datanode啟動異常（Incompatible clusterIDs）

-Advertisement-

問題：正常start-all.sh無法啟動datanode進程，但是./hadoop-daemon.sh start datanode又可以啟動。過一會後datanode進程又莫名消失。原理：多次hdfs namenode -format導致namenode生成了新的clusterID, 和d ...

問題：

　　正常start-all.sh無法啟動datanode進程，但是./hadoop-daemon.sh start datanode又可以啟動。過一會後datanode進程又莫名消失。

原理：

多次hdfs namenode -format導致namenode生成了新的clusterID, 和datanode的不一致。

解決：

查日誌，發現異常信息如下：

2019-07-22 17:46:09,856 WARN org.apache.hadoop.hdfs.server.common.Storage: Failed to add storage directory [DISK]file:/home/wjy/hadoop/tmp/dfs/data
java.io.IOException: Incompatible clusterIDs in /home/wjy/hadoop-3.1.1/tmp/dfs/data: namenode clusterID = CID-8041cf56-7cbd-423e-a0b6-f782c1e1340f; datanode clusterID = CID-0d8412e3-e59b-4b1b-acdf-871b8cfa2f79

　　照著網上說的刪除本地dfs.data.dir下的所有內容然後重啟進程並沒有解決我的問題。這個dfs.data.dir是在hdfs-site.xml里找的（由於我用的hadoop3.1.1，所以是dfs.datanode.data.dir）：

把data下麵的current文件夾刪了以後再次格式化namenode，還是那個問題，不同的是namenode的clusterID發生了改變（這很正常，因為重新格式化以後又生成了新的clusterID),datanode的clusterID卻一直沒變。按理說datanode的clusterID應該是在data/current/VERSION裡面被記錄的，但是現在我根本就把這個文件夾給刪掉了。。。而且啟動datanode時應該會生成一個和namenode一樣的clusterID的，並沒有。把namenode的VERSION給複製過去做適當的修改還是沒用。

後來我發現在下圖這個路徑下麵還有一個data文件夾，下麵的VERSION文件中的clusterID正是錯誤信息中的那個！

原來我之前刪錯了。。。把這個current給刪掉再重啟一次datanode果然就好了（完全分散式記得要刪除所有節點的哦，不然slave的datanode也會起不來的）。

可是很奇怪，為什麼這個文件不生成在設置的dfs.datanode.name.dir的文件夾下麵呢？而是在這個預設路徑裡面。

您的分享是我們最大的動力!

-Advertisement-

更多相關文章

第四周作業

1.查找/var目錄下不屬於root、lp、gdm的所有文件。find /var -not \ (-user root -o -user lp -user gdm) -ls 2.統計/etc/init.d/functions文件中的每個單詞出現次數，併排序，用grep和sed兩種方法實現。 sed方 ...
檢查目錄下文件的許可權-linux shell腳本

#！/bin/bash #History: #2019/07/23 Fsq #This Program will check Permissions on dir PATH=/bin:/sbin:/usr/bin:/usr/sbin:/usr/local/bin:/usr/local/sbin:~/ ...
MySQL的sql_mode模式說明及設置

MySQL的sql_mode合理設置 sql_mode是個很容易被忽視的變數,預設值是空值,在這種設置下是可以允許一些非法操作的,比如允許一些非法數據的插入。在生產環境必須將這個值設置為嚴格模式,所以開發、測試環境的資料庫也必須要設置,這樣在開發測試階段就可以發現問題. sql model 常用來解 ...
MySQL必知必會1

MySQL必知必會瞭解SQL 什麼是資料庫：資料庫(database)保存有阻止的數據的容器，可以把資料庫想象成一個文件櫃。什麼是表：表(table) 某種特定類型結構的結構化清單，資料庫中的表的名字是唯一的。什麼是列：列(column)表中的一個欄位。所有表都是有一個或多個列組成的 ...
MySQL 5.7和8.0性能測試

[toc] 背景測試mysql5.7和mysql8.0 分別在讀寫、只讀、只寫模式下不同併發時的性能（tps，qps）前提測試使用版本為mysql5.7.22和mysql8.0.15 sysbench測試前先重啟mysql服務，並清空os的cache（避免多次測試時命中緩存）每次進行測試都是 ...
Hadoop學習(2)-java客戶端操作hdfs及secondarynode作用

首先要在windows下解壓一個windows版本的hadoop 然後在配置他的環境變數，同時要把hadoop的share目錄下的hadoop下的相關jar包拷貝到esclipe 然後Build Path 下麵上代碼練習：從一個文件裡面不斷地採集日誌上傳到hdfs裡面 1.流程介紹啟動一個定時任 ...
Server基本語句的用法

1、創建資料庫 create database databaseName user databaseName go /* 轉到指定資料庫 */ 2、創建表 create table tableName( /* 欄位名 */ ) 3、插入數據 insert into tableName values( ...
SQL 十位隨機數（大小寫字母+數據）

USE [TEST]GO/****** Object: UserDefinedFunction [dbo].[RANDTENNUMS] Script Date: 2019/7/23 15:40:16 ******/SET ANSI_NULLS ONGOSET QUOTED_IDENTIFIER ON ...