一.NameNode,SeconderyNamenode,DataNode NameNode,DataNode,SeconderyNamenode都是進程,運行在節點上。 1.NameNode:hadoop的主節點, 保存HDFS的元數據信息 1.fsimage - 它是在NameNode啟動時對整 ...
一.NameNode,SeconderyNamenode,DataNode
NameNode,DataNode,SeconderyNamenode都是進程,運行在節點上。
1.NameNode:hadoop的主節點, 保存HDFS的元數據信息
1.fsimage - 它是在NameNode啟動時對整個文件系統的快照 2.edit logs - 它是在NameNode啟動後,對文件系統的改動序列 2.SeconderyNamenode: 職責是合併NameNode的edit logs到fsimage文件中,幫助NameNode3.DataNode : 響應來自 HDFS 客戶機的讀寫請求。它們還響應來自 NameNode 的創建、刪除和複製塊的命令。NameNode 依賴來自每個 DataNode 的定期心跳(heartbeat)消息。每條消息都包含一個塊報告,NameNode 可以根據這個報告驗證塊映射和其他文件系統元數據。如果 DataNode 不能發送心跳消息,NameNode 將採取修複措施,重新複製在該節點上丟失的塊。
一.HDFS相關概念
1.HDFS : Hadoop分散式文件系統(Hadoop Distributed File System) 2.數據塊:存儲時為了方便傳輸和提高容錯率,把文件分為多個數據塊,hadoop1.x 是64M,hadoop2.x 是128M 3.複製因數:hdfs文件會在多個節點進行備份,預設數量為3(現在配置的是偽分散式,只有一個) 在hdfs-site.xml 中配置 <property> <name>dfs.replication</name> <value>1</value> </property> 4.fsimage文件: FSImage文件是HDFS中名位元組點NameNode上文件/目錄元數據在特定某一時刻的持久化存儲文件。 5.edits文件: 操作日誌文件,由NameNode或者SeconderyNamenode讀取對fsimage文件進行更改 6.安全模式: 安全模式是hadoop的一種保護機制,用於保證集群中的數據塊的安全性。 當集群啟動的時候,會首先進入安全模式。當系統處於安全模式時會檢查數據塊的完整性。 這時,不允許客戶端進行任何修改文件的操作,包括上傳文件,刪除文件,重命名,創建文件夾等操作。 正常情況下,安全模式會運行一段時間自動退出的,只需要我們稍等一會就行了,到底等多長時間呢,我們可以通過50070埠查看安全模式退出的剩餘時間
三.常見HDFS shell命令
1.查看目錄 hadoop fs -ls hdfs目錄(根目錄為 /) 2.創建目錄 hadoop fs -mkdir -p hdfs路徑 (-p是可以創建多級目錄) 3.刪除目錄 hadoop fs -rmdir hdfs目錄 (只能刪除空目錄) 4.刪除文件 hadoop fs -rm -r hdfs路徑 (加-r可迴圈刪除非空目錄) 5.上傳文件 hadoop fs -put 文件在本機的路徑 hdfs路徑 6.下載文件 hadoop fs -get 文件在hdfs路徑 文件在本機要放置的路徑 7.查看文件 hadoop fs -cat 文件在hdfs的路徑 8.查看健康模式 hdfs dfsadmin -safemode get