[HDFS Manual] CH7 ViewFS Guide

来源:https://www.cnblogs.com/Amaranthus/archive/2018/04/03/8705659.html
-Advertisement-
Play Games

ViewFS Guide ViewFS Guide. 1 1 介紹... 1 2. The Old World(Prior to Federation). 1 2.1單個Namenode Clusters. 1 2.2 路徑使用... 1 2.3 路徑名的最佳實踐... 1 3 New World ...


ViewFS Guide

ViewFS Guide. 1

1 介紹... 1

2. The Old World(Prior to Federation). 1

2.1單個Namenode Clusters. 1

2.2 路徑使用... 1

2.3 路徑名的最佳實踐... 1

3 New World – Federation and ViewFS. 1

3.1 How The Clusters Look. 1

3.2 使用ViewFs的每個clusterNamespace. 1

3.3 路徑使用... 1

3.4 路徑使用最佳實踐... 1

3.5 通過namespace重命名路徑名... 1

3.7 FAQ.. 1

4 附錄:Mount table配置例子... 1

 

1 介紹

View File SystemViewFS)提供一個方法來管理hadoop文件系統namespaces。對於多個namnode的集群很有用。在HDFS FederationViewFSclient上面的Linuxmount table 類似。ViewFS可以用來創建個人的namespace

Hadoop系統有多個clusters,每個cluster可能被聯合到多個namespaces。也描述瞭如何在HDFS聯合上使用ViewFS,可以讓應用可以使用相似的方法,操作每個聯合。

2. The Old World(Prior to Federation)

2.1單個Namenode Clusters

在以前HDFS聯合,一個cluster有一個namenode提供了一個文件系統namespace。假設有多個cluster,每個cluster的文件系統namespace都是獨立的。此外集群的存儲也是相互不共用的。(datanode集群間是不共用的)

Core-site.xml的每個配置屬性設置namenode 的預設文件系統集群:

<property>

  <name>fs.default.name</name>

  <value>hdfs://namenodeOfClusterX:port</value>

</property>

比如這個配置允許使用相對路徑來訪問cluster namenode。比如使用上面的/foo/bar配置表示hdfs://namenodeOfClusterX:port/foo/bar

這個配置屬性需要配置在集群的每個gateway,也需要設置在關鍵的服務上,比如JobTrackerOozie

2.2 路徑使用

配置了以上設置,通常的路徑名:

1./foo/bar
這個配置等於hdfs://namenodeOfClusterX:port/foo/bar

2. hdfs://namenodeOfClusterX:port/foo/bar
是可用的路徑,使用相對路徑會更好,因為可以根據cluster的變化而變化。

3. hdfs://namenodeOfClusterY:port/foo/bar
指向另外一個集群的路徑,可以使用以下命令複製:
distcp hdfs://namenodeClusterY:port/pathSrc hdfs://namenodeClusterZ:port/pathDest

4.webhdfs://namenodeClusterX:http_port/foo/bar
URI用來訪問WebHDFS文件系統。註意WebHDFS使用HTTPnamenode,而不是使用PRC埠。

5.http://namenodeClusterX:http_port/webhdfs/v1/foo/bar http://proxyClusterX:http_port/foo/bar
通過WebHDFS RESET APIHDFS代理,HTTP URLs訪問這些文件。

2.3 路徑名的最佳實踐

推薦使用上面類型1而不是類型2的。絕對URI類似於地址並且不允許應用程式轉化數據。

3 New World – Federation and ViewFS

3.1 How The Clusters Look

假設有多個集群。每個集群有一個或者多個namenode。每個namenode都有自己的namespace。一個namenode只屬於一個集群。同一個集群的namenode共用集群中的物理存儲。Namespace關聯的集群是獨立的。

3.2 使用ViewFs的每個clusterNamespace

為了提供和之前的相容,ViewFS文件系統用來為每個集群創建獨立的集群namespace view。和老的namespace類似。以下圖片顯示了mount table mount4namespace

ViewFS實現了Hadoop file system結構和HDFS和本地文件系統類似。感覺就是一個細微的文件系統用來連接到其他文件系統。因為ViewFs實現了hadoop文件系統的藉口,對hadoop tool透明。比如ViewFs的命令和hdfs和本地文件系統一樣。

hadoop配置文件可以配置mount表的mount點。在每個集群的配置,預設的文件系統被設置到mount table

<property>

  <name>fs.defaultFS</name>

  <value>viewfs://clusterX</value>

</property>

頭上在viewfs://之後是mount table名,推薦使用cluster name。然後hadoop系統查看在配置文件中的clusterxmount table。操作覆蓋所有gateway和服務來包含所有集群的mount table。對於每個cluster,預設文件系統會被創建為ViewFs mount table和上面描述的一樣。

Mount table 的掛載點在hadoop 配置文件中設置。所有mount table使用fs.viewfs.mounttable配置。Mount point是使用link標簽來鏈接其他文件系統。推薦mount point的名字和掛載目標的一樣。對於所有的namespace沒有配置在mount table中,我們可以使用linkFallbackfallback到預設文件系統。

在以下mount table配置,namespace /data鏈接到文件系統hdfs://nn1-clusterx.example.com:8020/data/project鏈接到hdfs://nn2-clusterx.example.com:8020/project。所有的namespace沒有被配置在mount table的比如/logs都會被鏈接到hdfs://nn5-clusterx.example.com:8020/home下。

<configuration>

  <property>

    <name>fs.viewfs.mounttable.ClusterX.link./data</name>

    <value>hdfs://nn1-clusterx.example.com:8020/data</value>

  </property>

  <property>

    <name>fs.viewfs.mounttable.ClusterX.link./project</name>

    <value>hdfs://nn2-clusterx.example.com:8020/project</value>

  </property>

  <property>

    <name>fs.viewfs.mounttable.ClusterX.link./user</name>

    <value>hdfs://nn3-clusterx.example.com:8020/user</value>

  </property>

  <property>

    <name>fs.viewfs.mounttable.ClusterX.link./tmp</name>

    <value>hdfs://nn4-clusterx.example.com:8020/tmp</value>

  </property>

  <property>

    <name>fs.viewfs.mounttable.ClusterX.linkFallback</name>

    <value>hdfs://nn5-clusterx.example.com:8020/home</value>

  </property>

</configuration>

替代方案,可以通過linkMergeSlash來合併mount tableroot。在mount table配置,ClusterYroot使用hdfs://nn1-clustery.example.com:8020合併。

<configuration>
  <property>
    <name>fs.viewfs.mounttable.ClusterY.linkMergeSlash</name>
    <value>hdfs://nn1-clustery.example.com:8020/</value>
  </property>
</configuration>

3.3 路徑使用

配置了以上設置,通常的路徑名:

1./foo/bar
這個配置等於hdfs://namenodeOfClusterX:port/foo/bar

2. hdfs://namenodeOfClusterX:port/foo/bar
是可用的路徑,使用相對路徑會更好,因為可以根據cluster的變化而變化。

3. hdfs://namenodeOfClusterY:port/foo/bar
指向另外一個集群的路徑,可以使用以下命令複製:
distcp hdfs://namenodeClusterY:port/pathSrc hdfs://namenodeClusterZ:port/pathDest

4.webhdfs://namenodeClusterX:http_port/foo/bar
URI用來訪問WebHDFS文件系統。註意WebHDFS使用HTTPnamenode,而不是使用PRC埠。

5.http://namenodeClusterX:http_port/webhdfs/v1/foo/bar http://proxyClusterX:http_port/foo/bar
通過WebHDFS RESET APIHDFS代理,HTTP URLs訪問這些文件。

3.4 路徑使用最佳實踐

推薦使用上面類型1而不是類型2的。絕對URI類似於地址並且不允許應用程式轉化數據。

3.5 通過namespace重命名路徑名

在新的方式下,如果/user/data在不同的namenode上,那麼就不可以運行。

rename /user/joe/myStuff /data/foo/bar

3.7 FAQ

4 附錄:Mount table配置例子

通常,用戶不需要鄧毅表或者core-site.xml來使用mount table

Mount table可以在core-site.xml中描述,但是最好不要直接在core-site.xml上使用,而是通過一個獨立的文件,比如mountTable.xml,在core-site.xml增加以下配置:

<configuration xmlns:xi="http://www.w3.org/2001/XInclude"> 
  <xi:include href="mountTable.xml" />
</configuration> 

mountTable.xml文件,定義了ClusterXmount tableClusterX是三個namespace
1.nn1-clusterx.example.com:8020,
2.nn2-clusterx.example.com:8020,
3.nn3-clusterx.example.com:8020.

這裡/home/tmpnn1-clusterx.example.com:8020 namenode管理,/foo/bar在聯合集群的其他namenodeHomebase目錄被設置在/home,這樣每個用戶可以通過getHomeDirectory()訪問各自的home目錄,getHomeDirectory()定義可以查看FileSystem/FileContext.

<configuration>
  <property>
    <name>fs.viewfs.mounttable.ClusterX.homedir</name>
    <value>/home</value>
  </property>
  <property>
    <name>fs.viewfs.mounttable.ClusterX.link./home</name>
    <value>hdfs://nn1-clusterx.example.com:8020/home</value>
  </property>
  <property>
    <name>fs.viewfs.mounttable.ClusterX.link./tmp</name>
    <value>hdfs://nn1-clusterx.example.com:8020/tmp</value>
  </property>
  <property>
    <name>fs.viewfs.mounttable.ClusterX.link./projects/foo</name>
    <value>hdfs://nn2-clusterx.example.com:8020/projects/foo</value>
  </property>
  <property>
    <name>fs.viewfs.mounttable.ClusterX.link./projects/bar</name>
    <value>hdfs://nn3-clusterx.example.com:8020/projects/bar</value>
  </property>
</configuration>

 

 

 

 


您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • 瞭解到docker的優點,搭建快,運行要求資源低,最重要的是實現的功能和效果都能達到預期,於是決定使用docker來搭建gitlab伺服器。 效果圖如下: 系統環境:CentOS Linux release 7.1.1503 (Core) git版本:/gitlab/gitlab-ce 一、安裝和啟 ...
  • 配置自己電腦的vim,配置一個根據個人習慣使用的.vimrc文件。我的有以下功能等,讀者可以根據自己的 個人喜好去配置自己的vim。 1.自動插入文件頭 ,新建C、C++源文件時自動插入表頭:包括文件名、作者、聯繫方式、建立時間等。(我個人是不太喜歡新建源 文件時自動插入表頭文件名,所以將其註釋,讀 ...
  • Windows 2008系統管理 電腦網路 思科高級路由與交換 Linux系統管理 Linux網路服務 MySQL資料庫管理 Linux Shell腳本編程 Linux 運維與監控 Linux 安全應用 Linux 集群與存儲技術 Linux 性能調優 虛擬化技術 ...
  • 使用Linux發行版時需要註意幾個方面的問題: 1. 包管理器 包管理器無疑時各家發行版的最大特色之一。軟體同時也是一個平臺是否能夠產生足夠的吸引力的來源之一。 manjaro使用CLI版的 ,同時附帶具有圖形前端的 ;同時manjaro基於archLinux,這意味著可以使用軟體眾多的archcn ...
  • 使用過 Ubuntu 的人都知道,Ubuntu 預設是不能以 root 登陸的,但是我們是不是就完全不能使用 root 進行登陸了呢?當然不是,只是我們需要做一些設置。而 Ubuntu 17.10 和之前的版本的設置方法都是不一樣的(包括 16.04 的方法在這裡也是行不通的),這裡分享一下 Ubu ...
  • 1.drbd多節點簡介 在drbd9以前,drbd一直只能配置兩個節點,要麼是primary/secondary,要麼是primary/primary。雖然在這些版本上也能配置第三個節點實現三路節點的同步,但這個第三節點一般都只當作備份drbd設備,幾乎沒人去使用drbd配置3節點。 但是在drbd ...
  • 公司的伺服器構架比較複雜,建立了一個主從熱備的centos7伺服器,分別有內網,外網,和VIP。 環境: ha-01 內網:192.168.1.221 外網:XX.XX.XX.221 ha-02 內網:192.168.1.222 外網:XX.XX.XX.222 VIP:192.168.1.232 公 ...
  • 1、左連接: var LeftJoin = from emp in ListOfEmployees join dept in ListOfDepartment on emp.DeptID equals dept.ID into JoinedEmpDept from dept in JoinedEmp ...
一周排行
    -Advertisement-
    Play Games
  • 移動開發(一):使用.NET MAUI開發第一個安卓APP 對於工作多年的C#程式員來說,近來想嘗試開發一款安卓APP,考慮了很久最終選擇使用.NET MAUI這個微軟官方的框架來嘗試體驗開發安卓APP,畢竟是使用Visual Studio開發工具,使用起來也比較的順手,結合微軟官方的教程進行了安卓 ...
  • 前言 QuestPDF 是一個開源 .NET 庫,用於生成 PDF 文檔。使用了C# Fluent API方式可簡化開發、減少錯誤並提高工作效率。利用它可以輕鬆生成 PDF 報告、發票、導出文件等。 項目介紹 QuestPDF 是一個革命性的開源 .NET 庫,它徹底改變了我們生成 PDF 文檔的方 ...
  • 項目地址 項目後端地址: https://github.com/ZyPLJ/ZYTteeHole 項目前端頁面地址: ZyPLJ/TreeHoleVue (github.com) https://github.com/ZyPLJ/TreeHoleVue 目前項目測試訪問地址: http://tree ...
  • 話不多說,直接開乾 一.下載 1.官方鏈接下載: https://www.microsoft.com/zh-cn/sql-server/sql-server-downloads 2.在下載目錄中找到下麵這個小的安裝包 SQL2022-SSEI-Dev.exe,運行開始下載SQL server; 二. ...
  • 前言 隨著物聯網(IoT)技術的迅猛發展,MQTT(消息隊列遙測傳輸)協議憑藉其輕量級和高效性,已成為眾多物聯網應用的首選通信標準。 MQTTnet 作為一個高性能的 .NET 開源庫,為 .NET 平臺上的 MQTT 客戶端與伺服器開發提供了強大的支持。 本文將全面介紹 MQTTnet 的核心功能 ...
  • Serilog支持多種接收器用於日誌存儲,增強器用於添加屬性,LogContext管理動態屬性,支持多種輸出格式包括純文本、JSON及ExpressionTemplate。還提供了自定義格式化選項,適用於不同需求。 ...
  • 目錄簡介獲取 HTML 文檔解析 HTML 文檔測試參考文章 簡介 動態內容網站使用 JavaScript 腳本動態檢索和渲染數據,爬取信息時需要模擬瀏覽器行為,否則獲取到的源碼基本是空的。 本文使用的爬取步驟如下: 使用 Selenium 獲取渲染後的 HTML 文檔 使用 HtmlAgility ...
  • 1.前言 什麼是熱更新 游戲或者軟體更新時,無需重新下載客戶端進行安裝,而是在應用程式啟動的情況下,在內部進行資源或者代碼更新 Unity目前常用熱更新解決方案 HybridCLR,Xlua,ILRuntime等 Unity目前常用資源管理解決方案 AssetBundles,Addressable, ...
  • 本文章主要是在C# ASP.NET Core Web API框架實現向手機發送驗證碼簡訊功能。這裡我選擇是一個互億無線簡訊驗證碼平臺,其實像阿裡雲,騰訊雲上面也可以。 首先我們先去 互億無線 https://www.ihuyi.com/api/sms.html 去註冊一個賬號 註冊完成賬號後,它會送 ...
  • 通過以下方式可以高效,並保證數據同步的可靠性 1.API設計 使用RESTful設計,確保API端點明確,並使用適當的HTTP方法(如POST用於創建,PUT用於更新)。 設計清晰的請求和響應模型,以確保客戶端能夠理解預期格式。 2.數據驗證 在伺服器端進行嚴格的數據驗證,確保接收到的數據符合預期格 ...