大數據---Ranger-1

来源:https://www.cnblogs.com/taojietaoge/archive/2019/03/04/10474071.html
-Advertisement-
Play Games

背景:從軟通出來,告別華為外包,離開H區,進入了一家搞大數據的創業公司,感覺周圍都好陌生,記錄下自己大數據的career! 2019-03-4新的徵程-入職第一天: 一、辦理入職手續 公司人比較少,沒有入職培訓等操作;用了企業微信和企業郵箱,填下個人信息,然後開搞; 二、搭建Java開發環境和虛擬機 ...


背景:從軟通出來,告別華為外包,離開H區,進入了一家搞大數據的創業公司,感覺周圍都好陌生,記錄下自己大數據的career!

 

2019-03-4新的徵程-入職第一天:

一、辦理入職手續

公司人比較少,沒有入職培訓等操作;用了企業微信和企業郵箱,填下個人信息,然後開搞;

二、搭建Java開發環境和虛擬機、Linux、Xshell等

Windows下使用Xshell時出現丟失msvcr110.dll等dll,可以使用該鏈接解決https://blog.csdn.net/franck_lou/article/details/78438268 

三、學習編譯Ranger工程,熟悉相關部署和使用

剛開始接觸公司自己搭建的Ranger工程,感覺好難受;Ranger是開源的,公司下載了源碼併在原有結構上在增加新功能;Ranger裡面好多組件都沒用過,感覺很陌生,難受馬非,於是感覺今天先弄明白這些東西時什麼,之後再仔細研究它們時怎麼存儲數據、讀/寫文件和使用等。

1、Ranger 簡介

Apache Ranger提供一個集中式安全管理框架,它可以對Hadoop生態的組件如Hive、Hbase進行細粒度的數據訪問控制;通過操作Ranger控制台,管理員可以輕鬆的通過配置策略來控制用戶訪問HDFS文件夾、HDFS文件、資料庫、表和欄位許可權,這些策略可以為不同的用戶和組來設置,同時許可權可與hadoop無縫對接;並且提供了Web UI方便管理員進行操作。

2、什麼是Hbase

HBase是一種Hadoop資料庫,經常被描述為一種稀疏的、分散式的、可持續化的、多維有序映射,它是基於行鍵、列鍵和時間戳建立索引的,是一個可以隨機訪問的存儲和檢索數據的平臺;HBase不限制存儲的數據種類,允許動態的、靈活的數據模型,不用SQL語言,也不強調數據之間的關係;HBase被設計成在一個伺服器集群上運行,可以相應地橫向擴展。

3、什麼是Hive

a. Hive由Facebook實現並開源;
b. 是基於Hadoop的一個數據倉庫工具;
c. 可以將結構化的數據映射為一張資料庫表,並提供HQL(Hive SQL)查詢功能;
d. 底層數據是存儲在HDFS上的;
e. Hive的本質是將SQL 語句轉換為MapReduce 任務執行,使不熟悉MapReduce的用戶很方便的利用HQL處理和計算HDFS上的結構化的數據,適用於離線的批量數據計算;
f. MapReduce是一種編程模型,用於大規模數據集(大於1TB)的並行運算。

4、什麼是YARN

Apache Hadoop YARN(Yet Another Resource Negotiator,另一種資源協調者)是一種新的Hadoop資源管理器,它是一個通用資源管理系統,可為上層應用提供統一的資源管理和調度;它將資源管理和處理組件分開,它的引入為集群在利用率、資源統一管理和數據共用等方面帶來了巨大的好處。

5、什麼是Hadoop

Hadoop是一個開源框架,它允許在整個集群使用簡單編程模型電腦的分散式環境存儲並處理大數據;它的目的是從單一的伺服器到上千台機器的擴展,每一個台機都可以提供本地計算和存儲。

6、什麼是KNOX

Knox是Apache Hadoop生態中REST API和應用的網關,Apache Knox是一個通過REST API和UI與Apache Hadoop部署交互的應用網關;Knox網關為所有與Hadoop集群的REST和HTTP交互提供
了一個單獨的訪問點。(REST描述的是在網路中client和server的一種交互形式)

7、什麼是HDFS

HDFS(Hadoop Distributed File System)是Hadoop項目的核心子項目,是分散式計算中數據存儲管理的基礎,是基於流數據模式訪問和處理超大文件的需求而開發的,可以運行於廉價的商用伺服器上;它所具有的高容錯性、高可靠性、高擴展性、高獲得性和高吞吐率特征為海量數據提供了不怕故障的存儲,為超大數據集(Large Data Set)的應用處理帶來了很多便利。

四、吐槽

1、今天上班用的是win10系統,win10需要以管理員身份打開dos視窗,才可以修改執行某些特殊命令;

2、上班第一天沒有把Ranger工程自己編譯出來,難受;

3、第一天晚上就加班了,還被嫌棄了,要講究工作效率,在上班時間完成任務,該加班的時候再加班,難受;

4、建議大家有事沒事都下個虛擬機玩玩,Linux和Xshell等操作熟悉下吧,又被嫌棄了,難受馬非。

 


您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • linux文件許可權r 讀w 寫x (execute)執行rwxrw-r--解釋:rwx文件所有者對該文件有讀寫執行的許可權;rw- 組內用戶對該文件有讀寫的許可權;r-- 其他非本組用戶對該文件具有讀的許可權。 ...
  • linux基礎之文本處理命令 1、wc命令 基本介紹 文件的行統計、字元統計、位元組統計 基本語法 wc [OPTION]... [FILE]... wc [OPTION]... --files0-from=F 常用選項 -c:列印位元組數 -m:列印字元數 -l:列印行數 -w:列印單詞數 --hel ...
  • 環境: centOS7 Elasticsearch-6.6.1 JDK8 準備: jdk下載地址:https://www.oracle.com/technetwork/java/javase/downloads/jdk8-downloads-2133151.html elasticsearch下載地 ...
  • 1、安裝Java JDK 2、安裝Elasticsearch 1、導入Elasticsearch的GPG公鑰 2、添加Elasticsearch倉庫源 3、安裝elasticsearch 4、安裝完成之後,配置Elasticsearch 5、啟動Elasticsearch服務並加入開機自啟 3、安裝 ...
  • 1.處理目錄的命令 2.查看文件指令 3.鏈接文件 ln 命令保證鏈接文件的同步性,無論改動哪一處文件,其他文件都會發生相應的變化 4.文件許可權 在Linux中第一個字元代表這個文件是目錄、文件或鏈接文件等等。 當為[ d ]則是目錄 當為[ - ]則是文件; 若是[ l ]則表示為鏈接文檔(lin ...
  • 安裝Head插件 由於head插件本質上還是一個nodejs的工程,因此需要安裝node,使用npm來安裝依賴的包。 <1>安裝Node.js 下載解壓 配置並生效 查看版本驗證 <2>下載head插件 如果未安裝git ,則先安裝git工具 <3>安裝grunt <4>安裝插件 在elastics ...
  • 直接使用root賬號 1、zookeeper安裝 將zookeeper 3.4.13.tar.gz安裝包放置指定目錄 2、zookeeper安裝可視化工具 需要安裝 java和maven環境 1、安裝maven環境 線上下載地址,不用管 http://mirrors.shu.edu.cn/apach ...
  • 1、增增加目錄命令:mkdir 映射--1.新建目錄名為dir1 eg:mkdir dir1 2.一次建多個文件夾eg:temp1,temp2,temp3 mkdir temp1 temp2 temp3 3.新建父目錄,文件已存在也不會報錯; eg:mkdir -p t1/t2/t3增加文件命令:t ...
一周排行
    -Advertisement-
    Play Games
  • 移動開發(一):使用.NET MAUI開發第一個安卓APP 對於工作多年的C#程式員來說,近來想嘗試開發一款安卓APP,考慮了很久最終選擇使用.NET MAUI這個微軟官方的框架來嘗試體驗開發安卓APP,畢竟是使用Visual Studio開發工具,使用起來也比較的順手,結合微軟官方的教程進行了安卓 ...
  • 前言 QuestPDF 是一個開源 .NET 庫,用於生成 PDF 文檔。使用了C# Fluent API方式可簡化開發、減少錯誤並提高工作效率。利用它可以輕鬆生成 PDF 報告、發票、導出文件等。 項目介紹 QuestPDF 是一個革命性的開源 .NET 庫,它徹底改變了我們生成 PDF 文檔的方 ...
  • 項目地址 項目後端地址: https://github.com/ZyPLJ/ZYTteeHole 項目前端頁面地址: ZyPLJ/TreeHoleVue (github.com) https://github.com/ZyPLJ/TreeHoleVue 目前項目測試訪問地址: http://tree ...
  • 話不多說,直接開乾 一.下載 1.官方鏈接下載: https://www.microsoft.com/zh-cn/sql-server/sql-server-downloads 2.在下載目錄中找到下麵這個小的安裝包 SQL2022-SSEI-Dev.exe,運行開始下載SQL server; 二. ...
  • 前言 隨著物聯網(IoT)技術的迅猛發展,MQTT(消息隊列遙測傳輸)協議憑藉其輕量級和高效性,已成為眾多物聯網應用的首選通信標準。 MQTTnet 作為一個高性能的 .NET 開源庫,為 .NET 平臺上的 MQTT 客戶端與伺服器開發提供了強大的支持。 本文將全面介紹 MQTTnet 的核心功能 ...
  • Serilog支持多種接收器用於日誌存儲,增強器用於添加屬性,LogContext管理動態屬性,支持多種輸出格式包括純文本、JSON及ExpressionTemplate。還提供了自定義格式化選項,適用於不同需求。 ...
  • 目錄簡介獲取 HTML 文檔解析 HTML 文檔測試參考文章 簡介 動態內容網站使用 JavaScript 腳本動態檢索和渲染數據,爬取信息時需要模擬瀏覽器行為,否則獲取到的源碼基本是空的。 本文使用的爬取步驟如下: 使用 Selenium 獲取渲染後的 HTML 文檔 使用 HtmlAgility ...
  • 1.前言 什麼是熱更新 游戲或者軟體更新時,無需重新下載客戶端進行安裝,而是在應用程式啟動的情況下,在內部進行資源或者代碼更新 Unity目前常用熱更新解決方案 HybridCLR,Xlua,ILRuntime等 Unity目前常用資源管理解決方案 AssetBundles,Addressable, ...
  • 本文章主要是在C# ASP.NET Core Web API框架實現向手機發送驗證碼簡訊功能。這裡我選擇是一個互億無線簡訊驗證碼平臺,其實像阿裡雲,騰訊雲上面也可以。 首先我們先去 互億無線 https://www.ihuyi.com/api/sms.html 去註冊一個賬號 註冊完成賬號後,它會送 ...
  • 通過以下方式可以高效,並保證數據同步的可靠性 1.API設計 使用RESTful設計,確保API端點明確,並使用適當的HTTP方法(如POST用於創建,PUT用於更新)。 設計清晰的請求和響應模型,以確保客戶端能夠理解預期格式。 2.數據驗證 在伺服器端進行嚴格的數據驗證,確保接收到的數據符合預期格 ...