EasyMR 安全架構揭秘:如何管理 Hadoop 數據安全

来源:https://www.cnblogs.com/DTinsight/archive/2023/04/06/17291841.html
-Advertisement-
Play Games

2017年,美國信用評級機構 Equifax 遭受黑客攻擊,導致1.4億個人的敏感信息泄露; 2020年,發生了 SolarWinds 公司的軟體供應鏈遭受惡意代碼攻擊事件,涉及多個行業和國家; 2022年,網信辦依據《數據安全法》等法律法規,對滴滴公司開出人民幣80.26億元的巨額罰款,對互聯網企 ...


2017年,美國信用評級機構 Equifax 遭受黑客攻擊,導致1.4億個人的敏感信息泄露;

2020年,發生了 SolarWinds 公司的軟體供應鏈遭受惡意代碼攻擊事件,涉及多個行業和國家;

2022年,網信辦依據《數據安全法》等法律法規,對滴滴公司開出人民幣80.26億元的巨額罰款,對互聯網企業敲響數據安全警鐘。

近年來,數據安全正在快速成為當今信息化時代一個備受關註的話題。在數字化快速發展的今天,各個領域都離不開數據的支撐,而數據安全問題也隨之成為了一項重要的任務。企業、政府、學術機構等各種組織和個人都需要保護自己的數據免於泄露、丟失、篡改或被濫用等風險。

Hadoop 作為進入大數據領域的必備技術,由於自身的業務特點,一般都是部署在用戶內網中,所以在早期設計的時候不是太註重安全方面的設計,而更多的專註於實現業務的功能。

作為領先的數字化基礎軟體與應用服務商袋鼠雲,一直以來也高度重視數據安全問題,2022年12月,在自研的大數據計算引擎 EasyMR新增了一站式大數據應用安全防控以及數據許可權管控能力

基於此,EasyMR 可以實現一鍵部署安全管控服務,一鍵開啟大數據集群組件的安全認證、用戶管理以及許可權管控服務。

本文就為大家展開介紹一下 EasyMR 具體是如何管理 Hadoop 數據安全的。

Hadoop 的安全問題

最早部署 Hadoop 集群時並沒有考慮安全問題,未開啟安全認證時,Hadoop 是以客戶端提供的用戶名作為用戶憑證, 一般就是發起任務的 Unix 用戶。線上機器部署服務通常會採用統一賬號,當以統一賬號部署集群時,所有執行 Hadoop 任務的用戶都是集群的超級管理員,非常容易發生誤操作。

即便是以管理員賬號部署集群,惡意用戶在客戶端仍然可以冒充管理員賬號執行。隨著集群的不斷擴大, 各部門對集群的使用需求增加,集群安全問題就顯得頗為重要。Hadoop 的安全問題,一般包括以下兩個方面:

· 用戶認證(Authentication) 即是對用戶身份進行核對, 確認用戶是其聲明的身份, 這裡包括用戶和服務的認證。

· 用戶授權(Authorization) 即是許可權控制,對特定資源,特定訪問用戶進行授權或拒絕訪問,用戶授權是建立在用戶認證的基礎上, 沒有可靠的用戶認證談不上用戶授權。

EasyMR 如何接管 Hadoop 安全

EasyMR Hadoop 的安全認證是基於 Kerberos 實現的,集成 LDAP 用戶體系。 Kerberos 是一個網路身份驗證協議,用戶只需輸入身份驗證信息,驗證通過獲取票據即可訪問多個接入 Kerberos 的服務,機器的單點登錄也可以基於此協議完成。

Hadoop 本身並不創建用戶賬號,而是使用 Kerberos 協議來進行用戶身份驗證,從 Kerberos 憑證中的用戶信息獲取用戶賬號, 這樣一來就跟實際用戶運行的賬號無關。

EasyMR 接管 Hadoop 安全主要使用以下兩種賬號管理方式:

集群賬號管理

原先我們使用單一賬號作為集群管理員,且這一賬號為線上統一登錄賬號, 這存在極大的安全隱患,我們需要使用特殊賬號來管理集群。這裡涉及的問題是,我們需要幾個運維賬號呢? 一種簡單的做法是使用一個特殊運維賬號, CDH 和 Apache官方也都推薦按服務劃分賬號來啟動集群。

考慮到精細化控制可以有效避免誤操作,EasyMR 遵循官方的建議使用多賬號,使用 Hadoop 作為同一用戶組,每個組件使用單獨的用戶。如果是從單一運維賬號遷移到多個賬號部署時,則需要考慮相關文件許可權問題,包括本地以及 HDFS 兩部分,可以在安全部署上線時完成相應改動。

EasyMR 組件服務運行的用戶信息可以配置在產品包服務層級下,下圖以服務 hdfs_namenode 為例:

file

file

用戶賬號管理

考慮到每個團隊下會有不同的小組,每個小組都有使用 Hadoop 來進行大數據處理需求,所以需要一定程度的多租戶環境, 這裡主要考慮其中的數據和操作的許可權問題,EasyMR 集成了 LdapServer 目錄服務系統,其功能優勢具體體現如下:

• LdapServer 能夠減少用戶賬戶管理人員在面對用戶數量大、增長快等問題的情況下對賬號的創建、回收、許可權管理、安全審計等一系列複雜而繁瑣工作的壓力。

• LdapServer 能夠解決多層次、多類型系統、資料庫的安全訪問難題,所有與賬號相關的管理策略均配置在服務端,實現了賬號的集中維護和管理。

• LdapServer 能夠充分繼承和利用平臺組織中現有的賬戶管理系統的身份認證功能,並實現了賬戶管理與訪問控制管理的分離,提高了大數據平臺訪問認證的安全性。

EasyMR 如何部署 Hadoop 安全

EasyMR 可以支持 Hadoop,Hive,Spark,Ranger 組件開啟Kerberos功能,每個組件的開啟操作基本一致。下麵以開啟Hadoop Kerberos 功能為例為大家介紹EasyMR 具體是如何部署 Hadoop 安全的。

準備產品包

file

安裝產品包

● 安裝 zookeeper、openldap、kdc、Hadoop 服務

以安裝 Hadoop 服務為例,選中需要安裝的服務,點擊下一步;

file

指定每個服務需要部署的節點,點擊執行部署;

file

部署完成後,可以在節點檢查目錄的許可權及組件的啟動用戶。

file

開啟 Kerberos 安全

部署完服務後,需要按照 Kerberos 開啟順序依次開啟。

● zookeeper 開關

首先在服務頁面,選擇 zookeeper 服務,在部署配置裡面找到 Switch 開關項,切換開關狀態,等待開關開啟結果。

file

● Hadoop 開關

在服務頁面,選擇 hadoop pkg 服務,在部署配置裡面找到 Switch 開關項,切換開關狀態,等待開關開啟結果,開啟成功後,hadoop Kerberos 功能就成功啟用了。

file

應用授權

授權一般來說是由應用來決定的,通過在 LDAP 資料庫中配置一些屬性可以讓應用程式來進行授權判斷。EasyMR 在部署完 LdapServer 後,平臺管理裡面將會自動關聯 LdapServer 的連接信息,用戶只需選中對應的 LdapServer 連接,在對應的用戶下點擊下載票據即可。

file

《數據治理行業實踐白皮書》下載地址:https://fs80.cn/380a4b

想瞭解或咨詢更多有關袋鼠雲大數據產品、行業解決方案、客戶案例的朋友,瀏覽袋鼠雲官網:https://www.dtstack.com/?src=szbky

同時,歡迎對大數據開源項目有興趣的同學加入「袋鼠雲開源框架釘釘技術qun」,交流最新開源技術信息,qun號碼:30537511,項目地址:https://github.com/DTStack


您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • 1. HAVING子句的用法 1.1. 學習SQL時最大的阻礙就是我們已經習慣了的面向過程語言的思考方式(排序、迴圈、條件分支、賦值等) 1.2. 只有習慣了面向集合的思考方式,才能真正地學好它 1.3. 幫助我們順利地忘掉面向過程語言的思考方式並理解SQL面向集合特性的最為有效的方法 1.4. H ...
  • # 大數據開發基礎學習編程語言往往是我們開啟學習之路的第一大步。大數據領域的很多框架都是基於Java語言開發的,而且各種框架也都提供了Java API來提供使用和操作介面,所以Java語言的學習逃不掉。除此之外Scala在必要時也可以學一下,在大數據開發領域里用得還是挺多的。Scala語言的表達能力 ...
  • 數據管理技術的發展 第一節 資料庫技術發展概述 數據模型是資料庫系統的核心和基礎 以數據模型的發展為主線,資料庫技術可以相應地分為三個發展階段: 第一代的網狀、層次資料庫系統 第二代的關係資料庫系統 新一代的資料庫系統 一、第一代資料庫系統 層次資料庫系統 層次模型 網狀資料庫系統 網狀模型 層次模 ...
  • ORACLE資料庫中ORACLE_SID與INSTANCE_NAME在概念和意義上有什麼異同呢?下麵簡單來總結概況一下,很多時候,不少人都搞不清楚兩者的異同,甚至認為兩者是等價的。 ORACLE_SID與INSTANCE_NAME的異同 ORACLE_SID參數是操作系統的環境變數,用於和操作系統進 ...
  • 最近寫了幾個簡單的spark structured streaming 的代碼實例。 目的是熟悉spark 開發環境搭建, spark 代碼開發流程。 開發環境: 系統:win 11 java : 1.8 scala:2.13 工具:idea 2022.2 ,maven 3, git 2.37 sp ...
  • 在日常工作中,我們會遇見一些慢SQL,在分析這些慢SQL時,我們通常會看下SQL的執行計劃,驗證SQL執行過程中有沒有走索引。通常我們會調整一些查詢條件,增加必要的索引,SQL執行效率就會提升幾個數量級。我們有沒有思考過,為什麼加了索引就會能提高SQL的查詢效率,為什麼有時候加了索引SQL執行反而會... ...
  • navicat15安裝破解教程 一.navicati15安裝 參考教程 安裝包文件查找過程不再這裡贅述了,大家自行百度,相關經驗帖很多。 二. 破解 啟動破解工具,並點擊Patch 點擊後選擇我們安裝navicat的目錄 註意第二步的相關配置 點擊Generate生成key 打開navicat15, ...
  • 摘要:本文主要介紹GaussDB(DWS)雲原生數倉架構、產品能力,幫助開發者快速瞭解GaussDB(DWS)雲原生數倉相關信息與能力。 本文分享自華為雲社區《直播回顧 | GaussDB(DWS)雲原生數倉技術解析》,作者:胡辣湯。 在本期《GaussDB(DWS)雲原生數倉技術解析》的主題直播中 ...
一周排行
    -Advertisement-
    Play Games
  • 前言 本文介紹一款使用 C# 與 WPF 開發的音頻播放器,其界面簡潔大方,操作體驗流暢。該播放器支持多種音頻格式(如 MP4、WMA、OGG、FLAC 等),並具備標記、實時歌詞顯示等功能。 另外,還支持換膚及多語言(中英文)切換。核心音頻處理採用 FFmpeg 組件,獲得了廣泛認可,目前 Git ...
  • OAuth2.0授權驗證-gitee授權碼模式 本文主要介紹如何筆者自己是如何使用gitee提供的OAuth2.0協議完成授權驗證並登錄到自己的系統,完整模式如圖 1、創建應用 打開gitee個人中心->第三方應用->創建應用 創建應用後在我的應用界面,查看已創建應用的Client ID和Clien ...
  • 解決了這個問題:《winForm下,fastReport.net 從.net framework 升級到.net5遇到的錯誤“Operation is not supported on this platform.”》 本文內容轉載自:https://www.fcnsoft.com/Home/Sho ...
  • 國內文章 WPF 從裸 Win 32 的 WM_Pointer 消息獲取觸摸點繪製筆跡 https://www.cnblogs.com/lindexi/p/18390983 本文將告訴大家如何在 WPF 裡面,接收裸 Win 32 的 WM_Pointer 消息,從消息裡面獲取觸摸點信息,使用觸摸點 ...
  • 前言 給大家推薦一個專為新零售快消行業打造了一套高效的進銷存管理系統。 系統不僅具備強大的庫存管理功能,還集成了高性能的輕量級 POS 解決方案,確保頁面載入速度極快,提供良好的用戶體驗。 項目介紹 Dorisoy.POS 是一款基於 .NET 7 和 Angular 4 開發的新零售快消進銷存管理 ...
  • ABP CLI常用的代碼分享 一、確保環境配置正確 安裝.NET CLI: ABP CLI是基於.NET Core或.NET 5/6/7等更高版本構建的,因此首先需要在你的開發環境中安裝.NET CLI。這可以通過訪問Microsoft官網下載並安裝相應版本的.NET SDK來實現。 安裝ABP ...
  • 問題 問題是這樣的:第三方的webapi,需要先調用登陸介面獲取Cookie,訪問其它介面時攜帶Cookie信息。 但使用HttpClient類調用登陸介面,返回的Headers中沒有找到Cookie信息。 分析 首先,使用Postman測試該登陸介面,正常返回Cookie信息,說明是HttpCli ...
  • 國內文章 關於.NET在中國為什麼工資低的分析 https://www.cnblogs.com/thinkingmore/p/18406244 .NET在中國開發者的薪資偏低,主要因市場需求、技術棧選擇和企業文化等因素所致。歷史上,.NET曾因微軟的閉源策略發展受限,儘管後來推出了跨平臺的.NET ...
  • 在WPF開發應用中,動畫不僅可以引起用戶的註意與興趣,而且還使軟體更加便於使用。前面幾篇文章講解了畫筆(Brush),形狀(Shape),幾何圖形(Geometry),變換(Transform)等相關內容,今天繼續講解動畫相關內容和知識點,僅供學習分享使用,如有不足之處,還請指正。 ...
  • 什麼是委托? 委托可以說是把一個方法代入另一個方法執行,相當於指向函數的指針;事件就相當於保存委托的數組; 1.實例化委托的方式: 方式1:通過new創建實例: public delegate void ShowDelegate(); 或者 public delegate string ShowDe ...