隨著大數據時代的到來,數據作為重要的生產要素和流動載體,如何加強技術層面的數據安全和隱私保護,對數據倉庫產品提出更高的要求。 ...
本文分享自華為雲社區《直播回顧 | 人人用數不用愁,動態數據脫敏為您解憂》,作者:胡辣湯 。
隨著大數據時代的到來,數據作為重要的生產要素和流動載體,如何加強技術層面的數據安全和隱私保護,對數據倉庫產品提出更高的要求。本期《隱私保護不用愁,數據脫敏為您解憂》的主題直播中,我們邀請到華為雲GaussDB(DWS)技術佈道師胡玥老師,針對GaussDB(DWS) 動態脫敏功能、效果與開發者和伙伴朋友們展開交流互動。
什麼是數據脫敏?
數據脫敏(Data Masking),顧名思義,即屏蔽敏感數據,對敏感數據通過脫敏規則進行數據的變形。如:身份證號、手機號、卡號、客戶姓名、客戶地址、郵箱地址等。
數據脫敏分為靜態數據脫敏和動態數據脫敏。靜態數據脫敏,是數據的“搬移並模擬替換”,是將數據抽取進行脫敏處理後,下發給下游環節,隨意取用和讀寫的,脫敏後數據與生產環境相隔離,滿足業務需求的同時保障生產資料庫的安全。動態數據脫敏,在訪問敏感數據的同時實時進行脫敏處理,可以為不同角色、不同許可權、不同數據類型執行不同的脫敏方案,從而確保返回的數據可用而安全。
GaussDB(DWS)動態數據脫敏
當前,業界脫敏實施最廣泛的方案是基於數倉底座,外掛第三方代理工具實現脫敏目的,這類方式屬於靜態脫敏,而GaussDB(DWS) 數據脫敏是在數倉底座拓展了一個透明引擎與數倉內核直接交互,使得脫敏處理在SQL語句請求執行過程中實時發生,然後返回給用戶執行結果,即脫敏之後的數據,所以整個脫敏的過程,用戶無感知,邊執行、邊脫敏、邊使用,是一種非常典型的動態脫敏。
DWS動態脫敏引擎的優勢
良好的底座協同。脫敏引擎貫穿於數倉底座的諸多環節,基於預置脫敏策略,參與SQL引擎的解析、重寫、優化與執行。脫敏過程用戶無感知。
策略可配置。客戶可結合自身業務場景識別敏感數據並對業務表的指定列靈活預置脫敏策略。
策略可擴展。產品內置脫敏函數,可以涵蓋大部分常見脫敏效果,支持用戶自定義脫敏函數。
數據可用性。資料庫內原始敏感數據參與運算,僅在出庫時刻(返回結果時)才會做脫敏處理。
數據訪問受控。脫敏策略生效條件的用戶均對原始敏感數據不可見。
全場景數據不泄露。底座交互,可減少敏感數據傳輸鏈路潛在的泄露風險,更加安全可靠,且充分識別各種惡意套取潛在場景並有效防護。
GaussDB(DWS)脫敏引擎
數據脫敏怎麼用?
動態數據脫敏,是在查詢語句執行過程中,根據生效條件是否滿足,實現實時的脫敏處理。生效條件,通常是針對當前用戶角色的判斷。敏感數據的可見範圍,即是針對不同用戶預設的。系統管理員,具有最高許可權,任何時刻對任何表的任何欄位都可見。確定受限制用戶角色,是創建脫敏策略的第一步。
敏感信息依賴於實際業務場景和安全維度,以自然人為例,用戶個體的敏感欄位包括:姓名、身份證號、手機號、郵箱地址等等;在銀行系統,作為客戶,可能還涉及銀行卡號、過期時間、支付密碼等等;在公司系統,作為員工,可能還涉及薪資、教育背景等;在醫療系統,作為患者,可能還涉及就診信息等等。所以,識別和梳理具體業務場景的敏感欄位,是創建脫敏策略的第二步。
不同脫敏列可以採用不同的脫敏函數。比如,手機號通常顯示後四位尾號,前面用"*"替換;金額統一顯示為固定值0,等等。確定脫敏列需要綁定的脫敏函數,是創建脫敏策略的第三步。
有了上述三個信息,第四步構造策略創建的語句並執行,從而預製好脫敏策略。
常見的脫敏效果
如何做到資料庫內可算僅庫外不可見
資料庫內要求原始的敏感數據能夠參與加工計算,僅在出庫的時刻敏感數據才會被脫敏處理。例如投影列表達式、投影列函數、聚集函數、過濾條件、分組條件、子查詢位置投影列表達式等,需要原敏感數據直接參与加工計算。在表查詢、視圖查詢、COPY查詢、GDS外表導出等場景觸發時會進行數據脫敏。可算不可見功能有一個前置的條件,需要打開開關enable_redactcol_computable=on!。
示例:將表emp中年齡<30的員工數據生成新表young,員工Alice查看表young數據會發生什麼?
輸入語句:CREATE TABLE young AS SELECT * FROM david.emp WHERE timestampdiff(year, birth, now()) < 30;
SELECT * FROM young;
執行語句後,員工Alice查看目標表樣時發現查詢young表的脫敏行為與我們的原表emp行為一致(圖一)。當我們查看Alice表定義時(圖二),發現Alice並沒有手工創建脫敏策略,而是關聯了脫敏策略inherited_rp,INSERT執行過程觸發脫敏策略的繼承,從而保證我們的資料庫內可算,又保證了數據的隱私性。
圖一
圖二
華為雲數倉GaussDB(DWS)數據脫敏功能,是資料庫產品內化和夯實數據安全能力的重要技術突破,主要涵蓋以下三個方面:
- 一套簡單、易用的數據脫敏策略語法;
- 一系列可覆蓋常見隱私數據脫敏效果的、靈活配置的內置脫敏函數;
- 一個完備、便捷的脫敏策略應用方案,使得原始語句在執行過程中可以實時、透明、高效地實現脫敏。
總而言之,數據脫敏功能可以充分滿足客戶業務場景的數據脫敏訴求,支持常見隱私數據的脫敏效果,實現敏感數據的可靠保護。歡迎感興趣的開發者觀看直播回放,瞭解詳細信息。
更多關於GaussDB(DWS)產品技術解析、數倉產品新特性的介紹,請關註GaussDB(DWS)論壇,技術博文分享、直播安排將第一時間發佈在GaussDB(DWS)論壇。
論壇鏈接:https://bbs.huaweicloud.com/forum/forum-598-1.html
直播回放鏈接:https://bbs.huaweicloud.com/live/cloud_live/202310191700.html