數據的脫敏與加密在數據安全領域極爲重要,也是大數據平臺、數據中臺建設中不可缺少的一環,我將以數據脫敏與數據加密的特徵以及區別、方法論來進行研究學習。
一、數據脫敏與數據加密是什麼?
數據脫敏與數據加密是兩種截然不同的技術,也適用於不同的目的。數據脫敏技術主要是爲了兼顧數據安全與數據使用,採用專業的數據脫敏算法;而數據加密則是通過對數據進行編碼來保護數據,獲取實際值的唯一方法是使用解密密鑰解碼數據。所以說,數據加密是可逆的,數據脫敏是不可逆的。
二、數據加密與數據脫敏的優劣以及實施方法?
1.數據加密:
優點:數據加密的優點就在於它的可逆性,敏感數據的實際值被轉爲垃圾值,可以通過解密還原出實際值;
缺點:
1)解密密鑰存儲位置、如何存儲密鑰以及訪問權限等工作都會給整個安全工作增加成本、故障點、複雜性;
2)加密不能完全從技術上保證數據的安全,任何有權限訪問用戶數據的人員,均有可能導致數據泄露;
3)沒有數據訪問權限的人員,也可能存在對數據進行分析挖掘的需求,數據的訪問約束限制充分挖掘數據價值的 範圍;
實施方法:例如DES、MD5等加密函數,具體感興趣的可以去網上搜一下,可以做一些加密數據的測試。
2.數據脫敏:
優點:數據脫敏能夠在更好的保證數據的隱私性的同時保證數據的可用性;
缺點:敏感數據的實際值被轉換成虛構的、但看起來逼真的值,實際值被永久改變且無法恢復,過程是不可逆的;
實施方法:脫敏又分爲靜態脫敏和動態脫敏;
1)靜態脫敏:對數據的搬移並仿真替換,按照用戶指定或預定義的敏感數據特徵,對數據進行自動識別,發現敏感數據,通過對數據的抽取,進行遮蔽、變形、替換等脫敏技術後下發給下游環節(供取用讀寫的數據庫或目標文件中),脫敏後的數據與生產環境相隔離,做到既滿足業務需求又保障生產數據庫的安全;
2)動態脫敏:在訪問敏感數據的同時實時進行脫敏處理,可以爲不同角色、不同權限、不同數據類型執行不同的脫敏方案,從而確保返回的數據可用而安全;
動態脫敏會對數據進行多次脫敏,通過匹配用戶IP或MAC地址等脫敏條件,根據用戶權限,基於SQL語句解析技術,將包含敏感字段的查詢語句進行改寫,對敏感字段採用函數運算的方式,讓數據庫自行返回改寫後的不包含敏感信息的數據。
擴展:數據動態脫敏經過多次迭代發展,目前也有混合模式動態脫敏,集結果集改寫和sql語句改寫,仍需要進一步學習研究,技術進步永遠是數據安全進步的尺度。