差分隱私及應用

差分攻擊

       差分攻擊是通過比較分析有特定區別的明文在通過加密後的變化傳播情況來攻擊密碼算法的。差分攻擊是針對對稱分組加密算法提出的攻擊方法,看起來是最有效的攻擊DES的方法(之所以說看起來,是因爲差分攻擊需要很大的空間複雜度,實際上可能不如野蠻攻擊具有可操作性)。2000年以前,差分攻擊就被證明對MD5的一次循環是有效的,但對全部4次循環似乎難以奏效。但是隨着對MD5研究的進展,情況有了變化。

       2005年,王小云、來學嘉等使用差分攻擊的思路,提出了對MD5差分的攻擊方法。該方式提出了充分條件的概念,並列出了一系列的充分條件(大約有290個),如果這些充分條件都能得到滿足,那麼一定能產生碰撞。於是MD5的強抗碰撞性不能得到滿足,即該攻擊方法可以尋找消息對 ,使得 。不過,這一系列的充分條件很難同時滿足。儘管王小云、來學嘉等進一步提出了消息修改算法,通過修改相應比特位的方法來達到滿足這一系列充分條件,但是仍然有37條充分條件不能滿足。這就意味着,從理論上來講,該算法只需測試 條隨機消息就可以找到完全滿足充分條件的消息對 ,從而找到碰撞,即 。這是一個相當有意義的成果,意味着任何人在自己的筆記本上都可以計算出碰撞的消息對。當然,這裏產生碰撞的消息對是隨機的。

差分攻擊案例

       2006年10月,Netflix提出一筆100萬美元的獎金,作爲將其推薦系統改進達10%的獎勵。Netflix還發布了一個訓練數據集供競選開發者訓練其系統。在發佈此數據集時,Netflix提供了免責聲明:爲保護客戶的隱私,可識別單個客戶的所有個人信息已被刪除,並且所有客戶ID已用隨機分配的ID[sic]替代。由於Netflix不是網絡上唯一的電影評級門戶網站,其他網站還有很多,包括IMDb。個人可以在IMDb上註冊和評價電影,並且可以選擇匿名化自己的詳情。德克薩斯州大學奧斯汀分校的研究員Arvind Narayanan和Vitaly Shmatikov將Netflix匿名化的訓練數據庫與IMDb數據庫(根據用戶評價日期)相連,能夠部分反匿名化Netflix的訓練數據庫,危及到部分用戶的身份信息。

       卡內基梅隆大學的Latanya Sweeney的將匿名化的GIC數據庫(包含每位患者的出生日期、性別和郵政編碼)與選民登記記錄相連後,可以找出馬薩諸塞州州長的病歷。

差分隱私

       差分隱私是Dwork在2006年針對統計數據庫的隱私泄露問題提出的一種新的隱私定義。 在此定義下,對數據集的計算處理結果對於具體某個記錄的變化是不敏感的,單個記錄在數據集中或者不在數據集中,對計算結果的影響微乎其微。所以,一個記錄因其加入到數據集中所產生的隱私泄露風險被控制在極小的、可接受的範圍內,攻擊者無法通過觀察計算結果而獲取準確的個體信息。

       差分隱私保護模型的思想源自於一個很樸素的觀察:當數據集D中包含個體Alice 時,設對D進行任意查詢操作f(例如計數、求和、平均值、中位數或其它範圍查詢等)所得到的結果爲f(D),如果將Alice 的信息從D中刪除後進行查詢得到的結果仍然爲f(D),則可以認爲,Alice 的信息並沒有因爲被包含在數據集D中而產生額外的風險。差分隱私保護就是要保證任一個體在數據集中或者不在數據集中時,對最終發佈的查詢結果幾乎沒有影響。具體地說,設有兩個幾乎完全相同的數據集(兩者的區別僅在於一個記錄不同),分別對這兩個數據集進行查詢訪問,同一查詢在兩個數據集上產生同一結果的概率的比值接近於1。

       具體的公式定義可以參見:https://baike.baidu.com/item/%E5%B7%AE%E5%88%86%E9%9A%90%E7%A7%81/22415732?noadapt=1

差分隱私在隱私保護領域的優勢

       差分隱私保護模型假設攻擊者能夠獲得除目標記錄外所有其它記錄的信息,這些信息的總和可以理解爲攻擊者所能掌握的最大背景知識。在這一最大背景知識假設下,差分隱私保護無需考慮攻擊者所擁有的任何可能的背景知識,因爲這些背景知識不可能提供比最大背景知識更豐富的信息。

        它建立在堅實的數學基礎之上,對隱私保護進行了嚴格的定義並提供了量化評估方法,使得不同參數處理下的數據集所提供的隱私保護水平具有可比較性。因此,差分隱私理論迅速被業界認可,並逐漸成爲隱私保護領域的一個研究熱點。

差分隱私的弱點

        差分隱私的弱點其實很明顯:由於對於背景知識的假設過於強,需要在查詢結果中加入大量的隨機化,導致數據的可用性急劇下降。特別對於那些複雜的查詢,有時候隨機化結果幾乎掩蓋了真實結果。這也是導致目前應用不多的一個原因。

差分隱私的應用

       差分隱私可以被應用於推薦系統、網絡蹤跡分析、運輸信息保護、搜索日誌保護等領域。

       Google利用本地化差分隱私保護技術從Chrome瀏覽器每天採集超過1400萬用戶行爲統計數據。在2016年WWDC主題演講中,蘋果工程副總裁Craig Federighi宣佈蘋果使用本地化差分隱私技術來保護iOS/MacOS用戶隱私。根據其官網披露的消息,蘋果將該技術應用於Emoji、QuickType輸入建議、查找提示等領域。例如,Count Mean Sketch算法(CMS)幫助蘋果獲得最受歡迎的Emoji表情用來進一步提升Emoji使用的用戶體驗。

參考

差分隱私保護及其應
 

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章