中國信息通信研究院王卓:基於安全多方計算的數據流通產品標準

首先先講一下背景,我們都在說數據價值的釋放,但是現在數據價值釋放是有瓶頸的,在進行共享和挖掘的時候,一定會涉及到數據在管理方和使用方之間的轉移,這樣的轉移一定會帶來問題,它帶來的問題主要涉及到數據存在泄漏的風險,以及法律方面的合規要求問題。所以我們認爲要通過落地的技術手段解決這些問題,在符合法規要求的情況下充分挖掘數據,實現價值的釋放。

  所以我們就要引出安全多方計算技術,它的由來是最早在1982年由姚期智先生提出了“百萬富翁問題”,就是有兩個很有錢的富翁,他們想知道誰更有錢,他們又不想讓任何人知道自己實際有多少錢,包括可能存在的可信第三方。所以這個問題被提出來成爲“百萬富翁問題”,對於這個問題解決是典型的兩方安全計算案例。

  實際上我們還希望比較的有更多人,希望比較更多的富翁誰更有錢,這就變成了多方計算的問題。在兩方計算基礎上,通過延伸也提出了安全多方計算的協議。在我們的安全多方計算標準裏寫出的定義是指針對沒有可信第三方情況下,安全的進行多方協同計算的問題。具體來說,在分佈式網絡中參與個體都有祕密輸入,即不希望其他方得知的輸入,希望在這種情況下共同完成計算,並且可以得到正確計算結果。實際上這並不是一個從技術上進行的定義,而是一種純邏輯上的定義,技術的實現其實有很多,後面我們還會講到。

  現在安全多方計算已經受到了很多方的關注,首先在很多場合,央行和工信部都提到了對安全多方計算髮展的要求,比如在“兩會”的記者會上,和工信部發出的《大數據產業發展規劃》,都有相應的提及。其次在國際安全多方計算研究社區中,社區的活動十分活躍,有20多款各種各樣種類不一的安全多方計算軟件和產品,這些軟件其實全都是以開源的形式公佈的,比如在GitHub上。然後在國內的各大企業,比如說這裏列出的螞蟻金服、百度、騰訊雲、阿里巴巴等,他們都進行了相應跟進,均有各自的安全多方計算軟件產品,這其實說明安全多方計算商業產品化的方向是很明顯的。

  接下來要說的是重點的基於安全多方計算的數據流通產品,首先它就是利用MPC技術,在跨組織流動方面進行數據保護,任何一方最終不能拿到除計算以外第三方數據的情況下進行計算,這是直接把MPC的定義拿到了產品中。

  接下來是產品化的部分,剛纔提到了它的技術實現有很多種,包括混淆電路、不經意傳輸、同態加密、區塊鏈等等。實際上我們沒有做任何規定,市面上也有來自各種各樣不同技術的實現,實現雖然不同,但是同樣完成了定義中的要求,它就是一個合格的安全多方計算的產品。在安全多方計算的產品上,它的優勢主要在於真實數據、不希望別人得到的數據是不會發生轉移的,同時還能正確完成計算任務。同時也是存在一些問題的,最明顯的就是性能,因爲你不想把真實數據傳出去,一定會涉及到加密等等其他的技術環節,一定會對計算性能造成影響。另外就是產品實現差異性大,沒有統一的衡量標準,以及最終要的產品的安全性難以驗證,所以我們引出了後面對於MPC產品標準的需求,需要統一標準來界定具體的技術要求以及要通過什麼樣的方式驗證它的安全性。

  然後就是具體的標準內容,標準主要包括技術要求與測試方法,技術要求部分我們先對產品進行了定義,然後從數據相關基礎能力,編譯計算能力,數據流通管理能力,產品安全性、健壯性、穩定性方面進行了要求,我們後面會有具體的列表,每一大項裏都有相應的具體要求,每一個具體要求都有測試用例,比較長、比較複雜,也是流程化、操作化的東西,我就不具體展示了。

  最後是這份標準的編寫單位,由中國信息通信研究院牽頭,然後由螞蟻金服、百度、零知識科技、矩陣元、阿里巴巴、騰訊雲、UCloud等等單位參與編寫。

  安全多方計算,雖然我們對它的產品進行了標準的工作,但是我們還是想繼續研究這項技術有什麼樣的應用場景,還有什麼樣的技術細節,我們後續會組織學術性的探討。

  除了我們已經完成的這份標準,還想具體進行性能方面的評測項制定,以及除了基於MPC之外是不是還有其他的可以形成的數據流通產品標準,這也是我們後續要做的工作。

  最重要的一點,就是這份標準已經形成了相應的評測,這個評測已經正式加入了第九批大數據產品能力評測,第九批大數據產品能力評測也就是這兩天開始,會正式啓動,我們也會有相關的新聞發出,也希望大家能參與進來,謝謝大家,我們這次的發佈就到這裏。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章