衝量網絡 | 聯邦學習

在這裏插入圖片描述
雖然大量的數據每天都在產生,但在許多領域依然存在數據有限並且質量低下的情況,在跨領域數據方面情況更嚴重,不同行業的數據源之間也存在壁壘,每一類數據往往都儲存在於同一領域的企業或組織中。
在這裏插入圖片描述
一般來說,大多數行業裏,數據之間都是相互獨立,也就是以數據孤島的形式存在,甚至在某個企業內部,由於競爭、隱私或者合規方面等原因,不同部門之間實現數據共享都會非常難。因此如果想要在現實環境中將分散的數據進行整合和共享,其基本上是很難的,花費的代價也很大。另一方面,隨着大數據的進一步發展,重視數據隱私和安全已經成爲了世界性的趨勢,其也在對傳統的數據共享手段提出新的挑戰。

因此,需要尋找新的解決方案來將數據整合,並解決一系列的利益問題,使得數據能在不同行或者同行業不同部門之間流動起來,同時讓所有人能享受數據共享帶來的利益。
在這裏插入圖片描述
聯邦學習(Federated Learning)最早是由谷歌在2016年提出,但它最早並不是專門用於人工智能中,原本是用於解決安卓手機終端用戶在本地更新模型的問題,使得在數據交換的時候也能保證信息安全和個人隱私,並在保證合規和安全的情況下,使得不同機器和來自多個不同節點的計算能力相結合,從而積少成多,大規模整合算力,並開展高效率的機器學習。聯邦學習可使用的機器學習算法不侷限於神經網絡,還包括隨機森林等重要算法。

舉例來說,如果兩個公司希望共享數據聯合訓練一個機器學習模型,不過他們系統之間的業務系統分別擁有各自用戶的相關數據。考慮道數據隱私保護和安全,兩家公司並不能直接進行數據交換,可使用聯邦學習系統建立模型。
在這裏插入圖片描述
聯邦學習主要由加密數據對比、模型訓練和激勵三部分來組成。

加密數據對比
其主要是防止一些誘導性的訓練方式,會優先對比雙方是否由共同的用戶,在保密的狀態下就把重複的部分排除在外,避免信息的泄露。

模型訓練
爲了保證訓練過程中數據的保密性,一般需要第三方協作者胡總和第三方硬件進行加密訓練。協作者會將公鑰分發給數據提供者,用於數據加密,而數據提供者將進行交互,分別基於加密的情況下進行計算,並且把結果返回給協作者。協作者將加密的部分進行解密,並將結果分發回數據提供者,並完成一次訓練。當然,協作者可以是其他形式,例如雙方的SGX硬件可以進行交互,來形成可信計算集羣進行安全的數據學習。

激勵
聯邦學習能解決不同機構之間的參與度問題,也就是說實際應用後的模型效果會記錄在區塊鏈等功能上,並形成激勵機制。比如提供更好的數據的機構能獲得更好的激勵反饋,同時激勵更多的數據和算力加入進來。衝量網絡也將利用區塊鏈技術,將聯邦學習的過程透明化和市場化。

在這裏插入圖片描述
數據隔離
外部不會泄露給任何非權限擁有者,滿足用戶隱私保護和數據安全的需求。

效率高
聯邦學習能保證模型質量不會出現損壞,其會降低負作用的情況,保證聯邦模型比割裂的獨立模型效果好。

公平
所有參與進來的人都是公平且能分享激勵的,使得整個合作的過程都處於公平的狀態。

獨立
保證參與各方在保持獨立性的情況下,進行信息與模型參數的加密交換,並同時獲得成長。

在這裏插入圖片描述
聯邦學習分爲橫向聯邦學習、縱向聯邦學習與聯邦遷移學習。

橫向聯邦學習主要用於用戶數據重疊比較多但用戶重疊比較少的情況,取出雙方用戶特徵相同而用戶不完全相同的那部分數據進行訓練。一般用於同業公司中,例如銀行與銀行間。

縱向聯邦學習一般用於用戶數據重疊較低但用戶重疊較多的情況,取出雙方用戶相同而用戶特徵不完全相同的那部分數據進行訓練。一般用於非同業關聯公司中,例如徵信機構與電商的合作。

聯邦遷移學習則是用於用戶和數據重疊都較少的情況下,不對數據進行切分。例如兩家非同業甚至是非同地的企業,來解決單邊數據規模小和標籤樣本少的問題,從而提升模型的效果。

在這裏插入圖片描述
聯邦學習的產生爲人工智能打破數據屏障和進一步發展提供了新的思路。在未來,聯邦學習會在可信協作、人工智能中發揮更大的作用使得跨機構可信數據協作的效率變得更高,簡化數據計算中的複雜算法,減少參與者之間的互信成本。

衝量網絡也將利用聯邦學習技術來建設可信協作平臺,幫助多個機構在滿足用戶隱私保護、數據安全和政府法規的要求下,進行機器學習建模。利用SGX技術使得數據不出庫便能進行聯合建模,並自動根據數據特徵選擇相關的方案,進一步優化可信協作平臺的體驗,保證大規模可信算力能有用武之地。


衝量網絡隸屬於上海衝量網絡科技有限公司,致力於打造全球區塊鏈可信計算網絡,爲商業場景提供可信計算、安全存儲和區塊鏈網絡解決方案和PaaS服務。衝量網絡通過匯聚多樣化的可信計算資源建立全球最大的可信算力網絡,支持企業、政務大數據中心的數據聯合計算、聯合建模、區塊鏈外可信存儲、可信供應鏈金融、可信跨鏈服務等場景的分佈式計算。同時,衝量網絡爲企業提供一系列的基於區塊鏈+X技術的產品和解決方案,打造下一代的分佈式可信計算平臺,支持區塊鏈的邊界無限擴展,是Web3.0時代的重要基礎設施。
詳見:www.impulse.top

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章