聯邦學習有望打破企業與高校的科研數據壁壘

上過大學、讀過研究生的同學都知道,我們在學校實驗室做的很多項目,其實離企業生產、工程實踐的真實環境相差很遠,所以存在一個很大的“偶然”,我們上了3年的研究生踏出校門進了企業,才發現動手能力和對企業實際業務的能力,遠遠不如在“一線”奮戰過3年的本科生。

這是一個很多做主管都非常能感同身受的“研究生”現象(當然不代表全部)。這其實反應了一個教學問題,高校的教學理論和實踐爲什麼總是會相差那麼遠?這個問題可能不是我們可以去左右的問題,是教育部、是專家需要去關心的。不過,作爲一個也曾經是現象級的研究生,在研究生課題的點上,我想說一說。

都說中國的大學讀研究生難,畢業容易;外國的大學讀研究生容易,畢業難。道理其實出在做課題上,我想起我們在學校做課題(計算機專業),我們幾個同學都選擇了大數據存儲、機器學習、深度學習、複雜網絡等比較時髦的行業課題,方向完全沒有問題(未來十年發現這些領域都成就了行業的獨角獸)。


我記得我的課題是“機器學習在精準營銷領域的研究與應用”,當時的過程是這樣的,整個開題到答辯的過程,歷史1年,最打動我的是我找到了一個很善解人意的導師張老師,給我找了一個師姐(也是軟件工程方向的)。真的是手把手教我調整邏輯迴歸參數,教我用python,美滋滋,關鍵是這種研究生活像毒藥一樣,一下子把大半年時間給消耗掉了......

我先前一直以爲,算法啊、模型啊都研究透了,然後會在一個實際的場景裏面去試一試,後來要run整個模型的時候,師姐說:別多想,去xxx下載點數據,跑完,把曲線結果寫到你的論文裏面去。

好吧,原來研究生的課題基本大多數如此——根本沒辦法去感受真實的企業生產環境,做數據的拿到是沒有現實意義的樣本,那我們的課題只能生存在溫室裏面!

我覺得除了北大自己有方正(前兩天也差不多倒閉了)、清華自己有紫光,很少有高校擁有自己的企業,更何況企業數據!對於一個互聯網企業來說,特別是擁有大數據的企業,在法律合規層面,也不可能將真實數據給到高校,獻給一個研究生來做一個課題。這是荒謬絕倫的事情。

“數據壁壘”破題之道

關於高校如何培養更接地氣的研究生,因爲我們現在有個和學校出國留學的項目,所以,和項目方經常會組織一些“茶花會”,大家會提出一些想法。(如果我們的條件和方案更加能吸引深造的學生,那麼是不是深造項目在招生和畢業上會更有優勢呢?)和交大的老師們還有上海富數科技的卞總(在他們合作的密碼學實驗室討論會上),卞總提出了一個非常有意思的想法——


卞總:當年在交大做課題,也是被數據樣本給逼瘋了。我覺得企業真實數據開放給高校,建立深度的合作關係,這裏麪包含兩層意思,

第一是高校的科研能力注入到企業生產環境

第二是高校的專業人才輸送到企業。這些合作的都是三贏的。企業得到了人才、高校豐富了教學資源、學生更加接近企業。


金老師:這裏面啊,關鍵其實還是怎麼樣促成企業和高校之間的合作,就拿我們實驗室來說,想從企業拿點合作資源和項目,其實比申請國家項目還難。

卞總:其實現在也有好的方式,比如說我們和密碼學實驗室合作的多方安全計算項目,聯邦學習這種方式。我們公司現在的FMPC平臺,已經對接了數十家大數據的聯盟區塊鏈節點,比如SDK、運營商等,這些數據廠商完全可以與高校進行科研項目,甚至可以舉辦建模大賽等活動。我們的學生可以在企業級的真實數據環境裏做更多的事情。聯邦學習這個過程就解決了企業數據不出來,卻可以被建模使用的需求。


茶花會上關於這個想法,得到了一致認可,我個人作爲一個高校缺數據的“受害研究生”也覺得是一個非常不錯的發展方向。目前微衆的標準化fate讓使用者門檻越來越低,富數科技在這件事情上,又有很好的高校資源,相信在聯邦學習完全成熟的時候,我們的高校和企業能做到聯動,讓企業級生產數據和業務能真正被高校科研接觸到。

END -


發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章