《數據競賽白皮書·下篇》發佈,首次開源辦好一場數據競賽的實踐方法論

兩週前,我們發佈了《數據競賽白皮書·上篇·1000場競賽的深度分析》,通過28000字的研究分析、54個高品質圖表,講透了數據競賽行業發展,帶領大家看懂了競賽高熱度背後的邏輯。

上篇發佈後,引發了廣泛的討論,湧進公衆號後臺領取白皮書的小夥伴們可把方小鯨累壞了。拿到上篇後,小夥伴們就開始靈魂拷問三連:

下篇在哪裏?

什麼時候發?

我要怎麼領?

低調了半個月的方小鯨,今天終於可以正式宣佈《數據競賽白皮書·下篇·辦好一場競賽的實操手冊》發佈啦。

在這裏插入圖片描述

僅在中國,數據競賽就以年均108.8%的增速、累計超120萬人次參加體量、累計高達2.8億人民幣的獎金規模,成爲了數據智能行業的創新槓桿。如此高的熱度與參與度,此前尚無一份專業研究資料,《數據競賽白皮書》無疑是填補了這一遺憾。

《數據競賽白皮書》(以下簡稱“白皮書”)是在大數據系統軟件國家工程實驗室的指導下,和鯨科技攜旗下第三方數據競賽平臺和鯨社區(Kesci.com),聯合AWS共同發佈,分爲《數據競賽白皮書·上篇·1000場競賽的深度分析》和《數據競賽白皮書·下篇·辦好一場競賽的實操手冊》兩部分。

[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-8H6cNIU0-1577089174245)(https://blog.heywhale.com/content/images/2019/12/image-14.png)]

白皮書通過1000餘份問卷調研、1000餘場競賽數據、幾十位行業專家及企業辦賽負責人的訪談、超過1200小時的分析研究、近50000字的內容輸出、80個可視化精美圖表,爲我們全景展現了數據競賽行業,揭示了爲什麼數據競賽正在被越來越多的機構認可,一步步成爲數字化創新的常用策略。

正因爲數據競賽已經成爲科研、政府、產業的頭部機構普遍採用的探索模式,可以快速驗證數據驅動業務的方向與效果。作爲數據競賽行業的頭部平臺——和鯨科技頻頻收到合作伙伴的辦賽需求,爲了更好地回答有關數據競賽方面的問題,也爲了讓更多企業與機構在嘗試數據競賽模式時能夠收穫更多,我們在《數據競賽白皮書·下篇·辦好一場競賽的實操手冊》首度公開了和鯨的數據競賽管理方法論與業界最佳實踐。

組織數據競賽的系統方法,爲數字化創新落地賦能增效

爲什麼要掌握數據競賽的系統方法?

雖然受到了各類機構的廣泛歡迎,數據競賽有着很高的組織成本與技術複雜性,要在數據競賽中取得滿意的成果,仍然是充滿挑戰的。經過檢驗的系統方法,能幫助主辦方更好利用數據競賽的工具,取得技術探索、組織發展、業務成長的複合型目標:

· 辦比賽:幫助更多企業或機構能自主辦賽、進行數字化轉型探索。

· 拿成果:幫助企業和機構少走彎路、減少浪費,產出更高價值的算法成果。

· 可落地:匹配業務的真實需求和組織的能力建設,促進算法成果的落地與沉澱。

經過上百場數據賽事驗證的系統方法

《數據競賽白皮書·下篇·辦好一場競賽的實操手冊》——和鯨首度開源策劃與組織數據競賽的系統方法,幫助企業利用和鯨科技四年時間積累的上百場賽事經驗,用更敏捷、可持續的方式推動數字化轉型。

在這裏插入圖片描述

如何設計數據競賽的賽題?

好的賽題能夠貼合賽事主體的業務需求,有創新探索價值。一道好的賽題制定需考慮以下方面:

1、賽題的未來應用價值在緊湊的競賽週期內能夠基於現行技術實現;
2、賽題與現有數據條件充分契合;
3、賽題具有充分的可解性,又能夠保有一定的難度和挑戰;
4、賽題表述清晰、明確,選手易懂;
5、賽題配套的測評方法需要綜合考量學術指標、生產指標與競賽效果;
6、可引入行業專家共同參與賽題的打磨並對賽題質量提出意見。

如何用好雲計算的基礎設施?

雲計算技術日趨成熟,上雲也已是全球趨勢,如何用好雲計算的基礎設施,實現數據競賽的過程可控、體驗提升和成果落地:

· 安全:數據安全是賽事發起方的主要考慮之一,在雲端環境直接調用數據,可以避免公開下載數據的潛在傳播。
· 公平:雲計算爲選手提供了統一的賽事環境,幫助選手專注於算法創新和業務洞察,賽事的成績不再依賴於選手擁有的計算資源。
· 成果可復現:成果管理是數據競賽實現價值的“最後一公里”,雲計算使得賽事成果可以被追蹤、評價、復現、改進,從而實現在業務場景中的價值落地。

高水平的數據競賽需要數據科學協同工具的支撐,能幫助選手和主辦方更高效率、更加便利地使用雲計算資源,如Kaggle Kernels、Google Colab,以及國內的K-Lab:

· 體驗高效:通過預置豐富的數據分析工具包與機器學習框架,提升研發與創新的效率;數據的雲端調用,不再需要數據下載;雲端協同工作,選手可以高效進行團隊協作與成果管理
· 節約成本:在雲端進行每一位選手的算力管理、數據管理,彈性調度雲計算資源,按需使用,最大化雲計算的使用效率。

如何把握賽事運營的全流程?

賽事系統承載了一場比賽的全部流程,從信息展示、報名組隊、成果提交到評測出分,支撐了數據競賽的高效運營與互動體驗。

· 提升賽事管理便利性:一站式賽事信息管理;多種可配置的功能,可適應不同的賽事場景需求,提高運營管理者的工作效率;
· 自動測評的能力與效率:支持多個AI領域、多種類型和大小的成果測評;彈性調度測評的雲算力,幫助選手快速得到反饋結果。

數據競賽的意義在於,用最敏捷的方式實現數據科學的價值閉環,同時實現技術方向驗證、數據人才篩選、數據文化培養、業務效率優化的複合型目標。

覆盤1000餘場數據競賽,這一模式已經成爲了聚合“數據+算力+算法+人才”四大創新要素的樞紐,和鯨科技希望藉助數據競賽系統方法的開源,幫助更多的企業與機構在數字化、智能化、雲端化的變革中找到抓手,加速數據創新的驗證與落地。

在這裏插入圖片描述

領取方式:“和鯨”公衆號後臺發送 “數據競賽白皮書”

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章