阿里的推薦算法競賽的宣傳稿寫得很不錯,很生動,吸引眼球。貼在這裏,以後可以借鑑
-------------------------------------------------------------------------------------------------------------------------------------
穿越到甄嬛傳,你有幾分勝算?
又是一年選秀開始,於是宮裏宮外又開始了明爭暗鬥。如何才能挑出合皇上口味的好秀女,當好主子的左膀右臂?可能還要花很多功夫。
你知道皇上喜歡聰明的嬛嬛,喜歡明豔的華妃,喜歡得體的皇后,那你怎麼知道皇上喜不喜歡新來的秀女呢?
(皇上,左邊是不是別有一番風味?——你一定是在逗我(╯‵□′)╯︵┻━┻)
好吧,現代的審美在宮裏估計是站不住腳,但如果運用現代技術,比如機器學習算法,也許可以幫上你一些忙。
要預測小主未來的受寵程度,自然是以宮中已有的主子們作爲樣本。各位娘娘千姿百態,你便首先要將大家的特點(attribute)加以歸類,方便日後的總結。而對應的皇上的態度基本分爲三類:朕喜歡,朕不喜歡,偶爾朕還覺得挺逗比的。
然後聰明的你會去找@留一手 給各位娘娘都打個單項分(方便謀劃起見,請將他的分數調整爲正數),然後與皇上的態度聯繫起來:
嬪妃 容貌 家世 脾氣 人際關係 皇上態度
甄嬛
沈眉莊
安陵容
華妃
皇后
吃貨淳貴人
像這樣已經存在並被分類(皇上態度已經明確)的情報,我們稱之爲前車之鑑(training set)。
有了情報,你就可以用很多種辦法來處理它們,比如將這些分數調整比重相加得出一個總評分,總評分越高對應皇上越喜歡。這樣,你大概可以算出皇上喜歡溫婉大方的白富美學霸,而且似乎美貌和溫婉佔的比重更大一些。爲了驗證這個評判法則,你可以選一些一開始尚未加入前車之鑑情報集、新發現的嬪妃(testing set)進行驗證。
在驗證的過程中,你纔會知道神馬叫做人算不如天算。總有一些姑娘雖然百般不符合你的預測,仍然得了皇上的寵幸。這就說明——皇上的眼瞎了?纔不是呢!是你需要修改你的評判法則了!這時你可以再加入一個改進因子(learning rate),每次如果預測結果與實際不符,你就得做出一定的修正。
如此一來,你便可以將每年的選秀都當成你的八卦演練場了。當再有新人進宮的時候,你只需再分析一下新人的各個屬性特徵,就可以大概猜出這位小主的前途。隨着新人的不斷進入,你的這個評判法則也會越來越趨於準確。當然,前提是皇上的口味保持一致。如果皇上性情大便,啊不,大變,那有可能原有的模型都要推倒重來了。
好吧,我們的機器學習算法看起來還不錯,也爲你的宮鬥進階之路提供了指引。如果你是女人,請你按照主子的喜好去努力,也許哪一天你就是下一個容!嬤!嬤!(奴婢可是當年大明湖畔的夏雨荷!!!)如果你是一個#可愛的男孩子#,恭喜你,是一塊蘇培盛接班人的好材料……#註定孤獨一生#
在21世紀的天貓,就有那麼一羣兢兢業業的可愛的男孩子,他們每時每刻都在尋找新的方式來揣測各位主子的意思,希望能給爲屏幕前的皇上老佛爺們挑出最合各位口味的商品。這,就是我們[人見人愛花見花開妹子你們怎麼還不到碗裏來]的天貓算法團隊。
除了並肩作戰之外,這些算法達人之間還會展開各種激烈的廝殺啃咬……來比賽誰更懂主子的心意!就是傳說中的”阿里巴巴大數據競賽內部賽——天貓推薦算法大挑戰”!那麼高大上的名字想來你也還沒聽說過,不過隨着天貓數據的開放,你也將有機會可以小試身手,看看面對看不見的主子們,你有幾分勝算!
少年們,繼續加油,多多提高姿勢水平啊!當年宮裏那些個公公嬤嬤,都不知道比你高到哪裏去了!
阿里巴巴大數據競賽——天貓推薦算法大挑戰正式啓動,給你真實的數據,解決真實的問題。百萬大獎,等你挑戰!快來參賽吧~~~
參賽猛戳:http://102.alibaba.com/competition/addDiscovery/index.htm
----------------------------------------------------------------------------------------------------------------------------------
這是第二篇稿件,文案平實多了
當你還在實驗室琢磨幾十萬網頁的分類器,
當你還在網上苦苦搜尋那幾千幾萬條的公開測試集,
當你的論文把百來萬條記錄稱做“大數據上的科研”...
同學們,save your time, 放過那些tiny data,讓阿里告訴你,什麼叫做big data。阿里巴巴大數據競賽——天貓推薦算法大挑戰,玩轉真實數據,解決真實問題。一場屬於精英的遊戲,即將開啓,更有百萬大獎,等你挑戰!
你,準備好了嗎?
參賽猛戳:http://102.alibaba.com/competition/addDiscovery/index.htm
阿里巴巴大數據競賽介紹
1.大賽介紹:
阿里巴巴大數據競賽是阿里巴巴集團主辦,在阿里巴巴大數據科研平臺——“天池”上開展的,基於天貓海量真實用戶的訪問數據的推薦算法大賽。
本次比賽的目的是讓廣大的高校同學在大數據時代的背景下,有機會學習和利用阿里巴巴的大數據和雲計算平臺,嘗試解決真實的業務與社會問題。
整個比賽分爲三季(season):
Season 1:2014年3月10日至4月20日,參賽者可以下載少量天貓的真實行爲數據,並在本地調試算法,提交結果。
Season 2:2014年4月25日至7月30日,參賽者須使用“天池”平臺(阿里巴巴自主研發的分佈式計算平臺),訪問海量的天貓數據,並利用Map&Reduce、SQL及各種平臺集成的機器學習算法包調試模型、提交結果。
Season 3(即線上賽,實戰雙11):2014年10月至11月,Season 2的top選手可以訪問天貓,參與2014年雙11的真實算法設計,並有機會獲取百萬大獎。
2.大賽激勵:
Season 1 階段不設獎項
參賽隊伍中成績Top500的隊伍直接晉級Season 2
Season 2 階段獎項:
一等獎:1支隊伍,獎金貳拾萬
二等獎:1支隊伍,獎金伍萬
三等獎:1支隊伍,獎金貳萬
(上述獎項以決賽答辯成績的最終名次決定)
月星星獎:每期月度榜單排名Top10的參賽隊成員都將獲得搭載雲OS的手機一部(具體手機型號在公佈榜單時公佈)
優勝獎:決賽全國賽排名Top50的參賽隊成員直接進入阿里巴巴校園招聘綠色通道(即招聘流程省略簡歷篩選及筆試篩選階段,直接進入面試階段) ,在校期間均有效;並將獲得阿里紀念T恤和大賽獲獎證書
總決賽Top10的主要參賽隊成員可直接入圍“阿里星”計劃,參賽隊的指導老師(如有)將享受天池數據的最高使用權限1年
Season 3 階段獎項:
Season 2 階段的Top3隊伍將受邀參加天貓雙十一實戰,贏取100萬大獎。(組委會將在Season 2結束後公佈細則)
3.報名規則
1、參賽對象
全日制高校(研究院所)本科、碩士、博士均可參賽
2、組隊規則
參賽隊伍可以是單人組隊,或者自由組合,但是最多不超過三人(可以跨學院跨學校)。如果是多人團隊,則需指定一名隊長,負責溝通事宜。另外每個隊伍可以配備指導老師一名
注:
1.每人只能參加一支隊伍;
2.保證參賽隊員報名信息準確有效,否則會被取消參賽資格及激勵;
3.進入season2後,不允許變更隊伍成員;
4.報名時間:只要在4月20日0:00(season1截止)之前報名即可。鼓勵大家早點報名,可以早點接觸到數據,以確保參賽時間充足。
5.報名方式:官網註冊賬號後報名即可
6.交流論壇:
阿里雲論壇:http://bbs.aliyun.com/thread/187.html?type=738
4.大賽組織:
主辦方:阿里巴巴集團
合作方:中國中文信息學會
技術媒體:Infoq技術媒體
技術社區:SF
鳴謝CCF大數據專委會的支持