破解YouTube、Facebook推薦系統背後的那些算法

我之前翻譯過一篇文章《破解 YouTube 的視頻推薦算法》,得到了很多人的好評,在各個算法、大數據公號上紛紛轉載。最初看到這篇文章是@fengyoung 在Facebook上分享的,覺得題目很有意思就看了一遍,看完後感覺很有啓發,遂決定翻譯一下讓更多人看到。

這篇文章內所指的算法包含多個YouTube增長類算法(爲你推薦(Recommended),建議觀看(Suggest),相關視頻(Related),搜索(Search),原始評分(MetaScore),等等)。這些不同的算法產品,各有側重,但有一個共同點,那就是它們的優化目標相同,都是觀看時長(Watch Time)。

這篇文章給我的啓發有三方面:

1. 從YouTube平臺的算法設計人員角度,設計繁多的推薦算法,是爲了提高頻道的觀看時長,而提高頻道的觀看時長又是爲了讓用戶能夠經常訪問平臺。這是一種雙贏的思維,說白了:誰能幫平臺留住用戶,平臺就重點扶持他。

2. 文章得出結論,要做垂直內容才能在YouTube上活下去。平臺上內容越多樣,平臺越健康,這是毋庸置疑的,儘管我贊同這個結論,但是我沒有在本文中看到作者是如何得到這個結論的。這一點就是YouTube和國內視頻平臺最大的差別,國內的視頻平臺嚴重趨同,花高價購買獨家版權似乎是國內視頻平臺的唯一出路,也是一個妖魔化的出路。反觀YouTube,他們利用算法驅使了各個頻道專耕某一個垂直內容,然後把最適合的用戶給你匹配上,這纔是更宏大的一盤內容棋。

3. 本文作者給我們了一個啓示,算法並不是黑盒子,是可以hack的,儘管這個也只能hack到冰山一角,但是也比我們盲目地運營要明亮很多了。作者的研究方式,首先是明確了一個平臺的算法目標是什麼,YouTube是watch time,那麼就去觀察這個目標和哪些指標有關,進一步看到每個指標又能怎麼提高。

感興趣的朋友可以搜索着看,我這裏就不過多重複了。

關於Facebook的算法,我在《推薦系統36式》專欄裏都有提到,你也可以看下圖,總結了推薦系統背後的那些算法,都是需要你花時間去學習和實踐的。

爲什麼會有《推薦系統36式》這個專欄?

最近十年尤其最近五年,藉助推薦系統的技術和名頭,異軍突起的互聯網產品越來越多,Youtube、淘寶、京東、Netflix、今日頭條、Amazon等等這些產品都已經從個性化推薦中嚐到了商業的甜頭。甚至有人說在未來,推薦系統會成爲所有數據型產品的標配。

然而推薦系統前方技術蓬勃發展,後方卻落地困難。

審視推薦系統的技術應用現狀,大廠們一騎絕塵,但太多中小廠的工程師們還不知道一個推薦系統如何從 0 到 1 誕生,需要去了解哪些知識。比如有人問我這些問題:

1. 我們產品這個階段需要上線推薦系統嗎?推薦系統前期投入大嗎?

2. 推薦系統這事容易整嗎?裏面那些算法到底是怎麼回事?

3. 搭建一個推薦系統,這裏面有哪些坑?

4. 推薦架構、搜索引擎和廣告系統之間應該如何協同?

5. 推薦系統相關的開源軟件都有哪些?如何選型?

所以我就順勢寫了一個推薦系統相關的專欄,希望能幫助推薦系統學習者架構起整體的知識脈絡,並在此基礎上補充實踐案例與經驗,力圖解決你係統起步階段 80% 的問題。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章