推薦相關的觀點、典型例子記錄

1、廣告、搜索、推薦相關人員與技術和業務產品之間的關係,想將廣告和搜索做好更多的從廣告系統(技術)和搜索系統(技術)的角度出發即可,但是想把推薦做好需要從推薦產品的角度出發,而不僅僅是推薦系統(技術)的角度。基於此一個懂算法的產品經理或是能用產品語言溝通的算法工程師是難能可貴的!!!

2、關於產品與算法的關係,產品是1,算法是0。沒有合適的產品之前,算法對用戶幾乎不產生什麼價值,一旦產品成立,算法能讓產品實現質的飛躍。對於跟產品端走得更近的推薦算法而言,這個效應尤其明顯。

3、推薦技術是否能成就一個偉大的產品(公司),就像搜索技術之於google一樣?——因爲搜索技術的革新促成了google(搜索產品)的成功,但基於推薦技術對產品的強烈依附關係,它不會促成一個產品,而是會在和產品的相互作用下,錦上添花,形成一種用戶習慣。(注:今日頭條不算是一種基於推薦技術而成功的大公司嗎?)

4、個性化技術是解決信息過載問題的,一個產品引入個性化的前提條件是:

4.1、item數量足夠多

4.2、item類型對用戶產生的分衆

拿電影和圖書做對比,每年產生的圖書比電影至少多一個數量級,圖書在種類和分衆性上也顯然比電影強得多,特別是在國內環境對於電影偏好趨同性高度一致的情況下。這也是個性化商用技術最早由amazon圖書發端的一個原因。而幾年前豆瓣各產品線分拆,算法技術也獨立發展,圖書更強調個性化,電影更強調熱門與根據標籤篩選,也是同樣道理。以上論述不意味着電影就不需要個性化,比如netflix,在美帝可被接觸到的優質片源更多,用戶品味更分散的條件下,個性化仍然是必須的,特別是近年來netflix的業務不僅侷限於電影之後。

5、一個產品從零開始考慮上個性化,未必要一蹴而就,它有一個判斷的漸進路徑:排行榜->分類排行榜->分人羣個性化->針對個人的個性化。如果前一個方案能解決問題,就沒必要走到下一步。即便走到最極致的個性化,之前幾步的解決方案也需要同時存在於系統之中。

6、經歷的兩家公司正好代表了兩種不同類型的推薦訴求——基於用戶社區的興趣型推薦,和以商業目標實現爲前提的推薦(市面上還有其它類型差別較大的推薦)。注意到它們的差異,並採取不同的措施是件相當有價值的事情。

7、推薦的衡量指標決定了努力方向,面對不同的推薦場景,一個重要的原則就是不要用同一套標準去衡量你的工作結果。

8、ctr、precision/recall、rmse是衡量一個單一算法,而不是一個推薦系統的指標,或者說,不是衡量跟它綁定在一起的推薦產品的指標。要推動產品和算法形成一個適合自身的指標非常困難,需要多方人員的認知並達成共識。——現在視訊的狀態就是我們提出衡量feed流推薦的優劣的三個指標。

9、個性化直白的說就是讓所有人都滿意,並不是滿足80%的需求,犧牲掉20%。由此可見其極端困難程度。

10、另一個案例比方說淘寶搜索個性化,如果我們衡量的指標是ctr、cvr,只要我們照顧好那80%大衆用戶和爆款商品,就能用最簡單的方法獲得最好看的統計數字指標。然後用他們產生的數據繼續訓練我們的模型,同時強化了這個結果。於是那20%(或許價值巨大)的用戶永遠也無法進入我們的視野,這終歸是個蹩腳的個性化系統。

11、數據質量決定了算法效果的上界,算法模型的變換、算法參數的調優只不過是在努力逼近這個上界而已。所以,要想讓你的算法產生更好的效果,有兩種途徑:優化算法;或者優化數據——具體到推薦領域,主要是優化人與系統的交互數據,但這不是單純的算法問題。

12、不要過度迷信算法的作用,要充分利用產品和生態的力量。數據優化的增益能極大提升算法優化的上界。

13、這裏有一個案例,是我們前陣子跟的手機淘寶商品詳情頁的同店商品推薦,在一個較長期的純粹算法層面的ctr預估版本的改進中,點擊率提升了幾個百分點。後來我們發現該模塊的數據來源於兩處——算法和賣家自定義。而實際上,後一個來源幾乎不起作用(注:作者的意思應該是:對於增加點擊率不起作用)。實際數據對比也顯示算法來源產生的點擊和成交都三倍於店家自定義的數據結果。如果我們在業務上推動數據源全切換到算法來源,預期帶來的效果提升比之前純粹的算法改進要高出一倍。這個提升不牽涉到任何的模型改進,但需要算法人員保持對業務的關注和理解,而不是一直躲在後面。

 

 

參考文獻:

1、https://zhuanlan.zhihu.com/p/28886858(注:這篇文章的觀點成形於2014年,作者:知乎-阿穩)

 

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章