推薦系統實踐筆記——第一章_好的推薦系統

目錄

 

一、什麼是推薦系統及推薦系統的任務: 

二、推薦系統的應用

三、推薦系統評測


一、什麼是推薦系統及推薦系統的任務: 

  1. 推薦系統的任務就是聯繫用戶和信息(物品),一方面幫助用戶發現對自己有價值的信息(或稱感興趣的物品),另一方面能夠讓信息(物品)能夠展現在對它感興趣的用戶面前。從而實現用戶與信息(物品)之間的雙贏。
  2. 推薦系統與搜索引擎的區別在於,推薦紫銅不需要用戶有明確的需求,而是根據用戶的歷史行爲給用戶興趣建模,從而主動給用戶提供明確的需求物品信息,推薦系統能夠在用戶沒有明確目標的時候幫他們發現自己的感興趣的內容。
  3. 推薦系統能夠通過挖掘用戶的行爲,從而找到用戶個性化的需求,將長尾商品準確的推薦給需要的用戶,幫助用戶發現他們感興趣但很難發現的商品。
  4. 推薦系統的本質是將用戶和物品聯繫起來,它能夠在信息過載的情況下幫助用戶發現令他們感興趣的信息,也能夠將信息推送給對它們感興趣的用戶,實現用戶和信息雙贏。

                                                                                用戶\Leftrightarrow信息(物品)

二、推薦系統的應用

廣泛利用推薦系統的領域包括:電子商務、電影視頻、音樂、社交網絡、閱讀、基於位置服務、個性化郵件和廣告。

電子商務:亞馬遜 ,電影視頻網站:Netflix,個性化音樂電臺:Pandora 社交網絡:Facebook,個性化閱讀:GoogleReader,基於位置服務:Foursquare

三、推薦系統評測

什麼纔是好的推薦系統?這是推薦系統評測需要解決的首要問題,一個完整的推薦紫銅包含三個參與方:用戶、物品提供者、推薦系統網站。以圖書推薦爲例,首先,推薦系統需要滿足用戶需求,給用戶推薦他們感興趣的圖書,其次:推薦系統要讓各出版社的書都能夠被推薦給對其感興趣的用戶,而不是隻推薦幾個大型出版社的書。最後好的推薦系統設計,能夠讓推薦系統本身收集到高質量的用戶反饋,不斷完善推薦的質量,增加用戶和推薦系統之間的交互,提高網站的收入。因此在評測一個推薦系統的同時,需考慮三方的利益,一個好的推薦系統是能夠令三方共贏的系統。

爲了評測推薦系統採用以下幾個指標:

1.準確度

2.覆蓋度

3.新穎度

4.驚喜度

5.信任度

6.透明度

推薦系統的實驗方法:

1.離線實驗

(1)通過日誌數據獲得用戶的歷史行爲數據,並按照一定的格式生成標準數據集;

(2)將數據集按照一定的規則分成訓練集和測試集;

(3)在訓練集上訓練用戶的興趣模型,在測試集上測試;

(4)通過事先定義的離線指標算法在測試集上評測算法在測試集上的預測結果。

優點:不需要對實際系統的控制權,不需要用戶參與實驗,速度快,可以測試大量算法。

缺點:無法計算商業上關心指標,離線實驗的指標和商業指標存在差距。

2.用戶調查

在對算法沒有十足把握的時候上線具有較大的風險,所以在上線前一般需要做一次稱爲用戶調查的測試。,在做用戶調查時,一般要控制成本和調查的統計意義。

優點:可以獲得體現用戶主觀感受的指標,相對在線實驗的風險很低,出現錯誤後很容易彌補。

缺點:招募測試用戶的成本代價較大,很難組織大規模的測試用戶,可能會導致測試結果統計意義不足。

3.在線實驗

在完成離線實驗和用戶調查後,可以將推薦系統上線做AB實驗。

優點:可以公平的獲得不同算法實際在線時的性能指標,包括商業上關注的指標。

缺點:週期較長,必須經過長期實驗才能夠獲得可靠的結果。

一般來說,一個新的推薦系統最終上線,需要完成上面所說的3個實驗。

  • 首先,通過離線實驗證明它在很多離線指標上優於現有算法。
  • 然後,通過用戶調查確定它的用戶滿意度不低於現有的算法。
  • 最後,通過在線的AB測試確定它在我們關心的指標上優於現有的算法。

 

 

 

發佈了16 篇原創文章 · 獲贊 1 · 訪問量 8027
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章