荔枝推薦在UGC內容平臺的挑戰
UGC平臺的特點
主UGC+PGC— 生產者多,體系豐富,內容多,質量層次不齊
新增強勁 —每天上傳的內容很多
UGC積累——歷史積累內容多
平臺價值觀
選擇一個賽馬機制+普惠價值觀;推薦系統從長遠目標裏去完善落實這個價值觀。
- 賽馬機制:
我們想構造 一個社區 ,主播們都是平等,都是有機會成長,就像這個社會可以有出頭的機會,我們想做的就是幫助他們成長,大浪淘沙,也有人落敗下來;
- 普惠:
每個人都有機會被分發。。
推薦要解決的哪些問題?
推薦系統想要解決的問題---在用戶、主播、平臺,3者達到一個最大化的收益
用戶—找到他喜歡的內容,興趣的發現,消費內容或者社交
主播—發現優質主播,得到用戶的互動,金錢的收益的激勵,不斷成長 ?
平臺—用戶與主播的活躍,並給平臺帶來的收益
推薦基本原則取向
- 偏向活躍的主播
- 偏向新發布的內容
- 保持多樣的內容,覆蓋更多用戶羣體
- 用戶喜歡的內容
推薦場景問題定義:流量分發優化+匹配問題?
推薦池+評價系統:收益的計算,內容的評價,推薦池的進入與淘汰機制
用戶側-匹配:用戶與內容的匹配,提高用戶的點擊率,時長,留存;
如何從百萬級裏—》千級別-》百級—》十級別的過程 ,不斷找到用戶匹配的內容
- 多路召回
內容召回—興趣召回,實體召回
協同召回-- youtube_cf
向量召回:w2v-->混合w2v-->圖模型向量召回
深度學習模型召回:dssm
- 排序
lr—>xgboost—>dnn—>w&d
- 主播側:
新主播-發現與爬坡
老主播—評價
- 平臺流量分配:流量—》收益最大化;解決生態主播成長問題
流量有限,如何做到收益最大化?
保證每個作品一定曝光量的前提下最大化全局收益
如何高效?
就是要打造一個舞臺,所有人都可以在上面表演,但還要可以給表演者科學的打分。
所以就有不斷演進打造一個強大的平臺的目標:實驗平臺、策略平臺、機器學習平臺、搜索平臺;
打造強大的推薦系統
強大的平臺:實驗平臺、策略平臺、機器學習平臺、搜索平臺;
易用的實驗分析工具:數據與實驗平臺打通,自動發現策略好壞
完備的評估體系:
用戶:短期長期指標,點擊率,播放時長 ,互動率,留存
生態指標:頭腰尾數據,流量,時間 分佈,生產者留存
推薦系統輔助健康指標—多樣性,基尼係數,新穎度
2018到2019年,荔枝推薦平臺架構演進