推薦系統在直播場景的應用（花椒直播）

原創

进击的煎饼果子

2020-06-17 05:18

記錄一次講座筆記，講課的是花椒直播的改機算法架構工程師，王洋；王洋浙大+新加坡南洋理工大學，通信系統專業

推薦系統：幫助用戶發現內容，克服信息過載
通過分析用戶行爲，對用戶興趣建模，預測用戶的興趣

早期，基於熱度推薦：熱度高的一般質量有保證，但是集中在頭部，難以千人千面

現代化推薦系統
全樣本，生成粗排序（百萬量級），再生成精緻排序（幾百個量級），在推薦給用戶（10量級）

所以分兩步分別是：
召回與排序。

召回

基於鄰域的協同過濾

1計算用戶與物品的相似度矩陣
2計算出用戶對缺失物品的得分
將得分高的部分推薦給用戶，就可以得知該用戶沒看過的物品裏哪個更可能喜歡了

具體舉例：

早期使用：基於主播的協同過濾
由於是n方，用戶的話會維度爆炸
原因：
1主播維度小，計算少
2根據用戶的歷史行爲推薦，可解釋性強
3新用戶看一個主播即可開始推薦其他
總結
1是基於統計的方法，不是優化學習的方法
2只使用局部數據進行推薦，更像是策略
3用戶和物品維度大時對內存需求較大

基於隱向量的協同過濾

矩陣分解
顯式反饋：打分，評分
隱式反饋：交互頻率；點擊觀看等，評分矩陣一般是01形式

顯式反饋常用方法：

用兩個小矩陣相乘，擬合出大矩陣

隱式反饋常用方法：

交互程度r ，如觀看時間大於10s
x，y是兩個小矩陣
c表示置信度正比於反饋程度

n方級別編程nk級別
可解釋性差，未用到其他特徵，不夠全面

基於深度學習的矩陣分解

內積可以用DNN學習
NCF網絡 Neural collaborative Filtering

NeuMF

鏈接地址爲：
https://mp.weixin.qq.com/s/ERfIcCJ7ne4OjfRStdR_vw

其他召回模型

Youtube召回模型
使用了較複雜的信息

線上用戶隱向量實時計算；物品隱向量離線存好
二者相乘

排序（精排）

特徵工程

直播不同於物品的推薦，直播是連續行爲，有實時特徵（比如遊戲直播，有五殺時情況與平時不同；是否在跳舞等）

訓練集的生成

藍色部分；使用之前數據組成用戶畫像

排序模型

LR
FM/FFM
GBDT+LR

LR邏輯迴歸

線性迴歸
人工特徵交叉成本高（需要先驗知識）

FM因式分解機

（自動進行特徵交叉）
使用Vi Vj內積模擬特徵交叉

但是隻能進行二階特徵交叉

GBDT+LR

GBDT以天的時間級別更新
LR部分實時更新

深度學習排序

Wide&Deep類模型

DNN
學習特徵間的潛在關係（全連接層），有泛化能力
LR+DNN

下圖左邊是LR 右邊是DNN

DIN深度興趣網絡

多任務學習的模型

業界主流模型之一
可優化的目標包括：點擊、觀看、送禮、關乎、轉發等
宗旨：平衡不同目標的相互影響，做到全局最優（不要出現某個目標特別佔主導）
ESMM模型
把樣本空間分爲三個部分
曝光；點擊；轉化三個層次
是共享底層卷積的（但是共享部分可能有問題，如多任務相關性比較低）

改進：
MMOE 不同的任務使用不同的底層網絡（使用門）減輕不同任務干擾

鏈接地址爲：
https://mp.weixin.qq.com/s/e6Spp7smIEUUExJxHzUOFA

直播內容的理解與識別
把直播中最核心，最精彩的部分挖掘出來推薦給用戶

直播實時性特徵

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

618網購節，電商能擋住惡意網絡爬蟲的攻擊嗎？

2023年，杭州中院審結了兩起涉及“搬店軟件”的不正當競爭案件。本案的原告是國內某大型知名電子商務平臺的運營主體，而被告則是開發了一款名爲“某搬家快速商品上貨批量發佈”的複製軟件，被控非法獲取平臺商品信息並在其他服務市場銷售。根據原告的訴

2024-06-07 00:14:57

大模型在推薦系統中的精準推薦策略與實踐

引言推薦系統在現代互聯網應用中佔據了極其重要的位置。無論是電商平臺、社交媒體、音樂和視頻流媒體服務，還是新聞和內容推薦系統，推薦系統都在提高用戶體驗和平臺收益方面發揮着關鍵作用。近年來，隨着人工智能和機器學習技術的迅猛發展，大模型（如G

2024-06-06 23:55:10

原來Stable Diffusion是這樣工作的

stable diffusion是一種潛在擴散模型，可以從文本生成人工智能圖像。爲什麼叫做潛在擴散模型呢？這是因爲與在高維圖像空間中操作不同，它首先將圖像壓縮到潛在空間中，然後再進行操作。在這篇文章中，我們將深入瞭解它到底是如何工作的,還

2024-06-06 21:38:48

什麼是LLM大模型訓練，詳解Transformer結構模型

本文分享自華爲雲社區《LLM 大模型學習必知必會系列(四)：LLM訓練理論篇以及Transformer結構模型詳解》，作者：汀丶。 1.模型/訓練/推理知識介紹深度學習領域所謂的“模型”，是一個複雜的數學公式構成的計算步驟。爲了便於理解

2024-06-04 11:09:34

Prompt Tuning：大模型微調實戰

隨着深度學習技術的不斷髮展，大模型在各種任務中取得了顯著的成果。然而，大模型的訓練需要大量的數據和算力，導致在實際應用中受到限制。爲了解決這個問題，研究者們提出了微調的方法，即使用預訓練模型在少量數據上進行訓練，使其適應特定的任務。在Pr

2024-06-03 12:14:42

走進京東“卓越研效架構師”首期研習營圓滿收官

五月的北京，春深半夏，花開滿城。由全國雲計算技術行業產教融合共同體牽頭，攜手工業和信息化部電子第五研究所、E³CI軟件研發效能度量工作委員會以及京東雲共同主辦的“走進京東——卓越研效架構師”研習營，於5月17-18日和24-26日在北京京東

2024-05-31 23:55:49

兒童節變身小小音樂家*用ModelArts製作一張AIGC音樂專輯

本文分享自華爲雲社區《兒童節變身小小音樂家*用ModelArts製作一張AIGC音樂專輯》*作者* 華爲雲社區精選。兒童節*如何給小朋友準備一份特別的禮物* 這份AIGC音樂專輯製作攻略一定要收下一段文字靈感就能編織出一曲悠揚悅耳的旋

2024-05-31 11:04:39

金融反欺詐指南：車險欺詐爲何如此猖獗？

青島市人民檢察院在其官方微信公衆號上發佈的梁某保險詐騙案顯示，2020 年以來，某汽修廠負責人梁某、某汽車服務公司負責人孫某，與保險公司的趙某等人相互勾結，收購二手北汽等品牌新能源汽車，併爲這些車輛購買車損險。隨後，他們利用暴雨天氣，故意製

2024-05-30 00:16:51

基於Fluid與JindoCache的大模型訓練加速實踐

隨着人工智能技術的不斷髮展，深度學習模型變得越來越複雜，參數量動輒幾十億甚至上百億。這樣的“大模型”在帶來強大性能的同時，也對訓練過程提出了極高的要求。尤其是在數據加載和計算資源利用方面，傳統的訓練方法往往難以滿足快速、高效的需求。爲此，我

2024-05-28 12:12:15

【終極指南】使用Python可視化分析文本情感傾向

本文分享自華爲雲社區《Python理解文本情感傾向的終極指南》，作者：檸檬味擁抱。情感分析是一種通過自然語言處理技術來識別、提取和量化文本中的情感傾向的方法。Python在這一領域有着豐富的庫和工具，如NLTK、TextBlob和VAD

2024-05-28 10:58:03

AI安全志：英國AI騙保事件增加300%！

最近，英國《衛報》報道稱，一些騙子正在利用人工智能照片編輯軟件篡改照片，以進行保險欺詐活動。這一發現令保險公司震驚，因爲這可能導致汽車保險費用飆升至歷史最高水平。安聯保險公司表示，從2021年至2023年期間，利用應用程序篡

2024-05-28 00:15:50

解讀注意力機制原理，教你使用Python實現深度學習模型

本文分享自華爲雲社區《使用Python實現深度學習模型：注意力機制（Attention）》，作者：Echo_Wish。在深度學習的世界裏，注意力機制（Attention Mechanism）是一種強大的技術，被廣泛應用於自然語言處理（NL

2024-05-27 10:58:44

智能測試持續加碼，大模型引領軟件測試新生態

在軟件行業日新月異的今天，智能測試已成爲提升軟件質量的關鍵環節。大模型的崛起，更是爲軟件測試帶來了前所未有的變革。隨着AI和ML技術的突飛猛進，智能測試得到了快速發展，實現了對測試過程的自動化和智能化管理，顯著提高了測試效率和質量。如今，智

2024-05-25 02:07:17

風控指南：國內車險欺詐呈現四大趨勢

2024年4月11日，國家金融監督管理總局官網發佈國家金融監督管理總局關於《反保險欺詐工作辦法（徵求意見稿）》公開徵求意見的公告。《徵求意見》共6章、37條，明確反保險欺詐工作目標是建立“監管引領、機構爲主、行業聯防、各方協同”四位一體的

2024-05-23 12:16:45

智能高效的IDE GoLand v2024.1全新發布 - 進一步升級AI輔助工具

GoLand 使 Go 代碼的閱讀、編寫和更改變得非常容易。即時錯誤檢測和修復建議，通過一步撤消快速安全重構，智能代碼完成，死代碼檢測和文檔提示幫助所有 Go 開發人員，從新手到經驗豐富的專業人士，創建快速、高效、和可靠的代碼。立即獲取G

2024-05-21 12:19:26

24小時熱門文章

最新文章

最新評論文章