基於矩陣分解的協同過濾算法

原創

あずにゃん

2020-06-16 07:08

日萌社

人工智能AI：Keras PyTorch MXNet TensorFlow PaddlePaddle 深度學習實戰（不定時更新）

矩陣分解發展史

TraditionalSVD：將矩陣分解爲三個矩陣，中間的爲奇異值矩陣
缺點：矩陣必須稠密，在工程中無法應用

LFM FUNK SVD：將一個矩陣分解爲兩個矩陣，其中一個是用戶-隱含特徵矩陣，另一個是物品-隱含特徵矩陣

BiasSVD:在原來的FUNK SVD基礎上加入了偏置項

SVD++：在BiasSVD的基礎上添加了用戶的隱式反饋信息
顯示反饋指的用戶的評分這樣的行爲，隱式反饋指用戶的瀏覽記錄、購買記錄、收聽記錄等。
SVD++是基於這樣的假設：在BiasSVD基礎上，認爲用戶對於項目的歷史瀏覽記錄、購買記錄、收聽記錄等可以從側面反映用戶的偏好。

基於內容的推薦

畫像：構建物品或用戶的特徵，本質上就是給用戶或物品貼標籤

基於矩陣分解的CF算法

矩陣分解發展史

Traditional SVD:

通常SVD矩陣分解指的是SVD（奇異值）分解技術，在這我們姑且將其命名爲Traditional SVD（傳統並經典着）其公式如下：

Traditional SVD分解的形式爲3個矩陣相乘，中間矩陣爲奇異值矩陣。如果想運用SVD分解的話，有一個前提是要求矩陣是稠密的，即矩陣裏的元素要非空，否則就不能運用SVD分解。

很顯然我們的數據其實絕大多數情況下都是稀疏的，因此如果要使用Traditional SVD，一般的做法是先用均值或者其他統計學方法來填充矩陣，然後再運用Traditional SVD分解降維，但這樣做明顯對數據的原始性造成一定影響。

FunkSVD（LFM）

剛纔提到的Traditional SVD首先需要填充矩陣，然後再進行分解降維，同時存在計算複雜度高的問題，因爲要分解成3個矩陣，所以後來提出了Funk SVD的方法，它不在將矩陣分解爲3個矩陣，而是分解爲2個用戶-隱含特徵，項目-隱含特徵的矩陣，Funk SVD也被稱爲最原始的LFM模型

借鑑線性迴歸的思想，通過最小化觀察數據的平方來尋求最優的用戶和項目的隱含向量表示。同時爲了避免過度擬合（Overfitting）觀測數據，又提出了帶有L2正則項的FunkSVD，上公式：

以上兩種最優化函數都可以通過梯度下降或者隨機梯度下降法來尋求最優解。

BiasSVD:

在FunkSVD提出來之後，出現了很多變形版本，其中一個相對成功的方法是BiasSVD，顧名思義，即帶有偏置項的SVD分解：

它基於的假設和Baseline基準預測是一樣的，但這裏將Baseline的偏置引入到了矩陣分解中

SVD++:

人們後來又提出了改進的BiasSVD，被稱爲SVD++，該算法是在BiasSVD的基礎上添加了用戶的隱式反饋信息：

顯示反饋指的用戶的評分這樣的行爲，隱式反饋指用戶的瀏覽記錄、購買記錄、收聽記錄等。

SVD++是基於這樣的假設：在BiasSVD基礎上，認爲用戶對於項目的歷史瀏覽記錄、購買記錄、收聽記錄等可以從側面反映用戶的偏好。

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

向量數據庫引領 AI 創新——Zilliz 亮相 2024 亞馬遜雲科技中國峯會

2024年5月29日，亞馬遜雲科技中國峯會在上海召開，此次峯會聚集了來自全球各地的科技領袖、行業專家和創新企業，探討雲計算、大數據、人工智能等前沿技術的發展趨勢和應用場景。作爲領先的向量數據庫技術公司，Zilliz 在本次峯會上展示了最新的

2024-05-30 21:25:17

2024年國內最全面最前沿人工智能理論和實踐資料

引言【導讀】2024第11屆全球互聯網架構大會圓滿結束。會議邀請了100餘位行業內的領軍人物和革新者，大會通過主題演講、實踐案例分享，以及前瞻性的技術討論，探索AI技術的邊界。(最新AI-大模型獲取地址點擊領取) 近日

2024-05-29 22:52:52

AI安全志：英國AI騙保事件增加300%！

最近，英國《衛報》報道稱，一些騙子正在利用人工智能照片編輯軟件篡改照片，以進行保險欺詐活動。這一發現令保險公司震驚，因爲這可能導致汽車保險費用飆升至歷史最高水平。安聯保險公司表示，從2021年至2023年期間，利用應用程序篡

2024-05-28 00:15:50

使用 Spring Cloud Alibaba AI 構建 RAG 應用

作者：姬世文背景介紹 RAG（Retrieval Augmented Generation）檢索增強生成（RAG）是一種用於將數據與人工智能模型集成的技術。在 RAG 工作流程中，第一步將文檔數據加載到矢量數據庫（例如 Redis）中。

2024-05-27 21:13:51

面向AI的開發：從大模型（LLM）、檢索增強生成（RAG）到智能體（Agent）的應用

引言隨着人工智能技術的飛速發展，大型語言模型（LLM）、檢索增強生成（RAG）和智能體（Agent）已經成爲推動該領域進步的關鍵技術，這些技術不僅改變了我們與機器的交互方式，而且爲各種應用和服務的開發提供了前所未有的可能性。正確理解這三者

2024-05-24 23:57:39

文心大模型免費辣，動手搓點啥慶祝一下吧

5月21日下午，百度智能雲宣佈文心大模型的兩款主力模型ENIRE Speed、ENIRE Lite全面免費，即刻生效。這兩款大模型都是今年3月剛剛發佈的，均支持8K和128k上下文長度。可以說，這是百度最新的模型

2024-05-24 12:13:22

噱頭還是風口？剖析AI短劇出海的未來

導語 |去年以來，低成本、高回報的土味短劇在國內爆火，而這股風也成功地刮到海外。2024 年，越來越多的人把目光投向了擁有龐大市場的國外“藍海”，當人們還在高談闊論 Sora 是否顛覆影視行業的時候，AI 已經在出海短劇中大顯身手，那

2024-05-24 11:48:13

華爲雲受邀出席AICon2024 分享AI Agent在企業生產中的技術實踐

近日， InfoQ在北京舉辦行業技術盛會——AICon全球人工智能開發與應用大會2024，華爲雲aPaaS首席架構師陳星亮受邀出席，和技術愛好者分享AI Agent在企業生產中的技術實踐。大模型技術發展浪潮下，AI Agent成爲新一

2024-05-24 10:58:18

昔日輝煌不再，PHP老矣，尚能飯否？

導語 | 近期 TIOBE 最新指數顯示，PHP 的流行度降至了歷史最低，排在第 17 名，同時，在年度 Stack Overflow 開發者調查報告中，PHP 在開發者中的受歡迎程度已經從之前的約 30% 萎縮至現在的 18%。“P

2024-05-23 23:48:42

2023全球DDoS攻擊態勢分析，與衆多行業專家共議DDoS破局之道

近日，百度安全聯合華爲、天翼安全科技有限公司、聯通數科安全、Nexusguard、中國移動雲能力中心、中國移動卓望公司、清華大學共同發佈《2023年全球DDoS攻擊現狀與趨勢分析》（以下簡稱《報告》）。報告從DDoS攻擊態勢、殭屍網絡態勢、

2024-05-23 21:42:25

站在岸上學不會游泳 | 算法校招生的高效成長總結

在這個由數據編織、由算法驅動的時代，AI大模型正成爲推動社會進步的重要力量。我們不僅是變革的見證者，更是推動者和塑造者。感謝零售UP技術人欄目的邀請，本文藉此機會回顧一下自己的算法之路上的一些故事和思考，希望能帶給讀者一些幫助。介紹自

2024-05-22 11:56:42

「Kimi」加入微信，最方便的私人財經助手

喜大普奔，「Kimi」大模型現在可以接入微信了！如果說其他大模型應用還略顯繁瑣，需要下載一個新的APP 甚至翻牆，那「Kimi」加入微信後，把大模型應用的體驗成本降低到 0。這意味着我們有了一個免費且好用且穩定且無

2024-05-21 11:48:27

5月21日相聚上海張江！與文心大模型一起共建大模型產業應用生態圈

5月21日，文心中國行將走進上海，在張江科學會堂舉行。屆時，政府、企業與高校的相關專家和業界同仁將現場分享生成式人工智能與大模型最新進展，主要圍繞大模型技術如何賦能產業級應用創新展開探討，還有百度風投從投資視角帶來的觀點，讓參會者全方位瞭解

2024-05-17 00:28:21

白鯨開源CEO郭煒在2024 DataOps發展大會上獲聘專家

2024年5月15日，白鯨開源CEO郭煒在2024 DataOps發展大會上被正式聘任爲DataOps專家，並獲得了榮譽證書。本次大會由中國通信標準化協會主辦，中關村科學城管委會提供支持，大數據技術標準推進委員會（CCSATC601）承辦，

2024-05-16 11:28:50

共創數字經濟新生態，華爲雲生態領航者·AI先遣隊圓滿落幕

5月9-11日，華爲雲生態“領航者·AI先遣隊”課程班在杭州成功舉辦，本次課程聚焦於AI前沿探索與實踐的高端研修，匯聚了來自華爲雲生態夥伴企業的高層決策者，共同開啓了一場關於智慧升級與生態共建的深度對話。華爲雲生態領航者·AI先

2024-05-16 10:58:48

24小時熱門文章

最新文章

最新評論文章