推薦系統相關技術

原創

2020-02-24 14:13

推薦算法是推薦系統的核心，但爲了產生精確而且有效的推薦，越來越多的技術融合到推薦系統的研究中，然後提出各種不同的推薦算法。目前在推薦系統中應用的核心技術包括：

（1）信息檢索技術（IR）

推薦系統根據用戶需求，搜索產品類別數據庫，然後返回用戶需要的信息，其搜索過程可以實時進行，也可以定期執行，同時推薦系統提供的推薦界面既可以基於傳統的關鍵字查詢，也可以基於動態查詢接口。

（2）信息過濾技術（IF）

信息過濾技術一般適合於用戶需求相對不變，而信息動態更新比較頻繁地情況。（比如：指閱，閱米，牛贊網）

信息過濾與信息檢索的主要區別在於：

信息過濾面向用戶長期的信息需求，而信息檢索技術面向的是用戶短期的、實時的信息查詢。
信息過濾使用特徵文件表示用戶的信息需求特點，而信息檢索技術是用關鍵詞表達用戶的查詢需求。
信息過濾中用戶需求相對不變，但用戶訪問的是動態數據流，是從動態數據流中選擇數據；而信息檢索技術訪問的是相對靜止的數據，但用戶需求卻具有瞬時性。

（3）數據挖掘技術（Data Mining）

數據挖掘中的知識可以分爲以下幾類：

分類：將數據劃分爲實現定義好的類別中去。
迴歸：將數據項映射到若干預定義好的變量上去。
聚類：將數據劃分到幾個聚類中去。
概括：爲數據的一個子集給出一個簡潔的描述。
依賴性模型：描述變量之間的相互依賴性。
鏈接分析：判斷數據庫或者數據倉庫中字段之間存在的關係，比如：關聯規則。
序列分析：構造順序模型，發現數據之間在時間上的相關性。

數據挖掘常用的數據挖掘方法包括：

統計分析：利用統計學和概率論對關係中各個屬性進行統計分析，找出它們之間存在的關聯。
神經網絡：模仿生物神經網絡，通過訓練進行學習的非線性預測模型，可以完成分類、聚類等多種任務。
決策樹：用樹形結果表示決策集合，決策集合通過對數據集分析產生典型的決策樹方法。
遺傳算法：運用基於生物進化的概念設計有了一系列過程來達到優化的目的，包括基因組合、分叉、變異和自然選擇。
粗糙集：一種處理模糊和不確定性問題的數學工具，可以用於數據簡化、關聯規則挖掘。
模糊邏輯：可以用來進行證據合成、置信度計算。
最近鄰技術：通過k個最相似的歷史記錄的組合來辨別新的記錄，用來聚類分析、偏差分析。
規則歸納：通過統計方法歸納，提取有價值的if-else規則，可用於關聯規則挖掘。
可視化：採取直觀的圖形方式將信息模型、數據關聯或者趨勢呈獻給決策者。

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

京東廣告研發 —— 京東推薦廣告排序機制演化

1、序言：廣告排序機制的前世今生 1.1、簡介：廣告排序機制在線廣告是國內外各大互聯網公司的重要收入來源之一，而在線廣告與傳統廣告最大的區別就在於其超大規模的實時競價環境：數以萬計的廣告主在一天內可以參與億級別的流量競拍。在這複雜的實

2024-04-24 23:17:14

Pinecone: 大模型時代的智能索引與搜索解決方案

隨着人工智能技術的飛速發展，大模型（Large Models）已成爲衆多領域的重要工具。無論是自然語言處理、圖像識別還是其他複雜任務，大模型都展現出了強大的性能。然而，隨着模型規模的不斷擴大，數據量的激增，如何有效地管理、索引和搜索這些模型

2024-04-19 11:29:43

深度解析大模型推理框架：原理、應用與實踐

在當今數據驅動的時代，大模型推理框架已經成爲人工智能領域的重要支柱。本文將通過簡明扼要、清晰易懂的方式，帶領讀者深入瞭解大模型推理框架的原理、應用領域和實踐經驗，幫助讀者更好地掌握這一技術，並在實際工作中發揮其價值。一、大模型推理框架簡介

2024-04-11 23:28:49

華爲雲GeminiDB，廣告RTA的“登雲梯”

本文分享自華爲雲社區《華爲雲GeminiDB，廣告RTA的“登雲梯”》，作者： GeminiDB-Redis博客。行話說，廣告RTA要想效果好，數據庫挑戰少不了。那麼，廣告RTA對數據庫究竟有哪些挑戰？在上篇文章《究竟什麼樣的數據庫，才能

2024-04-09 10:32:19

大模型推理框架：從理論到實踐的全面解析

在數據驅動的時代，深度學習技術已經滲透到各個行業，從圖像識別到自然語言處理，從推薦系統到智能客服，其應用無處不在。然而，深度學習模型的訓練和推理過程往往涉及大量數據和複雜計算，傳統的計算框架難以滿足需求。因此，大模型推理框架應運而生，成爲解

2024-03-23 00:31:01

正式支持騰訊雲！Zilliz Cloud 多雲版圖再度擴張

3 月 22 日，Zilliz 對外透露，Zilliz Cloud 的用戶可以利用騰訊雲在北京和上海區的雲服務搭建雲應用，這將進一步爲海內外用戶提供更爲豐富的多雲支持的向量數據庫雲服務！這是繼阿里雲後，Zilliz Cloud 在國內新

2024-03-22 14:51:11

解鎖深度表格學習（Deep Tabular Learning）的關鍵：算術特徵交互

近日，阿里雲人工智能平臺PAI與浙江大學吳健、應豪超老師團隊合作論文《Arithmetic Feature Interaction is Necessary for Deep Tabular Learning》正式在國際人工智能頂會AAAI

2024-03-21 01:31:46

京東廣告算法架構體系建設--高性能計算方案最佳實踐

1、前言推薦領域算法模型的在線推理是一個對高併發、高實時有較強要求的場景。算法最初是基於Wide & Deep相對簡單的網絡結構進行建模，容易滿足高實時、高併發的推理性能要求。但隨着廣告模型效果優化進入深水區，基於Transformer

2024-03-15 13:45:05

多模態+大模型會帶來哪些“化學反應”？

導語：沒人懷疑，2024 年，AI 依然將是科技界的主角。上個月，OpenAI 推出了可以生成 60 秒高清視頻的視頻生成模型 Sora，掀起了對多模態模型的進一輪討論。多模態大模型技術的最新進展如何？這一波新技術，對於行業和消費者的體驗會

2024-03-15 13:45:01

大模型技術調研與端應用形態探索

在人工智能領域，大模型（Large Model）技術的崛起標誌着深度學習進入了一個全新的階段。這些模型通常包含數十億甚至千億級別的參數，通過大規模的數據訓練，能夠在語音識別、自然語言處理、圖像識別等多個領域取得令人矚目的成就。那麼，大模型究

2024-03-08 12:36:05

Z Potentials | 星爵，他的征途不止向量數據庫

縱觀過去幾十年的科技發展史，每一代新的技術架構的出現往往都伴隨着新的數據範式的出現，也催生了多家百億到千億美金數據平臺的誕生。如果說 2023 年科技領域的關鍵詞是 LLM，那麼數據庫領域的關鍵詞一定非向量數據庫莫屬。向量數據庫是一種專門用

2024-03-07 21:26:17

揭祕 LLMs 時代向量數據庫的 3 大實用場景

過去一年，ChatGPT 和其他大語言模型（LLMs）的爆火也帶動了向量數據庫的發展。許多用戶在搭建檢索增強生成（RAG）系統過程中選擇了使用向量數據庫 Zilliz Cloud ，但 Zilliz Cloud 的功能不止於此

2024-02-23 14:52:22

覆盤了今年春節，主打一個AI應用讓我「機智過人」

鞭炮聲聲辭舊歲，春光融融迎新年。春節，這一喜慶團圓的節日意味着萬象更始，一幅嶄新的畫卷已經徐徐展開——在數字化、智能化的時代背景下，科技爲這一歷史悠久的節日注入了新的活力與魅力。春節與科技的強強聯合，不僅展現了中華民族的智慧與創新精神，也讓

2024-02-23 12:37:09

零門檻AI開發平臺EasyDL：百億參數大模型ERNIE的加持

隨着人工智能技術的不斷髮展，越來越多的企業和個人開始關注如何快速開發出高效的AI模型。在這個背景下，EasyDL應運而生，作爲一個零門檻AI開發平臺，它降低了AI開發的門檻，讓更多人能夠輕鬆地開發和部署AI模型。而當EasyDL與百億參數大

2024-02-21 12:33:38

智慧家庭場景的推薦系統的發展歷程和方向 | InfoQ《公開課》

直播概要：隨着計算機的蓬勃發展，互聯網進入大數據和人工智能時代，爲了解決信息過載和長尾商品，推薦系統成爲唯一選擇，而面對不同的業務場景，爲了解決業務痛點，會根據不同的場景特點尋找不同的方法和手段來解決推薦中實際遇到的問題。在智慧家庭領域，

InfoQ 中文站

2021-12-21 10:54:01

24小時熱門文章

最新文章

最新評論文章