在做推薦系統前,請先避免這幾個問題

一、高估系統對用戶需求的捕捉能力

我們都說,搜索引擎是滿足用戶主動需求的產品,而推薦系統則是滿足用戶隱含需求的產品。當用戶明確需要什麼信息,就把需求轉化爲檢索詞,丟到搜索引擎,搜索引擎幫用戶找到它,而推薦系統則能良好的感知用戶未明確陳述的需求,爲其呈現信息。那麼問題來了,既然推薦系統能夠捕捉用戶的需求,也就是說用戶還沒丟關鍵詞給搜索引擎之前已然知道用戶要什麼,直接爲用戶呈現出信息不更好?還需要搜索引擎幹嘛?!

當然更好,當然很好,只是做不到。

用戶的需求是多變的,其中暗含着某些規律,但卻不可能被完全的,徹底的捕捉到,例如用戶瀏覽一個商品頁面,可能他對網頁上的產品感興趣,可能他被網頁上的代言吸引,可能他在爲朋友準備禮物,可能他在爲家人準備年貨,也可能只是誤操作罷了,這些細節被系統感知到的難度太大,所以我們無法知道用戶下一步要去做什麼,哪又如何推薦?

推薦系統有其邊界,一切技術均有其邊界,侷限於當前技術成熟度,侷限於數據,侷限於現實世界與技術世界的距離。當產品經理不瞭解技術的邊界,而技術人員則缺乏產品思維的時候,這種錯誤便容易發生。歡迎加入大數據學習交流分享羣: 658558542   一起吹水交流學習(☛點擊即可加入羣聊

二、不顧用戶需求

系統良好的挖掘了用戶的需求,但是如果不顧場景,帶來的將是用戶巨大的反感。例如,我們公認的基於社交網絡進行各種類型的推薦都是非常好的推薦思路:你所熟悉的人的行爲對你有着非常好的借鑑作用。這一點沒錯。但是一般而言,對商品的推薦還是要放在商品售賣網站,對電影的推薦也請放在電影票售賣網站(個人覺得這個推薦應該放在相關的網站中,比如用戶在瀏覽產品的新聞的時候,也可以進行推薦。當然現在這種情況下的推薦多是廣告)。瀏覽這些網站的用戶,都帶着強烈的隱含需求,但選錯了地方,往往形成對用戶的強制,安能不敗。

三、將“推薦”理解爲“推送” (這種情況更多的是廣告)

不妨變主動變被動,當下無數的互聯網產品都有一個“發現”模塊,包括微信,Twiiter等大量產品。用戶有需求的時候,會主動的找“推薦”,避免被打攪。而對於推薦系統,也避免對用戶形成打擾,引起用戶反感。歡迎加入大數據學習交流分享羣: 658558542   一起吹水交流學習(☛點擊即可加入羣聊

四、不顧用戶需求的“個性化”程度

我們將推薦系統的目標進行簡化,假設它要解決的是點擊率/轉化率預估問題。那麼這些指標都與哪些因素有關?

平臺的因素

本身的魅力

信息造成的差異

用戶的羣體偏好

用戶的個性化偏好

五、總結

其中這幾個因素,有一定的界限,其對應的技術選型也不同,如果只有平臺的因素,點擊率與轉化率遵循Beta分佈,只需要對這些值進行估計。而本身的魅力通過簡單的歷史信息統計便可得到。信息造成的差異,則可以通過典型的線性預估 屬性特徵進行處理。而如果有強烈的羣體偏好,則可以在線性預估模型裏面增加交叉特徵,但是如果個性化需求極其強烈,那麼協同過濾算法可能更加適合。

推薦系統的不同產品形態,其實就是“個性化”程度不同。沒有太強個性化類型的,這樣的推薦系統要解決的問題是“大家都喜歡什麼?”,簡單的統計便能搞定。對於多數廣告類產品,個性化需求太難以捕捉,要解決的問題是“什麼樣的人喜歡什麼樣的結果?”那麼線性模型屬性特徵交叉特徵更加適合。但是對於大多數推薦產品,尤其是大平臺的推薦產品,去探索“每個人喜歡什麼東西?”的個性化推薦技術可能更加適合。而不同的產品,選型哪怕類似,卻也或多或少隱含差異,例如社交網絡中的一些推薦產品,基於圖挖掘的推薦方式可能更加適合。

一句話,技術選型必須參照產品形態與用戶需求。

結語

感謝您的觀看,如有不足之處,歡迎批評指正。

如果有對大數據感興趣的小夥伴或者是從事大數據的老司機可以加羣:

658558542    (☛點擊即可加入羣聊

裏面整理了一大份學習資料,全都是些乾貨,包括大數據技術入門,海量數據高級分析語言,海量數據存儲分佈式存儲,以及海量數據分析分佈式計算等部分,送給每一位大數據小夥伴,這裏不止是小白聚集地,還有大牛在線解答!歡迎初學和進階中的小夥伴一起進羣學習交流,共同進步!

最後祝福所有遇到瓶頸的大數據程序員們突破自己,祝福大家在往後的工作與面試中一切順利。


發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章