網站推薦機制中的藝術、科學與商務問題

網站推薦機制是電子商務或內容網站的核心功能之一。例如你在一個網站買了一本書後,網站會推薦其他你可能會感興趣的書。這被認爲是亞馬遜等電子商務巨頭成功的關鍵。本文對幾個出色的推薦系統進行了較透徹的分析。

2006年10月,Netflix搞了一次不尋常的有獎競賽。這家網上DVD租賃公司開出獎金一百萬美元,獎勵給能把他們網站的產品推薦機制提高10%的人。Netflix 以富有創新精神和闖勁著稱。而一百萬美元的獎金對於這樣一家公司來說,其實並不象聽起來那麼多。


有獎競賽還在進行當中(“至少要進行到2011年10月2日”)。所以這是一場炒作活動還是希望花小錢進行研究,我們還不得而知。而對Netflix來說,更好的推薦機制是必不可少還是錦上添花?今天,Netflix正面對從沉睡中醒來的巨人BlockBuster的挑戰,因此它必然要尋找制勝的先機。出色的推薦機制會留住老用戶,吸引新用戶。比如當一個用戶還DVD時,系統會推薦給他/她可能會喜歡的另一部電影。這就增加了這個用戶回來再租DVD的可能。

瀏覽與推薦


一個出色的推薦機制不光對Netflix,對其他網絡企業也非常重要。這是因爲用戶的網上活動分爲兩類:搜索瀏覽。當消費者明確知道她想要什麼的時候,她搜索。但當她不太清楚想要什麼的時候,她瀏覽。瀏覽活動爲推薦系統帶來了絕好的機會。因爲當用戶沒有集中注意力在找她想要的東西時,她對外來的建議是敞開的。

在瀏覽過程中,用戶的注意力(和他們的錢),都等着你去抓住。通過向用戶展示有吸引力的東西,網站可以使交易成功的可能最大化。所以如果網站能增加給用戶提供好推薦的機率,就能賺更多錢。顯然這不是一個容易解決的問題,但解決這個問題帶來的好處是巨大的。推薦的幾種方式如下:

  • 個性化的推薦--根據用戶過去在網站的行爲進行推薦
  • 社會化推薦--根據類似用戶過去在網站的行爲進行推薦
  • 基於產品的推薦--基於產品本身的特性進行推薦
  • 以上三者的混合


我們現在通過實例詳述上述方式。包括老牌網站如亞馬遜 Amazon,以及新秀如Pandora(譯者:一個收聽網上音樂的站點)和del.icio.us(譯者:著名的社會化書籤網站)。

亞馬遜--推薦之王


亞馬遜被廣泛認爲是網上購物行業的領袖,特別是推薦機制的使用。過去十幾年間,該公司投入了大量金錢和腦力開發推薦機制,來促使用戶更多地購物--包括對你瀏覽歷史、購買歷史,以及其他用戶購買數據的分析。讓我們看看亞馬遜推薦機制的幾個方面。下面是登陸到我的亞馬遜帳戶後網頁顯示的主要部分:



(譯者:上圖擡頭是“消費者瀏覽了這件商品後買了什麼?”下面是三件商品:52%的消費者買了你正在看的這套襯衣;19%買了另一種款式;5%買了灰色的那種)

這部分是社會化推薦。注意,非常量化的分析,給我一個基於數據統計的理由爲什麼我應該買這套襯衣。而同時這又是個性化的推薦,因爲它基於我剛剛點擊查看的產品。



(譯者:上圖擡頭是“爲你準備的新貨”。下面是幾本書以及鏈接“爲什麼我們推薦這本書給你?”)

這一部分是“基於產品的推薦”,具體說是新書推薦。點擊“爲什麼我們推薦這本書給你?”的鏈接會顯示我的購買歷史。因此這同時也是個性化推薦--基於我過去行爲的推薦。

這一頁上有其他四個部分採用上述推薦機制的結合。我們用下表概括:

亞馬遜個性化推薦系統

 
你的瀏覽歷史 你的購買歷史
實際瀏覽商品 新產品(基於產品的推薦)
相關商品(基於產品的推薦) 相關商品(基於產品的推薦)
別人購買的(社會化推薦) 別人購買的(社會化推薦)

很自然,這個系統是對稱和覆蓋全面的。所有推薦都基於用戶個人行爲,加上商品本身,或者是其他用戶在亞馬遜的活動。不管是因爲你以前購買過相關產品,還是因爲其他很多用戶都喜歡,亞馬遜每推薦給你一件商品,都增大你把它放進你的購物筐的可能。

超越亞馬遜

亞馬遜的推薦系統是程序自動化和用戶相關購物信息天才集合的經典之作。亞馬遜花了十幾年的時間建立和完善了這個系統。這個系統基於產品和相關用戶的巨大數據庫;記錄的信息包括你在過去幾年或幾分鐘內做過什麼。其他新公司如何與之競爭呢?

出乎意料的是,有辦法競爭。答案來自與網絡購物沒什麼關係的學科--遺傳學。如你所知,遺傳學研究DNA片段--基因,如何承載影響人類特性和行爲的密碼。比如一家人因爲他們有某些基因是相同的,因此長相和行爲有類似之處。遺傳學是一門有150年曆史的學科,在醫學和歷史學的研究中都是一個重要工具。但遺傳學一個出乎意料的應用於2000年1月6日出現--Time Westergren和他的朋友們決定把遺傳學的概念引入到音樂中。

潘朵拉(Pandora)--基於遺傳學的推薦系統

音樂染色體組項目的推出,目的在於把音樂解析成爲最基本的基因組成。它的基本想法是:我們因爲音樂的某些特性喜歡音樂--那麼爲什麼不能根據音樂的某些相似之處設計出一套推薦系統呢?這類推薦系統應該屬於基於產品的推薦。但具有深刻創新意義的是,產品(音樂產品)的相似性,通過“基因”組成來衡量。

(譯者:上圖是Pandora音樂播放器向用戶解釋爲什麼播放一首歌曲:“基於你告訴我們的信息,我們播放這段音樂。因爲這段音樂微妙地使用人聲合聲,混合了聲學和電子樂器,有以人聲爲核心的審美特點,音調以大調爲主,以及其他音樂基因組項目中發現的相似性。”)

在奮鬥了幾年,分析了海量的音樂後,這個項目積累了足夠的數據,並推出了名爲Pandora的在網上收聽音樂的服務。Pandora 由於準確的推薦和用戶低成本進入(譯者:指用戶可以很容易地就試用Pandora的服務)取得巨大成功。用戶只需選一名歌手,或一首歌,就可以建立一個用戶自己的電臺,播放類似的音樂。

這種“即刻滿足感”是很難抗拒的。因爲Pandora 瞭解音樂相似性背後的因素,它不需要了解用戶的好惡,就可以把用戶黏住。確實,Pandora 需要把握用戶的口味或記憶--但這正是蘊藏在音樂本身的DNA中了。當然Pandora有時並不完美,會播放不對用戶口味的音樂。但這很少發生。

很自然地我們會問:這個基於基因的推薦方式能不能應用於其他產品--如書籍、電影、酒、餐館、或旅遊點呢?對於每一類產品,它的基因又由什麼因素組成呢?比如說,對葡萄酒來說,它的基因是否包括對酒的口味的描述呢:黑莓口味、土味、果香型、複合型、混合型,等等。而書籍的基因是否是描述故事情節的用語呢?如果基因真的是讓某一個物體在我們頭腦中產生獨特形象的因素,對於不同的事物我們應該可以把他們的基因定義出來。其實在過去的幾年間,我們已經在互聯網上做這樣的事了。這就是“標籤(tagging)”。

Del.icio.us -標籤會成爲基因麼?

Pandora 的初始投入是巨大的。因爲成千上萬的音樂需要人工來鑑定。社會化書籤網站中首屈一指的 del.icio.us 則採用不同的辦法--讓用戶自己來鑑定、標識。這種自組織的方式相當成功,del.icio.us 很快在最初的使用者中流行起來。今天,del.icio.us 已經不僅僅是一個書籤網站--它還是一個新聞網站和搜索引擎。但del.icio.us是否也是一個推薦系統呢?



(譯者:上圖顯示加了“Linux”標籤的最受歡迎的網頁鏈接,右側是相關標籤。)

答案是肯定的。這是一個非常簡明的推薦系統,它指基於一個基因--那就是一個標籤。例如在上圖中,我們看到最受歡迎的加了“Linux”標籤的網頁鏈接,同時還看到相關鏈接如“Open source (開源軟件)”和“ubuntu (Linux 操作系統的一個版本)”。而一個更令人興奮的推薦系統是基於多個標籤的吻合。然而由於算法還不完善,這一點的作用並不明顯。但至少,這一功能對於Read/WriteWeb 的網頁(譯者:原文的站點)是有效的,在下圖中,可以看到右側顯示的與 Read/WriteWeb 類似的其他博客。


因此,del.icio.us 的機制有可能發展成爲一個有趣的自助分類、組織的推薦系統。如果有足夠的用戶並逐步調整系統,用羣體的力量加標籤的方式可以建立起一個對書、葡萄酒、音樂同樣有效的推薦系統。前題是,標籤要準確到能夠成爲被標籤對象的基因!

結論

推薦引擎是網上電子商務系統和用戶體驗的一個重要組成部分。網上零售商們有強烈的意願向那些正在瀏覽的用戶提供推薦,以驅使他們購買。亞馬遜有一套非常出色的個性化推薦系統,是這個領域的領先者。其他網上零售商面臨的問題是缺乏用戶信息和軟件構架不完善。

最新的推薦引擎,如受遺傳學啓發的Pandora和基於羣體社會化標籤的del.icio.us都是非常有趣的新發展。這些系統的長處在於“即刻滿意度”--不需要用戶提供他們的偏好和過去的瀏覽或消費歷史。不管未來如何發展,亞馬遜、Pandora和del.icio.us目前展示了極其出色的推薦技術。我們向您推薦這幾個系統,並對未來拭目以待。

 




發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章