指閱CTO談個性化閱讀

2011年初我發表了一篇文章《搜索已死,推薦上位》, 結果證明實際情況蠻配合的,2011年可以說是個性化推薦爆發的一年。我訂閱了推薦引擎/個性化推薦等幾個微博關鍵字,眼睜睜地看着相關的微博內容蹭蹭地往上漲,懂的不懂的不懂裝懂的打醬油的都在提個性化,甚至連殭屍帳號都在摻和。春節訂票大家被折騰得不行了,有朋友表示,“12306,你媽媽叫你做個性化推薦!”。這一年,小事兒咱不表,看看幾家大佬的表態。

1、『遲來的產品升級 百度終上個性化推薦的新臺階』 百度CEO李彥宏將此次轉變稱爲百度首頁“迄今爲止最重大的改變、最重要的創新”。其中的一大創新之處是百度對“推薦引擎技術”的應用,即基於用戶行爲、 興趣建模,通過算法和數據分析,準確識別用戶需求,向用戶智能推薦想要的信息、服務或應用,從而提高用戶轉化率及強化用戶黏性。

2、『周鴻禕:360導航UV超hao123 未來佈局垂直搜索』 周鴻禕表示,360瀏覽器和導航網站在中國的流量已經很大,但不會模仿百度做傳統搜索,目前360已經在根據用戶使用習慣推薦個性化內容,這可能代表了未來搜索的方向,另外360將在垂直搜索領域做一些嘗試,將充分發揮瀏覽器覆蓋面大的優勢,在垂直搜索上給用戶提供更多不同的體驗。

3、『搜狗首推探索引擎注重用戶個性化需求』 搜狗積極開發的新一代“探索引擎”的目標,是要給尋找信息的網民完全不同的上網體驗:例如,當用戶打開瀏覽器閱讀一篇新聞的時候,探索引擎會在頁面下方自動推送其他網站相關的報道和評論;當用戶在互聯網上瀏覽商品信息的時候,新一代搜索引擎就會在頁面下方自動向其推送其他網站上該商品的價格、優惠券以及商 品評論。也就是說,新一代搜索引擎能夠“猜”到用戶想要什麼,並且及時向用戶推送他所需要的信息。

4、『數據在淘寶』淘寶會針對消費者提供一些個性化的推薦,未來的淘寶可能會比現在的淘寶發生非常大的變化,未來的淘寶會變得非常個性化,就是會有消費者更感興趣的產品,如果賣家都能夠對這些個性化的產品做足夠多的準備,如果沒有個性化能力的話那很有可能失去競爭力。

5、『豆瓣首頁改爲豆瓣猜 基於個性化算法提供內容』 阿北:“豆瓣猜2005年就有了,這是我們一直在積累的事情。但是新的豆瓣猜纔剛剛面世,它的形態、使用和內容都會有各種問題。我們會在新的一年裏逐步改善這個首頁,也會慢慢把更多類型的內容放進來。豆瓣猜的終極目標是這樣的:每天你打開豆瓣,滿眼看到的都是各類你會感興趣的新東西。我們迫不及待地想和你一起讓這個畫面成爲現實。”

個性化推薦,已然無處不在。

認識我的朋友們應該都知道,2011一年我都在折騰「指閱」,成績不敢說有多大,但起碼上路了。指閱 2012年會有比較大的升級,希望能把產品各方面的體驗都有一個提升,歡迎大家試用。

天涯海閣的 watsonxu 最近發了一篇文章,國內個性化閱讀服務彙總,文章最後留了幾個問題:

1、如何有效獲取用戶的興趣:用戶的閱讀興趣往往很泛,泛意味着這種興趣獲取的難度的成本會更高,如何基於現有的社會化服務或者閱讀過程更好的獲取用戶興趣是一個需要研究的話題。

2、如何更有效的推薦閱讀內容:推薦閱讀內容的難度可能大於電影、音樂和圖書,因爲電影、音樂和圖書都有相對固定的維度,而根據閱讀內容來挖掘用戶的興趣可能難度會更大。

3、當然最大的挑戰在於:個性化閱讀其實基於一個前提就是能夠推薦用戶感興趣的內容,而實際的過程中如果不能給每個用戶推薦感興趣的內容(或者說這個會有個過程),那如何形成用戶的粘性?另外個人的一個困惑是個性化閱讀的需求真的有那麼強麼?

說說我的看法。

基於社交網絡的數據來進行用戶興趣的建模,這個已經是目前幾乎必選的方式之一了。關注個性化推薦領域的朋友應該都知道,冷啓動問題是一個困擾這個領域已久的老大難問題。通過社交帳號授權獲取用戶在社交網絡上積累下來的數據,是解決冷啓動問題的有效有段。這裏有一些簡單的數據示例。當然,這些數據並不見得可以代表你的所有興趣,但卻是個不錯的起點。除了分析興趣點,你還可以分析用戶的「社交影響力」[1] [2]。我之前基於微博數據做過一個小實驗,針對「IT互聯網」[1] 和「創業與投資」[2] 這兩個領域,計算得到了微博帳號的影響力排名。這方面最著名的要數 Klout,國內有一個不錯的創業團隊在做類似的事情 μ+。這種影響力分析結果對進行微博營銷蠻有參考價值,但它是一種相對粗放和更偏向於全局的熱點分析,對個性化的幫助有限。這方面,更有效的是 Facebook 提出的EdgeRank,這裏面融入了個人的「口味」,衡量的是好友圈子內的影響力。

如 watsonxu 所言,做個性化閱讀的產品難度挺大的。Quora 上有一個問題,是講個性化閱讀產品面臨的困難的,答案很棒,我簡單給總結了一下:

1、人的興趣很廣泛,而且多變。你爲什麼會對某個主題感興趣或者不感興趣,這裏面的原因很複雜,如何用算法模擬出來是個很大的挑戰。

2、每天新產生的資訊非常之多。像 Amazon、Netflix 之類的推薦引擎,它們面對的候選條目集合是相對穩定的,這個比較好理解,它們每週也會增加一些新產品,但和資訊數目相比,差距甚遠。

3、大部分資訊的生命週期非常之短。你現在推薦阿凡達,效果也許不會比兩年前差多少,但推薦資訊就不行了,推薦一篇幾天前的文章,很可能就要捱罵了。在如此短的時間窗口裏爲每位讀者做出智能推薦,這對系統的要求非常之高。

4、資訊聚合通常都要面臨大量重複內容的問題,這在國內尤爲嚴重,這會極大傷害個性化資訊應用的用戶體驗。而且國內還有另外一個問題,就是原創的高質量內容相對匱乏,推薦引擎巧婦也難爲無米之炊。

5、與微博之類的個人信息發佈工具相比,這類工具缺乏互動。每次你發佈一條微博,你的 Followers 就可以看到,而大部分的個性化閱讀工具,我們只是默默地使用它,不具備病毒傳播特性而無法迅速爆發。

6、缺少“社區”的感覺,因爲大家看到的東西各不一樣。這有點像爲什麼很多人喜歡在電影院觀看電影,而不是在家裏,即使在家裏看可能會更舒適。大家需要那種與其他人一起在做同一件事情的存在感。

詳細的技術拆解,可以去看看鄭昀的這兩篇文章 [1] [2],基本上我對這兩篇文章的評價是,“從此這個領域再無技術祕密可言”。

閱讀是人的基本需求,個性化閱讀是這個基本需求的 2.0 版。套用個性化推薦「三個合適」的表述,個性化閱讀要解決的問題是,在合適的情境下以合適的形式爲用戶帶來合適的內容。 因此,“個性化閱讀的需求有多強?”是個僞命題,個性化閱讀與閱讀本身沒有矛盾,它的目標是讓閱讀這事更簡單,謝文老師曾經以看女排新聞爲場景給過一個形象的例子。現在大家對個性化閱讀存疑,是因爲相對於大量非個性化的資訊類產品,還沒有哪一款個性化產品顯示出了與衆不同的能力,尤其是與 Twitter、Facebook 這類以社會化見長的產品相比,個性化產品並沒有高明太多。這很像當年圍繞智能手機的討論,之前很多人在說手機不就是打個電話發個短信嘛。直到 iPhone,重新發明了手機,從此沒人再懷疑。目前個性化閱讀這個領域,Flipboard 和 Zite 是好榜樣,但其實也只是剛開了個頭,大家都還在摸索,需要有人用實實在在的產品體驗,來重新定義「閱讀」。這個市場不是不爆,是王者未到。

之前做簡網的時候,我們主要在研究兩個網站,一個是 Zite(估計沒人用過它的 Web 版吧),還有一個是 Evri(它和指閱前後一天 iPad 版上線),後面又陸陸續續出現了一些和我們核心功能類似的產品,比如:Mashable Follow、Trap.it、Google+ Spark 等,都是以「主題」爲起點謀求信息消費的個性化。現在總結,我只能說,相對於國內互聯網的現實情況,我們當時的選擇太超前了。從去年移動互聯網升溫,社會化/個性化閱讀逐漸被大衆所接受,對有志於這個領域的同道來說,好年代其實才剛剛開始,讓我們一起努力!

這篇文章標題裏面的「個性化」是加着引號的。賣一個關子,我在醞釀一篇和《搜索已死,推薦上位》類似的標題黨之作,名字想好了,叫做《重新定義「個性化」》。不過大家別期望太高啊,有可能有,也可能沒有。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章