阿里忙收購,李彥宏在忙…“深度學習”




要搞清楚一個互聯網公司當下的主要戰略方向其實並不難,只要看它們的創始人在幹嘛,基本就能猜個八九不離十。以這個標準看,騰訊的馬化騰在抓手機QQ,搜狐的張朝陽逼着自己看雷人電視劇,新浪的曹國偉當然還是在發微博,阿里巴巴的馬雲……退休了……

百度的李彥宏在做什麼?他在年初成立了深度學習研究院(Institute of Deep Learning,IDL)並自任院長,親自出馬去延攬人才,並在全公司羣發郵件介紹這些來自Facebook等硅谷巨頭的技術專家。“以前就算是VP入職,也是HR和分管高管發郵件介紹而已啊。”三天前,一位百度員工看着又一封Robin發出的新進專家介紹郵件說。

深度學習對百度有啥用?

今年3月,一位在Google領導重要研究項目的人物低調來訪百度,還去清華大學講了次課。淼叔當時發了一條微博,說他會見了一堆百度的技術高管,還可能幫百度在硅谷的研究員招兵買馬。

這個人就是Andrew Ng(吳恩達)。在他來訪百度之後不久,即入選《時代》雜誌年度全球最有影響力100人,成爲16位科技界代表之一。吳恩達現任斯坦福大學人工智能實驗室主任。他與大公司合作的一個項目,則代表了互聯網巨頭的下一步方向:這個項目,叫做Google Brain,它的領域,就是深度學習。

鑑於百度發佈的研究成果比較少,我們可以用吳恩達取得的一些成果來側面看看深度學習能幹些什麼:去年,吳恩達領導Google的科學家們,用16000臺電腦模擬了一個模擬人腦神經網絡出來,並向這個網絡展示了1000萬段隨機從Youtube上選取的視頻,看看它能學會什麼。結果在完全沒有外界干涉的條件下,它自己識別出了貓臉。

我們要注意的是,這種機器學習與我們通常意義上說的“機器識別”有所不同。現有的很多此類識別,需要人工輸入一些用於對比的數據,或者一些已經進行初步分類、打好標籤的數據,機器通過學習這些數據的共同點,得出規律,然後再去將規律應用於更大規模的數據中。粗略地說,這是一種“有監督的學習”,需要人工輸入初始數據,有時候還要對識別結果進行判斷,由此促進機器的學習速度。

而深度學習是一種“無監督的學習”。它基於一種學術假設:即人類對外界環境的瞭解過程最終可以歸結爲一種單一算法,而人腦的神經元可以通過這種算法,分化出識別不同物體的能力。這個識別過程甚至完全不需要外界干預。

還是以識別貓臉爲例:吳恩達給神經網絡輸入了一個單詞“cat”,這個神經網絡中並沒有辭典,不瞭解這個單詞的含義。但在觀看了一千萬段視頻,它最終確定,cat就是那種毛茸茸的小動物。這個學習過程,與一個不懂英語的人,在沒任何人教他的時候,通過獨立觀察學會“cat”的過程幾乎一致。

現在我們可以看出,深度學習對百度有什麼意義了。最基本的,在門檻上,這個領域不是誰都能隨便進來的,它需要有龐大的計算能力,海量的人類知識數據;更重要的,它能夠完全自主地學習並數字化這個世界——然後就可以讓人們搜索任何東西啦。

深度學習對互聯網業務有什麼幫助?

現在我們可以看看百度在深度學習方面做了哪些工作。年初,百度建立了深度學習研究院;隨後,百度硅谷人工智能實驗室成立,這個實驗室與Google相距只有六英里,方便一些硅谷的人才直接在本地展開研究;5月,Facebook資深科學家徐偉宣佈加盟百度,他此前負責的項目是“大規模推薦系統”,更往前,他在NEC美國研究院從事神經網絡底層的研究。同月,李彥宏羣發了他今年第二封新員工介紹郵件:曾任職IBM研究院、雅虎研究院的機器學習專家張潼加入。

這些是在人才架構上的動作。而在實際成果方面,深度學習的應用已經在2012年就出現了。百度多媒體業務負責人餘凱用淼叔做實驗對象,演示了人臉搜索能力。可能是出於強化戲劇性效果以便於傳播的考慮,這個產品叫“明星臉搜索”。實驗對象實時拍一張照片,百度可以搜索出這張照片最像哪個明星——但令人驚奇的是,在百度作爲參考列出的互聯網圖片搜索照片中,第一張就是淼叔10年前拍的一張照片。也就是說,在沒有任何其他條件限定的前提下,百度根據一個現實場景,找到了一個確定的人。

由於計算機的高度普及,很多人可能已經固化了“搜索”的印象:面對屏幕上的一個輸入框,敲入一串詞語,電腦返回一堆鏈接,用戶再逐個點開查看哪個是自己需要的內容。但當我們要教會從沒接觸過電腦的父母這一搜索過程時,就發現它與人類天生的本能並不相同:父母們往往會指着一株不知名的植物,問電腦是否能告訴我們這是什麼;他們也並不習慣鍵入文字內容(甚至還不會輸入法),更希望對着電腦說一句“明天什麼天氣”就能得到答案。

傳統的搜索,其交互方式是人工提煉出關鍵詞輸入,才返回答案。所以使用搜索引擎其實是一種技術,考驗的是人能否準確觀察問題、恰當提煉主題詞,做到這些纔有可能得到自己想要的信息。這就與一切搜索引擎“公平地爲每個人提供信息”的初衷相悖了。

而深度學習的技術配合上大數據的儲備,語音搜索、圖像搜索等新興技術就不再僅僅是技術的噱頭,而是將搜索用戶從數億拓展到數十億的大生意。這也是Google、蘋果和百度紛紛在語音搜索上推出新產品的原因。

百度的移動互聯網戰略:抄後路

在PC互聯網上,新搜索方式的出現可能僅僅是擴大用戶規模。但在移動互聯網上,這種變革可能是生死之爭。

手機的小屏幕決定,用戶不可能像在PC上一樣順暢高速輸入,手機的麥克風和攝像頭是比鍵盤普及得多的輸入方式。而對語音搜索和圖像搜索快速、高效地給出識別與匹配的結果,這正是深度學習所擅長的領域。所以百度語音助手雖然去年才推出,卻在效果與一些專業做這個領域好幾年的公司打成平手,語音搜索也一舉佔據了百度移動搜索10%的流量。在語音識別準確率方面,2012年一年的進展就超過了過去15年進展的總和。同樣,百度圖像識別技術應用於全網搜索以後,以圖搜圖的準確率一下子從20%提升到80%。

更重要的,除了入口之外,基於深度學習的大數據處理,將覆蓋整個移動互聯網的“後臺”。移動互聯網與雲計算和大數據其實是一體兩面的事物,高度移動化的手機等設備決定了它不會具有很強的運算能力,手機更多地是採集各類數據,將之傳送到雲計算平臺,得到結果後再返回手機,供用戶使用。將來的各類可穿戴設備也將是這種模式。

所以,在騰訊、阿里紛紛基於APP展開研發與收購時,百度在這個領域顯得相對沉寂。其實從去年9月百度世界的戰略發佈上,就可以看出李彥宏的算盤:他希望在後臺提供整個雲計算能力,加上百度這些年積累的最爲豐富的中文數據與搜索需求,支撐開發者研發、發佈各種APP。這樣,即使百度沒有任何前端的APP產品,也依然掌握了移動互聯網的基礎設施。

百度無線事業部總經理嶽國鋒給我們盤點了百度開放給開發者提供的雲開發能力與系統保障服務:雲儲存PCS、應用引擎BAE、雲推送PUSH、位置服務LBS、自測平臺MTC、衆測平臺、移動統計、開放平臺提交、移動聯運平臺、In-App Ads。可以看到,既有開發、儲存方面的服務,也有發行、營銷能力的支持,還在移動變現方面進行了探索。

路線選擇的不同,使百度與騰訊、阿里的移動互聯網戰略可比性越來越弱(其中阿里巴巴着眼於提供電商生態平臺的建設,與百度的抄後路戰略略微相似)。但百度的這個戰略也面臨挑戰,最大的不確定性來自於數據的來源:騰訊擁有大量基於用戶明確ID的行爲數據,阿里巴巴則擁有整個互聯網價值最高的電商流量數據。在PC互聯網上,百度擁有搜索框入口;但在移動互聯網上,殺手級APP的匱乏,可能會導致百度在數據採集方面腳步放慢。在移動用戶飛速增長的大前提下,如何再造移動入口,通過大數據“深度學習”出移動互聯網的未來? 這或許是百度面臨的關鍵挑戰。
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章