深度學習座下的四大神獸:計算能力、算法、數據、場景

1

如今越來越多的人願意和自己的虛擬私人助理交談,只需要動動嘴就可以讓Siri/Alexa/Rokid幫你完成發微信、訂車票、設鬧鐘這樣的閒事,還能提醒你吃藥、開會,這樣一個不需要付工資的貼心小棉襖怎麼會不受喜愛呢?虛擬助理正在一步步接近現實中的私人助理,而背後支持它的正是深度學習的技術除了虛擬助理之外,深度學習技術還將是未來計算機視覺、自動駕駛、語音識別等多個領域的核心技術。而深度學習實踐的四個關鍵要素:計算能力、算法、數據和應用場景,就像四大護法神獸一樣保證了深度學習的應用和實踐,缺一不可。

深度學習是以不少於兩個隱含層的神經網絡對輸入進行非線性變換或表示學習的技術,通過構建深層神經網絡,進行各項分析活動。深層神經網絡由一個輸入層,數個隱層,以及一個輸出層構成。每層有若干個神經元,神經元之間有連接權重。每個神經元模擬生物的神經細胞,而結點之間的連接模擬神經細胞之間的連接。總結起來是這個樣子的:

這種流向圖的一個特別屬性是深度(depth):從一個輸入到一個輸出的最長路徑的長度。深度學習並非一個新的概念,但在2006年由Hinton等人引領了一波爆發。然而近年來雖然許多人都在談論深度學習,但這項技術在實際應用時到底有哪些坑?創辦一家成熟的依賴深度學習的公司需要哪些要素?以下是我們的看法:

計算能力

首先,深度神經網絡複雜,訓練數據多,計算量大。深度神經網絡中神經元多,神經元間連接數量也相當驚人。從數學的角度看,每個神經元都要包含數學計算(如Sigmoid、ReLU或者Softmax函數),需要估計的參數量也極大。語音識別和圖像識別應用中,神經元達數萬個,參數數千萬,模型複雜導致計算量大。所以計算能力是深度學習應用的基礎。

不僅如此,計算能力還是推動深度學習的利器,計算能力越強,同樣時間內積累的經驗就越多、迭代速度也越快,百度首席科學家吳恩達博士認爲深度學習的前沿正轉移到高性能計算(HPC),這也是他目前在百度的工作重心之一,吳博士認爲深度學習上的很多成功得益於主動地追求可用的計算能力,2011年Jeff Dean(谷歌第二代人工智能學習系統Tensorflow的設計者之一)創立並領導了谷歌深度學習小組,使用谷歌雲擴展深度學習;這使得深度學習得以推向工業界。在2013年,科茨博士等人建立了第一個HPC式的深度學習系統,可擴展性提升了1-2個數量級,使深度學習有了革命性的進步——計算能力這種對於深度學習的支撐與推動作用是不可替代的。

目前這方面技術處於領先地位的還是像百度、谷歌這樣的大型互聯網公司,當然也有一些初創公司在該領域頗有成就,由百度深度學習研究院負責人餘凱博士設計的深度神經網絡芯片相比傳統的CPU芯片能夠支持深度神經網絡中圖像、語音、文字、控制等方面的任務而不是去做所有事情,這樣比在CPU上用軟件要高效,會提高2-3個數量級。

算法

在計算能力變得日益廉價的今天,深度學習試圖建立大得多也複雜得多的神經網絡,我們可以把算法理解爲深度學習的神經網絡或是計算思維,這種神經網絡越複雜,捕捉到的信號就越精確,目前比較常見的算法包括深度信念網絡(Deep Belief Networks)、卷積神經網絡(ConvolutionalNeural Networks)、受限玻爾茲曼機(Restricted BoltzmannMachine)和堆棧式自動編碼器(Stacked Auto-encoders),以深度卷積神經網絡爲代表的監督學習方法目前來說是最有效也是使用最多的。

但目前問題在於大家把專注度放在了數據與運算,因爲神經網絡本身差異不會很大,並且神經網絡的核心算法提升起來太困難,仍然面臨着像局部最優問題、代價函數與整個神經網絡系統的設計等問題,但這也給衆多創業公司以新的思路,何不反其道而行之,避開那載着千軍萬馬的“獨木橋”,如果能將算法優化,前途也是不可限量的。

數據

如今深度學習正迅速成爲高級數據分析領域的熱門話題,而數據的絕對量是促進深度學習工具和技術發展的一個關鍵因素。Affectiva的首席科學家和研究部總監DanielMcDuff表示,新興公司積累了足夠的數據後,技術才能更好地發揮作用。對於那些深度學習的應用,不僅開發時需要大量的數據訓練、完善,在產品推廣之後更加需要實時用戶數據,不斷進行迭代、更新。

中國在深度學習的競爭中還是有很大機會,可獲取的互聯網數據,以及低成本的衆包勞動,將爲中國公司帶來海量的數據和極低的數據標註的成本。但是國內市場面臨的問題在於大量數據都被BAT等互聯網巨頭控制,初創公司很難拿到數據去完善、更新深度學習的神經網絡,尤其是在產品推出之後,還有可能面臨大公司的惡意排擠,獲取數據更是難上加難,不說是夾縫中求生存也差不多了吧。

應用場景

深度學習技術目前應用的場景不多,最普遍也是最成功的領域就是語音識別和圖像處理這兩個應用場景了,之前提到的三大神獸——計算能力、算法和數據屬於開發端,應用場景則屬於消費端層面,隨着未來深度學習技術的不斷髮展以及用戶的需求提升,深度學習的應用場景將越來越多,比如許多智能手機內置的人臉識別功能來對照片進行分類,已經可以達到相當的準確率;支付寶等金融工具也很可能採用人臉識別以提高安全性……未來的深度學習一定不僅僅侷限於語音識別和圖像識別這兩個領域,還有更多的可能性。對於那些初創公司來說,與其和谷歌、Facebook、Amazon、BAT等擁有十多年數據沉澱的大公司競爭這一成熟市場,還不如去發展屬於自己的某一片小天地。

如今深度學習的火爆程度不弱於任何其他的領域,互聯網巨頭們都在想方設法分這塊蛋糕,事實上想要做好深度學習計算能力、算法、數據、應用場景這四大護法神獸缺一不可,而BAT等巨頭在這些方面都佔盡資源上的優勢,對於初創公司來說很難四點兼顧,尤其是數據方面,所以利用自身的比較優勢抓住其中一點進行創新,無論是計算能力、算法還是應用場景上,只要有創新之處,就能幫助你在市場中掌握主動權。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章