人工神經網絡的優缺點

炒作,爲什麼?
Niklas Donges 覺得,最近的神經網絡是火的有點過了。當然,這也是有原因的:

  • 原因之一:數據

幾十年來積累的海量數據,在2018年,迎來了最光輝的時刻!使得神經網絡能夠真正展示自己的潛力。數據之於神經網絡,就好比波紋之於 JoJo,氣之於龜仙人。

數據越多,神經網絡越浪!

相比之下,傳統的機器學習算法在數據量面前,會觸及一個天花板。一旦到達極限,傳統機器學習算法將無法跟上數據增長的步伐,性能則停滯不前。我們用一張圖來更直觀的說明:

  • 原因之二:計算能力

另一個非常重要的原因是現在的計算能力。想想比特幣礦機,單機就能達到那樣恐怖的算力!

強大的算力能夠處理更多數據,節省更多時間。根據人工智能領域的重要人物 Ray Kurzweil 的說法,計算能力是呈指數增長。

是不是想起了摩爾定律?

  • 原因之三:算法

增加深度學習流行度的第三個因素是算法本身已經取得的進步。這些最近在算法開發方面的突破,主要是因爲它們比以前運行得更快,這就可以儘可能充分的的利用所有數據,做到不浪費。

  • 原因之四:營銷

營銷,就是給太上老君八卦爐扇火的那把芭蕉扇,可以把星星之火,扇成森林大火。

自1944年提出神經網絡概念以來,已經被炒過一輪了,市場已經疲軟,沒人相信和投資了。 

“深度學習”這個詞,賦予了它一個新的名字,使新的炒作成爲可能。這也是爲什麼,許多人錯誤地認爲深度學習是一個新創造的領域。

此外,還有其他一些因素促成了深度學習的營銷。例如第一個機器人公民 Sophia,以及機器學習等主要領域的幾項突破等等。

Pros vs Cons
拋開這些虛幻的因素,接下來 Niklas Donges 通過和傳統機器學習算法的對比,闡述了神經網絡的優缺點。

  • 優點

神經網絡的主要優點,在於它們能夠勝過幾乎所有其他機器學習算法。例如在癌症檢測中,對於性能的要求是非常高的,因爲性能越好,可以治療的人越多。

 

  • 缺點1:著名的“黑匣子”問題

神經網絡最着名的缺點,可能就是“黑匣子”性質。這意味着你不知道你的神經網絡將會如何產出結果,更不知道爲什麼會產生這種結果。

例如,你把一張貓的圖像放入神經網絡,結果告訴你這是個汽車 ?。而且你也沒辦法找出問題的癥結所在。

相反,像決策樹這樣的算法,是遵循一定的邏輯性,是可被解釋的,你就很容易找出問題所在,並進行調整。在某些領域,這種可解釋性非常重要!比如銀行。

銀行不會使用神經網絡來預測一個人的信譽。銀行需要向客戶解釋爲什麼沒有獲得貸款,而神經網絡恰恰無法做出解釋。

假如 Quora 決定使用神經網絡算法刪除垃圾帳戶,結果就像是滅霸的手套一樣,反正你也不知道它是根據什麼規則定義一個賬戶是不是垃圾賬戶,結果就被滅了。

你覺得被刪除賬戶的用戶,會接受“我們也不清楚,這都是計算機決定的”這種解釋嗎?

以及,你能想象馬雲收購一家公司,只是因爲“電腦”說他需要這樣做?

  • 缺點2:耗時耗力

雖然有像 Keras 這樣的庫,使得神經網絡的開發變得相當簡單。但有時你需要更多地控制算法的細節,

例如試圖用機器學習來解決一個從沒有人做過的難題。你可能會使用 Tensorflow,它是爲你提供了更多的可能性。但它更復雜,開發需要更長的時間(取決於你想要構建的東西)。 

那麼對於公司管理層來說問題就出現了,真的值得動用昂貴的工程師花費數週時間嗎?可能用其他算法,一天就搞定了。

  • 缺點3:數據饕餮

神經網絡比傳統的機器學習算法通常來說,需要更多的數據。數千,甚至數百萬的標記樣本纔夠。這麼多的數據從哪兒來?顯然是個非常讓人頭疼的問題。

相較而言,像樸素貝葉斯這樣的簡單算法,可以更好地處理小數據。

  • 缺點4:貴

這裏的貴,指的是算力的昂貴,時間的昂貴。最先進的深度學習算法,實現真正深度神經網絡的成功訓練,可能需要數週才能完全訓練完畢。

然而大多數傳統的機器學習算法訓練時間要少得多,從幾分鐘到幾小時或幾天不等。

神經網絡所需的計算能力在很大程度上取決於數據的大小,也取決於網絡的深度和複雜程度。只有一個層 + 50個神經元的神經網絡,當然比1000個決策樹的隨機森林快得多。相比之下,有50個層的神經網絡,將比僅具有10個決策樹的隨機森林慢得多。

總結
雖然 Niklas Donges 認爲神經網絡被過度預期了。但他同時認爲,我們生活在機器學習復興中。因爲它越來越親民,越來越多的人能夠用來構建有用的產品。

但一些現實問題,我們也不能忽視。目前,只有少數人瞭解可以用神經網絡做什麼,並且知道如何建立成功的數據科學團隊,爲公司帶來真正的價值。

雖然我們擁有如此多的天才級博士工程師,他們深諳機器學習背後理論,卻缺乏對商業方面的理解。 

同時,企業的高管,CEO,並不瞭解深度學習。他們被忽悠的認爲,公司面臨的所有問題都會被人工智能在未來幾年內解決掉 ?。 

所以,我們需要更多人來銜接兩者的鴻溝,從而產生更多對我們社會有用的產品。

 

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章