好書推薦|人人都能讀懂的機器學習《零基礎學機器學習》

本文作者:黃佳,新加坡埃森哲公司高級顧問,人工智能專家,機器學習和雲計算高級工程師,參與過公共事業、醫療、金融等多領域大型人工智能項目。

1

走下神壇的機器學習


我們馬上就要進入20世紀的第3個十年啦,而人工智能和機器學習,也已經火了差不多有六七年的時間。


從Hinton團隊在2012年的ImageNet大賽中用神經網絡模型一舉奪魁開始,AI頻頻出圈。2014年吳恩達在Coursera開了機器學習課,2015年周志華老師出了西瓜書,而2017年李彥宏把無人駕駛車開上了北京五環路,AlphaGo打遍天下無敵手,波士頓動力機器人學會了後空翻,人工智能熱到了極致。



大家覺得,生活和信念正在被顛覆,嶄新的時代即將來臨。


到了2020年,雖然人工智能和機器學習熱度仍在,卻沒有什麼“驚天地泣鬼神”的新東西出場,和前兩年相比,機器學習在媒體中的熱度降溫了。


那麼,機器學習還香嗎?內捲了嗎?


現在開始學機器學習,還來得及嗎?


先說一件事:


也就是兩、三年前吧,有天早上一小美女同事帶着熬夜排到的iPhone進了公司。大家呼啦一下圍上來。最開始屏幕是鎖着的,然後小姐姐面帶着微笑把電話往自己臉前一晃——好帥啊,手機解鎖了!當時我們這些圍觀羣衆都驚呆了……心想這什麼黑科技啊……


這場景要是在今天重放一遍,大家會不會把我們全體人當傻子?—— 老土啊!不就是一人臉識別嗎?這破技術早都爛大街了……


我說這件事是什麼意思呢?——現在技術落地的速度,實在是太快了。一種“黑科技”,從實驗室裏面走出來,從學術界到工業界,簡直是零距離。


事實上,機器學習開始真正吸引眼球,是從其分支深度學習的出現開始的。作爲一種突破性的技術,深度學習把AI提升到了一個嶄新的高度。


新的飛躍確尚未出現,但是機器學習和深度學習在數據分析、計算機視覺、自然語言處理、自動駕駛和機器人等場景中,具體的應用一個接一個的落地,層出不窮。因此,深度學習之後的主要發展,不全是技術的發展,而是實際應用場景的廣泛拓展。


因此,我的答案是機器學習並沒有內卷,他正在走下神壇,從學術殿堂的象牙塔中逐漸落地,成爲一種應用技術


在未來的AI世界中,會存在兩種人:


第一種是繼續尋求AI創新的算法工程師、數據科學家,努力尋找更好的算法和新的技術突破;


第二種是機器學習的應用者,對他們而言,機器學習就向Java/C++、Excel/PPT一樣,只是解決問題的一種手段。是像英文、駕車一樣不得不會的工具。


第二種人會比第一種人多很多,也一樣會很有價值。


也就是說,只要你從事與大數據、IT相關的工作,你可能就得多少學點機器學習的知識,多少會使用一些機器學習模型。——即使你的目標並不一定是成爲機器學習和算法工程師。


也許:


你需要對未來的業務數據進行預測——可以應用迴歸和分類模型;


你需要進行大數據的分析和處理——比如開發或優化推薦系統;


你需要對非結構化的圖片進行特徵提取——比如爲產品加入人臉識別功能;


你需要通過強化學習訓練智能體——比如訓練更聰明的聊天機器人。


下圖是一些機器學習的種類和應用場景,大家可以看看(覆蓋未必很全面,因爲機器學習的應用領域發展太快)。


機器學習的種類和應用場景


2

爲什麼寫這本書



《零基礎學機器學習》

作者: 黃佳

限時5折



這本書,正是寫給需要“懂”機器學習,並需要在工作中用到機器學習技能的人的。

市面上,深奧的理論和細摳算法的資料太多。而如何從零基礎開始,手把手教人“用”機器學習的教程太少。

這就像一個人來到駕校想學車,而駕校的教練帶他走進了造汽車的工廠,說:“來,小夥子,我們詳細講一講你面前的這輛車是怎麼造出來的。”

這樣不合適,順序反了。

應該是先學會開車,把車開好了,然後如果真有興趣,再去了解車的內部結構。

爲什麼我這麼看中“開車”而不是“造車”?這和我的職業有關。

我是技術顧問出身,年輕時出過幾本很普通的SAP書(凡爾賽),後來一直給一家大客戶做SAP系統實施和維護,生活像溫水中的青蛙一樣平靜……

突然有一天,大客戶說,SAP License太貴了,我們準備停用了。你們給找找雲軟件,替代掉SAP。

從那天開始,我們這組人的生活就不再平靜了。大家各顯神通,也經歷了各種培訓,一段時間之後,都化身爲了雲計算、AWS、Azure和各種SaaS供應商的專家,爲客戶提供雲解決方案。

 
然而好景不長,客戶成功上雲之後,我們再次面臨沒事可做的窘境。
 
新的增長點在何處呢?(打工人!總要恰飯)
 
思考之後,我們有2個主要發現:
  • Workday、Salesforce這樣的SaaS軟件、AWS等雲服務實在太好用了,讓客戶從繁瑣的業務流程中逐漸解脫出來;
  • 客戶開始把眼光投向他們手頭所積累的數據,並希望我們能利用這些數據,爲他們解決運營或者增長相關的高附加值問題,即產生洞見,優化運營。
 
原來的客戶拋給我們的第一個新項目,就是通過收集的詳細用戶信息,對用戶進行畫像,然後找出具有高欺詐風險的羣體,他們將進行對其賬戶更嚴格監管。
 
另一個客戶給我們的挑戰更大——他們是印尼一個較大的打印紙生產商,擁有上萬公頃的樹林,他們問題是每年需要派出大量的人力、物力,去深入森林勘察,偵測出今年哪個片區的森林已經成熟,值得砍伐。
 
新項目一個接一個的來了。
 
我們發現——這些“新”的“不同”類型的有趣項目,無不與數據相關,無不與“機器學習”相關
 
如果你瞭解一些AI具體技術,你應該會知道第一個項目是一個典型的機器學習問題,而第二個項目,解決方案是使用無人機進行航拍,收集海量視頻和圖片數據,然後通過深度學習的方法發現圖片中的顏色和模式,然後智能定位已經成熟或者發育不良的林區,對症下藥。
 
好了,從這時起,我們又搖身一遍,從“雲計算”專家化身“機器學習”應用專家。
——其實,這個變身的過程,與我在《零基礎學機器學習》書中所描述的故事大同小異。
 
說了這麼多,這些事情到底與這本書的創作有何關聯呢?
 
作爲一個諮詢顧問,我有自己的創作目的:就是從實際出發,強調“機器學習的應用過程”,想象着有一羣像我一樣的,具有一定IT背景的讀者、學生,從0基礎開始學起,該如何循序漸進,逐步深入,不多不少,恰到好處的給出其入門機器學習所最需要用到的知識?以節省它們的時間和精力呢?
 
因此這本書就是我在機器學習項目實戰過程中,所發掘到的對實際工作最有價值的內容記錄,能夠讓“應用型”的你作爲接觸機器學習的良好起點。


3

如何零基礎入門


那麼,如何入門機器學習呢?

這裏總結一個較爲輕鬆的入門路線,無論是否閱讀《零基礎學機器學習》,都可以參考一下。


①打消掉畏難情緒



我第一個要打破的刻板印象就是——機器學習很難,裏面有一大堆的算法。

這主要是由於信息過載,初學者往往不知道從何開始,一開始一大堆新概念和算法上來頭就暈。

我太瞭解這種知識過載給人帶來的焦慮和苦惱了。因爲我本人也不是一個研究型的學習者,讀論文可從來不是我的強項。

大家首先可以放心,機器學習——真的不難!而且比起前端/後端、Java、C++、微服務和分佈式系統開發等互聯網技術相比,入門機器學習不僅不難,而且還是太簡單了!

我在《零基礎學機器學習》中,特意設置了2個角色:

咖哥引導小冰入門

這本書用小冰的學習過程,串起了整本書的學習流程。初學者容易遇到的問題,小冰這個AI小白都會碰到,此時技術專家咖哥則從各種角度給以指導。

有小夥伴一起,你也可以輕鬆而快速地入門機器學習!


②打牢入門基礎


在此基礎上,增加機器學習必備的基礎知識和實戰構架,這是最最重要的內容。

請牢記,無論學習哪一領域,大家一定要在一開始就看到全貌,這樣纔能有的放矢。

下圖是機器學習上手就需要掌握的內容,學起來一點都不會累。只需要花費不到一週的時間,就能打牢入門基礎。

機器學習基礎

夯實這些機器學習領域的基礎知識後,我們就可以上路了。


③從實戰出發解決實際問題


解決了“入門難”這個事兒之後呢,下一個着力點是“我們要用機器學習幹什麼?”

學一樣東西,如果沒有看到學了之後具體有什麼用,怎麼使用,那簡直是浪費時間。

所以,如果想讓自己的學習有結果,就要特別強調實戰

實戰案例的選擇,需要具有實用性,比如銀行客戶流失率的預測、疾病風險評估、網站用戶的聚類等等。大家可以在Kaggle網站上尋找數據集、訓練機器,參加機器學習競賽,只有解決了實際問題,才能明白機器學習是怎麼一回事。

對於我來說,一切拋開實際應用的理論都不是爲入門階段的讀者所準備的,所以我在書中也準備了非常多的訓練項目。此外,我還添加了一個小小的設計:

一般的課程思路是這樣的:
講解理論 →介紹工具→解決問題

這本書的設計思路是這樣的:
提出問題→講解理論→介紹工具→解決問題

這一小小的設計,會讓待解決的問題在整個學習過程中一直在我們的頭腦中打轉,也讓我們的學習過程充滿目的性。

以結果爲導向,是我在學習過程中所特別強調的。

④總結出一個實戰套路反覆演練


重點來了,有了學習目標,還需要一個完善的、經過實證檢驗的套路,方便大家檢驗習得的技能。

那麼機器學習實戰有沒有套路?

有套路,請看下圖:


這是在機器學習項目實踐中總結出來的流程, 在書中所有具體機器學習項目實戰章節中,全部套用同一個實戰套路。

具體包括:

·線性迴歸
·邏輯迴歸
·深度學習
·卷積神經網絡
·循環神經網絡
·集成學習
·非監督學習
·生成式對抗網絡
·強化學習等

將各種各樣的機器學習模型反覆演練,強化上圖中的套路,每強化一次,你就會覺得機器學習愈發簡單,而且逐漸變得充滿樂趣。

下圖就是《零基礎學機器學習》爲新手精心設計的入門路線。

零基礎學機器學習入門路線

好了,說了這麼多書的事兒,我們回到文初的問題上面:機器學習內捲了嗎?

機器學習當然沒有內卷,機器學習只是正在被越來越多的人所瞭解,正在被越來越多的企業所應用,正在滲透進我們生活中的方方面面。這叫做落地,而不叫什麼“內卷”

使用機器學習的技術,去解決工作和生活中具體的問題,在數據中提煉出價值,那是多酷的一件事情!


▼▼▼

《零基礎學機器學習》

限時5折

作者: 黃佳



內容簡介:

本書的目標,是讓非機器學習領域甚至非計算機專業出身但有學習需求的人,輕鬆地掌握機器學習的基本知識,從而擁有相關的實戰能力。 


本書通過AI“小白”小冰拜師程序員咖哥學習機器學習的對話展開,內容輕鬆,實戰性強,主要包括機器學習快速上手路徑、數學和Python基礎知識、機器學習基礎算法(線性迴歸和邏輯迴歸)、深度神經網絡、卷積神經網絡、循環神經網絡、經典算法、集成學習、無監督和半監督等非監督學習類型、強化學習實戰等內容,以及相關實戰案例。


本書所有案例均通過Python及Scikit-learn機器學習庫和Keras深度學習框架實現,同時還包含豐富的數據分析和數據可視化內容。本書適合對AI感興趣的程序員、項目經理、在校大學生以及任何想以零基礎學機器學習的人,用以入門機器學習領域,建立從理論到實戰的知識通道。

本書的內容,可以看下圖的簡介(上下滑動查看):




-END-

本文分享自微信公衆號 - FunTester(NuclearTester)。
如有侵權,請聯繫 [email protected] 刪除。
本文參與“OSC源創計劃”,歡迎正在閱讀的你也加入,一起分享。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章