用最通俗易懂的方式打開機器學習!

在一個風和日麗的週末......















故事一:瑞雪兆豐年


我們中國有一句關於農業生產的古老諺語:瑞雪兆豐年。就是說,如果前一年冬天下雪很大很多,那麼第二年莊稼豐收的可能性比較大。


這條諺語是怎麼來的呢?我們可以想象當時的情景:


第一年冬天






第二年收穫時節






第二年冬天






第三年收穫時節






第三年冬天






第四年收穫時節





年復一年,若干年後的冬天......






這就是瑞雪兆豐年的故事。頭年的瑞雪和來年的豐收,本是兩個看起來並不相關的現象,但是智慧的農民伯伯通過幾十年甚至幾代人的經驗,總結出了兩個現象之間的規律。


現代的農業學家通過科學的分析,弄清了瑞雪兆豐年規律背後的本質原理。但是對於古代農民伯伯來說,知道規律就足夠了,可以通過規律來爲下一年的生產生活做出有效的調整。


故事二:啤酒和尿布


上個世紀90年代,沃爾瑪超市已經是美國最大的零售企業,擁有大量的顧客資源。那時候的沃爾瑪已經採用了先進的計算機技術,隨時記錄着每天衆多顧客購物車中所挑選的商品明細。



在其中一個普通的日子裏:













就這樣經年累月,沃爾瑪積累了大量的顧客購物數據。直到某一天,沃爾瑪的技術專家發現:









於是,這一嘗試實行以後......







從此,沃爾瑪的銷售額得到了顯著提升,啤酒尿布的故事也廣爲流傳,成爲了銷售界和IT界津津樂道的成功典範......


這就是沃爾瑪啤酒和尿布的故事。顧客購買啤酒的行爲和顧客購買尿布的行爲,原本是兩個看起來沒什麼關聯的現象。但是沃爾瑪的技術專家以大量的用戶購物數據爲樣本,通過先進的算法,最終尋找到了兩者之間的重要關聯和規律。


爲什麼購買啤酒的人更有可能同時購買尿布呢?是因爲有了小孩的男人比別人更愛喝啤酒?還是因爲愛喝啤酒的男人比別人更顧家?這些臆測似乎都有些牽強。


但是沃爾瑪不需要關心規律背後的本質。對企業來講,利用發現的規律,獲得實實在在的利益就足夠了。


以下是小灰根據個人理解說畫的流程圖:









以下是大黃基於小灰的流程圖所做的補充:






以下是大黃對流程圖結果部分作出的調整。其中假設模型可以理解成訓練出來的降雪和收穫的規律,通過假設模型,從新一年降雪情況推斷出下一年收穫情況的過程叫做迴歸。至於啤酒尿布的例子,屬於截然不同的機器學習類型,只需要找出關聯關係,並不需要進行迴歸。






機器學習按照方式不同主要分爲三大類,有監督學習(Supervised learning)、無監督學習(Unsupervised learning)以及半監督學習(Semi-supervised learning)。


  • 監督學習:通過已有的一部分輸入數據與輸出數據之間的對應關係,生成一個函數,將輸入映射到合適的輸出。在瑞雪兆豐年的例子中,頭年降雪量就是輸入,來年畝產量就是輸出。


  • 非監督學習:直接對輸入數據集進行建模,尋找關聯。例如啤酒尿布的例子,只需要尋找關聯性,並不需要什麼明確的目標值輸出。


  • 半監督學習:綜合利用有輸入輸出的數據,和只有輸入的數據來進行訓練。可以簡單理解成監督學習和非監督學習的綜合。







這裏所介紹的相關知識,只是作者對於機器學習領域的淺層次理解。通過這篇漫畫,希望沒有從過IT行業,或者不瞭解機器學習的朋友們能夠對機器學習有一些初步的認知。


希望有經驗的朋友們對本文提出寶貴意見,指出其中的紕漏和不足,非常感謝!


————— END —————


本文轉自(微信訂閱號),僅作爲收藏,如有侵犯請聯繫:

http://mp.weixin.qq.com/s?__biz=MjM5MjAwODM4MA==&mid=2650690576&idx=1&sn=1bc009cbeffd5613201228a5b27744de&chksm=bea625c389d1acd57ef35092ddfcc42cdd846a505e3d7c2ea5176053a2e6cf46b5bbecdfab87&mpshare=1&scene=23&srcid=1104QTjupgQ7Bnvhsu4uRIxl#rd

發佈了24 篇原創文章 · 獲贊 20 · 訪問量 31萬+
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章