用最通俗易懂的方式打開機器學習！

原創

2020-02-21 12:33

在一個風和日麗的週末......

故事一：瑞雪兆豐年

我們中國有一句關於農業生產的古老諺語：瑞雪兆豐年。就是說，如果前一年冬天下雪很大很多，那麼第二年莊稼豐收的可能性比較大。

這條諺語是怎麼來的呢？我們可以想象當時的情景：

第一年冬天

第二年收穫時節

第二年冬天

第三年收穫時節

第三年冬天

第四年收穫時節

年復一年，若干年後的冬天......

這就是瑞雪兆豐年的故事。頭年的瑞雪和來年的豐收，本是兩個看起來並不相關的現象，但是智慧的農民伯伯通過幾十年甚至幾代人的經驗，總結出了兩個現象之間的規律。

現代的農業學家通過科學的分析，弄清了瑞雪兆豐年規律背後的本質原理。但是對於古代農民伯伯來說，知道規律就足夠了，可以通過規律來爲下一年的生產生活做出有效的調整。

故事二：啤酒和尿布

上個世紀90年代，沃爾瑪超市已經是美國最大的零售企業，擁有大量的顧客資源。那時候的沃爾瑪已經採用了先進的計算機技術，隨時記錄着每天衆多顧客購物車中所挑選的商品明細。

在其中一個普通的日子裏：

就這樣經年累月，沃爾瑪積累了大量的顧客購物數據。直到某一天，沃爾瑪的技術專家發現：

於是，這一嘗試實行以後......

從此，沃爾瑪的銷售額得到了顯著提升，啤酒尿布的故事也廣爲流傳，成爲了銷售界和IT界津津樂道的成功典範......

這就是沃爾瑪啤酒和尿布的故事。顧客購買啤酒的行爲和顧客購買尿布的行爲，原本是兩個看起來沒什麼關聯的現象。但是沃爾瑪的技術專家以大量的用戶購物數據爲樣本，通過先進的算法，最終尋找到了兩者之間的重要關聯和規律。

爲什麼購買啤酒的人更有可能同時購買尿布呢？是因爲有了小孩的男人比別人更愛喝啤酒？還是因爲愛喝啤酒的男人比別人更顧家？這些臆測似乎都有些牽強。

但是沃爾瑪不需要關心規律背後的本質。對企業來講，利用發現的規律，獲得實實在在的利益就足夠了。

以下是小灰根據個人理解說畫的流程圖：

以下是大黃基於小灰的流程圖所做的補充：

以下是大黃對流程圖結果部分作出的調整。其中假設模型可以理解成訓練出來的降雪和收穫的規律，通過假設模型，從新一年降雪情況推斷出下一年收穫情況的過程叫做迴歸。至於啤酒尿布的例子，屬於截然不同的機器學習類型，只需要找出關聯關係，並不需要進行迴歸。

機器學習按照方式不同主要分爲三大類，有監督學習（Supervised learning）、無監督學習（Unsupervised learning）以及半監督學習（Semi-supervised learning）。

監督學習：通過已有的一部分輸入數據與輸出數據之間的對應關係，生成一個函數，將輸入映射到合適的輸出。在瑞雪兆豐年的例子中，頭年降雪量就是輸入，來年畝產量就是輸出。

非監督學習：直接對輸入數據集進行建模，尋找關聯。例如啤酒尿布的例子，只需要尋找關聯性，並不需要什麼明確的目標值輸出。
半監督學習：綜合利用有輸入輸出的數據，和只有輸入的數據來進行訓練。可以簡單理解成監督學習和非監督學習的綜合。

這裏所介紹的相關知識，只是作者對於機器學習領域的淺層次理解。通過這篇漫畫，希望沒有從過IT行業，或者不瞭解機器學習的朋友們能夠對機器學習有一些初步的認知。

希望有經驗的朋友們對本文提出寶貴意見，指出其中的紕漏和不足，非常感謝！

————— END —————

本文轉自（微信訂閱號），僅作爲收藏，如有侵犯請聯繫：

http://mp.weixin.qq.com/s?__biz=MjM5MjAwODM4MA==&mid=2650690576&idx=1&sn=1bc009cbeffd5613201228a5b27744de&chksm=bea625c389d1acd57ef35092ddfcc42cdd846a505e3d7c2ea5176053a2e6cf46b5bbecdfab87&mpshare=1&scene=23&srcid=1104QTjupgQ7Bnvhsu4uRIxl#rd

發佈了24 篇原創文章 · 獲贊 20 · 訪問量 31萬+

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

Docker輕鬆入門指南

安裝docker 在Deepin下安裝卸載舊版本的docker： sudo apt-get remove docker.io docker-engine 安裝依賴： sudo apt-get install apt-trans

2020-07-03 00:35:39

Petri網課題組——神聖的使命

哇~ 今天我竟然意外的發現，我們的課題組是多麼一個神奇的課題組。爲什麼要研究那些流程與實例與模型之間或者之類的相互關係或比較或分析？我覺得，這就像是理想與現實，我們之所以會稱之爲理想，就是因爲它是最完美最優秀的狀態，是目前現實無法達到

2020-06-30 17:34:52

.NET 和 Docker結合使用

許多與我交流的開發者要麼在積極地使用 Docker，要麼計劃在他們的環境中採用容器技術。容器是我們這個行業的一個重要趨勢，.NET 是其中的一部分。 Microsoft 和 Docker 一直在合作，以便在開發 .NET 應用時，使用

2020-06-30 09:20:13

saas相關說明解釋

詳見百度百科的說明 SaaS是Software-as-a-Service（軟件即服務）的簡稱，隨着互聯網技術的發展和應用軟件的成熟，在21世紀開始興起的一種完全創新的軟件應用模式。它與“on-demand softwar

2020-06-29 03:52:42

linux：最常見的linux命令

最常見，最頻繁使用的基礎命令如下：系統經典語錄： 1、命令操作完沒有任何消息信息, 就是最好的消息 2、系統一切從根開始 3、系統中數據一切皆文件一、linux關機命令： 1.shutdown命令安全地將系統關機（推薦）參數說明: [

2020-06-28 17:57:16

Jmeter 壓力測試、併發測試、弱網測試

jmeter常用測試元件測試計劃：默認線程組：設置併發數、併發時間、請求循環次數採樣器（simple）：較常用HTTP請求、JDBC Request、Soap/XML - RPC Request 監聽器：查看結果樹斷言：響應斷言

2020-06-28 17:57:16

Jmeter+ant+jendkins 接口自動化

jmeter的安裝以及環境變量的設置在dos命令中執行jmeter Jmeter_home Path jmeter 默認生成的測試報告的後綴爲.jtl格式修改成mxl 在jmeter文件下bin\jme

2020-06-28 17:57:16

測試篇-理論知識

一：首先軟件測試的基本流程： 1.產品提出需求，相關人員進行開會討論確認需求，保證需求可執行。 2.前端，後臺相關人員進行功能開發，測試編寫測試用例。 3.前端與後臺進行聯調完畢後，測試進行冒煙測試，確保測試對象正常運行。 4.進行測試接

2020-06-28 17:57:16

appium案例以及常用方法api

封裝類： from appium import webdriver from appium.webdriver.common.touch_action import TouchAction from selenium.webdriver

2020-06-28 17:57:16

安裝loadrunner11 以及錯誤解決

一．安裝 1. 下載loadrunner11進行安裝。打開安裝安裝程序進入如圖界面（可能會出現提示，不受信任。出現這個情況嘗試用此方法解決下“win+r”打開運行，輸入gpedit.msc進入組策略，依次選擇“計算機配置”、“

2020-06-28 17:57:14

Selenium——Web自動化測試

1.什麼是Selenium？答案：Selenium是一個開源的web自動化測試框架，主要是基於web uI的自動化測試。現在的版本，逐步增加了對移動端的自動化測試。Selenium支持多種語言進行開發自動化測試腳本，有Java,pyth

2020-06-28 17:57:14

VMwarework環境使用Loadrunner

一：虛擬機的安裝 1.打開.exe文件，即可開始安裝。 2.安裝位置默認在C盤下，在這裏我選擇安裝在F盤，安裝路徑儘量不要有中文。 3.等待安裝就好了。 4.安裝成功後，第一次運行程序會要求輸入密鑰，這個可以自己百度，下面分享我

2020-06-28 17:57:14

Charles（弱網測試、斷點測試、壓力測試）

弱網：在做移動開發的時候，我們常常需要模擬慢速網絡或者高延遲的網絡，以測試在移動網絡下，應用的表現是否正常(如模擬應用在網絡較慢時的響應時間等情景)。Charles 對此需求提供了很好的支持。 1、點擊Proxy->Throttlin

2020-06-28 17:57:14

Liunx安裝mysql數據庫

連接服務器快捷鍵window + R 進入黑窗口，輸入 ssh [email protected](公鑰id）輸入密碼進入環境更新apt：sudo apt-get update 安裝mysql：sudo apt-get i

2020-06-28 17:57:14

統計算法

統計學習算法概述：統計學習（statistical learning）是關於計算機基於數據構建概率模型並運用模型對數據進行預測與分析的一門學科。從中可見，統計學習中有兩個重要的點：數據，概率模型。算法就是學習時用的詳細方法。統

2020-06-28 17:57:14

24小時熱門文章

最新文章

最新評論文章