ML機器學習導論學習筆記

機器學習的定義：

機器學習(Machine Learning, ML)是一門多領域交叉學科，涉及概率論、統計學、逼近論、凸分析、算法複雜度理論等多門學科。專門研究計算機怎樣模擬或實現人類的學習行爲，以獲取新的知識或技能，重新組織已有的知識結構使之不斷改善自身的性能。

機器學習的應用實例：

　　1.學習關聯性

在零售業中，機器學習的應用就是購物籃分析，任務就是發現顧客所購商品之間的關聯性。

　　2.分類

　　　　2.1信貸行業，做好風險評估，以及做好銀行貸款問題中的信用評分。還有就是做好預測，通過學習過去的數據，例如收入和存款等，然後預測此客戶的是高風險客戶還是低風險客戶。

　　　　2.2 機器學習在模式識別中也有應用，其中之一就是光學字符識別（optional character recognition，OCR）,即從字符圖像識別字符編碼。

　　　　2.3 人臉識別，輸入的是人臉圖像，類是需要識別的人，並且學習程序應當學習人臉圖像與身份之間的關聯性。

　　　　2.4 醫學診斷。輸入的是患者的信息，而類是疾病。

　　　　2.5 語音識別。輸入的是語音，類是可以讀出的詞彙。語音方面的難題就是每個人、每個地域的說話不一樣。這是未來的研究領域。

　　　　2.6 生物測定學，使用人的生理和行爲特徵來識別或認證人的身份，需要集成來自不同形態的輸入。生理特徵的例子是面部圖像、指紋、虹膜和手掌；行爲特徵的例子是：簽字的力度、嗓音、步態和擊鍵。

　　　　2.7 機器學習還可以進行壓縮，用規則擬合數據，能夠得到比數據更簡單的解釋，需要的存儲空間更少，處理需要的計算更少。

　　　　2.8 離羣點檢測，即發現哪些不遵守規則的例外實例。

　　3. 迴歸

                   機器學習的應用例子：對機器人的導航，例如現在的自動駕駛汽車導航。

　　4. 非監督學習

　　在監督學習中，目標是學習從輸入到輸出的映射關係，其中的輸出是正確值已經由指導者提供。

　　非監督學習是沒有指導者，單純只有輸入數據，目標是發現輸入的數據中的規律。

　　　　密度估計的概念：

　　　　　　輸入空間存在某種結構，使得特定的模式比其他的模式更常出現，而我們希望知道哪些常發生，那些不常發生，在統計學中，稱之爲密度估計（Density estimation）

　　　　密度估計的方法：聚類———目標是發現輸入數據的蔟和分組。

　　　　聚類的應用之一————圖像壓縮，輸入實例是由RGB值表示的圖像像素。

在文本聚類中，目標是把相似的文檔分組。

　　5. 增加學習

　　機器學習程序就是應當能夠評估策略的好壞程度，並從以往的動作序列中學習，以便能夠產生策略，這種學習方法稱之爲增強學習（Reinforcement learning）算法。

參考書籍：《機器學習導論》

歡迎關注我的公衆號：爬數AI先生

個人學習筆記文章如有錯誤之處，歡迎大家指出。謝謝~~