機器學習筆記（1）——基本概念

原創

蘇沐軼

2019-08-02 18:58

文/浪潮之巔

1、什麼是機器學習

1959年，Arthur

Samuel給機器學習了一個明確概念：Field

of study that gives computers the ability to learn without being explicitly

programmed.（即機器學習研究如何讓計算器不需要明確的程序也可以具備學習的能力）。

通俗來講：機器學習是指針對某一個特定任務，計算機程序能夠從數據中不斷學習，越做越好。因此，機器學習有兩個重要的內容：數據和模型。當我們遇到某個問題準備用機器學習的手段去解決的時候，我們需要獲取相關的數據，通過分析觀察數據搭建合適的算法模型，利用數據作爲輸入去訓練優化模型，最終使得模型對於新數據具有泛化能力。

2、爲什麼用機器學習

1）對於現有方案需要大量手動調整或者設置規則列表超長的問題，通過機器學習可以簡化代碼、提高效率。

2）對於傳統技術手段無法解決的複雜問題，通過機器學習可以找到一個解決方案。

3）對於環境波動，機器學習可以適應新的數據

4）從複雜問題和大量數據中找到規律和價值。

3、機器學習分類

1）按照是否需要監督進行訓練可以分爲：監督學習、半監督學習、無監督學習和強化學習。

a)監督學習概念：計算機程序從大量含有標籤的數據中學習出規律，從而能夠對一個新的輸入做出合理的輸出預測。重要監督式學習：K-近鄰算法、線性迴歸、邏輯迴歸、支持向量機、決策樹、隨機森林、神經網絡。

b)無監督學習：計算機程序從大量的無標籤數據中去分析數據本身內在的特點和結構。重要無監督學習：聚類算法、K-平均算法、分層聚類分析、最大期望算法、可視化和降維、主成分分析、關聯規則學習。

c)半監督學習：利用少量有標籤數據和大量無標籤數據進行訓練和分類，它是監督學習和無監督學習相結合的一種學習方法。重要半監督學習：基於概率的方法、基於圖的方法、直接依賴於聚類假設的方法、基於多視圖的方法、在現有監督學習算法基礎上作修改的方法。

d)強化學習：智能體(Agent)以"試錯"的方式進行學習，通過與環境進行交互獲得的獎賞指導行爲，目標是使智能體獲得最大的獎賞。

增強學習和監督學習的兩個明顯區別是：一、增強學習是試錯學習(Trail-and-error)，由於沒有直接的指導信息，智能體要以不斷與環境進行交互，通過試錯的方式來獲得最佳策略。二、延遲迴報，增強學習的指導信息很少，而且往往是在事後（最後一個狀態）纔給出的，這就導致了一個問題，就是獲得正回報或者負回報以後，如何將回報分配給前面的狀態。

2）按照是否可以動態進行增量學習可以分爲：在線學習和批量學習。

a)批量學習概念：在批量學習中必須使用所有可用的數據進行訓練，離線學習完成後再將所學到的應用到生產中。

批量學習面臨問題：這種學習方式每次都需要耗費大量的時間和存儲資源，這是我們無法接受的。

b)在線學習概念：通過分批次給系統提供訓練數據，並逐步積累學習成果的方式稱爲在線學習，又稱增量學習。在線學習提供訓練數據的方式可以是單獨的或者小批量的（mini-batches）。因此，採用在線學習方式進行學習過程中，每一步學習都非常快速並且便宜，同時系統需要持續的接收數據流並且對數據流變化做出快速響應。當然，整個訓練過程也通常是離線完成的，不要被字面意思曲解。

在線學習重要特徵：對於在線學習系統，學習率是一個非常重要的參數。學習率是衡量機器學習系統適應變化的數據的速度。如果學習率過高，那麼系統適應新數據快，與此同時會導致遺忘舊數據過快。相反，系統適應新數據過慢，產生惰性。

在線學習面臨問題：如果輸入數據不佳，那麼系統性能會逐漸下降。爲了避免這種問題，當檢測到系統性能下降超過閾值時，我們需要及時中止學習。

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

機器學習筆記（1）——基本概念

Python實現大麥網搶票的四大關鍵技術點解析

salesforce零基礎學習（一百三十八）零碎知識點小總結（十）

一款開源的.NET程序集反編譯、編輯和調試神器

關於接口協議，你必須要知道這些！

【2024-05-21】以茶會友

從明天起，我要斷更了

簡書，如果繼續這樣會傷了很多人的心

爲了簡書，我放棄了什麼

sole distributor

寫給自己，也寫給你們

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結