機器學習的三種方法

原創

浩1001

2020-02-22 12:17

機器學習三種方法：監督學習（supervised learining）、無監督學習（unsupervised learning）和強化學習（reinforcement learning）

1.通過監督學習對未來事件進行預測

監督學習的主要目的是使用有類標的訓練數據構建模型，我們可以使用經訓練得到的模型對未來數據進行預測。此外，術語監督是指訓練數據集中的每個樣本均有一個已知的輸出項（類標（label））

a、利用分類對類標進行預測

分類是監督學習的一個之類，其目的是基於對過往類標已知示例的觀察與學習，實現對新樣本類標的預測。這些類標是離散的、無序的值，他們可以視爲樣本的組別信息。

b、使用迴歸預測連續輸出值

另一類監督學習的方法針對連續型輸出變量進行預測，也就是所謂的迴歸分析。在在迴歸分析中，數據中會給出大量的自變量（解釋變量）和相應的連續因變量（輸出結果），通過嘗試尋找這兩種變量之間的關係，就能夠預測輸出變量。

2.通過強化學習解決交互式問題

強化學習的目標是構建一個系統（Agent），在與環境（environment）交互的過程中提高系統的性能。環境的當前狀態信息中通常包含一個反饋（reward）信號，我們可以將強化學習視爲與監督學習相關的一個領域。然而，在強化學習中，這個反饋值不是一個確定的類標或者連續類型的值，而是一個通過反饋函數產生的對當前系統行爲的評價。通過與環境的交互，Agent可以通過強化學習來得到一系列的行爲，通過探索性的試錯或者藉助精心設計的激勵系統使得正向反饋最大化。

一個常用的強化學習例子就是象棋對弈的遊戲，正此，Agent根據棋盤上的當前局態（環境）決定落子的位置，而遊戲結束時勝負的判定可以作爲激勵信號。

3.通過無監督學習發現數據本身潛在的結構

通過無監督學習，我們可以在沒有已知輸出變量和反饋函數指導的情況下提取有效信息來探索數據的整體結構。

a、通過聚類發現數據的子羣

聚類是一種探索性數據分析技術。在沒有任何相關先驗信息的情況下，它可以幫助我們將數據劃分爲有意義的小的組別（即簇（cluster））。對數據進行分析師，生成的每個簇中其內部成員之間具有一定的相識度，而在其他簇中的成員則具有較大的不同，這也是爲什麼簇類有時候也被稱爲“無監督分類”。簇類是獲取數據的結構信息，以及導出數據間有價值的關係的一種很好的技術，例如，它使得市場人員可以基於用戶的興趣將其分爲不同的類別，以分別制定相應的市場營銷計劃。

b、數據壓縮中的降維

數據降維是無監督學習的林一個子領域。通常，我們面對的數據都是高維的（每一次採樣都會獲得大量的樣本值），這就對有限的數據存儲空間以及機器學習算法性能提出挑戰。無監督降維是數據特徵預處理是常用的技術，用於清除數據中的噪聲，它能夠最大程度保留相關信息的情況下將數據壓縮到一個維度較小的子空間，但同時也可能會降低某些算法在準確性方面的性能。

參考書籍：Python機器學習

浩1001

發佈了41 篇原創文章 · 獲贊 4 · 訪問量 1萬+

私信關注

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

機器學習的三種方法

2018年湘潭大學程序設計競賽 D Fibonacci進制（貪心，斐波那契）

感知器算法的Python實現

Wannafly挑戰賽16 A-取石子

LightOJ 1315 - Game of Hyper Knights （博弈論-SG函數）

POJ 1067--取石子游戲（威佐夫博弈）

Mac下配置sublime實現LaTeX

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結