算法學習概論

今天有點不想學習,不想搞科研,過幾天去北京開會了,這兩天就多更一些吧,今天開一個新專欄算法學習,這裏主要講解李航老師的《統計學習方法》中的內容,這兩天看了看,感覺李航老師這本書真的是講的非常好,有興趣的童鞋可以去買一本研讀,有什麼問題大家可以一起交流學習~

統計學習是關於計算機基於數據構建概率統計模型並運用模型對數據進行預測與分析的一門學科,統計學習也稱爲統計機器學習我們單次“統計學習”這個名字可以看出,主要包含兩個過程:一是統計過程,即對數據進行統計,總結出相應的規律;二是對數據的規律進行學習,進行預測新的數據。赫爾伯特.西蒙曾對“學習”給出的如下定義:“如果一個系統能夠通過執行某個過程改進它的性能,這就是學習”。下面從統計學習的對象、目的、方法等方面簡單對統計學習進行介紹~

1統計學習的對象

這一點大家應該都十分清楚,統計學習的對象就是數據,我們生活在一個大數據時代,很多事情都可以用數據去評估,比如淘寶會根據你最近的瀏覽記錄去預測你最近感興趣的東西,從而給你推送相關商品,從而促進消費。統計學習從數據出發,從數據中挖掘出相關規律,學習其中的知識,建立數據模型,最終回到數據當中,實現數據的預測與分析。

統計學習在對數據進行挖掘、預測、分析等過程都是建立在同類數據具有一定的概率統計規律這一假設基礎上,而我們處理的大部分數據都是滿足這一假設的。在統計學習過程中,以變量或者變量組表示數據,數據分爲連續數據和離散數據兩種類型。

2.統計學習的目的

統計學習的目的歸根結底是爲了人們服務,通過統計學習方法對數據進行學習,從而預測未知新數據,從而幫助人們解決一些難題:如通過統計學習方法學習醫學圖像數據,從而發現人類患病與圖像信息的關係,從而通過醫學圖像實現人類患病與否的預測,實現病變的快速監測。

3.統計學習的方法

統計學習方法是基於數據構建統計模型從而對數據進行分析與預測。統計學習有監督學習、非監督學習、半監督學習和增強學習。

監督學習方法主要包括神經網絡、SVM、決策樹等,由於需要預先需要帶標籤的訓練數據學習其的分佈規律,建立模型進行對新數據的預測與分析,因此稱爲監督學習(就是有一堆數據監督着你,讓你更好的學習)

非監督學習方法主要有KNN、K-mean等聚類算法和隱馬爾科夫模型,該類方法直接對無標籤數據進行分類、預測。

半監督學習是模式識別和機器學習領域研究的重點問題,是監督學習與無監督學習相結合的一種學習方法。半監督學習使用大量的未標記數據,以及同時使用標記數據,來進行模式識別工作。當使用半監督學習時,將會要求儘量少的人員來從事工作,同時,又能夠帶來比較高的準確性,因此,半監督學習目前正越來越受到人們的重視。

增強學習,又稱再勵學習、評價學習或增強學習,是機器學習的範式和方法論之一,用於描述和解決智能體在與環境的交互過程中通過學習策略以達成回報最大化或實現特定目標的問題。

後面的文章介紹的主要是監督學習算法,具體過程可以概括如下:

從給定的、有限的、用於學習的訓練數據集合出發,假設數據是獨立同分布產生的;並且假設要學習的模型屬於某個函數的集合,稱爲假設空間;應用評價準則,從假設空間中選取一個最優的模型,使它對已知訓練數據及未知測試數據在給定的評價準則下有最優的預測;最優模型的選取由算法實現。這樣,統計學習方法包括模型的假設空間、模型選擇的準則以及模型學習的算法,稱其爲統計學習方法的三要素,簡稱爲:模型、策略和算法。

今天算是算法學習這一欄目的一個大綱,簡單的介紹一下~希望大家能夠從中收穫知識~

繼續喊出我的口號:每天進步一點點~

 

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章