機器學習實戰筆記

機器學習實戰筆記

機器學習的概念:

引用Andrew Ng在機器學習課程中說過的一句話“機器學習實際上就是使用一個學習型算法,讓機器學習起來”。機器學習能讓我們自數據集中受到啓發,換句話說,我們會利用計算機來彰顯數據背後的真是含義。

實際上,很多應用是很難用程序編寫出來的,或者說不能編寫出來的,例如手寫體識別問題。而藉助於機器學習的思想,我們能夠挖掘數據背後隱含的特徵,從而能夠解決該問題。

學習方式:

監督學習:分類(離散)和迴歸(連續)屬於監督學習,之所以稱之爲監督學習,是因爲這類算法必須知道預測什麼,即目標變量的分類信息(可理解爲:給算法提供了一組“標準答案”,即有標籤的訓練集,輸出結果也會是“標準答案的形式”)。

無監督學習:數據沒有類別信息,也不會給定目標值(可理解爲:給一組數據,不告訴你關於數據任何的“標準答案”,要求你從中找出一些有趣的結構,而不用給出任何的“標準答案”)。在無監督學習中,將數據集合分成由類似的對象組成的多個類的過程被稱之爲聚類;將尋找描述數據統計值的過程稱之爲密度估計。此外,無監督學習還可以減少數據特徵的唯獨,以便我們可以使用二維或三維圖形更加直觀地展示數據信息。

必須要明確一點的是,在很多實際問題中,只有少量的帶有標記的數據,因爲對數據進行標記的代價有時比利用它們還要高,比如在生物學中,對某種蛋白質的結構分析或者功能鑑定,可能會花上生物學家很多年的工作,而大量的未標記數據卻很容易得到。

         半監督學習:半監督學習是監督學習和無監督學習的結合。在此學習方式下,輸入數據部分被標識,部分沒有被標識,這種學習模型可以用來進行預測,但是模型首先需要學習數據的內在結構以便合理地組織數據來進行預測。

         強化學習:所謂強化學習就是智能系統從環境到行爲映射的學習,以使獎勵信號(強化信號)函數值最大,強化學習不同於連接主義學習中的監督學習,主要表現在教師信號上,強化學習中由環境提供的強化信號是對產生動作好壞的一種評價(通常爲標量信號),而不是告訴強化學習系統RLS(reinforcement learning system)如何去產生正確的動作。由於外部環境提供的信息很少,RLS必須靠自身的經歷進行學習。通過這種方式,RLS在行動-評價的環境中獲得知識,改進行動方案以適應環境。常見的應用場景包括動態系統以及機器人控制等。

強化學習示例圖

發佈了25 篇原創文章 · 獲贊 18 · 訪問量 16萬+
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章