機器學習簡介(1)

一、簡介
機器學習就是使用計算機來“學習”如何解決問題而無需“編程”(這是人工智能的一個分支)。
我們獲取一些數據,在該數據上訓練模型,然後使用訓練後的模型對新數據進行預測。 基本上,這是一種使計算機創建程序的方法,該程序給出具有已知輸入的某些輸出,而後者給出與其他但相似的輸入的智能輸出。
我們需要對難以手動編程的分類/預測問題的所有可能變體的案例進行機器學習。

二、機器學習
機器學習的基本思想是使計算機從數據中學到東西。 機器學習有兩種形式:
監督學習:您向計算機提供了一些輸入/輸出對,因此在將來出現新輸入時,您將獲得智能輸出。
無監督學習:您可以讓計算機從數據本身中學習,而無需顯示預期的輸出。
在這裏插入圖片描述
監督學習的例子
圖片分類:帶有圖片/標籤的火車。 然後在將來您提供一張新圖像,期望計算機可以識別新對象(分類)
市場預測:您使用歷史市場數據訓練計算機,並要求計算機預測未來的新價格(迴歸)
在這裏插入圖片描述
無監督學習的例子
聚類:您要求計算機將相似的數據分成多個簇,這在研究和科學中至關重要。
高維可視化:使用計算機幫助我們可視化高維數據。
生成模型:在模型捕獲了輸入數據的概率分佈之後,它將能夠生成更多數據。 這對於使分類器更健壯非常有用。
在這裏插入圖片描述
在這裏插入圖片描述

特徵
想象以下問題,您正在一個應該對腫瘤是良性還是惡性進行分類的系統上,首先,您唯一需要做出決定的信息就是腫瘤的大小。 我們可以在下面看到此示例的訓練數據分佈。 觀察到腫瘤大小的特徵(或特徵)似乎並不能單獨決定腫瘤是惡性還是良性。

現在考慮我們爲該問題(年齡)添加了另一個功能。
在這裏插入圖片描述
直覺是,通過添加與您要解決的問題相關的更多功能,可以使系統更強大。 像這樣的複雜系統可能具有多達數千個功能。 您可能會問的一個問題是如何確定與我的問題相關的功能。 另外,使用哪種算法可以最好地解決無限數量的可能特徵,例如支持向量機具有一些數學技巧,可讓您使用大量特徵。

訓練
這個想法是提供一組輸入及其預期的輸出,因此在訓練之後,我們將擁有一個模型(假設),該模型會將新數據映射到一個訓練過的類別中。
在這裏插入圖片描述
例如:假設您提供了一組圖像以及以下類別(鴨子還是不鴨子),其想法是,經過訓練,您可以從互聯網上獲得鴨子的圖像,並且模型應該告訴您這是“鴨子”。

在這裏插入圖片描述
絕招
有很多不同的機器學習算法,在本書中,我們將更多地集中在神經網絡上,但是沒有一個單一的最佳算法,這全部取決於您需要解決的問題和可用的數據量。
基本食譜
這是超級簡單的祕訣(可能涵蓋了50%的可能情況),我們稍後將解釋“如何做”,但這爲在處理機器學習問題時如何思考提供了一些提示。
首先檢查您的模型在訓練數據上是否運行良好,是否不能使模型更復雜(更深或更深的神經元)
如果是,則對“測試”數據進行測試,如果不是,則表示過度擬合,而解決過度擬合的最可靠方法是獲取更多數據(將測試數據放入訓練數據中不計算在內)

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章