機器學習簡介（1）

原創

2020-07-05 08:03

一、簡介
機器學習就是使用計算機來“學習”如何解決問題而無需“編程”（這是人工智能的一個分支）。
我們獲取一些數據，在該數據上訓練模型，然後使用訓練後的模型對新數據進行預測。基本上，這是一種使計算機創建程序的方法，該程序給出具有已知輸入的某些輸出，而後者給出與其他但相似的輸入的智能輸出。
我們需要對難以手動編程的分類/預測問題的所有可能變體的案例進行機器學習。

二、機器學習
機器學習的基本思想是使計算機從數據中學到東西。機器學習有兩種形式：
監督學習：您向計算機提供了一些輸入/輸出對，因此在將來出現新輸入時，您將獲得智能輸出。
無監督學習：您可以讓計算機從數據本身中學習，而無需顯示預期的輸出。

監督學習的例子
圖片分類：帶有圖片/標籤的火車。然後在將來您提供一張新圖像，期望計算機可以識別新對象（分類）
市場預測：您使用歷史市場數據訓練計算機，並要求計算機預測未來的新價格（迴歸）

無監督學習的例子
聚類：您要求計算機將相似的數據分成多個簇，這在研究和科學中至關重要。
高維可視化：使用計算機幫助我們可視化高維數據。
生成模型：在模型捕獲了輸入數據的概率分佈之後，它將能夠生成更多數據。這對於使分類器更健壯非常有用。

特徵
想象以下問題，您正在一個應該對腫瘤是良性還是惡性進行分類的系統上，首先，您唯一需要做出決定的信息就是腫瘤的大小。我們可以在下面看到此示例的訓練數據分佈。觀察到腫瘤大小的特徵（或特徵）似乎並不能單獨決定腫瘤是惡性還是良性。

現在考慮我們爲該問題（年齡）添加了另一個功能。

直覺是，通過添加與您要解決的問題相關的更多功能，可以使系統更強大。像這樣的複雜系統可能具有多達數千個功能。您可能會問的一個問題是如何確定與我的問題相關的功能。另外，使用哪種算法可以最好地解決無限數量的可能特徵，例如支持向量機具有一些數學技巧，可讓您使用大量特徵。

訓練
這個想法是提供一組輸入及其預期的輸出，因此在訓練之後，我們將擁有一個模型（假設），該模型會將新數據映射到一個訓練過的類別中。

例如：假設您提供了一組圖像以及以下類別（鴨子還是不鴨子），其想法是，經過訓練，您可以從互聯網上獲得鴨子的圖像，並且模型應該告訴您這是“鴨子”。

絕招
有很多不同的機器學習算法，在本書中，我們將更多地集中在神經網絡上，但是沒有一個單一的最佳算法，這全部取決於您需要解決的問題和可用的數據量。
基本食譜
這是超級簡單的祕訣（可能涵蓋了50％的可能情況），我們稍後將解釋“如何做”，但這爲在處理機器學習問題時如何思考提供了一些提示。
首先檢查您的模型在訓練數據上是否運行良好，是否不能使模型更復雜（更深或更深的神經元）
如果是，則對“測試”數據進行測試，如果不是，則表示過度擬合，而解決過度擬合的最可靠方法是獲取更多數據（將測試數據放入訓練數據中不計算在內）

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

機器學習簡介（1）

ziw2pdf

apisix~helm方式的部署到k8s

firmeye - IoT固件漏洞挖掘工具

機器學習簡介（1）

機器學習簡介（2）

高通HVX簡介

高通HTA簡介

SNPE分析與評測 (2)

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結