監督學習、無監督學習、自監督學習和強化學習

監督學習
監督學習是目前最常見的機器學習類型。給定一組樣本（通常由人工標註），他可以學會將輸入數據映射到已知目標。一般來說，近年來過度關注的深度學習應用幾乎都屬於監督學習，比如光學字符識別、語音識別、圖像分類和語言翻譯。
監督學習主要包括分類和迴歸，但還有更多的奇特變體，主要包括如下幾種：
1、序列生成（sequence generation）。給定一張圖像，預測描述圖像的文字。序列生成有時可以被重新表示爲一系列分類問題，比如反覆預測序列中的單詞或標記。
2、語法樹預測（syntax tree prediction）。給定一個句子，預測其分解生成的語法樹。
3、目標檢測（object detection）。給定一張圖，在圖中特定目標的周圍畫一個邊界框。這個問題也可以表示爲分類問題（給定多個候選邊界框，對每個框內的目標進行分類）或分類與迴歸聯合問題（用向量迴歸來預測邊界框的座標）。
4、圖像分割（image segmentation）。給定一張圖像，在特定物體上畫一個像素級的掩模（mask）。
無監督學習
無監督學習是指在沒有目標的情況下尋找輸入數據的有趣變化，其目的在於數據可視化、數據壓縮、數據去噪或更好地理解數據中的相關性。無監督學習是數據分析的必備技能，在解決監督學習之前，它通常是一個必要步驟。降維（dimensionality reduction）和聚類（clustering）都是衆所周知的無監督學習方法。
自監督學習
自監督學習是監督學習的一個特例，它與衆不同，值得單獨分爲一類。自監督學習是沒有人工標註標籤的監督學習，可以將它看作沒有人類參與的監督學習。標籤仍然存在（因爲總要有什麼東西來監督學習過程），但它們是從輸入數據中生成的，通常使用啓發式算法生成的。
強化學習
強化學習一直以來被人們所忽視，但隨着google的DeepMind公司將其成功應用於學習玩Atari遊戲（以及後來學習下圍棋並達到最高水平），機器學習的這一分支開始受到大量關注。在強化學習中，智能體（agent）接收有關環境的信息，並學會選擇使某種獎勵最大化的行動。例如，神經網絡會“觀察”視頻遊戲的屏幕，並輸出遊戲操作，目的是儘可能得高分，這種神經網絡可以通過強化學習來訓練。
目前，強化學習主要集中在研究領域，除遊戲外還沒有取得實踐上的重大成功。但是，我們期待強化學習未來能夠實現越來越多的實際應該：自動駕駛汽車、機器人、資源管理、教育等。

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

監督學習、無監督學習、自監督學習和強化學習

使用c#強大的表達式樹實現對象的深克隆之解決循環引用的問題

free AI online tools All In One

痞子衡嵌入式：恩智浦i.MX RT1xxx系列MCU啓動那些事（12.A）- uSDHC eMMC啓動時間(RT1170)

linux安裝cuda和cudnn

Mellanox網卡開啓SR-IOV

模擬手機設備：使用 Playwright 實現移動端自動化測試

HTML 00 Tutorial

全面系統的AI學習路徑，幫助普通人也能玩轉AI

從零開始：使用 Playwright 腳本錄製實現自動化測試

騰訊面試：什麼鎖比讀寫鎖性能更高？

python中將數組轉化成列表

查看Windows默認安裝的python的安裝路徑

關於docker下載鏡像失敗問題

jupyter notebook中配置TensorFlow環境

python在文件中查找指定字符串所在行號

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結