監督學習、無監督學習、自監督學習和強化學習

  • 監督學習
    監督學習是目前最常見的機器學習類型。給定一組樣本(通常由人工標註),他可以學會將輸入數據映射到已知目標。一般來說,近年來過度關注的深度學習應用幾乎都屬於監督學習,比如光學字符識別、語音識別、圖像分類和語言翻譯。
    監督學習主要包括分類和迴歸,但還有更多的奇特變體,主要包括如下幾種:
    1、序列生成(sequence generation)。給定一張圖像,預測描述圖像的文字。序列生成有時可以被重新表示爲一系列分類問題,比如反覆預測序列中的單詞或標記。
    2、語法樹預測(syntax tree prediction)。給定一個句子,預測其分解生成的語法樹。
    3、目標檢測(object detection)。給定一張圖,在圖中特定目標的周圍畫一個邊界框。這個問題也可以表示爲分類問題(給定多個候選邊界框,對每個框內的目標進行分類)或分類與迴歸聯合問題(用向量迴歸來預測邊界框的座標)。
    4、圖像分割(image segmentation)。給定一張圖像,在特定物體上畫一個像素級的掩模(mask)。

  • 無監督學習
    無監督學習是指在沒有目標的情況下尋找輸入數據的有趣變化,其目的在於數據可視化、數據壓縮、數據去噪或更好地理解數據中的相關性。無監督學習是數據分析的必備技能,在解決監督學習之前,它通常是一個必要步驟。降維(dimensionality reduction)和聚類(clustering)都是衆所周知的無監督學習方法。

  • 自監督學習
    自監督學習是監督學習的一個特例,它與衆不同,值得單獨分爲一類。自監督學習是沒有人工標註標籤的監督學習,可以將它看作沒有人類參與的監督學習。標籤仍然存在(因爲總要有什麼東西來監督學習過程),但它們是從輸入數據中生成的,通常使用啓發式算法生成的。

  • 強化學習
    強化學習一直以來被人們所忽視,但隨着google的DeepMind公司將其成功應用於學習玩Atari遊戲(以及後來學習下圍棋並達到最高水平),機器學習的這一分支開始受到大量關注。在強化學習中,智能體(agent)接收有關環境的信息,並學會選擇使某種獎勵最大化的行動。例如,神經網絡會“觀察”視頻遊戲的屏幕,並輸出遊戲操作,目的是儘可能得高分,這種神經網絡可以通過強化學習來訓練。
    目前,強化學習主要集中在研究領域,除遊戲外還沒有取得實踐上的重大成功。但是,我們期待強化學習未來能夠實現越來越多的實際應該:自動駕駛汽車、機器人、資源管理、教育等。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章