監督學習or無監督學習？這個問題必須搞清楚

原創

读芯术

2020-04-29 12:58

全文共1691字，預計學習時長6分鐘

圖源：unsplash

當你踏上機器學習之旅時，搞清楚監督學習和無監督學習是你應該做的第一件事。而對於新手而言，“監督學習和無監督學習有什麼區別？”，是最爲常見不過的問題。

其答案在於理解機器學習算法的本質。如果沒有明確監督學習和無監督學習之間的區別，你的學習之旅將無法前行。

如果sSDBQIF不瞭解線性迴歸、邏輯迴歸、聚類、神經網絡等算法的適用範圍，就沒法直接進入模型構建階段。

如果不知道機器學習算法的目標是什麼，就無法建立一個精確的模型。這就是監督學習和無監督學習的由來。

本文就將幫你解決這個問題，再友情奉送另一個關鍵問題：如何決定何時使用監督學習或無監督學習？

什麼是監督學習？

在監督學習中，計算機通過示例學習。它從過去的數據中學習，並將學習的結果應用到當前的數據中，以預測未來的事件。在這種情況下，輸入和期望的輸出數據都有助於預測未來事件。

爲了準確預測，將輸入數據標記爲正確答案。

監督機器學習分類

重要的是，要記住：所有監督學習算法本質上都是複雜算法，分爲分類或迴歸模型。

1.迴歸模型—迴歸模型用於輸出變量爲實際值的問題，例如單一的數字、美元、薪水、體重或壓力。它最常用於根據先前的觀測數據來預測數值。一些比較常見的迴歸算法包括線性迴歸、邏輯迴歸、多項式迴歸和脊迴歸。

2.分類模型—分類模型用於可以對輸出變量進行分類，例如“是”或“否”、“通過”或“失敗”。分類模型用於預測數據的類別。現實生活中的例子包括垃圾郵件檢測、情緒分析、考試記分卡預測等。

監督學習算法在現實生活中有一些非常實際的應用，包括：

· 文本分類

· 垃圾郵件檢測

· 天氣預報

· 根據當前市場價格預測房價

· 股票價格預測等

· 人臉識別

· 簽名識別

· 客戶發現

圖源：unsplash

什麼是無監督學習？

無監督學習是訓練機器使用既未分類也未標記的數據的方法。這意味着無法提供訓練數據，機器只能自行學習。機器必須能夠對數據進行分類，而無需事先提供任何有關數據的信息。

其理念是先讓計算機與大量變化的數據接觸，並允許它從這些數據中學習，以提供以前未知的見解，並識別隱藏的模式。因此，無監督學習算法不一定有明確的結果。相反，它確定了與給定數據集不同或有趣之處。

計算機需要編程才能自學。計算機需要從結構化和非結構化數據中理解和提供見解。以下是無監督學習的準確說明：

無監督機器學習分類

1.聚類是最常見的無監督學習方法之一。聚類的方法包括將未標記的數據組織成類似的組，稱爲聚類。因此，聚類是相似數據項的集合。此處的主要目標是發現數據點中的相似性，並將相似的數據點分組到一個聚類中。

2.異常檢測是識別與大多數數據顯著不同的特殊項、事件或觀測值的方法。通常在數據中尋找異常或異常值的原因在於它們是可疑的。異常檢測常用於銀行欺詐和醫療差錯檢測。

圖源：unsplash

無監督學習算法的應用

無監督學習算法的一些實際應用包括：

· 惡意軟件檢測

· 數據輸入過程中人爲錯誤識別

· 進行準確的購物籃分析等

· 欺詐檢測

應該什麼時候選擇監督學習或無監督學習？

在製造業中，有很多因素影響哪種機器學習方法最適合任何給定的任務。而且，由於每個機器學習問題的獨特性，決定使用哪種技術是一個複雜的過程。

一般來說，選擇正確機器學習方法的一個好策略是：

· 評估數據。標記與否？是否有專家知識支持附加標記？這將有助於確定是否應使用監督、無監督、半監督或強化的學習方法。

· 審查可用的算法，其可能適合維度問題（特徵、屬性或特徵的數量）。候選算法應適合於整個數據量以及其結構。

· 研究成功案例，關於類似問題上應用的算法類型。

· 定義目標。被定義的問題是否反覆出現？是否期望算法能預測新的問題？

圖源：unsplash

監督學習和無監督學習是機器學習領域中的關鍵概念，這應該是你開始學習機器學習的第一課，一定要理解透徹呀！

留言點贊關注

我們一起分享AI學習與發展的乾貨
歡迎關注全平臺AI垂類自媒體 “讀芯術”

（添加小編微信：dxsxbb，加入讀者圈，一起討論最新鮮的人工智能科技哦～）

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

監督學習or無監督學習？這個問題必須搞清楚

什麼是監督學習？

什麼是無監督學習？

應該什麼時候選擇監督學習或無監督學習？

[轉帖]使用NMT和pmap解決JVM資源泄漏問題原創

Python實現大麥網搶票的四大關鍵技術點解析

Python 安裝庫指令大全

salesforce零基礎學習（一百三十八）零碎知識點小總結（十）

一款開源的.NET程序集反編譯、編輯和調試神器

關於接口協議，你必須要知道這些！

基於 Milvus + LlamaIndex 實現高級 RAG

【2024-05-21】以茶會友

還在“收集”證書？學好數據科學，做項目纔是第一位的

如果必須重新開始，我會怎樣開啓自己的數據科學之旅？

寫出你的第一個web app，幾行代碼就夠了

研究了500+數據科學麪試問題之後，我發現了這些規律……

質子之死：粒子衰變如何推出萬有理論

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結