分類就是根據訓練數據集和標記的數據屬性,構建模型,來分類新的數據。這種模型就叫分類器。
預測就是建立連續的函數模型,預測接下來的連續值。同樣的模型就叫預測器。
(說到底就是給一堆數據,然後按不同方法分類,看看效果好不好...)
主要的分類方法有決策樹、貝葉斯,人工神經網絡、支持向量機、K最近鄰方法,基於規則的分類和組合分類等方法。
(這一張好多東西都是知道但不瞭解的,就介紹的粗略些,以後這些東西隨着慢慢學再慢慢寫,而且每種方法都巨多內容,都能單開一篇推送...)
決策樹分類
決策樹分類就是條件判斷進行分類,通過給不同的條件,加上各種嵌套,對數據進行分類。此外,還可以通過剪枝的思想對雜類統一處理,降低複雜度。
貝葉斯分類
基於貝葉斯定理的分類方法。(簡簡單單統計學)
人工神經網絡
利用人工神經網絡模型,模擬生物神經網絡系統,用於分類和預測。
神經網絡包括多個神經元和連接,這些神經元和連接構成多層結構,包括一個輸入層,多個隱藏層(通常爲一層)和一個輸出層。
整體過程大概是所有的數據都是輸入層的一個神經節點,然後通過各種函數投影到隱藏層的節點,進行分析判斷,輸出到輸出層,給數據打標籤分類。
之後具體的前向傳播和後向傳播等以後學了再寫...
更進一步是深度學習,通過組合低層特徵形成更加抽象的高層表示屬性類別或特徵,以發現數據的分佈式特徵表示。
(就是多層網絡,通過多個簡單的隱藏層尋找多個特徵,多個簡單特徵組合成複雜特徵,進行分類。缺點是太耗費算力,算的真的慢啊,哭了)
支持向量機分類
支持向量機分類(SVM)主要用於二項分類。
本質上就是用各種非線性映射,將原來的數據在別的維度中展示。典型的就是極座標系與笛卡爾座標系。
K最鄰近分類
組合分類
多個分類方法堆到一起,起到一個綜合的作用,產生更好的效果~
空間分類
常用線性迴歸、地理加權迴歸(加個空間關係矩陣)、趨勢面擬合,克里金等。
關注我就是我最尊貴的朋友