機器學習導圖系列(1):數據處理

機器學習導圖系列教程旨在幫助引導開發者對機器學習知識網絡有一個系統的概念,其中具體釋義並未完善,需要開發者自己探索才能對具體知識有深入的掌握。本項目靈感來自Daniel Formoso的github開源項目。本文作者對其項目進行翻譯、整理、批註等二次創作,其中不乏生僻的數學名詞,對於沒有留過學的作者來說費了很多功夫。我又將導圖整理成了知識卡片,方便大家查看。由於機器學習的知識網絡很大,導致完整的導圖過大,文章中的圖片可能經過壓縮,如需完整圖片可查看github項目machine-learning-mindmap-cn下載高清原圖。本系列還在持續創作中,你的點贊、留言、star都會成爲我持續創作的動力。

Daniel Formoso: https://github.com/dformoso/machine-learning-mindmap
machine-learning-mindmap-cn: https://github.com/caiyongji/machine-learning-mindmap-cn

機器學習導圖系列分爲五大模塊。

  1. 機器學習數據處理
  2. 機器學習概念
  3. 機器學習過程
  4. 機器學習算法
  5. 機器學習模型及神經網絡模型

在這裏插入圖片描述

數據類型

在這裏插入圖片描述

數據探索

在這裏插入圖片描述

數據清洗

在這裏插入圖片描述

特徵插補

在這裏插入圖片描述

特徵工程

在這裏插入圖片描述

特徵選擇

在這裏插入圖片描述

特徵編碼

在這裏插入圖片描述

特徵歸一化(Normalisation)或縮放(Scaling)

在這裏插入圖片描述

構造數據集

在這裏插入圖片描述

最後

你隨手就是一個贊。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章