今天小編帶領大家完整的走完一個簡單機器學習小的實戰項目,這個項目是Kaggle上的經典項目《泰坦尼克號之災》,也是面試經常考的項目。大家對於泰坦尼克號一定不會陌生,但是不知道大家想過沒有,泰坦尼克號上生還的都是哪些人,他們都有什麼樣的特徵呢?
今天小編將從以下的幾個點進行分析:
*對於數據的認知
- 特徵工程
- 進行模型的構建
首先爲什麼要講數據的認知,只有對數據進行充分的瞭解,你才能從大量的冰冷的數據中發現潛在的規律;只有對數據進行充分的認識,你才能從數據中提取有價值的信息。沒有對於數據的瞭解,其他的都是空談。那麼我們首先來看一下,我們所要處理的數據吧。