第四章總結 特徵構造講了什麼

1:分類數據填充。直接使用衆數進行填充,使用value_counts方法。

2:處理分類數據。 對於無序的分類數據,直接轉化爲虛擬變量。對於有序的分類變量,直接轉化爲label,即有序的數字即可。

3:處理數值數據。對於數值數據,我們可以把它們切分開來,然後轉化爲有序的數字即可。

4:對於數值類型的數據,可以使用多項式結合的方式進行擴展。

5:最後介紹瞭如何處理文本數據。介紹了字袋模型還有Tf-idf方法。(最後這一塊沒有暫時沒有需求,所以沒有看)

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章