深度學習筆記之四——feature_column

1、numeric_column —— 代表連續數值類型的特徵列。

2、bucketized_column——將連續數值分箱,如:輸入(1,2,3,4,5)按照(0,34,5)兩個區間分箱,分箱成爲(0,0,0,1,1)的onehot形式,即最終結果爲:),(

 [1,0]  #1
 [1,0]  #2
 [1,0]  #3
 [0,1]  #4
 [0,1]  #5

 3、categorical_column_with_identity——將數值型離散值進行onehot編碼。注意要求是數值型的離散值。

4、categorical_column_with_hash_bucket——將連續值分箱的hash版本,即對於連續值取餘,用餘數來確定它被歸爲哪個區間。不知道該列所有的取值,取值很多,用這個方法合適。

5、crossed_column —— 將兩個離散型特徵列進行組合,輸入多個bucketized_column,輸出一個bucketized_column。

6、embedding_column —— 輸入categorical_column離散類數值,返回embedding矩陣。

7、categorical_column_with_vocabulary_list——知道該列所有取值,且不多,可以直接寫一個包含所有取值的list。

8、以上所有方法最終都會生成categorical Column或是Dense Column,這兩個東西我在文檔中沒有找到,不知道是不是僅僅是個概念。

 

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章