1、numeric_column —— 代表連續數值類型的特徵列。
2、bucketized_column——將連續數值分箱,如:輸入(1,2,3,4,5)按照(0,34,5)兩個區間分箱,分箱成爲(0,0,0,1,1)的onehot形式,即最終結果爲:),(
[1,0] #1
[1,0] #2
[1,0] #3
[0,1] #4
[0,1] #5
3、categorical_column_with_identity——將數值型離散值進行onehot編碼。注意要求是數值型的離散值。
4、categorical_column_with_hash_bucket——將連續值分箱的hash版本,即對於連續值取餘,用餘數來確定它被歸爲哪個區間。不知道該列所有的取值,取值很多,用這個方法合適。
5、crossed_column —— 將兩個離散型特徵列進行組合,輸入多個bucketized_column,輸出一個bucketized_column。
6、embedding_column —— 輸入categorical_column離散類數值,返回embedding矩陣。
7、categorical_column_with_vocabulary_list——知道該列所有取值,且不多,可以直接寫一個包含所有取值的list。
8、以上所有方法最終都會生成categorical Column或是Dense Column,這兩個東西我在文檔中沒有找到,不知道是不是僅僅是個概念。