什麼是稀疏向量(向量的稀疏表示)

對數據進行預處理時,一般需要對類別型特徵進行編碼:

  1. 序號編碼
  2. 獨熱編碼
  3. 二進制編碼

其中獨熱編碼用的是最多的。但是當類別數十分巨大時,獨熱編碼是一個非常稀疏的向量,只有一個值不爲0,其他值均爲0。可以使用向量的稀疏表示來大大的節省空間,並且目前大多數的算法都接受稀疏向量形式的輸入。

舉個例子:
v=[0,0,0,0,1,0,3,0,0,0] v = [0,0,0,0,1,0,3,0,0,0]
對於向量 vv,其稀疏表示爲
(10,[4,6],[1,3]) (10, [4, 6], [1,3])
10代表vv的長度,[4,6][4, 6]表示非零元素的下標,[1,3][1, 3]表示非零元素的值。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章