在Word2vec中使用到了非相關數據的降採樣方法, 其中用到了torch.multinomial方法, 這裏記錄一下:
multinomial(input, num_samples, replacement=False)
該方法主要有三個參數, 分別是輸入的張量, 採樣的個數, 是否有重複的數據, 採樣的時候是根據輸入張量的數值當做權重來進行抽樣的, 數值越大, 抽到的可能性越大, 越小抽到的可能性越小, 如果是0 則不會抽到
由案例可知, 輸出的是出入的張量的索引值,
當非零數據只有4個時, 要輸出5個不重複的數據會報錯
而可以重複數據時, 即使去很多值, 也不會取到, 索引值爲0的, 因爲其權重是0