doc2vec的一些操作

1,從doc2vec模型中提取出word2vec向量表,代碼如下:

from gensim.test.utils import common_texts
from gensim.models.doc2vec import Doc2Vec, TaggedDocument
documents = [TaggedDocument(doc, [i]) for i, doc in enumerate(common_texts)]
model = Doc2Vec(documents, vector_size=5, window=2, min_count=1, workers=4)
model.save_word2vec_format("t")

在訓練時將dbow_words需要設置爲1詞向量纔會保存,然後使用model.save_word2vec_format("word_vec")將向量保存在文件word_vec中。

 

2,查看模型中訓練樣本的數量

model.corpus_count

 

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章