Gensim庫生成與導入W2V模型_CodingPark編程公園

Gensim庫生成與導入W2V模型

語料目錄

在這裏插入圖片描述

完整代碼

import gensim
import pandas as pd

'''

W2V-msr 生成

'''
corpus_msr = gensim.models.word2vec.Text8Corpus("./training/msr_training.utf8")  # 加載語料
model = gensim.models.word2vec.Word2Vec(corpus_msr, size=128, window=5, min_count=5, workers=4)
model.save('W2V_Danmu_msr')
print('W2V_Danmu_msr 生成完畢')

'''

W2V-pku 生成

'''
corpus_pku = gensim.models.word2vec.Text8Corpus("./training/pku_training.utf8")  # 加載語料
model = gensim.models.word2vec.Word2Vec(corpus_pku, size=128, window=5, min_count=5, workers=4)
model.save('W2V_Danmu_pku')
print('W2V_Danmu_pku 生成完畢')







'''

W2V-msr 導入

'''
model_msr = gensim.models.Word2Vec.load('W2V_Danmu_msr')
print()
print('---使用 W2V_Danmu_msr 模型---')
print(pd.Series(model_msr.most_similar('爸爸', topn=10)))

'''

W2V-pku 導入

'''
model_pku = gensim.models.Word2Vec.load('W2V_Danmu_pku')
print()
print('---使用 W2V_Danmu_pku 模型---')
print(pd.Series(model_pku.most_similar('爸爸', topn=10)))


在這裏插入圖片描述

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章