训练Doc2Vec

在这里插入图片描述
将文本数据表示成list of list的形式:
在这里插入图片描述
对每一条文本进行分词操作,可能的话,去除停用词,加上自定义词等:
在这里插入图片描述
将分词后的文本转换为gensim所需要的形式:
在这里插入图片描述
训练Doc2Vec,其中参数dm=1表示DM模型,dm=0表示DBOW模型。(此处没有写,dm参数放在Doc2Vec()函数中)
在这里插入图片描述

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章