python 詞雲製作

製作詞雲需要兩個python核心類庫

準備工作

1、jieba中文分詞器
安裝:pip install jieba
2、wordcloud:Python下的詞雲生成工具
安裝:
下載https://www.lfd.uci.edu/~gohlke/pythonlibs/#wordcloud

在這裏插入圖片描述下載完成後在該包的目錄下執行
pip install wordcloud-1.6.0-cp36-cp36m-win_amd64.whl
wordcloud-1.6.0-cp36-cp36m-win_amd64.whl
在這裏插入圖片描述安裝完成!

詞雲製作

準備一個text文檔,上面寫上要做的文字,以及一張圖片作詞雲的背景圖

# -*- coding: utf-8 -*-
import PIL
from os import path
from PIL import Image
import numpy as np
import matplotlib.pyplot as plt
import jieba
from wordcloud import WordCloud, STOPWORDS

d = path.dirname(__file__)
# 1.讀入txt文本數據
txt = open("ciyun.txt", "r", encoding="utf-8").read()
# 2.結巴中文分詞,生成字符串,默認精確模式,如果不通過分詞,無法直接生成正確的中文詞雲
cut_text = jieba.cut(txt)
# 必須給個符號分隔開分詞結果來形成字符串,否則不能繪製詞雲
result = " ".join(cut_text)
# 讀取圖片
alice_mask = np.array(PIL.Image.open(d+'/xin.png'))
# 要忽略的 不在詞雲顯示的詞組
stopwords = set(STOPWORDS)
stopwords.add("我們")
wc = WordCloud(font_path="C:/Windows/Fonts/simfang.ttf",
               background_color="white",
               max_words=2000,
               mask=alice_mask,
               stopwords=stopwords)
# 生成詞雲
wc.generate(result)

# 存儲到當前文件 ,生成詞雲的名稱
wc.to_file(r"wordcloud.png")
# show
plt.imshow(wc, interpolation='bilinear')
# 關閉圖像座標系
plt.axis("off")
plt.show()

運行結果
在這裏插入圖片描述

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章