文本識別的起始應用與展示——詞雲

from wordcloud import WordCloud 	 #詞雲本雲
import matplotlib.pyplot as plt   #作圖利器
import jieba
import pandas as pd
import matplotlib.image as mpimg
import numpy as np 
from PIL import Image

text= pd.read_excel('C:/Users/zhangpeng/Desktop/詞雲.xlsx',header=0)

cnt=''
for rows in text[1]:
    cnt=cnt+rows 

cnt.replace(' ','')

wordlist = jieba.cut(cnt,cut_all=False)

wl='/'.join(wordlist)

imreceive=np.array(Image.open('C:/Users/zhangpeng/Desktop/詞雲.png'))

wc = WordCloud(
    background_color="white",    #背景顏色
       
    max_words=3000,       # 設置最大顯示的詞雲數
         
    font_path='C:\Windows\Fonts\STHUPO.TTF',     # 這種字體都在電腦字體中,一般路徑
    #     height= 1200,
    #     width= 1600,
       
    max_font_size=200,      # 設置字體最大值
    
    random_state=40,      # 設置有多少種隨機生成狀態,即有多少種配色方案
    mask=imreceive  #設置了mask 高和寬就沒作用了
    )
 
myword = wc.generate(wl)  # 生成詞雲
   
plt.imshow(myword)     # 展示詞雲圖
plt.axis("off")
plt.show()
wc.to_file('C:/Users/zhangpeng/Desktop/py_book.png') 

在這裏插入圖片描述
任何問題可在評論區溝通~

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章