半原創^_^
學習了一篇關於python實現詞雲的文章,現在分享給大家
我的製作圖如下:
準備工作
python版本:python3.6,2.7均可
操作系統:Ubuntu(自帶python 2和3) MacOS(自帶python 2和3) Windows (需下載python 2.7 或 3.6)
需要用到模塊及工具:
anaconda套餐 (anaconda指的是一個開源的Python發行版本,其包含了conda、Python等180多個科學包及其依賴項。[1] 因爲包含了大量的科學包,Anaconda 的下載文件比較大)在官網上選擇合適版本下載 ‘xxxx.sh’文件,在終端下使用sudo chmod +x xxxx.sh添加運行權限,然後./xxxx.sh運行安裝
jupyter notebook (Jupyter Notebook 的本質是一個 Web 應用程序,便於創建和共享文學化程序文檔,支持實時代碼,數學方程,可視化和 markdown)Ubuntu用戶使用
sudo pip install jupyter 安裝
在終端裏,macOS或者Linux用戶請鍵入以下命令:
pip install wordcloud
開始利用數據分析
詞雲分析的是文本信息,我挑選了英劇"Yes, minister",到維基百科上找到了這部劇的介紹詞條
複製了介紹部分的內容,存爲yes-minister.txt
代碼實現
在終端內執行,jupyter notebook
會自動打開瀏覽器,顯示如下界面
點擊右側New,選擇python版本2或3
填寫新建Notebook文件名,可以任意填寫,我選擇的是wordcloud
然後就出現了一個空白的筆記本,供我們使用了。我們在網頁裏唯一的代碼文本框裏,輸入以下3條語句。請務必逐字根據示例代碼輸入,空格數量都不可以有差別。尤其注意第三行,用4個空格,或者1個Tab開始。輸入後,按Shift+Enter鍵,就可以執行了。
以上程序打開了你的yes-minister.txt文本文件,把裏面的內容都讀了出來,存儲到了一個叫做mytext的變量裏面filename = "yes-minister.txt"
with open(filename) as f:
mytext = f.read()
若想讀取mytext文件裏的內容
在代碼文本框內輸入
mytext
然後我們使用import導入包,
利用mytext中存儲的文本內容來製造詞雲。
大功告成!我也終於寫完了,,,,from wordcloud import WordCloud
wordcloud = WordCloud().generate(mytext)
輸出詞雲圖像使用以下語句
%pylab inline#在notebook內顯示圖像
import matplotlib.pyplot as plt
plt.imshow(wordcloud, interpolation='bilinear')
plt.axis("off")
最後可以嘗試wordcloud的高級功能,將詞雲做的高大上