一步一步教你如何用Python做詞雲

前言

在大數據時代,你竟然會在網上看到的詞雲,例如這樣的。

看到之後你是什麼感覺?想不想自己做一個?

如果你的答案是正確的,那就不要拖延了,現在我們就開始,做一個詞雲分析圖,Python是一個當下很流行的編程語言,你不僅可以用它做數據分析和可視化,還能用來做網站、爬取數據、做數學題、寫腳本替你偷懶……

如果你之前沒有編程基礎,沒關係。希望你不要限於瀏覽,而是親自動手嘗試一番。到完成的那一步,你不僅可以做出第一張詞雲圖,而且這還將是你的第一個有用的編程作品。

【python開發學習資料領取方式】:加入python技術學習交流羣250933691,點擊加入羣聊,私信管理員即可免費領取

安裝wordcloud庫

請確保你的python環境沒有問題,我用的開發工具是VsCode,首先你要在Python擴展中安裝python開發環境(當然,這不是爲你的windows安裝python)

那麼你還需要安裝所需要的第三方庫,那麼在VSCode中並沒有PyCharm那麼專業,這裏需要獲得你自己的Python腳本位置。

我們可以發現裏面有一個名爲pip.exe文件,這個文件就是python官方給我們去安裝python第三方庫的一個程序,那麼我們可以在VsCode的終端中就可以去通過它,這也是我們爲什麼要獲取python安裝位置的根本原因。

例如我們安裝WordCloud,我們的操作如下:

pip install WordCloud

Code

python做詞雲呢,需要導入的包有wordcloud和PIL,其中PIL(Python Image Library)是python平臺圖像處理標準庫,功能是真的強大。首先需要讀取文件 。

首先我們要讀取我們的txt文件,那麼代碼如下:

運行腳本結果如下:

 接下來導包,我們看看如何生成最簡單的詞雲:

如果python引入無誤,並代碼無誤,那麼會彈出你生成的圖片,該圖片會儲存在你的系統。詳細位置一般爲:C:\Users\MACHENIKE\AppData\Local\Temp 中。

帶形狀的詞雲

一般來說,我們不想要這麼方的詞雲,肯定喜歡一些有形狀的,

接下來是生成那種有輪廓的詞雲,這裏就需要繼續導入其他包,這裏導入的包爲numpy,numpy系統是python的一種開源的數值計算擴展,這種工具可以用來存儲和處理大型矩陣。這裏在處理的時候將給出形狀的圖片表示爲一個大型矩陣,再有顏色的地方來進行填詞(導包 :import numpy as np)。導包之後需添加一個遮罩層,遮罩層就是用來限制生成圖片的形狀 。

 網上隨便找個圖片放入到項目當中(這裏我找的是一個💗),然後開始code:

結果如下:

 

不支持中文的解決方案

我又從網上摘抄了一段文字,文字內容如下:

生活星期天早上和朋友一起聊天,朋友說了一個他們聽過的故事:“一尊佛像前有一條鋪着石板的路,人們每天都踏着這一階一階的石板去膜拜佛像。石階看着人們踏着自己去膜拜佛像,心裏很不舒服。石階心裏想,自己和佛本來就來自同一塊石頭,爲什麼自己要成爲踏腳石,讓人們踩着自去去膜拜它呢!它對佛抱怨說這樣太不公平!佛像說:這沒有什麼不公平,你們成爲臺階只需捱了四刀,而我是捱了千刀萬剮才成了人們膜拜的佛像。

重新運行,發現雪崩了。

 如果需要生成中文的詞雲,還需導入jieba分詞的包。jieba分詞的切分還是蠻準的。

 

 

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章