Python 數據可視化生成詞雲 WordCloud

原創

2020-04-21 09:20

演示：

不羅嗦，直接先上代碼。

from wordcloud import WordCloud
import jieba
from matplotlib import pyplot as plt
from PIL import Image
import numpy as np

path = r'E:\123\教程'  #文本路徑
path_ph = r'E:\123\教程'   #詞雲背景模板路徑
font = r'C:\Windows\Fonts\FZSTK.TTF'  #設置字體，可以顯示中文。

text = (open(path + r'\job.txt', 'r', encoding='utf-8')).read()   # gbk <--> utf-8
cut = jieba.cut(text)  # 使用 jieba庫 分詞
string = ' '.join(cut)
print(len(string))  # 輸出詞量
img = Image.open(path_ph + r'\2.jpg')  # 打開圖片
img_array = np.array(img)  # 將圖片裝換爲數組
stopword = ['Unword']  # 設置停止詞，也就是你不想顯示的詞，可有可無，看情況處理
wc = WordCloud(
    background_color='white',  #設置顯示內容在什麼顏色內
    width=1000,    #設置圖片寬
    height=800,     #設置圖片高
    mask=img_array,  #設置詞雲背景模板
    font_path=font,  #設置字體路徑
    stopwords=stopword,
    scale=10  #圖像清晰度，數值越大越清晰，最好在10-30之間。
)
wc.generate_from_text(string)  # 繪製圖片
plt.imshow(wc)
plt.axis('off') #關閉座標軸
plt.show()  # 顯示圖片
wc.to_file(path + r'\wordcloud1.png')  # 保存圖片

使用之前需要將需要的第三方庫先下載安裝完。（wordcloud、jieba、matplotlib、PIL、numpy）
可以通過pip安裝。
如果還不會的可以看我的另一個文章———>pip 安裝，更新，卸載，查看模塊方法

Note：有時候你們生成的詞雲可能不清晰，是因爲沒有設置 scale 值，設置完後會讓生成的詞雲圖像變得清晰。

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

從原始邊列表到鄰接矩陣Python實現圖數據處理的完整指南

本文分享自華爲雲社區《從原始邊列表到鄰接矩陣Python實現圖數據處理的完整指南》，作者：檸檬味擁抱。在圖論和網絡分析中，圖是一種非常重要的數據結構，它由節點（或頂點）和連接這些節點的邊組成。在Python中，我們可以使用鄰接矩陣來表示

2024-04-30 10:34:05

Python爬蟲技術與數據可視化：Numpy、pandas、Matplotlib的黃金組合

前言在當今信息爆炸的時代，數據已成爲企業決策和發展的關鍵。而互聯網作爲信息的主要來源，網頁中蘊含着大量的數據等待被挖掘。Python爬蟲技術和數據可視化工具的結合，爲我們提供了一個強大的工具箱，可以幫助我們從網絡中抓取數據，並將其可視

2024-04-29 23:26:28

華爲云云原生FinOps解決方案，釋放雲原生最大價值

華爲云云原生FinOps通過可視化的成本洞察和成本優化，幫助用戶精細用雲以提升單位成本的資源利用率，實現降本增效目標企業上雲現狀：上雲趨勢持續加深，但云上開支存在顯著浪費根據Flexer 2024年最新的一項調查顯示，當前有超過7

2024-04-29 22:33:46

無需重新學習，使用 Kibana 查詢/可視化 SLS 數據

作者：荊磊場景現在通過 SLS 的 ES 兼容能力，可以很方便地實現用 Kibana 來查詢和可視化 SLS 的數據。對於從 ES 遷移到 SLS 的用戶可以繼續保留原來的 Kibana 使用習慣。下面來演示如何通過 Kibana 來訪

2024-04-28 21:12:20

嘉爲藍鯨WeOps與DeepFlow強強聯合，共同打造拓展性運維平臺

直達原文：嘉爲藍鯨WeOps x DeepFlow | 強強聯合，共同打造拓展性運維平臺運維管理在企業信息化建設中扮演着至關重要的角色，嘉爲藍鯨WeOps一體化運維平臺致力於爲客戶提供更全面、智能的運維能力。在探索創新的過程中，我們深刻

2024-04-26 23:23:22

重慶興農擔保集團攜手嘉爲藍鯨，鍛造運維能力底座，精益信息化管理

重慶興農融資擔保集團有限公司（以下簡稱“重慶興農擔保集團”）成立於2011年8月，是經市政府批准同意，由市國資委牽頭組建的一家市屬國有重點企業。集團註冊資本85.9億元，資本金規模居全市擔保行業第一，淨資產超過93億元，綜合實力位於全國擔

2024-04-26 23:23:19

連續兩年！嘉爲藍鯨入選“鑫智獎·2024金融數據創新優秀解決方案”

直達原文：喜訊 | 連續兩年！嘉爲藍鯨入選“鑫智獎·2024金融數據創新優秀解決方案” 4月16日，金科創新社正式揭曉了“鑫智獎·第六屆金融數據智能優秀解決方案評選榜單”。在衆多參評方案中，嘉爲藍鯨一體化和平臺化運維管理解決方案，憑藉一

2024-04-26 23:23:18

Apache RocketMQ ACL 2.0 全新升級

作者：徒鍾引言 RocketMQ 作爲一款流行的分佈式消息中間件，被廣泛應用於各種大型分佈式系統和微服務中，承擔着異步通信、系統解耦、削峯填谷和消息通知等重要的角色。隨着技術的演進和業務規模的擴大，安全相關的挑戰日益突出，消息系統的訪問控

2024-04-26 21:12:10

有遇到過嗎？同樣的規則 Excel 中比Python 結果大

大家好，我是Python進階者。一、前言前幾天在Python白銀交流羣【Jethro Shen】問了一個Python處理Excel數據讀取的問題。問題如下：有遇到過嗎？同樣的規則 Excel 中比Python 結果大？二、實

2024-05-01 09:49:01

這種運行結果裏的10.100000001，怎麼能最快改成10.1？

大家好，我是Python進階者。一、前言前幾天在Python白銀交流羣【無敵劈叉小狗】問了一個Python基礎的問題。問題如下：這種運行結果裏的10.100000001，怎麼能最快改成10.1，所有結果都最多一位小數。二、實現過程

2024-04-30 21:49:58

通義靈碼實戰系列：一個新項目如何快速啓動，如何維護遺留系統代碼庫？

作者：別象進入 2024 年，AI 熱度持續上升，翻閱科技區的文章，AI 可謂是軍書十二卷，卷卷有爺名。而麥肯錫最近的研究報告顯示，軟件工程是 AI 影響最大的領域之一，AI 已經成爲了軟件工程的必選項，也有研究稱開發者每天的事務性工作可

2024-04-30 21:12:20

Apache DolphinScheduler支持Flink嗎？

隨着大數據技術的快速發展，很多企業開始將Flink引入到生產環境中，以滿足日益複雜的數據處理需求。而作爲一款企業級的數據調度平臺，Apache DolphinScheduler也跟上了時代步伐，推出了對Flink任務類型的支持。 Flink

2024-04-30 11:49:27

Spring AI 搶先體驗，5 分鐘玩轉 Java AI 應用開發

作者：劉軍 Spring AI 是 Spring 官方社區項目，旨在簡化 Java AI 應用程序開發，讓 Java 開發者像使用 Spring 開發普通應用一樣開發 AI 應用。 Spring Cloud Alibaba AI 以 Spr

2024-04-29 21:12:12

1 名工程師輕鬆管理 20 個工作流，創業企業用 Serverless 讓數據處理流程提效

作者：嶽洋、陳德全、劉靜娜北京語勢科技有限公司成立於 2023 年 6 月，語勢科技定位爲“智能投資時代的主題入口”，在資管行業從以機構爲核心轉向以用戶爲核心的變革時代，通過打造主題投資引擎，賦能普惠投資一體化，打造以投資者和資管機構爲主

2024-04-28 21:12:22

11個Python循環技巧

本文分享自華爲雲社區《Python中的循環技巧指南》，作者：檸檬味擁抱。當我們處理數據時，有時候需要創建多個列表以存儲不同類型或不同條件下的數據。在Python中，我們可以利用循環來快速、高效地創建這些列表。本文將介紹如何使用循環在Pyt

2024-04-28 10:33:08

24小時熱門文章

最新文章

最新評論文章