文本識別的起始應用與展示——詞雲

原創

2020-06-15 21:59

from wordcloud import WordCloud 	 #詞雲本雲
import matplotlib.pyplot as plt   #作圖利器
import jieba
import pandas as pd
import matplotlib.image as mpimg
import numpy as np 
from PIL import Image

text= pd.read_excel('C:/Users/zhangpeng/Desktop/詞雲.xlsx',header=0)

cnt=''
for rows in text[1]:
    cnt=cnt+rows 

cnt.replace(' ','')

wordlist = jieba.cut(cnt,cut_all=False)

wl='/'.join(wordlist)

imreceive=np.array(Image.open('C:/Users/zhangpeng/Desktop/詞雲.png'))

wc = WordCloud(
    background_color="white",    #背景顏色
       
    max_words=3000,       # 設置最大顯示的詞雲數
         
    font_path='C:\Windows\Fonts\STHUPO.TTF',     # 這種字體都在電腦字體中，一般路徑
    #     height= 1200,
    #     width= 1600,
       
    max_font_size=200,      # 設置字體最大值
    
    random_state=40,      # 設置有多少種隨機生成狀態，即有多少種配色方案
    mask=imreceive  #設置了mask 高和寬就沒作用了
    )
 
myword = wc.generate(wl)  # 生成詞雲
   
plt.imshow(myword)     # 展示詞雲圖
plt.axis("off")
plt.show()
wc.to_file('C:/Users/zhangpeng/Desktop/py_book.png')

任何問題可在評論區溝通~

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

愛奇藝公有云對賬標準化實踐

01 背景雲成本系統化管理公有云作爲基礎架構部核心資源之一，其成本佔比逐年上升，企業對於公有云成本實施精細化管理的需求越來越高。相較於私有化部署主要關注服務器、網設、帶

愛奇藝技術產品團隊

2024-06-08 02:19:16

低代碼：加速企業數字化轉型的利器

隨着企業數字化轉型步伐的加快，低代碼開發平臺迅速成爲市場的焦點。**憑藉其能簡化開發流程、縮短交付時間和降低成本等優勢，**低代碼已經贏得了企業和開發人員的廣泛認可，已成爲推動企業數字化轉型、提高企業創新效率、競爭力的關鍵工具。本文將詳細介

2024-06-07 21:18:49

史上最強 AI 翻譯誕生了！拳打穀歌，腳踢 DeepL

CoT 推理範式默認情況下，大語言模型通常是直接給出問題的最終答案，中間推理過程是隱含的、不透明的，無法發揮出大模型最極致的理解能力。如果你用它來充當翻譯，可能效果和傳統的機器翻譯也差不了太多。如果我們給大模型設計一個合理的提示詞，控制

2024-06-07 21:16:43

國內首場 Unstructured Data Meetup 收官！GenAI 如何連接非結構化數據？

近日，國內首場 Unstructured Data Meetup 圓滿收官！本次 Meetup 由向量數據庫領軍者 Zilliz 創辦的，同時還邀請到來自 MOSS & OpenMOSS、螞蟻集團、LangChain 中國社區的技術專

2024-06-06 14:16:06

界面控件DevExpress WinForms的流程圖組件 - 可完美複製Visio功能（二）

DevExpress WinForms的Diagram（流程圖）組件允許您複製Microsoft Visio中的許多功能，並能在下一個Windows Forms項目中引入信息豐富的圖表、流程圖和組織圖。 P.S：DevExpress Win

2024-06-04 12:32:12

暗水印——變換域DCT水印算法（一種通用性強，能有抵禦攻擊的手段）

引言隨着計算機和網絡技術的飛速發展，信息的安全保護問題日益突出。數字圖像、音頻和視頻等多媒體數字產品愈來愈需要一種有效的版權保護方法——水印技術，通常用於保護知識產權、防止未經授權的訪問、作弊等。廣義上可以把水印技術劃分爲四大類：

2024-06-04 12:09:29

一文搞懂DevOps、DataOps、MLOps、AIOps：所有“Ops”的比較

引言近年來，"Ops"一詞在 IT 運維領域的使用迅速增加。IT 運維正在向自動化過程轉變，以改善客戶交付。傳統的應用程序開發採用 DevOps 實施持續集成（CI）和持續部署（CD）。但對於數據密集型的機器學習和人工智能（AI）應用，精

2024-06-07 14:08:38

盤點一個Pandas數據分組的問題

大家好，我是Python進階者。一、前言前幾天在Python白銀交流羣【上海新年人】問了一個Pandas數據分組的問題，問題如下： list1 = '電子稅票號碼徵收稅務機關社保經辦機構單位編號費種徵收品目徵收子目費款所屬

2024-06-07 10:02:02

sublime text4 定製記錄

經過測試sublime text4用於python開發時，使用pyright做爲lsp服務比較好，能夠提示出numpy的各種函數。但有時提示也太多了，類似於idea，會把所有能查到的變量都提示出來，我更需要的是類似 vs.net 那樣的精確

2024-06-07 01:14:07

sublime text定製

經過測試sublime text4用於python開發時，使用pyright做爲lsp服務比較好，能夠提示出numpy的各種函數。但有時提示也太多了，類似於idea，會把所有能查到的變量都提示出來，我更需要的是類似 vs.net 那樣的精確

2024-06-07 01:14:04

無需搭建環境，零門檻帶你體驗Open-Sora文生視頻應用

本文分享自華爲雲社區《Open-Sora 文生視頻原來在AI Gallery上也能體驗了》，作者：碼上開花_Lancer。體驗鏈接：Open-Sora 文生視頻案例體驗不久前，OpenAI Sora 憑藉其驚人的視頻生成效果迅速走紅，在

2024-06-06 10:56:52

有沒有python在flask框架下開發的實際案例？

大家好，我是Python進階者。一、前言前幾天在Python鑽石交流羣【進擊的python】問了一個Python web開發的問題，問題如下：各位大佬，有沒有python在flask框架下開發的實際案例？？？求分享二、實現過程 git

2024-06-06 10:01:59

[oeasy]python020在遊戲中體驗數值自由_勇闖地下城_終端文字遊戲

繼續運行 ?* 回憶上次內容上次使用shell環境中的命令命令作用 c

2024-06-05 12:31:14

Python網絡爬蟲要清理cookies 才能再爬，有啥解決方法嘛？

大家好，我是Python進階者。一、前言前幾天在Python鑽石交流羣【大寫一個Y】問了一個Python基網絡爬蟲的問題，問題如下：大佬們請教個問題我做了個在某眼查抓地址數據的爬蟲，程序中做了隨機2-5秒的循環延時，現在大概爬8

2024-06-05 10:02:06

自動化Reddit圖片收集：Python爬蟲技巧

引言 Reddit，作爲一個全球性的社交平臺，擁有海量的用戶生成內容，其中包括大量的圖片資源。對於數據科學家、市場研究人員或任何需要大量圖片資源的人來說，自動化地從Reddit收集圖片是一個極具價值的技能。本文將詳細介紹如何使用Pyth

2024-06-05 00:06:19

24小時熱門文章

最新文章

最新評論文章