當列表已經不能滿足人們對信息的呈現時,標籤雲這種展現方式很好地滿足了人們關注重點、突出趨勢、顯示偏好的瀏覽需求,本文簡單介紹下使用python生成標籤雲。
有兩種方式:
1. 自己實現
2.使用現有庫,主要是pytagcloud
本文主要是利用pytagcloud這個庫進行標籤雲的生成。首先需要安裝它,不過在此之前如果你的機器上沒有安裝pygame和simplejson兩個python包,則需要先下載安裝
他們;這三個包安裝完成以後,使用就很簡單了,例子代碼如下:
1 from pytagcloud import create_tag_image,make_tags
2 from pytagcloud.lang.counter import get_tag_counts
3
4 TEXT = '''
5 python(2) compiler(1) olap(1)
6 recommender-System(2) crawler(1) python networkx(1))
7 sinaWeibo(1) dremel(1) python-multi-thread(1) path(1)
8 mobile-Internet(1) hadoop hbase HDFS zookeeper(1) meachine-Learning(1)
9 similarity(1) hbase zookeeper(1) openSource(1)
10 python(2) python-multi-thread(1) mahout itembased-CF(1)
11 Levenshtein(1)
12 auto-Check(1) mahout itembased(1) Real-time data analysis
13 python(2) recommender-System(2) python recommender-system(1)) real(1)
14 mapreduce shuffle(1) video(1)
15 ant(1) Native Hadoop Libraries(1) search(1)
16 bigtable(1) nc(1)
17 recommender-system(1) bigData(1) data-analysis(1)
18 '''
19 tags = make_tags(get_tag_counts(TEXT), maxsize=150)
20 create_tag_image(tags, 'cloud_large.png', size=(900, 600))運行後在當前目錄下會生成一個cloud_large.png結果文件,結果如下:
除了生成圖片外,pytagcloud還可以生成html形式的標籤雲,可以用來與用戶互動,可以參考pytagcloud的文檔。