中學生都喜歡什麼樣的老師?抓取知乎高贊回答告訴你

今天一位學校老師提了這麼一個需求:想知道當前初中學生都喜歡什麼樣的老師,並可以用詞雲的方式直觀展示出來。

要製作詞雲呢,需要有一定數量的關鍵詞,以及權重值(或者出現頻率)。而要得到這些關鍵詞、權重值,必須要有一定量的內容信息,總不能我們自己瞎編瞎寫吧~~

那今天就來和大家分享一下永恆君的整個操作過程,希望對大家能有啓發和幫助。

1、獲取內容信息

這一步是基礎,獲取的方式有很多樣,但無外乎就是兩類

直接內容,如給學生調查問卷,整理成稿

間接內容,如網上搜集相關資料文章、相關問答

永恆君採取的是第二種,直接從知乎上面找到相關內容的高贊回答的問題,然後將該問題的所有答案都抓取下來。

如這個問題,相關性就比較高,瀏覽量和回答人數也還算可以。(當然你也可以選擇其他你認爲更合適的問題。)

接下來就要使用我們的web scraper來抓取數據了,配置很簡單,主要就是配置Element Scroll down就好了。

抓取到的數據,經過整理得到想要的回答內容如下:

將上述抓取到的數據內容保存到goodteacher.txt備用,這樣我們就得到了最重要的基礎數據。

2、獲取關鍵詞和權重(詞頻)

這一步需要有一點編程的能力,永恆君這裏使用python的jieba庫,

提取goodteacher.txt內容的動詞、形容詞之後,經過簡單的統計整理,生成keywords.xlsx,得到如下的結果:

當然,這其中還包含了一些無效、或者對主題無意義的詞,可以按需求進行適當的修改。

3、生成詞雲

有了上述的關鍵詞文件keywords.xlsx之後,生成詞雲的方式就有很多了,網上能搜到許多的在線詞雲網站,但是一般都會有這樣那樣的限制,感覺不方便。

永恆君這裏依然使用的是python,通過調用wordcloud庫,可以非常方便的生成想要的詞雲,沒有這樣那樣的限制。

最後生成的兩種詞雲圖如下:

可以看到,初中學生喜歡的老師大致畫像是幽默、溫柔、尊重人、能開玩笑、有趣等等。

其中溫柔排這麼前,是否說明現在的初中女老師居多呢?

你可能還會想看:

不寫代碼玩轉爬蟲實例(6) – 抓取知乎搜索的數據

用Python爬取28010條《隱祕的角落》評論,我發現了這些…

python助你快速讀懂文字內心!

什麼情況?python這次居然被web scraper比下去了

那些高大上的詞雲圖,可以這樣快速做!

歡迎交流!

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章