數據分析實戰——有哪些讓你不得不服氣的神邏輯(知乎)

1,前序

本篇文章爬取了知乎上的 有哪些讓你不得不服氣的神邏輯? 的答案,一共爬取了100條數據左右,分別收集了答題者名字、粉絲數量、性別、頭像圖片鏈接,答案評論數、點贊數等方面數據,剛好自己最近在學 matplotlibpandas; 就利用這些數據做了個簡單分析,鞏固一下知識!

2,數據可視化與分析

2.1 答案點贊數與評論數正相關

2.png

對於知乎上問題的答案來說,點贊代表對答案內容的認同,點贊數越多表示這個答案越受歡迎;這裏針對於點贊數,首先做了一個與評論數相關的可視化圖標,從圖表來看,評論數跟點贊數被擬合在一條一元一次函數上,呈現正相關走向

2.2 對於一個問題的回答熱度,最高點並不是在問題剛出來時

1.png

從圖表上來看,一個問題剛被提出來的時候,回答者並不多,但隨着回答數量不斷增加,問題的熱度也在逐漸增高,回答者也會越來越多,期間會達到一個頂峯,達到頂峯之後熱度逐漸下降,最終達到平穩期,就類似於圖表的右端處,答題者數量基本不再變化

2.3 答題者的粉絲數與內容受歡迎程度關係不大

先解讀一下這個圖標,橫座標是答案點贊數排名(從第一到第三十);縱座標指的是對應答題者的粉絲數量

1111.png

對於小標題中結論: 粉絲數量與答案受歡迎程度關係不大 ,只是我的一個猜想,不能確定這個分析對不對;可能有同學會反駁說,圖表在開始的一段時間展示的是隨着排名減少粉絲量也在逐漸減少,說明,粉絲量多的答主,其答案受到的歡迎程度也會越大

如果對於科普性的問題這種關係是成立的,答主粉絲量越多,其答案受歡迎程度也越高;但是本次分析的問題 :有哪些讓你不得不服氣的神邏輯 卻不在這一列;

並且,粉絲量大也有可能是在回答完這個問題之後,由於問題的比較受歡迎從而帶來的粉絲,而且這個問題提出時間在18年,太早了,選取的分析對象並不是太好

2.4 點贊數與答主的性別關係不大,靠的是內容取勝

111.jpg

上面這個表把採集的答案中,對於點贊數排了個序,取出了前20名,並且分別對於回答者不同性別用不同顏色做了標註,對應關係分別爲:紅色—女、藍色—男、灰色—未知

柱狀圖上顯示來看,答主性別與答案點贊數排名並沒有太大關係;如果仔細看一下點贊數,其實差別不大,暫且不分析未知性別,點贊排名高的不僅男性有女性也有,雖然前20名女性相對於男性佔比較少,但是點贊總數加起來絲毫不弱;因此對於一個答案的質量好壞,性別並不佔優勢

3,精彩答案

這一部分我從點贊數排名比較高的幾個答案中,並且選取了幾條篇幅不太長的,讓大家細品一下:

我:“爸,同學約我出去玩”
爸:“哪?”
我:“xx路”
爸:“不行,太亂了。想去,讓你媽陪你去。”
我:“哦”
……
以上對話重複多次以後
……
突然有一天
爸:“你說你,那麼長一個假期,就沒一個同學找你出去玩,你這交際能力也太差了xxxxxxxxxxxxxxxx”(此處省略無數教導)
我:“……”
爸:“要學着跟同學交往,知道不”
我:“那我能週末去跟同學看電影嗎?”
爸:“哪”
我:“xx”
爸:“從家又不是不能看,最近外邊多亂”
我:“⊙∀⊙!哦”

簡而言之,我從小到大和我爸總會處在這個循環中 —— 同學邀我出去玩,我爸不允許,我無奈拒絕同學。拒絕多次之後沒有同學找我,我爸開始各種嫌棄我的交際能力,說我成天玩手機都玩傻了。然後偶然又會有不瞭解情況的新朋友約我,然後被我爸嚴詞拒絕,繼續重複以上情況。
我爸這邏輯,從小學折磨我到現在大二,我真的服氣了。

各位厲害,小女子掩耳盜鈴地把地點去掉了,就當心裏安慰了。各位看破不說破哦。謝啦!喵~

(承蒙厚愛,不勝感激,謝絕轉載)


相親。

男:我沒房。

女:沒事,可以先租着。

男:我沒車。

女:坐公交,走路環保健康。

男:我也沒存款。

女:以後會更好的,要相信自己。

男:那我們。。。?

女:哦對了,你喜歡什麼顏色?

男:紅色。

女:那不好意思,我喜歡黃色,我們不合適。

作者: **戴綵衣**


我就放個圖片吧

1.jpg

作者 :楊高聰


只有娘炮,才幹女人。真男人,就應該幹男人。

作者 Siyix

4,照片牆

最後放上一張照片牆,這個照片牆是由採集數據中答題者的圖像繪製而成的,照片牆的就是 劉看山的輪廓,關於照片牆的製作方法,可以參考之前的文章:
精美的照片牆,python也能做!
234.png

文中涉及的所有源碼、數據獲取方式,關注微信公衆號:Z先生點記,後臺回覆關鍵詞:神邏輯 即可。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章