讓人費解的統計(股票、幸福指數等)

一.股票分析

於知乎,看到名爲“數據分析之簡易分析股票走勢“的文章,由興奮變成了疑惑。

開篇“谷歌和騰訊的成交量差異巨大,可能也是股價變化的一個原因“與結尾“雖然谷歌和騰訊漲勢幅度相近,但收益率相差極大“的論述,到底是何意?

1.請問長期股價,交易量明細有何關聯?

開篇截圖:

在這裏插入圖片描述

個人看法:
無論是長期價格走勢,還是當日交易價格,與交易量無關;而與開盤、收盤及轉讓、分紅等價格有關,作者的說法有所偏頗。

同時,受自身股價影響,谷歌股價高於騰訊幾倍,交易量自然不一。

2.請問分析幅度,爲何對比差值,而非百分比?

結尾截圖:

在這裏插入圖片描述
在這裏插入圖片描述

據圖示,谷歌約從800漲到1050,跟騰訊約從200漲到400,前者漲了約30%,後者漲了約2倍,漲勢幅度並不相近,相近的只是股票前後差值。

個人看法:
1.若對比幅度,應對比百分比,而非差值;
2.直接對比幅度可估算收益率,不需要具體計算;若要體現具體數值,才需進行運算,文章的估算方法有點籠統。

二、幸福指數分析

在這裏插入圖片描述
圖例是某統計教材關於“生活幸福指數“的案例,其中一結論爲“如果希望婚姻幸福,只要這個婚姻不是基於愛情的,那就還有指望“,個人覺得說法比較偏頗。

理由如下:
1.樣本總體情況:未坦言,是否爲隨機調研,用戶樣本分佈情況,方差及誤差分別是多少;
2.數據時效性:各年代各國家各城市的數據是有差異、有時效性的,不能以某個年代的數據直接作爲現今年代參考,或移接爲該案例的補充總結;且若要作爲補充總結,應具體說明,不然會誤導讀者;
3.數據定義:
(1)關於“愛情“、“個人利益“、“人人結婚“、“幸福“和“不幸福“的具體定義、量化指標等並無詳細說明,很含糊(“人人結婚“此說法已違反常識);
(2)主觀意識對於“幸福“和“不幸福“的定義的映射,到底怎麼體現爲對應的數據指標,無說明;
(3)即使所有數據都是真實的,亦無爭議,但是文中“指望“這個詞,有歧義。這種社會引導並不正確,會引起拜金等不良的社會風氣。
4.數據準確性:受訪人羣百分比只是範圍,非具體數值,不嚴謹;
5.調研方法:未坦言訪談的影響。訪談技巧對數據會有影響,而引導用戶回答,會導致數據偏差,文中沒提及;
6.數據描述:應分階段呈現,不能一概而論。如婚前對比婚後,對比幸不幸福,兩者對比的百分比差異是多少;婚後的不同年齡階段,對比幸不幸福,兩者的百分比漲跌各是多少;
7.統計意義:分析的意義在於尋找及解決問題,但這項統計,並無太大意義。

三、短視頻行業分析

下圖是海馬大數據關於抖音的分析:

1.不同的平臺生態,竟直接對比數值
在這裏插入圖片描述
兩者的生態原本就不同,單單對比數值,無可比性,對比的應該是各種數據指標權重形成的影響力。

應根分析微博各層級的點贊量、粉絲量,對應的影響力是多少;而抖音各層級的點贊量、粉絲量,對應的影響力是多少;對比兩者的上升、下降幅度及趨勢等。

2.素人案例,不應摻雜明星

在這裏插入圖片描述
費啓鳴嚴格來說不是素人,他後期已是明星,有自身經紀人,還曾出演影視劇,背後是有團隊打造。若納入案例,則會產生一定的數據誤差,同時可見平臺沒有足夠的調研。

在這裏插入圖片描述

四、數據量定義

馬蜂窩事件很火,很多人聲援“小聲比比“公衆號,但我對“小聲比比“文中數據量的表述有不同看法:

在這裏插入圖片描述

若對數據進行細分,再統計數量,則總數會超過用戶數。

例如,我國有14億人口,而各單位在統計的時候,對人的各種行爲劃分爲不同的數據種類,以此類推,數據總量超14億。

換而言之,馬蜂窩分類統計數據,再算總量,那麼“2100萬“真實點評“佔數據總量的2.91%“的說法是有可能的。

最後

希望數據分析可以再嚴謹一點,對數據負責。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章