【573→數據】數據思維

1

對於“數據究竟是什麼"這個問題,我們可以從三個方面來理解:

1,數據是對現實世界實體的映射,是在某種方法之下對實體的數字化表達。

2,數據需要元數據來說明、描寫和記錄它的關鍵特徵。

3,不要把數據容器和數據本身混淆,也不要以爲數據自動蘊含信息。數據中蘊含什麼信息,需要有數據思維的人專門處理。

2

1,對數據精度的過分迷戀是一件要警惕的事情。根據目標確定需要什麼精度的數據,纔是好的數據思維。

2,估算能讓我們在知道很少信息的情況下得出相對靠譜的數據。估算時要做到兩點一一敢於不精確,但不能太離譜。

3,"二八法則”和"1%法則"是兩個非常好用的估算技巧。

3

如何通過練習提高自己對數據的敏感度呢?教你三個方法

一,量轉型。思考、談論和使用一個東西時,有意識地把過去定性的方式轉變爲定量的方式。

二,量定義。如果一個事物的性質是用某一方面的量來定義的,就搞清楚它具體是怎麼定義的。

三,對應值。在量定義的基礎上,爲事物確定一個明確的量的標準。

4

1,背景不同,數據代表的意義就不同。只有確定了數據的背景,才能準確理解數據的意義。

2,掌握數據的背景可以幫助我們理解什麼信息呢?

第一,理解事物的屬性;

第二,理解事物的相對情況;

第三,理解當事人的意圖。

5

單一的一個數據包含的信息也不是那麼少,我們需要把隱含的信息挖掘出來。教你三個方法

1,數學推斷。先利用數學知識做出假議,然後進行推斷。

2,邏輯推理。從各個領域的規則和限制條件出發,進行合理化推測。

3.切換視角。在不同的視角、關係下觀察數據,數據就會發出不同的隱含信息。

6

1,如果從人這一端來看,人的生物性和人與人之間的差異會導致我們在面對同樣的數據時,產生不同的感覺、解釋和觀點。

2,人與人的差異主要包含三個方面一,生理傾向差異;二,文化屬性差異;三,價值立場差異。

3,由於人自身的差異而導致對數據感知的差異,既是正常的,也是要警惕的。一定不要把自己的特點當成全人類的特點,大家對數據的感知可能真的不太一樣。

7

1,對數據精度的過分迷戀是一件要警惕的事情。根據目標確定需要什麼精度的數據,纔是好的數據思維。

2,估算能讓我們在知道很少信息的情況下得出相對靠譜的數據。估算時要做到兩點——敢於不精確,但不能大離譜。

3,"二八法則”和"1%法則"是兩個非常好用的估算技巧。

8

1,數據、變量和表格是三個不同層次的概念。數據是一個變量的具體值,變量代表一個維度的信息,表格是各種維度信息的集合。

2,數據一共有四種類型,分別是類別數據、次序數據、間隔數據和比例數據,分別對應唐僧、沙和尚、豬八戒和孫悟空。

3,數據類型不同,處理數據的方法就不同。

9

1,測量的目標就是爲了得到一組指標。這樣一來,我們就可以用這組指標描述一個事物了。

2,爲了全面把握一個事物,測量時可以用維度拆分的方法,具體要遵循兩個原則一邊際效應最大化原則和可靠性原則。

3,爲了保證測量的就是我們想測量的,我們需要用各種方法進行確認,考慮關聯、結構和完備性是三個常用的方法。

10

1,只有概率樣本才能確保全面反映總體的情況。

2,現實工作中,非概率樣本也可以幫我們應對一些複雜的、概率樣本難以覆蓋的情況。

3,抽樣調查的結果是一個有限制條件的範圍,而不是一個單一的數值。

11

1,問卷的核心是提問,而不是問題出現在哪種媒介和哪個場景中。

2,問卷的含金量在於概念的操作化,也只有操作化才能打敗操作化。

3,設計問卷時,問題必須讓答題者準確理解,而且要注意提問方式。你得到什麼取決於你怎麼問。

12

1,實驗法是通過操縱自變量、控制無關變量、觀測因變量這樣的邏輯,既找到了因果性,也能知道原因的效果大小。

2,實驗法特別適合範圍有限、界定明確的概念和假設。因此,實驗法最大的問題就在於結論的外推,一不小心就會把結論的適用範圍錯誤地擴大。

3,走出實驗室做實驗,讓實驗控制與真實的社會生活接近,會讓實驗的結論更可靠。

13

1,大數據帶來了新的思維方式和利用方式,不僅衝擊了傳統的數據收集方式,也極大地拓展了我們的能力,我們必須與時俱進。

2,大數據擁有海量性、持續性和不反應性等優勢,但使用時也有很多要避開的坑。

3,善於把大數據和小數據相結合,纔是我們利用數據的最高境界。

14

1,尋找表徵之前必須先真正理解問題,並反思你的認知。這樣才能發揮數據技能的效力。

2,在面對複雜問題時,我們需要隨着信息的增加而不斷調整表徵方向。

3,當沒有現成的數據能表徵我們想要的東西時,可以自己構造新指標。雖然有風險,但值得嘗試。

15

1,分類就是按照量的標準把一個總體分成幾組,必須保證組內差異小,組間差異大。

2,分類的結果一定是概率性的,有出錯的可能。

3,當沒有標準答案,僅僅能通過分析數據來分類時,最重要的就是建立數據與現實世界的連接。只有這樣,才能確保我們的發現是合情合理的。

16

1,所謂的分解,就是把影響一個複雜事物的各種複雜糾纏的因素分開。通過分解,可以濃縮信息探究本質。

2,要建立分解的意識,不要一見到差異,就想當然地認爲都源於一個單一因素。

3,分解的辦法有很多種,因子分解只是其中的一種。每種分解方法都有各自的優點、缺點和適用條件。如果不確定你要解決的問題應該用哪種方法,可以找數據專家諮詢。

17

1,兩個變量之間因果關係成立的必要條件有三個:一,兩個變量有相關;二,兩個變量有先後;三,兩個變量的關係不能被第三個變量解釋。

2,因果關係的尋找是一項重大挑戰,沒有保證成功的一般法則。其中,最大的困難就在於反事實難題的存在。

3,面對現實問題,我們能做的就是猜測、驗證和迭代。如果對因果關係的追尋有一個總原則的話,那就是保持謙卑。

18

1,真正利用數據指導決策,需要做好三步:理解挑戰,建立模型,量化變量。

2,建立決策模型時要學會轉換思路,從解決一個問題轉換成理解一個機制。只有徹底理解了挑戰背後的機制,建立的模型纔是可靠的。

3,一切事物皆可量化,而量化的實質就是降低不確定性。

19

1,數據可視化是基於數據的,由數據驅動生成的圖像,幫助受衆看見並理解數據當中隱含的信息。

2,好的數據可視化作品要兼顧高效和美觀。傳達信息快速有力,過程又充滿愉悅感和美感。

3,數據可視化是一個重要的探索工具,能讓我們發現其他手段難以發現的新信息。

20

1,數字不會欺騙,是人會欺騙。西方有句俗語說,Don't hate the player,hate the game(別去恨玩家,要恨恨遊戲).

2,誤導的具體方法很多,不可能完全舉例說明,建議你發現一個就記下來一個,經驗多了,就會提高識別的能力和速度。

3,遇到別人用數據得出的論斷,建議先問自己五問題:誰說的?他是如何知道的?遺漏了什麼?是否有人偷換了概念?這個資料有意義嗎?

21

我認爲數據思維是現代人的基本素養之一,地位與語文素養一樣。理由有三

第一,這個世界是量的,只有通過量オ可能接近質;

第二,只有通過量的競爭,才能達成質的暫時共識;

第三,雖然定量的方法不完美,但我們只能依賴它。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章