統計學概述
什麼是統計學
統計學
統計學是數據的科學,它包括數據的收集、分類、概括、整理、分析以及解釋。
統計學通常應用於兩種類型的問題:
1. 概括、描述以及探索數據,即描述性統計
2. 利用樣本數據推斷被選取樣本的數據集的性質,即推斷統計學
描述性統計
致力於數據集的整理、概括以及描述的統計學分支稱作描述性統計。
比如美國的人口普查,它涉及數據集的收集,目的在於反映生活在美國的人民的社會經濟特徵。
推斷統計學
利用樣本數據對一個很大的數據集作出推斷的統計學分支稱作推斷統計學。
有時數據集刻畫的是一種感興趣的現象,這樣的數據集在自然狀態下是無法得到的、代價昂貴或者耗費時間才能獲得的。在這種情況下,我們得到數據的一個子集(稱作樣本),利用這個樣本信息來推斷它的性質。
爲了確定數據集的性質,我們從中抽樣,然後利用樣本推斷數據集的性質。
統計學的基本要素
- 統計總體是我們感興趣的目標的數據集(通常很大,有時是概念上的)
- 樣本是取自目標總體的數據子集
- 測量值採集的對象(例如,人、事物、交易、標本或者事件)稱作試驗單位
- 變量是單個試驗單位的特徵或性質
- 可靠性度量是關於統計推斷不確定程度的一個陳述(通常是定量的)
描述性統計問題的4要素
- 感興趣的總體或樣本
- 被研究的一個或多個變量(總體或樣本單位的特徵)
- 表格、圖形或者數字概括工具
- 確定數據類型
推斷性統計問題的5要素
- 感興趣的總體
- 被研究的一個或多個變量(試驗單位的特徵)
- 試驗單位的樣本
- 基於包括在樣本中的信息對總體的推斷
- 推斷的可靠性度量
數據類型
數據分爲定量和定性兩種類型。
數據類型更細緻的劃分是名義、次序、區間和比率數據。名義數據、次序數據是定性數據,區間數據和比率數據是定量數據。
定量數據
定量數據表示事物的數量或個數。
定性數據
定性數據沒有量的解釋,即它們只能以類型分類。