學習筆記 | 分析連續數據的數學

在這裏插入圖片描述

01 對於無限的理解

在這裏插入圖片描述

02 極限

“若x無限放大,則函數f(x)無限接近於定數p”可以表示爲:

在這種情況下,p被稱作f(x)的極限值。

03 歐拉常數e

用以下極限來定義的定數e被稱作歐拉常數或自然對數的底。

在這裏插入圖片描述

04 積分:求解面積

積分與面積

y=f(x)與x=a、x=b(a<b)以及x軸圍成的圖形面積S,使用∫與dx表示如下:

05 連續型隨機變量與概率密度函數

  • 取連續型數據的隨機變量X被稱爲連續型隨機變數
概率密度函數
  • 連續型隨機變數X取值範圍爲a≤X≤b時,其概率P(a≤X≤b)爲下圖所示的面積,即
這時,f(x)被稱作X的概率密度函數 。
概率密度函數的性質

(1)f(x)總是≥0 …

注:隨機變數X可取的值,被限定在α≤x≤β的範圍內時,

06 連續型隨機變量的平均值與方差

連續型隨機變數的期待值E(X(或平均值)與方差V(X)

連續型隨機變數X的取值範圍在α≤X≤β,且概率密度函數爲f(x)時

在這裏插入圖片描述
在這裏插入圖片描述

07 正態分佈

正態分佈的平均值與標準差

當X是呈正態分佈N(μ, σ2)的隨機變數時:平均值:E(X)=μ

標準正態分佈

當隨機變數X呈正態分佈時,假設隨機變數Z滿足

則隨機變數Z呈N(0,1)的標準正態分佈

08 正態分佈表

在這裏插入圖片描述

標準正態分佈重要的性質

  • 隨機變數Z呈標準正規分佈N(0,1)時,-1.96≤Z≤1.96的面積佔全體面積的95%。

09 什麼是推測統計

推測統計分爲兩個重要模塊

  • 一是通過研究樣本對母集團做出概率預測的“推算”;
  • 二是針對已知數據的差值,找出產生差值原因的“檢驗”。

使用標準正態分佈進行“推算”

“μ的95%置信區間是α≤μ≤β” 是指:“在母集團中隨機觀測與這一次相同數量的數據,且用同樣的方式重複確定置信區間的話,那麼,在100次中大概有95次,μ的值落在a以上b以下的範圍內。"

使用標準正態分佈進行“檢驗”

  • 統計學中的檢驗是一種合理判斷數據是否存在異常的手段。
  • 首先,有95概率發生的事件被視爲“發生概率較大”的事件。以這一標準進行的檢驗被稱爲 “有意水準5%驗證”

在已知母集團呈標準差爲σ的正態分佈時,建立“真正的平均值爲μ”這一假說,並進行“有意水準5%驗證”後,如果針對被觀測的數據X來說:

以上不等式成立的話,我們就說“接受原假設”。反之,不等式不成立時,就說“拒絕原假設”。
  • 有名的t檢驗是利用了t分佈(由於在實際工作中,標準差(σ)是未知的,常用S作爲σ的估算值,爲了與μ變換區別,稱爲t變換,統計量t值的分佈稱爲t分佈。)進行的檢驗。而呈正態分佈的母集團中抽出的數據樣本呈標準正態分佈(當數據量在數百甚至數千以上時,t分佈與標準正態分佈幾乎一致)就十分接近於t分佈。
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章