概率論1

寫博客的目的是爲了幫自己理清楚在學習過程中的思路。


char1 基本概念與抽樣分佈


1.數理統計學是在做什麼?

研究如何有效地收集、整理和分析受隨機影響的數據,並對所考慮的問題作出推斷和預測,爲決策和行爲提供依據和建議。

數理統計學的本質就是利用樣本的信息去研究總體,去研究總體的某種性能。

---------《應用統計學》王國富


用 有效的方法收集和分析數據。

有效:①人力物力時間的節省 ② 收集來的數據包含儘可能多的信息,有便於分析的結構 ;數據:帶有隨機性,可以通過某種概率分佈規律來描述。

----------------《數理統計學見識》陳希孺

現在需要注意的關鍵詞有:有效、收集、分析、數據  (後面還有推斷和預測,但是暫時不考慮)

收集就是對數據抽樣的過程。抽樣會產生樣本,我們希望樣本儘可能多地包含總體中的信息。


------->爲什麼要抽樣?

因爲我們關注的是總體的數量指標X,X是一個隨意變量,因而可以求得其概率分佈,我們通過X的分佈或者數字特徵e.g. EX,DX來對總體做判斷。但是總體的measure工作是不太好做或者不太現實的(eg總體數量級可能太大),我們希望借抽樣的方法來簡化性質判斷的過程,從而更好地對總體的性能做研究。所以在抽樣的過程中,我們希望樣本能包含儘可能多的總體信息。


---------->抽樣有什麼問題嗎?

雖然抽樣簡化了總體,但是抽出來的樣本仍然可能是高維的。可以理解成我們將事情從一個無窮維變成了有限維,這是一個很大的進步,但是有限維的維數仍然很大,我們需要繼續進行壓縮簡化。於是,統計量就應運而生。

----------->什麼是統計量?

統計量是樣本的一個連續函數,由樣本唯一確定。將問題從有限高維簡化到了有限低維。

------------>統計量有什麼問題嗎?

高維轉低維的過程中,信息的損失是必然的。也就是說,統計量會帶來丟失掉一部分信息。

------------>統計量丟失信息的問題我們怎麼處理?

我們暫時不去處理信息丟失的問題。因爲統計量所所包含的信息量可能是很大的,是多方面的。我們在研究的過程中更關注的是總體的某一特性,所以我們只要保證這一部分特性不會因爲壓縮而丟失就好了。那也就是說,我們要找到一個與這一特定性質有關的信息量不受損失的統計量。在針對這一個特性時,這個統計量所包含的信息與整個樣本是一樣多的,這樣子損失的就是指與這個特性無關的信息。於是,我們就要去找充分統計量。


PS:這裏想到我們在降維壓縮簡化的時候,雖然會有維度的簡化,但是會產生信息丟失。

PSS:我們常見的統計量有:樣本矩;順序統計量


------------->什麼是充分統計量?

充分統計量就是綜合了樣本中有關參數p的全部信息/最重要信息。或者說,充分統計量就是能把含在樣本中有關總體的信息或者參數一點都不損失的提取出來。


暫停一下:我們目前瞭解了這樣的一個過程:

總體----->樣本----->統計量----->充分統計量

在這個過程中我們是在不斷地壓縮簡化,那伴隨的信息損失我們不去管它,我們只保證我們所關注的那部分信息儘可能多地保留下來,以便研究。


---------------->我們怎麼去找充分統計量或者說怎麼去判斷一個統計量是不是充分統計量?

因子分解定理。





發佈了33 篇原創文章 · 獲贊 2 · 訪問量 8933
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章