原创 [統計學筆記] 必須要掌握的統計學基本概念和術語(更新中)

必須要掌握的統計學基本概念和術語 統計和處理數據是一門科學。統計學是收集、分析、表述和解釋數據,並從數據中得出結論的科學。 要學好統計學必須掌握和理解下面的基本概念和術語: 分類數據 順序數據 數值型數據 界面數據 時間序列數據 總體和樣

原创 什麼是抽樣平均誤差?

什麼是抽樣平均誤差? 抽樣平均誤差是抽樣平均數(或抽樣成數)的標準差,它反映抽樣平均數(或抽樣成數)與總體平均數(或總體成數)的平均差異程度。 由於從一個總體可能抽取多個樣本,因此抽樣指標(如平均數、抽樣成數等),就有多個不同的數值,因而

原创 什麼是統計學中的 Standard Error ( SE )?

什麼是統計學中的 Standard Error ( SE )? 我們來看一段英文解釋:The standard deviation of a sampling distribution is called as standard erro

原创 統計學中的標準差(SD)和 平均值的標準誤差(SEM)的區別

統計學中的標準差(SD)和 平均值的標準誤差(SEM)的區別 先來看一個解釋: The standard deviation (SD) represents variation in the values of a variable, w

原创 什麼是抽樣誤差?

什麼是抽樣誤差? 在抽樣檢查中,由於用樣本指標代替全及指標所產生的誤差可分爲兩種:一種是由於主觀因素破壞了隨機原則而產生的誤差,稱爲系統性誤差;另一種是由於抽樣的隨機性引起的偶然的代表性誤差。抽樣誤差僅僅是指後一種由於抽樣的隨機性而帶來的

原创 [統計學筆記] (十)一元線性迴歸

(十)一元線性迴歸 基本術語 迴歸這一術語最早來源於生物遺傳學,由高爾頓(Francis Galton)引入。 迴歸的解釋:迴歸分析是研究某一變量(因變量)與另一個或多個變量(解釋變量、自變量)之間的依存關係,用解釋變量的已知值或固定值來

原创 [統計學筆記] (十二)時間序列分析和預測

(十二)時間序列分析和預測 時間序列數據用於描述現象隨時間發展變化的特徵。 時間序列(times series)是同一現象在不同時間的相繼觀察值排列而形成的序列。經濟數據大多數以時間序列的形式給出。 時間序列及其分解 時間序列可以分爲平穩

原创 [統計學筆記] 統計學計算題選講

統計學計算題選講 第1題 某班級學生物理課程考試成績分別爲:              68  89  88  84  86  87  75  73  72  68              75  82  97  58  81  54

原创 [統計學筆記] (八)分類數據分析

(八)分類數據分析 首先思考問題: 1. 爲什麼要對數據進行分類?如何對數據分類? 2. 數據分類後,如何對分類數據進行分析? 數據分類 分類變量的結果表現爲類別,例如:性別 (男, 女) 各類別用符號或數字代碼來測度 使用分類或順序

原创 [統計學筆記] 13. 概率與概率分佈

概率與概率分佈 概率是度量偶然事件發生可能性的數值。假如經過多次重複試驗(用X代表),偶然事件(用A代表)出現了若干次(用Y代表)。以X作分母,Y作分子,形成了數值(用P代表)。在多次試驗中,P相對穩定在某一數值上,P就稱爲A出現的概率。

原创 [數據分析學習筆記] 數據探索分析(EDA)需要了解的統計學基礎

Exploratory Data Analysis(EDA) Exploratory Data Analysis(EDA)是指對已有數據在儘量少的先驗假設下通過作圖、製表、方程擬合、計算特徵量等手段探索數據的結構和規律的一種數據分析方法,

原创 [機器學習筆記] 數據標準化方法

數據標準化方法 數據標準化 在數據分析之前,我們通常需要先將數據標準化(Normalization),利用標準化後的數據進行數據分析。數據標準化也就是統計數據的指數化。數據標準化處理主要包括數據同趨化處理和無量綱化處理兩個方面。 目前數據

原创 ModuleNotFoundError: No module named 'graphviz' 的解決方法

ModuleNotFoundError: No module named 'graphviz' 的解決方法 在 Jupyter 中執行下面的代碼時,報錯,提示:ModuleNotFoundError: No module named 'g

原创 [機器學習] ModuleNotFoundError: No module named 'prettytable' 錯誤的解決

ModuleNotFoundError: No module named 'prettytable' 錯誤的解決 PrettyTable 是python中的一個第三方庫,可用來生成美觀的ASCII格式的表格。 遇到 ModuleNotFo

原创 [統計學筆記二] 收集數據

[統計學筆記二] 收集數據 數據是什麼? 數據、信息和知識被廣泛的用於計算機科學領域。 數據是信息的載體,信息是數據的語義解釋。數據是得出結論的前提。信息是處理後的數據,爲實際問題提供答案。 當我們增加一種關係或者一個關聯時,數據就成爲信