原创 [統計學筆記](五)統計量及其抽樣分佈

統計量 統計學中最主要的提取信息的方式就是對原始數據進行一定的運算,得出某些代表性的數字,以反映數據某些方面的特徵,這種數字稱爲統計量。用統計學的語言表述就是:統計量是樣本的函數,它不依賴於任何未知參數。 推斷統計學的重要作用就是,通過從

原创 [統計學筆記] (十三)指數分析(1)

(十三)指數分析(1) 統計指數簡稱指數,有廣義和狹義之分。廣義地講,任何兩個數值對比形成的相對數都可以稱爲指數;狹義地講,爲了反映某一社會經濟現象而產生的兩組有關聯的數值對比形成的相對數稱爲指數。 指數分析法是利用指數體系分析各影響因素

原创 [敏捷開發實踐] 爲什麼開發人員不願意寫單元測試?

爲什麼開發人員不願意寫單元測試? 單元測試是專業開發人員確保真正完成編程任務的有效手段之一。但是實際開發中,絕大多數開發人員卻非常牴觸寫單元測試,這又是很殘酷的現實。開發人員有100個理由不寫單元測試。我觀察了超過20個項目的實際開發過程

原创 [敏捷開發實踐] 端到端測試你瞭解多少?

端到端測試你瞭解多少? 端到端測試是一種軟件測試方法,用於從開始到結束測試應用程序流。此測試的目的是模擬真實的用戶場景,驗證被測系統及其組件的集成和數據完整性。 它自始至終都是在實際場景下執行的,比如應用程序與硬件、網絡、數據庫和其他應用

原创 [敏捷開發實踐] 敏捷團隊如何應對Product Owner不斷變化的需求

敏捷團隊如何應對Product Owner不斷變化的需求 敏捷項目推進中,經常會遇到 Product Owner 提出新的需求事項,或者在原來的Product Backlog上擴充範圍的情況。 最可怕的情況是在Sprint迭代即將結束時,

原创 數據挖掘(Data Mining)和數據分析(Data Analysis)的對比

數據挖掘和數據分析 現在信息世界中,每天生成的數據量呈指數級增長。獲取這些數據的過程並不複雜,因爲可以使用的方法很多。然而,從這些數據中獲取有意義的信息是非常複雜和耗時的。 收集的數據通常存儲在數據倉庫中,數據倉庫是保存從各種來源收集的數

原创 機器學習(Machine Learning)和傳統的數據統計分析(Data Statistics)有什麼區別?

機器學習(Machine Learning)和傳統的數據統計(Data Statistics)有什麼區別? 機器學習 強調預測 通過預測性能評估結果 關注過度擬合而不是模型本身的複雜性 注重表現 通過在新數據集上的性能獲得可概括性 通常,

原创 統計學、統計學習和統計推斷之間的關係

統計學、統計學習和統計推斷之間的關係 什麼是統計學? 百度百科的定義: 統計學是應用數學的一個分支,主要通過利用概率論建立數學模型,收集所觀察系統的數據,進行量化的分析、總結,並進而進行推斷和預測,爲相關決策提供依據和參考。它被廣泛的應用

原创 Data Science 到底是什麼?

最近被問到了一個問題:Data Science是幹什麼的? 儘管一直在說Data Science,但是還真的沒有深入的、認真的研究過它的起源。 Data Science,數據科學,一般的解釋是: 數據科學僅是一種概念,它結合了統計學、數

原创 [統計學筆記] (十三)指數分析(2)

(十三)指數分析(2) 指數體系與因素分析 指數體系是指由三個或三個以上的具有內在聯繫的指數構成的有一定數量對等關係的整體。指數體系的形式不是隨意的,而是由現象間客觀存在的必然聯繫決定的。例如, 產品產值=產品產量×產品價格 商品銷售額=

原创 [數據挖掘與預測分析] 單變量統計分析思考問題

單變量統計分析思考問題 1. 解釋統計推理的含義 統計推理亦稱“統計概括”。由樣本具有某屬性推出總體具有某屬性的推理。 如爲了解全國住戶對電視機的需要量,就根據收入的多少等情況而把住戶分成若干類(若干層次),從每類中再隨機抽出一定數量的住

原创 [統計學筆記] 參數估計和假設檢驗計算題精講

參數估計和假設檢驗計算題精講 習題1 設某產品的指標服從正態分佈,它的標準差 σ 已知爲150,今抽了一個容量爲26的樣本,計算得平均值爲1637。問在5%的顯著水平下,能否認爲這批產品的指標的期望值 μ 爲1600? 解答: 根據題意知

原创 [統計學筆記] 方差分析表的解讀

方差分析表的解讀 方差分析表(analysis of variance table)是指爲了便於進行數據分析和統計判斷,按照方差分析的過程,將有關步驟的計算數據,例如差異來源、離差平方和、自由度、均方和F檢驗值等指標數值逐一列出,以方便檢

原创 [統計學筆記] (十三)指數分析

(十三)指數分析 統計指數簡稱指數,有廣義和狹義之分。廣義地講,任何兩個數值對比形成的相對數都可以稱爲指數;狹義地講,爲了反映某一社會經濟現象而產生的兩組有關聯的數值對比形成的相對數稱爲指數。 指數分析法是利用指數體系分析各影響因素變動對

原创 [統計學筆記] 統計學中的相關關係和三大相關係數

統計學中的相關關係和三大相關係數 相關關係是一種非確定性的關係,相關係數是研究變量之間線性相關程度的量。 由於研究對象的不同,相關係數有如下幾種定義方式。 簡單相關係數:又叫相關係數或線性相關係數,一般用字母r 表示,用來度量兩個變量間的