原创 數據分析系列:Z 檢驗和 T 檢驗的應用及代碼實現

原創 J 數據科學家聯盟  4天前 目錄 0前言 1 Z 檢驗 1.單樣本 Z 檢驗 2.雙樣本 Z 檢驗 2 T 檢驗 1.單樣本 T 檢驗 2.雙樣本 T 檢驗 3 比例檢驗 1.單比例檢驗 2.雙

原创 特徵工程系列:特徵構造之概覽篇

原創: JunLiang 木東居士  1周前 特徵工程系列:特徵構造之概覽篇 本文爲數據茶水間羣友原創,經授權在本公衆號發表。 關於作者:JunLiang,一個熱愛挖掘的數據從業者,勤學好問、動手達人,期待與大家一起交流探討機器學習相關內

原创 特徵工程系列:空間特徵構造以及文本特徵構造

原創: JunLiang 木東居士   特徵工程系列:空間特徵構造以及文本特徵構造 本文爲數據茶水間羣友原創,經授權在本公衆號發表。 關於作者:JunLiang,一個熱愛挖掘的數據從業者,勤學好問、動手達人,期待與大家一起交流探討機器學習

原创 卡方檢驗學習總結

  1.卡方檢驗概念 1)卡方檢驗是一種用途很廣的計數資料的假設檢驗方法,由卡爾·皮爾遜提出。 (1)它屬於非參數檢驗的範疇,主要是比較兩個及兩個以上樣本率( 構成比)以及兩個分類變量的關聯性分析。 (2)其根本思想就是在於比較理論頻數和

原创 (補基礎)數據分析系列:假設檢驗的基礎知識

JunLiang 數據科學家聯盟  目錄: 0x00 前言 0x01 基本思想 0x02 檢驗方向 拒絕域(拒絕域是由顯著性水平圍成的區域) 1.雙尾檢驗 2.單尾檢驗 0x03 一類錯誤和二類錯誤 0x04

原创 假設檢驗總結

      1.符合正態分佈,總體均值和方差已知的單個樣本假設檢驗:均值差異的顯著性檢驗 例子:有一個嬰兒服用維他命後8個月會走路,檢驗服用維他命對加快嬰兒走路是否有效           2.一組樣本的假設檢驗 例子:有25個學生學

原创 數據挖掘之統計學基礎(4):【實踐】數據分佈-Python實戰

import numpy as np import pandas as pd import time import matplotlib as mpl import matplotlib.pyplot as plt %matp

原创 特徵工程系列:自動化特徵構造

特徵工程系列:自動化特徵構造 原創: JunLiang 木東居士  今天 0x00 前言 數據和特徵決定了機器學習的上限,而模型和算法只是逼近這個上限而已。由此可見,特徵工程在機器學習中佔有相當重要的地位。在實際應用當中,可以說特徵工程是

原创 特徵工程系列:時間特徵構造以及時間序列特徵構造

特徵工程系列:時間特徵構造以及時間序列特徵構造 原創: JunLiang 木東居士   0x00 前言 數據和特徵決定了機器學習的上限,而模型和算法只是逼近這個上限而已。由此可見,特徵工程在機器學習中佔有相當重要的地位。在實際應用當中,可