原创 獲取HTTP請求數據

客戶端通過URL訪問服務端程序,會發送給服務端兩類信息,一類是HTTP請求頭,另外一類是請求數據。一般HTTP請求會通過GET方法和POST方法向服務端提交數據。因此,服務端程序需要獲得客戶端的這些請求數據,然後會做進一步的處理。

原创 scipy.stats單因素方差分析

###調包進行單因素方差分析 import numpy as np from scipy import stats '''###第一種數據形式type=numpy.recarray data = np.rec.array([ ('

原创 機器學習:XGBoost和GBDT的區別

原文鏈接:http://www.elecfans.com/d/995278.html xgboost是一種集成學習算法,屬於3類常用的集成方法(bagging,boosting,stacking)中的boosting算法類別。它是

原创 Anaconda下創建虛擬環境

安裝virtualenv: pip install virtualenv 2.測試Virtualenv 版本 virtualenv --version 3.創建虛擬環境: virtualenv venv 使用virtualenv

原创 pycharm中運行文件調包

首先所有.py文件需要在同一文件夾下 在同文件夾下添加一個空的__init__.py文件 在控制區域添加系統路徑 import sys sys.path.append(r'C:\Users\LHL\Desktop') 4.如

原创 正態總體均值假設檢驗

單個正態總體均值的檢驗 (1)sigma已知的u檢驗(Z檢驗) #######Z檢驗 '''Z檢驗條件 1.樣本量大於30 2.數據之間彼此獨立 3.數據正常分佈 4.樣本量應該相等 ''' #單正態總體,方差已知 fro

原创 streamlit 開發簡單數據處理的頁面

Streamlit是第一個專門針對機器學習和數據科學團隊的應用 開發框架,它是開發自定義機器學習工具的最快的方法,你可以認爲 它的目標是取代Flask在機器學習項目中的地位,可以幫助機器學習 工程師快速開發用戶交互工具。但是str

原创 自定義單因素方差分析

定義總平方和分解公式: 利用檢驗統計量F定義檢驗方法: '''實現單因素方差分析''' # 導入相關包 import pandas as pd import numpy as np import math import sci

原创 方差齊性檢驗

哈特利檢驗 Bartlett檢驗 可用於樣本量相等或不等的場合,但是每個樣本量不低於5 修正的Bartlett檢驗 #多總體方差差異的顯著性,要求數據正態性 ##Bartlett檢驗,適用於樣本量相等或不

原创 SQLAlchemy向數據庫添加數據報錯

1.在創建連接的位置設置字符編碼 mysql = 'mysql+pymysql://root:@localhost:3306/test?charset=utf8mb4' tableName = 'persons1'

原创 機器學習:集成算法的原理

集成學習是指將若干弱分類器組合之後產生一個強分類器。 集成算法的目的是爲了讓ML效果更好,單個分類行不行就採用多個(換而言之,它是通過組合幾種模型來提高機器學習的效果。與單一模型相比,該方法可以提供更好的預測結果),它是對於訓

原创 卡方擬合性檢驗

1.卡方檢驗能檢驗單個多項分類名義型變量各分類間的實際觀測次數與理論次數之間是否一致的問題,這裏的觀測次數是根據樣本數據得多的實計數,理論次數則是根據理論或經驗得到的期望次數。 2.這一類檢驗稱爲擬合性檢驗。 其自由度通常爲分類數

原创 卡方列聯表的獨立性檢驗

1.列聯表是按兩個或多個特徵分類的頻數數據,一般以表格形式組成。 2.判斷兩個或多個屬性之間有無關聯,即判別屬性之間是否獨立。 3.檢驗步驟 建立原假設 H0: 兩屬性相互獨立 H1: 兩屬性之間不獨立 計算自由度

原创 statsmodels雙因素方差分析

''' 1.正態性 2.方差齊性 3.獨立性 ''' #雙因素方差分析 import pandas as pd import numpy as np from statsmodels.formula.api import ols

原创 自定義雙因素方差分析

####雙因素方差分析,可進行有交互作用與無交互作用 def f_twoway(df_c,col_fac1,col_fac2,col_sta,interaction=False): df=df_c.copy()