原创 python假設檢驗是否符合正態分佈

ks檢驗  特點是比較嚴格,基於的原理是CDF,理論上可以檢驗任何分佈。 from scipy.stats import kstest --data爲數據集,μ爲data的均值,δ爲data的標準差 kstest(data, 'nor

原创 in insert schema specification are not found among regular columns of nor dynamic partition columns

問題描述:hive插入數據時報錯,sql很簡單卻報錯了 insert into table1 (c1, c2, c3) select c1, c2, c3 from table2 分析:hive插入數據時不能指定列名插入,默認是全列插

原创 dataframe刪除多列同時爲空的行

1,先左右填充數據 #向右填充數據 df.fillna(method='ffill', axis=1) #向左填充數據 df.fillna(method='bfill',axis=1) 注:一行全爲空的數據定然不會被填充 2,指定刪除某

原创 行列式和矩陣的區別

1,本質上 (1)行列式是一個數,一個值。當有未知數時就是一個表達式。 (2)矩陣是一個數表,一種數據結構,可以按照數據庫表結構來理解,也可以理解成二維數組。 矩陣是不能像行列式那樣計算的!! 2,數學符號表示上 (1)行列式是用雙

原创 hive求一行的最大值

1. 準備數據表test2 create table test2( a int, b int, c int, d int, e int);  2. 準備2條數據 insert into table test2 values(5,1,3

原创 python畫餅圖

from pylab import mpl #顯示中文,在Spyder下有效,在linux的jupyter notebook上無效,因爲該機器爲內網機器,沒有SimHei.ttf語言包 mpl.rcParams['font.sans-s

原创 如何將數據上傳到jupyter notebook

方法一:適用於文件過多時,將文件直接拷貝到當前notebook所在路徑下   方法二:單個上傳 點贊 收藏 分享 文章舉報 無極仙翁 發佈了346 篇原創文章 · 獲贊 1

原创 向量的點乘(內積、數量積)和叉乘(外積、向量積)

參考博文:https://blog.csdn.net/dcrmg/article/details/52416832 已知兩個向量 ,   1  點乘 1.1 公式 公式(1) 公式(2) 1.2 點乘幾何意義 參考博文:https://w