原创 繪圖(餅圖/折線圖設置)

#!/usr/bin/env python3 # -*- coding: utf-8 -*- """ Created on Mon Aug 5 17:21:10 2019 @author: didi """ #!/usr/bin/

原创 PCA與FA

主成分分析和因子分析的關係是包含與擴展。 當因子分析提取公因子的方法是主成分(矩陣線性組合)時,因子分析結論的前半部分內容就是主成分分析的內容,而因子旋轉是因子分析的專屬(擴展),主成分分析是因子分析(提取公因子方法爲主成分)的中間步驟。

原创 ks-test

原文鏈接:https://www.cnblogs.com/arkenstone/p/5496761.html Kolmogorov-Smirnov是比較一個頻率分佈f(x)與理論分佈g(x)或者

原创 彙總平均數/比值的坑

A城市:每天車總訂單100(total_ord),一共20個車(total_vid),因此每天的車均單是5(avg_ord) B城市:每天車總訂單300,一共30個車,因此每天的車均單是10 在計算全國(假設只有A+B兩個城市) 簡單的車

原创 Hive日期函數

模塊 Hive時間函數特別注意 要點 除了unix_timestamp/from_unixtime之外 其他函數無法識別‘年-月’形式,至少‘年-月-日’ to_date 注意to_date就是返回年-月-日,和d

原创 lag/lead

lag 和lead 可以 獲取結果集中,按一定排序所排列的當前行的上下相鄰若干offset 的某個行的某個列(不用結果集的自關聯); lag ,lead 分別是向前,向後; lag 和lead 有三個參數,第一個參數是列名,第二個參數是偏

原创 自連接--子查詢的另一種方式

CREATE TABLE cust ( cust_id INT NOT NULL , cust_name VARCHAR(50) NOT NULL, cust_concat VARCHAR(50) NOT NULL ); INSERT

原创 拼多多筆試

1 ord表 userid,ord_id,ord_amt,create_time   act_user表actid,user_id,create_time 第一問:每個活動類型所有用戶的總訂單額,訂單數 第二問:每個活動類型活動開始時間(

原创 分類彙總/數據有效性/數據透視表

注意分類彙總和數據透視表不一樣,分類彙總是在原表裏每一個類別彙總下面有一個彙總~ 

原创 lookup

這裏注意數組 1.{= sum((E3:E11)*(F3*F11) )} 代表數組運算ctrl+enter+shift,因爲(E3:E11)*(F3*F11)返回的是數組 2.= sum(E3:E11)其中E3:E11也是數組但是直接e

原创 if/countif/sumif/

原创 if{1,0}

if({1,0}是利用常量數組作爲IF函數的第1個參數,實現構建新的兩列數組的用法。 想徹底瞭解它,我們還得從IF函數的基本用法說起~~ =IF(A1>=0,"正數","負數"),這個很容易理解,如果條件成立,就返回後面第一個值,條件不成

原创 1.tab之數據格式

原创 行列轉換

1.變換結果集成一行 create table test3 ( deptno int not null, cnt int not null ); insert i

原创 sql關於avg中的else null和else 0

drop table test1; use sys; create table test1 ( id int not null, num int not null ); insert into te