原创 pandas操作一列數據
def tt(x): if x.name == "distribution": return [el[0:10] for el in x.values] else: return x tes
原创 hive sql 分區
創建分區表,以日期作爲分區,一般先創建分區表,再插入數據drop table if EXISTS t1; create table t1( id int ,name string ,hobby str
原创 找出重複行
d_rows=orderstate_merge[orderstate_merge['customerid'].duplicated(keep=False)]
原创 hive sql練習1
參考DROP TABLE student; create TEMPORARY TABLE student ( sid string, sname string, sage int, ssex string ); INSERT
原创 hive sql練習
參考-- 創建學生表,學號,姓名,性別,年齡,班級 DROP TABLE student; CREATE TEMPORARY TABLE student( Sno int, Sname VARCHAR(20), Sex VAR
原创 迴歸
嶺迴歸# Author: Fabian Pedregosa -- <[email protected]> # License: BSD 3 clause import numpy as np import matplotli
原创 關聯規則挖掘算法
設爲所有項目的集合,爲事務數據庫,事物是一個項目子集()。每一個事務具有唯一的事務標識。設是一個由項目構成的集合,稱爲。事務包含項集,當且僅當。如果項集中包含個項目,則稱其爲 項集在事務數據庫中出現的次數佔總事務的百分比叫做項集的。如果項