原创 pandas操作一列數據

def tt(x): if x.name == "distribution": return [el[0:10] for el in x.values] else: return x tes

原创 hive sql 分區

創建分區表,以日期作爲分區,一般先創建分區表,再插入數據drop table if EXISTS t1; create table t1( id int ,name string ,hobby str

原创 找出重複行

d_rows=orderstate_merge[orderstate_merge['customerid'].duplicated(keep=False)]

原创 hive sql練習1

參考DROP TABLE student; create TEMPORARY TABLE student ( sid string, sname string, sage int, ssex string ); INSERT

原创 hive sql練習

參考-- 創建學生表,學號,姓名,性別,年齡,班級 DROP TABLE student; CREATE TEMPORARY TABLE student( Sno int, Sname VARCHAR(20), Sex VAR

原创 迴歸

嶺迴歸# Author: Fabian Pedregosa -- <[email protected]> # License: BSD 3 clause import numpy as np import matplotli

原创 關聯規則挖掘算法

設爲所有項目的集合,爲事務數據庫,事物是一個項目子集()。每一個事務具有唯一的事務標識。設是一個由項目構成的集合,稱爲。事務包含項集,當且僅當。如果項集中包含個項目,則稱其爲 項集在事務數據庫中出現的次數佔總事務的百分比叫做項集的。如果項