原创 Pandas-排序函數sort_values()

一、sort_values()函數用途 pandas中的sort_values()函數原理類似於SQL中的order by,可以將數據集依照某個字段中的數據進行排序,該函數即可根據指定列數據也可根據指定行的數據排序。 二、s

原创 Python-格式化符%

格式化符爲真實值預留位置,並控制字符串顯示的格式。 格式化符基礎使用方法: 格式化符號 說明 %s 字符串 (採用str()的顯示) %r 字符串 (採用repr()的顯示) %c 單個字符 %b 二進制

原创 機器學習-集成學習(ensemble learning)

集成學習ensemble learning:本身不是一個單獨的機器學習算法,而是通過構建並結合多個機器學習器來完成學習任務。 可以用兩句話形容: 1、“三個臭皮匠頂個諸葛亮”:一堆弱分類器的組合可以成爲一個強分類器; 2、“知錯能

原创 Pandas-object字符類型轉時間類型to_datetime()函數

一、pandas中to_datetime()函數 可以將指定數據轉換爲相應格式的時間類型數據 pandas.to_datetime(arg,format=None,unit=None) 參數 含義 arg 需要轉

原创 Pandas-去除重複項函數drop_duplicates()

一、drop_duplicates函數用途 pandas中的drop_duplicates()函數可以通過SQL中關鍵字distinct的用法來理解,根據指定的字段對數據集進行去重處理。 二、drop_duplicates(

原创 Python-缺失值分類及Pandas中缺失數據處理函數

一、Python中缺失值分類 Python中有三種缺失值(空值): 形式 含義 None Python內置的None值,如創建一個空的列表list=[] NA 在pandas中,將缺失值表示爲NA,表示不可用

原创 機器學習-簡單線性迴歸分析(Python)

前言 機器學習常用來解決相關分析和迴歸分析的問題,有時候大家會混淆兩者之間的差異,這裏通過對比分析來說明兩者的區別和聯繫,最後會以調用sklearn包中LinearRegression方法進行簡單線性迴歸分析爲例,說明如何使用

原创 Pandas-連接合並函數merge()

一、merge函數用途 pandas中的merge()函數類似於SQL中join的用法,可以將不同數據集依照某些字段(屬性)進行合併操作,得到一個新的數據集。 二、merge()函數的具體參數 用法: DataFrame

原创 Python-with open() as f的用法

常見的讀寫操作: with open(r'filename.txt') as f: data_user=pd.read_csv(f) #文件的讀操作 with open('data.txt', 'w') as f:

原创 Python-Groupby函數應用

Pandas分組和聚合運算–Groupby函數應用 一、groupby函數功能 根據一個或多個鍵拆分pandas對象,計算分組摘要統計,如計數、平均值、標準差或用戶自定義函數等。 二、groupby函數原理 可將groupby函數

原创 SQL-Exists與IN用法比較

一、EXISTS用法說明 EXITS謂詞代表 存在量詞,帶有EXISTS謂詞的子查詢不返回任何數據,只產生邏輯真值TRUE或邏輯假值FALSE。只要EXITS引導的子句有結果集返回,該條件即成立,EXITS不在乎返回的是什麼內容,

原创 讀書筆記-《SQL 必知必會》

《SQL 必知必會》是學習數據庫的入門級經典書籍,裏面知識點雖然都比較基礎,不過講解的清晰簡介,也比較全面。通過全面的學習SQL,可以在工作面臨問題時想到更高效的辦法。 接下來主要記錄經典章節中知識點的用法(主要針對Oracle語

原创 Python-sklearn包中拆分數據集進行交叉驗證的方法對比

一、對比訓練模型前,不同拆分數據集方法 sklearn.model_selection.KFold() 交叉採樣,將實驗數據劃分得到若干個互斥子集。 sklearn.model_selection.StratifiedKFold

原创 Python-sklearn包中StratifiedKFold和KFold生成交叉驗證數據集的區別

一、StratifiedKFold及KFold主要區別及函數參數 KFold交叉採樣:將訓練/測試數據集劃分n_splits個互斥子集,每次只用其中一個子集當做測試集,剩下的(n_splits-1)作爲訓練集,進行n_splits

原创 SQL-SQLZOO學習筆記

Tutorials: Learn SQL in stages 雖然日常工作中經常用到SQL,不過沒有系統性的訓練就難以有效的提升查詢效率。本文記錄每一節的常用函數及應用方法,以備以後查找。 https://sqlzoo.net/w