原创 Matplotlib - 餅圖、環形圖 pie() & 多重餅圖 subplots() 所有用法詳解

目錄 基本用法  餅圖中突出顯示某部分 環形圖(空心餅圖) 多重餅圖,並添加分割線 相較散點圖和折線圖,柱狀圖、餅圖、箱線圖是另外 3 種數據分析常用的圖形,主要用於分析數據內部的分佈狀態或分散狀態。餅圖主要用於查看各分組數據在總數據中的

原创 hive - 可優化的 10 個地方及詳解

1.合理選擇排序 排序算法比較耗資源,應根據業務需要選擇 order by :全局排序,大數據集會消耗太過漫長的時間 sort by:局部排序,只能保證每個reducer的輸出數據都是有序的 distribute by:分桶不排序,控制m

原创 RGB顏色查詢對照表#FFFFFF

大致是下圖這樣的,有需要的可以點擊下面的連接複製使用: https://www.114la.com/other/rgb.htm

原创 特徵計算 - 遍歷求值提速 6 萬倍 lambda...if...else(if...else...) +map() 對比 iterrows() - Python代碼

Python 進行 DataFrame 數據處理的過程中,需要判斷某一列中的值(條件),然後對其他兩列或三列進行求和(均值/最值)等運算,並把運算結果存儲在新的一列中。幹說可能覺得比較暈,我們來看一個例子: 下表 data_base 中,

原创 缺失值處理 - 獲取一段時間內所有日期的列表 - (Python、MySQL)

有的時候做數據清洗的時候 , 如果表中數據在某一天沒有記錄,但是業務要求不能有缺失日期,那麼就需要我們將這些缺失日期補上。這個前提就是我們先要有一張包含所有日期的列表(作爲左表),供我們進行匹配(left join)進而補上缺失日期。  

原创 Matplotlib - 柱狀圖、直方圖、條形圖 bar() & barh() 所有用法詳解

目錄 基本用法  多個直方圖並列顯示 顯示直方圖上的數值 多個直方圖堆疊顯示 水平直方圖 相較散點圖和折線圖,柱狀圖(直方圖、條形圖)、餅圖、箱線圖是另外 3 種數據分析常用的圖形,主要用於分析數據內部的分佈狀態或分散狀態。 柱狀圖(直方

原创 MySQL - 定時任務(每天凌晨1點、每小時、每分鐘、某一時間點)

常用的一定要寫在前面 # 從2019-10-11開始,每天的00:30:00執行定時任務 ON SCHEDULE EVERY 1 DAY STARTS '2019-10-11 00:30:00'  # 每天的凌晨1點執行定時任務 O

原创 mysql_根據身份證號識別性別、年齡、所在省份

1.性別: IF(mod(SUBSTR(c.reciver_idcard_num,17,1),2),'man','woman') 性別, 2. 年齡: CASE WHEN c.reciver_idcard_num <>'' THEN

原创 Matplotlib - 散點圖 scatter() 所有用法詳解

目錄  基本用法 散點的大小不同(根據點對應的數值) 散點的顏色不同(指定顏色或者漸變色) 散點圖和折線圖是數據分析中最常用的兩種圖形,他們能夠分析不同數值型特徵間的關係。其中,散點圖主要用於分析特徵間的相關關係。 散點圖(scatter

原创 線性迴歸 - 機器學習多元線性迴歸 - 一步一步詳解 - Python代碼實現

目錄 數據導入 單變量線性迴歸 繪製散點圖 相關係數R 拆分訓練集和測試集 多變量線性迴歸 數據檢驗(判斷是否可以做線性迴歸) 訓練線性迴歸模型 先甩幾個典型的線性迴歸的模型,幫助大家撿起那些年被忘記的數學。 ● 單變量線性迴歸: h(x

原创 Power BI連接MySQL 提示錯誤......未能加載文件或程序集......或它的某一個依賴項

Power BI連接MySQL數據庫時報錯: 提示錯誤未能加載文件或程序集“MySql.Data, Version=5.1.4.0, Culture=neutral,........”或它的某一個依賴項。找到的程序集清單定義與程序集引用不

原创 mac筆記本修改 mysql 的密碼

原文鏈接:https://blog.csdn.net/pariese/article/details/77527813 第一種 mysql版本:5.7.17 1.首先我們要關閉mysql服務 s

原创 Hive的數據加載與導出

普通表的加載 1.load方式 load data [local] inpath [源文件路徑] into table 目標表名;   從HDFS上加載數據,本質上是移動文件所在的路徑 load data inpath '/user/st

原创 Hive關於數據庫的增刪改查

創建庫 if not exists:防止db_hive已經存在 CREATE DATABASE if not exists db_hive; CREATE DATABASE if not exists db_hive COMMENT

原创 Hive關於數據表的增刪改(內部表、外部表、分區表、分桶表 & 數據類型、分隔符類型)

建表 基本語句格式 CREATE [external] TABLE if not exists student #默認建立內部表,加上external則是建立外部表 (id int COMMENT'學號',sname string C