原创 Pyecharts數據可視化學習筆記(附代碼)

PyEcharts學習筆記# 參考PyEcharts 官網,對常用的可視化圖形進行了整理,包括柱形圖,線柱圖,餅圖,漏斗圖,地理信息圖,動態3D展示圖等。 附幾張展示圖: 柱形圖 線柱圖 3D展示 地理信息圖 漏斗圖 熱度

原创 基於邏輯迴歸的評分卡模型簡單概述

評分卡模型 1:概述 信用評分本質上是模式識別中的一類分類問題,將企業或者個體消費者劃分爲能夠按期還本付息(即“好”客戶)和違約(即“壞”)兩類。 具體做法是根據歷史數據中的樣本,從已知的數據中找出違約及不違約客戶的特徵,從而總結出分

原创 Anaconda中安裝python版的XGBoost和LightGBM庫

Anaconda中安裝python版的XGBoost和LightGBM庫 XGboost 和LightGBM是目前機器學習中兩個非常強大的算法。在之前的電腦上已經安裝過着兩個算法。最近換了一臺新電腦,在重新安裝的過程中,好像有點忘記了

原创 SQL中分析函數first_value(),last_value,sum() over(partition by...)詳解

SQL中分析函數first_value(),last_value,sum() over(partition by…)詳解 首先,生成有一張原始表score,s_id表示學生id,c_id表示課程id,s_core表示最後課程的成績,表

原创 SQL——coalesce函數詳解

最近寫SQL的過程中,學習到一個非常有用的函數:coalesce。特別是在做統計的時候,這個函數作爲條件可以兼顧到一些特殊情況。這裏做一下總結和分享。 用途: (1):將控制替換成其他值; (2):返回第一個非空值 表達式 COALESC

原创 大數據組件Presto,Spark SQL,Hive相互關係

大數據組件Presto,Spark SQL,Hive相互關係 工作上經常寫SQL,有時候會在Presto上查表,或者會Presto web頁面上寫SQL語句。而有時候會在堡壘機上的服務器利用Spark在Yarn模式下寫SQL語句,而有

原创 IntelliJ IDEA IDEA 最新激活註冊碼(親測可用)

 複製下面鏈接即可 K03CHKJCFT-eyJsaWNlbnNlSWQiOiJLMDNDSEtKQ0ZUIiwibGljZW5zZWVOYW1lIjoibnNzIDEwMDEiLCJhc3NpZ25lZU5hbWUiOiIiLCJhc

原创 Azkaban作業參數使用介紹

Azkaban中的參數詳解 參數傳遞是調度字體工作流運行時非常重要的一部分,工作流的執行,單個作業的執行,多個工作流之間的依賴執行,歷史人物重算,都涉及到參數傳遞和同步。 azkaban的工作流中的參數可以分爲如下幾個類型: 1: Azk

原创 Python類的實例化,封裝,繼承,私有變量和私有方法

1:定義一個類 首先在python中,定義一個類,作爲例子,然後引出相關知識點 class Example(object): def __init__(self,data1,data2): self.__data

原创 Python:類的繼承,調用父類的屬性和方法基礎詳解

(1)繼承,調用父類屬性方法 class Father(): def __init__(self): self.a='aaa' def action(self): print('調用父類的

原创 Python 子類繼承父類構造函數說明

(1) 如果在子類中需要的構造方法就需要顯示的調用父類的構造方法,或者不重寫父類的構造方法。 子類不重寫__init__,實例化子類時,會自動調用父類定義的__init__。 實例: class Father(object):

原创 Python之Pickle學習

(1)Pickle的作用: python的pickle模塊實現了基本的數據序列和反序列化。通過pickle模塊的序列化操作我們能夠將程序中運行的對象信息保存到文件中去,永久存儲;通過pickle模塊的反序列化操作,我們能夠從文件中創建上一

原创 SQL中row_number() over(partition by)詳解

row_number 語法 ROW_NUMBER()函數將針對SELECT語句返回的每一行,從1開始編號,賦予其連續的編號。在查詢時應用了一個排序標準後,只有通過編號才能夠保證其順序是一致的,當使用ROW_NUMBER函數時,也需要專

原创 機器學習之樹迴歸——CART算法(Python代碼)

一:背景         線性迴歸包含了強大的方法,但這些方法創建的模型需要擬合所有的樣本(局部加權線性迴歸除外)。當數據擁有衆多特徵並且特徵之間的關係十分複雜時,構建全局模型的想法就顯得太難了。而且現實生活中很多數據都是非線性的,不可能

原创 SQL---模糊查詢與正則表達式詳解和對比

1:模糊查詢 在進行數據庫查詢的時候,有完整查詢和模糊查詢之分; 完整查詢就是我們平時查詢的普通語句(對某個查詢條件確定的前提下),而模糊查詢就是常見的where 後面增加了 like 關鍵字。 一般模糊查詢語句如下: select