台部落奥卡姆的剃刀

PyEcharts學習筆記# 參考PyEcharts 官網，對常用的可視化圖形進行了整理，包括柱形圖，線柱圖，餅圖，漏斗圖，地理信息圖，動態3D展示圖等。附幾張展示圖：柱形圖線柱圖 3D展示地理信息圖漏斗圖熱度

2019-02-16 16:45:55

評分卡模型 1：概述信用評分本質上是模式識別中的一類分類問題，將企業或者個體消費者劃分爲能夠按期還本付息（即“好”客戶）和違約（即“壞”）兩類。具體做法是根據歷史數據中的樣本，從已知的數據中找出違約及不違約客戶的特徵，從而總結出分

2019-02-14 20:25:40

Anaconda中安裝python版的XGBoost和LightGBM庫 XGboost 和LightGBM是目前機器學習中兩個非常強大的算法。在之前的電腦上已經安裝過着兩個算法。最近換了一臺新電腦，在重新安裝的過程中，好像有點忘記了

2019-01-25 20:30:23

SQL中分析函數first_value(),last_value，sum() over(partition by…)詳解首先，生成有一張原始表score，s_id表示學生id，c_id表示課程id，s_core表示最後課程的成績，表

2019-01-25 20:30:23

最近寫SQL的過程中，學習到一個非常有用的函數：coalesce。特別是在做統計的時候，這個函數作爲條件可以兼顧到一些特殊情況。這裏做一下總結和分享。用途：（1）：將控制替換成其他值；（2）：返回第一個非空值表達式 COALESC

2019-01-25 20:30:23

大數據組件Presto，Spark SQL，Hive相互關係工作上經常寫SQL，有時候會在Presto上查表，或者會Presto web頁面上寫SQL語句。而有時候會在堡壘機上的服務器利用Spark在Yarn模式下寫SQL語句，而有

2019-01-10 13:53:09

複製下面鏈接即可 K03CHKJCFT-eyJsaWNlbnNlSWQiOiJLMDNDSEtKQ0ZUIiwibGljZW5zZWVOYW1lIjoibnNzIDEwMDEiLCJhc3NpZ25lZU5hbWUiOiIiLCJhc

2019-01-09 13:40:28

Azkaban中的參數詳解參數傳遞是調度字體工作流運行時非常重要的一部分，工作流的執行，單個作業的執行，多個工作流之間的依賴執行，歷史人物重算，都涉及到參數傳遞和同步。 azkaban的工作流中的參數可以分爲如下幾個類型： 1: Azk

2019-01-06 20:48:49

1：定義一個類首先在python中，定義一個類，作爲例子，然後引出相關知識點 class Example(object): def __init__(self,data1,data2): self.__data

2019-01-02 21:02:33

（1）繼承，調用父類屬性方法 class Father(): def __init__(self): self.a='aaa' def action(self): print('調用父類的

2018-12-30 21:43:16

（1）如果在子類中需要的構造方法就需要顯示的調用父類的構造方法，或者不重寫父類的構造方法。子類不重寫__init__，實例化子類時，會自動調用父類定義的__init__。實例： class Father(object):

2018-12-29 21:34:20

（1）Pickle的作用： python的pickle模塊實現了基本的數據序列和反序列化。通過pickle模塊的序列化操作我們能夠將程序中運行的對象信息保存到文件中去，永久存儲；通過pickle模塊的反序列化操作，我們能夠從文件中創建上一

2018-12-26 23:21:56

row_number 語法 ROW_NUMBER()函數將針對SELECT語句返回的每一行，從1開始編號，賦予其連續的編號。在查詢時應用了一個排序標準後，只有通過編號才能夠保證其順序是一致的，當使用ROW_NUMBER函數時，也需要專

2018-12-23 20:15:52

一：背景線性迴歸包含了強大的方法，但這些方法創建的模型需要擬合所有的樣本（局部加權線性迴歸除外）。當數據擁有衆多特徵並且特徵之間的關係十分複雜時，構建全局模型的想法就顯得太難了。而且現實生活中很多數據都是非線性的，不可能

2018-12-23 20:15:52

1：模糊查詢在進行數據庫查詢的時候，有完整查詢和模糊查詢之分；完整查詢就是我們平時查詢的普通語句（對某個查詢條件確定的前提下），而模糊查詢就是常見的where 後面增加了 like 關鍵字。一般模糊查詢語句如下： select

2018-12-16 19:52:53