原创 機器學習入門及基本算法圖解

基本算法 最近在學習神經網絡,整理了一些算法,寫出來給自己一點交代吧,本人剛入算法沒多久,如果有不對的地方,請指出來大家一起學習,謝謝。 費曼算法(Feynman algorithm) 將這個算法放在最前面是因爲該算法提供了一些我

原创 星環TDH數據庫批量生成表和存儲過程

環境準備 安裝python環境:解壓 ,然後設置環境變量。把ETL文件夾放到本地 ETL文件夾以及腳本說明 路徑D:\ETL\genproc下是各種運行的Python腳本。 路徑D:\ETL\model\TDH下是生成

原创 mysql(oracle)-shareplex-kafka-flink-hbase數據同步

企業運維的數據庫最常見的是mysql(oracle);但是mysql(oracle)有個缺陷:當數據量達到千萬條的時候,mysql(oracle)的相關操作會變的非常遲緩; 如果這個時候有需求需要實時展示數據;對於mysql來說

原创 解決TypeError:'twophase' is an invalid keyword argumet for this function(附:pandas連接oracle)

問題描述 先來看看百度的解決方法,因爲全是英文的,一開始沒大看懂,沒有想到是版本的問題,現在的cx_oracle已經更新到了7.0版本,sqlalchemy更新到了1.3.10版本. 這篇文章大概的意思就是說當使用版本6.

原创 機器學習常見算法及其優缺點

一、決策樹 決策樹優點 1、決策樹易於理解和解釋,可以可視化分析,容易提取出規則。 2、可以同時處理標稱型和數值型數據。 3、測試數據集時,運行速度比較快。 4、決策樹可以很好的擴展到大型數據庫中,同時它的大小獨立於數據庫大小。

原创 scala高級特性

高階函數 概念 Scala混合了面向對象和函數式的特性,我們通常將可以作爲參數傳遞到方法中的表達式叫做函數。在函數式編程語言中,函數是“頭等公民”,高階函數包含:作爲值的函數、匿名函數、閉包、柯里化等等。 作爲值的函數 可以像任何