原创 【乾貨】聽HPE Vertica技術大咖,談談大數據和MPP高效的計算框架(上)

關於大數據這個概念,你一定不陌生了。但是,你知道大數據的“三生三世”嗎?你知道大數據圈子裏的“百家爭鳴”嗎... 如果都不清楚,沒關係,不妨就跟着HPE資深大數據架構師劉定強先生一起探索吧! 劉定強先生是HPE資深大數據架構師,Ver

原创 idea python 運行腳本報錯AttributeError: module 'matplotlib' has no attribute 'verbose'

1、問題描述 idea的版本:2017.3.3 python插件的版本:2017.3.173.4301.35 代碼引用了畫圖包:matplotlib matplotlib版本:3.0.3 運行代碼出錯: AttributeError:

原创 桑基圖有何作用,桑基圖又是怎麼做出來的?

如果一定要給桑基圖貼一個標籤的話,那一定是:展現數據流動的利器。真的好直觀好用。 具體詳情: 地址:https://www.zhihu.com/question/45502919

原创 關於git:使用http&https訪問時記住賬號密碼

在clone項目的時候直接在鏈接地址後面追加上用戶名&密碼,但是小白就只能亡羊補牢了。這裏給提供個方法。 1.clone項目時直接追加上用戶名和密碼:   用戶:MYUSERNAME 密碼:MYPASSWORD https://MYUS

原创 推薦系統指標評測——覆蓋率與基尼係數的算法與應用

評測指標是衡量推薦系統優劣的數據支持,目前應用廣泛的有:點擊率、轉化率、精準率、召回率、F1值、覆蓋率、多樣性等等。不同的指標衡量的標準和目的是不一樣的...今天就來介紹一下覆蓋率和多樣性是如何計算和應用的。 更多推薦系統資源,請參考——

原创 在Idea中添加javap命令查看構成java字節碼的指令

1、打開idea的setting菜單 2、找到external Tools功能 3、增加具體的javap命令 4、在選擇代碼文件可以使用

原创 Python pip配置國內源

      衆所周知,Python使用pip方法安裝第三方包時,需要從 https://pypi.org/ 資源庫中下載,但是會面臨下載速度慢,甚至無法下載的尷尬,這時,你就需要知道配置一個國內源有多麼重要了,通過一番摸索和嘗試,總結了一

原创 CentOS7修改yum源爲阿里

修改yum源爲阿里 備份本地yum源     mv /etc/yum.repos.d/CentOS-Base.repo /etc/yum.repos.d/CentOS-Base.repo_bak   2.獲取阿里yum源配置文件   

原创 CDH集羣配置文件、日誌、jar包以及安裝目錄彙總

一、總結目的 因爲CDH集羣的配置、日誌、jar包以及安裝文件的目錄非常多,而且分散,每次繞進去就有種繞不出來的感覺。所以,下決心總結一下,防止自己後面採坑。 詳細內容詳見: 本文鏈接:https://blog.csdn.net/u010

原创 Linux下實現免密登錄(包含批量方法)

1.Linux下生成密鑰    ssh-keygen的命令手冊,通過”man ssh-keygen“命令:      通過命令”ssh-keygen -t rsa“      生成之後會在用戶的根目錄生成一個 “.ssh”的文件夾   

原创 【乾貨】聽HPE Vertica技術大咖,談談大數據和MPP高效的計算框架(下)

如果您已經看過上期的內容,一定對大數據和HPE Vertica有了更爲深刻的認識。接下來,我們就趁熱打鐵,繼續爲您帶來劉定強先生關於大數據和MPP高效計算框架的分享。 Vertica,關係型數據庫 Vertica是HPE一個重要的大數據產

原创 MySQL Binlog 三個解析工具的對比

目前常用的MySQL Binlog解析工具主要有阿里的canal、mysql_streamer,三個工具對比如下: canal 由Java開發,分爲服務端和客戶端,擁有衆多的衍生應用,性能穩定,功能強大;canal 需要自己編寫客戶端來

原创 Gradient Boosting算法簡介(有python列子)

Gradient Boosting算法簡介 最近項目中涉及基於Gradient Boosting Regression 算法擬合時間序列曲線的內容,利用python機器學習包 scikit-learn 中的GradientBoosting

原创 VirtualBox下安裝CentOS7系統網絡配置

1、主機的虛擬機網卡的ip地址配置:   2、虛擬機的“主機網絡管理器”配置:   3、虛擬機客戶網絡配置: 網卡1:   網卡2:   4、虛擬機內的網絡配置: cd /etc/sysconfig/network-scripts

原创 vmware11安裝linux7連接內外網

實現雙網卡的配置,在虛擬機中搭建雙網卡,實現訪問公網、內部網絡靜態ip互訪的需求。 如果配置已經亂了,那麼首先要把虛擬機的網卡都還原: 2、記住vmnet1的網咯配置 3、修改本機虛擬網卡的配置: 4、爲虛擬機添加第二個網卡: 默認