原创 數據倉庫項目筆記5

用戶留存分析 用戶留存含義: 當日的新增用戶在所求日期也活躍 用戶留存解析: 所需字段 日期 新增用戶數 1天后留存數 2天后留存數 因爲日期的不同, 幾天後的列數不固定, 因此豎錶轉爲橫表更有利於設計 日期 新

原创 數據庫和數據倉庫區別

數據庫: 聯機事務處理 OLTP 聯機=實時 特性: 實時增刪改查(響應) 在線(不宕機) 逐條不斷修改事務處理 只能看到最終修改狀態 mysql oracle sqlserver 數據倉庫: 用來分析 聯機數據分析

原创 spark RDD系列——2.HadoopRDD分區的創建以及計算

原文鏈接:https://www.maiyewang.com/?p=606 原文鏈接:https://www.maiyewang.com/?p=606   Spark經常需要從hdfs讀取文件生

原创 hive 開窗函數理解區別range和row以及默認省略語句

數據準備:name,orderdate,cost jack,2017-01-01,10 tony,2017-01-02,15 jack,2017-02-03,23 tony,2017-01-01,29 jack,2017-01-01,46

原创 linux 普通用戶傻瓜式安裝啓動mysql5.7.26

wget https://cdn.mysql.com//Downloads/MySQL-5.7/mysql-5.7.26-linux-glibc2.12-x86_64.tar.gz useradd mysql passwd mysql t

原创 分析函數名(參數) OVER (PARTITION BY子句 ORDER BY子句 ROWS/RANGE子句

分析函數的語法結構一般是:分析函數名(參數) OVER (PARTITION BY子句 ORDER BY子句 ROWS/RANGE子句)。 即由以下三部分組成: 分析函數名:如sum、max、min、count、avg等聚集函數以

原创 tomcat 自啓動

原文http://blog.csdn.net/wangli61289/article/details/37924785 Linux下tomcat開機自動啓動有兩種方法,一種是簡單,一種是複雜而又專業的,使用shell腳本要實現,我們一

原创 Windows 下安裝 nvm 管理 nodejs 版本

原文鏈接https://segmentfault.com/a/1190000007612011   npm  node.js  nvm  電波馬達 2016年11月27日發佈 贊  |   3 收藏  |  2

原创 mysql主主搭建

關於mysql-HA,目前有多種解決方案,比如heartbeat、drbd、mmm、共享存儲,但是它們各有優缺點。heartbeat、drbd配置較爲複雜,需要自己寫腳本才能實現mysql自動切換,對於不會腳本語言的人來說,這無疑是一種腦

原创 java實現zip壓縮多個目錄及子目錄和文件

java實現zip壓縮文件(同一文件夾下的多個文件夾打成一個zip包) 博客分類:  JAVA此文鏈接:http://zhangzhaoaaa.iteye.com/blog/2115048  參考:http://blog.1

原创 解決Fiddler "creation of the root certificate was not successful”的問題

http://localhost:8888/    安裝證書,如果提示沒有證書(8888是你在Tool->Fiddler Option->Connections設置的Fiddler監聽端口) cd "d:\Program Files\F

原创 JVM垃圾回收機制

Java垃圾回收機制 Java垃圾回收機制   說到垃圾回收(Garbage Collection,GC),很多人就會自然而然地把它和Java聯繫起來。在Java中,程序員不需要去關心內存動態分配和垃圾回收的問題,這一切都交

原创 cassndra spring.xml配置

[java][cassandra][spring] java操作 import com.datastax.driver.auth.DseAuthProvider; import com.datastax.driver.core.