原创 數據倉庫項目筆記5
用戶留存分析 用戶留存含義: 當日的新增用戶在所求日期也活躍 用戶留存解析: 所需字段 日期 新增用戶數 1天后留存數 2天后留存數 因爲日期的不同, 幾天後的列數不固定, 因此豎錶轉爲橫表更有利於設計 日期 新
原创 數據庫和數據倉庫區別
數據庫: 聯機事務處理 OLTP 聯機=實時 特性: 實時增刪改查(響應) 在線(不宕機) 逐條不斷修改事務處理 只能看到最終修改狀態 mysql oracle sqlserver 數據倉庫: 用來分析 聯機數據分析
原创 spark RDD系列——2.HadoopRDD分區的創建以及計算
原文鏈接:https://www.maiyewang.com/?p=606 原文鏈接:https://www.maiyewang.com/?p=606 Spark經常需要從hdfs讀取文件生
原创 hive 開窗函數理解區別range和row以及默認省略語句
數據準備:name,orderdate,cost jack,2017-01-01,10 tony,2017-01-02,15 jack,2017-02-03,23 tony,2017-01-01,29 jack,2017-01-01,46
原创 linux 普通用戶傻瓜式安裝啓動mysql5.7.26
wget https://cdn.mysql.com//Downloads/MySQL-5.7/mysql-5.7.26-linux-glibc2.12-x86_64.tar.gz useradd mysql passwd mysql t
原创 分析函數名(參數) OVER (PARTITION BY子句 ORDER BY子句 ROWS/RANGE子句
分析函數的語法結構一般是:分析函數名(參數) OVER (PARTITION BY子句 ORDER BY子句 ROWS/RANGE子句)。 即由以下三部分組成: 分析函數名:如sum、max、min、count、avg等聚集函數以
原创 tomcat 自啓動
原文http://blog.csdn.net/wangli61289/article/details/37924785 Linux下tomcat開機自動啓動有兩種方法,一種是簡單,一種是複雜而又專業的,使用shell腳本要實現,我們一
原创 Windows 下安裝 nvm 管理 nodejs 版本
原文鏈接https://segmentfault.com/a/1190000007612011 npm node.js nvm 電波馬達 2016年11月27日發佈 贊 | 3 收藏 | 2
原创 mysql主主搭建
關於mysql-HA,目前有多種解決方案,比如heartbeat、drbd、mmm、共享存儲,但是它們各有優缺點。heartbeat、drbd配置較爲複雜,需要自己寫腳本才能實現mysql自動切換,對於不會腳本語言的人來說,這無疑是一種腦
原创 java實現zip壓縮多個目錄及子目錄和文件
java實現zip壓縮文件(同一文件夾下的多個文件夾打成一個zip包) 博客分類: JAVA此文鏈接:http://zhangzhaoaaa.iteye.com/blog/2115048 參考:http://blog.1
原创 解決Fiddler "creation of the root certificate was not successful”的問題
http://localhost:8888/ 安裝證書,如果提示沒有證書(8888是你在Tool->Fiddler Option->Connections設置的Fiddler監聽端口) cd "d:\Program Files\F
原创 JVM垃圾回收機制
Java垃圾回收機制 Java垃圾回收機制 說到垃圾回收(Garbage Collection,GC),很多人就會自然而然地把它和Java聯繫起來。在Java中,程序員不需要去關心內存動態分配和垃圾回收的問題,這一切都交
原创 cassndra spring.xml配置
[java][cassandra][spring] java操作 import com.datastax.driver.auth.DseAuthProvider; import com.datastax.driver.core.