原创 HBase的RowKey設計

1 概述 HBase是一個分佈式的、面向列的數據庫,它和一般關係型數據庫的最大區別是:HBase很適合於存儲非結構化的數據,還有就是它基於列的而不是基於行的模式。 既然HBase是採用KeyValue的列存儲,那Rowkey就是KeyV

原创 ubuntu下安裝程序的三種方法

引言 在ubuntu當中,安裝應用程序我所知道的有三種方法,分別是apt-get,dpkg安裝deb和make install安裝源碼包三種。下面針對每一種方法各舉例來說明。 apt-get方法 使用apt-get install來安裝

原创 ubuntu下配置環境變量

`在用戶主目錄下,有一個 .bashrc 文件,編輯該文件: vi ~/.bashrc 在最後邊加入需要設置變量的shell語句,例如: export PATH=~/mypath/bin:$PATH 該方式添加的變量只能當前用

原创 Hadoop中FileInputFormat源碼解析

基於Hadoop2.6.0 //生成文件list,放進filesplits public List<InputSplit> getSplits(JobContext job) throws IOException { Sto

原创 hiveQL詳解

一、創建表 1.創建內部表 //create & load create table tab_ip(id int,name string,ip string,country string) row format delim

原创 Ubuntu14.04安裝搜狗輸入法

難得搜狗輸入法支持ubuntu,果斷下載嘗試一把。 官網:http://pinyin.sogou.com/linux/ 官網教程:http://pinyin.sogou.com/linux/help.php 按照教程上面的說法,對於

原创 Ubuntu兩臺節點無密碼登錄

在第一臺機器上輸入下面兩條命令 ssh-keygen -t dsa -P ” -f ~/.ssh/id_dsa scp ~/.ssh/id_dsa.pub hadoop:~/.ssh 備註:其中hadoop爲第二臺機器的用戶名 在