原创 MapReduce中的SequenceFile和MapFile

SequeceFile是Hadoop API提供的一種二進制文件支持。這種二進制文件直接將<key, value>對序列化到文件中。一般 對小文件可以使用這種文件合併,即將文件名作爲key,文件內容作爲value序列化到大文件中。這種文件

原创 Redis學習2

redis管道(pipeline) redis的pipeline(管道)功能在命令行中沒有,但是redis是支持管道的,在java的客戶端(jedis)中是可以使用的。 測試發現: 1:使用管道方式,插入1000條數據耗時37毫秒 Pip

原创 查看fsimage和edits文件

查看fsimage文件: 啓動服務器bin/hdfs oiv -i 某個fsimage文件 查看內容bin/hdfs dfs -ls  -R webhdfs://127.0.0.1:5978/ 導出結果bin/hdfs oiv -p XM

原创 hadoop2.6.0 shell常用操作

1.1. 對hdfs的shell操作 a) 執行bin/hdfs dfs [-command] b) -ls 顯示文件夾的內容 i. -h 顯示文件大小的時候,使用K\M\G顯示文件大小 ii. -R 遞歸顯示文件夾包含的內容 c) -m

原创 Hive0.14安裝

1.首先下載apache-hive-0.14.0-bin.tar.gz並解壓,爲了方便,解壓後的文件夾重命名爲hive14 2.ls到hive目錄下的conf目錄,將hive-env.sh.template重命名爲hive-env.sh。

原创 Redis學習

Redis是一種面向“鍵/值”對數據類型的內存數據庫,可以滿足我們對海量數據的讀寫需求。 redis的鍵只能是字符串 redis的值支持多種數據類型:         1:字符串 string         2:哈希 hash     

原创 Java常用工具總結

/** * 判斷字符串是否是整數或小數 * @param str * @return */ public static boolean isNumeric(String str) { Pattern pattern

原创 從hdfs批量導出數據到hbase表中

將hdfs中的日誌數據導入到hbase中。 打成jar包在服務器使用 hadoop jar xxx.jar 包名.類名            運行 需要將hbase類庫加到hadoop的classpath中,在hadoop-env.sh

原创 Java筆試面試(==和equals)

/* * 以下輸出內容是什麼 */ public class Test { public static void main(String[] args) { String str = new String("abc"); S

原创 Hive0.14 語法

創建數據庫 create database mydb; 切換數據庫 use mydb; 創建數據庫 create database if not exists mydb; 創建內部表表的同時加載數據 create table studen

原创 多線程同步輔助類

<span style="font-size:18px;">/** * 同步輔助類之信號量 * 允許指定共享資源數量,可以允許指定數量的線程同時訪問資源 * 與同步的區別在於,同步時,一次只能一個線程訪問資源 * @author

原创 Zookeeper學習

Zookeeper 是 Google 的 Chubby一個開源的實現,是 Hadoop 的分佈式協調服務 Zookeeper的角色 領導者(leader),負責進行投票的發起和決議,更新系統狀態 學習者(learner),包括跟隨者(f

原创 Python學習

python數據類型: 1.整數 2.浮點數 3.字符串 print 多個字符串時以逗號連接 print "hello","world" -> hello world 4.布爾 True False 注意大小寫 5.空值 None 6

原创 hadoop2.6.0 shell 命令

bin/hdfs dfs命令 appendToFile Usage: hdfs dfs -appendToFile <localsrc> ... <dst> 追加一個或者多個文件(本地路徑的文件)的內容到hdfs指定文件中.也可以從命令行

原创 hbase優化

HBase的性能優化 1.數據寫入到WAL和memstore中。   memstore中的數據flush到HDFS中。   數據存放在內存中,一般存放在jvm中的新生代、老生代區域。   memstore一般設置大小爲128MB。   設