原创 hbase無法正常啓動問題
在完全分佈式環境下,hbase啓動時無法正常啓動,logs日誌中拋出異常信息org.apache.hadoop.hbase.ClockOutOfSyncException此問題是由於master和RegionServer節點的時間不一致導致
原创 MapReduce作業性能調優參數
Map端參數調整參數名稱類型默認值說明io.sort.mbint100Map階段內存緩存區大小,默認100Mio.sort.record.percentfloat0.05io.sort.mb有5%保存記錄邊界,其他緩存用來保存數據io.so
原创 Tachyon的安裝、配置和使用
0. 前言在上一篇博文《Tachyon簡介》中,我們簡要地介紹了Tachyon,一個以內存爲中心的分佈式文件系統,及其一些基本工作原理。這一次,我們重點介紹如何在你自己的單機或集羣環境下去安裝、配置和使用Tachyon。具體地,會從怎樣編譯
原创 我的友情鏈接
51CTO博客開發
原创 storm安裝
1、實驗環境: centos6.4 jdk1.8.0 CDH-5.3.2-1 storm0.9.32、準備條件 yum install libtool yum install gcc-c++ yum
原创 Tachyon簡介
1. Tachyon是什麼Tachyon(/'tki:n/ 意爲超光速粒子)是以內存爲中心的分佈式文件系統,擁有高性能和容錯能力,能夠爲集羣框架(如Spark、MapReduce)提供可靠的內存級速度的文件共享服務。Tachyon誕生於UC
原创 flume
Flume OGFlume OG主要由上圖幾個組件組成:Agent、Collector、Master、HDFSAgent: 主要用於採集數據,通常是由source和sink兩部分組成。其中Source用於獲取數據,Sink將Sourc
原创 hadoop問題彙總
1、啓動journalnode時存在警告信息,sbin/hadoop-daemon.sh stop journalnodestarting journalnode, logging to /app/hadoop-2.2.0/logs/had
原创 HBase簡介
一、簡介 HBase是基於列存儲、構建在HDFS上的分佈式存儲系統,其主要功能是存儲海量結構化數據。 HBase構建在HDFS之上,因此HBase也是通過增加廉價的PC機提高系統運行和存儲的能力。 HBase中存儲的表有如
原创 java.lang.OutOfMemoryError定位內存溢出的對象
在我們的程序運行過程中,經常會因爲各種原因出現OutOfMemoryError的錯誤,而如何定位是由哪個對象溢出,可通過以下方法進行查看1、查找JVM運行的任務號 ps aux |grep ${pid} 或 jps -m |grep
原创 Jamon模板語言簡介
項目中需要扒一段hbase webUI頁面的內容,hbase webUI頁面訪問地址10.x.x.x:60010/master-status,跟蹤代碼後發現,此web頁面使用了一個jamon的模板語言,這個做個簡單介紹。既然是模塊語言,都不
原创 sparkstreaming源碼分析
做個筆記,記錄streaming任務執行的整個流程,下文使用的源碼是master分支的代碼,1.2.1版本已經發布,應該和1.2.1差別不大1、streaming程序是從StreamingContext.start()開始的,做一個必要的參
原创 centos6.4使用本地yum源安裝cloudera manager 5.3.0和cdh5.3.0
1、準備工作 三個節點 192.168.56.110 cdh1 192.168.56.111 cdh2 192.168.56.112 cdh3 關閉所有節點防火牆 service iptables stop chkconfig iptabl
原创 Tachyon簡介
1. Tachyon是什麼Tachyon(/'tki:n/ 意爲超光速粒子)是以內存爲中心的分佈式文件系統,擁有高性能和容錯能力,能夠爲集羣框架(如Spark、MapReduce)提供可靠的內存級速度的文件共享服務。Tachyon誕生於UC
原创 jmxtrans安裝使用
實驗環境1、下載jmxtrans下載地址:https://github.com/jmxtrans/jmxtrans/downloads2、安裝jmxtrans#判斷是否已安裝此軟件 #rpm -qa |grep jmx #卸載軟件 #rpm