原创 Apache Tephra -使用

  一.     下載源代碼並編譯打包: git clone https://git-wip-us.apache.org/repos/asf/incubator-tephra.git cd incubator-tephra mvn cl

原创 linux 內存優化

linux 內存優化: 1>. /proc是一個虛擬文件系統,我們可以通過對它的讀寫操作作爲與kernel實體間進行通信的一種手段。也就是說可以通過修改/proc中的文件,來對當前kernel的行爲做出調整。也就是說我們可以通過調整/pr

原创 Linux yum報錯以及虛擬機網絡配置

今天在使用yum安裝軟件的時候出現問題: 第一次報錯: “Couldn’t resolve host ‘centos.ustc.edu.cn’” 網上查是因爲DNS的配置有問題,於是在 /etc/sysconfig/network-scr

原创 數據結構與算法(一)--基本概念

- 數據結構:是相互之間存在一種或多種特定關係的數據元素的集合。 - 算法:算法是解決特定問題求解步驟的描述。在計算機中的表現爲指令的有限序列,並且每條指令表示一個或多個操作。 2.1 算法的五個基本特徵: 輸入,輸出,有窮性,確定性

原创 HBase協處理器加載過程(1.2)

之前寫過HBase協處理器的一些原理和使用,基本上都是官方文檔和官方的博客翻過來的,知道了怎麼寫,怎麼用。 現在需要思考的一個問題是,自己寫的協處理器是怎麼加載成功並調用的。 一、首先來看Observer

原创 Apache Tephra-簡介

What is Apache Tephra (TM)   Apache Tephra在Apache HBase等分佈式數據存儲上提供全局一致的事務。雖然HBase提供了與row或region級ACID操作的強大一致性,但是它犧牲了跨區域和

原创 Linux Shell腳本中,遠程調用腳本或命令,並使後臺執行

split_to_array $KAFKA_hosts "," for node in ${array[@]} do echo "正在啓動kafka服務" java -cp .:$BEH_HOME/scri

原创 kafka (java API demo)

版本:kafka0.10.2 Producer API 生產者API允許應用程序發送數據流到kafka集羣中的topic。 介紹怎麼使用producer的例子在這個文檔裏javadocs 如果你使用maven構建工程的話,要使用

原创 linux命令隨筆(4)

查看端口監聽情況: netstat –nlpt 如圖: 可以看到監聽的程序名和進程id~

原创 測試shell中使用map的小demo

用於修改hadoop的配置文件 #!/bin/bash dfs_namenode_name_dir=/opt/beh/data/hadoop/namenode dfs_nameservices=beh dfs_blocksize=2684

原创 linux命令隨筆(3)

Vim批量註釋 方法一 ctrl+v 進入列編輯模式,向下或向上移動光標,把需要註釋的行的開頭標記起來,然後按大寫的I(shift+i),再插入註釋符,比如”//”,再按Esc,就會全部註釋了 批量去掉註釋 ctrl+v,進入列編輯模式,

原创 HBase數據模型(1.2官方文檔)

在hbase中,數據被存儲在行列構成的表中,這聽起來像是傳統的RDBMS,但實際上,用傳統RDBMS來類比hbase的數據模型沒有啥意思。不如把hbase的data model想象成多維map。 hbase術語 table:一個表包含很

原创 linux命令隨筆(2)

LINUX通過下面的命令可以開啓允許對外訪問的網絡端口: /sbin/iptables -I INPUT -p tcp –dport 8000 -j ACCEPT #開啓8000端口 /etc/rc.d/init.d/iptables s