clickHouse數據庫

ClickHouse是一個面向聯機分析處理(OLAP)的開源的面向列式存儲的DBMS,簡稱CK, 與Hadoop, Spark相比,ClickHouse很輕量級,由俄羅斯第一大搜索引擎Yandex於2016年6月發佈, 開發語言爲C++

ClickHouse的特點:

開源的列存儲數據庫管理系統,支持線性擴展,簡單方便,高可靠性,

容錯跑分快:比Vertica快5倍,比Hive快279倍,比MySQL快800倍,其可處理的數據級別已達到10億級別

功能多:支持數據統計分析各種場景,支持類SQL查詢,異地複製部署

clickHouse的性能:

低延遲:對於數據量(幾千行,列不是很多)不是很大的短查詢,如果數據已經被載入緩存,且使用主碼,延遲在50MS左右。
併發量:雖然 ClickHouse 是一種在線分析型數據庫,也可支持一定的併發。當單個查詢比較短時,官方建議 100 Queries / second。
寫入速度:在使用 MergeTree 引擎的情況下,寫入速度大概是 50 - 200 M / s,如果按照 1 K 一條記錄來算,大約每秒可寫入 50000 ~ 200000 條記錄每秒。如果每條記錄比較小的話寫入速度會更快

其主要的應用場景: 用於結構良好清晰且不可變的事件或日誌流分析

  Web和App分析,廣告網絡和RTB,電信,電子商務和金融,信息安全,監測和遙感,時間序列,商業智能,網絡遊戲,物聯網

需要注意的是: 由於clickHouse不支持事務操作, 顧不能作爲傳統數據庫來使用(OLTP),以及高請求率的鍵值訪問,Blob或文檔存儲,超標準化數據

安裝clickHouse:

添加yum源 (一行內容)
yum-config-manager --add-repo http://repo.red-soft.biz/repos/clickhouse/repo/clickhouse-el6.repo

執行安裝(一行內容)
yum install clickhouse-server clickhouse-client clickhouse-server-common clickhouse-compressor

啓動clickHouse
/etc/init.d/clickhouse-server start

啓動以後可以看到三個端口

9000端口,用於接受客戶端請求

9009端口,用於集羣複製數據

8123端口,http請求端口

登錄clickHouse:

第一種方式(連接本地): /etc/init.d/clickhouse-client
第二種方式(連接遠程): /etc/init.d/clickhouse-client --host=… --port=… --user=… --password=…

登錄後, 其基本操作採用類SQL的方式即可使用, 但需要注意, 在建表時候, 需要開啓多行查詢, 否則建表時候會報錯

開啓多行查詢的方式:

clickhouse-client -m  或者:  clickhouse-client --multiline
 

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章