這個項目是在2013年底開源出來的,個人感覺比較適合廣告領域的實時大數據的OLAP(click/impression/conversion),開發作者之一有一個華人。
網址:http://druid.io
Druid是一個在大數據集上進行實時分析的開源基礎工具(海量實時的OLAP系統),在導入數據、增加數據量和過濾數據時都能有提供非常快的速度。另外也指出任意維度的數據抽取,平均數據增長的分佈,面對各種失敗場景。
特點:實時抽取、可擴展性和可用性、實時查詢、不可修改
使用場景:
適合於快速交互,從大量的數據(每天從幾百GB到TB不等)中進行抽取
進行實時的數據分析(多維度)
支持24×7×365的服務
查詢請求格式是json,舉例如下:
{
"queryType" : "timeseries",
"dataSource" : "myData",
"intervals" : [ "2013-08-31/2013-09-01" ],
"granularity" : "hour",
"aggregations": [
{ "type":"count", "name":"rows" },
{ "type":"doubleSum", "fieldName":"edit_count", "name":"edit_count" }
]
}
老版本請求是json格式,但源碼裏面提供了SQL格式但沒有正式說明。