第一章durid.io簡介

這個項目是在2013年底開源出來的,個人感覺比較適合廣告領域的實時大數據的OLAP(click/impression/conversion),開發作者之一有一個華人。

網址:http://druid.io

Druid是一個在大數據集上進行實時分析的開源基礎工具(海量實時的OLAP系統),在導入數據、增加數據量和過濾數據時都能有提供非常快的速度。另外也指出任意維度的數據抽取,平均數據增長的分佈,面對各種失敗場景。
特點:實時抽取、可擴展性和可用性、實時查詢、不可修改
使用場景:
  適合於快速交互,從大量的數據(每天從幾百GB到TB不等)中進行抽取
  進行實時的數據分析(多維度)
  支持24×7×365的服務


查詢請求格式是json,舉例如下:

{
  "queryType"   : "timeseries",
  "dataSource"  : "myData",
  "intervals"   : [ "2013-08-31/2013-09-01" ],
  "granularity" : "hour",
  "aggregations": [
    { "type":"count", "name":"rows" },
    { "type":"doubleSum", "fieldName":"edit_count", "name":"edit_count" }
  ]
}

老版本請求是json格式,但源碼裏面提供了SQL格式但沒有正式說明。


發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章