原创 Apache Druid 中文翻譯 - 設計(Design)

設計 德魯伊具有多進程、分佈式的架構,並且在設計爲雲友好且易操作的系統。每種Druid進程類型(指Druid框架之中的各種組件)都可以獨立配置和水平擴展,從而爲您的集羣提供最大的靈活性。這種設計還提高了容錯能力:一個組件的故障不會立即影

原创 Apache Druid 中文翻譯 - 段(Segments)

Segments Apache Druid將其索引(index)存儲在段(Segments)文件中,該段文件按時間進行分區(partitioned)。在默認設置中,Druid爲每個時間間隔(time interval)創建一個段文件,其

原创 Apache Druid 中文翻譯- 快速開始(Quickstart)

  在本快速入門中,我們將下載Druid並將其設置在一臺計算機上。完成此初始設置後,集羣將準備好加載數據。 在開始快速入門之前,閱讀常規Druid概述和 攝入概述很有幫助,因爲本教程將參考這些頁面上討論的概念。 先決條件 軟件 你會需要

原创 Apache Druid 中文翻譯-單機部署(Single server deployment)

單機部署 Druid自帶了一組用於單機部署的啓動腳本和參考配置: nano-quickstart micro-quickstart small medium large xlarge 其中,micro-quickstart的配置規格適合

原创 Apache Druid 中文翻譯-集羣部署(Clustered deployment)

Apache Druid被設計爲作爲可水平拓展、容錯的集羣進行部署。 在本文檔中,我們將設置一個簡單的集羣,並討論如何對其進行進一步配置以滿足您的需求。 這個簡單的集羣將具有以下特點: 一臺部署協調器(Coordinator )and 統

原创 Apache Druid 中文翻譯- Introduction 簡介

什麼是Druid ? Apache Druid是一個實時分析數據庫,旨在對大型數據集進行快速的切片和切分分析(“ OLAP ”查詢)。Druid最常用作數據庫,以支持對實時攝取,快速查詢性能和高正常運行時間很重要的用例。因此,Druid通

原创 A HostProvider may not be empty --記一次線上配置問題的來龍去脈和解決方案

起源 公元XXX年,新上線的mapreduce任務在線上執行時遇到問題,主要報錯如下: A HostProvider may not be empty, 根據報錯信息,定位到如下代碼: org.apache.zookeeper.clien

原创 confluence中文顯示亂碼問題

解決方法1:修改數據庫默認編碼爲utf8   方法來自: https://blog.csdn.net/lovely_xinyi/article/details/45581883 使用時,發現中文有問號,刷新又正常,解決辦法: 在mysq

原创 Spark中RDD 持久化操作 cache與persist區別

Spark中RDD 持久化操作 cache與persist區別 原創小鵝鵝 最後發佈於2018-07-02 15:33:13 閱讀數 1712  收藏 展開 環境/背景 Spark 2.3.0 Scala 2.11 Java 1.8 在進

原创 深度預警:深入理解HBase的系統架構

大數據首席數據師 2018.12.24 17:26:54字數 4,738閱讀 155   https://www.jianshu.com/p/ecf849648cd0     HBase的構成 物理上來說,HBase是由三種類型的服務器以