原创 Ambari 自定義 Alert

原文: https://www.ibm.com/developerworks/cn/opensource/os-cn-bigdata-ambari3/ Ambari 最新動態 2015 年,Ambari 發展的比較快,最新的發佈版

原创 superset 使用 presto 獲取數據緩慢問題解決

排查思路 原文鏈接: https://editor.csdn.net/md/?articleId=104540547 1.使用 traceback.print_stack() 加入到pyhive源碼中,如 venv/lib/pyt

原创 Spring Cloud Netflix 教程(Feign+Ribbon+Hystrix)

說明 目前這三種組件的講解資料較少,包括官方的wiki也只是將配置項列出,沒有告知如何整合Spring Cloud來做細粒度更小的控制.該工程會提供一些實例,並告知閱讀哪些源碼來解決問題.service1 僅用於被 service0 調

原创 Java 8併發工具包漫遊指南

Java 8併發工具包由3個包組成,分別是java.util.concurrent、java.util.concurrent.atomic和java.util.concurrent.locks,提供了大量關於併發的接口、類、原子操作類、

原创 歸納決策樹ID3(Java實現)

先上問題吧,我們統計了14天的氣象數據(指標包括outlook,temperature,humidity,windy),並已知這些天氣是否打球(play)。如果給出新一天的氣象指標數據:sunny,cool,high,TRUE,判斷

原创 HBase vs. MongoDB vs. MySQL vs. Oracle vs. Redis,三大主流開源 NoSQL 數據庫的 PK 兩大主流傳統 SQL 數據庫

HBase vs. MongoDB vs. MySQL vs. Oracle vs. Redis,三大主流開源 NoSQL 數據庫的 PK 兩大主流傳統 SQL 數據庫 類別 HBase MongoDB MySQL Oracle

原创 Spark 踩坑記錄

Encoders.bean(Person.class) 調用報異常 異常信息 Exception in thread "main" java.lang.UnsupportedOperationException: Cannot

原创 Spring Cloud Sleuth 教程

1.說明:     1.1.使用註解方式,來使用spring cloud sleuth.      1.2.需要自行安裝zipkin. 2.源碼: https://github.com/leoChaoGlut/spring-cloud-

原创 Spring Cloud Config 配置中心 教程

1.說明     1.1.使用Spring Security進行配置訪問鑑權     1.2.目前使用的是native形式管理配置文件,vault或git形式請自行配置 2.源碼: https://github.com/leoChaoGl

原创 Spring Cloud Bus 教程

1.說明     1.1.使用kafka作爲MQ 2.源碼: https://github.com/leoChaoGlut/spring-cloud-tutorial/tree/master/tutorial-bus

原创 我必須得告訴大家的MySQL優化原理

說起MySQL的查詢優化,相信大家收藏了一堆奇淫技巧:不能使用SELECT *、不使用NULL字段、合理創建索引、爲字段選擇合適的數據類型..... 你是否真的理解這些優化技巧?是否理解其背後的工作原理?在實際場景下性能真有提升嗎?我想

原创 Apache Kylin無法啓動,卡在 “Logging initialized using configuration..."

前置條件 完成Hadoop Environment 配置 通過 “bin/check-env.sh” 問題重現 執行 bin/kylin.sh start,然後控制檯出現如下信息後,就沒有下文了. log4j:WARN N

原创 Kafka 踩坑記錄

1.Java Client Consumer 實現 "--from-beginning": KafkaConsumer JavaDoc 的"Controlling The Consumer's Position"章節中提到,使用" see

原创 解決時區導致druid任務構建失敗的問題:No buckets?? seems there is no data to index.

===== update 2017-07-12 begin ===== No Buckets 的主要原因是: load batch data 的時候,intervals 的範圍小於被上傳數據的時間範圍 ===== update 2017-

原创 Parquet與ORC性能測試報告

一、環境說明 Hadoop集羣:使用測試hadoop集羣,節點: hadoop230 hadoop231 hadoop232 hadoop233 這幾臺機器配置一樣,具體參數可參考如下:  CPU數量:2個  CPU線程數:32個