原创 GZIPInputStream報EOFException(異常的getmessage是null)

前言 有個前人留下的日誌清洗的程序,日誌源是gz包的格式,後臺拿到gz後進行解壓並清洗日誌,報錯代碼如下: //代碼裏的file對象即爲日之源的gz文件 BufferedReader bufferedReader = new Buffe

原创 Comparator使用記錄

1、實體類 @Entity @Table(name = "game_server_pay") public class EntityGameServerPay implements Serializable{ private stat

原创 Impala集成hive

原文鏈接:https://blog.csdn.net/lukabruce/article/details/82970502 https://blog.csdn.net/lukabruce/art

原创 Mysql:ON 與 WHERE 的區別

原文鏈接:https://www.jianshu.com/p/d923cf8ae25f 即使你認爲自己已對 MySQL 的 LEFT JOIN 理解深刻,但我敢打賭,這篇文章肯定能讓你學會點東西

原创 hibernate的分頁數據錯亂問題

前言 使用hibernate的分頁功能時,發現第一頁和第二頁的數據出現重複現象 原因 hibernate 分頁查詢 的第一頁 和第二頁之後的sql 不一樣 第一頁時是: select * from (myquery) where rown

原创 MYSQL單列索引和組合索引分析

概念: 單列索引:即一個索引只包含單個列,一個表可以有多個單列索引,但這不是組合索引。 創建語句如下: /*=======================================================

原创 關於Kafka 的消息日誌Offset 的瞭解

轉:http://blog.csdn.net/looklook5/article/details/42008079 之前在做Kafka 整合Storm的時候,因爲對Kafka 不是很熟,考慮過這樣的一個場景問題,針對一個Topic,Kaf

原创 Kafka爲什麼那麼快的祕密

網上有很多Kafka的測試文章,測試結果通常都是“吊打”其他MQ。感慨它的牛B之餘我覺得必要仔細分析一下它如此快速的原因。這篇文章不同於其他介紹Kafka使用或者技術實現的文章,我會重點解釋——爲什麼真快。(當然不是因爲它用了Scala!

原创 如何爲Kafka集羣選擇合適的Partitions數量

        這是許多kafka使用者經常會問到的一個問題。本文的目的是介紹與本問題相關的一些重要決策因素,並提供一些簡單的計算公式。 文章目錄 1 越多的分區可以提供更高的吞吐量 2 越多的分區需要打開更多地文件句柄 3 更

原创 kafka的High Level Consumer Rebalance

前言 kafka的consumer分爲High Level Consumer和Low Level Consumer。本文主要講High Level Consumer Rebalance,至於High Level Consumer和Low 

原创 kafka的leader選舉過程(詳細)

前言 要理解kafka的leader選舉,先了解下zookeeper的基本操作 zookeeper的基本操作 備註:本章主要是指作爲zookeeper的客戶端的基本操作 1)四種節點類型 PERSISTI   PERSIST_SEQUEN

原创 zookeeper的廣播模式和恢復模式

zookeeper是什麼 zookeeper是一個高性能分佈式應用協調服務。zookeeper主要可以提供如下的服務:(1)Naming Service;(2)配置管理;(3)Leader Election;(4)服務發現;(5)同步;(

原创 kafka的數據副本機制(詳細解讀)

前言 爲了數據的安全性,我們在實際的工作中,不可避免的需要考慮kafka的數據備份問題,否則數據丟失了,就無法恢復了。所以數據的備份機制是很重要的。 副本介紹 正常情況下,kafka裏的數據都不能只有一份。假設我們保存了N個副本,即top

原创 使用filesystemxmlapplicationcontext,絕對路徑不生效問題

前言 很多人在使用filesystemxmlapplicationcontext(“絕對路徑”),即使加了絕對路徑時,發現任然是無效的。例如下圖的代碼,運行後任然是無效的。 ApplicationContext fsxac = new

原创 CAP理論

前言 CAP理論是Consistency、Availability和Partition tolerance這單個單詞的縮寫。 1)Consistency(一致性) 強一致性:數據更新後,可以立即感知到該更新。 弱一致性:數據更新後,允許部