讀書筆記——Kafka核心技術與實戰（生產者分區機制原理）

原創

2019-09-03 08:07

爲什麼分區？

分區作用是提供負載均衡的能力，對數據分區是爲了實現系統的高伸縮性 (High Scalability).
不同的分區可放置在不同節點的機器上（同一個分區的副本可以分佈在不同的機器上），數據的訪問操作都是針對分區這個粒度進行的，這樣每個節點的機器都獨立執行各自分區的讀寫請求；
增加新的節點機器來增加整理的吞吐量；

分區策略是什麼？有哪些？

分區策略是指決定生產者將消息發送到哪個分區的算法
輪詢算法：Round-robin
- 一個主題下有三個分區Pa，Pb，Pc，消息1、4、7被分配到Pa…
- 優秀的負載均衡表現，保證消息最大限度地分配到所有分區上，默認情況下是最合理的分區策略。
隨機策略：Randomness
List partitions = cluster.partitionsForTopic(topic);
return ThreadLocalRandom.current().nextInt(partitions.size());
按消息鍵保存策略：Key-Ordering
List partitions = cluster.partitionsForTopic(topic);
return Math.abs(key.hashCode()) % partitions.size();
其他分區策略：基於地理位置的分區策略，針對大規模的 Kafka 集羣。根據 broker 所在的 IP 分區
List partitions = cluster.partitionsForTopic(topic);
return partitions.stream().filter(p -> isSouth(p.leader().host())).map(PartitionInfo::partition).findAny().get();

總結：

Kafka 的消息組織方式實際上是三級架構：主題-分區-消息，主題下的消息會保存在某個分區下，不會在多個分區下保存多份。
分區機制是實現負載均衡和高吞吐的關鍵

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

Kafka技術知識總結之三——Kafka 高效文件存儲設計

接上篇《Kafka技術知識總結之二——Kafka事務》三. Kafka 高效文件存儲設計參考地址：《kafka的消息消費機制、consumer的負載均衡、文件存儲機制》 Kafka 把 topic 中一個 parit

2020-07-08 09:16:27

Kafka技術知識總結之九——Kafka消息壓縮與日誌壓縮

接上篇《Kafka技術知識總結之八——Kafka生產者結構》 9. Kafka 消息壓縮與日誌壓縮 9.1 消息壓縮日誌 v2 版本的壓縮，優化內容： RecordBatch 與 Record：對多條消息 (Record)

2020-07-08 09:16:27

Kafka技術知識總結之六——Kafka負載均衡策略

接上篇《Kafka技術知識總結之五——Kafka的高可用性》六. Kafka負載均衡策略 6.1 分區器分區器是生產者層面的負載均衡。Kafka 生產者生產消息時，根據分區器將消息投遞到指定的分區中，所以 Kafka 的負

2020-07-08 09:16:27

Kafka技術知識總結之五——Kafka的高可用性

接上篇《Kafka技術知識總結之四——Kafka 再均衡》五. 消息中間件的高可用性 5.1 消息中間件的高可用性 Kafka 實現高可用性的方式是進行 replication。對於 kafka，如果沒有提供高可用性機制，一

2020-07-08 09:16:27

Kafka技術知識總結之八——Kafka生產者結構

接上篇《Kafka技術知識總結之七——Kafka磁盤存儲》八. Kafka 生產者結構 Kafka Producer 主要有三個部分組成：主線程、Sender 線程、RecordAccumulator。主線程：執行序列化

2020-07-08 09:16:27

Kafka技術知識總結之二——Kafka事務

接上篇《Kafka技術知識總結之一——Kafka 的元素，組成，架構》二. Kafka 事務參考地址：《【乾貨】Kafka 事務特性分析》 2.1 Kafka 事務簡述 Kafka 事務與數據庫的事務定義基本類似，主

2020-07-08 09:16:27

Kafka技術知識總結之七——Kafka磁盤存儲

接上篇《Kafka技術知識總結之六——Kafka負載均衡策略》七. 磁盤存儲參考地址：《Kafka如何實現每秒上百萬的高併發寫入》《深入理解 Kafka：核心設計與實踐原理》5.5 章節 Kafka 在大數據領域有

2020-07-08 09:16:27

Kafka技術知識總結之四——Kafka 再均衡

接上篇《Kafka技術知識總結之三——Kafka 高效文件存儲設計》四. Kafka 再均衡原理 4.1 消費者再均衡 Kafka 通過消費組協調器 (GroupCoordinator) 與消費者協調器 (Consumer

2020-07-08 09:16:27

Kafka技術知識總結之一——Kafka 的元素，組成，架構

一. Kafka 的元素，組成，架構 1.1 Kafka 的基本組成 Kafka將消息以topic爲單位進行歸納將向Kafka topic發佈消息的程序成爲producers. 將預訂topics並消費消息的程序成爲consum

2020-07-08 09:16:27

ZooKeeper 一致性協議 ZAB 原理，瞭解一下

一致性協議有很多種，比如 Paxos，Raft，2PC，3PC等等，在這講一種協議，ZAB 協議，該協議應該是所有一致性協議中生產環境中應用最多的了。爲什麼？因爲它是爲 Zookeeper 設計的分佈式一致性協議！ 1. 什麼是

毛发旺盛的程序员

2020-07-08 12:27:20

Kafka 集羣環境搭建

序言說明下安裝環境.在centos7上安裝Kafka集羣環境. Kafka 依賴Java環境,所以需要提前配置.Kafka有自帶的Zookeeper,但是一般不用. Zookeeper集羣

2020-07-08 12:24:19

flink讀kafka報錯：Undefined offset with no reset policy for partitions

Caused by: org.apache.kafka.clients.consumer.NoOffsetForPartitionException: Undefined offset with no reset policy for

2020-07-08 10:43:26

基於docker搭建zookeeper集羣、kafka集羣（多臺真機之間的集羣）

基於docker搭建zookeeper集羣、kafka集羣---二（多臺真機之間的集羣）

超级大超越

2020-07-08 09:04:39

【kafka】爲什麼快(why‘s kafka so fast)？

大家好我又來了！我先提前說下，本文其實是比較早之前我整理給自己看的，那時候是看到外網有一篇文章說到這個事情，具體作者是誰我已經忘記了（因爲原文已經訪問不了，好像是因爲域名過期了），但是其實大家直接搜索“why's kafka so fas

2020-07-08 08:30:23

阿里雲Kafka坑點

Topic管理裏的分區狀態中的消息總量是不準的，消息被消費完了還是會存在

2020-07-08 05:44:58

24小時熱門文章

最新文章

最新評論文章