读书笔记——Kafka核心技术与实战（生产者分区机制原理）

原創

2019-09-03 08:07

为什么分区？

分区作用是提供负载均衡的能力，对数据分区是为了实现系统的高伸缩性 (High Scalability).
不同的分区可放置在不同节点的机器上（同一个分区的副本可以分布在不同的机器上），数据的访问操作都是针对分区这个粒度进行的，这样每个节点的机器都独立执行各自分区的读写请求；
增加新的节点机器来增加整理的吞吐量；

分区策略是什么？有哪些？

分区策略是指决定生产者将消息发送到哪个分区的算法
轮询算法：Round-robin
- 一个主题下有三个分区Pa，Pb，Pc，消息1、4、7被分配到Pa…
- 优秀的负载均衡表现，保证消息最大限度地分配到所有分区上，默认情况下是最合理的分区策略。
随机策略：Randomness
List partitions = cluster.partitionsForTopic(topic);
return ThreadLocalRandom.current().nextInt(partitions.size());
按消息键保存策略：Key-Ordering
List partitions = cluster.partitionsForTopic(topic);
return Math.abs(key.hashCode()) % partitions.size();
其他分区策略：基于地理位置的分区策略，针对大规模的 Kafka 集群。根据 broker 所在的 IP 分区
List partitions = cluster.partitionsForTopic(topic);
return partitions.stream().filter(p -> isSouth(p.leader().host())).map(PartitionInfo::partition).findAny().get();

总结：

Kafka 的消息组织方式实际上是三级架构：主题-分区-消息，主题下的消息会保存在某个分区下，不会在多个分区下保存多份。
分区机制是实现负载均衡和高吞吐的关键

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

Kafka技术知识总结之三——Kafka 高效文件存储设计

接上篇《Kafka技術知識總結之二——Kafka事務》三. Kafka 高效文件存儲設計參考地址：《kafka的消息消費機制、consumer的負載均衡、文件存儲機制》 Kafka 把 topic 中一個 parit

2020-07-08 09:16:27

Kafka技术知识总结之九——Kafka消息压缩与日志压缩

接上篇《Kafka技術知識總結之八——Kafka生產者結構》 9. Kafka 消息壓縮與日誌壓縮 9.1 消息壓縮日誌 v2 版本的壓縮，優化內容： RecordBatch 與 Record：對多條消息 (Record)

2020-07-08 09:16:27

Kafka技术知识总结之六——Kafka负载均衡策略

接上篇《Kafka技術知識總結之五——Kafka的高可用性》六. Kafka負載均衡策略 6.1 分區器分區器是生產者層面的負載均衡。Kafka 生產者生產消息時，根據分區器將消息投遞到指定的分區中，所以 Kafka 的負

2020-07-08 09:16:27

Kafka技术知识总结之五——Kafka的高可用性

接上篇《Kafka技術知識總結之四——Kafka 再均衡》五. 消息中間件的高可用性 5.1 消息中間件的高可用性 Kafka 實現高可用性的方式是進行 replication。對於 kafka，如果沒有提供高可用性機制，一

2020-07-08 09:16:27

Kafka技术知识总结之八——Kafka生产者结构

接上篇《Kafka技術知識總結之七——Kafka磁盤存儲》八. Kafka 生產者結構 Kafka Producer 主要有三個部分組成：主線程、Sender 線程、RecordAccumulator。主線程：執行序列化

2020-07-08 09:16:27

Kafka技术知识总结之二——Kafka事务

接上篇《Kafka技術知識總結之一——Kafka 的元素，組成，架構》二. Kafka 事務參考地址：《【乾貨】Kafka 事務特性分析》 2.1 Kafka 事務簡述 Kafka 事務與數據庫的事務定義基本類似，主

2020-07-08 09:16:27

Kafka技术知识总结之七——Kafka磁盘存储

接上篇《Kafka技術知識總結之六——Kafka負載均衡策略》七. 磁盤存儲參考地址：《Kafka如何實現每秒上百萬的高併發寫入》《深入理解 Kafka：核心設計與實踐原理》5.5 章節 Kafka 在大數據領域有

2020-07-08 09:16:27

Kafka技术知识总结之四——Kafka 再均衡

接上篇《Kafka技術知識總結之三——Kafka 高效文件存儲設計》四. Kafka 再均衡原理 4.1 消費者再均衡 Kafka 通過消費組協調器 (GroupCoordinator) 與消費者協調器 (Consumer

2020-07-08 09:16:27

Kafka技术知识总结之一——Kafka 的元素，组成，架构

一. Kafka 的元素，組成，架構 1.1 Kafka 的基本組成 Kafka將消息以topic爲單位進行歸納將向Kafka topic發佈消息的程序成爲producers. 將預訂topics並消費消息的程序成爲consum

2020-07-08 09:16:27

ZooKeeper 一致性协议 ZAB 原理，了解一下

一致性協議有很多種，比如 Paxos，Raft，2PC，3PC等等，在這講一種協議，ZAB 協議，該協議應該是所有一致性協議中生產環境中應用最多的了。爲什麼？因爲它是爲 Zookeeper 設計的分佈式一致性協議！ 1. 什麼是

毛发旺盛的程序员

2020-07-08 12:27:20

Kafka 集群环境搭建

序言說明下安裝環境.在centos7上安裝Kafka集羣環境. Kafka 依賴Java環境,所以需要提前配置.Kafka有自帶的Zookeeper,但是一般不用. Zookeeper集羣

2020-07-08 12:24:19

flink读kafka报错：Undefined offset with no reset policy for partitions

Caused by: org.apache.kafka.clients.consumer.NoOffsetForPartitionException: Undefined offset with no reset policy for

2020-07-08 10:43:26

基于docker搭建zookeeper集群、kafka集群（多台真机之间的集群）

基於docker搭建zookeeper集羣、kafka集羣---二（多臺真機之間的集羣）

超级大超越

2020-07-08 09:04:39

【kafka】为什么快(why‘s kafka so fast)？

大家好我又來了！我先提前說下，本文其實是比較早之前我整理給自己看的，那時候是看到外網有一篇文章說到這個事情，具體作者是誰我已經忘記了（因爲原文已經訪問不了，好像是因爲域名過期了），但是其實大家直接搜索“why's kafka so fas

2020-07-08 08:30:23

阿里云Kafka坑点

Topic管理裏的分區狀態中的消息總量是不準的，消息被消費完了還是會存在

2020-07-08 05:44:58

24小時熱門文章

最新文章

最新評論文章