Kafka源码解读——kafka配置文件_Configs

原創

2019-06-11 09:09

Kafka源码解读——配置文件_Configs（间断持续更新......）

目录

Producer Configs配置
Consumer Configs配置
Kafka Connect Configs配置

以下配置中没有的请查看官网原文：http://kafka.apache.org/documentation/

一、Producer Configs配置

名称	释义
key.serializer	key序列化类
value.serializer	value序列化类
acks	设置为0，则生产者根本不会等待服务器的任何确认。记录将立即添加到套接字缓冲区并被视为已发送。在这种情况下，无法保证服务器已收到记录，重试配置将不会生效（因为客户端通常不知道任何故障）。为每个记录返回的偏移量将始终设置为-1 设置为1，这意味着领导者会将记录写入其本地日志，但不会等待所有追随者的完全确认。在这种情况下，如果领导者在确认记录后立即失败，但在追随者复制记录之前，则记录将丢失。设置为all，这意味着领队将等待完整的同步副本集确认记录。这可以保证只要至少有一个同步副本保持活动状态，记录就不会丢失。这是最有力的保证。这相当于ACKS=-1设置。
bootstrap.servers	用于建立与Kafka群集的初始连接的主机/端口对列表。客户机将使用所有服务器，而不管在此处指定用于引导的服务器是什么，此列表只影响用于发现完整服务器集的初始主机。此列表的格式应为host1:port1,host2:port2，…。由于这些服务器只是用于初始连接以发现完整的群集成员身份（可能会动态更改），因此此列表不需要包含完整的服务器集（但是，如果服务器关闭，您可能需要多个服务器）。
buffer.memory	官方默认大小：33554432字节（32mb） producer可用于缓冲等待发送到服务器的记录的内存总字节数。如果记录的发送速度超过了它们可以传递到服务器的速度，则生产者将阻塞，阻塞时间由ax.block.ms定义，之后将引发异常。此设置应大致等于生产者将使用的总内存，但不是绝对的根据实际传输数据定义，因为并非生产者使用的所有内存都用于缓冲。一些额外的内存将用于压缩（如果启用了压缩）以及维护处理中的请求。
compression.type	生产者生成的所有数据的压缩类型。默认值为无（即无压缩）。有效值为none、gzip、snappy、lz4或zstd。压缩是整批数据，因此分批的效果也会影响压缩比（越多分批意味着更好的压缩）。压缩参考：https://www.jianshu.com/p/d69e27749b00
retries	设置一个大于零的值将导致客户端重新发送任何发送失败并可能出现暂时性错误的记录。请注意，此重试与客户端在收到错误后重新发送记录的情况相同。如果不将max.in.flight.requests.per.connection设置为1，则允许重试可能会更改记录的顺序，因为如果将两个批发送到单个分区，而第一个批失败并重试，但第二个批成功，则第二批中的记录可能会首先出现。注意：另外，如果delivery.timeout.ms配置的超时在成功确认之前先过期，则在重试次数用完之前，生成请求将失败。通常，用户应该不设置此配置，而是使用delivery.timeout.ms来控制重试行为。
ssl.key.password	密钥存储文件中私钥的密码。这对于客户是可选的。
ssl.keystore.location	密钥存储文件的位置。这对于客户端是可选的，可以用于客户端的双向身份验证。
ssl.keystore.password	密钥存储文件的存储密码。这对于客户机是可选的，只有在ssl.keystore中才需要。位置配置。
ssl.truststore.location	信任存储文件的位置。
ssl.truststore.password	信任存储文件的密码。如果没有设置密码，对信任库的访问仍然可用，但已禁用完整性检查。

二、Consumer Configs配置

名称	释义
key.deserializer	同producer，不再解释
value.deserializer	同producer，不再解释
bootstrap.servers	同producer，不再解释
fetch.min.bytes	请求返回的最小数据量，如果请求的数据量不够这个值，则会继续请求，超过了请求时间之后，会立即fetch，将此值设置大于1可以提高请求吞吐量，缺点是会有延迟。
group.id	标识消费者组的唯一字符串，如果消费者使用subscribe(topic)或基于kafka的偏移管理策略，则需要配置该属性
heartbeat.interval.ms	用于确保消费者的会话保持活动的状态，或者在consumer加入、离开组时，保持组内平衡；值必须低于<session.timeout.ms>，通常是不高于1/3，也可以更小，控制正常的、再平衡的预期时间
max.partition.fetch.bytes	官方默认值：1048576字节（1mb）服务器返给每个分区的最大数据量，由消费者批量获取，如果获取第一个非空分区的第一个批处理记录大于此值，则会回退，以防止consumer阻塞。最大批记录大小由<message.max.bytes>（broker config）或<max.message.bytes>（topic config） <fetch.max.bytes>用于限制consumer请求的记录大小
session.timeout.ms	Kafka组管理者会检测consumer超时，consumer定期向broker节点发送心跳表示它还活着如果在超时之前broker未收到consumer的心跳，那么该broker会移除当前consumer，consumer组会重新找一个consumer来消费注意：此值的范围为：<group.min.session.timeout.ms>和<group.max.session.timeout.ms>之间（broker config）
ssl.key.password	同producer，不再解释
ssl.keystore.location	同producer，不再解释
ssl.keystore.password	同producer，不再解释
ssl.truststore.location	同producer，不再解释
ssl.truststore.password	同producer，不再解释
auto.offset.reset	官方默认值：latest；取值范围 [latest, earliest, none] 如果在Kafka中没有初始化offet或者服务器上没有当前offset（例如：该数据已被删除该怎么办？） earliest：自动将offset设置为最早的offset latest：自动将offset设置为最新的offset none：如果在consumer组里面没有找到之前的offset，则向该consumer抛异常 anything else：向consumer抛异常

三、Kafka Connect Configs配置

名称	释义
config.storage.topic	存储connector的topic name
group.id	标识woker连接的集群组的字符串
key.converter	转换器类，用于在Kafka连接格式和写入Kafka的序列化形式之间进行转换。控制了写或读Kafka的消息中的键的格式，因为它独立于connectors，所以它允许任何connectors使用任何序列化格式。常见的例子由Json、Avro。
offset.storage.topic	存储connectors偏移量的Kafka Topic的名称
status.storage.topic	存储connector和task状态的Kafka Topic名称
value.converter	与<key.converter>类似，这个设置value的转换器类。
bootstrap.servers	Kafka集群主机：端口列表注意：不需要全部都配上，因为只是为了初始化连接，获取整个集群的数据，但为了保险起见，最好多配几个，防止部分主机宕机。
heartbeat.interval.ms	默认值：3000ms 用于确保worker的会话保持活动的状态，或者新的worker加入、离开组时，保持组内平衡；值必须低于<session.timeout.ms>，通常是不高于1/3，也可以更小，控制正常的、再平衡的预期时间
rebalance.timeout.ms	默认值：60000ms 再平衡开始后，允许每个woker加入工作组的最大时间，基本上是对所有任务刷新数据量和提交偏移量所需的时间限制，超时之后，worker会从组内删除，导致提交offset失败。
session.timeout.ms	默认值：10000ms 用于检测worker故障导致的超时，worker定时发送心跳，表示自己还活着，如果该worker会话超时之前未收到心跳，那么worker将会从组内移除，并进行再平衡注意：此值的范围为：<group.min.session.timeout.ms>和<group.max.session.timeout.ms>之间
ssl.key.password
ssl.keystore.location
ssl.keystore.password
ssl.truststore.location
ssl.truststore.password
client.dns.lookup	控制客户端如何使用DNS查找。 use_all_dns_ips：当查找返回一个主机的多个IP地址时，将在连接失败之前；用于引导和通知servers resolve_canonical_bootstrap_servers_only：没一个都将被解析，单独作为一个规范名称列表
connections.max.idle.ms	默认值：540000ms 配置多长时间之后关闭空闲连接
receive.buffer.bytes	读取数据时使用的TCP接收缓冲区(SO_RCVBUF)的大小，如果值为-1，则用系统默认值。

（1）Sources Connectors Configs配置

名称	释义
name	全局唯一的名称
connector.class	连接器的类别名，必须是org.apache.kafka.connect.connector.Connector的子类，如果是org.apache.kafka.connect.file.FileStreamSinkConnector，可以用全名，可以用FileStreamSink，可以用FileStreamSinkConnector，简写。
tasks.max	此连接器使用的最大任务数
errors.retry.timeout	默认值：0 失败重连的最长持续时间，值为-1表示无限重试
errors.retry.delay.max.ms	连续重试尝试之间的最长持续时间，一旦达到这个限制，抖动将增加到延迟，以防止出现群体问题（不太理解，估计就是怕影响到整个Kafka集群吧）
errors.tolerance	默认值：none 连接操作期间的容错行为，none表示任何错误都将导致连接任务失败，all表示跳过有问题的记录，
errors.log.enable	默认值：false 值为true，将每个错误、失败操作的详细信息、有问题的记录，都将写入连接程序的日志里。默认为false，因此只有不可容忍的错误才会报错。
errors.log.include.messages	默认值：false 是否将导致失败的连接记录包含到日志中，默认是false，将组织记录key、value、header写入日志文件，尽管topic和分区号仍然会被log

（2）Sink Connectors Configs配置

名称	释义
name	全局唯一的标识
connector.class	连接器类别名，必须是org.apache.kafka.connect.connector.Connector的子类，可以写全名、FileStreamSink、FileStreamSinkConnector，使配置更简单
tasks.max	连接最大任务数
topics	使用的topic列表，用','分隔
topics.regex	topic列表的正则表达式，该正则会被编译成java.util.regex.Pattern，只能指定topic或topic.regex中的一个

四、Kafka Streams Configs配置

名称	释义
application.id	集群内流程需唯一标识，用处有3个： 1：默认客户端ID前缀 2：成员管理组ID 3：日志更新topic前缀
bootstrap.servers	略
replication.factor	默认值：1 流处理应用程序创建的更改日志topic和重分区topic的复制因子
state.dir	默认值：/tmp/kafka-streams
cache.max.bytes.buffering	所有线程之间缓存的最大字节数
client.id	用于内部的消费者、生产者和原始消费者的客户端ID的前缀，格式为“--streamthread--”

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

Kafka技术知识总结之三——Kafka 高效文件存储设计

接上篇《Kafka技術知識總結之二——Kafka事務》三. Kafka 高效文件存儲設計參考地址：《kafka的消息消費機制、consumer的負載均衡、文件存儲機制》 Kafka 把 topic 中一個 parit

2020-07-08 09:16:27

Kafka技术知识总结之九——Kafka消息压缩与日志压缩

接上篇《Kafka技術知識總結之八——Kafka生產者結構》 9. Kafka 消息壓縮與日誌壓縮 9.1 消息壓縮日誌 v2 版本的壓縮，優化內容： RecordBatch 與 Record：對多條消息 (Record)

2020-07-08 09:16:27

Kafka技术知识总结之六——Kafka负载均衡策略

接上篇《Kafka技術知識總結之五——Kafka的高可用性》六. Kafka負載均衡策略 6.1 分區器分區器是生產者層面的負載均衡。Kafka 生產者生產消息時，根據分區器將消息投遞到指定的分區中，所以 Kafka 的負

2020-07-08 09:16:27

Kafka技术知识总结之五——Kafka的高可用性

接上篇《Kafka技術知識總結之四——Kafka 再均衡》五. 消息中間件的高可用性 5.1 消息中間件的高可用性 Kafka 實現高可用性的方式是進行 replication。對於 kafka，如果沒有提供高可用性機制，一

2020-07-08 09:16:27

Kafka技术知识总结之八——Kafka生产者结构

接上篇《Kafka技術知識總結之七——Kafka磁盤存儲》八. Kafka 生產者結構 Kafka Producer 主要有三個部分組成：主線程、Sender 線程、RecordAccumulator。主線程：執行序列化

2020-07-08 09:16:27

Kafka技术知识总结之二——Kafka事务

接上篇《Kafka技術知識總結之一——Kafka 的元素，組成，架構》二. Kafka 事務參考地址：《【乾貨】Kafka 事務特性分析》 2.1 Kafka 事務簡述 Kafka 事務與數據庫的事務定義基本類似，主

2020-07-08 09:16:27

Kafka技术知识总结之七——Kafka磁盘存储

接上篇《Kafka技術知識總結之六——Kafka負載均衡策略》七. 磁盤存儲參考地址：《Kafka如何實現每秒上百萬的高併發寫入》《深入理解 Kafka：核心設計與實踐原理》5.5 章節 Kafka 在大數據領域有

2020-07-08 09:16:27

Kafka技术知识总结之四——Kafka 再均衡

接上篇《Kafka技術知識總結之三——Kafka 高效文件存儲設計》四. Kafka 再均衡原理 4.1 消費者再均衡 Kafka 通過消費組協調器 (GroupCoordinator) 與消費者協調器 (Consumer

2020-07-08 09:16:27

Kafka技术知识总结之一——Kafka 的元素，组成，架构

一. Kafka 的元素，組成，架構 1.1 Kafka 的基本組成 Kafka將消息以topic爲單位進行歸納將向Kafka topic發佈消息的程序成爲producers. 將預訂topics並消費消息的程序成爲consum

2020-07-08 09:16:27

ZooKeeper 一致性协议 ZAB 原理，了解一下

一致性協議有很多種，比如 Paxos，Raft，2PC，3PC等等，在這講一種協議，ZAB 協議，該協議應該是所有一致性協議中生產環境中應用最多的了。爲什麼？因爲它是爲 Zookeeper 設計的分佈式一致性協議！ 1. 什麼是

毛发旺盛的程序员

2020-07-08 12:27:20

Kafka 集群环境搭建

序言說明下安裝環境.在centos7上安裝Kafka集羣環境. Kafka 依賴Java環境,所以需要提前配置.Kafka有自帶的Zookeeper,但是一般不用. Zookeeper集羣

2020-07-08 12:24:19

flink读kafka报错：Undefined offset with no reset policy for partitions

Caused by: org.apache.kafka.clients.consumer.NoOffsetForPartitionException: Undefined offset with no reset policy for

2020-07-08 10:43:26

基于docker搭建zookeeper集群、kafka集群（多台真机之间的集群）

基於docker搭建zookeeper集羣、kafka集羣---二（多臺真機之間的集羣）

超级大超越

2020-07-08 09:04:39

ActiveMQ基本介绍以及Springboot整合ActiveMQ

一、什麼是消息中間件發送者將消息發送給消息服務器，消息服務器將消息存放在隊列中，在合適的時候再講消息轉發給接受者。在這種模式下，發送和接收是異步的，發送者無需進行等待，而且二者的生命週期不一定相同，發送消息的時候接收者不一定正在運行，

2020-07-08 10:42:16

使用Springboot集成ActiveMQ后发送邮件

Springboot集成ActiveMQ可以實現異步發送郵件一、創建生產者 1.1導入maven依賴 <parent> <groupId>org.springframework.boot</groupId>

2020-07-08 10:42:16

24小時熱門文章

python gdal 安装使用（Windows， python 3.6.8）

最新文章

最新評論文章