Kafka（二）Kafka集羣搭建

環境描述

服務器名稱	系統	配置
Srv01.contoso.com	CentOS 7、Kafka_2.11-1.1.0	IP：172.16.48.163
Srv02.contoso.com	CentOS 7、Kafka_2.11-1.1.0	IP：172.16.48.149
Srv03.contoso.com	CentOS 7、Kafka_2.11-1.1.0	IP：172.16.48.154

Zookeeper集羣安裝不做贅述，請看Zookeeper詳解（二）：Zookeeper安裝和運行

安裝kafka集羣

下載Kafka安裝包：http://kafka.apache.org/downloads

下載之後解壓即可。（由於Kafka是用Scala語言開發，運行在JVM上，所以要先安裝JDK）

編輯Kafka服務的配置文件server.properties。這裏還有一個zookeeper.properties配置文件，該文件是如果你使用kafka自帶zookeeper那麼你就需要配置它。如果你有另外的zookeeper集羣那就忽略就好了。

配置要連接的zookeeper，我這裏就使用一臺。另外這個 /kafka的意思是給它指定一個節點。這個節點你需要提前建立。讓kafka把他需要的數據結構都建立在這個節點下，否則它會使用 “/”節點。

最少運行起來至少要配置四項，也就是上面的內容。

listeners   # kafka服務器監聽IP和端口，這裏也可以寫域名，只要能解析就行
broker.id   # 三臺服務器的ID不能相同，第一臺是0，第二臺是1，第三臺是2
log.dirs    # 日誌路徑
zookeeper.connect  # Zookeeper連接參數

# 另外我還配置了
message.max.bytes =5000000
default.replication.factor =2

配置好後把配置文件複製到其他2臺服務器上，並修改broker.id和listeners字段。下面啓動Kafka，進入bin目錄運行下面的命令，有兩種方式

# 第一種方式（推薦）
kafka-server-start.sh -daemon ../config/server.properties
# 第二種方式
nohup kafka-server-start.sh config/server.properties&

# 停止
kafka-server-stop.sh

查看進程和端口

按照同樣的方法啓動剩餘2臺。查看日誌

日誌名稱	說明
server.log	是kafka系統日誌，很常用
state-change.log	leader切換日誌，就是broker宕機副本切換
controller.log	kafka集羣中有一臺機器是控制器，那麼控制器角色的日誌就記錄在這裏

我們看看zookeeper裏面的三個節點註冊信息

測試生產者與消費者之間的消息發送，這是利用它自帶的腳本程序來創建生產者和消費者

kafka-console-producer.sh --broker-list 172.16.48.163:9092 --topic test1

kafka-console-consumer.sh --bootstrap-server 172.16.48.163:9092 --topic test1 --from-beginning

然後在生產者的>提示符後面輸入內容，那麼消費者就會收到

Kafka命令使用

說明：所有命令都要在bin目錄下執行，除非你配置了環境變量。 --zookeeper 172.16.48.163:2181/kafka 之所以後面加一個/kafka這個是因爲我在kafka配置文件中指明使用這個名稱空間。

# 創建主題
./kafka-topics.sh --create --zookeeper 172.16.48.163:2181/kafka --replication-factor 2 --partitions 1 --topic test9999

--replication-factor	該主題每個分區的副本數，不能大於broker數量。這個副本用於備份，假設每個分區有2個副本，那麼只有一個是leader負責讀寫，follower只是負責同步內容，對外提供讀寫的也是由leader提供。Leader宕機follower接管成爲新的leader。這裏的數量是包括Leader+Follwer的
--partitions	分區數量，控制將主題切分成多少個LOG。消費者數量應該和分區數量相等，如果超過則毫無意義。
--topic	主題名稱

# 刪除主題
kafka-topics.sh --delete --zookeeper 172.16.48.163:2181/kafka --topic test9999

# 查看所有主題
./kafka-topics.sh --list --zookeeper 172.16.48.163:2181/kafka

# 查看指定topic信息，從下圖可以看出當時建立這個topic的時候我們設置3個分區，每個分區的副本是3.
./kafka-topics.sh --describe --zookeeper 172.16.48.163:2181/kafka --topic BBB

PartiticonCount	顯示分區數量一共有多少
ReplicationFactor	副本因子是多少
Partition	分區編號
Leader	顯示Leader副本在哪個Broker上，這裏是不同分區會有不同，表示Leader在broker.id=0的服務器上。三個分區每個分區有三個副本，分區編號從0開始，所以這個Leader是說後面Replicas副本里面哪個是Leader。Leader副本提供讀寫，非Leader副本只做數據備份。從下圖可以看出分區0和1對外提供讀寫的副本都在broker 2上。當然這不是一個好現象，意味着這個服務器將處理一個主題的2個分區讀寫，我們要平均分開。
Replicas	顯示該partitions所有副本存儲在哪些節點上 broker.id 這個是配置文件中設置的，它包括leader和follower節點
Isr	顯示副本都已經同步的節點集合，這個集合的所有節點都是存活的，並且跟LEADER節點同步

# 平衡讀寫
kafka-preferred-replica-election.sh --zookeeper 172.16.48.163:2181/kafka

再次查看BBB主題發現Leader均衡了，3個分區的Leader副本由3個broker各自承擔一個。不像之前0和1分區的Leader副本都在broker 2上

# 線上集羣所有主題情況
./kafka-topics.sh --describe --zookeeper 172.16.48.163:2181/kafka

kafka服務器配置文件說明

# ----------------------系統相關----------------------
# broker的全局唯一編號，不能重複，和zookeeper的myid是一個意思
broker.id=0

# broker監聽IP和端口也可以是域名
listeners=PLAINTEXT://172.16.48.163:9092

# 用於接收請求的線程數量
num.network.threads=3

# 用於處理請求的線程數量，包括磁盤IO請求，這個數量和log.dirs配置的目錄數量有關，這裏的數量不能小於log.dirs的數量，
# 雖然log.dirs是配置日誌存放路徑，但是它可以配置多個目錄後面用逗號分隔
num.io.threads=8

# 發送緩衝區大小，也就是說發送消息先發送到緩衝區，當緩衝區滿了之後一起發送出去
socket.send.buffer.bytes=102400

# 接收緩衝區大小，同理接收到緩衝區，當到達這個數量時就同步到磁盤
socket.receive.buffer.bytes=102400

# 向kafka套接字請求最大字節數量，防止服務器OOM，也就是OutOfMemery，這個數量不要超過JAVA的堆棧大小，
socket.request.max.bytes=104857600

# 日誌路徑也就是分區日誌存放的地方，你所建立的topic的分區就在這裏面，但是它可以配置多個目錄後面用逗號分隔
log.dirs=/tmp/kafka-logs

# 消息體（也就是往Kafka發送的單條消息）最大大小，單位是字節，必須小於socket.request.max.bytes值
message.max.bytes =5000000

# 自動平衡由於某個broker故障會導致Leader副本遷移到別的broker，當之前的broker恢復後也不會遷移回來，有時候我們需要
# 手動進行平衡避免同一個主題不同分區的Leader副本在同一臺broker上，下面這個參數就是開啓自動平衡功能
auto.leader.rebalance.enable=true

# 設置了上面的自動平衡，當故障轉移後，隔300秒（默認）觸發一個定時任務進行平衡操作，而只有代理的不均衡率爲10%以上纔會執行
leader.imbalance.check.interval.seconds=300

# 設置代理的不均衡率，默認是10%
leader.imbalance.per.broker.percentage=10

# ---------------分區相關-------------------------

# 默認分區數量，當建立Topic時不指定分區數量，默認就1
num.partitions=1

# 是否允許自動創建topic ，若是false，就需要通過命令創建topic
auto.create.topics.enable =true
 
# 一個topic ，默認分區的replication個數 ，不得大於集羣中broker的個數
default.replication.factor =2

# ---------------日誌相關-------------------------

# segment文件默認會被保留7天的時間，超時的話就會被清理，那麼清理這件事情就需要有一些線程來做。
# 這裏就是用來設置恢復和清理data下數據的線程數量
num.recovery.threads.per.data.dir=1

# 日誌文件中每個segment的大小，默認爲1G。topic的分區是以一堆segment文件存儲的，這個控制每個segment的大小，當超過這個大小會建立一個新日誌文件
# 這個參數會被topic創建時的指定參數覆蓋，如果你創建Topic的時候指定了這個參數，那麼你以你指定的爲準。
log.segment.bytes=1073741824

# 數據存儲的最大時間 超過這個時間 會根據log.cleanup.policy設置的策略處理數據，也就是消費端能夠多久去消費數據
# log.retention.bytes和log.retention.minutes|hours任意一個達到要求，都會執行刪除
# 如果你創建Topic的時候指定了這個參數，那麼你以你指定的爲準
log.retention.hours|minutes=168

# 這個參數會在日誌segment沒有達到log.segment.bytes設置的大小默認1G的時候，也會強制新建一個segment會被
# topic創建時的指定參數覆蓋
log.roll.hours=168 

# 上面的參數設置了每一個segment文件的大小是1G，那麼就需要有一個東西去定期檢查segment文件有沒有達到1G，多長時間去檢查一次，
# 就需要設置一個週期性檢查文件大小的時間（單位是毫秒）。
log.retention.check.interval.ms=300000

# 日誌清理策略 選擇有：delete和compact 主要針對過期數據的處理，或是日誌文件達到限制的額度，
# 如果你創建Topic的時候指定了這個參數，那麼你以你指定的爲準
log.cleanup.policy = delete

# 是否啓用日誌清理功能，默認是啓用的且清理策略爲compact，也就是壓縮。
log.cleaner.enable=false

# 日誌清理時所使用的緩存空間大小
log.cleaner.dedupe.buffer.size=134217728

# log文件"sync"到磁盤之前累積的消息條數，因爲磁盤IO操作是一個慢操作,但又是一個"數據可靠性"的必要手段
# 所以此參數的設置,需要在"數據可靠性"與"性能"之間做必要的權衡.
# 如果此值過大,將會導致每次"fsync"的時間較長(IO阻塞)
# 如果此值過小,將會導致"fsync"的次數較多,這也意味着整體的client請求有一定的延遲.
# 物理server故障,將會導致沒有fsync的消息丟失.
log.flush.interval.messages=9223372036854775807

# 檢查是否需要固化到硬盤的時間間隔
log.flush.scheduler.interval.ms =3000
 
# 僅僅通過interval來控制消息的磁盤寫入時機,是不足的.
# 此參數用於控制"fsync"的時間間隔,如果消息量始終沒有達到閥值,但是離上一次磁盤同步的時間間隔
# 達到閥值,也將觸發.
log.flush.interval.ms = None

# --------------------------複製(Leader、replicas) 相關-------------------
# partition leader與replicas之間通訊時,socket的超時時間
controller.socket.timeout.ms =30000

# replicas響應partition leader的最長等待時間，若是超過這個時間，就將replicas列入ISR(in-sync replicas)，
# 並認爲它是死的，不會再加入管理中
replica.lag.time.max.ms =10000

# follower與leader之間的socket超時時間
replica.socket.timeout.ms=300000

# leader複製時候的socket緩存大小
replica.socket.receive.buffer.bytes=65536

# replicas每次獲取數據的最大大小
replica.fetch.max.bytes =1048576

# replicas同leader之間通信的最大等待時間，失敗了會重試
replica.fetch.wait.max.ms =500

# fetch的最小數據尺寸,如果leader中尚未同步的數據不足此值,將會阻塞,直到滿足條件
replica.fetch.min.bytes =1

# leader 進行復制的線程數，增大這個數值會增加follower的IO
num.replica.fetchers=1

# 最小副本數量
min.insync.replicas = 2

Kafka（二）Kafka集羣搭建

如何基於surging跨網關跨語言進行緩存降級

2024合集

程序員天天 CURD，怎麼才能成長，職業發展的思考(2)

移位操作搞定兩數之商

教你用Perl實現Smgp協議

如何通過前端表格控件在10分鐘內完成一張分組報表？

win11關閉自動檢測病毒刪文件

通用代碼生成器簡介

lightdb 單機模式下數據庫平移

千兆寬帶實際網速能到達多少？

Zookeeper詳解（二）：Zookeeper安裝和運行

Zookeeper詳解（一）：分佈式與Zookeeper

Zookeeper詳解（三）：Zookeeper中的Znode特性

我的友情鏈接

TCP/IP之（四）Delay ack 和 Nagle算法

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結