图文讲解Kafka如何应用NIO实现网络通信


  点击上方“JavaEdge”,关注公众号

设为“星标”,好文章不错过!


网络通信层




Kafka网络通信组成



  • SocketServer

    核心,主要实现了Reactor模式,用于处理外部多个Clients(广义Clients,可能包含Producer、Consumer或其他Broker)的并发请求,并负责将处理结果封装进Response中,返还给Clients。SocketServer是Kafka网络通信层中最重要的子模块。它的Acceptor线程、Processor线程和RequestChannel等对象,都是实施网络通信的重要组成部分。

  • KafkaRequestHandlerPool

    I/O线程池,里面定义了若干个I/O线程,用于执行真实的请求处理逻辑。KafkaRequestHandlerPool线程池定义了多个KafkaRequestHandler线程,而KafkaRequestHandler线程是真正处理请求逻辑的地方。


两者共通处在于SocketServer中定义的RequestChannel对象和Processor线程。在代码中,线程本质都是Runnable类型,不管是Acceptor类、Processor还是KafkaRequestHandler类。

相较于KafkaRequestHandler,Acceptor和Processor最多算请求和响应的“搬运工”。


SocketServer



  • AbstractServerThread类 这是Acceptor线程和Processor线程的抽象基类

  • Acceptor线程类 接收和创建外部TCP连接的线程。每个SocketServer实例只会创建一个Acceptor线程。唯一作用创建连接,并将接收到的Request传递给下游的Processor线程。

  • Processor线程类 每个SocketServer实例默认创建若干个(num.network.threads)Processor线程。负责

    • 将接收到的Request添加到RequestChannel的Request队列

    • 将Response返还给Request发送方

  • Processor伴生对象类 仅定义一些与Processor线程相关的常见监控指标和常量等,如Processor线程空闲率等。

  • ConnectionQuotas类 

  • TooManyConnectionsException类 

  • SocketServer类 实现了对以上所有组件的管理和操作,如创建和关闭Acceptor、Processor线程。

  • SocketServer伴生对象类 定义了一些有用的常量,同时明确了SocketServer组件中的哪些参数是允许动态修改的。




Acceptor线程



经典Reactor模式的Dispatcher接收外部请求并分发给下面的实际处理线程。在Kafka中,这个Dispatcher就是Acceptor线程。


参数



endPoint

定义的Kafka Broker连接信息,比如PLAINTEXT://localhost:9092 

sendBufferSize

recvBufferSize

如果在你的生产环境中,Clients与Broker的通信网络延迟很大(RTT>10ms),推荐增加控制缓冲区大小的两个参数:sendBufferSize和recvBufferSize,一般默认值100KB太小了。


Acceptor线程的自定义属性



  • nioSelector Java NIO库的Selector对象实例,也是后续所有网络通信组件实现Java NIO机制的基础

  • processors 网络Processor线程池。Acceptor线程在初始化时,需要创建对应的网络Processor线程池。Processor线程是在Acceptor线程中管理和维护的。


Processor相关API



  • addProcessors  

  • removeProcessors 于是Acceptor类就具备Processor线程池管理功能。

  • Acceptor类的run方法 - 处理Reactor模式中分发 

Acceptor线程会先为每个入站请求确定要处理它的Processor线程

Acceptor线程使用Java NIO的Selector、SocketChannel循环轮询就绪的I/O事件(SelectionKey.OP_ACCEPT)。一旦接收到外部连接请求,Acceptor就指定一个Processor线程,并将该请求交由它,让它创建真正的网络连接。




Processor线程



  • 源码 

  • 执行流程 

  • 每个Processor线程在创建时都会创建3个队列:可能是阻塞队列,也可能是一个Map对象

newConnections

 每当Processor线程接收新连接请求,都会将对应SocketChannel放入该队列。之后调用configureNewConnections创建连接时,就从该队列中取出SocketChannel,然后注册新连接。

inflightResponses

  • 临时Response队列 

  • 为何是临时?有些Response回调逻辑要在Response被返回发送方后,才能执行,因此需要暂存临时队列。

responseQueue

每个Processor线程都会维护自己的Response队列, 而非像网上的某些文章说Response队列是线程共享的或是保存在RequestChannel中的。Response队列里面保存着需要被返还给发送方的所有Response对象。

工作逻辑

configureNewConnections

  • 负责处理新连接请求,注意每个Processor线程都维护着一个Selector类实例。 

processNewResponses

  • 负责发送Response给Request发送方,并且将Response放入临时Response队列 

poll

processCompletedReceives

  • 接收和处理Request 

processCompletedSends

processDisconnected

closeExcessConnections

  • 关闭超限连接 


往期推荐


大厂如何解决数值精度/舍入/溢出问题

硬核干货:HTTP超时、重复请求必见坑点及解决方案

由于不知线程池的bug,某Java程序员叕被祭天

程序员因重复记录日志撑爆ELK被辞退!

拥抱Kubernetes,再见了Spring Cloud




目前交流群已有 800+人,旨在促进技术交流,可关注公众号添加笔者微信邀请进群


喜欢文章,点个“在看、点赞、分享”素质三连支持一下~

本文分享自微信公众号 - JavaEdge(Java-Edge)。
如有侵权,请联系 [email protected] 删除。
本文参与“OSC源创计划”,欢迎正在阅读的你也加入,一起分享。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章