为什么要用消息队列+各个消息队列框架该如何选择?

为什么要使用消息队列

消息队列中间件是分布式系统中非常重要的分布式架构,主要提供异步消息、流量消峰、应用解耦、消息通讯等功能。

1、异步处理

举个例子:我们在某个系统网站中注册账号后,需要的操作为将账号信息添加进数据库、发送注册邮件、发送注册短信,当这三个步骤全部完成后,返回个用户注册成功信息。
如果用串行方式处理,即先将信息插入到数据库、然后发送邮件信息、发送注册短信,最后返回给用户注册成功信息。假设每个流程将耗费50ms,不考虑其他消耗的时间,串行方式处理后,使用的总时间为150ms。
如果用并行方式处理,即先将信息插入到数据库、然后发送邮件信息和发送注册短信进行并行处理,三步全部完成后,返回给用户信息,使用的总时间为100ms。
但是如果我们用消息队列处理,即先将信息插入到数据库、然后将接下来的操作放入消息队列中,后面的操作由消息队列来负责任务分配执行,通过消费者监听,对接下来的两步操作进行异步,由于放入消息队列中的时间消耗非常短,我们可以忽略不计,同样按照每个节点流程耗费50ms计算,并行处理方式的总共耗时几乎等于将信息插入到数据库中的时间,即50毫秒。

2、应用解耦

举个例子:用户下单后,订单系统需要通知库存系统。传统的做法是,订单系统调用库存系统的接口。
但是这样做会有一定的弊端,比如,订单系统订单成功,但是库存系统异常,无法调用成功,这样也将导致订单系统的用户下单失败,订单系统与库存系统耦合严重,用户体验非常差。

此时我们就可以引入消息队列,订单系统订单成功后,将消息存入到消息队列中,存入成功后即可返回用户下单成功。
库存系统订阅下单的消息,采用推拉的方式,获取下单信息,库存系统根据下单信息进行库存操作。这样一来就实现了订单系统与库存系统的解耦。

3、流量消峰

某电商网站开展秒杀活动,一般由于瞬间访问暴增,服务器收到请求过大,可能出现无法处理请求或崩溃的情况。这时候我们可以应用rabbitmq做流量消峰处理,如果短时间流量过大,可以通过设置阀值丢弃掉一部分消息或者根据服务的承受能力设置处理消息限制,也就是限流。
在这里插入图片描述
同时,加入消息队列后,系统就可以从消息队列中读取数据,相当于做了一次缓冲,超出系统处理之外的请求会积压在消息队列中,等高峰期已过,就会快速将积压在队列中的数据处理完。

消息队列的缺陷

1、系统可用性降低

系统引入的外部依赖越多,越容易垮掉,原来整个系统是ABCD四个系统间的相互调用,引入mq之后,如果mq挂掉,那么整套系统将会崩溃,这时候就需要我们采用一定策略保证消息队列的高可用。

2、系统复杂度提高

加入mq之后,我们如何保证消息没有重复消费?怎么处理消息丢失的情况?怎样保证消息传递的顺序性?这些问题都会随着我们业务难度的增加需要考虑的。

3、一致性问题

例如:ABCD四个系统,A系统处理完了直接返回成功了,用户以为这个请求发送成功了,但是,如果BCD三个系统进行异步处理时,BD系统写库成功,但是C系统写库失败,这样就无法保证数据一致了。

RabbitMQ/ActiveMQ/RocketMQ/Kafka对比

1、RabbitMq

RabbitMQ 2007年发布,是一个在AMQP(高级消息队列协议)基础上完成的,可复用的企业消息系统,是当前最主流的消息中间件之一。

主要特性

可靠性: 提供了多种技术可以让你在性能和可靠性之间进行权衡。这些技术包括持久性机制、投递确认、发布者证实和高可用性机制;

灵活的路由: 消息在到达队列前是通过交换机进行路由的。RabbitMQ为典型的路由逻辑提供了多种内置交换机类型。如果你有更复杂的路由需求,可以将这些交换机组合起来使用,你甚至可以实现自己的交换机类型,并且当做RabbitMQ的插件来使用;

消息集群:在相同局域网中的多个RabbitMQ服务器可以聚合在一起,作为一个独立的逻辑代理来使用;

队列高可用:队列可以在集群中的机器上进行镜像,以确保在硬件问题下还保证消息安全;

多种协议的支持:支持多种消息队列协议;

支持语言丰富:服务器端用Erlang语言编写,支持只要是你能想到的所有编程语言;

管理界面: RabbitMQ有一个易用的用户界面,使得用户可以监控和管理消息Broker的许多方面;

跟踪机制:如果消息异常,RabbitMQ提供消息跟踪机制,使用者可以找出发生了什么;

插件机制:提供了许多插件,来从多方面进行扩展,也可以编写自己的插件;

安装需求

使用RabbitMQ需要:

  • ErLang语言包
  • RabbitMQ安装包

RabbitMQ可以运行在Erlang语言所支持的平台之上。

优缺点

优点

由于erlang语言的特性,mq 性能较好,高并发;

健壮、稳定、易用、跨平台、支持多种语言、文档齐全;

有消息确认机制和持久化机制,可靠性高;

高度可定制的路由;

管理界面较丰富,在互联网公司也有较大规模的应用;

社区活跃度高;

缺点

尽管结合erlang语言本身的并发优势,性能较好,但是不利于做二次开发和维护;

实现了代理架构,意味着消息在发送到客户端之前可以在中央节点上排队。此特性使得RabbitMQ易于使用和部署,但是使得其运行速度较慢,因为中央节点增加了延迟,消息封装后也比较大;

需要学习比较复杂的接口和协议,学习和维护成本较高;

2、ActiveMQ

ActiveMQ是由Apache出品,ActiveMQ 是一个完全支持JMS1.1和J2EE 1.4规范的 JMS Provider实现。它非常快速,支持多种语言的客户端和协议,而且可以非常容易的嵌入到企业的应用环境中,并有许多高级功能。

主要特性

服从 JMS 规范:JMS 规范提供了良好的标准和保证,包括:同步或异步的消息分发,一次和仅一次的消息分发,消息接收和订阅等等。遵从 JMS 规范的好处在于,不论使用什么 JMS 实现提供者,这些基础特性都是可用的;

连接性:ActiveMQ 提供了广泛的连接选项,支持的协议有:HTTP/S,IP 多播,SSL,STOMP,TCP,UDP,XMPP等等。对众多协议的支持让 ActiveMQ 拥有了很好的灵活性。

支持的协议种类多:OpenWire、STOMP、REST、XMPP、AMQP ;

持久化插件和安全插件:ActiveMQ 提供了多种持久化选择。而且,ActiveMQ 的安全性也可以完全依据用户需求进行自定义鉴权和授权;

支持的客户端语言种类多:除了 Java 之外,还有:C/C++,.NET,Perl,PHP,Python,Ruby;

代理集群:多个 ActiveMQ 代理可以组成一个集群来提供服务;

异常简单的管理:ActiveMQ 是以开发者思维被设计的。所以,它并不需要专门的管理员,因为它提供了简单又使用的管理特性。有很多方法可以监控 ActiveMQ 不同层面的数据,包括使用在 JConsole 或者 ActiveMQ 的Web Console 中使用 JMX,通过处理 JMX 的告警消息,通过使用命令行脚本,甚至可以通过监控各种类型的日志。

安装需求

使用ActiveMQ需要:

  • Java JDK
  • ActiveMQ安装包

ActiveMQ可以运行在Java语言所支持的平台之上。

优缺点

优点

跨平台(JAVA编写与平台无关有,ActiveMQ几乎可以运行在任何的JVM上)

可以用JDBC:可以将数据持久化到数据库。虽然使用JDBC会降低ActiveMQ的性能,但是数据库一直都是开发人员最熟悉的存储介质。将消息存到数据库,看得见摸得着。而且公司有专门的DBA去对数据库进行调优,主从分离;

支持JMS :支持JMS的统一接口;

支持自动重连

有安全机制:支持基于shiro,jaas等多种安全配置机制,可以对Queue/Topic进行认证和授权。

监控完善:拥有完善的监控,包括Web Console,JMX,Shell命令行,Jolokia的REST API;

界面友善:提供的Web Console可以满足大部分情况,还有很多第三方的组件可以使用,如hawtio;

缺点

社区活跃度不及RabbitMQ高;

根据其他用户反馈,会出莫名其妙的问题,会丢失消息;

目前重心放到activemq6.0产品-apollo,对5.x的维护较少;

不适合用于上千个队列的应用场景;

3、RocketMQ

RocketMQ出自 阿里公司的开源产品,用 Java 语言实现,在设计时参考了 Kafka,并做出了自己的一些改进,消息可靠性上比 Kafka 更好。RocketMQ在阿里集团被广泛应用在订单,交易,充值,流计算,消息推送,日志流式处理,binglog分发等场景。

主要特性:

是一个队列模型的消息中间件,具有高性能、高可靠、高实时、分布式特点;

Producer、Consumer、队列都可以分布式;

Producer向一些队列轮流发送消息,队列集合称为Topic,Consumer如果做广播消费,则一个consumer实例消费这个Topic对应的所有队列,如果做集群消费,则多个Consumer实例平均消费这个topic对应的队列集合;

能够保证严格的消息顺序;

提供丰富的消息拉取模式;

高效的订阅者水平扩展能力;

实时的消息订阅机制;

亿级消息堆积能力;

较少的依赖;

安装需求

使用RocketMQ需要:

  • Java JDK
  • 安装git、Maven
  • RocketMQ安装包

RocketMQ可以运行在Java语言所支持的平台之上。

优缺点

优点

单机支持 1 万以上持久化队列

RocketMQ 的所有消息都是持久化的,先写入系统 PAGECACHE,然后刷盘,可以保证内存与磁盘都有一份数据,访问时,直接从内存读取。

模型简单,接口易用(JMS 的接口很多场合并不太实用);

性能非常好,可以大量堆积消息在broker中;

支持多种消费,包括集群消费、广播消费等。

各个环节分布式扩展设计,主从HA;

开发度较活跃,版本更新很快。

缺点:

支持的客户端语言不多,目前是java及c++,其中c++不成熟;
RocketMQ社区关注度及成熟度也不及前两者;
没有web管理界面,提供了一个CLI(命令行界面)管理工具带来查询、管理和诊断各种问题;
没有在 mq 核心中去实现JMS等接口;

4、Kafka

Apache Kafka是一个分布式消息发布订阅系统。它最初由LinkedIn公司基于独特的设计实现为一个分布式的提交日志系统( a distributed commit log),之后成为Apache项目的一部分。Kafka系统快速、可扩展并且可持久化。它的分区特性,可复制和可容错都是其不错的特性。

主要特性:

快速持久化,可以在O(1)的系统开销下进行消息持久化;

高吞吐,在一台普通的服务器上既可以达到10W/s的吞吐速率;

完全的分布式系统,Broker、Producer、Consumer都原生自动支持分布式,自动实现负载均衡;

支持同步和异步复制两种HA;

支持数据批量发送和拉取;

zero-copy:减少IO操作步骤;

数据迁移、扩容对用户透明;

无需停机即可扩展机器;

其他特性:严格的消息顺序、丰富的消息拉取模型、高效订阅者水平扩展、实时的消息订阅、亿级的消息堆积能力、定期删除机制;

安装需求

使用Kafka需要:

  • Java JDK
  • Kafka安装包

优缺点

优点

客户端语言丰富,支持java、.net、php、ruby、python、go等多种语言;

性能卓越,单机写入TPS约在百万条/秒,消息大小10个字节;

提供完全分布式架构, 并有replica机制, 拥有较高的可用性和可靠性, 理论上支持消息无限堆积;

支持批量操作;

消费者采用Pull方式获取消息, 消息有序, 通过控制能够保证所有消息被消费且仅被消费一次;

有优秀的第三方Kafka Web管理界面Kafka-Manager;

在日志领域比较成熟,被多家公司和多个开源项目使用;

缺点

Kafka单机超过64个队列/分区,Load会发生明显的飙高现象,队列越多,load越高,发送消息响应时间变长

使用短轮询方式,实时性取决于轮询间隔时间;

消费失败不支持重试;

支持消息顺序,但是一台代理宕机后,就会产生消息乱序;

社区更新较慢;

5、总结

一般业务系统要引入 MQ,最早大家都是用 ActiveMQ,但是现在大家用的不多了,没经过大规模吞吐量场景的验证,社区也不是很活跃,不推荐使用。

中小型公司,技术实力较为一般,技术挑战不是特别高,用 RabbitMQ 是不错的选择,大型公司,基础架构研发实力较强,用 RocketMQ 是很好的选择。

如果是高性能分布式、大数据领域的实时计算、日志采集等场景,用 Kafka 是业内标准。

广泛来说,电商、金融等对事务性要求很高的,可以考虑RabbitMQ和RocketMQ,对性能要求高的可考虑Kafka。

参考文章:

消息队列及常用消息队列介绍
消息队列如何选择

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章