四種策略確保 RabbitMQ 消息發送可靠性!你用哪種?

@[toc] 微服務可以設計成消息驅動的微服務,響應式系統也可以基於消息中間件來做,從這個角度來說,在互聯網應用開發中,消息中間件真的是太重要了。

今天,以 RabbitMQ 爲例,松哥來和大家聊一聊消息中間消息發送可靠性的問題。

注意,以下內容我主要和大家討論如何確保消息生產者將消息發送成功,並不涉及消息消費的問題。

1. RabbitMQ 消息發送機制

大家知道,RabbitMQ 中的消息發送引入了 Exchange(交換機)的概念,消息的發送首先到達交換機上,然後再根據既定的路由規則,由交換機將消息路由到不同的 Queue(隊列)中,再由不同的消費者去消費。

大致的流程就是這樣,所以要確保消息發送的可靠性,主要從兩方面去確認:

  1. 消息成功到達 Exchange
  2. 消息成功到達 Queue

如果能確認這兩步,那麼我們就可以認爲消息發送成功了。

如果這兩步中任一步驟出現問題,那麼消息就沒有成功送達,此時我們可能要通過重試等方式去重新發送消息,多次重試之後,如果消息還是不能到達,則可能就需要人工介入了。

經過上面的分析,我們可以確認,要確保消息成功發送,我們只需要做好三件事就可以了:

  1. 確認消息到達 Exchange。
  2. 確認消息到達 Queue。
  3. 開啓定時任務,定時投遞那些發送失敗的消息。

2. RabbitMQ 的努力

上面提出的三個步驟,第三步需要我們自己實現,前兩步 RabbitMQ 則有現成的解決方案。

如何確保消息成功到達 RabbitMQ?RabbitMQ 給出了兩種方案:

  1. 開啓事務機制
  2. 發送方確認機制

這是兩種不同的方案,不可以同時開啓,只能選擇其中之一,如果兩者同時開啓,則會報如下錯誤:

我們分別來看。以下所有案例都在 Spring Boot 中展開,文末可以下載相關源碼。

2.1 開啓事務機制

Spring Boot 中開啓 RabbitMQ 事務機制的方式如下:

首先需要先提供一個事務管理器,如下:

@Bean
RabbitTransactionManager transactionManager(ConnectionFactory connectionFactory) {
    return new RabbitTransactionManager(connectionFactory);
}

接下來,在消息生產者上面做兩件事:添加事務註解並設置通信信道爲事務模式:

@Service
public class MsgService {
    @Autowired
    RabbitTemplate rabbitTemplate;

    @Transactional
    public void send() {
        rabbitTemplate.setChannelTransacted(true);
        rabbitTemplate.convertAndSend(RabbitConfig.JAVABOY_EXCHANGE_NAME,RabbitConfig.JAVABOY_QUEUE_NAME,"hello rabbitmq!".getBytes());
        int i = 1 / 0;
    }
}

這裏注意兩點:

  1. 發送消息的方法上添加 @Transactional 註解標記事務。
  2. 調用 setChannelTransacted 方法設置爲 true 開啓事務模式。

這就 OK 了。

在上面的案例中,我們在結尾來了個 1/0 ,這在運行時必然拋出異常,我們可以嘗試運行該方法,發現消息並未發送成功。

當我們開啓事務模式之後,RabbitMQ 生產者發送消息會多出四個步驟:

  1. 客戶端發出請求,將信道設置爲事務模式。
  2. 服務端給出回覆,同意將信道設置爲事務模式。
  3. 客戶端發送消息。
  4. 客戶端提交事務。
  5. 服務端給出響應,確認事務提交。

上面的步驟,除了第三步是本來就有的,其他幾個步驟都是平白無故多出來的。所以大家看到,事務模式其實效率有點低,這並非一個最佳解決方案。我們可以想想,什麼項目會用到消息中間件?一般來說都是一些高併發的項目,這個時候併發性能尤爲重要。

所以,RabbitMQ 還提供了發送方確認機制(publisher confirm)來確保消息發送成功,這種方式,性能要遠遠高於事務模式,一起來看下。

2.2 發送方確認機制

2.2.1 單條消息處理

首先我們移除剛剛關於事務的代碼,然後在 application.properties 中配置開啓消息發送方確認機制,如下:

spring.rabbitmq.publisher-confirm-type=correlated
spring.rabbitmq.publisher-returns=true

第一行是配置消息到達交換器的確認回調,第二行則是配置消息到達隊列的回調。

第一行屬性的配置有三個取值:

  1. none:表示禁用發佈確認模式,默認即此。
  2. correlated:表示成功發佈消息到交換器後會觸發的回調方法。
  3. simple:類似 correlated,並且支持 waitForConfirms()waitForConfirmsOrDie() 方法的調用。

接下來我們要開啓兩個監聽,具體配置如下:

@Configuration
public class RabbitConfig implements RabbitTemplate.ConfirmCallback, RabbitTemplate.ReturnsCallback {
    public static final String JAVABOY_EXCHANGE_NAME = "javaboy_exchange_name";
    public static final String JAVABOY_QUEUE_NAME = "javaboy_queue_name";
    private static final Logger logger = LoggerFactory.getLogger(RabbitConfig.class);
    @Autowired
    RabbitTemplate rabbitTemplate;
    @Bean
    Queue queue() {
        return new Queue(JAVABOY_QUEUE_NAME);
    }
    @Bean
    DirectExchange directExchange() {
        return new DirectExchange(JAVABOY_EXCHANGE_NAME);
    }
    @Bean
    Binding binding() {
        return BindingBuilder.bind(queue())
                .to(directExchange())
                .with(JAVABOY_QUEUE_NAME);
    }

    @PostConstruct
    public void initRabbitTemplate() {
        rabbitTemplate.setConfirmCallback(this);
        rabbitTemplate.setReturnsCallback(this);
    }

    @Override
    public void confirm(CorrelationData correlationData, boolean ack, String cause) {
        if (ack) {
            logger.info("{}:消息成功到達交換器",correlationData.getId());
        }else{
            logger.error("{}:消息發送失敗", correlationData.getId());
        }
    }

    @Override
    public void returnedMessage(ReturnedMessage returned) {
        logger.error("{}:消息未成功路由到隊列",returned.getMessage().getMessageProperties().getMessageId());
    }
}

關於這個配置類,我說如下幾點:

  1. 定義配置類,實現 RabbitTemplate.ConfirmCallbackRabbitTemplate.ReturnsCallback 兩個接口,這兩個接口,前者的回調用來確定消息到達交換器,後者則會在消息路由到隊列失敗時被調用。
  2. 定義 initRabbitTemplate 方法並添加 @PostConstruct 註解,在該方法中爲 rabbitTemplate 分別配置這兩個 Callback。

這就可以了。

接下來我們對消息發送進行測試。

首先我們嘗試將消息發送到一個不存在的交換機中,像下面這樣:

rabbitTemplate.convertAndSend("RabbitConfig.JAVABOY_EXCHANGE_NAME",RabbitConfig.JAVABOY_QUEUE_NAME,"hello rabbitmq!".getBytes(),new CorrelationData(UUID.randomUUID().toString()));

注意第一個參數是一個字符串,不是變量,這個交換器並不存在,此時控制檯會報如下錯誤:

接下來我們給定一個真實存在的交換器,但是給一個不存在的隊列,像下面這樣:

rabbitTemplate.convertAndSend(RabbitConfig.JAVABOY_EXCHANGE_NAME,"RabbitConfig.JAVABOY_QUEUE_NAME","hello rabbitmq!".getBytes(),new CorrelationData(UUID.randomUUID().toString()));

注意此時第二個參數是一個字符串,不是變量。

可以看到,消息雖然成功達到交換器了,但是沒有成功路由到隊列(因爲隊列不存在)。

這是一條消息的發送,我們再來看看消息的批量發送。

2.2.2 消息批量處理

如果是消息批量處理,那麼發送成功的回調監聽是一樣的,這裏不再贅述。

這就是 publisher-confirm 模式。

相比於事務,這種模式下的消息吞吐量會得到極大的提升。

3. 失敗重試

失敗重試分兩種情況,一種是壓根沒找到 MQ 導致的失敗重試,另一種是找到 MQ 了,但是消息發送失敗了。

兩種重試我們分別來看。

3.1 自帶重試機制

前面所說的事務機制和發送方確認機制,都是發送方確認消息發送成功的辦法。如果發送方一開始就連不上 MQ,那麼 Spring Boot 中也有相應的重試機制,但是這個重試機制就和 MQ 本身沒有關係了,這是利用 Spring 中的 retry 機制來完成的,具體配置如下:

spring.rabbitmq.template.retry.enabled=true
spring.rabbitmq.template.retry.initial-interval=1000ms
spring.rabbitmq.template.retry.max-attempts=10
spring.rabbitmq.template.retry.max-interval=10000ms
spring.rabbitmq.template.retry.multiplier=2

從上往下配置含義依次是:

  • 開啓重試機制。
  • 重試起始間隔時間。
  • 最大重試次數。
  • 最大重試間隔時間。
  • 間隔時間乘數。(這裏配置間隔時間乘數爲 2,則第一次間隔時間 1 秒,第二次重試間隔時間 2 秒,第三次 4 秒,以此類推)

配置完成後,再次啓動 Spring Boot 項目,然後關掉 MQ,此時嘗試發送消息,就會發送失敗,進而導致自動重試。

3.2 業務重試

業務重試主要是針對消息沒有到達交換器的情況。

如果消息沒有成功到達交換器,根據我們第二小節的講解,此時就會觸發消息發送失敗回調,在這個回調中,我們就可以做文章了!

整體思路是這樣:

  1. 首先創建一張表,用來記錄發送到中間件上的消息,像下面這樣:

每次發送消息的時候,就往數據庫中添加一條記錄。這裏的字段都很好理解,有三個我額外說下:

  • status:表示消息的狀態,有三個取值,0,1,2 分別表示消息發送中、消息發送成功以及消息發送失敗。
  • tryTime:表示消息的第一次重試時間(消息發出去之後,在 tryTime 這個時間點還未顯示發送成功,此時就可以開始重試了)。
  • count:表示消息重試次數。

其他字段都很好理解,我就不一一囉嗦了。

  1. 在消息發送的時候,我們就往該表中保存一條消息發送記錄,並設置狀態 status 爲 0,tryTime 爲 1 分鐘之後。
  2. 在 confirm 回調方法中,如果收到消息發送成功的回調,就將該條消息的 status 設置爲1(在消息發送時爲消息設置 msgId,在消息發送成功回調時,通過 msgId 來唯一鎖定該條消息)。
  3. 另外開啓一個定時任務,定時任務每隔 10s 就去數據庫中撈一次消息,專門去撈那些 status 爲 0 並且已經過了 tryTime 時間記錄,把這些消息拎出來後,首先判斷其重試次數是否已超過 3 次,如果超過 3 次,則修改該條消息的 status 爲 2,表示這條消息發送失敗,並且不再重試。對於重試次數沒有超過 3 次的記錄,則重新去發送消息,並且爲其 count 的值+1。

大致的思路就是上面這樣,松哥這裏就不給出代碼了,松哥的 vhr 裏邊郵件發送就是這樣的思路來處理的,完整代碼大家可以參考 vhr 項目(https://github.com/lenve/vhr)。

當然這種思路有兩個弊端:

  1. 去數據庫走一遭,可能拖慢 MQ 的 Qos,不過有的時候我們並不需要 MQ 有很高的 Qos,所以這個應用時要看具體情況。
  2. 按照上面的思路,可能會出現同一條消息重複發送的情況,不過這都不是事,我們在消息消費時,解決好冪等性問題就行了。

當然,大家也要注意,消息是否要確保 100% 發送成功,也要看具體情況。

4. 小結

好啦,這就是關於消息生產者的一些常見問題以及對應的解決方案,下篇文章松哥和大家探討如果保證消息消費成功並解決冪等性問題。

本文涉及到的相關源代碼大家可以在這裏下載:https://github.com/lenve/javaboy-code-samples。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章