《從0到1學習Flink》—— Flink 讀取 Kafka 數據寫入到 RabbitMQ

前言

之前有文章《從0到1學習Flink》—— Flink 寫入數據到 Kafka 寫過 Flink 將處理後的數據後發到 Kafka 消息隊列中去，當然我們常用的消息隊列可不止這一種，還有 RocketMQ、RabbitMQ 等，剛好 Flink 也支持將數據寫入到 RabbitMQ，所以今天我們就來寫篇文章講講如何將 Flink 處理後的數據寫入到 RabbitMQ。

前提準備

安裝 RabbitMQ

這裏我直接用 docker 命令安裝吧，先把 docker 在 mac 上啓動起來。

在命令行中執行下面的命令：

docker run -d  -p 15672:15672  -p  5672:5672  -e RABBITMQ_DEFAULT_USER=admin -e RABBITMQ_DEFAULT_PASS=admin --name rabbitmq rabbitmq:3-management

【大數據開發學習資料領取方式】：加入大數據技術學習交流羣458345782，點擊加入羣聊，私信管理員即可免費領取

登錄用戶名和密碼分別是：admin / admin ，登錄進去是這個樣子就代表安裝成功了：

image

依賴

pom.xml 中添加 Flink connector rabbitmq 的依賴如下：

<dependency>
    <groupId>org.apache.flink</groupId>
    <artifactId>flink-connector-rabbitmq_${scala.binary.version}</artifactId>
    <version>${flink.version}</version>
</dependency>

生產者

這裏我們依舊自己寫一個工具類一直的往 RabbitMQ 中的某個 queue 中發數據，然後由 Flink 去消費這些數據。

注意按照我的步驟來一步步操作，否則可能會出現一些錯誤！

RabbitMQProducerUtil.java

import com.rabbitmq.client.Channel;
import com.rabbitmq.client.Connection;
import com.rabbitmq.client.ConnectionFactory;

public class RabbitMQProducerUtil {
    public final static String QUEUE_NAME = "zhisheng";

    public static void main(String[] args) throws Exception {
        //創建連接工廠
        ConnectionFactory factory = new ConnectionFactory();

        //設置RabbitMQ相關信息
        factory.setHost("localhost");
        factory.setUsername("admin");
        factory.setPassword("admin");
        factory.setPort(5672);

        //創建一個新的連接
        Connection connection = factory.newConnection();

        //創建一個通道
        Channel channel = connection.createChannel();

        // 聲明一個隊列
//        channel.queueDeclare(QUEUE_NAME, false, false, false, null);

        //發送消息到隊列中
        String message = "Hello zhisheng";

        //我們這裏演示發送一千條數據
        for (int i = 0; i < 1000; i++) {
            channel.basicPublish("", QUEUE_NAME, null, (message + i).getBytes("UTF-8"));
            System.out.println("Producer Send +'" + message + i);
        }

        //關閉通道和連接
        channel.close();
        connection.close();
    }
}

Flink 主程序

import com.zhisheng.common.utils.ExecutionEnvUtil;
import org.apache.flink.api.common.serialization.SimpleStringSchema;
import org.apache.flink.api.java.utils.ParameterTool;
import org.apache.flink.streaming.api.datastream.DataStreamSource;
import org.apache.flink.streaming.api.environment.StreamExecutionEnvironment;
import org.apache.flink.streaming.connectors.rabbitmq.RMQSource;
import org.apache.flink.streaming.connectors.rabbitmq.common.RMQConnectionConfig;

/**
 * 從 rabbitmq 讀取數據
 */
public class Main {
    public static void main(String[] args) throws Exception {
        final StreamExecutionEnvironment env = StreamExecutionEnvironment.getExecutionEnvironment();
        ParameterTool parameterTool = ExecutionEnvUtil.PARAMETER_TOOL;

        //這些配置建議可以放在配置文件中，然後通過 parameterTool 來獲取對應的參數值
        final RMQConnectionConfig connectionConfig = new RMQConnectionConfig
                .Builder().setHost("localhost").setVirtualHost("/")
                .setPort(5672).setUserName("admin").setPassword("admin")
                .build();

        DataStreamSource<String> zhisheng = env.addSource(new RMQSource<>(connectionConfig,
                "zhisheng",
                true,
                new SimpleStringSchema()))
                .setParallelism(1);
        zhisheng.print();

        //如果想保證 exactly-once 或 at-least-once 需要把 checkpoint 開啓
//        env.enableCheckpointing(10000);
        env.execute("flink learning connectors rabbitmq");
    }
}

運行 RabbitMQProducerUtil 類，再運行 Main 類！

注意⚠️：

1、RMQConnectionConfig 中設置的用戶名和密碼要設置成 admin/admin，如果你換成是 guest/guest，其實是在 RabbitMQ 裏面是沒有這個用戶名和密碼的，所以就會報這個錯誤：

nested exception is com.rabbitmq.client.AuthenticationFailureException: ACCESS_REFUSED - Login was refused using authentication mechanism PLAIN. For details see the broker logfile.

不出意外的話應該你運行 RabbitMQProducerUtil 類後，立馬兩個運行的結果都會出來，速度還是很快的。

image

2、如果你在 RabbitMQProducerUtil 工具類中把註釋的那行代碼打開的話：

 // 聲明一個隊列
//        channel.queueDeclare(QUEUE_NAME, false, false, false, null);

就會出現這種錯誤：

Caused by: com.rabbitmq.client.ShutdownSignalException: channel error; protocol method: #method<channel.close>(reply-code=406, reply-text=PRECONDITION_FAILED - inequivalent arg 'durable' for queue 'zhisheng' in vhost '/': received 'true' but current is 'false', class-id=50, method-id=10)

這是因爲你打開那個註釋的話，一旦你運行了該類就會創建一個叫做 zhisheng 的 Queue，當你再運行 Main 類中的時候，它又會創建這樣一個叫 zhisheng 的 Queue，然後因爲已經有同名的 Queue 了，所以就有了衝突，解決方法就是把那行代碼註釋就好了。

3、該 connector（連接器）中提供了 RMQSource 類去消費 RabbitMQ queue 中的消息和確認 checkpoints 上的消息，它提供了三種不一樣的保證：

Exactly-once(只消費一次): 前提條件有，1 是要開啓 checkpoint，因爲只有在 checkpoint 完成後，纔會返回確認消息給 RabbitMQ（這時，消息纔會在 RabbitMQ 隊列中刪除)；2 是要使用 Correlation ID，在將消息發往 RabbitMQ 時，必須在消息屬性中設置 Correlation ID。數據源根據 Correlation ID 把從 checkpoint 恢復的數據進行去重；3 是數據源不能並行，這種限制主要是由於 RabbitMQ 將消息從單個隊列分派給多個消費者。
At-least-once(至少消費一次): 開啓了 checkpoint，但未使用相 Correlation ID 或數據源是並行的時候，那麼就只能保證數據至少消費一次了
No guarantees(無法保證): Flink 接收到數據就返回確認消息給 RabbitMQ

Sink 數據到 RabbitMQ

RabbitMQ 除了可以作爲數據源，也可以當作下游，Flink 消費數據做了一些處理之後也能把數據發往 RabbitMQ，下面演示下 Flink 消費 Kafka 數據後寫入到 RabbitMQ。

public class Main1 {
    public static void main(String[] args) throws Exception {
        final ParameterTool parameterTool = ExecutionEnvUtil.createParameterTool(args);
        StreamExecutionEnvironment env = ExecutionEnvUtil.prepare(parameterTool);
        DataStreamSource<Metrics> data = KafkaConfigUtil.buildSource(env);

        final RMQConnectionConfig connectionConfig = new RMQConnectionConfig
                .Builder().setHost("localhost").setVirtualHost("/")
                .setPort(5672).setUserName("admin").setPassword("admin")
                .build();

        //注意，換一個新的 queue，否則也會報錯
        data.addSink(new RMQSink<>(connectionConfig, "zhisheng001", new MetricSchema()));
        env.execute("flink learning connectors rabbitmq");
    }
}

是不是很簡單？但是需要注意的是，要換一個之前不存在的 queue，否則是會報錯的。

不出意外的話，你可以看到 RabbitMQ 的監控頁面會出現新的一個 queue 出來，如下圖：

image

總結

本文先把 RabbitMQ 作爲數據源，寫了個 Flink 消費 RabbitMQ 隊列裏面的數據進行打印出來，然後又寫了個 Flink 消費 Kafka 數據後寫入到 RabbitMQ 的例子！

《從0到1學習Flink》—— Flink 讀取 Kafka 數據寫入到 RabbitMQ

前言

前提準備

生產者

Flink 主程序

Sink 數據到 RabbitMQ

總結

使用c#強大的表達式樹實現對象的深克隆之解決循環引用的問題

free AI online tools All In One

痞子衡嵌入式：恩智浦i.MX RT1xxx系列MCU啓動那些事（12.A）- uSDHC eMMC啓動時間(RT1170)

linux安裝cuda和cudnn

Mellanox網卡開啓SR-IOV

模擬手機設備：使用 Playwright 實現移動端自動化測試

HTML 00 Tutorial

全面系統的AI學習路徑，幫助普通人也能玩轉AI

從零開始：使用 Playwright 腳本錄製實現自動化測試

騰訊面試：什麼鎖比讀寫鎖性能更高？

職場上打拼的人，這4件事一定要去爭取

大學生是否該選擇培訓機構學習，這些因素看完就知曉

python+人工智能學習路徑是怎麼樣？

簡歷投出去卻沒有電話，關注這些，錄取提高了80%

Scala難道會成爲大數據世界的通用編程語言？

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結