你所不知道的日誌異步落庫

在互聯網設計架構過程中，日誌異步落庫，儼然已經是高併發環節中不可缺少的一環。爲什麼說是高併發環節中不可缺少的呢？原因在於，如果直接用mq進行日誌落庫的時候，低併發下，生產端生產數據，然後由消費端異步落庫，是沒有什麼問題的，而且性能也都是異常的好，估計tp99應該都在1ms以內。但是一旦併發增長起來，慢慢的你就發現生產端的tp99一直在增長，從1ms，變爲2ms，4ms，直至send timeout。尤其在大促的時候，我司的系統就經歷過這個情況，當時mq的發送耗時超過200ms，甚至一度有不少timeout產生。

考慮到這種情況在高併發的情況下才出現，所以今天我們就來探索更加可靠的方法來進行異步日誌落庫，保證所使用的方式不會因爲過高的併發而出現接口ops持續下降甚至到不可用的情況。

方案一：基於log4j的異步appender實現

此種方案，依賴於log4j。在log4j的異步appender中，通過mq進行生產消費入庫。相當於在接口和mq之間建立了一個緩衝區，使得接口和mq的依賴分離，從而不讓mq的操作影響接口的ops。

此種方案由於使用了異步方式，且由於異步的discard policy策略，當大量數據過來，緩衝區滿了之後，會拋棄部分數據。此種方案適用於能夠容忍數據丟失的業務場景，不適用於對數據完整有嚴格要求的業務場景。

來看看具體的實現方式：

首先，我們需要自定義一個Appender，繼承自log4j的AppenderSkeleton類，實現方式如下：

public class AsyncJmqAppender extends AppenderSkeleton {

    @Resource(name = "messageProducer")
    private MessageProducer messageProducer;

    @Override
    protected void append(LoggingEvent loggingEvent) {
        asyncPushMessage(loggingEvent.getMessage());
    }

    /**
     * 異步調用jmq輸出日誌
     * @param message
     */
    private void asyncPushMessage(Object message) {

        CompletableFuture.runAsync(() -> {

            Message messageConverted = (Message) message;

            try {
                messageProducer.send(messageConverted);
            } catch (JMQException e) {
                e.printStackTrace();
            }

        });
    }


    @Override
    public boolean requiresLayout() {
        return false;
    }

    @Override
    public void close() {

    }
}

然後在log4j.xml中，爲此類進行配置：

<!--異步JMQ appender-->
<appender name="async_mq_appender" class="com.jd.limitbuy.common.util.AsyncJmqAppender">
    <!-- 設置File參數：日誌輸出文件名 -->
    <param name="File" value="D:/export/Instances/order/server1/logs/order.async.jmq" />
    <!-- 設置是否在重新啓動服務時，在原有日誌的基礎添加新日誌 -->
    <param name="Append" value="true" />
    <!-- 設置文件大小 -->
    <param name="MaxFileSize" value="10KB" />
    <!-- 設置文件備份 -->
    <param name="MaxBackupIndex" value="10000" />
    <!-- 設置輸出文件項目和格式 -->
    <layout class="org.apache.log4j.PatternLayout">
        <param name="ConversionPattern" value="%m%n" />
    </layout>
</appender>
<logger name="async_mq_appender_logger">
    <appender-ref ref="async_mq_appender"/>
</logger>

最後就可以按照如下的方式進行正常使用了：

private static Logger logger = LoggerFactory.getLogger("filelog_appender_logger");

注意：此處需要注意log4j的一個性能問題。在log4j的conversionPattern中，匹配符最好不要出現 C% L%通配符，壓測實踐表明，這兩個通配符會導致log4j打日誌的效率降低10倍。

方案一很簡便，且剝離了接口直接依賴mq導致的性能問題。但是無法解決數據丟失的問題（但是我們其實可以在本地搞個策略落盤來不及處理的數據，可以大大的減少數據丟失的機率）。但是很多的業務場景，是需要數據不丟失的，所以這就衍生出我們的另一套方案來。

方案二：增量消費log4j日誌

此種方式，是開啓worker在後臺增量消費log4j的日誌信息，和接口完全脫離。此種方式相比方案一，可以保證數據的不丟失，且可以做到完全不影響接口的ops。但是此種方式，由於是後臺worker在後臺啓動進行掃描，會導致落庫的數據慢一些，比如一分鐘之後才落庫完畢。所以適用於對落庫數據實時性不高的場景。

具體的實現步驟如下：

首先，將需要進行增量消費的日誌統一打到一個文件夾，以天爲單位，每天生成一個帶時間戳日誌文件。由於log4j不支持直接帶時間戳的日誌文件生成，所以這裏需要引入log4j.extras組件，然後配置log4j.xml如下：

之後在代碼中的申明方式如下：

private static Logger businessLogger = LoggerFactory.getLogger("file_rolling_logger");

最後在需要記錄日誌的地方使用方式如下：

businessLogger.error(JsonUtils.toJSONString(myMessage))

這樣就可以將日誌打印到一個單獨的文件中，且按照日期，每天生成一個。

然後，當日志文件生成完畢後，我們就可以開啓我們的worker進行增量消費了，這裏的增量消費方式，我們選擇RandomAccessFile這個類來進行，由於其獨特的位點讀取方式，可以使得我們非常方便的根據位點的位置來消費增量文件，從而避免了逐行讀取這種低效率的實現方式。

注意，爲每個日誌文件都單獨創建了一個位點文件，裏面存儲了對應的文件的位點讀取信息。當worker掃描開始的時候，會首先讀取位點文件裏面的位點信息，然後找到相應的日誌文件，從位點信息位置開始進行消費。這就是整個增量消費worker的核心。具體代碼實現如下(代碼太長，做了摺疊)：

/**
 * @Description: 增量日誌掃描worker
 * @Detail: 此worker主要用來掃描增量日誌，日誌本身會在不停的插入中，此worker會不停的掃描此日誌來將數據上傳到kafka集羣
 * @date 2018-04-08 10:30
 */
public class LimitBuyScanWorker {

    /**
     * 日誌和位點文件保存的目錄
     */
    private static final String FILE_DIRECTORY = "D:\\export\\Instances\\order\\server1\\logs\\";

    /**
     * 每次步進的長度，此處爲1000行
     */
    private static final int SCAN_STEP = 1000;

    /**
     * 日誌文件名前綴
     */
    private static final String LOG_FILE_PREFIX = "limitbuy.soa.order.";

    /**
     * 位點文件名後綴
     */
    private static final String OFT_FILE_APPENDIX = ".offset";

    public void logScanner() {

        //當前時間
        Date currentDate = new Date();

        //今日
        String currentDay = DateUtil.formatDate("yyyy-MM-dd", currentDate);
        //今日日誌文件路徑
        String currentLogFilePath = FILE_DIRECTORY + LOG_FILE_PREFIX + currentDay;
        logger.error("今日的日誌文件路徑:" + currentLogFilePath);
        //今日位點文件路徑
        String currentOffsetFilePath = FILE_DIRECTORY + LOG_FILE_PREFIX + currentDay + OFT_FILE_APPENDIX;

        //昨日
        String yesterDay = DateUtil.formatDate("yyyy-MM-dd", DateUtil.queryPlusDay(currentDate, -1));
        //昨日日誌文件路徑
        String yesterdayLogFilePath = FILE_DIRECTORY + LOG_FILE_PREFIX + yesterDay;
        logger.error("昨日的日誌文件路徑:" + yesterdayLogFilePath);
        //昨日位點文件路徑
        String yesterdayOffsetFilePath = FILE_DIRECTORY + LOG_FILE_PREFIX + yesterDay + OFT_FILE_APPENDIX;

        //先檢測昨日位點和文件體積是否一致，不一致則代表未消費完畢
        boolean yesterdayConsumedOK = checkIfConsumeOK(yesterdayLogFilePath, yesterdayOffsetFilePath);
        logger.error("昨日的日誌文件已被消費完畢:" + yesterdayConsumedOK);

        //昨日的文件已掃描完畢
        if (yesterdayConsumedOK) {
            //掃描並消費今日增量日誌
            scanAndConsumeLog(currentLogFilePath, currentOffsetFilePath);
        }
        //昨日的文件未掃描完畢
        else {
            //掃描並消費昨日增量日誌
            scanAndConsumeLog(yesterdayLogFilePath, yesterdayOffsetFilePath);
        }
    }

    /**
     * 檢測日誌是否被掃描消費完畢,true:消費完畢；false：未消費完畢
     * @Description 此舉主要防止log4j在零點大促開始的時候，突然的滾動文件造成的部分增量日誌不會被消費的問題
     * @param logFilePath
     * @param offsetFilePath
     */
    private boolean checkIfConsumeOK(String logFilePath, String offsetFilePath) {
        try {

            //打開文件
            RandomAccessFile randomAccessFile = new RandomAccessFile(logFilePath, "r");

            //得到當前位點
            long currentOffset = checkOffset(offsetFilePath);

            //得到文件總長
            long currentFileLength = randomAccessFile.length();

            //比對
            if (currentOffset >= currentFileLength) {
                return true;
            }
            return false;
        } catch (FileNotFoundException e) {
            logger.error("com.jd.limitbuy.service.worker.logScanner 出錯(FileNotFoundException):", e);
            AlarmUtil.alarm("com.jd.limitbuy.service.worker.logScanner 出錯:" + e.getMessage());
            return false;
        } catch (IOException e) {
            logger.error("com.jd.limitbuy.service.worker.logScanner 出錯(IOException):", e);
            AlarmUtil.alarm("com.jd.limitbuy.service.worker.logScanner 出錯:" + e.getMessage());
            return false;
        }
    }

    /**
     * 掃描並消費增量日誌
     * @param logFilePath
     * @param offsetFilePath
     */
    private void scanAndConsumeLog(String logFilePath, String offsetFilePath) {
        try {

            RandomAccessFile randomAccessFile = new RandomAccessFile(logFilePath, "r");

            //得到當前位點
            long currentOffset = checkOffset(offsetFilePath);
            logger.error("開始位點==>" + currentOffset);

            //重置位點到當前位點
            if (currentOffset <= randomAccessFile.length()) {
                randomAccessFile.seek(currentOffset);
            }

            //讀取@SCAN_STEP行
            for (long i = currentOffset; i < currentOffset + SCAN_STEP; i++) {
                //得到行
                String result = randomAccessFile.readLine();
                //如果內容不爲空
                if (StringUtil.isNotBlank(result)) {
                    //TODO 邏輯實現
                }
            }

            //讀取@SCAN_STEP行之後的位點
            logger.error("讀取" + SCAN_STEP + "行之後位點==>" + randomAccessFile.getFilePointer());

            //如果update不成功，可以不處理，後面掃描進來重新過一遍即可
            updateOffset(randomAccessFile.getFilePointer(), offsetFilePath);

            logger.error("文件總長==>" + randomAccessFile.length());

        } catch (FileNotFoundException e) {
            logger.error("com.jd.limitbuy.service.worker.logScanner 出錯(FileNotFoundException):", e);
            AlarmUtil.alarm("com.jd.limitbuy.service.worker.logScanner 出錯:" + e.getMessage());
        } catch (IOException e) {
            logger.error("com.jd.limitbuy.service.worker.logScanner 出錯(IOException):", e);
            AlarmUtil.alarm("com.jd.limitbuy.service.worker.logScanner 出錯:" + e.getMessage());
        }
    }

    /**
     * 校驗位點
     *     不存在則創建並賦值爲0
     *     已存在則更新位點
     * @param offsetFilePath
     * @return
     * @throws IOException
     */
    private long checkOffset(String offsetFilePath) throws IOException {

        File offsetFile = new File(offsetFilePath);

        //如果位點文件不存在，則創建位點文件並返回0
        if (!offsetFile.exists()) {
            updateOffset(0, offsetFilePath);
            return 0;
        }
        //如果位點文件存在，則返回位點文件內容
        else {
            FileReader fileReader = new FileReader(offsetFilePath);
            StringBuilder stringBuilder = new StringBuilder();
            char[] bytesChar = new char[50];
            fileReader.read(bytesChar);
            fileReader.close();

            for (char c : bytesChar) {
                stringBuilder.append(c);
            }

            String filteredOffset = stringBuilder.toString().trim();

            if (StringUtil.isNotBlank(filteredOffset)) {
                return Long.parseLong(filteredOffset);
            } else {
                return 0;
            }
        }
    }

    /**
     * 更新位點信息
     * @param offset
     * @param offsetFilePath
     */
    private void updateOffset(long offset, String offsetFilePath) throws IOException {
        FileWriter fileWriter = new FileWriter(offsetFilePath);
        fileWriter.write(offset + "");
        fileWriter.flush();
        fileWriter.close();
    }
}

此種方式由於worker掃描是每隔一段時間啓動一次進行消費，所以導致數據從產生到入庫，可能經歷時間超過一分鐘以上，但是在一些對數據延遲要求比較高的業務場景，比如庫存扣減，是不能容忍的，所以這裏我們就引申出第三種做法，基於內存文件隊列的異步日誌消費。

方案三：基於內存文件隊列的異步日誌消費

由於方案一和方案二都嚴重依賴log4j，且方案本身都存在着要麼丟數據，要麼入庫時間長的缺點，所以都並不是那麼盡如人意。但是本方案的做法，既解決了數據丟失的問題，又解決了數據入庫時間被拉長的尷尬，所以是終極解決之道。而且在大促銷過程中，此種方式經歷了實戰檢驗，可以大面積的推廣使用。

此方案中提到的內存文件隊列，是我司自研的一款基於RandomAccessFile和MappedByteBuffer實現的內存文件隊列。隊列核心使用了ArrayBlockingQueue，並提供了produce方法，進行數據入管道操作，提供了consume方法，進行數據出管道操作。而且後臺有一個worker一直啓動着，每隔5ms或者遍歷了100條數據之後，就將數據落盤一次，以防數據丟失。具體的設計，就這麼多，感興趣的可以根據我提供的信息，自己實踐一下。

由於有此中間件的加持，數據生產的時候，只需要入壓入管道，然後消費端進行消費即可。未被消費的數據，會進行落盤操作，謹防數據丟失。當大促的時候，大量數據涌來的時候，管道滿了的情況下會阻塞接口，數據不會被拋棄。雖然可能會導致接口在那一瞬間無響應，但是由於有落盤操作和消費操作（此操作操控的是JVM堆外內存數據，不受GC的影響，所以不會出現操作暫停的情況，爲什麼呢？因爲用了MappedByteBuffer），此種阻塞並未影響到接口整體的ops。

在實際使用的時候，ArrayBlockingQueue作爲核心隊列，顯然是全局加鎖的，後續我們考慮升級爲無鎖隊列，所以將會參考Netty中的有界無鎖隊列：MpscArrayQueue。預計性能將會再好一些。

受限於公司政策，我僅提供大致思路，但是不會提供具體代碼，有問題評論區交流吧。

上面就是在進行異步日誌消費的時候，我所經歷的三個階段，並且一步一步的優化到目前的方式。雖然過程曲折，但是結果令人歡欣鼓舞。如果喜歡就給個推薦，後續我將會持續更新你所不知道的系列，以期達到拋磚引玉的效果。

你所不知道的日誌異步落庫

[轉帖]使用NMT和pmap解決JVM資源泄漏問題原創

Python實現大麥網搶票的四大關鍵技術點解析

Python 安裝庫指令大全

salesforce零基礎學習（一百三十八）零碎知識點小總結（十）

一款開源的.NET程序集反編譯、編輯和調試神器

關於接口協議，你必須要知道這些！

2020年上半年數據庫系統工程師考試

基於 Milvus + LlamaIndex 實現高級 RAG

【2024-05-21】以茶會友

你所不知道的鎖

openresty實踐指導

ChatGPT用後感

自定義classloader的固定套路

【轉】天池中間件大賽dubboMesh優化總結（qps從1000到6850）

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結