你完全沒瞭解過的日誌非同步落庫

来源:https://www.cnblogs.com/AIPAOJIAO/archive/2018/08/27/9545215.html
-Advertisement-
Play Games

前言 在互聯網設計架構過程中,日誌非同步落庫,儼然已經是高併發環節中不可缺少的一環。為什麼說是高併發環節中不可缺少的呢? 原因在於,如果直接用mq進行日誌落庫的時候,低併發下,生產端生產數據,然後由消費端非同步落庫,是沒有什麼問題的,而且性能也都是異常的好,估計tp99應該都在1ms以內。但是一旦併發增 ...


前言

在互聯網設計架構過程中,日誌非同步落庫,儼然已經是高併發環節中不可缺少的一環。為什麼說是高併發環節中不可缺少的呢? 原因在於,如果直接用mq進行日誌落庫的時候,低併發下,生產端生產數據,然後由消費端非同步落庫,是沒有什麼問題的,而且性能也都是異常的好,估計tp99應該都在1ms以內。但是一旦併發增長起來,慢慢的你就發現生產端的tp99一直在增長,從1ms,變為2ms,4ms,直至send timeout。尤其在大促的時候,我司的系統就經歷過這個情況,當時mq的發送耗時超過200ms,甚至一度有不少timeout產生。

考慮到這種情況在高併發的情況下才出現,所以今天我們就來探索更加可靠的方法來進行非同步日誌落庫,保證所使用的方式不會因為過高的併發而出現介面ops持續下降甚至到不可用的情況。


 

方案一: 基於log4j的非同步appender實現

此種方案,依賴於log4j。在log4j的非同步appender中,通過mq進行生產消費入庫。相當於在介面和mq之間建立了一個緩衝區,使得介面和mq的依賴分離,從而不讓mq的操作影響介面的ops。

此種方案由於使用了非同步方式,且由於非同步的discard policy策略,當大量數據過來,緩衝區滿了之後,會拋棄部分數據。此種方案適用於能夠容忍數據丟失的業務場景,不適用於對數據完整有嚴格要求的業務場景。

來看看具體的實現方式:

首先,我們需要自定義一個Appender,繼承自log4j的AppenderSkeleton類,實現方式如下:

public class AsyncJmqAppender extends AppenderSkeleton {

    @Resource(name = "messageProducer")
    private MessageProducer messageProducer;

    @Override
    protected void append(LoggingEvent loggingEvent) {
        asyncPushMessage(loggingEvent.getMessage());
    }

    /**
     * 非同步調用jmq輸出日誌
     * @param message
     */
    private void asyncPushMessage(Object message) {

        CompletableFuture.runAsync(() -> {

            Message messageConverted = (Message) message;

            try {
                messageProducer.send(messageConverted);
            } catch (JMQException e) {
                e.printStackTrace();
            }

        });
    }


    @Override
    public boolean requiresLayout() {
        return false;
    }

    @Override
    public void close() {

    }
}

然後在log4j.xml中,為此類進行配置:

<!--非同步JMQ appender-->
<appender name="async_mq_appender" class="com.jd.limitbuy.common.util.AsyncJmqAppender">
    <!-- 設置File參數:日誌輸出文件名 -->
    <param name="File" value="D:/export/Instances/order/server1/logs/order.async.jmq" />
    <!-- 設置是否在重新啟動服務時,在原有日誌的基礎添加新日誌 -->
    <param name="Append" value="true" />
    <!-- 設置文件大小 -->
    <param name="MaxFileSize" value="10KB" />
    <!-- 設置文件備份 -->
    <param name="MaxBackupIndex" value="10000" />
    <!-- 設置輸出文件項目和格式 -->
    <layout class="org.apache.log4j.PatternLayout">
        <param name="ConversionPattern" value="%m%n" />
    </layout>
</appender>
<logger name="async_mq_appender_logger">
    <appender-ref ref="async_mq_appender"/>
</logger>

最後就可以按照如下的方式進行正常使用了:

private static Logger logger = LoggerFactory.getLogger("filelog_appender_logger");

註意: 此處需要註意log4j的一個性能問題。在log4j的conversionPattern中,匹配符最好不要出現 C% L%通配符,壓測實踐表明,這兩個通配符會導致log4j打日誌的效率降低10倍。

方案一很簡便,且剝離了介面直接依賴mq導致的性能問題。但是無法解決數據丟失的問題(但是我們其實可以在本地搞個策略落盤來不及處理的數據,可以大大的減少數據丟失的幾率)。但是很多的業務場景,是需要數據不丟失的,所以這就衍生出我們的另一套方案來。


 

方案二:增量消費log4j日誌

此種方式,是開啟worker在後臺增量消費log4j的日誌信息,和介面完全脫離。此種方式相比方案一,可以保證數據的不丟失,且可以做到完全不影響介面的ops。但是此種方式,由於是後臺worker在後臺啟動進行掃描,會導致落庫的數據慢一些,比如一分鐘之後才落庫完畢。所以適用於對落庫數據實時性不高的場景。

具體的實現步驟如下:

首先,將需要進行增量消費的日誌統一打到一個文件夾,以天為單位,每天生成一個帶時間戳日誌文件。由於log4j不支持直接帶時間戳的日誌文件生成,所以這裡需要引入log4j.extras組件,然後配置log4j.xml如下:

之後在代碼中的申明方式如下:

private static Logger businessLogger = LoggerFactory.getLogger("file_rolling_logger");

最後在需要記錄日誌的地方使用方式如下:

businessLogger.error(JsonUtils.toJSONString(myMessage))

這樣就可以將日誌列印到一個單獨的文件中,且按照日期,每天生成一個。

然後,當日誌文件生成完畢後,我們就可以開啟我們的worker進行增量消費了,這裡的增量消費方式,我們選擇RandomAccessFile這個類來進行,由於其獨特的位點讀取方式,可以使得我們非常方便的根據位點的位置來消費增量文件,從而避免了逐行讀取這種低效率的實現方式。

註意,為每個日誌文件都單獨創建了一個位點文件,裡面存儲了對應的文件的位點讀取信息。當worker掃描開始的時候,會首先讀取位點文件裡面的位點信息,然後找到相應的日誌文件,從位點信息位置開始進行消費。這就是整個增量消費worker的核心。具體代碼實現如下(代碼太長,做了摺疊):

+ View Code

此種方式由於worker掃描是每隔一段時間啟動一次進行消費,所以導致數據從產生到入庫,可能經歷時間超過一分鐘以上,但是在一些對數據延遲要求比較高的業務場景,比如庫存扣減,是不能容忍的,所以這裡我們就引申出第三種做法,基於記憶體文件隊列的非同步日誌消費。

 

 方案三:基於記憶體文件隊列的非同步日誌消費

由於方案一和方案二都嚴重依賴log4j,且方案本身都存在著要麼丟數據,要麼入庫時間長的缺點,所以都並不是那麼盡如人意。但是本方案的做法,既解決了數據丟失的問題,又解決了數據入庫時間被拉長的尷尬,所以是終極解決之道。而且在大促銷過程中,此種方式經歷了實戰檢驗,可以大面積的推廣使用。

此方案中提到的記憶體文件隊列,是我司自研的一款基於RandomAccessFile和MappedByteBuffer實現的記憶體文件隊列。隊列核心使用了ArrayBlockingQueue,並提供了produce方法,進行數據入管道操作,提供了consume方法,進行數據出管道操作。而且後臺有一個worker一直啟動著,每隔5ms或者遍歷了100條數據之後,就將數據落盤一次,以防數據丟失。具體的設計,就這麼多,感興趣的可以根據我提供的信息,自己實踐一下。

由於有此中間件的加持,數據生產的時候,只需要入壓入管道,然後消費端進行消費即可。未被消費的數據,會進行落盤操作,謹防數據丟失。當大促的時候,大量數據涌來的時候,管道滿了的情況下會阻塞介面,數據不會被拋棄。雖然可能會導致介面在那一瞬間無響應,但是由於有落盤操作和消費操作(此操作操控的是JVM堆外記憶體數據,不受GC的影響,所以不會出現操作暫停的情況,為什麼呢?因為用了MappedByteBuffer),此種阻塞並未影響到介面整體的ops。

在實際使用的時候,ArrayBlockingQueue作為核心隊列,顯然是全局加鎖的,後續我們考慮升級為無鎖隊列,所以將會參考Netty中的有界無鎖隊列:MpscArrayQueue。預計性能將會再好一些。

受限於公司政策,我僅提供大致思路,但是不會提供具體代碼,有問題評論區交流吧。


上面就是在進行非同步日誌消費的時候,我所經歷的三個階段,並且一步一步的優化到目前的方式。雖然過程曲折,但是結果令人歡欣鼓舞。如果喜歡就給個推薦,後續我將會持續更新你所不知道的系列,以期達到拋磚引玉的效果。

在此我向大家推薦一個架構學習交流群。交流學習群號:478030634  裡面會分享一些資深架構師錄製的視頻錄像:有Spring,MyBatis,Netty源碼分析,高併發、高性能、分散式、微服務架構的原理,JVM性能優化、分散式架構等這些成為架構師必備的知識體系。還能領取免費的學習資源,目前受益良多

 

大家覺得文章對你還是有一點點幫助的,大家可以點擊下方二維碼進行關註。 《Java爛豬皮》 公眾號聊的不僅僅是Java技術知識,還有面試等乾貨,後期還有大量架構乾貨。大家一起關註吧!關註爛豬皮,你會瞭解的更多..............

 

原文:https://www.cnblogs.com/scy251147/p/9193075.html


您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • [TOC] 一、xhprof擴展安裝步驟 xhprof是PHP的一個擴展,廢話不多說,直奔正題。 1、安裝 PHP5版本的安裝 PHP7版本的安裝 下載源碼包 "xhprof" :https://github.com/rustjason/xhprof/tree/php7 2、修改php.ini配置文 ...
  • 目錄: 1 solr7部署+創建核心2 solr mysql 連接 2.1 導入相關 jar包 2.2 配置連接信息 2.3 配置中文分析器3 solrj JAVA客戶端應用 3.1 solrj 構建和運行 3.2 solrj 應用(數據的 增、刪、改、查) 3.3 solrj JavaBean 整 ...
  • 1、spring定義了多種作用域,可以基於這些作用域創建bean: 單例(Singleton):在整個應用中,只創建一次bean實例 原型(Prototype):每次註入或者通過上下文獲取bean時候,都會創建一個新的bean實例 會話(Session):在Web應用中,為每個會話創建一個bean實 ...
  • web 相信大家都不陌生,平常我們瀏覽網頁用的都是web服務。互聯網起初的web就是非常簡單的頁面,但是隨著客戶需求越來越複雜,需要的功能越來越多,我們的伺服器端需要處理的請求越來越多,需要區分不同的請求,還需要按照不同請求進行請求數據的提取以及資源的分配和運算還有邏輯的處理,最後還需要響應給客戶端 ...
  • 給定一個字元串,找到它的第一個不重覆的字元,並返回它的索引。如果不存在,則返回 -1。 案例: ...
  • IDEA 版本:2018.2.1 1.點擊 File——New——Project 2.選擇SpringInitializr和Jdk, 點擊 next 3.設置相關包名 工程類型選擇MavenProject 點擊next 4.配置Web相關依賴,搜索'web'點擊第一個,IDEA會為你的項目裝載web ...
  • Spring裝配有三種方式: 基於XML的顯式配置 基於註解的自動裝配 在java中進行顯示配置 1、基於註解的自動裝配 Spring從組件掃描和自動裝配兩個角度實現自動轉配 組件掃描:Spring會自動發現應用上下文中所創建的bean,配置時需要指定掃描的包 組件掃描會將標記了以下註解的類實例化交 ...
  • 前言 在 "上一篇" 中我們學習了結構型模式的適配器模式和橋接模式。本篇則來學習下結構型模式的外觀模式和裝飾器模式。 外觀模式 簡介 外觀模式隱藏系統的複雜性,並向客戶端提供了一個客戶端可以訪問系統的介面。這種類型的設計模式屬於結構型模式,它向現有的系統添加一個介面,來隱藏系統的複雜性。 簡單的來說 ...
一周排行
    -Advertisement-
    Play Games
  • 移動開發(一):使用.NET MAUI開發第一個安卓APP 對於工作多年的C#程式員來說,近來想嘗試開發一款安卓APP,考慮了很久最終選擇使用.NET MAUI這個微軟官方的框架來嘗試體驗開發安卓APP,畢竟是使用Visual Studio開發工具,使用起來也比較的順手,結合微軟官方的教程進行了安卓 ...
  • 前言 QuestPDF 是一個開源 .NET 庫,用於生成 PDF 文檔。使用了C# Fluent API方式可簡化開發、減少錯誤並提高工作效率。利用它可以輕鬆生成 PDF 報告、發票、導出文件等。 項目介紹 QuestPDF 是一個革命性的開源 .NET 庫,它徹底改變了我們生成 PDF 文檔的方 ...
  • 項目地址 項目後端地址: https://github.com/ZyPLJ/ZYTteeHole 項目前端頁面地址: ZyPLJ/TreeHoleVue (github.com) https://github.com/ZyPLJ/TreeHoleVue 目前項目測試訪問地址: http://tree ...
  • 話不多說,直接開乾 一.下載 1.官方鏈接下載: https://www.microsoft.com/zh-cn/sql-server/sql-server-downloads 2.在下載目錄中找到下麵這個小的安裝包 SQL2022-SSEI-Dev.exe,運行開始下載SQL server; 二. ...
  • 前言 隨著物聯網(IoT)技術的迅猛發展,MQTT(消息隊列遙測傳輸)協議憑藉其輕量級和高效性,已成為眾多物聯網應用的首選通信標準。 MQTTnet 作為一個高性能的 .NET 開源庫,為 .NET 平臺上的 MQTT 客戶端與伺服器開發提供了強大的支持。 本文將全面介紹 MQTTnet 的核心功能 ...
  • Serilog支持多種接收器用於日誌存儲,增強器用於添加屬性,LogContext管理動態屬性,支持多種輸出格式包括純文本、JSON及ExpressionTemplate。還提供了自定義格式化選項,適用於不同需求。 ...
  • 目錄簡介獲取 HTML 文檔解析 HTML 文檔測試參考文章 簡介 動態內容網站使用 JavaScript 腳本動態檢索和渲染數據,爬取信息時需要模擬瀏覽器行為,否則獲取到的源碼基本是空的。 本文使用的爬取步驟如下: 使用 Selenium 獲取渲染後的 HTML 文檔 使用 HtmlAgility ...
  • 1.前言 什麼是熱更新 游戲或者軟體更新時,無需重新下載客戶端進行安裝,而是在應用程式啟動的情況下,在內部進行資源或者代碼更新 Unity目前常用熱更新解決方案 HybridCLR,Xlua,ILRuntime等 Unity目前常用資源管理解決方案 AssetBundles,Addressable, ...
  • 本文章主要是在C# ASP.NET Core Web API框架實現向手機發送驗證碼簡訊功能。這裡我選擇是一個互億無線簡訊驗證碼平臺,其實像阿裡雲,騰訊雲上面也可以。 首先我們先去 互億無線 https://www.ihuyi.com/api/sms.html 去註冊一個賬號 註冊完成賬號後,它會送 ...
  • 通過以下方式可以高效,並保證數據同步的可靠性 1.API設計 使用RESTful設計,確保API端點明確,並使用適當的HTTP方法(如POST用於創建,PUT用於更新)。 設計清晰的請求和響應模型,以確保客戶端能夠理解預期格式。 2.數據驗證 在伺服器端進行嚴格的數據驗證,確保接收到的數據符合預期格 ...