netcore服務程式暴力退出導致的業務數據不一致的一種解決方案(優雅退出)

来源:https://www.cnblogs.com/huangxincheng/archive/2018/09/03/9576795.html
-Advertisement-
Play Games

一: 問題提出 現如今大家寫的netcore程式大多部署在linux平臺上,而且服務程式裡面可能會做各種複雜的操作,涉及到多數據源(mysql,redis,kafka)。成功部署成後臺 進程之後,你以為這樣就萬事大吉了? 卻不知當你更新代碼時,暴力的kill掉這個進程導致你的業務出現數據不一致,業務 ...


 

一: 問題提出

  現如今大家寫的netcore程式大多部署在linux平臺上,而且服務程式裡面可能會做各種複雜的操作,涉及到多數據源(mysql,redis,kafka)。成功部署成後臺

進程之後,你以為這樣就萬事大吉了? 卻不知當你更新代碼時,暴力的kill掉這個進程導致你的業務出現數據不一致,業務流程被破壞等等問題。比如下麵這段代碼:

 

1. TestService

 1     public class TestService
 2     {
 3         public static void Run()
 4         {
 5             while (true)
 6             {
 7                 Console.WriteLine($"{DateTime.Now}: 1. 獲取mysql");
 8                 System.Threading.Thread.Sleep(2000);
 9                 Console.WriteLine($"{DateTime.Now}: 2. 獲取redis");
10                 System.Threading.Thread.Sleep(2000);
11                 Console.WriteLine($"{DateTime.Now}: 3. 更新monogdb");
12                 System.Threading.Thread.Sleep(2000);
13                 Console.WriteLine($"{DateTime.Now}: 4. 通知kafka");
14                 System.Threading.Thread.Sleep(2000);
15                 Console.WriteLine($"{DateTime.Now}: 5. 所有業務處理完畢");
16                 System.Threading.Thread.Sleep(2000);
17             }
18         }
19     }

 

2. Main程式

1         public static void Main(string[] args)
2         {
3             var bgtask = Task.Run(() => { TestService.Run(); });
4 
5             bgtask.Wait();
6         }

 

      這裡不考慮程式的健壯性,只表達這裡可能出現的問題,當程式退出後,這裡必然會遇到TestService.Run方法出現未執行完的情況,導致數據不一致,比如下

面我簡單的部署了一下,可以看到程式到了 5:03:24s之後就結束了,顯然破壞了業務邏輯。程式沒有完整的執行結束,那問題該怎麼解決呢?

[root@localhost netcore]# nohup dotnet ConsoleApp4.dll &
[1] 4101
[root@localhost netcore]# nohup: ignoring input and appending output to ‘nohup.out’

[root@localhost netcore]# ps -ef | grep dotnet
root       4101   2865  0 17:03 pts/0    00:00:00 dotnet ConsoleApp4.dll
root       4118   2865  0 17:03 pts/0    00:00:00 grep --color=auto dotnet
[root@localhost netcore]# kill 4101
[root@localhost netcore]# tail nohup.out
9/2/18 5:03:06 PM: 2. 獲取redis
9/2/18 5:03:08 PM: 3. 更新monogdb
9/2/18 5:03:10 PM: 4. 通知kafka
9/2/18 5:03:12 PM: 5. 所有業務處理完畢
9/2/18 5:03:14 PM: 1. 獲取mysql
9/2/18 5:03:16 PM: 2. 獲取redis
9/2/18 5:03:18 PM: 3. 更新monogdb
9/2/18 5:03:20 PM: 4. 通知kafka
9/2/18 5:03:22 PM: 5. 所有業務處理完畢
9/2/18 5:03:24 PM: 1. 獲取mysql
[1]+  Done                    nohup dotnet ConsoleApp4.dll
[root@localhost netcore]# 

    

二:思考 kill 命令

  要解決這個問題,大家一定要從kill命令入手, 在centos上進行kill  -x pid 的時候,不知道有多少人瞭解了這個命令,除了常見的 kill -9 pid ,其實還有很多其

他的數字,則代表其他的意思,可以通過kill -l 看一下。

 1 [root@localhost ~]# kill -l
 2  1) SIGHUP     2) SIGINT     3) SIGQUIT     4) SIGILL     5) SIGTRAP
 3  6) SIGABRT     7) SIGBUS     8) SIGFPE     9) SIGKILL    10) SIGUSR1
 4 11) SIGSEGV    12) SIGUSR2    13) SIGPIPE    14) SIGALRM    15) SIGTERM
 5 16) SIGSTKFLT    17) SIGCHLD    18) SIGCONT    19) SIGSTOP    20) SIGTSTP
 6 21) SIGTTIN    22) SIGTTOU    23) SIGURG    24) SIGXCPU    25) SIGXFSZ
 7 26) SIGVTALRM    27) SIGPROF    28) SIGWINCH    29) SIGIO    30) SIGPWR
 8 31) SIGSYS    34) SIGRTMIN    35) SIGRTMIN+1    36) SIGRTMIN+2    37) SIGRTMIN+3
 9 38) SIGRTMIN+4    39) SIGRTMIN+5    40) SIGRTMIN+6    41) SIGRTMIN+7    42) SIGRTMIN+8
10 43) SIGRTMIN+9    44) SIGRTMIN+10    45) SIGRTMIN+11    46) SIGRTMIN+12    47) SIGRTMIN+13
11 48) SIGRTMIN+14    49) SIGRTMIN+15    50) SIGRTMAX-14    51) SIGRTMAX-13    52) SIGRTMAX-12
12 53) SIGRTMAX-11    54) SIGRTMAX-10    55) SIGRTMAX-9    56) SIGRTMAX-8    57) SIGRTMAX-7
13 58) SIGRTMAX-6    59) SIGRTMAX-5    60) SIGRTMAX-4    61) SIGRTMAX-3    62) SIGRTMAX-2
14 63) SIGRTMAX-1    64) SIGRTMAX    

 

 其中裡面的

2.   SIGNIT  (Ctrl+C)

3.   SIGQUIT (退出)

9.   SIGKILL   (強制終止)

15. SIGTERM (終止)

 

都可以讓程式退出,好了,線索出來了,那我能不能讓程式捕獲到kill命令發出的這Sigxxx信號呢??? 通過尋找資料之後的一陣渾身痙攣,你明白了原來只有

-9是不能讓程式捕獲到,其他的程式都能捕獲,那麼既然能捕獲,我就可以在捕獲的事件中做程式的安全退出。 大概的腦圖就像下麵這樣:

 

三:研究如何捕獲

   

         在core 2.0之後,獲取sigterm就非常簡單了,可以在當前應用程式域中掛載一個ProcessExit 事件,在ProcessExit中讓應用程式安全的退出。

 

然後還有一個問題就是,如何在ProcessExit中通知TestService結束執行呢? 這裡就用到了CancellationTokenSource 這種線程安全的取消協調機制,思考之後

畫出來的腦圖大概是這個樣子,不一定對,但是邏輯大概出來了。。。

 

四: 問題解決

    有了上面的腦圖,寫起代碼就快啦~~~

 

1. Main函數

 1         public static void Main(string[] args)
 2         {
 3             var cts = new CancellationTokenSource();
 4 
 5             var bgtask = Task.Run(() => { TestService.Run(cts.Token); });
 6 
 7             AppDomain.CurrentDomain.ProcessExit += (s, e) =>
 8             {
 9                 Console.WriteLine($"{DateTime.Now} 後臺測試服務,準備進行資源清理!");
10 
11                 cts.Cancel();    //設置IsCancellationRequested=true,讓TestService今早結束 
12                 bgtask.Wait();   //等待 testService 結束執行
13 
14                 Console.WriteLine($"{DateTime.Now} 恭喜,Test服務程式已正常退出!");
15 
16                 Environment.Exit(0);
17             };
18 
19             Console.WriteLine($"{DateTime.Now} 後端服務程式正常啟動!");
20 
21             bgtask.Wait();
22         }

 

   Main函數中做瞭如上的變更,將CancellationToken傳遞給 Run方法,這樣當我執行Cancel的時候,Run方法就能感知到Token的變化,然後就是調用Wait等待

TestService執行結束。

 

2. TestService

 1     public class TestService
 2     {
 3         public static void Run(CancellationToken token)
 4         {
 5             while (true)
 6             {
 7                 if (token.IsCancellationRequested) break;
 8 
 9                 Console.WriteLine($"{DateTime.Now}: 1. 獲取mysql");
10                 System.Threading.Thread.Sleep(2000);
11                 Console.WriteLine($"{DateTime.Now}: 2. 獲取redis");
12                 System.Threading.Thread.Sleep(2000);
13                 Console.WriteLine($"{DateTime.Now}: 3. 更新monogdb");
14                 System.Threading.Thread.Sleep(2000);
15                 Console.WriteLine($"{DateTime.Now}: 4. 通知kafka");
16                 System.Threading.Thread.Sleep(2000);
17                 Console.WriteLine($"{DateTime.Now}: 5. 所有業務處理完畢");
18                 System.Threading.Thread.Sleep(2000);
19             }
20         }
21     }

    

      TestService的while迴圈裡面,在周期輪訓的開頭,加上一個IsCancellationRequested的判斷,如果Cancel()方法被調用,IsCancellationRequested就會變

成true,從而讓本方法感知到外界讓我結束,所以本邏輯就不再進行下一個周期了,從而保證業務邏輯的完整。

 

五:部署

 

      為了更好的表達效果,我加了很多的日誌,還是採用nohup的模式來觀察一下程式的流轉過程。

 1 [root@localhost netcore]# nohup dotnet ConsoleApp1.dll &
 2 [2] 4487
 3 [root@localhost netcore]# nohup: ignoring input and appending output to ‘nohup.out’
 4 
 5 [root@localhost netcore]# ps -ef | grep dotnet
 6 root       4487   2865  1 17:11 pts/0    00:00:00 dotnet ConsoleApp1.dll
 7 root       4496   2865  0 17:11 pts/0    00:00:00 grep --color=auto dotnet
 8 [1]-  Done                    nohup dotnet ConsoleApp1.dll
 9 [root@localhost netcore]# kill 4487
10 [root@localhost netcore]# tail -100 nohup.out
11 9/2/18 5:11:17 PM: 1. 獲取mysql
12 9/2/18 5:11:17 PM 後端服務程式正常啟動!
13 9/2/18 5:11:19 PM: 2. 獲取redis
14 9/2/18 5:11:21 PM: 3. 更新monogdb
15 9/2/18 5:11:23 PM: 4. 通知kafka
16 9/2/18 5:11:25 PM: 5. 所有業務處理完畢
17 9/2/18 5:11:27 PM: 1. 獲取mysql
18 9/2/18 5:11:29 PM: 2. 獲取redis
19 9/2/18 5:11:31 PM: 3. 更新monogdb
20 9/2/18 5:11:33 PM: 4. 通知kafka
21 9/2/18 5:11:35 PM: 5. 所有業務處理完畢
22 9/2/18 5:11:37 PM: 1. 獲取mysql
23 9/2/18 5:11:39 PM: 2. 獲取redis
24 9/2/18 5:11:41 PM: 3. 更新monogdb
25 9/2/18 5:11:43 PM: 4. 通知kafka
26 9/2/18 5:11:45 PM: 5. 所有業務處理完畢
27 9/2/18 5:11:47 PM: 1. 獲取mysql
28 9/2/18 5:11:49 PM: 2. 獲取redis
29 9/2/18 5:11:50 PM 後臺測試服務,準備進行資源清理!
30 9/2/18 5:11:51 PM: 3. 更新monogdb
31 9/2/18 5:11:53 PM: 4. 通知kafka
32 9/2/18 5:11:55 PM: 5. 所有業務處理完畢
33 9/2/18 5:11:57 PM 恭喜,Test服務程式已正常退出!

 

    大家可以清楚的看到,5:11:49 收到了system給過來的kill通知,但是程式還是等到了5:11:57才真正的結束自己,這樣是不是就保證了業務流程免遭破壞呢?

好了,本篇就說到這裡,希望對你有幫助。

 


您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • 1.Spring Boot簡介 wiki上的介紹: Spring Boot是Spring的常規配置解決方案,用於創建可以“運行”的獨立的,生產級的基於Spring的應用程式。[22]它預先配置了Spring對Spring平臺和第三方庫的最佳配置和使用的“見解視圖”,因此您可以儘量少開始。大多數Spr ...
  • 一 、前言 本文設計思想採用明德揚至簡設計法。VGA是最常見的視頻顯示介面,時序也較為簡單。本文從利用顯示屏通過VGA方式顯示測試圖案及靜態圖片著手帶大家接觸圖像顯示應用,算是為後續VGA顯示攝像頭採集圖像以及HDMI高清數字顯示方式打個基礎。 二、VGA顯示原理 關於VGA的詳細解釋可查看參考文獻 ...
  • 類載入機制中的雙親委派模型是非常重要的,本文從源碼的角度對雙親委派模式進行瞭解析,源碼調用基本邏輯很簡單. ...
  • 1.MyBatis架構(簡單介紹MyBatis的流程) 接下來簡單介紹一下這張圖:首先明確我們的目的就是要創建sqlsession然後利用這個對象去執行sql 完成CRUD。創建sqlsession的前提就是用session工廠去創建,利用工廠創建需要原材料啊,所以最頂端的MyBatis配置文件就是 ...
  • 1、非同步消息 當一個消息發送時候,消息會被交給消息代理,消息代理可以確保消息被髮送到指定的目的地,同時解放發送者,使其能夠繼續進行其它業務。消息代理通常有ActiveMQ、RabbitMQ...,目的地通常有隊列和主題,隊列採用點對點的模型,主題採用發佈訂閱模型 點對點模型:消息隊列可以有多個接受者 ...
  • 1、多線程安全問題 2、等待喚醒機制 ...
  • 給定兩個以字元串形式表示的非負整數 num1 和 num2,返回 num1 和 num2 的乘積,它們的乘積也表示為字元串形式。 示例 1: 示例 2: 說明: 從題目要求來看,應該是讓我們實現一個比較省記憶體的大數乘法,先分享幾個我在discuss中發現的不太切合題意的解法: 這個可以說是個毫無技術 ...
  • 一、概念和基本註解 從JDK1.5開始,引入了源代碼中的註解這一機制。註解使得 Java 源代碼中不但可以包含功能性的實現代碼,還可以包含元數據。 那麼什麼是元數據呢?所謂元數據,就是描述數據的數據。比如說一張圖片,圖片內容是它的主體數據,那麼像圖片的創建時間、修改時間、創建者等等這些數據,就是這張 ...
一周排行
    -Advertisement-
    Play Games
  • 移動開發(一):使用.NET MAUI開發第一個安卓APP 對於工作多年的C#程式員來說,近來想嘗試開發一款安卓APP,考慮了很久最終選擇使用.NET MAUI這個微軟官方的框架來嘗試體驗開發安卓APP,畢竟是使用Visual Studio開發工具,使用起來也比較的順手,結合微軟官方的教程進行了安卓 ...
  • 前言 QuestPDF 是一個開源 .NET 庫,用於生成 PDF 文檔。使用了C# Fluent API方式可簡化開發、減少錯誤並提高工作效率。利用它可以輕鬆生成 PDF 報告、發票、導出文件等。 項目介紹 QuestPDF 是一個革命性的開源 .NET 庫,它徹底改變了我們生成 PDF 文檔的方 ...
  • 項目地址 項目後端地址: https://github.com/ZyPLJ/ZYTteeHole 項目前端頁面地址: ZyPLJ/TreeHoleVue (github.com) https://github.com/ZyPLJ/TreeHoleVue 目前項目測試訪問地址: http://tree ...
  • 話不多說,直接開乾 一.下載 1.官方鏈接下載: https://www.microsoft.com/zh-cn/sql-server/sql-server-downloads 2.在下載目錄中找到下麵這個小的安裝包 SQL2022-SSEI-Dev.exe,運行開始下載SQL server; 二. ...
  • 前言 隨著物聯網(IoT)技術的迅猛發展,MQTT(消息隊列遙測傳輸)協議憑藉其輕量級和高效性,已成為眾多物聯網應用的首選通信標準。 MQTTnet 作為一個高性能的 .NET 開源庫,為 .NET 平臺上的 MQTT 客戶端與伺服器開發提供了強大的支持。 本文將全面介紹 MQTTnet 的核心功能 ...
  • Serilog支持多種接收器用於日誌存儲,增強器用於添加屬性,LogContext管理動態屬性,支持多種輸出格式包括純文本、JSON及ExpressionTemplate。還提供了自定義格式化選項,適用於不同需求。 ...
  • 目錄簡介獲取 HTML 文檔解析 HTML 文檔測試參考文章 簡介 動態內容網站使用 JavaScript 腳本動態檢索和渲染數據,爬取信息時需要模擬瀏覽器行為,否則獲取到的源碼基本是空的。 本文使用的爬取步驟如下: 使用 Selenium 獲取渲染後的 HTML 文檔 使用 HtmlAgility ...
  • 1.前言 什麼是熱更新 游戲或者軟體更新時,無需重新下載客戶端進行安裝,而是在應用程式啟動的情況下,在內部進行資源或者代碼更新 Unity目前常用熱更新解決方案 HybridCLR,Xlua,ILRuntime等 Unity目前常用資源管理解決方案 AssetBundles,Addressable, ...
  • 本文章主要是在C# ASP.NET Core Web API框架實現向手機發送驗證碼簡訊功能。這裡我選擇是一個互億無線簡訊驗證碼平臺,其實像阿裡雲,騰訊雲上面也可以。 首先我們先去 互億無線 https://www.ihuyi.com/api/sms.html 去註冊一個賬號 註冊完成賬號後,它會送 ...
  • 通過以下方式可以高效,並保證數據同步的可靠性 1.API設計 使用RESTful設計,確保API端點明確,並使用適當的HTTP方法(如POST用於創建,PUT用於更新)。 設計清晰的請求和響應模型,以確保客戶端能夠理解預期格式。 2.數據驗證 在伺服器端進行嚴格的數據驗證,確保接收到的數據符合預期格 ...