要想在終端後臺常駐進程,首先想到的是在命令後加 & 符號,來達到隱藏程式在後臺的目的,儘管看起來進程已經在後臺運行了,實際上終端會話關閉時進程還是會被 kill 掉,這種問題一般是採用搭配 nohup 命令來解決的,nohup 作用是忽略 SIGHUP 信號,而會話關閉時正好發送了該信號給會話內所有 ...
要想在終端後臺常駐進程,首先想到的是在命令後加 & 符號,來達到隱藏程式在後臺的目的,儘管看起來進程已經在後臺運行了,實際上終端會話關閉時進程還是會被 kill 掉,這種問題一般是採用搭配 nohup 命令來解決的,nohup 作用是忽略 SIGHUP 信號,而會話關閉時正好發送了該信號給會話內所有運行程式,簡而言之,nohup 命令搭配 & 不僅可以在後臺運行,還不受會話關閉的影響。
$ nohup /bin/cat &
那麼問題來了,雖然做到了後臺運行,也避免了掛斷操作帶來的影響,但是它避免不了常駐進程自己出現問題,一旦它因自身異常終止了進程,這對黃金搭檔就無力回天了。那怎麼才能把掛了的常駐進程拉起來呢?這就是我們要講的主題 Supervisor。
Supervisor 介紹
Supervisor 是專門用來在類 Unix 系統上監控管理進程的工具,發佈於 2004 年,雖然名字氣勢磅礴,但它的志向並不是統籌整個操作系統的進程,而是致力於做一個聽話的貼身助理,你只需要告訴它要管理的程式,它就按你的要求監控進程,救死扶傷,保證進程的持續運行。
類 Unix 系統就是由 Unix 設計風格演變出的操作系統,除了 Windows 市面上絕大多數系統都是類 Unix 系統。
官方文檔介紹 Supervisor 是 C/S 架構體系,它對應的角色分別為 Supervisorctl 和 Supervisord。後者的主要作用是啟動配置好的程式、響應 Supervisorctl 發過來的指令以及重啟退出的子進程,而前者是 Supervisor 的客戶端,它以命令行的形式提供了一系列參數,來方便用戶向 Supervisord 發送指令,常用的有啟動、暫停、移除、更新等命令。
Supervisor 安裝與配置
安裝 Supervisor 很簡單,在各大操作系統的軟體包管理器中都可以直接安裝。
$ yum install -y supervisor
安裝好的 Supervisor 配置文件預設為 /etc/supervisor.conf,如果找不到配置文件可以通過官方命令生成,該配置文件包含了一個空的配置目錄 /etc/supervisor.d(不同 OS 可能不一樣),只需在該目錄添加配置文件即可動態擴展,所以 supervisor.conf 一般不需要做改動。
我們以最簡單的 cat 命令為例,cat 命令不加參數會阻塞住等待標準輸入,所以很適合做常駐進程的演示。現在創建一個配置文件 cat.ini 到 /etc/supervisor.d/,第一行定義程式的名稱,該名稱用來做操作的標識,第二行定義命令路徑,它才是程式執行的根本命令。
[program:foo]
command=/bin/cat
配置好後,啟動 supervisord 服務,註意通過 -c 指定 supervisor 的配置文件。
$ supervisord -c /etc/supervisord.conf
當然也可以不指定配置路徑,那麼它會按以下順序逐個搜索配置文件:
- $CWD/supervisord.conf
- $CWD/etc/supervisord.conf
- /etc/supervisord.conf
- /etc/supervisor/supervisord.conf
- ../etc/supervisord.conf
- ../supervisord.conf
如果你是通過 Mac OS 安裝的 Supervisor,可能從上述目錄都找不到配置文件,可以利用官方提供的命令生成配置。
$ echo_supervisord_conf > supervisor.conf
這個時候 cat 進程應該已經跑起來了。
$ ps aux | grep /bin/cat
殺掉進程,進程 id 會發生變化,證明 supervisor 又把 cat 拉了起來。
$ sudo kill 9 <進程ID>
核心配置講解
配置文件中的選項並不止 command,官方提供了很多配置項。
[program:name]
command=sh /tmp/echo_time.sh
priority=999
numprocs=1
autostart=true
autorestart=true
startsecs=10
startretries=3
exitcodes=0,2
stopsignal=QUIT
stopwaitsecs=10
user=root
log_stdout=true
log_stderr=true
logfile=/tmp/echo_time.log
logfile_maxbytes=1MB
logfile_backups=10
stdout_logfile_maxbytes=20MB
stdout_logfile_backups=20
stdout_logfile=/tmp/echo_time.stdout.log
下麵挑選幾個配置簡要說明
- command:要執行的命令
- priority:執行優先順序,值越高就越晚啟動,越早關閉
- numprocs:進程數量
- autostart:是否與 supervisord 一起啟動
- autorestart:自動重啟
- startsecs:延時啟動時間,預設為 10 秒
- startretries:啟動重試次數,預設為 3 次
- exitcodes:當程式的退出碼為 0 或 2 時,重啟
- stopsignal:停止信號
- stopwaitsecs:延時停止時間,收到停止指令後多久停止
- user:以哪個用戶執行
動態操作子程式
添加新的程式,只需增加配置文件,然後執行 supervisorctl update 即可動態添加新的程式,並不需要重啟 supervisord 服務。如果出現 refused connection 的提示,可能是沒找到配置文件,需要加上配置選項。
$ supervisorctl update
foo1: added process group
刪除同理,remove 時會先將進程關閉,再從列表中移除。
foo1: stopped
foo1: removed process group
如果需要單獨停止某個程式,可以使用 stop 命令,stop 後跟的是 program 名稱。
$ supervisorctl stop foo
foo: stopped
當然還可以通過 stop all 命令更加暴力的停止所有進程。
$ supervisorctl stop all
foo: stopped
foo1: stopped
反之亦然,啟動進程只需要將 stop 改為 start。
$ supervisorctl start all
連接到某個進程
$ supervisorctl fg <program 名稱>
重啟 supervisord
$ supervisorctl reload
動態載入 supervisor.conf
$ supervisorctl reread
查看所有進程運行狀況
$ supervisorctl status
Web 界面操作
官方提供了界面操作方式,需要在 supervisor.conf 中去掉 inet_http_server 的註釋。
[inet_http_server] ; inet (TCP) server disabled by default
port=127.0.0.1:9001 ; ip_address:port specifier, *:port for all iface
username=user ; default is no username (open server)
password=123 ; default is no password (open server)
重啟 supervisord。
$ supervisorctl reload
訪問 http://localhost:9001 可以看到 supervisor 的操作界面。
我是平也,這有一個專註Gopher技術成長的開源項目「go home」
感謝大家的觀看,如果覺得文章對你有所幫助,歡迎關註公眾號「平也」,聚焦Go語言與技術原理。