情景linux--shell如何實現多線程？

-Advertisement-

情景linux shell如何實現多線程？情景 shell腳本的執行效率雖高，但當任務量巨大時仍然需要較長的時間，尤其是需要執行一大批的命令時。因為預設情況下，shell腳本中的命令是串列執行的。如果這些命令相互之間是獨立的，則可以使用“併發”的方式執行這些命令，這樣可以更好地利用系統資源，提升 ...

情景linux--shell如何實現多線程？

情景

shell腳本的執行效率雖高，但當任務量巨大時仍然需要較長的時間，尤其是需要執行一大批的命令時。因為預設情況下，shell腳本中的命令是串列執行的。如果這些命令相互之間是獨立的，則可以使用“併發”的方式執行這些命令，這樣可以更好地利用系統資源，提升運行效率，縮短腳本執行的時間。如果命令相互之間存在交互，則情況就複雜了，那麼不建議使用shell腳本來完成多線程的實現。

為了方便闡述，使用一段測試代碼。在這段代碼中，通過seq命令輸出1到10，使用for...in語句產生一個執行10次的迴圈。每一次迴圈都執行sleep 1，並echo出當前迴圈對應的數字。

註意：

真實的使用場景下，迴圈次數不一定等於10，或高或低，具體取決於實際的需求。
真實的使用場景下，迴圈體內執行的語句往往比較耗費系統資源，或比較耗時等。

請根據真實場景的各種情況理解本文想要表達的內容。

$ cat test1.sh

#/bin/bash

all_num=10

a=$(date +%H%M%S)

for num in `seq 1 ${all_num}`
do
    sleep 1
    echo ${num}
done

b=$(date +%H%M%S)

echo -e "startTime:\t$a"
echo -e "endTime:\t$b"

通過上述代碼可知，為了體現執行的時間，將迴圈體開始前後的時間列印了出來。

運行結果：

$ sh test1.sh

1
2
3
4
5
6
7
8
9
10
startTime:  193649
endTime:    193659

10次迴圈，每次sleep 1秒，所以總執行時間10s。

方案

方案1：使用"&"使命令後臺運行

在linux中，在命令的末尾加上&符號，則表示該命令將在後臺執行，這樣後面的命令不用等待前面的命令執行完就可以開始執行了。示例中的迴圈體內有多條命令，則可以以{}括起來，在大括弧後面添加&符號。

$ cat test2.sh

#/bin/bash

all_num=10

a=$(date +%H%M%S)

for num in `seq 1 ${all_num}`
do
{
    sleep 1
    echo ${num}
} &
done

b=$(date +%H%M%S)

echo -e "startTime:\t$a"
echo -e "endTime:\t$b"

運行結果：

sh test2.sh

startTime:  194147
endTime:    194147
[j-tester@merger142 ~/bin/multiple_process]$ 1
2
3
4
5
6
7
8
9
10

通過結果可知，程式沒有先列印數字，而是直接輸出了開始和結束時間，然後顯示出了命令提示符[j-tester@merger142 ~/bin/multiple_process]$（出現命令提示符表示腳本已運行完畢），然後才是數字的輸出。這是因為迴圈體內的命令全部進入後臺，所以均在sleep了1秒以後輸出了數字。開始和結束時間相同，即迴圈體的執行時間不到1秒鐘，這是由於迴圈體在後臺執行，沒有占用腳本主進程的時間。

方案2：命令後臺運行+`wait`命令

解決上面的問題，只需要在上述迴圈體的done語句後面加上wait命令，該命令等待當前腳本進程下的子進程結束，再運行後面的語句。

$ cat test3.sh

#/bin/bash

all_num=10

a=$(date +%H%M%S)

for num in `seq 1 ${all_num}`
do
{
    sleep 1
    echo ${num}
} &
done

wait

b=$(date +%H%M%S)

echo -e "startTime:\t$a"
echo -e "endTime:\t$b"

運行結果：

$ sh test3.sh

1
2
3
4
5
6
7
9
8
10
startTime:  194221
endTime:    194222

但這樣依然存在一個問題：
因為&使得所有迴圈體內的命令全部進入後臺運行，那麼倘若迴圈的次數很多，會使操作系統在瞬間創建出所有的子進程，這會非常消耗系統的資源。如果迴圈體內的命令又很消耗系統資源，則結果可想而知。

最好的方法是併發的進程是可配置的。

方案3：使用文件描述符控制併發數

$ cat test4.sh

#/bin/bash

all_num=10
# 設置併發的進程數
thread_num=5

a=$(date +%H%M%S)


# mkfifo
tempfifo="my_temp_fifo"
mkfifo ${tempfifo}
# 使文件描述符為非阻塞式
exec 6<>${tempfifo}
rm -f ${tempfifo}

# 為文件描述符創建占位信息
for ((i=1;i<=${thread_num};i++))
do
{
    echo 
}
done >&6 


# 
for num in `seq 1 ${all_num}`
do
{
    read -u6
    {
        sleep 1
        echo ${num}
        echo "" >&6
    } & 
} 
done 

wait

# 關閉fd6管道
exec 6>&-

b=$(date +%H%M%S)

echo -e "startTime:\t$a"
echo -e "endTime:\t$b"

運行結果：

$ sh test4.sh

1
3
2
4
5
6
7
8
9
10
startTime:  195227
endTime:    195229

方案4：使用`xargs -P`控制併發數

xargs命令有一個-P參數，表示支持的最大進程數，預設為1。為0時表示儘可能地大，即方案2的效果。

$ cat test5.sh

#/bin/bash

all_num=10
thread_num=5

a=$(date +%H%M%S)

seq 1 ${all_num} | xargs -n 1 -I {} -P ${thread_num} sh -c "sleep 1;echo {}"

b=$(date +%H%M%S)

echo -e "startTime:\t$a"
echo -e "endTime:\t$b"

運行結果：

$ sh test5.sh

1
2
3
4
5
6
8
7
9
10
startTime:  195257
endTime:    195259

方案5：使用`GNU parallel`命令控制併發數

GNU parallel命令是非常強大的並行計算命令，使用-j參數控制其併發數量。

$ cat test6.sh

#/bin/bash

all_num=10
thread_num=6

a=$(date +%H%M%S)


parallel -j 5 "sleep 1;echo {}" ::: `seq 1 10`

b=$(date +%H%M%S)

echo -e "startTime:\t$a"
echo -e "endTime:\t$b"

運行結果：

$ sh test6.sh

1
2
3
4
5
6
7
8
9
10
startTime:  195616
endTime:    195618

總結

“多線程”的好處不言而喻，雖然shell中並沒有真正的多線程，但上述解決方案可以實現“多線程”的效果，重要的是，在實際編寫腳本時應有這樣的考慮和實現。
另外：
方案3、4、5雖然都可以控制併發數量，但方案3顯然寫起來太繁瑣。
方案4和5都以非常簡潔的形式完成了控制併發數的效果，但由於方案5的parallel命令非常強大，所以十分建議系統學習下。
方案3、4、5設置的併發數均為5，實際編寫時可以將該值作為一個參數傳入。

參考文章

相關知識點

wait命令
&後臺運行
文件描述符、mkfifo等
xargs命令
parallel命令

您的分享是我們最大的動力!

-Advertisement-

更多相關文章

FFmpeg 入門(1)：截取視頻幀

本文轉自：[FFmpeg 入門(1)：截取視頻幀 | www.samirchen.com][2] 背景在 Mac OS 上如果要運行教程中的相關代碼需要先安裝 FFmpeg，建議使用 brew 來安裝：或者你可以參考[在 Mac OS 上編譯 FFmpeg][5]使用源碼編譯和安裝 FFmpeg ...
AVAudioSession(4)：響應音頻中斷事件

本文轉自：[AVAudioSession(4)：響應音頻中斷事件 | www.samirchen.com][2] 本文內容主要來源於 [Responding to Interruptions][3]。當一個音頻中斷到來時，會關閉你的 Audio Session，這通常就意味著停止或暫停你的音頻播放 ...
AVAudioSession(3)：定製 Audio Session 的 Category

本文轉自：[AVAudioSession(3)：定製 Audio Session 的 Category | www.samirchen.com][2] 本文內容主要來源於 [Working with Categories][3]。對於 Audio Session 來說，與之對應的 Category ...
SQLServer資料庫表欄位超長，找到超長欄位腳本

平時開發系統時偶爾會遇到數據超長導致往資料庫中保存時出錯。使用下邊的腳本可以方便的找出超長的欄位。 1.通過正式表創建臨時表，修改臨時表中varchar、nvarchar的長度為max 2.數據手動寫入臨時表後，查找超長欄位 3.新建測試表表截圖如下：修改表名，運行 1.通過正式表創建臨時表， ...
【踩坑記錄】記一次MySQL主從複製延遲的坑

最近開發中遇到的一個MySQL主從延遲的坑，記錄並總結，避免再次犯同樣的錯誤。 ...
磁碟空間滿了之後MySQL會怎樣

大多數用戶在對於磁碟進行分區的時候都是習慣性的不給系統盤預留很大空間，其實這並不是一個好習慣。因為系統分區並不像我們想象的那樣會僅僅安裝一個操作系統，系統分區多數還是會承載操作系統主要應用軟體安裝任務。那麼當磁碟空間爆滿後，MySQL會發生什麼事呢？又應該怎麼應對？會發生什麼事當磁碟空間寫滿了之 ...
在PHP中連接資料庫的八大步驟

連接資料庫的八大步驟 Step1：鏈接資料庫 mysqli_connect() 參數： ①主機地址 ②mysql用戶名 ③mysql密碼 ④選擇連接的資料庫 ⑤埠號返回：如果連接成功，返回資源類型的標誌符號；如果連接失敗，返回false。如果我們與mysql建立的連接不只一條，那麼以後操作數據 ...
Redis中的數據對象

redis對象 redis中有五種常用對象我們所說的對象的類型大多是值的類型,鍵的類型大多是字元串對象,值得類型大概有以下幾種,但是無論哪種都是基於redisObject實現的 redisObject的結構如下 type的可選值有五種.分別是 REDIS_STRING, REDIS_LIST, R ...

情景linux--shell如何實現多線程？

情景linux--shell如何實現多線程？

情景

方案

方案1：使用"&"使命令後臺運行

方案2：命令後臺運行+wait命令

方案3：使用文件描述符控制併發數

方案4：使用xargs -P控制併發數

方案5：使用GNU parallel命令控制併發數

總結

參考文章

相關知識點

方案2：命令後臺運行+`wait`命令

方案4：使用`xargs -P`控制併發數

方案5：使用`GNU parallel`命令控制併發數