Shell 變數(一) bash shell 編程和其他編程語言差不多,同樣包含變數(存放字元串和數值的容器,可以進行修改、比較、傳遞)。在引用 bash 變數時,可以使用一些非常特殊的運算符。bash 還擁有內建變數,這些變數可以提供有關腳本中其他變數的重要信息。下麵介紹 bash 變數和一些特殊 ...
Shell 變數(一)
bash shell 編程和其他編程語言差不多,同樣包含變數(存放字元串和數值的容器,可以進行修改、比較、傳遞)。在引用 bash 變數時,可以使用一些非常特殊的運算符。bash 還擁有內建變數,這些變數可以提供有關腳本中其他變數的重要信息。下麵介紹 bash 變數和一些特殊的變數引用機制,展示如何將其運用於你自己的腳本。
1、shell 變數基礎知識
bash 腳本中的變數名稱通常採用全大寫,但這並非強制性的,只是一種常見做法而已。變數不用事先聲明,直接使用就行了。變數基本上都是字元串類型,不過有些運算符能夠將變數內容視為數字。變數的實際用法如下所示。
# 使用shell變數的普通腳本
MYVAR="something"
echo $MYVAR
# 寫法類似,但沒有引號
MY_2ND=anotherone
echo $MY_2ND
# 這裡因為包含空客,需要使用引號:
MYOTHER="more stuff to echo"
echo $MYOTHER
bash 變數的語法有兩處要點,但可能不那麼一目瞭然。
- 首先,賦值語法 name=value 看起來相當直觀,但 = 兩側不能有任何空白字元。如果允許 = 兩側出現空白字元,那麼變數賦值就會變成下麵這樣:
MYVAR = something
此時 shell 很難區分出到底是要調用命令還是要給變數賦值。對於能夠以 = 為參數的命令(如 test)更是如此。所以,還是讓事情簡單點吧:變數賦值時,shell 不允許在 = 兩側出現空白字元。該規定的另一方面也值得註意,不要在文件名中使用 =。
-
其次需要註意的是,引用變數時要使用 $ 符號。給變數賦值時不需要在變數名前加 $,但獲取變數值時需要。出現在表達式 $(( ))中的變數是個例外。原因很簡單,就是為了消除歧義。如下:
MYVAR=something echo MYVAR is now MYVAR
你能分辨出哪個是字元串 MYVAR,哪個是變數 MYVAR 嗎?bash 中的一切都是字元串,所以需要用 $ 來表明變數引
用。
2、記錄腳本
詳細討論 shell 腳本或變數前,我們還得說說如何記錄腳本。畢竟,你得能看明白自己的腳本,即便是在編寫完的幾個月後。
用註釋記錄腳本。# 代表註釋的開始。該行上隨後的所有字元都會被shell 忽略。
#
# 這是一行註釋
#
# 多用註釋
# 註釋是你的好朋友
如果您是java開發工作者,你會發現,這就是我們平時常說的代碼註釋。
3、將變數名與周圍的文本分開
如果你需要輸出變數以及其他文本。引用變數要用到 $,但是該怎麼區分變數名與緊隨其後的其他文本呢?例如,你想要用 shell 變數作為文件名的一部分,如下所示:
for FN in 1 2 3 4 5
do
somescript /tmp/rep$FNport.txt #執行某個腳本,把文件當作執行參數,如cat
done
shell 會怎麼理解這段代碼?它會認為變數名從 $ 開始,到點號結束。換句話說,它將 $FNport 視為變數名,而非我們想要的 $FN。
那麼,我們如何讓shell知道我們的變數是FN呢?
使用完整的變數引用語法,不僅要包括 $,還要在變數名周圍加上花括弧,如下:
somescript /tmp/rep${FN}port.txt
因為 shell 變數名中只能包含字母、數字以及下劃線,所以很多時候並不需要使用花括弧。任何空白字元或標點符號(下劃線除外)都足以提示變數名的結束位置。但只要有疑問,就應該用花括弧。
4、導出變數
你在某個腳本中定義了一個變數,但在調用其他腳本時,該腳本並不知道這個變數的存在。為瞭解決這個問題,我們需要將傳給其他腳本的變數導出。如下所示:
export MYVAR
export NAME=value
要想查看所有已導出的變數,敲入命令 env(或者內建命令 export-p)就能列出各個變數及其值。當腳本運行時,這些變數都可供使用,其中很多是 bash 啟動腳本已經設置好的,如$PATH。
可以在 export 後面跟上變數賦值,不過這種寫法不適用於比較老的 shell 版本。然後導出之後,就可以隨意給變數賦值,不用重覆導出。因此,有時你會看到下列語句:
# 導出變數
export FNAME
export SIZE
export MAX
# 為變數賦值
MAX=2048
SIZE=64
FNAME=/tmp/scratch
註意,導出的變數實際上是按值調用的。在被調用腳本中修改導出變數的值並不會改變調用腳本中該變數的值。
對於導出的變數,我們該如何刪除呢?
# 刪除變數
unset myvar
Shell 變數(二)
你希望用戶能在調用腳本時指定參數。可以要求用戶設置一個 shell變數,但這種做法似乎不夠靈活。另外還需要向其他腳本傳遞數據。這可以通過環境變數實現,但會使兩個腳本之間的聯繫過於緊密。因此,此處我們可以用到腳本參數。
1、在shell腳本中使用參數
使用命令行參數。在命令行上,出現在腳本名之後的任意單詞都可以在腳本中作為編號變數(numbered variable)被訪問。假設有下列腳本 simplest.sh。
# 一個簡單的shell腳本
echo $1
該腳本會顯示在命令行上被調用時所指定的第一個參數。我們來看一種實際用法。
$ cat simplest.sh
# 一個簡單的shell腳本
echo ${1}
$ ./simplest.sh you see what I mean
you
$ ./simplest.sh one more time
one
$
其他參數的可用形式分別為 ${2}、${3}、${4}、${5} 等。單個數位的數字用不著花括弧,除非要區分變數名與其後出現的文本。典型的腳本只用到少部分參數,但如果涉及 ${10},那就得使用花括弧了,否則 shell 會將 $10 理解為 ${1} 後面緊跟著字元串 0,如下所示。
$ cat tricky.sh
echo $1 $10 ${10}
$ ./tricky.sh I II III IV V VI VII VIII IX X XI
I I0 X #註意觀察第二個輸出
$
第 10 個參數的值是 X,但如果在腳本中寫成 $10,那麼你在 echo語句中得到的會是第一個參數 $1,後面緊跟著一個字元串 0。
因為第三個使用了${},所以三個${10}可以正常輸出X。
2、遍歷傳入腳本的參數: $*
如果你想對指定的一系列參數執行某些操作。在編寫 shell 腳本時,對單個參數進行處理不是什麼問題,只需要用 $1 引用這個參數即可。但如果面對的是一大批文件呢?你可能想這樣調用腳本。
./actall *.txt
shell 會進行模式匹配,生成匹配 *.txt 模式(以 .txt 結尾的文件名)的文件名列表。對於腳本而言,我們永遠無法預估傳入的參數的個數,那麼我們就無法通過${數字}獲取所有參數,那麼${數字}方式將不再適用。
特殊的 shell 變數 $* 能夠引用所有的參數,可以將其用於 for 迴圈,如下所示:
#!/usr/bin/env bash
# 實例文件:actall.sh
# 批量修改文件許可權
#
for FN in $*
do
echo changing $FN
chmod 0750 $FN
done
變數 $FN 是我們自己挑選的;使用別的變數名也沒有任何問題。$*引用的是命令行上出現的所有參數。假如用戶輸入
./actall abc.txt another.txt allmynotes.txt
調用該腳本時,$1 等於 abc.txt、$2 等於 another.txt、$3 等於allmynotes.txt,而 $* 等於整個參數列表。換句話說,shell 替換for 語句中的 $* 後,腳本就變成瞭如下這樣:
for FN in abc.txt another.txt allmynotes.txt
do
echo changing $FN
chmod 0750 $FN
done
for 迴圈從列表中獲取第一個值,並將其賦給變數 $FN,然後執行do 和 done 之間的語句。列表中的其他值會重覆執行該過程。
3、處理包含空格的參數: “”
你編寫了一個可以接受文件名作為參數的腳本,看起來一切正常,但有一次腳本出現了問題,結果發現是因為文件名中帶有空格。你得仔細將所有可能包含文件名的命令參數全部加上引號。引用變數時,將其放入雙引號中。
在 shell 腳本中,曾經簡單的寫作 ls -l $1 的地方,現在最好給參數加上引號,改寫成 ls -l "$1"。否則,如果參數包含空格,那麼會被 shell 解析成兩個單詞,$1 中只會包含部分文件名。如下:
$ cat simpls.sh
# 一個簡單的shell腳本
ls -l ${1}
$
$ ./simple.sh Oh the Waste
ls: Oh: No such file or directory
$
如果調用腳本時沒有將文件名放進引號,那麼 bash 會看到 3 個參數並將 $1 替換成第 1 個參數(Oh)。ls 命令運行時只有一個參數Oh,結果就是無法找到該文件。
接下來,我們在調用腳本時給文件名加上引號。
$ ./simpls.sh "Oh the Waste"
ls: Oh: No such file or directory
ls: the: No such file or directory
ls: Waste: No such file or directory
$
還是不行。bash 得到了一個包含 3 個單詞的文件名,並將 ls 命令中的 $1 替換成了該文件名。到目前一切都還好。但是,我們並沒有將腳本中的變數引用放入引號,因此 ls 將文件名中的各個單詞視為單獨的參數(作為單獨的文件名)。結果還是無法找到這些文件,相當執行命令:
ls -l Oh the Waste
因此,我們需要將我們變數引用放進引號,修改腳本內容如下:
$ cat simpls.sh
# 一個簡單的shell腳本,註意此處${1}與第一次腳本里的區別,多了雙引號
ls -l "${1}"
$
$ ./simple.sh "Oh the Waste"
$
4、處理包含空格的參數列表:$@
對於第二節,我們通過$*,可以獲取參數列表,那麼如果這個時候我們傳入的參數列表包含空格會不會有問題呢? 如下所示:
$ ./actall.sh "Oh the Waste"
changing Oh
chmod: 無 法 訪 問 "Oh": 沒 有 那 個 文 件 或 目 錄
changing the
chmod: 無 法 訪 問 "the": 沒 有 那 個 文 件 或 目 錄
changing Waste
chmod: 無 法 訪 問 "Waste": 沒 有 那 個 文 件 或 目 錄
$
按照上節中的建議,你給變數加上引號,但是仍然出現了錯誤。如下:
#!/usr/bin/env bash
#實例文件:actall.sh
#批量修改文件許可權
#
for FN in $*
do
echo changing "$FN"
chmod 0750 "$FN"
done
如果文件名中帶有空格,就會報錯,報錯的原因與 for 迴圈中使用的 $* 有關。在這個示例中,我們需要用到另一個不同但相關的 shell 變數 $@。如果該變數出現在引號中,則會得到一個命令行參數列表,其中每個參數都會被單獨引用起來。修改後的 shell 腳本如下:
#!/usr/bin/env bash
# 實例文件:chmod_all.2
# 在文件名包含空格時選擇更好的引號添加方式,批量修改文件許可權
#
for FN in "$@"
do
chmod 0750 "$FN"
done
如果不加引號,$* 和 $@ 沒什麼兩樣。但當兩者出現在引號中時,bash 就會區別對待了。"$*" 得到的是整個參數列表,而"$@" 得到的可不是一個字元串,而是與各個參數對應的帶有引號的字元串列表。
如果你知道文件名中沒有空格,沿用老的 $ 語法基本沒什麼大礙。對於那些更穩健的腳本而言,安全起見,建議使用 "$@"*
Shell 變數(三)
1、統計參數數量
你想知道調用腳本時使用了多少個參數。使用 shell 內建變數 $#。如下,展示了一個嚴格要求3個參數的腳本:
#!/usr/bin/env bash
# 實例文件:check_arg_count
#
# 檢查正確的參數數量:
# 使用下列語法或者:if [ $# -lt 3 ]
if (( $# < 3 ))
then
printf "%b" "Error. Not enough arguments.\n" >&2
printf "%b" "usage: myscript file1 op file2\n" >&2
exit 1
elif (( $# > 3 ))
then
printf "%b" "Error. Too many arguments.\n" >&2
printf "%b" "usage: myscript file1 op file2\n" >&2
exit 2
else
printf "%b" "Argument count correct. Proceeding...\n"
fi
以下分別是參數過多和參數數量正好時的運行情況。
$ ./myscript myfile is copied into yourfile
Error. Too many arguments.
usage: myscript file1 op file2
$ ./myscript myfile copy yourfile
Argument count correct. Proceeding...
我們用 if 測試所提供的參數數量(保存在 $# 中)是否大於 3。如果答案是肯定的,則輸出一條錯誤信息,提醒用戶正確的腳本用法,然後退出。
標準提示錯誤信息會被重定向到標準錯誤(>&2)。這種做法符合標準錯誤的本意:作為所有錯誤信息的通道。
2、丟棄參數:shift
所有的正式腳本可能都要有兩種參數:修改腳本行為的選項以及要處理的真正參數。你需要用一種方法在處理完選項後將其丟棄。例如,現在有如下腳本:
for FN in "$@"
do
echo changing $FN
chmod 0750 "$FN"
done
腳本內容非常簡單,它會顯示正在處理的文件名,然後修改文件許可權。但有時你希望腳本靜悄悄地工作,不要顯示文件名,而有時又希望顯示文件名。如何在保留for 迴圈的同時添加一個能夠關閉文件名顯示的選項呢?
用 shift 刪除處理過的參數,如下:
# 自定義變數
VERBOSE=0
# 判斷第一個參數的值
if [[ $1 = -v ]]
then
# 使用變數保存參數值
VERBOSE=1
# 刪除參數
shift
fi
# 此時for拿到的參數已經少了$1,從$2開始讀取
for FN in "$@"
do
if (( VERBOSE == 1 ))
then
echo changing $FN
fi
chmod 0750 "$FN"
done
我們添加了標記變數 $VERBOSE,藉此瞭解是否應該輸出所處理的文件名。可是一旦 shell 腳本發現 -v 選項並設置好標記,我們就用不著參數列表中的 -v 了。shift 語句告訴 bash 將命令行參數挪動一個位置,使 $2 變成 $1、$3 變成 $2,以此類推,這樣就丟棄了第一個參數($1)。如此一來,當 for 迴圈啟動時,參數列表($@)中就再也沒有 -v,剩下的是緊隨其後的那些參數。
運行結果如下:
# 執行腳本,帶-v參數,輸出修改的文件名
$ ./shift_test.sh -v error.out
changing error.out
# 執行腳本,不帶-v參數,悄悄執行,不輸出文件名
$./shift_test.sh error.out
$
3、獲取預設值:${:-}
有一個可以接受命令行參數的 shell 腳本。如你希望能夠提供預設值,這樣就不用每次都讓用戶輸入那些頻繁用到的值了。
用 ${:-} 語法引用參數並提供預設值,如下所示:
FILEDIR=${1:-/tmp}
在引用 shell 變數時,有多種特殊運算符可用。:- 運算符的意思是,如果指定參數(這裡是 $1)不存在或為空,則將運算符之後的內容(本例為 /tmp)作為值。否則,使用已經設置好的參數值。該運算符可用於任何 shell 變數,並不局限於位置參數$1、$2、$3等。
當然,你也可以用更多的代碼來實現:用 if 語句檢查變數是否為空或不存在,但在 shell 腳本中,此類處理司空見慣,:- 運算符可謂是一種頗受歡迎的便捷寫法。
4、設置環境變數預設值: ${HOME:=/tmp}
你的腳本依賴於某些常用(如 $USER)或業務特定的環境變數。要想構建一個穩健的 shell 腳本,就得確保這些變數都有合理的預設值。那麼該如何確保呢?
首次引用 shell 變數時,如果該變數沒有值,則使用賦值運算符為其賦值,如下:
cd ${HOME:=/tmp}
示例中所引用的 $HOME 會返回其當前值,除非它為空或者壓根就沒設置。對於後兩種情況(為空或沒有設置),返回 /tmp,該值還會被賦給 $HOME,隨後再引用 $HOME 的話,返回的就是這個新值。如下所示,
註意:下麵的例子會改變環境變數HOME,請慎重執行
$ echo ${HOME:=/tmp}
/home/uid002
$ unset HOME # 刪除環境變數值
$ echo ${HOME:=/tmp} # 重新獲取,此時不存在,將重新賦值並返回新值
/tmp
$ echo $HOME # 此時再查看變數,輸出新設置的值
/tmp
$ cd;pwd
/tmp
$
賦值運算符有一個重要的例外:不能對位置參數(如 $1 或$)賦值。在這種情況下,可以使用 :-(如 ${1:-default*}),該表達式只返回值,但不進行賦值。
${VAR:=value} 和 ${VAR:-value} 在形式上的差異,也許可以幫助你記憶這兩種讓人抓狂的符號。:= 執行賦值操作,同時返回運算符右側的值。:- 只做了前者一半的工作:返回值,但不賦值。因此,它的符號也只有等號的一半(一個橫杠,而不是兩個)。
Shell 變數(四)
1、獲得某個數的絕對值
變數中的數值可能是負數,也可能是零或正數。你想得到它的大小(也就是絕對值),但 bash 似乎沒有求絕對值的功能。但是,我們可以利用字元串操作。如下:
${MYVAR#-}
這是一種簡單的字元串操作。# 從字元串起始位置開始搜索負號(-)。如果找到,則將其刪除;如果沒有找到,就保留原值。不管是哪種情況,最後得到的都是不包含負號的絕對值。
然而,我們也可以使用 if/then/else 按照數學方法來實現。如下:
# 通過判斷數值於0的關係,並且通過與-1相乘
if (( MYVAR < 0 ))
then
let MYVAR=MYVAR*-1
fi
對比上面2種方法,明顯第一種更簡單,所以推薦第一種。
2、選取CSV的替換值
你想製作一個由逗號分隔的值列表,但不希望開頭或結尾處出現逗號,然後這是我們日常工作中很普遍的需求。如果在迴圈內部用 LIST="${LIST},${NEWVAL}" 構建該列表,那麼第一次迴圈(此時 LIST 為空)過後會得到一個前導逗號。你可以對 LIST 進行特殊的初始化處理,以便它在進入迴圈前就先得到第一個值,但如果覺得這種方法不實用,或是為了避免重覆代碼(用於得到新值),你可以改用 bash 中的 ${:+} 語法。如下:
LIST="${LIST}${LIST:+,}${NEWVAL}"
如果 {LIST} 為空或不存在,那麼 $LIST 的兩個表達式不會產生任何內容。這就意味著,第一次迴圈過後,LIST 中保存的只有NEWVAL 的值。如果 LIST 不為空,則第二個表達式 ${LIST:+,}會被替換為逗號,將先前的值與新值分隔開來。
下麵的代碼片段用於讀取並構建 CSV 列表。
LIST=""
for NEWVAL in "$@"
do
LIST="${LIST}${LIST:+,}${NEWVAL}"
done
echo ${LIST}
3、使用數組變數
到目前為止,我們已經見識了不少使用變數的腳本,但是 bash 能不能處理數組呢?當然可以,bash 有專門的一維數組語法。
如果編寫腳本時已經知道具體的值,則初始化數組就很容易了。格式如下:
MYRA=(first second third home)
註意:數組是用(),這同java里的數組符號[]不同。
括弧內列表的每個單詞都對應著一個數組元素。你可以像下麵這樣引用各個元素:
echo runners on ${MYRA[0]} and ${MYRA[2]}
輸出結果如下:
runners on first and third
註意:如果只寫 $MYRA,那麼只會得到第一個數組元素,相當於${MYRA[0]}。
4、轉換大小寫
bash 4.0 中的幾個運算符可以在引用變數名時轉換其大小寫。如果變數 $FN 中包含一個需要轉換成小寫的文件名(字元串),那麼${FN,,} 會返回全部是小寫形式的字元串。與此類似,${FN^^} 會返回全部是大寫形式的字元串。甚至還有 ${FN~~},它可以切換大小寫,將所有的小寫字母轉換成大寫,大寫字母轉換成小寫。
以下的 for 迴圈會將所有參數更改成小寫字母。
for FN in "$@"
do
echo "${FN}" 轉為小寫的結果為:"${FN,,}"
done
或者寫成單行腳本:
for FN in "$@"; do echo "${FN}" 轉為小寫的結果為:"${FN,,}" ; done
5、對不存在的參數輸出錯誤消息
有時你需要強制用戶指定某個值,否則就無法繼續往下進行。用戶有可能會遺漏某個參數,因為他們確實不知道該怎樣調用腳本。你希望能給用戶點提示,省得他們自己瞎猜。相較於堆砌成堆的 if 語句,有沒有更簡潔的方法來檢查各個參數?
引用參數時使用 ${:?} 語法。如果指定參數不存在或為空,那麼 bash 會輸出錯誤消息並退出。
#!/usr/bin/env bash
# 實例文件:check_unset_parms
#
USAGE="usage: myscript scratchdir sourcefile conversion"
FILEDIR=${1:?"Error. You must supply a scratch directory."}
FILESRC=${2:?"Error. You must supply a source file."}
CVTTYPE=${3:?"Error. ${USAGE}"}
如果執行腳本時沒有指定足夠的參數,則會出現下列結果。
$ ./myscript /tmp /dev/null
./myScript.sh:行11: 3: Error. usage: myscript scratchdir sourcefile conversion
$
bash 會測試各個參數,如果參數不存在或為空,則輸出錯誤信息並退出。$3 所對應的錯誤消息中使用了另一個 shell 變數。
如果 $3 不存在,則錯誤消息中會包含短語 "Error."、變數$USAGE 的值。
另一方面,${:?} 生成的錯誤信息包含 shell 腳本文件名和行號。
本文由
傳智教育博學谷
教研團隊發佈。如果本文對您有幫助,歡迎
關註
和點贊
;如果您有任何建議也可留言評論
或私信
,您的支持是我堅持創作的動力。轉載請註明出處!