本文介紹一下 shell 的語法。 一、變數 在 shell 里,使用變數之前通常並不需要事先為他們做出聲明,需要使用的時候直接創建就行了。預設情況下,所有變數都被看做字元串並以字元串來存儲,即使它們被賦值為數值時也是如此。shell 和一些工具會在需要時把數值型字元串轉換成對應的數值以對它們進行操 ...
本文介紹一下 shell 的語法。
一、變數
在 shell 里,使用變數之前通常並不需要事先為他們做出聲明,需要使用的時候直接創建就行了。預設情況下,所有變數都被看做字元串並以字元串來存儲,即使它們被賦值為數值時也是如此。shell 和一些工具會在需要時把數值型字元串轉換成對應的數值以對它們進行操作。
1.1 變數的命名
shell 變數的命名規則如下:開頭是一個字母或下劃線,後面可以接任意長度的字母、數字或下劃線符號,變數名的字元長度並無限制(Bourne shell中)。不過為了相容性(一些早期的shell里變數名是有長度限制的),一般還是不要超過255個字元。另外,Linux 區分大小寫。當用戶自己定義變數的時候,要註意變數名不能與 shell 中的關鍵字重名。
1.2 變數的賦值
shell 中變數的賦值方式如下:
變數名=值 # 註意 賦值語句兩邊不能有空格
註意,賦值語句兩邊不能有空格(即 “=” 號兩邊不能有空格)。等號右邊若有空格的話,需要加上引號(單引號或雙引號都是可以的)。shell 中可以在變數名前加上 $ 字元來取變數的值。用一個簡單的例子演示一下:
#!/bin/bash name=tongye age=23 address="Hubei Wuhan" money='10$' echo "$name $age in $address" echo "I have $money!" exit 0
輸出結果如下:
這裡需要註意的是單引號和雙引號的用法:在單引號中,所有特殊字元都沒有特殊含義;在雙引號中,"$"、" ` "(反引號)、"\" 有特殊含義,其餘的沒有特殊含義。至於反引號 " ` ",反引號中可以用來引用系統命令,其中的內容將會被優先執行,其功能與 $(...) 一樣,詳情後面再做敘述。
1.3 變數的類型
shell 中有四種類型的變數:用戶自定義變數、環境變數、位置參數變數和預定義變數。
1) 用戶自定義變數
用戶自定義變數只會在當前 shell 中生效,也就是“局部變數”,上面程式中的 name、age、address、money 等都是用戶自定義變數,只能在變數所在的那個 shell 腳本中生效。用戶自定義變數一般用小寫字母來命名。
2) 環境變數
當一個 shell 腳本程式開始執行時,一些變數會根據環境設置中的值進行初始化,這些變數通常用大寫字母做名字,以便與用戶自定義變數做區分,被稱為環境變數。環境變數可以在當前 shell 和這個 shell 的所有子 shell 中生效。如果把環境變數寫入相應的配置文件(如 /etc/profile ),那麼這個環境變數就會在所有的 shell 中生效。系統自帶的環境變數的名字不可更改,但是值可以按需更改。用戶也可以使用 export 命令在 shell 中自己創建環境變數:
export 變數名=變數值 # 創建環境變數並賦值
一些主要的系統環境變數如下:
環境變數 | 描述 |
$HOME | 當前用戶的家目錄 |
$PATH | 以冒號分隔的用來搜索命令的目錄列表,決定了 shell 將到哪些目錄中去尋找命令或程式 |
$PS1 | 命令提示符,通常是 $ 字元,也可以自行設置 |
$PS2 | 二級提示符,用來提示後續的輸入,通常是 > 字元 |
$IFS | 輸入域分隔符。當 shell 讀取輸入時,它給出用來分隔單詞的一組字元,通常是空格、製表符和換行符 |
$0 | shell 腳本的名字 |
$# | 傳遞給腳本的參數個數 |
$$ | shell 腳本的進程號(PID),腳本程式通常會用它來生成一個唯一的臨時文件,如 /tmp/tmpfile_$$ |
3) 位置參數變數
位置參數變數主要用來向腳本中傳遞參數或數據,變數名不能自定義,變數作用也是固定的。主要有以下幾種位置參數變數:
位置參數變數 | 描述 |
$1、$2、... | 腳本程式的參數,分別代表程式的第1個參數、第2個參數、... 程式第10個以上的參數需要用大括弧包含,如 ${10} |
$* | 代表命令行中的所有參數。在一個變數中將所有參數列出,各參數之間用環境變數 IFS 中的第一個字元分隔開。 |
$@ | 和 $* 一樣,也包含了命令行中的所有參數,但是不使用 IFS 環境變數,即使 IFS 為空,參數也是分開顯示的 |
關於 $0 和 $#,在有些資料上,也把這兩個歸為位置參數變數,本文是把它們歸為了環境變數。其中,$0 代表 shell 腳本本身(不算在參數行列),$# 代表傳遞給腳本的參數個數(不包括 $0)。
關於 $* 和 $@,這二者的區別就在 $* 使用 IFS 所定義的分隔符來分隔參數而 $@ 沒有使用。$* 將所有的參數視為一個整體,而 $@ 將所有的參數分別視為單獨的個體。一般來說,採用 $@ 來訪問腳本程式的參數會比較好,不必擔心 IFS 所設置的分隔符為空而導致各參數連在一起分不清楚。
4) 預定義變數
預定義變數是在 bash 中已經定義好了的變數,變數名不能自定義,變數作用也是固定的。實際上,位置參數變數就是預定義變數的一種。 除了上面介紹的一些外,這裡再介紹兩個:
$? :保存最後一次執行的命令的返回狀態。如果 $? 的值為 0 ,則表明上一個命令成功執行;如果值非 0 ,則表明上一個命令沒有成功執行。
$! :用於保存後運行的最後一個進程的 PID 號。
二、算術運算
shell 的算術運算符與 C 語言里的差不多,優先順序與順序也相同。但是,由於 shell 中所有變數都是被看做字元串來存儲的,因此,要處理算術表達式,還需要使用一些特殊手段將數值型字元串轉換成相應的數值。
2.1 使用 expr 命令對算術表達式求值
expr 命令將它的參數當做一個表達式來求值,可以用來進行數學運算。如下:
#!/bin/bash a=2 b=3 c=`expr $a + $b` echo $c
exit 0
這段代碼的輸出結果是:5 。註意使用 expr 命令的那一行,使用的是反引號 `` ,反引號中的內容會被優先執行,所以這一行代碼的作用是將 expr $a + $b 這一表達式的執行結果賦給變數 c 。也可以使用 $(...) 來替代反引號: c=$(expr $a + $b)。
關於反引號和 $( .. ) 表達式,需要說明的一點是,反引號是一種比較老的語法形式,如果你希望自己寫的腳本具備非常好的可移植性,那麼可以使用反引號,新的腳本程式一般都使用 $(...) 來替代反引號了,以避免在反引號中處理一些特殊字元時需要應用的一些相對複雜的規則。比如,如果想在 ` ... ` 結構中使用 ` (反引號)字元,則需要使用轉義符 \ 來進行轉義,這樣會使代碼閱讀起來較為困難。反引號和 $( ... ) 都可以用來引用系統命令。
expr 命令的功能十分強大,可以支持許多表達式求值運算:
表達式 | 說明 |
expr1 | expr2 | 若 expr1 非零,則等於 expr1 ,否則等於 expr2。 |
expr1 & expr2 | 只要有一個表達式為零,則等於零,否則等於 expr1。 |
expr1 = expr2 | 等於(與 == 是同義的),若兩式相等則結果為1,不等結果為0 |
expr1 > expr2 | 大於 |
expr1 >= expr2 | 大於等於 |
expr1 < expr2 | 小於 |
expr1 <= expr2 | 小於等於 |
expr1 != expr2 | 不等於 |
expr1 + expr2 | 加 |
expr1 - expr2 | 減 |
expr1 * expr2 | 乘 |
expr1 / expr2 | 整除 |
expr1 % expr2 | 取餘 |
註意:在 expr 命令所支持的操作符中,“ | 、 & 、< 、<= 、> 、 >= 、 * ” 這幾個需要用 \ 符進行轉義再使用。此外,表達式的各字元之間需要用空格隔開。 用一段代碼演示一下 expr 命令的使用方法:
#!/bin/bash a=5;b=6;c=0 echo $(expr $a \| $c) # 輸出 5 echo $(expr $b \& $c) # 輸出 0 echo $(expr $a \& $b) # 輸出 5 echo $(expr $a \<= $b) # 輸出 1 echo $(expr $a \* $b) # 輸出 30 echo $(expr $a = 2) # 輸出 1
exit 0
expr 命令中的 | 和 & 操作符比較特殊,並不是我們常見的按位或和按位與,而是邏輯操作:
expr1 \| expr2 是邏輯或運算,結果為真(1 表示真,0表示假)則返回 expr1 的值,否則返回 expr2 的值,具有短路功能(expr1 為非零,則表達式一定非零,直接返回 expr1 的值,而不必在對 expr2 的值做判斷);
expr1 \& expr2 是邏輯與運算,結果為真則返回 expr1 的值,否則返回 expr2 的值,具有短路功能(expr1 為零,則表達式一定為零,直接返回零,而不必再對 expr2 的值做判斷)。
2.1 使用 $(( ... )) 的方式對算術表達式求值
expr 雖然功能強大,但是上面已經提到,在進行一些運算的時候,需要使用 \ 符來進行轉義,這對於閱讀代碼的人來說並不友好。另一方面,expr 命令執行起來其實很慢,因為它需要調用一個新的 shell 來處理 expr 命令。更新更好的一種做法是使用 $((...)) 擴展的方式。只需要將準備求值的表達式放在 $((...)) 的括弧中即可進行簡單的算術求值。且,所有支持 $(( ... )) 的shell,都可以讓用戶在提供變數名稱時,無須前置 $ 符。用一段代碼演示一下用法:
#!/bin/bash a=5;b=6 echo $(($a + $b)) # 輸出 11 。在變數名前加上 $,這在shell中一般是取變數值的意思 echo $((a + b)) # 輸出 11 。可見,變數前不加 $ 也是可以的,為了簡便,後面的代碼就不加 $ 了 echo $((a | b)) # 輸出 7 。這裡的 | 是按位或操作符 echo $((a || b)) # 輸出 1 。這裡的 || 是邏輯或操作符 echo $((a & b)) # 輸出 4 。這裡的 & 是按位與操作符 echo $((a && b)) # 輸出 1 。這裡的 && 是邏輯與操作符 echo $((a * b)) # 輸出 30 echo $((a == b)) # 輸出 0
exit 0
可以看到, $(( ... )) 與 expr 命令還是有些不同之處的:
1)首先一些操作符的功能不同( | 和 & );
2)其次, expr 表達式在使用一些操作符時是需要使用轉義操作的,而 $(( ... )) 結構不需要;
3)還有一點就是,$(( ... )) 結構中取變數的值可以不使用 $ 操作符。
一些更具體的使用方法,建議親自動手去操作一下,這裡就不再作更詳細的敘述了。
三、shell 中的條件判斷命令 test 和 [
test 命令可以處理 shell 腳本中的各類工作。它產生的不是一般的輸出,而是可使用的退出狀態。test 命令通過接受各種不同的參數,來控制要執行哪種測試。在許多系統上,test 命令與 [ 命令的作用其實是一樣的,使用 [ 命令的時候,一般在結尾加上 ] 符號,使代碼更具可讀性。另外,需要註意一點的是,在使用 [ 命令時,[ 符號與被檢查的語句之間應該留有空格。shell 中通常使用 test 命令來產生控制結構所需要的條件,根據 test 命令的退出碼決定是否需要執行後面的代碼。
test 命令可以使用的條件類型有三類:字元串比較、算術比較和與文件有關的條件測試。
1)字元串比較
表達式 | 結果 |
string1 = string2 | 如果兩個字元串相同則結果為真 |
string1 != string2 | 如果兩個字元串不同則結果為真 |
-n string | 如果字元串不為空則結果為真 |
-z string | 如果字元串為空(null),則結果為真 |
使用方法如下:
str1="tongye" str2="ttyezi" # 用 test 命令,test 語句的結果將作為 if 的判斷條件,結果為真即條件為真,則執行 if 下麵的語句 if test "$str1" = "$str2" ; then .... fi # 用 [ 命令的話,可以這樣,註意 [ 與表達式之間要有空格 if [ "$str1" != "$str2" ] ; then .... fi
if [ -n "$str1" ] ; then
....
fi
使用字元串比較的時候,必須給變數加上引號 " " ,避免因為空字元或字元串中的空格導致一些問題。實際上,對於條件測試語句里的變數,都建議加上雙引號,能做字元串比較的時候,不要用數值比較。
2)算術比較
算術比較 | 結果 |
expr1 -eq expr2 | 如果兩個表達式相等,則結果為真 |
expr1 -ne expr2 | 如果兩個表達式不相等,則結果為真 |
expr1 -gt expr2 | 如果 expr1 > expr2 ,則結果為真 |
expr1 -ge expr2 | 如果 expr1 >= expr2 ,則結果為真 |
expr1 -lt expr2 | 如果 expr1 < expr2,則結果為真 |
expr1 -le expr2 | 如果 expr1 <= expr2,則結果為真 |
!expr | 如果表達式為假,則結果為真 |
使用方法如下:
num1=2 num2=3 if [ "$num1" -eq "$num2" ] ; then ... fi if [ "$num1" -le "$num2" ] ; then .... fi
註意算術比較和字元串比較之間的不同之處,字元串比較比較的是兩個字元串,數字也是能組成字元串的,因此,當我們使用字元串比較的方式和數字比較的方式來比較兩串數字的時候,結果會有些不同。說起來比較拗口,用一個例子來說明一下:
#!/bin/bash val1="1" val2="001" val3="1 " # 字元串 val3 在 1 的後面還有一個空格 [ "$val1" = "$val2" ] echo $? # 使用字元串比較,退出碼為 1,說明兩個字元串不相等 [ "$val1" -eq "$val2" ] echo $? # 使用數值比較,退出碼為 0,說明兩個數值相等 [ "$val1" = "$val3" ] echo $? # 退出碼為 1 [ "$val1" -eq "$val3" ] echo $? # 退出碼為 0
exit 0
需要註意的是,如果在編寫代碼時,變數沒有加上雙引號,上述程式的結果又會不同,僅對 val3 進行取值,將會忽略該字元串中的空格,則第三個表達式的退出碼將為 0 。這也說明瞭在變數兩邊加上雙引號的重要性。
3)文件條件測試
文件條件測試 | 結果 |
-d file | 如果文件是一個目錄,則結果為真 |
-e file | 如果文件存在,則結果為真。註意,歷史上 -e 選項不可移植,所以通常使用的是 -f 選項 |
-f file | 如果文件存在且為普通文件,則結果為真 |
-g file | 如果文件的 set-group-id 位被設置,則結果為真 |
-r file | 如果文件可讀,則結果為真 |
-s file | 如果文件大小不為 0 ,則結果為真 |
-u file | 如果文件的 set-user-id 為被設置,則結果為真 |
-w file | 如果文件可寫,則結果為真 |
-x file | 如果文件可執行,則結果為真 |
用一個例子演示一下:
#!/bin/bash if [ -f /bin/bash ] ; then echo "file /bin/bash exists" fi if [ -d /bin/bash ] ; then echo "/bin/bash is a directory" else echo "/bin/bash is not a directory" fi
exit 0
四、控制結構
shell 中的控制結構與其他程式設計語言中的控制結構類似,也是由順序結構、選擇結構和迴圈結構組成。
4.1 if 語句
在上面的例子中,已經多次用到了 if 語句,這裡再詳細描述一下 if 語句的語法結構:
if condition1 then statements1 elif condition2 then statements2 else statements3 fi
在 if 結構中,condition 就是我們第三節所說的條件判斷語句。if 語句執行時,先執行 condition ,獲得其退出狀態,若退出狀態為 0(這意味著條件滿足),則執行 then 塊中的語句,否則跳過 then,接下去執行。
如果需要對條件作更進一步的判斷劃分的話,可以使用 elif 語句(類似於 else if)。具體的例子上文有許多,就不再單獨寫了。
4.2 case 語句
與其他編程語言中的 case 語句類似, shell 中的 case 語句也可以用來進行模式匹配,語法如下:
case variable in pattern [ | pattern ] ... ) statements;; pattern [ | pattern ] ... ) statements;; ... esac
關於 case 的語法,有以下幾點需要說明一下:
1)case 語句以 case 作為開頭,以 esac 作為結尾;
2)case 語句的每個模式行都是以雙分號 ;; 結尾的;
3)一個模式行可以合併匹配多個模式,使用 | 符作為分隔;
4)一個模式行可以執行多條語句,各語句之間可以使用單分號 ; 隔開,這也是為什麼每行的結尾要使用雙分號 ;; 作為結束標誌的原因;
5)case 語句支持使用正則表達式作為匹配項,這使得 case 語句的功能更為強大。
#!/bin/bash read -p "please keyin a word:" -t 5 word case $word in [a-z] | [A-Z] ) echo "You have keyin a letter";; [1-9] ) echo "You have keyin a number";; * ) echo "Unknow input" esac exit 0
這段代碼從鍵盤輸入一個字元,然後進行匹配,判斷這個字元是字母還是數字,都不是的話返回未知輸入。
4.3 for 語句
shell 中的 for 語句與 C 語言等的 for 語句格式不一樣,但都是用來迴圈處理一組值的。這組值可以是任意字元串的集合(shell 在預設情況下所有變數都是以字元串的形式存儲的),它們可以在程式里被列出,更常見的做法是使用 shell 的文件名擴展結果。 for 迴圈將會重覆整個對象列表,依次執行每一個獨立對象的迴圈內容。對象可能是命令行參數、文件名或是任何可以以列表形式建立的東西。其語法如下:
for variable in values do statements done
for 命令可以執行指定次數的一個或多個命令。在執行迴圈時,參數列表 values(可以有多個參數,如val1、val2、val3、...) 中的第一個參數將被賦給變數 variable,然後執行迴圈體(do 與 done 之間的命令);然後將列表中的第二個參數賦給 variable,依次迴圈,直到列表中的參數用完。舉個簡單的例子:
#!/bin/bash for name in tongye wuhen xiaodong wufei laowang do echo $name done exit 0
這段代碼將依次列印參數列表中的參數。 關於 for 語句,還有許多其他用法,暫不細說。
4.4 while 與 until 語句
如果你需要進行迴圈操作而是先不知道需要迴圈的次數,可以使用 while 迴圈,while 迴圈的語法如下:
while condition do statements done
until 迴圈語句的功能與 while 一樣,不同的是對於條件判斷結果的處理上。until 迴圈的語法如下:
until condition do statements done
在 while 和 until 語句中,condition 是判斷條件,不同的是,while 語句中,若判斷條件為真,則執行迴圈體;until 語句中,若判斷條件為真,則停止執行迴圈體。
#!/bin/bash i=1 while [ "$i" -le 10 ] do read -p "please keyin a number:" i done 9 10 echo "$i" 11 12 exit 0
這段代碼從鍵盤中輸入一個數字,直到輸入數值大於 10,退出迴圈並列印最後輸入的那個值。
參考書籍:
《Linux程式設計 第四版》
《Shell腳本學習指南》
《UNIX/Linux/OS X 中的 Shell 編程 第四版》