看第21章時,介紹到瞭解析命令行的神器 getopt,瞭解了 linux 下處理通用命令行的方法。 命令行可分為參數與選項,其中不帶 - 或 -- 首碼的為參數,對一個命令而言數量是固定的,多個參數之間的順序也是固定的(不然命令沒法區分);而選項就是帶 - 或 -- 首碼的,可有可沒有的,由用戶的輸 ...
看第21章時,介紹到瞭解析命令行的神器 getopt,瞭解了 linux 下處理通用命令行的方法。
命令行可分為參數與選項,其中不帶 - 或 -- 首碼的為參數,對一個命令而言數量是固定的,多個參數之間的順序也是固定的(不然命令沒法區分);而選項就是帶 - 或 -- 首碼的,可有可沒有的,由用戶的輸入決定,另外選項也可以有自己的跟隨參數,它們之間是沒有順序的。比如說:
> wget -c http://strawberryperl.com/download/5.30.2.1/strawberry-perl-5.30.2.1-32bit.msi
這個 wget 命令行有兩個輸入,一個是選項 -c,表示斷點續傳;一個是參數 url,就是後面這一串下載的地址。
當然這隻是一個簡單的例子,並沒有多個參數,也沒有多個選項,選項也沒有帶自己的參數。後面我們會自己做一個複雜的例子,來做驗證。
回到 getopt,它的作用就是簡化對這些輸入的處理。
如何簡化呢,就是通過定義一個可接受的選項“模板”,然後通過不停調用 getopt 來將所有選項解析出來,
最後剩下的就是不能被識別的參數了,但是這種場景就簡單了,只需按順序處理它們即可。
下麵是一個用來作驗證的例子:
1 #include "../apue.h" 2 int main (int argc, char *argv[]) 3 { 4 int c, i; 5 char fmt[1024] = { 0 }; 6 char *abc = "abcdefghijklmnopqrtsuvwxyz"; 7 char *ABC = "A:B:C:D:E:F:G:H:I:J:K:L:M:N:O:P:Q:R:S:T:U:V:W:X:Y:Z:"; 8 strcat (fmt, abc); 9 strcat (fmt, ABC); 10 while ((c = getopt (argc, argv, fmt)) != -1) { 11 printf ("got option [%d]: '%c' ('%c')", optind, c, optopt); 12 if (optarg) 13 printf (" arg: '%s'", optarg); 14 15 printf ("\n"); 16 } 17 18 printf ("end up at %d\n", optind); 19 if (optind < argc) 20 printf ("some argument left, from %s\n", argv[optind]); 21 exit (1); 22 }
這個例子比較“貪心”,定義了所有的字母做選項,其中小寫字母不帶參數,大寫字母均帶參數。最後列印解析不了的參數。
它可以用來驗證 getopt 有沒有正確的執行:
$ ./getopt -a -b -c -A 1 -B 2 -C 3 admin 123qwe got option [2]: 'a' ('') got option [3]: 'b' ('') got option [4]: 'c' ('') got option [6]: 'A' ('') arg: '1' got option [8]: 'B' ('') arg: '2' got option [10]: 'C' ('') arg: '3' end up at 10 some argument left, from admin
列印了一些 getopt 相關設施 (optind/optarg/optopt) 的返回值,以便可以觀察它們隨著選項解析後的變化。
其中中括弧中的是 optind 代表的值,表示下一個輸入在 argv 中的位置。
當所有選項解析完成後,這個位置將被更新到結尾或第一個參數的位置(如果有)。
我一直有個疑問,如果當參數夾雜在選項中時,這個位置是定位到哪裡呢?
如果定位到那個參數的位置,那麼應用在向後遍歷剩餘參數時,豈不是會遍歷到已經解析的選項?
如果不是,那豈不是漏掉了一個參數?
於是我用這個小程式做了個測試,就像這樣:
$ ./getopt -a -b admin -c -A 1 -B 2 123qwe -C 3 got option [2]: 'a' ('') got option [3]: 'b' ('') got option [5]: 'c' ('') got option [7]: 'A' ('') arg: '1' got option [9]: 'B' ('') arg: '2' got option [12]: 'C' ('') arg: '3' end up at 10 some argument left, from admin
這次我把用戶名參數放在了 -b 與 -c 之間,把密碼參數放在了 -B 與 -C 之間。
可以看到,各個選項都解析出來了,沒有漏掉;而參數貌似也是正確的。
等等,這個optind顯示位置是 argv[10],也就是說 admin 位於 argv[10],但是明明它是 argv[3] 啊!
而且解析完 -C 時 optind 已經到了 12 就是結尾了,怎麼最後又倒回去了?
為瞭解釋這種種謎團,在解析完成後加入以下兩句代碼,列印解析後的命令行:
1 for (i = 0; i<argc; ++ i) 2 printf ("%s ", argv[i]); 3 4 printf ("\n");
新的程式執行輸出如下:
$ ./getopt -a -b admin -c -A 1 -B 2 123qwe -C 3
got option [2]: 'a' ('')
got option [3]: 'b' ('')
got option [5]: 'c' ('')
got option [7]: 'A' ('') arg: '1'
got option [9]: 'B' ('') arg: '2'
got option [12]: 'C' ('') arg: '3'
end up at 10
./getopt -a -b -c -A 1 -B 2 -C 3 admin 123qwe
some argument left, from admin
原來是命令行參數順序被重新排列了。
所有選項經過解析後排在了參數之前,而參數保持輸入時的順序被排列在選項後面。
這樣通過 optind 進行遍歷,就會得到原順序的參數輸入,perfect !
通過 man 3 getopt 也發現了這樣描述:
By default, getopt() permutes the contents of argv as it scans, so that eventually all the non-options are at the end.
其它的謎團也迎刃而解。
其實回過頭來想,這種 permute argv 參數的成本幾乎沒有,就是移動幾個指針的指向而已,可以說用最小的代價完成了最大的收益。
當然了,getopt 也不是萬能的,例如在選項中有重覆的輸入時,就需要你來處理它們了(不做特別處理的話是後面的選項覆蓋前面的)。