今天偶然看到這篇文章,做個入門瞭解還是不錯的。 前一陣子在QQ上和朋友聊天的時候,總會看到有人說Linux上的應用程式開發是高手才可以完成的,而且這種“迷信”在目前似乎還很普遍。然而,情況並不是這樣的,從程式庫的支持方面,Linux平臺為用戶級應用程式的開發提供了很多功能強大且豐富的程式庫,而且它們 ...
今天偶然看到這篇文章,做個入門瞭解還是不錯的。
前一陣子在QQ上和朋友聊天的時候,總會看到有人說Linux上的應用程式開發是高手才可以完成的,而且這種“迷信”在目前似乎還很普遍。然而,情況並不是這樣的,從程式庫的支持方面,Linux平臺為用戶級應用程式的開發提供了很多功能強大且豐富的程式庫,而且它們大部分是跨平臺的(Boost、OpenGL、STL、Qt、Java等)和基於POSIX標準的(glibc等),同時Linux內核還為驅動程式的開發提供了功能完備的內核介面,從開發工具方面,Linux提供了功能強大的編譯器GCC和調試器GDB,藉助它們的幫助,我們可以很輕鬆的在Linu x上開發出可移植性的應用程式。既然如此,“迷信”又源於何來呢?我想,一方面由於詳細介紹Linux各種開發的書籍較少,各種Linux應用在國內仍不普及,另一方面則是由於很多人在安裝好一個Linux後,苦於找不到一個得心應手的IDE環境,從而感到不知所措,畢竟,我們很多人都習慣了寫好程式後,按下F5,剩下的任務就讓IDE全權代理了。其實想在Linux下如此這般當然也沒問題。既然說到了IDE,就讓我們從它開始吧,相信選擇一個好的IDE環境是你整個學習過程的一個不錯的開始。
工欲善其事 必先利其器——IDE篇
其實Linux下有許多功能強大的IDE環境,因為從某種意義上說,Linux是專為開發者準備的操作系統,這個東西當然少不了,在這裡為讀者介紹一些比較常用的IDE。
KDevelop
這是一個用Qt開發的IDE,其主要支持的語言是C / C++,
Eclipse
近年來,eclipse可以說發展極為迅速,它不僅是一個以java為主的開發平臺,其功能強大的插件體繫結構使得它可以被當作各種應用程式來使用。作為各種插件的載體,eclipse提供了完整的GUI介面,用戶完全可以藉助eclipse來只關心自己想做的工作。
Emacs
VIM
山高月曉 水落石出——IDE後臺的故事 GCC篇
前面我們簡要介紹了一些IDE環境,其中所有C/C++相關程式的編譯都是由GCC來完成的,而IDE只不過起到了一個收集編譯信息和為我們的項目生成makefile等作用(後面我們會提到)。出於目前Linux開發的特點,C仍是系統開發的主流語言。所以,對GCC有一個全面的瞭解是很有必要的,一旦IDE不能滿足你的需求,我們要有手工打造程式的能力,而且出於學習的目的,我們往往不需要IDE生成的那些複雜的文件,為一個Hello world生成2M多的文件顯然是多餘的。
GCC的全稱是GNU Compiler Collection,從這個名字我們不難看出,GCC代表著一個編譯器的集合,目前GCC可以支持C, C++, Objective-C, Objective-C++, Fortran, Java, and Ada等語言。但是出於一般性考慮,我們這裡只討論GCC中的C/C++部分。
目前GCC的最新發佈版是4.0.0,但是這個版本由於使用了新技術和新的編碼規範,很多舊的代碼都需要修改才可以通過編譯,所以並不推薦使用這個版本。而相對穩定的新版本目前是3.4.4,大家可以到GNU的主頁上更新下載。那麼究竟GCC強大在哪裡,如何使用?下麵我就通過幾個簡單而實際的例子帶你看看GCC提供的強大功能。
通過Helloworld的編譯熟悉GCC的基本使用方法
似乎為所有新語言提供一個Hello World樣本程式已經成為了一種不成文的標準,人們通過它來認識語言的一些基本要素。在這裡,我們使用一個Hello World來看看如何用GCC生成可執行文件。
1 #include<stdio.h> 2 3 int main() 4 { 5 printf("hello world!\r\n"); 6 return 0; 7 }
把上面的文件存成helloworld.c,之後打開控制台,輸入如下的命令
gcc helloworld.c –o helloworld
如果一切正常的話,你的控制臺上應該沒有任何輸出。用ls查看你的工作目錄,你會發現目錄下多了一個名為helloworld的可執行文件,之後,執行
./hellworld
就會看到這個程式的輸出了
很簡單不是嗎?但是學過電腦的朋友都應該知道,程式的編譯過程要分為下圖所示的過程而GCC的強大之處就在於它允許你在上面所示的任何一個過程中停下來查看中間結果,並對其加以控制。
1. 預處理
首先是預處理過程,GCC的-E選項可以讓GCC在預處理後停止編譯,並向標準輸出列印預處理過後的文件。下麵的-o用於指定輸出文件的文件名。
gcc –E hellowrold.c –o helloworld.cpp
下麵是helloworld.cpp的一部分的內容,我們看到,文件已經包含了stdio.h中的內容。
如果我們想執行下一步的編譯過程,可以繼續使用GCC的-x <language type>選項,該選項用於顯示指定文件的尾碼名(而不是讓編譯器根據尾碼來自行判斷)。我們比較常用的language type有如下幾種,(如果讀者想獲得更為完整參數說名,請參考GCC manual):
l c c-header c-cpp-output
l c++ c++-header c++-cpp-output
l assembler assembler-with-cpp
另外,下表列出了常用的GCC尾碼名
文件尾碼 |
註釋 |
.c |
需要經過預處理的C代碼文件 |
.i |
不需要經過預處理的C代碼文件 |
.ii |
不需要經過預處理的C++代碼文件 |
.h |
需要被預編譯的C, C++, Objective-C頭文件 |
.cc .cp .cxx .cpp .CPP .c++ .C |
需要被預處理的C++程式文件 |
.hh .H |
需要被預編譯的C++頭文件 |
.s |
彙編代碼文件 |
.S |
需要被預處理的彙編文件 |
當然,你也可以省略掉language type的部分,這時候GCC會根據文件的尾碼名自行判斷,就像你沒有使用該選項一樣。
下麵繼續我們的編譯過程
2. 編譯
如果我們想獲得編譯後的源文件可以使用-S選項,該選項讓gcc只執行編譯(生成彙編文件)而不進行彙編(生成目標文件),此時,我們可以用-o選項指定輸出的彙編文件的名稱。
gcc –S helloworld.cpp –o hellowrld.S
3. 彙編
另外,我們還可以使用GCC的-c選項來編譯和彙編源文件而不鏈接,此時-o指定的輸出文件就是編譯後的目標文件名
gcc –x c++ -c helloworld.cpp –o helloworld.o
4. 鏈接
最後,我們可以利用GCC來把我們剛纔生成的.o文件鏈接成可執行程式
gcc helloworld.o –o helloworld
這一次,我們使用了-o選項指定了可執行文件名,也就是說,根據輸入文件類型的不同,-o有著不同的含義。
5. 函數庫的鏈接和包含文件
對於我們編寫的任和一個程式,沒有庫函數的支持是不可想象的,而當我們要使用的頭文件和函數庫不在GCC預設的搜索路徑下的時候(例如OpenGL、Qt、KDE、Boost等),我們就需要手工來告訴GCC他們的位置。
先來看頭文件路徑的指定。我們可以利用-I<dir_name>來指定我們希望GCC去搜索的頭文件目錄,例如我們要使用X11的程式,我們就要使用下麵的選項
再來看庫函數的設置:我們通過-L<dir_name>和-l<lib_name>兩個命令行選項完成任務。其中-L用於告訴GCC在<dir_name>中去尋找函數庫,而-l選項則告訴GCC使用用戶指定的程式庫。在Linux中,函數庫的命名是遵循UNIX約定的,即lib{lib name},例如libsocket.so,所以當你需要告訴GCC使用這些庫的時候,你就可以使用-lsocket選項。通常,這兩個命令是結合在一起使用的,例如引用X11程式庫的時候,我們可以這樣:
–L/usr/X11R6/lib –lX11
另外,GCC在預設情況下使用共用庫來鏈接程式,而當你想鏈接靜態庫的時候,一定要使用-static選項,例如-lncurses -static
在這一部分的最後,我們對編譯時用到的GCC常用命令做一個簡要的總結
命令 |
說明 |
-x <language type> |
顯示指定輸入文件的格式 |
-c |
編譯和彙編源文件,但不鏈接,輸出為.o文件格式 |
-S |
編譯源文件,但不彙編,輸出為.S文件格式 |
-E |
只對源文件進行預處理,並不編譯,輸出為經過預處理的源代碼 |
我們可以利用上面的-x和-c / –S / –E的組合來控制GCC的整個編譯過程,其中-x用於告訴GCC我們從哪裡開始,而-c / -S / -E用來告訴GCC在那裡結束。 |
|
-o output-file |
用來指定輸出文件,該選項可以指定很多種輸出文件,例如:可執行文件、目標文件、彙編文件或者是預處理過的程式代碼等,這要根據具體的命令行參數而定。當然,GCC還提供了預設的-o選項,其中,預設的可執行文件是a.out,目標文件是<file_name>.o,彙編文件是<file_name>.s,預編譯頭文件的格式是<file_name>.suffix.gch |
-I<dir name> |
告訴GCC在<dir name>中去尋找頭文件 |
-L<dir name> |
告訴GCC在<dir name>中去尋找庫文件 |
-l<lib name> |
使用名為lib<lib name>.so的程式庫 |
-static |
通知GCC鏈接靜態庫 |
上面,我們提到了關於GCC編譯的常用命令,這裡另外補充一些幫助性的常用命令,他們可以讓你對GCC的基本配置和使用作一個瞭解。
命令 |
說明 |
-v |
向標準錯誤列印編譯GCC時使用的命令和預處理器和編譯器的編本,如果你在升級GCC時舉棋不定,那麼不妨在你的控制臺上使用這個選項,看看廠商的配置 |
--help |
向標準輸出列印GCC命令行選項的描述。如果把這個命令和-v結合起來,--help則會同時列印被GCC調用的進程的命令行描述。如果把-Wextra和—help結合起來,那麼,那些沒有文檔描述的命令行選項也會被顯示出來。 |
--target-help |
向標準輸出列印每一個工具的特定命令行選項的描述 |
--version |
現實GCC的版本和版權信息 |
在這部分的最後,我們來談一談關於構建軟體時鏈接參數的設定問題。在上面的第5部分我們已經提到了,函數庫的使用是需要-L和-l一起配合來使用的,但實際上,往往一個像樣的程式需要很多庫的支持,例如,如果你需要編寫一個GTK程式,我們需要下麵的鏈接參數:
-L/usr/lib -L/usr/X11R6/lib -lgtk -lgdk -rdynamic -lgmodule -lglib -ldl -lXi -lXext -lX11 –lm,看上去有些嚇人,你可能會問,我如何知道需要這些呢,如果我想編寫KDE的程式呢,還有OpenGL呢?其實,情況比你想象的要好很多,在/usr/bin目錄下,有很多名為xxx-config的腳本,它們的作用就是向用戶顯示編譯鏈接程式時使用的參數的。這些腳本可以接受一些參數,比較常用的有—libs用於列出鏈接特定程式時使用的程式庫,另外--cflags用於生成頭文件的包含目錄,也就是上面我們提到的-I參數。於是,對於GTK程式,我們可以使用下麵的命令來編譯:
gcc gtksource.c `gtk-config –libs --cflags`
當然,為每一種程式寫一個config顯然不是一個好辦法,目前新的開發包都使用pkg-config這個腳本來生成鏈接參數。你可以使用pkg-config –list-all查看pkg-config支持的所有鏈接參數
當你在上面這份列表中查到了自己想要程式包時,就可以使用下麵的命令來編譯程式了
gcc <source file>.suffix `pkg-config <pkg name> --libs --cflags`
讓GCC幫助你更好的工作
上面我們簡單介紹了GCC的常用命令行選項,其實GCC的功能比上面提到的那些要豐富得多,GCC對代碼的警告、優化、調試等方面提供了豐富的支持,下麵我們就從一些例子來看看GCC提供的這些功能。
1. 對問題代碼提出警告
GCC對程式代碼提供了完整的檢查功能,由於C/C++語言本身的特點,很多錯誤都是程式員無意間犯下的,例如使用了未定義的變數、在bool表達式中使用了=而不是==等等問題,利用GCC提供的代碼檢查功能,我們可以讓編譯器為我們找到這些問題,避免運行時發生災難。
首先,我們來看一個“問題代碼”
1 /* test_warning.c We use this file to check the warning facilities provided by GCC*/ 2 3 #include <stdio.h> 4 #include <stdlib.h> 5 6 7 void main() { /* main should return int*/ 8 9 int a, b; 10 11 long long l = 2.2; /* long long type is GNU extension, not standard ANSI / ISO type*/ 12 13 miss_decl(); /* We call an undeclared function*/ 14 15 if (a = 0) /* May be we want == here instead of =*/ 16 17 printf (“a really equals to 0?/n”); 18 19 if (b != 0) /* We used uninitialized variables*/ 20 21 /* %d and “We should put b here” don’t match*/ 22 23 printf(“We make a mistake again! b = %d/n”, “We should put b here”); 24 25 }; 26 27 28 void miss_decl() { 29 30 /* /* This type of annotation is prohibited*/ 31 32 printf(“We should put the declaration before it’s been used!/n”); 33 34 }
上面這些代碼故意製造了很多編程中出現的常見問題,接下來,我們就用這段代碼來檢測一下GCC提供的各種常用的警告設施。
首先,我們不使用任何警告設施編譯上面的程式
gcc test_warning.c –o test_warning
預設情況下,GCC會給出輸出,其中GCC識別出了main函數不標準(warning)以及使用了未聲明的函數(error)兩個問題,但是其他的GCC並未察覺。
1. 利用-pedantic找出不符合ANSI / ISO標準的代碼
執行下麵的命令:gcc –pedantic test_warning.c –o test_warning
可以看到,這次GCC以警告的形式報告了代碼中long long的使用,但是要說明的是我們並不能依賴這個選項來保證我們的代碼完全符合ANSI / ISO標準,因為該選項只報告ANSI C要求編譯器進行檢察的內容。另外,你還可以使用-pedantic-errors讓GCC把所有的警告都變成錯誤。
2. 利用-Wformat檢查printf中的參數不匹配問題
執行下麵的命令:gcc –Wformat test_warning.c –o test_warning
3. 利用-WComment找出註釋中的錯誤
執行下麵的命令:gcc –WComment test_warning.c –o test_warning
4. 利用-Wparentheses查找bool表達式中的=錯誤
執行下麵的命令:gcc –Wparentheses test_warning.c –o test_warning
5. 用-Wuninitialized查找未初始化變數的使用
執行下麵的命令:gcc –O –Wuninitialized test_warning.c –o test_warning
值得說明的是,在使用這個選項的時候,一定要配合上-O(後面我們會提到)選項
6. 利用-Wimplicit-function-declaration / -Werror-implicit-function-declaration檢查未聲明函數的使用
執行下麵的命令:gcc -Wimplicit-function-declaration test_warning.c –o test_warning
另外-Werror-implicit-function-declaration和-Wimplicit-function-declaration作用是類似的,只是如果你使用了未聲明的函數,前者會把它認為是一個錯誤。
7. 如果你只是想對你的代碼進行全面的檢查,你大可不必把上面的選項一併列出來,GCC提供了-Wall選項,含義就是列出所有代碼中的警告
執行下麵的命令:gcc –Wall test_warning.c –o test_warning
8. 如果你想走另一個極端,也就是不想讓gcc輸出任何警告,那麼使用-w選項,該選項禁止所有的警告
執行下麵的命令:gcc –w test_warning.c –o test_warnin
<輸出結果>
對於上面所有的選項,你都可以把它們和-Werror選項一起使用,這樣就可以把所有的警告都變成錯誤。另外,如果你只是想對代碼進行檢查而並不執行編譯的話,可使用-fsyntax-only選項,像下麵的命令這樣
gcc –fsyntax-only test_warning.c
基本上來說,我們常用的一些警告選項就是這些,而其中-Wall更是我們極為常用的功能。
2. 優化選項
這一部分的內容可以分成兩部分,一部分是讓編譯器對代碼進行分析後,進行的代碼優化,另一部分是我們可以為編譯器制定一些關於硬體的信息,讓他生成對硬體結合的更好的代碼,而我們之所以要用源代碼來編譯程式,很多情況下,是出於這方面的原因。
首先來看代碼優化,從代碼的整體優化上,GCC提供了下麵的選項
-O –O1
這兩個選項的含義是一樣的,GCC將執行減少代碼尺寸和執行時間的優化,對於那些會嚴重影響編譯時間的優化選項,這個級別的優化並不會執行。
-O2
在這一級別GCC將會提供所有支持的優化,但這其中並不包括以空間換時間的優化手段,例如編譯器不會使用迴圈展開和函數內聯。和-O相比,該選項進一步加快了編譯時間和生成代碼的性能。
-O3
除了-O2提供的優化選項外,還指定了-finline-functions,-funswitch-loops和-fgcse-afer-reload選項,目的只有一個就是全力執行代碼優化。
-Os
這個選項是專門用來優化代碼尺寸的,-Os打開了所有-O2級別中不會顯著增長代碼尺寸的優化選項
-O0
該選項代表不執行優化
在這裡要說明的是,儘管GCC提供了1~3和s這4個整體優化選項,但從實際的優化效果上來看,往往O3優化出來的程式的效率並不是最高的,而大部分情況下我們都在使用-O2,如果你希望獲得最高的效率利益,那麼不妨這4個選項都試試。另外,其實這些選項只不過是GCC提供的很多單方面優化的一個組合,如果你想瞭解更為具體的優化內容,可以去查看GCC手冊,出於篇幅限制,這裡不細談了。最後要記住的一點是,如果你的程式是用於高精度數值計算的,那麼記住不要使用上面任何的優化選項。
下麵來看基於硬體優化,由於這部分和電腦硬體相關,這裡僅用Intel的CPU做一些說明:
對於所有為Intel和AMD x86-64提供的優化選項都是用m開頭的,下麵寫一些常用的選項:
-march
該選項用來指定CPU的類型,常用的有i386 / i486 / i586 / pentium-mmx / i686 / pentium2 / pentium3 / pentium-m / pentium4 / prescott / k6 / athlon / athlon-4 / k8等等,讀者可以根據自己的情況進行指定。
-mfpmath
該選項用於指定浮點運算單元的類型。包括
387
使用標準的數學協處理器
sse
使用SSE指令集提供的標量浮點運算。在Pentium3 / Athlon-4以及更新的晶元上支持這個特性。另外,在pentium4以及AMD x86-64處理器上,SSE2還可以進行雙精度浮點計算。
sse,387
混合使用387數學協處理器和SSE指令集,該選項可以充分的利用CPU的浮點寄存器和xmm寄存器,但是該選項還處在試驗階段。
-malign-double
該選項使得GCC把double / long double / long long類型的變數在4位元組或2位元組地址上對齊,
在Pentium級的CPU上,這會使得代碼的執行速度更快,當然帶來的代價是需要更多的記憶體來執行程式。-mmmx –msse –msse2 –msse3 –m3dnow
這些選項用來啟動內置函數直接使用這些處理器擴展指令的功能。在編譯3D或多媒體程式的時候,使用他們是非常有效的。
3. 對調試的支持
當程式出錯的時候,我們可以在Visual Studio中輕鬆的進行調試,而在Linux中,一旦出現Segmentation Fault,似乎我們除了用眼睛去看代碼就沒有更好的選擇了,其實情況不然,用GCC向程式加入一些適當的調試信息,我們可以利用GDB去調試程式。在這裡,我們介紹最為常用的-g和-ggdb選項。
先來看-g。該選項可以利用操作系統的“原生格式(native format)”生成調試信息。GDB可以直接利用這個信息。儘管我們可以把-O和-g放在一起使用,但是,這種做法是極為不推薦的。
如果你想用GDB來調試程式,那麼你可以使用-ggdb來讓GCC為GDB生成更為豐富的調試信息,但是,此時你就不能用其他的調試器來進行調試了。
最後要說明的是,上面這兩個選項都可以接受一個輸出調試信息的級別,預設的級別是2。如果你指定1級(-g1),那麼GCC會生成最少的調試信息,這包括函數和全局變數的描述信息,但是對於局部變數和行號等信息,在這個級別是不會輸出的。另外一個級別是3級(-g3),在這一級別上,GCC會為程式中的所有巨集定義和符號生成調試信息。
小結
通過這篇文章,希望能過對想學習Linux開發中用到的一些基本的技術和知識有一個瞭解,並且能夠自己動手開始做些試驗性的工作,其實,這裡還有很多問題沒有談到,例如利用GDB進行調試、利用make管理工程、利用autoconf為程式生成配置腳本、利用CVS管理程式源文件等等,這些問題有待在今後的文章中和讀者一起交流。