國內最大的程式員社區CSDN網站的用戶資料庫被黑客公開發佈,600萬用戶的登錄名及密碼被公開泄露,隨後又有多家網站的用戶密碼被流傳於網路,連日來引發眾多網民對自己賬號、密碼等互聯網信息被盜取的普遍擔憂。 網路安全成為了現在互聯網的焦點,這也恰恰觸動了每一位用戶的神經,由於設計的漏洞導致了不可收拾的惡
國內最大的程式員社區CSDN網站的用戶資料庫被黑客公開發佈,600萬用戶的登錄名及密碼被公開泄露,隨後又有多家網站的用戶密碼被流傳於網路,連日來引發眾多網民對自己賬號、密碼等互聯網信息被盜取的普遍擔憂。
網路安全成為了現在互聯網的焦點,這也恰恰觸動了每一位用戶的神經,由於設計的漏洞導致了不可收拾的惡果,驗證了一句話“出來混的,遲早是要還的”,所以我想通過專題博文介紹一些常用的攻擊技術和防範策略。
SQL Injection也許很多人都知道或者使用過,如果沒有瞭解或完全沒有聽過也沒有關係,因為接下來我們將介紹SQL Injection。
1.1.2 正文
SQL Injection:就是通過把SQL命令插入到Web表單遞交或輸入功能變數名稱或頁面請求的查詢字元串,最終達到欺騙伺服器執行惡意的SQL命令。
具體來說,它是利用現有應用程式,將(惡意)的SQL命令註入到後臺資料庫引擎執行的能力,它可以通過在Web表單中輸入(惡意)SQL語句得到一個存在安全漏洞的網站上的資料庫,而不是按照設計者意圖去執行SQL語句。
首先讓我們瞭解什麼時候可能發生SQL Injection。
假設我們在瀏覽器中輸入URL www.sample.com,由於它只是對頁面的簡單請求無需對資料庫動進行動態請求,所以它不存在SQL Injection,當我們輸入www.sample.com?testid=23時,我們在URL中傳遞變數testid,並且提供值為23,由於它是對資料庫進行動態查詢的請求(其中?testid=23表示資料庫查詢變數),所以我們可以該URL中嵌入惡意SQL語句。
現在我們知道SQL Injection適用場合,接下來我們將通過具體的例子來說明SQL Injection的應用,這裡我們以pubs資料庫作為例子。
我們通過Web頁面查詢job表中的招聘信息,job表的設計如下:
圖1 jobs表
接著讓我們實現Web程式,它根據工作Id(job_id)來查詢相應的招聘信息,示意代碼如下:
/// <summary> /// Handles the Load event of the Page control. /// </summary> /// <param name="sender">The source of the event.</param> /// <param name="e">The <see cref="System.EventArgs"/> instance containing the event data.</param> protected void Page_Load(object sender, EventArgs e) { if (!IsPostBack) { // Gets departmentId from http request. string queryString = Request.QueryString["departmentID"]; if (!string.IsNullOrEmpty(queryString)) { // Gets data from database. gdvData.DataSource = GetData(queryString.Trim()); // Binds data to gridview. gdvData.DataBind(); } } }
現在我們已經完成了Web程式,接下來讓我們查詢相應招聘信息吧。
圖2 job表查詢結果
如圖所示,我們要查詢資料庫中工作Id值為1的工作信息,而且在頁面顯示了該工作的Id,Description,Min Lvl和Max Lvl等信息。
現在要求我們實現根據工作Id查詢相應工作信息的功能,想必大家很快可以給出解決方案,SQL示意代碼如下:
SELECT job_id, job_desc, min_lvl, max_lvl FROM jobs WHERE (job_id = 1)
假設現在要求我們獲取Department表中的所有數據,而且必須保留WHERE語句,那我們只要確保WHERE恆真就OK了,SQL示意代碼如下:
SELECT job_id, job_desc, min_lvl, max_lvl FROM jobs WHERE (job_id = 1) OR 1 = 1
上面我們使得WHERE恆真,所以該查詢中WHERE已經不起作用了,其查詢結果等同於以下SQL語句。
SELECT job_id, job_desc, min_lvl, max_lvl FROM jobs
SQL查詢代碼實現如下:
string sql1 = string.Format( "SELECT job_id, job_desc, min_lvl, max_lvl FROM jobs WHERE job_id='{0}'", jobId);
現在我們要通過頁面請求的方式,讓資料庫執行我們的SQL語句,我們要在URL中嵌入惡意表達式1=1(或2=2等等),如下URL所示:
http://localhost:3452/ExcelUsingXSLT/Default.aspx?jobid=1'or'1'='1
等效SQL語句如下:
SELECT job_id, job_desc, min_lvl, max_lvl FROM jobs WHERE job_id = '1' OR '1' = 1'
圖3 job表查詢結果
現在我們把job表中的所有數據都查詢出來了,僅僅通過一個簡單的恆真表達式就可以進行了一次簡單的攻擊。
雖然我們把job表的數據都查詢出來了,但數據並沒有太大的價值,由於我們把該表臨時命名為job表,所以接著我們要找出該表真正表名。
首先我們假設表名就是job,然後輸入以下URL:
http://localhost:3452/ExcelUsingXSLT/Default.aspx?jobid=1'or 1=(select count(*) from job)--
等效SQL語句如下:
SELECT job_id, job_desc, min_lvl, max_lvl FROM jobs WHERE job_id='1'or 1=(select count(*) from job) --'
圖4 job表查詢結果
當我們輸入了以上URL後,結果伺服器返回我們錯誤信息,這證明瞭我們的假設是錯誤的,那我們該感覺到挫敗嗎?不,其實這裡返回了很多信息,首先它證明瞭該表名不是job,而且它還告訴我們後臺資料庫是SQL Server,不是MySQL或Oracle,這也設計一個漏洞把錯誤信息直接返回給了用戶。
接下假定表名是jobs,然後輸入以下URL:
http://localhost:3452/ExcelUsingXSLT/Default.aspx?jobid=1'or1=(select count(*) from jobs) --
等效SQL語句如下:
SELECT job_id, job_desc, min_lvl, max_lvl FROM jobs WHERE job_id='1'or 1=(select count(*) from jobs) --'
圖5 job表查詢結果
現在證明瞭該表名是jobs,這可以邁向成功的一大步,由於我們知道了表名就可以對該表進行增刪改操作了,而且我們還可以猜測出更多的表對它們作出修改,一旦修改成功那麼這將是一場災難。
現在大家已經對SQL Injection的攻擊有了初步的瞭解了,接下讓我們學習如何防止SQL Injection。
總的來說有以下幾點:
1.永遠不要信任用戶的輸入,要對用戶的輸入進行校驗,可以通過正則表達式,或限制長度,對單引號和雙"-"進行轉換等。
2.永遠不要使用動態拼裝SQL,可以使用參數化的SQL或者直接使用存儲過程進行數據查詢存取。
3.永遠不要使用管理員許可權的資料庫連接,為每個應用使用單獨的許可權有限的資料庫連接。
4.不要把機密信息明文存放,請加密或者hash掉密碼和敏感的信息。
5.應用的異常信息應該給出儘可能少的提示,最好使用自定義的錯誤信息對原始錯誤信息進行包裝,把異常信息存放在獨立的表中。
通過正則表達校驗用戶輸入
首先我們可以通過正則表達式校驗用戶輸入數據中是包含:對單引號和雙"-"進行轉換等字元。
然後繼續校驗輸入數據中是否包含SQL語句的保留字,如:WHERE,EXEC,DROP等。
現在讓我們編寫正則表達式來校驗用戶的輸入吧,正則表達式定義如下:
private static readonly Regex RegSystemThreats = new Regex(@"\s?or\s*|\s?;\s?|\s?drop\s|\s?grant\s|^'|\s?--|\s?union\s|\s?delete\s|\s?truncate\s|" + @"\s?sysobjects\s?|\s?xp_.*?|\s?syslogins\s?|\s?sysremote\s?|\s?sysusers\s?|\s?sysxlogins\s?|\s?sysdatabases\s?|\s?aspnet_.*?|\s?exec\s?", RegexOptions.Compiled | RegexOptions.IgnoreCase);
上面我們定義了一個正則表達式對象RegSystemThreats,並且給它傳遞了校驗用戶輸入的正則表達式。
由於我們已經完成了對用戶輸入校驗的正則表達式了,接下來就是通過該正則表達式來校驗用戶輸入是否合法了,由於.NET已經幫我們實現了判斷字元串是否匹配正則表達式的方法——IsMatch(),所以我們這裡只需給傳遞要匹配的字元串就OK了。
示意代碼如下:
/// <summary> /// A helper method to attempt to discover [known] SqlInjection attacks. /// </summary> /// <param name="whereClause">string of the whereClause to check</param> /// <returns>true if found, false if not found </returns> public static bool DetectSqlInjection(string whereClause) { return RegSystemThreats.IsMatch(whereClause); } /// <summary> /// A helper method to attempt to discover [known] SqlInjection attacks. /// </summary> /// <param name="whereClause">string of the whereClause to check</param> /// <param name="orderBy">string of the orderBy clause to check</param> /// <returns>true if found, false if not found </returns> public static bool DetectSqlInjection(string whereClause, string orderBy) { return RegSystemThreats.IsMatch(whereClause) || RegSystemThreats.IsMatch(orderBy); }
現在我們完成了校驗用的正則表達式,接下來讓我們需要在頁面中添加校驗功能。
/// <summary> /// Handles the Load event of the Page control. /// </summary> /// <param name="sender">The source of the event.</param> /// <param name="e">The <see cref="System.EventArgs"/> instance containing the event data.</param> protected void Page_Load(object sender, EventArgs e) { if (!IsPostBack) { // Gets departmentId from http request. string queryString = Request.QueryString["jobId"]; if (!string.IsNullOrEmpty(queryString)) { if (!DetectSqlInjection(queryString) && !DetectSqlInjection(queryString, queryString)) { // Gets data from database. gdvData.DataSource = GetData(queryString.Trim()); // Binds data to gridview. gdvData.DataBind(); } else { throw new Exception("Please enter correct field"); } } } }
當我們再次執行以下URL時,被嵌入的惡意語句被校驗出來了,從而在一定程度上防止了SQL Injection。
http://localhost:3452/ExcelUsingXSLT/Default.aspx?jobid=1'or'1'='1
圖6 添加校驗查詢結果
但使用正則表達式只能防範一些常見或已知SQL Injection方式,而且每當發現有新的攻擊方式時,都要對正則表達式進行修改,這可是吃力不討好的工作。
通過參數化存儲過程進行數據查詢存取
首先我們定義一個存儲過程根據jobId來查找jobs表中的數據。
-- ============================================= -- Author: JKhuang -- Create date: 12/31/2011 -- Description: Get data from jobs table by specified jobId. -- ============================================= ALTER PROCEDURE [dbo].[GetJobs] -- ensure that the id type is int @jobId INT AS BEGIN -- SET NOCOUNT ON; SELECT job_id, job_desc, min_lvl, max_lvl FROM dbo.jobs WHERE job_id = @jobId GRANT EXECUTE ON GetJobs TO pubs END
接著修改我們的Web程式使用參數化的存儲過程進行數據查詢。
using (var com = new SqlCommand("GetJobs", con)) { // Uses store procedure. com.CommandType = CommandType.StoredProcedure; // Pass jobId to store procedure. com.Parameters.Add("@jobId", SqlDbType.Int).Value = jobId; com.Connection.Open(); gdvData.DataSource = com.ExecuteScalar(); gdvData.DataBind(); }
現在我們通過參數化存儲過程進行資料庫查詢,這裡我們把之前添加的正則表達式校驗註釋掉。
圖7 存儲過程查詢結果
大家看到當我們試圖在URL中嵌入惡意的SQL語句時,參數化存儲過程已經幫我們校驗出傳遞給資料庫的變數不是整形,而且使用存儲過程的好處是我們還可以很方便地控制用戶許可權,我們可以給用戶分配只讀或可讀寫許可權。
但我們想想真的有必要每個資料庫操作都定義成存儲過程嗎?而且那麼多的存儲過程也不利於日常的維護。
參數化SQL語句
還是回到之前動態拼接SQL基礎上,我們知道一旦有惡意SQL代碼傳遞過來,而且被拼接到SQL語句中就會被資料庫執行,那麼我們是否可以在拼接之前進行判斷呢?——命名SQL參數。
string sql1 = string.Format("SELECT job_id, job_desc, min_lvl, max_lvl FROM jobs WHERE job_id = @jobId"); using (var con = new SqlConnection(ConfigurationManager.ConnectionStrings["SQLCONN1"].ToString())) using (var com = new SqlCommand(sql1, con)) { // Pass jobId to sql statement. com.Parameters.Add("@jobId", SqlDbType.Int).Value = jobId; com.Connection.Open(); gdvData.DataSource = com.ExecuteReader(); gdvData.DataBind(); }
圖8 參數化SQL查詢結果
這樣我們就可以避免每個資料庫操作(尤其一些簡單資料庫操作)都編寫存儲過程了,而且當用戶具有資料庫中jobs表的讀許可權才可以執行該SQL語句。
添加新架構
資料庫架構是一個獨立於資料庫用戶的非重覆命名空間,您可以將架構視為對象的容器(類似於.NET中的命名空間)。
首先我們右擊架構文件夾,然後新建架構。
圖9 添加HumanResource架構
上面我們完成了在pubs資料庫中添加HumanResource架構,接著把jobs表放到HumanResource架構中。
圖 10 修改jobs表所屬的架構
當我們再次執行以下SQL語句時,SQL Server提示jobs無效,這是究竟什麼原因呢?之前還運行的好好的。
SELECT job_id, job_desc, min_lvl, max_lvl FROM jobs
圖 11 查詢輸出
當我們輸入完整的表名“架構名.對象名”(HumanResource.jobs)時,SQL語句執行成功。
SELECT job_id, job_desc, min_lvl, max_lvl FROM HumanResource.jobs
為什麼之前我們執行SQL語句時不用輸入完整表名dbo.jobs也可以執行呢?
這是因為預設的架構(default schema)是dbo,當只輸入表名時,Sql Server會自動加上當前登錄用戶的預設的架構(default schema)——dbo。
由於我們使用自定義架構,這也降低了資料庫表名被猜測出來的可能性。
LINQ to SQL
前面使用了存儲過程和參數化查詢,這兩種方法都是非常常用的,而針對於.NET Framework的ORM框架也有很多,如:NHibernate,Castle和Entity Framework,這裡我們使用比較簡單LINQ to SQL。
圖 12 添加jobs.dbml文件
var dc = new pubsDataContext(); int result; // Validates jobId is int or not. if (int.TryParse(jobId, out result)) { gdvData.DataSource = dc.jobs.Where(p => p.job_id == result); gdvData.DataBind(); }
相比存儲過程和參數化查詢,LINQ to SQL我們只需添加jobs.dbml,然後使用LINQ對錶進行查詢就OK了。
1.1.3 總結
我們在本文中介紹了SQL Injection的基本原理,通過介紹什麼是SQL Injection,怎樣進行SQL Injection和如何防範SQL Injection。通過一些程式源碼對SQL的攻擊進行了細緻的分析,使我們對SQL Injection機理有了一個深入的認識,作為一名Web應用開發人員,一定不要盲目相信用戶的輸入,而要對用戶輸入的數據進行嚴格的校驗處理,否則的話,SQL Injection將會不期而至。