本文為 SQL 初學者介紹了 SQL 究竟是什麼,以及它能做什麼事情。因為 SQL 是用來與資料庫打交道的,所以,我們也介紹了一些基本的資料庫術語。 一、資料庫基礎 你正在讀這這一篇文章,這表明你需要以某種方式與資料庫打交道。SQL 正是用來實現這一任務的語言,因此在學習 SQL 之前,你應該對數據 ...
目錄
本文為 SQL 初學者介紹了 SQL 究竟是什麼,以及它能做什麼事情。因為 SQL 是用來與資料庫打交道的,所以,我們也介紹了一些基本的資料庫術語。
一、資料庫基礎
你正在讀這這一篇文章,這表明你需要以某種方式與資料庫打交道。SQL 正是用來實現這一任務的語言,因此在學習 SQL 之前,你應該對資料庫及資料庫技術的某些基本概念有所瞭解。
你可能還沒有意識到,其實自己一直在使用資料庫。每當你在手機上選取聯繫人,或從電子郵件地址簿里查找名字時,就是在使用資料庫。
你在網站上進行搜索,也是在使用資料庫。你在工作中登錄網路,也需要依靠資料庫驗證用戶名和密碼。即使是在自動取款機上使用 ATM 卡,也要利用資料庫進行密碼驗證和餘額查詢。
雖然我們一直都在使用資料庫,但對究竟什麼是資料庫並不十分清楚。更何況人們可能會使用同一個資料庫術語表示不同的事物,這樣一來,就進一步加劇了這種混亂。
因此,我們首先給出一些最重要的資料庫術語,並加以說明。
提示:基本概念回顧
後面是一些基本資料庫概念的簡要介紹。如果你已經具有一定的資料庫經驗,可以藉此複習鞏固一下;如果你剛開始接觸資料庫,可以由此瞭解必需的基本知識。
理解資料庫概念是學習並掌握 SQL 的重要前提,如果有必要,你或許還應該找本好書好好補一補資料庫基礎知識。
1.1 資料庫
資料庫這個術語的用法很多,但就本博客中的 SQL 分類下的文章而言,資料庫是以某種有組織的方式存儲的數據集合。
最簡單的辦法是將資料庫想象為一個文件櫃。文件櫃只是一個存放數據的物理位置,它不管數據是什麼,也不管數據是如何組織的。
資料庫(database)
保存有組織的數據的容器(通常是一個文件或一組文件)。
註意:誤用導致混淆
人們通常用資料庫這個術語來代表他們使用的資料庫軟體,這是不正確的,也因此產生了許多混淆。確切地說,資料庫軟體應稱為資料庫管理系統(DBMS)。
資料庫是通過 DBMS 創建和操縱的容器,而具體它究竟是什麼,形式如何,各種資料庫都不一樣。
1.2 表
你往文件櫃里放資料時,並不是隨便將它們扔進某個抽屜就完事了的,而是在文件櫃中創建文件,然後將相關的資料放入特定的文件中。
在資料庫領域中,這種文件稱為表。表是一種結構化的文件,可用來存儲某種特定類型的數據。表可以保存顧客清單、產品目錄,或者其他信息清單。
表(table)
某種特定類型數據的結構化清單。
這裡的關鍵一點在於,存儲在表中的數據是同一種類型的數據或清單。決不應該將顧客的清單與訂單的清單存儲在同一個資料庫表中,否則以後的檢索和訪問會很困難。應該創建兩個表,每個清單一個表。
資料庫中的每個表都有一個名字來標識自己。這個名字是唯一的,即資料庫中沒有其他表具有相同的名字。
說明:表名
使表名成為唯一的,實際上是資料庫名和表名等的組合。有的資料庫還使用資料庫擁有者的名字作為唯一名的一部分。
也就是說,雖然在一個資料庫中不能兩次使用相同的表名,但在不同的資料庫中完全可以使用相同的表名。
表具有一些特性,這些特性定義了數據在表中如何存儲,包括存儲什麼樣的數據,數據如何分解,各部分信息如何命名等信息。
描述表的這組信息就是所謂的模式(schema),模式可以用來描述資料庫中特定的表,也可以用來描述整個資料庫(和其中表的關係)。
模式
關於資料庫和表的佈局及特性的信息。
1.3 列和數據類型
表由列組成。列存儲表中某部分的信息。
列(column)
表中的一個欄位。所有表都是由一個或多個列組成的。
理解列的最好辦法是將資料庫表想象為一個網格,就像個電子錶格那樣。網格中每一列存儲著某種特定的信息。
例如,在顧客表中,一列存儲顧客編號,另一列存儲顧客姓名,而地址、城市、州以及郵政編碼全都存儲在各自的列中。
提示:數據分解
正確地將數據分解為多個列極為重要。例如,城市、州、郵政編碼應該總是彼此獨立的列。通過分解這些數據,才有可能利用特定的列對數據進行分類和過濾(如找出特定州或特定城市的所有顧客)。
如果城市和州組合在一個列中,則按州進行分類或過濾就會很困難。你可以根據自己的具體需求來決定把數據分解到何種程度。
例如,一般可以把門牌號和街道名一起存儲在地址里。
這沒有問題,除非你哪天想用街道名來排序,這時,最好將門牌號和街道名分開。
資料庫中每個列都有相應的數據類型。數據類型(datatype)定義了列可以存儲哪些數據種類。
例如,如果列中存儲的是數字(或許是訂單中的物品數),則相應的數據類型應該為數值類型。如果列中存儲的是日期、文本、註釋、金額等,則應該規定好恰當的數據類型。
數據類型
允許什麼類型的數據。每個表列都有相應的數據類型,它限制(或允許)該列中存儲的數據。
數據類型限定了可存儲在列中的數據種類(例如,防止在數值欄位中錄入字元值)。數據類型還幫助正確地分類數據,併在優化磁碟使用方面起重要的作用。
因此,在創建表時必須特別關註所用的數據類型。
註意:數據類型相容
數據類型及其名稱是 SQL 不相容的一個主要原因。雖然大多數基本數據類型得到了一致的支持,但許多高級的數據類型卻沒有。
更糟的是,偶然會有相同的數據類型在不同的 DBMS 中具有不同的名稱。對此用戶毫無辦法,重要的是在創建表結構時要記住這些差異。
1.4 行
表中的數據是按行存儲的,所保存的每個記錄存儲在自己的行內。如果將表想象為網格,網格中垂直的列為表列,水平行為表行。
例如,顧客表可以每行存儲一個顧客。表中的行編號為記錄的編號。
行(row)
表中的一個記錄。
說明:是記錄還是行?
你可能聽到用戶在提到行時稱其為資料庫記錄(record)。這兩個術語多半是可以互通的,但從技術上說,行才是正確的術語。
1.5 主鍵
表中每一行都應該有一列(或幾列)可以唯一標識自己。顧客表可以使用顧客編號,而訂單表可以使用訂單 ID
。雇員表可以使用雇員 ID
。書目表則可以使用國際標準書號 ISBN。
主鍵(primary key)
一列(或幾列),其值能夠唯一標識表中每一行。
唯一標識表中每行的這個列(或這幾列)稱為主鍵。主鍵用來表示一個特定的行。沒有主鍵,更新或刪除表中特定行就極為困難,因為你不能保證操作只涉及相關的行,沒有傷及無辜。
提示:應該總是定義主鍵
雖然並不總是需要主鍵,但多數資料庫設計者都會保證他們創建的每個表具有一個主鍵,以便於以後的數據操作和管理。
表中的任何列都可以作為主鍵,只要它滿足以下條件:
- 任意兩行都不具有相同的主鍵值;
- 每一行都必須具有一個主鍵值(主鍵列不允許空值
NULL
); - 主鍵列中的值不允許修改或更新;
- 主鍵值不能重用(如果某行從表中刪除,它的主鍵不能賦給以後的新行)。
主鍵通常定義在表的一列上,但並不是必須這麼做,也可以一起使用多個列作為主鍵。在使用多列作為主鍵時,上述條件必須應用到所有列,所有列值的組合必須是唯一的(但其中單個列的值可以不唯一)。
還有一種非常重要的鍵,稱為外鍵,我們在 如何使用 SQL INNER JOIN 聯結兩個或多個表 中介紹。
二、什麼是 SQL
SQL(發音為字母 S-Q-L 或 sequel)是 Structured Query Language(結構化查詢語言)的縮寫。SQL 是一種專門用來與資料庫溝通的語言。
與其他語言(如英語或 Java、C、PHP 這樣的編程語言)不一樣,SQL 中只有很少的詞,這是有意而為的。設計 SQL 的目的是很好地完成一項任務——提供一種從資料庫中讀寫數據的簡單有效的方法。
SQL 有哪些優點呢?
- SQL 不是某個特定資料庫廠商專有的語言。絕大多數重要的 DBMS 支持 SQL,所以學習此語言使你幾乎能與所有資料庫打交道。
- SQL 簡單易學。它的語句全都是由有很強描述性的英語單片語成,而且這些單詞的數目不多。
- SQL 雖然看上去很簡單,但實際上是一種強有力的語言,靈活使用其語言元素,可以進行非常複雜和高級的資料庫操作。
下麵我們將開始真正學習 SQL。
說明:SQL 的擴展
許多 DBMS 廠商通過增加語句或指令,對 SQL 進行了擴展。這種擴展的目的是提供執行特定操作的額外功能或簡化方法。雖然這種擴展很有用,但一般都是針對個別 DBMS 的,很少有兩個廠商同時支持這種擴展。
標準 SQL 由 ANSI 標準委員會管理,從而稱為 ANSI SQL。所有主要的 DBMS,即使有自己的擴展,也都支持 ANSI SQL。各個實現有自己的名稱,如 Oracle 的 PL/SQL、微軟 SQL Server 用的 Transact-SQL 等。
三、動手實踐
與其他任何語言一樣,學習 SQL 的最好方法是自己動手實踐。為此,需要一個資料庫和用來測試 SQL 語句的應用系統。
3.1 該選哪個 DBMS?
你需要用一種 DBMS 來跟著學,那麼該選哪一個呢?
基本上有兩種做法。一種是你在自己電腦上安裝一個 DBMS(以及有關的客戶端軟體),這樣做你用起來便利,好控制。但是對很多人來說,要學 SQL 最麻煩的一關就是安裝配置 DBMS 了。
另一種做法是通過網路使用遠程(或雲端)DBMS,你不需要管理或安裝任何東西。
要是準備在自己電腦上安裝,其實可選的很多。我給兩個建議:
-
MySQL(或派生的 MariaDB)是很不錯的,免費,每個主流操作系統都支持,安裝簡便,它也是最流行的 DBMS 之一。
MySQL 自帶一個命令行工具,你可以輸入 SQL 命令,但最好是使用 MySQL Workbench,你也把它下載安裝吧(通常是要單獨安裝的)。
-
Windows 用戶可以使用 Microsoft SQL Server Express。這是強大的 SQL Server 的一個免費版本,它還包括一個用戶友好的客戶端叫 SQL Server Management Studio。
要是準備使用遠程(或雲端)DBMS 的話,我的建議是:
-
如果你是為工作需要而學習 SQL,那麼你們公司應該會有 DBMS 供你使用。這樣的話,你應該可以得到登錄名和連接工具,可以訪問 DBMS 並輸入和測試你的 SQL 語句。
-
雲端 DBMS 是指運行在虛擬伺服器上的 DBMS,用起來就像自己機器上安裝了 DBMS,而實際上不需要安裝。所有主流的雲服務廠商(如谷歌、亞馬遜、微軟)都提供雲端 DBMS。
可是,設置雲端 DBMS(包括配置遠程訪問)都不太簡單,經常比自己安裝個 DBMS 還要費事。
有兩個例外,Oracle 的 Live SQL 和 IBM 的雲端 DB2,它們提供的免費版本有 Web 界面,你只需要在瀏覽器里輸入 SQL 語句就可以了。
學習 SQL 所用到的樣例表腳本 解釋了什麼是樣例表,並詳述瞭如何獲得(或創建)樣例表。
四、小結
本文介紹了什麼是 SQL,它為什麼很有用。因為 SQL 是用來與資料庫打交道的,所以,我們也複習了一些基本的資料庫術語。
我們還建議你學習 SQL 的最好方法是自己親自動手實踐。為此,需要選擇一個資料庫和用來測試 SQL 語句的應用系統。
原文鏈接:https://www.developerastrid.com/sql/sql-introductory-tutorial-create-a-view/
(完)