SQL Server 與MySQL中排序規則與字元集相關知識的一點總結

-Advertisement-

字元集&&排序規則字元集是針對不同語言的字元編碼的集合，比如UTF-8字元集，GBK字元集，GB2312字元集等等，不同的字元集使用不同的規則給字元進行編碼排序規則則是在特定字元集的基礎上特定的字元排序方式，排序規則是基於字元集的，是對字元集在排序方式維度上的一個劃分。排序規則是依賴於字元集的，一 ...

字元集&&排序規則

字元集是針對不同語言的字元編碼的集合，比如UTF-8字元集，GBK字元集，GB2312字元集等等，不同的字元集使用不同的規則給字元進行編碼
排序規則則是在特定字元集的基礎上特定的字元排序方式，排序規則是基於字元集的，是對字元集在排序方式維度上的一個劃分。
排序規則是依賴於字元集的，一種字元集可以有多種排序規則，但是一種排序規則只能基於某一種字元集的
比如中文字元集，也即漢字，可以按照“拼音排序”、“按姓氏筆劃排序”等等。
而對於英語，就沒有“拼音”和“姓氏筆畫”，但是可以分為區分大小寫、不區分大小寫等等
而其他語言下麵也有自己特定的排序規則。

在SQL Server中，任何一種字元集的資料庫，都能存儲任何一種語言的字元。
並不是說拉丁（Latin）字元集的數據就存儲不了中文，中文（Chinese）字元集的資料庫就存儲不了蒙古語（只要操作系統本身支持）
sqlserver中，不管哪種字元集（實際上是排序規則）的資料庫（或者欄位），都是可以使用nvarchar（或者nchar），而nvarchar（或者nchar）是可以存儲任意非Unicode字元的
至於排序規則，那是根據不同的字元集所支持的不同的排序規則人為定義的。

SQL Server中的字元集和排序規則
排序規則只不過是指定了存儲的數據的排序（比較）規則而已，換句話說就是，排序規則中已經包含了字元集的信息。
因此在sqlserver中，不需要關心字元集，只需要關心排序規則，sqlserver中在創建只能指定排序規則（不能直接指定字元集），
如截圖，只能指定collation，也就是字元集

在MySQL中的字元集和排序規則

上面說了，排序規則是依賴於字元集的，一種字元集可以有多種排序規則，但是一種排序規則只能基於某一種字元集的。
如下是MySQL中排序規則和字元集的對應關係。

MySQL的建庫語法比較扯，可以指定字元集和排序規則，
如果指定的排序規則在字元集的下麵，則是沒有問題的，如果指定的排序規則不在字元集下麵，則會報錯。

比如下麵這一句，排序規則utf8_bin是屬於字元集utf8下麵的一種排序規則，這個語句執行是沒有問題的
create database test_database2 charset utf8 collate utf8_bin;
再比如下麵這一句，排序規則latin1_bin不是屬於字元集utf8下麵的一種排序規則，這個語句執行是會報錯的
create database test_database2 charset utf8 collate latin1_bin;

以上是字元集和排序規則在sqlserver和MySQL中的一些基本應用，再說說常用的排序規則的區別

***_genera_ci & ***_genera_cs & ***_bin 常見排序規則的特點

以上是某種字元集下常用的三種排序規則，下麵以常見的utf8為例說明
utf8_genera_ci不區分大小寫，ci為case insensitive的縮寫，即大小寫不敏感，
utf8_general_cs區分大小寫，cs為case sensitive的縮寫，即大小寫敏感，但是目前MySQL版本中已經不支持類似於***_genera_cs的排序規則，直接使用utf8_bin替代。
utf8_bin將字元串中的每一個字元用二進位數據存儲，區分大小寫。
那麼，同樣是區分大小寫，utf8_general_cs和utf8_bin有什麼區別？
cs為case sensitive的縮寫，即大小寫敏感；bin的意思是二進位，也就是二進位編碼比較。
utf8_general_cs排序規則下，即便是區分了大小寫，但是某些西歐的字元和拉丁字元是不區分的，比如ä=a，但是有時並不需要ä=a，所以才有utf8_bin
utf8_bin的特點在於使用字元的二進位的編碼進行運算，任何不同的二進位編碼都是不同的，因此在utf8_bin排序規則下：ä<>a

在utf8_genera_ci的情況下A=a，ä=a

在utf8_bin排序規則下，A<>a,ä<>a

所以要想區分大小寫，有沒有特殊需求，就直接使用utf8_bin（實際上***_general_cs在MySQL中本身就不支持，在SQL Server中支持）
以上字元集的特點以及使用情況在SQL Server中表現為類似。

以上。

您的分享是我們最大的動力!

-Advertisement-

更多相關文章

利用python完成多個url狀態碼的檢測

需要註意的是： 1.需要在當前目錄下創建hosts.txt文件，文件內容格式為： https://www.baidu.com,百度首頁 https://www.trc.com,泰然城首頁 https://www.jd.com,京東商城 2.ding_url換成自己的釘釘機器人webhook鏈接，也可 ...
創客工具 - 晶元模擬器 , 原型

昨天已實現一個模擬器的原型. 模擬器的基本原理是, 用另外一種方式實現所有腳本會訪問到的API , 然後把腳本操作的數據, 在網頁上展現出來. 模擬器可以覆蓋大部分開發的情況, 在不使用硬體前就把代碼調試好. 開發速度會更上一個臺階. 下一個階段是完善各種硬體介面, TCP/HTTP/WebSock ...
【詳記MySql問題大全集】三、安裝之後沒有my.ini配置文件怎麼辦

系列目錄一、安裝MySql 二、安裝並破解Navicat 三、沒有my.in配置文件怎麼辦四、設置MySql的大小寫敏感五、重置MySql登陸密碼之前說過，Windows操作系統中，我們安裝Mysql有兩個選擇：一是下載MSI點擊運行，利用windows系統安裝程式的方法按部就班的來安裝；二 ...
oracle系列(四)PL/SQL

過程,函數,觸發器是PL/SQL編寫的,存儲在oracle中的.PL/SQL是非常強大的資料庫過程語言. PL/SQL優點:性能,模塊化,網路傳輸量,安全性缺點:移植性不好簡單分類:塊:過程,函數,觸發器,包 Demo:create or replace procedure sp01 isbegi ...
利用binlog server及Xtrabackup備份集來恢復誤刪表

占座 ...
mssql sqlserver 將欄位null(空值)值替換為指定值的三種方法分享

轉自:http://www.maomao365.com/?p=6965 摘要: 下文將分享兩種將欄位中null值替換為指定值的方法分享，如下所示: 實驗環境:sqlserver 2008 R2 例: ...
Mysql--約束

一、約束的含義和分類 1.1約束的含義：是一種限制，用於限製表中的數據，保證數據的完整性和一致性。 1.2約束的分類： ①not null：非空，保證欄位不能為空。違反約束不會報錯，但是會有警告，適用於說有的類型。 ②default：預設約束，當數據插入的時候，指定的欄位如果沒有數據插入，即插入默 ...
資料庫增刪改查基本操作

一、增加（create add insert ）1，create操作庫 create database 庫名新建庫 create database 庫名 character set 編碼表 2，create 操作表結構新建表： create table 表名（ id int primary ke ...