mysql的字元集和字元序: 字元序:字元序(Collation)是指在同一字元集內字元之間的比較規則 一個字元序唯一對應一種字元集,但一個字元集可以對應多種字元序,其中有一個是預設字元序(Default Collation) mysql的字元集和字元序有四個級別的預設設置:伺服器級,資料庫級,數據 ...
mysql的字元集和字元序:
字元序:字元序(Collation)是指在同一字元集內字元之間的比較規則
一個字元序唯一對應一種字元集,但一個字元集可以對應多種字元序,其中有一個是預設字元序(Default Collation)
mysql的字元集和字元序有四個級別的預設設置:伺服器級,資料庫級,數據表級,欄位級
mysql中的字元序的命名按照規範,以字元序對應的字元集名稱開頭.以_ci(大小寫不敏感),_cs(大小寫敏感)或者_bin(按編碼值比較)
例如:在字元序“utf8_general_ci”下,字元“a”和“A”是等價的
mysql字元集設置:
系統變數:
– character_set_server:預設的內部操作字元集
– character_set_client:客戶端來源數據使用的字元集
– character_set_connection:連接層字元集
– character_set_results:查詢結果字元集
– character_set_database:當前選中資料庫的預設字元集
– character_set_system:系統元數據(欄位名等)字元集
– 還有以collation_開頭的同上面對應的變數,用來描述字元序
MySQL中的字元集轉換過程:
1.MySQL Server收到請求時將請求數據從character_set_client轉換為character_set_connection
2.進行內部操作前將請求數據從character_set_connection轉換為內部操作字元集,其確定方法如下
- 使用每個數據欄位的CHARACTER SET設定值
- 若上述值不存在,則使用對應數據表的DEFAULT CHARACTER SET設定值(MySQL擴展,非SQL標準)
- 若上述值不存在,則使用對應資料庫的DEFAULT CHARACTER SET設定值
- 若上述值不存在,則使用character_set_server設定值
3.將操作結果從內部操作字元集轉換為character_set_results
檢測字元集問題的命令;
SHOW CHARACTER SET;
SHOW COLLATION;
SHOW VARIABLES LIKE ‘character%’;
SHOW VARIABLES LIKE ‘collation%’;
SQL函數HEX、LENGTH、CHAR_LENGTH
SQL函數CHARSET、COLLATION
註意事項:
1.my.cnf中的default_character_set設置隻影響mysql命令連接伺服器時的連接字元集,不會對使用libmysqlclient庫
的應用程式產生任何作用
2.對欄位進行的SQL操作通常都是以內部操作字元集來進行的,不受連接字元集設置的影響
總結:
mysql的字元集可以細化到一個庫,一張表,一列.但是一般是使用預設的設置
1.編譯mysql時,指定了一個預設的字元集,這個字元集是latin1
2.安裝mysql時,可以在配置文件中指定一個預設的字元集,如果沒有指定,這個值繼承編譯時的字元集
3.啟動mysqld時,可以使用character_set_server來指定預設的字元集,如果沒有指定就繼承配置文件中的配置
4.安裝mysql時選擇多語言支持,在程式安裝時會自動將配置設置為UTF-8
預設情況下的mysql預設字元集是latin1
修改預設字元集:
1.最簡單的修改方法:
在mysql的配置文件中加入default-character-set = utf8
character_set_server = utf8
修改完後重啟伺服器
2.線上修改字元集
mysql> SET character_set_client = utf8;
mysql> SET character_set_connection = utf8;
mysql> SET character_set_database = utf8;
mysql> SET character_set_results = utf8;
mysql> SET character_set_server = utf8;
mysql> SET collation_connection = utf8;
mysql> SET collation_database = utf8;
mysql> SET collation_server = utf8;
設置了表的預設字元集為utf8並且通過UTF-8編碼發送查詢,存入資料庫的仍然是亂碼.那connection連接層上可能出了問題
解決方法是在發送查詢前執行一下下麵這句:SET NAMES 'utf8';它相當於下麵的三句指令:
SET character_set_client = utf8;
SET character_set_results = utf8;
SET character_set_connection = utf8;
自己周末放假沒事學習的心得,如有不對請指出.謝謝!