MySQL學習筆記(8):字元集

来源:https://www.cnblogs.com/garvenc/archive/2020/07/01/mysql_learning_8_character_set.html
-Advertisement-
Play Games

本文更新於2019-06-16,使用MySQL 5.7,操作系統為Deepin 15.4。 常用字元集 字元集 定長 代碼寬度 說明 ASCII或ISO-646 是 1位元組7位 英文字母、數字、標點符號和33個控制符 ISO-8859系列 是 1位元組8位 各西歐字元集,相容ASCII GB2312 ...


本文更新於2019-06-16,使用MySQL 5.7,操作系統為Deepin 15.4。

目錄

常用字元集

字元集 定長 代碼寬度 說明
ASCII或ISO-646 1位元組7位 英文字母、數字、標點符號和33個控制符
ISO-8859系列 1位元組8位 各西歐字元集,相容ASCII
GB2312 1或2位元組 相容ASCII,不推薦使用
GBK 1或2位元組 相容GB2312
GB18030 1、2或4位元組 相容GBK
Unicode或UCS-4或ISO-10646 4位元組 從最高位元組起依次代表組(group)、面(plane)、行(row)、格(ceil),包括BMP、輔助字面和專用字面
UCS-2 2位元組 UCS-4的0組0面,即基本多語言文字面(BMP)

Unicode有如下編碼方式:

編碼方式 定長 代碼寬度 說明
UTF-8 1至6位元組 相容ASCII
UTF-16 2或4位元組 BMP使用2位元組表示,以外使用4位元組表示,按位元組序不同分為UTF-16BE和UTF-16LE
UTF-32 4位元組 Unicode原始編碼,按位元組序不同分為UTF-32BE和UTF-32LE

UTF-8編碼如下:

位元組 代碼位數 代碼空間 位元組組合
1 0-7 0x0 - 0x7f 0xxxxxxx
2 8-11 0x80 - 0x7ff 110xxxxx,10xxxxxx
3 12-16 0x800 - 0xffff 1110xxxx,10xxxxxx,10xxxxxx
4 17-21 0x10000 - 0x1fffff 11110xxx,10xxxxxx,10xxxxxx,10xxxxxx
5 22-26 0x200000 - 0x3ffffff 111110xx,10xxxxxx,10xxxxxx,10xxxxxx,10xxxxxx
6 27-31 0x4000000 - 0x7fffffff 1111110x,10xxxxxx,10xxxxxx,10xxxxxx,10xxxxxx,10xxxxxx

每個漢字,GBK使用2位元組,UTF-8使用3位元組。

MySQL字元集

MySQL的UTF-8字元集最大長度為3位元組,只能表示BMP中的字元(0-0xffff)。若要使用大於3位元組的字元(如emoji),則需使用utf8mb4字元集。

MySQL包含字元集和校對規則兩個概念。校對規則用來定義比較字元串的方式,一種字元集至少有一種校對規則,但可以有多種校對規則。校對規則的命名以其相關的字元集名開始,中間通常包含一個語言名,並且以_ci(大小寫不敏感)、_cs(大小寫敏感)或_bin(比較是基於字元編碼的值而與語言無關)結束,如gbk_chinese_ci。

MySQL的字元集和校對規則有4個級別的設置:

  • 伺服器級:可通過配置文件或啟動選項設置,預設為latin1。
  • 資料庫級:可通過CREATE DATABASEALTER DATABASE設置,如資料庫中已存在記錄,修改字元集不會將已有數據按照新的字元集進行存放。
  • 表級:可通過CREATE TABLEALTER TABLE設置,如表中已存在記錄,修改字元集不會將已有數據按照新的字元集進行存放。
  • 欄位級:可通過CREATE TABLEALTER TABLE設置,如表中已存在記錄,修改字元集不會將已有數據按照新的字元集進行存放。

客戶端和伺服器交互時,還存在客戶端、連接、返回結果的字元集和校對規則,通常這三者是相同的,才可以確保數據能被正確讀取。可以通過SET NAMES charset同時修改這三個值。可以通過[_charset] 'str' [COLLATE collation]強制字元串的字元集和校對規則。

已有記錄的字元集調整,需先將數據導出,經過適當調整後重新導入。


您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • 離線安裝 軟體包下載地址:http://mirrors.sohu.com/mysql/MySQL-8.0/ 這裡使用8.0.18版本,對應各軟體包下載鏈接如下: http://mirrors.sohu.com/mysql/MySQL-8.0/mysql-community-client-8.0.18 ...
  • 一、環境 環境:Centos 6.5 ,MySQL 5.7.22, yum install 命令安裝 二、備份 指定備份路徑,指定 --master-data=2 參數備份時輸出 MASTER_LOG_POS 位置信息 備份腳本: 1 #!/bin/bash 2 3 backup_path=/hom ...
  • MySQL 游標 SQL語句是“面向集合編程”,重點在於“獲得什麼”,而不是“如何獲得”。 有時候我們不需要對查詢結構集的每一條都進行相同的操作,而是只操作其中的某些行,這時候就需要面向過程的編程方法,而游標就是面向過程編程方式的體現 游標就相當於“指針”,它一次只指向一行 游標的作用就是用於對查詢 ...
  • create database 課程管理 //1:create database為SQL語句,用於創建資料庫。執行完之後會創建一個新資料庫及存儲該資料庫的文件,或從先前創建的資料庫文件中附加資料庫。 2:資料庫名稱在伺服器中必須唯一,並且符合標識符的規則。使用一條create database語句即 ...
  • MySQL補充——忘記密碼怎麼辦 摘要:本文主要記錄了在忘記密碼時怎麼辦。 部分內容來自以下博客: https://www.cnblogs.com/wuotto/p/9682400.html 關閉MySQL資料庫 使用命令檢查MySQL資料庫是否已經關閉: 1 [root@localhost ~]# ...
  • DELETE FROM Persons WHERE Id NOT IN (SELECT MIN(Id)AS id FROM Persons GROUP BY Email) ; You can't specify target table 'Person' for update in FROM cla ...
  • MySQL補充——獲取自增主鍵的下一個自增值 摘要:本文主要學習瞭如何獲得自增主鍵的下一個值。 格式 1 select auto_increment from information_schema.tables where table_schema='資料庫名' and table_name='表名 ...
  • 文章前言 提到記憶體管理,我們就需要考慮Redis的記憶體過期策略和記憶體淘汰機制。該文章便從這兩方面入手,分享一些在Redis記憶體方面相關的基礎知識。 文章中使用的示例版本為Redis5.0版本。 記憶體過期策略 記憶體過期策略主要的作用就是,在緩存過期之後,能夠及時的將失效的緩存從記憶體中刪除,以減少記憶體的 ...
一周排行
    -Advertisement-
    Play Games
  • 前言 在我們開發過程中基本上不可或缺的用到一些敏感機密數據,比如SQL伺服器的連接串或者是OAuth2的Secret等,這些敏感數據在代碼中是不太安全的,我們不應該在源代碼中存儲密碼和其他的敏感數據,一種推薦的方式是通過Asp.Net Core的機密管理器。 機密管理器 在 ASP.NET Core ...
  • 新改進提供的Taurus Rpc 功能,可以簡化微服務間的調用,同時可以不用再手動輸出模塊名稱,或調用路徑,包括負載均衡,這一切,由框架實現並提供了。新的Taurus Rpc 功能,將使得服務間的調用,更加輕鬆、簡約、高效。 ...
  • 順序棧的介面程式 目錄順序棧的介面程式頭文件創建順序棧入棧出棧利用棧將10進位轉16進位數驗證 頭文件 #include <stdio.h> #include <stdbool.h> #include <stdlib.h> 創建順序棧 // 指的是順序棧中的元素的數據類型,用戶可以根據需要進行修改 ...
  • 前言 整理這個官方翻譯的系列,原因是網上大部分的 tomcat 版本比較舊,此版本為 v11 最新的版本。 開源項目 從零手寫實現 tomcat minicat 別稱【嗅虎】心有猛虎,輕嗅薔薇。 系列文章 web server apache tomcat11-01-官方文檔入門介紹 web serv ...
  • C總結與剖析:關鍵字篇 -- <<C語言深度解剖>> 目錄C總結與剖析:關鍵字篇 -- <<C語言深度解剖>>程式的本質:二進位文件變數1.變數:記憶體上的某個位置開闢的空間2.變數的初始化3.為什麼要有變數4.局部變數與全局變數5.變數的大小由類型決定6.任何一個變數,記憶體賦值都是從低地址開始往高地 ...
  • 如果讓你來做一個有狀態流式應用的故障恢復,你會如何來做呢? 單機和多機會遇到什麼不同的問題? Flink Checkpoint 是做什麼用的?原理是什麼? ...
  • C++ 多級繼承 多級繼承是一種面向對象編程(OOP)特性,允許一個類從多個基類繼承屬性和方法。它使代碼更易於組織和維護,並促進代碼重用。 多級繼承的語法 在 C++ 中,使用 : 符號來指定繼承關係。多級繼承的語法如下: class DerivedClass : public BaseClass1 ...
  • 前言 什麼是SpringCloud? Spring Cloud 是一系列框架的有序集合,它利用 Spring Boot 的開發便利性簡化了分散式系統的開發,比如服務註冊、服務發現、網關、路由、鏈路追蹤等。Spring Cloud 並不是重覆造輪子,而是將市面上開發得比較好的模塊集成進去,進行封裝,從 ...
  • class_template 類模板和函數模板的定義和使用類似,我們已經進行了介紹。有時,有兩個或多個類,其功能是相同的,僅僅是數據類型不同。類模板用於實現類所需數據的類型參數化 template<class NameType, class AgeType> class Person { publi ...
  • 目錄system v IPC簡介共用記憶體需要用到的函數介面shmget函數--獲取對象IDshmat函數--獲得映射空間shmctl函數--釋放資源共用記憶體實現思路註意 system v IPC簡介 消息隊列、共用記憶體和信號量統稱為system v IPC(進程間通信機制),V是羅馬數字5,是UNI ...