記一次字元串末尾空白丟失的排查 → MySQL 是會玩的!

来源:https://www.cnblogs.com/youzhibing/archive/2023/06/25/17384635.html
-Advertisement-
Play Games

開心一刻 今天答應準時回家和老婆一起吃晚飯,但臨時有事加了會班,回家晚了點 回到家,本以為老婆會很生氣,但老婆卻立即從廚房端出了熱著的飯菜 老婆:還沒吃飯吧,去洗下,來吃飯吧 我洗好,坐下吃飯,內心感動十分;老婆坐旁邊深情的看著我 老婆:你知道誰最愛你嗎 我毫不猶豫道:你 老婆:誰最關心你? 我:你 ...


開心一刻

  今天答應準時回家和老婆一起吃晚飯,但臨時有事加了會班,回家晚了點

  回到家,本以為老婆會很生氣,但老婆卻立即從廚房端出了熱著的飯菜

  老婆:還沒吃飯吧,去洗下,來吃飯吧

  我洗好,坐下吃飯,內心感動十分;老婆坐旁邊深情的看著我

  老婆:你知道誰最愛你嗎

  我毫不猶豫道:你

  老婆:誰最關心你?

  我:你

  老婆:我是誰呀?

  我:我老婆

  老婆:那你以後是不是得對我好點?

  這時電話響了,一看好哥們打過來的,我接了並開了免提

  哥們:樓下洗浴八折,幹啥呢?

  我:那個......,在陪我前妻吃口飯

問題背景

  一天,小伙伴找到我,他說他碰到一個很奇怪的問題

  他說:明明表名的入參是 test  ,為什麼展示到界面的記錄包括 test 這條記錄?

  他補充道:會不會是 MyBatis-Plus 做了什麼騷操作,把 test  末尾的空格給拿掉了

  我:你直接把 SQL 語句到 MySQL 執行下試試

  結果如下:

  這看起來不夠直觀,我移動下游標

  然後我和小伙伴面面相覷

環境準備

   MySQL5 、 MySQL8 各準備一個

  我們來看下預設情況下,末尾空白的判斷情況

   MySQL 5.7.36 如下

  1 表示 TRUE ,也就是相等

   MySQL 8.0.27 如下

  0 表示 FALSE ,表示不相等

  這是什麼原因,我們繼續往下看

字元集與字元序

  比較肯定就需要比較規則, SQL 的比較規則就離不開字元序,字元序又與字元集相關,所以我們一個一個來捋

  字元集

  關於字元集,不是隻言片語可以說清楚的,但是大家也不用擔心,網上相關資料已經非常多,大家擦亮慧眼去查閱即可

  簡單點來說:字元集定義了字元和字元的編碼

  有人又問了:字元、字元的編碼又是什麼?

  為了方便大家理解,舉個簡單慄子

    有四個字元:A、B、C、D,這四個字元的編碼分別是 A = 0, B = 1, C = 2, D = 3

    這裡的字元(A、B、C、D) + 編碼(0、1、2、3)就構成了字元集(character set)

   MySQL 支持的字元集有很多,可以通過 SHOW CHARACTER SET; 查看

   Charset :字元集名

   Description :描述

   Default collation :預設字元序

   Maxlen :每個字元最多位元組數

  字元序

  定義了字元的比較規則;字元間的比較按何種規則進行

  一個字元集對應多個字元序,通過 SHOW COLLATION; 可以查看全部的字元序;也可以帶條件查具體某個字元集的字元序

   Default 等於 Yes 表示是預設字元序

  每個字元集都有預設的字元序

  server的字元集與字元序

  當我們創建資料庫時,沒有指定字元集、字元序,那麼server字元集、server字元序就會作為該資料庫的字元集、字元序

  database的字元集與字元序

  指定資料庫級別的字元集、字元序

  同一個MySQL服務下的資料庫,可以分別指定不同的字元集、字元序

  創建、修改資料庫的時候,可以通過 CHARACTER SET 、  COLLATE  指定資料庫的字元集、字元序

  可以通過

  查看資料庫的字元集和字元序

  table的字元集與字元序

  創建、修改表的時候,可以通過 CHARACTER SET 、 COLLATE 指定表的字元集、字元序

  可以通過

  查看表的字元序

  column的字元集與字元序

  類型為 CHAR 、 VARCHAR 、 TEXT 的列,可以指定字元集、字元序

  可以通過

  查看欄位的字元集和字元序

  多個維度指定字元集、字元序的話,粒度越細的優先順序越高( column > table > database > server )

  如果細粒度未指定字元集、字元序,那麼會繼承上一級的字元集,字元序則是上一級字元集的預設字元序

  通常情況下我們一般不會指定 table 、 column 粒度的字元集、字元序

  也就是說,通常情況下 column 的字元集會與 database 的字元集一致,而 column 的字元序則是 database 字元集的預設字元序

空白丟失

  上面講了那麼多,跟空白丟失有什麼關係?

  大家先莫急,繼續往下看

   MySQL5.7 The CHAR and VARCHAR Types中有這麼一段

  翻譯過來就是:

    1、類型是 CHAR 、 VARCHAR 、 TEXT 列的值,會根據列的字元序來比較和排序

    2、所有 MySQL 排序規則的類型都是 PAD SPACE 。這就意味著, CHAR 、 VARCHAR 、 TEXT 類型的值進行比較時,不用考慮任何末尾空格,LIKE 除外

    3、不受 SQL mode 影響,也就是說不管是嚴格模式,還是非嚴格模式,都不影響 2 所說的規則

  劃重點,記筆記:在 MySQL5.7 及以下( <=5.7 )版本中,排序規則都是 PAD SPACE ,末尾的空格會忽略不考慮

  那如何讓末尾空格參與比較了,有三種處理方式

  1、 BINARY ,類似 SELECT 'test' = BINARY 'test '; 

  2、 LIKE ,類似 SELECT 'test' LIKE 'test '; 

  3、 LENGTH 函數,類似

   MySQL8 做了調整,The CHAR and VARCHAR Types 有如下說明

  翻譯過來就是:

    1、類型是 CHAR 、 VARCHAR 、 TEXT 列的值,會根據列的字元序來比較和排序

    2、 MySQL 字元序的 pad 參數的可選值,除了 PAD SPACE ,還增加了 NO PAD 

    3、對於非二進位字元串( CHAR 、 VARCHAR 、 TEXT ),字元序 pad 參數決定如何去處理字元串末尾的空格

       NO PAD 不會忽略末尾空格,會將其當做其他字元一樣對待

       PAD SPACE 會忽略末尾空格, LIKE 除外

       SQL mode 不參與字元串末尾空格的處理

   MySQL8 server 維度的字元集是 utf8mb4 ,對應的預設字元序是: utf8mb4_0900_ai_ci 

   Pad_attribute 的值是 NO PAD ,也就是不會忽略字元串末尾的空格

  所以在 MySQL8 中, SELECT 'test' = 'test '; 預設情況下得到的結果是 0

總結

  1、非二進位字元串( CHAR 、 VARCHAR 、 TEXT )比較時,末尾空格的處理跟列的字元序有直接關係

  2、 MySQL5.7 及之前的版本,排序規則的類型都是 PAD SPACE ,會忽略字元串末尾的空格, LIKE 除外

  3、 MySQL8 開始,字元序增加了一個參數 Pad_attribute ,該參數的值不同,對字元串末尾空格的處理方式不同

     NO PAD :字元串末尾的空格會和其他字元一樣,不會被忽略

     PAD SPACE :字元串末尾的空格會被忽略, LIKE 除外

  4、如上針對的都是非二進位字元串的排序和比較,而不是儲存

參考

  The CHAR and VARCHAR Types

  The CHAR and VARCHAR Types

  再見亂碼:5分鐘讀懂MySQL字元集設置


您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • 在`WPF`中,命令是一種用於處理用戶交互操作的機制。它將操作行為與界面元素解耦,使得界面元素可以通過命令進行觸發和執行相應的邏輯。`WPF`中的命令模型通過`ICommand`介面和相關的實現類來實現。命令模式的設計思想是將命令的發送者(例如按鈕)與命令的執行者(例如視圖模型中的方法)解耦,使得它... ...
  • 問題應該算挺常見的但是一句話還挺難說清楚,所以百度特別難搜。 場景就是,有一堆以員工名稱命名的文件(名稱可能還有字母數字等前尾碼),現在給定一個員工清單,需要從這些文件中篩選出員工清單上列出的員工的文件,並複製到另外一個目錄中。 輸入: 1. 許多文件名包含員工名稱的文件 2.一個清單文件,裡面包含 ...
  • 哈嘍大家好,我是鹹魚 今天跟大家分享一個關於 zabbix Timeout 值設置不當導致的問題,這個問題不知道大家有沒有碰到過 ## 問題 事情經過是這樣的: 把某一臺 zabbix agent 的模板由原來的 `Template OS Windows by Zabbix agent` 換成了 ` ...
  • # Spark Spark是一種快速、通用、可擴展的大數據分析引擎,2009年誕生於加州大學伯克利分校AMPLab,2010年開源,2013年6月成為Apache孵化項目,2014年2月成為Apache的頂級項目,2014年5月發佈spark1.0,2016年7月發佈spark2.0,2020年6月 ...
  • ![file](https://img2023.cnblogs.com/other/3195851/202306/3195851-20230625185718639-2144905227.jpg) > 近日,Apache SeaTunnel 正式發佈 2.3.2 版本。此時距離上一版本 2.3.1 ...
  • 摘要:本文將介紹如何在 Docker 環境下搭建 MS SQL Server 的主從同步,幫助讀者瞭解主從同步的原理和實現方式,進而提高數據的可靠性和穩定性。 一、前言 在當今信息化的時代,數據的安全性和穩定性顯得尤為重要。資料庫是許多企業和組織存儲和管理數據的核心,因此如何保證資料庫的高可用性和數 ...
  • ## case1(表鎖的讀-寫-讀阻塞) 上篇文檔中提到過 >WRITE locks normally have higher priority than READ locks to ensure that updates are processed as soon as possible. Thi ...
  • 很多小微型應用程式也需要一些數據處理和計算能力,如果集成一個資料庫就顯得太沉重了,這種情況下 SQLite 是一個不錯的選擇,它架構簡單,集成方便,可持久化存儲數據,並提供 SQL 實現計算能力。 但是,對於某些較複雜的場景,SQLite 仍有不足之處。 ...
一周排行
    -Advertisement-
    Play Games
  • 移動開發(一):使用.NET MAUI開發第一個安卓APP 對於工作多年的C#程式員來說,近來想嘗試開發一款安卓APP,考慮了很久最終選擇使用.NET MAUI這個微軟官方的框架來嘗試體驗開發安卓APP,畢竟是使用Visual Studio開發工具,使用起來也比較的順手,結合微軟官方的教程進行了安卓 ...
  • 前言 QuestPDF 是一個開源 .NET 庫,用於生成 PDF 文檔。使用了C# Fluent API方式可簡化開發、減少錯誤並提高工作效率。利用它可以輕鬆生成 PDF 報告、發票、導出文件等。 項目介紹 QuestPDF 是一個革命性的開源 .NET 庫,它徹底改變了我們生成 PDF 文檔的方 ...
  • 項目地址 項目後端地址: https://github.com/ZyPLJ/ZYTteeHole 項目前端頁面地址: ZyPLJ/TreeHoleVue (github.com) https://github.com/ZyPLJ/TreeHoleVue 目前項目測試訪問地址: http://tree ...
  • 話不多說,直接開乾 一.下載 1.官方鏈接下載: https://www.microsoft.com/zh-cn/sql-server/sql-server-downloads 2.在下載目錄中找到下麵這個小的安裝包 SQL2022-SSEI-Dev.exe,運行開始下載SQL server; 二. ...
  • 前言 隨著物聯網(IoT)技術的迅猛發展,MQTT(消息隊列遙測傳輸)協議憑藉其輕量級和高效性,已成為眾多物聯網應用的首選通信標準。 MQTTnet 作為一個高性能的 .NET 開源庫,為 .NET 平臺上的 MQTT 客戶端與伺服器開發提供了強大的支持。 本文將全面介紹 MQTTnet 的核心功能 ...
  • Serilog支持多種接收器用於日誌存儲,增強器用於添加屬性,LogContext管理動態屬性,支持多種輸出格式包括純文本、JSON及ExpressionTemplate。還提供了自定義格式化選項,適用於不同需求。 ...
  • 目錄簡介獲取 HTML 文檔解析 HTML 文檔測試參考文章 簡介 動態內容網站使用 JavaScript 腳本動態檢索和渲染數據,爬取信息時需要模擬瀏覽器行為,否則獲取到的源碼基本是空的。 本文使用的爬取步驟如下: 使用 Selenium 獲取渲染後的 HTML 文檔 使用 HtmlAgility ...
  • 1.前言 什麼是熱更新 游戲或者軟體更新時,無需重新下載客戶端進行安裝,而是在應用程式啟動的情況下,在內部進行資源或者代碼更新 Unity目前常用熱更新解決方案 HybridCLR,Xlua,ILRuntime等 Unity目前常用資源管理解決方案 AssetBundles,Addressable, ...
  • 本文章主要是在C# ASP.NET Core Web API框架實現向手機發送驗證碼簡訊功能。這裡我選擇是一個互億無線簡訊驗證碼平臺,其實像阿裡雲,騰訊雲上面也可以。 首先我們先去 互億無線 https://www.ihuyi.com/api/sms.html 去註冊一個賬號 註冊完成賬號後,它會送 ...
  • 通過以下方式可以高效,並保證數據同步的可靠性 1.API設計 使用RESTful設計,確保API端點明確,並使用適當的HTTP方法(如POST用於創建,PUT用於更新)。 設計清晰的請求和響應模型,以確保客戶端能夠理解預期格式。 2.數據驗證 在伺服器端進行嚴格的數據驗證,確保接收到的數據符合預期格 ...