面試官問：為啥不建議使用 Select *？請你大聲地回答他！！

-Advertisement-

作者：小目標青年來源：https://blog.csdn.net/qq_35387940/article/details/125921218 前言不建議使用 select * 這幾個字眼，做開發的都不陌生吧。阿裡的開發手冊上面也是有提到：這個完整版可以關註公眾號Java核心技術，然後在公眾號 ...

作者：小目標青年
來源：https://blog.csdn.net/qq_35387940/article/details/125921218

前言

不建議使用 select *

這幾個字眼，做開發的都不陌生吧。

阿裡的開發手冊上面也是有提到：

這個完整版可以關註公眾號Java核心技術，然後在公眾號後臺回覆手冊獲取。

昨晚收到一個小兄弟的反饋：

隨後也問了下學習群里的兄弟們，

不敢吱聲的：

好像派：

離譜的：

那麼，我作為一個出手俠，我必然要出手了。

出手俠：

習慣用語，等到xxxxx的時候，我就會出手。

正文

這個完整版可以關註公眾號Java核心技術，然後在公眾號後臺回覆手冊獲取。其實阿裡巴巴手冊上說明的三點了：

1）增加查詢分析器解析成本

什麼是分析器成本，什麼東西，我隨手畫個簡圖，大家知道一下：

就是這個分析器，這裡會去解析你的sql的語法，詞法。

舉例，如果是select * from user ，看到 * ，就會去看看是哪個表 user，然後 Query Table Metadata For Columns，把所有列值給你支楞出來，填充成類似 select id ，name ，age，phone form user 這樣子。（當然還有其他分析了，例如如語法的判斷，欄位的判斷，表名等等）

說實話。這個分析器的成本....你要是說增加瞭解析成本，我確實能理解。

但是我感覺成本也不是很大.... 除非是個大表，大到查詢完所有列值？

so，我能接受，但是接受得不多。

2）增減欄位，容易與resultMap 配置不一致

這一點我不想說。說實在的，有時候寫select *（需要查表所有列值的時候），我實體加了欄位，我改了resultMap ，我sql還不用動。

這一點屬於是平時使用規範上的規避點了，不多言。

3）無用欄位增加網路消耗、磁碟IO開銷

這一點有講究。

可以看到我第一點裡面畫的簡圖，如果說

不考慮緩存存在的時候：

最終會走到執行器，然後執行器後面其實是引擎層

引擎層這裡我就不展開了，引擎層裡面其實包括了各種日誌（undo、redo、binlog等）的記錄，還有就是在記憶體里找數據。

簡單點歸納，其實這種查詢操作就是刷盤操作，從磁碟刷入記憶體，涉及到的磁碟IO開銷。

那麼在刷盤操作的時候，是不是真的selec * 就真的會增加磁碟IO開銷呢？

答案，肯定是的。但是增大的影響程度，我必須說一下：

如果你說，表裡面就三欄位， id ，name ，age ，本來查 id ，name ；因為 select * ，變成查多了一個 age ，增大磁碟IO開銷 ?

我覺得是增大了，但是幾乎不用理。因為這些都是正常的數據類型，開銷增大不了多少。

所以，真正隱藏的雷是什麼？

有大欄位

例如

tinytext、text、mediumtext、longtext

tinybob、blob、mediumblob、longblob

這些家伙，在mysql上，就是當做一個獨立的對象處理。

這時候就真的要謹慎了。

如果你是個比較多欄位的表，例如什麼意見反饋表，留言不確定長度，用了text ，還有回覆留言欄位也用了text ；

又例如博客文本表，為了存content，用了這些大欄位。

本來想查詢一下意見的反饋人名，或者是查詢博客的標題，結果因為懶或者不註意，寫了select *., 查詢的時候帶出來這些大欄位。

那麼顯然，這時候讀取的內容數據就是真的比原先初衷要大很多（沒準業主小丹投訴保全，意見反饋的留言給你寫了篇小論文），這時候因為讀取的內容多，磁碟IO開銷多，然後返回數據包給客戶端量也多，這樣就真的是有影響了。

4）補充，其實也是我首當其衝想說的一點

無法使用索引覆蓋

ps：今天學習成語了嗎？不要亂用成語。

select * 基本告別索引覆蓋了

什麼是索引覆蓋？

舉例：

給name欄位建索引，查詢的時候，只用到了索引的欄位，這就是索引覆蓋。

也就是直接通過查詢索引，拿出來的數據就已經滿足了查詢返回的欄位數據。無需額外其他查詢操作了，也就是索引覆蓋了。這樣肯定快。

如果初衷是查 name，結果寫成了 select * ，變成查多了其他欄位，那其他欄位不是索引，肯定無法觸發索引覆蓋使用場景了，也就是需要額外的回表查詢操作了，那這樣就慢了。

回歸正題，因為寫成select * ，變成查多了其他欄位，其他欄位不是索引，導致回表，慢。

問題出在哪裡？出在其他欄位不是索引?

那麼給其他欄位都建索引唄，完事了兄弟們。

你們千萬不要這麼亂搞，索引的維護成本一定是不能忽視的。

涉及到修改新增刪除數據時索引的維護成本，索引頁的分裂合併等等。索引也是需要存起來的，也是需要占用磁碟空間的。而且如果N個欄位都是索引，隨便改動一行數據，需要維護N個索引。

什麼概念，就像咱們平時寫word文檔，搞了個目錄，然後底下的2級標題，3級標題，正文啥的，什麼分頁啥的，亂七八糟操作的編輯，都需要去刷新一下目錄。

那麼這個索引覆蓋影響真的非常大嗎？

拿出200W數據的表，刪除全部索引，給 platform_sn 單獨加索引：

然後先試試索引覆蓋的查詢，看看用時，0.02秒：

接著換成select * ：

當然這是 200W 數據的場景下，不過可以看出，時間差距還是很明顯。

0.02 到 0.179 ....

如果我們再加幾個大欄位？Text ... 那估計就真的離譜了。

客觀總結：

如果表裡有大欄位，TEXT 、BLOB系列類型欄位，使用 SELECT * 需要註意
如果本來只查詢某1，2個比較常用的欄位的，可以給這些欄位建單個索引或者組合索引，這時候查詢就避免使用 SELECT *，儘量能觸發索引覆蓋是最好的了
如果表欄位不多，也沒啥特殊欄位類型，而且肯定是查多列的，無法觸發索引覆蓋的情況下，

我覺得使用 SELECT * 也無妨，或者寫個<select cloum> 裡面列出所有欄位，這樣copy代碼也方便（因為會存在一種情況就是，資料庫裡面有這個欄位，但是不能查出來，這種情況select * 就是不如寫成select <select cloum>這種方式方便了，只需要在<select cloum> 提除某個欄位就可以）。

近期熱文推薦：

1.1,000+ 道 Java面試題及答案整理(2022最新版)

2.勁爆！Java 協程要來了。。。

3.Spring Boot 2.x 教程，太全了！

4.別再寫滿屏的爆爆爆炸類了，試試裝飾器模式，這才是優雅的方式！！

5.《Java開發手冊（嵩山版）》最新發佈，速速下載！

覺得不錯，別忘了隨手點贊+轉發哦！

您的分享是我們最大的動力!

-Advertisement-

更多相關文章

JS如何返回非同步調用的結果？

這個問題作者認為是所有從後端轉向前端開發的程式員，都會遇到的第一問題。JS前端編程與後端編程最大的不同，就是它的非同步機制，同時這也是它的核心機制。為了更好地說明如何返回非同步調用的結果，先看三個嘗試非同步調用的示例吧。示例一：調用一個後端介面，返回介面返回的內容 function foo() { v ...
【軟體工程底層邏輯系列】建模的底層邏輯

建模對於大家來講並不陌生，而且建模的方法也有很多，如用例建模、四色建模、事件風暴等，但在日常工作中，大家又覺得建模挺虛的：怎麼把建模落到實際開發工作中。個人認為建模是分兩部分：第一部分是業務概念建模，對現實業務抽取核心概念構建出模型（知識層）；第二部分是系統建模，系統建模是源於業務概念模型，遵循某些... ...
LeetCode-224. 基本計算器

題目來源 224. 基本計算器題目詳情給你一個字元串表達式 s ，請你實現一個基本計算器來計算並返回它的值。註意:不允許使用任何將字元串作為數學表達式計算的內置函數，比如 eval() 。示例 1：輸入： s = "1 + 1" 輸出： 2 示例 2：輸入： s = " 2-1 + 2 ...
基於 Dubbo Admin 實現同機房/區域優先

JZ64 求1+2+3+...+n 題目求1+2+3+...+n，要求不能使用乘除法、for、while、if、else、switch、case等關鍵字及條件判斷語句（A?B:C）。方法位運算思路演算法實現從1連加到n，不能使用城乘除法，那就只能相加了。一個一個加，但是迴圈需要判斷什麼時候 ...
當我把用Python做的課堂點名系統獻給各科老師後，再也沒掛過科

剛上大學的表弟問我，大學準備好好玩玩，問我有沒有什麼不掛科的秘訣。哎，這可就問對人了，要想不掛科，先把老師賄賂好，當然，咱們說的賄賂不是送錢啥的，這不是侮辱老師嗎？於是我連夜給表弟寫了一個課堂點名系統，讓他給每個任課老師都送一遍，方便老師就是方便自己，嘿嘿~ 準備工作首先我們需要準備好點名的姓 ...
一分鐘搞定Netty 三大組件，如果搞不定，再看3遍

1. 三大組件簡介 Channel 與 Buffer Java NIO 系統的核心在於：通道 (Channel) 和緩衝區 (Buffer)。通道表示打開到 IO 設備 (例如：文件、套接字) 的連接。若需要使用 NIO 系統，需要獲取用於連接 IO 設備的通道以及用於容納數據的緩衝區。然後操作緩 ...
C++11：非受限聯合體（union）

在 C/C++ 中，聯合體（Union）是一種構造數據類型。在一個聯合體內，我們可以定義多個不同類型的成員，這些成員將會共用同一塊記憶體空間。老版本的 C++ 為了和C語言保持相容，對聯合體的數據成員的類型進行了很大程度的限制，這些限制在今天看來並沒有必要，因此 C++11 取消了這些限制。 C++1 ...
Java HashMap原理

HashMap是Java中用於實現映射關係的一種數據結構。它允許將一個對象（稱為鍵）映射到另一個對象（稱為值）。當需要訪問值時，可以使用鍵來查找值。 HashMap的實現原理是使用散列函數將鍵映射到表中的桶（也稱為桶位置）。每個桶都包含了一些鍵值對，這些鍵值對按照鍵的散列值存儲在桶中。當向Hash ...