摘要:本文分析了分散式資料庫發展情況、分散式資料庫應用的主要問題,從行業應用的角度給出了分散式資料庫發展的建議。 本文分享自華為雲社區《數字化轉型下我國分散式資料庫應用挑戰及發展建議》,作者:資料庫領域科學家、華為雲資料庫GaussDB首席專家 馮柯。 當前,金融等重點行業都在進行數字化轉型,而分佈 ...
一、背景
MySQL是當今世上最受歡迎的使用最廣泛的開源資料庫,它的繁榮離不開它的開源特性。放在過去商業資料庫的時代,大家都沒有機會接觸到資料庫的源代碼,但在如今開源資料庫的時代,越來越多的人開始研究資料庫的源碼,並給社區貢獻代碼,MySQL官方每次發佈新版本都要感謝一些在社區上貢獻代碼的程式員。現在新的資料庫時代也給DBA提出了更高的要求,學會調試源碼,通過源碼定位問題,這是DBA進階的方向。MySQL的源碼有幾百上千萬行,想全部搞懂幾乎是不可能的,研究源碼一般推薦從某個功能點入手。而學會調試源碼,不管對研究源碼或通過源碼定位問題,都是必備的技能。本文將介紹Linux平臺下如何通過gdb進行MySQL源碼調試,並簡單介紹通過調試源碼定位一條select語句的執行流程。
二、源碼調試方法
關於源碼的編譯及調試,不同的平臺可以通過不同的工具來進行:windows平臺下可以通過visual studio來進行,https://www.cnblogs.com/huangxincheng/p/13084736.html 按照這篇文章的方法可以進行5.7的調試,通過cmake生成mysql.sln文件,然後給打開sln文件編譯成功後,就可以進入調試模式了。在某個函數處打下斷點,F5進入調試模式後,就可以對資料庫進行操作了,命中斷點後就可以查看堆棧的函數調用關係。一般在實際應用中,MySQL都是運行在Linux平臺下,在Linux平臺下一般是通過GDB(GNU symbolic debugger)工具進行調試,C/C++ 項目的開發和調試包括故障排查都是利用 GDB 完成的。此外,VsCODE這種IDE工具可以在本地的windows操作系統下,通過ssh遠程調試Linux平臺下的MySQL,https://mp.weixin.qq.com/s/RO_Ipa9_SH8_DuVholrgvg,薑老師這篇文章也簡單講了一下如何操作。
三、GDB調試MySQL源碼
3.1 MySQL源碼下載
首先需要在MySQL官網上下載MySQL源碼,操作系統選擇為source code,OS版本選擇為ALL OPERATING SYSTEM,下載帶boost頭文件的源碼包。如果對MySQL的版本沒有特別要求的話,一般推薦下載最新版本的,因為老版本中存在bug的概率較大,編譯過程需要解決這些bug,比如在8.0.23版本中編譯過程中報了這個錯:buf0buf.cc:1227:44: error: ‘SYS_gettid’ was not declared in this scope。參考MySQL官方論壇:https://forums.mysql.com/read.php?117,674410,676378#msg-676378,在storage/innobase/buf/buf0flu.cc文件代碼中加上聲明#include <sys/syscall.h>,解決了這個報錯。
3.2 編譯安裝環境準備
源碼編譯需要gcc等基礎軟體支持,MySQL8.0版本 gcc至少需要7.1以上,一般推薦直接升級到最高版本,線上環境比較好辦直接通過yum安裝即可。離線環境的下載及安裝可以參考這兩篇文章分別升級gcc和cmake:
https://mp.weixin.qq.com/s/kWPD1o5fWTAxUNETGsXA7g、https://mp.weixin.qq.com/s/5sHPJ0Kxkmj2llW-UvEbkg。把gcc和cmake搞定後,就可以開始編譯安裝mysql了。
3.3 編譯和安裝MySQL
參考官方文檔通過源碼安裝mysql這一章可以完成mysql的編譯和安裝:
實際cmake加上這幾個參數,其中-DWITH_DEBUG=1是為了開啟調試模式。
cmake .. -DCMAKE_INSTALL_PREFIX=/usr/local/mysql -DWITH_BOOST=/root/gdb_mysql/mysql-8.0.23/boost/boost_1_73_0 -DWITH_DEBUG=1
接著make install成功後,配置好配置文件/etc/my.cnf,就可以初始化資料庫並啟動資料庫了。
mysqld --initialize --user=mysql
mysqld_safe --user=mysql &
啟動完資料庫後,登錄資料庫可以發現現在已經是debug模式了。
3.4 gdb調試源碼
完成MySQLdebug版本的安裝和啟動後,gdb命令下attach mysql的進程號,就可以對mysql進程進行打斷點調試了。
gdb調試過程中常用的命令可以參考如下:
attach 進程號 #進入調試模式 b Sql_cmd_insert::mysql_insert #在某個函數打下斷點 b filename:linenum #在文件的某行打下斷點 clear function #在某個函數處刪除斷點 bt #查看堆棧信息 n #next 單步調試,每次只執行往下一行代碼,對於調用的函數來說,next 命令只會將其視作一行代碼。 #n 3 往下執行三行代碼 s #step 單步調試,當 step 命令所執行的代碼行中包含函數時,會進入該函數內部,併在函數第一行代碼處停止執行。 c #continue 當程式在某一斷點處停止運行後,使用該指令可以繼續執行,直至遇到下一個斷點或者程式結束。 l #list 顯示源程式代碼的內容,包括各行代碼所在的行號。 p xxx #print 列印指定xxx變數的值 info breakpoint #查看斷點信息
四、一條select語句的調試
在handle_connection函數處打下斷點,然後在mysql客戶端執行一條select語句,可以在gdb裡面看到,程式很快命中了斷點,接下來便可以通過單步調試,一步一步定位select語句的執行流程。
#客戶端連接的線程處理函數 handle_connection (arg=0xb998240) at /gdb/mysql-8.0.23/sql/conn_handler/connection_handler_per_thread.cc #讀取連接發來的命令,然後執行 do_command (thd=0x7f5a3815d3c0) at /gdb/mysql-8.0.23/sql/sql_parse.cc:1320 #THD類,描述每個客戶端連接產生的後臺進程 #發出命令 dispatch_command (thd=0x7f5a3815d3c0, com_data=0x7f5afc7adb00, command=COM_QUERY) #根據command=COM_QUERY,調用alloc_query函數(讀取查詢語句並存在thd->query中) if (alloc_query(thd, com_data->com_query.query,com_data->com_query.length)) #執行到dispatch_sql_command(thd, &parser_state); 解析sql語句,然後把結果發給executor dispatch_sql_command(thd, &parser_state); #進入dispatch_sql_command函數,執行到mysql_execute_command函數(Execute command saved in thd and lex->sql_command) error = mysql_execute_command(thd, true); #在mysql_execute_command函數中,執行到case SQLCOM_SELECT,res = lex->m_sql_cmd->execute(thd),進入到execute函數 #在mysql_execute_command函數中,switch (lex->sql_command)通過case SQLCOM_XXX,轉到不同語句的執行器 #這時候就進入到了lex的公共屬性m_sql_cmd類下麵的execute函數; #通過單步調試,此時程式進入到了Sql_cmd_dml::execute (this=0x7f5a38bee0b0, thd=0x7f5a3815d3c0) at /gdb/mysql-8.0.23/sql/sql_select.cc:517 #此時可以看到,解析SQL是在dispatch_sql_command和mysql_execute_command函數中完成的,Sql_cmd_dml::execute的函數主要有6步 Prelocking;Preparation;Locking of tables;Optimization;Execution or explain;Cleanup #lock_tables(thd, lex->query_tables, lex->table_count, 0) 鎖表 #execute_inner(thd) 執行 #進入execute階段 Sql_cmd_dml::execute_inner (this=0x7f1ca0011858, thd=0x7f1ca0005ed0) at /gdb/mysql-8.0.23/sql/sql_select.cc:809 if (unit->optimize(thd, /*materialize_destination=*/nullptr, /*create_iterators=*/true)) #優化 if (unit->execute(thd)) return true; #執行 #此時執行到了SELECT_LEX_UNIT::execute (this=0x7f1ca0023e48, thd=0x7f1ca0005ed0) at /gdb/mysql-8.0.23/sql/sql_union.cc:1267 return ExecuteIteratorQuery(thd); #執行ExecuteIteratorQuery這個函數 SELECT_LEX_UNIT::ExecuteIteratorQuery (this=0x7f1ca0023e48, thd=0x7f1ca0005ed0) at /gdb/mysql-8.0.23/sql/sql_union.cc:1125 #執行完成後返回查詢語句的結果值 return query_result->send_eof(thd); #這個時候Sql_cmd_dml::execute_inner函數也執行完成了,進而Sql_cmd_dml::execute,mysql_execute_command也接著執行完成 #執行到dispatch_command函數的thd->send_statement_status(); 這一行,看到客戶端執行的查詢語句也輸出了結果 #執行到handle_connection的while (thd_connection_alive(thd)) {if (do_command(thd)) break;}; 意味著mysql連接結束了,這時候調試也隨之結束。
select語句的執行流程可以總結如下,這些函數可以方便以後打斷點,更快的定位問題:
1. 客戶端連接線程處理函數 handle_connection (arg=0xb998240) at /gdb/mysql-8.0.23/sql/conn_handler/connection_handler_per_thread.cc:301 2. 讀取連接發來的命令,然後執行 do_command (thd=0x7f5a3815d3c0) at /gdb/mysql-8.0.23/sql/sql_parse.cc:1320 3. 發出命令,並將查詢語句存在thd->query中 dispatch_command (thd=0x7f1ca0011100, com_data=0x7f1d644d3b00, command=COM_QUERY) at /gdb/mysql-8.0.23/sql/sql_parse.cc:1836 4. 解析sql語句,然後把結果發給executor dispatch_sql_command (thd=0x7f1ca0011100, parser_state=0x7f1d644d2a60) at /gdb/mysql-8.0.23/sql/sql_parse.cc:4988 5. 執行存在thd中的語句 mysql_execute_command (thd=0x7f1ca0011100, first_level=true) at /gdb/mysql-8.0.23/sql/sql_parse.cc:4407 6. SELECT語句的:準備,鎖表,優化,執行 Sql_cmd_dml::execute (this=0x7f1ca09feb28, thd=0x7f1ca0011100) at /gdb/mysql-8.0.23/sql/sql_select.cc:612 7. SELECT語句的優化和執行 Sql_cmd_dml::execute_inner (this=0x7f1ca0011858, thd=0x7f1ca0005ed0) at /gdb/mysql-8.0.23/sql/sql_select.cc:809 8. SELECT語句的執行 SELECT_LEX_UNIT::execute (this=0x7f1ca0023e48, thd=0x7f1ca0005ed0) at /gdb/mysql-8.0.23/sql/sql_union.cc:1267 9. 執行語句,返回結果 SELECT_LEX_UNIT::ExecuteIteratorQuery (this=0x7f1ca0023e48, thd=0x7f1ca0005ed0) at /gdb/mysql-8.0.23/sql/sql_union.cc:1125
五、總結
不管是研究MySQL源碼還是通過源碼定位問題,學會調試MySQL源碼都是必備的基礎技能,MySQL源碼體系十分龐大,調試源碼可以更快更清晰從源碼中定位問題。