MyCAT日誌分析_ZenDei技術網路在線

MyCAT日誌對於瞭解MyCAT的運行信息不可獲取，譬如MyCAT是否採用讀寫分離，對於一個查詢語句，MyCAT是怎樣執行的，每個分片會分發到哪個節點上等等。預設是info級別，通過log4j.xml可將其設置debug級別，這樣就可獲得更多有關MyCAT運行的內部信息。下麵通過對MyCAT的啟動以...

MyCAT日誌對於瞭解MyCAT的運行信息不可獲取，譬如MyCAT是否採用讀寫分離，對於一個查詢語句，MyCAT是怎樣執行的，每個分片會分發到哪個節點上等等。

預設是info級別，通過log4j.xml可將其設置debug級別，這樣就可獲得更多有關MyCAT運行的內部信息。

下麵通過對MyCAT的啟動以及執行一個查詢語句來分析MyCAT的運行流程。

Here We Go!

Mycat的啟動日誌輸入如下：

processors指的是CPU的核數，aio thread pool size指的是AIO線程池，為CPU核數的兩倍

-sysconfig params：指的是mycat的啟動參數，可在server.xml中修改。

其中idleTimeout=1800000指的是外部應用與mycat最大空閑連接時長為30min，超過30min，則外部應用到mycat的連接將被斷開。

dataNodeHeartbeatPeriod=10000 節點心跳檢測的頻率為10s一次。

9066是MyCAT的管理埠

8066是MyCAT的預設埠，類似於MySQL的3306埠。

接下來初始化MyCAT連接池，預設最小為10個連接

可通過schema.xml中dataHost處定義

-init backend myqsl source ,create connections total 10 for hostM1 index :0：初始化後端MySQL連接，master節點是hostM1，可根據conf目錄下dnindex.properties文件指定。

再下麵的輸出信息就是創建連接，釋放channel。

創建完畢後，會輸出如下信息，代表連接創建完畢

執行心跳檢測，所以需建立新的連接，因為我配置的是一主兩從，所以需判斷localhost，192.168.244.144和192.168.244.146的心跳，localhost已啟動10個連接，所以不需要創建新的連接，但hostS1（即192.168.244.146）和hostS2（即192.168.244.144）需要。

threadID對應的是MySQL中的進程ID

接下來是前端連接到MyCAT的輸出信息，可以看出，連接到MyCAT後，會執行show database，show tables，select @@version_comment limit 1命令。個人感覺這是為後續的路由分析緩存資料庫及表信息。

接下來執行一下select * from travelrecord，查看MyCAT的內部實現邏輯

首先會判斷該SQL語句的路由信息（根據下麵的輸出，MyCAT內部應該用了一個map集合來存儲SQL語句的路由信息），如果沒有，則會首先生成路由信息。

路由的主要作用是用於確定SQL語句的執行路徑，包括查詢的數據在哪些分片上。

-SQLRouteCache miss cache：沒有路由信息

-SQLRouteCache add cache：生成路由信息

-execute mutinode query select * from travelrecord：確認該查詢會跨多個分片

-has data merge logic：會存在數據的合併

下麵就可以確認具體在哪個節點去讀了

因為我配置的是一主兩從，且balance="1"，全部的readHost與stand by writeHost參與select語句的負載均衡，所以hostS1（192.168.244.146）和hostS2（192.168.244.144）均參與select語句的負載均衡。

在執行select語句之前，需同步連接，為什麼要同步連接呢？

MyCAT為了高效的使用後端的MySQL連接，採用了基於MySQL實例的連接池模式。

在Mycat的連接池裡，當前可用的MySQL連接是放到一個HashMap的數據結構里，Key為當前連接對應的Database，另外還有二級分類，即按照連接是自動提交還是手動提交模式進行區分，這個設計是為了高效的查詢匹配的可用連接，具體邏輯如下：

當某個用戶會話需要一個自動提交的，到分片dn1(對應db1）的SQL連接的時候，連接池首先找是否有db1上的可用連接，如果有，看是否有自動提交模式的連接，找到就返回，否則返回db1上的手動提交模式的連接，若沒有db1的可用連接，則隨機返回一個其他db對應的可用連接，若沒有可用連接，並且連接池還沒達到上限，則創建一個新連接並返回，這個邏輯過程，我們會發現，用戶會話得到的連接可能不是他原先想要的，比如Database不對應，或者事務模式不匹配，因此在執行具體的SQL之前，還有一個自動同步資料庫連接的過程，包括事務隔離級別、事務模式、字元集、Database等四個指標，同步完成以後，才會執行具體的SQL指令。

在執行select * from travelrecord語句時，因為會涉及到3個分片，故MyCAT選擇了三個read source進行查詢，其中，兩個在hostS2上，一個在hostS1上。對於hostS2的兩個連接，其中一個會復用MyCAT之前對hostS2執行心跳檢測的連接，另一個需創建。

對於hostS2復用之前的連接，因為之前執行心跳檢測的時候即使用的db1，所以這次schema change為false，不用修改。

而對於hostS1復用之前的連接，因為之前使用的是db1，這次是db3，所以schema change為true，需修改。

對於每一個同步的連接，需在連接同步後才開始執行查詢。

一共有5個received ok response，其中2個對應上圖中的total syn cmd 2 commands，另外3個對應於上圖中的total syn cmd 3 commands，根據host也能很輕易的對應起來。

下麵開始執行程式，

第一個紅色方框針對的是192.168.244.146中dn3分片上，因為我整個select * from travelrecord輸出只有兩行，

mysql> select * from travelrecord;
+---------+---------------+------------+------+------+
| id      | user_id       | traveldate | fee  | days |
+---------+---------------+------------+------+------+
|       1 | mysql-server2 | 2016-01-01 |  100 |   10 |
| 5000001 | mysql-server3 | 2016-01-02 |  100 |   10 |
+---------+---------------+------------+------+------+
2 rows in set (0.04 sec)