ORACLE AWR結合ASH診斷分析enq: TX - row lock contention

-Advertisement-

公司用戶反饋一系統在14:00~15:00（2016-08-16）這個時間段反應比較慢，於是生成了這個時間段的AWR報告，如上所示，通過Elapsed Time和DB Time對比分析，可以看出在這段時間內伺服器並不繁忙。分析Top 5 Timed Events，我們可以看到前五的等待事件可以看... ...

公司用戶反饋一系統在14:00~15:00（2016-08-16）這個時間段反應比較慢，於是生成了這個時間段的AWR報告，

如上所示，通過Elapsed Time和DB Time對比分析，可以看出在這段時間內伺服器並不繁忙。分析Top 5 Timed Events，我們可以看到前五的等待事件

可以看到等待事件enq: TX - row lock contention占了所有等待事件17.3%的比例，猜測有可能是鎖等待（enqueue等待）引起的阻塞導致，但是這個還不能下定論，因為畢竟CPU Time和db file sequential read等待事件所占的比例要大。於是我就使用awrddrpt.sql生成了15號與16號同一時段的AWR對比報告。

如上所示，16號14:00-15:00的DB Time反而比15號的DB Time小，從Top 5 Timed Events來看， 15號沒有enq: TX - row lock contention等待事件，那麼很有可能是這個引起的，那麼我接下來看看16號14:00-15:00時間段的AWR報告的Wait Events，如下所示，enq: TX - row lock contention的Total Waits Tims(s)為1022秒，Avg Waits(ms)為2848毫秒，說明鎖等待（enqueue等待）還是蠻嚴重的。

那麼我們去檢查Segments by Row Lock Waits，看看是那些對象產生了等待事件““enq: TX - row lock contention”，如下所示，主要是表INV_NEXT_NO，以及索引IDX_INV_SRN_HD_N1

另外在bdump的trace文件中發現在14:30左右出現了TNS-12535 & TNS-1260錯誤，那麼我就來生成14:25:00~14:35:00這個時間段的ASH報告來分析一下

Client Address = (ADDRESS=(PROTOCOL=tcp)(HOST=192.168.xxx.xxx)(PORT=44913))

*** 2016-08-16 14:32:36.012

  NS Primary Error: TNS-12535: TNS:operation timed out

  NS Secondary Error: TNS-12606: TNS: Application timeout occurred

kmduicxd: 0x7f381c4bc770, kmduiflg: 1, circuit: 0x3778688f0

  (circuit) dispatcher process id = (0x37f799ef8, 1)

            parent process id = (17, 1)

            serial # = 416

            connection context = 0x7f381c4bc770

            user session = ((nil)), flag = (100c0), queue = (9)

            current buffer = (0), status = (4, 0)

Client Address = (ADDRESS=(PROTOCOL=tcp)(HOST=192.168.xxx.xx)(PORT=60069))

*** 2016-08-16 14:32:58.679

  NS Primary Error: TNS-12535: TNS:operation timed out

  NS Secondary Error: TNS-12606: TNS: Application timeout occurred

kmduicxd: 0x7f381c4bd960, kmduiflg: 1, circuit: 0x377942fd0

  (circuit) dispatcher process id = (0x37f799ef8, 1)

            parent process id = (17, 1)

            serial # = 798

            connection context = 0x7f381c4bd960

            user session = ((nil)), flag = (100c0), queue = (9)

            current buffer = (0), status = (4, 0)

可以看出主要是因為下麵語句造成的

SELECT NEXT_NO FROM INV_NEXT_NO WHERE PREFIX_CODE = :B1 FOR UPDATE

select next_no from inv_next_no where prefix_code = 'SRN-YMG-201608-' for update

想必你一看到FOR UPDATE語句，心裡就已經知道了七七八八了,當兩個會話或多個會話同時更新某一行時,就會出現enq: TX - row lock contention等待事件,如果其中一個會話遲遲不提交事務或是由於網路等其其它故障出現,那麼其它會話就會一直等待這個資源,併發高的情況下,就會出現大量阻塞。這個還真是因為不合理的設計所造成的。因為系統要生成唯一併且連續的單號（首碼+數字），為了獲取唯一併且連續的單號，所以使用SELECT FOR UPDATE這種設計來實現，沒有使用SEQUENCE（因為SEQUENCE可能會跳號，造成單號不連續），也不能使用其它方式了。如果能修改生成單號的業務邏輯，這個問題就好解決了。

您的分享是我們最大的動力!

-Advertisement-

更多相關文章

Oracle 11g的Redo Log和Archive Log的分析方法

自Oracle 11g起，無需設置UTL_FILE_DIR就可以使用LOGMNR對本地資料庫的日誌進行分析，以下是使用LOGMNR的DICT_FROM_ONLINE_CATALOG分析REDO和歸檔日誌的步驟 ...
在 CentOS7 上部署 MySQL 主從

...
包的變數作用域測試說明

Oracle Database 10g Enterprise Edition Release 10.2.0.1.0 1. 包中作用域種類說明以及聲明位置 a. publish、private、locavariable 三種類型，當然每種類型包括了變數、函數、類型等。 b. publish類聲明在非包 ...
LINUX下使用elasticsearch-jdbc工具實現MySQL同步到ElasticSearch 以及linux 64位centos系統安裝jdk1.8

第一步：環境匹配 1）elasticsearch 2.3.3 成功安裝部署 2）mysql安裝成功，增刪改查無誤~~。 3）要保證elasticsearch-jdbc的版本要與elasticsearch的版本是一致的（下麵的內容會提示下載）。否則會報錯，無法進行之後的步驟。（例如elasticse ...
Redis學習總結

Redis是一個開源的使用ANSI C語言編寫、支持網路、可基於記憶體亦可持久化的日誌型、Key-Value資料庫，並提供多種語言的API，其實當前最熱門的NoSQL資料庫之一，NoSQL還包括了Memcached和mongodb。關於Redis和Memcached的比較請點擊：Redis 和 Mem ...
查詢資料庫的幾個示例

...
MySQL基礎(非常全)

MySQL基礎一、MySQL概述 1、什麼是資料庫？　答：數據的倉庫，如：在ATM的示例中我們創建了一個 db 目錄，稱其為資料庫 2、什麼是 MySQL、Oracle、SQLite、Access、MS SQL Server等？　答：他們均是一個軟體，都有兩個主要的功能： a. 將數據保存到文 ...
Linux 系統中的MySQL資料庫預設區分大小寫

今天在開發中遇到這麼個問題，將連接的資料庫改為伺服器上的時候（伺服器是Linux系統的），程式跑起來後一直出錯，總提示資料庫的表找不到，而打開資料庫看該表明明是存在的，在我的印象中MySQL數據是不區分大小寫的，後來查資料才發現，在Linux系統中MySQL預設是嚴格區分大小寫的，可以在配置文件 ...