概括來說,分三步: 1,首先找到是哪個進程的CPU占有率飆到了100%。 2,根據進程號pid,定位到是哪個線程,找到對應線程的tid。 3,導出對應線程的dump日誌文件,分析日誌文件定位具體代碼。 要解決這個問題,你應該具備以下技能: 1,linux的top命令。 2,jvm監控工具jps。 3 ...
概括來說,分三步:
1,首先找到是哪個進程的CPU占有率飆到了100%。
2,根據進程號pid,定位到是哪個線程,找到對應線程的tid。
3,導出對應線程的dump日誌文件,分析日誌文件定位具體代碼。
要解決這個問題,你應該具備以下技能:
1,linux的top命令。
2,jvm監控工具jps。
3,jvm監控工具jstack。
OK,接下來我們詳細看一下如何定位問題。
一,linux的top命令如何使用
linux的top命令類似於windows下的任務管理器,我們可以使用linux命令來查看生產伺服器的cpu使用情況。
常用命令如下:
top:每隔5秒顯示所有進程的資源占用情況。
top -d 2:每隔2秒顯示所有進程的資源占用情況。
top -c:每隔5秒顯示所有進程的資源占用情況,並顯示進程的命令行參數(預設只有進程名稱)。
top -p 12345 -p 6789:每隔5秒顯示12345和6789這2個進程的資源占用情況。
top -d 2 -c -p 123456:每隔2秒顯示PID為12345的進程的資源占用情況,並顯示該進程啟動的命令行參數。
OK,我們可以使用下麵的命令來查看某個線程下所有線程的CPU使用情況:
top -H -p pid
例如查找進程號為12345的進程下所有線程的使用情況:
top -H -p 12345
OK,我們離目標更近一步了,根據PID我們找到了tid,接下來我們就要使用另外一個命令了:jstack,找到了線程id意味著接下來的工作就要交給jvm提供的分析工具了。操作系統只能幫我們到這裡了。
二,jvm監控工具jps
top命令很強大,不過我們也可以使用jvm提供的jps分析工具,這個是jvm專屬的進程分析工具。
jps -lvm:查看當前伺服器上運行的java進程。我們可以獲取到java應用的pid。
接下來我們使用jstack -l pid命令查看java應用的堆棧信息。
總之,有2種方式可以獲取到java應用的pid。
1,使用top命令
2,使用jps命令
jps的功能和linux的ps命令類似,都是用來查看進程的運行信息的。下麵我們來看一下具體的參數都是什麼含義。
jps -q:只列出進程id,註意這裡列出的是jvm進程,非jvm進程jps是無能為力的。
jps -m:列出啟動應用時傳給main方法的參數。
jps -l:列出jvm進程id和運行主類全稱。
jps -v:列出jvm進程啟動時的jvm參數。
三,jstack性能分析工具
jstack可以導出某個線程的運行情況和當前狀態等信息,命令如下:
jstack 98765 > 98765jstack.log
我們即可以把日誌拉到本地來分析,也可以直接在linux上分析。總之,我們找到了日誌文件,並且知道,文件里記錄了線程98765的一些信息。接下來我們就是查看這個日誌文件,定位到具體代碼的位置。
四,如何分析日誌文件定位到具體的代碼
jstack導出的日誌文件中,可能會包含以下幾個關鍵信息:
1,Deadlock:死鎖。
2,Runnable:執行中。
3,Waiting for condition:等待資源。
4,Waiting on monitor entry:等待獲取監視器。
5,Suspended:暫停。
6,Object.wait()或者TIMED_WAITING:對象等待中。
7,Blocked:阻塞
8,Parked:停止
CPU飆高的問題,通常線程狀態是Runnable。我們找到線程的狀態信息後,再分析下麵的詳細堆棧信息,就可以大概定位到出問題的代碼。
這裡還有幾個標識我們必須要清楚:
tid:java線程id。
nid:native線程id。
prio:線程優先順序。
最後小編整理了一套技術資料不僅能精準消除技術盲點、累計面試經驗,更可以攻剋JVM、Spring、分散式、微服務等技術難題。
海量電子書,珍藏版