Linux 基礎教程 36-查看系統性能

uptime uptime命令功能比較簡單，主要功能如下所示：查看伺服器的開機時長查看CPU負載基本用法用法示例輸出內容解釋如下所示： | 顯示內容 | 解釋 | | | | | 15:33:08 | 系統當前時間 | | up 10 days, 4:40 | ...

uptime

uptime命令功能比較簡單，主要功能如下所示：

查看伺服器的開機時長
查看CPU負載

基本用法

uptime

用法示例

[root@localhost ~]# uptime
15:33:08 up 10 days,  4:40,  2 users,  load average: 1.56, 1.22, 0.92

輸出內容解釋如下所示：

顯示內容	解釋
15:33:08	系統當前時間
up 10 days, 4:40	主機已運行時間，時間越長，說明機器越穩定
2 users	用戶連接數，是總連接數而不是用戶數
load average: 1.56, 1.22, 0.92	系統平均負載，統計最近1、5、15分鐘的系統平均負載

系統平均負載：指在某一段時間間隔內運行隊列中的平均進程數。根據實際工程經驗來看，單核負載在 0.7 以下是安全的，如超過則需要進行優化了。

除了使用uptime外，我們也可以使用以下方式來獲取系統的平均負載情況。

[root@localhost ~]# cat /proc/loadavg
1.32 1.35 1.15 1/5585 28715

前面3個數字分別表示最近1、5、15分鐘的系統平均負載
1/5585：分母表示系統的總進程數，分子表示正在運行的進程數
28715：最近一個啟動運行進程的ID

free

free常用來查看系統的可用記憶體和已使用記憶體等信息。

基本用法

free [選項]

常用選項如下所示：

選項	解釋
-b	以byte為單位顯示記憶體使用情況
-k	以KB為單位顯示記憶體使用情況
-m	以MB為單位顯示記憶體使用情況
-g	以GB為單位顯示記憶體使用情況
-t	額外顯示記憶體總和
-h	以較短的數字（預設為3位數）進行顯示且增加單位，方便查看
-s time	持續觀察記憶體使用情況
-c count	常與-s一直使用，用來設置採樣樣本數
-l	詳細顯示高峰和低谷時的記憶體使用統計情況

採用-k/-m/-g/-h顯示的值均採用向下取整的方式顯示，如果需要精確查看，則建議使用-b

用法示例

1、顯示主機記憶體使用情況

[root@localhost ~]# free -t -m
      total        used        free      shared  buff/cache   available
Mem:  128652       32106       87049     1293      9496       94266
Swap: 4095           0         4095
Total:132748       32106       91145

輸出內解釋如下所示：

total:可用物理記憶體總量
used:已經使用的記憶體數，包含buff/cache
free:可使用的記憶體數，不含buff/cache
share:多個進程共用的記憶體數
buff/cache:buff/cache占用量
Swap:交換分區使用量，虛擬記憶體
Total:物理記憶體總數

vmstat

vmstat是一個Linux監控工具，全稱為Virtual Memory Statistics。可用於查看關於進程、記憶體、I/O、等系統整體運行狀態。

基本用法

vmstat [選項] [採樣間隔] [採樣樣本數]

常用選項如下所示：

選項	解釋
-a	顯示活動/非活動的記憶體信息
-f	顯示自系統啟動以來的系統創建的總任務數
-t	增加時間戳
-m	顯示slabinfo信息
-n	頭部信息僅顯示一次
-s	以表格形式顯示記憶體指標及系統事件信息等
-d	顯示各磁碟的統計信息
-p	顯示特定分區的詳細統計信息
delay	設置兩次更新之間的時間間隔，如果不指定，則預設顯示從開機到現在的平均值
count	指定採樣的樣本數，如delay指定而count不指定則一直持續監控和輸出

用法示例

1、常用用法

vmstat delay count
- delay:採樣時間間隔
- count:採樣的樣本數

01vmstat詳細解釋.jpg

2、查看伺服器創建了多少個任務數

[root@localhost ~]# vmstat -f
     51221915 forks

3、顯示特定分區的統計信息：

[root@localhost ~]# vmstat -p /dev/sdb1
sdb1          reads   read sectors  writes    requested writes
               754      35990         81      22102

結果分析

對於vmstat出來的統計結果，如何判定是否存在問題了？不同的伺服器、操作系統、應用場景等均不一樣，也無法給出統一的判斷標準，需要大家根據實際情況進行綜合判斷。以下是一些實際應用中的經驗，僅供參考：

1、如果cache的值比較大，則說明系統緩存了比較多的磁碟數據，有利於磁碟I/O性能的提升，此時，bi會相對較小，因為很多讀寫磁碟的操作都由cache來承擔了。
2、si和so則代表讀寫SWAP的數量，這兩個值如果長期大於0，則表示系統需要經常讀寫交換分區，這樣會消耗CPU資源和磁碟I/O性能。如能確定物理記憶體存在瓶頸，則需要進行擴容或遷移了。
3、如free的值很低，基於接近於0，也不一定就是系統記憶體已經耗盡，還需要結合buffer和cache的使用量，如果buffer和cache占用了很多記憶體資源，則代表沒有問題，說明系統把空閑的記憶體都用於緩存，反而是提升了I/O性能，當系統需要記憶體時，buffer和cache可以隨時被回收回來。
4、如果bi和bo值很大，則說明系統正在進行大量的磁碟讀寫操作。如果是用戶正在進行的操作，則沒有問題，否則需要進行排查哪個設備或分區在進行大量讀寫操作。
5、如果us的值經常大於50%，則說明用戶進程占用的CPU時間比較多，需要對占用較多的程式進行排查和優化了。
6、如果sy值比較高，需要排查系統是否存在問題。
7、如果wa值比較高，則說明CPU總是在等待I/O操作，說明磁碟已經成為瓶頸，需要排查磁碟是否存在問題或優化程式的讀寫操作
8、如果r值總是超過CPU核數，則說明CPU可能成為瓶頸，可考核升級CPU等

mpstat

mpstat全稱Multiprocessor statistics，也是一個監控工具，主要對象是CPU。

基本用法

mpstat [選項] [採樣間隔] [採樣樣本數]

常用選項如下所示：

選項	解釋
-I	顯示中斷統計信息
-P	顯示指定CPU編號的統計信息，0為第一個CPU
-u	顯示CPU的使用情況
-A	等同於-u -I ALL -P ALL

與-I一起使用的參數如下所示
- SUM:顯示所有CPU中斷次數之和
- CPU:顯示每個CPU中斷次數
- ALL:將SUM和CPU的內容一起顯示

與-P一起使用的參數如下所示
- ON:僅統計線上的CPU使用情況
- ALL：統計所有CPU的使用情況

CPU常用指標

該指標一般是使用選項-u出來的統計結果，如下所示：

指標	解釋
CPU	CPU編號
%usr	用戶進程所使用的CPU占比
%nice	對進程進行降級時的CPU占比
%sys	內核進行使用的CPU占比
%iowait	空閑態中等待I/O請求所使用的CPU占比
%irq	處理系統中斷所使用的CPU占比
%soft	軟體中斷所使用的CPU占比
%steal	虛擬管理程式所使用的CPU占比
%guest	運行虛擬處理器所使用的CPU占比
%gnice	運行降級虛擬程式所使用的CPU占比
%idle	CPU空閑態的CPU占比

用法示例

1、查看所有CPU運行狀態
02mpstat示例1.jpg

2、查看指定CPU編號的運行狀態
03mpstat示例2.jpg

3、查看CPU中斷情況

    因為CPU的運算速度比外部硬體要快很多。以硬碟為例，如果是簡單的順序執行，則CPU需要等待很長
時間，不停詢問硬碟是否讀取完成，而這樣會浪費很多CPU時間。為此人們提出一種中斷機制，使得讀取硬
盤這樣的操作交給其他設備來完成，而CPU則掛起當前進程，將控制權轉讓給其他來處理的進程，當其他設
備處理完成後通知CPU，系統將當前進程標識為活動進行，從而繼續執行，處理硬碟的讀取操作。

04mpstat示例3.jpg

top

top是Linux中一個常用的性能監控工具並能周期性地進行更新，我們因此也可以快速瞭解伺服器的運行狀態。

基本用法

top [選項]

常用的選項如下所示：

選項	解釋
-b	以批處理模式進行操作
-c	顯示完整的命令信息
-d	更新時間間隔
-n number	指定迴圈顯示的次數
-u number/name	顯示指定用戶ID/用戶名的進程
-p pid
-s	安全模式
-S	累積模式

交互模式

交換械是指在top顯示相關信息時，在不影響顯示信息的同時進行的其他操作等，詳細如下所示：

快捷鍵	說明
f	添加或刪除進程信息項
k	終止進程，需要輸入PID號
r	更改進程優先順序
S	切換到累積模式
s或d	更改刷新時間
m	切換顯示記憶體信息
t	切換顯示進程和CPU狀態信息
c	切換顯示命令名稱和完整命令行
P	根據CPU使用率大小進行排序
T	根據時間/累計時間進行排序
W	將當前設置保存到~/.toprc文件中
q	退出top進程
b	將當前進程進行高亮顯示
l	是否顯示系統負載信息和啟動時間
1（數字1）	顯示每個CPU核心單獨的性能數據

用法示例

1、第一個示例：
05top示例1.jpg

示例詳解

系統級信息
進程指標信息

指標	說明	參考值
PID	進程ID
PRID	父進程ID
USER	進程所屬用戶，啟用進程的用戶名
PR	Priority縮寫，進程優先順序
NI	Nice縮寫，用於調節優先順序，與PR有關，越小越早被執行	-20~20 正數優先順序降低，負數優先順序提升
VIRT	進程虛擬記憶體使用量
RES	進程使用且未被交換出的物理記憶體使用量
SHR	共用記憶體使用量
S	進程狀態	R：運行 S:睡眠 D：不可中斷的睡眠狀態 T:跟蹤、停止僵屍
%CPU	CPU使用率
%MEM	記憶體使用率
TIME+	進程的CPU使用時間累積和	單位為1/100秒
TIME	進程占用的CPU時間累積和	單位為秒
RUSER	進程的實際用戶名，即登錄到Shell所用用戶名
UID	進程所屬用戶的ID
GROUP	進程所屬的組名
TTY	啟動進程的終端名稱
P	進程最近一次所使用的CPU編號
SWAP	進程使用且被交換出來的虛擬記憶體使用量
CODE	進程對應的可執行代碼所占用的物理記憶體量
DATA	進程對應的數據部分（數據段、棧等）所占用的物理記憶體量
nFLT	頁面錯誤次數
nDRT	最後一次寫入到目前為止被修改過的頁面數
WCHAN	如果進程處理睡眠狀態，則顯示睡眠狀態中系統調用名
Flags	進程標誌
COMMAND	進程所對應的命令名

iostat

iostat命令主要用來CPU的統計信息和每個設備、硬碟的IO統計信息

基本用法

iostat [選項] [採樣間隔] [採樣樣本數]

常用的選項如下所示：

選項	解釋
-c	僅顯示CPU的統計信息，即單獨輸出CPU的平均統計信息
-d	僅顯示設備的統計信息
-h	將各設備的統計信息以易於查看的方式進行顯示
-k	以kb/s顯示統計信息
-m	以mb/s顯示統計信息
-t	增加顯示時間戳
-x	顯示額外信息
-y	忽略自系統啟動以來的第一行信息

用法示例

1、iostat示例
06iostat示例1.jpg

2、查看硬碟的IO信息
06iostat示例2.jpg

各指標詳細解釋如下所示：

指標	說明
tps	每秒進程的I/O讀寫請求總數
MB_read/s	每秒讀取的位元組數，單位為MB/s
MB_wrtn/s	每秒寫入的位元組數，單位為MB/s
MB_read	讀取的位元組總數，單位為MB
MB_wrtn	寫入的位元組總數，單位為MB

看到第一組第一行的數字非常大，是否就可以斷定I/O存在問題了？ 在iostat輸出的第一組第一行數據，
表示是自Linux系統啟動剛纔本命令執行這段期間的統計結果，而後面的幾組數據才真正表示了在iostat
採樣周期的統計結果，而如果要排除第一組的數據可以使用選項 -y

3、顯示額外的統計信息
06iostat示例3.jpg

各指標詳細解釋如下所示：

指標	說明
rrqm/s	每秒對該設備的讀取請求總次數
wrqm/s	每秒對該設備的寫入請求總次數
r/s	每秒完成讀取的I/O次數
w/s	每秒完成寫入的I/O次數
rMB/s	每秒實際讀取的大小，單位為MB
wMB/s	每秒實際寫入的大小，單位為MB
avgrq-sz	平均每次I/O操作的數據大小
avgqu-sz	平均等待處理I/O操作的隊列長度
await	平均每次I/O請求等待時間(含等待時間和處理時間)，一般應低於5ms
r_await	每次讀取I/O請求等待時間
w_await	每次寫入I/O請求等待時間
svctm	平均每次I/O操作的服務時間
%util	周期內用於I/O操作的時間比率,即I/O隊列非空的時間比率，即(r/s+w/s )*(svctm/1000)

需要關註的參數如下所示：

%util：表示磁碟的忙碌情況，較大則代表I/O請求太多，硬碟可能存在瓶頸，一般不超過80%
await大於svctm:差值越小，則說明隊列時間越短，反之差值越大，則隊列時間越長，系統可能存在問題
svctm接近await，則說明I/O幾乎沒有等待時間
await遠大於svctm，則說明I/O隊列太長，則響應時間會變長

4、顯示CPU統計信息
06iostat示例4.jpg

各指標詳細解釋如下所示：

指標	說明
%user	顯示CPU在用戶級(應用程式)執行時的時間占比
%nice	顯示CPU在用戶級(應用程式)使用NICE許可權執行時的時間占比
%system	顯示CPU在系統級(內核)執行時的時間占比
%iowait	顯示CPU在空閑狀態期間未完成的磁碟I/O時間占比
%steal	顯示hypervisor服務另一個虛擬處理器時，虛擬CPU等待實際CPU的時間占比
%idle	顯示CPU在空閑狀態期間系統未完成的磁碟I/O時間占比