Linux性能評估工具_ZenDei技術網路在線

[TOC] 介紹檢測伺服器當前的性能，主要檢查的項目如下：負載：uptime 內核信息： dmesg 記憶體：vmstat、free CPU：top、mpstat、 I/O：iostat 網路：sar 有些命令需要安裝sysstat包負載：uptime 通過命令可以快速的查看當前的伺服器的1分 ...

介紹
負載：uptime
查看內核的信息： dmesg
查看記憶體狀態： free、vmstat
- free：查看記憶體，已用記憶體，剩餘記憶體、交換分區等
- vmstat：顯示虛擬記憶體狀況的信息。
查看CPU：
- mpstat：查看每個CPU的消耗信息
- top: 查看Linux任務信息
查看IO：iostat
查看網卡：sar

介紹

檢測伺服器當前的性能，主要檢查的項目如下：

負載：uptime
內核信息： dmesg
記憶體：vmstat、free
CPU：top、mpstat、
I/O：iostat
網路：sar

有些命令需要安裝sysstat包

負載：uptime

$ uptime 
 22:37:31 up 65 days, 3:15, 1 user, load average: 40.00, 25.01, 10.05

通過uptime命令可以快速的查看當前的伺服器的1分鐘、5分鐘、15分鐘的平均負載情況，它對CPU運行狀態和I/O數狀態的資源負載的整體的展示。這三個數字幾乎依次展示了系統的15分鐘之內負載的變化，如上，1分鐘的值比15分鐘的高，就說明你的系統負載越來越高，此時就需要緊急排查系統的狀況了。該工具只是快速查看健康狀態的一種手段而已，真正需要確定需要下麵的工具查看。

查看內核的信息： dmesg

$ dmesg |tail
[ 2567.534310] IPv6: ADDRCONF(NETDEV_UP): em3: link is not ready
[ 2570.386536] tg3 0000:02:00.0 em3: Link is up at 1000 Mbps, full duplex
[ 2570.386550] tg3 0000:02:00.0 em3: Flow control is off for TX and off for RX
[ 2570.386555] tg3 0000:02:00.0 em3: EEE is disabled
[ 2570.386584] IPv6: ADDRCONF(NETDEV_CHANGE): em3: link becomes ready
[20907.774686] perf: interrupt took too long (2502 > 2500), lowering kernel.perf_event_max_sample_rate to 79000
[50276.167405] perf: interrupt took too long (3173 > 3127), lowering kernel.perf_event_max_sample_rate to 63000
[96662.454537] perf: interrupt took too long (4010 > 3966), lowering kernel.perf_event_max_sample_rate to 49000
[143249.558510] perf: interrupt took too long (5025 > 5012), lowering kernel.perf_event_max_sample_rate to 39000
[204028.503117] perf: interrupt took too long (6286 > 6281), lowering kernel.perf_event_max_sample_rate to 31000

通過dmesg可以查看設備的一些故障信息。如: TCP丟包，oom-killer錯誤等。

查看記憶體狀態： free、vmstat

free：查看記憶體，已用記憶體，剩餘記憶體、交換分區等

$ free -h
    total used free shared buff/cache available
Mem: 7.6G   697M   3.0G   23M   3.9G    6.5G
Swap: 8.0G   0B   8.0G

通過free命令可以查看系統記憶體的使用狀況。要瞭解Linux對記憶體利用率，就必須瞭解Linux對buffer cache和page cache的處理。簡單來說，Linux內核會將進程要讀取或者寫入的數據先保存在記憶體中形成緩存塊，加快下次對該數據的操作，上圖中available更準確顯示記憶體的剩餘量。

buffer cache是對塊設備數據的緩存，page cache是對文件數據的緩存。

swap顯示了swap分區的大小，通過調整/proc/sys/vm/swappiness文件可以調整記憶體交換到磁碟的積極程度，值為0-100之間的值，值越高，交換就越頻繁，如果交換太頻繁就會影響系統的性能，預設是60，建議調整為0。

# cat /proc/sys/vm/swappiness 
60
# echo "vm.swappiness = 10" >>/etc/sysctl.conf
# sysctl -p

vmstat：顯示虛擬記憶體狀況的信息。

$ vmstat 1
procs -----------memory---------- ---swap-- -----io---- -system-- ------cpu-----
 r b swpd free buff cache si so bi bo in cs us sy id wa st
 0 0 0 3082644 2076 4156120 0 0 1 210 12 9 1 0 99 0 0
 0 0 0 3083180 2076 4156112 0 0 0 473 2231 2420 1 0 99 0 0
 0 0 0 3083212 2076 4156112 0 0 0 12510 3946 3945 1 2 97 0 0
 0 0 0 3083684 2076 4156096 0 0 0 1403 2333 1725 1 0 99 0 0
 1 0 0 3082868 2076 4156388 0 0 0 505 2307 1795 4 1 95 0 0
 0 0 0 3083508 2076 4156040 0 0 0 475 1888 1570 1 1 99 0 0
 0 0 0 3083152 2076 4156040 0 0 0 8090 1694 1910 1 1 99 0 0

vmstat報告有關進程，記憶體，分頁，塊IO和cpu活動的信息。
procs:

r：正在CPU上運行和等待運行的進程數量。    
b：阻塞的進程

Memory:

swpd：虛擬記憶體使用的大小
free：空閑的記憶體大小
buffer: 用作緩衝的記憶體大小
cache：用作緩存的記憶體大小

Swap:

si:每秒從交換區寫到記憶體的大小
so:每秒寫入到交換區的記憶體大小

IO：

bi:塊設備每秒接收的塊數量
bo:塊設備每秒發送的塊數量

System:

in:每秒CPU中斷次數
cs:每秒上下文切換的次數，這個值越小越好

CPU :

us:用戶的CPU時間
sy:系統內核運行CPU時間
id:空閑的CPU時間
wa:等待IO花費的時間
st:從虛擬機中偷走的時間

查看CPU：

mpstat：查看每個CPU的消耗信息

$ mpstat -P ALL 1 2
Linux 2.6.32-696.el6.x86_64 (DX_JQ_2) 12/07/2018 _x86_64_   (32 CPU)

01:52:00 PM CPU %usr %nice %sys %iowait %irq %soft %steal %guest %idle
01:52:01 PM all 0.00 0.00 0.03 0.00 0.00 0.00 0.00 0.00 99.97
01:52:01 PM 0 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 100.00
01:52:01 PM 1 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 100.00
01:52:01 PM 2 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 100.00
01:52:01 PM 3 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 100.00
01:52:01 PM 4 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 100.00
01:52:01 PM 5 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 100.00
01:52:01 PM 6 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 100.00
01:52:01 PM 7 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 100.00

mpstat可以實時的查看每個CPU的消耗狀況，可以查看每個CPU的分配不均衡的問題。

top: 查看Linux任務信息

top命令可以實時的查看Linux系統運行狀況，查看系統啟動的時間，線上用戶，負載，各個進程的狀態，CPU，記憶體，交換分區的狀態。可以通過查看top查看每個進程具體的狀信息，如，進程的PID，優先順序，進程需要的虛擬記憶體和進程當前使用的記憶體大小等。
各個欄位的含義：

PID:進程ID
PR：任務優先順序
NI：nice值，數值越小表示優先順序越高
VIRT：進程使用的虛擬記憶體總量
RES：進程使用的，沒有換出的物理記憶體的大小
SHR：共用記憶體的大小
S：進程狀態。D:不可中斷的睡眠狀態 R:運行 S:睡眠 T:跟蹤/停止  Z:僵屍進程
%CPU: 占用的CPU時間比
%MEM：進程所使用的物理記憶體百分比
TIME+:進程使用的CPU時間總計
COMMAND:命令行

查看IO：iostat

# iostat -xz 1 
Linux 2.6.32-696.el6.x86_64 (DX_JQ_2) 12/07/2018 _x86_64_   (32 CPU)

avg-cpu: %user %nice %system %iowait %steal %idle
           0.05 0.00 0.07 0.01 0.00 99.87

Device: rrqm/s wrqm/s r/s w/s rsec/s wsec/s avgrq-sz avgqu-sz await r_await w_await svctm %util
sda 0.00 3.29 0.02 1.13 1.28 35.30 31.88 0.02 20.90 7.84 21.13 5.19 0.60
dm-0 0.00 0.00 0.02 4.41 1.27 35.29 8.25 0.07 14.68 8.78 14.70 1.34 0.60

avg-cpu: %user %nice %system %iowait %steal %idle
           0.06 0.00 0.06 0.00 0.00 99.87

Linux中可以通過iostat查看系統的IO狀態。r/s, w/s, rkB/s, wkB/s: 這些是該設備每秒讀％、寫％、讀Kb、寫Kb。可用於描述工作負荷。

查看網卡：sar

# sar -n DEV 1
Linux 2.6.32-696.el6.x86_64 (DX_JQ_2) 12/07/2018 _x86_64_   (32 CPU)

02:28:00 PM IFACE rxpck/s txpck/s rxkB/s txkB/s rxcmp/s txcmp/s rxmcst/s
02:28:01 PM lo 20.00 20.00 2.33 2.33 0.00 0.00 0.00
02:28:01 PM em1 21.00 39.00 1.47 9.24 0.00 0.00 4.00
02:28:01 PM em2 89.00 39.00 49.84 8.36 0.00 0.00 29.00
02:28:01 PM em3 0.00 0.00 0.00 0.00 0.00 0.00 0.00
02:28:01 PM em4 1.00 0.00 0.12 0.00 0.00 0.00 1.00
02:28:01 PM bond0 110.00 78.00 51.31 17.60 0.00 0.00 33.00
02:28:01 PM bond1 1.00 0.00 0.12 0.00 0.00 0.00 1.00

使用sar查看網路介面的吞吐量。通過 sar 命令可以全面的獲取系統的 CPU、運行隊列、磁碟 I/O、交換區、記憶體、 cpu 中斷、網路等性能數據。
|命令|說明|
|---|---|
|sar -u 1 3|查看CPU|
|sar -r 1 3|查看記憶體和交互空間|
|sar -B 1 3|查看記憶體分頁|
|sar -b 1 3|查看I/O速率|
|sar -q 1 3|查看進程隊列長度和平均負載狀態|
|sar -W 1 3|查看系統交互活動信息|

Linux性能評估工具

介紹