Linux伺服器要保證高可用性,就要對其進行有效的監控,實時瞭解到伺服器的運行狀況,各項性能指標是否正常,以防患以未然,進行運維日誌的記錄,圖形化的監控,出現問題的消息報警機制,都是保證Linux伺服器能正常對外提供服務的先決條件。 ...
本文地址:http://www.cnblogs.com/aiweixiao/p/7131532.html
原文地址(公眾號):http://t.cn/RKwmqUs
點擊關註 微信公眾號
1. 監控概要
Linux伺服器要保證高可用性,就要對其進行有效的監控,實時瞭解到伺服器的運行狀況,各項性能指標是否正常,以防患以未然,進行運維日誌的記錄,圖形化的監控,出現問題的消息報警機制,都是保證Linux伺服器能正常對外提供服務的先決條件。
2. 監控的內容
監控,是預防的其中的一項重要工作。這裡先說說我需要監控的內容。系統負載、cpu使用率、記憶體占用、磁碟空間、網路流量、埠、進程、apache或tomcat的連接數、mysql的運行狀態這些都是需要監控的東西。要瞭解伺服器每時每刻的整體運行狀態,單靠幾個Linux自帶的性能監測命令是很難實現的。所以,利用shell腳本和開源監控工具進行伺服器監控成為兩個主要的選擇。
3.監控的方法
首先是要明白Linux伺服器監控的一些常見命令,以及這些命令編寫的監控腳本,最後,一些成熟的開源監控工具也是必要的。
3.1 常見監控命令
1) 【iostat】:iostat命令用來顯示存儲子系統的詳細信息,通常用它來監控磁碟 I/O 的情況。
2)【meminfo 和 free】: cat /proc/meminfo free
3)【mpstat】:實時系統監控工具,多CPUs系統里,其不但能查看所有CPU的平均狀況信息,而且能夠查看特定CPU的信息
4)【netstat】:顯示了大量跟網路相關的信息
5)【nmon】:開源工具,用以監控 Linux 系統的性能,下載及安裝
6)【pmap】:pmap 命令用來報告每個進程占用記憶體的詳細情況,可用來看是否有進程超支了,該命令需要進程 id 作為參數。
7)【ps pstree】:ps 告訴你每個進程占用的記憶體和 CPU 處理時間,而 pstree以樹形結構顯示進程之間的依賴關係,包括子進程信息
8)【sar】:sar 可用來顯示 CPU 使用率、記憶體頁數據、網路 I/O 和傳輸統計、進程創建活動和磁碟設備的活動詳情。
9)【strace】:診斷進程工具,如 strace ls ,但是被診斷進程會變慢
10)【tcpdump】網路監控工具,用來做基本的協議分析,看看那些進程在使用網路以及如何使用網路。
11)【uptime】:該命令告訴你這台伺服器從開機啟動到現在已經運行了多長時間了
12)【 vmstat 】來監控虛擬記憶體
13)【Wireshark】:是一個網路協議檢測程式,讓您經由程式抓取運行的網站的相關資訊
14)【dstat】 多類型資源統計工具:該命令整合了vmstat,iostat和ifstat三種命令
15)【htop】: 更加友好的top,兩者區別見:“關於htop和top的比較”
16)【ss】: 用來記錄套接字統計信息,它可以顯示類似netstat一樣的信息,同時也能顯示更多TCP和狀態信息
17)【lsof】 : 列表顯示打開的文件
18)【iftop】是另一個基於網路信息的類似top的程式。它能夠顯示當前時刻按照帶寬使用量或者上傳或者下載量排序的網路連接狀況
3.2 shell監控腳本
這裡提供 四個腳本(performance.sh 性能監控,process.sh 進程監控,network.sh 流量監控,tongji.sh流量分析統計),並使用crontab定時執行腳本進行監控數據的記錄,形成每天的監控日誌放在如下相應的文件夾,並且超過自己設定的告警值後發郵件通知,那些有免費簡訊通知功能的郵箱如騰訊企業郵箱,163郵箱可以嘗試一下,收到郵件告警後很快就能收到簡訊了,很方便。
3.2.1 性能監控腳本 performance.sh
代碼GitHub地址:http://t.cn/Ro0H1EV
代碼截圖如下,有四個
性能監控腳本01-監控cpu負載
性能監控腳本02-監控cpu使用率
性能監控腳本03-監控交換分區
性能監控腳本04-監控磁碟空間
3.2.2 進程監控腳本 process.sh
代碼GitHub地址:http://t.cn/Ro0R9pG
代碼截圖如下
進程監控腳本process.sh
3.2.3 流量監控腳本 network.sh
代碼GitHub地址:
代碼截圖如下:
流量監控腳本 network.sh
3.2.4 流量分析統計腳本 tongji.sh
代碼GitHub地址:http://dwz.cn/6b8y48
代碼截圖如下:
流量分析統計腳本 tongji.sh
3.3 監控工具
3.3.1) Cacti+Nagios
【Cacti】:Cacti是一套基於PHP,MySQL,SNMP及RRDTool開發的網路流量監測圖形分析工具。
【Nagios】: Nagios是一個監視系統運行狀態和網路信息的監視系統。能監視所指定的本地或遠程主機以及服務,同時提供異常通知功能等
3.3.2)Zabbix
【Zabbix】: Zabbix除了能監視各種網路參數,保證伺服器系統的安全運營之外,還能提供如簡訊、郵件、jabber等通知機制以讓系統管理員快速定位/解決存在的各種問題。基本上能實現cacti+nagios的功能
關註微信公眾號