Linux開源監控平臺歸總 Cacti 偏向於基礎監控。成圖非常漂亮,需要php環境支持,並且需要mysql作為數據存儲 Cacti是一個性能廣泛的圖表和趨勢分析工具,可以用來跟蹤並幾乎可以繪製出任何可監測指標,描繪出圖表。從硬碟的利用率到風扇的轉速,在一個電腦管理系統中,只要是可以被監測的指標,C ...
Linux開源監控平臺歸總
Cacti
偏向於基礎監控。成圖非常漂亮,需要php環境支持,並且需要mysql作為數據存儲
Cacti是一個性能廣泛的圖表和趨勢分析工具,可以用來跟蹤並幾乎可以繪製出任何可監測指標,描繪出圖表。從硬碟的利用率到風扇的轉速,在一個電腦管理系統中,只要是可以被監測的指標,Cacti都可以監測,並快速的轉換成可視化的圖表。
Nagio
不用存儲歷史數據,註重服務或者監控項的狀態
Nagios是一款開源的免費網路監視工具,能有效監控Windows、Linux和Unix的主機狀態,交換機路由器等網路設置,印表機等。在系統或服務狀態異常時發出郵件或簡訊報警第一時間通知網站運維人員,在狀態恢復後發出正常的郵件或簡訊通知。;
Nagios 可以監控的功能有:
- 監控網路服務(SMTP、POP3、HTTP、NNTP、PING等);
- 監控主機資源(處理器負荷、磁碟利用率等);
- 簡單地插件設計使得用戶可以方便地擴展自己服務的檢測方法;
- 並行服務檢查機制;
- 具備定義網路分層結構的能力,用"parent"主機定義來表達網路主機間的關係,這種關係可被用來發現和明晰主機宕機或不可達狀態;
- 當服務或主機問題產生與解決時將告警發送給聯繫人(通過EMail、簡訊、用戶定義方式);
- 可以定義一些處理程式,使之能夠在服務或者主機發生故障時起到預防作用;
- 自動的日誌滾動功能;
- 可以支持並實現對主機的冗餘監控;
- 可選的WEB界面用於查看當前的網路狀態、通知和故障歷史、日誌文件等;
Icinga
Icinga 是一個正在重建的Nagios的分支,它提供了一個全面的監控和警報的框架,致力於設計一個像Nagios一樣的開放和可擴展性的平臺。但是和Nagios擁有不一樣的Web界面。Icinga 1 和 Nagios非常的相近,不過Icinga 2就重寫了。兩個版本都能很好的相容,而且,Nagios用戶可以很輕鬆的轉到Icinga 1平臺。
NeDi
NeDi可能不如其他的工具一樣聞名全世界,但它確是一個跟蹤網路接入的一個強大的解決方案。它可以很流暢的運行網路基礎設施和設備目錄,保持對任何事件的跟蹤。並且可以提供任意設備的當前地點,也包括歷史地點。
NeDi可以被用於定位被偷的,或者是丟失掉的設備,只要設備出現在網路上。它甚至可以在地圖上顯示所有已發現的節點。並且很清晰的告訴人們網路是怎麼互聯的到物理設備埠的。
Observium
Observium 綜合了系統和網路監控,在性能趨勢監測上有很好的表現,它支持靜態和動態發現來確認伺服器和網路設備,利用多種監測方法,可以監測任何可用的指標。Web界面非常的整潔,易用。
Observium也可以在地圖上顯示任何被監測節點的實際地點。需要註意的是面板上關於活躍設備和警報的計數。
Zabbix
需要php環境支持,並且需要mysql作為數據存儲,基本上可以滿足大部分需求,目前大部分公司在用
zabbix是一個基於WEB界面的提供分散式系統監視以及網路監視功能的企業級的開源解決方案。zabbix能監視各種網路參數,保證伺服器系統的安全運營;並提供柔軟的通知機制以讓系統管理員快速定位/解決存在的各種問題。zabbix由2部分構成,zabbix server與可選組件zabbix agent。zabbix server可以通過SNMP,zabbix agent,ping,埠監視等方法提供對遠程伺服器/網路狀態的監視,數據收集等功能,它可以運行在Linux, Solaris, HP-UX, AIX, Free BSD, Open BSD, OS X等平臺上。
Ntop
Ntop是一種監控網路流量工具,用ntop顯示網路的使用情況比其他一些網路管理軟體更加直觀、詳細。Ntop甚至可以列出每個節點電腦的網路帶寬利用率。他是一個靈活的、功能齊全的,用來監控和解決區域網問題的工具;尤其當ntop與nprobe配合使用,其功能更加顯著。它同時提供命令行輸入和web頁面,可應用於嵌入式web服務
Ntop主要提供以下一些功能:
- 自動從網路中識別有用的信息;
- 將截獲的數據包轉換成易於識別的格式;
- 對網路環境中通信失敗的情況進行分析;
- 探測網路通信的時間和過程
Smokeping
偏向於基礎監控,成圖非常漂亮
Smokeping 是rrdtool 的作者Tobi Oetiker 的作品,是用Perl 寫的,主要是監視網路性能,包括常規的ping,用echoping監控www 伺服器性能,監視dns 查詢性能,監視ssh 性能等。底層也是rrdtool做支持,特點是畫的圖非常漂亮,網路丟包和延遲用顏色和陰影來表示。在企業中運用較少。
Open-falcon
由於是國人開發有一套較為完善的中文文檔
小米公司開發,開源後受到諸多大公司和運維工程師的追捧,適合大企業,滴滴、360、新浪微博、京東等大公司在使用這款監控軟體
特點:
數據採集免配置:agent自發現、支持Plugin、主動推送模式
容量水平擴展:生產環境每秒50萬次數據收集、告警、存儲、繪圖,可持續水平擴展。
告警策略自發現:Web界面、支持策略模板、模板繼承和覆蓋、多種告警方式、支持回調動作。
告警設置人性化:支持最大告警次數、告警級別設置、告警恢復通知、告警暫停、不同時段不同閾值、支持維護周期,支持告警合併。
歷史數據高效查詢:秒級返回上百個指標一年的歷史數據。
Dashboard人性化:多維度的數據展示,用戶自定義Dashboard等功能。
架構設計高可用:整個系統無核心單點,易運維,易部署
Overwatch
功能強大 但是由於是新開源的項目 目前網路上相關資料較少
Overwatch分散式系統監控平臺可以對所有後臺系統間的RPC通信進行實時的監控。圖形化的展現使得工程師不用去解讀大量的、複雜的數據報表。僅通過一張有向圖,工程師便可以快速理解並掌握當前系統的整體狀況,幫助工程師快速定位並修複系統異常。
Overwatch有著極大的擴展的潛力,通過對客戶端收集程式的加強,我們還可以實現以下功能:
- 對於數據源、中間件的監控(如MySQL、Redis、消息隊列),在有向圖中加入基礎組件,全面監控所有系統間的依賴以及調用情況。
- 支持更多RPC協議 (如Thrift、gRPC)
- 更多的metric,實現精確到API的監控和展現
最後附上市場主流監控平臺 2017年的一個比較圖表