運維,這裡指互聯網運維,通常屬於技術部門,與研發、測試、系統管理同為互聯網產 品技術支撐的4大部門,這個劃分在國內和國外以及大小公司間都會多少有一些不同。 一個互聯網產品的生成一般經歷的過程是:產品經理、需求分析、研發部門開發、測試部門測試、運維部門部署發佈以及長期的運行維護。 運維,本質上是對 ...
運維,這裡指互聯網運維,通常屬於技術部門,與研發、測試、系統管理同為互聯網產
品技術支撐的4大部門,這個劃分在國內和國外以及大小公司間都會多少有一些不同。
一個互聯網產品的生成一般經歷的過程是:產品經理、需求分析、研發部門開發、測試部門測試、運維部門部署發佈以及長期的運行維護。
運維,本質上是對網路、伺服器、服務的生命周期各個階段的運營與維護,在成本、穩定性、效率上達成一致可接受的狀態。
對於初創公司,運維部和系統部一般是合二為一的,相關工作由同一批人負責,界限可能不是很明顯。大型公司對運維工作的要求更高,需要有更精細的分工,因此機房/網路/操作系統相關的底層工作分離出來由專人負責,成為系統管理部,而上層和應用產品相關的工作則由運維負責,成為運維部。以下從互聯網產品生命周期和運維涉及的技術分別來看分工較細的大型互聯網公司中運維工作的職責。
隨著技術發展,運維自動化也成了一個不可阻擋的趨勢,雲計算的發展帶來的是docker和kubenetes這種大大降低運維成本的技術,與此同時,基於這些技術不斷的發展的自動化運維Devops也不斷深入人心,如今的運維技術也漸漸地進入了新的時代。今天我們就來推薦幾本關於運維方面技術的優秀書籍。
運維繫列書單
DevOps開發運維訓練營
本書將全面完整地介紹智能運維的技術體系,以及大企業的智能運維實踐經驗,讓讀者更加瞭解運維技術的現狀和發展方向,在實踐中能夠有所借鑒。同時,也能幫助運維工程師在一定程度上瞭解到機器學習的常見演算法模型,以及如何將它們應用到運維工作中。全書共分4篇。
第1篇運維發展史,將重點闡述當前運維的發展現狀及面臨的技術挑戰;第2篇智能運維基礎設施,將重點講述大數據場景下的數據存儲、大數據處理和分析的方法與經驗,以及海量數據多維度多指標的處理分析技術;第3篇智能運維技術詳解,將重點關註在新時期大數據時代下,如何進行智能化的運維體系建設;第4篇技術案例詳解,為大家梳理了通過開源框架ELK快速構建智能監控系統的整體方案,還將分享微博平臺和微博廣告兩個不同業務場景下智能監控系統的技術實踐。
作者簡介
彭冬:微博廣告基礎架構團隊負責人、技術專家,商業大數據平臺及智能監控平臺發起人,目前負責廣告核心引擎基礎架構、Hubble智能監控系統、商業基礎數據平臺(D )等基礎設施建設。
關註計算廣告、大數據、人工智慧、高可用系統架構設計、區塊鏈等方向。在加入微博之前,曾就職於百度負責大數據平臺建設,曾擔任趣點科技聯合創始人兼CTO等職位。畢業於西北工業大學,曾在國內外知名期刊發表多篇學術論文,擁有9項發明專利。
朱偉@kimi:微博廣告SRE團隊技術負責人,高級運維工程師,2016年4月加入微博,目前主要負責微博廣告智能監控報警平臺和服務治理等項目的建設與研究。
劉俊:微博平臺部監控技術負責人,負責微博平臺、PC微博大規模監控系統的建設,主要關註實時大數據、運維自動化、智能化方向。2014年加入微博,之前曾在新浪、搜狐等公司從事運維監控方面的工作。
Linux運維之道
隨著開源技術的不斷進步與創新,整個IT行業中越來越多的企業願意採用開源產品,而基於Linux的操作系統為這些開源產品提供了一個很好的操作平臺。丁明一編著的《Linux運維之道(第2版)》將圍繞Linux操作系統這樣一個基礎平臺,講解如何使用操作系統實現各種開源產品的應用案例。全書主要從運維工作中的應用服務入手,全面講解基本Linux操作系統以及各種軟體服務的運維工作。
現在的商業環境是一個充滿競爭的環境,很多企業的業務量在不斷地增長,而對服務質量的要求也越來越高。特別是互聯網企業為了滿足客戶非常高的需求,提升用戶使用體驗。IT部門維護的設備往往數以萬計,如此龐大的設備維護量,通常會讓IT管理人員頭疼不已。
本書介紹的自動化運維的內容可以讓我們快速掌握大規模批量處理的簡單方法。僅僅依靠自動化運維還不足以發揮出這些設備能效,因此,我們還需要將這個伺服器設備有機地結合在一起,為客戶提供安全、快捷、高效的服務,於是集群技術應運而生。本書後面將圍繞集群技術介紹目前比較流行的開源產品部署案例。
丁明一,領航眾達教育創始人,紅帽認證高級講師(RHCI),有著豐富的Linux系統運維以及講師經驗,培養學生兩千餘名。精通Linux系統管理、生產環境大規模集中部署Linux環境、建立Shell腳本自動化管理平臺。
主持部署多個LAMP網路服務平臺、構建管理多個大型NginxWeb服務平臺,項目實施中利用Cacti與Nagios監控平臺實現自動故障報警。對企業集群環境及高性能、高可用構架有深入的研究。
擁有豐富的虛擬化技術使用經驗:Xen、KVM、VMware,利用虛擬化技術構建高效、綠色節能機房。對安全與調優有獨特的理解,精通Linux防火牆、SELinux安全、系統性能調優化。翻譯過多篇國外雲計算解決方案文檔,熟悉國外主流雲計算技術發展。
智能運維:從0搭建大規模分散式AIOps系統
夠有所借鑒。同時,也能幫助運維工程師在一定程度上瞭解到機器學習的常見演算法模型,以及如何將它們應用到運維工作中。全書共分4篇。
第1篇運維發展史,將重點闡述當前運維的發展現狀及面臨的技術挑戰;第2篇智能運維基礎設施,將重點講述大數據場景下的數據存儲、大數據處理和分析的方法與經驗,以及海量數據多維度多指標的處理分析技術;第3篇智能運維技術詳解,將重點關註在新時期大數據時代下,如何進行智能化的運維體系建設;第4篇技術案例詳解,為大家梳理了通過開源框架ELK快速構建智能監控系統的整體方案,還將分享微博平臺和微博廣告兩個不同業務場景下智能監控系統的技術實踐。
作者簡介
彭冬:微博廣告基礎架構團隊負責人、技術專家,商業大數據平臺及智能監控平臺發起人,目前負責廣告核心引擎基礎架構、Hubble智能監控系統、商業基礎數據平臺(D )等基礎設施建設。
關註計算廣告、大數據、人工智慧、高可用系統架構設計、區塊鏈等方向。在加入微博之前,曾就職於百度負責大數據平臺建設,曾擔任趣點科技聯合創始人兼CTO等職位。畢業於西北工業大學,曾在國內外知名期刊發表多篇學術論文,擁有9項發明專利。
朱偉@kimi:微博廣告SRE團隊技術負責人,高級運維工程師,2016年4月加入微博,目前主要負責微博廣告智能監控報警平臺和服務治理等項目的建設與研究。
劉俊:微博平臺部監控技術負責人,負責微博平臺、PC微博大規模監控系統的建設,主要關註實時大數據、運維自動化、智能化方向。2014年加入微博,之前曾在新浪、搜狐等公司從事運維監控方面的工作。
王莉:University of Georgia碩士研究生,主要研究用機器學習方法,識別植物被水淹沒的季節性規律,研究成果已發表在SCI高影響因數期刊。2017年加入微博廣告團隊,致力於用數據分析和機器學習模型,優化廣告業務策略,洞悉商業價值。
陸鬆林:微博廣告數據倉庫負責人,高級研發工程師,先後就職於搜狐、愛奇藝,主要研究數據倉庫、數據治理相關技術。
車亞強:微博廣告大數據開發工程師,曾在百度外賣負責實時流、微服務相關研發工作,目前主要研究方向為實時流、微服務架構設計。