現如今每個公司都有自己的大數據平臺和大數據團隊,可以看出大數據建設在公司的重要地位,不管是用於做數據分析、BI還是做用於機器學習、人工智慧等領域,大數據都是基礎,海量數據成為了互聯網公司的重要資產。 今天這一份書單,我們將推薦幾本綜合介紹大數據平臺和技術棧的優質書籍,幫各位對大數據技術感興趣的小 ...
現如今每個公司都有自己的大數據平臺和大數據團隊,可以看出大數據建設在公司的重要地位,不管是用於做數據分析、BI還是做用於機器學習、人工智慧等領域,大數據都是基礎,海量數據成為了互聯網公司的重要資產。
今天這一份書單,我們將推薦幾本綜合介紹大數據平臺和技術棧的優質書籍,幫各位對大數據技術感興趣的小伙伴快速入門和學習大數據。
大數據技術棧系列書單
大數據技術原理與應用
(1) 概念篇:介紹當前緊密關聯的*新IT領域技術雲計算、大數據和物聯網。
(2) 大數據存儲與管理篇:介紹分散式數據存儲的概念、原理和技術,包括HDFS、HBase、NoSQL資料庫、雲資料庫。
(3) 大數據處理與分析篇:介紹MapReduce分散式編程框架、基於記憶體的分散式計算框架Spark、圖計算、流計算、數據可視化。
(4) 大數據應用篇:介紹基於大數據技術的推薦系統。
作者簡介
林子雨,北大博士,廈門大學電腦科學系老師,中國高校**"數字教師"的提出者和建設者。在資料庫、數據倉庫、數據挖掘、大數據、雲計算和物聯網等領域有著十多年的知識積累,對各個領域知識都有比較深入的瞭解,有比較寬泛的視野。
大數據平臺基礎架構指南
當前不乏大數據具體技術組件的書籍,但卻很少有從大數據平臺整體建設和產品形態的巨集觀角度入手來闡釋的。
本書重點介紹大數據開發平臺服務構建的整體思路和解決方案,內容涵蓋一個成熟的大數據開發平臺必不可少的各類核心組件:工作流調度系統、集成開發環境、元數據管理系統、數據交換服務、數據可視化服務、數據質量管理服務,以及測試環境的建設等。
書中還凝結了作者多年平臺建設的實踐經驗,以及對大數據相關從業人員能力建設和職業規劃的寶貴建議。本書適合廣大志在深入瞭解大數據平臺建設、開發和應用的在職人員及院校師生。
作者簡介
劉旭暉,花名天火,蘑菇街數據平臺資深架構師,負責蘑菇街大數據服務平臺整體產品規劃和架構設計工作;此前多年供職於Intel開源技術中心,是Spark/Hadoop/HBase/Phoenix等開源項目貢獻者;在內核驅動、操作系統中間件、輸入法、瀏覽器等方向均有多年開發經驗。
大數據架構詳解:從數據獲取到深度學習
本書從架構、業務、技術三個維度深入淺出地介紹了大數據處理領域端到端的知識。主要內容包括三部分:第一部分從數據的產生、採集、計算、存儲、消費端到端的角度介紹大數據技術的起源、發展、關鍵技術點和未來趨勢,結合生動的業界新產品,以及學術界新的研究方向和成果,讓深奧的技術淺顯易懂;第二部分從業務和技術角度介紹實際案例,讓讀者理解大數據的用途及技術的本質;第三部分介紹大數據技術不是孤立的,講解如何與前沿的雲技術、深度學習、機器學習等相結合。
作者簡介
朱潔,2008年加入華為,具有8年大數據研發管理經驗,現任華為大數據服務首席規劃師。專註於大數據服務平臺建設、規劃和實踐應用,同時參與多項企業級大數據項目解決方案的規劃、設計和實施工作,在深化大數據行業落地方面有諸多實踐經驗,對解讀大數據垂直行業的技術創新與開發有諸多獨到的見解和心得。
羅華霖,2002年加入華為,華為大數據首席規劃師,主導完成華為大數據平臺DataSight和華為電信大數據解決方案SmartCare技術規劃和架構設計,支持電信運營商數字化戰略轉型,完成浙江移動、上海聯通、沙特STC等200+電信大數據解決方案項目落地。曾任華為軟交換首席設計師,華為大型電信大數據解決方案SmartCare首席架構師。