Spark入門到精通--（第一節）Spark的前世今生

-Advertisement-

最近由於公司慢慢往spark方面開始轉型，本人也開始學習，今後陸續會更新一些spark學習的新的體會，希望能夠和大家一起分享和進步。 Spark是什麼？ Apache Spark™ is a fast and general engine for large-scale data processin ...

　　最近由於公司慢慢往spark方面開始轉型，本人也開始學習，今後陸續會更新一些spark學習的新的體會，希望能夠和大家一起分享和進步。

Spark是什麼？

　　Apache Spark™ is a fast and general engine for large-scale data processing.（官方說法）

　　Spark，簡單的說是一種通用的大數據計算框架。

　　包含了常見領域的各種框架：核心組件-Spark Core、互動式查詢-Spark SQL、準實時流式計算-Spark Streaming、機器學習-Spark MLlib、圖計算-Spark GraphX。

Spark與Hadoop的關係

　　很多人說Spark可以替換Hadoop，這顯然是錯的。Spark是基於Hadoop的，即Spark主要用於大數據的計算，而Hadoop由於計算方面採用MapReduce的方式，多次反覆讀寫磁碟，使得速度遠遠不如Spark快，所以Hadoop以後會用於大數據的存儲（HDFS、Hive、HBase等）和資源調度（Yarn）。

　　Spark本身不具備存儲功能，未來Spark+Hadoop的組合是一套完整的解決方案。

　　Spark可以替換MapReduce的計算框架、Spark SQL可以替換Hive的查詢框架，但並沒有Hive作為數據倉庫的功能，所以只是部分替換。

您的分享是我們最大的動力!

-Advertisement-

更多相關文章

【Python開發實戰】Windows7+VirtualBox+Ubuntu環境配置

1. VirtualBox的安裝參考常規安裝方式即可。 VirtualBox 4.3.14 for Windows hosts：http://download.virtualbox.org/virtualbox/4.3.14/VirtualBox-4.3.14-95030-Win.exe 2. U ...
解決wampserver3.0.4遠程不能訪問問題

在windows2008伺服器上安裝wampserver3.0.4集成環境，預設卻是無法遠程訪問，如果要遠程訪問需要修改apache的配置文件httpd.conf,修改如下： <Directory "D:/wamp64/www/"> # # Possible values for the Optio ...
Java學習筆記（1）：註釋規範

註釋規範 1、類註釋在每個類前面必須加上類註釋，註釋模板如下： 2、屬性註釋在每個屬性前面必須加上屬性註釋，註釋模板如下： 3、方法註釋在每個方法前面必須加上方法註釋，註釋模板如下： 4、構造方法註釋在每個構造方法前面必須加上註釋，註釋模板如下： 5、方法內部註釋在方法內部使用單 ...
函數指針、回調函數、系統調用區別

函數指針、回調函數、系統調用區別1.函數指針 2.回調函數體現: 1.函數名作為參數傳遞給調用函數。 2.將調用者和被調函數分開，回調函數實現具體的功能，調用者無需關註實現的具體細節。3.系統調用系統調用 --> (0x80)軟中斷(系統調用表) --> 內核函數 --> 返回到系統調用層 rea ...
遞歸的一些應用（二）無限極分類

用遞歸的方法實現無限極分類通常我在寫項目的時候，在寫一些例如商城分類的時候會實現對應分類的上級分類，或者其它項目部門管理的上級部門的時候一般就會用到無限極分類來進行分類第一步：首先在數據表設計的時候，如果要實現無限極分類，一般我會在數據表多添加一個欄位pid,下麵我通過一張新建的數據表來說明一下 ...
ajax跨域往php程式post數據時，php程式總是執行兩次的解決方法

php程式是部署在IIS7上面，ajax提交數據時，遇到了兩個問題，一個就是跨域，一個php程式總會被執行兩次。第一個問題的解決方法，是百度出來的，添加下麵幾行代碼就可以了： header('Access-Control-Allow-Origin:*'); header("Access-Contr ...
Linux C lock pages

虛擬記憶體按頁劃分，我們可以明確告訴系統：某一個虛擬記憶體頁需要和實際記憶體幀相關聯。這樣一來，該記憶體頁就被換進來了，而且不會被系統換出去。這一行為叫做鎖頁（locking a page）。一般來講頁的換進換出是透明的，一般程式接觸不到這一層。但是呢，鎖頁可以為我們帶來如下好處： 1、速度：如果你的程式 ...
遞歸的一些應用（一）遍歷文件夾

函數的遞歸調用遞歸的含義遞歸其實也只是一種演算法上的描述，不是一種新的語法！有時候，我們解決問題的時候，會遇到這種情況，當我們把一個大的問題按照某種解決方案分成若幹個小的問題的時候，發現這些小問題的解決方案其實和剛纔大問題的解決方案又是一樣的！典型的，比如：求階乘！ 10！ = 10 * 9！ ...