Scala當中什麼是RDD(Resilient Distributed Datasets)彈性分散式數據集 ...
RDD(Resilient Distributed Datasets)彈性分散式數據集。你不好理解的話,可以把RDD就可以看成是一個簡單的"動態數組"(比如ArrayList),對其操作,也只需要 調用它的方法而已,和java中的ArrayList一樣。但它與一般動態數組的區別在於:RDD是分佈的。彈性是指的是數據自動在記憶體和磁碟切換, task如果失敗會進行特定次數的重試。如果在某個節點發生錯誤,RDD會自動在不同的節點中重試。
文章轉載自原文:https://blog.csdn.net/qq_44596980/article/details/93308230