大數據常用技術棧一覽

来源:https://www.cnblogs.com/danrenying/archive/2019/07/07/11145101.html
-Advertisement-
Play Games

大數據常用技術棧一覽 —— GitHub 地址:https://github.com/heibaiying/BigData Notes ,主要技術棧如下: :black_nib: 前 言 1. "大數據常用技術棧思維導圖" 2. "大數據常用軟體安裝指南" 一、Hadoop 1. "分散式文件存儲系 ...


大數據常用技術棧一覽 —— GitHub 地址:https://github.com/heibaiying/BigData-Notes,主要技術棧如下:

✒️ 前 言

  1. 大數據常用技術棧思維導圖
  2. 大數據常用軟體安裝指南

一、Hadoop

  1. 分散式文件存儲系統——HDFS
  2. 分散式計算框架——MapReduce
  3. 集群資源管理器——YARN
  4. Hadoop單機偽集群環境搭建
  5. Hadoop集群環境搭建
  6. HDFS常用Shell命令
  7. HDFS Java API的使用
  8. 基於Zookeeper搭建Hadoop高可用集群

二、Hive

  1. Hive簡介及核心概念
  2. Linux環境下Hive的安裝部署
  3. Hive CLI和Beeline命令行的基本使用
  4. Hive 常用DDL操作
  5. Hive 分區表和分桶表
  6. Hive 視圖和索引
  7. Hive常用DML操作
  8. Hive 數據查詢詳解

三、Spark

Spark Core :

  1. Spark簡介
  2. Spark開發環境搭建
  3. 彈性式數據集RDD
  4. RDD常用運算元詳解
  5. Spark運行模式與作業提交
  6. Spark累加器與廣播變數
  7. 基於Zookeeper搭建Spark高可用集群

Spark SQL :

  1. DateFrame 和 DataSet
  2. Structured API的基本使用
  3. Spark SQL外部數據源
  4. Spark SQL常用聚合函數
  5. Spark SQL JOIN 操作

Spark Streaming :

  1. Spark Streaming 簡介
  2. Spark Streaming 基本操作
  3. Spark Streaming 整合 Flume
  4. Spark Streaming 整合 Kafka

四、Storm

  1. Storm和流處理簡介
  2. Storm核心概念詳解
  3. Storm單機環境搭建
  4. Storm集群環境搭建
  5. Storm編程模型詳解
  6. Storm項目三種打包方式對比分析
  7. Storm集成Redis詳解
  8. Storm集成HDFS/HBase
  9. Storm集成Kafka

TODO

六、HBase

  1. Hbase 簡介
  2. HBase系統架構及數據結構
  3. HBase基本環境搭建(Standalone /pseudo-distributed mode)
  4. HBase集群環境搭建
  5. HBase常用Shell命令
  6. HBase Java API
  7. Hbase 過濾器詳解
  8. HBase 協處理器詳解
  9. HBase 容災與備份
  10. HBase的SQL中間層——Phoenix
  11. Spring/Spring Boot 整合 Mybatis + Phoenix

七、Kafka

  1. Kafka 簡介
  2. 基於Zookeeper搭建Kafka高可用集群
  3. Kafka 生產者詳解
  4. Kafka 消費者詳解
  5. 深入理解Kafka副本機制

八、Zookeeper

  1. Zookeeper 簡介及核心概念
  2. Zookeeper單機環境和集群環境搭建
  3. Zookeeper常用Shell命令
  4. Zookeeper Java 客戶端——Apache Curator
  5. Zookeeper ACL許可權控制

九、Flume

  1. Flume簡介及基本使用
  2. Linux環境下Flume的安裝部署
  3. Flume整合Kafka

十、Sqoop

  1. Sqoop簡介與安裝
  2. Sqoop的基本使用

十一、Azkaban

  1. Azkaban簡介
  2. Azkaban3.x 編譯及部署
  3. Azkaban Flow 1.0 的使用
  4. Azkaban Flow 2.0 的使用

十二、Scala

  1. Scala簡介及開發環境配置
  2. 基本數據類型和運算符
  3. 流程式控制制語句
  4. 數組——Array
  5. 集合類型綜述
  6. 常用集合類型之——List & Set
  7. 常用集合類型之——Map & Tuple
  8. 類和對象
  9. 繼承和特質
  10. 函數 & 閉包 & 柯里化
  11. 模式匹配
  12. 類型參數
  13. 隱式轉換和隱式參數

十三、公共內容

  1. 大數據應用常用打包方式


您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • 1.前言 記得從上大學的時候就已經聽說過這個詞語 以前的理解可能就是數據量超大很多嘛 到這幾年大數據這個詞語被人們談論得也越來越頻繁 也越來越想瞭解它的所以自己才會去學習 我覺得做任何事之前肯定有某種驅使你去瞭解它的過程 以下僅是自己個人的理解 2.什麼是大數據? 大數據不僅是數據量大 (G,TB, ...
  • 1.Redis伺服器 can not get resource from pool. 1000個線程併發還能跑,5000個線程的時候出現這種問題,查後臺debug日誌,發現redis 線程池不夠。剛開始設置的是: 順便也改了一下jdbc 的連接池參數,最大空閑和最大連接數都改成1000.在測一下。可 ...
  • SQL中的連接 關係型資料庫的核心之一就是連接, 而在不同的標準中, 連接的寫法上可能有區別, 最為主要的兩個SQL標準就是SQL92和SQL99了, 後面的數字表示的是標準提出的時間. SQL92中的連接 案例使用的表是球員表, 球隊表和身高級別表, 下載: 笛卡爾積 笛卡爾積是一個數學運算, 假 ...
  • 子查詢 子查詢就是嵌套在查詢中的查詢, 目的是為了進行更複雜的查詢, 同時可以理解查詢的過程. 子查詢也分為兩種, 一種是關聯子查詢, 一種是非關聯子查詢. 關聯子查詢與非關聯子查詢 子查詢的劃分是依據了子查詢是否執行多次來進行劃分的. 子查詢從數據表中查詢數據結果, 如果這個數據結果只執行一次, ...
  • 1.MySQL資料庫安裝與配置 1.1 資料庫安裝和配置 安裝需要註意的地方: 典型安裝:安裝最常用的特性組件,會預設安裝至C盤目錄下,適合大部分開發者。 自定義安裝:可以自定義安裝目錄,自定義選擇安裝所需要的組件,安裝過程可控。 完全安裝:會安裝MySQL所有服務及特性,占用磁碟空間大。 配置需要 ...
  • 《SQL Server溫故系列》之增刪改查,CRUD,查詢語句,SELECT。顧名思義,SELECT 語句的作用就是從表中查詢數據。查詢語句一次可以從一個或多個表中檢索一個或多個欄位的一行或多行。SELECT 是 SQL 中最常用的一個語句,完整的 SELECT 語法是非常複雜的,本文將先對簡單查詢... ...
  • 利用mapWithState運算元實現有狀態的wordCount,且按照word的第一個字母為key,但是要求輸出的格式為(word,1)這樣形式的結果 ...
  • SQL的函數 函數就是將我們經常使用的代碼封裝起來, 需要的時候直接調用, 提高代碼效率和可維護性. SQL函數一般是在數據上執行, 可以方便地轉換和處理數據. 常用的SQL函數 SQL提供了一些常用的內置函數, 也可以自定義, 內置的函數分為四類: 算數函數 字元串函數 日期函數 轉換函數 算數函 ...
一周排行
    -Advertisement-
    Play Games
  • 移動開發(一):使用.NET MAUI開發第一個安卓APP 對於工作多年的C#程式員來說,近來想嘗試開發一款安卓APP,考慮了很久最終選擇使用.NET MAUI這個微軟官方的框架來嘗試體驗開發安卓APP,畢竟是使用Visual Studio開發工具,使用起來也比較的順手,結合微軟官方的教程進行了安卓 ...
  • 前言 QuestPDF 是一個開源 .NET 庫,用於生成 PDF 文檔。使用了C# Fluent API方式可簡化開發、減少錯誤並提高工作效率。利用它可以輕鬆生成 PDF 報告、發票、導出文件等。 項目介紹 QuestPDF 是一個革命性的開源 .NET 庫,它徹底改變了我們生成 PDF 文檔的方 ...
  • 項目地址 項目後端地址: https://github.com/ZyPLJ/ZYTteeHole 項目前端頁面地址: ZyPLJ/TreeHoleVue (github.com) https://github.com/ZyPLJ/TreeHoleVue 目前項目測試訪問地址: http://tree ...
  • 話不多說,直接開乾 一.下載 1.官方鏈接下載: https://www.microsoft.com/zh-cn/sql-server/sql-server-downloads 2.在下載目錄中找到下麵這個小的安裝包 SQL2022-SSEI-Dev.exe,運行開始下載SQL server; 二. ...
  • 前言 隨著物聯網(IoT)技術的迅猛發展,MQTT(消息隊列遙測傳輸)協議憑藉其輕量級和高效性,已成為眾多物聯網應用的首選通信標準。 MQTTnet 作為一個高性能的 .NET 開源庫,為 .NET 平臺上的 MQTT 客戶端與伺服器開發提供了強大的支持。 本文將全面介紹 MQTTnet 的核心功能 ...
  • Serilog支持多種接收器用於日誌存儲,增強器用於添加屬性,LogContext管理動態屬性,支持多種輸出格式包括純文本、JSON及ExpressionTemplate。還提供了自定義格式化選項,適用於不同需求。 ...
  • 目錄簡介獲取 HTML 文檔解析 HTML 文檔測試參考文章 簡介 動態內容網站使用 JavaScript 腳本動態檢索和渲染數據,爬取信息時需要模擬瀏覽器行為,否則獲取到的源碼基本是空的。 本文使用的爬取步驟如下: 使用 Selenium 獲取渲染後的 HTML 文檔 使用 HtmlAgility ...
  • 1.前言 什麼是熱更新 游戲或者軟體更新時,無需重新下載客戶端進行安裝,而是在應用程式啟動的情況下,在內部進行資源或者代碼更新 Unity目前常用熱更新解決方案 HybridCLR,Xlua,ILRuntime等 Unity目前常用資源管理解決方案 AssetBundles,Addressable, ...
  • 本文章主要是在C# ASP.NET Core Web API框架實現向手機發送驗證碼簡訊功能。這裡我選擇是一個互億無線簡訊驗證碼平臺,其實像阿裡雲,騰訊雲上面也可以。 首先我們先去 互億無線 https://www.ihuyi.com/api/sms.html 去註冊一個賬號 註冊完成賬號後,它會送 ...
  • 通過以下方式可以高效,並保證數據同步的可靠性 1.API設計 使用RESTful設計,確保API端點明確,並使用適當的HTTP方法(如POST用於創建,PUT用於更新)。 設計清晰的請求和響應模型,以確保客戶端能夠理解預期格式。 2.數據驗證 在伺服器端進行嚴格的數據驗證,確保接收到的數據符合預期格 ...