大數據常用技術棧一覽 —— GitHub 地址:https://github.com/heibaiying/BigData Notes ,主要技術棧如下: :black_nib: 前 言 1. "大數據常用技術棧思維導圖" 2. "大數據常用軟體安裝指南" 一、Hadoop 1. "分散式文件存儲系 ...
大數據常用技術棧一覽 —— GitHub 地址:https://github.com/heibaiying/BigData-Notes,主要技術棧如下:
✒️ 前 言
一、Hadoop
- 分散式文件存儲系統——HDFS
- 分散式計算框架——MapReduce
- 集群資源管理器——YARN
- Hadoop單機偽集群環境搭建
- Hadoop集群環境搭建
- HDFS常用Shell命令
- HDFS Java API的使用
- 基於Zookeeper搭建Hadoop高可用集群
二、Hive
- Hive簡介及核心概念
- Linux環境下Hive的安裝部署
- Hive CLI和Beeline命令行的基本使用
- Hive 常用DDL操作
- Hive 分區表和分桶表
- Hive 視圖和索引
- Hive常用DML操作
- Hive 數據查詢詳解
三、Spark
Spark Core :
Spark SQL :
Spark Streaming :
四、Storm
- Storm和流處理簡介
- Storm核心概念詳解
- Storm單機環境搭建
- Storm集群環境搭建
- Storm編程模型詳解
- Storm項目三種打包方式對比分析
- Storm集成Redis詳解
- Storm集成HDFS/HBase
- Storm集成Kafka
五、Flink
TODO
六、HBase
- Hbase 簡介
- HBase系統架構及數據結構
- HBase基本環境搭建(Standalone /pseudo-distributed mode)
- HBase集群環境搭建
- HBase常用Shell命令
- HBase Java API
- Hbase 過濾器詳解
- HBase 協處理器詳解
- HBase 容災與備份
- HBase的SQL中間層——Phoenix
- Spring/Spring Boot 整合 Mybatis + Phoenix
七、Kafka
八、Zookeeper
- Zookeeper 簡介及核心概念
- Zookeeper單機環境和集群環境搭建
- Zookeeper常用Shell命令
- Zookeeper Java 客戶端——Apache Curator
- Zookeeper ACL許可權控制
九、Flume
十、Sqoop
十一、Azkaban
十二、Scala
- Scala簡介及開發環境配置
- 基本數據類型和運算符
- 流程式控制制語句
- 數組——Array
- 集合類型綜述
- 常用集合類型之——List & Set
- 常用集合類型之——Map & Tuple
- 類和對象
- 繼承和特質
- 函數 & 閉包 & 柯里化
- 模式匹配
- 類型參數
- 隱式轉換和隱式參數