
hadoop數據倉庫培訓
Hadoop數據倉庫概述
1.hadoop數據倉庫與傳統倉庫區別
2. hadoop數據倉庫架構
3. hadoop數據倉庫關鍵模塊
數據接入與存儲、數據加工,數據建模,數據分析及可視化等模塊
4. hadoop倉庫關鍵點
數據質量把控
數據模型選擇
OLAP引擎選擇
Hadoop數據倉庫:數據接入與存儲模塊
1. 數據接入模塊關鍵技術
講解sqoop,flume,kafka以及databus等常用開源技術以及它們對應的應用場景
2. 數據存儲模塊關鍵技術
講解hdfs(不同存儲格式及壓縮格式對性能的影響)、hbase、kudu、hive等開源技術以及它們對應的應用場景
Hadoop數據倉庫:數據加工模塊
數據加工模塊關鍵技術
講解spark/hive及spark streaming相關技術以及對應應用場景
Hadoop數據倉庫:數據建模
1. 1. Hadoop數據模型
涉及原始表,聚集表以及cube等
涉及元信息管理系統hive metastore
2. 數據模型選擇原則
Hadoop數據倉庫:數據分析
計算引擎的分類及對應應用場景
涉及hive,presto/impala以及kylin三類系統以及對應應用場景
Hadoop數據倉庫:數據可視化
1. 自研系統
C3,Echarts等
2. 商業系統
tableau等
Hadoop數據倉庫實例:某互聯網公司TB及數據倉庫構建案例
1. 項目背景
2. 系統架構
3. 關鍵技術點和特色