
Hadoop基礎模塊—Linux基礎培訓
Linux
Linux簡介
通過本模塊理論結合實踐的學習,讓學員對能夠:
(1)掌握Linux的基礎知識,
(2)熟練掌握Linux常用Shell命令、文本編輯工具,
(3)熟練掌握Linux的安裝、部署、用戶和權限等知識,
(4)熟練掌握基本的性能調試、網絡相關的命令。
Linux
基礎知識
Linux 安裝部署
Hadoop常規模塊
Hadoop運維——Hadoop
Hadoop簡介
通過本模塊理論結合實踐的學習,讓學員對能夠:
(1)掌握Hadoop基本原理、架構和核心組件
(2)熟練掌握Hadoop的分布式安裝、部署過程和基本的運維方法
Hadoop安裝部署
Hadoop運維
Hadoop核心組件——HDFS
HDFS簡介、HDFS分布式文件系統原理和體系結構
通過本模塊理論結合實踐的學習,讓學員對能夠:
(1)深刻理解HDFS的工作原理和常用命令
HDFS的I/0基本操作 、HDFS常用Java API詳解
HDFS中的輸入輸出與讀寫數據流、WebHDFS詳解
HDFS中的常用的重要的文件存儲結構
HDFS I/0操作和讀寫工作原理 、HDFS數據壓縮機制與程序實現
HDFS集群資源管理技術精講
Hadoop核心組件——MapReduce
MapReduce基礎知識
通過本模塊理論結合實踐的學習,讓學員對能夠:
(1)深刻理解MapReduce計算模型的原理和架構
(2)掌握MapReduce編程開發和技巧
MapReduce原理
MapReduce編程
YARN平臺
離線分析
Hive基礎知識
通過本模塊理論結合實踐的學習,讓學員對能夠:
(1)掌握數據倉庫和分析工具Hive的基本架構和使用方法,能夠熟練的搭建數據倉庫并進行離線數據分析需求開發
(2)掌握從RDBMS到Hadoop的導入工具Sqoop的使用
(3)掌握如何使用Azkaban構建自己的工作流
Hive使用
Sqoop/Azkaban詳解
實時計算
HBase詳解
通過本模塊理論結合實踐的學習,讓學員對能夠:
(1)理解海量數據實時處理的基本概念和開源產品、框架
(2)掌握列式數據庫HBase的概念、架構、安裝部署和基本的API訪問編程
(3)掌握使用HBase進行表結構設計的方法和技巧
(4)掌握實時流框架Storm的概念、架構、安裝部署和編程
(5)掌握實時計算系統的基本設計理念和設計方法
(6)掌握日志收集系統Flume等的架構、安裝部署
ZooKeeper詳解
Storm介紹
Storm安裝
Flume介紹與使用
實戰項目
案例實戰(離線、實時2個不同項目)
通過本模塊理論結合實踐的學習,讓學員對能夠:
(1)鞏固之前學習Hadoop知識
(2)實戰中提高實操技能以達到企業用人標準
(3)檢驗之前學習中的不足,并根據不足制定復習計劃
Hadoop模塊
數據可視化方向
大數據可視化技術
通過本模塊理論結合實踐的學習,讓學員對能夠:
(1)掌握前端可視化相關技術,如、R語言等技術的簡單實用
(2)掌握大數據中數據可視化的基本理念和實現方法
交互式計算Spark
Scala基礎編程
Spark簡介和安裝部署
Spark核心機制
通過本模塊理論結合實踐的學習,讓學員對能夠:
(1)掌握Scala編程技術的簡單使用
(2)掌握Spark框架的概念、架構、核心機制和使用
數據挖掘方向
Mahout簡介
Mahout經典算法講解
通過本模塊理論結合實踐的學習,讓學員對能夠:
(1)通過學習Mahout了解數據挖掘、機器學習的相關算法基于Hadoop的實現
(2)理解算法并行化實現(基于Hadoop)的流程和方法