班級規模及環境--熱線:4008699035 手機:15921673576( 微信同號) |
每期人數限3到5人。 |
上課時間和地點 |
上課地點:【上海】:同濟大學(滬西)/新城金郡商務樓(11號線白銀路站) 【深圳分部】:電影大廈(地鐵一號線大劇院站)/深圳大學成教院 【北京分部】:北京中山學院/福鑫大樓 【南京分部】:金港大廈(和燕路) 【武漢分部】:佳源大廈(高新二路) 【成都分部】:領館區1號(中和大道) 【沈陽分部】:沈陽理工大學/六宅臻品 【鄭州分部】:鄭州大學/錦華大廈 【石家莊分部】:河北科技大學/瑞景大廈 【廣州分部】:廣糧大廈 【西安分部】:協同大廈
最近開課時間(周末班/連續班/晚班):2020年3月16日 |
實驗設備 |
☆資深工程師授課
☆注重質量
☆邊講邊練
☆合格學員免費推薦工作
★實驗設備請點擊這兒查看★ |
質量保障 |
1、培訓過程中,如有部分內容理解不透或消化不好,可免費在以后培訓班中重聽;
2、培訓結束后,授課老師留給學員聯系方式,保障培訓效果,免費提供課后技術支持。
3、培訓合格學員可享受免費推薦就業機會。 |
課程大綱 |
|
大數據培訓日程 課程目標: 通過該課程的學習,會對大數據離線計算、實時計算的企業級構架有清晰的理解以及對常用的成熟的大數據開源項目從原理到使用有深入的理解。 實時計算的項目常用組合為Flume(數據采集) + Kafka(高可用高并發分布式消息隊列) + spark streaming(流式計算) + hbase(分布式列式存儲數據庫,億級行百萬列毫秒級查詢) 離線計算項目常用組合為分布式文件存儲HDFS,資源調度器、分布式計算框架MapReduce、數據倉庫Hive。 課程大綱: 時間 主題 內容 第一天 上午 離線計算: Hadoop大數據生態圈、分布式存儲HDFS、資源管理 大數據生態圈介紹 開源相關項目說明以及每個項目的用途 實時計算整體構架詳解 離線計算整體構架詳解 分布式文件系統HDFS是什么 HDFS的體系結構 HDFS高可用集群原理詳解 HDFS如何使用 資源管理器介紹以及構架 資源管理器核心組件詳解 資源調度器詳解 下午 離線計算: Hadoop MapReduce&Hive 分布式計算MapReduce介紹 MapReduce整體流程 MapReduce實例 數據倉庫工具Hive介紹 Hive模型介紹:數據庫、表、分區、高級函數 Hive元數據介紹 第二天 上午 實時計算: 數據采集Flume、分布式消息隊列Kafka 實時計算整體構架設計 Flume是什么以及體系結構介紹 Flume組件介紹:agent、source、channel、sink Flume高可用拓撲介紹 Kafka體系結構詳解 Kafka核心概念 Kafka高可用高并發原理 Kafka生產者消費者 Flume寫入kafka 下午 實時計算: spark streaming流式計算、HBase分布式列存儲 spark是什么以及體系結構 彈性分布式數據集RDD spark streaming流式計算體系結構 spark steaming讀取kafka spark算子詳解 HBase存儲數據庫體系結構 Hbase的高可用 HBase數據模型詳解 HBase毫秒級查詢
|

|