班級規模及環境--熱線:4008699035 手機:15921673576( 微信同號) |
每期人數限3到5人。 |
上課時間和地點 |
上課地點:【上海】:同濟大學(滬西)/新城金郡商務樓(11號線白銀路站) 【深圳分部】:電影大廈(地鐵一號線大劇院站)/深圳大學成教院 【北京分部】:北京中山學院/福鑫大樓 【南京分部】:金港大廈(和燕路) 【武漢分部】:佳源大廈(高新二路) 【成都分部】:領館區1號(中和大道) 【沈陽分部】:沈陽理工大學/六宅臻品 【鄭州分部】:鄭州大學/錦華大廈 【石家莊分部】:河北科技大學/瑞景大廈 【廣州分部】:廣糧大廈 【西安分部】:協同大廈
最近開課時間(周末班/連續班/晚班):2020年3月16日 |
實驗設備 |
☆資深工程師授課
☆注重質量
☆邊講邊練
☆合格學員免費推薦工作
★實驗設備請點擊這兒查看★ |
質量保障 |
1、培訓過程中,如有部分內容理解不透或消化不好,可免費在以后培訓班中重聽;
2、培訓結束后,授課老師留給學員聯系方式,保障培訓效果,免費提供課后技術支持。
3、培訓合格學員可享受免費推薦就業機會。 |
課程大綱 |
目標收益
本課程將為大家全面而又深入的介紹大數據平臺的構建流程,涉及分布式數據收集,大數據存儲,資源管理及分布式計算框架等。本課程重點以Hadoop和Spark兩大生態系統作為基準進行介紹,涉及Flume, HDFS, Hbase,YARN,MapReduce,Hive, Zookeeper, Spark,Storm,Spark Streaming等主流的大數據開源系統架構及應用經驗。
培訓對象
各類 IT/軟件企業和研發機構的軟件架構師、軟件設計師、程序員。對于懷有設計疑問和問題,需要梳理解答的團隊和個人,效果最佳。
學員基礎
了解Java語言、Linux系統;
課程大綱
主題內容
大數據架構概述1.1 大數據層級架構及各層軟件設計要求,包括數據收集、存儲、計算框、應用
1.2 Hadoop生態系統概述以及版本演化,并給出版本選擇建議。
1.3 Spark生態系統概述及其特點,并與Hadoop對比
數據收集系統Flume與Sqoop2. 使用flume和sqoop兩個系統將外部流式數據(比如網站日志,用戶行為數據等)、關系型數據庫(比如MySQL、Oracle等)中的數據導入Hadoop中進行分析和挖掘
大數據存儲系統HDFS與HBase3.1與HDFS 1.0進行對比介紹2.0原理、特性與基本架構(快照、緩存、異構存儲)。
3.2 HBase原理,基本架構與案例分析
3.3 HBase應用場景、原理和架構,典型應用案例(互聯網、銀行)
集群資源管理與調度系統4. 介紹 YARN應用場景、基本架構與資源調度
Zookeeper部署及典型應用5. 介紹Zookeeper是什么,基本原理及在應用
大數據計算平臺介紹主流的三大類大數據計算框架,分別是批處理、交互式計算和流式計算框架,并選取當下主流的開源實現進行介紹。
6.1 批處理計算框架
(1)MapReduce 2.0基本原理與架構、程序編寫(使用java、C++、php語言)。
(2)數據分析系統Hive與Pig應用與比較,如何使用其中的海量數據
(3)Spark計算框架,背景及應用案例
6.2 交互式計算框架,Impala和presto應用場景,基本架構和典型應用案例
6.3 流式/實時計算框架,storm、Spark Streaming基本架構特點,及應用案例
數據挖掘與機器學習庫7. Mahout與MLlib兩個主流的分布式數據挖掘與機器學習庫的實現以及應用案例。 |
|
|
|
|
|
|