班級規模及環境--熱線:4008699035 手機:15921673576( 微信同號) |
每期人數限3到5人。 |
上課時間和地點 |
上課地點:【上海】:同濟大學(滬西)/新城金郡商務樓(11號線白銀路站) 【深圳分部】:電影大廈(地鐵一號線大劇院站)/深圳大學成教院 【北京分部】:北京中山學院/福鑫大樓 【南京分部】:金港大廈(和燕路) 【武漢分部】:佳源大廈(高新二路) 【成都分部】:領館區1號(中和大道) 【沈陽分部】:沈陽理工大學/六宅臻品 【鄭州分部】:鄭州大學/錦華大廈 【石家莊分部】:河北科技大學/瑞景大廈 【廣州分部】:廣糧大廈 【西安分部】:協同大廈
最近開課時間(周末班/連續班/晚班):2020年3月16日 |
實驗設備 |
☆資深工程師授課
☆注重質量
☆邊講邊練
☆合格學員免費推薦工作
★實驗設備請點擊這兒查看★ |
質量保障 |
1、培訓過程中,如有部分內容理解不透或消化不好,可免費在以后培訓班中重聽;
2、培訓結束后,授課老師留給學員聯系方式,保障培訓效果,免費提供課后技術支持。
3、培訓合格學員可享受免費推薦就業機會。 |
課程大綱 |
|
- Spark培訓——提高云計算大數據速度
?
Spark培訓——提高云計算大數據速度
培訓內容:
第一部分:
1、Spark的架構設計
1.1?Spark的速度為什么如此的快?
1.2?Spark的架構設計剖析
1.3?RDD計算流程解析
1.4?Spark的出色容錯機制
2、實戰使用三種語言開發Spark
2.1?Scala簡介、為什么Spark會使用Scala作為開發語言?
2.2?在Spark中使用Scala
2.3?使用Java開發Spark程序
2.4?使用Python開發Spark程序
2.5?深入使用Spark?Shell
3、快速掌握Scala
3.1?Scala變量聲明、操作符、函數的使用實戰
3.2?apply方法
3.3?Scal的控制結構和函數
3.4?Scala數組的操作、Map的操作
3.5?Scala中的類
3.6?Scala中對象的使用;
3.7?Scala中的繼承
3.8?Scala中的特質
3.9?Scala中集合操作
4、Spark集群的安裝和設置
4.1?在一臺機器上運行Spark
4.2?在EC2上運行Spark
4.3?在Mesos上部署Spark
4.4?在YARN上部署Spark
4.5?通過SSH在眾多機器上部署Spark
4.6?Spark集群設置
5、編寫Spark程序
5.1?程序數據的來源:File、HDFS、HBase、S3等
5.2?IDE環境構建
5.3?Maven
5.4?sbt.
5.5?編寫并部署Spark程序的實例
第二部分
6、SparkContext解析和數據加載以及存儲
6.1?源碼剖析SparkContext
6.2?Scala、Java、Python使用SparkContext
6.4?加載數據成為RDD
6.5?把數據物化
7、深入實戰RDD
7.1?DAG
7.2?深入實戰各種Scala?RDD?Function?
7.3?Spark?Java?RDD?Function
7.4?RDD的優化問題
8、Shark的原理和使用
8.1?Shark與Hive
8.2?安裝和配置Shark
8.3?使用Shark處理數據
8.4?在Spark程序中使用Shark?Queries
8.5?SharkServer
8.6?思考Shark架構
9、Spark程序的測試
9.1?編寫可測試的Spark程序
9.2?Spark測試框架解析
9.3?Spark測試代碼實戰
10、Spark的優化
10.1?Logs
10.2?并發
10.3?內存
10.4?垃圾回收
10.5?序列化
10.6?安全
第三部分
11、Spark的機器學習
11.1?LinearRegression
11.2?K-Means
11.3?Collaborative?Filtering
12、Spark的圖計算GraphX
12.1?Table?Operators
12.2?Graph?Operators
12.3?GraphX
13、Spark?SQL
13.1?Parquet支持
13.2?DSL
13.3?SQL?on?RDD
14、Spark實時流處理
14.1?DStream
14.2?transformation
14.3?checkpoint
14.4?性能優化
?
?
?
?
"
|