班級規模及環境--熱線:4008699035 手機:15921673576( 微信同號) |
每期人數限3到5人。 |
上課時間和地點 |
上課地點:【上海】:同濟大學(滬西)/新城金郡商務樓(11號線白銀路站) 【深圳分部】:電影大廈(地鐵一號線大劇院站)/深圳大學成教院 【北京分部】:北京中山學院/福鑫大樓 【南京分部】:金港大廈(和燕路) 【武漢分部】:佳源大廈(高新二路) 【成都分部】:領館區1號(中和大道) 【沈陽分部】:沈陽理工大學/六宅臻品 【鄭州分部】:鄭州大學/錦華大廈 【石家莊分部】:河北科技大學/瑞景大廈 【廣州分部】:廣糧大廈 【西安分部】:協同大廈
最近開課時間(周末班/連續班/晚班):2020年3月16日 |
實驗設備 |
◆課時: 共5 部份,30學時
☆注重質量
☆邊講邊練
☆合格學員免費推薦工作
★實驗設備請點擊這兒查看★ |
質量保障 |
1、培訓過程中,如有部分內容理解不透或消化不好,可免費在以后培訓班中重聽;
2、培訓結束后,授課老師留給學員聯系方式,保障培訓效果,免費提供課后技術支持。
3、培訓合格學員可享受免費推薦就業機會。 |
大綱 |
|
1)scala解釋器、變量、常用數據類型等 2)scala的條件表達式、輸入輸出、循環等控制結構 3)scala的函數、默認參數、變長參數等 4)scala的數組、變長數組、多維數組等 5)scala的映射、元組等操作 6)scala的類,包括bean屬性、輔助構造器、主構造器等 7)scala的對象、單例對象、伴生對象、擴展類、apply方法等 8)scala的包、引入、繼承等概念 9)scala的特質 10)scala的操作符 11)scala的高階函數 12)scala的集合 13)scala數據庫連接
五、Spark2.0 core大數據編程 1)Spark2.0介紹 2)Spark應用場景 3)Spark和Hadoop MR、Storm的比較和優勢 4)RDD 5)Transformation 6)Action 7)Spark計算PageRank 8)Lineage 9)Spark模型簡介 10)Spark緩存策略和容錯處理 11)寬依賴與窄依賴 12)Spark配置講解 13)Spark集群搭建 14)集群搭建常見問題解決 15)Spark原理核心組件和常用RDD 16)數據本地性 17)任務調度 18)DAGScheduler 19)TaskScheduler 20)Spark源碼解讀 21)性能調優 22)Spark和Hadoop2.x整合:Spark on Yarn原理 23) Spark Core核心編程 24)RDD內核架構概覽 25)RDD的不同數據來源的創建方式詳解 26)RDD的操作算子綜述與本質分析(轉換算子、行動算子) 27)常用操作算子的案例實戰 28)RDD持久化實戰以及Checkpoint 29)RDD共享變量以及累加器的使用實戰
30)RDD簡單排序功能(優化之前WordCount程序)以及二次排序的實戰
31)Spark實戰Top N功能詳解 32)Spark任務調度流程整體架構分析詳解 33)Spark任務劃分流程整體架構分析詳解(寬依賴與窄依賴、DAGScheduler源碼分析)
34)Spark執行任務相關原理以及源碼分析(TaskScheduler、Executor、Task、Shuffle)
35)Spark實戰之PageRank 36)性能優化與調優的分析
六、 Spark SQL 1.Spark RDD應用SQL實戰 2.RDD轉化為DataFrame數據框的方式詳解 3.Spark DataFrame數據框操作實戰 4.加載和保存數據操作(load與save) 5.JSON數據源實戰案例 6.JDBC數據源實戰案例 7.Hive數據源實戰案例 8.Parquets數據源實戰加載數據、自動分區推斷、合并元數據 9.內置函數的實戰案例 10.開窗函數的實戰案例 11.Spark SQL UDF自定義函數實戰 12.Spark SQL UDAF自定義聚合函數實戰 13.Spark SQL 工作原理詳解以及Spark SQL 的源碼分析 14.Hive on Spark
七、Spark Streaming實時計算 1)Spark Streaming和Storm對比講解 2)Spark Streaming本質原理分析 3)Wordcount程序的實時版本開發 4)Spark Streaming和Spark Core里面context的不同 5)輸入DStream和Receiver的講解 6)不同輸入源(Kafka、HDFS)的DStream操作實戰 7)基于DStream的window滑動窗口實戰案例 8)基于DStream的updateStateByKey實戰案例 9)基于DStream的transform實戰案例 10)DStream的輸出存儲操作以及核心函數foreachRDD實戰 11)Spark Streaming的持久化實戰以及Checkpoint 12)與Spark SQL結合使用實戰案例 13)架構原理分析與性能優化
|