曙海教育集團
全國報名免費熱線:4008699035 微信:shuhaipeixun
或15921673576(微信同號) QQ:1299983702
首頁 課程表 在線聊 報名 講師 品牌 QQ聊 活動 就業(yè)
 
Spark大數據平臺應用實戰(zhàn)課程

 
  班級規(guī)模及環(huán)境--熱線:4008699035 手機:15921673576( 微信同號)
      每個班級的人數限3到5人,互動授課, 保障效果,小班授課。
  上間和地點
上部份地點:【上海】同濟大學(滬西)/新城金郡商務樓(11號線白銀路站)【深圳分部】:電影大廈(地鐵一號線大劇院站)/深圳大學成教院【北京分部】:北京中山學院/福鑫大樓【南京分部】:金港大廈(和燕路)【武漢分部】:佳源大廈(高新二路)【成都分部】:領館區(qū)1號(中和大道)【沈陽分部】:沈陽理工大學/六宅臻品【鄭州分部】:鄭州大學/錦華大廈【石家莊分部】:河北科技大學/瑞景大廈
最近開間(周末班/連續(xù)班/晚班):2020年3月16日
  實驗設備
    ◆小班教學,教學效果好
       
       ☆注重質量☆邊講邊練

       ☆合格學員免費推薦工作
       ★實驗設備請點擊這兒查看★
  質量保障

       1、培訓過程中,如有部分內容理解不透或消化不好,可免費在以后培訓班中重聽;
       2、培訓結束后,授課老師留給學員聯系方式,保障培訓效果,免費提供課后技術支持。
       3、培訓合格學員可享受免費推薦就業(yè)機會。☆合格學員免費頒發(fā)相關工程師等資格證書,提升職業(yè)資質。專注高端技術培訓15年,端海學員的能力得到大家的認同,受到用人單位的廣泛贊譽,端海的證書受到廣泛認可。

部份程大綱
 

第一部份. Spark背景介紹與安裝部署
1.1 Spark在大數據生態(tài)中的定位
1.2 Spark主要模塊介紹
1.3 Spark部署模型介紹
1.4 Spark基于Ambari的安裝
1.5 Spark Standalone下的HA

第二部份. 基于Java的Spark編程入門
2.1 Spark應用中的術語介紹
2.2 交互式工具spark-shell
2.3 從Word Count看Spark編程
2.4 spark-submit的幾種用法

第三部份 Spark常用算子介紹
3.1 transform與action
3.2 廣播變量與累加器
3.3 persist與checkpoint
3.4 數據本地性(Data locality)

第四部份. 一個Spark應用的一生
4.1 Spark應用的Stage劃分
4.2 窄依賴 vs. Shuffle依賴
4.3 Job邏輯執(zhí)行計劃
4.4 Job物理執(zhí)行計劃

第五部份. Shuffle機制變遷
5.1 Hadoop Shuffle方案
5.2 Spark Hash Shuffle
5.3 Spark Sort Shuffle
5.4 Spark Tungsten Sort Shuffle

第六部份. Spark SQL實戰(zhàn)
6.1 Spark SQL前世今生
6.2 RDD vs. Dataframe vs. Dataset
6.3 使用外部數據源
6.4 連接metastore
6.5 自定義函數
6.6 spark-sql與Spark thrift server

第七部份. Spark SQL原理
7.1 Spark SQL執(zhí)行過程解析
7.2 Catalyst原理
7.3 SQL引擎原理
7.4 Spark SQL優(yōu)化

第八部份. 例講數據傾斜解決方案
8.1 為何需要處理數據傾斜
8.2 調整并行度,分散同一Task的不同Key
8.3 自定義Partitioner,分散同一Task的不同Key
8.4 Map Join代替Reduce Join消除數據傾斜
8.5 為傾斜key增加隨機前綴
8.6 大表增加隨機前綴,小表擴容

第九部份. Spark Streaming上
9.1 Spark Streaming示例
9.2 流式系統關鍵問題分析
9.3 Window操作
9.4 如何在流數據上做Join
9.5 Checkpoint機制

第十部份. Spark Streaming下
10.1 如何處理數據亂序問題
10.2 Spark Streaming容錯機制
10.3 Spark與Kafka實現Exactly once
10.4 Spark Streaming vs. Storm vs. Kafka Stream
10.5 Spark Streaming性能優(yōu)化
10.6 Structured Streaming

第十一部份. Spark MLlib
11.1 Pipeline
11.2 特征工程
11.3 模型選擇
11.4 調優(yōu)

第十二部份. Spark優(yōu)化
12.1 應用代碼優(yōu)化
12.2 Spark統一內存模型
12.3 基于YARN的參數優(yōu)化
12.4 其它優(yōu)化項

 

-

 

  備案號:備案號:滬ICP備08026168號-1 .(2024年07月24日)....................
友情鏈接:Cadence培訓 ICEPAK培訓 EMC培訓 電磁兼容培訓 sas容培訓 羅克韋爾PLC培訓 歐姆龍PLC培訓 PLC培訓 三菱PLC培訓 西門子PLC培訓 dcs培訓 橫河dcs培訓 艾默生培訓 robot CAD培訓 eplan培訓 dcs培訓 電路板設計培訓 浙大dcs培訓 PCB設計培訓 adams培訓 fluent培訓系列課程 培訓機構課程短期培訓系列課程培訓機構 長期課程列表實踐課程高級課程學校培訓機構周末班培訓 南京 NS3培訓 OpenGL培訓 FPGA培訓 PCIE培訓 MTK培訓 Cortex訓 Arduino培訓 單片機培訓 EMC培訓 信號完整性培訓 電源設計培訓 電機控制培訓 LabVIEW培訓 OPENCV培訓 集成電路培訓 UVM驗證培訓 VxWorks培訓 CST培訓 PLC培訓 Python培訓 ANSYS培訓 VB語言培訓 HFSS培訓 SAS培訓 Ansys培訓 短期培訓系列課程培訓機構 長期課程列表實踐課程高級課程學校培訓機構周末班 端海 教育 企業(yè) 學院 培訓課程 系列班 長期課程列表實踐課程高級課程學校培訓機構周末班 短期培訓系列課程培訓機構 端海教育企業(yè)學院培訓課程 系列班
主站蜘蛛池模板: 欧美日韩国产综合视频在线观看| 97久久天天综合色天天综合色hd| 欧美亚洲日韩国产综合网| 久久久久高潮综合影院| 一97日本道伊人久久综合影院| 色综合天天综合网国产国产人| 亚洲国产综合精品一区在线播放| 国产欧美日韩综合精品一区二区| 久久综合欧美成人| 五月婷婷综合在线| 色狠狠色狠狠综合天天| 国产亚洲综合一区柠檬导航| 综合无码一区二区三区| 久久综合久久自在自线精品自| heyzo专区无码综合| 综合色婷婷| 久久综合九色综合欧美狠狠| 在线综合+亚洲+欧美中文字幕| 六月婷婷国产精品综合| 久久婷婷色香五月综合激情| 亚洲VA欧美va国产va综合| 99热婷婷国产精品综合| 国产综合欧美| 久久综合伊人77777| 亚洲综合图片区| 99久久精品国产综合一区| 亚洲狠狠色丁香婷婷综合| 五月天综合色激情| 久久综合九色综合网站| 亚洲伊人成无码综合网| 亚洲人成伊人成综合网久久久| 狠狠色狠狠色综合伊人| 亚洲精品综合在线影院| 国产综合无码一区二区辣椒| 久久婷婷是五月综合色狠狠| 亚洲狠狠爱综合影院婷婷| 欧美伊人久久大香线蕉综合69| 色悠久久久久久久综合网| 国产激情电影综合在线看| 欧美久久综合九色综合| 99热婷婷国产精品综合|