班級規模及環境--熱線:4008699035 手機:15921673576( 微信同號) |
每個班級的人數限3到5人,互動授課, 保障效果,小班授課。 |
上間和地點 |
上部份地點:【上海】同濟大學(滬西)/新城金郡商務樓(11號線白銀路站)【深圳分部】:電影大廈(地鐵一號線大劇院站)/深圳大學成教院【北京分部】:北京中山學院/福鑫大樓【南京分部】:金港大廈(和燕路)【武漢分部】:佳源大廈(高新二路)【成都分部】:領館區1號(中和大道)【沈陽分部】:沈陽理工大學/六宅臻品【鄭州分部】:鄭州大學/錦華大廈【石家莊分部】:河北科技大學/瑞景大廈 最近開間(周末班/連續班/晚班):2020年3月16日 |
實驗設備 |
◆小班教學,教學效果好 ☆注重質量☆邊講邊練 ☆合格學員免費推薦工作 ★實驗設備請點擊這兒查看★ |
質量保障 |
1、培訓過程中,如有部分內容理解不透或消化不好,可免費在以后培訓班中重聽; 2、培訓結束后,授課老師留給學員聯系方式,保障培訓效果,免費提供課后技術支持。 3、培訓合格學員可享受免費推薦就業機會。☆合格學員免費頒發相關工程師等資格證書,提升職業資質。專注高端技術培訓15年,端海學員的能力得到大家的認同,受到用人單位的廣泛贊譽,端海的證書受到廣泛認可。 |
部份程大綱 |
|
?互聯網時代下,數據量的急劇增長,傳統的數據倉庫已經無法滿足。Hive作為Hadoop生態圈中的數據倉庫解決方案隨著開源社區的快速發展而逐步成熟,慢慢的在某些場景下替代企業級數據倉庫,成為各大互聯網公司數據倉庫建設的必選方案,可以這么說,Hive已經成為大數據數據倉庫的事實標準。
第一部份 Hadoop與MapReduce
1) Hive在Hadoop Ecosystem中的地位
2) Hive的版本演進與目前現狀
3) 部份程實踐環境說明
4) 實操: Hive/Hadoop預備環境安裝
第二部份 Hive的基本概念與QuickStart
1) Hive的安裝部署
2) Hive的基本架構
3) 啟動Hive
4) Hive命令行
5) HiveServer與JDBC/ODBC
6) 實操: Hive命令行和ThriftServer基本使用
第三部份 數據類型與文件格式
1) Hive支持的基本數據類型
2) Hive支持的集合數據類型
3) Hive支持的文件格式與優劣對比
第四部份 HiveQL:數據定義
1) Hive數據模型
2) Database
3) Table
4) Partition
5) 自定義存儲格式
6) 自定義表屬性
7) 常用創建/刪除/修改表語法
8) 實操: HQL 創建/刪除/修改操作練習
第五部份 HiveQL:數據操作
1) 加載數據(LoadData)
2) 從查詢計算結果加載數據(Insert Table Select)
3) 動態分區(DynamicPartitioning)
4) CTAS(CreateTableAsSelect)
5) 導出數據
6) 實操: 練習以上數據加載計算和導出操作
第六部份 HiveQL:數據查詢
1) 從最簡單的開始
2) Select … From
3) Where條件
4) Group By條件
5) Join
6) 排序(OrderBy/SortBy)
7) ClusterBy/DistributeBy
8) 抽樣(Sampling)
9) Union
10) 實操: 練習以上各種查詢語法
第七部份 Hive函數與自定義函數
1) 查看與調用函數
2) 常用標準函數(UDF)
3) UDAF
4) UDTF
5) UDF/UDAF/UDTF開發
6) 實操: 練習并完成UDF Java開發的作業
第八部份 Hive常用模式設計
1) 按天做Partition
2) 分桶(Bucket)
3) 壓縮
4) 表Schema變更
5) 實操: 練習以上幾種倉庫設計模式
第九部份 Hive調優
1) Hive參數說明
2) Explain查看執行計劃
3) 控制Map/Reduce數
4) 并行執行
5) 推測執行
6) Join優化
7) 數據傾斜問題
8) 動態分區優化
9) 實操: 練習并理解不同優化參數下的執行邏輯
第十部份 Hive新特性與其他
1) Hive on Tez
2) Hive on Spark
3) Hive與HBase集成
4) HCatalog
第十一部份 案例
1) 廣告用戶行為分析場景預備
2) 構建Hive表與數據處理
3) 常用分析案例
|