班級規模及環境--熱線:4008699035 手機:15921673576( 微信同號) |
每個班級的人數限3到5人,互動授課, 保障效果,小班授課。 |
上間和地點 |
上部份地點:【上海】同濟大學(滬西)/新城金郡商務樓(11號線白銀路站)【深圳分部】:電影大廈(地鐵一號線大劇院站)/深圳大學成教院【北京分部】:北京中山學院/福鑫大樓【南京分部】:金港大廈(和燕路)【武漢分部】:佳源大廈(高新二路)【成都分部】:領館區1號(中和大道)【沈陽分部】:沈陽理工大學/六宅臻品【鄭州分部】:鄭州大學/錦華大廈【石家莊分部】:河北科技大學/瑞景大廈 最近開間(周末班/連續班/晚班):2020年3月16日 |
實驗設備 |
◆小班教學,教學效果好 ☆注重質量☆邊講邊練 ☆合格學員免費推薦工作 ★實驗設備請點擊這兒查看★ |
質量保障 |
1、培訓過程中,如有部分內容理解不透或消化不好,可免費在以后培訓班中重聽; 2、培訓結束后,授課老師留給學員聯系方式,保障培訓效果,免費提供課后技術支持。 3、培訓合格學員可享受免費推薦就業機會。☆合格學員免費頒發相關工程師等資格證書,提升職業資質。專注高端技術培訓15年,端海學員的能力得到大家的認同,受到用人單位的廣泛贊譽,端海的證書受到廣泛認可。 |
部份程大綱 |
|
01章大數據前沿應用與Hadoop環境搭建
01-01大數據行業前沿應用與知識介紹
01-02大數據分析師課程安排
01-03Linux入門基礎
01-04Hadoop入門介紹
01-05Hadoop單機環境搭建
01-06Hadoop偽分布式集群搭建
01-07Hadoop完全分布式集群搭建
02章Hadoop核心組建使用方法
01-01分布式文件系統HDFS架構原理及常用指令
01-02HDFS編程入門
01-03Hbase編程入門
01-04分布式數據倉庫Hive架構原理及HQL語法介紹
01-05分布式計算引擎MapReduce架構原理及基本使用方法
01-06資源調度器YARN基本原理
01-07ETL工具Sqoop使用方法
03章分布式計算引擎Spark入門
01-01Scala語法知識介紹
01-02 Spark架構特點及基本原理
01-03Spark入門及安裝部署方法
01-04Spark Core介紹
01-05Spark SQL介紹與數據讀取、保存方法
01-06Spark GraphX入門及基本使用方法
01-07Spark GraphX圖計算算法案例
04章Spark核心組件的使用方法
01-01日志采集系統Flume和分布式消息隊列Kafka入門
01-02流式計算框架Spark Streaming基本原理及使用方法
01-03流式計算框架Structured Streaming基本原理及使用方法
01-04分布式算法庫Spark MlLib入門介紹
01-05Spark ML與Spark MLLib
01-06機器學習工作流
05章Python入門與數據清洗
01-01Python編程基礎:基本數據結構
01-02Python編程基礎:常用控制語句
01-03NumPy基本數據結構和常用操作
01-04Pandas基本數據結構和常用操作
01-05Python數據清洗綜合案例
06章大數據分析之數據統計學基礎
01-01概率論與數理統計基礎知識
01-02數據探索與描述性統計分析
01-03常用統計量的解釋與使用
01-04參數估計方法:點估計和區間估計
01-05假設檢驗基本原理和應用
01-06方差分析基本原理和應用
07章Pyspark基礎知識
01-01Spark數據結構及編程語言接口
01-02PySpark開發環境搭建
01-03PySpark編程入門:Spark基本數據結構
01-04PySpark編程入門:PySpark常用語句
01-05Spark與分布式數據庫和分布式數據倉庫的集成方法
01-06采用PySpark讀取分布式數據庫中數據
01-07 PySpark數據清洗案例
08章PySpark機器學習-Part1
01-01機器學習入門
01-02PySpark基于Spark ML的特征抽取、轉化和選擇方法
01-03最近鄰分類器KNN基本原理及ML實現
01-04聚類分析基本原理
01-05K-Means快速聚類基本原理
01-06K-Means快速聚類的Spark ML實現方法
01-07高斯混合模型(GMM)聚類算法的Spark實現
09章PySpark機器學習-Part2
01-01Spark MLLib統計分析
01-02線性回歸基本原理
01-03線性回歸的Spark ML實現方法
01-04對數幾率分布于Sigmoild函數
01-05邏輯回歸基本原理
01-06邏輯回歸的Spark ML實現方法
10章PySpark機器學習-Part3
01-01決策樹模型的基本原理
01-02決策樹的Spark ML實現方法
01-03隨機森林基本原理
01-04隨機森林的Spark ML實現方法
01-05關聯規則算法入門:Apriori算法基本原理
01-06利用FP-Growth挖掘關聯規則
01-07FP-Growth算法的Spark ML實現方法
01-08帶時序關系的關聯規則挖掘算法Pre-FixSpan基本原理
01-09Pre-FixSpan的Spark ML實現方法
11章PySpark機器學習-Part4與綜合案例
01-01協同過濾在Spark ML中的實現方法
01-02Spark機器學習流構建方法
01-03Spark機器學習模型超參數調優方法
01-04Spark機器學習模型自動選擇方法
01-05PySpark綜合案例
|