班級規模及環境--熱線:4008699035 手機:15921673576( 微信同號) |
每期人數限3到5人。 |
上課時間和地點 |
開課地址:【上?!客瑵髮W(滬西)/新城金郡商務樓(11號線白銀路站)【深圳分部】:電影大廈(地鐵一號線大劇院站) 【武漢分部】:佳源大廈【成都分部】:領館區1號【沈陽分部】:沈陽理工大學【鄭州分部】:錦華大廈【石家莊分部】:瑞景大廈【北京分部】:北京中山學院 【南京分部】:金港大廈
最新開班 (連續班 、周末班、晚班):2020年3月16日 |
實驗設備 |
☆資深工程師授課
☆注重質量
☆邊講邊練
☆合格學員免費推薦工作
★實驗設備請點擊這兒查看★ |
質量保障 |
1、培訓過程中,如有部分內容理解不透或消化不好,可免費在以后培訓班中重聽;
2、培訓結束后,授課老師留給學員聯系方式,保障培訓效果,免費提供課后技術支持。
3、培訓合格學員可享受免費推薦就業機會。 |
課程大綱 |
|
- 第1章Spark中決策樹相關算法
1-1回顧決策樹
1-2信息增益的計算
1-3參數maxBins含義
1-4其他重要參數講解
1-5類別值轉換處理
1-6構建決策樹分類模型
1-7模型訓練以及debug
1-8構建決策樹回歸模型
1-9Spark中的梯度提升樹
1-10性能提升參數
1-11Spark中的隨機森林模型實現
第2章運動數據分類
2-1業務場景定義
2-2加載數據
2-3探索每一種活動類型數據分布情況
2-4計算每一行的NAN個數
2-5計算NAN的占比
2-6找出NAN值太多的無效行
2-7每一列缺失值的探索
2-8心率缺失值的處理
2-9其他字段缺失值的處理
2-10統一數據
2-11對activityId進行索引標記
2-12特征值中類別值的索引標記
2-13模型訓練
2-14模型的debug
2-15模型評估
2-16混淆矩陣
2-17計算正確率
2-18混淆矩陣的label
2-19計算精確率和召回率
2-20模型部署
|