班級規模及環境--熱線:4008699035 手機:15921673576( 微信同號) |
每期人數限3到5人。 |
上課時間和地點 |
上課地點:【上海】:同濟大學(滬西)/新城金郡商務樓(11號線白銀路站) 【深圳分部】:電影大廈(地鐵一號線大劇院站)/深圳大學成教院 【北京分部】:北京中山學院/福鑫大樓 【南京分部】:金港大廈(和燕路) 【武漢分部】:佳源大廈(高新二路) 【成都分部】:領館區1號(中和大道) 【沈陽分部】:沈陽理工大學/六宅臻品 【鄭州分部】:鄭州大學/錦華大廈 【石家莊分部】:河北科技大學/瑞景大廈 【廣州分部】:廣糧大廈 【西安分部】:協同大廈
最近開課時間(周末班/連續班/晚班):2020年3月16日 |
實驗設備 |
◆課時: 共5 部份,30學時
☆注重質量
☆邊講邊練
☆合格學員免費推薦工作
★實驗設備請點擊這兒查看★ |
質量保障 |
1、培訓過程中,如有部分內容理解不透或消化不好,可免費在以后培訓班中重聽;
2、培訓結束后,授課老師留給學員聯系方式,保障培訓效果,免費提供課后技術支持。
3、培訓合格學員可享受免費推薦就業機會。 |
大綱 |
|
Mahout提供一些可擴展的機器學習領域經典算法的實現,很多公司會使用Mahout方便快捷地創建智能應用程序。Mahout包含許多實現,包括聚類、分類、推薦過濾、頻繁子項挖掘。Mahout通過使用 Apache Hadoop,可以有效地擴展到云中。被業界奉為第二代機器學習工具。此部分過后大家不僅會學習到mahout的組件而且會有項目讓大家真正把它應用到工作中。
1) 介紹為什么使用它,它的前景
a) 簡單介紹Mahout b) 簡單介紹機器學習 c) 實例演示Mahout單機推薦程序
2) 配置安裝(hadoop2.x版本的)編譯安裝步驟說明
a) 命令行中測試運行協同過濾概念
3) 推薦
a) 講解基于用戶的協同過濾 b) 講解基于物品的協同過濾
4) 分類
a) 分類概念 b) 分類的應用及Mahout分類優勢 c) 分類和聚類、推薦的區別 d) 分類工作原理
e) 分類中概念術語 f) 分類項目工作流 g) 如何定義預測變量 h) 線性分類器的介紹,及貝葉斯分類器
i) 決策樹分類器的介紹,及隨機森林分類器 j) 如何使用貝葉斯分類器和隨機森林分類器的代碼展示
5) 聚類
a) 聚類概念 b) 聚類步驟流程 c) 聚類中的距離測度 d) 講解K-means聚類 e) K-means聚類算法展示
f) 聚類其他算法 g) 介紹TF-IDF h) 歸一化 i) 微博聚類案例
項目實戰
微博營銷數據挖掘項目
使用數據來自微博平臺,項目目標通過機器學習所學知識挖掘目標客戶群體,找到代言人進行微博營銷廣告投放。
項目技術架構體系:
a) 分布式平臺 Hadoop,MapReduce b) 數據采集 Flume c) 數據清洗 ETL d) 數據庫 Hbase,Redis e) 機器學習 Mahout
|