班級規(guī)模及環(huán)境--熱線:4008699035 手機:15921673576( 微信同號) |
每期人數(shù)限3到5人。 |
上課時間和地點 |
上課地點:【上海】:同濟大學(滬西)/新城金郡商務樓(11號線白銀路站) 【深圳分部】:電影大廈(地鐵一號線大劇院站)/深圳大學成教院 【北京分部】:北京中山學院/福鑫大樓 【南京分部】:金港大廈(和燕路) 【武漢分部】:佳源大廈(高新二路) 【成都分部】:領館區(qū)1號(中和大道) 【沈陽分部】:沈陽理工大學/六宅臻品 【鄭州分部】:鄭州大學/錦華大廈 【石家莊分部】:河北科技大學/瑞景大廈 【廣州分部】:廣糧大廈 【西安分部】:協(xié)同大廈
最近開課時間(周末班/連續(xù)班/晚班):2020年3月16日 |
實驗設備 |
☆資深工程師授課
☆注重質(zhì)量
☆邊講邊練
☆合格學員免費推薦工作
★實驗設備請點擊這兒查看★ |
質(zhì)量保障 |
1、培訓過程中,如有部分內(nèi)容理解不透或消化不好,可免費在以后培訓班中重聽;
2、培訓結束后,授課老師留給學員聯(lián)系方式,保障培訓效果,免費提供課后技術支持。
3、培訓合格學員可享受免費推薦就業(yè)機會。 |
課程大綱 |
一、 課程背景
信息爆炸的大數(shù)據(jù)時代,如何有效利用系統(tǒng)龐大的數(shù)據(jù),如何面對互聯(lián)網(wǎng)金融的挑戰(zhàn),成為企業(yè)關注的重要問題。為幫助企業(yè)認清和解決這一問題,有必要緊跟時代發(fā)展步伐,綜合各方經(jīng)驗,以幫助企業(yè)成功轉型。中培在過去的十年中曾經(jīng)為數(shù)百家企業(yè)提供了數(shù)據(jù)挖掘培訓服務。
二、 培訓收益
通過本課程,您可以掌握以下:
1. 數(shù)據(jù)挖掘與商業(yè)智能的歷史、概念、經(jīng)典案例、基礎理論;
2. 掌握R的基本數(shù)據(jù)結構、統(tǒng)計函數(shù)及高級函數(shù)、導入導出數(shù)據(jù);
3. 理解如何使用R語言及相應的模型解決現(xiàn)實問題;
4. 全面掌握Hadoop的架構原理和使用場景;
5. 掌握大數(shù)據(jù)基本概念及特點;
6. 了解典型行業(yè)對于大數(shù)據(jù)的處理方式;
7. 了解基于大數(shù)據(jù)的客戶行為分析;
8. 數(shù)據(jù)云計算框架Hadoop及其對大數(shù)據(jù)處理的支撐作用;
9. 掌握MapReduce計算模型概念及應用;
10. 熟悉大數(shù)據(jù)存儲組件Hbase及Hive;
11. 了解大數(shù)據(jù)分析工具Mouhout;
12. 掌握R數(shù)據(jù)挖掘的基本方法。
三、 培訓大綱
日程 培訓模塊 培訓內(nèi)容
大數(shù)據(jù)概述 1. 大數(shù)據(jù)基本概念、技術梗概、技術沿革,以及大數(shù)據(jù)技術是如何改變?nèi)斯ぶ悄芗夹g、語音識別技術、圖像識別/視頻理解、自然語言處理技術等;
2. 數(shù)據(jù)挖掘與商業(yè)智能概述;
3. 數(shù)據(jù)挖掘與商業(yè)智能發(fā)展歷程;
4. 數(shù)據(jù)挖掘與商業(yè)智能的基本理論。
R語言精要 本著循序漸進而又覆蓋R語言重要而有用的基本內(nèi)容原則,本講從R語言入門開始,以前期的數(shù)據(jù)處理為核心,以實際案例為載體,內(nèi)容包括R語言的向量、數(shù)據(jù)框、矩陣運算、缺失值和零值的處理、特別注重用R語言構造函數(shù)編程解決實際問題,詳細介紹強大的數(shù)據(jù)清洗整理plyr、zoo、car等常用包和強大的作圖ggplot2包,為使用R語言進行數(shù)據(jù)挖掘打下扎實的工具基礎。
主要案例:
案例1:如何用R語言plyr等包合并、排序、分析數(shù)據(jù)并編制香農(nóng)-威納指數(shù);
案例2:如何用R語言編程同時實現(xiàn)幾十個高難度數(shù)據(jù)分析可視化圖片的jpeg格式輸出;
案例3:如何使用R語言進行分層或者整群抽樣構建訓練集與測試集;
案例4:使用ggplot2畫出各種復雜的圖形。
關聯(lián)規(guī)則和R語言實現(xiàn) 關聯(lián)規(guī)則(著名的“啤酒和尿布”)是數(shù)據(jù)挖掘的基礎和核心技術之一,本講將著重圍繞經(jīng)典的Apriori算法和eclat算法,闡明關聯(lián)規(guī)則的支持、置信和提升程度與控制,使用R語言快速完成關聯(lián)規(guī)則分析。
主要案例:
案例1:使用R語言關聯(lián)規(guī)則方法幫助各個超市實現(xiàn)商品的最佳捆綁銷售方案(即“購物籃”分析);
案例2:泰坦尼克號乘客幸存的關聯(lián)規(guī)則分析;
案例3:提高個人收入的關聯(lián)分析。
決策樹(回歸樹)分析和R語言實現(xiàn) 決策樹是數(shù)據(jù)挖掘的經(jīng)典方法,其原理容易被理解。本講主要講授兩種最為普遍的決策樹算法:CART和C4.5算法,使用Rpart和J48函數(shù)進行R語言分析。
主要案例:
案例1:對汽車耗油量進行決策樹分析并完成相關目標變量的預測;
案例2:使用決策樹幫助電信局判斷和預測客戶辦理寬帶業(yè)務。
R語言隨機森林(RandomForest)算法 在機器學習中,隨機森林是一個包含多個決策樹的分類器,本講講清隨機森林方法的原理,以致在實際中幫助學員判斷適合進行隨機森林分析的情況,最終熟練掌握R語言隨機森林分析的方法。
主要案例:
案例1:對皮膚病進行隨機森林的分類和預測;
案例2:對酒的品質(zhì)和種類進行分類和評價。
支持向量機和R語言的實現(xiàn) 本講將分析支持向量機的結構風險最小原理、間隔和核函數(shù),從而幫助學員深刻理解支持向量機的思想和算法,以及使用中注意的問題,從而幫助學員靈活地應用于各個領域。
主要案例:
案例1:對著名的鳶尾花數(shù)據(jù)進行支持向量機的分析;
案例2:使用支持向量機識別有毒蘑菇;
案例3:使用支持向量機進行股票指數(shù)預測。
神經(jīng)網(wǎng)絡和R語言的實現(xiàn) 神經(jīng)網(wǎng)絡由大量的節(jié)點和輸出函數(shù)構成邏輯策略,本講介紹其原理,主要通過案例的方式講解R語言實現(xiàn)神經(jīng)網(wǎng)絡算法的過程和注意的事項。
主要案例:
案例1:酒的品質(zhì)和種類的神經(jīng)網(wǎng)絡的分析和預測;
案例2:公司財務預警建模。
使用R語言結合KNN算法進行文本挖掘 文本挖掘,特別是對中文的文本挖掘日趨重要。本講介紹文本挖掘的原理和方法,幫助大家使用R語言在大量的非結構化的數(shù)據(jù)中發(fā)現(xiàn)有價值的信息,抽取潛在有用的數(shù)據(jù),發(fā)現(xiàn)適合模式,實現(xiàn)可視化結果展示。
主要案例:
案例:使用R語言結合KNN算法對網(wǎng)頁(Web)進行文本挖掘(含分詞、分類、可視化等)。 |
|
|