曙海教育集團
全國報名免費熱線:4008699035 微信:shuhaipeixun
或15921673576(微信同號) QQ:1299983702
首頁 課程表 在線聊 報名 講師 品牌 QQ聊 活動 就業(yè)
 
大數(shù)據(jù)分析與可視化技術(shù)應用培訓
 
   班級規(guī)模及環(huán)境--熱線:4008699035 手機:15921673576( 微信同號)
       每期人數(shù)限3到5人。
   上課時間和地點
開課地址:【上海】同濟大學(滬西)/新城金郡商務樓(11號線白銀路站)【深圳分部】:電影大廈(地鐵一號線大劇院站) 【武漢分部】:佳源大廈【成都分部】:領(lǐng)館區(qū)1號【沈陽分部】:沈陽理工大學【鄭州分部】:錦華大廈【石家莊分部】:瑞景大廈【北京分部】:北京中山學院 【南京分部】:金港大廈
最新開班 (連續(xù)班 、周末班、晚班):2020年3月16日
   實驗設(shè)備
     ☆資深工程師授課
        
        ☆注重質(zhì)量 ☆邊講邊練

        ☆合格學員免費推薦工作
        ★實驗設(shè)備請點擊這兒查看★
   質(zhì)量保障

        1、培訓過程中,如有部分內(nèi)容理解不透或消化不好,可免費在以后培訓班中重聽;
        2、培訓結(jié)束后,授課老師留給學員聯(lián)系方式,保障培訓效果,免費提供課后技術(shù)支持。
        3、培訓合格學員可享受免費推薦就業(yè)機會。

課程大綱
 

數(shù)據(jù)處理及復雜數(shù)據(jù)可視化(一)
R語言入門及數(shù)據(jù)挖掘基本概念
R語言簡介
常量、向量、矩陣、數(shù)組、數(shù)據(jù)框、列表、數(shù)據(jù)處理、編寫程序、基本統(tǒng)計計算、R語言繪圖基礎(chǔ)、幫助及包的用法
R語言數(shù)據(jù)處理秘笈
介紹填、剪、揉太極三式的數(shù)據(jù)處理原理、方法、案例、技巧,以及Dplyr包、Tidyr包、Data.Table包的具體用法和代碼講解
數(shù)據(jù)挖掘基礎(chǔ)
講解數(shù)據(jù)挖掘的基本概念、典型問題,通過場景舉例說明數(shù)據(jù)挖掘的用途;同時,結(jié)合數(shù)據(jù)挖掘標準流程講解開展數(shù)據(jù)挖掘工作的各環(huán)節(jié)及主要技術(shù)。介紹數(shù)據(jù)挖掘常用算法及適合場景,比較不同數(shù)據(jù)挖掘工具的優(yōu)缺點。

數(shù)據(jù)處理及復雜數(shù)據(jù)可視化(二)
R語言數(shù)據(jù)挖掘與可視化分析
數(shù)據(jù)挖掘關(guān)鍵技術(shù)
詳細講解抽樣、分區(qū)、樣本平衡、特征選擇、訓練模型、評估模型的技術(shù),并結(jié)合R語言講解其代碼實現(xiàn)。
Rattle數(shù)據(jù)挖掘工具
介紹Rattle在業(yè)界的使用情況,安裝及具體使用方法,包括數(shù)據(jù)源、數(shù)據(jù)探索、統(tǒng)計檢驗、數(shù)據(jù)變換、聚類分析、關(guān)聯(lián)挖掘、建模、評估模型以及日志功能。通過實際的數(shù)據(jù)演示各環(huán)節(jié)的具體操作過程,分析挖掘結(jié)果。
可視化分析
介紹可視化基本概念,可視化設(shè)計流程以及R語言可視化的優(yōu)勢;其次,介紹24種常見圖表(拆線圖、柱狀圖、散點圖、雷達圖、詞云圖、玫瑰圖、桑基圖、河流圖等等)的適用場景和使用方法;最后,重點對Lattice、Rcharts、Recharts、Ggplot2包進行了詳細講解和案例演示。

數(shù)據(jù)挖掘模型實戰(zhàn)(一)
關(guān)聯(lián)規(guī)則算法原理與案例分析
算法講解
關(guān)聯(lián)規(guī)則概念、基本術(shù)語、Apriori算法實現(xiàn)原理、流程及手動演算案例;Arules包的介紹等等
案例:利用超市購物籃Groceries數(shù)據(jù)進行關(guān)聯(lián)規(guī)則分析
介紹Groceries數(shù)據(jù)集、事務數(shù)據(jù)集以及常見操作;介紹數(shù)據(jù)轉(zhuǎn)換為事務數(shù)據(jù)集的方法以及使用Apriori算法建立關(guān)聯(lián)規(guī)則模型,同時,對分析關(guān)聯(lián)規(guī)則結(jié)果的常用技術(shù)進行了講解和演示。
聚類算法原理與案例分析
Kmeans算法講解
介紹Kmeans聚類基本思路及算法流程;Kmeans函數(shù)介紹;數(shù)據(jù)標準化技術(shù)介紹
案例:對Iris數(shù)據(jù)集進行K均值聚類分析
介紹Iris數(shù)據(jù)集,并試圖通過使用基本數(shù)值指標建立聚類分析模型,驗證其與真實分類的區(qū)別
案例:對Mtcars數(shù)據(jù)集進行K均值聚類分析
介紹Mtcars數(shù)據(jù)集,并使用Kmeans算法對其進行聚類分析,以了解汽車的類別細分,同時給出合理解釋并提煉判斷規(guī)則
層次聚類算法講解
介紹樣本距離、類間距離的概念和計算方法,介紹層次聚類算法流程以及通過手動演算詳細講解層次聚類實現(xiàn)的過程;Hclust函數(shù)講解
案例:對洛杉機街區(qū)數(shù)據(jù)進行層次聚類
介紹洛杉機數(shù)據(jù),并使用層次聚類算法對其進行細分;通過細分進一步對數(shù)據(jù)進行了詳細了解,并給出各類的詳細描述與說明
案例:對哺乳動物的睡眼數(shù)據(jù)進行層次聚類
介紹哺乳動物的睡眠數(shù)據(jù),使用層次聚類的方法對其進行細分,并給出各類的特點,并給出詳細描述與說明

數(shù)據(jù)挖掘模型實戰(zhàn)(二)
KNN算法原理與案例分析
算法原理
介紹Knn基本概念、原理以及實現(xiàn)流程,同時給出Knn算法的優(yōu)缺點和適用場景;詳細介紹Kknn包
案例:對Iris數(shù)據(jù)集進行Knn分類
介紹使用Knn算法對Iris數(shù)據(jù)進行分類的方法、流程及代碼演示,并對分類的結(jié)果進行分析
案例:對乳腺癌數(shù)據(jù)進行Knn分類
介紹乳腺癌數(shù)據(jù)集,并使用Knn算法對乳腺癌數(shù)據(jù)進行分類,同時給出實現(xiàn)的方法、流程及代碼,并對分類效果進行分析
案例:對新聞文本數(shù)據(jù)進行Knn分類
介紹新聞文本數(shù)據(jù),并使用Knn分類算法對新聞文本數(shù)據(jù)進行分類,同時給出實現(xiàn)的方法、流程及代碼,并對分類效果進行分析
決策樹原理與案例分析
介紹決策樹基本概念、分類與回歸問題的區(qū)別與聯(lián)系、說明決策樹建模的通用過程。
CART算法原理
介紹分類回歸樹的基本思路、算法實現(xiàn)流程,并通過案例說明其實現(xiàn)細節(jié);介紹選擇分割點的方法,拆分規(guī)則,代價復雜度以及Rpart包和Prune函數(shù)的介紹
案例:對Iris數(shù)據(jù)集運用CART算法進行分類
介紹使用CART算法對Iris數(shù)據(jù)進行分類的方法、原理和代碼實現(xiàn)流程,并對分類效果進行比較分析
案例:對汽車數(shù)據(jù)運用CART對汽車重量進行預測
介紹使用CART算法對Mtcars數(shù)據(jù)中汽車的重量進行預測的方法、原理和代碼實現(xiàn)流程,并對預測效果進行分析
C5.0算法原理
介紹ID3算法的算法實現(xiàn)原理和流程,同時講解信息熵、后驗熵、信息增益等基本概念;通過案例講解ID3算法的具體過程以及ID3自身的問題;介紹C4.5算法的實現(xiàn)原理和流程,講解增益比例的來源和優(yōu)點,同時介紹C4.5對連續(xù)屬性及有缺失樣本的算法辦法,此外,還將會對剪枝、規(guī)則的產(chǎn)生、交叉驗證等問題進行講解;C50包的介紹
案例:對Iris數(shù)據(jù)集運用C50算法分類
介紹使用C50算法對Iris數(shù)據(jù)集進行分類的方法、原理和代碼實現(xiàn)流程,同時對分類效果進行分析

行業(yè)應用案例分享(一)
分析案例剖析
購物籃分析案例
Onlineretail數(shù)據(jù)集,包含用戶購買商品的交易信息,本案例旨在從中挖掘出用戶購買商品的關(guān)聯(lián)規(guī)則規(guī)律,并分析各模式對應的含義及應用可行性。
航空公司客戶價值分析案例
面對激烈的市場競爭,各航空公司都推出了更優(yōu)惠的營銷方式來吸引更多的客戶,國內(nèi)某航空公司面臨著旅客流失、競爭力下降和航空資源未充分利用等經(jīng)營危機。通過建立合理的客戶價值評估模型,對客戶進行分群,分析比較不同客戶群的客戶價值,并制定相應的營銷策略
Lending Club信貸違約分析案例
Lending Club 信用貸款違約數(shù)據(jù)是美國網(wǎng)絡(luò)貸款平臺 Lendingclub 在2007-2015年間的信用貸款情況數(shù)據(jù),主要包括貸款狀態(tài)和還款信息。本例基于該數(shù)據(jù)對多維度信息進行詳細的數(shù)據(jù)分析,主要結(jié)合詞云、地圖等分析方法,另外,針對貸款違約建立了預測模型,本節(jié)會介紹詳細的建模過程及預測效果分析

行業(yè)應用案例分享(二)
用戶行為挖掘算法及案例
推薦系統(tǒng)
介紹推薦系統(tǒng)的基本概念、以及常見推薦算法(包括基于人口統(tǒng)計學的推薦、基于內(nèi)容的推薦、協(xié)同過濾推薦、基于關(guān)聯(lián)規(guī)則的推薦、基于效用的推薦、基于知識推薦、基于標簽的推薦、基于圖的推薦等等),同時對不同的推薦算法進行比較;另外,針對構(gòu)建推薦系統(tǒng),給出了詳細的說明;介紹了推薦系統(tǒng)評測的關(guān)鍵指標(包括用戶滿意度、準確度、覆蓋率、多樣性、驚喜度等等);接著,對R語言中的Recommenderlab包的用法進行詳細介紹
案例:基于Onlineretail數(shù)據(jù)建立推薦系統(tǒng)
介紹Onlineretail數(shù)據(jù)集,以及開展推薦系統(tǒng)搭建過程的方法及具體實現(xiàn),案例中使用了RANDOM、UBCF、IBCF三種方法建立了預測模型,并給出了比較分析
序列模式挖掘
介紹序列模式挖掘的基本概念、術(shù)語、實現(xiàn)的思路及具體過程。主要介紹SPADE算法的原理以及其實現(xiàn)過程。針對具體的實現(xiàn),詳細介紹了R語言中的Arulessequences包
對Onlineretail數(shù)據(jù)集進行序列模式挖掘
基于Onlineretail數(shù)據(jù)集,使用Spade算法建立序列模式挖掘算法進行序列模式挖掘,并對挖掘出的結(jié)果進行解釋分析

 
 
  備案號:備案號:滬ICP備08026168號-1 .(2024年07月24日)....................
主站蜘蛛池模板: 国产成人综合一区精品| 久久青青草原综合伊人| 99久久国产综合精品成人影院| 久久九色综合九色99伊人| 成人精品综合免费视频| 国产综合内射日韩久| 国产亚洲综合一区柠檬导航| 亚洲国产欧美国产综合一区| 亚洲国产综合人成综合网站| 亚洲国产综合人成综合网站| 一本大道加勒比久久综合| 伊人久久大香线蕉综合影院首页| AV狠狠色丁香婷婷综合久久| 欧美成人精品一区二区综合| 一本一本久久a久久精品综合麻豆| 国产巨作麻豆欧美亚洲综合久久| 色综合天天综合狠狠| 国产成人综合亚洲欧美天堂| 亚洲小说图区综合在线| 国产成人综合美国十次| 91精品国产综合久久婷婷| 亚洲欧美综合另类图片小说区| 亚洲欧美国产∧v精品综合网| 91精品国产综合久久四虎久久无码一级| 婷婷综合久久狠狠色99h| 天天综合天天看夜夜添狠狠玩| 激情综合色五月六月婷婷| 久久综合久久综合久久| 亚洲国产美国国产综合一区二区| 久久乐国产精品亚洲综合| 狠狠做深爱婷婷综合一区| 亚洲精品第一国产综合境外资源| 婷婷久久香蕉五月综合加勒比| 丁香狠狠色婷婷久久综合| 激情综合婷婷丁香五月| 狠狠色综合日日| 中文字幕亚洲综合小综合在线| 久久91综合国产91久久精品| 亚洲AV人无码综合在线观看| 欧美一区二区三区综合| 三级韩国一区久久二区综合|