課程目錄: R語言數(shù)據(jù)挖掘?qū)崙?zhàn)培訓(xùn)|
(78637/99817)
課程大綱:

     R語言數(shù)據(jù)挖掘?qū)崙?zhàn)培訓(xùn)

 

 

 

第1節(jié)
R語言數(shù)據(jù)對象概要
通過創(chuàng)建不同的對象(數(shù)據(jù)對象、圖形對象、模型對象、自定義方程)詳細介紹了在R語言中萬物皆對象的說法,通過實際案例演示了如何創(chuàng)建向量、矩陣、數(shù)組、數(shù)據(jù)框和列表等數(shù)據(jù)對象。
學(xué)員學(xué)習(xí)完本小節(jié)的內(nèi)容,懂得R語言中的常用數(shù)據(jù)對象創(chuàng)建、判斷和轉(zhuǎn)換的方法,為以后的數(shù)據(jù)分析和處理打下堅實的基礎(chǔ)。
第2節(jié)
R語言數(shù)據(jù)導(dǎo)入概要

R語言沒有提供圖形化的數(shù)據(jù)導(dǎo)入界面,本小節(jié)利用RStuido導(dǎo)入外部的txt、csv文件;也介紹了利用read.table函數(shù)導(dǎo)入txt、csv文件數(shù)據(jù);讓學(xué)員對外部文本文件數(shù)據(jù)導(dǎo)入到R有基本的能力。

第3節(jié)
距離計算及數(shù)據(jù)標準化處理
本小節(jié)介紹了連續(xù)型變量間距離的計算方式;介紹了數(shù)據(jù)標準化處理的基本原理;并利用了caret擴展包中的preProcess函數(shù)快速實現(xiàn)數(shù)據(jù)的標準化處理,通過例子演示了利用preProcess函數(shù)和其他函數(shù)實現(xiàn)標準化和歸一化處理的結(jié)果。

第4節(jié)
常用聚類算法原理及R語言實現(xiàn)

常用聚類算法介紹,并對K均值聚類及層次聚類算法原理的詳細講解;后介紹了不同聚類算法在R語言中對應(yīng)的函數(shù)實現(xiàn)。

第5節(jié)
聚類分析案例演示

利用K-Means聚類對Vehicle數(shù)據(jù)集進行聚類分群,并通過汽車類型指標查看聚類效果;利用cluster函數(shù)對洛杉磯街區(qū)數(shù)據(jù)進行層次聚類,并繪制聚類系譜樹圖,并利用聚類結(jié)果對街區(qū)進行分群標識,在經(jīng)緯度圖上把街區(qū)數(shù)據(jù)展現(xiàn)出來;后利用cluster函數(shù)對mtcars數(shù)據(jù)集進行層次聚類,并對結(jié)果進行詳細解讀。

第6節(jié)
關(guān)聯(lián)規(guī)則案例演示

簡單介紹了關(guān)聯(lián)規(guī)則的基本原理,并詳細介紹了R語言關(guān)聯(lián)規(guī)則的實現(xiàn)及其他相關(guān)函數(shù);介紹了關(guān)聯(lián)規(guī)則可視化包arulesViz;后通過超市購物數(shù)據(jù)進行事務(wù)型數(shù)據(jù)的探索,利用as函數(shù)進行數(shù)據(jù)格式轉(zhuǎn)換,利用itemFrequency函數(shù)查看包含該商品的交易比例;通過arules函數(shù)構(gòu)建關(guān)聯(lián)規(guī)則模型,并對關(guān)聯(lián)規(guī)則進行排序和篩選。

第7節(jié)
KNN算法原理及R語言實現(xiàn)
詳細講解了KNN近鄰算法思想,KNN算法流程,如何對數(shù)據(jù)進行標準化以及呀變量處理;以及KNN算法的R語言實現(xiàn)。

第8節(jié)
KNN算法案例詳解

利用KNN算法對鳶尾花數(shù)據(jù)集iris建立分類器,并利用混淆矩陣查看預(yù)測誤差率,其中利用caret包的creatDataPartition函數(shù)對數(shù)據(jù)進行分區(qū),并通過自定義函數(shù)ceshi讓學(xué)員清楚KNN近鄰算法的實現(xiàn)步驟。后利用KNN算法對乳腺癌數(shù)據(jù)識別患者,對汽車類型進行識別等。

第9節(jié)
決策樹算法基本原理及R語言實現(xiàn)

介紹了決策樹的基本思想以及其優(yōu)缺點。我們從理論上概述決策樹的構(gòu)建過程,這一過程包括如下四個步驟。1、決策樹的生成;2、生成樹的剪枝;3、生成規(guī)則;4、模型性能和預(yù)測。
詳細介紹了C5.0、CART算法的R語言實現(xiàn),并利用不同的決策樹算法對汽車類型進行識別。
第10節(jié)
條件推理算法決策樹的案例演示

R語言中的party包主要用于實現(xiàn)條件推理決策樹,介紹了ctree函數(shù)的參數(shù)設(shè)置。通過運用條件推理決策樹算法對汽車類型進行識別,并繪制決策樹圖進行直觀展示。

第11節(jié)
五折交叉驗證方法及其他機器學(xué)習(xí)算法R語言實現(xiàn)

介紹了評估和選擇合適的模型和算法:五折交叉驗證的方法。并介紹了組合算法、隨機森林、人工神經(jīng)網(wǎng)絡(luò)、支持向量機算法的R語言實現(xiàn)。

第12節(jié)
利用其他機器學(xué)習(xí)算法對cars數(shù)據(jù)集進行預(yù)測

利用數(shù)據(jù)集cars作為案例演示:介紹了構(gòu)建五折交叉驗證下標的代碼,并通過for循環(huán)構(gòu)建五折交叉驗證,通過對訓(xùn)練集和測試集進行預(yù)測,利用平均誤差率小原則,選擇優(yōu)模型對其他樣本進行預(yù)測。

第13節(jié)
rattle的使用

介紹了R語言數(shù)據(jù)挖掘可視化工具—Rattle的主要功能。包括:數(shù)據(jù)導(dǎo)入、數(shù)據(jù)探索、數(shù)據(jù)可視化、數(shù)據(jù)建模及模型評估等操作。讓學(xué)員能利用rattle工具快速完成數(shù)據(jù)挖掘工作的目的。

主站蜘蛛池模板: 欧美日韩一区二区综合| 一本久久综合亚洲鲁鲁五月天亚洲欧美一区二区| 一97日本道伊人久久综合影院| 亚洲色婷婷综合久久| 观看 国产综合久久久久鬼色 欧美 亚洲 一区二区| 色综合天天综合网国产国产人| 激情97综合亚洲色婷婷五| 综合国产精品第一页| 色综合.com| 一本色道久久综合亚洲精品| 伊人久久大香线蕉综合5g| 国产综合一区二区| 99综合电影在线视频好看| 一本色道久久88加勒比—综合| 狠狠色狠狠色综合日日不卡| 狠狠色丁香久久婷婷综合_中| 激情五月综合网| 久久久综合九色合综国产| 久久久久亚洲av综合波多野结衣| 一本大道加勒比久久综合| 欧美久久综合九色综合| 久久婷婷色综合一区二区| 久久99亚洲综合精品首页| 亚洲激情综合网| 久久婷婷色综合一区二区| 亚洲AV综合色一区二区三区| 欧美成人精品一区二区综合| 国产成人综合网在线观看| 色婷婷综合和线在线| 亚洲综合精品网站| 久久综合久久综合久久综合| 久久综合伊人77777麻豆| 色综合久久久久综合体桃花网| 国产成人精品综合在线观看| 国产欧美日韩综合精品二区| 亚洲国产免费综合| 色综合久久久久| 国产精品亚洲综合专区片高清久久久| 狠狠色伊人久久精品综合网| 五月六月综合欧美网站| 欧美日韩亚洲国内综合网|