
機(jī)器學(xué)習(xí)與R語(yǔ)言培訓(xùn)
一:機(jī)器學(xué)習(xí)基本理論
機(jī)器學(xué)習(xí)概述
機(jī)器學(xué)習(xí)算法分類及知識(shí)框架
機(jī)器學(xué)習(xí)相關(guān)概念
機(jī)器學(xué)習(xí)一般步驟
案例:用R實(shí)現(xiàn)機(jī)器學(xué)習(xí)模型預(yù)測(cè)
二:R語(yǔ)法基礎(chǔ)
R語(yǔ)言基礎(chǔ)語(yǔ)法
數(shù)據(jù)處理常用R包介紹(tidyr,dplyr,stringr,reshape2,ggplot2)
數(shù)據(jù)的存取與編輯
非結(jié)構(gòu)化數(shù)據(jù)的讀取
案例:用R實(shí)現(xiàn)MySQL數(shù)據(jù)庫(kù)數(shù)據(jù)讀取
三:數(shù)據(jù)清洗方法
缺失數(shù)據(jù)處理
異常值的辨識(shí)處理
不平衡數(shù)據(jù)的處理
特征提取與特征工程
案例:針對(duì)美國(guó)人群收入等數(shù)據(jù)進(jìn)行數(shù)據(jù)清洗
四:線性回歸與Logistic回歸
線性回歸與小二乘法
Lasso回歸及嶺回歸
Logistic回歸模型
多分類Logistic回歸模型
案例:運(yùn)用Logistic回歸模型預(yù)測(cè)學(xué)生錄取情況
五:K近鄰(KNN)算法
k近鄰算法原理
k近鄰算法R實(shí)現(xiàn)
案例:運(yùn)用KNN實(shí)現(xiàn)前列腺癌癥檢測(cè)
六:聚類算法
聚類算法原理
聚類算法R實(shí)現(xiàn)
案例:運(yùn)用聚類分析進(jìn)行離群點(diǎn)識(shí)別
七:基于決策樹類型算法介紹
決策樹算法
隨機(jī)森林算法
八:提升算法
Adaboost算法
GBDT算法
XGBoost
案例:針對(duì)美國(guó)人群收入預(yù)測(cè)模型比較
九:SVM支持向量機(jī)算法介紹
SVM基本原理
SVM算法的R實(shí)現(xiàn)
十:人工神經(jīng)網(wǎng)絡(luò)
人工神經(jīng)網(wǎng)絡(luò)(RNN)
深度學(xué)習(xí)
案例:運(yùn)用神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn)手寫數(shù)字識(shí)別
十一:地圖可視化:上海交通地圖數(shù)據(jù)可視化實(shí)戰(zhàn)
數(shù)據(jù)可視化基本圖形選擇匯總
繪制數(shù)據(jù)地圖常用方法
交互式可視化實(shí)戰(zhàn)
十二:機(jī)器學(xué)習(xí)mlr包:債務(wù)預(yù)測(cè)實(shí)戰(zhàn)
mlr包介紹
實(shí)際問(wèn)題分析及數(shù)據(jù)處理
多種分類算法模型的比較