數(shù)據(jù)挖掘?qū)τ谑廊藖?lái)說(shuō)在很大程度上是透明的。我們?cè)诖蠖鄶?shù)時(shí)間都從未注意到它的發(fā)生。但每當(dāng)我們辦理商店購(gòu)物卡、使用信用卡購(gòu)物或在網(wǎng)上沖浪時(shí),都在創(chuàng)建數(shù)據(jù)。這些數(shù)據(jù)以大數(shù)據(jù)集形式存儲(chǔ)在我們每天與之打交道的公司所擁有的功能強(qiáng)大的計(jì)算機(jī)上。存在于這些數(shù)據(jù)集之內(nèi)的便是模式 - 表明我們的興趣、習(xí)慣和行為。數(shù)據(jù)挖掘可讓人們找到并解讀這些模式,從而幫助人們做出更明智的決策,并更好地為客戶服務(wù)。
第一節(jié):數(shù)據(jù)挖掘基本知識(shí)RapidMiner工具介紹
第二節(jié):數(shù)據(jù)準(zhǔn)備:導(dǎo)入、預(yù)處理、導(dǎo)出
第三節(jié):數(shù)據(jù)挖掘模型和方法
第四節(jié):K-Means 聚類與辨別分析
第五節(jié):線性回歸與邏輯回歸
第六節(jié):決策樹(shù)與神經(jīng)網(wǎng)絡(luò)
第七節(jié):文本挖掘
第八節(jié):WEB挖掘
第九節(jié):協(xié)同過(guò)濾、推薦
第十節(jié):時(shí)間序列分析
第十一節(jié):離群點(diǎn)分析
第十二節(jié):模型評(píng)估-交叉驗(yàn)證與模型優(yōu)化化
第十三節(jié):過(guò)程控制
第十四節(jié):數(shù)據(jù)轉(zhuǎn)換與執(zhí)行命令 |