
大數據分析及可視化培訓
數據處理及復雜數據可視化(一)
第一講 大數據挖掘及可視化介紹? 數據挖掘及可視化背景? 數據挖掘流程? 常用挖掘工具介紹? R語言的優勢?
R數據挖掘可視化工具-Rattle快速上手? R語言對復雜數據可視化的優勢? R語言快速入門? 利用caret包做數據抽樣及虛擬化處理
數據處理及復雜數據可視化(二)
第二講 數據質量分析及高級可視化? 缺失值處理的高級方法? 異常值甄別的高級方法? 數據可視化進階:lattice及ggplot2包介紹? 數據交互可視化:
rCharts、recharts、networkD3、plotly等包介紹
數據挖掘模型實戰(一)
第三講 聚類分析及R語言實現聚類分析是一種原理簡單、應用廣泛的數據挖掘技術。顧名思義,聚類分析即是把若干事物按照某種標準歸為幾個類別,
其中較為相近的聚為一類,不那么相近的聚于不同類。
? 案例一:對著名的鳶尾花數據進行K均值聚類分析
? 案例二:對汽車數據進行K均值聚類分析
? 案例三:對洛杉磯街區數據進行層次聚類
? 案例四:對汽車數據進行層次聚類
第四講 關聯規則及R語言實現關聯規則(著名的“啤酒和尿布”)是數據挖掘的基礎和核心技術之一,
本講將著重圍繞經典的Apriori算法,闡明關聯規則的支持、置信和提升程度與控制,使用R語言快速完成關聯規則分析,
并通過arulesViz擴展包對關聯規則進行可視化展示。案例:利用超市購物籃Groceries數據進行關聯規則分析
數據挖掘模型實戰(二)
第五講 KNN近鄰算法及R語言實現KNN(k-Nearest Neighbor)分類算法是數據挖掘分類技術中較簡單的方法之一。
所謂k近鄰,就是k個近的鄰居的意思,說的是每個樣本都可以用它接近的k個鄰居來代表。
? 案例一:對鳶尾花數據集進行knn分類
? 案例二:對乳腺癌數據進行knn分類
? 案例三:對文本數據進行knn分類
第六講 決策樹分類及R語言實現決策樹是數據挖掘的經典方法,其原理容易被理解。
本講主要講授兩種為普遍的決策樹算法:CART和C5.0算法,使用rpart和C50函數進行R語言分析。
? 案例一:對鳶尾花數據集運用C50算法分類
? 案例二:對鳶尾花數據集運用CART算法進行分類
? 案例三:對汽車數據運用CART對汽車重量進行預測
行業應用案例分享(一)
第七講 深度挖掘用戶付費行為及社會網絡分析? 對用戶的購買行為進行購物籃分析? 智能推薦系統常用算法介紹
? 對用戶購物行為構建智能推薦系統? 社會網絡圖基本知識? 利用R語言繪制社會網絡圖? 利用Gephi繪制社會網絡圖? 對用戶購物行為進行聚類分析,發現社群
行業應用案例分享(二)
第八講 客戶價值分析? 背景與挖掘目標? 分析方法及過程? 數據探索分析? 數據預處理? 模型構建? 模型應用
第九講 漏斗模型及路徑分析? 漏斗模型的主要應用場景? 路徑分析的主要應用場景? 漏斗模型與路徑分析的不同點
? sunburst事件路徑圖的繪制方法? 利用基于時序的關聯規則對點擊事件進行分析