
數據挖掘和數據統計分析技術—基于Python和R培訓
第一講 數據挖掘,Python和R簡介
1.1數據挖掘
1.2Python語言
1.3 R語言
1.4 Iris數據集
1.5 Bodyfat數據集
第二講 數據的導入與導出
2.1 R數據的保存與加載
2.2 CSV文件的導入與導出
2.3 通過ODBC從數據庫中讀取數據
2.4 從Excel中導入與導出數據
2.5 Python的數據操作
第三講 數據可視化展現
3.1 查看數據
3.2 單個變量展現
3.3 多個變量展現
3.4 更多探索
3.5 將圖表保存到文件中
第四講 決策樹與隨機森林
4.1 使用party包構建決策樹
4.2 使用rpart包構建決策樹
4.3 隨機森林
4.4 Python中的決策樹實現
4.5 Python決策樹實例
第五講 回歸分析
5.1 線性回歸
5.2 邏輯回歸
5.3 廣義線性回歸
5.4 非線性回歸
5.5 Python中的回歸實現
5.6 Python回歸實例
第六講 聚類分析
6.1 k-means聚類
6.2 k-medoids聚類
6.3 層次聚類
6.4 基于密度的聚類
6.5 Python中的聚類實現
6.6 Python聚類實例
第七講 離群點檢測
7.1單變量的離群點檢測
7.2局部離群點因子檢測
7.3用聚類方法進行離群點檢測
7.4時間序列數據的離群點檢測
7.5 Python中的孤立點實例
第八講 時間序列分析
8.1 R中的時間序列數據
8.2 時間序列分解
8.3 時間序列預測
8.4 時間序列聚類
8.5 時間序列分類
8.6 Python中的時間序列實例
第九講 關聯規則
9.1 關聯規則的基本概念
9.2 Titanic數據集
9.3 關聯規則挖掘
9.4 消除冗余
9.5 解釋規則
9.6 關聯規則的可視化
9.7 Python中的關聯規則實例
第十講 社交網絡分析
10.1 詞項網絡
10.2 推文網絡
10.3 雙模式網絡
10.4 Python中的社交網絡分析實例