
Python數據挖掘和分析培訓
Python基礎和數據科學基礎
1. Python語言和開發環境簡介
2. 數據科學概述
3. 數據分析流程和步驟
4. 數據獲取路徑
5. 法律法規
6. Python語言和數據科學
7. 理解基本的字符串函數
8. 選擇合適的數據結構
9. 通過列表推導式理解列表
10. 使用計數器,使用文件和網絡
11. 使用正則表達式實現模式匹配
12. globbing文件名與其他字符串
13. Pickling和Unpickling數據
14. 文本數據的處理
15. 數據庫數據的處理
16. 通用函數和各類聚合函數
Python數據分析基礎
1. 搭建Python開發平臺
2. 所要考慮的問題
3. 基礎平臺的搭建
4. Python使用入門
5. 運行方式
6. 基本命令
7. 數據結構
8. 庫的導入與添加
9. Python數據分析工具
10. ?Numpy
11. ?Scipy
12. ?Matplotlib
13. ?Pandas
14. ?StatsModels
15. ?Scikit-Learn
16. ?Keras
17. ?Gensim
數據探索
1. 數據質量分析
2. 缺失值分析
3. 異常值分析
4. 一致性分析
5. 數據特征分析
6. 分布分析
7. 對比分析
8. 統計量分析
9. 周期性分析
10. 貢獻度分析
11. 相關性分析
12. Python主要數據探索函數
13. 基本統計特征函數
14. 拓展統計特征函數
15. 統計作圖函數
數據預處理
1. 數據清洗60
2. 缺失值處理60
3. 異常值處理64
4. 數據集成64
5. 實體識別64
6. 冗余屬性識別65
7. 數據變換65
8. 簡單函數變換65
9. 規范化66
10. 連續屬性離散化68
11. 屬性構造70
12. 小波變換71
13. 數據規約74
14. 屬性規約74
15. 數值規約77
16. Python主要數據預處理函數80
數據挖掘建模
1. 分類與預測83
2. 實現過程83
3. 常用的分類與預測算法84
4. 回歸分析85
5. 決策樹89
6. 人工神經網絡95
7. 5.1.6?分類與預測算法評價100
8. 5.1.7?Python分類預測模型特點103
9. 5.2?聚類分析104
10. 5.2.1?常用聚類分析算法104
11. 5.2.2?K-Means聚類算法105
12. 5.2.3?聚類分析算法評價111
13. 5.2.4?Python主要聚類分析算法111
14. 5.3?關聯規則113
15. 5.3.1?常用關聯規則算法114
16. 5.3.2?Apriori算法114
17. 5.4?時序模式119
18. 5.4.1?時間序列算法120
19. 5.4.2?時間序列的預處理120
20. 5.4.3?平穩時間序列分析122
21. 5.4.4?非平穩時間序列分析124
22. 5.4.5?Python主要時序模式算法132
23. 5.5?離群點檢測134
24. 5.5.1?離群點檢測方法135
25. 5.5.2?基于模型的離群點檢測方法136
26. 5.5.3?基于聚類的離群點檢測方法138
數據挖掘實戰項目一—客戶價值分析
1. 背景與挖掘目標164
2. 7.2?分析方法與過程166
3. 7.2.1?數據抽取168
4. 7.2.2?數據探索分析168
5. 7.2.3?數據預處理169
6. 7.2.4?模型構建173
數據挖掘實戰項目二--電子商務網站用戶行為分析及服務推薦
1. 背景與挖掘目標238
2. 12.2?分析方法與過程240
3. 12.2.1?數據抽取242
4. 12.2.2?數據探索分析244
5. 12.2.3?數據預處理251
6. 12.2.4?模型構建256
協議分析
1. Web端協議分析
2. 網頁登錄POST分析
3. 隱藏表單分析
4. 加密數據分析
5. 驗證碼問題
6. IP代理
7. Cookie登錄
8. 傳統驗證碼識別
9. 人工打碼
10. 滑動驗證碼
11. PC客戶端抓包分析
12. HTTP Analyzer簡介
13. 蝦米音樂PC端API實戰分析
14. App抓包分析
15. Wireshark簡介
16. 酷我聽書App端API實戰分析
17. API爬蟲:爬取mp3資源信息
Scrapy爬蟲框