
Python數據挖掘應用培訓
第一階段: Python 基礎精要,零基礎也能學會
1. 語法初步
2. 列表、字符串和元組
3. 集合與字典
4. 條件和循環語句
5. 若干重要內置函數應用
6. 文件操作
7. 函數及其應用
8. 正則表達式
9. 數據庫和 Python
10.排序算法、 動態規劃算法、遞歸算法等算法
第二階段:numpy、pandas等進行數據清洗和整理,充分統計分析數據
1. 整理數據(切片、產生隨機數、復制、廣播、排序等)
2. 數據索引和選擇的各種方法
3. 數據的分組、分割、合并、變形
4. 缺失值和空值的數據處理
5. 時間序列數據處理、建模和預測(ARIMA)
6. 含中文數據的處理
7. 數據去重、去離群值
8. R語言和Python(pandas)數據整理和建模的比較
9. 描述統計和推論統計分析
第三階段:Python機器學習算法和數據挖掘案例實戰
1. 文本挖掘原理和案例(Logistic 回歸模型對文本的分類)
2. 預測分析核心算法(圖片的K-means聚類分析)
3. 機器學習經典算法(圖片的識別和分類:PCA建模)
4. 概率統計(二維手寫數字識別 KNN方法)
5. 數據可視化(推薦系統和精準營銷 近鄰方法、協同過濾)
6. 金融建模分析(數據可視化的各種情形)
7. 客戶畫像和精準營銷(新聞的文本分類 TF-IDF準則、旅游新聞個性化推薦)
8. 算法和模型的優化(手寫識別)
9. 模型精度評估和提升(樸素貝葉斯決策)
10.特征選取的方法(酒的品質分類預測)
11.佳K-means分類數(機器學習的格點搜索和參數尋優)
12.交叉驗證(懲罰線性回歸分類器)
13.不平衡數據處理(使用支持向量機識別和分類)
14.XGBoost 使用案例 (金融時間序列預測)
15.貝葉斯分析(機器集成學習算法)
16.逼近和優化 (隨機模擬)
17.自然語言概率圖模型(用戶流失預警)
18 馬爾科夫&蒙特卡羅(量化投資實戰)