第一部份:初等概率論
1) 離散隨機(jī)變量與離散分布
2) 連續(xù)隨機(jī)變量與連續(xù)分布
3) 條件概率與貝葉斯公式
4) 馬爾科夫矩陣
5) 案例:信貸違約的轉(zhuǎn)移矩陣
第二部份:初等統(tǒng)計理論
1) 假設(shè)檢驗
2) 參數(shù)估計
3) 線性回歸
4) 案例:性別對信貸違約的影響
第三部份:數(shù)據(jù)分析師的養(yǎng)成計劃
1) 業(yè)務(wù)背景
2) 數(shù)據(jù)搜集與整理
3) 數(shù)據(jù)可視化與數(shù)據(jù)報表
4) 案例:信貸違約預(yù)測中的數(shù)據(jù)可視化
第四部份:python的介紹和入門
1) python語法
2) pandas,numpy,statsmodels,sklearn等常用包
3) 案例:pandas中的數(shù)據(jù)切片
第五部份:時間序列模型的應(yīng)用
1) AR模型
2) MA模型
3) ARIMA模型
4) 其他常見的時間序列模型
5) 案例:從股票收益率的預(yù)測說起
第六部份:廣義線性回歸
1) 泊松回歸
2) 邏輯回歸
3) 案例:預(yù)測違約發(fā)生事件數(shù)
第七部份:分類場景之決策樹與隨機(jī)森林
1) 分類樹的基本概念
2) 如何控制模型過擬合
3) 回歸樹的基本概念
4) 隨機(jī)森林
5) 案例:信用卡的欺詐識別
第八部份:分類場景之支持向量機(jī)
1) 從線性可分說起
2) 對偶問題
3) 巧妙的核函數(shù)
4) 軟間隔:妥協(xié)的藝術(shù)
5) SMO算法詳解
6) 案例:信用卡的欺詐識別
第九部份:聚類場景之K均值聚類與K鄰近聚類
1) K均值聚類:物以類聚、人以群分
2) K鄰近聚類:近朱者赤、近墨者黑
3) 案例:信貸客群的聚類分析
第十部份:一統(tǒng)江湖之神經(jīng)網(wǎng)絡(luò)模型與深度學(xué)習(xí)模型
1) 神經(jīng)網(wǎng)絡(luò)模型的基本框架
2) 反向傳播算法
3) 深度學(xué)習(xí)模型
4) TensorFlow的使用
5) 案例:信用卡的欺詐識別
第十一部份:模型性能評估
1) 回歸模型的精度刻畫
2) 分類模型的精度刻畫
3) 案例:信用卡的欺詐識別
第十二部份:走近經(jīng)典
1) EM算法
2) MCMC算法
3) 主成分分析
4) 案例:信用卡的欺詐識別模型中的降維
第十三部份:被忽視的也是最重要的
1) 數(shù)據(jù)質(zhì)量檢驗
2) 特征工程
3) 案例:信用卡的欺詐識別 |