在信貸風(fēng)控領(lǐng)域,隨著大數(shù)據(jù)、計(jì)算機(jī)集群技術(shù)、網(wǎng)絡(luò)技術(shù)和人工智能的發(fā)展,越來越多的金融機(jī)構(gòu)將傳統(tǒng)的策略風(fēng)控手段轉(zhuǎn)向依賴機(jī)器學(xué)習(xí)模型等量化手段。信貸環(huán)節(jié)中的審批、預(yù)警、催收以及營銷等諸多場景也適合機(jī)器學(xué)習(xí)模型的應(yīng)用。機(jī)器學(xué)習(xí)模型的發(fā)展離不開數(shù)學(xué)、統(tǒng)計(jì)、概率、計(jì)算機(jī)理論等基礎(chǔ)知識(shí)。本課程將從較為基礎(chǔ)的統(tǒng)計(jì)和概率入手,展現(xiàn)如何從從基礎(chǔ)知識(shí)入門進(jìn)而掌握較為先進(jìn)的機(jī)器學(xué)習(xí)模型,從而構(gòu)建簡單但實(shí)用的風(fēng)控模型。
第一部份:初等概率論
1) 離散隨機(jī)變量與離散分布
2) 連續(xù)隨機(jī)變量與連續(xù)分布
3) 條件概率與貝葉斯公式
4) 馬爾科夫矩陣
5) 案例:信貸違約的轉(zhuǎn)移矩陣
第二部份:初等統(tǒng)計(jì)理論
1) 假設(shè)檢驗(yàn)
2) 參數(shù)估計(jì)
3) 線性回歸
4) 案例:性別對信貸違約的影響
第三部份:數(shù)據(jù)分析師的養(yǎng)成計(jì)劃
1) 業(yè)務(wù)背景
2) 數(shù)據(jù)搜集與整理
3) 數(shù)據(jù)可視化與數(shù)據(jù)報(bào)表
4) 案例:信貸違約預(yù)測中的數(shù)據(jù)可視化
第四部份:python的介紹和入門
1) python語法
2) pandas,numpy,statsmodels,sklearn等常用包
3) 案例:pandas中的數(shù)據(jù)切片
第五部份:時(shí)間序列模型的應(yīng)用
1) AR模型
2) MA模型
3) ARIMA模型
4) 其他常見的時(shí)間序列模型
5) 案例:從股票收益率的預(yù)測說起
第六部份:廣義線性回歸
1) 泊松回歸
2) 邏輯回歸
3) 案例:預(yù)測違約發(fā)生事件數(shù)
第七部份:分類場景之決策樹與隨機(jī)森林
1) 分類樹的基本概念
2) 如何控制模型過擬合
3) 回歸樹的基本概念
4) 隨機(jī)森林
5) 案例:信用卡的欺詐識(shí)別
第八部份:分類場景之支持向量機(jī)
1) 從線性可分說起
2) 對偶問題
3) 巧妙的核函數(shù)
4) 軟間隔:妥協(xié)的藝術(shù)
5) SMO算法詳解
6) 案例:信用卡的欺詐識(shí)別
第九部份:聚類場景之K均值聚類與K鄰近聚類
1) K均值聚類:物以類聚、人以群分
2) K鄰近聚類:近朱者赤、近墨者黑
3) 案例:信貸客群的聚類分析
第十部份:一統(tǒng)江湖之神經(jīng)網(wǎng)絡(luò)模型與深度學(xué)習(xí)模型
1) 神經(jīng)網(wǎng)絡(luò)模型的基本框架
2) 反向傳播算法
3) 深度學(xué)習(xí)模型
4) TensorFlow的使用
5) 案例:信用卡的欺詐識(shí)別
第十一部份:模型性能評(píng)估
1) 回歸模型的精度刻畫
2) 分類模型的精度刻畫
3) 案例:信用卡的欺詐識(shí)別
第十二部份:走近經(jīng)典
1) EM算法
2) MCMC算法
3) 主成分分析
4) 案例:信用卡的欺詐識(shí)別模型中的降維
第十三部份:被忽視的也是最重要的
1) 數(shù)據(jù)質(zhì)量檢驗(yàn)
2) 特征工程
3) 案例:信用卡的欺詐識(shí)別
|