互聯網金融是新興涌現出來的金融創新模式。它結合了成熟的互聯網技術、電商消費和人工智能等手段,打破了傳統線下銀行的壁壘,在橫向的廣度和縱向的深度上都為傳統金融機構帶來了顛覆性的革新,為現代的融資、購物、支付等需求提供了強大的便利。同時,也由于互金平臺中的實時性、快捷性和復雜性等特點,該領域也爆發了大量的欺詐行為,給互金機構帶來及其嚴重的損失。過去的反欺詐手段主要以專家經驗和規則為主。隨著大數據、機器學習、深度學習等技術的發展,越來越多的互金平臺將量化模型引入到反欺詐工作中農。本課程以消費金融領域的交易反欺詐為例,介紹如何將機器學習模型應用在反欺詐工作中,從而為互金平臺識別欺詐、降低損失。
第一部份:python的介紹和入門
1) python語法
2) pandas,numpy,statsmodels,sklearn等常用包
第二部份:數據分析建模的準備工作
1) 業務背景
2) 數據清洗
3) 特征工程
4) 數據可視化
第三部份:建模的預備知識
1) 損失函數
2) 參數估計
3) 性能評價
第四部份:邏輯回歸模型的介紹
1) 邏輯回歸模型的簡介
2) 邏輯回歸模型的參數估計
第五部份:邏輯回歸模型在反欺詐中的應用
1) 邏輯回歸模型的特征處理
2) 邏輯回歸模型的結果解讀
第六部份:支持向量機模型的介紹
1) 支持向量機模型的原理
第七部份:支持向量機模型在反欺詐中的應用
1) 支持向量機模型的應用
第八部份:機器學習中的集成模型
1) 元模型與集成模型
2) 集成的方式:bagging,boosting與stacking
第九部份:決策樹與隨機森林及其應用
1) 決策樹模型
2) 隨機森林模型
3) 隨機森林的應用
4) 特征重要性評估
第十部份:GBDT模型及其應用
1) GBDT模型的原理
2) GBDT模型的應用
3) 特征重要性評估
第十一部份:集成模型中的stacking方法
1) 多模型的stacking
第十二部份:反欺詐業務中的衍生問題
1) 無監督模型與半監督模型
2) 聚類模型
3) 非平衡樣本的處理方法
|