
R語言數據挖掘與商業分析建模培訓
R語言數據挖掘與商業分析建模
第0講 數據分析基本概念
0.1 商業數據分析的本質
0.2 商業數據分析中心建設
0.3 商業數據分析的階段與行業運用
0.4 商業數據分析在銀行中的運用
0.5 商業數據挖掘通用方法論
0.6 課程安排
第1講 準備知識
1.1.0 引言與課程介紹
1.1.1 Capital One的故事
1.1.2 風險管理的理解
1.1.3 巴塞爾協議介紹
1.1.4 三大類風險
1.1.5 信用評分卡類型
1.1.6 信用風險IT系統
1.2.1 數據挖掘方法分類
1.2.2 分類模型示例
1.3.1 R的身世和特點1
1.3.2 安裝R和包
1.4 數據分析流程演示
1.5 參考資料講解
第2講 R語言編程基礎與數據整合(分開2)
2.1.1 R的基本數據類型
2.1.2 R的數據結構
2.1.3 R程序控制
2.1.4_1 R的函數與包
2.1.4_2 R的函數與包
2.1.5 R的時間與日期類型
2.1.6 在R中讀取數據
2.2.1 背景介紹
2.2.2 數據庫基礎知識
2.2.3 數據介紹
2.3.1 SQL語句介紹
2.3.2 縱向連接表
2.3.3 橫向連接表
第3講 描述性統計分析基礎
3.1 描述性統計與探索型數據分析-1
3.1 描述性統計與探索型數據分析-2
3.2 APPLY函數族
3.3 制圖原理-1
3.3 制圖原理-2
3.4 R基礎繪圖包
3.5 GGPLOT2繪圖
3.6 使用SQL進行匯總
3.7_1 使用描述性方法做貸款違約特征探索_1
3.7_2 使用描述性方法做貸款違約特征探索_2
3.7_3 使用描述性方法做貸款違約特征探索_3
第4講 數據清洗與信息壓縮(分開2)
4.1 FRM提取行為變量
4.2 數據重組
4.3 抽樣知識
4.4.0 信息壓縮(概述)
4.4.1 分類變量重編碼(概化)
4.4.2 基于目標變量的轉換-WOE
4.5.1 主成分分析
4.5.2_1 變量聚類
4.5.2_2 變量聚類
4.6 臟數據或數據不正確
4.7 數據重復
4.8 缺失值處理
4.9 噪聲值處理
第5講 統計推斷基礎
5.1 參數估計
5.2 假設檢驗與單樣本T檢驗
5.3 兩樣本T檢驗
5.4 方差分析
5.5 相關分析
5.6 卡方檢驗
第6講 客戶價值預測_線性回歸模型與診斷
6.0 內容介紹
6.1 相關性分析
6.2.1 簡單線性回歸_1
6.2.1 簡單線性回歸_2
6.2.1 簡單線性回歸_3
6.2.2 模型解釋
6.2.3 多元線性回歸
6.2.4 多元線性回歸的變量篩選
6.3.0 線性回歸的診斷介紹
6.3.1 殘差分析
6.3.2 強影響點分析
6.3.3 多重共線性分析
6.4 數值預測評估原理
6.5.0 正則化方法介紹
6.5.1 嶺回歸
6.5.2 LASSO算法
6.6 附錄:估計方法
第7講 用邏輯回歸作申請評分信用評級
7.0 內容介紹
7.1 分類變量的相關關系
7.2 邏輯回歸
7.3 模型評估_1決策類
7.3 模型評估_2排序類介紹
7.3 模型評估_3ROC
7.3 模型評估_4其它排序類
7.3 模型評估_5R的實現
7.4 因果關系建模與取數邏輯
7.5 附錄:邏輯回歸估計方法
第8講 用決策樹做可表述的模式
8.1 決策樹建模思路
8.2 決策樹建模基本原理
8.3 Quinlan系列決策樹建模原理_1
8.3 Quinlan系列決策樹建模原理_2
8.4 CART決策樹建模原理_1
8.4 CART決策樹建模原理_2
8.5 模型修剪—以CART為例
8.7 組合算法與隨機森林
8.8 汽車貸款違約的模式表述
第9講 用神經網絡做行為信用評級
9.0 前言
9.1 基本概念
9.2 人工神經網絡結構
9.3 感知器與BP網絡_1
9.3 感知器與BP網絡_2
9.3 感知器與BP網絡_3
9.3 感知器與BP網絡_4
9.4 徑向基神經網絡_1
9.4 徑向基神經網絡_2
9.4 徑向基神經網絡_3
第10講 分類器入門與支持向量機
10.1.0 分類器的概念
10.1.1 KNN算法_1
10.1.1 KNN算法_2
10.1.2 樸素貝葉斯_1
10.2.1 支持向量機概述
10.2.2 支持向量機詳述_1
10.2.2 支持向量機詳述_2
10.2.2 支持向量機詳述_3
第11講 客戶聚類與聚類后畫像
11.1 基本概念
11.2 層次聚類_1
11.2 層次聚類_2
11.3.1 K-means聚類_1
11.3.1 K-means聚類_2
11.3.1 K-means聚類_3
11.3.2使用決策樹做聚類后客戶畫像
第12講 使用推薦算法提升客戶價值
12.1 廣告推薦介紹
12.2 購物籃分析與運用_1
12.2 購物籃分析與運用_2
12.3 相關性在推薦中的運用
12.4.1 協同過濾介紹
12.4.2 基于物品的協同過濾
12.5 基于內容的推薦
12.6 附錄:矩陣奇異值分解(SVD)在協同過濾中的運用
第13講 使用時間序列(ARIMA)分析做銷售量預測
13.1 認識時間序列
13.2 簡單時間序列分析法:平滑算法_1
13.2 簡單時間序列分析法:平滑算法_2
13.2 簡單時間序列分析法:平滑算法_3
13.2 簡單時間序列分析法:平滑算法_4
13.3 平穩時間序列(ARMA)模型設定與識別_1
13.3 平穩時間序列(ARMA)模型設定與識別_2
13.3 平穩時間序列(ARMA)模型設定與識別_3
13.4 非平穩時間序列(ARIMA)模型_1
13.4 非平穩時間序列(ARIMA)模型_2
13.5 實際數據時間序列建模步驟_1
13.5 實際數據時間序列建模步驟_2
13.5 實際數據時間序列建模步驟_3
第14講 汽車金融申請信用評級模型案例
案例1.1 業務理解
案例1.2 數據理解
案例1.3.1 拒絕推斷_1
案例1.3.1 拒絕推斷_2
案例1.3.1 拒絕推斷_3
案例1.3.2 變量粗篩
案例1.3.3 變量細篩與數據清洗_1
案例1.3.3 變量細篩與數據清洗_2
案例1.3.3 變量細篩與數據清洗_3
案例1.3.4 連續變量分箱WOE轉換
案例1.4 建模與模型評估
案例1.5 模型監測