歸納數據集;金融數據標準化;支持向量機分類模型的選擇和應用;用支持向量機模型進行預測; 模型評估
適用人群
學習金融學、數據、計算機的高校生、在職的基金經理、投研總監、專業投資者、金融分析師、量化分析
課程簡介
案例數據集來源于UCI網站。該數據集中的圖象數據分別來源于真紙幣和偽紙幣。通常是通過工業相機生成400x 400像素的圖象。然后利用小波變換工具從圖象中提取相關特征。數據集中共有1372條記錄,4個連續型的特征變量,和1個二元分類變量,無缺失數據。
支持向量機分類算法是機器學習中的一個基礎且非常重要的算法。它利用傳統的數學優化方法,即,二次函數的優化,對數據進行分類。Python的優勢在于開源,基于Python的各類機器學習算法非常豐富而且方便使用。我們將以紙幣識別案例數據集為一個點的同時,討論支持向量機分類原理和Python算法并用他們來區分真紙幣和偽紙幣。
本案例的特點是將識別真假紙幣的金融決策問題的解決方案與機器學習中的支持向量機算法進行結合,并利用Python設計一個自動分類算法來對案例數據集進行學習并輔助我們進行決策。這三者的結合就是智能金融在金融行業的一種經典應用。
學生通過本案例的學習將能夠充分理解并在未來能夠使用支持向量機算法和Python程序來解決一個具體金融決策問題。本案例中還將介紹數據預處理和變量工程概念,從而有助于掌握數據處理的方法和技巧。
通過案例學習后,如果學生能夠獨立完成作業,學生將能達到以下預期目標:
能夠將歸納一個金融問題的數據集;
2. 金融數據的處理和標準化;
3. 支持向量機分類模型的選擇和應用;
4. 用支持向量機模型進行預測;
5. 對支持向量機模型進行評估 |