機器學習是指一套工具、方法或程式,使到我們可以從現實世界的海量數據里提煉出有價值的知識,規則和模式,然后將它們反哺給前臺應用系統,進行預測,推薦等能產生直接經濟價值的場景,給用戶帶來“機器具備人類般高智能”的震撼性體驗。對于數據越來越多,而人力成本又越來越高的大數據時代,機器學習能降低企業進行數據分析的成本,掌控有關技術,可以給企業和個人帶來巨大的價值。
機器學習,人工智能,數據挖掘,模式識別等技術,其實是同一座山峰在不同視角下的側影,其技術內涵幾乎是一樣的,都是回歸,分類器,聚類,頻繁模式挖掘,神經網絡等等,我們學習機器識別的同時,學到的知識同樣也可以用于數據挖掘和設計機器人這樣高度智能化的產品,這些領域概念之間至少在技術上沒有界限,是互相滲透的。
第1部份 機器學習概論
第2部份 線性回歸與Logistic。案例:電子商務業績預測
第3部份 嶺回歸,Lasso,變量選擇技術。從一團亂麻中識別有用維度的技巧
第4部份 降維技術。案例:業績綜合指標設計
第5部份 線性分類器,Knn算法,樸素貝葉斯分類器,文本挖掘,案例:智能判斷垃圾短信,通過文本挖掘給用戶加標簽,評論自動分析,用戶流失預警
第6部份 決策樹,組合提升算法,bagging和adaboost,隨機森林。案例:運營商用戶分析
第7部份 支持向量機,為什么能理解SVM的人鳳毛麟角?
第8部份 人工神經網絡,單層感知器,線性神經網絡,BP神經網絡,基于梯度下降的學習算法,圖像壓縮和銀行用戶信用評估
第9部份 通用逼近器徑向基函數神經網絡,在新觀點下審視PDA和SVM。Hopfield聯想記憶型神經網絡。案例:字符識別,人臉識別
第10部份 概率神經網絡和信念貝葉斯分類器
第11部份 聚類,孤立點判別。案例:推薦系統,自動品酒器,作弊識別,社會系統團體識別
|