班級規模及環境--熱線:4008699035 手機:15921673576( 微信同號) |
每期人數限3到5人。 |
上課時間和地點 |
上課地點:【上海】:同濟大學(滬西)/新城金郡商務樓(11號線白銀路站) 【深圳分部】:電影大廈(地鐵一號線大劇院站)/深圳大學成教院 【北京分部】:北京中山學院/福鑫大樓 【南京分部】:金港大廈(和燕路) 【武漢分部】:佳源大廈(高新二路) 【成都分部】:領館區1號(中和大道) 【沈陽分部】:沈陽理工大學/六宅臻品 【鄭州分部】:鄭州大學/錦華大廈 【石家莊分部】:河北科技大學/瑞景大廈 【廣州分部】:廣糧大廈 【西安分部】:協同大廈
最近開課時間(周末班/連續班/晚班):2020年3月16日 |
實驗設備 |
☆資深工程師授課
☆注重質量
☆邊講邊練
☆合格學員免費推薦工作
★實驗設備請點擊這兒查看★ |
質量保障 |
1、培訓過程中,如有部分內容理解不透或消化不好,可免費在以后培訓班中重聽;
2、培訓結束后,授課老師留給學員聯系方式,保障培訓效果,免費提供課后技術支持。
3、培訓合格學員可享受免費推薦就業機會。 |
課程大綱 |
一、 課程背景
經濟30年快速發展,正在使我們漸漸窺探到數據時代的特征,隨著企業級數據的積累,相應的使現代統計軟件分析過程也發生變化,由傳統基本的數據挖掘技術,漸漸趨向于數據庫技術應用。與此同時各家軟件相應推出應對策略,像SAS、STATA、SPSS三大統計軟件,相序推出多線程、分布式等數據處理技術,這對于企業日益龐大的數據現狀來說,無疑在一定程度上緩解了大數據處理的壓力。SPSS2.0的推出,在海量數據分析方面有了顯著改善,同時SPSS兼備數據管理、數據庫訪問等技術,這在企業數據處理方面可以說是很完備的。通過案例演示,幫助學員更好的掌握SAS工具的使用。
二、 培訓收益
1. 了解SAS基本概念;
2. 理解SAS語言;
3. 掌握SAS數據集;
4. 了解SAS常用統計;
5. 通過案例掌握SAS軟件工具的基本使用;
6. 通過案例掌握SAS軟件工具的數據管理技巧;
7. 通過案例掌握SAS軟件工具的數據處理技巧;
8. 了解SAS EM基本知識和工具的使用;
9. 掌握SAS EM工具進行數據挖掘的實例;
10. 使學員掌握SAS的界面使用和基本編程使用,為學習和應用SAS的其他功能奠定堅實的基礎。
11. SAS技術與崗位需求零距離,使學員能夠快速有效的了解和處理企業數據要求。
三、 培訓大綱
培訓模塊 培訓內容
SAS軟件概述 1. SAS軟件簡介
2. SAS軟件的使用基礎
3. SAS語言的語句和程序
4. 建立SAS數據集
1) SAS數據集概述
2) SAS數據集的建立
3) SAS數據集的修改
5. 常用統計描述
1) 定量資料的統計描述
2) 定性資料統計描述
SAS軟件應用之數據管理(一) 企業的數據收集主要涉及3個方面:原始數據錄入、數據文件讀入和數據庫的訪問,這些我們將在前三節具體介紹,這里以實際企業要求為背景,強調學員的上機動手實踐能力。
1. 數據獲取。
企業需求:數據庫訪問、外部數據文件讀入、
案例分析:訪問db2、oracle、teradata等數據庫、以及不同格式文件的導入,如spss、excel、stata等軟件的數據文件。
2. 數據管理。
企業需求: 對大型數據進行編碼、清理、轉換。
案例分析: 介紹SAS/base的編程技術。
SAS軟件應用之數據管理(二) 1) data步:
文件操作語句:數據的訪問、整合、輸出
Input、put、File、Set、Merge、Infile
運行語句:程序運行
賦值和累加語句:Stop、abort、Where、output、Call;
2) 控制語句: 控制程序的運行
Do、If、Return、Go to、Link、Continue、leave、select(do);
3) 信息語句:數據集信息管理;
Array、Informat、Format、Drop和keep、Retain、Attrib;
數據庫語言SAS/SQL:匯總、檢索數據;
SAS軟件應用之數據管理(三) 3. 數據探索和報表呈現。
企業需求: 對企業級數據進行探索,主要涉及圖表的使用。
案例分析: 企業績效文件,如何生成美觀清晰的報告。
1)Means、Standard Univariate描述變量信息。
2)insight的數據探索過程。
3)SAS的tabulate制表過程繪制精美表格。
4. SAS高級程序語言宏程序。
企業需求: 宏程序可以增強普通程序的使用效率,減少重復性質作業的工作量、應用十分廣泛,像企業日常分析流程、大數據分析等。
案例分析: 企業日常分析流程的程序代碼優化。
SAS軟件應用之數據處理(一) 1. 相關與差異分析:corr、cancorr、anova。
企業需求:企業往往需要探索影響企業效率的因素間的相關關系,這是最基礎的過程,并在此基礎上了解存在的差異。
案例分析:產品合格率的相關與差異分析。
2. 線性與廣義線性預測:reg、logistic、genmod。
企業需求:
1)探索影響企業效率的因素,并進一步預測企業效率;
2)客戶違約可能性預測;
案例分析:產品合格率的影響因素及其預測分析與銀行客戶違約預報。
3. 因子分析:factor。
企業需求:需要抽取影響企業效率的主要因素,進行重點投資。
案例分析:客戶購買力信息研究。
4. 聚類分析:varclus。
企業需求:需要了解購買產品的客戶信息。
案例分析:客戶購買力信息研究。
SAS軟件應用之數據處理(二) 5. 生存分析:phreg。
企業需求: 研發新產品的使用周期,能夠縮短投入成本,并可以有效的預期市場使用率。
案例分析: 產品耐用性研究。
6. 對應分析:corresp。
企業需求: 定性資料的數據大量存在,尤其是多分類的情況。
案例分析: 女性購物信息的關聯度研究。
7. 穩健模型:robustreg。
企業需求: 企業中大量的實驗經濟研究可以大幅減少成本投入。
案例分析: 管理特征與員工勝任力的關系調查。
8. 方差分析
1) 案例說明:完全隨機設計資料的方差分析
2) 案例說明:隨機區組設計資料的方差分析
3) 案例說明:拉丁方設計資料的方差分析
4) 案例說明:析因設計資料的方差分析
5) 案例說明:重復測量資料的方差分析
9. 線性相關與回歸
1) 案例說明:直線相關與回歸
2) 案例說明:Spearman秩相關
案例說明:多重線性回歸與相關
SAS Enterprise Miner(一) 1. 啟動SAS EM
2. 建立工程和流程圖
3. 識別窗口組件
4. SAS EM挖掘過程
5. SAS EM結點介紹
1) EM基本介紹
2) EM特色
3) EM界面
4) SEMMA方法論
5) 節點簡介
6) 節點通用概貌
SAS Enterprise Miner(二) 6. 抽樣
7. 探索
8. 調整
9. 模型
10. 評估
11. 在過程流程圖中放置節點的一般規則
SAS EM實例進階(一) 1. SAS Enterprise Miner 簡介
1) 數據挖掘簡介
2) EM簡介
2. SAS數據挖掘實例
3. 分類的基本概念與步驟
4. 使用EM進行數據挖掘
1) 例程背景描述
2) 第一步—新建項目
3) 第二步—定義輸入數據集
4) 第三步—設置目標變量
SAS EM實例進階(二) 5) 第四步—為目標變量 Variable 設置 Target Profile
6) 第五步—檢查 Interval 和 Class 變量的統計信息
7) 第六步—建立訓練數據和檢驗數據
8) 第七步—轉換變量
9) 第八步—建立 Stepwise Logistic Regression Model
10) 第 九 步 — 建 立 Multilayer Perceptron Neural
11) 第十步—評估模型
12) 第十一步—定義 Score Data Set
13) 第十二步—對 Score Data Set 進行預測
14) 第十三步—查看 Score Data Set 的 Expected Loss
15) 第十四步—為信用好的申請者創建 Score card |
|
|
|
|