InfoSphere DataStage是IBM統一數據集成平臺InfoSphere Information Server(IIS) 的重要組件,是業界主流的 ETL(Extract, Transform, Load) 工具。DataStage執行從源系統到目標系統的批量和實時的數據轉換和移動,它廣泛支持各種異構平臺的數據源和各種類型的數據格式(結構化、半結構化和非結構化數據);通過簡單易用的圖形化設計方式,并內置豐富的功能組件,從而支持從簡單到高度復雜的數據結構中,對大量數據進行收集、清洗、整合和轉換,具有滿足最苛刻的數據集成需求所需的功能性、靈活性和可伸縮性。本課程主要介紹InfoSphere DataStage的基本架構和產品特點,并基于實戰案例詳細講解DataStage的安裝、配置、開發以及較佳實踐。
第一部份 IBM數據集成與治理方案簡介
第二部份 Infosphere Datastage 架構、安裝與配置
第三部份 Infosphere Datastage 管理與開發部署流程
第四部份 Infosphere Datastage 數據連接組件使用
第五部份 Infosphere Datastage 數據合并、排序與聚合組件使用
第六部份 Infosphere Datastage 數據轉換組件使用
第七部份 Infosphere Datastage 自定義公共組件與過程
第八部份 Infosphere Datastage 作業序列和作業控制
第九部份 Infosphere Datastage 作業調試、調度與監控
第十部份 Infosphere Datastage 數據血源分析
第十一部份 Infosphere Datastage 性能調優和較佳實踐
第十二部份 Infosphere Datastage 實戰案例分享