
CDA大數(shù)據(jù)分析師培訓
一
python開發(fā)基礎(chǔ)
1、Python概述
(1)計算機語言概述 (2)python簡史 (3)python相關(guān)
2、python語法基礎(chǔ)
(1)Python環(huán)境配置 (2)python基礎(chǔ)語法 (3)變量 (4)數(shù)據(jù)類型
(5)表達式和運算符 (6)分支結(jié)構(gòu) (7)循環(huán)結(jié)構(gòu)
3、函數(shù)
(1)函數(shù)初步 (2)細說參數(shù) (3)變量作用域 (4)遞歸調(diào)用
4、內(nèi)置函數(shù)
(1)字符串相關(guān)-string(2)列表-list(3)元組-tuple(4)集合-set(5)字典-dict
二
python數(shù)據(jù)分析
數(shù)據(jù)科學和AI概述
數(shù)據(jù)結(jié)構(gòu)和算法
Python 數(shù)據(jù)分析與數(shù)據(jù)挖掘簡介、環(huán)境搭建
Python數(shù)據(jù)分析工具箱
數(shù)據(jù)加載與存儲
數(shù)據(jù)規(guī)范化和處理
數(shù)據(jù)分析
數(shù)據(jù)挖掘
數(shù)據(jù)可視化
三
Hadoop大數(shù)據(jù)管理實戰(zhàn)應(yīng)用
1、Hadoop與大數(shù)據(jù)概要
(1)Hadoop生態(tài)系統(tǒng)介紹 (2)Hadoop集群安裝與部署 (3)Hadoop獨立部署
(4)Hadoop偽分布式安裝部署 (5)Hadoop集群安裝與部署 (6)Hadoop配置參數(shù)詳解
(7)Hadoop配置故障診斷
2、HDFS系統(tǒng)管理
(1)HDFS體系結(jié)構(gòu) (2)HDFS讀寫過程-串行寫與并行讀
(3)HDFS 管理接口-HDFS shell && HDFS Web Interface (4)HDFS 新增節(jié)點
(5)HDFS 刪除節(jié)點 (6)HDFS 版本升級 (7)HDFS 高可用性方案完全解析
3、Map/Reduce架構(gòu)與原理
(1)Map/Reduce體系結(jié)構(gòu) (2)Map/Reduce任務(wù)調(diào)度策略 (3)Map/Reduce 性能調(diào)優(yōu)
(4)Map/Reduce管理接口-Map/Reduce shell && Map/Reduce Web Interface
(5)Map/Reduce 類SQL工具Hive介紹
4、HBASE架構(gòu)與原理
(1)HBASE體系結(jié)構(gòu)(2)HBASE物理存儲(3)HBASE流程算法(4)HBASE與RDBMS的比較
(5)HBASE管理接口HBase Shell&& HBase Web Interface (6)Zookeeper介紹
5、Hadoop平臺操作實踐
(1)Hadoop集群部署(2)Hadoop文件管理(3)Hadoop數(shù)據(jù)管理(4)Hadoop集群監(jiān)控
(5)大數(shù)據(jù)應(yīng)用案例分析