
大數(shù)據(jù)計(jì)算技術(shù)培訓(xùn)
第一章 大數(shù)據(jù)計(jì)算技術(shù)概述
1.1 課程簡(jiǎn)介
1.2大數(shù)據(jù)計(jì)算概論(上)
1.3 大數(shù)據(jù)計(jì)算概論(下)
第二章 大數(shù)據(jù)計(jì)算系統(tǒng)
2.1 大數(shù)據(jù)計(jì)算系統(tǒng)
2.2 數(shù)據(jù)存儲(chǔ)系統(tǒng)
2.3 數(shù)據(jù)處理系統(tǒng)
2.4 數(shù)據(jù)處理系統(tǒng)(續(xù))
2.5 數(shù)據(jù)應(yīng)用系統(tǒng)
第三章 數(shù)據(jù)采集方法
3.1 系統(tǒng)日志數(shù)據(jù)采集
3.2 網(wǎng)絡(luò)數(shù)據(jù)采集
第四章 數(shù)據(jù)清洗與規(guī)約方法
4.1 臟數(shù)據(jù)類(lèi)型及處理方法
4.2 數(shù)據(jù)噪聲處理方法
4.3 數(shù)據(jù)集成方法
4.4 數(shù)據(jù)規(guī)約方法
4.5 數(shù)據(jù)建模方法
第五章 數(shù)據(jù)分析算法
5.1 C4.5算法
5.2 K-均值算法
5.3 SVM算法
5.4 Apriori算法
5.5 kNN算法
5.6 PageRank算法
第六章 文本讀寫(xiě)技術(shù)
6.1 讀取文本文件
6.2 讀取CSV文件
6.3 寫(xiě)入文本文件
6.4 其他操作
第七章 數(shù)據(jù)處理技術(shù)
7.1 數(shù)據(jù)合并技術(shù)
7.2 數(shù)據(jù)轉(zhuǎn)換技術(shù)
7.3 數(shù)據(jù)轉(zhuǎn)換技術(shù)(續(xù))
第八章 數(shù)據(jù)分析技術(shù)
8.1 Numpy工具包
8.2 Numpy工具包:基本運(yùn)算
8.3 Pandas工具包
8.4 Python Scikit-learn
8.5 Python NLTK 自然語(yǔ)言處理入門(mén)
第九章 數(shù)據(jù)可視化技術(shù)
9.1 數(shù)據(jù)可視化技術(shù)
第十章 大數(shù)據(jù)計(jì)算模式
10.1 大數(shù)據(jù)計(jì)算標(biāo)準(zhǔn)
10.2 大數(shù)據(jù)計(jì)算模式
第十一章 Hadoop計(jì)算架構(gòu)
11.1 Hadoop平臺(tái)
11.2 HDFS分布式文件系統(tǒng)
11.3 HDFS分布式文件系統(tǒng)(續(xù))
11.4 分布式存儲(chǔ)模型
11.5 分布式存儲(chǔ)架構(gòu)
11.6 二次索引表
第十二章 分布式并行計(jì)算模型
12.1 并行計(jì)算模型
12.2 MapReduce計(jì)算架構(gòu)
12.3 MapReduce計(jì)算流程
12.4 MapReduce算例描述
第十三章 圖并行計(jì)算架構(gòu)
13.1圖計(jì)算問(wèn)題
13.2 BSP圖計(jì)算模型
13.3 圖并行計(jì)算架構(gòu)
13.4 圖并行計(jì)算架構(gòu)(續(xù))
第十四章 流計(jì)算
14.1 流計(jì)算模型
14.2 流計(jì)算模型(續(xù))
14.3 ACK實(shí)現(xiàn)機(jī)制
第十五章 內(nèi)存計(jì)算模型
15.1 分布式緩存系統(tǒng)
15.2 內(nèi)存技術(shù)
15.3 MemCloud計(jì)算架構(gòu)
15.4 Spark 內(nèi)存計(jì)算
15.5 Spark 內(nèi)存計(jì)算