階段三:Hadoop離線計算
學習內容:?
Hadoop生態環境介紹、Hadoop云計算中的位置和關系、國內外Hadoop應用案例介紹、Hadoop 概念、版本、歷史、Hadoop 核心組成介紹及hdfs、mapreduce 體系結構、Hadoop 的集群結構、Hadoop 偽分布的詳細安裝步驟、通過命令行和瀏覽器觀察hadoop、HDFS底層工作原理、HDFS datanode、namenode詳解、Hdfs shell、Hdfs java api 、Mapreduce四個階段介紹、Writable、InputSplit和OutputSplit、Maptask、Shuffle:Sort,Partitioner,Group,Combiner、Reducer......
學習目標:?
此部分帶領大家了解hadoop的用途,在大數據中的用途,以及快速搭建一個hadoop的實驗環境,在本過程中不僅將用到前面的Linux知識,而且會對hadoop的架構有深入的理解,并為你以后架構大數據項目打下堅實基礎。