Hive如何擴(kuò)展MapReduce 如何使用Hive創(chuàng)建和操作表 Hive基本和高級數(shù)據(jù)類型 對數(shù)據(jù)進(jìn)行分區(qū)和分組 高級Hive特性 如何用Pig加載和操作數(shù)據(jù) PigLatin編程語言的特性 用Pig解決實(shí)際數(shù)據(jù)分析問題。Hadoop分布式文件系統(tǒng)(HDFS)和MapReduce的工作原理 如何優(yōu)化Hadoop機(jī)群所需要的硬件配置 搭建Hadoop機(jī)群所需要考慮的網(wǎng)絡(luò)因素 如何利用Hadoop配置選項(xiàng)進(jìn)行系統(tǒng)性能調(diào)優(yōu) 如何利用FairScheduler為多用戶提供服務(wù)級別保障 Hadoop機(jī)群維護(hù)和監(jiān)控 如何使用Flume從動態(tài)生成的文件加載數(shù)據(jù)到Hadoop 如何使用Sqoop從關(guān)系型數(shù)據(jù)庫加載數(shù)據(jù) 使用其他Hadoop相關(guān)系統(tǒng)工具(諸如Hive,Pig和HBase)所涉及到的系統(tǒng)管理問題。Hadoop分布式文件系統(tǒng)(HDFS)和MapReduce的工作原理 如何利用JAVA API或者其他編程語言來開發(fā)MapReduce應(yīng)用 MapReduce任務(wù)開發(fā)中的注意事項(xiàng) 如何在Hadoop上實(shí)現(xiàn)常見算法 Hadoop開發(fā)和調(diào)試的最佳實(shí)用經(jīng)驗(yàn)。