? ? ? ?Spark2.0快速入門課程的目的是讓大數據初學者快速入門,目標是讓想學大數據的人了解這個大數據生態圈,以及Spark在大數據生態圈中的霸主地位。
? ? ? 該課程為Spark的基礎課程。
? ? ? ?1.會講解到Spark學習環境的搭建
? ? ? ?2.最基礎的Linux命令的使用
? ? ? ?3.Hadoop中分布式文件系統HDFS的使用
? ? ? ?4.Spark中的基本概念及抽象
? ? ? ?5.Spark程序編寫的注意事項
? ? ? ?6.Spark性能優化的方向
? ? ? ?7.以及會講解一些Spark內核和內核使用的Scala語言的知識。
? ? ? ?8.最后以一個成都地區20160101到20161231一年PM2.5數據的監控數據作為實戰項目的數據素材,以此講解Spark2.0初階的項目實戰并以此作為基礎課程的結束。
? ? ? ?為深入學習SparkSql、Spark流處理、Spark圖計算、Spark機器學習打下基礎。