一、Spark SQL基礎
?? ?
1、Spark SQL的簡介
?? ?
2、基本概念:DataSets和DataFrames
?? ?
3、創建DataFrames
?? ?
4、DataFrames操作
?? ?
5、Global Temporary view?
?? ?
6、創建DataSets
?? ?
7、DataSets的操作案例
二、使用數據源
?? ?
1、通用的load/save函數
?? ?
2、Parquet文件
?? ?
3、JSON文件
?? ?
4、使用JDBC
?? ?
5、使用Hive Table
三、性能的優化
?? ?
1、在內存中的緩存數據
?? ?
2、性能優化相關參數
四、在IDEA中開發Spark SQL程序
?? ?
1、案例一:指定的Schema的格式
?? ?
2、案例二:使用case class
?? ?
3、案例三:將數據保存到關系型數據庫中