1.DSL模式
通過調用方法來是實現。
如:
dataFrame.select("name").show
dataFrame.filter($"age">25).show
2.SQL模式
通過執行SQL。
1)先創建一張表:
一個sparkContext可以多次創建sparkSession。
//Session內可訪問,一個sparkSession結束後,表自動刪除。
dataFrame.createOrReplaceTempView 使用表名,不需要任何前綴。
//應用級別內可訪問,一個sparkContext結束後,表自動刪除。
dataFrame.createGlobalTempView 使用表明,需要加上 “global_temp”前綴,比如global_temp.people。
2)執行SQL:
spark.sql(“select * from people”).show
spark.sql("select * from global_temp.p1").show