《Hadoop大明白》【2】pyspark的應用場景 原

1,python的碼農涉獵Hadoop,首選pyspark

2,開發spark應用,需要知道的幾個點:

【1】SQL語句:insert into / overwirte

【2】DataFrame的常用API

【3】UDF函數

【4】Kafka組件使用

【5】Avro序列化

【6】RDD的坑:謹防嵌套使用
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章