原创 spark1.3.0集成kafka的新辦法

Simplified Parallelism: No need to create multiple input Kafka streams and union-ing them. With directStream, Spark Stre

原创 rdd沒有reduceByKey的方法

寫Spark代碼的時候經常發現rdd沒有reduceByKey的方法,這個發生在spark1.2及其以前對版本,因爲rdd本身不存在reduceByKey的方法,需要隱式轉換成PairRDDFunctions才能訪問,因此需要引入Impor