使用 Scala 寫WordContext程序

package mydemo

import org.apache.spark.{SparkConf, SparkContext}

object MyWordContextDemo {
  def main(args: Array[String]): Unit = {
    // 創建一個 Config
    val conf = new SparkConf().setAppName("MyWordContext")

    // 創建 SparkContext 對象
    val sc = new SparkContext(conf)

    // 使用sc 對象執行相應的算子
    sc.textFile(args(0))                    // 從第一個參數獲取文件路徑並打開
      .flatMap(_.split(" "))              // 先 map 再壓平
      .map((_, 1))                        // 將單詞和 1 構成元組
      .reduceByKey(_ + _)                 // 根據Key 進行 Reduce,並將 value 累加
      .saveAsTextFile(args(1))            // 將結果輸出到文件

    // 停止 SparkContext 對象
    sc.stop()

  }

}

==> 運行程序:

    ---> 首先將程序打包成 jar 包

    ---> 執行以下命令

spark-submit --master spark://bigdata0:7077 --class mydemo.MyWordContextDemo scalawordcontext.jar hdfs://192.168.10.210:9000:/output/scala/wordcontext.txt

    ---> 命令解釋:

        ---- spark-submit                                    spark 命令

        ---- --master spark://bigdata0:7077

        ---- --class         指定類名

        ---- scalawordcontext.jar    將自己與的程序打成的jar 包

        ---- hdfs://192.168.10.210:9000/out/scala/wordcontext.txt        指定處理好的數據輸出的文件

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章