大數據 - 第八課 :運行wordcount程序 & scala下載解壓與配置

  1. wordcount程序的運行
    1.1 上傳文本文件(英文)到hdfs文件系統
    上傳文件後,可以在eclipse環境中看到路徑。
    在這裏插入圖片描述

這些路徑作爲main的運行參數,需要填入configuration裏。
1.2設置configuration
首先,eclipse的激活頁面要是程序界面:
在這裏插入圖片描述
在主菜單選擇“Run”,然後“Run Configurations”。

在這裏插入圖片描述
在這裏插入圖片描述
雙擊“Java Application”,檢查自動填入的內容是否正確。
在這裏插入圖片描述
打開“Arguments”標籤頁,填入路徑。

在這裏插入圖片描述
填好後點擊“Apply”,然後 “Close”。
在程序界面上右擊:
在這裏插入圖片描述
選擇“Run As”,“Run on Hadoop”。
運行之後,可以在右側看到hdfs文件的變化:
在這裏插入圖片描述

  1. spark相關信息
    下載解壓spark2.4.5。
    在路徑:/home/user1/spark-2.4.5/bin下,運行./spark-shell。
    在這裏插入圖片描述
  2. scala下載解壓與配置
    3.1下載scala2.11.12,解壓:tar -zxvf scala-2.11.12.tgz。
    進入目錄:/home/user1/scala-2.11.12/bin,運行./scala:
    在這裏插入圖片描述
    說明scala運行正常。
    3.2配置路徑
    在.bash_profile裏添加如下內容:
    export SCALA_HOME=/home/user1/scala-2.11.12
    export PATH=SCALAHOME/bin/:SCALA_HOME/bin/:PATH
    然後運行.bash_profile:source .bash_profile。
    3.3 scala環境退出
    “:q”。
  3. scala語言簡介
    4.1值和變量
    值:val;
    變量:var。
    值:聲明後不能修改;變量可以。
    在這裏插入圖片描述
    在計算過程,低級數值類型會自動向高級數值類型轉換,但不會自動從高級數據類型向低級數據類型轉換。
    類型轉換可以強制執行,使用toType方法。
    在這裏插入圖片描述
    字面量中的字母不區分大小寫。
    4.2 字符串String
    用雙引號。
    String類型比數值類型級別高,所以計算過程中數值類型會轉換爲String類型,進行String類型的計算(拼接)。
    4.3 scala類型概述
    在這裏插入圖片描述
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章