Apache Beam程序嚮導4

Apache Beam程序嚮導4

今天在集羣上實驗Beam On Spark的時候,遇到一個坑爹的問題,這個問題總結起來是一個java.lang.NoClassDefFoundError

錯誤,具體錯誤如下圖1所示


wKiom1itGIejsUb3AAEGqBT8O5w788.png

1 錯誤提示

該錯誤提示SparkStreamingContext沒有定義,這說明java虛擬機加載進來了SparkStreamingContext,也就是相應的代碼包已經導入進來了,這個階段沒有什麼問題。接下來就得看看是不是代碼包版本不合適。

我的maven依賴如下圖2所示

wKioL1itGKij53_hAABjGT-AXgQ725.png

2 Maven依賴包

於是我在各種嘗試之後,終於找到了一種有希望的解決方案,那就是將spark的版本2.1.0改爲1.6.3版本。

修改後狀況如下:

wKiom1itGLbR3LUrAAIxdZjTO9I435.png

3 本地運行成功

 

這裏看似成功了,但是這只是在本機測試的時候有了Beam On Spark的運行測試結果。至於在Spark集羣中能否跑起來,我們還要按照官方提供的方法生成對應的jar包,並通過Spark-submit提交的方式提交到yarn集羣中去通過yarn來調度運行。這種情況下運行成功了,那才叫真正的成功。所以現在還不是高興的時候,那麼接下來我們就開始繼續接下來的實驗吧。

首先應該在mavenpom.xml文件中加入以下對shade的構建依賴

(該部分加入到根節點的build節點的plugins節點之中

<build>

            <plugins>

   

            </plugins>

</build>

 

<plugin>

  <groupId>org.apache.maven.plugins</groupId>

  <artifactId>maven-shade-plugin</artifactId>

  <configuration>

    <createDependencyReducedPom>false</createDependencyReducedPom>

    <filters>

      <filter>

        <artifact>*:*</artifact>

        <excludes>

          <exclude>META-INF/*.SF</exclude>

          <exclude>META-INF/*.DSA</exclude>

          <exclude>META-INF/*.RSA</exclude>

        </excludes>

      </filter>

    </filters>

  </configuration>

  <executions>

    <execution>

      <phase>package</phase>

      <goals>

        <goal>shade</goal>

      </goals>

      <configuration>

        <shadedArtifactAttached>true</shadedArtifactAttached>

        <shadedClassifierName>shaded</shadedClassifierName>

      </configuration>

    </execution>

  </executions>

</plugin>

 

首先將項目打包拷貝到提交應用的那臺機器上並解壓。

如果已經安裝好了maven的環境了的話,就直接在解壓之後的根目錄下執行如下命令

mvnpackage

然後就等着編譯結束

wKiom1itGMbzX3n2AAKE4GQB2xs124.png…………………..

如下圖所示,編譯成功後的jar包就在target目錄下

wKioL1itGNTivtypAAJ2x9zSwuw259.png

 

 

spark提交jar包的方式提交,提交的腳本如下:

wKioL1itGOGxduPgAABD1RIxaM0705.png

${SPARK_HOME}/bin/./spark-submit\                         

 --class org.tongfang.beam.examples.WordCount \##指定要運行的類,全路徑+類名

 --master yarn \ ##提交給yarn調度

 --deploy-mode cluster \##集羣模式運行

/home/ubuntu/shaded/target/shaded-1.0.0-shaded.jar##指定jar包路徑

給腳本添加可執行權限之後就可以開始運行了:

wKiom1itGO-xeqojAAR0jtF6KRM287.png

經過一會兒等待之後就成功了,如下圖所示:

 wKioL1itGQSTkZU_AAKFV84mRAM133.png


文章來自數模堂,如需更多交流,請掃描關注

wKiom1itGUzS2NLzAAAg50i6_rI939.png

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章