1.背景

大數據開發的測試環境，很多人不以爲然，其實重複的打包，上傳，測試雖然每次時間大概也就幾分鐘，但是積累起了往往會花費很多的時間，但是一個完整的測試環境在生產環境下往往難形成閉環，拋開堡壘機權限不說，hadoop，hive，spark等服務端的權限也會難倒一羣英雄好漢，主要是太繁瑣了，測試環境的搭建，我這裏採用Docker容器，適合多端遷移，而且容器的鏡像大小也比虛擬機小很多，難度上說，也只需要掌握幾個基礎的命令即可，除非想引入K8s等技術，但測試環境完全沒必要，Docker環境搭建大數據平臺的系列從這裏大數據開發-Docker-使用Docker10分鐘快速搭建大數據環境,Hadoop、Hive、Spark、Hue、Kafka、ElasticSearch.....[https://blog.csdn.net/hu_lichao/article/details/112125800](https://blog.csdn.net/hu_lichao/article/details/112125800)，環境搭建好了，可能還是會有一些特殊的問題

2.如何解決缺失winutils.exe

在Win操作系統，idea下開發hadoop程序或者Spark程序，那麼你肯定會遇到下面的問題

之所以出現上面的問題，Spark程序和Hadoop在idea寫編寫的程序是依賴hadoop的環境的，所以要提前配置好，並且設定HADOOP_HOME ，不一定需要$HADOOP_HOME/bin 到PATH ，後者是給快捷方式用的

注意：配置完環境變量後要將idea，退出後重進，不能Restart

3.如何解決java.lang.NoSuchMethodError: org.apache.hadoop.security.authentication.util.KerberosUtil.hasKerberosKeyTab(Ljavax/security/auth/Subject;)Z

錯誤如下圖

出現這個問題的原因是版本衝突，即使看起來不那麼明顯，可能是spark依賴的包中的hadoop和hadoop依賴的版本不一致https://stackoverflow.com/questions/45470320/what-is-the-kerberos-method，具體不一致的問題，可能各有不同，解決難易程度因人而異😁😁😁,我的解決方式就是exclude掉spark的低版本hadoop

4.如何解決Exception in thread "main" org.apache.spark.SparkException: Task not serializable

這個問題，我是這麼遇到的，如下程序：

//        results.foreach(System.out::println); //輸出沒有序列化
        results.foreach(x -> System.out.println(x));

首先foreach是action算子，需要將task上的數據拉到driver上來遍歷顯示，就需要序列化，如果習慣了Java的lambda寫法，可能會寫第一種，第一種寫法的問題是沒有序列化，序列化是在閉包裏完成的，而使用靜態方法調用的方式，沒有閉包化，所以會報序列化的問題，寫成第二種就可以了，System.out是一個final static對象。

    public final static PrintStream out = null;

吳邪，小三爺，混跡於後臺，大數據，人工智能領域的小菜鳥。
更多請關注

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

大數據開發-解決Windows下，開發環境常遇的幾個問題

1.背景

2.如何解決缺失winutils.exe

3.如何解決java.lang.NoSuchMethodError: org.apache.hadoop.security.authentication.util.KerberosUtil.hasKerberosKeyTab(Ljavax/security/auth/Subject;)Z

4.如何解決Exception in thread "main" org.apache.spark.SparkException: Task not serializable

如何使用 JS 判斷用戶是否處於活躍狀態

通過HPA+CronHPA組合應對業務複雜彈性伸縮場景

❤️‍🔥 Solon Cloud Event 新的事務特性與應用

使用Nginx做頁面採集, Kafka收集到對應Topic_6XwWe5qWHGM2PojVPUSejM

大數據開發-從Scala到Akka併發編程_jDW32G3c87fjEBtYNE7Z7f

大數據實戰-Hive-技巧實戰_2LgaeiFwLs7mCTwG5T3c9M

大數據開發-Go-新手常遇問題

大數據開發-Go-數組，切片

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結