ubuntu Hadoop及Spark環境搭建

原創

2020-07-07 07:37

關於平臺選擇的問題
目前分佈式計算框架主要是在linux系統下開發，因此選擇ubuntu或者centos都沒有問題。
spark發展到現在，很多方面都已經十分完善，其速度與性能等也比hadoop好不止一個數量級，因此，主要使用spark進行分佈式計算框架的學習。但是hadoop中的HDFS文件系統應用廣泛，spark默認也採用hadoop的HDFS文件系統，因此安裝時，首先安裝配置hadoop，然後再安裝spark。
主要流程
安裝系統
最好是首先配置一個username爲hadoop的用戶名，方便之後的操作。
安裝hadoop
jdk配置：因爲在這裏需要配置jdk，儘量選擇jdk8，不要選擇9或者以上的版本，否則之後spark中的scala(scala2.12.4以及之前版本都是這樣)無法使用
在安裝hadoop的過程中，主要是需要配置一些免密登錄等的東西，方便之後的操作，同時需要設置hadoop文件夾可以被hadoop用戶直接讀寫，否則始終用sudo操作很麻煩。
安裝hadoop的參考鏈接
https://www.cnblogs.com/87hbteo/p/7606012.html
http://blog.csdn.net/monkeys2012/article/details/51972622
scala安裝
其實不需要單獨安裝這個，因爲之後安裝spark的時候也會安裝scala，但是爲了平時練習，也可以安裝一下，安裝教程參考鏈接和spark的放在一起
spark安裝
安裝與測試的參考鏈接：http://dblab.xmu.edu.cn/blog/spark-quick-start-guide/
注意：如果遇到spark-shell Failed to initialize compiler: object java.lang.Object in compiler mirror not found.等問題，可能就是java版本太高的問題，換成8或者一下就沒有問題了

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

項目常用的註解

註解的概念和作用 @RestController @Controller @RequestMapping @Autowired @ApiOperation @interface 內容待補充現在只是彙總

2020-07-04 05:57:04

DLL切換爲exe

DLL切換爲exe方便調試 #1.動態庫(.dll)改爲應用程序(.exe) #2.窗口(/SUBSYSTEM:WINDOWS)改爲控制檯(/SUBSYSTEM:CONSOLE)

2020-07-03 02:46:44

創新過程管理

以下截圖都是來自TechED2012的《企業創新過程管理》的PPT，後續還有更多精彩的IPM資料，敬請持續關注

2020-06-28 09:41:57

【Project】基於LD3320 的智能語音控制系統

這是一個之前做過的小課設，主要是利用LD3320語音模塊進行模擬智能家居，通過不同命令的特徵提取，實現不同指令的控制。項目已經開源整理至github。【github開源項目：Intelligent-speech-recognit

2020-06-26 03:36:33

數據使用準則

從服務器返回的數據永遠是不可靠的。從文件讀取的數據永遠是不可靠的。從數據庫讀取的數據永遠是不可靠的。總結來說，外部的數據永遠是不可靠的，它會以任何突破你想象的形式出現，就像這個殘酷的現實世界一樣。 Repository是數

2020-06-23 22:31:10

項目 | javaweb 的購物車---小案列

效果圖：基本功能：顯示商品列表添加商品到購物車對添加的商品進行價格計算刪除購物車商品適用人羣：初學者—_— 環境說明： Myeclispe2017，jdk1.8，tomcat9，Oracle數據庫

2020-06-22 06:25:52

前端請求參數->HTTP編碼->SpringMVC接收參數過程的匹配

1.前端請求參數->HTTP編碼->SpringMVC接收參數參數格式前端參數數據格式 Object objec = {key:value} key1=value1&key2=value12 (keyvalue字符串)

2020-06-22 00:57:57

IDEA詳細搭建Web項目

項目配置簡單Web項目配置創建項目配置服務器啓動項目/服務器

2020-06-22 00:57:57

旅遊網項目中遇到的知識與問題

1知識 1.1註冊 1.用js進行表單校驗 2.使用ajax是爲了獲取server響應的數據，html作爲視圖層不能直接從servlet域對象獲取值，只能從ajax獲取響應數據 3.用戶激活碼可以用Uuid工具類生成 1.2 登

2020-06-20 11:58:57

優惠券項目四

整體項目介紹：https://blog.csdn.net/wenjieyatou/article/details/80190886優惠券項目一介紹：https://blog.csdn.net/wenjieyatou/article/det

2020-06-17 09:52:28

優惠券項目五

整體項目介紹：https://blog.csdn.net/wenjieyatou/article/details/80190886優惠券項目一介紹：https://blog.csdn.net/wenjieyatou/article/det

2020-06-17 09:52:28

kshen轉Project 2002 server安裝手記

Project server 的安裝有些煩瑣，誰讓她功能強大呢，經過一段時間的摸索，我記錄了我的安裝過程，其中如有不對，或者我描述不清楚的地方，請聯繫

kshenalphalo2002

2020-06-16 03:25:55

牛客高級項目課（仿牛客網）筆記

一、介紹： 1. 框架 ssm 2. 開發環境構建工具：Apache Maven 集成開發工具: IntelliJ IDEA 數據庫：MySQL、Redis 應用服務器：Apache Tomcat 版本控制工具：Git 3. Sprin

2020-06-15 00:29:48

use java to execute the cmd and compile to jar file

try { String cmd = "cmd.exe /c http://www.google.com/"; Process process = Runtime.getRuntime().

2020-06-14 22:53:56

JSF copy files

public static int copyFiles(String orgFile, String newFile) throws AccessControlException { String

2020-06-14 22:53:56

24小時熱門文章

最新文章

最新評論文章