HUE配置Spark Notebook

原創

asin929

2020-02-21 04:54

在HUE3.10版中已經具有spark notebook的功能，但需要自己配置。

安裝步驟

主要參照run-hue-spark-notebook-on-cloudera進行。

注意點

在第四步，

#download Livy
wget http://archive.cloudera.com/beta/livy/livy-server-0.2.0.zip
unzip livy-server-0.2.0.zip -d /<your_livy_dir>

#set environment variables for Livy
export SPARK_HOME=/opt/cloudera/parcels/CDH/lib/spark
export JAVA_HOME=/usr/java/jdk1.7.0_67-cloudera
export HADOOP_CONF_DIR=<your hadoop_conf_dir found in the previous step in Hue configuration>
export HUE_SECRET_KEY=<your Hue superuser password, this is usually the user you use when you log in to Hue Web UI the first time>

#run Livy. You must run Livy as a user who has access to hdfs, for example, the superuser hdfs.
su hdfs
/<your_livy_dir>/livy-server-0.2.0/bin/livy-server

注意：HADOOP_CONF_DIR可能隨着CDH的重啓而改變，所以每次需要重新設置。也可以直接設置成固定的/etc/hadoop/conf，見CDH中服務的配置及啓動。

測試

val data = Array(1, 2, 3, 4 ,5)
val distData = sc.parallelize(data)
distData.map(s=>s+1).collect()

asin929

發佈了148 篇原創文章 · 獲贊 39 · 訪問量 69萬+

私信關注

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

HUE配置Spark Notebook

安裝步驟

注意點

測試

.Net 8.0 下的新RPC，IceRPC之試試的新玩法"打洞"

完美替代postman的軟件

Vue mockjs mock.js

關於遊戲付費的一點想法

我通過CKA和CKS啦！

《最新出爐》系列入門篇-Python+Playwright自動化測試-42-強大的可視化追蹤利器Trace Viewer

大數據怎麼學？對大數據開發領域及崗位的詳細解讀，完整理解大數據開發領域技術體系

關於遠程主機的數據傳輸

Java中錯誤記錄

PostgreSQL生成測試數據

Jupyter配置Spark開發環境

PostgreSQL中的注意點

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結