Spark+zookeeper搭建高可用集羣學習筆記

原創

nuc2015

2018-08-29 16:08

Master結點存在單點故障，所以要藉助zookeeper，至少啓動兩臺Master結點來實現高可用，配置方案比較簡單

先停止所有Spark服務，然後安裝zookeeper，並啓動zookeeper

集羣規劃：

主機名	IP地址	啓動程序
master.hadoop	192.168.1.2	zookeeper、master、worker
slave1.hadoop	192.168.1.3	zookeeper、master、worker
slave2.hadoop	192.168.1.4	zookeeper、worker

一、先安裝Spark集羣（Spark2.2.0安裝教程）
二、安裝zookeeper:(zookeeper安裝教程)

三、高可用配置

在spark-env.sh上刪掉SPARK_MASTER_IP配置項，並添加以下內容：

export SPARK_DAEMON_JAVA_OPTS="-Dspark.deploy.recoveryMode=ZOOKEEPER -Dspark.deploy.zookeeper.url=master.hadoop:2181,slave1.hadoop:2181,slave2.hadoop:2181 -Dspark.deploy.zookeeper.dir=/spark"

解釋：

#-Dspark.deploy.recoverMode=ZOOKEEPER #代表發生故障使用zookeeper服務

#-Dspark.depoly.zookeeper.url=master.hadoop,slave1.hadoop,slave1.hadoop #主機名的名字

#-Dspark.deploy.zookeeper.dir=/spark #spark要在zookeeper上寫數據時的保存目錄

[root@master conf]# vi spark-env.sh

export JAVA_HOME=/apps/jdk1.8.0_171
export SCALA_HOME=/apps/scala-2.11.7
#export HADOOP_HOME=/apps/hadoop-2.8.0/
#export HADOOP_CONF_DIR=/apps/hadoop-2.8.0/etc/hadoop
#export SPARK_MASTER_IP=master.hadoop
export SPARK_WORKER_MEMORY=512m
export SPARK_WORKER_CORES=2
export SPARK_WORKER_INSTANCES=1
export SPARK_DAEMON_JAVA_OPTS="-Dspark.deploy.recoveryMode=ZOOKEEPER -Dspark.deploy.zookeeper.url=master.hadoop:2181,slave1.hadoop:2181,slave2.hadoop:2181 -Dspark.deploy.zookeeper.dir=/spark"

然後修改slaves文件

[root@master conf]# vi slaves

# A Spark Worker will be started on each of the machines listed below.
master.hadoop
slave1.hadoop
slave2.hadoop

四、啓動

先啓動zookeeper

可以單臺啓動，也可以寫一個啓動腳本，集體啓動。

在每臺機器上執行該命令：

[root@master /]# zkServer.sh start

啓動腳本：https://blog.csdn.net/nuc2015/article/details/81045941

啓動後一個leader，其他的是flower

在第一臺機器上啓動spark

[root@master spark-2.2.0]# sbin/start-all.sh 
starting org.apache.spark.deploy.master.Master, logging to /apps/spark-2.2.0/logs/spark-root-org.apache.spark.deploy.master.Master-1-master.hadoop.out
master.hadoop: starting org.apache.spark.deploy.worker.Worker, logging to /apps/spark-2.2.0/logs/spark-root-org.apache.spark.deploy.worker.Worker-1-master.hadoop.out
slave1.hadoop: starting org.apache.spark.deploy.worker.Worker, logging to /apps/spark-2.2.0/logs/spark-root-org.apache.spark.deploy.worker.Worker-1-slave1.hadoop.out
slave2.hadoop: starting org.apache.spark.deploy.worker.Worker, logging to /apps/spark-2.2.0/logs/spark-root-org.apache.spark.deploy.worker.Worker-1-slave2.hadoop.out
[root@master spark-2.2.0]# jps
2321 Jps
2149 Worker
2028 QuorumPeerMain
2076 Master
[root@master spark-2.2.0]#

在第二臺機器上單獨啓動master

[root@slave1 spark-2.2.0]# sbin/start-master.sh

查看web端口

第一個master爲

Status: ALIVE

第二個master爲

Status: STANDBY

搭建成功

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

Spark+zookeeper搭建高可用集羣學習筆記

使用c#強大的表達式樹實現對象的深克隆之解決循環引用的問題

痞子衡嵌入式：恩智浦i.MX RT1xxx系列MCU啓動那些事（12.A）- uSDHC eMMC啓動時間(RT1170)

GPT-4o 引領人機交互新風向，向量數據庫賽道沸騰了

企業大模型如何成爲自己數據的“百科全書”？

本地SSL證書過期輸入命令在IIS自動生成

基於Ubuntu-22.04安裝K8s-v1.28.2實驗（二）使用kube-vip實現集羣VIP訪問

.NET週刊【5月第2期 2024-05-12】

關於定時任務一個批次起止時間的算法設計與實現

SpringBoot前後端分離跨域導致的Sessionid不一致問題解決辦法

WARN scheduler.TaskSchedulerImpl: Initial job has not accepted any resources

如何運行一個uve.js項目

時隔一年後的面經總結

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結