Apache DolphinScheduler-3.2.0集羣部署教程

集羣部署方案(2 Master + 3 Worker)

主機名 ip 部署服務
hadoop31 192.168.0.31 MasterServer、WorkerServer、ApiServer
hadoop32 192.168.0.32 MasterServer、WorkerServer
hadoop33 192.168.0.33 WorkerServer、AlertServer

前置準備工作

  • 操作系統:Linux CentOS 7.9 【CPU 4核+ 內存8G+】
  • **JDK:**下載JDK(1.8+),安裝並配置 JAVA_HOME 環境變量,並將其下的 bin 目錄追加到 PATH 環境變量中。
  • 數據庫:MySQL(5.7+)或者 PostgreSQL(8.2.15+),兩者任選其一即可,如 MySQL 則需要JDBC Driver 8.0.16 版本。【此處使用MySQL 8.2.0,驅動使用的是:mysql-connector-j-8.2.0.jar】
  • 註冊中心:Zookeeper(3.8.0+),集羣模式,【此處使用 3.8.3 版本】
  • 二進制包:下載地址 https://www.apache.org/dyn/closer.lua/dolphinscheduler/3.2.0/apache-dolphinscheduler-3.2.0-bin.tar.gz
  • 注意:Apache DolphinScheduler 本身不依賴 Hadoop、Hive、Spark,但如果你運行的任務需要依賴他們,就需要有對應的環境支持。

端口說明

組件 默認端口 說明
MasterServer 5678 非通信端口,只需本機端口不衝突即可
WorkerServer 1234 非通信端口,只需本機端口不衝突即可
ApiApplicationServer 12345 提供後端通信端口

集羣部署

時間同步

服務端:192.168.0.31 客戶端:192.168.0.32、192.168.0.33,服務端在31執行,客戶端在32、33執行

# 服務端和客戶端,安裝chrony
yum install chrony -y

# 服務端和客戶端,安裝chrony
yum install chrony -y

# 服務端(此處也可以使用 ntp.aliyun.com 來代替 192.168.0.31,使用阿里雲時間服務,如果使用31則是本機時間)
cat > /etc/chrony.conf << EOF 
pool 192.168.0.31 iburst
driftfile /var/lib/chrony/drift
makestep 1.0 3
rtcsync
allow 192.168.0.0/24
local stratum 10
keyfile /etc/chrony.keys
leapsectz right/UTC
logdir /var/log/chrony
EOF

# 客戶端
cat > /etc/chrony.conf << EOF 
pool 192.168.0.31 iburst
driftfile /var/lib/chrony/drift
makestep 1.0 3
rtcsync
keyfile /etc/chrony.keys
leapsectz right/UTC
logdir /var/log/chrony
EOF

# 客服端和服務端,重啓chrony,開機自啓動
systemctl restart chronyd
systemctl enable chronyd

#客戶端進行驗證
chronyc sources -v

# 參數解釋
#
# pool ntp.aliyun.com iburst
# 指定使用ntp.aliyun.com作爲時間服務器池,iburst選項表示在初始同步時會發送多個請求以加快同步速度。
# 
# driftfile /var/lib/chrony/drift
# 指定用於保存時鐘漂移信息的文件路徑。
# 
# makestep 1.0 3
# 設置當系統時間與服務器時間偏差大於1秒時,會以1秒的步長進行調整。如果偏差超過3秒,則立即進行時間調整。
# 
# rtcsync
# 啓用硬件時鐘同步功能,可以提高時鐘的準確性。
# 
# allow 192.168.0.0/24
# 允許192.168.0.0/24網段範圍內的主機與chrony進行時間同步。
# 
# local stratum 10
# 將本地時鐘設爲stratum 10,stratum值表示時鐘的準確度,值越小表示準確度越高。
# 
# keyfile /etc/chrony.keys
# 指定使用的密鑰文件路徑,用於對時間同步進行身份驗證。
# 
# leapsectz right/UTC
# 指定時區爲UTC。
# 
# logdir /var/log/chrony
# 指定日誌文件存放目錄。

配置用戶、權限

# 創建用戶需使用 root 登錄
useradd dolphinscheduler

# 添加密碼
echo "dolphinscheduler" | passwd --stdin dolphinscheduler

# 配置 sudo 免密
sed -i '$adolphinscheduler  ALL=(ALL)  NOPASSWD: NOPASSWD: ALL' /etc/sudoers
sed -i 's/Defaults    requirett/#Defaults    requirett/g' /etc/sudoers

# 修改目錄權限,使得部署用戶對二進制包解壓後的 apache-dolphinscheduler-*-bin 目錄有操作權限
chown -R dolphinscheduler:dolphinscheduler apache-dolphinscheduler-*-bin
chmod -R 755 apache-dolphinscheduler-*-bin

配置集羣免密登陸

# 使用創建的 dolphinscheduler 登陸,配置hadoop31到hadoop32、hadoop33免密登陸
su dolphinscheduler

# hadoop31節點,生成密鑰
ssh-keygen -t rsa

# hadoop31節點操作,配置向hadoop31、hadoop32、hadoop33節點免密
ssh-copy-id hadoop31
ssh-copy-id hadoop32
ssh-copy-id hadoop33

ZooKeeper集羣啓動

 集羣安裝,參考教程:ZooKeeper集羣的安裝,本文安裝 ZK 版本爲 3.8.3。參考教程中是 3.4.14,安裝步驟都是一樣兒的,對應着來就可以了。

# 啓動zk集羣
bin/zkServer.sh start

初始化數據庫

此處以 MySQL 爲例

創建數據庫、用戶、授權

-- 進入MySQL命令行
[root@hadoop01]# mysql -u root -p 
Enter password: xxxxxx
-- 創建 dolphinscheduler 數據庫用戶和密碼,並限定登陸範圍
mysql > CREATE USER 'dolphinscheduler'@'%' IDENTIFIED BY 'dolphinscheduler';
-- 創建 dolphinscheduler 的元數據,並指定編碼
mysql > CREATE DATABASE dolphinscheduler DEFAULT CHARACTER SET utf8 DEFAULT COLLATE utf8_general_ci;
-- 爲dolphinscheduler數據庫授權
mysql > grant all privileges on dolphinscheduler.* to 'dolphinscheduler'@'%';
-- 刷新權限
mysql > flush privileges;

解壓縮安裝包

# 將apache-dolphinscheduler-3.2.0-bin.tar.gz上傳至/opt/targz目錄下

# 解壓
[root@hadoop31 targz]# tar zxvf ./apache-dolphinscheduler-3.2.0-bin.tar.gz

# 修改目錄權限,使得部署用戶對解壓縮後的文件有操作權限
[root@hadoop31 targz]# chown -R dolphinscheduler:dolphinscheduler apache-dolphinscheduler-3.2.0-bin

添加MySQL驅動至libs目錄

​ 此處使用 MySQL 8.2.0版本,對應使用 JDBC 驅動爲 mysql-connector-j-8.2.0.jar,將該驅動移動至 DolphinScheduler 的每個模塊下的 libs 目錄下。共5個目錄:

  • api-server/libs
  • alert-server/libs
  • master-server/libs
  • worker-server/libs
  • tools/libs

配置文件修改

dolphinscheduler_env.sh 配置

# 修改dolphinscheduler_env.sh
vim apache-dolphinscheduler-3.2.0-bin/bin/env/dolphinscheduler_env.sh

# 在文末添加以下配置:
# JAVA_HOME, will use it to start DolphinScheduler server
# JDK配置
export JAVA_HOME=${JAVA_HOME:-/opt/soft/jdk8}

# Database related configuration, set database type, username and password
# MySQL數據庫配置
export DATABASE=${DATABASE:-mysql}
export SPRING_PROFILES_ACTIVE=${DATABASE}
export SPRING_DATASOURCE_URL="jdbc:mysql://192.168.17.28:3307/dolphinscheduler?useUnicode=true&characterEncoding=UTF-8&useSSL=false"
export SPRING_DATASOURCE_USERNAME=${SPRING_DATASOURCE_USERNAME:-"dolphinscheduler"}
export SPRING_DATASOURCE_PASSWORD=${SPRING_DATASOURCE_PASSWORD:-"dolphinscheduler"}

# DolphinScheduler server related configuration
export SPRING_CACHE_TYPE=${SPRING_CACHE_TYPE:-none}
export SPRING_JACKSON_TIME_ZONE=${SPRING_JACKSON_TIME_ZONE:-UTC}
export MASTER_FETCH_COMMAND_NUM=${MASTER_FETCH_COMMAND_NUM:-10}

# Registry center configuration, determines the type and link of the registry center
# zk註冊中心
export REGISTRY_TYPE=${REGISTRY_TYPE:-zookeeper}
export REGISTRY_ZOOKEEPER_CONNECT_STRING=${REGISTRY_ZOOKEEPER_CONNECT_STRING:-hadoop31:2181,hadoop32:2181,hadoop33:2181}

# Tasks related configurations, need to change the configuration if you use the related tasks.
# 其他環境配置(此處只配置了hadoop、hive,其他環境未部署)
# 如果你不使用某些任務類型,可以忽略不做配置,使用默認即可。比如Flink不使用,不做處理即可
export HADOOP_HOME=${HADOOP_HOME:-/opt/soft/hadoop-3.3.6}
export HADOOP_CONF_DIR=${HADOOP_CONF_DIR:-/opt/soft/hadoop-3.3.6/etc/hadoop}
export SPARK_HOME=${SPARK_HOME:-/opt/soft/spark}
export PYTHON_LAUNCHER=${PYTHON_LAUNCHER:-/opt/soft/python}
export HIVE_HOME=${HIVE_HOME:-/opt/soft/hive-3.1.3}
export FLINK_HOME=${FLINK_HOME:-/opt/soft/flink}
export DATAX_LAUNCHER=${DATAX_LAUNCHER:-/opt/soft/datax/bin/python3}

export PATH=$HADOOP_HOME/bin:$SPARK_HOME/bin:$PYTHON_LAUNCHER:$JAVA_HOME/bin:$HIVE_HOME/bin:$FLINK_HOME/bin:$DATAX_LAUNCHER:$PATH

install_env.sh文件修改

# 修改install_env.sh
vim apache-dolphinscheduler-3.2.0-bin/bin/env/install_env.sh

# 按照集羣部署方案,內容如下:

# 集羣節點
ips=${ips:-"hadoop31,hadoop32,hadoop33"}

# ssh免密端口,使用默認
sshPort=${sshPort:-"22"}

# master節點
masters=${masters:-"hadoop31,hadoop32"}

# worker節點
workers=${workers:-"hadoop31:default,hadoop32:default,hadoop33:default"}

# alert節點
alertServer=${alertServer:-"hadoop33"}

# api節點
apiServers=${apiServers:-"hadoop31"}

# dolphinscheduler實際安裝路徑
installPath=${installPath:-"/opt/soft/dolphinscheduler-3.2.0"}

# 部署dolphinscheduler使用的用戶名
deployUser=${deployUser:-"dolphinscheduler"}

# zk根節點
zkRoot=${zkRoot:-"/dolphinscheduler"}

初始化元數據

# 切換到apache-dolphinscheduler-3.2.0-bin目錄下,執行命令
[root@hadoop31 apache-dolphinscheduler-3.2.0-bin]# sh ./tools/bin/upgrade-schema.sh

# 此操作,會向MySQL數據庫寫入元數據,共計65張表,如圖所示:

file

安裝Apache DolphinScheduler

# 執行install.sh部署命令
[root@hadoop31 apache-dolphinscheduler-3.2.0-bin]# ./bin/install.sh 

# 當看到下圖時,說明 DS 安裝完成

file

提示:

安裝完成後,此時安裝用到的 apache-dolphinscheduler-3.2.0-bin 文件就沒用了。

此時,已經將 Apache DolphinScheduler 安裝到配置中指定的 /opt/soft/dolphinscheduler-3.2.0 目錄下了

登錄Apache DolphinScheduler 控制檯

訪問地址:http://192.168.0.31:12345/dolphinscheduler/ui/

用戶名:admin

密碼:dolphinscheduler123

file

查看監控中心Master/Worker節點信息

1.Master節點

file

2.Worker節點

file

啓動/停止服務命令

第一次安裝後,會自動啓動所有服務。如有服務問題或者後續需要啓停,命令如下。以下腳本都在 DolphinScheduler安裝目錄的bin下

# 一鍵停止集羣所有服務
sh /opt/soft/dolphinscheduler-3.2.0/bin/stop-all.sh

# 一鍵啓動集羣所有服務
sh /opt/soft/dolphinscheduler-3.2.0/bin/start-all.sh

# 啓/停 master 服務
sh /opt/soft/dolphinscheduler-3.2.0/bin/dolphinscheduler-daemon.sh start master-server 
sh /opt/soft/dolphinscheduler-3.2.0/bin/dolphinscheduler-daemon.sh stop master-server 

# 啓/停 worker 服務
sh /opt/soft/dolphinscheduler-3.2.0/bin/dolphinscheduler-daemon.sh start worker-server 
sh /opt/soft/dolphinscheduler-3.2.0/bin/dolphinscheduler-daemon.sh stop worker-server 

# 啓/停 api 服務
sh /opt/soft/dolphinscheduler-3.2.0/bin/dolphinscheduler-daemon.sh start api-server 
sh /opt/soft/dolphinscheduler-3.2.0/bin/dolphinscheduler-daemon.sh stop api-server 

# 啓/停 alert 服務
sh /opt/soft/dolphinscheduler-3.2.0/bin/dolphinscheduler-daemon.sh start alert-server 
sh /opt/soft/dolphinscheduler-3.2.0/bin/dolphinscheduler-daemon.sh stop alert-server 

本文結束,謝謝!

本文由 白鯨開源科技 提供發佈支持!

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章