Apache DolphinScheduler 單機部署方案

單機部署(Standalone)

DolphinScheduler單機部署分爲後端部署和前端部署兩部分:

1、後端部署

1.1 : 基礎軟件安裝(必裝項請自行安裝)

  • PostgreSQL (8.2.15+) or Mysql (5.6或者5.7系列) : 兩者任選其一即可
  • JDK (1.8+) : 必裝,請安裝好後在/etc/profile下配置 JAVA_HOME 及 PATH 變量
  • ZooKeeper (3.4.6+) :必裝
  • Hadoop (2.6+) or MinIO :選裝, 如果需要用到資源上傳功能,針對單機可以選擇本地文件目錄作爲上傳文件夾(此操作不需要部署Hadoop);當然也可以選擇上傳到Hadoop or MinIO集羣上
 注意:DolphinScheduler本身不依賴Hadoop、Hive、Spark,僅是會調用他們的Client,用於對應任務的運行。

1.2 : 下載後端tar.gz包

  • 請下載最新版本的後端安裝包至服務器部署目錄,比如創建 /opt/dolphinscheduler 做爲安裝部署目錄,下載地址: 下載 (以1.2.0版本爲例),下載後上傳tar包到該目錄中,並進行解壓
# 創建部署目錄
mkdir -p /opt/dolphinscheduler;
cd /opt/dolphinscheduler;
# 解壓縮
tar -zxvf apache-dolphinscheduler-incubating-1.2.0-dolphinscheduler-backend-bin.tar.gz -C /opt/dolphinscheduler;
 
mv apache-dolphinscheduler-incubating-1.2.0-dolphinscheduler-backend-bin  dolphinscheduler-backend

###1.3:創建部署用戶並賦予目錄操作權限

  • 創建部署用戶,並且一定要配置sudo免密。以創建dolphinscheduler用戶爲例
# add user dolphinscheduler
useradd dolphinscheduler;

# modify user password
echo "dolphinscheduler" | passwd --stdin dolphinscheduler

# 配置sudo免密
sed -i '$adolphinscheduler  ALL=(ALL)  NOPASSWD: NOPASSWD: ALL' /etc/sudoers

# 修改目錄權限,使得部署用戶對dolphinscheduler-backend目錄有操作權限  
chown -R dolphinscheduler:dolphinscheduler dolphinscheduler-backend
 注意:
 - 因爲任務執行服務是以 sudo -u {linux-user} 切換不同linux用戶的方式來實現多租戶運行作業,所以部署用戶需要有 sudo 權限,而且是免密的。初學習者不理解的話,完全可以暫時忽略這一點
 - 如果發現/etc/sudoers文件中有"Default requiretty"這行,也請註釋掉
 - 如果用到資源上傳的話,還需要給該部署用戶分配操作`本地文件系統或者HDFS或者MinIO`的權限

1.4 : ssh免密配置

  • 切換到部署用戶並配置ssh本機免密登錄
su dolphinscheduler;

ssh-keygen -t rsa -P '' -f ~/.ssh/id_rsa
cat ~/.ssh/id_rsa.pub >> ~/.ssh/authorized_keys
chmod 600 ~/.ssh/authorized_keys

注意:正常設置後,dolphinscheduler用戶在執行命令ssh localhost 是不需要再輸入密碼的

1.5 : 數據庫初始化

  • 進入數據庫,默認數據庫是PostgreSQL,如選擇Mysql的話,後續需要添加mysql-connector-java驅動包到DolphinScheduler的lib目錄下
mysql -uroot -p
  • 進入數據庫命令行窗口後,執行數據庫初始化命令,設置訪問賬號和密碼。注: {user} 和 {password} 需要替換爲具體的數據庫用戶名和密碼

    mysql> CREATE DATABASE dolphinscheduler DEFAULT CHARACTER SET utf8 DEFAULT COLLATE utf8_general_ci;
    mysql> GRANT ALL PRIVILEGES ON dolphinscheduler.* TO '{user}'@'%' IDENTIFIED BY '{password}';
    mysql> GRANT ALL PRIVILEGES ON dolphinscheduler.* TO '{user}'@'localhost' IDENTIFIED BY '{password}';
    mysql> flush privileges;
    
  • 創建表和導入基礎數據

    • 修改 conf 目錄下 application-dao.properties 中的下列配置

      • vi conf/application-dao.properties 
        
    • 如果選擇 Mysql,請註釋掉 PostgreSQL 相關配置(反之同理), 還需要手動添加 [ mysql-connector-java 驅動 jar ] 包到 lib 目錄下,這裏下載的是mysql-connector-java-5.1.47.jar,然後正確配置數據庫連接相關信息

      # postgre
      #spring.datasource.driver-class-name=org.postgresql.Driver
      #spring.datasource.url=jdbc:postgresql://localhost:5432/dolphinscheduler
      # mysql
      spring.datasource.driver-class-name=com.mysql.jdbc.Driver
      spring.datasource.url=jdbc:mysql://xxx:3306/dolphinscheduler?useUnicode=true&characterEncoding=UTF-8     需要修改ip,本機localhost即可
      spring.datasource.username=xxx						需要修改爲上面的{user}值
      spring.datasource.password=xxx						需要修改爲上面的{password}值
    
    • 修改並保存完後,執行 script 目錄下的創建表及導入基礎數據腳本
    sh script/create-dolphinscheduler.sh
    

注意: 如果執行上述腳本報 ”/bin/java: No such file or directory“ 錯誤,請在/etc/profile下配置 JAVA_HOME 及 PATH 變量

1.6 : 修改運行參數

  • 修改 conf/env 目錄下的 .dolphinscheduler_env.sh 環境變量(以相關用到的軟件都安裝在/opt/soft下爲例)

    export HADOOP_HOME=/opt/soft/hadoop
    export HADOOP_CONF_DIR=/opt/soft/hadoop/etc/hadoop
    #export SPARK_HOME1=/opt/soft/spark1
    export SPARK_HOME2=/opt/soft/spark2
    export PYTHON_HOME=/opt/soft/python
    export JAVA_HOME=/opt/soft/java
    export HIVE_HOME=/opt/soft/hive
    export FLINK_HOME=/opt/soft/flink
    export PATH=$HADOOP_HOME/bin:$SPARK_HOME2/bin:$PYTHON_HOME:$JAVA_HOME/bin:$HIVE_HOME/bin:$PATH:$FLINK_HOME/bin:$PATH
    
    

    注: 這一步非常重要,例如 JAVA_HOME 和 PATH 是必須要配置的,沒有用到的可以忽略或者註釋掉

  • 將jdk軟鏈到/usr/bin/java下(仍以 JAVA_HOME=/opt/soft/java 爲例)

    sudo ln -s /opt/soft/java/bin/java /usr/bin/java
    
  • 修改一鍵部署腳本 install.sh中的各參數,特別注意以下參數的配置

    # 這裏填 mysql or postgresql
    dbtype="mysql"
    
    # 數據庫連接地址
    dbhost="localhost:3306"
    
    # 數據庫名
    dbname="dolphinscheduler"
    
    # 數據庫用戶名,此處需要修改爲上面設置的{user}具體值
    username="xxx"    
    
    # 數據庫密碼, 如果有特殊字符,請使用\轉義,需要修改爲上面設置的{passowrd}具體值
    passowrd="xxx"
    
    #將DS安裝到哪個目錄,如: /opt/soft/dolphinscheduler,不同於現在的目錄
    installPath="/opt/soft/dolphinscheduler"
    
    #使用哪個用戶部署,使用1.3小節創建的用戶
    deployUser="dolphinscheduler"
    
    #zookeeper地址,單機本機是localhost:2181,記得把2181端口帶上
    zkQuorum="localhost:2181"
    
    #在哪些機器上部署DS服務,本機選localhost
    ips="localhost"
    
    #master服務部署在哪臺機器上
    masters="localhost"
    
    #worker服務部署在哪臺機器上
    workers="localhost"
    
    #報警服務部署在哪臺機器上
    alertServer="localhost"
    
    #後端api服務部署在在哪臺機器上
    apiServers="localhost"
    
    
    # 郵件配置,以qq郵箱爲例
    # 郵件協議
    mailProtocol="SMTP"
    
    # 郵件服務地址
    mailServerHost="smtp.exmail.qq.com"
    
    # 郵件服務端口
    mailServerPort="25"
    
    # mailSender和mailUser配置成一樣即可
    # 發送者
    mailSender="[email protected]"
    
    # 發送用戶
    mailUser="[email protected]"
    
    # 郵箱密碼
    mailPassword="xxx"
    
    # TLS協議的郵箱設置爲true,否則設置爲false
    starttlsEnable="true"
    
    # 郵件服務地址值,參考上面 mailServerHost
    sslTrust="smtp.exmail.qq.com"
    
    # 開啓SSL協議的郵箱配置爲true,否則爲false。注意: starttlsEnable和sslEnable不能同時爲true
    sslEnable="false"
    
    # excel下載路徑
    xlsFilePath="/tmp/xls"
    
    # 業務用到的比如sql等資源文件上傳到哪裏,可以設置:HDFS,S3,NONE,單機如果想使用本地文件系統,請配置爲HDFS,因爲HDFS支持本地文件系統;如果不需要資源上傳功能請選擇NONE。強調一點:使用本地文件系統不需要部署hadoop 
    resUploadStartupType="HDFS"
    
    # 這裏以保存到本地文件系統爲例
    #注:但是如果你想上傳到HDFS的話,NameNode啓用了HA,則需要將core-site.xml和hdfs-site.xml放到conf目錄下,本例即是放到/opt/dolphinscheduler/conf下面,並配置namenode cluster名稱;如果NameNode不是HA,則修改爲具體的ip或者主機名即可 
    defaultFS="file:///data/dolphinscheduler"    #hdfs://{具體的ip/主機名}:8020
    
    
    # 如果ResourceManager是HA,則配置爲ResourceManager節點的主備ip或者hostname,比如"192.168.xx.xx,192.168.xx.xx",否則如果是單ResourceManager或者根本沒用到yarn,請配置yarnHaIps=""即可,我這裏沒用到yarn,配置爲""
    yarnHaIps=""
    
    # 如果是單ResourceManager,則配置爲ResourceManager節點ip或主機名,否則保持默認值即可。我這裏沒用到yarn,保持默認
    singleYarnIp="ark1"
    
    # 由於hdfs支持本地文件系統,需要確保本地文件夾存在且有讀寫權限
    hdfsPath="/data/dolphinscheduler"
    

    注:如果打算用到資源中心功能,請執行以下命令:

    sudo mkdir /data/dolphinscheduler
    sudo chown -R dolphinscheduler:dolphinscheduler /data/dolphinscheduler
    

1.7 : 安裝python的zookeeper工具kazoo

  • 安裝python的 zookeeper 工具 ,此步驟僅在一鍵部署時候用到
#安裝pip
sudo yum -y install python-pip;  #ubuntu請使用 sudo apt-get install python-pip
sudo pip install kazoo;

注意:如果yum沒找到python-pip,也可以通過下面方式安裝

sudo curl https://bootstrap.pypa.io/get-pip.py -o get-pip.py
sudo python get-pip.py  # 如果是python3,使用sudo python3 get-pip.py 
#然後
sudo pip install kazoo;
  • 切換到部署用戶,執行一鍵部署腳本

    sh install.sh

    注意:
    第一次部署的話,在運行中第3步`3,stop server`出現5次以下信息,此信息可以忽略
    sh: bin/dolphinscheduler-daemon.sh: No such file or directory
    
  • 腳本完成後,會啓動以下5個服務,使用jps命令查看服務是否啓動(jpsjava JDK自帶)

    MasterServer         ----- master服務
    WorkerServer         ----- worker服務
    LoggerServer         ----- logger服務
    ApiApplicationServer ----- api服務
    AlertServer          ----- alert服務

如果以上服務都正常啓動,說明自動部署成功

部署成功後,可以進行日誌查看,日誌統一存放於logs文件夾內

 logs/
    ├── dolphinscheduler-alert-server.log
    ├── dolphinscheduler-master-server.log
    |—— dolphinscheduler-worker-server.log
    |—— dolphinscheduler-api-server.log
    |—— dolphinscheduler-logger-server.log

2、前端部署

請下載最新版本的前端安裝包至服務器部署目錄,下載地址: 下載 (以1.2.0版本爲例),下載後上傳tar包到該目錄中,並進行解壓

cd /opt/dolphinscheduler;

tar -zxvf apache-dolphinscheduler-incubating-1.2.0-dolphinscheduler-front-bin.tar.gz -C /opt/dolphinscheduler;

mv apache-dolphinscheduler-incubating-1.2.0-dolphinscheduler-front-bin dolphinscheduler-ui

以下兩種部署方式任選其一種即可,推薦自動化部署

2.1 自動化部署

  • 進入dolphinscheduler-ui目錄下執行(注意:自動化部署會自動下載 nginx)

    cd dolphinscheduler-ui;
    sh ./install-dolphinscheduler-ui.sh;
    
    • 執行後,會在運行中請鍵入前端端口,默認端口是8888,如果選擇默認,請鍵入y,或者鍵入其他端口
    • 然後會讓鍵入跟前端ui交互的api-server的ip
    • 接着是讓鍵入跟前端ui交互的api-server的port
    • 接着是操作系統選擇
    • 等待部署完成
  • 部署完,爲防止資源過大無法上傳到資源中心,建議修改nginx上傳大小參數,具體如下

    • 添加nginx配置 client_max_body_size 1024m,在http方法體內添加即可
    vi /etc/nginx/nginx.conf
    
    # add param
    client_max_body_size 1024m;
    
    • 然後重啓Nginx服務
    systemctl restart nginx
    
  • 訪問前端頁面地址: http://localhost:8888 ,出現前端登錄頁面,前端web也安裝完成了

    <p align="center">
       <img src="/img/login.png" width="60%" />
     </p>
    

2.2 手動部署

  • 自行安裝nginx,去官網下載: http://nginx.org/en/download.html 或者 yum install nginx -y

  • 修改nginx配置文件(注意自行修改的幾處)

vi /etc/nginx/nginx.conf

server {
    listen       8888;# 訪問端口(自行修改)
    server_name  localhost;
    #charset koi8-r;
    #access_log  /var/log/nginx/host.access.log  main;
    location / {
        root   /opt/soft/dolphinscheduler-ui/dist;      # 前端解壓的dist目錄地址(自行修改)
        index  index.html index.html;
    }
    location /dolphinscheduler {
        proxy_pass http://localhost:12345;    # 接口地址(自行修改)
        proxy_set_header Host $host;
        proxy_set_header X-Real-IP $remote_addr;
        proxy_set_header x_real_ipP $remote_addr;
        proxy_set_header remote_addr $remote_addr;
        proxy_set_header X-Forwarded-For $proxy_add_x_forwarded_for;
        proxy_http_version 1.1;
        proxy_connect_timeout 4s;
        proxy_read_timeout 30s;
        proxy_send_timeout 12s;
        proxy_set_header Upgrade $http_upgrade;
        proxy_set_header Connection "upgrade";
    }
    #error_page  404              /404.html;
    # redirect server error pages to the static page /50x.html
    #
    error_page   500 502 503 504  /50x.html;
    location = /50x.html {
        root   /usr/share/nginx/html;
    }
}
  • 然後重啓Nginx服務

    systemctl restart nginx
    
  • 訪問前端頁面地址: http://localhost:8888 ,出現前端登錄頁面,前端web也安裝完成了
    在這裏插入圖片描述

3、啓停服務

  • 一鍵停止集羣所有服務

    sh ./bin/stop-all.sh

  • 一鍵開啓集羣所有服務

    sh ./bin/start-all.sh

  • 啓停Master

sh ./bin/dolphinscheduler-daemon.sh start master-server
sh ./bin/dolphinscheduler-daemon.sh stop master-server
  • 啓停Worker
sh ./bin/dolphinscheduler-daemon.sh start worker-server
sh ./bin/dolphinscheduler-daemon.sh stop worker-server
  • 啓停Api
sh ./bin/dolphinscheduler-daemon.sh start api-server
sh ./bin/dolphinscheduler-daemon.sh stop api-server
  • 啓停Logger
sh ./bin/dolphinscheduler-daemon.sh start logger-server
sh ./bin/dolphinscheduler-daemon.sh stop logger-server
  • 啓停Alert
sh ./bin/dolphinscheduler-daemon.sh start alert-server
sh ./bin/dolphinscheduler-daemon.sh stop alert-server
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章