Azkaban快速入門系列(2) | Azkaban安裝部署

  大家好,我是不溫卜火,是一名計算機學院大數據專業大二的學生,暱稱來源於成語—不溫不火,本意是希望自己性情溫和。作爲一名互聯網行業的小白,博主寫博客一方面是爲了記錄自己的學習過程,另一方面是總結自己所犯的錯誤希望能夠幫助到很多和自己一樣處於起步階段的萌新。但由於水平有限,博客中難免會有一些錯誤出現,有紕漏之處懇請各位大佬不吝賜教!暫時只有csdn這一個平臺,博客主頁:https://buwenbuhuo.blog.csdn.net/

  此篇爲大家帶來的是Azkaban安裝部署。

安裝部署Azkaban所需要的文件博主已經親自打包上傳到百度雲了,如有需要可以自行下載:
鏈接:https://pan.baidu.com/s/1CKs8EqBLnJwvPuwCxkx5UA
提取碼:jh3j


20

一. 安裝前準備

  • 1. 將Azkaban Web服務器、Azkaban執行服務器、Azkaban的sql執行腳本及MySQL安裝包拷貝到hadoop002虛擬機/opt/software目錄下
    1
  • 2.選擇Mysql作爲Azkaban數據庫,因爲Azkaban建立了一些Mysql連接增強功能,以方便Azkaban設置。並增強服務可靠性。

二. 安裝Azkaban

  • 1. 在/opt/module/目錄下創建azkaban目錄
[bigdata@hadoop002 module]$ mkdir azkaban
  • 2. 解壓azkaban-web-server-2.5.0.tar.gz、azkaban-executor-server-2.5.0.tar.gz、azkaban-sql-script-2.5.0.tar.gz到/opt/module/azkaban目錄下
[bigdata@hadoop002 azkaban]$ tar -zxvf azkaban-web-server-2.5.0.tar.gz -C /opt/module/azkaban/
[bigdata@hadoop002 azkaban]$ tar -zxvf azkaban-executor-server-2.5.0.tar.gz -C /opt/module/azkaban/
[bigdata@hadoop002 azkaban]$ tar -zxvf azkaban-sql-script-2.5.0.tar.gz -C /opt/module/azkaban/

  • 3. 對解壓後的文件重新命名
[bigdata@hadoop002 azkaban]$ mv azkaban-web-2.5.0/ server
[bigdata@hadoop002 azkaban]$ mv azkaban-executor-2.5.0/ executor

2

  • 4. azkaban腳本導入
// 進入mysql,創建azkaban數據庫,並將解壓的腳本導入到azkaban數據庫。
[bigdata@hadoop002 azkaban]$ mysql -uroot -p199712
mysql> create database azkaban;
mysql> use azkaban;
mysql> source /opt/module/azkaban/azkaban-2.5.0/create-all-sql-2.5.0.sql

//注:source後跟.sql文件,用於批量處理.sql文件中的sql語句。

3
4

三. 生成密鑰對和證書

Keytool是java數據證書的管理工具,使用戶能夠管理自己的公/私鑰對及相關證書。
-keystore 指定密鑰庫的名稱及位置(產生的各類信息將存在.keystore文件中)
-genkey(或者-genkeypair) 生成密鑰對
-alias 爲生成的密鑰對指定別名,如果沒有默認是mykey
-keyalg 指定密鑰的算法 RSA/DSA 默認是DSA

  • 1. 生成 keystore的密碼及相應信息的密鑰庫
[bigdata@hadoop002 server]$ keytool -keystore keystore -alias jetty -genkey -keyalg RSA

// 注意:
密鑰庫的密碼至少必須6個字符,可以是純數字或者字母或者數字和字母的組合等等
密鑰庫的密碼最好和<jetty> 的密鑰相同,方便記憶

5

  • 2. 查看密鑰庫
[bigdata@hadoop002 server]$ keytool -keystore keystore --list

6

四. 時間同步配置

  先配置好服務器節點上的時區

  • 1.如果在/usr/share/zoneinfo/這個目錄下不存在時區配置文件Asia/Shanghai,就要用 tzselect 生成。
[bigdata@hadoop002 server]$ tzselect
Please identify a location so that time zone rules can be set correctly.
Please select a continent or ocean.
 1) Africa
 2) Americas
 3) Antarctica
 4) Arctic Ocean
 5) Asia
 6) Atlantic Ocean
 7) Australia
 8) Europe
 9) Indian Ocean
10) Pacific Ocean
11) none - I want to specify the time zone using the Posix TZ format.
#? 5
Please select a country.
 1) Afghanistan           18) Israel                35) Palestine
 2) Armenia               19) Japan                 36) Philippines
 3) Azerbaijan            20) Jordan                37) Qatar
 4) Bahrain               21) Kazakhstan            38) Russia
 5) Bangladesh            22) Korea (North)         39) Saudi Arabia
 6) Bhutan                23) Korea (South)         40) Singapore
 7) Brunei                24) Kuwait                41) Sri Lanka
 8) Cambodia              25) Kyrgyzstan            42) Syria
 9) China                 26) Laos                  43) Taiwan
10) Cyprus                27) Lebanon               44) Tajikistan
11) East Timor            28) Macau                 45) Thailand
12) Georgia               29) Malaysia              46) Turkmenistan
13) Hong Kong             30) Mongolia              47) United Arab Emirates
14) India                 31) Myanmar (Burma)       48) Uzbekistan
15) Indonesia             32) Nepal                 49) Vietnam
16) Iran                  33) Oman                  50) Yemen
17) Iraq                  34) Pakistan
#? 9
Please select one of the following time zone regions.
1) Beijing Time
2) Xinjiang Time
#? 1

The following information has been given:

        China
        Beijing Time

Therefore TZ='Asia/Shanghai' will be used.
Local time is now:      Thu Oct 18 16:24:23 CST 2018.
Universal Time is now:  Thu Oct 18 08:24:23 UTC 2018.
Is the above information OK?
1) Yes
2) No
#? 1

You can make this change permanent for yourself by appending the line
        TZ='Asia/Shanghai'; export TZ
to the file '.profile' in your home directory; then log out and log in again.

Here is that TZ value again, this time on standard output so that you
can use the /usr/bin/tzselect command in shell scripts:
Asia/Shanghai

  • 2. 拷貝該時區文件,覆蓋系統本地時區配置
[bigdata@hadoop002 server]$ cp /usr/share/zoneinfo/Asia/Shanghai /etc/localtime
  • 3. 集羣時間同步(同時發給三個窗口)
[bigdata@hadoop002 server]$ sudo date -s '2020-05-18 23:26:00'

7

五. 修改配置

1. Web服務器配置

  • 1. 進入azkaban web服務器安裝目錄 conf目錄,打開azkaban.properties文件
// 獲取內容
[bigdata@hadoop002 conf]$ pwd
/opt/module/azkaban/server/conf

[bigdata@hadoop002 conf]$ vim azkaban.properties 
  • 2. 按照如下配置修改azkaban.properties文件
#Azkaban Personalization Settings
#服務器UI名稱,用於服務器上方顯示的名字
azkaban.name=Test
#描述
azkaban.label=My Local Azkaban
#UI顏色
azkaban.color=#FF3601
azkaban.default.servlet.path=/index
#默認web server存放web文件的目錄
web.resource.dir=/opt/module/azkaban/server/web/
#默認時區,已改爲亞洲/上海 默認爲美國
default.timezone.id=Asia/Shanghai

#Azkaban UserManager class
user.manager.class=azkaban.user.XmlUserManager
#用戶權限管理默認類(絕對路徑)
user.manager.xml.file=/opt/module/azkaban/server/conf/azkaban-users.xml

#Loader for projects
#global配置文件所在位置(絕對路徑)
executor.global.properties=/opt/module/azkaban/executor/conf/global.properties
azkaban.project.dir=projects

#數據庫類型
database.type=mysql
#端口號
mysql.port=3306
#數據庫連接IP
mysql.host=hadoop002
#數據庫實例名
mysql.database=azkaban
#數據庫用戶名
mysql.user=root
#數據庫密碼
mysql.password=199712
#最大連接數
mysql.numconnections=100

# Velocity dev mode
velocity.dev.mode=false

# Azkaban Jetty server properties.
# Jetty服務器屬性.
#最大線程數
jetty.maxThreads=25
#Jetty SSL端口
jetty.ssl.port=8443
#Jetty端口
jetty.port=8081
#SSL文件名(絕對路徑)
jetty.keystore=/opt/module/azkaban/server/keystore
#SSL文件密碼
jetty.password=199712
#Jetty主密碼與keystore文件相同
jetty.keypassword=199712
#SSL文件名(絕對路徑)
jetty.truststore=/opt/module/azkaban/server/keystore
#SSL文件密碼
jetty.trustpassword=199712

# Azkaban Executor settings
executor.port=12321

# mail settings
mail.sender=
mail.host=
job.failure.email=
job.success.email=

lockdown.create.projects=false

cache.directory=cache

  • 3. web服務器用戶配置
      在azkaban web服務器安裝目錄 conf目錄,按照如下配置修改azkaban-users.xml 文件,增加管理員用戶。
[bigdata@hadoop002 conf]$ vim azkaban-users.xml
<azkaban-users>
	<user username="azkaban" password="azkaban" roles="admin" groups="azkaban" />
	<user username="metrics" password="metrics" roles="metrics"/>
	<user username="admin" password="admin" roles="admin,metrics"/>
	<role name="admin" permissions="ADMIN" />
	<role name="metrics" permissions="METRICS"/>
</azkaban-users>

8

2. 執行服務器配置

  • 1. 進入執行服務器安裝目錄conf,打開azkaban.properties
// 進入到要修改的目錄下
[bigdata@hadoop002 conf]$ cd ../../executor/conf/
// 修改
[bigdata@hadoop002 conf]$ vim azkaban.properties
  • 2. 按照如下配置修改azkaban.properties文件
#Azkaban
#時區
default.timezone.id=Asia/Shanghai

# Azkaban JobTypes Plugins
#jobtype 插件所在位置
azkaban.jobtype.plugin.dir=plugins/jobtypes

#Loader for projects
executor.global.properties=/opt/module/azkaban/executor/conf/global.properties
azkaban.project.dir=projects

database.type=mysql
mysql.port=3306
mysql.host=hadoop002
mysql.database=azkaban
mysql.user=root
mysql.password=199712
mysql.numconnections=100

# Azkaban Executor settings
#最大線程數
executor.maxThreads=50
#端口號(如修改,請與web服務中一致)
executor.port=12321
#線程數
executor.flow.threads=30

9

六. 分別啓動executor服務器和web服務器

  • 1. 在executor服務器目錄下執行啓動命令
[bigdata@hadoop002 executor]$ bin/azkaban-executor-start.sh

10

  • 2. 在azkaban web服務器目錄下執行啓動命令
[bigdata@hadoop002 server]$ bin/azkaban-web-start.sh

11

注意: 先執行executor,再執行web,避免Web Server會因爲找不到執行器啓動失敗

  • 3. jps查看進程
    12

七. web查看

  • 輸入https://服務器IP地址:8443,即可訪問azkaban服務。
    https://hadoop002:8443/
    在登錄中輸入剛纔在azkaban-users.xml文件中新添加的戶用名及密碼,點擊 login。
    13
    14

  本次的分享就到這裏了,


11

  好書不厭讀百回,熟讀課思子自知。而我想要成爲全場最靚的仔,就必須堅持通過學習來獲取更多知識,用知識改變命運,用博客見證成長,用行動證明我在努力。
  如果我的博客對你有幫助、如果你喜歡我的博客內容,請“點贊” “評論”“收藏”一鍵三連哦!聽說點讚的人運氣不會太差,每一天都會元氣滿滿呦!如果實在要白嫖的話,那祝你開心每一天,歡迎常來我博客看看。
  碼字不易,大家的支持就是我堅持下去的動力。點贊後不要忘了關注我哦!

13
12

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章