Azkaban實戰-多job工作流案例

0.數據源:

word.txt:

AAA
BBB
DDD
CCC
AAA
Movle
Kai Movle
BBB yue 

word.txt

1.創建有依賴關係的多個job描述

第一個job:1.job

vi 1.job

添加內容:

type=command
command=/opt/module/hadoop-2.8.4/bin/hadoop fs -put /opt/module/datas/word.txt /

第二個job:2.job依賴1.job

vi 2.job

添加內容:

type=command
command=/opt/module/hadoop-2.8.4/bin/hadoop jar /opt/module/hadoop-2.8.4/share/hadoop/mapreduce/hadoop-mapreduce-examples-2.8.4.jar wordcount /word.txt /out
dependencies=1

2.注意:將所有job資源文件打到一個zip包中
3.在azkaban的web管理界面創建工程並上傳zip包

執行

4.查看結果

結果-查看對word.txt進行wordcount的結果
2.job的運行結果

思考:

將student.txt文件上傳到hdfs,根據所傳文件創建外部表,再將表中查詢到的結果寫入到本地文件

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章