k8s pods中shell 腳本里無法調出jobs的後臺進程

問題:k8s pods中用戶執行的job經常要跑多線程,所以會使用 &方式,這時候job直接執行完當前shell退出了,造成用戶實際執行的任務沒有執行。
分析:此問題剛開始採用jobs方式判斷,發現服務器在腳本里執行jobs是可以調出後臺進程的,而在pods中卻不行。例子如下:

服務器:

[root@node241 ~]# cat a.sh
i=0
while [ $i -le 10 ]
do
sleep 1
echo $i
i=$(($i+1))
done
[root@node241 ~]# cat c.sh
i=0
while [ $i -le 10 ]
do
sleep 1
echo $i
i=$(($i+1))
done

[root@node241 ~]# cat b.sh
sh a.sh&
sh c.sh&
echo $(jobs)
[root@node241 ~]# sh b.sh
[1]- Running sh a.sh & [2]+ Running sh c.sh &
[root@node241 ~]# 0
0
1
1
2
2
3
3
4
4
5
5
6
6
7
7
8
8
9
9
10
10

pods中

root@dev-kun3-li-mt-moba-scp-ciim-6dffd89ff5-bpkwm:~# cat a.sh
i=0
while [ $i -le 5 ]
do
sleep 1
echo $i
i=$(($i+1))
done

root@dev-kun3-li-mt-moba-scp-ciim-6dffd89ff5-bpkwm:~# cat d.sh
sh a.sh&
echo $(jobs)
root@dev-kun3-li-mt-moba-scp-ciim-6dffd89ff5-bpkwm:~# sh d.sh

root@dev-kun3-li-mt-moba-scp-ciim-6dffd89ff5-bpkwm:~# 0
1
2
3
4
5

此時job腳本中通過jobs命令判斷後臺進程是否執行完畢是失敗的,這點服務器和容器中還是有區別的。

問題解決
在job腳本中採用wait命令,則問題解決:

wait方式

root@dev-kun3-li-mt-moba-scp-ciim-6dffd89ff5-bpkwm:~# cat a.sh
i=0
while [ $i -le 5 ]
do
sleep 1
echo $i
i=$(($i+1))
done

root@dev-kun3-li-mt-moba-scp-ciim-6dffd89ff5-bpkwm:~# cat c.sh
i=0
while [ $i -le 10 ]
do
sleep 1
echo $i
i=$(($i+1))
done

root@dev-kun3-li-mt-moba-scp-ciim-6dffd89ff5-bpkwm:~# cat b.sh
sh a.sh&
sh c.sh&
wait %$(jobs -p)
echo hh
root@dev-kun3-li-mt-moba-scp-ciim-6dffd89ff5-bpkwm:~# sh b.sh
0
0
1
1
2
2
3
3
4
4
5
5
6
7
8
9
10
hh

此時wait %n中n指的是後臺進程的任務號,而不是pid,等所有後臺進程執行完畢,當前腳本才退出。
wait %$(jobs -p)中 echo $(jobs -p)實際上也無法輸出,但是wait命令卻能獲得這個值。
wait方式完美解決了用戶job無法後臺多線程啓動的問題。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章