Kubernetes Job是一次性任务的控制器。它控制Pod中的容器执行完成任务后不会再重启,并将容器的状态设置为“Completed”。如果Pod中的容器出现了异常终止的情况,Job控制器会根据设置的重启策略进行Pod的重启。如果因为Node节点的故障导致Pod无法正常运行,Job控制器会通过调度器将Pod调度到其他的节点上运行。Job控制器的运行方式分为:单工作队列的串行方式和多工作队列的并行方式。
视频讲解如下:
下面通过一个具体示例来演示如何使用Job控制器的多工作队列的并行方式。在创建多工作队列的Job并行方式时,需要指定两个重要的参数。它们分别是:
.spec.parallelism:作业并行并行执行的数量,即:队列的数量
.spec.completions:作业需要完成数量,即:作业总数量
下面的例子中,需要完成的作业总数量是5个,并且创建了3个队列,即:作业的并行度是3。整个作业执行完成需要2分钟。
(1)创建“job-demo2.yaml”文件,并输入下面的内容:
(2)执行命令创建Job。
(3)查看Job信息和Pod信息,如下图所示。
(4)等待60秒后,再次查看Job信息和Pod信息,如下图所示。
(5)再等待60秒后,再次查看Job信息和Pod信息,如下图所示。