[ja] Translate docs/concepts/workloads/controllers/job.md (#34296)
* Translate docs/concepts/workloads/controllers/job.md into Japanese(Line 1-266) * append the original English text * modify the layout * deleted reviewers block, modified the links and commited the suggestion * removed the original English text and fixed the links * synchronise the modification in the original English text * Update content/ja/docs/concepts/workloads/controllers/job.md Co-authored-by: atoato88 <akihito-inou@nec.com> * Update content/ja/docs/concepts/workloads/controllers/job.md Co-authored-by: atoato88 <akihito-inou@nec.com> * Update content/ja/docs/concepts/workloads/controllers/job.md Co-authored-by: atoato88 <akihito-inou@nec.com> * Update content/ja/docs/concepts/workloads/controllers/job.md Co-authored-by: atoato88 <akihito-inou@nec.com> * Update content/ja/docs/concepts/workloads/controllers/job.md Co-authored-by: atoato88 <akihito-inou@nec.com> * Update content/ja/docs/concepts/workloads/controllers/job.md Co-authored-by: atoato88 <akihito-inou@nec.com> * Update content/ja/docs/concepts/workloads/controllers/job.md Co-authored-by: atoato88 <akihito-inou@nec.com> * Update content/ja/docs/concepts/workloads/controllers/job.md Co-authored-by: atoato88 <akihito-inou@nec.com> * Update content/ja/docs/concepts/workloads/controllers/job.md Co-authored-by: atoato88 <akihito-inou@nec.com> * Update content/ja/docs/concepts/workloads/controllers/job.md Co-authored-by: atoato88 <akihito-inou@nec.com> * Update content/ja/docs/concepts/workloads/controllers/job.md Co-authored-by: atoato88 <akihito-inou@nec.com> * Update content/ja/docs/concepts/workloads/controllers/job.md Co-authored-by: Toshiaki Inukai <82919057+t-inu@users.noreply.github.com> * Update content/ja/docs/concepts/workloads/controllers/job.md Co-authored-by: Toshiaki Inukai <82919057+t-inu@users.noreply.github.com> * Update content/ja/docs/concepts/workloads/controllers/job.md Co-authored-by: Toshiaki Inukai <82919057+t-inu@users.noreply.github.com> * Update content/ja/docs/concepts/workloads/controllers/job.md Co-authored-by: Toshiaki Inukai <82919057+t-inu@users.noreply.github.com> * Update content/ja/docs/concepts/workloads/controllers/job.md Co-authored-by: Toshiaki Inukai <82919057+t-inu@users.noreply.github.com> * Update content/ja/docs/concepts/workloads/controllers/job.md Co-authored-by: Toshiaki Inukai <82919057+t-inu@users.noreply.github.com> * Update content/ja/docs/concepts/workloads/controllers/job.md Co-authored-by: Toshiaki Inukai <82919057+t-inu@users.noreply.github.com> * Update content/ja/docs/concepts/workloads/controllers/job.md Co-authored-by: Toshiaki Inukai <82919057+t-inu@users.noreply.github.com> * Update content/ja/docs/concepts/workloads/controllers/job.md Co-authored-by: Toshiaki Inukai <82919057+t-inu@users.noreply.github.com> * Update content/ja/docs/concepts/workloads/controllers/job.md Co-authored-by: Toshiaki Inukai <82919057+t-inu@users.noreply.github.com> * Update content/ja/docs/concepts/workloads/controllers/job.md Co-authored-by: Toshiaki Inukai <82919057+t-inu@users.noreply.github.com> * Translate docs/concepts/workloads/controllers/job.md into Japanese(Line 266-470) * Update content/ja/docs/concepts/workloads/controllers/job.md Co-authored-by: Toshiaki Inukai <82919057+t-inu@users.noreply.github.com> * Update content/ja/docs/concepts/workloads/controllers/job.md Co-authored-by: Toshiaki Inukai <82919057+t-inu@users.noreply.github.com> * Update content/ja/docs/concepts/workloads/controllers/job.md Co-authored-by: Toshiaki Inukai <82919057+t-inu@users.noreply.github.com> * Update content/ja/docs/concepts/workloads/controllers/job.md Co-authored-by: Toshiaki Inukai <82919057+t-inu@users.noreply.github.com> * Update content/ja/docs/concepts/workloads/controllers/job.md Co-authored-by: Toshiaki Inukai <82919057+t-inu@users.noreply.github.com> * Update content/ja/docs/concepts/workloads/controllers/job.md Co-authored-by: Toshiaki Inukai <82919057+t-inu@users.noreply.github.com> * Update content/ja/docs/concepts/workloads/controllers/job.md Co-authored-by: Toshiaki Inukai <82919057+t-inu@users.noreply.github.com> * Update content/ja/docs/concepts/workloads/controllers/job.md Co-authored-by: Toshiaki Inukai <82919057+t-inu@users.noreply.github.com> * Update content/ja/docs/concepts/workloads/controllers/job.md Co-authored-by: Toshiaki Inukai <82919057+t-inu@users.noreply.github.com> * Update content/ja/docs/concepts/workloads/controllers/job.md Co-authored-by: Toshiaki Inukai <82919057+t-inu@users.noreply.github.com> * Update content/ja/docs/concepts/workloads/controllers/job.md Co-authored-by: atoato88 <akihito-inou@nec.com> * Update content/ja/docs/concepts/workloads/controllers/job.md Co-authored-by: atoato88 <akihito-inou@nec.com> * Update content/ja/docs/concepts/workloads/controllers/job.md Co-authored-by: atoato88 <akihito-inou@nec.com> * Update content/ja/docs/concepts/workloads/controllers/job.md Co-authored-by: Toshiaki Inukai <82919057+t-inu@users.noreply.github.com> * Update content/ja/docs/concepts/workloads/controllers/job.md Co-authored-by: Toshiaki Inukai <82919057+t-inu@users.noreply.github.com> * Update content/ja/docs/concepts/workloads/controllers/job.md Co-authored-by: Toshiaki Inukai <82919057+t-inu@users.noreply.github.com> * Update content/ja/docs/concepts/workloads/controllers/job.md Co-authored-by: Toshiaki Inukai <82919057+t-inu@users.noreply.github.com> * Update content/ja/docs/concepts/workloads/controllers/job.md Co-authored-by: Toshiaki Inukai <82919057+t-inu@users.noreply.github.com> * Update content/ja/docs/concepts/workloads/controllers/job.md Co-authored-by: Toshiaki Inukai <82919057+t-inu@users.noreply.github.com> * Update content/ja/docs/concepts/workloads/controllers/job.md Co-authored-by: Toshiaki Inukai <82919057+t-inu@users.noreply.github.com> * Translate docs/concepts/workloads/controllers/job.md into Japanese(Line 471-595) * Synchronize with the original text * Update content/ja/docs/concepts/workloads/controllers/job.md Co-authored-by: Toshiaki Inukai <82919057+t-inu@users.noreply.github.com> * Update content/ja/docs/concepts/workloads/controllers/job.md Co-authored-by: Toshiaki Inukai <82919057+t-inu@users.noreply.github.com> * Update content/ja/docs/concepts/workloads/controllers/job.md Co-authored-by: Toshiaki Inukai <82919057+t-inu@users.noreply.github.com> * Update content/ja/docs/concepts/workloads/controllers/job.md Co-authored-by: Toshiaki Inukai <82919057+t-inu@users.noreply.github.com> * Update content/ja/docs/concepts/workloads/controllers/job.md Co-authored-by: Toshiaki Inukai <82919057+t-inu@users.noreply.github.com> * Update content/ja/docs/concepts/workloads/controllers/job.md Co-authored-by: Toshiaki Inukai <82919057+t-inu@users.noreply.github.com> * Update content/ja/docs/concepts/workloads/controllers/job.md Co-authored-by: Toshiaki Inukai <82919057+t-inu@users.noreply.github.com> * Update content/ja/docs/concepts/workloads/controllers/job.md Co-authored-by: Toshiaki Inukai <82919057+t-inu@users.noreply.github.com> * Update content/ja/docs/concepts/workloads/controllers/job.md Co-authored-by: Toshiaki Inukai <82919057+t-inu@users.noreply.github.com> * Update content/ja/docs/concepts/workloads/controllers/job.md Co-authored-by: Toshiaki Inukai <82919057+t-inu@users.noreply.github.com> * Update content/ja/docs/concepts/workloads/controllers/job.md Co-authored-by: Toshiaki Inukai <82919057+t-inu@users.noreply.github.com> * Update content/ja/docs/concepts/workloads/controllers/job.md Co-authored-by: Toshiaki Inukai <82919057+t-inu@users.noreply.github.com> * Update content/ja/docs/concepts/workloads/controllers/job.md Co-authored-by: Toshiaki Inukai <82919057+t-inu@users.noreply.github.com> * Update content/ja/docs/concepts/workloads/controllers/job.md Co-authored-by: Toshiaki Inukai <82919057+t-inu@users.noreply.github.com> * modified some typo * Update content/ja/docs/concepts/workloads/controllers/job.md Co-authored-by: Toshiaki Inukai <82919057+t-inu@users.noreply.github.com> * Update content/ja/docs/concepts/workloads/controllers/job.md Co-authored-by: Toshiaki Inukai <82919057+t-inu@users.noreply.github.com> * Update content/ja/docs/concepts/workloads/controllers/job.md Co-authored-by: Toshiaki Inukai <82919057+t-inu@users.noreply.github.com> * Update content/ja/docs/concepts/workloads/controllers/job.md Co-authored-by: Toshiaki Inukai <82919057+t-inu@users.noreply.github.com> * Update content/ja/docs/concepts/workloads/controllers/job.md Co-authored-by: Toshiaki Inukai <82919057+t-inu@users.noreply.github.com> * Update content/ja/docs/concepts/workloads/controllers/job.md Co-authored-by: Toshiaki Inukai <82919057+t-inu@users.noreply.github.com> * Update content/ja/docs/concepts/workloads/controllers/job.md Co-authored-by: Toshiaki Inukai <82919057+t-inu@users.noreply.github.com> * Update content/ja/docs/concepts/workloads/controllers/job.md Co-authored-by: atoato88 <akihito-inou@nec.com> * Update content/ja/docs/concepts/workloads/controllers/job.md Co-authored-by: atoato88 <akihito-inou@nec.com> * Update content/ja/docs/concepts/workloads/controllers/job.md Co-authored-by: atoato88 <akihito-inou@nec.com> * Update content/ja/docs/concepts/workloads/controllers/job.md Co-authored-by: atoato88 <akihito-inou@nec.com> * Update content/ja/docs/concepts/workloads/controllers/job.md Co-authored-by: atoato88 <akihito-inou@nec.com> * Update content/ja/docs/concepts/workloads/controllers/job.md Co-authored-by: atoato88 <akihito-inou@nec.com> * Update content/ja/docs/concepts/workloads/controllers/job.md Co-authored-by: atoato88 <akihito-inou@nec.com> * Update content/ja/docs/concepts/workloads/controllers/job.md Co-authored-by: atoato88 <akihito-inou@nec.com> * Update content/ja/docs/concepts/workloads/controllers/job.md Co-authored-by: atoato88 <akihito-inou@nec.com> * Update content/ja/docs/concepts/workloads/controllers/job.md Co-authored-by: atoato88 <akihito-inou@nec.com> * Update content/ja/docs/concepts/workloads/controllers/job.md Co-authored-by: atoato88 <akihito-inou@nec.com> * Update content/ja/docs/concepts/workloads/controllers/job.md Co-authored-by: Toshiaki Inukai <82919057+t-inu@users.noreply.github.com> * modified some translations * modified the image version * Update content/ja/docs/concepts/workloads/controllers/job.md Co-authored-by: Toshiaki Inukai <82919057+t-inu@users.noreply.github.com> * Update content/ja/docs/concepts/workloads/controllers/job.md Co-authored-by: Toshiaki Inukai <82919057+t-inu@users.noreply.github.com> * Update content/ja/docs/concepts/workloads/controllers/job.md Co-authored-by: Toshiaki Inukai <82919057+t-inu@users.noreply.github.com> * Update content/ja/docs/concepts/workloads/controllers/job.md Co-authored-by: Toshiaki Inukai <82919057+t-inu@users.noreply.github.com> * Update content/ja/docs/concepts/workloads/controllers/job.md Co-authored-by: Toshiaki Inukai <82919057+t-inu@users.noreply.github.com> * Update content/ja/docs/concepts/workloads/controllers/job.md Co-authored-by: Toshiaki Inukai <82919057+t-inu@users.noreply.github.com> * Update content/ja/docs/concepts/workloads/controllers/job.md Co-authored-by: Toshiaki Inukai <82919057+t-inu@users.noreply.github.com> * Update content/ja/docs/concepts/workloads/controllers/job.md Co-authored-by: Toshiaki Inukai <82919057+t-inu@users.noreply.github.com> * Update content/ja/docs/concepts/workloads/controllers/job.md Co-authored-by: Toshiaki Inukai <82919057+t-inu@users.noreply.github.com> * Update content/ja/docs/concepts/workloads/controllers/job.md Co-authored-by: Toshiaki Inukai <82919057+t-inu@users.noreply.github.com> * Update content/ja/docs/concepts/workloads/controllers/job.md Co-authored-by: Toshiaki Inukai <82919057+t-inu@users.noreply.github.com> * Update content/ja/docs/concepts/workloads/controllers/job.md Co-authored-by: Toshiaki Inukai <82919057+t-inu@users.noreply.github.com> * Update content/ja/docs/concepts/workloads/controllers/job.md Co-authored-by: Toshiaki Inukai <82919057+t-inu@users.noreply.github.com> * Update content/ja/docs/concepts/workloads/controllers/job.md Co-authored-by: Toshiaki Inukai <82919057+t-inu@users.noreply.github.com> * Update content/ja/docs/concepts/workloads/controllers/job.md Co-authored-by: Toshiaki Inukai <82919057+t-inu@users.noreply.github.com> * Update content/ja/docs/concepts/workloads/controllers/job.md Co-authored-by: Toshiaki Inukai <82919057+t-inu@users.noreply.github.com> * Update content/ja/docs/concepts/workloads/controllers/job.md Co-authored-by: Toshiaki Inukai <82919057+t-inu@users.noreply.github.com> * fixed some typo * Update content/ja/docs/concepts/workloads/controllers/job.md Co-authored-by: nasa9084 <nasa9084@users.noreply.github.com> * Update content/ja/docs/concepts/workloads/controllers/job.md Co-authored-by: nasa9084 <nasa9084@users.noreply.github.com> * Update content/ja/docs/concepts/workloads/controllers/job.md Co-authored-by: nasa9084 <nasa9084@users.noreply.github.com> * Update content/ja/docs/concepts/workloads/controllers/job.md Co-authored-by: nasa9084 <nasa9084@users.noreply.github.com> * Update content/ja/docs/concepts/workloads/controllers/job.md Co-authored-by: nasa9084 <nasa9084@users.noreply.github.com> Co-authored-by: atoato88 <akihito-inou@nec.com> Co-authored-by: Toshiaki Inukai <82919057+t-inu@users.noreply.github.com> Co-authored-by: nasa9084 <nasa9084@users.noreply.github.com>
This commit is contained in:
parent
b122ea5d70
commit
9041424353
|
|
@ -0,0 +1,603 @@
|
|||
---
|
||||
title: Jobs
|
||||
content_type: concept
|
||||
feature:
|
||||
title: バッチ実行
|
||||
description: >
|
||||
サービスだけでなく、KubernetesはバッチとCIワークロードの管理機能も提供し、必要に応じて障害が発生したコンテナを置き換えることもできます。
|
||||
weight: 50
|
||||
---
|
||||
|
||||
<!-- overview -->
|
||||
|
||||
Jobは一つ以上のPodを作成し、指定された数のPodが正常に終了するまで、Podの実行を再試行し続けます。Podが正常に終了すると、Jobは成功したPodの数を追跡します。指定された完了数に達すると、そのタスク(つまりJob)は完了したとみなされます。Jobを削除すると、作成されたPodも一緒に削除されます。Jobを一時停止すると、再開されるまで、稼働しているPodは全部削除されます。
|
||||
|
||||
単純なケースを言うと、確実に一つのPodが正常に完了するまで実行されるよう、一つのJobオブジェクトを作成します。
|
||||
一つ目のPodに障害が発生したり、(例えばノードのハードウェア障害またノードの再起動が原因で)削除されたりすると、Jobオブジェクトは新しいPodを作成します。
|
||||
|
||||
Jobで複数のPodを並列で実行することもできます。
|
||||
|
||||
スケジュールに沿ってJob(単一のタスクか複数タスク並列のいずれか)を実行したい場合は [CronJob](/ja/docs/concepts/workloads/controllers/cron-jobs/)を参照してください。
|
||||
|
||||
<!-- body -->
|
||||
|
||||
## 実行例 {#running-an-example-job}
|
||||
|
||||
下記にJobの定義例を記載しています。πを2000桁まで計算して出力するJobで、完了するまで約10秒かかります。
|
||||
|
||||
{{< codenew file="controllers/job.yaml" >}}
|
||||
|
||||
このコマンドで実行できます:
|
||||
|
||||
```shell
|
||||
kubectl apply -f https://kubernetes.io/examples/controllers/job.yaml
|
||||
```
|
||||
|
||||
実行結果はこのようになります:
|
||||
|
||||
```
|
||||
job.batch/pi created
|
||||
```
|
||||
|
||||
`kubectl`でJobの状態を確認できます:
|
||||
|
||||
{{< tabs name="Check status of Job" >}}
|
||||
{{< tab name="kubectl describe job pi" codelang="bash" >}}
|
||||
Name: pi
|
||||
Namespace: default
|
||||
Selector: controller-uid=c9948307-e56d-4b5d-8302-ae2d7b7da67c
|
||||
Labels: controller-uid=c9948307-e56d-4b5d-8302-ae2d7b7da67c
|
||||
job-name=pi
|
||||
Annotations: kubectl.kubernetes.io/last-applied-configuration:
|
||||
{"apiVersion":"batch/v1","kind":"Job","metadata":{"annotations":{},"name":"pi","namespace":"default"},"spec":{"backoffLimit":4,"template":...
|
||||
Parallelism: 1
|
||||
Completions: 1
|
||||
Start Time: Mon, 02 Dec 2019 15:20:11 +0200
|
||||
Completed At: Mon, 02 Dec 2019 15:21:16 +0200
|
||||
Duration: 65s
|
||||
Pods Statuses: 0 Running / 1 Succeeded / 0 Failed
|
||||
Pod Template:
|
||||
Labels: controller-uid=c9948307-e56d-4b5d-8302-ae2d7b7da67c
|
||||
job-name=pi
|
||||
Containers:
|
||||
pi:
|
||||
Image: perl:5.34.0
|
||||
Port: <none>
|
||||
Host Port: <none>
|
||||
Command:
|
||||
perl
|
||||
-Mbignum=bpi
|
||||
-wle
|
||||
print bpi(2000)
|
||||
Environment: <none>
|
||||
Mounts: <none>
|
||||
Volumes: <none>
|
||||
Events:
|
||||
Type Reason Age From Message
|
||||
---- ------ ---- ---- -------
|
||||
Normal SuccessfulCreate 14m job-controller Created pod: pi-5rwd7
|
||||
{{< /tab >}}
|
||||
{{< tab name="kubectl get job pi -o yaml" codelang="bash" >}}
|
||||
apiVersion: batch/v1
|
||||
kind: Job
|
||||
metadata:
|
||||
annotations:
|
||||
kubectl.kubernetes.io/last-applied-configuration: |
|
||||
{"apiVersion":"batch/v1","kind":"Job","metadata":{"annotations":{},"name":"pi","namespace":"default"},"spec":{"backoffLimit":4,"template":{"spec":{"containers":[{"command":["perl","-Mbignum=bpi","-wle","print bpi(2000)"],"image":"perl","name":"pi"}],"restartPolicy":"Never"}}}}
|
||||
creationTimestamp: "2022-06-15T08:40:15Z"
|
||||
generation: 1
|
||||
labels:
|
||||
controller-uid: 863452e6-270d-420e-9b94-53a54146c223
|
||||
job-name: pi
|
||||
name: pi
|
||||
namespace: default
|
||||
resourceVersion: "987"
|
||||
uid: 863452e6-270d-420e-9b94-53a54146c223
|
||||
spec:
|
||||
backoffLimit: 4
|
||||
completionMode: NonIndexed
|
||||
completions: 1
|
||||
parallelism: 1
|
||||
selector:
|
||||
matchLabels:
|
||||
controller-uid: 863452e6-270d-420e-9b94-53a54146c223
|
||||
suspend: false
|
||||
template:
|
||||
metadata:
|
||||
creationTimestamp: null
|
||||
labels:
|
||||
controller-uid: 863452e6-270d-420e-9b94-53a54146c223
|
||||
job-name: pi
|
||||
spec:
|
||||
containers:
|
||||
- command:
|
||||
- perl
|
||||
- -Mbignum=bpi
|
||||
- -wle
|
||||
- print bpi(2000)
|
||||
image: perl:5.34.0
|
||||
imagePullPolicy: Always
|
||||
name: pi
|
||||
resources: {}
|
||||
terminationMessagePath: /dev/termination-log
|
||||
terminationMessagePolicy: File
|
||||
dnsPolicy: ClusterFirst
|
||||
restartPolicy: Never
|
||||
schedulerName: default-scheduler
|
||||
securityContext: {}
|
||||
terminationGracePeriodSeconds: 30
|
||||
status:
|
||||
active: 1
|
||||
ready: 1
|
||||
startTime: "2022-06-15T08:40:15Z"
|
||||
{{< /tab >}}
|
||||
{{< /tabs >}}
|
||||
|
||||
Jobの完了したPodを確認するには、`kubectl get pods`を使います。
|
||||
|
||||
Jobに属するPodの一覧を機械可読形式で出力するには、下記のコマンドを使います:
|
||||
|
||||
```shell
|
||||
pods=$(kubectl get pods --selector=job-name=pi --output=jsonpath='{.items[*].metadata.name}')
|
||||
echo $pods
|
||||
```
|
||||
|
||||
出力結果はこのようになります:
|
||||
|
||||
```
|
||||
pi-5rwd7
|
||||
```
|
||||
|
||||
ここのセレクターはJobのセレクターと同じです。`--output=jsonpath`オプションは、返されたリストからPodのnameフィールドを指定するための表現です。
|
||||
|
||||
その中の一つのPodの標準出力を確認するには:
|
||||
|
||||
```shell
|
||||
kubectl logs $pods
|
||||
```
|
||||
|
||||
出力結果はこのようになります:
|
||||
|
||||
```
|
||||

|
||||
```
|
||||
|
||||
## Job spec(仕様)の書き方 {#writing-a-job-spec}
|
||||
|
||||
他のKubernetesオブジェクト設定ファイルと同様に、Jobにも`apiVersion`、`kind`または`metadata`フィールドが必要です。
|
||||
Jobの名前は有効な[DNSサブドメイン名](/ja/docs/concepts/overview/working-with-objects/names/#dns-subdomain-names)である必要があります。
|
||||
|
||||
Jobには[`.spec`セクション](https://git.k8s.io/community/contributors/devel/sig-architecture/api-conventions.md#spec-and-status)も必要です。
|
||||
|
||||
### Podテンプレート {#pod-template}
|
||||
|
||||
`.spec.template`は`.spec`の唯一の必須フィールドです。
|
||||
|
||||
`.spec.template`は[podテンプレート](/ja/docs/concepts/workloads/pods/#pod-template)です。ネストされていることと`apiVersion`や`kind`フィールドが不要になったことを除いて、仕様の定義が{{< glossary_tooltip text="Pod" term_id="pod" >}}と全く同じです。
|
||||
|
||||
Podの必須フィールドに加えて、Job定義ファイルにあるPodテンプレートでは、適切なラベル([podセレクター](#pod-selector)を参照)と適切な再起動ポリシーを指定する必要があります。
|
||||
|
||||
[`RestartPolicy`](/ja/docs/concepts/workloads/pods/pod-lifecycle/#restart-policy)は`Never`か`OnFailure`のみ設定可能です。
|
||||
|
||||
### Podセレクター {#pod-selector}
|
||||
|
||||
`.spec.selector`フィールドはオプションです。ほとんどの場合はむしろ指定しないほうがよいです。
|
||||
[独自のPodセレクターを指定](#specifying-your-own-pod-selector)セクションを参照してください。
|
||||
|
||||
### Jobの並列実行 {#parallel-jobs}
|
||||
|
||||
Jobで実行するのに適したタスクは主に3種類あります:
|
||||
|
||||
1. 非並列Job
|
||||
- 通常、Podに障害が発生しない限り、一つのPodのみが起動されます。
|
||||
- Podが正常に終了すると、Jobはすぐに完了します。
|
||||
2. *固定の完了数*を持つ並列Job:
|
||||
- `.spec.completions`に0以外の正の値を指定します。
|
||||
- Jobは全体的なタスクを表し、`.spec.completions`個のPodが成功すると、Jobの完了となります。
|
||||
- `.spec.completionMode="Indexed"`を利用する場合、各Podは0から`.spec.completions-1`までの範囲内のインデックスがアサインされます。
|
||||
3. *ワークキュー*を利用した並列Job:
|
||||
- `.spec.completions`の指定をしない場合、デフォルトは`.spec.parallelism`となります。
|
||||
- Pod間で調整する、または外部サービスを使う方法で、それぞれ何のタスクに着手するかを決めます。例えば、一つのPodはワークキューから最大N個のタスクを一括で取得できます。
|
||||
- 各Podは他のPodがすべて終了したかどうか、つまりJobが完了したかどうかを単独で判断できます。
|
||||
- Jobに属する _任意_ のPodが正常に終了すると、新しいPodは作成されません。
|
||||
- 一つ以上のPodが正常に終了し、すべてのPodが終了すると、Jobは正常に完了します。
|
||||
- 一つのPodが正常に終了すると、他のPodは同じタスクの作業を行ったり、出力を書き込んだりすることはできません。すべてのPodが終了プロセスに進む必要があります。
|
||||
|
||||
_非並列_ Jobの場合、`.spec.completions`と`.spec.parallelism`の両方を未設定のままにしておくことも可能です。未設定の場合、両方がデフォルトで1になります。
|
||||
|
||||
_完了数固定_ Jobの場合、`.spec.completions`を必要完了数に設定する必要があります。
|
||||
`.spec.parallelism`を設定してもいいですし、未設定の場合、デフォルトで1になります。
|
||||
|
||||
_ワークキュー_ 並列Jobの場合、`.spec.completions`を未設定のままにし、`.spec.parallelism`を非負の整数に設定する必要があります。
|
||||
|
||||
各種類のJobの使用方法の詳細については、[Jobパターン](#job-patterns)セクションを参照してください。
|
||||
|
||||
#### 並列処理の制御 {#controlling-parallelism}
|
||||
|
||||
必要並列数(`.spec.parallelism`)は任意の非負の値に設定できます。
|
||||
未設定の場合は、デフォルトで1になります。
|
||||
0に設定した際には、増加するまでJobは一時停止されます。
|
||||
|
||||
実際の並列数(任意の瞬間に実行されているPod数)は、さまざまな理由により、必要並列数と異なる可能性があります:
|
||||
|
||||
- _完了数固定_ Jobの場合、実際に並列して実行されるPodの数は、残りの完了数を超えることはありません。 `.spec.parallelism`の値が高い場合は無視されます。
|
||||
- _ワークキュー_ Jobの場合、任意のPodが成功すると、新しいPodは作成されません。ただし、残りのPodは終了まで実行し続けられます。
|
||||
- Job{{< glossary_tooltip text="コントローラー" term_id="controller" >}}の応答する時間がなかった場合。
|
||||
- Jobコントローラーが何らかの理由で(`ResourceQuota`の不足、権限の不足など)、Podを作成できない場合、
|
||||
実際の並列数は必要並列数より少なくなる可能性があります。
|
||||
- 同じJobで過去に発生した過度のPod障害が原因で、Jobコントローラーは新しいPodの作成を抑制することがあります。
|
||||
- Podがグレースフルシャットダウンされた場合、停止するのに時間がかかります。
|
||||
|
||||
### 完了モード {#completion-mode}
|
||||
|
||||
{{< feature-state for_k8s_version="v1.24" state="stable" >}}
|
||||
|
||||
_完了数固定_ Job、つまり`.spec.completions`の値がnullではないJobは`.spec.completionMode`で完了モードを指定できます:
|
||||
|
||||
- `NonIndexed`(デフォルト): `.spec.completions`個のPodが成功した場合、Jobの完了となります。言い換えれば、各Podの完了状態は同質です。ここで要注意なのは、`.spec.completions`の値がnullの場合、暗黙的に`NonIndexed`として指定されることです。
|
||||
- `Indexed`: Jobに属するPodはそれぞれ、0から`.spec.completions-1`の範囲内の完了インデックスを取得できます。インデックスは下記の三つの方法で取得できます。
|
||||
- Podアノテーション`batch.kubernetes.io/job-completion-index`。
|
||||
- Podホスト名の一部として、`$(job-name)-$(index)`の形式になっています。
|
||||
インデックス付きJob(Indexed Job)と{{< glossary_tooltip term_id="Service" >}}を一緒に使用すると、Jobに属するPodはお互いにDNSを介して確定的ホスト名で通信できます。
|
||||
- コンテナ化されたタスクの環境変数`JOB_COMPLETION_INDEX`。
|
||||
|
||||
インデックスごとに、成功したPodが一つ存在すると、Jobの完了となります。完了モードの使用方法の詳細については、
|
||||
[静的な処理の割り当てを使用した並列処理のためのインデックス付きJob](/ja/docs/tasks/job/indexed-parallel-processing-static/)を参照してください。めったに発生しませんが、同じインデックスを取得して稼働し始めるPodも存在する可能性があります。ただし、完了数にカウントされるのはそのうちの一つだけです。
|
||||
|
||||
## Podとコンテナの障害対策 {#handling-pod-and-container-failures}
|
||||
|
||||
Pod内のコンテナは、その中のプロセスが0以外の終了コードで終了した、またはメモリ制限を超えたためにコンテナが強制終了されたなど、様々な理由で失敗することがあります。この場合、もし`.spec.template.spec.restartPolicy = "OnFailure"`と設定すると、Podはノード上に残りますが、コンテナは再実行されます。そのため、プログラムがローカルで再起動した場合の処理を行うか、`.spec.template.spec.restartPolicy = "Never"`と指定する必要があります。
|
||||
`restartPolicy`の詳細については[Podのライフサイクル](/ja/docs/concepts/workloads/pods/pod-lifecycle/)を参照してください。
|
||||
|
||||
Podがノードからキックされた(ノードがアップグレード、再起動、削除されたなど)、または`.spec.template.spec.restartPolicy = "Never"`と設定されたときにPodに属するコンテナが失敗したなど、様々な理由でPod全体が故障することもあります。Podに障害が発生すると、Jobコントローラーは新しいPodを起動します。つまりアプリケーションは新しいPodで再起動された場合の処理を行う必要があります。特に、過去に実行した際に生じた一時ファイル、ロック、不完全な出力などを処理する必要があります。
|
||||
|
||||
`.spec.parallelism = 1`、`.spec.completions = 1`と`.spec.template.spec.restartPolicy = "Never"`を指定しても、同じプログラムが2回起動されることもありますので注意してください。
|
||||
|
||||
`.spec.parallelism`と`.spec.completions`を両方とも2以上指定した場合、複数のPodが同時に実行される可能性があります。そのため、Podは並行処理を行えるようにする必要があります。
|
||||
|
||||
### Pod失敗のバックオフポリシー {#pod-backoff-failure-policy}
|
||||
|
||||
設定の論理エラーなどにより、Jobが数回再試行した後に失敗状態にしたい場合があります。`.spec.backoffLimit`を設定すると、失敗したと判断するまでの再試行回数を指定できます。バックオフ制限はデフォルトで6に設定されています。Jobに属していて失敗したPodはJobコントローラーにより再作成され、バックオフ遅延は指数関数的に増加し(10秒、20秒、40秒…)、最大6分まで増加します。
|
||||
|
||||
再実行回数の算出方法は以下の2通りです:
|
||||
- `.status.phase = "Failed"`で設定されたPod数を計算します。
|
||||
- `restartPolicy = "OnFailure"`と設定された場合、`.status.phase`が`Pending`または`Running`であるPodに属するすべてのコンテナで再試行する回数を計算します。
|
||||
|
||||
どちらかの計算が`.spec.backoffLimit`に達した場合、Jobは失敗とみなされます。
|
||||
|
||||
[`JobTrackingWithFinalizers`](#job-tracking-with-finalizers)機能が無効な場合、
|
||||
失敗したPodの数は、API内にまだ存在するPodのみに基づいています。
|
||||
|
||||
{{< note >}}
|
||||
`restartPolicy = "OnFailure"`が設定されたJobはバックオフ制限に達すると、属するPodは全部終了されるので注意してください。これにより、Jobの実行ファイルのデバッグ作業が難しくなる可能性があります。失敗したJobからの出力が不用意に失われないように、Jobのデバッグ作業をする際は`restartPolicy = "Never"`を設定するか、ロギングシステムを使用することをお勧めします。
|
||||
{{< /note >}}
|
||||
|
||||
## Jobの終了とクリーンアップ {#job-termination-and-cleanup}
|
||||
|
||||
Jobが完了すると、それ以上Podは作成されませんが、[通常](#pod-backoff-failure-policy)Podが削除されることもありません。
|
||||
これらを残しておくと、完了したPodのログを確認でき、エラーや警告などの診断出力を確認できます。
|
||||
またJobオブジェクトはJob完了後も残っているため、状態を確認することができます。古いJobの状態を把握した上で、削除するかどうかはユーザー次第です。Jobを削除するには`kubectl` (例:`kubectl delete jobs/pi`または`kubectl delete -f ./job.yaml`)を使います。`kubectl`でJobを削除する場合、Jobが作成したPodも全部削除されます。
|
||||
|
||||
デフォルトでは、Jobは中断されることなく実行できますが、Podが失敗した場合(`restartPolicy=Never`)、またはコンテナがエラーで終了した場合(`restartPolicy=OnFailure`)のみ、前述の`.spec.backoffLimit`で決まった回数まで再試行します。`.spec.backoffLimit`に達すると、Jobが失敗とマークされ、実行中のPodもすべて終了されます。
|
||||
|
||||
Jobを終了させるもう一つの方法は、活動期間を設定することです。
|
||||
Jobの`.spec.activeDeadlineSeconds`フィールドに秒数を設定することで、活動期間を設定できます。
|
||||
Podがいくつ作成されても、`activeDeadlineSeconds`はJobの存続する時間に適用されます。
|
||||
Jobが`activeDeadlineSeconds`に達すると、実行中のすべてのPodは終了され、Jobの状態は`type: Failed`になり、理由は`reason: DeadlineExceeded`になります。
|
||||
|
||||
ここで要注意なのは、Jobの`.spec.activeDeadlineSeconds`は`.spec.backoffLimit`よりも優先されます。したがって、失敗して再試行しているPodが一つ以上持っているJobは、`backoffLimit`に達していなくても、`activeDeadlineSeconds`で指定された設定時間に達すると、追加のPodをデプロイしなくなります。
|
||||
|
||||
例えば:
|
||||
|
||||
```yaml
|
||||
apiVersion: batch/v1
|
||||
kind: Job
|
||||
metadata:
|
||||
name: pi-with-timeout
|
||||
spec:
|
||||
backoffLimit: 5
|
||||
activeDeadlineSeconds: 100
|
||||
template:
|
||||
spec:
|
||||
containers:
|
||||
- name: pi
|
||||
image: perl:5.34.0
|
||||
command: ["perl", "-Mbignum=bpi", "-wle", "print bpi(2000)"]
|
||||
restartPolicy: Never
|
||||
```
|
||||
|
||||
Job仕様と、Jobに属する[Podテンプレートの仕様](/ja/docs/concepts/workloads/pods/init-containers/#detailed-behavior)は両方とも`activeDeadlineSeconds`フィールドを持っているので注意してください。適切なレベルで設定していることを確認してください。
|
||||
|
||||
また`restartPolicy`はJob自体ではなく、Podに適用されることも注意してください: Jobの状態は`type: Failed`になると、自動的に再起動されることはありません。
|
||||
つまり、`.spec.activeDeadlineSeconds`と`.spec.backoffLimit`によって引き起こされるJob終了メカニズムは、永久的なJob失敗につながり、手動で介入して解決する必要があります。
|
||||
|
||||
## 終了したJobの自動クリーンアップ {#clean-up-finished-jobs-automatically}
|
||||
|
||||
終了したJobは通常システムに残す必要はありません。残ったままにしておくとAPIサーバーに負担をかけることになります。Jobが上位コントローラーにより直接管理されている場合、例えば[CronJobs](/ja/docs/concepts/workloads/controllers/cron-jobs/)の場合、Jobは指定された容量ベースのクリーンアップポリシーに基づき、CronJobによりクリーンアップされます。
|
||||
|
||||
### 終了したJobのTTLメカニズム {#ttl-mechanism-for-finished-jobs}
|
||||
|
||||
{{< feature-state for_k8s_version="v1.23" state="stable" >}}
|
||||
|
||||
終了したJob(状態が`Complete`か`Failed`になったJob)を自動的にクリーンアップするもう一つの方法は
|
||||
[TTLコントローラー](/ja/docs/concepts/workloads/controllers/ttlafterfinished/)より提供されたTTLメカニズムです。`.spec.ttlSecondsAfterFinished`フィールドを指定することで、終了したリソースをクリーンアップすることができます。
|
||||
|
||||
TTLコントローラーでJobをクリーンアップする場合、Jobはカスケード的に削除されます。つまりJobを削除する際に、Jobに属しているオブジェクト、例えばPodなども一緒に削除されます。Jobが削除される場合、Finalizerなどの、Jobのライフサイクル保証は守られることに注意してください。
|
||||
|
||||
例えば:
|
||||
|
||||
```yaml
|
||||
apiVersion: batch/v1
|
||||
kind: Job
|
||||
metadata:
|
||||
name: pi-with-ttl
|
||||
spec:
|
||||
ttlSecondsAfterFinished: 100
|
||||
template:
|
||||
spec:
|
||||
containers:
|
||||
- name: pi
|
||||
image: perl:5.34.0
|
||||
command: ["perl", "-Mbignum=bpi", "-wle", "print bpi(2000)"]
|
||||
restartPolicy: Never
|
||||
```
|
||||
|
||||
Job `pi-with-ttl`は終了してからの`100`秒後に自動的に削除されるようになっています。
|
||||
|
||||
このフィールドに`0`を設定すると、Jobは終了後すぐに自動削除の対象になります。このフィールドに何も設定しないと、Jobが終了してもTTLコントローラーによるクリーンアップはされません。
|
||||
|
||||
{{< note >}}
|
||||
`ttlSecondsAfterFinished`フィールドを設定することが推奨されます。管理されていないJob(CronJobなどの、他のワークロードAPIを経由せずに、直接作成したJob)は`orphanDependents`というデフォルトの削除ポリシーがあるため、Jobが完全に削除されても、属しているPodが残ってしまうからです。
|
||||
{{< glossary_tooltip text="コントロールプレーン" term_id="control-plane" >}}は最終的に、失敗または完了して削除されたJobに属するPodを[ガベージコレクション](/ja/docs/concepts/workloads/pods/pod-lifecycle/#pod-garbage-collection)しますが、Podが残っていると、クラスターのパフォーマンスが低下することがあり、最悪の場合、この低下によりクラスターがオフラインになることがあります。
|
||||
|
||||
[LimitRanges](/ja/docs/concepts/policy/limit-range/)と[リソースクォータ](/ja/docs/concepts/policy/resource-quotas/)で、指定する名前空間が消費できるリソースの量に上限を設定することができます。
|
||||
{{< /note >}}
|
||||
|
||||
|
||||
## Jobパターン {#job-patterns}
|
||||
|
||||
Jobオブジェクトは、Podの確実な並列実行をサポートするために使用されます。科学技術計算でよく見られるような、密接に通信を行う並列処理をサポートするようには設計されていません。独立だが関連性のある一連の*作業項目*の並列処理をサポートします。例えば送信すべき電子メール、レンダリングすべきフレーム、トランスコードすべきファイル、スキャンすべきNoSQLデータベースのキーの範囲、などです。
|
||||
|
||||
複雑なシステムでは、異なる作業項目のセットが複数存在する場合があります。ここでは、ユーザーが一斉に管理したい作業項目のセットが一つだけの場合 — つまり*バッチJob*だけを考えます。
|
||||
|
||||
並列計算にはいくつかのパターンがあり、それぞれに長所と短所があります。
|
||||
トレードオフの関係にあるのは:
|
||||
|
||||
- 各作業項目に1つのJobオブジェクト vs. すべての作業項目に1つのJobオブジェクト。
|
||||
後者は大量の作業項目を処理する場合に適しています。
|
||||
前者は大量のJobオブジェクトを管理するため、ユーザーとシステムにオーバーヘッドをかけることになります。
|
||||
- 作成されるPod数が作業項目数と等しい、 vs. 各Podが複数の作業項目を処理する。
|
||||
前者は通常、既存のコードやコンテナへの変更が少なくて済みます。
|
||||
後者は上記と同じ理由で、大量の作業項目を処理する場合に適しています。
|
||||
- ワークキューを利用するアプローチもいくつかあります。それを使うためには、キューサービスを実行し、既存のプログラムやコンテナにワークキューを利用させるための改造を行う必要があります。
|
||||
他のアプローチは既存のコンテナ型アプリケーションに適用しやすいです。
|
||||
|
||||
|
||||
ここでは、上記のトレードオフをまとめてあり、それぞれ2~4列目に対応しています。
|
||||
またパターン名のところは、例やより詳しい説明が書いてあるページへのリンクになっています。
|
||||
|
||||
| パターン | 単一Jobオブジェクト | Podが作業項目より少ない? | アプリを修正せずに使用できる? |
|
||||
| ----------------------------------------- |:-----------------:|:---------------------------:|:-------------------:|
|
||||
| [作業項目ごとにPodを持つキュー] | ✓ | | 時々 |
|
||||
| [Pod数可変のキュー] | ✓ | ✓ | |
|
||||
| [静的な処理の割り当てを使用したインデックス付きJob] | ✓ | | ✓ |
|
||||
| [Jobテンプレート拡張] | | | ✓ |
|
||||
|
||||
`.spec.completions`で完了数を指定する場合、Jobコントローラーより作成された各Podは同一の[`spec`](https://git.k8s.io/community/contributors/devel/sig-architecture/api-conventions.md#spec-and-status)を持ちます。これは、このタスクのすべてのPodが同じコマンドライン、同じイメージ、同じボリューム、そして(ほぼ)同じ環境変数を持つことを意味します。これらのパターンは、Podが異なる作業をするためのさまざまな配置方法になります。
|
||||
|
||||
この表は、各パターンで必要な`.spec.parallelism`と`.spec.completions`の設定を示しています。
|
||||
ここで、`W`は作業項目の数を表しています。
|
||||
|
||||
| パターン | `.spec.completions` | `.spec.parallelism` |
|
||||
| ----------------------------------------- |:-------------------:|:--------------------:|
|
||||
| [作業項目ごとにPodを持つキュー] | W | 任意 |
|
||||
| [Pod数可変のキュー] | null | 任意 |
|
||||
| [静的な処理の割り当てを使用したインデックス付きJob] | W | 任意 |
|
||||
| [Jobテンプレート拡張] | 1 | 1であるべき |
|
||||
|
||||
[作業項目ごとにPodを持つキュー]: /docs/tasks/job/coarse-parallel-processing-work-queue/
|
||||
[Pod数可変のキュー]: /docs/tasks/job/fine-parallel-processing-work-queue/
|
||||
[静的な処理の割り当てを使用したインデックス付きJob]: /ja/docs/tasks/job/indexed-parallel-processing-static/
|
||||
[Jobテンプレート拡張]: /docs/tasks/job/parallel-processing-expansion/
|
||||
|
||||
## 高度な使い方 {#advanced-usage}
|
||||
|
||||
### Jobの一時停止 {#suspending-a-job}
|
||||
|
||||
{{< feature-state for_k8s_version="v1.24" state="stable" >}}
|
||||
|
||||
Jobが作成されると、JobコントローラーはJobの要件を満たすために直ちにPodの作成を開始し、Jobが完了するまで作成し続けます。しかし、Jobの実行を一時的に中断して後で再開したい場合、または一時停止状態のJobを再開し、再開時間は後でカスタムコントローラーに判断させたい場合はあると思います。
|
||||
|
||||
Jobを一時停止するには、Jobの`.spec.suspend`フィールドをtrueに修正し、後でまた再開したい場合にはfalseに修正すればよいです。
|
||||
`.spec.suspend`をtrueに設定してJobを作成すると、一時停止状態のままで作成されます。
|
||||
|
||||
一時停止状態のJobを再開すると、`.status.startTime`フィールドの値は現在時刻にリセットされます。これはつまり、Jobが一時停止して再開すると、`.spec.activeDeadlineSeconds`タイマーは停止してリセットされることになります。
|
||||
|
||||
Jobを中断すると、稼働中のPodは全部削除されることを忘れないでください。Jobが中断されると、PodはSIGTERMシグナルを受信して[終了されます](/ja/docs/concepts/workloads/pods/pod-lifecycle/#pod-termination)。Podのグレースフル終了の猶予期間がカウントダウンされ、この期間内に、Podはこのシグナルを処理しなければなりません。場合により、その後のために処理状況を保存したり、変更を元に戻したりする処理が含まれます。この方法で終了したPodは`completions`数にカウントされません。
|
||||
|
||||
下記は一時停止状態のままで作成されたJobの定義例になります:
|
||||
|
||||
```shell
|
||||
kubectl get job myjob -o yaml
|
||||
```
|
||||
|
||||
```yaml
|
||||
apiVersion: batch/v1
|
||||
kind: Job
|
||||
metadata:
|
||||
name: myjob
|
||||
spec:
|
||||
suspend: true
|
||||
parallelism: 1
|
||||
completions: 5
|
||||
template:
|
||||
spec:
|
||||
...
|
||||
```
|
||||
|
||||
Jobのstatusセクションで、Jobが停止中なのか、過去に停止したことがあるかを判断できます:
|
||||
|
||||
```shell
|
||||
kubectl get jobs/myjob -o yaml
|
||||
```
|
||||
|
||||
```yaml
|
||||
apiVersion: batch/v1
|
||||
kind: Job
|
||||
# .metadata and .spec omitted
|
||||
status:
|
||||
conditions:
|
||||
- lastProbeTime: "2021-02-05T13:14:33Z"
|
||||
lastTransitionTime: "2021-02-05T13:14:33Z"
|
||||
status: "True"
|
||||
type: Suspended
|
||||
startTime: "2021-02-05T13:13:48Z"
|
||||
```
|
||||
|
||||
Jobのcondition.typeが"Suspended"で、statusが"True"になった場合、Jobは一時停止中になります。`lastTransitionTime`フィールドで、どのぐらい中断されたかを判断できます。statusが"False"になった場合、Jobは一時停止状態でしたが、今は実行されていることになります。conditionが書いていない場合、Jobは一度も停止していないことになります。
|
||||
|
||||
Jobが一時停止して再開した場合、Eventsも作成されます:
|
||||
|
||||
```shell
|
||||
kubectl describe jobs/myjob
|
||||
```
|
||||
|
||||
```
|
||||
Name: myjob
|
||||
...
|
||||
Events:
|
||||
Type Reason Age From Message
|
||||
---- ------ ---- ---- -------
|
||||
Normal SuccessfulCreate 12m job-controller Created pod: myjob-hlrpl
|
||||
Normal SuccessfulDelete 11m job-controller Deleted pod: myjob-hlrpl
|
||||
Normal Suspended 11m job-controller Job suspended
|
||||
Normal SuccessfulCreate 3s job-controller Created pod: myjob-jvb44
|
||||
Normal Resumed 3s job-controller Job resumed
|
||||
```
|
||||
|
||||
最後の4つのイベント、特に"Suspended"と"Resumed"のイベントは、`.spec.suspend`フィールドの値を切り替えた直接の結果です。この2つのイベントの間に、Podは作成されていないことがわかりますが、Jobが再開されるとすぐにPodの作成も再開されました。
|
||||
|
||||
### 可変スケジューリング命令 {#mutable-scheduling-directives}
|
||||
|
||||
{{< feature-state for_k8s_version="v1.23" state="beta" >}}
|
||||
|
||||
{{< note >}}
|
||||
この機能を使うためには、[APIサーバー](/ja/docs/reference/command-line-tools-reference/kube-apiserver/)上で`JobMutableNodeSchedulingDirectives`[フィーチャーゲート](/ja/docs/reference/command-line-tools-reference/feature-gates/)を有効にする必要があります。
|
||||
デフォルトで有効になっています。
|
||||
{{< /note >}}
|
||||
|
||||
ほとんどの場合、並列Jobは、すべてのPodが同じゾーン、またはすべてのGPUモデルxかyのいずれかであるが、両方の混在ではない、などの制約付きで実行することが望ましいです。
|
||||
|
||||
[suspend](#suspending-a-job)フィールドは、これらの機能を実現するための第一歩です。Suspendは、カスタムキューコントローラーがJobをいつ開始すべきかを決定することができます。しかし、Jobの一時停止が解除されると、カスタムキューコントローラーは、Job内のPodの実際の配置場所には影響を与えません。
|
||||
|
||||
この機能により、Jobが開始される前にスケジューリング命令を更新でき、カスタムキューコントローラーがPodの配置に影響を与えることができると同時に、実際のPodとノードの割り当てをkube-schedulerにオフロードすることができます。これは一時停止されたJobの中で、一度も一時停止解除されたことのないJobに対してのみ許可されます。
|
||||
|
||||
JobのPodテンプレートで更新可能なフィールドはnodeAffinity、nodeSelector、tolerations、labelsとannotationsです。
|
||||
|
||||
### 独自のPodセレクターを指定 {#specifying-your-own-pod-selector}
|
||||
|
||||
Jobオブジェクトを作成する際には通常、`.spec.selector`を指定しません。Jobが作成された際に、システムのデフォルトロジックは、他のJobと重ならないようなセレクターの値を選択し、このフィールドに追加します。
|
||||
|
||||
しかし、場合によっては、この自動設定されたセレクターをオーバーライドする必要があります。そのためには、Jobの`.spec.selector`を指定します。
|
||||
|
||||
その際には十分な注意が必要です。そのJobの他のPodと重なったラベルセレクターを指定し、無関係のPodにマッチした場合、無関係のJobのPodが削除されたり、無関係のPodが完了されてもこのJobの完了数とカウントしたり、片方または両方のJobがPodの作成または完了までの実行を拒否する可能性があります。
|
||||
一意でないセレクターを選択した場合、他のコントローラー(例えばReplicationController)や属しているPodが予測できない挙動をする可能性があります。Kubernetesは`.spec.selector`を間違って設定しても止めることはしません。
|
||||
|
||||
下記はこの機能の使用例を紹介しています。
|
||||
|
||||
`old`と名付けたJobがすでに実行されていると仮定します。既存のPodをそのまま実行し続けてほしい一方で、作成する残りのPodには別のテンプレートを使用し、そのJobには新しい名前を付けたいとしましょう。これらのフィールドは更新できないため、Jobを直接更新できません。そのため、`kubectl delete jobs/old --cascade=orphan`で、_属しているPodが実行されたまま_、`old`Jobを削除します。削除する前に、どのセレクターを使用しているかをメモしておきます:
|
||||
|
||||
```shell
|
||||
kubectl get job old -o yaml
|
||||
```
|
||||
|
||||
出力結果はこのようになります:
|
||||
|
||||
```yaml
|
||||
kind: Job
|
||||
metadata:
|
||||
name: old
|
||||
...
|
||||
spec:
|
||||
selector:
|
||||
matchLabels:
|
||||
controller-uid: a8f3d00d-c6d2-11e5-9f87-42010af00002
|
||||
...
|
||||
```
|
||||
|
||||
次に、`new`という名前で新しくJobを作成し、同じセレクターを明示的に指定します。既存のPodも`controller-uid=a8f3d00d-c6d2-11e5-9f87-42010af00002`ラベルが付いているので、同じく`new`Jobによってコントロールされます。
|
||||
|
||||
通常システムが自動的に生成するセレクターを使用しないため、新しいJobで `manualSelector: true`を指定する必要があります。
|
||||
|
||||
```yaml
|
||||
kind: Job
|
||||
metadata:
|
||||
name: new
|
||||
...
|
||||
spec:
|
||||
manualSelector: true
|
||||
selector:
|
||||
matchLabels:
|
||||
controller-uid: a8f3d00d-c6d2-11e5-9f87-42010af00002
|
||||
...
|
||||
```
|
||||
|
||||
新しいJobは`a8f3d00d-c6d2-11e5-9f87-42010af00002`ではなく、別のuidを持つことになります。`manualSelector: true`を設定することで、自分は何をしているかを知っていて、またこのミスマッチを許容することをシステムに伝えます。
|
||||
|
||||
### FinalizerによるJob追跡 {#job-tracking-with-finalizers}
|
||||
|
||||
{{< feature-state for_k8s_version="v1.23" state="beta" >}}
|
||||
|
||||
{{< note >}}
|
||||
この機能を使うためには、[APIサーバー](/ja/docs/reference/command-line-tools-reference/kube-apiserver/)と[コントローラーマネージャー](/docs/reference/command-line-tools-reference/kube-controller-manager/)で`JobTrackingWithFinalizers`
|
||||
[フィーチャーゲート](/ja/docs/reference/command-line-tools-reference/feature-gates/)を有効にする必要があります。
|
||||
|
||||
有効にした場合、コントロールプレーンは下記に示す機能で新しいJobを追跡します。この機能が有効になる前に作成されたJobは影響を受けません。ユーザーとして実感できる唯一の違いは、コントロールプレーンのJob完了ステータス追跡がより正確になるということだけです。
|
||||
{{< /note >}}
|
||||
|
||||
この機能が有効でない場合、Job {{< glossary_tooltip term_id="controller" >}}はクラスター内に存在するPodを数えてJobステータスを追跡します。つまり`succeeded`Podと`failed`Podのカウンターを保持します。
|
||||
しかし、Podは以下のような理由で削除されることもあります:
|
||||
- Nodeがダウンしたときに、孤立した(Orphan)Podを削除するガベージコレクター。
|
||||
- 閾値に達すると、(`Succeeded`または`Failed`フェーズで)終了したPodを削除するガベージコレクター。
|
||||
- Jobに属するPodの人為的な削除。
|
||||
- 外部コントローラー(Kubernetesの一部として提供されていない)によるPodの削除や置き換え。
|
||||
|
||||
クラスターで`JobTrackingWithFinalizers`機能を有効にすると、コントロールプレーンは任意のJobに属するPodを追跡し、そのようなPodがAPIサーバーから削除された場合に通知します。そのために、Jobコントローラーは`batch.kubernetes.io/job-tracking`Finalizerを持つPodを作成します。コントローラーはPodがJobステータスに計上された後にのみFinalizerを削除し、他のコントローラーやユーザーによるPodの削除を可能にします。
|
||||
|
||||
Jobコントローラーは、新しいJobに対してのみ新しいアルゴリズムを使用します。この機能が有効になる前に作成されたJobは影響を受けません。JobコントローラーがPod FinalizerでJob追跡しているかどうかは、Jobが`batch.kubernetes.io/job-tracking`というアノテーションを持っているかどうかで判断できます。
|
||||
このアノテーションを手動で追加または削除しては**いけません**。
|
||||
|
||||
## 代替案 {#alternatives}
|
||||
|
||||
### 単なるPod {#bare-pods}
|
||||
|
||||
Podが動作しているノードが再起動または故障した場合、Podは終了し、再起動されません。しかし、終了したPodを置き換えるため、Jobが新しいPodを作成します。このため、たとえアプリケーションが1つのPodしか必要としない場合でも、単なるPodではなくJobを使用することをお勧めします。
|
||||
|
||||
### Replication Controller {#replication-controller}
|
||||
|
||||
Jobは[Replication Controllers](/docs/concepts/workloads/controllers/replicationcontroller/)を補完するものです。
|
||||
Replication Controllerは、終了することが想定されていないPod(Webサーバーなど)を管理し、Jobは終了することが想定されているPod(バッチタスクなど)を管理します。
|
||||
|
||||
[Podのライフサイクル](/ja/docs/concepts/workloads/pods/pod-lifecycle/)で説明したように、`Job`は`RestartPolicy`が`OnFailure`か`Never`と設定されているPodに*のみ*適用されます。(注意:`RestartPolicy`が設定されていない場合、デフォルト値は`Always`になります)
|
||||
|
||||
|
||||
### シングルJobによるコントローラーPodの起動 {#single-job-starts-controller-pod}
|
||||
|
||||
もう一つのパターンは、一つのJobが一つPodを作り、そのPodがカスタムコントローラーのような役割を果たし、他のPodを作ります。これは最も柔軟性がありますが、使い始めるにはやや複雑で、Kubernetesとの統合もあまりできません。
|
||||
|
||||
このパターンの一例としては、Sparkマスターコントローラーを起動し、sparkドライバーを実行してクリーンアップするスクリプトを実行するPodをJobで起動する([sparkの例](https://github.com/kubernetes/examples/tree/master/staging/spark/README.md)を参照)が挙げられます。
|
||||
|
||||
|
||||
この方法のメリットは、全処理過程でJobオブジェクトが完了する保証がありながらも、どのPodを作成し、どのように作業を割り当てるかを完全に制御できることです。
|
||||
|
||||
## {{% heading "whatsnext" %}}
|
||||
|
||||
* [Pods](/ja/docs/concepts/workloads/pods/)について学ぶ。
|
||||
* Jobのさまざまな実行方法について学ぶ:
|
||||
* [ワークキューを用いた粒度の粗い並列処理](/docs/tasks/job/coarse-parallel-processing-work-queue/)
|
||||
* [ワークキューを用いた粒度の細かい並列処理](/docs/tasks/job/fine-parallel-processing-work-queue/)
|
||||
* [静的な処理の割り当てを使用した並列処理のためのインデックス付きJob](/ja/docs/tasks/job/indexed-parallel-processing-static/) を使う(beta段階)
|
||||
* テンプレートを元に複数のJobを作成: [拡張機能を用いた並列処理](/docs/tasks/job/parallel-processing-expansion/)
|
||||
* [終了したJobの自動クリーンアップ](#clean-up-finished-jobs-automatically)のリンクから、クラスターが完了または失敗したJobをどのようにクリーンアップするかをご確認ください。
|
||||
* `Job`はKubernetes REST APIの一部です。JobのAPIを理解するために、{{< api-reference page="workload-resources/job-v1" >}}オブジェクトの定義をお読みください。
|
||||
* UNIXツールの`cron`と同様に、スケジュールに基づいて実行される一連のJobを定義するために使用できる[`CronJob`](/ja/docs/concepts/workloads/controllers/cron-jobs/)についてお読みください。
|
||||
|
|
@ -7,7 +7,7 @@ spec:
|
|||
spec:
|
||||
containers:
|
||||
- name: pi
|
||||
image: perl
|
||||
image: perl:5.34.0
|
||||
command: ["perl", "-Mbignum=bpi", "-wle", "print bpi(2000)"]
|
||||
restartPolicy: Never
|
||||
backoffLimit: 4
|
||||
|
|
|
|||
Loading…
Reference in New Issue