kubelet使用livenessProbe(存活探针)来判断何时重启容器。例如,当程序中产生死锁的时候,程序还在运行,通过livenessProbe可以检测到程序已不能正常提供服务。这种情况下重启容器可以让程序恢复可用的状态(虽然程序中存在会导致死锁的bug)。如果没有配置livenessProbe,则默认状态为Success。
kubelet使用readinessProbe(就绪探针)来判断容器何时准备好了接受流量。当Pod中的所有容器都准备好时,Pod就被认为准备好了。最重要的用途是用来控制哪些pod被用作服务的后端。当一个Pod未准备好时,在负载均衡中会被移除。如果没有配置readinessProbe,则默认状态为Success。
Kube.NETes从1.17版本开始新增了startupProbe(启动探针),kubelet使用startupProbe来判断容器应用程序何时启动。如果配置了startupProbe,等启动成功后才会进行livenessProbe和readinessProbe。这样可以避免应用程序在启动过程被livenessProbe和readinessProbe影响。如果没有配置startupProbe,则默认状态为Success。
livenessProbe、readinessProbe和startupProbe都可以称为健康检查,这几种健康检查类型都支持四种检查方式:exec命令、httpGet、tcpSocket和grpc。其中exec命令行方式通用性最强,适用于大部分场景,tcpSocket方式适用于TCP类型的服务,httpGet方式适用于http类型的服务,grpc方式适用于grpc类型的服务。
配置探针的常用可选参数如下:
参数名称 |
默认值 |
最小值 |
描述 |
initialDelaySeconds |
0秒 |
0秒 |
容器启动后多久开始进行第一次探测。 |
periodSeconds |
10秒 |
1秒 |
探测频度,频率过高会对pod带来较大的额外开销,频率过低则无法及时反映容器真实情况。 |
timeoutSeconds |
1秒 |
1秒 |
探测超时时间。 |
failureThreshold |
3 |
1 |
处于成功状态时,探测连续失败几次可被认为失败。 |
successThreshold |
1 |
1 |
处于失败状态时,探测连续成功几次,被认为成功。 |
livenessProbe、readinessProbe和startupProbe的配置方法基本类似,下面就以配置livenessProbe为例。
apiVersion: v1
kind: Pod
metadata:
labels:
test: liveness
name: liveness-exec
spec:
containers:
- name: liveness
image: registry.k8s.io/busybox
args:
- /bin/sh
- -c
- touch /tmp/healthy; sleep 30; rm -f /tmp/healthy; sleep 600
livenessProbe:
exec:
command:
- cat
- /tmp/healthy
initialDelaySeconds: 5
periodSeconds: 5
apiVersion: v1
kind: Pod
metadata:
labels:
test: liveness
name: liveness-http
spec:
containers:
- name: liveness
image: registry.k8s.io/liveness
args:
- /server
livenessProbe:
httpGet:
path: /healthz
port: 8080
httpHeaders:
- name: Custom-Header
value: Awesome
initialDelaySeconds: 3
periodSeconds: 3
apiVersion: v1
kind: Pod
metadata:
name: goproxy
labels:
App: goproxy
spec:
containers:
- name: goproxy
image: registry.k8s.io/goproxy:0.1
ports:
- containerPort: 8080
readinessProbe:
tcpSocket:
port: 8080
initialDelaySeconds: 5
periodSeconds: 10
livenessProbe:
tcpSocket:
port: 8080
initialDelaySeconds: 15
periodSeconds: 20
apiVersion: v1
kind: Pod
metadata:
name: etcd-with-grpc
spec:
containers:
- name: etcd
image: registry.k8s.io/etcd:3.5.1-0
command: [ "/usr/local/bin/etcd", "--data-dir", "/var/lib/etcd", "--listen-client-urls", "http://0.0.0.0:2379", "--advertise-client-urls", "http://127.0.0.1:2379", "--log-level", "debug"]
ports:
- containerPort: 2379
livenessProbe:
grpc:
port: 2379
initialDelaySeconds: 10
更多关于健康检查配置的说明可以参考kubernetes官方文档:
https://kubernetes.io/docs/tasks/configure-pod-container/configure-liveness-readiness-startup-probes/。