以下冷门命令能实现某种具体的功能, 都是在实际工作中摸索总结的经验, 获取到相关的资源名称之后, 就可以配合常用的 kubectl 命令获取其他详细信息.
列出所有被 OOMKilled 过的 POD 列表
#
使用
jq (一个轻量级的灵活的命令行JSON解析器) 获取上一个状态
1
2
3
4
5
| kubectl get pods --all-namespaces -ojson | jq -c '.items[] | {
name: .metadata.name,
reasons: [{reason: .status.containerStatuses[]?.lastState.terminated.reason,
finishedAt: .status.containerStatuses[]?.lastState.terminated.finishedAt}]
}' | grep OOMKilled
|
信息以行为单位显示, 方便进行筛选:
1
2
3
| {"name":"nginx-699f949679-8kkth","reasons":[{"reason":"OOMKilled","fini
shedAt":"2021-09-08T01:34:05Z"}]}
...
|
列出含有 UID 的 POD 列表
#
kubelet 大量使用了 pod-uid 来为 pod 创建相关的资源, 获取 pod-uid 来辅助运维是很有必要的.
1
| kubectl get pods -A -o custom-columns=NAME:.metadata.name,UID:.metadata.uid
|
列出集群所有 ContainerID
#
集群中所有的 containerID,方便排查问题
1
2
3
4
5
| kubectl get pods --all-namespaces -ojson | jq -c '.items[] | {
name:.metadata.name,
c1: [.status.containerStatuses[]?.containerID],
c2: [.status.containerStatuses[]?.lastState.terminated.containerID]
}'
|
列出集群中所有镜像
#
有时候为了统计分析镜像,可能需要导出所有在用的镜像
1
2
| kubectl get pods --all-namespaces -ojson | jq -c '.items[] | {
name:.metadata.name,images: [{image: .spec.containers[]?.image}]}'
|
按行输出,部分结果如下:
1
2
| {"name":"fz-wms-fz-wms-78657df596-s9zbr","images":[{"image": "registry
.example.com/18678868396/wms:1.1.55"}]}
|
删除集群中所有被驱逐到Pods记录
#
1
| kubectl get pods --all-namespaces -owide | grep Evicted | awk '{print "kubectl -n "$1" delete pods "$2}' | xargs -I {} sh -c "{}"
|