文章

Prometheus Operator 设计思路

设计 #

这篇文章介绍了 Prometheus Operator 的几种自定义资源 (CRD):

  • Prometheus
  • Alertmanager
  • ThanosRuler
  • ServiceMonitor
  • PodMonitor
  • Probe
  • PrometheusRule
  • AlertmanagerConfig

Prometheus #

它定义了在 Kubernetes 集群中安装 Prometheus 的方式. 它提供了一些配置项, 比如副本数、持久卷还有接收告警的 Alertmanagers.

...

使用 velero 备份 kubernetes 指引

要求 #

  • kubernetes 版本 1.7+,velero 的每个主版本对 kuberetes 的版本要求不同,详情请参考官方文档说明。 官方文档通道
  • velero 所在服务器有 kubectl 命令, 且能连上集群

我们先从最简单的体验开始

1. 安装 velero 客户端 #

下载二进制安装包, 点击 latest release, 下载 velero-v1.7.0-linux-amd64.tag.gz (以 release 页面为准), 解压

...

Index

Kubernetes相关日志方案 #

目前的方案 #

目前的方案简单概括来说是: fluentd(daemonset)+es+kibana. 使用fluentd在集群每个节点运行一个fluentd实例采集日志通过调用k8s接口为每个日志添加kubernetes和container相关的标签, 然后直接发送到es存储.

痛点 #

  • es集群的维护成本较高, 比如索引的管理和优化, 集群规模的维护等. 需要技术和经验的加持, 故障处理效率不高.
  • es日志需要多副本, 并对整个文档进行索引, 占用资源较多.
  • fluentd直接推送到es, 中间少了流量缓冲.(fluentd自带缓冲区,该问题可有所缓解).
  • fluentd配置复杂

下面的方案会针对当前的方案提出, 分析与当前方案的优劣比较:

...