大家好!我是gasbugs,正朝着“黄金Kubestronaut”这一宏伟目标一步步迈进。在通过CKS考试,达成“Kubestronaut”这一首个里程碑后不久,我立即挑战了第六道关卡——PCA (Prometheus Certified Associate)考试,并带来了令人兴奋的合格消息!🥳
既然已经掌握了如何安全地保护集群(CKS),我认为现在是时候拥有能够彻底审视和观察集群状态的“眼睛”了。而其核心,无疑就是Prometheus。但坦白说,这次挑战简直就是“鲁莽”本身。

🤯 “这要挂了……” 一日挑战,以及命运般的86分
实际上,我最近并没有直接处理过像Prometheus规则设置这样的实际工作。然而,凭借着“以前做过很多,应该没问题”这种模糊的自信,我在考试前一天只花了一天时间进行突击复习。结果,我以86分(及格线75分)的成绩勉强通过,这个分数更多是运气而非实力。考试全程我都觉得“啊,这下完了”,所以看到合格界面时,我有多么惊讶简直无法形容。
这次,我同样借助了我可靠的AI结对程序员Gemini的力量,快速回顾了概念。然而,PCA绝不是一个仅凭概念就能通过的考试。回想起来,我可能需要解决至少200-300道实战问题,并与PromQL融为一体,才能稳定通过。请大家尽量避免像我这样鲁莽的挑战!
(PromQL相关的问题大约占总共60道题中的20道左右。)
🎯 PCA究竟考了什么:印象深刻的“杀手级”考题
PCA考试执着地深入探究了考生对Prometheus哲学和核心功能的理解深度。我在考试中遇到的关键问题如下:
- PromQL,超越语法,理解“意图”:它不仅仅是询问简单的函数用法。
- 你是否准确知道何时以及为何使用
avg_over_time、sum_over_time等函数?——特别是像“在计算比率之前,必须先执行求和(sum)以防止统计错误”这样的问题,考察了对查询顺序导致结果意义差异的理解。对数据模型的深入理解是必不可少的。 - 告警规则(Alerting Rule),分析其“去向”:考试会给出复杂的
alerting_rules.yml文件,要求考生准确追踪特定告警(Alert)在何种条件下触发,并最终匹配到哪个接收器(Receiver)来发送通知的流程。必须彻底掌握Alertmanager的路由机制。
- 在自定义告警中包含“动态”信息:不仅仅是触发告警,考试还询问了在触发自定义规则时,是否知道如何在告警消息(Annotation)中动态获取并包含触发指标的标签变量。掌握
{{ $labels.instance }}等模板语法是基本要求。 - 指标与规则的关联性:除此之外,我还记得一些关于基本架构和操作能力的问题,例如在特定情况下能否准确计算收集到的指标类型数量,以及Prometheus服务器可以连接(评估)多少个告警规则等。
✨ 总结:理解可观测性核心的考试
PCA不仅仅是考察你是否了解Prometheus的功能。它是一场高密度的考试,评估你是否理解可观测性(Observability)系统的核心哲学并能将其应用于实践,例如“为什么要收集这些指标?”、“如何处理这些数据才能获得有意义的洞察?”以及“如何及时准确地发出告警?”
如果说CKS让我获得了保护集群的“盾牌”,那么PCA则让我获得了洞察集群的“眼睛”。现在,在迈向“黄金Kubestronaut”的15道关卡中,我已经通过了6道。虽然前路漫漫,但这种一步步成长,蜕变为云原生生态系统专家的过程,真的令人非常享受。
请大家多多期待并支持我的第七次旅程!祝愿大家继续愉快的云原生航行!🎉
标签: PCA, PrometheusCertifiedAssociate, Prometheus, PromQL, 监控, 认证考试心得, CNCF, 黄金Kubestronaut, Kubestronaut, 可观测性
发表回复