Safe recovery

安全恢复

优先选择可重试操作。只有在状态说明需要人工处理时，才修改服务器、凭据、代理或域名配置。

安全恢复的目标是先保住可解释性：确认失败发生在哪一步、哪些资源已经改变、是否存在可回滚对象，然后再做下一次操作。

警告：不要在不知道当前状态的情况下同时重试、手动改服务器、改 DNS 和替换 secret。一次只处理一个变量，恢复路径才可验证。

临时网络、拉取和执行失败通常可以重试。输入、凭据、DNS 和证书材料问题需要先修复。

先打开资源状态、最近部署状态、事件时间线和健康摘要。记录最后一个失败阶段、错误代码、是否给出 retry 建议，以及访问地址是否已经切换。

临时网络、镜像拉取、命令超时、健康检查偶发失败通常可以重试。缺少 secret、无效域名、SSH 不可用、证书材料错误和输入配置错误通常需要先修复。

只修改和错误代码直接相关的输入，例如一个 secret、一条 DNS 记录、一把 SSH key 或一个构建目录。修复后保留原失败记录，方便比较下一次结果。

如果新部署已经影响访问地址或运行时状态，并且短时间内无法修复，优先回滚到最后一个已验证版本。回滚后继续保存失败部署的日志和诊断摘要。