Case Study 模板
这里给出 「Case Study:故障复盘」模板(参考飞书的模板)
# 1. 故障级别及责任人
故障级别分为:严重、警告、一般,具体不同项目以及影响范围定级略有不同,需要跟业务部门以及相关上级领导一起确认事故级别。
故障级别 | 主责任人 | 次责任人 |
---|---|---|
警告 | @张三 、@李四 | @王五 |
# 2. 详细描述(必填)
详细的 bug 描述,包括可以复现的环境准备(比如测试包、有问题的 commit、现场录屏/截图、coredump 文件、监控报表等等)
# 2.1 问题现场录屏/截图【必填】
# 2.2 问题发生概率【必填】
- 必现 - 描述必现路径/场景
- 概率复现 - 出现概率 + 描述偶现路径/场景
# 3. 发生过程
问题发生的时间线及行为
时间 | 行为 |
---|---|
2022/03/01 10:05 | 收到首例用户反馈 |
2022/03/01 10:06 | 值班研发开始调研,并同步相关成员 |
2022/03/01 10:07 | 问题初步定位 |
2022/03/01 10:09 | 问题修复 |
2022/03/01 10:10 | 上线 |
2022/03/01 10:11 | 故障解除 |
# 4. 原因分析(必填)
定位过程及问题原因
# 5. 解决方案
方案策略及代码修改截图/commit等 可根据具体问题包含:不同版本的修复策略,发版分支是什么处理方案,主干开发分支是什么方案;推荐分级处理,保障发版分支的修复影响最小化。
# 6. 影响范围(必填)
客户端问题:引入版本,影响版本,影响用户人数,受影响的场景,发现渠道等。 服务端问题:设计××接口/服务,影响××端××版本,影响用户人数XX人,受影响的功能,发现渠道等。
# 7. 关联需求
有关联需求的填写:需求名称或者附上需求链接; 无明确需求根据实际可不填写。
# 8. 反思总结(必填)
改进与 Todo,明确真正有借鉴意义、会落实的措施。
上次更新: 2023/01/31, 17:37:12