docs: add real-world morning briefing outage scenario and scenario writing rules

This commit is contained in:
happybell80 2026-03-04 22:51:30 +09:00
parent 558d1873b8
commit 15211f0331
3 changed files with 75 additions and 0 deletions

View File

@ -106,6 +106,10 @@
- 문서 상단에 `상태: 완료 / 부분 / 미구현`을 명시 - 문서 상단에 `상태: 완료 / 부분 / 미구현`을 명시
- 구현 완료 시 대응되는 troubleshooting·plans 링크를 함께 표기 - 구현 완료 시 대응되는 troubleshooting·plans 링크를 함께 표기
- UX 흐름만 기록하고 내부 구현 세부 설명은 링크로 참조 - UX 흐름만 기록하고 내부 구현 세부 설명은 링크로 참조
- 사용자/운영자 행동 기준으로 작성 (`누가`, `언제`, `무엇을 하려다`, `어디서 막히는지`)
- 기술 용어보다 체감 결과를 우선 기록 (`기다림`, `재시도`, `업무 지연`, `실행 실패`)
- 수치는 `현재 관측값``개선 목표`를 분리해 표기하고, 달성 전에는 목표를 결과처럼 쓰지 않음
- 한 시나리오는 반드시 `실패 장면 1개``개선 후 장면 1개`를 같은 맥락으로 짝지어 기록
--- ---

View File

@ -0,0 +1,70 @@
# 아침 브리핑 지연/먹통 복구 시나리오
**상태**: 부분 (현재 문제/기준선 측정 완료, 구조 개선 미적용)
**작성일**: 2026-03-04
**대상 서비스**: `rb8001`, `robeing-monitor`
---
## 1) 목적
- 사용자가 실제로 겪은 "아침 업무 시간 응답 지연/먹통" 경험을 기준으로, 복구 후 어떤 체감 변화가 있어야 하는지 명확히 정의한다.
- 기술 구현 설명이 아니라, 사용자 기준의 실패 장면과 개선 장면을 고정한다.
## 2) 실제 실패 장면 (현재)
### 장면
- 시간: 평일 오전 9시~10시 (브리핑/일정/메일 처리 집중 시간)
- 사용자 행동: "오늘 메일 우선순위 알려줘", "일정 등록해줘"를 연속 요청
- 체감 문제:
- 응답이 늦어짐(기다림 증가)
- 재시도 필요(같은 질문 반복 입력)
- 최악의 경우 서비스가 멈춰 업무 흐름이 끊김
### 현재 관측값(사실)
| 항목 | 현재 관측값 | 비고 |
|------|-------------|------|
| `/api/message` 단건 응답 | 약 2.24초 | 2026-03-04 실측 1회 |
| 피크 구간 응답 | 3초 제한 타임아웃(HTTP:000) | `TOTAL:3.000558` 기록 |
| 장애 당시 서버 체감 | GUI 멈춤/재시작 루프 관측 | 51124 장애 상황 |
## 3) 개선 후 장면 (사용자 기준)
### 장면
- 동일 시간대(오전 9시~10시), 동일 사용자 요청(브리핑/메일/일정)에서
- 사용자는 질문 1회 입력 후 응답을 받고 바로 다음 행동(회신/일정 등록)을 시작한다.
### 기대되는 체감 변화
- "기다림 때문에 다시 입력"이 줄어든다.
- "지금 당장 할 1건" 응답을 끊김 없이 받는다.
- 브리핑 시간 안(9~10시)에 메일/일정 처리를 끝낼 수 있다.
## 4) 개선 검증 시나리오
### 검증 대상 요청
1. "오늘 메일 중 지금 답장할 1건만 말해줘"
2. "내일 9시 일정 등록해줘"
3. "오늘 브리핑 핵심 3줄만"
### 검증 방법
- 같은 사용자로 9~10시 구간 연속 호출
- 사용자 관점 체크:
- 1회 질문으로 응답 받았는지
- 재시도 없이 다음 행동으로 넘어갔는지
- 처리 중 멈춤/끊김이 없었는지
### 목표 수치(개선 목표)
| 항목 | 목표 |
|------|------|
| `/api/message` P50 | 1.0초 이하 |
| `/api/message` P95 | 2.0초 이하 |
| 3초 초과 비율 | 1% 미만 |
| 컨테이너 재시작 | 0회 |
## 5) 완료 판정
- 사용자 기준:
- 오전 9~10시 연속 요청에서 "재질문/재시도 없이" 업무 진행 가능
- 운영 기준:
- 3초 타임아웃 재발 없음
- 재시작 루프 없음
- 헬스체크/로그 기준 정상 상태 유지
## 6) 연결 문서
- [자기개선 루프 DB/서비스 구현 실행계획](../plans/260303_자기개선루프_DB_구현_실행계획.md)
- [51123 임시복구 서비스 연속성 조치내역](../troubleshooting/260304_51123_임시복구_서비스연속성_조치내역.md)

View File

@ -60,6 +60,7 @@
- [IR Deck 평가 시나리오](./ir_deck_evaluation_scenario.md) - [IR Deck 평가 시나리오](./ir_deck_evaluation_scenario.md)
- [베이지안 세미나 발표 시나리오](./251223_bayesian_seminar_presentation_scenario.md) - [베이지안 세미나 발표 시나리오](./251223_bayesian_seminar_presentation_scenario.md)
- [자기개선 루프 미팅 요약 시나리오 (260303)](./260303_자기개선루프_미팅요약_피드백_시나리오.md) - [자기개선 루프 미팅 요약 시나리오 (260303)](./260303_자기개선루프_미팅요약_피드백_시나리오.md)
- [아침 브리핑 지연/먹통 복구 사용자 시나리오 (260304)](./260304_아침브리핑_지연_먹통_복구_사용자시나리오.md)
--- ---