DOCS/journey/scenarios/260304_아침브리핑_지연_먹통_복구_사용자시나리오.md

2.9 KiB

아침 브리핑 지연/먹통 복구 시나리오

상태: 부분 (현재 문제/기준선 측정 완료, 구조 개선 미적용)
작성일: 2026-03-04
대상 서비스: rb8001, robeing-monitor


1) 목적

  • 사용자가 실제로 겪은 "아침 업무 시간 응답 지연/먹통" 경험을 기준으로, 복구 후 어떤 체감 변화가 있어야 하는지 명확히 정의한다.
  • 기술 구현 설명이 아니라, 사용자 기준의 실패 장면과 개선 장면을 고정한다.

2) 실제 실패 장면 (현재)

장면

  • 시간: 평일 오전 9시~10시 (브리핑/일정/메일 처리 집중 시간)
  • 사용자 행동: "오늘 메일 우선순위 알려줘", "일정 등록해줘"를 연속 요청
  • 체감 문제:
    • 응답이 늦어짐(기다림 증가)
    • 재시도 필요(같은 질문 반복 입력)
    • 최악의 경우 서비스가 멈춰 업무 흐름이 끊김

현재 관측값(사실)

항목 현재 관측값 비고
/api/message 단건 응답 약 2.24초 2026-03-04 실측 1회
피크 구간 응답 3초 제한 타임아웃(HTTP:000) TOTAL:3.000558 기록
장애 당시 서버 체감 GUI 멈춤/재시작 루프 관측 51124 장애 상황

3) 개선 후 장면 (사용자 기준)

장면

  • 동일 시간대(오전 9시~10시), 동일 사용자 요청(브리핑/메일/일정)에서
  • 사용자는 질문 1회 입력 후 응답을 받고 바로 다음 행동(회신/일정 등록)을 시작한다.

기대되는 체감 변화

  • "기다림 때문에 다시 입력"이 줄어든다.
  • "지금 당장 할 1건" 응답을 끊김 없이 받는다.
  • 브리핑 시간 안(9~10시)에 메일/일정 처리를 끝낼 수 있다.

4) 개선 검증 시나리오

검증 대상 요청

  1. "오늘 메일 중 지금 답장할 1건만 말해줘"
  2. "내일 9시 일정 등록해줘"
  3. "오늘 브리핑 핵심 3줄만"

검증 방법

  • 같은 사용자로 9~10시 구간 연속 호출
  • 사용자 관점 체크:
    • 1회 질문으로 응답 받았는지
    • 재시도 없이 다음 행동으로 넘어갔는지
    • 처리 중 멈춤/끊김이 없었는지

목표 수치(개선 목표)

항목 목표
/api/message P50 1.0초 이하
/api/message P95 2.0초 이하
3초 초과 비율 1% 미만
컨테이너 재시작 0회

5) 완료 판정

  • 사용자 기준:
    • 오전 9~10시 연속 요청에서 "재질문/재시도 없이" 업무 진행 가능
  • 운영 기준:
    • 3초 타임아웃 재발 없음
    • 재시작 루프 없음
    • 헬스체크/로그 기준 정상 상태 유지

6) 연결 문서