DOCS/journey/plans/260303_23테스트보조_24프로덕션_운영전환_계획.md
2026-03-03 23:48:46 +09:00

1.8 KiB

260303 23(테스트+보조) / 24(프로덕션) 운영 전환 계획

목표

  • 서버 역할을 명시적으로 고정한다: 23=테스트+보조(보험), 24=프로덕션(핵심 서비스).
  • 로컬 성공과 운영 성공의 간극을 줄이기 위해 배포·검증·복구 절차를 서버 역할에 맞게 재정의한다.

서버 역할 정의

  1. 24 서버 (프로덕션)
  • 사용자 트래픽의 기본 처리 서버
  • 핵심 API/서비스의 기준 배포 대상
  • SLO/알람 기준의 단일 기준 서버
  1. 23 서버 (테스트+보조)
  • 스테이징/사전검증 트래픽 처리
  • 게이트웨이·프록시·운영 보조 기능 담당
  • 24 장애 시 임시 우회(보험) 수용

운영 원칙

  1. 배포 순서: 23 검증 -> 24 반영
  2. 프로덕션 판정 기준은 24에서만 확정
  3. 신규 API는 경로 + HTTP 메서드를 23 게이트웨이에서 먼저 검증 후 24에 승격
  4. 장애 대응 문서는 "23 임시수용 -> 24 복구 -> 23 정상복귀" 순서로 고정

실행 계획

  1. 문서/설정 정합화
  • AGENTS/아키텍처/전달사항 문서에서 23/24 역할 문구 통일
  1. 배포 게이트 고정
  • 체크리스트: 헬스체크, 주요 API, 인증, 프록시 경로, 메서드 허용
  • 실패 시 24 반영 금지
  1. 장애/복구 런북 고정
  • 24 장애 시 23 임시 라우팅 절차
  • 24 복구 후 원복 검증 절차

검증 기준

  1. 평시
  • 23: 테스트 체크리스트 100% 통과
  • 24: 프로덕션 헬스체크/핵심 API 정상
  1. 장애 시뮬레이션
  • 24 중단 가정에서 23 임시수용 절차 1회 이상 재현
  • 24 복구 후 원복까지 완료

완료 조건

  • 관련 문서에 23/24 역할 정의가 동일하게 반영됨
  • 배포 시 23 선검증 절차가 실제 운영 체크리스트로 사용됨
  • 장애/복구 시나리오 1회 리허설 기록이 남아 있음