DOCS/journey/troubleshooting/251016_coldmail_duplicate_file_fix.md
Claude-51124 22557e7132 docs: 오래된 트러블슈팅 아카이브 및 구조 정리
- 7-8월 초기 구축 문서 12개를 _archive/troubleshooting/2025_07-08_initial_setup/로 이동
- book/300_architecture/390_human_in_the_loop_intent_learning.md를 journey/research/intent_classification/로 이동 (개발 여정 문서)
- 빈 폴더 제거 (journey/assets/*)
2025-11-17 14:06:05 +09:00

111 lines
2.9 KiB
Markdown

# Coldmail IR 분석 실패 해결 - 중복 파일 처리 개선
**날짜**: 2025-10-16
**작성자**: Claude (51124 서버 전담)
**커밋**: skill-rag-file cea055c
**관련 파일**: skill-rag-file/app/api/upload.py:60-79
---
## 문제 상황
Coldmail 브리핑 워크플로우에서 동일 PDF 재업로드 시 `400 - File already exists` 에러로 전체 IR 분석 실패.
**연쇄 효과**: PDF 업로드 실패 → document_id = None → RAG 검색 0건 → IR 분석 "N/A" → Slack Lists API 에러
---
## 원인 분석
**위치**: skill-rag-file/app/api/upload.py:67-71
**기존 동작**:
- 중복 파일 발견 시 HTTPException 발생
- document_id 반환 없음
- 멱등성 미보장: 동일 요청 재실행 시 결과 달라짐
---
## 해결 방안
**위치**: skill-rag-file/app/api/upload.py:60-79
**변경 내용**:
1. select(TeamDocument.id) → select(TeamDocument): 전체 레코드 조회
2. HTTPException 제거 → 기존 document_id 반환
3. FileUploadResponse 반환: 기존 document와 동일 응답
4. INFO 로그 추가: 중복 감지 기록
**핵심 로직**:
- existing_doc = result.scalar_one_or_none()
- if existing_doc: return FileUploadResponse(document_id=existing_doc.id, ...)
---
## 구현 완료
**배포**: 2025-10-16
- 커밋 해시: cea055c
- 상태: skill-rag-file 컨테이너 재시작 완료 (healthy)
---
## 효과
### 멱등성 보장
**Before**: 1차 성공, 2차 400 에러
**After**: 1차/2차/3차 모두 동일 document_id 반환
### Coldmail 워크플로우 안정성
PDF 업로드 → document_id 항상 획득 → RAG 검색 정상 → IR 분석 정확 → Slack 전송 성공
### 재시도 안전성
- 1차 시도: 파일 저장 + 벡터 생성 (느림)
- 2차 시도: 기존 document_id 즉시 반환 (빠름)
---
## 검증 계획
### 내일 실전 검증 (2025-10-17 09:05)
**Coldmail 브리핑 실행 시 확인**:
1. PDF 업로드 성공 여부
2. IR 분석 실제 데이터 반환 확인
3. Slack Lists 전송 성공 확인
**로그 체크**:
- rb8001: docker logs rb8001 --since "2025-10-17T09:00:00" | grep -iE "upload|document_id"
- skill-rag-file: docker logs skill-rag-file --since "2025-10-17T09:00:00" | grep "File already exists"
---
## 교훈
### 멱등성은 필수
**원칙**: 동일 요청을 여러 번 실행해도 결과가 같아야 함
**적용**:
- POST 요청이라도 리소스 생성/조회에는 멱등성 필요
- 중복 체크 시 에러가 아닌 기존 리소스 반환
- 네트워크 불안정, 재시도 상황에서 안전성 보장
### Cascading Failure 방지
**원인**: 한 단계 실패가 전체 워크플로우 실패로 연쇄
**해결**:
- 각 단계의 실패 격리
- 재시도 가능한 설계
- Graceful degradation (부분 성공 허용)
### 에러 메시지의 의미
"File already exists"는 에러가 아니라 상태 확인 메시지:
- 이미 존재하는 리소스 정보 반환
- 클라이언트는 정상 처리 가능