docs: 파일 내용으로 인한 의도 오분류 문제 추가

- 파일 업로드시 이메일 서비스 오류 문제 기록
- 원인 분석 및 해결 시도 내역 추가
- 구조적 문제와 근본 해결 방안 제시
This commit is contained in:
happybell80 2025-09-17 01:58:41 +09:00
parent b686f412aa
commit c444485896
2 changed files with 41 additions and 0 deletions

View File

@ -81,3 +81,32 @@ response_text = response_text.replace("**", "*") # Slack 포맷 변환
- IntentAnalyzer(LLM) + DecisionEngine(정규식) 병행으로 정확도 향상
- 제로샷 의도 분류 구현 (임베딩 기반, /DOCS/ideas/250819 참조)
- router.py 559줄 → 200줄 리팩토링 (비즈니스 로직 분리)
## 추가 문제 (2025-09-17)
### 파일 내용으로 인한 의도 오분류
- **증상**: 파일만 업로드시 "이메일 서비스 연결 실패"
- **원인 분석**:
1. slack_handler.py가 파일 내용을 text에 추가 (236행)
2. router.py의 이메일 키워드 체크가 파일 내용 검사
3. DecisionEngine이 파일 내용의 "이메일" 단어 감지
4. EMAIL_SEND로 분류 → skill-email 호출 → 422 에러
### 해결 시도
1. **router.py 이메일 체크 제거**
- 143-158행 주석 처리
- 파일 내용 오인식 문제로 임시 비활성화
2. **DecisionEngine 파일 감지 개선** (부분 해결)
- `"[파일:" in message` 체크 추가
- 하지만 패턴 매칭이 여전히 파일 내용 검사
### 구조적 문제
- **의도 분석 시점**: 파일 내용이 message에 포함된 후 분석
- **패턴 매칭 범위**: 전체 메시지(파일 내용 포함) 검사
- **우선순위 충돌**: 파일 감지 vs 키워드 패턴 매칭
### 근본 해결 필요
- 파일 컨텍스트와 사용자 메시지 분리
- 의도 분석 시 원본 메시지만 사용
- 파일 있을 때 DOCUMENT_ANALYSIS 강제

View File

@ -155,6 +155,18 @@ brain_service/llm_service (파일 처리 없이 텍스트만 처리)
- 파일 다운로드 및 처리 성공
- 로빙이 파일 내용 읽고 정확히 답변
### 파일 의도 분석 오류 (2025-09-17 01:42)
- **증상**: 파일 업로드시 "이메일 서비스 연결 실패" 오류
- **원인**:
- router.py의 이메일 키워드 체크가 파일 내용까지 검사
- DecisionEngine이 파일 내용의 "이메일" 단어로 EMAIL_SEND 분류
- skill-email 서비스 호출 → 422 Unprocessable Entity
- **해결 시도**:
- router.py의 이메일 키워드 체크 제거
- DecisionEngine에 파일 감지 로직 추가 ("[파일:" in message)
- DOCUMENT_ANALYSIS 우선순위 상향
- **남은 문제**: 패턴 매칭이 파일 내용까지 검사하는 구조적 문제
### ChromaDB 검색 구조 (API 통신)
- **현재 구조**: