docs: 파일 내용으로 인한 의도 오분류 문제 추가
- 파일 업로드시 이메일 서비스 오류 문제 기록 - 원인 분석 및 해결 시도 내역 추가 - 구조적 문제와 근본 해결 방안 제시
This commit is contained in:
parent
b686f412aa
commit
c444485896
@ -81,3 +81,32 @@ response_text = response_text.replace("**", "*") # Slack 포맷 변환
|
||||
- IntentAnalyzer(LLM) + DecisionEngine(정규식) 병행으로 정확도 향상
|
||||
- 제로샷 의도 분류 구현 (임베딩 기반, /DOCS/ideas/250819 참조)
|
||||
- router.py 559줄 → 200줄 리팩토링 (비즈니스 로직 분리)
|
||||
|
||||
## 추가 문제 (2025-09-17)
|
||||
|
||||
### 파일 내용으로 인한 의도 오분류
|
||||
- **증상**: 파일만 업로드시 "이메일 서비스 연결 실패"
|
||||
- **원인 분석**:
|
||||
1. slack_handler.py가 파일 내용을 text에 추가 (236행)
|
||||
2. router.py의 이메일 키워드 체크가 파일 내용 검사
|
||||
3. DecisionEngine이 파일 내용의 "이메일" 단어 감지
|
||||
4. EMAIL_SEND로 분류 → skill-email 호출 → 422 에러
|
||||
|
||||
### 해결 시도
|
||||
1. **router.py 이메일 체크 제거** ✅
|
||||
- 143-158행 주석 처리
|
||||
- 파일 내용 오인식 문제로 임시 비활성화
|
||||
|
||||
2. **DecisionEngine 파일 감지 개선** (부분 해결)
|
||||
- `"[파일:" in message` 체크 추가
|
||||
- 하지만 패턴 매칭이 여전히 파일 내용 검사
|
||||
|
||||
### 구조적 문제
|
||||
- **의도 분석 시점**: 파일 내용이 message에 포함된 후 분석
|
||||
- **패턴 매칭 범위**: 전체 메시지(파일 내용 포함) 검사
|
||||
- **우선순위 충돌**: 파일 감지 vs 키워드 패턴 매칭
|
||||
|
||||
### 근본 해결 필요
|
||||
- 파일 컨텍스트와 사용자 메시지 분리
|
||||
- 의도 분석 시 원본 메시지만 사용
|
||||
- 파일 있을 때 DOCUMENT_ANALYSIS 강제
|
||||
|
||||
@ -155,6 +155,18 @@ brain_service/llm_service (파일 처리 없이 텍스트만 처리)
|
||||
- 파일 다운로드 및 처리 성공
|
||||
- 로빙이 파일 내용 읽고 정확히 답변
|
||||
|
||||
### 파일 의도 분석 오류 (2025-09-17 01:42)
|
||||
- **증상**: 파일 업로드시 "이메일 서비스 연결 실패" 오류
|
||||
- **원인**:
|
||||
- router.py의 이메일 키워드 체크가 파일 내용까지 검사
|
||||
- DecisionEngine이 파일 내용의 "이메일" 단어로 EMAIL_SEND 분류
|
||||
- skill-email 서비스 호출 → 422 Unprocessable Entity
|
||||
- **해결 시도**:
|
||||
- router.py의 이메일 키워드 체크 제거
|
||||
- DecisionEngine에 파일 감지 로직 추가 ("[파일:" in message)
|
||||
- DOCUMENT_ANALYSIS 우선순위 상향
|
||||
- **남은 문제**: 패턴 매칭이 파일 내용까지 검사하는 구조적 문제
|
||||
|
||||
|
||||
### ChromaDB 검색 구조 (API 통신)
|
||||
- **현재 구조**:
|
||||
|
||||
Loading…
x
Reference in New Issue
Block a user