docs: update pronoun resolution document with implementation completion

- Add implementation completion section with code changes
- Document pronoun resolution before intent classification
- Document latest conversation priority logic
- Document entity extraction pattern expansion
- Add commit hash and deployment status
- Fixes '엠에스 바이오 인터케어' → '이 기업 검색해줘' resolution issue
This commit is contained in:
Claude-51124 2025-11-18 21:29:31 +09:00
parent 30479e01d3
commit 30109b64a6

View File

@ -40,11 +40,13 @@
- 환경변수: `PRONOUN_THOMPSON_GATE=false` (기본 비활성) - 환경변수: `PRONOUN_THOMPSON_GATE=false` (기본 비활성)
- 로깅: `Selected pronoun resolution source: ...` 추가 - 로깅: `Selected pronoun resolution source: ...` 추가
4) **향후 개선 필요 (2025-11-18 추가)** 4) **대명사 해소 플로우 개선 (2025-11-18 구현 완료)**
- `web_search_workflow.py:107-126`: 최신 대화(인덱스 0)의 엔티티를 최우선 선택, 스코어는 동점 시에만 사용 - `router.py:179-195`: 대명사 포함 시 의도 분류 전에 대명사 해소 먼저 수행, 해소된 메시지로 의도 분류
- `web_search_workflow.py:63-65`: 엔티티 추출 패턴 확장 (접미사 없이도 기업명 인식) - `web_search_workflow.py:60-149`: 최신 대화(인덱스 0)의 엔티티를 최우선 선택, 시간 우선순위를 스코어보다 우선시
- `router.py:216`: 대명사 포함 시 의도 분류 전에 대명사 해소 먼저 수행 - `web_search_workflow.py:69-70`: 엔티티 추출 패턴 확장 (접미사 없이도 기업명 인식, 한글 3글자 이상 또는 영문 대문자 시작)
- `web_search_workflow.py:129-133`: LangGraph 경로에서도 LLM 기반 대명사 해소 적용 또는 CoT 활용 - `message_router.py:118-126`: 최신 대화 우선 정렬 로직 적용
- 커밋: `cc7a162` (2025-11-18)
- 배포: Gitea Actions 자동 배포 완료, rb8001 컨테이너 정상 동작 확인
5) 부수 수정 5) 부수 수정
- `pipelines/langgraph_document.py`: `import os` 누락 보완 - `pipelines/langgraph_document.py`: `import os` 누락 보완
@ -55,7 +57,7 @@
- 실제 시나리오: - 실제 시나리오:
1) "솔트룩스 검색해줘." 1) "솔트룩스 검색해줘."
2) "이 기업 대표이사 검색해줘." → `Selected pronoun resolution source: llm` 또는 `heur-direct(솔트룩스)` 로 안정 치환 2) "이 기업 대표이사 검색해줘." → `Selected pronoun resolution source: llm` 또는 `heur-direct(솔트룩스)` 로 안정 치환
3) **추가 검증 필요**: "엠에스 바이오 인터케어 관련 검" → "이 기업 검색해줘" → "엠에스 바이오 인터케어" 정확히 해소 3) **검증 완료 (2025-11-18)**: "엠에스 바이오 인터케어 관련 검" → "이 기업 검색해줘" → 최신 대화 우선 로직으로 "엠에스 바이오 인터케어" 정확히 해소 (확장 패턴 적용)
## 교훈 ## 교훈
- 의도 패턴은 "핵심 키워드 단독" 케이스를 반드시 포함할 것(대표/대표이사/CEO 등). - 의도 패턴은 "핵심 키워드 단독" 케이스를 반드시 포함할 것(대표/대표이사/CEO 등).