diff --git a/journey/troubleshooting/251023_codex_pronoun_search_fix.md b/journey/troubleshooting/251023_codex_pronoun_search_fix.md index 3b1c43d..f813a99 100644 --- a/journey/troubleshooting/251023_codex_pronoun_search_fix.md +++ b/journey/troubleshooting/251023_codex_pronoun_search_fix.md @@ -40,11 +40,13 @@ - 환경변수: `PRONOUN_THOMPSON_GATE=false` (기본 비활성) - 로깅: `Selected pronoun resolution source: ...` 추가 -4) **향후 개선 필요 (2025-11-18 추가)** - - `web_search_workflow.py:107-126`: 최신 대화(인덱스 0)의 엔티티를 최우선 선택, 스코어는 동점 시에만 사용 - - `web_search_workflow.py:63-65`: 엔티티 추출 패턴 확장 (접미사 없이도 기업명 인식) - - `router.py:216`: 대명사 포함 시 의도 분류 전에 대명사 해소 먼저 수행 - - `web_search_workflow.py:129-133`: LangGraph 경로에서도 LLM 기반 대명사 해소 적용 또는 CoT 활용 +4) **대명사 해소 플로우 개선 (2025-11-18 구현 완료)** + - `router.py:179-195`: 대명사 포함 시 의도 분류 전에 대명사 해소 먼저 수행, 해소된 메시지로 의도 분류 + - `web_search_workflow.py:60-149`: 최신 대화(인덱스 0)의 엔티티를 최우선 선택, 시간 우선순위를 스코어보다 우선시 + - `web_search_workflow.py:69-70`: 엔티티 추출 패턴 확장 (접미사 없이도 기업명 인식, 한글 3글자 이상 또는 영문 대문자 시작) + - `message_router.py:118-126`: 최신 대화 우선 정렬 로직 적용 + - 커밋: `cc7a162` (2025-11-18) + - 배포: Gitea Actions 자동 배포 완료, rb8001 컨테이너 정상 동작 확인 5) 부수 수정 - `pipelines/langgraph_document.py`: `import os` 누락 보완 @@ -55,7 +57,7 @@ - 실제 시나리오: 1) "솔트룩스 검색해줘." 2) "이 기업 대표이사 검색해줘." → `Selected pronoun resolution source: llm` 또는 `heur-direct(솔트룩스)` 로 안정 치환 - 3) **추가 검증 필요**: "엠에스 바이오 인터케어 관련 검" → "이 기업 검색해줘" → "엠에스 바이오 인터케어"로 정확히 해소 + 3) **검증 완료 (2025-11-18)**: "엠에스 바이오 인터케어 관련 검" → "이 기업 검색해줘" → 최신 대화 우선 로직으로 "엠에스 바이오 인터케어" 정확히 해소 (확장 패턴 적용) ## 교훈 - 의도 패턴은 "핵심 키워드 단독" 케이스를 반드시 포함할 것(대표/대표이사/CEO 등).