From 325fe3da61d9b696e41a2ed7d443b1cd2e8c46af Mon Sep 17 00:00:00 2001 From: Claude-51124 Date: Thu, 23 Oct 2025 00:12:30 +0900 Subject: [PATCH] =?UTF-8?q?docs(troubleshooting):=20web=5Fsearch=20?= =?UTF-8?q?=EB=8C=80=EB=AA=85=EC=82=AC(=EC=9D=B4/=EA=B7=B8/=EC=A0=80)=20?= =?UTF-8?q?=ED=95=B4=EC=86=8C=20=EB=B0=A9=EC=95=88=203=EA=B0=80=EC=A7=80?= =?UTF-8?q?=20=EB=B0=8F=20=EA=B6=8C=EC=9E=A5=20=EC=A0=81=EC=9A=A9=20?= =?UTF-8?q?=EC=88=9C=EC=84=9C=20=EC=B6=94=EA=B0=80?= MIME-Version: 1.0 Content-Type: text/plain; charset=UTF-8 Content-Transfer-Encoding: 8bit --- ...1022_claude_rb8001_web_search_미수행.md | 19 +++++++++++++++++++ 1 file changed, 19 insertions(+) diff --git a/troubleshooting/251022_claude_rb8001_web_search_미수행.md b/troubleshooting/251022_claude_rb8001_web_search_미수행.md index 0075c5c..78158a7 100644 --- a/troubleshooting/251022_claude_rb8001_web_search_미수행.md +++ b/troubleshooting/251022_claude_rb8001_web_search_미수행.md @@ -57,5 +57,24 @@ - 검색 의도는 안내문이 아니라 “결과+출처”가 핵심 가치. 외부 호출 실패 시에도 대안·재시도·보충질문이 필요. - 결과는 시간축과 출처를 반드시 포함해 재현 가능성을 높인다. +## 대명사(이/그/저 …) 처리 방안 + +1) 대화 맥락 기반 대명사 해소(Heuristic + NER) +- 최근 N턴(예: 5~10)에서 NER로 기업명 후보 추출 → “이/그/저 기업/회사” 출현 시 최신·salience 높은 엔티티로 치환(스레드/파일 메타 포함). +- 모호/다중 후보면 보충질문(버튼) 노출. +- 장점/비용/난이도: 빠름·저비용·낮은 난이도. 한국어 대명사 패턴에 강함. + +2) 질의 재작성(CQR: Conversational Query Rewriting) +- 직전 대화·스레드·첨부 요약을 입력으로 LLM에 “대명사를 구체 엔티티로 치환한 단일 검색 질의” 생성(예: “이 기업을 검색해줘” → “컴퍼니엑스 기업 정보 최신 뉴스/재무/프로필 검색”). +- 신뢰도 점수 낮으면 재질문으로 confirm. +- 장점/비용/난이도: 정확도 높음·중간 비용·중간 난이도(rb8001 내장 LLM로 구현 용이). + +3) 엔티티 캐시/지식그래프 연동(Neo4j + Thread cache) +- 스레드별 최근 언급 엔티티 스택과 Neo4j(Organization 노드) 매핑 유지 → “이/그/저” 등장 시 캐시→그래프 순으로 정규화 후 검색. +- 캐시 미스/복수 후보는 상위 2~3개 버튼으로 확인. +- 장점/비용/난이도: 일관성/재현성 우수·중간 비용·중간 난이도(rb8001 이미 Neo4j 연결). + +권장 적용 순서: Heuristic+NER → CQR 재작성 → Neo4j 캐시 통합. + --- 문서 규칙: `DOCS/300_architecture/312_문서_작성_원칙.md` 준수