From 3828e28788cd898a5eff8d85f8fd2711264873ab Mon Sep 17 00:00:00 2001 From: Claude-51124 Date: Thu, 16 Oct 2025 14:04:59 +0900 Subject: [PATCH] =?UTF-8?q?troubleshooting:=20=EC=98=A8=ED=86=A8=EB=A1=9C?= =?UTF-8?q?=EC=A7=80=20=EA=B8=B0=EB=B0=98=20=ED=95=B4=EA=B2=B0=20=EB=B0=A9?= =?UTF-8?q?=ED=96=A5=20=EC=B6=94=EA=B0=80?= MIME-Version: 1.0 Content-Type: text/plain; charset=UTF-8 Content-Transfer-Encoding: 8bit - 현재 방식 한계: 임베딩(유사도 한계) + LLM(학습 불가) - 온톨로지 원칙: 개념 계층, 관계 표현, 추론 가능 - 구현 전 준비: 핵심 개념 정의, competency questions, 재사용 조사 - 참고 문서: plans/251016, core_design/225 🤖 Generated with [Claude Code](https://claude.com/claude-code) Co-Authored-By: Claude --- ...aude_coldmail_filter_tokenization_issue.md | 21 +++++++++++++++++++ 1 file changed, 21 insertions(+) diff --git a/troubleshooting/251014_claude_coldmail_filter_tokenization_issue.md b/troubleshooting/251014_claude_coldmail_filter_tokenization_issue.md index c74a8f3..958501a 100644 --- a/troubleshooting/251014_claude_coldmail_filter_tokenization_issue.md +++ b/troubleshooting/251014_claude_coldmail_filter_tokenization_issue.md @@ -251,3 +251,24 @@ coldmail: 0.2817, normal: 0.3435 (역전) **영향**: - 실제 IR 제안 누락으로 비즈니스 기회 손실 가능 - 하이브리드 필터의 Stage 1 임계값 조정 필요성 확인 + +--- + +## 근본 해결 방향: 온톨로지 기반 접근 + +### 현재 방식의 한계 +- **임베딩**: 벡터 유사도만으로 "투자검토요청 + 회사소개서" 의미 관계 이해 불가 +- **LLM**: 학습 불가능, 비용 과다, 일관성 부족 + +### 온톨로지 기본 원칙 +1. **개념 계층**: coldmail > {IR자료, 피칭덱, 사업계획서} 명시적 정의 +2. **관계 표현**: "제목 CONTAINS 투자 AND 첨부 HAS PDF → IR자료" 규칙화 +3. **추론 가능**: reasoner가 규칙 기반으로 자동 분류 + 설명 생성 + +### 구현 전 준비 +- [ ] 핵심 개념 10개 정의 (coldmail, IR, 피칭, 발신자, 회사, ...) +- [ ] Competency questions (예: "파인티처 메일은 coldmail인가?") +- [ ] 기존 온톨로지 재사용 조사 (schema.org) + +**상세 계획**: plans/251016_ontology_coldmail_implementation.md +**설계 원칙**: 200_core_design/225_온톨로지_기반_지식_표현.md