diff --git a/troubleshooting/251014_claude_coldmail_filter_tokenization_issue.md b/troubleshooting/251014_claude_coldmail_filter_tokenization_issue.md index c74a8f3..958501a 100644 --- a/troubleshooting/251014_claude_coldmail_filter_tokenization_issue.md +++ b/troubleshooting/251014_claude_coldmail_filter_tokenization_issue.md @@ -251,3 +251,24 @@ coldmail: 0.2817, normal: 0.3435 (역전) **영향**: - 실제 IR 제안 누락으로 비즈니스 기회 손실 가능 - 하이브리드 필터의 Stage 1 임계값 조정 필요성 확인 + +--- + +## 근본 해결 방향: 온톨로지 기반 접근 + +### 현재 방식의 한계 +- **임베딩**: 벡터 유사도만으로 "투자검토요청 + 회사소개서" 의미 관계 이해 불가 +- **LLM**: 학습 불가능, 비용 과다, 일관성 부족 + +### 온톨로지 기본 원칙 +1. **개념 계층**: coldmail > {IR자료, 피칭덱, 사업계획서} 명시적 정의 +2. **관계 표현**: "제목 CONTAINS 투자 AND 첨부 HAS PDF → IR자료" 규칙화 +3. **추론 가능**: reasoner가 규칙 기반으로 자동 분류 + 설명 생성 + +### 구현 전 준비 +- [ ] 핵심 개념 10개 정의 (coldmail, IR, 피칭, 발신자, 회사, ...) +- [ ] Competency questions (예: "파인티처 메일은 coldmail인가?") +- [ ] 기존 온톨로지 재사용 조사 (schema.org) + +**상세 계획**: plans/251016_ontology_coldmail_implementation.md +**설계 원칙**: 200_core_design/225_온톨로지_기반_지식_표현.md