DOCS/journey/plans/251016_ontology_coldmail_implementation.md

59 lines
2.4 KiB
Markdown

# 온톨로지 기반 Coldmail 필터 구현 계획
**날짜**: 2025-10-16
**목표**: 임베딩 한계(파인티처 메일 누락)를 온톨로지 추론으로 해결
**상태**: Phase 1-1.5 완료, Phase 2-3 미구현
**원칙 참조** (구현 전 필수 확인):
- `311_백엔드_구조_원칙.md`: 계층 분리, DB는 state 경유
- `312_문서_작성_원칙.md`: 핵심만 간결, 파일명:줄번호
- `315_테스트_원칙.md`: 테스트는 TDD로 진행 (Red → Green → Refactor)
---
## Phase 1: Coldmail 온톨로지 (✅ 완료)
→ 상세: `troubleshooting/251014_claude_coldmail_filter_tokenization_issue.md`
---
## Phase 1.5: 베이지안 학습 (✅ 완료)
→ 상세: `troubleshooting/260113_coldmail_ontology_phase1_5_implementation.md`
---
## 남은 작업
### Phase 2-3: Neo4j 기억 시스템 및 감정-기억-윤리 (TDD 진행)
- **참고**: `../ideas/251016_coldmail_ontology_phase2_3_neo4j_emotion.md`
- **필요 작업**: Neo4j 기억 시스템, 감정-기억-윤리 삼각형 구현
---
## 문제 상황 (구체 시나리오)
- 2025-10-14 09:05 Coldmail Daily Briefing에서 IR deck 메일이 Slack에 전송되지 않음
(올굿즈컴퍼니 IR deck 30.35%, 빅웨이브 IR 행사 7.65%, 투자제안서 검토 28.38% → threshold 미달)
- 원인: 정규식 토큰화 실패(“회사소개서”, “ir에” 등 교착어 처리 불가)로 DB 키워드 매칭 실패
→ 임베딩/온톨로지 기반 추론 필요성 대두
- 현재는 하이브리드(임베딩→LLM→Naive Bayes) + 온톨로지 규칙 + Slack 피드백 학습까지 적용
(Phase 1/1.5 완료, 남은 것은 Neo4j 기억 시스템 확장)
## 기대 효과 (UX 중심)
- **누락 감소**: 중요한 콜드메일이 브리핑에서 빠지지 않아 “믿고 보는 브리핑” 경험 제공
- **개인화 체감**: 맞음/틀림 피드백이 기억에 누적되어 사용자별 패턴 반영 정확도 향상
- **설명 가능성**: 규칙·관계·기억 기반 근거로 “왜 콜드메일인지” 설명 가능 → 신뢰도 상승
---
## 참고
- `book/300_architecture/311_백엔드_구조_원칙.md`
- `book/300_architecture/315_테스트_원칙.md`
- `troubleshooting/251014_claude_coldmail_filter_tokenization_issue.md`
- `troubleshooting/251016_ontology_filter_validation.md`
- `troubleshooting/260113_coldmail_ontology_phase1_5_implementation.md`
- `book/200_core_design/225_온톨로지_기반_지식_표현.md`