# 온톨로지 기반 Coldmail 필터 및 기억 시스템 구현 계획 **날짜**: 2025-10-16 **작성자**: Claude **관련 문서**: 200_core_design/225_온톨로지_기반_지식_표현.md --- ## 목표 파인티처 메일 누락 같은 임베딩 한계(75% 정확도)를 온톨로지 추론으로 해결하고, 기억-감정-윤리 삼각형을 온톨로지로 구조화하여 로빙의 존재성 강화. --- ## Phase 1: Coldmail 온톨로지 파일럿 (2주) ### 개념 계층 구축 **파일**: rb8001/app/ontology/coldmail_schema.owl ``` 메일 └── 외부메일 └── 제안메일 └── coldmail (투자제안) ├── IR자료 ├── 피칭덱 └── 사업계획서 ``` ### 관계 정의 - `발신자 -속한다→ 회사` - `회사 -투자단계→ {시드, 시리즈A, ...}` - `메일 -포함한다→ 첨부파일` ### 추론 규칙 (10개) **파일**: rb8001/app/services/coldmail_ontology_reasoner.py 1. IF 제목 CONTAINS "투자" AND 첨부 HAS PDF THEN IR자료 2. IF 발신자 NOT IN known_contacts THEN 신규접촉 3. ... (8개 추가) ### 검증 - 파인티처 메일: coldmail 확률 0.9+ (현재 0.28) - 기존 17건 재테스트: 정확도 90%+ --- ## Phase 2: 기억 시스템 온톨로지 통합 (1개월) ### Neo4j 도입 **위치**: 51123 서버 (별도 컨테이너) **스키마**: ``` (사건)-[:발생시각]->(시간) (사건)-[:관련감정]->(감정) (사건)-[:참여자]->(사용자) (사건)-[:결과]->(결과) ``` ### ChromaDB 하이브리드 - 벡터 유사도: 빠른 1차 필터링 - Neo4j 추론: 의미적 연결 ("1년 전 비슷한 상황") ### API 설계 **rb8001/app/router/memory_ontology.py**: - POST /memory/event: 사건 저장 (자동 관계 추론) - GET /memory/recall: 쿼리 기반 회상 (벡터 + 그래프) --- ## Phase 3: 감정-윤리 온톨로지 규칙화 (1개월) ### 감정-우도 온톨로지 **파일**: rb8001/app/ontology/emotion_likelihood.owl ``` 불안 -조정→ 위험관련증거 (가중치 1.3) 흥분 -조정→ 긍정관련증거 (가중치 1.2) 슬픔 -조정→ 위로관련증거 (가중치 1.5) ``` ### 윤리 제약 온톨로지 **파일**: rb8001/app/ontology/ethics_constraints.owl ``` 정보수집 행동 -제약→ [개인정보보호, 투명성, 동의] 조언 행동 -제약→ [해악금지, 자율성존중] ``` ### 추론 엔진 통합 - HermiT/Pellet reasoner 도입 - 일관성 검사: 충돌 규칙 자동 탐지 - 설명 생성: "왜 이 행동을 선택했는가?" --- ## 기술 스택 | 구분 | 도구 | 용도 | |------|------|------| | 온톨로지 편집 | Protégé | OWL 스키마 설계 | | 그래프 DB | Neo4j | 사건-관계 저장 | | 추론 엔진 | HermiT | 일관성 검사 | | 벡터 DB | ChromaDB | 기존 유지 (하이브리드) | | 표준 | RDF/OWL | 온톨로지 표현 | --- ## 마일스톤 | 날짜 | 단계 | 목표 | |------|------|------| | Week 1-2 | Phase 1 | Coldmail 정확도 90%+ | | Week 3-6 | Phase 2 | 기억 회상 의미적 연결 | | Week 7-10 | Phase 3 | 감정-윤리 규칙 투명화 | --- ## 체크리스트 Phase 1: - [ ] Coldmail 온톨로지 스키마 설계 (Protégé) - [ ] 추론 규칙 10개 구현 (Python OWL API) - [ ] 파인티처 메일 재테스트 (0.9+) - [ ] Slack 피드백 → 관계 가중치 베이지안 업데이트 Phase 2: - [ ] Neo4j 컨테이너 배포 (51123 서버) - [ ] ChromaDB + Neo4j 하이브리드 쿼리 - [ ] "1년 전 비슷한 상황" 회상 테스트 Phase 3: - [ ] 감정-우도 온톨로지 7가지 감정 - [ ] 윤리 제약 온톨로지 사랑 기반 원칙 - [ ] HermiT 일관성 검사 자동화 --- ## 참고 - 설계 원칙: 200_core_design/225_온톨로지_기반_지식_표현.md - 문제 배경: troubleshooting/251014_claude_coldmail_filter_tokenization_issue.md - 온톨로지 연구: research/ontology/