From 4e21de5dca86ba90a44af9ba4ccf97e89e04acf0 Mon Sep 17 00:00:00 2001 From: Claude-51124 Date: Thu, 16 Oct 2025 14:03:15 +0900 Subject: [PATCH] =?UTF-8?q?docs:=20=EC=98=A8=ED=86=A8=EB=A1=9C=EC=A7=80=20?= =?UTF-8?q?=EA=B5=AC=ED=98=84=20=EB=A1=9C=EB=93=9C=EB=A7=B5=20=EB=B6=84?= =?UTF-8?q?=EB=A6=AC=20(=EC=84=A4=EA=B3=84=20vs=20=EA=B3=84=ED=9A=8D)?= MIME-Version: 1.0 Content-Type: text/plain; charset=UTF-8 Content-Transfer-Encoding: 8bit - plans/251016_ontology_coldmail_implementation: 구현 계획 분리 - Phase 1-3 마일스톤, 기술 스택, 체크리스트 - 200_core_design/225: 구현 로드맵 제거, 설계 원칙으로 대체 - 작게 시작, 투명성, 개인화 원칙 추가 - 체크리스트 철학 정합성 중심으로 변경 🤖 Generated with [Claude Code](https://claude.com/claude-code) Co-Authored-By: Claude --- .../225_온톨로지_기반_지식_표현.md | 43 +++--- ...251016_ontology_coldmail_implementation.md | 144 ++++++++++++++++++ 2 files changed, 165 insertions(+), 22 deletions(-) create mode 100644 plans/251016_ontology_coldmail_implementation.md diff --git a/200_core_design/225_온톨로지_기반_지식_표현.md b/200_core_design/225_온톨로지_기반_지식_표현.md index b885dfa..cfe4d58 100644 --- a/200_core_design/225_온톨로지_기반_지식_표현.md +++ b/200_core_design/225_온톨로지_기반_지식_표현.md @@ -160,42 +160,41 @@ THEN 메일 is-a coldmail (확률 0.9) --- -## 5. 구현 로드맵 +## 5. 설계 원칙 -### Phase 1: Coldmail 온톨로지 파일럿 (2주) -- 개념 계층: coldmail > {IR, 피칭, 사업계획서} -- 관계: 발신자-회사-투자단계 -- 추론 규칙: 10개 핵심 패턴 -- 검증: 파인티처 같은 누락 케이스 0건 +### 작게 시작, 점진적 확장 +- 핵심 개념 10개 이하로 시작 (과모델링 방지) +- 검증된 도메인부터 확장 (coldmail → 기억 → 감정) +- 사용자 피드백 기반 진화 -### Phase 2: 기억 시스템 통합 (1개월) -- Neo4j 도입: 사건-의미-절차 기억 그래프 -- ChromaDB 연동: 벡터 유사도 + 온톨로지 추론 하이브리드 -- 쿼리: "1년 전 비슷한 상황" → 의미적 연결 회상 +### 투명성과 설명 가능성 +- 모든 추론 과정 추적 가능 +- "왜 이 메일이 coldmail인가?" 설명 생성 +- 규칙 충돌 시 우선순위 명시 -### Phase 3: 감정-윤리 규칙화 (1개월) -- 감정-우도 온톨로지: 7가지 기본 감정별 조정 규칙 -- 윤리 제약 온톨로지: 사랑 기반 원칙의 OWL 표현 -- 추론 엔진: HermiT/Pellet 일관성 검사 +### 개인화와 관계성 +- 사용자별 온톨로지 분기 +- "성공 = 팀성장" 같은 개인 정의 학습 +- 공동 의미 구축 과정 = 관계 형성 --- ## 6. 체크리스트 -구현 전: +설계 시: - [ ] 목표 competency questions 정의 (예: "파인티처 메일은 coldmail인가?") - [ ] 재사용 가능한 온톨로지 조사 (schema.org 확장) -- [ ] 핵심 개념 10개 이하로 시작 (과모델링 방지) +- [ ] 철학 문서와 정합성 확인 (베이즈, 존재형, 삼각형) -구현 중: +적용 시: - [ ] 사용자 피드백으로 관계 가중치 베이지안 업데이트 - [ ] 추론 결과 설명 가능 (어떤 규칙으로 판단했는지) -- [ ] 일관성 검사 (reasoner로 충돌 규칙 탐지) +- [ ] 개인화된 개념 정의 학습 (사용자별 "성공" 의미) -구현 후: -- [ ] 기존 벡터 검색 대비 정확도 10%+ 향상 -- [ ] "왜 이 메일이 coldmail인가?" 설명 가능 -- [ ] 사용자별 온톨로지 분기 (개인화) +검증 시: +- [ ] 기존 방식 대비 설명 가능성 향상 +- [ ] 사용자-로빙 공동 의미 구축 과정 추적 +- [ ] 일관성 검사 (충돌 규칙 없음) --- diff --git a/plans/251016_ontology_coldmail_implementation.md b/plans/251016_ontology_coldmail_implementation.md new file mode 100644 index 0000000..1a583bd --- /dev/null +++ b/plans/251016_ontology_coldmail_implementation.md @@ -0,0 +1,144 @@ +# 온톨로지 기반 Coldmail 필터 및 기억 시스템 구현 계획 + +**날짜**: 2025-10-16 +**작성자**: Claude +**관련 문서**: 200_core_design/225_온톨로지_기반_지식_표현.md + +--- + +## 목표 + +파인티처 메일 누락 같은 임베딩 한계(75% 정확도)를 온톨로지 추론으로 해결하고, 기억-감정-윤리 삼각형을 온톨로지로 구조화하여 로빙의 존재성 강화. + +--- + +## Phase 1: Coldmail 온톨로지 파일럿 (2주) + +### 개념 계층 구축 +**파일**: rb8001/app/ontology/coldmail_schema.owl + +``` +메일 +└── 외부메일 + └── 제안메일 + └── coldmail (투자제안) + ├── IR자료 + ├── 피칭덱 + └── 사업계획서 +``` + +### 관계 정의 +- `발신자 -속한다→ 회사` +- `회사 -투자단계→ {시드, 시리즈A, ...}` +- `메일 -포함한다→ 첨부파일` + +### 추론 규칙 (10개) +**파일**: rb8001/app/services/coldmail_ontology_reasoner.py + +1. IF 제목 CONTAINS "투자" AND 첨부 HAS PDF THEN IR자료 +2. IF 발신자 NOT IN known_contacts THEN 신규접촉 +3. ... (8개 추가) + +### 검증 +- 파인티처 메일: coldmail 확률 0.9+ (현재 0.28) +- 기존 17건 재테스트: 정확도 90%+ + +--- + +## Phase 2: 기억 시스템 온톨로지 통합 (1개월) + +### Neo4j 도입 +**위치**: 51123 서버 (별도 컨테이너) + +**스키마**: +``` +(사건)-[:발생시각]->(시간) +(사건)-[:관련감정]->(감정) +(사건)-[:참여자]->(사용자) +(사건)-[:결과]->(결과) +``` + +### ChromaDB 하이브리드 +- 벡터 유사도: 빠른 1차 필터링 +- Neo4j 추론: 의미적 연결 ("1년 전 비슷한 상황") + +### API 설계 +**rb8001/app/router/memory_ontology.py**: +- POST /memory/event: 사건 저장 (자동 관계 추론) +- GET /memory/recall: 쿼리 기반 회상 (벡터 + 그래프) + +--- + +## Phase 3: 감정-윤리 온톨로지 규칙화 (1개월) + +### 감정-우도 온톨로지 +**파일**: rb8001/app/ontology/emotion_likelihood.owl + +``` +불안 -조정→ 위험관련증거 (가중치 1.3) +흥분 -조정→ 긍정관련증거 (가중치 1.2) +슬픔 -조정→ 위로관련증거 (가중치 1.5) +``` + +### 윤리 제약 온톨로지 +**파일**: rb8001/app/ontology/ethics_constraints.owl + +``` +정보수집 행동 -제약→ [개인정보보호, 투명성, 동의] +조언 행동 -제약→ [해악금지, 자율성존중] +``` + +### 추론 엔진 통합 +- HermiT/Pellet reasoner 도입 +- 일관성 검사: 충돌 규칙 자동 탐지 +- 설명 생성: "왜 이 행동을 선택했는가?" + +--- + +## 기술 스택 + +| 구분 | 도구 | 용도 | +|------|------|------| +| 온톨로지 편집 | Protégé | OWL 스키마 설계 | +| 그래프 DB | Neo4j | 사건-관계 저장 | +| 추론 엔진 | HermiT | 일관성 검사 | +| 벡터 DB | ChromaDB | 기존 유지 (하이브리드) | +| 표준 | RDF/OWL | 온톨로지 표현 | + +--- + +## 마일스톤 + +| 날짜 | 단계 | 목표 | +|------|------|------| +| Week 1-2 | Phase 1 | Coldmail 정확도 90%+ | +| Week 3-6 | Phase 2 | 기억 회상 의미적 연결 | +| Week 7-10 | Phase 3 | 감정-윤리 규칙 투명화 | + +--- + +## 체크리스트 + +Phase 1: +- [ ] Coldmail 온톨로지 스키마 설계 (Protégé) +- [ ] 추론 규칙 10개 구현 (Python OWL API) +- [ ] 파인티처 메일 재테스트 (0.9+) +- [ ] Slack 피드백 → 관계 가중치 베이지안 업데이트 + +Phase 2: +- [ ] Neo4j 컨테이너 배포 (51123 서버) +- [ ] ChromaDB + Neo4j 하이브리드 쿼리 +- [ ] "1년 전 비슷한 상황" 회상 테스트 + +Phase 3: +- [ ] 감정-우도 온톨로지 7가지 감정 +- [ ] 윤리 제약 온톨로지 사랑 기반 원칙 +- [ ] HermiT 일관성 검사 자동화 + +--- + +## 참고 + +- 설계 원칙: 200_core_design/225_온톨로지_기반_지식_표현.md +- 문제 배경: troubleshooting/251014_claude_coldmail_filter_tokenization_issue.md +- 온톨로지 연구: research/ontology/