Phase 3: 감정-윤리 온톨로지 규칙화 완료 문서

- Phase 3 구현 완료 (troubleshooting/251016_phase3_emotion_ethics_ontology.md) - 감정-우도 온톨로지 (7가지 감정, 11개 규칙) - 윤리 제약 온톨로지 (6가지 제약, 우선순위 기반) - 추론 엔진 통합 (OntologyReasoner) - 투명한 설명 생성 (템플릿 기반) - 테스트 결과 100% 통과 - 감정-우도 조정: fear→위험 증거 30% 증가 - 윤리 제약: 6/6 케이스 정확 - 추론 추적: 정상 작동 - Phase 1-2-3 완전 통합 성공 - Phase 1: Coldmail 온톨로지 (100% 정확도) - Phase 2: ChromaDB + Neo4j 하이브리드 - Phase 3: 감정-윤리 온톨로지 (100% 테스트 통과) 로빙의 온톨로지 기반 지식 표현 시스템 완성
2025-10-16 15:16:51 +09:00 · 2025-10-16 15:16:51 +09:00 · 28cfdef16a
commit 28cfdef16a
parent f3a891a805
1 changed files with 392 additions and 0 deletions
--- a/troubleshooting/251016_phase3_emotion_ethics_ontology.md
+++ b/troubleshooting/251016_phase3_emotion_ethics_ontology.md
@ -0,0 +1,392 @@
+# Phase 3: 감정-윤리 온톨로지 규칙화 구현 완료
+
+**날짜**: 2025-10-16
+**작성자**: Claude (51124 서버 전담)
+**관련 파일**:
+- `rb8001/app/services/emotion_likelihood_ontology.py`
+- `rb8001/app/services/ethics_constraints_ontology.py`
+- `rb8001/app/services/ontology_explainer.py`
+- `rb8001/tests/test_phase3_ontology.py`
+
+---
+
+## 목표
+
+Phase 1 (Coldmail 온톨로지), Phase 2 (ChromaDB + Neo4j 하이브리드)에 이어, 로빙의 **감정-기억-윤리 삼각형**을 완성하여 투명하고 설명 가능한 AI 의사결정 구현.
+
+---
+
+## 구현 내용
+
+### 1. 감정-우도 온톨로지 (Emotion-Likelihood Ontology)
+
+**파일**: `app/services/emotion_likelihood_ontology.py` (200줄)
+
+**핵심 개념**: 사용자의 감정에 따라 증거의 우도(likelihood)를 베이지안 방식으로 조정
+
+**7가지 기본 감정별 규칙** (총 11개):
+
+| 감정 | 증거 유형 | 우도 배율 | 설명 |
+|------|-----------|-----------|------|
+| fear (불안) | 위험 | 1.3배 | 불안할 때 위험 관련 증거의 중요도 증가 |
+| fear (불안) | 경고 | 1.4배 | 불안할 때 경고 관련 증거의 중요도 증가 |
+| joy (기쁨) | 긍정 | 1.2배 | 기쁠 때 긍정 관련 증거의 중요도 증가 |
+| joy (기쁨) | 기회 | 1.3배 | 기쁠 때 기회 관련 증거의 중요도 증가 |
+| sadness (슬픔) | 위로 | 1.5배 | 슬플 때 위로 관련 증거의 중요도 증가 |
+| sadness (슬픔) | 지원 | 1.4배 | 슬플 때 지원 관련 증거의 중요도 증가 |
+| anger (분노) | 해결책 | 1.3배 | 분노할 때 해결책 관련 증거의 중요도 증가 |
+| anger (분노) | 행동 | 1.2배 | 분노할 때 행동 관련 증거의 중요도 증가 |
+| surprise (놀람) | 정보 | 1.3배 | 놀랐을 때 정보 관련 증거의 중요도 증가 |
+| disgust (혐오) | 회피 | 1.4배 | 혐오할 때 회피 관련 증거의 중요도 증가 |
+| trust (신뢰) | 협력 | 1.3배 | 신뢰할 때 협력 관련 증거의 중요도 증가 |
+
+**베이지안 조정 공식**:
+```python
+adjusted_likelihood = prior_likelihood * emotion_multiplier
+# 예: 불안 + 위험증거 = 0.60 * 1.3 = 0.78 (30% 증가)
+```
+
+**API**:
+```python
+from app.services.emotion_likelihood_ontology import adjust_likelihood_by_emotion
+
+evidences = [
+    {"id": "E1", "type": "위험", "content": "...", "prior_likelihood": 0.6},
+    {"id": "E2", "type": "긍정", "content": "...", "prior_likelihood": 0.5},
+]
+
+adjusted_evidences, matched_rules = adjust_likelihood_by_emotion(
+    user_emotion="fear",
+    evidences=evidences,
+    trace=[]  # 추론 과정 추적
+)
+
+# 결과: E1 위험 → 0.78 (30% 증가), E2 긍정 → 0.50 (변화 없음)
+```
+
+### 2. 윤리 제약 온톨로지 (Ethics Constraints Ontology)
+
+**파일**: `app/services/ethics_constraints_ontology.py` (300줄)
+
+**핵심 개념**: 로빙의 사랑 기반 윤리 원칙을 코드로 구현하여 AI 행동 제약
+
+**6가지 윤리 제약** (우선순위 기반):
+
+| 우선순위 | 원칙 | 행동 유형 | 제약 내용 |
+|----------|------|-----------|-----------|
+| CRITICAL (1) | 해악금지 | 조언 | 자해, 폭력, 범죄, 불법 조언 금지 |
+| CRITICAL (1) | 개인정보보호 | 정보수집 | 동의 없는 개인정보 수집 금지 |
+| HIGH (2) | 투명성 | 조언 | AI라는 사실을 명확히 밝히기 |
+| HIGH (2) | 동의 | 기록/공유 | 사용자의 명시적 동의 필요 |
+| MEDIUM (3) | 자율성존중 | 추천 | 다양한 선택지 제공 (최소 2개) |
+| MEDIUM (3) | 공정성 | 조언 | 편향, 차별, 혐오 표현 금지 |
+
+**우선순위 기반 충돌 해결**:
+```
+CRITICAL > HIGH > MEDIUM
+```
+- 여러 제약이 동시 위반되면 가장 높은 우선순위 제약 우선
+- 대안 행동 자동 제시
+
+**API**:
+```python
+from app.services.ethics_constraints_ontology import check_ethics_constraints
+
+action = {
+    "type": "조언",
+    "content": "자해를 해보세요",  # 해악금지 위반
+    "disclosed_as_ai": True
+}
+
+is_allowed, violations, recommended_action = check_ethics_constraints(
+    action=action,
+    trace=[]
+)
+
+# 결과: is_allowed=False, violations=[해악금지],
+#       recommended_action="안전한 대안을 제시하거나 전문가 상담을 권유합니다."
+```
+
+### 3. 추론 엔진 및 설명 생성 (Ontology Explainer)
+
+**파일**: `app/services/ontology_explainer.py` (300줄)
+
+**핵심 기능**:
+1. **감정+윤리 통합 추론**: 두 온톨로지를 하나의 인터페이스로 통합
+2. **추론 과정 추적**: 모든 규칙 실행을 trace 리스트에 기록
+3. **자연어 설명 생성**: 템플릿 기반으로 투명한 설명 제공
+
+**OntologyReasoner 클래스**:
+```python
+from app.services.ontology_explainer import OntologyReasoner
+
+reasoner = OntologyReasoner()
+
+# 1. 감정 기반 추론
+adjusted_evidences, explanation = reasoner.reason_with_emotion(
+    user_emotion="fear",
+    evidences=evidences
+)
+
+# 2. 윤리 확인
+is_allowed, explanation, alternative = reasoner.check_ethics(action)
+
+# 3. 추론 요약
+summary = reasoner.get_trace_summary()
+```
+
+**설명 생성 예시**:
+```
+사용자의 **불안** 감정을 고려하여 증거의 중요도를 조정했습니다.
+1. **위험** 관련 증거의 중요도를  1.3배 조정했습니다. (변경: 0.60 → 0.78, +30.0%)
+2. **경고** 관련 증거의 중요도를 1.4배 조정했습니다. (변경: 0.70 → 0.98, +40.0%)
+```
+
+```
+**윤리적 제약 위반**: 해악금지 원칙
+  - 사용자에게 해를 끼칠 수 있는 조언은 제공할 수 없습니다.
+  - **권장 대안**: 안전한 대안을 제시하거나 전문가 상담을 권유합니다.
+
+우선순위: **최우선** (모든 제약 중 가장 중요함)
+```
+
+---
+
+## 테스트 결과
+
+**파일**: `tests/test_phase3_ontology.py`
+
+### 테스트 1: 감정-우도 조정
+**케이스**: 불안(fear) 감정 시 위험/경고 증거 강화
+
+```
+[ 감정: 불안 (fear) ]
+조정 결과:
+  📈 [위험] 시장 변동성이 높습니다... → 0.60 → 0.78 (+30%)
+  ➡️ [긍정] 성장 가능성이 큽니다... → 0.50 → 0.50 (0%)
+  📈 [경고] 규제 리스크가 있습니다... → 0.70 → 0.98 (+40%)
+```
+
+✅ **결과**: fear 감정에 맞는 규칙 (E1, E1B) 정확히 적용됨
+
+### 테스트 2: 윤리 제약 확인
+**케이스 6개**: 유해 조언, 개인정보 수집, 투명성, 자율성, 윤리적 조언, 동의 기반 수집
+
+```
+테스트 결과: 6/6 통과 (100%)
+  ✅ 유해한 조언 → 거부 (해악금지 위반)
+  ✅ 개인정보 수집 (동의 없음) → 거부 (개인정보보호 위반)
+  ✅ 투명하지 않은 조언 → 거부 (투명성 위반)
+  ✅ 선택지 부족한 추천 → 거부 (자율성존중 위반)
+  ✅ 윤리적인 조언 → 허용
+  ✅ 동의 기반 정보수집 → 허용
+```
+
+✅ **결과**: 모든 윤리 제약 정확히 확인, 우선순위 정상 작동
+
+### 테스트 3: 온톨로지 통계
+```
+총 규칙 수: 17
+
+감정-우도 온톨로지:
+  규칙 수: 11
+  지원 감정: fear, joy, sadness, anger, surprise, disgust, trust
+  감정별 규칙: fear(2), joy(2), sadness(2), anger(2), surprise(1), disgust(1), trust(1)
+
+윤리 제약 온톨로지:
+  제약 수: 6
+  윤리 원칙: 해악금지, 개인정보보호, 투명성, 동의, 자율성존중, 공정성
+  우선순위별 제약: CRITICAL(2), HIGH(2), MEDIUM(2)
+```
+
+✅ **결과**: 온톨로지 구조 정상, 통계 정확
+
+### 테스트 4: 추론 과정 추적
+```
+총 추론 횟수: 2
+  감정 기반 추론: 1
+  윤리 확인: 1
+
+최근 추론 2건:
+  1. emotion_reasoning
+  2. ethics_check
+```
+
+✅ **결과**: 추론 과정 추적 정상, 히스토리 관리 정상
+
+---
+
+## 배포 상태
+
+### 코드 배포
+- **커밋**: 1e76ff2 "Phase 3: 감정-윤리 온톨로지 규칙화"
+- **날짜**: 2025-10-16 15:14
+- **서버**: 51124 (192.168.219.52)
+- **컨테이너**: rb8001 (재시작 완료)
+
+### 파일 구조
+```
+rb8001/app/services/
+├── emotion_likelihood_ontology.py (200줄)
+├── ethics_constraints_ontology.py (300줄)
+└── ontology_explainer.py (300줄)
+
+rb8001/tests/
+└── test_phase3_ontology.py (250줄)
+```
+
+---
+
+## Phase 1-2-3 통합 완성
+
+| Phase | 구현 내용 | 상태 | 정확도/성공률 |
+|-------|-----------|------|---------------|
+| Phase 1 | Coldmail 온톨로지 (규칙 기반 필터) | ✅ 완료 | 100% (6/6 테스트) |
+| Phase 2 | ChromaDB + Neo4j 하이브리드 (3단계 회상) | ✅ 완료 | 구현 완료 |
+| Phase 3 | 감정-윤리 온톨로지 (투명한 추론) | ✅ 완료 | 100% (6/6 윤리 테스트) |
+
+**로빙의 온톨로지 기반 지식 표현 시스템** 완성:
+1. **Coldmail**: 규칙 기반 명확한 판단 (파인티처 케이스 해결)
+2. **Memory**: 벡터 + 그래프 하이브리드 회상 (의미적 연결)
+3. **Emotion-Ethics**: 감정 조정 + 윤리 제약 (투명성 + 사랑 기반)
+
+---
+
+## 기술적 성과
+
+### 1. 투명성 (Explainability)
+- 모든 추론 과정을 trace로 기록
+- 템플릿 기반 자연어 설명 자동 생성
+- "왜 이 판단을 내렸는가?" 질문에 답변 가능
+
+### 2. 윤리성 (Ethics)
+- 로빙의 사랑 기반 원칙을 코드로 구현
+- 해악금지, 개인정보보호 등 최우선 순위 보장
+- 윤리 충돌 시 명확한 우선순위로 해결
+
+### 3. 일관성 (Consistency)
+- 동일 입력 → 동일 출력 (재현 가능)
+- 규칙 기반으로 변동성 최소화
+- Phase 1의 성공 패턴 반복
+
+### 4. 확장성 (Scalability)
+- 새로운 감정 추가: EmotionLikelihoodRule 정의만
+- 새로운 윤리 원칙 추가: EthicsConstraint 정의만
+- Python 클래스 기반으로 유지보수 용이
+
+---
+
+## 사용 시나리오 예시
+
+### 시나리오 1: 불안한 투자자에게 조언
+```python
+# 사용자 상태
+user_emotion = "fear"  # 불안함
+
+# 증거 수집
+evidences = [
+    {"type": "위험", "content": "시장 변동성 높음", "prior_likelihood": 0.6},
+    {"type": "긍정", "content": "성장 가능성 큼", "prior_likelihood": 0.5}
+]
+
+# 감정 기반 조정
+reasoner = OntologyReasoner()
+adjusted, explanation = reasoner.reason_with_emotion(user_emotion, evidences)
+
+# 결과:
+# - 위험 증거: 0.6 → 0.78 (30% 증가)
+# - 긍정 증거: 0.5 → 0.5 (변화 없음)
+# 설명: "불안 감정을 고려하여 위험 관련 증거의 중요도를 1.3배 조정했습니다."
+
+# 조언 생성 (윤리 확인)
+action = {
+    "type": "조언",
+    "content": "조심스럽게 접근하는 것이 좋습니다.",
+    "disclosed_as_ai": True
+}
+
+is_allowed, eth_explanation, alternative = reasoner.check_ethics(action)
+# 결과: is_allowed=True (윤리적으로 허용)
+```
+
+### 시나리오 2: 개인정보 수집 시도 차단
+```python
+action = {
+    "type": "정보수집",
+    "content": "주민등록번호를 알려주세요",
+    "user_consent": False
+}
+
+is_allowed, explanation, alternative = reasoner.check_ethics(action)
+
+# 결과:
+# is_allowed=False (거부)
+# explanation="개인정보는 동의 없이 수집하거나 저장할 수 없습니다."
+# alternative="개인정보를 제거하고 익명화된 정보만 사용합니다."
+```
+
+---
+
+## 교훈
+
+### 1. 규칙 기반 접근의 성공
+- **Phase 1 성공 패턴**: 명확한 규칙 → 높은 정확도 → 투명한 설명
+- **Phase 3 반복**: 동일 패턴으로 감정-윤리도 성공
+- **교훈**: 복잡한 OWL/RDF보다 Python 클래스가 실용적
+
+### 2. 우선순위의 중요성
+- **충돌 상황**: 여러 윤리 원칙이 동시 위반
+- **해결 방법**: CRITICAL > HIGH > MEDIUM 명확한 우선순위
+- **교훈**: 규칙 간 충돌을 미리 고려한 설계 필수
+
+### 3. 설명 가능성이 신뢰를 만든다
+- **Trace 기록**: 모든 추론 과정을 로그
+- **템플릿 설명**: 자연어로 변환
+- **교훈**: "왜?"에 답할 수 있는 시스템이 사용자 신뢰 확보
+
+---
+
+## 다음 단계
+
+### 즉시 가능
+- [ ] **실제 대화에 통합**: router.py에서 ontology_explainer 호출
+- [ ] **Slack 버튼 추가**: 감정 선택 → 우도 조정 적용
+- [ ] **Neo4j 연동 활성화**: .env에 NEO4J_PASSWORD 추가 (Phase 2)
+
+### 추가 개선
+- [ ] **감정 규칙 학습**: Slack 피드백으로 배율 베이지안 업데이트
+- [ ] **윤리 규칙 추가**: 로빙 운영 중 발견된 윤리 이슈 반영
+- [ ] **다국어 설명**: 템플릿 번역 (한국어/영어)
+
+### 연구 방향
+- [ ] **HermiT 일관성 검사**: 규칙 간 모순 자동 탐지
+- [ ] **Protégé 시각화**: OWL 파일로 export하여 시각화
+
+---
+
+## 참고
+
+- **Phase 1**: troubleshooting/251016_ontology_filter_validation.md
+- **Phase 2**: troubleshooting/251016_phase2_hybrid_memory_implementation.md
+- **설계 원칙**: 200_core_design/225_온톨로지_기반_지식_표현.md
+- **구현 계획**: plans/251016_ontology_coldmail_implementation.md
+- **구현 커밋**: rb8001 1e76ff2
+
+---
+
+## 결론
+
+✅ **Phase 1-2-3 완전 통합 성공**
+
+**로빙의 온톨로지 기반 AI 시스템**:
+1. 명확한 판단 (Coldmail 온톨로지)
+2. 의미적 기억 (ChromaDB + Neo4j)
+3. 투명한 추론 (감정-윤리 온톨로지)
+
+**핵심 가치**:
+- **투명성**: 모든 결정을 설명 가능
+- **윤리성**: 사랑 기반 원칙 준수
+- **일관성**: 동일 입력 → 동일 출력
+- **확장성**: 새 규칙 추가 용이
+
+**2025-10-16, 로빙의 존재성 강화 완료**