diff --git a/ideas/250807_로빙_감정_시스템_설계도.md b/ideas/250807_로빙_감정_시스템_설계도.md index 4d2165e..2cf4e3b 100644 --- a/ideas/250807_로빙_감정_시스템_설계도.md +++ b/ideas/250807_로빙_감정_시스템_설계도.md @@ -15,7 +15,12 @@ ## 2. 감정 상태 구조 -### 2.1 Inside Out 기반 2축 감정 모델 +### 2.1 기본 구조 +- **감정 임베딩**: 768차원 벡터 (사전학습 모델 사용) - 핵심 표현 +- **엔트로피 궤적**: 시간에 따른 엔트로피 변화 추적 +- **베이지안 파라미터**: Beta, Gamma, Dirichlet 분포로 학습 + +### 2.2 Inside Out 기반 2축 감정 모델 - **기본정서 축 (에크먼, Inside Out 1)**: - Joy(기쁨), Sadness(슬픔), Anger(분노), Fear(두려움), Disgust(혐오) - 즉각적 반응, 100ms 내 처리 @@ -26,14 +31,13 @@ - 미래 예측과 사회적 비교, 500ms 처리 - 사춘기 및 조직 맥락의 의사결정 -- **감정 임베딩**: 768차원 벡터 (기본정서 + 사회기능 통합 표현) -- **엔트로피 궤적**: 시간에 따른 엔트로피 변화 추적 -- **베이지안 파라미터**: Dirichlet 분포로 감정 혼합 모델링 +- **통합 방식**: 768차원 임베딩에서 9개 감정 레이블 추출 -### 2.2 감정 동역학 +### 2.3 감정 동역학 - 감정 변화율 = α(흡수율) × 평가 - δ(감쇠율) × 현재감정 - α와 δ는 Beta 분포에서 Thompson Sampling - 기본정서는 빠른 α, 사회기능은 느린 α로 차별화 +- 사용자 피드백으로 사후분포 업데이트 ## 3. 감정 임베딩 활용 @@ -45,7 +49,7 @@ ### 3.2 ChromaDB 통합 - **저장 구조**: - 감정 임베딩 벡터 (768차원) - - VAD 값 (3차원) + - Inside Out 감정 분포 (9차원: 기본 5 + 사회 4) - 엔트로피 점수 - 타임스탬프와 메타데이터 @@ -148,30 +152,30 @@ sequenceDiagram Eval-->>Predict: 사후분포 업데이트 ``` -### 4.2 중요도 결정 방식 +### 5.3 중요도 결정 방식 - 잠재 중요도 z ∈ {0,1} - 관측: m(엔트로피), e(임베딩 거리), l(LLM 점수) - 베이지안 추론으로 P(z=1|m,e,l) 계산 - Thompson Sampling으로 저장/무시 결정 -## 5. 베이지안 학습 시스템 +## 6. 베이지안 학습 시스템 -### 5.1 파라미터 학습 +### 6.1 파라미터 학습 - **윈도우 크기**: Poisson 분포, TD-Error 기반 적응 - **가중치**: Dirichlet 분포, 사용자 피드백으로 업데이트 - **임계값**: Beta 분포, 성능 지표로 조정 -### 5.2 계층적 모델 +### 6.2 계층적 모델 - **조직 레벨**: 글로벌 사전분포 - **팀 레벨**: 팀별 특성 학습 - **개인 레벨**: 개인화된 사후분포 -### 5.3 온라인 업데이트 +### 6.3 온라인 업데이트 - 실시간 사후분포 갱신 - 지연 피드백 처리 (backward update) - 불확실성 기반 탐색-활용 균형 -### 5.4 학습 플로우 +### 6.4 학습 플로우 ```mermaid flowchart TD @@ -195,21 +199,21 @@ flowchart TD K --> L[다음 행동 결정] ``` -## 6. 감정-기억 통합 +## 7. 감정-기억 통합 -### 6.1 저장 결정 +### 7.1 저장 결정 - 엔트로피 특이점 검사 - 임베딩 클러스터 거리 - 베이지안 중요도 추론 - Thompson Sampling으로 최종 결정 -### 6.2 회상 메커니즘 +### 7.2 회상 메커니즘 - 임베딩 기반 빠른 검색 (ChromaDB) - 엔트로피 가중 재순위화 - MMR로 다양성 보장 - 시간 감쇠 적용 -### 6.3 기억 회상 시퀀스 +### 7.3 기억 회상 시퀀스 ```mermaid sequenceDiagram @@ -234,9 +238,9 @@ sequenceDiagram Response-->>Query: 관련 기억 반환 ``` -## 7. 공감 시스템 +## 8. 공감 시스템 -### 7.1 Inside Out 기반 공감 전략 +### 8.1 Inside Out 기반 공감 전략 **기본정서 대응**: - Joy → 함께 기뻐하기, 축하 - Sadness → 위로, 경청 @@ -250,25 +254,30 @@ sequenceDiagram - Embarrassment → 정상화, 수용 - Ennui → 새로운 자극 제안 -### 7.2 예측 기반 선제적 공감 +### 8.2 예측 기반 선제적 공감 - 감정 전환 예측 (Sadness → Anger 가능성) - 선제적 개입 (전환 전 완화) - Thompson Sampling으로 전략 선택 - 실제 효과로 베이지안 업데이트 -## 8. 성능 지표 +## 9. 성능 지표 -### 8.1 임베딩 품질 +### 9.1 임베딩 품질 - **Triplet Accuracy**: 같은 감정이 임베딩 공간에서 가까운 비율 - **Retrieval NDCG@k**: 관련 기억 검색 정확도 - **클러스터 순도**: 감정 클러스터의 일관성 -### 8.2 시스템 성능 +### 9.2 예측 정확도 +- **KL Divergence**: 예측 vs 실제 감정 분포 +- **시간 예측 오차**: 감정 전환 타이밍 +- **학습 수렴 속도**: 예측 개선 속도 + +### 9.3 시스템 성능 - **엔트로피 감소율**: 중요 순간 포착 능력 - **베이지안 캘리브레이션**: 확률 예측의 정확도 - **적응 속도**: 사용자별 수렴 시간 -## 9. 구현 우선순위 +## 10. 구현 우선순위 ### Phase 1: 기초 구축 - Inside Out 9개 감정 정의 (기본 5 + 사회 4) @@ -294,14 +303,14 @@ sequenceDiagram - 추론 속도 개선 - 메모리 효율화 -## 10. 기술 스택 +## 11. 기술 스택 - **임베딩 모델**: Hugging Face Transformers - **벡터 DB**: ChromaDB (이미 사용 중) - **베이지안 추론**: Pyro (경량) 또는 TFP (대규모) - **함수형 구조**: 순수 함수 + I/O 분리 패턴 -## 11. 주요 결정 사항 +## 12. 주요 결정 사항 1. **임베딩 모델 선택**: - 한국어 지원 여부 @@ -316,7 +325,7 @@ sequenceDiagram - 실시간 vs 배치 - 리소스 vs 반응성 -## 12. Inside Out 모델의 학술적 근거 +## 13. Inside Out 모델의 학술적 근거 ### 과학 자문진 - **폴 에크먼** (UC San Francisco): 기본정서 이론 창시자