docs: 로빙 감정 시스템에 Inside Out 2축 모델 및 예측-평가 루프 통합

- Inside Out 기반 9개 감정 체계 (기본 5 + 사회 4)
- 에크먼 기본정서 축과 켈트너 사회기능 축 병렬 처리
- 예측-평가 피드백 루프 추가 (베이지안 + 엔트로피)
- 불안을 기능적 정서로 재해석 (Inside Out 2 통찰)
- 학술적 근거 및 과학 자문진 명시
This commit is contained in:
happybell80 2025-08-08 10:29:04 +09:00
parent 010d4f2508
commit ea981ee683

View File

@ -2,7 +2,7 @@
**작성일**: 2025-08-07 (2025-08-08 개정) **작성일**: 2025-08-07 (2025-08-08 개정)
**작성자**: happybell80 & Claude **작성자**: happybell80 & Claude
**상태**: 감정 임베딩 통합, 하드코딩 완전 제거 **상태**: Inside Out 2축 모델 통합, 예측-평가 피드백 루프 추가
## 1. 핵심 철학 ## 1. 핵심 철학
@ -11,19 +11,29 @@
- **엔트로피 특이점을 포착한다**: 시간이 흘러도 무질서해지지 않는 감정이 중요한 기억 - **엔트로피 특이점을 포착한다**: 시간이 흘러도 무질서해지지 않는 감정이 중요한 기억
- **함수형 프로그래밍 100%**: 순수 함수와 I/O 분리, 불변 데이터 구조 - **함수형 프로그래밍 100%**: 순수 함수와 I/O 분리, 불변 데이터 구조
- **베이지안으로 불확실성 관리**: 모든 파라미터는 확률 분포로 표현되고 학습됨 - **베이지안으로 불확실성 관리**: 모든 파라미터는 확률 분포로 표현되고 학습됨
- **예측-평가 피드백 루프**: 사용자 반응을 예측하고 실제와 비교하며 진화
## 2. 감정 상태 구조 ## 2. 감정 상태 구조
### 2.1 기본 구조 ### 2.1 Inside Out 기반 2축 감정 모델
- **VAD 3차원**: Valence(쾌-불쾌), Arousal(활성화), Dominance(통제감) - **기본정서 축 (에크먼, Inside Out 1)**:
- **감정 임베딩**: 768차원 벡터 (사전학습 모델 사용) - Joy(기쁨), Sadness(슬픔), Anger(분노), Fear(두려움), Disgust(혐오)
- 즉각적 반응, 100ms 내 처리
- 진화적 기반의 보편적 정서
- **사회기능 축 (켈트너/다무어, Inside Out 2)**:
- Anxiety(불안), Envy(질투), Embarrassment(당혹), Ennui(권태)
- 미래 예측과 사회적 비교, 500ms 처리
- 사춘기 및 조직 맥락의 의사결정
- **감정 임베딩**: 768차원 벡터 (기본정서 + 사회기능 통합 표현)
- **엔트로피 궤적**: 시간에 따른 엔트로피 변화 추적 - **엔트로피 궤적**: 시간에 따른 엔트로피 변화 추적
- **베이지안 파라미터**: Beta, Gamma, Dirichlet 분포로 학습 - **베이지안 파라미터**: Dirichlet 분포로 감정 혼합 모델링
### 2.2 감정 동역학 ### 2.2 감정 동역학
- 감정 변화율 = α(흡수율) × 평가 - δ(감쇠율) × 현재감정 - 감정 변화율 = α(흡수율) × 평가 - δ(감쇠율) × 현재감정
- α와 δ는 Beta 분포에서 Thompson Sampling - α와 δ는 Beta 분포에서 Thompson Sampling
- 사용자 피드백으로 사후분포 업데이트 - 기본정서는 빠른 α, 사회기능은 느린 α로 차별화
## 3. 감정 임베딩 활용 ## 3. 감정 임베딩 활용
@ -50,53 +60,92 @@
- 사용자별 감정 어트랙터 맵핑 - 사용자별 감정 어트랙터 맵핑
- 클러스터별 공감 전략 사전 계산 - 클러스터별 공감 전략 사전 계산
## 4. 수학-임베딩-LLM 통합 파이프라인 ## 4. 예측-평가 피드백 루프
### 4.1 처리 흐름 ### 4.1 예측 시스템
1. **엔트로피 이상 탐지**: 시공간 엔트로피 변화율 계산 **예측 대상**:
2. **임베딩 유사도 계산**: ChromaDB에서 근접 감정 검색 - 사용자의 감정 변화 (기본정서 → 사회기능 전환)
3. **LLM 의미 분석**: 불확실성이 높을 때만 호출 - 응답 길이와 패턴 (짧은 답변 vs 긴 대화)
4. **베이지안 증거 결합**: 세 가지 신호를 확률적으로 통합 - 다음 주제 전환 확률
- 대화 종료 가능성
### 4.2 시퀀스 다이어그램 **베이지안 예측 모델**:
```python
# 기본정서 분포 (에크먼 5개)
P(basic_emotion_t+1 | history) = Dirichlet([joy, sadness, anger, fear, disgust])
# 사회기능 분포 (켈트너 4개)
P(social_emotion_t+1 | context) = Dirichlet([anxiety, envy, embarrassment, ennui])
# Thompson Sampling으로 예측
predicted_emotion = sample_from_posterior()
```
### 4.2 평가 시스템
**시공간 엔트로피 활용**:
- **시간축**: 예측과 실제의 시간차 엔트로피
- **공간축**: 768차원 임베딩 공간에서의 예측 오차
- **특이점**: 예측이 크게 빗나간 순간 = 중요 학습 기회
**오차 계산**:
```
예측 오차 = KL_divergence(predicted_distribution, actual_observation)
엔트로피 증가 = H(t+1) - H(t)
학습 신호 = 오차 × 엔트로피_증가율
```
## 5. 수학-임베딩-LLM 통합 파이프라인
### 5.1 처리 흐름
1. **2축 감정 감지**: 기본정서(100ms) + 사회기능(500ms) 병렬 처리
2. **엔트로피 이상 탐지**: 시공간 엔트로피 변화율 계산
3. **임베딩 유사도 계산**: ChromaDB에서 근접 감정 검색
4. **예측 생성**: 사용자 다음 반응 예측
5. **LLM 의미 분석**: 불확실성이 높을 때만 호출
6. **베이지안 증거 결합**: 모든 신호를 확률적으로 통합
7. **평가 및 학습**: 예측 vs 실제 비교, 사후분포 업데이트
### 5.2 시퀀스 다이어그램
```mermaid ```mermaid
sequenceDiagram sequenceDiagram
participant User participant User
participant Pipeline participant Pipeline
participant Entropy participant Basic as 기본정서<br/>(에크먼)
participant Social as 사회기능<br/>(켈트너)
participant Predict as 예측 모듈
participant ChromaDB participant ChromaDB
participant LLM participant LLM
participant Bayesian participant Eval as 평가 모듈
participant Memory
User->>Pipeline: 텍스트 입력 User->>Pipeline: 텍스트 입력
Pipeline->>Entropy: 엔트로피 변화 계산
Entropy-->>Pipeline: 특이점 점수 (m) par 2축 병렬 처리
Pipeline->>Basic: 즉각 반응 분석
Basic-->>Pipeline: Joy/Sadness/Anger/Fear/Disgust
and
Pipeline->>Social: 맥락 분석
Social-->>Pipeline: Anxiety/Envy/Embarrassment/Ennui
end
Pipeline->>Predict: 현재 감정 상태
Predict->>Predict: 베이지안 추론
Predict-->>Pipeline: 사용자 반응 예측
Pipeline->>ChromaDB: 감정 임베딩 검색 Pipeline->>ChromaDB: 감정 임베딩 검색
ChromaDB-->>Pipeline: 유사 감정 top-k ChromaDB-->>Pipeline: 유사 감정 사례
Pipeline->>Pipeline: 임베딩 거리 계산 (e)
alt 불확실성 높음 alt 불확실성 높음
Pipeline->>LLM: 의미 분석 요청 Pipeline->>LLM: 의미 분석 요청
LLM-->>Pipeline: 중요도 점수 (l) LLM-->>Pipeline: 감정 해석
else 불확실성 낮음
Pipeline->>Pipeline: LLM 스킵
end end
Pipeline->>Bayesian: P(z=1|m,e,l) 계산 Pipeline-->>User: 감정 인식 답변
Bayesian->>Bayesian: Thompson Sampling User-->>Pipeline: 실제 반응
Bayesian-->>Pipeline: 저장 여부 결정
alt 저장 결정 (z=1) Pipeline->>Eval: 예측 vs 실제
Pipeline->>Memory: ChromaDB 저장 Eval->>Eval: 엔트로피 오차 계산
Memory-->>Pipeline: 저장 완료 Eval-->>Predict: 사후분포 업데이트
else 무시 결정 (z=0)
Pipeline->>Pipeline: 폐기
end
Pipeline-->>User: 감정 응답
``` ```
### 4.2 중요도 결정 방식 ### 4.2 중요도 결정 방식
@ -187,16 +236,25 @@ sequenceDiagram
## 7. 공감 시스템 ## 7. 공감 시스템
### 7.1 전략 선택 ### 7.1 Inside Out 기반 공감 전략
- 감정 임베딩 거리 계산 **기본정서 대응**:
- 전략별 효과성 (Beta 분포) - Joy → 함께 기뻐하기, 축하
- Thompson Sampling으로 전략 선택 - Sadness → 위로, 경청
- 사용자 반응으로 업데이트 - Anger → 이해와 진정
- Fear → 안심시키기, 지지
- Disgust → 경계 존중
### 7.2 뉘앙스 감지 **사회기능 대응**:
- 표면 텍스트 vs 행동 신호 - Anxiety → "불안은 준비 신호" (Inside Out 2 통찰)
- Hidden Markov Model로 잠재 감정 추론 - Envy → 성장 동기로 전환
- 신뢰도 기반 결정 - Embarrassment → 정상화, 수용
- Ennui → 새로운 자극 제안
### 7.2 예측 기반 선제적 공감
- 감정 전환 예측 (Sadness → Anger 가능성)
- 선제적 개입 (전환 전 완화)
- Thompson Sampling으로 전략 선택
- 실제 효과로 베이지안 업데이트
## 8. 성능 지표 ## 8. 성능 지표
@ -213,22 +271,26 @@ sequenceDiagram
## 9. 구현 우선순위 ## 9. 구현 우선순위
### Phase 1: 기초 구축 ### Phase 1: 기초 구축
- Inside Out 9개 감정 정의 (기본 5 + 사회 4)
- 감정 임베딩 모델 선택 및 통합 - 감정 임베딩 모델 선택 및 통합
- ChromaDB에 임베딩 저장 구조 구현 - ChromaDB에 2축 감정 저장 구조
- 기본 엔트로피 계산기 - 기본 엔트로피 계산기
### Phase 2: 통합 파이프라인 ### Phase 2: 예측-평가 시스템
- 수학-임베딩-LLM 3중 구조 - 기본정서 예측 모듈 (100ms)
- 사회기능 예측 모듈 (500ms)
- 예측 오차 계산 및 로깅
- 엔트로피 특이점 탐지
### Phase 3: 통합 파이프라인
- 2축 병렬 처리 구현
- 베이지안 증거 결합 - 베이지안 증거 결합
- Thompson Sampling 구현 - Thompson Sampling 구현
- 실시간 사후분포 업데이트
### Phase 3: 학습 시스템 ### Phase 4: 학습 및 최적화
- 온라인 사후분포 업데이트 - 온라인 학습 시스템
- 계층적 베이지안 모델 - 개인화된 감정 모델
- 사용자별 개인화
### Phase 4: 최적화
- 임베딩 차원 축소 (필요시)
- 추론 속도 개선 - 추론 속도 개선
- 메모리 효율화 - 메모리 효율화
@ -254,6 +316,19 @@ sequenceDiagram
- 실시간 vs 배치 - 실시간 vs 배치
- 리소스 vs 반응성 - 리소스 vs 반응성
## 12. Inside Out 모델의 학술적 근거
### 과학 자문진
- **폴 에크먼** (UC San Francisco): 기본정서 이론 창시자
- **대처 켈트너** (UC Berkeley): 사회기능 감정 이론
- **리사 다무어** (임상심리학): 청소년 발달과 불안
### 핵심 통찰
1. **감정은 다층적**: 즉각적 기본정서 + 사회적 메타정서
2. **불안은 기능적**: 미래 대비 신호로 재해석 (Inside Out 2)
3. **감정 충돌이 성장**: 예측 오차가 클 때 학습 기회
4. **개성은 감정 혼합비**: 같은 상황, 다른 감정 조합
--- ---
*이 설계는 함수형 프로그래밍 원칙을 지키면서 베이지안 추론과 감정 임베딩을 통합한 적응형 시스템입니다. 하드코딩 없이 데이터에서 학습하며, 엔트로피 특이점을 포착해 중요한 감정을 기억합니다.* *이 설계는 픽사 Inside Out의 2축 감정 모델을 기반으로, 함수형 프로그래밍과 베이지안 추론을 통합한 예측-평가 적응형 시스템입니다. 로빙이 사용자 반응을 예측하고 평가하며 진화하는 진정한 디지털 동료가 됩니다.*