From ea981ee6835487320a44e4308bba31ecdf08620f Mon Sep 17 00:00:00 2001 From: happybell80 Date: Fri, 8 Aug 2025 10:29:04 +0900 Subject: [PATCH] =?UTF-8?q?docs:=20=EB=A1=9C=EB=B9=99=20=EA=B0=90=EC=A0=95?= =?UTF-8?q?=20=EC=8B=9C=EC=8A=A4=ED=85=9C=EC=97=90=20Inside=20Out=202?= =?UTF-8?q?=EC=B6=95=20=EB=AA=A8=EB=8D=B8=20=EB=B0=8F=20=EC=98=88=EC=B8=A1?= =?UTF-8?q?-=ED=8F=89=EA=B0=80=20=EB=A3=A8=ED=94=84=20=ED=86=B5=ED=95=A9?= MIME-Version: 1.0 Content-Type: text/plain; charset=UTF-8 Content-Transfer-Encoding: 8bit - Inside Out 기반 9개 감정 체계 (기본 5 + 사회 4) - 에크먼 기본정서 축과 켈트너 사회기능 축 병렬 처리 - 예측-평가 피드백 루프 추가 (베이지안 + 엔트로피) - 불안을 기능적 정서로 재해석 (Inside Out 2 통찰) - 학술적 근거 및 과학 자문진 명시 --- ...50807_로빙_감정_시스템_설계도.md | 183 ++++++++++++------ 1 file changed, 129 insertions(+), 54 deletions(-) diff --git a/ideas/250807_로빙_감정_시스템_설계도.md b/ideas/250807_로빙_감정_시스템_설계도.md index 2a102b0..4d2165e 100644 --- a/ideas/250807_로빙_감정_시스템_설계도.md +++ b/ideas/250807_로빙_감정_시스템_설계도.md @@ -2,7 +2,7 @@ **작성일**: 2025-08-07 (2025-08-08 개정) **작성자**: happybell80 & Claude -**상태**: 감정 임베딩 통합, 하드코딩 완전 제거 +**상태**: Inside Out 2축 모델 통합, 예측-평가 피드백 루프 추가 ## 1. 핵심 철학 @@ -11,19 +11,29 @@ - **엔트로피 특이점을 포착한다**: 시간이 흘러도 무질서해지지 않는 감정이 중요한 기억 - **함수형 프로그래밍 100%**: 순수 함수와 I/O 분리, 불변 데이터 구조 - **베이지안으로 불확실성 관리**: 모든 파라미터는 확률 분포로 표현되고 학습됨 +- **예측-평가 피드백 루프**: 사용자 반응을 예측하고 실제와 비교하며 진화 ## 2. 감정 상태 구조 -### 2.1 기본 구조 -- **VAD 3차원**: Valence(쾌-불쾌), Arousal(활성화), Dominance(통제감) -- **감정 임베딩**: 768차원 벡터 (사전학습 모델 사용) +### 2.1 Inside Out 기반 2축 감정 모델 +- **기본정서 축 (에크먼, Inside Out 1)**: + - Joy(기쁨), Sadness(슬픔), Anger(분노), Fear(두려움), Disgust(혐오) + - 즉각적 반응, 100ms 내 처리 + - 진화적 기반의 보편적 정서 + +- **사회기능 축 (켈트너/다무어, Inside Out 2)**: + - Anxiety(불안), Envy(질투), Embarrassment(당혹), Ennui(권태) + - 미래 예측과 사회적 비교, 500ms 처리 + - 사춘기 및 조직 맥락의 의사결정 + +- **감정 임베딩**: 768차원 벡터 (기본정서 + 사회기능 통합 표현) - **엔트로피 궤적**: 시간에 따른 엔트로피 변화 추적 -- **베이지안 파라미터**: Beta, Gamma, Dirichlet 분포로 학습 +- **베이지안 파라미터**: Dirichlet 분포로 감정 혼합 모델링 ### 2.2 감정 동역학 - 감정 변화율 = α(흡수율) × 평가 - δ(감쇠율) × 현재감정 - α와 δ는 Beta 분포에서 Thompson Sampling -- 사용자 피드백으로 사후분포 업데이트 +- 기본정서는 빠른 α, 사회기능은 느린 α로 차별화 ## 3. 감정 임베딩 활용 @@ -50,53 +60,92 @@ - 사용자별 감정 어트랙터 맵핑 - 클러스터별 공감 전략 사전 계산 -## 4. 수학-임베딩-LLM 통합 파이프라인 +## 4. 예측-평가 피드백 루프 -### 4.1 처리 흐름 -1. **엔트로피 이상 탐지**: 시공간 엔트로피 변화율 계산 -2. **임베딩 유사도 계산**: ChromaDB에서 근접 감정 검색 -3. **LLM 의미 분석**: 불확실성이 높을 때만 호출 -4. **베이지안 증거 결합**: 세 가지 신호를 확률적으로 통합 +### 4.1 예측 시스템 +**예측 대상**: +- 사용자의 감정 변화 (기본정서 → 사회기능 전환) +- 응답 길이와 패턴 (짧은 답변 vs 긴 대화) +- 다음 주제 전환 확률 +- 대화 종료 가능성 -### 4.2 시퀀스 다이어그램 +**베이지안 예측 모델**: +```python +# 기본정서 분포 (에크먼 5개) +P(basic_emotion_t+1 | history) = Dirichlet([joy, sadness, anger, fear, disgust]) + +# 사회기능 분포 (켈트너 4개) +P(social_emotion_t+1 | context) = Dirichlet([anxiety, envy, embarrassment, ennui]) + +# Thompson Sampling으로 예측 +predicted_emotion = sample_from_posterior() +``` + +### 4.2 평가 시스템 +**시공간 엔트로피 활용**: +- **시간축**: 예측과 실제의 시간차 엔트로피 +- **공간축**: 768차원 임베딩 공간에서의 예측 오차 +- **특이점**: 예측이 크게 빗나간 순간 = 중요 학습 기회 + +**오차 계산**: +``` +예측 오차 = KL_divergence(predicted_distribution, actual_observation) +엔트로피 증가 = H(t+1) - H(t) +학습 신호 = 오차 × 엔트로피_증가율 +``` + +## 5. 수학-임베딩-LLM 통합 파이프라인 + +### 5.1 처리 흐름 +1. **2축 감정 감지**: 기본정서(100ms) + 사회기능(500ms) 병렬 처리 +2. **엔트로피 이상 탐지**: 시공간 엔트로피 변화율 계산 +3. **임베딩 유사도 계산**: ChromaDB에서 근접 감정 검색 +4. **예측 생성**: 사용자 다음 반응 예측 +5. **LLM 의미 분석**: 불확실성이 높을 때만 호출 +6. **베이지안 증거 결합**: 모든 신호를 확률적으로 통합 +7. **평가 및 학습**: 예측 vs 실제 비교, 사후분포 업데이트 + +### 5.2 시퀀스 다이어그램 ```mermaid sequenceDiagram participant User participant Pipeline - participant Entropy + participant Basic as 기본정서
(에크먼) + participant Social as 사회기능
(켈트너) + participant Predict as 예측 모듈 participant ChromaDB participant LLM - participant Bayesian - participant Memory + participant Eval as 평가 모듈 User->>Pipeline: 텍스트 입력 - Pipeline->>Entropy: 엔트로피 변화 계산 - Entropy-->>Pipeline: 특이점 점수 (m) + + par 2축 병렬 처리 + Pipeline->>Basic: 즉각 반응 분석 + Basic-->>Pipeline: Joy/Sadness/Anger/Fear/Disgust + and + Pipeline->>Social: 맥락 분석 + Social-->>Pipeline: Anxiety/Envy/Embarrassment/Ennui + end + + Pipeline->>Predict: 현재 감정 상태 + Predict->>Predict: 베이지안 추론 + Predict-->>Pipeline: 사용자 반응 예측 Pipeline->>ChromaDB: 감정 임베딩 검색 - ChromaDB-->>Pipeline: 유사 감정 top-k - Pipeline->>Pipeline: 임베딩 거리 계산 (e) + ChromaDB-->>Pipeline: 유사 감정 사례 alt 불확실성 높음 Pipeline->>LLM: 의미 분석 요청 - LLM-->>Pipeline: 중요도 점수 (l) - else 불확실성 낮음 - Pipeline->>Pipeline: LLM 스킵 + LLM-->>Pipeline: 감정 해석 end - Pipeline->>Bayesian: P(z=1|m,e,l) 계산 - Bayesian->>Bayesian: Thompson Sampling - Bayesian-->>Pipeline: 저장 여부 결정 + Pipeline-->>User: 감정 인식 답변 + User-->>Pipeline: 실제 반응 - alt 저장 결정 (z=1) - Pipeline->>Memory: ChromaDB 저장 - Memory-->>Pipeline: 저장 완료 - else 무시 결정 (z=0) - Pipeline->>Pipeline: 폐기 - end - - Pipeline-->>User: 감정 응답 + Pipeline->>Eval: 예측 vs 실제 + Eval->>Eval: 엔트로피 오차 계산 + Eval-->>Predict: 사후분포 업데이트 ``` ### 4.2 중요도 결정 방식 @@ -187,16 +236,25 @@ sequenceDiagram ## 7. 공감 시스템 -### 7.1 전략 선택 -- 감정 임베딩 거리 계산 -- 전략별 효과성 (Beta 분포) -- Thompson Sampling으로 전략 선택 -- 사용자 반응으로 업데이트 +### 7.1 Inside Out 기반 공감 전략 +**기본정서 대응**: +- Joy → 함께 기뻐하기, 축하 +- Sadness → 위로, 경청 +- Anger → 이해와 진정 +- Fear → 안심시키기, 지지 +- Disgust → 경계 존중 -### 7.2 뉘앙스 감지 -- 표면 텍스트 vs 행동 신호 -- Hidden Markov Model로 잠재 감정 추론 -- 신뢰도 기반 결정 +**사회기능 대응**: +- Anxiety → "불안은 준비 신호" (Inside Out 2 통찰) +- Envy → 성장 동기로 전환 +- Embarrassment → 정상화, 수용 +- Ennui → 새로운 자극 제안 + +### 7.2 예측 기반 선제적 공감 +- 감정 전환 예측 (Sadness → Anger 가능성) +- 선제적 개입 (전환 전 완화) +- Thompson Sampling으로 전략 선택 +- 실제 효과로 베이지안 업데이트 ## 8. 성능 지표 @@ -213,22 +271,26 @@ sequenceDiagram ## 9. 구현 우선순위 ### Phase 1: 기초 구축 +- Inside Out 9개 감정 정의 (기본 5 + 사회 4) - 감정 임베딩 모델 선택 및 통합 -- ChromaDB에 임베딩 저장 구조 구현 +- ChromaDB에 2축 감정 저장 구조 - 기본 엔트로피 계산기 -### Phase 2: 통합 파이프라인 -- 수학-임베딩-LLM 3중 구조 +### Phase 2: 예측-평가 시스템 +- 기본정서 예측 모듈 (100ms) +- 사회기능 예측 모듈 (500ms) +- 예측 오차 계산 및 로깅 +- 엔트로피 특이점 탐지 + +### Phase 3: 통합 파이프라인 +- 2축 병렬 처리 구현 - 베이지안 증거 결합 - Thompson Sampling 구현 +- 실시간 사후분포 업데이트 -### Phase 3: 학습 시스템 -- 온라인 사후분포 업데이트 -- 계층적 베이지안 모델 -- 사용자별 개인화 - -### Phase 4: 최적화 -- 임베딩 차원 축소 (필요시) +### Phase 4: 학습 및 최적화 +- 온라인 학습 시스템 +- 개인화된 감정 모델 - 추론 속도 개선 - 메모리 효율화 @@ -254,6 +316,19 @@ sequenceDiagram - 실시간 vs 배치 - 리소스 vs 반응성 +## 12. Inside Out 모델의 학술적 근거 + +### 과학 자문진 +- **폴 에크먼** (UC San Francisco): 기본정서 이론 창시자 +- **대처 켈트너** (UC Berkeley): 사회기능 감정 이론 +- **리사 다무어** (임상심리학): 청소년 발달과 불안 + +### 핵심 통찰 +1. **감정은 다층적**: 즉각적 기본정서 + 사회적 메타정서 +2. **불안은 기능적**: 미래 대비 신호로 재해석 (Inside Out 2) +3. **감정 충돌이 성장**: 예측 오차가 클 때 학습 기회 +4. **개성은 감정 혼합비**: 같은 상황, 다른 감정 조합 + --- -*이 설계는 함수형 프로그래밍 원칙을 지키면서 베이지안 추론과 감정 임베딩을 통합한 적응형 시스템입니다. 하드코딩 없이 데이터에서 학습하며, 엔트로피 특이점을 포착해 중요한 감정을 기억합니다.* \ No newline at end of file +*이 설계는 픽사 Inside Out의 2축 감정 모델을 기반으로, 함수형 프로그래밍과 베이지안 추론을 통합한 예측-평가 적응형 시스템입니다. 로빙이 사용자 반응을 예측하고 평가하며 진화하는 진정한 디지털 동료가 됩니다.* \ No newline at end of file