docs: 감정 시스템 설계 문서 수정 - VAD 제거 및 기존 내용 보존

- VAD 3차원 모델 제거 (학술적 근거 부족)
- 768차원 임베딩을 핵심 표현으로 유지
- Inside Out 9개 감정을 해석 레이어로 추가
- 기존 엔트로피, 베이지안, ChromaDB 구조 모두 보존
- 예측-평가 피드백 루프 통합
- 섹션 번호 정리
This commit is contained in:
happybell80 2025-08-08 10:36:22 +09:00
parent ea981ee683
commit 4b9cb34203

View File

@ -15,7 +15,12 @@
## 2. 감정 상태 구조 ## 2. 감정 상태 구조
### 2.1 Inside Out 기반 2축 감정 모델 ### 2.1 기본 구조
- **감정 임베딩**: 768차원 벡터 (사전학습 모델 사용) - 핵심 표현
- **엔트로피 궤적**: 시간에 따른 엔트로피 변화 추적
- **베이지안 파라미터**: Beta, Gamma, Dirichlet 분포로 학습
### 2.2 Inside Out 기반 2축 감정 모델
- **기본정서 축 (에크먼, Inside Out 1)**: - **기본정서 축 (에크먼, Inside Out 1)**:
- Joy(기쁨), Sadness(슬픔), Anger(분노), Fear(두려움), Disgust(혐오) - Joy(기쁨), Sadness(슬픔), Anger(분노), Fear(두려움), Disgust(혐오)
- 즉각적 반응, 100ms 내 처리 - 즉각적 반응, 100ms 내 처리
@ -26,14 +31,13 @@
- 미래 예측과 사회적 비교, 500ms 처리 - 미래 예측과 사회적 비교, 500ms 처리
- 사춘기 및 조직 맥락의 의사결정 - 사춘기 및 조직 맥락의 의사결정
- **감정 임베딩**: 768차원 벡터 (기본정서 + 사회기능 통합 표현) - **통합 방식**: 768차원 임베딩에서 9개 감정 레이블 추출
- **엔트로피 궤적**: 시간에 따른 엔트로피 변화 추적
- **베이지안 파라미터**: Dirichlet 분포로 감정 혼합 모델링
### 2.2 감정 동역학 ### 2.3 감정 동역학
- 감정 변화율 = α(흡수율) × 평가 - δ(감쇠율) × 현재감정 - 감정 변화율 = α(흡수율) × 평가 - δ(감쇠율) × 현재감정
- α와 δ는 Beta 분포에서 Thompson Sampling - α와 δ는 Beta 분포에서 Thompson Sampling
- 기본정서는 빠른 α, 사회기능은 느린 α로 차별화 - 기본정서는 빠른 α, 사회기능은 느린 α로 차별화
- 사용자 피드백으로 사후분포 업데이트
## 3. 감정 임베딩 활용 ## 3. 감정 임베딩 활용
@ -45,7 +49,7 @@
### 3.2 ChromaDB 통합 ### 3.2 ChromaDB 통합
- **저장 구조**: - **저장 구조**:
- 감정 임베딩 벡터 (768차원) - 감정 임베딩 벡터 (768차원)
- VAD 값 (3차원) - Inside Out 감정 분포 (9차원: 기본 5 + 사회 4)
- 엔트로피 점수 - 엔트로피 점수
- 타임스탬프와 메타데이터 - 타임스탬프와 메타데이터
@ -148,30 +152,30 @@ sequenceDiagram
Eval-->>Predict: 사후분포 업데이트 Eval-->>Predict: 사후분포 업데이트
``` ```
### 4.2 중요도 결정 방식 ### 5.3 중요도 결정 방식
- 잠재 중요도 z ∈ {0,1} - 잠재 중요도 z ∈ {0,1}
- 관측: m(엔트로피), e(임베딩 거리), l(LLM 점수) - 관측: m(엔트로피), e(임베딩 거리), l(LLM 점수)
- 베이지안 추론으로 P(z=1|m,e,l) 계산 - 베이지안 추론으로 P(z=1|m,e,l) 계산
- Thompson Sampling으로 저장/무시 결정 - Thompson Sampling으로 저장/무시 결정
## 5. 베이지안 학습 시스템 ## 6. 베이지안 학습 시스템
### 5.1 파라미터 학습 ### 6.1 파라미터 학습
- **윈도우 크기**: Poisson 분포, TD-Error 기반 적응 - **윈도우 크기**: Poisson 분포, TD-Error 기반 적응
- **가중치**: Dirichlet 분포, 사용자 피드백으로 업데이트 - **가중치**: Dirichlet 분포, 사용자 피드백으로 업데이트
- **임계값**: Beta 분포, 성능 지표로 조정 - **임계값**: Beta 분포, 성능 지표로 조정
### 5.2 계층적 모델 ### 6.2 계층적 모델
- **조직 레벨**: 글로벌 사전분포 - **조직 레벨**: 글로벌 사전분포
- **팀 레벨**: 팀별 특성 학습 - **팀 레벨**: 팀별 특성 학습
- **개인 레벨**: 개인화된 사후분포 - **개인 레벨**: 개인화된 사후분포
### 5.3 온라인 업데이트 ### 6.3 온라인 업데이트
- 실시간 사후분포 갱신 - 실시간 사후분포 갱신
- 지연 피드백 처리 (backward update) - 지연 피드백 처리 (backward update)
- 불확실성 기반 탐색-활용 균형 - 불확실성 기반 탐색-활용 균형
### 5.4 학습 플로우 ### 6.4 학습 플로우
```mermaid ```mermaid
flowchart TD flowchart TD
@ -195,21 +199,21 @@ flowchart TD
K --> L[다음 행동 결정] K --> L[다음 행동 결정]
``` ```
## 6. 감정-기억 통합 ## 7. 감정-기억 통합
### 6.1 저장 결정 ### 7.1 저장 결정
- 엔트로피 특이점 검사 - 엔트로피 특이점 검사
- 임베딩 클러스터 거리 - 임베딩 클러스터 거리
- 베이지안 중요도 추론 - 베이지안 중요도 추론
- Thompson Sampling으로 최종 결정 - Thompson Sampling으로 최종 결정
### 6.2 회상 메커니즘 ### 7.2 회상 메커니즘
- 임베딩 기반 빠른 검색 (ChromaDB) - 임베딩 기반 빠른 검색 (ChromaDB)
- 엔트로피 가중 재순위화 - 엔트로피 가중 재순위화
- MMR로 다양성 보장 - MMR로 다양성 보장
- 시간 감쇠 적용 - 시간 감쇠 적용
### 6.3 기억 회상 시퀀스 ### 7.3 기억 회상 시퀀스
```mermaid ```mermaid
sequenceDiagram sequenceDiagram
@ -234,9 +238,9 @@ sequenceDiagram
Response-->>Query: 관련 기억 반환 Response-->>Query: 관련 기억 반환
``` ```
## 7. 공감 시스템 ## 8. 공감 시스템
### 7.1 Inside Out 기반 공감 전략 ### 8.1 Inside Out 기반 공감 전략
**기본정서 대응**: **기본정서 대응**:
- Joy → 함께 기뻐하기, 축하 - Joy → 함께 기뻐하기, 축하
- Sadness → 위로, 경청 - Sadness → 위로, 경청
@ -250,25 +254,30 @@ sequenceDiagram
- Embarrassment → 정상화, 수용 - Embarrassment → 정상화, 수용
- Ennui → 새로운 자극 제안 - Ennui → 새로운 자극 제안
### 7.2 예측 기반 선제적 공감 ### 8.2 예측 기반 선제적 공감
- 감정 전환 예측 (Sadness → Anger 가능성) - 감정 전환 예측 (Sadness → Anger 가능성)
- 선제적 개입 (전환 전 완화) - 선제적 개입 (전환 전 완화)
- Thompson Sampling으로 전략 선택 - Thompson Sampling으로 전략 선택
- 실제 효과로 베이지안 업데이트 - 실제 효과로 베이지안 업데이트
## 8. 성능 지표 ## 9. 성능 지표
### 8.1 임베딩 품질 ### 9.1 임베딩 품질
- **Triplet Accuracy**: 같은 감정이 임베딩 공간에서 가까운 비율 - **Triplet Accuracy**: 같은 감정이 임베딩 공간에서 가까운 비율
- **Retrieval NDCG@k**: 관련 기억 검색 정확도 - **Retrieval NDCG@k**: 관련 기억 검색 정확도
- **클러스터 순도**: 감정 클러스터의 일관성 - **클러스터 순도**: 감정 클러스터의 일관성
### 8.2 시스템 성능 ### 9.2 예측 정확도
- **KL Divergence**: 예측 vs 실제 감정 분포
- **시간 예측 오차**: 감정 전환 타이밍
- **학습 수렴 속도**: 예측 개선 속도
### 9.3 시스템 성능
- **엔트로피 감소율**: 중요 순간 포착 능력 - **엔트로피 감소율**: 중요 순간 포착 능력
- **베이지안 캘리브레이션**: 확률 예측의 정확도 - **베이지안 캘리브레이션**: 확률 예측의 정확도
- **적응 속도**: 사용자별 수렴 시간 - **적응 속도**: 사용자별 수렴 시간
## 9. 구현 우선순위 ## 10. 구현 우선순위
### Phase 1: 기초 구축 ### Phase 1: 기초 구축
- Inside Out 9개 감정 정의 (기본 5 + 사회 4) - Inside Out 9개 감정 정의 (기본 5 + 사회 4)
@ -294,14 +303,14 @@ sequenceDiagram
- 추론 속도 개선 - 추론 속도 개선
- 메모리 효율화 - 메모리 효율화
## 10. 기술 스택 ## 11. 기술 스택
- **임베딩 모델**: Hugging Face Transformers - **임베딩 모델**: Hugging Face Transformers
- **벡터 DB**: ChromaDB (이미 사용 중) - **벡터 DB**: ChromaDB (이미 사용 중)
- **베이지안 추론**: Pyro (경량) 또는 TFP (대규모) - **베이지안 추론**: Pyro (경량) 또는 TFP (대규모)
- **함수형 구조**: 순수 함수 + I/O 분리 패턴 - **함수형 구조**: 순수 함수 + I/O 분리 패턴
## 11. 주요 결정 사항 ## 12. 주요 결정 사항
1. **임베딩 모델 선택**: 1. **임베딩 모델 선택**:
- 한국어 지원 여부 - 한국어 지원 여부
@ -316,7 +325,7 @@ sequenceDiagram
- 실시간 vs 배치 - 실시간 vs 배치
- 리소스 vs 반응성 - 리소스 vs 반응성
## 12. Inside Out 모델의 학술적 근거 ## 13. Inside Out 모델의 학술적 근거
### 과학 자문진 ### 과학 자문진
- **폴 에크먼** (UC San Francisco): 기본정서 이론 창시자 - **폴 에크먼** (UC San Francisco): 기본정서 이론 창시자