감정 시스템 계획 업데이트 - 아키텍처 결정 사항 및 진행 현황 반영

This commit is contained in:
happybell80 2025-08-13 01:17:22 +09:00
parent 8565e03938
commit 43dac8e386

View File

@ -41,11 +41,12 @@ def calculate_entropy(probs: List[float]) -> float:
```
### 기술 스택
- **감정 모델**: klue/bert-base 기반 (이미 학습 완료)
- **임베딩**: 기존 skill-embedding 서비스 확장 (포트 8515)
- **감정 모델**: klue/bert-base 기반 → ONNX 변환 완료
- **서비스**: skill-embedding 확장 (포트 8515, /emotion 추가)
- **저장**: 기존 ChromaDB 활용 (메타데이터에 감정 추가)
- **의사결정**: ε-greedy (ε=0.1)
- **의사결정**: 엔트로피 기반 복잡도 판단
- **기존 코드**: rb10508_micro의 memory/storage.py 재사용
- **설정값**: confidence=0.35, entropy=2.0, temperature=1.232
### 성능 목표
- 응답시간: 500ms 이내
@ -72,12 +73,23 @@ curl -w "@curl-format.txt" http://localhost:8503/analyze
### 산출물
- [x] 7개 감정 모델 학습 완료 (training_emotion)
- [ ] skill-embedding 서비스에 /analyze_emotion 엔드포인트 추가
- [x] ONNX 변환 완료 (423MB)
- [ ] skill-embedding 서비스에 /emotion 엔드포인트 추가
- [ ] Temperature Scaling 적용 (1.232)
- [ ] 엔트로피 계산기 구현
- [ ] ChromaDB 메타데이터 통합
- [ ] rb10508_micro 연동
### 아키텍처 결정 사항 (2025-08-12)
**문제**: 감정 분석을 어디에 구현할 것인가?
- Option A: 별도 skill-emotion 서비스 (아키텍처 원칙)
- Option B: skill-embedding에 통합 (자원 효율성)
**최종 결정**: skill-embedding에 통합
- 이유: ONNX Runtime 공유, 메모리 200MB 절약, 레이턴시 감소
- 트레이드오프: 서비스 역할 혼재 vs 실용성
- 향후: 서비스명 변경 고려 (skill-embedding → skill-ai)
---
## Phase 2: 성능 최적화 및 통합