감정 시스템 계획 업데이트 - 아키텍처 결정 사항 및 진행 현황 반영

2025-08-13 01:17:22 +09:00 · 2025-08-13 01:17:22 +09:00 · 43dac8e386
commit 43dac8e386
parent 8565e03938
1 changed files with 16 additions and 4 deletions
--- a/plans/250808_감정시스템_현실적용_5단계_로드맵.md
+++ b/plans/250808_감정시스템_현실적용_5단계_로드맵.md
@ -41,11 +41,12 @@ def calculate_entropy(probs: List[float]) -> float:
 ```

 ### 기술 스택
- **감정 모델**: klue/bert-base 기반 (이미 학습 완료)
- **임베딩**: 기존 skill-embedding 서비스 확장 (포트 8515)
+- **감정 모델**: klue/bert-base 기반 → ONNX 변환 완료
+- **서비스**: skill-embedding 확장 (포트 8515, /emotion 추가)
 - **저장**: 기존 ChromaDB 활용 (메타데이터에 감정 추가)
- **의사결정**: ε-greedy (ε=0.1)
+- **의사결정**: 엔트로피 기반 복잡도 판단
 - **기존 코드**: rb10508_micro의 memory/storage.py 재사용
+- **설정값**: confidence=0.35, entropy=2.0, temperature=1.232

 ### 성능 목표
 - 응답시간: 500ms 이내
@ -72,12 +73,23 @@ curl -w "@curl-format.txt" http://localhost:8503/analyze

 ### 산출물
 - [x] 7개 감정 모델 학습 완료 (training_emotion)
- [ ] skill-embedding 서비스에 /analyze_emotion 엔드포인트 추가
+- [x] ONNX 변환 완료 (423MB)
+- [ ] skill-embedding 서비스에 /emotion 엔드포인트 추가
 - [ ] Temperature Scaling 적용 (1.232)
 - [ ] 엔트로피 계산기 구현
 - [ ] ChromaDB 메타데이터 통합
 - [ ] rb10508_micro 연동

+### 아키텍처 결정 사항 (2025-08-12)
+**문제**: 감정 분석을 어디에 구현할 것인가?
+- Option A: 별도 skill-emotion 서비스 (아키텍처 원칙)
+- Option B: skill-embedding에 통합 (자원 효율성)
+
+**최종 결정**: skill-embedding에 통합
+- 이유: ONNX Runtime 공유, 메모리 200MB 절약, 레이턴시 감소
+- 트레이드오프: 서비스 역할 혼재 vs 실용성
+- 향후: 서비스명 변경 고려 (skill-embedding → skill-ai)
+
 ---

 ## Phase 2: 성능 최적화 및 통합