diff --git a/plans/250808_감정시스템_현실적용_5단계_로드맵.md b/plans/250808_감정시스템_현실적용_5단계_로드맵.md index 796dc57..696d889 100644 --- a/plans/250808_감정시스템_현실적용_5단계_로드맵.md +++ b/plans/250808_감정시스템_현실적용_5단계_로드맵.md @@ -41,11 +41,12 @@ def calculate_entropy(probs: List[float]) -> float: ``` ### 기술 스택 -- **감정 모델**: klue/bert-base 기반 (이미 학습 완료) -- **임베딩**: 기존 skill-embedding 서비스 확장 (포트 8515) +- **감정 모델**: klue/bert-base 기반 → ONNX 변환 완료 +- **서비스**: skill-embedding 확장 (포트 8515, /emotion 추가) - **저장**: 기존 ChromaDB 활용 (메타데이터에 감정 추가) -- **의사결정**: ε-greedy (ε=0.1) +- **의사결정**: 엔트로피 기반 복잡도 판단 - **기존 코드**: rb10508_micro의 memory/storage.py 재사용 +- **설정값**: confidence=0.35, entropy=2.0, temperature=1.232 ### 성능 목표 - 응답시간: 500ms 이내 @@ -72,12 +73,23 @@ curl -w "@curl-format.txt" http://localhost:8503/analyze ### 산출물 - [x] 7개 감정 모델 학습 완료 (training_emotion) -- [ ] skill-embedding 서비스에 /analyze_emotion 엔드포인트 추가 +- [x] ONNX 변환 완료 (423MB) +- [ ] skill-embedding 서비스에 /emotion 엔드포인트 추가 - [ ] Temperature Scaling 적용 (1.232) - [ ] 엔트로피 계산기 구현 - [ ] ChromaDB 메타데이터 통합 - [ ] rb10508_micro 연동 +### 아키텍처 결정 사항 (2025-08-12) +**문제**: 감정 분석을 어디에 구현할 것인가? +- Option A: 별도 skill-emotion 서비스 (아키텍처 원칙) +- Option B: skill-embedding에 통합 (자원 효율성) + +**최종 결정**: skill-embedding에 통합 +- 이유: ONNX Runtime 공유, 메모리 200MB 절약, 레이턴시 감소 +- 트레이드오프: 서비스 역할 혼재 vs 실용성 +- 향후: 서비스명 변경 고려 (skill-embedding → skill-ai) + --- ## Phase 2: 성능 최적화 및 통합