로빙 임베딩 서비스 분리 아키텍처 설계서 추가:
- 현재 메모리 사용량 분석 (rb10508_micro: 987.9MB)
- 임베딩 서비스 공유 + 기억 저장소 분리 아키텍처
- 구체적 구현 방안 (HTTP API, ChromaDB 분리)
- 메모리 절약 효과 (228MB + 확장성)
- 단계별 구현 계획 및 위험 완화 방안
🤖 Generated with [Claude Code](https://claude.ai/code)
Co-Authored-By: Claude <noreply@anthropic.com>
- 현재 L12 모델 성능 벤치마크 (한국어 유사도 테스트)
- 대안 임베딩 모델 8가지 비교 분석
- L6 vs L12 성능 차이 예상치 (10-15% 저하)
- 단계별 경량화 전략 (Phase 1-3)
- 하이브리드 아키텍처 제안 (ChromaDB + PostgreSQL)
- 메모리 사용량 분석 (현재 987MB → 목표 500MB)
- 벡터 DB 필요성 및 일반 DB 한계 설명