diff --git a/troubleshooting/250805_happybell80_skill-embedding서비스구축.md b/troubleshooting/250805_happybell80_skill-embedding서비스구축.md index c4c13e6..25571f0 100644 --- a/troubleshooting/250805_happybell80_skill-embedding서비스구축.md +++ b/troubleshooting/250805_happybell80_skill-embedding서비스구축.md @@ -316,4 +316,55 @@ class HTTPEmbeddingFunction(EmbeddingFunction): - rb10508_micro: 112.7MB (풀 기능) - 2배 차이는 추가 기능 대비 효율적 -**결론**: rb10508_micro 최적화 완료! HTTP 임베딩 전환이 핵심이었으며, 112.7MB로 목표 초과 달성. 추가 최적화는 비용 대비 효과가 낮음. \ No newline at end of file +**결론**: rb10508_micro 최적화 완료! HTTP 임베딩 전환이 핵심이었으며, 112.7MB로 목표 초과 달성. 추가 최적화는 비용 대비 효과가 낮음. + +## 오후 3시 34분 + +### rb10508_micro Gemini 모델 404 오류 해결 + +**문제상황**: +- AI 응답이 "응답 생성 중 오류가 발생했습니다: 404 Resource not found" 반환 +- ChromaDB에는 오류 메시지만 저장 +- 정상적인 대화 기능 완전 상실 + +**원인 분석**: +```python +# app/core/brain.py:38 +self.gemini_model = genai.GenerativeModel('gemini-pro') # ❌ 존재하지 않는 모델 +``` + +**해결**: +```python +# 1줄 수정 +self.gemini_model = genai.GenerativeModel('gemini-2.5-flash-lite') # ✅ 정상 모델 +``` + +**검증 결과**: +| 항목 | 이전 | 현재 | 개선도 | +|------|------|------|--------| +| API 연결 | ❌ 404 오류 | ✅ 정상 | 100% | +| 응답 생성 | ❌ 오류 메시지 | ✅ AI 응답 | 100% | +| 응답 속도 | N/A | 0.087초 | 완전 복구 | +| 메모리 저장 | ❌ 오류만 저장 | ✅ 정상 대화 | 100% | + +**최종 상태**: +- 메모리: 117.2MB (미세 증가는 정상 작동으로 인한 것) +- 기능: 완전한 AI 대화 서비스 복구 +- ChromaDB: 실제 대화 내용 정상 저장 + +**교훈**: + +15. **정확한 모델명의 중요성** + - LLM API 모델명은 정확해야 함 + - 존재하지 않는 모델은 404 오류 발생 + - 공식 문서 확인 필수 + +16. **1줄 수정의 파급력** + - 핵심 기능이 1줄 오류로 완전 정지 + - 빠른 진단과 수정이 중요 + - 테스트 코드로 사전 검증 필요 + +**총 최적화 프로젝트 성과**: +- 메모리: 987.9MB → 117.2MB (88.1% 감소) +- 기능: 100% 정상 작동 +- 목표 달성: 200MB 목표 대비 58.6% 수준 \ No newline at end of file