DOCS/journey/troubleshooting/250906_gemini_model_optimization.md
Claude-51124 22557e7132 docs: 오래된 트러블슈팅 아카이브 및 구조 정리
- 7-8월 초기 구축 문서 12개를 _archive/troubleshooting/2025_07-08_initial_setup/로 이동
- book/300_architecture/390_human_in_the_loop_intent_learning.md를 journey/research/intent_classification/로 이동 (개발 여정 문서)
- 빈 폴더 제거 (journey/assets/*)
2025-11-17 14:06:05 +09:00

876 B

Gemini 모델 최적화: gemini-2.5-flash-lite 전환

작성일: 2025-09-06

작성자: happybell80

문제 상황

  • 여러 서비스에서 서로 다른 Gemini 모델 사용 (1.5-flash, 2.5-flash)
  • 하드코딩된 모델명으로 인한 관리 어려움
  • 비용 및 성능 최적화 필요

해결 과정

  1. 테스트 결과: gemini-2.5-flash-lite가 가장 빠름 (0.93초)
  2. 모든 서비스에 환경변수 GEMINI_MODEL 도입
  3. 기본값을 gemini-2.5-flash-lite로 통일

수정 파일

  • skill_news/app/services/news_summarizer.py
  • company-x_hompage/src/collectors/summarize_news.py
  • rb8001/app/llm/gemini_handler.py
  • rb8001/app/llm/llm_service.py

교훈

  • 환경변수로 모델 관리하면 서버별 최적화 가능
  • 최신 lite 모델이 구버전보다 빠르고 저렴 (35% 속도 향상, 4배 비용 절감)