DOCS/journey/troubleshooting/260316_임베딩_Gemini_Embedding_2_전환_문제오픈.md
happybell80 a9627edebf docs: 임베딩 Gemini Embedding 2 전환 트러블슈팅·계획 문서 추가
- 트러블슈팅: 문제 정의, 현재/기대 상태, 재현 조건, 확인된 사실, 미확정 항목
- 계획: 목표, 범위, 적용 순서, 검증 기준
- 리서치 문서에 후속 문서 링크 추가
- README에 새 문서 등록

Made-with: Cursor
2026-03-16 12:49:19 +09:00

2.6 KiB

tags
tags
troubleshooting
embedding
gemini
rag
robeing

임베딩 Gemini Embedding 2 전환 문제 오픈

상위 원칙

문제 정의

  • 로빙의 임베딩은 현재 skill-embedding(ko-sroberta 768d)과 서비스별 혼재 경로를 사용합니다.
  • 멀티모달(이미지, PDF, 오디오) 데이터는 캡셔닝 파이프라인 없이 직접 임베딩할 수 없습니다.
  • 리서치(260315)에서 Gemini Embedding 2 도입이 NAS RAG·Company X에 유리하다고 정리했으나, 실행 계획과 문제 문서가 없어 전환 여부가 미결정 상태입니다.

현재 상태

항목 내용
skill-embedding ko-sroberta(multitask) 768d, 텍스트 전용
rb8001 메모리 ChromaDB 768/384 차원 드리프트 잔존
skill-rag-file Company X 384d, intent_prototypes pgvector 768d
멀티모달 미지원 (이미지·PDF는 텍스트 추출 후 임베딩)
청킹 Micro-chunking(300~500 단어) 위주

기대 상태

항목 내용
임베딩 모델 Gemini Embedding 2 (또는 하이브리드) 도입
멀티모달 PDF·이미지 직접 임베딩 가능 (캡셔닝 파이프라인 생략)
차원 MRL로 768d 유지 또는 1536/3072 선택
청킹 Macro-chunking(2,000~4,000 토큰) 전환 검토
비용 무료 티어·품질 비교 후 부분/하이브리드 적용

관련 문서

재현 조건

  • NAS RAG, Company X RAG, rb8001 메모리에서 임베딩 품질·비용·멀티모달 요구가 생길 때
  • PDF·이미지 기반 검색 품질 개선이 필요할 때

확인된 사실

  • 리서치(260315)에서 Gemini Embedding 2 특징·비용·청킹 전략이 정리됨
  • NAS RAG에 부분 도입, 하이브리드(미디어=Gemini 2, 텍스트=저렴) 권장
  • rb8001/scripts/test_gemini_embedding_2.py로 API 테스트 스크립트 존재

미확정 항목

  • skill-embedding 교체 vs Gemini API 직접 호출 병용
  • ChromaDB/pgvector 스키마 차원(768/1536/3072) 확정
  • 비용·품질 A/B 테스트 범위 및 기준