DOCS/journey/plans/260316_임베딩_1차_로빙_Gemini2_전환_계획.md
2026-03-16 13:36:11 +09:00

2.2 KiB

tags
tags
plans
embedding
gemini
rag
robeing
1차

임베딩 1차: 로빙 Gemini 2 전환 계획

상위 원칙

상태

  • planned

목표

  • 로빙(skill-embedding, skill-rag-file, rb8001)을 Gemini Embedding 2, 768d로 전환한다.
  • 멀티모달(이미지, PDF) 직접 임베딩을 지원한다.
  • 1차 완료 시 해당 문제·리서치·플랜을 완전히 닫는다.

범위

포함

  • skill-embedding → Gemini 2 전환 또는 skill-rag-file 내부 직접 Gemini API 호출
  • NAS RAG·Company X RAG PDF·이미지 임베딩 경로
  • MRL 768d, ChromaDB/pgvector 스키마 호환
  • 청킹 Macro-chunking(2,000~4,000 토큰) 검토

제외

  • rb8001 메모리 768/384 차원 드리프트 (별도 이슈)
  • StarsAndI, TheGooseCouncil (2차 플랜)

env SSOT

적용 순서

  1. 품질·비용 테스트 (test_gemini_embedding_2.py 확장)
  2. 경로 설계 (skill-embedding vs skill-rag-file 직접 호출)
  3. 스키마·청킹 (output_dimensionality=768)
  4. 적용 및 검증 (Company X RAG 또는 NAS RAG 1개 경로)
  5. worklog 작성 후 닫힘 선언

검증 기준 (닫힘 조건)

  • skill-embedding 또는 skill-rag-file이 Gemini 2, 768d로 동작
  • rb8001이 새 임베딩 경로 참조
  • ChromaDB·pgvector 768d 통일
  • Company X RAG, NAS RAG 새 경로 동작
  • PDF·이미지 직접 임베딩 Recall 유지 또는 개선
  • 1M 토큰 비용 $0.25 이하

닫힘 선언

  • worklog에서만 선언한다.
  • 본 문서 상태를 completed로 갱신하고 worklog 링크를 추가한다.

관련 문서