--- status: closed closed_date: 2026-03-21 closed_reason: 260320 다형식문서 RAG 계획으로 흡수 또는 구현 완료 tags: [plans, embedding, gemini, rag, robeing, deprecated] --- status: closed closed_date: 2026-03-21 closed_reason: 260320 다형식문서 RAG 계획으로 흡수 또는 구현 완료 # 임베딩 Gemini Embedding 2 전환 계획 > **1차·2차로 분리됨.** > - [1차: 로빙](./260316_임베딩_1차_로빙_Gemini2_전환_계획.md) (완전 닫힘 가능) > - [2차: StarsAndI·GooseCouncil](./260316_임베딩_2차_StarsAndI_GooseCouncil_전환_계획.md) (열어둠) --- ## 상위 원칙 - [0_VALUE 임베딩 정책](../../../../0_VALUE/20_Governance/embedding-policy.md) - [로빙 문서 작성 원칙](../../book/300_architecture/312_writing-principles.md) - [임베딩 Gemini Embedding 2 전환 문제 오픈](../troubleshooting/260316_임베딩_Gemini_Embedding_2_전환_문제오픈.md) - [임베딩 전체 프로젝트 현황 및 SSOT 리서치](../research/rag/260316_임베딩_전체프로젝트_현황_및_SSOT_리서치.md) - [Gemini Embedding 2 리서치: 비용·청킹·도입 검토](../research/rag/260315_Gemini_Embedding_2_리서치_비용_청킹_도입검토.md) ## 상태 - planned ## 목표 - Gemini Embedding 2를 0_VALUE 정책에 따라 전수 교체합니다. - 멀티모달(이미지, PDF) 직접 임베딩으로 캡셔닝 파이프라인 비용·지연을 줄입니다. - 1차: robeing. 2차: StarsAndI·TheGooseCouncil (별도 플랜). ## 범위 ### 포함 - skill-embedding 또는 skill-rag-file에 Gemini Embedding 2 경로 추가 - NAS RAG·Company X RAG의 PDF·이미지 임베딩 경로 검토 - MRL 768d 유지 시 ChromaDB/pgvector 스키마 호환 - 청킹 전략 Macro-chunking(2,000~4,000 토큰) 검토 ### 제외 - rb8001 메모리 768/384 차원 드리프트 해결 (별도 이슈) ## 적용 순서 1. **품질·비용 테스트** - `rb8001/scripts/test_gemini_embedding_2.py` 확장 또는 별도 벤치마크 - 무료 티어로 PDF·이미지 임베딩 품질 비교 2. **경로 설계** - skill-embedding을 Gemini 2로 전환 vs skill-rag-file 내부 직접 Gemini API 호출 - [전체 프로젝트 현황 리서치](../research/rag/260316_임베딩_전체프로젝트_현황_및_SSOT_리서치.md) 참조 3. **스키마·청킹** - output_dimensionality=768 확정 시 기존 ChromaDB 호환 - 청킹 단위 2,000~4,000 토큰으로 확대 검토 4. **적용 및 검증** - NAS RAG 또는 Company X RAG 1개 경로에 먼저 적용 - Recall·비용 측정 후 확대 여부 결정 ## 검증 기준 - PDF·이미지 직접 임베딩 시 검색 Recall이 기존(캡셔닝 파이프라인) 대비 유지 또는 개선 - 1M 토큰 기준 비용이 예산 내 ($0.25 이하) - 기존 768d 컬렉션과 MRL 768d 호환 ## 플랜 분리 - **1차**: robeing (skill-embedding, skill-rag-file, rb8001). 빨리 닫을 수 있는 핵심 범위. - **2차**: StarsAndI, TheGooseCouncil. 별도 플랜으로 열기. ## 레포별 경계 - 1차: `robeing/skill-embedding`, `robeing/skill-rag-file`, `robeing/rb8001` (Company X, NAS RAG) - 문서: `robeing/DOCS`