--- tags: [plans, embedding, gemini, rag, robeing, 1차] --- # 임베딩 1차: 로빙 Gemini 2 전환 계획 ## 상위 원칙 - [0_VALUE 임베딩 정책](https://github.com/happybell80/0_VALUE/blob/main/02_Governance/embedding-policy.md) - [임베딩 1차 로빙 Gemini 2 전환 문제 오픈](../troubleshooting/260316_임베딩_1차_로빙_Gemini2_전환_문제오픈.md) - [임베딩 1차 로빙 현황 및 SSOT 리서치](../research/rag/260316_임베딩_1차_로빙_현황_SSOT_리서치.md) ## 상태 - planned ## 목표 - 로빙(skill-embedding, skill-rag-file, rb8001)을 Gemini Embedding 2, 768d로 전환한다. - 멀티모달(이미지, PDF) 직접 임베딩을 지원한다. - 1차 완료 시 해당 문제·리서치·플랜을 완전히 닫는다. ## 범위 ### 포함 - skill-embedding → Gemini 2 전환 또는 skill-rag-file 내부 직접 Gemini API 호출 - NAS RAG·Company X RAG PDF·이미지 임베딩 경로 - MRL 768d, ChromaDB/pgvector 스키마 호환 - 청킹 Macro-chunking(2,000~4,000 토큰) 검토 ### 제외 - rb8001 메모리 768/384 차원 드리프트 (별도 이슈) - StarsAndI, TheGooseCouncil (2차 플랜) ## env SSOT - `workspace-config/runtime.env`: `EMBEDDING_SERVICE_URL`, `EMBEDDING_DIM` — [0_VALUE embedding-policy](https://github.com/happybell80/0_VALUE/blob/main/02_Governance/embedding-policy.md) ## 적용 순서 1. 품질·비용 테스트 (`test_gemini_embedding_2.py` 확장) 2. 경로 설계 (skill-embedding vs skill-rag-file 직접 호출) 3. 스키마·청킹 (output_dimensionality=768) 4. 적용 및 검증 (Company X RAG 또는 NAS RAG 1개 경로) 5. worklog 작성 후 닫힘 선언 ## 검증 기준 (닫힘 조건) - skill-embedding 또는 skill-rag-file이 Gemini 2, 768d로 동작 - rb8001이 새 임베딩 경로 참조 - ChromaDB·pgvector 768d 통일 - Company X RAG, NAS RAG 새 경로 동작 - PDF·이미지 직접 임베딩 Recall 유지 또는 개선 - 1M 토큰 비용 $0.25 이하 ## 닫힘 선언 - worklog에서만 선언한다. - 본 문서 상태를 `completed`로 갱신하고 worklog 링크를 추가한다. ## 관련 문서 - [임베딩 2차 StarsAndI·GooseCouncil 전환 계획](./260316_임베딩_2차_StarsAndI_GooseCouncil_전환_계획.md)