SSOT는 로컬 0_VALUE/. GitHub URL은 복사본 참조로 SSOT 원칙 위반. 02_Governance는 존재하지 않는 구 경로로 전부 깨진 링크. Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>
3.1 KiB
3.1 KiB
status, closed_date, closed_reason, tags
| status | closed_date | closed_reason | tags | ||||||
|---|---|---|---|---|---|---|---|---|---|
| closed | 2026-03-21 | 260320 다형식문서 RAG 계획으로 흡수 또는 구현 완료 |
|
status: closed closed_date: 2026-03-21 closed_reason: 260320 다형식문서 RAG 계획으로 흡수 또는 구현 완료
임베딩 Gemini Embedding 2 전환 계획
1차·2차로 분리됨.
- 1차: 로빙 (완전 닫힘 가능)
- 2차: StarsAndI·GooseCouncil (열어둠)
상위 원칙
- 0_VALUE 임베딩 정책
- 로빙 문서 작성 원칙
- 임베딩 Gemini Embedding 2 전환 문제 오픈
- 임베딩 전체 프로젝트 현황 및 SSOT 리서치
- Gemini Embedding 2 리서치: 비용·청킹·도입 검토
상태
- planned
목표
- Gemini Embedding 2를 0_VALUE 정책에 따라 전수 교체합니다.
- 멀티모달(이미지, PDF) 직접 임베딩으로 캡셔닝 파이프라인 비용·지연을 줄입니다.
- 1차: robeing. 2차: StarsAndI·TheGooseCouncil (별도 플랜).
범위
포함
- skill-embedding 또는 skill-rag-file에 Gemini Embedding 2 경로 추가
- NAS RAG·Company X RAG의 PDF·이미지 임베딩 경로 검토
- MRL 768d 유지 시 ChromaDB/pgvector 스키마 호환
- 청킹 전략 Macro-chunking(2,000~4,000 토큰) 검토
제외
- rb8001 메모리 768/384 차원 드리프트 해결 (별도 이슈)
적용 순서
- 품질·비용 테스트
rb8001/scripts/test_gemini_embedding_2.py확장 또는 별도 벤치마크- 무료 티어로 PDF·이미지 임베딩 품질 비교
- 경로 설계
- skill-embedding을 Gemini 2로 전환 vs skill-rag-file 내부 직접 Gemini API 호출
- 전체 프로젝트 현황 리서치 참조
- 스키마·청킹
- output_dimensionality=768 확정 시 기존 ChromaDB 호환
- 청킹 단위 2,000~4,000 토큰으로 확대 검토
- 적용 및 검증
- NAS RAG 또는 Company X RAG 1개 경로에 먼저 적용
- Recall·비용 측정 후 확대 여부 결정
검증 기준
- PDF·이미지 직접 임베딩 시 검색 Recall이 기존(캡셔닝 파이프라인) 대비 유지 또는 개선
- 1M 토큰 기준 비용이 예산 내 ($0.25 이하)
- 기존 768d 컬렉션과 MRL 768d 호환
플랜 분리
- 1차: robeing (skill-embedding, skill-rag-file, rb8001). 빨리 닫을 수 있는 핵심 범위.
- 2차: StarsAndI, TheGooseCouncil. 별도 플랜으로 열기.
레포별 경계
- 1차:
robeing/skill-embedding,robeing/skill-rag-file,robeing/rb8001(Company X, NAS RAG) - 문서:
robeing/DOCS