1차 (로빙, 완전 닫힘 가능): - 트러블, 리서치, 플랜 - skill-embedding, skill-rag-file, rb8001 - 닫힘 조건 명확 2차 (StarsAndI·GooseCouncil, 열어둠): - 트러블, 리서치, 플랜 - 카탈로그 5044개 재임베딩 등 비용 큰 항목 - 1차 완료 후 진행 기존 3개 문서: 1차·2차 링크로 리다이렉트 Made-with: Cursor
2.0 KiB
2.0 KiB
tags
| tags | ||||||
|---|---|---|---|---|---|---|
|
임베딩 1차: 로빙 Gemini 2 전환 계획
상위 원칙
상태
- planned
목표
- 로빙(skill-embedding, skill-rag-file, rb8001)을 Gemini Embedding 2, 768d로 전환한다.
- 멀티모달(이미지, PDF) 직접 임베딩을 지원한다.
- 1차 완료 시 해당 문제·리서치·플랜을 완전히 닫는다.
범위
포함
- skill-embedding → Gemini 2 전환 또는 skill-rag-file 내부 직접 Gemini API 호출
- NAS RAG·Company X RAG PDF·이미지 임베딩 경로
- MRL 768d, ChromaDB/pgvector 스키마 호환
- 청킹 Macro-chunking(2,000~4,000 토큰) 검토
제외
- rb8001 메모리 768/384 차원 드리프트 (별도 이슈)
- StarsAndI, TheGooseCouncil (2차 플랜)
적용 순서
- 품질·비용 테스트 (
test_gemini_embedding_2.py확장) - 경로 설계 (skill-embedding vs skill-rag-file 직접 호출)
- 스키마·청킹 (output_dimensionality=768)
- 적용 및 검증 (Company X RAG 또는 NAS RAG 1개 경로)
- worklog 작성 후 닫힘 선언
검증 기준 (닫힘 조건)
- skill-embedding 또는 skill-rag-file이 Gemini 2, 768d로 동작
- rb8001이 새 임베딩 경로 참조
- ChromaDB·pgvector 768d 통일
- Company X RAG, NAS RAG 새 경로 동작
- PDF·이미지 직접 임베딩 Recall 유지 또는 개선
- 1M 토큰 비용 $0.25 이하
닫힘 선언
- worklog에서만 선언한다.
- 본 문서 상태를
completed로 갱신하고 worklog 링크를 추가한다.