docs: 임베딩 전환 영향 범위 전수 표기

- 리서치 §3: robeing/StarsAndI/TheGooseCouncil/companyx/인프라/DB 상세 테이블
- 트러블슈팅: 영향 범위 요약 + 리서치 §3 링크

Made-with: Cursor
This commit is contained in:
happybell80 2026-03-16 13:15:12 +09:00
parent 6e5c439a49
commit 66e3730fe1
2 changed files with 88 additions and 12 deletions

View File

@ -68,7 +68,73 @@ tags: [research, embedding, ssot, robeing, starsandi, goosecouncil, workspace]
---
## 3. 0_VALUE 정책과의 불일치 요약
## 3. 영향 범위 (전수)
### 3.1 robeing
| 레포/서비스 | 파일/경로 | 영향 내용 |
|-------------|-----------|-----------|
| skill-embedding | 전체 | ONNX→Gemini 2 전환, /embed 엔드포인트, docker-compose, 포트 8515 |
| skill-embedding | ONNX 모델 경로 | ko-sroberta 제거 또는 보조 전환 |
| skill-rag-file | `app/services/embedding.py` | EmbeddingService 호출 경로 |
| skill-rag-file | `app/api/upload.py` | chromadb_client, embedding_service |
| skill-rag-file | `app/core/config.py` | EMBEDDING_SERVICE_URL |
| skill-rag-file | `docker-compose.yml` | EMBEDDING_SERVICE_URL |
| rb8001 | `app/core/config.py` | EMBEDDING_DIM, SKILL_EMBEDDING_URL |
| rb8001 | `app/state/database.py` | ChromaDB PersistentClient, memory_manager |
| rb8001 | `app/services/brain/intent_store.py` | intent_prototypes pgvector embedding |
| rb8001 | `docker-compose.yml` | SKILL_EMBEDDING_URL |
| rb8001 | `scripts/migrate_chromadb_collections.py` | ChromaDB 컬렉션 차원 마이그레이션 |
| rb8001 | `scripts/benchmark_emotion_accuracy.py` | skill-embedding /emotion (감정 분류, 임베딩과 별도) |
| rb8001 | `scripts/test_gemini_embedding_2.py` | 벤치마크 스크립트 |
| DOCS | `skills/companyx-rag/SKILL.md` | Default embedding path 384d 문서 |
| DOCS | `book/300_architecture/330_*.md` | ChromaDB 768차원 설계 문서 |
### 3.2 StarsAndI
| 레포/서비스 | 파일/경로 | 영향 내용 |
|-------------|-----------|-----------|
| StarsAndI | `apps/apps/api-py/app/services/recommend.py` | OpenAI → Gemini 또는 skill-embedding 호출 |
| StarsAndI | `apps/apps/api-py/app/repositories/usage_repository.py` | EMBEDDING_WHERE (로깅, 선택적) |
### 3.3 TheGooseCouncil
| 레포/서비스 | 파일/경로 | 영향 내용 |
|-------------|-----------|-----------|
| TheGooseCouncil | `tests/calibrate_value_model.py` | OPENAI_EMBEDDING_MODEL env |
| TheGooseCouncil | `tests/test_value_state_decision.py` | 동일 |
| TheGooseCouncil | `.env.local` | OPENAI_EMBEDDING_MODEL |
### 3.4 companyx-knowledge-base
| 레포/서비스 | 파일/경로 | 영향 내용 |
|-------------|-----------|-----------|
| companyx-knowledge-base | skill-rag-file 경유 | robeing 전환 시 연쇄 반영, 문서 갱신 |
### 3.5 인프라·배포
| 레포/서비스 | 파일/경로 | 영향 내용 |
|-------------|-----------|-----------|
| ivada-infra | skill-embedding 배포, `.env.deploy` | 서비스 전환 시 배포 설정 |
| ivada-infra | 23/24 서버 docker compose | skill-embedding 8515 의존성 |
| workspace-config | (현재 없음) | 임베딩 키 추가 시 `EMBEDDING_*` |
### 3.6 DB·스키마
| 대상 | 영향 내용 |
|------|-----------|
| ChromaDB | 컬렉션 dimension 768 통일, 기존 384 컬렉션 마이그레이션 |
| PostgreSQL | intent_prototypes.embedding 컬럼 (pgvector 768d) |
| skill-rag-file ChromaDB | Company X, NAS RAG 컬렉션 차원 |
### 3.7 NAS RAG
- skill-rag-file이 NAS 마운트 문서를 RAG 대상으로 사용. Company X RAG와 동일 skill-rag-file 경로.
- 영향: skill-rag-file 전환 시 NAS RAG 자동 반영.
---
## 4. 0_VALUE 정책과의 불일치 요약
| 프로젝트 | 현재 | 0_VALUE 요구 | 불일치 |
|----------|------|--------------|--------|
@ -79,20 +145,20 @@ tags: [research, embedding, ssot, robeing, starsandi, goosecouncil, workspace]
---
## 4. SSOT 설정 방안
## 5. SSOT 설정 방안
### 4.1 정책 SSOT (확정)
### 5.1 정책 SSOT (확정)
- **위치**: `0_VALUE/02_Governance/embedding-policy.md`
- **내용**: 모델(Gemini 2), 차원(768), 적용(전수 교체), 멀티모달
### 4.2 런타임 SSOT (설정 가능)
### 5.2 런타임 SSOT (설정 가능)
- **현재**: 프로젝트별 개별 설정 (skill-embedding URL, OpenAI API, .env 등)
- **목표**: `workspace-config/runtime.env` 또는 동등한 공용 설정에 `EMBEDDING_MODEL`, `EMBEDDING_DIM`, `EMBEDDING_SERVICE_URL` 등 통합
- **전제**: [0_VALUE Infrastructure SSOT Principle](https://github.com/happybell80/0_VALUE/blob/main/02_Governance/infrastructure-ssot-principle.md)
### 4.3 적용 순서
### 5.3 적용 순서
1. robeing: skill-embedding → Gemini 2 경로 전환, 768d 통일
2. skill-rag-file, rb8001: 새 임베딩 서비스/API 참조
@ -101,7 +167,7 @@ tags: [research, embedding, ssot, robeing, starsandi, goosecouncil, workspace]
---
## 5. 사실(Facts)
## 6. 사실(Facts)
- robeing skill-embedding은 ko-sroberta 768d, 포트 8515
- skill-rag-file은 `EMBEDDING_SERVICE_URL`로 skill-embedding 호출
@ -111,7 +177,7 @@ tags: [research, embedding, ssot, robeing, starsandi, goosecouncil, workspace]
---
## 6. 해석(Interpretation)
## 7. 해석(Interpretation)
- 전수 교체 시 robeing뿐 아니라 StarsAndI, TheGooseCouncil도 변경 대상
- 공용 skill-embedding이 Gemini 2로 전환되면, skill-rag-file·rb8001은 URL만 유지하고 모델은 자동 반영
@ -119,7 +185,7 @@ tags: [research, embedding, ssot, robeing, starsandi, goosecouncil, workspace]
---
## 7. 미확정 항목(Unresolved)
## 8. 미확정 항목(Unresolved)
- workspace-config에 임베딩 키를 넣을지, 프로젝트별 .env만 유지할지
- StarsAndI·TheGooseCouncil 전환 우선순위 및 일정
@ -127,7 +193,7 @@ tags: [research, embedding, ssot, robeing, starsandi, goosecouncil, workspace]
---
## 8. 관련 문서
## 9. 관련 문서
- [임베딩 Gemini Embedding 2 전환 문제 오픈](../../troubleshooting/260316_임베딩_Gemini_Embedding_2_전환_문제오픈.md)
- [임베딩 Gemini Embedding 2 전환 계획](../../plans/260316_임베딩_Gemini_Embedding_2_전환_계획.md)

View File

@ -51,9 +51,19 @@ tags: [troubleshooting, embedding, gemini, rag, robeing]
## 영향 범위
- skill-embedding, skill-rag-file, rb8001 메모리, NAS RAG, Company X RAG
- ChromaDB·pgvector 스키마 및 청킹 전략
- 0_VALUE 정책을 따르는 모든 프로젝트
**robeing**: skill-embedding(전체, /embed), skill-rag-file(embedding.py, upload.py, config), rb8001(memory_manager, intent_store, database.py, docker-compose), ChromaDB 컬렉션, intent_prototypes pgvector, migrate_chromadb_collections.py, DOCS/skills/companyx-rag, 330_백엔드 설계 문서
**StarsAndI**: recommend.py, usage_repository.py
**TheGooseCouncil**: calibrate_value_model.py, test_value_state_decision.py, .env.local
**companyx-knowledge-base**: skill-rag-file 경유 연쇄 반영
**인프라**: ivada-infra skill-embedding 배포, 23/24 서버 docker, workspace-config(추가 시)
**DB·스키마**: ChromaDB dimension, PostgreSQL intent_prototypes.embedding, NAS RAG 컬렉션
전수 목록: [임베딩 전체 프로젝트 현황 및 SSOT 리서치 §3 영향 범위](../research/rag/260316_임베딩_전체프로젝트_현황_및_SSOT_리서치.md#3-영향-범위-전수)
## 재현 조건