From 66e3730fe13230e805146bdb49e08d0c2a20c910 Mon Sep 17 00:00:00 2001 From: happybell80 Date: Mon, 16 Mar 2026 13:15:12 +0900 Subject: [PATCH] =?UTF-8?q?docs:=20=EC=9E=84=EB=B2=A0=EB=94=A9=20=EC=A0=84?= =?UTF-8?q?=ED=99=98=20=EC=98=81=ED=96=A5=20=EB=B2=94=EC=9C=84=20=EC=A0=84?= =?UTF-8?q?=EC=88=98=20=ED=91=9C=EA=B8=B0?= MIME-Version: 1.0 Content-Type: text/plain; charset=UTF-8 Content-Transfer-Encoding: 8bit - 리서치 §3: robeing/StarsAndI/TheGooseCouncil/companyx/인프라/DB 상세 테이블 - 트러블슈팅: 영향 범위 요약 + 리서치 §3 링크 Made-with: Cursor --- ...프로젝트_현황_및_SSOT_리서치.md | 84 +++++++++++++++++-- ..._Gemini_Embedding_2_전환_문제오픈.md | 16 +++- 2 files changed, 88 insertions(+), 12 deletions(-) diff --git a/journey/research/rag/260316_임베딩_전체프로젝트_현황_및_SSOT_리서치.md b/journey/research/rag/260316_임베딩_전체프로젝트_현황_및_SSOT_리서치.md index 7f341e6..62d1a91 100644 --- a/journey/research/rag/260316_임베딩_전체프로젝트_현황_및_SSOT_리서치.md +++ b/journey/research/rag/260316_임베딩_전체프로젝트_현황_및_SSOT_리서치.md @@ -68,7 +68,73 @@ tags: [research, embedding, ssot, robeing, starsandi, goosecouncil, workspace] --- -## 3. 0_VALUE 정책과의 불일치 요약 +## 3. 영향 범위 (전수) + +### 3.1 robeing + +| 레포/서비스 | 파일/경로 | 영향 내용 | +|-------------|-----------|-----------| +| skill-embedding | 전체 | ONNX→Gemini 2 전환, /embed 엔드포인트, docker-compose, 포트 8515 | +| skill-embedding | ONNX 모델 경로 | ko-sroberta 제거 또는 보조 전환 | +| skill-rag-file | `app/services/embedding.py` | EmbeddingService 호출 경로 | +| skill-rag-file | `app/api/upload.py` | chromadb_client, embedding_service | +| skill-rag-file | `app/core/config.py` | EMBEDDING_SERVICE_URL | +| skill-rag-file | `docker-compose.yml` | EMBEDDING_SERVICE_URL | +| rb8001 | `app/core/config.py` | EMBEDDING_DIM, SKILL_EMBEDDING_URL | +| rb8001 | `app/state/database.py` | ChromaDB PersistentClient, memory_manager | +| rb8001 | `app/services/brain/intent_store.py` | intent_prototypes pgvector embedding | +| rb8001 | `docker-compose.yml` | SKILL_EMBEDDING_URL | +| rb8001 | `scripts/migrate_chromadb_collections.py` | ChromaDB 컬렉션 차원 마이그레이션 | +| rb8001 | `scripts/benchmark_emotion_accuracy.py` | skill-embedding /emotion (감정 분류, 임베딩과 별도) | +| rb8001 | `scripts/test_gemini_embedding_2.py` | 벤치마크 스크립트 | +| DOCS | `skills/companyx-rag/SKILL.md` | Default embedding path 384d 문서 | +| DOCS | `book/300_architecture/330_*.md` | ChromaDB 768차원 설계 문서 | + +### 3.2 StarsAndI + +| 레포/서비스 | 파일/경로 | 영향 내용 | +|-------------|-----------|-----------| +| StarsAndI | `apps/apps/api-py/app/services/recommend.py` | OpenAI → Gemini 또는 skill-embedding 호출 | +| StarsAndI | `apps/apps/api-py/app/repositories/usage_repository.py` | EMBEDDING_WHERE (로깅, 선택적) | + +### 3.3 TheGooseCouncil + +| 레포/서비스 | 파일/경로 | 영향 내용 | +|-------------|-----------|-----------| +| TheGooseCouncil | `tests/calibrate_value_model.py` | OPENAI_EMBEDDING_MODEL env | +| TheGooseCouncil | `tests/test_value_state_decision.py` | 동일 | +| TheGooseCouncil | `.env.local` | OPENAI_EMBEDDING_MODEL | + +### 3.4 companyx-knowledge-base + +| 레포/서비스 | 파일/경로 | 영향 내용 | +|-------------|-----------|-----------| +| companyx-knowledge-base | skill-rag-file 경유 | robeing 전환 시 연쇄 반영, 문서 갱신 | + +### 3.5 인프라·배포 + +| 레포/서비스 | 파일/경로 | 영향 내용 | +|-------------|-----------|-----------| +| ivada-infra | skill-embedding 배포, `.env.deploy` | 서비스 전환 시 배포 설정 | +| ivada-infra | 23/24 서버 docker compose | skill-embedding 8515 의존성 | +| workspace-config | (현재 없음) | 임베딩 키 추가 시 `EMBEDDING_*` | + +### 3.6 DB·스키마 + +| 대상 | 영향 내용 | +|------|-----------| +| ChromaDB | 컬렉션 dimension 768 통일, 기존 384 컬렉션 마이그레이션 | +| PostgreSQL | intent_prototypes.embedding 컬럼 (pgvector 768d) | +| skill-rag-file ChromaDB | Company X, NAS RAG 컬렉션 차원 | + +### 3.7 NAS RAG + +- skill-rag-file이 NAS 마운트 문서를 RAG 대상으로 사용. Company X RAG와 동일 skill-rag-file 경로. +- 영향: skill-rag-file 전환 시 NAS RAG 자동 반영. + +--- + +## 4. 0_VALUE 정책과의 불일치 요약 | 프로젝트 | 현재 | 0_VALUE 요구 | 불일치 | |----------|------|--------------|--------| @@ -79,20 +145,20 @@ tags: [research, embedding, ssot, robeing, starsandi, goosecouncil, workspace] --- -## 4. SSOT 설정 방안 +## 5. SSOT 설정 방안 -### 4.1 정책 SSOT (확정) +### 5.1 정책 SSOT (확정) - **위치**: `0_VALUE/02_Governance/embedding-policy.md` - **내용**: 모델(Gemini 2), 차원(768), 적용(전수 교체), 멀티모달 -### 4.2 런타임 SSOT (설정 가능) +### 5.2 런타임 SSOT (설정 가능) - **현재**: 프로젝트별 개별 설정 (skill-embedding URL, OpenAI API, .env 등) - **목표**: `workspace-config/runtime.env` 또는 동등한 공용 설정에 `EMBEDDING_MODEL`, `EMBEDDING_DIM`, `EMBEDDING_SERVICE_URL` 등 통합 - **전제**: [0_VALUE Infrastructure SSOT Principle](https://github.com/happybell80/0_VALUE/blob/main/02_Governance/infrastructure-ssot-principle.md) -### 4.3 적용 순서 +### 5.3 적용 순서 1. robeing: skill-embedding → Gemini 2 경로 전환, 768d 통일 2. skill-rag-file, rb8001: 새 임베딩 서비스/API 참조 @@ -101,7 +167,7 @@ tags: [research, embedding, ssot, robeing, starsandi, goosecouncil, workspace] --- -## 5. 사실(Facts) +## 6. 사실(Facts) - robeing skill-embedding은 ko-sroberta 768d, 포트 8515 - skill-rag-file은 `EMBEDDING_SERVICE_URL`로 skill-embedding 호출 @@ -111,7 +177,7 @@ tags: [research, embedding, ssot, robeing, starsandi, goosecouncil, workspace] --- -## 6. 해석(Interpretation) +## 7. 해석(Interpretation) - 전수 교체 시 robeing뿐 아니라 StarsAndI, TheGooseCouncil도 변경 대상 - 공용 skill-embedding이 Gemini 2로 전환되면, skill-rag-file·rb8001은 URL만 유지하고 모델은 자동 반영 @@ -119,7 +185,7 @@ tags: [research, embedding, ssot, robeing, starsandi, goosecouncil, workspace] --- -## 7. 미확정 항목(Unresolved) +## 8. 미확정 항목(Unresolved) - workspace-config에 임베딩 키를 넣을지, 프로젝트별 .env만 유지할지 - StarsAndI·TheGooseCouncil 전환 우선순위 및 일정 @@ -127,7 +193,7 @@ tags: [research, embedding, ssot, robeing, starsandi, goosecouncil, workspace] --- -## 8. 관련 문서 +## 9. 관련 문서 - [임베딩 Gemini Embedding 2 전환 문제 오픈](../../troubleshooting/260316_임베딩_Gemini_Embedding_2_전환_문제오픈.md) - [임베딩 Gemini Embedding 2 전환 계획](../../plans/260316_임베딩_Gemini_Embedding_2_전환_계획.md) diff --git a/journey/troubleshooting/260316_임베딩_Gemini_Embedding_2_전환_문제오픈.md b/journey/troubleshooting/260316_임베딩_Gemini_Embedding_2_전환_문제오픈.md index 21dc3e9..28831f7 100644 --- a/journey/troubleshooting/260316_임베딩_Gemini_Embedding_2_전환_문제오픈.md +++ b/journey/troubleshooting/260316_임베딩_Gemini_Embedding_2_전환_문제오픈.md @@ -51,9 +51,19 @@ tags: [troubleshooting, embedding, gemini, rag, robeing] ## 영향 범위 -- skill-embedding, skill-rag-file, rb8001 메모리, NAS RAG, Company X RAG -- ChromaDB·pgvector 스키마 및 청킹 전략 -- 0_VALUE 정책을 따르는 모든 프로젝트 +**robeing**: skill-embedding(전체, /embed), skill-rag-file(embedding.py, upload.py, config), rb8001(memory_manager, intent_store, database.py, docker-compose), ChromaDB 컬렉션, intent_prototypes pgvector, migrate_chromadb_collections.py, DOCS/skills/companyx-rag, 330_백엔드 설계 문서 + +**StarsAndI**: recommend.py, usage_repository.py + +**TheGooseCouncil**: calibrate_value_model.py, test_value_state_decision.py, .env.local + +**companyx-knowledge-base**: skill-rag-file 경유 연쇄 반영 + +**인프라**: ivada-infra skill-embedding 배포, 23/24 서버 docker, workspace-config(추가 시) + +**DB·스키마**: ChromaDB dimension, PostgreSQL intent_prototypes.embedding, NAS RAG 컬렉션 + +전수 목록: [임베딩 전체 프로젝트 현황 및 SSOT 리서치 §3 영향 범위](../research/rag/260316_임베딩_전체프로젝트_현황_및_SSOT_리서치.md#3-영향-범위-전수) ## 재현 조건