docs: StarsAndI 임베딩 상세 리서치 반영

- §2.2: 카탈로그 5044개, add_star_embeddings.py, 153MB JSON
- §3.2: 영향 파일 전수 (recommend, add_star_embeddings, time_recommend_*)
- 사실/해석/미확정: 카탈로그 재임베딩, 비용
- 트러블 영향 범위: StarsAndI 상세 추가

Made-with: Cursor
This commit is contained in:
happybell80 2026-03-16 13:17:24 +09:00
parent 66e3730fe1
commit db277adeae
2 changed files with 27 additions and 7 deletions

View File

@ -35,10 +35,22 @@ tags: [research, embedding, ssot, robeing, starsandi, goosecouncil, workspace]
| 구성요소 | 모델/경로 | 차원 | 비고 |
|----------|-----------|------|------|
| recommend.py | OpenAI text-embedding-3-small | 1536 | 직접 API 호출 |
| recommend.py | OpenAI text-embedding-3-small | 1536 | 사용자 발화 임베딩, 직접 API 호출 |
| 카탈로그 임베딩 | `candidates_merged_projection_embeddings_v1.json` | 1536 | 5044개 별, 153MB, .gitignore |
| add_star_embeddings.py | OpenAI text-embedding-3-small | 1536 | 카탈로그 임베딩 생성 스크립트 |
**경로**: `StarsAndI/apps/apps/api-py/app/services/recommend.py`
**엔드포인트**: `https://api.openai.com/v1/embeddings`
**용도**: 별 추천. 사용자 발화 임베딩 ↔ 카탈로그 임베딩 cosine 유사도 → 티어별 상위 K개 → LLM 최종 선택.
**경로**:
- `StarsAndI/apps/apps/api-py/app/services/recommend.py` (`_embed_text`, `_top_k_by_embedding`, `len(emb)==1536` 하드코딩)
- `StarsAndI/DATA/scripts/add_star_embeddings.py`
- `StarsAndI/DATA/prompts/recommend/manifest_v1.json``candidate_projection_embeddings`
- `StarsAndI/apps/apps/api-py/scripts/time_recommend_stages.py`, `time_recommend_tiers.py`
**0_VALUE 전환 시**:
- `_embed_text()` → Gemini API 또는 skill-embedding 호출, `len(emb)==768` 변경
- `add_star_embeddings.py` → Gemini 2로 변경, 카탈로그 5044개 전체 재임베딩
- 카탈로그 JSON 153MB 재생성 필요
### 2.3 TheGooseCouncil
@ -94,8 +106,13 @@ tags: [research, embedding, ssot, robeing, starsandi, goosecouncil, workspace]
| 레포/서비스 | 파일/경로 | 영향 내용 |
|-------------|-----------|-----------|
| StarsAndI | `apps/apps/api-py/app/services/recommend.py` | OpenAI → Gemini 또는 skill-embedding 호출 |
| StarsAndI | `apps/apps/api-py/app/services/recommend.py` | `_embed_text()` Gemini/skill-embedding 호출, `len(emb)==768` 변경 |
| StarsAndI | `DATA/scripts/add_star_embeddings.py` | 카탈로그 임베딩 생성 → Gemini 2로 전환 |
| StarsAndI | `DATA/prompts/recommend/candidates_merged_projection_embeddings_v1.json` | 5044개 768d로 재생성 (153MB) |
| StarsAndI | `apps/apps/api-py/scripts/time_recommend_stages.py` | `_embed_text`, `_top_k_by_embedding` 사용 |
| StarsAndI | `apps/apps/api-py/scripts/time_recommend_tiers.py` | 동일 |
| StarsAndI | `apps/apps/api-py/app/repositories/usage_repository.py` | EMBEDDING_WHERE (로깅, 선택적) |
| StarsAndI | `DOCS/03_Architecture/Recommend_Pipeline.md` | 임베딩 카탈로그 153MB, add_star_embeddings 문서 |
### 3.3 TheGooseCouncil
@ -171,7 +188,8 @@ tags: [research, embedding, ssot, robeing, starsandi, goosecouncil, workspace]
- robeing skill-embedding은 ko-sroberta 768d, 포트 8515
- skill-rag-file은 `EMBEDDING_SERVICE_URL`로 skill-embedding 호출
- StarsAndI, TheGooseCouncil는 OpenAI text-embedding-3-small 직접 호출
- StarsAndI는 OpenAI text-embedding-3-small (사용자 발화 + 카탈로그 5044개), 1536d, `add_star_embeddings.py`로 카탈로그 생성
- TheGooseCouncil는 OpenAI text-embedding-3-small 직접 호출
- 0_VALUE 임베딩 정책은 Gemini 2, 768d, 전수 교체, 멀티모달로 확정
- workspace-config에는 현재 임베딩 관련 키 없음
@ -181,7 +199,8 @@ tags: [research, embedding, ssot, robeing, starsandi, goosecouncil, workspace]
- 전수 교체 시 robeing뿐 아니라 StarsAndI, TheGooseCouncil도 변경 대상
- 공용 skill-embedding이 Gemini 2로 전환되면, skill-rag-file·rb8001은 URL만 유지하고 모델은 자동 반영
- StarsAndI·TheGooseCouncil는 API 경로 변경(OpenAI → Gemini 또는 skill-embedding) 필요
- StarsAndI는 API 경로 변경 + 카탈로그 5044개 전체 재임베딩 필요 (153MB JSON 재생성)
- TheGooseCouncil는 API 경로 변경(OpenAI → Gemini 또는 skill-embedding) 필요
---
@ -189,6 +208,7 @@ tags: [research, embedding, ssot, robeing, starsandi, goosecouncil, workspace]
- workspace-config에 임베딩 키를 넣을지, 프로젝트별 .env만 유지할지
- StarsAndI·TheGooseCouncil 전환 우선순위 및 일정
- StarsAndI 카탈로그 재임베딩 비용 (5044 × 평균 토큰 × $0.25/1M)
- goosefarminvesting pgvector 용도 (임베딩 vs 공간 데이터)
---

View File

@ -53,7 +53,7 @@ tags: [troubleshooting, embedding, gemini, rag, robeing]
**robeing**: skill-embedding(전체, /embed), skill-rag-file(embedding.py, upload.py, config), rb8001(memory_manager, intent_store, database.py, docker-compose), ChromaDB 컬렉션, intent_prototypes pgvector, migrate_chromadb_collections.py, DOCS/skills/companyx-rag, 330_백엔드 설계 문서
**StarsAndI**: recommend.py, usage_repository.py
**StarsAndI**: recommend.py, add_star_embeddings.py, 카탈로그 5044개 재임베딩(153MB), time_recommend_*.py, usage_repository.py
**TheGooseCouncil**: calibrate_value_model.py, test_value_state_decision.py, .env.local