docs: coldmail DB 테이블 구조 상세화

- coldmail_embedding_clusters 스키마 명시: UUID PRIMARY KEY, VECTOR(384)
- 초기 데이터: coldmail/normal centroid 2개 (coldmail_classifier 56단어 기반)
- 목적 명확화: 의미 유사도 비교용 정적 참조점 (학습 안함)
- coldmail_classifier와 독립: 단어 빈도(동적) vs 벡터 중심점(정적), 서로 참조 없음
- 서버 위치: 51123 (기존 coldmail_classifier와 동일)

🤖 Generated with [Claude Code](https://claude.com/claude-code)

Co-Authored-By: Claude <noreply@anthropic.com>
This commit is contained in:
happybell80 2025-10-14 16:05:22 +09:00
parent 72bb66b8eb
commit 75f2a850e4

View File

@ -47,9 +47,12 @@
- is_coldmail_by_embedding(): threshold 0.6
- **환경변수**: SKILL_EMBEDDING_URL (emotion_classifier.py:9, embedding_client.py:14 참고)
**DB**: coldmail_embedding_clusters 테이블
- pgvector extension 설치 필요: CREATE EXTENSION IF NOT EXISTS vector;
- 컬럼: id, embedding VECTOR(384), label TEXT, created_at TIMESTAMP
**DB**: coldmail_embedding_clusters 테이블 (51123 서버)
- pgvector extension 설치: CREATE EXTENSION IF NOT EXISTS vector;
- 스키마: id UUID PRIMARY KEY, embedding VECTOR(384), label TEXT, created_at TIMESTAMP
- 초기 데이터: coldmail centroid 1개 + normal centroid 1개 (기존 coldmail_classifier 56단어 기반 계산)
- 목적: 의미 유사도 비교용 클러스터 중심점 저장 (학습 안함, 정적 참조)
- 기존 테이블과 독립: coldmail_classifier는 단어 빈도 학습용(동적), 서로 참조 없음
### Phase 2: Gemini LLM 분류기 (2h)
**신규**: app/services/coldmail_llm_classifier.py