From 75f2a850e422bdfa4022d50a5ffb29b5584f2b12 Mon Sep 17 00:00:00 2001 From: happybell80 Date: Tue, 14 Oct 2025 16:05:22 +0900 Subject: [PATCH] =?UTF-8?q?docs:=20coldmail=20DB=20=ED=85=8C=EC=9D=B4?= =?UTF-8?q?=EB=B8=94=20=EA=B5=AC=EC=A1=B0=20=EC=83=81=EC=84=B8=ED=99=94?= MIME-Version: 1.0 Content-Type: text/plain; charset=UTF-8 Content-Transfer-Encoding: 8bit - coldmail_embedding_clusters 스키마 명시: UUID PRIMARY KEY, VECTOR(384) - 초기 데이터: coldmail/normal centroid 2개 (coldmail_classifier 56단어 기반) - 목적 명확화: 의미 유사도 비교용 정적 참조점 (학습 안함) - coldmail_classifier와 독립: 단어 빈도(동적) vs 벡터 중심점(정적), 서로 참조 없음 - 서버 위치: 51123 (기존 coldmail_classifier와 동일) 🤖 Generated with [Claude Code](https://claude.com/claude-code) Co-Authored-By: Claude --- .../251014_claude_coldmail_filter_tokenization_issue.md | 9 ++++++--- 1 file changed, 6 insertions(+), 3 deletions(-) diff --git a/troubleshooting/251014_claude_coldmail_filter_tokenization_issue.md b/troubleshooting/251014_claude_coldmail_filter_tokenization_issue.md index 9ca5be7..54ac116 100644 --- a/troubleshooting/251014_claude_coldmail_filter_tokenization_issue.md +++ b/troubleshooting/251014_claude_coldmail_filter_tokenization_issue.md @@ -47,9 +47,12 @@ - is_coldmail_by_embedding(): threshold 0.6 - **환경변수**: SKILL_EMBEDDING_URL (emotion_classifier.py:9, embedding_client.py:14 참고) -**DB**: coldmail_embedding_clusters 테이블 -- pgvector extension 설치 필요: CREATE EXTENSION IF NOT EXISTS vector; -- 컬럼: id, embedding VECTOR(384), label TEXT, created_at TIMESTAMP +**DB**: coldmail_embedding_clusters 테이블 (51123 서버) +- pgvector extension 설치: CREATE EXTENSION IF NOT EXISTS vector; +- 스키마: id UUID PRIMARY KEY, embedding VECTOR(384), label TEXT, created_at TIMESTAMP +- 초기 데이터: coldmail centroid 1개 + normal centroid 1개 (기존 coldmail_classifier 56단어 기반 계산) +- 목적: 의미 유사도 비교용 클러스터 중심점 저장 (학습 안함, 정적 참조) +- 기존 테이블과 독립: coldmail_classifier는 단어 빈도 학습용(동적), 서로 참조 없음 ### Phase 2: Gemini LLM 분류기 (2h) **신규**: app/services/coldmail_llm_classifier.py