diff --git a/troubleshooting/251014_claude_coldmail_filter_tokenization_issue.md b/troubleshooting/251014_claude_coldmail_filter_tokenization_issue.md index 54ac116..64dd6ce 100644 --- a/troubleshooting/251014_claude_coldmail_filter_tokenization_issue.md +++ b/troubleshooting/251014_claude_coldmail_filter_tokenization_issue.md @@ -48,9 +48,9 @@ - **환경변수**: SKILL_EMBEDDING_URL (emotion_classifier.py:9, embedding_client.py:14 참고) **DB**: coldmail_embedding_clusters 테이블 (51123 서버) -- pgvector extension 설치: CREATE EXTENSION IF NOT EXISTS vector; -- 스키마: id UUID PRIMARY KEY, embedding VECTOR(384), label TEXT, created_at TIMESTAMP -- 초기 데이터: coldmail centroid 1개 + normal centroid 1개 (기존 coldmail_classifier 56단어 기반 계산) +- ✅ pgvector extension 설치 완료 +- ✅ 스키마: id UUID PRIMARY KEY, embedding VECTOR(384), label TEXT, created_at TIMESTAMP +- ✅ 초기 데이터: coldmail centroid(36단어 평균) + normal centroid(20단어 평균), 각 384차원 - 목적: 의미 유사도 비교용 클러스터 중심점 저장 (학습 안함, 정적 참조) - 기존 테이블과 독립: coldmail_classifier는 단어 빈도 학습용(동적), 서로 참조 없음