docs: 콜드메일 리스트 현황 기록, OCR fallback 자동 동작 명시

Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>
This commit is contained in:
happybell80 2026-03-21 11:01:50 +09:00
parent 67e33826c2
commit 2d1503921d
2 changed files with 8 additions and 0 deletions

View File

@ -35,6 +35,7 @@ RAG(Retrieval-Augmented Generation) 파일 처리 스킬. 포트 8508.
- 모델: `OCR_MODEL=gemini-2.0-flash` (runtime.env SSOT)
- 용도: 이미지 기반 PDF 텍스트 추출 (text_length 부족 시 선별 적용)
- 벤치마크: 3.4초/페이지, 2.3초/MB — 속도+품질 최적 ([리서치](../../journey/research/rag/260320_OCR_모델_벤치마크_리서치.md))
- IR덱 평가 시 텍스트 추출 실패 → OCR fallback 자동 동작 (`ir_deck_workflow.py`)
## 환경변수

View File

@ -76,6 +76,13 @@ Slack 통합 스킬. 포트 8502.
| `ir_deck_page_evaluations` | 장표별 page_number, score, strengths[], weaknesses[], page_topic |
| `coldmail_memory_email` | evaluation_id, document_id, ir_deck_path, robeing_evaluation |
### 현황 (260320)
- 슬랙 리스트: 57건 (고유 53개 회사), 전건 평가 완료
- DB(`coldmail_memory_email`): 60건 (테스트 3건 포함), 59건 평가+문서 연결
- 중복 기업: 에듀온(3), 누리광장(2), 담을거야(2), NAVER(2)
- OCR fallback 적용: 이미지 기반 PDF도 Gemini 2.0 Flash로 평가 가능
### 확인 방법
```bash