docs: 콜드메일 리스트 현황 기록, OCR fallback 자동 동작 명시
Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>
This commit is contained in:
parent
67e33826c2
commit
2d1503921d
@ -35,6 +35,7 @@ RAG(Retrieval-Augmented Generation) 파일 처리 스킬. 포트 8508.
|
||||
- 모델: `OCR_MODEL=gemini-2.0-flash` (runtime.env SSOT)
|
||||
- 용도: 이미지 기반 PDF 텍스트 추출 (text_length 부족 시 선별 적용)
|
||||
- 벤치마크: 3.4초/페이지, 2.3초/MB — 속도+품질 최적 ([리서치](../../journey/research/rag/260320_OCR_모델_벤치마크_리서치.md))
|
||||
- IR덱 평가 시 텍스트 추출 실패 → OCR fallback 자동 동작 (`ir_deck_workflow.py`)
|
||||
|
||||
## 환경변수
|
||||
|
||||
|
||||
@ -76,6 +76,13 @@ Slack 통합 스킬. 포트 8502.
|
||||
| `ir_deck_page_evaluations` | 장표별 page_number, score, strengths[], weaknesses[], page_topic |
|
||||
| `coldmail_memory_email` | evaluation_id, document_id, ir_deck_path, robeing_evaluation |
|
||||
|
||||
### 현황 (260320)
|
||||
|
||||
- 슬랙 리스트: 57건 (고유 53개 회사), 전건 평가 완료
|
||||
- DB(`coldmail_memory_email`): 60건 (테스트 3건 포함), 59건 평가+문서 연결
|
||||
- 중복 기업: 에듀온(3), 누리광장(2), 담을거야(2), NAVER(2)
|
||||
- OCR fallback 적용: 이미지 기반 PDF도 Gemini 2.0 Flash로 평가 가능
|
||||
|
||||
### 확인 방법
|
||||
|
||||
```bash
|
||||
|
||||
Loading…
x
Reference in New Issue
Block a user