- 5.4절 추가: IR 평가 품질 개선 효과 분석 - 현재 문제: PDF 추출 실패 시 evidence_count=0으로 신뢰도 0.6 고정 - 개선 효과: 한글 OCR 안정 처리로 신뢰도 0.7~0.8 상승 - 실무 제약: 48시간 제한으로 하이브리드 병행 운영 권장 - 참고 코드: startup_valuation.py, text_extractor.py, upload.py
- PDF/TXT 파일 처리 성능 테스트 결과 - 콜드메일 워크플로우 적용 분석 - 48시간 제한으로 전면 교체 비권장 - 하이브리드 아키텍처 또는 선택적 활용 제안 - 테스트 환경: 51124 서버, 2.06MB PDF 13.77초 색인 완료