From 6268e13b70735c77d1ba35812225c1b089a99be1 Mon Sep 17 00:00:00 2001 From: happybell80 Date: Tue, 14 Oct 2025 01:30:56 +0900 Subject: [PATCH] =?UTF-8?q?docs:=20=EC=BD=9C=EB=93=9C=EB=A9=94=EC=9D=BC=20?= =?UTF-8?q?IR=20=EC=9E=90=EB=8F=99=20=EB=B6=84=EC=84=9D=20=EC=A0=84?= =?UTF-8?q?=EC=B2=B4=20=EC=8B=9C=EB=82=98=EB=A6=AC=EC=98=A4=20=EC=B6=94?= =?UTF-8?q?=EA=B0=80?= MIME-Version: 1.0 Content-Type: text/plain; charset=UTF-8 Content-Transfer-Encoding: 8bit - 최종 목표: 평일 9시 5분 자동 IR 분석 → Slack 보고서 - 구현 완료: 파일 처리, AI 분석, Slack 통합 - 미구현: LLM JSON 파싱, 파일 첨부, 분석 메시지 포맷 - 분석 예시: 굿베이션 투자 확률 0% (베이지안) 🤖 Generated with [Claude Code](https://claude.com/claude-code) Co-Authored-By: Claude --- .../251014_coldmail_ir_analysis_scenario.md | 100 ++++++++++++++++++ 1 file changed, 100 insertions(+) create mode 100644 troubleshooting/251014_coldmail_ir_analysis_scenario.md diff --git a/troubleshooting/251014_coldmail_ir_analysis_scenario.md b/troubleshooting/251014_coldmail_ir_analysis_scenario.md new file mode 100644 index 0000000..b1b3fb3 --- /dev/null +++ b/troubleshooting/251014_coldmail_ir_analysis_scenario.md @@ -0,0 +1,100 @@ +# 콜드메일 IR 자동 분석 시나리오 + +**날짜**: 2025-10-14 +**작성자**: happybell80 +**관련 파일**: `rb8001/app/scheduler/jobs/coldmail_briefing.py` + +--- + +## 최종 목표 시나리오 + +### 평일 오전 9시 5분 자동 실행 +1. NAVER WORKS 메일 중 콜드메일 감지 (Naive Bayes) +2. IR 첨부파일(PDF) 다운로드 +3. skill-rag-file에 업로드 → 51123 HDD 영구 저장 +4. AI 분석 실행: + - 페이지별 요약 (27페이지 → 핵심 내용) + - 기업 평가 (사업분야, 재무, 강약점) + - 베이지안 투자 확률 계산 (0~100%) +5. Slack Lists에 정리된 보고서 첨부: + - 회사명, 이메일, IR 파일 + - 투자 확률, 밸류에이션, 핵심 평가 +6. Slack 채널에 요약 메시지 + 피드백 버튼 + +--- + +## 구현 완료 (2025-10-14) + +### 파일 처리 +- coldmail_briefing.py:75-263: 전체 플로우 +- naverworks_file_processor.py:94-135: PDF 다운로드 → skill-rag-file 업로드 +- 파일 영속성: SSHFS allow_other 해결 (251014_skill-rag-file_sshfs_allow_other_해결.md) + +### AI 분석 기능 +- ir_analyzer.py:86-168: extract_ir_metrics() - RAG 6회 쿼리 → LLM 요약 +- startup_valuation.py:63-173: valuate_startup() - 베이지안 VC Method + +### Slack 통합 +- coldmail_briefing.py:176-248: Slack Lists 아이템 생성 +- coldmail_briefing.py:221-247: 피드백 버튼 (✅ 맞음 / ❌ 아님) +- coldmail_filter.py:29-76: Naive Bayes 학습 루프 + +--- + +## 미구현 및 버그 + +### 버그 1: LLM JSON 파싱 에러 +- ir_analyzer.py:156 - LLM 마크다운 블록(```json) 응답 +- 해결: 151-163줄 전처리 추가 + +### 버그 2: RAG threshold (✅ 해결) +- ir_analyzer.py:32 - 0.5 → 0.3 (cf3fa51) + +### 미구현 1: Slack Lists 파일 첨부 +- coldmail_briefing.py:204 - document_id → file_id 필요 +- 상세: 251014_slack_lists_file_attachment.md + +### 미구현 2: 분석 결과 메시지 +- coldmail_briefing.py:252 - 투자확률/밸류/강약점 추가 + +--- + +## 분석 결과 예시 (굿베이션) + +**파일**: 27페이지, 4.7MB → 14 chunks + +**기업**: 굿베이션 (IT 인테리어 플랫폼) / 설립 7개월 / 팀 4명 / 자본 2억 + +**강점**: 시장 문제 인식, IT 차별화, 24조 시장 +**약점**: 실적 전무, 소규모 팀, 자본 부족, 경쟁사 존재 + +**베이지안 투자 확률**: 0% +- 기본: 7.3% (Pre-A 15% × 밸류 70% × 신뢰도 70%) +- 리스크: -35% (실적-30%, 팀-20%, 자본-20%, 기타+15%) + +**의견**: 투자 권장 안함 / MVP + 매출 + 인력 보강 시 60% + +--- + +## 구현 계획 + +### 우선순위 1: LLM JSON 파싱 에러 +- ir_analyzer.py:151-163: 마크다운 블록(```json) 제거 로직 + +### 우선순위 2: Slack 메시지 포맷 +- coldmail_briefing.py:252-259: 투자확률/밸류/강약점 추가 + +### 우선순위 3: Slack Lists 파일 첨부 +- 251014_slack_lists_file_attachment.md + +--- + +## 교훈 + +### 전체 시나리오 문서화 중요성 +- 개별 기능은 작동하나 최종 목표 불명확 +- 교훈: 전체 시나리오 문서를 먼저 작성 후 세부 구현 + +### LLM 응답 형식 검증 부족 +- LLM이 마크다운 블록(```json)으로 응답 → JSON 파싱 실패 +- 교훈: LLM 응답은 항상 전처리 필요