From 579626edb8e998e028f8c44d5fbeda0387083c67 Mon Sep 17 00:00:00 2001 From: happybell80 Date: Tue, 16 Sep 2025 21:24:03 +0900 Subject: [PATCH] =?UTF-8?q?docs:=20CompanyX=20=EB=89=B4=EC=8A=A4=20?= =?UTF-8?q?=EB=AC=B8=EC=A0=9C=20=ED=95=B4=EA=B2=B0=20=EB=82=B4=EC=97=AD=20?= =?UTF-8?q?=EC=97=85=EB=8D=B0=EC=9D=B4=ED=8A=B8?= MIME-Version: 1.0 Content-Type: text/plain; charset=UTF-8 Content-Transfer-Encoding: 8bit - 근본 원인 명확화 - 해결 내역 및 수정 파일 기록 - 의사코드 제거, 사실만 기록 --- .../250916_claude_companyx_wrong_news.md | 19 +++++++++---------- 1 file changed, 9 insertions(+), 10 deletions(-) diff --git a/troubleshooting/250916_claude_companyx_wrong_news.md b/troubleshooting/250916_claude_companyx_wrong_news.md index 5dc9b52..e52071a 100644 --- a/troubleshooting/250916_claude_companyx_wrong_news.md +++ b/troubleshooting/250916_claude_companyx_wrong_news.md @@ -33,17 +33,16 @@ docker logs robeing-skill-news | grep "컴퍼니엑스" - chat_update API로 메시지 수정 가능 - 채널: C09C98KK2TT, ts: 1757984471.889439 -## 필요한 개선사항 -### 1. 수집 단계 검증 필요 -- 제목/URL에서 회사명 정확히 포함 여부 확인 로직 추가 -- 부분 매칭 제외 로직 구현 +## 근본 원인 +- skill-news/app/services/companyx_news_scraper.py에 본문 검증 로직 없었음 +- scrape_all() 92행에서 모든 기사를 scraped_articles에 추가 +- 언급 없는 기사도 요약되어 rb8001에 전달됨 -### 2. 처리 단계 검증 필요 -- 본문 스크래핑 후 관련성 검증 로직 추가 - -### 3. 전송 전 검증 필요 -- summarized 상태 기사만 전송하도록 필터링 -- 검증된 기사 0개일 때 전송 중단 로직 +## 해결 내역 (2025-09-16) +### 수정 파일 +- companyx_news_scraper.py: _find_company_mentions() 함수 추가 (32-65행) +- companyx_news_scraper.py: scrape_all()에서 언급 확인 후 필터링 (92-110행) +- companyx_news_collector.py: company_mentioned, mention_count 필드 추가 (367-368행) ## 교훈 - 검색어 설정과 검증은 별개 프로세스로 관리 필요