docs: CompanyX 뉴스 문제 해결 내역 업데이트

- 근본 원인 명확화
- 해결 내역 및 수정 파일 기록
- 의사코드 제거, 사실만 기록
This commit is contained in:
happybell80 2025-09-16 21:24:03 +09:00
parent 8f62e9c4d4
commit 579626edb8

View File

@ -33,17 +33,16 @@ docker logs robeing-skill-news | grep "컴퍼니엑스"
- chat_update API로 메시지 수정 가능
- 채널: C09C98KK2TT, ts: 1757984471.889439
## 필요한 개선사항
### 1. 수집 단계 검증 필요
- 제목/URL에서 회사명 정확히 포함 여부 확인 로직 추가
- 부분 매칭 제외 로직 구현
## 근본 원인
- skill-news/app/services/companyx_news_scraper.py에 본문 검증 로직 없었음
- scrape_all() 92행에서 모든 기사를 scraped_articles에 추가
- 언급 없는 기사도 요약되어 rb8001에 전달됨
### 2. 처리 단계 검증 필요
- 본문 스크래핑 후 관련성 검증 로직 추가
### 3. 전송 전 검증 필요
- summarized 상태 기사만 전송하도록 필터링
- 검증된 기사 0개일 때 전송 중단 로직
## 해결 내역 (2025-09-16)
### 수정 파일
- companyx_news_scraper.py: _find_company_mentions() 함수 추가 (32-65행)
- companyx_news_scraper.py: scrape_all()에서 언급 확인 후 필터링 (92-110행)
- companyx_news_collector.py: company_mentioned, mention_count 필드 추가 (367-368행)
## 교훈
- 검색어 설정과 검증은 별개 프로세스로 관리 필요