Add: PLG 키워드 중복 및 네이버웍스 브리핑 개선 트러블슈팅 추가

2025-10-02 09:26:24 +09:00 · 2025-10-02 09:26:24 +09:00 · e5baa5e475
commit e5baa5e475
parent 1193b3d453
1 changed files with 29 additions and 1 deletions
--- a/troubleshooting/20251002_opensearch_cleanup.md
+++ b/troubleshooting/20251002_opensearch_cleanup.md
@ -14,4 +14,32 @@ curl -XDELETE 'localhost:9200/dataprepper-2025.09.*'
 ## 결과
 - 10/1부터 정상 서비스 로그만 수집 (24,817건/일)
 - fluent-bit 디버그 로그 0건
- 저장 공간 120MB 확보
+- 저장 공간 120MB 확보
 ---
 # PLG 키워드 중복 및 네이버웍스 브리핑 개선
 ## 문제 1: PLG 키워드 반복 출현
 - startup_news_skill.py에서 PLG가 키워드로 계속 추출됨
 - 실제 뉴스와 무관하게 프롬프트 예시 편향
 ## 원인
 - 64번, 86번 라인 프롬프트 예시에 PLG 포함
 - LLM이 예시를 우선 선택하도록 학습됨
 ## 해결
 - PLG를 FORBIDDEN words 리스트에 추가 (67번 라인)
 - 예시에서 PLG 제거, D2C로 대체
 ## 문제 2: 네이버웍스 브리핑 어색한 표현
 - "보내주신 메일"처럼 받은 메일을 보낸 것처럼 표현
 - "네," 같은 응답어가 브리핑에 포함
 ## 해결
 - naverworks_briefing.py:198-213 프롬프트 개선
 - "수신된 이메일" 명시, 인사말/응답어 금지 지시 추가
 ## 교훈
 - LLM 프롬프트 예시가 실제 출력에 강한 편향 생성
 - 명확한 금지 지시 없으면 LLM이 대화형 응답 생성