DOCS/troubleshooting/251002_opensearch_cleanup.md
happybell80 b18b7f1143 refactor: 트러블슈팅 파일명 형식 통일
- 8자리 날짜(20251013) → 6자리 날짜(251013)
- 16개 파일 rename 완료
- 형식: yymmdd_주제.md로 통일

🤖 Generated with [Claude Code](https://claude.com/claude-code)

Co-Authored-By: Claude <noreply@anthropic.com>
2025-10-13 21:09:56 +09:00

1.4 KiB

OpenSearch 오염 로그 정리

문제

  • 9월 인덱스에 fluent-bit 디버그 로그 99.9% 오염 (303,274건/일)
  • 실제 서비스 로그가 묻혀 모니터링 불가능

해결

  1. 9/30: dataprepper-static 고정 인덱스로 전환 (디버그 로그 제거)
  2. 10/2: 오염된 9월 인덱스 삭제
curl -XDELETE 'localhost:9200/dataprepper-2025.09.*'

결과

  • 10/1부터 정상 서비스 로그만 수집 (24,817건/일)
  • fluent-bit 디버그 로그 0건
  • 저장 공간 120MB 확보

PLG 키워드 중복 및 네이버웍스 브리핑 개선

문제 1: PLG 키워드 반복 출현

  • startup_news_skill.py에서 PLG가 키워드로 계속 추출됨
  • 실제 뉴스와 무관하게 프롬프트 예시 편향

원인

  • 64번, 86번 라인 프롬프트 예시에 PLG 포함
  • LLM이 예시를 우선 선택하도록 학습됨

해결

  • PLG를 FORBIDDEN words 리스트에 추가 (67번 라인)
  • 예시에서 PLG 제거, D2C로 대체

문제 2: 네이버웍스 브리핑 어색한 표현

  • "보내주신 메일"처럼 받은 메일을 보낸 것처럼 표현
  • "네," 같은 응답어가 브리핑에 포함

해결

  • naverworks_briefing.py:198-213 프롬프트 개선
  • "수신된 이메일" 명시, 인사말/응답어 금지 지시 추가

교훈

  • LLM 프롬프트 예시가 실제 출력에 강한 편향 생성
  • 명확한 금지 지시 없으면 LLM이 대화형 응답 생성