DOCS/journey/troubleshooting/251002_opensearch_cleanup.md
Claude-51124 22557e7132 docs: 오래된 트러블슈팅 아카이브 및 구조 정리
- 7-8월 초기 구축 문서 12개를 _archive/troubleshooting/2025_07-08_initial_setup/로 이동
- book/300_architecture/390_human_in_the_loop_intent_learning.md를 journey/research/intent_classification/로 이동 (개발 여정 문서)
- 빈 폴더 제거 (journey/assets/*)
2025-11-17 14:06:05 +09:00

45 lines
1.4 KiB
Markdown

# OpenSearch 오염 로그 정리
## 문제
- 9월 인덱스에 fluent-bit 디버그 로그 99.9% 오염 (303,274건/일)
- 실제 서비스 로그가 묻혀 모니터링 불가능
## 해결
1. **9/30**: dataprepper-static 고정 인덱스로 전환 (디버그 로그 제거)
2. **10/2**: 오염된 9월 인덱스 삭제
```bash
curl -XDELETE 'localhost:9200/dataprepper-2025.09.*'
```
## 결과
- 10/1부터 정상 서비스 로그만 수집 (24,817건/일)
- fluent-bit 디버그 로그 0건
- 저장 공간 120MB 확보
---
# PLG 키워드 중복 및 네이버웍스 브리핑 개선
## 문제 1: PLG 키워드 반복 출현
- startup_news_skill.py에서 PLG가 키워드로 계속 추출됨
- 실제 뉴스와 무관하게 프롬프트 예시 편향
## 원인
- 64번, 86번 라인 프롬프트 예시에 PLG 포함
- LLM이 예시를 우선 선택하도록 학습됨
## 해결
- PLG를 FORBIDDEN words 리스트에 추가 (67번 라인)
- 예시에서 PLG 제거, D2C로 대체
## 문제 2: 네이버웍스 브리핑 어색한 표현
- "보내주신 메일"처럼 받은 메일을 보낸 것처럼 표현
- "네," 같은 응답어가 브리핑에 포함
## 해결
- naverworks_briefing.py:198-213 프롬프트 개선
- "수신된 이메일" 명시, 인사말/응답어 금지 지시 추가
## 교훈
- LLM 프롬프트 예시가 실제 출력에 강한 편향 생성
- 명확한 금지 지시 없으면 LLM이 대화형 응답 생성