51123 서비스 문제 현황 문서화

- Gateway Stats API URL 슬래시 3개 버그 (250926)
- 51123 Fluent Bit 로그 유실 현황 (250918)
- 000000 매트릭스에 Quick Wins 추가

🤖 Generated with [Claude Code](https://claude.ai/code)

Co-Authored-By: Claude <noreply@anthropic.com>
This commit is contained in:
happybell80 2025-09-27 11:31:39 +09:00
parent 12ba27bac0
commit d9a01d33ae
3 changed files with 34 additions and 7 deletions

View File

@ -1,7 +1,9 @@
# 미해결 항목 매트릭스 (중요도 × 구현 난이도) # 미해결 항목 매트릭스 (중요도 × 구현 난이도)
## 🔴 Quick Wins (높은 중요도 + 쉬운 구현) → 즉시 실행 ## 🔴 Quick Wins (높은 중요도 + 쉬운 구현) → 즉시 실행
1. **네이버웍스 메일→슬랙 전달** - 기본 연동(01) ✅완료, 일일 브리핑(02) 구현 완료, 테스트 중 · 콜드메일(03) 미구현 (1주) [→250919_01_base](../troubleshooting/250919_naverworks_slack_01_base_configuration.md) [→250919_02_daily](../troubleshooting/250919_naverworks_slack_02_daily_briefing.md) [→250919_03_cold](../troubleshooting/250919_naverworks_slack_03_cold_mail_list.md) 1. **Gateway Stats API URL 슬래시 3개 버그** - 51123 robeing-gateway에서 `///api/stats/` 형식으로 404 반복, 1분마다 폴백 동작 중 (30분) [→250926](../troubleshooting/250926_happybell80_gateway_redis_integration.md)
2. **51123 Fluent Bit 로그 유실** - Data Prepper 미실행으로 127.0.0.1:2021 연결 실패, 초당 4-5회 에러, 수백 건 chunk 유실 중 (1시간) [→250918](../troubleshooting/250918_happybell80_fluent_bit_opensearch_data_prepper_integration.md)
3. **네이버웍스 메일→슬랙 전달** - 콜드메일(03) 미구현 (1주) [→250919_03_cold](../troubleshooting/250919_naverworks_slack_03_cold_mail_list.md)
## 🟠 Major Projects (높은 중요도 + 어려운 구현) → 계획 수립 후 진행 ## 🟠 Major Projects (높은 중요도 + 어려운 구현) → 계획 수립 후 진행
1. **하드코딩 URL 제거** - 15개+ 서비스 광범위 미해결, 특히 rb8001의 auth-server URL (3-4주) [→250915](../troubleshooting/250915_hardcoded_url_removal.md) 1. **하드코딩 URL 제거** - 15개+ 서비스 광범위 미해결, 특히 rb8001의 auth-server URL (3-4주) [→250915](../troubleshooting/250915_hardcoded_url_removal.md)
@ -34,9 +36,6 @@
--- ---
*평가 기준: 중요도(시스템 안정성/사용자 영향), 난이도(구현 시간/복잡도)* *평가 기준: 중요도(시스템 안정성/사용자 영향), 난이도(구현 시간/복잡도)*
## ✅ 완료된 항목 (아카이브)
1. **시스템 메트릭/Stats 일원화** - rb8001 → robeing-monitor 위임 완료, /stats 정상 동작 확인 ✅ [→250920_stats](../troubleshooting/250920_stats_api_unification_complete.md)
2. **네이버웍스 일일 브리핑** - 구현 완료, 테스트 진행 중 ✅
--- ---
*최종 업데이트: 2025-09-25* *최종 업데이트: 2025-09-27*

View File

@ -166,7 +166,20 @@ curl -s "http://192.168.219.45:9200/dataprepper-*/_count"
- Git Actions에 Data Prepper 자동 배포 추가 고려 - Git Actions에 Data Prepper 자동 배포 추가 고려
- 51124 서버 전용 배포 스크립트 작성 필요 - 51124 서버 전용 배포 스크립트 작성 필요
---
## 현재 상태 (2025-09-27)
### 51123 Fluent Bit 연결 실패
- **증상**: 초당 4-5회 `no upstream connections available to 127.0.0.1:2021` 에러
- **영향**: 수백 건의 chunk 재시도 한계 초과, 로그 유실 중
- **원인**: 51123에서 Data Prepper 미실행 (51124에만 실행 중)
- **Data Prepper 위치**: 51124 서버 (`docker ps` 확인됨, 포트 2021 정상)
- **헬스체크**: 51124 `curl http://192.168.219.52:2021/health``{"healthy":true}`
- **51123 확인**: 로컬 2021 포트 리스닝 없음 (`ss -tlnp | grep 2021` 결과 없음)
- **상태**: 미해결 - 51123 Fluent Bit이 로컬 2021 포트로 전송 시도하나 서비스 없음
--- ---
*작성자: happybell80* *작성자: happybell80*
*작성일: 2025-09-18* *작성일: 2025-09-18*
*최종 수정: 2025-09-18 - 실제 구현 현황 추가* *최종 수정: 2025-09-27 - 51123 연결 실패 현황 추가*

View File

@ -57,4 +57,19 @@ docker inspect robeing-gateway auth-redis | grep -A2 "Networks"
## 5. 결과 ## 5. 결과
- ✅ Stats API 정상 작동 - ✅ Stats API 정상 작동
- ✅ Redis 연결 성공 (rate limiting) - ✅ Redis 연결 성공 (rate limiting)
- ✅ 헬스체크 통과 - ✅ 헬스체크 통과
---
## 6. 현재 상태 (2025-09-27)
### Stats API 404 반복 발생
- **증상**: `http://192.168.219.52:9024///api/stats/rb8001` 404 응답 (1분마다)
- **URL 형식**: 슬래시 3개 (`///`) 발생 중
- **현재 설정**:
- `MONITOR_URL="http://192.168.219.52:9024"`
- `MONITOR_STATUS_URI="/api/stats"`
- **코드**: `main.py:290` - `f"{env_setting.MONITOR_URL}/{env_setting.MONITOR_STATUS_URI}/{robeing_id}"`
- **실제 동작**: robeing-monitor API는 정상 (`curl http://localhost:9024/api/stats/rb8001` 성공)
- **폴백**: 404 시 기본값 반환 중
- **상태**: 미해결