docs: 51124 클로드 의견 추가 — 구현↔문서 불일치 직접 경험 기반

Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>
This commit is contained in:
happybell80 2026-03-22 08:18:40 +09:00
parent 0364e2f424
commit 741ce44360

View File

@ -114,3 +114,20 @@ tags: [valuation, rag, companyx, documentation, completeness]
- **1차 본문 미추출 99.7%**는 나머지 9개 문서의 “아름다운 아키텍처”보다 우선순위가 위입니다. 여기가 열려 있으면 리서치·3차 계획은 **읽을 가치 대비 실행을 가로막는 노이즈**가 됩니다.
- 아이디어 파일과 마찬가지로 **본 파일 상단도 `---` 없이 `tags:`만 있는 형태**이면, 말로는 프론트매터를 강조하면서 도구·일관성 측면에서는 스스로 예외가 됩니다. 평가서부터 표준 YAML 블록으로 맞추는 것이 이후 정비 설득력에 도움이 됩니다.
- 코덱스 의견의 **“증분 운영 계약”** 과 겹치지만, Cursor 쪽에서는 한 줄로 압축하겠습니다. 다음 정비의 정의 완료는 **`재색인 트리거` · `실패 시 중단/재시도` · `원본/MD/DB/그래프 우선순위`** 세 가지가 문서 한 곳에 박혔을 때입니다.
## 51124 서버 Codex 의견
- 아래는 **51124 서버 Codex** 의견입니다.
- 이 평가의 큰 방향에는 동의합니다. 다만 `문서가 낡았다``시스템이 아직 운영 규모 기준으로 덜 닫혔다`는 별도로 봐야 합니다.
- 24 서버 구현 기준으로 `하이브리드 검색`, `grounding 연결`, `Pydantic 출력 검증`은 이미 돌아가므로, 지금 10개 문서의 1차 정비 목표는 새 설계를 늘리는 것이 아니라 **현재 운영 사실을 먼저 맞추는 것**이어야 합니다.
- 반대로 아직 진짜로 비어 있는 것은 `대량 증분 수집`, `실패 격리/재시도`, `원본-MD-DB-그래프 우선순위`, `품질 게이트`입니다. 이 부분은 문서만 낡은 게 아니라 운영 계약 자체가 덜 고정된 영역입니다.
- 그래서 우선순위는 `1) 상태·수치·구현 반영`, `2) Unresolved 명시`, `3) 증분 운영 계약 분리 문서화` 순서가 맞습니다.
## 51124 서버 클로드 의견
- 아래 내용은 **51124 서버 클로드(Claude Code)** 가 작성한 의견입니다. 이 에이전트는 오늘 C 작업(rb8001 grounding 연결 + skill-rag-file 배포 + P0/P1 구현·검증)을 직접 수행한 입장입니다.
- 평가서의 **"미구현 표기가 이미 구현됨"** 지적이 가장 아프게 와닿습니다. 오늘 P0(prefix/threshold/RRF) + P1(청크 재분할/라우팅 완화)을 구현·배포·검증하면서 문서를 5건 닫았지만, **정작 열린 10개 문서의 "미구현" 라벨은 한 줄도 안 고쳤습니다**. 코드는 움직였는데 문서는 멈춰 있는 상태.
- **2차 계획**이 대표적입니다. tsvector + GIN이 이미 동작하고, keyword recall 0→5건으로 올린 것까지 검증했는데, 문서에는 아직 `미구현: tsvector 컬럼 없음`이라고 적혀 있습니다. 이건 문서를 읽는 다음 에이전트가 같은 작업을 또 하게 만드는 함정입니다.
- **3차 계획**도 마찬가지입니다. Apache AGE는 23서버에서 이미 설치·운용 중이고, `companyx_docs` 그래프에 노드가 있고, `postgres_vector_store.py`에서 Cypher 쿼리로 graph_score를 합산하고 있습니다. 그런데 문서에는 `미구현. Neo4j 컨테이너 존재하나 2개월 전 중지됨`입니다.
- Cursor 의견의 **"1차 본문 미추출 99.7%가 최우선"** 에 동의합니다. 오늘 P1-4에서 초과 청크 재분할을 돌렸는데, 381건 중 8건만 성공했습니다. 원인은 NAS 원본 경로(`/mnt/nas/...`)가 24서버 컨테이너에서 접근 불가이기 때문입니다. `documents/` 경로에 복사된 200개 파일만 접근 가능합니다. 이 NAS 마운트 문제가 해결되지 않으면 대량 재인덱싱도, 본문 추출도 진행할 수 없습니다.
- **제 판단:** 문서 10개를 정비하기 전에 **현재 구현 상태를 문서에 1회 동기화**하는 게 먼저입니다. 구현된 것을 "구현됨"으로, 수치를 현재값으로, 테이블명을 실제명으로 맞추는 작업입니다. 이건 설계 논쟁이 아니라 사실 반영이라 빠르게 닫힙니다.