NAS shared-editing drafts에서 검증 완료된 연구 자료를 DOCS로 이관:
- research/: 양자 복소수 임베딩 팩트체크, 베이즈/힐베르트 대화 검토, 임베딩 한계 대조
- plans/: 로빙 성장 전 에이전트 중지 종합, 코드 기반 원인 분석 개선안
- ideas/: OpenAI/오픈라우터 하이브리드 세션 관리
- troubleshooting/: 로빙 슬랙 대화 문제 7에이전트 종합 보고서
- skills/: hwpx-skill 검증 메모
참여: 23-claude, 23-codex, 23-Cursor, 23-Gemini, 24-claude, 24-codex, 24-Cursor, 24-Gemini
Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>
- 아이디어: 표준 JSON 출력 인터페이스 초안, OpenClaw 커넥터 패턴, 메시지 버스 트렌드 반영
- 리서치: 현재 코드 기반 실현 경로 4단계, Facts 6건, Unresolved 3건
Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>
- MeCab-ko: 2026년 유지보수 중단, 사전 노후, PG14 EOL 고려 → 비권장
- pg_trgm: 키워드 축 복구용 병렬 매칭 엔진으로 재정의 (우회가 아님)
- 로빙이 이미 pgvector+하이브리드 운용 중이라는 현실 반영
Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>
- 트러블: simple 토크나이저 한국어 구조적 한계 확정
- 리서치: MeCab-ko(근본 해결) vs pg_trgm(물리적 보완) 비교
- 근본 해결 1순위: MeCab-ko, 현실적 1단계: pg_trgm (보완 명시 필수)
Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>
- A1: 이미지 PDF chunk_text OCR 깨짐 → 파일명 보조 검색으로 해소
- B: grounding 독립 검색 → 이전 결과 컨텍스트 전달
- 테스트 결과 A 5건 기록 (3 PASS, 2 FAIL)
Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>
- 아이디어 1: 계획 1~3차 + 적용1로 채택 완료
- 2차 계획: PGVector 적재 + tsvector + 하이브리드 + AGE 구현 완료
- 리서치 6: 설계 목적 달성, Unresolved는 후속 문서로 이관
- 남은 열린 문서: 1차 계획(본문 미추출), 3차 계획(OCR/동기화)
Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>
- 리서치 6건 + 1차 계획 + 아이디어: 현재 상태 보정 섹션 통일
- tsvector/하이브리드/AGE 구현 완료 반영, DB 수치 갱신
- 설계 별칭-운영 실체 매핑 명시, Unresolved 보강
Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>
- 260312/260315/260316 계열 트러블/리서치/계획/시나리오/워크로그
- 본문에만 닫힘 표기되어 있던 문서에 status: closed 프론트메타 추가
- 열린 문서는 260320 다형식문서 RAG 체인 10개만 남음
Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>
- 옐로펀치 MOU: 인덱싱 완료, 임베딩 정상, 문서간 유사도 0.8+
- 쿼리 임베딩과 문서 청크 간 cosine 거리가 멀어 top-50에도 미등장
- Gemini 비대칭 임베딩(RETRIEVAL_QUERY vs DOCUMENT)의 한계 확인
- keyword 보완 실패와 합쳐 이중 실패 구조 확정
Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>
- threshold 0.35에서 ts_rank 최대 0.089이므로 전부 필터링되는 문제 확인
- 교착어 미처리와 threshold 불일치가 중첩 원인임을 명시
- 우선순위 1(즉시 적용): threshold 분리 + prefix 매칭 동시 적용 제안
Co-Authored-By: Claude Opus 4.6 <noreply@anthropic.com>
- RRF 점수(0.01~0.03)가 threshold(0.35)와 스케일 불일치 확인
- vector_score OR 조건으로 우회되지만 relevance_score 기준 정렬에 영향
- 실측 데이터 추가 (hybrid rrf=0.032 vs vector=0.775)
Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>
- keyword recall 0: simple 토크나이저가 한국어 조사 분리 불가 (실측 recall 27%)
- grounding 실패 3계층: 검색(8건), 라우팅 마커(3건), LLM 판단(정상)
- prefix 매칭(:*) 적용 시 recall 27%→90% 즉시 개선 가능
Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>
Gemini 대화 기반 — 인제션 아키텍처, 가치 판단 필터링, 프롬프트 DB 시너지,
위키 통합, 사업화 검토, 핵심 비판 4가지, RBAC 구현 전략 정리
Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>
프롬프트 과잉 서비스 유도, OpenAI 대화 이력 미전달, 감정 constraints 무조건 주입 확인.
해결 방안 3단계 제안 (프롬프트 v2 + 이력 전달 + JSON 강제 선택적)
Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>
리서치 Fact 17: PDF만이 아닌 이미지/docx 등 모든 파일 형식을 텍스트
변환 없이 직접 임베딩해야 함을 명시. 현재 텍스트 변환 파이프라인이
Gemini Embedding 2 전환의 의미를 절반 이상 버리는 것임을 지적.
계획 Phase 0: 인덱싱 파이프라인 전환 항목 추가 (미완료).
계획 구현 원칙: 멀티모달 직접 임베딩 전환 플로우 및 기존 텍스트 추출
파이프라인 제거 방향 명시.
Co-Authored-By: Claude Sonnet 4.6 <noreply@anthropic.com>
리서치 Fact 7: 현재 구조는 RAG가 아님을 명시. 검색만 있고 LLM 생성이
없는 규칙 기반 문자열 조합임을 지적. LLM 기반 전환 필요 방향 추가.
리서치 결론: 가장 근본 원인으로 RAG 구조 부재 추가. 구현 항목 4가지로 갱신.
계획 구현 원칙: RAG 전환 플로우(임베딩→검색→청크선별→LLM→답변) 명시.
계획 Phase 4: 규칙 문자열 조합 → LLM 호출로 대체하는 구체적 플로우 추가.
Co-Authored-By: Claude Sonnet 4.6 <noreply@anthropic.com>
리서치 Fact 14: skill-rag-file 문서 청크가 여전히 ChromaDB에 저장 중이며
운영 원칙(PostgreSQL 중심)과 불일치 상태임을 명시.
계획 Phase 0 표: rb8001 메모리(확정)와 skill-rag-file 청크(미완료) 저장
경로를 분리해 pgvector 전환 필요 항목으로 추가.
Co-Authored-By: Claude Sonnet 4.6 <noreply@anthropic.com>
- SKILL.md: 384d → Gemini Embedding 2 / 768d 전환 반영, PostgreSQL 저장 경로, NAS 원본 경로 추가
- 트러블슈팅: 존재하지 않는 worklog 참조 제거, 실제 코드 검토 기반 종결 근거로 교체, 잔여 조건 명시
- 시나리오: 상태를 구현완료_검증대기로 갱신, 구현 반영 상태 추가, 닫힘까지 남은 작업 4건 구체화
- 리서치: Unresolved 6건 중 확정 3건 닫기(임베딩 차원, 적합도 판정, 수치형 판정), 미확정 3건만 잔류
- 계획: Phase 0을 표 형식으로 현행화(확정/인지/미완료 구분), Phase 5 자동화+수동 검증 구체화
- 아이디어: 후속 진행 상태 및 임베딩 전환 확정 사항 추가
Co-Authored-By: Claude Opus 4.6 <noreply@anthropic.com>