566 Commits

Author SHA1 Message Date
2b753fd610 docs: P0 검증 결과 기록 — keyword 0→5건, RRF 정규화 동작, grounding 5→8
Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>
2026-03-21 16:16:09 +09:00
270ebb2d24 fix: prefix recall 상한 명시 + 라우팅 완화 범위 위험/롤백 기준 추가
Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>
2026-03-21 16:08:14 +09:00
d526b48d23 fix: 품질개선 계획 보완 — P0-3 옵션 확정, P1-4 실패 대안, P1-5 fallback 확인
Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>
2026-03-21 16:07:28 +09:00
5cc4e5aa08 plan: 하이브리드 검색 품질 개선 계획 (P0 3건 + P1 2건)
- P0: prefix 매칭, keyword threshold 분리, RRF 점수 정규화
- P1: 초과 청크 재분할, grounding 라우팅 완화
- 260321 리서치 원인 5개 → 조치 5개 1:1 매핑

Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>
2026-03-21 16:05:13 +09:00
59eeec2117 docs: 벡터 검색 실패 원인 확정 — 쿼리-문서 임베딩 거리 문제 실측
- 옐로펀치 MOU: 인덱싱 완료, 임베딩 정상, 문서간 유사도 0.8+
- 쿼리 임베딩과 문서 청크 간 cosine 거리가 멀어 top-50에도 미등장
- Gemini 비대칭 임베딩(RETRIEVAL_QUERY vs DOCUMENT)의 한계 확인
- keyword 보완 실패와 합쳐 이중 실패 구조 확정

Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>
2026-03-21 15:56:17 +09:00
cb39cbd8ee fix: keyword recall=0 리서치에 threshold 스케일 불일치 원인 추가 (23서버 실측)
- threshold 0.35에서 ts_rank 최대 0.089이므로 전부 필터링되는 문제 확인
- 교착어 미처리와 threshold 불일치가 중첩 원인임을 명시
- 우선순위 1(즉시 적용): threshold 분리 + prefix 매칭 동시 적용 제안

Co-Authored-By: Claude Opus 4.6 <noreply@anthropic.com>
2026-03-21 15:50:30 +09:00
9bd9459912 docs: RRF score와 threshold 스케일 불일치 원인 추가
- RRF 점수(0.01~0.03)가 threshold(0.35)와 스케일 불일치 확인
- vector_score OR 조건으로 우회되지만 relevance_score 기준 정렬에 영향
- 실측 데이터 추가 (hybrid rrf=0.032 vs vector=0.775)

Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>
2026-03-21 15:48:33 +09:00
3e78c7cf6e docs: 하이브리드 검색 keyword recall=0 및 grounding 실패 원인 확정 리서치
- keyword recall 0: simple 토크나이저가 한국어 조사 분리 불가 (실측 recall 27%)
- grounding 실패 3계층: 검색(8건), 라우팅 마커(3건), LLM 판단(정상)
- prefix 매칭(:*) 적용 시 recall 27%→90% 즉시 개선 가능

Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>
2026-03-21 15:44:44 +09:00
872ae14f73 fix: RAG 계획/SKILL.md stale 값 정리 및 검증 기록란 추가
- SKILL.md: ChromaDB 병행 → pgvector 단일 운영, 대표 파일 2개 → 200개 인덱싱 현황으로 갱신
- 1차 계획: 완료 조건에 본문 미추출(99.7%) 미완료 상태 명시, 1:1 대응 차이 수치 반영
- 적용1 계획: 샘플 질문 16개 검증 결과 기록 테이블 추가

Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>
2026-03-21 12:22:57 +09:00
0252dd1a7f fix: 51123 서버 IP 주소 업데이트 (성수 이전)
192.168.219.45 → 192.168.0.100 일괄 변경

Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>
2026-03-21 11:52:26 +09:00
67e33826c2 docs: OCR 모델 벤치마크 리서치 추가, skill-rag-file에 OCR 모델(gemini-2.0-flash) 기록
Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>
2026-03-21 10:44:57 +09:00
4b8edbf77f fix: update legacy IP 192.168.219.52 → 192.168.0.106 in failover plan (SSOT alignment)
Co-Authored-By: Claude Opus 4.6 <noreply@anthropic.com>
2026-03-20 17:59:32 +09:00
99d2f314fb docs: 금지 원칙 명시 — 질문별 하드코딩 특례/폴백/예외 분기 추가 금지
Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>
2026-03-20 17:50:48 +09:00
e8d3511fd8 docs: 샘플 검증 질문을 200개 파일 실제 내용 기반으로 교체 (투자조합/TIPS/오늘전통/실패 검증)
Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>
2026-03-20 17:49:24 +09:00
bae070c352 docs: RAG 계획 4건 코드 현실 반영 — 기존 테이블/구현 상태/미구현 항목 명시
Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>
2026-03-20 17:48:33 +09:00
25db212d80 docs: 260315 계획 닫기 → 260320 흡수, 시나리오 닫기, 워크로그 작성
Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>
2026-03-20 17:43:01 +09:00
1722d16e32 docs: 키워드 검색(TSVECTOR) 미구현 상태 명시, 적용1 흐름에 벡터+키워드+그래프 3중 검색 반영
Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>
2026-03-20 17:38:42 +09:00
3a06a3f20f docs: 그래프 확장 방향 변경 — 재귀 CTE에서 Apache AGE로, 계획 문서에 링크 반영
Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>
2026-03-20 17:36:37 +09:00
271b74322d docs: RAG 계획 문서 현재 상태 반영 — 200개 파일 인덱싱 완료, 닫는 조건 정의
Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>
2026-03-20 17:31:31 +09:00
e8ab0d2ba7 docs: 스트림데이터 MD/위키 통합 지식베이스 사업화 리서치 추가
Gemini 대화 기반 — 인제션 아키텍처, 가치 판단 필터링, 프롬프트 DB 시너지,
위키 통합, 사업화 검토, 핵심 비판 4가지, RBAC 구현 전략 정리

Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>
2026-03-20 14:23:20 +09:00
happybell80
13d3a0b42e docs: add multimodal rag idea and phased plans 2026-03-20 13:00:00 +09:00
happybell80
8226affa9a docs: add multimodal rag research set 2026-03-20 12:43:52 +09:00
0e1ea74de6 docs: rb8001 응답 품질 트러블슈팅 종결 — 워크로그 작성, E2E 검증 통과
재현 질문셋 4건 전수 통과: 톤 과장 해소, 문맥 유지, 과잉 제안 제거

Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>
2026-03-19 22:13:03 +09:00
4903acdbee docs: 응답 품질 문서 세트 보강 — OpenClaw 레퍼런스, 확정 원인, 범위 분리
- 리서치: OpenClaw Context Engine/compaction 분석 §7 추가, 리스크 보강
- 계획: OpenClaw 레퍼런스 링크, 비범위에 compaction/Context Engine 명시
- 트러블슈팅: 원인 가설 → 확정 원인으로 갱신 (리서치 §2 기반)

Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>
2026-03-19 22:02:49 +09:00
8fc7f421e8 docs: rb8001 응답 품질 수정 계획 작성 및 문서 세트 링크 연결
트러블슈팅-리서치-계획 3점 세트 완성, 4단계 구현 순서 확정

Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>
2026-03-19 21:47:53 +09:00
12d59a5819 docs: rb8001 응답 품질 리서치 작성 — 톤 과장·문맥 유실·과잉 제안 원인 확정
프롬프트 과잉 서비스 유도, OpenAI 대화 이력 미전달, 감정 constraints 무조건 주입 확인.
해결 방안 3단계 제안 (프롬프트 v2 + 이력 전달 + JSON 강제 선택적)

Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>
2026-03-19 21:45:43 +09:00
0a46c56ddd docs: 워크로그에 E2E 검증 결과 및 JWT 테스트 방법 추가
실제 응답 변화 확인 (v1→v2 TEST-V2 prefix), 캐시 주의사항 기록

Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>
2026-03-19 21:28:01 +09:00
f62d48283d docs: 프롬프트 DB 폐루프 미연결 트러블슈팅 종결 처리
P1 구현 워크로그 작성, 트러블슈팅 종결 상태 반영

Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>
2026-03-19 21:23:11 +09:00
49cc3b2144 docs: 계획 문서 보강 — 리서치 결과 기반 현재 상태·Phase 1~2 갱신
- 현재 상태를 리서치 링크 기반으로 갱신 (약 40개 → 24건 확정)
- Phase 1 완료 항목 표시
- Phase 2 실행 경로를 리서치 §6, §9 링크로 구체화
- SSOT 원칙: 상세는 리서치에만 두고 계획은 링크+요약

Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>
2026-03-19 21:14:41 +09:00
0875becc91 docs: 프롬프트 DB 문서 세트 보강 — 리서치 결과 반영
- 트러블슈팅 #3: 확정 항목 추가 (주입 계층, P1 대상, fallback 정책)
- 트러블슈팅 #7: 24건 인벤토리 확정, 이관 우선순위 반영
- 계획: 인벤토리 목록화 체크리스트 완료 처리
- 리서치: 캐싱 전략 상세 보강 (TTL, 무효화, 실패 처리)

Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>
2026-03-19 21:09:07 +09:00
ff6645e8cb docs: 프롬프트 DB 폐루프 및 하드코딩 잔존 전수 조사 리서치 작성
하드코딩 프롬프트 24건 인벤토리, gap 분석, 폐루프 연결 최소 수정 범위 확정.
트러블슈팅·계획 문서에 리서치 링크 추가.

Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>
2026-03-19 21:04:24 +09:00
f75f814807 docs: workspace-config SSOT 하드코딩 분산 트러블슈팅 종결 처리
우회 경로 4건 통합 확인, config.py 하드코딩 기본값 제거 완료

Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>
2026-03-19 20:50:18 +09:00
8e4a758df4 docs: rb8001 ChromaDB 차원 드리프트 트러블슈팅 종결 처리
Gemini Embedding 2 전환으로 768d 통일, 컬렉션 초기화 확인, 에러 0건

Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>
2026-03-19 20:40:42 +09:00
078ad50612 docs: NAVER WORKS 브리핑 서두 누출 트러블슈팅 종결 처리
코드 반영·테스트·배포 검증 완료 확인 후 상태를 종결로 변경

Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>
2026-03-19 20:08:56 +09:00
6844dff07d docs(research): update Gemini Embedding 2 hybrid indexing findings 2026-03-19 19:33:53 +09:00
dd786dfed6 docs: Phase 3 키워드 필터링→LLM 위임 반영, n8n JSON 워크플로우 갱신
- 계획: Phase 3 근거 채택 판정을 LLM 위임으로 전환 반영
- 워크플로우 JSON: 키워드 필터링 노드 제거, Vector Score 선택 + LLM 판단 구조
- 워크플로우 MD: 근거 선별 원칙 추가 (룰베이스 절제 원칙 §B.6)

Co-Authored-By: Claude Opus 4.6 <noreply@anthropic.com>
2026-03-19 18:45:53 +09:00
7718c84167 docs: 260319 오후 ivada_project 경로수정·워크플로우 업데이트 워크로그
Made-with: Cursor
2026-03-19 15:27:13 +09:00
930f87b70f docs: companyx RAG phase4/5a plans, research, worklog 갱신
Made-with: Cursor
2026-03-18 09:52:22 +09:00
7eea592636 docs: record scheduler recovery and debug 2026-03-18 09:34:44 +09:00
c1a3854591 docs: record rb8001 prompt and intent issues 2026-03-17 22:59:36 +09:00
1154d2f550 docs: record rb8001 slack signing secret recovery 2026-03-17 22:51:31 +09:00
f5b12dcee5 docs: Company X RAG 시나리오·아이디어·리서치·계획 현행화, Gemini Embedding 2 리서치 보강
Made-with: Cursor
2026-03-17 20:02:22 +09:00
ff1d694ec3 docs: Gemini Embedding 2 멀티모달 직접 임베딩 전환 방향 명시
리서치 Fact 17: PDF만이 아닌 이미지/docx 등 모든 파일 형식을 텍스트
변환 없이 직접 임베딩해야 함을 명시. 현재 텍스트 변환 파이프라인이
Gemini Embedding 2 전환의 의미를 절반 이상 버리는 것임을 지적.
계획 Phase 0: 인덱싱 파이프라인 전환 항목 추가 (미완료).
계획 구현 원칙: 멀티모달 직접 임베딩 전환 플로우 및 기존 텍스트 추출
파이프라인 제거 방향 명시.

Co-Authored-By: Claude Sonnet 4.6 <noreply@anthropic.com>
2026-03-17 17:04:53 +09:00
c6a36e0bdf docs: 진짜 RAG 구조(LLM 컨텍스트 기반 답변 생성) 명시
리서치 Fact 7: 현재 구조는 RAG가 아님을 명시. 검색만 있고 LLM 생성이
없는 규칙 기반 문자열 조합임을 지적. LLM 기반 전환 필요 방향 추가.
리서치 결론: 가장 근본 원인으로 RAG 구조 부재 추가. 구현 항목 4가지로 갱신.
계획 구현 원칙: RAG 전환 플로우(임베딩→검색→청크선별→LLM→답변) 명시.
계획 Phase 4: 규칙 문자열 조합 → LLM 호출로 대체하는 구체적 플로우 추가.

Co-Authored-By: Claude Sonnet 4.6 <noreply@anthropic.com>
2026-03-17 17:02:34 +09:00
60cc3841cb docs: skill-rag-file ChromaDB→PostgreSQL 전환 필요 사항 명시
리서치 Fact 14: skill-rag-file 문서 청크가 여전히 ChromaDB에 저장 중이며
운영 원칙(PostgreSQL 중심)과 불일치 상태임을 명시.
계획 Phase 0 표: rb8001 메모리(확정)와 skill-rag-file 청크(미완료) 저장
경로를 분리해 pgvector 전환 필요 항목으로 추가.

Co-Authored-By: Claude Sonnet 4.6 <noreply@anthropic.com>
2026-03-17 16:43:35 +09:00
6f6af521a1 docs: Company X RAG 문서 세트 전면 현행화 (97%+ 완벽도 목표)
- SKILL.md: 384d → Gemini Embedding 2 / 768d 전환 반영, PostgreSQL 저장 경로, NAS 원본 경로 추가
- 트러블슈팅: 존재하지 않는 worklog 참조 제거, 실제 코드 검토 기반 종결 근거로 교체, 잔여 조건 명시
- 시나리오: 상태를 구현완료_검증대기로 갱신, 구현 반영 상태 추가, 닫힘까지 남은 작업 4건 구체화
- 리서치: Unresolved 6건 중 확정 3건 닫기(임베딩 차원, 적합도 판정, 수치형 판정), 미확정 3건만 잔류
- 계획: Phase 0을 표 형식으로 현행화(확정/인지/미완료 구분), Phase 5 자동화+수동 검증 구체화
- 아이디어: 후속 진행 상태 및 임베딩 전환 확정 사항 추가

Co-Authored-By: Claude Opus 4.6 <noreply@anthropic.com>
2026-03-17 15:05:28 +09:00
28d722d543 docs: 청킹-임베딩 전제 불일치 미완료 항목 추가
Gemini Embedding 2 전환 후에도 skill-rag-file 청킹 로직(char_per_token=4,
영어 기준 고정값)이 그대로이며, PDF 직접 임베딩 경로가 미구현 상태임을
미완료 항목에 명시.

Co-Authored-By: Claude Sonnet 4.6 <noreply@anthropic.com>
2026-03-17 14:58:06 +09:00
45f6ddf79e Update Company X RAG research and plan 2026-03-17 12:00:57 +09:00
happybell80
0593dae69b docs: companyx grounding 코드 검토 결과 문서 현행화
계획 문서 상태 planned→구현완료_미검증, 리서치 문서에 outdated 사실 섹션 추가,
코드 검토 worklog 신규 작성. 코드 수정 없음.

Co-Authored-By: Claude Sonnet 4.6 <noreply@anthropic.com>
2026-03-17 11:12:16 +09:00
2db6a29640 docs: 312 출처 표기 방법 섹션 추가, journey 문서 동기화
Made-with: Cursor
2026-03-17 03:20:48 +09:00