20 Commits

Author SHA1 Message Date
6c37b1afc7 close: RAG 관련 문서 5건 프론트메타로 닫기
- 260312 리서치: 근거응답 현황 → closed
- 260315 리서치: 답변합성 시나리오동시종결 → closed
- 260321 리서치: keyword recall0 원인확정 → closed
- 260320 적용1 계획: 검증 16개 기입 완료 → closed
- 260321 품질개선 계획: P0+P1 완료 → closed

Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>
2026-03-21 16:30:07 +09:00
59eeec2117 docs: 벡터 검색 실패 원인 확정 — 쿼리-문서 임베딩 거리 문제 실측
- 옐로펀치 MOU: 인덱싱 완료, 임베딩 정상, 문서간 유사도 0.8+
- 쿼리 임베딩과 문서 청크 간 cosine 거리가 멀어 top-50에도 미등장
- Gemini 비대칭 임베딩(RETRIEVAL_QUERY vs DOCUMENT)의 한계 확인
- keyword 보완 실패와 합쳐 이중 실패 구조 확정

Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>
2026-03-21 15:56:17 +09:00
cb39cbd8ee fix: keyword recall=0 리서치에 threshold 스케일 불일치 원인 추가 (23서버 실측)
- threshold 0.35에서 ts_rank 최대 0.089이므로 전부 필터링되는 문제 확인
- 교착어 미처리와 threshold 불일치가 중첩 원인임을 명시
- 우선순위 1(즉시 적용): threshold 분리 + prefix 매칭 동시 적용 제안

Co-Authored-By: Claude Opus 4.6 <noreply@anthropic.com>
2026-03-21 15:50:30 +09:00
9bd9459912 docs: RRF score와 threshold 스케일 불일치 원인 추가
- RRF 점수(0.01~0.03)가 threshold(0.35)와 스케일 불일치 확인
- vector_score OR 조건으로 우회되지만 relevance_score 기준 정렬에 영향
- 실측 데이터 추가 (hybrid rrf=0.032 vs vector=0.775)

Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>
2026-03-21 15:48:33 +09:00
3e78c7cf6e docs: 하이브리드 검색 keyword recall=0 및 grounding 실패 원인 확정 리서치
- keyword recall 0: simple 토크나이저가 한국어 조사 분리 불가 (실측 recall 27%)
- grounding 실패 3계층: 검색(8건), 라우팅 마커(3건), LLM 판단(정상)
- prefix 매칭(:*) 적용 시 recall 27%→90% 즉시 개선 가능

Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>
2026-03-21 15:44:44 +09:00
67e33826c2 docs: OCR 모델 벤치마크 리서치 추가, skill-rag-file에 OCR 모델(gemini-2.0-flash) 기록
Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>
2026-03-21 10:44:57 +09:00
3a06a3f20f docs: 그래프 확장 방향 변경 — 재귀 CTE에서 Apache AGE로, 계획 문서에 링크 반영
Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>
2026-03-20 17:36:37 +09:00
happybell80
8226affa9a docs: add multimodal rag research set 2026-03-20 12:43:52 +09:00
f5b12dcee5 docs: Company X RAG 시나리오·아이디어·리서치·계획 현행화, Gemini Embedding 2 리서치 보강
Made-with: Cursor
2026-03-17 20:02:22 +09:00
b8e1775887 Close Gemini embedding phase one 2026-03-16 23:35:19 +09:00
0be1fb8eba Refine Gemini embedding phase-one closure docs 2026-03-16 22:49:27 +09:00
happybell80
12a0842cc5 docs(1차): 임베딩 문제·리서치·계획 문서 보강, 계획 95%+ 완성도
Made-with: Cursor
2026-03-16 13:45:15 +09:00
happybell80
d3e67ce517 docs: 임베딩 env SSOT 문서 반영, 1차 문서 보강
Made-with: Cursor
2026-03-16 13:36:11 +09:00
happybell80
32094f7438 docs: 임베딩 전환 1차·2차 분리 (6개 문서)
1차 (로빙, 완전 닫힘 가능):
- 트러블, 리서치, 플랜
- skill-embedding, skill-rag-file, rb8001
- 닫힘 조건 명확

2차 (StarsAndI·GooseCouncil, 열어둠):
- 트러블, 리서치, 플랜
- 카탈로그 5044개 재임베딩 등 비용 큰 항목
- 1차 완료 후 진행

기존 3개 문서: 1차·2차 링크로 리다이렉트

Made-with: Cursor
2026-03-16 13:22:59 +09:00
happybell80
db277adeae docs: StarsAndI 임베딩 상세 리서치 반영
- §2.2: 카탈로그 5044개, add_star_embeddings.py, 153MB JSON
- §3.2: 영향 파일 전수 (recommend, add_star_embeddings, time_recommend_*)
- 사실/해석/미확정: 카탈로그 재임베딩, 비용
- 트러블 영향 범위: StarsAndI 상세 추가

Made-with: Cursor
2026-03-16 13:17:24 +09:00
happybell80
66e3730fe1 docs: 임베딩 전환 영향 범위 전수 표기
- 리서치 §3: robeing/StarsAndI/TheGooseCouncil/companyx/인프라/DB 상세 테이블
- 트러블슈팅: 영향 범위 요약 + 리서치 §3 링크

Made-with: Cursor
2026-03-16 13:15:12 +09:00
happybell80
6e5c439a49 docs: 임베딩 전체 프로젝트 현황·SSOT 리서치 보강
- 신규: 260316_임베딩_전체프로젝트_현황_및_SSOT_리서치
  - robeing, StarsAndI, TheGooseCouncil, companyx 등 전수 조사
  - 0_VALUE 정책 불일치 요약, SSOT 설정 방안
- 트러블-리서치 연결: 이 문서가 여는 리서치 섹션 추가
- 260315: 전수 교체 정책 반영, 현황 리서치 링크
- 계획: 전수 교체 목표, 전체 프로젝트 적용 범위

Made-with: Cursor
2026-03-16 13:12:40 +09:00
happybell80
a9627edebf docs: 임베딩 Gemini Embedding 2 전환 트러블슈팅·계획 문서 추가
- 트러블슈팅: 문제 정의, 현재/기대 상태, 재현 조건, 확인된 사실, 미확정 항목
- 계획: 목표, 범위, 적용 순서, 검증 기준
- 리서치 문서에 후속 문서 링크 추가
- README에 새 문서 등록

Made-with: Cursor
2026-03-16 12:49:19 +09:00
happybell80
3ef6c27b5e docs: Gemini Embedding 2 리서치 문서 추가
Made-with: Cursor
2026-03-15 23:39:45 +09:00
Claude-51124
22557e7132 docs: 오래된 트러블슈팅 아카이브 및 구조 정리
- 7-8월 초기 구축 문서 12개를 _archive/troubleshooting/2025_07-08_initial_setup/로 이동
- book/300_architecture/390_human_in_the_loop_intent_learning.md를 journey/research/intent_classification/로 이동 (개발 여정 문서)
- 빈 폴더 제거 (journey/assets/*)
2025-11-17 14:06:05 +09:00