30 Commits

Author SHA1 Message Date
27ca166bcf open: keyword 단독 0건 트러블 + MeCab vs pg_trgm 근본해결 리서치
- 트러블: simple 토크나이저 한국어 구조적 한계 확정
- 리서치: MeCab-ko(근본 해결) vs pg_trgm(물리적 보완) 비교
- 근본 해결 1순위: MeCab-ko, 현실적 1단계: pg_trgm (보완 명시 필수)

Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>
2026-03-22 10:18:01 +09:00
74503ab24b docs(research/rag): PostgreSQL 한국어 FTS·키워드 검색 한계 요약
Made-with: Cursor
2026-03-22 10:06:12 +09:00
4a356a9542 fix: 문서 정리 — closed_reason 최종 결과 반영 (17/17 100%), 평가서 최종 검증 결과 추가
Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>
2026-03-22 09:52:18 +09:00
ad89e58179 close: 트러블+리서치+계획 3건 닫기 — 파일명 보조 검색 P0 완료, B 유형 후속 분리
Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>
2026-03-22 09:34:40 +09:00
d625a41ef8 docs: 트러블 보정 + 리서치(원인 3건) + 계획(P0 파일명검색 + P1 맥락전달)
- A1: 이미지 PDF chunk_text OCR 깨짐 → 파일명 보조 검색으로 해소
- B: grounding 독립 검색 → 이전 결과 컨텍스트 전달
- 테스트 결과 A 5건 기록 (3 PASS, 2 FAIL)

Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>
2026-03-22 09:27:47 +09:00
21b0d5b9ce close: RAG 열린 문서 8/10 닫기 — 200개 기준 구현 완료
- 아이디어 1: 계획 1~3차 + 적용1로 채택 완료
- 2차 계획: PGVector 적재 + tsvector + 하이브리드 + AGE 구현 완료
- 리서치 6: 설계 목적 달성, Unresolved는 후속 문서로 이관
- 남은 열린 문서: 1차 계획(본문 미추출), 3차 계획(OCR/동기화)

Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>
2026-03-22 09:07:48 +09:00
915fed980f docs: 열린 RAG 문서 8건 현재 구현 상태 동기화 (260322)
- 리서치 6건 + 1차 계획 + 아이디어: 현재 상태 보정 섹션 통일
- tsvector/하이브리드/AGE 구현 완료 반영, DB 수치 갱신
- 설계 별칭-운영 실체 매핑 명시, Unresolved 보강

Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>
2026-03-22 08:42:55 +09:00
47057380a8 docs: sync companyx rag open docs with runtime state 2026-03-22 08:22:54 +09:00
0364e2f424 docs: 260320 RAG·workflow 프론트메타 type/tags 정비
Made-with: Cursor
2026-03-22 08:15:47 +09:00
c272340fd3 close: CompanyX RAG 계열 닫힌 문서 20건 프론트메타 일괄 반영
- 260312/260315/260316 계열 트러블/리서치/계획/시나리오/워크로그
- 본문에만 닫힘 표기되어 있던 문서에 status: closed 프론트메타 추가
- 열린 문서는 260320 다형식문서 RAG 체인 10개만 남음

Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>
2026-03-22 07:59:29 +09:00
6c37b1afc7 close: RAG 관련 문서 5건 프론트메타로 닫기
- 260312 리서치: 근거응답 현황 → closed
- 260315 리서치: 답변합성 시나리오동시종결 → closed
- 260321 리서치: keyword recall0 원인확정 → closed
- 260320 적용1 계획: 검증 16개 기입 완료 → closed
- 260321 품질개선 계획: P0+P1 완료 → closed

Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>
2026-03-21 16:30:07 +09:00
59eeec2117 docs: 벡터 검색 실패 원인 확정 — 쿼리-문서 임베딩 거리 문제 실측
- 옐로펀치 MOU: 인덱싱 완료, 임베딩 정상, 문서간 유사도 0.8+
- 쿼리 임베딩과 문서 청크 간 cosine 거리가 멀어 top-50에도 미등장
- Gemini 비대칭 임베딩(RETRIEVAL_QUERY vs DOCUMENT)의 한계 확인
- keyword 보완 실패와 합쳐 이중 실패 구조 확정

Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>
2026-03-21 15:56:17 +09:00
cb39cbd8ee fix: keyword recall=0 리서치에 threshold 스케일 불일치 원인 추가 (23서버 실측)
- threshold 0.35에서 ts_rank 최대 0.089이므로 전부 필터링되는 문제 확인
- 교착어 미처리와 threshold 불일치가 중첩 원인임을 명시
- 우선순위 1(즉시 적용): threshold 분리 + prefix 매칭 동시 적용 제안

Co-Authored-By: Claude Opus 4.6 <noreply@anthropic.com>
2026-03-21 15:50:30 +09:00
9bd9459912 docs: RRF score와 threshold 스케일 불일치 원인 추가
- RRF 점수(0.01~0.03)가 threshold(0.35)와 스케일 불일치 확인
- vector_score OR 조건으로 우회되지만 relevance_score 기준 정렬에 영향
- 실측 데이터 추가 (hybrid rrf=0.032 vs vector=0.775)

Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>
2026-03-21 15:48:33 +09:00
3e78c7cf6e docs: 하이브리드 검색 keyword recall=0 및 grounding 실패 원인 확정 리서치
- keyword recall 0: simple 토크나이저가 한국어 조사 분리 불가 (실측 recall 27%)
- grounding 실패 3계층: 검색(8건), 라우팅 마커(3건), LLM 판단(정상)
- prefix 매칭(:*) 적용 시 recall 27%→90% 즉시 개선 가능

Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>
2026-03-21 15:44:44 +09:00
67e33826c2 docs: OCR 모델 벤치마크 리서치 추가, skill-rag-file에 OCR 모델(gemini-2.0-flash) 기록
Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>
2026-03-21 10:44:57 +09:00
3a06a3f20f docs: 그래프 확장 방향 변경 — 재귀 CTE에서 Apache AGE로, 계획 문서에 링크 반영
Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>
2026-03-20 17:36:37 +09:00
happybell80
8226affa9a docs: add multimodal rag research set 2026-03-20 12:43:52 +09:00
f5b12dcee5 docs: Company X RAG 시나리오·아이디어·리서치·계획 현행화, Gemini Embedding 2 리서치 보강
Made-with: Cursor
2026-03-17 20:02:22 +09:00
b8e1775887 Close Gemini embedding phase one 2026-03-16 23:35:19 +09:00
0be1fb8eba Refine Gemini embedding phase-one closure docs 2026-03-16 22:49:27 +09:00
happybell80
12a0842cc5 docs(1차): 임베딩 문제·리서치·계획 문서 보강, 계획 95%+ 완성도
Made-with: Cursor
2026-03-16 13:45:15 +09:00
happybell80
d3e67ce517 docs: 임베딩 env SSOT 문서 반영, 1차 문서 보강
Made-with: Cursor
2026-03-16 13:36:11 +09:00
happybell80
32094f7438 docs: 임베딩 전환 1차·2차 분리 (6개 문서)
1차 (로빙, 완전 닫힘 가능):
- 트러블, 리서치, 플랜
- skill-embedding, skill-rag-file, rb8001
- 닫힘 조건 명확

2차 (StarsAndI·GooseCouncil, 열어둠):
- 트러블, 리서치, 플랜
- 카탈로그 5044개 재임베딩 등 비용 큰 항목
- 1차 완료 후 진행

기존 3개 문서: 1차·2차 링크로 리다이렉트

Made-with: Cursor
2026-03-16 13:22:59 +09:00
happybell80
db277adeae docs: StarsAndI 임베딩 상세 리서치 반영
- §2.2: 카탈로그 5044개, add_star_embeddings.py, 153MB JSON
- §3.2: 영향 파일 전수 (recommend, add_star_embeddings, time_recommend_*)
- 사실/해석/미확정: 카탈로그 재임베딩, 비용
- 트러블 영향 범위: StarsAndI 상세 추가

Made-with: Cursor
2026-03-16 13:17:24 +09:00
happybell80
66e3730fe1 docs: 임베딩 전환 영향 범위 전수 표기
- 리서치 §3: robeing/StarsAndI/TheGooseCouncil/companyx/인프라/DB 상세 테이블
- 트러블슈팅: 영향 범위 요약 + 리서치 §3 링크

Made-with: Cursor
2026-03-16 13:15:12 +09:00
happybell80
6e5c439a49 docs: 임베딩 전체 프로젝트 현황·SSOT 리서치 보강
- 신규: 260316_임베딩_전체프로젝트_현황_및_SSOT_리서치
  - robeing, StarsAndI, TheGooseCouncil, companyx 등 전수 조사
  - 0_VALUE 정책 불일치 요약, SSOT 설정 방안
- 트러블-리서치 연결: 이 문서가 여는 리서치 섹션 추가
- 260315: 전수 교체 정책 반영, 현황 리서치 링크
- 계획: 전수 교체 목표, 전체 프로젝트 적용 범위

Made-with: Cursor
2026-03-16 13:12:40 +09:00
happybell80
a9627edebf docs: 임베딩 Gemini Embedding 2 전환 트러블슈팅·계획 문서 추가
- 트러블슈팅: 문제 정의, 현재/기대 상태, 재현 조건, 확인된 사실, 미확정 항목
- 계획: 목표, 범위, 적용 순서, 검증 기준
- 리서치 문서에 후속 문서 링크 추가
- README에 새 문서 등록

Made-with: Cursor
2026-03-16 12:49:19 +09:00
happybell80
3ef6c27b5e docs: Gemini Embedding 2 리서치 문서 추가
Made-with: Cursor
2026-03-15 23:39:45 +09:00
Claude-51124
22557e7132 docs: 오래된 트러블슈팅 아카이브 및 구조 정리
- 7-8월 초기 구축 문서 12개를 _archive/troubleshooting/2025_07-08_initial_setup/로 이동
- book/300_architecture/390_human_in_the_loop_intent_learning.md를 journey/research/intent_classification/로 이동 (개발 여정 문서)
- 빈 폴더 제거 (journey/assets/*)
2025-11-17 14:06:05 +09:00