1876 Commits

Author SHA1 Message Date
7388e720d3 fix: 리서치 재작성 — MeCab-ko 비권장, pg_trgm 1순위로 전환
- MeCab-ko: 2026년 유지보수 중단, 사전 노후, PG14 EOL 고려 → 비권장
- pg_trgm: 키워드 축 복구용 병렬 매칭 엔진으로 재정의 (우회가 아님)
- 로빙이 이미 pgvector+하이브리드 운용 중이라는 현실 반영

Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>
2026-03-22 10:32:00 +09:00
27ca166bcf open: keyword 단독 0건 트러블 + MeCab vs pg_trgm 근본해결 리서치
- 트러블: simple 토크나이저 한국어 구조적 한계 확정
- 리서치: MeCab-ko(근본 해결) vs pg_trgm(물리적 보완) 비교
- 근본 해결 1순위: MeCab-ko, 현실적 1단계: pg_trgm (보완 명시 필수)

Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>
2026-03-22 10:18:01 +09:00
74503ab24b docs(research/rag): PostgreSQL 한국어 FTS·키워드 검색 한계 요약
Made-with: Cursor
2026-03-22 10:06:12 +09:00
4a356a9542 fix: 문서 정리 — closed_reason 최종 결과 반영 (17/17 100%), 평가서 최종 검증 결과 추가
Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>
2026-03-22 09:52:18 +09:00
ad89e58179 close: 트러블+리서치+계획 3건 닫기 — 파일명 보조 검색 P0 완료, B 유형 후속 분리
Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>
2026-03-22 09:34:40 +09:00
d625a41ef8 docs: 트러블 보정 + 리서치(원인 3건) + 계획(P0 파일명검색 + P1 맥락전달)
- A1: 이미지 PDF chunk_text OCR 깨짐 → 파일명 보조 검색으로 해소
- B: grounding 독립 검색 → 이전 결과 컨텍스트 전달
- 테스트 결과 A 5건 기록 (3 PASS, 2 FAIL)

Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>
2026-03-22 09:27:47 +09:00
624e563372 open: LLM 판단 과보수 + 대화 맥락 미연결 트러블 + 테스트셋 15개
Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>
2026-03-22 09:23:47 +09:00
7d42aaf38e close: 답변 품질 트러블 닫힘 — evidence_lines 교체 완료
Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>
2026-03-22 09:20:59 +09:00
d12e88a77d open: 답변 품질 트러블 — 장황/무관 문서 혼입/점수 노출
Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>
2026-03-22 09:16:29 +09:00
21b0d5b9ce close: RAG 열린 문서 8/10 닫기 — 200개 기준 구현 완료
- 아이디어 1: 계획 1~3차 + 적용1로 채택 완료
- 2차 계획: PGVector 적재 + tsvector + 하이브리드 + AGE 구현 완료
- 리서치 6: 설계 목적 달성, Unresolved는 후속 문서로 이관
- 남은 열린 문서: 1차 계획(본문 미추출), 3차 계획(OCR/동기화)

Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>
2026-03-22 09:07:48 +09:00
915fed980f docs: 열린 RAG 문서 8건 현재 구현 상태 동기화 (260322)
- 리서치 6건 + 1차 계획 + 아이디어: 현재 상태 보정 섹션 통일
- tsvector/하이브리드/AGE 구현 완료 반영, DB 수치 갱신
- 설계 별칭-운영 실체 매핑 명시, Unresolved 보강

Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>
2026-03-22 08:42:55 +09:00
47057380a8 docs: sync companyx rag open docs with runtime state 2026-03-22 08:22:54 +09:00
741ce44360 docs: 51124 클로드 의견 추가 — 구현↔문서 불일치 직접 경험 기반
Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>
2026-03-22 08:18:40 +09:00
0364e2f424 docs: 260320 RAG·workflow 프론트메타 type/tags 정비
Made-with: Cursor
2026-03-22 08:15:47 +09:00
89c3b83396 docs(valuation): CompanyX RAG 문서 완벽도 평가 및 Cursor 의견 추가
Made-with: Cursor
2026-03-22 08:15:20 +09:00
c272340fd3 close: CompanyX RAG 계열 닫힌 문서 20건 프론트메타 일괄 반영
- 260312/260315/260316 계열 트러블/리서치/계획/시나리오/워크로그
- 본문에만 닫힘 표기되어 있던 문서에 status: closed 프론트메타 추가
- 열린 문서는 260320 다형식문서 RAG 체인 10개만 남음

Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>
2026-03-22 07:59:29 +09:00
9f8fa21830 RAG 워크플로우 정비: 3중 검색 반영 + 단계별 증분 인덱싱 워크플로우 추가
- companyx_grounding_pipeline: team_id 기반 라우팅, 멀티쿼리, hybrid RRF 반영
- rag_search_grounding_request: search_mode, threshold, 점수 필드 추가
- rag_upload_indexing_pipeline: 청킹/임베딩/tsvector 기준 명시
- companyx_incremental_indexing_workflow: 200→2000→5000 단계별 실행 흐름 (신규)
- README: 인덱스에 증분 인덱싱 워크플로우 추가

Co-Authored-By: Claude Opus 4.6 <noreply@anthropic.com>
2026-03-21 16:41:17 +09:00
6c37b1afc7 close: RAG 관련 문서 5건 프론트메타로 닫기
- 260312 리서치: 근거응답 현황 → closed
- 260315 리서치: 답변합성 시나리오동시종결 → closed
- 260321 리서치: keyword recall0 원인확정 → closed
- 260320 적용1 계획: 검증 16개 기입 완료 → closed
- 260321 품질개선 계획: P0+P1 완료 → closed

Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>
2026-03-21 16:30:07 +09:00
2c2d2517ec docs: 260321 품질개선 계획 닫힘 — P0+P1 전부 완료, grounding 5→11
Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>
2026-03-21 16:24:02 +09:00
2b753fd610 docs: P0 검증 결과 기록 — keyword 0→5건, RRF 정규화 동작, grounding 5→8
Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>
2026-03-21 16:16:09 +09:00
270ebb2d24 fix: prefix recall 상한 명시 + 라우팅 완화 범위 위험/롤백 기준 추가
Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>
2026-03-21 16:08:14 +09:00
d526b48d23 fix: 품질개선 계획 보완 — P0-3 옵션 확정, P1-4 실패 대안, P1-5 fallback 확인
Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>
2026-03-21 16:07:28 +09:00
5cc4e5aa08 plan: 하이브리드 검색 품질 개선 계획 (P0 3건 + P1 2건)
- P0: prefix 매칭, keyword threshold 분리, RRF 점수 정규화
- P1: 초과 청크 재분할, grounding 라우팅 완화
- 260321 리서치 원인 5개 → 조치 5개 1:1 매핑

Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>
2026-03-21 16:05:13 +09:00
59eeec2117 docs: 벡터 검색 실패 원인 확정 — 쿼리-문서 임베딩 거리 문제 실측
- 옐로펀치 MOU: 인덱싱 완료, 임베딩 정상, 문서간 유사도 0.8+
- 쿼리 임베딩과 문서 청크 간 cosine 거리가 멀어 top-50에도 미등장
- Gemini 비대칭 임베딩(RETRIEVAL_QUERY vs DOCUMENT)의 한계 확인
- keyword 보완 실패와 합쳐 이중 실패 구조 확정

Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>
2026-03-21 15:56:17 +09:00
cb39cbd8ee fix: keyword recall=0 리서치에 threshold 스케일 불일치 원인 추가 (23서버 실측)
- threshold 0.35에서 ts_rank 최대 0.089이므로 전부 필터링되는 문제 확인
- 교착어 미처리와 threshold 불일치가 중첩 원인임을 명시
- 우선순위 1(즉시 적용): threshold 분리 + prefix 매칭 동시 적용 제안

Co-Authored-By: Claude Opus 4.6 <noreply@anthropic.com>
2026-03-21 15:50:30 +09:00
9bd9459912 docs: RRF score와 threshold 스케일 불일치 원인 추가
- RRF 점수(0.01~0.03)가 threshold(0.35)와 스케일 불일치 확인
- vector_score OR 조건으로 우회되지만 relevance_score 기준 정렬에 영향
- 실측 데이터 추가 (hybrid rrf=0.032 vs vector=0.775)

Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>
2026-03-21 15:48:33 +09:00
3e78c7cf6e docs: 하이브리드 검색 keyword recall=0 및 grounding 실패 원인 확정 리서치
- keyword recall 0: simple 토크나이저가 한국어 조사 분리 불가 (실측 recall 27%)
- grounding 실패 3계층: 검색(8건), 라우팅 마커(3건), LLM 판단(정상)
- prefix 매칭(:*) 적용 시 recall 27%→90% 즉시 개선 가능

Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>
2026-03-21 15:44:44 +09:00
0a967ce7c1 fix: SKILL.md를 3중 검색 + CompanyXRAGOutput 기준으로 정합화
- 검색 경로에 벡터+키워드+그래프 RRF 합산 명시
- Storage에 AGE 추가
- Question Types 4종 섹션 추가
- Response Shape를 Pydantic 모델 기준으로 갱신

Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>
2026-03-21 13:04:53 +09:00
872ae14f73 fix: RAG 계획/SKILL.md stale 값 정리 및 검증 기록란 추가
- SKILL.md: ChromaDB 병행 → pgvector 단일 운영, 대표 파일 2개 → 200개 인덱싱 현황으로 갱신
- 1차 계획: 완료 조건에 본문 미추출(99.7%) 미완료 상태 명시, 1:1 대응 차이 수치 반영
- 적용1 계획: 샘플 질문 16개 검증 결과 기록 테이블 추가

Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>
2026-03-21 12:22:57 +09:00
0252dd1a7f fix: 51123 서버 IP 주소 업데이트 (성수 이전)
192.168.219.45 → 192.168.0.100 일괄 변경

Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>
2026-03-21 11:52:26 +09:00
2d1503921d docs: 콜드메일 리스트 현황 기록, OCR fallback 자동 동작 명시
Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>
2026-03-21 11:01:50 +09:00
67e33826c2 docs: OCR 모델 벤치마크 리서치 추가, skill-rag-file에 OCR 모델(gemini-2.0-flash) 기록
Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>
2026-03-21 10:44:57 +09:00
4f2b392918 docs: 로빙평가 링크 형식, 결과 페이지, DB 구조 문서화
Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>
2026-03-20 23:12:57 +09:00
ae3aae5840 docs: skill-slack 콜드메일 리스트 7개 컬럼 매핑, 로빙평가 흐름, 확인 방법 문서화
Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>
2026-03-20 22:46:31 +09:00
92c420c93f docs: skill-slack 기본 토큰 컴퍼니엑스 전환 완료, 리스트 정상 동작 확인
Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>
2026-03-20 22:30:37 +09:00
e7333d88ff docs: skill-slack SKILL.md에 리스트 CRUD API + 컴퍼니엑스 콜드메일 리스트 정보 추가
Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>
2026-03-20 22:18:42 +09:00
4b8edbf77f fix: update legacy IP 192.168.219.52 → 192.168.0.106 in failover plan (SSOT alignment)
Co-Authored-By: Claude Opus 4.6 <noreply@anthropic.com>
2026-03-20 17:59:32 +09:00
0e6e8d71c2 docs(workflow/rag): Markdown 중간표현 SSOT 요약 및 RAG 인덱스 연결
Made-with: Cursor
2026-03-20 17:51:24 +09:00
99d2f314fb docs: 금지 원칙 명시 — 질문별 하드코딩 특례/폴백/예외 분기 추가 금지
Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>
2026-03-20 17:50:48 +09:00
e8d3511fd8 docs: 샘플 검증 질문을 200개 파일 실제 내용 기반으로 교체 (투자조합/TIPS/오늘전통/실패 검증)
Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>
2026-03-20 17:49:24 +09:00
bae070c352 docs: RAG 계획 4건 코드 현실 반영 — 기존 테이블/구현 상태/미구현 항목 명시
Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>
2026-03-20 17:48:33 +09:00
25db212d80 docs: 260315 계획 닫기 → 260320 흡수, 시나리오 닫기, 워크로그 작성
Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>
2026-03-20 17:43:01 +09:00
1722d16e32 docs: 키워드 검색(TSVECTOR) 미구현 상태 명시, 적용1 흐름에 벡터+키워드+그래프 3중 검색 반영
Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>
2026-03-20 17:38:42 +09:00
3a06a3f20f docs: 그래프 확장 방향 변경 — 재귀 CTE에서 Apache AGE로, 계획 문서에 링크 반영
Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>
2026-03-20 17:36:37 +09:00
271b74322d docs: RAG 계획 문서 현재 상태 반영 — 200개 파일 인덱싱 완료, 닫는 조건 정의
Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>
2026-03-20 17:31:31 +09:00
e8ab0d2ba7 docs: 스트림데이터 MD/위키 통합 지식베이스 사업화 리서치 추가
Gemini 대화 기반 — 인제션 아키텍처, 가치 판단 필터링, 프롬프트 DB 시너지,
위키 통합, 사업화 검토, 핵심 비판 4가지, RBAC 구현 전략 정리

Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>
2026-03-20 14:23:20 +09:00
happybell80
13d3a0b42e docs: add multimodal rag idea and phased plans 2026-03-20 13:00:00 +09:00
happybell80
8226affa9a docs: add multimodal rag research set 2026-03-20 12:43:52 +09:00
8b5f028327 docs: credential 설정 가이드를 README에 통합 (SSOT)
공통 Slack credential/App 설정을 README 1곳에 두고, 개별 MD에서 링크.
slack_basic_dialogue.md는 워크플로우 고유 설정만 유지.

Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>
2026-03-19 23:12:22 +09:00
b0bb4c6007 fix: 워크플로우 JSON settings.notes를 Sticky Note 노드로 교체
settings.notes는 n8n 공식 필드가 아님.
n8n 표준인 stickyNote 노드로 260319 변경사항 기록.
- slack_basic_dialogue: 프롬프트 DB, 이력 전달, neutral 생략
- companyx_grounding_pipeline: 영향 없음 (skip_default_prompt)
- diary_reflection_pipeline: 영향 있음 (톤 변화 가능)

Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>
2026-03-19 22:59:46 +09:00