1.9 KiB
1.9 KiB
260320 로빙 다형식문서 RAG 적용 1차 계획
목적
- 앞선 1~3차 산출물을 로빙 실제 질의 응답 경로에 연결하는 첫 적용 단계를 정의한다.
- 목표는 "질문 -> 관련 문서 회수 -> 근거 기반 응답"의 최소 폐회로를 만드는 것이다.
참조 문서
- 다형식문서 자동지식화 RAG 파이프라인 아이디어
- 다형식문서 RAG 1차 MD·메타 정규화 계획
- 다형식문서 RAG 2차 PGVector·JSONB 적재 계획
- 다형식문서 RAG 3차 OCR·관계확장·동기화 계획
적용 범위
rb8001- 필요시
skill-rag-file - 문서 회수와 근거 응답에 필요한 최소 질의 경로
최소 동작 흐름
- 사용자 질문 수신
- 메타 필터 후보 결정
- PGVector/키워드 검색
- 관련 문서 확장
- 근거 청크 선택
- 로빙 응답 생성
- 사용한 근거 기록
1차 목표
- 로빙이 "찾아보겠습니다" 수준이 아니라 실제 근거 문서를 제시하게 한다.
- 근거 문서명, 경로, 핵심 문단을 응답에 포함하게 한다.
- retrieval 실패와 generation 실패를 분리해 로그에 남긴다.
샘플 검증 질문
- 계약/MOU 근거 질문
- 특정 프로그램 운영 근거 질문
- 보고서 내 수치/표 근거 질문
완료 조건
- 대표 질문셋에서 근거 문서 회수가 실제로 일어난다.
- 근거 없는 경우와 검색 실패 경우를 구분해 응답한다.
- 응답 로그에 사용 문서와 청크가 남는다.
보류
- 완전 자동 자가개선
- 모든 파일 유형에 대한 완전 멀티모달 해석
- 대규모 그래프 탐색 기반 답변