DOCS/01_Terminology/grounding_용어집.md
2026-03-22 15:34:26 +09:00

2.6 KiB

type, tags, created_date, last_verified, scope, upper_principle
type tags created_date last_verified scope upper_principle
governance
terminology
grounding
rag
companyx
2026-03-23 2026-03-23 robeing 프로젝트 전체 /home/admin/0_VALUE/00_Foundations/global-principles.md

Grounding 용어집

Grounding (근거 기반 답변)

LLM이 답변할 때 내부 문서에서 근거를 찾아 명시하는 프로세스. 추측이나 외부 지식이 아니라 검색된 문서 내용만을 근거로 답변하고, 어떤 문서가 근거인지 함께 제시한다. 근거가 부족하면 "모른다"고 명시한다.

RAG (Retrieval-Augmented Generation)

검색(Retrieval) + 생성(Generation)을 결합한 구조. 먼저 관련 문서를 검색하고, 검색 결과를 LLM 컨텍스트에 넣어 답변을 생성한다. Grounding은 RAG의 출력 원칙이다.

여러 검색 방식을 결합하여 결과를 합산하는 검색 구조.

로빙의 현재 하이브리드 검색 축:

  • 벡터 검색 (pgvector): 의미 유사도 기반
  • 키워드 검색 (tsvector + pg_trgm): 텍스트 매칭 기반
  • 파일명 검색 (ILIKE): 파일명 토큰 매칭
  • 그래프 검색 (Apache AGE): 문서 관계 기반

RRF (Reciprocal Rank Fusion)

여러 검색 결과의 순위를 합산하는 알고리즘. score = 1/(k + rank). 로빙에서는 벡터·키워드·파일명·그래프 결과를 RRF로 합산 후 0~1 정규화.

CompanyXRAGOutput

grounding 응답의 Pydantic 검증 모델.

필드 설명
direct_answer 1~3문장 답변. 근거 부족 시 빈 문자열
evidence_docs 근거 문서 파일명 목록
failure_reason 답변 불가 사유. 정상이면 null

Grounding 경로 진입 조건

조건 설명
team_id == COMPANYX_TEAM_ID Company X 팀 사용자면 자동 진입
검색 결과 0건 failure 응답 반환 후 일반 경로로 fallback

질문 유형 (Question Types)

유형 트리거 예시
fact_check 기본값 "근거 있어?", "협력 관계야?"
explanatory "뭐야?", "설명해줘" "X-COURSE가 뭐야?"
quantitative "몇 개야?", "얼마나?" "투자사 몇 개야?"
recap "다시 정리해줘" "근거 문서명만 다시"

관련 문서