docs: add Company X RAG idea and scenario

This commit is contained in:
Claude-51124 2026-03-12 21:15:52 +09:00
parent 91349beaeb
commit 984307f882
3 changed files with 127 additions and 0 deletions

View File

@ -0,0 +1,51 @@
tags: [robeing, companyx, rag, ideas, knowledge-grounding]
# Company X 내부 문서 RAG 응답 아이디어
## 배경
- 로빙은 이미 `skill-rag-file`을 통해 문서를 텍스트로 처리하고 검색할 수 있지만, Company X 내부 NAS 문서를 `Company X 업무 근거`로 안정적으로 활용하는 사용자 경험은 아직 고정되지 않았습니다.
- Company X 관련 질문은 일반 웹 지식이 아니라 내부 파일의 실제 내용과 표현을 근거로 답해야 가치가 생깁니다.
- 이번 아이디어는 "Company X 소속 사용자 질문에는 Company X 내부 문서를 우선 근거로 삼아 답하는 로빙" 방향을 열어두기 위한 문서입니다.
## 핵심 아이디어
### 1. Company X 내부 문서를 별도 지식 원천으로 다룬다
- 내부 NAS에 있는 Company X 파일을 로빙이 읽기 쉬운 텍스트 단위로 정리합니다.
- 이 데이터는 일반 사용자 업로드 문서와 섞지 않고, `Company X 내부 지식`이라는 별도 검색 맥락으로 다룹니다.
- 원본 파일 경로, 문서 제목, 문단/페이지 위치 같은 근거 메타데이터를 함께 남깁니다.
### 2. 사용자 소속에 따라 답변 근거 우선순위를 다르게 둔다
- Company X 소속 사용자라면 관련 질문에 대해 내부 문서를 우선 검색합니다.
- 내부 문서에 근거가 있으면 일반 웹 정보보다 내부 문서를 우선 인용합니다.
- 근거가 약하거나 없으면 모른다고 말하고, 어떤 내부 근거가 부족한지 드러냅니다.
### 3. 답변은 결론보다 근거를 먼저 보이게 한다
- 로빙은 단순 요약이 아니라, "어떤 문서의 어떤 내용 때문에 이렇게 답하는지"를 함께 보여줘야 합니다.
- 따라서 답변 구조는 `질문에 대한 직접 답변 + 근거 문서/문단 + 필요한 경우 후속 확인 제안` 형태가 적합합니다.
## 기대 효과
- Company X 구성원은 로빙을 일반 챗봇이 아니라 내부 문서 기반 업무 보조자로 인식할 수 있습니다.
- 같은 질문에 대해 추측성 답변보다 실제 파일 근거가 먼저 나오므로 신뢰도가 높아집니다.
- 이후 계획 단계에서 `권한`, `문서 정제 방식`, `근거 노출 형식`, `색인 범위`를 더 구체적으로 좁힐 수 있습니다.
## 왜 아직 아이디어 단계인가
- 어떤 파일 형식을 우선 색인할지 아직 고정되지 않았습니다.
- Company X 소속 판별 기준과 권한 경계가 아직 제품 규칙으로 정해지지 않았습니다.
- 내부 문서를 그대로 청킹할지, 사람이 읽기 쉬운 중간 RAG 포맷으로 먼저 변환할지 아직 결정되지 않았습니다.
- 답변에 어느 수준까지 근거를 노출할지, 원문 인용 범위를 어떻게 제한할지도 미확정입니다.
## 검증이 필요한 질문
1. Company X 내부 문서 중 실제 질문 빈도가 높은 문서군은 무엇인가
2. RAG 입력은 원본 파일 직접 청킹과 중간 정제 포맷 중 무엇이 더 안정적인가
3. Company X 소속 사용자 식별은 어떤 인증/권한 신호로 고정할 것인가
4. 답변 근거를 문서 경로, 제목, 문단 수준 중 어디까지 보여주는 것이 적절한가
## 다음 단계 후보
1. 실제 Company X 파일 유형을 분류하는 `research`
2. 기대 사용자 질문과 바람직한 답변 흐름을 적는 `scenarios`
3. 권한 경계와 검색 우선순위를 고정하는 `plans`
## 관련 문서
- [컴퍼니엑스(Company X) 개요](../../book/500_business/560_컴퍼니엑스_개요.md)
- [RAG 시스템 파일 처리 아키텍처](./250909_RAG_file_processing_architecture.md)
- [skill-rag-file 초기 구축](../troubleshooting/250915_skill-rag-file_초기_구축.md)

View File

@ -0,0 +1,74 @@
tags: [robeing, companyx, rag, scenarios, user-experience]
# Company X 내부 문서 근거응답 사용자 시나리오
**상태**: 초안
**작성일**: 2026-03-12
**대상 사용자**: Company X 소속으로 인증된 사용자
---
## 현재 체감
- 지금의 로빙은 Company X 내부 파일을 사용자의 질문 맥락에서 안정적으로 근거화해 답하는 경험이 고정돼 있지 않습니다.
- 사용자는 내부 문서에 답이 있을 것 같은 질문도 다시 사람에게 묻거나, 파일을 직접 열어 찾아야 합니다.
## 해결 후 기대 상황
- Company X 소속 사용자가 내부 업무 질문을 하면, 로빙이 Company X 내부 문서를 먼저 검색해 답합니다.
- 답변에는 결론만 아니라 근거 문서명, 관련 문단 요지, 필요한 경우 원문 위치가 함께 제시됩니다.
- 내부 문서에 근거가 부족하면 억지로 답하지 않고, 부족한 근거와 다음 확인 경로를 분명히 말합니다.
## 장면 1. 프로그램 자료를 빠르게 찾고 설명받고 싶다
1. 사용자가 묻습니다. "X-COURSE가 뭐야? 내부 자료 기준으로 설명해줘."
2. 로빙은 Company X 내부 문서에서 `X-COURSE` 관련 소개서, 운영 문서, 제안서 등을 먼저 찾습니다.
3. 로빙은 핵심 설명을 짧게 답한 뒤, 어떤 문서를 근거로 썼는지 함께 보여줍니다.
### 바람직한 답변 예시
> X-COURSE는 Company X가 운영하는 액셀러레이팅 프로그램으로 보입니다.
> 내부 문서 기준으로는 투자 연계, 스타트업 육성, 프로그램 운영 흐름이 반복적으로 언급됩니다.
> 근거: `문서명`, `섹션/페이지`, 해당 문단 요약.
## 장면 2. 문서 속 사실 여부를 확인하고 싶다
1. 사용자가 묻습니다. "오늘전통 프로그램을 Company X가 옐로펀치랑 같이 운영한다는 근거 있어?"
2. 로빙은 관련 제안서, 소개 문서, 보도자료 초안 등에서 공동 운영 표현을 검색합니다.
3. 근거가 있으면 문서 위치를 붙여 답하고, 없으면 없다고 답합니다.
### 바람직한 답변 예시
> 확인된 내부 문서 기준으로는 Company X가 옐로펀치와 공동 운영한다고 적힌 자료가 있습니다.
> 다만 문서마다 표현이 `공동 운영`, `협력 운영`으로 조금 다를 수 있습니다.
> 근거: `문서명`, `문단 요약`, `파일 경로 또는 페이지 위치`.
## 장면 3. 내부 문서에 없는 내용은 모른다고 말해야 한다
1. 사용자가 묻습니다. "이번 달 확정 투자 건수 몇 건이야?"
2. 로빙이 검색했지만 최신 월간 실적 문서나 집계표가 없거나, 값이 서로 다릅니다.
3. 로빙은 추정하지 않고 현재 확보된 근거 범위를 설명합니다.
### 바람직한 답변 예시
> 현재 제가 확인한 Company X 내부 문서만으로는 이번 달 확정 투자 건수를 단정할 수 없습니다.
> 찾은 자료는 과거 보고서와 개별 투자 문서이고, 이번 달 집계표는 아직 보이지 않습니다.
> 가능하면 최신 월간 보고서나 투자 집계 파일을 추가 확인해야 합니다.
## 장면 4. 사용자는 답만 아니라 근거 재사용이 가능해야 한다
1. 사용자가 묻습니다. "이 답을 대표님께 공유하려는데, 근거 문서명만 다시 정리해줘."
2. 로빙은 이전 답변에서 사용한 문서 근거를 다시 짧게 정리합니다.
3. 사용자는 파일을 다시 뒤지지 않고 바로 전달 자료를 만들 수 있습니다.
### 바람직한 답변 예시
> 이번 답변에 사용한 내부 근거 문서는 아래와 같습니다.
> 1. `문서명 A` - 프로그램 개요
> 2. `문서명 B` - 공동 운영 표현 확인
> 3. `문서명 C` - 운영 대상/목적 확인
## 실패 장면
1. 사용자가 내부 자료 기준 답변을 기대하고 질문합니다.
2. 로빙이 내부 문서 대신 일반 웹 정보나 추측으로 먼저 답합니다.
3. 근거 문서가 보이지 않거나, 실제 내부 표현과 다른 내용이 섞입니다.
4. 사용자는 다시 파일을 직접 찾아야 하고, 로빙 답변을 신뢰하지 못합니다.
## 완료 기준 (사용자 기준)
- Company X 소속 사용자가 내부 업무 질문에 대해 "문서 근거가 붙은 답변"을 일관되게 받습니다.
- 근거가 없는 질문에는 추측 대신 부족한 근거를 명확히 안내합니다.
- 사용자가 답변 후 "근거 문서가 뭐냐"를 다시 묻는 빈도가 줄어듭니다.
## 연결 문서
- [Company X 내부 문서 RAG 응답 아이디어](../ideas/260312_companyx_내부문서_rag_응답_아이디어.md)
- [컴퍼니엑스(Company X) 개요](../../book/500_business/560_컴퍼니엑스_개요.md)

View File

@ -44,6 +44,7 @@
- ✅ 일반 대화 및 질문 답변 `troubleshooting/251126_intent_3step_db_bayesian_integration.md`
- ✅ 웹 프론트엔드 채팅 및 IR 덱 관련 질문 `ir_deck_evaluation_scenario.md`
- 📝 Company X 내부 문서 근거응답 기대 시나리오 `260312_companyx_내부문서_근거응답_사용자시나리오.md`
## 사용자 설정
@ -62,6 +63,7 @@
- [자기개선 루프 미팅 요약 시나리오 (260303)](./260303_자기개선루프_미팅요약_피드백_시나리오.md)
- [51124 먹통 사건 사용자 시나리오 (260304)](./260304_아침브리핑_지연_먹통_복구_사용자시나리오.md)
- [아침 브리핑 형식 혼선과 동남아 영어 노출 사용자 시나리오 (260305)](./260305_아침브리핑_형식혼선과_동남아영어노출_사용자시나리오.md)
- [Company X 내부 문서 근거응답 사용자 시나리오 (260312)](./260312_companyx_내부문서_근거응답_사용자시나리오.md)
---