tags: [robeing, companyx, rag, ideas, knowledge-grounding] # Company X 내부 문서 RAG 응답 아이디어 ## 배경 - 로빙은 이미 `skill-rag-file`을 통해 문서를 텍스트로 처리하고 검색할 수 있지만, Company X 내부 NAS 문서를 `Company X 업무 근거`로 안정적으로 활용하는 사용자 경험은 아직 고정되지 않았습니다. - Company X 관련 질문은 일반 웹 지식이 아니라 내부 파일의 실제 내용과 표현을 근거로 답해야 가치가 생깁니다. - 이번 아이디어는 "Company X 소속 사용자 질문에는 Company X 내부 문서를 우선 근거로 삼아 답하는 로빙" 방향을 열어두기 위한 문서입니다. ## 핵심 아이디어 ### 1. Company X 내부 문서를 별도 지식 원천으로 다룬다 - 내부 NAS에 있는 Company X 파일을 로빙이 읽기 쉬운 텍스트 단위로 정리합니다. - 이 데이터는 일반 사용자 업로드 문서와 섞지 않고, `Company X 내부 지식`이라는 별도 검색 맥락으로 다룹니다. - 원본 파일 경로, 문서 제목, 문단/페이지 위치 같은 근거 메타데이터를 함께 남깁니다. ### 2. 사용자 소속에 따라 답변 근거 우선순위를 다르게 둔다 - Company X 소속 사용자라면 관련 질문에 대해 내부 문서를 우선 검색합니다. - 내부 문서에 근거가 있으면 일반 웹 정보보다 내부 문서를 우선 인용합니다. - 근거가 약하거나 없으면 모른다고 말하고, 어떤 내부 근거가 부족한지 드러냅니다. ### 3. 답변은 결론보다 근거를 먼저 보이게 한다 - 로빙은 단순 요약이 아니라, "어떤 문서의 어떤 내용 때문에 이렇게 답하는지"를 함께 보여줘야 합니다. - 따라서 답변 구조는 `질문에 대한 직접 답변 + 근거 문서/문단 + 필요한 경우 후속 확인 제안` 형태가 적합합니다. ## 기대 효과 - Company X 구성원은 로빙을 일반 챗봇이 아니라 내부 문서 기반 업무 보조자로 인식할 수 있습니다. - 같은 질문에 대해 추측성 답변보다 실제 파일 근거가 먼저 나오므로 신뢰도가 높아집니다. - 이후 계획 단계에서 `권한`, `문서 정제 방식`, `근거 노출 형식`, `색인 범위`를 더 구체적으로 좁힐 수 있습니다. ## 왜 아직 아이디어 단계인가 - 어떤 파일 형식을 우선 색인할지 아직 고정되지 않았습니다. - Company X 소속 판별 기준과 권한 경계가 아직 제품 규칙으로 정해지지 않았습니다. - 내부 문서를 그대로 청킹할지, 사람이 읽기 쉬운 중간 RAG 포맷으로 먼저 변환할지 아직 결정되지 않았습니다. - 답변에 어느 수준까지 근거를 노출할지, 원문 인용 범위를 어떻게 제한할지도 미확정입니다. ## 검증이 필요한 질문 1. Company X 내부 문서 중 실제 질문 빈도가 높은 문서군은 무엇인가 2. RAG 입력은 원본 파일 직접 청킹과 중간 정제 포맷 중 무엇이 더 안정적인가 3. Company X 소속 사용자 식별은 어떤 인증/권한 신호로 고정할 것인가 4. 답변 근거를 문서 경로, 제목, 문단 수준 중 어디까지 보여주는 것이 적절한가 ## 다음 단계 후보 1. 실제 Company X 파일 유형을 분류하는 `research` 2. 기대 사용자 질문과 바람직한 답변 흐름을 적는 `scenarios` 3. 권한 경계와 검색 우선순위를 고정하는 `plans` ## 관련 문서 - [컴퍼니엑스(Company X) 개요](../../book/500_business/560_컴퍼니엑스_개요.md) - [RAG 시스템 파일 처리 아키텍처](./250909_RAG_file_processing_architecture.md) - [skill-rag-file 초기 구축](../troubleshooting/250915_skill-rag-file_초기_구축.md)