From 3f296b720665bde492ce668899214112d3b502a5 Mon Sep 17 00:00:00 2001 From: Claude-51124 Date: Mon, 15 Sep 2025 22:16:52 +0900 Subject: [PATCH] =?UTF-8?q?docs:=20skill-rag-file=20=ED=8F=AC=ED=8A=B8?= =?UTF-8?q?=EB=A5=BC=208508=EB=A1=9C=20=EC=84=A4=EC=A0=95=20=EB=B0=8F=20?= =?UTF-8?q?=EC=8B=9C=EC=8A=A4=ED=85=9C=20=EA=B5=AC=EC=84=B1=20=EC=84=B9?= =?UTF-8?q?=EC=85=98=20=EC=B6=94=EA=B0=80?= MIME-Version: 1.0 Content-Type: text/plain; charset=UTF-8 Content-Transfer-Encoding: 8bit --- ...250909_RAG_file_processing_architecture.md | 19 +++++++++++++++---- 1 file changed, 15 insertions(+), 4 deletions(-) diff --git a/ideas/250909_RAG_file_processing_architecture.md b/ideas/250909_RAG_file_processing_architecture.md index f54c30f..fc3aa23 100644 --- a/ideas/250909_RAG_file_processing_architecture.md +++ b/ideas/250909_RAG_file_processing_architecture.md @@ -167,20 +167,31 @@ CREATE TABLE user_documents ( - 경로 순회 공격 방지 - 사용자별 용량 쿼터 관리 -## 8. 향후 확장 방안 +## 8. 시스템 구성 -### 8.1 단기 (1-2개월) +### 8.1 서비스 정보 +- **서비스명**: skill-rag-file +- **포트**: 8508 +- **컨테이너명**: skill-rag-file +- **API 엔드포인트**: + - POST /upload - 파일 업로드 + - GET /search - RAG 검색 + - GET /healthz - 헬스체크 + +## 9. 향후 확장 방안 + +### 9.1 단기 (1-2개월) - **적응형 임계값**: 최근 데이터 분포 기반 동적 우선도 임계값 조정 - **베이지안 파라미터 갱신**: 처리 성공률 기반 α, β, γ 가중치 자동 튜닝 - **A/B 테스트**: 청킹 크기, 오버랩 비율 최적화 -### 8.2 중기 (3-6개월) +### 9.2 중기 (3-6개월) - **버전 관리**: 동일 파일의 업데이트 추적 + 델타 저장 - **협업 기능**: 팀 단위 문서 공유 (레벨 15+ 로빙만 허용) - **자동 요약**: 업로드 시 문서 요약 생성 + 감정 분석 - **멀티 암드 밴딧**: 파일 유형별 최적 처리 전략 자동 선택 -### 8.3 장기 (6-12개월) +### 9.3 장기 (6-12개월) - **검색 고도화**: 의미 기반 + 키워드 + 구조 정보 하이브리드 검색 - **스카웃 시스템**: 레벨 20 로빙의 문서 처리 이력을 포트폴리오화 - **문서 간 연결망**: 지식 그래프 구축, 연관 문서 자동 추천 \ No newline at end of file