diff --git a/journey/research/260311_자가수정_에이전트_프레임워크_및_workspace_cli_검증_리서치.md b/journey/research/260311_자가수정_에이전트_프레임워크_및_workspace_cli_검증_리서치.md index c64e33b..c96416c 100644 --- a/journey/research/260311_자가수정_에이전트_프레임워크_및_workspace_cli_검증_리서치.md +++ b/journey/research/260311_자가수정_에이전트_프레임워크_및_workspace_cli_검증_리서치.md @@ -205,6 +205,39 @@ tags: [research, agents, langgraph, pydantic-ai, gemini-cli, workspace, self-imp - 로빙의 현재 문제는 `LangGraph를 버릴지`가 아니라 `Gemini CLI를 안전한 operator로 승격할 안전장치를 어떻게 붙일지`입니다. - 따라서 우선순위는 `LangGraph 제거`가 아니라 `Gemini CLI 무가드 호출 제거 + operator 경계 설계 + 승인 흐름 추가`입니다. +## 그래프 DB / RAG / GraphRAG 추가 판단 + +### 개념 정리 +- `그래프 DB`와 `GraphRAG 라이브러리`는 같은 것이 아닙니다. + - 그래프 DB 예: `Neo4j` + - 오케스트레이션/검색 계층 예: `LangChain`, `LangGraph`, GraphRAG 구현체 +- 벡터도 동일합니다. + - 벡터 DB 예: `Chroma` + - retrieval/orchestration 계층 예: `LangChain` +- 즉 `DB`는 저장소이고, `RAG/GraphRAG 라이브러리`는 그 저장소를 읽고 흐름을 구성하는 계층입니다. + +### Gemini 답변 검증 +- `그래프 DB와 GraphRAG 라이브러리는 역할이 다르다`는 설명은 대체로 맞습니다. +- `벡터도 DB와 RAG 라이브러리가 분리된다`는 설명도 맞습니다. +- 다만 `처음부터 Chroma + Neo4j + LangChain + LangGraph를 다 쓰는 것이 정석`처럼 들리는 표현은 과장입니다. +- 실제 기준은 도구 조합이 아니라 질문 유형입니다. + - 단순 의미 검색/요약 중심이면 벡터 RAG 우선 + - 인물-기업-투자사-라운드 같은 다단계 관계 추론이 반복되면 그래프 계층 추가 + +### 로빙 기준 판단 +- 현재 로빙은 이미 `Chroma + LangGraph 워크플로 + 검색/요약` 축을 가지고 있습니다. +- 지금 당장 `Neo4j`를 붙여야 할 정도로 확정된 운영 요구는 아직 문서화돼 있지 않습니다. +- 하지만 `스타트업 투자 데이터`, `컴퍼니엑스 내부 관계`, `투자사-기업-인물 연결 질문`은 향후 그래프 계층 후보로 충분합니다. + +### 지금 준비할 것 +1. 문서 청킹 시 `company`, `investor`, `person`, `round`, `date`, `amount`, `source_doc` 메타데이터를 먼저 고정합니다. +2. 추후 그래프 전환을 위해 `관계 추출 스키마`를 JSON 형태로 먼저 정의합니다. +3. 그래프 도입 전에는 `벡터 검색 + 구조화 메타데이터 필터`만으로 얼마나 커버되는지 먼저 측정합니다. + +### 방향 +- 현재 권장 방향은 `그래프 DB 즉시 도입`이 아니라 `그래프 준비가 가능한 벡터 우선 구조`입니다. +- 즉 `Chroma/기존 RAG 유지 -> 메타데이터/청킹 정교화 -> 관계형 질문 빈도 측정 -> 필요 시 Neo4j/GraphRAG 추가` 순서가 맞습니다. + ## 참고 소스 - Pydantic AI 공식 문서: - Pydantic AI GitHub: @@ -217,3 +250,6 @@ tags: [research, agents, langgraph, pydantic-ai, gemini-cli, workspace, self-imp - Google Workspace Developer Tools: - overview: - codelab: +- Neo4j graph database overview: +- Chroma docs: +- LangChain retrieval docs: