docs: extend research with graph db and rag direction

This commit is contained in:
Claude-51124 2026-03-11 17:34:21 +09:00
parent 572c1ed433
commit 0f97331f0e

View File

@ -205,6 +205,39 @@ tags: [research, agents, langgraph, pydantic-ai, gemini-cli, workspace, self-imp
- 로빙의 현재 문제는 `LangGraph를 버릴지`가 아니라 `Gemini CLI를 안전한 operator로 승격할 안전장치를 어떻게 붙일지`입니다. - 로빙의 현재 문제는 `LangGraph를 버릴지`가 아니라 `Gemini CLI를 안전한 operator로 승격할 안전장치를 어떻게 붙일지`입니다.
- 따라서 우선순위는 `LangGraph 제거`가 아니라 `Gemini CLI 무가드 호출 제거 + operator 경계 설계 + 승인 흐름 추가`입니다. - 따라서 우선순위는 `LangGraph 제거`가 아니라 `Gemini CLI 무가드 호출 제거 + operator 경계 설계 + 승인 흐름 추가`입니다.
## 그래프 DB / RAG / GraphRAG 추가 판단
### 개념 정리
- `그래프 DB``GraphRAG 라이브러리`는 같은 것이 아닙니다.
- 그래프 DB 예: `Neo4j`
- 오케스트레이션/검색 계층 예: `LangChain`, `LangGraph`, GraphRAG 구현체
- 벡터도 동일합니다.
- 벡터 DB 예: `Chroma`
- retrieval/orchestration 계층 예: `LangChain`
- 즉 `DB`는 저장소이고, `RAG/GraphRAG 라이브러리`는 그 저장소를 읽고 흐름을 구성하는 계층입니다.
### Gemini 답변 검증
- `그래프 DB와 GraphRAG 라이브러리는 역할이 다르다`는 설명은 대체로 맞습니다.
- `벡터도 DB와 RAG 라이브러리가 분리된다`는 설명도 맞습니다.
- 다만 `처음부터 Chroma + Neo4j + LangChain + LangGraph를 다 쓰는 것이 정석`처럼 들리는 표현은 과장입니다.
- 실제 기준은 도구 조합이 아니라 질문 유형입니다.
- 단순 의미 검색/요약 중심이면 벡터 RAG 우선
- 인물-기업-투자사-라운드 같은 다단계 관계 추론이 반복되면 그래프 계층 추가
### 로빙 기준 판단
- 현재 로빙은 이미 `Chroma + LangGraph 워크플로 + 검색/요약` 축을 가지고 있습니다.
- 지금 당장 `Neo4j`를 붙여야 할 정도로 확정된 운영 요구는 아직 문서화돼 있지 않습니다.
- 하지만 `스타트업 투자 데이터`, `컴퍼니엑스 내부 관계`, `투자사-기업-인물 연결 질문`은 향후 그래프 계층 후보로 충분합니다.
### 지금 준비할 것
1. 문서 청킹 시 `company`, `investor`, `person`, `round`, `date`, `amount`, `source_doc` 메타데이터를 먼저 고정합니다.
2. 추후 그래프 전환을 위해 `관계 추출 스키마`를 JSON 형태로 먼저 정의합니다.
3. 그래프 도입 전에는 `벡터 검색 + 구조화 메타데이터 필터`만으로 얼마나 커버되는지 먼저 측정합니다.
### 방향
- 현재 권장 방향은 `그래프 DB 즉시 도입`이 아니라 `그래프 준비가 가능한 벡터 우선 구조`입니다.
- 즉 `Chroma/기존 RAG 유지 -> 메타데이터/청킹 정교화 -> 관계형 질문 빈도 측정 -> 필요 시 Neo4j/GraphRAG 추가` 순서가 맞습니다.
## 참고 소스 ## 참고 소스
- Pydantic AI 공식 문서: <https://ai.pydantic.dev/> - Pydantic AI 공식 문서: <https://ai.pydantic.dev/>
- Pydantic AI GitHub: <https://github.com/pydantic/pydantic-ai> - Pydantic AI GitHub: <https://github.com/pydantic/pydantic-ai>
@ -217,3 +250,6 @@ tags: [research, agents, langgraph, pydantic-ai, gemini-cli, workspace, self-imp
- Google Workspace Developer Tools: - Google Workspace Developer Tools:
- overview: <https://developers.google.com/workspace/guides/developer-tools> - overview: <https://developers.google.com/workspace/guides/developer-tools>
- codelab: <https://developers.google.com/codelabs/dev-tools-for-gws#0> - codelab: <https://developers.google.com/codelabs/dev-tools-for-gws#0>
- Neo4j graph database overview: <https://neo4j.com/docs/getting-started/graph-database/>
- Chroma docs: <https://docs.trychroma.com/>
- LangChain retrieval docs: <https://docs.langchain.com/oss/python/langchain/retrieval>