3.9 KiB
3.9 KiB
250919 동적 컨텍스트 엔지니어링 시스템 (업데이트)
1. 초기 구현 (2025-08-06)
문제 상황
의도 파악 실패 사례:
- "내 이름은?" → AI가 자기소개로 오해
- "네 이름은?" → 정상 응답
- 사용자가 부른 이름(베르단디) 기억 못함
원인 분석:
- 캐시 임계값 0.3 (너무 낮음)
- 프롬프트 하드코딩 ("당신은 로빙입니다" 고정)
- 메모리와 프롬프트 분리
철학적 재검토
초기 오해: 로빙의 정체성을 고정된 것으로 이해 올바른 이해: 성장하는 존재, 사용자와 함께 개성 발전
프롬프트 구조 재설계:
- Base Layer: 기본 규칙, 윤리 원칙
- Dynamic Layer: 이름, 레벨, 최근 기억
Intent 패턴 최적화
문제: 과도한 패턴 매칭이 캐시 우회 해결:
- greeting 패턴 축소
- memory_recall 패턴 제거
- question 패턴 정밀화 효과: 캐시 활성화율 80% 이상
동적 프롬프트 구현
방법: 컨텍스트 변수 방식
구현 내역:
- 이름 추출 함수 추가 (_extract_user_name, _extract_my_name)
- think() 메서드에서 컨텍스트 변수 설정
- 프롬프트 동적 구성 (이름, 레벨 포함)
- greeting 개인화
초기 배포 결과
효과:
- "베르단디"로 불리면 기억
- "내 이름은?" 올바르게 이해
- 사용자별 맞춤 응답
- 성장 상태(레벨) 반영
2. 영속화 문제 해결
이름 영속화 문제
문제: "내 이름은 김종태야" 인식 후 다음 대화에서 망각 원인: 매 요청마다 Brain 인스턴스 재생성
ChromaDB Identity 컬렉션 솔루션
구현:
- memory.py에 identity 컬렉션 추가
- store_identity() 메서드로 key-value 저장
- get_identity() 메서드로 로드
- think() 시작 시 identity 로드
- Structured Output에서 즉시 저장
효과:
- 컨테이너 재시작 후에도 이름 유지
- Brain 인스턴스 재생성과 무관
- ChromaDB 백업과 함께 관리
3. 캐시 시스템 재설계
캐시 시스템 재설계
문제:
- 캐시 임계값 0.1~0.3 (업계 표준 0.8)
- 3회 사용 제한 (TTL 기반이 표준)
- 템플릿 응답이 LLM 응답과 충돌
해결:
- 캐시 완전 제거 (USE_CONVERSATION_CACHE: False)
- 템플릿 응답 제거, 100% LLM API 사용
- 모든 대화 무조건 저장 (User + Assistant 모두)
4. 현재 상황 (2025-09-19)
동적 컨텍스트 엔지니어링 필요성
로빙의 성장 = 피드백 루프:
- Gateway(감각) → rb8001(뇌) → Skills(운동) → 피드백
- 각 스킬이 실행 결과를 rb8001에 보고
- rb8001이 피드백으로 다음 행동 조정
컨텍스트 최적화 방향:
- RAG 통합: skill-rag-file로 컨텍스트 확장
- 메타데이터 활용: ChromaDB 메타데이터로 관련성 판단
- 동적 우선순위: 최근성, 중요도, 감정 상태 고려
- 피드백 학습: 성공/실패 패턴을 베이즈 업데이트
구현 로드맵
Phase 1: 기본 동적 조정 (현재)
- 사용자/로빙 이름 동적 반영
- 레벨/스탯 실시간 반영
- 최근 대화 컨텍스트 포함
Phase 2: RAG 기반 확장 (계획)
- skill-rag-file 연동으로 장기 기억 검색
- 문서 기반 컨텍스트 증강
- 의미적 유사도 기반 우선순위
Phase 3: 피드백 루프 구현 (미래)
- 스킬 실행 결과를 컨텍스트에 반영
- 성공 패턴 학습 및 강화
- 실패 패턴 회피 메커니즘
기술적 고려사항
컨텍스트 윈도우 관리:
- Gemini: 128k 토큰
- GPT-4: 128k 토큰
- 효율적 압축과 요약 필요
우선순위 알고리즘:
- Recency (최근성): 시간 가중치
- Relevance (관련성): 벡터 유사도
- Importance (중요도): 메타데이터 태그
- Emotion (감정): 현재 감정 상태
작성자: happybell80 & Claude 프로젝트: rb8001 주제: 동적 컨텍스트 엔지니어링 시스템