DOCS/troubleshooting/250806_happybell80_동적프롬프트구현.md
happybell80 d6428feb44 250806 트러블슈팅 업데이트 - 캐시 제거 및 대화 연속성
- 캐시 시스템 전면 개편 과정
- 대화 연속성 문제 해결
- 교훈 정리
2025-08-06 17:11:26 +09:00

9.1 KiB

250806 동적 프롬프트 컨텍스트 구현

오후 2시 55분

문제 상황

서버팀 테스트 결과 분석:

  • Phase 5는 정상 작동 (캐시 3회 사용 후 재생성)
  • 하지만 의도 파악 실패 지속
    • "내 이름은?" → "저는 베르단디입니다" (잘못됨)
    • "네 이름은?" → "저는 베르단디입니다" (맞음)
    • 사용자 이름을 묻는 것을 자기소개로 오해

원인 분석:

  1. 캐시 임계값 너무 관대 (0.3) → 다른 질문도 같은 캐시 사용
  2. 프롬프트 하드코딩 → "당신은 로빙입니다" 고정
  3. 메모리와 프롬프트 분리 → 사용자가 "베르단디"라 불러도 기억 못함

오후 3시 10분

철학적 재검토

초기 착각:

  • 로빙의 "존재적 정체성"을 고정된 것으로 이해
  • DOCS 철학 문서를 잘못 해석

올바른 이해:

  • 로빙은 "성장하는 존재" (레벨 1→20)
  • 사용자와 함께 개성 발전
  • "베르단디"로 불리면 그것이 새로운 정체성

프롬프트 구조 재설계:

Base Layer (하드코딩):
- 기억-감정-윤리 삼각형
- 이모지 사용 금지
- 기본 규칙

Dynamic Layer (메모리에서):
- 현재 이름 (로빙/베르단디/기타)
- 사용자 이름
- 현재 레벨/스탯
- 최근 기억

오후 3시 25분

intent 패턴 최적화

문제점:

  • "하이" → greeting → 템플릿 응답
  • "기억" → memory_recall → 기계적 나열
  • 대부분 캐시를 우회

해결책:

  1. greeting 패턴 축소: r"(안녕하세요|안녕하십니까)"
  2. memory_recall 패턴 제거
  3. question 패턴 정밀화: r"(어떻게|왜|언제|how|why|when).*\?"
  4. 이모지 하드코딩 제거

효과:

  • "하이" → general_conversation → 캐시 사용
  • 캐시 활성화율 80% 이상

오후 3시 40분

동적 프롬프트 구현

방법 선택: 컨텍스트 변수 방식 (가장 효율적)

구현 내역:

  1. 이름 추출 함수 추가:
async def _extract_user_name(self, memories, user_id):
    # "내 이름은 김종태" 패턴 인식
    # "나는 김종태야" 패턴 인식
    # semantic 메모리에서 user_name 메타데이터 검색
    return "사용자"  # 기본값

async def _extract_my_name(self, memories, user_id):
    # "너를 베르단디라고 부를게" 패턴 인식
    # "베르단디야" 직접 호명 패턴 인식
    return "로빙"  # 기본값
  1. think() 메서드에서 컨텍스트 변수 설정:
# 메모리 검색 후
self.current_user_name = await self._extract_user_name(memories, user_id)
self.my_name = await self._extract_my_name(memories, user_id)
  1. 프롬프트 동적 구성:
context = f"""당신은 {my_name}(RO-BEING)입니다.
현재 대화 상대: {user_name}
현재 레벨: {self.stats.level}

중요 규칙:
- "내 이름은?"은 사용자({user_name})가 자신의 이름을 묻는 것
- "네 이름은?"은 나({my_name})의 이름을 묻는 것
"""
  1. greeting 개인화:
greeting_name = f", {user_name}님" if user_name != "사용자" else ""
f"안녕하세요{greeting_name}! 오늘은 어떤 도움이 필요하신가요?"

오후 3시 45분

배포 및 예상 효과

구현 완료:

  • 총 소요 시간: 15분
  • 코드 변경: brain.py만 수정
  • 추가된 줄: 약 70줄

예상 효과:

  • "베르단디"로 불리면 기억하고 사용
  • "내 이름은?" 올바르게 이해
  • 사용자별 맞춤 응답
  • 성장 상태(레벨) 반영

Gitea Actions 자동 배포: 진행 중

교훈

  1. 철학 문서의 중요성

    • 기술 구현 전 철학적 기반 이해 필수
    • "성장하는 존재"라는 핵심 개념 놓침
  2. 하드코딩의 한계

    • 프롬프트 하드코딩은 성장을 막는 족쇄
    • 동적 구성이 존재형 AI의 본질
  3. 간단한 해결책 우선

    • 컨텍스트 변수 방식이 가장 효율적
    • 과도한 엔지니어링 피하기
  4. 메모리와 프롬프트 통합

    • 기억 시스템과 응답 생성의 연결 필수
    • 분리된 시스템은 일관성 없는 응답 생성
  5. intent 패턴의 영향

    • 과도한 패턴 매칭이 캐시 시스템 무력화
    • 적절한 균형 필요

오후 4시 00분

이름 영속화 문제 발견

서버팀 보고:

  • 코드는 정상 작동 (에러 없음)
  • "내 이름은 김종태야" → "김종태님, 반갑습니다!" (인식 성공)
  • 하지만 다음 대화에서 까먹음 (영속화 실패)

원인 분석:

  1. 매 요청마다 새로운 Brain 인스턴스 생성
  2. 딕셔너리만 사용 → 인스턴스 소멸 시 이름 정보도 소실
  3. 컨테이너 재시작 시 모든 정보 리셋

ChromaDB Identity 컬렉션 솔루션

서버팀 제안:

  • 이미 사용 중인 ChromaDB에 identity 컬렉션 추가
  • 벡터 검색 불필요한 단순 key-value 저장
  • 파일이나 Redis 추가 불필요

구현 내역:

  1. memory.py에 identity 컬렉션 추가:
self.identity_collection = self.client.get_or_create_collection(
    name=f"{settings.ROBING_ID}_identity",
    metadata={"type": "identity", "description": "User and robing names"}
)
  1. store_identity() 메서드:
async def store_identity(self, user_id: str, user_name: str = None, robing_name: str = None):
    doc_id = f"identity:{user_id}"
    self.identity_collection.upsert(
        ids=[doc_id],
        documents=[f"user:{user_name},robing:{robing_name}"],
        metadatas=[{"user_name": user_name, "robing_name": robing_name}]
    )
  1. get_identity() 메서드:
async def get_identity(self, user_id: str) -> Dict:
    result = self.identity_collection.get(ids=[f"identity:{user_id}"])
    if result['metadatas']:
        return result['metadatas'][0]
    return {}
  1. think() 시작 시 identity 로드:
# Identity 로드 (영속 저장된 이름 정보)
identity = await self.memory.get_identity(user_id)

if identity.get('user_name'):
    self.current_user_name = identity['user_name']
else:
    self.current_user_name = '사용자'
  1. Structured Output에서 즉시 저장:
if data.get('user_name') and data['user_name'] != "null":
    await self.memory.store_identity(
        user_id=self.current_user_id,
        user_name=data['user_name']
    )
    logger.info(f"[IDENTITY] 사용자 이름 저장: {data['user_name']}")

해결된 문제

  1. 영속성 보장:

    • 컨테이너 재시작 후에도 이름 유지
    • Brain 인스턴스 재생성과 무관
    • ChromaDB 백업과 함께 관리
  2. 운영 단순화:

    • 추가 인프라 불필요
    • 하나의 DB로 통합 관리
    • 모니터링 포인트 감소

교훈

  1. 기존 인프라 활용:

    • 새로운 솔루션 도입보다 기존 시스템 활용이 효율적
    • ChromaDB는 벡터 DB지만 key-value 저장도 가능
  2. 영속성의 중요성:

    • 메모리 기반 저장은 항상 휘발성 고려
    • 중요 정보는 반드시 영속 저장소에
  3. 간단한 해결책 우선:

    • 파일 저장 → 권한, 백업 문제
    • Redis → 새 의존성, 복잡도 증가
    • ChromaDB identity → 이미 있는 것 활용

오후 5시 10분

캐시 시스템 전면 개편

문제 발견:

  • 캐시 임계값 0.1~0.3 너무 낮음 (업계 표준 0.8)
  • 3회 사용 제한 임의적 (TTL 기반이 표준)
  • 템플릿 응답이 Gemini 응답과 충돌

해결 과정:

  1. 캐시 최적화 (실패):

    • 임계값 0.8로 상향
    • TTL 5분 기반 전환
    • 결과: 여전히 문제 지속
  2. 캐시 완전 제거:

    # config.py
    USE_CONVERSATION_CACHE: bool = False  # 비활성화
    CACHE_DISTANCE_THRESHOLD: float = 0.95  # 사실상 무효
    CACHE_TTL_SECONDS: int = 10  # 극단축
    
  3. 템플릿 응답 제거:

    • 모든 하드코딩된 응답 삭제
    • 100% Gemini API 사용

대화 연속성 문제

증상:

로빙: "세 가지 제안해볼까요?"
사용자: "그래"
로빙: "무엇을 도와드릴까요?" ❌ (문맥 손실)

원인:

  • should_store 조건이 많은 대화 필터링
  • 로빙 응답이 메모리에 저장 안됨

해결:

# brain.py - 모든 대화 무조건 저장
# 사용자 메시지
await self.memory.store_memory(
    content=f"User: {message}",
    user_id=user_id,
    memory_type="episodic",
    metadata={"role": "user"}
)

# 로빙 응답 (필수)
await self.memory.store_memory(
    content=f"Robing: {final_response}",
    user_id=user_id,
    memory_type="episodic",
    metadata={"role": "assistant"}
)

교훈

  1. 캐시는 만병통치약이 아니다

    • 잘못된 캐시는 오히려 문제 악화
    • 초기에는 캐시 없이 시작
  2. 대화 연속성 = 모든 발화 저장

    • User만 저장하면 반쪽짜리
    • Assistant 응답도 필수
  3. 템플릿 vs LLM

    • 혼용하면 일관성 파괴
    • 하나로 통일 필요
  4. 업계 표준 존중

    • 유사도 임계값: 0.8
    • TTL 기반 만료
    • 사용 횟수보다 시간 기반

작성자: happybell80 & Claude 프로젝트: rb10508_micro 주제: 동적 프롬프트 구현 및 이름 영속화