Claude-51124 f3c062ce01 docs: 하이브리드 의도 분류 성능 비교 테스트 결과 문서화

- FastPath 49.6%, 제로샷 임베딩 23.4%, 병행 비교 49.6% 테스트 결과 기록
- Multi-centroid 방식 및 Few-shot LLM 프롬프트 개선 방향 제시
- 계획 문서 및 리서치 문서 업데이트

2026-01-03 12:13:02 +09:00

로빙 의도 파악 개선 플랜

날짜: 2025-10-17 현재: 정규식 패턴 매칭만 사용

현재 문제

결론: 단순 명령만 처리 가능, 복합 질문 처리 불가

구현 완료: troubleshooting/251126_happybell80_rb8001_의도_3단계_아키텍처_도입_및_배포.md

완료일: 2025-11-26
커밋: a4738b9 (rb8001)

✅ 3단계 스키마 정의: intent/schemas.py (IntentCategory, IntentGoal, ActionPlan, SkillSequence)
✅ IntentAnalyzer 구현: LLM 기반 제로샷 의도 분석
✅ ActionPlanner 구현: IntentGoal → ActionPlan 변환
✅ SkillSelector 구현: ActionPlan → SkillSequence 변환
✅ DecisionEngine 통합: _build_intent_pipeline() 메서드 추가, execution_plan에 intent_pipeline 메타데이터 포함
✅ TDD 테스트: tests/test_intent_3step_architecture.py 통과

1. 의도 파악 → 추상적 목표 (일정 관리, 정보 검색 등)
2. 행동 계획 → 구체적 행동 (등록, 조회, 삭제 등)
3. 스킬 선택 → 적절한 도구 (calendar_skill 등)

테스트 결과 (2026-01-03): troubleshooting/260103_하이브리드_의도_분류_성능_비교_테스트.md

사용자 메시지
  ↓
1단계: 정규식 FastPath (명확한 패턴)
  ↓ 실패 또는 확신도 < 0.9
2단계: Multi-centroid 임베딩 (Top-3 후보 생성)
  ↓ 확신도 < 0.7
3단계: Few-shot LLM 분류 (Top-3 후보 + 예시)

1. Multi-centroid 방식 도입

2. Intent Prototypes DB 초기화

3. Few-shot LLM 프롬프트 개선

4. 성능 목표