Claude-51124 725f8b047c docs: multi-centroid 적용 성과 문서화

- 트러블슈팅 문서에 개선 결과 섹션 추가 (23.4%→70.2%)
- 계획 문서 아카이브에 완료 사항 업데이트
- 리서치 README는 인덱스 역할로 간소화 (상세는 troubleshooting 참조)

2026-01-03 12:29:51 +09:00

5.2 KiB

Raw Blame History

의도 분류(Intent Classification) 연구

작성일: 2025-11-17
목적: 로빙 프로젝트의 의도 분석 시스템 개선을 위한 이론적 배경 및 최신 연구 동향

개요

의도 분류는 사용자의 자연어 발화에서 의도를 추출하여 적절한 응답이나 액션을 결정하는 핵심 기술입니다. 로빙 프로젝트에서는 HITL(Human-in-the-Loop) 피드백을 통한 지속적인 의도 분류 정확도 개선을 목표로 합니다.

핵심 논문

1. Active Learning with Rationales for Text Classification

저자: Sharma et al.
연도: 2015 (ACL)
핵심: 액티브 러닝과 인간의 피드백을 결합하여 텍스트 분류 모델의 성능을 향상
로빙 적용: 사용자 피드백(좋아요/싫어요)을 통한 의도 분류 개선의 이론적 근거

2. Human-in-the-Loop Machine Learning

저자: Loveleen Narang
핵심: HITL 접근법이 머신러닝 파이프라인의 여러 단계에서 인간의 전문 지식을 통합하여 모델의 품질과 신뢰성을 향상
로빙 적용: 리뷰 큐를 통한 라벨링 및 재학습 파이프라인의 설계 원칙

3. PT4AL: Using Self-Supervised Pretext Tasks for Active Learning

저자: -
연도: 2022 (arXiv)
핵심: 자기지도 학습을 활용한 액티브 러닝 기법으로 레이블링 비용 절감 및 성능 향상
로빙 적용: 의도 분류기의 효율적인 재학습 전략

4. Impact of Feedback Type on Explanatory Interactive Learning

연도: 2022 (arXiv)
핵심: 사용자 피드백 유형이 모델 성능과 설명 정확도에 미치는 영향 분석
로빙 적용: 좋아요/싫어요 같은 이진 피드백의 효용성 검증

로빙 프로젝트 적용 현황

구현 완료 (2025-11-17)

✅ 사용자 피드백 수집 (좋아요/싫어요)
✅ 리뷰 큐 진입 로직 (low confidence, error, negative feedback)
✅ 관리자 라벨링 API (조회/라벨링/통계)
✅ 데이터 수집 파이프라인 (100% 수집률 달성)
✅ 코드 작성 원칙 준수 (router → services → state)

진행 중 (2025-11-17)

재학습 배치 스크립트 구현 (TDD) ✅
재학습 전후 정확도 비교 측정 ✅
Active Learning 쿼리 전략 구현 (uncertainty sampling, margin sampling) ✅
암묵적 피드백 수집 (재질문, 세션 종료 등) ✅
Few-shot learning 기법 적용
암묵적 피드백 통합 (conversation_service 연동)

성능 비교 테스트 및 프로덕션 적용

하이브리드 의도 분류 성능 비교
- 초기 테스트: FastPath 49.6%, 제로샷 임베딩 23.4%, 병행 비교 49.6%
- Multi-centroid 적용 후: 제로샷 임베딩 70.2% (+46.8%p), FastPath 72.3% (+22.7%p)
- 프로덕션 적용: 14개 intent × 3개 centroid (version=3), 123개 샘플 기반 K-means

구현 문서

성능 비교 테스트

하이브리드 의도 분류 성능 비교: FastPath vs 제로샷 임베딩 vs 병행 비교 (2026-01-03)

참고 문헌

Sharma, M., et al. (2015). "Active Learning with Rationales for Text Classification." ACL.
Narang, L. "Human-in-the-Loop Machine Learning: Combining Human and Artificial Intelligence."
PT4AL: Using Self-Supervised Pretext Tasks for Active Learning (2022, arXiv)
Impact of Feedback Type on Explanatory Interactive Learning (2022, arXiv)

업데이트:

2025-11-17: HITL 피드백 파이프라인 구현 완료, 논문 근거 추가
2026-01-03: 하이브리드 의도 분류 성능 비교 테스트 결과 추가, Few-shot LLM 프롬프트 개선 방향 추가
2026-01-03: Multi-centroid 방식 적용 완료, 제로샷 임베딩 23.4%→70.2% 개선 (프로덕션 적용 사례 추가)

5.2 KiB

Raw Blame History

의도 분류(Intent Classification) 연구

개요

핵심 논문

1. Active Learning with Rationales for Text Classification

2. Human-in-the-Loop Machine Learning

3. PT4AL: Using Self-Supervised Pretext Tasks for Active Learning

4. Impact of Feedback Type on Explanatory Interactive Learning

최신 트렌드 (2023-2025)

1. Implicit vs Explicit Feedback

2. Human-AI 협업의 피드백 루프 설계

3. Few-shot Learning with User Feedback

로빙 프로젝트 적용 현황

구현 완료 (2025-11-17)

진행 중 (2025-11-17)

성능 비교 테스트 및 프로덕션 적용

구현 문서

성능 비교 테스트

관련 연구 분야

참고 문헌

5.2 KiB Raw Blame History Unescape Escape

의도 분류(Intent Classification) 연구

개요

핵심 논문

1. Active Learning with Rationales for Text Classification

2. Human-in-the-Loop Machine Learning

3. PT4AL: Using Self-Supervised Pretext Tasks for Active Learning

4. Impact of Feedback Type on Explanatory Interactive Learning

최신 트렌드 (2023-2025)

1. Implicit vs Explicit Feedback

2. Human-AI 협업의 피드백 루프 설계

3. Few-shot Learning with User Feedback

로빙 프로젝트 적용 현황

구현 완료 (2025-11-17)

진행 중 (2025-11-17)

성능 비교 테스트 및 프로덕션 적용

구현 문서

성능 비교 테스트

관련 연구 분야

참고 문헌

5.2 KiB

Raw Blame History