# 의도 분류(Intent Classification) 연구 **작성일**: 2025-11-17 **목적**: 로빙 프로젝트의 의도 분석 시스템 개선을 위한 이론적 배경 및 최신 연구 동향 ## 개요 의도 분류는 사용자의 자연어 발화에서 의도를 추출하여 적절한 응답이나 액션을 결정하는 핵심 기술입니다. 로빙 프로젝트에서는 HITL(Human-in-the-Loop) 피드백을 통한 지속적인 의도 분류 정확도 개선을 목표로 합니다. ## 핵심 논문 ### 1. Active Learning with Rationales for Text Classification - **저자**: Sharma et al. - **연도**: 2015 (ACL) - **핵심**: 액티브 러닝과 인간의 피드백을 결합하여 텍스트 분류 모델의 성능을 향상 - **로빙 적용**: 사용자 피드백(좋아요/싫어요)을 통한 의도 분류 개선의 이론적 근거 ### 2. Human-in-the-Loop Machine Learning - **저자**: Loveleen Narang - **핵심**: HITL 접근법이 머신러닝 파이프라인의 여러 단계에서 인간의 전문 지식을 통합하여 모델의 품질과 신뢰성을 향상 - **로빙 적용**: 리뷰 큐를 통한 라벨링 및 재학습 파이프라인의 설계 원칙 ### 3. PT4AL: Using Self-Supervised Pretext Tasks for Active Learning - **저자**: - - **연도**: 2022 (arXiv) - **핵심**: 자기지도 학습을 활용한 액티브 러닝 기법으로 레이블링 비용 절감 및 성능 향상 - **로빙 적용**: 의도 분류기의 효율적인 재학습 전략 ### 4. Impact of Feedback Type on Explanatory Interactive Learning - **연도**: 2022 (arXiv) - **핵심**: 사용자 피드백 유형이 모델 성능과 설명 정확도에 미치는 영향 분석 - **로빙 적용**: 좋아요/싫어요 같은 이진 피드백의 효용성 검증 ## 최신 트렌드 (2023-2025) ### 1. Implicit vs Explicit Feedback - **트렌드**: 명시적 피드백(좋아요/싫어요)과 암묵적 피드백(재질문, 세션 종료 등)의 결합 - **로빙 적용**: 현재는 명시적 피드백만 수집, 향후 암묵적 피드백 통합 고려 ### 2. Human-AI 협업의 피드백 루프 설계 - **트렌드**: 컨텍스트 공유와 피드백 루프를 통한 협업 효율성 향상 - **로빙 적용**: 리뷰 큐에서 관리자가 라벨링할 때 컨텍스트 정보 제공 ### 3. Few-shot Learning with User Feedback - **트렌드**: 소량의 사용자 피드백으로 빠른 적응 - **로빙 적용**: 재학습 배치에서 few-shot learning 기법 활용 검토 ## 로빙 프로젝트 적용 현황 ### 구현 완료 (2025-11-17) - ✅ 사용자 피드백 수집 (좋아요/싫어요) - ✅ 리뷰 큐 진입 로직 (low confidence, error, negative feedback) - ✅ 관리자 라벨링 API (조회/라벨링/통계) - ✅ 데이터 수집 파이프라인 (100% 수집률 달성) - ✅ 코드 작성 원칙 준수 (router → services → state) ### 진행 중 (2025-11-17) - [x] 재학습 배치 스크립트 구현 (TDD) ✅ - [x] 재학습 전후 정확도 비교 측정 ✅ - [x] Active Learning 쿼리 전략 구현 (uncertainty sampling, margin sampling) ✅ - [x] 암묵적 피드백 수집 (재질문, 세션 종료 등) ✅ - [ ] Few-shot learning 기법 적용 - [ ] 암묵적 피드백 통합 (conversation_service 연동) ## 구현 문서 - [재학습 파이프라인 설계](./retraining_pipeline_plan.md) - [Active Learning 쿼리 전략](./active_learning_query_strategy.md) - [암묵적 피드백 수집](./implicit_feedback.md) ## 관련 연구 분야 - [Memory/Classification](../memory/classification/): BERT 임베딩, 하이브리드 LLM-ML 분류 - [Bayesian Theory](../bayesian_theory/): 베이지안 의도 추론 - [Memory/Embedding Search](../memory/embedding_search/): Ko-SRoBERTa 기반 의도 분류 ## 참고 문헌 1. Sharma, M., et al. (2015). "Active Learning with Rationales for Text Classification." ACL. 2. Narang, L. "Human-in-the-Loop Machine Learning: Combining Human and Artificial Intelligence." 3. PT4AL: Using Self-Supervised Pretext Tasks for Active Learning (2022, arXiv) 4. Impact of Feedback Type on Explanatory Interactive Learning (2022, arXiv) --- **업데이트**: 2025-11-17 - HITL 피드백 파이프라인 구현 완료, 논문 근거 추가