happybell80 58153a49a0 Fix documentation errors and add UUID principle violation docs

- Fix false EmailIntegration bug reports in multiple docs
- Add new UUID principle violation documentation
- Remove incorrect assumptions about gmail_tokens table
- Update 250922 doc to reflect Gateway UUID conversion working
- Clean up research papers organization into subdirectories

2025-09-26 00:38:52 +09:00

5.8 KiB

Raw Blame History

베이지안 추론, MCMC, 그리고 로빙 적용 논의 종합

이 문서는 로빙 프로젝트의 핵심 철학인 베이지안 추론에 대한 심층적인 논의를 종합합니다. 베이즈 정리의 기본 개념부터 MCMC의 필요성, '확률'과 '분포'의 차이, 그리고 '믿음이 분포로 이루어져 있다'는 철학적 의미와 실생활 적용까지 다룹니다. 마지막으로 로빙에 베이지안 원리를 구현하기 위한 5단계 로드맵과 데이터 저장 원리를 제시합니다.

1. 베이지안 추론의 기본 원리

베이지안 추론은 새로운 증거(정보)를 통해 초기 믿음(사전 분포)을 합리적으로 업데이트하여 사후 분포를 얻는 과정입니다. 핵심은 베이즈 정리입니다.

P(H|E) = \frac{P(E|H) \times P(H)}{P(E)}

P(H) (사전 분포, Prior): 증거 관찰 전의 초기 믿음.
P(E|H) (우도, Likelihood): 가설이 옳다고 가정했을 때 증거가 나타날 확률.
P(H|E) (사후 분포, Posterior): 증거 관찰 후 업데이트된 믿음. 우리가 정말로 알고 싶은 것.
P(E) (증거, Evidence): 증거가 나타날 전체 확률. 모든 가능한 가설에 대해 우도와 사전 분포를 곱한 것을 합산(또는 적분)한 값.

2. MCMC (Markov Chain Monte Carlo)의 필요성

베이지안 추론에서 사후 분포 $P(H|E)$를 직접 계산하기 어려운 주된 이유는 분모의 P(E) 때문입니다. $P(E)$는 복잡한 모델이나 고차원 가설에서 다차원 적분 형태로 나타나며, 이를 해석적으로 또는 수치적으로 정확히 계산하는 것이 거의 불가능합니다.

MCMC는 이 문제를 해결하는 강력한 도구입니다.

MCMC는 $P(E)$를 직접 계산하지 않고도, 사후 분포에 비례하는 함수(P(E|H) \times P(H))만을 이용하여 사후 분포에서 샘플을 뽑아낼 수 있습니다.
타겟 분포에 수렴하는 마르코프 연쇄를 구성하여 샘플을 생성하며(예: 메트로폴리스-해스팅스, 깁스 샘플러), 이 샘플들을 통해 사후 분포의 특성(평균, 신뢰 구간, 모양 등)을 추정합니다.

3. '확률'과 '분포'의 차이: 베이지안 이해의 핵심

확률 (Probability): 특정 사건의 가능성을 나타내는 하나의 숫자.
분포 (Distribution): 변수가 가질 수 있는 모든 값들에 대해 확률이 어떻게 퍼져 있는지를 보여주는 전체적인 그림.

이 혼동은 가설(H)의 종류 때문에 발생합니다.

이산적 가설 (예: 질병 유무): 가설이 몇 가지 값만 가질 때, 각 값의 확률이 전체 분포를 설명하므로 '사후 확률'과 '사후 분포'를 혼용 가능합니다.
연속적 가설 (예: 혈액 농도, 모델 파라미터): 가설이 무한히 많은 값을 가질 때, 특정 한 점의 확률은 의미가 없으므로 반드시 '사후 분포' 개념을 사용해야 합니다.

베이지안 추론은 불확실성을 '분포'로 표현하여 모든 가능한 값들에 대한 믿음의 정도를 명확히 하는 데 강점이 있습니다.

4. '믿음이 분포로 이루어져 있다'는 철학적 의미와 실생활 적용

철학적 의미:

불확실성의 본질적 인정: 세상의 불확실성을 명시적으로 모델링하며, 우리가 모르는 것이 무엇인지, 얼마나 모르는지를 인정하는 태도입니다.
열린 마음과 유연한 사고: 새로운 증거에 따라 믿음이 점진적으로 변화하며, 특정 값에 대한 편향을 줄이고 지속적으로 학습하는 사고방식을 반영합니다.
무지(Ignorance)의 표현: 모르는 것에 대해 넓고 평평한 분포로 표현하여 편향되지 않은 시작점을 제공합니다.

실생활 적용 (불확실성 하 의사결정):

의료 진단: 가장 높은 확률뿐 아니라 치명적인 다른 질병의 낮은 확률까지 고려하여 추가 검사 결정 등 위험 관리.
금융 투자: 기대 수익률뿐 아니라 손실 가능성의 분포까지 고려하여 위험 감수 수준에 맞는 포트폴리오 구성.
자율 주행: 센서 오차 분포를 고려하여 최악의 시나리오에 대비한 안전 거리 확보.
로빙의 스킬 선택: 기대 성공률이 낮은 스킬이라도 분포가 넓으면 탐색의 가치가 있다고 판단, 장기적 최적화 추구. 이는 로빙이 '성장'하는 원동력이 됩니다.

5. 로빙에 베이지안 원리 구현 로드맵 및 데이터 저장 원리

5.1. 5단계 구현 로드맵

구조화된 행동 로그 수집: 로빙의 모든 행동을 PostgreSQL에 정형 데이터로 저장.
스킬 성공률 베이지안 모델링: 각 스킬의 alpha, beta 파라미터를 PostgreSQL에 저장, 로그 기반 업데이트.
베이지안 의사결정 (톰슨 샘플링): 스킬 후보 중 분포에서 샘플링하여 선택, 탐색-활용 균형.
'놀람' 기반 핵심 기억 저장: '놀람 점수'를 로그에 저장, ChromaDB에서 우선 회상.
베이지안 사용자 의도 추론: 명령어-목표 간 조건부 확률 학습, 베이즈 정리로 목표 추론.

5.2. 데이터 저장 원리

확률적 믿음의 저장: 분포 파라미터(alpha, beta)를 PostgreSQL/Redis에 저장.
맥락이 풍부한 이벤트 로그: PostgreSQL에 모든 상호작용 로그 저장.
효율적인 기억 검색 및 우선순위화: ChromaDB에 임베딩 및 '놀람 점수' 저장.
계층적/모듈화된 지식 표현: PostgreSQL 테이블로 스킬/사용자/목표별 파라미터 분리 관리.

이 문서는 로빙의 베이지안 철학을 실제 시스템으로 구현하기 위한 이론적 배경과 구체적인 로드맵을 제공합니다.

5.8 KiB Raw Blame History