- 팀 소개
- 홍길동: CTO, 전직 네이버, AI 12년 경력
-
-
- ```
-
-### 5.2 고급 수준 변환 (복잡)
-- **난이도**: 높음
-- **요구사항**:
- - 레이아웃 유지하면서 HTML/CSS 재현
- - 반복 구조 템플릿화
- - 전환 효과 및 계층 구조 시각화
- - 반응형 디자인 적용
-
-### 5.3 의미 기반 변환 (최고 수준)
-- **난이도**: 매우 높음
-- **필요 기술**:
- - 논리 흐름 분석
- - 시각 구조 해석
- - 컴포넌트 단위 인식
- - LLM/Vision 모델 활용
-
-## 6. 실용적 구현 방안
-
-### 6.1 도구 및 라이브러리
-- **python-pptx**: 기본 텍스트/이미지 추출
-- **unoconv**: LibreOffice 기반 변환
-- **Aspose**: 상용 변환 라이브러리
-- **Apache POI**: Java 기반 처리
-
-### 6.2 단계별 접근
-1. **Phase 1**: 기본 텍스트/이미지 추출
-2. **Phase 2**: 제목/본문 구분 (폰트 크기, 위치 기반)
-3. **Phase 3**: 슬라이드 논리 구조 분석
-4. **Phase 4**: 의미 기반 HTML 변환
-
-### 6.3 현실적 절충안
-- 완벽한 의미 분석보다는 "어느 정도 추론 가능한 수준"
-- 사용자 피드백을 통한 점진적 개선
-- 특정 도메인(IR, 교육 등) 특화 접근
-
-## 7. 결론
-
-### 7.1 핵심 인사이트
-- PPTX 구조 분석은 **불가능하지 않으나 완전 자동화는 어려움**
-- **기본 수준의 HTML 변환은 충분히 실용적**
-- **목적과 범위 정의가 핵심**
-
-### 7.2 권장사항
-- 단순 문서 변환용: 즉시 구현 가능
-- 의미 기반 분석: 단계적 접근 필요
-- 특정 용도 특화: 도메인별 최적화 고려
-
-### 7.3 로빙 프로젝트 적용 방안
-- PoC 단계: 슬라이드별 제목/내용 구조 기반 요약
-- 발전 단계: GPT + Vision 모델 활용한 의미 분석
-- 완성 단계: 사용자 맞춤형 구조 학습 시스템
-
----
-
-*이 문서는 ChatGPT와의 대화를 기반으로 작성되었으며, PPTX 파일 처리 스킬 개발의 기술적 근거로 활용됩니다.*
\ No newline at end of file
diff --git a/docs/skills-stats/외부도구_아이템화_및_스마트폰_오버레이_활용방안.md b/docs/skills-stats/외부도구_아이템화_및_스마트폰_오버레이_활용방안.md
index bc52865..d56702d 100755
--- a/docs/skills-stats/외부도구_아이템화_및_스마트폰_오버레이_활용방안.md
+++ b/docs/skills-stats/외부도구_아이템화_및_스마트폰_오버레이_활용방안.md
@@ -28,36 +28,10 @@
| 외부 도구 | Notion, Slack, Zoom 등 | 토큰 기반 권한 제어 |
| 프리미엄 모델 | GPT-4 등 | 호출량 기반 과금 및 제한 |
-### 2.2 젠스파크(GenSpark) 연동
-
-#### 2.2.1 서비스 특성
-- AI 코드 생성 및 실시간 결과 실행 플랫폼
-- 웹 기반 코드 에디터 + 실행 환경 제공
-
-#### 2.2.2 로빙 연동 조건
-- **API 접근**: 젠스파크 공식 API 또는 웹 자동화 인터페이스 필요
-- **워크플로우**:
- 1. 로빙에서 코딩 요청 수신
- 2. 젠스파크로 스크립트 실행
- 3. 결과를 Slack/Notion으로 반환
-- **기술적 구현**:
- - 공식 API 미제공 시 Playwright 등 UI 자동화 활용
- - 실행 결과, 코드, 로그의 구조화된 반환
-
-### 2.3 리플릿(Replit) 연동
-
-#### 2.3.1 서비스 특성
-- 웹 기반 인터프리터 및 공유 가능한 코드 환경
-- 다양한 프로그래밍 언어 지원
-- 협업 기능 및 배포 환경 제공
-
-#### 2.3.2 활용 방식
-- **API 활용**: 리플릿 API 또는 템플릿 복제 링크 사용
-- **워크플로우**:
- 1. 사용자 입력 또는 Slack 대화를 코드로 변환
- 2. 리플릿에 코드 업로드 및 실행
- 3. 실행 링크 또는 결과를 Slack에 반환
-- **권한 관리**: 개인 토큰 또는 OAuth 인증으로 사용자 계정 연결
+### 2.2 외부 코드 실행 도구 연동
+- **주요 서비스**: GenSpark, Replit 등
+- **통합 방식**: API 또는 웹 자동화
+- **활용**: 코드 실행 요청 → 외부 도구 실행 → 결과 반환
## 3. 기술적 구현 방안
@@ -159,4 +133,7 @@
---
-*이 문서는 ChatGPT와의 대화를 기반으로 작성되었으며, 로빙의 외부 도구 아이템화 전략 수립에 활용됩니다.*
\ No newline at end of file
+*이 문서는 ChatGPT와의 대화를 기반으로 작성되었으며, 로빙의 외부 도구 아이템화 전략 수립에 활용됩니다.*
+
+**최종 수정**: 2025-07-29
+**수정 내용**: 외부 도구별 상세 설명을 간소화하여 핵심 내용만 유지
\ No newline at end of file
diff --git a/troubleshooting/250729_happybell80_프론트엔드재설계.md b/troubleshooting/250729_happybell80_프론트엔드재설계.md
new file mode 100644
index 0000000..369d535
--- /dev/null
+++ b/troubleshooting/250729_happybell80_프론트엔드재설계.md
@@ -0,0 +1,121 @@
+# 프론트엔드 재설계 및 GUI 공유 아키텍처 논의
+
+**날짜**: 2025-07-29
+**작업자**: happybell80 & Claude
+**관련 프로젝트**: frontend-customer, 로빙 GUI 공유 시스템
+
+## 오후 6시 7분
+
+### 세션 시작 문제
+
+Claude가 세션 시작 시 규칙을 제대로 따르지 않음. CLAUDE.md 재확인 후 규칙 준수.
+
+**교훈**:
+- 세션 시작 시 항상 CLAUDE.md 규칙 재확인 필요
+- 간결한 응답 원칙 준수
+
+## 오후 6시 30분
+
+### 프론트엔드 커스터머 대대적 개편 계획
+
+**목표**:
+- 기존 React 기반 frontend-customer를 모바일 게임 UI처럼 개편
+- Merge Restaurant 스타일의 인터페이스 적용
+
+**현재 상태 분석**:
+1. 프로젝트 구조
+ - React 18 + TypeScript + Vite
+ - Tailwind CSS + shadcn/ui
+ - 2가지 뷰 모드: 관리 대시보드, 캐릭터 대시보드
+
+2. 발견된 문제
+ - @shared/schema import 존재하지만 실제 파일 없음
+ - 이미지 경로 하드코딩
+ - API URL 환경변수 미사용
+
+**DOCS 문서 검토**:
+- PERSONOS 프로토콜: 감정 공명, 상호기억 시스템
+- 외부도구 아이템화 방안
+- PRD: 3개월 MVP 계획
+
+## 오후 7시 00분
+
+### 로빙 컨테이너 GUI 공유 아키텍처 설계
+
+**핵심 개념**: 로빙이 컨테이너에서 실행하는 모든 GUI를 사용자가 웹으로 볼 수 있게 함
+
+**기술 스택**:
+1. VNC/noVNC 방식 (선택)
+ - Xvfb + x11vnc + noVNC
+ - Slack 인증 불필요
+ - 리소스: 300MB~1GB
+
+2. 레벨별 단계적 해금
+ - Lv.1-4: 스크린샷 (300-400MB)
+ - Lv.5-9: 반응형 스크린샷
+ - Lv.10-14: 영상 스트리밍 (500-700MB)
+ - Lv.15-19: 읽기 전용 VNC (800MB-1GB)
+ - Lv.20: 완전 제어 VNC (1GB+)
+
+**리소스 최적화**:
+- qutebrowser, surf 등 경량 브라우저 사용
+- 세션 수명 제한
+- 독립 스킬 컨테이너 분리
+
+## 오후 7시 20분
+
+### SaaS에서 독립 GUI로의 확장 전략
+
+**철학**: 초기에는 SaaS API만 사용하다가 레벨업하면서 독립 GUI 도구 해금
+
+**단계별 확장**:
+- Lv.1-4: Gmail, Notion API
+- Lv.5-9: Google Docs, Figma API
+- Lv.10-14: Playwright로 SaaS 화면 공유
+- Lv.15-19: PDF 리더, 로그 뷰어 등 독립 앱
+- Lv.20: LibreOffice, 터미널 도구
+
+**GUI 프레임 최적화**:
+- 창 관리자 없이 Xvfb 직접 실행
+- xdotool로 불필요한 UI 제거
+- 이미지 크롭으로 콘텐츠만 추출
+
+## 오후 7시 30분
+
+### 웹 인터페이스 3분할 설계
+
+**데스크톱**: GUI 화면 | 채팅창 | 상태창 (가로 3분할)
+**모바일**: 슬라이드 전환 방식
+
+**기술 스택 비교**:
+1. React 기반 (권장)
+ - 게임풍 UI 구현 용이
+ - Framer Motion, Lottie 활용
+
+2. Rails 기반
+ - 빠른 개발 가능
+ - GUI 스트리밍과 통합 어려움
+ - 복잡한 UI 표현 한계
+
+**결론**: React + 애니메이션 라이브러리로 게임 스타일 UI 구현
+
+## 교훈
+
+1. **GUI 공유는 리소스와 신뢰의 트레이드오프**
+ - 레벨이 낮을 때는 최소한의 리소스로 관찰만
+ - 신뢰가 쌓이면 더 많은 리소스를 투자해 제어 권한 부여
+
+2. **SaaS 우선, GUI는 보조**
+ - 대부분의 작업은 API로 해결 가능
+ - GUI 공유는 투명성과 신뢰 구축용
+
+3. **기술 스택은 목적에 맞게**
+ - 게임풍 UI가 목표라면 React가 Rails보다 적합
+ - 하지만 핵심 기능은 기존 스택 유지 가능
+
+4. **점진적 확장이 핵심**
+ - 한번에 모든 기능을 구현하지 말고 레벨별로 해금
+ - 리소스 사용량도 점진적으로 증가
+
+---
+**작성 완료**: 2025-07-29 19:35
\ No newline at end of file