--- tags: [infra, nas, companyx, sync, troubleshooting] --- # 260312 Company X 장시간 동기화 상태 미기록 종료 이슈 **상태**: 해결 및 종료 (2026-03-12 상태 기록 강화 후 전체 재개 실행 완주와 `summary` 생성 확인) ## 상위 원칙 - [Infra Project Identity](../../00_Philosophy/00_IDENTITY/Infra_Project_Identity.md) - [Core Infrastructure Principles](../../00_Philosophy/01_PRINCIPLES/Core_Infrastructure_Principles.md) - [Operational Guardrails](../../00_Philosophy/02_GUARDRAILS/Operational_Guardrails.md) - 공통 작성 원칙: [0_VALUE Writing Principles](https://github.com/happybell80/0_VALUE/blob/main/02_Governance/writing-principles.md) ## 관련 문서 - [외부 NAS -> 내부 NAS 컴퍼니엑스 파일 동기화 아이디어](../ideas/260307_external_nas_companyx_sync_아이디어.md) - [외부 NAS -> 내부 NAS 컴퍼니엑스 동기화 리서치](../research/260307_external_nas_companyx_sync_research.md) - [외부 NAS -> 내부 NAS 컴퍼니엑스 동기화 운영계획](../plans/260311_external_nas_companyx_sync_운영계획.md) - [Company X 외부 NAS 동기화 스크립트 구현 및 대표 검증](../worklog/260311_companyx_external_nas_sync_스크립트구현_및_대표검증.md) ## 문제 정의 - `companyx_external_nas_sync.py`로 `/6.Company X -> /mnt/nas/workspace/6.Company X` 전체 동기화를 장시간 실행했지만, 프로세스 종료 후 상태 파일과 실패 로그가 남지 않았다. - 따라서 전체 동기화가 어디까지 성공했고 어디에서 왜 끊겼는지 실행 결과만으로 닫을 수 없다. - 이 문제는 아이디어 타당성 문제가 아니라, 장시간 실행을 운영 가능한 상태로 남기지 못한 실행 안정성 문제다. ## 재현 조건 - 대상: 외부 NAS `/6.Company X` - 내부 경로: `/mnt/nas/workspace/6.Company X` - 스크립트: `/home/admin/infra/scripts/bin/companyx_external_nas_sync.py` - 대용량 디자인/영상 파일이 포함된 전체 트리 기준 장시간 실행 ## 확인된 사실 1. 대표 경로 검증은 정상 동작했다. - `/6.Company X/7. 사진/220308_X코스_5기 발표 사진` 기준 1회 동기화는 `downloaded=20`, 2회 재실행은 `skipped=20`, `failed=0`이었다. 2. 전체 트리 실행에서는 실제 데이터가 크게 누적됐다. - 확인 시점 기준 `/mnt/nas/workspace/6.Company X`는 약 `283G`까지 증가했다. 3. 2026-03-12 보강 전 실행에서는 `companyx_external_nas_sync.py` 프로세스만 사라지고 실행 메타데이터가 남지 않았다. - `pgrep -af 'companyx_external_nas_sync.py$'` 결과 없음 4. 2026-03-12 보강 후 실행에서는 `/mnt/nas/workspace/.sync-logs/`에 상태 파일과 임시파일 진단 로그가 생성됐다. - `companyx_sync_state.json` - `companyx_tmp_inventory_20260312.jsonl` - 즉 장시간 실행 중 현재 위치를 설명할 최소 메타데이터는 남길 수 있게 됐다. 5. 임시 파일 흔적은 남아 있다. - 예: `tmp3fe5jpym` `393,216,000B` - 예: `tmpjrz40eiq` `0B` - 즉 일부 다운로드는 완료 파일이 아니라 임시 파일 상태로 끊겼다. 6. 종료 직전 장시간 실행 흔적은 있었다. - 이전 확인 기준 `companyx_external_nas_sync.py` 프로세스는 약 `2시간 46분` 이상 살아 있었다. - 당시 CPU 사용률은 약 `16%`, 메모리 사용률은 약 `0.1%` 수준이었다. - 내부 경로 용량은 장시간 실행 중 `11G -> 29G -> 143G -> 208G -> 283G`로 계속 증가했다. 7. 최신 임시 파일 시각은 2026-03-11 저녁 구간에 집중된다. - 최신 예시: `2026-03-11 19:27:19 KST`, `tmp3fe5jpym`, `393,216,000B` - 즉 오래된 원본 폴더 내부에 과거부터 있던 `tmp*`와, 이번 실행 중 새로 남은 `tmp*`를 구분해서 봐야 한다. ## 영향 범위 - 전체 동기화 완주 여부를 현재 결과만으로 단정할 수 없다. - 재개 시 어떤 파일을 다시 받아야 하는지, 어떤 임시 파일을 어떻게 취급해야 하는지 운영 판단이 애매해진다. - 아이디어 종료 기준인 `재현 가능한 동기화 운영 절차`가 아직 닫히지 않는다. ## 해결 후 남은 항목 - 최초 종료 원인은 여전히 확정되지 않았다. - 다만 현재 주제의 핵심이었던 `상태 미기록`은 해결됐고, 2026-03-12 전체 재개 실행도 `finished_at`과 `summary`까지 남기며 종료됐다. ## 최종 결과 - 최종 요약 파일: `/mnt/nas/workspace/.sync-logs/companyx_sync_summary_20260312_121619.json` - 완료 시각: `2026-03-12 13:59:01 KST` - 최종 수치: - `downloaded=18481` - `skipped=34352` - `failed=0` - `delete_candidates=16` - `files_seen=52833` - 따라서 이 troubleshooting 주제는 `원인 미상 종료`가 아니라 `상태 기록과 요약이 남는 운영 실행`으로 전환돼 닫혔다.