4.3 KiB
4.3 KiB
tags
| tags | |||||
|---|---|---|---|---|---|
|
260312 Company X 장시간 동기화 상태 미기록 종료 이슈
상태: 해결됨 (2026-03-12 상태 기록 강화 적용 후 장시간 재개 실행에서 state.json 실시간 갱신 확인)
상위 원칙
- Infra Project Identity
- Core Infrastructure Principles
- Operational Guardrails
- 공통 작성 원칙: 0_VALUE Writing Principles
관련 문서
- 외부 NAS -> 내부 NAS 컴퍼니엑스 파일 동기화 아이디어
- 외부 NAS -> 내부 NAS 컴퍼니엑스 동기화 리서치
- 외부 NAS -> 내부 NAS 컴퍼니엑스 동기화 운영계획
- Company X 외부 NAS 동기화 스크립트 구현 및 대표 검증
문제 정의
companyx_external_nas_sync.py로/6.Company X -> /mnt/nas/workspace/6.Company X전체 동기화를 장시간 실행했지만, 프로세스 종료 후 상태 파일과 실패 로그가 남지 않았다.- 따라서 전체 동기화가 어디까지 성공했고 어디에서 왜 끊겼는지 실행 결과만으로 닫을 수 없다.
- 이 문제는 아이디어 타당성 문제가 아니라, 장시간 실행을 운영 가능한 상태로 남기지 못한 실행 안정성 문제다.
재현 조건
- 대상: 외부 NAS
/6.Company X - 내부 경로:
/mnt/nas/workspace/6.Company X - 스크립트:
/home/admin/infra/scripts/bin/companyx_external_nas_sync.py - 대용량 디자인/영상 파일이 포함된 전체 트리 기준 장시간 실행
확인된 사실
- 대표 경로 검증은 정상 동작했다.
/6.Company X/7. 사진/220308_X코스_5기 발표 사진기준 1회 동기화는downloaded=20, 2회 재실행은skipped=20,failed=0이었다.
- 전체 트리 실행에서는 실제 데이터가 크게 누적됐다.
- 확인 시점 기준
/mnt/nas/workspace/6.Company X는 약283G까지 증가했다.
- 2026-03-12 보강 전 실행에서는
companyx_external_nas_sync.py프로세스만 사라지고 실행 메타데이터가 남지 않았다.
pgrep -af 'companyx_external_nas_sync.py$'결과 없음
- 2026-03-12 보강 후 실행에서는
/mnt/nas/workspace/.sync-logs/에 상태 파일과 임시파일 진단 로그가 생성됐다.
companyx_sync_state.jsoncompanyx_tmp_inventory_20260312.jsonl- 즉 장시간 실행 중 현재 위치를 설명할 최소 메타데이터는 남길 수 있게 됐다.
- 임시 파일 흔적은 남아 있다.
- 예:
tmp3fe5jpym393,216,000B - 예:
tmpjrz40eiq0B - 즉 일부 다운로드는 완료 파일이 아니라 임시 파일 상태로 끊겼다.
- 종료 직전 장시간 실행 흔적은 있었다.
- 이전 확인 기준
companyx_external_nas_sync.py프로세스는 약2시간 46분이상 살아 있었다. - 당시 CPU 사용률은 약
16%, 메모리 사용률은 약0.1%수준이었다. - 내부 경로 용량은 장시간 실행 중
11G -> 29G -> 143G -> 208G -> 283G로 계속 증가했다.
- 최신 임시 파일 시각은 2026-03-11 저녁 구간에 집중된다.
- 최신 예시:
2026-03-11 19:27:19 KST,tmp3fe5jpym,393,216,000B - 즉 오래된 원본 폴더 내부에 과거부터 있던
tmp*와, 이번 실행 중 새로 남은tmp*를 구분해서 봐야 한다.
영향 범위
- 전체 동기화 완주 여부를 현재 결과만으로 단정할 수 없다.
- 재개 시 어떤 파일을 다시 받아야 하는지, 어떤 임시 파일을 어떻게 취급해야 하는지 운영 판단이 애매해진다.
- 아이디어 종료 기준인
재현 가능한 동기화 운영 절차가 아직 닫히지 않는다.
해결 후 남은 항목
- 최초 종료 원인은 여전히 확정되지 않았다.
- 다만 현재 주제의 핵심이었던
상태 미기록은 해결됐고, 남은 것은 전체 동기화 완주와 최종 요약 파일 확인이다.