DOCS/journey/troubleshooting/260312_companyx_sync_장시간동기화_상태미기록종료_이슈.md

4.7 KiB

tags
tags
infra
nas
companyx
sync
troubleshooting

260312 Company X 장시간 동기화 상태 미기록 종료 이슈

상태: 해결 및 종료 (2026-03-12 상태 기록 강화 후 전체 재개 실행 완주와 summary 생성 확인)

상위 원칙

관련 문서

문제 정의

  • companyx_external_nas_sync.py/6.Company X -> /mnt/nas/workspace/6.Company X 전체 동기화를 장시간 실행했지만, 프로세스 종료 후 상태 파일과 실패 로그가 남지 않았다.
  • 따라서 전체 동기화가 어디까지 성공했고 어디에서 왜 끊겼는지 실행 결과만으로 닫을 수 없다.
  • 이 문제는 아이디어 타당성 문제가 아니라, 장시간 실행을 운영 가능한 상태로 남기지 못한 실행 안정성 문제다.

재현 조건

  • 대상: 외부 NAS /6.Company X
  • 내부 경로: /mnt/nas/workspace/6.Company X
  • 스크립트: /home/admin/infra/scripts/bin/companyx_external_nas_sync.py
  • 대용량 디자인/영상 파일이 포함된 전체 트리 기준 장시간 실행

확인된 사실

  1. 대표 경로 검증은 정상 동작했다.
  • /6.Company X/7. 사진/220308_X코스_5기 발표 사진 기준 1회 동기화는 downloaded=20, 2회 재실행은 skipped=20, failed=0이었다.
  1. 전체 트리 실행에서는 실제 데이터가 크게 누적됐다.
  • 확인 시점 기준 /mnt/nas/workspace/6.Company X는 약 283G까지 증가했다.
  1. 2026-03-12 보강 전 실행에서는 companyx_external_nas_sync.py 프로세스만 사라지고 실행 메타데이터가 남지 않았다.
  • pgrep -af 'companyx_external_nas_sync.py$' 결과 없음
  1. 2026-03-12 보강 후 실행에서는 /mnt/nas/workspace/.sync-logs/에 상태 파일과 임시파일 진단 로그가 생성됐다.
  • companyx_sync_state.json
  • companyx_tmp_inventory_20260312.jsonl
  • 즉 장시간 실행 중 현재 위치를 설명할 최소 메타데이터는 남길 수 있게 됐다.
  1. 임시 파일 흔적은 남아 있다.
  • 예: tmp3fe5jpym 393,216,000B
  • 예: tmpjrz40eiq 0B
  • 즉 일부 다운로드는 완료 파일이 아니라 임시 파일 상태로 끊겼다.
  1. 종료 직전 장시간 실행 흔적은 있었다.
  • 이전 확인 기준 companyx_external_nas_sync.py 프로세스는 약 2시간 46분 이상 살아 있었다.
  • 당시 CPU 사용률은 약 16%, 메모리 사용률은 약 0.1% 수준이었다.
  • 내부 경로 용량은 장시간 실행 중 11G -> 29G -> 143G -> 208G -> 283G로 계속 증가했다.
  1. 최신 임시 파일 시각은 2026-03-11 저녁 구간에 집중된다.
  • 최신 예시: 2026-03-11 19:27:19 KST, tmp3fe5jpym, 393,216,000B
  • 즉 오래된 원본 폴더 내부에 과거부터 있던 tmp*와, 이번 실행 중 새로 남은 tmp*를 구분해서 봐야 한다.

영향 범위

  • 전체 동기화 완주 여부를 현재 결과만으로 단정할 수 없다.
  • 재개 시 어떤 파일을 다시 받아야 하는지, 어떤 임시 파일을 어떻게 취급해야 하는지 운영 판단이 애매해진다.
  • 아이디어 종료 기준인 재현 가능한 동기화 운영 절차가 아직 닫히지 않는다.

해결 후 남은 항목

  • 최초 종료 원인은 여전히 확정되지 않았다.
  • 다만 현재 주제의 핵심이었던 상태 미기록은 해결됐고, 2026-03-12 전체 재개 실행도 finished_atsummary까지 남기며 종료됐다.

최종 결과

  • 최종 요약 파일: /mnt/nas/workspace/.sync-logs/companyx_sync_summary_20260312_121619.json
  • 완료 시각: 2026-03-12 13:59:01 KST
  • 최종 수치:
    • downloaded=18481
    • skipped=34352
    • failed=0
    • delete_candidates=16
    • files_seen=52833
  • 따라서 이 troubleshooting 주제는 원인 미상 종료가 아니라 상태 기록과 요약이 남는 운영 실행으로 전환돼 닫혔다.