From d26bada28bf90a75215e8645e0a4c7e13459579b Mon Sep 17 00:00:00 2001 From: happybell80 Date: Tue, 14 Oct 2025 15:08:23 +0900 Subject: [PATCH] =?UTF-8?q?docs:=20=EB=AC=B8=EC=84=9C=20=EC=9E=91=EC=84=B1?= =?UTF-8?q?=20=EC=9B=90=EC=B9=99=20=EC=A4=80=EC=88=98=20-=20=EC=A4=91?= =?UTF-8?q?=EB=B3=B5=20=EC=A0=9C=EA=B1=B0=20=EB=B0=8F=20=EA=B0=84=EA=B2=B0?= =?UTF-8?q?=ED=99=94?= MIME-Version: 1.0 Content-Type: text/plain; charset=UTF-8 Content-Transfer-Encoding: 8bit --- .../251014_namuwiki_image_crawl_failure.md | 50 ++----------------- 1 file changed, 3 insertions(+), 47 deletions(-) diff --git a/troubleshooting/251014_namuwiki_image_crawl_failure.md b/troubleshooting/251014_namuwiki_image_crawl_failure.md index 4cd3a4a..0222fcd 100644 --- a/troubleshooting/251014_namuwiki_image_crawl_failure.md +++ b/troubleshooting/251014_namuwiki_image_crawl_failure.md @@ -49,53 +49,9 @@ const imgElement = await page.locator('.wiki-image img, .wiki-paragraph img').fi - 이미지 없는 문서 존재 (볶음밥, 볶음 등) ## 교훈 - -### ❌ 하지 말 것 -- **나무위키 크롤링 의존 금지**: 저작권, 봇 차단, 플레이스홀더 문제 -- **단일 소스 의존 금지**: 백업 없이 한 곳에서만 이미지 수집 - -### ✅ 해야 할 것 -- **저작권 명확한 소스 사용**: Pixabay (CC0), Unsplash (무료), Pexels -- **AI 생성 이미지**: Stable Diffusion/DALL-E - 한식 데이터셋 부족 우려 -- **수동 검수 필수**: 자동 크롤링 후 실제 이미지 확인 - -## 다음 단계 - -### 1단계: Pixabay API (우선) -```bash -# 기존 스크립트 존재 여부 확인 -ls scripts/download_korean_pixabay.sh -``` -- API 키: PIXABAY_API_KEY (환경변수) -- 쿼리: "korean {음식명} food" -- 라이선스: CC0 Public Domain - -### 2단계: 수동 다운로드 (Pixabay 실패 시) -- 직접 검색 후 고품질 이미지 선택 -- 1200×900 이상 해상도 -- 출처/라이선스 메타데이터 기록 - -### 3단계: WebP 변환 + 메타 매니페스트 -```javascript -// FOODS 배열에 추가 -{ - id: "007", - ko: "청국장찌개", - en: "cheonggukjang-jjigae", - image: "/images/foods/007_cheonggukjang-jjigae.webp", - width: 1200, - height: 900, - format: "webp", - source: "pixabay", - license: "CC0" -} -``` - -## 삭제할 파일 -```bash -# SVG 플레이스홀더 7개 삭제 -rm public/images/foods/{007,034,048,075,082,084,093}_*.jpg -``` +- 나무위키 크롤링 의존 금지: 저작권, 봇 차단, 플레이스홀더 +- 단일 소스 의존 금지: 백업 없이 한 곳에서만 수집 +- 수동 검수 필수: 자동 크롤링 후 실제 이미지 확인 ## 최종 해결 (2025-10-14)