윈도우용 wget.
생각보다 유용하게 쓰인다.
생각보다 유용하게 쓰인다.
2. 사용방법 #
C:\>wget -h
간단한 설명을 볼수 있다.
C:\>wget http://url/index.html
url의 index.html 를 현재 디렉토리에 복사한다. 'http://'은 생략 가능하다.
C:\>wget -q url/doc/lecture/lecture.html
표준 출력에 로그를 남기지 않는다.
C:\>wget -O a.html url/doc/lecture/lecture.html
다른 이름으로 받는다.
C:\>wget -r http://url/doc/lecture/
-r 옵션의 'r' 은 '재귀적'을 의미하는 'recursive'의 줄임이다. 디렉토리 구조와 파일을 그대로 복사해 온다.
재귀적 탐색의 깊이 레벨은 기본값이 '5'로 되어 있다. '-l depth' 옵션을 사용하면 바꿀수 있다. 이 레벨이 증가함에 따라 복사해오는 파일은 지수 함수적으로 증가하게 된다.
C:\>wget -r url/doc/lecture/lecture.html
'lecture.html'과 이것에 링크된 파일들을 복사해 온다. 이 과정에서 링크된 파일 중 상위 디렉토리에 있는 것도 있는데, 이것들은 빼고 원하는 파일이 있는 디렉토리와 그 이하에서만 받아 오려면
C:\>wget -r -np url/doc/lecture/lecture.html
'-np' 옵션을 사용한다. 'np'는 'no-parent'를 의미한다.
여기서 홈페이지에서 그림이나 오디오파일 등은 빼고 HTML 문서만 복사해오고자 한다면
C:\>wget -r -np -A html, htm url/doc/lecture/lecture.html
와 같이 -'A'옵션을 사용한다. 'A'는 'accept'를 의미한다. 위의 예처럼 원하는 파일의 형식을 나열하면된다. 반대로 일부 파일을 제외하고 싶으면 '-R' 옵션을 사용한다. 'R'은 'reject'를 의미한다.
C:\>wget -r -R gif, jpg, jpeg url/doc/lecture/lecture.html