Скачуємо сайти повністю - утиліта wget

Поради та підказки щодо софту, роботи в операційних системах, комплектуючих та зборок комп'ютерів.
Аватар користувача
toxi
Администратор
Администратор
Статті: 0
Повідомлень: 532
З нами з: 12-04-2008 07:58:25
Ваша стать: Чоловічий
І'мя: Roman
Контактна інформація:

Скачуємо сайти повністю - утиліта wget

Повідомлення toxi »

wget - це утиліта, яка призначена для завантаження файлів по мережі (з інтернету). Я розповім, як використовувати wget, щоб завантажувати сайти з інтернету повністю, а потім переглядати їх в автономному режимі.

За допомогою wget можна завантажувати сайти, включаючи картинки, лише вказавши адресу сайту та певні параметри. wget автоматично переходитиме за посиланнями на сайті та завантажуватиме сторінку за сторінкою. Розглянемо кілька прикладів.

Щоб скачати сайт повністю за допомогою wget, потрібно виконати команду:

Код: Виділити все

wget -r -k -l 7 -p -E -nc http://site.com/
Після виконання цієї команди до директорії site.com буде завантажено локальну копію сайту http://site.com. Щоб відкрити домашню сторінку сайту, потрібно відкрити файл index.html.

Розглянемо параметри, що використовуються:
-r - Вказує на те, що потрібно рекурсивно переходити за посиланнями на сайті, щоб завантажувати сторінки.
-k — використовується для того, щоб wget перетворив всі посилання в скачаних файлах таким чином, щоб можна було переходити на локальному комп'ютері (в автономному режимі).
-p - вказує на те, що потрібно завантажити всі файли, які потрібні для відображення сторінок (зображення, CSS і т.д.).
-l - Визначає максимальну глибину вкладеності сторінок, які wget повинен скачати (за замовчуванням значення дорівнює 5, в прикладі ми встановили 7). У більшості випадків сайти мають сторінки з великим ступенем вкладеності та wget може просто «закопатися», завантажуючи нові сторінки. Щоб цього не сталося, можна використовувати параметр -l.
-E — додавати до завантажених файлів розширення .html.
-nc — якщо використовується цей параметр, існуючі файли не будуть перезаписані. Це зручно, коли потрібно продовжити завантаження сайту, перерване попереднього разу.

Ми розглянули лише одне із можливих застосувань утиліти wget. Насправді область застосування wget значно ширша і wget має велику кількість додаткових параметрів. За більш детальною інформацією звертайтесь до посібника, виконавши у командному рядку: man wget.
Правила форуму :: Виконую послуги IT-адміністратора (види послуг).