Wget - opțiuni de bază

Programul wget descarcă site-uri și fișiere individuale în directorul curent (în directorul unde a fost rulat wget).

Descărcarea unui fișier

Pentru a descărca un fișier cu wget, puteți folosi această linie de comandă







  • -t 45 - numărul de repetări în caz de eșec al conexiunii
  • -c - modul de reluare. Specifică wget pentru a continua încărcarea fișierului. Dacă fișierul există deja în directorul curent, va fi trimisă o solicitare serverului pentru a continua descărcarea
  • --raspuns server - afiseaza protocolul de raspuns al serverului
  • --referer =. indică adresa URL a editorului. Parametrul este necesar pentru descărcarea de pe acele servere care verifică URL-ul referer și nu permite descărcarea fișierului dacă acesta nu aparține acestui server
  • Parametrul este adresa URL a fișierului descărcat. Acesta va fi pus în directorul curent

Descărcarea listei de fișiere

Dacă există un fișier în interiorul căruia există o listă de fișiere pentru descărcare (o adresă URL pe o singură linie), puteți descărca printr-o astfel de comandă comanda

wget -i linkfile.txt

Restricționarea vitezei de descărcare

Pentru a limita viteza de descărcare, puteți utiliza parametrul

în acest caz, viteza va fi limitată la 10 Kb / sec.

Descărcarea fișierelor după șablon

Când pompați peste FTP, puteți specifica șabloanele în numele fișierelor (desigur, prin "citarea" acestora). De exemplu, comanda







descarcă toate actualizările sistemului XFree86.

Descărcați site-uri recursive

Când se descarcă recursiv, wget creează automat arborele de directoare corespunzător.

În acest caz, fișierele vor fi plasate în directorul ./www.h-hosts.com/users/goofy/.

Dacă descărcarea datelor a fost întreruptă accidental, atunci pentru a relua descărcarea de la punctul de întrerupere, trebuie să adăugați comutatorul -c la comandă

Notă. Wget, fiind un program cultural, cu descărcări recurente, respectă așa-numitul. "Protocolul roboților web" și poate sări peste o parte din fișiere (interzise în fișierul robots.txt de pe server). Pentru a dezactiva această "cultură", puteți folosi tasta "-e robots = off". Citiți despre protocolul roboți web în documentația info pentru Wget, utilizând comanda info wget appendices robots.

Descărcarea numai a anumitor conținuturi de pe site

Puteți utiliza o comandă a formularului

Această comandă va descărca site-ul somesite.com recursiv, adică toate link-urile către fișierele html care vor fi găsite în index.html de pe acest site vor fi procesate și descărcate, vor fi de asemenea descărcate etc.

Opțiunea -A restricționează conținutul descărcabil la extensii valide, interzicând astfel descărcarea, de exemplu, a arhivelor tar.gz. În aceste condiții, wget nu va depăși domeniul specificat și, în plus, va descărca numai acele rechizite (-p, adică imagini și stiluri) care se află pe același site.

Cu toate acestea, prin adăugarea opțiunii -H, puteți crea accidental o copie locală a Internetului în 5 linkuri recursive. Trebuie să fii atent. Dar pentru aceasta există o opțiune -l - care stabilește nivelul cuiburilor descărcate.

Descărcați în fundal

Dacă opțiunea "-b" (fundal) este specificată, programul intră imediat în fundal, astfel încât utilizatorul să poată face alte lucruri sau chiar să se deconecteze și wget va continua să funcționeze.

Mesajele care vor fi afișate pe ecran vor merge la fișierul wget.log (și dacă există deja, atunci wget.log.1, wget.log.2, etc.). Aceste fișiere log sunt generate în directorul curent.

Continuând în fundal.

Rezultatul va fi scris în `wget-log '.

/ moale% tail -f wget-log







Articole similare

Trimiteți-le prietenilor: