Wget, keletas pavyzdžių, ką galima padaryti naudojant šį įrankį

Apie wget

Kitame straipsnyje mes pažvelgsime į Wget. Reikia pasakyti, kad „GNU Wget“ yra a nemokamas įrankis leidžiantis atsisiųsti turinį iš interneto serverių paprastu ir greitu būdu. Jo pavadinimas kilo iš žiniatinklio (w) ir žodis get (angliškai gauti). Šis pavadinimas reiškia: gauti iš WWW.

Šiandien yra daugybė programų, leidžiančių labai efektyviai atsisiųsti failus. Dauguma jų yra pagrįsti žiniatinklio ir darbalaukio sąsajomis ir yra sukurti visoms operacinėms sistemoms. Tačiau „Gnu / Linux“ (taip pat yra „Windows“ versija) yra galingas atsisiuntimo tvarkyklė wget failų. Tai laikoma galingiausiu egzistuojančiu atsisiuntėju. Palaiko tokius protokolus kaip http, https ir FTP.

Atsisiųskite failus naudodami „wget“

Atsisiųskite failą

Paprasčiausias būdas naudoti šį įrankį yra atsisiųsti nurodant bylą Ko mes norime:

wget http://sitioweb.com/programa.tar.gz

Atsisiųskite naudodami skirtingus protokolus

Kaip geras atsisiuntimų tvarkytuvas tai įmanoma paprašykite daugiau nei vieno atsisiuntimo vienu metu. Mes netgi galime naudoti skirtingus protokolus ta pačia tvarka:

wget http://sitioweb.com/programa.tar.gz ftp://otrositio.com/descargas/videos/archivo-video.mpg

Atsisiųsti pagal plėtinį

Kitas būdas atsisiųsti kelis failai, kurie naudoja tą patį plėtinį, jis naudos pakaitos žvaigždutę:

wget<code class="language-bash" data-lang="bash">-r -A.pdf</code>http://sitioweb.com/*.pdf

Ši komanda ne visada veikia, nes kai kurie serveriai gali užblokuoti prieigą wget.

Atsisiųskite failų sąrašą

Jei norime atsisiųsti failus, kuriuos randame, turėsime tik juos išsaugoti URL faile. Mes sukursime sąrašą, vadinamą failai.txt o komandai nurodysime sąrašo pavadinimą. Būtinas kiekvienoje eilutėje įdėkite tik vieną URL viduje files.txt.

Komanda, kurią naudosime atsisiųsdami sukurtą sąrašą ir kurią išsaugosime .txt failuose, bus tokia:

wget -i archivos.txt

Iš naujo paleiskite atsisiuntimą

Jei dėl kokių nors priežasčių atsisiuntimas buvo nutrauktas, galėsime tai padaryti tęskite atsisiuntimą ten, kur baigta naudojant c variantas su komanda wget:

wget -i -c archivos.txt

Pridėkite žurnalą apie atsisiuntimą

Jei norime gauti žurnalą apie atsisiuntimą, tam, kad kontroliuoti bet kokį incidentą ant jo turėsime pridėti -o variantas kaip parodyta taip:

wget -o reporte.txt http://ejemplo.com/programa.tar.gz

Apriboti atsisiuntimo pralaidumą

Per labai ilgus atsisiuntimus mes galime apriboti atsisiuntimo pralaidumą. Tokiu būdu mes užkirsime kelią atsisiuntimui perimti visą pralaidumą per visą atsisiuntimo laiką:

wget -o /reporte.log --limit-rate=50k ftp://ftp.centos.org/download/centos5-dvd.iso

Atsisiųskite naudodami vartotojo vardą ir slaptažodį

Jei norime atsisiųsti iš svetainės, kur reikalingas vartotojo vardas / slaptažodis, turėsime naudoti tik šias parinktis:

wget --http-user=admin --http-password=12345 http://ejemplo.com/archivo.mp3

Atsisiųsti bandymus

Pagal numatytuosius nustatymus ši programa bando užmegzti ryšį 20 kartų ir pradėkite atsisiuntimą, labai prisotintose svetainėse gali būti, kad net 20 bandymų nebuvo sėkmingi. Su variantas t padidėja iki daugiau bandymų.

wget -t 50 http://ejemplo.com/pelicula.mpg

Atsisiųskite svetainę naudodami „wget“

„Wget man“ pagalba

„Wget man“ pagalba

„Wget“ neapsiriboja tik failų atsisiuntimaisGalėsime atsisiųsti visą puslapį. Mes tiesiog turėsime parašyti kažką panašaus:

wget www.ejemplo.com

Atsisiųskite svetainę ir jos papildomus elementus

Su parinktis p mes taip pat atsisiųsime visus reikalingi papildomi elementai puslapyje pvz., stiliaus lapai, įterpti vaizdai ir kt.

Jei pridėsime variantas r se atsisiųs rekursyviai iki 5 lygių iš svetainės:

wget -r www.ejemplo.com -o reporte.log

Konvertuokite nuorodas į vietinius gyventojus

Pagal numatytuosius nustatymus nuorodos svetainėje nurodo viso domeno adresą. Jei atsisiųsime svetainę rekursyviai ir tada ją tyrinėsime neprisijungę, galime naudoti variantas konvertuoti nuorodas kad juos pavers vietiniai saitai:

wget --convert-links -r http://www.sitio.com/

Gaukite visą svetainės kopiją

Turėsime galimybę gauti išsamią svetainės kopiją. The –Veidrodinis variantas yra tas pats, kas naudoti parinktys -r -l inf -N tai rodo rekursiją begaliniu lygiu ir kiekvieno atsisiųsto failo originalios laiko žymos gavimą.

wget --mirror http://www.sitio.com/

Transformuoti plėtinius

Jei atsisiųsite visą svetainę norėdami ją peržiūrėti neprisijungę, keli atsisiųsti failai gali nebūti atidaryti dėl plėtinių, tokių kaip .cgi, .asp ar .php. Tada galima nurodyti –Html-plėtinio parinktis Visi failai konvertuojami į .html plėtinį.

wget --mirror --convert-links --html-extension http://www.ejemplo.com

Tai tik bendros gairės nei jūs galite padaryti su Wget. Kas nori, gali kreiptis į internetinis vadovas sužinoti visas galimybes, kurias mums siūlo šis nuostabus atsisiuntimų tvarkytuvas.


7 komentarai, palikite savo

Palikite komentarą

Jūsų elektroninio pašto adresas nebus skelbiamas. Privalomi laukai yra pažymėti *

*

*

  1. Atsakingas už duomenis: Miguel Ángel Gatón
  2. Duomenų paskirtis: kontroliuoti šlamštą, komentarų valdymą.
  3. Įteisinimas: jūsų sutikimas
  4. Duomenų perdavimas: Duomenys nebus perduoti trečiosioms šalims, išskyrus teisinius įsipareigojimus.
  5. Duomenų saugojimas: „Occentus Networks“ (ES) talpinama duomenų bazė
  6. Teisės: bet kuriuo metu galite apriboti, atkurti ir ištrinti savo informaciją.

  1.   Rubenas Kardenalas sakė

    Kalbant apie „Atsisiųsti plėtiniu“, aš nustojau skaityti. Negalite atsisiųsti to, ko nežinote. Tai, ko jūs sakote, negali būti padaryta, nebent prašomame kataloge leidžiama įrašyti failus ir trūksta indekso (ir abu turi būti vienu metu). Koks lygis.

    1.    „InformaticoAnonimo“ sakė

      Sveiki, Rubenai, nežinojimas yra šiek tiek drąsus.
      Ką galite komentuoti, galite padaryti naudodami paprastą komandą „Google“:
      filetype:pdf site:ubunlog.com
      Šiame pavyzdyje šiame tinklaraštyje nėra pdf, tačiau pakeiskite domeną gale į norimą internetą ir pamatysite, kaip lengva pamatyti visus žiniatinklio tipo failus.
      Geros dienos.

      1.    Phrankas sakė

        Bet „wget“ neprisijungia prie „Google“, kad rastų URL, esančius URL. Interneto katalogas turi būti atviras ir turi būti rodyklės puslapis, kurį sugeneravo mod_autoindex ar panašiai, kaip sako Rubén Cardenal.

    2.    Džimis Olano sakė

      "Ši komanda ne visada veikia, nes kai kurie serveriai gali užblokuoti prieigą prie" wget "."
      Šis pakeitimas, kuris buvo įdėtas į šį straipsnį, nes aš su juo nesutinku (nors techniškai įmanoma užblokuoti tam tikrus žiniatinklio agentus dėl http antraštės užklausų ir grąžinti 403 pranešimą „neleidžiama“) ir aš paaiškinsiu, kodėl:

      Visi „Apache“ žiniatinklio serveriai (ir aš kalbu apie didelę dalį serverių) pagal numatytuosius nustatymus leidžia šnipinėti (puikus „Wikipedia“ straipsnis: https://es.wikipedia.org/wiki/Glob_(inform%C3%A1tica) .

      Tai praktiškai reiškia, kaip nurodė p. Rubenas (ir jis teisus), JEI NĖRA KVIETIMO "index.php" arba "index.html" (arba net paprasčiausiai vadinama "index"), serveris tyliai grąžins failų ir katalogų sąrašą (žinoma, forma HTML puslapio su informacija kaip kiekvieno failo interneto nuoroda). DAUGIAU VEIKLOS PASLAUGŲ TEIKĖJŲ PABAIGA ŠIĄ SAVYBURE DĖL .htacces failo (griežtai tariant „Apache2“) SAUGUMO PRIEŽASTIS.

      Štai „wget“ universalumas (dar kartą peržiūrėkite jo istoriją Vikipedijoje, tą, kurią žinote labiausiai: https://es.wikipedia.org/wiki/GNU_Wget ) analizuoti ar „išanalizuoti“ tokią informaciją ir išgauti tik mūsų prašomus plėtinius.

      Dabar, jei tai neveikia, dėl vienų ar kitų priežasčių galime išbandyti kitas išplėstines „wget“ funkcijas, cituoju tiesiogiai anglų kalba:

      Visus GIF norite atsisiųsti iš katalogo, esančio HTTP serveryje. Jūs bandėte „wget“ http://www.example.com/dir/*.gif’, bet tai neveikė, nes HTTP atkūrimas nepalaiko „GLOBBING“ (aš dedu didžiąsias raides). Tokiu atveju naudokite:

      wget -r -l1 –ne -parent -A.gif http://www.example.com/dir/

      Verbiška, bet efektas tas pats. „-r -l1“ reiškia rekursyvų nuskaitymą (žr. „Rekursyvus atsisiuntimas“), maksimalus gylis 1. „–no-parent“ reiškia, kad nuorodos į tėvų katalogą nepaisomos (žr. „Directory-Based Limits“) ir „-A“. „gif“ reiškia atsisiųsti tik GIF failus. '-A «* .gif»' taip pat būtų veikęs.

      JEI BĖGSITE ŠIU PASKUTINIU KELIU wget sukurs mums aplanką su prašomu interneto adresu numatytame aplanke, kuriame dirbame, ir prireikus sukurs pakatalogius ir ten įdės, pavyzdžiui, .gif vaizdus, ​​kuriuos mes prašymą.

      --------
      Tačiau jei vis tiek neįmanoma gauti tik tam tikrų rūšių failų (pvz., * .Jpg), turėsime naudoti parametrą «–page-rekvizitai», kuris atsisiunčia visus vidinius HTML puslapio elementus (vaizdus, ​​garsus, „css“ ir kt.) kartu su pačiu HTML puslapiu („–page-rekvizitai“ gali būti sutrumpinti „-p“) ir tai atitiktų atsisiuntimą panašaus į „mhtml“ https://tools.ietf.org/html/rfc2557

      Tikiuosi, kad ši informacija jums bus naudinga.

      1.    Damianas Amoedo sakė

        Ačiū už užrašus. Salu2.

  2.   Užpakaliniai bankai sakė

    Manau, kad turite klaidą, pirmose dviejose eilutėse yra ta pati komanda.

  3.   mikrofonas sakė

    Labai ačiū, labai gera pamoka!