Вгет, неки примери шта се може урадити помоћу овог алата

О вгету

У следећем чланку ћемо погледати Вгет. Мора се рећи да је ГНУ Вгет а бесплатан алат који омогућава преузимање садржаја са веб сервера на једноставан и брз начин. Његово име потиче од Ворлд Виде Веб (w) и реч гет (на енглеском get (добити)). Ово име значи: добити са ВВВ.

Данас постоје десетине апликација за преузимање датотека врло ефикасно. Већина њих је заснована на веб и десктоп интерфејсима и развијена је за све оперативне системе. Међутим на Гну / Линук (постоји и верзија за Виндовс) постоји моћан менаџер преузимања вгет датотека. Сматра се најмоћнијим програмом за преузимање који постоји. Подржава протоколе као што су хттп, хттпс и фтп.

Преузмите датотеке помоћу вгета

Преузмите датотеку

Најједноставнији начин коришћења овог алата је преузимање указујући на досије Оно што желимо:

wget http://sitioweb.com/programa.tar.gz

Преузмите помоћу различитих протокола

Као добар менаџер преузимања, то је могуће захтева више одједном преузимања. Можемо чак користити различите протоколе у ​​истом редоследу:

wget http://sitioweb.com/programa.tar.gz ftp://otrositio.com/descargas/videos/archivo-video.mpg

Преузми продужењем

Други начин за преузимање вишеструких датотеке које користе исту екстензију, користиће џокер звездицу:

wget<code class="language-bash" data-lang="bash">-r -A.pdf</code>http://sitioweb.com/*.pdf

Ова наредба не ради увек, јер су неки сервери можда блокирани вгет.

Преузмите списак датотека

Ако оно што желимо је да преузмемо датотеке које пронађемо, мораћемо само да их сачувамо УРЛ у датотеци. Направићемо листу под називом филес.ткт а ми ћемо наредби назначити име списка. Потребно ставите само један урл по реду унутар филес.ткт.

Наредба коју ћемо користити за преузимање креиране листе и коју ћемо сачувати у .ткт датотекама биће следећа:

wget -i archivos.txt

Поново покрените преузимање

Ако је из било ког разлога преузимање прекинуто, моћи ћемо наставите преузимање тамо где је стало помоћу опција ц помоћу команде вгет:

wget -i -c archivos.txt

Додајте евиденцију о преузимању

Ако желимо да добијемо дневник о преузимању, да бисмо контролишу било који инцидент на њему ћемо морати да додамо -о опција као што је приказано у следећем:

wget -o reporte.txt http://ejemplo.com/programa.tar.gz

Ограничите пропусност за преузимање

У веома дугим преузимањима можемо ограничити пропусност за преузимање. Овим ћемо спречити да преузимање заузима сав пропусни опсег током трајања преузимања:

wget -o /reporte.log --limit-rate=50k ftp://ftp.centos.org/download/centos5-dvd.iso

Преузмите са корисничким именом и лозинком

Ако желимо да преузмемо са локације на којој је потребно корисничко име / лозинка, мораћемо да користимо само ове опције:

wget --http-user=admin --http-password=12345 http://ejemplo.com/archivo.mp3

Покушаји преузимања

Уобичајено, овај програм чини 20 покушаја успостављања везе и започните преузимање, на врло засићеним сајтовима могуће је да чак и са 20 покушаја то није постигнуто. Са опција т повећава се на више покушаја.

wget -t 50 http://ejemplo.com/pelicula.mpg

Преузмите веб страницу са вгет-ом

Помозите човеку

Помозите човеку

Вгет није ограничен само на преузимање датотекаМоћи ћемо да преузмемо целу страницу. Само ћемо морати да напишемо нешто попут:

wget www.ejemplo.com

Преузмите веб локацију и њене додатне елементе

Са опција стр такође ћемо преузети све потребни додатни елементи на страници као што су табеле стилова, уметнуте слике итд.

Ако додамо опција р se ће рекурзивно преузети до 5 нивоа са сајта:

wget -r www.ejemplo.com -o reporte.log

Конвертујте везе у локалне

Везе на веб локацији подразумевано воде до адресе читавог домена. Ако страницу рекурзивно преузмемо, а затим је проучимо ван мреже, можемо користити опција цонверт-линкс то ће их претворити у локалне везе:

wget --convert-links -r http://www.sitio.com/

Набавите потпуну копију странице

Имаћемо могућност да добијемо потпуну копију веб локације. Тхе –Огледала опција је исто што и коришћење опције -р -л инф -Н што указује на рекурзију на бесконачном нивоу и добијање оригиналне временске ознаке сваке преузете датотеке.

wget --mirror http://www.sitio.com/

Трансформ екстензије

Ако преузмете целу веб локацију да бисте је прегледали офлајн, неколико преузетих датотека се можда неће отворити због екстензија као што су .цги, .асп или .пхп. Тада је могуће означити са –Хтмл-опција проширења Све датотеке се претварају у .хтмл екстензију.

wget --mirror --convert-links --html-extension http://www.ejemplo.com

Ово су само опште смернице него што можете учинити са Вгет-ом. Ко жели може да се консултује са онлајн приручник да консултујемо све могућности које нам нуди овај дивни менаџер преузимања.


Оставите свој коментар

Ваша емаил адреса неће бити објављена. Обавезна поља су означена са *

*

*

  1. За податке одговоран: Мигуел Ангел Гатон
  2. Сврха података: Контрола нежељене поште, управљање коментарима.
  3. Легитимација: Ваш пристанак
  4. Комуникација података: Подаци се неће преносити трећим лицима, осим по законској обавези.
  5. Похрана података: База података коју хостује Оццентус Нетворкс (ЕУ)
  6. Права: У било ком тренутку можете ограничити, опоравити и избрисати своје податке.

  1.   Рубен Царденал дијо

    Што се тиче „Преузимања помоћу екстензије“, престао сам да читам. Не можете преузети оно што не знате. Ако тражени директоријум не дозвољава списак датотека и ако му недостаје индекс (а оба се морају појавити истовремено), оно што кажете не може бити учињено. Какав ниво.

    1.    ИнформатицоАнонимо дијо

      Здраво Рубен, незнање је помало смело.
      Оно што коментаришете може се урадити једноставном командом за гоогле:
      филетипе:пдф сајт:ubunlogСа.
      У овом примеру на овом блогу нема пдф-а, али промените домен на крају на веб који желите и видећете како је лако видети све датотеке неке врсте мреже.
      Желим вам пријатан дан.

      1.    Пхранк дијо

        Али вгет се не повезује са гооглеом да би пронашао пдфс који се налазе у УРЛ-у. Веб директоријум мора бити отворен и мора постојати индексна страница коју генерише мод_аутоиндек или слично, како каже Рубен Царденал.

    2.    Јимми Олано дијо

      „Ова команда не функционише увек, јер су неки сервери можда блокирали приступ вгет-у.“
      Овај амандман који је стављен на овај чланак, јер се не слажем с њим (иако је технички могуће блокирати одређене веб агенте за захтеве заглавља хттп и вратити поруку 403 „није дозвољено“), и објаснићу зашто:

      Сви Апацхе веб сервери (а говорим о знатном проценту сервера) подразумевано омогућавају глобање (одличан чланак на Википедији, прочитајте: https://es.wikipedia.org/wiki/Glob_(inform%C3%A1tica) .

      То у пракси значи, како је прецизирао мр. Рубен (и у праву је), АКО НЕ БУДЕ ФИЛЕ КОЈИ СЕ ЗОВЕ "индек.пхп" или "индек.хтмл" (или чак једноставно назван "индек"), сервер ће тихо вратити листу датотека и директорија (наравно у облику ХТМЛ странице са информацијама као веб-везом за сваку датотеку). ВЕЋИНА ВЕБ СЕРВЕРА ОМОГУЋАВА ОВОЈ КАРАКТЕРИСТИКУ ДАТОТЕКОМ .хтаццес (строго говорећи Апацхе2) ИЗ РАЗЛОГА БЕЗБЕДНОСТИ.

      Ево свестраности вгета (погледајте његову причу, поново на Википедији, ону коју највише знате: https://es.wikipedia.org/wiki/GNU_Wget ) да анализирамо или „рашчланимо“ такве информације и издвојимо само проширења која захтевамо.

      Сада, ако ово из неког или другог разлога не успе, можемо испробати друге напредне функције вгета, цитирам директно на енглеском:

      Желите да преузмете све ГИФ-ове из директоријума на ХТТП серверу. Покушао си са вгетом http://www.example.com/dir/*.gif’, али то није успело јер ХТТП преузимање не подржава ГЛОББИНГ (ставио сам велика слова). У том случају користите:

      вгет -р -л1 –без родитеља -А.гиф http://www.example.com/dir/

      Опширније, али ефекат је исти. '-р -л1' значи рекурзивно преузимање (погледајте Рекурзивно преузимање), са максималном дубином од 1. '–но-парент' значи да се референце на родитељски директоријум занемарују (погледајте Ограничења заснована на директоријуму) и '-А. гиф 'значи да преузимате само ГИФ датотеке. '-А «* .гиф» би такође функционисао.

      АКО РАДИТЕ ОВАЈ ПОСЛЕДЊИ НАЧИН, вгет ће за нас створити фасциклу са траженом веб адресом у подразумеваној фасцикли у којој радимо и по потреби направиће поддиректоријуме и тамо ће сместити, на пример, .гиф слике које ми захтев.

      --------
      Међутим, ако још увек није могуће добити само одређене врсте датотека (на пример, * .јпг), мораћемо да користимо параметар «–паге-рекуиситес» који преузима све интерне елементе хтмл странице (слике, звукови, цсс итд.), заједно са самом хтмл страницом („–паге-реквизити“ могу бити скраћени „-п“) и то би било еквивалентно преузимању нечега попут „мхтмл“ https://tools.ietf.org/html/rfc2557

      Надам се да су вам ове информације корисне.

      1.    Дамиан Амоедо дијо

        Хвала на белешкама. Салу2.

  2.   Афтербанкс дијо

    Мислим да имате грешку, прва два реда имају исту команду.

  3.   Микрофон дијо

    Пуно вам хвала, врло добар водич!