У следећем чланку ћемо погледати Вгет. Мора се рећи да је ГНУ Вгет а бесплатан алат који омогућава преузимање садржаја са веб сервера на једноставан и брз начин. Његово име потиче од Ворлд Виде Веб (w) и реч гет (на енглеском get (добити)). Ово име значи: добити са ВВВ.
Данас постоје десетине апликација за преузимање датотека врло ефикасно. Већина њих је заснована на веб и десктоп интерфејсима и развијена је за све оперативне системе. Међутим на Гну / Линук (постоји и верзија за Виндовс) постоји моћан менаџер преузимања вгет датотека. Сматра се најмоћнијим програмом за преузимање који постоји. Подржава протоколе као што су хттп, хттпс и фтп.
Преузмите датотеке помоћу вгета
Преузмите датотеку
Најједноставнији начин коришћења овог алата је преузимање указујући на досије Оно што желимо:
wget http://sitioweb.com/programa.tar.gz
Преузмите помоћу различитих протокола
Као добар менаџер преузимања, то је могуће захтева више одједном преузимања. Можемо чак користити различите протоколе у истом редоследу:
wget http://sitioweb.com/programa.tar.gz ftp://otrositio.com/descargas/videos/archivo-video.mpg
Преузми продужењем
Други начин за преузимање вишеструких датотеке које користе исту екстензију, користиће џокер звездицу:
wget<code class="language-bash" data-lang="bash">-r -A.pdf</code>http://sitioweb.com/*.pdf
Ова наредба не ради увек, јер су неки сервери можда блокирани вгет.
Преузмите списак датотека
Ако оно што желимо је да преузмемо датотеке које пронађемо, мораћемо само да их сачувамо УРЛ у датотеци. Направићемо листу под називом филес.ткт а ми ћемо наредби назначити име списка. Потребно ставите само један урл по реду унутар филес.ткт.
Наредба коју ћемо користити за преузимање креиране листе и коју ћемо сачувати у .ткт датотекама биће следећа:
wget -i archivos.txt
Поново покрените преузимање
Ако је из било ког разлога преузимање прекинуто, моћи ћемо наставите преузимање тамо где је стало помоћу опција ц помоћу команде вгет:
wget -i -c archivos.txt
Додајте евиденцију о преузимању
Ако желимо да добијемо дневник о преузимању, да бисмо контролишу било који инцидент на њему ћемо морати да додамо -о опција као што је приказано у следећем:
wget -o reporte.txt http://ejemplo.com/programa.tar.gz
Ограничите пропусност за преузимање
У веома дугим преузимањима можемо ограничити пропусност за преузимање. Овим ћемо спречити да преузимање заузима сав пропусни опсег током трајања преузимања:
wget -o /reporte.log --limit-rate=50k ftp://ftp.centos.org/download/centos5-dvd.iso
Преузмите са корисничким именом и лозинком
Ако желимо да преузмемо са локације на којој је потребно корисничко име / лозинка, мораћемо да користимо само ове опције:
wget --http-user=admin --http-password=12345 http://ejemplo.com/archivo.mp3
Покушаји преузимања
Уобичајено, овај програм чини 20 покушаја успостављања везе и започните преузимање, на врло засићеним сајтовима могуће је да чак и са 20 покушаја то није постигнуто. Са опција т повећава се на више покушаја.
wget -t 50 http://ejemplo.com/pelicula.mpg
Преузмите веб страницу са вгет-ом
Вгет није ограничен само на преузимање датотекаМоћи ћемо да преузмемо целу страницу. Само ћемо морати да напишемо нешто попут:
wget www.ejemplo.com
Преузмите веб локацију и њене додатне елементе
Са опција стр такође ћемо преузети све потребни додатни елементи на страници као што су табеле стилова, уметнуте слике итд.
Ако додамо опција р se ће рекурзивно преузети до 5 нивоа са сајта:
wget -r www.ejemplo.com -o reporte.log
Конвертујте везе у локалне
Везе на веб локацији подразумевано воде до адресе читавог домена. Ако страницу рекурзивно преузмемо, а затим је проучимо ван мреже, можемо користити опција цонверт-линкс то ће их претворити у локалне везе:
wget --convert-links -r http://www.sitio.com/
Набавите потпуну копију странице
Имаћемо могућност да добијемо потпуну копију веб локације. Тхе –Огледала опција је исто што и коришћење опције -р -л инф -Н што указује на рекурзију на бесконачном нивоу и добијање оригиналне временске ознаке сваке преузете датотеке.
wget --mirror http://www.sitio.com/
Трансформ екстензије
Ако преузмете целу веб локацију да бисте је прегледали офлајн, неколико преузетих датотека се можда неће отворити због екстензија као што су .цги, .асп или .пхп. Тада је могуће означити са –Хтмл-опција проширења Све датотеке се претварају у .хтмл екстензију.
wget --mirror --convert-links --html-extension http://www.ejemplo.com
Ово су само опште смернице него што можете учинити са Вгет-ом. Ко жели може да се консултује са онлајн приручник да консултујемо све могућности које нам нуди овај дивни менаџер преузимања.
Што се тиче „Преузимања помоћу екстензије“, престао сам да читам. Не можете преузети оно што не знате. Ако тражени директоријум не дозвољава списак датотека и ако му недостаје индекс (а оба се морају појавити истовремено), оно што кажете не може бити учињено. Какав ниво.
Здраво Рубен, незнање је помало смело.
Оно што коментаришете може се урадити једноставном командом за гоогле:
филетипе:пдф сајт:ubunlogСа.
У овом примеру на овом блогу нема пдф-а, али промените домен на крају на веб који желите и видећете како је лако видети све датотеке неке врсте мреже.
Желим вам пријатан дан.
Али вгет се не повезује са гооглеом да би пронашао пдфс који се налазе у УРЛ-у. Веб директоријум мора бити отворен и мора постојати индексна страница коју генерише мод_аутоиндек или слично, како каже Рубен Царденал.
„Ова команда не функционише увек, јер су неки сервери можда блокирали приступ вгет-у.“
Овај амандман који је стављен на овај чланак, јер се не слажем с њим (иако је технички могуће блокирати одређене веб агенте за захтеве заглавља хттп и вратити поруку 403 „није дозвољено“), и објаснићу зашто:
Сви Апацхе веб сервери (а говорим о знатном проценту сервера) подразумевано омогућавају глобање (одличан чланак на Википедији, прочитајте: https://es.wikipedia.org/wiki/Glob_(inform%C3%A1tica) .
То у пракси значи, како је прецизирао мр. Рубен (и у праву је), АКО НЕ БУДЕ ФИЛЕ КОЈИ СЕ ЗОВЕ "индек.пхп" или "индек.хтмл" (или чак једноставно назван "индек"), сервер ће тихо вратити листу датотека и директорија (наравно у облику ХТМЛ странице са информацијама као веб-везом за сваку датотеку). ВЕЋИНА ВЕБ СЕРВЕРА ОМОГУЋАВА ОВОЈ КАРАКТЕРИСТИКУ ДАТОТЕКОМ .хтаццес (строго говорећи Апацхе2) ИЗ РАЗЛОГА БЕЗБЕДНОСТИ.
Ево свестраности вгета (погледајте његову причу, поново на Википедији, ону коју највише знате: https://es.wikipedia.org/wiki/GNU_Wget ) да анализирамо или „рашчланимо“ такве информације и издвојимо само проширења која захтевамо.
Сада, ако ово из неког или другог разлога не успе, можемо испробати друге напредне функције вгета, цитирам директно на енглеском:
Желите да преузмете све ГИФ-ове из директоријума на ХТТП серверу. Покушао си са вгетом http://www.example.com/dir/*.gif’, али то није успело јер ХТТП преузимање не подржава ГЛОББИНГ (ставио сам велика слова). У том случају користите:
вгет -р -л1 –без родитеља -А.гиф http://www.example.com/dir/
Опширније, али ефекат је исти. '-р -л1' значи рекурзивно преузимање (погледајте Рекурзивно преузимање), са максималном дубином од 1. '–но-парент' значи да се референце на родитељски директоријум занемарују (погледајте Ограничења заснована на директоријуму) и '-А. гиф 'значи да преузимате само ГИФ датотеке. '-А «* .гиф» би такође функционисао.
АКО РАДИТЕ ОВАЈ ПОСЛЕДЊИ НАЧИН, вгет ће за нас створити фасциклу са траженом веб адресом у подразумеваној фасцикли у којој радимо и по потреби направиће поддиректоријуме и тамо ће сместити, на пример, .гиф слике које ми захтев.
--------
Међутим, ако још увек није могуће добити само одређене врсте датотека (на пример, * .јпг), мораћемо да користимо параметар «–паге-рекуиситес» који преузима све интерне елементе хтмл странице (слике, звукови, цсс итд.), заједно са самом хтмл страницом („–паге-реквизити“ могу бити скраћени „-п“) и то би било еквивалентно преузимању нечега попут „мхтмл“ https://tools.ietf.org/html/rfc2557
Надам се да су вам ове информације корисне.
Хвала на белешкама. Салу2.
Мислим да имате грешку, прва два реда имају исту команду.
Пуно вам хвала, врло добар водич!