Maqaalka soo socda waxaan ku eegeynaa Wget. Waa in la dhaho GNU Wget waa a qalab bilaash ah taas oo u oggolaanaysa in laga soo dejiyo waxyaabaha ka soo baxa shabakadaha internetka hab fudud oo dhakhso leh. Magaceedu wuxuu ka yimid World Wide Web (w) iyo erayga get (oo af-ingiriisi ah heli). Magacaani wuxuu ula jeedaa: ka hel WWW.
Maanta waxaa jira daraasiin codsiyo ah si aad si hufan ugu soo dejiso faylasha. Intooda badani waxay ku saleysan yihiin websaydhka iyo iskudhafyada desktop, waxaana loo horumariyaa dhammaan nidaamyada hawlgalka. Si kastaba ha noqotee Gnu / Linux (sidoo kale waxaa jira nooc loogu talagalay Windows) waxaa jira maamule soo dejin awood leh ee faylasha wget. Waxaa loo tixgeliyaa soo dejiyaha ugu awoodda badan ee jira. Waxay taageertaa hab maamuuska sida http, https iyo ftp.
Ku soo dejiso faylasha wget
Soo dejiso feyl
Habka ugu fudud ee loo adeegsado qalabkan waa soo dejinta muujinaya faylka Waxa aan rabno:
wget http://sitioweb.com/programa.tar.gz
Soo dejiso adoo adeegsanaya maamuusyo kala duwan
Maadaama aad tahay maamule soo dejin wanaagsan, waa suurtagal codso in kabadan hal soo dejin markiiba. Xitaa waxaan u adeegsan karnaa maamuusyo kala duwan isla nidaamka:
wget http://sitioweb.com/programa.tar.gz ftp://otrositio.com/descargas/videos/archivo-video.mpg
Ku soo dejiso kordhin
Hab kale oo lagu soo dejiyo dhowr faylasha isticmaala isla kordhinta, waxay adeegsan doontaa xiddigta calaamadda:
wget<code class="language-bash" data-lang="bash">-r -A.pdf</code>http://sitioweb.com/*.pdf
Amarkani had iyo jeer ma shaqeeyo, maaddaama qaar ka mid ah server-yada laga yaabo inay xannibeen gelitaanka wget.
Soo dejiso liistada faylka
Haddii waxa aan dooneyno ay tahay inaan kala soo baxno feylasha aan raadineyno, waxaan kaliya ku qasbanaaneynaa inaan keydinno URL fayl ku jira. Waxaan abuuri doonnaa liis la yiraahdo faylasha.txt oo waxaan ku tusi doonnaa magaca liiska amarka. Waa lagama maarmaan dhig hal url halkii saf gudaha faylasha.txt.
Amarka aan u isticmaali doonno inaan ku soo dejino liiska la abuuray oo aan ku keydinno faylasha .txt waxay noqon doonaan kuwa soo socda:
wget -i archivos.txt
Dib u soo dejiso
Haddii sabab kasta ha noqotee soo dejinta la joojiyay, waan awoodnaa sii wad soo dejinta halkii ay ka tagtay isticmaalaya xulasho c oo leh amarka wget:
wget -i -c archivos.txt
Kudar log ku saabsan soo dejinta
Haddii aan rabno inaan helno log ku saabsan soo dejinta, si xakamee dhacdo kasta dushiisa, waa inaan ku darnaa -o ikhtiyaar sida ku cad soo socda:
wget -o reporte.txt http://ejemplo.com/programa.tar.gz
Xaddid xadka ballaadhinta
Soo degsasho aad u dheer ayaan kari karnaa xaddid bandwidth soo dejinta. Tan waxaan uga hortageynaa soo degsashada inay qaadato dhammaan baaxadda ballaadhsiga muddada soo dejinta:
wget -o /reporte.log --limit-rate=50k ftp://ftp.centos.org/download/centos5-dvd.iso
Ku soo dejiso magaca isticmaalaha iyo lambarka sirta ah
Haddii aan dooneyno inaan ka soo dejisanno barta loo baahan yahay username / lambarka sirta ah, waxaan u baahan doonnaa oo keliya xulashooyinkaan:
wget --http-user=admin --http-password=12345 http://ejemplo.com/archivo.mp3
Soo dejiso isku dayga
Ugu talagal, barnaamijkani wuxuu sameeyaa 20 isku day si loo dhiso xiriirinta oo bilaw soo dejinta, boggag aad u cufan waxaa macquul ah in xitaa 20 isku day aan lagu guuleysan. Iyada oo ay xulasho t kordhiyaa iskuday badan.
wget -t 50 http://ejemplo.com/pelicula.mpg
Ku soo dejiso degel wget
Wget kuma koobna kaliya soo dejinta faylashaWaxaan awoodi doonnaa inaan soo dejino bog buuxa. Waxaan kaliya u baahanahay inaan qoro wax sida:
wget www.ejemplo.com
Soo dejiso degel iyo walxihiisa dheeriga ah
Iyada oo leh xulashada p waxaan sidoo kale soo dejineynaa dhamaan walxaha dheeraadka ah ee looga baahan yahay bogga sida go'yaasha qaabka, sawirrada safka ah, iwm.
Haddaan ku darno ikhtiyaar r se soo celin doonaa ilaa 5 heer ka socota goobta:
wget -r www.ejemplo.com -o reporte.log
U beddelo xiriiriyeyaasha degaanka
Sida caadiga ah, xiriiriyeyaasha ku jira barta ayaa tilmaamaya cinwaanka dhammaan bogga. Haddii aan soo dejino bogga si isdaba-joog ah ka dibna aan ku baranno qadka, waxaan isticmaali karnaa ikhtiyaarka beddelaad-xiriiriye taasi waxay u rogi doontaa iyaga xiriiriyeyaasha deegaanka:
wget --convert-links -r http://www.sitio.com/
Hel nuqul buuxa oo goobta ah
Waxaan fursad u heli doonnaa inaan helno nuqul dhammaystiran oo degel ah. The - ikhtiyaar cabsi leh waxay la mid tahay isticmaalka xulashooyinka -r -l inf -N taas oo muujinaysa dib u noqosho heer aan dhammaanayn iyo helitaanka shaxdii asalka ahayd ee feyl kasta oo la soo dejiyey.
wget --mirror http://www.sitio.com/
Beddel kordhinta
Haddii aad soo dejiso bogga oo dhan si aad uga daawatid khadka tooska ah, dhowr faylal ah oo la soo dejiyey ayaa laga yaabaa inaanay furin, sababtoo ah kordhinta sida .cgi, .asp, ama .php. Markaa waa suurtagal in lala tilmaamo kan - xulashada kordhinta-html Faylasha oo dhan waxaa loo rogay kordhin .html.
wget --mirror --convert-links --html-extension http://www.ejemplo.com
Kuwani waa tilmaamaha guud intaad ka qaban karto Wget. Kii raba ayaa la tashan kara buugga tooska ah si aad ula tashato dhammaan fursadaha uu maamulehaan soo dejinta cajiibka ahi na siiyo.
Sida loogu talagalay "Download by kordhin" Waxaan joojiyay akhriska. Ma soo dejisan kartid wixii aadan aqoon. Ilaa diiwaanka la codsaday mooyaane aan u oggolaanayn liistada faylasha oo aan lahayn tixraac (oo labaduba waa inay isku mar dhacaan), waxaad dhahdo lama qaban karo. Maxaa heer ah.
Hello Rubén, jahligu waa xoogaa geesinimo.
Waxa aad ka faallooto waxaa lagu sameyn karaa amar fudud oo google ah:
filetype:pdf site:ubunlog.com
Tusaalahan ma jiraan wax pdf ah oo ku jira boggan, laakiin u beddelo cinwaanka dhammaadka bogga aad doorbidayso waxaadna arki doontaa sida ay u fududahay in la arko dhammaan faylasha nooc ka mid ah websaydh.
Maalin wanaagsan.
Laakiin wget kuma xirna google si loo helo pdfs-ka url. Diiwaanka websaydhku waa inuu furnaadaa oo waa inuu jiraa bogga tusmada ee ay soo saareen mod_autoindex ama wax la mid ah, sida uu leeyahay Rubén Cardenal.
"Amarkani had iyo jeer ma shaqeeyo, maaddaama qaar ka mid ah server-yada laga yaabo inay xannibeen helitaanka wget."
Wax ka beddelkaan lagu saaray qodobkan, maxaa yeelay kuma raacsani (in kasta oo farsamo ahaan ay suurtagal tahay in laga horjoogsado wakiillada websaydhada qaar codsiyada cinwaanka cinwaanka oo aan soo celiyo farriin 403 "aan la oggolayn") waana sharxi doonaa sababta:
Dhammaan server-yada websaydhka 'Apache' (waxaanan ka hadlayaa boqolkiiba tiro aad u tiro badan oo ka mid ah server-yada) marka ugu horreysa ee loo oggolaado dunnida (maqaalka Wikipedia ee wanaagsan, akhri: https://es.wikipedia.org/wiki/Glob_(inform%C3%A1tica) .
Tan ficil ahaan macnaheedu waa, sida ku cad mr. Rubén (oo isagu wuu saxan yahay), HADDII AAN JIRIN FAYL LOO WACO "index.php" ama "index.html" (ama xitaa si fudud loogu yeero "index") adeegaha ayaa si aamusnaan leh u soo celin doona liiska faylasha iyo tilmaamaha (dabcan qaab ahaan bogga html oo leh macluumaadka oo ah isku xirka webka ee fayl kasta). ADEEGAYAASHA INTA BADAN AYAA NADIIFINAYA MUUQAALKAAN MARKII .htacces FILE (si adag uhadlaya Apache2) SABABAHA AMNIGA.
Halkan waxaa ku yaal farqiga u dhexeeya wget (eeg sheekadiisa, mar labaad Wikipedia, kan aad inta badan u taqaanno: https://es.wikipedia.org/wiki/GNU_Wget ) si loo falanqeeyo ama loo "gorfeeyo" macluumaadka la yiri loona soo saaro oo keliya kordhinta aan codsanno.
Hadda, haddii ay dhacdo in tani aysan shaqeynin, hal sabab ama mid kale, waxaan isku dayi karnaa shaqooyinka kale ee wget ee horumarsan, waxaan si toos ah ugu soo qaatay Ingiriisiga:
Waxaad dooneysaa inaad ka soo degsato dhamaan GIF-yada galka ku jira server HTTP. Waxaad isku dayday 'wget http://www.example.com/dir/*.gif’, laakiin taasi ma shaqeyn maxaa yeelay dib-u-helidda HTTP ma taageerto GLOBBING (Waxaan dhigay xarfaha waaweyn). Xaaladdaas, isticmaal:
wget -r -l1 – waalid-la’aan -A.gif http://www.example.com/dir/
Hadal badan, laakiin saameyntu waa isku mid. '-r -l1' waxaa loola jeedaa dib u soo noqosho soo noqnoqosho leh (eeg Soo-celinta Soo-noqnoqoshada), oo qoto dheerkeeda ugu sarreysa 1. '- waalid-la'aan' macnaheedu waa tixraacyada tixraaca waalidka waa la iska indhatiray (eeg Xaddiyadaha Ku-saleysan Diiwaanka), iyo '-A. gif 'macnaheedu waa inaad soo dejiso kaliya faylasha GIF. '-A «* .gif»' sidoo kale wuu shaqeyn lahaa
HADDII AAD KA CARSATO JIDKA UGU DANBEEYAY wget wuxuu noo abuuri doonaa galka cinwaanka websaydhka la codsaday ee galka ku jira halka aan ka shaqeyneyno, wuxuuna sameyn doonaa hoosaadyo haddii loo baahdo halkaasna waa la dhigi doonaa, tusaale ahaan .gif sawirrada aan codsi
--------
SIDEE AYAY U DHACDAA HADDII AANAY weli suurtagal ahayn in la helo oo keliya noocyada faylasha ah (* .jpg, tusaale ahaan) waa inaan isticmaalnaa cabirka «–page-requisites» kaas oo soo dejista dhamaan waxyaabaha gudaha ee bogga html (sawirada, dhawaaqyada, css, iwm) oo ay weheliso bogga html laftiisa ("–page-requisites" ayaa loo soo gaabin karaa "-p") taasina waxay u dhigantaa soo degsashada wax u eg "mhtml" https://tools.ietf.org/html/rfc2557
Waxaan rajeynayaa in macluumaadkani faa iido kuu yahay.
Waad ku mahadsantahay qoraalada. Salu2.
Waxaan u maleynayaa inaad qalad leedahay, labada sadar ee hore waxay leeyihiin isku amar.
Aad baad u mahadsantahay, cashar aad ufiican!