அடுத்த கட்டுரையில் நாம் Wget ஐப் பார்க்கப் போகிறோம். குனு விஜெட் ஒரு என்று சொல்ல வேண்டும் இலவச கருவி இது வலை சேவையகங்களிலிருந்து உள்ளடக்கத்தைப் பதிவிறக்க அனுமதிக்கிறது எளிய மற்றும் வேகமான வழியில். இதன் பெயர் உலகளாவிய வலை (w) மற்றும் சொல் கிடைக்கும் (ஆங்கிலத்தில்) கிடைக்கும்). இந்த பெயர் இதன் பொருள்: WWW இலிருந்து கிடைக்கும்.
கோப்புகளை மிகவும் திறமையாக பதிவிறக்க இன்று டஜன் கணக்கான பயன்பாடுகள் உள்ளன. அவற்றில் பெரும்பாலானவை வலை மற்றும் டெஸ்க்டாப் இடைமுகங்களை அடிப்படையாகக் கொண்டவை, மேலும் அவை அனைத்து இயக்க முறைமைகளுக்கும் உருவாக்கப்பட்டுள்ளன. இருப்பினும் குனு / லினக்ஸில் (விண்டோஸுக்கான பதிப்பும் உள்ளது) உள்ளது சக்திவாய்ந்த பதிவிறக்க மேலாளர் wget கோப்புகளின். இது இருக்கும் மிக சக்திவாய்ந்த பதிவிறக்கியாக கருதப்படுகிறது. Http, https மற்றும் போன்ற நெறிமுறைகளை ஆதரிக்கிறது FTP.
Wget உடன் கோப்புகளைப் பதிவிறக்கவும்
ஒரு கோப்பைப் பதிவிறக்கவும்
இந்த கருவியைப் பயன்படுத்துவதற்கான எளிய வழி பதிவிறக்கம் கோப்பைக் குறிக்கும் நமக்கு என்ன வேண்டும்:
wget http://sitioweb.com/programa.tar.gz
வெவ்வேறு நெறிமுறைகளைப் பயன்படுத்தி பதிவிறக்கவும்
ஒரு நல்ல பதிவிறக்க மேலாளராக, அது சாத்தியமாகும் ஒரே நேரத்தில் ஒன்றுக்கு மேற்பட்ட பதிவிறக்கங்களைக் கோருங்கள். ஒரே வரிசையில் வெவ்வேறு நெறிமுறைகளைக் கூட நாம் பயன்படுத்தலாம்:
wget http://sitioweb.com/programa.tar.gz ftp://otrositio.com/descargas/videos/archivo-video.mpg
நீட்டிப்பு மூலம் பதிவிறக்கவும்
பல பதிவிறக்க மற்றொரு வழி அதே நீட்டிப்பைப் பயன்படுத்தும் கோப்புகள், இது வைல்டு கார்டு நட்சத்திரத்தைப் பயன்படுத்தும்:
wget<code class="language-bash" data-lang="bash">-r -A.pdf</code>http://sitioweb.com/*.pdf
இந்த கட்டளை எப்போதும் இயங்காது, ஏனெனில் சில சேவையகங்கள் அணுகலைத் தடுத்திருக்கலாம் wget,.
கோப்பு பட்டியலைப் பதிவிறக்கவும்
நாம் கண்டுபிடிக்கும் கோப்புகளை பதிவிறக்கம் செய்ய வேண்டுமென்றால், அவற்றை மட்டுமே சேமிக்க வேண்டும் ஒரு கோப்பில் உள்ள URL. என்ற பட்டியலை உருவாக்குவோம் files.txt கட்டளைக்கு பட்டியலின் பெயரைக் குறிப்பிடுவோம். அவசியம் ஒரு வரிக்கு ஒரு URL மட்டுமே வைக்கவும் files.txt உள்ளே.
உருவாக்கப்பட்ட பட்டியலைப் பதிவிறக்குவதற்கு நாம் பயன்படுத்தும் கட்டளை மற்றும் .txt கோப்புகளில் சேமிப்பது பின்வருமாறு:
wget -i archivos.txt
பதிவிறக்கத்தை மறுதொடக்கம் செய்யுங்கள்
எந்த காரணத்திற்காகவும் பதிவிறக்கம் தடைபட்டிருந்தால், எங்களால் முடியும் பதிவிறக்கம் நிறுத்தப்பட்ட இடத்திலிருந்து தொடரவும் பயன்படுத்தி விருப்பம் c wget கட்டளையுடன்:
wget -i -c archivos.txt
பதிவிறக்கம் பற்றி ஒரு பதிவைச் சேர்க்கவும்
பதிவிறக்கத்தைப் பற்றி ஒரு பதிவைப் பெற விரும்பினால் எந்த சம்பவத்தையும் கட்டுப்படுத்தவும் அதில், நாம் சேர்க்க வேண்டும் -o விருப்பம் இது பின்வருவனவற்றில் காட்டப்பட்டுள்ளபடி:
wget -o reporte.txt http://ejemplo.com/programa.tar.gz
பதிவிறக்க அலைவரிசையை வரம்பிடவும்
மிக நீண்ட பதிவிறக்கங்களில் நம்மால் முடியும் பதிவிறக்க அலைவரிசையை வரம்பிடவும். இதன் மூலம் பதிவிறக்கத்தின் அனைத்து அலைவரிசைகளையும் பதிவிறக்கம் செய்வதைத் தடுப்போம்:
wget -o /reporte.log --limit-rate=50k ftp://ftp.centos.org/download/centos5-dvd.iso
பயனர்பெயர் மற்றும் கடவுச்சொல் மூலம் பதிவிறக்கவும்
பயனர்பெயர் / கடவுச்சொல் தேவைப்படும் தளத்திலிருந்து பதிவிறக்கம் செய்ய விரும்பினால், இந்த விருப்பங்களை மட்டுமே நாங்கள் பயன்படுத்த வேண்டும்:
wget --http-user=admin --http-password=12345 http://ejemplo.com/archivo.mp3
பதிவிறக்க முயற்சிகள்
இயல்புநிலை, இந்த நிரல் இணைப்பை நிறுவ 20 முயற்சிகளை செய்கிறது பதிவிறக்கத்தைத் தொடங்குங்கள், மிகவும் நிறைவுற்ற தளங்களில் 20 முயற்சிகள் கூட அதை அடைய முடியவில்லை. உடன் விருப்பம் டி அதிக முயற்சிகளுக்கு அதிகரிக்கிறது.
wget -t 50 http://ejemplo.com/pelicula.mpg
Wget உடன் ஒரு வலைத்தளத்தைப் பதிவிறக்கவும்
Wget என்பது கோப்பு பதிவிறக்கங்களுக்கு மட்டுமல்லநாங்கள் ஒரு முழு பக்கத்தைப் பதிவிறக்க முடியும். நாம் இதைப் போன்ற ஒன்றை எழுத வேண்டும்:
wget www.ejemplo.com
ஒரு வலைத்தளத்தையும் அதன் கூடுதல் கூறுகளையும் பதிவிறக்கவும்
உடன் விருப்பம் ப நாங்கள் அனைத்தையும் பதிவிறக்குவோம் பக்கத்தில் கூடுதல் கூறுகள் தேவை நடை தாள்கள், இன்லைன் படங்கள் போன்றவை.
நாம் சேர்த்தால் விருப்பம் ஆர் se 5 நிலைகள் வரை மீண்டும் மீண்டும் பதிவிறக்கும் தளத்திலிருந்து:
wget -r www.ejemplo.com -o reporte.log
இணைப்புகளை உள்ளூர் மாற்றவும்
இயல்பாக, தளத்திலுள்ள இணைப்புகள் முழு களத்தின் முகவரியையும் சுட்டிக்காட்டுகின்றன. நாங்கள் தளத்தை மீண்டும் மீண்டும் பதிவிறக்கம் செய்து அதை ஆஃப்லைனில் படித்தால், நாம் பயன்படுத்தலாம் மாற்ற-இணைப்புகள் விருப்பம் அது அவர்களை மாற்றும் உள்ளூர் இணைப்புகள்:
wget --convert-links -r http://www.sitio.com/
தளத்தின் முழு நகலைப் பெறுங்கள்
ஒரு தளத்தின் முழுமையான நகலைப் பெறுவதற்கான வாய்ப்பு எங்களுக்கு இருக்கும். தி –மிரர் விருப்பம் பயன்படுத்துவதற்கு சமம் விருப்பங்கள் -r -l inf -N இது எல்லையற்ற மட்டத்தில் மறுநிகழ்வு மற்றும் பதிவிறக்கம் செய்யப்பட்ட ஒவ்வொரு கோப்பின் அசல் நேர முத்திரையைப் பெறுவதைக் குறிக்கிறது.
wget --mirror http://www.sitio.com/
நீட்டிப்புகளை மாற்றவும்
முழு தளத்தையும் ஆஃப்லைனில் காண நீங்கள் பதிவிறக்கம் செய்தால், .cgi, .asp அல்லது .php போன்ற நீட்டிப்புகள் காரணமாக பதிவிறக்கம் செய்யப்பட்ட பல கோப்புகள் திறக்கப்படாது. பின்னர் குறிக்க முடியும் –Html- நீட்டிப்பு விருப்பம் எல்லா கோப்புகளும் .html நீட்டிப்புக்கு மாற்றப்படுகின்றன.
wget --mirror --convert-links --html-extension http://www.ejemplo.com
இவை பொதுவான வழிகாட்டுதல்கள் மட்டுமே நீங்கள் Wget உடன் செய்யக்கூடியதை விட. யார் விரும்புகிறார்கள் ஆன்லைன் கையேடு இந்த அற்புதமான பதிவிறக்க மேலாளர் எங்களுக்கு வழங்கும் அனைத்து சாத்தியங்களையும் கலந்தாலோசிக்க.
"நீட்டிப்பு மூலம் பதிவிறக்கு" என்பதைப் பொறுத்தவரை நான் படிப்பதை நிறுத்திவிட்டேன். உங்களுக்குத் தெரியாததை நீங்கள் பதிவிறக்க முடியாது. கோரப்பட்ட கோப்பகம் கோப்புகளின் பட்டியலை அனுமதிக்காது மற்றும் ஒரு குறியீட்டைக் கொண்டிருக்கவில்லை என்றால் (இரண்டும் ஒரே நேரத்தில் நிகழ வேண்டும்), நீங்கள் சொல்வதைச் செய்ய முடியாது. என்ன ஒரு நிலை.
வணக்கம் ரூபன், அறியாமை கொஞ்சம் தைரியம்.
நீங்கள் கருத்து தெரிவிப்பது Google க்கு ஒரு எளிய கட்டளையுடன் செய்யப்படலாம்:
filetype:pdf தளம்:ubunlogகாம்
இந்த எடுத்துக்காட்டில் இந்த வலைப்பதிவில் பி.டி.எஃப் இல்லை, ஆனால் நீங்கள் விரும்பும் வலையில் டொமைனை மாற்றவும், ஒரு வகை வலையின் அனைத்து கோப்புகளையும் பார்ப்பது எவ்வளவு எளிது என்பதை நீங்கள் காண்பீர்கள்.
ஒரு நல்ல நாள்.
ஆனால் ஒரு URL இல் உள்ள pdf களைக் கண்டுபிடிக்க wget google உடன் இணைக்கப்படவில்லை. வலை அடைவு திறந்திருக்க வேண்டும் மற்றும் ரூபன் கார்டனல் சொல்வது போல் mod_autoindex அல்லது அதற்கு ஒத்த ஒரு குறியீட்டு பக்கம் இருக்க வேண்டும்.
"இந்த கட்டளை எப்போதும் இயங்காது, ஏனெனில் சில சேவையகங்கள் wget க்கான அணுகலைத் தடுத்திருக்கலாம்."
இந்த கட்டுரையில் வைக்கப்பட்டுள்ள இந்த திருத்தம், ஏனெனில் நான் இதை ஏற்கவில்லை (தொழில்நுட்ப ரீதியாக சில வலை முகவர்களை http தலைப்பு கோரிக்கைகளுக்கு தடுத்து 403 "அனுமதிக்கப்படாத" செய்தியை திருப்பி அனுப்ப முடியும்) மற்றும் அதற்கான காரணத்தை நான் விளக்குகிறேன்:
எல்லா அப்பாச்சி வலை சேவையகங்களும் (நான் கணிசமான சதவீத சேவையகங்களைப் பற்றி பேசுகிறேன்) இயல்பாகவே குளோபிங்கை அனுமதிக்கின்றன (சிறந்த விக்கிபீடியா கட்டுரை, படிக்க: https://es.wikipedia.org/wiki/Glob_(inform%C3%A1tica) .
இது நடைமுறையில், திரு. ரூபன் (மற்றும் அவர் சொல்வது சரிதான்), "File" என்று அழைக்கப்படாவிட்டால் "index.php" அல்லது "index.html" (அல்லது "index" என்று கூட அழைக்கப்படுகிறது) சேவையகம் அமைதியாக கோப்புகள் மற்றும் கோப்பகங்களின் பட்டியலைத் தரும் (நிச்சயமாக வடிவத்தில்) ஒவ்வொரு கோப்பிற்கும் ஒரு வலை இணைப்பாக தகவலுடன் ஒரு HTML பக்கத்தின்). பாதுகாப்பு காரணங்களுக்காக .Htacces FILE (கண்டிப்பாக அப்பாச்சி 2) மூலம் இந்த அம்சத்தை மிகவும் வலை சேவையகங்கள் முடக்குகின்றன.
Wget இன் பல்துறை இங்கே (அதன் கதையைப் பாருங்கள், மீண்டும் விக்கிபீடியாவில், உங்களுக்கு மிகவும் தெரிந்த ஒன்று: https://es.wikipedia.org/wiki/GNU_Wget ) அத்தகைய தகவல்களை பகுப்பாய்வு செய்ய அல்லது "பாகுபடுத்தி" மற்றும் நாங்கள் கோரும் நீட்டிப்புகளை மட்டுமே பிரித்தெடுக்கவும்.
இப்போது, இது செயல்படாத நிலையில், ஒரு காரணத்திற்காக அல்லது இன்னொரு காரணத்திற்காக, பிற மேம்பட்ட விஜெட் செயல்பாடுகளை நாம் முயற்சி செய்யலாம், நான் நேரடியாக ஆங்கிலத்தில் மேற்கோள் காட்டுகிறேன்:
HTTP சேவையகத்தில் உள்ள ஒரு கோப்பகத்திலிருந்து அனைத்து GIF களையும் பதிவிறக்க விரும்புகிறீர்கள். நீங்கள் முயற்சித்தீர்கள் http://www.example.com/dir/*.gif’, ஆனால் அது வேலை செய்யவில்லை, ஏனெனில் HTTP மீட்டெடுப்பு GLOBBING ஐ ஆதரிக்காது (நான் பெரிய எழுத்துக்களை வைத்தேன்). அந்த வழக்கில், பயன்படுத்தவும்:
wget -r -l1 –no- பெற்றோர் -A.gif http://www.example.com/dir/
மேலும் சொற்பொழிவு, ஆனால் விளைவு ஒன்றே. '-r -l1' என்பது அதிகபட்ச ஆழத்துடன் 1 ஐ மீண்டும் மீண்டும் பெறுவது (சுழல்நிலை பதிவிறக்கத்தைப் பார்க்கவும்). gif 'என்றால் GIF கோப்புகளை மட்டுமே பதிவிறக்குவது. '-A «* .gif»' கூட வேலை செய்திருக்கும்.
இந்த கடைசி வழியில் நீங்கள் இயங்கினால், நாங்கள் பணிபுரியும் இயல்புநிலை கோப்புறையில் கோரப்பட்ட வலை முகவரியுடன் ஒரு கோப்புறையை உருவாக்கும், மேலும் அது தேவைப்பட்டால் அது துணை அடைவுகளை உருவாக்கும், அது அங்கு வைக்கும், எடுத்துக்காட்டாக, நாம் .gif படங்கள் கோரிக்கை.
--------
எப்படியிருந்தாலும் சில வகையான கோப்புகளை மட்டுமே பெற முடியாவிட்டால் (* .jpg, எடுத்துக்காட்டாக) ஒரு HTML பக்கத்தின் அனைத்து உள் கூறுகளையும் பதிவிறக்கும் (படங்கள், ஒலிகள், css, போன்றவை) HTML பக்கத்துடன் சேர்ந்து ("-பக்கம்-தேவைகள்" "-p" என்று சுருக்கமாகக் கூறலாம்) மேலும் இது "mhtml" போன்ற ஒன்றைப் பதிவிறக்குவதற்கு சமமாக இருக்கும். https://tools.ietf.org/html/rfc2557
இந்த தகவல் உங்களுக்கு பயனுள்ளதாக இருக்கும் என்று நம்புகிறேன்.
குறிப்புகளுக்கு நன்றி. சலு 2.
உங்களிடம் பிழை இருப்பதாக நான் நினைக்கிறேன், முதல் இரண்டு வரிகளுக்கு ஒரே கட்டளை உள்ளது.
மிக்க நன்றி, மிகச் சிறந்த பயிற்சி!