Wget, இந்த கருவி மூலம் என்ன செய்ய முடியும் என்பதற்கான சில எடுத்துக்காட்டுகள்

பற்றி wget

அடுத்த கட்டுரையில் நாம் Wget ஐப் பார்க்கப் போகிறோம். குனு விஜெட் ஒரு என்று சொல்ல வேண்டும் இலவச கருவி இது வலை சேவையகங்களிலிருந்து உள்ளடக்கத்தைப் பதிவிறக்க அனுமதிக்கிறது எளிய மற்றும் வேகமான வழியில். இதன் பெயர் உலகளாவிய வலை (w) மற்றும் சொல் கிடைக்கும் (ஆங்கிலத்தில்) கிடைக்கும்). இந்த பெயர் இதன் பொருள்: WWW இலிருந்து கிடைக்கும்.

கோப்புகளை மிகவும் திறமையாக பதிவிறக்க இன்று டஜன் கணக்கான பயன்பாடுகள் உள்ளன. அவற்றில் பெரும்பாலானவை வலை மற்றும் டெஸ்க்டாப் இடைமுகங்களை அடிப்படையாகக் கொண்டவை, மேலும் அவை அனைத்து இயக்க முறைமைகளுக்கும் உருவாக்கப்பட்டுள்ளன. இருப்பினும் குனு / லினக்ஸில் (விண்டோஸுக்கான பதிப்பும் உள்ளது) உள்ளது சக்திவாய்ந்த பதிவிறக்க மேலாளர் wget கோப்புகளின். இது இருக்கும் மிக சக்திவாய்ந்த பதிவிறக்கியாக கருதப்படுகிறது. Http, https மற்றும் போன்ற நெறிமுறைகளை ஆதரிக்கிறது FTP.

Wget உடன் கோப்புகளைப் பதிவிறக்கவும்

ஒரு கோப்பைப் பதிவிறக்கவும்

இந்த கருவியைப் பயன்படுத்துவதற்கான எளிய வழி பதிவிறக்கம் கோப்பைக் குறிக்கும் நமக்கு என்ன வேண்டும்:

wget http://sitioweb.com/programa.tar.gz

வெவ்வேறு நெறிமுறைகளைப் பயன்படுத்தி பதிவிறக்கவும்

ஒரு நல்ல பதிவிறக்க மேலாளராக, அது சாத்தியமாகும் ஒரே நேரத்தில் ஒன்றுக்கு மேற்பட்ட பதிவிறக்கங்களைக் கோருங்கள். ஒரே வரிசையில் வெவ்வேறு நெறிமுறைகளைக் கூட நாம் பயன்படுத்தலாம்:

wget http://sitioweb.com/programa.tar.gz ftp://otrositio.com/descargas/videos/archivo-video.mpg

நீட்டிப்பு மூலம் பதிவிறக்கவும்

பல பதிவிறக்க மற்றொரு வழி அதே நீட்டிப்பைப் பயன்படுத்தும் கோப்புகள், இது வைல்டு கார்டு நட்சத்திரத்தைப் பயன்படுத்தும்:

wget<code class="language-bash" data-lang="bash">-r -A.pdf</code>http://sitioweb.com/*.pdf

இந்த கட்டளை எப்போதும் இயங்காது, ஏனெனில் சில சேவையகங்கள் அணுகலைத் தடுத்திருக்கலாம் wget,.

கோப்பு பட்டியலைப் பதிவிறக்கவும்

நாம் கண்டுபிடிக்கும் கோப்புகளை பதிவிறக்கம் செய்ய வேண்டுமென்றால், அவற்றை மட்டுமே சேமிக்க வேண்டும் ஒரு கோப்பில் உள்ள URL. என்ற பட்டியலை உருவாக்குவோம் files.txt கட்டளைக்கு பட்டியலின் பெயரைக் குறிப்பிடுவோம். அவசியம் ஒரு வரிக்கு ஒரு URL மட்டுமே வைக்கவும் files.txt உள்ளே.

உருவாக்கப்பட்ட பட்டியலைப் பதிவிறக்குவதற்கு நாம் பயன்படுத்தும் கட்டளை மற்றும் .txt கோப்புகளில் சேமிப்பது பின்வருமாறு:

wget -i archivos.txt

பதிவிறக்கத்தை மறுதொடக்கம் செய்யுங்கள்

எந்த காரணத்திற்காகவும் பதிவிறக்கம் தடைபட்டிருந்தால், எங்களால் முடியும் பதிவிறக்கம் நிறுத்தப்பட்ட இடத்திலிருந்து தொடரவும் பயன்படுத்தி விருப்பம் c wget கட்டளையுடன்:

wget -i -c archivos.txt

பதிவிறக்கம் பற்றி ஒரு பதிவைச் சேர்க்கவும்

பதிவிறக்கத்தைப் பற்றி ஒரு பதிவைப் பெற விரும்பினால் எந்த சம்பவத்தையும் கட்டுப்படுத்தவும் அதில், நாம் சேர்க்க வேண்டும் -o விருப்பம் இது பின்வருவனவற்றில் காட்டப்பட்டுள்ளபடி:

wget -o reporte.txt http://ejemplo.com/programa.tar.gz

பதிவிறக்க அலைவரிசையை வரம்பிடவும்

மிக நீண்ட பதிவிறக்கங்களில் நம்மால் முடியும் பதிவிறக்க அலைவரிசையை வரம்பிடவும். இதன் மூலம் பதிவிறக்கத்தின் அனைத்து அலைவரிசைகளையும் பதிவிறக்கம் செய்வதைத் தடுப்போம்:

wget -o /reporte.log --limit-rate=50k ftp://ftp.centos.org/download/centos5-dvd.iso

பயனர்பெயர் மற்றும் கடவுச்சொல் மூலம் பதிவிறக்கவும்

பயனர்பெயர் / கடவுச்சொல் தேவைப்படும் தளத்திலிருந்து பதிவிறக்கம் செய்ய விரும்பினால், இந்த விருப்பங்களை மட்டுமே நாங்கள் பயன்படுத்த வேண்டும்:

wget --http-user=admin --http-password=12345 http://ejemplo.com/archivo.mp3

பதிவிறக்க முயற்சிகள்

இயல்புநிலை, இந்த நிரல் இணைப்பை நிறுவ 20 முயற்சிகளை செய்கிறது பதிவிறக்கத்தைத் தொடங்குங்கள், மிகவும் நிறைவுற்ற தளங்களில் 20 முயற்சிகள் கூட அதை அடைய முடியவில்லை. உடன் விருப்பம் டி அதிக முயற்சிகளுக்கு அதிகரிக்கிறது.

wget -t 50 http://ejemplo.com/pelicula.mpg

Wget உடன் ஒரு வலைத்தளத்தைப் பதிவிறக்கவும்

Wget man உதவி

Wget man உதவி

Wget என்பது கோப்பு பதிவிறக்கங்களுக்கு மட்டுமல்லநாங்கள் ஒரு முழு பக்கத்தைப் பதிவிறக்க முடியும். நாம் இதைப் போன்ற ஒன்றை எழுத வேண்டும்:

wget www.ejemplo.com

ஒரு வலைத்தளத்தையும் அதன் கூடுதல் கூறுகளையும் பதிவிறக்கவும்

உடன் விருப்பம் ப நாங்கள் அனைத்தையும் பதிவிறக்குவோம் பக்கத்தில் கூடுதல் கூறுகள் தேவை நடை தாள்கள், இன்லைன் படங்கள் போன்றவை.

நாம் சேர்த்தால் விருப்பம் ஆர் se 5 நிலைகள் வரை மீண்டும் மீண்டும் பதிவிறக்கும் தளத்திலிருந்து:

wget -r www.ejemplo.com -o reporte.log

இணைப்புகளை உள்ளூர் மாற்றவும்

இயல்பாக, தளத்திலுள்ள இணைப்புகள் முழு களத்தின் முகவரியையும் சுட்டிக்காட்டுகின்றன. நாங்கள் தளத்தை மீண்டும் மீண்டும் பதிவிறக்கம் செய்து அதை ஆஃப்லைனில் படித்தால், நாம் பயன்படுத்தலாம் மாற்ற-இணைப்புகள் விருப்பம் அது அவர்களை மாற்றும் உள்ளூர் இணைப்புகள்:

wget --convert-links -r http://www.sitio.com/

தளத்தின் முழு நகலைப் பெறுங்கள்

ஒரு தளத்தின் முழுமையான நகலைப் பெறுவதற்கான வாய்ப்பு எங்களுக்கு இருக்கும். தி –மிரர் விருப்பம் பயன்படுத்துவதற்கு சமம் விருப்பங்கள் -r -l inf -N இது எல்லையற்ற மட்டத்தில் மறுநிகழ்வு மற்றும் பதிவிறக்கம் செய்யப்பட்ட ஒவ்வொரு கோப்பின் அசல் நேர முத்திரையைப் பெறுவதைக் குறிக்கிறது.

wget --mirror http://www.sitio.com/

நீட்டிப்புகளை மாற்றவும்

முழு தளத்தையும் ஆஃப்லைனில் காண நீங்கள் பதிவிறக்கம் செய்தால், .cgi, .asp அல்லது .php போன்ற நீட்டிப்புகள் காரணமாக பதிவிறக்கம் செய்யப்பட்ட பல கோப்புகள் திறக்கப்படாது. பின்னர் குறிக்க முடியும் –Html- நீட்டிப்பு விருப்பம் எல்லா கோப்புகளும் .html நீட்டிப்புக்கு மாற்றப்படுகின்றன.

wget --mirror --convert-links --html-extension http://www.ejemplo.com

இவை பொதுவான வழிகாட்டுதல்கள் மட்டுமே நீங்கள் Wget உடன் செய்யக்கூடியதை விட. யார் விரும்புகிறார்கள் ஆன்லைன் கையேடு இந்த அற்புதமான பதிவிறக்க மேலாளர் எங்களுக்கு வழங்கும் அனைத்து சாத்தியங்களையும் கலந்தாலோசிக்க.


உங்கள் கருத்தை தெரிவிக்கவும்

உங்கள் மின்னஞ்சல் முகவரி வெளியிடப்பட்ட முடியாது. தேவையான புலங்கள் குறிக்கப்பட்டிருக்கும் *

*

*

  1. தரவுக்கு பொறுப்பு: மிகுவல் ஏஞ்சல் கேடன்
  2. தரவின் நோக்கம்: கட்டுப்பாட்டு ஸ்பேம், கருத்து மேலாண்மை.
  3. சட்டபூர்வமாக்கல்: உங்கள் ஒப்புதல்
  4. தரவின் தொடர்பு: சட்டபூர்வமான கடமையால் தவிர மூன்றாம் தரப்பினருக்கு தரவு தெரிவிக்கப்படாது.
  5. தரவு சேமிப்பு: ஆக்சென்டஸ் நெட்வொர்க்குகள் (EU) வழங்கிய தரவுத்தளம்
  6. உரிமைகள்: எந்த நேரத்திலும் உங்கள் தகவல்களை நீங்கள் கட்டுப்படுத்தலாம், மீட்டெடுக்கலாம் மற்றும் நீக்கலாம்.

  1.   ரூபன் கார்டனல் அவர் கூறினார்

    "நீட்டிப்பு மூலம் பதிவிறக்கு" என்பதைப் பொறுத்தவரை நான் படிப்பதை நிறுத்திவிட்டேன். உங்களுக்குத் தெரியாததை நீங்கள் பதிவிறக்க முடியாது. கோரப்பட்ட கோப்பகம் கோப்புகளின் பட்டியலை அனுமதிக்காது மற்றும் ஒரு குறியீட்டைக் கொண்டிருக்கவில்லை என்றால் (இரண்டும் ஒரே நேரத்தில் நிகழ வேண்டும்), நீங்கள் சொல்வதைச் செய்ய முடியாது. என்ன ஒரு நிலை.

    1.    தகவல்அனோனிமோ அவர் கூறினார்

      வணக்கம் ரூபன், அறியாமை கொஞ்சம் தைரியம்.
      நீங்கள் கருத்து தெரிவிப்பது Google க்கு ஒரு எளிய கட்டளையுடன் செய்யப்படலாம்:
      filetype:pdf தளம்:ubunlogகாம்
      இந்த எடுத்துக்காட்டில் இந்த வலைப்பதிவில் பி.டி.எஃப் இல்லை, ஆனால் நீங்கள் விரும்பும் வலையில் டொமைனை மாற்றவும், ஒரு வகை வலையின் அனைத்து கோப்புகளையும் பார்ப்பது எவ்வளவு எளிது என்பதை நீங்கள் காண்பீர்கள்.
      ஒரு நல்ல நாள்.

      1.    ஃபிராங்க் அவர் கூறினார்

        ஆனால் ஒரு URL இல் உள்ள pdf களைக் கண்டுபிடிக்க wget google உடன் இணைக்கப்படவில்லை. வலை அடைவு திறந்திருக்க வேண்டும் மற்றும் ரூபன் கார்டனல் சொல்வது போல் mod_autoindex அல்லது அதற்கு ஒத்த ஒரு குறியீட்டு பக்கம் இருக்க வேண்டும்.

    2.    ஜிம்மி ஒலனோ அவர் கூறினார்

      "இந்த கட்டளை எப்போதும் இயங்காது, ஏனெனில் சில சேவையகங்கள் wget க்கான அணுகலைத் தடுத்திருக்கலாம்."
      இந்த கட்டுரையில் வைக்கப்பட்டுள்ள இந்த திருத்தம், ஏனெனில் நான் இதை ஏற்கவில்லை (தொழில்நுட்ப ரீதியாக சில வலை முகவர்களை http தலைப்பு கோரிக்கைகளுக்கு தடுத்து 403 "அனுமதிக்கப்படாத" செய்தியை திருப்பி அனுப்ப முடியும்) மற்றும் அதற்கான காரணத்தை நான் விளக்குகிறேன்:

      எல்லா அப்பாச்சி வலை சேவையகங்களும் (நான் கணிசமான சதவீத சேவையகங்களைப் பற்றி பேசுகிறேன்) இயல்பாகவே குளோபிங்கை அனுமதிக்கின்றன (சிறந்த விக்கிபீடியா கட்டுரை, படிக்க: https://es.wikipedia.org/wiki/Glob_(inform%C3%A1tica) .

      இது நடைமுறையில், திரு. ரூபன் (மற்றும் அவர் சொல்வது சரிதான்), "File" என்று அழைக்கப்படாவிட்டால் "index.php" அல்லது "index.html" (அல்லது "index" என்று கூட அழைக்கப்படுகிறது) சேவையகம் அமைதியாக கோப்புகள் மற்றும் கோப்பகங்களின் பட்டியலைத் தரும் (நிச்சயமாக வடிவத்தில்) ஒவ்வொரு கோப்பிற்கும் ஒரு வலை இணைப்பாக தகவலுடன் ஒரு HTML பக்கத்தின்). பாதுகாப்பு காரணங்களுக்காக .Htacces FILE (கண்டிப்பாக அப்பாச்சி 2) மூலம் இந்த அம்சத்தை மிகவும் வலை சேவையகங்கள் முடக்குகின்றன.

      Wget இன் பல்துறை இங்கே (அதன் கதையைப் பாருங்கள், மீண்டும் விக்கிபீடியாவில், உங்களுக்கு மிகவும் தெரிந்த ஒன்று: https://es.wikipedia.org/wiki/GNU_Wget ) அத்தகைய தகவல்களை பகுப்பாய்வு செய்ய அல்லது "பாகுபடுத்தி" மற்றும் நாங்கள் கோரும் நீட்டிப்புகளை மட்டுமே பிரித்தெடுக்கவும்.

      இப்போது, ​​இது செயல்படாத நிலையில், ஒரு காரணத்திற்காக அல்லது இன்னொரு காரணத்திற்காக, பிற மேம்பட்ட விஜெட் செயல்பாடுகளை நாம் முயற்சி செய்யலாம், நான் நேரடியாக ஆங்கிலத்தில் மேற்கோள் காட்டுகிறேன்:

      HTTP சேவையகத்தில் உள்ள ஒரு கோப்பகத்திலிருந்து அனைத்து GIF களையும் பதிவிறக்க விரும்புகிறீர்கள். நீங்கள் முயற்சித்தீர்கள் http://www.example.com/dir/*.gif’, ஆனால் அது வேலை செய்யவில்லை, ஏனெனில் HTTP மீட்டெடுப்பு GLOBBING ஐ ஆதரிக்காது (நான் பெரிய எழுத்துக்களை வைத்தேன்). அந்த வழக்கில், பயன்படுத்தவும்:

      wget -r -l1 –no- பெற்றோர் -A.gif http://www.example.com/dir/

      மேலும் சொற்பொழிவு, ஆனால் விளைவு ஒன்றே. '-r -l1' என்பது அதிகபட்ச ஆழத்துடன் 1 ஐ மீண்டும் மீண்டும் பெறுவது (சுழல்நிலை பதிவிறக்கத்தைப் பார்க்கவும்). gif 'என்றால் GIF கோப்புகளை மட்டுமே பதிவிறக்குவது. '-A «* .gif»' கூட வேலை செய்திருக்கும்.

      இந்த கடைசி வழியில் நீங்கள் இயங்கினால், நாங்கள் பணிபுரியும் இயல்புநிலை கோப்புறையில் கோரப்பட்ட வலை முகவரியுடன் ஒரு கோப்புறையை உருவாக்கும், மேலும் அது தேவைப்பட்டால் அது துணை அடைவுகளை உருவாக்கும், அது அங்கு வைக்கும், எடுத்துக்காட்டாக, நாம் .gif படங்கள் கோரிக்கை.

      --------
      எப்படியிருந்தாலும் சில வகையான கோப்புகளை மட்டுமே பெற முடியாவிட்டால் (* .jpg, எடுத்துக்காட்டாக) ஒரு HTML பக்கத்தின் அனைத்து உள் கூறுகளையும் பதிவிறக்கும் (படங்கள், ஒலிகள், css, போன்றவை) HTML பக்கத்துடன் சேர்ந்து ("-பக்கம்-தேவைகள்" "-p" என்று சுருக்கமாகக் கூறலாம்) மேலும் இது "mhtml" போன்ற ஒன்றைப் பதிவிறக்குவதற்கு சமமாக இருக்கும். https://tools.ietf.org/html/rfc2557

      இந்த தகவல் உங்களுக்கு பயனுள்ளதாக இருக்கும் என்று நம்புகிறேன்.

      1.    டாமியன் அமீடோ அவர் கூறினார்

        குறிப்புகளுக்கு நன்றி. சலு 2.

  2.   பிந்தைய வங்கிகள் அவர் கூறினார்

    உங்களிடம் பிழை இருப்பதாக நான் நினைக்கிறேன், முதல் இரண்டு வரிகளுக்கு ஒரே கட்டளை உள்ளது.

  3.   மைக் அவர் கூறினார்

    மிக்க நன்றி, மிகச் சிறந்த பயிற்சி!