كن محترفًا في pdf من محطة Ubuntu

محطة بألوان نشطة

المستندات النصية هي مستندات شائعة جدًا بين مستخدمي Gnu / Linux وعالم الكمبيوتر ... ومعها جميع الأوامر والبرامج المتعلقة بها. ولكن في الوقت الحاضر ، تكتسب الملفات بتنسيق pdf أكثر من المستندات النصية ، كونها المفضلة للعديد من المستخدمين والمطورين والمشاريع.

إذا استخدمنا بيئة رسومية ، استخدام وإدارة ملف pdf أمر سهل، ولكن ماذا لو استخدمنا المحطة؟ بعد ذلك ، نخبرك بكيفية التعامل مع ملفات pdf والبحث عن الكلمات ، وحساب الأحرف في نص ملف pdf ، إلخ ...

لهذا سنفعله استخدام الأمر pdfgrep ، وهو أمر يمثل تفرعًا للأمر grep. يسمح لنا Pdfgrep بإنشاء مستندات pdf وإرسال المعلومات إلى الملف الذي تم إنشاؤه أو البحث ببساطة عن كلمة داخل مستند pdf.

Pdfgrep هي أداة يمكن أن نجدها في المستودعات الرسمية لجميع التوزيعات تقريبًا، لذلك لتثبيته علينا فقط استخدام مدير البرنامج للتوزيع وتثبيته. قد يحدث أن توزيعنا لا يحتوي عليه ، (شيء غريب إذا استخدمنا Ubuntu). في هذه الحالة نذهب إلى الموقع الرسمي من المطور وسوف نحصل على حزمة deb أو rpm للتثبيت.

بمجرد تثبيته ، يجب أن تكون العملية على النحو التالي:

pdfgrep [-v] pattern [archivo.pdf]

في هذه الحالة ، يكون كل من pdfgrep والنمط أمرين ثابتين و [-v] هو الجزء المتغير الذي سنستخدمه لإجراء عمليات بملفات pdf، مثل البحث عن الكلمات ، عد الأحرف ، إلخ ... يجب تغيير [file.pdf] إلى اسم الملف الذي نريد استخدامه أو إنشائه. إذا كان في نفس المجلد الذي نتواجد فيه ، فلن تكون هناك مشكلة ، ولكن إذا كان ملف pdf في جزء آخر من الكمبيوتر ، فيجب علينا الإشارة إلى عنوان ملف pdf لأنه بخلاف ذلك سيكون هناك خطأ.

إذا كنت تستخدم حقًا الأمر grep في المحطة ، فستحب الأمر pdfgrep. أداة تسمح لنا إنشاء ملفات pdf بمعلومات فريقنا ولتتمكن من إرسالها إلى صديق أو فني أو أي استخدام آخر مشابه.


4 تعليقات ، اترك لك

اترك تعليقك

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها ب *

*

*

  1. المسؤول عن البيانات: ميغيل أنخيل جاتون
  2. الغرض من البيانات: التحكم في الرسائل الاقتحامية ، وإدارة التعليقات.
  3. الشرعية: موافقتك
  4. توصيل البيانات: لن يتم إرسال البيانات إلى أطراف ثالثة إلا بموجب التزام قانوني.
  5. تخزين البيانات: قاعدة البيانات التي تستضيفها شركة Occentus Networks (الاتحاد الأوروبي)
  6. الحقوق: يمكنك في أي وقت تقييد معلوماتك واستعادتها وحذفها.

  1.   جيوفاني جاب قال

    لقد استمروا في مساعدتي في خطأ BIOS الذي تسبب فيه Ubuntu ، وتخلينا عن الكنسي وتظاهروا بنسياننا ، لقد أتلفوا جهاز الكمبيوتر الجديد

    1.    donquijote قال

      وربما تكون غبيًا ، أيها القزم الذي لا تفهمه أن هذه المدونة لا تنتمي إلى غير طبيعي لعنة متعارف عليها ، في كل مرة أرى فيها المدونة تعلق على هراء ، اذهب إلى مكان آخر.

  2.   جيمي أولانو قال

    لقد قمت للتو بتثبيت الإصدار التالي على نظام التشغيل Ubuntu 16.04 الخاص بي:

    «هذا هو الإصدار pdfgrep 1.4.1.

    باستخدام إصدار poppler 0.41.0
    استخدام إصدار Libpcre 8.41 2017-07-05 »

    لقد حصلت على ذلك باستخدام المعلمة –V (أو –version) ولكن مع المعلمة -v يخبرني أنه لا يتعرف عليه.

    لكل هؤلاء أجد الأمر -io –ignore-case ليكون أكثر فائدة ، والذي يعود إما بأحرف كبيرة أو صغيرة الكلمة الأساسية التي نمررها إليها في بحثها.

    ومع ذلك ، هناك مشكلة خطيرة في البحث عن الكلمات المنطوقة وخطابنا العزيز ، إذا أردنا البحث عن "إنتاج" أو "حماية" ، فيجب علينا البحث عن:

    pdfgrep -i producc filename.pdf
    pdfgrep -i حماية اسم الملف. pdf

    (لقد حاولت بالفعل إرفاقه بعلامات اقتباس ، مفردة ومزدوجة ، وحرف الهروب من لغة C "\" وأحرف البدل ولا شيء على الإطلاق). للبحث عن الكلمة الرئيسية "year" ، الحقيقة هي أنني لا أستطيع التفكير في أي بديل ، من يعرف شيئًا ما ، يرجى النشر هنا والرجاء الإجابة علي.

    الخيار الأقوى هو -ro- متسلسل: إنه يبحث عن الكلمة في جميع مستندات pdf التي لدينا في الدليل الذي نعمل عليه.

    باختصار ، إنها أداة جيدة ولأنها مكتوبة ببرمجيات حرة ، يمكننا تعديلها بحيث تدعم اللغة الإسبانية ، شكرًا على المقال!

  3.   جيمي أولانو قال

    قراءة هذا المستند:

    https://pdfgrep.org/doc.html

    لقد اكتشفت وأعلمك أنه من المقترح إضافة المعلمة "–unac" للتعامل مع الأحرف المحركة ، ومع ذلك ، فإن الإصدار الذي قمت بتنزيله لم يكن لديه دعم unac لأنه ببساطة لم يتم تجميعه باستخدام تلك الأداة ، والتي يسمونها تجريبية بواسطة الطريقة.
    الشيء المضحك هو أن الأمر grep لا يحتوي على هذا القيد ، حتى عند استخدام المعامل -i مع grep يمكن للمرء البحث عن "ú" وسيعيد أيضًا "Ú".

    على أي حال ، أنا أقوم بالفعل بمراجعة مستودع pdfgrep لمعرفة ما أعرفه أيضًا ، حسنًا ، لم أعد أزعجك بعد الآن (لليوم).