سؤال كيف يمكنني إصلاح / إصلاح ملف PDF تالف؟


هل لدى أي شخص أي توصية أو إجراءات لإصلاح PDF فاسد؟ عندما أفتح الملف أحصل على "حدث خطأ في فتح هذا المستند. الملف تالف ولا يمكن إصلاحه." يبدو أن هناك عدد لا يحصى من الأدوات هناك ولكن لا شيء يمكن أن أصفها بأنها حسنة السمعة. هل هناك أي حلول لينكس مصدر مفتوحة لهذا ممكن؟


71
2018-05-03 14:35


الأصل


أدوات PDF مفتوحة المصدر تميل إلى أن تكون كربيًا جدًا ، أخشى. ما الذي تستخدمه؟ - Satanicpuppy
انظر أيضا: superuser.com/questions/166999/... - slhck
لم يعجبه مظهر أي من الأدوات كما بدا مثل عدد لا يحصى من "منظفات السجل" هناك التي لا جدوى منها. وقد تم محاولة Adobe Pro وبدأت للتو تبحث إذا Ghostscript أو PDFForge لديك أي مفاتيح إصلاح. - Tim Alexander
Ghostscript على ما يرام ، لكنها بالتأكيد ليست أفضل من Acrobat. انها عظام عارية تماما. - Satanicpuppy
Satanicpuppy أنا لا أوافق: أنا استخدم ghostscript لإعادة بناء pdfs التالفة أو منخفضة الجودة في كثير من الأحيان ، وأنه يؤدي بشكل جيد للغاية. - Eddie B


الأجوبة:


سيقوم Ghostscript بإصلاح ملف PDF التالف تلقائيًا ... إذا كان بإمكانه فتحه في المقام الأول (أي ، إذا لم يكن تالفًا بعد الإصلاح). ولكن بعد ذلك ، ستظل بحاجة إلى التحقق مرة أخرى من النتيجة ...

على نظام التشغيل Linux ، جرّب هذا الأمر:

 gs \
  -o repaired.pdf \
  -sDEVICE=pdfwrite \
  -dPDFSETTINGS=/prepress \
   corrupted.pdf

على نظام التشغيل Windows ، جرِّب هذا:

 gswin32c.exe ^
  -o repaired.pdf ^
  -sDEVICE=pdfwrite ^
  -dPDFSETTINGS=/prepress ^
   corrupted.pdf

87
2018-05-11 12:47



Ghostscript يقوم بعمل رائع في تقديم pdfs ... أنا استخدم gs بانتظام لإعادة بناء pdfs لتحسين جودة الخط. - Eddie B
و / ما قبل الطباعة جعل نوعية جيدة حقا مقارنة مع / الشاشة. شكر. - Dolanor


كان لدي ملف PDF تالف ، print.pdf ، أن Ghostscript لا يمكن فتح ، ولكن افتتح المشاهد الرسومية لينكس PDF المعتادة (Okular ، Evince) بشكل جيد. (في حالتي ، كان الملف يحتوي على القمامة في البداية بدلاً من رأس PDF ، عند فتحه في محرر سداسي عشرية.)

يستخدم مشاهدو PDF هذا Poppler كعارض PDF للجهة الخلفية. حتى تتمكن من إصلاح PDF باستخدام أدوات سطر الأوامر Poppler. في أوبونتو هذه في poppler-utils صفقة. انا إستعملت:

pdftocairo -pdf print.pdf print_repaired.pdf

التي أنشأت ملف PDF مع رؤوس صحيحة ، والتي قبلت أدوات مثل Ghostscript الآن.


28
2018-06-18 02:01



+1 هذا اقرأ لي كوارتز ولدت قوات الدفاع الشعبي دون شكوى ، وبدأت على الفور توليد الإخراج. أصر Ghostscript ، أدوبي أكروبات برو وغيرها على إعادة بناء بي دي بي 120GB أولا. - Orwellophile
لم ينجح ذلك في ملف PDF غريب واحد على الأقل ، ولكن يبدو وكأنه بداية جيدة. - Brian Peterson
يعمل بشكل مثالي على PDF الذي تريد Ghostscript إزالة بعض العناصر التعسفية على الصفحات. - Andrea Lazzarotto
فشلت Ghostscript في قراءة الوثيقة ولكن هذا العمل مثل السحر. راجع للشغل فعلت هذا على ويندوز باستخدام نظام لينكس الفرعي الجديد ، حتى تبرد! - HyLian


mutool (صفحة المشروع، manpage) سوف إصلاح PDFs مكسورة دون طباعتها.

  • التثبيت على سبيل المثال على أوبونتو: sudo apt-get install mupdf-tools
  • شغله هكذا: mutool clean input.pdf output.pdf
mutool clean [options] input.pdf [output.pdf] [pages]

  The clean command pretty prints and rewrites the syntax of a PDF file.
   It can be used to repair broken files, expand compressed streams,
   filter out a range of pages, etc.
  If no output file is specified, it will write the cleaned PDF to
   "out.pdf" in the current directory.

بدلا من ذلك ، هناك عدد قليل من الأدوات والأطر التي يمكن أن تفكك / تفكيك ملفات PDF في مكوناتها دون تقديمها. هذه يمكن أن تكون مفيدة لاستخراج النص ، والنصوص ، والصور. انظر هذه الإجابة للحصول على قائمة بهذه الأدوات: https://reverseengineering.stackexchange.com/q/1526/8210. مثلا يمكنك تجربة الإجابة الأعلى الحالية فن قص الورق، لديه عارض يستند إلى GTK.


18
2018-06-04 14:45



يعمل هذا الحل "بشكل أفضل" من الحلول المقدمة أعلاه أو في ترتيب أفضل ، حيث إنه لا "يطبع" ملف PDF ويظل نشطًا في الروابط ، والعناصر القابلة للنقر ، إلخ ... بالنسبة لي ، يبدو أنه حل أكثر أناقة من استخدام ghostscript أو القاهرة. - Speredenn
للأسف، mutool clean لا يصلح جميع الأخطاء المحتملة. لدي ملف يحتوي على العديد من الأخطاء في تدفقات الخط والمحتوى ، وسيحتفظ جهاز mutool بتلك الأخطاء. - Dominik Honnef
DominikHonnef يمكنك دائمًا تجربة الأدوات / الأطر التي تحلل PDF وتسمح لك بمشاهدة جميع الأجزاء دون عرضها. من المفترض أن يساعدك ذلك في الحصول على النصوص والنصوص والصور وما إلى ذلك مباشرة. انظر هذا الجواب للحصول على قائمة من الأدوات: reverseengineering.stackexchange.com/q/1526/8210 - jmiserez
الشيء الوحيد الذي يعمل بالنسبة لي! - jamadagni
هذا عمل أفضل لأن هذا لا يجعل pdf فحص المستند. - riccs_0x


كان لدي ملف pdf تالف ، لأن ملف php المستخدم لتنزيله ردد بعض الأخطاء (في HTML) وأرقام NUL في النهاية.

كان الحل لفتح PDF مع Notepad ++ وإزالة كافة النص بعد السطر

%%EOF

9
2018-01-29 12:54



بنفس الطريقة ، لم يتم فتح Adobe Reader ولكن تم عرض ملف PDF الخاص بـ Mac و Chrome و Firefox PDF بشكل جيد. كان السبب أيضا إضافي "NUL" في السطر الأخير المضاف أثناء التحميل. - Tilo
كان لدي ملف PDF مع اثنين %%EOF. أنا حذفت كل شيء بعد الأول %%EOF باستخدام محرر سداسي. الآن كل شيء يعمل بشكل جيد. - Adrian