سؤال لماذا يتم إنشاء ملفات PDF من MS Word بشكل كبير؟


أنا خلقت وثيقة MS Word بسيطة تحتوي فقط على هذه الجملة:

هذه وثيقة صغيرة.

لا شيء آخر. ثم قمت بحفظ هذا المستند باسم DOCX و PDF. فيما يلي أحجام الملفات:

DOCX: 12 كيلو بايت
PDF: 89 كيلوبايت

هذا الاختلاف ضخممن الناحية الفنية ، ويبدأ في الواقع عناء لي عند معظم الوثائق النصية التي هي عشرات كيلو بايت في DOCX بدء توليد ملفات PDF التي هي مئات من كيلو بايت كبير. ما هو غير فعال في تنسيق PDF؟ أو هو مجرد كلمة باستخدام بعض خوارزمية إخراج رهيب؟

راجع للشغل ، تم تعيين إعدادات الإخراج PDF لإنشاء أصغر ملف ممكن:

PDF output options


70
2017-09-30 08:08


الأصل


تخميني هو أن ملف PDF يدمج الخط ، وهو أمر ضروري إذا كان المستند محمولاً بالفعل. - AFH
نعم ، يتم تضمين مجموعة فرعية الخط. قد يكون ذلك. لقد حاولت أن أكرر نفس الجملة بضع مئات من المرات ، ونما حجم ملف PDF بمقدار 4 كيلوبايت فقط. (بقيت DOCX على 12 كيلوبايت وهو أمر غير مفاجئ لأن هذا هو تنسيق مضغوط والنص المتكرر لن يستغرق أي بايت جديد). - Borek Bernard
AFH لا يتضمن Arial. i.stack.imgur.com/aUZgt.png - MonkeyZeus
بالتفكير في الأمر من وجهة نظر تعقيد كولموغوروف ، فإن برنامج Microsoft Word أكبر من متوسط ​​حجم المشاهد الخاص بك ، بأكثر من بضع مئات من الكيلومترات. - hobbs
أعتقد أن السؤال الحقيقي هو لماذا تنسيق صيغة معالجة الكلمات الخاص بك أكبر بكثير من LaTeX المكافئة ... :-p - Toby Speight


الأجوبة:


إذا قمت بفتح PDF في notepad ++ ستجد:

9 0 obj
<</Filter/FlateDecode/Length 79100/Length1 171804>>
stream
xœì}    XTGºvÕ9½/t7Ðl
..... many more bytes  ...   ëH|  
endstream
endobj
10 0 obj

ويشار إلى هذا الكائن هنا في النهاية في التعليمة / FontFile2:

6 0 obj
<</Type/FontDescriptor/FontName/ABCDEE+Calibri/Flags 32/ItalicAngle 0/Ascent 750/Descent -250/CapHeight 750/AvgWidth 521/MaxWidth 1743/FontWeight 400/XHeight 250/StemV 52/FontBBox[ -503 -250 1240 750] /FontFile2 9 0 R>>
endobj

يتم تضمين الخطوط المستخدمة بواسطة مستند Word في ملف PDF بحيث يكون ملف pdf قائمًا بذاته.

انا إستعملت هذه الشريحة الشريحة لفك تعليمات PDF.

إذا كنت ترغب في منع الخطوط المضمن في ملف PDF ، تأكد من أن مستند Word الخاص بك يستخدم أحد المحارف القياسية الأربعة عشر المتوفرة في عارض PDF ، (المصدر ويكيبيديا)

  • Times New Roman> Times (v3) (بشكل مائل ، مائل ، غامق ، غامق مائل)
  • ساعي جديد> ساعي (مائل ، مائل ، جريئة وجريئة مائلة)
  • Arial> Helvetica (الإصدار 3) (المائل ، المائل ، الغامق والجرأ المائل)
  • الرمز> الرمز
  • Wingdings> Zapf Dingbats

103
2017-09-30 08:46



ذات صلة: superuser.com/questions/607840/... - Borek Bernard
Sidenote: إن سطح الشريحة المرتبطة (عرض Powershell) يستحق القراءة. مفصل جدا. لا تفوت التعليقات حيث يشرح بنية PDF - nixda


لقد حدث هذا معي عدة مرات في Microsoft Word عند محاولة تصدير مخطوطة بسيطة إلى PDF. سيتم إنشاء مستند Word من 5 إلى 8 ، بحجم 50 كيلوبايت تقريبًا كملف PDF أكثر من 10 ميغابايت ، وهو كبير جدًا بدرجة لا تسمح بإرسال بريد إلكتروني إلى شخص ما.

إجابة رينيه على المسار الصحيح - المشكلة هي أن الخطوط مدمجة في المستند - ولكن مجرد استخدام أحد المحارف القياسية لن يحل المشكلة بالضرورة.

كانت جميع المستندات الخاصة بي في تايمز نيو رومان ، باستخدام أي شيء أكثر إثارة من الجريئة والمائلة. او كذلك ظننت انا. اتضح أن لدي التلقائي تقنين ممكن في القالب الافتراضي (لـ أسباب واضحة). عند التصدير إلى PDF ، كان Word يقوم بالفعل بتضمين كل من هذه الحروف المركبة ككائن خط منفصل في الوثيقة ، مما أدى إلى تضخيمها خارج كل الاعتقاد.

الإصلاح بسيط ، عليك فقط أن تتذكر أن تفعل ذلك في كل مرة:

  1. حدد كل النص في المستند.
  2. الشكل ← الخط ← متقدم
  3. قم بإلغاء تحديد "Kerning for fonts"

ومن المثير للاهتمام ، يمكنك ترك الحروف المركبة والبدائل السياقية وغيرها من ميزات الطباعة المتقدمة الممكنة ؛ ليس لها تأثير ملموس على حجم PDF الناتج.

أعد تصدير المستند بتنسيق PDF ، وانخفض حجمه إلى مائة كيلو بايت. للأسف ، تقنين الأحرف هو دون المستوى ، لذلك لا أوصي بطباعة بهذه الطريقة ، لكنه يعمل بشكل جيد لإرسال مستند عبر البريد الإلكتروني.


2
2018-02-15 10:54





لإعطاء إجابة تقنية أقل قد تساعد على أن تستخدم ملفات PDF المتجهات (أي: المعادلات الرياضية) لوصف كل ما تراه. يتم تعريف جميع المنحنيات والخطوط من خلال المعادلات الرياضية ، وبالتالي سيكون هناك بالضرورة الكثير من المعلومات للاحتفاظ بها ، خاصة عندما يكون لديك صور في مستنداتك.

وتتمثل فائدة ذلك في أنه يمكنك نظريًا التقريب بشكل لا نهائي بدون فقد أي دقة أو تفصيل ، نظرًا لأن الخطوط والمنحنيات ليس لها عرض ، لذا يمكنها القياس باستخدام التكبير / التصغير.

تمامًا مثل الطريقة التي أدى بها تغيير الخط الأخير من Google إلى تقليل حجم الشعار من ~ 14 كيلوبايت إلى ~ 300 بي ، من المحتمل أن تساعد الخطوط الأبسط في تقليل حجم الملف.


-3
2017-10-01 16:13



هذا التناظر لا يعمل. على الاطلاق. لم يكن تغيير شعار Google هو الخط فحسب ، بل أيضًا من التدرجات إلى المسطحة مما يجعل فرق الحجم. علاوة على ذلك ، سيكون تصدير مستند إلى صورة نقطية كبيرة أكبر بكثير من خط + النص. المعادلات الرياضية ، كما كنت مضللة وضعه ، ليست سوى أزواج تنسيق عدد صحيح ، والتي قد تكون هناك بضع عشرات في الصورة الرمزية. ولأنه خط لا يحتاج إلى تكرار لكل حرف. - Joey