Re: PDF platzsparend mit Scanner erzeugen

Tech-Archive recommends: Repair Windows Errors & Optimize Windows Performance

From: Michael Landenberger (spameimer092004_at_onlinehome.de)
Date: 03/21/05


Date: Tue, 22 Mar 2005 00:01:22 +0100

Hallo,

"arno" schrieb:

> ich möchte A4 Dokumente scannen und in möglichst kleinen PDF-Dateien
> speichern.

Warum PDF? Scans sind zunächst einmal Bilder und für die ist PDF nicht das
optimale Format.

> Wie macht ihr das?

Ich speichere die Scans je nach Vorlage als TIF (Texte) oder JPG (Fotos).

> Derzeit scanne ich mit 256 Graustufen, 200 dpi in eine Worddatei

Kann dein Scanner kein reines Grafikformat erzeugen?

> der HP PSC 2210 Scanner stellt mir eine Grafik in eine Worddatei,
> direkt PDF erzeugen geht glaub ich nicht). Diese Worddatei drucke ich
> dann mittels CutePDF oder PDFCreator und erzeuge damit die PDF-Dateien.
> Optisch bin ich sehr zufrieden, aber die PDF-Datei einer A4-Seite
> benötigt ca. 450kb Speicherplatz, das ist mir zu viel.

Du wirst sie in kaum einem Format (außer JPG) kleiner bekommen. Die erzeugte
PDF-Datei enthält nichts weiter als eine Grafik, und wie bereits geschrieben
ist PDF kein optimales Grafikformat.

Wenn du mindestens bei Textvorlagen eine deutliche Verkleinerung erreichen
willst, musst du die gescannte Grafik mit einem OCR-Programm in eine Textdatei
umwandeln. Die ist zwar bei hoher Ausgabequalität drastisch kleiner als die
Grafik, weicht aber im Aussehen vom Original ab bzw. der Text muss erst mühsam
so formatiert werden, dass er so wie im Original aussieht.
Eine andere Verbesserungsmöglichkeit besteht darin, dafür zu sorgen, dass
einfarbige Bereiche auf der Vorlage auch im Scan nur aus einer Farbe bestehen.
Große einfarbige Flächen lassen sich sehr effektiv komprimieren. Da der
Scanner aber u. A. die Papierstruktur der Vorlage und jedes Staubkörnchen
mitscannt, gibt es im Scan zunächst keine wirklich einfarbigen Bereiche, auch
wenn die Farbunterschiede so minimal sind, dass das Auge sie gar nicht
wahrnimmt. Hier muss man mit einem Bildbearbeitungsprogramm nachträglich dafür
sorgen, dass zusammenhängende einfarbige Flächen wirklich mit ein und
demselben Farbwert gefüllt werden.

> Allerdings habe
> ich keine Erfahrungswerte und weiss nicht, ob 450kb wirklich viel od.
> wenig sind.

DIN A4 ist ca. 8 x 11,5 Zoll groß. Bei 200 dpi ergeben sich also 1600 x 2300
Pixel. Bei 256 Farben belegt jedes Pixel 1 Byte, die resultierende
unkomprimierte Datei wäre also immerhin 1600 x 2300 = 3,68 Megabyte groß. Da
bedeutet eine Reduktion auf 450 KByte schon eine recht ordentliche
Kompression.

> Meine Dokumente haben meist schwach sichtbare Hintergrundmuster. Diese
> Muster müssen zumindest andeutungsweise mitgescannt werden. Ich nehme
> an, das trägt zur Dateigrösse wesentlich bei, aber es muss halt so
> sein.

Ja, das erschwert eine Kompression erheblich. Meine obigen Ausführungen mit
den einfarbigen Flächen habe ich auch eher auf Vorlagen ohne jedes
Hintergrundmuster bezogen. Die OCR-Methode berücksichtigt das
Hintergrundmuster überhaupt nicht, kommt also vermutlich für dich nicht in
Frage.

Du kannst mal versuchen, ob das JPG-Format für deinen Einsatzzweck Vorteile
hat. Fotos lassen sich mit JPG sehr gut komprimieren, ohne dass die Qualität
nennenswert leidet, für Grafiken und Texte ist es allerdings weniger geeignet.
Da JPG verlustbehaftet ist, könnte das Ergebnis Artefakte enthalten, speziell
bei dem von dir erwähnten Hintergrundmuster. Um diese Artefakte zu minimieren,
brauchst du ein hochwertiges Bildbearbeitungsprogramm (z. B. Paint Shop Pro
oder Photoshop) und musst ein bisschen mit den Kompressionseinstellungen
herumexperimentieren.

Gruß

Michael



Relevant Pages

  • Re: Distiller PDF/X1A
    ... JPG compression is a compression, side by side with an uncompressed tif, ... Now if the client wants a PDF to view on screen for approval, ...
    (comp.publish.prepress)
  • Re: Cannot open attachments Windows Mail, Vista
    ... Problems with rtf, doc, jpg and pdf files. ... Does the problem appear with PDF attachments only? ... How about JPG and TXT files? ... Where the temporary file is created depends on the settings for the path in ...
    (microsoft.public.windows.vista.mail)
  • Re: S: Erfahrungstipp beim Einbinden von Bildern (pdflatex)
    ... du hattest in der .pdf Newsgroup bereits PNG empfohlen. ... PDF-Datei. ... Dateien waren sogar kleiner als JPG. ...
    (de.comp.text.tex)
  • RE: Saving PowerPoint 07 as individual slides
    ... MOS PowerPoint 2003 ... I'm assuming the end product is 40+ individual PDF files, ... In Acrobat, Save As .jpg ... Tell it you want the whole document saved as .jpg ...
    (microsoft.public.powerpoint)
  • Re: RTF-Komponente =?iso-8859-15?Q?f=FCr_D2010_gesucht?=
    ... Die Vorlage ist eine ... einfache Textdatei, so dass das Suchen und Ersetzen von Platzhaltern ... kostenlos und das Ergebnis ist ein PDF. ... Du brauchst jemanden, der sich soweit mit LaTeX auskennt, ...
    (de.comp.lang.delphi.misc)