Bilder unverändert in PDF packen

Grundsätzliche Fragen zur Bedienung
Antworten
cocabonga
Beiträge: 1
Registriert: 26.07.2019, 23:49

Bilder unverändert in PDF packen

Beitrag von cocabonga » 27.07.2019, 01:43

Hallo!

Ich habe hier ein Problem beim erstellen von PDF Dokumenten mit Acrobat und mehreren Tools, aber ich Fange mal ganz von vorne an.

Ich habe hier mehre gescannte Dokumente und ebooks die als PDF vorliegen. Nun sind diese PDFs nicht immer von bester Qualität. Oftmals sind sie doppelseitig eingescannt, die Textzeilen sind schief, die Auflösung ist nicht immer die beste und die Dateien sind nicht durchsuchbar. Was ich hier erstmal nutze sind die beiden Tools Briss und ABBYY Fine Reader. Mit Briss lassen sich doppelseitige PDF Dokumente teilen und ABBYY Fine Reader macht die PDFs dann durchsuchbar. Oft liefern diese zwei Arbeitsschritte ein brauchbares Ergebnis und man kann zufrieden sein.
Machmal nutzt daß aber auch nicht viel, wenn z.B. die eingescannten Seiten voller schwarzer Ränder sind und die Textzeilen schief eingescannt wurden. In solchen Fällen muß das PDF Dokument ja quasi neu aufgebaut werden. Ich nutze dabei den PDF Image extractor und hole die Bilder erstmal aus dem Dokument raus. Oftmals handelt es sich dabei dann um Tiff Dateien. Diese Bilder tue ich dann mit Scan Tailor nachbearbeiten. Scan Tailor liefert dabei doch sehr brauchbare Ergebnisse. Es kann entzerren, zuschneiden, die Ränder entfernen sowie die Zeilen gerade ausrichten. Am Ende gibt das Programm wieder Bilddateien im TIF Format aus.
Bis zu diesem Schritt läuft in der Regel noch alles gut. Problematisch wird die Weiterverarbeitung von hier an, denn die Bilder müssen ja nun in ein PDF gepackt werden, welches anschließend per OCR durchsuchbar gemacht werden soll.
Ich arbeite derzeit mit Acrobat 9 um die von Scan Tailor erzeugen Bilder wieder in ein PDF zu packen. Das Problem dabei ist, daß danach entweder die Qualität der Bilder abnimmt (was sich besonders Scans mit niedriger DPI bemerkbar macht) oder PDF Dateien am Ende 5-mal so groß ist wie die Ursprungs PDF. Zwar kann man im Acrobat 9 gewisse Einstellungen vornehmen was die Umkonvertierung von Bildern in PDFs betrifft, aber manchmal kommt immer wieder Murks dabei herauf, egal was man bei den Einstellungen auswählt.
Ein ähnliches Problem ergibt sich bei der Texterkennung von einigen PDF Dateien mit dem ABBYY Fine Reader. Auch wenn man dort das Image processing komplett abschaltet werden die Bilder verändert, was mache Scans einfach nicht vertragen und hier kommt nun mein Problem. Es muß doch möglich sein ein paar TIF Dateien völlig unverändert in ein PDF Dokument zu kleistern, ohne daß da irgendein Programm wieder was dran herum konvertiert. Das gleiche Problem bei Texterkennung. Hier möchte ich einfach nur meinen Text Layer dazu haben ohne Irgendeine Änderung des Bildes, aber das scheint zumindest mit meiner Software hier nicht möglich zu sein.

Wie macht Ihr das?

Für Hilfe wäre ich sehr Dankbar


P.S. Mir ist außerdem aufgefallen das mache PDF Dateien die mit Acrobat erstellt wurden trotz guter Optimierung später beim Anzeigen und Scrollen im Adobe Reader mitunter sehr träge und langsam sein können. Was läuft hier schief? Hat jemand schon ähnliche Erfahrungen gemacht?

Antworten