Wie kann ich eine Textebene von einer PDF in eine andere portieren? (in Fenstern)

608
marlonob

Ich habe ein paar Dateien im .djvu-Format, deren Größe klein ist, aber leider kann mein E-Reader sie nicht anzeigen. Ich verwende DjvuToy, um es in PDF umzuwandeln und behält dabei die geringe Größe bei. Wenn ich jedoch Abby FineReader für die OCR verwende und speichere, erhöht sich die Größe ungefähr acht Mal (dies geschieht nur, wenn die Datei Farb- oder Graustufenbilder enthält). Ich denke also, dass es möglich ist, die zweite Datei-Textebene zu der ersten hinzuzufügen, damit ich sowohl die kleine Größe als auch die OCR erhalten kann. Wie kann ich das machen?

Hinweis: Die Original-djvu-Datei hat keine Textebene, obwohl es gut wäre zu wissen, wie man von djvu zu pdf konvertiert, einschließlich Text direkt.

2
Tatsächlich konvertiert es es in XML, Block für Block mit Koordinaten, die effektiv die Positionen der Wörter / Buchstaben abbilden Dave vor 12 Jahren 1

1 Antwort auf die Frage

0
alexei

Ghostscript kann direkt zum Bearbeiten der PDF-Eigenschaften verwendet werden, wobei die Textebene erhalten bleibt:

gs -q -dNOPAUSE -dBATCH -sDEVICE=pdfwrite -dColorConversionStrategy=/Gray -dProcessColorModel=/DeviceGray -sOutputFile=output.pdf input.pdf 

Von hier .