Wie kann ich eine mehrseitige TIF-Datei in eine PDF-Datei umwandeln?

20022
user170220

Ich habe eine GIGANTIC .TIF-Datei.

Ich habe vor ein paar Tagen ein Buch eingescannt und aus Versehen als mehrseitiges .TIF-Dokument gescannt. Ich möchte es wirklich in eine zugänglichere .PDF-Datei umwandeln.

Haben Sie eine Idee, wie das geht?

6
"GIGANTIC" ist irgendwie subjektiv. Sie könnten Ihre Frage verbessern, wenn Sie einige Zahlen angeben: Die Anzahl der Seiten und die Größe der TIF-Datei (komprimiert oder nicht) wäre ein guter Ausgangspunkt. mpy vor 11 Jahren 0
Dies ist kein Duplikat der verknüpften Frage, da sich die beiden Fragen unterscheiden. In diesem Fall möchte die Person eine mehrseitige TIFF-Datei in ein einzelnes PDF-Dokument konvertieren. Im anderen Fall möchte die Person MULTIPLE TIFF-Dateien in eine einzige PDF-Datei konvertieren und zusammenführen. Während dies verwandt ist, sind die Fragen eindeutig! Gibt es eine Möglichkeit, eine Frage als "einzigartig" zu kennzeichnen? user2021355 vor 6 Jahren 0
TIFF-zu-PDF-Konverter-Sites sind online verfügbar. Beispielsweise wurde eine Schnellsuche aufgerufen: https://tiff2pdf.com/ Die 12-seitige mehrseitige TIFF-Datei wurde erfolgreich in eine PDF-Datei konvertiert. Entschuldigung für die Antwort in einem Kommentar, aber die Frage ist für die Bearbeitung gesperrt (vorerst ... Ich versuche, es mit Klarstellung wiederzubeleben :). user2021355 vor 6 Jahren 0

2 Antworten auf die Frage

16
mpy

If you are fine with just converting the file format (without making the text searchable (via OCR as pointed out by Jonathan Ben-Avraham), this will be a perfect task for convert from the ImageMagick package (available for various platforms: Win, Linux, Mac).

Simply use that command to convert your multi-page TIFF file

convert multi-page.tif book.pdf 

However, you should employ the -compress Parameter. If you have a 24bit colored TIF, you can use LZW (lossless) or JPEG (lossy), e.g.

convert -compress LZW multi-page.tif book.pdf 

If your TIFF is black and white (please make sure, it is really saved with only 1bit colordepth), I usually use -compress Fax.

Here is an example for a 5 page sample file, with some text in it -- the actual ratio between the compression algorithms depends of course on the content of your file:

24bit JPEG: 1294kB 24bit LZW: 1759kB 1bit Fax: 135kB 

After that conversion you still can run a OCR tool (like Adobe Acrobat Pro) to make the text search- and copyable.

Vielen Dank für die "-compress Fax" -Flagge, die sich besonders für Buchscans eignet. firegurafiku vor 9 Jahren 0
2
Jonathan Ben-Avraham

TIFF (Tagged Image File Format) is a pixel-oriented format that is intended for images. In order to get just the character data from a TIFF file you would have to use an OCR (Optical Chararacter Recognition) program. All OCR programs have some error rate. The format of the pages (header, footers, section headings, etc) also affect the ability of OCR to accurately guess the characters.

The language and particularly the writing system and font also affect OCR accuracy. If the book has an unusual non-western font with ligatures then the chance of getting goot OCR output are close to zero.

If the book is not primarily text, for example, a book with many screen shots or other images that are important, then OCR will not help you.

There are some Open Source OCR programs available, depending on the OS you are using. Google Drive has a free OCR service. WMMV.

Assuming that the original book you scanned is in paper format, then TIFF is about the best you can do in any event. You can make the document size more manageable by compressing the TIFF file. Try JPEG compression with various levels of compression to optimize document size against readability.