Was ist die beste Methode zur Bearbeitung von JPEG-Texten?

464
tjt263

Ich habe eine relativ einfache Grafik. ein technisches Diagramm mit verschiedenen Textteilen.

Der Text ist in einer anderen Sprache (Tschechisch / Slowakisch). Es wird deutlich genug gedruckt, um von OCR (Google Translate) von Google Translate genau unterschieden und interpretiert zu werden. Jedenfalls möchte ich den Text durch die englische Übersetzung ersetzen.

In diesem Fall ist es nicht schwierig, den aktuellen Text einfach auszuschneiden / zu verdecken und dann alle neuen Textfelder mit grundlegenden Bearbeitungswerkzeugen hinzuzufügen. Es wäre aber schön, wenn ich einfach den Text so auswählen und bearbeiten könnte, wie es einige PDF-Editoren können.

Ich habe versucht, das JPEG / PNG-Format als PDF zu exportieren und dann mit Libre Office zu bearbeiten. Es war jedoch nicht anders, als ein leeres Dokument zu erstellen und das Bild einzufügen. Es war alles nur ein einziger Gegenstand.

Ich verstehe den Grund und erwarte keine Magie. Aber hat jemand eine Technik dafür?

2
Fragen Sie im Grunde, ob es ein Grafikbearbeitungsprogramm gibt, das OCR dazu verwendet, Textelemente in einer Grafik zu erkennen und in tatsächlich bearbeitbaren Text umzuwandeln? Wenn ja, gibt es keine, die ich kenne. Text ist nicht nur Text, es gibt Schriftarten, Kerning, Zeilenabstände und alle möglichen anderen Variablen. Klingt, als wäre es eine wirklich coole Funktion! Sandwich vor 6 Jahren 0
@Sandwich Die meisten PDF-Editoren, die ich verwendet habe, hatten irgendwann Probleme mit der Kompatibilität von Schriftarten. Besonders bei der Bearbeitung von Dokumenten von fremden Betriebssystemen. Es hat mir jedoch nie Kummer bereitet; Ich habe es immer geschafft, den Text in eine native Schriftart umzuwandeln. tjt263 vor 6 Jahren 0
PDFs sind jedoch weitaus "reichhaltiger" als JPEG. PDFs sollen ein qualitativ hochwertiges Drucken von einem tragbaren Dokument aus ermöglichen. Daher enthalten sie nicht nur häufig eingebettete JPEGs für Bilder, sondern sie können auch Vektordaten für Grafiken sowie Textdaten mit den entsprechenden Formatierungsanweisungen und der eigentlichen Schriftart selbst speichern, die alle in der PDF-Datei selbst verborgen sind. Deshalb haben viele PDFs kopierbaren und durchsuchbaren Text. OCR ist das, worauf wir zurückgreifen müssen, wenn es KEINE zugrunde liegenden Textdaten gibt - es wird versucht, Buchstaben aus reinen Pixeldaten herauszufinden. Sandwich vor 6 Jahren 0

1 Antwort auf die Frage

2
Yorik

Der einfachste Weg, dies zu tun (ohne zu prüfen, wie komplex das Dokument ist), besteht darin, das Bild mithilfe der DTP-Software zu platzieren, das Bild zu sperren und einzelne Textfelder hinzuzufügen, die einen weißen Hintergrund haben. Sie können eine sehr genaue Platzierung vornehmen und die Größe des Kästchens einfach an den alten Text anpassen. Sie können dann als PDF oder ein flaches Bildformat exportieren.

Scribus ist ein kostenloses Open Source-DTP-Paket, ähnlich wie bei Quark oder InDesign.

Word usw. hat oft eine Möglichkeit mit Textfeldern, aber ich finde diese im Vergleich zu DTP-Software umständlich.

Wenn Sie das Bild gut bereinigen, können Sie mit Inkscape (Open Source) oder Illustrator versuchen, das Bild mit "Trace" oder "Live Trace" zu bearbeiten, und der Text wird möglicherweise als Nicht-Text-Vektorobjekt bearbeitet. Dies ist jedoch der Fall wahrscheinlich problematisch, und selbst dann dauert es länger als neue Textfelder.