So erstellen Sie TMX aus vorhandenen TXT-Dateien

520
nitech

Ich habe einige Bücher in gedruckter Form. Sie wurden vom Englischen ins Norwegische übersetzt, ehe Computer Mainstream waren, also ließ ich die Übersetzung über einen Scanner laufen und arbeitete mit OCR. Die englische Version wurde bereits digitalisiert.

Es gibt OCR-Fehler, die ich korrigieren muss, und ich muss auch die Absätze in der norwegischen Übersetzung an das englische Original anpassen.

Anscheinend sollte ich ein Translation Memory-Programm wie Zanata als Werkzeug und Repository für die Übersetzungen verwenden. Bevor ich das tun kann, muss ich jedoch eine TMX-Datei erstellen, die die Segmente zwischen den vorhandenen Übersetzungen angleicht

Irgendeine Idee, wie ich das machen kann? Oder greife ich dieses Problem im falschen Winkel an?

1
Scheint "Übersetzungen ausrichten" ist ein beschreibender Begriff http://www.across.net/online-help/across/acrossHaupt141.htm nitech vor 8 Jahren 1
Wie dieser http://tag-aligner.sourceforge.net/ nitech vor 8 Jahren 0
Und das hier: http://sourceforge.net/projects/aligner/ - funktioniert unter Windows nitech vor 8 Jahren 1

1 Antwort auf die Frage

0
nitech

Wenn Sie nach "Übersetzungen ausrichten" suchen, finden Sie einige Werkzeuge, die speziell für das Ausrichten von Absätzen (oder Sätzen) in bereits übersetzten Dokumenten entwickelt wurden.

Ich habe sourceforge.net/projects/aligner verwendet, eine Cross-Plattform. Ich bin nicht sehr beeindruckt von dem Tool - aber es erledigt die Arbeit, soweit die obige Frage reicht (es erlaubt Ihnen, Text auszurichten und erzeugt dann eine TMX-Datei).

Ich habe das Tool jedoch aus einem Grund verlassen, der aus der obigen Frage nicht klar hervorgeht. Ich brauchte den Aligner, um eine Textdatei auszugeben, die hinsichtlich der Anzahl der Zeilenumbrüche genau mit dem Original übereinstimmt. Obwohl LF Aligner ein laufendes Projekt in Textdateien speichert, gab es einige Probleme:

  • Als ich ein Projekt ein zweites Mal öffnete, war ein Teil der Ausrichtung durcheinander. Dies betraf insbesondere die Orte, an denen ich einen leeren Absatz eingefügt habe.
  • Allgemeine Probleme beim Umgang mit leeren Absätzen in Originalsprache und Übersetzung.

Ich werde diesem Beitrag weitere Informationen hinzufügen, wenn ich ein Tool finde, das dazu in der Lage ist.