Seltsames Problem mit hebräischen Vokalen in Microsoft Word

1083
Dave

Ich habe ein Microsoft Word-Dokument mit Hebräisch, und einige der Vokalzeichen scheinen sich von den Buchstaben zu unterscheiden, unter denen sie stehen sollen.

Beispiel:

enter image description here

Mit einem String-Analysator stellte ich fest, dass die Buchstaben, zu denen dies geschah, als "alphabetische Präsentationsformen" und nicht als normale hebräische Buchstaben interpretiert wurden. (Im obigen Beispiel hatte der gepunktete Gimmel einen Unicode-Wert von U + FB32 anstatt von U + 05D2 mit U + 05BC.)

Gibt es eine Möglichkeit, alles in hebräische Standard-Unicode-Zeichen zu konvertieren, damit die Vokale richtig angezeigt werden?

Vielen Dank!

4

3 Antworten auf die Frage

1
matan129

Probieren Sie dieses niqqud- Add-on aus . Vielleicht hat sich etwas mit der Art und Weise, wie Sie das niqqud hinzugefügt haben, verwirrt.

Soweit ich das beurteilen kann, vereinfacht dieses Add-On lediglich das Hinzufügen von Vokalen, ohne jedoch die gesamte Datei auf einmal zu reparieren. Ich habe es mit einer sehr großen Datei zu tun und möchte das Ganze nicht wiederholen. Dave vor 11 Jahren 0
Ich glaube nicht, dass es eine solche Korrektur gibt, aber können Sie die Datei hochladen (oder einen Teil davon, es ist persönlich oder etwas anderes) und mich überprüfen lassen? Hast du auch die Datei geschrieben? Wenn ja, wie haben Sie den ניקוד hinzugefügt? matan129 vor 11 Jahren 0
Es ist eigentlich die Datei einer anderen Person, die ich nicht hochladen darf. Ich weiß nicht, wie der Nikkud hinzugefügt wurde, aber ich vermute, dass es in einer aktuellen Version von Word gemacht wurde, die es auf eine Weise behandelt, die von meinem Word 2003 nicht erkannt wird. Dave vor 11 Jahren 0
Es scheint, dass Suchen / Ersetzen das Problem lösen könnte, aber wenn ich die Unicode-Werte für die beleidigenden Buchstaben in Words "Suchen" -Feld eingebe, wird nicht nur der Buchstabe, sondern auch die darauf folgende Nekudah ausgewählt. Dave vor 11 Jahren 0
Okay, wenn jemand anderes die Datei geschrieben hat, liegt das Problem auf seiner Seite, das heißt, das niqqud-Tool, das er verwendet hatte, hat die Reihenfolge der Buchstaben durcheinander gebracht. Versuchen Sie: * Öffnen der Datei in einer anderen Wortversion * Ändern der Schriftart Können Sie sogar einen sinnlosen Satz aus der Datei hochladen, der aus verschiedenen Wörtern in der Datei besteht? matan129 vor 11 Jahren 0
Ich habe keine andere Version von Word. Das Ändern der Schriftart hilft nicht. [Here] (https://dl.dropboxusercontent.com/u/3563246/temp.doc) ist ein Link zu einem Dokument mit einem Wort aus der Datei, sodass Sie sehen können, was ich meine. Dave vor 11 Jahren 0
Übrigens habe ich festgestellt, dass das "Suchen" -Feld richtig funktioniert, wenn "Diakritiken anpassen" aktiviert ist. Theoretisch könnte dies mit find / replace gelöst werden, aber das wäre ziemlich langweilig ... Dave vor 11 Jahren 0
Interessanterweise wird das Wort unter Word 2010 korrekt angezeigt: [Screenshot] (http://i.imgur.com/U2yoSy3.png). matan129 vor 11 Jahren 0
Ich habe in Word 2003 keine Lösung für dieses Problem gefunden. Möglicherweise ist dies jedoch nur ein Anzeigeproblem, das bedeutet, dass der Druckvorgang in Ordnung ist. Versuchen Sie, sogar 2-3 Zeilen aus dem Dokument zu drucken, um dies zu testen (mehr als ein Wort, um zu prüfen, ob der Zeilenabstand in den Raum des niqqud gerät und ihn verschiebt). matan129 vor 11 Jahren 0
Hmm. Ich frage mich, was passiert, wenn Sie es als wirklich altes Format speichern. Möglicherweise werden die Buchstaben wieder in Standardzeichen konvertiert, damit sie in Word 2003 richtig angezeigt werden können. Dave vor 11 Jahren 0
Es ist nicht nur ein Anzeigeproblem. Es gibt auch ein Problem, dass, wenn ich versuche, die Datei mit einem hebräischen Textverarbeitungsprogramm (Davkawriter) zu öffnen, diese Buchstaben überhaupt nicht erkannt werden. Also muss ich diese Briefe wirklich auf den früheren Standard zurücksetzen. Dave vor 11 Jahren 0
Speichern Sie es als Rich Text Format matan129 vor 11 Jahren 0
RTF hat nicht geholfen. Die Verwendung von Word 2010 zum Speichern als RTF würde möglicherweise etwas bewirken, aber ich bezweifle es. Dave vor 11 Jahren 0
Nun, ich nehme an, dass alle Optionen zur Verfügung stehen, und wenn keine von ihnen funktioniert, denke ich, gibt es keine Lösung (die mir einfällt) :( matan129 vor 11 Jahren 0
OK, Matan. Ich freue mich sehr über Ihre Bemühungen, zu helfen! Dave vor 11 Jahren 0
war froh zu helfen. matan129 vor 11 Jahren 0
0
Jukka K. Korpela

Ihr Testdokument scheint auf Word 2007 ok angezeigt werden, aber wenn ich kopieren und fügen Sie den Text von ihm zu dem BabelPad Editor, wird es angezeigt falsch auf die gleiche Weise wie in Ihrem Bild. Wenn ich den BabelPad-Befehl Convert → Normalization Form → To NFC verwende, wird die Anzeige korrigiert.

Es scheint, dass das Problem nicht mit vorkompositierten Zeichen wie U + FB32 als solchen besteht, sondern in Verbindung mit einer zusätzlichen Kombinationsmarke wie U + 05B7 HEBREW POINT PATAH. Einige Programme können solche Kombinationen nicht verarbeiten, obwohl sie ein vollständig zerlegtes Formular (Basisbuchstabe, gefolgt von zwei Kombinationszeichen) verarbeiten können.

Es ist unmöglich (und wahrscheinlich irrelevant) zu wissen, wie die Zeichenkombinationen in die Datei kamen. Sie sind gültige Unicode-Daten, aber nicht normalisiert, und eine Normalisierung würde vermutlich das Problem beheben. Es scheint, dass Sie hier wirklich alle Unicode-Normalisierungsformen verwenden könnten, aber NFC wird aus allgemeinen Gründen oft bevorzugt.

Soweit ich weiß, verfügt Word über keine Werkzeuge zur Normalisierung, daher müssten Sie externe Werkzeuge dafür verwenden. BabelPad ist für einfachen Text geeignet, aber ich weiß nicht, wie gut es mit großen Dateien umgehen kann, und Sie haben wahrscheinlich einige Formatierungen, die Sie beibehalten müssen. Vielleicht könnten Sie die Datei als HTML speichern, die Daten in Nabel in BabelPad normalisieren und dann die so modifizierte HTML-Datei in Word öffnen. (Ich dachte zuerst an die Verwendung von RTF anstelle von HTML, aber Word scheint RTF zu generieren, das nicht die eigentlichen hebräischen Zeichen enthält, sondern einige Escape-Notationen.)

Danke, aber das geht mir etwas über den Kopf. Ich möchte lieber nicht mit dem Ändern der Dateitypen beginnen, da die Datei stark formatiert ist. Nehmen Sie an, dass die Verwendung von Word "Suchen / Ersetzen" (mit ^ u für Unicode-Ziel) funktionieren würde? Es gibt nur etwa 30 betroffene Charaktere, und wenn Sie sie in ihre einzelnen Komponenten ändern (z. B. U + FB32 bis U + 05D2 und U + 05BC), scheint das Problem zu lösen. Dave vor 11 Jahren 0
Ich habe versucht, eine HTML-Version mit BabelPad zu öffnen, wie Sie vorgeschlagen haben, aber die Option zum Konvertieren in NFC wurde grau dargestellt. Dave vor 11 Jahren 0
Ich habe gerade erkannt, dass die Option verfügbar ist, indem Sie den Text auswählen und das Kontextmenü verwenden. Die Umstellung auf NFC hat leider nicht geholfen. Dave vor 11 Jahren 0
Wenn Sie sagen, dass NFC nicht geholfen hat, bedeutete das, dass das Rendering in BabelPad nicht repariert wurde (in meinem einfachen Test mit Ihren Daten) oder dass das Update nicht in Word übertragen wurde, als die HTML-Datei darin geöffnet wurde (hat es in meinem Test auf Word 2007 gemacht)? Jukka K. Korpela vor 11 Jahren 0
Es scheint, dass Sie die Änderung mithilfe von Suchen und Ersetzen in Word durchführen könnten, dies wird jedoch unangenehm und Sie müssen Zahlen in Dezimal- und nicht in Hexadezimal-Schreibweise verwenden, z. B. `^ u65306` für U + FB32. Jukka K. Korpela vor 11 Jahren 0
0
Zeke

Ich konnte das nicht als Kommentar erhalten, also werde ich es als Antwort einreichen. Basierend auf dem Vorschlag von @Jukka K. Korpela habe ich ein Word-Makro erstellt, das die vorkomponierten Zeichen in 'normale' Zeichen konvertiert. Es kann hier heruntergeladen werden .