Konvertieren von LaTeX-generierter PDF-Datei in Word mit Acrobat XI

5454
Jacob Schaer

Ich musste wieder im Land von LaTeX und Microsoft Word leben. Ich habe Acrobat XI zur Verfügung, also dachte ich, ich würde es einfach als mittleren Mann bei der Konvertierung von LaTeX in Word verwenden. Es hat den Anschein, als hätte ich diese Arbeit in der Vergangenheit gehabt, aber jetzt wird nur viel Kauderwelsch produziert.

Der aktuelle Workflow:

  • Schreiben Sie LaTeX in TeXworks (von MikTeX)
  • Setzen Sie den Satz mit der Einstellung "pdfLaTeX + MakeIndex + BibTex"
  • Öffnen Sie die Ausgabe-PDF in Acrobat Pro XI
  • Gehen Sie auf Datei-> Speichern als Sonstiges-> Microsoft Word-> Word-Dokument
  • Deaktivieren Sie in den Einstellungen die Option "Kommentare einschließen" und "OCR ausführen, falls erforderlich".
  • sparen

Alles scheint gut zu gehen, dann öffne ich das Ausgabe-Word-Dokument und der gesamte Text besteht aus zufälligen Symbolen. Interessanterweise scheint die Formatierung absolut perfekt zu sein - Listen sind Listen, Links funktionieren noch, Seitenlayout sieht gut aus - einfach unleserlicher Text. Ich habe geprüft, und Acrobat kann die PDF-Datei einfach durchsuchen. Das Kopieren des Textes in Word (über die Zwischenablage) ist vollkommen in Ordnung. Wenn ich aber "Kopieren mit Formatierung" wähle und in ein Wort einfügen, komme ich wieder zu den Symbolen.

Ich vermute, dies ist nur ein Problem mit Schriftarten. Ich gehe auch davon aus, dass dies ein ziemlich allgemeines Problem ist, das nicht unbedingt für Acrobat von Bedeutung ist. Ich hoffe wirklich, dass dies geklärt wird - das Ausgabe-Word-Dokument muss nicht perfekt sein, es muss nur derselbe Text und ungefähr dieselbe Formatierung verwendet werden. Haben Sie irgendwelche Gedanken zu möglichen Einstellungen in MikTeX, die einen PDF-Acrobat ergeben könnten?

Vielen Dank!

4
Interessant - Ich habe der Vorlage \ RequirePackage hinzugefügt und sie wurde erheblich verbessert. Ich bin mir nicht sicher, was genau das tut, aber ich habe es auf http://tex.stackexchange.com/questions/115080/cannot-copy-text-from-the- gefunden. einfachste-pdf-datei? rq = 1. Es gibt immer noch einige gebrochene Zeichen, obwohl der doppelte Strich ein "X" wird, das "f" ein schickes "+" - Zeichen, die # 2 scheint eine verrückte Wölbung zu haben, und einige Apostrophe sind zu Stars geworden. Mehr Gedanken wären nützlich! Jacob Schaer vor 10 Jahren 0

2 Antworten auf die Frage

0
sceee

Ich habe dieses Problem mit dem Latex-Dokument gelöst

\usepackage[T1] \usepackage 

Die erste Anweisung ermöglicht die T1Codierung von Schriftarten und die zweite ermöglicht die Verwendung moderner Latex-Schriftarten.

Ich hatte sogar (nur) die erste Anweisung die ganze Zeit verwendet (was dieses Problem nicht von selbst gelöst hat), aber durch das Hinzufügen der zweiten Anweisung wurde sie korrigiert, und das aus Acrobat Pro (in meinem Fall X) gespeicherte Word-Dokument wurde korrekt angezeigt.

Weitere Informationen finden Sie in den Antworten unter https://tex.stackexchange.com/questions/115080/cannot-copy-text-from-the-simimest-pdf-file?rq=1 .

-1
asuka4125

3 Möglichkeiten zum Konvertieren von PDF in Word auf dem Mac Schritt 1: Öffnen Sie die PDF-Datei in Adobe Acrobat.

Schritt 2: Klicken Sie in der oberen Navigationsleiste von Adobe Acrobat auf die Option "Datei".

Schritt 3: Klicken Sie auf die Option "Speichern unter".

Schritt 4: Wählen Sie die Option "PDF to Word".

Schritt 5: Geben Sie einen Namen für das Dokument ein. Wählen Sie einen Word-Dateityp (.doc oder .docx) und klicken Sie auf die Schaltfläche "Speichern". Das Dokument wird jetzt als Microsoft Word-Dokument gespeichert.

Hast du die Frage gelesen? Das macht das OP bereits, wenn es als Word gespeichert wird. slhck vor 10 Jahren 1