Wie kann ich PDF-Dateien in LibreOffice Writer anstelle von Draw öffnen?

5953
einpoklum

Einige Websites bieten die Konvertierung von PDF-Dateien in DOCX- oder ODT-Dateien an. Ich denke, Adobe Acrobat (zumindest die Vollversion) bietet eine Exportfunktion für alle möglichen Formate. Wenn ich in LibreOffice jedoch eine PDF-Datei öffne, wird sie in Draw geöffnet. Nun, Draw ist manchmal gut, nicht immer.

Kann ich also PDF-Dateien irgendwie in einem LO Writer-Dokument öffnen?

Hinweis: Ich bin natürlich an PDFs interessiert, die legitimerweise als Writer-Dokumente wahrgenommen werden können, z. B. aus einem Textverarbeitungsprogramm exportiert wurden. Das Öffnen von Dutzenden Frames, die über die Seite verstreut sind, ist nicht das, wonach ich strebe. Dies kann durch Öffnen in Draw, Kopieren von alles und Einfügen in Writer erreicht werden. Ich möchte den Text in schönen aufeinander folgenden Absätzen, hoffentlich mit konsistenten Stilen (auch wenn sie synthetisiert werden) usw.

3
Offenbar gibt es keine direkte Möglichkeit, ein PDF-Dokument in * Writer * zu öffnen oder es im ODT-Format von * Draw * zu speichern. Es gibt jedoch zahlreiche Tools für die Konvertierung von PDF-Dokumenten in ODT-Dokumente, sowohl online als auch als diskrete Anwendungen. Die Konvertierung ist jedoch immer "iffy", da PDF ein Seitenbeschreibungsformat ist, bei dem die Zeilenumbrüche des Originaldokuments verloren gehen. DrMoishe Pippik vor 6 Jahren 0
@DrMoishePippik: Aber oft ist das PDF die Ausgabe einer Konvertierung / eines Ausdrucks eines _document_, an der Sie dann arbeiten möchten. Siehe meine Bearbeitung der Frage. Schlagen Sie auch vor, ich frage nach SR.SX? einpoklum vor 6 Jahren 0
Die Tatsache, dass Sie LibreOffice verwenden, macht dies möglicherweise mühsam oder unhandlich. Word 2016 kann jedoch PDF-Dateien öffnen und konvertieren sowie Dateien in ODT speichern. music2myear vor 6 Jahren 0
Bei der Konvertierung von ODT nach PDF geht (absichtlich) vieles verloren. Die PDF-Datei kann zum Beispiel alle ursprünglichen CR / LF (Absatzsymbole) verlieren und am Ende von * jeder Zeile Text im PDF-Dokument eigene Zeilenumbrüche einfügen, wie am *, und nicht am Ende von a Absatz. DrMoishe Pippik vor 6 Jahren 0
@DrMoishePippik: Das meiste davon kann ziemlich einfach wiederhergestellt werden, und Online-Tools tun dies. PDFs können auch Metadaten enthalten, so dass praktisch _none_ dieses Materials verloren geht (aber ich bin nicht sicher, was LibreOffice speichert). einpoklum vor 6 Jahren 0
Tatsächlich wird es häufig nicht wiederhergestellt, sondern durch optische Zeichenerkennung (OCR) synthetisiert, wodurch das tatsächliche Absatzformat basierend auf dem Seitenlayout neu erstellt wird. Im Extremfall handelt es sich um ein PDF-Dokument, das keinen Text enthält, sondern nur die * Bilder * des Textes. OCR ist die einzige Möglichkeit, Text aus einer solchen Datei wiederherzustellen. DrMoishe Pippik vor 6 Jahren 0
@DrMoishePippik: Ich akzeptiere die Unterscheidung zwischen Erholung und Synthese. Ich spreche jedoch nicht von gescannten Bildern, für die OCR erforderlich ist. Ich nehme PDF-Dateien, die auf einem Computer erstellt wurden und oft aus MS-Word- oder LO Writer-Dokumenten bestehen. einpoklum vor 6 Jahren 0

1 Antwort auf die Frage

3
fixer1234

LibreOffice verfügt nicht über die systemeigene Funktion zum Öffnen oder Importieren von zufälligen PDF-Dateien in ein Writer-Dokument (und es sind keine Erweiterungen verfügbar, die dies hinzufügen). Wie Sie bereits festgestellt haben, kann es in Draw importiert und dann als ODT gespeichert werden, aber die Ergebnisse lassen zu wünschen übrig. Vor einigen Jahren gab es eine PDF Importer-Erweiterung, die ab Version 4 standardmäßig enthalten war. Jetzt können Sie ein PDF in Draw öffnen und mit hybriden PDFs umgehen.

Wenn Sie das PDF selbst erstellen, können Sie es von Writer als "Hybrid" -PDF exportieren. Dadurch wird eine ODT-Kopie des Dokuments in die PDF-Datei eingebettet. In diesem Fall kann die PDF-Datei in Writer geöffnet und bearbeitet werden, und die gesamte Formatierung bleibt erhalten. Hybrid-PDFs werden hier beschrieben: https://wiki.documentfoundation.org/Faq/Writer/PDF_Hybrid .

Ansonsten gibt es Anwendungen und Webservices von Drittanbietern, die die PDF-Datei in ODT konvertieren, die Sie dann in Writer öffnen können. Hier sind ein paar:

  • Online2PDF, CloudConvert, Zamzar und File-Converter-Online konvertieren alle in und aus PDF für eine Reihe von Formaten, einschließlich ODT.

  • Convertio bietet auch die Möglichkeit, OCR für eine PDF-Bilddatei auszuführen, um das Dokument und die Formatierung wiederherzustellen.

  • Sejda und Smallpdf werden nicht in ODT konvertiert, sie können jedoch in MS Office-Formate konvertiert werden, die von LibreOffice geöffnet und verwendet werden können.

Ich habe nicht alle diese Dienste in Anspruch genommen, und es ist schon lange her, seit ich diese Dienste in Anspruch genommen habe. Daher kann ich Ihnen nicht sagen, wie gut diese Dienste sind. Ich vermute, dass verschiedene Dienste Dokumente mit unterschiedlichen Eigenschaften verbessern können. Daher möchten Sie vielleicht mit verschiedenen Diensten experimentieren, um herauszufinden, welche Aufgabe in Ihrem Dokument am besten funktioniert.

Es gibt auch einige herunterladbare Konvertierungsanwendungen, von denen einige kostenlos sind, andere nur für begrenzte Versionen und einige kostenpflichtig. Ich habe keine verwendet, daher kann ich keine Beratung anbieten, aber die Optionen sind bei einer Google-Suche leicht zu finden.

Sie sagen also, dass der Code hinter diesen Tools proprietär ist oder zumindest nicht Teil der LO-Codebase ist? einpoklum vor 6 Jahren 0
@einpoklum, ich bin mir nicht sicher, warum das keine Funktion ist, wie in MS Office. Soweit ich das beurteilen kann, bietet keine der großen Open Source- und kostenlosen Office-Suiten dies an. WPS Office enthält eine PDF-zu-MS-Office-Konvertierung in seinem Premium-Produkt, nicht jedoch deren kostenlose Version. fixer1234 vor 6 Jahren 0