Text aus einer PDF-Datei kann nicht kopiert werden

119149
Jonno_FTW

Ich verwende den foxit PDF-Reader zum Anzeigen meines Lehrbuchs. Ich möchte den Text aus der PDF-Datei in ein Word-Dokument kopieren, aber das lässt mich nicht. Ich kann den Text fein auswählen, aber die Option zum Kopieren von Text ist nicht verfügbar. Ich kann Text von anderen Dokumenten kopieren, aber nicht von einigen. Gibt es eine Möglichkeit, diesen Schutz in Fenstern zu umgehen?

36
Ich sehe, dass meine Antwort für Sie nicht funktioniert, also haben Sie eine Prämie gepostet. Wenn Sie irgendwo ein Beispiel für ein solches PDF posten, werde ich es mir ansehen. harrymc vor 11 Jahren 0
@ harrymc: Konkret wollte ich die Werte aus Tabelle 6.15 von http://acousticslab.org/papers/VassilakisP2001Dissertation.pdf kopieren endolith vor 11 Jahren 0
@ Endolith: Siehe meine neue Antwort. harrymc vor 11 Jahren 0

9 Antworten auf die Frage

28
harrymc

Die PDF-Datei wurde wahrscheinlich gegen das Kopieren von Text gesperrt. Es gibt zwei Möglichkeiten, um es zu entsperren:

  1. Wenn das PDF-Dokument nicht für den Druck gesperrt wurde, können Sie es auf einem virtuellen PDF-Drucker ausdrucken, um eine entsperrte Datei zu erstellen. Siehe dies:
    "Entfernen Sie das Kennwort und entsperren Sie die geschützte PDF-Datei, die gedruckt werden darf, ohne ein Geheimnis zu kennen" .
  2. Wenn die Druckfunktion gesperrt ist, finden
    Sie folgende Informationen : "Einschränkungen entfernen und kennwortgeschützte PDF-Dateien mit PDF Unlocker entschlüsseln" .
Sie können sehen, ob die PDF-Datei zum Kopieren gesperrt ist. Wählen Sie im Menü Datei die Option Eigenschaften und auf der Registerkarte Sicherheit wird angegeben, ob das Kopieren von Inhalten zulässig ist. Rob Sedgwick vor 8 Jahren 0
23
Khaleel
  1. Open the PDF in Google Chrome(drag and drop PDF file to Chrome).
  2. Print the particular page as PDF or just open print preview.
  3. Now you can copy the text from print preview or output PDF. But I don't think you could copy the table directly.
https://docs.google.com/open?id=0B0U0hneaP_FcYWprOFpEbTVqdkk Sehen Sie mein Ergebnis. Khaleel vor 11 Jahren 1
Das funktioniert auch für mich. Dies ist die einfachste Methode, die ich hier sehe. endolith vor 11 Jahren 3
Absolut brilliant. Oh, Sie können Dateien in die Tab-Leiste von Chrome ziehen, um sie übrigens schnell zu öffnen. iono vor 11 Jahren 2
Keine dieser Methoden hat in Chrome 53 für mich funktioniert. Wurde die Lücke möglicherweise geschlossen? Simon East vor 7 Jahren 0
10
Michael Hampton

Ich konnte eine DRM-freie Version Ihrer PDF-Datei mit Ghostscript (das für Windows verfügbar ist) erstellen .

gs -q -dNOPAUSE -dBATCH -sDEVICE=pdfwrite -sOutputFile=stripped.pdf VassilakisP2001Dissertation.pdf 

Die resultierende Datei stripped.pdfkann in Adobe Reader geladen werden. Mit dem Reader können Sie beliebig Teile davon kopieren. Es behält auch den größten Teil der Formatierung der Tabelle bei.

Das ist brilliant. Mein Steuerberater gibt mir keine DRM-PDFs oder das Kennwort zum Entfernen von DRM zurück. Das löst mein Problem. Ausgezeichnete Arbeit! kevinarpe vor 10 Jahren 0
Wenn die PDF-Datei ein Kennwort enthält, stellen Sie sicher, dass der Schalter "-sPDFPassword" ("-sPDFPassword = Kennwort") enthalten ist. palswim vor 6 Jahren 0
2
Michael Hampton

Ich konnte die Tabelle mit Okular (für Linux; Teil von KDE) erfolgreich aus Ihrer PDF-Datei kopieren. Dazu musste ich in Okulars Einstellungen gehen und die Option "Obey DRM restrictions" deaktivieren.

Ich bin mir bewusst, dass dies Ihnen nicht wirklich hilft, seit Sie Windows ausführen, aber es ist eine Möglichkeit, wenn Sie eine Linux-Maschine zur Hand haben oder bereit sind, sie zu installieren.

Leider war dies nur Text ohne Formatierung, aber es scheint nicht zu schwierig zu sein, die Tabelle neu zu erstellen. Sie können die Ergebnisse meines Copy & Paste-Abenteuers hier sehen .

Dafür gibt es VirtualBox. : DI kann den Klartext auch ohne Formatierung kopieren, aber durch Auswahl einer Spalte ist der Export ziemlich einfach. endolith vor 11 Jahren 0
Sieht so aus, als wäre dies am besten für Zahlentabellen geeignet, da Sie mit Okular eine rechteckige Auswahl von Text vornehmen und eine einzelne Spalte nacheinander extrahieren können. endolith vor 11 Jahren 0
Für einzelne Spalten wahrscheinlich so. Für die gesamte Tabelle siehe [meine andere Antwort] (http://superuser.com/a/449293/144961). Michael Hampton vor 11 Jahren 0
Beachten Sie, dass Okular * unter Windows laufen kann. Tatsächlich können * viele * KDE-Software unter Windows laufen (http://windows.kde.org/). Bakuriu vor 10 Jahren 0
1
David

Sie können GT Text verwenden, ein Programm, das Bilder (auch PDF-Momentaufnahmen = Bilder) in Text umwandelt. Sie können den Bereich auswählen und in die Zwischenablage kopieren. Es ist kostenlos

Die offizielle Homepage ist http://gttext.googlecode.com

0
endolith

Wenn Sie nur nach kurzen Ausschnitten suchen, können Sie oft ein paar Wörter in Google-Anführungszeichen eingeben und das genaue Zitat finden, das bereits in einem anderen Format gescannt oder von einer anderen Person eingegeben wurde.

Eine weitere Option ist "Dokument von Foto" in der Android-App von Google Text & Tabellen, bei der der Text durch OCR übertragen wird. Dies ist natürlich fehleranfällig.

Ich wünschte, PDF-Sperrfunktionen gäbe es nie. :(

0
harrymc

Answer to endolith:

Your PDF is protected against copying, but is not protected against printing.

So I have printed the one page containing table 6.15 into another PDF that is not protected against copying, selected and copied the table, then pasted it into Word. To my great surprise the result of the paste was utter rubbish.

I have now taken a further look at this table and found a very surprising result : This is not a table !

It is actually a montage of small pieces of text, positioned on the page so as to look like a table. But this is not a real table.

The best you can do is either rewrite the whole thing as a table, or just use in your work a screenshot of this table-like assembled text.

Here is my screenshot of the table, as taken from my generated one-page pdf document :

image

Ich habe versucht, es mit 2 Programmen zu drucken, aber alles, was ich bekam, war eine leere Seite. endolith vor 11 Jahren 0
Mit [Foxit Reader] (http://www.foxitsoftware.com/Secure_PDF_Reader/) positionierte ich mich auf der Seite und druckte die aktuelle Seite auf einen PDF-Drucker (ich verwendete [Cute Pdf Writer] (http: // www .cutepdf.com / products / cutepdf / writer.asp)). Ich werde versuchen, das Problem beim Kopieren der Tabelle heute Abend zu analysieren. harrymc vor 11 Jahren 0
Ich habe PrimoPDF und qvPDF (die GhostScript verwenden) ausprobiert endolith vor 11 Jahren 0
Siehe meine obige Ergänzung. harrymc vor 11 Jahren 0
... Ich habe auch meine einseitige PDF-Datei [hier] (http://depositfiles.com/files/uy697if76) hochgeladen (60 Sekunden Wartezeit). harrymc vor 11 Jahren 0
0
endolith

Eine andere Möglichkeit ist Evince .

In Windows scheint das Kopieren standardmäßig zu unterstützen.

In Linux kann das Kopieren aktiviert werden, indem die override_restrictionsEinstellung überprüft wird, falls noch nicht geschehen. Befolgen Sie diese Anweisungen ( dconf-editor/org/gnome/evinceoverride_restrictions).

0
Rob Sedgwick

Dies gelang es, grundlegenden Text zu konvertieren. Es hat jedoch mit Tischen zu kämpfen.

http://www.onlineocr.net/documents