Autor des Dokuments, aus dem ein PDF erstellt wurde?

3726
user1729

Ich unterrichte an einem College, und vor einiger Zeit hatte ich Spaß, Studenten zu entdecken, die die Arbeit anderer Studenten kopierten, indem sie einfach ihre Wortdatei nahmen und die Sätze "paraphrasieren". Schüler A würde also unschuldig seine Akte an Schüler B ausleihen, der böswillig ihre Arbeit kopieren würde. Das Plagiat war leicht zu erkennen, aber ich stellte fest, dass der "Autor" der Word-Datei, die von Student B eingereicht wurde, als Student A aufgeführt wurde (Student B war nur ein Redakteur).

Meine Schüler haben es verstanden. Diesmal haben zwei von ihnen pdfs eingereicht.

Wieder ist das Plagiat leicht zu erkennen. Es wäre jedoch schön, die gleichen harten Beweise wie zuvor zu haben.

Ist es möglich, den Autor einer Datei herauszufinden, aus der ein PDF erstellt wurde?

Ich habe versucht, ExifTool zu verwenden, das Metadaten für ein PDF-Dokument enthält, aber das geht nicht weit genug zurück. Ich erwarte also, dass die Antwort auf meine Frage "nein" ist. Aber es wäre schön, wenn mir das bestätigt würde :-)

2

2 Antworten auf die Frage

0
jredd

Schauen Sie sich PDFParser von Didier Stephens oder ein anderes auf seiner Website erwähntes Werkzeug an und Sie haben vielleicht mehr Glück.

Nach meinem Verständnis wäre der "Autor" entweder in den Metadaten enthalten oder nicht. Innerhalb eines PDF- Dokuments gibt es kein Leerzeichen oder ähnliches, das Sie schnitzen können, aber ich denke, Sie könnten versuchen, die in der Datei enthaltenen Zeichenfolgen zu suchen und nach Erwähnungen eines Namens zu suchen, der nicht im Dokument selbst enthalten ist.

0
Vinayak

Es gibt keine eindeutige Methode, um festzustellen, ob eine Person tatsächlich der Autor des von Ihnen übermittelten Dokuments ist, da das Entfernen von Metadaten aus einem Word-Dokument eine triviale Aufgabe ist.

Persönlich identifizierbare Informationen können mit der Funktion "Dokument prüfen" in Microsoft Word (2007 und höher) leicht entfernt werden.

Wenn Ihre Schüler das Dokument jedoch nicht bearbeitet oder entfernt haben, bevor Sie das Dokument in PDF konvertieren, können Sie den Autor herausfinden, indem Sie das Dokument einfach in Microsoft Reader, Adobe Reader, Foxit Reader usw. öffnen und die zugehörigen Metadaten anzeigen (Datei → Eigenschaften in Adobe Reader)

Um nach Plagiaten zu suchen, können Sie jedoch versuchen, das Dokument in ein HTML- oder Nur-Text-Format zu konvertieren (kopieren Sie den Inhalt einfach in Notepad und speichern Sie ihn als .TXT) und laden Sie ihn auf einen Webserver hoch, den Sie steuern (öffentliche Dateien auf Dropbox funktionieren ebenfalls) ) und geben Sie die URL zum Dokument in Copyscape an .