Blogelemente als PDF speichern

1361
Rook

Ich kenne FireShot, eine Firefox-Erweiterung, um ganze Seiten mit Bildern zu speichern. Und ich liebe es. Tolle Idee und eine sehr gute Umsetzung.

Leider haben Sie auf solchen Websites oft Links, die auf diese Weise verloren gehen. Ich frage mich also, gibt es eine Möglichkeit, ganze Blog-Posts, Wiki-Posts, StackOverflow-Posts :) auf dieselbe Weise als PDF-Dateien zu speichern, sodass die Links ebenfalls gespeichert werden?

1
Ich denke, das wird eine harte Nuss zu knacken sein :) +1 vor 14 Jahren 0
@Molly - nun, das ist nicht Averageuser.com, oder? :-) Rook vor 14 Jahren 2
Die FireShot- Erweiterung ist nur für Windows verfügbar . Es gibt jedoch Screengrab , das auch auf anderen Systemen funktioniert. Denilson Sá Maia vor 14 Jahren 0
(dang, keine Links zu Kommentaren ...) Die FireShot-Erweiterung ist nur für Windows verfügbar. Es gibt jedoch eine Screengrab-Erweiterung, die auch auf anderen Systemen funktioniert. Denilson Sá Maia vor 14 Jahren 0
@Denilson Sa - Speichert es auch Links? Rook vor 14 Jahren 0

14 Antworten auf die Frage

3
caliban

Wenn das Ziel darin besteht, den gesamten Inhalt und die Links beizubehalten und die Formatierung so wenig wie möglich zu beeinflussen, empfehle ich Evernote .

Ich weiß, es ist keine PDF-Lösung ... aber nachdem ich zwei Jahre lang Webseiten in PDFs und Bildern archiviert und frustriert hatte, entschloss ich mich, mein persönliches Web-Capture-Tool auf Evernote umzustellen.

Probieren Sie es aus, es könnte Ihnen gefallen.

1
nik

Es gibt eine Firefox-Erweiterung namens PDF Download, mit der eine Seite als PDF gespeichert wird (oder per E-Mail an Sie gesendet wird).

  • Die Links für diese Seite wurden beim Versuch gespeichert.
  • Sie müssen jedoch bedenken, dass die Seite als öffentlicher Abruf gespeichert wird,
    was das Tool online ausführt (nicht wie Sie angemeldet sind).
  • Es gibt eine kostenpflichtige Version des PDF Nitro-Tools (von derselben Stelle)
    , die es direkt von Ihrem Schreibtisch aus speichert, und Sie sollten auch die fehlenden Teile erhalten.
    Hab das nicht probiert.
  • Ein weiterer Fehler ist, dass
    das kostenlose Firefox-Addon (zumindest) PDF-Seitengrenzen nicht richtig verarbeitet,
    Sie können dort eine Textzeile verlieren ...
  • Das Nitro-Tool hat eine 14-tägige kostenlose Testversion, wenn Sie das ausprobieren möchten
1
AffineMesh

HTML-to-PDF is a free Windows tool for batch converting webpages to PDF document. It supports clickable links, pages containing JavaScript, live forms, and font embedding.

See: http://sourceforge.net/projects/html-to-pdf/

0
William Hilsum

Ich weiß, dass Sie wahrscheinlich nach einer intelligenten All-in-One-Lösung suchen. In diesem Fall hat vielleicht jemand anderes eine bessere Antwort.

Ich persönlich finde, dass Bullzip PDF Printer sehr gut funktioniert. Es hat grundsätzlich die Fähigkeit, als Drucker zu fungieren, und alles, was zu Papier geht, sollte stattdessen zu ihm gehen.

Viele Seiten haben alternative CSS zum Drucken und sind recht nett. Für die anderen mache ich einen Screenshot, verwende Farbe und Druck (nicht elegant, aber es funktioniert!)

Aber die Links bleiben trotzdem nicht erhalten. Andrew Moore vor 14 Jahren 1
... "was er sagte" :) Rook vor 14 Jahren 0
Das lehrt mich für das Skim Reading :( sorry ... Offizieller Acrobat hat die Fähigkeit, Webseiten zu konvertieren, die Links bleiben erhalten, aber das tatsächlich gerenderte PDF ist nicht so toll. William Hilsum vor 14 Jahren 1
0

Ich dachte an den PDF-Druck selbst, aber das klappt nicht ganz, die Links gehen verloren.

In diesem Fall kopiere / füge ich die gesamte Website in ein Textverarbeitungsprogramm ein und speichere das Dokument. Dies funktioniert gut für die Links, jedoch nicht für das ursprüngliche Seitenlayout.

Ja. Normalerweise speichere ich die Seite als Bild und extrahiere dann die Links aus dem Text, der mich interessiert. Das Problem bei diesem Ansatz ist jedoch: 1. Es ist viel Arbeit, und ich mache das normalerweise nicht gern. 2. Ich vermisse immer ein oder zwei Links und entdecke das zu spät. Rook vor 14 Jahren 0
0
greyDrifter

Um Ihre Frage tangential zu beantworten. Während PDF mit Links umgehen kann, wird die Seite gespeichert, da HTML näher am Original liegt und weniger beeinträchtigt wird. Die meisten Browser enthalten ein Basis-Tag, das sich zum Zitieren von Quellen eignet (und zwangsläufig, wenn sie unvollständige URLs verwenden).

<base href="..." /> 

Da ich bereits von PDF abgewichen bin ... Wenn Sie den Browser Opera verwenden, können Sie die Quelle anzeigen, das Präfix der Trümmer entfernen und den gewünschten Inhalt mit einem Suffix versehen. Übernehmen Sie die Änderungen vor dem Speichern lokal in der Vorschau. Ohne den Rückstand bekomme ich bei der Suche weniger Fehlalarme. (Firefox sollte ein ähnliches Toolkit enthalten.)

Sie sagen, was im Internet geht, ist für immer da ... Versuchen Sie, eine Website von vor einem Jahrzehnt zu besuchen ...

Das stimmt, aber nur für "normale" Seiten. Für Wikipedia zum Beispiel ist das Speichern der Seite als HTML sinnlos, was das Layout angeht. Gleiches gilt für viele Blogs. Sie erhalten den Inhalt, aber in einem solchen Layout, dass Sie keine Lust mehr dazu haben, ihn zu lesen. Was den letzten Kommentar betrifft, kann www.archive.org Spaß machen :) Rook vor 14 Jahren 0
0
dlamblin

Haben Sie das LOOP Add-On ausprobiert ? Es soll URLs (und Dokumente) in PDF konvertieren.

dasselbe Problem, Links nicht erhalten. Es ist im Grunde ein Online-Drucker und -Publisher. vor 14 Jahren 0
0
Chintan

Schauen Sie sich zinepal an . Es ist eher für RSS-Abonnements geeignet, kann jedoch alle Inhalte aus dem Web akzeptieren.

0
RBerteig

Vielleicht möchten Sie einen Blick auf wkhtmltopdf werfen . Es handelt sich hierbei um einen HTML-zu-PDF-Konverter, der auf der Webkit- HTML-Engine basiert und Safari und die meisten anderen OS X-Anwendungen, die HTML anzeigen, sowie den Google Chrome-Browser unter anderen Anwendungen unterstützt. Es ist ein Kommandozeilen-basiertes Dienstprogramm und sollte leicht genug sein, um Anpassungen vorzunehmen und neu zu kompilieren, da Apps auf Basis des Qt-Frameworks erstellt werden können.

Ich kann mich nicht erinnern, was genau mit den Links auf der Seite gemacht wird, aber es macht einen anständigen Job, den Text einschließlich der CSS-Formatierung in ein ziemlich gut aussehendes PDF-Format zu konvertieren.

Und es ist kostenlos ...

Bearbeiten: Auch eine vollständige Kopie von Acrobat hat diese Fähigkeit seit mindestens Acrobat 3 oder 4 (dh lange Zeit). Sie müssen jedoch Voll-Acrobat kaufen, da Reader diese Funktion nicht bietet. Es unterstützt zwei Konvertierungsmodi: Automatisch und Ad-hoc. Im automatischen Modus wird die angegebene URL angezeigt und alles, was von dort aus erreichbar ist, abgerufen. Da dies leicht das Abrufen des gesamten Webs einschließen kann, hat es die Möglichkeit, die Anzahl der Hops zu steuern, die von der ursprünglichen Seite entfernt werden dürfen. Im Ad-hoc-Modus können Sie von Seite zu Seite navigieren. Wenn Sie auf Links klicken, wird die Seite abgerufen, dem wachsenden PDF-Dokument hinzugefügt und die Links werden so geschrieben, dass sie auf die PDF-Datei statt auf das Web verweisen.

Acrobats PDF-Erstellung ist im Allgemeinen die beste Show, außer in diesem Fall. Es behandelt wirklich nicht genug CSS-Spezifikationen, um die Dinge richtig zu machen. Ich hatte oft die besten Ergebnisse, wenn ich das Seitenlayout auf Querformat umstellte, aber selbst dann ist es klobig.

Bearbeiten 2: Ich habe Opera aus der Liste der Benutzer von Webkit entfernt und einen Link zur Webkit-Projektseite hinzugefügt. Danke an Dan Walker für die Korrektur.

Zu Ihrer Information verwendet Opera eine eigene interne Rendering-Engine. Dan Walker vor 14 Jahren 0
0
acripps

Website2pdf sieht so aus, als würde es das tun (zumindest für diese Seite) - nicht kostenlos, aber das wurde in der Frage nicht angegeben :)