Skripte, die wget --page-Requisites erweitern?

1677
Pekka 웃

Ich habe heute eine sehr ähnliche Frage gestellt, möchte aber noch einmal mit einem Wget / Linux-Fokus fragen. Ich hoffe das ist in Ordnung.

Ich muss Offline-Kopien von Webseiten programmgesteuert auf einem LAMP-Stack erstellen, vorzugsweise mit PHP. Ich brauche den HTML-Quellcode, angehängte Bilder und CSS-Stylesheets.

Ich kann Dinge auf der Kommandozeile ausführen, aber keine neuen Pakete installieren.

Ich kann eine wget --page-requisitesauf den Seiten machen, die ich archivieren möchte. Dies lädt alles herunter, was ich brauche, aber die heruntergeladenen HTML- und CSS-Dateien werden nicht so geändert, dass sie auf die archivierten Dateien zeigen.

Ich suche nach einem Erweiterungs- / Perl-Skript / Shell-Skript, das die heruntergeladenen Dokumente so ändert, dass sie auf die heruntergeladenen Ressourcen verweisen, oder möglicherweise eine andere, Linux-basierte Lösung, die dies tut. Ich habe bereits geprüft, httrackscheint nicht auf dem Server installiert zu sein ("whereis httrack" gibt nichts zurück).

2

1 Antwort auf die Frage

9
Phil

Versuchen Sie die --convert-linksOption:

Nachdem der Download abgeschlossen ist, konvertieren Sie die Links im Dokument, um sie für die lokale Anzeige geeignet zu machen. Dies betrifft nicht nur die sichtbaren Hyperlinks, sondern alle Teile des Dokuments, die mit externen Inhalten verknüpft sind, z. B. eingebettete Bilder, Links zu Stylesheets, Hyperlinks zu Nicht-HTML-Inhalten usw.

Wie könnte ich das übersehen? Ich werde es ausprobieren und berichten. Pekka 웃 vor 14 Jahren 0