Wie kann ich die von mir referenzierten Seiten als HTML-Dateien herunterladen?

2099
void

Ich habe viele Lesezeichen (Gitarrenakkorde der Lieder), die in Google Chrome gespeichert sind, und auch ein schönes Programm namens XMarks. Es funktioniert großartig, aber ein Problem besteht darin, dass einige der alten Webseiten gelöscht werden . Daher möchte ich eine lokale Kopie speichern von ihnen. Und ich will es nicht

for(i=0; i<infinity; i++) { open page; right click; save page; etc; } 

Gibt es eine Software- oder Browsererweiterung, mit der ich alle Bookmark-Seiten herunterladen kann?

(ein PHP-Skript oder ähnliches könnte auch funktionieren, ich möchte nur die Dateien, und ich möchte es regelmäßig tun können) Vielen Dank für jede Hilfe!

Bearbeiten: Und ich möchte auch die Ordnerstruktur als Lesezeichenordner beibehalten.

Edit 2:: Ich versuche nicht, meine Lesezeichen zu exportieren. Ich versuche, jede Seite zu speichern, auf die von meinen Lesezeichen verwiesen wird (danke für die Bearbeitung des Titels). Ich brauche ein Programm, das alle meine Lesezeichen öffnet, Strg + S drückt und es speichert (hoffentlich mit derselben Ordnerstruktur wie meine Lesezeichen) ). siehe meinen kleinen Code-Witz oben :)

Edit 3: "Danke für jede Hilfe!" bedeutet, dass ich keine Antworten nach unten stelle, da die Absicht besteht, zu helfen.

4

2 Antworten auf die Frage

6
Sparr

Exportieren Sie Ihre Lesezeichenliste als HTML und laden Sie dann jede Seite, auf die verwiesen wird, sowie alle für die Anzeige dieser Seiten erforderlichen Bilder und Skripts mit wget herunter:

wget --recursive --level 1 --page-requisites --convert-links --force-html --input-file bookmarks_7_7_14.html 

--level 1 beschränkt das rekursive Herunterladen auf einen einzigen Link von Ihrer Lesezeichen-Seite zu der mit Lesezeichen versehenen Website.

--page-requisites bedeutet, die für die Anzeige jeder Seite erforderlichen Dateien herunterzuladen (Bilder, Stile, Javascript usw.).

--convert-links ändert die Links in relative, die lokal funktionieren, wenn die Dateien heruntergeladen werden (Bilder usw.), und ändert die Links in absolute (Links zu anderen Seiten), wenn dies nicht der Fall ist.

--force-html wget wird angegeben, dass die Eingabedatei als HTML-Seite und nicht als Liste von URLs behandelt wird.

Wenn Sie dies wiederholt wiederholen, müssen Sie einige Vorkehrungen treffen, um zu vermeiden, dass alte Downloads mit neuen Downloads überschrieben werden.

HINWEIS: Dies lädt nur die Seite, die Sie mit einem Lesezeichen versehen haben, und keine anderen Seiten auf derselben Site. Komplexere Lösungen wären erforderlich, wenn Sie einige oder alle Zielseiten spiegeln möchten, und komplexere Lösungen, wenn Sie sich darüber im Klaren sein möchten, welche davon wie oft gespiegelt werden.

und wo soll ich diesen Befehl ausführen? in der Eingabeaufforderung? Kann ich daraus einen PHP-Code machen? Denn dafür brauche ich wirklich einen "automatischen" Weg. Da ändert sich meine Lesezeichenliste ständig. void vor 11 Jahren 0
Ja. wget ist für die meisten Betriebssysteme verfügbar und es ist ein Befehlszeilenprogramm. Sparr vor 11 Jahren 0
@void Sie könnten einfach exec ('wget ...') in php machen, wenn Sie wget weiterhin verwenden möchten. Sie müssen wahrscheinlich etwas tun, um sicherzustellen, dass die heruntergeladenen Dateien in ein beschreibbares Verzeichnis usw. verschoben werden. Sparr vor 11 Jahren 0
Anstelle von PHP würde ich empfehlen, einen Scheduled Task (Windows) oder Cron-Job (Linux, OSX) oder Launchd (OSX) zu erstellen, der den Befehl Wget nach einem Zeitplan ausführt. Sparr vor 11 Jahren 0
Oh. Ich habe deinen Code nicht gelesen. Es nimmt bookmarkfile.html als Eingabe. so ist es wahrscheinlich, was ich suche. Vielen Dank ! void vor 11 Jahren 0
Ein einfacher Weg, um wget für Windows zu erhalten, ist das Toolkit [GOW] (https://github.com/bmatzelle/gow), obwohl es auch eigenständige Distributionen von wget gibt Journeyman Geek vor 11 Jahren 0
@Sparr, nochmals vielen Dank. Ich musste plötzlich gehen, jetzt bin ich zurück, ich werde versuchen, in Windows 'cmd. Aber ich frage mich, wird dies die Ordnerstruktur beibehalten? Gibt es irgendwelche Gründe, um dies zu erreichen? void vor 11 Jahren 0
@JourneymanGeek: GOW enthält wget 1.11.4, was sehr alt ist. Warum sich die Mühe machen, wenn wget 1.14 seit Monaten verfügbar ist? Karan vor 11 Jahren 0
vor allem die Benutzerfreundlichkeit. Ich habe gow auf den meisten meiner Systeme installiert, einfach weil es eine Reihe von Nix-Stil-Tools für den Pfad installiert, so dass sie ähnlich funktionieren wie unter Linux Journeyman Geek vor 11 Jahren 0
1
JackLock

Wenn Sie einige Seiten der aktuellen Website herunterladen möchten, benötigen Sie ein Werkzeug zum Kopieren einer Website. Ein kostenloses Tool, das ich häufig verwende, ist httrack

Aber wenn Sie Google finden, werden Sie wahrscheinlich eine Anzahl von Tools finden, die ähnliche Dinge tun ... Einige sind kostenlos, einige werden bezahlt.