Durchsuchen Sie die archivierte Website

332
dtmland

Ich habe HTML- / Webseiten-Dateien in einem Ordner lokal auf meinem Rechner gespeichert. Ich kann diesen Inhalt gut mit jedem Browser anzeigen. Langfristig möchte ich jedoch, dass der Inhalt in einem Archivformat (ZIP?) Gespeichert wird. Ich könnte dies tun und den Inhalt jedes Mal manuell extrahieren, wenn ich die Seiten anzeigen möchte. Dies hat jedoch mehrere Nachteile.

Wie kann ich HTML- / Webseiten-Dateien innerhalb einer Archivdatei unter folgenden Bedingungen anzeigen:

  1. Der Inhalt muss nicht jedes Mal manuell extrahiert werden

  2. Der Inhalt sollte nicht in dasselbe Verzeichnis wie das Archiv extrahiert werden - er sollte an eine andere Stelle wie ein temporäres Systemverzeichnis gelangen

  3. Sie müssen nicht ALLE Inhalte extrahieren, um nur einige Seiten anzuzeigen. Ich möchte, dass die Lösung nur die Inhalte extrahieren kann, die zum Rendern der aktuell angezeigten Seite erforderlich sind

0
Warum schreiben Sie nicht ein Skript, um dies für Sie zu tun? slybloty vor 10 Jahren 1
@slybloty Warum das Down-Voting? dtmland vor 10 Jahren 1
Das Downvote war nicht ich. slybloty vor 10 Jahren 0
@slybloty Ah, muss ein Feigling gewesen sein. Hat keinen Kommentar hinterlassen dtmland vor 10 Jahren 0
Ich könnte wahrscheinlich mit einem Skript aufwarten, um alles zu erreichen, was von Punkt 3 erwartet wird. Ich bin mir nicht sicher, wie ich das erreichen könnte? Irgendwelche Ideen? dtmland vor 10 Jahren 0
Der einfachste Weg, um Punkt 3 zu erreichen, besteht darin, dass das Skript das Unterverzeichnis extrahiert, in dem sich Ihre Seite befindet, sowie die Bilder und CSS-Verzeichnisse. Dies sollte die meisten der auf einer bestimmten Seite enthaltenen Elemente extrahieren, während die unnötigen extrahierten Dateien reduziert werden. (Upvoted, um den Downvote zu kontern, übrigens) Yitzchak vor 10 Jahren 0

1 Antwort auf die Frage

3
slybloty

Die einzige Möglichkeit, die ich mir vorstellen kann, um Ihre Anforderungen zu erfüllen, besteht darin, ein Skript zu schreiben, das dies tut. Wenn Sie eine Seite aus dem Archiv anzeigen möchten, öffnen Sie sie mit dem Skript.

Auf diese Weise können Sie das Skript folgende Schritte ausführen lassen:

  • Erstellen Sie einen temporären Ordner
  • Lesen Sie die HTMLDatei
  • Nimm alle benötigten Links
  • gehen Sie sie durch und greifen Sie auf die restlichen Links zu
  • Erstellen Sie die Struktur aus dem Archiv
  • Extrahieren Sie die benötigten Dateien (von Links) in die neu erstellte Struktur
  • die Seite anzeigen
  • Entfernen Sie den temporären Ordner, wenn Sie die Seite schließen

Ich weiß, dass dies ein bisschen Arbeit erfordert, aber je nach Verwendung und Notwendigkeit kann es sich lohnen.