Speichern Sie die Webseite mit allen zugehörigen Inhalten

324
maazza

Ich versuche herauszufinden, wie ich eine Webseite mit allen zugehörigen Dateien speichern kann, zum Beispiel: http://docs.oasis-open.org/ubl/os-UBL-2.0/xsd/

Ich möchte alle Dateien im Verzeichnis wie ein Crawler speichern, aber mehr und möglichst in Firefox

1

1 Antwort auf die Frage

0
maazza

seltsamerweise wurde die Antwort irgendwie gelöscht.

Hier ist die Antwort:

wget -r -l2 http://docs.oasis-open.org/ubl/os-UBL-2.0/xsd

oder

wget -r -np http://docs.oasis-open.org/ubl/os-UBL-2.0/xsd

Siehe https://www.gnu.org/software/wget/manual/html_node/Directory_002dBased-Limits.html

'-np' '--no-parent' 'no_parent = on'

The simplest, and often very useful way of limiting directories is disallowing retrieval of the links that refer to the hierarchy above 

als das Ausgangsverzeichnis, dh das Aufsteigen in das übergeordnete Verzeichnis / die Verzeichnisse ist nicht zulässig.

The ‘--no-parent’ option (short ‘-np’) is useful in this case. Using it guarantees that you will never leave the existing hierarchy. 

Angenommen, Sie geben Wget aus mit:

wget -r --no-parent http://somehost/~luzer/my-archive/  You may rest assured that none of the references to /~his-girls-homepage/ or /~luzer/all-my-mpegs/ will be followed. Only 

Das Archiv, an dem Sie interessiert sind, wird heruntergeladen. Im Wesentlichen ist '--no-parent' ähnlich zu '-I / ~ luzer / my-archive', nur dass Umleitungen intelligenter gehandhabt werden.

Note that, for HTTP (and HTTPS), the trailing slash is very important to ‘--no-parent’. HTTP has no concept of a “directory”—Wget 

verlässt sich darauf, dass Sie angeben, was ein Verzeichnis ist und was nicht. In ' http: // foo / bar / ' betrachtet Wget 'bar' als Verzeichnis, während in ' http: // foo / bar ' (kein nachstehender Schrägstrich) 'bar' als Dateiname (also '--no-parent' wäre bedeutungslos, da das übergeordnete Element '/' ist.