Wget - Schwierigkeit ohne Domänen und Verzeichnisse

667
Ray Woodcock

Ich verwende Wget in Windows 7. Ich glaube, das beschränkt mich auf Wget 1.11.4.

Für alle, die sich für Details interessieren, habe ich eine Beispieldatei für Wgetrc veröffentlicht . Dieses Beispiel ist das, das ich gerade verwende. Mein Wget-Befehl lautet wie folgt:

wget 2> "I:\Current\Wget\wgeterr.log" 

Ich habe Probleme mit den Optionen, die einschränken sollen, was heruntergeladen wird. Wie am Ende von wgetrc (oben) beschrieben, scheinen einige dieser Einschränkungen nicht zu funktionieren.

Ich glaube insbesondere, dass ich mit exclude_domains richtig angeben kann, dass ich twitter.com nicht als Download auf der gleichen Ebene wie die heruntergeladene Website (dh raywoodcockbio.wordpress.com) verwenden möchte. . Trotzdem bekomme ich twitter.com.

Die Frage ist, wie kann ich verhindern, dass twitter.com (auch Facebook und andere Social-Media-Site-Ordner) in meinen Download einbezogen werden?

2

1 Antwort auf die Frage

0
stderr

Schauen Sie sich den Parameter exclude_directoriesoder -Xvon wget an . Die -XOption Angabe ist eine Liste der vom Download ausgeschlossenen Verzeichnisse. Wenn Sie beispielsweise nicht möchten, dass Wget Objekte aus dem /foo-barVerzeichnis herunterlädt, geben Sie dies -X /foo-barin der Befehlszeile an.

Aus irgendeinem Grund kann dies die Erstellung von twitter.com und www.facebook.com nicht verhindern, unabhängig davon, ob ich zum Beispiel twitter.com oder /twitter.com ausschließe. Der Ordner twitter.com wird auf oberster Ebene erstellt, dh auf derselben Verzeichnisebene wie der gewünschte Downloadordner. Es schlägt auch fehl, wenn ich twitter.com oder /twitter.com mit exclude_directories in wgetrc spezifiziere. Ray Woodcock vor 10 Jahren 0