Herunterladen von Dateien rekursiv von einer Website mit wget

506
harper

Ich möchte eine Reihe von Dateien von einer Website herunterladen. Die HTML-Dokumente sind mit verlinkt

<a href="https://website.com/path/to/folder/jjxx.70" data-linktype="relative-path">bla</a> 

Nach dem Download der Primärdatei wird der Pfad / zum / Ordner wie erwartet entfernt. Die verbleibende Zeile ist:

<a href="jjxx.70" data-linktype="relative-path">bla</a> 

Wget lädt die referenzierten Dateien jedoch nicht herunter, obwohl ich den Spiegelparameter übergeben habe . Alles was ich bekomme ist:

c:\>wget-1.12 -m -p -E https://website.com/path/to/folder/jjroot ... progress information ... 2018-09-15 18:52:33 (708 KB/s) - `website.com/path/to/folder/jjroot.html' saved [25784/25784]  FINISHED --2018-09-15 18:52:33-- Downloaded: 1 files, 25K in 0.04s (708 KB/s) 
  • Warum lädt wget nur "1 Dateien" herunter?
  • Wie kann ich wget mitteilen, dass es tatsächlich rekursiv herunterladen soll?

Edit : Seit ich gefragt wurde: Die Version des Wget ist 1.12. Ich habe auch wget 1.19.4 mit dem gleichen Ergebnis verwendet.

1
Haben Sie das Wget-Handbuch gelesen? Es gibt einen ganzen Abschnitt über rekursive Downloads. RalfFriedl vor 5 Jahren 1
Teilen Sie zunächst die verwendete Wget-Version. "wget ​​-V". Ich sehe, dass Sie es in Windows verwenden. Sehr oft verwenden die Leute sehr alte Versionen von Wget, bei denen die Hälfte der Lösungen nicht funktioniert. BEARBEITEN: Es scheint, als würden Sie Wget 1.12 verwenden, das ungefähr 6 Jahre alt ist. Das neueste Release ist 1.19.5, das in diesem Jahr veröffentlicht wurde. darnir vor 5 Jahren 0
@darnir Nun, wget-1.12 meldet sich als Version "1.12.1-devel". Das ist keine Überraschung für mich. harper vor 5 Jahren 0

1 Antwort auf die Frage

2
Ahmed Abdelazim

Der Befehl lautet:

wget -r -np -l 1 -A zip http://example.com/download/ 

Optionen, die bedeuten:

-r, --recursive specify recursive download. -np, --no-parent don't ascend to the parent directory. -l, --level=NUMBER maximum recursion depth (inf or 0 for infinite). -A, --accept=LIST comma-separated list of accepted extensions 

Sie können die erforderlichen Erweiterungen mithilfe eines Parameters -A anpassen

Referenz

https://stackoverflow.com/questions/13533217/how-to-download-all-links-to-zip-files-on-a-given-web-page-using-wget-curl 
Das ändert leider nichts. Es lädt immer noch eine Datei herunter. harper vor 5 Jahren 0