Wget - Probleme beim rekursiven Herunterladen mit Authentifizierung

Question

Wget - Probleme beim rekursiven Herunterladen mit Authentifizierung

1065

user3738916 2014-08-20 в 20:52

Ich versuche also, die gesamte Domain einer privaten Wiki-Seite herunterzuladen. Ich habe die Cookies in einer Datei "cookies.txt" gespeichert und benutze sie mit wget zur Authentifizierung:

wget --load-cookies=cookies.txt --recursive --no-parent --convert-links --backup-converted --adjust-extension --limit-rate=500k https://wiki-to-download

Anschließend wird die gesamte Wiki-Domäne heruntergeladen. Auf den ersten Blick schien es funktioniert zu haben. Ich habe die HTML-Datei der Hauptseite lokal in meinem Browser geöffnet, aber neben der Startseite sind fast alle Links gleich: Die Anmeldeseite ...

Ich vermute, dass es mich einmal authentifiziert hat, um den Download der Homepage zuzulassen. Die Anmeldeinformationen werden jedoch nicht gespeichert, da der Rest der Seiten abgerufen wird, sodass die gefürchtete "Login-erforderliche Seite" für jede Seite heruntergeladen werden muss. Wie kann ich das vermeiden? Mit anderen Worten, wie kann ich sicherstellen, dass jede Datei korrekt heruntergeladen wird, als ob ich die ganze Zeit angemeldet wäre?

1

1 Antwort auf die Frage

3

Accepted Answer · 2014-09-29 13:33:08

MartinM 2014-09-29 в 13:33

Auf der ersten Seite gibt es wahrscheinlich auch einen Link zum Abmelden, der genau das tut, was er erwartet. Um dies zu vermeiden, verwenden Sie -R (zB -R "* logout *") wie hier angegeben

Wget - Probleme beim rekursiven Herunterladen mit Authentifizierung

1 Antwort auf die Frage

Verwandte Probleme