Wget - Probleme beim rekursiven Herunterladen mit Authentifizierung

1035
user3738916

Ich versuche also, die gesamte Domain einer privaten Wiki-Seite herunterzuladen. Ich habe die Cookies in einer Datei "cookies.txt" gespeichert und benutze sie mit wget zur Authentifizierung:

wget --load-cookies=cookies.txt --recursive --no-parent --convert-links --backup-converted --adjust-extension --limit-rate=500k https://wiki-to-download

Anschließend wird die gesamte Wiki-Domäne heruntergeladen. Auf den ersten Blick schien es funktioniert zu haben. Ich habe die HTML-Datei der Hauptseite lokal in meinem Browser geöffnet, aber neben der Startseite sind fast alle Links gleich: Die Anmeldeseite ...

Ich vermute, dass es mich einmal authentifiziert hat, um den Download der Homepage zuzulassen. Die Anmeldeinformationen werden jedoch nicht gespeichert, da der Rest der Seiten abgerufen wird, sodass die gefürchtete "Login-erforderliche Seite" für jede Seite heruntergeladen werden muss. Wie kann ich das vermeiden? Mit anderen Worten, wie kann ich sicherstellen, dass jede Datei korrekt heruntergeladen wird, als ob ich die ganze Zeit angemeldet wäre?

1

1 Antwort auf die Frage

3
MartinM

Auf der ersten Seite gibt es wahrscheinlich auch einen Link zum Abmelden, der genau das tut, was er erwartet. Um dies zu vermeiden, verwenden Sie -R (zB -R "* logout *") wie hier angegeben