Auf der ersten Seite gibt es wahrscheinlich auch einen Link zum Abmelden, der genau das tut, was er erwartet. Um dies zu vermeiden, verwenden Sie -R (zB -R "* logout *") wie hier angegeben
Wget - Probleme beim rekursiven Herunterladen mit Authentifizierung
Ich versuche also, die gesamte Domain einer privaten Wiki-Seite herunterzuladen. Ich habe die Cookies in einer Datei "cookies.txt" gespeichert und benutze sie mit wget zur Authentifizierung:
wget --load-cookies=cookies.txt --recursive --no-parent --convert-links --backup-converted --adjust-extension --limit-rate=500k https://wiki-to-download
Anschließend wird die gesamte Wiki-Domäne heruntergeladen. Auf den ersten Blick schien es funktioniert zu haben. Ich habe die HTML-Datei der Hauptseite lokal in meinem Browser geöffnet, aber neben der Startseite sind fast alle Links gleich: Die Anmeldeseite ...
Ich vermute, dass es mich einmal authentifiziert hat, um den Download der Homepage zuzulassen. Die Anmeldeinformationen werden jedoch nicht gespeichert, da der Rest der Seiten abgerufen wird, sodass die gefürchtete "Login-erforderliche Seite" für jede Seite heruntergeladen werden muss. Wie kann ich das vermeiden? Mit anderen Worten, wie kann ich sicherstellen, dass jede Datei korrekt heruntergeladen wird, als ob ich die ganze Zeit angemeldet wäre?
1 Antwort auf die Frage
Verwandte Probleme
-
3
IE unter Windows 7 speichert keine Dateien auf der Festplatte
-
3
Computer herunterfahren, wenn der Download / Upload beendet ist
-
4
Wo kann ich viele Ziffern von Pi herunterladen?
-
3
Windows-Domänenauthentifizierung mit Firefox
-
4
Konfigurieren Sie das Modem für Bittorrent-Downloads
-
3
Firefox: Warum ist es langsam, wenn ich einige aktive Downloads habe?
-
2
Anrufen, aber keine Seite mit wget herunterladen
-
2
Unterstützt Firefox Platzhalter in NTLM / Negotiate URIs für die automatische Anmeldung?
-
3
Windows-Authentifizierung mit Google Chrome
-
17
Wie kann ich eine URL als Datei herunterladen?