Laden Sie mehrere HTML-Seiten aus einer TXT-Datei herunter

408
Rafael

Ich habe eine TXT-Datei mit mehreren Links. Ich muss auf jeden Link in diesem Text zugreifen und jede Seite herunterladen / speichern. Um auf jede Seite zuzugreifen, sind ein Login und ein Passwort erforderlich. Wie kann ich das per Terminal Linux / Shell Script / Python machen? Kann Luchs helfen?

1
[man wget] (https://www.gnu.org/software/wget/manual/wget.html) Möglicherweise möchten Sie auch die Möglichkeit nutzen, [die Authentifizierung zu übergeben] (https://stackoverflow.com/questions/4272770/). wget-with-authentication) nnovich-OK vor 6 Jahren 1
Möchten Sie zur Eingabe von Benutzernamen und Kennwörtern aufgefordert werden oder möchten Sie sie in einer anderen Datei speichern, die vom Skript gelesen wird, das die Seiten herunterlädt? Erfordert jede Seite einen eigenen Benutzernamen und ein separates Kennwort oder werden auf allen Seiten derselbe Benutzername und das gleiche Kennwort verwendet? Enthält jede Zeile in der Textdatei nur einen Link ohne weiteren Text oder müssen Sie ein Textdokument durchsuchen, dessen Links mit anderem Text durchsetzt sind? moonpoint vor 6 Jahren 0
Lieber @moonpoint, danke. Ich möchte sie in einer anderen Datei speichern, die das Skript liest, mit dem die Seiten heruntergeladen werden, und jede Zeile in der Textdatei enthält nur einen Link zu anderem Text. ||| Die Website lässt Sie den Link nicht herunterladen aber wenn ich auf der Seite bin und gebe eine Strg + S oder Strg + P zum Download oder Ausdruck (pdf) der Seite. Also dachte ich, ich würde lynx verwenden, um mich auf der Seite anzumelden und jeden Link in der txt-Datei zu speichern. Denkst du es ist möglich? Hast du bessere Ideen? Rafael vor 6 Jahren 0
Liebes @ nnovich-OK, danke, aber das habe ich schon probiert. Die Website lässt den Download von wget nicht mit "--user und --password" oder "--user --password --auth-no-challenge" zu. Rafael vor 6 Jahren 0

0 Antworten auf die Frage