Laden Sie mehrere HTML-Seiten aus einer TXT-Datei herunter
439
Rafael
Ich habe eine TXT-Datei mit mehreren Links. Ich muss auf jeden Link in diesem Text zugreifen und jede Seite herunterladen / speichern. Um auf jede Seite zuzugreifen, sind ein Login und ein Passwort erforderlich. Wie kann ich das per Terminal Linux / Shell Script / Python machen? Kann Luchs helfen?
[man wget] (https://www.gnu.org/software/wget/manual/wget.html) Möglicherweise möchten Sie auch die Möglichkeit nutzen, [die Authentifizierung zu übergeben] (https://stackoverflow.com/questions/4272770/). wget-with-authentication)
nnovich-OK vor 7 Jahren
1
Möchten Sie zur Eingabe von Benutzernamen und Kennwörtern aufgefordert werden oder möchten Sie sie in einer anderen Datei speichern, die vom Skript gelesen wird, das die Seiten herunterlädt? Erfordert jede Seite einen eigenen Benutzernamen und ein separates Kennwort oder werden auf allen Seiten derselbe Benutzername und das gleiche Kennwort verwendet? Enthält jede Zeile in der Textdatei nur einen Link ohne weiteren Text oder müssen Sie ein Textdokument durchsuchen, dessen Links mit anderem Text durchsetzt sind?
moonpoint vor 7 Jahren
0
Lieber @moonpoint, danke. Ich möchte sie in einer anderen Datei speichern, die das Skript liest, mit dem die Seiten heruntergeladen werden, und jede Zeile in der Textdatei enthält nur einen Link zu anderem Text. ||| Die Website lässt Sie den Link nicht herunterladen aber wenn ich auf der Seite bin und gebe eine Strg + S oder Strg + P zum Download oder Ausdruck (pdf) der Seite. Also dachte ich, ich würde lynx verwenden, um mich auf der Seite anzumelden und jeden Link in der txt-Datei zu speichern. Denkst du es ist möglich? Hast du bessere Ideen?
Rafael vor 7 Jahren
0
Liebes @ nnovich-OK, danke, aber das habe ich schon probiert. Die Website lässt den Download von wget nicht mit "--user und --password" oder "--user --password --auth-no-challenge" zu.
Rafael vor 7 Jahren
0
0 Antworten auf die Frage
Verwandte Probleme
-
4
Kostenloser HTML Image Map Editor für Windows?
-
9
Wie versende ich E-Mails in Klartext und nicht in HTML in meinem E-Mail-Client?
-
18
Verwendung des Lynx-Webbrowsers
-
4
Google ist zu langsam zum Laden
-
6
Was ist ein guter, einfacher und kostenloser HTML-Editor für Windows?
-
6
So finden Sie den Quellcode für HTML-E-Mails
-
3
Wie kann ich mit Python / AWK / SED ein Inhaltsverzeichnis für ein Markdown-Dokument erstellen?
-
1
So installieren Sie Markdowns Erweiterungen von Python
-
9
Ist Python nur für das Erstellen von Backends bei der Erstellung von Websites?
-
4
Um Python in einer HTML-Datei ähnlich wie PHP auszuführen