So rufen Sie alle * .html-Dateien mithilfe von Unix-Befehlszeilentools und regulären Ausdrücken von der Website ab
1378
Ich möchte alle .html-Dateien von einer Website abrufen, deren Name einen bestimmten Text enthält:
z.B. this_is_good_site.html
Ich möchte also .html-Dateien mit einem Wort "good" auf den Namen herunterladen. Ich habe versucht, Wget und Curl, aber ich verstand nicht, wie ich diese Dateien mit einem regulären Ausdruck auswählen kann? Gibt es eine Python- oder Perl-Lösung, wenn Befehlszeilentools unter Unix das nicht können?
Probieren Sie den HTTrack Website-Kopierer oder ein ähnliches Programm aus, besser als die Befehlszeile. Laden Sie alle Dateien in ein Verzeichnis herunter, sortieren Sie sie nach .html. Kopieren Sie sie und fügen Sie sie an einer anderen Stelle ein