Wie lade ich Seiten herunter, die in gewisser Weise mit httrack enden?

397
Ford Smith

Ich habe versucht, bestimmte Seiten herunterzuladen, die mit einem bestimmten Satz enden. Ich habe die Dokumentation durchgesehen und konnte nicht herausfinden, wie. Wenn es einen Weg gibt oder nicht, sagen Sie mir bitte, und wenn ja, wie.

EDIT: Sagen Sie zum Beispiel, ich versuche, diese Websites zu bekommen: example.com/sdfsdfs/awrf235/sdgsdg/important_page.html example.com/sdfsasdasddfs/awrfg235/sdgsdg/important_page.html example.com/sdfsdfsdfs/awrf235g/sdsagsdg/important_page.html

Und es gibt noch 100 von denen, die auf /wichtig_page.html enden, und 1000 weitere nutzlose Dinge. Wie könnte ich die herunterladen, die nur in /wichtig_page.html enden

1
Können Sie weitere Informationen geben? Beschreibe mehr, was du erreichen willst (Beispiel), die Hindernisse und die Dinge, die du bisher versucht hast. Tom Ruh vor 9 Jahren 0
Im Allgemeinen ist dies das Format dessen, was Sie versuchen, "example.com / RANDOM / RANDOM / important_page.html" zu kratzen (dh "example.com" und "important_page.html" sind festgelegt und die anderen Teile des Pfads kann variieren? meatspace vor 9 Jahren 0
Ja das ist genau richtig. Ford Smith vor 9 Jahren 0

1 Antwort auf die Frage

0
Karan

Zum Options / Scan Rules, klicken Sie auf Include Link (s) und fügen Sie dann eine Scan - Regel für den Dateinamen Sie übereinstimmen soll:

1

2
(Das Bild oben zeigt eine hinzugefügte Ausschlussregel, aber die Benutzeroberfläche ist auch für Einschlussregeln gleich.)

Dokumentation für Filter / Scan-Regeln und erweiterte Filter .