Httrack eine Site sichern?

580
Sathya

Ich versuche eine Seite mit httrack zu sichern, aber es tut nicht was ich will.

Es hat bereits 20 Minuten gedauert, und es wurde heruntergeladen, was aus Unsinnbildern und JS-Dateien von anderen Websites stammt. Die Seite, die ich verlinkt habe, war die "Archiv" -Seite, die einen Link zu allen gewünschten Seiten hat. Wenn ich zu dem Ordner navigiere und die Sicherungs-HTML-Datei starte. Ich sehe diese Seite, aber alle Links sind direkte Links zur ursprünglichen Website. Es scheint nicht, dass die Seiten, auf die verlinkt wird, gespeichert werden. (Was hat es in den letzten 20 Minuten getan ...)

Wie kann ich httrack anweisen, auf eine bestimmte Seite zu gehen und alle Seiten dieser Domäne zu sichern, auf die diese Seite verweist?

1
Meinen Sie damit HTTrack (http://www.httrack.com/)? William Jackson vor 13 Jahren 0
@William: Ja, danke, dass du das entdeckt hast! vor 13 Jahren 0
Ich habe noch nie Probleme mit den Standardeinstellungen gehabt. Können Sie die URL auf der Website veröffentlichen, die Sie sichern möchten? William Jackson vor 13 Jahren 0
@William: Ich habe versucht, diese bestimmte Seite http://www.2pstart.com/comic-archives/ zu crawlen. Es wurde nicht versucht, die verknüpften Seiten (in derselben Domäne) abzurufen. Diese Seite wurde mit direkten Links zu den Comics gespeichert und über 40 MB von www.widgetbox.com heruntergeladen, bevor ich sie stoppte. Dies war> 1 Stunde nach dem Scan. vor 13 Jahren 0
Ihr Verzeichnis ist geöffnet, damit ich die Comics bekommen kann. Ich möchte jetzt nur den Text für jeden http://www.2pstart.com/comics/. Ich kann wahrscheinlich einen Bot für den Text in einer Stunde schreiben, aber die Seite würde nicht cool aussehen oder gleich aussehen vor 13 Jahren 0

0 Antworten auf die Frage