Kann HTTrack eine Website ohne Indexseite oder eine Website mit "isolierten" Seiten herunterladen?

9847
brilliant

Kann HTTrack nur Websites mit einer Indexseite herunterladen? Und die Indexseite sollte alle Links zu allen anderen Seiten der Site haben, oder? Oder zumindest müssen alle Seiten der Website irgendwie durch Links miteinander verbunden sein, oder? Wenn also mindestens eine Seite keinen Link enthält und von keiner anderen Seite verlinkt wird, wird diese Art von Seite nicht von HTTrack heruntergeladen, oder?

Ich versuche, eine Website auf einen kostenlosen Host herunterzuladen (tatsächlich handelt es sich nicht um eine Website, sondern um eine Sammlung von Bildern und einigen HTML-Dokumenten, die nicht unbedingt miteinander verbunden sind). Diese Website wird in etwa zwei Wochen geschlossen. Ich muss mich also beeilen, um alle Bilder von dieser Website herunterzuladen. Also habe ich versucht, HTTrack zu versuchen, die gesamte Site herunterzuladen, bekam jedoch eine Nachricht, die folgendes aussagte:

WinHTTrack Website-Kopierer

    • SPIEGELFEHLER! * * HTTrack hat festgestellt, dass der aktuelle Spiegel leer ist. Wenn es ein Update war, wurde der vorherige Spiegel wiederhergestellt. Grund: Die erste Seite (n) wurde entweder nicht gefunden oder es trat ein Verbindungsproblem auf. => Stellen Sie sicher, dass die Website noch vorhanden ist, und / oder überprüfen Sie Ihre Proxy-Einstellungen! <=

Ich verwende Windows XP.

1

1 Antwort auf die Frage

2
Snark

Sie haben Recht, dass solche Tools nur auf Links zwischen den Seiten basieren. Wenn auf eine Seite keine anderen Seiten verweisen, ist diese für HTTrack (und andere "Spider" -Tools) "unsichtbar". Wenn Sie die URLs dieser "nicht verknüpften" Seiten kennen, fügen Sie sie manuell hinzu.

Wenn der Webserver jedoch "Directory Browsing" aktiviert hat, zeigt er auf eine URL, die ein Verzeichnis und keinen Seitennamen enthält, eine Liste aller Dateien im Verzeichnis. Aus Sicherheitsgründen wird sie jedoch selten aktiviert. Wenn kein Seitenname angegeben wird, stellt der Webserver in der Regel eine Standardseite (index.html, index.php, default.html, ...) anstelle des Verzeichnisinhalts bereit.

Danke für die Beantwortung meiner Frage. Nun noch eine Frage: Was ist mit Bildern? Muss ein Bild auch von einer Seite einer Website aus verlinkt werden, oder wenn es nicht von anderen Seiten aus verlinkt wird und nicht von Tinten zur Indexseite zurückverfolgt werden kann, bleibt es auch unsichtbar und wird daher übersehen von HTTrack? brilliant vor 14 Jahren 0
Dies gilt für alle Dateien: Bilder, CSS, ZIP-Dateien, ... Wenn sie nicht verknüpft sind, können sie nicht gefunden werden. Snark vor 14 Jahren 0