Httrack anweisen, index.html nicht an Links anzuhängen

1899
marlar

Beim Spiegeln einer Site mit einem Link wie www.example.com/some/where/httracks ändert sich diese www.example.com/some/where/index.htmlin der lokalen Kopie.

Gibt es eine Möglichkeit, die angehängte index.html zu vermeiden?

PS. Ich bin mir bewusst, dass die index.html für das lokale Durchsuchen der Site benötigt wird, aber der Spiegel wird die Site auf dem Server ersetzen. Es handelt sich dabei um eine datenbankgestützte Website, die durch eine statische Version ersetzt wird, da sie nicht mehr aktualisiert wird. Ich möchte jedoch, dass es mit einer Momentaufnahme der ursprünglichen Website identisch ist.

Wenn dies nicht möglich ist, muss ich sed verwenden, um die Teile von index.html zu entfernen.

1

1 Antwort auf die Frage

1
marlar

Ich endete mit sed:

find . -name '*.html' -exec sed -i 's%index.html%%g' {} \; 

Es findet alle Dateien, die mit .html im aktuellen Unterverzeichnis enden, und führt einen sed-Befehl aus, der alle Vorkommen von index.html durch nichts ersetzt, d. H. löscht es.

Könnten Sie erklären, was Ihr Code macht? Tom Wijsman vor 13 Jahren 0
Es findet alle Dateien, die mit .html im aktuellen Unterverzeichnis enden, und führt einen sed-Befehl aus, der alle Vorkommen von index.html durch nichts ersetzt, d. H. löscht es. marlar vor 13 Jahren 0