Wget's --convert-links berücksichtigt http gegenüber https

397
jonathanverner

Ich verwende den folgenden Befehl, um eine https-Website zu spiegeln:

wget --directory-prefix=/tmp/mirror --mirror --no-host-directories \ --regex-type pcre --reject-regex "$SKIP_REGEXP" \ --convert-links --adjust-extension --header "Accept-Language: en-US,en" \ --header "X-Build-Mirror: True" -o /tmp/mirror.log https://logic.ff.cuni.cz 

(Eigentlich läuft der Befehl als einzelne Zeile - ich habe ihn zur besseren Lesbarkeit in mehrere Zeilen aufgeteilt.)

Gemäß der Dokumentation der --convert-linksFlagge werden Links zu heruntergeladenen Dateien in relative Links für die lokale Anzeige umgewandelt, und Links zu Dateien, die nicht heruntergeladen wurden (z. B. wegen --reject-regexp), werden in absolute Links konvertiert. Obwohl die Host-URL eine https- URL ist, werden bei der Konvertierung alle absoluten Links zu http- Links.

Ist dies ein Fehler wgetoder gibt es eine Möglichkeit, den Protokolltyp zu respektieren? (Ich weiß, dass ich das --https-only Flag verwenden kann, aber dies würde verhindern, dass eine http-Ressource abgerufen wird.)

2
Dies ist fast definitiv ein Fehler in Wget. Ich werde in Ihrem Namen einen Fehlerbericht öffnen. darnir vor 5 Jahren 0

0 Antworten auf die Frage