Wget's --convert-links berücksichtigt http gegenüber https
Ich verwende den folgenden Befehl, um eine https-Website zu spiegeln:
wget --directory-prefix=/tmp/mirror --mirror --no-host-directories \ --regex-type pcre --reject-regex "$SKIP_REGEXP" \ --convert-links --adjust-extension --header "Accept-Language: en-US,en" \ --header "X-Build-Mirror: True" -o /tmp/mirror.log https://logic.ff.cuni.cz
(Eigentlich läuft der Befehl als einzelne Zeile - ich habe ihn zur besseren Lesbarkeit in mehrere Zeilen aufgeteilt.)
Gemäß der Dokumentation der --convert-links
Flagge werden Links zu heruntergeladenen Dateien in relative Links für die lokale Anzeige umgewandelt, und Links zu Dateien, die nicht heruntergeladen wurden (z. B. wegen --reject-regexp
), werden in absolute Links konvertiert. Obwohl die Host-URL eine https- URL ist, werden bei der Konvertierung alle absoluten Links zu http- Links.
Ist dies ein Fehler wget
oder gibt es eine Möglichkeit, den Protokolltyp zu respektieren? (Ich weiß, dass ich das --https-only
Flag verwenden kann, aber dies würde verhindern, dass eine http-Ressource abgerufen wird.)
0 Antworten auf die Frage
Verwandte Probleme
-
9
Erzwingen Sie eine Webadresse, um HTTPS zu durchlaufen
-
2
Anrufen, aber keine Seite mit wget herunterladen
-
5
Wie kann ich meinem Browser die Passwörter für sichere Websites merken?
-
1
wget und cookies.txt - domain.tld vs. .domain.tld
-
2
Ich kann nicht auf https-Seiten zugreifen = (
-
1
Was sind die Lösungen für die Herausforderung von Ha.ckers.org?
-
1
Was bewirkt, dass die Adressleiste in IE grün wird?
-
17
So laden Sie Dateien von der Befehlszeile in Windows herunter, z. B. wget oder curl
-
15
So ermitteln Sie die tatsächliche Download-URL auf Download-Websites, die Weiterleitungen verwenden
-
9
Wie deaktiviere ich die Warnung, die Chrome gibt, wenn ein Sicherheitszertifikat nicht vertrauenswür...