wget-Fehler "Konvertieren von Links in" URL "Unvollständige oder ungültige Multibyte-Sequenz gefunden"

687
LoJoe

Ich versuche einem Kollegen auf einem Macbook Air MacOsx 10.11.06 bei der Archivierung einer Website mithilfe von wget (Version 1.19.1) zu helfen, die durch Brew installiert wurde. Verwenden Sie diesen Befehl.

wget --recursive --no-clobber --page-requisites --html-extension --convert-links --restrict-file-names=windows --domain scart.be --warc-file=20161103_scart www.scart.be 

Dies führt jedoch zu einem Fehler im Terminal:

Konvertieren von Links in http://www.scart.be/index.html?q=fr%2Fnode%2F1135.html 35-27 Unvollständige oder ungültige Multibyte-Sequenz gefunden

Ich habe es getestet und es funktioniert gut auf einem Ubuntu-Xenial-Computer (wget Version 1.17.1) und auf einem anderen System, MacOsx 10.11.06. (wget version 1.19.1)

Ich habe versucht, "--restrict-file-names = windows" in "--restrict-file-names = nocontrol" zu ändern, nichts hat sich geändert. Wenn wir versuchen, die .warc-Datei in den Webrecorder-Player zu importieren, wird "keine gefundenen Lesezeichen" angezeigt. Dort werden mit .warc-Dateien gearbeitet, die auf zwei anderen zuvor genannten Computern erstellt wurden. Was ich bisher auf anderen Seiten gefunden habe, ist, dass dieser Fehler mit der Zeichencodierung zusammenhängt und dort steckengeblieben ist.

2
Möglicherweise müssen Sie zuerst die genaue Webseite finden, die das Problem verursacht, um zu sehen, ob einige Zeichen ungültige Kodierungen enthalten. Wiederholt sich Ihr Problem auch mehrmals? Andernfalls könnte es sich um ein vorübergehendes Netzwerkproblem handeln oder sogar um lokal nicht genügend Speicherplatz, um alles herunterzuladen. Patrick Mevzek vor 6 Jahren 0

0 Antworten auf die Frage