Warum sind Craigslist-Posts voller Fragezeichen?

3964
John Fouhy

In meiner Stadt gibt es keine Craigslist-Präsenz, aber ich stöbere manchmal nach dem "Besten", weil es lustig oder interessant ist.

Warum sind einige Posts voller Fragezeichen? Es sieht so aus, als ob alle Satzzeichen außer Kommas und Punkte durch -Symbole ersetzt werden.

Beispiel

Firefox 3 für Macbook Pro.

7

2 Antworten auf die Frage

19
hyperslug

Dies geschieht häufig, wenn Sie aus einem Programm, das eine eigene Codepage oder einen eigenen Zeichensatz verwendet, Ausschneiden und Einfügen ausführen. Das lokale Programm sieht sie als Apostrophe an. Da es sich jedoch um ein nicht standardmäßiges Zeichen handelt, hat es keine Bedeutung für den Renderer. Daher wird standardmäßig nur das schwarze Fragezeichen / Fragezeichen verwendet.

Obligatorisches Joelonsoftware-Foto:

Alt-Text

Weitere Informationen zu Unicode: http://www.joelonsoftware.com/articles/Unicode.html

15
Joel Spolsky

Hier ein Beispiel von Craigslist.

Diese Seite ist mit der ISO-8859-1-Kodierung codiert. Der Webserver meldet jedoch, dass sich die Seite in UTF-8 befindet, indem er den folgenden Header sendet:

Inhaltstyp: Text / HTML; Zeichensatz = utf-8

Dies ist ein Fehler in Craigslist. Es ist anzunehmen, dass die Craigslist-Programmierer nicht das absolute Minimum kennen, das funktionierende Programmierer über Unicode wissen sollten .

Diese geschweiften Apostrophe werden in ISO-8859-1 mit Bytes codiert, die in UTF-8 nicht gültig wären. So erscheinen sie wie <?>in Firefox und Quadrate im IE.

Um das Problem beim Anzeigen der Seite zu beheben, gehen Sie zum Menü Ansicht und wählen Sie Zeichencodierung> Western (ISO-8859-1), um dem Browser mitzuteilen, in welcher Kodierung sich die Seite wirklich befindet.

Wir müssen anfangen, dich Kibo zu nennen. Richard Hoskins vor 15 Jahren 0
Diese Seite ist tatsächlich in Windows-1252 kodiert. ISO 8859-1 enthält nicht einmal geschweifte Zitate. Wenn Sie jedoch in Firefox ISO-8859-1 wählen, werden Bytes im Bereich 80-9F (nicht definiert in ISO-8859-1) als entsprechende Windows-1252-Grafik angezeigt. mark4o vor 15 Jahren 4
Danke, oh Microsoft, dass Sie uns lockige Zitate gegeben haben, die unsere Cut-n-Pasten durcheinander bringen, für inkonsistente Codepages, für ... oh, ich gebe auf. quack quixote vor 15 Jahren 2