Ihre Nutzdaten sind weder ASCII- noch UTF-8-codiert. Sie können die Nicht-ASCII-Bits schnell finden:
awk '/[^\x00-\x7F]/{ print NR ":", $0 }' data.csv | less
Sie werden Dinge wie Briarcliffe College�??Patchogue
in einem UTF-8-codierten Terminalemulator sehen, was darauf hindeutet, dass dies keine UTF-8-codierte Datei ist. Und die erste Vermutung der Kodierung? ISO 8859-1, Westeuropäisch. Lass uns testen:
# piping to /dev/null to suppress printing and speed up processing (printing to tty is slow) csvcut -e iso-8859-1 data.csv >/dev/null
Kein Fehler diesmal, voila!