Das Problem bei PDF ist, dass Text nicht wirklich kodiert wird. Alles was er sagt, sagt so ziemlich "die Glyphen dort und die Glyphen dort hinstellen". Es ist ein Format, das für die Druckvorschau und die Anzeige von Dokumenten mit hoher Wiedergabetreue auf dem Bildschirm gedacht ist, jedoch nicht so sehr, um Semantik oder Inhalte tatsächlich beizubehalten.
Ein PDF-Reader kann also nur erkennen, welche Buchstaben ungefähr in einer Zeile stehen. Leerzeichen kann es nicht als Leerzeichen sehen, da dies in einem PDF nicht enthalten ist. Alles, was es hat, sind kleinere und größere Lücken zwischen den Buchstaben. Und dank Kerning oder begründetem Text sind diese nicht einmal konsistent.
Was PDF-Reader normalerweise tun, ist zu raten, welche Lücken Leerzeichen sind und welche Lücken nicht. Je nach verwendetem Algorithmus sind die Ergebnisse ziemlich gut oder schrecklich.
Das heißt, dass alle PDFs das Problem aufweisen, ist ein bisschen komisch. Foxit kann hier besser abschneiden. Sie können jedoch einen anderen PDF-Reader oder ein Update ausprobieren.