Ich gehe davon aus, dass Sie anhand Ihrer Angaben überprüft haben, dass Ihre Dateien tatsächlich 99% der Daten gemeinsam haben, wobei ein zusammenhängender (oder fast zusammenhängender) Unterschied von 1% besteht.
Zuerst sollten Sie tar verwenden, um ein Archiv mit Ihren Dateien darin zu erstellen. Für Tests würde ich eine .tar mit 10 Dateien erstellen, also 300 MB groß sein.
Wenn Sie dann xz verwenden, müssen Sie es so einstellen, dass das Wörterbuch größer ist als die Größe einer Datei. Da Sie nicht sagen, ob Sie Speicherbeschränkungen haben, würde ich mit xz -9 gehen. Es ist sinnlos, nicht den gesamten verfügbaren Speicher zu verwenden.
Ich würde auch das --extreme-Preset verwenden, um zu testen, ob es einen Unterschied macht.
Größe des Wörterbuchs
In einer Dokumentation, die mir zur Verfügung steht - site - heißt es, dass die Größe des Wörterbuchs in etwa der Speicherbelegung des Dekompressors entspricht. Der Parameter -1 bedeutet ein Diktier von 1MiB, -6 bedeutet 10 MiB (oder 8 MiB in einem anderen Teil des gleichen Handbuchs). Deshalb erhalten Sie keinen Vorteil, wenn Sie diese Dateien zusammenfassen. Mit -9 würde der Zerleger (und damit das Wörterbuch) 64 MiB betragen, und ich denke, das war es, was Sie wollten.
Bearbeiten
Eine andere Möglichkeit wäre die Verwendung eines anderen Kompressors. Ich würde mit 7zip gehen, würde aber diese Dateien zuerst tarieren und dann 7zip.
Je nach Inhalt Ihrer Dateien könnten Sie 7zip mit der PPM-D-Methode verwenden (anstelle von LZMA oder LZMA2 ist dies die Standardeinstellung und dieselbe, die von xz verwendet wird).
Nicht gut: Zip (dict = 32kB), Bzip (dict = 900 kB).