Warum ist mein .tar.gz größer als die Summe der separat komprimierten Dateien?
Ich habe folgende Situation beobachtet, die für mich etwas unerwartet ist:
Ich habe eine CSV-Datei und eine entsprechende TXT-Datei. Unkomprimiert sind ihre Größen 375 MB und 5 KB.
- Wenn ich die CSV-Datei
gzip
mit Standardeinstellungen komprimiere, wird sie auf 95 MB reduziert. Also zusammen habe ich ~ 95MB. - Wenn ich beide Dateien in einem Tarball
gzip
bündle und sie dann mit den Standardeinstellungen komprimiere, lande ich auf 189 MB.
Soweit ich weiß, sollte das komprimierte Archiv eher kleiner als die komprimierte CSV-Datei + die TXT-Datei sein, da dann gzip
in allen Dateien nach Redundanzen aus dem Archiv gesucht werden kann. Ich weiß, dass dies für meinen speziellen Fall keine Rolle spielt, da die TXT-Datei so klein ist.
Sollte die .tar.gz-Datei jedoch nicht etwa die gleiche Größe wie die komprimierte CSV + TXT-Datei haben? In meinem Fall ist es mehr als doppelt so groß ...
Ich möchte mehrere Schichten Archivierung / Komprimierung vermeiden, aber trotzdem eine gute Komprimierung erreichen. Fehlt mir etwas?
0 Antworten auf die Frage
Verwandte Probleme
-
3
Linux-Befehlszeile: Jede Datei wird rekursiv mit einer komprimierten Version überschrieben.
-
7
GZIP-Dateien effizient in bzip2 konvertieren
-
8
Verschieben von Dateien in einem lokalen Netzwerk - würde das Komprimieren die Geschwindigkeit verbe...
-
3
tar.gz programmatisch in einem einzigen Schritt (unter Windows mit 7zip) extrahieren
-
2
Bash-Befehl zum Komprimieren von Ordnern mit einem Kennwort
-
1
Was kann verwendet werden, um in Windows 'gzip'
-
5
Map "Entar" zu tar xvfz?
-
7
Wie packen Sie eine Datei und behalten die .gz-Datei?
-
2
Auf Solaris losfahren
-
3
Öffnen einer .tar-Datei unter Windows