AWS Redshift konnte beim Einfügen einer gezippten CSV-Datei keine ungültigen oder unvollständigen Deflatierungsdaten erzeugen
641
Cyrus
Ich habe eine gezippte csv-Datei, die Teil einer riesigen Datei ist, und mit dem folgenden Befehl aus der ursprünglichen riesigen Datei extrahiert:
gunzip -c myFile.csv.gz | head -n 500000 > myFile.csv.gz_p1
Nachdem ich die kleinere Datei erstellt habe, muss ich sie in Redshift in eine Tabelle einfügen. Ich erhalte jedoch die folgende Fehlermeldung:
Cause: Failed to inflateinvalid or incomplete deflate data. zlib error code: -3
myFile.csv`.gz`_p1 <- hervorgehobene Stelle, die irgendwo Probleme verursacht? oder doppelt gzippped Daten?
Hannu vor 7 Jahren
0
Ich weiß es nicht, und würden Sie bitte klarstellen, was Sie unter doppelt gzippped Daten verstehen? Gibt es irgendwelche doppelt gezippten Daten?
Cyrus vor 7 Jahren
0
Anscheinend gibt es Probleme, wie Ihre Daten gespeichert werden. `echo TEST | gzip -c | gzip -c | od -t x1z` zeigt das Ergebnis der Komprimierung von "TEST" doppelt (zweimal) an.
Hannu vor 7 Jahren
0
0 Antworten auf die Frage
Verwandte Probleme
-
5
Time Machine Backup auf S3
-
3
Linux-Befehlszeile: Jede Datei wird rekursiv mit einer komprimierten Version überschrieben.
-
7
GZIP-Dateien effizient in bzip2 konvertieren
-
8
Verschieben von Dateien in einem lokalen Netzwerk - würde das Komprimieren die Geschwindigkeit verbe...
-
3
tar.gz programmatisch in einem einzigen Schritt (unter Windows mit 7zip) extrahieren
-
2
Bash-Befehl zum Komprimieren von Ordnern mit einem Kennwort
-
1
Was kann verwendet werden, um in Windows 'gzip'
-
4
Amazon S3 Wiederherstellen der gelöschten Datei
-
2
gzip komprimierte Dateiinhaberschaft und Berechtigungen
-
2
Wie kann ich tar / gzip und dann Verzeichnisse etwas sicher löschen?