Wie kann ich eine Teilmenge einer großen (35 MB) .xlsx-Datei öffnen?

1422
David LeBauer

Ich habe Ubuntu 10.04 auf einem Dell Optiplex mit 4 GB Arbeitsspeicher und zwei 3,16 GHz-Prozessoren.

Ich habe eine 35MB-Tabelle erhalten. Es öffnete sich in Gnumeric nach 5 Minuten mit Fehlern, und es wurde auch nicht geöffnet, nachdem ich den "Soffice" -Prozess als höchste Priorität eingestuft hatte (Niceness = -20).

Wie gehe ich am besten mit einer solchen Datei um? Ist es möglich, einen Teil der ersten paar hundert Zeilen zu extrahieren, damit ich das Skript ausarbeiten kann, das ich zum Parsen der gesamten Datei verwenden muss?

aktualisieren:

Die Befehlszeilenfunktion ssconvert BigFile.xlsx BigFile.csverzeugte dieselben Fehler wie Gnumeric (nicht überraschend, da Gnumeric verwendet ssconvert).

1

1 Antwort auf die Frage

1
Aaron Digulla

Wahrscheinlich werden Sie aber einige manuelle Arbeiten benötigen.

xslx-Dateien sind ZIP-Dateien mit XML-Daten. SO entpacken Sie einfach die Datei und werfen Sie einen Blick hinein. Das Format wird von einem gesunden Menschenverstand nicht leicht verstanden, aber es sollte möglich sein, die Blattdateien zu öffnen, nach den RowElementen zu suchen und alles nach den ersten hundert zu entfernen.

Alternativ können Sie versuchen, die Datei mit dem Apache-POI zu öffnen . Geben Sie einfach Java 1 GB RAM und es könnte funktionieren.