Wie nahe bei 1: 1 ist die SVN-Serverspeicher-Nutzung im Vergleich zur herabgesetzten Inhaltsgröße?

352
Enigma

Angenommen, ich habe 100 GB Inhalt von einem VisualSVN-Server heruntergezogen. Kann ich Rückschlüsse auf den Speicherplatz ziehen, der auf dem Server selbst zum Speichern dieses Inhalts verwendet wird?

Wenn alles komprimiert ist, würde ich mir vorstellen, dass es etwas weniger als 100 GB braucht.

Wenn es eine enorme Anzahl von Protokollen gibt oder was nicht, würde dies theoretisch die Größe erhöhen.

Wie kann ich die verwendete Speichermenge des Servers zuverlässig bestimmen?

1

1 Antwort auf die Frage

2
Mokubai

Zuverlässig? Keine Chance.

Svn verwendet ähnliche Techniken, diffum die Größe einzelner Commits zu reduzieren. Dateien werden effektiv zu einer "Basis" -Datei komprimiert und die Additionen und Subtraktionen dieser Datei werden komprimiert. Dies funktioniert anscheinend sogar für Binärdateien

Das Problem ist jedoch, dass Sie nicht alle dieser Zwischen-Blobs herunterziehen. Im Verlauf mehrerer Revisionen kann der Speicherplatz, der zum Ermitteln des Unterschieds zwischen den Revisionen verwendet wird, einige Male größer sein als die Datei selbst.

Sie ziehen auch keine gelöschten Dateien herunter. Wenn Sie mit besonders großen Dateien arbeiten, die regelmäßig gelöscht werden, wird diese gelöschte Datei bis zum Ende der Zeit auf dem Server gespeichert, aber niemals auf Ihrer Festplatte gesehen. Dadurch würde der Server im Vergleich zu Ihrer Kopie eine größere Datenmenge haben.

Wenn Sie häufig externe Geräte verwenden, um große Projekte miteinander zu verknüpfen, könnten Sie mehrmals mehr Daten auschecken, als wenn Sie nur die einzelnen Projekte ausgecheckt hätten. Tags nehmen auch fast keinen Platz auf dem Server ein (es sei denn, Sie bearbeiten darunterliegende Dateien), sodass das Auschecken nicht dem auf dem Server belegten Speicherplatz entspricht.

Die einzige Schlussfolgerung, die Sie wirklich machen können, ist, dass der Server bei gegebenen Dateideltas, Protokollen und gelöschten Dateien und solange Sie Externals und Tags / Verzweigungen ausschließen, wahrscheinlich mehr Daten als Ihre lokale Kopie enthält. Die Dateikomprimierung kann dies jedoch ebenfalls beeinflussen.

Was ist der Bereich der Ungleichheit, den man sehen könnte? Könnte der Speicher auf dem Server doppelt so groß sein wie die ausgecheckte Größe? Enigma vor 8 Jahren 0
Mit einer echten Autorität ist es schwer zu sagen. Wenn Ihre Kasse viele Tags oder externe Tags enthält, verwendet der Server möglicherweise einen winzigen Bruchteil der Größe Ihrer Kasse. Wenn Sie beim Auschecken keine Tags und Externen verwenden und das Repository relativ jung ist, sind die Größen möglicherweise ähnlich oder zumindest in derselben Größenordnung. Es könnte doppelt so viel verwendet werden, aber bei dieser Größe wäre ich überrascht, und Sie müssten eine Menge inkompressibler Daten verwenden. Mokubai vor 8 Jahren 2