Wie wichtig ist die Prozessorgeschwindigkeit für die Ausführung von R?

2713
Thomas Jensen

Ich bin gerade dabei, einen neuen Laptop für die Arbeit zu kaufen. Ich bin ein Doktorand und benutze täglich R und Pyhton, wobei ich oft große Simulationen durchführe. Ich habe mich gefragt, was für das Ausführen von R mit großen Datensätzen und vielen Simulationen am wichtigsten ist: Prozessorgeschwindigkeit oder RAM?

2

2 Antworten auf die Frage

2
dsimcha

Moderne Computer verfügen normalerweise über 2-4 GB RAM, und zumindest unter Windows ist die "empfohlene" Version von R immer noch 32-Bit, was bedeutet, dass Sie gewonnen haben, wenn Sie die weniger gut unterstützte 64-Bit-Version von R verwenden Mehr als 2-4 GB können nicht genutzt werden. Unter Linux ist das Verteilen einer 64-Bit-Version (die für alle praktischen Zwecke eine unbegrenzte Menge an Speicher verwenden kann, falls vorhanden) üblicher. Darüber hinaus führt mehr Arbeitsspeicher nur zu einer schnelleren Verarbeitung bis zu dem Punkt, an dem Sie nicht mehr häufig in Ihre Auslagerungsdatei wechseln. Prozessorgeschwindigkeit dagegen ist etwas, das diese willkürlichen Einschränkungen oder sinkenden Renditen niemals erreicht.

Wenn Leistung entscheidend ist, sollten Sie als Erstes eine schnellere Sprache als R oder Python verwenden. R und Python sind hervorragende Sprachen für nicht leistungskritischen Code, bei dem der Programmierkomfort wichtig ist. Wenn Sie jedoch Geschwindigkeit benötigen, sollten Sie wahrscheinlich besser D, C #, Java oder sogar C ++ lernen und eine gute Statistikbibliothek finden mit ihnen. Diese Sprachen können um Größenordnungen schneller sein als R und Python, wenn mit ähnlich geschriebenem Code gearbeitet wird.

/ me findet es seltsam, dass "D" vor "C ++" steht ...: seufz: +1 Billy ONeal vor 13 Jahren 0
0
Billy ONeal

Abhängig von der Größe der Simulation. Wenn die Simulation so viele Daten enthält, dass sie nicht in den Arbeitssatz (Hauptspeicher) passen, wird der Engpass immer die Festplatte sein. Durch die Erhöhung des Arbeitsspeichers wird die Leistung in diesen Fällen verbessert, indem die Festplatte aus der Schleife entfernt wird, da der Hauptspeicher um einige Größenordnungen schneller als die Festplatte ist. Wenn das gesamte Problem jedoch in den Arbeitsspeicher passt, wird der Engpass wahrscheinlich die CPU-Zeit sein.