GPU-VRAM-Bandbreitenbedeutung für das Training des neuronalen Netzes
Meine Frage ist kurz: Ist die VRAM-Bandbreite einer GPU wirklich der Engpass in Bezug auf Deep Neural Networks?
Längere Version: Ein Typ namens Tim Dettmers schrieb in seinem Blog, dass alle relevanten Operationen auf dem Grafikprozessor selbst schneller sind als die Bandbreite neue Daten liefern kann. Scheint vernünftig. Aber jetzt habe ich gestern meine eigenen Epxerimente gemacht und festgestellt, dass dies bei meiner GPU nicht der Fall ist. Es ist eine Nvidia GTX 560TI mit 1 GB VRAM. Wie Sie sehen, ist die Karte ziemlich langsam und hat nicht viel VRAM. Mit AlexNet und 128x128 Bildern und einer Stapelgröße von 4 - größere passen nicht in mein VRAM -, die Situation ist wie folgt: 2200 MHz Speicheruhr: 13:34 Minuten 1650 MHz Speicheruhr: 14:17 Minuten
Fast keine Beschleunigung. 95,3% der Zeit mit 1 1/3 Speichertakt. Nun könnte es der Fall sein, dass der grahics-Prozessor in meiner Situation wirklich zu langsam ist oder die Stapelgröße zu gering ist und daher an die PCIe-Bandbreite (PCIe 2.0) gebunden ist. Ich habe es auch auf einem eigenen Netz mit ~ 1 Million Parametern und verschiedenen Losgrößen bis 1024 mit 40x40 Bildern ausprobiert. Da machte es fast keinen Unterschied.
Nach meinem nicht so repräsentativen Experiment bin ich immer noch unsicher, was für die GPU-Leistung wirklich wichtig ist.
Edit: In diesem Fall war das Framework Nvidia Digits mit Nvidia Caffe Gabel. Ich weiß, dass meine GPU sehr langsam ist, aber meine Frage bezog sich allgemein auf GPUs.
0 Antworten auf die Frage
Verwandte Probleme
-
5
Gibt es drahtlose Router, die Bandbreitenüberwachung und -drosselung ermöglichen?
-
3
Wie können Sie die Akkulaufzeit eines Laptops eines Windows-PCs optimal nutzen?
-
8
Warum sind Upload-Raten niedriger als Download-Raten bei normalen Internetverbindungen?
-
1
Was kann ich unter Windows XP ausschalten, um Speicher freizugeben, ohne alles zu beschädigen
-
2
Was kann ich auf einem Vista-Laptop ausschalten, um Ressourcen freizugeben
-
5
Warum läuft mein CPU-Fan, wenn Sie Videos oder virtuelle Maschinen ausführen?
-
4
Firefox 3.5 startet das Problem langsam
-
2
Wie interpretiere ich die Speichernummern im Windows Task Manager?
-
4
Welche Faktoren sind bei der Betrachtung der Leistungsaspekte eines Motherboards am wichtigsten?
-
6
Windows 7-Standardinstallation: Was muss geändert werden, um den Vorgang zu beschleunigen?