So aktivieren Sie die deaktivierten Streaming-Prozessoren (SM)

1697
skm

Ich verwende NVIDIA Quadro K2000 GPU. Ich lief deviceQuery.exe, deren Ergebnisse unten aufgeführt sind. Es besagt, dass ich nur 2 SM-Einheiten habe. Ich bin nicht sicher, ob ich wirklich nur 2 SMs habe oder einige meiner SMs sind deaktiviert, wie im dritten Kommentar in dieser SO-Frage erwähnt .

Ich habe auch gesehen, dass die Anzahl der SP 192 pro SM beträgt. Möglicherweise gibt es eine Möglichkeit, mehr SM zu aktivieren, und dann wird die Anzahl der SP pro SM verringert.

Bild

Update: Der Grund, warum ich frage, ist die Tatsache, dass ich meine GPU-Verarbeitung effizient gestalten möchte. Ich habe ein Bild von 1080 x 1920, das ich in drei Segmente unterteilt habe. Ich übertrage diese Segmente H2D, verarbeite und übertrage D2H asynchron. Daher möchte ich eine solche Dimension von Blöcken und die Anzahl der Threads pro Block wählen, die die Hardwarekonfiguration meiner GPU effizient nutzen können. Darüber hinaus bin ich immer noch verwirrt, dass eine GPU mit mehr als 2 SMs (sagen wir 8 SMs), aber weniger SPs pro SM (384/8 = 48 SPs pro SM) eine GPU mit 2 SMs und 192 SPs pro SMD aufweisen würden SM? Ich meine, kommt es auf die Gesamtzahl der verfügbaren SPs an?

-1
Es ist durchaus möglich, dass die zusätzlichen Einheiten deaktiviert werden, indem bestimmte wichtige Verknüpfungen auf dem physischen Chipchip gelasert werden und ** nicht in irgendeiner Weise per Software oder Hardware erneut aktiviert werden können. Dies ist sehr wahrscheinlich, um das zu verhindern, was Sie wollen. Während einige dieser SMs * möglicherweise * außer der Deaktivierung tatsächlich funktionieren, ist es auch möglich, dass sie deaktiviert sind, weil sie während des Tests eine Fehlfunktion hatten. Es ist viel einfacher und einfacher, das zu kaufen, was Sie tatsächlich brauchen, als das billigste und die Hoffnung, dass Sie deaktivierte Teile wieder aktivieren können. Mokubai vor 8 Jahren 0
@Mokubai: NVIDIA Quadro K2000 verfügt über die Fähigkeit 3.0. Es ist fast eine GPU der neuen Generation. Glaubst du wirklich, das sollte nur 2 SMs haben? Wo immer ich über GPUs lese, sagen sie, dass GPUs normalerweise 2-30 SMs haben. Und ich kann nicht glauben, dass diese neueste GPU nur 2 SMs hat. skm vor 8 Jahren 0
Da sich die K2000 auf der "Schnäppchenwanne" -Seite der Quadro-Linie befindet, würde mich nichts überraschen. Unter https://en.wikipedia.org/wiki/List_of_Nvidia_graphics_processing_units#Quadro_Kxxx_Series können Sie bestätigen, dass Sie über 2 ** funktionsfähige ** SMX-Einheiten verfügen. Aller Wahrscheinlichkeit nach verfügen Sie über einen Chip, der über viele weitere SMX-Einheiten verfügt, die jedoch wahrscheinlich physisch ** deaktiviert sind, entweder weil sie fehlerhaft sind oder dass die Spuren mit dem Laser geschnitten werden. Mokubai vor 8 Jahren 1
Ihre "neueste" GK107 ist in der Tat über drei Jahre alt, verfügt über zwei SMX mit je 192 Kernen: http://www.tomshardware.com/reviews/geforce-gt-640- Testbericht, 3214.html (Ihr K2000 ist nur eine Quadro-Version dieser Karte). Und es gibt keine magischen Softwarebefehle, die die Transistoren auf dem Silizium anweisen, sich neu zu organisieren. Bedauern all diese Fragen nur das Bedauern der Käufer oder haben Sie einen Grund, dies zu fragen? talonmies vor 8 Jahren 0
@ talonmies: Ich habe nicht den Grund dafür geschrieben, diese Frage zu stellen, weil jemand von SO gesagt hat, dass dort keine Hardware-Fragen gestellt werden sollen. Also, hier habe ich gerade nach dem Hardwareproblem gefragt. Wie auch immer, ich habe meine Frage aktualisiert, um den Grund für diese Frage zu klären. skm vor 8 Jahren 0

1 Antwort auf die Frage

1
talonmies

In Ordnung:

  1. Ich bin mir nicht sicher, ob ich wirklich nur 2 SMs habe oder einige meiner SMs sind deaktiviert

    Ihre GPU ist GK107. Es verfügt über zwei SMX mit jeweils 192 SP. Es gibt keine deaktivierten Prozessoren.

  2. Möglicherweise gibt es eine Möglichkeit, mehr SM zu aktivieren, und dann wird die Anzahl der SP pro SM verringert.

    Es gibt keine magische Möglichkeit, das Silizium in der Software zu ändern.

  3. Ich bin immer noch verwirrt, dass eine GPU mit mehr als zwei SMs (sagen wir 8 SMs), aber eine geringere Anzahl von SPs pro SM (384/8 = 48 SP pro SM) eine GPU mit 2 SMs und 192 SPs pro SM hätte?

    Das ist eine große Frage, die ich hier nicht beantworten möchte. NVIDIA hat zahlreiche sehr detaillierte Whitepapers zur Architektur und Leistung der verschiedenen Generationen ihrer Flaggschiff-Computerkarten veröffentlicht, sobald diese veröffentlicht wurden. Wenn Sie dazu neigen, schlage ich vor, sie selbst zu lesen. Als Faustregel gilt jedoch die gleiche ArchitekturgenerationJe mehr SM oder SMX ein Gerät hat, desto besser wird es bei arithmetisch gebundenen Operationen ausgeführt. Ein Vergleich verschiedener Generationen von GPUs ist zwecklos. Zum Beispiel hat die allererste Telsa-Compute-Karte, die NVIDIA veröffentlicht, 16 SM (den C860). Der jüngste hat 15 SMX (der K40). Es gibt etwa einen zehnfachen Unterschied in ihrer Spitzenleistung bei Einzelgenauigkeit. Beachten Sie auch, dass viele Anwendungen der realen Welt an die Speicherbandbreite gebunden sind und dies den Leistungsunterschied zwischen verschiedenen Karten radikal ändern kann. Während Core Count und Peak FLOP mehr oder weniger dem Moore'schen Gesetz gefolgt sind, ist es bei der Speicherbandbreite nicht der Fall.