Es gibt keine Ungewissheit in der Antwort und daher keine Spekulation. Wenn Sie einen Satz Benchmarks auswählen, die GPU korrigieren und sie profilieren, erhalten Sie eine feste Antwort
Nun ja. Sie könnten das tun, wenn Sie die richtigen Werkzeuge hätten. Es ist nicht besonders einfach, Leistungsbenchmarks durchzuführen, ohne die Hardware selbst zu instrumentieren. Sie können eine Simulation ausführen, wenn Sie NVIDIA oder Partner sind und Zugriff auf den Prozessor Verilog haben. Der Stromverbrauch hängt jedoch stark von den Layout- und Implementierungsdetails ab. Er kann sich daher sehr ändern.
Sie sprechen von Optimierung, aber von was? Wenn Sie GPU-Code schreiben, ist es fast immer optimal, die Gesamtzahl der ausgeführten Anweisungen zu minimieren, anstatt mit dem Anweisungsmix herumzuspielen. Sie haben keine wirkliche Möglichkeit, dies zu tun, ohne die Funktionalität des Codes trotzdem zu ändern. Wenn Sie Hardware entwerfen, gibt es verschiedene Antworten, aber Sie haben es nicht gesagt.