Defekte PMU-Hardware wurde nur mit Softwareereignissen erkannt

1593
Allen

Ich habe zwei von vier Rechnern (Dell R815), die beim Ausführen nicht die CPU-Hardware-Zähler anzeigen (von Linux-Tools-Common auf Ubuntu oder Debian):

perf list 

Ich verwendete strace und stellte fest, dass das Problem darin bestand, dass auf den beiden Computern / sys / devices / cpu das Problem fehlt. Ich habe dies auf einen Fehler in dmesg zurückgeführt:

Performance Events: Broken PMU hardware detected, using software events only. 

Auf den Maschinen, die funktionieren, heißt es

Performance Events: AMD PMU driver. 

Meine Frage ist: Was kann ich tun, um sicherzustellen, dass dies nicht nur ein Software- oder Konfigurationsproblem ist? Für mich sieht das nach schlechter Hardware aus.

0

1 Antwort auf die Frage

0
Allen

Ich fand das Problem heraus, dass die Microcode-Version auf den CPUs für die betroffenen Maschinen älter war. Ich habe versucht, das Paket amd64-microcode zu installieren, das den Mikrocode aber erst aktualisiert hat, nachdem der PMU-Fehler in dmesg bereits angezeigt wurde. Ich habe das bootfähige Serverkonfigurationstool von Dell verwendet, um das BIOS und die Systemfirmware zu aktualisieren, und das Problem wurde behoben. Hoffentlich wird dies für alle anderen hilfreich sein, die das gleiche Problem haben.