NVM-Fehler, E / A-Fehler, im BIOS nicht erkannt

414
Thomas Leclercq

Ich habe seit ungefähr einem Monat ein wiederkehrendes Problem, bei dem meine (einzelne) SSD an einen NVM-Port angeschlossen ist.

Aufbau :

OS: Archlinux Laptop Razer Blade Stealth 2017 SSD: `Samsung NVMe SSD Controller SM951/PM951` 

Wenn das Problem auftritt (plötzlich kann es nach 10 Sekunden Booten oder 2 Stunden dauern), fängt mein Prozess an zu scheitern Input/Output error. Irgendwann kurz vor dem IO-Fehler bekomme ich einige Read-only filesystemFehler.

Manchmal starte ich den Laptop neu und er erkennt mein Gerät nicht mehr! (booten Sie direkt in das Bios, weil ... keine Geräte und wenn ich dann in einen NVM-Abschnitt des Bios gehe, wird nichts erkannt ...)

Klar eine beschädigte SSD hier! Ich führe das Basic aus fsckund badblocksbeide sagen mir, dass alles in Ordnung ist. Ich habe das gesamte Gerät mit Nullnytes gespült und mein Betriebssystem erneut installiert. Das Problem ist immer noch aufgetreten.

Dies ist die Ausgabe von smartctl --all /dev/nvme0n1

=== START OF INFORMATION SECTION === Model Number: SAMSUNG MZVLV512HCJH-00000 Serial Number: S2J6NX0H906873 Firmware Version: BXV7000Q PCI Vendor/Subsystem ID: 0x144d IEEE OUI Identifier: 0x002538 Controller ID: 1 Number of Namespaces: 1 Namespace 1 Size/Capacity: 512,110,190,592 [512 GB] Namespace 1 Utilization: 511,650,234,368 [511 GB] Namespace 1 Formatted LBA Size: 512 Local Time is: Wed Sep 12 21:59:29 2018 IST Firmware Updates (0x06): 3 Slots Optional Admin Commands (0x0007): Security Format Frmw_DL Optional NVM Commands (0x001f): Comp Wr_Unc DS_Mngmt Wr_Zero Sav/Sel_Feat Maximum Data Transfer Size: 32 Pages  Supported Power States St Op Max Active Idle RL RT WL WT Ent_Lat Ex_Lat 0 + 6.00W - - 0 0 0 0 5 5 1 + 4.20W - - 1 1 1 1 30 30 2 + 3.10W - - 2 2 2 2 100 100 3 - 0.0700W - - 3 3 3 3 500 5000 4 - 0.0050W - - 4 4 4 4 2000 22000  Supported LBA Sizes (NSID 0x1) Id Fmt Data Metadt Rel_Perf 0 + 512 0 0  === START OF SMART DATA SECTION === SMART overall-health self-assessment test result: PASSED  SMART/Health Information (NVMe Log 0x02, NSID 0x1) Critical Warning: 0x00 Temperature: 37 Celsius Available Spare: 100% Available Spare Threshold: 10% Percentage Used: 1% Data Units Read: 10,189,885 [5.21 TB] Data Units Written: 14,400,717 [7.37 TB] Host Read Commands: 145,666,903 Host Write Commands: 268,275,465 Controller Busy Time: 1,937 Power Cycles: 2,475 Power On Hours: 3,256 Unsafe Shutdowns: 438 Media and Data Integrity Errors: 0 Error Information Log Entries: 1,985  Error Information (NVMe Log 0x01, max 64 entries) Num ErrCount SQId CmdId Status PELoc LBA NSID VS 0 1985 0 0x0018 0x4004 0x000 0 0 - 1 1984 0 0x0012 0x4004 0x000 0 0 - 2 1983 0 0x0007 0x4004 0x000 0 0 - 3 1982 0 0x0006 0x4004 0x000 0 0 - 4 1981 0 0x0005 0x4004 0x000 0 0 - 5 1980 0 0x0009 0x4004 0x000 0 0 - 6 1979 0 0x0009 0x4004 0x000 0 0 - 7 1978 0 0x0003 0x4004 0x000 0 0 - 8 1977 0 0x0004 0x4004 0x000 0 0 - 9 1976 0 0x0007 0x4004 0x000 0 0 - 10 1975 0 0x000b 0x4004 0x000 0 0 - 11 1974 0 0x0001 0x4004 0x000 0 0 - 12 1973 0 0x0012 0x4004 0x000 0 0 - 13 1972 0 0x001c 0x4004 0x000 0 0 - 14 1971 0 0x0000 0x4004 0x000 0 0 - 15 1970 0 0x0012 0x4004 0x000 0 0 - ... (48 entries not shown) 

Ich habe ein probiert, smartctl -t short /dev/nvme0n1aber leider scheint es nicht zu funktionieren.

Kann mir jemand die richtige Richtung zeigen? Ich hätte nichts dagegen, meine SSD zu wechseln, aber ich habe Angst, es könnte ein fehlerhafter Controller sein, und dann müsste ich das Motherboard (oder den Laptop) austauschen.

0

0 Antworten auf die Frage