"Ich frage mich, wie ein Cloud-Dienstanbieter seine Festplatten auf Probleme überwacht."
Sie tun es nicht wirklich. Laufwerke fallen normalerweise plötzlich aus. Die Antwort besteht darin, Systeme zu bauen, die den Ausfall überleben. Die großen Cloud-Dienste verwenden in mehreren Gebäuden riesige Server-Cluster, Server mit gespiegelten RAID-Arrays (die Daten redundant speichern) und Server, die andere Server spiegeln.
Also redundante Standorte, redundante Server, redundante Laufwerke in Servern.
Google hat Studien zu den Festplattenausfallraten usw. veröffentlicht. Grundsätzlich gilt: SMART ist hauptsächlich unbrauchbar und Laufwerksausfälle machen nach etwa 3 Jahren einen großen Sprung.
Holen Sie sich ein zweites Laufwerk in den Mix, spiegeln Sie es (Robocopy (ein Teil von Windows) ist eine gute Wahl für Verbraucher), und ersetzen Sie sie alle drei Jahre. Wenn Sie eine Kopie Ihrer Daten außerhalb des Standortes erhalten können, tun Sie dies.
Das Reparieren von Laufwerken ist nur gut, um Sachen von denen zu bekommen, für die Sie keine Backups haben. Sie können ihnen nicht länger vertrauen und sie sollten aufgegeben werden. Wenn Sie über eine gespiegelte Sicherung verfügen, ersetzen Sie einfach das ausgefallene Laufwerk, spiegeln Sie die vorhandenen Daten, und fahren Sie fort.
Ich verwende ein Gerät mit niedrigem Stromverbrauch als Server in meinem LAN mit zwei passenden externen Laufwerken (ich suche etwas Großartiges um 100 US-Dollar). Ich schiebe Sicherungen auf ein Serverlaufwerk, und der Server plant eine Routine-Spiegelungsoperation, um die Sicherung auf das andere Laufwerk zu kopieren. Ich bilde auch ab und zu meine wichtigen Maschinen ab, damit ich die Betriebssysteminstallation bei Bedarf wiederherstellen kann.
Ich tausche die externen Festplatten alle paar Jahre aus. Normalerweise nehme ich die Festplatte aus dem Gehäuse und verwende sie zur Massenspeicherung nicht kritischer Daten, z. B. von Spielen auf einem meiner Hauptcomputer bis zur nächsten Runde.