ANLEITUNG ZUR PROBLEMBEHEBUNG BEI HPE SAS-SSDs

Kritisches Firmware-Update für bestimmte HPE SAS-SSDs erforderlich, um einen Laufwerksausfall zu verhindern

ANLEITUNG ZUR PROBLEMBEHEBUNG BEI HPE SAS-SSDs

HPE wurde von Lieferanten über kritische Probleme bei bestimmten Solid-State-Laufwerken (SSDs) informiert, die ein Firmware-Update erfordern. Mit dem Update soll sichergestellt werden, dass die von diesen Lieferanten hergestellten Laufwerke weiterhin korrekt funktionieren. Als Teil unserer Verpflichtung, unsere Kunden zu unterstützen und den Firmware-Update-Prozess zu vereinfachen, stellt HPE diese Webseite mit einer Anleitung zur Problembehebung bei SSDs bereit. Damit erhalten HPE Kunden rund um die Uhr an sieben Tagen die Woche Zugang zu den Informationen und Tools, die sie benötigen, um betroffene Laufwerke in Echtzeit zu ermitteln und das Problem schnell zu beheben.

HPE empfiehlt Kunden nachdrücklich, diese Ressourcen und Tools, z. B. HPE iLO Amplifier Pack, HPE InfoSight for Servers, HPE Service Pack for ProLiant und Smart Update Manager, für die effektive Ermittlung und Behebung des SSD-Problems in einer Rechenzentrumsumgebung zu nutzen. Darüber hinaus enthalten die Dokumente zur HPE Plattform- und SSD-Modellmatrix direkte Links zum Download der SSD-Firmware.


Um welche Probleme bei HPE SAS-SSDs handelt es sich?

Bisher wurde HPE von zwei Lieferanten von Solid-State-Laufwerken über herstellerbedingte Firmware-Fehler bei bestimmten SAS-SSD-Modellen informiert:
  • PROBLEM 40K (Ausfall nach 40.000 Betriebsstunden):   Im Februar 2020 wurde HPE von einem SSD-Lieferanten über einen herstellerbedingten Firmware-Fehler bei bestimmten SAS-SSD-Modellen informiert, die in der gesamten Branche eingesetzt werden. Das festgestellte Problem betrifft bestimmte HPE SAS-SSDs mit einer  HPE Firmware-Version vor HPD7 , die bei einer Reihe von HPE Server- und Speicherprodukten verwendet werden. Es führt zu einem SSD-Ausfall nach 40.000 Betriebsstunden (d. h. nach 4 Jahren, 206 Tagen und 16 Stunden). Da der SSD-Ausfall erst nach 40.000 Betriebsstunden auftritt, können diese Laufwerke NICHT vor Oktober 2020 ausfallen (errechnet anhand des HPE-Lieferdatums) Ausgenommen ist der HPE SimpliVity OmniCube, bei dem schon jetzt ein Risiko besteht.  Dieses Laufwerksproblem ist nicht auf HPE beschränkt und betrifft möglicherweise alle Kunden, die diese Laufwerke gekauft haben.
  • PROBLEM 32K (Ausfall nach 32.768 Betriebsstunden): Im November 2019 wurde HPE von einem SSD-Lieferanten über einen herstellerbedingten Firmware-Fehler bei bestimmten SAS-SSD-Modellen informiert, die bei einer Reihe von HPE Server- und Speicherprodukten verwendet werden. Das festgestellte Problem betrifft bestimmte HPE SAS-SSDs mit einer  HPE Firmware-Version vor HPD8  und  führt zu einem SSD-Ausfall nach 32.768 Betriebsstunden (d. h. nach 3 Jahren, 270 Tagen und 8 Stunden).

Welche HPE SSD-Modelle, Server und Speicherplattformen sind von den Problemen bei den Laufwerken der Lieferanten betroffen?

Die umfassende Liste der von den Laufwerksproblemen betroffenen HPE Server- und Speicherplattformen und SAS-SSD-Modelle ist in den folgenden Dokumenten zur HPE Plattform- und SSD-Modellmatrix enthalten. Bitte beachten Sie, dass diese Dokumente auch direkte Links zum Download der SSD-Firmware enthalten.

Woher weiß ich, ob es betroffene SSDs in meinem Rechenzentrum gibt?

HPE empfiehlt Kunden nachdrücklich, die HPE Tools für die Problemerkennung/-bestimmung zu nutzen, bevor sie zur Problemlösung übergehen. Diese Tools vereinfachen die Identifizierung der betroffenen SAS-SSDs und das effektive Management des Laufwerksproblems in ihrem Rechenzentrum.

Standard-Tools von HPE für das Rechenzentrumsmanagement:

  • HPE InfoSight for Servers – Sendet eine Warnmeldung (einen sogenannten Wellness Alert) an Kunden mit betroffenen Laufwerken, die auf das Customer Bulletin und Firmware-Downloads verweist. 
    • HPE empfiehlt Kunden ausdrücklich, HPE InfoSight for Servers gleich zu installieren, um die Wellness Alerts zu erhalten, die auf potenzielle Produktprobleme hinweisen, die Leistung optimieren und Probleme vorhersagen und vermeiden.
  • HPE iLO Amplifier Pack – Stellt einen Bericht mit SSD-Modellnummern und Firmware-Versionen für die manuelle Prüfung bereit.  Kombinieren Sie HPE iLO Amplifier Pack mit HPE InfoSight for Servers, um die Anzeige, das Management und die Behebung von Serverproblemen zu ermöglichen.
  • HPE Smart Storage Administrator (SSA) – Kann verwendet werden, um die Betriebsstunden von SAS-SSDs für die manuelle Prüfung zu ermitteln.
  • HPE MSA Storage Health Check – Damit können Sie Ihre Log-Datei sicher hochladen und erhalten einen maßgeschneiderten Bericht, der wichtige Feststellungen, empfohlene Verbesserungen und Möglichkeiten zur Maximierung der Verfügbarkeit Ihres Arrays zusammenfasst. Zusätzliche Informationen sind im Kundenhinweis enthalten.

 

HPE Skripts zur Problemerkennung bei SSDs

Nutzen Sie die HPE Skripts zur Problemerkennung bei SSDs, um die Firmware des SSD-Laufwerks auf das Problem eines Ausfalls nach einer bestimmten Anzahl von Betriebsstunden zu überprüfen, das bestimmte HPE SAS-SSD-Laufwerke betrifft. Bitte beachten Sie, dass beide Skripts ausgeführt werden müssen, um die von dem 40K- und 32K-Problem betroffenen SSD-Modelle zu ermitteln. Die Skripts sind für Linux, VMware und Windows verfügbar. Anweisungen finden Sie in der Datei README.txt in der .zip-Datei.

Wie löse oder behebe ich die SSD-Probleme?

HPE hat aktualisierte Firmware für alle betroffenen SAS-SSD-Modelle veröffentlicht und empfiehlt Kunden dringend, die kritischen Fixes umgehend zu installieren. Wird kein Update auf die vorgeschriebenen SSD-Firmware-Versionen durchgeführt, führt dies zu einem Laufwerksausfall und Datenverlusten, wie oben beschrieben. HPE empfiehlt Ihnen, zunächst die HPE Skripts zur Problemerkennung zu verwenden, um die betroffenen SSDs in Ihrem Rechenzentrum zu ermitteln, und dann das Firmware-Update durchzuführen.  Links zum Download der geeigneten SSD-Firmware sind in den folgenden Dokumenten enthalten:   


WICHTIG: Die aktualisierte Firmware ist für bestimmte SSD-Modelle vorgesehen und die Firmware für PROBLEM 40K ist nicht mit der Firmware für PROBLEM 32K austauschbar.

HPE Service Pack for ProLiant (SPP) und Smart Update Manager (SUM) können verwendet werden, um den SSD-Firmware-Update-Prozess zu vereinfachen. Diese Tools erkennen, welche Firmware für welches Laufwerk bestimmt ist, und verteilen das geeignete Firmware-Update an die Plattformen im Rechenzentrum. Verschiedene spezielle Smart Components, die für das Laufwerksmodell und das Plattformbetriebssystem spezifisch sind, aktualisieren die Firmware des Laufwerks. Sie können die Smart Component(s) auch auf eine einzelne Plattform herunterladen und darauf installieren, basierend auf dem in der Konfiguration vorhandenen Laufwerksmodell. Detaillierte Informationen finden Sie im Dokument HPE SAS SSD Firmware Update – Software Analysis and Update Tools.