El gestor de rendimiento de clúster de HPE es una solución completa de gestión de sistemas integrados que ofrece todas las funcionalidades que necesitas para gestionar tus clústeres de computación de alto rendimiento (HPC) basados en Linux® durante todo el día, todos los días. El software proporciona configuración del sistema, gestión y supervisión de hardware, gestión de la imagen y actualizaciones del software, así como gestión de la energía para sistemas de cualquier tamaño, hasta 100 000 nodos. El gestor de rendimiento de clúster de HPE reduce el tiempo y los recursos utilizados en la administración de los sistemas HPC, al reducir los costes totales de propiedad, al incrementar la productividad y al proporcionar un mejor retorno de las inversiones en hardware.

Novedades

  • Función de gestión del estado del clúster
  • Configuración de alta disponibilidad activa-activa para una mayor resiliencia

Características

Configuración rápida del sistema

La configuración guiada permite una fácil instalación del software, detectar los componentes del hardware para los nodos del clúster y aprovisionar el sistema operativo para todos los nodos de computación y de servicio en el clúster.

El gestor de rendimiento de clúster de HPE puede aprovisionar rápidamente un clúster con miles de nodos desde el hardware, normalmente en una hora.

Añadir nuevos nodos de clúster en el sistema no requiere apagar el sistema.

Supervisión y gestión integral de hardware

El gestor de rendimiento de clúster de HPE proporciona una supervisión y gestión central detallada de todos los aspectos del hardware del clúster (CPU, memoria, GPU, redes, refrigeración…)

Cuando se detectan problemas, se envían avisos al administrador del sistema a través de la consola (GUI, CLI) y por correo electrónico. El software también ofrece la posibilidad de configurar reacciones automáticas ante avisos específicos.

Los análisis adicionales de las métricas del hardware pueden realizarse mediante la visualización de las métricas en un punto específico en el tiempo o en un período histórico en una GUI fácil de usar. Asimismo, los usuarios también pueden supervisar y analizar las métricas, al igual que visualizar las alertas vía Ganglia, Nagios Core o ELK.

El software admite la integración flash del firmware, incluidos los switches, adaptadores de red, BIOS, BMC/iLO y CMC. El software instalado, incluida la BIOS en el clúster de nodos, puede compararse y señalarse ante cualquier inconsistencia con versiones o elementos faltantes.

Para proteger los sistemas de brechas de seguridad, las tareas del administrador del sistema se mantienen en los nodos administrativos, a salvo del acceso de los usuarios finales.

Gestión de software flexible para adaptarse a una amplia gama de requisitos

Gracias al gestor de rendimiento de clúster de HPE se puede aprovisionar cualquier imagen de software en uno o en todos los clústeres de nodos para adaptarse a las distintas necesidades de los usuarios.

El repositorio de imágenes de software seguro puede almacenar diversas versiones del sistema operativo Linux, bibliotecas o aplicaciones. El software admite múltiples formatos (RPM, ISO, versión dorada).

El control de las versiones permite que los cambios se realicen o deshagan según sea necesario al tiempo que se hace un seguimiento de los cambios para la rendición de cuentas.

Reduce los costes operativos con una gestión de alimentación avanzada

El gestor de rendimiento de clúster de HPE ofrece herramientas para una predicción y medición precisas del consumo energético con el fin de brindar una mejor planificación de la capacidad.

El gestor de rendimiento de clúster de HPE recopila potentes métricas del sistema para el clúster del nodo y la infraestructura de refrigeración líquida para el análisis y la planificación de la capacidad futura.

El software admite funciones de gestión de energía avanzadas para la limitación o la gestión de recursos en los trabajos.

La topología detallada y la función de activación/desactivación con reconocimiento de protocolos permiten un inicio controlado del sistema, así como el aislamiento de incidentes ocasionados por un fallo y una recuperación más rápida del sistema.

  • 1.
    Disponible para sistemas HPE SGI 8600.
  • Linux es la marca comercial registrada de Linus Torvalds en Estados Unidos y en otros países. El resto de marcas comerciales de terceros pertenecen a sus respectivos propietarios.