Clúster HPC

¿Qué es un clúster HPC?

Un clúster HPC, también conocido como clúster de computación de alto rendimiento, es la combinación de hardware especializado, que incluye un grupo de grandes y potentes PC, y un marco de software de procesamiento distribuido configurado para gestionar cantidades masivas de datos a altas velocidades con rendimiento paralelo y alta disponibilidad.

¿Cómo se diseña un clúster HPC?

Aunque diseñar un clúster HPC resulta relativamente sencillo, requiere que la organización comprenda el nivel de poder de procesamiento que se requiere a diario para poder determinar su configuración. Debes evaluar cuidadosamente preguntas como las siguientes: ¿Cuántos servidores se necesitan? ¿Qué capa de software puede gestionar las cargas de trabajo de forma eficaz? ¿Dónde se alojará el clúster? ¿Cuáles son los requisitos de energía y refrigeración del sistema? Una vez tomadas las decisiones oportunas, puedes proceder a diseñar el clúster, siguiendo los pasos que se enumeran a continuación:

  1. Diseña un nodo de computación: configura un nodo principal instalando herramientas de supervisión y gestión de recursos, así como controladores y software para la interconexión a alta velocidad. Crea un directorio compartido para el clúster, captura una imagen del nodo de computación y clona la imagen al resto del clúster que ejecutará las cargas de trabajo.
  2. Configura direcciones IP: para una eficacia óptima, los clústeres HPC contienen una red de interconexión de alta velocidad que emplea una subred IP dedicada. Debes asignar direcciones IP adicionales a los nodos de los empleados que conectes al principal.
  3. Configura trabajos como grupos de usuarios CMU: a medida que lleguen las cargas de trabajo en la cola, necesitarás un script que cree dinámicamente grupos de usuarios CMU para cada trabajo que se encuentre en ejecución en ese momento.

¿Cuáles son los componentes claves de un clúster HPC?

Existen tres componentes básicos en un clúster HPC. Cada uno presenta requisitos diferentes: hardware informático, software e instalaciones.

Hardware informático

El hardware informático incluye servidores, almacenamiento y una red dedicada. Normalmente, deberás aprovisionar al menos tres servidores que operen como los nodos principal, de empleado y de cliente. Con una configuración tan limitada, deberás invertir en servidores de alta gama con procesadores potentes y almacenamiento abundante para obtener la máxima capacidad de computación de cada uno. No obstante, puedes escalar verticalmente virtualizando varios servidores para proporcionar más poder de procesamiento al clúster. La infraestructura de red que los apoye requerirá equipos de red TCP/IP con un gran ancho de banda, como Gigabit Ethernet, NIC y conmutadores.

Software

La capa de software incluye las herramientas que desees emplear para supervisar, aprovisionar y gestionar tu clúster HPC. Las pilas de software también incluyen bibliotecas, compiladores, depuradores y sistemas de archivos para ejecutar las funciones de gestión del clúster. Puedes tomar la decisión de adoptar un marco HPC, como Hadoop, que desempeña las mismas funciones, aunque en este caso, ofrece también tolerancia a fallos y permite detectar los sistemas que fallan y redirigir el tráfico automáticamente a otros que se encuentren disponibles.

Instalaciones

Necesitas espacio físico real para alojar tu clúster HPC y soportar el peso de los racks de servidores, con capacidad para incluir hasta 72 servidores blade y cinco conmutadores TOR, con un peso de hasta unos 800 kilos. Debes disponer de energía suficiente para operar y refrigerar los servidores, que pueden requerir hasta 43 kW.

HPE y los clústeres HPC

HPE ofrece un portfolio líder del sector de soluciones de HPC que ayudan a las organizaciones de cualquier tamaño a mejorar la eficacia, reducir el tiempo de inactividad y acelerar la productividad.

HPE Performance Cluster Manager proporciona todo lo que necesitas para gestionar tu clúster HPE y mantenerlo en funcionamiento a máximo rendimiento. Con un conjunto completo de herramientas totalmente integradas para sistemas HPE HPC y de inteligencia artificial, constituye una solución de gestión del sistema flexible y fácil de utilizar que cientos de clientes de todo el mundo llevan más de una década empleando. Escalable para gestionar sistemas de cualquier tamaño, desde docenas de nodos hasta la exaescala, tanto a nivel local como en entornos HPC híbridos, puedes llegar a producción en minutos y ejecutar pruebas de estado periódicas para aprovechar al máximo los recursos disponibles.

HPE Slingshot constituye una interconexión moderna de alto rendimiento para clústeres HPC y de inteligencia artificial que ofrece rendimiento, ancho de banda y baja latencia líder del sector para aplicaciones de HPC, inteligencia artificial, aprendizaje automático y análisis de datos. Realiza un seguimiento en tiempo real de la información sobre la carga en cada ruta entre conmutadores y redirige el tráfico dinámicamente para equilibrarla.

HPE GreenLake proporciona la flexibilidad, escalabilidad y control que necesitas para tu entorno HPC con un modelo de consumo de servicio de nube local. Además, puedes encargar la implementación y gestión del entorno a nuestros expertos capacitados, a fin de reducir el coste y la complejidad de mantener tu propia arquitectura HPC.