Connect with us

Noticias

ORNL publica descripción general del sistema HPC ‘Crusher’ impulsado por AMD: 192 EPYC ‘Trento’ 64 CPU de núcleo, 1536 GPU Instinct MI250X, 40 PFLOP de potencia

Published

blank

El Laboratorio Nacional de Oak Ridge ha publicado la descripción general de su sistema Crusher, que funciona con CPU EPYC optimizadas de tercera generación y GPU Instinct MI250X de AMD.

Se publica la descripción general del sistema triturador alimentado por AMD de ORNL: cuenta con CPU EPYC optimizadas de tercera generación y GPU Instinct MI250X

El sistema Crusher es una plataforma de prueba para la próxima supercomputadora Frontier de ORNL que contará con las últimas CPU AMD EPYC ‘Trento’ y GPU Instinct MI250X ‘Aldebaran’. Como tal, tiene una cantidad menor de nodos, pero aun así, tiene un gran impacto dada la gran cantidad de núcleos de CPU/GPU que se incluyen en él.

ASUS lanza el firmware AMD AGESA 1.2.0.6 BETA BIOS para sus placas base ROG Crosshair VIII

Crusher es un sistema de seguridad moderada del Centro Nacional de Ciencias Computacionales (NCCS) que contiene hardware idéntico y software similar al del próximo sistema Frontier. Se utiliza como banco de pruebas de acceso anticipado para los equipos del Centro para la preparación acelerada de aplicaciones (CAAR) y el Proyecto de computación a gran escala (ECP), así como para el personal de NCCS y nuestros socios proveedores.

vía ORNL

La descripción general publicada por ORNL establece que el sistema de prueba Crushes constará de 2 gabinetes, uno con 128 nodos de cómputo y el otro con 64 nodos de cómputo, con un total de 192 nodos de cómputo en la configuración completa. Cada nodo cuenta con una sola CPU AMD EPYC 7A53 de 64 núcleos que se basa en la arquitectura de CPU EPYC optimizada de tercera generación. Sabemos que Frontier contará con la tecnología de las CPU Trento de AMD, que es una versión optimizada del chip Milan. Cuenta con los mismos 64 núcleos y 128 subprocesos, pero con optimizaciones de relojes y eficiencia energética. Cada CPU tendrá acceso a 512 GB de memoria DDR4.

Para el lado de la GPU, cada nodo contará con cuatro GPU AMD Instinct MI250X, empaquetando 2 GCD y cada nodo trata el GCD como una GPU separada, por lo que Crusher tendrá acceso a 8 GPU en total. Cada GPU MI250X ofrece hasta 52 TFLOP de potencia máxima de cómputo FP64, 220 unidades de cómputo (110 por GCD) y 128 GB de memoria HBM2e (64 GB por GPU) para un ancho de banda de hasta 3,2 TB/s por acelerador MI250X. Cada GCD está conectado a través de un enlace Infinity Fabric que ofrece un ancho de banda bidireccional de 200 GB/s.

Hablando de interconexiones, las CPU AMD EPYC están conectadas a la GPU con Infinity Fabric con un ancho de banda máximo de 36+36 GB/s. Los nodos Crusher están conectados a través de cuatro NIC HPE Slingshot de 200 Gbit por segundo (25 GB/s) que proporcionan un ancho de banda de inyección de nodo de 800 Gbps (100 GB/s).

Existen [4x] Dominios NUMA por nodo y [2x] Regiones de caché L3 por NUMA para un total de [8x] Regiones de caché L3. Cada una de las 8 GPU está asociada con una de las regiones L3 de la siguiente manera:

NÚMERO 0:

  • roscas de hardware 000-007, 064-071 | GPU 4
  • roscas de hardware 008-015, 072-079 | GPU 5

NÚMERO 1:

  • roscas de hardware 016-023, 080-087 | GPU 2
  • roscas de hardware 024-031, 088-095 | GPU 3

NÚMERO 2:

  • roscas de hardware 032-039, 096-103 | GPU 6
  • roscas de hardware 040-047, 104-111 | GPU 7

NÚMERO 3:

  • roscas de hardware 048-055, 112-119 | GPU 0
  • roscas de hardware 056-063, 120-127 | GPU 1

El siguiente diagrama de bloques de un nodo Crusher singular muestra los anchos de banda de interconexión entre las CPU AMD EPYC y los aceleradores GPU Instinct MI250X:

AMD RAMP es XMP para las CPU Ryzen 7000 de AMD, acelera la memoria DDR5 en la plataforma AM5

Además de eso, el sistema Crusher también cuenta con 250 PB de almacenamiento con una velocidad máxima de escritura de 2,5 TB/s, con acceso al sistema de archivos basado en NFS de todo el centro. Espere ver más de las plataformas EPYC CPU y GPU Instinct de AMD cuando estén operativas en la supercomputadora Frontier este año.

Fuente de noticias: celacanto-sueño