Connect with us

Noticias

Las GPU AMD RDNA 2 tienen una latencia de memoria mucho mejor en comparación con la arquitectura de GPU Ampere de NVIDIA

blank

Published

blank

El rendimiento de latencia de memoria de las arquitecturas de GPU RDNA 2 de AMD y Ampere de NVIDIA ha sido probado por Patatas Fritas y Queso. La tienda de tecnología decidió probar el rendimiento de latencia de la memoria de la GPU de las últimas arquitecturas de GPU del equipo rojo y el equipo verde y descubrió algunos resultados interesantes.

Las GPU RDNA 2 de AMD cuentan con un rendimiento de latencia de memoria superior en comparación con la arquitectura de GPU Ampere de NVIDIA

En el lado de la CPU, la medición del rendimiento de la caché y la latencia se ha convertido en un indicador crucial con el uso cada vez mayor de matrices multi-chiplet y varios chips IO integrados en la misma matriz y, en casos recientes, también fuera de matriz (chiplets AMD Zen). Las GPU también están compuestas por varias jerarquías de caché que llenan las brechas entre el rendimiento de la memoria y el cómputo, y la fuente utilizó puntos de referencia basados ​​en OpenCL que persiguen puntos de referencia para medir el rendimiento de latencia de la memoria caché y de la memoria en la generación actual de GPU, como NVIDIA Ampere y AMD RDNA 2. arquitecturas.

Las APU de AMD Van Gogh llevarán el poder de RDNA 2 a portátiles Ryzen de consumo ultrabajo, núcleos Quad Zen 2 y hasta 8 unidades informáticas Navi

Se midió el rendimiento de latencia y caché de GPU NVIDIA Ampere frente a AMD RDNA 2 GPU. (Créditos de imagen: patatas fritas y queso)

En los puntos de referencia, la AMD Radeon RX 6800 XT (RDNA 2 GPU) y la NVIDIA GeForce RTX 3090 (Ampere GPU) se colocaron una contra la otra. El banco de pruebas de memoria y caché muestra que la arquitectura RDNA 2 de AMD funcionó mucho mejor que la GPU Ampere de NVIDIA, ofreciendo una latencia más baja a pesar de tener que verificar dos niveles más de caché en el camino hacia la memoria. El uso de la caché Infinity solo agrega 20ns sobre el golpe L2 y aún es más rápido que el Ampere de NVIDIA.

La razón indicada es que la GPU GA102 basada en NVIDIA Ampere es simplemente una GPU mucho más grande y, si bien utiliza un subsistema de memoria de GPU más convencional con solo dos niveles de caché, tiene que tomar muchos ciclos y da como resultado una latencia de más de 100ns (L1 a L2). RDNA 2, por otro lado, tiene una latencia de solo 66ns. Tenga en cuenta que la GPU AMD Navi 21 es mucho más pequeña y cuenta con una caché L2 de 4 MB, mientras que la GPU NVIDIA GA102 cuenta con una caché L2 de 6 MB para todo el chip. La GPU NVIDIA A100 Ampere para HPC cuenta con una enorme caché L3 de 40 MB.

A continuación se incluye una nota sobre el desempeño de Chips and Cheese:

El caché de RDNA 2 es rápido y hay mucho. En comparación con Ampere, la latencia es baja en todos los niveles. Infinity Cache solo agrega alrededor de 20 ns sobre un golpe L2 y tiene una latencia más baja que la L2 de Ampere. Sorprendentemente, la latencia de VRAM de RDNA 2 es aproximadamente la misma que la de Ampere, aunque RDNA 2 está comprobando dos niveles más de caché en el camino hacia la memoria.

Por el contrario, Nvidia se queda con un subsistema de memoria GPU más convencional con solo dos niveles de caché y alta latencia L2. Pasar de la L1 privada SM de Ampere a la L2 toma más de 100 ns. El L2 de RDNA está a ~ 66 ns de L0, incluso con una caché L1 entre ellos. Moverse por el enorme dado de GA102 parece llevar muchos ciclos.

Esto podría explicar el excelente rendimiento de AMD a resoluciones más bajas. Las cachés L2 y L3 de baja latencia de RDNA 2 pueden darle una ventaja con cargas de trabajo más pequeñas, donde la ocupación es demasiado baja para ocultar la latencia. En comparación, los chips Ampere de Nvidia requieren más paralelismo para brillar.

a través de patatas fritas y queso

En comparación con los chips Pascal y Maxwell más antiguos, la arquitectura Ampere ha dado lugar a velocidades de latencia muy mejoradas en GPU mucho más grandes. AMD, por otro lado, ha mostrado algunas ganancias impresionantes frente a los chips basados ​​en la arquitectura GCN y VLIW más antiguos. Estos números definitivamente serán interesantes para comparar una vez que la nueva ronda de GPU basadas en chiplet llegue al segmento de los juegos en los próximos años.

Click to comment

Leave a Reply

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *