Los puntos de referencia de la APU AMD Strix Point “Ryzen AI 9 365” revelaron el IPC, la latencia, el rendimiento y varios aspectos de rendimiento del Zen 5

Según se informa, la APU Zen 5 Strix Point «Ryzen AI 9 365» de AMD ha sido probada por David Huangque tiene un análisis en profundidad del IPC, la latencia y el rendimiento.

La APU AMD Ryzen AI 9 365 «Strix Point» se prueba en una multitud de puntos de referencia antes del lanzamiento, IPC, rendimiento, latencia y más detalles de Zen 5

Nota – El blog de David Huang afirma que los números mencionados aquí se basan en una muestra de ingeniería de la APU AMD Strix Point, principalmente el Ryzen AI 9 365, así que tómelos con cautela, ya que pueden no ser representativos del producto final. También afirma explícitamente que el sistema de prueba estaba ejecutando firmware/software no oficial del sistema.

Fuente de la imagen: Blog de David Huang

Para empezar, David tuvo acceso a una de las primeras computadoras portátiles AMD Strix Point que, según se informa, cuenta con el SKU Ryzen AI 9 365. La plataforma de prueba utilizó memoria LPDDR5x-7500 en capacidades de 32 GB. El enfoque principal de la prueba de hoy está en el IPC y el rendimiento, que comienza con la herramienta InstruccionesRate para medir el rendimiento/latencia de las instrucciones de tres generaciones de CPU Zen, incluidas las arquitecturas Zen 3, Zen 4 y Zen 5.

David enumera que, si bien Zen 5 tiene mejoras gracias a su diseño básico, la arquitectura también tiene algunas desventajas que se detallan a continuación:

  • El rendimiento de varias instrucciones escalares ALU ha aumentado considerablemente, pero debido a que el número de unidades vectoriales en el Zen 5 móvil se reduce a la mitad en comparación con el escritorio y el servidor, el rendimiento SIMD en esta prueba permanece sin cambios en comparación con el Zen 4. Incluso en el Zen 5 núcleo con unidades vectoriales reducidas a la mitad, las operaciones de almacenamiento SIMD de todos los anchos aún se duplican en comparación con la generación anterior, y el rendimiento del almacenamiento de carga SIMD alcanza 1:1;
  • La capacidad de procesamiento de sucursales se ha mejorado enormemente, y el número de sucursales no tomadas que se pueden procesar por ciclo aumentó de dos a tres. y se pueden procesar dos ramas tomadas por ciclo. Esto debería estar relacionado con el nuevo diseño del front-end;
  • La latencia de los cálculos de suma de enteros SIMD de 128/256/512 bits SSE/AVX/AVX512 se ha aumentado a 2 ciclos. Este cambio puede ser para facilitar el mantenimiento de altas frecuencias.
  • El rendimiento de las operaciones de suma de enteros SIMD de 128/256 bits se reduce a la mitad en comparación con Zen 4, pero 512 bits permanece sin cambios. Se especula que este problema sólo existe en los núcleos Zen 5 con SIMD reducido a la mitad, lo que puede estar relacionado con la asignación de puertos;
  • Se eliminó la función de fusión nop introducida en Zen 4. Ya no es posible fusionar una instrucción nop con otra instrucción en la misma macrooperación;
  • Se ajustó el rendimiento de algunas operaciones de registros lógicos, unificando el rendimiento de algunas operaciones de mov y algunas operaciones de puesta a cero de registros a 5, lo cual es una mejora mixta en comparación con Zen 4.

Las pruebas también se centran en el front-end de doble canal paralelo, lo que debería afectar la recuperación de instrucciones, la decodificación y el caché de macrooperaciones. Se afirma que al ejecutar instrucciones NOP de diferentes longitudes y números, se pueden observar las diferencias entre Zen 4 y Zen 5. Las observaciones concluyen de la siguiente manera:

  • Zen 5 utiliza un diseño de interfaz múltiple similar a Tremont pero más ancho, utilizando dos decodificadores x86 de 4 de ancho y cachés de macrooperaciones de al menos 8 de ancho para implementar cambios de nombre de 8 de ancho;
  • Considere el siguiente fenómeno
    • Zen 5 no puede hacer que el ancho de banda de decodificación x86 supere 4 cuando se ejecutan instrucciones NOP consecutivas en un solo subproceso;
    • En la sección de rendimiento de instrucciones, se probó que dos ramas tomadas se pueden procesar en un solo ciclo;
  • Es razonable especular que Zen 5 no utiliza una solución de caché ILD previa a la decodificación similar a Gracemont, pero debe permitir que dos decodificadores funcionen simultáneamente cuando el predictor de rama predice una rama tomada, es decir, dejar que uno de los decodificadores comience a decodificar directamente. desde la dirección de destino de la siguiente sucursal. Desde esta perspectiva, AMD todavía necesita depender del caché de macrooperaciones para lograr un alto rendimiento en escenarios con ramas escasas.
  • Zen 5 no solo admite la decodificación de instrucciones x86 desde dos ubicaciones en el mismo ciclo, sino que también admite la recuperación de instrucciones desde dos ubicaciones en el caché de macrooperación en el mismo ciclo, para lograr dos ramas tomadas por ciclo dentro de la cobertura de la macrooperación. cache;
  • Cuando el núcleo ejecuta dos subprocesos SMT, cada uno puede monopolizar un decodificador, de modo que el límite de rendimiento de decodificación x86 de todo el núcleo alcanza 8 en la mayoría de los casos.
amd-ryzen-ai-9-365-zen-5-strix-point-apu-_-ipc-latencia-ancho de banda-rendimiento-pruebas-_7
amd-ryzen-ai-9-365-zen-5-strix-point-apu-_-ipc-latencia-ancho de banda-rendimiento-pruebas-_8

Luego, las pruebas pasan a los aspectos más de rendimiento de las APU AMD Strix Point. Una vez más, se utiliza el chip Ryzen AI 9 365, pero esta vez se compara con el Ryzen 7 7735U (Zen 3), Ryzen 7 7840U (Zen 4) y el Ryzen AI 9 365 (Zen 5) antes mencionado, pero Esta vez, los núcleos Zen 5 y Zen 5C están disponibles en el chip que se está probando. Los núcleos Zen 5C funcionan a una frecuencia mucho más baja de sólo 3,30 GHz, mientras que los núcleos Zen 5 y los otros dos chips están configurados a una frecuencia fija de 4,8 GHz.

El rendimiento se evaluó dentro de SPEC CPU 2017 y Geekbench 6 (de un solo núcleo y de varios núcleos). En SPEC CPU 2017, el chip AMD Zen 5 experimenta un aumento del +9,71 % con respecto a la oferta Zen 4 y un aumento del 22,28 % con respecto a la oferta Zen 3. Los núcleos Zen 5C casi igualan al Zen 4 IPC en una frecuencia más baja.

amd-ryzen-ai-9-365-zen-5-strix-point-apu-_-ipc-latencia-ancho-de-banda-rendimiento-pruebas-de-rendimiento-_11
amd-ryzen-ai-9-365-zen-5-strix-point-apu-_-ipc-latencia-ancho-de-banda-rendimiento-pruebas-de-rendimiento-_10

En Geekbench 6, la mejora relativa del rendimiento con respecto a Zen 3 es de hasta un 40,94% frente a Zen 3 y Zen 4, es aproximadamente un 13,1%. Estos números son solo de un solo núcleo. Con las pruebas de múltiples núcleos, las APU Zen 5 «Strix Point» ven un aumento del 55,45 % sobre Zen 3 y una mejora del 24,3 % sobre Zen 4, pero cabe señalar que los chips Zen 3 y Zen 4 ejecutaban un TDP de 28 W frente a los 54 W. de la APU Ryzen AI 9 365.

ESPECIFICACIONES CPU 2017 IPC (generación a generación)

  • Zen 3 – 100,00%
  • Zen 4 – 111,46%
  • Zen 5 – 109,71%

ESPECIFICACIÓN CPU 2017 Rendimiento (relativo)

  • Zen 3 – 100,00%
  • Zen 4 – 111,46%
  • Zen 5 – 122,28%

Geekbench 6 ST IPC (generación a generación)

  • Zen 3 – 100,00%
  • Zen 4 – 117,37%
  • Zen 5 – 115,28%

Rendimiento Geekbench 6 ST (relativo)

  • Zen 3 – 100,00%
  • Zen 4 – 124,71%
  • Zen 5 – 140,94%

La publicación del blog de David analiza ampliamente los diversos aspectos arquitectónicos de la arquitectura Zen 5. que no solo alimentará las APU Ryzen AI 300 «Strix Point», sino también varias CPU diferentes, como la familia de computadoras de escritorio Ryzen 9000 «Granite Ridge», la familia de servidores EPYC «Turin» de quinta generación y varias otras APU para plataformas de escritorio y portátiles. .

Lo que sabemos oficialmente es que los núcleos Zen 5 vienen con un aumento promedio de IPC del 16% y varía para diferentes cargas de trabajo, por lo que una vez más aconsejaremos a nuestros lectores que tomen estos resultados con una pizca de sal. Se espera el primer lanzamiento de Zen 5 con las APU Strix a mediados de julio, seguido de los chips de escritorio de alto rendimiento Ryzen 9000 a finales de julio, así que estad atentos para obtener más información.

Fuente de noticias: David Huang

Comparte esta historia

Facebook

Gorjeo