Las últimas GPU Blackwell de Nvidia son un par de tarjetas de estación de trabajo diminutas que tienen como objetivo ofrecer el mayor rendimiento posible para visualización profesional y cargas de trabajo de IA local con un consumo de energía de 70 vatios.
Presentadas el lunes en la conferencia Siggraph de Vancouver, Columbia Británica, las RTX Pro 4000 de formato pequeño (SFF) y la RTX Pro 2000 comparten el mismo diseño de disipador de doble ranura de media altura. Sin embargo, a pesar de sus similitudes, ambas tarjetas son muy diferentes: la RTX 4000 SFF incorpora más del doble de núcleos CUDA (8960) frente a los 4352 de la RTX Pro 2000.
Nvidia afirma que la RTX 4000 Ada SFF es aproximadamente 1,7 veces más rápida en trazado de rayos y ofrece un rendimiento de IA 2,5 veces superior al de su modelo anterior. Con 280 núcleos tensoriales, Nvidia afirma que el chip es capaz de ofrecer 770 teraFLOPS de rendimiento en FP4.
Si bien técnicamente representa una mejora de 2,51x en matemáticas de punto flotante, la mayor parte se debe a la transición a FP4, más que a mejoras arquitectónicas. Al normalizarlo a FP8, el chip es solo un 25% más rápido.
Si bien el rendimiento de punto flotante puede no dar un gran salto con la nueva y diminuta tarjeta, el ancho de banda de memoria, una métrica clave para la inferencia local, sí lo hace. Con 24 GB de memoria GDDR7, que ofrece 432 GB/s de ancho de banda, la tarjeta debería ser capaz de generar tokens en LLM como el recién lanzado gpt-oss-20b de OpenAI, aproximadamente un 54% más rápido que la anterior oferta de Nvidia.
Nvidia sugiere que la RTX Pro 2000 es ideal para cargas de trabajo de visualización profesional, pero también promete una mejora considerable del rendimiento. El gigante de las GPU afirma que se puede esperar una mejora de 1,6 veces en modelado 3D, un rendimiento 1,4 veces superior en CAD y un renderizado 1,6 veces más rápido en comparación con su predecesora de la generación Ada.
En cuanto al rendimiento de la IA, la tarjeta está muy por debajo de sus hermanas mayores o con mayor consumo de energía, pero no se queda atrás considerando su escaso TDP de 70 W. La tarjeta presume de hasta 545 teraFLOPS de computación FP4 dispersa y 280 GB/s de ancho de banda de memoria, alimentados por 16 GB de GDDR7.
Tanto las RTX Pro 4000 SFF como las 2000 estarán disponibles a partir de finales de este año en PNY y TD SYNNEX y se ofrecerán en sistemas OEM de BOXX, Dell, HP y Lenovo.
Las tarjetas completan la línea existente de GPU para estaciones de trabajo Blackwell de Nvidia anunciadas en su conferencia GTC de marzo, cuando la compañía reveló su RTX Pro 6000 de 96 GB.
También en Siggraph, Nvidia presentó una plataforma de servidor 2U compatible con dos tarjetas RTX Pro 6000 Server Edition de 600 W. Cada GPU ofrece hasta 4 petaFLOPS de rendimiento en FP4 escaso.
Los sistemas ya están disponibles en Cisco, Dell, HPE, Lenovo y Supermicro, entre otros.

