Nvidia presentó Vera Rubin, la nueva plataforma de IA de próxima generación
Nvidia destacó que esta plataforma reduce hasta 4 veces el número de GPUs necesarias para entrenar modelos avanzados mixture-of-experts en comparación con la generación Blackwell.
Por Gonzalo Andrés Castillo
Redactor especialista en finanzas y mercado de capitales
En el CES 2026 celebrado esta semana en Las Vegas, Nvidia lanzó oficialmente su nueva plataforma de inteligencia artificial llamada Vera Rubin, la evolución más ambiciosa de su línea de hardware para IA diseñada para sostener el crecimiento exponencial de los modelos de inteligencia artificial y sus demandas computacionales.
Vera Rubin no es un solo chip, sino una arquitectura integral compuesta por seis componentes principales que trabajan de forma integrada para ofrecer capacidades de cómputo que superan ampliamente a las generaciones anteriores. El nuevo conjunto incluye:
NVIDIA Vera CPU enfocada en razonamiento agente y movimiento de datos.
NVIDIA Rubin GPU, con poder de cálculo masivo para inferencia y entrenamiento.
NVLink 6 Switch, para una interconexión ultrarrápida entre GPUs.
ConnectX-9 SuperNIC y BlueField-4 DPU, para acelerar tareas de red e infraestructura.
Spectrum-6 Ethernet Switch, para redes de datos de alta escala. investor.nvidia.com
Nvidia destacó que esta plataforma reduce hasta 4 veces el número de GPUs necesarias para entrenar modelos avanzados mixture-of-experts en comparación con la generación Blackwell, y puede reducir el costo de procesamiento de tokens en 10 veces, abaratando considerablemente la inferencia de IA en aplicaciones de gran escala.
Arquitectura orientada a la nueva ola de IA
La compañía explicó que Vera Rubin fue diseñada para soportar “IA agente” y modelos de razonamiento avanzado, es decir, AI que puede tomar decisiones complejas y procesar tareas en múltiples pasos sin supervisión constante, algo que está ganando terreno en investigación y aplicaciones industriales.
Una de las características más llamativas de la plataforma es el sistema NVL72, un servidor rack-scale que combina 72 chips de Rubin y Vera, ofreciendo una infraestructura capaz de escalar hacia supercomputadoras de IA cuando varias unidades se combinan en un cluster tipo DGX SuperPOD. Grandes proveedores de nube como Microsoft Azure, AWS y Google Cloud planean adoptar instancias basadas en esta arquitectura una vez que esté disponible.
Producción y despliegue
Nvidia informó que Vera Rubin ya entró en producción completa, y se espera que los productos basados en esta plataforma empiecen a llegar al mercado durante la segunda mitad de 2026 a través de socios y proveedores de infraestructura.
