Transcripción de NVIDIA: Vera Rubin ya está en plena producción y llega un nuevo CPU diseñado específicamente para agentes de IA

Keynote de NVIDIA GTC Taipéi 2026 con Jensen Huang — 1 de junio de 2026, Taipéi, Taiwán

Bienvenida y estado del ecosistema

Jensen Huang subió al escenario ante una cálida bienvenida en la GTC Taiwán, inaugurando el evento al reconocer la magnitud de la asistencia. Señaló que se estaban llevando a cabo 70 fiestas de lanzamiento simultáneas en todo Taiwán, todas siguiendo la presentación en vivo. Presentó a sus padres ante la audiencia entre aplausos antes de agradecer a los artistas del espectáculo previo.

Huang reflexionó sobre la amplitud del ecosistema de NVIDIA, señalando que cuando la mayoría piensa en "ecosistema", se refiere a la pila de software y a la comunidad de desarrolladores que operan sobre los sistemas de computación que construye NVIDIA. Sin embargo, enfatizó que el ecosistema de NVIDIA se extiende hasta la cadena de suministro en Taiwán, donde todo comienza, y llega hasta los centros de datos y, finalmente, a los usuarios finales. Expresó su aprecio por el ecosistema taiwanés, describiéndolo como el mejor ecosistema de cadena de suministro del mundo. Mencionó que alguien le había comentado la noche anterior que se esperaba que el PIB anual de Taiwán creciera cerca de un 10 por ciento, calificándolo de increíble.

La IA agéntica ha llegado: la revolución de la productividad del software

Huang comenzó su presentación con un tema central: hace dos años, empezó a hablar de cómo la IA había pasado de la IA generativa a la siguiente ola, que denominó IA agéntica. Declaró que la IA agéntica ya ha llegado y que la IA útil es una realidad.

Para ilustrar este punto, hizo referencia a GitHub como una de las primeras aplicaciones de la IA agéntica en la programación de software. Describió el mercado de desarrollo de software profesional como uno compuesto por aproximadamente 30 a 40 millones de desarrolladores profesionales en todo el mundo. Luego presentó datos sobre los commits de GitHub: la medida de los desarrolladores que descargan, modifican y vuelven a subir código. En 2023, hubo 300 millones de commits. En 2024, 400 millones. En 2025, 500 millones. En los primeros meses de 2026, la cifra casi se ha triplicado.

Huang tradujo esto a términos económicos: 30 millones de desarrolladores de software representan aproximadamente tres billones de dólares en salarios anuales, lo que a su vez genera crecimiento económico en el resto de la economía. Esos tres billones de dólares en salarios están produciendo ahora casi el triple de resultados; efectivamente, nueve billones de dólares de productividad a partir de tres billones de dólares en salarios. Calificó esto como el potencial y la promesa de la IA.

Refutó enérgicamente la narrativa de que la IA reduce empleos, calificándola de sinsentido absoluto. Argumentó que está ocurriendo lo contrario: se están contratando más ingenieros de software precisamente porque el rendimiento por ingeniero se ha vuelto extraordinario. Si puedes contratar a un ingeniero de software y generar nueve billones de dólares en trabajo productivo, ¿por qué contratarías a menos? Afirmó que este efecto se reflejará en la economía muy pronto.

Los tokens como nueva unidad de ingresos y el patrón de computación detrás de los agentes

Huang conectó luego esta revolución de la productividad con la demanda de cómputo. Explicó que los tokens tienen ahora una demanda extraordinaria porque, si puedes producir este tipo de resultados, quieres producir más. Los tokens son ahora unidades rentables de ingresos y, debido a que la IA es ahora rentable, las empresas quieren construir más fábricas de IA y generar más tokens. Esto, dijo, es precisamente la razón por la que la demanda de cómputo en Taiwán se ha disparado y por la que todas las empresas del ecosistema están teniendo un desempeño tan positivo.

Describió un cambio fundamental en el patrón de computación. El modelo antiguo involucraba una aplicación, código ejecutándose dentro de esa aplicación y un sistema operativo. El nuevo modelo es un agente, que consiste en un modelo de lenguaje extenso (LLM) o varios, dentro de un entorno de orquestación (harness). Ese entorno orquesta al modelo para realizar trabajo productivo. Gestiona la entrada, la comprensión, la observación, el razonamiento, la actuación y el uso de herramientas. Las herramientas pueden incluir hojas de cálculo, navegadores web, motores de procesamiento de datos y motores de bases de datos. El agente gestiona la memoria de trabajo a corto plazo y la memoria a largo plazo, tal como lo hacen los humanos.

Destacó el uso de herramientas como un gran avance. Señaló que muchas personas le habían dicho que la IA agéntica dejaría fuera del negocio a las empresas de software. Dijo que lo contrario es cierto: debido a que habrá tantos agentes y el mundo ya no está limitado por el número de personas, esos agentes utilizarán más herramientas que nunca. Este es, de hecho, un momento increíble para ser una empresa de software, afirmó, pero el software debe presentarse al agente de una manera que este pueda utilizarlo.

Bibliotecas CUDA-X: el tesoro de NVIDIA para la era agéntica

Huang describió las mil bibliotecas CUDA-X de NVIDIA como el tesoro de la compañía. Explicó que NVIDIA ahora puede presentar estas bibliotecas CUDA-X a los agentes, quienes pueden utilizarlas de manera más efectiva incluso que los humanos. Remontó esto a CUDA, creado hace 20 años como una arquitectura única para la computación acelerada. Las bibliotecas abarcan una amplia gama de campos: cuLitho para litografía computacional, cuOpt para optimización de decisiones, cuDSS para solucionadores de matrices dispersas, AI-Q para investigación profunda en documentos estructurados y no estructurados, Aerial para redes de acceso por radio (RAN) con IA, PhysicsNeMo para física diferenciable y Parabricks para genómica.

Señaló que todas las bibliotecas CUDA-X vendrán ahora con "habilidades", esencialmente un manual que la IA lee y aprende a utilizar. Dijo que la capacidad de los agentes para usar estas bibliotecas será increíble, y todas las bibliotecas CUDA-X se están preparando para servir como herramientas para agentes.

La arquitectura desagregada de la computación agéntica

Huang recorrió la arquitectura distribuida que subyace a la IA agéntica. Describió al agente como el modelo de computación desagregado y distribuido definitivo, donde muchas computadoras diferentes se activan para procesar el trabajo de un solo agente. El modelo, el entorno de orquestación, las herramientas, las habilidades y el tiempo de ejecución se ejecutan en diferentes partes de un centro de datos.

Ofreció una analogía: piense en el modelo como el cerebro, el entorno de orquestación como el cuerpo y las herramientas como los objetos utilizados en un taller. El trabajador —el agente— trabaja con herramientas en ese taller a una escala extraordinariamente grande. Cada paso del proceso se ejecuta en una parte diferente de la computadora. Cuando el modelo de lenguaje extenso está pensando —procesando contexto, razonando, planificando, actuando— se activa todo un rack de Grace Blackwell NVLink 72. Cuando el agente utiliza una herramienta, se emplea un CPU. El entorno de seguridad se ejecuta en CPUs y en un procesador de seguridad llamado DPU, el BlueField de NVIDIA. La orquestación de todo se ejecuta en un CPU.

Describió el sistema de memoria como una de las partes más difíciles. La memoria de trabajo, llamada caché KV, implica la compresión y recuperación de datos tanto estructurados como no estructurados, con complejas relaciones ontológicas entre diferentes estructuras de datos. Dijo que el sistema de memoria de la IA provocará que el sistema de almacenamiento se revolucione por completo.

Huang afirmó que este problema de computación desagregada, distribuida y heterogénea es precisamente la razón por la que NVIDIA construyó su próxima generación: Vera Rubin.

Vera Rubin: la primera supercomputadora de IA a escala de rack y pod, ya en plena producción

Huang presentó a Vera Rubin no como un solo chip ni solo como un GPU. Dijo que Vera Rubin es el sistema completo, de principio a fin. Incluye GPUs Vera Rubin NVL72, CPUs Vera, un sistema de almacenamiento revolucionario, redes ConnectX-9, la pila de software DOCA y un procesador de seguridad que garantiza que todo esté cifrado en reposo, en movimiento y en uso. Calificó a Vera Rubin como el esfuerzo más ambicioso en la historia de NVIDIA, con los 40.000 ingenieros de la compañía trabajando en ello, junto con el ecosistema más amplio.

Hizo un anuncio importante: Vera Rubin ya está en plena producción. Dijo que la cadena de suministro creada para Vera Rubin es dos veces más grande que la de Grace Blackwell, y lo que antes tomaba dos horas para ensamblar un rack de Grace Blackwell ahora toma solo cinco minutos. Agradeció al ecosistema de Taiwán por este logro.

Se mostró un video narrado que describía los detalles técnicos y de fabricación de Vera Rubin. El sistema comienza en TSMC con un proceso de tres nanómetros, empaquetado avanzado CoWoS y memoria HBM4 de Micron, SK Hynix y Samsung. El GPU Vera Rubin cuenta con seis billones de transistores y más de 18.000 componentes en una sola placa. El Vera Rubin NVL72 maneja la comprensión de prompts y contexto, el razonamiento y la planificación. El sistema utiliza una nueva bandeja de cómputo modular con un nuevo plano medio (midplane) de PCB, SuperNICs ConnectX-9 y DPUs BlueField-4, todo accesible para mantenimiento sin cables. Hay 18 bandejas de cómputo y nueve bandejas de conmutación NVLink intercambiables en caliente. Las nuevas barras colectoras de refrigeración líquida de alta eficiencia transportan más de 5.000 amperios, el equivalente a 20 autos eléctricos en plena aceleración. En conjunto, 1,3 millones de componentes forman este rack MGX de tercera generación. El video felicitó a Microsoft, Dell y CoreWeave por implementar sus racks de ingeniería Vera Rubin NVL72.

El video también describió el rack de CPU Vera, que alberga 256 CPUs en un solo rack refrigerado por líquido para orquestar modelos, gestionar la memoria y ejecutar herramientas. El rack Vera LPX, desarrollado por Foxconn y Quanta, alberga 256 LPUs de Groq en 16 bandejas con 40 petabytes por segundo de ancho de banda SRAM para una latencia ultrabaja. Mientras que el NVL72 genera tokens con el mayor rendimiento, el rack LPX los genera con la menor latencia. El video también destacó el Vera BlueField-4 STX para el procesamiento de almacenamiento y seguridad en silicio, y la fotónica Ethernet NVIDIA Spectrum-X, descrita como el primer conmutador Ethernet del mundo con óptica coempaquetada (CPO) de 200 gigabits. El sistema completo, cinco sistemas conectados a escala de rack, se describió como una supercomputadora para agentes de IA, construida con 150 socios de la cadena de suministro en Taiwán.

Después del video, se llevaron sistemas de rack físicos al escenario. Huang mostró el Vera Rubin NVL72, el rack LPX, el rack de CPU Vera con 256 CPUs refrigerados por líquido, el sistema de procesamiento de almacenamiento y seguridad Vera BlueField, y el conmutador de red Mellanox, al que llamó el primer CPO del mundo. Destacó la eliminación de cables y mangueras del diseño, posible gracias a un plano medio de PCB que conecta ambos lados del rack, lo que reduce drásticamente el tiempo de ensamblaje y mejora la confiabilidad.

NVIDIA DSX: infraestructura de fábrica de IA a escala

Antes de profundizar en Vera Rubin, Huang presentó el marco DSX de NVIDIA para la infraestructura de fábricas de IA. Describió al mundo compitiendo por construir fábricas de IA, calificándolo como la mayor construcción de infraestructura en la historia de la humanidad. Señaló que las fábricas de IA de nivel de un gigavatio comenzaron con un costo de 20 a 30 mil millones de dólares, ahora están en 50 a 60 mil millones y pronto alcanzarán los 80 a 100 mil millones de dólares por gigavatio. Dijo que estas fábricas deben funcionar bien desde la primera vez, ya que el costo de capital es increíble.

Un video narrado describió DSX Sim, un plano de Omniverse que permite a los socios diseñar y validar una fábrica de IA NVIDIA Vera Rubin antes de pedir un solo rack: planificar el diseño, simular la energía y la refrigeración, diseñar la red y validar cada integración en un gemelo digital. Luego, DSX OS aprovisiona, opera, monitorea y repara la infraestructura. DSX MaxLPS permite a los operadores desplegar de forma segura más GPUs dentro del mismo presupuesto energético, señalando que las fábricas de IA actuales sobreaprovisionan energía hasta en un 40 por ciento. El sistema cuenta con una innovadora refrigeración líquida en caliente a 45 grados Celsius que utiliza menos agua y energía. DSX Flex lee señales de red en tiempo real y ajusta dinámicamente la energía cuando la red necesita alivio. El video afirmó que 100 gigavatios de fábricas de IA entrarán en funcionamiento antes de finales de la década.

Huang explicó que NVIDIA se ha convertido en una empresa de infraestructura de IA, no solo de GPUs o sistemas. Describió la lógica económica: el cómputo es ingreso, el rendimiento por vatio es ingreso, y la capacidad de levantar una fábrica rápidamente, operarla con alto rendimiento, mantener la confiabilidad y extender su vida útil son factores críticos que el enfoque totalmente integrado de NVIDIA aborda. Dijo que el costo por token de NVIDIA es el más bajo del mundo —no por un 10 por ciento, sino por múltiplos— debido al diseño conjunto extremo en todo el sistema.

NVIDIA Vera CPU: el primer CPU construido para agentes, no para personas

Huang pasó entonces a lo que llamó un nuevo motor de crecimiento importante: el CPU Vera, construido específicamente para la era agéntica.

Argumentó que todos los CPUs hasta ahora fueron creados para personas: humanos que viven en un mundo contado en segundos, que alquilan núcleos de CPU en la nube a tarifas por hora. Los agentes son fundamentalmente diferentes. Son impacientes. Viven en un mundo contado en nanosegundos. Cuando un agente utiliza una herramienta o accede a una base de datos, la respuesta debe llegar lo más rápido posible. Cada momento de espera impide que el agente pase al siguiente paso. Y debido a que los CPUs se encuentran en la ruta crítica junto a una infraestructura de GPU extremadamente costosa que genera ingresos por tokens, estos CPUs deben ser tanto de alto rendimiento como altamente eficientes energéticamente.

Esbozó cuatro propiedades definitorias de Vera. Primero, instrucciones por ciclo: las más altas del mundo con 10 instrucciones obtenidas, decodificadas y ejecutadas por ciclo, ofreciendo el mejor rendimiento de un solo hilo y baja latencia. Segundo, ancho de banda por núcleo: de clase mundial. Tercero, ancho de banda total alrededor y dentro del chip: dado que los sistemas agénticos están fundamentalmente desagregados y distribuidos, el movimiento de datos y las redes se convierten en el problema. Vera cuenta con una estructura de coherencia escalable de segunda generación que conecta los 88 núcleos Olympus en una malla monolítica a 3,6 terabytes por segundo, sin cruces de límites de viaje. Es el primer CPU que utiliza PCIe Gen 6 y el primero en usar memoria LPDDR5X con 1,2 terabytes por segundo —dos a tres veces el ancho de banda de los CPUs de mayor rendimiento en el mercado— mientras corrige múltiples errores simultáneamente sin comprometer el ancho de banda. Cuarto, eficiencia energética: permitiendo que el sistema incluya tantos CPUs como sea posible en la fábrica sin quitar energía a la generación de tokens.

Un video narrado profundizó en la arquitectura técnica del CPU Vera. El núcleo NVIDIA Olympus en el corazón de Vera está diseñado para cargas de trabajo modernas de centros de datos, incluyendo tiempos de ejecución de Python con muchas ramificaciones, llamadas a herramientas y ejecución de código en entornos aislados (sandbox). Cada núcleo cuenta con un predictor de ramificaciones neuronal que evalúa dos ramificaciones tomadas por ciclo, un motor de decodificación de 10 vías, un gran motor fuera de orden y prebuscadores avanzados con un novedoso motor de grafos. El video describió que Vera logra un 40 por ciento menos de latencia máxima de memoria en comparación con x86. NVLink chip-a-chip coherente con la memoria conecta los GPUs directamente al CPU y también puede escalar Vera a múltiples sockets. Vera ofrece 1,8 veces el rendimiento de entorno aislado agéntico de los CPUs x86.

Al regresar al escenario, Huang presentó los resultados de las pruebas de rendimiento. Mostró SQL ejecutándose tres veces más rápido en Vera, calificándolo de extraordinario, ya que SQL es una de las cargas de trabajo más difíciles de acelerar. También presentó resultados de procesamiento de flujos en tiempo real para la Bolsa de Nueva York, donde el CPU Vera funciona seis veces más rápido, atribuyéndolo a las mejoras en el ancho de banda, la ejecución de instrucciones de un solo hilo y las mejoras de ancho de banda interno y externo de la arquitectura.

Señaló que casi todos los principales fabricantes de equipos originales (OEM) y de diseño original (ODM) en Taiwán apoyan a Vera. Dijo que los primeros adoptantes son las empresas agénticas, y esto representa un nuevo mercado que nunca antes había existido: CPUs para agentes. Afirmó que habrá muchos más agentes que personas, y los agentes son muy impacientes, lo que hace que este mercado sea seguramente más grande que el anterior. Agregó que los pedidos ya están realizados y predijo que Vera será el lanzamiento de producto más rápido y exitoso en la historia de la compañía.

NVIDIA Agent Toolkit para IA empresarial

Huang presentó lo que describió como la conclusión más importante de la presentación: el NVIDIA Agent Toolkit para IA empresarial. Dijo que todas las empresas ejecutarán agentes, todas tendrán agentes en su interior y todas se preguntan cómo ejecutar agentes de forma segura y cómo construirlos para sus propias cargas de trabajo.

El kit de herramientas tiene cuatro componentes. Primero, modelos: modelos de lenguaje extenso, cuanto más inteligentes, baratos y rápidos, mejor. Segundo, un entorno de orquestación para coordinar todo. Tercero, herramientas con habilidades, incluyendo las bibliotecas CUDA-X. Cuarto, un tiempo de ejecución: el sistema operativo que mantiene todo unido, al que NVIDIA llama OpenShell. OpenShell es un entorno altamente seguro para uso empresarial que protege al agente, lo mantiene fundamentado en políticas de seguridad, protege la privacidad, gestiona derechos y privilegios, y protege la identidad. Es de código abierto y está siendo adoptado ampliamente, incluso por Red Hat, Canonical y Microsoft. El kit también incluye entornos agénticos abiertos como OpenClaw y Hermes.

Como demostración del kit en acción, Huang describió una asociación con Cadence para construir un superagente de diseño de chips. Un video narrado mostró al agente —orquestado por Codex o Claude Code, impulsado por Nemotron y asegurado por NVIDIA OpenShell— ejecutando un flujo de trabajo de verificación de diseño. Los subagentes manejan la generación de RTL, la creación de bancos de pruebas, las pruebas de regresión y la depuración. Los agentes de Chip Stack ejecutan cientos de simulaciones con Cadence Xcelium y verificación formal con JasperGold. Lo que antes tomaba semanas a los equipos ahora toma horas: ciclos de verificación más de 40 veces más rápidos.

Huang dijo que NVIDIA tiene miles de diseñadores de chips y contratará a cientos de miles de superagentes de Cadence para trabajar junto a ellos y así acelerar aún más. Luego anunció Nemotron 3 Ultra, descrito como el primer modelo del mundo basado en una arquitectura híbrida que combina modelos de espacio de estados (State Space Models) con una mezcla de expertos (Mixture of Experts). Dijo que es cinco veces más rápido y un 30 por ciento más barato de ejecutar que incluso los modelos más rentables del mundo, comparándose favorablemente con los mejores modelos abiertos del mundo. Al igual que con los modelos Nemotron anteriores, NVIDIA no solo lanza el modelo, sino todos los datos y scripts de entrenamiento para que cualquiera pueda tomarlo, añadirle contenido y hacerlo suyo. Señaló que NVIDIA ya está trabajando en Nemotron 4.

Enumeró a los socios de software empresarial que ya trabajan con el kit: Cadence, CrowdStrike, ServiceNow, Palantir y SAP. Reiteró su opinión de que los agentes no interrumpirán a estas empresas, sino que crearán la mayor oportunidad de la historia para los socios de software empresarial.

Reinventando la PC: RTX Spark, máquinas Windows y la DGX Station

Huang cambió el enfoque a la computación personal, enmarcando la discusión en el contexto de los 40 años de historia de la PC. Dijo que Microsoft y NVIDIA van a reinventar la PC para la era de los agentes, tras haber pasado tres años trabajando juntos para reimaginar fundamentalmente cómo funcionará la PC.

Presentó RTX Spark, descrito como todo lo que NVIDIA ha aprendido en 33 años destilado en un solo chip. RTX Spark cuenta con un GPU Blackwell RTX con 6.144 núcleos Tensor, un petaflop de rendimiento de IA, un CPU Grace personalizado de 20 núcleos construido en asociación con MediaTek, fusión NVLink, 128 gigabytes de memoria unificada, proceso de 3 nanómetros de TSMC y 70 mil millones de transistores. Dijo que el 100 por ciento del software de NVIDIA se ejecuta en él —biología digital, procesamiento sísmico, astrofísica, toda la física, biología, genómica, IA y gráficos por computadora— y cada aplicación que Windows ha ejecutado jamás. Dijo que Microsoft y NVIDIA optimizaron meticulosamente todo para que la computadora ejecute todo lo que el mundo ha creado, además de agentes.

Un video narrado demostró un agente ejecutándose localmente en RTX Spark ayudando a diseñar una casa. El agente operaba a través de un entorno aislado OpenShell ejecutando el entorno Hermes, conectado a Claude Sonnet en la nube, utilizando herramientas en la computadora portátil, incluyendo Rhino para modelado 3D y Blender para renderizado. El agente modeló el sitio, dio forma al terreno, propuso formas de construcción optimizadas para el costo y la comodidad, generó diseños interiores, colocó puertas, ventanas y elementos estructurales automáticamente, detectó y corrigió sus propios errores, exportó el modelo de Rhino a Blender con materiales y propiedades de objeto intactos, y utilizó el modelo de IA generativa Flux 2 para producir renders fotorrealistas en múltiples puntos de vista y condiciones de iluminación.

También destacó a Adobe como socio, señalando que han rediseñado el núcleo de Photoshop y Premiere para RTX Spark, haciendo que las aplicaciones sean el doble de rápidas y diseñándolas para que sean amigables con los agentes a través de un servidor MCP que permite la interacción con agentes en la computadora portátil.

Huang anunció luego una línea de PC más amplia: tres máquinas Windows revolucionarias que cubren escritorio, computadora portátil y estación de trabajo, todas 100 por ciento compatibles con Windows, 100 por ciento CUDA y 100 por ciento con núcleos Tensor de IA de NVIDIA. Mostró una versión de escritorio MSI de la plataforma RTX Spark y la describió como capaz de ejecutar un agente las 24 horas del día, los siete días de la semana, sin ansiedad por el consumo, conectada a toda la casa del usuario —computadora portátil, pantalla, cámaras, electrodomésticos y sistema de seguridad— funcionando como un agente de IA personal que se vuelve más inteligente con el tiempo.

También anunció la DGX Station, compatible con Windows, con 768 gigabytes de memoria, 20 petaflops de cómputo y ocho terabytes por segundo de ancho de banda de memoria, capaz de ejecutar un modelo de un billón de parámetros y situarse junto al escritorio de un desarrollador. Dijo que esto representa el comienzo de una nueva familia de productos —una nueva línea— con una hoja de ruta que entregará un escritorio, computadora portátil y estación de trabajo para cada generación de arquitectura en el futuro.

Comparó la transformación esperada de la PC con lo que sucedió con el teléfono. Hace veinte años, un teléfono era un teléfono. Hoy, la gente apenas usa su teléfono para hacer llamadas. Expresó su certeza de que la PC dentro de 10 años será completamente diferente: que así como cada casa hoy tiene un cine en casa y electrodomésticos, algún día habrá una supercomputadora de IA en cada casa ejecutando todos los agentes y asistentes de su propietario durante todo el día. Dijo que esto se sentirá más como R2-D2 o C-3PO que como una PC tradicional, y que esta reinvención es tan importante como la transformación del teléfono en el teléfono inteligente.

IA física: Cosmos 3, vehículos autónomos y robótica humanoide

Huang se centró en la IA física y la robótica, señalando que la IA agéntica es esencialmente un robot digital: entiende, razona, planifica y actúa. El mismo patrón de computación se ejecutará en todo tipo de sistemas físicos.

Describió el desafío de los datos para la IA física: los datos de entrenamiento de los modelos de lenguaje fueron escritos desde la perspectiva humana, pero los datos de entrenamiento de los robots deben provenir de la perspectiva del robot. La mayoría de los datos de video del mundo provienen de un punto de vista en tercera persona, no en primera persona. Esbozó una escalera de progreso desde la teleoperación y la demostración humana a través del entrenamiento basado en simulación, luego aprendiendo de datos en tercera persona reproyectados a primera persona, y finalmente un Modelo de Fundación Mundial que entiende el mundo físico desde cualquier perspectiva.

Huang anunció Cosmos 3, calificándolo como la frontera de la IA física. Dijo que NVIDIA es absolutamente la mejor del mundo en IA física y describió a Cosmos 3 como un modelo de fundación para cualquier trabajo que involucre el mundo físico: robots de fábrica, cualquier robot operando en un entorno físico. Un video narrado describió a Cosmos como un modelo omni de frontera abierta construido sobre una nueva arquitectura de Mezcla de Transformers. Los píxeles, la acción, el sonido y el lenguaje fluyen hacia un transformador autorregresivo que razona, planifica e instruye a un transformador de difusión que genera lo que sigue. Cosmos puede funcionar como un modelo de visión-lenguaje que observa y entiende el mundo físico, como un modelo mundial que genera video sintético con física precisa, como un simulador que cierra el ciclo para el entrenamiento y evaluación de políticas, y como la base de NVIDIA OmniDreams, un modelo mundial condicionado por la acción que predice el futuro fotograma a fotograma. Cosmos es abierto: el modelo, los datos y la metodología de entrenamiento se publican abiertamente.

Luego anunció Alpamayo 2 Super, descrito como un modelo abierto para autos autónomos y el primer vehículo autónomo con razonamiento del mundo. Señaló que marcas que representan aproximadamente el 80 por ciento de los fabricantes de automóviles del mundo se han registrado para NVIDIA DRIVE Hyperion, y aproximadamente el 97 por ciento de los servicios de movilidad del mundo se están conectando con NVIDIA. Un video de demostración mostró un vehículo Mercedes navegando por escenarios de conducción urbana —gestionando peatones, señales de alto, cambios de carril, vehículos que se cruzan y carriles bloqueados— mientras el sistema narraba su razonamiento en tiempo real. Huang bromeó diciendo que, aunque el auto narrándose a sí mismo todo el tiempo volvería loco a un pasajero, la narración representa el pensamiento, y eso es exactamente lo que quieren.

Luego abordó la robótica humanoide, describiendo la plataforma NVIDIA Isaac GR00T como la que cubre la pila completa de robótica humanoide: modelo, generación de datos, simulación, tiempo de ejecución y sistema operativo. Anunció el robot humanoide de referencia NVIDIA Isaac GR00T, descrito como totalmente integrado con 25 grados de libertad en cada mano fabricado por Sharpa, 31 grados de libertad en total, midiendo 6 pies de altura y pesando 150 libras, ejecutándose en la nueva plataforma Jetson Thor y la pila de software completa Isaac GR00T. Dijo que la plataforma se construyó principalmente para la educación superior y los investigadores universitarios, para quienes construir un robot así desde cero sería increíblemente difícil. Un video narrado describió el flujo de trabajo completo: configurar la simulación en Isaac Lab, capturar demostraciones con Isaac Teleoperation, generar datos sintéticos con Omniverse y Cosmos, entrenar políticas, evaluarlas en Isaac Lab Arena y desplegarlas a través de Isaac ROS en Jetson Thor, con cada elemento modular y abierto.

Resumen de cierre

Huang cerró con un resumen de los anuncios principales. Vera Rubin está en plena producción; no solo un GPU, sino todo un sistema de procesamiento de agentes distribuido y desagregado. NVIDIA se ha convertido en una empresa de infraestructura de IA. El CPU Vera es una arquitectura revolucionaria construida para agentes, no para personas, con propiedades fundamentalmente diferentes a todos los CPUs anteriores. Los pedidos ya están realizados y se espera que sea el lanzamiento de producto más rápido y exitoso de NVIDIA. Microsoft y NVIDIA han creado toda una nueva línea de PCs para la era de los agentes, con todos los fabricantes de PC del mundo uniéndose al esfuerzo. El mismo patrón de computación agéntica se replicará en nubes, empresas, PCs, robots, satélites, estaciones base y fábricas.

Expresó su confianza en que la forma en que la gente piensa sobre la computadora personal cambiará profundamente, y agradeció al ecosistema de Taiwán por su asociación, amistad y trabajo extraordinario durante el último año. Cerró dando la bienvenida a todos a Computex 2026.

Análisis profundo de NVIDIA

La arquitectura de la computación

NVIDIA ha completado su metamorfosis de ser un proveedor de procesadores gráficos discretos a convertirse en un arquitecto integral de la era de la inteligencia. El modelo de negocio de la compañía se basa fundamentalmente en la ingeniería y monetización de plataformas de computación acelerada que impulsan la inteligencia artificial, la computación de alto rendimiento y la visualización avanzada de datos. En lugar de limitarse a vender silicio comercial, NVIDIA vende una infraestructura completamente integrada. El ecosistema abarca el hardware de computación subyacente, incluidas las unidades de procesamiento gráfico (GPU) y las unidades centrales de procesamiento (CPU), así como equipos críticos de red para centros de datos, como InfiniBand y switches Ethernet. Esta capa de hardware está fuertemente fortificada por una extensa pila de software propietario, lo que permite a la compañía capturar valor en toda la arquitectura del centro de datos.

La traducción financiera de esta estrategia integral es asombrosa. En el primer trimestre del año fiscal 2027, la compañía registró ingresos totales de $81.600 millones, lo que representa una expansión del 85% interanual. El segmento de Data Center eclipsa ahora por completo al negocio tradicional de gaming, generando $75.200 millones en el mismo trimestre. Fundamentalmente, NVIDIA ha transformado con éxito las redes de ser un complemento auxiliar a un pilar estructural independiente. Solo los ingresos por redes para centros de datos alcanzaron los $14.800 millones en el trimestre, impulsados en gran medida por la adopción de Spectrum-X Ethernet y las interconexiones NVLink. Además, la empresa está expandiendo sistemáticamente sus ingresos recurrentes por software a través de NVIDIA AI Enterprise, monetizado a aproximadamente $4.500 por GPU al año, añadiendo una economía de suscripción de alto margen sobre su base instalada de hardware. Este apalancamiento operativo se refleja profundamente en el perfil de rentabilidad de la compañía, que arroja márgenes brutos del 74,9% y generó $48.600 millones en flujo de caja libre en un solo trimestre.

El ecosistema: clientes, proveedores y competidores

La base de clientes de NVIDIA refleja los motores duales del despliegue global de inteligencia artificial. Actualmente, la división de ingresos dentro del segmento de Data Center se encuentra en un equilibrio exacto: aproximadamente el 50% de la demanda proviene de los proveedores de servicios en la nube a hiperescala, incluidos Microsoft, Alphabet, Amazon y Meta, mientras que el 50% restante se distribuye entre iniciativas soberanas de IA, centros de datos empresariales y aplicaciones industriales. Esta diversificación es un factor crítico de mitigación de riesgos, lo que demuestra que la demanda de computación acelerada se ha ampliado con éxito más allá de un puñado concentrado de gigantes de infraestructura en la nube.

En el lado de la oferta, la principal vulnerabilidad y limitación de NVIDIA sigue estando vinculada estructuralmente a Taiwan Semiconductor Manufacturing Company. La complejidad física de los sistemas de múltiples chips de la compañía la hace altamente dependiente de la capacidad de empaquetado avanzado CoWoS de la fundición. Para finales de 2026, se espera que la capacidad mensual total de CoWoS alcance entre 120.000 y 130.000 obleas, de las cuales NVIDIA controla una participación masiva del 60%. Además, la compañía depende en gran medida de proveedores de memoria como SK Hynix y Micron para sus módulos críticos de High Bandwidth Memory, creando una cadena de suministro altamente compleja y de múltiples niveles donde cualquier cuello de botella estrangula inmediatamente los ingresos reconocidos.

El panorama competitivo se está intensificando en dos vectores distintos: rivales de silicio comercial e ingeniería interna de hiperescala. Advanced Micro Devices sigue siendo el competidor comercial más visible, desplegando sus arquitecturas de las series MI350 y la próxima MI400. Sin embargo, la amenaza mucho más existencial proviene de los clientes más grandes de NVIDIA. El despliegue de Alphabet de sus procesadores propietarios TPU v6e Trillium y TPU v7 Ironwood, junto con Trainium 2 de Amazon, representan esfuerzos creíbles y altamente financiados para eludir los márgenes de NVIDIA. A medida que los proveedores de nube buscan optimizar el costo total de propiedad y reducir la dependencia absoluta de un solo proveedor, los programas internos de silicio están recibiendo compromisos de capital prácticamente ilimitados.

Cuota de mercado y la fortaleza de CUDA

A pesar del creciente ruido competitivo, nuestro análisis del mercado de aceleradores para centros de datos de 2026 indica que NVIDIA sigue controlando aproximadamente el 80% de la cuota de mercado global por ingresos. La cartera Instinct de Advanced Micro Devices ha establecido un punto de apoyo duradero pero menor, capturando entre el 5% y el 7% del mercado. Este dominio persistente del mercado no es solo una función del rendimiento aritmético; está fuertemente protegido por la plataforma de software Compute Unified Device Architecture (CUDA) de NVIDIA. Durante casi dos décadas, este ecosistema se ha convertido en la *lingua franca* definitiva para la computación paralela y el desarrollo de inteligencia artificial.

Los competidores pueden igualar o superar teóricamente a NVIDIA en especificaciones de hardware, como el ancho de banda de memoria o teraflops por segundo. Sin embargo, desplazar a NVIDIA requiere convencer a los desarrolladores empresariales de que abandonen un ecosistema de software altamente maduro y documentado en favor de alternativas incipientes. Además, la cuota de mercado está cada vez más protegida por el dominio en redes. A medida que los modelos de inteligencia artificial escalan a billones de parámetros, entrenarlos requiere sincronizar perfectamente decenas de miles de procesadores. La capacidad de NVIDIA para vender toda la arquitectura a escala de rack, integrando sin problemas unidades de procesamiento, switches y unidades de procesamiento de datos (DPU), crea un estándar de rendimiento integrado que los competidores fragmentados luchan por replicar. Este profundo arraigo estructural asegura que la barrera de entrada siga siendo prohibitivamente alta.

Horizontes generacionales: Blackwell y Rubin

El ciclo de productos de hardware es el catalizador central para la futura aceleración de los ingresos. Con la arquitectura Hopper habiendo sentado las bases del auge de la computación generativa, el aumento del volumen de la generación Blackwell está impulsando actualmente los despliegues de infraestructura a principios de 2026. NVIDIA, sin embargo, ya ha diseñado el próximo ciclo de obsolescencia con la introducción de su plataforma Vera Rubin, programada para disponibilidad en la nube a gran escala en la segunda mitad de 2026. La familia de productos Rubin representa un profundo salto arquitectónico.

La unidad central R100 dentro de la plataforma Rubin utiliza un proceso de 3nm e integra 336.000 millones de transistores, una expansión masiva respecto a la generación anterior. Transiciona a la industria a la memoria HBM4 de próxima generación, proporcionando 288GB de capacidad de memoria y 50 PFLOPS de cómputo FP4 por chip. De manera igual de crítica, la generación Rubin impulsa agresivamente la unidad central de procesamiento Vera, propiedad de NVIDIA, hacia el centro de datos. Al acoplar el acelerador central con un procesador basado en ARM, NVIDIA está atacando explícitamente el mercado de servidores de propósito general, desbloqueando un mercado total direccionable completamente nuevo de $200.000 millones. La dirección afirma que la plataforma Rubin ofrece una reducción de hasta 10 veces en el costo de tokens de inferencia a escala, reiniciando por completo la economía unitaria del despliegue y forzando a la industria a un ciclo de actualización involuntario.

Dinámica de la industria y participantes disruptivos

El mercado de infraestructura de centros de datos ha cambiado estructuralmente de gastos de capital basados en cómputo general a fábricas de inteligencia especializadas. La oportunidad principal reside en la proliferación de marcos de trabajo agentes y la computación de borde (edge computing) localizada. A medida que las demandas de inferencia aumentan exponencialmente, impulsadas por aplicaciones capaces de voz, video y razonamiento autónomo en tiempo real, el requisito de instancias de cómputo localizadas está expandiendo el mercado total direccionable más allá de las instalaciones tradicionales de hiperescala. Además, el advenimiento de la inteligencia artificial soberana, donde los estados-nación están invirtiendo activamente miles de millones para construir infraestructura localizada, está proporcionando una capa de demanda altamente duradera y no correlacionada.

Por el contrario, la industria enfrenta severas restricciones físicas y termodinámicas. La principal amenaza para el despliegue continuo no es la disponibilidad de capital, sino la densidad de potencia y térmica. La métrica de competencia está cambiando rápidamente del rendimiento absoluto a los tokens por megavatio. Esta dinámica exacta está creando una ventana para nuevos participantes disruptivos que se dirigen específicamente a cargas de trabajo de inferencia de baja potencia y alto rendimiento. Empresas como Cerebras y Groq han superado la fase de riesgo especulativo y están asegurando activamente contratos comerciales significativos, utilizando una integración única a nivel de oblea y arquitecturas SRAM localizadas para eludir por completo los cuellos de botella de la memoria de gran ancho de banda. Si bien estos participantes no amenazan el control férreo de NVIDIA sobre el entrenamiento de modelos pesados, representan una amenaza creíble y muy específica para el futuro fondo de ingresos por inferencia.

Trayectoria de la gestión

Bajo el liderazgo de Jensen Huang, el equipo directivo ha demostrado una trayectoria inigualable de anticipación tecnológica y ejecución de la cadena de suministro. Durante los últimos tres años, la dirección identificó correctamente el cambio arquitectónico hacia la computación acelerada y aseguró agresivamente la capacidad de obleas mucho antes de que el mercado en general comprendiera la magnitud de la demanda inminente. Esta voluntad de comprometer miles de millones en obligaciones de compra no cancelables permitió a NVIDIA monopolizar esencialmente las primeras etapas del auge de la infraestructura.

El marco de asignación de capital de la dirección ha madurado en paralelo con su flujo de caja operativo. Históricamente vista como una entidad de crecimiento volátil, NVIDIA se ha transformado rápidamente en un vehículo estructural de retorno de efectivo. Solo en el primer trimestre del año fiscal 2027, la compañía ejecutó aproximadamente $20.000 millones en retornos a los accionistas, anunció un aumento de 25 veces en su dividendo trimestral y autorizó un programa adicional de recompra de acciones por $80.000 millones. La precisión operativa requerida para gestionar una transición de la arquitectura Hopper a Blackwell, e inmediatamente a Rubin, sin canibalizar las ventas del trimestre actual ni sufrir amortizaciones de inventario catastróficas, subraya un equipo ejecutivo que opera en la cima absoluta de la competencia industrial.

El cuadro de mando

NVIDIA se erige como el proveedor de infraestructura definitorio de la era informática moderna, combinando una ingeniería de hardware inigualable con un foso de software profundamente arraigado. La magnitud de su ejecución financiera, evidenciada por un trimestre de $81.600 millones y márgenes brutos impecables del 74,9%, demuestra un modelo de negocio totalmente liberado de la ciclicidad de los semiconductores tradicionales. La expansión estratégica hacia sistemas completos a escala de rack, equipos de red propietarios y unidades centrales de procesamiento a través de la próxima plataforma Vera Rubin asegura virtualmente que la compañía capture un porcentaje creciente del gasto de capital global en centros de datos a mediano plazo.

La transición de monopolio absoluto a líder dominante del mercado está en pleno desarrollo. La rápida maduración del silicio personalizado de hiperescala, junto con las persistentes iteraciones de hardware de competidores comerciales directos y nuevos participantes que apuntan a arquitecturas de inferencia especializadas, comprimirá inevitablemente el margen de error histórico de la compañía. Si bien las limitaciones de empaquetado físico y un cuello de botella de energía en toda la industria limitan la expansión del volumen a corto plazo, el poder de fijación de precios y la fidelidad al ecosistema de la firma siguen siendo absolutos. Respaldado por una división de ingresos equitativa entre la nube y la empresa y una transformación proactiva hacia un ecosistema definido por software, el modelo de negocio central mantiene una profunda durabilidad estructural.

Leer a continuación

Análisis profundo de ERock: La cartera de pedidos de hipercrecimiento frente a la intensidad de capital y los gigantes industriales tradicionales

2026-06-08

Análisis a fondo de Forbright: Rediseñando el paradigma de la banca comercial mediante comisiones "asset-light" y captación digital de depósitos

2026-06-08

Análisis profundo de Parabilis Medicines: Eficacia excepcional en β-catenina frente a obstáculos en administración intravenosa y riesgos de concentración geopolítica

2026-06-08

Análisis profundo de Liftoff Mobile: Desacoplamiento y dominio en la economía independiente de aplicaciones

2026-06-08

Transcripción de NVIDIA: La plataforma de IA Vera Rubin entra en producción a gran escala mientras los agentes transforman la economía de la computación

2026-06-06

Bloomberg Live: Hock Tan de Broadcom afirma que las fusiones y adquisiciones han quedado atrás, y que los chips de OpenAI entrarán en producción a finales de año

2026-06-05

Aviso legal: Este artículo es solo para fines informativos y no constituye asesoramiento de inversión ni una recomendación para comprar, vender o mantener ningún valor. Nuestros analistas ofrecen una cobertura detallada de eventos corporativos, pero pueden cometer errores; siempre realiza tu propia investigación. Los puntos de vista y opiniones expresados no reflejan necesariamente los de DruckFin. No hemos verificado de forma independiente toda la información utilizada aquí, y puede contener errores u omisiones. Antes de tomar cualquier decisión de inversión, consulta a un asesor financiero calificado. DruckFin y sus afiliados no asumen ninguna responsabilidad por cualquier pérdida que surja de la confianza en este contenido. Para los términos completos, consulta nuestros Términos de Uso.