DruckFin

Transcripción de NVIDIA: La plataforma de IA Vera Rubin entra en producción a gran escala mientras los agentes transforman la economía de la computación

Discurso principal en GTC Taipei 2026 - 1 de junio de 2026

Jensen Huang subió al escenario en GTC Taipei para anunciar que la ambiciosa plataforma Vera Rubin de NVIDIA ya se encuentra en plena producción, marcando lo que calificó como el cambio más significativo en la computación desde la revolución de la PC. El discurso, transmitido a 70 eventos simultáneos en todo Taiwán, enfatizó que la IA útil ya es una realidad y que la economía de la computación ha cambiado fundamentalmente.

La economía de la IA: Los tokens equivalen a ingresos

Huang comenzó con pruebas contundentes de que la IA agente ha pasado de ser una promesa a una realidad productiva. Al mostrar datos de confirmaciones (commits) en GitHub, reveló que, si bien 30 millones de desarrolladores de software produjeron históricamente 300 millones de commits en 2023, esa cifra alcanzó los 500 millones en 2025. En los primeros meses de 2026, los commits casi se han triplicado, llegando a aproximadamente 900 millones.

Las implicaciones económicas son profundas. Huang explicó que tres billones de dólares en salarios de desarrolladores generan ahora lo que anteriormente requeriría nueve billones de dólares en productividad humana. Esto representa la primera prueba tangible de que la IA genera un crecimiento medible del PIB. Subrayó que, contrariamente a los temores sobre el desplazamiento laboral, las empresas están contratando más ingenieros de software porque la producción por ingeniero se ha vuelto extremadamente valiosa.

Este aumento en la productividad ha creado una demanda sin precedentes de infraestructura de cómputo. Huang señaló que, debido a que los tokens son ahora unidades de ingresos rentables, las empresas de IA desean generar muchos más, impulsando el crecimiento explosivo que experimenta el ecosistema de semiconductores de Taiwán. Hizo referencia al crecimiento proyectado del PIB de Taiwán, de casi el 10 por ciento, como evidencia directa de esta demanda de cómputo.

Entendiendo el modelo de computación agente

Huang dedicó un tiempo considerable a explicar cómo los agentes difieren fundamentalmente de las aplicaciones tradicionales. Un agente consiste en un modelo de lenguaje de gran escala (LLM) dentro de un entorno que orquesta la observación, el razonamiento, la planificación y la acción. El agente utiliza herramientas —hojas de cálculo, navegadores web, bases de datos o motores de computación especializados—, todo gestionado por el entorno de forma muy similar a como un sistema operativo gestiona las aplicaciones.

La demostración incluyó la generación de una animación GIF del edificio Taipei 101 mediante simples instrucciones de texto, la creación de archivos CAD para impresión 3D a partir de descripciones verbales y la ejecución de tareas complejas mediante lenguaje natural. Huang destacó que el patrón de computación ha cambiado: ya no se trata de abrir aplicaciones y hacer clic en botones, sino de explicar la intención a la IA, que luego genera código o utiliza herramientas para producir resultados.

Una revelación importante se refirió al uso de herramientas. Huang abordó la idea errónea de que la IA agente dejaría obsoletas a las empresas de software. Argumentó lo contrario: debido a que el mundo ya no estará limitado por el número de trabajadores humanos, los agentes utilizarán exponencialmente más herramientas de las que las personas podrían usar jamás. Esto representa una oportunidad sin precedentes para las empresas de software, siempre que sus herramientas se presenten de forma que los agentes puedan utilizarlas.

El desafío de la computación desagregada

El modelo de computación agente representa la arquitectura de computación distribuida y desagregada definitiva. Diferentes componentes se ejecutan en distintas partes de un centro de datos. El proceso de razonamiento del LLM activa racks completos de sistemas Grace Blackwell NVLink 72. El uso de herramientas activa CPUs que ejecutan compiladores, Python, JavaScript o bibliotecas de computación acelerada. Los entornos de seguridad se ejecutan en CPUs y DPUs como BlueField de NVIDIA. La orquestación ocurre en CPUs que gestionan todo el flujo de trabajo.

La gestión de memoria surgió como uno de los desafíos más complejos. La memoria de trabajo, llamada caché KV, debe gestionar la compresión y recuperación de datos estructurados y no estructurados. La ontología y las relaciones entre las estructuras de datos crean requisitos de procesamiento extraordinariamente complicados. Huang predijo que los sistemas de memoria de la IA revolucionarán por completo la infraestructura de almacenamiento.

Esta arquitectura heterogénea y desagregada es precisamente la razón por la que NVIDIA construyó Vera Rubin. Huang enfatizó que Vera Rubin no es un solo chip, sino un sistema integral de extremo a extremo que incluye GPUs, CPUs, sistemas de almacenamiento, redes ConnectX-9, procesadores de seguridad y pilas de software. Todo implementa computación confidencial porque los modelos de IA son extremadamente valiosos. Cada componente del sistema constituiría una revolución por sí solo; juntos, representan el esfuerzo más ambicioso de NVIDIA.

NVIDIA como empresa de infraestructura

Huang explicó que NVIDIA se ha transformado de ser una empresa de GPUs a una de sistemas, y ahora a una de infraestructura. El ecosistema incluye generadores de energía, sistemas de refrigeración y proveedores de redes eléctricas. El objetivo de NVIDIA es construir pilas de infraestructura completas para que los clientes puedan construir fábricas de IA.

Presentó DSX, el modelo de infraestructura que sigue a RTX para GPUs y DGX para sistemas. DSX incluye DSX Sim, un simulador basado en Omniverse donde los socios diseñan y validan fábricas de IA completas antes de pedir un solo rack. Planifican diseños, simulan el consumo de energía y la refrigeración, diseñan redes y prueban cada cambio en un gemelo digital.

DSX OS aprovisiona, opera, monitorea y repara la infraestructura, convirtiendo los sistemas instalados en capacidad confiable, multiusuario, resiliente y lista para la IA. Las innovaciones incluyen DSX MaxLPS, que permite a los operadores desplegar más GPUs dentro del mismo presupuesto energético al reducir el sobreaprovisionamiento del 40 por ciento a casi cero, añadiendo miles de millones en ingresos anuales. La refrigeración líquida a 45 grados Celsius utiliza menos agua y energía. La asignación dinámica de energía dirige la potencia entre racks, recuperando vatios desperdiciados. Equipos de agentes de IA coordinan continuamente el equilibrio entre refrigeración y potencia para satisfacer las demandas de carga de trabajo.

Huang mostró cómo las fábricas de IA DSX operan como activos energéticos flexibles que cooperan con la red eléctrica. DSX Flex lee señales de la red en tiempo real y ajusta dinámicamente el consumo de energía cuando la red necesita alivio. Con 100 gigavatios de fábricas de IA esperados en línea antes de que termine la década, estas mejoras de eficiencia se traducen en enormes ventajas económicas.

Los cuatro factores de ventaja competitiva

Huang presentó lo que considera el marco definitivo para evaluar las inversiones en infraestructura de IA. Mostró una curva que ilustra la rapidez con la que la infraestructura entra en línea, su rendimiento, fiabilidad y vida útil. Debido a que estos sistemas representan entre 50.000 y 100.000 millones de dólares, cada factor impacta drásticamente en el retorno de la inversión.

El tiempo hasta el primer token es fundamental. El enfoque totalmente integrado de NVIDIA —donde cada componente está codiseñado y todo el sistema está simulado— permite un despliegue mucho más rápido que el de la competencia. La empresa ha construido miles de millones de dólares en infraestructura propia para garantizar que todo funcione correctamente.

El rendimiento por vatio es ingreso. Cuando un centro de datos tiene un gigavatio de capacidad de potencia, eso es todo lo que tendrá. Cada token es rentable, por lo que el rendimiento por vatio equivale directamente a ingresos. Huang enfatizó que elegir chips más baratos sin considerar el rendimiento por vatio es económicamente irracional. Declaró enfáticamente: cuanto más compras, más ganas.

La fiabilidad —medida como tiempo medio entre interrupciones— resulta extremadamente valiosa a escala. Los centros de datos contienen millones de cables y componentes. La experiencia de NVIDIA operando a gran escala durante muchos años crea una ventaja significativa en una operación armoniosa y confiable.

La vida útil del sistema crea las diferencias más drásticas. En los cuatro años desde la introducción de Hopper, la IA ha cambiado por completo. Hace seis años, durante Ampere, la IA se veía totalmente diferente. La industria pasó de las CNN a los Transformers, a la mezcla de expertos y a los sistemas agentes. Si la arquitectura no es flexible y el ecosistema no es rico, la vida útil del activo es corta. Debido a que los sistemas de NVIDIA operan en todo el mundo y los desarrolladores de software comienzan con CUDA, el ecosistema garantiza una larga vida útil y un bajo costo total de propiedad.

Vera Rubin: Anuncio de producción a gran escala

Huang anunció que Vera Rubin está ahora en plena producción, una declaración recibida con aplausos sostenidos. La cadena de suministro que NVIDIA creó para Vera Rubin es dos veces más grande que la de Grace Blackwell. El rendimiento de fabricación ha mejorado drásticamente: el ensamblaje que tomaba dos horas por rack de Grace Blackwell ahora toma cinco minutos. Millones de pies cuadrados de capacidad de fabricación han entrado en línea para respaldar a Grace Blackwell y ahora están aumentando para Vera Rubin.

La presentación en video detalló el milagro de fabricación en toda la cadena de suministro. Los siete nuevos chips que componen Vera Rubin toman forma a través de cientos de pasos de procesamiento en TSMC utilizando tecnología de proceso de tres nanómetros, empaquetado avanzado CoWoS y memoria HBM4 de Micron, SK Hynix y Samsung. La GPU Vera Rubin contiene seis billones de transistores con más de 18.000 componentes en una sola placa.

Vera Rubin NVL72 maneja el pensamiento: procesamiento de instrucciones, comprensión del contexto, razonamiento y planificación. Una nueva bandeja de cómputo modular cuenta con una placa base (PCB) optimizada. ConnectX-9, SuperNICs y DPUs BlueField-4 son accesibles para mantenimiento sin cables, lo que mejora la resiliencia y la escalabilidad. Dieciocho bandejas de cómputo y nueve bandejas de conmutación NVLink intercambiables en caliente se conectan a través de nuevas barras colectoras refrigeradas por líquido de alta eficiencia que transportan más de 5.000 amperios, equivalente a 20 autos eléctricos en plena aceleración. En conjunto, 1,3 millones de componentes forman el rack MGX de tercera generación.

Huang felicitó a Microsoft, Dell y CoreWeave por poner en marcha racks de ingeniería Vera Rubin NVL72 operativos. El rack de CPU Vera contiene 256 CPUs en un solo rack refrigerado por líquido, orquestando modelos, gestionando la memoria y lanzando herramientas. Foxconn y Quanta fabricaron el rack Vera LPX con 256 LPUs Groq en 16 bandejas, entregando 40 petabytes por segundo de ancho de banda SRAM para una latencia ultrabaja. Mientras que NVL72 genera tokens al mayor rendimiento, LPX los genera con la menor latencia.

Vera BlueField-4 STX sirve como almacenamiento de memoria de IA: procesamiento de almacenamiento acelerado por BlueField-4 que conecta memoria, almacenamiento y seguridad en el silicio. NVIDIA Spectrum-X Ethernet Photonics es el primer switch Ethernet del mundo con óptica coempaquetada de 200 gigabits, utilizando el proceso TSMC CoWoS, empaquetado a escala de chip y matrices láser de ultra alta potencia sobre fosfuro de indio.

El sistema completo comprende cinco sistemas conectados a escala de rack. Involucró a 150 socios de la cadena de suministro en Taiwán y millones de pies cuadrados de planta de fabricación en cientos de sitios. Huang enfatizó que Vera Rubin no se construyó simplemente para ejecutar IA, sino específicamente para ejecutar agentes. La complejidad de la arquitectura de agentes representa el último gran avance en ciencias de la computación, requiriendo el sistema informático más avanzado del mundo.

Demostración de hardware Vera Rubin

Se llevaron sistemas de rack físicos al escenario para su examen. Huang mostró el Vera Rubin NVL72, el rack LPX, el rack de CPU Vera con 256 CPUs refrigeradas por líquido, el sistema de procesamiento de almacenamiento y seguridad Vera BlueField, y la red Mellanox con la primera óptica coempaquetada del mundo.

El diseño elimina cables, mangueras y ventiladores. Una placa base (PCB) conecta ambos lados de lo que antes requería un cableado extenso. Las mejoras en fiabilidad y resiliencia son sustanciales. Huang mostró la bandeja de CPU Vera y la bandeja de almacenamiento que contiene dos CPUs Vera, cuatro unidades ConnectX-9 y una capacidad de almacenamiento masiva. El rack Groq LPX proporciona una inferencia de latencia muy baja, extendiendo las capacidades de rendimiento de Vera Rubin. La bandeja de conmutación NVLink representa una tecnología revolucionaria que permite a NVIDIA convertirse en la empresa de redes más grande del mundo.

CPU NVIDIA Vera: Computación para agentes

Huang presentó la CPU Vera como fundamentalmente diferente a todos los procesadores anteriores. Las CPUs tradicionales fueron creadas para humanos que viven en un mundo contado por segundos, con una economía de nube basada en alquilar núcleos de CPU por hora. Los agentes viven en un mundo contado por nanosegundos. Son impacientes. Cuando los agentes utilizan herramientas o acceden a bases de datos, cada momento de espera les impide avanzar al siguiente paso. Hacer que las CPUs sean lo más interactivas y de menor latencia posible es vital.

Dentro de los sistemas Vera Rubin, las CPUs cumplen tres funciones. Dos CPUs en cada rack Vera Rubin orquestan y gestionan las GPUs, gestionan la caché KV y manejan el software del rack. Las CPUs Grace BlueField proporcionan seguridad y aislamiento. Las CPUs de cómputo Vera manejan el entorno, la orquestación de modelos de IA, el uso de herramientas y el acceso a bases de datos. Las CPUs Vera BlueField potencian los servidores de almacenamiento más rápidos jamás creados.

Estos sistemas se encuentran en la ruta crítica de la parte más costosa del centro de datos. La economía se centra en la generación de tokens, y la infraestructura de CPU no debe impedir esta función primaria. Esto requirió que NVIDIA construyera una arquitectura completamente nueva desde cero: una CPU que el mundo nunca antes había visto, construida para agentes en lugar de humanos.

Huang describió cuatro características definitorias. Primero, las instrucciones por ciclo de reloj deben ser increíblemente altas porque la latencia debe ser corta. El rendimiento de un solo hilo, no el rendimiento total, debe ser de clase mundial. Vera logra el IPC más alto del mundo, capturando, decodificando y ejecutando 10 instrucciones por ciclo.

Segundo, el ancho de banda por núcleo debe ser excepcional para mover datos rápidamente dentro y fuera de la CPU. Tercero, el ancho de banda total en todo el sistema debe ser de clase mundial. Debido a que los sistemas agentes son fundamentalmente desagregados y distribuidos, las redes se convierten en el desafío central. Los datos deben moverse lo más rápido posible entre núcleos de CPU, entre CPU y almacenamiento, y entre CPU y GPU. El ancho de banda alrededor y dentro del sistema debe superar todos los estándares anteriores.

Vera es la primera CPU construida con límites radicales con una estructura que conecta todos los núcleos de CPU a la velocidad de la luz: 3,6 terabytes por segundo sin cruces de límites. Todos los núcleos de CPU se comunican con un ancho de banda extremadamente alto, trabajando juntos en lugar de ser alquilados individualmente. El ancho de banda de sección transversal no tiene precedentes. Vera es la primera CPU que utiliza PCIe Gen 6 y LPDDR5 con 1,2 terabytes por segundo, dos o tres veces el ancho de banda de las CPUs de mayor rendimiento del mercado.

Cuarto, la eficiencia energética es crítica. El número de CPUs será muy alto porque habrá miles de millones de agentes en comparación con solo mil millones de humanos que utilizan CPUs tradicionales. Los agentes usan CPUs con poca paciencia porque el costo de las GPUs adyacentes es demasiado alto y valioso. Las CPUs deben ser tanto de alto rendimiento como extremadamente eficientes energéticamente para maximizar el despliegue de CPUs sin restar energía a la generación de tokens.

Comparada con los procesadores x86 de mayor rendimiento, las mejoras reales de rendimiento de un solo hilo de Vera son extraordinarias. Huang señaló que lograr una mejora del cinco por ciento en CPUs es increíble, diez por ciento notable, pero los aumentos de velocidad de Vera son simplemente inauditos.

Benchmarks de rendimiento de la CPU Vera

La presentación en video detalló el núcleo NVIDIA Olympus en el corazón de Vera, construido específicamente para cargas de trabajo modernas de centros de datos, incluyendo tiempos de ejecución de Python con muchas ramificaciones, llamadas a herramientas y ejecución de código en sandbox. Cada núcleo está ajustado para el rendimiento con un predictor de ramificaciones neuronal que evalúa dos ramificaciones tomadas por ciclo, un motor de decodificación de 10 vías que trae más trabajo cada ciclo, un motor de ejecución fuera de orden grande que mantiene las instrucciones en movimiento y prelectores avanzados con un motor de grafos novedoso que anticipa la siguiente búsqueda de datos.

Vera es la primera CPU que utiliza memoria LPDDR5X mientras corrige múltiples errores simultáneamente sin comprometer el ancho de banda. Logra una latencia de memoria máxima un 40 por ciento menor en comparación con x86, manteniendo los núcleos alimentados durante la recuperación, el análisis y la ejecución en sandbox. La estructura de coherencia escalable de segunda generación de NVIDIA unifica los 88 núcleos Olympus en una malla monolítica. La memoria y los núcleos no están divididos en chiplets, lo que permite una comunicación entre núcleos un 50 por ciento más rápida que en las CPUs tradicionales. NVLink con coherencia de memoria conecta las GPUs directamente a la CPU y puede escalar Vera a múltiples sockets para un ancho de banda masivo entre CPUs.

Huang presentó resultados de benchmarks que sorprendieron a la audiencia. SQL —el lenguaje específico de dominio más famoso jamás creado— corre tres veces más rápido en Vera, no un 10 o 25 por ciento más rápido. Para el procesamiento de flujos en tiempo real, particularmente importante para fábricas y bolsas de valores, Vera ofrece una aceleración de seis veces. Destacó la asociación con Lynn Martin, presidenta de la Bolsa de Valores de Nueva York, señalando que este sistema funciona globalmente en tiempo real.

Estas mejoras de factor X en cargas de trabajo reales son raras para las CPUs. Huang expresó orgullo por el logro del equipo y presentó un mapa de ruta extraordinario. Las asociaciones con los primeros adoptantes abarcan toda la industria, con los ODM y fabricantes de computadoras de Taiwán llevando los sistemas al mercado. Los primeros adoptantes son empresas de agentes, lo que marca el comienzo de un nuevo mercado que nunca existió antes: CPUs para agentes en lugar de personas. Este mercado seguramente será más grande que los mercados de CPU anteriores porque habrá muchos más agentes que personas, y los agentes son muy impacientes.

NVIDIA Agent Toolkit para IA empresarial

Huang enfatizó que el patrón de aplicación que describió —agentes con entornos que orquestan modelos de lenguaje de gran escala— definirá la próxima década de la computación. Cada empresa se convertirá en una empresa de agentes con agentes ejecutándose internamente. Cada empresa necesitará sistemas operativos para agentes y se preguntará cómo ejecutar agentes de forma segura y cómo construirlos para sus cargas de trabajo.

El NVIDIA Agent Toolkit para IA empresarial aborda estas necesidades. Huang señaló que NVIDIA construye todo a la vista: revisar los GTC anteriores revela que los anuncios de hoy fueron presentados hace años. Ha discutido este kit de herramientas durante varios años, construyendo hacia este momento.

Las empresas necesitan cuatro cosas para construir agentes como servicios u operar agentes internamente. Primero, modelos: modelos de lenguaje de gran escala que sean inteligentes, baratos y rápidos. Segundo, un entorno para orquestar todo. Tercero, herramientas que los modelos quieran usar, junto con habilidades. Las bibliotecas CUDA-X se convertirán en herramientas increíbles para futuros agentes. Cuarto, un tiempo de ejecución: el sistema operativo que mantiene todo unido.

El kit de herramientas incluye modelos que los usuarios pueden modificar, varios modelos abiertos de clase mundial y más por venir. Ejecuta agentes de cualquier proveedor —Claude Code, Codex u otros— dentro de NVIDIA OpenShell, un entorno altamente seguro para uso empresarial. OpenShell protege a los agentes, los mantiene basados en políticas de seguridad, protege la privacidad, otorga derechos y privilegios apropiados y protege la identidad. Este entorno de código abierto está siendo adoptado globalmente por Red Hat, Canonical, Microsoft y muchos otros.

El tiempo de ejecución está totalmente optimizado para la plataforma de IA de NVIDIA, que está en todas partes. OpenShell se ejecuta en cualquier nube, en las instalaciones y hasta en dispositivos. Los usuarios tienen herramientas y bibliotecas que los agentes pueden usar, modelos para modificar o usar tal cual, y entornos de agentes como OpenClaw y Hermes. Estos pueden ejecutarse en las instalaciones o en cualquier lugar. Esto representa el sistema operativo de la empresa moderna.

Superagente de diseño de chips de Cadence

Uno de los casos de uso favoritos de Huang involucra a los diseñadores de chips, lo cual calificó como lo más importante que hace NVIDIA. La empresa se asoció con Cadence para construir un superagente de diseño de chips orquestado por Codex o Claude Code. Procesa RTL y diagramas de arquitectura, esquemas o especificaciones como entrada, junto con cualquier cosa que necesite reparación. Juntos crearon superagentes optimizados para la plataforma NVIDIA con Nemotron.

La demostración mostró cómo cientos de miles de chips NVIDIA se unen para hacer fábricas de IA que impulsan los modelos de IA de frontera del mundo. Diseñar estos chips y sus sistemas representa uno de los desafíos de ingeniería más difíciles: billones de transistores en circuitos tridimensionales a escala microscópica, cada puerta y cable sincronizado a picosegundos, trabajando en perfecta armonía sin margen de error.

Los prototipos físicos son demasiado lentos y costosos, por lo que los ingenieros trabajan digitalmente. Cada chip comienza como especificaciones arquitectónicas traducidas a RTL, el lenguaje de diseño de chips. El RTL debe verificarse en simulación. Un solo error puede retrasar un chip por meses. En NVIDIA, miles de ingenieros gastan miles de millones de horas de cómputo anualmente escribiendo, ejecutando y depurando millones de pruebas en un ciclo que toma semanas a los equipos.

Para comprimir este ciclo, Cadence y NVIDIA construyeron un agente de verificación de diseño. Codex orquestó el proceso. Cadence Chip Stack lanza el bucle de verificación RTL impulsado por Nemotron y asegurado por OpenShell, llamando a subagentes expertos en generación RTL, creación de bancos de pruebas, pruebas de regresión y depuración. El sistema se conduce solo, ejecutando cientos de simulaciones con Cadence Xcelium y verificación formal con JasperGold. Se revelan fallas de diseño y se corrigen errores de código. Lo que antes tomaba semanas ahora toma horas: ciclos de verificación más de 40 veces más rápidos.

Huang enfatizó las implicaciones: de semanas a horas. NVIDIA tiene miles de diseñadores de chips y contratará a cientos de miles de superagentes de Cadence para acelerar la empresa, permitiendo mayor ambición, creaciones más asombrosas y una ejecución más rápida.

Nemotron 3 Ultra: El modelo fundacional

El kit de herramientas para agentes comienza con modelos excelentes que socios como Cadence pueden modificar y ajustar para su experiencia, creando superagentes propietarios con conocimiento propietario. Huang presentó Nemotron 3 Ultra, el próximo modelo abierto de NVIDIA dedicado a construir modelos abiertos para el mundo para que todos puedan crear sus propios agentes.

Los modelos Nemotron proporcionan no solo el modelo, sino todos los datos de entrenamiento y scripts de entrenamiento. A través de una coalición de socios increíbles que contribuyen con datos entre sí, Nemotron entrena en uno de los conjuntos más grandes de modelos de razonamiento de larga duración y conjuntos de datos de resolución de tareas y uso de herramientas del mundo. Todo —modelo, scripts de entrenamiento y datos— se hace completamente disponible. Esto es modelos abiertos en su máxima expresión, el mejor sistema de modelos abiertos del mundo, con el objetivo simple de permitir a los usuarios tomar todo, añadirle, mejorarlo y hacerlo suyo.

Nemotron 3 Ultra es cinco veces más rápido que los modelos anteriores: el primer modelo del mundo basado en una arquitectura híbrida de modelos de espacio de estados con mezcla de expertos. La arquitectura es increíblemente rápida para que los usuarios puedan pensar rápido. Al pensar rápido, pueden pensar más tiempo al mismo costo. También es un 30 por ciento más barato, requiriendo un costo un 30 por ciento menor en FLOPs totales y tiempo de inferencia total que incluso los modelos más rentables del mundo. Es inteligente a nivel de frontera, cinco veces más rápido, 30 por ciento más barato y completamente abierto. NVIDIA está completamente dedicada a esta dirección. Nemotron 3 es actual, Nemotron 4 está en desarrollo.

Ecosistema de socios de software empresarial

Huang abordó la idea errónea de que los agentes interrumpirían los mercados de software empresarial existentes. Declaró enfáticamente: completamente lo contrario. El kit de herramientas permite a empresas como Cadence, CrowdStrike, ServiceNow, Palantir y SAP crear la mayor oportunidad de la historia. Los agentes crearán una demanda sin precedentes de capacidades de software empresarial, proporcionadas como herramientas que los agentes pueden usar.

Los tres anuncios principales hasta este punto: Vera Rubin en plena producción, la CPU Vera construida para una nueva generación de computación con agentes y el NVIDIA Enterprise AI Toolkit que permite a cada empresa y empresa de software construir agentes.

Reinventando la computadora personal

La relación de Huang con Taiwán y muchos socios comenzó con la revolución de la PC hace 40 años. La industria informática moderna comenzó en Taiwán con Windows 1, Windows 2, Apple 1 y Apple 2. Para cuando NVIDIA llegó hace 33 años, Windows 3.1 definía la PC. Windows 95 hizo que la PC fuera personal, transformándola de una herramienta empresarial a un dispositivo de electrónica de consumo que todos deberían tener.

Esa plataforma informática tuvo éxito gracias a un diseño inteligente. Windows no solo estaba desagregado, sino correctamente abstraído con la arquitectura correcta: BIOS del sistema, chipsets abiertos, el sistema operativo con controladores instalables en tiempo de ejecución y una capa de abstracción con APIs multimedia que abrieron la PC a lo que conocemos hoy. Cada elemento fue esencial para la popularidad de la PC.

Cuarenta años después, Microsoft y NVIDIA están reinventando la PC. Huang adelantó una discusión con Satya Nadella programada para la noche siguiente para detallar su colaboración. Tomó tres años reinventar por completo cómo funcionará la PC para estar lista para este momento.

El patrón de computación agente se ejecutará en nubes de IA, dentro de empresas y en PCs. Cuando una PC tiene un agente autónomo que entiende al usuario, puede ser hablado, puede mirar al usuario y puede ser solicitado para archivar cosas, realizar investigaciones y realizar muchas otras tareas, ¿qué sucede con esa PC? El nuevo sistema operativo es el antiguo sistema operativo más modelos de lenguaje de gran escala. Los modelos de lenguaje de gran escala son la versión moderna de DirectX: una extensión de inteligencia de la PC con entrada y salida, entendiendo instrucciones y visión por computadora, generando video y sonido. La capa de aplicación es reemplazada por un tiempo de ejecución agente. El agente es la aplicación moderna.

Introducción de NVIDIA RTX Spark

La presentación en video introdujo a RTX Spark como la culminación de 33 años de aprendizaje de NVIDIA destilados en un chip: una reimaginación de la PC para la era de la IA. Los agentes que se ejecutan de forma nativa, conectados a modelos locales o en la nube, se convierten en IAs personales en sandbox para mayor seguridad, ejecutándose continuamente y realizando el trabajo. Los chips y el sistema operativo deben evolucionar juntos.

RTX Spark contiene una GPU Blackwell RTX con 6.144 núcleos Tensor que ofrecen un petaflop de rendimiento de IA. Se construyó una CPU Grace personalizada de 20 núcleos en asociación con MediaTek, fusionada por NVLink con 128 gigabytes de memoria unificada. Utilizando el proceso de tres nanómetros de TSMC, contiene 70 mil millones de transistores. En estrecha colaboración con Microsoft, se creó una plataforma de Windows para agentes. Este es el amanecer de una nueva revolución de computación personal que comienza con RTX Spark.

Huang enfatizó que este es el chip más hermoso jamás construido, creado en asociación con MediaTek. Señaló haber visto a Rick Tsai en la audiencia. El chip es extraordinario porque tomó 33 años construirlo en el sentido de que el 100 por ciento del software de NVIDIA funciona en él. Biología digital, procesamiento sísmico, astrofísica, toda la física relacionada con CUDA, biología, genómica, IA y gráficos por computadora funcionan sin problemas. Cada aplicación que NVIDIA ha creado y cada aplicación que Windows ha ejecutado funcionan en este sistema. Microsoft y NVIDIA optimizaron meticulosamente todo para que esta computadora literalmente ejecute todo lo que el mundo ha creado, más agentes.

El sistema puede ejecutar un modelo local Nemotron 3 Ultra, Nemotron 3, Claude Code, Codex u otros modelos en la nube o en la red. Una demostración mostró un flujo de trabajo de diseño arquitectónico donde un agente que se ejecuta localmente en RTX Spark ayuda a diseñar una casa usando herramientas de laptop. Con un sandbox OpenShell ejecutando el entorno Hermes conectado a Claude Sonnet en la nube, el usuario selecciona un sitio, comparte bocetos conceptuales y tableros de estado de ánimo, y proporciona una descripción de texto de los requisitos y la intención del diseño.

El agente abre Rhino y modela el sitio, dando forma al terreno, los retranqueos y la envolvente del edificio. Propone formas de construcción optimizadas para costo, comodidad y calidad. Con la forma definida, genera el diseño interior con paredes, circulación y habitaciones. El usuario puede intervenir en cualquier momento para ajustar o cambiar. Las puertas, ventanas y elementos estructurales se colocan automáticamente. El agente detecta sus propios errores y los corrige. Cuando se aprueba, exporta el modelo desde Rhino a Blender con materiales y propiedades de objeto que transfieren el contexto de diseño intacto. El usuario ajusta los materiales y elige las tomas. Blender renderiza la casa. El agente utiliza IA generativa con el modelo Flux 2 para hacer que los renders sean fotorrealistas con múltiples puntos de vista y condiciones de iluminación. Lo que alguna vez fue un flujo de trabajo complejo ahora es guiado y simplificado por un agente que trabaja en RTX Spark, diseñado a la velocidad de la imaginación.

Asociación con Adobe y apoyo de la industria

Los desarrolladores están entusiasmados con las capacidades de RTX Spark: aceleración, capacidades de software y asociaciones que lo hacen increíble para todos. Adobe ha reingenierizado la arquitectura y el núcleo de Photoshop y Premiere para RTX Spark, entregando el doble de velocidad. Las aplicaciones ya son rápidas y ahora serán el doble de rápidas. También están diseñadas para ser amigables con los agentes con servidores MCP que pueden interactuar con agentes en la laptop.

El número de socios que llevan RTX Spark al mercado es extraordinario. Huang llamó a esto la primera gran reinvención de la PC en 40 años. Expresó su felicidad de que el ecosistema global se haya unido a este esfuerzo. Esencialmente, cada fabricante importante de PC apoyará a RTX Spark, construyendo laptops increíblemente inteligentes, potentes y hermosas.

Reinvención completa de la línea de PC

RTX Spark representa la reinvención de la laptop, pero Microsoft y NVIDIA están reinventando todo el PC. Huang anunció una línea completamente nueva: tres máquinas revolucionarias de Windows que cubren escritorio, laptop y estación de trabajo, todas 100 por ciento compatibles con Windows, 100 por ciento CUDA, 100 por ciento núcleo Tensor de IA de NVIDIA. Todo lo que funciona en NVIDIA en plataformas de todo el mundo funciona en estos sistemas. Esta es la primera línea de PCs completamente reingenierizada y reinventada en 40 años.

El sistema de escritorio de MSI puede ejecutar agentes las 24 horas del día, los 7 días de la semana, sin medidor. Los usuarios pueden descargar agentes que se ejecutan continuamente sin ansiedad por el medidor. El sistema se conecta por toda la casa: a laptops, pantallas, cámaras, electrodomésticos, calentadores de agua, sistemas de seguridad. Se convierte en un agente de IA personal que se vuelve más inteligente con el tiempo a medida que Nemotron evoluciona a través de las versiones 3, 4, 5, 6 y más allá. El agente se sienta en casa ayudando con tareas como reservar viajes.

La estación DGX representa la solución de estación de trabajo: compatible con Windows, ejecutando todo en Windows, con 768 gigabytes de memoria que permiten la ejecución de modelos de billones de parámetros. Esta es una capacidad sin precedentes. A 20 petaflops y ocho terabytes por segundo de ancho de banda de memoria, este sistema se sienta junto al escritorio del desarrollador. Para los desarrolladores de modelos de lenguaje de gran escala y agentes, tener esta potencia de cómputo en el escritorio proporciona todo lo necesario para el desarrollo, con el despliegue en la nube a continuación.

El futuro de la computación personal

Huang hizo una analogía con los teléfonos de hace 15 a 20 años. El teléfono de hoy se usa para casi todo excepto para hacer llamadas telefónicas; significa algo muy diferente que en el pasado. Está seguro de que la PC sufrirá una transformación similar. En 10 años, la PC será completamente diferente a la herramienta actual donde lanzas aplicaciones, haces clic y escribes.

Huang teorizó que, al igual que cada casa hoy tiene cines en casa, televisores grandes, cortadoras de césped y lavavajillas, algún día habrá supercomputadoras de IA en las casas ejecutando todos los agentes y asistentes, haciendo todo tipo de cosas continuamente. La gente querrá computadoras de agentes de IA ejecutándose en sus casas. Con el tiempo, estos se vuelven más como R2-D2 o C-3PO, más como compañeros que como PCs.

No hay duda de que esta reinvención de la computadora es tan significativa como la reinvención del teléfono en el teléfono inteligente. Este es el comienzo de ese viaje, el comienzo de una nueva línea de productos. NVIDIA tiene un mapa de ruta para esta nueva familia de productos. Cada generación de arquitectura incluirá un escritorio, laptop y estación de trabajo.

Huang expresó estar increíblemente complacido y honrado de que el 100 por ciento de la industria de PCs del mundo se haya unido a NVIDIA para reinventar la PC: una nueva línea, un nuevo comienzo.

IA física y el modelo fundacional Cosmos 3

La IA agente es esencialmente un robot digital que entiende, razona, planea, actúa y usa herramientas. La IA agente se ejecutará en todas las computadoras: computadoras de robótica humanoide, computadoras de robótica de todo tipo, computadoras de autos autónomos, satélites, sistemas GeForce, la nueva línea de PC, equipos agrícolas, equipos de fabricación, equipos de industria pesada. Incluso las estaciones base —estaciones de radio del futuro— serán agentes, entendiendo el tráfico y coordinando con otras estaciones para minimizar el uso de energía mientras aumentan la eficiencia espectral.

Todo ejecutará agentes. Hoy en día, NVIDIA está principalmente en el centro de datos, pero Huang está seguro de que habrá decenas de miles de millones, eventualmente cientos de miles de millones de sistemas agentes y computadoras agentes ejecutándose en todo el mundo.

El mayor problema son los datos. Para los modelos de lenguaje, todo el inglés y el lenguaje en Internet utilizado para el entrenamiento fue escrito desde la perspectiva humana: lo escribimos y lo leímos. Sin embargo, crear datos para la robótica de IA requiere la perspectiva del robot. La mayoría de los datos de video del mundo son en tercera persona, no en primera persona. Para los sistemas agentes, los sistemas robóticos y la IA física, los datos son el problema más difícil.

NVIDIA ha subido una escalera de progresión que comienza con la teleoperación: demostración humana similar al avance del aprendizaje por refuerzo a partir de la retroalimentación humana. La simulación usando Omniverse permite el aprendizaje por refuerzo con recompensas verificables. Estos sistemas arrancan modelos de IA: modelos de IA física. Eventualmente, el aprendizaje a partir de datos en tercera persona puede ser reproyectado a primera persona. A través del arranque, surge un Modelo Fundacional Mundial que entiende el mundo físico desde cualquier perspectiva: tercera persona, primera persona, por dentro y por fuera. Esto representa un gran avance.

Huang anunció Cosmos 3 como la frontera de la IA física. Mientras muchas personas trabajan en modelos de lenguaje, NVIDIA es absolutamente la mejor del mundo en IA física. Este es el modelo fundacional para todo el trabajo de robótica. Cualquiera que quiera crear un robot —robots de fábrica, robots que trabajan en fábricas, cualquier tipo de robot que involucre el mundo físico— ahora tiene un compañero en Cosmos 3 que puede entender y razonar. Puede generar, simular y, en el bucle, puede incluso ser la política en sí misma. Lidera las tablas de clasificación en todo el mundo.

El video detalló cómo el mundo real es infinito e impredecible. La IA física necesita datos, pero los datos del mundo real son imposibles de escalar. Para la IA física, el cómputo es datos. Cosmos es un omnimodelo de frontera abierta para la IA física construido sobre una nueva arquitectura de Mezcla de Transformers. Los píxeles, la acción, el sonido y el lenguaje fluyen hacia el transformador autorregresivo, que razona, planea e instruye al transformador de difusión que genera lo que viene después.

Los desarrolladores post-entrenan a Cosmos a través de encarnaciones y casos de uso. Como VLM, Cosmos observa el mundo físico, entiende lo que está sucediendo, describe escenas y marca lo que importa. Como modelo mundial, Cosmos genera video sintético físicamente preciso a partir de una imagen, texto o video. Como simulador, Cosmos cierra el bucle para el entrenamiento y la evaluación de políticas. Como base de NVIDIA OmniDreams —un modelo mundial condicionado por la acción—, Cosmos predice el futuro cuadro por cuadro.

El post-entrenamiento de Cosmos lo transforma en un modelo de acción mundial: percibiendo, razonando, planificando, generando acciones para robots de todo tipo, para todo lo que se mueve. Esto representa un nuevo tipo de datos, un nuevo tipo de maestro generado por el cómputo. Cosmos proporciona la base para los desarrolladores en la era de la IA física.

Así como los datos de texto más el cómputo dan IA, ahora que tenemos IA, el cómputo equivale a datos. Usa Cosmos 3 para entrenar modelos. Cosmos es un sistema de modelos abiertos exactamente como Nemotron: modelo abierto, datos abiertos, metodología de entrenamiento abierta para que los usuarios puedan mejorarlo y convertir a Cosmos en su modelo propietario. NVIDIA tiene socios increíbles trabajando en muchas industrias diferentes.

Alpamayo 2 Super para vehículos autónomos

Huang anunció Alpamayo 2 Super, un modelo abierto para autos autónomos. NVIDIA trabaja con empresas automotrices de todo el mundo. Las marcas que se han registrado para NVIDIA DRIVE Hyperion —construyendo autos DRIVE Hyperion— representan alrededor del 80 por ciento de los fabricantes de autos del mundo. Habrá una cantidad enorme de sistemas DRIVE Hyperion capaces de ejecutar Alpamayo 2 Super o cualquier otra pila de NVIDIA. NVIDIA también conecta con aproximadamente el 97 por ciento de los servicios de movilidad del mundo, por lo que al desplegar Alpamayo 2 Super en el tiempo de ejecución DRIVE Hyperion con el sistema operativo Halos, se conectará a todos estos servicios globalmente.

La demostración mostró un vehículo autónomo Mercedes navegando escenarios complejos. El auto explica verbalmente su razonamiento: salir cuando el carril está despejado, moverse ligeramente a la izquierda debido a vehículos estacionarios que bloquean carriles, detenerse en señales de alto e intersecciones, ceder el paso a peatones, mantener distancia de vehículos que se cruzan, manejar flujos de carriles, mantener distancia de camiones, navegar alrededor de obstáculos. El anuncio del destino concluye la demostración. Si bien la salida verbal continua sería molesta para los pasajeros, el diálogo interno continuo representa el pensamiento: Alpamayo 2 Super es un auto que razona.

Plataforma Isaac GR00T y robot de referencia

La tecnología creada para vehículos autónomos se aplica a los humanoides, aunque deben suceder muchos avances nuevos. NVIDIA Isaac GR00T es la pila de robótica humanoide: modelo, generación de datos, simulación y tiempo de ejecución, incluido el sistema operativo. Esto representa la plataforma GR00T completa.

Cada sistema NVIDIA sigue exactamente la misma arquitectura, ya sea para sistemas agentes en la nube, sistemas agentes para PCs, sistemas robóticos para autos autónomos o sistemas robóticos para robots humanoides. En cada caso, NVIDIA construye todo completamente con integración vertical, integración completa, codiseño y codiseño extremo. Cuando se abre para que todos lo usen —las partes que deseen, lo que los usuarios quieran—, NVIDIA incluso ayuda con las modificaciones.

Lo que faltaba era una plataforma de referencia para sistemas robóticos. Estos sistemas son extremadamente complicados con muchos motores y sensores, pero muy frágiles. NVIDIA necesita una forma de entregar plataformas de referencia tal como lo hace con PCs, DGXs, nubes y autos autónomos. Ahora NVIDIA está haciendo esto para los robots.

Huang anunció el robot humanoide de referencia NVIDIA Isaac GR00T, totalmente integrado. Cada mano tiene 25 grados de libertad, fabricada por Sharpa. El robot tiene 31 grados de libertad, mide 6 pies de altura y pesa 150 libras. Huang bromeó diciendo que comparte la primera característica (cerca de 6 pies) y la segunda (cerca de 150 libras), aunque los números específicos varían. Esta plataforma ejecuta el nuevo Jetson Thor y toda la pila de software de NVIDIA —pila de generación de datos, pila de simulación de datos y tiempo de ejecución—, todo integrado en un robot diseñado para que todos lo usen. Fue construido para la educación superior y los investigadores universitarios porque construir tales sistemas de forma independiente es increíblemente difícil.

El video explicó que el siguiente salto en la IA son los robots de propósito general: los humanoides. Pero construir uno es difícil. Cada equipo comienza desde cero, uniendo simuladores, sistemas de teleoperación, tuberías de datos e infraestructura de entrenamiento. Meses de configuración preceden a la investigación.

Isaac GR00T es una plataforma de desarrollo abierta para robots humanoides: modelos abiertos, bibliotecas de simulación y entrenamiento, y generadores de datos, además de la computadora del robot totalmente preconfigurada y lista para funcionar en horas. Primero, configura el entorno de simulación en Isaac Lab. Captura demostraciones con Isaac Teleoperation en robots reales o simulados. Genera datos sintéticos con Omniverse y Cosmos, escalando una demostración en miles. Entrena políticas y evalúalas en Isaac Lab Arena. Despliega a través de Isaac ROS ejecutándose en Jetson Thor.

Cada elemento es modular y abierto: usa los componentes de NVIDIA o cámbialos por alternativas. GR00T impulsa la investigación en robótica en todas las disciplinas para cada dominio, desde laboratorios de investigación hasta plantas de fábrica. Una plataforma abierta con una nueva edición: robots de diseño de referencia Isaac GR00T construidos sobre la plataforma abierta de NVIDIA, listos para la investigación de frontera para cualquier laboratorio en cualquier lugar. La era de la robótica comienza aquí con NVIDIA Isaac GR00T.

Patrón de computación para la próxima década

Huang resumió los cambios integrales en la industria informática en los últimos seis meses. Todo cambió porque los agentes se hicieron realidad y convergieron con los últimos modelos de frontera, haciendo posible que la IA ahora haga un trabajo útil.

El patrón de computación se repetirá en todos los dominios. Este patrón de computación —un agente con un modelo, un entorno que usa herramientas con habilidades, ejecutándose en un tiempo de ejecución— se aplica ya sea en una nube, en las instalaciones, en una PC o en un robot. El tiempo de ejecución varía, pero el patrón de computación sigue siendo idéntico. Se utilizarán diferentes entornos y modelos según la preferencia. Los usuarios los mejorarán para uso propietario, creando superagentes para ofrecer a otros para su trabajo.

Esta plataforma agente, este patrón agente: NVIDIA tiene un Enterprise AI Toolkit. Esta es una forma maravillosa para que todos interactúen con la IA y para NVIDIA representa una maravillosa oportunidad de crecimiento.

Vera Rubin está en plena producción. Mientras que Grace Blackwell fue creada para procesar IA, particularmente inferencia, Vera Rubin fue creada para ejecutar agentes. Está en plena producción. Es mucho más que una GPU: un sistema completo de procesamiento de agentes desagregado y distribuido.

NVIDIA se ha convertido en una empresa de infraestructura, no solo una empresa de GPUs o de sistemas, sino una empresa de infraestructura que ayuda a generar el máximo de ingresos y el máximo de beneficios lo antes posible.

El mundo agente requiere CPUs construidas para agentes, no para personas. Las CPUs para agentes tienen requisitos especiales, y NVIDIA Vera es revolucionaria. Huang expresó su felicidad por su aumento. Los pedidos ya están hechos. Será el lanzamiento de producto más rápido y exitoso en la historia de la compañía.

NVIDIA y Microsoft han creado una línea completamente nueva de PCs: un nuevo comienzo. El mismo patrón de computación agente se ejecutará en todo tipo de dispositivos. PCs hoy, pero en el futuro robots, satélites, estaciones base, fábricas: en la nube, en las instalaciones, en el borde. Este patrón de computación agente será replicado en computadoras de todo el mundo.

Cómo pensamos sobre las computadoras personales muy probablemente cambiará. Huang agradeció a todos por la asociación y la amistad. NVIDIA no podría estar aquí sin todo lo hecho juntos. Expresó orgullo por el éxito de los socios durante el último año, prediciendo que el próximo año será aún mejor.

Actuación de cierre

El discurso principal concluyó con una actuación musical que resumió los anuncios. La actuación celebró la llegada de la IA útil, los agentes trabajando junto a las personas, Vera Rubin en plena producción, la nueva arquitectura de CPU construida para agentes en lugar de x86, el sandbox OpenShell, la integración de sistemas de cinco capas, la optimización de energía MaxLPS, la reinvención de la PC de 40 años ejecutándose donde sea que vaya Windows, la generación de datos sintéticos a través del cómputo, las capacidades de razonamiento que entienden el mundo como lo hacen las personas y el futuro llegando para que todos lo vean.

Huang cerró dando la bienvenida a todos a Computex, agradeciéndoles por un año increíble, expresando gratitud por la amistad y el apoyo, y deseando lo mejor a todos.

Análisis profundo de NVIDIA: Monopolizando la era de la IA agente a través del diseño integral

El modelo de negocio y la arquitectura de ingresos

NVIDIA ha orquestado una de las transiciones más notables en la historia corporativa, evolucionando de ser un fabricante de tarjetas gráficas a un proveedor de plataformas de computación acelerada de pila completa (full-stack) y verticalmente integrado. El motor principal del modelo económico de NVIDIA es su negocio de Data Center, que actualmente representa más del 92% de los ingresos consolidados de la compañía. En lugar de vender chips de silicio discretos, el modelo de negocio de la empresa se estructura en torno a la venta de plataformas de computación acelerada completas. Estas plataformas abarcan unidades de procesamiento gráfico (GPU) de alto rendimiento, unidades centrales de procesamiento (CPU) personalizadas, silicio de red avanzado y software propietario. Durante los últimos trimestres, la unidad básica de venta ha migrado de placas de servidor individuales a gabinetes de supercomputación a escala de rack totalmente integrados, como los sistemas Grace Blackwell y la plataforma Vera Rubin, que está aumentando su producción. Esto permite a la compañía capturar múltiples capas de hardware de alto margen y primas de software que, de otro modo, se dividirían entre varios participantes de la cadena de suministro.

Los resultados financieros de NVIDIA reflejan los rendimientos compuestos de esta estrategia de monetización a nivel de sistema. En el primer trimestre del año fiscal 2027, finalizado el 26 de abril de 2026, NVIDIA registró ingresos totales récord de $81.600 millones, lo que representa un incremento del 85% en comparación con el año anterior y una expansión secuencial del 20%. Este crecimiento estuvo anclado por el segmento de Data Center, que generó $75.200 millones, un 92% más año tras año. La productividad financiera de este modelo está respaldada por un poder de fijación de precios inigualable y una mezcla de sistemas de alto margen, lo que llevó a márgenes brutos GAAP y no GAAP del 74,9% y 75,0%, respectivamente. Esta inmensa rentabilidad respalda una estrategia agresiva de retorno de capital. Solo en el primer trimestre del año fiscal 2027, NVIDIA devolvió aproximadamente $20.000 millones a los accionistas mediante dividendos y recompras de acciones, incluyendo el aumento de su dividendo trimestral en efectivo a $0,25 por acción y el establecimiento de una autorización adicional de recompra de acciones por $80.000 millones.

El ecosistema de clientes, proveedores y competidores

Las dinámicas estructurales de la cadena de valor de NVIDIA se caracterizan por una concentración extrema de clientes, una alta especialización en la fabricación y una intensa postura competitiva. La base de clientes principal de NVIDIA consiste en los proveedores globales de servicios en la nube y operadores de hiperescala, a menudo denominados los "Big Four", que incluyen a Microsoft, Amazon, Alphabet y Meta. Esta concentración introduce un riesgo material para el flujo de ingresos, ya que solo cuatro clientes representaron el 61% de los ingresos totales a finales del año fiscal 2026, con el mayor comprador individual representando el 22% de las ventas. Los clientes finales son desarrolladores de software empresarial, plataformas de internet para el consumidor y gobiernos nacionales que construyen infraestructura de IA soberana. Por el lado de la oferta, Taiwan Semiconductor Manufacturing Company (TSMC) es el socio de fabricación indispensable de NVIDIA. NVIDIA ha incrementado sus compromisos de capital y gastos de adquisición en Taiwán a aproximadamente $150.000 millones anuales, convirtiéndose en el mayor comprador en el ecosistema tecnológico taiwanés y asegurando acceso prioritario a nodos avanzados y capacidad de empaquetado Chip-on-Wafer-on-Substrate. Otros proveedores clave incluyen a SK Hynix, Samsung y Micron, que proporcionan la memoria de alto ancho de banda (HBM) esencial para los aceleradores modernos.

En el panorama competitivo, el mercado de semiconductores comerciales es un duopolio en la gama alta. Advanced Micro Devices (AMD) sirve como el principal retador, escalando su cartera de GPU Instinct. AMD reportó una expansión interanual del 57% en sus ingresos de centros de datos hasta los $5.800 millones en el primer trimestre de 2026, impulsada por su serie Instinct MI300 y las próximas arquitecturas MI350 y MI400. AMD ha asegurado importantes compromisos de asociación, incluida una infraestructura a escala de gigavatios con OpenAI e iniciativas de codiseño personalizado con Meta. Los aceleradores Gaudi de Intel siguen siendo un distante tercer lugar, ya que la compañía lucha con la adopción del ecosistema de software y la integración de plataformas. Más allá del silicio comercial, los competidores más formidables son las divisiones de ingeniería interna de los hiperescaladores, que diseñan cada vez más circuitos integrados de aplicación específica (ASIC) personalizados para evitar los márgenes del silicio comercial.

Dinámica de cuota de mercado y el foso del codiseño

NVIDIA mantiene un control dominante sobre el mercado de aceleradores de IA comerciales, con una cuota de mercado estimada entre el 85% y el 92% a mediados de 2026. Si bien los competidores han logrado asegurar posiciones secundarias en el mercado, la gran velocidad de la demanda de la industria ha permitido a NVIDIA mantener su liderazgo sin comprometer su perfil de margen. La base de este dominio de la cuota de mercado es la Compute Device Unified Architecture, conocida como CUDA, una plataforma de computación de software propietaria desarrollada durante dos décadas. CUDA ha creado un inmenso efecto de bloqueo para los desarrolladores, ya que la gran mayoría de las bibliotecas de entrenamiento de IA, compiladores y optimizaciones de marcos están escritos específicamente para la pila de software de NVIDIA. Intentar ejecutar modelos de vanguardia en hardware de la competencia requiere complejas capas de emulación o extensas reescrituras de código, lo que introduce riesgos de ejecución y latencia que la mayoría de los compradores empresariales no están dispuestos a aceptar.

La ventaja competitiva de NVIDIA se ha expandido de un foso de software-silicio a una hegemonía de codiseño a escala de rack altamente integrada. A medida que evolucionan las arquitecturas de los centros de datos, el cuello de botella del rendimiento se ha desplazado de la capacidad de cómputo bruto al ancho de banda de comunicación e interconexión a nivel de sistema. NVIDIA aborda esto a través de sus redes propietarias de escalado (scale-up y scale-out), particularmente el protocolo de interconexión NVLink y el silicio NVSwitch. En la recién anunciada plataforma Vera Rubin, los switches NVLink 6 ofrecen un ancho de banda agregado sin precedentes de 260 terabytes por segundo. Al actuar como el único arquitecto de todo el sistema —incluyendo la CPU Vera basada en ARM, la GPU Rubin, los SuperNIC ConnectX-9 y los switches Ethernet Spectrum-6—, NVIDIA optimiza el acceso a la memoria y la entrega de energía a nivel de rack. Esta capacidad de ingeniería a nivel de sistemas impide que los competidores compitan componente por componente, ya que los compradores empresariales exigen cada vez más supercomputadoras llave en mano, totalmente optimizadas y refrigeradas por líquido, en lugar de elementos semiconductores dispares.

Oportunidades industriales, amenazas geopolíticas y concentración de plataformas

La principal oportunidad a largo plazo para NVIDIA es la transición secular de los modelos de IA generativa a la IA agente y las arquitecturas de aprendizaje por refuerzo. La IA generativa dependía en gran medida de consultas de inferencia de una sola pasada, mientras que los sistemas de IA agente ejecutan flujos de trabajo autónomos de varios pasos. Un solo prompt de usuario puede activar miles de pasos secuenciales que involucran ejecución de código local en entornos aislados, recuperaciones de bases de datos vectoriales, utilización de herramientas y bucles de razonamiento. Este cambio hacia lo agente aumenta exponencialmente la intensidad computacional por transacción, impulsando una expansión estructural en el mercado total direccionable para la infraestructura de centros de datos y manteniendo la demanda de hardware avanzado mucho después de que se complete el entrenamiento inicial del modelo fundamental.

Estas oportunidades estructurales se ven contrarrestadas por graves vientos en contra geopolíticos y la concentración de plataformas. El impacto financiero más inmediato es la pérdida total del mercado de centros de datos chino debido a las estrictas restricciones de exportación de Estados Unidos. En el primer trimestre del año fiscal 2026, NVIDIA generó $4.600 millones en ingresos de centros de datos de clase Hopper de clientes chinos; en el primer trimestre del año fiscal 2027, esta cifra cayó a cero. La guía actual de NVIDIA no asume ingresos por cómputo de centros de datos provenientes de China, cerrando permanentemente un mercado direccionable masivo. Además, la concentración de la cadena de suministro global de semiconductores en Taiwán representa un riesgo sistémico. Con TSMC fabricando aproximadamente el 90% del silicio avanzado utilizado en los aceleradores de IA, cualquier interrupción geopolítica en la región detendría inmediatamente la producción de hardware de NVIDIA. Finalmente, la extrema concentración de clientes entre los cuatro principales hiperescaladores expone a NVIDIA a ciclos de digestión de gastos de capital si estos grandes compradores deciden optimizar su capacidad existente.

Hojas de ruta tecnológicas: Vera, Rubin y el cambio a la IA agente

Para adelantarse a la competencia y mantener sus flujos de ingresos de alto margen, NVIDIA ha comprimido su cadencia de lanzamiento de hardware a un ciclo anual. La recién anunciada plataforma Vera Rubin, que ha pasado a producción total para los envíos iniciales a clientes en el tercer trimestre de 2026, está diseñada específicamente para esta era agente. La plataforma no es solo un único chip semiconductor, sino un conjunto integrado de siete chips diseñados a medida: la CPU Vera, la GPU Rubin, el switch NVLink 6, el SuperNIC ConnectX-9, la DPU BlueField-4, el switch Ethernet Spectrum-6 y la LPU Groq 3. Este codiseño extremo permite que todo el sistema a escala de rack funcione como un único acelerador distribuido, evitando las limitaciones de rendimiento y comunicación de los diseños modulares tradicionales.

En el corazón de esta arquitectura de próxima generación se encuentra la GPU Rubin, construida sobre el avanzado proceso de 3 nanómetros de TSMC. La GPU Rubin cuenta con 336.000 millones de transistores, un aumento de 1,6 veces respecto a la arquitectura Blackwell, e integra 288 gigabytes de memoria HBM4 en ocho pilas. Esta arquitectura ofrece un extraordinario ancho de banda de memoria de 22 terabytes por segundo, que es 2,8 veces mayor que el ancho de banda de Blackwell. La GPU Rubin utiliza un Transformer Engine de tercera generación con compresión adaptativa acelerada por hardware para admitir el formato de punto flotante de 4 bits, lo que permite hasta 50 petaFLOPS de capacidad de inferencia NVFP4. Operando a una potencia de diseño térmico (TDP) de hasta 2.300 vatios por GPU, la plataforma Rubin está completamente refrigerada por líquido, eliminando por completo las opciones refrigeradas por aire de la cartera de centros de datos de gama alta de NVIDIA.

El otro motor de crecimiento clave de la plataforma es la CPU Vera, el primer procesador de NVIDIA personalizado y basado en ARM, construido específicamente para la orquestación de IA agente y el aprendizaje por refuerzo. La CPU Vera cuenta con 88 núcleos Olympus personalizados compatibles con la arquitectura Armv9.2 y utiliza subprocesos múltiples espaciales para particionar los recursos del núcleo. Los datos de referencia indican que la CPU Vera ofrece una mejora de 1,8 veces en las velocidades de finalización de tareas en comparación con los procesadores de servidor x86 tradicionales y logra un salto de rendimiento de 1,63 veces sobre la CPU Grace de la generación anterior. En el borde (edge), NVIDIA está desplegando su arquitectura de procesador RTX Spark, que escala la microarquitectura Rubin a computadoras portátiles y de escritorio. Este marco agente en el dispositivo está diseñado para hacer que los asistentes de IA pasen de ser herramientas dependientes de la nube a agentes autónomos locales de baja latencia, estableciendo un canal de crecimiento secundario en el mercado de la computación personal.

Retadores disruptivos y la amenaza del silicio personalizado

Si bien los competidores tradicionales como AMD e Intel siguen siendo puntos focales para los comentaristas del mercado, la amenaza a largo plazo más creíble para la cuota de mercado de NVIDIA es el rápido crecimiento de los circuitos integrados de aplicación específica (ASIC) personalizados diseñados internamente por los hiperescaladores en la nube. El silicio personalizado representó el 20,9% del mercado de aceleradores de IA en 2025 y se proyecta que se expandirá al 27,8% para finales de 2026. Los hiperescaladores están altamente motivados para desplegar hardware propietario para evitar los masivos márgenes brutos comerciales de NVIDIA y reducir su costo total de propiedad. Las TPU de Google siguen sirviendo como la columna vertebral de volumen de este mercado personalizado, mientras que la serie Trainium de Amazon ha asegurado compromisos sustanciales de miles de millones de dólares, incluidos despliegues con Meta.

Broadcom ha surgido como el principal habilitador y socio de diseño para este ecosistema de ASIC personalizados, capturando un estimado del 60% del mercado de semiconductores de IA personalizados a través de asociaciones de codiseño personalizado multigeneracionales con Google, Meta y OpenAI. El programa de silicio personalizado de Broadcom se está expandiendo a nodos avanzados de 2 nanómetros, aprovechando su profunda propiedad intelectual física y capacidades de integración de empaquetado para construir alternativas de alto rendimiento y rentables a las GPU de propósito general. Del mismo modo, Marvell posee una cuota estimada del 20% al 25% del espacio de diseño de ASIC personalizados, sirviendo principalmente a Amazon Web Services y Microsoft. A medida que el mercado de la IA madura y las cargas de trabajo pasan del entrenamiento fundamental intensivo en cómputo a la inferencia altamente repetitiva y sensible a los costos, estos ASIC personalizados y específicos para cargas de trabajo presentan un viento en contra estructural que podría erosionar gradualmente la cuota de mercado a largo plazo de NVIDIA en los centros de datos de hiperescala de gran volumen.

Historial de gestión y ejecución bajo escasez

El liderazgo senior de NVIDIA, encabezado por el fundador y CEO Jensen Huang y la CFO Colette Kress, ha demostrado un historial excepcional de agilidad operativa y previsión estratégica a largo plazo. La dirección anticipó con éxito los requisitos de hardware de la revolución de los modelos transformer y comprometió capital agresivamente para asegurar la capacidad de fabricación y empaquetado avanzado antes de que la ola de IA generativa se materializara por completo. Esta postura agresiva ha permitido a NVIDIA ejecutar constantemente sus aumentos de producción de hardware bajo severas restricciones globales de empaquetado y silicio, gestionando una cadena de suministro altamente compleja de cientos de socios, incluidos 150 proveedores solo en Taiwán.

Esta ejecución operativa se combina con un marco de asignación de capital disciplinado y alineado con los accionistas. Con el negocio generando flujos de caja libre masivos, la dirección ha aprovechado su fortaleza financiera para iniciar un programa sustancial de retorno de capital. En el primer trimestre del año fiscal 2027, la compañía devolvió $20.000 millones a los accionistas y estableció una autorización adicional de recompra de acciones sin fecha de vencimiento por $80.000 millones, lo que eleva la capacidad total de recompra a más de $118.000 millones. Si bien algunos participantes del mercado interpretan este enfoque en la recompra de acciones y un aumento de dividendos de 25 veces como una señal de una historia de hipercrecimiento que está llegando a la madurez, el compromiso simultáneo de la dirección con una cadencia de hardware anual y fuertes inversiones en investigación y desarrollo en futuras arquitecturas, como la próxima plataforma Feynman, indica que NVIDIA sigue centrada en el liderazgo tecnológico mientras mantiene una estructura de capital equilibrada.

El cuadro de mando

NVIDIA continúa ocupando una posición excepcionalmente fuerte, casi monopolística, en el epicentro del despliegue global de infraestructura de inteligencia artificial, como lo demuestra su ingreso récord del primer trimestre del año fiscal 2027 de $81.600 millones y márgenes brutos no GAAP del 75,0%. El foso competitivo de la compañía se ha expandido mucho más allá de la simple superioridad del silicio para abarcar el codiseño de sistema completo y a escala de rack, representado por la plataforma Vera Rubin, que está aumentando su producción. Al emparejar la CPU Vera personalizada de 88 núcleos con la GPU Rubin de 336.000 millones de transistores e integrarlas a través de redes propietarias NVLink 6, NVIDIA ha creado una plataforma optimizada y altamente integrada que ofrece hasta 10 veces el rendimiento agente de la generación Blackwell anterior. Esta integración de pila completa, combinada con el ecosistema de software CUDA profundamente arraigado, hace que sea altamente improbable que los competidores comerciales como AMD ganen una cuota de mercado sustancial en el entrenamiento de gama alta y las cargas de trabajo de inferencia agente complejas a corto plazo.

A pesar de esta excelencia operativa, los inversores a largo plazo deben sopesar el dominio de NVIDIA frente a los crecientes vientos en contra estructurales y geopolíticos. La compañía enfrenta una concentración de clientes sin precedentes, con solo cuatro hiperescaladores representando más del 60% de los ingresos totales, lo que expone al negocio a una volatilidad sustancial si estos compradores entran en una fase de digestión de gastos de capital. Simultáneamente, el rápido aumento de los ASIC personalizados, codesarrollados por Broadcom y Marvell para hiperescaladores como Google y Amazon, plantea una amenaza creíble a largo plazo a medida que el mercado cambia del entrenamiento a la inferencia altamente sensible a los costos. Sumado a la pérdida total de ingresos de centros de datos chinos debido a los controles de exportación de EE. UU. y una dependencia sistémica del ecosistema de fabricación de Taiwán, la valoración premium de NVIDIA deja poco margen para errores de ejecución. Si bien la hoja de ruta tecnológica sigue siendo inigualable, la transición a un mercado maduro y altamente concentrado indica que los rendimientos futuros estarán dictados por la resiliencia de la cadena de suministro y la economía de la sustitución por silicio personalizado.

Aviso legal: Este artículo es solo para fines informativos y no constituye asesoramiento de inversión ni una recomendación para comprar, vender o mantener ningún valor. Nuestros analistas ofrecen una cobertura detallada de eventos corporativos, pero pueden cometer errores; siempre realiza tu propia investigación. Los puntos de vista y opiniones expresados no reflejan necesariamente los de DruckFin. No hemos verificado de forma independiente toda la información utilizada aquí, y puede contener errores u omisiones. Antes de tomar cualquier decisión de inversión, consulta a un asesor financiero calificado. DruckFin y sus afiliados no asumen ninguna responsabilidad por cualquier pérdida que surja de la confianza en este contenido. Para los términos completos, consulta nuestros Términos de Uso.