Transcripción de Nvidia: Jensen Huang revela el futuro de la computación agentica, un retorno de efectivo del 50% y la arquitectura de CPU Vera Rubin

Sesión de preguntas y respuestas con analistas financieros en GTC Taipei 2026, junio de 2026

Anuncio importante sobre retorno de capital

Jensen Huang abrió la sesión con un anuncio financiero significativo. Nvidia planea devolver el 50% o más de su flujo de caja libre a los accionistas este año, el próximo y en adelante. Esto sucede tras el programa de recompra de acciones de $80.000 millones anunciado previamente y un incremento de 25 veces en el dividendo. Huang enfatizó que la compañía planea aumentar las recompras de acciones y los dividendos con el tiempo, describiendo esto como un compromiso sustancial con los accionistas.

La gran idea: el patrón de computación agentica

Huang dedicó una parte considerable de su tiempo a explicar lo que denominó la gran idea que ha estado discutiendo durante dos años. El patrón de computación de la IA es agentico, y los agentes son las aplicaciones modernas. Estos agentes pueden razonar, utilizar herramientas y acceder a una memoria a largo plazo. La memoria puede ser estructurada o no estructurada. Los agentes pueden utilizar herramientas que podrían estar en una PC, en la nube, herramientas de diseño, programación de software, recuperación de bases de datos, procesamiento de bases de datos o herramientas de diseño de chips. Este patrón de computación se ejecutará en todas partes, tal como las aplicaciones lo hicieron en el pasado. Se ejecutará en la nube, en PCs, en estaciones de trabajo, en automóviles e incluso en robots humanoides.

Este enfoque de computación es distribuido y desagregado, lo que significa que cada parte del patrón de computación de agentes se ejecuta en diferentes partes del centro de datos. Hopper fue construido para el preentrenamiento. Grace Blackwell introdujo la inferencia además del preentrenamiento y el postentrenamiento. NVLink 72 hizo posible generar los tokens de menor costo del mundo, no por un 20%, sino por 20 veces. Nvidia es ahora la forma de menor costo para generar tokens. El objetivo no es tener un centro de datos de bajo costo, sino producir el producto con bajo costo. Grace Blackwell de Nvidia genera tokens al costo más bajo del mundo.

Arquitectura Vera Rubin

Vera Rubin fue diseñada para el preentrenamiento, postentrenamiento, inferencia y ejecución de agentes. Este patrón de computación es desagregado y distribuido. Diferentes partes de esa carga de trabajo se ejecutan en diferentes partes de Vera Rubin. La parte pesada que genera dinero para la IA es la generación de tokens. Es por eso que maximizar el número de GPUs es importante, porque lo que las empresas venden son tokens. Las empresas comenzarán preguntando cuántas GPUs pueden caber en un centro de datos de un gigavatio, porque eso maximiza los ingresos.

El núcleo de todo es el pensamiento, que requiere una computación muy pesada. El pensamiento incluye leer el contexto, leer todos los documentos, razonar sobre ellos, elaborar un plan y actuar, lo que implica generar comandos para las herramientas. La retroalimentación de la herramienta regresa y el sistema evalúa si la respuesta es correcta. Este intercambio requiere que el uso de herramientas sea muy rápido, porque la IA está esperando. Es por eso que Nvidia trabaja con toda la industria del software para acelerar sus aplicaciones. Adobe ha acelerado su aplicación, reestructurando completamente Adobe Photoshop y Premiere por primera vez en décadas. Nvidia está acelerando a Cadence, Synopsys, Ansys y Siemens.

Las CPUs no pueden ser simplemente fáciles o baratas de alquilar. Tienen que ser rápidas para responder, razón por la cual el rendimiento de un solo hilo es importante. No multihilo, no multinúcleo, sino una CPU haciendo un trabajo para una IA tiene que ser súper rápida. Debido a que está desagregada, Nvidia pensó en cómo diseñar la CPU correcta y dónde colocarla. Vera Rubin es el mejor procesador de datos del mundo para sistemas de memoria. Una IA debe tener memoria a largo plazo y memoria a corto plazo. La memoria es datos. Mover datos por todo el centro de datos requiere mucho ancho de banda.

Vera tiene el mayor ancho de banda de E/S. Vera también tiene el mayor ancho de banda de CPU a CPU, porque al procesar datos, las CPUs tienen que hablar entre sí. No hay "impuesto de chiplet" porque todo está en un solo dado gigante. Nvidia podría haberlo hecho en cuatro o seis dados pequeños, pero cada vez que cruzas el dado, hay un impuesto de chiplet. El ancho de banda de CPU a CPU es tres veces y media mayor. El ancho de banda transversal dentro del chip es absolutamente el mejor del mundo. El ancho de banda de E/S es absolutamente el mejor del mundo, no por un 15%, sino por factores de X.

Diseño de núcleo de CPU personalizado

Grace fue la primera CPU con la que Nvidia decidió hacer esto. Vera fue la segunda generación. El núcleo de CPU en Vera es completamente personalizado porque Nvidia quería que esta CPU tuviera las instrucciones por reloj más altas del mundo. La CPU busca 10, decodifica 10 y ejecuta 10 instrucciones al mismo tiempo a través de toda la tubería. Ninguna CPU en el mundo hace eso. Vera no fue diseñada para humanos. Vera fue diseñada para agentes, que son muy impacientes. Es computación acelerada diseñada para agentes. Este sistema completo fue diseñado no solo para el preentrenamiento, no solo para la inferencia, sino para ejecutar agentes.

Reinvención de la PC con Microsoft

Hace unos tres años, Huang habló con Satya Nadella y le dijo que, en el futuro, la IA también querrá ejecutarse en un dispositivo porque la gente quiere tener asistencia acompañándolos todo el tiempo. En este momento, si alguien quiere hablar con su laptop, tiene que esperar hasta volver a su habitación. En el futuro, si alguien necesita que su laptop haga algo, simplemente le enviará un mensaje por WhatsApp. La laptop se convierte en una IA, se convierte en un asistente durante todo el día. La gente no quiere necesariamente ejecutar todo en la nube, porque si puede ejecutarse localmente, es gratis, al igual que las laptops, al igual que los teléfonos.

Huang y Nadella, Microsoft y Nvidia, decidieron crear una línea completamente nueva de computadoras. Esta línea completa de computadoras es la primera en el mundo que tiene procesamiento de tensores, compresión de parámetros y un sistema operativo que permite un "sandbox" que es seguro, porque la gente quiere poner a sus agentes en un entorno controlado y darles permisos. La línea completa incluye estaciones de trabajo, computadoras de escritorio y laptops. En los últimos tres años, han trabajado las 24 horas. Todo es ahora compatible. Cada aplicación importante ha sido probada y su rendimiento ha sido evaluado.

Toda la industria de las PCs, toda la industria informática, sin dejar a nadie atrás, todos se unirán para reinventar la computadora. Esta es la primera reinvención de la PC literalmente en 40 años. El comportamiento de una PC va a cambiar. Hará todo lo que solía hacer mejor y, además, será un asistente.

Modelos fundacionales y ecosistema

Nvidia anunció algunos modelos fundacionales, los modelos de IA física de frontera del mundo. Estos son la frontera de los modelos de IA física para sistemas robóticos y para conducción autónoma. Nvidia puso esos modelos a disposición del ecosistema. La misma idea es que una vez que tienes ese modelo, insertas un flujo de trabajo agentico y luego simplemente lo ejecutas en todas partes. Ese es el futuro. Nvidia está reinventando la computación en todos los aspectos.

Oportunidad de mercado de CPU

Cuando se le preguntó sobre el objetivo de $20.000 millones para la CPU, Huang explicó que, antes de Vera, cada CPU estaba construida para humanos. Las características de las CPUs del pasado y las de las CPUs del futuro serán muy diferentes. Vera es la primera con tal IPC extraordinario, tal ancho de banda por núcleo extraordinario, tal número extraordinario de núcleos con ancho de banda entre ellos y tal eficiencia energética extraordinaria. Las CPUs del futuro para el mundo de los agentes son muy diferentes a la CPU del pasado.

Cada centro de datos que tenga GPUs de Nvidia probablemente usará Vera. Nvidia vende millones de GPUs. Divídalo a la mitad y ese es el número de CPUs en el nodo principal. Fuera del nodo principal hay CPUs para orquestar la carga de trabajo y también en el servidor de almacenamiento. Este servidor de almacenamiento tiene una CPU de muy alto rendimiento. En el mundo de las GPUs de Nvidia, las CPUs probablemente serán de Nvidia en las tres configuraciones. Esto efectivamente duplica el número de CPUs.

La cuota de CPU de Nvidia probablemente será mayor que la cuota de GPU porque Nvidia tiene el 100% de la cuota de GPU y venderá más CPUs fuera de las GPUs de Nvidia. Cuando Nvidia se asocia con alguien en NVLink Fusion, le vende switches, NICs y CPUs. Nvidia Vera se venderá más allá de las GPUs de Nvidia. Para el procesamiento de datos, que es la carga de trabajo número uno en el mundo en la nube, Nvidia venderá muchas CPUs. La compañía también venderá muchas CPUs para EDA y simulación porque el rendimiento de un solo hilo es muy importante.

Las CPUs del pasado y las del futuro tienen diferentes centros de diseño. Nvidia va tras un mercado de cero mil millones de dólares llamado agentes. Agentes es un mercado de cero mil millones de dólares porque hace seis meses no existía. Hoy, los agentes han hecho posible tener una IA útil y ahora están impulsando una demanda enorme. Vera fue construida para eso y su momento ha llegado.

Razonando sobre el futuro: relación CPU a GPU

Huang enfatizó que la capacidad de predecir el futuro se trata de razonar, no de adivinar o esperar. Explicó que, independientemente del poder que tengan las empresas, solo están ganando dinero con los tokens. Las empresas de IA no pueden alquilar un núcleo de CPU. No quieren alquilar un núcleo de CPU. Quieren vender tokens. El modelo de negocio son los tokens. Las empresas quieren dos cosas: aumentar el ASP (precio de venta promedio) de los tokens, lo que significa hacerlos lo más inteligentes posible con modelos grandes, y hacer que el rendimiento sea lo más alto posible para producir tantos tokens como sea posible.

Esta fábrica solo se valora por los tokens. Lo primero que Huang aconsejaría a los clientes es maximizar la cantidad de Vera Rubin NVLink 72 en el centro de datos. Número dos, poner tantas CPUs como sean necesarias, tan pocas como sea posible para soportar las GPUs. Las empresas quieren maximizar el número de Vera Rubins porque les permite generar la mayor cantidad de dinero posible. Si gastan $50.000 o $60.000 millones en un centro de datos, las empresas también podrían ganar mucho dinero. Las CPUs no recuperarán ese dinero. No generan tokens. ¿Por qué las empresas querrían $30.000 millones en CPUs que no hacen nada?

¿Dónde se ejecutan los agentes? ¿Se ejecutan todos en la nube hoy? Sí. Pero, ¿dónde se ejecutarán en el futuro? En todas partes. Todos tienen CPUs. Es por eso que Nvidia tiene grandes CPUs en todas partes. Hoy, no hay otra opción que ejecutar el agente en la nube. En Nvidia, la compañía tiene agentes, y todos se están ejecutando actualmente en la nube, pero Nvidia está tratando de traerlos todos de vuelta. Deberían ejecutarse solo en laptops y luego pueden llamar a los modelos de IA en la nube o de otra manera. Así que las CPUs se distribuirían. Nvidia seguirá vendiendo muchas CPUs.

La razón es muy simple. Hay mil millones de usuarios de computadoras hoy. Mañana habrá decenas de miles de millones de agentes usando computadoras. Por definición, toda esta nueva población de inteligencia necesita computadoras para operar. Van a necesitar muchas CPUs, laptops, estaciones de trabajo y Vera Rubins para pensar. El mercado de CPU va a ser mucho más grande, pero no puede acercarse razonablemente a la GPU en términos de valor.

Pila de software empresarial

Cuando se le preguntó sobre el negocio empresarial, Huang explicó que la pila empresarial es cómo Nvidia ayudará a que cada empresa de software se convierta en una empresa agentica. La compañía mostró un ejemplo con Cadence. El patrón de computación tiene cuatro cosas: arnés de modelo, herramientas y habilidades, y tiempo de ejecución. Estas cuatro cosas son los ingredientes, la estructura operativa, el sistema operativo de los agentes. Nvidia ha estado trabajando con todas las empresas de SaaS. Todo es abierto excepto la capa de Nvidia AI Enterprise. Esa es la capa de tiempo de ejecución para empresas. Nvidia cobra aproximadamente entre $1.000 y $1.500 por GPU al año.

Esa licencia de software obviamente está creciendo. Cuando las empresas la ejecutan, cuando las empresas de SaaS la ejecutan en la nube, esa es la licencia de software. Huang cree que es una oportunidad de negocio bastante grande. Deberían ser miles y miles de millones.

Estrategia de PC y propuesta de valor

Huang explicó por qué Nvidia está entrando en el mercado de las PCs. La compañía ha estado en la industria de las PCs durante mucho tiempo. Nvidia no está clamando por construir otro dispositivo básico. Eso sería muy ajeno a su carácter. La compañía no solo construye una CPU por el bien de la CPU. Nvidia construye una CPU porque el mundo ha cambiado o la compañía quiere cambiar el mundo. Hace mucho tiempo, cuando Huang entró en la industria de los gráficos, el ASP de una tarjeta gráfica era de $49. La gama alta era de $100. Obviamente, Nvidia ahora tiene tarjetas gráficas de $1.500, $2.500, $5.000, $8.000. La compañía reinventó lo que significan los gráficos y lo que hacen, y por lo tanto, la convirtió de una tarjeta gráfica en una GPU.

Nvidia hará lo mismo con las PCs. La compañía no entró para construir una PC. Nvidia va a remodelar lo que es una PC. Una PC hoy es como una máquina de escribir. Es un dispositivo en el que la gente escribe y hace clic. En el futuro, se convertirá en un asistente que está funcionando todo el tiempo. Cuando esa PC cambia de una máquina de escribir inteligente a un sistema agentico, un asistente de IA inteligente funcionando en segundo plano todo el tiempo, siempre disponible, siempre a la espera, a menudo avisando para que la gente sepa que algo ha terminado, esa forma de pensar sobre un asistente cambia la propuesta de valor.

Tal vez hoy la gente piense que eso debería costar $1.500, pero la idea de tener un asistente de $10.000 que se usa todos los días haciendo cosas no es ilógica. Al igual que en los viejos tiempos, era sensato tener un teléfono de $99, pero ahora la gente gasta $2.000 en teléfonos inteligentes. Es algo sensato, pero la categoría tiene que ser reinventada. Lo que Satya y Huang están haciendo, lo que Microsoft y Nvidia están haciendo, es reinventar esta categoría, tomando todo lo que la gente ama de las PCs, haciéndolo mejor, pero reinventando el concepto completo de una computadora personal. Ahora es una IA personal. Es por eso que Nvidia está en este mercado, no para reducir la PC y convertirla en un producto básico. Nvidia nunca hace eso.

Piense hace 10 años. Huang entró en la industria automotriz y el controlador integrado de un automóvil, la computadora en el automóvil, costaba algo así como $29. Dijo que la compañía no está tratando de competir por esos $29. Lo que Nvidia quiere hacer es reinventar ese automóvil en un automóvil robótico, en un automóvil de conducción autónoma. Lo primero que tiene que hacer la compañía es hacerlo programable por software y redefinir el chasis, la arquitectura del mismo. Ahora Hyperion está en todas partes. No existe tal cosa como un Hyperion de $29. Nvidia reinventó lo que puede ser un automóvil. En cada una de estas categorías, la compañía simplemente está reinventando. Ese es el estilo de Nvidia.

Estrategia de óptica y cobre

Cuando se le preguntó sobre la óptica en el centro de datos, Huang explicó que la gente debería usar cobre tanto como pueda, tanto como sea posible. Deberían usar óptica siempre que sea necesario. El cobre inicialmente comenzó con distancias muy cortas, pero debido al SerDes que inventó Nvidia, la compañía ahora puede llegar, en el caso de NVLink, al SerDes de mayor recorrido de la historia. Nvidia ejecutó todo el plano posterior de un rack. Nadie pensó que eso fuera posible. Como resultado, Nvidia tomó el cobre y lo convirtió en "cobre sexy". La compañía trajo lo sexy de vuelta al cobre.

Debido al cobre, porque Nvidia hizo que el cobre fuera sexy, la compañía también hizo que los conectores, estos microconectores con los que trabajaron con Amphenol, fueran sexys también. La compañía debería mantener el cobre y usarlo durante el mayor tiempo posible porque es confiable y extremadamente rentable. Sin embargo, Nvidia debería usar óptica donde sea necesario. Un metro o algo así es el límite. La compañía cree que podría ser capaz de ir un poco más lejos, pero no 10 veces más lejos.

Los centros de datos que Nvidia está construyendo están pasando, en el caso del primer sistema de OpenAI, de 18.000 GPUs. Eso fue Ampere. El primer superordenador de OpenAI tenía 18.000. En la era de Hopper eran unas 100.000. En la era de Blackwell está en el límite de unas 250.000 o 200.000. Pero ahora, en la era de Vera Rubin, es al menos medio millón. Medio millón de GPUs necesitará una red bastante sofisticada. Para eso está diseñado Spectrum 6. Spectrum 6 es el primer CPO de 800 gigabits del mundo y está diseñado para escalar fábricas de IA que son sistemas gigantes de cientos de miles o un millón. El cobre no tiene ninguna posibilidad de hacer eso.

Nvidia escala hacia arriba con cobre. La compañía podría escalar más con fotónica de silicio, con óptica. Luego Nvidia escala hacia afuera con óptica y escala a través con óptica. La conclusión es que la compañía necesitará mucho cobre, muchos conectores, mucha óptica, razón por la cual Nvidia se asoció e invirtió en Coherent, Lumentum, Corning. La asociación con Marvell trata de preparar al mundo para poder escalar con Nvidia, escalar hacia afuera con Nvidia. La cadena de suministro de Nvidia es bastante genial.

Inferencia y adopción de agentes

Cuando se le preguntó sobre la inferencia, Huang explicó que la inferencia llegará a las PCs cuando RTX Spark llegue a ellas. La razón de eso es simple. ¿Qué es un agente? Agente equivale a IA útil. Esta IA útil no está diseñada para reescribir todo el software en la PC. El agente va a utilizar el sistema operativo, DirectX, Adobe Photoshop, Autodesk. El agente es finalmente lo suficientemente inteligente, ese patrón de computación es finalmente lo suficientemente inteligente para usar las herramientas en las computadoras para ayudar a las personas a hacer sus trabajos.

La mayoría de la gente, incluso los expertos, conoce solo una fracción de las características reales de Adobe Photoshop, Adobe Premiere, Lightroom. Ahora, con los agentes, el agente aprenderá los archivos de habilidades, los manuales, los manuales operativos de todas estas herramientas simplemente leyéndolos. Estos agentes ahora van a ser expertos en cada herramienta. Todo lo que la gente tiene que hacer es pedirle al agente ayuda para hacer algo. No tienen que conocer los comandos reales. El agente ayudará a hacerlo. De repente, todas las PCs van a ser más útiles. Las PCs van a ser agenticas. Todo eso es inferencia. Cada vez que el agente está pensando, está haciendo inferencia. Inferencia equivale a pensamiento. Para hacer algo, el agente tiene que pensar primero. Para hacer algo, tiene que elaborar un plan. Tiene que hacer inferencia. Cuando llegan los agentes, es cuando la inferencia despega, porque cuando llegaron los agentes, llegó la IA útil.

En términos del centro de datos, Huang adivinaría, aunque no lo sabe exactamente porque los sistemas de Nvidia hoy se utilizan para entrenamiento, pero más tarde, cuando la compañía presente Vera Rubin, los clientes tomarán todos los sistemas Grace Blackwell y los usarán para inferencia. Esa es una de las bellezas del sistema de Nvidia. Los investigadores están multiplicando su rendimiento para el entrenamiento cada año en lugar de usar un centro de datos que fue construido solo para inferencia o solo para entrenamiento y quedarse atrapado con él para siempre. El sistema es completamente fungible. Nvidia lo construyó para ser fungible por buenas razones.

Cuando algo es fungible, su utilidad aumenta. Cuando algo es fungible, la utilidad aumenta. Cuando la utilidad aumenta, el TCO (costo total de propiedad) disminuye. Cuando la utilidad aumenta, la vida útil se extiende. Cuando la vida útil se extiende, el TCO disminuye. Huang está seguro de que las plataformas de Nvidia tienen los TCO más bajos del mundo. Puede probarlo. ¿A100 ha sido amortizado durante cuántos años ya? Tres o cuatro. Están acuñando monedas a $3 a $4 por hora. Aquí hay un chip que es gratis ganando $3 por hora, 24 horas al día. Eso es mejor que cuando Huang era ayudante de mesero.

Abordando la percepción y adopción de la IA

Cuando se le preguntó sobre que la IA es más impopular que la energía nuclear y cómo convencer al público estadounidense para que apoye la IA y la construcción de infraestructura, Huang dijo que esta era en realidad la pregunta más optimista. En Asia, la IA es amada. En Estados Unidos, la IA es odiada. La razón de eso es porque muchas personas usan palabras que tienen la intención de posicionar a su empresa, destinadas a causar captura regulatoria. Tienen que ser inteligentes al respecto porque es dañino para el país.

Si Estados Unidos, Sudamérica o Europa no usan IA y la comparan con bombas nucleares, lo cual es completamente ridículo, todos deberían tener IA, nadie debería tener una bomba nuclear. Esa comparación es ridícula. No tiene sentido. Es hiperbólica sin ninguna buena razón. Asusta a la gente. Si la industria termina asustando a las comunidades para que no usen IA, le ha hecho un gran daño a la comunidad y al país. Esa es la mayor preocupación de Huang.

Por supuesto, la IA tiene que construirse de forma segura. Por supuesto, debe haber políticas en los mercados finales para evitar que se use de manera inapropiada. Por supuesto, la seguridad, la protección, la funcionalidad, todas estas cosas tienen que ser ciertas. Es responsabilidad de la industria tecnológica, de los fabricantes de productos, de los fabricantes de servicios, garantizar que eso sea cierto. La idea de que de alguna manera una empresa es la única empresa que construye seguridad es una tontería. Es como si solo una empresa automotriz construyera autos seguros y todos los demás autos simplemente mataran gente al azar. Es el trabajo de toda la industria. Es responsabilidad de toda la industria hacer grandes productos, productos seguros, productos protegidos.

Es posible estar seguro y estar preocupado y optimista. Estas no son ideas contradictorias. El mundo tiene que construir para la seguridad, la protección y un futuro optimista al mismo tiempo. Ambas ideas son posibles. Requiere mucho trabajo. La industria tiene que ser muy seria al respecto. Pero una cosa que no se debe hacer es asustar a la comunidad pensando que esta tecnología es peligrosa y, por lo tanto, que sus hijos no la utilicen. Huang les dice a sus dos hijos que usen IA. No quiere que se queden atrás. Su consejo para sus hijos es la prueba definitiva de cómo se siente acerca de la tecnología.

Nadie va a aconsejar a sus hijos que no usen IA. No dejen que se queden atrás. A medida que los analistas escriben cosas que la gente lee, todos deberían tener IA. Pero la industria debe tomarlo en serio. Construirlo correctamente. Construirlo de forma segura. Construirlo de forma protegida.

Economía del costo por gigavatio

Cuando se le preguntó sobre el costo por gigavatio pasando de $50.000 millones a $90.000 millones, Huang preguntó qué es mejor para un centro de datos de un gigavatio: tener $50.000 millones en computadoras o $1 billón en computadoras. Un billón es mejor. La razón de eso es porque sigue siendo un gigavatio. Para soportar $1 billón en computadoras, ese billón de dólares en computadoras debe ser muy productivo y su eficiencia energética debe estar fuera de serie. Huang simplemente estaba proyectando bondad. La alternativa es tonta.

Este año, se pueden poner $50.000 millones en computadoras en un gigavatio. Si el próximo año solo se pueden poner $10.000 millones, cuando alguien te dice que sus dólares por gigavatio, su cómputo por gigavatio es bajo, tienes que preguntarte si eso es una buena noticia. Huang simplemente está proyectando buenos principios de ingeniería. Eso es en lo que Nvidia es increíblemente buena. La compañía es increíblemente buena en rendimiento por vatio. El rendimiento por vatio es lo único que importa.

Es posible tener tres veces el rendimiento por vatio. Muy posible. No es posible reducir el costo tres veces. La razón de eso es muy simple. Neto de márgenes brutos, todavía hay memorias, cables, generadores de energía y MLCCs. No se puede reducir el costo de todo. Lo que se puede reducir es un cierto porcentaje, pero no es inusual que el rendimiento por vatio de Nvidia sea tres veces, 10 veces mayor. Por lo tanto, el rendimiento por vatio es absolutamente vital.

La capacidad extrema de co-diseño de Nvidia, el hecho de que la compañía diseña a través de todo el rack y toda la pila de software, permite a Nvidia exprimir literalmente todo, para arquitecturizarlo inteligentemente de modo que la eficiencia energética sea increíble. El rendimiento por vatio es de clase mundial y Huang sigue creyendo que esa será la capacidad brillante de Nvidia y la característica más importante de una fábrica de IA en el futuro.

Justificación de la divulgación por segmentos de negocio

Cuando se le preguntó sobre la motivación para resegmentar las finanzas, Huang explicó que el propósito de la divulgación es explicar cómo funciona el negocio. Cuando todo se agrupó en un centro de datos gigante, no muestra cómo funciona el negocio en absoluto. Es solo un gran número. La pregunta es cómo funciona el negocio.

El negocio funciona de tres maneras solo dentro de los hiperescaladores. Uno, Nvidia trae clientes a los hiperescaladores. Es por eso que la compañía está en cada nube. Están distribuyendo el cómputo de Nvidia de muchas maneras porque Nvidia les trae clientes, grandes. Mantienen a Nvidia en su nube porque la compañía les trae clientes. El hecho de que el ecosistema sea tan rico permite a Nvidia traerles muchos clientes.

Número dos, Nvidia ejecuta sus cargas de trabajo internas: búsqueda, procesamiento de datos, consultas SQL, un montón de cosas, voz, transcripción. Los modelos de transcripción de Nvidia son los mejores del mundo. La compañía ejecuta un montón de cosas: gráficos por computadora, PCs remotas. Eso es todo Nvidia. Así que está toda esa carga de trabajo interna, cosas que no son IA, cosas clásicas de computación acelerada.

Y luego hay un tercero que es la IA. Es Anthropic. La compañía está muy complacida de que esté creciendo con ellos. Es OpenAI. Es XAI. El negocio con los CSP (proveedores de servicios en la nube) se describe en esa textura. Eso solo es suficiente para que la gente piense.

Luego hay una segunda categoría que son los OEM como HP, Dell y Lenovo, y venden a industriales y OEM o venden a lo que se llaman NCP, las NeoClouds o nubes nativas de IA o nubes de IA. CoreWeave depende de Nvidia. Lambda depende de Nvidia para muchas cosas, incluida la ayuda para montar todo su centro de datos. No quieren comprar en piezas. Quieren comprar la arquitectura de referencia. La razón de eso es porque toda esa pila de software es tan complicada y simplemente no tienen suficientes ingenieros ni quieren tener tantos ingenieros. Quieren moverse rápido. La agilidad es su habilidad, su ingrediente secreto.

Pueden asegurar tierra, energía y estructura. Lo encuentran y están en todo el mundo. Están en Australia, están en Europa, están por todo Estados Unidos y son súper inteligentes para encontrar tierra, energía y estructura porque son regionales. La tierra es regional. La tierra no está en la nube. Ahora pueden encontrar tierra, energía y estructura. Necesitan la arquitectura de referencia de computación de Nvidia. Necesitan la pila de software. Necesitan que Nvidia los traiga a los clientes. Y luego, después de eso, necesitan financiamiento. Nvidia hace una pequeña inversión en ellos para asegurarles su reputación, para anclar su inversión. Luego pueden ir a recaudar el 90% por sí mismos. Luego, Nvidia les trae clientes y ellos atan todo eso.

Toda esa segunda categoría, en realidad no son diseñadores de arquitecturas. No están arquitecturizando nuevos ASIC. No quieren hacer eso. Su propósito no es diseñar y construir una computadora. Su propósito es operar una computadora para un servicio. No quieren diseñar una computadora. Quieren operar una computadora. Todo ese segundo segmento, resulta que es el 50% del negocio. Está creciendo un 100% al año. A largo plazo, es probable que sea aún mayor. La razón de eso no es porque los CSP vayan a disminuir. Es porque hay demasiadas cosas en el borde (edge).

Cada fábrica va a tener un cerebro de fábrica. Esa carga de trabajo agentica se va a ejecutar dentro de cada fábrica. Esa computadora no puede sentarse en la nube. Hay muchas empresas que quieren, por razones industriales o de telecomunicaciones o simplemente porque tiene que ser regional o soberano o por razones de protección de datos, necesitan construir los centros de datos y controlarlo. Ese mercado va a ser bastante grande.

El tercer segmento es la robótica y el borde. ¿Crees en el futuro de la robótica? ¿Crees en la IA física? Si es así, Nvidia no va a estar en todos ellos, pero la compañía va a estar en muchos de ellos. A Nvidia le gustaría presentar una línea completamente nueva de sistemas de borde. Esas son las tres categorías: proveedores de servicios en la nube, nubes de IA y empresas e industriales, y luego robótica y borde.

Al divulgarlo de esa manera, realmente podría ayudar con la granularidad del negocio y la gente podría decidir por sí misma cómo quieren proyectar cada uno de estos segmentos. Esto llevó a Huang a la conclusión de que Nvidia está ganando cuota y eso es extraño, no porque la compañía se la esté quitando a nadie, sino porque el futuro de la IA está creciendo de todas estas maneras diferentes. Al pensar en el mundo de la IA, Nvidia comenzó con lo que la gente piensa que es una posición muy grande. La compañía ahora está creciendo con Anthropic y todos los modelos de IA, OpenAI, etc. Pero hay todo otro segmento de IA del que la gente no habla y está desatendido. No fue hasta hace poco que Michael Dell simplemente hizo estallar su trimestre y ninguno de ellos eran CSP. La compañía lo hizo estallar por completo.

Evidencia del impacto en la productividad

Cuando se le preguntó sobre el riesgo de recesión, Huang proporcionó evidencia del impacto de la IA en la productividad. El cuerpo de empleados más grande en dólares en el mundo son los ingenieros de software: $3 billones a $4 billones. Sin incluir a todas las personas de marketing que codifican o personas de la cadena de suministro que codifican, solo los programadores. Estos tres o cuatro billones de dólares al año de gastos operativos contribuyeron en 2023 con 300 millones de envíos (submits). Envías el software cuando terminas de programarlo, lo pruebas y lo envías a producción. Luego 400 millones de envíos, luego 500 millones de envíos en 2025. El año pasado fueron 500 millones.

La forma de pensar en eso es que $3 billones de gastos operativos contribuyeron con 500 millones de envíos de software. En los primeros meses de 2026, en los primeros meses, pasó de 500 millones por año a 1.400 millones por año. Se triplicó en tamaño. Entonces, ¿qué acaba de pasar? La productividad de $3 billones acaba de triplicarse. La industria produjo más de $6 billones en productividad. Es un generador de productividad insano.

Mientras tanto, la gente sigue hablando de cómo los ingenieros de software van a ser despedidos. Si hay un ingeniero de software que pudiera usar agentes con $3 billones de gastos operativos y puede generar más de $6 billones, las empresas no van a despedir a esa persona. Van a contratar más. No tiene sentido despedir a esa persona. Las empresas van a contratar más para que puedan generar aún más. El mundo tiene mucho código que debe ser generado. Código equivale a resolución de problemas. Código equivale a crecimiento del PIB. Código equivale a innovación.

Ahora hay evidencia absoluta de que hay muchas cosas en las que podrías ahorrar dinero, pero la única cosa en la que no quieres ahorrar dinero es en la codificación de software. Eso es lo que hace Nvidia para ganarse la vida. Eso es lo que hace la máquina. Genera código, genera tokens.

Apoyo a la cadena de suministro

Huang abordó las preguntas sobre la cadena de suministro directamente. Nvidia tiene el apoyo de todo el ecosistema y la cadena de suministro para proporcionar un crecimiento muy sólido. La compañía creció casi un 100% año tras año desde una base que ya era muy grande. Nvidia tiene la capacidad, con el apoyo de la cadena de suministro, de crecer de manera muy sólida. Sin embargo, la compañía no tiene suficiente suministro y la razón de eso es porque la cadena de suministro mundial está limitada en la oferta. Pero Nvidia tiene el apoyo del ecosistema para tener un crecimiento muy sólido, muy por encima de cualquier guía que se haya proporcionado.

Leer a continuación

Análisis a fondo de Samsara: El sistema operativo de IA para la economía física

2026-06-27

Análisis profundo de Coherent: El foso de fosfuro de indio y el cuello de botella óptico de la IA

2026-06-27

Aravolta: La depreciación de las GPU varía entre un 30% y un 45% según la carga de trabajo real, dejando obsoletos los promedios de la industria para los prestamistas

2026-06-27

La administración Trump lanza ataques contra Irán horas después del alto al fuego, lo que dispara la volatilidad en el mercado de materias primas

2026-06-27

Noam Brown de OpenAI: Las tablas de referencia engañan a los inversores sobre la capacidad de los modelos

2026-06-27

All In Podcast: Los modelos de IA de código abierto de China desafían a los laboratorios de frontera de EE. UU. mientras el cuello de botella de memoria impulsa la inflación industrial

2026-06-27

Aviso legal: Este artículo es solo para fines informativos y no constituye asesoramiento de inversión ni una recomendación para comprar, vender o mantener ningún valor. Nuestros analistas ofrecen una cobertura detallada de eventos corporativos, pero pueden cometer errores; siempre realiza tu propia investigación. Los puntos de vista y opiniones expresados no reflejan necesariamente los de DruckFin. No hemos verificado de forma independiente toda la información utilizada aquí, y puede contener errores u omisiones. Antes de tomar cualquier decisión de inversión, consulta a un asesor financiero calificado. DruckFin y sus afiliados no asumen ninguna responsabilidad por cualquier pérdida que surja de la confianza en este contenido. Para los términos completos, consulta nuestros Términos de Uso.