Intel en Computex 2026: La IA agéntica cambia la proporción GPU/CPU, e Intel tiene el rack para demostrarlo
La conferencia de Lip-Bu Tan en Computex el 2 de junio de 2026 ofrece la señal más clara hasta ahora de que la IA agéntica está reconfigurando estructuralmente la demanda de silicio para centros de datos a favor de Intel.
La CPU ya no es un actor secundario
El mensaje más importante de la conferencia de Intel en Computex 2026 no es un lanzamiento de producto. Es un cambio fundamental en la proporción de cómputo que rige cómo se construyen los centros de datos. Durante años, la GPU ha dominado la economía de la infraestructura de IA, con la CPU simplemente orquestando el tráfico a su alrededor. Intel utilizó una demostración en vivo el martes para mostrar que la IA agéntica —sistemas que planifican, ejecutan, iteran y generan subagentes en lugar de solo responder a un prompt— invierte esa proporción casi por completo.
En un pipeline de inferencia de IA tradicional, la proporción de carga de trabajo CPU-GPU es de aproximadamente siete a uno a favor de la GPU. En un sistema agéntico, como se mostró en tiempo real utilizando los procesadores Xeon 6 de Intel, la proporción se acerca a la paridad y se inclina hacia un uso intensivo de CPU. "A medida que trabaja, utiliza herramientas, lee y escribe archivos, verifica reglas y, para cada paso, el tipo de necesidades de cómputo subyacentes es muy diferente", explicó el ejecutivo de centros de datos de Intel en el escenario. "Esa es la razón principal por la que hay un aumento tan rápido en la demanda de CPU. Para la IA agéntica, la CPU es la protagonista".
La lectura comercial es directa. Si la IA agéntica se convierte en el paradigma de inferencia dominante —y la trayectoria de adopción de IA empresarial sugiere que así será—, entonces la construcción de infraestructura actual, que ha favorecido abrumadoramente las arquitecturas centradas en GPU, está subestimando materialmente a la CPU. Intel, con su franquicia Xeon y el nuevo Xeon 6+ que cuenta con 288 núcleos y 576 megabytes de caché L3 por procesador, está posicionada para capturar ese reequilibrio. Un rack construido sobre núcleos de eficiencia Xeon 6+, dijo la compañía, puede ejecutar hasta 150.000 agentes en 32 unidades de espacio de cómputo; una afirmación de densidad que requerirá validación independiente, pero que es direccionalmente significativa para los CIO que evalúan los costos de infraestructura agéntica.
La demostración de SambaNova concreta el caso heterogéneo
El momento técnicamente más preciso de la conferencia fue una demostración en vivo presentada junto al CEO de SambaNova, Rodrigo Liang, que mostró una inferencia desagregada utilizando las unidades de flujo de datos reconfigurables (RDU) de SambaNova junto con CPUs Intel Xeon y GPUs Nvidia simultáneamente. La arquitectura asigna cada clase de chip a la etapa del pipeline que mejor maneja: los procesadores Xeon ejecutan las herramientas, las RDU de SambaNova manejan la decodificación y generación de tokens, y las GPUs gestionan el almacenamiento en caché y el prellenado de prompts.
"Cuando los tres chips trabajan juntos, se reduce drásticamente la latencia de extremo a extremo; los agentes necesitan la mayor velocidad posible", dijo Liang, añadiendo que pruebas independientes de Artificial Analysis encontraron que el stack desagregado es de dos a tres veces más rápido que las GPUs solas en el mismo modelo y prompt. La asociación, anunciada a principios de este año como una colaboración multianual, ya está entregando producto físico: un sistema de infraestructura de IA a escala de rack llamado SambaNova Summer, construido para cargas de trabajo agénticas, se enviará a los clientes a finales de este año.
Robert Smith, de Vista Equity, quien apareció en el escenario con Tan, proporcionó el respaldo desde el lado de la demanda. Vista tiene más de 90 empresas en su portafolio, más de la mitad de las cuales ya han migrado a soluciones agénticas, atendiendo a aproximadamente 750 millones de usuarios y, según la estimación de Smith, generando más de 10 mil millones de agentes. Vista ha lanzado Vector Core Compute, descrito como la primera arquitectura disponible comercialmente en el mundo para inferencia desagregada, con más de 50 implementaciones planeadas en EE. UU. para convertir centros de datos existentes en centros de datos de inferencia. "ForwardTogether AI es el primer cliente comercial y está entusiasmado de utilizar esta arquitectura como servicio para acelerar las cargas de trabajo de inferencia", dijo Smith.
Intel entra oficialmente en el mercado de silicio personalizado
Quizás el anuncio estratégicamente más subestimado de la conferencia fue la entrada formal de Intel en el mercado de silicio hecho a medida y específico para el cliente: el mercado de ASICs y chips personalizados que históricamente ha sido dominio de Broadcom, Marvell y los equipos internos de silicio de los propios hiperescaladores.
El líder de silicio hecho a medida de Intel reveló dos victorias de clientes destacados. Primero, Google se ha asociado con Intel para diseñar e implementar una unidad de procesamiento de infraestructura (IPU), que ya está en producción, no es un elemento de hoja de ruta. Segundo, Ericsson ha seleccionado a Intel para entregar silicio de infraestructura de próxima generación a escala global en todo su negocio de redes de telecomunicaciones. "Qué mejor lugar que Computex y Taipéi, donde el silicio personalizado es realmente el nombre del juego, para anunciar que Intel ha entrado oficialmente en este mercado", dijo el ejecutivo.
Tan reforzó la intención estratégica explícitamente, describiendo ambiciones de construir silicio personalizado con "empresas de vanguardia, así como algunas de las startups más dinámicas en verticales de la industria", que abarcan ingeniería biomédica, automatización industrial y energía. Las asociaciones destacadas incluyen a Eddie Chang, neurocirujano de UCSF y cofundador de ACCO Neuro Technologies, trabajando con Intel en algoritmos entrenados por el cerebro para la transmisión de voz; Greenstone Biosciences del cardiólogo de Stanford Joseph Wu, que combina el cómputo de IA de Intel con el biobanco más grande del mundo de células madre pluripotentes inducidas por humanos para el desarrollo de fármacos; Siemens, expandiéndose desde el diseño a la fabricación y aplicaciones de chips dentro de los propios productos de Siemens; y Hitachi, centrado en herramientas de fundición y sistemas de computación cuántica.
Asociación a escala de rack con Foxconn y el impulso a los estándares abiertos
Intel también anunció una asociación formal de desarrollo a escala de rack con Foxconn, una de las relaciones operativamente más significativas en la cadena de suministro global de hardware. Ambas compañías desarrollarán, integrarán y comercializarán conjuntamente soluciones de infraestructura de IA a escala de rack diferenciadas, con énfasis en arquitecturas heterogéneas para diversas cargas de trabajo de IA. La asociación amplía la iniciativa de planos a escala de rack de Intel, que tiene como objetivo construir arquitecturas de referencia basadas en estándares abiertos —posicionadas explícitamente contra el bloqueo de proveedores— junto con socios como Foxconn y SambaNova.
Se mostraron dos planos de referencia: uno optimizado para el rendimiento agéntico utilizando Xeon 6 con núcleos de rendimiento, y otro para la densidad de agentes utilizando núcleos de eficiencia Xeon 6. El marco de estándares abiertos es una señal competitiva deliberada, dirigida a clientes empresariales que se han vuelto cautelosos ante el costo y la dependencia de proveedores incrustados en la infraestructura de IA actual centrada en GPU.
La asociación con Perplexity replantea la historia de la IA en el dispositivo
En el lado del cliente, el cofundador y CEO de Perplexity, Aravind Srinivas, demostró la inferencia agéntica híbrida en el Core Ultra Series 3 de Intel, el primer producto construido sobre la tecnología de proceso AT&A de Intel. El caso de uso fue un analista de capital privado ejecutando un análisis confidencial de compra apalancada (LBO): los documentos confidenciales de la sala de acuerdos, los acuerdos de confidencialidad (NDA) y los modelos financieros se procesan localmente en el dispositivo, mientras que las consultas de investigación no sensibles se enrutan a modelos en la nube. "El modelo local decide qué es trabajo muy importante y no debe enviarse al servidor. Lee los archivos, clasifica qué es sensible y qué no", explicó Srinivas.
"La inferencia agéntica híbrida es cómo maximizamos el valor del token por vatio por usuario", dijo. La arquitectura refleja una realidad comercial en la que ambas compañías parecen estar genuinamente alineadas: los flujos de trabajo empresariales sensibles a la privacidad no pueden trasladarse completamente a la inferencia en la nube, y la economía de la inferencia en el borde mejorará a medida que los modelos en el dispositivo sean más capaces. La plataforma AT&A de Intel ahora sustenta más de 300 diseños en envío en los segmentos de consumo y comercial, con una variante adicional de la serie Core 3 lanzada en abril que ya alcanza más de 70 diseños, llevando la línea combinada a casi 400 diseños.
Xeon 6+ y el argumento de la eficiencia del centro de datos
Intel presentó el procesador Xeon 6+ en Computex, la variante de núcleos de eficiencia de su familia Xeon 6, con 288 núcleos, 576 megabytes de caché L3 y una propuesta basada en la densidad de cómputo y la eficiencia energética para la infraestructura de nube y red. La compañía enmarca esto como una forma de permitir configuraciones de servidor y rack más compactas, un argumento de venta significativo a medida que los operadores de centros de datos enfrentan crecientes limitaciones de energía y bienes raíces. Los pronósticos citados en el escenario proyectan que la demanda fundamental de los centros de datos crecerá de 80 gigavatios a 100 gigavatios para 2030, y se espera que las cargas de trabajo de inferencia de IA representen el 40% de la demanda total de energía de los centros de datos en ese horizonte.
El Xeon 6+ se une a una variante de núcleos de rendimiento Xeon 6 que ya se está enviando, dando a Intel una respuesta de dos productos a las necesidades de cómputo divergentes de los pipelines agénticos. La afirmación de Intel de que x86 alimentará ocho de cada diez servidores instalados hasta 2030 es una declaración deliberadamente confiada sobre la durabilidad arquitectónica en un mercado donde las alternativas basadas en Arm de Ampere, AWS Graviton y otros han ganado una participación significativa.
La credibilidad en la ejecución sigue siendo la pregunta predominante
El marco intelectual que Tan está construyendo en torno a la IA agéntica, el cómputo heterogéneo y el silicio hecho a medida es coherente y, si el mercado se desarrolla como Intel pronostica, genuinamente ventajoso para el posicionamiento de la empresa. El problema que Intel aún no ha resuelto —y que Tan reconoció oblicuamente— es la credibilidad en la ejecución. "La ejecución siempre ha estado en la parte superior de mi lista", dijo, señalando que el aumento de AT&A a alto volumen con múltiples productos y el progreso en hitos de empaquetado avanzado representan un progreso real catorce meses después de su mandato. Pero el historial de Intel de retrasos en la fabricación, pérdida de clientes de fundición y erosión de la cuota de mercado tanto en el cliente como en el centro de datos significa que la brecha entre el argumento arquitectónico y la entrega de ingresos sigue siendo amplia, y los inversores exigirán más que demostraciones y anuncios de asociaciones antes de revisar materialmente al alza las estimaciones a largo plazo.
Lo que Computex 2026 establece es que el Intel de Tan tiene una narrativa estratégica más clara y diferenciada de la que la compañía ha tenido en años. El argumento de la proporción de cómputo de la IA agéntica no es marketing: es una tesis estructuralmente defendible. Si Intel puede fabricar, empaquetar y enviar al volumen y ritmo necesarios para capturar la oportunidad que ha identificado es una pregunta separada y más difícil, y la respuesta a esa pregunta determinará si esta conferencia marca un punto de inflexión o simplemente otro punto de datos en una larga historia de recuperación.