All In Podcast: Los modelos de IA de código abierto de China desafían a los laboratorios de frontera de EE. UU. mientras el cuello de botella de memoria impulsa la inflación industrial
Episodio 278 con Gavin Baker y Travis Kalanick, grabado en junio de 2026
Los laboratorios chinos de IA están cerrando rápidamente la brecha con los modelos de frontera de EE. UU. mediante lanzamientos de código abierto que ahora igualan o superan el rendimiento de GPT-5.5 de OpenAI y Claude Opus 4.8 de Anthropic, lo que plantea preguntas fundamentales sobre si las restricciones de seguridad autoimpuestas por Estados Unidos aún cumplen algún propósito estratégico. El lanzamiento de GLM 5.2 por parte de Z.AI de China marca un momento decisivo, ya que el modelo logra la puntuación más alta de cualquier modelo de pesos abiertos en benchmarks clave, con un costo 85% menor que los modelos cerrados comparables de empresas estadounidenses.
El avance del código abierto en China vuelve obsoleto el "teatro de seguridad" de EE. UU.
GLM 5.2 obtuvo 51 puntos en el índice de inteligencia de análisis artificial, la puntuación más alta jamás registrada para un modelo de pesos abiertos, y superó a GPT-5.5 en el benchmark de codificación Frontier SWE, quedando por detrás de Claude Opus 4.8 por menos de un punto porcentual. El modelo cuenta con 744 mil millones de parámetros y una ventana de contexto de 1 millón de tokens, lanzado bajo la licencia MIT sin restricciones regionales. El fundador de Z.AI le dijo a Elon Musk que los modelos de pesos abiertos con capacidades de nivel Fable llegarán antes del primer trimestre de 2027.
David Sacks, hablando desde su rol en la administración, advirtió que el actual proceso de aprobación para los modelos de frontera de EE. UU. está otorgando a China una ventaja competitiva. "No tenemos meses para regalar en esta carrera", dijo Sacks. "Los chinos han estado 9 meses por detrás de nuestros modelos, más o menos 3 meses dependiendo de la capacidad. Pero cuando saben que ha habido un avance en algo como la ciberseguridad, pueden desplegar más recursos contra ese problema particular y alcanzar el ritmo más rápido".
Sacks culpó al CEO de Anthropic, Dario Amodei, por crear el entorno regulatorio que llevó a que Fable fuera retirado. "He estado diciendo desde el principio que estamos en una situación muy competitiva con China. No podemos permitirnos hacer cosas innecesarias que ralenticen a nuestras empresas". Describió la situación como una profecía autocumplida, señalando que "Dario cayó en su propia trampa" al abogar por procesos de aprobación gubernamental que ahora limitan a su propia empresa.
Gavin Baker reconoció que la calidad de GLM 5.2 "ha desafiado algunas de mis creencias", pero enfatizó que la destilación de modelos de frontera jugó un papel importante. "Ha habido una inmensa cantidad de destilación. No hay duda", explicó Baker. "Imaginen decenas de miles de teléfonos, iPads y computadoras que consultan a la API en la nube a través de cuentas enmascaradas con preguntas muy específicas, y esos rastros de razonamiento son recolectados. Esos rastros se reintroducen en el modelo durante el proceso de aprendizaje por refuerzo y probablemente durante el proceso de pre-entrenamiento".
Sin embargo, Baker señaló que ahora que GLM 5.2 es "tan bueno, es lo suficientemente bueno para hacer su propio RL y es posible que el secreto ya haya sido revelado". La pregunta crítica es si los próximos modelos de OpenAI, Mythose y SpaceX volverán a abrir la brecha.
El cuello de botella de DRAM genera inflación en toda la industria y vulnerabilidades estratégicas
Los resultados financieros de Micron revelaron hasta qué punto la memoria de alto ancho de banda (HBM) se ha convertido en la restricción definitoria de la infraestructura de IA, con ingresos que aumentaron 4 veces año tras año hasta los $42 mil millones y todo el suministro de 2026 de la compañía ya agotado. Baker calificó a la DRAM como "el cuello de botella más importante" en la pila de IA, señalando que "la capacidad y el ancho de banda de memoria son fundamentales para el rendimiento de cada modelo de IA".
La escasez de suministro está provocando aumentos dramáticos de precios en la electrónica de consumo. Apple subió los precios de su MacBook Neo un 14% a $799 y los del Mac Studio un 25%, trasladando costos que anteriormente había absorbido. "La inflación ha llegado al escritorio", como describieron los presentadores. Microsoft aumentó los precios de Xbox, y se espera que Nintendo Switch y PlayStation sigan el mismo camino.
Baker explicó que solo tres empresas a nivel mundial pueden producir la DRAM HBM especializada necesaria para servidores de IA: Micron, SK Hynix y Samsung. "Esto es lo más cercano a la magia que puede llegar la ciencia", dijo, enfatizando la dificultad de apilar 8, 12 o 16 matrices de DRAM con el empaquetado necesario. Un cuarto jugador, CXMT de China, saldrá a bolsa y "inundará el mercado con DRAM de grado de consumo barata", pero carece de la capacidad para producir los chips personalizados requeridos para la infraestructura de IA.
La escasez de DRAM ha creado una dinámica peculiar donde ahora constituye del 30% al 40% de todo el gasto de capital (capex) de los hiperescaladores. Baker sugirió que esto podría beneficiar a la sociedad al ralentizar la carrera armamentista de la IA. "Esto puede darnos como sociedad tiempo para adaptarnos", dijo, refiriéndose a lo que Brad Gerstner llama "el contrato social". El alto costo de construir centros de datos de un gigavatio —ahora $35 mil millones en semiconductores más $25 mil millones en energía y refrigeración— significa que "incluso para los hiperescaladores, la economía importa".
Chamath Palihapitiya señaló que las limitaciones energéticas están agravando el cuello de botella de la memoria. "Desde 2021, alrededor del 40% de todos los centros de datos están en disputa", dijo. "Creo que esa cifra va a aumentar. Cualquier pronóstico de consumo de energía que estemos viendo en la IA está gravemente desequilibrado. Hay una oferta muy escasa y una demanda efectivamente infinita".
La computación distribuida y la infraestructura orbital emergen como soluciones
Los cuellos de botella terrestres están acelerando el interés tanto en la computación distribuida como en los centros de datos orbitales. Baker describió la economía que hace que la computación basada en el espacio sea cada vez más viable. Construir un centro de datos de un gigavatio en la Tierra cuesta $60 mil millones en total: $35 mil millones en semiconductores de Nvidia y $25 mil millones en equipos de energía y refrigeración. Una vez que Starship sea rápidamente reutilizable, los costos de lanzamiento para poner una capacidad de cómputo equivalente en órbita caerían a solo $5 mil millones, llevando los costos totales a $40 mil millones.
"Los $25 mil millones que corresponden a energía y refrigeración son claramente inflacionarios", explicó Baker. "Puede ser que en tres o cuatro años sean $70 mil millones terrestres frente a $40 mil millones en el espacio. Y esos $5 mil millones, a medida que Starship se vuelve rápidamente reutilizable, probablemente sean deflacionarios". El enfoque orbital elimina la necesidad de una infraestructura de refrigeración masiva, con racks en el espacio conectados por láseres en lugar de la arquitectura tradicional de centros de datos.
Los presentadores discutieron el sistema "Megapod" recién registrado por Tesla, describiéndolo como hardware de centro de datos modular que podría desplegarse en estaciones de Supercharger donde ya existe infraestructura eléctrica. Palihapitiya describió el atractivo de los módulos de cómputo prefabricados que pueden fabricarse en almacenes y desplegarse en 90 días, en lugar del plazo típico de dos a tres años para las instalaciones tradicionales.
Travis Kalanick destacó que su empresa, Adams, está explorando redes de inferencia distribuida, donde el cómputo excedente de diversas fuentes puede ser agregado. "Si eres una corporación, vas a tener un router y cada consulta que alguien haga, cada tarea que deba realizarse en tu empresa, ese router la enviará a tu versión de DeepSeek o cualquier modelo de código abierto que estés usando", explicó Baker. "Luego, en algún punto del flujo de trabajo, un modelo de frontera podría intervenir o no para verificarlo".
La desagregación de la inferencia en operaciones de prefill (pre-llenado) y decode (decodificación) permite este enfoque distribuido. Baker explicó que el prefill —entender la pregunta y el contexto— está limitado por la capacidad de memoria, mientras que el decode —generar el siguiente token— está limitado por el ancho de banda de memoria. Empresas como Groq (que Nvidia adquirió) y Cerebras permiten que las GPUs H100 o A100 más antiguas se emparejen con chips de decodificación especializados, extendiendo la vida útil del hardware existente a siete o incluso 12 años.
La insurgencia socialista de los DSA captura la infraestructura del Partido Demócrata
Los Socialistas Democráticos de América (DSA) del alcalde de la ciudad de Nueva York, Zohran Mamdani, arrasaron en las tres primarias del Congreso donde respaldó candidatos, desbancando a demócratas establecidos en un desarrollo que Sacks describió como la versión de la izquierda de la toma de poder populista de Trump. "Las opciones del futuro serán el comunismo o el socialismo en el partido demócrata, o el nacionalismo en el partido republicano", dijo Sacks. "Esas son las dos direcciones populistas".
Los candidatos victoriosos de los DSA apoyan abolir el Senado, eliminar las fuerzas policiales y las prisiones, disolver el ICE con amnistía para todos, reemplazar al presidente y a la Corte Suprema con órganos subordinados al Congreso, e implementar la representación proporcional con voto de segunda vuelta. "Esto es una transformación total de nuestro sistema constitucional", señaló Sacks. Una de las ganadoras, Shioalier, de 32 años, ha declarado que quiere "erradicar la civilización occidental" y asistió a una manifestación celebrando las muertes de civiles israelíes el día después del 7 de octubre.
El copresidente de los DSA, Josh Block, fue explícito sobre la estrategia: "Estamos usando al Partido Demócrata como un vehículo de acceso a las urnas. No porque compartamos sus objetivos. Construimos nuestra propia organización, somos elegidos bajo la etiqueta demócrata, formamos caucus con los demócratas cuando es útil y promovemos nuestra propia agenda desde adentro. Vemos al establishment demócrata como un obstáculo, no como un hogar".
Baker argumentó que Mamdani es "uno de los políticos más talentosos que he visto en mi vida", comparándolo favorablemente con AOC. "Puede dar un gran discurso. Es bueno en una entrevista. Puede aprovechar todo esto. Es una especie de camaleón que puede cambiar". Sin embargo, Baker enfatizó que la base electoral real de los DSA son "liberales blancos relativamente ricos que están en declive económico" en lugar de los estadounidenses de clase trabajadora, pobres, negros o hispanos a quienes los demócratas tradicionalmente representaban.
Los presentadores conectaron el auge socialista con dos generaciones de estadounidenses que se sienten excluidos económicamente. "No creen que puedan participar en el sistema. Sienten que el sistema está amañado", dijo Baker. "Y si aparece alguien que les habla y no tienen idea de qué es el socialismo o qué sucedió en Alemania o durante el 'Red Scare', no tienen idea de qué es el socialismo o el comunismo".
Kalanick ofreció un marco filosófico: "La verdad y la justicia son el sistema inmunológico de la sociedad. Cuando el sistema inmunológico está suprimido, todos los males sociales brotan". Añadió que "el comunismo está en todos nosotros. El comunismo está en nuestra sangre como humanos. ¿Alguna vez en tu vida has sido perezoso? ¿Alguna vez has querido algo a cambio de nada? La diferencia es, ¿haces de eso una forma de vida?".
Cerebras rompe el precio de oferta mientras regresa la disciplina del mercado público
Cerebras cayó por debajo de su precio de salida a bolsa (IPO) en su primer informe de ganancias como empresa pública, lo que desencadenó lo que Baker describió como "ventas insensibles al precio" por parte de gestores de cartera que salen automáticamente de posiciones que rompen el precio de oferta. "Hay personas que dirigen fondos gigantes que conozco personalmente donde, si una acción rompe el precio de oferta, venden sin importar nada", dijo Baker. "Los vendedores en corto saben que si una acción se acerca al precio de oferta, la venden en corto porque quieren romperlo y luego obtener un 10% o 20% rápido".
Baker argumentó que la reacción del mercado se debió principalmente a la sincronización de la cadena de suministro y no a problemas fundamentales del negocio. Explicó cómo el contrato transformacional que Cerebras firmó con OpenAI en diciembre de 2025 no mostraría impacto en los ingresos hasta el Día del Trabajo de 2026 como muy pronto. "Pasan 4 meses desde que hacemos el pedido para que Taiwan Semi fabrique el chip, luego nos toma 2 meses, más o menos, convertir ese chip en un servidor. Y luego, si tenemos suerte y podemos encontrar la energía, nos toma un mes energizar ese chip y comenzar a generar tokens con él".
La pregunta clave para los inversores de Cerebras es la velocidad de ejecución en el despliegue de energía. "Fuera de los hiperescaladores, las únicas empresas que han incorporado más de un gigavatio son CoreWeave, Crusoe y SpaceX AI", señaló Baker. Si Cerebras pudiera añadir 50 megavatios por mes en 2027, cerrarían el año con una tasa de ejecución de computación en la nube de aproximadamente $9 mil millones frente a una capitalización de mercado actual inferior a $40 mil millones.
Baker aconsejó a las empresas que salen a bolsa "fijar el precio de tal manera que no vayamos a romper el precio de oferta en nuestros primeros 9 meses como empresa pública", mientras que Palihapitiya abogó con más fuerza por procesos de IPO basados en subastas para descubrir los verdaderos precios de equilibrio del mercado en lugar de confiar en el juicio de los suscriptores.
Anthropic valorada en $3 billones antes de su esperado debut público
Baker ofreció una evaluación de valoración sorprendente para Anthropic, argumentando que la empresa "vale $3 billones hoy" y "eso es aproximadamente donde probablemente cotizaría como empresa pública". Basó esto en proyecciones de ingresos que muestran a Anthropic terminando 2026 con "bastante más de $100 mil millones" en ingresos y probablemente alcanzando entre $200 mil millones y $300 mil millones en 2028. "Probablemente no cotizará a 10 veces esa cifra y será muy rentable a esa escala porque estará dominada por la inferencia", dijo Baker, citando informes de márgenes brutos del 85% en inferencia.
La valoración haría que Anthropic fuera más grande que la valoración pública esperada de OpenAI y representaría una de las mayores ofertas tecnológicas de la historia. Sin embargo, Baker restó importancia a las preocupaciones sobre la absorción del mercado. "Simplemente se está moviendo de privado a público", dijo. "En la escala de los mercados de capitales globales, estos parecen números realmente grandes. Solo te estás moviendo de los mercados privados a los mercados públicos, que son aún más grandes".
La conversación destacó cuán radicalmente han cambiado las escalas de valoración en la era de la IA. Baker y Kalanick recordaron la Serie C de Uber en 2014, cuando una valoración de $17 mil millones se consideraba innovadora y controvertida. "Fuimos criticados en la prensa por no saber lo que estábamos haciendo", recordó Baker sobre la valoración de Uber en $14 mil millones en Fidelity. Una década después, que Anthropic se acerque a una valoración de $3 billones apenas levanta sospechas entre los inversores sofisticados.
Respecto a la reciente IPO de SpaceX, Baker señaló que, a diferencia de las IPO tecnológicas típicas, la mayoría de los accionistas de SpaceX tuvieron oportunidades regulares de liquidez durante la última década a través de ofertas de compra, lo que redujo la posible presión de venta. "Casi la mitad de los empleados de SpaceX compraron en la IPO", dijo. Sin embargo, Palihapitiya replicó que la apreciación de 8 veces en el año final antes de salir a bolsa —de una valoración privada de $350 mil millones a la valoración pública— aún podría crear eventos de liquidez significativos para los tenedores a largo plazo que experimentaron años de ganancias anuales más modestas del 20% al 30%.