Google acaba de hacer un movimiento muy estratégico en la conferencia Cloud Next en Las Vegas. Lanzó dos nuevos procesadores TPU de octava generación simultáneamente, y esto marca un cambio importante en la forma en que la empresa ve el mercado de IA.



Por primera vez, Google separó completamente los chips de entrenamiento e inferencia. Tiene el TPU 8t enfocado en entrenar modelos de IA, y el TPU 8i optimizado para ejecutar estos modelos en producción. Es un cambio táctico claro - reconocen que estas dos tareas tienen necesidades muy diferentes.

Los números de rendimiento son interesantes. El TPU 8t ofrece un 124% más de eficiencia por vatio en comparación con la generación anterior, mientras que el TPU 8i tiene una mejora del 117%. En comparación con Ironwood que salió en noviembre, el TPU 8t entrega 2,8 veces más rendimiento por el mismo precio, y el 8i es un 80% más eficiente. Estas ganancias no son triviales.

Lo que más llama la atención en el TPU 8t es la capacidad de escalar hasta 9.600 unidades en un solo sistema. Google está muy consciente de que en instalaciones de ese tamaño, la energía se convirtió en el limitador crítico de los centros de datos. Por eso, la eficiencia energética se convirtió en la máxima prioridad.

Por otro lado, el TPU 8i tiene un enfoque diferente. Cada chip lleva 384MB de SRAM - tres veces más que Ironwood. Esto tiene mucho sentido para la inferencia, donde el chip necesita procesar múltiples pasos de razonamiento sin buscar datos afuera todo el tiempo. Ideal para ejecutar agentes de IA complejos.

Los dos procesadores llegarán al mercado a finales de 2026. Sundar Pichai, CEO de Alphabet, dejó claro que la arquitectura fue pensada para "ejecutar millones de agentes simultáneamente de forma económicamente viable". Ese es el punto - no se trata solo de tener chips mejores, sino de hacerlo sin romper el presupuesto.

En el lado del software, Google lanzó la Gemini Enterprise Agent Platform con nuevas funciones. Memory Bank y Memory Profile permiten que los agentes recuerden interacciones pasadas con usuarios - resuelven un problema real que tenían las herramientas antiguas. También tiene Agent Simulation para probar mejor antes de lanzar.

La plataforma Projects integra datos de Workspace, OneDrive y chats corporativos, dando contexto a los agentes. Además, lanzaron Gemini Enterprise para empleados comunes, posicionándolo como un "asistente de IA para cada uno", sin necesidad de escribir código.

Todo esto es un doble ataque - hardware y software - contra Nvidia, OpenAI y Anthropic. Google está muy consciente de que los ingenieros del Valle frecuentemente alternan entre Claude de Anthropic y Codex de OpenAI para desarrollo de IA, raramente considerando las herramientas de Google. Esto claramente molesta a la dirección.

La adopción del TPU está acelerando. Citadel Securities ya construyó software cuantitativo en TPU de Google. Los 17 laboratorios nacionales del Departamento de Energía de EE. UU. usan herramientas colaborativas basadas en TPU. Meta firmó un acuerdo a largo plazo para usar TPU de Google, y Anthropic se comprometió con capacidad computacional a escala de gigavatios.

Analistas de DA Davidson estiman que el valor combinado de los negocios de TPU y DeepMind de Google superaba los US$ 900 mil millones en septiembre pasado.

Es interesante notar que Google no comparó directamente su nuevo TPU con productos de Nvidia. Mientras tanto, Nvidia está por lanzar una nueva línea que incorpora tecnología de Groq, que adquirió por US$ 20 mil millones, especialmente orientada a inferencia de ultra baja latencia. Jensen Huang de Nvidia afirmó que más del 20% de las cargas de IA pueden ser mejor manejadas por este tipo de chip.

Google está probando implementar TPU en centros de datos de clientes y promoviendo compatibilidad con herramientas de terceros. Pero los cuellos de botella en el suministro y la desconexión entre iteraciones rápidas de modelos y ciclos de desarrollo de chips que llevan años siguen siendo desafíos reales para escalar.
Ver original
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
  • Recompensa
  • Comentar
  • Republicar
  • Compartir
Comentar
Añadir un comentario
Añadir un comentario
Sin comentarios
  • Anclado