
Ironwood de Google: Inferencia de IA Optimizada para clientes Cloud
Google acaba de presentar su TPU de **séptima generación**, llamada Ironwood, en la conferencia Cloud Next. Este nuevo chip acelerador de IA está diseñado y optimizado principalmente para la **inferencia de IA**, es decir, ejecutar modelos de IA ya entrenados de manera eficiente. Este lanzamiento coloca a Google firmemente en el mercado de aceleradores de IA cada vez más competitivo.
Ironwood: Potencia y Rendimiento
Se espera que esté disponible para los clientes de Google Cloud a finales de este año, Ironwood se ofrecerá en dos configuraciones: un **clúster de 256 chips** y un enorme **clúster de 9,216 chips**. Según el vicepresidente de Google Cloud, Amin Vahdat, Ironwood es su "TPU más potente, capaz y energéticamente eficiente hasta el momento", diseñada específicamente para potenciar **modelos de IA inferenciales** a escala.
Con la intensificación de la competencia de empresas como Nvidia, Amazon y Microsoft, la iniciativa de Google para mejorar su hardware de IA es crucial. Amazon ofrece procesadores Trainium, Inferentia y Graviton a través de AWS, mientras que Microsoft proporciona instancias de Azure impulsadas por su chip Cobalt 100 AI.
Los puntos de referencia internos de Google indican que Ironwood puede alcanzar un pico de **4,614 TFLOPs** de potencia informática. Cada chip cuenta con **192 GB de RAM** dedicada con un ancho de banda de aproximadamente 7,4 Tbps, lo que garantiza un acceso rápido a los datos.
Núcleo Especializado e Integración
Ironwood cuenta con un núcleo especializado mejorado llamado **SparseCore**, diseñado para procesar de manera eficiente los datos comunes en sistemas avanzados de clasificación y recomendación. Este núcleo sobresale en tareas como sugerir productos a los usuarios. La arquitectura minimiza el movimiento de datos y la latencia, lo que resulta en un **ahorro de energía** significativo, según Google.
Google tiene la intención de integrar Ironwood en su **AI Hypercomputer**, un clúster informático modular dentro de Google Cloud. Esta integración promete mejorar aún más el rendimiento y la escalabilidad de las cargas de trabajo de IA.
Vahdat concluye que Ironwood significa un "avance único en la era de la inferencia", que ofrece mayor potencia computacional, capacidad de memoria, avances en la red y mayor confiabilidad.
Fuente: TechCrunch