Gemini 2.5 de Google: Revolucionando la IA con Razonamiento Mejorado

25/03/2025 Inteligencia Artificial

Google acaba de lanzar Gemini 2.5, una nueva familia de modelos de IA diseñados con capacidades de razonamiento mejoradas. Esto significa que la IA se detiene y "piensa" antes de proporcionar una respuesta, buscando respuestas más precisas y perspicaces.

Gemini 2.5 Pro Experimental: el modelo más inteligente de Google hasta ahora

Liderando la carga está Gemini 2.5 Pro Experimental, un modelo de IA multimodal que Google afirma que es su creación más inteligente hasta el momento. Ya está disponible en Google AI Studio, su plataforma de desarrolladores, y a través de la aplicación Gemini para suscriptores de Gemini Advanced.

Google enfatiza que todos los futuros modelos de IA incorporarán estas capacidades de razonamiento avanzadas. Este cambio sigue la tendencia iniciada por o1 de OpenAI en septiembre de 2024, que desencadenó una carrera para desarrollar IA con habilidades de razonamiento similares o superiores. Empresas como Anthropic, DeepSeek y xAI se han unido a la contienda desde entonces.

Estos modelos de razonamiento utilizan potencia informática y tiempo adicionales para verificar los hechos y analizar minuciosamente los problemas antes de proporcionar una respuesta. Este enfoque ha llevado a mejoras significativas en el rendimiento de la IA, particularmente en áreas como las matemáticas y la codificación.

Muchos creen que los modelos de razonamiento son cruciales para el desarrollo de agentes de IA, sistemas autónomos capaces de realizar tareas con mínima intervención humana. Sin embargo, vale la pena señalar que estos modelos también conllevan mayores costos debido a las mayores demandas computacionales.

Gemini 2.5 Pro está diseñado para sobresalir en la creación de aplicaciones web visualmente atractivas y aplicaciones de codificación de agentes. Según Google, Gemini 2.5 Pro obtuvo una puntuación del 68,6% en Aider Polyglot, que es una evaluación que mide la edición de código, superando a los principales modelos de IA de OpenAI, Anthropic y el laboratorio chino de IA DeepSeek. Sin embargo, en SWE-bench Verified, Gemini 2.5 Pro obtuvo una puntuación del 63,8%, superando al o3-mini de OpenAI y al R1 de DeepSeek, pero con un rendimiento inferior al Claude 3.7 Sonnet de Anthropic, que obtuvo una puntuación del 70,3%.

La versión inicial de Gemini 2.5 Pro cuenta con una ventana de contexto de 1 millón de tokens, lo que permite a la IA procesar aproximadamente 750.000 palabras a la vez. Google planea duplicar esta longitud de entrada a 2 millones de tokens pronto. Se espera que los detalles de los precios de la API de Gemini 2.5 Pro se anuncien en las próximas semanas.

Fuente: TechCrunch