
Meta Revela Llama 4: Modelos de IA de Código Abierto de Próxima Generación
Meta acaba de lanzar sus últimos modelos de IA, la familia Llama 4, marcando un paso significativo en el panorama de la IA de código abierto. Esta nueva colección incluye Llama 4 Scout, Llama 4 Maverick y Llama 4 Behemoth. Estos modelos fueron entrenados con un conjunto de datos masivo de texto, imagen y video sin etiquetar para lograr una **amplia comprensión visual**.
El desarrollo de Llama 4 se aceleró supuestamente debido al éxito de los modelos abiertos del laboratorio chino de IA DeepSeek, que superaron a los modelos Llama anteriores de Meta. Meta respondió intensificando los esfuerzos para comprender cómo DeepSeek logró reducir los costos asociados con la ejecución e implementación de modelos como R1 y V3.
Llama 4 Scout y Maverick están disponibles en Llama.com y a través de socios de Meta como Hugging Face. Sin embargo, Behemoth todavía está en entrenamiento. Meta AI, el asistente impulsado por IA integrado en aplicaciones como WhatsApp, Messenger e Instagram, ya se ha actualizado con Llama 4 en 40 países, aunque las funciones multimodales actualmente están limitadas a los EE. UU. en inglés.
Restricciones de Licencia
Algunos desarrolladores pueden encontrar la licencia de Llama 4 restrictiva. Las entidades domiciliadas en la UE tienen prohibido usar o distribuir los modelos, probablemente debido a las estrictas leyes de privacidad de datos e IA de la región. Además, al igual que con las versiones anteriores de Llama, las empresas con más de 700 millones de usuarios activos mensuales deben solicitar una licencia especial de Meta, que Meta puede aprobar o denegar a su discreción.
Meta enfatiza que los modelos Llama 4 representan el comienzo de una nueva era para el ecosistema Llama. Estos modelos son los primeros en utilizar una arquitectura de mezcla de expertos (MoE), lo que aumenta la eficiencia computacional para el entrenamiento y las respuestas a consultas. La arquitectura MoE divide el procesamiento de datos en subtareas, asignándolas a modelos "expertos" más pequeños y especializados.
Por ejemplo, Maverick cuenta con 400 mil millones de parámetros totales, pero solo 17 mil millones de parámetros activos en 128 expertos. Scout tiene 17 mil millones de parámetros activos, 16 expertos y 109 mil millones de parámetros totales.
Rendimiento y Capacidades
Las pruebas internas de Meta sugieren que Maverick, diseñado para casos de uso general de asistente y chat, supera a modelos como GPT-4o de OpenAI y Gemini 2.0 de Google en codificación, razonamiento, tareas multilingües, comprensión de contexto largo y benchmarks de imagen. Sin embargo, no alcanza a modelos como Gemini 2.5 Pro de Google, Claude 3.7 Sonnet de Anthropic y GPT-4.5 de OpenAI.
Scout se destaca en el resumen de documentos y el razonamiento sobre grandes bases de código. Su característica destacada es su enorme ventana de contexto de 10 millones de tokens, lo que le permite procesar y trabajar con documentos extremadamente largos. Scout puede operar en una sola GPU Nvidia H100, mientras que Maverick requiere un sistema Nvidia H100 DGX o equivalente.
Behemoth, el modelo no lanzado de Meta, exige hardware aún más potente, con 288 mil millones de parámetros activos, 16 expertos y casi dos billones de parámetros totales. Los benchmarks de Meta muestran que Behemoth supera a GPT-4.5, Claude 3.7 Sonnet y Gemini 2.0 Pro en evaluaciones de habilidades STEM, como la resolución de problemas de matemáticas.
Vale la pena señalar que ninguno de los modelos Llama 4 son verdaderos modelos de "razonamiento" como o1 y o3-mini de OpenAI. Los modelos de razonamiento priorizan la verificación de hechos, lo que lleva a respuestas más confiables pero tiempos de procesamiento más largos.
Abordando el Sesgo y las Preguntas Contenciosas
Meta también ha ajustado Llama 4 para que esté más dispuesto a responder preguntas "contenciosas". Los modelos ahora responden a temas políticos y sociales debatidos que los modelos Llama anteriores evitaban. Meta afirma que Llama 4 es más equilibrado en el manejo de indicaciones que antes no entretendría.
Según un portavoz de Meta, Llama 4 proporciona respuestas útiles y objetivas sin juzgar y es más receptivo a diversos puntos de vista. Estos ajustes se producen en medio de acusaciones de aliados de la Casa Blanca de que los chatbots de IA tienen prejuicios políticos.
El sesgo en la IA sigue siendo un desafío técnico complejo, con empresas como OpenAI y xAI trabajando constantemente para crear modelos que no favorezcan desproporcionadamente ciertas visiones políticas.
Fuente: TechCrunch