Meta lanza Llama 4, su nueva serie de modelos de inteligencia artificial
Lanzamiento de Llama 4 por Meta
Meta ha dado a conocer el lanzamiento de Llama 4, una nueva serie de modelos de inteligencia artificial (IA) que promete ofrecer capacidades comparables a las de GPT-4o de OpenAI, Gemini 2.0 Flash de Google y DeepSeek-V3. Estos innovadores algoritmos se distinguen por su naturaleza multimodal y por contar con ventanas de contexto de gran escala, que oscilan entre 1 millón y 2 billones de tokens.
El primer modelo que se ha presentado es Llama 4 Scout. Según Meta, este modelo es “el mejor en su categoría a nivel mundial y supera a todas las generaciones anteriores de Llama”. Su arquitectura está compuesta por 17,000 millones de parámetros activos, una ventana de contexto de 10 millones de tokens (equivalente a aproximadamente 15,000 páginas de texto) y un sistema basado en “mezcla de expertos”, que integra 16 submodelos especializados en diversas tareas, temáticas y formatos multimedia, activándose según las necesidades del usuario.
Características y rendimiento de Llama 4
Este diseño permite que el modelo funcione en una única unidad de procesamiento gráfico (GPU) Nvidia H100, lo que optimiza su rendimiento y reduce el consumo de recursos computacionales. Según los desarrolladores, Llama 4 Scout supera a Gemma 3, Gemini 2.0 Flash-Lite y Mistral 3.1 en tareas como el análisis profundo de datos, revisiones extensas de código, generación de resúmenes complejos y evaluación legal de documentos extensos.
Por otro lado, Llama 4 Maverick se presenta como el primer modelo de la serie que incorpora capacidades multimodales de forma nativa, habiendo sido entrenado simultáneamente con texto, imágenes y video sin necesidad de etiquetado previo. Su estructura incluye 128 expertos, lo que le permite alcanzar un total de 400,000 millones de parámetros, manteniendo activos 17,000 millones por token. Esto lo posiciona como un competidor de alto nivel, capaz de igualar los resultados de DeepSeek V3 y superar a GPT-4o, Gemini 2.0 y Claude 3 Opus en tareas de razonamiento, codificación y comprensión de contenido visual y textual.
Innovaciones y disponibilidad
Meta destaca que este modelo permite “la creación de sofisticadas aplicaciones de IA que trascienden las barreras del lenguaje. Como nuestro modelo de referencia para asistentes conversacionales y usos generales, Llama 4 Maverick es ideal para la interpretación precisa de imágenes y la escritura creativa”.
Entre sus innovaciones técnicas se encuentra Llama iRoPE, una arquitectura de atención intercalada que mejora la generalización en contextos extensos al eliminar las tradicionales incrustaciones posicionales. Estas incrustaciones solían proporcionar información sobre la ubicación de cada palabra (o token) dentro de una secuencia, pero el nuevo enfoque optimiza la eficiencia y precisión en tareas de largo alcance.
En tercer lugar, Meta presentó Llama 4 Behemoth, considerado “el modelo más avanzado de la compañía y uno de los modelos de lenguaje más inteligentes del mundo”. Aunque todavía está en desarrollo y no está disponible públicamente, cuenta con 288,000 millones de parámetros activos y cerca de 2 billones en total. Este modelo se utiliza principalmente para mejorar la calidad de los sistemas más pequeños mediante técnicas de co-destilación. Meta lo considera fundamental para avanzar hacia agentes de IA más versátiles y autónomos. Según pruebas internas, Behemoth supera a GPT-4.5, Claude Sonnet 3.7 y Gemini 2.0 Pro en múltiples evaluaciones relacionadas con las disciplinas STEM (ciencia, tecnología, ingeniería y matemáticas).
Una de las características más destacadas de esta nueva generación es la implementación de la técnica de entrenamiento llamada MetaP, diseñada para facilitar la transferencia eficiente de hiperparámetros entre modelos de distintos tamaños. Esta metodología optimiza el proceso de entrenamiento, especialmente en modelos a gran escala como Behemoth, que requieren grandes volúmenes de datos y recursos computacionales. Además, permite definir y aplicar comportamientos deseados en diferentes versiones del modelo. Junto a esto, Meta ha incorporado un post-entrenamiento personalizado que refuerza el razonamiento mediante estrategias avanzadas de selección de datos y métricas de evaluación específicas.
Como en versiones anteriores, Meta define la familia Llama 4 como “de código abierto”. Sin embargo, esta afirmación ha sido cuestionada por la comunidad tecnológica debido a las restricciones de su licencia. En particular, se establece que las entidades comerciales con más de 700 millones de usuarios activos mensuales deben solicitar autorización expresa a Meta antes de utilizar los modelos, una condición que, según la Iniciativa de Código Abierto (Open Source Initiative) en 2023, impide clasificarla formalmente como software de código abierto.
Los modelos Llama 4 Maverick y Scout ya están disponibles para descarga a través del sitio web oficial de Meta y la plataforma Hugging Face. Próximamente se integrarán a las principales infraestructuras de nube, soluciones de edge computing y servicios ofrecidos por integradores globales. El público general podrá experimentar sus capacidades mediante Meta AI, el asistente inteligente de la empresa accesible en WhatsApp, Facebook, Instagram y Messenger.



