- Meta Platforms lanzó una versión más grande de Llama 3 que compite directamente con los modelos de IA de Google y OpenAI.
- Llama 3.1 cuenta con 405,000 millones de parámetros, es multilingüe (ocho idiomas) y presenta mejoras en programación y matemáticas.
- Meta también presentó versiones más livianas de Llama 3 con 8,000 millones y 70,000 millones de parámetros, promoviendo una experiencia ampliada de usuario.
Meta Platforms lanzó este martes Llama 3.1, la versión más grande de su modelo de inteligencia artificial que cuenta con habilidades multilingües y métricas de rendimiento generales que compiten directamente con los modelos de IA más potentes del mercado.
De acuerdo con Meta, Llama 3.1 puede conversar en ocho idiomas, escribir código informático de mayor calidad y resolver problemas matemáticos más complejos que las versiones anteriores.Llama 3.1 cuenta con 405,000 millones de parámetros —o variables que el algoritmo toma en cuenta para generar respuestas a las consultas de los usuarios—; sin embargo, esto es menos que los modelos de IA más populares. Por ejemplo, GPT-4 de OpenAI tiene un billón de parámetros y Amazon está invirtiendo en un modelo con 2 billones de parámetros.Además del modelo con 405,000 millones de parámetros, Meta también está lanzando versiones actualizadas de sus modelos Llama 3 más livianos de 8,000 millones y 70,000 millones de parámetros presentados en la primavera.Los tres nuevos modelos son multilingües y pueden manejar solicitudes de usuarios más grandes a través de una «ventana contextual» ampliada. Esto, según el jefe de IA generativa de Meta, Ahmad Al-Dahle, mejoraría la experiencia de generar código informático.
Meta dice que Llama 3.1 casi iguala o supera en rendimiento a modelos de la competencia
Aunque el progreso en el desarrollo de la IA es notoriamente difícil de medir, los resultados de las pruebas proporcionadas por Meta sugieren que Llama 3.1 casi igualaba —y en algunos casos superaba— a modelos de IA sumamente capaces como Claude 3.5 Sonnet de Anthropic y GPT-4o de OpenAI.En el punto de referencia MATH de problemas matemáticos escritos a nivel de competencia, por ejemplo, Llama 3 obtuvo una puntuación de 73.8, en comparación con 76.6 de GPT-4o y 71.1 de Claude 3.5 Sonnet.El modelo de Meta también obtuvo una puntuación de 88.6 en MMLU, un punto de referencia que cubre docenas de materias en matemáticas, ciencias y humanidades. Por su parte, GPT-4o obtuvo una puntuación de 88.7 y Claude 3.5 Sonnet obtuvo una puntuación de 88.3.Los investigadores de Meta también adelantaron que versiones «multimodales» de los modelos Llama saldrán a finales de este año. Estos serán capaces de superponer capacidades de imagen, video y voz sobre el modelo de texto central Llama 3.De acuerdo con Meta, los primeros experimentos indican que esos modelos pueden funcionar «competitivamente» con otros modelos multimodales como Gemini 1.5 de Google y el Claude 3.5 Sonnet de Anthropic.