En Resumen

  • En un evento en Londres, ejecutivos de Meta confirman el próximo lanzamiento de Llama 3, el esperado modelo de lenguaje de código abierto.
  • Llama 3, entrenado con 140 mil millones de parámetros, será el modelo más avanzado de Meta que alimentará a Meta AI, el asistente de inteligencia artificial de la empresa.
  • El enfoque de código abierto de Llama 3 desafía la dominancia de OpenAI, permitiendo una comunidad activa de desarrollo que podría igualar o superar a los modelos propietarios en calidad y eficiencia.

En un evento de inteligencia artificial de alto perfil en Londres, los ejecutivos de Meta proporcionaron el martes la primera confirmación oficial y detalles sobre el inminente lanzamiento de Llama 3, el tan esperado modelo de lenguaje grande o Lange Language Model (LLM) de código abierto de la empresa.

"En el próximo mes, en realidad menos, con suerte en un período de tiempo muy corto, esperamos comenzar a implementar nuestra nueva suite de modelos bases de próxima generación, Llama 3", anunció Nick Clegg, presidente de asuntos globales de Meta, en el Meta AI Day London, según informó TechCrunch.

Clegg dijo que Llama 3 consta de "varios modelos diferentes con diferentes capacidades, diferentes versatilidades" que comenzarán a implementarse a lo largo de este año.

Una vez que se lance, se espera que Llama 3 sea el modelo de código abierto más avanzado disponible, con Meta invirtiendo fuertemente en su desarrollo. El modelo fue entrenado con 140 mil millones de parámetros, según Meta (el doble de la capacidad de Llama 2). El CEO de Meta, Mark Zuckerberg, había insinuado algunos de los detalles técnicos en enero.

AD

“Estamos construyendo una infraestructura informática masiva para respaldar nuestro futuro plan de trabajo, incluidos 350k H100s para fin de año, y en total casi 600k equivalentes de H100s si se incluyen otras GPUs”, dijo Zuckerberg en ese momento. Esta cantidad de potencia informática es significativamente mayor que la utilizada por OpenAI para entrenar a GPT-4, que se estimó que requería alrededor de 25.000 GPUs entre 90 a 100 días.

Zuckerberg también reveló que Meta AI, su asistente de inteligencia artificial, está programado para ser impulsado por Llama 3.

Chris Cox, Director de Producto Principal, dijo que Llama 3 se integrará a pleno en Meta.

"Nuestro plan será que Llama 3 alimente múltiples productos y experiencias diferentes en nuestra familia de aplicaciones", dijo.

AD

La estrategia de código abierto

El impacto del lanzamiento de Llama 3 se extiende mucho más allá de Meta, dada el compromiso filosófico de la empresa de desarrollarlo como un modelo de código abierto, en claro contraste con el enfoque cerrado y propietario adoptado por rivales como OpenAI con ChatGPT.

Al abrir sus modelos de lenguaje, Meta tiene como objetivo fomentar un ecosistema de desarrollo de IA abierto y posicionar a la familia Llama como la base para una amplia gama de herramientas y aplicaciones creadas por desarrolladores e investigadores de terceros.

"Es muy importante darse cuenta de que las innovaciones siempre se basan en contribuciones anteriores de otros, a veces muy similares", tuiteó el pasado martes Yann LeCun, jefe de investigación de IA de Meta. "Por eso la investigación abierta es tan importante: hace que el campo avance más rápido para todos".

Este ethos abierto ya ha dado lugar a una comunidad vibrante que se ha unido en torno a Llama. Algunos de los modelos de lenguaje de código abierto más avanzados hoy en día, como Mistral, Falcon y Beluga, se construyen ajustando finamente el modelo base anterior de Llama 2. Varios de estos modelos comunitarios han igualado o superado a GPT-3.5 en ciertas pruebas.

El lanzamiento de Llama-3 como otro modelo base de código abierto probablemente allane el camino para una nueva generación de LLMs que establecerán un estándar aún más alto en cuanto a calidad y eficiencia en IA.

Desafiando la dominancia de OpenAI

La premisa de código abierto de Llama 3 plantea un desafío formidable y multifacético a la actual dominancia del mercado de OpenAI y, por extensión, a otros modelos propietarios como Claude y Gemini.

AD

La comunidad de código abierto pronto podrá construir sobre Llama 3 e iterar rápidamente sus variaciones para potencialmente igualar o superar las capacidades de GPT-4, tal como lo hicieron contra GPT-3.5. Con costos de entrenamiento más bajos compartidos entre los colaboradores, el ecosistema abierto podría superar el desarrollo de modelos propietarios de OpenAI, que requiere inmensos recursos informáticos y costos.

Si las ofertas de código abierto logran regularmente la paridad con las ofertas comerciales, las empresas podrían inclinarse hacia ecosistemas más accesibles y rentables como Llama en lugar de depender y pagar por los modelos de OpenAI. Actualmente, GPT-4 de OpenAI es el modelo más caro en el mercado en términos de costo por token.

Además, la comunidad de código abierto se fortalece a medida que más personas se involucran en ella. Meta se beneficia de tener una gran comunidad construyendo sobre el modelo, ajustándolo, desarrollando nuevas tecnologías y mejorándolo de forma gratuita. Esto facilita que Meta desarrolle mejores versiones de su modelo mientras lo monetiza a través de esquemas alternativos como concesión de licencias para uso comercial por parte de grandes industrias.

En otras palabras, la inercia continua y los efectos de red podrían hacer que sea más difícil para los modelos propietarios de OpenAI atraer usuarios y clientes en el futuro.

Para estar seguros, OpenAI actualmente tiene una fuerte ventaja en términos de rentabilidad. Anthropic puede presumir de tener el LLM de mejor rendimiento en el espacio de la IA. Pero Llama 3 representará otro golpe estratégico de Meta para trastocar el panorama de la IA generativa.

Por supuesto, todo depende del rendimiento y la adopción del mundo real de Llama 3 en el próximo año. Pero la comunidad de inteligencia artificial de código abierto es bastante activa, y ya adora a Llama-2. Las cosas se pondrán muy interesantes en los próximos meses, especialmente con GPT-5 de OpenAI a la vuelta de la esquina.

Editado por Ryan Ozawa.

Generally Intelligent Newsletter

A weekly AI journey narrated by Gen, a generative AI model.