A lo largo de 2023 y 2024, las empresas chinas, deseosas de ponerse al día con Estados Unidos, utilizaron Llama de Meta para desarrollar sus propios modelos.
Cuando el gigante tecnológico estadounidense Meta Platforms lanzó su familia de modelos de inteligencia artificial Llama en febrero de 2023, los puso a disposición del público, una medida que lo distinguió entre los desarrolladores de modelos de IA a nivel mundial en ese momento.
En septiembre de ese mismo año, se anunció uno de los muchos derivados de Llama: Qwen de Alibaba Cloud. La primera generación de Qwen adoptó el proceso de entrenamiento de Llama y citó los hallazgos de la investigación fundamental de Meta en su informe técnico correspondiente.
Por respeto, los investigadores chinos incluso llamaron a Llama «el principal modelo de lenguaje grande de código abierto».
Dos años después, la situación parece haberse invertido. Según un informe de Bloomberg del miércoles, ahora es Meta quien supuestamente se inspira en Alibaba, con fuentes anónimas que afirman que el propietario de Facebook está utilizando Qwen para entrenar un nuevo modelo con nombre en clave Avocado.
El informe no especificó qué modelo de Qwen de Alibaba se estaba utilizando.

Este desarrollo culmina un notable cambio de rumbo para los dos principales referentes de código abierto de Estados Unidos y China. Hasta hace muy poco, Llama era el modelo predeterminado para los desarrolladores que trabajaban con software de IA de código abierto, incluso en China.

