La división de investigación de inteligencia artificial de Huawei ha rechazado las afirmaciones de que una versión de su modelo de lenguaje grande Pangu Pro haya copiado elementos de un modelo de lenguaje de Alibaba. El modelo de nueva pestaña, afirmando que fue desarrollado y entrenado de forma independiente.
La división, llamada Noah Ark Lab, emitió el comunicado el sábado, un día después de que la entidad HonestAGI publicara un documento en inglés en la plataforma de código compartido Github, en el que afirmaba que el modelo Pangu Pro Moe (Mezcla de Expertos) de Huawei mostró una «correlación extraordinaria» con el modelo Qwen 2.5 14B de Alibaba.
Esto sugiere que el modelo de Huawei se obtuvo mediante «reciclaje» y no se entrenó desde cero, según el documento, lo que generó un amplio debate en los círculos de IA en línea y en los medios de comunicación chinos especializados en tecnología.
El documento añadió que sus hallazgos indicaban una posible violación de derechos de autor, la falsificación de información en informes técnicos y afirmaciones falsas sobre la inversión de Huawei en el entrenamiento del modelo. Noah Ark Lab afirmó en su comunicado que el modelo «no se basaba en el entrenamiento progresivo de modelos de otros fabricantes» y que había «introducido innovaciones clave en el diseño de la arquitectura y las características técnicas». Añadió que es el primer modelo a gran escala construido íntegramente con chips Ascend de Huawei.

También afirmó que su equipo de desarrollo se había adherido estrictamente a los requisitos de licencia de código abierto para cualquier código de terceros utilizado, sin detallar de qué modelos de código abierto se tomó como referencia.
No pudimos contactar con HonestAGI ni averiguar quién está detrás de la entidad.
El lanzamiento del modelo de código abierto R1 de la startup china DeepSeek en enero de este año conmocionó a Silicon Valley por su bajo coste y desencadenó una intensa competencia entre los gigantes tecnológicos chinos por ofrecer productos competitivos.
Qwen 2.5-14B se lanzó en mayo de 2024 y forma parte de la familia de modelos Qwen 2.5 de tamaño reducido de Alibaba, que puede implementarse en PC y teléfonos inteligentes. Si bien Huawei se adentró en el sector de los modelos de lenguaje a gran escala con el lanzamiento original de Pangu en 2021, desde entonces se le ha percibido como rezagado respecto a sus competidores. A finales de junio, publicó el código abierto de sus modelos Pangu Pro Moe en la plataforma china para desarrolladores GitCode, con el objetivo de impulsar la adopción de su tecnología de IA al ofrecer acceso gratuito a los desarrolladores.
Si bien Qwen está más orientado al consumidor y cuenta con servicios de chatbot como ChatGPT, los modelos Pangu de Huawei tienden a utilizarse más en el sector público, así como en los sectores financiero y manufacturero.

