El Instituto de Investigación Tencent busca crear conjuntos de datos especializados para modelos de IA que podrían beneficiar ampliamente a la segunda nación más poblada del mundo.
Investigadores de Tencent Holdings buscan colaborar con otros importantes desarrolladores de inteligencia artificial para mejorar la forma en que la mayoría de los servicios de IA generativa, como los chatbots, interactúan con personas mayores, niños abandonados y otros usuarios vulnerables de la sociedad.
Según Lu Shiyu, investigador principal del Instituto de Investigación Tencent (TRI), los conjuntos de datos especializados pueden hacer que los servicios de IA sean más útiles para los usuarios vulnerables que se han conectado progresivamente a ellos para recibir apoyo emocional y asistencia sanitaria.
Desde 2024, el equipo de Lu en TRI, la unidad de investigación de estrategia pública de Tencent, con sede en Shenzhen, ha estado desarrollando conjuntos de datos especializados pensando en los usuarios vulnerables. Los conjuntos de datos, como los de internet en su conjunto, dotan a los grandes modelos lingüísticos (LLM) de conocimientos generales en la fase de preentrenamiento, antes de perfeccionarse en la fase posterior al entrenamiento, antes de su implementación.
El año pasado, el equipo de Lu e investigadores de la Universidad de Ciencia y Tecnología de Beijing probaron los principales LLM desarrollados en Estados Unidos y China, incluyendo el modelo Hunyuan de Tencent. Descubrieron que todos los modelos debían mejorar su gestión de temas como la educación sexual y otros relevantes para los 69 millones de niños que se quedaron atrás en China: niños, a menudo en zonas rurales, cuyos padres emigran a las ciudades para trabajar.
El equipo también colaboró con organizaciones chinas sin fines de lucro que ayudan a grupos vulnerables para desarrollar un «conjunto de datos sobre personas mayores», derivado de miles de ejemplos de formularios de preguntas y respuestas aportados por personas mayores.
“Para generar un impacto, el siguiente paso es trabajar con los principales desarrolladores de modelos de IA que tienen muchos usuarios”, afirmó Lu.

