La IA avanzada puede sobresalir en matemáticas de las Olimpiadas, pero flaquea en tareas de oficina rutinarias, mientras las empresas recurren a modelos más pequeños para el uso diario: David Meyer.
Los modelos de inteligencia artificial de última generación (Sota) sobresalen en la resolución de problemas matemáticos complejos de las Olimpiadas, pero aún tienen dificultades con las tareas empresariales cotidianas, según un ejecutivo de una importante empresa unicornio de IA en EE.UU.
David Meyer, vicepresidente sénior de producto de Databricks, empresa estadounidense de procesamiento y análisis de datos, declaró al South China Morning Post en una entrevista reciente que las mismas características que convierten a los modelos en tecnología de vanguardia podrían generar problemas en tareas administrativas básicas. Por ejemplo, al identificar un número erróneo en una factura, un modelo de última generación «a menudo corregirá el error» en lugar de simplemente extraerlo para su posterior corrección, explicó.
Esta discrepancia se extiende también a otros ámbitos altamente técnicos. Si bien los modelos avanzados, como Claude de Anthropic, son potentes para la programación, pueden presentar deficiencias en tareas como la ingeniería de datos en comparación con modelos con un entrenamiento y datos significativamente más especializados en este campo, según Meyer.
La ingeniería de datos implica la transformación de conjuntos de datos a gran escala y la realización de tareas de limpieza, como el manejo de valores nulos y ceros.
«Un solo modelo, por muy grande que sea, no puede ser igual de bueno en todo», afirmó.
Para resolver estas complejidades específicas de forma más eficiente, Meyer sugirió el uso de pequeños modelos de código abierto perfeccionados mediante aprendizaje por refuerzo. Esto permitió un propósito específico con un costo de capacitación «varios órdenes de magnitud menor» que el de los modelos de última generación, según Meyer.


