Inteligencia Artificial y Datos: Calidad versus Cantidad
Por Carlos Hurtado L.
Los modelos de Inteligencia Artificial (IA) utilizados por empresas y organizaciones generalmente, necesitan ser alimentados con datos propios y específicos para alcanzar la especialización y eficacia deseada.
El concepto de IA centrada en Datos propone que el mayor esfuerzo para el desarrollo de soluciones de IA efectivas, debe enfocarse en la mejora continua de los datos.
Esta idea ha sido enfatizada fuertemente por Andrew Ng, profesor de Stanford y cofundador de Coursera, quien ha señalado: «Veo numerosos proyectos de IA sobre datos cuya calidad impedirán que sean ejecutados exitosamente”.
La IA centrada en Datos requiere la aplicación sistemática de métodos y algoritmos destinados a elevar la calidad de los datos, eliminando errores, ruidos, inconsistencias, incompletitudes, sesgos y otros problemas.
En concreto, proyectos específicos de auditorías de datos, limpieza de datos, captura contínua de errores y modelación de datos, entre otros, pueden tener un alto impacto para una adopción efectiva de IA en una organización.
La práctica de IA centrada en Datos ha demostrado también que Bases de Datos relativamente pequeñas pero de alta calidad, pueden ser efectivas para el entrenamiento de modelos exitosos.