02/10/2023
La generativa, capaz de crear contenidos originales a partir de datos existentes, está experimentando un éxito espectacular. Millones de personas se valen de ella para generar imágenes, texto o música. En los próximos años, de seguir la tendencia, el contenido producido de este modo puede llegar a ser mayoritario en internet. Esto plantea una situación problemática, ya que las herramientas de inteligencia artificial generativa se entrenan en muchos casos con grandes conjuntos de datos extraídos de internet. Por tanto, en breve, modelos como el popular estarán adiestrando sus nuevas versiones con datos creados por las anteriores que pueden contener errores.
¿Qué efecto tendrá esta retroalimentación? ¿Mejorará o empeorará la calidad de los futuros modelos de inteligencia artificial? ¿Introducirá nuevos sesgos? Son cuestiones que se ha planteado un equipo de investigadores de diferentes instituciones entre los que figura Pedro Reviriego, profesor titular de la . En un estudio titulado 'Towards Understanding the Interplay of Generative Artificial Intelligence and the Internet', han explorado el efecto de la mencionada retroalimentación en modelos sencillos de inteligencia artificial para la generación de imágenes, como Stable Diffusion o DALL-E. Su conclusión es que, a medida que nuevas versiones trabajan con datos generados por las precedentes, la calidad y la diversidad de las imágenes obtenidas se reduce de manera drástica.
Puedes leer la noticia completa en: short.upm.es/1bnwb