Stichting Brein desconecta una gran cantidad de datos ilegales para el entrenamiento de IA


Este artículo fue actualizado por última vez el agosto 15, 2024

Stichting Brein desconecta una gran cantidad de datos ilegales para el entrenamiento de IA

Stichting Brein

Stichting Brein desconecta una gran cantidad de datos ilegales para el entrenamiento de IA

La organización de derechos de autor Stichting Brein ha desconectado un conjunto de datos holandés, una colección de datos, que estaba destinada al entrenamiento de inteligencia artificial (IA). Según la organización, esta es la primera vez que esto sucede en Holanda.

La propia Brein habla de un “gran conjunto de datos” que, según la organización, se compone de copias ilegales de decenas de miles de libros, millones de líneas de artículos de noticias de sitios web como Nu.nl y subtítulos de innumerables películas y series de televisión de fuentes ilegales. fuentes. El director Bastiaan van Ramshorst también dice que sabe quién es el creador, pero no puede decirlo por razones de privacidad.

Usar conjunto de datos

El conjunto de datos está destinado a entrenar el llamado modelo de lenguaje, que en la jerga se denomina modelos de lenguaje grandes. El creador del conjunto de datos prometió a Brein por escrito no utilizarlo más y también proporcionó información sobre quién lo recibió. La fundación está comprobando ahora si los datos realmente han sido utilizados por modelos de IA. Si ese es el caso, las partes tendrán que rendir cuentas.

El material que infringe los derechos de autor es un problema importante a la hora de entrenar IA. Recientemente, una investigación muestra claramente que los trabajos de creadores de imágenes holandeses se han utilizado sin su permiso para entrenar a conocidos generadores de imágenes de IA, incluidos DALL-E y Midjourney.

En Estados Unidos existe actualmente una demanda entre The New York Times y OpenAI, el fabricante de ChatGPT. El periódico acusa a la empresa de utilizar cantidades masivas de artículos periodísticos para entrenar IA sin permiso. OpenAI cree que el uso de los datos está permitido.

Costura Brein

Comparte con Amigos


Be the first to comment

Leave a Reply

Your email address will not be published.


*