A medida que avanza el desarrollo de la inteligencia artificial y sus distintas funcionalidades, también son más los conflictos que se generan y los intereses en juego, es por ello que en el último tiempo hemos visto varios litigios entablados contra las empresas detrás de las herramientas más difundidas basadas en la IA.
Es que se sabe que para “entrenar” a estos grandes modelos, se necesitan cantidades siderales de información, lo que generalmente hace que las compañías recurran al “scraping” de datos publicados libremente en la web.
Esta práctica dio como resultado que programas que ahora permiten crear textos o imágenes en cuestión de segundos utilicen para ese contenido generado información que previamente fue creada por personas y muchas de ellas tienen derechos de autor sobre esas obras.
Todo ello implica que, en ultima instancia, la inteligencia artificial generativa “compita” contra autores, utilizando en algunos casos sus propios trabajos como fuente y sin pagar una compensación o pedir una autorización para ese uso, dando lugar a posibles daños; algo que se esta debatiendo en los tribunales estadounidenses actualmente.
Se sabe que para “entrenar” a estos grandes modelos, se necesitan cantidades siderales de información, lo que generalmente hace que las compañías recurran al “scraping” de datos publicados libremente en la web … Esto implicó que en ultima instancia la inteligencia artificial generativa “compita” contra autores, utilizando en algunos casos sus propios trabajos como fuente y sin pagar una compensación o pedir una autorización para ese uso, dando lugar a posibles daños; algo que se esta debatiendo en los tribunales estadounidenses actualmente.
La IA en juicio:
Así fue que en los Estados Unidos se han presentado varias demandas colectivas: En noviembre de 2022 se demandó a Github Copilot por el uso no autorizado de código fuente de varios programas open-source. Poco tiempo despues, en enero de 2023, se demandó a Stability AI, DeviantArt y Midjourney por el uso de Stable Diffusión para crear imágenes a partir de texto, para lo cual se entrenaba el modelo con imágenes recolectadas de internet, algo que analizamos en esta nota. En este caso la demanda inclusive fue ampliada agregando nuevos actores y sumando también como codemandado a Runway AI.
En julio de 2023 fue el turno de ChatGPT, LLaMA, Meta, Nvidia y Dara-bricks por el supuesto uso no autorizados de diferentes libros de autores reconocidos.
Luego, en diciembre de 2023 fue el propio New York Times el que demandó a ChatGPT, OpenAI y Microsoft por el uso no autorizado de trabajos publicados en el diario para entrenar a la IA, que “ahora competía como una fuente de información”, caso que también analizamos en esta otra nota.
Finalmente, a finales de abril de este año (2024), le tocó a Google y su empresa madre “Alphabet”, por su propia iniciativa con la cual también pretende crear imágenes a partir de texto, lo que motivó una acción de clase a iniciativa de 4 artistas (un fotógrafo y 3 ilustradores).
A finales de abril de este año (2024), le tocó a Google y su empresa madre “Alphabet”, por su propia iniciativa con la cual también pretende crear imágenes a partir de texto, lo que motivó una acción de clase a iniciativa de 4 artistas (un fotógrafo y 3 ilustradores).
El caso contra Google:
En esta última incursión judicial, los accionantes explicaron que Google también hizo uso de la base de datos LAION-400M, que incluía 400 millones de imágenes de entrenamiento ensambladas a partir de imágenes accesibles en la internet pública.
LAION (acrónimo de "Large-Scale Artificial Intelligence Open Network") era una organización con sede en Alemania que buscaba poner a disposición del público en general “modelos de aprendizaje automático a gran escala, conjuntos de datos y código relacionado", todo de forma gratuita.
Entre sus publicaciones se encontraba LAION-400M aunque fue dada de baja en diciembre de 2023 por contener material pornográfico sensible.
Para los actores, la demandada utilizó esta fuente para entrenar su modelo de inteligencia artificial, donde se incluían imágenes protegidas con derecho de autor de los actores, debiendo hacer necesariamente una copia de ellas.
Consideraban que Google y Alphabet habían violado los derechos de autor de estos autores que nunca autorizaron a las empresas a usar su trabajo de ninguna forma
También alegaron que luego Google ayudó a crear una nueva base de datos denominada LAION-5B con 5.85 billones de imágenes, lo que incluso dio lugar a otros modelos llamados Google-LAION Models donde inclusive se replicó las imágenes de la primera base e incorporaba los trabajos de los actores.
Según los demandantes, Google y Alphabet habían violado los derechos de autor de estos autores que nunca autorizaron a las empresas a usar su trabajo de ninguna forma.
Con la acción se pretendía la eliminación de las copias que hicieron o usaron los demandados de las imágenes protegidas de los actores, y el pago de una indemnización por los daños y perjuicios, más los intereses previos y posteriores a la sentencia, costos, costas y otras reparaciones que resulten justas y apropiadas.