IA generativa en un momento decisivo con una serie de desafíos legales

Mires donde mires ahora mismo, es imposible evitar la existencia de la inteligencia artificial generativa (IA). Desde ChatGPT hasta creadores de imágenes como Stable Diffusion, la industria se ha disparado desde casi nada hasta convertirse en una súper industria global. Pero no todo el mundo está contento. En enero de 2023, la empresa de licencias de imágenes Getty Images inició procedimientos legales contra los propietarios de la aplicación de creación de imágenes de IA Stable Diffusion por su supuesta violación de las leyes de derechos de autor.

Es solo uno de un número creciente de casos, incluidos los desafíos legales contra la imagen AI Midjounrey y el buque insignia Open AI respaldado por Microsoft, que podrían determinar el futuro de la tecnología.

Pero estas batallas legales llevan más que solo el futuro de la IA generativa sobre sus hombros, y podrían afectar todo el futuro del arte de la IA, la creación de contenido y la capacidad de controlar cómo se utilizan nuestros datos personales.

Las razones del caso judicial son bastante simples en la superficie. Getty Images, como plataforma de licencias de imágenes, cobra una tarifa a los usuarios para acceder o usar imágenes. Ese sistema plantea un problema importante para los sistemas de IA generativa como ChatGPT o Stable Diffusion, que dependen del raspado masivo de datos para entrenar sus sistemas sobre cómo responder a las indicaciones.

“Entrenar estos modelos generativos de IA implica una gran cantidad de datos”, dice Laura Houston, experta en derecho de autor y socia del bufete de abogados Slaughter and May. “Por ejemplo, en los modelos de texto a imagen, tienes esta necesidad de alimentarlo con cientos de millones de puntos de datos para enseñarle al modelo a encontrar relaciones estadísticas entre las palabras y las imágenes”.

En pocas palabras, si un creador de imágenes de IA quiere descubrir cómo crear una imagen de, por ejemplo, un pollo con un sombrero de copa, debe estudiar tantas imágenes como pueda de pollos y sombreros de copa. La gran escala de los datos que necesita para aprender esa capacidad hace que sea imposible separar significativamente las imágenes con derechos de autor de las que no tienen derechos de autor.

“Tienes la propiedad intelectual [IP] riesgo de infracción que surge del uso de esos datos para enseñar el modelo de IA”, dice. “Pero también surge la pregunta de qué genera el modelo de IA como resultado y si, en virtud de los datos con los que se entrena, la salida del modelo corre el riesgo de infringir la propiedad intelectual de esos datos de entrada”.

Más contenido para leer:  Mobile’s next generation: The 6G-based hyper-connected future of living and work

Esto no es todo un ejercicio intelectual. La ley de derechos de autor es lo que sustenta la capacidad de todos los artistas y creadores de contenido para poder proteger y controlar su trabajo y, por lo tanto, realmente ganar dinero con él. Si la IA generativa es capaz de atravesar eso y usar su trabajo para entrenar sus sistemas, podría beneficiarse mientras diezma las industrias culturales en todo el mundo.

Pero las cuestiones legales y morales no terminan con las leyes de derechos de autor. La IA generativa y los modelos de lenguaje extenso también se han vuelto cada vez más incompatibles con los reguladores de protección de datos.

El regulador de datos italiano ya ha prohibido que el chatbot Replika, basado en Open AI, recopile datos en el país.

“Los datos disponibles públicamente siguen siendo datos personales según el RGPD [General Data Protection Regulation] y otras leyes de privacidad y protección de datos, por lo que aún necesita una base legal para procesarlo”, dice Robert Bateman, un experto en protección de datos. “El problema es que no sé cuánto han pensado estas empresas en eso… Creo que es una especie de bomba de relojería legal”.

Las violaciones de datos personales a menudo también son bastante extrañas. El mes pasado, El periodista de FT Dave Lee descubrió que ChatGPT estaba dando su número de Signal (publicado en su cuenta de Twitter) como el propio número del bot de chat, y posteriormente fue inundado con mensajes aleatorios. Incluso ese tipo de datos publicados están sujetos a las leyes de protección de datos, según Bateman.

“Existe la privacidad contextual”, dice. “Puede poner su número en Twitter y no esperar que aparezca en una base de datos en China. lo mismo te pasa a ti no [necessarily] esperando que se convierta en la salida de los chatbots. La precisión de los datos es uno de los principios del RGPD. Está obligado a asegurarse de que los datos personales en sus procesos sean precisos y estén actualizados.

“Pero los modelos de lenguaje grande alucinan alrededor del 20% del tiempo, aparentemente. Sobre esa base, habrá mucha información inexacta sobre las personas que se distribuirán”.

Determinación de incumplimientos

Pero tanto para la protección de datos como para la propiedad intelectual, una gran preocupación es determinar exactamente si una IA generativa realmente ha infringido la ley. La gran cantidad de datos que se introducen en estos sistemas hace que analizar lo que es y lo que no es problemático sea un problema. Mientras tanto, la salida nunca es una copia absoluta de lo que se ingresó, lo que hace que sea un poco más difícil probar una violación de la mayoría de los casos de derechos de autor, que generalmente se refieren a la copia directa.

Más contenido para leer:  Mind the gap: AI leaders pulling ahead as LLMs take off

Ese punto es donde los grandes modelos de lenguaje como ChatGPT y la IA de imagen generativa como Stable Diffusion ven una división. Las imágenes distorsionadas generadas por IA, más que el texto, a menudo contienen pistas más definitivas sobre los datos que ayudaron a crearlas. El caso Getty, por ejemplo, supera muchos de los desafíos probatorios en esta área simplemente basándose en el hecho de que su propia marca de agua supuestamente ha estado apareciendo en muchos de los resultados de Stable Diffusion.

“Creo que posiblemente no sea una coincidencia que muchos de estos desafíos legales iniciales estén surgiendo en el mundo de los modelos de IA de texto a imagen”, dice Houston.

También es probable que no sea una coincidencia que el caso se presentara en el Reino Unido. EE. UU., a diferencia del Reino Unido, tiene una defensa de “uso justo” por infracción de derechos de autor que haría que las cosas fueran mucho más amigables para los grandes desarrolladores de IA.

Mientras tanto, el Reino Unido tiene una excepción específica de minería de texto y datos para la ley de derechos de autor, pero no se extiende para cubrir los usos comerciales de esas infracciones, que ya están haciendo los sistemas de IA generativa actuales.

Nominalmente, eso sugeriría que los datos personales y el contenido creado en el Reino Unido son más seguros, pero el parlamento y la Oficina de Propiedad Intelectual del gobierno ya están discutiendo si ampliar esa ley, eliminando las protecciones para la explotación comercial del contenido de otras personas.

En última instancia, el vínculo ineludible para los tribunales y los encargados de formular políticas es el mismo; que ahora tienen que elegir si sacrificar las protecciones de derechos de autor de los creadores de contenido (y las protecciones de privacidad de todos) en el altar de los miles de millones o incluso billones de libras de valor económico que probablemente proporcionará el sector de IA generativa.

Más contenido para leer:  Europol se prepara para recopilar grandes datos sobre ciudadanos europeos después de que los eurodiputados voten para ampliar el poder policial

Atribución

Si bien Houston cita el caso de Spotify, donde “los titulares de derechos y los jugadores tecnológicos finalmente pudieron llegar a un aterrizaje”, existen algunas complicaciones para llegar a un compromiso similar aquí. La atribución, una solución común en otros lugares en los casos de PI, también es una lucha.

“Creo que el gran problema es con grandes conjuntos de datos de imágenes o texto que tienen que usar, y no tengo conocimiento de alguna forma en que los artistas originales puedan atribuirse en alguna parte”, dice Chen Zhu, profesor asociado de derecho de la Universidad de Birmingham. escuela, especializada en Derecho de la Propiedad Intelectual.

Además, aquellos con los que habló Computer Weekly cuestionaron si es factible, si ni siquiera está seguro de que sus datos personales estén siendo recolectados, pedir que solo se publiquen correctamente, y mucho menos asegurarse de que no se usen, o que las empresas consultar manualmente con los artistas sobre la inclusión de su obra en los sistemas.

De cualquier manera, es poco probable que veamos mucho movimiento en el corto plazo. Casi todas las personas con las que habló Computer Weekly acordaron que pasarían al menos dos años antes de que veamos algún avance en los casos legales presentados por personas como Getty, y para entonces, es posible que la IA generativa ya se haya convertido, como dijo Bateman, “demasiado”. grande para fallar”.

De hecho, el sector ya está respaldado por una importante financiación. Open AI cuenta con el respaldo de Microsoft, por ejemplo, mientras que Stable Diffusion ya ha recaudado más de $101 millones de dólares en efectivo de capital de riesgo y ahora busca una valoración de $4 mil millones.

Mientras tanto, como Zhu notas, Napster era una industria “desvalida” sin apoyo institucional ni grandes sumas de capital de riesgo. Cita casos como cuando Google copió digitalmente millones de libros para una biblioteca en línea sin permiso. Al final de la larga y costosa lucha legal con los autores agraviados, el gigante tecnológico salió victorioso. “Mi observación es que empresas como Google han sido invencibles en relación con los litigios por derechos de autor en el pasado y nunca han perdido hasta ahora”, dice Zhu.

En última instancia, la mayor diferencia entre el caso de Napster y esta nueva serie de casos, que probablemente determinará el resultado, es que las organizaciones que son cuestionadas esta vez tienen dinero.

Nuestro objetivo fué el mismo desde 2004, unir personas y ayudarlas en sus acciones online, siempre gratis, eficiente y sobre todo fácil!

¿Donde estamos?

Mendoza, Argentina

Nuestras Redes Sociales