¿El único problema con la moderación de contenido de IA? no funciona

Nadie estaba seguro de dónde venía la ráfaga interminable de incendios y accidentes automovilísticos en Indonesia. Pero el sistema seguiría marcándolos, según Josh Sklar.

El ex moderador de contenido trabajó una vez en el equipo de Instagram que evaluó las publicaciones marcadas por la inteligencia artificial (IA) como propensas a ser problemáticas. Y aunque el sistema detectaría regularmente ese contenido ilícito, el número y la naturaleza de los falsos positivos era confuso en el mejor de los casos.

En el Reino Unido, la responsabilidad de las plataformas de redes sociales de moderar el contenido tóxico en línea solo se intensificará con la aprobación del proyecto de ley de seguridad en línea. Una cláusula en particular, que pide a las plataformas que “eviten” que los usuarios encuentren contenido peligroso, ha convencido a muchos de que las plataformas recurrirán a una mayor moderación automatizada para tratar de resolver el problema.

¿El único problema? Puede que no funcione.

El año pasado, la BBC intentó usar una herramienta de inteligencia artificial para medir la escala de toxicidad que enfrentan los políticos en línea. Identificó que cada día se envían unos 3.000 tuits “tóxicos” a los parlamentarios.

El problema era que la IA definió “tóxico” para significar cualquier cosa “grosero, irrespetuoso o irrazonable”, lo que significa que a menudo se marcaron palabras descriptivas simples como “Tory” e “hipócrita”. Un usuario de Twitter señaló que la herramienta etiquetó el vitriolo anti-trans como menos tóxico que llamar a alguien “transfóbico”.

En muchos sentidos, esa lucha por definir “tóxico” es el núcleo del problema de los sistemas de moderación de contenido de IA. Que su objetivo, moderar y “arreglar” los defectos tácitos y los sentimientos peligrosos en el mundo gris de la interacción humana, es difícil de lograr por completo para un sistema de aprendizaje automático.

Más contenido para leer: Las 10 principales historias de vigilancia, periodismo y cifrado de 2024

“La IA funcionaría bien para eliminar de manera proactiva las peores cosas, como lo hacen ahora con las imágenes de violencia, por ejemplo”, dice Eugenia Siapera, directora del centro de política digital del University College Dublin. “Pero las decisiones más difíciles no se pueden automatizar”.

Qualcomm a bordo para montar mmWave

Películas del MCU para ver antes de Ant-Man and the Wasp: Quantumania

Servicios

Recursos

¿Donde estamos?

¿El único problema con la moderación de contenido de IA? no funciona

Moderación automatizada en la práctica

supervisión humana

Un problema fundamentalmente social

Qualcomm a bordo para montar mmWave

Películas del MCU para ver antes de Ant-Man and the Wasp: Quantumania

Servicios

Recursos

¿Donde estamos?