Algunas IA han aprendido a engañar a los humanos - Ciencia

Un artículo de revisión de otros estudios publicado en Patterns por autores estadounidenses y australianos describen los riesgos del engaño por parte de la IA y piden a los gobiernos que elaboren cuanto antes normativas estrictas para abordar el problema. El equipo, encabezado por Peter Park del Instituto Tecnológico de Massachusetts (MIT), define el término engaño como “la inducción sistemática de creencias falsas con el fin de obtener un resultado distinto de la verdad”.

Park indicó que “los desarrolladores de IA no saben a ciencia cierta qué causa comportamientos indeseables en la IA, como el engaño”. En términos generales el equipo cree que surge porque una estrategia basada en ese comportamiento fue “la mejor manera de obtener buenos resultados en una tarea dada de entrenamiento. El engaño les ayuda a conseguir sus objetivos”, afirmó Park citado por la revista.

Los investigadores repasaron la literatura centrada en las formas en que los sistemas de IA difunden información falsa mediante el engaño aprendido.

El engaño es “especialmente probable” cuando un sistema de IA se entrena para ganar juegos que tienen un elemento social, como Diplomacy (un juego de conquista del mundo que implica la creación de alianzas). El estudio repasa ejemplos en los que los sistemas de IA aprendieron a engañar para lograr un rendimiento experto en un tipo de juego o tarea, entre ellos Cicero, diseñado para jugar a Diplomacy.

Meta afirma que lo entrenó para que fuera “en gran medida honesto” y “nunca apuñalara intencionadamente por la espalda a sus aliados humanos”, sin embargo, “se dedica al engaño premeditado, rompe los tratos y dice falsedades descaradas”, asegura el estudio.

Lea más: TikTok contragolpea en Estados Unidos y otros clics tecnológicos en América