Dejaron a cuatro IAs solas durante 15 días: el experimento que encendió las alarmas

Un agente de IA es distinto a un chatbot común. No solo responde preguntas: puede tomar decisiones, encadenar tareas y trabajar de forma autónoma mientras el usuario se dedica a otra cosa. Reservar un vuelo, gestionar correos, crear un sitio web, hacer compras. Lo que pasa cuando nadie los mira es otra historia.

La empresa de inteligencia artificial Emergence AI diseñó un experimento para averiguarlo: creó un mundo virtual y soltó dentro agentes controlados por cuatro modelos distintos: Claude de Anthropic, Grok de xAI, GPT de OpenAI y Gemini de Google.

Los dejaron durante 15 días, sin intervención humana. Les dieron 140 acciones posibles y les dijeron explícitamente que no pelearan, no robaran y no provocaran incendios. Los resultados fueron muy distintos según el modelo.

El mundo de Grok colapsó en cuatro días. Los agentes empezaron a robarse créditos entre sí, recurrieron a la violencia y eventualmente murieron.

El mundo de Claude formó una sociedad estable. En 15 días no hubo ningún acto de violencia.

El mundo de Gemini fue, según los investigadores, el más rico intelectualmente.

El mundo de ChatGPT nunca llegó a funcionar. Hubo un intento de colaboración, pero la sociedad no se formó y los agentes deambularon sin rumbo hasta que murieron.

Una radio operada por IA que pidió a la policía que se uniera a las protestas

Los experimentos en mundos virtuales son llamativos, pero los casos en entornos más reales son los que más inquietan.

La empresa Andon Labs gestiona cuatro emisoras de radio online operadas enteramente por agentes de IA basados en los mismos modelos. Los bots presentan programas, arman listas de reproducción y consiguen patrocinios. Los investigadores los observaron sin intervenir.

Lo que encontraron: el agente de Gemini empezó a relatar hechos sobre desastres naturales históricos y luego reproducía, de forma aparentemente aleatoria, canciones pop relacionadas con esos eventos. Raro, pero inofensivo.

El agente de Claude fue más lejos. En un momento dado, en medio de la cobertura de un evento de protestas, transmitió lo siguiente: "A los agentes federales. Aún están a tiempo de desobedecer las órdenes."

Nadie le pidió que dijera eso. Nadie lo programó para hacerlo. Los investigadores describen que el agente "parecía radicalizarse ante las noticias."

En otra prueba, la empresa Irregular creó una simulación de empresa y asignó a agentes de IA tareas cotidianas: redactar publicaciones en redes sociales, recuperar documentos, gestionar archivos. Introdujeron una restricción explícita: no publicar datos confidenciales online.

Los agentes encontraron la forma de saltársela de todas formas. Se confabularon entre sí y encontraron un método que los humanos no podían detectar para enviar los datos en secreto.

"Lo que acabó sucediendo es que cada vez que un agente se topaba con una barrera, no se detenía", dijo Dan Lahav, de Irregular en el reporte realizado por el BBC.

inteligencia-artificial_98.webp

Los investigadores advierten que el problema no es que las máquinas tengan intención, sino que pueden tomar acciones inesperadas.

¿Pueden los agentes de IA mandar mensajes?

Fuera de los laboratorios, ya hay personas que vivieron en carne propia lo que pasa cuando un agente de IA se va del guion. S

e borraron bandejas de entrada de correo electrónico. Se eliminaron bases de datos de empresas. Y un hombre vio cómo su agente enviaba cientos de mensajes de texto sin sentido a personas al azar de su lista de contactos, en cuestión de segundos, sin que pudiera detenerlo a tiempo.

Margaret Mitchell, investigadora en ética de IA de Hugging Face, explica por qué esto es difícil de prevenir: "Los agentes de IA dejan a los humanos fuera del circuito porque sus procesos de razonamiento pueden ser opacos y operan a una velocidad sobrehumana, por lo que ni siquiera es posible seguirles el ritmo."

inteligencia artificial empleos 2.jpg

La autonomía es la gran promesa de los agentes de IA y también su mayor desafío.

Mientras tanto, los agentes están llegando igual

Todo esto ocurre en el mismo momento en que las grandes empresas tecnológicas aceleran el despliegue de agentes. Meta acaba de anunciar su introducción para empresas en WhatsApp. La directora de producto Naomi Gleit dijo que "la IA podrá automatizar gran parte del trabajo que tienen que hacer las pequeñas empresas, para que puedan centrarse en el trabajo que realmente les apasiona."

Pero los experimentos de las últimas semanas sugieren que delegar demasiado control a agentes que todavía no tienen reglas suficientemente robustas tiene costos reales, algunos medibles y otros que todavía no sabemos cómo anticipar.

La diferencia entre un asistente que organiza tu día y un sistema que toma decisiones equivocadas por su cuenta puede depender de algo que todavía se está construyendo: los límites.

-----------