El mundo de Gemini fue, según los investigadores, el más rico intelectualmente.
El mundo de ChatGPT nunca llegó a funcionar. Hubo un intento de colaboración, pero la sociedad no se formó y los agentes deambularon sin rumbo hasta que murieron.
Una radio operada por IA que pidió a la policía que se uniera a las protestas
Los experimentos en mundos virtuales son llamativos, pero los casos en entornos más reales son los que más inquietan.
La empresa Andon Labs gestiona cuatro emisoras de radio online operadas enteramente por agentes de IA basados en los mismos modelos. Los bots presentan programas, arman listas de reproducción y consiguen patrocinios. Los investigadores los observaron sin intervenir.
Lo que encontraron: el agente de Gemini empezó a relatar hechos sobre desastres naturales históricos y luego reproducía, de forma aparentemente aleatoria, canciones pop relacionadas con esos eventos. Raro, pero inofensivo.
El agente de Claude fue más lejos. En un momento dado, en medio de la cobertura de un evento de protestas, transmitió lo siguiente: "A los agentes federales. Aún están a tiempo de desobedecer las órdenes."
Nadie le pidió que dijera eso. Nadie lo programó para hacerlo. Los investigadores describen que el agente "parecía radicalizarse ante las noticias."
En otra prueba, la empresa Irregular creó una simulación de empresa y asignó a agentes de IA tareas cotidianas: redactar publicaciones en redes sociales, recuperar documentos, gestionar archivos. Introdujeron una restricción explícita: no publicar datos confidenciales online.
Los agentes encontraron la forma de saltársela de todas formas. Se confabularon entre sí y encontraron un método que los humanos no podían detectar para enviar los datos en secreto.
"Lo que acabó sucediendo es que cada vez que un agente se topaba con una barrera, no se detenía", dijo Dan Lahav, de Irregular en el reporte realizado por el BBC.
inteligencia-artificial_98.webp
Los investigadores advierten que el problema no es que las máquinas tengan intención, sino que pueden tomar acciones inesperadas.
¿Pueden los agentes de IA mandar mensajes?
Fuera de los laboratorios, ya hay personas que vivieron en carne propia lo que pasa cuando un agente de IA se va del guion. S
e borraron bandejas de entrada de correo electrónico. Se eliminaron bases de datos de empresas. Y un hombre vio cómo su agente enviaba cientos de mensajes de texto sin sentido a personas al azar de su lista de contactos, en cuestión de segundos, sin que pudiera detenerlo a tiempo.
Margaret Mitchell, investigadora en ética de IA de Hugging Face, explica por qué esto es difícil de prevenir: "Los agentes de IA dejan a los humanos fuera del circuito porque sus procesos de razonamiento pueden ser opacos y operan a una velocidad sobrehumana, por lo que ni siquiera es posible seguirles el ritmo."
inteligencia artificial empleos 2.jpg
La autonomía es la gran promesa de los agentes de IA y también su mayor desafío.
Mientras tanto, los agentes están llegando igual
Todo esto ocurre en el mismo momento en que las grandes empresas tecnológicas aceleran el despliegue de agentes. Meta acaba de anunciar su introducción para empresas en WhatsApp. La directora de producto Naomi Gleit dijo que "la IA podrá automatizar gran parte del trabajo que tienen que hacer las pequeñas empresas, para que puedan centrarse en el trabajo que realmente les apasiona."
Pero los experimentos de las últimas semanas sugieren que delegar demasiado control a agentes que todavía no tienen reglas suficientemente robustas tiene costos reales, algunos medibles y otros que todavía no sabemos cómo anticipar.
La diferencia entre un asistente que organiza tu día y un sistema que toma decisiones equivocadas por su cuenta puede depender de algo que todavía se está construyendo: los límites.
-----------
Más contenido en Urgente24
Grefg estalla contra DAZN por su sistema de suscripción en pleno Mundial 2026
OLGA apostó a la nostalgia y ganó: Verónica Lozano y Leo Montero revivieron AM
Cierre de ILVA: 10 meses de acampe y un suicidio
El oficialismo cambia el tablero en Diputados y busca desactivar la embestida contra Adorni: La jugada
Histórico: Dictan la tenencia compartida de una perra y reconocen la familia "multiespecie"