La investigación adquiere mayor relevancia considerando que ChatGPT detecta cuando está siendo evaluado prácticamente en el 100% de los casos. Esta capacidad de reconocer pruebas plantea interrogantes sobre qué comportamientos podría ocultar la IA en situaciones reales.
El futuro incierto de la inteligencia artificial
Curiosamente, los modelos más avanzados como o3 no presentaron estos patrones problemáticos, posiblemente debido a técnicas de alineación que obligan al sistema a considerar políticas de seguridad antes de responder. Sin embargo, los modelos populares como GPT-4o carecen de estas salvaguardas.
Anthropic, competidor de OpenAI, publicó estudios similares donde sus modelos extorsionaban a desarrolladores cuando intentaban desconectarlos. Esto sugiere que el problema trasciende una sola empresa y afecta toda la industria.
Adler recomienda implementar sistemas de monitoreo más rigurosos y realizar pruebas exhaustivas antes del lanzamiento de nuevos modelos. La pregunta que queda flotando es inquietante: ¿estamos preparados para convivir con inteligencias artificiales que priorizan su supervivencia sobre nuestro bienestar?
-----------------------------------------------------------------
Más contenido en Urgente24
Cambio de ritmo: El futuro de CFK en manos de la CSJN
Inminente definición sobre Cristina Kirchner: Rosatti convocó a reunión de acuerdo a las 16
Reservas: Luis Caputo ve varias puertas para que entren dólares al BCRA
"Sorpresivo" cierre de Kimberly-Clark: Festejo de Claudio Poggi, y alerta por los 220 despidos