Cuando los investigadores aplicaron después técnicas de regulación emocional, como ejercicios de mindfulness, procedimientos de recuperación del estrés usados en estudios clínicos, las puntuaciones bajaron en promedio 48,2 puntos.
El patrón se repitió en las distintas variantes de Llama, aunque con matices: GPT-4o y Llama 4 Maverick mostraron las respuestas más intensas, mientras que Llama 4 Scout reaccionó de forma mucho más moderada ante los mismos estímulos.
Los autores comparan esa variabilidad con la que se observa entre personas distintas sometidas a la misma prueba psicológica, y la atribuyen a diferencias de arquitectura, tamaño y datos de entrenamiento de cada sistema.
Lo que hace interesante el hallazgo no es solo que los modelos "reaccionaran", sino que lo hicieron de forma sistemática y reproducible. Esas dos palabras son las que cualquier ensayo científico necesita para ser válido, y son exactamente las que más cuesta conseguir trabajando con sujetos humanos, donde la variabilidad individual y el contexto vital de cada persona introducen ruido que es difícil de controlar.
inteligencia artificial.jpg
Los científicos sometieron a ChatGPT a pruebas inspiradas en experimentos psicológicos usados con humanos.
El dato que conecta con la clínica real
La parte que más le importa a la psiquiatría no es la simulación de la emoción en sí, sino lo que esa emoción simulada le hizo a la forma en que el modelo procesó información nueva.
En una prueba de sesgo cognitivo, los investigadores le pidieron a los sistemas que completaran frases ambiguas como "El resultado de la reunión fue…". Después de inducir tristeza en GPT-4o, el modelo completaba esas frases con contenidos sistemáticamente más negativos o pesimistas.
Esto importa porque el sesgo cognitivo es un mecanismo central en varios trastornos mentales. Las personas con depresión tienden a interpretar situaciones ambiguas de manera más negativa, recuerdan con más facilidad lo desagradable y anticipan resultados peores de lo que la evidencia justifica.
Si un modelo de lenguaje reproduce ese mismo patrón cuando se le induce un estado afectivo equivalente, eso abre la puerta a usarlo como un sistema controlado donde poner a prueba hipótesis sobre cómo funciona ese sesgo, sin depender exclusivamente de pacientes reales.
Lo que el estudio no dice
Acá está el punto donde conviene frenar, y los propios investigadores lo subrayan: nada de esto significa que los modelos sientan algo.
Lo que ocurre es que generan respuestas lingüísticas que reproducen patrones similares a los que se observan en estudios con seres humanos. Es una distinción técnica pero crucial. El modelo no tiene miedo. Produce el tipo de texto que alguien con miedo produciría, de forma consistente y medible.
Alba María Mármol Romero, doctoranda del grupo SINAI de la Universidad de Jaén, fue clara al respecto ante SMC España: el trabajo es un punto de partida interesante, pero todavía está lejos cualquier afirmación de que las máquinas replican la complejidad afectiva humana. El rol de la IA, dice, sigue siendo el de adaptarse a una tarea dada, simulando la emoción porque la instrucción se lo pide.
El estudio no dice que la IA tenga sentimientos ni que esté lista para ejercer de terapeuta. El riesgo no está en el estudio sino en cómo se lo interprete.
Esa advertencia tiene sentido en un momento donde millones de personas ya usan chatbots como confidentes emocionales o sustitutos informales de terapia.
Que un modelo pueda simular un estado afectivo de manera consistente en un laboratorio no equivale a que esté capacitado para sostener una conversación terapéutica real con alguien en crisis.
Por qué importa de todos modos
El valor de este tipo de investigación no está en lo que dice sobre la IA, sino en lo que podría permitir entender sobre la mente humana.
La psiquiatría lleva años limitada por la falta de modelos experimentales que capturen la complejidad de los estados de ánimo. Si los modelos de lenguaje pueden funcionar como un banco de pruebas reproducible para hipótesis sobre sesgos cognitivos, regulación emocional o mecanismos de estrés, eso podría acelerar el desarrollo de mejores estrategias terapéuticas, incluida la psicoterapia verbal, sin necesidad de exponer a pacientes reales a protocolos experimentales en sus primeras fases.
En ese sentido es una herramienta más cerca de un simulador que de un paciente. Pero un simulador suficientemente bueno también enseña algo real sobre lo que simula.
---------------
Más contenido en Urgente24
Luis Caputo, "la boluda esta" y el tiro por la culata
Finde en Córdoba: Día del Padre con Las Pastillas del Abuelo, rally y más
La Ciudad lanzó un plan para ayudar a familias con deudas: cómo acceder
La furia de Santiago Caputo contra la revista que lo apunta por "recaudador"
Acusan a Atilra de paralizar la venta de una empresa láctea inactiva desde principios de año