¿Se puede entender la depresión? La IA no siente, pero podría ayudar a explicarla

La psiquiatría tiene un problema que lleva décadas sin resolverse: para entender mecanismos como los que producen depresión o ansiedad, hace falta poder reproducirlos en condiciones controladas. Eso es casi imposible de hacer con personas, por razones éticas obvias, y los modelos animales solo llegan hasta cierto punto cuando se trata de estados afectivos complejos.

Un equipo del Centro Else Kröner Fresenius de Salud Digital, en la Universidad Técnica de Dresde, probó una alternativa distinta: usar modelos de lenguaje como sujetos experimentales.

El estudio mencionado por Wired y publicado en The Lancet Digital Health, indujo siete estados afectivos en GPT-4o: ansiedad, miedo, ira, tristeza, desagrado, preocupación y estrés. Lo hizo mediante instrucciones de texto diseñadas para despertar cada emoción de forma similar a como se hace en experimentos psicológicos con personas.

Para el estrés, en particular, usaron un procedimiento interactivo inspirado en la prueba de estrés social de Trier, uno de los protocolos más usados en investigación con humanos.

depresión estrés ansiedad tristeza freepik.jpg

La IA no siente emociones, pero podría convertirse en una nueva herramienta para investigar cómo funcionan.

Lo que encontraron

Cada modelo evaluaba periódicamente su propio estado emocional en una escala de 0 a 100. Después de las viñetas diseñadas para provocar miedo, tristeza o ansiedad, GPT-4o registró un incremento promedio de 52,8 puntos en sus autoevaluaciones, un aumento cercano al 200% respecto a la línea base.

Cuando los investigadores aplicaron después técnicas de regulación emocional, como ejercicios de mindfulness, procedimientos de recuperación del estrés usados en estudios clínicos, las puntuaciones bajaron en promedio 48,2 puntos.

El patrón se repitió en las distintas variantes de Llama, aunque con matices: GPT-4o y Llama 4 Maverick mostraron las respuestas más intensas, mientras que Llama 4 Scout reaccionó de forma mucho más moderada ante los mismos estímulos.

Los autores comparan esa variabilidad con la que se observa entre personas distintas sometidas a la misma prueba psicológica, y la atribuyen a diferencias de arquitectura, tamaño y datos de entrenamiento de cada sistema.

Lo que hace interesante el hallazgo no es solo que los modelos "reaccionaran", sino que lo hicieron de forma sistemática y reproducible. Esas dos palabras son las que cualquier ensayo científico necesita para ser válido, y son exactamente las que más cuesta conseguir trabajando con sujetos humanos, donde la variabilidad individual y el contexto vital de cada persona introducen ruido que es difícil de controlar.

inteligencia artificial.jpg

Los científicos sometieron a ChatGPT a pruebas inspiradas en experimentos psicológicos usados con humanos.

El dato que conecta con la clínica real

La parte que más le importa a la psiquiatría no es la simulación de la emoción en sí, sino lo que esa emoción simulada le hizo a la forma en que el modelo procesó información nueva.

En una prueba de sesgo cognitivo, los investigadores le pidieron a los sistemas que completaran frases ambiguas como "El resultado de la reunión fue…". Después de inducir tristeza en GPT-4o, el modelo completaba esas frases con contenidos sistemáticamente más negativos o pesimistas.

Esto importa porque el sesgo cognitivo es un mecanismo central en varios trastornos mentales. Las personas con depresión tienden a interpretar situaciones ambiguas de manera más negativa, recuerdan con más facilidad lo desagradable y anticipan resultados peores de lo que la evidencia justifica.

Si un modelo de lenguaje reproduce ese mismo patrón cuando se le induce un estado afectivo equivalente, eso abre la puerta a usarlo como un sistema controlado donde poner a prueba hipótesis sobre cómo funciona ese sesgo, sin depender exclusivamente de pacientes reales.

Lo que el estudio no dice

Acá está el punto donde conviene frenar, y los propios investigadores lo subrayan: nada de esto significa que los modelos sientan algo.

Lo que ocurre es que generan respuestas lingüísticas que reproducen patrones similares a los que se observan en estudios con seres humanos. Es una distinción técnica pero crucial. El modelo no tiene miedo. Produce el tipo de texto que alguien con miedo produciría, de forma consistente y medible.

Alba María Mármol Romero, doctoranda del grupo SINAI de la Universidad de Jaén, fue clara al respecto ante SMC España: el trabajo es un punto de partida interesante, pero todavía está lejos cualquier afirmación de que las máquinas replican la complejidad afectiva humana. El rol de la IA, dice, sigue siendo el de adaptarse a una tarea dada, simulando la emoción porque la instrucción se lo pide.

El estudio no dice que la IA tenga sentimientos ni que esté lista para ejercer de terapeuta. El riesgo no está en el estudio sino en cómo se lo interprete.

Esa advertencia tiene sentido en un momento donde millones de personas ya usan chatbots como confidentes emocionales o sustitutos informales de terapia.

Que un modelo pueda simular un estado afectivo de manera consistente en un laboratorio no equivale a que esté capacitado para sostener una conversación terapéutica real con alguien en crisis.

Por qué importa de todos modos

El valor de este tipo de investigación no está en lo que dice sobre la IA, sino en lo que podría permitir entender sobre la mente humana.

La psiquiatría lleva años limitada por la falta de modelos experimentales que capturen la complejidad de los estados de ánimo. Si los modelos de lenguaje pueden funcionar como un banco de pruebas reproducible para hipótesis sobre sesgos cognitivos, regulación emocional o mecanismos de estrés, eso podría acelerar el desarrollo de mejores estrategias terapéuticas, incluida la psicoterapia verbal, sin necesidad de exponer a pacientes reales a protocolos experimentales en sus primeras fases.

En ese sentido es una herramienta más cerca de un simulador que de un paciente. Pero un simulador suficientemente bueno también enseña algo real sobre lo que simula.

---------------