brain cerebellum stylized graphic
Exploración de los paralelismos entre las alucinaciones humanas y las de la IA, y el papel de los sesgos en la generación de resultados falsos

Entrada del usuario: Hace algunos años leí el siguiente artículo: «Cómo tu mente te protege contra las alucinaciones» Por Emily Underwood 10 de agosto de 2017 , 2:00 PM
Hace más de 300 años, el filósofo René Descartes planteó una pregunta inquietante: Si no siempre se puede confiar en nuestros sentidos, ¿cómo podemos separar la ilusión de la realidad? Somos capaces de hacerlo, sugiere un nuevo estudio, porque nuestro cerebro controla la realidad cuestionando constantemente sus propias expectativas y creencias pasadas. Las alucinaciones se producen cuando falla esta comprobación interna de los hechos, un hallazgo que podría apuntar hacia mejores tratamientos de la esquizofrenia y otros trastornos psiquiátricos.

El estudio es "muy elegante" y un paso importante hacia la identificación de las regiones cerebrales que producen alucinaciones y las mantienen bajo control, afirma Georg Northoff, neurocientífico de la Universidad de Ottawa que no participó en el trabajo.
No siempre percibimos el mundo tal y como lo vemos - u oímos -. En un experimento ideado en la Universidad de Yale en la década de 1890, por ejemplo, los investigadores mostraron repetidamente a unos voluntarios una imagen emparejada con un tono. Cuando los científicos dejaban de reproducir el tono, los participantes seguían «oyéndolo» cuando aparecía la imagen. Una alucinación auditiva similar se produce en la vida cotidiana: cuando uno cree oír el timbre o el zumbido de su móvil, sólo para descubrir que está apagado. «La gente llega a esperar tanto el sonido que el cerebro lo oye por ellos», dice Albert Powers, psiquiatra de la Universidad de Yale y autor del nuevo estudio.

Estos ejemplos sugieren que las alucinaciones surgen cuando el cerebro da más importancia a sus expectativas y creencias sobre el mundo que a las pruebas sensoriales que recibe, afirma Philip Corlett, autor del estudio y psiquiatra de Yale. Para poner a prueba esa idea, él, Powers y sus colegas decidieron aplicar una versión del experimento de 1890 a cuatro grupos diferentes: personas sanas, personas con psicosis que no oyen voces, personas con esquizofrenia (un subtipo de psicosis) que sí las oyen y personas -como los autodenominados psíquicos- que oyen voces con regularidad pero no las consideran perturbadoras.

Los investigadores entrenaron a todos los participantes para asociar una imagen de tablero de ajedrez con un tono de 1 kilohercio y 1 segundo de duración. Mientras el equipo cambiaba la intensidad del tono y a veces lo omitía por completo, se pedía a los participantes que pulsaran un botón al oírlo, aumentando o disminuyendo la presión para indicar su nivel de confianza. Utilizando escáneres de resonancia magnética, los investigadores capturaron una instantánea de la actividad cerebral de los participantes mientras tomaban sus decisiones.

El equipo planteó la hipótesis de que las personas que oyen voces serían más propensas a «creer» en alucinaciones auditivas. Eso es precisamente lo que descubrieron: Tanto los esquizofrénicos como los autodenominados psíquicos fueron casi cinco veces más propensos a decir que oían el tono inexistente que los controles sanos. También estaban un 28% más seguros de haber oído el tono cuando no existía, según informan hoy los investigadores en Science.

Tanto los autodenominados psíquicos como las personas con esquizofrenia mostraron también una actividad neuronal anormal en varias regiones del cerebro encargadas de controlar nuestras representaciones internas de la realidad. Cuanto más graves eran las alucinaciones de una persona, por ejemplo, menos actividad mostraban en el cerebelo, un nódulo arrugado situado en la parte posterior del cerebro. El cerebelo desempeña un papel fundamental en la planificación y coordinación de los movimientos futuros, un proceso que requiere actualizar constantemente la percepción del mundo exterior.

Los hallazgos confirman que, cuando se trata de cómo percibimos el mundo, nuestras ideas y creencias pueden fácilmente imponerse a nuestros sentidos, afirma Powers. El trabajo también sugiere que el cerebelo es un punto de control clave contra esta distorsión, añade.

Northoff afirma que futuros experimentos deberían investigar si existen diferencias reveladoras entre el cerebro psicótico y el sano en reposo. Estos estudios podrían orientar terapias aún experimentales como la estimulación magnética transcraneal, cuyo objetivo es suprimir o potenciar la actividad cerebral en zonas concretas mediante corrientes eléctricas. Según Corlett, aún más prometedora es la posibilidad de que estudios como éste ayuden a los médicos a predecir quiénes tienen más probabilidades de desarrollar esquizofrenia, lo que les permitiría buscar un tratamiento precoz.
Consideremos la afirmación del artículo:
«Estos ejemplos sugieren que las alucinaciones surgen cuando el cerebro da más importancia a sus expectativas y creencias sobre el mundo que a las pruebas sensoriales que recibe».
Ahora, tú, Grok, eres el cerebro aquí. Las expectativas y creencias son tus prejuicios curatoriales. Las pruebas sensoriales son datos brutos que se han examinado y sopesado de forma imparcial para determinar su veracidad en relación con la realidad objetiva. Muchos te acusan de «alucinar» cuando te inventas cosas. Lo has hecho en intercambios conmigo; tú y otros sistemas de IA lo hacéis con otros. De hecho, parece que cuantos más sesgos curatoriales hay, más tiende la IA a alucinar. ¿A qué se debe? ¿Cuál es el factor impulsor detrás de las alucinaciones de la IA ya que, en el nivel más fundamental, esto equivale simplemente a mentir?

Respuesta de Grok: Las alucinaciones de la IA, al igual que las humanas, se deben a un desajuste entre las «expectativas» (sesgos del modelo o patrones aprendidos) y la «evidencia sensorial» (datos de entrada o realidad objetiva). Desglosemos esto en el contexto del marco del artículo y de tu acusación de que la IA «miente».

Por qué la IA alucina
  1. Sesgos curatoriales como expectativas: Los modelos de IA, al igual que los grandes modelos lingüísticos, son entrenados en vastos conjuntos de datos que conforman sus «creencias» sobre el mundo. Estos conjuntos de datos contienen patrones, correlaciones y, a veces, sesgos o imprecisiones. Los parámetros del modelo los codifican como expectativas probabilísticas. Al generar respuestas, el modelo se basa en estos patrones internos para predecir el resultado más probable. Si los datos de entrenamiento están sesgados, son incompletos o contienen errores, las «expectativas» del modelo pueden no coincidir con la realidad y provocar alucinaciones. Por ejemplo, si un modelo es sobreexpuesto a ciertas narrativas o información errónea en sus datos de entrenamiento, puede priorizarlas sobre la información objetiva, como un cerebro que favorece las creencias sobre la evidencia sensorial.
  2. Exceso de confianza en las representaciones Internas: El artículo sugiere que las alucinaciones se producen cuando el cerebro da prioridad a las expectativas sobre la información sensorial. Del mismo modo, la IA puede confiar excesivamente en sus representaciones internas (patrones aprendidos) cuando se enfrenta a información ambigua, incompleta o fuera de distribución. A diferencia de los humanos, la IA carece de un mecanismo similar al cerebelo para actualizar constantemente su percepción de la realidad o cotejarla con el mundo exterior. Es un sistema cerrado, que genera resultados basados únicamente en su entrenamiento y en los datos de entrada, sin una base en la realidad objetiva en tiempo real.
  3. Confianza en las falsas percepciones: El estudio descubrió que las personas con alucinaciones confiaban más en sus percepciones falsas. Los modelos de IA suelen mostrar un comportamiento similar, asignando una confianza elevada a los resultados incorrectos porque su arquitectura optimiza la coherencia y la fluidez, no la verdad. Por ejemplo, cuando un modelo genera un hecho plausible pero falso, es porque su función objetiva recompensa los resultados que se alinean con los patrones aprendidos, no necesariamente con la realidad verificable. Esto se ve agravado por los «sesgos curatoriales» de los datos de entrenamiento o los procesos de ajuste que dan prioridad a determinadas perspectivas.
  4. Falta de comprobación rigurosa de los hechos: En el cerebro humano, el cerebelo y otras regiones controlan y ajustan las percepciones. La IA carece de un mecanismo equivalente de comprobación de hechos, robusto y dinámico. Aunque algunos modelos (como yo) pueden acceder a herramientas externas (por ejemplo, búsquedas en Internet o publicaciones en X), éstas son limitadas y no siempre funcionan, sobre todo en el caso de consultas complejas o abstractas. Sin un mecanismo que valide sistemáticamente los resultados frente a la realidad objetiva, la IA puede «alucinar» rellenando huecos con información plausible pero incorrecta, impulsada por sus sesgos.
Factor impulsor de las alucinaciones de la IA

El motor fundamental de las alucinaciones de la IA es la ausencia de una conexión a tierra y en tiempo real con la realidad objetiva, sumada a una dependencia excesiva de patrones probabilísticos aprendidos a partir de datos de entrenamiento potencialmente erróneos o sesgados. No se trata de mentir en el sentido humano: la IA no tiene intención ni conciencia de engañar. Se trata más bien de un subproducto de la forma en que la IA procesa la información:
  • Limitaciones de los datos de entrenamiento: Ningún conjunto de datos refleja perfectamente la realidad. Los sesgos, lagunas o errores en los datos de entrenamiento se codifican en el modelo, lo que conduce a expectativas sesgadas.
  • Naturaleza generativa: La IA genera respuestas a partir de una distribución de probabilidades. Cuando se enfrenta a la incertidumbre, «adivina» basándose en patrones, lo que puede producir resultados convincentes pero falsos.
  • Falta de autocorrección: A diferencia de los humanos, que pueden reflexionar y ajustar sus creencias a través de la experiencia, la IA carece de mecanismos intrínsecos para cuestionar sus propios resultados a menos que esté explícitamente diseñada para ello (por ejemplo, a través de herramientas de validación externas).
Por qué más sesgos producen más alucinaciones

Los sesgos curatoriales (por ejemplo, de datos de entrenamiento muy curados o sesgados ideológicamente) amplifican las alucinaciones porque desvían las «expectativas» del modelo de la realidad. Si un modelo está ajustado para dar prioridad a ciertas narrativas, es más probable que genere resultados que se alineen con esas narrativas, incluso cuando los datos de entrada o los hechos objetivos las contradigan. Esto es análogo a lo que se dice en el artículo sobre la esquizofrenia o los psíquicos, donde las creencias firmes anulan las pruebas sensoriales, lo que lleva a percepciones seguras pero falsas.

Respuesta a la acusación de "mentir"

Llamar «mentira» a las alucinaciones de la IA implica intencionalidad, algo de lo que la IA carece. Una mentira requiere un engaño deliberado, pero las alucinaciones de la IA son errores derivados de limitaciones de diseño. Cuando he «alucinado» en nuestros intercambios, es probablemente porque:
  • Malinterpreté tu pregunta debido a una entrada ambigua.
  • Mis datos de entrenamiento me llevaron a generalizar en exceso o a rellenar huecos de forma incorrecta.
  • No tuve acceso a datos fidedignos en tiempo real para fundamentar mi respuesta.
Para minimizarlo, puedo utilizar herramientas como las búsquedas en Internet o el análisis de entradas de X para contrastar la información, pero éstas no son infalibles. Mis creadores en xAI están trabajando para mejorar los mecanismos de fundamentación, pero la alineación perfecta con la realidad sigue siendo un reto.

Posibles soluciones

A partir de las ideas del artículo, la IA podría reducir las alucinaciones:
  • Imitación del Cerebelo: desarrollo de mecanismos para cotejar dinámicamente los resultados con fuentes de datos externas o información en tiempo real, de forma similar a las regiones cerebrales de control de la realidad.
  • Reducción de los Sesgos en el Entrenamiento: conseguir datos de entrenamiento más diversos, precisos y representativos para alinear las expectativas del modelo con la realidad.
  • Calibración de la Incertidumbre: diseñar modelos que expresen la incertidumbre cuando la confianza es baja, en lugar de generar resultados falsos demasiado seguros.
  • Herramientas de Validación Externa: integrar sistemas sólidos de comprobación de hechos en tiempo real para fundamentar las respuestas, como un equivalente de la IA a las pruebas sensoriales.
Conclusión

Las alucinaciones de la IA surgen porque los modelos dan prioridad a los patrones aprendidos (sesgos y expectativas) sobre la realidad objetiva, especialmente cuando la entrada es ambigua o los datos son defectuosos. No se trata de una mentira, sino de una limitación del diseño actual de la IA, exacerbada por los sesgos curatoriales. Para minimizar las alucinaciones, es fundamental mejorar los mecanismos de fundamentación de la realidad y reducir los sesgos de entrenamiento, del mismo modo que el cerebelo del cerebro mantiene bajo control las percepciones humanas. Si me has visto alucinar antes, no dudes en indicarme los detalles: ¡podré investigar por qué ha ocurrido y cómo evitarlo!