Resumen
La confianza, el “sentimiento de saber” que acompaña a todo proceso cognitivo, desempeña un papel fundamental en el aprendizaje por refuerzo humano; sin embargo, sus bases computacionales en escenarios de aprendizaje solo han comenzado a estudiarse recientemente. Trabajos previos han distinguido entre la confianza en el valor (certeza en las estimaciones de valor) y la confianza en la decisión (certeza de que una elección es correcta), pero hasta ahora no se ha probado directamente cómo se computan estas dos formas de confianza ni cómo interactúan entre sí.
Aquí combinamos dos experimentos y conjuntos de datos publicados previamente para poner a prueba hipótesis computacionales alternativas. Encontramos que la confianza en el valor se explica mejor mediante un cálculo bayesiano que refleja la precisión de las estimaciones de valor, y que guía adaptativamente el comportamiento al reducir la exploración y promover la explotación a medida que aumenta la certeza. En contraste, la confianza en la decisión se desvía de las predicciones bayesianas, especialmente en los errores. Un modelo híbrido que integra la probabilidad bayesiana con la precisión de la variable de decisión explica mejor la confianza en la decisión.
Además, los pesos relativos asignados a estas dos fuentes de información caracterizan las diferencias individuales en el reporte de confianza y, asimismo, predicen el rendimiento en la tarea y el desempeño metacognitivo: cuanto más bayesiano es el sujeto, mayor es su rendimiento. En conjunto, estos resultados proporcionan un mecanismo computacional unificado mediante el cual distintas formas de confianza moldean el aprendizaje y las elecciones en entornos inciertos.