¡O exploro o exploto!: Factores que modulan la atención a estímulos asociados a refuerzo

David Luque
School of Psychology, University of New South Wales, Australia

(FreeImages) Angela Granger.

Orientar la atención, al igual que pasa con otras conductas, puede perseguir el objetivo de explorar el entorno en busca de nuevas fuentes de refuerzo o, por el contrario, explotar otras fuentes ya conocidas. Investigaciones recientes han descrito los factores que facilitan que se ponga en marcha una u otra estrategia. En entornos bien conocidos y estables se ha encontrado que la atención se centra en aquellos estímulos predictores de refuerzo (explotación). En entornos inciertos la atención es más difusa y los estímulos se procesan durante más tiempo (exploración). De forma muy interesante, estos efectos son producidos por mecanismos muy rápidos, probablemente de naturaleza automática.

[Versión en pdf]

Tanto para los humanos como para el resto de animales, la búsqueda de refuerzo (p.ej., comida o que te digan que has hecho algo bien) y la evitación del castigo (evitar un predador o, simplemente, evitar una charla por parte de tu jefe) son la motivación principal que impulsa y orienta la mayoría de nuestras acciones cotidianas.

Ahora bien, no siempre sabemos qué tenemos que hacer para conseguir refuerzos y evitar castigos. Para maximizar la cantidad de refuerzo conseguido es necesario realizar conductas orientadas no a obtener directamente esos refuerzos, sino a obtener información acerca de si están disponibles en el entorno otras fuentes de refuerzo alternativas (potencialmente mejores). A las conductas destinadas a obtener refuerzo de fuentes ya conocidas las llamamos explotadoras, mientras que las conductas realizadas para obtener más información las llamamos exploradoras.

Mantener un balance correcto entre explotación y exploración es importante para la operación de nuestros mecanismos atencionales. Nuestro sistema atencional tiene que “decidir” si es necesario gastar tiempo y recursos explorando nuevos estímulos. Un ejemplo puede ayudar a entender este punto. Imagina que te mudas a, digamos, Indonesia. De repente, pasas a estar rodeado de restaurantes que sirven un tipo de comida hasta ahora desconocida para ti. Dada esta situación, las primeras veces que vayas a un restaurante te verás obligado a explorar la carta, en busca de algo que suene apetitoso (exploración). Después de probar algunos platos, tu tiempo de exploración se irá reduciendo a medida que descubras qué cosas son más de tu gusto. Con el suficiente entrenamiento, tus tiempos de exploración se reducirán drásticamente y tu atención se centrará en la rápida localización de tus platos favoritos (explotación).

En una serie de experimentos hemos venido estudiando qué factores modulan el compromiso entre explotación y exploración en nuestra atención. Como resulta evidente en nuestro ejemplo, la atención exploratoria dominará cuando nos encontremos en ambientes completamente novedosos. Otro factor crucial que hemos descubierto es la incertidumbre del entorno, o en otras palabras, cómo de estables son las fuentes de refuerzo.

Por ejemplo, los participantes en los experimentos de Luque, Vadillo, Le Pelley y Beesley (2016) aprendían sobre varios estímulos visuales presentados en una pantalla de ordenador. Uno de esos estímulos indicaba siempre qué respuesta era la correcta en ese ensayo en concreto (el estímulo “predictivo” o P), mientras que otro estímulo no ofrecía ninguna información útil (el estímulo “no predictivo” o NP; véase la Figura 1). Se midió la atención prestada a cada uno de estos estímulos usando una tarea de «detección del punto» (“dot-probe” en inglés), en la cual los participantes tienen que localizar lo antes posible un pequeño puntito que aparece encima de uno de los estímulos en la pantalla. Si tardas muy poco en localizar este pequeño puntito quiere decir que estabas ya prestando atención a ese estímulo. Los resultados en esta tarea mostraron que los participantes prestaban más atención a los estímulos P que a los NP, resultado que hemos replicado en varias ocasiones (p.ej., Le Pelley, Vadillo y Luque, 2013).

Figura 1.- Procedimiento usado en Luque y col. (2016). A) En los ensayos de aprendizaje los participantes tenían que aprender a responder ‘A’ o ‘Z’ dada una pareja de estímulos presentada en la pantalla. B) Una vez aprendían qué respuesta era correcta para cada par de estímulos, la atención prestada a cada uno de los estímulos se midió usando una prueba de detección del punto («dot-probe»). En cada ensayo de detección del punto se presentaba una de las parejas de estímulos. Después de cierta cantidad de tiempo, un pequeño punto aparecía encima de uno de los estímulos. El tiempo que tardaba en aparecer el punto fue diferente para dos grupos de participantes, 250 o 1000 ms. Todos los participantes tenían que responder lo antes posible a la posición de este puntito usando las flechas ‘izquierda’ o ‘derecha’ del teclado. C) De cada par de estímulos, solo uno de ellos resultaba útil a la hora de predecir qué respuesta era la correcta en los ensayos de aprendizaje (los estímulos predictivos). Los colores y respuestas fueron contrabalanceados. En el panel C se presenta una posible combinación de los mismos.

En una segunda fase de los experimentos publicados en Luque y col. (2016) hicimos que uno de los estímulos P perdiese parte de su eficacia. En un 33% de los ensayos, aunque se emitiera la respuesta correcta, se le informaba a los participantes que la respuesta había sido incorrecta. En otras palabras, aumentamos la incertidumbre asociada a las relaciones estímulo-respuesta: ya no podían estar completamente seguros de evitar retroalimentación negativa. A esta condición la llamamos de alta incertidumbre. Al mismo tiempo, algunos de los estímulos P mantuvieron su eficacia intacta. A esta otra condición la llamamos de baja incertidumbre. De vuelta a Indonesia, sería como si algunos restaurantes siempre sirvieran tus platos favoritos exactamente igual (baja incertidumbre), mientras que en otros la calidad de esos platos no siempre cumpliera tus expectativas (alta incertidumbre).

Pues bien, en nuestros experimentos observamos que, para la condición de alta incertidumbre, la atención se hizo más dispersa de un modo general, mostrando los participantes dificultad a la hora de localizar el punto, independientemente de si se presentaba sobre un estímulo P o NP (véase la Figura 2). Estos resultados apoyan la hipótesis de que la exploración atencional es más probable en entornos poco estables o inciertos.

Figura 2.- Tiempos de respuesta (TR) promedio en la tarea de detección del punto (dot-probe). En el grupo en el que la atención se midió a los 250 ms se obtuvieron respuestas más rápidas para los estímulos predictivos (P) comparados con los no predictivos (NP) en la primera fase del experimento en la que no había incertidumbre (explotación). En la segunda fase, en la que se introdujo la incertidumbre, la diferencia entre P y NP desapareció (exploración). En el grupo en el que la atención se midió a los 1000 ms no se encontró ningún efecto. Las barras de error representan el error típico de la media.

Un aspecto importante en Luque y col. (2016) es que se estudió el curso temporal de esta exploración atencional. Nuestros experimentos se realizaron en dos grupos de participantes. En el primer grupo, la atención se midió en los primeros momentos del procesamiento visual de los estímulos (250 milisegundos después de presentar los estímulos en la pantalla). En el segundo grupo, la atención se midió un poco más tarde, pasados 1000 milisegundos desde la presentación de los estímulos en la pantalla. El análisis de las respuestas en la detección del punto en estos dos grupos mostró que el efecto de atención exploratoria fue más fuerte a los 250 que a los 1000 milisegundos. Este resultado no fue lo que esperábamos encontrar, ya que se supone que las conductas exploratorias son el resultado de procesos de toma de decisiones relativamente lentos. Sin embargo, los resultados en Luque y col. (2016) nos llevan a pensar que la atención exploratoria se pone en marcha muy rápidamente y, hasta cierto punto, de un modo automático e involuntario. Futuras investigaciones estudiarán hasta qué punto esta rápida exploración motivada por la incertidumbre tiene un peso real en nuestra conducta, por ejemplo, mejorando el aprendizaje sobre nuevas fuentes de refuerzo.

Referencias

Le Pelley, M. E., Vadillo, M., y Luque, D. (2013). Learned predictiveness influences rapid attentional capture: Evidence from the dot probe task. Journal of Experimental Psychology: Learning, Memory, and Cognition, 39, 1888-1900.

Luque, D., Vadillo, M. A., Le Pelley, M. E., y Beesley, T. (2016). Prediction and uncertainty in associative learning: Examining controlled and automatic components of learned attentional biases. The Quarterly Journal of Experimental Psychology. DOI: 10.1080/17470218.2016.1188407

Manuscrito recibido el 12 de septiembre de 2016.
Aceptado el 15 de noviembre de 2016.

Guardar

(Visitado 2.274 veces, 1 visitas hoy)

¡O exploro o exploto!: Factores que modulan la atención a estímulos asociados a refuerzo

Post Navigation

Buscar

Más leído hoy

Categorías

Divulgación en castellano

Divulgación en inglés

Patrocinadores

¡O exploro o exploto!: Factores que modulan la atención a estímulos asociados a refuerzo

Post Navigation

Buscar

Más leído hoy

Etiquetas

Categorías

Divulgación en castellano

Divulgación en inglés

Patrocinadores