Extinción de la Conducta Condicionada: Concepto y Teorías

La extinción implica la omisión del EI o reforzador.

  • Extinción en el condicionamiento clásico: incluye presentaciones repetidas del estímulo condicionado por sí solo.
  • Extinción en el condicionamiento instrumental: Implica no volver a presentar el reforzador como una consecuencia de la respuesta instrumental.

El resultado es que la respuesta condicionada (ya sea clásica o instrumental) disminuye. Por ello se piensa que la extinción es lo contrario a la adquisición (como en el Modelo de Rescorla y Wagner) sin embargo esto es incorrecto.

Diferencia entre extinción y olvido

Extinción: Se produce por la omisión del EI que sigue a las presentaciones del EC o la  omisión del reforzador que sigue a la respuesta instrumental.
Olvido: Disminución de la respuesta condicionada que se da con el paso del tiempo.

Efecto de los Procedimientos de Extinción

  • La respuesta disminuye cuando no vuelve a producir reforzamiento
  • Además la variabilidad de la respuesta aumenta (si la llave de mi casa un día no abre la puerta intentaré introducirle de distintas maneras a ver si lo consigo)

Estos efectos se muestran en un experimento con ratas en el que la extinción produjo una disminución en el número de secuencias de respuesta que los sujetos realizaban pero aumentó la variabilidad de esas secuencias.

Sin embargo es importante señalar que aparte de la variabilidad de respuestas también seguía dándose la respuesta inicial previa a la extinción, por lo tanto podemos decir que la estructura básica de la conducta instrumental se altera muy poco por el hecho de introducir la extinción.

Por lo tanto: La extinción disminuye la tasa de respuesta e incrementa la variabilidad de respuesta, pero no altera de otro modo la estructura de la conducta.

Además de estos efectos podemos encontrar otros efectos emocionales como consecuencia de la extinción:

Frustración: Reacción emocional inducida por la falta de un reforzador esperado. Puede derivar en agresión.

Extinción y Aprendizaje Original

Aquí vamos a ver varios ejemplos que explican porqué la extinción no elimina por completo lo que se aprendió originalmente:

Recuperación espontánea

Recuperación espontánea tras el condicionamiento pavloviano: El efecto de la extinción se pierde con el tiempo. Por lo tanto la respuesta condicionada volverá a estar presente si el sujeto se pone a prueba tras una demora que siga al procedimiento de extinción.

Recuperación espontánea tras el condicionamiento instrumental: (la explicación es más o menos la misma que en el ejemplo pavloviano anterior). En un experimento con ratas se demostró que la respuesta cuya recuperación se comprobó tras un período de descanso posterior a la extinción (R-Descanso) se dio a una tasa mucho más alta que la respuesta cuya recuperación se midió sin un período de descanso posterior a la extinción (R-No descanso).

Por lo tanto: La introducción de un período de descanso tras la extinción produjo una recuperación sustancial en la respuesta.

Renovación del condicionamiento excitatorio original

Renovación: Se refiere a la recuperación de la ejecución propia de la adquisición que se da cuando se cambian las claves contextuales que estaban presentes durante la extinción.

En un experimento con ratas se comprobó que un miedo condicionado y posteriormente extinguido se renovava cuando se retiraba al grupo de ratas del nuevo contexto y se volvía a introducir en el contexto original de aprendizaje.

Por lo tanto: El hecho de que el miedo condicionado se renovara, indica que la pérdida de supresión durante la fase de extinción no refleja desaprendizaje de la respuesta de miedo condicionado. Es decir, a pesar de la extinción y de que las ratas han dejado de dar la respuesta, al cambiarlas de contexto la recuperan, por lo tanto nunca la desaprendieron.

La renovación también puede darse si el sujeto se retira del contexto de adquisición a un contexto alternativo que no es el de la adquisición original. Sin embargo en este caso la renovación no es tan sólida como cuando se lleva al contexto original.

Otra explicación de la renovación: propiedades excitatorias condicionadas del contexto de renovación:

1) Contexto A: Adquisición original
2) Contexto B. Extinción
3) Vuelta al contexto A que tiene propiedades excitatorias ya que es ahí donde se produjo la adquisición.

Implicación en la terapia de conducta: Aunque un procedimiento terapéutico sea efectivo extinguiendo una fobia en la seguridad de una sala de consulta del terapeuta, el miedo condicionado puede volver a presentarse cuando el paciente se enfrente con un EC de miedo en un contexto diferente.

Para reducir el efecto de renovación, investigadores han llevado a cabo la extinción en distintos contextos.

Restauración de la ejecución propia de la extinción

Como ya hemos visto antes: La renovación implica la reactivación de la memoria del condicionamiento original mediante la retirada del sujeto de las claves contextuales presentes durante la extinción. Y ahora lo mismo dicho de otra manera: La renovación reactiva una conducta aprendida previamente mediante el cambio del contexto a condiciones más aproximadas a las presentes cuando la conducta se adquirió con anterioridad.

De la misma forma que recuperamos la respuesta original, también podemos recuperar la respuesta de la extinción, (osea la “no respuesta”) Esto tiene mucho que ver con la recuperación espontánea ya que la conducta propia de la extinción puede restaurarse (contrarrestando la recuperación espontánea) presentando las claves que estaban presentes durante la fase de extinción.

Recuperación espontánea: Implica la recuperación de la conducta condicionada originalmente que sigue a la extinción si transcurre un período suficiente de tiempo tras la fase de extinción.

Restablecimiento de la excitación condicionada

Restablecimiento: Procedimiento que sirve para restaurar la respuesta a un estímulo condicionado extinguido.

Ejemplo con patatas fritas: Si cojo aversión a las patatas fritas porque me puse enfermo en un viaje tras comerlas, la aversión se extinguirá comiendo patatas fritas en varias ocasiones sin caer enfermo. Sin embargo, el fenómeno del restablecimiento sugiere que si se cae enfermo otra vez por alguna razón, la aversión a las patatas fritas podría reaparecer aunque la enfermedad no tuviera nada que ver con ellas.

Al igual que ocurría con el efecto de renovación, es importante considerar si el efecto del restablecimiento puede ser un resultado del condicionamiento contextual. El condicionamiento contextual es un posible factor contribuyente debido a que las presentaciones del EI que se dan durante la fase de restablecimiento pueden producir un condicionamiento de las claves contextuales de la situación experimental.

Diversos estudios han demostrado que el papel del contexto en estos casos es suprimir la ambigüedad de significado de un estímulo que tiene una historia mezclada de condicionamiento y extinción. El contexto tiene un efecto pequeño en los estímulos que tienen una historia sólo de condicionamiento.

En realidad se considera el restablecimiento como una forma de renovación: las claves contextuales condicionadas proporcionan algunas de las claves contextuales para la respuesta excitatoria en circunstancias normales. Estas claves contextuales se extinguen cuando se presenta el EC por sí solo durante la extinción.

Sensibilidad a la devaluación del reforzador

En una contingencia operante (instrumental), el procedimiento de devaluación de un reforzador consiste en asociar de forma pavloviana el estímulo que se está usando para reforzar una conducta (comida, por ejemplo) con algún otro estímulo de naturaleza inversa, es decir, aversivo (cloruro de litio, por ejemplo).

El efecto resultante es una disminución de la respuesta operante que ha sido reforzada con el reforzador devaluado aunque ésta respuesta nunca haya sido contingente con el estímulo aversivo, ni siquiera con el reforzador tras el proceso de devaluación.

En una contingencia clásica (pavloviana, respondiente), el procedimiento es muy similar y consiste en asociar el EI (con el que se estaba condicionando el EC) con otro EI de naturaleza inversa. De nuevo, el efecto encontrado es una disminución de la RC ante el EC, aunque el EC nunca se haya relacionado directamente con el EI aversivo.

Lo relevante para el capítulo que nos ocupa (Extinción de la conducta condicionada) es que este efecto (el de la devaluación del reforzador) se observa también en estímulos (en el caso del condicionamiento clásico) y respuestas (en el caso del condicionamiento operante) que han sido sometidas a procedimientos de extinción. Es decir, que después de extinguir un EC, por ejemplo, si devaluamos el EI con el que se condicionó, la RC ante ese EC será todavía menor que si simplemente lo hubiésemos extinguido.

Este fenómeno se usa como evidencia para defender que los procesos de extinción no eliminan las asociaciones realizadas durante el condicionamiento. Es decir, que las asociaciones establecidas (EC-EI o R-Er) durante el aprendizaje no desaparecen durante la extinción, aunque el sujeto no emita la RC o la R.

¿Qué se aprende en la extinción?

Asociaciones E-R inhibitorias

La falta de reforzamiento produce una asociación E-R inhibitoria.

¿porqué ocurre esto?

En realidad la extinción implica un tipo especial de ausencia de reforzamiento, es decir, se trata de ausencia de reforzamiento tras una historia de reforzamiento. La ausencia de reforzamiento sin esta historia previa no es extinción, sino más bien habituación. La ausencia de reforzamiento resulta aversiva sólo después de darse una historia de reforzamiento.

Por lo tanto los efectos emocionales de la ausencia de reforzamiento dependen de forma crítica de la historia previa del sujeto. Si tu pareja nunca te ha hecho café por la mañana, no te sentirás desilusionado cuando te despiertes y veas que no hay café.

Los efectos de la extinción son tanto conductuales como emocionales. Los efectos emocionales se originan en la frustración que se desencadena cuando un reforzador esperado no llega. Se supone que la ausencia de reforzamiento cuando se espera recompensa desencadena una reacción frustrante aversiva incondicionada.

Esta emoción aversiva sirve para que se deje de responder durante el curso de la extinción mediante el establecimiento de una asociación E-R inhibitoria.

Efectos paradójicos de la recompensa

Cuanto más entrenamiento con reforzamiento se proporciona, más fuerte será la expectativa de recompensa, y en consecuencia más fuerte será la frustración que se da cuando se introduce la extinción.

Efecto de sobreentrenamiento en la extinción: Si la disminución en la respuesta se debe a los efectos frustrantes de la ausencia de recompensa, un entrenamiento más extenso debería producir una extinción más rápida. Es paradójico ya que el sentido común nos diría que un entrenamiento más extenso debería crear una respuesta más fuerte y más resistente a la extinción, pero sucede lo contrario.

Efecto de la magnitud del reforzamiento en la extinción: La respuesta disminuye más rápido durante la extinción que sigue a un reforzamiento con un reforzador mayor. La ausencia de reforzamiento resulta más frustrante si el individuo espera una gran recompensa que si espera una pequeña.

Efecto del reforzamiento parcial en la extinción (ERPE): (es el efecto más estudiado). Los efectos de la extinción serán diferentes dependiendo del programa de reforzamiento usado. La extinción es más lenta y produce menos reacciones de frustración si había un programa de reforzamiento parcial (o intermitente) en lugar de uno continuo.

Un buen ejemplo de esto es el caso de los jugadores habituales ya que están a merced del reforzamiento intermitente. Las ganancias ocasionales les animan a seguir jugando a pesar de largos períodos de pérdidas.

Mecanismos del efecto de reforzamiento parcial en la extinción

Hipótesis de la discriminación: La ausencia de reforzamiento es mucho más fácil de detectar tras el reforzamiento continuo. El reforzamiento parcial parece enseñar a los sujetos a no rendirse ante la ausencia del reforzador, y esta persistencia aprendida se mantiene aun cuando los sujetos posteriormente experimenten una cadena ininterrumpida de sucesos.

¿Qué aprenden los sujetos durante el reforzamiento parcial que les hace más persistentes al enfrentarse a una racha de mala suerte o de fracasos?: 2 teorías que vamos a ver a continuación:

Teoría de la frustración: Los sujetos aprenden sobre los efectos emocionales de la ausencia de recompensa durante el entrenamiento en reforzamiento parcial

Teoría secuencial: Está basada en lo que los sujetos aprenden sobre la memoria de la ausencia de recompensa.

Y ahora vamos a ver estas teorías con más profundidad:

Teoría de la frustración (Abraham Amsel): La persistencia en la extinción es resultado del aprendizaje de algo paradójico, es decir, continuar respondiendo cuando se espera no ser reforzado o ser frustrado. La teoría de la frustración asume que el reforzamiento  intermitente da como resultado aprender a responder a pesar de esperar la ausencia de reforzamiento.

El reforzamiento intermitente da como resultado el aprendizaje de realizar la respuesta instrumental como reacción a la expectativa de ausencia de recompensa. Por el contrario, no existe nada en la experiencia del reforzamiento continuo que motive a los sujetos a responder cuando esperan ausencia de recompensa. El reforzamiento continuo no produce persistencia en la extinción.

Teoría secuencial: (Capaldi) Esta teoría está formulada en términos de conceptos de memoria. Asume que los sujetos pueden recordar si fueron reforzador por realizar la respuesta instrumental en el pasado reciente. El sujeto aprende a responder siempre y cuando recuerde no haber sido reforzado en los ensayos precedentes.

Resistencia al Cambio y Momento Conductual

Momento conductual: Este concepto se basa en el concepto de momento de la física newtoniana. El momento de un objeto físico es el producto de su peso (o masa) por su velocidad. Esta hipótesis dice que la conducta que posee un momento elevado también será difícil de “parar” o interrumpir por las manipulaciones.

La investigación sobre el momento conductual se ha llevado a cabo utilizando programas múltiples de reforzamiento ya que capacitan a los investigadores para comparar la susceptibilidad de la conducta a la interrupción bajo dos condiciones diferentes en la misma sesión.

Diversos experimentos concluyen que:

  • El modelo conductual está relacionado directamente con la tasa de reforzamiento. Una tasa más alta de reforzamiento produce una conducta que tiene un mayor momento y que es menos susceptible a la interrupción.
  • El momento conductual no está relacionado con la tasa de respuesta, es decir, do conductas que se dan a tasas semejantes no es preciso que tengan grados similares de momento conductual.
  • Los programas que proporcionan tasas similares de reforzamiento pero tasas diferentes de respuesta tienen similares momentos o resistencias al cambio.

La idea del momento conductual resulta intrigante porque intenta captar en un único concepto la resistencia de la conducta a diversas posibilidades de cambio. El concepto “fuerza de la respuesta” está relacionado con esto.

Redacción
Portal web especializado en Psicología y Desarrollo Personal formado por más de 200 profesionales.