Extinción de la Conducta Condicionada: Concepto y Teorías

La extinción implica la omisión del EI o reforzador.

Extinción en el condicionamiento clásico: incluye presentaciones repetidas del estímulo condicionado por sí solo.
Extinción en el condicionamiento instrumental: Implica no volver a presentar el reforzador como una consecuencia de la respuesta instrumental.

El resultado es que la respuesta condicionada (ya sea clásica o instrumental) disminuye. Por ello se piensa que la extinción es lo contrario a la adquisición (como en el Modelo de Rescorla y Wagner) sin embargo esto es incorrecto.

Diferencia entre extinción y olvido

Extinción: Se produce por la omisión del EI que sigue a las presentaciones del EC o la omisión del reforzador que sigue a la respuesta instrumental.
Olvido: Disminución de la respuesta condicionada que se da con el paso del tiempo.

Efecto de los Procedimientos de Extinción

La respuesta disminuye cuando no vuelve a producir reforzamiento
Además la variabilidad de la respuesta aumenta (si la llave de mi casa un día no abre la puerta intentaré introducirle de distintas maneras a ver si lo consigo)

Estos efectos se muestran en un experimento con ratas en el que la extinción produjo una disminución en el número de secuencias de respuesta que los sujetos realizaban pero aumentó la variabilidad de esas secuencias.

Sin embargo es importante señalar que aparte de la variabilidad de respuestas también seguía dándose la respuesta inicial previa a la extinción, por lo tanto podemos decir que la estructura básica de la conducta instrumental se altera muy poco por el hecho de introducir la extinción.

Por lo tanto: La extinción disminuye la tasa de respuesta e incrementa la variabilidad de respuesta, pero no altera de otro modo la estructura de la conducta.

Además de estos efectos podemos encontrar otros efectos emocionales como consecuencia de la extinción:

Frustración: Reacción emocional inducida por la falta de un reforzador esperado. Puede derivar en agresión.

Extinción y Aprendizaje Original

Aquí vamos a ver varios ejemplos que explican porqué la extinción no elimina por completo lo que se aprendió originalmente:

Recuperación espontánea

Recuperación espontánea tras el condicionamiento pavloviano: El efecto de la extinción se pierde con el tiempo. Por lo tanto la respuesta condicionada volverá a estar presente si el sujeto se pone a prueba tras una demora que siga al procedimiento de extinción.

Recuperación espontánea tras el condicionamiento instrumental: (la explicación es más o menos la misma que en el ejemplo pavloviano anterior). En un experimento con ratas se demostró que la respuesta cuya recuperación se comprobó tras un período de descanso posterior a la extinción (R-Descanso) se dio a una tasa mucho más alta que la respuesta cuya recuperación se midió sin un período de descanso posterior a la extinción (R-No descanso).

Por lo tanto: La introducción de un período de descanso tras la extinción produjo una recuperación sustancial en la respuesta.

Renovación del condicionamiento excitatorio original

Renovación: Se refiere a la recuperación de la ejecución propia de la adquisición que se da cuando se cambian las claves contextuales que estaban presentes durante la extinción.

En un experimento con ratas se comprobó que un miedo condicionado y posteriormente extinguido se renovava cuando se retiraba al grupo de ratas del nuevo contexto y se volvía a introducir en el contexto original de aprendizaje.

Por lo tanto: El hecho de que el miedo condicionado se renovara, indica que la pérdida de supresión durante la fase de extinción no refleja desaprendizaje de la respuesta de miedo condicionado. Es decir, a pesar de la extinción y de que las ratas han dejado de dar la respuesta, al cambiarlas de contexto la recuperan, por lo tanto nunca la desaprendieron.

La renovación también puede darse si el sujeto se retira del contexto de adquisición a un contexto alternativo que no es el de la adquisición original. Sin embargo en este caso la renovación no es tan sólida como cuando se lleva al contexto original.

Otra explicación de la renovación: propiedades excitatorias condicionadas del contexto de renovación:

1) Contexto A: Adquisición original
2) Contexto B. Extinción
3) Vuelta al contexto A que tiene propiedades excitatorias ya que es ahí donde se produjo la adquisición.

Implicación en la terapia de conducta: Aunque un procedimiento terapéutico sea efectivo extinguiendo una fobia en la seguridad de una sala de consulta del terapeuta, el miedo condicionado puede volver a presentarse cuando el paciente se enfrente con un EC de miedo en un contexto diferente.

Para reducir el efecto de renovación, investigadores han llevado a cabo la extinción en distintos contextos.

Restauración de la ejecución propia de la extinción

Como ya hemos visto antes: La renovación implica la reactivación de la memoria del condicionamiento original mediante la retirada del sujeto de las claves contextuales presentes durante la extinción. Y ahora lo mismo dicho de otra manera: La renovación reactiva una conducta aprendida previamente mediante el cambio del contexto a condiciones más aproximadas a las presentes cuando la conducta se adquirió con anterioridad.

De la misma forma que recuperamos la respuesta original, también podemos recuperar la respuesta de la extinción, (osea la “no respuesta”) Esto tiene mucho que ver con la recuperación espontánea ya que la conducta propia de la extinción puede restaurarse (contrarrestando la recuperación espontánea) presentando las claves que estaban presentes durante la fase de extinción.

Recuperación espontánea: Implica la recuperación de la conducta condicionada originalmente que sigue a la extinción si transcurre un período suficiente de tiempo tras la fase de extinción.

Restablecimiento de la excitación condicionada

Restablecimiento: Procedimiento que sirve para restaurar la respuesta a un estímulo condicionado extinguido.

Ejemplo con patatas fritas: Si cojo aversión a las patatas fritas porque me puse enfermo en un viaje tras comerlas, la aversión se extinguirá comiendo patatas fritas en varias ocasiones sin caer enfermo. Sin embargo, el fenómeno del restablecimiento sugiere que si se cae enfermo otra vez por alguna razón, la aversión a las patatas fritas podría reaparecer aunque la enfermedad no tuviera nada que ver con ellas.

Al igual que ocurría con el efecto de renovación, es importante considerar si el efecto del restablecimiento puede ser un resultado del condicionamiento contextual. El condicionamiento contextual es un posible factor contribuyente debido a que las presentaciones del EI que se dan durante la fase de restablecimiento pueden producir un condicionamiento de las claves contextuales de la situación experimental.

Diversos estudios han demostrado que el papel del contexto en estos casos es suprimir la ambigüedad de significado de un estímulo que tiene una historia mezclada de condicionamiento y extinción. El contexto tiene un efecto pequeño en los estímulos que tienen una historia sólo de condicionamiento.

En realidad se considera el restablecimiento como una forma de renovación: las claves contextuales condicionadas proporcionan algunas de las claves contextuales para la respuesta excitatoria en circunstancias normales. Estas claves contextuales se extinguen cuando se presenta el EC por sí solo durante la extinción.

Sensibilidad a la devaluación del reforzador

En una contingencia operante (instrumental), el procedimiento de devaluación de un reforzador consiste en asociar de forma pavloviana el estímulo que se está usando para reforzar una conducta (comida, por ejemplo) con algún otro estímulo de naturaleza inversa, es decir, aversivo (cloruro de litio, por ejemplo).

El efecto resultante es una disminución de la respuesta operante que ha sido reforzada con el reforzador devaluado aunque ésta respuesta nunca haya sido contingente con el estímulo aversivo, ni siquiera con el reforzador tras el proceso de devaluación.

En una contingencia clásica (pavloviana, respondiente), el procedimiento es muy similar y consiste en asociar el EI (con el que se estaba condicionando el EC) con otro EI de naturaleza inversa. De nuevo, el efecto encontrado es una disminución de la RC ante el EC, aunque el EC nunca se haya relacionado directamente con el EI aversivo.

Lo relevante para el capítulo que nos ocupa (Extinción de la conducta condicionada) es que este efecto (el de la devaluación del reforzador) se observa también en estímulos (en el caso del condicionamiento clásico) y respuestas (en el caso del condicionamiento operante) que han sido sometidas a procedimientos de extinción. Es decir, que después de extinguir un EC, por ejemplo, si devaluamos el EI con el que se condicionó, la RC ante ese EC será todavía menor que si simplemente lo hubiésemos extinguido.

Este fenómeno se usa como evidencia para defender que los procesos de extinción no eliminan las asociaciones realizadas durante el condicionamiento. Es decir, que las asociaciones establecidas (EC-EI o R-Er) durante el aprendizaje no desaparecen durante la extinción, aunque el sujeto no emita la RC o la R.

¿Qué se aprende en la extinción?

Asociaciones E-R inhibitorias

La falta de reforzamiento produce una asociación E-R inhibitoria.

¿porqué ocurre esto?

En realidad la extinción implica un tipo especial de ausencia de reforzamiento, es decir, se trata de ausencia de reforzamiento tras una historia de reforzamiento. La ausencia de reforzamiento sin esta historia previa no es extinción, sino más bien habituación. La ausencia de reforzamiento resulta aversiva sólo después de darse una historia de reforzamiento.

Por lo tanto los efectos emocionales de la ausencia de reforzamiento dependen de forma crítica de la historia previa del sujeto. Si tu pareja nunca te ha hecho café por la mañana, no te sentirás desilusionado cuando te despiertes y veas que no hay café.

Los efectos de la extinción son tanto conductuales como emocionales. Los efectos emocionales se originan en la frustración que se desencadena cuando un reforzador esperado no llega. Se supone que la ausencia de reforzamiento cuando se espera recompensa desencadena una reacción frustrante aversiva incondicionada.

Esta emoción aversiva sirve para que se deje de responder durante el curso de la extinción mediante el establecimiento de una asociación E-R inhibitoria.

Efectos paradójicos de la recompensa

Cuanto más entrenamiento con reforzamiento se proporciona, más fuerte será la expectativa de recompensa, y en consecuencia más fuerte será la frustración que se da cuando se introduce la extinción.

Efecto de sobreentrenamiento en la extinción: Si la disminución en la respuesta se debe a los efectos frustrantes de la ausencia de recompensa, un entrenamiento más extenso debería producir una extinción más rápida. Es paradójico ya que el sentido común nos diría que un entrenamiento más extenso debería crear una respuesta más fuerte y más resistente a la extinción, pero sucede lo contrario.

Efecto de la magnitud del reforzamiento en la extinción: La respuesta disminuye más rápido durante la extinción que sigue a un reforzamiento con un reforzador mayor. La ausencia de reforzamiento resulta más frustrante si el individuo espera una gran recompensa que si espera una pequeña.

Efecto del reforzamiento parcial en la extinción (ERPE): (es el efecto más estudiado). Los efectos de la extinción serán diferentes dependiendo del programa de reforzamiento usado. La extinción es más lenta y produce menos reacciones de frustración si había un programa de reforzamiento parcial (o intermitente) en lugar de uno continuo.

Un buen ejemplo de esto es el caso de los jugadores habituales ya que están a merced del reforzamiento intermitente. Las ganancias ocasionales les animan a seguir jugando a pesar de largos períodos de pérdidas.

Mecanismos del efecto de reforzamiento parcial en la extinción

Hipótesis de la discriminación: La ausencia de reforzamiento es mucho más fácil de detectar tras el reforzamiento continuo. El reforzamiento parcial parece enseñar a los sujetos a no rendirse ante la ausencia del reforzador, y esta persistencia aprendida se mantiene aun cuando los sujetos posteriormente experimenten una cadena ininterrumpida de sucesos.

¿Qué aprenden los sujetos durante el reforzamiento parcial que les hace más persistentes al enfrentarse a una racha de mala suerte o de fracasos?: 2 teorías que vamos a ver a continuación:

Teoría de la frustración: Los sujetos aprenden sobre los efectos emocionales de la ausencia de recompensa durante el entrenamiento en reforzamiento parcial

Teoría secuencial: Está basada en lo que los sujetos aprenden sobre la memoria de la ausencia de recompensa.

Y ahora vamos a ver estas teorías con más profundidad:

Teoría de la frustración (Abraham Amsel): La persistencia en la extinción es resultado del aprendizaje de algo paradójico, es decir, continuar respondiendo cuando se espera no ser reforzado o ser frustrado. La teoría de la frustración asume que el reforzamiento intermitente da como resultado aprender a responder a pesar de esperar la ausencia de reforzamiento.

El reforzamiento intermitente da como resultado el aprendizaje de realizar la respuesta instrumental como reacción a la expectativa de ausencia de recompensa. Por el contrario, no existe nada en la experiencia del reforzamiento continuo que motive a los sujetos a responder cuando esperan ausencia de recompensa. El reforzamiento continuo no produce persistencia en la extinción.

Teoría secuencial: (Capaldi) Esta teoría está formulada en términos de conceptos de memoria. Asume que los sujetos pueden recordar si fueron reforzador por realizar la respuesta instrumental en el pasado reciente. El sujeto aprende a responder siempre y cuando recuerde no haber sido reforzado en los ensayos precedentes.

Resistencia al Cambio y Momento Conductual

Momento conductual: Este concepto se basa en el concepto de momento de la física newtoniana. El momento de un objeto físico es el producto de su peso (o masa) por su velocidad. Esta hipótesis dice que la conducta que posee un momento elevado también será difícil de “parar” o interrumpir por las manipulaciones.

La investigación sobre el momento conductual se ha llevado a cabo utilizando programas múltiples de reforzamiento ya que capacitan a los investigadores para comparar la susceptibilidad de la conducta a la interrupción bajo dos condiciones diferentes en la misma sesión.

Diversos experimentos concluyen que:

El modelo conductual está relacionado directamente con la tasa de reforzamiento. Una tasa más alta de reforzamiento produce una conducta que tiene un mayor momento y que es menos susceptible a la interrupción.
El momento conductual no está relacionado con la tasa de respuesta, es decir, do conductas que se dan a tasas semejantes no es preciso que tengan grados similares de momento conductual.
Los programas que proporcionan tasas similares de reforzamiento pero tasas diferentes de respuesta tienen similares momentos o resistencias al cambio.

La idea del momento conductual resulta intrigante porque intenta captar en un único concepto la resistencia de la conducta a diversas posibilidades de cambio. El concepto “fuerza de la respuesta” está relacionado con esto.