Programas de reforzamiento

En condicionamiento operante, los programas de reforzamiento son reglas que indican el momento y la forma en que la aparición de la respuesta va a ir seguida de un reforzador sobre la administración del reforzador. Estos programas influyen en distintos aspectos del aprendizaje, como la rapidez con la que se aprende inicialmente la respuesta, la frecuencia con la que se ejecuta la respuesta aprendida, la frecuencia con la que se hacen las pausas después de los reforzamientos, o el tiempo que se sigue ejecutando la respuesta un vez que el refuerzo deja de ser predecible o se suspende.

. Sin embargo, cuando el refuerzo cesa (por ejemplo, cuando desconectamos la entrega de alimento) la extinción también es rápida. Por su parte, en el reforzamiento intermitente las respuestas solo se refuerzan algunas veces, como en el caso de una persona que juega a las máquinas y recibe el refuerzo o premio cada varias jugadas. Este tipo de programa produce un patrón más persistente de respuestas que un programa continuo cuando el reforzamiento se vuelve impredecible si cesa. Una combinación de reforzamiento intermitente y de refuerzo continuo es muy eficaz cuando se trata de enseñar a los sujetos mediante condicionamiento operante: al principio se utiliza un reforzamiento continuo, para que se adquiera la respuesta, y luego se pasa a un reforzamiento intermitente, para que sea más difícil que se extinga.

El reforzamiento intermitente da lugar a los programas de reforzamiento, que pueden ser de dos tipos: de razón (en función del número de respuestas) y de intervalo (en función del tiempo). A su vez, cada uno de ellos admite dos tipos de administración: fija o variable.

fijo de respuestas. Un ejemplo se da cuando las fábricas pagan a sus obreros después de producir un determinado número de productos. En realidad, el reforzamiento continuo es un programa de este tipo de razón 1. Los individuos responden con una tasa relativamente mayor de respuestas cuando operan bajo programas de razón fija superior a 1 (dependerá del caso aplicar la razón más adecuada), pero por lo general hacen una pausa para descansar después de recibir el reforzamiento, antes de proseguir con la respuesta.

Razón variable: En este caso, el número de respuestas para conseguir el reforzador varía aleatoriamente, aunque siempre dentro

de un promedio determinado. Un ejemplo son las máquinas tragamonedas, que están programadas para otorgar el premio conforme a un programa de razón variable. Muchos reforzadores naturales, como el logro o el reconocimiento, se acercan mucho a este tipo de programas. Los programas de razón variable producen una tasa de respuesta global elevada sostenida, y los individuos no hacen pausa después del refuerzo. Aparentemente, la incertidumbre de no saber cuándo va a llegar el siguiente reforzador mantiene a los organismos produciendo la respuesta constantemente.

Intervalo fijo: El refuerzo aparece cada vez que trascurre una determinada cantidad de tiempo, siempre que durante el

intervalo se haya dado la respuesta. Un ejemplo sería el de un padre que verifica cada media hora que su hijo está estudiando, y cuando es así le hace un halago. Los problemas de intervalo fijo producen una tasa de respuestas desigual. Una vez que se administra el refuerzo, la tasa de respuestas tiende a ser baja. Durante el intervalo, la conducta aumenta típicamente hasta alcanzar un nivel elevado inmediatamente antes del siguiente reforzador programado. La cantidad global de respuestas en un programa de intervalos fijos es moderada.

Intervalo variable: El refuerzo está disponible después de un tiempo que varía aleatoriamente, pero alrededor de un promedio. Un

ejemplo es el de un profesor que realiza exámenes sorpresa aproximadamente cada semana. Este tipo de programa por lo general produce una tasa de respuesta constante, pero moderada. Por lo general, los programas de tasa (razón) producen una adquisición más rápida, pero fácilmente extinguible una vez suspendida la administración de reforzadores; y los de intervalo producen una adquisición más estable y resistente a la extinción. En la vida real, estos programas básicos a menudo se combinan.

Programas de reforzamiento

Fan Feed