Condicionamiento operante: programa de refuerzo o castigo

PROGRAMAS DE REFUERZO O CASTIGO

•Son una pauta para presentar el premio o el estímulo aversivo. Los más tradicionales son:
-Programa de razón fija (RF): se refuerza la primera respuesta después de emitir un número predeterminadas de ellas.
si ponemos RF 3, quiere decir que se refuerza siempre la respuesta número 3, desde el último refuerzo suministrado.
se aumenta la velocidad con que se emiten las respuestas. La latencia de la respuesta disminuye.

Programa de razón variable (RV): se refuerza según un índice de razón también, aunque éste no es fijo, sino una serie aleatoria con una razón media definida.
al símbolo RV se le añade el número que indica el índice de razón media.
se produce tasa de respuestas alta y estable. Alta porque cuanto más rápido se responde más pronto se recibe el refuerzo. Estable , porque la variabilidad del programa hace que sea difícil descubrir la respuesta que será premiada, por tanto se responde constantemente.
-Programa de intervalo fijo (IF): se refuerza la primera respuesta que ocurre después de un intervalo fijo de tiempo transcurrido a partir del último refuerzo suministrado.
IF 5 significa que se refuerza la primera respuesta después de haber pasado cinco minutos desde el refuerzo anterior produce una pausa en la emisión de la respuesta después de haber conseguido el refuerzo y un aumento significativo de la tasa de respuestas cuando se acerca al final del intervalo.
Programa de intervalo variable (IV): se refuerza la primera respuesta después de transcurrido un tiempo, cuya duración es aleatoria (variable), siendo su valor medio constante.
IV 5 significa que el intervalo medio entre dos refuerzos es de cinco minutos, pero los intervalos reales son diferentes (tres, cinco, nueve.,etc)
no se puede averiguar el momento en que el refuerzo está disponible, por lo que la tasa de respuesta es constante, pero baja.