PROCESOS DE APRENDIZAJE

1. El condicionamiento clásico (Pavlov, 1849-1936)

Ivan Petrovich Pavlov. Fisiólogo, su actitud fue de una objetividad y materialismo sin concesiones: “ para el naturalista toda la cuestión reside en el método, en la probabilidad de obtener una verdad inconmovible y duradera, y únicamente desde el punto de vista… el alma… no sólo es innecesaria, sino incluso perjudicial para este trabajo”. En ningún modo niega la existencia del alma, pero si la aparta de las ciencias debido a la dificultad científica de analizarla.

La figura central en el estudio del condicionamiento es Pavlov que estaba estudiando los reflejos de salivación de los perros cuando advirtió que algunos cambios sistemáticas en los reflejos salivares de los mismos estaban relacionados con su conducta en el laboratorio, ya que los perros comenzaban a salivar no sólo cuando recibían la comida en la boca, sino cuando la veían en le plato del experimentador. Pavlov se preguntó si esa salivación prematura anticipada estaba provocada tan sólo por la visión de la comida o si, por el contrario, cualquier estímulo, por ejemplo el sonido de una diapasón o una luz, sería capaz de provocar la salivación, con tal de que fuera seguido con alguna frecuencia por la comida verdadera. El mecanismo del condicionamiento clásico es el siguiente:

Si a un perro se le presenta la comida (estimulo incondicionado: EI, da una respuesta innata( respuesta incondicionada: RI) que es la salivación. Esta conducta se explica por un acto reflejo que posee de forma innata. Ahora bien, si al estímulo de presentar la comida le asociamos un estimulo neutro EN (el sonido de un diapasón), al cabo de unos días de adiestramiento el estímulo neutro (EN) se convierte en estímulo condicionado EC, de forma que su sonido aislado es capaz de provocar en el perro la salivación. La respuesta del perro ya no es una respuesta innata sino una respuesta condicionada. El perro ha hecho un aprendizaje: el sonido del diapasón significa comida, y por tanto, empieza a preparar el estómago salivando.

Estimulos incondicionado respuesta incondicionada
EI —————————————-→ RI
Estimulo neutro
EN —————————————–→ ø
Estimulo condicionado respuesta condicionada
EC——————————————-→ RC

Un factor importante para que se produzca el condicionamiento es la repetición en contigüidad de los estimulos condionado e incondicionado. El intervalo temporal adecuado viene determinado por la presentación del estímulo condicionado( diapasón), medio segundo antes que el estímulo incondicionado( la comida), ya que es importante que el efecto del estimulo condicionado sobre el organismo se produzca en simultaneidad con el estimulo incondicionado, lo que supone una cierta duración de la excitación del sujeto. Aunque Pavlov consideró la contigüidad temporal de los estimulos esencial para el condicionamiento, hay excepciones a esta regla, ya que la repetición puede no ser necesaria para la formación de todas las relaciones estimulo condicionado-respuesta condicionada. De hecho, basta en ocasiones un solo acontecimiento para que se produzca el aprendizaje de la respuesta condicionada.

Para adquirir un condicionamiento necesitamos estímulos incondicionados. Ahora bien, la respuesta condicionada no es igual a la respuesta incondicionada; podemos precisar 4 características que le hacen ser distintas a la RI:

1. generalización: consiste en que una vez adquirido un EC, tenemos tendencia a actuar de la misma manera ante estímulos similares al EC inicial. Según la ley de generalización, cuando un organismo ha sido condicionado a responder a un estímulo determinado, también producirán esa misma respuesta otros estimulos, aun cuando no hayan intervenido en el proceso de condicionamiento ni sean exactamente como él. Ej.: cuando alguien viaja a un país y tiene una experiencia desagradable. Mantiene una actitud negativa ante cualquier persona de ese país, también el racismo puede basarse en este mecanismo. La generalización es útil para la economía adaptiva del organismo, ya que el sujeto podrá responder a un estimulo, aunque este sufra variaciones. Por ejemplo, de nada serviría aprender a esquivar los coches cuando andamos o cruzamos la calle, si el aprendizaje sólo tuviera vigencia para un coche de tamaño o marca determinada. La generalización no es ilimitada no arbitraria, sino que parece seguir un gradiente de generalización que puede definirse como la relación entre la intensidad de las respuestas y el grado de semejanza de los nuevos estímulos con el estímulo original.

El condicionamiento de orden superior, como la generalización del estímulo es un medio para asociar una respuesta condicionada a un estímulo distinto del estímulo condicionado original. Pero a diferencia de la generalización, el condicionamiento de orden superior no se produce automáticamente como un subproducto de la experiencia del condicionamiento original. Más bien se establece a través de experiencias adicionales de condicionamiento. En le condicionamiento de orden superior, un estímulo neutro es apareado con un estímulo condicionado y eventualmente este estímulo neutro también llega a ser estímulo condicionado para la respuesta condicionada original.

2. discriminación: consiste en la capacidad para distinguir entre el Ec original y EC que se parece. Si la generalización es la respuesta a las semejanzas, la discriminación es la respuesta a las diferencias. Ej.: un niño pequeño generaliza en palabras amables, sonrisa y buen trato, pero al mismo tiempo discrimina entre el buen trato de su madre y el de otra persona. Este último mecanismo equilibra los efectos de la generalización. La tendencia a generalizar tiene un indudable valor adoptivo, pero es inadecuada en numerosas circunstancias, por ejemplo cuando hay que dar a diversos estímulos respuestas diferentes. Pavlov realizó un experimento interesante respecto a la salud mental, que tiene que ver mucho con el proceso de discriminación. Comenzó mostrando a un perro el dibujo de un círculo y dándole inmediatamente después algo de comida. En seguida el perro llegó a condicionar la saliva a la vista del círculo. Luego probó al animal mostrándole otros dibujos de figuras como elipse, cuadrado, rectángulo, triangulo estrella, comprobando que la respuesta de salivación se generalizaba a estímulos distintos del estímulo condicionado original (el circulo). La generalización seguía, por supuesto, un patrón: cuanto más semejante era la otra figura a un círculo, más salivaba el animal. Pavlov entrenó después al perro a discriminar entre los dos estímulos, dando siempre comida al perro cuando aparecía el círculo, peor no cuando aparecía la elipse. Inmediatamente el perro aprendió a salivar sólo cuando se mostraba el círculo. Cuando Pavlov comprobó que el perro podía discriminar entre un círculo y una elipse, trató de enloquecer al animal. En los siguientes ensayos presentó al perro elipse que eran casi redondas. En este momento, el sistema cognitivo del perro sufrió un schock tal que estuvo a punto de romperse, pues el animal no podía percibir la diferencia entre el estímulo condicionado positivo (el circulo) y el estimulo condicionado negativo (la elipse). Abrumado por el stress, el animal se descomponía, orinaba, defecaba y trataba de retirarse de la situación del entrenamiento.

3. extinción: es evidente que el sujeto condicionado a dar una respuesta determinada no está condicionado a darla durante el resto de su vida. Si el Estímulo condicionado no va a acompañado de vez en cuando por el Estímulo incondicionado la Respuesta condicionada desaparece. Ej.: si tocamos la campana repetidas veces y la comida no aparece, el perro desaprenderá la conducta aprendida.

4. recuperación automática: se refiere a la capacidad de recuperar condicionamientos ya extinguidos. Ej.: un año más tarde del experimento volvemos a practicar con el mismo pero el condicionamiento de la campanilla, el estímulo neutro, con pocas repeticiones se convertirá inmediatamente en estímulo condicionado.

El experimento de la salivación canina le hizo ganar el premio nobel en 1904.

EL MASOQUISMO
Muchos psicólogos tienen la idea de que el masoquismo es un fallo en el sistema de la personalidad de algunos sujetos. Pavlov en cambio, pensaba que podía tratarse de una conducta aprendida a través del condicionamiento. Para ello, Pavlov, entrenó a un perro a resistir estímulos extremadamente dolorosos utilizando una técnica de condicionamiento. Comenzó marcando un área de la piel sobre la pata del perro, luego estimuló esta área con un estímulo doloroso, e inmediatamente le dio algo de comida. El perro salivó a la comida, peor no retrocedió ante el dolor. Aparentemente, la fuerte respuesta de salivación incondicionada inhibió el reflejo normal de dolor, apareándolo cada vez con la comida. En ningún momento, el animal respondió como si estuviera herido. Es más, el perro parecía desear la sesión de entrenamiento y recibir el dolor, pues éste llegaba a ser una señal condicionada de que recibiría enseguida la comida. Una vez que el perro estaba completamente entrenado, aguantaba increíbles cantidades de estimulación dolorosa sobre su pata. Sin embargo, si Pavlov aplicaba el estímulo doloroso cualquier otra parte del cuerpo del perro, el animal instantáneamente daba un alarido e intentaba escapar de su lugar de entrenamiento. Pavlov concluyó que cuando se aplicaba el estimulo doloroso sobre su pata, el animal no sentía ningún dolor.¿por qué? Porque la respuesta de salivación era tan fuerte que suprimía todas las otras respuestas al mismo estímulo. Realmente, los animales, como los seres humanos no pueden hacer más que una cosa a la vez. Ya la respuesta fuerte tiende a suprimir la mayor parte de las reacciones que pudieran ser hechas al mismo estimulo. El paralelo entre los perros masoquistas y los seres humanos que buscan dolor o humillación para conseguir placer( frecuentemente sexual) es evidente.

2. El conductismo (Watson)

Formado en la Universidad de Chicago. Su campo de interés fue la psicología animal. Critica la psicología introspectiva de especulativa. Su solución al problema mente-cuerpo consistió en ignorarlo, estudiando únicamente la conducta. No existe la conciencia incógnita, sino unos procesos conductuales complejos. En 1913 expresa: “no existen procesos surgidos del interior”

Experimentó con el pequeño Albert para demostrar que hasta los sentimientos son aprendidos y que ninguna característica psíquica depende de un procesamiento anímico de la información. El experimento consistía en que aprovechando que Albert tenía miedo (respuesta incondicionado) de los golpes de una barra de hierro (estimulo condicionado9, se le condiciono el miedo a un peluche como ratas blancas, batas blancas, etc… Watson no llegó a desacondicionar a Albert porque la madre se negó a que siguiera experimentando con él.

EI————————————————–→ RI
Sonido barras de hierro miedo
EN————————————————→ ø
Peluche blanco
EC————————————————-→ RC
Peluche blanco miedo

Negó la existencia de caracteres o facultades innatas. En 1930 dice: “denme una doce de niños sanos…y un mundo con las especificaciones expresamente diseñadas por mi para educarlos, y les aseguro que, tomando a cualquiera de ellos al azar, le adiestraré para convertirse en cualquier clase de profesión: doctor, jurista, artista, director comercial, y si, incluso en un mendigo o un ladró; y ello con independencia de sus talentos…y de la raza de sus antepasados”. Esta posición era muy progresista porque algunos eugenistas pensaban que los negros eran inferiores.

Redujo el pensamiento a conducta implícita y redujo la creatividad a combinaciones nuevas de reflejos aprendidos previamente, peor no dijo nada sobre cómo se llevan a cabo tales combinaciones.

Para Watson el conductismo era una revolución dirigida frontalmente contra el estructuralismo, aunque indirectamente contra la religión calvinista. Su madre era anabaptisma con una moral muy tradicional, justo antes de entrar en el seminario murió su madre y pasó a estudiar psicología. Negar la existencia del alma suponía cerrar la puerta a la culpabilidad que la religión de su familia le imponía.

3. El condicionamiento instrumental ( Thorndike, 1874- 1949)

La teoría del condicionamiento instrumental, también llamado “aprendizaje de ensayo- error”, explica que no todas nuestras conductas tienen un carácter de respuestas a un estímulo previo; a diferencia de lo que contiene el condicionamiento clásico, el hombre y el animal no son seres pasivos que responden automáticamente ante un estímulo; son seres activos y según mantengan una conducta u otra, habrá unas u otras consecuencias.

Thorndike decía que una conducta que obtien un resultado satisfactorio, tiene muchas posibilidades de repetirse en situaciones similares. Su experimento más como es el siguiente:

Colocaba un gato dentro de una caja-problema. El gato esta hambriento y la comida a la vista, pero fuera de su alcance. Para poder salir de la caja, el gato debía tocar una palanca. En cuanto el animal entraba en la caja, intentaba salir sin conseguirlo. En esta situación, el animal desplegaba una conducta totalmente errática: brincaba, golpeaba la puerta, se lanzaba contra los barrotes de la caja, hasta que casualmente accionaba el dispositivo conseguía abrir la puerta. Thorndike midió el tiempo y comprobó que a mayor número de ensayos menor era al tiempo invertido en averiguar la solución para escapar.

Lo más destacado de este tipo de aprendizaje es que el animal, una vez que resuelve el problema que tenía planteado y abre la puerta, va eliminando gradualmente las respuestas inútiles y selecciona aquellas que conducen adecuadamente a la solución del problema ahora bien, una vez que el animal selecciona la conducta que conduce exitosamente a la solución, se establece una conexión instrumental definitiva entre la conducta apropiada (presión del dispositivo) y la recompensa a la que conduce (la comida). Entonces se produce el aprendizaje que se llama instrumental porque se aprende una conducta que es instrumento para obtener una recompensa.

Del analisis de estos experimentos dedujo Thorndike una serie de leyes, de entre las que destacamos:

1. ley del efecto: cuanto mayor sea la satisfacción, mayor seré el fortalecimiento o debilitamiento de la conexión.

2. ley del ejercicio: revela que las conexiones se fortalecen con la práctica y se debilitan sin ella. Ahora bien, la práctica, para ser eficaz, debe ser recompensada.

4. El condicionamiento operante (B.F. Skinner, 1904-1991)

el condicionamiento operante es, según la mayor parte de los especialistas, una modalidad del condicionamiento instrumental. En sentido estricto, se trata de un proceso en el cual la frecuencia con que se produce una conducta depende de las consecuencias que tiene esa conducta. Si las consecuencias son agradables, la conducta tenderá a repetirse; si la conducta se desfavorable, la conducta tenderá a desaparecer. Es una versión de la ley del efecto de Thorndike que, en versión de Skinner será la ley del refuerzo.

Ley del refuerzo: un refuerzo es un estímulo que provoca el que una conducta se repita en el futuro. En este sentido, el refuerzo es un estímulo positivo porque provoca que se repita la conducta. También puede existir un refuerzo que actue de modo negativo y tenga como consecuencia la desaparición de la conducta, a esto le llamaremos castigo. De esta teoría deducimos el siguiente cuadro, en él llamamos refuerzo a los estímulos que favorecen la repetición de una conducta y castigos a los estímulos que potencian su desaparición.

REFUERZO POSITIVO: queremos que una conducta se repita y para ello administramos un premio, ej.: un niño se porta bien y le damos un caramelo; un trabajador se esfuerza por su empresa y le damos una paga extraordinaria. El caso del refuerzo positivo es el más efectivo para la adquisición de hábitos conductuales peor hemos de tener en cuanta que no siempre puede aplicarse, ya que la persona reforzada se acostumbra a los premios y puede llegar el momento en que si no se le premia, no se esfuerce, y se haga incapaz de realizar tareas por si mismo. Asimismo la persona constantemente reforzada en el momento en que deja de serlo se frustra y esto normalmente desembocan agresividad.
REFUERZO NEGATIVO: queremos que una conducta se repita y para ello eliminamos un estímulo negativo. Ej.: si realizas bien los trabajos no tendrás que presentarte al examen.
CASTIGO POSITIVO: queremos que desaparezca una conducta y administramos un estímulo negativo. Ej.: un niño se sube a la mesa y le damos un capón. Este refuerzo es el más empleado y sin embargo es el menos eficaz ya que las personas son capaces de acostumbrarse al castigo e inmunizarse con el tiempo ante él.
CASTIGO NEGATIVO: queremos que desaparezca una conducta y eliminamos un estímulo positivo. Ej.: si te subes ala mesa te quedas sin helado.

La respuesta o conducta operante (propia del condicionamiento operante) difiere claramente de la conducta respondiente (propia del condicionamiento clásico de Pavlov).

La conducta respondiente es innata, producida por tanto necesariamente por el estímulo que le precede. Se trata, por lo general, de respuestas reflejas que tienen una misión protectora respecto a la supervivencia del animal. Además, la relación entre estímulo-respuesta es necesaria y está basada en la estructura heredad del organismo. En este caso, la frecuencia con que se produce esta conducta depende sólo de la frecuencia con que se presenta el estímulo evocador, de manera que para que aumentar o reducir la frecuencia de esta conducta basta con aumentar o reducir la frecuencia del estimulo. Por otra parte, las consecuencias que tiene la conducta no tienen influencia sobre eso mismo conducta.

Por el contrario, conducta operante no es provocada necesariamente oir el estímulo, sino que es emitida por el organismo de forma espontánea; correr, volar, comer, salir… son conductas operantes. Se puede llamar conducta operante a cualquier conducta espontánea que emite el organismo sin ser provocada por un estímulo determinado del ambiente. Y se llama operante, porque opera o produce algún efecto en el ambiente.

En el condicionamiento operante interesan especialmente los estímulos reforzados y discriminativos. Como hemos visto, los estimulos reforzados son sucesos ambientales que van detrás de la repuesta e incrementan la probabilidad de que estas respuestas ocurran en la conducta futura del organismo. Los estímulos discriminativos acompañan o proceden a las respuestas, y aumentan la probabilidad de las respuestas operantes que han sido reforzadas en el pasado en presencia de los mismos estímulos discriminativos.

El proceso de condicionamiento es extremadamente simple, tanto cuando se realiza en la vida diaria como cuando se provoca en situaciones de laboratorio, es decir, la caja de Skinner. Concretamente, en esta caja hay una palanca que, apretada 8conducta operante), hace caer la comida (estimulo reforzante). El proceso tiene, por lo general, dos partes; en la primera se aprende o constituye la operante y en la segunda se consolida. Cuando se introduce, por ejemplo, una paloma en la situación experimental, hay que esperar a que el animal accione la palanca (presione la operante) para facilitar la comida. Como este aprendizaje puede llevar mucho tiempo, conviene acelerar la constitución de la operante mediante el método llamado de aproximaciones sucesivas o moldeamiento, es decir, facilitando la comida cada vez que el animal se acerca a la palanca o se sitúa en la dirección correcta, logrando así llevarle hasta ella y hacer que la presione.

Una vez que la operante está ya constituida, y el animal ha aprendido a presionar la palanca (operante) para obtener la comida, puede entrar en juego el estímulo discriminativo, ordinariamente una luz que permanece encendida siempre que este dispositivo de la comida está en funcionamiento, y apagada cuando el dispositivo no funciona. De esta forma, el animal aprenderá a operar la palanca cuando la luz esté encendida (porque detrás de la operante- presión de la palanca- aparecerá la comida) y a no presionarla cuando la luz esté apagada. Las leyes del condicionamiento operante son semejantes a las del condicionamiento clásico ya descritas.

5. el aprendizaje observacional (Bandura)

la aportación de Bandura es sencilla pero no por ello menos relevante. Sus estudios apuntan la existencia de aprendizaje conductual a partir de otros modelos, es decir, la persona puede aprender no siempre sufriendo o gozando sobre si todos los castigos y refuerzos sino también a través de la observación. Ej.: si Juanito lleva pantalones Levi´s y obtiene la admiración de los demás, yo me compraré; o por ejemplo, en caso de que el personaje sea ficticio puede ocurrir que: si Batman no tiene miedo de dormir a oscuras yo tampoco; o- ves como ese niño después de ponerle la inyección no ha llorado, etc.

En esta teoría se supone la existencia de una contigüidad entre la conducta del observador y la del modelo, pero también la existencia de procesos mediacionales que operan de forma concertada. En primer lugar, deben intervenir ciertos procesos atencionales, de manera que el observador pueda reconocer y diferenciar los rasgos distintivos de la respuesta del modelo; de retención, adquiriendo la conducta del modelo de forma representacional a través del sistema imaginativo y del verbal; de reproducción motórica, ya que necesita el observador transformar el conocimiento en acción, y motivacionales, ya que la condición del refuerzo determina la medida en que una correcta adquisición se trasformará en ejecución abierta.

Son muchas las teorías que tratan de explicar el aprendizaje observacional. Algunos como Tarde o James explican este proceso de aprendizaje acudiendo a una instancia instintiva presente en el observador, que le lleva a adquirir e incorporar a su repertorio comportamental las conductas que observa en el modelo. Tarde llegó a pensar que los procesos observacionales o imitativos constituían la clave explicativa de todo el sistema social, puesto que llegaba a explicar la formación, mantenimiento y cambio de las regularidades sociales, tanto en el nivel institucional como en el personal, e incluso en el de las creencias compartidas.

Efectos del aprendizaje observacional

Se reconocen tres efectos principales del aprendizaje observacional: modelado, inhibición-desinhibición y facilitación.

1. modelado: se llama modelado a la adquisición de nuevas pautas de conducta que el modelo ofrece y observador reproduce. Uno de los campos principales de estudio es el de la adquisición, por parte de los niños, de las respuestas agresivas de la contemplación de los modelos adultos. De los experimentos realizados por Bandura, se puede concluir que los niños que observan una conducta agresiva, realizan luego una mayor número de respuestas agresivas que los que no la han observado. Más importante que esto es qie los modelos filmados son tan poderosos en la creación de conductas agresivas como los modelos reales.

2. la inhibición se refiere a la supresión, por parte del observador, de una conducta prohibida o socialmente indeseables por haberla visto castigada en el modelo, o porque el modelo no la realiza, respetando así la prohibición. La deshibición, en cambio, implica la manifestación, por parte del observador, de una respuesta prohibida o socialmente indeseable contemplada previamente en el modelo. En un experimento reciente, el grupo de niños que había observado la conducta del modelo que transgredía una norma y comentaba luego positivamente la trasgresión cometida, quebrantaba una norma que les prohibía jugar con determinado juguete en una proporción mayor que el grupo de niños que observaba un modelo también trasgresor, peor que hacía comentarios críticos sobre la conducta.

3. facilitación: el efecto del modelado en este caso es instigar o disparar una respuesta conocida y no castigada. El ejemplo más sencillo de facilitación es el del emigrante, que al volver a su tierra, ha olvidado los modismos del lenguaje del pueblo, pero al poco tiempo vuelve a recuperarlos y habla como los demás.

Las características del observador también influyen de manera destacada en la conducta imitativa. Los rasgos más influyentes son la edad, sexo, nivel intelectual características emocionales, y de personalidad. Algunos rasgos del modelo, tales como edad, sexo, poder social y situación socioeconómica constituyen variables determinantes en la eficacia del modelo.