Tema 2: Motivación en las Teorías de Aprendizaje PDF

Tema 2 LA MOTIVACIÓN EN LAS TEORÍAS DEL APRENDIZAJE 1.- Presentación 2.- Aprendizaje y conducta 2.1.- Condicionamiento clásico 2.1.1.- Conceptos básicos 2.1.2.- Programas en el condicionamiento clásico 2.2.- Condicionamiento operante 2.2.1.- Conceptos básicos 2.2.2.- Programas en el condicionamiento operante 3.- Determinantes de la motivación 3.1.- El contexto de interacción 3.1.1.- Estímulos antecedentes 3.1.2.- Estímulos consecuentes 3.1.3.- La respuesta 3.2.- Otros motivos 4.- La conducta de elección: la ley de igualación 5.- Otros aspectos de la motivación: la extinción Referencias 1 Tema 2 La motivación en las teorías del aprendizaje. 2 Tema 2 La motivación en las teorías del aprendizaje. 1.- Presentación Se pretende realizar un acercamiento a las teorías del aprendizaje y cómo desde éstas se ha abordado la motivación o la conducta motivada a partir del análisis de la relaciones contingenciales que se establecen en la interacción del organismo con el medio ambiente en el que se desarrolla. No se abordaran los modelos cognitivos que han surgido desde los teóricos del aprendizaje (Dickinson, etc…) ya que serán tratados en el capítulo correspondiente a los acercamientos de tales características. Desde el análisis de la conducta se realiza una aproximación a ésta, y a sus causas, mediante la comprensión de los factores contextuales presentes antes, durante y después de la emisión conductual; de igual forma, se entiende que ésta y aquéllos mantienen una perspectiva funcional que marca el desarrollo de las mismas relaciones. En los primeros años no era frecuente leer trabajos sobre motivación desde la óptica skinneriana. Sin embargo, sí era posible entender que al desarrollar modelos que relacionasen al organismo con el ambiente, éstos nos permitirían considerar la posibilidad de predecir y por tanto intervenir sobre la ejecución de una u otra conducta. En última instancia se mantendría el mismo objetivo de aquellos que sí hablaban, de una u otra manera, sobre motivación, que no era otro que explicar por qué se realiza una conducta en una situación concreta. El capítulo se organiza en cinco apartados, partiendo de una breve introducción a los paradigmas de aprendizaje, tanto clásico como operante, que formarán la base del análisis posterior. Se continuará con la presentación de los factores determinantes de la conducta, de la motivación, y estos factores serán analizados en función de su contextualización temporal con respecto a la respuesta presentada por el sujeto. En el cuarto de los apartados, se presenta una forma de analizar la elección conductual mediante la ley de igualación. Por último y para finalizar, se introduce un aspecto de la motivación, como es la extinción que pudiera dar cuenta de los factores y mecanismos que dan lugar a la eliminación de una respuesta; hablamos de los procesos de extinción que vendrían a responder a la pregunta de por qué se desmotiva un sujeto. 2.- Aprendizaje y conducta En el tema introductorio ya se planteó cuál ha venido a considerarse como el objeto de estudio de la psicología. La conducta toma relevancia por el abanico de posibilidades heurísticas que establece a partir de su observación. Pero al hablar de conducta también es inevitable hacer referencia al aprendizaje; aquélla no puede ser entendida sin éste, son por definición inseparables. El aprendizaje, según se considere, permite o es la variabilidad y la amplia diversidad conductual e interactiva en la adaptación del organismo al contexto estimular. El aprendizaje presenta una importancia destacada en el proceso evolutivo de las especies al complementarse, en muchas de ellas, con las respuestas innatas y así favorecer la adaptación y supervivencia de las mismas. Entre los beneficios que pudieran destacarse de este proceso señalamos el de ser un recurso valioso cuando hay la probabilidad de un cambio repentino en las condiciones ambientales. Por tanto, puede afirmarse que es un recurso de importancia destacada para la adaptación de las especies a esa variabilidad del entorno, haciendo que el animal sea un ser flexible 3 Tema 2 La motivación en las teorías del aprendizaje. en su respuesta al medio. Entendiendo la flexibilidad como un subproducto de la selección de rasgos específicos, en lugar de entenderlo como la evolución de algún tipo de inteligencia general. Junto a los beneficios que se nos muestran del aprendizaje, éste también presenta una serie de costes (Tarpy, 2000). Entre ellos ha de considerarse que si la adaptación dependiese sólo del aprendizaje habría períodos donde el animal no tendría la capacidad de adaptación. Por otro lado, si la conducta del organismo dependiese totalmente del adiestramiento paterno el tiempo y la energía invertida en uno solo de los descendientes harían imposible la cría de camadas amplias. Si el aprendizaje debiera aplicarse a todo el repertorio de manifestaciones motoras del organismo en su entorno (vg. la reproducción) las especies podrían no sobrevivir lo suficiente hasta aprenderlas. Poseer la capacidad de aprender significaría que un animal habría de disfrutar de una mayor complejidad neurológica. Una especie no podría desarrollar un cerebro grande y complejo capaz de aprender sin incurrir también en algunos costes biológicos. Por último, poseer la capacidad de aprendizaje implicaría que si éste fallara, el animal se vería sin recursos alternativos. El estudio de la conducta, y consecuentemente del aprendizaje, toma importancia a partir de los trabajos del fisiólogo ruso Ivan Petróvich Pavlov (1849- 1936), quien establece las bases para una extensa y fructífera investigación sobre el proceso asociativo (condicionamiento clásico). Éste se encontraba estudiando las reacciones digestivas en perros cuando descubrió el condicionamiento. La idea central, de los trabajos de este premio nobel -1904-, puede resumirse en que mediante el condicionamiento se llega a elicitar una respuesta ante un estímulo inicialmente neutro y que anterioridad no presentaba dicha función. Aquí, el organismo reacciona a la asociación de dos estímulos ambientales; puede decirse que la respuesta es elicitada por dicha asociación. Posteriormente, el interés que John Broadus Watson (1878-1958) mostró por los trabajos de Pavlov y los experimentos de Edward Lee Thorndike (1874-1949) vino a definir las bases de lo que se ha dado en llamar las teorías conductistas. Es Burrhus Frederic Skinner (1904-1990) quien desarrolla un procedimiento de aprendizaje conocido como instrumental u operante; donde la ley del efecto toma un papel crucial en el modelo. Desde un punto de vista formal, el condicionamiento instrumental se produce cuando el resultado es contingente respecto a la conducta del sujeto; aquí, el organismo manipula los estímulos ambientales mediante sus respuestas. En el estudio del aprendizaje, como en el de otros muchos tópicos presentes en la psicología, se ha llamado la atención del riesgo que se corre, por parte de la ciencia psicológica, al aceptarse tal y como se presentan los términos -y su significado- procedentes del lenguaje popular no científico o técnico (Ribes, 1985). Pérez y Caracuel (1997), siguiendo a Ribes (o.c), analizan las repercusiones que tiene el asumir de forma acrítica la concepción popular sobre el aprendizaje y cómo ello ha producido unos efectos de confusión conceptual y callejones teóricos que no muestran una salida (Ribes, 1990). Diferencian dos perspectivas en el uso del término aprendizaje desde una concepción no técnica y en muchos casos asumidas como tales. Uno, como referente a resultados o logros, como conducta que satisface unos criterios. Se considera que el aprendizaje ha tenido lugar cuando la conducta alcanza un determinado nivel de eficacia. En la segunda perspectiva se considera al aprendizaje como una capacidad, como una tendencia a “ocuparse en ciertas conductas dada su ocurrencia en el pasado bajo circunstancias similares” (Ribes, 1990, pág, 365). Es esta última opción como ha sido incorporado a la psicología y poder entenderla como categoría de proceso, siendo éste el responsable del cambio que 4 Tema 2 La motivación en las teorías del aprendizaje. puede observarse y constituyen el aprendizaje (Pérez y Caracuel, 1997). Estos autores entienden que la consideración de aprendizaje como cambio implica buscar los contenidos de ese cambio, las formas de aprender o los momentos en que se producen dichos cambios. Ahora bien, no hace falta indagar en esta dirección si partimos de considerar el cambio que se produce durante el aprendizaje como cambios asociados a cualquier comportamiento pero que no pueden identificarse ni con el aprendizaje ni con las causas del aprendizaje (Riera, 1985). Para Ribes (1990) aprender consiste en satisfacer un criterio en términos de efectos, resultados o logros de conducta y ser capaz en el futuro de hacer lo mismo. En este contexto, habría que matizar alguna diferencia entre aprendizaje y aprender. Aprendizaje haría referencia a procedimiento y a logro, mientras que aprender lo haría a tarea y a proceso (Pérez y Caracuel, 1997). Entendiendo que aprender, como proceso, aludiría a la forma en que se van estableciendo nuevas relaciones entre acciones de los sistemas reactivos y algunas características estimulares. Para comprender cómo desde las teorías del aprendizaje se ha abordado el estudio de la motivación o, más exactamente, de los factores que facilitan o dificultan el desarrollo de una conducta en unas circunstancias concretas, han de manejarse, al menos de forma básica, una serie de conceptos que permitirán comprender posteriormente la perspectiva epistemológica y metodológica que desde el paradigma conductual se presenta. Por ello, en los dos próximos apartados presentaremos brevemente, los conceptos y programas fundamentales, tanto del condicionamiento clásico como del operante. 2.1.- Condicionamiento clásico En 1904, Pavlov analizaba procesos implicados en la digestión cuando pudo observar cómo el animal experimental (un perro atado a un arnés) comenzaba a salivar en los momentos en que el experimentador hacía acto de presencia en la misma sala donde se desarrollaba el estudio. Ante esta situación, Pavlov concluyó la existencia de dos clases de reflejos: los fisiológicos o innatos y los que se creaban como fruto de la experiencia del individuo (a los que denominó psíquicos o condicionados). Posteriormente, en 1913, el neurólogo ruso Vladímir Bechterev (1857- 1927), realiza un experimento semejante a los de Pavlov, pero utilizando un estímulo aversivo para el organismo (una descarga eléctrica en una pata). Los resultados fueron análogos a los de Pavlov: el organismo aprendía a retirar (contraer) la pata ante la sola presencia del sonido. Como ya se comentó, en el condicionamiento clásico (CC) el organismo responde a la asociación de dos estímulos ambientales; él no manipula los elementos contextuales. Básicamente puede afirmarse que el CC es un procedimiento por el cual se administra de forma reiterada a un organismo un estímulo neutro seguido de un estímulo con importancia biológica para el mismo. Tras dicha situación es posible comprobar que la respuesta dada ante el estímulo biológicamente significativo ahora es elicitada ante la presencia del estímulo que hemos denominado como neutro. Básicamente, esta idea es el desarrollo del concepto que subyacía en el empirismo inglés cuando se afirmaba que si experimentamos dos sensaciones conjuntamente y repetidas veces, las reacciones a estas sensaciones se asocian de tal modo que, cuando se presenta el primer estímulo o sensación, provoca el recuerdo del estímulo asociado. Dicho de otro modo, la ley de la contigüidad nos viene a afirmar, según Hume (1711-1776), “que una idea puede desencadenar el recuerdo de otra si las impresiones en las que se basan ambas ideas han sido experimentadas de forma 5 Tema 2 La motivación en las teorías del aprendizaje. contigua”. Junto a ello, y como regla secundaria, Hume destaca la ley de causa y efecto que nos viene a indicar que si dos acontecimientos se presentan de manera contigua en el espacio y en el tiempo, precediendo siempre uno de los acontecimientos al otro, la persona llegará a considerar al primero de los estímulos presentados como causa del segundo de ellos. El experimento típico y clásico de Pavlov venía a consistir en que, tras un período de privación de alimento, se sujetaba a un perro a un arnés y se le presentaban dos estímulos -el sonido de un metrónomo y una dosis de comida en polvo-. El primero de los estímulos (sonido del metrónomo) provocaba una reacción de orientación, sin capacidad de provocar salivación. Sin embargo, el segundo de los estímulos sí hacía salivar al animal. Después de la presentación repetida de ambos estímulos el perro comenzaba a mostrar indicios de salivación ante la presencia del sonido del metrónomo, cuando éste se presentaba de forma aislada. 2.1.1.- Conceptos básicos Como ya se ha comentado (aunque más adelante se presentarán algunas cuestiones críticas con este planteamiento), el CC se produce al presentar dos estímulos contiguos temporalmente con independencia de la conducta del sujeto; se organiza sobre las relaciones estímulo–reforzador (E–R). Pero pasemos a analizar brevemente cada uno de los componentes implicados, o al menos los principales, en dicho procedimiento que se refleja en la figura 2.1. EN (metrónomo)…………………………………R.O “debe llevarse a cabo una habituación” EN…….…..…..EI (comida)………..RI (salivación) “se repite la asociación hasta que se comprueba que”: EC (metrónomo)………………………RC (salivación) Figura 2.1.- Esquema básico de condicionamiento clásico. Estímulo neutro (E.N).- estímulos que tras un proceso de habituación a su presentación no llegan a desencadenar respuestas en el organismo. Ej.- sonido de metrónomo, toque de campana, etc. Estímulo incondicionado (E.I).- estímulos que en determinadas condiciones son capaces de provocar una respuesta (R.I) en el sujeto. Ej.- comida, zumo de limón, pinchazo, descarga eléctrica, etc. Estímulo condicionado (E.C).- estímulo, inicialmente neutro, que tras su asociación con el E.I. adquiere ciertas similitudes en la capacidad para desencadenar una respuesta (R.C). Respuestas de orientación (R.O).- respuestas que da el organismo ante la presencia de un estímulo novedoso, neutro inicialmente, (E.N.) y que es sometida a habituación. Respuestas de incondicionada (R.I).- respuestas que en condiciones específicas siempre se dan si está presente el E.I. Ej. Salivación -ante comida, ante zumo de limón, etc-. Retirada del brazo (ante descarga eléctrica, pinchazo, etc.). 6 Tema 2 La motivación en las teorías del aprendizaje. Respuestas de condicionada (R.C).- respuesta desencadenada por un E.C. El condicionamiento clásico puede establecerse como un procedimiento de excitación condicionada o como un condicionamiento clásico inhibitorio. El primero de ellos, ocurre cuando la presentación del E.C. va seguida de la presentación del E.I..; es decir, el EC predice la presentación del EI. Mientras en el segundo, condicionamiento clásico inhibitorio, el E.C. no va seguido del E.I..; es decir, el E.C. predice la ausencia del E.I. El condicionamiento excitatorio puede, a su vez, agruparse como apetitivo o aversivo, en función de si el E.C. va seguido de un estímulo apetitivo (vg. comida) o un estímulo aversivo (vg. descarga eléctrica); viene a representarse como EC+. En este tipo de condicionamiento el E.C. y el E.I. se presentan conjuntamente y se mide después la ocurrencia positiva de la R.C. Sin embargo, existen formas indirectas de evaluar la existencia de una asociación. Un método es la técnica de la respuesta emocional condicionada (REC). Básicamente consiste en enseñar a un organismo a apretar una palanca, por ejemplo, para obtener un trozo de comida. A continuación, se lleva a cabo un procedimiento de condicionamiento aversivo, donde se presenta una E.C. (vg. tono de 30 seg.) seguido de un E.I. aversivo (vg. descarga eléctrica). Al principio el tono (E.C.) tiene escasa influencia en la conducta de apretar la palanca, pero tras su asociación con el E.I., éste es capaz de provocar diversas respuestas incondicionadas; llegándose a que cuando suena un tono posteriormente, el animal deja de pulsar la palanca bastante antes de administrar la descarga eléctrica. Cuanto mayor es la R.C. mayor es el efecto resultante en la presión de la palanca. En otras palabras, se utiliza como medidas de la fuerza del condicionamiento el grado de perturbación de la tasa de presión de la palanca por un E.C. que ha sido emparejado a una descarga eléctrica. La perturbación de la respuesta en un REC puede cuantificarse de la siguiente forma. Se cuenta el número de pulsaciones de la palanca ejecutadas durante la presentación del E.C. (período “B”), así como el número de pulsaciones de la palanca realizadas durante un período de igual de duración justo antes del inicio del E.C. (período “A”). Si el EC carece de significado estos valores (A y B) deberían ser aproximadamente iguales. Además, la razón del número de pulsaciones efectuadas durante la presentación del E.C. (B) en relación con el número total de pulsaciones (A + B), debería ser igual a 0,5. Sin embargo, si el E.C. posee fuerza asociativa y produce así la supresión de la respuesta de presión de la palanca, la razón disminuiría hasta 0 (el número de pulsaciones efectuadas durante la presentación del E.C. será menor que el número de pulsaciones antes del E.C.). Si medimos la fuerza de la perturbación de forma cuantitativa, la razón de la REC [B /(A + B)] expresa el grado en que el E.C. provoca una reacción aversiva. Otra prueba indirecta del condicionamiento pavloviano, donde también se utiliza un E.I. aversivo, es la aversión condicionada al sabor. Dicho procedimiento se produce cuando un sabor (E.C.) va seguido de la inyección de una sustancia venenosa (vg. cloruro de litio) que sería capaz de provocar molestias y náuseas. Al emparejar el sabor con el cloruro de litio se adquiere una R.C., haciendo que los sujetos eviten consumir sustancias con ese sabor en el futuro. En el condicionamiento clásico inhibitorio, se considera que un estímulo condicionado inhibitorio es aquel que, mediante el condicionamiento, adquiere propiedades antagónicas respecto a un estímulo condicionado excitatorio. El E.C. inhibitorio aminora, o anula, los procesos excitatorios. El estímulo inhibitorio viene a representarse como E.C.-. 7 Tema 2 La motivación en las teorías del aprendizaje. En algunos casos la inhibición condicionada puede evaluarse de forma directa por ejemplo mediante la prueba de la conducta dirigida, según la cual se considera el alejamiento físico del sujeto de, o la ausencia de contacto con, un E.C. inhibitorio. Un ejemplo de este procedimiento es el utilizado por Hearts y Franklin (1977) donde se examinó a unas palomas en una caja con un suelo basculante. La razón del tiempo invertido en el lado de la tecla iluminada en relación con el tiempo total en que las teclas estaban iluminadas ofrecía una medida de la aproximación-alejamiento (si la razón se aproxima a 0 indica un fuerte alejamiento). Ahora bien, la inhibición condicionada plantea un dilema interesante; puede existir una asociación entre un E.C.- y la ausencia de E.I., pero el animal no puede mostrar esa asociación al ejecutar una ausencia de conducta. Por tanto, ante esta situación, la estrategia habitual es utilizar alguna de las pruebas indirectas; como son: la prueba de sumación y la prueba del retraso del aprendizaje excitatorio. La prueba de sumación consiste en la presentación de dos estímulos, un E.C.+ y un E.C.-, de tal forma que ambos tendrán un efecto sumatorio; así se mide el efecto del E.C.+ en solitario y se comprueba la respuesta ante él cuando ha sido presentado conjuntamente con el E.C.-, calculándose posteriormente la diferencia. Por su parte, la prueba de retraso del aprendizaje excitatorio consiste en dos fases; en la primera de ellas, se utiliza un E.C. como estímulo condicionado inhibitorio. En la segunda de las fases se utiliza el E.C. en un experimento de condicionamiento excitatorio normal, es decir, se empareja con un E.I. Si el E.C. ha devenido de hecho inhibitorio en la fase 1, debería resultar más difícil de convertirlo en excitatorio en la segunda fase que un estímulo nuevo. En un proceso de condicionamiento clásico, como aprendizaje asociativo, cabe preguntarse ¿qué asociación se aprende?. Cuando se empareja un E.C. y un E.I., que desencadena una R.I. de forma refleja, el E.C. puede experimentar dos tipos de asociaciones: E-E y E-R. La tradición conductista mantenía que la asociación se producía entre el E.C. y la R.I., de tal manera que acaba provocando por sí mismo la conocida R.C. Sin embargo, existe cierta envidencia (v.g. precondicionamiento sensorial donde se asocian dos E.C. sin mediar el E.I.) que apunta en contra de dicha asociación, planteando lo que inicialmente defendía el propio Pavlov que la asociación resultante era de E-E. Por lo general, un estudio de condicionamiento incluye varias fases: Habituación.- se lleva a cabo con la finalidad de eliminar o reducir las R.O. que suelen presentarse ante un E.N. Básicamente consiste en la presentación repetida del E.N. Adquisición.- es el período donde el sujeto adquiere la asociación, la fuerza de la asociación dependerá de las particularidades del entrenamiento. Extinción.- en muchos experimentos se incluye una fase de extinción. La extinción tiene lugar cuando se presenta el E.C. sin la presencia del E.I. con el que se había condicionado. No se elimina la asociación, solamente resulta suprimida o inhibida. Desinhibición.- tiene lugar cuando se administra un nuevo estímulo junto con el E.C. durante la fase de extinción, lo cual provoca que el sujeto ejecute la R.C. inmediatamente. Recuperación espontánea.- la fuerza de la R.C. se recobra espontáneamente si tras un período de extinción le sigue un descanso, pero nunca recupera el nivel previo re R.C. Renovación de la R.C.- se manifiesta si la extinción del E.C. tiene lugar en un entorno distinto al utilizado en la fase de adquisición. Otros aspectos de interés que consideramos han de resaltarse son: 8 Tema 2 La motivación en las teorías del aprendizaje. Generalización.- Se refiere al hecho de que un organismo emita la R.C. ante estímulos algo diferentes del E.C. original (por ejemplo, si el E.C. es un tono de 200 Hz, un organismo puede emitir la R.C. ante un tono de 210 Hz). Se tratará siempre de una R. más débil que la que se da al E.C. original, y su magnitud será proporcional a la semejanza entre éste y el nuevo estímulo. Discriminación.- Se produce cuando, durante la adquisición, se presentan dos estímulos neutros semejantes (por ejemplo, dos luces de diferente intensidad) uno de los cuales se empareja con el E.I. (y es por tanto el E.C.) mientras el otro no se empareja con E.I. El organismo discrimina entre ambos estímulos, al dar la R.C. al verdadero E.C. y no darla al otro. En el condicionamiento clásico han de destacarse una seria de fenómenos que teórica e históricamente han mostrado ser relevantes, éstos son: Condicionamiento de segundo orden (o de orden superior).- se produce cuando un nuevo E.C. (EC2) se empareja con un E.C. previamente condicionado (EC1); de tal forma que el EC2 llega a provocar la R.C. Entre los elementos que le influyen a la fuerza del EC2: intervalo entre estímulos, la similitud entre EC1 y EC2, contigüidad espacial, magnitud del E.I., la consistencia del emparejamiento EC2-EC1, nivel de entrenamiento. Precondicionamiento sensorial.- se presentan dos E.N. emparejados y evidentemente no producen reacción alguna. Pero posteriormente, cuando uno de ellos se condiciona a un E.I., se demuestra que el otro también es capaz de provocar la R.C. Entre los factores que le influyen señalamos: intervalo entre estímulos, número de ensayos, estado motivacional. Modulación.- si se presenta un EC+ (excitatorio) seguido de un E.I. y posteriormente se presentan el EC+ junto a un EC- (inhibitorio) no seguido del E.I. se observa que se mantiene la respuesta ante el EC+ aisladamente y se reduce o se muestra muy escasa cuando se han presentado de forma conjunta al EC- (hablamos de inhibición condicionada). En una manipulación contraria si un EC+ (excitatorio) y un ECf (facilitador o modulador), presentados secuencialmente o simultáneamente van seguidos de un E.I. En otros ensayos, sólo se administra el EC+ pero no se presenta el E.I. En lugar de indicar la supresión del E.I. (como hace el inhibitorio condicionado) el ECf indica que el E.I. será presentado de hecho tras el EC+. El modulador o facilitador dispone la ocasión para el condicionamiento de otro estímulo. Entre los factores que le influyen señalamos que cuanto mayor sea el intervalo entre estímulos entre B y A, especialmente si B se produce antes del final de A, más poderoso. Cuanto más se aísla perceptivamente B del emparejamiento A-E.I. mejor funciona como modulador. Inhibición latente (o efecto de preexposición del E.C.).- se produce cuando los EECC se presentan de forma aislada y de manera previa al condicionamiento. Se lleva a cabo en tres fases: 1.- preexposición del E.C., 2.- asociación E.C.-E.I., condicionamiento y 3.- comprobación de la fuerza de la R.C. (que también puede realizarse en la fase 2), donde se observa que existe un retraso en el condicionamiento al E.C. debido a la preexposición previa. Entre las variables que le influyen: número de preexposiciones, duración del E.C., intensidad del E.C., atenuación de la inhibición latente mediante la presentación de dos E.C. en la preexposición o cambiando el contexto entre la fase de preexposición y la de entrenamiento. Bloqueo.- cuando se presentan dos E.C., como estímulo compuesto, los dos elementos debieran desarrollar una asociación similar con el E.I. Sin embargo, se observa que la fuerza asociativa a uno de ellos (EC2) dependerá de la intensidad con la que se ha presentado de forma previa y aisladamente el otro (EC1). 9 Tema 2 La motivación en las teorías del aprendizaje. Ensombrecimiento y supercondicionamiento.- el primero es un fenómeno similar al bloqueo. Se produce cuando un estímulo interfiere en el condicionamiento del otro con el que forma un compuesto. El E.C. más saliente ensombrece al menos saliente. En el supercondicionamiento en alguno de los ensayos son compuestos (EC1EC2-E.I.) mientras que otros ensayos conllevan la presentación de uno de los elementos (e.j. EC2), no emparejado con el E.I. El resultado es un aumento de la fuerza del EC1. Una vez presentados los principales elementos del CC, al menos de forma aproximativa, nos quedaría orientarnos en dos cuestiones más: ¿por qué se asocian los estímulos? y ¿cómo ha de organizarse la presentación de cada uno de los elementos destacados?. Con respecto a la primera de las preguntas, habría que hablar de dos principios: el de contigüidad -visto con anterioridad- y el de contingencia. El principio de contigüidad, defendido tanto por los empiristas ingleses como por el mismo Pavlov o por una gran parte de los psicólogos conductistas, nos viene a decir que dos eventos se asocian en la medida en que ocurren próximos temporalmente. Por su parte, el principio de contingencia, dado que el E.C. actuaría como señal del E.I. para que se produzca condicionamiento es fundamental la covariación entre ambos; nos estaría indicando que entre los dos estímulos han de producirse unas relaciones probabilísticas en su presentación, que evidentemente han de ser contiguos en el tiempo. Por último, y con respecto a la segunda de las preguntas, ésta será abordada con mayor detalle en el próximo apartado, donde se analizará la forma de organizar y presentar cada elemento estimular del CC; es decir, lo que ha venido en denominarse como programa de condicionamiento y las principales características que han de tener cada uno de ellos. 2.1.2.- Programas en el condicionamiento clásico Hemos referido en varias ocasiones la importancia de los principios de contigüidad y contingencia que han de presidir las relaciones entre los estímulos implicados en un condicionamiento. Ya Pavlov (1927 pág. 27) observó la necesaria disposición proactiva al señalar que “Además, no es suficiente que haya un solapamiento entre los dos estímulos; es igualmente necesario que el estímulo condicionado comience a operar antes de que el estímulo incondicionado entre en acción”. Resulta evidente comprender la necesaria utilidad adaptativa que presenta dicha relación; ya que si el animal ha de predecir la aparición en el contexto de los hechos destacados (vg. aparición de un E.I.) el E.C. debe anticipar al E.I. Los programas de condicionamiento, se han clasificado en: Condicionamiento de demora. El condicionamiento de demora puede presentarse en dos versiones: demora larga y demora breve. La diferencia entre uno y otro viene marcada por el tiempo que media entre la presentación del E.C. y la aparición del E.I. Así, en el condicionamiento de demora breve, el E.C. comienza antes que el E.I., y éste en menos de un minuto hace su aparición. El E.C. podría terminar su presentación al comienzo del E.I. o ir 10 Tema 2 La motivación en las teorías del aprendizaje. más allá de éste. En el condicionamiento de demora larga la demora del E.I. es mayor respecto al E.C. CONDICIONAMIENTO DE DEMORA BREVE EI EC Tiempo CONDICIONAMIENTO DE DEMORA LARGA EI EC Tiempo Condicionamiento de huella. El condicionamiento de huella es similar al de demora, salvo en el hecho de que la presentación del E.C. termina antes de la presentación del E.I. Es decir, existe un intervalo entre la presentación de ambos estímulos, pudiendo ser de huella larga o corta, dependiendo del tiempo que media entre la presentación de ambos estímulos. Viene a denominarse como de huella ya que en estos casos la asociación del E.I. debe realizarse con la huella del E.C., dado que éste ya no está presente CONDICIONAMIENTO DE HUELLA EI EC Tiempo Condicionamiento simultáneo. 11 Tema 2 La motivación en las teorías del aprendizaje. El E.C. y el E.I. comienzan exactamente a la vez; siendo lo más habitual que también terminen al mismo tiempo, si bien no es un aspecto necesario ni especialmente relevante. Se ha considerado que este tipo de condicionamiento ofrece una buena condición de control porque se genera una escasa respuesta condicionada que no puede competir con los métodos proactivos. CONDICIONAMIENTO SIMULTÁNEO EI EC Tiempo Condicionamiento hacia atrás o retroactivo. Este tipo de condicionamiento tiene lugar cuando el E.I. precede en su presentación al E.C. Puede decirse que este condicionamiento es un procedimiento de control deficiente porque produce condicionamiento excitatorio aunque sus efectos son complejos. CONDICIONAMIENTO HACIA ATRÁS O RETROACTIVO EI EC Tiempo Un procedimiento que es utilizado a menudo es el procedimiento de control aleatorio, en el que las presentaciones del E.C. y el E.I. se administran de modo aleatorio. Aquí es importante destacar que se supone la presentación del E.C. y el E.I., pero evita el establecimiento de una relación temporal consistente entre ellos. En este caso se permite observar que el condicionamiento será más fuerte cuando el E.C. sea capaz de predecir la presencia/ausencia del E.I. 2.2.- Condicionamiento operante 12 Tema 2 La motivación en las teorías del aprendizaje. En el condicionamiento operante o instrumental (CO), a diferencia del condicionamiento clásico, el sujeto manipula el ambiente en el que se encuentra; su acción cambia el entorno y estos cambios producen efectos sobre la misma conducta del organismo. Los orígenes del condicionamiento instrumental se vinculan estrechamente a los trabajos de Edward L. Thorndike (1874-1949) quien sistematizó y detalló los procedimientos que anteriormente se venían utilizando en, por ejemplo, la doma de animales, que ya de manera intuitiva manejaban el concepto básico del CO. De los trabajos que Thorndike vino a desarrollar, se formula la ley del efecto, donde se establece que si las conductas van seguidas de consecuencias satisfactorias tenderán a conectarse con la situación en la que se produjeron, de manera que cuando la situación se repita, será más probable que vuelva a tener lugar la misma conducta; la asociación entre estímulo y la respuesta se fortalece; mientras que si la respuesta es seguida de un suceso molesto la asociación estímulo y respuesta se debilita. Debe señalarse que en esta ley los animales aprenden una asociación entre la respuesta y los estímulos presentes cuando se ejecuta la respuesta. La consecuencia de la respuesta no es un elemento que forme parte de la asociación; siempre servirá para fortalecer o debilitar la asociación. Por tanto, el aprendizaje según la ley del efecto de Thorndike implica un aprendizaje E-R. El CO o instrumental se produce cuando el resultado, normalmente un E.I., es contingente respecto a la conducta del sujeto. Con esta base de partida es fácil comprender la importancia que el CO, junto al CC, presenta para la adaptación del organismo a un ambiente cambiante; así esta dependencia entre la respuesta del sujeto y el E.I. consecuente le permite esperar un hecho próximo donde la conducta del organismo es primordial. El incremento de la tasa o probabilidad de la respuesta en el curso del entrenamiento reconoce la importancia de la contingencia entre la respuesta del animal y sus consecuencias. A diferencia del CC, donde no se proporciona a los individuos la posibilidad para ajustar la conducta a sus consecuencias, el aprendizaje de una respuesta proporciona un mecanismo mediante el cual los animales pueden modificar y controlar adaptativamente el ambiente; es una forma de cambio conductual debido a la experiencia: la conducta es instrumento para obtener reforzadores y evitar castigos. A pesar de las divergencias, entre CC y CO, no está del todo aclarado si constituyen dos procesos de aprendizaje distintos o responden a un mismo conjunto de reglas asociativas básicas que se manifiestan de forma diferente en condiciones distintas. Si, como decimos, a Thorndike se le viene a considerar como el pionero en el CO, es a Watson (1878-1958) a quien se le debe lo que se ha denominado como revolución conductista o watsoniana. Éste rechazó otorgar alguna posibilidad al introspeccionismo, por carecer de rigor científico, y propuso como objeto de estudio en la psicología a la conducta manifiesta. Posteriormente, es a Skinner (1904-1990) a quien se le atribuyen las mayores contribuciones teóricas, instrumentales y metodológicas dentro del paradigma conductual. A Skinner le interesaba la conducta en sus aspectos funcionales y frente a los ensayos discretos, utilizados principalmente por Thorndike, comienza a considerar la posibilidad de utilizar la operante libre, consiguiendo así una mayor semejanza con la realidad natural (p.e. creando la caja de Skinner). 2.2.1.- Conceptos básicos 13 Tema 2 La motivación en las teorías del aprendizaje. Hay que comprender que en el terreno del condicionamiento operante se llevan a cabo análisis funcionales; donde la conducta realizada en un contexto ha de entenderse tomando como referentes a todos los elementos o factores que se observan implicados en la misma interacción. Por tanto, puede aseverarse que la conducta es una función de las variables contextuales y de las funciones que presentan en la interacción. Si en el CC la conducta es elicitada, provocada por la asociación E-E y/o E-R, en el caso del CO la conducta es emitida por el sujeto siguiendo un esquema R-Er. Al igual que lo hecho con el condicionamiento clásico presentamos esquemáticamente los principales elementos que han de reconocerse como relevantes para el control, y por tanto la predicción conductual. El condicionamiento operante es el proceso por el cual la probabilidad de una respuesta se ve afectada y modificada por las consecuencias de la misma. En él hay que saber que, las respuestas o la conducta, aún teniendo diferentes propiedades físicas (topografía de la respuesta) las funciones pueden ser las mismas. Se define la respuesta operante como la clase de respuesta que tiene el mismo efecto, la misma función. Por último, se entiende por reforzador al evento que, haciéndose contingente a la conducta, altera la probabilidad en su posterior emisión. Los reforzadores pueden agruparse en reforzadores primarios y reforzadores secundarios. Los R. primarios mantienen un carácter de incentivo innato; mientras los R. secundarios adquieren su valor de incentivo mediante la asociación con algún reforzador primario. Otros reforzadores que pueden mantener un carácter innato o aprendido son los reforzadores sociales cuyas propiedades se derivan de la conducta de otros miembros de la misma especie. Un hecho importante en la historia de los reforzadores es que si bien se venía a considerar que el reforzador debía ser un estímulo; es Premack (1965) quien observa que una actividad muy probable puede ser considerada como reforzador de otra actividad menos probable; a esta regla se la denominó como principio de Premack o principio de la probabilidad diferencial. Posteriormente Timberlake y Allison (1974) consideran que para poder utilizar una actividad como reforzador de otra no haría falta que la reforzante sea más probable que la instrumental; bastaría con que aquélla no pudiera realizarse en su frecuencia espontánea. La eficacia de los refuerzos vendrá determinada por una serie de parámetros, como son: la cantidad y la calidad del reforzador, su demora en la presentación, la motivación o privación en el sujeto. La eficacia mantiene una relación directa con la cantidad y la calidad de los reforzadores; ahora bien la influencia de la cantidad va a depender de la historia de reforzamiento previo. Con la demora el valor del reforzador mantiene una relación inversa, a menor demora mayor valor o efecto tendrá el reforzador, junto al hecho de facilitar la asociación respuesta-reforzador. Por último, la motivación, o el estado de privación en el que se encuentra el sujeto, nos viene a indicar que a mayor nivel de impulso, en principio, más efectivo resulta el refuerzo, sin embargo, en esta consideración habría que realizar algunos matices, que serán planteadas en próximos apartados. Los términos utilizados en el CO son generalmente los mismos a los considerados en el CC; si bien con algunos matices diferenciales. Así, por estímulos incondicionados se entiende que son aquellos que vienen a seguir a la respuesta dada por el sujeto. Los estímulos condicionados utilizados en el CO cumplen una función muy diferente a la realizada en el CC. Así, un E.N. que nos viene a indicar cuándo una 14 Tema 2 La motivación en las teorías del aprendizaje. respuesta puede conducir como mucha probabilidad a una consecuencia determinada le llamamos estímulo discriminativo (Ed o Ed+) mientras que si nos está indicando la ausencia o la baja probabilidad de ocurrencia de la misma hacemos referencia a estímulo delta (E∆ o Ed-). Por otra parte, la respuesta pudiera ser analizada como respuesta incondicionada (R.I.) que vendría determinada por estímulo incondicionado presente (se saliva si el E.I. es comida) y la reacción condicional, llamada a menudo respuesta instrumental es bastante distinta a la respuesta incondicionada. La respuesta instrumental es en la mayoría de los experimentos una respuesta motora arbitraria (vg. presionar una palanca....). En el proceso de condicionamiento, que viene a realizarse en base a lo que se ha denominado como ensayo, hay que tener presente que el: Ensayo.- es el tiempo experimental, que comienza con la emisión de la respuesta operante y termina en el momento en el que se administra el reforzador. Intervalo entre ensayos (I.E.E.).- tiempo, no experimental, que media entre la finalización de un ensayo y el comienzo del siguiente. Ensayos discretos.- método en el que el sujeto sólo puede realizar una respuesta por ensayo. La frecuencia y el momento es decidido por el experimentador y no por el sujeto experimental (vg. corredor...). Ensayos de operante libre.- método por el cual el sujeto puede realizar una o más respuestas por ensayos. La frecuencia y el momento son decididos por el sujeto experimental y no por el experimentador (vg. Caja Skinner). Registro acumulativo.- instrumento gráfico para tomar la medida de la tasa de conducta a lo largo del tiempo. Tasa de respuesta.- número de respuestas por unidad de tiempo. Por otro lado, las fases de un proceso de aprendizaje instrumental son esencialmente las mismas que las vistas en un proceso de CC. Éstas son: Adquisición.- en esta fase se adquiere la reacción condicionada, a medida que aumenta el entrenamiento se incrementa la tasa de respuesta. La fuerza de la respuesta se mide en función del aumento en la probabilidad o en la frecuencia de la conducta, una disminución en los errores cometidos, un decremento en el tiempo invertido en completar la respuesta, un aumento del vigor o de la velocidad de la conducta. Extinción.- proceso que implica eliminar o impedir la aparición de las consecuencias que se presentaban tras la conducta o respuesta y que la mantenían. El resultado es una disminución de la fuerza o reducción en la ejecución de la respuesta. Recuperación espontánea.- la extinción no llega a eliminar totalmente la respuesta; es más, si se recibe un intervalo de descanso tras la extinción se produce una cierta recuperación de la respuesta. Pasemos ahora, a la revisión de los distintos tipos de condicionamiento instrumental y para ello debe diferenciarse entre aquellos estímulos hacia los que el sujeto tiende a aproximarse (estímulos apetitivos) y aquellos otros a los que el sujeto tiende a evitar o alejarse de ellos (estímulos aversivos). Así, cuando la respuesta instrumental permite acceder al estímulos (apetitivo o aversivo) hablamos que se ha establecido una contingencia positiva. Al referirnos a las contingencias hay que recordar que éstas vienen definidas como probabilidades de darse o no el reforzador cuando se ha realizado o no la respuesta operante; así la contingencia R-Er positiva vendría reflejada como la siguiente ecuación: [p(Er/R) > p(Er/No R)]; p1 > p2 15 Tema 2 La motivación en las teorías del aprendizaje. Mientras que si la respuesta facilita la retirada o alejamiento del estímulo entonces decimos que se ha desarrollado una contingencia negativa. Que según las probabilidades referidas quedaría indicada como: [p(Er/R) < p(Er/No R)]; p1 < p2 Por último, la acontingencia o contingencia cero; viene a indicarnos que la realización o no de la conducta y la presencia o no del Er se muestran como independientes, siendo su formulación probabilística como se indica: [p(Er/R) = p(Er/No R)]; p1 = p2 Considerando el tipo de contingencia podemos hablar que, como contingencia positiva, tendríamos al: Reforzamiento positivo.- cuando la respuesta facilita la aparición de un estímulo apetitivo o reforzador que hace aumentar la tasa de respuesta. Castigo positivo.- cuando la respuesta facilita la aparición de un estímulo aversivo que como consecuencia reduce o suprime la tasa de respuesta. Por su parte, como contingencia negativa tendríamos al: Reforzamiento negativo.- cuando la respuesta permite retirar (escapar) o prevenir (evitar) un estímulo aversivo; teniendo como resultado un aumento en la tasa de respuesta. Entrenamiento de omisión.- cuando la respuesta instrumental previene la presentación de un estímulo apetitivo. Estos procedimientos también se han denominado como reforzamiento diferencial de otras conductas (R.D.O.) y se refleja el hecho de que el individuo recibe un estímulo apetitivo periódicamente a condición de que se dedique a realizar otra conducta diferente de la respuesta especificada por el procedimiento. El entrenamiento de omisión también ha sido denominado como castigo negativo y su resultado es una disminución en la tasa de respuesta. Si en los orígenes del conductismo se planteaba que basándose en las relaciones contingenciales era posible desarrollar modificaciones en cualquier conducta, pronto pudo comprobarse que esta modificabilidad presentaba ciertas limitaciones (Pérez, Gutiérrez, García y Gómez, 2005) que vendrían a depender de la: Pertinencia de los eventos.- ciertas respuestas tienen una relación natural con ciertos estímulos consecuentes a causa de la historia evolutiva de la especie del sujeto. Intrusión de respuestas incompatibles, clásicamente condicionadas, en el transcurso de un condicionamiento operante.- las respuestas extras que se desarrollan en determinadas situaciones de condicionamiento son resultado de una emisión natural ante dichas situaciones, interfiriendo el condicionamiento instrumental que se pretendía al inicio (vg. en cerdos, al reforzarlos con comida por una determinada operante, pueden aparecer conductas instintivas o naturales tras la adquisición de la comida). Motivación del sujeto.- para llevar a cabo un condicionamiento operante es necesario un cierto estado motivacional (privación del reforzador) y éste puede interferir en el desarrollo del condicionamiento (vg. en hámster al privarles de comida disminuyen las conductas de autocuidado). 16 Tema 2 La motivación en las teorías del aprendizaje. Línea base o nivel operante.- sería la tasa de una respuesta antes de que se introduzca el procedimiento de condicionamiento clásico. En el CC nos encontrábamos con dos fenómenos, generalización vs discriminación, de máxima importancia en la adaptación de las especies al entorno contextual; en el CO vienen a presentarse estos fenómenos de igual manera. De otra forma, podríamos hablar de control por el estimulo de la conducta. El control por estímulos en el CO se demuestra desde el momento en que la presencia de diferentes estímulos cambia la probabilidad de emisión de diferentes respuestas. Es decir, la conducta está controlada por los estímulos. Discriminación.- si el sujeto responde de manera diferencial ante dos estímulos. Generalización.- fenómeno opuesto a la discriminación; es decir, el sujeto responde con el mismo nivel de una conducta en presencia de estímulos diferentes. Gradiente de generalización.- representación gráfica entre la tasa de respuesta a los estímulos generalizados y la similitud entre estos estímulos y el estímulo usado en el entrenamiento. Una vez descritos los principales conceptos que se hacen necesarios para comprender o al menos aproximarnos al condicionamiento operante, pasaremos, en el próximo apartado a dejar constancia, de forma esquemática, de la relación temporo- espacial en la que se establecen dichos componentes para instaurar o modificar un determinado comportamiento. Con ello hacemos referencia a los programas de condicionamiento. 2.2.2.- Programas en el condicionamiento operante Podemos entender por programa de reforzamiento a la pauta o regla que determina cómo y cuándo la emisión de una respuesta irá seguida de un reforzador; determinando tanto la forma en la que se aprende una respuesta como la forma en la que se mantiene (Pérez, Gutiérrez, García y Gómez, 2005). Los programas de reforzamiento mantienen una relevancia ya que son los que van a definir a qué patrón de respuesta concreto se llega; es decir, van a permitir predecir una determinada distribución temporal de la respuesta y una diferente tasa en la respuesta. Los programas de reforzamiento son factibles de clasificarse en función de diversos criterios. Una primera diferenciación se basaría en la frecuencia con la que se entregan los reforzadores de forma contingente a la respuesta; así, si los reforzadores se presentan siempre que se ha dado la respuesta estaríamos hablando de programas de reforzamiento continuo frente a los que no siempre la respuesta va seguida del reforzador que se denominan programas de reforzamiento parcial. Dentro de cada uno de ellos podemos establecer el criterio de reforzar en función del número de respuestas dadas o en función del tiempo que ha transcurrido desde la última presentación del reforzador. En el primer caso hablamos de programas de razón y en el segundo de programas de intervalo. Junto a estos dos tipos de programas podría ser posible que el reforzador se entregara en función del tiempo que ha transcurrido desde la última respuesta y entonces hablaríamos de programas de tasa. Tanto al tomar como criterios para obtener el reforzador el tiempo transcurrido o el número de respuestas dadas, éstos pueden ser estables o variables (para lo que se calcularía una media) a lo largo de los diversos ensayos. Ante ello, estaríamos hablando de programa fijo o programa variable. 17 Tema 2 La motivación en las teorías del aprendizaje. También se hace necesario considerar que los programas de reforzamiento pueden plantearse de uno o más componentes; hablamos entonces de programas simples o programas compuestos. De manera esquemática los programas pudieran organizarse como se indica (figura 2.2). PROGRAMAS DE REFORZAMIENTO 1.- CONTINUO 2.- INTERMITENTE 2.1.- SIMPLE RAZÓN FIJO.................VARIABLE INTERVALO FIJO.................VARIABLE TASA RDA.................RDB 2.2.- COMPUESTO ALTERNANTES MIXTO.............MÚLTIPLE SECUENCIALES TÁNDEM.........ENCADENADO CONCURRENTES Figura 2.2.- Tipos de programas de reforzamiento. Como se ha comentado, los programas de reforzamiento continuo, donde siempre se da el reforzador si se ha dado la respuesta, se vienen a representar como RF1 (razón fija 1), son los más adecuados para comenzar la instauración de una nueva conducta. Con ellos se logran tasas constantes y moderadas pero con pausas breves e impredecibles. Por lo que a los programas intermitentes se refiere, se ha mencionado que un tipo de ellos son los simples, y dentro de estos pudiéramos encontrarnos con los de razón o intervalo. Los programas intermitentes simples de razón son aquellos donde la obtención del reforzamiento depende del número de respuestas dadas por el sujeto; una vez dada la respuesta que cumple el criterio se presenta el reforzador. Estos programas pueden ser en base a un número fijo de respuestas, programas de razón fija (vg. RF7: razón fija siete: es decir, contingente a la séptima respuesta dada se presenta el reforzador), o sobre la base de un número variable de respuestas, programa de razón variable (vg. RV8: razón variable ocho: por término medio se presenta el reforzador cada ocho respuestas -debe señalarse que en el caso del programa de razón variable el valor indicado es una media del número de respuestas necesarias para ser reforzado-). Los programas de razón suelen presentar una relación inversa entre el criterio establecido y la tasa de respuesta. Por su lado, los programas de razón fija presentan un patrón donde tras la presentación del reforzador se produce una pausa, siendo mayor esta pausa cuanto aumenta la razón establecida o la saciación del sujeto. Las tasas son constantes y altas. Los programas de razón variable son más estables y los que más se ajustan a las situaciones naturales; de igual manera presentan una tasa alta y constante; con pausas que son menos probables que en el caso anterior. 18 Tema 2 La motivación en las teorías del aprendizaje. Por otra parte, los programas basados en el periodo temporal entre reforzadores, dependen tanto del tiempo transcurrido como de la emisión de la respuesta y vienen a denominarse como programas de intervalo. Éstos pudieran ser programas de intervalo fijo, donde una vez cumplido el criterio temporal se recibiría el reforzamiento si se ha emitido la respuesta instrumental (vg. IF 10: intervalo fijo diez - segundos, minutos etc...-) o programas de intervalo variables (IV5: intervalo variable cinco: se presenta el reforzador tras la respuesta dada en un periodo temporal de cinco -debe señalarse que en el valor indicado es una media del tiempo necesarias para ser reforzado-). Hay que considerar que a medida que se aumenta el tiempo del intervalo se produce una disminución de la tasa de respuesta, ya sea en un intervalo fijo o variable. Por otro lado, los programas de intervalo fijo producen un registro festoneado característico, donde se produce una pausa un incremento a medida que va pasando el tiempo acercándose nuevamente el reforzador. Mientras que el programa de intervalo variable mantiene un tipo de tasa que suele presentarse como moderada, constante y estable, sin pausa. De manera resumida puede decirse que los programas fijos producen pausas post-reforzamiento, los programas variables producen tasas más altas que los fijos y los programas de razón producen tasas más altas que los programas de intervalo. Por último, dentro de los programas que hemos denominados como simples tenemos aquellos programas donde se requiere que los sujetos respondan en base a una determinada tasa para poder obtener un reforzador. Así, tendríamos lo que se denomina como reforzamiento diferencial de tasa alta (RDA) donde se pide al sujeto que tras un periodo de tiempo máximo de tiempo entre respuestas (TIR) emita la respuesta que será reforzada. Es decir, el sujeto ha de emitir la respuesta antes de transcurrido el tiempo tras la respuesta anterior (RDA: TIR 8’’: debe emitir la respuesta una vez transcurridos los ochos segundos tras la última respuesta, nunca antes). Con estos programas RDA se promueven tasas altas de respuesta, mientras que con los programas RDB se favorece la instauración de tasas bajas y estables de respuestas. Cuando dos o más programas simples se enlazan constituyen un programa de reforzamiento compuesto. El tipo de programa compuesto del que se hable dependerá de cuándo se presentan el reforzador y de si los programas simples se presentan con o sin estímulo discriminativo. Por tanto nos podemos encontrar con: Programa de reforzamiento alternante: el reforzador se presenta una vez cumplido el criterio del programa que esta actuando; por tanto, tras cada programa simple. El intercambio de los programas simples se lleva a cabo sin un orden establecido previamente. Cuando el cambio se produce con la presencia de un estímulo discriminativo, hablamos de un programa múltiple, en caso de no existir ese estímulo discriminativo estaríamos hablando de un programa mixto. Programa de reforzamiento secuenciales: el reforzador se presenta una vez se haya cumplido y finalizado cada uno de los diversos programas simples. La presentación de los programas simples se mantiene en un mismo orden y 19 Tema 2 La motivación en las teorías del aprendizaje. cuando el cambio de uno a otro se lleva a cabo con la presencia de un estímulo discriminativo hablamos entonces de un programa encadenado. Mientras que si no va precedido de un estímulo discriminativo hablaríamos de un programa tándem. PROGRAMA PRESENTACIÓN Er CON Ed SIN Ed ALTERNANTE FINAL DE MÚLTIPLE MIXTO COMPONENTES SECUENCIAL FINAL SECUENCIA ENCADENADOS TÁNDEM Programa de reforzamiento concurrente: en este tipo de programas se presenta la posibilidad de tener disponibles al mismo tiempo todos los programas. Por tanto el sujeto podrá pasar de uno a otro según su elección. El condicionamiento instrumental se ve afectado por muy diversas variables entre las que señalamos, los ya mencionados programas de reforzamiento, las características de los reforzadores y de las respuestas (Tarpy, 2000). De las características de los reforzadores podemos señalar a la magnitud del reforzador, donde es posible observar que a mayor recompensa mejor es el aprendizaje; si bien existe cierta controversia en torno a ello ya que se ha podido comprobar que el aprendizaje también se relacionaba con la accesibilidad (breve o no) a los reforzadores (Collier, Johnson, Hill y Kaufman, 1986). La inmediatez de la recompensa resulta, al igual que en el CC, de importancia ya que a medida que aumenta la demora en la entrega del reforzador la ejecución disminuye; la demora interfiere en la adquisición de nuevas conductas y no sólo de las ya establecidas. La naturaleza del reforzador ya sea éste sensorial, donde se comprobó que se produce principalmente cuando los animales no han experimentado de forma reciente un patrón de privación sensorial; si no ha sido así el efecto del reforzamiento se reduce considerablemente. Los olores naturales pueden ser utilizados como un potente reforzador o como castigo. Por último, el reforzamiento social se ha comprobado que no sólo aumentan el nivel general de estimulación sensorial, si no que son reforzadores por sí mismos. Por su lado, las características de la respuesta es otro de los factores que determinan al aprendizaje instrumental. La respuesta en el CO es definida por el experimentador, a diferencia del CC. En este terreno, se ha podido detallar que no todas las respuestas son condicionables en la misma medida, aun utilizando el reforzador adecuado. Así, se llega a determinar la influencia de la relevancia ecológica de la conducta que se pretende reforzar. Como ejemplo podemos referirnos a los patrones de respuesta que son relevantes para el animal, y efectuados antes de la comida, son más sensibles a los efectos de la recompensa de la comida que los patrones que no lo son. 3.- Determinantes de la motivación Analizar la motivación desde el modelo o los modelos basados en las teorías del aprendizaje implica cambiar alguna de las ideas que tradicionalmente se habían venido a considerar para definir y realizar cualquier aproximación a tal constructo. 20 Tema 2 La motivación en las teorías del aprendizaje. Tarpy (2000) nos indicaba que el grupo de teorías provenientes del análisis de la conducta se centran no tanto en procesos cognitivos o asociaciones internas, sino en las condiciones ambientales que regulan la conducta; afirmándose que la conducta es seleccionada y reforzada por las consecuencias contextuales de una determinada acción. Si como se ha señalado (Kantor, 1967; Ribes, 1985) aprender consiste en una diferenciación conductual, en la ampliación de actos de relación conductual, sin verse en la necesidad de tener que suponer ninguna entidad interna que intervenga en la relación; puede afirmarse que el desarrollo funcional de las relaciones entre el organismo y su contexto son las que van a determinar y explicar la acción psicológica. Por tanto, la motivación no debe considerarse como una construcción hipotética explicativa de carácter interno, como causa de la conducta; sino más bien ha de entenderse como la confluencia de determinadas variables y condiciones ambientales que facilitan la acción conductual en contextos específicos, ya sea incrementando su frecuencia, reduciéndola o cambiando la direccionalidad en la ejecución psicológica. Así pues, analizar la motivación desde los principios básicos del aprendizaje es analizar las variables ambientales que se relacionan e interactúan con la conducta; por tanto, el análisis motivacional será considerar el carácter funcional de los factores que afectan al poder reforzante de los estímulos (Pérez y Caracuel, 1997). Desde el conductismo radical conceptos como el de pulsión apenas fueron tratados; ya que, como Skinner (1938) decía, medir la fuerza de la pulsión es medir la fuerza de la conducta. Sobre la base de esta idea, el conductismo centró su interés en las operaciones de privación y saciedad como operaciones definidoras de la pulsión o estado de necesidad fisiológico; ello implicaba que había tantas pulsiones como formas de privar a un organismo. Por tanto, podemos aumentar la probabilidad de que un organismo realice una conducta (vg. beber) llevándole a un determinado estado de privación. Como se viene a señalar (Pérez, Gutiérrez, García y Gómez, 2005 pág.117) es posible establecer una cadena causal de tres eslabones, por ejemplo en la conducta de beber: el primero sería la privación de agua (acción externa sobre el organismo), el segundo, sería la sed (estado interno) y el tercer eslabón sería la conducta de beber (acción externa del organismo). Considerar la sed como un factor explicativo conlleva una serie de problemáticas: 1.- No es observable directamente, sino que es una variable interviniente que debe ser inferida a partir del conocimiento de las otras dos. 2.- Aunque el estado interno de sed tenga propiedades fisiológicas, no puede resultar de utilidad al control de la conducta en el nivel de análisis psicológico si no conocemos la manera de alterarlo directamente. Sólo podemos manipular el primer eslabón de forma directa y el tercero a través de éste. Por tanto, y como se ha apuntado anteriormente, las variables independientes de las que la conducta es función están en el ambiente. Si se asume que la privación (privación agua) se relaciona causalmente con la necesidad (sed) y ésta con la conducta (beber) es posible relacionar funcionalmente la primera con la conducta. Skinner (1953) destacaba las relaciones entre la privación-saciedad y el reforzamiento operante en dos sentidos: 1.- el Er no sólo refuerza sino también sacia y 2.- el efecto de un reforzamiento operante sólo se observa si el organismo ha experimentado la privación adecuada. De esta forma el reforzamiento fortalece la conducta en un estado de privación determinado. Es decir, la emisión de las conductas que han sido fortalecidas por un reforzador variarán en función de la privación de ese reforzador (a mayor privación mayor probabilidad de ser reforzante p.e. si se refuerza estudiar permitiendo acceder a la consola, éste acceso será más reforzante cuanto mayor haya sido el tiempo que lleva sin jugar). 21 Tema 2 La motivación en las teorías del aprendizaje. Se considera que la motivación facilita el aprendizaje y la motivación suele inducirse como deprivación en los animales. Se ha distinguido dos tipos de motivación: primaria, referente a los aspectos fisiológicos y secundaria o aprendida. La teoría más importante de la motivación primaria es la teoría del impulso; siendo considerado éste como una variable interna del individuo, teniendo una doble implicación: su reducción es reforzante y su fuerza explicaría el nivel de ejecución. 3.1.- El contexto de interacción El análisis de la motivación, desde el paradigma conductual, se basa en la manipulación de las variables que se encuentran presentes en el contexto de interacción con el organismo. Ha de entenderse que el sujeto siempre se está comportando, no existe la no-conducta, y este comportamiento ha de definirse como una representación conceptual de un segmento de interacción del organismo en su medio ambiente (Ribes y López, 1985). Este campo interconductual está configurado como un sistema de relaciones recíprocas en las que pueden señalarse los siguientes factores: los límites del campo, los objetos de estímulo, los estímulos, la función del estímulo, el organismo, las respuestas, la función de respuesta, los medios de contacto, los factores situacionales y la historia interconductual (evolución del estímulo y biografía reactiva). Estos elementos como variables de un campo interconductual se integran funcionalmente en tres grupos de factores: los factores disposicionales, la función estímulo–respuesta y el medio de contacto. Por tanto, puede decirse que estudiar la motivación es estudiar todos los factores implicados en la aparición de una conducta. Así pues, el estudio de la motivación desde el análisis experimental del comportamiento es el análisis de los factores que afectan al poder reforzante de los estímulos, si bien otros factores que afectan a la respuesta en sí y a los estímulos control -Ed y E∆ - también poseen este carácter (Pérez y Caracuel, 1997). Para exponer los factores que determinan el poder reforzante de los estímulos seguiremos la clasificación realizada por Pérez y Caracuel (1997) quienes establecen como elementos destacados: los estímulos antecedentes, los estímulos consecuentes, las respuestas y otros motivos. 3.1.1.- Estímulos antecedentes Entre los factores que preceden a la emisión de la respuesta pueden establecerse características motivacionales que influyan de alguna forma en la conducta del sujeto. Ribes (1980) destaca que las propiedades de dichos factores pueden ser físicas o funcionales; y en función de ellas se especificarían tres parámetros: a) factores físicos y perceptivos, b) factores asociativos y de contingencia y c) factores culturales. A: Factores físicos y perceptivos.- aunque el valor del estímulo que antecede a una respuesta depende del tipo de contingencia que mantenga con los estímulos consecuentes, las características físicas de los mismos pueden modular las respuestas. La influencia que manifiestan puede ser variable y relativa, en función de 22 Tema 2 La motivación en las teorías del aprendizaje. dichas contingencias mencionadas. Entre los factores físicos que se han venido a señalar, destacamos: Intensidad y duración: son los factores más estudiados y aún no se dispone de resultados claros y concluyentes. En el CC la influencia de la intensidad sobre el E.I. es bastante clara, a mayor intensidad del E.I. mayor magnitud de la R.C., con respecto al E.C. no influye de igual manera llegando a producir efectos contradictorios. Como regla general, hay que decir que la intensidad y la duración de los estímulos han de alcanzar, por lo menos, el umbral perceptivo mínimo para que puedan existir reacciones por parte del organismo. Modalidad sensorial: no todos los animales responden de igual manera ante la presentación de un estímulo en una determinada modalidad sensorial, hay una cierta facilitación biológica para la receptividad estimular. Junto a ello, y para el sujeto humano, hay que tener presente la influencia cultural o de socialización como mediadores de la respuesta ante la presentación estimular en un determinado sentido. Otros aspectos perceptivos: junto a las características físicas de los estímulos hay que considerar la localizabilidad del estímulo frente a otros más difusos, el distanciamiento, la movilidad y la similitud (con el E.I./Er con el que se asocie) estas son variables que pueden modular las respuestas, principalmente en el CC; si bien también en el CO pudieran ser considerados. B: Factores asociativos y de contingencia: en este epígrafe ubican aquellas situaciones o características motivacionales derivadas del E.I./ErI con el que se asocia el E. precedente (E.C., Ed o E.). Los estímulos controladores son inicialmente neutros, es decir, su influencia sobre la conducta es derivada de las mismas propiedades fisico- químicas del estímulo; adquieren su valor a consecuencia de la inmersión de tal estímulo en una situación específica, donde se aparean a E.I./ErI. Así, un E. asociado a una situación de reforzamiento adquirirá propiedades que le definirán como Ed, mientras que si se asocia a la no presentación del E.I. pasará a denominarse y mantener propiedades de E∆. Un E. asociado a un E.I. podrá llegar a mantener propiedades de un E.C. excitatorio que provocara la R.C., mientras que si ha sido asociado a la ausencia del E.I., la no ocurrencia del E.I., mantendrá un carácter de E.C. inhibitorio. De igual manera, un mismo estímulo podrá provocar una respuesta u otra en función de con qué estímulo se le ha asociado. C: Factores culturales: a la hora de hablar sobre estos factores hay que tener presente que hacen mención principalmente al comportamiento humano, y vendrían a referirse a las propiedades motivacionales de los Es. que se deben a características anteriormente adquiridas en función de determinantes o condicionamientos culturales y que determinan un significado, valor, etc..(vg. el rojo indica peligro, el negro luto o duelo....). Un contexto donde es posible observar claramente estos factores es en el del lenguaje. Aquí, las letras, las palabras, las frases, etc., los signos de forma genérica no significan nada por sí mismos sino en cuanto que han sido asociados a consecuencias específicas que son transmitidos y reforzados. 3.1.2.- Estímulos consecuentes Siguiendo con estos mismos autores (Pérez y Caracuel, 1997) los diversos factores determinantes de los estímulos consecuentes a una respuesta dada por el 23 Tema 2 La motivación en las teorías del aprendizaje. organismo se pueden de organizar en función del tipo de consecuencia que ésta tenga, ya sea como estímulo reforzador positivo o como estímulo reforzador negativo. Es decir, estimulación a la cual el sujeto estará motivado para obtenerla o motivado para lograr eliminarla. Por otra parte, aún presentando cada parámetro y sus consecuencias de manera aislada hay que saber las derivaciones presentes en las diversas interacciones que pudieran darse entre ellos. A.- Parámetros que afectan a los Er+: un estímulo reforzador mantendrá mayor poder reforzante, por tanto tendrá más propiedades motivacionales, si están presentes una serie de condiciones relacionadas con el estímulo. Éstas se pueden agrupar en: privación, cantidad, duración, calidad, demora y el tipo de programa de reforzamiento. Privación: como norma general puede afirmarse que a mayor grado de privación se mantenga en el sujeto respecto a un estímulo (Er+), mayor sería el poder reforzante de ese estímulo; ya sea éste incondicionado o condicionado. En el caso de los estímulos generalizados hay que considerar ciertas matizaciones, ya que por definición son independientes del grado de privación (vg. el dinero). Cantidad (magnitud): en determinadas circunstancias se ha encontrado que a mayor cantidad del Er+ es mayor el grado de condicionamiento (vg. a igualdad de condiciones se toma la respuesta que aporte mayor beneficio). En esta situación hay que considerar el hecho de que la saciedad ocurrirá en un plazo de tiempo menor lo que puede llevar a un menor volumen de respuestas. Duración: la mayor o menor duración del Er+ influye en la respuesta que puede emitir el sujeto. Así, por ejemplo, en igualdad de condiciones o con mínimas variaciones en su precio, elegimos un artículo que presente una mayor vida en el uso. Calidad: la calidad es un parámetro que presenta ciertas peculiaridades a la hora de trabajar con él. En experimentación animal se maneja este factor como la cantidad de nutrientes por unidad de comida; sin embargo en humanos hay que tener presente otras variables que pueden estar afectándolo: sociales, culturales, etc. Demora: siempre se había considerado que a menor demora en la presentación del Er+ tras la emisión de la conducta mayor sería el poder motivante del mismo. Se ha entendido por demora aquel periodo temporal que media entre la respuesta y el inicio del Er+. Es cierto que se ha podido observar la capacidad de establecer contingencias entre la respuesta y la presentación del estímulo tras periodos de varias horas (García y Koelling, 1966). Programa de reforzamiento: ya hemos visto anteriormente la diversidad de programa existentes y cómo cada uno de ellos presentan unas pautas de conducta específicas. Junto a ello debe añadirse que cuando se habla de sujetos humanos estos efectos se ven mediados por otros factores de tipo cultural, social, etc. Si bien los programas continuos son los adecuados para iniciarse en la emisión de una conducta, su mantenimiento vendrá favorecido por los programas variables o intermitentes. De manera genérica puede decirse que a mayor facilidad en el cumplimiento del criterio de respuesta establecido en el programa mayor motivación tendrá el sujeto. Ahora bien, es posible encontrarnos que dicha facilidad pueda provocar un descenso 24 Tema 2 La motivación en las teorías del aprendizaje. motivacional en el caso de los humanos ya que se observa que cierto incremento gradual en la complejidad del criterio favorece la motivación. B.- Parámetros que afectan a los Er-: en estas condiciones de reforzamiento negativo el sujeto, estará motivado, llevará a cabo las conductas necesarias que permitan eliminar o al menos reducir la estimulación aversiva presentada. Entre los parámetros que se han indicado señalan: intensidad, duración, tiempo sin Er- tras la R., demora en el reforzamiento negativo, grado de reducción del Er- y programa de reforzamiento. Intensidad: de forma genérica puede afirmarse que cuanto mayor sea la estimulación aversiva presentada, más motivado estará el sujeto para emitir las conductas que permiten reducirla o eliminarla. Duración: a mayor duración en la presentación del Er- más motivado se estará para intentar eliminarlo. Como resulta obvio, la duración se ve en íntima relación con la intensidad. Tiempo sin Er- tras la respuesta: se afirma que cuanto mayor sea el tiempo conseguido sin Er- tras emitir la respuesta mayor será su poder reforzante. Debe entenderse que esta situación puede implicar una menor emisión de respuestas por parte del sujeto; si una palanca A elimina una descarga eléctrica durante 20 minutos y otra B lo hace durante 10 minutos se tenderá a presionar la palanca A, en igualdad de condiciones. Sin embargo, observamos que sólo hace falta emitir una respuesta cada 20 minutos mientras en la B serían dos las respuestas necesarias en el mismo periodo de tiempo. Demora en el reforzamiento negativo: se entiende por demora en la eliminación del Er- (en el caso del Er+ era su presentación) al tiempo que media entre la emisión de la conducta o respuesta y la desaparición o evitación del Er-. Así pues, a iguales condiciones, se emiten las respuestas que logran una menor demora o, dicho de otra forma, hacen desparecer el Er- antes. Grado de reducción del Er-: cuando no es posible la eliminación total del Er- se convierte en reforzante la máxima reducción posible del mismo. Programa de reforzamiento: en este caso debe tenerse presente una importante consideración y es que cuando se trabaja con estimulación aversiva debe establecerse de manera adecuada y factible la relación entre el criterio de respuesta y la emisión de la estimulación. Por lo demás, este parámetro se comporta de manera general como lo visto en ante los Er+. 3.1.3.- La respuesta La emisión de una conducta en un ambiente específico presenta entre otras características la de suponer un esfuerzo en su realización o la carga, el coste, que conlleva. 25 Tema 2 La motivación en las teorías del aprendizaje. A.- Esfuerzo en la emisión de la conducta: el esfuerzo puede entenderse en sus aspectos tanto físicos como de complejidad y requerimiento de la tarea. Así, aquellas tareas donde la fuerza necesaria para la ejecución conductual es menor resultarán más motivantes; de igual manera, a mayor requerimiento de fuerza menor es el tiempo necesitado para completarse una extinción. En el caso de la complejidad en los requerimientos de la tarea deben hacerse matizaciones, ya indicadas anteriormente cuando se hablo de los programas de reforzamiento, que nos indican que tanto las tareas demasiado fáciles como demasiado complejas pueden ser caracterizadas como poco motivantes; sin olvidar la mediación de otros elementos como pudieran ser la privación del Er+ o la intensidad del Er- por ejemplo. B.- El coste que conlleva la respuesta: en muchas ocasiones el emitir una conducta que nos hace posible un tipo de reforzamiento implica la pérdida de un Er+. Esta situación se dará tanto para la obtención de Er+ (conducir implica gasto de dinero en gasolina) o para escapar o evitar un Er- (pagar un trabajo para evitar una denuncia). De igual manera que en los casos anteriores hay que considerar la posibilidad mediadora de otras variables como serían la privación, la necesidad etc. que pueden alterar dicha relación. 3.2.- Otros motivos En este apartado, y continuando con la propuesta clasificatoria llevada a cabo por Pérez y Caracuel (1997), sólo dejaremos indicados un conjunto de motivos que presentan un destacado papel en la vida de los sujetos y que en muchos casos ha sido desarrollado el conocimiento sobre ellos desde distintas perspectivas a la meramente psicológica (etología, fisiología, biología….). Entre las diversas motivaciones los autores señalan: la actividad (Richter, 1927; Berlyne, 1957), el contacto físico (Millenson, 1967), la motivación sexual (Beach, 1956), la estimulación eléctrica (Olds, 1962), procesos relacionados con la adicción (Solomon y Corbit, 1974), así como el sueño y el dolor, entre otras. 4.- La elección conductual: la ley de igualación Sabemos que cuando se habla de la motivación ésta ha de hacer referencia a una variedad de aspectos que deben tenerse presente a la hora de poder explicar la conducta motivada (energía, direccionalidad, persistencia...). Suele ser frecuente explicitar a qué nos referimos cuando hablamos de la motivación con la pregunta ¿por qué realizo una conducta A frente a una conducta B?; es decir, hablamos de elección conductual. Mediante los programas de reforzamiento podemos iniciar, incrementar o disminuir la frecuencia con la que se emite una conducta, llegando a una cierta estabilización de la misma. Sin embargo, es frecuente que el sujeto se vea envuelto en una continua elección de conducta; ¿presiono la palanca A, la palanca B o la palanca C? ¿voy al cine, me quedo en casa leyendo un libro, salgo de compras, leo el periódico o voy a montar en bicicleta?. Es decir, el sujeto ha de elegir de entre una gran variedad de posibles respuestas; las cuales estarían sometidas a programas de reforzamiento diferenciados. Ante esta situación, la forma en que se ha procedido a estudiar esta elección ha consistido en tomar situaciones base; se plantea un contexto donde el sujeto ha de responder a una de dos posibles alternativas. 26 Tema 2 La motivación en las teorías del aprendizaje. Por el año 1954, Woodworth y Schlosberg para estudiar la conducta de elección venían a trabajar con laberintos en forma de T; el animal, llegado al punto de intersección, debía elegir entre el brazo de la derecha o el brazo de la izquierda. Una vez desarrollada la caja de Skinner, ésta permitía desarrollar situaciones donde mediante la presentación de dos programas de reforzamiento, los cuales estaban disponibles de manera simultánea (programas concurrentes) el sujeto debía elegir entre dos opciones de respuesta; donde cada una de ellas estaba sometida a programas de reforzamiento diferenciados. De esta forma se permite una medición continua de la elección, ya que el organismo puede intercambiar su respuesta entre uno u otro programa (p.e. si la paloma picotea en la tecla de la derecha se recibe reforzamiento en base a un IV 50 seg. mientras que si picotea en la tecla izquierda el reforzamiento se presenta según un RF 20). De esta forma la conducta de elección se refleja en la distribución de su conducta entre dos respuestas alternativas. Existen diversas formas de realizar las mediciones en situaciones como las que presentamos. Una de ellas es llevar a cabo el cálculo de la tasa relativa de respuesta de cada alternativa, que puede realizarse mediante la siguiente formulación [RA / (RA + RB)]; es decir, la tasa de respuesta dada en la opción A dividida por la suma de las tasas obtenidas en A y en B o también llamada tasa total. Así, si el animal responde por igual el valor resultante será 0,5; mientras que si responde con mayor frecuencia en la opción A el valor resultante superará el 0,5, ocurriendo la tendencia contraria si se responde con mayor frecuencia en la alternativa B, que tendería a un valor por debajo de 0,5. Ante una situación de este calibre, cabe preguntarse ¿cómo distribuirá el animal sus respuestas a lo largo de los diversos ensayos?. Visto todo lo anterior, es obvio pensar que la influencia del programa de reforzamiento en cada una de las opciones será lo que va a marcar la tendencia de respuesta. Si se ha planteado una situación donde una rata dispone de dos opciones (palanca A y palanca B) y está sometida a un programa concurrente de reforzamiento, donde ambos son similares (A.- IV 60 seg y B.- IV 60 seg.); el animal responderá con la misma frecuencia en ambas opciones, la tasa relativa de respuesta para las presiones en cada opción será de 0,5. De igual manera se obtendrá una tasa relativa de reforzamiento ([rA/rA + rB]) de 0,5 si alterna el número de respuestas entre ambas opciones; de esta forma, el animal puede conseguir el máximo de reforzadores alternando ambas opciones. Cuando las dos opciones de respuesta están sometidas al mismo tipo de programa de reforzamiento, hemos visto lo que suele ocurrir con respecto a las tasas relativas, tanto de reforzamiento como de respuestas. Ahora bien, ¿qué ocurre cuando cada una de las alternativas de respuesta está sometida a distintos programas de reforzamiento?; por ejemplo, si la opción A responde a un programa IV 6 min. y la opción B lo hace a un programa IV 2 min. En la palanca A se podrá obtener un máximo de 10 reforzadores al cabo de una hora, mientras que en la opción B se obtendrán 30 en el mismo periodo temporal. Para analizar este tipo de variantes, fue Herrnstein (1961) quien procuró una respuesta a esta cuestión y para ello llegó a considerar que la tasa relativa de respuesta en una alternativa dada estaba siempre muy cercana a igualar la tasa relativa de reforzamiento logrado en esa alternativa. Por tanto, si la rata obtenía una mayor proporción de reforzadores en la alternativa B, la tasa relativa de respuesta tendía a igualarse con la tasa relativa de reforzamiento (Ley de igualación). Las expresiones matemáticas para la ley de igualación serán: 27 Tema 2 La motivación en las teorías del aprendizaje. [RA/(RA+RB)] = [rA/(rA+rB)]. También existe la posibilidad de formularlas como: RA/RB = rA/rB No entraremos aquí a plantear diversas alternativas que son posibles de observar en estos procedimientos (infraigualación: la mejor opción es menos elegida de lo que cabría esperar; la supraigualación: la mejor opción es más elegida de lo que cabría esperar) y que vienen a explicar la mayoría de los casos donde la conducta de elección no se corresponde perfectamente con la relación de igualación. Entre las variables que determinan estos fenómenos se indican: la utilización de diferentes topografías de respuestas para cada alternativa, la utilización de diferentes reforzadores para cada alternativa, la dificultad para cambiar de una alternativa a la otra. 5.- Otros aspectos de la motivación: la extinción En la mayoría de los manuales cuando se habla de motivación se hace mención de todas las cuestiones que ya se han referenciado (energetización, direccionalidad, persistencia....); sin embargo, se ha analizado en menor medida desde los diferentes modelos el decaimiento de la conducta, el por qué un sujeto deja de realizar una conducta que antes venía realizándola a una determinada frecuencia o tasa. Es decir, cuando un animal que ha iniciado una tarea y sin llegar a concluirla la abandona, es común que se diga que el sujeto abandona por desmotivación, dicho de otra manera por falta de motivación. Ahora bien ¿por qué el sujeto se desmotiva?. Hemos visto, cómo mediante los programas de reforzamiento de tasas, especialmente el RDB, es posible hacer que el sujeto mantenga una tasa baja y estable de respuesta, sin llegar a su eliminación. Ahora bien, cómo se explica que un organismo que mantenía una determinada tasa de respuesta llegue a eliminar la emisión de dicha respuesta. Este fenómeno es posible analizarlo desde el paradigma conductual si se considera y analiza el proceso de extinción; si bien también sería posible considerarlo desde el modelo de indefensión aprendida de Seligman (1975). Ya hemos visto como, tanto en el CC como en el CO, la extinción viene a producirse cuando se presenta el E.C. sin ser seguido del E.I. o se emite la R. sin ser seguida de las consecuencias que la mantenía. Llegado a este punto, debe indicarse que la extinción es un proceso diferente del olvido; la primera se produce por la omisión del E.I. o Er, mientras que el olvido es resultado del mero paso del tiempo, se da con la ausencia prolongada de experiencia con el estímulo condicionado o con la respuesta instrumental. Los fenómenos como la recuperación espontánea, la renovación y el restablecimiento vienen a mostrarnos que la extinción no elimina lo que se aprendió de forma original. Los estudios sobre la devaluación del reforzador sugieren que la extinción no tiene virtualmente ningún impacto sobre la asociación E-C o R-C. Es más la extinción parece implicar el nuevo aprendizaje de una asociación E-R inhibitoria que se superpondría a lo que se aprendió con anterioridad (Domjan, 2003). 28 Tema 2 La motivación en las teorías del aprendizaje. Se ha podido observar que un procedimiento de extinción produce una disminución en la tasa de respuestas, y curiosamente se producía un aumento en la variabilidad de las secuencias de respuesta que los sujetos ejecutaban. Por tanto, junto a la disminución en el número de secuencias de respuesta que realizaba el sujeto también producía un aumento en la variabilidad de esas secuencias. Dicha variabilidad de las respuestas no se dio porque los sujetos repitiesen las secuencias que habían realizado durante la fase de reforzamiento. Las secuencias de respuesta que eran muy probables durante la fase de reforzamiento continuaban apareciendo durante la extinción, pero se complementaban con secuencias que los sujetos habían ejecutado rara vez con anterioridad. La extinción disminuye la tasa de respuesta e incrementa la variabilidad de la respuesta pero no altera de otro modo la estructura de la conducta (Neuringer, Kornell y Olufs, 2001; Machado y Cevik, 1998). Junto a los efectos conductuales mostrados, la extinción puede producir unos efectos emocionales entre los que se destacan la frustración; que vendría a ser la reacción emocional experimentada por un organismo ante la falta de un reforzador esperado. REFERENCIAS Beach, F.A. (1956): Characteristics of masculine “sex drive”. En M. R. Jones (ed): Nebraska Symposium in motivation. Lincoln: University of Nebraska Press. Berlyne, D.E. (1957): Conflict and information theory variables as determinants of human perceptual curiosity. Journal of Experimental Psychology. 53, 399-404. Collier, G.H.; Johnson, D.E.; Hill, W,L. y Kaufman, L.W. (1986): The economics of the law of effect. Journal of the Experimental Analysis of Behavior. 46,9 113-136. Domjan, M. (2003): Principios de aprendizaje y conducta. Madrid Thomson. García, J. y Koelling, R.A. (1966): Relación entre la clave y la consecuencia en el aprendizaje de evitación. En L. Aguada (comp.) (1983): Lecturas de aprendizaje animal. Madrid

Tema 2: Motivación en las Teorías de Aprendizaje PDF

Document Details

Tags

Related

Summary

Full Transcript

Upgrade to continue