Módulo 18 Condicionamiento Operante PDF
Document Details
![BetterMinimalism](https://assets.quizgecko.com/cdn-cgi/image/width=100,height=100,quality=75,format=webp/profile-images/V43wRicQ2z3wS5ypyhKicNWBoYbHCd1qOeHQzZHL.jpg)
Uploaded by BetterMinimalism
Tags
Summary
Este documento describe el condicionamiento operante, un tipo de aprendizaje donde se fortalece o debilita una respuesta voluntaria dependiendo si las consecuencias son favorables o desfavorables. Se utilizan ejemplos con animales, como gatos dentro de jaulas, para ilustrar los principios. Los conceptos clave, como reforzamiento y castigo, se exploran con detalles.
Full Transcript
MODULO 18. CONDICIONAMIENTO OPERANTE Muy bien... Qué idea tan inteligente... Fantástico... Concuerdo... Gracias... Excelente... Súper... Correcto... Este es el mejor ensayo que has escrito; te mereces un 10... De veras estás captando la idea... Estoy impresionado... Te toca un ascenso... Toma una g...
MODULO 18. CONDICIONAMIENTO OPERANTE Muy bien... Qué idea tan inteligente... Fantástico... Concuerdo... Gracias... Excelente... Súper... Correcto... Este es el mejor ensayo que has escrito; te mereces un 10... De veras estás captando la idea... Estoy impresionado... Te toca un ascenso... Toma una galletita... Te ves maravillosa... Te quiero...A pocos de nosotros nos molestaría recibir cualquiera de estos comentarios, pero lo que es especialmente notable es que cada una de estas sencillas frases puede utilizarse, median-te un proceso conocido como condicionamiento operante, para generar cambios poderosos en la conducta y para enseñar las tareas más complejas. El condicionamiento operante es el fundamento de muchos de los más importantes tipos de aprendizaje humano y animal.El condicionamiento operante es un aprendizaje en el cual se fortalece o debilita una respuesta voluntaria, dependiendo de sus consecuencias favorables o desfavorables. Cuan-do decimos que una respuesta se ha fortalecido o debilitado, entendemos que es más o menos probable que se repita regularmente.A diferencia del condicionamiento clásico, en el cual las conductas originales son res-puestas biológicas naturales a la presencia de un estímulo, como sería agua o dolor, el con-dicionamiento operante se aplica a respuestas voluntarias y deliberadas de un organismo para producir un resultado deseable. El término operante hace hincapié en este aspecto: el orga-nismo opera en su ambiente para producir un resultado deseable. El condicionamiento ope-rante actúa cuando aprendemos que trabajar en forma diligente puede generar un aumento de sueldo, o que estudiar con ahínco da por resultado buenas calificaciones.Al igual que con el condicionamiento clásico, el fundamento para la comprensión del condicionamiento operante se estableció mediante trabajos con animales. Ahora, nos concen-traremos en algunas de las primeras investigaciones, que se iniciaron con una simple inte-rrogante sobre el comportamiento de los gatos.La ley del efecto de ThorndikeSi usted colocara a un gato en una jaula y después pusiera una pequeña porción de alimento en el exterior de la jaula, apenas fuera del alcance del gato, es probable que este buscara afanosamente la forma de salir de la jaula. El gato quizás empezaría rasguñando los costados o presionándose contra alguna abertura. Pero suponga que usted ha dispuesto las cosas de tal manera que el gato pueda escapar pisando una pequeña palanca que libera el pestillo de la puerta de la jaula (figura 1). Al final, al desplazarse dentro de la jaula, podría ser que el gato presionara la palanca, se abriera la puerta y se comiera el alimento. ¿Qué sucedería si volviera a poner al gato en la jaula? La siguiente vez probablemente le llevaría un poco menos tiempo al gato pisar la palanca y escapar de la jaula y, tras unos cuantos ensayos, el gato pisaría de manera deliberada la palanca tan pronto como se le co-locara dentro de la jaula. Lo que habría sucedido, según Edward L. Thorndike (1932), quien estudió esta situación de manera exhaustiva, fue que el gato habría aprendido que presionar la palanca se asociaba con la consecuencia deseable de obtener alimento. Thorndike resumió esa relación al formular la ley del efecto, que afirma que las respuestas que conducen a con-secuencias satisfactorias tienen mayores probabilidades de repetirse.Thorndike creía que la ley del efecto opera de manera tan automática como caen las hojas de los árboles durante el otoño. No era necesario que el organismo comprendiera que había un vínculo entre una respuesta y una recompensa. En cambio, Thorndike creía que con el tiempo y la experiencia el organismo haría una conexión directa entre el estímulo y la respuesta sin que mediara conciencia alguna de la conexión.Fundamentos del condicionamiento operanteLas primeras investigaciones de Thorndike sentaron las bases para el trabajo de uno de los más influyentes psicólogos del siglo xx: B. F. Skinner (1904-1990). Quizá haya oído de la caja de Skinner (que se muestra en la figura 2), una cámara con un ambiente sumamente con-trolado que se utilizó para estudiar los procesos del condicionamiento operante con anima-les de laboratorio. Si bien la meta de Thorndike era lograr que sus gatos aprendieran a obtener alimento al escapar de la jaula, los animales en la caja de Skinner aprenden a obte-ner alimento al operar en su ambiente dentro de la caja. Skinner se interesó en especificar cómo varía la conducta como resultado de las alteraciones del ambiente.Se considera a Skinner, cuyo trabajo fue mucho más allá del perfeccionamiento del aparato inicial de Thorndike, como el inspirador de toda una generación de psicólogos que estudió el condicionamiento operante. Para ilustrar las contribuciones de este investigador, consideremos lo que sucede con una rata en la típica caja de Skinner (Soorya, Carpenter y Romanczyk, 2011; Huston et al., 2013; De Meyer et al., 2019).Suponga que quiere enseñarle a una rata hambrienta a presionar la palanca que se en-cuentra dentro de su caja. Al principio, la rata deambulará por la caja, explorando el am-biente de manera relativamente aleatoria. Sin embargo, en algún momento, tal vez presione la palanca de manera accidental y, al hacerlo, recibirá una bolita de alimento. La primera vez que esto suceda, la rata no aprenderá la conexión entre presionar la palanca y recibir ali-mento, por lo que seguirá explorando la caja. No obstante, tarde que temprano, la rata presionará nuevamente la palanca y recibirá otra bolita; con el tiempo, la frecuencia de la respuesta de presión de la palanca aumentará. A la larga, la rata presionará la palanca conti-nuamente hasta satisfacer su hambre, con lo que demostrará que ha aprendido que recibir alimento depende de que presione la palanca.REFORZAMIENTO: EL CONCEPTO CENTRAL DEL CONDICIONAMIENTO OPERANTESkinner denominó "reforzamiento" al proceso que hace que la rata siga presionando la palanca. El reforzamiento es el proceso por el cual un estímulo aumenta la probabilidad de que una conducta precedente se repita. En otras palabras, que la rata presione la palanca es más probable que ocurra nuevamente debido al estímulo del alimento.En una situación como esta, al alimento se le llama reforzador. Un reforzador es cual-quier estímulo que aumenta la probabilidad de que una conducta precedente ocurra de nuevo. Por ende, el alimento es un reforzador, pues aumenta la probabilidad de que tenga lugar la conducta de presionar la palanca (formalmente denominada respuesta de presionar la palanca).¿Qué tipo de estímulos pueden actuar como reforzadores? Las bonificaciones, los jugue-tes y las buenas calificaciones pueden servir como reforzadores, si fortalecen la probabilidad de la respuesta que ocurrió antes de su introducción. Que algo sea un reforzador depende de las preferencias del individuo. Aunque una barra de chocolate puede actuar como reforzador para una persona, a un individuo que le disgusta el chocolate le resultaría más deseable un pago en efectivo. La única forma en que podemos saber si un estímulo es un reforzador para un determinado organismo es observando si la frecuencia de un comportamiento previo aumenta después de la presentación del estímulo.Por supuesto, no nacemos sabiendo que una cantidad de dinero nos sirve para comprar una barra de chocolate. Más bien, por experiencia aprendemos que el dinero es un insumo valioso debido a su asociación con estímulos, como alimentos y bebidas, que son reforzantes innatos. Este hecho sugiere una distinción entre reforzadores primarios y secundarios. Un reforzador primario satisface alguna necesidad biológica y funciona de manera innata, al mar-gen de la experiencia previa de la persona. El alimento para una persona hambrienta, el calor para alguien con frío y alivio para el doliente, son ejemplos de reforzadores primarios.En contraste, un reforzador secundario es un estímulo que se vuelve reforzador a causa de su asociación con un reforzador primario. Por ejemplo, sabemos que el dinero es valioso porque hemos aprendido que nos permite obtener otros objetos deseables, incluidos refor-zadores primarios como alimento y refugio. El dinero, así, se convierte en un reforzador secundario (Qu, Zhang y Chen, 2013; Thrailkill y Bouton, 2017; Rosenthal-von der Pütten et al., 2019).Al centro de los sistemas de economía de fichas utilizados para el tratamiento de algunos trastornos psicológicos para personas institucionalizadas, se hallan los reforzadores secunda-rios. En un sistema de economía de fichas, al paciente se le recompensa con una ficha, como las de juegos de cartas, por mostrar el comportamiento deseado. La ficha, un ejemplo de reforzador secundario, puede intercambiarse por algo deseable, como un tentempié, algún juego o dinero en efectivo.Los neurocientíficos están empezando a explorar los fundamentos biológicos de los re-forzadores. Por ejemplo, sabemos que el neurotransmisor dopamina desempeña una función crucial en el reforzamiento de la conducta, pues cuando nos exponemos a determinados estímulos, un torrente de dopamina fluye por el cerebro, lo que produce sensaciones de placer que son reforzantes (Trujillo-Pisanty et al., 2011; Thompson y Wolpaw, 2015).REFORZADORES POSITIVOS, REFORZADORES NEGATIVOS Y CASTIGOEn muchos aspectos, los reforzadores pueden pensarse en términos de recompensas; tanto un reforzador como una recompensa aumentan la probabilidad de que un comportamiento precedente ocurra de nuevo, pero el término recompensa se limita a incidencias positivas, y aquí es donde difiere de un reforzador, pues resulta que los reforzadores pueden ser positi-vos y negativos.Un reforzador positivo es un estímulo añadido al ambiente que genera un aumento en la respuesta precedente. Si se proporciona alimento, agua, dinero o elogio después de una respuesta, es muy probable que la respuesta ocurra de nuevo en el futuro. El salario que los trabajadores obtienen al final de cada semana, por ejemplo, aumenta la probabilidad de que regresen a sus puestos de trabajo la siguiente semana.En contraste, un reforzador negativo se refiere a un estímulo desagradable cuya eli-minación genera un aumento en la probabilidad de que una respuesta precedente se repita en el futuro. Por ejemplo, si usted tiene una erupción cutánea que le provoca comezón (un estímulo desagradable), la cual se alivia cuando usted se aplica cierta marca de ungüento, es muy probable que se aplique el ungüento en la siguiente ocasión en que tenga una erupción que le provoque comezón. El uso del ungüento, entonces, se refuerza en forma negativa, pues elimina la comezón desagradable. De manera similar, si el volumen de su teléfono in-teligente está tan elevado que le lastima los oídos al encenderlo, es probable que reduzca el volumen. Reducirle el volumen es un reforzador negativo, y es más probable que repita la acción en el futuro al encender su teléfono. El reforzamiento negativo, entonces, le ense-ña al individuo que el hecho de emprender una acción elimina una condición negativa que existe en el ambiente. Como sucede con los reforzadores positivos, los reforzadores negativos aumentan la probabilidad de que se repitan conductas previas que logró evitar o terminar (Magoon y Critchfield, 2008; DePaolo, Gravina y Harvey, 2019).Observe que el reforzamiento negativo no es lo mismo que el castigo. El castigo es un estímulo que disminuye la probabilidad de que una conducta precedente ocurra de nuevo. A diferencia del reforzamiento negativo, que produce un incremento de la conducta, el cas-tigo reduce la probabilidad de la respuesta precedente. Si recibimos una descarga eléctrica con la intención de disminuir una conducta, estamos recibiendo un castigo; pero si ya esta-mos recibiendo una descarga eléctrica y hacemos algo para detenerla, se considera que la conducta que detiene la descarga se refuerza negativamente. En el primer caso, la conducta específica tiene probabilidades de disminuir por el castigo; en el segundo, es probable que aumente debido al reforzamiento negativo.Hay dos tipos de castigo: el castigo positivo y el castigo negativo, así como hay refor-zamiento positivo y reforzamiento negativo. En ambos casos, "positivo" significa añadir algo, mientras que "negativo" significa eliminar algo. El castigo positivo debilita una respuesta al aplicar un estímulo desagradable. Por ejemplo, darle unas nalgadas a un niño por portarse mal o pasar 10 años en la cárcel por cometer un delito constituyen un castigo positivo. (En ambos casos, se aplicó un estímulo desagradable.)En contraste, el castigo negativo consiste en retirar algo placentero. Por ejemplo, cuando a un adolescente se le dice que ya no puede utilizar su teléfono celular porque llegó después de la hora en que debía, o cuando a un empleado se le informa que se le reducirá el suel-do porque su evaluación laboral ha sido mala, se está aplicando un castigo negativo. (En ambos casos, se está retirando algo agradable; el uso del celular o la totalidad del salario.)Tanto el castigo positivo como el castigo negativo generan una disminución en la pro-babilidad de que se repita una conducta precedente. De modo que la condena de cárcel tiene la intención de reducir el comportamiento delictivo, y la suspensión del celular del adolescente tiene por objeto disminuir la probabilidad de que regrese después de la hora que se le indica.Las siguientes reglas (y el resumen de la figura 3) pueden ayudarle a distinguir estos conceptos. El reforzamiento aumenta la frecuencia de la conducta que lo precede; el castigo dis-minuye la frecuencia de la conducta que lo precede. La aplicación de un estímulo positivo genera un aumento en la frecuencia de la con-ducta y se denomina reforzamiento positivo; la aplicación de un estímulo negativo dis-minuye o reduce la frecuencia del comportamiento y se denomina castigo positivo. La eliminación de un estímulo negativo que genera un aumento en la frecuencia de la conducta es un reforzamiento negativo; la eliminación de un estímulo positivo que dis-minuye la frecuencia de una conducta es un castigo negativo. VENTAJAS Y DESVENTAJAS DEL CASTIGO: POR QUÉ EL REFORZAMIENTO SUPERA AL CASTIGO¿El castigo es una forma efectiva de modificar la conducta? El castigo a menudo representa el camino más rápido para cambiar una conducta que, si se permite que continúe, podría resul-tar peligrosa para un individuo. Por ejemplo, un padre posiblemente no tenga una segunda oportunidad para advertirle a un hijo que no cruce corriendo una calle transitada, por lo que castigar la primera incidencia de esta conducta puede ser una medida inteligente. Además, el uso del castigo para inhibir el comportamiento, aunque sea de manera temporal, ofrece la oportunidad de reforzar a una persona por comportarse en una próxima oportunidad de manera más deseable (Bruno, 2016).Sin embargo, el castigo presenta varias desventajas que hacen que aplicarlo rutinaria-mente sea cuestionable. De inicio, el castigo suele ser ineficaz, sobre todo si no se aplica poco después de la conducta indeseada o si el individuo está en posibilidades de abandonar el entorno en el que se aplica el castigo. Un empleado al que su jefe le llama la atención puede renunciar a su empleo; una adolescente que pierde el privilegio de conducir el auto de la familia podría tomar prestado el auto de un amigo. En tales casos, el comportamiento inicial que se castiga podría ser reemplazado por uno menos deseable. Aún peor, el castigo físico transmite a quien lo recibe la idea de que la agresión física es permisible y tal vez incluso deseable. Un padre que le grita a su hijo y lo golpea por portarse mal le enseña que la agresión es una respuesta adulta apropiada. El hijo podría copiar pronto el proceder de su padre actuando en forma agresiva hacia los demás. Además, el castigo físico suele aplicarlo gente que ya de por sí está molesta o encolerizada. Es poco probable que los individuos en un estado emocional así sean capaces de planear detenida-mente lo que hacen o de controlar el grado de castigo que infringen. Al final de cuentas, quienes recurren al castigo físico corren el riesgo de que les teman. El castigo también re-duce la autoestima de quienes lo reciben, a menos de que estos comprendan las razones de aquel (Smith, Springer y Barrett, 2011; Alampay et al., 2017; González et al., 2019). Por último, el castigo no proporciona información alguna sobre un comportamiento al-ternativo más apropiado. Para ser útil a fin de producir un comportamiento más deseable a futuro, el castigo debe acompañarse de información concreta sobre la conducta que se está castigando, junto con sugerencias específicas relacionadas con un comportamiento más de-seable. Castigar a un niño por mirar hacia afuera por la ventana en la escuela podría simple mente conducir a que se ponga a mirar el piso. A menos que le enseñemos formas apropiadas para responder, lo único que lograremos es sustituir una conducta indeseable por otra. Si el castigo no se acompaña de un reforzamiento por conductas posteriores que sean adecuadas, poco es lo que se logrará. Esa es la razón por la que las investigaciones científicas son tan contundentes; al final de cuentas, utilizar nalgadas es tanto ineficaz como dañino para los niños. Incluso los castigos en la forma de gritos son dañinos (Wang y Kenny, 2013; Kubanek, Snyder y Abrams, 2015; también vea la sección de Aplicación de la psicología en el siglo xxi). En resumen, reforzar la conducta deseada es una técnica más apropiada para modificar-la que el uso de castigos. Tanto dentro como fuera del campo científico, el reforzamiento suele superar al castigo (Sidman, 2006; Hall et al., 2011; Bruno, 2016). PROGRAMAS DE REFORZAMIENTO: EL MOMENTO EN QUE LLEGAN LAS RECOMPENSAS DE LA VIDAEl mundo sería un sitio muy diferente si los jugadores de póquer nunca jugaran tras su primera mano perdida, si los pescadores regresaran a la costa tan pronto como sus redes aparecieran vacías o si los agentes de telemercadeo se dieran por vencidos después de que les colgaran por primera vez. El hecho de que esas conductas no reforzadas continúen, a menudo con gran frecuencia y persistencia, ilustra que el reforzamiento no necesita recibirse continuamente para que una conducta se aprenda y mantenga. De hecho, las conductas que se refuerzan solo de manera ocasional pueden aprenderse en última instancia mejor que aquellas que se refuerzan siempre.El patrón de frecuencia y sincronización del reforzamiento que sigue a la conducta de-seada se conoce como programa de reforzamiento. En un programa de reforzamiento continuo, la conducta se refuerza cada vez que ocurre. En contraste, en un programa de reforzamiento parcial (o intermitente) la conducta se refuerza algunas de las veces en que se presenta, pero no en todas. Aunque el aprendizaje ocurre más rápidamente bajo un programa de reforzamiento continuo, la conducta perdura más tiempo después de que el reforzamiento termina cuando se aprende bajo un programa de reforzamiento intermitente (Reed, 2007; Holtyn y Lattal, 2013; Mullane et al., 2017).¿Por qué el reforzamiento intermitente genera un aprendizaje mucho más sólido y duradero que el reforzamiento continuo? Podemos responder a la pregunta si examinamos cómo podríamos comportarnos al utilizar una máquina expendedora de dulces, en compa-ración con una máquina tragamonedas de Las Vegas. Cuando utilizamos una máquina ex-pendedora de dulces, la experiencia nos ha enseñado que cada vez que ingresamos la cantidad apropiada de dinero, debe suministrársenos el reforzador, un dulce. En otras pala-bras, el programa de reforzamiento es continuo. En comparación, una máquina tragamonedas ofrece un reforzamiento intermitente. Hemos aprendido que después de introducir nuestro dinero, la mayor parte de las veces no recibiremos nada a cambio. Al mismo tiempo, sin embargo, sabemos que en alguna ocasión recibiremos algo.Ahora suponga que se descomponen, sin que usted lo sepa, tanto la expendedora de dulces como la tragamonedas y, por tanto, ninguna entrega nada. No pasaría mucho tiempo antes de que dejáramos de depositar monedas en la expendedora de dulces. Probablemente intentaríamos a lo sumo dos o tres veces más antes de abandonar la máquina molestos. Pero la historia sería muy diferente con la tragamonedas descompuesta. Aquí, depositaríamos di-nero por un periodo considerablemente mayor, aunque no hubiera compensación.En términos formales, podemos ver la diferencia entre los dos programas de reforzamien-to: el programa de reforzamiento parcial (como los que ofrecen las tragamonedas) mantiene el desempeño durante mucho más tiempo que los programas de reforzamiento continuo (como los que se establecen con las expendedoras de dulces) antes de que ocurra la extinción, o desaparición de la respuesta condicionada.Programas de razón fija o variable Ciertos tipos de programas de reforzamiento parcial producen respuestas más fuertes y prolongadas antes de la extinción que otros. En algunos de ellos se considera la cantidad de respuestas generadas antes de que se dé el reforzamiento y otras consideran la cantidad de tiempo que transcurre antes de que una respuesta obtenga el reforzamiento (Miguez, Witnauer y Miller, 2011; Manzo et al., 2015; Langford, Pitts y Hughes, 2019).En un programa de razón fija el reforzamiento se da solo después de una cantidad de respuestas específica. Por ejemplo, una rata podía recibir una bolita de alimento cada diez veces que presione una palanca; aquí, la razón sería 1:10. De manera similar, a las trabajado-ras de la industria de la confección se les paga generalmente según un programa de razón fija. Reciben una cantidad específica de dinero por cada blusa que cosen. Dado que una mayor tasa de producción implica mayor reforzamiento, quienes están bajo programas de razón fija probablemente trabajen lo más rápido posible (figura 4).En un programa de razón variable, el reforzamiento se da tras una cantidad prome-dio de respuestas, pero es impredecible el momento exacto en el que ocurre el reforzamien-to. Un buen ejemplo de programa de razón variable es la labor de un agente de ventas por teléfono. Podría hacer una venta durante la tercera, octava, novena y vigésima llamada sin haber tenido éxito durante ninguna llamada intermedia. Aunque varía la cantidad de respuestas que debe dar antes de hacer una venta, hay una tasa de 20% de éxito en promedio. En estas circunstancias, usted podría esperar que el vendedor tratara de hacer tantas llama-das como pueda en el menor lapso posible. Así sucede con los programas de razón variable, que conducen a una tasa elevada de respuesta y de resistencia a la extinción.Programas de intervalo fijo y variable: el paso del tiempo En contraste con los programas de razón fija y variable en los que el factor esencial es la cantidad de respuestas, los progra-mas de intervalo fijo y variable se concentran en la cantidad de tiempo transcurrido desde que se recompensó a una persona o a un animal. Un ejemplo de programa de intervalo fijo es el pago del salario semanal. Para quienes reciben un salario regular semana a semana, por lo general no es muy diferente cuánto producen en una determinada semana.Un programa de intervalo fijo ofrece el reforzamiento a una respuesta solo si ha transcurrido un periodo fijo. En consecuencia, las tasas generales de respuesta son relativa-mente bajas. Esto es cierto de manera especial en el periodo inmediato posterior al reforza-miento, cuando el periodo anterior a otro reforzamiento es relativamente grande. Los hábitos de estudio de los jóvenes suelen ejemplificar esta realidad. Si los periodos entre los exáme-nes son relativamente largos (lo que significa que la oportunidad de reforzamiento se da de manera infrecuente), los alumnos suelen estudiar el mínimo o no lo hacen en absoluto hasta que se aproxima la fecha del siguiente examen. Sin embargo, justo antes del examen, los alumnos empiezan a prepararse de manera intensa, lo que indica un rápido aumento en su tasa de respuesta de estudio. Como podría esperar, inmediatamente después del examen hay una disminución rápida en la tasa de respuesta, ya que pocos alumnos abren un libro el día posterior al examen. Los programas de intervalo fijo producen el tipo de patrón de "festoneo" que se muestra en la figura 4 (Saville, 2009; Daniels y Sanabria, 2017).Una forma de reducir la demora en la respuesta que ocurre justo después del reforza-miento y mantener la conducta deseada de manera más estable durante un intervalo, consiste en recurrir a un programa de intervalo variable. En un programa de intervalo variable el tiempo entre los reforzamientos varía en torno a cierto promedio en lugar de ser fijo. Por ejemplo, un profesor que gusta de hacer pruebas sorpresa que varían entre una cada tres días y una cada tres semanas, promediando una cada dos semanas, se está valiendo de un programa de intervalo variable. En comparación con los hábitos de estudio que ob-servamos con un programa de intervalo fijo, los hábitos de estudio de los estudiantes en un programa de intervalo variable de esta índole serían probablemente muy diferentes. Los jó-venes estarían más dispuestos a estudiar en forma más regular, ya que nunca sabrían cuándo les tocaría la siguiente prueba sorpresiva. Los programas de intervalo variable, en general, tienen más probabilidades de producir tasas relativamente estables de respuestas que los programas de intervalo fijo, y las respuestas tardan más tiempo en extinguirse después de que termina el reforzamiento. DISCRIMINACIÓN Y GENERALIZACIÓN EN EL CONDICIONAMIENTO OPERANTEA un niño no le lleva mucho tiempo aprender que un semáforo con la luz roja en una intersección significa detenerse y un semáforo cuya luz está en verde indica que se permite pasar, en el mismo sentido en que una paloma aprende a picotear una palanca cuando se enciende una luz verde, pero no cuando aparece la luz roja. Como en el condicionamiento clásico, entonces, el aprendizaje operante implica los fenómenos de la discriminación y la generalización.El proceso por el cual la gente aprende a discriminar los estímulos se conoce como entrenamiento en control de estímulos. En el entrenamiento en control de estímulos se refuer-za una conducta en presencia de un determinado estímulo, pero no en ausencia de este. Por ejemplo, una de las discriminaciones más difíciles que enfrentan muchas personas consiste en determinar cuando la cordialidad de alguien no es simple cordialidad, sino un indicio de interés romántico. La gente aprende a hacer la discriminación observando la presencia de ciertas claves no verbales ---como mayor contacto visual y físico--- que indican un interés romántico. En este caso, la clave no verbal actúa como un estímulo discriminativo al que el organismo aprende a responder durante el entrenamiento en control de estímulos. Un estímulo discri-minativo indica la probabilidad de que a una respuesta siga un reforzamiento. Por ejemplo, si usted espera que su compañera de habitación esté de buen humor para pedirle prestado su suéter favorito, diríamos que el comportamiento de usted está bajo control del estímulo, pues usted discrimina entre los estados de ánimo de su compañera.Como sucede en el condicionamiento clásico, el fenómeno de la generalización del es-tímulo, en el que un organismo aprende a dar una respuesta a un estímulo y después exhi-be la misma respuesta a estímulos similares, ocurre en el condicionamiento operante. Si usted aprendió que ser cortés lo ayuda a conseguir lo que quiere en una determinada situa-ción (reforzando su cortesía), probablemente generalice su respuesta en otras situaciones. A veces, no obstante, la generalización puede tener consecuencias desafortunadas, como cuando las personas se comportan negativamente hacia todos los miembros de un grupo racial porque han tenido una experiencia desagradable con un miembro de ese grupo. MOLDEAMIENTO: REFORZAR LO QUE NO SUCEDE POR NATURALEZAConsidere la dificultad de utilizar el condicionamiento operante para enseñar a los empleados a reparar la transmisión de un automóvil. Si tuviera que esperar hasta que por casualidad arreglaran una transmisión perfectamente antes de que usted les ofreciera un reforzamiento, el Ford modelo T volvería a estar de moda antes de que dominaran el proceso de reparación.Hay muchas conductas complejas, desde la reparación de automóviles hasta la adminis-tración de un zoológico, que no cabría esperar que ocurrieran de forma natural como parte del comportamiento espontáneo de nadie. Para tales conductas, a las que de otra forma no habría oportunidad de ofrecer un reforzamiento (porque el comportamiento jamás sucedería, en primer lugar), se utiliza un procedimiento conocido como moldeamiento. El moldea-miento es el proceso de enseñar conductas complejas reforzando las aproximaciones cada vez más cercanas a la conducta deseada. En el moldeamiento se empieza por reforzar cual-quier comportamiento que tenga cualquier semejanza con la conducta que se quiere que la persona aprenda. Más tarde, solo se refuerzan las conductas que están próximas al compor-tamiento final que se quiere que la persona aprenda. Por último, únicamente se refuerza la respuesta deseada. Cada paso del moldeamiento, entonces, avanza solo un poco más allá de la conducta previamente aprendida, lo que permite que la persona vincule el nuevo paso con la conducta aprendida antes (Krueger y Dayan, 2009; Egervari et al., 2017).El moldeamiento permite que incluso animales de orden inferior aprendan respuestas complejas que nunca ocurrirían de manera natural, lo que va desde los leones que saltan por aros, los delfines que rescatan a nadadores perdidos en el mar o los roedores que en-cuentran minas terrestres ocultas. El moldeamiento también subyace el aprendizaje de mu-chas habilidades humanas complejas. Por ejemplo, la organización de la mayor parte de los libros de texto se basa en los principios del moldeamiento. Por lo común, se presenta la información de modo que el material nuevo descanse sobre los conceptos y habilidades previamente aprendidos. Por tanto, no podríamos haber presentado el concepto de moldea-miento hasta haber analizado los principios más elementales del aprendizaje operante.LIMITACIONES BIOLÓGICAS AL APRENDIZAJE: NO PUEDE ENSEÑÁRSELE A UN PERRO VIEJO TRUCOS NUEVOSNo todos los comportamientos pueden entrenarse en todas las especies con el mismo éxito. De hecho, hay limitaciones biológicas, restricciones intrínsecas en la capacidad de los animales para aprender determinadas conductas. En algunos casos, un organismo tiene una predispo-sición especial que le ayuda en su aprendizaje de una conducta (como el comportamiento de picoteo de las palomas). En otros casos, las limitaciones biológicas impiden o inhiben que un organismo aprenda una conducta.Por ejemplo, es imposible entrenar a un cerdo para que recoja un disco, pues está programado genéticamente para empujar objetos por el suelo, pero no para recogerlos. De manera similar, aunque se puede condicionar a un ma-pache para que deposite una moneda en una alcancía, solo lo hará después de frotarla contra la parte exterior de la alcancía. ¿Por qué? Porque los mapaches, luego de atrapar un pez, instintivamente los frotan contra el piso para retirar su capa externa (Breland y Breland, 1966; Thurman y Lu, 2013).La existencia de limitaciones biológicas es congruente con las explicaciones evolutivas de la conducta. Resulta evidente que hay beneficios adaptativos que fomentan la supervivencia en los organismos, por los que con rápidamente aprenden ---o evitan--- ciertos comportamientos. Por ejemplo, nuestra capacidad para aprender rápidamente a evitar tocar superficies calientes aumenta nuestras probabilidades de supervivencia. Hay un respaldo adicional a la interpretación evolutiva de las limitaciones biológicas, que radica en el hecho de que las aso-ciaciones que aprenden los animales con más facilidad tienen que ver con los estímulos más importantes en el entorno específico en el que viven (Cosmides y Tooby, 2004; Davis, 2007; Behrendt, 2011).Además, los psicólogos que adoptan una perspectiva evolucionista han seña-lado que quizás estemos predispuestos genéticamente a temerles a ciertos es-tímulos, como a las serpientes e incluso a los rostros amenazadores. Por ejemplo, los participantes en los experimentos aprenden a hacer asociaciones en forma relativamente rápida entre fotografías de rostros con expresiones amenazadoras y estímulos neutros (como un paraguas). En contraste, son más lentos para aprender asociaciones entre rostros que tienen expresiones agradables y estímulos neutros. Los estímulos que suponen amenazas potenciales, como las serpientes o las personas con expresiones faciales hostiles, re-presentaban un peligro potencial para los primeros humanos, y posiblemente haya un "módu-lo de temor" evolutivo en el cerebro que está sensibilizado a tales amenazas (DeLoache y LoBue, 2009; Gerdes, Uhl y Alpers, 2009; Lester et al., 2017).COMPARACIÓN ENTRE EL CONDICIONAMIENTO CLÁSICO Y EL CONDICIONAMIENTO OPERANTEHemos considerado el condicionamiento clásico y el condicionamiento operante como dos procesos completamente distintos. Y, como se resume en la figura 5, hay muchas diferencias medulares entre ambas formas de aprendizaje. Por ejemplo, el concepto clave en el condi-cionamiento clásico es la asociación entre estímulos, mientras que en el condicionamiento operante es el reforzamiento. Además, el condicionamiento clásico implica una conducta involuntaria, natural e innata, mientras que el condicionamiento operante se basa en las respuestas voluntarias de un organismo.Algunos investigadores se preguntan si, en realidad, ambos tipos de aprendizaje son tan diferentes después de todo. Algunos psicólogos del aprendizaje han señalado que el condi-cionamiento clásico y el operante posiblemente compartan ciertos procesos subyacentes. Desde un punto de vista evolucionista, afirman que es poco probable que evolucionen dos procesos básicos en forma por completo separada. Más bien, un proceso ---si bien con una complejidad considerable en la forma que opera--- podría explicar mejor la conducta. Aunque es demasiado pronto para saber si este punto de vista se sustentará, es claro que hay muchos procesos que operan tanto en el condicionamiento clásico como en el operante, incluidas la extinción, la generalización del estímulo y la discriminación del estímulo (Donahoe y Vegas, 2004; Silva, Gonçalves y García-Mijares, 2007; Lattal et al., 2017).