TERAPIA CONDUCTUAL

TERAPIA CONDUCTUAL Hay varios diferentes procedimientos y aproximaciones a la psicoterapia los que pueden ser (y muchas

Views 179 Downloads 1 File size 432KB

Report DMCA / Copyright

DOWNLOAD FILE

Recommend stories

Citation preview

TERAPIA CONDUCTUAL Hay varios diferentes procedimientos y aproximaciones a la psicoterapia los que pueden ser (y muchas veces lo son) incluidos bajo el título de la terapia conductual. A pesar de las diferencias en las técnicas asociadas con varias formas de terapia conductual, ellas están todas virtualmente caracterizadas por una filosofía común y un set de principios básicos. Todas las formas de terapia conductual están enfocadas en una larga extensión de experiencias de aprendizaje diseñadas para cambiar las conductas desadaptadas de los pacientes. O’Leary y Wilson (1987) enumeran los principios que se aplican en la mayoría de las terapias conductuales. Los siguientes 5 principios son aquellos que creemos que representan l mayor fundamento de las terapias conductuales existentes: 1. Todo el comportamiento, normal y anormal, es adquirido y mantenido de acuerdo a los mismos principios básicos del aprendizaje. 2. No es necesario inferir una causa que sirva de base para las conductas desadaptadas; las conductas son el desorden; no son una manifestación o un signo de un desorden que se encuentra bajo la superficie o de un proceso de enfermedad. 3. Usualmente no es necesario saber como ha sido aprendido un problema conductual específico; el foco del tratamiento no debiera estar en los resultados históricos sino más bien en aquellos factores que están manteniendo constantemente la conducta. 4. La mayoría del comportamiento anormal puede ser modificado por medio de la aplicación de los principios del aprendizaje, con los cuales la conducta desadaptada puede ser desaprendida y reemplazada por otra nueva, más adaptativa, conducta aprendida. 5. Los métodos de tratamiento son precisamente especificados, replicables y hechos a la medida de las necesidades, la fuerza y la situación de cada cliente; el progreso del tratamiento se señala continuamente y los resultados del tratamiento son evaluados objetivamente. Estos principios subrayan la importancia de que, en primer lugar, la terapia conductual se enfoca en las conductas manifiestas en lugar de los conflictos subyacentes y motivaciones, y en segundo lugar, la evaluación científica de la efectividad de cada programa de tratamiento. No es difícil ver que ambos conceptos representan un cambio significativo desde la perspectiva psicoanalítica que prevalecía en el momento en que la terapia conductual estaba siendo desarrollada.

Objetivos Estando el foco de la terapia conductual en las conductas desadaptadas de los pacientes, un importante objetivo general de esta forma de psicoterapia es reducir o eliminar las conductas problemáticas de los pacientes e incrementar la frecuencia de conductas más adaptativas. El énfasis en la conducta manifiesta, en vez de conflictos intrapsíquicos vagamente definidos, significa que los objetivos de la terapia conductual serán generalmente claros y específicos. Adicionalmente, en contraste con el psicoanálisis y terapeutas psicodinámicos, los terapeutas conductuales trabajan de manera activa y en colaboración con sus pacientes en la planificación de los objetivos de la terapia y en la ejecución de los procedimientos diseñados para alcanzar estos objetivos. Debido a que los terapeutas conductuales asumen que las conductas desadaptadas son consecuencia tanto de antecedentes específicos como consecuencia del medio ambiente natural del paciente, muchos de los trabajos importantes en terapia conductual están hechos fuera de la oficina del terapeuta, ya sea por medio de una terapia conductual dirigida en el medio ambiente del paciente (terapia en vivo) o por medio de asignación de tareas que el paciente realiza entre sesiones. El razonamiento que subyace a la selección de objetivos específicos y técnicas es generalmente explicitado al paciente, así terapeuta y paciente juntos llevan a cabo la terapia, evalúan el progreso del paciente y, si es necesario, modifican el plan de tratamiento. Entrenamiento y Supervisión A diferencia del psicoanálisis, los terapeutas conductuales no requieren no deben someterse a terapia ellos mismos. La terapia conductual, como ya hemos notado, es una fuerte aproximación empírica a la psicoterapia que está basada sólidamente en los principios del aprendizaje. En consecuencia, los terapeutas conductuales deben tener un acabado entendimiento de la mayoría de las teorías del aprendizaje, incluyendo el condicionamiento clásico y operante y la teoría del aprendizaje social. Debido a este requerimiento, es generalmente (no siempre) el caso de que los terapeutas conductuales son psicólogos gracias al entrenamiento. De hecho, la alta proporción de terapeutas conductuales que son psicólogos contrasta con los psicoanalistas ortodoxos, los cuales se componen principalmente de individuos que han sido formados en psiquiatría. Finalmente el fuerte foco en la conducta manifiesta y la importancia del cambio conductual, extiende además la supervisión en la terapia conductual. Por lo tanto, no es sorprendente que los terapeutas conductuales quienes están siendo supervisados son frecuentemente observados por sus supervisores como ellos conducen la terapia y son registrados en escalas que señalan sus habilidades y sus progresos como terapeutas conductuales.

La Importancia de la Evaluación en la Terapia Conductual El lazo entre la evaluación y la terapia es fuerte para los terapeutas conductualmente orientados, que, virtualmente, es el caso para cualquier otra aproximación a la psicoterapia, incluyendo psicoanálisis y terapias fenomenológicas. Desde una perspectiva conductual, la evaluación tiene profundas implicaciones para la psicoterapia. De hecho, muchos terapeutas conductuales podrían argumentar que uno no puede comenzar una terapia conductual sin primero llevar a cabo una evaluación comprensiva de la conducta, o un análisis funcional de las dificultades de los pacientes. Mueser y Liberman (1995) esquematizan una aproximación conductual a la evaluación y terapia que describe la interdependencia entre ambas. Mueser y Liberman notan la importancia de identificar la conducta o conductas problema del modo más objetivo y preciso posible usando una variedad de procedimientos de evaluación que incluyen cuestionarios de autorreporte, entrevistas estructuradas, auto monitoreo y observación conductual. En el capítulo 10 discutimos sobre el análisis funcional de la conducta, en el cual las conductas problemáticas del paciente son identificadas junto con los antecedentes y consecuencias de la conducta. Esta operacionalización de las conductas desadaptadas del paciente permite a los terapeutas conductuales desarrollar y llevar a cabo programas de tratamiento apuntados específicamente al cambio de frecuencia o intensidad de las conductas problemáticas de la manera más eficiente posible. Métodos Los terapeutas conductuales tienen a su disposición una gran variedad de técnicas para enseñar o incrementar conductas más adaptativas y eliminar las conductas desadaptadas. Debido a que existe un gran número de técnicas disponibles para el cambio conductual, es provocador mirar la terapia conductual como una simple variedad o arsenal de procedimientos. Como Kalish (1981) manifiesta, sin embargo, esta visión no es una percepción precisa de esta aproximación a la psicoterapia: La inclinación a considerar los métodos de intervención en la modificación conductual como una colección de técnicas estandarizadas es especialmente seductora. Esto tiende a oscurecer una de las más importantes contribuciones al entendimiento del cambio conductual hecho por el advenimiento de los procedimientos de modificación conductual: a saber que por cada bien llamada técnica, existe un principio de conducta más fundamental y más general derivado de las investigaciones con animales y/o humanos las cuales pueden ser aplicadas a la solución de un problema en el funcionamiento humano. Esto significa, entre otras cosas, que aquellos que intentan utilizar la modificación de la conducta para solucionar los problemas humanos, debiera estar

consciente de esos principios y recursos suficientes para proponer estrategias de tratamiento que se adecuen al caso después de un análisis concienzudo de las condiciones que iniciaron y mantuvieron la conducta.

En la siguiente sección presentaremos y discutiremos la aplicación de un número de métodos y procedimientos conductuales que son utilizados para reducir altos niveles de miedo (más comunes son las fobias) y luego discutiremos sobre procedimientos usados para enseñar y mantener nuevas conductas. APLICACIONES DE LA TERAPIA CONDUCTUAL A PROBLEMAS ESPECÍFICOS Procedimientos de Reducción del Miedo Sabemos debido a estudios epidemiológicos recientes, que el miedo y las fobias están entre las formas más comunes de estrés psicológico (Brunello et al. 2000; Curtis, Magee, Eaton, Wittchen & Kessler, 1998; Den Boer, 2000). El experimento de Watson con el pequeño Alberto demostró que el miedo puede ser aprendido por medio de la experiencia, es decir, por medio de condicionamiento clásico. Además el miedo puede ser aprendido indirectamente a través de la observación. No debiera ser difícil imaginar, por ejemplo, que un niño pueda aprender a ser miedoso frente a las serpientes al mirar a un familiar exhibir signos manifiestos de dolor (como gritos y contorsiones) luego de ser picado por una serpiente. Dado que este miedo es aversivo, el individuo entendidamente evita entrar en contacto con el objeto o situación que causa miedo. Desde una perspectiva conductual sin embargo, esta evitación del objeto que causa miedo significa que el individuo nunca tendrá la oportunidad de extinguir el miedo, es decir, enfrentarse a la serpiente y encontrar que no sucede nada. En ausencia de cualquier experiencia de aprendizaje nueva, el miedo o fobia puede persistir indefinidamente. La mayoría de las aproximaciones conductuales a la reducción del miedo involucran algún tipo de exposición del paciente frente al estímulo que causa miedo. Algunas veces esta exposición es hecha usando la imaginación del paciente; es decir, el paciente es instruido para imaginarse a sí mismo entrando en contacto con el objeto o situación que produce el miedo. Otras veces la exposición es actual o en vivo, en la cual el individuo actualmente confronta el objeto de su miedo. Comenzaremos nuestra discusión de esos procedimientos con una descripción de la desensibilización sistemática. Desensibilización Sistemática: Es uno de los procedimientos más ampliamente estudiados y comúnmente aplicados en los procedimientos conductuales para la reducción del miedo y las fobias. Esta es

generalmente utilizada cuando el paciente tiene habilidades que puede ocupar en conductas más adaptativas o apropiadas, pero en vez de eso evita los estímulos o situaciones que producen miedo. Típicamente esta evitación toma la forma de una fobia, la cual es el miedo a una situación u objeto particular que es desproporcionado frente al peligro real. De cualquier modo, el miedo o la fobia pueden presentar un problema serio en el funcionamiento cotidiano de la vida de un individuo. Por ejemplo, una paciente diabética que es incapaz de inyectarse a sí misma con insulina porque tiene miedo a las agujas, tendrá más probabilidad de seguir el tratamiento para su fobia a las agujas de la que tendrá un contador que vive en Manhattan y tiene una fobia que le impide aproximarse o manipular serpientes. La desensibilización sistemática estuvo entre una de las primeras claramente definidas y testeadas técnicas conductuales diseñadas para reducir la ansiedad en humanos. Fue primeramente desarrollada y descrita por Wolpe (1958) en su libro Psicoterapia Mediante Inhibición Recíproca (Psychoterapy by Reciprocal Inhibition). El principio de la inhibición recíproca simplemente significa que no podemos estar ansiosos y relajados al mismo tiempo, que estos estados se excluyen mutuamente. De este modo, no podemos experimentar al mismo tiempo los componentes fisiológicos de la ansiedad (Por ej. aumento del ritmo cardiaco, incremento de la respiración y estado de activación (arousal) elevado) y los componentes fisiológicos de la relajación (Por ej. disminución del ritmo cardiaco, respiración lenta y estado de activación baja), debido a que estos son incompatibles el uno con el otro. Wolpe argumentó que si él pudiera enseñar a sus pacientes ansiosos a permanecer relajados frente a la creciente presencia de estímulos fóbicos o aversivos, ellos no podrían sentirse ansiosos al mismo tiempo. Existen tres pasos distintos en la desensibilización sistemática. Primero, ya que el paciente no puede estar ansioso cuando esta relajado, el paciente es entrenado en una o más técnicas de relajación específicas. El procedimiento de relajación más frecuentemente usado en la desensibilización sistemática está basado en la técnica de relajación muscular progresiva de E. Jacobson (1938). Este procedimiento implica tensar y relajar alternadamente grupos musculares de todo el cuerpo de manera sistemática. El terapeuta a menudo le dará al paciente un cassette de audio con las instrucciones de relajación de modo que el paciente pueda practicar en casa. Sin embargo, si el paciente o terapeuta prefieren, existe una gran cantidad de procedimientos disponibles para enseñar al paciente como relajarse. Muchos pacientes, por ejemplo, prefieren usar una técnica conocida como relajación autogénica, en la cual se utiliza la imaginería para relajarse. Así en vez de tensar y relajar alternadamente músculos específicos, los pacientes

escuchan al terapeuta que describe escenas relajantes (Por Ej., imagínese tendido en una playa con arenas cálidas, escuchando la brisa pasar en medio de las palmeras y sintiendo el calor del sol en su piel). Aun hay otros pacientes que prefieren usar la hipnosis, la retroalimentación biológica (biofeedback) y la meditación para relajarse. El segundo período de la desensibilización sistemática involucra una jerarquización de la ansiedad. Una jerarquía ansiosa es una lista de escenas o situaciones relatadas que varían en el monto de ansiedad que elicitan cuando el paciente las imagina o visualiza. El paciente trabaja con el terapeuta inicialmente en la construcción de una larga lista de escenas relatadas de objetos o situaciones fóbicas o aversivas que provocan que el paciente se sienta ansioso cuando las imagina. El paciente entonces anota cada escena indicando que tan ansiosa o ansioso se siente cuando imagina o visualiza la escena. Basándose en las escalas del paciente, paciente y terapeuta seleccionan aproximadamente 15 o 20 de las escenas que amplían mejor el rango de la escala. Ejemplos de jerarquías de ansiedad para dos pacientes son presentados en la tabla 14.1. El paso final en la desensibilización sistemática es realmente el núcleo de este procedimiento: los pareamientos sucesivos de la relajación con cada uno de los estímulos en la jerarquía de ansiedad del paciente. El paciente comienza la sesión cuando está relajado lo que toma 10 o 15 minutos debido a que el paciente ha aprendido a relajarse completamente de manera relativamente rápida. Luego se comienza con los estímulos del rango más bajo en la jerarquía, el paciente es instruido a visualizar la escena por cerca de unos 10 segundos mientras permanece relajado. Si el paciente comienza a sentirse ansioso mientras está visualizando la escena, él o ella señala esta ansiedad al terapeuta, quien entonces le dice al paciente que deje de imaginar la escena y recupere el estado de relajación. Cuando el paciente ha conseguido este estado de relajación, el terapeuta presenta la misma escena nuevamente. Cuando el paciente logra visualizar esta escena y permanecer relajado, el terapeuta repite el procedimiento con los estímulos que siguen en la jerarquía. Este procedimiento es repetido hasta que el paciente puede permanecer relajado mientras visualiza la escena que induce mayor ansiedad en la jerarquía. Ejemplo de Jerarquías de Desensibilización La desensibilización sistemática es más frecuente y sucesivamente usada en el tratamiento de miedos específicos y fobias. El mayor componente de este

tratamiento es el desarrollo de una o más jerarquías de estímulos que cubren el rango de la ansiedad experimentada en presencia del objeto o situación fóbica. Aquí presentamos dos tipos de jerarquía, una con un paciente para tratar el miedo a volar y la otra construida para tratar el miedo a las arañas de un paciente Miedo a Volar Fobia a las Arañas  Mirando un avión volando en el  Caminando sin arañas en el lugar  Viendo una araña frente a ti en el cielo  Oyendo un avión volando en el lado quecaminas  Viendo una tela de araña en la cielo  Conduciendo pasando por un esquina de una habitación  Viendo una araña en el piso frente a aeropuerto  Conduciendo en un aeropuerto ti  Mirando un aeroplano en la tierra  Viendo una araña en tu zapato  Caminando en un terminal de  Viendo una araña en tu camisa  Viendo una araña caminando hacia aerolíneas  Esperando para abordar un avión ti  Entrando en un avión  Viendo una araña caminando en tu  Abrochando el cinturón de mano  Sintiendo una araña caminando en seguridad en el avión  Sintiendo que el avión se tu pierna  Sintiendo una araña caminando en comienza a mover  Sintiendo que las ruedas dejan la tu cara  Caminando en una tela de arañas tierra  Sintiendo que el avión comienza a descender

Cuando el paciente puede visualizar la escena más intensa, es decir, la que induce mayor ansiedad en la jerarquía, sin experimentar ansiedad, la desensibilización sistemática está completa. Sin embargo, la mayoría de los terapeutas que practican este procedimiento aconsejan al paciente que busque en la vida real escenas equivalentes a las imaginadas en la jerarquía para asegurarse de que la relajación se generaliza a las escenas reales. De hecho, existe una variante de la desensibilización sistemática, llamada desensibilización en vivo, en la cual el paciente es expuesto realmente a los estímulos que inducen ansiedad. Por ejemplo un individuo con acrofobia (miedo a las alturas) puede acompañar al terapeuta al segundo piso mientras intenta permanecer relajado. Este procedimiento puede ser repetido hasta que el paciente se relaje mientras está en el balcón, en dicho punto, terapeuta y paciente pueden proceder a mirar por la ventana del tercer piso.

Ya que cualquier estado que es incompatible con la ansiedad puede ser usado en la desensibilización, el terapeuta no se limita a que el paciente se relaje mediante la tensión muscular o la meditación. Bryntwick & Solyom (1973) por ejemplo, reportaron el exitoso tratamiento de una persona con miedo a los ascensores haciendo que él comiera comidas gourmet (las cuales le brindaban un gran placer) mientras estaba en el ascensor. El afecto positivo experimentado por el paciente se debía a las cualidades de la comida que eran incompatibles con cualquier sentimiento de ansiedad. Por supuesto, como en el tratamiento de Peter llevado a cabo por Jones (1924), el orden de presentación del ascensor y la comida es crítico En el siguiente caso, el orden de presentación fue incorrecto, por lo que el paciente pudo haber aprendido a asociar su ansiedad con el comer comidas gourmet conduciéndolo a una aversión a algunas comidas en vez de una asociación de la relajación y el agrado de estar en un ascensor. ¿Funciona la desensibilización? Desde los trabajos de Wolpe (1958), quien fue el primero en proponer la desensibilización sistemática como un tratamiento para los miedos y fobias, literalmente, miles de estudios han sido conducidos virtuosamente corroborando la eficacia a esta intervención en el tratamiento de los miedos y las fobias (ver Emmelkamp, 1994 para una revisión de estos estudios). Se ha encontrado que los procedimientos de desensibilización han sido además efectivos en el tratamiento de las disfunciones sexuales. Por ejemplo, Cranston-Cuebas & Barlow (1990) encontraron que entre 50% y el 70% de los pacientes que recibieron tratamiento para la disfunción sexual que estaban basados en la reducción de la ansiedad por medio del procedimiento de desensibilización sistemática mostraron mejorías inmediatas. Mas extensamente, Berman, Miller & Massman (1985) llevaron a cabo un meta análisis (ver capítulo 15) de estudios comparando la desensibilización sistemática con la terapia cognitiva en el tratamiento de los desórdenes de ansiedad. Berman et al. Concluyeron que la desensibilización sistemática y la terapia cognitiva son ambas efectivas y son duramente comparables la una con la otra en su eficacia. Interesantemente, los autores concluyeron además que las terapias que combinan los procedimientos cognitivos y los de desensibilización no son más efectivas que uno de los tratamientos por sí solo. Aunque ahora es aparente que la desensibilización sistemática es un efectivo tratamiento para los miedos y las fobias, es menos claro como la desensibilización sistemática consigue estos efectos. Más de 25 años atrás, Kazdin & Wilcoxon (1976) hicieron un análisis de la desensibilización sistemática y concluyeron que ninguno de los tres

principales pasos de este tratamiento (la relajación, el uso de la jerarquía de ansiedad y el pareamiento de la relajación y la jerarquía) son necesarios para la reducción de los miedos y las fobias. Más recientemente, Bouton (1994, 2000) demostró que el nuevo pareamiento de los estímulos que producen miedo con la relajación en la desensibilización sistemática no remueve la asociación original entre los estímulos y la respuesta de miedo del paciente. Más bien, ambas asociaciones están ahora disponibles, y el paciente puede reaccionar a los estímulos ya sea con el miedo o con la relajación, dependiendo de un número de diferentes factores (ver cuadro 14.1). La verdad es que esta perspectiva reciente puede llegar muy lejos en la explicación de por qué algunos pacientes quienes responden favorablemente a la desensibilización sistemática, en poco tiempo despliegan nuevamente la conducta de evitación de estímulos que provocaban el miedo original. La mayoría de los teóricos e investigadores de estos tiempos concuerdan en que la característica más importante de la desensibilización sistemática parece ser la exposición del paciente a los estímulos fóbicos o aversivos (Marks, 1987; Rachman, 1990). Basados en esta formulación, los investigadores ahora han comenzado a examinar la eficacia de la simple exposición de los individuos a los objetos o situaciones que producen miedo. Tratamientos de Exposición: Como es el caso de muchos procedimientos de terapia conductual, los tratamientos de exposición tiene su origen en los modelos animales de psicopatología. Por ejemplo, el psicólogo Martín Seligman de la University of Pennsylvania, demostró en los años 60 que una manera efectiva de enseñar a un perro que regrese a una caja que ha sido asociada previamente con shock, es forzando al perro dentro de la caja y prevenir este escape. De este modo, inicialmente el perro mostrará signos de considerable estrés, pero con el tiempo la ansiedad y emocionalidad se disiparán (extinguidas) y el perro será capaz de entrar a la caja para obtener comida, algunas veces no ha sido posible hacer esto antes de la exposición a la situación provocadora de ansiedad (Seligman, 1975; Seligman, Maier & Greer, 1968). ¿DESTRUYE LA EXTINCIÓN EL APRENDIZAJE ORIGINAL? El concepto de extinción es una parte integral del condicionamiento clásico lo cual se ha extendido también al condicionamiento operante. En el condicionamiento clásico, un estímulo que fue condicionado para producir una respuesta por medio de ser pareado con un evento de significancia biológica, pierde su habilidad de elicitar esta respuesta si es presentado en ausencia del evento de significancia biológica. Así por ejemplo, una serpiente que es pareada con el dolor de una mordedura para producir miedo, podría perder su habilidad de evocar miedo si esta es presentada repetidamente en ausencia de la mordedura dolorosa. Similarmente en el condicionamiento operante, la eliminación del reforzamiento de una conducta que ha sido reforzada en el

pasado podría, a la larga, reducir la frecuencia de esa conducta a cero. La habilidad de cambiar conductas en respuesta a la variación de las contingencias ambientales, como Pavlov observó tiempo atrás, es vital para una adaptación exitosa. Por muchos años, los psicólogos creyeron que el decremento o eliminación de la conducta por medio de la extinción era un reflejo de la destrucción del aprendizaje original (ver Rescorla, 1988, 2001). Similarmente el contracondicionamiento o la formación de nuevas asociaciones con el estímulo original, como es el caso de la desensibilización sistemática en la cual estímulo fóbico o aversivo es recondicionado con la relajación en vez de la respuesta ansiosa, se creyó que funcionaban debido a que la nueva asociación reemplazaba la original (ver Bouton, 2000). En realidad, Wolpe (1958) pensó que la respuesta de relajación condicionada en la desensibilización sistemática debilitaba el lazo entre el estímulo evocador de ansiedad y la respuesta ansiosa. Sin embargo, las investigaciones más recientes presentan serias dudas con esta perspectiva y nos están ayudando a ganar un mejor entendimiento del hecho de que, incluso después de que es extinguida o recondicionada la respuesta puede ocurrir nuevamente frente al estímulo original, fenómeno conocido como recuperación espontánea. Los resultados de estas investigaciones, los cuales tienen importantes implicaciones para las aproximaciones al tratamiento clínico orientadas conductualmente, sugieren que en vez de destruir las bases aprendidas de la conducta condicionada, la extinción y el contracondicionamiento dejan al menos parte del aprendizaje y las asociaciones en un lugar (Bouton 1994, 2000). Bouton (1994) argumenta que tanto el aprendizaje como la extinción están fuertemente afectados por el contexto en el cual tienen lugar. Por ejemplo, los métodos conductuales para el tratamiento del miedo y la ansiedad, a menudo involucran la exposición de los pacientes a los estímulos amenazantes hasta que su miedo se disipa o es extinguido. Sin embargo, los estímulos provocadores de miedo pueden aun elicitar el miedo bajo ciertas condiciones. Para explicar este hallazgo, Bouton y Swartzentruber (1991) sostienen que la extinción o el contracondicionamiento no causan un desaprendizaje del miedo. Mas bien los estímulos toman una segunda significación: ésta es ahora más ambigua de lo que fue originalmente (debido a que han sido pareados con ambos, el miedo y la relajación), y el que evoquen ansiedad o relajación dependerá del contexto en el cual estos son presentados. El contexto incluye tanto el medio ambiente físico como los estados internos tales como las emociones y los estados fisiológicos producidos por drogas. De hecho Bouton (1994) ha demostrado en un número de estudios que la respuesta de ansiedad original puede ser recuperada de forma relativamente fácil cuando el contexto original es presentado nuevamente. Observa, consecuentemente, que debido a que la extinción y el contracondicionamiento no necesariamente involucran el desaprendizaje de una asociación, existe siempre la posibilidad de que los pacientes recaigan luego del tratamiento clínico. Basado en el concepto de generalización, Bouton sugiere que es muy

probable la recaída o la recurrencia de las conductas desadaptadas pueda ser reducida mediante la ampliación del rango de contextos en los cuales las nuevas asociaciones (producidas ya sea por medio de extinción o contracondicionamiento) son aprendidas.

Los terapeutas conductuales basados en estos descubrimientos científicos, los cuales demuestran la efectividad de forzar a los perros a volver a las cajas en las cuales ellos habían experimentado inicialmente el miedo, comenzaron a desarrollar terapias de exposición para los tratamientos del miedo y las fobias el ejemplo más temprano de tales aproximaciones terapéuticas es la Terapia Implosiva o inundación (Stampfl & Levis, 1967; Wanderer & Ingram, 1990). La terapia implosiva intenta extinguir la respuesta de miedo mediante la exposición a las situaciones que elicitan miedo en individuos ansiosos y forzándolos a permanecer en aquellas situaciones hasta que su estado de activación (arousal) es reducido o eliminado. Es importante reconocer que esta aproximación al miedo difiere dramáticamente de los procedimientos de desensibilización. En la desensibilización sistemática o desensibilización en vivo el individuo es enseñado a relajarse y es expuesto lenta y gradualmente a situaciones que elicitan e incrementan el nivel de ansiedad; al individuo nunca se le permite más que un bajo nivel de ansiedad antes de retirar la situación. En contraste, la terapia implosiva involucra en muchos aspectos la aproximación opuesta, esencialmente comenzando en el tope de la jerarquía de ansiedad. No se le enseñan métodos de relajación al individuo; él o ella inmediatamente son ya sea expuestos o instruidos a imaginarse a sí mismos en la situación que más les produce ansiedad por un prolongado período de tiempo. Además, el paciente es instruido a ubicarse en el peor resultado que pueda tener una situación con el objetivo de elicitar los mayores niveles de ansiedad. Por ejemplo, a un paciente claustrofóbico se le puede instruir que se imagine estando en una pequeña habitación por 2 horas y que imagine que esa habitación se hace cada vez más pequeña. En la terapia implosiva, los individuos aprendes que no existen consecuencias aversivas a largo plazo aproximándose al objeto que produce miedo o permaneciendo en la situación que produce ansiedad. La gente ve que puede sobrevivir a sus peores miedos y que los estímulos que producen el miedo pierden su potencial de producir ansiedad. Los resultados de numerosos estudios corroboran la efectividad de los tratamientos para el miedo y fobias basados en la exposición. En las revisiones de estos estudios se examina la eficacia de la terapia

implosiva, Marks (1987) y Spiegler (1998) concluyeron que la exposición es un efectivo procedimiento para el tratamiento de una variedad de desordenes de ansiedad y es generalmente más efectiva que la desensibilización sistemática. Dando soporte a su efectividad, DeRubeis y CritsChristoph (1998) incluyeron la terapia de exposición como un soporte empírico para el tratamiento de la fobia social, agorafobia, desorden de pánico y desorden de estrés post-traumático. Como es de esperar, la terapia implosiva inicialmente causa más estrés entre los pacientes que la desensibilización sistemática, y por esa razón algunos terapeutas se sienten más cómodos usando la desensibilización sistemática. En respuesta a esta preocupación, la exposición gradual ha sido usada crecientemente en la terapia conductual. En este procedimiento los pacientes son expuestos inicialmente a estímulos que evocan solo niveles mínimos de ansiedad y luego gradualmente progresan a estímulos más estresantes y productores de ansiedad. Es interesante la evidencia existente de que la exposición gradual puede ser más efectiva que la exposición intensiva (Spiegler, 1998). Una variante de terapia implosiva, conocida como prevención de respuesta, ha sido usada exitosamente en el tratamiento de los desórdenes obsesivo – compulsivos (Por ej., Salkovskis & Kirk, 1989). Los pacientes con desórdenes obsesivo – compulsivos (OCD) se caracterizan por pensamientos y conductas no deseados que no pueden detener. En la prevención de respuesta, los pacientes son expuestos al estímulo que elicita sus pensamientos obsesivos pero se previene que realicen las conductas obsesivas que utilizan para reducir la ansiedad asociada con el estímulo, Por ejemplo, en el caso de un obsesivo – compulsivo lavador de manos, el tratamiento de prevención de respuesta puede consistir en la exposición del paciente a la suciedad y luego se previene que el paciente lave sus manos. Típicamente, las sesiones de exposición y prevención de respuesta son continuadas por extendidos períodos de tiempo (Por ej., 2 horas diarias por varias semanas) y son combinadas con tareas asignadas para el hogar. Numerosos estudios han documentado la efectividad de la exposición y prevención de respuesta en el tratamiento del OCD. Por ejemplo, en un temprano estudio Foa y Goldstein (1978) demostraron que la combinación de exposición y prevención de respuesta es más efectiva que si se utiliza cada componente solo. Positivos resultados subsecuentes fueron además reportados por Foa, Kozak, Steketee & McCarthy (1992), Marks (1987) y Rachman & Hodgson (1997). En una revisión reciente, Abramowitz (1996) reportó que la terapia de exposición supervisada es más efectiva que la exposición autocontrolada en el tratamiento del OCD y que la adición de la

prevención de respuesta a la terapia de exposición rinde mejores resultados que al hacer la exposición sola. Esta técnica ha sido además aplicada en pacientes que sufren de bulimia nerviosa, basándose en el supuesto de que el comer comidas altas en calorías induce la ansiedad y el miedo a subir de peso y que purgando, por lo tanto, se reduce la ansiedad. Desde esta perspectiva, la bulimia es tratada dándole a los pacientes bulímicos comidas altas en calorías en la oficina del terapeuta (exposición) teniendo entonces el paciente que permanecer en la oficina con el terapeuta hasta que el impulso de vomitar y la ansiedad asociada se hayan disipado (prevención de respuesta). Estudios tempranos han reportado ser exitosos usando la exposición acompañado de la prevención de respuesta en el tratamiento de la bulimia (Por ej., Cooper & Steere, 1995; Leitenberg, Rosen, Gross, Nudelman & Vara, 1988; G. T. Wilson, Rossiter, Kleifield, & Lindholm, 1986). Los resultados de estudios más recientes sugieren que el componente de la terapia cognitiva conductual que la hace efectiva en el tratamiento de la bulimia es la exposición y no la prevención de respuesta. G. Terence Wilson, un psicólogo clínico de Rutgers University, ha conducido varios elegantes estudios durante la década pasada demostrando que, la terapia cognitivo conductual es el tratamiento más efectivo para la bulimia y que la prevención de respuesta no mejora la efectividad de esta terapia (Wilson, Eldredge, Smith & Niles, 1997; ver además Agras, Schneider, Arnow, Raeburn & Tekh, 1989). G. T. Wilson y Fairburn (en prensa) presentan una discusión comprensiva de la efectividad de la terapia cognitivo – conductual en el tratamiento de los desórdenes alimenticios, apoyando claramente el uso de esta aproximación para el tratamiento de la bulimia. Un asunto interesante y que concierne a como funcionan la exposición, la relajación y la desensibilización sistemática en el tratamiento de la ansiedad cuando son comparadas con la farmacoterapia (tratamiento por medicación). Gould, Otto, Pollack y Yap (1997) recientemente examinaron este asunto llevando a cabo un meta – análisis de 35 estudios que incluyeron un total de 61 intervenciones de tratamiento distintas para el desorden de ansiedad generalizada (GAD), incluyendo desensibilización sistemática, exposición relajación, reestructuración cognitiva y tratamiento farmacológico para la ansiedad. En las bases de su análisis, Gould et al. llegaron a dos importantes conclusiones: Primero, que tanto la terapia cognitivo – conductual como la farmacoterapia son tratamientos efectivos para el GAD, y segundo, que no hay diferencias sustanciales entre esos dos tipos de tratamiento. Sería importante en futuras investigaciones examinar si la combinación

de terapia cognitivo – conductual y los medicamentos antiansiedad son más efectivos que cada tratamiento por separado. PERSPECTIVAS DE TEORÍAS CONTEMPORÁNEAS DE APRENDIZAJE SOBRE LA ETIOLOGÍA DE MIEDOS Y FOBIAS Susan Mineka & Jon Sutton Fear and Learning: From Basic Process to Clinical Implications, 2006, A.P.A. Capítulo 4. (p.75 – p.98)

Los psicólogos clínicos han estado mucho tiempo interesados en la causa de los desordenes mentales, y durante años las fobias parecieran tener quizás las más adelantadas explicaciones etiológicas. Watson y Rayner (1920) publicaron el primer estudio en humanos de condicionamiento clásico al miedo utilizando al pequeño Albert. Aunque el pequeño Albert inicialmente no le tenía miedo a las ratas blancas, desarrolló un intenso miedo de características fóbicas a las ratas blancas luego de que se había asustado con un fuerte sonido en presencia de las ratas por muchas veces. Las ideas de que las fobias son simplemente manifestaciones de un condicionamiento clásico intenso al miedo llego a dominar la perspectiva conductual, y pocos psicólogos de hoy se atreverían a negar que el condicionamiento clásico es un mecanismo capaz de producir fobias. Uno de los mayores atractivos de esta perspectiva fue su simplicidad. Si la gente en ocasiones desarrolla miedos o fobias a través de un simple condicionamiento clásico (el cual puede ser muy poderoso, especialmente con eventos altamente traumáticos), ¿por qué no hipotetizar que este es el mecanismo en que la mayoría de la gente desarrolla miedos y fobias? Más aún, miles de experimentos de condicionamiento al miedo se han realizado, y el fenómeno parece ser bastante confiable y válido. Con el tiempo pareció ser que el condicionamiento traumático directo no era suficiente ni necesario para explicar el origen de la totalidad de miedos y fobias, y por lo tanto una parte de científicos clínicos abandonaron esta primera visión del condicionamiento clásico y le adscribieron una importancia secundaria o auxiliar. Sin embargo, como nosotros intentamos demostrar aquí, las razones para este abandono son erróneas. Nosotros presentamos una nueva y revitalizada explicación asociativa para la totalidad de miedos y fobias. En particular ilustramos algunos de los avances realizados por los científicos del aprendizaje básico que permiten a los científicos clínicos tener un entendimiento más sofisticado y claro de los orígenes de miedos y fobias. Una de las primeras críticas de la perspectiva clásica [o pavloviana] simple fue que mucha gente con miedos o fobias no podía recordar una historia o evento traumático de condicionamiento clásico en el origen de sus fobias, y así la explicación original de los conductistas ciertamente no podía explicar todos los casos. Aunque esto podía involucrar un simple olvido del incidente original, llegó a ser claro que otras dos vías asociativas se encontraban involucradas en la adquisición de algunos miedos y fobias (e.g., Mineka, 1985; Rachman, 1990). Una es el condicionamiento observacional o vicario. En este, la simple observación de otra persona que parece asustada en la presencia de un objeto o en ciertas situaciones puede resultar en la adquisición de miedos y fobias en el observador. La otra vía

es el aprendizaje verbal o instruccional. En este caso, una persona puede adquirir miedo simplemente a través de ver, escuchar o leer una información terrorífica acerca de un objeto o situación. Una segunda crítica fue que no sólo los eventos de condicionamiento directo son innecesarios para el desarrollo de fobias, ellos también son insuficientes. Específicamente, la crítica a la original explicación asociativa fue que muchos individuos con historias de condicionamiento observacional o directo no desarrollaban miedos o fobias (e.g., Rachamn, 1990). Lo que estos investigadores ignoraron son las variables individuales diferenciales que influyen dramáticamente en cómo y si los individuos desarrollarán un miedo o fobia seguido de un evento dado, o si muestran un miedo persistente en el curso del tiempo. Sólo a través del entendimiento de estas variables de los sujetos podemos nosotros comenzar a entender por qué muchos individuos que han sufrido eventos traumáticos no desarrollan miedos o fobias (e.g., Mineka, 1985; Mineka & Zinbarg, 1996). Finalmente, la mirada original y simple del condicionamiento ignoró otras variables que afectan el resultado de una particular experiencia de aprendizaje – que es concerniente a la naturaleza de los potenciales objetos fóbicos. Es más probable que la gente desarrolle miedos y fobias con ciertos objetos o situaciones más que con otros. Pareciera que tuviéramos una preparación biológica para asociar más rápidamente ciertos hechos terroríficos con ciertos objetos o situaciones, que tendría relación con nuestros primeros ancestros. APRENDIZAJE OBSERVACIONAL E INSTRUCCIONAL DE MIEDOS Y FOBIAS. Como se ha notado anteriormente, además del condicionamiento traumático directo, otras dos vías asociativas han sido propuestas: el condicionamiento observacional y el aprendizaje instruccional (Raciman, 1990). Observaciones anecdóticas han sugerido por largo tiempo que la gente puede adquirir miedos intensos o fobias simplemente mirando otros individuos comportándose de manera asustada en la presencia de un objeto o situación potencialmente fóbico. Estudios retrospectivos de humanos con fobias han confirmado estas observaciones anecdóticas para una pequeña pero significativa proporción de estos estudiados. Por ejemplo, Öst y Hugdahl (1981) encontraron que el 17% de su muestra de personas con fobias específicas reportaron experiencias de condicionamiento vicario como centralmente involucradas en el origen de sus fobias (40% para gente con fobia a animales). Además, Muris y Merckelbach (2001) revisaron ocho estudios acerca de niños con fobias y reportaron un amplio rango de estimaciones para las experiencias de modelamiento como al menos parcialmente responsables del origen de la fobia de los niños (rango de 8% a 73%). Los estudios retrospectivos tiene enormes limitaciones, sin embargo, dado que ellos dependen en las memorias falibles de las personas, a menudo sobre largos periodos de tiempo y bajo condiciones que tienden a reducir más que promover un recuerdo preciso (véase la sección de conclusiones de este capítulo). Así, siempre que sea posible, es

preferible confiar en estudios que utilizen metodologías experimentales para mostrar que dicho aprendizaje observacional puede ocurrir. De hecho, muchos experimentos han mostrado que sujetos bajo condicionamiento observacional adquieren respuestas condicionadas (RCs; más a menudo indicado por respuestas electrodérmicas) a estímulos condicionados previamente neutros (ECs) después de observar a otro individuo quien ostensiblemente experimenta miedo o dolor por golpes eléctricos en la presencia de ese EC (véase Green y Osborne, 1985). Sin embargo, esos estudios son limitados porque, por razones éticas, los “miedos” condicionados no pueden ser intensos y persistentes como los miedos fóbicos y por lo tanto no pueden decirnos si estos pueden ser adquiridos por la sola observación. Afortunadamente estudios relacionados con primates no humanos han ayudado a clarificar la verdadera potencia del condicionamiento observacional. En los 80s, Mineka, M. Cook, y colegas demostraron que monos rhesus sin experiencia criados en laboratorio que inicialmente no tenían miedo a las serpientes podían adquirir fácilmente un intenso miedo fóbico a través de aprendizaje vicario. Monos observadores no temerosos observaron un mono modelo criado en la naturaleza, relacionado o no relacionado y no familiar, que tenía un intenso miedo fóbico a las serpientes. El mono fóbico se comportaba temerosamente ante la presencia de serpientes reales o de juguete y no temerosamente ante la presencia de objetos neutrales (e.g. M.Cook, Mineka, Wolkenstein, y Laitsch, 1985; Mineka, Davidson, Cook, y Keir, 1984). Más aún, este aprendizaje por monos observadores ocurría rápidamente y era altamente persistente, sin signos de disminución en un seguimiento de 3 meses después. De hecho, en un experimento, miedo significativo a las serpientes fue adquirido luego de solo 4 minutos de exposición a un modelo comportándose temerosamente (Mineka y Cook, 1993). Incluso, el máximo monto de exposición que cualquier observador tuvo a un modelo comportándose temerosamente con las serpientes fue de 24 minutos. El miedo que el mono observador adquiría era comparablemente intenso al miedo del mono modelo; los antiguos observadores podían además servir como modelos para otros monos no relacionados, quienes a su vez adquirían un intenso miedo a las serpientes (M. Cook et al, 1985). Finalmente, monos observadores también adquirían un intenso miedo a las serpientes simplemente observando cintas de video de modelos comportándose temerosamente con serpientes (M. cook y Mineka, 1990). Así, esta serie de experimentos con monos inicialmente no temerosos claramente demostraron que el rápido condicionamiento observacional de un intenso y persistente miedo puede ocurrir. Este modelo primate ha sido considerado por mucho como una poderosa evidencia de que un intenso y persistente miedo fóbico puede ser aprendido por sola observación. Más aún, varios otros estudios con niños también apoyan la influencia del modelamiento parental en el incremento de los miedos de los niños, al menos a corto plazo. Por ejemplo, Gerrul y Rapee (2002) estudiaron niños de 17 meses de edad que observaron a sus madres demostrar miedo y disgusto (tanto con expresiones faciales como verbalizaciones negativas) a una serpiente de goma (o araña) por sólo un minuto. Estos niños mostraron mayores expresiones de miedo y evitación hacía ese objeto 10 minutos después, incluso aunque la madre había cambiado y expresó emociones neutrales hacía la serpiente (o araña) luego del primer minuto. Desafortunadamente, no hubo testeos

posteriores para determinar por cuánto tiempo duraba la influencia del modelamiento parental. Este estudio ilustra hermosamente la importante influencia que incluso pequeñas demostraciones de miedo por parte de los padres pueden tener en los miedos de sus niños, al menos en el corto plazo. Mucho menos evidencia está disponible en relación al rol del aprendizaje instruccional o verbal en el origen de los miedos. Estudios retrospectivos (con todas sus limitaciones) indican que un número pequeño pero significativo de personas reportan que leer o escuchar información atemorizante acerca de algún objeto o situación llevó al desarrollo de sus fobias (e.g., Öst y Hugdahl, 1981). Hay, sin embargo, sólo pocas demostraciones actuales de que los miedos pueden ser aprendidos de esta manera en el laboratorio, e incluso estos estudios documentan sólo que dicho aprendizaje puede influenciar los niveles de miedo, dejando abierta la cuestión de cómo estos miedos podrían desarrollarse en fobias. En uno de esos estudios, niños con edades entre 7 y 9 años fueron expuestos a información negativa por parte de un adulto en la forma de una historia acerca de un monstruo de juguete e información positiva acerca de otro monstruo de juguete (Field y Lawson, 2003). El miedo autoreportado al monstruo de juguete pareado con la historia de miedo se incrementó, mientras que el miedo autoreportado al monstruo de juguete pareado con la historia agradable decreció. Más aún, los niños también mostraron conductas evitativas al monstruo de juguete asociado con la historia atemorizante, así como también mostraron un cambio de actitud hacia el monstruo de juguete (utilizando una tarea de actitudes implícitas). En otro estudio con niños de un rango de edades entre 4 y 12 años, también se encontró cambios similares en el autorreporte de miedo luego de una semana después de parear un animal desconocido similar a un perro llamado “la bestia” con información negativa a través de un cuento (Muris, Bodden, Merckelbach, Ollendik & King, 2003). Sin embargo, Muris y sus colegas también reconocieron que la mera exposición a información negativa produce con poca probabilidad miedos intensos y conductas evitativas que son las que caracterizan a las fobias clínicas. En cambio, la información negativa puede inicialmente establecer expectativas que luego podrían potenciar los resultados de episodios de condicionamientos observacionales directos (e.g., Daddys, Davey & Field, 2001). En síntesis, hay evidencia mucho más fuerte sobre el condicionamiento observacional como vía de origen de algunas fobias, que evidencia sobre el aprendizaje instruccional. Sin embargo, las experiencias de aprendizaje instruccional podrían fácilmente llevar al desarrollo de miedos leves al menos en niños (aunque no conocemos cómo pasan a incrementarse). Más aún, esto en cambio podría potenciar el resultado de las experiencias de condicionamiento observacional directo. DIFERENCIAS INDIVIDUALES EN LA VULNERABILIDAD O RESISTENCIA A MIEDOS Y FOBIAS Como se señaló anteriormente, las experiencias de aprendizaje no son suficientes para el desarrollo de miedos y fobias. En cambio, hay variables de temperamento y de la

experiencia del sujeto en las cuales los individuos difieren enormemente y afectan el resultado de algunas de las experiencias de aprendizaje, a veces incrementando la vulnerabilidad, y otras disminuyéndola. Más aún, estas variables pueden actuar por sí solas o en combinación afectando cuanto miedo es experimentado en una situación atemorizante, así como cuánto miedo se adquiere y se mantiene en el futuro. Estas variables no fueron reconocidas previamente dada la negación relativamente sistemática por la mayoría de los investigadores acerca del poderoso rol que jugaban las variables de personalidad, el temperamento, así como las experienciales en la adquisición de miedos y fobias. Esto sucedió, en parte, por el exceso de confianza en extrapolar desde estudios de condicionamiento simple, donde animales sin experiencia previa se sometían a entrenamiento en cajas de condicionamiento, protegidos de cualquier estimulo ambiental extraño. Más aún, a animales de un experimento dado que eran todos de la misma camada (y por lo tanto tenían “temperamentos” similares) y que fueron criados de la misma manera, se les examinó diferencias individuales con los estímulos usados en la fase de condicionamiento. Todos estos factores prevenían encontrar diferencias individuales en el resultado del condicionamiento. Notablemente, las variaciones en las diferencias individuales en su mayor parte fueron consideradas como un factor molesto por los investigadores del condicionamiento dado que ellos estaban interesados en comprender los principios generales del aprendizaje asociativo. Incluso lo desestimaron los científicos clínicos quienes extrapolaron estudios con animales a lo que debería suceder en el condicionamiento de humanos que ocurre en la vida cotidiana. Obviamente, los humanos en su sometimiento cotidiano al condicionamiento raramente son ignorantes con respecto a los estímulos con los que se enfrentan o independientes de variables extrañas que pueden afectar el resultado del condicionamiento. Más aún, individuos bajo las mismas contingencias claramente tienen diferencias temperamentales así como diferencias en sus experiencias antes, durante, y después de las experiencias de condicionamiento. Variables temperamentales Pavlov (1927) inicialmente realizó observaciones sistemáticas de que sus perros tenían diferentes “temperamentos” que afectaban la rapidez de las respuestas condicionadas excitatorias e inhibitorias en formación, así como su estabilidad una vez adquiridas. Posteriores investigaciones extensivas en ratas también mostraron que hay una significativa contribución genética o temperamental a la formación de asociaciones aversivas en animales (cf. Gray, 1987, para una revisión). Diferencias similares también ocurren en humanos (e.g., Levey & Martin, 1981; Zinbarg & Mohman, 1998). Estudios longitudinales iniciados en 1980s por Kagan, Biederman y colegas entregaron importantes datos acerca de las diferencias en la facilidad para adquirir miedos en niños pequeños con temperamentos comportamentalmente inhibidos o no inhibidos. Los niños definidos como comportamentalmente inhibidos son tímidos, temerosos, y fácilmente estresables, y esto puede ser medido a una edad relativamente temprana. Estos investigadores (e.g., Biederman et al., 1990) mostraron que los niños categorizados como comportamentalmente

inhibidos a los 21 meses de edad tenían un mayor riesgo de desarrollar múltiples fobias específicas de los 7 a 8 años de edad del que tenían los niños no inhibidos (32% vs. 5%). Más aún, ellos además mostraron mayores niveles de ansiedad social generalizada a los 13 años (e.g., Scwartz et al., 1999). Aunque este estudio no demostró que los efectos de la inhibición comportamental en el desarrollo de fobias son de hecho mediados por diferencias en condicionabilidad, este será un importante mecanismo potencial de mediación para testear en el futuro (e.g., Mineka y Zinbarg, 1996). Variables experienciales Como se notó anteriormente, los seres humanos bajo condicionamiento en sus vidas diarias varían tremendamente en términos de su experiencia previa tanto con los ECs como con los estímulos incondicionados (EIs) involucrados, así como en sus experiencias generales de vida ellos pueden derivar hacía un sentido de maestría (o desesperanza). Así, ellos no son directamente análogos a animales sin experiencia bajo procedimientos de condicionamiento en cámaras aisladas en un laboratorio, tal como ahora ilustraremos. Efectos de diferencias individuales preexistentes El bien conocido fenómeno de la inhibición latente (e.g., Lubow, 1998) claramente muestra que la exposición previa de un organismo a un EC neutral antes de ser pareado con un EI aversivo reduce la condicionabilidad de ese EC. Específicamente, cuando la gente o los animales tienen experiencia previa con un EC antes de una experiencia de condicionamiento aversiva, el monto de miedo condicionado se ve generalmente disminuido en comparación a lo que ocurre con un EC verdaderamente novedoso. Varios estudios acerca de fobias han reportado resultados consistentes con este fenómeno. Por ejemplo, niños que han tenido más encuentros no traumáticos previos con dentistas tienen menos probabilidades de desarrollar fobia dental si se traumatizan subsecuentemente que aquellos con menos encuentro no traumáticos previos (e.g., Kent, 1997). Incluso una atenuación más poderosa del condicionamiento puede ocurrir cuando un observador efectivamente mira primero a otra persona comportándose de una manera no temerosa con un EC neutral (algún objeto o situación) antes de tener una experiencia aversiva directa o observacional con ese EC. Mineka y Cook (1986) demostraron esto utilizando su modelo primate de la adquisición de miedos. Tres grupos de ocho monos no temerosos cada uno pasaron a través de uno o tres pretratramientos por seis sesiones. El grupo de inmunización primero observó un modelo mono no temeroso comportándose no temerosamente frente a serpientes y otros objetos; el grupo de inhibición latente primero tuvo exposicones por sí mismos a las serpientes y otros objetos por el mismo monto de tiempo que tuvo el grupo de inmunización (pero no con modelos no temerosos); y el grupo control de pseudoinmunización primero tuvo exposiciones a modelos monos no temerosos comportándose no temerosamente frente a objetos neutrales (pero no frente a serpientes). Subsecuentemente, los tres grupos siguieron el protocolo estandar de seis sesiones de condicionamiento observacional descrito anteriormente en el cual todos observaron a un mono temeroso comportándose temerosamente frente a serpientes. Tal como se hipotetizó, el grupo de inmunización no mostró una adquisición significativa de miedo a las serpientes,

mientras que el grupo de pseudoinmunización mostró una fuerte y robusta adquisición de miedo a las serpientes. El grupo de inhibición latente fue intermedio: los miembros de este grupo mostraron una adquisición significativa de miedo a las serpientes, pero su nivel de miedo no difirió significativamente de los otros dos grupos, bastante probablemente debido a un limitado poder estadístico. Aunque no tenemos conocimiento de ningún estudio en humanos que demuestre este fenómeno de inmunización, parece probable que niños que tienen experiencias de inmunización con padres no temerosos (o quizás un par) comportándose de una manera no temerosa frente al objeto o situación fóbica temido por otro padre o par, serán inmunizados, ya sea completa o parcialmente, de cualquier efecto de observar posteriormente a un padre o par temeroso comportándose temerosamente. Clínicamente, esto podría sugerir que si padres fóbicos están preocupados de transmitir su propia fobia a sus niños, ellos debiesen asegurarse de que sus niños tengan abundantes exposiciones a alguien comportándose no temerosamente con su propio objeto fóbico antes de permitirle a sus niños verlos comportarse temerosamente con ese objeto. Tanto la inhibición latente como la inmunización envuelven los efectos de experiencias previas con potenciales objetos o situaciones fóbicas antes de cualquier experiencia de aprendizaje aversivo. Las experiencias previas de un individuo con respecto a tener la capacidad de controlar su ambiente tienen también efectos más generales en el miedo y el condicionamiento al miedo. De hecho, psicólogos del desarrollo interesados en el desarrollo socioemocional han notados desde hace tiempo que infantes y pequeños niños que son criados con un sentido de maestría y control sobre aspectos importantes de su medios tienen relaciones de apego más seguras y son menos temerosos y más capaces de arreglárselas con situaciones novedosas, atemorizantes y estresoras (e.g., horpita, 2001; Watson, 1979). Estas ideas están necesariamente basadas en los resultados de estudios correlacionales, sin embargo, y son por lo tanto no concluyentes debido a que los ambientes que promueven un sentido de control y maestría usualmente poseen otras características positivas relacionadas que podrían de hecho estar jugando el rol causal crítico (e.g., Ainsworth, Velar, Waters, y Wall, 1978). Afortunadamente, evidencia experimental para estas conclusiones provienen de una investigación experimental longitudinal con monos rhesus infantes que fueron criados en ambientes controlables versus incontrolables durante el primer año de vida (Mineka, Gunnar, y Champoux, 1986). En los ambientes controlables, los dos grupos de cuatro “monos maestros” tenían palancas para apretar y cadenas para tirar para así obtener comida, agua, y cuidados. En los ambientes incontrolables, los dos grupos de cuatro “monos ligados” recibían el mismo acceso a comida, agua, y cuidados, pero estos eran entregados de manera incontrolable cada vez que un mono maestro obtenía un reforzador1 (i.e., su manipulanda era inoperante). Cuando fueron evaluados en varias situaciones atemorizantes y novedosas entre los 7 y 11 meses de edad, los monos maestros criados con control se adaptaron más rápidamente en varias situaciones provocadoras de temor en comparación con los monos ligados criados sin control. Los monos maestros mostraron además más comportamiento exploratorio cuando fueron puestos en una gran pieza no familiar de

juegos para primates. Así, experiencias tempranas con el control y la maestría sobre reforzadores positivos parece afectar el nivel de miedo que eventos novedosos o atemorizantes evocan, emulando lo que se cree que ocurre en el desarrollo humano temprano. De esta manera, aprender un sentido de control o maestría puede disminuir el condicionamiento al miedo ya sea por disminuir la intensidad de las reacciones a eventos atemorizantes o aumentando el nivel de habituación a él (o ambos). Desde un punto de vista clínico, estos resultados sugieren que individuos criados con un sentido de maestría sobre su ambienten bien podrían mostrar una susceptibilidad reducida a desarrollar miedos, fobias, y algunos otros desórdenes de ansiedad (véase también Chorpita, 2001; Mineka y Zinbarg, 1996) Efectos de las diferencias individuales en las experiencias durante un evento de Aprendizaje Cuando un animal o una persona se somete a un condicionamiento pavloviano en un encuadre experimental, no tiene control sobre el comienzo o la desaparición ni del EC ni del EI ya que los eventos del condicionamiento están todos bajo control experimental. Cuando el condicionamiento pavloviano ocurre durante nuestras vidas diarias, sin embargo, no hay un experimentador controlando el tiempo de los ECs o los EIs, y frecuentemente los individuos tienen algún control sobre el EI, como por ejemplo cuándo terminará. Tener control sobre la terminación del EI tiene poderosos efectos en qué tanto miedo es condicionado. De hecho, la literatura del condicionamiento animal indica que shocks incontrolables condicionan ansiedad a ECs neutrales más poderosamente que lo que lo hacen el mismo monto de shocks controlables (e.g., Mineka, Cook, Y Millar, 1984; Mowrer y Viek, 1948). Efectivamente, Mineka, Cook, y Miller (1984) encontraron que los niveles de ansiedad condicionados con shocks inescapables era el doble de alto que los niveles de ansiedad condicionados con exactamente el mismo monto de shocks escapables. Así, las dinámicas del condicionamiento pavloviano son dramáticamente afectadas por la controlabilidad del EI. Lo que esto significa clínicamente es que los humanos bajo experiencias de condicionamiento traumático debiesen adquirir mucho menos miedo si tienen alguna habilidad para escapar de dicho trauma (e.g., corriendo lejos) en vez de verlo terminado independiente de sus propias respuestas (con un mismo monto de exposición al trauma). Efectos de las diferencias individuales en lo que ocurre luego del condicionamiento Luego de que un cierto nivel de miedo se adquiere a través de condicionamiento directo o vicario, ese nivel de miedo usualmente se mantiene a través del tiempo, a menos que ocurran ensayos de extinción. Sin embargo, la memoria del miedo puede ser manipulable (véase, Hendersen, 1985; Mineka y Zinbarg, 1996). Por ejemplo, Rescorla (1974) decubrió el efecto de inflación en el cual ratas que primero fueron condicionadas a mostrar un miedo pequeño a un EC (utilizando un EI medio) posteriormente fueron expuestas con presentaciones al azar a un EI mas fuerte (no pareadas con el EC). Cuando las ratas fueron luego testedas ante el EC, su nivel de miedo se incrementó como si el EC hubiera sido pareado con el EI fuerte en un principio. Más aún, el EI más fuerte no necesariamente debe ser el mismo EI que se usó en el condicionamiento inicial. Así, por ejemplo, una persona

que adquiere un miedo leve a los automóviles luego de un pequeño accidente podría luego mostrar un intenso miedo a los automóviles si viviera un asalto (vea White & Davey, 1989). Hendersen (1985) también demostró que a mayor intervalo entre que ocurre el condicionamiento y ocurre la exposición al EI más intenso, mayor la magnitud del efecto de inflación. Hendersen noto que es como sí el organismo tuviese una representación del EI original que puede ser alterada a través experiencias posteriores con EIs más intensos; más aún, la manipulabilidad de la memoria del miedo se incrementa con el tiempo desde que el condicionamiento original ocurrió. Más recientemente, Davey describio un fenómeno relacionado en humanos llamado reevaluación del EI en el cual incluso la información transmitida socialmente acerca del EI adquirida luego del condicionamiento puede resultar en niveles incrementados de miedo (e.g., Dadds et al., 2001). Así por ejemplo, si una persona adquiere información verbal de que el EI es más peligroso o traumático de lo que había sido durante el condicionamiento, ello puede ser suficiente para que su nivel de miedo se incremente. Incluso la repetición mental de pareaciones EC-EI luego del condicionamiento pueden también aumentar la fuerza de una RC leve en el laboratorio (Davey y Matchett, 1994). ASOCIACIONES SELECTIVAS Y LA DISTRIBUCIÓN NO AZAROSA DE MIEDOS Y FOBIAS Otra importante variable que afecta si la gente desarrollará un miedo o una fobia se relaciona con la naturaleza del EC que está presente durante el aprendizaje. Seligman (1971) fue el primero en sistematizar observaciones de que los miedos y fobias parecen desarrollarse mucho más frecuentemente a ciertos objetos o situaciones que a otros. Por ejemplo, miedos y fobias a las serpientes, arañas, alturas, espacios cerrados, y agua son mucho más comunes que a los autos, bicicletas, y armas, incluso aunque quizás las últimas pueden ser pareadas con trauma en la sociedad contemporánea. Seligman hipotetizó que esto es porque temprano en nuestra historia evolucionaria, una ventaja selectiva fue desarrollada por los animales que rápidamente adquirían miedos intensos a objetos o situaciones que frecuentemente eran peligrosas o poseían alguna amenaza en comparación con animales que no adquirían dichos miedos tan rápido. Estas observaciones clínicas tempranas en relación a la distribución no azarosa de los miedos y fobias fueron sistematizadas en varios estudios que examinaban los contenidos de fobias de varios individuos diagnosticados con fobias específicas (e.g., de Silva, Rachman, y Seligman, 1977, para una revisión, véase Öhman y mineka, 2001). Evaluadores entrenados estimaron la preparación biológica de los contenidos de estas fobias en una escala de 1 a 5. Una evaluación de 4 y 5 indicaba que el objeto o situación fóbica era probable o casi seguramente peligroso para los humanos pretecnológicos, mientras que evaluaciones de 1 y 2 indicaba que el objeto o situación fóbica era probable o casi seguramente no peligroso para humanos pretecnológicos. Como fue predicho, la mayoría de las fobias fueron evaluadas de 4 a 5. Asociaciones selectivas

Investigaciones experimentales proveen evidencia incluso más fuertes para varios aspectos de la teoría de Seligman de la preparación de las fobias. A mediados de los 70s, Öhman y sus colegas en Suecia iniciaron una larga serie de estudios experimentales de condicionamiento humano acerca de la asociabilidad selectiva de ECs relevantes (en relación a la adquisición del miedo) con EIs aversivos. Ellos compararon el condicionamiento cuando un shock leve como EI fue pareado o con un EC que parecía ser relevante para el miedo (por ejemplo serpientes, arañas o caras hurañas) o con EC que podrían ser irrelevantes (por ejemplo flores, callampas, figuras geométricas o caras felices). Las variables dependientes psicofisiológicas más usadas fueron las respuestas electrodermicas, aunque en algunas oportunidades otras variables dependientes también fueron medidas, tales como la tasa cardiaca o respuestas de contracción (de las respuestas que controlan los músculos al fruncir la cara, que son observadas en el condicionamiento con estímulos faciales). Numerosos experimentos encontraron que las RCs a los ECs relevantes fueron mucho mas resistentes a la extinción que las RCs a los ECs irrelevantes (para una revisión vea Öhman & Mineka, 2001). Más aún, las respuestas se daban con un solo ensayo al utilizar estímulos relevantes al miedo, lo que no ocurre con estímulos irrelevantes. Investigaciones siguientes también demostraron una diferencia cualitativa en la naturaleza de la RC en relación con los estímulos relevantes al miedo versus los no relevantes. Por ejemplo, E. Cok, Hodges y Lang (1986) señalaron que con ECs relevantes y mediciones de tasa cardíaca como medida dependiente, las respuestas cardiacas mostraban una fuerte aceleración seguidas de una breve desaceleración. En cambio, las tasas cardiacas ante ECs irrelevantes al miedo, mostraban sólo una fuerte desaceleración (tal como el que se encuentra comúnmente en el condicionamiento cardiaco usando ECs irrelevantes al miedo). Similarmente, Dimber (1987) comparó el condicionamiento usando caras felices versus enojadas como ECs, pareando con shocks leves como EIs. Él encontró que las RCs a las caras enojadas (pero no a las felices) incluían actividad estriada, aceleración de la tasa cardiaca, y miedo autoreportado. Tal como fue revisado por Öhman y Mineka (2001), estos y otros resultados acerca de diferencias cualitativas en el condicionamiento al miedo de ECs relevantes versus irrelevantes al miedo sugieren que verdaderas respuestas defensivas, indicadas por conductas de defensa activa, sólo son condicionables con ECs relevantes al miedo. Con ECs irrelevantes al miedo, las RCs típicas son respuestas de orientación fortalecidas. Aunque estas series de experimentos proveen un fuerte apoyo al concepto de asociaciones selectivas, dos fuertes limitaciones impiden a esta línea de trabajo por si sola servir como un modelo completo para la adquisición de fobias. Primero, por razones éticas, los miedos condicionados en todos estos experimentos con humanos necesariamente deben ser de leve intensidad y transitorios, y por lo tanto no podemos estar seguros de que diferencias similares ocurrirán en el condicionamiento de intensos y duraderos miedos de nivel fóbico. Segundo, los humanos en estos experimentos por supuestos tienen asociaciones previas basadas en la ontogenia en relación a los ECs relevantes e irrelevantes al miedo utilizados. Por lo tanto, no podemos estar seguros de que las diferentes características observadas en el condicionamiento de ECs relevantes al miedo realmente derivan de fuentes filogenéticas o

evolucionarias (como opuestas a ontogenéticas o del desarrollo) como la teoría de la preparación sostiene (véase Mineka y Öhman, 2002a; Öhman y Mineka, 2001). Por estas razones, Mineka y M. Cook usaron su modelo primate para testear si efectos similares serían observados en monos observadores no temerosos expuestos a objetos relevantes o irrelevantes para el miedo. Sus experimentos iniciales revisados anteriormente ilustraron que una rápida, robusta y duradera fobia a las serpientes podía ser adquirida observacionalmente, pero no testearon si un aprendizaje similar ocurriría con objetos irrelevantes al miedo. Para hacer esto, fue necesario igualar el nivel exacto de miedo mostrado por los modelos a los estímulos relevantes e irrelevantes para el miedo. Esto fue logrado usando técnicas de edición de video. De esta manera las reacciones de miedo de los modelos monos a serpientes de verdad podían mostrarse como si hubiesen sido exhibidas frente a, por ejemplo, flores de colores brillantes o una serpiente de juguete. En un experimento, un grupo de monos observadores (grupo SN+/FL-) observaron un modelo mono en una cinta de video mostrando intensas reacciones de miedo frente a serpientes de juguete (pero no a flores u objetos de madera neutrales) (M. Cook y Mineka, 1990). El otro grupo FL+/SN-, en contraste, observaron a un modelo mono mostrar exactamente las mismas reacciones intensas de miedo a flores artificiales de colores brillantes (pero no a serpientes de juguete u otros objetos neutrales). Cuando posteriormente fueron testeados por sí solos, el grupo SN+/FL- claramente había adquirido miedo a las serpientes (pero no a las flores), mientras el grupo FL+/SN- no había adquirido ningún miedo a las flores (o a las serpientes). Resultados esencialmente idénticos fueron obtenidos cuando el condicionamiento observacional a otro estímulo relevante al miedo (i.e., un cocodrilo de juguete) fue comparado con el condicionamiento a otro estimulo irrelevante al miedo (i.e., un conejo de juguete; M. Cook y Mineka, 1989). En resumen, estos monos superaron las dos limitaciones de la literatura acerca de la preparación en el condicionamiento al miedo en humanos mencionada anteriormente. Primero, miedos intensos pueden ser condicionados a estímulos relevantes al miedo (pero no irrelevantes). Segundo, aunque estos monos criados en laboratorio carecían absolutamente de exposición previa a ninguno de los estímulos usados en las cintas de videos de los experimentos (i.e., no tenían asociaciones derivadas de la ontogenia), ellos sin embargo mostraron más diferencias en la condicionabilidad de estímulos relevantes versus los irrelevantes. Encapsulación y Automaticidad Trabajos posteriores de Öhman y sus colegas revelaron otra importante diferencia en las características del condicionamiento de ECs relevantes para el miedo. Una serie de estudios demostró la automaticidad del proceso con estímulos relevantes (pero no con irrelevantes). En un experimento, Öhman y Soares (1994) mostraron que participantes quienes ya tenían miedo a arañas o serpientes (pero no a ambos) mostraban una activación no conciente de su respuesta de miedo cuando se realizaban presentaciones subliminales de sus objetos atemorizantes (pero no al objeto no temido). En otro experimento, ellos mostraron que las RCs a ECs supraliminales y relevantes para el miedo, se mantenían durante un

procedimiento de extinción en el cual los ECs fueron presentados subliminalmente. Esto es que, incluso sujetos pensantes que no pueden identificar el estímulo al cual ellos están respondiendo, continúan mostrando las RCs al EC relevante, pero no al irrelevante (e.g., Öhman & Soares 1993). Por último, ellos también mostraron que el condicionamiento puede incluso ocurrir con ECs subliminales relevantes (pero no con subliminales irrelevantes al miedo) al ser pareados con descargas eléctricas. Es decir, los sujetos adquieren RCs a los ECs relevantes al miedo que ellos incluso no pueden identificar durante el condicionamiento (e.g., Öhman y Soares, 1998). Así, solo los ECs relevantes ganan un acceso preferencial a los mecanismos atencionales preconcientes. Tales resultados podrían ayudar a explicar por qué los miedos fóbicos pueden en ocasiones ser elicitados con gran velocidad incluso con un mínimo input de estimulación (e.g., reaccionando a una serpiente en el pasto antes de que ocurra algún reconocimiento conciente de que la serpiente esta allí; vea Ömaham & Mineka, 2001). Otro aspecto importante de esta línea de trabajo de condicionamiento preparado, es que las RCs a estímulos relevantes en relación al miedo parecen ser especialmente resistentes al control cognitivo consciente. Por ejemplo, muchos experimentos encontraron que cuando a los sujetos se les dijo que no serían sometidos nuevamente a descargas eléctricas al final del condicionamiento, los estímulos irrelevantes condicionados mostraron una inmediata extinción de las RCs, pero aquellos condicionados con estímulos relevantes continuaron mostrando RCs electrodérmicas. (e.g., Soares & Ömaham, 1993). Más aún, Scell, Dawson y Marinkovic (1991) midieron las expectativas de los sujetos en relación a cuando los EIs se presentarían, así como sus respuestas electrotérmicas durante el condicionamiento y la extinción. Los sujetos condicionados con ECs relevantes (no así con los irrelevantes en relación al miedo) continuaron mostrando RCs electrodérmicas luego de que sus expectativas de recibir descargas eléctricas se había extinguido. Así, el reconocimiento de que el EI no será más entregado tiene poco, si no ningún impacto, en las RCs a los ECs que son relevantes en relación al miedo. El Concepto de un Modulo del Miedo Evolucionado Öhman y Mineka (2001; Mineka & Ömaham, 2002a) propusieron un modulo conductual evolucionado para el aprendizaje del miedo para explicar mejor el complejo esquema de los resultados obtenidos en los últimos 30 años. Tomando prestado el concepto de modulo conductual evolucionado de Toooby y Cosmides (e.g., 1992), quienes planteaban de que el modulo al miedo es relativo al sistema mental, conductual y neuronal que se ha dado por presiones evolutivas para ayudar a resolver problemas de adaptación ante situaciones peligrosas y de potencial daño a la vida que se encontraban en los ambientes de nuestros primeros ancestros. El módulo del miedo, como otro sistema conductual moldeado, muestra cuatro características distintivas. Primero, muestra una selectividad relativa con respecto a los input que acepta, siendo el sistema especialmente sensitivo a ciertos estímulos que proveían amenazas evolutivas recurrentes a nuestros viejos ancestro evolucionarios. Esto es consistente con la evidencia revisada anteriormente de que el aprendizaje del miedo es especialmente robusto con ECs

relevantes para el miedo tanto en monos como en humanos. Más aún, la naturaleza de la RC es a menudo cualitativamente diferente (de hecho, verdaderamente defensiva) con ECs relevantes para el miedo. Segundo, sistemas conductuales con orígenes evolucionarios profundos están típicamente fuera de control consciente pero en cambio son rápida y directamente activados por estímulos, querámoslo o no, dado que estos sistemas cerebrales evolucionaron en animales con cerebros mucho más primitivos que los nuestros, mucho antes de la aparición del lenguaje o el pensamiento. Dichos efectos son ilustrados por los experimentos de Öhman y colegas que muestran activación automática y condicionamiento de RCs con ECs subliminales relevantes para el miedo. Tercero, Öhman y Mineka (2001) también argumentaron que dichos sistemas conductuales están típicamente encapsulados de influencias cognitivas superiores, nuevamente debido a que han evolucionado en animales con cerebros mucho más primitivos. Esto fue ilustrado en experimentos que muestran que el condicionamiento con ECs relevantes para el miedo no es afectado por la información directa de que el shock no volverá a ocurrir, así como en experimentos que muestran que las respuestas de miedo con ECs relevantes para el miedo continúan luego de la extinción de las expectativas (ver cap. 6 de este volumen; Lovibond y Shanks, 2002, para un punto de vista alternativo; véase Wiens y Öhman, 2002, para una réplica). UNIVERSIDAD DE CHILE DEPARTAMENTO DE PSICOLOGÍA USO EXCLUSIVO DE LA CÁTEDRA PSICOLOGÍA DEL APRENDIZAJE

Cuarto, Öhman y Mineka (2001) también notaron que dichos sistemas conductuales modelados evolucionariamente usualmente tiene algunos circuitos neurales dedicados, lo que en el caso del miedo y el aprendizaje del miedo está centrado en la amígdala. Así, las características primarias del módulo del miedo incluyen selectividad con respecto al input, automaticidad con respecto a la activación, encapsulación de influencias cognitivas superiores, y un circuito neuronal dedicado. De esta manera, el concepto de modulo del miedo integra varios hallazgos diversos acerca del miedo y el aprendizaje del miedo provenientes de diferentes dominios (e.g., clínicos, cognitivos, de aprendizaje, neurobiológicos). Más aún el concepto también propone una agenda para investigaciones futuras que puede mejorar la comprensión tanto de los aspectos básicos como clínicos del miedo y la ansiedad. Hasta ahora, hemos revisado evidencias provenientes desde estudios con animales y humanos que apoyan la idea de Rachman sobre las tres vías asociativas que estan involucradas en el desarrollo de miedos y fobias: aprendizaje directo, instruccional y vicario. También hemos demostrado que los modelos de condicionamiento tradicionales eran muy simplistas, y como los modelos contemporáneos, necesitan tomar en cuenta el amplio rango de variables temperamentales, experienciales y evolutivas que afectan cuanto miedo se adquiere y mantiene. En los pasados 25 años, un pequeño grupo de investigadores había pensado verificar el que los patrones asociativos se encuentran realmente involucrados en la manera que fuertemente sugieren los investigadores revisados aquí. Comúnmente, en estas docenas de estudios se ha simplemente preguntado a los sujetos acerca de que creen que ha causado el desarrollo de sus miedos y fobias (usualmente utilizando cuestionarios estructurados para verificar varios tipos de experiencias de aprendizaje). Algunos de estos estudios han planteado dudas sobre cuán a menudo estas vías asociativas se encuentran realmente

involucradas, sugiriendo de que algunos miedos y fobias son innatos. Ahora revisaremos los fundamentos de estas explicaciones no asociativas. Finalmente, evaluaremos críticamente lo incólume de este nuevo enfoque que descansa en la confiabilidad y validez del llamado método retrospectivo utilizado en estos estudios. LA EXPLICACION NO ASOCIATIVA DE LA ADQUISICION DE MIEDOS En la literatura que investiga los orígenes de las fobias a través del autoreporte, muchos estudios han encontrado un subgrupo de participantes que bien no pueden recordar el comienzo de su fobia o bien reportan siempre haber sido temerosos. Una explicación hipotetizada para estos reportes es que los participantes simplemente no podían recordar experiencias que efectivamente ocurrieron (e.g., causada por olvido o amnesia infantil; véase la sección final de este capítulo). Otra explicación postulada, en la que nos centramos primero, proviene desde un enfoque no asociativo (e.g., Menzies & Clarke, 1995a; Poulton y Menzies, 2002a; 2002b). Esta explicación estipula que para ciertos peligros UNIVERSIDAD DE CHILE DEPARTAMENTO DE PSICOLOGÍA USO EXCLUSIVO DE LA CÁTEDRA PSICOLOGÍA DEL APRENDIZAJE

evolucionariamente relevantes, los miedos son innatos, desarrollándose sin experiencias negativas con algún estímulo. Esto es contrario a la posición de Öhman y Mineka (2001), quienes señalaron que los miedos evolutivamente relevantes requieren al menos una pequeña cantidad de input experiencial para que se den. La explicación no asociativa reconoce la importancia de las vías de adquisición de los miedos “evolucionariamente neutros” (por ejemplo, el miedo al dentista), y en algunos casos, de ciertos miedos evolutivamente relevantes. Tanto la explicación de condicionamiento preparado, como la no asociativa, han señalado que la evitación y el miedo de ciertas situaciones o estímulos historicamente peligrosos se encuentran bajo un control genético parcial y han beneficiado la supervivencia de las especies. Más aún, Menzies y Clarke (1995a) también establecieron “de acuerdo a esta visión [no asociativa], entonces, dados procesos maduracionales y experiencias pasadas normales… la mayoría de las especies mostrarán miedo a un conjunto de estímulos evolutivamente relevantes en su primer encuentro” (p.42). Incluidos dentro de este grupo evolutivamente relevante hay cuatro miedos particulares: miedo a los extraños, alturas, separación temprana, y agua (véase Menzies y Harris, 2001). La explicación no asociativa proviene en gran parte de estudios del desarrollo y transculturales que demuestran que la mayoría de los infantes experimentan un desarrollo normativo de los miedos a los cuatro estímulos recién mencionados. Por ejemplo, Menzies y Harris (2001) citaron investigación en primates y transculturales en apoyo del miedo de infantes a extraños y la ansiedad de separación. Ellos además revisaron el trabajo de Gibson y Walk (1960) quienes encontraron que la evitación de infantes de un precipicio visual era una reacción normativa propia del desarrollo. Finalmente, para el agua Gram y Gaffan (1997) encontró que cerca del 50% de las madres cuyos hijos eran actualmente o previamente temerosos del agua reportaban que este miedo estaba presente al primer contacto del niño. No tenemos noticia de ningún estudio transcultural o del desarrollo cuidadoso que muestre que el miedo al agua es innato, sin embargo. Si el desarrollo de estos cuatro miedos es normativo, ¿por qué una minoría de gente continúa teniendo numerosos miedos y fobias más allá de la infancia, mientras la mayoría de la gente no los tiene? Primero, la explicación no asociativa reconoce una significativa variabilidad genética en las reacciones al miedo de diferentes individuos incluso en los

encuentros iniciales […a los estímulos o situaciones atemorizantes] (e.g., Menzies y Harris, 2001). Así, incluso en un contacto inicial, las respuestas de la gente al miedo varían desde leves a más pronunciadas. Segundo, en la explicación el tema de que estos miedos usualmente son transitorios y restringidos a una etapa evolutiva temprana, la argumentación no asociativa invoca el proceso de habituación (Menzies & Clarke, 1995a). Esto es que, con el tiempo, muchos niños tienen exposiciones repetidas a sus situaciones atemorizantes sin experiencias negativas significantes, y de esta manera el miedo se habitúa. Si la habituación es tan común, ¿por qué algunos adultos desarrollan estos miedos (no asociativos) innatos UNIVERSIDAD DE CHILE DEPARTAMENTO DE PSICOLOGÍA USO EXCLUSIVO DE LA CÁTEDRA PSICOLOGÍA DEL APRENDIZAJE

(Menzies & Harries, 2001)? Menzies y Clarke establecieron como hipótesis tres razones de por que el miedo podría continuar o reaparecer si esta se había habituado: carencia de exposiciones seguras, una base innata pobre para la habituación, y estrés no específico. Carencias de exposiciones seguras pueden suceder por causa de limitaciones prácticas en oportunidades de exposición, o por la evitación propia o por parte de los padres de situaciones atemorizantes. En el caso de una pobre habituación, la explicación no asociativa establece diferencias individuales genéticas para diferentes tazas de habituación tal que ciertos individuos necesitan un monto mucho mayor de exposición antes de que la habituación ocurra (Menzies y Harris, 2001). Sin embargo, notable es que incluso los proponentes de la explicación no asociativa han reconocido una escasez de datos que apoyen esta segundo mecanismo hipotetizado (Poulton, Waldie, Craske, Menzies, y McGee, 2000). Tercero y final, la explicación no asociativa hipotetiza que altos niveles de un estrés general pueden resultar en la reaparición de un miedo evolutivamente relevante que previamente había sido habituado. Poulton y colegas (2000) señalaron como evidencia trabajos en animales realizados por Groves y Thompson (1970) demostrando deshabituación cuando un nuevo y sensibilizador estímulo se presentaba cercano temporalmente a la presentación de un estimulo habituado previamente. Poulton y sus colegas obtuvieron apoyo para esta hipótesis cuando encontraron que, a los niños que no tenían miedo a la edad de 11 años, un estrés no específico entre la edades 14 y 15 predecía una alta fobia a la edad de 18 años pero no una fobia evolutivamente neutra como la fobia al dentista. Muchos aspectos metodológicos limitan seriamente las conclusiones que pueden obtenerse desde este estudio, sin embargo. Específicamente, los miedos y las fobias sólo fueron medidas a los 11 y 18 años, los eventos estresantes fueron medidos sólo entre los 14 y 15 años, y las entrevistas diagnósticas a los 18 sólo preguntaban acerca del miedo durante el año pasado. Así, muchos eventos estresantes y varias apariciones y remisiones de miedos y fobias pueden haber tenido lugar durante los otros 6 años de las cuales no hay información. Un apoyo más sustantiva para la explicación por deshabituación requeriría un estudio que implemente mediciones frecuentes tanto del estrés diario y los miedos y fobias resultantes para elucidar más claramente las relaciones temporales y las trayectorias de desarrollo. Un interesante punto para sobreponer entre las explicaciones asociativas y no asociativas de la aparición de miedos y fobias es que ambas parecen explicar la evidencia de que muchos participantes que tienen una historia de experiencias aversivas o traumáticas no desarrollan miedos o fobias a esos estímulos. En un estudio usando recuerdos retrospectivos, Menzies y Parker (2001) encontraron que participantes con miedo a las alturas no diferían

significativamente de un grupo control de participantes no temerosos en la proporción de reportes de experiencias de condicionamiento directo o indirecto, edad durante los condicionamientos, o miedo autoreportado antes de las experiencias de condicionamiento antes reportadas. Más aún, los participantes controles no temerosos recordaron mayores niveles de miedo y dolor durante sus experiencias de condicionamiento de lo que lo hicieron sus contrapartes con miedo a las alturas. UNIVERSIDAD DE CHILE DEPARTAMENTO DE PSICOLOGÍA USO EXCLUSIVO DE LA CÁTEDRA PSICOLOGÍA DEL APRENDIZAJE

Estos autores concluyeron que estos últimos hallazgos son más compatibles con la explicación no asociativa: individuos que siempre habían tenido miedo a las alturas (uno de sus miedos innatos) podría probablemente realizan sólo actos menos peligrosos y por lo tanto estar sujetos a menos dolor debido a sus precauciones o evitación. Aunque esta línea de pensamiento parece plausibles, los resultados de Menzies y Parker de hecho no prueban ni confirman adecuadamente esta hipótesis ya que tanto lo participantes temerosos como no temerosos reportaron bajos y comparables niveles de miedo a las alturas antes del evento de condicionamiento putativo. Luego su teoría presupone niveles más bajos de miedo antes de los eventos de condicionamiento en aquellos participantes que no desarrollaron un miedo significativo. Así, sus resultados no resultan consistentes con sus hipótesis. Resulta interesante que la explicación asociativa parece proveer una mejor explicación potencial de estos particulares hallazgos de Menzies y Parker (2001). Como se revisó anteriormente en este capítulo y por Mienka y Öhman (2002b), diferencias temperamentales y experienciales (e.g., inhibición latente y percepción de control) llevan a diferencias en qué tanto miedo se adquiere durante experiencias traumáticas y qué tanto se mantiene en el futuro. Más aún, niños con temperamentos no temerosos y extrovertidos, particularmente si tienen un sentido aprendido de maestría sobre su medio, serán mucho más tendientes a involucrarse en actividades riesgosas que podrían llevar a la ocurrencia de experiencias aversivas con ciertos estímulos, lo que en ningún caso no llevaría a una adquisición de miedo debido a estas variables experienciales o temperamentales. Está fuera del foco de este capítulo desplegar una crítica entera de la explicación no asociativa. El lector interesado es dirigido a un número especial de Behaviour Research and Therapy (2002, pp. 121-208), que incluye artículos de Poulton y Menzies (2002a, 2002b), Mineka y Öhman (2002b), y un número de otros investigadores. Puntos particulares de pugna envuelven el definir la relevancia evolutiva, el monto de contribución genética a fobias específicas, el rol de la personalidad individual y factores experienciales, y explicaciones de las complejidades de la teoría contemporánea del aprendizaje (las que son discutidas en este capítulo). También proponemos el tópico aquí de que si incluso particulares miedos leves o moderados son innatos, las fobias probablemente requieren input experiencial. Es más, la explicación no asociativa no trata el tema de cómo un alto miedo normativo en la infancia se vuelve en una poderosa fobia, o no trata las trayectorias del desarrollo de los miedos normativos a los extraños y el de separación como si pertenecieran a desórdenes de ansiedad de la infancia y de la adultez (e.g., Mineka y Öhman, 2002b). Esta área de debate sustancial tiene importantes implicaciones para la teoría y la investigación de la etiología de las fobias. CONFIABILIDAD DE LOS RECUERDOS RETROSPECTIVOS Es vital para los investigadores posicionar tanto las explicaciones asociativas y las no asociativas para tener en cuenta las limitaciones e implicancias de las conclusiones

UNIVERSIDAD DE CHILE DEPARTAMENTO DE PSICOLOGÍA USO EXCLUSIVO DE LA CÁTEDRA PSICOLOGÍA DEL APRENDIZAJE

extraídas de estos cuerpos de trabajo basados en estudios retrospectivos. Aunque los espacios temporales entre miedos o fobias establecidas y el tiempo en que se produce el recuerdo se han acortado en algunos estudios retrospectivos recientes de estudiantes universitarios y niños (e.g., Menzies y Parker, 2001) en relación a anteriores investigaciones en la población adulta, incluso en las más recientes investigaciones han utilizados el recuerdo sobre muchos años. Más aún, incluso el trabajo prospectivo a veces se vuelve dependiente en substanciales recuerdos retrospectivos. Por ejemplo, el Dunedin Multidisciplinary Health and Developmental Study, usado extensivamente en estudios por Poulton, Menzies, y colegas, siguió una cohorte entera de nacidos con multifacéticas entrevistas y mediciones obtenidas al nacimiento y a la edad de 3, 5, 7, 9, 11, 13, 15, 18, 21, y 26 años (véase Poulton y Menzies, 2002a, para métodos y hallazgos relevantes). Cada periodo de seguimiento entonces tenía al menos 2 años de espacio entre si, y las fobias sólo fueron medidas a la edad de 3, 11, 18, y 21. Como vimos aquí, incluso 2 años de espacio permiten espacio suficiente para errores en los recuerdos. Precisión del recuerdo de eventos de la niñez El primer tema para tratar es la precisión de la memoria humana para los eventos tempranos, dado que muchos estudios que estudian autorreportes de miedo y fobias establecidas asumen que los universitarios y participantes adultos pueden recordar precisamente hechos que comúnmente ocurren en la infancia. Una revisión de la evidencia disponible concluyo que los recuerdos autobiográficos para eventos ocurridos en la infancia son a menudo bastantes precisos (Brewin, Andrews & Gotlib, 1993), especialmente para las características centrales de eventos únicos, y por lo tanto, inesperados en la infancia. Un estudio que investigó el recuerdo de estudiantes universitarios para eventos tempranos en la niñez que fueron significativamente relevantes (por ejemplo el cumpleaños del hermano anterior a que el participante haya celebrado su sexto cumpleaños), encontró que los padres validaban alrededor de un 60% de las memorias tempranas de los participantes, y que negaban menos del 15% del relato de los participantes (Usher y Neiser, 1993). Los investigadores también notaron muchas notificaciones que reconocían la veracidad del recuerdo para los eventos de la niñez. Por ejemplo, Henry, Moffitt, Caspi, Langely y Silva (1994) señalaron que la validez fue sospechosa para el recuerdo de estados subjetivos (por ejemplo, ansiedad) y precavida para reportes retrospectivos que son menos confiables para su comprobación dado que requieren una estimación precisa de las fechas y frecuencias en que los hechos ocurrieron. Más aún, Brewin y sus colegas (1993) también precavieron que a menos que existiesen puntos de anclaje, la gente podría olvidar el tiempo y la secuencia exacta de los hechos, así como sus reacciones emocionales durante estos. La precisión del recuerdo de una secuencia temporal y de los estados emocionales es esencial para conectar las posibles experiencias de aprendizaje asociativo en los reportes verídicos. Un factor discutido por Hyman y Loftus (1998) es el concepto de “errores de rebanadas del tiempo”, los cuales ocurren cuando un los sujetos entregan un evento recordado precisamente, que no fue el que se ha preguntado. En el caso del miedo, estos errores pueden ocurrir dado que la persona no asocia un evento temprano con un miedo UNIVERSIDAD DE CHILE DEPARTAMENTO DE PSICOLOGÍA USO EXCLUSIVO DE LA CÁTEDRA PSICOLOGÍA DEL APRENDIZAJE

establecido, o dado que un evento podría ser uno de muchos que últimamente acontecieron en el desarrollo de una fobia. Ellos también discutieron la posibilidad de que una persona pudiera no tener recuerdos disponibles de un evento debido a amnesia infantil (discutida luego). Un tercer factor, que fue señalado por Kendler, Myers y Prescott (2002), involucra posibles falso positivos en las confirmaciones de los eventos relatados como parte del establecimiento de las fobias. Estos autores especularon que los eventos podrían ser confirmados como parte de una búsqueda de sentido, o que podrían marcar la primera experiencia memorable a un estímulo que ya es temido. Cuarto, Hyman y Loftus (1998) concluyeron que “la gente reconstruye sus actitudes y estados mentales pasados basados en su ajuste actual al hacer implícitas ideas constantes relacionadas y cambios ocurridos hasta el periodo de intervención” (p. 934). Quinto, Bradburn, Rips, y Shevell (1987) reportaron que cuando el recuerdo de un evento es desafiante, las personas podrían usar sus interferencias para concluir que un evento fue infrecuente, distante, o que nunca ocurrió. Así, las propias teorías de la gente acerca de la memoria en sí misma afectar el recuerdo. Chequeo de la confiabilidad del recuerdo Varias investigaciones han implementado chequeos de confiabilidad para los recuerdos de los participantes. En general, los resultados han sido problemáticos en relación a la validación de los reportes retrospectivos acerca del inicio de miedos y fobias. Un estudio relevante con gente con fobia a las arañas ofreció un fuerte apoyo a la confiabilidad de los recuerdos en la que la confirmación parental de los reportes de los niños de condicionamiento directo o de haber tenido siempre miedo llegaba a un valor kappa mayor que .8 (Merckelbach, Muris, y van Schouten, 1996). En contraste, otros tres estudios levantan dudas acerca de la confiabilidad de los recuerdos retrospectivos. Por ejemplo, Henry et al. (1994) le preguntaron a participantes por el número de heridas serias en los dos años anteriores a las mediciones a las edades de 9, 11, 13, y 15 años. Ellos compararon este total con el recuerdo de los participantes a la edad de 18 años acerca de todas las heridas que ocurriero entre los 7 y los 15 años. Sólo encontraron un acuerdo modesto (r = .42, k = .34). Este resultado es particularmente relevante y problemático dado que las heridas son un EI común en relación al comienzo de numerosas fobias. Un segundo estudio acerca del inicio de las fobias también encontró niveles significativos de desacuerdo. Kheriaty, Kleinknetcht, y Hyman (1999) investigaron a estudiantes temerosos de los perros o sangre y heridas acerca de los orígenes de sus fobias así como del tiempo de aparición. Los padres también fueron contactados para confirmar los datos de sus hijos, con 55 de 88 cuestionarios devueltos. Entre los hijos de estos 55 padres, 42 estudiantes recordaron alguna vía asociativa relacionada con el comienzo del miedo; los padres validaron este dato en 26 casos (62%). Los padres nombraron un evento anterior y diferente que el que los estudiantes designaron en 9 casos (21%), y 7 padres (17%) no sabían cómo sus hijos habían adquirido el miedo. Es importante que para los 13 estudiantes restantes que no reportaron recuerdo del origen del miedo, 8 padres (62%) identificaron un UNIVERSIDAD DE CHILE DEPARTAMENTO DE PSICOLOGÍA USO EXCLUSIVO DE LA CÁTEDRA PSICOLOGÍA DEL APRENDIZAJE

evento específico relacionado con el inicio del miedo del estudiante. Finalmente para los 28 casos en que la edad del comienzo del miedo fue recordado tanto por lo padres como por los niños, los niños reportaban el comienzo cerca de 3 años después que lo que lo hacían los padres.

Un tercer estudio conducido por Taylor, Deane, y Podd (1999) también entrega resultados problemáticos. Esto investigadores pidieron a una muestra de adultos con miedo a conducir que adscribieran una causa para el inicio de su miedo en dos puntos del tiempo, con un año de espacio. Sorprendentemente, sólo el 54% de las atribuciones se mantenía igual en estos dos puntos. Además, de las 11 personas (13% de la muestra) que inicialmente afirmaron “no puedo recordar”, sólo 2 continuaron diciendo “no puedo recordar” en la segunda medición. Cerca de un cuarto (6 de 23) de aquellos que dijeron “siempre ha sido así” cambiaron en la segunda medición. En resumen, los estudios que han implementado chequeos de confiabilidad han dejado al descubierto los problemas de confiar en estudios retrospectivos que sólo usan autorreportes. Además hemos notado que estos estudios que implementan chequeos de confiabilidad usando reportes parentales también son problemáticos porque tienden a crear la idea algo sospechosa de que el recuerdo parental es siempre más preciso que el de los participantes. Amnesia de la infancia Una explicación adicional para los hallazgos de que ciertos participantes (e.g., Kheriaty et al., 1999; Öst y Hugdahl, 1981) no tenían recuerdos para el inicio de miedos y fobias es que ello podría haber ocurrido durante un periodo de amnesia de la infancia. Esencialmente, hay un periodo temprano de vida durante la cual los niños no forman memorias permanentes. Por ejemplo, Usher y Neisser (1993) identificaron estudiantes usando un cuestionario exploratorio para determinar quién sabía que había experimentado uno de cuatro eventos infantiles antes de los 6 años (nacimiento de un hermano, hospitalización, una mudanza familiar, o muerte de un miembro de la familia). Ellos entonces investigaron los recuerdos de los estudiantes de estos eventos. Aspectos del nacimiento de un hermano y una hospitalización podían ser recordados por más de la mitad de la muestra de 2 a 3 años de edad el momento del evento. Para los otros dos eventos (i.e., mudanza familiar, muerte de un padre), no fue hasta la edad de 4 años que más de la mitad de la muestra logró el criterio de recuerdo. Los autores concluyeron que los efectos de la amnesia de la infancia no son iguales para todos los eventos, y que a las edades de 3 y 4 años sólo ciertas experiencias excepcionales estarán disponibles para el recuerdo en la adultez. En un hallazgo relacionado, Pillemer (1998) notó que adultos emplazados a fechar su recuerdo más antiguo en promedio situaban de los 3 a 4 años de edad y que hay una marcada disminución en el monto y complejidad de la memoria adquirida antes de los primeros años escolares. Neisser (2004) también advirtió que incluso cuando la gente puede recordar un evento temprano particular, esto no significa que la edad crítica para recordar otro tipo de eventos ha sido alcanzada; un criterio diferente producirá diferentes UNIVERSIDAD DE CHILE DEPARTAMENTO DE PSICOLOGÍA USO EXCLUSIVO DE LA CÁTEDRA PSICOLOGÍA DEL APRENDIZAJE

estimaciones. En suma, cuando la gente reporta siempre haber sido miedosa, especialmente sin fuentes externas corroborativas, la etiología de la fobia puede ser la consecuencia de aprendizaje asociativo que ocurrió antes de la edad con memoria verbal accesible. Olvido Otra razón por la cual muchos participantes pueden no recordar experiencias de condicionamiento es porque simplemente lo han olvidado. Esto es, dado de que los eventos de condicionamiento directo pueden no ser siempre severos o que los encuentros indirectos pueden no ser únicos o consecutivos, estas experiencias pueden simplemente no ser codificadas adecuadamente en la memoria o son olvidadas a través del tiempo. Usando un

inventario de eventos generales de la vida, Monroe (1982) reportó que participantes adultos compelidos a recordar eventos sobre un periodo de 2 años marcaron un promedio de siete eventos para el año más reciente pero sólo tres para el año anterior, sugiriendo una substancial caída en el recuerdo sobre sólo un periodo de 2 años. Monroe luego condujo una investigación prospectiva del recuerdo de eventos de la vida en la cual estos mismos participantes fueron medidos mensualmente al final de cada uno de 4 meses consecutivos. Monroe sumó el total de eventos negativos reportados en estas 4 mediciones mensuales y los comparó con el total de eventos negativos recordados sobre el periodo de 4 meses más reciente en la investigación retrospectiva de 2 años. Él encontró una disminución significativa (2.25 vs. 0.97 eventos) en el número promedio de eventos negativos reportados usando el periodo de recuerdo mayor (pero para varios eventos, véase G. W. Brown y Harris, 1982, quienes encontraron mayores niveles de recuerdos confiables). Más aún, se han levanto dudas acerca de la memorabilidad de experiencias indirectas que son menos únicas, consecutivas, sorpresivas, y quizás menos potentes emocionalmente que la experiencias directas (Field, Argyris, y Knowles, 2001). Por ejemplo, Withers y Deane (1995) encontraron que participantes con experiencias de condicionamiento directo eran más confiables en su recuerdo que aquellos involucrados en condicionamiento indirecto. En suma, la propiedad de los eventos, la secuencia de tiempo, los sesgos de la memoria, e inferencias acerca de la misma son facetas integrales del proceso de rememoración. Así, hay una razón substancial para preocuparse cuando examinamos estudios retrospectivos acerca de las experiencias más relevantes para la etiología de miedos y fobias. Como Kleinknetcht (2002) convincentemente apuntó, debido a estos factores, “sin corroboración las aproximaciones retrospectivas debiesen ser vistas a lo más como sugestivas y generadoras de hipótesis más que confirmadoras o desconfirmadoras de hipótesis” (p. 160). Hasta ahora, una conclusión que puede obtenerse de esta literatura es que una falla en atribuir una vía asociativa no es lo mismo que confirmar la ausencia de aprendizaje asociativo. Inversamente, otra conclusión es que la atribución de un participante de investigación de una vía asociativa no es equivalente a confirmar que la experiencia asociativa recordada de hecho haya jugado un rol causal. Incluso con corroboraciones, el problema de fallar en identificar una vía asociativa es incluso más serio que el problema de UNIVERSIDAD DE CHILE DEPARTAMENTO DE PSICOLOGÍA USO EXCLUSIVO DE LA CÁTEDRA PSICOLOGÍA DEL APRENDIZAJE

concluir que una vía asociativa que es recordada de hecho haya jugado un rol causal. Esto es porque el concluir con seguridad que algo no paso es similar al problema de tratar de probar la hipótesis nula (véase Mineka y Öhman, 2002b). ¿Cómo podrían dichos estudios ser más útiles? Dos mejoras obvias serían la inclusión consistente de fuentes de corroboración así como metodología prospectiva con monitoreo frecuente. Idealmente un diseño de estudio así necesitaría incluir un gran número de participantes medidos prospectivamente por al menos los primeros 20 años de vida. Especialmente, infantes, niños, y padres necesitarían ser medidos al menos varias veces al año tanto acerca de sus miedos a un amplio rango de estímulos o situaciones comúnmente temidos como acerca de la ocurrencia de eventos relevantes (y factores de personalidad) que podrían contribuir a desarrollar vulnerabilidades, invulnerabilidades, o miedos. Desafortunadamente, aunque el estudio Dunedin es excelente para varios propósitos, no puede ser usado de una manera convincente para testear teorías de miedos y fobias porque no fue diseñado para este propósito. Las mediciones fueron demasiado espaciadas, e

información inadecuada fue proveída acerca de una variedad de eventos relevantes y vulnerabilidades de la personalidad. CONCLUSIONES Hemos revisado evidencias de muchas tradiciones investigativas, tanto históricas como contemporáneas, que son relevantes para el entendimiento de la etiología de miedos y fobias. Primero revisamos el modelo etiológico de tres vías de Rachan (1990) que coloca énfasis en una variedad de factores asociativos. Al hacer esto, mostramos como los modelos conductuales tradicionales fallaban por que ignoraban la importancia del rol que juegan variables temperamentales, experienciales y de diferencias individuales en el resultado de cualquier experiencia de aprendizaje (vea tambien Mineka, 1985; Mineka y Zinberg, 1996). Atendiendo al amplio rango de factores de diferencias individuales que tienen participación, una imagen comienza a aparecer entre las muchas variables (de vulnerabilidad y resistencia) que interactúan y que son importantes en la búsqueda de la etiología de miedos y fobias. Nuestra revisión prestó especial atención a estudios que usaban los dos tipos de estrategias de investigación, complementarias y sinérgicas, que han sido históricamente un punto importante e indispensable dentro de los trabajos del área. Específicamente, discutimos investigaciones experimentales con animales en los cuales miedos potentes y de larga duración fueron inducidos y manipulados experimentalmente, así como investigaciones experimentales realizadas en humanos en las cuales miedos leves y transitorios también pudieron se inducidos y manipulados. La evidencia para cualquier factor de riesgo es a menudo considerada fuerte cuando se ha estudiado utilizando ambas estrategias, aunque esto no es siempre factible (e.g., a causa de limitaciones en nuestra habilidad para medir y manipular cogniciones en animales y por limitaciones éticas que no permiten la realización de cierto tipo de preguntas en estudios con humanos). Notable es que cuando se han usado UNIVERSIDAD DE CHILE DEPARTAMENTO DE PSICOLOGÍA USO EXCLUSIVO DE LA CÁTEDRA PSICOLOGÍA DEL APRENDIZAJE

ambas estrategias complementarias, los resultados han llevado casi siempre a conclusiones similares. Luego, enfocamos nuestra atención en una estrategia desarrollada mas recientemente en la cual los investigadores confían en el recuerdo retrospectivo de los sujetos para los eventos que ellos creen que se encuentran involucrados en el origen de sus fobias (e.g., Öst & Hugdahl, 1981; Poulton & Menzies, 2002a, 2002b). Algunos han propuesto que los resultados de muchos de estos estudios plantean dudas acerca de las conclusiones extraídas de la tradición experimental revisada inicialmente, dado que sus hallazgos frecuentemente revelan una proporción significativa de personas quienes no recuerdan un patrón asociativo para el establecimiento de una fobia, o hay quienes señalan que siempre han tenido un miedo particular o fobia. Más aún, estos investigadores también han encontrado un número significativo de personas sin miedos o fobias que recuerdan eventos de condicionamiento putativos anteriores pero que no se desarrollaron en miedos. También revisamos evidencia considerable, que sin embargo, lleva a dudar por serias razones la validez de estos estudios así como la manera de obtener conclusiones de ellos. En particular, hay grandes problemas tanto con la precisión del recuerdo de eventos emocionales (y las secuencias de estos hechos) que a menudo ocurrían muchos años antes y sin la firmeza de estar libre de atribuciones de causalidad hacia los eventos ocurridos con mucha anterioridad si es que podían ser precisamente recordados. Es más, encontramos sorprendentemente que

demasiada atención se le había prestado a la explicación no asociativa dado que esta confiaba meramente en estudios que usaban recuerdos retrospectivos y que eran deficientes en el apoyo de estudios experimentales válidos. En conclusión, sugerimos que sería más prudente el incorporar los hallazgos de investigaciones experimentales con animales, y experimentos análogos en humanos, y los poco corroborados estudios retrospectivos a través de autorreportes, concluir que, la explicación asociativa contemporánea de la adquisición de fobias y miedos persistentes es la teoría más válida, comprensible y plausible. Como se ha señalado antes, la prueba más estricta de la validez ecológica de nuestra explicación vendrá con futuras investigaciones usando metodologías prospectivas y longitudinales con frecuentes mediciones de experiencias de aprendizaje potencialmente relevantes, y miedos y fobias establecidas, así como mediciones ocasionales de otras variables, tales como temperamentales y de percepción de control. 46

El Poder del Reforzamiento Editorial State University of New York Press

Introducción

¿Por qué algunos niños se escapan de la escuela para emborracharse, drogarse o “volarse” en las drogas, mientras otros niños llegan a la escuela a tiempo, trabajan duro en sus tareas, y participan en actividades extracurriculares como bandas, clubes de debate, atletismo inter-escolar, o juegos? Es por la misma razón por la que un niño con discapacidades severas de desarrollo se golpea la cabeza en el piso en forma repetitiva hasta que la acumulación de golpes resulta en el desprendimiento de la retina, y causa ceguera, mientras otros niños con iguales discapacidades severas se visten y comen independientemente, y utilizan lenguaje de señas para comunicar sus deseos y necesidades en vez de recurrir a conductas autodestructivas. Es por la misma razón por la que una persona anciana toma numerosas recetas de medicamentos para el dolor, se queja constantemente de sus achaques, y visita frecuentemente al doctor mientras otros ancianos en la misma condición física no toman medicamentos, apenas se quejan o visitan al doctor sino que continúan su educación en la escuela, ayudan a sus nietos en sus tareas, participan en clubes de lectura o de danza. La razón de por qué todas éstas personas hacen lo que hacen – la razón del por qué cada persona hace lo que hace – es que las personas hacen lo que están reforzadas para hacer. El reforzamiento es un proceso básico de la naturaleza. Entender el proceso de reforzamiento es una manera de entender el comportamiento - por qué las personas hacen lo que hacen. Se pueden utilizar otras formas de entender la conducta. Se puede utilizar una aproximación fisiológica o biológica, o bien se puede utilizar un enfoque poético o artístico. Pero mientras otros enfoques para explicar el comportamiento tienen su lugar, la explicación del comportamiento desde la perspectiva del reforzamiento tiene las ventajas de ser sencilla, observable directamente, verificable y parsimoniosa (tan simple como sea posible, sin “explicaciones excesivas”), y lo más importante, cuando se entiende el proceso de reforzamiento surge una tecnología de modificación de la conducta muy efectiva, que está disponible de inmediato para los padres, profesores, consejeros, administradores, analistas de comportamiento, todos los que están relacionados con la conducta – ¡es decir todos! Por ejemplo: cuando cualquier conducta académica, desde la lectura o las matemáticas hasta la construcción de oraciones es intencionada y sistemáticamente reforzada, el logro académico mejora rápidamente. El interés y el disfrute del aprendizaje también aumentan luego del reforzamiento sistemático del logro académico (capítulos 1, 4, 5, 7, 9 y 10). Cuando las respuestas correctas son reforzadas en las pruebas de CI o en otras pruebas estandarizadas, los puntajes de los niños de todas las procedencias socio-económicas y UNIVERSIDAD DE CHILE DEPARTAMENTO DE PSICOLOGÍA USO EXCLUSIVO DE LA CÁTEDRA PSICOLOGÍA DEL APRENDIZAJE

los niveles de logro previo aumentan significativamente (capítulos 5, 9 y 10). Cuando se reforzó sistemáticamente el seguimiento de los procedimientos de seguridad en los trabajadores de peligrosas minas a tajo abierto se logró disminuir en miles los días perdidos a causa de lesiones, se salvaron vidas, y la compañía ahorró millones de dólares debido a la reducción en los costos por accidentes y lesiones (capítulo 2). En comparación con los niños a los cuales se les refuerza para aprender los usos comunes

de los objetos comunes (por ejemplo, utilizar un borrador para borrar), los niños a los que se les refuerza para aprender usos creativos para objetos comunes (como utilizar un borrador como un flotador o una esponja) producen dibujos y escriben historias más creativas (capítulo 7). Cuando se refuerzan sistemáticamente el logro en las metas del tratamiento, la práctica de habilidades sociales y la presentación de muestras de orina negativas, aumentan considerablemente las tasas de abstinencia y empleabilidad en los adictos a drogas (capítulo 11). Los niños con problemas de conducta que participan en los programas del “Modelo de Enseñanza Familiar” basados en el refuerzo mejoran sus notas y disminuyen el número de delitos criminales y presencias ante la justicia (capítulo 12). Definido de manera simple, un reforzador es una consecuencia que aumenta la frecuencia de la conducta que precede a la consecuencia. Reforzamiento es el proceso mediante el cual se aumenta la tasa de respuesta con consecuencias reforzadas. Castigo es el proceso de disminución de la tasa de respuesta con consecuencias punitivas. El reforzamiento puede ser positivo o negativo. Ambos, tanto el reforzamiento positivo como el negativo, incrementan la conducta. El reforzamiento positivo ocurre cuando se presenta un evento o estímulo (positivo) como consecuencia de la conducta y la tasa de esta se incrementa (reforzamiento). Si leer una novela revela una historia y produce placer, y si la tasa de lectura de novelas aumenta la revelación de más historias y causa más placer, entonces la lectura de novelas ha sido positivamente reforzada por las historias y por el placer producido por la lectura. El reforzamiento negativo ocurre cuando la tasa de conducta se incrementa (reforzamiento) debido a que un evento o estímulo aversivo (negativo) ha sido eliminado o evitado. La conducta de decir “No esta noche, cariño. Me duele la cabeza”, es reforzada negativamente si es que evita o elimina eventos sexuales indeseados. La lectura de novelas puede también ser reforzada negativamente si es que la lectura permite escapar de la monotonía de la vida diaria, o permite olvidar y escapar de los problemas. Las conductas que se han incrementado o mantenido con el reforzamiento se denominan conductas operantes, o simplemente operantes debido a que “operan” en el ambiente para producir consecuencias reforzadas. Por ejemplo, la conducta verbal de decir “por favor pásame la torta” es una operante debido a que opera en el ambiente social para producir la consecuencia reforzada de recibir la torta, así como operar una máquina expendedora es una conducta operante porque permite obtener un snack reforzante. Tanto el reforzamiento positivo como el negativo incrementan la conducta u operante. Una conducta cualquiera, por ejemplo leer novelas, puede ser una función de reforzamiento positivo en una primera instancia, y de negativo en una segunda. Hacer “zapping” con el control remoto de la TV es reforzado positivamente si es que hay varios programas interesantes al mismo tiempo, y si se desea verlos todos. Pero la mayoría de las veces la búsqueda de canales es más una función de reforzamiento negativo debido a que “no hay UNIVERSIDAD DE CHILE DEPARTAMENTO DE PSICOLOGÍA USO EXCLUSIVO DE LA CÁTEDRA PSICOLOGÍA DEL APRENDIZAJE

nada bueno en la TV”, con lo que el televidente cambia de canales para escapar de malos programas o evitar los comerciales. De manera similar, el abuso de drogas puede ocurrir debido a consecuencias reforzadas positivamente – “drogarse” – o por consecuencias reforzadas negativamente – “escapar de la realidad”. Como aprenderemos en el capítulo de abuso de drogas, la persona que entra al consumo de drogas como función de reforzamiento negativo – “para escapar” – está más cerca de hacerse adicto que la persona que consume como función de reforzamiento positivo – “drogarse”. Desafortunadamente, mucho del abuso de drogas ocurre debido tanto a características de reforzamiento positivo como negativo, con lo que el consumo de drogas se convierte rápidamente en un comportamiento complejo.

Pero utilizar el concepto de reforzamiento para entender el abuso de drogas sugiere que si este ocurre porque es reforzante, entonces se puede reducir o eliminar enseñándoles a las personas nuevas conductas – tales como destrezas comunicacionales y vocacionales – que pueden producir un mayor refuerzo que el uso de drogas. Este es sólo un ejemplo de cómo utilizar una perspectiva de reforzamiento para entender el comportamiento sugiere formas prácticas para reemplazar las conductas poco adaptativas por conductas adaptativas. A pesar de que el reforzamiento positivo se puede utilizar para un gran beneficio de la humanidad, varios mitos y tergiversaciones han evitado la implementación amplia del reforzamiento sistemático. Aún así millones de personas, incluyéndome, han sido beneficiadas ampliamente por su uso. Por ejemplo, mis padres se sorprendieron cuando mi profesor de primer grado dijo que yo nunca aprendería a leer o escribir en la escuela pública. Entonces, durante el verano entre el primer y segundo año me llevaron a un laboratorio de lectura en la Universidad de Carolina del Norte donde trataron de enseñarme las destrezas básicas que necesitaría para aprender a leer y escribir. Cada pequeño éxito que tenía era reforzado con alabanzas, afecto y aliento. Mi comportamiento de lectura estaba siendo moldeado. Aproximaciones sucesivas de habilidades prerrequisito para la lectura (leer una palabra desde la izquierda a la derecha persistentemente, escribir palabras desde la izquierda a la derecha, etc.) fueron reforzadas con alabanzas. Discriminaciones adecuadas fueron también reforzadas diferencialmente con alabanzas y los errores fueron gentilmente corregidos. Por ejemplo, aprendí que d, p, q, y b, no significaban lo mismo. “Mojar” no lo deletreé como “rajom”, como lo escribí en una prueba de deletreo en la escuela. “Amac” y “cama” no eran lo mismo, y etc. A través de este programa de reforzamiento fui capaz de adquirir algunas de las conductas básicas necesarias para el éxito en leer y escribir. Por ejemplo, aprendí a empezar por el principio, desde la izquierda de las palabras, al momento de leer o escribir. Aprendí a asociar los sonidos de las letras con sus formas (B suena como “bee”; P no suena así, etc.). Mi padre, un profesor de inglés, temía que yo nunca aprendiera a leer o escribir a un nivel mínimo aceptable. Entonces más allá de la desesperación tomó el problema en sus propias manos. Papá me guió a través de un programa de reforzamiento positivo sistemático que se centró en el refuerzo del “sobreaprendizaje” (perfeccionar las repeticiones anteriores para mejorar el rendimiento). El programa comenzó un domingo en la tarde con una prueba de las palabras a dictar la semana siguiente. Cada palabra en la que me equivoqué, que usualmente eran todas, la tuve que escribir diez veces. Entonces papá me pasó otra prueba, y otra vez escribí cada palabra errónea diez veces. Después se reforzaron mis esfuerzos con un juego de ping-pong UNIVERSIDAD DE CHILE DEPARTAMENTO DE PSICOLOGÍA USO EXCLUSIVO DE LA CÁTEDRA PSICOLOGÍA DEL APRENDIZAJE

contra papá en el sótano. No importaba cuanto llorara o gritara, tenía que terminar mi dictado. No podía jugar ping-pong con papá (o hacer algo más de ese tipo) hasta que hubiese hecho mi dictado. Hicimos eso lunes, martes, miércoles, y jueves en las tardes. Al momento de tomar la prueba el viernes estaba deletreando casi todas las palabras correctamente, y papá pudo reforzar mis esfuerzos con un nuevo comic. Al comienzo sólo miraba las imágenes de los comics, pero mi lectura fue mejorando así como mi deletreo, y pronto fui capaz de leer algunas de las palabras. Finalmente, como mi lectura mejoraba lento pero seguro, pude seguir las aventuras de El Hombre Increíble y El Sargento Rock. Algunos de los refuerzos naturales que la lectura produce comenzaron a ocurrirme. Deletrear, leer, y escribir continuaron, y permanecen siendo, un desafío para mí (por ejemplo, cuando escribía esto ¡coloqué “continúam” en vez de “continúan”!). Todavía leo mal con frecuencia, con

lentitud, y deletreo peor que el resto de la gente. Pero el reforzamiento de mis esfuerzos en el deletreo en la infancia me enseñó a no rendirme. Este reforzamiento persistente me ayudó a lograr los grados de licenciado, magíster y doctor. Durante mi último año de pregrado, y durante los veranos mientras trabajaba para mi grado de magíster trabajé en Annie Sullivan Inc. Denominada así debido a la profesora de Helen Keller, Annie Sullivan Inc. estaba centrada en la instrucción uno-a-uno y en programas de manejo del comportamiento basados en el refuerzo positivo. Los clientes tenían hiperactividad severa, agresión, autismo, retraso mental y/o comportamiento autodestructivo de riesgo vital (Self-Injurious Behavior, SIB). En otras palabras Annie Sullivan tomaba sólo “lo peor de lo peor” cuando se trataba de conductas peligrosas y discapacidades de desarrollo. Trabajé con y observé varios clientes así. Para protegerse de su SIB, el cual ya había desfigurado su cara permanentemente, un adolescente autista llegó a Annie Sullivan usando un casco de portero de lacrosse, y con un protector en el brazo que no permitía doblar los codos. “Carl” lloró y gritó casi constantemente. Sin esas protecciones, podría intentar dañarse seriamente. Dentro del protector y el casco, Carl era apenas más que una persona en estado vegetal. Nuestra primera meta fue aumentar la cantidad de tiempo que Carl podía permanecer sin SIB fuera de sus protecciones. Una vez sin estas y sin auto-agredirse, a Carl se le podrían enseñar habilidades básicas (por ejemplo, conductas mínimas de higiene personal). Este programa finalmente resultó en una gran mejora de la calidad de vida de Carl. Pero hubo tormenta antes de la calma. Nunca privamos a Carl de alimento, pero comenzamos requiriendo que comiera sin su casco (inicialmente pudo usar su sombrero como reemplazo), sin el protector del brazo, y sin hacer SIB (bloqueamos los golpes a su cara). Si Carl cometía SIB, su casco se le devolvía y la comida era retirada de la mesa. Carl tenía tres oportunidades para comer sin SIB. Si lo intentaba por cuarta vez, la comida se le quitaba. El reforzamiento de Carl, la comida, era contingente para la conducta adecuada de comer sin SIB. Los requerimientos para comer de Carl no fueron realmente inusuales. A Carl se le pidió “comportarse” en la mesa y si no, se le “pedía” que se fuera. Es precisamente lo mismo que en millones de familias en las que a los niños se les pide que se comporten adecuadamente, que coman sin golpearse ni que golpeen a otros o serán echados de la mesa sin terminar la comida. Las conductas apropiadas de Carl fueron sistemática y contingentemente reforzadas. UNIVERSIDAD DE CHILE DEPARTAMENTO DE PSICOLOGÍA USO EXCLUSIVO DE LA CÁTEDRA PSICOLOGÍA DEL APRENDIZAJE

Después de unos pocos e intensos días Carl estaba comiendo feliz sin sus protecciones, sin su casco, y lo más importante, sin golpearse. En los siguientes veranos cuando volví a Annie Sullivan observé más mejoras en la conducta de Carl. Sus protecciones no estaban. Prestaba atención y trabajaba en varias habilidades vocacionales. Aunque aún de manera muy limitada, su vocabulario había mejorado. Lo mejor de todo, es que Carl casi nunca gritaba, lloraba, chillaba o intentaba lastimarse. Al contrario, parecía estar calmado y relajado. Ahora frecuentemente sonreía y a menudo reía. También observé que las pocas veces que Carl intentó SIB u otras conductas inapropiadas, fue debido a que esa conducta era reforzada. Carl usualmente intentaba SIB sólo cuando Ann estaba trabajando. Ann era una empleada hipnotizantemente hermosa, a quien yo sin éxito invité a salir. Carl también se había fijado en ella. Después de un episodio de SIB, Ann se acercaba a milímetros del rostro de Carl, y le suplicaba con una voz que hacía que todos los hombres se derritieran cuando la escuchaban, incluso a la distancia: “¿Qué pasa Carl? Oh, Carl tu no deberías hacer eso. Quiero ayudarte”. Lágrimas salían de mis ojos y de los de Carl. Le dije a otro empleado “Me haré daño también para que Ann se me acerque y me hable así. Quizás me podría ayudar también”.

Ahora, ¡eso es reforzamiento social de comportamiento inapropiado! Sea como sea, sin excepción alguna, en Annie Sullivan vi que los programas de reforzamiento diseñados producen significativos impactos positivos en las vidas de todos los clientes. Mis experiencias durante el posgrado trabajando como psicólogo ayudante y especialista en conducta para el Centro de Retardo de Georgia fueron similares a las que experimenté en Annie Sullivan en que cada vez que un programa de reforzamiento sistemático se implementaba para un cliente, este mejoraba. Una vez que el programa de reforzamiento se llevaba a cabo, los clientes gritaban y lloraban menos y sonreían y reían más. Las conductas agresivas de una niña de catorce años, “Jane”, eran tan severas que muchos miembros del personal la evitaban, huían de ella, o rechazaban rotundamente trabajar en cualquier área donde estuviera. Las observaciones mostraron que Jane normalmente se volvía agresiva cuando no había básicamente nada más para que ella hiciera. Debido a que disfrutaba estar activa, diseñé un programa que simplemente le dio más cosas para hacer, como por ejemplo hacer más puzzles, sacar la basura, y reforzándola normalmente con alabanzas verbales en relación a la tarea. Jane también disfrutaba cuando le hacían cosquillas y le daban paseos sobre los hombros, y mientras muchos miembros del personal se asustaban al estar cerca de ella, le di muchos paseos sin incidente alguno. Reforzar la dedicación a las tareas de Jane disminuyó mucho su agresividad. Esto puede no parecer mucho. Pero antes de que los procedimientos de reforzamiento sistemático comenzaran a ser utilizados con individuos institucionalizados, la mayoría de las instituciones estatales no eran más que bodegas humanas para individuos sedados, psicóticos, retardados y autistas. Los programas de reforzamiento sistemático han permitido que muchos de los individuos antes encerrados sean devueltos a sus comunidades respectivas, donde su calidad de vida normalmente mejora ampliamente. Sin embargo, así como el poder del reforzamiento se vuelve más claro y profundo, algunas personas – incluyendo muchos profesores de psicología – rechazan su estudio como “insuficiente”, “irrelevante” para la psicología, o “demasiado simplista”. Algunas personas consideran que reforzar a los niños en sus conductas académicas o UNIVERSIDAD DE CHILE DEPARTAMENTO DE PSICOLOGÍA USO EXCLUSIVO DE LA CÁTEDRA PSICOLOGÍA DEL APRENDIZAJE

“apropiadas” es como “sobornar a los niños para que se comporten”. Nunca sentí que estaba siendo sobornado al momento en que se me reforzaban la lectura y el dictado. Hay una literatura completa – un movimiento – que argumenta que si el reforzamiento, o “recompensa”, no es completamente malo, entonces al menos no se debiera utilizar nunca en la educación, o definitivamente en ningún asunto humano intencionalmente ¡porque los efectos del reforzamiento son invariablemente perjudiciales a los seres humanos!. Se argumenta que usar reforzamiento es lo mismo que “convertir el juego en trabajo” (Lepper, Green & Nisbett, 1973). Se afirma que el reforzamiento “socava la motivación intrínseca”, evita la “auto-determinación”, priva a los niños de un “sentido de competencia”, y es “controlador” aversivamente (ver Cameron & Pierce, 1994, 1996; Dickinson, 1989; Eisenberger & Cameron, 1996; Flora, 1990 para revisiones de estas afirmaciones). Si es cierto que el reforzamiento es malo, ¿entonces los cientos de situaciones en las que yo he estado implicado que sistemáticamente utilizaron el reforzamiento para mejorar las vidas de las personas (incluyéndome) no sucedieron realmente? ¿Fueron los miles de estudios y experimentos de investigación de reforzamiento fraudulentos? ¿Fueron las miles de aplicaciones de reforzamiento de las que he leído, observado, ayudado a implementar, e incluso diseñado, todas poco éticas? ¿Deberíamos realmente mantener a individuos que se hacen daño y/o son violentos con restricciones, aislados y sedados 24

horas al día, 365 días al año? ¿O podríamos utilizar el reforzamiento sistemáticamente para mejorar las vidas humanas? Creo que deberíamos usar el reforzamiento positivo para mejorar la condición humana, pero puede que esta sea una posición minoritaria. A pesar de su falsedad, el argumento de que las “recompensas externas” (ej. refuerzo) “socavan el interés intrínseco” se extiende de manera impresionante por las fiestas de cóctel académicas. Pero así como con muchos “factoides” psicológicos cuando se busca más allá de la superficie, el argumento carece de mérito. Básicamente, el mito es que si a uno se le da una “recompensa externa” (usualmente esto significa “reforzador”) para una actividad en la cual uno tiene un “interés intrínseco” (esto es, la actividad no está relacionada con reforzadores externos), entonces el “interés intrínseco” será “socavado” por la “recompensa externa”. A primera vista el mito de “socavar el interés intrínseco con recompensa externa” parece contraintuitivo: “¿si a alguien se le recompensa por algo que ya le gusta hacer, no significa que le debería gustar aún más? ¿No es eso glasear la torta?”. Si, le gustará más. Es sólo un mito el que el interés disminuye. Pero las explicaciones del mito suenan bastante lógicas, y una vez que se dan, la intelligentsia1, presumiendo de su elitista “comprensión de la naturaleza humana”, responderá probablemente “Por supuesto, debí haberme dado cuenta antes”. La explicación básica, la “hipótesis de la sobrejustificación”, se define así: si me gusta hacer algo, estoy supuestamente “justificado internamente” para la conducta. Entonces, si me premias por esta, se “sobrejustifica” (justificación interna más recompensa externa); posteriormente, si tu no me recompensas más, porque creí supuestamente que estaba llevando a cabo la conducta sólo porque estaba siendo recompensado externamente, me interesaré en ella menos y menos. La conducta es ahora “in-” o “menos” “justificada”. (Lepper et al., 1973). “¡Ah-ha!,” clama la intelligentsia, “¿no querríamos sobrejustificar una 1

Forma peyorativa de referirse a las élites intelectuales o académicas (Nota del T.)

UNIVERSIDAD DE CHILE DEPARTAMENTO DE PSICOLOGÍA USO EXCLUSIVO DE LA CÁTEDRA PSICOLOGÍA DEL APRENDIZAJE

conducta ahora, o sí?”. De acuerdo al mito, si te gustaba enseñar y lo hiciste como voluntario, pero comencé a pagarte por enseñar y luego dejé de hacerlo, nunca más enseñarás voluntariamente. “Ahora soy un profesional; sólo enseño si se me paga”. Sobrejustificación. Misteriosamente, el “interés intrínseco” original de enseñar se ha perdido. Pero con todo lo lógica que la “sobrejustificación” pueda sonar, el absurdo de todo ello es descaradamente obvio en el mundo que nos rodea. Si los “reforzadores externos” realmente “socavan el interés intrínseco”, entonces ningún veterinario tendría mascotas; todos los ex-atletas profesionales (especialmente aquellos con contrato en base a incentivos) nunca jugarían o desearían estar involucrados con sus antiguos deportes; ningún carpintero, electricista o pintor se haría voluntario para “Hábitat para la Humanidad”, una organización que construye casas para los trabajadores pobres; los profesores no querrían enseñar; los doctores no querrían practicar la medicina; en resumen, NINGÚN profesional disfrutaría su profesión y ningún profesional querría estar involucrado con esta a menos que se sintiera pagado para hacerlo. Si el mito de que los reforzadores externos socavan el interés intrínseco fuera verdad, la humanidad sería un completo caos. Suponer que un profesor, previamente voluntario, diría “la paga es buena y la necesito, pero la verdadera razón por la que elegí enseñar como profesión es porque amo hacerlo”, es tanto o más lógico que la “hipótesis de la sobrejustificación”. Esta, junto al mito de que los reforzadores externos socavan el interés intrínseco, es errónea. A pesar de la vasta evidencia de los efectos beneficiosos de los programas de reforzamiento, el libro de Edward L. Deci y Richard M. Ryan, Motivación Intrínseca y Autodeterminación en la Conducta Humana (1985) y los escritos de Mark R. Lepper de la

Universidad de Stanford, argumentan que los programas de reforzamiento tienen demasiados efectos no deseados, y que se deberían evitar o remover de las instituciones humanas, las que fueron y están siendo citadas en la prensa educativa y popular. Los capítulos sobre aprendizaje o motivación en muchos textos introductorios de Psicología concluyen con la afirmación de que el refuerzo mina el interés intrínseco, con lo que sería muy dañino utilizar los procedimientos de reforzamiento en personas. Las revistas para padres publican artículos advirtiéndoles sobre recompensar – incluso con alabanzas – la conducta apropiada en sus niños debido a los supuestos efectos perjudiciales de las recompensas en el desarrollo. Dentro de la comunidad académica y en las profesiones relacionadas a la psicología aplicada existe un amplio escepticismo, y a veces una hostilidad declarada en relación al estudio y uso del reforzamiento. El análisis de la conducta (la disciplina que estudia y aplica el reforzamiento) ha sido encerrado en un ghetto (Leahey, 1991, p. 373) por psicólogos que sienten que su dominio del estudio académico y aplicado de la conducta humana está siendo amenazado. Muchos psicólogos han menospreciado e ignorado los avances en el análisis de la conducta y la teoría del reforzamiento. En 1993, el popular libro Castigado por la Recompensa (sic): El Problema con las Estrellas Doradas, Planes de Incentivo, A’s, Alabanzas y Otros Sobornos fue publicado por el “crítico social” Alfie Kohn. En una lectura fácil, Kohn toma virtualmente todos los mitos, tergiversaciones, caricaturas, y críticas que se hayan hecho contra el reforzamiento para atacar su uso. Si no fuera por el hecho de que Kohn es un talentoso auto-promotor UNIVERSIDAD DE CHILE DEPARTAMENTO DE PSICOLOGÍA USO EXCLUSIVO DE LA CÁTEDRA PSICOLOGÍA DEL APRENDIZAJE

(invitado a Oprah Winfrey) y que su libro es ampliamente leído y citado básicamente en manuales de educación y administración de empresas, este sería ridículo. Sin embargo, el libro ha llevado al público, en una forma fácil de comprender, la idea de que el reforzamiento es malo. Increíblemente, Kohn argumenta, entre otras cosas, que las “recompensas” (como él llama a los “refuerzos”) no mejoran el desempeño o la conducta, y son malas para las relaciones humanas y la creatividad. Más aún, Kohn plantea que los incentivos, reforzadores, no se deberían utilizar en los lugares de trabajo o en las escuelas, y que las tareas de los niños no deberían ser evaluadas. De hecho, de acuerdo a Kohn, ¡los niños NO deberían ser alabados! A lo largo de mi vida he sido testigo, y a menudo parte del uso sistemático del poder del reforzamiento positivo para mejorar la condición humana. Sin embargo otros, como Kohn, continúan machacando el erróneo mensaje de que el usar el reforzamiento intencionalmente con personas de alguna manera las convierte en menos que humanos. La mejora de la condición humana ha sido obstaculizada debido a que los mitos acerca del reforzamiento han evitado la implementación efectiva de muchos programas de reforzamiento. Se necesita una reacción ampliamente difundida para contrarrestar los mitos y tergiversaciones acerca del reforzamiento. Con tal reacción, el uso planificado de los procedimientos de reforzamiento probablemente sería más utilizado, y cuando los resultados aparezcan, aquellos relacionados con los programas de reforzamiento estarán mejor informados para responder a las criticas y defenderse de los ataques sobre el bien que están haciendo. Este libro tiene por propósito responder a los mitos, tergiversaciones, críticas acerca del uso planificado del reforzamiento en las instituciones y relaciones humanas, y también para presentar con exactitud el uso y el potencial del reforzamiento en la sociedad.

Parte 1

MITOS Y TERGIVERSACIONES DEL

REFORZAMIENTO 1 REFORZAMIENTO COMO “PSICOLOGÍA DE RATAS”

Se ha desarrollado una nueva vacuna. Aclamada como un milagro, protege de TODAS las enfermedades de transmisión sexual incluyendo el SIDA y el herpes, y además previene la gripe, el resfrío común y todas las enfermedades de la infancia, así como la varicela. La vacuna estará disponible desde mañana. ¿La tomaría? ¿Desearía que a su hijo se le inyectara? Disculpe, una parte de la información concerniente a la vacuna hipotética se dejó afuera. La vacuna no ha sido nunca testeada en animales y no está basada en los modelos UNIVERSIDAD DE CHILE DEPARTAMENTO DE PSICOLOGÍA USO EXCLUSIVO DE LA CÁTEDRA PSICOLOGÍA DEL APRENDIZAJE

animales de las enfermedades. La compañía farmacéutica produjo la droga observando a personas con las enfermedades, y juntó cosas que le parecían lógicas. Sabiendo esto, ¿tomaría usted la vacuna? Probablemente no. En el mundo real, antes de que a las nuevas drogas se les permita ser testeadas de una manera muy limitada y controlada en humanos, deben pasar por numerosas pruebas en modelos animales de las enfermedades. Mientras la legislación requiere que las compañías farmacéuticas prueben sus nuevas drogas en animales antes de que se les permita probarlas en personas, en muchos “tratamientos” psicológicos y educacionales pasa lo contrario. Los tratamientos son raramente, si es que alguna vez lo son, testeados en animales y casi nunca están basados en modelos animales de comportamiento anormal o inapropiado. A menudo los “tratamientos” no están siquiera basados en investigación válida de ningún tipo (Singer & Lalich, 1996; Watters & Ofshe, 1999). Psicólogos y educadores simplemente los desarrollan observando a la gente con problemas de conducta, y generan algo que de alguna manera se relaciona con lo que han observado. Esta actitud del “todo sirve” en psicoterapia ha producido, en la estimación del investigador de la Universidad de Pennsylvania Alan E. Kazdin (1994) ¡más de 400 enfoques diferentes de psicoterapia! Ed Anderson, miembro del Centro de Estudios de la Conducta de Cambridge, se lamentó así acerca de la situación: “Siendo Químico de profesión, a menudo me pregunté por qué sólo existen una química, una biología y una física y en cambio existen 10.000 Psicologías” (en Daniels, 1994, p. 12). Mientras que para los problemas de Física no sería ético, este enfoque de “inventa una terapia” es una práctica standard cuando se trata de problemas de conducta y educacionales. El resultado es que millones de dólares se pierden en charlatanería como “regresión a vidas pasadas”, “facilitación de comunicación”, “terapia” psicoanalítica empíricamente invalidada (Ej: Singer & Lalich, 1996; Watters & Ofshe, 1999; Wolpe, 1981), instrucción de lectura de “palabra completa” y “nuevas matemáticas”. De hecho, un niño murió en un esfuerzo “renacedor” para obtener un “vínculo” con su madre adoptiva. El uso sistemático y planificado del reforzamiento se ve como muy elemental, inefectivo, irrelevante e incluso como poco ético para los problemas humanos. La ciencia de la conducta, denominada “análisis del comportamiento”, que está basada en el Análisis Experimental de la Conducta, y a menudo utiliza el comportamiento de ratas y palomas como fuente de información para investigar el proceso de reforzamiento, es despreciada por muchos en Psicología, Administración y Educación. Sin embargo, irónicamente los tratamientos y programas psicológicos y educacionales más efectivos son todos en última instancia derivados de modelos u observaciones de la conducta animal y su relación sistemática con el reforzamiento. De la misma manera, la Administración del Desempeño,

desarrollada por Aubrey C. Daniels, aplica directamente el análisis de la conducta básicamente con la utilización efectiva de reforzamiento positivo en la administración de negocios. Esta aplicación directa y sistemática del reforzamiento ha resultado en una mejora en la calidad y productividad en compañías tales como 3M, Kodak, Rubbermaid y Honeywell, así como en otras compañías en Estados Unidos, Canadá, México, Gran Bretaña, Francia, Italia y Brasil (Daniels, 1994). UNIVERSIDAD DE CHILE DEPARTAMENTO DE PSICOLOGÍA USO EXCLUSIVO DE LA CÁTEDRA PSICOLOGÍA DEL APRENDIZAJE

LA PSICOLOGÍA DE RATAS EN LA EDUCACIÓN DE BARRIOS PROBLEMÁTICOS En 1975, en uno de los sectores más pobres y violentos del área de Houston, Texas, Thaddeus Lott se hizo cargo de la Escuela Básica Wesley, una escuela con un 99% de alumnos pertenecientes a minorías étnicas. Sólo el 18% de los alumnos de tercer grado eran capaces de leer al nivel adecuado. Sin embargo, para 1996 el 100% de los alumnos de tercer grado pasaron la Evaluación de Destrezas Académicas de Texas. En 1998 los alumnos de primer grado de Wesley obtuvieron el lugar 13 de 182 colegios de Houston en lectura, sobrepasando incluso a cursos mayores de colegios predominantemente de raza blanca. Resultados similares se han obtenido con programas funcionalmente similares en otras escuelas de “ghettos decadentes” tales como la Escuela Pública 114 del Bronx (Lemann, 1998). A pesar de su éxito verdaderamente impresionante, el director Lott, en vez de ser aplaudido, fue vilipendiado por muchos en psicología y educación. Su éxito se pasa por alto y se critica debido a que su programa se basa en el uso de refuerzos contingentes con el logro progresivo de los profesores y estudiantes y usa el método de “instrucción directa”. En la instrucción directa los estudiantes son constantemente ejercitados con respuestas correctas reforzadas y errores corregidos inmediatamente. En otras palabras, el enfoque que Lott utiliza para llevar su escuela se basa en los principios del aprendizaje derivados del estudio de la conducta animal, o despectivamente, que se basa en la “psicología de las ratas”. De hecho, de acuerdo a críticos como Kenneth Goodman, profesor de lenguaje, lectura y cultura en la Universidad de Arizona, no sólo el enfoque de Lott es denominado “psicología de ratas”, sino que además está dirigido a los pobres y niños pertenecientes a minorías y es algo “que los padres de clase media no apoyarían” (“a pesar de los puntajes de las pruebas”, 1998). A pesar de tales ataques insustanciales y representaciones inexactas, el progreso continúa. En la Escuela Básica Wesley, la conducta tanto de los estudiantes como de los profesores es reforzada de acuerdo a un programa de administración conductual estricto, planificado, programado y basado en la investigación, centrado en el reforzamiento contingente de sucesivos logros académicos. No se puede decir que ha habido enseñanza si no ha habido aprendizaje. Por lo tanto, la efectividad de la enseñanza se mide por el progreso académico de los estudiantes. Las promociones y ascensos de los profesores son contingentes a que sus alumnos obtengan, al finalizar el año, resultados más altos en las pruebas que los alcanzados al comenzar. Esto es, la conducta de enseñanza efectiva se refuerza con ascensos y promociones. Como resultado, la conducta de enseñanza efectiva es seleccionada, aumenta su frecuencia, y los repertorios de enseñanza inefectivos tienden a desparecer o extinguirse. La instrucción directa está ampliamente basada en los conceptos de moldeamiento (el método de reforzar aproximaciones sucesivas) y fluidez. La conducta que ocurre con facilidad, exactitud y a una alta tasa es fluida. La comprensión de la naturaleza fundamental y el uso sistemático de ambos, moldeamiento y fluidez, se deriva directamente de los estudios que utilizan ratas y palomas como sujetos para los análisis experimentales básicos del comportamiento.

El moldeamiento involucra el reforzamiento de respuestas cada vez más cercanas a la conducta final, y la extinción o no reforzamiento de aproximaciones previas. Para moldear a una rata para presionar una palanca, inicialmente se le refuerza con alimento al UNIVERSIDAD DE CHILE DEPARTAMENTO DE PSICOLOGÍA USO EXCLUSIVO DE LA CÁTEDRA PSICOLOGÍA DEL APRENDIZAJE

acercarse a esta. Luego se refuerza tocar la palanca, pero ya no solo acercarse. A continuación se refuerza presionar la palanca pero ya no simplemente tocarla. A la rata se le ha enseñado a presionar una palanca mediante el refuerzo de aproximaciones sucesivas y dejando de reforzar o extinguiendo las aproximaciones previas. Una madre guepardo comienza por traer carne a sus crías para suplementar su leche. Luego, trae pequeñas crías de gacelas heridas con el fin de que puedan matarlas y comérselas. Más tarde trae crías de gacela más grandes e intactas. Finalmente, la madre guepardo le permite a su prole compartir la cacería. Al traer sucesivamente presas más difíciles, la madre ha moldeado la conducta de caza de sus crías. A un niño se le enseña a leer la palabra era primero siendo reforzado socialmente para hacer el sonido “eee” en respuesta al estímulo impreso E, y para hacer el sonido “ra” en respuesta a la palabra estímulo impresa “ra”. Luego, se refuerza el sonido “eee….raaa” en respuesta al estímulo “era”. A continuación el sonido “e…ra” es reforzado diferencialmente y el sonido “eeee…….raaaaaa” no se refuerza o se corrige. Por último, solo la conducta verbal de decir “era” en respuesta al estímulo impreso “era” es reforzada. Aprender a leer “era” se moldeó al reforzar aproximaciones sucesivas de la conducta a la respuesta deseada. Aprender a leer mediante fonética depende en parte del moldeamiento. A pesar de parecer simple, el moldeamiento puede construir repertorios conductuales complejos y puede requerir miles de repeticiones. Aprender matemáticas básicas (suma y resta), por ejemplo, puede requerir más de cincuenta mil respuestas (L.K. Millar, 1997, p.261). Si aprender matemáticas simples requiere de miles de repeticiones, entonces es fácil de ver que para aprender habilidades académicas elementales se requieren cientos de miles, sino millones de repeticiones. La adquisición de fluidez depende de repeticiones rápidas, con las respuestas correctas reforzadas. Para tener habilidades funcionales, se requiere fluidez (Jonson & Layng, 1992). Muchos graduados de universidad y algunos de secundaria han tenido algunos años de estudios de algún idioma extranjero. Sin embargo, una amplia mayoría de estos adultos no puede hablar, leer o entender el lenguaje que estudiaron. No tienen una habilidad funcional para la lengua extranjera debido a que nunca fueron fluidos con el idioma. Al contrario, alcanzaron el nivel mínimo necesario para pasar el próximo examen. Pero los pocos que si llegaron a ser fluidos en la lengua a menudo disfrutan hablarla y escucharla. De manera semejante, la fluidez en las matemáticas conlleva una apreciación de su poder, belleza y utilidad. Además de considerar “hermosa” una solución, los matemáticos pueden llamarla “elocuente”. Pero de aquellos con habilidades matemáticas pobres y no fluidas se dice que tienen “fobia a las matemáticas”. A aquellos que no pueden leer bien, no les gusta hacerlo. Pero los lectores fluidos disfrutan la lectura. Un cirujano de corazón que ha adquirido sólo las destrezas básicas para realizar una cirugía de bypass puede llevar a cabo la operación correctamente pero tomando muchas horas. En contraste, un cirujano que es fluido en la operación la llevará a cabo igualmente bien pero puede tomar menos de dos horas. A pesar de que ambos doctores llevan a cabo la operación correctamente, los pacientes del doctor fluido tienen más probabilidad de sobrevivir. El comportamiento fluido es necesario tanto si la conducta operante es mecánica de autos o una operación de corazón. UNIVERSIDAD DE CHILE DEPARTAMENTO DE PSICOLOGÍA

USO EXCLUSIVO DE LA CÁTEDRA PSICOLOGÍA DEL APRENDIZAJE

Cuando una destreza conductual no es fluida, es dificultosa. De acuerdo a la ley del menor esfuerzo, este es adverso (Eisenberger, 1992), y tenderá a evitarse. Por lo tanto, el enseñar destrezas académicas básicas a un alto nivel de fluidez aumenta la probabilidad de que se adquieran destrezas académicas más avanzadas. Por otro lado, aprender sólo a un nivel de adquisición mínimo aumenta la probabilidad de fallas académicas posteriores. En universidades a lo largo de Estados Unidos, la instrucción directa es a menudo menospreciada como un método de enseñanza “embrutecedor” (“instruir y destruir” 2, Cheney, 1999). Una frase más precisa puede ser “enseñar e ilusionar”. Cuando una conducta es altamente reforzada y llevada a fluidez, como conducta está en instrucción directa, da lugar a “autoestima” (Cheney, 1999) y los alumnos disfrutan del aprendizaje. Una conducta fluida es aquella que ha sido fuertemente seleccionada y por lo tanto es muy probable que ocurra bajo las condiciones ambientales apropiadas. El método de construcción de fluidez en instrucción directa se basa en el concepto de laboratorio (“de ratas”) de “respuesta operante libre”. En la operante libre, siempre que el organismo esté en el ambiente, es “libre” de ejecutar la operante tan frecuente o infrecuentemente como se lo permita su fisiología. El porcentaje de respuestas correctas, la medición educacional estándar, captura solo parte de lo que es necesario para que la conducta se haga fluida. La fluidez requiere una alta tasa de desempeño preciso. La presión de la palanca por la rata se puede reforzar cuando haya una luz encendida en la palanca y no cuando esté apagada. Inicialmente, la presión de la palanca será igualmente probable si es que la luz está encendida o no. Si el entrenamiento termina tan pronto como se hayan ejecutado siete respuestas cuando la luz esté encendida y sólo tres cuando la luz esté apagada (70 % de exactitud, una meta típica para la promoción en educación), no es demasiado probable que para la próxima sesión de entrenamiento se ejecute la respuesta correcta. Aún más, entrenar una nueva conducta basada en el aprendizaje discriminatorio previo (presionar cuando la luz está encendida; no presionar cuando la luz está apagada) será casi imposible posteriormente debido a que el aprendizaje inicial, que obtuvo un 70% de exactitud, nunca fue fluido. En cambio, si para finalizar la sesión o para enseñar una nueva conducta basada en la discriminación inicial se hubiera requerido presionar la palanca a una alta tasa mientras la luz estaba encendida, a cientos de respuestas por minuto, y a una tasa baja o cero cuando la luz estaba apagada, sería altamente probable obtener la respuesta correcta durante la próxima sesión y lograr aprendizaje de nuevas respuestas basadas en el aprendizaje previo. Una operante libre a tasa alta de respuesta y reforzada produce fluidez. Si se intenta enseñarle a un niño nuevas habilidades matemáticas basadas en la simple suma y resta antes de que el niño sea fluido, pero después de que logre un 70% de respuestas correctas (quizás aún utilice sus dedos para contar, o quizás se tarda un minuto por problema), enseñar habilidades posteriores como la multiplicación, división o resolución de problemas será muy difícil si no es que imposible. Sin embargo, si al niño se En el original en inglés la expresión utilizada es “drill and kill”, literalmente “instruir (o ejercitar) y destruir”, pero traducida usualmente como “embrutecer”. De ahí la relación que hace luego con “enseñar e ilusionar” (en inglés “drill and thrill”) (Nota del T.) 2

UNIVERSIDAD DE CHILE DEPARTAMENTO DE PSICOLOGÍA USO EXCLUSIVO DE LA CÁTEDRA PSICOLOGÍA DEL APRENDIZAJE

le requiere ser fluido en sumas y restas simples, por ejemplo, a una tasa de diez cartas correctas por cada carta incorrecta, a la velocidad de una carta por segundo, antes de enseñarle una nueva destreza, posteriormente aprender multiplicación, división, y resolución de problemas será mucho más fácil. De acuerdo a los investigadores y reformadores educacionales Kent R. Johnson y T. V. Joe Layng, el requisito de fluidez en la conducta académica es un resultado directo “del descubrimiento de Skinner (1938) de la importancia de la tasa de respuestas como una variable dependiente” (Johnson y Layng, 1992, p.1476). El clásico libro de Skinner La Conducta de los Organismos (1938) se basa completamente en investigación con ratas. Quizás la afirmación “usar el reforzamiento en los humanos es ‘psicología de ratas’” no es un mito después de todo. Los principios generales del reforzamiento (e.j. demora, intensidad, frecuencia del reforzamiento y otras variables, por ej. que la disponibilidad simultánea de respuestas alternativas y fuentes de reforzamiento afectan la tasa de respuesta) han todos sido establecidos sistemáticamente casi exclusivamente en base al estudio de la conducta de ratas y palomas bajo variadas contingencias de reforzamiento. Cada disciplina basada en la ciencia desarrolla una comprensión de sus principios generales en condiciones de laboratorio controladas y simplificadas antes de que se apliquen a situaciones humanas. Los principios generales de una reacción química pueden ser establecidos en un tubo de ensayo con variables aisladas antes de que se apliquen en una medicación farmacéutica. La electricidad, los transistores, resistencias, y todos los demás componentes de los computadores modernos fueron inicialmente estudiados en situaciones de laboratorio controladas y simplificadas, antes de que sus aplicaciones sistemáticas fueran posibles. Sin embargo, cuando el análisis experimental de la conducta desarrolla principios generales en condiciones controladas y simplificadas en el laboratorio antes de que se apliquen a situaciones humanas, estos son descartados en su aplicabilidad a las personas. Los procedimientos son excluidos, y sus promotores son a menudo mirados con desprecio. “Las personas no son ratas. Estudiar la conducta de las ratas no puede ayudar a las personas”. Sin embargo, tales ataques son provocadores pero no muy agudos. Para que sea válido, un ataque debe ser preciso. Si lo que se entiende por “psicología de la rata” es la aplicación sistemática de los principios generales del reforzamiento en programas de análisis de conducta aplicados, entonces, cuando los niños tienen problemas de conducta, los padres de clase media de hecho usan crecientemente “psicología de ratas”, o corren por ayuda a programas basados en la “psicología de la rata”. Afortunadamente para estos padres de clase media, los datos muestran que ellos han tomado la mejor decisión. Además estos programas ofrecen la mejor esperanza para los niños de minorías pobres para tener éxito en la escuela. LA PSICOLOGÍA DE RATAS EN EL HOGAR Los padres de clase media y alta a menudo confían en el “tiempo fuera” más que en los maltratos para corregir la conducta de sus niños. Por una buena razón claro. Las investigaciones de Murria A. Straus sobre maltrato infantil durante más de veinte años han demostrado consistentemente una correlación directa entre la cantidad de maltrato que un niño recibe y crecientes problemas sociales, psicológicos y conductuales tanto en la infancia como en la adultez (ej. Straus, 1994). A lo largo de la vida de una persona, el maltrato causa muchos más problemas que lo que ayuda. Los maltratos frecuentemente UNIVERSIDAD DE CHILE DEPARTAMENTO DE PSICOLOGÍA USO EXCLUSIVO DE LA CÁTEDRA PSICOLOGÍA DEL APRENDIZAJE

ocurren no porque ayuden al niño, sino porque son a menudo refuerzos negativos para los padres. Los padres que utilizan el tiempo fuera en vez de los golpes deberían saber que la

denominación correcta para “tiempo fuera” es entrenamiento por omisión, y que como lo notaron los investigadores de la Universidad de Florida Cynthia J. Pietras y Timothy D. Hackenberg, el principio general del tiempo fuera deriva directamente del laboratorio animal (de ratas y palomas): El entrenamiento de omisión es uno de los procedimientos más comúnmente utilizados en los entornos educacionales y terapéuticos. Como muchos otros procedimientos conductuales utilizados en contextos de aplicación, el entrenamiento de omisión tiene sus orígenes en la investigación básica de laboratorio…. En los escenarios de aplicación,… su aplicación de contingencia de respuesta es utilizada comúnmente para suprimir la conducta no deseada (Pietras & Hackenberg, 2000, p. 147). Cada vez que los padres utilizan el tiempo fuera en vez de los golpes para suprimir la conducta no deseada, ¡están usando “psicología de ratas” con sus niños! En el laboratorio, por ejemplo, el entrenamiento por omisión se puede programar para enseñar secuencias de presión de palanca. Durante el entrenamiento, si la rata presiona la palanca sin seguir la secuencia, la caja se oscurecerá inmediatamente y se dejará de obtener refuerzo mediante la presión de la palanca por un breve periodo de tiempo, usualmente unos pocos segundos. Esto es, al presionar la palanca fuera de la secuencia, ocurre un “tiempo fuera del refuerzo positivo” por el tiempo en que las respuestas no son reforzadas. Una omisión del refuerzo positivo para la presión de palanca indeseada puede ser tan o más efectiva que un shock eléctrico para suprimir la respuesta. (¿Es el shock el equivalente al maltrato para la rata?) ¿Una rata debería ser shockeada o tener una omisión de refuerzo positivo? ¿Un niño debe ser maltratado o tener un tiempo fuera por “mala conducta”?. La omisión de refuerzo positivo, “psicología de ratas”, ha reducido o eliminado excesos de conducta severos, peligrosos y frecuentes en niños donde otros métodos han fallado. En un ejemplo clásico de omisión, investigadores de la Universidad de Vermont (Knight & McKenzie, 1974) entrenaron a unos padres en el uso de omisión de refuerzo positivo en un programa para eliminar la conducta persistente de chuparse el dedo en niños de seis a ocho años que iniciaron ese hábito durante su infancia. Al comienzo, cada noche los padres les leían a sus hijos sus historias favoritas sin importar lo que hicieran. Los niños se chupaban el dedo. Pero cuando el procedimiento de omisión comenzaba, los padres simplemente paraban de leer cada vez que el niño tocaba o acercaba su dedo a la boca. La lectura comenzaba otra vez tan pronto como el niño dejaba de chuparse el dedo. Esto es, este hábito produjo una “omisión de refuerzo positivo” (lectura). La conducta de chuparse el dedo se eliminó en todos los niños. ¡Tres hurras para la psicología de ratas! UNIVERSIDAD DE CHILE DEPARTAMENTO DE PSICOLOGÍA USO EXCLUSIVO DE LA CÁTEDRA PSICOLOGÍA DEL APRENDIZAJE

LA PSICOLOGÍA DE RATAS EN ESCUELAS PRIVADAS Y COLEGIOS3 La aplicación de los principios básicos de condicionamiento operante, o “psicología de ratas”, ha producido logros académicos amplios y rápidos para los novatos de colegios académicamente en desventaja. En 1991, el 40% de los estudiantes del colegio Malcolm X de Chicago obtuvo puntajes bajo el octavo nivel en lectura, y el 30% bajo el sexto nivel. En un número significativo de los estudiantes, virtualmente todos Hispanos o Afroamericanos, se falló en corregir esta deficiencia con horas extras de clases. Durante el verano de 1991, un programa piloto para los estudiantes de Malcolm X basado ampliamente en la fluidez y los principios generales de la “psicología de ratas” de Skinner, mejoró la lectura y comprensión de vocabulario correspondientes a 1.1 año en sólo 20 horas de enseñanza. Los logros en cálculo, solución de problemas y conceptos fueron desde 1.9 a 6.0 años. No se pedían tareas para la casa. A raíz de estos resultados,

Malcolm X ha establecido un Instituto Preuniversitario diseñado según el programa piloto (Johnson & Layng, 1992). Con estudiantes diagnosticados con problemas de aprendizaje y/o “déficit atencional”, se obtienen invariablemente resultados tan buenos o incluso superiores al programa Malcolm X en la Academia Morningside, en Seattle, Washington. De hecho, el programa Malcolm X se basa en el modelo Morningside (el que a su vez se basa en la psicología operante o “de ratas”). En Morningside, no sólo niños de clase media sino que también adolescentes sin hogar y con antecedentes criminales han logrado resultados académicos impresionantes. Morningside ofrece dos garantías de devolución del dinero. Los alumnos avanzarán al menos dos años en un año, y aquellos diagnosticados con déficit atencional aumentarán su promedio de atención a la tarea de uno a tres minutos, hasta veinte minutos o más. Ningún padre ha pedido nunca su dinero de vuelta (Daniels 1994; Johnson & Layng, 1992). Etiquetar a una persona con Trastorno de Déficit Atencional (o con “Trastorno Obsesivo Compulsivo” o cualquier etiqueta de ese tipo) tiene tanto significado y hace tan poco bien como etiquetar a un programa como psicología de ratas. El enfoque más válido para superar las deficiencias y excesos conductuales es conducir un análisis de las interacciones conducta-ambiente del individuo, y luego implementar una intervención basada en ese análisis, y en la aplicación sistemática de principios generales de la conducta, incluyendo el reforzamiento de respuestas operantes apropiadas. La aplicación sistemática de los principios del reforzamiento en la educación de niños con deficiencias es el método más efectivo, agradable y conveniente para acercar el logro educacional de las minorías de bajo nivel socioeconómico al nivel de la mayoría de clase media blanca. En una historia de éxito similar a la de Lott en Houston, cuando la Escuela Básica y Preparatoria Harvest, que sirve a muchos niños de familias pobres de Minneapolis, introdujo la instrucción directa, los puntajes de lectura de los pre-escolares subieron desde el promedio al percentil 89 (Cheney 1999). Mientras que gran parte de la élite intelectual lo niega, y se apega a las nociones románticas del logro humano, las conductas académicas de los niños de élite son copiosa En USA se denomina “College” a una amplia variedad de instituciones tanto de pregrado como posgrado. No son propiamente universidades aunque la distinción no suele ser estricta. Algunas universidades son de hecho federaciones de “colleges” autónomos (Nota del T.). 3

UNIVERSIDAD DE CHILE DEPARTAMENTO DE PSICOLOGÍA USO EXCLUSIVO DE LA CÁTEDRA PSICOLOGÍA DEL APRENDIZAJE

y frecuentemente reforzadas. Es este reforzamiento generoso y frecuente el que selecciona las conductas académicas, artísticas e intelectuales. Los programas de reforzamiento sistemático, tales como el de instrucción directa, pueden proveer el reforzamiento necesario para seleccionar las conductas académicas, artísticas e intelectuales de niños con déficit, cuyos ambientes carecen de reforzadores adecuados y suficientes para las conductas académicas. Es una historia personal de reforzamiento para operantes particulares, sean artísticas o anarquistas, y no una cualidad intrínseca, mística o interna del ser humano la que es responsable por lo que el individuo logra. LA PSICOLOGÍA DE RATAS EN LA LECTURA Ganando por Aprender es un ejemplo de programa de reforzamiento para niños en riesgo académico. La conducta de leer se refuerza pagándole al niño dos dólares por cada libro leído. Este reforzamiento también puede ser contingente con leer partes del libro a un adulto voluntario, o escribir un informe acerca de este. Alfie Kohn, autor del polémico Castigado por la Recompensa, afirma que “sería difícil proponer una forma menos

efectiva para ayudar a los niños a valorar la lectura” (Kelly, 1995). Aún así la investigación es clara; esto es, al pagarle a niños en riesgo académico para leer, se les enseña a valorar la lectura. Una investigación conducida por profesores del Colegio West Georgia descubrió que el programa de reforzamiento Ganando por Aprender aumenta las actitudes positivas tanto hacia la lectura académica como la recreacional (McNinch et al., 1995). Al aumentar sus habilidades de lectura, más de diez mil niños en riesgo académico han sido beneficiados por este programa de reforzamiento y han aprendido a valorar la lectura. Ganando por Aprender generalmente sirve con niños de nivel socioeconómico bajo. Los padres de clase media, cuyos hijos generalmente asisten a colegios, tienen más posibilidades de pagarles a sus hijos con el fin de aumentar su frecuencia de lectura (Flora & Flora, 1999; Flora & Popanak, 2001). También es más probable sean niños de clase media los que participen en el programa de lectura Book It! de Pizza Hut. Durante el año escolar 1995-1996, más de veintidós millones de niños en Estados Unidos, Canadá y Australia participaron en Book It!, y este está creciendo. Book It! refuerza la lectura con tickets intercambiables por una pizza personal gratis cuando se alcanzan las metas de lectura establecidas por el profesor. Es un programa de reforzamiento simple y sencillo (Flora & Flora, 1999). Un informe del Instituto de Ciencia Humana y Servicios de la Universidad de Rhode Island acerca de Book It! concluyó que “la base detrás del programa fue ofrecer reforzamiento positivo inmediato para recompensar los logros individuales…fue esta recompensa al esfuerzo y no a la habilidad lo que probablemente hizo que Book It! fuese tan atractivo para padres y estudiantes” (Institute, 1986, p.17, énfasis en el original). Más aún, los profesores informaron que el programa aumentó las actitudes positivas hacia el aprendizaje (61 %), el nivel de lectura (69 %), y el placer de leer (80 %); mientras más permanecían los niños en el programa, más subía su nivel de lectura y aumentaba el placer de leer. A través de Book It!, más de veintidós millones de niños se benefician cada año de la “psicología de la rata”. Cuando los niños de clase media enfrentan serias dificultades académicas, los padres hacen típicamente todo lo necesario, y utilizan cualquier recurso disponible para superar las deficiencias de sus niños. Para remediarlas, los padres de clase media están pagando cada vez más cientos de millones de dólares, a un precio de $35 a $65 por hora, en “centros de aprendizaje” con fines de lucro tales como los Centros de Aprendizaje Sylvan. UNIVERSIDAD DE CHILE DEPARTAMENTO DE PSICOLOGÍA USO EXCLUSIVO DE LA CÁTEDRA PSICOLOGÍA DEL APRENDIZAJE

Sylvan opera en Estados Unidos y en ciento setenta países. Ahora está participando de las escuelas públicas, recibiendo dólares federales mediante el Capítulo Uno para Educación Compensatoria (Hancock, 1994). Mientras Sylvan afirma utilizar un currículo específico para cada niño, el motor que impulsa el éxito académico de las tutorías de Sylvan no es más que un simple programa de refuerzos simbólicos o economía de fichas. Aún más, en Sylvan, como en instrucción directa, las respuestas correctas son frecuente e inmediatamente reforzadas, y los errores inmediatamente corregidos. Como en la Academia Morningside, Sylvan también garantiza que cada niño avanzará un grado en treinta y seis horas de instrucción o menos. La mayor parte de lo que Sylvan hace no es más que lo que cualquier padre podría hacer con un poco de tiempo y un mínimo de conocimientos en reforzamiento. ECONOMÍAS DE FICHAS La moderna aplicación sistemática de las economías de fichas utilizadas en los Centros de Aprendizaje Sylvan y en otras organizaciones a lo largo del mundo, es una derivación directa de los principios generales del reforzamiento establecidos en el laboratorio de ratas, como explica el investigador S.E.G. Lea, de la Universidad de Exeter, Reino Unido:

La “Psicología Operante” no sólo consiste en aquellos que aún llevan a cabo investigación básica con ratas y palomas en cajas de Skinner. Otra influencia importante viene de aquellos que buscan usar principios operantes, por ejemplo en psicología educacional o clínica – los modificadores de la conducta…. En un ambicioso y original proyecto de investigación clínica, Teodoro Ayllon y Nathan Azrin (1968) buscaron aplicar los principios del reforzamiento para elevar el nivel conductual en una sala completa de pacientes esquizofrénicos severamente retrasados…. Ayllon y Azrin… introdujeron “fichas”, las que se les entregaban a los pacientes como recompensas cuando ejecutaban cualquier respuesta deseada, y podían ser intercambiadas por cualquiera de los “reforzadores de apoyo”. La base del sistema de fichas de Ayllon y Azrin yace en el bien establecido principio del reforzamiento condicionado, que ha sido estudiado en detalle en animales, y demostrado extenderse al uso de fichas al menos en ratas y simios…. Las economías de fichas han tenido un éxito considerable y pronto se extenderán ampliamente (Lea, 1987, p. 97). En una economía de fichas, los reforzadores generalizados, o fichas, son entregados contingentemente sobre una conducta específica. Las fichas no tienen validez por sí solas. Son los reforzadores de apoyo por los que se intercambian los que hacen que las fichas sean reforzadores efectivos. Un reforzador de apoyo puede ser cualquier cosa que tenga valor para el individuo. Puede ser alimento u horas de computador, dependiendo del comportamiento de la persona que está siendo reforzada con fichas (ver Martin & Pear, 1999, para un repaso de las economías simbólicas). Como lo notó Lea, el uso sistemático de fichas se deriva del concepto del reforzamiento condicionado. Cuando el presionar una palanca se refuerza con un pellet de comida, pero su entrega es precedida por un tono, este se convertirá en un poderoso reforzador condicionado por el que la rata trabajará para producir. Si una esposa escucha siempre a Vivaldi antes de reforzar los avances sexuales de su marido, entonces Vivaldi se convertirá en un poderoso reforzador condicionado y el esposo ejecutará otras conductas para recibir el reforzador condicionado (comprar CDs, pedir Vivaldi en la radio, etc.). Los reforzadores condicionados asociados a varios reforzadores de apoyo son reforzadores generalizados, de los cuales las fichas son un ejemplo. Basadas en la variedad y el valor de los UNIVERSIDAD DE CHILE DEPARTAMENTO DE PSICOLOGÍA USO EXCLUSIVO DE LA CÁTEDRA PSICOLOGÍA DEL APRENDIZAJE

reforzadores de apoyo, las fichas se pueden convertir en motivadores muy poderosos. “Los programas de reforzamiento de fichas han probado repetidamente su valor mejorando la productividad académica y disminuyendo las conductas inapropiadas, y han probado ser muy efectivos en evaluaciones a largo plazo en escuelas de barrios problemáticos” (O’Leary, 1991, p.5). Los profesores de clases normales han utilizado los sistemas de reforzamiento de fichas para mejorar el desempeño en las pruebas y conductas de estudio en sala (ej. Karraker, 1971), por nombrar algunos. Encuestas informales a profesores en mis clases de aprendizaje de posgrado revelaron que más de un tercio de ellos empleaba algún tipo de sistema de reforzamiento de fichas en sus clases. Más aún, cuando a los profesores se les enseña explícitamente acerca de las economías de fichas es más probable que las empleen en sus salas de clases e informen buenos resultados (Kestner & Flora, 1998). En Sylvan, las conductas académicas apropiadas son reforzadas con fichas (que son solamente fichas de póker con el texto “Centros de Aprendizaje Sylvan” estampado). Las fichas se cambian por CDs, entradas para el cine, pelotas, juegos, u otros artículos de valor para los niños en la “Tienda Sylvan”. Es la simple aplicación de los principios básicos del reforzamiento (“psicología de ratas”) lo que hace a Sylvan tan exitoso, y es este éxito el que lleva los padres de clase

media a la puerta de Sylvan. “INTENTÉ EL REFORZAMIENTO. NO FUNCIONA EN MI CLASE” Así como con otros fenómenos naturales, cuando se intenta la aplicación sistemática de los principios de reforzamiento con poco conocimiento puede ser algo peligroso. A veces, un profesor puede tratar de incrementar la conducta académica al “recompensarla” con estrellas doradas, o caritas sonrientes al lado del nombre del estudiante. Como el comportamiento de los estudiantes no cambia, o solo lo hace temporalmente, el profesor pronto descubre que realmente no se interesan por las estrellas o caritas. Como la conducta que el profesor trató de incrementar no aumenta, concluye que el “reforzamiento no funciona”. El profesor no está solo, como podremos ver; muchos psicólogos y educadores también creen que “el reforzamiento no funciona”. Pero esto es lo mismo que decir “la selección natural no ocurre”. En este ejemplo, el profesor desarrolló un sistema de entrega de fichas o reforzadores condicionados, pero falló en asociarlos (las estrellas) con algún reforzador de apoyo con valor. Por lo tanto, las fichas no adquieren capacidad reforzante y no pueden incrementar la tasa de la conducta con la que son contingentes. Si las estrellas o caritas hubieran sido asociadas con, o hubieran sido intercambiadas por reforzadores de apoyo, el profesor se hubiera dado cuenta de que el reforzamiento si funciona. Habría sido más exacto que el profesor concluyera “recompensé la conducta académica con estrellas doradas que se veían bonitas. Pero ya que me negué a asociarlas con cualquier reforzador de apoyo, finalmente no tenían valor para los estudiantes, y no eran efectivas en el cambio de las conductas académicas de los niños. Si hubiese hecho que las estrellas adquirieran valor al asociarlas con reforzadores de apoyo, como unos cinco minutos extra de recreo por cada estrella, entonces la conducta académica probablemente habría mejorado”. REFORZAMIENTO VERSUS RECOMPENSA La mayoría de la gente utiliza las palabras recompensa y refuerzo de manera intercambiable. En muchos casos las recompensas si funcionan como reforzadores. Sin embargo, las palabras reforzamiento y refuerzo tienen un significado funcional que no es UNIVERSIDAD DE CHILE DEPARTAMENTO DE PSICOLOGÍA USO EXCLUSIVO DE LA CÁTEDRA PSICOLOGÍA DEL APRENDIZAJE

explícito en el término recompensa. Una recompensa es algo que se otorga por una conducta especial, pero no es necesariamente una consecuencia de la conducta, usualmente no se otorga repetidamente, y lo más importante es que no tiene el significado explícito de que la recompensa se da para una tasa creciente de conducta. En contraste, un reforzador es una consecuencia contingente y explícita de la conducta, que usualmente ocurre repetitivamente, y que por definición incrementa la tasa de la conducta precedente (el Apéndice 2 define y explica varios términos básicos relacionados con el reforzamiento). Si una conducta es “recompensada”, pero la tasa de la conducta no aumenta, entonces no fue reforzada y no hubo reforzamiento. Recompensar una conducta con una estrella dorada no reforzará necesariamente (ej. seleccionar o aumentar la tasa de) la conducta que fue recompensada. Las estrellas doradas podrían llegar a ser reforzadores condicionados si cada vez que el niño se las mostrara a mamá recibiera un abrazo y besos. Ser besado, abrazado y alabado por traer a casa buenas notas es una de las maneras en que estas se convierten en reforzadores condicionados para muchas personas. Si las notas no están asociadas con alabanza y afecto u otros reforzadores, probablemente no llegarán a ser reforzadores condicionados para el trabajo académico. Si a un niño no se le otorga afecto, alabanzas o refuerzo de algún tipo para el logro académico no se preocupará de que notas trae a casa. El reforzamiento es un fenómeno natural así como la selección natural o la gravedad son

fenómenos naturales. Afirmar que “el reforzamiento no funciona” es tan lógico como afirmar que “la selección natural no funciona” o que “la gravedad no funciona”. Un jet que vuela por el Atlántico o el menor peso de una persona en la Luna no significan que “la gravedad no funciona”. Si nos equivocamos al entender por qué el jet vuela o por qué la persona es liviana en la Luna, quiere decir que no hemos considerado todas las otras variables relevantes que operan en los fenómenos (ej. la propulsión del jet y la presión diferencial del aire creada por la forma de las alas operan para que el jet pueda volar) o que no entendemos o ignoramos otros factores relevantes (quizás no entendemos o ignoramos los factores que hacen que la Luna tenga menos masa y su fuerza gravitacional sea menor, con lo que los objetos son más livianos). Del mismo modo, el “programa de reforzamiento” de un profesor puede fallar porque ignora que las fichas, o reforzadores condicionados, deben ser intercambiables por reforzadores de apoyo con valor para el niño para que sean reforzantes. Esto es, las fichas deben intercambiarse por reforzadores que refuercen (quizás cada estrella podría ser intercambiable por diez minutos de tiempo libre, tiempo en el computador, o un snack extra). ECONOMIA CONDUCTUAL Todas las economías del mundo son, de hecho, programas de reforzamiento de fichas, o economías de fichas. Estas, o el dinero, han reemplazado al sistema del trueque. En términos de reforzamiento, inflación quiere decir que el mismo número de fichas son intercambiables por menos refuerzos de apoyo, o que se requieren más fichas para la misma cantidad de refuerzos de apoyo. En los 80’s, 2 fichas ($2) eran intercambiables por dos cervezas. Al año 2000, una cerveza a menudo requiere 4 fichas o más. Deflación quiere decir que el mismo número de fichas son intercambiables por más refuerzo de apoyo, o que menos se necesitan menos fichas para la misma cantidad de reforzamiento de apoyo. En los 80’s, se necesitaban 2.000 fichas ($2000) o más para lo UNIVERSIDAD DE CHILE DEPARTAMENTO DE PSICOLOGÍA USO EXCLUSIVO DE LA CÁTEDRA PSICOLOGÍA DEL APRENDIZAJE

que ahora se consideraría un computador personal vergonzosamente débil y virtualmente inútil. A inicios del siglo veintiuno, 1.000 fichas son intercambiables por un computador personal miles de veces más poderoso que la versión 1980. Debido a que la misma cantidad de conducta produce el mismo número de fichas, pero la misma cantidad es intercambiable por menos, la inflación disminuye el valor reforzante del dinero (”No trabajaré más por $5 la hora”). Ya que la misma cantidad de conducta produce el mismo número de fichas, pero estas se intercambian por más, la deflación aumenta el valor reforzante del dinero (“Durante la crisis, trabajé doce horas al día por $1 y estaba feliz de ganarlo”). Cuando la moneda de un país colapsa completamente, no es intercambiable por reforzadores de apoyo y no tiene valor. La gente no trabajará más por las fichas de ese país. La moneda colapsada no tiene funciones como reforzador generalizado. De la misma manera, si las estrellas doradas de un profesor no son intercambiables por reforzadores de apoyo, los estudiantes no trabajarán más para obtenerlas. Por supuesto que sería absurdo argumentar que las economías del mundo no son más que “psicología de ratas”. Sin embargo, los términos conducta económica y conducta operante son a menudo sinónimos. En economía, un empleado trabaja (se comporta) con el objetivo de recibir su pago, productos básicos (refuerzos). En psicología operante, un organismo se comporta (trabaja) para recibir refuerzo (productos básicos y dinero). Como lo notó Skinner (1953), la contingencia y el patrón de respuesta resultantes del entrenamiento de animales en programas de reforzamiento de razón fija son casi idénticos a la contingencia y el patrón de trabajo resultante de los empleados pagados con salarios a destajo4. Por ejemplo, cuando se refuerza la presión de palanca por la rata

en un programa de reforzamiento de razón fija, este produce tasas de respuesta sistemáticamente altas y estables, con una pausa en la respuesta después de la entrega del refuerzo. De la misma manera, cuando a un empleado se le paga a destajo, por ejemplo, $1 por cada 25 calcetines cocidos, trabajará a una alta velocidad sólo deteniéndose después de que haya terminado 25 calcetines. El patrón de comportamiento es idéntico para el trabajador de la fábrica y para la rata de laboratorio, ya que la contingencia del reforzamiento es idéntica. El modelo experimental básico de economía conductual obtiene sus conclusiones mediante el establecimiento de varios programas, contingencias y restricciones del refuerzo y las respuestas para simular fenómenos, hipótesis y problemas económicos. La conducta resultante del trabajo de los animales bajo ciertas restricciones permite luego contrastar la teoría económica y la exactitud de sus supuestos, y puede proveer posibles soluciones a los problemas económicos. “La experimentación de laboratorio basada en el análisis conductual es el método más poderoso para definir, testear y refinar la teoría económica”, argumentan Steven R. Hursh y Richard A. Bauman, del Instituto de Investigación Walter Reed de la Armada, en Washington D.C. Por ejemplo, “el concepto más básico es el equilibrio de la oferta y la demanda. La oferta es controlada experimentalmente por un programa de reforzamiento. La demanda está determinada por el nivel de consumo observado en los rangos de precios. La tasa de respuesta se determina por el punto de equilibrio para cada precio” (Hursch y Barman, 1987, pp. 154-155). 4

Salarios pagados en razón de rendimiento o productividad (Nota del T.)

UNIVERSIDAD DE CHILE DEPARTAMENTO DE PSICOLOGÍA USO EXCLUSIVO DE LA CÁTEDRA PSICOLOGÍA DEL APRENDIZAJE

En respuesta a la posible crítica de que los resultados en animales no se aplican a los problemas económicos humanos, John H. Kagel, Raymond C. Battalio y Leonard Green argumentan que “nuestros resultados ponen la carga de la prueba sobre aquellos que sostienen una posición particular con la cual nuestra información es incompatible. Son ellos quienes deben mostrar cómo nuestros resultados son inaplicables o irrelevantes para la condición humana” (Kagel et al., 1995, p.5). Al utilizar este enfoque, se ha obtenido información útil en temas económicos tales como los cambios de precios por ingreso-compensado, la teoría de la demanda económica, la hipótesis del consumidor representativo, la teoría del trabajo-oferta, restricciones de presupuesto, curvas de oferta de trabajo, trabajos alternativos con tasas de salario distintas, cambios en salarios por ingreso-compensado, preferencia de riesgos, utilidad esperada, ciclo de pobreza, demandas y sustitución elástica e inelástica, y curvas de precios de consumo (ej., Green & Kagel, 1987; Kagel et al., 1995). “Los animales proveen una manera de testear los principios microeconómicos elementales” afirman Kagel, Battalio y Green en su libro Teoría de Elección Económica. Continúan: Para algunas preguntas….los modelos animales son el único medio práctico para investigar un tema. Nos permiten conducir experimentos precisos, controlados y exigentes, utilizando recompensas y castigos de consecuencia real para probar la teoría de elección individual….Al aplicar los modelos animales al estudio de la conducta económica, seguimos el mismo enfoque utilizado en la biomedicina, donde se aceptan con pocas reservas….Utilizamos nuestro modelo para direccionar temas sociales complicados - como el “ciclo de la pobreza” y la hipótesis de la “trampa del bienestar”(que) tienen que ver con los efectos que tienen sobre el individuo diferencias amplias entre altos y bajos ingresos; un tratamiento experimental no puede aproximar adecuadamente estas

condiciones con sujetos humanos voluntarios. Con ratas y palomas, en cambio, se pueden imponer grandes diferencias en ingresos por extensos períodos de tiempo para dirigir directamente los efectos de la conducta” (Kagel y otros, 1995, pp.3-4). Economía - ¡de vuelta a la “psicología de ratas”! El análisis básico de la conducta económica en los paradigmas de reforzamiento, y utilizando una amplia variedad de sujetos, incluyendo ratas, chimpancés y humanos, ha sido útil para acrecentar nuestra comprensión de los principios generales del abuso de drogas, y ha sido utilizado para diseñar políticas públicas acerca de estas (ej., Hursch, 1991; 1993). La comprensión científica de la economía del abuso de drogas y las implicaciones para una política pública efectiva en drogas es un producto del enfoque científico básico. Como lo ejemplifica el trabajo de Hursch en Walter Reed, la aproximación científica comienza con experimentos de laboratorio controlados, utilizando la conducta de sujetos animales y estableciendo conocimiento práctico que se puede aplicar para mejorar la condición humana: Los conceptos de la economía conductual han probado ser útiles para la comprensión del control ambiental sobre todos los niveles de respuesta para una variedad de recursos básicos, incluyendo el reforzamiento por auto-administración de droga (Hursh, 1991, p.377)…..Una estrategia completa………recurriría a los hallazgos de la investigación de laboratorio y las investigaciones econométricas naturalistas para diseñar proyectos modelo de intervención. La evaluación y la mejora de estos proyectos serviría entonces UNIVERSIDAD DE CHILE DEPARTAMENTO DE PSICOLOGÍA USO EXCLUSIVO DE LA CÁTEDRA PSICOLOGÍA DEL APRENDIZAJE

como tests previos a pequeña escala para iniciativas más generales de políticas públicas…Si el trabajo futuro confirma la utilidad de esta agenda de economía conductual, entonces habremos dado el primer paso hacia el desarrollo de una sociedad más humana” (p.392).

2 INSULTOS Y TERGIVERSACIONES DAÑINAS M&M para Retrasados

Es un mito del reforzamiento que mientras reforzadores tales como los dulces M&M, o fichas intercambiables por dulces, otros productos o actividades pueden producir obediencia en individuos con trastornos del desarrollo, no son efectivos en el cambio conductual de humanos sin trastornos; “el reforzamiento puede funcionar en niños retrasados pero no en mí; soy demasiado inteligente para eso”. La primera parte del mito es ciertamente verdadera; refuerzos tales como dulces pueden producir obediencia en individuos con trastornos de desarrollo, si los reforzadores son contingentes a la conducta de obedecer. Sin embargo, como ya hemos visto, las fichas son reforzadores efectivos en la especie humana, y a menudo los dulces son un reforzador efectivo para muchas personas. Cuando el postre es contingente con comer vegetales, y el consumo de vegetales ocurre, entonces el postre ha reforzado esa conducta. Cuando un niño recibe dinero por devolver las botellas de soda vacías y aumenta el reciclaje, entonces el reciclaje ha sido reforzado. Cuando un autor recibe pago por escribir un artículo y la escritura de artículos aumenta entonces se ha reforzado dicha conducta. Cuando un oficinista pone monedas en una máquina, presiona un botón, y una bolsa de dulces M&M cae, entonces la conducta operante de hacer funcionar una máquina de dulces se ha UNIVERSIDAD DE CHILE

DEPARTAMENTO DE PSICOLOGÍA USO EXCLUSIVO DE LA CÁTEDRA PSICOLOGÍA DEL APRENDIZAJE

reforzado con M&Ms. Si saliera aceite de hígado de bacalao en vez de M&Ms, entonces es poco probable que la acción de operar la máquina ocurra de nuevo. Mientras es verdad que el reforzamiento ha sido utilizado en instituciones y en las salas de clases para moldear a los niños para que estén “silenciosos, tranquilos, dóciles” (Winett & Winkler, 1972), es una idea equivocada la de que el reforzamiento se utiliza sólo para hacer las salas de clases más manejables y la conducta más conformista. Las destrezas vocacionales para los que sufren de trastornos del desarrollo se enseñan rutinariamente utilizando programas de reforzamiento. Si el reforzamiento es contingente a las conductas vocacionales, entonces estas son seleccionadas. Los programas de modificación de la conducta centrados en el reforzamiento contingente son simplemente los tratamientos más efectivos para desarrollar destrezas para la vida de los con discapacidades de desarrollo. Una falta de comprensión del enfoque científico inductivo puede ser la responsable del mito de que los reforzadores simples sólo trabajan con conductas simples de individuos con repertorios de conducta relativamente simples (limitados). En el enfoque inductivo, los principios generales se aíslan primero y se establecen en situaciones simples de laboratorio. Por ejemplo, el principio de “reforzamiento discriminativo” se utiliza para enseñarle a una rata a presionar una palanca cuando la luz está encendida pero no cuando está apagada: la presión de la palanca cuando la luz está encendida produce el reforzamiento. El presionar la palanca cuando la luz está apagada no se refuerza. Debido a que la presión de la palanca está “reforzada discriminativamente” sólo en presencia de la luz, eventualmente la presión de la palanca ocurre sólo cuando la luz está encendida. Como el descubrimiento básico se replica en otros ambientes controlados ligeramente más complejos, la generalización del principio se establece y aparecen a menudo las aplicaciones. Por ejemplo, en un ejemplo clásico de generalización del reforzamiento discriminativo, William Redd y Jay S. Birnbrauer (1969) utilizaron la discriminación para producir “control de estímulos” de la conducta de cooperación en niños con problemas del desarrollo. Un adulto entregó alabanzas, helados, y bebidas de fantasía a los niños sólo cuando jugaban de manera cooperativa. Otro adulto otorgó más alabanzas, helados y bebidas de fantasía a los niños tanto si estaban siendo cooperativos como si no. Debido a que el primer adulto hizo las alabanzas, el helado y las bebidas contingentes a la conducta de cooperación, o a la conducta de cooperación reforzada discriminativamente, los niños aumentaron ampliamente la cooperación con el primer adulto, pero no con el segundo adulto. Una vez que un principio como el de reforzamiento discriminativo se establece, se aplica a situaciones cada vez más complejas, tales como enseñar a un niño con desarrollo normal a deletrear o a practicar matemáticas (ver Alberto & Troutman, 1999, pp.334-338). Cada replica exitosa amplia la generalidad del principio. Finalmente, la operación del principio en un amplio rango de situaciones se hace evidente (en este ejemplo, el principio del reforzamiento discriminativo). Por ejemplo, si un adulto le dedica tiempo a su padre anciano sólo cuando está enfermo o se queja de dolores e incapacidad, entonces el adulto está reforzando discriminativamente la operante de “conductas enfermizas” por sobre el de “conductas saludables”. La tasa a la cual el padre se queja aumentará (este ejemplo es de hecho un resultado muy frecuente; ver capítulo 13 de este libro). Del mismo modo, dentro de las operantes de “programación de software para computadoras”, la ubicación incorrecta de los paréntesis se castiga discriminativamente con una caída del UNIVERSIDAD DE CHILE DEPARTAMENTO DE PSICOLOGÍA USO EXCLUSIVO DE LA CÁTEDRA

PSICOLOGÍA DEL APRENDIZAJE

programa o una “bandera”5; por otro lado, la ubicación correcta de los paréntesis se refuerza discriminativamente por el correcto funcionamiento del programa. A través del proceso de reforzamiento discriminativo, se seleccionará la conducta de ubicación correcta de los paréntesis. Los procesos básicos tales como el reforzamiento discriminativo, se pueden observar primero en el laboratorio animal, y las aplicaciones iniciales pueden ser relativamente simples, pero esto no quiere decir que se apliquen sólo en el laboratorio animal o en situaciones simples. El reforzamiento selecciona la conducta no sólo de las personas con problemas de desarrollo, sino también la conducta de los “más capaces”. LOS TRABAJADORES EN LAS MINAS Desde los niños con trastornos del desarrollo en la sala de clases hasta los profesionales que trabajan en minas a tajo abierto, en el lugar que sea que los programas de reforzamiento se apliquen correctamente es probable que produzcan resultados beneficiosos para todas las partes involucradas. Por ejemplo, “cuando se implementó una economía de fichas que usó estampillas comerciales en dos peligrosas minas a tajo abierto…. (Hubieron) grandes reducciones (de miles por año) en el número de días de trabajo perdidos debido a lesiones, la cantidad de tiempo perdido por accidentes, y el costo de accidentes y lesiones” (Fox et al., 1987, p.215). Esto es, un programa que reforzó la seguridad con estampillas comerciales como reforzadores artificiales en minas de carbón a tajo abierto extremadamente peligrosas, le ahorró a la compañía millones de dólares y mejoró la salud, la seguridad, el ambiente laboral, y el ambiente en el hogar (con reforzadores de apoyo que los empleados intercambiaron por fichas) de “capataces, supervisores de turno, técnicos de laboratorio, ingenieros de faena, encuestadores, … mecánicos, obreros, empleados de mantención…, conductores de máquinas excavadoras, operadores de carga frontal, operadores de pala, operadores de camiones…, eléctricos, operadores de pulidoras, y encargados del combustible y aceite” (p. 217). “El número de días de trabajo perdidos en la Mina Shirley Basin debido a lesiones durante los diez años pasados con programas de fichas fue de alrededor de un cuarto del promedio nacional en minería, y en la mina Navajo cerca de una doceava parte del promedio nacional… Además de las pocas lesiones, incapacidades y muertes sufridas, los trabajadores obtuvieron beneficios por los premios de apoyo que recibieron a cambio de las estampillas comerciales” (p. 221). Los esforzados trabajadores que luchan en las minas a tajo abierto difícilmente son trastornados mentales. Pero los programas de reforzamiento de fichas funcionan bien en ellos, al lograr reducción en los accidentes y seguridad en la calidad de vida. Además de las crecientes productividad y seguridad del trabajador, los programas de reforzamiento producen también beneficios emocionales. “Las economías de fichas sumaron a la moral general de los trabajadores en ambos lugares (minas a tajo abierto)” (Fox et al., 1987, p.222). De hecho, la paga contingente o “paga por desempeño”, esto es, el reforzamiento contingente, es el determinante más fuerte en la satisfacción del empleo, y un determinante del compromiso con el trabajo y la eficacia (Locke y Latham, 1990). Difícilmente esto es sólo M&M para retrasados. Así como la falla en reconocer los efectos que el ejercicio tiene en la salud cardiovascular de un individuo no significa que el ejercicio no esté funcionando, fallar al reconocer los En programación, “bandera” se le denomina al segmento del programa que representa categorías o estados internos del software o hardware, como procesos, resultados o problemas de funcionamiento (Nota del T.) 5

UNIVERSIDAD DE CHILE DEPARTAMENTO DE PSICOLOGÍA USO EXCLUSIVO DE LA CÁTEDRA

PSICOLOGÍA DEL APRENDIZAJE

procesos de reforzamiento que operan en la conducta de un individuo no quiere decir que estos no funcionen. La ignorancia de los principios generales establecidos científicamente no quiere decir que no existen o que no funcionan. El reforzamiento “funciona” para todos, tanto si la persona tiene trastornos del desarrollo como si es un ingeniero. “La conducta humana, a pesar de ser muy compleja, está en definitiva controlada por los refuerzos” (McKim, 2000, p. 38).

3 CONTROL “GARROTE - ZANAHORIA”, SOBORNO Y VALOR

Mientras que la ignorancia acerca de un principio general no quiere decir que este no existe, si puede llevar a críticas inexactas. Por ejemplo, se ha criticado que establecer y aumentar la tasa de la conducta mediante reforzamiento es un enfoque “garrotezanahoria” en el manejo de la conducta y el cuidado del niño. De hecho, Alfie A. Kohn tituló un capítulo “El problema con las Zanahorias” en su libro Castigado por las Recompensa, y en el que denomina despectivamente al reforzamiento como un enfoque garrote-zanahoria no menos de diez veces. “El enfoque garrote- zanahoria no es en general exitoso” (Kohn, 1993, p.201). En relación a las críticas de que el reforzamiento es “psicología de ratas”, bajo una sección titulada “Tratar a la gente como mascotas”, Kohn comenta: “Antes de que estas palabras fueran utilizadas como representaciones genéricas de sobornos y amenazas, lo que en realidad se encontraba entre el garrote y la zanahoria era, por supuesto, un burro” (p.24). La implicancia es que las recompensas (ej. reforzadores) son sobornos, y que el uso planificado del reforzamiento en humanos los convierte en algo diferente (en el ejemplo de Kohn, en burros). “La suposición inconsciente detrás del modelo recompensa-castigo es que uno está lidiando con burros, que las personas son burros para ser manipulados y controlados”. La relación es “inevitablemente uno de los desprecios condescendientes cuya máscara más evidente es el paternalismo” (Levinson, 1973, pp.10-11). Esta polémica absurda asume que mis padres, millones de otros padres, y cientos de miles de profesores que participan en el Book It! (sólo por nombrar un pequeño segmento de personas) u otros programas de reforzamiento tienen un “desprecio condescendiente” para sus hijos y todos ¡“asumen” que sus hijos son burros! Las críticas garrote-zanahoria generalmente reflejan ignorancia del proceso de reforzamiento y es un insulto disfrazado ligeramente para los profesionales que utilizan o defienden el uso del reforzamiento para aliviar los problemas humanos. La imagen del garrote-zanahoria implica falsamente que aquellos que utilizan el reforzamiento de un modo programado y planificado son simple y ampliamente ignorantes de métodos más sofisticados y efectivos para enriquecer a los niños. Con todo, los consejos editoriales de las revistas que se enfocan en la aplicación práctica del reforzamiento, tales como la Revista de Análisis Conductual Aplicado, y Modificación de la Conducta, están llenas de profesionales de muchas de las instituciones académicas y de investigación mejor UNIVERSIDAD DE CHILE DEPARTAMENTO DE PSICOLOGÍA USO EXCLUSIVO DE LA CÁTEDRA PSICOLOGÍA DEL APRENDIZAJE

posicionadas, tales como Vanderbilt, John Hopkins, la Escuela de Medicina de la Universidad de Pennsilvania, la Universidad Federal de Sao Carlos, la Universidad de Oslo, la Universidad de Gales, y la Universidad de Carolina del Norte (por nombrar algunas). Es poco probable que estas personas sean simples e ignorantes en relación a su profesión (el estudio y aplicación del reforzamiento). Pero la pregunta permanece: ¿es el uso planificado del reforzamiento análogo al enfoque garrote-zanahoria? El Diccionario del Patrimonio Americano de la Lengua Inglesa define

al “garrote-zanahoria” como “combinar una recompensa prometida con una amenaza de castigo” (Patrimonio Americano, 1992, p. 294). Una recompensa prometida pero no recibida y una amenaza de castigo son una burda tergiversación del proceso de reforzamiento. Al menos en la fábula, a una mula se le puede engañar en un terreno de arado, atándole una zanahoria a un bastón atado a la cabeza en frente del rostro. La mula camina hacia la zanahoria colgante, pero nunca la alcanza. La zanahoria se le arrebata a la mula justo antes de que pueda comérsela. El enfoque del garrote-zanahoria cuelga un premio justo fuera de alcance para engañar a alguien para que trabaje, pero el premio nunca se obtiene; la zanahoria se le arrebata en el último momento. Pero con el reforzamiento, si la conducta con la que es contingente ocurre, se obtiene un refuerzo. ¡Puedes obtener tu torta o zanahoria y comértela también! Es esta relación conducta-reforzador frecuente y repetida la que selecciona una conducta operante. No existe una relación repetida conducta-consecuencia en la falsa analogía garrote-zanahoria. Como en la fábula del niño que gritó ¡al lobo!, si a los individuos se les ofrecen constantemente recompensas por trabajo, pero nunca llegan, y en vez de eso se les arrebatan justo antes de que las obtengan, entonces las personas dejarían de trabajar. Esto es, la conducta de trabajo experimentaría una extinción como lo harían las instrucciones, siguiendo a las conductas en general cuando las recompensas se ofrecen en las instrucciones. La analogía de la zanahoria es simplemente deshonesta y no representa el proceso de reforzamiento. El lado de la “amenaza de castigo” o “garrote” del enfoque garrote-zanahoria para la motivación está basado en el reforzamiento negativo. Este es un proceso en el cual la tasa de la conducta aumenta (reforzamiento) debido a que remueve (negativo), escapa de o evita una consecuencia adversa (ver Apéndice 2 de este libro). En la agricultura, en vez de una zanahoria, a una mula de arado se le pueden dar golpes con una vara, azotar o golpearla en las nalgas. La mula se mueve hacia delante para escapar o evitar el estimulo adverso que se aplica a su trasero y así, ara la tierra. De esta manera, el arar se selecciona como una función de reforzamiento negativo. Del mismo modo, a un caballo se le hace moverse al clavarle el jinete los talones (el cual puede tener espuelas para aumentar la adversividad) en los costados. Cuando el caballo alcanza la velocidad deseada por el jinete, se termina la aplicación del estimulo aversivo a sus costados. Por lo tanto, como una función del reforzamiento negativo, un caballo se mueve hacia delante para escapar y mantiene su movimiento hacia delante con el fin de evitar que se le clave con las espuelas en los costados (De paso, en años recientes el campo del entrenamiento animal y las industrias relacionadas a zoológicos han sido revolucionadas al adoptar un enfoque de reforzamiento positivo, y han ido eliminando o reduciendo las técnicas de control aversivo de las que antes dependían). Sin embargo, la aplicación programada del reforzamiento en humanos ha usado virtualmente siempre reforzamiento positivo, no reforzamiento negativo u otras técnicas de UNIVERSIDAD DE CHILE DEPARTAMENTO DE PSICOLOGÍA USO EXCLUSIVO DE LA CÁTEDRA PSICOLOGÍA DEL APRENDIZAJE

control aversivo. Ninguno de los programas de reforzamiento cubiertos hasta ahora (ej., Book it!, Ganando por Aprender y Morningside) usan reforzamiento negativo o consecuencias aversivas de cualquier tipo. Simplemente no hay amenazas, no hay “garrote”. La realidad de la analogía “garrote-zanahoria” con el uso sistemático del reforzamiento positivo es que (1) la parte del garrote simplemente no existe, y (2) se da una “zanahoria” cada vez que la conducta ocurre. Por lo tanto, una analogía más precisa del reforzamiento positivo que la de “garrote-zanahoria” es “zanahorias, zanahorias y más zanahorias, y mientras las tienes, ¡cámbialas por dulces, abrazos y besos!”. SOBORNO

Como se ejemplifica en el artículo de Woman’s Day, “El Currículo del Soborno: ¿Desde cuándo corromper a nuestros niños se hizo parte de su educación?” (Hetchman, 2000), un mito particularmente generalizado sobre los programas de reforzamiento es que equivalen a nada más que soborno (“No debería haber sobornado a Johnny para hacer su tarea. Debería hacerla por su cuenta”). Alfie Kohn describe el reforzamiento como soborno no menos de una docena de veces y tituló un capítulo “Sobornos para Comportarse: Por qué el Conductismo no ayuda a los niños a convertirse en buenas personas”. Como crítica general del reforzamiento, el mito de que es solamente soborno es insostenible. Sin embargo, dependiendo de la relación del soborno con la conducta poco ética, corrupta y/o ilegal, se puede admitir que los sobornos pueden funcionar como refuerzos (Pero esto no quiere decir que lo opuesto, es decir que los reforzadores siempre funcionan como sobornos, sea verdad). Sólo porque los sobornos pueden reforzar la conducta corrupta, es absurdo afirmar que todas las situaciones de reforzamiento artificiales necesariamente involucran el soborno. ¿Está un autor siendo sobornado cuando se le paga por un artículo, y aumenta su tasa de escritura? ¿Es soborno si se reciben bonos de productividad contingentes de parte de la fábrica hacia los trabajadores y aumente la productividad en el trabajo? ¿Están los Centros de Aprendizaje Sylvan sobornando a los niños para que estudien cuando les dan fichas contingentes con el estudio? ¿Es soborno cuando los atletas profesionales alcanzan los estándares de desempeño de las cláusulas de incentivo de sus contratos y consecuentemente se les paga más? ¿Es soborno cuando un niño recibe un ticket por una pizza gratis cuando alcanza su meta de lectura?. Kohn piensa así: Pizza Hut comenzó un programa “para alentar a los niños para que leyeran más. La estrategia para alcanzar esta meta: soborno” (Kohn, 1993, p.11). Con todo, mientras un soborno es típicamente algo que se entrega una vez, un niño en Book it! puede recibir muchos reforzadores para la lectura. Book it!, los Centros de Aprendizaje Sylvan y los programas de reforzamiento en general entregan reforzamiento positivo repetido e inmediato para el logro individual, reforzando el esfuerzo y la mejora. Esto difícilmente es soborno. Aún más los sobornos típicamente involucran amenazas y otros elementos aversivos que no son parte de los programas de reforzamiento sistemático. Las definiciones de la palabra soborno usualmente incluyen la palabra corrupto (como en “corromper el juicio o la conducta”). El Diccionario del Patrimonio Americano define “corrupto” como “1. Marcado por la inmoralidad y perversión; depravado. 2. Venial; deshonesto” (Patrimonio Americano, 1992, p. 423). Es difícil ver como dar a un niño fichas o pizza para que alcance las metas de lectura sea inmoral o depravado. Por supuesto, la mayoría de los niños aprenden a leer sin pizzas, fichas o dinero contingentes con la lectura. Pero de esto no se sigue que hacer que las fichas, dinero u otros reforzadores UNIVERSIDAD DE CHILE DEPARTAMENTO DE PSICOLOGÍA USO EXCLUSIVO DE LA CÁTEDRA PSICOLOGÍA DEL APRENDIZAJE

sean contingentes con la lectura sea corrupción o algún tipo de soborno. “Primero”, argumentan Patrick J. Schloss, de la Universidad de Bloomsburg, y Maureen A. Smith, de la Universidad de Estado de Nueva York, Buffalo, por definición, el soborno incluye pagarle a alguien por adelantado para que haga algo incorrecto o ilegal. Se usan alimentos y fichas después de que una conducta deseada ha sido demostrada para aumentar la probabilidad de que ocurrirá nuevamente. Son comparables a las boletas de pago que recibimos de nuestros empleadores por hacer nuestro trabajo. Como (Marcia) Smith (1993) notó, ‘todos los trabajadores trabajan por un pago… pero la mayoría tomarían a mal la implicación de que están trabajando por un soborno’” (Schloss y Smith, 1998, p.279). “Segundo,…” Schloss y Smith continúan, “los profesores pueden usar alimentos y fichas

para alentar el aprendizaje…estas técnicas disminuirán a lo largo del tiempo y se reemplazarán con eventos que ocurren naturalmente en la sala de clase. Por ejemplo, los alimentos se presentarán simultáneamente con una sonrisa. Eventualmente, la sonrisa será suficiente por un trabajo bien hecho” (p.11). Si una conducta se lleva a cabo debe ser por alguna razón. Si la lectura y el aprendizaje de leer ocurren sin los reforzadores artificiales obvios, tales como la pizza y el dinero, el aprendizaje de leer de todas maneras tiene que haber sido reforzado, y la lectura debe aún estar reforzada de una manera u otra o no ocurriría. Para muchos niños, quizás para la mayoría, los reforzadores para aprender a leer (entre otras habilidades) y para la lectura son normalmente abundantes, espontáneos, frecuentes y naturales. ¡El reforzamiento primordial para aprender a leer es ser capaz de hacerlo! – una gran fuente de placer para muchas personas y una habilidad muy útil para relacionarse con el mundo (ej., una vez que alguien puede leer muchos otros reforzadores se hacen disponibles). En familias de clase media, es probable que los padres les lean a sus niños, les sirvan como modelos de lectura; les tengan mucho material de lectura disponible; les sugieran (estimulen) intentos de lectura; les provean de atención, alabanza, afecto y otros reforzadores para leer. Una vez que se adquieran algunas conductas de lectura, comenzarán a producir reforzadores más típicos y naturales. Por ejemplo, una vez que a un niño se le ha alentado y reforzado para leer carteles (“¿Sabes lo que dicen esos signos, cariño? Muy bien, querido”), comienza a generar cierta exactitud de la lectura, con lo que luego leer carteles producirá consecuencias que de otra manera podrían no haber ocurrido. Leer en voz alta “Las 5 Millas del Lechero Queen” genera una mayor probabilidad de ser reforzado con un helado que el grito “¡Estoy aburrido! ¡Quiero parar!”. Como función de las consecuencias que la lectura produce, la tasa de lectura de carteles del niño aumentará. ¿Ha sido el niño sobornado para hacerlo? Comenzando en la infancia, es probable que los niños de clase media tengan libros con páginas gruesas y firmes que son fáciles de dar vuelta. El dar vuelta las páginas es reforzado probablemente con fotos brillantes, posiblemente con ilustraciones en relieve, y socialmente por los padres: “¡Mira a Sally! ¿Qué estás leyendo, cariño?”. Eventualmente estos libros contendrán letras y palabras simples que incentivarán al niño a decirlas y pronunciarlas. Las aproximaciones sucesivas a la lectura estarán reforzadas por los padres (incluso si ellos no están “conscientes” de que están utilizando reforzamiento). Una vez que se empieza a leer, esta conducta será reforzada crecientemente por las consecuencias naturales que la lectura trae. UNIVERSIDAD DE CHILE DEPARTAMENTO DE PSICOLOGÍA USO EXCLUSIVO DE LA CÁTEDRA PSICOLOGÍA DEL APRENDIZAJE

Una vez que se ha moldeado la lectura, un padre de clase media puede comentar “Nunca le enseñamos a leer a Johnny. Él sólo lo hizo naturalmente”. Sin embargo, eso es no ver el bosque a causa de los árboles. La lectura no es una conducta más “natural” que el cálculo o encestar un tiro de tres puntos (a pesar de que todas aquellas conductas parecen ser naturales cuando se hacen fluidas). TODOS los niños aprenden a leer a través de interacciones dinámicas conductaambiente. Los ambientes físicos y sociales de las típicas casas y escuelas de clase media contienen material de lectura, incentivos y consecuencias para la lectura. En estos ambientes hogareños y escolares, los materiales de lectura e incentivos establecen la ocasión para la lectura, y sus consecuencias seleccionan la conducta de leer. En muchos de estos casos los padres pueden no haber enseñado abiertamente al niño a leer. Sin embargo, aún así este aprendió gracias al reforzamiento diferencial de las aproximaciones sucesivas a la conducta de leer. Los padres pueden no haber entregado intencionalmente reforzamiento diferencial para la conducta de leer. Pero estos, o el profesor, sí prepararon

un ambiente que reforzó diferencialmente esa conducta. A pesar de que provengo de una familia de clase media y que mi padre es un profesor de inglés, por alguna razón los incentivos y consecuencias naturales para las conductas de prelectura y lectura no fueron suficientes para que aprendiera a leer. La lectura no vino “naturalmente”. Por ello, mi padre y varios tutores usaron reforzadores artificiales (pingpong, revistas de comics y dinero) para reforzarla. Ahora leo por muchas razones, incluyendo el placer. Difícilmente siento que fui “sobornado” para leer cuando era niño. Se me entregaron programas y consecuencias especiales para la lectura debido a que necesitaba ayuda especial. Lamentablemente muchos de los que necesitan ayuda especial no la encuentran, y llamar al reforzamiento “soborno” hace que la ayuda efectiva sea menos probable. REFORZAMIENTO ARTIFICIAL Y NATURAL El reforzamiento sistemático de una conducta deseada puede parecer un “pago” por lo que la persona “debería haber estado haciendo de todos modos”. En el artículo “El Currículo del Soborno”, el Woman’s Day pregunta “¿Qué le sucedió a enseñar a los niños de que se debe hacer algo solo por el hecho de hacer un buen trabajo?” (Hetchman, 2000). ¡Los niños aprenden que han hecho un “buen trabajo” sólo cuando la tarea es reforzada!. El reforzamiento puede ser sólo alabanzas y afectos, pero si una tarea no es reforzada de algún modo, ¿cómo se la puede considerar “buena”? Cuando un trabajo no se refuerza, pasa inadvertido, o peor, se castiga, entonces obviamente no puede haber sido un buen trabajo en cualquier sentido de la palabra bueno. De hecho la misma frase “¡Buen trabajo!” se vuelve un reforzador condicionado cuando es asociada repetitivamente con otros reforzadores como abrazos, besos y sí, incluso dulces o pizzas. Una vez que la frase “¡Buen trabajo!” se ha asociado fuertemente con otros reforzadores, funcionará como un reforzador y el dulce y la pizza podrían estar de mas (así como “¡Buen trabajo!” se convierte en un reforzador condicionado cuando los padres y profesores la asocian con otros reforzadores, “¡Tú eres un mal hombre!” se convierte en un reforzador condicionado para muchos niños y adolescentes cuando la frase se dice por un par. Malo pasa a significar bueno, porque la palabra se asocia con reforzadores sociales tales como el compañerismo y el compartir. El significado funcional de las palabras se determina por su asociación con algún refuerzo). UNIVERSIDAD DE CHILE DEPARTAMENTO DE PSICOLOGÍA USO EXCLUSIVO DE LA CÁTEDRA PSICOLOGÍA DEL APRENDIZAJE

A pesar de todo, un crítico puede preguntar, “¿Por qué debería Johnny aceptar pagos y sobornos por hacer sus tareas? Las personas deberían hacer lo apropiado sólo porque es apropiado”. Pero ¿qué es “apropiado”? Una definición funcional es que la conducta apropiada es la conducta reforzada. De hecho, la única manera en que los animales y humanos sin conductas verbales (expresivas o receptivas) tales como individuos severamente retardados sepan lo que es apropiado, es que las conductas sean reforzadas, o no castigadas. La única forma de que estos organismos sepan lo que es una conducta inapropiada es a través del castigo o la falta de reforzamiento. Esto es, la conducta apropiada es reforzada discriminativamente y la conducta impropia es no reforzada o castigada diferencialmente. Por lo tanto, para la mayoría de los niños de clase media se selecciona la “conducta apropiada”. Por ejemplo, a un niño de clase media se le puede decir, “te leeré un cuento (reforzador) después (contingencia) de que te pongas tu pijama, te laves las manos y la cara, y te cepilles los dientes (conducta apropiada)”. ¿Es esto soborno y pago? La conducta apropiada es la conducta reforzada. Lamentablemente, no todas las personas son tan afortunadas como para provenir de una familia típica de clase media. Si lo que normalmente se considera “apropiado” no es

reforzado, entonces es irreal esperar que se lleven a cabo conductas apropiadas. Un niño en un hogar de clase baja puede oír “cierra esa maldita agua y mete tu trasero en la cama antes de que yo vaya para allá”. En vez de reforzar una conducta apropiada, tal afirmación de los padres disminuye la probabilidad de las tareas que deben hacerse al momento de acostarse. A una adolescente proveniente de un hogar disfuncional y roto se le podría decir “saca esta basura de la escuela de mi mesa. Para de hacer ruido antes de que te azote la flauta en la cabeza. ¿Por qué no te vas a ver a ese bueno para nada de Johnny y paras de colgarte de mi teléfono a menos que quieras pagar la cuenta”. En vez de reforzar una conducta apropiada – hacer la tarea y practicar – con tales dichos por parte de los padres las tareas y la práctica de música se vuelven menos probables y se ha incentivado la promiscuidad sexual (Como se muestra en el capítulo 12 de este libro, el entrenamiento conductual para padres, que les enseña a reemplazar las tácticas coercitivas por prácticas de crianza basadas en el reforzamiento positivo, ayuda a reducir la delincuencia y a mejorar el rendimiento académico). Cuando las personas viven o vienen de ambientes donde nunca fueron reforzadas las conductas que la sociedad considera “apropiadas”, o incluso si fueron castigadas, tales conductas “apropiadas” simplemente no habrán sido seleccionadas por el ambiente. En tales casos, el sistema educacional, el sistema correctivo (aquí la palabra correctivo puede en realidad tener sentido) u otra agencia social puede establecer intencionadamente un sistema de reforzamiento artificial, usualmente utilizando una economía de fichas, lo que reforzará la conducta “apropiada”. Una vez que estas conductas socialmente deseadas han sido suficientemente reforzadas, serán seleccionadas (al menos en el ambiente donde son reforzadas). Una vez que estas conductas han sido seleccionadas, como lo son en las familias típicas de clase media, la conducta reforzada será la conducta apropiada. “Aún así”, puede insistir el crítico, “esa no es la forma natural en la que los humanos aprenden, dándoles amenazas, fichas o estableciendo marcas por lo que ellos deberían estar haciendo de todos modos. ¿Los niños no esperarán una recompensa por cada cosa que hacen?” Seguro, lo harán, y siempre. El reforzamiento es el por qué las personas hacen lo que hacen. Si una conducta ocurre, es por alguna razón. El reforzador responsable de la conducta puede sólo no haber sido identificado. Lamentablemente, en UNIVERSIDAD DE CHILE DEPARTAMENTO DE PSICOLOGÍA USO EXCLUSIVO DE LA CÁTEDRA PSICOLOGÍA DEL APRENDIZAJE

algunos casos los reforzadores naturales o usuales no han seleccionado, pueden no estar presentes, o no mantienen conductas socialmente deseadas (ej., cooperación, o conductas de higiene personal). En estos casos puede ser deseable o necesario establecer reforzadores artificiales para formar y mantener estas conductas. Esto es, cuando usamos contingencias de reforzamiento artificiales es más probable que los reforzadores parezcan ser sobornos, no naturales, o poco éticos. Pero si la conducta no es corrupta o ilegal no hay nada poco ético en utilizar el reforzamiento artificial. De hecho, en muchos casos hacer nada (ej., negligencia) es poco ético, e implementar un programa de reforzamiento artificial necesario para las habilidades de la vida es la acción más ética posible. Idealmente, una vez que una contingencia de reforzamiento artificial ha establecido una conducta, esta será “atrapada” por las contingencias naturales. Por ejemplo, meditando acerca de las condiciones deplorables en que muchos de sus clientes vivían, un amigo empleado del servicio de la infancia del condado local preguntaba, “¿qué es tan difícil acerca del concepto de algo de agua y una barra de jabón?” Por muchas razones posibles (ej., escasez de recursos, y cuidadores que nunca enseñaron higiene), las contingencias de reforzamiento para mantenerse limpios no tuvieron un efecto funcional en la conducta

de sus clientes. Si se ofrecieran refuerzos artificiales, tales como un vale por comida y productos de higiene, entonces es probable que la higiene personal pudiera mejorar. Una vez que la higiene aparece, se puede atrapar por los reforzadores naturales que las conductas de higiene producen, como la disminución de la susceptibilidad a enfermedades, picazones, infecciones, una probabilidad creciente de ofertas de trabajo, y una tasa de relaciones interpersonales afectivas y afirmativas en aumento. De hecho, el reforzamiento artificial, fichas, o lo que algunos despistados llaman “soborno”, para conductas como tomar un baño, lavar los platos o hacer la tarea, es una práctica standard en muchos orfanatos pertenecientes a la iglesia, hogares para jóvenes pre-delincuentes e instituciones a lo largo de Estados Unidos (ver Sarafino, 2001, pp.341-346). Además, los refuerzos artificiales o fichas se emplean regularmente en las salas de clases y lugares de trabajo para desarrollar y mantener conductas situacionalmente deseables. REFORZAMIENTO ARTIFICIAL: ECONOMÍAS DE FICHAS Y EL MODELO DE ENSEÑANZA FAMILIAR El reforzamiento artificial, fichas, es el ingrediente fundamental en el modelo de enseñanza familiar para delincuentes y jóvenes pre-delincuentes. Se utiliza en más de doscientos programas, incluyendo Boy’s Town y hogares grupales metodistas. En el modelo de enseñanza familiar, los jóvenes ganan fichas por conductas (lectura, tareas, higiene personal, apagar las luces, etc) de las que una crítica desinformada diría que “deberían ser esperadas de todos modos- sin sobornos ni amenazas”. Se pierden fichas con conductas antisociales o socialmente inapropiadas como pelear, mentir, o usar mal la gramática. Las fichas se cambian por reforzadores de apoyo como snacks, tiempo frente a la TV, mesada, o según la crítica, “lo que debieran tener de todos modos”. A medida que la conducta apropiada es capturada por reforzadores naturales (mejores notas, interacción social positiva en aumento, etc.), el reforzamiento artificial desaparece gradualmente. Los jóvenes van desde un sistema de puntuación diaria a un sistema de puntuación semanal, hasta un sistema de méritos donde no se usan fichas (puntos). Cuando la buena conducta permanece consistentemente, los jóvenes regresan a casa. Mientras en el ambiente de enseñanza familiar las notas de los jóvenes y la asistencia a la UNIVERSIDAD DE CHILE DEPARTAMENTO DE PSICOLOGÍA USO EXCLUSIVO DE LA CÁTEDRA PSICOLOGÍA DEL APRENDIZAJE

escuela mejoran, los delitos criminales, las interacciones judiciales y policiales disminuyen (Kirigin et al., 1982; Wolf et al., 1987). ¿Son la Iglesia Católica -que maneja Boy’s Town-, los metodistas y numerosas otras organizaciones de caridad y religiosas todas corruptas, poco éticas, inmorales -malvadasporque “usan zanahorias” y “sobornan” a los jóvenes al utilizar el reforzamiento artificial para que los jóvenes se comporten? Los críticos del uso práctico del reforzamiento lo llevarían a uno a creer eso. Aunque la portada trasera del libro de Kohn proclame “mientras más utilizamos incentivos artificiales para motivar a las personas, más pierden el interés en aquello para lo que los estamos sobornando” (Kohn, 1993) una conclusión razonable y objetiva es que los que usan el reforzamiento artificial están siguiendo el sabio consejo de Montaigne: “Donde esté la ganancia, deja que también esté el placer. Se debería endulzar la comida que es saludable para el niño, y desechar la nociva” (Montaigne, 1580/1958; reimpreso en 1992, p.176). Se deberían reforzar las conductas saludables y productivas del niño. Los críticos de las economías de fichas apuntan selectivamente a ciertos datos que indican que para algunos individuos los logros conductuales alcanzados durante la economía de fichas se pueden perder después de un período de tiempo una vez que abandonan el programa (ej., Kohn, 1993). Pero ignoran la imagen completa junto con

otras evaluaciones y resúmenes de investigaciones sobre las economías de fichas (ej., Kazdin, 1985) que consideran que estas son efectivas en poblaciones diversas y producen resultados que se mantienen años después del término del programa. Aún así, incluso si un joven regresa a las actividades antisociales y criminales después de haber abandonado un programa de enseñanza familiar, no quiere decir que el programa es inefectivo o mucho menos malvado. El retorno del joven a las conductas antisociales quiere decir que las conductas socialmente apropiadas no fueron atrapadas por los reforzadores que ocurren naturalmente para las conductas, o que el ambiente del hogar del joven entrega más reforzamiento a las conductas criminales y antisociales que a las conductas socialmente apropiadas. Pero de hecho, tras seguir un tratamiento que incluya la participación en una economía de fichas muchos jóvenes no vuelven a conductas antisociales. Por ejemplo, Trent Hicks y Richard Minger, del Departamento de Servicios Juveniles de Carolina del Sur, adaptaron el modelo de enseñanza familiar incluyendo una estructura de economía de fichas en un programa de tratamiento diario en la escuela, y hallaron mejoras significativas en las notas, en los informes de conducta para los padres, y “reducciones consistentes en los contactos con cortes de justicia juveniles, delitos criminales reportados y colocación en residencias” (Hicks & Munger, 1990, p.63). El reforzamiento es un proceso natural, por el cual el ambiente selecciona (refuerza) la conducta. La amplitud en la que podemos ordenar el ambiente, incluyendo el uso de reforzamiento artificial para seleccionar conductas socialmente apropiadas y adaptativas, es la amplitud en la que podemos mejorar la condición humana y aminorar el sufrimiento. EL MITO DE QUE “EL REFORZAMIENTO DEVALÚA LA CONDUCTA REFORZADA” A pesar de que el reforzamiento a menudo se usa para seleccionar conductas socialmente apropiadas y adaptativas, los críticos al reforzamiento artificial aplicado – de “recompensas”- afirman que su uso transmite el mensaje de que la conducta reforzada no UNIVERSIDAD DE CHILE DEPARTAMENTO DE PSICOLOGÍA USO EXCLUSIVO DE LA CÁTEDRA PSICOLOGÍA DEL APRENDIZAJE

vale la pena, y que su único valor yace en el reforzador que produce. “’Haz esto y obtendrás aquello’ devalúa automáticamente el “esto”: esto es”, expone Kohn, “la tarea viene a ser percibida como un pre-requisito tedioso para obtener una golosina” (Kohn, 1993, p.140). En un artículo de Better Homes and Gardens en que las recompensas se representan con un dibujo en el que los padres están colgando una zanahoria frente a un niño (promoviendo así el mito del garrote-zanahoria), Kohn le dice al lector lo que él cree que el niño está pensando: “Cuando dices, ‘Haz X cosa y te daré una estrella dorada o un helado’, la respuesta inmediata del niño es, ‘Síiii, X cosa debe ser algo que no me gustaría hacer, o de otra manera no me estarían ofreciendo un soborno”. Kohn continúa “mientras más recompensas ofreces por algo, más se evapora el intento del niño de hacerlo por cualquier otra razón” (Holman, 1997, p.114). En la realidad, más que devaluar la conducta reforzada, el reforzamiento le añade valor. Cuando se le dice a un niño “Haz X cosa y te daré una estrella dorada o helado”, es más probable que la respuesta inmediata del niño sea “Siii, hacer X debe ser algo realmente importante, de otra manera no me estarían reforzando para hacerlo. Haré mi mayor esfuerzo”. Cuando un padre ofrece a un niño una recompensa por una conducta, le transmite al niño que la tarea es valiosa e importante para el padre y también lo debería ser para el niño. Cuando se entrega un reforzador, se asocia con la conducta que el reforzador produjo. Las conductas que se refuerzan toman un “valor de recompensa secundario” como resultado de la asociación de la conducta con el reforzamiento (Eisenberger, 1992). A través de este proceso de condicionamiento, en la medida en que

los reforzadores sean valiosos, cualquier conducta o dimensión conductual (ej., el mayor esfuerzo), que sea reforzada se convierte en una “conducta valiosa”. El valor del reforzamiento condicionado para la conducta es la base de la teoría de Robert Eisenberger en Laboriosidad Aprendida. “Las amplias investigaciones en animales y humanos indican que el esfuerzo recompensado contribuye a las duraderas diferencias individuales en laboriosidad”, expone Eisenberger. “El reforzamiento para un desempeño físico o cognitivo aumentado…condiciona el valor de la recompensa a la sensación de un gran esfuerzo…el condicionamiento del valor de las recompensas secundarias a la sensación de esfuerzo genera un mecanismo dinámico por el cual el alto rendimiento reforzado se generaliza entre las conductas” (Eisenberger, 1992, p. 248). El reforzamiento del esfuerzo genera laboriosidad porque añade valor a las conductas laboriosas y esforzadas. No las devalúa. Debido a que el reforzamiento del esfuerzo añade valor a las conductas esforzadas además de incrementar la persistencia conductual, el reforzamiento produce una mejora en auto-control, desarrollo moral y específicamente desempeño académico así como en general laboriosidad. “El esfuerzo reforzado diferencialmente en una dimensión determinada, resultaría en un mayor desempeño en esta…(y) aumentar la variedad de tareas en las cuales el alto desempeño se refuerza…incrementará la generalización del alto rendimiento en relación a las tareas” (Eisenberger, 1992, p.250). Por ejemplo, la conducta moral puede estar seleccionada directamente por el proceso de reforzamiento. Si conductas inmorales tales como robar o estafar son castigadas, y se refuerza la conducta moral, como el trabajo honesto y decir la verdad, dichas conductas serán seleccionadas discriminativamente. La conducta moral llega a ser un patrón de conducta “valioso” debido a que produce reforzamiento diferencial en relación a la conducta inmoral. Mientras mayor sea la variedad de las conductas morales reforzadas UNIVERSIDAD DE CHILE DEPARTAMENTO DE PSICOLOGÍA USO EXCLUSIVO DE LA CÁTEDRA PSICOLOGÍA DEL APRENDIZAJE

(compartir, honestidad, ayudar, etc.), y más las situaciones (hogar, escuela, patio de recreo, etc.) en que se refuercen, más conductas morales fuertes y generalizadas se seleccionarán. Pero debido a que las conductas morales requieren a menudo más esfuerzo que las inmorales, y producen reforzamiento inmediato con poco esfuerzo, las conductas inmorales son tentadoras (estudiar para un examen requiere más esfuerzo que copiar el de un compañero, investigar y redactar requieren más esfuerzo que bajar un ensayo de internet, y obtener una comisión de ventas requiere más esfuerzo que robar de la caja registradora). Afortunadamente, el reforzamiento previo del alto rendimiento hace que la conducta inmoral sea menos probable. Por ejemplo, a los estudiantes de colegio a los que se les reforzó para completar difíciles problemas matemáticos y de percepción (reforzando el esfuerzo), hicieron menos trampa en una subsecuente tarea de anagramas que los otros estudiantes (Eisenberger & Masterson, 1983). “Estos resultados, replicados en un segundo estudio con un procedimiento de trampas diferente (Eisenberger & Shank, 1985), sugieren que la honestidad del individuo es afectada no sólo por el reforzamiento previo directo de la honestidad, sino también por el valor de la recompensa condicionada secundaria al esfuerzo” (Eisenberger, 1992, p. 257). El mensaje es claro. Si un padre, profesor o empleador quiere enseñarle a un niño, estudiante o trabajador que una conducta es valiosa, entonces esta debe ser reforzada abundantemente. Adicionalmente, debido a que la conducta honesta a menudo requiere mayor esfuerzo que la deshonesta, cuando se desea tener honestidad, además de reforzarla directamente, también se debería reforzar el esfuerzo. El reforzamiento añade valor a la conducta. UNIVERSIDAD DE CHILE

DEPARTAMENTO DE PSICOLOGÍA USO EXCLUSIVO DE LA CÁTEDRA PSICOLOGÍA DEL APRENDIZAJE

PUNISHMENT Richard L. Solomon American Psychologist, 1964, 19, 239-253.

El artículo tiene tres objetivos: 1. Resumir algunas generalizaciones empíricas y problemas que conciernen los efectos del castigo en la conducta. 2. Dar algunas demostraciones de las ventajas de una teoría biproceso del aprendizaje, sugiriendo nuevos procedimientos a ensayar en experimentos de castigo. 3. Finalmente, desacreditar algunas leyendas no científicas sobre castigo. Definición operacional de castigo: La definición de castigo no es operacionalmente simple, pero algunos de sus atributos están claros. Un castigo es un estímulo nocivo y que favorecerá, por su terminación u omisión, el desarrollo de nuevas respuestas de escape o evitación. Es un estímulo que el sujeto rechazará, si se le da a elegir entre ser castigado o no recibir estímulo alguno. Experimentos de muestra (Sample Experiments) 1. Entrenamiento de escape: Se usa pista tradicional de 6 pies con caja meta y piso con parrilla electrificable. La rata recibe shock eléctrico en la caja de partida y en la pista, y no recibe shock en la caja meta. Se adiestra rápidamente la rata a correr si el shock comienza al levantarse la puerta de la caja de partida y persiste hasta que la rata entre a la caja meta. 2. Entrenamiento de evitación: Se da a la rata 5 segundos para llegar a la caja meta antes de recibir el shock. La conducta resultante es aprendizaje de evitación activo. 3. Procedimiento de castigo: Se entrena a la rata hambrienta a correr por la pista para obtener alimento. En cuanto la ejecución es asintótica, se introduce el shock en la pista y en la caja meta y no se da alimento. Este procedimiento se llama procedimiento de castigo y el aprendizaje resultante (quedarse en la caja de partida) se llama aprendizaje pasivo de evitación.

En el experimento 1 y 2 la rata aprende que debe hacer y en el tercero, que no debe hacer. En todos los casos, el criterio de aprendizaje estaba correlacionado con que la rata no recibiera shocks, en contraste con una experiencia previa de recibir varios shocks en el mismo diseño experimental. No se puede pensar adecuadamente sobre castigo sin considerar lo que se conoce sobre los resultados de ambos procedimientos (activo y pasivo). Sin embargo, muchas revisiones del control aversivo de la conducta ponen énfasis en el aprendizaje de evitación activo e ignoran el aprendizaje de evitación pasivo. Yo pondré énfasis más bien en las similitudes que en las diferencias entre aprendizaje de evitación activo y pasivo. UNIVERSIDAD DE CHILE DEPARTAMENTO DE PSICOLOGÍA USO EXCLUSIVO DE LA CÁTEDRA PSICOLOGÍA DEL APRENDIZAJE

A fin de revisar algunas de las generalidades empíricas que describen los resultados de los experimentos sobre castigo de aprendizaje de evitación pasivo, dividiré la evidencia en 5 clases: a) Efectos del castigo en la conducta previamente establecida por recompensas o refuerzos positivos. b) Efectos del castigo en respuestas consumatorias. c) Efectos del castigo en reflejos discretos (discrete reflexes) d) Efectos del castigo en respuestas previamente establecidas mediante castigo, o sea, los efectos del castigo en respuestas de escape y evitación activos. La efectividad del castigo difiere en estos 5 casos. He llamado efectividad al grado en el cual un procedimiento de castigo produce supresión de o facilita la extinción de patrones de respuestas existentes. Caso a). Los resultados de los castigos están fuertemente relacionados con la intensidad del agente punitivo. A veces la intensidad se define y se mide independientemente como en el caso del shock eléctrico. A veces hay evaluaciones cualitativas (Ej. Rata que se da de narices contra una puerta cerrada, mi perro que recibe un golpe con el diario enrollado, etc.)

A medida que aumenta la intensidad de un shock desde 0.1 a 4 miliamperes, se obtienen los siguientes resultados: 1. Detección y “arousal”, donde el castigador puede ser usado como una clave, un estímulo discriminativo e incluso como un reforzador secundario. 2. Supresión temporal, donde el castigo resulta en la supresión de la respuesta castigada, seguida de completa recuperación, de modo que el sujeto aparece después inalterado (tal como estaba antes del castigo). 3. Supresión parcial, donde el sujeto muestra una supresión duradera de la respuesta castigada, sin recuperación total. 4. Supresión total, sin recuperación observable. Se pueden obtener todos estos resultados, con solo variar la intensidad del estímulo nocivo que se usa, cuando castigamos respuestas establecidas previamente por recompensa o reforzadores positivos. Pero tras variables son posibles tan importantes como la intensidad del castigo y su operación puede que haga innecesario el usar castigos intensos para producir la supresión efectiva de una respuesta establecida previamente por refuerzo positivo. He aquí algunos ejemplos: Proximidad en el tiempo y espacio a la respuesta castigada determina hasta cierto punto la efectividad del castigo. Hay una gradiente de supresión de respuestas que ha sido llamada la gradiente de demora temporal del castigo. La fuerza conceptualizada de una respuesta, medida por su resistencia a la extinción después de la omisión del refuerzo positivo, produce el efecto de un castigo UNIVERSIDAD DE CHILE DEPARTAMENTO DE PSICOLOGÍA USO EXCLUSIVO DE LA CÁTEDRA PSICOLOGÍA DEL APRENDIZAJE

contingente a la respuesta. Las respuestas fuertes son más resistentes a los efectos supresores del castigo. Así, por ejemplo, el sobre-entrenamiento de una respuesta a menudo disminuye la resistencia ordinaria a la extinción experimental, también aumenta la efectividad del castigo como supresor de respuestas.

Puede producirse una adaptación al castigo y esto disminuye su efectividad. Los castigadores nuevos intensos son mejores que los viejos intensos. La intensidad del castigo, si se aumenta poco a poco tiende a no ser tan efectiva como en el caso en que se introduce inicialmente su mayor intensidad. En general, la resistencia a la extinción disminuye cuando se castiga una respuesta previamente reforzada. Sin embargo, si el sujeto está acostumbrado a recibir shock junto con el refuerzo positivo durante el entrenamiento de recompensa, la relación puede invertirse y el castigo durante la extinción puede aumentar la resistencia a la extinción. Evidentemente, si se apela al castigo, puede actuar como un refuerzo secundario, o como clave para recibir recompensa o como excitante. Los castigos llegan a ser sumamente efectivos cuando el período de supresión de respuesta se usa tácticamente como ayuda para el reforzamiento de nuevas respuestas que son topográficamente incompatibles con la respuesta castigada. Cuando se establecen nuevos actos instrumentales que llevan a la meta antigua (nuevos medios para un viejo fin), un castigo de muy poca intensidad puede tener efectos de supresión duraderos. Whiting y Mowrer (1943) demostraron esto claramente, primero reforzaron un camino al alimento y después lo castigaron. Cuando los sujetos no utilizaron más ese camino, dieron otro como recompensa. Nunca más recorrieron los sujetos el camino antiguo. Este efecto confiable de supresión parece ser tan cierto de restricciones temporales, discriminativas de comportamiento. La supresión del acto de orinar en perros bajo el control de estímulos de dentro de la casa, es extremadamente efectiva siempre que se permita al perro que orine sin ser castigado fuera de la casa. Hay aquí una valiosa lección sobre el uso efectivo de castigos para producir el control de impulsos. Una

alternativa recompensada bajo control discriminativo, hace del entrenamiento pasivo de evitación una potente influencia conductual. Ejemplo: caso de ratas en laboratorio, se les castigaba si comían carne y se las recompensaba si comían píldoras, preferían morir de hambre si sólo se les ponía carne por delante. Veamos ahora experimentos donde el castigo parece tener sólo un efecto de supresión temporal. La mayoría de estos experimentos no ofrecen al sujeto una premiada a la alternativa castigada. En muchos casos, o te arriesgas o te mueres de hambre. La fuerza del hambre, junto con la intensidad del castigo, son las variables cruciales para predecir recuperación de los efectos supresivos del castigo. Aquí se produce un fenómeno difícil de comprender, parecido a la “formación de reacción” de Freud. Si se castiga a un sujeto por tocar un recipiente con alimento, a medida que el hambre aumenta en intensidad, el animal se aleja del recipiente, como si la probabilidad de tocar el recipiente aumentara con la intensidad del hambre. UNIVERSIDAD DE CHILE DEPARTAMENTO DE PSICOLOGÍA USO EXCLUSIVO DE LA CÁTEDRA PSICOLOGÍA DEL APRENDIZAJE

Finalmente, debo señalar que los atributos de los castigos efectivos varían según las especias y según la etapa del desarrollo dentro de cada especie. Una serpiente de juguete puede asustar a un mono. No asusta a una rata. Un ruido fuerte aterró al pequeño Albert de Watson. Para nosotros es apenas un gong chino. Caso b). Efectos del castigo en respuestas compensatorias, contrariamente a lo que podría suponerse, los actos consumatorios, a menudo tienen significado biológico para la supervivencia del individuo y de la especie, tienen poca resistencia a la supresión por medio del castigo. El comportamiento sexual del macho puede suprimirse seriamente por medio de castigo débil. El comer, en gatos y perros puede suprimirse permanentemente con choques moderados.

La interferencia del castigo en respuestas consumatorias debe ser más investigada. Tal vez la conexión temporal íntima entre drive, incentivo y castigo hace que el drive o el incentivo se conviertan en patrones de estímulos condicionados para las reacciones emocionales aversivas cuando se castigan los actos consumatorios. Tal vez esto interfiera con la actividad vegetativa, por ejemplo, mata el apetito en un sujeto hambriento. Pero, uno puede preguntarse por qué el mismo castigador no parece ser tan efectivo cuando se le hace contingente en un acto instrumental. Tal vez la variación paramétrica más importante es el orden temporal de recompensa i castigo. Si se da comida y después se castiga, el sujeto aprende a dar reacciones de miedo, maúlla y se retrae. Le cuesta recuperar sus hábitos de comida. Si se repite la experiencia, incluso llegará a morirse de hambre. En cambio, si se da primero shock y después la comida, el animal aprende a considerar el shock como una señal y come sin problemas. Por tanto, los efectos del castigo están determinados en parte por los hechos que le anteceden y los que le siguen inmediatamente. Un castigo no es tan sólo un castigo. Es un hecho en el flujo temporal y espacial de la estimulación y el comportamiento, y sus efectos pueden producirse por su punto de inserción temporal y espacial en tal flujo. Caso c) Secuencias de actos instintivos. A veces sucesos atemorizantes producirán lo que los etólogos llaman reacciones de desplazamiento, la expresión de un patrón de conducta inadecuado. No se ha experimentado de manera sistemática sobre esto. El mejor ejemplo que pude encontrar es el de “imprinting” en pájaros; usando la respuesta locomotora de seguimiento como índice. Moltz, Rosenblum y Halikas (1959), Kovach y Hess (1963 y Hess, 1959 b) han demostrado que el castigo de comportamientos de imprinting a veces impide su ocurrencia. Sin embargo, si se castiga a los pájaros antes que

se les presente el objeto al cual se fijará su “imprinting”, a menudo se energiza la respuesta consiguiente. Es difícil entender lo que esto significa, excepto que el castigo puede, ya sea despertar o inhibir tal comportamiento, según sea la forma de presentar el castigo. Caso d) ¿Qué sucede si se castiga un reflejo rotular condicionado o incondicionado? No tenemos información sobre este punto. ¿Pueden entrenarse sujetos para inhibir reflejos bajo motivación aversiva? UNIVERSIDAD DE CHILE DEPARTAMENTO DE PSICOLOGÍA USO EXCLUSIVO DE LA CÁTEDRA PSICOLOGÍA DEL APRENDIZAJE

Caso e) Efectos del castigo en conductas establecidas mediante castigo. En general, si se usa el mismo estímulo nocivo para castigar una respuesta que se estableció mediante él, la respuesta se fortalece al principio, después a veces se debilita, pero no siempre. Carlsmith (1961) demostró que se puede aumentar la resistencia a la extinción usando el mismo estímulo nocivo tanto para la adquisición como para la extinción, y disminuir la resistencia a la extinción usando castigos diferentes discriminativamente. Para predecir, aunque sea en forma gruesa, la acción del castigo en una respuesta, hay que saber primero cómo esa respuesta particular fue inserta en el repertorio de respuestas del sujeto, originalmente. Teoría He aquí un enfoque teórico que, para mi, tiene un alto valor pragmático al estimular nuevas líneas de experimentación. Hoy en día muchos psicólogos consideran que el procedimiento de castigo es un caso especial de condicionamiento de evitación y que los resultantes procesos de aprendizaje son teóricamente de la misma naturaleza. Woodsworth y Schlosberg (1954) distinguen los dos procesos de entrenamiento: Castigo para actuar y castigos para no actuar, paro suponen que el mismo motivo teórico, “un valor de incentivo de seguridad positivo” puede explicar el aprendizaje producido por lo dos procesos.

Sinsmoor (1955) dice que los hechos relacionados con estos procedimientos están bien explicados por principios de aprendizaje de evitación de simple E-R. Dice: “si castigamos al sujeto por dar una respuesta a secuencia de respuestas, esto es, aplicamos estímulos aversivos, como shock, las claves o estímulos discriminativos para esta respuesta corresponderán a las señales de advertencia que se usan típicamente en estudios más directos de condicionamiento de evitación. Por su propia respuesta a los estímulos, el sujeto mismo produce el estímulo de castigo y lo aparea con estas señales. Como resultado éstas se vuelven también aversivas. Mientras tanto, cualquier variación en el comportamiento del sujeto que interfiera o esté en conflicto con la cadena de reacciones que llevan al castigo, demoran la ocurrencia de la respuesta final y la recepción del estímulo que le sigue. Estas variaciones en el comportamiento rompen el patrón de estímulo discriminativo para la continuación de la cadena de castigo, cambiando la estimulación corriente de un compuesto aversivo a uno no aversivo; ellas son condicionadas, diferenciadas y mantenidas por los esfuerzos reforzadores del cambio en la estimulación”. Los focos del análisis de Dinsmoor son los procesos por los cuales a) los estímulos discriminativos se tornan aversivos y b) se refuerzan los actos instrumentales. Se queda en un nivel casi descriptivo, usa un análisis E-R periférico, en el cual la respuesta producida por estímulos propioceptivos y exteroceptivos sirven para mantener juntas las cadenas de comportamiento. Rechaza, como innecesarios, conceptos tales como miedo o ansiedad, al explicar la efectividad del castigo. Mowrer (1960) también dic e que los hechos relativos a los dos procedimientos de entrenamiento se explican por un set de principios común, pero los principios de Mowrer son algo distintos de los de Woodsworth y Schlosberg o Dinsmoor ya citados. Mowrer dice: “en ambos casos hay un condicionamiento de miedo y en ambos se encuentra un

modo de comportamiento que elimina o controla el miedo. Parece que la única distinción UNIVERSIDAD DE CHILE DEPARTAMENTO DE PSICOLOGÍA USO EXCLUSIVO DE LA CÁTEDRA PSICOLOGÍA DEL APRENDIZAJE

importante es que los estímulos a los cuales se conecta el miedo son diferentes. En el caso llamado castigo, estos estímulos son producidos por (correlacionados con) el comportamiento o respuesta que se desea impedir; mientras que en el así llamado aprendizaje por evitación, los estímulos que producen el miedo no son producidos por la respuesta - son extrínsecos más que intrínsecos, más bien independientes que dependientes de la respuesta. En ambos casos hay evitación, y en ambos casos está su antítesis, el castigo; de aquí la impropiedad de referirse a uno como “castigo” y al otro como “aprendizaje de evitación”. Obviamente hay más claridad y precisión de entendimiento si se usan los términos alternativos que aquí hemos sugerido, es decir, aprendizaje de evitación pasivo y aprendizaje de evitación activo, respectivamente. Pero, como hemos visto, los dos fenómenos implican exactamente los mismos principios básicos del condicionamiento de miedo y de refuerzo de cualquier acción (o inacción) que elimina el miedo” (pp. 31-32). Aplicaciones de la teoría Estamos suponiendo varias similitudes importantes entre los procesos de aprendizaje de evitación pasivo y activo. Por tanto, podemos mirar el aprendizaje de evitación activo como un recurso teórico que nos sugiera nuevas variables no estudiadas que son relativas a la efectividad del castigo. Turner y yo hemos publicado recientemente una monografía (1962) sobre aprendizaje de evitación humana temático, nuestros experimentos demostraron que cuando se usa una respuesta esquelética muy refleja, de corta latencia, en respuestas de evitación y escape, el sujeto experimenta graves dificultades en el aprendizaje activo de evitación. Las

variaciones experimentales que tendían a hacer más deliberadas, más operantes, más voluntarias o menos reflejas a las respuestas de escape, tenderán a hacer que las respuestas de evitación fueran más fáciles de aprender. Así, cuando a un sujeto se le pedía que moviera una perilla para evitar un shock eléctrico, el aprendizaje era rápido, en contraste con lo muchos fracasos en aprender con una respuesta de evitación que consistía en flexionar un dedo del pie. En aprendizaje de evitación activo con respuestas no reflejas de larga latencia, Hunter encontró que la ocurrencia de respuestas de evitación tendía a producir más respuestas de evitación (escape). La omisión del shock parece extinguir la flexión del dedo del pie como respuesta de evitación. Claramente da distinción operante-respondedor tiene valor predictivo en el aprendizaje de evitación activo. Schlosberg (1934) usó para respuestas de evitación una respuesta de flexión de patas muy refleja y de corta latencia. El aprendizaje fue inestable, poco confiable y se extinguió rápidamente. La misma tendencia se pudo detectar en experimentos que usaron perros como sujetos. Por ejemplo, Brogden (1949) usando como respuesta una flexión de las patas delanteras, encontró que res bastante difícil llegar a un criterio de 20/20 de aprendizaje de evitación. Encontró que 30 perros tomaron de aproximadamente 200-600 ensayos para llegar al criterio de evitación. La respuesta era usada, en nuestro idioma, altamente refleja –era totalmente educida por el shock en los ensayos de escape con una latencia muy corta, aproximadamente 0,3 seg. Compárese, el aprendizaje de evitación activo en perros en una UNIVERSIDAD DE CHILE DEPARTAMENTO DE PSICOLOGÍA USO EXCLUSIVO DE LA CÁTEDRA PSICOLOGÍA DEL APRENDIZAJE

caja con puertas de corredera con la que se encuentra en el experimento de flexión de la pata delantera. En la caja con puertas de corredera, una gran cantidad de perros pudieron

embarcarse en el criterio de ensayos después de 5-15 ensayos de entrenamiento de evitación activo. Las latencias de las respuestas tempranas de escape eran largas. La resistencia a la extinción está, en estos dos tipos de respuesta de evitación, relacionada inversamente a los ensayos necesarios para que un sujeto llegue al criterio. Las condiciones que conducen a la adquisición rápida son, en este caso, las que conducen a la extinción lenta. Nuestra conclusión es que los respondedores de alta probabilidad, y corta latencia, no son tan buenos como los operantes de probabilidad media, y larga latencia, cuando se les pide funcionar experimentalmente como respuestas de evitación activas. Esta generalización parece ser válida para rata, perros y estudiantes universitarios. Como podemos dar el salto inferencial desde estos hallazgos en entrenamientos de evitación activo a las posibles variaciones en experimentos de castigo. Es relativamente simple generalizar sobre los dos tipos de experimentos en el caso de intervalos CS-US, intensidad US y duración del CS. Pero los pasos inferenciales no son tan obvios en el caso de la distinción operante-respondedor. Si uno de los principales efectos del castigo es motivar o elicitar nuevos comportamientos, y reforzarlos mediante la omisión del castigo y así, se establecen respuestas de evitación incompatibles con una respuesta castigada, donde entra lógicamente la distinción operante-respondedor. Aquí la teoría biproceso de Mowrer puede sugerir una posible respuesta. Supongamos, por ejemplo, que una rata hambrienta ha sido entrenada a presionar una palanca para recibir alimento y está dando respuestas en una tasa estable. Ahora le damos un shock de corta duración y alta intensidad contingente al apretar la barra. El shock elicita un patrón de sobresalto que produce que se suelte la palanca en 0,2 seg. y el shock desaparece. La rata se hiela por unos instantes, respira fuertemente, orina y defeca. Suponemos que una reacción emocional condicionada se ha

establecido, con el principal control del estímulo que proviene de la vista de la barra, el toque de ella, y los estímulos propioceptivos que se despiertan por los mismos movimientos de apretar palanca. Esto es, según Dinsmoor describe, el desarrollo de aversión adquirida de estímulos o, como dice Mowrer, la adquisición de reacciones condicionadas de miedo. Por tanto las variables condicionadas de Pavlov debieran ser las más importantes en el desarrollo de este proceso. La reaparición del apretar palanca en esta rata castigada, dependería de la extinción de la reacción emocional condicionada (CER) y de la congelación esquelética. Si no se administran nuevos shocks, entonces el CER debiera extinguirse de acuerdo a las leyes de extinción de Pavlov, y la reaparición de la respuesta de tocar la barra no debiera tardar, incluso si el nivel de intensidad del shock fuera suficientemente alto para producir aprendizaje de evitación activo en otro aparato. La teoría biproceso nos dice que algo muy importante para la supresión de respuestas exitosa y durable faltaba un buen operante que permitiera reforzar una respuesta de evitación confiable, porque la reacción al shock era un respondedor, era altamente refleja y rápida de ocurrir, creo que la terminación del shock no la reforzará, ni conducirá a respuestas de evitación estables. Esta conclusión se desprende directamente de nuestros experimentos de aprendizaje de evitación en humanos. Si la terminación del shock se hace contingente a la ocurrencia de un operante, especialmente un operante topográficamente incompatible con el apretar la palanca, se producirá un proceso de aprendizaje de evitación UNIVERSIDAD DE CHILE DEPARTAMENTO DE PSICOLOGÍA USO EXCLUSIVO DE LA CÁTEDRA PSICOLOGÍA DEL APRENDIZAJE

activo. Por tanto, propongo que demos un shock a la rata hasta que se acurruque en un rincón de la caja. La rata aprenderá a hacer algo arbitrario cuando reaparecen los CSs

controladores. Así, si la rata va a apretar de nuevo la palanca, debe pasar por dos procesos de extinción. El CER, establecido por el apareamiento de patrones de CS y shock, debe debilitarse. Y en seguida debe extinguirse la respuesta de acurrucarse. Si mis inferencias son correctas, esto debería hacer que el efecto del castigo fuese más duradero. Es fácil diseñar experiencias para comprobar esto. Creo que hay mucho que ganar en conducir juegos teóricos como este, siendo las principales suposiciones que a) los aprendizajes de evitación activo y pasivo son procesos similares, en los cuales las mismas variables tienen efectos análogos y b) que dos procesos, el condicionamiento de respuestas al miedo y el refuerzo de operantes incompatibles con la respuesta castigada, pueden operar en experimentos de castigo. Hay otra ventaja en hacer estos juegos teóricos. Se pueden usar para cuestionar el significado que generalmente se imputa a hallazgos anteriores. Tomemos, por ejemplo, los extensos estudios de Neal Miller (1959) y sus estudiantes, y de Brown (1948) y estudiantes, sobre gradientes de aproximación y evitación en situaciones conflictivas. Nuestro anterior análisis del papel de la distinción del operante-respondedor cuestiona uno de sus supuestos centrales: el que la gradiente de evitación es incondicionalmente más abrupta que la gradiente de aproximación en los conflictos de aproximación-evitación. En tales experimentos, se entrena al sujeto hambriento para que corra a lo largo de una pista corta para obtener alimento. Después que la carrera es confiable, se le da un shock eléctrico, generalmente cerca de la caja meta, de modo que se desanime temporalmente a entrar a dicha caja. El comportamiento subsiguiente del sujeto típico es quedarse en la caja de partida, aproximarse abortivamente a la caja con comida, mostrando indecisión, oscilación y varias actividades de desplazamiento. Eventualmente, si se discontinúa el shock, el sujeto

vuelve a correr a la caja meta. Lo abrupto de la gradiente de evitación como función de la distancia desde la caja meta se infiere del comportamiento del sujeto antes de la extinción de las tendencias de evitación. Si el sujeto se mantiene alejado de la caja meta tanto como le sea posible, se puede inferir que la gradiente de evitación se desplazará hacia arriba, o si el sujeto se va acercando a la caja meta poco a poco de ensayo, se puede inferir que es menos abrupta que la gradiente de aproximación. ¿Cuál alternativa es más plausible? Miller y sus colaboradores han demostrado que la última alternativa es una mejor interpretación. Los estudios de Miller y colaboradores demostraron que las respuestas d aproximación se generalizan más fácilmente que las respuestas de evitación. Las tendencias de evitación se debilitan más rápidamente con cambios en el ambiente externo que las tendencias de aproximación. Yo considero que los experimentos de este tipo tienen errores y han sido realizados de tal manera de producir inevitablemente las gradientes abruptas de evitación. Creo que el sujeto de un experimento de aproximación-evitación es entrenado para ejecutar una secuencia específica de respuestas bajo condiciones de incentivo y de drive apetitivo. Corre al alimento cuando tiene hambre. En contraste, cuando el shock se introduce en el laberinto, se le da generalmente cerca de la meta, y no se requiere del sujeto una secuencia larga y específica de respuestas antes que termine el shock. Así, las fuerzas iniciales de las respuestas de aproximación y evitación (que están en conflicto) no están reguladas por procedimientos análogos o simétricos. Miller ha discutido esto UNIVERSIDAD DE CHILE DEPARTAMENTO DE PSICOLOGÍA USO EXCLUSIVO DE LA CÁTEDRA PSICOLOGÍA DEL APRENDIZAJE

cuidadosamente y dice que la gradiente de evitación no sería tan abrupta si se diera el shock a la rata antes en la pista en el caso en que toda la pista esté electrificada. Yo creo que si se

quiere estudiar lo abrupto de las gradientes de aproximación y evitación, las respuestas instrumentales competidoras deberían establecerse de manera simétrica. Después de aprender a correr una pista para obtener alimento, se le debiera dar el shock cerca de la caja meta o en ésta y el shock no debiera terminar hasta que el animal no hubiese recorrido toda la pista en respuesta de escape, o sea, la misma distancia. Leyendas Skinner en 1938 describió el efecto de una palmada de corta duración en la pata durante la extinción de la respuesta de apretar palanca en una rata. Se obtuvo la supresión temporal de la respuesta. El número total de respuestas antes que ocurriera la extinción no estuvo afectada por el castigo por apretar palanca. Estes (1944) obtuvo resultados similares y atribuyó la supresión temporal al establecimiento de una ansiedad que se disipó rápidamente. Tollman, Hall y Bretanall (1932) habían anteriormente demostrado que el castigo podía aumentar el aprendizaje de laberinto al servir como clave para el comportamiento correcto. Skinner hizo de estas observaciones (sobre la naturaleza aparentemente ineficaz del castigo como debilitador de respuestas) la base para promover un régimen de refuerzo positivo en su utopía, Walden Two. En Walden Two, Skinner (1948) escribió: “estamos ahora describiendo, a un costo increíble de sufrimiento humano, que a la larga el castigo no reduce la probabilidad de que un acto ocurra” (p.260) aquí no se usarían castigos, decía, pues ellos producen un pobre control de comportamiento. Durante la década siguiente a la publicación de Walden Two, Skinner (1953) mantuvo su posición concerniente a los efectos del castigo en respuestas instrumentales: la supresión de respuestas es sólo temporal, y los efectos laterales, tales como miedo y perturbaciones neuróticas y psicóticas, no valen las ventajas temporales del uso del castigo. Dijo: “A la larga, el castigo, contrariamente a los refuerzos, trabajan a desventaja del

organismo castigado y del agente castigador”. “El hecho de que le castigo no reduce permanentemente una tendencia a responder, está de acuerdo con el descubrimiento de Freud de lo que llamó la actividad sobreviviente de los deseos reprimidos2. “El castigo, como hemos visto, no crea una probabilidad negativa de que se de una respuesta, sino más bien una probabilidad positiva de que se presentará un comportamiento incompatible”. En defensa de Skinner hay que decir que en 1953 dedicó 12 páginas al tópico del castigo en su libro introductorio. Bugelski (1956) también dice que los experimentos demuestran que el castigo es ineficaz para eliminar conductas. Recientemente (1961) Skinner resumió su posición de esta manera: “A veces es particularmente dejar de lado las ventajas finales en el control de un comportamiento, y una ventaja pequeña pero rápida puede llegar a tener un peso indebido. Así, aunque decimos que hemos abandonado la varilla, la mayoría de los colegiales están aún bajo control aversivo, no porque el castigo sea más eficaz a la larga, sino porque UNIVERSIDAD DE CHILE DEPARTAMENTO DE PSICOLOGÍA USO EXCLUSIVO DE LA CÁTEDRA PSICOLOGÍA DEL APRENDIZAJE

produce resultados inmediatos. Es más fácil para el profesor controlar al colegial amenazando castigarlo que usando un refuerzo positivo que tiene acción lenta, aunque tiene efectos más poderosos”. La mayoría de los libros sobre aprendizaje apenas tratan el tema del castigo. Una excepción a esto es Bugelski (1956). Deese (1958) en un libro de texto y Church (1963) en un artículo, han tratado el tema. Talvez una razón de que se relegue el tópico de castigo es que hay una difundida creencia de que el castigo no es importante porque realmente no debilita hábitos, que pragmáticamente es un pobre controlador del comportamiento, que es extremadamente cruel e innecesario, y que es una técnica que lleva a la neurosis y otras

cosas peores. Esta leyenda, que no tiene suficiente base empírica, probablemente surgió con Thorndike (1931), quien llegó a la conclusión de que el castigo no cumple su función principal, la de destruir o extinguir hábitos. Guthrie y Wendt mantuvieron que la extinción no es el debilitamiento de un hábito, sino el reemplazo de un hábito por otro. Cuando Thorndike decía que los efectos del castigo eran indirectos, hacía hincapié en el poder del castigo de evocar otros comportamientos que los que produjeron el castigo; de manera parecida Guthrie puso énfasis en el procedimiento de extinción como un procedimiento que produce respuestas competitivas. ¿Cómo se puede decir si las respuestas competitivas han desplazado la respuesta castigada o si el hábito castigado es el mismo debilitado por el castigo? Ni Thorndike ni Guhtrie pudieron decirlo. Así nació la leyenda, y la aceptación de ella se debió seguramente a la falta de experimentación sobre castiga desde 1930 a 1955. Tampoco se ha gastado mucha imaginación en castigo. Para muchos experimentadores castigo es sinónimo de shock eléctrico en el laboratorio. Ha habido también una difundida creencia de que el síndrome neurótico es el resultado necesario de todos los procedimientos de castigo. Además ha habido una aceptación general de que los fenómenos de comportamiento tales como la rigidez, inflexibilidad o mapa cognitivo estrecho, son resultados necesarios de los experimentos en los que se usan estímulos nocivos. Discuto estas dos conclusiones. Sin embargo, he notado recientemente un definido aumento en buenos estudios paramétricos de los efectos del castigo en varios tipos de comportamiento, lo que es alentador. Resumen He cubierto un campo muy extenso en este trabajo, talvez demasiado para dar una imagen clara. Los principales puntos que he señalado son: primero, la efectividad del castigo como un controlador del comportamiento instrumental varía con una amplia

variedad de parámetros conocidos. Algunos de estos son: a) la intensidad del estímulo de castigo, b) si la respuesta que se castiga es instrumental o consumatoria, c) si la respuesta es instintiva o refleja, d) si se estableció originalmente mediante recompensa o castigo, e) si el castigo está estrechamente relacionado o no en el tiempo con la respuesta castigada, f) la ordenación temporal de recompensa y castigo, g) la fuerza de la respuesta que se castiga, h) la familiaridad del sujeto con el castigo que se usa, i) si se ofrece o no una alternativa de recompensa durante el período de supresión del comportamiento inducido por el castigo, j) UNIVERSIDAD DE CHILE DEPARTAMENTO DE PSICOLOGÍA USO EXCLUSIVO DE LA CÁTEDRA PSICOLOGÍA DEL APRENDIZAJE

si una respuesta de evitación incompatible y distintiva se refuerza por la omisión del castigo, k) la edad del sujeto, y l) tensión y la especie del sujeto. Segundo, he tratado de demostrar las virtudes teóricas de considerar que los procesos de aprendizaje de evitación activo y pasivo son similares, y he mostrado la utilidad de una teoría biproceso del aprendizaje. He descrito algunos ejemplos de la aplicación de hallazgos en experimentos de aprendizaje de evitación activa, en la creación de nuevos experimentos de castigo y al análisis de los experimentos de conflicto de aproximación y evitación. Tercero, he puesto en duda leyendas que conciernen la efectividad del castigo como agente de cambio conductual y la inevitabilidad de resultados neuróticos como consecuencia de procedimientos de castigo. Finalmente, he indicado que sería interesante y útil realizar nuevos experimentos para aumentar nuestros conocimientos sobre los efectos del castigo.