Condicionamiento Operante

conductas disponibles. La necesidad genera u n impulso (drive) que Capitulo IV activa al organismo a eliminar o reduci

Views 132 Downloads 6 File size 8MB

Report DMCA / Copyright

DOWNLOAD FILE

Recommend stories

Citation preview

conductas disponibles. La necesidad genera u n impulso (drive) que

Capitulo IV

activa al organismo a eliminar o reducir dicha necesidad (refuerzo). La probabilidad de emitir u n a respuesta aprendida en una determinada s i t u a t i o n (potential de r e a c t i o n o desempeno) depende de diversos facto res, entre ellos: la fuerza eficaz del habito, el impulso, el d i n a m i s m o del estimulo, el reforzamiento y la i n h i b i t i o n reactiva y condicionada.

EL CONDICIONAMIENTO OPERANTE -

T o l m a n es u n conductista p o c o o r t o d o x o y el padre del c o n ductismo propositivo o finalista. Enfoca la conducta desde u n p u n t o de vista molar y se o p o n e al molecularismo del conductismo clasico. El aprendizaje conduce a u n f i n y se produce mediante la confor-

P R E S U P U E S T O S TE6RICOS

m a t i o n de mapas cognoscitivos integrados p o r signos-significados,

H a c i a u n Sistema D e s c r i p t i v o

mas que p o r asociaciones estimulo-respuesta. Las expectativas de

A n a l i s i s F u n c i o n a l de la C o n d u c t a

p r e m i o regulan el aprendizaje, el cual puede mantenerse latente hasta que se d e n ciertas condiciones que p r o p i c i e n su expresion o

Tipos d e C o n d i c i o n a m i e n t o y C o n d u c t a

manifestation. M i l l e r y D o l l a r d s o n t e o r i c o s del r e f o r z a m i e n t o y e s t a n fuertemente influidos p o r H u l l . El aprendizaje depende de los impulsos, los indicios (senales), las respuestas y el refuerzo.

MARCO D E REFERENCIA Y EXPERIMENTOS

Los

impulsos activan al organismo. Los indicios d e t e r m i n a n cuando,

Los Experimentos Triple contingencia ; Encadenamientos

donde y c o m o respondera el organismo. Las respuestas se asocian

CONCEPTOS Y PROCESOS BASICOS

a patrones de indicios p o r reforzamiento. El refuerzo determina que

R e f o r z a m i e n t o s y Reforzadores

respuesta se asociara a u n indicio o p a t r o n de indicios y sera aquella

Castigos

que reduzca el impulso. Es posible el condicionamiento operante de

P r o g r a m a s de R e f o r z a m i e n t o

respuestas autonomas. El m i e d o es a menudo u n impulso aprendido

Generalization y Discrimination

y la r e d u c t i o n del mismo produce nuevos aprendizajes. N o pocos

Extincion y Olvido

conflictos de las personas son resultado de la f o r m a en que las

Moldeamiento

mismas evitan el miedo. Rotter desarrolla una teoria social e integra las teorias del aprendizaje c o n las de la personalidad. El aprendizaje h u m a n o es

EXTENSI6N Y APLICACI6N DEL CONPICIONAMIENTO OPERANTE

f u n d a m e n t a l m e n t e r e s u l t a d o d e r e l a c i o n e s s o c i a l e s y esta

: Conducta Verbal

d e t e r m i n a d o p o r las expectativas de la persona acerca de los

•. Ensenanza

resultados de su conducta y p o r la fuerza o el valor que la misma le asigna a dichos resultados.

;

.

. M o d i f i c a t i o n de la C o n d u c t a

:

..•

-A

V\

EVALUACI6N RESUMEN

130

131

I c

1 condicionamiento operante es una teoria conductista del

H u l l en su sistema hipotetico-deductivo y en el que las variables

aprendizaje formulada p o r Burrhus F. Skinner ( 1 9 0 4 - 1 9 9 0 ) ,

" O " y sus relaciones pasan a u n p r i m e r piano.

-J la cual ha tenido y sigue teniendo una influencia conside-

rable en la psicologia en general y, mas especificamente, en el c a m p o del aprendizaje y de la e d u c a t i o n . Areas tales c o m o la

Hacia un Sistema Descriptivo

o r i e n t a t i o n , la psicoterapia y otras mas, tambien h a n acusado u n

Skinner pretende desarrollar u n sistema descriptivo, de t i p o

fuerte impacto. Ello n o ha impedido una dura critica, especialmente

experimental, orientado al estudio de las respuestas, en el que se

procedente de las posiciones cognoscitivistas y sociales.

o r g a n i c e n los datos conductuales observados sin necesidad de una

Skinner ( 1 9 3 8 , 1 9 4 8 , 1 9 5 3 , 1 9 5 7 , 1 9 6 8 , 1 9 7 1 , 1 9 7 4 , 1 9 7 8 ,

estructura teorica. Para el, no es necesario acudir al sistema nervioso,

1 9 8 9 ; H o l l a n d y Skinner, 1 9 7 7 ) es u n escritor prolifico que solo

a impulsos internos, a procesos cognoscitivos n i a otras variables

dejo la pluma con la muerte. Sus obras abarcan desde investigaciones

mediadoras que o c u r r e n " e n el interior de la p i e l " (dentro del orga-

especificas de laboratorio c o n animales, hasta Utopias relativas a la

nismo), c o m o le gusta denominarlas. N o niega su existencia, pero

a p l i c a c i o n del c o n d i c i o n a m i e n t o o p e r a n t e c o n la finalidad de

piensa que es posible una psicologia, e n la que solo se recurra a

planificar la sociedad mediante el c o n t r o l de la conducta. Algunas

variables del ambiente disponibles al analisis cientifico.

de estas ultimas fueron u n exito editorial. Aunque a Skinner puede considerarsele casi u n clasico, lo hemos separado para dedicarle u n espacio mayor, dado la influencia de



Analisis Funcional de la C o n d u c t a

sus trabajos en psicologia y en e d u c a t i o n . En este capitulo, veremos

Skinner ( 1 9 5 3 , p . 33) denomina su procedimiento de investigar

los presupuestos teoricos de los que parte el autor, su m a r c o de

la conducta «analisis funcional». Veamos c o m o lo describe c o n sus

referenda y experimentos, los conceptos y procesos basicos del

propias palabras:

condicionamiento operante y la aplicacion de este a la conducta verbal, la ensefianza y la m o d i f i c a t i o n de la conducta.

PRESUPUESTOS TEORICOS Antes de revisar los presupuestos teoricos de los que parte Skinner, un breve recuento de algunas de las orientaciones teoricas vistas hasta ahora nos ayudara a ubicarnos en el contexto historico, e n el que nacio el condicionamiento operante propuesto p o r el. Recordemos que, para T h o r n d i k e y Pavlov, el funcionalismo

Las variables externas de las que la conducta es una funcion brindan lo que podriamos llamar el analisis causal o funcional. Nos encargamos de predecir y controlar el comportamiento del individuo, y esta es nuestra «variable dependiente», el efecto del que buscamos la causa. Nuestras variables independientes» -las causas de la conducta- son las condiciones externas de las que el comportamiento es una funci6n. Las relaciones entre ambas -las «relaciones causales» en la conducta- son las leyes de la ciencia.' La sintesis de estas leyes, expresada en terminos cuantitativos, ofrece una imagen general del organismo como sistema de conducta.

del sistema nervioso esta en la base de la conducta y el aprendizaje. Para Watson, la formula E-*R (estimulo-respuesta) es la unidad ba-

Para Skinner, esta claro que el analisis cientifico de-la conducta

sica, esencial e irreductible de la psicologia, de la actividad o

es del t i p o «'R' (respuesta) es funcion de 'E' (estimulo)», siendo «R»

respuesta del organismo ante los estimulos del e n t o r n o . A T o l m a n ,

la variable dependiente y «E» la variable independiente. C o n este

el modelo E-HR n o le parece suficiente y o p t a p o r la f o r m u l a

analisis funcional, estima que se puede controlar y predecir la

E-^O-^R (estimulo^organismo-^-respuesta), la cual tambien asume

conducta, es decir, construir una psicologia cientifica.

132

133

M A R C O D E REFERENCIA Y EXPERIMENTOS

preceden, cuya r e l a t i o n c o n ella desconocemos o tenemos que postular, y es controlada, no p o r ellos, sino p o r las consecuencias

C o m o acabamos de senalar, Skinner n o p r o p o n e , p o r creerlo

que la misma conducta ocasiona en el ambiente. Nuestro autor

innecesario, u n sistema teorico para explicar la conducta; c o n t o d o ,

d e n o m i n a a este t i p o de conducta: «conducta operante», porque

reconoce que es necesario u n m a r c o m i n i m o de referencia, donde

«opera» e n el m e d i o produciendo u n efecto que la c o n t r o l a . Por

organizar adecuadamente los datos que proporciona la investigation

t a n t o , las ejecuciones «que hacen cambiar al medio u o p e r a n sobre

empirica. Veamos en que consiste tal marco de referencia.

el reciben el n o m b r e de conductas operantes» (Ferster y Perrot, 1 9 7 7 , p . 37). Otros especialistas las h a n llamado «conducta instru-

Tipos de Condicionamiento y Conducta S k i n n e r ( 1 9 5 3 ) define el c o n d i c i o n a m i e n t o c o m o «el f o r t a lecimiento de la conducta c o m o resultado del reforzamiento» (p. 6 5 ), y considera que puede ser de dos clases, tipo «E» (estimulo) y t i p o «R» (respuesta), las cuales se corresponden, respectivamente, c o n otros dos tipos de conducta: la conducta respondiente y la c o n ducta operante. Esto es m u y i m p o r t a n t e . Recordemos el condicionamiento clasico o pavloviano. El EI (estimulo incondicionado: alimento) provoca automaticamente la RI (respuesta incondicionada: salivation), si el organismo esta sano. A l aparear el E I c o n el EC (estimulo condicionado: campana), este t e r m i n a p r o d u c i e n d o el solo la R C (respuesta c o n d i c i o n a d a : salivation). E n las condiciones de laboratorio del condicionamiento clasico, podemos facilmente identificar que estimulo incondicionado (EI) produce la respuesta incondicionada (RI); de he c ho, para iniciar el condicionamiento, hemos de saberlo, pues tenemos que asociar al estimulo incondicionado (EI) u n estimulo condicionado (EC), el cual terminara produciendo la respuesta condicionada (RC). Sabemos con seguridad que el EC esta correlacionado c o n la R C . En el condicionamiento clasico, el estimulo provoca la respuesta. Skinner llama a este tipo de respuesta conducta respondiente y estima que n o es la mas c o m u n n i la mas i m p o r t a n t e , y que el condicionamiento clasico, el cual explica las respuestas condicionadas relacionadas con reflejos, t a m p o c o es el mas significativo. C o n toda razon, Skinner considera que la m a y o r parte de la conducta n o es del tipo respondiente, es decir, dependiente de u n estimulo conocido que la provoca automaticamente, sino que es emitida de manera espontanea, ciertamente ante estimulos que la 134

m e n t a l , porque funcionan c o m o una herramienta o i n s t r u m e n t o p a r a producir efectos. U n ejemplo de conducta emitida, ya clasico y m u y socorrido, nos ayudara a c o m p r e n d e r tal t i p o de conducta o p e r a n t e . Juan esta escribiendo u n a carta a su m a m a , las respuestas que lleva a cabo son facilmente observables (tomar papel y lapiz, y demas), p e r o los investigadores h a n dado demasiada i m p o r t a n cia al condicionamiento de t i p o «E» (estimulo) y estima que ya es h o r a de aplicarse mas al condicionamiento de t i p o «R» (respuesta): f.

'

'.

" f t

••

La antigua pretension de que los conceptos aplicables a respondientes espinales y a reflejos condicionados^de tipo estimulo podian extenderse a la conducta en general ha frenado la investigation de la conducta operante. Hay pues una buena razon para orientar la investigation a conseguir un mejor equilibrio entre los dos campos, especialmente porque la mayor parte del comportamiento del organismo intacto es operante. 135

A n t e s de describir el condicionamiento operante de Skinner y sus c o m p o n e n t e s basicos, conviene que revisemos c o n cierto cuidado alguno de los dispositivos que f o r m a n p a r t e de sus experimentos.

R r " quiere decir que, c o n o c a s i o n de u n e s t i m u l o

Estimulo discriminativo

Numero de operante

discriminativo (Ed), en el e x p e r i m e n t o citado la palanquita, el sujeto emite una respuesta (R), presionar la palanquita, la cual da lugar a

1

Localizacion de la palanca

La rata se acerca al frente de la caja.

2

Palanca visible

Se alza sobre las patas traseras; coloca las patas delanteras sobre la palanca.

3

Palanca tactil

Presiona sobre la palanca que acciona el racionador de comida.

4

Ruido del dispositivo Baja las patas delanteras al platillo de comida.

u n estimulo reforzador (Er), la bolita de comida. E n terminos del p r o p i o Skinner ( 1 9 3 8 , p . 21): Si la ocurrencia de una conducta operante es seguida por la presentation de un estimulo reforzador, aumenta la fuerza (...) Si la ocurrencia de una conducta operante ya fortalecida por condicionamiento no es seguida por el estimulo reforzador, la fuerza decae. Resulta claro que, en el condicionamiento operante, el estimulo reforzador es el determinante de la recurrencia de la respuesta y de



.

su ex tin c i o n . Antes de pasar a los conceptos y procesos basicos, hagamos u n a referencia a los encadenamientos.

Bolita de alimento , visible ' • v. \ f;*r- :V

5

Encadenamientos Recordaremos que G u t h r i e distingue entre respuestas c o m o actos y respuestas c o m o m o v i m i e n t o s . Segun este autor, los actos s o n respuestas complejas resultado de otras m a s simples, los m o v i m i e n t o s encadenados,

siendo estos los que o p e r a n c o m o

estimulos p r o p i o c e p t i v o s c o n d i c iona d os e n r e l a t i o n c o n otros

Respuesta de la Rata

6

^

Bolita de alimento

Se apodera de la bolita con los dientes y las patas delanteras. Mastica la bolita.

en la boca Nota. Tornado de «Teorias del aprendizaje* (p. 151) por E. R. Hflgard y G. H . Bower (1978). Mexico: Trillas. •

m o v i m i e n t o s posteriores. Pues b i e n , Skinner considera que la mayoria de las acciones del organismo h u m a n o y a n i m a l , incluida la bajada de la palanquita 138

H e m o s utilizado el ejemplo de la ratita para facilitar la c o m p r e n s i o n de la idea de encadenamiento siguiendo el e x p e r i m e n t o 139

descrito. A l lector, seguramente, se le ocurriran multitud de habilida-

sera probablemente u n reforzador para u n nino, si le gusta el choco-

des complejas en el h o m b r e y, concretamente, en el ambito educa-

late, pero n o lo sera para otro, al que n o le guste. Imaginemos

tivo: andar en bicicleta, resolver una ecuacion de p r i m e r grado,

t a m b i e n que al n i n o , al que le gusta el chocolate, le reforzamos con

escribir una r e d a c t i o n , dibujar u n mapa y otras mas. Todas estan

una chocolatina en una determinada situation, e n la que ya ha

integradas por respuestas mas simples, las cuales, a su vez, consisten

c o m i d o dicha golosina y esta h a r t o ; con toda p r o b a b i l i d a d , el

en encadenamientos todavia mas elementales.

chocolate n o operara c o m o reforzador en esa circunstancia. Todo esto quiere decir que los reforzadores son especificos p a r a sujetos y

CONCEPTOS Y PROCESOS BASICOS

I

contextos determinados. Pasemos a describir dos tipos de reforzadores, el reforzador

E n este aparte, revisaremos los principales conceptos y procesos

positivo y el reforzador negativo que se corresponden respectiva-

basicos del condicionamiento operante: reforzamiento y reforza-

mente con sendos procesos de reforzamiento, reforzamiento positivo

dores, castigos, programas de reforzamiento, g e n e r a l i z a t i o n y

y reforzamiento negativo, y las funciones que Skinner les reconoce

d i s c r i m i n a t i o n , extincion y olvido, y m o l d e a m i e n t o , tal y c o m o los

(Tabla 4.2.).

concibe Skinner.

Reforzamiento y Reforzadores S k i n n e r llama r e f o r z a m i e n t o al p r o c e s o de fortalecer u n a respuesta y reforzador a aquel estimulo o acontecimiento que sigue a una respuesta y la fortalece, haciendo que se incremente su tasa

Tabla 4 . 2 .

Funciones de los Reforzadores Positivos y Negativos Reforzador /Condicion

Presentacion

Retiro

Reforzador positivo

A) Reforzamiento

B) Estimulo aversivo

o aumente la probabilidad de que ocurra. Lo que define un reforzador es, pues, que «refuerza» y la unica manera cierta de saber si c u m p l e

positivo

su funcion, es decir, si verdaderamente es u n reforzador o estimulo reforzante, es c o m p r o b a n d o sus efectos. E n palabras del p r o p i o autor (Skinner, 1 9 5 3 , p . 7 2 ) :

Reforzador negativo (Estimulo aversivo)

El unico modo de saber que cierto acontecimiento refuerza a cierto organismo en determinadas condiciones es hacer una prueba directa. Observamos la frecuencia de una respuesta elegida, le hacemos contingente un evento y vemos si cambia la frecuencia, en cuyo caso clasificamos el acontecimiento como reforzador del organismo en las condiciones presentes.

C) Castigo

D) Reforzamiento negativo

Nota: Tabla modificada de «Principios de la conducta- (p. 1 8 1 , Tabla 1) por C. B. Ferster y M . C. Perrott (1977). Mexico: Trillas."

El uso del t e r m i n o «negativo» para calificar u n t i p o de reforzador y de reforzamiento hace que n o pocos confundan el reforzador

Por tanto, y esto es importante para el aprendizaje, es necesario tener en cuenta que u n estimulo puede ser reforzador para u n sujeto

negativo con el castigo. Definamos p r i m e r o los tipos'cle reforzadores y reforzamientos.

y n o para o t r o . Es mas, es posible que sea reforzador para u n sujeto

U n reforzador positivo es u n estimulo que sigue a u n a respuesta

en unas circunstancias y n o lo sea en otras. A s i , una chocolatina

y la fortalece, es decir, incrementa la probabilidad de que la respuesta

140

141

aparezca en la misma s i t u a t i o n . El proceso, mediante el cual se presenta el reforzador positivo, se denomina reforzamiento positivo.

iQue l e s a g r a d a ? I d e a s de refuerzo d e los estudiantes

U n reforzador negativo es el estimulo que, cuando es eliminado p o r una respuesta, aumenta la probabilidad de que esta vuelva a aparecer en el m i s m o contexto. El proceso de remover u n estimulo de una s i t u a t i o n mediante una respuesta, a u m e n t a n d o la p r o b a b i l i d a d de a p a r i c i o n de esta e n la m i s m a s i t u a t i o n , se l l a m a reforzamiento negativo.

Nombre

Grado

Fecha

Por favor contesta las respuestas tan cpmpletas como puedas.

P o r t a n t o , los reforzadores, sean positivos o negativos, siempre fortalecen la respuesta. Esto n o sucede con el castigo, como veremos mas adelante. Pero sigamos c o n los reforzadores. H e m o s mencionado que la unica f o r m a de saber si u n estimulo es u n reforzador, es probar sus consecuencias sobre la conducta

1.

Las materias escolares que mas me gustan son:

2.

Tres de las cosas que mas me agradan de la escuela son:

3. - Si tuviera 30 minutos de tiempo libre en la escuela todos los dias

operante. Pues bien, Premack ( 1 9 6 2 , 1 9 7 1 ) p r o p u s o u n m e d i o para ordenar los reforzadores de m o d o que pudieramos predecir

para hacer lo que en realidad quisiera, esto seria: 4.

Mis dos comidas rapidas favoritas son:

Segun el, una actividad mas apreciada reforzara el dedicarse a otras

5.

Lo que mas me gusta hacer en el recreo es (tres cosas):

menos apreciadas.

6.

Si tuviera dinero para gastar en cualquier cosa, compraria-.

7.

Tres trabajos que me agradaria realizar en clase son:

8.

Las dos personas con quienes mas me gustaria trabajar en la

que estimulos y acontecimientos cumpliran funciones c o m o tales.

Observemos lo que hace la gente, p o r ejemplo, u n a l u m n o , cuando tiene o p o r t u n i d a d de elegir lo que desea hacer y m i d a m o s el t i e m p o que le dedica a determinadas actividades y cuantas veces

escuela son:

realiza cada actividad; con ello, obtendremos u n orden de actividades. Las que o c u p e n los p r i m e r o s lugares de preferencia p o d r a n ser

9.

En la casa en realidad disfruto (tres cosas):

reforzadores de las que se u b i q u e n en los siguientes lugares. Dispondremos de una lista de reforzadores que nos permitira utilizarlos convenientemente y n o repetirlos demasiado, puesto que pueden

A h o r a , continuemos con otra clasificacion de los reforzadores.

originar saciedad y dejar de o p e r a r c o m o tales. U n maestro o u n

Ya mencionamos, c o n ocasion del condicionamiento clasico, la exis-

padre pueden emplear este sistema para reforzar conductas en sus

tencia de reforzadores primarios, necesarios para la supervivencia

alumnos e hijos, respectivamente, ya sea en la escuela o en el hogar.

(comida, bebioxi, abrigo, descanso y otros), y secundarios que adquie-

Los reforzadores y el orden de preferencia p u e d e n cambiar, p o r lo

ren su c o n d i t i o n p o r su asociacion con los primarios. Skinner anade

que las listas deben ser actualizadas. E n el aparte «^Que les agrada?

u n tercer t i p o que denomina reforzadores generalizados.

Ideas de refuerzo de los estudiantes», tornado de B l a c k h a m y Silber-

U n reforzador generalizado es u n reforzador seeVidario que se

m a n ( 1 9 7 9 , p p . 2 8 1 - 2 8 3 ) , se muestra u n cuestionario sencillo que

asocia con mas de u n reforzador p r i m a r i o . Sea el caso del dinero

p e r m i t e obtener i n f o r m a t i o n sobre los reforzadores preferidos p o r

que se convierte en reforzador, porque se asocia c o n la comida, la

estudiantes.

bebida y el abrigo y, con el, se pueden c o m p r a r u obtener todos

142

esos reforzadores primarios. Otros reforzadores generalizados son 143

las calificaciones elevadas, las marcas deportivas y los titulos, p o r

d o r negativo). Si, ante la misma situation de perdida de t i e m p o , el

senalar algunos.

maestro le dice al a l u m n o que n o tendra t i e m p o libre y ello hace

C o n frecuencia, algunos reforzadores generalizados estan asociados a otros reforzadores, t a m b i e n generalizados, c o m o el dinero,

que n o pierda el t i e m p o , la supresion del t i e m p o libre o p e r a c o m o u n castigo (retiro de u n reforzador positivo: el t i e m p o libre).

el elogio, la fama, entre otros. A l lector perspicaz, n o se le escapara



la i m p o r t a n c i a que los reforzadores generalizados tienen p a r a la

Tabla 4 . 3 .

L o s Procesos de Refuerzo y Castigo

conducta e n general y la social e n particular.

Ed

Castigos Recordemos la ley del efecto de T h o r n d i k e . Este, en su p r i m e r a version de la misma, considera que la satisfaction conecta mas

>• R

Estimulo discriminativo

Respuesta operante

Estimulo reforzador positivo (o reforzador negativo o E . punitivo ,

M da tiempo de estudio independiente

A estudia

M encomia a A por trabajar bien

Refuerzo negativo M da tiempo (se retira el reforzador de estudio independiente negativo)

A estudia

M dice a A que no tiene tarea para llevar a casa

M = Maestro A = Alumno E = Estimulo

fuertemente las respuestas c o n los estimulos que las preceden, mientras que la insatisfaction debilita las conexiones.

Despues,

cambia la ley, porque la evidencia empirica le demuestra que los estados insatisfactorios n o siempre debilitan las conexiones. H e m o s visto que los reforzadores, sean positivos o negativos, fortalecen las respuestas. Los castigos d is m inu ye n la probabilidad de ocurrencia de una respuesta y pueden ser de dos tipos: retiro de u n reforzador positivo (lo que opera c o m o u n estimulo aversivo) y p r e s e n t a t i o n de u n reforzador negativo (estimulo aversivo). E n general, la gente c o m u n suele identificar castigo c o n u n estimulo aversivo, tal c o m o u n golpe. U n ejemplo del a m b i t o educativo (Tabla 4.3.) nos ayudara a entender mejor los conceptos precedentes (Schunk, 1 9 9 7 ) . S u p o n gamos que u n maestro da a u n a l u m n o t i e m p o de estudio ind e p e nd i e n t e ( e s t i m ul o d i s c r i m i n a t i v o ) ; el a l u m n o estudia (respuesta operante) y el maestro lo elogia (reforzador positivo). Si el elogio hace que el alumno estudie, se trata de u n reforzamiento positivo.

>-Er



Refuerzo positivo (se presenta un reforzador positivo

Castigo (se presenta un reforzador negativo)

M da tiempo de estudio independiente

A pierde el tiempo

M da tarea a A para llevar a casa

Castigo (se retira un reforzador positivo) •

M da tiempo de estudio independiente

A pierde el tiempo

M dice a A que no tendra tiempo libre

Nota: Tornado de «Teorias del Aprendizaje" (p. 6 8 , Tabla 3.1.) por D. H . Schunck (1997). Mexico; Prentice-Hall Hispanoamericana.

Imaginemos que el maestro, ante la misma situation, le dice al alumn o que n o tiene que llevar tarea para la casa. Si esto hace que el alumno estudie, se trata de u n reforzamiento negativo, puesto que

El castigo, e n t e r m i n o s de estimulos desagradables o dolorosos,

retira u n reforzador negativo, siempre y cuando u n a tarea tenga esa

generalmente, inhibe una respuesta inadecuada, p e r q n o la elimina.

cualidad para el alumno. Vamos a suponer que el alumno, cuando el

Si u n padre golpea a su hijo p o r ver la television a deshora, es

maestro le concede t i e m p o de estudio independiente, n o estudia y ,

probable que este n o encienda el aparato, si aquel esta presente

p o r ello, le asigna tarea para llevar a casa. Si esta tarea hace que n o

p a r a p r o p o r c i o n a r l e la golpiza. Pero, cuando el p r o g e n i t o r se

pierda el t i e m p o , opera c o m o u n castigo (presentation de u n reforza-

ausente, seguramente, el vastago encendera de nuevo el televisor,

144

145

asi n o sea la h o r a apropiada. Si u n profesor, cada vez que alguno

A h o r a bien, e n la vida, las personas y los animales n o reciben

de sus alumnos levanta la m a n o para preguntar algo, responde

u n reforzador cada vez que emiten u n a determinada respuesta, sino

agresivamente y de m o d o despectivo, sus alumnos aprenderan a

solo de vez en cuando. A s i , a u n n i n o que se limpia los dientes cada

n o levantar la m a n o para evitar la agresion y el desprecio.

rrianana, su m a m a n o siempre le da u n abrazo o le dice «hijo her-

El e m p l e o de castigos fisicos dolorosos debe evitarse, pues

moso», sino solo en ocasiones. U n albanil n o consigue aumentos

p r o d u c e efectos colaterales negativos, tales c o m o sentimientos

salariales todos los dias, n i se le paga cada vez que p o n e u n ladrillo.

de minusvalia, ansiedad, agresividad, rencor, m i e d o y otros, los

U n jugador de futbol m u y pocas veces consigue u n g o l , incluso,

cuales son sumamente perjudiciales para el desarrollo de la perso-

despues de excelentes jugadas. Pues bien, cuando las respuestas

nalidad y, p o r otra parte, c o n su utilization, n o se senala la conducta

n o siempre v a n seguidas de reforzadores, se dice que el refor-

correcta. Para s u p r i m i r las c o n d u c t a s n o o p e r a t i v a s , S k i n n e r h a

zamiento es i n t e r m i t e n t e .

proporcionado tecnicas las cuales son m u c h o mas eficaces que el

E n nuestra vida diaria, t a m p o c o solemos planificar o programar

castigo. U n a de ellas implica que identifiquemos los estimulos discri-

los reforzadores. L a madre del n i n i t o que se limpia los dientes es

minativos, los cuales dan ocasion a que se produzcan las respuestas.

probable que n o haya determinado previamente cuando y c o m o va

Si u n alumno alborota en clase y vemos que esto siempre sucede,

a p r o p o r c i o n a r a su hijo u n reforzador. Pero p o d e m o s hacerlo. Es

cuando esta con un determinado companero (estimulo discriminativo);

mas, si deseamos conseguir aprendizajes c o n exito, c o n rapidez y

el tandem, evidentemente, puede ser la ocasion que da lugar a la

c o n estabilidad, es i m p o r t a n t e que planifiquemos o p r o g r a m e m o s

conducta. Para suprimir los alborotos, es efectivo separar a los dos

previamente el uso de reforzadores. Basta acudir a u n a sesion de

alumnos, colocandoles en los dos pupitres mas alejados del salon.

e n t r e n a m i e n t o de animales e n u n circo, para darnos cuenta de que

O t r o procedimiento exige que se p e r m i t a al sujeto, siempre

la distribution de los refuerzos p o r parte del entrenador esta progra-

que n o haya peligro para el o para otros, emitir la respuesta n o

mada. Muchos profesores tambien hacen esto c o n sus alumnos, al

operativa hasta la saciedad, de forma que deje de ser recompensante.

menos en cierta medida.

O t r o mas es eliminar el refuerzo. Si u n nino patalea sistematicamente delante de la m a m a para conseguir que le c o m p r e u n dulce (reforzador), lo p e o r que puede hacer esta es comprarselo y lo mejor es dejarle que patalee, hasta que se canse, y n o darle el gusto. Esta

Pues bien, el determinar previamente c o m o y cuando vamos a usar los reforzadores es lo que se d e n o m i n a «planes o programas de reforzamiento». T a m b i e n , podemos decir que t o d o «patron de

tecnica es la mas efectiva y n o es otra cosa que la extincion p o r

reforzamientb» se d e n o m i n a tecnicamente «plan o p r o g r a m a de

retiro del reforzador.

reforzamiento>> ** Ya conocemos dos tipos de planes o programas de reforza-

P r o g r a m a s de Reforzamiento E n el condicionamiento clasico, vimos varias formas de presentar el reforzamiento, es decir, de asociar el EC y el E I . Recordemos que ambos estimulos siempre se presentan juntos en cierto o r d e n y relation temporal, con el objeto de que el EC llegue el solo a producir la R C . Por t a n t o , se trata de u n reforzamiento c o n t i n u o , porque el apareamiento EI/EC se presenta en todas las ocasiones. 146

m i e n t o : el continuo, cuando a cada respuesta emitida se p r o p o r c i o n a u n reforzador, y el intermitente, cuando n o siempre que ocurre la respuesta, esta va seguida de u n reforzador. Es necesario que profundicemos u n p o c o mas' e n los programas a V r e f o r z a m i e n t o intermitente, pues pueden ser de varios tipos y t i e n e n efectos diferentes. E n la Tabla 4 . 4 . , aparecen algunos p r o g r a m a s basicos de reforzamiento i n t e r m i t e n t e . •

147

Tabla 4 . 4 .

que el t i e m p o entre uno y otro reforzador varia. Sea u n p r o g r a m a

Programas de Reforzamiento Intermitente

I V 6 (Intervalo Variable 6), en el se presenta el reforzador en u n intervalo p r o m e d i o de seis minutos, pero el intervalo cambia en

Programas

De razon

De intervalo

Fijos

Raz6n fija (RF)

Intervalo fijo (IF)

Variables

Razon variable (RV)

Intervalo variable (IV)

Nota: Tabla modificada de "Principios de la conducta- (p. 2 6 1 , Tabla 1) por C.B. Ferster y M.C. Perrott (1977). Mexico: Trillas.

cada ocasion, p o r ejemplo, en u n caso es cada dos m i n u t o s y en otros cada tres, siete y doce m i n u t o s . Es posible llevar a cabo programas o planes de refuerzo, en los que se c o m b i n e n intervalos y pr o po r ci o nes o razones variables (Ferster y Perrot, 1 9 7 7 ) . Estudiarlos va mas alia de nuestros p r o positos. Casi seguro, el lector ya se habra preguntado p o r el t i p o de p r o g r a m a de reforzamiento mas eficaz: ^el co nti nuo o el i n t e r m i -

Los programas intermitentes se pueden clasificar segun dos criterios: el t i e m p o de p r e s e n t a t i o n o aparicion de las respuestas o el n u m e r o , razon o p r o p o r t i o n de respuestas. A los primeros, se les d e n o m i n a «programas de intervalo» (I) y, a los segundos, «programas de razon» (R). Los distintos programas suelen identificarse con abreviaturas. A h o r a bien, tanto los programas de razon (R) c o m o los de intervalo (I) pueden ser fijos o variables. Por t a n t o , los programas de razon posibles son: «razon fija» (RF) y «razon variable" (RV); y los programas de intervalo (I) posibles son: «intervalo fijo» (IF) e «intervalo variable" (IV). U n p r o g r a m a de razon fija (RF) es aquel, en que el n u m e r o de respuestas entre uno y o t r o reforzador es constante, es decir, se refuerza cada «n» respuesta, siendo «n» una constante. Por t a n t o , un p r o g r a m a R F 4 (razon Fija 4) significa que se p r o p o r c i o n a el reforzador cada cuatro respuestas. U n p rogra m a de razon variable (RV) es aquel, en que el reforzador se presenta en p r o m e d i o cada «n» respuestas, siendo «n» variable. Asi, en u n programa R V 4 (Razon Variable 4), el reforzador aparece en p r o m e d i o cada cuatro respuestas, p e r o el n u m e r o de estas varia de u n refuerzo a otro, sea el caso, cada seis, tres, dos y cinco respuestas. U n p r o g r a m a de intervalo fijo (IF) es aquel, en que el t i e m p o

tente? Considerando el pr o gr ama intermitente: