Elementos Que Intervienen en El Condicionamiento

ESCUELA PROFESIONAL DE PSICOLOGÍA CURSO PSICOLOGÍA DEL APRENDIZAJE III CICLO EL CONDICIONAMIENTO OPERANTE ACERCA DE B

Views 168 Downloads 1 File size 134KB

Report DMCA / Copyright

DOWNLOAD FILE

Recommend stories

  • Author / Uploaded
  • arj
Citation preview

ESCUELA PROFESIONAL DE PSICOLOGÍA CURSO PSICOLOGÍA DEL APRENDIZAJE III CICLO

EL CONDICIONAMIENTO OPERANTE

ACERCA DE B.F SKINNER Psicólogo estadounidense quien comenzó con la idea de que los principios del condicionamiento clásico sólo explicaban una pequeña parte de las conductas que se aprenden. De acuerdo con Skinner, estos operantes son afectados por lo que sucede después de ellos. De esta manera, el condicionamiento operante, o aprendizaje operante, implica el control de las consecuencias de la conducta. Para estudiar los efectos de las consecuencias sobre la conducta bajo condiciones cuidadosamente controladas, Skinner diseñó un apartado especial parecido a una caja. Los sujetos en estudio de Skinner fueron en su mayoría ratas o pichones colocados en cajas, que al poco tiempo se conocieron como cajas de Skinner. Una típica caja de Skinner es un cajón pequeño que contiene tan sólo una charola para comida y una palanca o barras (para ratas) o un disco (para los pichones). La palanca o disco se conecta a una tolva con alimento. Las modificaciones a esta caja básica incluyen luces cercanas a la palanca o disco y pisos electrificados que se utilizan para dar toques eléctricos a los animales. Probablemente puede imaginarse como se emplea esa caja para estudiar los efectos de las consecuencias positivas (la comida), como las consecuencias desagradables (toques eléctricos). Se coloca un pichón en la caja que comienza a explorarla. Como los pichones tienden a estar picoteando, eventualmente el animal se acercará a picotear el disco y en ese momento caerá a la charola una bolita de comida. Como está hambriento se la come, da una vuelta por la caja, y picotea el disco nuevamente; cae más alimento y al poco tiempo el pichón esta picoteando y comiendo continuamente. La siguiente vez que se coloque el pichón en la caja, irá directamente al disco y comenzará a picotear. Con la rata el mismo mecanismo; al presionar la barra, recibe los comprimidos de comida en la caja, lo cual refuerza la conducta de oprimir la barra. Las conductas operantes, son respuestas emitidas sin que necesariamente esté presente un estímulo. Ocurren en forma espontánea. No todos los movimientos del

recién nacido son respuestas reflejas. Algunas de estas son respuestas operantes con las que el niño actúa sobre el ambiente. Un bebe agita un brazo o mueve una pierna y siguen ciertas consecuencias. Estas determinan si la respuesta será repetida o no. Skinner creía que le proceso de condicionamiento operante tiene un significado mucho mayor que el condicionamiento clásico simple. Muchas de nuestras conductas no pueden ser explicadas en términos de condicionamiento clásico. Más bien, son en su origen conductas espontáneas cuyas consecuencias determinan su frecuencia subsecuente. Hay una distinción clara entre la naturaleza de una conducta respondiente y una operante. La conducta respondiente es provocada o producida por un estímulo; la operante es emitida o llevada a cabo en forma libre por el organismo. También difiere la naturaleza del reforzamiento. En el condicionamiento clásico, el estímulo es el reforzamiento y antecedente a la conducta; en el operante, el efecto de la conducta es el reforzamiento. Por tanto, en el condicionamiento operante el reforzamiento sigue a la conducta. Cuando la rata privada de alimento es condicionada en una caja de Skinner a oprimir una barra y es reforzada por esa conducta con alimento, se puede predecir con bastante precisión lo que la rata va a hacer en sesiones subsecuentes en la caja de Skinner. Además se puede controlar su conducta cambiando el reforzamiento. Cuando ocurre la conducta deseada, es reforzada. El reforzamiento apropiado incrementa la probabilidad de que la conducta ocurra denuevo. CONDICIONAMIENTO OPERANTE INSTRUMENTAL Tipo de aprendizaje en el cual la probabilidad de aparición de una conducta se incrementa o reduce mediante el reforzamiento o castigo.

El condicionamiento instrumental conduce a 2 objetivos evitar el dolor y conseguir una gratificación ambas a su vez. Se diferencia del puramente operante porque se realiza en laboratorio. El condicionamiento instrumental es denominado así porque el animal aprende que su acción determina ciertos efectos. TIPOS DE REFORZADORES: Hemos visto que en el condicionamiento operante una vez que ocurre la respuesta deseada, aumenta la probabilidad de que vuelva a ocurrir mediante el reforzamiento. Cada vez que algo es seguido de cerca por un reforzamiento, tendemos a repetir la acción aún cuando el refuerzo no produzca directamente lo que hemos hecho. Reforzadores positivo y negativo: Los psicólogos distinguen varios tipos de reforzadores. Una de las distinciones más importantes es la que se da entre los reforzadores positivos y negativos. Calificar a un reforzador como positivo significa simplemente que añade una recompensa a cierta situación, por ejemplo, comida o música agradable. El reforzamiento negativo resulta eficaz porque substrae algo desagradable de la situación: el reforzamiento consiste en eliminar el estímulo. Los animales aprenderán a oprimir barras y abrir puertas no sólo para obtener alimento y agua (reforzamiento positivo) sino también para evitar descargas eléctricas o ruidos molestos (reforzamiento negativo). Cabe hacer notar que ambos tipos de reforzamiento dan por resultado el aprendizaje de nuevos comportamientos y el fortalecimiento de conductas ya existentes. Tal vez a un niño le guste tocar el piano para que lo elogien (reforzamiento positivo) o bien para escapar un rato de alguna tarea tediosa (reforzamiento negativo). Un perro aprende a abrir la puerta trasera con las patas ya sea por el reforzamiento positivo de salir a jugar o por el reforzamiento negativo de alejarse del latoso gato de la familia. Si a un niño lo regañan por comer espagueti con los dedos y dejan de regañarlo si toma un tenedor y

lo usa, es más

probable que en un futuro use el tenedor. Este es un ejemplo de reforzador negativo ya que reducir o terminar con eventos desagradables (como los castigos) aumentan las probabilidades de que el comportamiento se presenta en ese momento se

repita. Y si al mismo tiempo se añade un reforzamiento positivo (“eres un buen niño” ¡Así como los grandes comen espaguetis!), existen aún más probabilidades de que el nuevo comportamiento se repita en el futuro. Reforzamiento primario y secundario: La distinción entre los reforzadores primarios y los secundarios también es importante. Un reforzador primario es aquel que resulta grato por si mismo sin nexo alguno con otros. El alimento, el agua y sexo pertenecen a esta categoría. Un reforzador secundario es aquel cuyo valor ha de aprenderse mediante una asociación con otros reforzadores. Se le califica de secundario no porque sea menos importante, sino porque se adquiere. Una rata aprende a obtener comida tirando de una barra; después que se activa un zumbador cada vez que ejecuta esa acción y consigue comida. Aún cuando el animal deje de obtenerla, seguirá tirando de la barra con tal de oír el zumbador. Aunque el zumbador por sí mismo carece de valor para el animal, se ha convertido en un reforzador secundario. El dinero es un reforzador secundario. Aunque no pasa de ser simple papel o metal, gracias a su vinculación con el alimento, la ropa y otros reforzadores primarios, se convierte en un precio poderoso. Los niños aprenden a conocer su valor sólo cuando saben que con él comprarán cosas como dulces (reforzador primario). Y en ese momento el dinero se convierte para ellos en un reforzador secundario. Los chimpancés han aprendido a trabajar para conseguir fichas de pócker que después introducen en una máquina automática y obtienen el reforzador primario: uvas, pasas. Las fichas se han convertido para ellos en un reforzador secundario. Reforzamiento demorado: Finalmente cabe señalar que por lo regular se da un intervalo entre el momento en que se produce el comportamiento deseado y el momento en que se aplica el reforzamiento. La duración de este intervalo es importante para que se realice el aprendizaje; cuanto mayor sea el intervalo, menor, eficacia tendrá el reforzamiento. En un estudio los experimentadores variaron el intervalo en que las ratas tiraban de la palanca y el momento en que se les daba el reforzamiento. Un retraso de unos cuantos segundos reducía drásticamente la frecuencia con que las ratas tiraban de la palanca. El reforzamiento demorado puede afectar nuestras elecciones, sobre todo

las que tienen que ver con el autocontrol. Una persona que está a dieta puede optar por una rebanada de pastel debido a que el reforzador primario es mucho más inmediato que el reforzador de adelgazar. La reducción de la eficacia con el retardo del esfuerzo parece deberse a distracciones que entorpecen el proceso adquisitivo. Al minimizar las distracciones a que está sujeto el individuo entre el comportamiento y el reforzamiento, es posible posponer este último sin que el aprendizaje disminuya demasiado. Lo mismo se logra en el ser humano recordándole varias veces que el reforzamiento está por llegar o explicándole por que se le refuerza cuando finalmente llega. Esto forma un nexo entre la respuesta del que aprende y el retardo del refuerzo que viene después. Hay casos en que los comportamientos son intrínsecamente reforzadores, de modo que no se da ningún retardo en ellos. Por ejemplo a esta categoría pertenece la conducta depredadora y sexual de los animales. Al ocurrir el comportamiento, éste premia de inmediato al animal. Como cabe suponer, tales actos son difíciles de eliminar. Castigo: Ocurre cuando una conducta es seguida por una situación desagradable diseñada para eliminarla. El castigo puede detener o bloquear una conducta pero no necesariamente eliminarla. PROGRAMAS DE REFORZAMIENTO: Skinner (1969) describió tres programas de reforzamiento e indicó su efectividad. En el reforzamiento continuo, las conducta deseada cada vez que ocurre. Un programa de reforzamiento continuo es en extremo efectivo en el desarrollo y fortalecimientos iniciales de una conducta. Sin embargo, si el reforzamiento es detenido, la respuesta desaparece con rapidez o sufre la extinción. En el reforzamiento de intervalo, el organismo es reforzado después de que ha transcurrido un cierto tiempo, sin importar el porcentaje de respuesta. El reforzamiento de intervalo puede ser aplicado en una base fija o variable. Si es fijo, transcurre el mismo periodo

cada vez (tal como cinco minutos). Si es variable, el periodo puede diferir en longitud. Este tipo de programa de reforzamiento ocurre con frecuencia en la vida cotidiana. Los empleados reciben su paga al final de cada semana. A los estudiantes se les dan calificaciones en determinados intervalos del año. En cada uno de estos casos, el reforzamiento de intervalo produce un nivel de respuestas que es más difícil de extinguir que las respuestas que han sido reforzadas en forma continua. Sin embargo, el nivel de respuesta tiende a ser inferior que el producido por otros tipos de programa. En el reforzamiento de razón, el reforzamiento es determinado por el número de respuestas apropiadas que emite el organismo. Un obrero en una fábrica puede recibir su pago de acuerdo al número de piezas que termina. Los programas de reforzamiento de razón también pueden ser fijos o variables. Si son fijos el número de respuestas requerido antes del reforzamiento es estable y en igual cantidad cada vez. Si son variables, el número de conductas operantes apropiadas que debe ocurrir antes del reforzamiento cambia de vez en cuando. Mientras que un programa de reforzamiento continuo es más efectivo para el desarrollo y fortalecimiento iniciales de conducta, un programa de razón variables es más efectivo después de mantenerla. Las respuestas conservadas bajo condiciones d reforzamiento de razón variable son muy resistentes a la extinción y tienen menor probabilidad de desaparecer. Los casinos de juego han aprendido bien esta lección. Su uso del principio de los programas de razón variable mantiene a muchos jugadores en la mesa mucho después de que el dinero que se les ha asignado para jugar se ha terminado. MOLDEAMIENTO: Con frecuencia la conducta que se desea que el animal ejecute es tan compleja y rebuscada que no se esperaría que peste la realizara en forma natural poco después de entrar en la caja. Supóngase que se desea entrenar a un pichón a picotear un pequeño punto negro dentro de un círculo blanco. Si se tuviera que esperar hasta que la conducta ocurriera de manera espontánea, se podría aguardar un largo tiempo. Por consiguiente, Skinner empleó un procedimiento denominado moldeamiento, el cual de manera deliberada forma o moldea la conducta del animal en fin de lograr la conducta deseada.

Al principio, el pichón se mueve al azar por la caja. Cuando se mueve en dirección al círculo, es reforzado con una bolita de alimento en el comedero que se encuentra debajo de este. La siguiente vez que se acerque al círculo, es reforzado de nuevo.Más tarde, se le permite que se acerque más al círculo antes de ser reforzado. Luego, no es reforzado sino hasta que picotea le círculo blanco. Por último, el pichón es reforzado solo por picotear en el pequeño punto negro dentro del círculo. Por medio del moldeamiento, Skinner fue capaz de inducir a los animales a ejecutar proezas únicas y notables; enseñó a los pichones a jugar ping-pong, a guiar proyectiles a su objetivo. El moldeamiento es el reforzamiento de las aproximaciones sucesivas

a un

comportamiento deseado. Skinner creía que la mayor parte de la conducta animal y humana es aprendida por medio del condicionamiento operante. El proceso de aprendizaje para hablar el propio idioma natal implica reforzamiento y moldeamiento de conducta operante. El niño pequeño emite ciertos sonidos espontáneos. Estos no están limitados a sonidos de su idioma natal, sino que representan a todos los idiomas posibles. Al principio, el niño es reforzado sólo por hablar con significado. Skinner (1986) sugirió que la conducta verbal evolucionó del señalamiento, la imitación y otras conductas no verbales, siguiendo las reglas de las contingencias de reforzamiento. Por tanto, el proceso de moldeamiento está implicado en el aprendizaje del habla así como en muchas otras conductas humanas.