Este documento describe el condicionamiento instrumental u operante. Explica que es un tipo de aprendizaje en el que las acciones de un individuo pueden ser modificadas por sus consecuencias. Detalla los principios básicos del condicionamiento instrumental como el premio, el castigo, la huida y la omisión. También resume las contribuciones de Edward Thorndike y B.F. Skinner al desarrollo de esta teoría del aprendizaje.
Condicionamiento instrumental: teoría de Thorndike y Skinner
1. República Bolivariana de Venezuela
Ministerio del Poder Popular para la Educación Universitaria
Universidad Bicentenaria de Aragua
Escuela: Psicología
Condicionamiento
Instrumental u Operante
Roraima Carolina Cuare Arquiades
V.-12363944 / P1
2. El condicionamiento instrumental o condicionamiento
operante es un tipo de aprendizaje que sucede cuando los
hechos son un resultado directo de la conducta del individuo. Es
decir, mediante el condicionamiento instrumental, las acciones
o conductas de un individuo pueden ser modificadas por sus
consecuencias.
El condicionamiento operante constituye uno de los
mecanismos de aprendizaje de mayor importancia teórica y
práctica: por una parte, es seguramente el más investigado y
mejor comprendido, y por otra es fuente de algunas de las más
significativas aplicaciones de la psicología a problemas
concretos.
3. En sentido estricto, el Condicionamiento Operante es un
caso particular de Condicionamiento Instrumental. El
Condicionamiento Instrumental se refiere a los mecanismos por
los cuales un organismo aprende a dar una respuesta más
frecuentemente (o menos) en virtud de los eventos(o
“consecuencias”) que siguen sistemáticamente a dicha
respuesta.
El Condicionamiento Operante se refiere a los casos en los
que dicha respuesta se define como un operante, es decir, en
virtud de sus propiedades funcionales. Sin embargo, la
importancia relativa del Condicionamiento operante es tan
grande que a menudo ambos términos (“operante” e
“instrumental”) se emplean como sinónimos.
4. Uno de los antecedentes
históricos del condicionamiento
instrumental son los trabajos de
Edward Thorndike acerca del
aprendizaje.
La intención inicial de
Thorndike fue estudiar la
inteligencia animal, y creó su
teoría del aprendizaje que se
basaba en la observación con
modelos de aprendizaje animal.
Antecedentes Del Condicionamiento Instrumental
5. Edward L.Thorndike
(1874-1949)
THORNDIKE:
• Fue profesor de psicología durante más de treinta años en el
Teachers College de Columbia, Estados Unidos.
• Lo que más atrajo su interés fue la teoría del aprendizaje.
• Se cuenta entre los importantes precursores del Conductismo.
• Su interés por la psicología apareció después de un curso en la
Universidad de Harvard donde tuvo de profesor aWilliam James.
• Sostenía que los animales no razonan ni avanzan en la resolución
de problemas mediante súbitos estallidos de introvisión, sino
que aprenden de una manera más o menos mecánica, partiendo
de un método de ensayo y error..
Edward LeeThorndike (1874-1949)
6. Edward L.Thorndike
(1874-1949)
Sus principales aportaciones fueron:
• El aprendizaje por ensayo/error y la ley del efecto. La formulación
esta ley, fue a partir de los estudios que realizó con gatos en cajas-
problema de las que debían escapar. La ley del efecto explicará la
teoría de Skinner del condicionamiento operante.
• Sus estudios sobre la conducta animal le permitieron desarrollar la
teoría del conexionismo.
• Según Thorndike, el aprendizaje se componía de una serie de
conexiones entre un estímulo y una respuesta, que se fortalecían
cada vez que generaban un estado de cosas satisfactorias para el
organismo, esta teoría suministró las bases sobre las que luego
Skinner construyó todo su edificio acerca del condicionamiento
operante.
Aportes de Edward LeeThorndike
7. Edward L.Thorndike
(1874-1949)
• Thorndike aplicó sus métodos para el adiestramiento de animales a
niños y jóvenes, con éxito sustancial, y llegó a tener gran
predicamento dentro del campo de la psicología educativa.
• Valoró el significado de las curvas de aprendizaje, las condiciones que
pueden afectarlas y las leyes básicas que constituyen dicho
aprendizaje como son: la ley del ejercicio, la ley del efecto y de la
disponibilidad.
• Estableció un marco teórico explicativo de la naturaleza del
aprendizaje considerada como un conjunto de asociaciones
existentes entre estímulos y respuestas proporcionadas por un
material experimental.
• Finalmente impulsó diferentes trabajos relacionados con la medida
de la capacidad intelectual y el rendimiento de los niños en edad
escolar mediante la estandarización de un cierto número de test.
Aportes de Edward LeeThorndike
8. Thorndike comienza sus investigaciones en
psicología animal. Su tesis doctoral trató sobre
Inteligencia Animal. En la cual, para desarrollar
sus investigaciones se apoyó en el estudio de
animales, en concreto gatos, y la utilización de
herramientas como la "CAJA ROMPECABEZAS"
o "CAJA-PROBLEMA", en la que el animal debía
accionar un mecanismo para poder salir de ella;
y sólo podían escapar cuando tiraban de una
cuerda, empujaban una carreta o, en algunos
casos, haciendo simultáneamente hasta tres
cosas diferentes.
Investigación más Significativa de Edward LeeThorndike
9. Investigación más Significativa de Edward LeeThorndike
El resultado de sus estudios fue la elaboración de
LA TEORÍA DEL APRENDIZAJE POR ENSAYO Y ERROR.
Según él, el proceso de aprendizaje se puede reducir a
varias leyes:
• La ley de la disposición: Que establece la preparación de las
conducciones neurológicas en la conexión estímulo-respuesta.
• La ley del ejercicio, o del uso y desuso: En la que la conexión
estímulo-respuesta se refuerza con la práctica o a la inversa.
• La ley del efecto: La más importante de ellas, que describe
cómo en el proceso de ensayo y error, si se produce una
respuesta seguida por una satisfacción, la conexión se hace más
fuerte y conduce a su aprendizaje, y al contrario, si hay un
refuerzo negativo, la conexión estímulo-respuesta se debilita y
acaba desapareciendo.
10. En el condicionamiento instrumental hay cuatro principios básicos: premio,
castigo, huída y omisión. En los cuatro casos ha de tenerse presente que
primero se produce la respuesta y luego recién se premia, o se castiga, etc.
• Premio: Un premio después de la respuesta aumenta la probabilidad
que ocurra. El premio se llama refuerzo positivo, y esto fue
enunciado en la ley del efecto deThorndike.
• Castigo: Un castigo después de la R disminuye la probabilidad que
vuelva a ocurrir. Es lo inverso a lo anterior (castigo positivo).
• Huída: Si una respuesta es para escapar de un castigo, aumenta la
probabilidad que vuelva a ocurrir. Esto se llama refuerzo negativo.
• Omisión: Si el presente está presente pero no se da, la respuesta que
lleva a esta frustración decrece su probabilidad de ocurrencia
(castigo negativo).
Principios del Condicionamiento Instrumental
11. Teoría de Edward LeeThorndike (Conexionismo)
La teoría del Aprendizaje de Thorndike
representa la estructura E - R original de la
Psicología del Comportamiento: donde el
aprendizaje, es el resultado de asociaciones
formadas entre estímulos y respuestas. Tales
asociaciones o "hábitos" se observan
fortalecidos o debilitados por la naturaleza y
frecuencia de las parejas E - R.
El paradigma de la teoría, estaba en el
aprendizaje a partir de prueba y el error, en el
cual las respuestas correctas vienen a imponerse
sobre otras debido a gratificaciones.
12. Teoría de Edward LeeThorndike (Conexionismo)
Otro concepto introducido fue "la
polaridad”, que consiste en la
contraposición de direcciones que pueden
seguir de lo positivo a lo negativo, del
agrado al desagrado, de lo justo a lo
injusto, de la atracción a la repulsión.
Thorndike también introdujo la
"diseminación del efecto" de la idea, es
decir, las gratificaciones, afectan no
solamente la conexión que las produjo
sino también a conexiones
temporalmente adyacentes.
13. • Respuesta Múltiple: se pone en juego todas las respuestas aprendidas
o instintivas de que pueda echar mano cuando se enfrenta a un nuevo
problema que no comprende totalmente. Supone un aprendizaje por
el método del ensayo y el error.
• Disposición o actitud: el impulso interno o condición que predispone al
animal a una determinada clase de comportamiento y no a otra.
• Actitud parcial o fragmentaria: a medida que el aprendizaje va
teniendo lugar, el animal gradualmente elimina movimientos inútiles
y no coronados por el éxito.
• Asimilación o analogía: un animal es puesto en una situación nueva y
extraña, recurrirá a aquellas actividades que sabe, por haberlas
probado en situaciones idénticas a un tanto semejantes, que
conducen al éxito.
• Desplazamiento asociativo: el rasgo esencial es el desplazamiento de
una respuesta (reforzada) desde un estímulo efectivo a otro
previamente inefectivo mediante la generalización.
Principios de Aprendizaje del Condicionamiento Instrumental
14. Condicionamiento Operante
También llamado "instrumental". Aunque no ha
sido olvidado por otros conductistas, éste segundo
tipo de condicionamiento ha sido investigado con
especial cuidado por el conductismo radical de
Skinner, y tiene un claro antecedente en el
aprendizaje basado en el ensayo y el error
estudiado porThorndike.
El condicionamiento operante pone al sujeto
en una situación en la que alguna de sus conductas
provoca la aparición de un refuerzo; como
consecuencia de la presencia del refuerzo se
produce en el sujeto una modificación en la
probabilidad de la emisión de dicha conducta.
15. Condicionamiento Operante
Son conductas aprendidas diseñadas para
operar en el ambiente a fin de obtener una
recompensa o evitar un castigo
No son reflejos automáticos
causados por estímulos
biológicamente importantes.
En otras palabras el condicionamiento operante o
instrumental, es el tipo de aprendizaje en el cual las
conductas son emitidas (en presencia de estímulos
específicos) para obtener recompensas o evitar castigos.
16. Psicólogo estadounidense. Obtuvo el doctorado en psicología por la Universidad
de Harvard en 1931. El autor más importante en el estudio del condicionamiento
operante es B. F. Skinner.
Influido por la teoría de los reflejos condicionados de Pávlov y por el
conductismo de John B. Watson, Skinner creyó que era posible explicar la
conducta de los individuos como un conjunto de respuestas fisiológicas
condicionadas por el entorno, y se entregó al estudio de las posibilidades que
ofrecía el control científico de la conducta mediante técnicas de refuerzo
(premio de la conducta deseada), necesariamente sobre animales.
Entre los experimentos más célebres de Skinner cabe citar el adiestramiento de
unas palomas para jugar al pimpón, la llamada caja de Skinner, todavía hoy
utilizada para el condicionamiento de animales, o el diseño de un entorno
artificial específicamente pensado para los primeros años de vida de las
personas.
Burrhus Frederic Skinner
(1904-1990)
Burrhus Frederic Skinner (1904-1990)
17. Elementos del Condicionamiento Operante
Dentro el condicionamiento operante se manejan algunos elementos
esenciales que lo ilustran:
1- La respuesta operante:
el condicionamiento operante ocurre cuando una respuesta,
llamada la RESPUESTAOPERANTE, opera en el ambiente
para producir consecuencias especificas.
2-El segundo elemento esencial es la
CONSECUENCIA, este sigue a la
conducta
3- El tercero se llama REFORZADORES a ese tipo de
consecuencias, que incrementan la probabilidad de que la
conducta se repita. En contraste de los ESTIMULOS
AVERSIVOS que ocasiona la disminución de la probabilidad de
que una conducta operante se repita
18. Fases del Condicionamiento Operante
Adquisición: La adquisición de la respuesta se
refiere a la fase del aprendizaje en que la respuesta
es seguida por reforzadores. Durante la adquisición
la respuesta se vuelve más fuerte o más frecuente,
debido a su relación con la consecuencia
reforzante.
Generalización: Las respuestas fortalecidas
mediante procedimientos operantes en un
conjunto de circunstancias tienden a extenderse o
a generalizarse en situaciones similares, al igual
que ocurre en el condicionamiento clásico. Cuando
más parecidos sean los contextos, más probable es
la generalización.
Discriminación: Los individuos desarrollan también
discriminaciones al reforzarse las respuestas en una
situación, pero no en otra.
19. Fases del Condicionamiento Operante
Extinción: Cuando se retira el reforzamiento para
alguna respuesta particular, dicha conducta
disminuye su frecuencia gradualmente hasta que
solo ocurre con la misma frecuencia con que
ocurría antes del reforzamiento. Sin embargo, es
importante advertir que en muchas ocasiones,
después de que se retiren los reforzadores, se
advierte inicialmente un aumento de la cantidad de
respuesta y de la frustración antes de que empiece
la disminución.
Recuperación espontánea: Al igual que en el
condicionamiento clásico, las respuestas que se
han extinguido vuelven a aparecer algunas veces,
es decir, se da una recuperación espontánea
después de un descanso
20. Una de las aportaciones teóricas más significativas de Skinner es la
reconceptualización de la respuesta como "operante“.
Se debe a B.F. Skinner la responsabilidad del desarrollo del concepto de
condicionamiento operante. Concretamente en 1938, publica su primer gran
libro “La conducta de los organismos”, en donde se exponen por primera vez
de manera sistemática los principios del condicionamiento operante
acompañados de los primeros experimentos clásicos sobre el tema.
En los años 30-40, Skinner, adoptando un marco teórico más amplio,
consistente y operativo, reformula la ley del efecto como "ley de refuerzo":
Skinner demuestra que una rata aprende a darle a una palanca cuando dicha
acción tiene la consecuencia de obtener alimento. Según este autor, el
condicionamiento operante o condicionamiento instrumental ocurre
cuando una respuesta en seguida por un reforzador. Contra más número de
veces se repita la relación entre respuesta-reforzador, más probabilidad
habrá de que se repita la respuesta premiada.
Aporte de B. F. Skinner al CondicionamientoOperante
21. Tipos Básicos del CondicionamientoOperante
Los cuatro tipos básicos de condicionamiento operante se producen como
resultado del entrenamiento de un organismo mediante el establecimiento de
una contingencia entre una R. operante y uno de los cuatro consecuentes
básicos.
Reforzamiento positivo: Administración de un evento siguiendo
contingentemente a una R dada, que tiene como efecto un aumento en la
fuerza, la probabilidad o la tasa de ésta. Normalmente se trata de un estímulo
apetitivo o de la posibilidad de realizar una conducta de alta probabilidad..
Ejemplo: cada vez que una rata presiona una palanca (R), se le administra
como consecuente un trozo de comida; se puede observar que la rata cada vez
presiona más frecuentemente la palanca
El tipo de CO que resulta de aplicar sistemáticamente reforzadores positivos a
una respuesta se conoce como entrenamiento de recompensa.
22. Tipos Básicos del CondicionamientoOperante
Reforzamiento negativo: Omisión o interrupción de un suceso
(típicamente, un E aversivo) de forma contingente con la emisión de una R, a
resultas de lo cual se produce un aumento en la fuerza, la probabilidad o la
tasa de ésta.
Ejemplo: cada vez que una rata se desplaza al lado opuesto de la jaula (R),
como consecuente se interrumpe una descarga eléctrica que se le estaba
aplicando; se puede observar que la rata cada vez cambia de lado más
frecuentemente.
La aplicación sistemática de reforzadores negativos a una R se conoce como
entrenamiento de evitación o entrenamiento de escape, dependiendo de si
el organismo puede mediante la R llegar a “prevenir” la aparición del E.
aversivo (evitación) o sólo puede interrumpirlo, acortando su duración, una
vez administrado (escape)
23. Tipos Básicos del CondicionamientoOperante
Castigo positivo: Administración de un suceso
(en el caso típico, un E aversivo) siguiendo
contingentemente a una R dada, que tiene como efecto
una disminución en la fuerza, la probabilidad o la tasa de
ésta.
Ejemplo: cada vez que una oveja entra en contacto con
la cerca en la que está encerrada (R), como consecuente
se le administra una descarga eléctrica; se puede
observar que la oveja cada vez toca menos
frecuentemente la cerca.
La aplicación sistemática de castigos positivos a una R se
conoce como entrenamiento de castigo.
24. Tipos Básicos del CondicionamientoOperante
Castigo negativo: Omisión o interrupción de un estímulo de
forma contingente con la emisión de una R, a resultas de lo cual
se produce una disminución en la fuerza, la probabilidad o la
tasa de ésta.
Ejemplo: cada vez que una rata que está recibiendo pequeños
fragmentos de comida cada 15 segundos toca la pared del
fondo de la jaula, se le elimina la siguiente administración de
comida que correspondiera; se puede observar que cada vez se
acerca menos a dicha pared.
La aplicación sistemática de castigos negativos a una R se
conoce como entrenamiento de omisión.
25. REFORZADOR : Tiende a aumentar la
fuerza de la R a la que sigue
CASTIGO :
Tiende a disminuir la fuerza de la R a la que
sigue
POSITIVO :
Se administra un estímulo
Reforzamiento positivo
Entrenamiento de recompensa.
Ej. : Administrar comida tras la respuesta.
R aumenta.
Se usa una recompensa (estímulo o suceso
apetitivo).
Castigo positivo
Entrenamiento de castigo.
Ej. : Administrar descarga tras la respuesta.
R disminuye.
Se usa un estímulo aversivo
NEGATIVO
Se omite un estímulo
Reforzamiento negativo
Entrenamiento de escape
Ej. : Detener una descarga eléctrica tras la
respuesta
Entrenamiento de evitación
Ej. : Si se da R, omitir una descarga que se
hubiera dado en caso contrario.
R aumenta.
Se usa un estímulo aversivo
Castigo negativo
Entrenamiento de omisión
Ej. : Se deja de dar comida al organismo
cada vez que da R.
Disminuye
Se usa estímulo apetitivo
Tipos Básicos del CondicionamientoOperante
26. Programas de Reforzamiento (del CondicionamientoOperante)
Un día a Skinner se le acabaron las bolas de alimento que daba a las
ratas, y entonces hizo un aparato que les daba bolas de alimento
automáticamente, siempre que la rata tocase la palanca un minuto.
No sólo las ratas comenzaron a presionar la palanca durante ese
lapso sino que también aumentó su tasa de respuestas (cantidad de
respuestas por unidad de tiempo), lo cual iba en contra de la idea
que a menor premio o refuerzo, menor cantidad de respuestas.
Skinner pensó que este ‘programa’ de dar bolas automáticamente
podía servir como eficaz método para controlar el comportamiento.
27. Programas de Reforzamiento (del CondicionamientoOperante)
Hay varios tipos de programas:
a)De intervalo fijo: es el ejemplo anterior.
b)De razón fija: aquí se premia a la rata cuando realiza un cierto
número de respuestas.
c)Programas combinados: una combinación de los dos anteriores.
d)Programas variables: es cuando los programas de intervalo o de
razón son variables en vez de fijos.
e)Programas de refuerzo diferencial: pueden ser de refuerzo
diferencial bajo (RDB) o alto (RDA).
Esto da tasas de respuesta muy lentas. No es eficaz para el
aprendizaje humano.
28. Programas de Reforzamiento (del CondicionamientoOperante)
f)Extinción después de un refuerzo parcial: cuando una
respuesta ha sido premiada constantemente, la extinción ocurre
más rápidamente que si aquélla fue premiada solo una vez.
g)Programas de castigo, refuerzo negativo y omisión: las pautas
de respuesta con castigo de IF son generalmente una aceleración
inmediatamente después del castigo y luego una supresión de la
respuesta inmediatamente antes del mismo. Un programa de
refuerzo negativo (huída) puede consistir en dar descargas
eléctricas a la rata hasta que cumpla cierto requerimiento, como
una razón fija de 10 respuestas. Por último, un programa de
omisión sería proporcionar premio continuamente y luego
retirarlo cuando se cumple el requerimiento serial.
29. • Con el condicionamiento operante, el animal aprende a conseguir algo -
eliminar una situación perjudicial, obtener algo beneficioso...
• La efectividad de éste condicionamiento es tal que el sujeto no sólo aprende a
responder ante una nueva situación con una conducta que formaba parte de su
repertorio anterior, sino que también le puede permitir obtener un nuevo
repertorio de conductas.
• El adjetivo "operante" se emplea para caracterizar este tipo de
condicionamiento porque, y a diferencia del "condicionamiento clásico", el
sujeto interviene u "opera" en el medio, lo modifica y este reobra sobre el
organismo: si los resultados de la acción del sujeto son "adecuados" (en la
versión más mentalista diríamos: "placenteros"), la conducta se aprenderá,
siendo más probable que se emita de nuevo en las mismas circunstancias; si los
resultados de la acción no son "adecuados" (son "desagradables") dicha
conducta tenderá a desaparecer del sujeto.
En resumen :
30. En resumen :
• En el condicionamiento clásico la asociación se da entre un
estímulo condicionado y uno incondicionado. En el
condicionamiento instrumental, la asociación se da entre
las respuestas y las consecuencias que se derivan de ellas.
• En el condicionamiento clásico, el estímulo incondicionado
no depende de la respuesta del sujeto, mientras que en el
operante las consecuencias dependen de la respuesta del
sujeto.
• En el condicionamiento clásico, la respuesta del sujeto es
involuntaria, mientras que en el instrumental es
generalmente voluntaria.