robot de la enciclopedia para niños

Condicionamiento operante para niños

Enciclopedia para niños

El condicionamiento operante es una forma de aprender donde una persona o animal es más propenso a repetir acciones que tienen resultados positivos. También es menos probable que repita las acciones que no tienen buenos resultados o que tienen resultados negativos. Es un tipo de aprendizaje que se relaciona con cómo se desarrollan nuevas conductas según lo que sucede después de ellas.

El psicólogo Burrhus Frederic Skinner introdujo este término. Sin embargo, hoy en día se prefiere el nombre de "condicionamiento instrumental". Este fue propuesto por Edward Thorndike y es más claro. Sugiere que una conducta es como una herramienta para lograr algo. Thorndike creía que se aprende por ensayo y error. Skinner, por su parte, decía que las respuestas que son recompensadas tienden a repetirse. Las que reciben un castigo tienen menos posibilidades de repetirse.

La investigación sobre el condicionamiento operante ha creado métodos detallados para la enseñanza. Esto se conoce como modificación de conducta.

Primeras investigaciones sobre el aprendizaje

El psicólogo Edward Thorndike (1874-1949) fue uno de los primeros en estudiar el condicionamiento operante. Creó unas "cajas de solución de problemas". Eran jaulas de las que las ratas podían escapar. Para salir, las ratas debían hacer acciones sencillas. Por ejemplo, tirar de un cordón o presionar una palanca.

Como motivación, la rata podía ver y oler comida fuera de la caja. Al principio, la rata se movía al azar. Por casualidad, resolvía el problema, como tirar de una polea. Cada vez que Thorndike ponía a la rata en la jaula, esta tardaba menos en salir. Esto pasaba porque la acción de tirar de la polea era recompensada. La recompensa era que la jaula se abría y la rata obtenía comida. Esta acción, al ser recompensada, se volvía la más probable en el futuro.

Archivo:Caja de Skinner
Caja de Skinner

Gracias a estos experimentos, Thorndike estableció la Ley del efecto. Esta ley dice: "Cualquier conducta que en una situación produce un efecto satisfactorio, se hará más probable en el futuro". Si una acción tiene una consecuencia buena, la conexión entre la situación y la acción se hace más fuerte. Si la acción tiene una consecuencia desagradable, la conexión se debilita. Thorndike pensaba que los animales, incluidos los humanos, resuelven problemas aprendiendo por ensayo y error.

Los estudios de Iván Pávlov sobre el condicionamiento clásico también influyeron mucho. Aunque son diferentes, el condicionamiento clásico y el operante comparten principios. Algunos de ellos son la adquisición, la extinción, la discriminación y la generalización.

El investigador más importante en el condicionamiento operante es B. F. Skinner. A finales de los años 20, empezó a trabajar con palomas. Usaba un lugar sin distracciones llamado caja de Skinner. En ella, podía controlar cómo se les daba alimento a los animales. Sus estudios con este aparato ayudaron a Skinner a descubrir muchos factores. Estos factores influyen en el condicionamiento operante.

¿Cómo funciona el condicionamiento operante?

Existen cuatro formas principales de condicionamiento instrumental:

  • Refuerzo positivo o condicionamiento de recompensa: Un refuerzo positivo es algo que, al estar presente, hace que una acción se repita más seguido. Es la forma más efectiva para que animales y humanos aprendan. Se llama "refuerzo" porque aumenta la frecuencia de la conducta. Se llama "positivo" porque el refuerzo se añade. Ejemplos comunes son los elogios, los regalos o el dinero. A veces, algo que parece desagradable puede ser un refuerzo positivo. Por ejemplo, si un niño grita y sus padres le prestan atención, el niño puede sentirse reforzado. Así, aprende que gritar le da atención.
  • Refuerzo negativo: Un refuerzo negativo es algo que, al ser quitado, hace que una acción se repita más seguido. También aumenta la frecuencia de la conducta. Se llama "negativo" porque la acción aumenta cuando el refuerzo desaparece. Hay dos tipos de refuerzo negativo:
    • Condicionamiento de escape: Aquí, una acción aumenta porque detiene algo desagradable que ya está ocurriendo. Por ejemplo, un animal que presiona una palanca para detener una corriente eléctrica. O un padre que compra un dulce a su hijo para que deje de llorar.
    • Condicionamiento de evitación: En este caso, una acción aumenta porque evita o pospone algo desagradable que podría pasar en el futuro. Un ejemplo es un estudiante que estudia para evitar una mala calificación.
  • Entrenamiento de omisión: Esto ocurre cuando una acción impide que se presente un refuerzo positivo o algo agradable. Consiste en quitar un estímulo positivo para que una conducta disminuya o desaparezca. Un ejemplo importante es el "tiempo fuera". Se le quita la atención a un niño aislándolo por un tiempo.
  • Castigo: El castigo hace que una conducta disminuya. Esto sucede porque lo que sigue a la acción es algo desagradable. Un ejemplo es castigar a una rata con una pequeña corriente eléctrica cuando presiona una palanca. Aunque el castigo puede ser efectivo para eliminar una conducta, se recomienda usarlo lo menos posible. Puede tener efectos no deseados. A veces, la conducta solo desaparece temporalmente o solo cuando se espera el castigo. Además, puede generar otras consecuencias, como frustración. Por eso, al aplicar castigos, es importante seguir reglas. Por ejemplo, reforzar al mismo tiempo otras conductas buenas, aplicarlo justo después de la conducta que se quiere eliminar, y ser constante.

¿Qué tipos de refuerzos existen?

Lo que es un refuerzo depende de cada persona o animal. También depende de la situación. Por ejemplo, unas galletas pueden ser un buen refuerzo para un perro con hambre. Pero no lo serán para un perro que acaba de comer carne.

Los refuerzos se dividen en dos grupos principales: primarios (o intrínsecos) y secundarios (o extrínsecos).

  • Un reforzador es primario o intrínseco cuando la acción es agradable por sí misma. Es decir, la acción produce sensaciones buenas y se fortalece automáticamente cada vez que ocurre. Hay varias acciones que son agradables por sí mismas. Por ejemplo, las acciones que satisfacen necesidades básicas, como beber cuando se tiene sed o comer cuando se tiene hambre. Muchas actividades sociales o que dan estimulación sensorial o intelectual también son a menudo agradables por sí mismas. Lo mismo ocurre con la sensación de mejorar en una habilidad. Las acciones que ayudan a evitar algún daño también pueden ser reforzantes. Sin embargo, las actividades agradables no siempre lo son desde el principio. Por ejemplo, se necesita cierta habilidad para que tocar un instrumento musical sea satisfactorio.
  • Los refuerzos secundarios o extrínsecos, también llamados reforzadores condicionados, se aprenden. En ellos, la recompensa no es parte de la actividad en sí. Obtienen su poder de refuerzo al asociarse con un reforzador primario. Si un reforzador condicionado se asocia con más de un reforzador primario, se le llama reforzador generalizado. Por ejemplo, el dinero se convierte en un refuerzo porque permite conseguir otros refuerzos primarios. Un tipo importante de reforzadores extrínsecos son los reforzadores sociales. Estos pueden influir mucho en el comportamiento humano. Incluyen el afecto, la atención, la aprobación o la obediencia.

En la vida real, los refuerzos intrínsecos y extrínsecos suelen mezclarse en una misma situación.

Principios clave del condicionamiento operante

  • Adquisición: Es la fase del aprendizaje donde una acción es seguida por refuerzos. Durante la adquisición, la acción se vuelve más fuerte o más frecuente. Esto se debe a su relación con la consecuencia que la refuerza.
  • Generalización: Las acciones que se fortalecen en una situación tienden a extenderse a situaciones similares. Esto es parecido a lo que ocurre en el condicionamiento clásico. Cuanto más parecidas sean las situaciones, más probable es la generalización.
  • Discriminación: Las personas también aprenden a diferenciar. Esto sucede cuando las acciones se refuerzan en una situación, pero no en otra.
  • Extinción: Cuando se deja de reforzar una acción, esta disminuye su frecuencia poco a poco. Esto ocurre hasta que vuelve a la frecuencia que tenía antes de ser reforzada. Sin embargo, a veces, después de quitar los refuerzos, la acción puede aumentar un poco antes de empezar a disminuir.
  • Recuperación espontánea: Al igual que en el condicionamiento clásico, las acciones que se habían extinguido a veces reaparecen. Esto se llama recuperación espontánea y ocurre después de un tiempo de descanso.

¿Cómo se aplican los refuerzos?

Los programas de reforzamiento son reglas que indican cuándo y cómo una acción será seguida por un refuerzo. Estos programas afectan varios aspectos del aprendizaje. Por ejemplo, la rapidez con la que se aprende una acción. También la frecuencia con la que se realiza la acción aprendida. O cuánto tiempo se sigue haciendo la acción una vez que el refuerzo deja de ser predecible.

Hay dos tipos básicos de reforzamiento: continuo e intermitente.

  • En el reforzamiento continuo, cada vez que se realiza una acción, aparece un refuerzo. Por ejemplo, una paloma que recibe comida cada vez que picotea una tecla. Este tipo de reforzamiento es muy efectivo para enseñar una conducta al principio. Sin embargo, cuando el refuerzo se detiene, la acción también desaparece rápidamente.
  • En el reforzamiento intermitente, las acciones solo se refuerzan algunas veces. Por ejemplo, una persona que juega en una máquina y recibe un premio cada varias jugadas. Este tipo de programa produce un patrón de acciones más constante. Es más resistente a que la acción desaparezca cuando el refuerzo se vuelve impredecible o se detiene. Una combinación de reforzamiento intermitente y continuo es muy efectiva. Al principio, se usa el continuo para que se aprenda la acción. Luego, se pasa al intermitente para que sea más difícil que la acción desaparezca.

El reforzamiento intermitente da lugar a los programas de reforzamiento. Estos pueden ser de dos tipos: de razón (según el número de acciones) y de intervalo (según el tiempo). Cada uno de ellos puede ser fijo o variable.

  • Razón fija: El refuerzo se obtiene después de un número fijo de acciones. Un ejemplo es cuando las fábricas pagan a sus trabajadores después de producir una cantidad específica de productos. El reforzamiento continuo es un tipo de razón fija (razón 1). Las personas responden más rápido bajo programas de razón fija. Pero suelen hacer una pausa para descansar después de recibir el refuerzo.
  • Razón variable: Aquí, el número de acciones para conseguir el refuerzo cambia al azar. Sin embargo, siempre dentro de un promedio. Un ejemplo son las máquinas de juegos, que dan premios de forma variable. Muchos refuerzos naturales, como el éxito o el reconocimiento, son parecidos a este tipo de programas. Los programas de razón variable producen una tasa de respuesta alta y constante. Las personas no hacen pausas después del refuerzo. La incertidumbre de no saber cuándo llegará el siguiente refuerzo mantiene a las personas realizando la acción constantemente.
  • Intervalo fijo: El refuerzo aparece cada vez que pasa un tiempo determinado. Esto siempre y cuando la acción se haya realizado durante ese tiempo. Un ejemplo sería un padre que revisa cada media hora si su hijo está estudiando. Si lo está, lo elogia. Los programas de intervalo fijo producen una tasa de respuestas desigual. Después de recibir el refuerzo, la tasa de acciones tiende a ser baja. Durante el intervalo, la conducta aumenta hasta un nivel alto justo antes del siguiente refuerzo programado.
  • Intervalo variable: El refuerzo está disponible después de un tiempo que varía al azar, pero alrededor de un promedio. Un ejemplo es un profesor que hace exámenes sorpresa aproximadamente cada semana. Este tipo de programa suele producir una tasa de respuesta constante, pero moderada.

En general, los programas de razón (número de acciones) hacen que se aprenda más rápido. Pero la acción puede desaparecer fácilmente si se quitan los refuerzos. Los programas de intervalo (tiempo) producen un aprendizaje más estable y resistente a que la acción desaparezca. En la vida real, estos programas básicos a menudo se combinan.

Diferencias entre condicionamiento clásico y operante

  • En el condicionamiento clásico, la conexión se da entre un estímulo condicionado y uno incondicionado. En el condicionamiento instrumental, la conexión se da entre las acciones y las consecuencias que resultan de ellas.
  • En el condicionamiento clásico, el estímulo incondicionado no depende de la acción de la persona o animal. En el operante, las consecuencias sí dependen de la acción del sujeto.
  • En el condicionamiento clásico, la conducta es provocada por un estímulo (es involuntaria). En el operante, la persona o animal es quien realiza la conducta en el ambiente (es voluntaria).

Véase también

Kids robot.svg En inglés: Operant conditioning Facts for Kids

kids search engine
Condicionamiento operante para Niños. Enciclopedia Kiddle.