robot de la enciclopedia para niños

Paradoja de Simpson para niños

Enciclopedia para niños

La paradoja de Simpson es un fenómeno interesante en probabilidad y estadística. Ocurre cuando una tendencia que se ve en varios grupos de datos individuales desaparece o incluso se invierte cuando esos grupos se combinan. Es como si al mirar las partes por separado, vieras una cosa, pero al juntarlas todas, ¡el resultado es lo contrario!

Esta situación puede ser un poco confusa y se presenta a menudo en estudios de ciencias, medicina o en el análisis de datos sociales. La paradoja se entiende mejor cuando se analizan las razones detrás de cómo se agrupan los datos.

Aunque no es muy conocida por el público en general, la paradoja de Simpson es un concepto importante para los expertos en estadística.

Paradoja de Simpson: ¿Quién la descubrió?

Este fenómeno fue descrito por primera vez por Edward H. Simpson en un artículo técnico en 1951. Sin embargo, ya había sido observado antes por otros investigadores como Karl Pearson en 1899 y Udny Yule en 1903.

El nombre "paradoja de Simpson" fue usado por primera vez por Colin R. Blyth en 1972. A veces, también se le llama "efecto Yule-Simpson" o "paradoja de la reversión".

Ejemplos de la Paradoja de Simpson

Para entender mejor la paradoja de Simpson, veamos algunos ejemplos de la vida real o situaciones que la ilustran.

Tratamientos médicos y cálculos renales

Imagina un estudio médico que compara dos tratamientos diferentes para los cálculos de riñón. Llamaremos a estos tratamientos "Tratamiento A" y "Tratamiento B". Los investigadores analizaron los resultados según el tamaño de los cálculos: pequeños o grandes.

Aquí están los porcentajes de éxito:

Tratamiento A Tratamiento B
Cálculos pequeños Grupo 1
93 % (81/87)
Grupo 2
87 % (234/270)
Cálculos grandes Grupo 3
73 % (192/263)
Grupo 4
69 % (55/80)
Total 78 % (273/350) 83 % (289/350)

Si miras los grupos por separado:

  • Para cálculos pequeños, el Tratamiento A tiene un 93% de éxito, mientras que el Tratamiento B tiene un 87%. ¡El Tratamiento A parece mejor!
  • Para cálculos grandes, el Tratamiento A tiene un 73% de éxito, y el Tratamiento B tiene un 69%. ¡El Tratamiento A también parece mejor aquí!

Pero, si miras el "Total" de todos los pacientes combinados:

  • El Tratamiento A tiene un 78% de éxito.
  • El Tratamiento B tiene un 83% de éxito.

¡De repente, el Tratamiento B parece mejor en general! Esto es la paradoja de Simpson.

¿Por qué ocurre esto? La clave es una variable "escondida" o "confusora": el tamaño del cálculo. Los médicos tienden a usar el Tratamiento A (que era un procedimiento más invasivo) en los casos más difíciles, es decir, en pacientes con cálculos grandes. El Tratamiento B (menos invasivo) se usaba más en casos con cálculos pequeños.

Como los casos más difíciles (cálculos grandes) tienen naturalmente una tasa de éxito más baja, y el Tratamiento A se usó más en ellos, esto hizo que su porcentaje total bajara. El Tratamiento B, al usarse más en casos más fáciles (cálculos pequeños), tuvo un porcentaje total más alto.

Un ejemplo con números muy claros

Para que sea aún más fácil de entender, veamos un ejemplo ficticio con números muy marcados:

Tratamiento A Tratamiento B
Problema tipo "1" Grupo 1
100 % (1/1)
Grupo 2
98.9 % (98/99)
Problema tipo "2" Grupo 3
1 % (1/99)
Grupo 4
0 % (0/1)
Ambos 2 % (2/100) 98 % (98/100)

Aquí, el Tratamiento A es 100% efectivo para el "Problema tipo 1" y 1% efectivo para el "Problema tipo 2". El Tratamiento B es 98.9% efectivo para el "Problema tipo 1" y 0% efectivo para el "Problema tipo 2". En ambos tipos de problema, el Tratamiento A es mejor.

Pero si miras el total, el Tratamiento A tiene un 2% de éxito, mientras que el Tratamiento B tiene un 98% de éxito. ¡El Tratamiento B parece mucho mejor en general!

Esto sucede porque casi todos los pacientes del Tratamiento A tenían el "Problema tipo 2" (el más difícil), mientras que casi todos los pacientes del Tratamiento B tenían el "Problema tipo 1" (el más fácil). La forma en que se distribuyeron los pacientes entre los tratamientos y los tipos de problemas es lo que causa la paradoja.

Admisiones en una universidad

Otro ejemplo famoso ocurrió en la Universidad de California, Berkeley en 1973, al analizar las admisiones a programas de posgrado. Al principio, parecía que un grupo de solicitantes tenía más posibilidades de ser aceptado que otro.

Aquí están los porcentajes generales:

Solicitudes Admisiones
Grupo 1 8442 44 %
Grupo 2 4321 35 %

A primera vista, el Grupo 1 parecía tener una tasa de admisión más alta (44%) que el Grupo 2 (35%).

Sin embargo, cuando se examinaron los datos por separado para cada departamento de la universidad, la situación cambió. En la mayoría de los departamentos, no se encontró esa diferencia. De hecho, en algunos departamentos, el Grupo 2 tenía una ligera ventaja.

Aquí están los datos de los seis departamentos más grandes:

Departamento Grupo 1 Grupo 2
Solicitudes Admisiones Solicitudes Admisiones
A 825 62 % 108 82 %
B 560 63 % 25 68 %
C 325 37 % 593 34 %
D 417 33 % 375 35 %
E 191 28 % 393 24 %
F 272 6 % 341 7 %

La explicación fue que el Grupo 2 tendía a solicitar ingreso en departamentos que eran muy populares y tenían tasas de admisión bajas (como el departamento de lengua inglesa). Por otro lado, el Grupo 1 tendía a solicitar en departamentos con menos competencia y tasas de admisión más altas (como ingeniería y química).

La paradoja de Simpson nos enseña que es muy importante mirar los datos con cuidado y considerar todas las variables que podrían estar influyendo, no solo los totales combinados.

Galería de imágenes

Véase también

Kids robot.svg En inglés: Simpson's paradox Facts for Kids

kids search engine
Paradoja de Simpson para Niños. Enciclopedia Kiddle.