robot de la enciclopedia para niños

Margen de error para niños

Enciclopedia para niños
Archivo:Margin-of-error-95
Densidades de probabilidad de encuestas de diferente tamaño, cada color se presenta a su intervalo de confianza del 95% (abajo), margen de error (izq), y tamaño de la muestra (derecha). Cada intervalo refleja el sector dentro del cual se puede tener un 95% de confianza que se puede encontrar el porcentaje verdadero, given a reported percentage of 50%. El margen de error es la mitad del intervalos de confianza (también denominado, el radio del intervalo). Cuanto mayor es la muestra, más pequeño es el margen de error. Además, cuanto más apartado del 50% se encuentre el porcentaje, menor resulta ser el margen de error.

El margen de error (MDE) es una estadística que expresa la cantidad de error de muestreo aleatorio en los resultados de una encuesta. Cuanto mayor sea el margen de error, menos confianza se debe tener en que el resultado de una encuesta reflejaría el resultado de una encuesta de toda la población. El margen de error será positivo siempre que se muestree una población de forma incompleta y la medida de resultado tenga una varianza positiva, es decir, la medida varía.

El término margen de error se usa a menudo en contextos que no son encuestas para indicar un error de observación al informar las cantidades medidas. También se utiliza en el habla coloquial para referirse a la cantidad de espacio o flexibilidad que uno podría tener para lograr una meta. Por ejemplo, los comentaristas lo usan a menudo en los deportes cuando describen cuánta precisión se requiere para lograr una meta, puntos o resultado. Un boliche que se usa en los Estados Unidos mide 4,75 pulgadas de ancho y la bola mide 8,5 pulgadas de ancho, por lo que se podría decir que un jugador de bolos tiene un margen de error de 21,75 pulgadas al intentar golpear un pin específico para ganar uno de repuesto (p. Ej., 1 pin permaneciendo en el carril).

Concepto

Sea una encuesta simple del tipo si/no, P es una muestra de n encuestados tomados de una población de N \text{, }(n << N) que indica un porcentaje p de respuestas si. Se desea saber cuan cercano se encuentra p del verdadero resultado de la encuesta de toda la población N, sin que tener que realizar una. Si, hipotéticamente, realizáramos una encuesta P sobre muestras subsecuentes de n encuestados (tomados nuevamente de N), es que es de esperar que los resultados subsecuentes p_1,p_2,\ldots se encuentren distribuidos en forma normal alrededor de \overline{p}. El margen de error describe la distancia dentro de la cual el porcentaje especificado de estos resultados es de esperar varíe de \overline{p}.

Según la regla 68-95-99.7, es de esperar que el 95% de los resultados p_1,p_2,\ldots caerán dentro de unas dos desviaciones estándar (\plusmn2\sigma_{P}) en cualquiera de los lados del valor medio verdadero \overline{p}.  Este intervalo se denomina el intervalo de confianza, y el radio (la mitad del intervalo) es denominado el margen de error, correspondiente al un nivel de confianza del 95%.

Generalmente, con un nivel de confianza \gamma, una muestra de tamaño n de una población que se sospecha posee una desviación estándar \sigma tiene un margen de error

MDE_\gamma = z_\gamma \times \sqrt{\frac{\sigma^2}{n}}

donde z_\gamma representa el cuantil (comúnmente denominado una unidad tipificada), y \sqrt{\frac{\sigma^2}{n}} es el error estándar.

Desviación estándar y error estándar

Es de esperar que los valores  p_1,p_2,\ldots distribuidos normalmente tengan una desviación estándar que depende de n. Cuanto menor es n, más amplio es el margen. Ello es denominado el error estándar \sigma_\overline{p}.

Para un único resultado de nuestra encuesta, se supone que p = \overline{p}, y que todos los resultados subsecuentes p_1,p_2,\ldots juntos tendrán una varianza \sigma_{P}^2=P(1-P).

 \text{Error estándar} = \sigma_\overline{p} \approx \sqrt{\frac{\sigma_{P}^2}{n}} \approx \sqrt{\frac{p(1-p)}{n}}

Es de notar que p(1-p) corresponde a la varianza de una distribución de Bernoulli.

Margen de error máximo para distintos niveles de confianza

Archivo:Empirical Rule
Representación visual de la regla empírica basada en la distribución normal

Para un nivel de confianza \gamma, existe un intervalo de confianza correspondiente alrededor del \mu\plusmn z_\gamma\sigma promedio, o sea, el intervalo [\mu-z_\gamma\sigma,\mu+z_\gamma\sigma] dentro del cual los valores de P deben encontrarse con una probabilidad \gamma. Los valores precisos de z_\gamma se obtienen a partir de la función cuantil de la distribución normal (la cual es aproximada por la regla 68-95-99.7).

Además, se debe notar que z_\gamma se encuentra indefinido para |\gamma| \ge 1, o sea, z_{1.00} es indefinido, ya que es z_{1.10}.

\gamma z_{\gamma}   \gamma z_{\gamma}
0.68 0.994457883210 0.999 3.290526731492
0.90 1.644853626951 0.9999 3.890591886413
0.95 1.959963984540 0.99999 4.417173413469
0.98 2.326347874041 0.999999 4.891638475699
0.99 2.575829303549 0.9999999 5.326723886384
0.995 2.807033768344 0.99999999 5.730728868236
0.997 2.967737925342 0.999999999 6.109410204869
Archivo:Margin of error vs sample size and confidence level
Gráficas Log-log de MOE_{\gamma}(0.5) con respecto al tamaño de la muestra n y nivel de confianza γ. Las flechas muestran que el máximo margen de error para una muestra con un tamaño de 1000 es ±3.1% con un nivel de confianza del 95%, y ±4.1% con 99%.
La párabola insertada \sigma_p^2 = p-p^2 ilustra la relación entre \sigma_p^2 para p=0.71 y \sigma^2_{max} para p=0.5. En el ejemplo, MDE95(0.71) ≈ 0.9 × ±3.1% ≈ ±2.8%.

Dado que \max \sigma_P^2 = \max P(1-P) = 0.25 para p = 0.5, se puede fijar de manera arbitraria p=\overline{p} = 0.5, calcular \sigma_{P}, \sigma_\overline{p}, y z_\gamma\sigma_\overline{p} para obtener el máximo margen de error para P con un nivel de confianza de \gamma y un tamaño de muestra n, aún antes de tener resultados concretos.  con p=0.5,n=1013

MDE_{95}(0.5) = z_{0.95}\sigma_\overline{p} \approx z_{0.95}\sqrt{\frac{\sigma_{P}^2}{n}} = 1.96\sqrt{\frac{.25}{n}} = 0.98/\sqrt{n}=\plusmn3.1%
MDE_{99}(0.5) = z_{0.99}\sigma_\overline{p} \approx z_{0.99}\sqrt{\frac{\sigma_{P}^2}{n}} = 2.58\sqrt{\frac{.25}{n}} = 1.29/\sqrt{n}=\plusmn4.1%

Ademásm es útil saber que para todo MDE_{95}

MDE_{99} = \frac{z_{0.99}}{z_{0.95}}MDE_{95} \approx 1.3 \times MDE_{95}

Márgenes específicos de error

Si una encuesta provee diversos resultados porcentuales (por ejemplo, por ejemplo una encuesta que mide una sola preferencia con opciones múltiples), el resultado más próximo al 50% tendrá el mayor margen de error. Por lo genetral, es este número el que se informa como el margen de error de toda la encuesta. Si por ejemplo la encuesta P arroja como resultados p_{a},p_{b},p_{c} 71%, 27%, 2%, n=1013

MDE_{95}(P_{a}) = z_{0.95}\sigma_\overline{p_{a}} \approx 1.96\sqrt{\frac{p_{a}(1-p_{a})}{n}} = 0.89/\sqrt{n}=\plusmn2.8% (tal como se observa en la figura previa)
MDE_{95}(P_{b}) = z_{0.95}\sigma_\overline{p_{b}} \approx 1.96\sqrt{\frac{p_{b}(1-p_{b})}{n}} = 0.87/\sqrt{n}=\plusmn2.7%
MDE_{95}(P_{c}) = z_{0.95}\sigma_\overline{p_{c}} \approx 1.96\sqrt{\frac{p_{c}(1-p_{c})}{n}} = 0.27/\sqrt{n}=\plusmn0.8%

As a given percentage approaches the extremes of 0% or 100%, its margin of error approaches ±0%.

Usos del margen de error en las encuestas

Diferentes niveles de confianza

Para una muestra aleatoria simple de una población grande, el margen de error máximo  E_m es otra expresión del tamaño de la muestra n. Los numeradores de estas ecuaciones se redondean a dos decimales.

Para la confianza X, E_m =\frac{\operatorname{erf}^{-1}(X)}{\sqrt{2n}}.

Para un 99% de confianza, E_m =\frac{1,29}{\sqrt{n}},.

Para un 95% de confianza, E_m =\frac{0,98}{\sqrt{n}},.

Para un 90% de confianza, E_m =\frac{0,82}{\sqrt{n}},.

Si un artículo sobre una encuesta no informa del margen de error, pero no indica que se ha utilizado una muestra aleatoria simple de un tamaño determinado, el margen de error puede calcularse para un grado de confianza deseado utilizando las fórmulas anteriores. Además, dado el margen de error del 95%, es posible hallar el margen de error del 99% aumentando el margen de error declarado en un 30% aproximadamente. Por ejemplo, una muestra aleatoria de 400 proporcionará un margen de error con un nivel de confianza del 95 % de \frac{0,98}{20} = 0,049, justo por debajo del 5 %. Una muestra aleatoria de tamaño 1.600 proporcionará un margen de error de \frac{0,98}{40} = 0,0245, algo menos del 2,5%. Una muestra aleatoria de 10.000 proporcionará un margen de error a un nivel de confianza del 95% de \frac{0,98}{100} = 0,0098, justo por debajo del 1%.

Márgenes de error máximos y específicos

Mientras que el margen de error que suele aparecer en la prensa es una imagen de la encuesta que refleja la máxima variación muestral de cualquier porcentaje basado en todos los encuestados, el término margen de error también se refiere al radio del intervalo de confianza de una estadística concreta. El margen de error de un determinado porcentaje individual será, por lo general, inferior al margen de error máximo comunicado por la encuesta. Este máximo sólo se aplica cuando el porcentaje observado es del 50% y el margen de error se reduce a medida que el porcentaje se acerca a los extremos del 0% y del 100%. En otras palabras, el margen de error máximo es el radio de un intervalo de confianza del 95% para un porcentaje declarado del 50%. Si p se aleja del 50%, el intervalo de confianza para p será mejor. Por lo tanto, el margen de error máximo representa la mayoración de la incertidumbre, se tiene un 95% de certeza de que el porcentaje real está dentro del margen de error máximo de un porcentaje reportado para cualquier porcentaje reportado.

Efecto del tamaño de la población

La fórmula anterior para el margen de error supone que existe una población infinitamente grande. Por lo tanto, no depende del tamaño de la población de interés. Según la teoría del muestreo, esta suposición es razonable cuando la fracción de la muestra es pequeña. El margen de error de un determinado método de muestreo es esencialmente el mismo independientemente del tamaño de la población de interés, siempre que la fracción de muestreo sea inferior al 5%. En los casos en los que la fracción de la muestra es superior al 5%, los analistas pueden ajustar el margen de error con el factor de corrección de la población finita (FCPF) para tener en cuenta la presión adicional obtenida por el muestreo cercano a un porcentaje mayor de la población.

El FCPF puede calcularse mediante  \operatorname{FCPF} = \sqrt{\frac{N - n}{N - 1}}.

Para ajustar el margen de error para una fracción de muestra grande, la FCPF reduce el margen de error. La FCPF se aproxima a 0 a medida que el tamaño de la muestra n se aproxima al tamaño de la población N, lo que tiene el efecto de eliminar completamente el margen de error. Esto tiene sentido porque cuando N = n, la muestra se convierte en un censo y el error de muestreo se vuelve irrelevante. Los analistas deben tener en cuenta que las muestras siguen siendo verdaderamente aleatorias a medida que aumenta la fracción de la muestra para que no se introduzca el sesgo.

Comparación de porcentajes

En un sistema de escrutinio mayoritario uninominal, en el que el ganador es el candidato con más votos, es importante saber quién va por delante. El término empate estadístico se utiliza a veces para describir porcentajes que divergen por menos de un margen de error, pero este término puede ser malinterpretado. Por un lado, el margen de error, tal y como se suele calcular, se aplica al porcentaje individual, no a la diferencia entre porcentajes. Por tanto, la diferencia entre dos estimaciones porcentuales puede no ser estadísticamente significativa, incluso cuando difieren en más de un margen de error. Los resultados de las encuestas también suelen proporcionar información relevante incluso cuando no hay diferencias estadísticamente significativas.

Cuando se comparan porcentajes, puede ser útil considerar la probabilidad de que uno sea mayor que otro. En situaciones sencillas, la probabilidad se puede derivar calculando el error estándar mencionado anteriormente, la fórmula de la varianza de la diferencia de dos variables aleatorias y la suposición de que si nadie elige al candidato A, elegirá al candidato B y viceversa. Están perfecta y negativamente correlacionados. Esto puede no ser una suposición aceptable cuando hay más de dos respuestas posibles a la encuesta. En el caso de encuestas más complejas, se deben utilizar diferentes fórmulas para calcular el error estándar de la diferencia.

El error estándar de la diferencia de dos porcentajes p del candidato A y q del candidato B, suponiendo que están perfecta y negativamente correlacionados, es

 \sqrt{\frac{p + q - (p - q)^2}{n}} = \sqrt{\frac{p + q - p^2 + 2pq - q^2}{n}}.

Dada la diferencia en el porcentaje observado p - q (2% o 0,02) y el error estándar de la diferencia mencionado anteriormente (0,03), se puede utilizar cualquier cálculo estadístico para calcular la probabilidad de que una muestra de una distribución normal con media 0,02 y desviación estándar 0,03 sea mayor que 0,

Véase también

Kids robot.svg En inglés: Margin of error Facts for Kids

  • Error de medición
  • Error experimental
  • Medidas de dispersión
kids search engine
Margen de error para Niños. Enciclopedia Kiddle.