robot de la enciclopedia para niños

Coeficiente de correlación de Pearson para niños

Enciclopedia para niños
Archivo:Correlation coefficient
Ejemplos de diagramas de dispersión con diferentes valores del coeficiente de correlación \rho

En estadística, el coeficiente de correlación de Pearson es una medida de dependencia lineal entre dos variables aleatorias cuantitativas. A diferencia de la covarianza, la correlación de Pearson es independiente de la escala de medida de las variables.

De manera menos formal, podemos definir el coeficiente de correlación de Pearson como un índice que puede utilizarse para medir el grado de relación de dos variables siempre y cuando ambas sean cuantitativas y continuas.

Definición

Para una población

El coeficiente de correlación de Pearson cuando se aplica a una población típicamente se representa por la letra griega \rho (rho) y se refiere a ella coeficiente de correlación poblacional o el coeficiente de correlación poblacional de Pearson.

Dado un par de variables aleatorias (X,Y), el coeficiente de correlación poblacional de Pearson (también denotado por \rho_{X,Y}) se define como

\rho_{X,Y}={\sigma_{XY} \over \sigma_X \sigma_Y} =\frac{\operatorname{Cov}(X,Y)}{\sqrt{\operatorname{Var}(X)\operatorname{Var}(Y)}}

donde

Para una muestra

El coeficiente de correlación de Pearson cuando es aplicado a una muestra, se suele denotar por r_{xy} y se refiere a este como el coeficiente de correlación muestral o el coeficiente de correlación muestral de Pearson. Dados n pares de datos \{(x_i,y_i)\}_{i=1}^n, se define el coeficiente de correlación muestral de Pearson como


r_{xy}
=\frac{\sum_{i=1}^n\left(x_i-\bar{x}\right)\left(y_i-\bar{y}\right)}{\sqrt{\sum_{i=1}^n\left(x_i-\bar{x}\right)^2}\sqrt{\sum_{i=1}^n\left(y_i-\bar{y}\right)^2}}

donde

  • 
n
es el tamaño de la muestra.
  • 
x_i,y_i
son puntos muestrales individuales indexados con 
i
.
  • 
\bar{x}
denota la media muestral definida por 
\bar{x}=\frac{1}{n}\sum_{i=1}^nx_i
(análogamente para 
\bar{y}
).

El coeficiente de correlación muestral también puede ser escrito como


r_{xy}=\frac{n\sum x_iy_i-\sum x_i\sum y_i}
{\sqrt{n\sum x_i^2-(\sum x_i)^2}~\sqrt{n\sum y_i^2-(\sum y_i)^2}}.

Véase también

Kids robot.svg En inglés: Pearson correlation coefficient Facts for Kids

kids search engine
Coeficiente de correlación de Pearson para Niños. Enciclopedia Kiddle.