robot de la enciclopedia para niños

Distribución t de Student para niños

Enciclopedia para niños
Datos para niños
Distribución t de student
Student densite best.JPG
Función de densidad de probabilidad
T distributionCDF.png
Función de distribución de probabilidad
Parámetros \nu > 0\! grados de libertad (real)
Dominio x \in (-\infty; +\infty)\!
Función de densidad (pdf) \frac{\Gamma((\nu+1)/2)} {\sqrt{\nu\pi}\,\Gamma(\nu/2)} (1+x^2/\nu)^{-(\nu+1)/2}\!
Función de distribución (cdf) Error al representar (error léxico): \begin{matrix} \frac{1}{2} + x \Gamma \left( \frac{\nu+1}{2} \right) \cdot\[0.5em] \frac{\,_2F_1 \left ( \frac{1}{2},\frac{\nu+1}{2};\frac{3}{2}; -\frac{x^2}{\nu} \right)} {\sqrt{\pi\nu}\,\Gamma \left(\frac{\nu}{2}\right)} \end{matrix} donde \,_2F_1 es la función hipergeométrica
Media 0 para \nu>1, indefinida para otros valores
Mediana 0
Moda 0
Varianza \frac{\nu}{\nu-2}\! para \nu>2, indefinida para otros valores
Coeficiente de simetría 0 para \nu>3
Curtosis \frac{6}{\nu-4}\! para \nu>4
Entropía

Error al representar (error léxico): \begin{matrix} \frac{\nu+1}{2}\left[ \psi(\frac{1+\nu}{2}) - \psi(\frac{\nu}{2}) \right] \[0.5em] + \log{\left[\sqrt{\nu}B(\frac{\nu}{2},\frac{1}{2})\right]} \end{matrix}

  • \psi: función digamma,
  • B: función beta
Función generadora de momentos (mgf) (No definida)

En probabilidad y estadística, la distribución  t (de Student) es una distribución de probabilidad que surge del problema de estimar la media de una población normalmente distribuida cuando el tamaño de la muestra es pequeño y la desviación estándar poblacional es desconocida.

Fue desarrollada por William Sealy Gosset bajo el pseudónimo “Student”.

Aparece de manera natural al realizar la prueba t de Student para la determinación de las diferencias entre dos varianzas muestrales y para la construcción del intervalo de confianza para la diferencia entre las partes de dos poblaciones cuando se desconoce la desviación típica de una población y esta debe ser estimada a partir de los datos de una muestra.

Historia

La distribución de Student fue descrita en el año 1908 por William Sealy Gosset. Gosset trabajaba en una fábrica de cerveza, Guinness, que prohibía a sus empleados la publicación de artículos científicos debido a una difusión previa de secretos industriales. De ahí que Gosset publicase sus resultados bajo el pseudónimo de “Student”.

Distribución t de Student a partir de una muestra aleatoria

Sea X_1,\dots,X_n variables aleatorias independientes distribuidas N(\mu,\sigma^2), esto es, X_1,\dots,X_n es una muestra aleatoria de tamaño n proveniente de una población con distribución normal con media \mu y varianza \sigma^2.

Sean

\overline{X}_n=\frac{1}{n}\sum_{i=1}^nX_i

la media muestral y

S^2=\frac{1}{n-1}\sum_{i=1}^n\left(X_i-\overline{X}\right)^2

la varianza muestral. Entonces, la variable aleatoria

\frac{\overline{X}-\mu}{\sigma/\sqrt{n}}

sigue una distribución normal estándar (es decir, una distribución normal con media 0 y varianza 1) y la variable aleatoria

\frac{\overline{X}-\mu}{S/\sqrt{n}}

donde S ha sido sustituido por \sigma, tiene una distribución t de student con n-1 grados de libertad.

Definición

Notación

Sean X una variable aleatoria continua y v>0, si X tiene una distribución t con v grados de libertad entonces escribiremos X\sim t_v o X\sim t(v).

Función de densidad

La distribución t-student tiene como función de densidad

f_X(x)=\frac{\Gamma\left(\frac{v+1}{2}\right)}{\sqrt{v\pi}\;\Gamma\left(\frac{v}{2}\right)}\left(1+\frac{x^2}{v}\right)^{-\frac{v+1}{2}}

para x\in\mathbb{R}, donde v denota los grados de libertad y \Gamma es la función gamma.

La expresión anterior también suele escribirse como

f_X(x)=\frac{1}{\sqrt{v}\;\operatorname{B}\left(\frac{1}{2},\frac{v}{2}\right)}\left(1+\frac{x^2}{v}\right)^{-\frac{v+1}{2}}

donde \operatorname{B} es la función beta.

En particular, para valores enteros de v se tiene que

para v>1 par

\frac{\Gamma\left(\frac{v+1}{2}\right)}{\sqrt{v\pi}\;\Gamma\left(\frac{v}{2}\right)}=\frac{(v-1)(v-3)\cdots5\cdot3}{2\sqrt{v}(v-2)(v-4)\cdots4\cdot2}

para v>1 impar

\frac{\Gamma\left(\frac{v+1}{2}\right)}{\sqrt{v\pi}\;\Gamma\left(\frac{v}{2}\right)}=\frac{(v-1)(v-3)\cdots4\cdot2}{\pi\sqrt{v}(v-2)(v-4)\cdots5\cdot3}

Función de distribución

La función de distribución puede ser escrita en términos de I, la función beta incompleta.

Para x>0

F_X(x)=\int_{-\infty}^xf(u)du=1-\frac{1}{2}I_{x(t)}\left(\frac{v}{2},\frac{1}{2}\right)

donde

x(t)=\frac{v}{t^2+v}

Una fórmula alternativa, válida para x^2<v es

\int_{-\infty}^xf(u)du=\frac{1}{2}+x\frac{\Gamma\left(\frac{v+1}{2}\right)}{\sqrt{\pi v}\;\Gamma\left(\frac{v}{2}\right)}{}_2F_1\left(\frac{1}{2},\frac{v+1}{2};\frac{3}{2};-\frac{x^2}{v}\right)

donde {}_2F_1 es un caso particular de la función hipergeométrica.

Casos particulares

Ciertos valores de v dan una forma especial a la función de densidad y de distribución.

  • v=1
Función de densidad:
f_X(x)=\frac{1}{\pi(1+x^2)}
Función de distribución:
F_X(x)=\frac{1}{2}+\frac{1}{\pi}\arctan(x)
Véase Distribución de Cauchy.
  • v=2
Función de densidad:
f_X(x)=\frac{1}{2\sqrt{2}\left(1+\frac{x^2}{2}\right)^{\frac{3}{2}}}
Función de distribución:
F_X(x)=\frac{1}{2}+\frac{x}{2\sqrt{2}\sqrt{1+\frac{x^2}{2}}}
  • v=3
Función de densidad:
f_X(x)=\frac{2}{\pi\sqrt{3}\left(1+\frac{x^2}{3}\right)^2}
Función de distribución:
F_X(x)=\frac{1}{2}+\frac{1}{\pi}\left[\frac{x}{\sqrt{3}\left(1+\frac{x^2}{3}\right)}+\arctan\left(\frac{x}{\sqrt{3}}\right)\right]
  • v=\infty
Función de densidad:
f_X(x)=\frac{1}{\sqrt{2\pi}}e^{-\frac{x^2}{2}}
Véase Distribución normal.
Función de distribución:
F_X(x)=\frac{1}{2}\left[1+\operatorname{erf}\left(\frac{x}{\sqrt{2}}\right)\right]
Véase Función error.

Propiedades

Si X es una variable aleatoria tal que X\sim t_v entonces X satisface algunas propiedades.

Media

La media de X para valores v>1 es

\operatorname{E}[X]=0

Varianza

La varianza de X para valores v>2 es

\operatorname{Var}(X)=\frac{v}{v-2}

Curtosis

La curtosis de X para valores v>4 es

\frac{6}{v-4}

Caracterización

La distribución  t de Student con v grados de libertad puede definirse como la distribución de la variable aleatoria T definida por:

T:=\frac{Z}{\sqrt{\frac{X}{v}}}\sim t_v

donde

Para una constante \mu no nula, el cociente

 (Z+\mu)\sqrt{\frac{v}{X}}

es una variable aleatoria que sigue la distribución no central  t de Student con parámetro de no-centralidad \mu.

Intervalos de confianza para muestras de la distribución normal

Intervalo para la media cuando \sigma^2 es desconocida

Sean X_1,\dots,X_n una muestra aleatoria proveniente de una población con distribución N(\mu,\sigma^2) donde \mu y \sigma son desconocidos.

Se tiene que

\frac{\overline{X}-\mu}{\sigma/\sqrt{n}}\sim N(0,1)

y

\frac{(n-1)S^2}{\sigma^2}\sim\chi^2_{n-1}

son independientes entonces el cociente

\frac{\frac{\overline{X}-\mu}{\sigma/\sqrt{n}}}{\sqrt{\frac{\frac{(n-1)S^2}{\sigma^2}}{n-1}}}\sim t_{n-1}

esto es

\frac{\overline{X}-\mu}{S/\sqrt{n}}\sim t_{n-1}

Sea t_{n-1,1-\alpha/2}\in\mathbb{R} tal que

\operatorname{P}[Y\leq t_{n-1,1-\alpha/2}]=1-\frac{\alpha}{2}

siendo Y\sim t_{n-1} entonces

\begin{align}
    &\operatorname{P}\left[-t_{n-1,1-\alpha/2}\leq \frac{\overline{X}-\mu}{S/\sqrt{n}}\leq t_{n-1,1-\alpha/2}\right]=1-\alpha \\
    &\operatorname{P}\left[-t_{n-1,1-\alpha/2}\;\frac{S}{\sqrt{n}}\leq \overline{X}-\mu\leq t_{n-1,1-\alpha/2}\;\frac{S}{\sqrt{n}}\right]=1-\alpha \\
    &\operatorname{P}\left[-\overline{X}-t_{n-1,1-\alpha/2}\;\frac{S}{\sqrt{n}}\leq-\mu\leq-\overline{X}+t_{n-1,1-\alpha/2}\;\frac{S}{\sqrt{n}}\right]=1-\alpha \\
    &\operatorname{P}\left[\overline{X}-t_{n-1,1-\alpha/2}\;\frac{S}{\sqrt{n}}\leq\mu\leq\overline{X}+t_{n-1,1-\alpha/2}\;\frac{S}{\sqrt{n}}\right]=1-\alpha \\
\end{align}

por lo tanto un intervalo de (1-\alpha)100\% de confianza para \mu cuando \sigma^2 es desconocida es

\left(\overline{X}-t_{n-1,1-\alpha/2}\;\frac{S}{\sqrt{n}},\overline{X}+t_{n-1,1-\alpha/2}\;\frac{S}{\sqrt{n}}\right)

Distribución t de Student generalizada

En términos del parámetro de escala \widehat{\sigma}

La distribución t de Student puede generalizarse a 3 parámetros, introduciendo un parámero locacional \widehat{\mu} y un parámetro de escala \widehat{\sigma} mediante la relación

X=\widehat{\mu}+\widehat{\sigma}\;T

o

T=\frac{X-\widehat{\mu}}{\widehat{\sigma}}

esto significa que {\textstyle \frac{x-\widehat{\mu}}{\widehat{\sigma}}} tiene la distribución clásica t de Student con v grados de libertad.

La resultante distribución t de Student no estandarizada tiene por función de densidad:

p(x|\nu,\widehat{\mu},\widehat{\sigma})=\frac{\Gamma(\frac{\nu + 1}{2})}{\Gamma(\frac{\nu}{2})\sqrt{\pi\nu}\widehat{\sigma}}\left(1+\frac{1}{\nu}\left(\frac{x-\widehat{\mu}}{\widehat{\sigma}}\right)^2\right)^{-\frac{\nu+1}{2}}

donde \widehat{\sigma} no corresponde a la desviación estándar, esto es, no es la desviación estándar de la distribución escalada t , simplemente es parámetro de escala de la distribución.

La distribución puede ser escrita en términos de \widehat{\sigma}^2 , el cuadrado del parámetro de escala:

p(x|\nu,\widehat\mu,\widehat\sigma^2) = \frac{\Gamma(\frac{\nu + 1}{2})}{\Gamma(\frac{\nu}{2})\sqrt{\pi\nu\widehat\sigma^2}} \left(1+\frac{1}{\nu}\frac{(x-\widehat\mu)^2}{\widehat\sigma^2}\right)^{-\frac{\nu+1}{2}}

Otras propiedades de esta versión de la distribución son:


\begin{align}
    &\operatorname{E}[X]=\widehat{\mu}\quad \quad \quad \text{para }\,\nu > 1 ,\\
    &\operatorname{Var}(X)=\widehat{\sigma}^2\frac{\nu}{\nu-2}\, \quad \text{para }\,\nu > 2 ,\\
    &\operatorname{Moda}(X)=\widehat\mu .
\end{align}

En términos del parámetro inverso de escala \lambda

Una parametrización alterna está en términos del parámetro inverso de escala \lambda definido mediante la relación {\textstyle \lambda=\frac{1}{\widehat{\sigma}^2}}. La función de densidad está dada por:

p(x|\nu,\widehat{\mu},\lambda)=\frac{\Gamma(\frac{\nu + 1}{2})}{\Gamma(\frac{\nu}{2})}\left(\frac{\lambda}{\pi v}\right)^{\frac{1}{2}}\left(1+\frac{\lambda(x-\widehat{\mu})^2}{v}\right)^{-\frac{\nu+1}{2}}

Otras propiedades de esta versión de la distribución son:


\begin{align}
    &\operatorname{E}[X]=\widehat{\mu}\quad \quad \quad \text{para }\,\nu > 1 ,\\
    &\operatorname{Var}(X)=\frac{1}{\lambda}\frac{\nu}{\nu-2}\, \quad \text{para }\,\nu > 2 ,\\
    &\operatorname{Moda}(X)=\widehat\mu .
\end{align}

Distribuciones relacionadas

  • Si  X\sim t_v entonces  X^2\sim\operatorname{F}_{1,v} donde  \operatorname{F}_{1,v} denota la distribución F con  1 y  v grados de libertad.

Véase también

Kids robot.svg En inglés: Student's t-distribution Facts for Kids

kids search engine
Distribución t de Student para Niños. Enciclopedia Kiddle.