Distribución t de Student

En probabilidad y estadística, la distribución (de Student) es una distribución de probabilidad que surge del problema de estimar la media de una población normalmente distribuida cuando el tamaño de la muestra es pequeño y la desviación estándar poblacional es desconocida.

Distribución t de student
Student densite best.JPG
Función de densidad de probabilidad
T distributionCDF.png
Función de distribución de probabilidad
Parámetros grados de libertad (real)
Dominio
Función de densidad (pdf)
Función de distribución (cdf) donde es la función hipergeométrica
Media para , indefinida para otros valores
Mediana
Moda
Varianza para , indefinida para otros valores
Coeficiente de simetría para
Curtosis para
Entropía

  • : función digamma,
  • : función beta
Función generadora de momentos (mgf) (No definida)

Fue desarrollada por William Sealy Gosset bajo el pseudónimo “Student”.

Aparece de manera natural al realizar la prueba t de Student para la determinación de las diferencias entre dos varianzas muestrales y para la construcción del intervalo de confianza para la diferencia entre las partes de dos poblaciones cuando se desconoce la desviación típica de una población y esta debe ser estimada a partir de los datos de una muestra.

HistoriaEditar

La distribución de Student fue descrita en el año 1908 por William Sealy Gosset. Gosset trabajaba en una fábrica de cerveza, Guinness, que prohibía a sus empleados la publicación de artículos científicos debido a una difusión previa de secretos industriales. De ahí que Gosset publicase sus resultados bajo el pseudónimo de “Student”.[1]

Distribución t de Student a partir de una muestra aleatoriaEditar

Sea   variables aleatorias independientes distribuidas  , esto es,   es una muestra aleatoria de tamaño   proveniente de una población con distribución normal con media   y varianza  .

Sean

 

la media muestral y

 

la varianza muestral. Entonces, la variable aleatoria

 

sigue una distribución normal estándar (es decir, una distribución normal con media 0 y varianza 1) y la variable aleatoria

 

donde   ha sido sustituido por  , tiene una distribución   de student con   grados de libertad.

DefiniciónEditar

NotaciónEditar

Sean   una variable aleatoria continua y  , si   tiene una distribución   con   grados de libertad entonces escribiremos   o  .

Función de densidadEditar

La distribución  -student tiene como función de densidad

 

para  , donde   denota los grados de libertad y   es la función gamma.

La expresión anterior también suele escribirse como

 

donde   es la función beta.

En particular, para valores enteros de   se tiene que

para   par

 

para   impar

 

Función de distribuciónEditar

La función de distribución puede ser escrita en términos de  , la función beta incompleta.

Para  

 

donde

 

Una fórmula alternativa, válida para   es

 

donde   es un caso particular de la función hipergeométrica.

Casos particularesEditar

Ciertos valores de   dan una forma especial a la función de densidad y de distribución.

  •  
Función de densidad:
 
Función de distribución:
 
Véase Distribución de Cauchy.
  •  
Función de densidad:
 
Función de distribución:
 
  •  
Función de densidad:
 
Función de distribución:
 
  •  
Función de densidad:
 
Véase Distribución normal.
Función de distribución:
 
Véase Función error.

PropiedadesEditar

Si   es una variable aleatoria tal que   entonces   satisface algunas propiedades.

MediaEditar

La media de   para valores   es

 

VarianzaEditar

La varianza de   para valores   es

 

CurtosisEditar

La curtosis de   para valores   es

 

CaracterizaciónEditar

La distribución   de Student con   grados de libertad puede definirse como la distribución de la variable aleatoria   definida por:

 

donde

Para una constante   no nula, el cociente

 

es una variable aleatoria que sigue la distribución no central   de Student con parámetro de no-centralidad  .

Intervalos de confianza para muestras de la distribución normalEditar

Intervalo para la media cuando σ² es desconocidaEditar

Sean   una muestra aleatoria proveniente de una población con distribución   donde   y   son desconocidos.

Se tiene que

 

y

 

son independientes entonces el cociente

 

esto es

 

Sea   tal que

 

siendo   entonces

 

por lo tanto un intervalo de   de confianza para   cuando   es desconocida es

 

Distribución t de Student generalizadaEditar

En términos del parámetro de escala σ̂Editar

La distribución   de Student puede generalizarse a 3 parámetros, introduciendo un parámero locacional   y un parámetro de escala   mediante la relación

 

o

 

esto significa que   tiene la distribución clásica   de Student con   grados de libertad.

La resultante distribución   de Student no estandarizada tiene por función de densidad:[2]

 

donde   no corresponde a la desviación estándar, esto es, no es la desviación estándar de la distribución escalada  , simplemente es parámetro de escala de la distribución.

La distribución puede ser escrita en términos de  , el cuadrado del parámetro de escala:

 

Otras propiedades de esta versión de la distribución son:[2]

 

En términos del parámetro inverso de escala λEditar

Una parametrización alterna está en términos del parámetro inverso de escala   definido mediante la relación  . La función de densidad está dada por:[2]

 

Otras propiedades de esta versión de la distribución son:[2]

 

Distribuciones relacionadasEditar

  • Si   entonces   donde   denota la distribución F con   y   grados de libertad.

Véase tambiénEditar

ReferenciasEditar

  1. Walpole, Roland; Myers, Raymond y Ye, Keying (2002). Probability and Statistics for Engineers and Scientists. Pearson Education. 
  2. a b c d Jackman, Simon (2009). Bayesian Analysis for the Social Sciences. Wiley. p. 507. 

Enlaces externosEditar