En probabilidad y estadística , la distribución
t
{\displaystyle t}
(de Student ) es una distribución de probabilidad que surge del problema de estimar la media de una población normalmente distribuida cuando el tamaño de la muestra es pequeño y la desviación estándar poblacional es desconocida.
Distribución t de student
Función de densidad de probabilidad
Función de distribución de probabilidad Parámetros
ν
>
0
{\displaystyle \nu >0\!}
grados de libertad (real) Dominio
x
∈
(
−
∞
;
+
∞
)
{\displaystyle x\in (-\infty ;+\infty )\!}
Función de densidad (pdf)
Γ
(
(
ν
+
1
)
/
2
)
ν
π
Γ
(
ν
/
2
)
(
1
+
x
2
/
ν
)
−
(
ν
+
1
)
/
2
{\displaystyle {\frac {\Gamma ((\nu +1)/2)}{{\sqrt {\nu \pi }}\,\Gamma (\nu /2)}}(1+x^{2}/\nu )^{-(\nu +1)/2}\!}
Función de distribución (cdf)
1
2
+
x
Γ
(
ν
+
1
2
)
⋅
2
F
1
(
1
2
,
ν
+
1
2
;
3
2
;
−
x
2
ν
)
π
ν
Γ
(
ν
2
)
{\displaystyle {\begin{matrix}{\frac {1}{2}}+x\Gamma \left({\frac {\nu +1}{2}}\right)\cdot \\[0.5em]{\frac {\,_{2}F_{1}\left({\frac {1}{2}},{\frac {\nu +1}{2}};{\frac {3}{2}};-{\frac {x^{2}}{\nu }}\right)}{{\sqrt {\pi \nu }}\,\Gamma \left({\frac {\nu }{2}}\right)}}\end{matrix}}}
donde
2
F
1
{\displaystyle \,_{2}F_{1}}
es la función hipergeométrica Media
0
{\displaystyle 0}
para
ν
>
1
{\displaystyle \nu >1}
, indefinida para otros valores Mediana
0
{\displaystyle 0}
Moda
0
{\displaystyle 0}
Varianza
ν
ν
−
2
{\displaystyle {\frac {\nu }{\nu -2}}\!}
para
ν
>
2
{\displaystyle \nu >2}
, indefinida para otros valores Coeficiente de simetría
0
{\displaystyle 0}
para
ν
>
3
{\displaystyle \nu >3}
Curtosis
6
ν
−
4
{\displaystyle {\frac {6}{\nu -4}}\!}
para
ν
>
4
{\displaystyle \nu >4}
Entropía
ν
+
1
2
[
ψ
(
1
+
ν
2
)
−
ψ
(
ν
2
)
]
+
log
[
ν
B
(
ν
2
,
1
2
)
]
{\displaystyle {\begin{matrix}{\frac {\nu +1}{2}}\left[\psi ({\frac {1+\nu }{2}})-\psi ({\frac {\nu }{2}})\right]\\[0.5em]+\log {\left[{\sqrt {\nu }}B({\frac {\nu }{2}},{\frac {1}{2}})\right]}\end{matrix}}}
ψ
{\displaystyle \psi }
: función digamma,
B
{\displaystyle B}
: función beta Función generadora de momentos (mgf)
(No definida)
Fue desarrollada por William Sealy Gosset bajo el pseudónimo “Student” .
Aparece de manera natural al realizar la prueba t de Student para la determinación de las diferencias entre dos varianzas muestrales y para la construcción del intervalo de confianza para la diferencia entre las partes de dos poblaciones cuando se desconoce la desviación típica de una población y esta debe ser estimada a partir de los datos de una muestra.
La distribución de Student fue descrita en el año 1908 por William Sealy Gosset . Gosset trabajaba en una fábrica de cerveza, Guinness , que prohibía a sus empleados la publicación de artículos científicos debido a una difusión previa de secretos industriales. De ahí que Gosset publicase sus resultados bajo el pseudónimo de “Student” .[ 1]
Distribución t de Student a partir de una muestra aleatoria Editar
Sea
X
1
,
…
,
X
n
{\displaystyle X_{1},\dots ,X_{n}}
variables aleatorias independientes distribuidas
N
(
μ
,
σ
2
)
{\displaystyle N(\mu ,\sigma ^{2})}
, esto es,
X
1
,
…
,
X
n
{\displaystyle X_{1},\dots ,X_{n}}
es una muestra aleatoria de tamaño
n
{\displaystyle n}
proveniente de una población con distribución normal con media
μ
{\displaystyle \mu }
y varianza
σ
2
{\displaystyle \sigma ^{2}}
.
Sean
X
¯
=
1
n
∑
i
=
1
n
X
i
{\displaystyle {\overline {X}}={\frac {1}{n}}\sum _{i=1}^{n}X_{i}}
la media muestral y
S
2
=
1
n
−
1
∑
i
=
1
n
(
X
i
−
X
¯
)
2
{\displaystyle S^{2}={\frac {1}{n-1}}\sum _{i=1}^{n}\left(X_{i}-{\overline {X}}\right)^{2}}
la varianza muestral. Entonces, la variable aleatoria
X
¯
−
μ
σ
/
n
{\displaystyle {\frac {{\overline {X}}-\mu }{\sigma /{\sqrt {n}}}}}
sigue una distribución normal estándar (es decir, una distribución normal con media 0 y varianza 1) y la variable aleatoria
X
¯
−
μ
S
/
n
{\displaystyle {\frac {{\overline {X}}-\mu }{S/{\sqrt {n}}}}}
donde
S
{\displaystyle S}
ha sido sustituido por
σ
{\displaystyle \sigma }
, tiene una distribución
t
{\displaystyle t}
de student con
n
−
1
{\displaystyle n-1}
grados de libertad.
Sean
X
{\displaystyle X}
una variable aleatoria continua y
v
>
0
{\displaystyle v>0}
, si
X
{\displaystyle X}
tiene una distribución
t
{\displaystyle t}
con
v
{\displaystyle v}
grados de libertad entonces escribiremos
X
∼
t
v
{\displaystyle X\sim t_{v}}
o
X
∼
t
(
v
)
{\displaystyle X\sim t(v)}
.
Función de densidad Editar
La distribución
t
{\displaystyle t}
-student tiene como función de densidad
f
X
(
x
)
=
Γ
(
v
+
1
2
)
v
π
Γ
(
v
2
)
(
1
+
x
2
v
)
−
v
+
1
2
{\displaystyle f_{X}(x)={\frac {\Gamma \left({\frac {v+1}{2}}\right)}{{\sqrt {v\pi }}\;\Gamma \left({\frac {v}{2}}\right)}}\left(1+{\frac {x^{2}}{v}}\right)^{-{\frac {v+1}{2}}}}
para
x
∈
R
{\displaystyle x\in \mathbb {R} }
, donde
v
{\displaystyle v}
denota los grados de libertad y
Γ
{\displaystyle \Gamma }
es la función gamma .
La expresión anterior también suele escribirse como
f
X
(
x
)
=
1
v
B
(
1
2
,
v
2
)
(
1
+
x
2
v
)
−
v
+
1
2
{\displaystyle f_{X}(x)={\frac {1}{{\sqrt {v}}\;\operatorname {B} \left({\frac {1}{2}},{\frac {v}{2}}\right)}}\left(1+{\frac {x^{2}}{v}}\right)^{-{\frac {v+1}{2}}}}
donde
B
{\displaystyle \operatorname {B} }
es la función beta .
En particular, para valores enteros de
v
{\displaystyle v}
se tiene que
para
v
>
1
{\displaystyle v>1}
par
Γ
(
v
+
1
2
)
v
π
Γ
(
v
2
)
=
(
v
−
1
)
(
v
−
3
)
⋯
5
⋅
3
2
v
(
v
−
2
)
(
v
−
4
)
⋯
4
⋅
2
{\displaystyle {\frac {\Gamma \left({\frac {v+1}{2}}\right)}{{\sqrt {v\pi }}\;\Gamma \left({\frac {v}{2}}\right)}}={\frac {(v-1)(v-3)\cdots 5\cdot 3}{2{\sqrt {v}}(v-2)(v-4)\cdots 4\cdot 2}}}
para
v
>
1
{\displaystyle v>1}
impar
Γ
(
v
+
1
2
)
v
π
Γ
(
v
2
)
=
(
v
−
1
)
(
v
−
3
)
⋯
4
⋅
2
π
v
(
v
−
2
)
(
v
−
4
)
⋯
5
⋅
3
{\displaystyle {\frac {\Gamma \left({\frac {v+1}{2}}\right)}{{\sqrt {v\pi }}\;\Gamma \left({\frac {v}{2}}\right)}}={\frac {(v-1)(v-3)\cdots 4\cdot 2}{\pi {\sqrt {v}}(v-2)(v-4)\cdots 5\cdot 3}}}
Función de distribución Editar
La función de distribución puede ser escrita en términos de
I
{\displaystyle I}
, la función beta incompleta .
Para
x
>
0
{\displaystyle x>0}
F
X
(
x
)
=
∫
−
∞
x
f
(
u
)
d
u
=
1
−
1
2
I
x
(
t
)
(
v
2
,
1
2
)
{\displaystyle F_{X}(x)=\int _{-\infty }^{x}f(u)du=1-{\frac {1}{2}}I_{x(t)}\left({\frac {v}{2}},{\frac {1}{2}}\right)}
donde
x
(
t
)
=
v
t
2
+
v
{\displaystyle x(t)={\frac {v}{t^{2}+v}}}
Una fórmula alternativa, válida para
x
2
<
v
{\displaystyle x^{2}<v}
es
∫
−
∞
x
f
(
u
)
d
u
=
1
2
+
x
Γ
(
v
+
1
2
)
π
v
Γ
(
v
2
)
2
F
1
(
1
2
,
v
+
1
2
;
3
2
;
−
x
2
v
)
{\displaystyle \int _{-\infty }^{x}f(u)du={\frac {1}{2}}+x{\frac {\Gamma \left({\frac {v+1}{2}}\right)}{{\sqrt {\pi v}}\;\Gamma \left({\frac {v}{2}}\right)}}{}_{2}F_{1}\left({\frac {1}{2}},{\frac {v+1}{2}};{\frac {3}{2}};-{\frac {x^{2}}{v}}\right)}
donde
2
F
1
{\displaystyle {}_{2}F_{1}}
es un caso particular de la función hipergeométrica .
Casos particulares Editar
Ciertos valores de
v
{\displaystyle v}
dan una forma especial a la función de densidad y de distribución.
v
=
1
{\displaystyle v=1}
Función de densidad:
f
X
(
x
)
=
1
π
(
1
+
x
2
)
{\displaystyle f_{X}(x)={\frac {1}{\pi (1+x^{2})}}}
Función de distribución:
F
X
(
x
)
=
1
2
+
1
π
arctan
(
x
)
{\displaystyle F_{X}(x)={\frac {1}{2}}+{\frac {1}{\pi }}\arctan(x)}
Véase Distribución de Cauchy .
v
=
2
{\displaystyle v=2}
Función de densidad:
f
X
(
x
)
=
1
2
2
(
1
+
x
2
2
)
3
2
{\displaystyle f_{X}(x)={\frac {1}{2{\sqrt {2}}\left(1+{\frac {x^{2}}{2}}\right)^{\frac {3}{2}}}}}
Función de distribución:
F
X
(
x
)
=
1
2
+
x
2
2
1
+
x
2
2
{\displaystyle F_{X}(x)={\frac {1}{2}}+{\frac {x}{2{\sqrt {2}}{\sqrt {1+{\frac {x^{2}}{2}}}}}}}
v
=
3
{\displaystyle v=3}
Función de densidad:
f
X
(
x
)
=
2
π
3
(
1
+
x
2
3
)
2
{\displaystyle f_{X}(x)={\frac {2}{\pi {\sqrt {3}}\left(1+{\frac {x^{2}}{3}}\right)^{2}}}}
Función de distribución:
F
X
(
x
)
=
1
2
+
1
π
[
x
3
(
1
+
x
2
3
)
+
arctan
(
x
3
)
]
{\displaystyle F_{X}(x)={\frac {1}{2}}+{\frac {1}{\pi }}\left[{\frac {x}{{\sqrt {3}}\left(1+{\frac {x^{2}}{3}}\right)}}+\arctan \left({\frac {x}{\sqrt {3}}}\right)\right]}
v
=
∞
{\displaystyle v=\infty }
Función de densidad:
f
X
(
x
)
=
1
2
π
e
−
x
2
2
{\displaystyle f_{X}(x)={\frac {1}{\sqrt {2\pi }}}e^{-{\frac {x^{2}}{2}}}}
Véase Distribución normal .
Función de distribución:
F
X
(
x
)
=
1
2
[
1
+
erf
(
x
2
)
]
{\displaystyle F_{X}(x)={\frac {1}{2}}\left[1+\operatorname {erf} \left({\frac {x}{\sqrt {2}}}\right)\right]}
Véase Función error .
Caracterización Editar
Intervalos de confianza para muestras de la distribución normal Editar
Intervalo para la media cuando σ² es desconocida Editar
Sean
X
1
,
…
,
X
n
{\displaystyle X_{1},\dots ,X_{n}}
una muestra aleatoria proveniente de una población con distribución
N
(
μ
,
σ
2
)
{\displaystyle N(\mu ,\sigma ^{2})}
donde
μ
{\displaystyle \mu }
y
σ
{\displaystyle \sigma }
son desconocidos.
Se tiene que
X
¯
−
μ
σ
/
n
∼
N
(
0
,
1
)
{\displaystyle {\frac {{\overline {X}}-\mu }{\sigma /{\sqrt {n}}}}\sim N(0,1)}
y
(
n
−
1
)
S
2
σ
2
∼
χ
n
−
1
2
{\displaystyle {\frac {(n-1)S^{2}}{\sigma ^{2}}}\sim \chi _{n-1}^{2}}
son independientes entonces el cociente
X
¯
−
μ
σ
/
n
(
n
−
1
)
S
2
σ
2
n
−
1
∼
t
n
−
1
{\displaystyle {\frac {\frac {{\overline {X}}-\mu }{\sigma /{\sqrt {n}}}}{\sqrt {\frac {\frac {(n-1)S^{2}}{\sigma ^{2}}}{n-1}}}}\sim t_{n-1}}
esto es
X
¯
−
μ
S
/
n
∼
t
n
−
1
{\displaystyle {\frac {{\overline {X}}-\mu }{S/{\sqrt {n}}}}\sim t_{n-1}}
Sea
t
n
−
1
,
1
−
α
/
2
∈
R
{\displaystyle t_{n-1,1-\alpha /2}\in \mathbb {R} }
tal que
P
[
Y
≤
t
n
−
1
,
1
−
α
/
2
]
=
1
−
α
2
{\displaystyle \operatorname {P} [Y\leq t_{n-1,1-\alpha /2}]=1-{\frac {\alpha }{2}}}
siendo
Y
∼
t
n
−
1
{\displaystyle Y\sim t_{n-1}}
entonces
P
[
−
t
n
−
1
,
1
−
α
/
2
≤
X
¯
−
μ
S
/
n
≤
t
n
−
1
,
1
−
α
/
2
]
=
1
−
α
P
[
−
t
n
−
1
,
1
−
α
/
2
S
n
≤
X
¯
−
μ
≤
t
n
−
1
,
1
−
α
/
2
S
n
]
=
1
−
α
P
[
−
X
¯
−
t
n
−
1
,
1
−
α
/
2
S
n
≤
−
μ
≤
−
X
¯
+
t
n
−
1
,
1
−
α
/
2
S
n
]
=
1
−
α
P
[
X
¯
−
t
n
−
1
,
1
−
α
/
2
S
n
≤
μ
≤
X
¯
+
t
n
−
1
,
1
−
α
/
2
S
n
]
=
1
−
α
{\displaystyle {\begin{aligned}&\operatorname {P} \left[-t_{n-1,1-\alpha /2}\leq {\frac {{\overline {X}}-\mu }{S/{\sqrt {n}}}}\leq t_{n-1,1-\alpha /2}\right]=1-\alpha \\&\operatorname {P} \left[-t_{n-1,1-\alpha /2}\;{\frac {S}{\sqrt {n}}}\leq {\overline {X}}-\mu \leq t_{n-1,1-\alpha /2}\;{\frac {S}{\sqrt {n}}}\right]=1-\alpha \\&\operatorname {P} \left[-{\overline {X}}-t_{n-1,1-\alpha /2}\;{\frac {S}{\sqrt {n}}}\leq -\mu \leq -{\overline {X}}+t_{n-1,1-\alpha /2}\;{\frac {S}{\sqrt {n}}}\right]=1-\alpha \\&\operatorname {P} \left[{\overline {X}}-t_{n-1,1-\alpha /2}\;{\frac {S}{\sqrt {n}}}\leq \mu \leq {\overline {X}}+t_{n-1,1-\alpha /2}\;{\frac {S}{\sqrt {n}}}\right]=1-\alpha \\\end{aligned}}}
por lo tanto un intervalo de
(
1
−
α
)
100
%
{\displaystyle (1-\alpha )100\%}
de confianza para
μ
{\displaystyle \mu }
cuando
σ
2
{\displaystyle \sigma ^{2}}
es desconocida es
(
X
¯
−
t
n
−
1
,
1
−
α
/
2
S
n
,
X
¯
+
t
n
−
1
,
1
−
α
/
2
S
n
)
{\displaystyle \left({\overline {X}}-t_{n-1,1-\alpha /2}\;{\frac {S}{\sqrt {n}}},{\overline {X}}+t_{n-1,1-\alpha /2}\;{\frac {S}{\sqrt {n}}}\right)}
Distribución t de Student generalizada Editar
En términos del parámetro de escala σ̂ Editar
La distribución
t
{\displaystyle t}
de Student puede generalizarse a 3 parámetros, introduciendo un parámero locacional
μ
^
{\displaystyle {\widehat {\mu }}}
y un parámetro de escala
σ
^
{\displaystyle {\widehat {\sigma }}}
mediante la relación
X
=
μ
^
+
σ
^
T
{\displaystyle X={\widehat {\mu }}+{\widehat {\sigma }}\;T}
o
T
=
X
−
μ
^
σ
^
{\displaystyle T={\frac {X-{\widehat {\mu }}}{\widehat {\sigma }}}}
esto significa que
x
−
μ
^
σ
^
{\textstyle {\frac {x-{\widehat {\mu }}}{\widehat {\sigma }}}}
tiene la distribución clásica
t
{\displaystyle t}
de Student con
v
{\displaystyle v}
grados de libertad.
La resultante distribución
t
{\displaystyle t}
de Student no estandarizada tiene por función de densidad :[ 2]
p
(
x
|
ν
,
μ
^
,
σ
^
)
=
Γ
(
ν
+
1
2
)
Γ
(
ν
2
)
π
ν
σ
^
(
1
+
1
ν
(
x
−
μ
^
σ
^
)
2
)
−
ν
+
1
2
{\displaystyle p(x|\nu ,{\widehat {\mu }},{\widehat {\sigma }})={\frac {\Gamma ({\frac {\nu +1}{2}})}{\Gamma ({\frac {\nu }{2}}){\sqrt {\pi \nu }}{\widehat {\sigma }}}}\left(1+{\frac {1}{\nu }}\left({\frac {x-{\widehat {\mu }}}{\widehat {\sigma }}}\right)^{2}\right)^{-{\frac {\nu +1}{2}}}}
donde
σ
^
{\displaystyle {\widehat {\sigma }}}
no corresponde a la desviación estándar , esto es, no es la desviación estándar de la distribución escalada
t
{\displaystyle t}
, simplemente es parámetro de escala de la distribución.
La distribución puede ser escrita en términos de
σ
^
2
{\displaystyle {\widehat {\sigma }}^{2}}
, el cuadrado del parámetro de escala:
p
(
x
|
ν
,
μ
^
,
σ
^
2
)
=
Γ
(
ν
+
1
2
)
Γ
(
ν
2
)
π
ν
σ
^
2
(
1
+
1
ν
(
x
−
μ
^
)
2
σ
^
2
)
−
ν
+
1
2
{\displaystyle p(x|\nu ,{\widehat {\mu }},{\widehat {\sigma }}^{2})={\frac {\Gamma ({\frac {\nu +1}{2}})}{\Gamma ({\frac {\nu }{2}}){\sqrt {\pi \nu {\widehat {\sigma }}^{2}}}}}\left(1+{\frac {1}{\nu }}{\frac {(x-{\widehat {\mu }})^{2}}{{\widehat {\sigma }}^{2}}}\right)^{-{\frac {\nu +1}{2}}}}
Otras propiedades de esta versión de la distribución son:[ 2]
E
[
X
]
=
μ
^
para
ν
>
1
,
Var
(
X
)
=
σ
^
2
ν
ν
−
2
para
ν
>
2
,
Moda
(
X
)
=
μ
^
.
{\displaystyle {\begin{aligned}&\operatorname {E} [X]={\widehat {\mu }}\quad \quad \quad {\text{para }}\,\nu >1,\\&\operatorname {Var} (X)={\widehat {\sigma }}^{2}{\frac {\nu }{\nu -2}}\,\quad {\text{para }}\,\nu >2,\\&\operatorname {Moda} (X)={\widehat {\mu }}.\end{aligned}}}
En términos del parámetro inverso de escala λ Editar
Una parametrización alterna está en términos del parámetro inverso de escala
λ
{\displaystyle \lambda }
definido mediante la relación
λ
=
1
σ
^
2
{\textstyle \lambda ={\frac {1}{{\widehat {\sigma }}^{2}}}}
. La función de densidad está dada por:[ 2]
p
(
x
|
ν
,
μ
^
,
λ
)
=
Γ
(
ν
+
1
2
)
Γ
(
ν
2
)
(
λ
π
v
)
1
2
(
1
+
λ
(
x
−
μ
^
)
2
v
)
−
ν
+
1
2
{\displaystyle p(x|\nu ,{\widehat {\mu }},\lambda )={\frac {\Gamma ({\frac {\nu +1}{2}})}{\Gamma ({\frac {\nu }{2}})}}\left({\frac {\lambda }{\pi v}}\right)^{\frac {1}{2}}\left(1+{\frac {\lambda (x-{\widehat {\mu }})^{2}}{v}}\right)^{-{\frac {\nu +1}{2}}}}
Otras propiedades de esta versión de la distribución son:[ 2]
E
[
X
]
=
μ
^
para
ν
>
1
,
Var
(
X
)
=
1
λ
ν
ν
−
2
para
ν
>
2
,
Moda
(
X
)
=
μ
^
.
{\displaystyle {\begin{aligned}&\operatorname {E} [X]={\widehat {\mu }}\quad \quad \quad {\text{para }}\,\nu >1,\\&\operatorname {Var} (X)={\frac {1}{\lambda }}{\frac {\nu }{\nu -2}}\,\quad {\text{para }}\,\nu >2,\\&\operatorname {Moda} (X)={\widehat {\mu }}.\end{aligned}}}
Distribuciones relacionadas Editar
Si
X
∼
t
v
{\displaystyle X\sim t_{v}}
entonces
X
2
∼
F
1
,
v
{\displaystyle X^{2}\sim \operatorname {F} _{1,v}}
donde
F
1
,
v
{\displaystyle \operatorname {F} _{1,v}}
denota la distribución F con
1
{\displaystyle 1}
y
v
{\displaystyle v}
grados de libertad.
Véase también Editar
Enlaces externos Editar