Diferencia entre revisiones de «Función de distribución»

Contenido eliminado Contenido añadido
Correción de Fórmulas
Sin resumen de edición
Línea 1:
[[Archivo:Normal Distribution CDF.svg|thumb|300px|Función de Distribución Acumulativa para la distribución normal en la siguiente imagen]]
[[Archivo:Normal Distribution PDF.svg|thumb|300px|Función de Densidad de Probabilidad para varias distribuciones normales. El trazo rojo distingue la distribución normal estándar.]]
En la [[teoría de la probabilidad]] y en [[estadística]], la '''función de distribución acumulada''' ('''FDA,''' designada también a veces simplemente como '''función de distribución''' o '''FD''') o función de probabilidad acumulada asociada a una [[variable aleatoria]] [[Número real|real]] <math>X</math> sujeta a cierta ley de [[distribución de probabilidad]], es una función matemática de la variable real <math>x</math> que describe la [[probabilidad]] de que <math>X</math> tenga un valor ''menor o igual'' que <math>x</math>.<br>Intuitivamente, asumiendo la función <math>f</math> como la ley de [[distribución de probabilidad]], la FDA sería la función con la recta real como dominio, con imagen del ''área hasta aquí'' de la función <math>f</math>, siendo ''aquí'' el valor ''x'' para la [[variable aleatoria]] [[Número real|real]] <math>X</math>.<br>La FDA asocia a cada valor ''x'', la probabilidad del [[Evento estadístico|''evento'']]: «la variable <math>X</math> toma valores menores o iguales a x».<br>El concepto de FDA puede generalizarse para modelar [[variable aleatoria|variables aleatorias]] [[Vector aleatorio|multivariantes]] definidas en <math>\mathbb{R}^n</math> <hr>Para cada número real <math>x</math>, una FDA está dada por la siguiente definición:<ref name="Monti">
{{cita publicación|autor=Monti, K.L.|páginas=342–345|año=1995|título=Folded Empirical Distribution Function Curves (Mountain Plots) |publicación=The American Statistician|volumen=49|jstor=2684570}}</ref><br>
 
== Definición ==
{| clas="wikitable"
Sean <math>(\Omega,\mathcal{F},\operatorname{P})</math> un espacio de probabilidad y <math>X:\Omega\to\mathbb{R}</math> una [[variable aleatoria]], la función de distribución acumulada de la variable aleatoria <math>X</math> es una función <math>F:\mathbb{R}\to[0,1]</math> definida como
|-
! En [[fórmula (expresión)|lenguaje matemático]] !! Interpretación
|-
| <math>F(x) = \operatorname{P}(X\leq x),</math> || Una función de nombre '''F''' le asigna a cada valor real ''x'', el de la [[probabilidad]] de que una [[variable aleatoria]] ''X'' asuma un valor inferior o igual a ''x''.
|}
 
:<math>F(x)=\operatorname{P}[X\leq x]</math>
La probabilidad de que <math>X</math> se sitúe en un intervalo <math>(a,b]</math> (abierto en <math>a</math> y cerrado en <math>b</math>) es <math>F(b)-F(a)</math> si <math>a\leq b</math>.
 
La función de distribución evaluada en un número <math>x</math> cualquiera es la probabilidad de que la variable aleatoria tome un valor menor o igual a <math>x</math>.
<center><math>
\operatorname{P}(a< X\leq b)\ =\ F_X(b)-F_X(a).
</math></center>
 
La FDAfunción de unadistribución [[probabilidad]]acumulada <math>\operatorname{P}F</math> definidapuede sobreobtenerse ela [[Álgebrapartir de Borel|espacio boreliano]] <math>\mathcal B(\R)</math> es la función <math>\de F</math> que a todo realprobabilidad <math> xf</math> le asocia .
<center><math>
F(x)=\operatorname{P}([-\infty, x]).
</math></center>
 
=== Notación ===
== Acumulada y distribuida ==
En ocasiones, se utiliza la notación <math>F_X(x)</math> para especificar que se trata de la función de distribución de una variable aleatoria <math>X</math> aunque por simplicidad suele escribirse <math>F(x)</math>.
Es convención usar una <math>F</math> mayúscula para una FDA, en contraste con la <math>f</math> minúscula usada para una [[función de densidad de probabilidad]] (FDP) o para una [[función de probabilidad]].
 
=== Caso Discreto ===
La función [[Distribución de probabilidad#Distribuciones de variable discreta|distribución]] puede obtenerse a partir de la [[función de probabilidad]] respectiva.
Si <math>X</math> es una variable aleatoria discreta con [[función de probabilidad]] <math>f(x)</math> entonces la función de distribución acumulada se calcula como
 
:<math>F(x)=\operatorname{P}[X\leq x]=\sum_{u\leq x}f(u)</math>
La FDA en el caso de una [[variable aleatoria]] <math>X</math> [[Variable discreta y variable continua|discreta]], puede establecerse como:
 
=== Caso Continuo ===
<math>F(x) = \sum_{x_i \leq x}^{}f(x_i)</math>
Si <math>X</math> es una variable aleatoria continua con [[Función de densidad de probabilidad|función de densidad]] <math>f(x)</math> entonces la función de distribución acumulada se calcula como
 
:<math>F(x)=\operatorname{P}[X\leq x]=\int_{-\infty}^xf(u)du</math>
Para una [[variable aleatoria]] <math>X</math> [[Distribución de probabilidad continua|continua]], la FDA y la FDP están relacionadas mediante:
 
== Propiedades ==
<math>F(x) = \int_{-\infty}^{x}f(t)\,dt</math>
Una función de distribución acumulada <math>F(x)</math> asociada a la variable aleatoria <math>X</math> satisface
 
# <math> 0\leq F(x)\leq 1 </math>.
# <math>\lim_{x\to\infty}F(x)=1</math>.
# <math>\lim_{x\to-\infty}F(x)=0</math>.
# Es monótona no decreciente, es decir, si <math>x_1\leq x_2</math> entonces <math>F(x_1)\leq F(x_2)</math>.
# Es continua por la derecha, es decir, <math>\lim_{x\to a^+}F(x)=F(a^+)</math>.
 
Si <math>a\leq b</math> puede demostrarse que
Debe observarse que una definición del tipo «menor o igual», '≤' podría sustituirse por estrictamente «[[menor]]» '<'. Esto produciría una función diferente, pero cualquiera de las funciones '''F''' puede deducirse a partir de la otra '''f'''.<br>También se podría cambiar por una determinada por ''mayor'' ('''>''') en lugar de ''menor'' '<' y deducir las propiedades de esta nueva función.<br>Solo es preciso ajustar las formulaciones y definiciones a lo pretendido en cada caso.<br>En países de lengua inglesa, una convención es usar una desigualdad de este tipo ''≤'' en lugar de una desigualdad estricta (<), por ejemplo.
 
* <math>\operatorname{P}(X < a) = F(a^-)</math>
 
*<math>\operatorname{P}(X > a) = 1 - F(a)</math>
*<math>\operatorname{P}(X \ge a) = 1 - F(a^-)</math>
*<math>\operatorname{P}(a < X < b) = F(b^-) - F(a)</math>
*<math>\operatorname{P}(a \le X < b) = F(b^-) - F(a^-)</math>
*<math>\operatorname{P}(a \le X \le b) = F(b) - F(a^-)</math>
Si <math>X</math> es una variable aleatoria continua entonces <math>F(x)</math> se dice que es absolutamente continua por lo que
 
:<math>\operatorname{P}(a \le X \le b) = \operatorname{P}(a \le X < b) = \operatorname{P}(a < X \le b) = \operatorname{P}(a < X < b) = \int_{a}^{b}f(x)\,dx = F(b)- F(a)</math>
 
== Ejemplos ==
* La FDA de una variable aleatoria <math>X</math>'','' [[Distribucióncon distribución uniforme continua|uniformemente distribuida]] en el [[intervalo unitario]] <math>[0,1]</math> queda definida por:
:''F''(''x'') = 0, si ''x'' < 0;
:''F''(''x'') = ''x'', si 0 &le; ''x'' &le; 1;
:''F''(''x'') = 1, si ''x'' > 1.
 
:<math>F(x)=
Si <math>X</math> toma solo los valores 0 y 1, con igual probabilidad (<math>X</math> sigue una [[distribución de Bernoulli]] con <math>p=1/2</math>). Entonces su FDA viene dada por
\begin{cases}
0 & x\leq0 \\
x & 0<x<1 \\
1 & x\geq1
\end{cases}</math>
 
Si <math>X</math> es una variable aleatoria con distribución exponencial con parámetro <math>\lambda</math>, es decir, <math>X\sim\operatorname{Exp}(\lambda)</math> tiene como función de distribución acumulada la función
:''F''(''x'') = 0, si ''x'' < 0;
:''F''(''x'') = 1/2, si 0 &le; ''x'' < 1;
:''F''(''x'') = 1, si ''x'' &ge; 1.
 
:<math>F(x)=
== Notación ==
\begin{cases}
Cuando hay más de una [[variable aleatoria]] y se vuelve necesario explicitar una diferencia entre las funciones, se designa la FDA de la [[variable aleatoria]] <math>X</math> por <math>\operatorname{F}_{X}(x)</math>.
1-e^{-\lambda x} & x>0 \\
0 & \text{en otro caso}
\end{cases}</math>
 
== Función de distribuciónDistribución acumuladaAcumulada inversaInversa ([[función cuantil]]) ==
La [[función cuantil]] de una [[variable aleatoria]] (o de una ley de probabilidad) es la inversa de su acumulada.<br>Si la FDA ''<math>F''</math> es estrictamente creciente y continua, su inversa está definida <math> F^{-1}( y ), y \in [0,1] </math> es el único número real <math> x </math> tal que <math> F(x) = y </math>.<br>
Solo en tales casos queda así definida la '''función de distribución inversa''' o [[función cuantil]].
Pero una función de distribución se mantiene constante en todo intervalo en el cual la variable aleatoria no puede tomar valores. Es por esto que se introduce la siguiente definición.
Línea 66 ⟶ 79:
 
La inversa de la pda puede emplearse para trasladar resultados obtenidos para la distribución uniforme a otras distribuciones.
 
=== Propiedades útiles de la inversa de pda ===
# <math>F^{-1}</math> es no-decreciente
# <math>F^{-1}(F(x)) \leq x</math>
# <math>F(F^{-1}(y)) \geq y</math>
# <math>F^{-1}(y) \leq x</math> si y solo si <math>y \leq F(x)</math>
# Si <math>Y</math> tiene una distribución <math>U[0, 1]</math> entonces, <math>F^{-1}(Y)</math> está distribuida como <math>F</math>. Esto se emplea en para la generación aleatoria de números con el método de muestreo de transformada inversa.
# Si <math>\{X_\alpha\}</math> es una colección de variables independentes aleatoriamente distribuidas <math>F</math>-definida en el mismo espacio muestral, entonces existen variables aleatorias <math>Y_\alpha</math> tales que <math>Y_\alpha</math> está distribuida como <math>U[0,1]</math> y <math>F^{-1}(Y_\alpha) = X_\alpha</math> como probabilidad 1 para todo <math>\alpha</math>.<br>
:*Ejemplo 1: La mediana es <math>F^{-1}( 0.5 )</math>.
:*Ejemplo 2: Sea <math> \tau = F^{-1}( 0.95 ) </math>. Se denominará <math> \tau </math> al 95.º percentil.
 
Por convención, podemos decidir que <math>Q_X(0)</math> es el menor de los valores posibles de <math>X</math> y <math>Q_X(1)</math> es el mayor; pueden ser eventualmente infinitos.
 
== Propiedades ==
Si <math>X</math> es una [[variable aleatoria]] [[Variable discreta y variable continua|discreta]], para la que los valores ''x''<sub>1</sub>, ''x''<sub>2</sub>, …, tienen probabilidades ''p''<sub>1</sub>, ''p''<sub>2</sub>, etc., la FDA de <math>X</math> será discontinua en los puntos ''x''<sub>''i''</sub> y constante entre ellos.
 
Si la FDA ''F'' de <math>X</math> es [[Distribución de probabilidad continua|continua]], entonces <math>X</math> es una [[variable aleatoria]] [[Distribución de probabilidad continua|continua;]] si se dice de ''F'' que es absolutamente [[Distribución de probabilidad continua|continua]], entonces existe una función [[Integral de Lebesgue ]] ''f''(''x'') tal que
 
:<math>F(b)-F(a) = \operatorname{P}(a\leq X\leq b) = \int_a^b f(x)\,dx</math>
 
para todos los números reales ''a'' y ''b''. (La primera de las dos igualdades no sería correcta en general si no se hubiera dicho que una distribución es [[Distribución de probabilidad continua|continua]].<br>La [[Distribución de probabilidad continua|continuidad de la distribución]] implica que P(''X'' = ''a'') = P(''X'' = ''b'') = 0, de modo que una diferencia entre "<" y "&le;" deja de ser importante en este contexto). Una función ''f'' es igual a la [[derivada]] de ''F'' (casi en toda parte), y es llamada [[función de densidad de probabilidad]] de la distribución de <math>X</math>.
 
Para cualquier función de distribución <math>F</math>, debe ser:
 
*<math>0 \le F(x) \le 1</math>
*<math>F</math> es no decreciente (creciente o constante): <math>x_1 < x_2 \Rightarrow F(x_1) \le F(x_2)</math>
*<math>F(-\infty) = \lim_{x \to -\infty} F(x) = 0</math>
*<math>F(+\infty) = \lim_{x \to +\infty} F(x) = 1</math>
*<math>F</math> es continua a la derecha: <math>F(a^+) = \lim_{x \to a^+}F(x) = F(a)</math>
*<math>\operatorname{P}(x=a) = F(a) - F(a^-)</math>
*<math>\operatorname{P}(a < x \le b) = F(b) - F(a)</math>, con <math>a,b \in \mathbb{R}</math>, y <math>a < b</math>
 
Se cumplen las siguientes propiedades, que permiten tratar con los diferentes tipos de desigualdades, y que se aplican a [[Distribución de probabilidad|funciones de distribución]] de [[variable aleatoria|variables aleatorias]] [[Variable discreta y variable continua|discretas]]:
 
*<math>\operatorname{P}(X < b) = F(b^-)</math>
*<math>\operatorname{P}(X > a) = 1 - F(a)</math>
*<math>\operatorname{P}(X \ge a) = 1 - F(a^-)</math>
*<math>\operatorname{P}(a < X < b) = F(b^-) - F(a)</math>
*<math>\operatorname{P}(a \le X < b) = F(b^-) - F(a^-)</math>
*<math>\operatorname{P}(a \le X \le b) = F(b) - F(a^-)</math>
 
En caso de las [[variable aleatoria|variables aleatorias]] [[Distribución de probabilidad continua|continuas]], valen las siguientes propiedades:
 
*<math>F</math> es continua en todos los puntos (en caso de las [[variable aleatoria|variables aleatorias]] [[Variable discreta y variable continua|discretas]] era solo continua a la derecha)
*<math>\operatorname{P}(x = a) = \int_{a}^{a}f(x)\,dx = 0</math>
*<math>\operatorname{P}(a \le X \le b) = \operatorname{P}(a \le X < b) = \operatorname{P}(a < X \le b) = \operatorname{P}(a < X < b) = \int_{a}^{b}f(x)\,dx = F(b)- F(a)</math>
 
La [[prueba de Kolmogórov-Smirnov]] está basada en funciones de distribución acumulada y puede ser usada para ver si dos distribuciones empíricas son diferentes o si una distribución empírica es diferente de una distribución ideal.<br>Muy relacionada con la [[:en:Kuiper's test|prueba de Kuiper]], la cual es útil si el dominio de la distribución es cíclico como por ejemplo en días de la semana. Por ejemplo podemos usar el [[:en:Kuiper's test| test de Kuiper]] para ver si el número de [[Tornado|tornados]] varía durante el año o si las ventas de un producto oscilan día a día o por día del mes.
 
== Véase también ==