Transformación Box-Cox

Las transformaciones de Box y Cox son una familia de transformaciones potenciales usadas en estadística para corregir sesgos en la distribución de errores, para corregir varianzas desiguales (para diferentes valores de la variable predictora) y principalmente para corregir la no linealidad en la relación (mejorar correlación entre las variables). Esta transformación recibe el nombre de los estadísticos George E. P. Box y David Cox.

Definición editar

La transformación potencial está definida como una función continua que varía con respecto a la potencia lambda ( $\lambda$ ). Para los datos (Y₁,..., Y_n). se calcula la transformación $Y_{i}^{(\lambda )}$ de la siguiente manera:^[1]

$Y_{i}^{(\lambda )}={\begin{cases}K_{1}(Y_{i}^{\lambda }-1)&\mathrm {si} \ \lambda \neq 0,\\\\K_{2}\ln(Y_{i})&\mathrm {si} \ \lambda =0\end{cases}}$

K₂ es la media geométrica^[2] de los valores Y₁, ..., Y_n.

$K_{2}={\bigg (}\prod _{i=1}^{n}Y_{i}{\bigg )}^{1/n}=(Y_{1}\cdot Y_{2}\cdot \dots \cdot Y_{n})^{1/n}$

y K₁ es un parámetro que depende de K₂ y de $\lambda$ , así:

$K_{1}={\dfrac {1}{\lambda \cdot K_{2}^{\lambda -1}}}$

Procedimiento para la transformación editar

Para llevar a cabo una transformación potencial, dado un valor de lambda $\lambda$ , se calcula primero la media geométrica de los valores Y₁ (K₂). Después se sustituye este valor para calcular el parámetro K₁.

Procedimiento para la selección del mejor valor de $\lambda$ editar

Primero se deben seleccionar el rango de valores de lambda $\lambda$ de los cuales se quiere seleccionar el que logra que la transformación se acerque al máximo a los datos. Para cada valor de $\lambda$ se realiza la transformación del paso anterior. Finalmente se sustituyen los valores de la o las variables explicativas en las diferentes funciones y se calculan los cuadrados de los residuales estadísticos. Aquella que tenga el menor valor de la suma de residuales será la mejor opción. Note que K₂ es un valor fijo para todos los casos y que sólo hay que calcular de nuevo el valor K₁.

Referencias editar

↑ Neter, J. et al. (1996) Applied Linear Statistical Models. McGrawHill
↑ http://mathworld.wolfram.com/GeometricMean.html

Datos: Q27032458

[1] Neter, J. et al. (1996) Applied Linear Statistical Models. McGrawHill

[2] ttp://mathworld.wolfram.com/GeometricMean.html

[1]

[2]

Transformación Box-Cox

Definición editar

Procedimiento para la transformación editar

Procedimiento para la selección del mejor valor de λ {\displaystyle \lambda } editar

Referencias editar

Procedimiento para la selección del mejor valor de $\lambda$ editar