Transformación Box-Cox

Las transformaciones de Box y Cox son una familia de transformaciones potenciales usadas en estadística para corregir sesgos en la distribución de errores, para corregir varianzas desiguales (para diferentes valores de la variable predictora) y principalmente para corregir la no linealidad en la relación (mejorar correlación entre las variables). Esta transformación recibe el nombre de los estadísticos George E. P. Box y David Cox.

Definición editar

La transformación potencial está definida como una función continua que varía con respecto a la potencia lambda ( ). Para los datos (Y1,..., Yn). se calcula la transformación   de la siguiente manera:[1]

 

K2 es la media geométrica[2]​ de los valores Y1, ..., Yn.

 

y K1 es un parámetro que depende de K2 y de  , así:

 

Procedimiento para la transformación editar

Para llevar a cabo una transformación potencial, dado un valor de lambda  , se calcula primero la media geométrica de los valores Y1 (K2). Después se sustituye este valor para calcular el parámetro K1.


Procedimiento para la selección del mejor valor de editar

Primero se deben seleccionar el rango de valores de lambda   de los cuales se quiere seleccionar el que logra que la transformación se acerque al máximo a los datos. Para cada valor de   se realiza la transformación del paso anterior. Finalmente se sustituyen los valores de la o las variables explicativas en las diferentes funciones y se calculan los cuadrados de los residuales estadísticos. Aquella que tenga el menor valor de la suma de residuales será la mejor opción. Note que K2 es un valor fijo para todos los casos y que sólo hay que calcular de nuevo el valor K1.

Referencias editar

  1. Neter, J. et al. (1996) Applied Linear Statistical Models. McGrawHill
  2. http://mathworld.wolfram.com/GeometricMean.html