En estadística, la prueba de Levene[1]​ es una prueba estadística inferencial utilizada para evaluar la igualdad de las varianzas para una variable calculada para dos o más grupos. Algunos procedimientos estadísticos comunes asumen que las varianzas de las poblaciones de las que se extraen diferentes muestras son iguales. La prueba de Levene evalúa este supuesto. Se pone a prueba la hipótesis nula de que las varianzas poblacionales son iguales (llamado homogeneidad de varianza ú homocedasticidad). Si el P-valor resultante de la prueba de Levene es inferior a un cierto nivel de significación (típicamente 0.05), es poco probable que las diferencias obtenidas en las variaciones de la muestra se hayan producido sobre la base de un muestreo aleatorio de una población con varianzas iguales. Por lo tanto, la hipótesis nula de igualdad de varianzas se rechaza y se concluye que hay una diferencia entre las variaciones en la población.

Algunos de los procedimientos que asumen normalmente homocedasticidad, para lo cual uno puede utilizar las pruebas de Levene, incluyen análisis de varianza y pruebas t.

La prueba de Levene se utiliza a menudo antes de que una comparación de medias. Cuando la prueba de Levene muestra significación, se debe cambiar a pruebas generalizadas (pruebas no paramétricas), libre de supuestos de homocedasticidad.

La prueba también puede ser utilizada como una prueba principal para responder a una pregunta independiente de si dos sub-muestras en una población dada tienen varianzas iguales o diferentes.

Definición editar

La estadística de prueba, W, se define como sigue:

 

donde

  •   es el resultado de la prueba
  •   es el número de diferentes grupos a los que pertenecen los casos muestreados,
  •   es el número total de casos en todos los grupos,
  •   es el número de casos en el grupo  ,
  •   es el valor de la variable medida para el  esimo caso del  esimo grupo,
  •  

(Ambas definiciones se encuentran en uso, aunque el segundo es, en sentido estricto, la prueba de Brown-Forsythe - ver más abajo para la comparación)

  •   es la media de  ,
  •   es la media de   para el grupo  .

La significancia de   es probada contra   donde   es un cuantil de la prueba F de distribución, con   and   son los grados de libertad, y   es el nivel de significación elegido (por lo general 0.05 o 0.01).

Comparación con la prueba de Brown- Forsythe editar

La prueba Brown-Forsythe utiliza la mediana en lugar de la media en el cálculo de la propagación dentro de cada grupo (  vs.  , arriba). Aunque la elección óptima depende de la distribución subyacente, se recomienda la definición basada en la mediana como la elección que ofrece buena robustez frente a muchos tipos de datos no normales al tiempo que conserva un buen poder estadístico. Si uno tiene conocimiento de la distribución subyacente de los datos, esto puede indicar el uso de una de las otras opciones. Brown y Forsythe realizaron estudios de Monte Carlo que indicaban que el uso de la Media truncada funcionaba mejor cuando los datos subyacentes seguían una distribución de Cauchy (una distribución de cola gruesa) y la mediana funcionaba mejor cuando los datos subyacentes seguían una Distribución χ² con cuatro grados de libertad (una distribución muy sesgada ). Usar la media proporcionó la mejor potencia para distribuciones simétricas, de cola moderada.

Referencias editar

  1. Levene, Howard (1960). «Robust tests for equality of variances». En Ingram Olkin, Harold Hotelling, et alia, ed. Stanford University Press. pp. 278-292.