Coeficiente de correlación de Pearson

Valor adimensional que expresa la relación entre dos variables estadísticas.

En estadística, el coeficiente de correlación de Pearson es una medida de dependencia lineal entre dos variables aleatorias cuantitativas. A diferencia de la covarianza, la correlación de Pearson es independiente de la escala de medida de las variables.

Ejemplos de diagramas de dispersión con diferentes valores del coeficiente de correlación

De manera menos formal, podemos definir el coeficiente de correlación de Pearson como un índice que puede utilizarse para medir el grado de relación de dos variables siempre y cuando ambas sean cuantitativas y continuas.

DefiniciónEditar

Sean   y   dos variables aleatorias sobre una población; el coeficiente de correlación de Pearson denotado por   se define como

 

Donde:

  •   es la covarianza de  
  •   es la desviación estándar de la variable  
  •   es la desviación estándar de la variable  

De manera análoga podemos calcular este coeficiente sobre un estadístico muestral, denotado por   como

 

InterpretaciónEditar

 
Varios grupos de puntos  , con el coeficiente de correlación para cada grupo. Nótese que la correlación refleja la no linealidad y la dirección de la relación lineal. En la figura del centro, la varianza de y es nula, por lo que la correlación es indeterminada.

El valor del índice de correlación varía en el intervalo  , indicando el signo el sentido de la relación:

  • Si  , existe una correlación positiva perfecta. El índice indica una dependencia total entre las dos variables denominada relación directa: cuando una de ellas aumenta, la otra también lo hace en proporción constante.
  • Si   entonces existe una correlación positiva.
  • Si   entonces no existe relación lineal pero esto no necesariamente implica que las variables son independientes: pueden existir todavía relaciones no lineales entre las dos variables.
  • Si  , existe una correlación negativa.
  • Si  , existe una correlación negativa perfecta. El índice indica una dependencia total entre las dos variables llamada relación inversa: cuando una de ellas aumenta, la otra disminuye en proporción constante.

Véase tambiénEditar

Enlaces externosEditar