En estadística, un gráfico Q-Q ("Q" viene de cuantil) es un método gráfico para el diagnóstico de diferencias entre la distribución de probabilidad de una población de la que se ha extraído una muestra aleatoria y una distribución usada para la comparación. Una forma básica de gráfico surge cuando la distribución para la comparación es una distribución teórica.[1]​ No obstante, puede usarse la misma idea para comparar las distribuciones inferidas directamente de dos conjuntos de observaciones, donde los tamaños de las muestras sean distintos.[2]

Un gráfico Q-Q normal de datos exp(1) generados aleatoriamente.
Un gráfico Q-Q normal de datos N(0,1) generados aleatoriamente.

Un ejemplo del tipo de diferencias que pueden comprobarse es la no-normalidad de la distribución de una variable en una población. Para una muestra de tamaño n, se dibujan n puntos con los (n+1)-cuantiles de la distribución de comparación, por ejemplo, la distribución normal, en el eje horizontal el estadístico de k-ésimo orden, (para k = 1, ..., n) de la muestra en el eje vertical. Si la distribución de la variable es la misma que la distribución de comparación se obtendrá, aproximadamente, una línea recta, especialmente cerca de su centro. En el caso de que se den desviaciones sustanciales de la linealidad, los estadísticos rechazan la hipótesis nula de similitud.

Representación gráfica editar

Para los cuantiles de la distribución de comparación se usa habitualmente la fórmula  . Hay varias fórmulas diferentes que se han usado o propuesto para representaciones gráficas simétricas. Tales fórmulas tienen la forma  , para algún valor de a entre 0 y  . La expresión de arriba,   es sólo un ejemplo de estas fórmulas, para a = 0. Otras expresiones incluyen:

  •  [3]
  •  [4]
  •  [5]
  •  [6]
  •  [7]

Para grandes tamaños muestrales, n, hay muy poca diferencia entre todas estas expresiones.

Relación con gráficas de probabilidad editar

Los gráficos Q-Q son similares a los gráficos de probabilidad (que para una distribución normal se llaman gráficos de probabilidad normal o gráficos rankit). La diferencia es que en un gráfico de probabilidad, en lugar de usar el cuantil de la distribución como eje X, se usa la esperanza matemática del estadístico de k-ésimo orden de la distribución. Sólo cuando n es pequeño hay una diferencia sustancial entre un gráfico Q-Q y un gráfico de probabilidad.

Véase también editar

Notas editar

  1. Gnanadesikan (1977) p199.
  2. Cleveland (1994), p144.
  3. A simple (and easy to remember) formula for plotting positions.
  4. Engineering Statistics Handbook: Normal Probability Plot Nótese que aquí también se usa una expresión diferente para el primer y último puntos. [1] cita el trabajo original de Filliben, en 1975.
  5. Distribution free plotting position, Yu & Huang
  6. Esta es una aproximación inicial de Blom en 1953 y se trata de la expresión usada en Minitab.
  7. Esta gráfica fue usada por Gringorten en 1963 para dibujar puntos en tests de la distribución de Gumbel.

Referencias editar

  • Cleveland, W.S. (1994) The Elements of Graphing Data, Hobart Press ISBN 0-9634884-1-4
  • Gnanadesikan, R. (1977) Methods for Statistical Analysis of Multivariate Observations, Wiley ISBN 0-471-30845-5.
  • Wilk, M.B., Gnanadesikan, R. (1968) Probability plotting methods for the analysis of data. Biometrika, 55, 1–17.

Enlaces externos editar