Regresión semiparamétrica

En estadística, la regresión semiparamétrica es una regresión que combina modelos paramétricos y no paramétricos. Se utiliza a menudo en situaciones en las que el modelo no paramétrico no puede funcionar totalmente bien, o cuando el investigador quiere usar un modelo paramétrico, pero la forma funcional con respecto a un subconjunto de los regresores o la densidad de los errores no se conoce. Los modelos de regresión paramétricos son un tipo particular del modelado semiparamétrico, ya que los modelos semiparamétricos contienen un componente paramétrico.

Estimación

editar

Se han propuesto y desarrollado muchos métodos de regresión semiparamétricos diferentes. Los métodos más conocidos son los modelos parcialmente lineales, índices y de coeficientes variables.

Modelos parcialmente lineales

editar

Un modelo parcialmente lineal está dado por:

 

donde   es la variable dependiente,   y   son   un vector de variables explicatorias,   es un   vector parámetros desconocidos y  . La parte paramétrica del modelo parcialmente lineal está dada por el vector de parámetros   mientras que la parte no paramétrico es la función desconocida  . Los datos se supone que es iid con   y el modelo permite una condicionalmente heteroscedasticos proceso de error   forma de desconocido. Este tipo de modelo fue propuesto por Robinson (1988) y se extendió a manejar covariables categóricas de Racine y Liu (2007).

Este método se implementa mediante la obtención de un   estimador consistente de   y luego derivar un estimador de   de la regresión no paramétrica de   en   utilizando un método de regresión no paramétrica apropiada.[1]

Modelos de indexación

editar

Un modelo de índice único toma la forma:

 

donde  ,   y   fueron definidos anteriormente y el término de error   satisface  . El modelo único índice toma su nombre de la parte paramétrica del modelo de   ue es un solo índice escalar. La parte no paramétrica es la función desconocida  .

El método de Ichimura

editar

El método de modelo de índice único desarrollado por Ichimura (1993) es la siguiente. Tenga en cuenta la situación en la que   es continua. Dada una forma conocida para la función  ,   podría ser estimado utilizando el método de mínimos cuadrados no lineales para reducir la función al mínimo.

 

Dado que la forma funcional de   no se sabe, hay que estimarla. Para un valor dado de   una estimación de la función

 

usando kernel método. Ichimura (1993) propone estimar   con

 

la licencia-un-out kernel no paramétrico estimador de  ..

Estimador de Klein y Spady

editar

Si la variable dependiente   es binaria y   and   se supone que son independientes, Klein y Spady (1993) proponen una técnica para estimar   utilizando métodos de máxima verosimilitud. La función de verosimilitud viene dada por:

 

donde   es la licencia-un-out estimador.

Coeficiente de Smooth / variando modelos de coeficientes

editar

Hastie y Tibshirani (1993) proponen un modelo de coeficiente lisa dada por:

 

donde   is a   vector and   es un vector de funciones suaves no especificadas de  .

  puede ser expresado como:

 

Referencias

editar
  1. See Li and Racine (2007) for an in depth look at nonparametric regression methods.
  • Racine, J.S.; Qui, L. (2007). «A Partially Linear Kernel Estimator for Categorical Data». Unpublished Manuscript, Mcmaster University. 
  • Hastie, T.; R. Tibshirani (1993). «Varying-Coefficient Models». Journal of the Royal Statistical Society, Series B 55: 757-796.