Regresión semiparamétrica

En estadística, la regresión semiparamétrica es una regresión que combina modelos paramétricos y no paramétricos. Se utiliza a menudo en situaciones en las que el modelo no paramétrico no puede funcionar totalmente bien, o cuando el investigador quiere usar un modelo paramétrico, pero la forma funcional con respecto a un subconjunto de los regresores o la densidad de los errores no se conoce. Los modelos de regresión paramétricos son un tipo particular del modelado semiparamétrico, ya que los modelos semiparamétricos contienen un componente paramétrico.

Estimación

Se han propuesto y desarrollado muchos métodos de regresión semiparamétricos diferentes. Los métodos más conocidos son los modelos parcialmente lineales, índices y de coeficientes variables.

Modelos parcialmente lineales

Un modelo parcialmente lineal está dado por:

Y_{i}=X'_{i}\beta +g\left(Z_{i}\right)+u_{i},\,\quad i=1,\ldots ,n,\,

donde $Y_{i}$ es la variable dependiente, $X_{i}$ y $Z_{i}$ son $p\times 1$ un vector de variables explicatorias, $\beta$ es un $p\times 1$ vector parámetros desconocidos y $Z_{i}\in \operatorname {R} ^{q}$ . La parte paramétrica del modelo parcialmente lineal está dada por el vector de parámetros $\beta$ mientras que la parte no paramétrico es la función desconocida $g\left(Z_{i}\right)$ . Los datos se supone que es iid con $E\left(u_{i}|X_{i},Z_{i}\right)=0$ y el modelo permite una condicionalmente heteroscedasticos proceso de error $E\left(u_{i}^{2}|x,z\right)=\sigma ^{2}\left(x,z\right)$ forma de desconocido. Este tipo de modelo fue propuesto por Robinson (1988) y se extendió a manejar covariables categóricas de Racine y Liu (2007).

Este método se implementa mediante la obtención de un ${\sqrt {n}}$ estimador consistente de $\beta$ y luego derivar un estimador de $g\left(Z_{i}\right)$ de la regresión no paramétrica de $Y_{i}-X'_{i}{\hat {\beta }}$ en $z$ utilizando un método de regresión no paramétrica apropiada.^[1]

Modelos de indexación

Un modelo de índice único toma la forma:

Y=g\left(X'\beta _{0}\right)+u,\,

donde $Y$ , $X$ y $\beta _{0}$ fueron definidos anteriormente y el término de error $u$ satisface $E\left(u|X\right)=0$ . El modelo único índice toma su nombre de la parte paramétrica del modelo de $x'\beta$ ue es un solo índice escalar. La parte no paramétrica es la función desconocida $g\left(\cdot \right)$ .

El método de Ichimura

El método de modelo de índice único desarrollado por Ichimura (1993) es la siguiente. Tenga en cuenta la situación en la que $y$ es continua. Dada una forma conocida para la función $g\left(\cdot \right)$ , $\beta _{0}$ podría ser estimado utilizando el método de mínimos cuadrados no lineales para reducir la función al mínimo.

\sum _{i=1}\left(Y_{i}-g\left(X'_{i}\beta \right)\right)^{2}.

Dado que la forma funcional de $g\left(\cdot \right)$ no se sabe, hay que estimarla. Para un valor dado de $\beta$ una estimación de la función

G\left(X'_{i}\beta \right)=E\left(Y_{i}|X'_{i}\beta \right)=E\left[g\left(X'_{i}\beta _{o}\right)|X'_{i}\beta \right]

usando kernel método. Ichimura (1993) propone estimar $g\left(X'_{i}\beta \right)$ con

{\hat {G}}_{-i}\left(X'_{i}\beta \right),\,

la licencia-un-out kernel no paramétrico estimador de $G\left(X'_{i}\beta \right)$ ..

Estimador de Klein y Spady

Si la variable dependiente $y$ es binaria y $X_{i}$ and $u_{i}$ se supone que son independientes, Klein y Spady (1993) proponen una técnica para estimar $\beta$ utilizando métodos de máxima verosimilitud. La función de verosimilitud viene dada por:

L\left(\beta \right)=\sum _{i}\left(1-Y_{i}\right)\ln \left(1-{\hat {g}}_{-i}\left(X'_{i}\beta \right)\right)+\sum _{i}Y_{i}\ln \left({\hat {g}}_{-i}\left(X'_{i}\beta \right)\right),

donde ${\hat {g}}_{-i}\left(X'_{i}\beta \right)$ es la licencia-un-out estimador.

Coeficiente de Smooth / variando modelos de coeficientes

Hastie y Tibshirani (1993) proponen un modelo de coeficiente lisa dada por:

Y_{i}=\alpha \left(Z_{i}\right)+X'_{i}\beta \left(Z_{i}\right)+u_{i}=\left(1+X'_{i}\right)\left({\begin{array}{c}\alpha \left(Z_{i}\right)\\\beta \left(Z_{i}\right)\end{array}}\right)+u_{i}=W'_{i}\gamma \left(Z_{i}\right)+u_{i},

donde $X_{i}$ is a $k\times 1$ vector and $\beta \left(z\right)$ es un vector de funciones suaves no especificadas de $z$ .

$\gamma \left(\cdot \right)$ puede ser expresado como:

\gamma \left(Z_{i}\right)=\left(E\left[W_{i}W'_{i}|Z_{i}\right]\right)^{-1}E\left[W_{i}Y_{i}|Z_{i}\right].

Referencias

↑ See Li and Racine (2007) for an in depth look at nonparametric regression methods.

Robinson, P.M. (1988). «Root-n Consistent Semiparametric Regression». Econometrica (The Econometric Society) 56 (4): 931-954. JSTOR 1912705. doi:10.2307/1912705.

Li, Qi; Racine, Jeffrey S. (2007). Nonparametric Econometrics: Theory and Practice. Princeton University Press. ISBN 0-691-12161-3.

Racine, J.S.; Qui, L. (2007). «A Partially Linear Kernel Estimator for Categorical Data». Unpublished Manuscript, Mcmaster University.

Ichimura, H. (1993). «Semiparametric Least Squares (SLS) and Weighted SLS Estimation of Single Index Models». Journal of Econometrics 58: 71-120. doi:10.1016/0304-4076(93)90114-K.

Klein, R. W.; R. H. Spady (1993). «An Efficient Semiparametric Estimator for Binary Response Models». Econometrica (The Econometric Society) 61 (2): 387-421. JSTOR 2951556. doi:10.2307/2951556.

Hastie, T.; R. Tibshirani (1993). «Varying-Coefficient Models». Journal of the Royal Statistical Society, Series B 55: 757-796.

Datos: Q7449609

[1] See Li and Racine (2007) for an in depth look at nonparametric regression methods.

[1]