Operador de proyección

En matemáticas, un operador de proyección P en un espacio vectorial es una transformación lineal idempotente, es decir, que satisface la igualdad P2 = P.[1]

La transformación P es la proyección ortogonal sobre una recta m

Introducción editar

Dichas transformaciones proyectan cualquier punto x del espacio vectorial a un punto del subespacio imagen de la transformación. En caso de que x pertenezca al subespacio imagen, la proyección no tiene efecto, dejando el punto x fijo.[2]

Por ejemplo, el operador P definido en R3 de la forma siguiente

 

es un operador que "proyecta" el espacio R3 sobre el espacio de dimensión 2 que consiste de los vectores cuya coordenada y es cero.

Esta definición abstracta, de "proyector" o "proyección" generaliza la idea gráfica intuitiva de proyección extendiéndola a cualquier tipo de espacio vectorial, incluyendo el caso de dimensión infinita donde no resulta posible una aproximación gráfica.

Descomposición de un vector mediante una proyección editar

Sea V un espacio vectorial,   una proyección e   la aplicación identidad. Se verifica que Q=I-P es una proyección. Además, dado que P+Q=I todo vector puede ser descompuesto de la siguiente forma:  .[3]

Proyectores ortogonales o autoadjuntos editar

Para pasar del concepto de «proyección» al de «proyección ortogonal» es preciso que exista un instrumento que nos diga si dos vectores son ortogonales, es decir, perpendiculares. Este instrumento es un producto interior definido en el espacio vectorial. Todo producto interior define una norma. El espacio vectorial puede ser o no completo respecto a ella. Si lo es, pasamos a hablar de un espacio de Hilbert. En este espacio, los conceptos «ortogonal» y «proyección ortogonal» están dotados plenamente de sentido.

En general, dado un subespacio vectorial W de un espacio V, existen muchas proyecciones sobre V. Si el espacio es un espacio de Hilbert y se exige además que el operador P sea un autoadjunto, es decir

 

entonces la proyección sobre V es única. El término «operador de proyección ortogonal» significa «operador de proyección autoadjunto».

En física, el término «operador de proyección» es sinónimo con proyección ortogonal.

En álgebra lineal y análisis funcional, una proyección es un aplicación lineal   de un espacio vectorial sobre sí mismo (un endomorfismo) tal que  . Es decir, siempre que   se aplica dos veces a cualquier vector, se obtiene el mismo resultado que si se aplicara una vez (es decir,   es idempotente). Expresado de otra manera, la imagen resultante queda sin cambios tras sucesivas aplicaciones.[2]​ Esta definición de proyección formaliza y generaliza la idea de proyección tridimensional. También se puede considerar el efecto de una proyección sobre un objeto geométrico examinando el efecto de la proyección sobre sus puntos.

Definiciones editar

Una proyección sobre un espacio vectorial   es un operador lineal   tal que  .

Cuando   posee un producto interior y es completo, es decir, cuando   es un espacio de Hilbert, se puede utilizar el concepto de ortogonalidad. Una proyección   en un espacio de Hilbert   se denomina proyección ortogonal si satisface   para todo  . Una proyección sobre un espacio de Hilbert que no es ortogonal se denomina proyección oblicua.

Matriz de proyección editar

  • Una matriz cuadrada   se llama matriz de proyección si es igual a su cuadrado,[4]: p. 38  es decir, si  .
  • Una matriz cuadrada   se denomina matriz de proyección ortogonal si   para una matriz real y, respectivamente,   para una matriz compleja, donde   denota la matriz transpuesta de   y   denota la matriz adjunta o traspuesta hermítica[4]: p. 223  de  .
  • Una matriz de proyección que no es una matriz de proyección ortogonal se denomina matriz de proyección oblicua.

Los autovalores de una matriz de proyección deben ser 0 o 1.

Ejemplos editar

Proyección ortogonal editar

Por ejemplo, la función que asigna el punto   en el espacio tridimensional   al punto   es una proyección ortogonal sobre el plano xy. Esta función está representada por la matriz.

 

La acción de esta matriz sobre un vector arbitrario es

 

Para ver que   es de hecho una proyección, es decir,  , se calcula

 

Debe observarse que   muestra que la proyección es una proyección ortogonal.

Proyección oblicua editar

Un ejemplo simple de una proyección no ortogonal (oblicua) es

 

A través de multiplicación de matrices, se ve que

 

mostrando que   es de hecho una proyección.

La proyección   es ortogonal si y solo si   porque solo entonces  

Propiedades y clasificación editar

 
La transformación T es la proyección a lo largo de k sobre m. El rango de T es m y el núcleo es k

Idempotencia editar

Por definición, una proyección   es idempotente (es decir,  ).

Aplicación abierta editar

Cada proyección es una aplicación abierta, lo que significa que asigna cada conjunto abierto de su dominio a un conjunto abierto en el subespacio topológico de la imagen. Es decir, para cualquier vector   y cualquier bola   (con radio positivo) centrada en  , existe una bola   (con radio positivo) centrada en   que está totalmente contenida en la imagen  .

Complementariedad de imagen y kernel editar

Sea   un espacio vectorial de dimensión finita y sea   una proyección sobre  . Supóngase que los subespacios   y   son imagen y núcleo de   respectivamente. Entonces,   tiene las siguientes propiedades:

  1.   es la función identidad   en  :
 
  1. Existe la suma directa  . Cada vector   puede descomponerse únicamente como   con   y  , y donde  

La imagen y el núcleo de una proyección son complementarios, al igual que   y  . El operador   también es una proyección, ya que la imagen y el núcleo de   se convierten en el núcleo y la imagen de   y viceversa. Se dice que   es una proyección en   sobre   (núcleo/imagen) y   es una proyección en   sobre  .

Espectro editar

En espacios vectoriales de dimensión infinita, el espectro de una proyección está contenido en   como

 

Sólo 0 o 1 puede ser los valores propios de una proyección. Esto implica que una proyección ortogonal   es siempre una matriz semidefinida positiva. En general, los espacios propios correspondientes son (respectivamente) el núcleo y el rango de la proyección. La descomposición de un espacio vectorial en sumas directas no es única. Por lo tanto, dado un subespacio  , puede haber muchas proyecciones cuyo rango (o núcleo) sea  .

Si una proyección no es trivial, tiene como polinomio mínimo  , que se descompone en distintos factores lineales y, por lo tanto,   es diagonalizable.

Producto de proyecciones editar

El producto de proyecciones no es en general una proyección, aunque sean ortogonales. Si dos proyecciones conmutan entonces su producto es una proyección, pero el enunciado inverso es falso: el producto de dos proyecciones que no conmutan puede ser una proyección.

Si dos proyecciones ortogonales conmutan, entonces su producto es una proyección ortogonal. Si el producto de dos proyecciones ortogonales es una proyección ortogonal, entonces las dos proyecciones ortogonales conmutan (de manera más general: dos endomorfismo autoadjuntos conmutan si y solo si su producto es autoadjunto).

Proyecciones ortogonales editar

Cuando el espacio vectorial   tiene un espacio prehilbertiano y está completo (es decir, es un espacio de Hilbert) se puede utilizar el concepto de ortogonalidad. Una proyección ortogonal se caracteriza porque el rango   y el núcleo   son subespacios ortogonales. Así, por cada   y   en  ,  .

Equivalentemente:

 

Una proyección es ortogonal si y solo si es autoadjunta. Usando las propiedades de ser autoadjunta e idempotente de  , para cualquier   y   en   se tiene que  ,   y

 

donde   es el producto interno asociado con  . Por tanto,   y   son proyecciones ortogonales.[5]​ La relación en sentido contrario, es decir, que si   es ortogonal, entonces es autoadjunta; se sigue de la implicación de   a

 

para cada   y   en  ; y por lo tanto  .

La existencia de una proyección ortogonal sobre un subespacio cerrado se desprende del teorema de proyección de Hilbert.

Propiedades y casos especiales editar

Una proyección ortogonal es un operador lineal acotado. Esto se debe a que para cada   en el espacio vectorial se tiene que, por la desigualdad de Cauchy-Bunyakovsky-Schwarz:

 

Así,  .

Para espacios vectoriales reales o complejos de dimensión finita, el producto escalar se puede sustituir por  .

Fórmulas editar

Un caso simple ocurre cuando la proyección ortogonal es sobre una recta. Si   es un vector unitario en la recta, entonces la proyección viene dada por el producto exterior

 

(si   tiene un valor complejo, la traspuesta en la ecuación anterior se reemplaza por una transpuesta hermítica). Este operador deja invariante u y anula todos los vectores ortogonales a  , lo que demuestra que de hecho es la proyección ortogonal sobre la línea recta que contiene a u.[6]​ Una forma sencilla de ver esto es considerar un vector arbitrario   como la suma de una componente de la recta (es decir, el vector proyectado que buscamos) y otra perpendicular a ella,  . Aplicando la proyección se obtiene

 

por las propiedades del producto escalar de vectores paralelos y perpendiculares.

Esta fórmula se puede generalizar a proyecciones ortogonales en un subespacio de dimensión arbitraria. Sea   una base ortonormal del subespacio  , asumiendo que el número entero  , y sea   la matriz   cuyas columnas son  , es decir,  . Entonces, la proyección viene dada por:[7]

 

que se puede reescribir como

 

La matriz   es la isometria parcial que desaparece en el complemento ortogonal de  , y   es la isometría que embebe a   en el espacio vectorial subyacente. Por tanto, el rango de   es el espacio final de  . También está claro que   es el operador de identidad en  .

También se puede eliminar la condición de ortonormalidad. Si   es una base (no necesariamente ortonormal) con  , y   es la matriz con estos vectores como columnas, entonces la proyección es:[8][9]

 

La matriz   todavía incorpora   en el espacio vectorial subyacente pero ya no es una isometría en general. La matriz   es un factor normalizador que recupera la norma. Por ejemplo, el operador   de rango-1 no es una proyección si  . Después de dividir por   se obtiene la proyección   sobre el subespacio abarcado por  .

En el caso general, se puede tener una matriz positiva definida arbitraria   que define un producto interno  , y la proyección   viene dada por  . Entonces

 

Cuando el espacio de rango de la proyección es generado por un marco (es decir, el número de generadores es mayor que su dimensión), la fórmula para la proyección toma la forma:  . Aquí   represnta la matriz pseudoinversa de Moore-Penrose. Esta es solo una de las muchas formas de construir el operador de proyección.

Si   es una matriz no singular y   (es decir,   es la matriz núcleo de  ),[10]​ se cumple lo siguiente:

 

Si la condición ortogonal se mejora a   con   no singular, se cumple lo siguiente:

 

Todas estas fórmulas también son válidas para espacios con productos internos complejos, siempre que se utilice la matriz traspuesta conjugada en lugar de la traspuesta. Se pueden encontrar más detalles sobre las sumas de las proyecciones en Banerjee y Roy (2014).[8]​ Véase también Banerjee (2004)[11]​ para la aplicación de sumas de proyecciones en trigonometría esférica básica.

Proyecciones oblicuas editar

El término proyecciones oblicuas se utiliza a veces para referirse a proyecciones no ortogonales. Estas proyecciones también se utilizan para representar figuras espaciales en dibujos bidimensionales (véase proyección oblicua), aunque no con tanta frecuencia como las proyecciones ortogonales. Mientras que calcular el valor ajustado de una regresión mínimos cuadrados ordinarios requiere una proyección ortogonal, calcular el valor ajustado de una regresión variable instrumental requiere una proyección oblicua.

Una proyección se define por su núcleo y los vectores base utilizados para caracterizar su rango (que es un complemento del núcleo). Cuando estos vectores base son ortogonales al núcleo, entonces la proyección es ortogonal. Cuando estos vectores base no son ortogonales al núcleo, la proyección es una proyección oblicua, o simplemente una proyección.

Fórmula de representación matricial para un operador de proyección distinto de cero editar

Sea   un operador lineal,   tal que   y supóngase que   no es el operador cero. Ahora, se considera que los vectores   forman una base para el rango de  , que se representan en la matriz   de orden  . Por lo tanto, el número entero  ; de lo contrario,   y   es el operador cero. El rango y el núcleo son espacios complementarios, por lo que el núcleo tiene dimensión  . De ello se deduce que el complemento ortogonal del núcleo tiene la dimensión  . Sea   una base para el complemento ortogonal del núcleo de la proyección, represéntesen estos vectores en la matriz  . Entonces, la proyección   (con la condición  ) viene dada por

 

Esta expresión generaliza la fórmula para proyecciones ortogonales dada anteriormente.[8][12]​ Una prueba estándar de esta expresión es la siguiente. Para cualquier vector   en el espacio vectorial  , se puede descomponer  , donde el vector   está en la imagen de   y el vector   Entonces  , y entonces   está en el núcleo de  , que es el espacio nulo de   En otras palabras, el vector   está en el espacio de columnas de  , por lo que   para algún vector de dimensión     y el vector   satisface   mediante la construcción de  . Uniendo estas condiciones se encuentra un vector   tal que  . Dado que las matrices   y   tienen el rango completo   por su construcción, la matriz     es invertible. Entonces la ecuación   da el vector  . De esta manera,   para cualquier vector   y por lo tanto  .

En el caso de que   sea una proyección ortogonal, se puede tomar  , y se deduce que  . Al utilizar esta fórmula, se puede comprobar fácilmente que  . En general, si el espacio vectorial está definido sobre el cuerpo de los números complejos, se usa la matriz traspuesta conjugada  , y se obtiene la fórmula  . Recuérdese que se puede definir la matriz pseudoinversa de Moore-Penrose de la matriz   por  , ya que   tiene rango de columna completo, y por lo tanto  .

Valores singulares editar

Téngase en cuenta que   también es una proyección oblicua. Los valores singulares de   e   se pueden calcular mediante una base ortonormal de  .

Sea   una base ortonormal de   y sea   el complemento ortogonal de  . Ahora, se denotan los valores singulares de la matriz   mediante los valores positivos  . Con esto, los valores singulares para   son:[13]

 

y los valores singulares para   son

 

Esto implica que los valores singulares más grandes de   e   son iguales y, por lo tanto, que la norma matricial de las proyecciones oblicuas es la misma. Sin embargo, su número de condición satisface la relación   y, por lo tanto, no es necesariamente igual.

Determinar una proyección con un producto interno editar

Sea   un espacio vectorial (en este caso un plano) abarcado por vectores ortogonales  . Sea   un vector. Se puede definir una proyección de   sobre   como

 

donde los índices repetidos se suman (de acuerdo con el convenio de suma de Einstein). El vector   se puede escribir como una suma ortogonal tal que  .   a veces se denomina  . Hay un teorema en álgebra lineal que establece que este   es la distancia más pequeña (la distancia ortogonal) de   a   y se usa comúnmente en áreas como el aprendizaje automático.

 
y proyectado en el espacio vectorial V

Formas canónicas editar

Cualquier proyección   sobre un espacio vectorial de dimensión   sobre un cuerpo es una matriz diagonalizable, ya que su polinomio mínimo divide a  , que se divide en distintos factores lineales. Por lo tanto, existe una base en la que   tiene la forma

 

donde   es el rango de  . Aquí,   es la matriz identidad de tamaño  ,   es la matriz cero de tamaño   y   es el operador suma directa. Si el espacio vectorial es complejo y está equipado con un espacio prehilbertiano, entonces existe una base ortonormal en la que la matriz de P es[14]

 

donde  . Los números enteros   y los números reales   están determinados de forma única. Téngase en cuenta que  . El factor   corresponde al subespacio invariante máximo en el que   actúa como una proyección ortogonal (de modo que P es ortogonal si y solo si  ) y los bloques   corresponden a las componentes oblicuas.

Proyecciones sobre espacios vectoriales normados editar

Cuando el espacio vectorial subyacente   es un espacio vectorial normado (no necesariamente de dimensión finita), es necesario considerar cuestiones analíticas, irrelevantes en el caso de dimensión finita. Supóngase ahora que   es un espacio de Banach.

Muchos de los resultados algebraicos discutidos anteriormente se conservan en este nuevo contexto. Una descomposición de suma directa dada de   en subespacios complementarios todavía especifica una proyección, y viceversa. Si   es la suma directa  , entonces el operador definido por   sigue siendo una proyección con rango   y núcleo  . También está claro que  . Por el contrario, si   es una proyección sobre  , es decir,  , entonces se verifica fácilmente que  . En otras palabras,   también es una proyección. La relación   implica que   y   es la suma directa  .

Sin embargo, a diferencia del caso de dimensión finita, las proyecciones no necesitan ser continuas en general. Si un subespacio   de   no está cerrado en la topología normal, entonces la proyección sobre   no es continua. En otras palabras, el rango de una proyección continua   debe ser un subespacio cerrado. Además, el núcleo de una proyección continua (de hecho, un operador lineal continuo en general) es cerrado. Así, una proyección continua   da una descomposición de   en dos subespacios cerrados complementarios:  .

Lo contrario también es válido, con un supuesto adicional. Supóngase que   es un subespacio cerrado de  . Si existe un subespacio cerrado   tal que X= UV, entonces la proyección   con rango   y núcleo   es continua. Esto se desprende del teorema de la gráfica cerrada. Supóngase también que xnx y Pxny. Es necesario demostrar que  . Dado que   es cerrado y {Pxn} ⊂ U, y se encuentra en  , es decir, Py= y. Además, xnPxn= (IP)xnxy. Debido a que   está cerrado y {(IP)xn} ⊂ V, se tiene que  , es decir,  , lo que prueba la afirmación.

El argumento anterior hace uso del supuesto de que tanto   como   están cerrados. En general, dado un subespacio cerrado  , no es necesario que exista un subespacio cerrado complementario  , aunque para un espacio de Hilbert esto siempre se puede hacer tomando el complemento ortogonal. Para los espacios de Banach, un subespacio unidimensional siempre tiene un subespacio complementario cerrado. Esta es una consecuencia inmediata del teorema de Hahn–Banach. Sea   el tramo lineal de  . Por el mencionado teorema de Hahn-Banach, existe una funcional lineal   acotada tal que φ(u)= 1. El operador   satisface que  , es decir, es una proyección. La acotación de   implica continuidad de   y, por lo tanto,   es un subespacio complementario cerrado de  .

Aplicaciones y consideraciones adicionales editar

Las proyecciones (ortogonales y de otro tipo) juegan un papel importante en la algoritmia para ciertos problemas de álgebra lineal:

Como se indicó anteriormente, las proyecciones son un caso especial de idempotencia. Analíticamente, las proyecciones ortogonales son generalizaciones no conmutativas de funciones características. La idempotencia se utiliza para clasificar, por ejemplo, álgebras semisimples, mientras que la teoría de medida comienza considerando las funciones características de los conjuntos mdibles. Por lo tanto, como se puede imaginar, las proyecciones se encuentran muy a menudo en el contexto del álgebra de operadores. En particular, un álgebra de von Neumann se genera por su retículo completo de proyecciones.

Generalizaciones editar

De manera más general, dada una aplicación entre espacios vectoriales normados  , se puede pedir de manera análoga que esta aplicación sea una isometría en el complemento ortogonal del núcleo: que   sea una isometría (compárese con una isometría parcial); y en particular debe ser sobreyectiva. El caso de una proyección ortogonal es cuando W es un subespacio de V. En la geometría de Riemann, esto se utiliza en la definición de submersión riemanniana.

Véase también editar

Referencias editar

  1. "Basic methods of linear Functional Analysis" J.D. Pryce. Hutchinson University Library. Página 150
  2. a b Meyer, pp 386+387
  3. "Basic methods of linear functional analysis" J.D. Pryce. Hutchinson University Library. Página 150.
  4. a b Horn, Roger A.; Johnson, Charles R. (2013). Matrix Analysis, second edition. Cambridge University Press. ISBN 9780521839402. 
  5. Meyer, p. 433
  6. Meyer, p. 431
  7. Meyer, equation (5.13.4)
  8. a b c Banerjee, Sudipto; Roy, Anindya (2014), Linear Algebra and Matrix Analysis for Statistics, Texts in Statistical Science (1st edición), Chapman and Hall/CRC, ISBN 978-1420095388 .
  9. Meyer, equation (5.13.3)
  10. Véase también Mínimos cuadrados lineales (matemáticas) § Propiedades de los estimadores de mínimos cuadrados.
  11. Banerjee, Sudipto (2004), «Revisiting Spherical Trigonometry with Orthogonal Projectors», The College Mathematics Journal 35 (5): 375-381, S2CID 122277398, doi:10.1080/07468342.2004.11922099 .
  12. Meyer, equation (7.10.39)
  13. Brust, J. J.; Marcia, R. F.; Petra, C. G. (2020), «Computationally Efficient Decompositions of Oblique Projection Matrices», SIAM Journal on Matrix Analysis and Applications 41 (2): 852-870, OSTI 1680061, S2CID 219921214, doi:10.1137/19M1288115 .
  14. Doković, D. Ž. (August 1991). «Unitary similarity of projectors». Aequationes Mathematicae 42 (1): 220-224. S2CID 122704926. doi:10.1007/BF01818492. 

Bibliografía editar

  • Banerjee, Sudipto; Roy, Anindya (2014), Linear Algebra and Matrix Analysis for Statistics, Texts in Statistical Science (1st edición), Chapman and Hall/CRC, ISBN 978-1420095388 .
  • Dunford, N.; Schwartz, J. T. (1958). Linear Operators, Part I: General Theory. Interscience. 
  • Meyer, Carl D. (2000). Matrix Analysis and Applied Linear Algebra. Society for Industrial and Applied Mathematics. ISBN 978-0-89871-454-8. 

Enlaces externos editar