Text
                    

SERGE LANG Ya le University Versión en español del M. en C. Miguel Lara Aparicio Universidad Nacional Autónoma de México Con la colaboración del Dr. Emilio Lluis Riera Universidad Nacional de México y del Dr. José Arias Páez Universidad Nacional de Colombia OCz , W/03 FONDO EDUCATIVO INTERAMERICANO, S. A. Bogotá • Caracas . México . Panamá . San Juan • Santiago . Sao Paulo
Versión en español autorizada de la segunda edición de la obra inglesa titulada Linear Algebra por Serge Lang. © 1971 por Addison-Wesley Publishing Company, Reading, Mass., E.U.A. © 1974 por FONDO EDUCATIVO INTERAMER1CANO, S. A. Reservados todos los derechos. Ni todo el libro ni parte de él pueden ser reproducidos, archivados o transmitidos en forma alguna o mediante algún sistema electrónico, mecánico de fotorreproducción, memoria, o cualquier otro sin permiso escrito del editor. Printed in the United States of America. Impreso en los E.U.A. Tarjeta de la Biblioteca del Congreso de los E.U.A.: 73-77982 ABCDEFGHtJ-MA-7987654
Prefacio El presente libro se destina a ser utilizado como texto en un curso de álgebra lineal a nivel de pre-grado. Contiene material suficiente para un curso de un año, pero, mediante adecuadas omisiones, será fácil usarlo también en un curso de un semestre de duración. Durante la década pasada, los programas de los cursos de álgebra a nivel de pre-grado han dirigido su énfasis hacia el álgebra lineal. Este cambio se debe parcialmente al hecho de reconocer que esta parte del álgebra es más fácil de en- tender que otras (por ser menos abstracta y, en todo caso, por ser motivada di- rectamente por la geometría del espacio) y en parte por las numerosas aplicaciones existentes para la misma. En consecuencia, he comenzado el libro con el concepto básico del vector en el espacio real euclidiano, el cual fija la pauta general para mucho de lo que sigue. Los capítulos sobre grupos y anillos han sido incluidos por razón de su importante relación con el álgebra lineal, siendo el grupo de las aplicaciones lineales invertibles (o matrices) y el anillo de las aplicaciones lineales de un espacio vectorial tal vez los ejemplos más llamativos de grupos y de anillos. El hecho de que se pueda considerar útilmente un espacio vectorial sobre un campo como un módulo sobre su anillo de endomorfismos lo hace merecedor de que se le incluya como parte de un curso de álgebra lineal. Sin embargo, a causa de la intención general del libro, esos capítulos no han sido tratados tan completa- mente como si fuese otro el caso y un texto más breve sobre estructuras algebraicas básicas (grupos, anillos, campos, conjuntos, etc.) acompañará a éste, con el fin de ofrecer la oportunidad de enseñar un curso semestral destinado principalmente a los estudiantes de matemáticas. El producto tensorial, y especialmente el producto alternante, son tan impor- tantes en los cursos de cálculo avanzado que fue necesario incluir un capítulo sobre ambos, sin olvidar sus aplicaciones. El limitado propósito de tal capítulo permite asi concreción y simplicidad. El apéndice sobre conjuntos convexos —como se presupone familiaridad con algunos hechos estándar sobre conjuntos compactos, cierres envolventes de conjuntos, etc.— amplía algunas de las ideas del capítulo I; puede ser leído a continuación de éste y después de conocer la definición de-la aplicación lineal. Varias cosas sueltas son agrupadas en el segundo apéndice (incluyéndose una prueba del cierre envolvente algebraico de los números complejos), que pueden explicarse o no, según el criterio del profesor.
PREFACIO Para esta segunda edición he reescrito algunas secciones e introducido algunos temas nuevos. También he añadido muchos nuevos ejercicios. Serge Lang .
Indice general Primera parte Teoría básica Capitulo 1 Vectores 1. Definición de puntos en un espacio «-dimensional............................. 2. Vectores localizados......................................................... 3. El producto escalar.......................................................... 4. La norma de un vector ....................................................... 5. Rectas y planos.............................................................. 6. El producto vectorial........................................................ 7. Números complejos............................................................ Capitulo II Espacios vectoriales 1. Definiciones................................................................ 2. Bases....................................................................... 3. Dimensión de un espacio vectorial........................................... 4. Sumas y sumas directas...................................................... Capitulo III Matrices 1. El espacio de las matrices.............................................. 2. Ecuaciones lineales..................................................... 3. Multiplicación de matrices.............................................. Apéndice. Eliminación............................................
INDICE GENERAL Capitulo IV Aplicaciones lineales 1. Aplicaciones................................................................. 83 2. Aplicaciones lineales........................................................ 91 3. El núcleo y la imagen de una aplicación lineal............................... 98 4. Composición de aplicaciones lineales y aplicaciones lineales inversas... 103 5. Aplicaciones geométricas................................................... 109 Capitulo V Aplicaciones lineales y matrices 1. La aplicación lineal asociada con una matriz............................... 117 2. La matriz asociada con una aplicación lineal............................... 118 3. Bases, matrices y aplicaciones lineales. , ............................... 122 Capitulo VI Productos escalares y ortogonaliJad 1. Productos escalares....................................................... 131 2. Bases ortogonales, caso definido positivamente........................... 137 3. Aplicación a las ecuaciones lineales..................................... 147 4. Aplicaciones bilineales y matrices........................................ 152 5. Bases ortogonales generales............................................... 156 6. El espacio dual........................................................... 159 Capitulo VII Determinantes 1. Determinantes de orden 2................................................. 167 2. Existencia de los determinantes...........................................169 3. Propiedades adicionales de los determinantes............................. 176 4. La regla de Cramer....................................................... 182 5. Permutaciones............................................................ 185 6. Unicidad................................................................. 191 7. Determinante de una transpuesta.......................................... 195 8. Determinante de un producto.............................................. 196 9. Inversa de una matriz.................................................... 197 10. El rango de una matriz y subdeterminantes................................200 11. Interpretación de los determinantes como área y como volumen.............202
INDICE GENERAL Teoremas de estructuras Capitulo VIH Formas bilineales y los operadores estándar 1. Formas bilineales....................................................... 215 2. Formas cuadráticas........................................................220 3. Operadores simétricos.................................................... 222 4. Operadores hermitianos................................,...................227 5. Operadores unitarios......................................................231 6. Teorema de Sylvester......................................................235 Capitulo IX Polinomios y matrices 1. Polinomios................................................................241 2. Polinomios de matrices y de aplicaciones lineales.........................244 3. Vectores propios y valores propios........................................246 4. El polinomio característico ..............................................252 Capitulo X Triangulación de matrices y de aplicaciones lineales 1. Existencia de la triangulación........................................... 257 2. Teorema de Hamilton-Cayley............................................... 260 3. Diagonalización de aplicaciones unitarias........................- - - - 262 Capitulo XI El teorema espectral 1. Vectores propios de aplicaciones lineales simétricas......................265 2. El teorema espectral..................................................... 268 3. El caso complejo......................................................... 274 4. Operadores unitarios......................................................275 Capitulo XII Polinomios y descomposición primaria 1. El algoritmo euclidiano...................................................^81 2. Máximo común divisor......................................................^83
INDICE GENERAL 3. Factorización única........................................................ 286 4. Los en teros................................................................290 5. Aplicación a la descomposición de un espacio vectorial......................292 6. Lema de Schur...............................................................295 7. La forma normal de Jordán.................................................. 297 Tercera parte Relaciones con otras estructuras Capitulo XIII Productos multilineales 1. El producto tensorial...................................................305 2. Isomorfismos de productos tensoriales...................................309 3. Productos alternantes: caso especial....................................311 4. Productos alternantes: caso general.....................................315 Apéndice. El espacio vectorial generado por un conjunto.................324 Capitulo XIV Grupos l. Grupos y ejemplos.................................................... 327 2. Propiedades simples de los grupos.......................................330 3. Clases laterales y subgrupos normales...................................336 4. Grupos cíclicos........................................................ 341 5. Grupos abelianos libres ........................................344 Capitulo XV Anillos 1. Anillos e ideales.................................................... . 349 2. Homomorfismos...........................................................354 3. Módulos.................................................................357 4. Módulos cocientes.......................................................361 APENDICE 1 Conjuntos convexos 1. Definiciones............................................................ 365 2. Hiperplanos separantes. ...............................................367
INDICE GENERAL 3. Puntos extremos e hiperplanos soporte.................................. 369 4. El teorema de Krein-Milman............................................. 371 APENDICE 2 „ Temas adicionales I. Inducción.............................................................. 373 2. Cierre algebraico o envolvente de los números complejos................ 374 3. Relaciones de equivalencia............................................. 375 APENDICE 3 Angulos 379 Respuestas..................................................................387 Indice......................................................................397

PRIMERA PARTE TEORIA BASICA

CAPITULO I Vectores El concepto de vector es básico para todo el curso. Suministra una base de tipo geométrico para todo lo que sigue. Por tanto, las propiedades de los vectores, tanto algebraicas como geométricas, se estudiarán en detalle. Con el fin de ofrecer un estudio completo, se ha incluido el concepto de pro- ducto vectorial. En realidad, es un concepto que apenas se mencionará en el resto del libro. Es el único aspecto de la teoría de los vectores cuya validez se limita a un espacio de tres dimensiones (ya que no la tiene en el espacio de 2, ni en el de 4, ni en el de n dimensiones). Una característica significativa de casi todos los enun- ciados y las pruebas de este libro (exceptuando los concernientes al producto y a los determinantes) es que no son ni más fáciles ni más difíciles de probar en el espacio de 3 dimensiones o en el de n dimensiones que en el espacio de 2 di- mensiones. §1. Definición de puntos en un espacio n-dimensional Sabemos que se puede emplear un número para representar un punto sobre una recta, una vez que se ha seleccionado la unidad de longitud. Se puede usar un par de números, esto es, una pareja de números, (x, y), para representar un punto en el plano. Estas representaciones se pueden indicar en una figura, de la forma siguiente. 0 x (a) Punto sobre una recta (b) Punto en un plano Figura ] Nótese ahora que se puede usar una terna de números (x, y, z) para represen- tar un punto en el espacio, esto es, en el espacio tridimensional o espacio de 3 di- mensiones. Simplemente, se introduce un eje más. El siguiente diagrama ilustra este caso. 3
4 ALGEBRA LINEAL Figura 2 Se podría emplear también (xj,x2, x3) en lugar de x,y, z. La recta se podría designar como el espacio de 1 dimensión y el plano como el espacio bidimensional. Así, pues, se puede decir que un solo número representa un punto en el espa- cio de una dimensión. Una pareja representa un punto en el espacio bidimen- sional. Una tema representa un punto en el espacio tridimensional. Aunque no se puede continuar dibujando diagramas, nada impide considerar una cuádrupla de números (xn x2, x3, x4) y afirmar que éste es un punto en el espacio de 4 dimensiones. Una quíntupla sería un punto en el espacio de 5 dimensiones, luego vendría una séxtupla, séptu- pla, óctupla,... Se puede ir más allá y definir un punto en el espacio de n dimensiones como la n-upla de números (Xi x2.....x„), si n es un entero positivo. Se denotará con una X mayúscula dicha n-upla; pro- curaremos reservar las letras minúsculas para representar números y las letras mayúsculas para representar puntos. Se designan los números x2,..., x„ como las coordenadas del punto X. Por ejemplo, en el espacio de 3 dimensiones, 2 es la primera coordenada del punto (2, 3, —4) y —4 es su tercera coordenada. La mayor parte de los ejemplos ilustran el caso en que n = 2 ó bien n = 3. Así, el lector podrá visualizar cualquiera de estos dos casos a lo largo de todo el libro. Sin embargo, es necesario hacer antes dos comentarios: primero, prácti- camente ninguna fórmula o teorema es más sencillo al considerar tales casos para n; segundo, el caso n = 4 sí aparece en física y el caso n = n aparece con mucha frecuencia en la práctica o en la teoría, como para justificar su tratamiento aquí. Más aún, parte de nuestro propósito es, de hecho, demostrar que el caso general siempre es semejante a los casos en que n = 2 ó n = 3. Ejemplos. Un ejemplo clásico del espacio tridimensional es, desde luego, el espacio en que vivimos. Luego de haber seleccionado un origen y un sistema
VECTORES 5 de coordenadas, se puede describir la posición de un punto (cuerpo, partícula, etcétera) mediante 3 coordenadas. Además, como ya se sabe desde hace mucho, resulta conveniente extender este espacio a otro de 4 dimensiones, en donde la cuarta coordenada es el tiempo, seleccionando el origen del tiempo en, por ejem- plo, el nacimiento de Cristo, aunque esto es puramente arbitrario (quizás sería más conveniente seleccionar como origen el nacimiento del sistema solar o el níujjmiento de la tierra, si se pudieran determinar con precisión). Así, un punto con coordenada negativa de tiempo es un punto A. C. y un punto con coordenada positiva de tiempo es un punto D. C. No obstante, no se crea que «el tiempo es la cuarta dimensión». El espacio de 4 dimensiones antes mencionado es solamente un ejemplo posible. En economía, por ejemplo, se usa un espacio muy diferente, tomando como coordenadas, por ejemplo, el número de dólares gastados en una industria. Por ejemplo, se podría trabajar como modelo con un espacio de 7 dimensiones en el que las coordenadas corresponderían a las siguientes industrias: 3. Productos agrícolas 4. Pesca 1. Acero 2. Automóviles 5. Productos 6. Ropa 7. Transporte químicos Supóngase que la unidad de medida es un megadólar por año. Entonces un punto (1000, 800, 550, 300, 700, 200, 900) en este espacio de 7 dimensiones significaría que la industria del acero gastó mil millones de dólares en un año determinado y que la industria química gastó 700 mi- llones de dólares en ese año. Ahora vamos a definir cómo sumar puntos. Si A, B son puntos, por ejemplo, A = (aj, . ..,a„), B = (bi, ..., bh), se define entonces A + B como el punto cuyas coordenadas son (a, + bt, ..., a„ + b„). Por ejemplo, en el plano, si A — (1, 2) y B = ( — 3, 5), entonces A + B = (-2, 7). En el espacio de tres dimensiones, si A = (— 1, n, 3) y B =^/2,7, —2), entonces A + B = (^2 - l,7r + 7,1). Más aún, si c es cualquier número, se define cA como el punto cuyas coordenadas son (ca1; ..., ca„). Si A = (2, — 1, 5) y c = 7, entonces cA = (14, —7, 35).
6 ALGEBRA LINEAL Nótese que se satisfacen las siguientes reglas: (1) (A + B) + C = A + (B + C). (2) A + B = B + A. (3) c(A + B) = cA + cB. (4) Si c1( c2 son números, entonces (ci + c2)A = c¡A + c2A y (c!C2)A = Ci(c24). (5) Si se supone que O = (0, ..., 0) es el punto cuyas coordenadas son todas 0, entonces O + A = A + O = A para todo A. (6) 1 • A = A, y si se denota por — A a la n-upla (—1)^4, entonces A + ( —,4) = 0. [En lugar de escribir A + ( — B), se escribirá frecuentemente A — B.] Todas estas propiedades son muy fáciles de probar y sugerimos al lector que las veri- fique mediante algunos ejemplos. Daremos con detalles la prueba de la propiedad (3). Sea A = («i,..., a„) y B = (bi, ..., b„). Entonces A + B = (ai + í>i, ..., a„ + b„) c(A + B) - (c(aj + bi), ..., c(a„ + b„)) = (caí + cbi .. ,,ca„ + cb„) — cA + cB, este último paso es cierto por la definición de adición de n-uplas. Las otras pruebas se dejan al lector como ejercicios. Nota. No confunda el número 0 con la n-upla (0, ..., 0). Comúnmente se de- nota esta n-upla mediante O, y también se denomina cero, debido a que, en la práctica, no puede ocurrir ninguna dificultad. Vamos ahora a analizar la adición y la multiplicación por números geomé- tricamente en el plano (el lector puede visualizar simultáneamente lo que sucede en el espacio de 3 dimensiones). Consideremos un ejemplo. Sea A = (2, 3) y B = ( — 1,1). Entonces A + B = (1,4). La figura se asemeja a un paralelogramo (figura 3). Consideremos otro ejemplo. Sea A = (3, 1) y B = (1, 2). Entonces Figura 3 A + B = (4, 3).
1 VECTORES Nuevamente se observa que la representación geométrica de nuestra adición se asemeja a un paralelogramo (figura 4). ¿Cuál es la representación de la multiplicación por un número? Sea A = (1,2) y c = 3. Entonces cA = (3, 6) como en la figura 5(a). La multiplicación por 3 produce un incremento de A 3 veces. Análogamente, ^A resulta en un acortamiento de A en |,es decir, A se reduce a la mitad de su tamaño. En general, si t es un número, t > 0, se interpreta tA como un punto en la misma dirección que A desde el origen, pero a una distancia mayor t veces. La multiplicación por un número negativo invierte la dirección. Así, — 3 A quedaría representado como en la figura 5(b). Ejercicios En cada uno de los siguientes casos, determinar A + B, A — B, 3A, — 2B. 1. A = (2,-1), B = (-1,1) 2. 4 = (-1,3), B = (0,4) 3. 4 = (2, — 1), B = ( —1, 1, 1) 4. A = (-l,— 2, 3), B = (—1, 3,-4) 5. A = (a, 3, — 1), B = (2n. -3,7) 6. A = (15, -2,4),B = (n, 3, -1) 7. En una hoja de papel milimetrado, marcar los puntos indicados en los ejercicios del 1 al 4. 8. Sean A y B como en el ejercicio 1. En una hoja de papel milimetrado, marcar los pun- tos A + 2B, A + 3B, A - 2B, A - 3B, A + |B.
8 ALGEBRA LINEAL § 2. Vectores localizados Se define un vector localizado come una pareja ordenada de puntos que se indican con ÁÜ. (Este no es un producto). La representación correspondiente es como una flecha que va de A a B. Se designa al punto A como punto inicial y al punto B como punto final del vector localizado (figura 6). Figura 6 ¿Cómo se obtienen las coordenadas de B a partir de las de A? Nótese que en el plano, b¡ = ai + (bi — «i). Análogamente, b2 = «2 + (b2 — ¿h)- Esto quiere decir que B = A + (B - A). Sean AByCD dos vectores localizados. Se dice que son equivalentes si B — A = D — C. Todo vector localizado AB es equivalente a aquél cuyo punto inicial se encuentra en el origen, porque AB es equivalente a O(B - A). Obviamente, éste es el único vector localizado cuyo punto inicial se encuentra en el origen y es equi- valente a ÁS. Si el lector puede imaginarse la ley del paralelogramo en el plano, entonces resulta evidente que la equivalencia de dos vectores localizados se puede interpretar geométricamente diciendo que las longitudes de los segmentos de recta determinados por la pareja de puntos son iguales y que los «sentidos» en que apuntan son los mismos. ___^En las siguientes figuras se han dibujado los vectores localizados O(B — A), AB, y O(A - B), fll.
VECTORES 9 Dado un vector localizado OC cuyo punto inicial es el origen, decimos que se encuentra localizado en el origen. Dado cualquier vector localizado A$, decimos que está localizado en A. Un vector localizado en el origen está determinado totalmente por su punto final. Con base en esto, una n-upla representará un punto o un vector, según la interpretación que tengamos en mente. . fSe dice que dos vectores localizados y P$. son paralelos si existe un nú- mero c / 0 tal que B — A = c(Q — P). Se dice que van en el mismo sentido si existe un número c > 0 tal que B — A — c(Q — P), y se dice que van en sentidos opuestos si existe un número c < 0 tal que B — A = c(Q — P). En los siguientes diagramas se ilustran dos casos de vectores localizados paralelos. Figura 9 De manera semejante, cualquier definición enunciada para las n-uplas se puede aplicar a los vectores localizados. En la siguiente sección, por ejemplo, definimos lo que se entiende por n-uplas perpendiculares entre sí. Entonces se puede decir que dos vectores localizados AB y PQ son perpendiculares entre sí si B — A es perpendicular a Q — P. En la siguiente figura aparece una representación en el plano de dichos vectores. Figura 10 Ejemplo 1. Sean P = (1, — 1,1) y Q = (2, 4, 1). Luego PQ es equivalente a OC, donde C = Q - P = (1, 5, -2). Si A = (4, -2, 5) y B = (5, 3, 3), entonces es equivalente a AB, ya que Q - P= B - A = (1, 5, —2).
10 ALGEBRA LINEAL Ejemplo 2. Sean P = (3, 7) y Q = (-4, 2). Sean A = (5, 1) y B = (- 16, - 14). Entonces C-P = (-7,-5) y B - A = (-21, -15). Por tanto, PQ es paralelo a AÍ, debido a que B — A = 3(Q — P). Más aún, como 3 > 0, se ve que PQ y A~§ van en el mismo sentido. Ejercicios En cada uno de los siguientes casos, determinar qué vectores localizados PQ y A$ son equivalentes. 1. P = (1. -1), 2 = (4, 3),/I = (-1, 5), B = (5,2). 2. P = (1,4), Q = (-3, 5), A = (5, 7), B = (1, 8). 3. P = (1, -1, 5), Q = (-2, 3, -4), A = (3, 1, 1), B = (0, 5,10). 4. P = (2,3, —4), Q = (-1, 3,5), A = (-2, 3, -1), B = (-5, 3, 8). En cada uno de los siguientes casos, determinar qué vectores localizados PQ y AB son paralelos. 5. P = (1, -1), Q = (4, 3), A = (-1, 5), B = (7, 1). 6. P = (1,4), Q = (- 3, 5), A = (5, 7), B = (9,6). 7. P = (1, -1, 5), Q = ( — 2, 3, -4), A = (3, 1,1), B = (-3, 9, - 17). 8. P = (2, 3,- 4), Q = (-1, 3, 5), A = (-2, 3,-1), B = (-11, 3, -28). 9. Con el objeto de ilustrar los ejercicios 1, 2, 5 y 6, dibujar en una hoja de papel los vec- tores localizados. Dibujar asimismo los vectores localizados Q? y BX Marcar los puntos Q- P, B — A, P-Qy A-B. §3. El producto escalar Se sobrentiende que a través de la explicación seleccionaremos vectores que se encuentren siempre en el mismo espacio de n dimensiones. Sean A = (a,,.. .,a„) y B = (bi,.. ,,bn) dos vectores. Se define su producto escalar o producto interno A B de la siguiente manera: Oibx + • • • + a„b„. Este producto es un número. Por ejemplo, si A =(1,3, -2) y B = (—1, 4,-3), entonces A B = - 1 + 12 + 6 = 17.
VECTORES 11 Por el momento no se dará ninguna interpretación geométrica de este producto escalar; se hará posteriormente. Antes, vamos a deducir algunas de sus propie- dades importantes. Las básicas son: PE I. Tenemos A B = B A. \ PE 2. Si A, B, C son tres vectores, entonces " A(B + Q = AB + A C = (B + C)-A. PE 3. Si x es un número, entonces (xA) • B = x(A • B) y A • (xB) = x(A B). I PE 4. Si A = O es el vector nulo, entonces A • A = 0 y, si no lo es, entonces A- A > 0. En seguida se demostrarán estas propiedades. Respecto de la primera propiedad, tenemos aibi + • • + ajb* — b1al + - • • + b„a„, puesto que para dos números cualesquiera a, b, se tiene que ab = ba. Lo que 1 prueba la misma propiedad. Para probar PE 2, sea C = (c>,..., cn). Luego B + C = (b¡ + ct,..., b„ + c„) y A -(B + C) = a^bi + c,) + +an(bn + c„) = aybi + al(¡ + + a„bn + a„c„. Al reordenar los términos se obtiene Uii>i + • • + aj>„ + atct -+-••• + a„c„, que no es otra cosa que A B + A - C. Esto prueba lo que se quería. Como ejercicio, demostrar la propiedad del PE 3. Por último para probar PE 4, nótese que si una coordenada a¡ de A no es igual a 0, entonces existe un término a¡ =£ 0 y a¡ > 0 en el producto escalar A • A = ai + + al. Como cada término es S 0, se deduce que la suma es > 0, que es lo que se quería demostrar. En gran parte del trabajo que realizaremos con los vectores sólo se emplea- rán las propiedades ordinarias de la adición, de la multiplicación por números y de las cuatro propiedades del producto escalar. Más adelante, se discutirán for- malmente éstas últimas. Mientras tanto, obsérvese que existen otros objetos con
12 ALGEBRA LINEAL los cuales el lector se encuentra familiarizado y que se pueden sumar, restar y multiplicar por números, como, por ejemplo, las funciones continuas definidas sobre un intervalo [a, b] (ver el ejercicio 5). Será conveniente escribir d2 en lugar de A A para representar el producto escalar de un vector con él mismo. (Este es el único ejemplo para el cual se emplear^ tal notación. Así entonces A2. no tiene significado alguno.) Verificar, como ejer- cicio, las siguientes identidades: (A + B)2 = A2 + 2A B + B2, (A - B)2 = A2 — 2A B + B2. Un producto interior A B puede muy bien ser igual a 0 sin que ninguno de los vectores A o B sea el vector nulo. Por ejemplo, sean A = (1,2, 3) y B = (2,1, — 3). Entonces A • B = 0. Se dice que dos vectores A y B son perpendiculares entre sí (u ortogonales como también se les llama) si A • B = 0. Por ahora no es evidente que en el plano esta definición coincida con la noción geométrica intuitiva de perpendicularidad; en la siguiente sección convenceremos al lector de tal coincidencia. Mientras tanto, daremos solamente un ejemplo. Considérense, en R3, los tres vectores unitarios £, = (1,0,0), E2 = (0,1,0), £3 = (0,0,1) como se representan en el diagrama (figura 11). Se ve entonces que £1 • £2 = 0 y que, análogamente, £,- • Ej = 0, si i j. Yasí, estos vectores se consideran perpendiculares entre sí. Si A = (aj, a2. a3), enton- ces la i-ésima componente de A, a saber: a,; = A • £, es el producto interior de A con el i-ésimo vector unitario. Se ve que A es perpen- dicular a £, (de acuerdo con la definición de perpendicularidad con el producto interno) si y sólo si su i-ésima componente es igual a 0.
VECTORES 13 Ejercicios 1. Para cada una de las n-uplas que aparecen en los ejercicios del 1 al 6 del §1, determi- nar A - A. 2. Para las mismas n-uplas que aparecen en el ejercicio anterior, determinar A B. 3. Usando sólo las cuatro propiedades del producto escalar, verificar con todo detalle las identidades dadas en el texto para (A + B)2 y (A — B)2. ’ ¿Qué parejas de vectores son perpendiculares entre sí? (a) (1,-1, 1) y (2, 1,5) (b) (1, -1,1) y (2, 3, 1) JcH-5,2, 7) y (3, -1,2) (d) (tt, 2,1) y (2, -n,0) ^5jConsiderar las funciones continuas definidas sobre el intervalo [—1,1]. Definase el pSoucto escalar de dos de dichas funciones /, g como | f<x)g(x¡ dx. También denotaremos con </, g) la misma integral. Verificar que se satisfacen las cuatro reglas para un producto escalar; en otras palabras, mostrar que: PEI. </,<?> = <g,/>. PE2.</,9 + h> = </,9> + </,h>. . PE 3. <c/, g) = c</, g>- PE 4.J'f f = 0, entonces </, /> = 0 y si f 0, entonces </,/> > 0. ó^Calcular </, />, <9, g> y <J, g\ si f(x) = x y g(x) = x2. C7.Jbonsi*dérense funciones continuas definidas sobre el intervalo [ — n, re]. Definir un pro- ducto escalar para este intervalo, semejante al del ejercicio anterior. Demostrar que las fun ciones sen nx y eos mx son ortogonales para este producto escalar (m, n son enteros). 8. Sea A un vector perpendicular a todo vector X. Demostrar que A = 0. §4. La norma de un vector Se define la norma o longitud de un vector 4 y se denota con ||4|| el número Mil = Como A • A > 0, se puede extraer la raíz cuadrada. En términos de coordenadas, se observa que p|| = Ja2t +--- + a2n, y, por consiguiente, que cuando n = 2 ó n = 3, esta fórmula coincide con la noción intuitiva (derivada del teorema de Pitágoras) de longitud. Por cierto, cuando n = 2 y digamos que A = (a, b) entonces la norma de A es MU = como se puede apreciar en la figura 12. uinHuiiniHiiniininniini
14 ALGEBRA LINEAL Figura 12 Por ejemplo, si A = (1, 2), entonces imii = x/íT4 = y?. Si B = (— 1,2, 3), entonces ||B|| = VTT4T9 = y/14. Si n = 3, entonces el diagrama se ve como en la figura 13, con A = (x, y, z) Si nos fijamos primero en las dos componentes (x, y), entonces, como se in- dicó, la longitud del segmento que une a (0,0) con (x, y) es igual a w = y/x2 + y2. Entonces, nuevamente la longitud de A sería, por el teorema de Pitágoras, y/w2 + z2 = y/x2 + y2 + z2. Así, cuando n = 3, la definición de longitud es compatible con la geometría del teorema de Pitágoras. Si A = {a¡,..a„) y A 0, entonces ||A|| 0, debido a que alguna coorde- nada a¡ =£ 0, por lo que a2 > 0 y. por tanto, a2 + ...,+ a2 > 0; por consiguiente, Mil / o-
VECTORES 15 Nótese que para cualquier vector A, se tiene que Esto se debe al hecho de que (~ai)2 + • • • + (— a„)2 — a¡ + • • + a2, porque (—l)2 = 1. Por supuesto, así debe ser según la figura: Figura 14 c A partir de la geometría de la situación, también resulta razonable suponer que si c > 0, entonces || cA || = c|| A ||,estoes,si se alarga un vector A al multiplicarlo por un número positivo c, entonces la longitud también se incrementa en la misma cantidad. Se puede verificar formalmente lo expuesto, usando la definición de longitud. Teorema 1. Sea x un número. Entonces l|xA|| = |x| ||A|| (el valor absoluto de x por la longitud de A). Prueba. Por definición se tiene que ||xA||2 = (xA)-(xA), que es igual a x2(A A) por las propiedades del producto escalar. Tomando ahora la raíz cuadrada se obtiene lo que se quería. Se dice que un vector £ es un vector unitario si ||£|¡ = 1. Dado cualquier vectorA, sea a = ||A||. Si a # 0, entonces ’a a
16 ALGEBRA LINEAL es un vector unitario, porque Se dice que dos vectores A y B (ninguno de los cuales es el vector O) van en el mismo sentido si existe un número c > 0 de modo que cA = B. Debido a esta definición, el vector MI A es un vector unitario con el sentido de A (suponiendo que 4^0). Figura 15 Si E es el vector unitario con el sentido de A, y ||41| = a, entonces A = aE. Ejemplo 1. Sea A = (1,2,—3). Entonces ||4|| = y/ii. Por tanto el vector uni- tario con el sentido de A es el vector Mencionemos de paso que dos vectores A y B (ninguno de los cuales es el vector O) van en sentidos opuestos si existe un número c < 0 tal que cA = B. Sean A y B n-uplas. Se define la distancia entre A y B de la siguiente manera: ||4 - B|| = V(4-B)(4-B). Esta definición coincide con la intuición geométrica cuando A y B son puntos en el plano (figura 16). Es lo mismo que la longitud del vector localizado AÉ o del vector localizado BÁ.
VECTORES 17 9 Figura 16 Ejemplo 2. Sean A = (—1,2) y B = (3.4). Entonces la longitud del vector AB es igual a )|B— .4||. Pero B — A = (4, 2). Por tanto ||B —4|| =716 + 4 = 720? En el diagrama se ve que el lado horizontal tiene una longitud igual a 4 y el lado vertical tiene una longitud igual a 2. Por lo que las definiciones reflejan la intui- ción geométrica derivada de Pitágoras. Figura 17 También nos encontramos en posición de poder justificar la definición de per- pendicularidad. Dados A y B en el plano, la condición IM + B|| = B|| (ilustrada en la figura 18 (b)) coincide con la propiedad geométrica de que A debe ser perpendicular a B. Figura 18
18 ALGEBRA lineal Elevando al cuadrado cada miembro, se ve que esta condición es equivalente a (A + B)(4 + B) = (4 —B)(4 — B), que al ser desarrollada equivale a A- A + 2A-B + B B = A A — 2A- B + B- B. Reduciendo, se obtiene la condición equivalente 44 • B = 0 o bien A B = 0. Así se obtiene lo que se quería demostrar: ||4— B|| = ||4 + B|| si y sólo si A • B = 0. Obsérvese que tenemos el teorema general de Pitágoras: si A, B son perpen- diculares entre si, entonces ||4 + B||2 = ||4||2 + ||B||2. El teorema aparece ilustrado en la figura. Para probarlo, se emplean las definiciones, a saber: II A + B||2 = (A + B) • (4 + B) = A2 + 24 • B + B2 = Mil2 + Mil2, puesto que por definición se tiene que 4 • B = 0, y A- A = ||41|2, B • B = ||B||2. Nota. Si 4 es perpendicular a B y si x es cualquier número, entonces 4 es perpendicular también a xB porque 4 • xB = xA • B = 0.
VECTORES 19 Empleamos ahora la noción de perpendicularidad para deducir la noción de proyección. Sean A y B dos vectores y B £ 0. Vamos a definir la proyección de A a lo largo de B, la cual resulta ser un vector P como se puede apreciar en la siguiente ilustración: Se busca un vector P tal que A — P sea perpendicular a B y tal que P se pueda expresar en la forma P = cB para algún número c. Supóngase que podemos hallar dicho número c; a saber, uno que satisfaga (A - cB) • B = 0. Entonces se obtiene A • B = cB • B y, por consiguiente, AB B B Se ve que por la condición de perpendicularidad, el número c está determinado en forma única. Reciprocamente, si c toma el valor mencionado anteriormente, entonces se tiene (A - cB) • B = A • B - cB B = 0. Así, este valor de c satisface nuestros requerimientos. Ahora vamos a definir al vector cB como la proyección de A a lo largo de B, si c es el número y se define c como la componente de A a lo largo de B. Si B es un vector unitario, entonces simplemente se tiene c= AB. Ejemplo. Sean A = (1,2, - 3) y B = (1,1,2). Entonces la componente de A a lo largo de B es el número _ A B_ -3 _ _ ] C ~ B B~~6~ ~~ í
20 ALGEBRA LINEAL Por lo que la proyección de A a lo largo de B es el vector cB = (-|, -1). Esta construcción tiene un significado inmediato en el plano, que ofrece una interpretación geométrica del producto escalar. Por ejemplo, supóngase que A O y obsérvese el ángulo 0 formado por A y B (figura 21). Entonces, según la geometría plana se tiene o bien al sustituir el valor de c, obtenido con anterioridad, A B = |¡A|| ||B|| eos 0. En algunos tratados sobre vectores, se considera la relación A B = M|| ||B|| eos 0 como la definición del producto escalar. Esta se encuentra sujeta a las siguientes desventajas, por no decir objeciones: . (a) Las cuatro propiedades del producto escalar PE 1 hasta PE 4 no son, de ninguna manera, obvias. (b) Hay que confiar en la intuición geométrica con el fin de obtener el coseno del ángulo formado por A y B, aún en el caso del espacio de 3 dimensiones, y esta intuición es menos clara que en el plano. En espacios de mayor dimensión, la intuición falla aún más. (c) Resulta extremadamente difícil trabajar con tal definición para lograr propiedades adicionales del producto escalar. Por tanto, es preferible establecer fundamentos algebraicos obvios y después recuperar todas las propiedades sencillamente. Además de esto, en análisis se usan los productos escalares en el contexto de las funciones donde el coseno de 0 pierde totalmente su significado, como, por ejemplo, en el ejercicio 5 del § 3, que es el punto de partida de la teoría de las series de Fourier.
VECTORES 21 Empleando los resultados sobre perpendicularidad, vamos a probar más pro- piedades tanto de la norma como del producto escalar. Obsérvese primero un caso especial. Si E, = (0,...,0, 1, 0,...,0) es e^i-ésimo vector unitario de R", y si A = (a,, ., a„), entonces A • E¡ = a¡ es la i-ésima componente de A, es decir, la componente de A a lo largo de E¡. Se tiene |af| = Tal ¿ Ta? + • + a2„ = M ||, de tal manera que el valor absoluto de cada una de las componentes de A es a lo sumo igual a la longitud de A. No tenemos que trabajar sólo con los vectores unitarios especiales como el que se acaba de ver. Sea E cualquier vector unitario, esto es un vector de longitud igual a 1. Sea c la componente de A a lo largo de E. Vimos que c = A E. Luego A — cE es perpendicular a E, y como A = A — cE + cE. Entonces A — cE también es perpendicular a cE y por el teorema de Pitágoras se obtiene Mil2 = IM - cE||2 + ||c£||2 = M - cE||2 + c2. Así, entonces, tenemos la desigualdad c2 íí M||2 y, por tanto, kl Mil- En el siguiente teorema generalizamos esta desigualdad para un producto escalar A • B, en donde B no es necesariamente un vector unitario. Teorema 2. Sean A, B dos vectores en R". Entonces |/i-b| s Mil Mil-
22 ALGEBRA LINEAL Prueba. Si B = O, entonces ambos miembros de la desigualdad son iguales a 0, y por tanto el enunciado es válido. Supóngase que B O. Sea E el vector unitario en el sentido de B, de tal manera que e = -L- 11*11 Empleando ahora el resultado que acabamos de deducir, o sea: \A -£| ||4||, hallamos que Al multiplicar por ||B|| se obtiene la prueba del teorema. Por el teorema 2 se ve que para vectores A y B en el espacio de n dimensiones, el número AB Mil 11*11 tiene valor absoluto íS 1. Por tanto, _! < B < i = Mil 11*11 = ’ y existe un ángulo único ff tal que 0 0 n, y tal que « A B co imii n*ir Se define este ángulo como el ángulo formado por A y B. Ejemplo. Sea A = (1,2, — 3) y B = (2,1,5). Encontrar el coseno del ángulo Q for- mado por A y B. Por definición, se tiene que AB 2 + 2-15 _ -11 COS ~ Mil 11*11 " Vlt/30 '7420' La desigualdad enunciada en el teorema 2 se conoce como la desigualdad de Schwarz. Teorema 3. Sean A y B vectores. Entonces M + *11 ¿ Mil + 11*11- Prueba. Los dos miembros de esta desigualdad son positivos o iguales a 0. Por lo que será suficiente probar que sus cuadrados satisfacen la desigualdad de- seada; en otras palabras, (A + B) (A + B) íS (||A|| + ||B||)2.
VECTORES 23 Para lograrlo, consideremos (A + B)(A + B) =AA + 2AB + BB. A la luz del resultado previo, se puede observar que esto satisface la desigualdad s hf + 2||a« íb|| + hbip, en donde esta última expresión no es otra cosa que (IMII + IIBII)2- El teorema queda probado. El teorema 3 se conoce como la desigualdad del triángulo. La razón para esto es que si dibujamos un triángulo como el de la figura 22, entonces el teorema 3 ex- presa el hecho de que la longitud de un lado es :£ a la suma de las longitudes de ¡os otros dos lados (ver el ejercicio 11). / ll-l + BII .I+B / Figura 22 J Ejercicios 1. En los ejercicios del 1 al 6 del §1, encontrar la longitud del vector A. 2. En los ejercicios del 1 al 6 del §1, encontrar la longitud del vector B. 3. En los ejercicios del 1 al 6 del §1, encontrar la proyección de A a lo largo de B. 4. Encontrar la proyección de B a lo largo de A, en el mismo grupo de ejercicios del ejer- cicio 3. 5. En el ejercicio 6 del §3, hallar la proyección de f a lo largo de g y la proyección de g a ío largo de /, usando la misma definición de proyección que la que aparece en el texto (y no referida a coordenadas). 6. Encontrar la norma de las funciones sen 3x y eos x con respecto al producto escalar dado por la integral, sobre el intervalo [ — n, ítj. 7. Encontrar la norma de la función constante igual a 1 sobre el intervalo [—tt, n]. 8. Encontrar la norma de la función constante igual a 1 sobre el intervalo [—1,1]. 9. Sean A¡,A, vectores diferentes al vector cero que son mutuamente perpendicu- lares; en otras palabras, A¡ A¡ = 0 si i # j. Sean ct, ..., cr números tales que c¡A¡ + ' ' + CrAr — 0. Demostrar que todo c¡ = 0.
24 ALGEBRA LINEAL 10. Sean A y B vectores diferentes del vector cero en el espacio de n dimensiones. Sea 0 el ángulo formado por ellos. Si eos 9=1, demostrar que A y B tienen el mismo sentido. Si eos 0 = — 1, demostrar que A y B tienen sentido opuesto. [Sugerencia: si c es la componente de A a lo largo de B, demostrar que (A — cB)2 = 0]. 11. Si A y B son vectores en el espacio de n dimensiones, indicar con d (A, B) la distancia entre A y B, es decir, d(A, B) = ||B — A||. Demostrar que d(A, B) = d(B, A), y que para cualesquiera tres vectores A, B y C se tiene d(A, B) á 4(4, Q + d(B, C). 12. Para cualesquiera vectores A, B en el espacio de n dimensiones, probar las siguientes relaciones: (a) + B||2 + M - B||2 = 2||< + 2||B||2. (b) M + B||2 = MI2 + |B||2 + 2A B.. (c) ||X + B||2 - |4 - B||2 = 4A • B. Interpretar (a) como una «ley del paralelogramo». 13. Determinar el coseno de los ángulos del triángulo cuyos vértices son (a) (2, — 1,1),(1, —3,-5),(3,-4, —4) (b) (3, 1,1), (—1,2,1), (2, —2, 5). 14. Demostrar que si 0 es el ángulo formado por A y B, entonces M - B||2 = MJ2 + |B||2-2|M|| |B| eos 0. 15. Sean A, B, C tres vectores distintos al vector cero. Si A B — A • C, entonces demostrar mediante un ejemplo que no necesariamente se tiene que B = C. 16. Sean A, B vectores diferentes al vector cero, mutuamente perpendiculares. Demostrar que para cualquier número c, se tiene ||4 + cB|| ||4||. 17. Sean A, B vectores diferentes al vector cero. Supóngase que M 4* cB|| ¿ M|| para todo número c. Demostrar que A, B son perpendiculares entre sí. [Sugerencia: tómese c con valor muy grande, ya sea positivo o negativo]. ^18Jilean Bt,..., B„ vectores de longitud igual a 1 en el espacio de n dimensiones, mu- tuamrtne perpendiculares; esto es, que Bi Bj = 0 si i j. Sea A un vector en el espacio de n dimensiones y sea c¡ la componente de A a lo largo de B¡. Sean x,,..., números. Demos- trar que M - (ciB! + • • + Crb„)| g m - (^iBí+ • • • + *A)I- §5. Rectas y planos Se define la ecuación paramétrica de una linea recta que pasa por un punto P en la dirección de un vector A 0 coino X = P + tA, donde t recorre todos los números (figura 23).
VECTORES .25 Figura 23 Supóngase que trabajamos en el plano y escribimos (x, y), para representar un punto X. Sean P = (p, q) y A = (a, b). Entonces en términos de las coordena- das se puede expresar x = p + ta, y = q + tb. Luego se piuede eliminar t y obtener la ecuación usual que relaciona x con y. Por ejemplo, sean P = (2, 1) y A = ( — I , 5). Entonces la ecuación paramétrica de la recta que pasa por P en el sentido de A nos da (♦) x = 2 - t, y = 1 + 5t. Al multiplicar la primera ecuación por 5 y sumar las dos, obtenemos (**) 5x + y = 11, que nos es familiar. Esta eliminación de t muestra que toda pareja (x, y) que satisface la ecuación paramétrica (*) para algún valor de t, satisface también (**). Reciprocamente, supóngase que tenemos una pareja de números (x, y) que satisface (**). Sea t = 2 — x. Entonces. y = 11 _ 5x = 11 - 5(2 - t) = 1 + 5t. Por tanto, existe cierto valor de t que satisface la ecuación (*). De este modo se ha probado que las parejas (x, y) que son soluciones de (**) son exactamente las mismas parejas de números que las obtenidas al asignarle a t valores arbitrarios en (*). Así, la línea recta se puede describir paramétricamente como en (*) o bien en términos de su ecuación usual (*♦). Comenzando con la ecuación ordinaria 5x + y = 11, se hace t = 2 — x con el objeto de recuperar la forma paramétrica específica de (*). Cuando se parametriza una línea recta en la forma X = P + tA,
26 ALGEBRA LINEAL es claro que hay infinidad de posibilidades para escoger P sobre la recta y tam- bién infinidad de posibilidades para escoger A, difiriendo por un múltiplo escalar. Siempre podemos seleccionar al menos uno. Es decir, dada una ecuación ax + by = c donde a, b, c, son números y donde suponemos que a ± 0. Se emplea y como parámetro y hacemos y = t. Entonces, se puede resolver para x, es decir c b x =-------t. a a Sean P = (c/a,Q) y A = { — b/a, 1). Nótese que un punto arbitrario (x, y) que satis- face la ecuación ax + by = c se puede expresar en forma paramétrica, o sea: (x, y) = P + tA. En dimensiones más grandes, al comenzar con una ecuación paramétrica X = P + tA, se puede eliminar t y, por tanto, la ecuación paramétrica es la única disponible para describir una línea recta. Sin embargo, es posible describir planos mediante una ecuación semejante a la sencilla ecuación de la recta. Se procede como se indica a continuación. X
VECTORES 27 Sea P un punto y considérese un vector localizado 0$. Se define el hiperplano que pasa por P y que es perpendicular a ON como la colección de todos los pun- tos X tales que el vector localizado P? es perpendicular a ON. Conforme a las anteriores definiciones, esto equivale a la condición (X - P) N = 0 zx que también se puede expresar como X N = P N. También diremos que este hiperplano es perpendicular a N y que constq de todos los vectores X tales que X — P es perpendicular a N. En la figura^V se ha di- bujado una situación típica en el espacio de 3 dimensiones. En vez de decir que N es perpendicular al plano, también se dice que N es normal al plano. Sea i un número / 0. Entonces, el conjunto de puntos X tales que (X - P) • N = 0 coincide con el conjunto de puntos X, de modo que (X - P) • tN = 0. Asi, se puede decir que el plano es aquel que pasa por P y que es perpendicular a la recta en el sentido de N. Para hallar la ecuación del plano se podría emplear cualquier vector tN (donde t ¿ 0) en lugar de N. En un espacio tridimensional obtenemos un plano ordinario. Por ejemplo, sean P — (2,1, — 1) y N = (— 1,1, 3). Entonces, la ecuación del plano que pasa por P y es perpendicular a N es — x + y (- 3z = —2 + 1 —3 ( N o bien -x + y + 3z = -4. Nótese que en un espacio bidimensional, donde X = (x, y), obtenemos la ecuación de la recta en el sentido ordinario. Por ejemplo, la ecuación de la recta que pasa por (4, —3) y es perpendicular a ( — 5,2) es - 5x + 2y = -20 - 6 = -26. Nos encontramos ahora en posición de dar una interpretación a los coeficientes ( — 5, 2) de x y y que aparecen en esta ecuación. Tales coeficientes dan origen a un vector perpendicular a la recta. En cualquier ecuación ax + by = c
28 ALGEBRA LINEAL el vector (a, b) es perpendicular a la recta determinada por la ecuación. Análo- gamente, en el espacio tridimensional el vector (a, b, c) es perpendicular al plano determinado por la ecuación ax + by + cz = d. Por ejempjo, el plano determinado por la ecuación 2x — y + 3z = 5 es perpendicular al vector (2, — 1, 3). Claro está que hay muchas elecciones si se quiere encontrar un punto en ese plano. Podemos asignarles valores arbitrarios tanto a x como a y -y después resolver para z. Para encontrar un punto concreto, considérese que x = 1 y que y = 1. Se resuelve luego para z, es decir, 3z = 5 — 2 + 1 — 4, de tal manera que z = |. Por tanto (1,14) es un punto que se encuentra en el plano. Se dice que dos vectores A, B son paralelos si existe un número c # 0 tal que cA = B. Se dice que dos rectas son paralelas si, dados dos puntos distintos entre s* Pi> Qi en la primera recta y P2, Qz en la segunda, los vectores Pi - Qi 7 Pz- Qz son paralelos. Se dice que dos planos son paralelos (en el espacio tridimensional) si sus vec- tores normales son paralelos. Se dice que son perpendiculares entre sí si sus vectores normales son perpendiculares entre sí. El ángulo formado por los planos se define como el ángulo formado por sus vectores normales. Ejemplo 1. Encontrar el coseno del ángulo formado por los planos 2x - y + z = 0, x + 2y — z = 1. Este coseno es el coseno del ángulo formado por los vectores A = (2, —1,1) y B = (1,2—1). En consecuencia, es igual a AB 1 IMII 11*11 ~ 6'
VECTORES 29 Ejemplo 2. Sean Q = (1,1,1) y P = (1, — 1,2). Sea N = (1,2,3). Encontrar ei punto de la intersección de la recta que pasa por P en el sentido de N y del plano que pasa por Q y que es perpendicular a N. La ecuación paramétrica de la recta que pasa por P en el sentido de N, es (1) X = P + tN. La ecuación del plano que pasa por Q y que es perpendicular a N, es (2) (X-Q)N = 0. En la siguiente figura se representan la recta y el plano: Se debe hallar un valor de t tal que el vector X que aparece en (1) satisfaga tam- bién (2), o sea: (P + tN - Q) • N = 0, o bien, después de usar las reglas del producto interior, (P - Q) • N + tN • N = 0. Resolviendo para t, se obtiene t - (Q - p) • = 1 N N 14 Asi, el punto deseado de la intersección es P + tN = (1, - 1, 2) + ^(1, 2, 3) = (45, - H, &) Ejemplo 3. Encontrar la ecuación del plano que pasa por los siguientes puntos: P, =(1,2, -1), P2 = (-1,1,4), P3 = (1, 3, —2).
30 ALGEBRA LINEAL Mediante un esquema se representan los tres puntos de la manera siguiente: Pt Figura 26 Ps Entonces se encuentra un vector N que sea perpendicular a P1P2 y P1P3, 0 sea, perpendicular a P2 — Pi y P3 — Py. Tenemos P2 - Pi = (-2, -1, +5), P3 - Pi = (0,1, - 1. Sea N = (a, b, c). Debemos resolver: — 2a — b + 5c — 0, b — c = 0. Hacemos b = c — 1 y resolvemos para a, con lo que se obtiene a = 2. Entonces N = (2,1,1) satisface nuestros requerimientos. El plano perpendicular a N que pasa por Pt es el plano deseado. En consecuencia, su ecuación es 2x + y + z = 2 + 2 — 1 = 3. Ejercicios Encontrar una ecuación paramétrica para la recta que pasa por los siguientes puntos: 1. (1.1.-1) y (-2, 1,3) 2. (-1,5,2) y (3, — 4, 1) Encontrar la ecuación de la recta en un espacio tridimensional que es perpendicular a A y que pasa por P para los siguientes valores de A y de P: 3. 4 = (1, — 1), P = ( —5, 3) 4. A = (-5,4), P = (3,2) 5. Demostrar que las rectas 3x — 5y = 1, 2x + 3y = 5 no son perpendiculares entre si.
VECTORES 31 6. ¿Cuáles de las siguientes parejas de rectas son perpendiculares entre si? (a) 3x - 5y = 1 y 2x + y = 2 (b) 2x + 7y = 1 y x — y = 5 (c) 3x — 5y = 1 y 5x + 3y = 7 (d) -x+y=2yx+y=9 7. Encontrar la ecuación del plano que es perpendicular al vector N y que pasa por el pun- jo P dado. (a) N = (1, -1,3),P = (4,2, -1) (b) N - (-3, — 2, 4), P = (2, rt, -5) (c) N = (- 1,0, 5), P = (2,3, 7) 8. Encontrar la ecuación del plano que pasa por los siguientes tres puntos: (a) (2, 1,1), (3,-1,1), (4, 1,-1) (b) (-2, 3,-1), (2, 2, 3),(—4, -1,1) (c) (-5, -1,2), (1, 2,-1), (3,-1,2) 9. Encontrar un vector que sea perpendicular a (1, 2, —3) y a (2, — 1, 3) y otro vector que sea perpendicular a ( — 1, 3,2) y a (2,1,1). 10. Sea P el punto (1,2, 3,4) y Q el punto (4, 3,2,1). Sea A el vector (1, 1,1, 1). Sea L la recta que pasa por P y que es paralela al vector A. (a) Dado un punto X sobre la recta L, calcular la distancia entre Q y X (como una función del parámetro t). (b) Demostrar que hay precisamente un punto Xo sobre la recta, tal que esta distancia alcanza un mínimo y que este mínimo es igual a 2^/5. (c) Demostrar que Xo - Q es perpendicular a la recta. 11. Sea P el punto (1, — 1,3,1) y Q el punto (1,1, — 1,2). Sea A el vector (1, —3,2,1). Resolver las mismas preguntas que se formularon en e! problema anterior, salvo que en este caso la distancia mínima es igual a 146/15. 12. Encontrar un vector que sea paralelo a la recta formada por la intersección de los planos 2x - y + z = 1, 3x + y + z = 2. 13. El problema es análogo al del ejercicio anterior salvo que ahora los planos son 2x + y + 5z = 2, 3x - 2y + z = 3. 14. Encontrar una ecuación paramétrica para la recta formada por la intersección de los planos de los ejercicios 12 y 13. 15. Encontrar el coseno del ángulo formado por los siguientes planos: (a) x + y + z = 1 (b). 2x + 3y — z = 2 x — y — z = 5 x — y + z = 1 (c) x + 2y — z = 1 (d) 2x + y + z = 3 — x + 3y + z = 2 — x — y + z = n 16. Sea P = (1, 3, 5) y A = (-2,1,1). Determinar la intersección de la recta que pasa por P en el sentido de A, con el plano 2x + 3y — z = 1.
32 ALGEBRA LINEAL 17. Sean Q = (1, -1,2), P = (1,3, -2), y N = (1,2,2). Encontrar el punto de la inter- sección de la recta que pasa por P en el sentido de N, con el plano que pasa por Q y que es perpendicular a N. 18. Sean P y Q puntos y N un vector en el espacio de 3 dimensiones. Sea F el punto de intersección de la recta que pasa por P, en el sentido de N, y del plano que pasa por Q per pendicular a N. Definimos la distancia de P a ese plano como la distancia que hay entre P y F. Determinar esta distancia cuando P = (1,3.5), Q = (—1,1,7), N = (-l, 1, -1)- (G^Con la notación empleada en el ejercicio 18, demostrar que la fórmula general para la owfancia está dada por |(Q-P)N|. |N| 20. Hallar la distancia entre el punto y el plano indicado. (a) (1,1,2) y 3x + y — 5z = 2. (b) (— 1,3,2) y 2x — y + z = 1. 21. Sean P = (1,3, —1) y Q = (—4,5,2). Determinar las coordenadas de los siguientes puntos: (a) el punto medio del segmento de recta que une a F con Q; (b) los dos puntos, sobre este segmento de recta, que se encuentran a uno y a dos tercios respectivamente e trayectoria que va de P a Q. 22. Si P y Q son puntos arbitrarios en el espacio de n dimensiones, indicar la fórmula general para el punto medio del segmento de recta que une a P con Q. §6. El producto vectorial ¡Esta sección tiene validez sólo para espacios tridimensionales! Sean A = (aH a2, a3) y B = (bt, b2, b3) vectores en el espacio tridimensional. Se ddine su producto vectorial como A x B = (a2b3 — a3b2, a3bi — aib3, atb2 — a2bi). Por ejemplo, si A = (2, 3, — 1) y B (— 1,1, 5), entonces A x B = (16, —9, 5). Como ejercicios, se dejan los siguientes enunciados: PV1. A x B = -(B x A}. PV 2. A x (B + C) = (A x B) + (A x C), y (B + C)xA = BxA + Cx A.
VECTORES 33 PV 3. Para cualquier número a, se tiene (a/1) x B = a(A x B) = A x (aB). PV 4. (A x B) x C = (A • C)B - (B • C)A. PV 5. A x B es perpendicular tanto a A como a B. ' ^Desarrollar el siguiente cálculo como ejemplo. Tenemos que A (A x B) = at(a2b3 - a3b2) + a2(a3bi - a,b3) + 03(0^2 - a2b3) = 0 ya que todos los términos se cancelan. Análogamente para B (A x B). Esta per- pendicularidad se puede ilustrar como se indica a continuación: El vector A x B es perpendicular al plano generado por Ay B. Así, también resulta ser B x 4, aunque B x A apunta en el sentido «puesto. Finalmente, como una última propiedad, tenemos PV 6. (A x B)2 = (A A)(B B)-(A- B)2. Nuevamente, esto se puede verificar mediante un cálculo sobre las coordenadas. Es decir que (A x B) (A x B) = («2^3 — a3b2)2 + (a3bi — a,b3)2 + (a3b2 — a2bt)2, (A A)(B B) - (A B)2 — (a2 + í>2 + aí)(bi + b2 + b3) — (a3b3 + a2b2 -I- a3b3)2. Desarrollando todos los términos y simplificando, vemos que PV 6 desaparece. A partir de nuestra interpretación del producto interior y de la definición de la norma se puede expresar PV 6 en la siguiente forma: ||A X B||2 = ||/1||2||B||2 - ||A||2||B||2cos29,
34 ALGEBRA LINEAL donde 0 es el ángulo formado por A y B. De aquí se obtiene M x = |M||2||B|[2sen20 o bien M X B|| = MU ||B|| |sen0|. Que es análoga a la fórmula que nos dio el valor absoluto de A • B. Ejercicios Encontrar A x B, para los siguientes vectores: t. ¿ = (1, — 1, l)yB = (-2,3,1) 2. A = (-1,1,2)yB = (l,0,-1) 3. ¿ = (1,1,-3) y B = (-1,-2,-3) 4. En los ejercicios del 1 al 3, hallar A x A y B x B. 5. SeanEj = (l,0,0),E2 = (0,l,0),yE3 = (0,0,1). Determinar Ei x E2,E2 x E3,E3 x Et. 6. Demostrar que para cualquier vector A en el espacio tridimensional tenemos que A x A = O. 7. Calcular Et x (E] x E2) y (Et x Et) x E2. ¿Son estos vectores iguales entre sí? §7. Números complejos Los números complejos son un conjunto de objetos que se pueden sumar y multiplicar, en donde la suma y el producto de dos números complejos es tam- bién un número complejo, y que satisfacen las siguientes condiciones. (1) Todo número real es un número complejo, y si a, P son números reales, V entonces su suma y su producto como números complejos corresponden ' a su suma y a su producto como números reales. (2) Existe un número complejo denotado por i tal que i2 = — 1. (3) Todo número complejo se puede escribir de manera única en la forma a + bi donde a, b son números reales. (4) Las leyes ordinarias de la aritmética concernientes a la adición y a la multiplicación, se cumplen. Damos a continuación una lista de esas leyes. Si a, P, y son números complejos, entonces (“/?)}' = a(/?y) y (a + P) + y = a + (P + y). Tenemos que a(j? + y) = ap + ay, y (P + y)a = P« + ya. Tenemos que aP = Py, y a + p = P + a.
35 VECTORES Si 1 es el número real uno, entonces la = a. Si 0 es el número real cero, entonces Oa = 0. Tenemos que a + ( — l)a = Ol Ahora se pueden derivar algunas consecuencias de estas propiedades. Con cada número complejo^+ bi,se asocia el vector (a, b) en el plano. Sean a = ai + + a2i y 0 = bt + b2i números complejos. Entonces a + 0 = O] + bj + (a2 + b2)i. Por tanto, la adición de números complejos se efectúa «componente a componente» y corresponde a la adición de vectores en el plano. Por ejemplo, (2 + 3i) + (—1 + 5ij = 1 + 8í. Al multiplicar números complejos se usa la regla i2 = — 1 para simplificar un producto y se escribe en la forma a + bi. Por ejemplo, sean « = 2 + 3i y 0=1 —i- Entonces a0 = (2 + 3iXl - 0 = 2(1 - 0 + 3i(l - i) = 2 — 2í 4- 3i — 3i2 = 2 + i - 3(— 1) = 2 + 3 + i = 5 + i. Sea a = a + bi un número complejo. Se define a como a — bi. Así, si a = 2 + 3i, entonces a = 2 — 3i. El número complejo a se denomina el conjugado de a. Se ve de inmediato que d- Z- 31 aa = a2 + b2. Con la interpretación vectorial de los números complejos se observa que aa es el cuadrado de la distancia del punto(a, b)desde el origen. Ahora tenemos otra importante propiedad de los números complejos, que nos permite dividir entre números complejos distintos de 0. Si a — a + bi es un número complejo # 0, y si se hace j =______«_____ a2 + b2 a - be .2 entonces a2 = 2a = 1. La prueba de esta propiedad es una consecuencia inmediata de la ley de la multiplicación de números complejos, ya que a_________aa _ , a a2 + b2 a2 + b2 El número 2 se conoce como el inverso de a y se denota por a 1 ó por 1/a.
36 ALGEBRA LINEAL Si a, p son números complejos, escribimos P/a en vez de a~lp (o de Pa~l), tal como se hizo con los números reales. Nótese que se puede dividir entre números complejos #= 0. Definimos el valor absoluto de un número complejo a = ai + <«2 como |a| = í + al- Este valor absoluto no es otra cosa que la longitud del vector (ai, a2). Expresán- dolo en términos de valores absolutos, tenemos suponiendo que a / 0. Ahora se puede enunciar, para los números complejos, la desigualdad del trian- gulo conocida para la longitud de ¡os vectores. Si a, p son números complejos, entonces |a + P\ á l«| + \P\- En el ejercicio 5 se puede encontrar otra propiedad del valor absoluto. Ejercicios 1. Expresar los siguientes números complejos en la forma x + iy, donde x, y son núme- ros reales. (a) (-1 + 3i)-> (b) (1 + 1X1 - i) (c) (1 + i)i(2 - i) (d) (i - 1X2 - i) (e) (7 + mj(rt + i) (í) (2i + l)ai (g) (x/2 + íMn + 3i) (h) (i + 1X¡ - 2X¡ + 3) 2. Expresar los siguientes números complejos en Ja forma x + iy, donde x, y son núme- ros reales. (a)(l + i)-‘ (b)^ (c)|ij (d)^ 3. Sea a un número complejo # 0. Calcular el valor absoluto de a/a. ¡,A qué es igual a? 4. Sean a, P números complejos. Demostrar que aP = a py que a + P — a + p. ^^J2)emostrar que |a/?| = |a| |/?|. tó^yefinir la adición de .n-uplas de números complejos componente a componente y la multiplicación de n-uplas de números complejos como el producto de éstos por cada com- ponente de la n-upla. Si A = («i ..., a„) y B = (Pi, . -., P„) son n-uplas de números com- plejos, definir su producto escalar <4, B> como «i^i + • + ají»
VECTORES 37 (¡nótese la conjugación compleja!). Probar las siguientes reglas: PH 1. <4, B> = <¿f4>. PH 2. <4, B + C> = <A, B> + <4, C>. PH 3. Si a es un número complejo, entonces <a4, B> = a<4, B> y <4, aB> = í<4, B>. • JTH4. Si 4=0, entonces <4, 4> = 0, y en otro caso, <4, 4> > 0. 7. Se supone que el lector conoce las funciones seno y coseno y sus fórmulas de adición. Sea 0 un número real. (a) Definir e" = eos 9 + i sen 0. Demostrar que si 0t y 02 son números reales, entonces gWi+ti) _ ¿•e1'*!. Demostrar que cualquier número complejo cuyo valor absoluto sea igual a 1 se puede escribir en la forma e" para algún número real t. (b) Demostrar que cualquier número complejo se puede expresar en la forma re1’ para algunos números reales r, 0 con r S 0. (c) Si zt = r¡ei>‘ y z2 — r2e”¡ donde los números reales r2, r2, § 0 son números reales 0i, 02, demostrar que z,z2 = (d) Si z es un número complejo, y si n es un entero > 0, demostrar que existe un nú- mero complejo w tal que w" = z. En efecto, demostrar que existen n números complejos w distintos entre si. [Sugerencia: si z = re”, entonces considerar primero ri/>.e.»/»-i
im hhhhhuuhiuiuuuh i
t <7 / / "MU i 'Í^O-'O ';V." >r_¿/ o,iwju> ? /8 CAPITULO II Espacios vectoriales Una colección de objetos generalmente se conoce como conjunto. Un miem-¿fc^ bro de la colección también se llama elemento del conjunto. Resulta práctico<¿¡= usar símbolos breves para denotar ciertos conjuntos. Por ejemplo, denotamos por R el conjunto de todos los números reales y por C el conjunto de todos los números complejos. Resulta lo mismo decir «x es un número real» o bien decir que «x es un elemento de R». Denotaremos con R" el conjunto de todas las n-uplas de números reales. Así «X es un elemento de R"» y «X es una n-upla de números reales» vienen a significar lo mismo. En vez de decir que u es un elemento de un conjunto S, frecuentemente diremos que u está en S y escribiremos u e S. Si S y S'son conjuntos y si cada elemento de S' es un elemento de S, entonces decimos que S' es un subconjunío de S. Así, el conjunto de los números reales es un subconjunto del conjunto de los números complejos. Decir que S' es un subconjúnto de S es decir que S’ es parte de S. Nótese que la definición de un subconjunto no excluye la posibilidad de que S' = S. Si S' es un subconjunto de S, pero tal que S' S, entonces diremos que S' es un subconjunto propio de S. Luego C es un subconjunto de C, pero R es un sub- conjunto propio de C. Para denotar el hecho de que S' es un subconjunto de S y también para decir que S' está contenido en S escribimos S'CS. Si Si, y Sj son conjuntos, entonces la intersección de Si y S2, denotada por Sif>S2, es el conjunto de elementos que están tanto en Si como en S2. La unión de Si y S2, denotada por St S2, es el conjunto de elementos que están en Sj o bien en S2. §1. Definiciones Sea K un subconjunto de los números complejos C. Diremos que K es un campo si satisface las siguientes condiciones: (a) Si x, y son elementos de K, entonces x + y y xy son también elementos de K. (b) Si xeK, entonces — x es un elemento de K. Si además x^O, entonces x-1 también es un elemento de K. (c) Los elementos 0 y 1 son elementos de K. 39
40 ALGEBRA LINEAL Nótese que tanto R como C son campos. « Se denota con Q el conjunto de los números racionales, esto es, el conjunto de todas las fracciones m/n, donde m y n son enteros y además n 0. Se puede verificar fácilmente que Q es un campo. Se denota con Z el conjunto de todos los enteros. Entonces Z no resulta un campo, debido a que no se satisface la condición (b) mencionada anteriormente. En realidad, si n es un entero 0, entonces n-1 = 1/n no es un entero (excepto en el caso trivial en el cual n = 1 ó bien n = — 1). Por ejemplo, | no es un entero. El hecho esencial acerca de un campo es que éste es un conjunto de elementos que se pueden sumar y multiplicar, de tal manera que por una parte la adición y la multiplicación satisfacen las reglas ordinarias de la aritmética y de tal manera que se puede dividir por elementos distintos de cero. Es posible axiomatizar más ampliamente esta noción, lo que se hará posteriormente, con el objeto de evitar discusiones abstractas que resultan obvias cuando el lector ha adquirido la ma- durez necesaria en matemáticas. Tomando en cuenta está posible generalización, debemos decir que un campo como lo hemos definido antes, es un campo de nú- meros (complejos) a los cuales llamaremos simplemente campos. Si el lector así lo desea, puede restringir todo su estudio del álgebra lineal a los campos de los números reales y de los números complejos. Sin embargo, como es necesario trabajar con cada uno de estos campos, nos vemos obligados a escoger una letra neutra como K. Sean K y L campos, y supóngase que K está contenido en L(es decir, que K es un subconjunto de I). Entonces diremos que K es un subcampo deL. Así, cada uno de los campos que se están considerando es un subcampo de los números complejos. En particular se puede decir que R es un subcampo de C y que Q es un-subeam- po de R. Sea K un campo. Los elementos de K también se llamarán números (sin es- pecificación alguna) si es que la referencia a K queda clara en el contexto, o bien se llamarán escalares. Un espacio vectorial V sobre el campo K es un conjunto de objetos que se pueden sumar y que se pueden multiplicar por elementos de K, de tal manera que la suma de dos elementos de V es, de nuevo, un elemento de V, el producto de un elemento de V por un elemento de K es un elemento de V y, además, se sa- tisfacen las siguientes propiedades: EV 1. Dados los elementos u, v, w de V, se tiene que (u + v) + w = u + (v + w). EV 2. Existe un elemento de V, denotado por O, tal que O+u=u+O=u para todos los elementos u de V.
ESPACIOS VECTORIALES 41 EV 3. Dado un elemento u de V, el elemento —u en V es tal que u + (-u) = O. EV 4. ¡ 'ara todos los elementos u,v de V se tiene que U + V — v + u. /E¥5. Si es un número, entonces c(u -f- o) = cu + cv. ' , EV 6. Si a y b son números, entonces (a + b)v = av + bv. EV 7. Si a y b son números, entonces (ab)v = a(bv). i EV 8. Para todos los elementos u de V se tiene que 1 • u = u(en donde 1 es el ! número uno). j Todas estas regías se han empleado al trabajar con los vectores, o con fun- ! ciones aunque de ahora en adelante deseamos ser más sistemáticos y por tanto ; se ha hecho una lista de ellas. En los ejercicios aparecerán más propiedades que se pueden deducir fácilmente de las enunciadas, por lo que desde ahora vamos í a emplearlas. Las propiedades algebraicas de los elementos de un espacio vectorial arbi- trario son muy semejantes a las de los elementos de R2, R3 o de R”. En conse- cuencia, se acostumbraJlamar vectores también a ios elementos de un espacio vectorial arbitrario. \ Si u, v son vectores (estb es, elementos del espacio vectorial arbitrario V), en- tonces la suma \ \ u + (-t>) comúnmente se escribe u — v. Para denotar al número cero se usa el símbolo 0, y con O denotaremos el elemento de cualquier espacio'vectorial V que satisfaga la propiedad EV 2; tam- bién se llamará cero, aunque no hay posibilidad alguna de confusión. Nótese que este elemento cero O está determinado en forma única por la condición EV 2 (ver el ejercicio 5). Nótese que para cualquier elemento v en V se tiene 0v = O. La prueba es sencilla, a saber: Ov + v = Ov + Ir = (0 + l)v = Iv = v. Sumando —va cada uno de los miembros tenemos Ov = O. Constantemente se emplearán otras propiedades sencillas de carácter análogo y se dejarán como ejercicios. Por ejemplo, probar que ( — l)v = — v. Es posible sumar varios elementos de un espacio vectorial. Supóngase que queremos sumar cuatro elementos u, v, w, z. Primero se suman cualesquiera dos de ellos, luego un tercero y por último un cuarto. Usando las reglas EV 1 y EV 4,
42 ALGEBRA LINEAL ESPACIOS VECTORIALES 43 se ve que no importa el orden en que se efectúen las sumas. Esto corresponde exactamente a lo que sucede con los vectores. Por ejemplo, ((u 4- v) + w) + Z = (u + (l) + w)} 4- z = ((t> 4- w) 4- u) 4- z = (v 4- w) 4- (u 4- z), etc. Es común eliminar los paréntesis, escribir sencillamente u 4- v 4- w 4- z. Esta misma observación se puede aplicar a la suma de cualquier número n de elementos de V; resulta sencillo hacer la prueba formal por inducción. Sea V un espacio vectorial y sea W un subconjunto de V. Supóngase que W satisface las siguientes condiciones: (i) Si v y w son elementos de W, su suma v 4 w también es un elemento de W. (ii) Si v es un elemento de W y c es un número, entonces cv es un elemento de W. (iii) El elemento O de V también es un elemento de W. Entonces el propio W es un espacio vectorial. En realidad, al satisfacer las propiedades 1 a 8 del EV, todos los elementos de Ese satisfacen también a fortiorí para iodos los elementos de W. Se dice que W es un subespacio de V. Ejemplo 1. Sea V = R" y sea W el conjunto de vectores en V cuya última coordenada es igual a 0. Entonces W es un subespacio de V que podríamos iden- tificar con R’-1. En forma más genera!, sea K un campo. Supóngase que K" es el conjunto de todas las n-uplas de elementos de K, esto es, el conjunto de los elementos X = (Xi,:.., x„) en donde x¡ e K para i = 1,..., n. Se define la adición de tales n-uplas. componente a componente, tal como se hizo para la adición de n-uplas de números reales. Asi, si Y = (ji,..., y„) con yi ¿ K, entonces X 4- y = (Xi 4- yi,..., x„ 4- y„). Si c e K, entonces se define cX como (cxi,..., cx„). Luego se verifica de inmediato' que estas operaciones satisfacen los axiomas para un espacio vectorial, esto es. que K" es un espacio vectorial sobre K. Por tanto, C" es un espacio vectorial sobre C y Q" es un espacio vectorial sobre Q. Nótese que R" no es un espacio vectorial sobre C. Así, entonces, al tra- bajar con espacios vectoriales siempre especificaremos el campo sobre el cual se toma el espacio vectorial. Cuando se escribe K" se deberá entender que se le considera como un espacio vectorial sobre K. A los elementos de K" también se les llamará vectores; igualmente es corriente llamar vectores a los elementos de un espacio vectorial arbitrario. ' Nótese que los números complejos forman un espacio vectorial sobre los núnteí°s reales. Esto es inmediato a partir de las reglas dadas en el capitulo 1 § 7. Ejemplo 2. Sea V un espacio vectorial arbitrario y sean Vi,..., v„ elementos de V- Sean Xj,..., x„ números. Una combinación lineal de i?!,...,a, será una ex- presipi^de l*P° XjVj 4- ... 4- x„v„. El conjunto de todas las combinaciones lineales de vt,... v„ es un subespacio de V. Prueba. Sean yi,...,y„ números. Entonces (XjVj 4- ••• 4- x„v„) 4- (yjVi 4- — 4- y„c„) = (*i + yi)fi 4-— 4- (x„ 4- yX- Por lo que la suma de dos elementos de W es de nuevo, un elemento de W, esto es, una combinación lineal de »t,..., v„. Por consiguiente, si c es un número, entonces C(X1V1 4- — 4- x„i>„) = CX1»! 4- 4- cx„v„ es una combinación lineal de a,, ...,vn y, por tanto.es un elemento de IV. Finalmente, 0 — Ovj 4- ••• 4- 0vB es un elemento de W. Esto prueba que es un subespacio de V. En el ejemplo 2, el subespacio fP se conoce como el subespacio generado por tij,..., v„. Si W = V; es decir, si todo elemento de V es una combinación lineal de vt,..., v„, entonces decimos que Vj,..., v„ genera a V. Ejemplo 3. Sea A un vector en R3. Sea W el conjunto de todos los elementos B en R3 tales que B'• A = O, es decir, tales que B es perpendicular a A. Entonces W es un subespacio de R3. Para probar esto, nótese que 0-4 — 0, por lo que 0 está en W. Después, supóngase que B y C son perpendiculares a A. Entonces (B + C)A = BA + CA = 0, por lo que B 4- C también es perpendicular a A. Por último, si x es un número, entonces (xB) • 4 = x(B • 4) = 0, por lo que xB es perpendicular a A. Esto prueba que W es un subespacio de R3. En forma general, si A es un vector en R", entonces el conjunto de todos los elementos B en R" tales que B • A = 0 es un subespacio de R". La prueba es la misma que cuando n = 3.
44 ALGEBRA LINEAL Ejemplo 4. Espacios de funciones. Sea S un conjunto y sea K un cajnpó. Se dice que una función de S en K es una regla que asocia a cada uno, dedos elemen- tos de S un elemento único de K. Así, si f es una funcióirdc S en K, se expresa mediante los símbolos f: S—+K. Diremos también que f es una función evaluada en K. Sea V el conjunto de todas las funciones de S en K. Si f, g son funciones de ese tipo, entonces se puede for mar su suma f + g\ es la función que calculada en un elemento x de 5, es igual a /(x) + g(x). Se escribe (/ + »Xx) = f(x) + g(x). Si ce K, entonces se define cf como la función tal que (c/X*) = cf(x). Así el valor de cf en x es c/(x). Es muy fácil comprobar que V es un espacio vec- torial sobre K y el lector lo debe verificar. Observemos solamente que el elemento cero de V es la función nula, es decir, la función f tal que /(x) = 0 para todo x e S. Se denota con 0 esta función nula. Sea V el conjunto de todas las funciones de R en R. Entonces V es un espacio vectorial sobre R. Sea W el subconjunto de las funciones continuas. Si f y g son funciones continuas, entonces f + g es continua. Si c es un número real, enton- ces cf es continua. La función nula es continua. Por tanto, W es un subespacio del espacio vectorial de todas las funciones de R en R, es decir, W es un subespacio de V. Sea U el conjunto de las funciones diferenciabies de R en R. Si f y g son fun- ciones diferenciables, entonces su suma f + g también-^s diferenciable. Si c es un número real, entonces cf es diferenciable. La funciónnula es diferenciable Por tanto, 1/es un subespacio de K En efecto, U es un subespacio oe IV, debido a que toda función diferenciable es continua. Nuevamente, sea V el espacio vectorial (sobre R) de las funciones que van de R en R. Considérense las dos funciones e2‘. (Estrictamente hablando se de- bería decir: las dos funciones f y g tales que f(t) = e' y glt) = e2‘ para todo t g R.) Estas funciones generan un subespacio del espacio de todas las funciones diferen- ciables. La función 3e* + 2e2' es un elemento de este subespacio, asi como tam- bién lo es la función 2e* + rte2'. Ejemplo 5. Sea V un espacio vectorial y sean U y W subespacios. Denotaremos por U r> W la intersección de U y W, es decir, el conjunto de elementos que per- tenecen tanto a U como a W. Entonces U n W es un subespacio. Por ejemplo, si U y W son dos planos en el espacio de tres dimensiones que pasan por el ori- gen, entonces, en general, su intersección será una linea recta que pasa por el origen, como se puede apreciar en la figura 1.
ESPACIOS VECTORIALES 45 Figura 1 Ejemplo 6. Sean U y W subespacios de un espacio vectorial V. Se denota con U + W el conjunto de todos los elementos u + w donde u e U y weW. Dejamos que el lector verifique que U + W es un subespacio de V; se dirá que éste es generado por U y W y también que es la suma de U y W. Ejercicios 1. Sea V un espacio vectorial. Demostrar que si c es un número, entonces cO = O, usando las propiedades 1 a 8 del EV. 2. Sea c un número # 0, y sea v un elemento de V. Probar que si cv = O, entonces v = O. 3. Considérese el espacio vectorial de las funciones, ¿cuál es la función que satisface la condición EV 2? 4. Sea V un espacio vectorial y sean v y w elementos de V. Si v + w = O, demostrar que w = — v. 5. Sea V un espacio vectorial y sean v y w elementos de V tales que v + w = v. Demos- trar que w = O. 6. Sean 4i, A2 vectores en R". Demostrar que el conjunto de todos los vectores B en R" tales que B es perpendicular tanto en AII como a A2, es un subespacio. 7. Generalizar el ejercicio 6 y probar, además lo siguiente: sean A, A, vectores en R". Sea W el conjunto de los vectores B en R" tales que B A¡ =0 para todo i — 1,..., r. Demostrar que W es un subespacio de R". 8. Demostrar que los siguientes conjuntos de elementos en R2 forman subespacios: (a) El conjunto de todas las (x, y) tales que x = y. (b) El conjunto de todas las (x. y) tales que x — y = 0. (c) El conjunto de todas las (x, y) tales que x + 4y = 0.
46 ALGEBRA LINEAL 9. Demostrar que los siguientes conjuntos de elementos de R3 forman subespacios. (a) El conjunto de todas las (x, y, z) tales que x + y + z = 0. (b) El conjunto de todas las (x, y, z) tales que x = y y 2y = z. (c) El conjunto de todas las (x, y, z) tales que x + y - 3z. 10. Si U y W son subespacios de un espacio vectorial V, entonces demostrar que U r> jy y W son subespacios. fljsea K un subcampo de un campo L. Demostrar que L es un espacio vectorial sobre K. FnnEarticular. C y R son espacios vectoriales sobre Q. ^T2^ea K el conjunto de todos los números que se pueden escribir en la forma a + b>/2, aburra y b son números racionales. Demostrar que K es un campo. 13. Sea K el conjunto de todos los números que se pueden escribir en la forma a + bi, donde a y b son números racionales. Demostrar que K es un campo. 14. Sea c un número racional > 0 y sea y un número real tal que y2 = c. Demostrar que el conjunto de todos los números que se pueden escribir en la forma a + by, donde a y b son números racionales, es un campo. §2. Bases Sea Vun espacio vectorial sobre el campo K y sean vt,..., v„ elementos de V. Se dice que vlt..., v„ son linealmente dependientes sobre K si existen elementos ait..., a„ en K no todos iguales a 0, tales que ají?! + ••• + a„v„ = O- \ Si no existen tales números, entonces se dice que vt,...,v„ son linealmente independientes. En otras palabras, los vectores v¡,..., v„ son linealmente indepen- dientes si y sólo si se satisface la siguiente condición: / Siempre que at,..., a„ sean números tales que / aiVt .+ + a„v„ = 0, / entonces ai — 0 para todo i = 1,..., n. Ejemplo 1. Sea V = R" y considérense los vectores Ei = (1,0,..., 0) E„ = (0,0,..., 1). Entonces E],..., E„ son linealmente independientes. En efecto, sean ai,..., a„ nú- meros tales que fliEj — + a„E„ = O.
ESPACIOS VECTORIALES 47 / Como atEi + • + a„E„ = a„), se infiere que todo a, = 0. Éjhnplo 2. Sea V el espacio vectorial de todas las funciones de una variable L Sean fi, ...,/„ n funciones. Decir que éstas son linealmente dependientes es equivalente a decir que existen n números alt..., a„ no todos iguales a 0, tales que «1/1(0 — + anfM = 0 para todos los valores de t. Las funciones e', e2' son linealmente independientes. Con el fin de probar este enunciado, supóngase que existen números a y b tales que ae* = be2' — 0 (para todos los valores de t). Diferencíese esta relación. Se obtiene a¿ 4- Ibe2' = 0. Réstese la primera relación de la segunda. Se obtiene be2' = Oy, por tanto, b = 0- A partir de la primera relación se deduce que aé — 0 y de aquí que a = 0. De donde e*, e2‘ resultan ser linealmente independientes. Nuevamente considérese un espacio vectorial arbitrario V. Sean Vi,...,», elementos de V linealmente independientes. Sean x1(...,x, y yi,-,yn núme- ros. Supóngase que tenemos XjCj + -•+ x„v„ = + ••• + y„v„. En otras palabras, las dos combinaciones lineales de v¡,..., v„ son iguales. Entonces debemos tener que x¡ = y¡ para cada i = 1,..., n. En efecto, restando el miembro izquierdo de la igualdad al miembro derecho de la misma tenemos que xjt>i - + — + .v; - ynv„ = o. También se puede escribir esta relación en la forma (*i - Jik’i + • + (x, - y„)t>„ = O. Por definición, debemos tener x¡ — y¡ = 0 para todo i = 1,..., n, con lo cual queda probado el enunciado. Si los elementos t^, ..., v„ de V generan a Ky además son linealmente inde- pendientes, entonces {i>,. .... u„} se conocen como una base de V. Diremos ade- más que los elementos i>!,v„ constituyen o forman una base de V.
48 algebra lineal Los vectores Et,..., E„ que se mencionan en el ejemplo 1 forman una base de R". Sea W el espacio vectorial de las funciones generadas por las dos funciones e1, e*2. Luego {e*, e2'} es una base de W. Sea V un espacio vectorial y sea {vj,..., i>„) una base de V. Los elementos de V se pueden representar por n-uplas relativas a esta base, como a continuación se indica. Si un elemento v de V se expresa como una combinación lineal v = + •• + x„v„ de los elementos de la base, entonces se dice que (Xj,..., x„) son las coordenadas de t> con respecto a la base y que x¡ es la i-ésima coordenada. Las coordenadas con respecto a la base usual Et,..., E„ de R" son simplemente las coordenadas que se definieron en el capítulo I, § 1. Se dice que la n-upla X = (x2, ...,x„) es el vector de coordenadas de v con respecto a la base {t>i,..., v„}. Por ejemplo, sea V el espacio vectorial de las funciones generadas por las dos funciones e', e12. Entonces las coordenadas de la función 3e* + 5e2' con respecto a la base {e’, e'2} son (3, 5). Ejemplo 3. Demostrar que los vectores (1, 1) y ( — 3, 2) son linealmente inde- pendientes. Sean a y b números tales que a(l, 1) + M-3,2) = O. Al escribir esta ecuación en términos de las componentes, encontramos que a — 3b = 0, a + 2b = 0. Este es un sistema de dos ecuaciones que se resuelve para a y b. Al restar la se- gunda ecuación de la primera, obtenemos — 5b = 0, por lo que b = 0. Al sustituir en cualquier ecuación, encontramos que a = 0. Por tanto, ay b son iguales a 0 y los vectores son linealmente independientes. Ejemplo 4. Hállense las coordenadas de (1, 0) con respecto a los vectores (1,1) (-1,2). Hay que encontrar números a y b tales que a(l, 1) + b(—1,2) = (1,0). Al escribir esta ecuación en términos de las coordenadas, se halla que \ a — b = 1, a + 2b = 0. Al resolver este sistema oe ecuaciones para a y ó en la forma usual, se encuentra que b = — jya = j. Por lo que las coordenadas de (1,0) con respecto a (1,1) y (-1, 2) son (i, - j).
ESPACIOS VECTORIALES 49 Ejemplo 5. Demostrar que los vectores (1, 1) y (— 1, 2) forman una base de R2. Tenemos que demostrar que los vectores son linealmente independientes y que generan a R2. Para probar la independencia lineal, supóngase que a y b son nú- meros tales que a(l, 1) + b(-1, 2) = (0,0); füígo a — b = 0, a + 2b = 0. Restando la primera ecuación de la segunda se obtiene 3b = 0, de tal manera que b = 0. Pero de la primera ecuación se sabe que a = 0, y se prueba así que los vec- tores son linealmente independientes. Luego, supóngase que (a, b) es un elemento arbitrario de R2. Se debe demostrar que existen números x, y tales que x(l,l)ly(-1,2) = («,&) • En otras palabras, se debe resolvet; el sistema de ecuaciones x \y = a, x + 2y\= i>. Réstese nuevamente la primera ecuación de la ségunda. Encontramos que 3y = b — a por lo que y finalmente b — a x = y + a = —-------1- a. Esto prueba lo que se quería. De acuerdo con las definiciones (x, y) son las coorde- nadas de (a, b) con respecto a la base {(1, 1), (—1, 2)}. Sea v„] un conjunto de elementos de un espacio V. Sea r un entero positivo n. Se dice que {v,,..., t>r} es un subconjunto máximo de elementos lineales independientes si Vi,..., vr son linealmente independientes y si, además, dado cualquier t>¡ con i > r, los elementos ..., vr, v¡son linealmente dependientes. El siguiente teorema nos da un criterio útil para determinar cuándo un con- junto de elementos de un espacio vectorial es una base. Teorema 1. Sea {t>i,..., u„¡ un conjunto de generadores de un espacio vectorial V. Sea {t’!,..., i>,rj un subconjunto máximo de elementos linealmente independientes. Entonces {uj,..., t>r} es una base de V.
50 ALGEBRA LINEAL Prueba. Debemos probar que tq, .... t>r generan a V. Primero se prueba que uno de los tq- (para i > r) es una combinación lineal de tq, ..., vr..Vot hipótesis, dado tq, existen números ., xr no todos iguales a 0, tales que Xjtq + • • • + xrvr + yv¡ = O. / Además, y 0, ya que de otra manera, tendríamos una relación de dependencia lineal para tq,..., vr. Por tanto, se puede despejar v¡, a saber: xr Vi =----tq + • • • d----vr, -y -y con lo cual se demuestra que v¡ es Sea ahora v un elemento de V. una combinación lineal de tq, ..., vr. Existen números c1T..., c„ tales que v = rqtq + + c„v„. En esta relación, se puede reemplazar cada uno de los v¡ (i > r) por una combi- nación lineal de tq,..., vr. Si se hace asi y después se agrupan los términos, se hallará que hemos expresado v como una combinación de tq..vr. Esto prueba que v¡, ...,vr generan a V y por tanto que forman una base V. Ejercicios (b) (1.0) y (1,1) (d) (2, -1) y (1,0) (0 (1.2) y (1,3) (h) (0.1.1). (0.2,1) y (1,5,3) X = (1,0), 4 = (1,1), B = (0. 1) X = (2, l),/t = (!,-1). B = (l,l) B = (-1.0) B = (- 1,0) X = (1, I). A = (2, 1), X - (4, 3). A = (2, 1). 1. Demostrar que los siguientes vectores son linealmente independientes (sobre C o sobre R). (a) (1,1,1) y (0,1,-2) (c) (-1,1,0) y (0,1, 2) (e) (n, 0)y(0,1) (g) (1,1,0) (1,1.1| y (0, 1,-1) 2. Dado el vector X, expresar éste como una combinación lineal de los vectores A y B y encontrar las coordenadas de X con respecto a A y B. (a) (b) (c) (d) 3 Ilallar las coordenadas del vector X con respecto a los vectores A, B y C. (a) X •• (1,0,0), A « (1, I, 1), B = (-1, 1,0), C = (1,0.-1) (b) X » (1. I. 1)J - (0, 1, 1). B = (1, 1.0), C = (1,0.2) (c) X - (0.0. 1). A - (I. 1. 1). B = (-1. 1.0). C = (1.0. -1) 4. Sean (a, ó) y (r, d) dos vectores en el plano. Si ad — be = 0, demostrar que son lineal- mente dependientes. Si ad - be / 0. demostrar que son linealmente independientes. 5. C onsidérese el espacio vectorial de todas las funciones de una variable t. Demostrar que las siguientes parejas de funciones son linealmente independientes. (a) I, t (b) t, t2 (c) t, t4 (d) é. t (e) té. e2' (f) sen t. eos t (g) t. sen r (h) sen t. sen 2r (i) eos t. eos 3t
w 1 MF ESPACIOS VECTORIALES 51 |Bb. ' 6. Considérese el espacio vectorial de las funciones definidas para t > 0. Demostrar que las siguientes parejas de funciones son linealmente independientes. I ; (a) t, l/t (b) C,logt , ¡ - 7. ¿Cuáles son las coordenadas de la función 3 sen t + 5 eos t = /(t) con respecto a la I base {sen t, eos t}? 1 ? <8.^Sea D la derivada d/dt. Sea f(t) como eh el ejercicio 7. ¿Cuáles son las coordenadas de { la función Df(t) con respecto a la base del ejercicio 7? { 9. Sean At, ..., A, vectores en R" y supóngase que son mutuamente perpendiculares 5 (esto es, cualesquiera dos de ellos son perpendiculares entre tí) y además que ninguno de > ellos es igual a O. Probar que son linealmente independientes. ? 10. Sea V el espacio vectorial de las funciones continuas definidas sobre el intervalo [ — ir, tt]. Si / y g son funciones continuas definidas sobre este intervalo, definir su pro- ducto escalar </, g) de la siguiente manera: । </.»> = j f(t)g(t)dt. Demostrar que las funciones sen nt(n = 1,2,3,...) son mutuamente perpendiculares, es decir, que el producto escalar de cualesquiera dos de ellas es igual a 0. 11. Demostrar que las funciones sen t, sen 2t, sen 3t,..., sen nt son linealmente indepen- dientes para cualquier entero n § 1. i 12. Sean v y w elementos de un espacio vectorial y supóngase que v # O. Si t> y w son t linealmente dependientes, demostrar que existe un número a tal que w = av. f §3. Dimensión de un espacio vectorial El principal resultado de esta sección es que cualesquiera dos bases de un j espacio vectorial tienen el mismo número de elementos. Para probar esta afir- mación se requiere un resultado intermedio previo. Teorema 2. Sea V un espacio vectorial sobre el campo K. Sea {vJ(..., vm, una base de V sobre K. Sean w1(..., w„ elementos de V y supóngase que n > m. Entonces wt, ... ,w„ son linealmente dependientes. Prueba. Supóngase que wj,..., w„ son linealmente independientes. Puesto que | {t>r,..., vm} es una base, existen elementos aJ;..., ame K tales que i wj = a,»! + ••• + amvm. Por hipótesis, sabemos que w, O y, por tanto, algún a¡ 0. Después de renu- merar Vi,.... vm, si es necesario, se puede suponer sin pérdida de generalidad que a¡ 0. Entonces, se puede despejar vt, con lo que se obtiene fliVi = wj - a2v2---------- amvm, v¡ = ar’w! — aí'a2v2---------— aí'amvm. El subespacio de V generado por Wi, v2,..., vm contiene a v¡ y, por tanto, debe contener todos los elementos de K ya que t>Ki>2,............ vm generan a V. La idea
52 ALGEBRA LINEAL consiste ahora en continuar el proceso paso a paso y en reemplazar sucesivamente a v2, v3, ... por w'2, w3,... hasta que se agoten todos los elementos vit..., v„ y asi Wj,..., genera a V. Supóngase ahora por inducción que existe un entero r con 1 í r < m que después de una renumeración adecuada de t>i,..., vm, los elementos wi,..., wr, vr+1,, v„ generan a V. Existen elementos bít..., br, cr+i,.•., c„ en K tales que wr+l = biWi + ••• + brwr + cr+Jur+i + + cmvm. No puede suceder que cj = 0 para j — r + 1,..., m, ya que si así fuera obtendría- mos una relación de dependencia lineal entre wi, ...,wr+i, lo que estaría en con- tradicción con nuestra suposición. Luego de renumerar, si es necesario, ur+i,..., v„ se puede suponer sin pérdida de generalidad que cr+i / O. Entonces se obtiene Cr+Il>r+1 = Wr+1 — biWi — — b,Wr — Cr + 2vr + 2 ~ — CmV„. Al dividir entre cr+I, concluimos que cr+I está en el subespacio generado por •Vj,..., wr+I, vr+2, ...,vm. Así, por inducción se infiere que ..., wr+i, vr+2, fm generan a V. Así, entonces, se ha probado por inducción que ..., wm generan a V. Si n > m, entonces existen elementos dj,..., dm e K tales que W» = djW! + ••• + d„wm. se prueba así que son linealmente dependientes. El teorema queda demostrado. Teorema 3. Sea V un espacio vectorial y supóngase que una base de este espacio tiene n elementos y que otra base del mismo tiene m elementos. Entonces m = n. Prueba. Se aplica el teorema 2 a las dos bases. El teorema 2 implica que ambas alternativas n > m y m > n son imposibles y que, por tanto, m = n. Sea V un espacio vectorial que tiene una base con n elementos. Diremos que n es la dimensión de V. Si V consta solamente del O, entonces V no tiene base alguna y se dice que V tiene dimensión 0. Ejemplo 1. El espacio vectorial R" tiene dimensión n sobre R, el espacio vec- torial C" tiene dimensión n sobre C y, en forma más general para cualquier cam- po K, el espacio vectorial K" tiene dimensión n sobre K. En realidad, los n vectores (1,0, ...,0), (0,1, ...,0).... (0, ...,0,1) forman una base de K" sobre K. La dimensión de un espacio vectorial V sobre K se denota con dim* V, o sim- plemente con dim V.
ESPACIOS VECTORIALES 53 Se dice que cualquier espacio vectorial que tenga una base con un número finito de elementos, o el espacio vectorial nulo, es de dimensión finita. Otros espacios vectoriales se conocen como de dimensión infinita. Es posible dar una definición para una base infinita. Para el efecto recomendamos que el lector con- sulte un texto más avanzado. En este libro, siempre que hablemos de la dimen- sión de un espacio vectorial, se supondrá que es de dimensión finita. - p Ejemplo 2. Sea K un campo. Entonces K es un espacio vectorial sobre sí mismo y es de dimensión 1. En efecto, el elemento 1 de K forma una base de K, debido a que cualquier elemento xeK tiene una expresión única como x = x-1. Procedamos a dar ahora un criterio que permita decir cuándo constituyen una base los elementos de un espacio vectorial. Sean ü!.....t>„ elementos linealmente independientes de un espacio vectorial V. Se dice que forman un conjunto máximo de elementos de V linealmente indepen- dientes si, dado cualquier elemento de w de V, los elementos w, vt, ..., v„ son li- nealmente dependientes. Teorema 4. Sea V un espacio vectorial y sea {t>i,..., un conjunto máximo de elementos de V linealmente independientes, entonces {t>], ..., v„} es una base de V. Prueba. Debemos mostrar que vlt... ,v„ generan a V, es decir, que todo ele- mento de Vse puede expresar como una combinación lineal de Vj,..., v„. Sea w un elemento de V. Por hipótesis, los elementos w, Vj,..., v„ de V deben ser linealmente dependientes y, por tanto, existen números Xo, x,,..., x„ no todos iguales a 0, tales que X0W + XjV] + • + x„v„ = O. No se puede tener x0 = 0, ya que-si este fuera el caso, se obtendría una relación de dependencia lineal entre »i,..., v„. Por consiguiente, se puede despejar w en función de t>j,..., v„ a saber Esto prueba que w es una combinación lineal de ...,v„ y, por tanto,{uj,..., u„¡ es una base. > Teorema 5. Sea V un espacio vectorial de dimensión n y sean vt, ... ,v„ elemen- tos independientes linealmente de V. Entonces v¡, ..., v„, constituyen una base de V. Prueba. Conforme al teorema 2, {«],..., u„} es un conjunto máximo de ele- mentos linealmente independientes de V. Por tanto, el teorema 4 es una base. Corolario 1. Sea V un espacio vectorial de dimensión n y sea W un subespacio, también de dimensión n. Entonces W = V. Prueba. Una base para W debe serlo también para V.
54 ALGEBRA LINEAL Corolario 2. Sea V un espacio vectorial de dimensión n. Sea r un entero positivo donde r < n, y sean 14,t>, elementos de V linealmente independientes. En- tonces se pueden hallar elementos vr+i,.... v, tales que {Vi,-.., l’n} es una base de V. Prueba. Como r < n sabemos que {t?1(..., ti,j no puede formar una base de V y asi no puede ser un conjunto máximo de elementos linealmente indepen- dientes. En particular, podemos encontrar rr+l en V tal que A+I sean linealmente independientes. Si r 4- 1 < n, entonces se puede repetir el argu- mento. Se puede proceder asi por pasos (por inducción) hasta obtener n ele- mentos linealmente independientes {Vj,.... Estos deben ser, por el teorema 5, una base, y asi el corolario queda probado. Teorema 6. Sea V un espacio vectorial con una base de n elementos. Sea W un subespacio que no conste sólo del O. Entonces W tiene una base y la dimensión de W es n. Prueba. Sea wj un elemento no nulo de W. Si {wj} no es un conjunto máximo de elementos de W linealmente independientes, entonces se puede hallar un ele- mento w2 de W tal que >v2 sean linealmen’.e independientes. Procediendo de esta manera, elemento por elemento, llegará el momento en que un elemento sea un entero m rS n tal que podamos encontrar elementos linealmente indepen- dientes wj, w2....y tales que {Wj,.... wm} \ • sea un conjunto máximo de elementos de W linealmente independientes (debido al teorema 2, no podemos seguir hallando indefinidamente elementos linealmente independientes; el número de tales elementos es a lo sumo n). Si ahora empleamos el teorema 4, entonces concluimos que {w,...., wm} es una base para W. §4. Sumas y sumas directas Sea V un espacio vectorial sobre el campo K. Sean U y W subespacios de V. Se define la suma de U y W como el subconjunto de V que consta de todas las sumas u + w con u e U y w e W. Se denota esta suma por 17 4- IV. Esta es un sub- espacio de V. Ciertamente, si ut, u2 e U y w15 w2 e W, entonces (ui 4- Wj) + (u2 4- H’2) = U] 4 u2 4 Wj 4- w2 6 U 4- IV.
ESPACIOS VECTORIALES 55 S¡ ce K, entonces cfuj + = «i + cwi e U + W. Finalmente O + O e W. Lo cual prueba gpe V + es un subespacio. S^dice que V es una suma directa (te K’ y W si para todo elemento u de V exis- ten elementos únicos ue U y w e W t atesque v = u + w. Teorema 7. Sea V un espacio vecteñtl sobre el campo K, y sean U y W subes- pacios. Si U + 1F = K y si U r> Vf * {O}, entonces V es la suma directa de V y W. Prueba. Dado ce V, por la primer* suposición, existen elementos »e U y weW tales que v = u + w. Asi, pues, Kes la suma de U y W. Para probar que es la suma directa se debe demostrar estos elementos u, w están determinados en forma única. Supóngase que existe* elementos u' e U y w' e W tales que v = u' + W . Asi u + w = *' + W. <M'c^ «nxa ut» c/<r'cyJ’c^'€- U, Entonces z ♦ • ) u-u'eU = uv<*‘Gv/ Perón — ueUyw'-we W. Por la segunda hipótesis, se concluye que u — u = O, y w - w = O, de donde u = u y w « w. con lo cual se prueba el teorema. Cuando V es la suma directa de los subespacios U y W, se emplea la siguiente notación V = U @ IV. Teorema 8. Sea V un espacio vectorial de dimensión finita sobre el campo K. Sea W un subespacio. Entonces, existe un subespacio U tal que es a suma directa de W y U. Prueba. Se selecciona una base de W, según el corolario de teorema - y se extiende a una base de V. Entonces el enunciado del teorema es evi Empleando la notación de aquel teorema, si {»i, - •, cr} es una se tonces se designa U al espacio generado por {vr+i, • • • > M- Nótese que, dado el subespacio W, generalmente existen muchos U tales que V es la suma directa de W y V-(En l°s ejercicios se a aran ej Más adelante, en la sección donde se estudia lo referente a a ortogona 11 , empleará este concepto para determinar un subespacio como e mencio
56 ALGEBRA LINEAL Teorema 9. Si V es un espacio vectorial de dimensión finita sobre K, y si es la suma directa de los subespacios U y W, entonces dim V = dim U + dim W. Prueba. Sea {m1( ..., ur} una base de U y {wj,..., w,} una base de W. Todo elemento de U tiene una expresión única como una combinación lineal x^ -t • • 1- xru, con x¡eK, y todo elemento de W tiene una expresión única como una combinación lineal yrwi + - • • + yjW, con y¡eK. Por definición, todo ele- mento de V tiene una expresión única como una combinación lineal XjUi + ••• 4- XrUr + ViW! + + y3Ws, con lo que se prueba que ultur, .... ws es una base de Vy, por tanto,tam- bién se prueba el teorema. Observación. También se puede definir V como una suma directa de más de dos subespacios. Sean Wt, .... Wr subespacios de V. Se dice,que V es su suma directa si todo elemento de V se puede expresar de manera única como una suma V — Wj + ••• + wr con.Wj en 17¡. Supóngase ahora que U y W son espacios vectoriales arbitrarios sobre el campo K (esto es, no necesariamente subespacios de algún espacio vectorial). Con- vengamos en denotar con U x W el conjunto de todas las parejas (u, w) cuya pri- mera componente es un elemento u de U y cuya segunda componente es un ele- mento w de W. Se define la adición de tales parejas, componente a componente, a saber: si (ui,W])e U x W y (u2,w2)e 17 x IV se define («1, Wj) + (u2, w2) = (Uj + u2, w, + w2). Si ce K, entonces se define el producto c(u15 wj por C(U1, Wj) = (CUls CWj). Entonces se verifica de inmediato que V x W es un espacio vectorial llamado producto directo de U y W. Cuando se estudien las aplicaciones lineales, com- pararemos al producto directo con la suma directa. Si n es un entero positivo, escrito como una suma de dos enteros positivos n = r + s, se observará entonces que K" es el producto directo Kr x Ks. Nótese que dim (17 x W7) = dim 17 -l- dim W. La prueba es sencilla y se en- comienda al lector.
ESPACIOS VECTORIALES 57 Ejercicios 1. Sea V = R2, y sea W el subespacio generado por (2,1). Sea U el subespacio generado por (0,1). Demostrar que V es la suma directa de W y U. Si U' es el subespacio generado por (I, I), entonces demostrar que V también es la suma directa de W y U'. 2. Sea V = K3 para algún campo K. Sea W el subespacio generado por (1,0,0) y sea U el Sutes pació generado por (1,1,0) y (0,1,1). Demostrar que V es la suma directa de W y U. 3. Sean A y B vectores en R2 y supóngase que ninguno de ellos es 0. Si no existe ningún número c tal que cA = B, demostrar entonces que A y B forman una base de R2 y que R2 es una suma directa de los subespacios generados por A y por B respectivamente. 4. Probar la última afirmación de la sección concerniente a la dimensión de U x W. Leu W -e-^eco eX'ik* r w 9- wsu ./rr„ & = P/® 6L- 111 Y 111111 T T 111111111111111111

CAPITULO III Matrices §J. El espacio de las matrices Consideremos una nueva clase de objetos» las matrices. Sea K un campo y sean n y m enteros 1. Un arreglo de números en K all °I3 ®1« a21 a22 a23 fl2» Oml Om2 am3 Ofiw, se conoce como una matriz enK. Se puede abreviar la notación para esta matriz expresándola como i = 1,m y / = 1..........n. Se dice que ésta es una matriz m por n, o bien que es una matriz m x n. La matriz tiene m filas y n columnas. Por ejemplo, la primera columna es y la segunda fila es («21, a22, , a2„). Se dice que a¡j es la componente ij de la matriz. Si la matriz anterior se denota por A, entonces la fila i-ésima se denota por Ai, y se define como A¡ = (an, a,i2,.... ain). La columna j-ésima se denota por A‘ y se define como 59
60 ALGEBRA LINEAL Si se remira en el capítulo I, §1, el ejemplo del espacio de 7 dimensiones con- siderado en economía da lugar a una matriz (a¡j) (í, j = 1,..., 7) 7 x 7 donde representa la cantidad invertida por la i-ésima industria en la j-ésima industria. Asi, pues, manteniendo la notación de ese ejemplo, si a25 = 50, esto significa que la industria automovilística compró material a la industria química por un valor de 50 millones de dólares durante el año indicado. Ejemplo 1. La siguiente es una matriz 2x3: 1 4 — 5/ Esta matriz tiene dos filas y tres columnas. Las filas son (1, 1, —2) y (— 1, 4, —5). Las columnas son /—2 5 Por tanto, las dos filas de una matriz se pueden considerar como n-uplas y las co- lumnas como m-uplas verticales. La m-upla vertical es también llamada vector columna. Un vector (x1;..., x„) es una matriz de 1 x n. Un vector columna *1 x„ es una matriz n x 1. Cuando una matriz se expresa en la forma (a¡j), entonces i denota la fila y j denota la columna. Así, en el ejemplo 1 tenemos «n = 1 y a23 = — 5. Se puede considerar un solo número (a) como una matriz 1 x 1. Sea (a,J, i = 1, ..., m y j = 1, ..., n. Si m = n, entonces se dice que es una matriz cuadrada. Asi. 2\ 0/ /1 -1 5\ y I 2 1 -1 ) \3 1-1/ son matrices cuadradas. Tenemos una matriz nula en la que = 0 para todos i y j. Tiene un aspecto como el que se muestra en seguida: 0 0 0 ... 0 00 0 ... 0 Ó Ó Ó ... Ó Se representa con O. Nótese que hasta ahora nos hemos encontrado con el nú- mero cero, con el vector nulo y con la matriz nula.
1 MATRICES 61 .. Ahora vamos a definir la adición de matrices y la multiplicación de matrices por números. Se define la adición de matrices sólo cuando tienen el mismo tamaño. Así, sean m y n enteros fijos ¡í 1. Sean A = (a¡j) y B = (ó,,) matrices m x n. Se define la matriz A + B como aquella cuya componente en la fila í-ésima y la columna j-ésji^a es a¡j + b¡j. En otras palabras, sumamos matrices del mismo tamaño, componente a componente. Ejemplo 2. Sean A^í1-1 0>l \2 3 4/ y i -1\ Entonces A + B = '6 4 0 -1\ 4 3/ Si tanto A como B son matrices 1 x n, esto es, n-uplas, entonces se notará que la adición de matrices coincide con la adición que definimos en el capítulo I, para n-uplas. Si O es la matriz nula, entonces para cualquier matriz A (del mismo tamaño, por supuesto) tenemos que O + A = A + O = A, lo que se verifica de inmediato. Definamos ahora la multiplicación de una matriz por un número. Sea c un número y sea A = (ay) una matriz. Se define cA como la matriz cuya componente ij es ca¡j. Escribimos cA = (ca^). Así entonces multiplicamos cada componente de A por c. Ejemplo 3. Sean A y B como en el ejemplo 2. Sea c = 2. Luego 2A '2 -2 4 6 2 —2\ 2 -2/ Además, se tiene (-1)4= -A = -1 1 0\ —2 -3 —4/ Para todas las matrices A, se encuentra A + (—1)4 = O. Dejamos como ejercicio que se verifique si todas las propiedades del EV1 al EV 8 se satisfacen por las reglas de adición de matrices y de multiplicación de matrices por números. Lo que es importante observar en este caso es que la adi- ción de matrices se define en función de las componentes y que para la adición de componentes se satisfacen las condiciones análogas del EV 1 al EV 4. Estas son propiedades características de los números. Análogamente, las condiciones del EV 5 al EV 8 son válidas para la multiplicación de matrices por números, ya que las propiedades correspondientes para la multiplicación de números son válidas.
62 algebra lineal Nótese que las matrices (de un determinado tamaño m x n) con componentes en un campo K, forman un espacio vectorial sobre K que podemos denotar por Definamos otra noción relativa a una matriz. Sea A = (a¡j) una matriz m x n. La matriz B = n x m tal que bj¡ = a,j se conoce como la transpuesta de A y se denota además por '4. El considerar la transpuesta de una matriz equivale a intercambiar filas por columnas y viceversa. Si A es la matriz que aparece al principio de esta sección; entonces '4 es la matriz Un ^21 aSl " aml\ #12 ^22 a32 am2 | i aln a3n a™ J Consideremos un caso especial: /2 1 Si4 = |2 1 entonces ‘4 =| 1 3 V 3 5/ \0 5 Si 4 = (2,1, —4) es un vector fila, entoncés es un vector columna. Se dice que una matriz 4 es simétrica si es igual a su transpuesta, esto es, S1 = A. Una matriz simétrica es necesariamente una matriz cuadrada. Por ejemplo, la matriz / 1 — 1 2\ -1 0 3 \ 2 3 7/ es simétrica. Sea A = (üíj) una matriz cuadrada. Se dice que aa,..., am son las compo- nentes de su diagonal. Se dice que una matriz es una matriz diagonal si todas sus componentes son iguales a cero, excepto, quizás, las componentes de la diago- nal, esto es: si = 0 si i j. Toda matriz diagonal es una matriz simétrica Una matriz diagonal tiene el siguiente aspecto: Ui 0 - O 0 a2 ••• 0 Ó Ó a„ Se define la matriz unitaria n x n como la matriz cuadrada que tiene todas sus componentes iguales 0, excepto las componentes de la diagonal que son iguales
MATRICES 63 a 1. Se denota esta matriz con I„ o bien con I si no hay necesidad de especificar la n. Así entonces: I 1 0 0 0 1 0 y ó ó ••• i Ejercicios sobre matrices 1. Sean A = 1 -1 2 3\ 0 2/ y \ 2 5 2 Hallar A + B, 3B, -2B, A + 2B, 2A + B, A — B, A — 2B, B — A. 2. Sean Hallar A + B, 3B, -2B, -2B, A + 2B, A — B, B — A. 3. En el ejercicio 1, determinar 'A y 'B. 4. En el ejercicio 2, determinar 'A y ‘B. 5. Si A y B son matrices arbitrarias m x n. entonces demostrar que U + B) = ’A + 'B. 6. Si c es un número, entonces demostrar que ’(cA) = ¿A. 7. Si A = (ay) es una matriz cuadrada, entonces los elementos on se llaman elementos diagonales. ¿Son diferentes los elementos diagonales de A de los de 'A? 8. En el ejercicio 2, determinar '(A + B) y 'A + ’B. 9. En el ejercicio 2, determinar A + ‘Ay B + ‘B. 10. Probar que para cualquier matriz cuadrada A, la matriz A + 'A es simétrica. 11. Describir los vectores fila y los vectores columna de las matrices A y B del ejercicio 1. 12. Describir los vectores fila y los vectores columna de las matrices A y B del ejercicio 2. Ejercicios sobre dimensión 1. ¿Cuál es la dimensión del espacio de las matrices 2x2? Determinar una base de este espacio. 2. ¿Cuál es la dimensión del espacio de las matrices m x n? Determinar una base para este espacio.
64 ALGEBRA LINEAL 3. ¿Cuál es la dimensión del espacio de las matrices'n x n cuyas componentes son todas iguales a 0, excepto, posiblemente, las de la diagonal? 4. ¿Cuál es la dimensión del espacio de las matrices n x n que son triangulares supe- riormente, es decir, de la forma siguiente: (Aj 1 Al 2 flirt \ 0 a22 fl2n | 9 o Ó ••• a„„/ 5. ¿Cuál es la dimensión del espacio de las matrices simétricas 2 x 2 (es decir, las matri- ces A 2 x 2 tales que A = M)? Determinar una base para este espacio. 6. De manera más general, ¿cuál es la dimensión del espacio de las matrices simétricas n x n? 7. ¿Cuál es la dimensión del espacio de las matrices diagonales n x n? ¿Cuál sería la base para este espacio? 8. Sea V un subespacio de R2. ¿Cuáles son las posibles dimensiones para V? Demostrar que si V R2, entonces V = {O}, o bien que V es una recta que pasa por el origen. 9. Sea V un subespacio de R3. ¿Cuáles son las dimensiones posibles para V? Demostrar que si V R3, entonces V = {O}, o bien V es una recta que pasa por el origen, o bien V es un plano que pasa por el origen. §2. Ecuaciones lineales Veremos ahora algunas aplicaciones de los teoremas sobre dimensión para la solución de ecuaciones lineales. Sea K un campo. Sea A = (ay), i — 1,..., m y j = 1,..., n una matriz en K y sean b¡,..., bm elementos de K. Las ecuaciones como al 1*1 + ’ ’ ’ + alnxn = b¡ (*) + ’ * 4" üfffffXn bm se conocen como ecuaciones lineales. Diremos también que (*) es un sistema de ecuaciones lineales. Se dice que el sistema es homogéneo si todos los números bt,..., bm son iguales a 0. El número n se conoce como el número de incógnitas y m se conoce como el número de ecuaciones. Se dice que («y) es la matriz de los coeficientes. El sistema de ecuaciones an*i + ••• + alnx„ = 0 (”) Omi*i 4niAn 0 se llamará el sistema homogéneo asociado con (*).
MATKIOK 65 El sistema (**) siempre tiene una solución, a saber, la solución obtenida al hacer todos los Xj = 0. Esta solución se conoce como la solución trivial. Una solución (Xi, - -, x„) tal que algún x¡ # 0 se conoce como solución no trivial. Considérese primero el sistema homogéneo (**), que se puede expresar de la siguiente manera: o, en los términos de los vectores columna de la matriz A — (a^), XjA1 + ••• + x^A* = O. Por consiguiente, una solución no trivial X — (xt,..., x„) de nuestro sistema (**) no es otra cosa que una n-uplas X O que da una relación de dependencia lineal entre las columnas A1,..., A”. Esta manera de expresar el sistema ofrece, por tanto, una buena interpretación y permite aplicar el teorema 2 del capítulo II. Los vectores columna son elementos de K", el cual tiene dimensión m sobre K. Por consiguiente: Teorema 1. Sea ^11X1 + • • + «inXn = 0 OmiXi + ••• + Om„X„ - 0 un sistema homogéneo de m ecuaciones lineales con n incógnitas, con coeficientes en un campo K, Supóngase que n > m. Entonces el sistema tiene una solución no trivial en K. Prueba. Por el teorema 2 del capítulo II, se sabe que los vectores A1,..., A" deben ser linealmente dependientes. Por tanto, para resolver explícitamente un sistema de ecuaciones lineales no tenemos hasta ahora ningún otro método que el de eliminación, conocido desde nuestros estudios elementales. A continuación damos algunos ejemplos. Ejemplo 1. Supóngase que tenemos una sola ecuación como 2x + y — 4z = 0. Para hallar una solución no trivial, se les asigna a todas las variables, excepto a la primera, un valor especial 0, digamos que y =1, z = 1. Luego, se resuelve para x y se encuentra que 2x = -y + 4z = 3, por lo que x = j.
66 ALGEBRA LINEAL Ejemplo2. Considérese ahora un par de ecuaciones como el siguiente: (1) 2v + 3y - z = 0, (2) x + y + z = 0. Reduzcamos el problema de resolver estas ecuaciones simultáneas al caso proce- dente de una ecuación, mediante la eliminación de una variable. Para esto se multiplica la segunda ecuación por 2 y se resta de la primera, con lo cual se obtiene (3) y - 3z = 0. Ahora nos encontramos con una ecuación de más de una variable. Se le asigna a z cualquier valor 0, por ejemplo z = 1, y se resuelve para y, a saber y = 3. Se despeja x de la segunda ecuación, o sea x = — y — z, con lo cual se obtiene x = — 4. Los valores obtenidos para x, y, z también son soluciones de la primera ecuación, ya que la primera ecuación es (en un sentido obvio) la suma de la ecua- ción (2) multiplicada por 2, más la ecuación (3). Ejemplo 3. Se desea encontrar una solución para el sistema de ecuaciones 3x - 2y + z + 2w — 0, x + y - z - w = 0, 2x — 2y + 3z = 0. Se emplea nuevamente el método de eliminación. Se multiplica la segunda ecua- ción por 2 y se resta de la tercera. Se tiene —4y + 5z + 2w = 0. Se multiplica la segunda ecuación por 3 y se resta de la primera- Encontramos que — 5y + 4z + 5w = 0. Se ha eliminado ahora x de las ecuaciones y se han hallado dos ecuaciones con tres incógnitas, y, z, w. Se elimina y de estas dos ecuaciones de la manera siguiente: se multiplica la primera por 5, la última por 4 y se restan. Tenemos A 50 r 9 4y = - + 2. Ahora se le asigna a w un valor arbitrario / 0, sea w = 1. Luego se resuelve para z, o sea: A 50+18 ro/n 4y =----— = 68/9. Regresando a las ecuaciones inmediatamente anteriores, se resuelve y, usando 4y — 5z + 2w.
MATRICES 67 Esto da como resultado y = 17/9. Finalmente, se resuelve x empleando, por ejemplo, la segunda del conjunto ori- ginal de tres ecuaciones, de tal manera que • 9- x = — y + z + w, o, numéricamente, x = 2/9. Por tanto, hemos hallado que w = 1, y = 17/9, z = 10/9, x = 2/9. Nótese que teníamos tres ecuaciones con cuatro incógnitas. Mediante una eli- minación sucesiva de variables se redujeron a dos ecuaciones con tres incógnitas y después a una ecuación con dos incógnitas. Usando precisamente el mismo método, supóngase que comenzamos con tres ecuaciones con cinco incógnitas. La eliminación de una variable dará dos ecuaciones con cuatro incógnitas. La eliminación de otra variable dará una ecua- ción con tres incógnitas. Luego se puede resolver esta ecuación, retroceder y obtener valores para las variables previas, tal como se mostró en los ejemplos. Una descripción de este proceso de aplicación general se desarrollará en el apén- dice de este capítulo, donde también se dará otra prueba del teorema 1. Posteriormente se mencionarán métodos más eficaces para encontrar solu- ciones de ecuaciones lineales. Consideremos ahora el sistema original de ecuaciones (*). Sea B el vector columna B - I : I. ybm / Entonces se puede escribir (*) en la forma o en forma abreviada, en términos de los vectores columna de A, x¡A' + + x„A" = B.
68 ALGEBRA LINEAL Teorema 2. Supóngase que en el sistema (*) se tiene m = n y supóngase ademas que los vectores A1, ..., A" son linealmente independientes. Entonces, el sistema (*) tiene una solución en K y esta solución es única. Prueba. Como los vectores A',..., A" son linealmente independientes, forman una base de K". Por tanto, cualquier vector B tiene una expresión única como una combinación lineal B = Xj/11 + • • + xnA", donde x¡e K, y, por consiguiente, X = (xi,..., x„) es la solución única del sistema. Ejercicios 1. Sea (**) un sistema de ecuaciones lineales homogéneas en un campo K y supóngase que m — n. Supóngase además que los vectores columna de los coeficientes son linealmente independientes. Demostrar que la única solución es la solución trivial. 2. Sea (**) un sistema de ecuaciones-lineales homogéneas en un campo K, con n incóg- nitas. Demostrar que el conjunto de soluciones X = (xt,..., x„) es un espacio vectorial sobre K. 3. Resolver los siguientes sistemas de ecuaciones lineales en R.‘ (a) 2x + 3y = 5 (b) 2x + 3y + z = 0 4x - y = 7 x — 2y — z = 1 x + 4y + z = 2 — 4. Resolver los siguientes sistemas de ecuaciones lineales en C’ (a) íx - 2y = 1 (b) 2x + iy - (1 + i)z = 1 x + iy — 2 x — 2y + iz = 0 - ix + y - (2 - i)z = 1 (c) (1 + i)x - y = 0 (d) ix - (2 + i)y = 1 ix + y = 3 — i x + (2 - í)y = 1 + i 5. Sean A'..... A" vectores columna de tamaño m. Supóngase que estos vectores tienen coeficientes enR y que, además, son linealmente independientes sobre R. Demostrar que estos vectores son linealmente independientes sobre C. 6. Encontrar al menos una solución no trivial para cada uno de los siguientes sistemas de ecuaciones. (a) 3x + y + z = 0 (c) 2x - 3y + 4z = 0 3x + y + z = 0 (e) —x + 2y — 4z + w = 0 x + 3y + z — >v = 0 (b) 3x + y + z = 0 x + y + z = 0 (d) 2x + y + 4z + w = 0 — 3x + 2y — 3z + w = 0 x + y + z = 0 (1) — 2x + 3y + z + 4w = 0 x — y + 2z+3w = 0 2x + y + z — 2w = 0
MATRICES 69 7. Demostar que las únicas soluciones de los siguieres sistemas de ecuaciones son triviales. (a) 2x + 3y = 0 x - y = 0 (b) 4x + 5y = 0 — 6x + 7y = 0 (c) 3x + 4y — 2z = 0 ’ F x + y + z = 0 — x — 3y + 5z = 0 (d) 4x — 7y 4- 3z = 0 x + y = 0 y — 6z = 0 (e) 7x - 2y -t 5z + w = 0 x - y + z = 0 y — 2z + w = 0 x + z + w = 0 (1) — 3x + y + z = 0 x — y +1 — 2w = 0 x - z + w = 0 —x + jr- 3w = 0 8. Sea (**) un sistema de ecuaciones lineales homogéneas con coeficientes en R. Si este sistema tiene una solución no trivial en C. entonces demostrar que tiene una solución no trivial en R. § 3. Multiplicación de matrices Consideremos matrices sobre un campo fijo K. Comencemos por hacer la observación de que el producto escalar definido en el capitulo I para los vectores con coeficientes reales también es válido para los vectores con componentes en K. Así, pues, si A = (at,..., an) y B = (6,,.. .,b„) están en K", definimos entonces A B — Uibi + + Este es un elemento de K. Tenemos las siguientes propiedades básicas: PE 1. Para todo A y B en K", tenemos que A B = B A. PE 2. Si A, B, C están en K", entonces A(B + C)=AB + AC=(B + C)A. PE 3. Si xe K, entonces (xA) B = x(A B) y A (xB) = x(A • B). Sin embargo, obsérvese que la propiedad de la positividad no es válida en general. Por ejemplo, si K = C. y sea A = (1, i). Entonces A / O, pero A A = 1 + i2 = 0. Para muchas aplicaciones, esta propiedad de positividad no es necesaria y en su lugar se puede usar una propiedad que llamaremos de la no degeneración, a saber: Si A g Kn, y si A • X = 0 para todo X e K", entonces A = O.
70 ALGEBRA LINEAL La prueba resulta ser trivial, debido a que se debe tener A • E¡ = 0 para cada uno de los vectores unitarios E¡ = (0,..., 0,1,0, ..., 0) que tienen 1 en la compo- nente í-ésima y 0 en las demás. Pero A - E¡ = a¡ y, por tanto, a¡ = 0 para todo i, de tal manera que A = O. Ahora definamos el producto de matrices. Sea A = (a(j), i= 1, ...,m y j = l,...,n, una matriz m x n. Sea B = (bJk), j = 1,..., n, y k = 1,..., s, una matriz de n x s. A = ¡bu B = bis b„s Se define el producto AB como la matriz m x s cuya coordenada ik es igual a £ Oijbjk = aiibih + a¡2b2k + ’'' + a¡nbnk- j=i Si Ai,..., A„ son los vectores fila de la matriz A y si B1,..., Bs son ios vectores columna de la matriz B, entonces la coordenada ik del producto AB es igual a A¡ Así I Ai • Bl Ai -Bs\ ab = \ ; \^WB‘ •• Am-B') Por consiguiente, la multiplicación de matrices es una generalización del producto escalar. Ejemplo 1. Sean . f2 1 5\ \1 3 2J’ / 3 . 4\ B = -1 2 . \ 2 1/
MATRICES 71 x Entonces AB es una matriz 2 2 y los cálculos muestran que AB = ti !-( i5\ 12 r 2 1 1 3 Ejemplo 2. Sea c — í i \ -i 3\ -i r Sean A y B como aparecen en el ejemplo 1. Entonces I 3 4V 1 3\ /-1 5\ BC = -1 2 _i)= -3-5 \ 2 l/\ / \ 1 5/ /? 1 4(BC) = (i J 30\ °/ Calcular (AB)C. ¿Qué encontró usted? Sea A una matriz de m x n y sea B una matriz n x 1, es decir, un vector co- lumna. Entonces AB es, de nuevo, un vector columna. El producto tiene el si- guiente aspecto: donde Ci = E Oijbj = anbi + • + ainb„. j=i Si X = (*],..., xm) es un vector fila, es decir, una matriz 1 x m, entonces se puede formar el producto XA, cuya forma es la siguiente: , y„),
72 ALGEBRA LINEAL donde yk = XiOn + • • + En este caso, XA es una matriz 1 x n, es decir un vector fila. Teorema 3. Sean A, B y C matrices. Supóngase que A y B se pueden mul- tiplicar entre sí, que A y C se pueden también multiplicar entre si y que B y C se puden sumar. Entonces, A y B + C se pueden multiplicar entre sí y tenemos que A(B + C) = AB + AC. Si x es un número, entonces A(xB) = x(AB). Prueba. Sea A¡ la fila i-ésima de A y sean Bk y Ck las columnas fc-ésimas de B y C, respectivamente... Entonces Bk + Ck es columna fc-ésima de B + C. Por definición, la componente ik de AB es A¡ Bk, la componente ik de AC es ^4, • C*' y la componente ik de A(B + C) es A¡ (Bk + C*). Ya que A¡ • (Bk + C‘) = A¡ • Bk + A, Ck, se deduce la primera afirmación. Por lo que toca a la segunda, obsérvese que la columna k-ésima de xBk. Puesto que A¡ xBk = x(4¡ • Bk), se infiere la segunda afirmación. Teorema 4. Sean A, B y C matrices tales que A y B se pueden multiplicar entre sí y tales que B y C se pueden multiplicar entre sí. Entonces A y BC se pueden multiplicar entre sí; lo mismo que las matrices AB y C, por tanto, se tiene (AB)C ~ zl(BC). Prueba. Sea A = (a¡j) una matriz de m x n, sea B = (bjk) una matriz n x r y sea C = (ckl) una matriz r x s. El producto AB es una matriz m x r, cuya com- ponente ik es igual a la suma Oiibiit + aubzk + • + a¡abnk.
MATRICES 73 Abreviaremos esta suma empleando la notación de E al escribir Z a¡jbJk. í=i por definición, la componente il de (AB)C es igual a z *=1 " r r * Z aijbjk I CH = Z I Z ^ijbjk^kl J=1 J La suma que aparece en el miembro de la derecha se puede describir también como la suma de todos los términos aijbjkckl, donde j y k varían sobre todos los enteros 1 á ny 1 íS k r respectivamente? Si hubiéramos comenzado’con la componente jl de BC y luego hubiéramos calculado la componente il de A(BC), habríamos hallado exactamente la misma suma, con lo cual habría quedado probado el teorema. Sea A una matriz cuadrada n x n. Se dice que A es invertible o no singular si existe una matriz B n x n tal que AB - BA = Tal matriz B está determinada en forma única por A, ya que si C es tal que AC = CA = I„, entonces B = BI„ = B(AC) = (BA)C = I„C = C. (Ver el ejercicio 1). Esta matriz B se conoce como la inversa de A y se denota con A-1. Cuando estudiemos los determinantes, hallaremos una manera explí- cita de determinarla, cuando quiera que exista. Sea A una matriz cuadrada. Entonces se puede formar el producto de A con ella misma, a saber A A, o formar-el producto A-A efectuado m veces. Por definición si m es un entero 2: 1, se define Am como el producto A • • A efectuado m veces. Se define A° = I (la matriz unitaria del mismo tamaño que A). La regla usual Ar+s = ArAs es válida para los enteros, r. s > 0. El siguiente resultado relaciona la transpuesta con la multiplicación de ma- trices.
74 ALGEBRA LINEAL Teorema 5. Sean A y B matrices que se pueden multiplicar entre sí. Entonces 'B, ‘A se pueden multiplicar entre sí, y ‘(AB) = ’B'A. Prueba. Sean A = (a¡j) y B = (bjk). Sea AB = C. Entonces c.t = Z Ojjbjk. j=i Sean 'B = (b¡,7) y ‘A = (a'¡). Entonces, la componente ki de ’B'A es, por definición, Z b'kjOji- j=l Como b'kj = bjk y a# = a,j, nótese que esta última expresión es igual a * n " Z bjlfllj — Z tiijbjk. j=l j=l Por definición, ésta es la componente ki de *C, como se tenía que demostrar. En términos de multiplicación de matrices, ahora se puede escribir un sistema de ecuaciones lineales en la forma AX = B, donde A es una matriz m x n, X es un vector columna de tamaño n y B es un vector columna de tamaño m. Ejercicios 1. Sea 1 la matriz unitaria n x n. Sea A una matriz n x r. ¿A qué es igual IA1 Si A es una matriz m x n, ¿a qué es igual AI? 2. Sea O la matriz en la cual todas las componentes son iguales a O. Sea A la matriz de un tamaño tal que el producto AO está definido. ¿A qué es igual AO1 3. En cada uno de los siguientes casos, determinar (AB)C y A(BC).
MATRICES 75 4. Sean A y B matrices cuadradas, del mismo tamaño y supóngase que AB = BA. De- mostrar que (A + B)2 = + 2AB + B2 y que (A + B)(A — B) = A2 — B2, einpleando las propiedades de las matrices enunciadas en el teorema 3. 5. Sean Encontrar AB y BA. 6. Sea '7 C\ 0 7/ C = Sean A y B como en el ejercicio 5. Determinar CA, AC, CB, y BC. Enunciar la regla general que incluye este ejercicio como un caso especial. 7. Sea X = (1,0,0) y sea (3 1 ó\ 2 0 1 117/ ¿Cómo es XA2 8. Sea X = (0, 1,0) y sea A una matriz arbitraria 3x3. ¿Cómo describiría usted la matriz XA2 ¿Cómo lo haría si X = (0,0,1)? Generalizar con enunciados semejantes referentes a las matrices n x n y sus productos con vectores unitarios. 9. Sean A y B las matrices del ejercicio 3(a). Verificar mediante cálculos directos que ‘(aB) = ‘B'A. Hacer lo mismo para 3(b) y 3(c). Probar la misma regla para cualquiera de las matrices Ay B (que se puedan multiplicar entre sí). Si A, B y C son matrices que se pueden multiplicar entre si, demostrar que '(ABC) = 'C'B'A. 10. Sea M una matriz n x n tal que ‘M = M. Dados dos vectores filas en el espacio de n dimensiones, digamos A y B, definir (A, B) como AM'B. (Identifiqúese una matriz 1x1 con un número). Demostrar que se satisfacen las condiciones de un producto escalar excep- to, posiblemente, la condición concerniente a la positividad. Mostrar un ejemplo de una matriz M y de dos vectores A y B tal que AM'B sea negativa (tomando n = 2' 11. (a) Sea A la matriz 0 1 1\ 0 0 11 o o o/ Determinar A2, A3. Generalizar para las matrices 4x4. (b) Sea A la matriz l 1 1\ 1 0 1 1 \° ° 1 Calcular A2. A'. A*.
76 ALGEBRA LINEAL 12. Sea X el vector columna AX como un vector columna. y A la matriz que se indican a continuación. Determinar 13. Sea 0 0\ o o) 5' 1 3' 5 determinar AX para cada uno de los siguientes valores de X. 14. Sea 5 4 8 Determinar AX para cada uno de los valores de X dados en el ejercicio 13. 1 5. Sean ¿A qué es igual AX? 16. Sea X un vector columna que tiene todas sus componentes iguales a 0, excepto la componente i-ésima que es igual a 1. Sea A una matriz arbitraria cuyo tamaño es tal que po- demos formar el producto AX. ¿A qué es igual AX? 17. Sea A = i — 1,..., myj = 1,..., n, una matriz m x n. Sea B = (bji,),J = y k » 1,..., s, una matriz n x s. Sea AB = C. Demostrar que la columna fc-ésima de C* se puede escribir como C^bnA1 + --+b^A". (Esto será de utilidad para hallar el determinante de un producto.) 18. Sean a y b números y sean ¿A qué es igual AB? ¿A qué es igual A", donde n es un entero positivo?
MATRICES 19. Si A es una matriz cuadrada n x n, se dice que una matriz cuadrada es una inversa de A si AB = BA = Demostrar que si B y C son inversas de A, entonces B = C. 20. Demostrar que la matriz A del ejercicio 18 tiene una matriz inversa. ¿Cuál es esta inversa? 21. Demostrar que si A y B son matrices n x n que tienen inversas, entonces AB tiene una inversa. 22. Determinar todas las matrices A 2 x 2 tales que A2 = O. a ZcosO — sen0\ , /eos 20 -sen20^ 23. Sea 4 = I- Demostrar que A2 = \ sen 0 eos 0/ \ sen 20 eos 20) Determinar por inducción A" para cualquier entero positivo n. /-1 0\ \ 0 -1/ 24. Hallar una matriz A 2 x 2 tal que Á2 = —l = 25. Sea A una matriz n x n. Definir la traza de A como la suma de los elementos diagona- les. Asi, si A = (aij), entonces tr(A) = £ a«- 1 *1 4 4|- 2 6/ entonces tr(A) = 1 + 4 = 5. Si (1 -1 5\ 2 1 3 |, 1—4 7/ entonces tr(/l) = 9. Calcular la traza de las siguientes matrices: (1 7 3\ / 3 -2 4\ /—2 -15 2 1 (b) I 1 4 1 I (c) 3 2 3 -4/ 1—7 -3 -3/ 1—5 26. Sean A y B las matrices indicadas. Demostrar que trf/lB) = trfBA). Z1 — 1 1\ / 3 1 2\ (a) A = I 2 4 1 B = I 1 1 0 I \3 0 1/ \-l 2 1/ / 1 7 3 \ / 3 -2 4\ (b) A = -1 5 2 | B= 1 4 1 \ 2 3 -4 / y7 ~3 2 27. Probar en general que si A y B son matrices cuadradas n x n, entonces tr(AB) = tr(BA). 28. Demostrar que para cualquier matriz cuadrada A se tiene que tr(/4) = tr(BA).
1 ALGEBRA LINEAL 78 29. Sea /1 ° °\ 4= 0 2 0) \0 0 3/ Hallar A2, A3, A*. 30. Sea A una matriz diagonal, cuyos elementos diagonales son at,..., a„. ¡,A qué son iguales A2, A3, Ak para cualquier entero positivo k? 31. Sea (0 1 ó\ 0 0 41- 0 0 0/ Encontrar A3. 32. Sea A una matriz invertible n x n. Demostrar que ‘(4-1) = M)-‘. Por consiguiente se puede escribir 'A~‘, sin temor de confusión. 33. Sea A una matriz compleja, A = (a.-J, y sea A = (ü,j), donde la barra significa que se trata del conjugado complejo. Demostrar que _'(4) = í4. Asi, entonces, escribimos simplemente 'A. 34. Sea A una matriz diagonal: 0 ••• o\ 4 = ? 02 • ? Ó ••• a„j Si ai 0 para todo i, demostrar- que 4 es invertible. ¿Cuál es su inversa? 35. Sea 4 una matriz triangular estrictamente superior, esto es, una matriz cuadra- da (a,;) que tiene todas sus componentes tanto las de la diagonal como las que se hallan debajo de ella iguales a 0. Se puede expresar tal situación escribiendo a,j = 0 si i g j: 0 <*12 U13 O)n \ 0 0 ^23 ’ a2n — 1 ,M 0 0 0 •• 0 i Probar que 4" = O. (Si el lector quiere, puede hacerlo sólo para el caso en que n = 2,3 y 4. El caso general se puede hacer por inducción.)
MATRICES 79 36. Sea A una matriz triangular con componentes iguales a 1, en la diagonal: gea jv = A — Demostrar que N"+ * =0. Nótese que A = 1 + N. Demostrar que A es in- vertible y que su inverso es (z + n)-‘ = /-n + n2------+ (-iriv. 37. Si N es una matriz cuadrada tal que Nr*1 — 0 para algún entero positivo r, demostrar que I — N es invertible y que su inversa es I + N + + N'. 38. Sea A una matriz triangular: Supóngase que ningún elemento diagonal es igual a 0, y sea Ou1 0 0 a¡2 Ó Ó Demostrar que tanto BA como AB son matrices triangulares con ccmponentes iguales a 1 en la diagonal. 39. Se dice que una matriz cuadrada .des nilpotente si/T = 0 para algún entero r g 1. Sean A y B matrices nilpotentes del mismo tamaño y supóngase que AB = BA. Demos- trar que tanto. AB como A + B son nilpotentes. Apéndice. Eliminación Para probar el teorema 1, referente a ecuaciones lineales homogéneas, se emplea el teorema que expresa que n elementos de un espacio vectorial de dimensión m deben ser linealmente dependientes si n > m. Recíprocamente, es posible hacer una prueba directa del teorema sobre ecuaciones lineales mediante el método elemental de eliminación y, después, probar el teorema de la dimensión a partir del misino teorema. Este método se empleará ahora como un procedimiento al- terno ál que se dio en el texto.
80 ALGEBRA LINEAL Considérese el sistema de ecuaciones homogéneas (**). Sean Ai, ..., A„ los vectores fila de la matriz (a¡,). Entonces se pueden expresar las ecuaciones (*♦) en la forma Ai • X = 0 I") Am X = 0. Empleando la notación del producto escalar es más fácil formular la prueba del teorema en la forma siguiente: Teorema. Sea ai 1*1 + ’ ’ ' + UlnX„ = 0 amiXi + • + am„x„ = 0 un sistema de m ecuaciones lineales con n incógnitas y supóngase que n > m. Entonces, el sistema tiene una solución no trivial. Prueba. La prueba se hará por inducción, es decir, un proceso por pasos. Considérese primero el caso de una ecuación con n incógnitas, n > 1: «iXi + • • + a„xn = 0. Si todos los coeficientes a¡, ..., a„ son iguales a 0, entonces cualquier valor de las variables será una solución y ciertamente existe una solución no trivial. Su- póngase que algún coeficiente a¡ 0. Después de renumerar las variables y los coeficientes, suponer que at es tal coeficiente. Entonces se asignan valores arbi- trarios a x2, ..., x„; por ejemplo, hagamos que x2 = •• • = x„ = 1, y se resuelve x¡, haciendo Xi = ~—(a2 + • • + a„). “i De la manera anterior, se obtiene una solución no trivial para el sistema de ecuaciones. Supongamos ahora que el teorema es cierto para un sistema de m — 1 ecua- ciones con más de m — 1 incógnitas. Probaremos que es cierto para m ecuaciones con n incógnitas cuando n > m. Considérese el sistema (**). Si todos los coeficientes (a,j) son iguales a 0, entonces se les puede asignar a las variables cualquier valor distinto de cero para obtener una solución. Si algún coeficiente no es igual a 0, entonces, después de renumerar las ecuaciones y las variables, se puede suponer que es an. Para eliminar x, se resta un múltiplo de
MATRICES 81 ]a primera ecuación de las otras ecuaciones. A saber, considérese el sistema de ecuaciones (a2 - —AjYx = 0 \ a“ / \ «u / que también se pueden escribir en la forma «n (***) A.-X-^A¡X = O. «n En este sistema, el coeficiente de xt es igual a 0. Por tanto, se puede considerar (♦♦♦) como un sistema de m — 1 ecuaciones con n — 1 incógnitas y con n — 1 > m — 1. Conforme a la suposición inicial, se puede hallar una solución no trivial (x2,..., x„) para este sistema. Entonces se puede resolver para Xi en la primera ecuación, o sea Xi = —^(«12*2 + • • + «1BX„). «ii De esta manera, se halla una solución de Ai • X = 0. Pero, de acuerdo con (***), tenemos A,X = — Ai-X «u para i = 2,..., m. Por tanto, Ar X = 0 para i = 2,..., m, y, por consiguiente, se ha encontrado una solución no trivial para el sistema original (**). El argumento que acabamos de dar permite proceder por pasos de una ecua- ción a dos ecuaciones, después de dos a tres y así sucesivamente. Esto concluye la prueba. Corolario. Sea V un espacio vectorial y sea {vi,..., una base de V. Sean Wj,..., w„ elementos de V y supóngase que n > m. Entonces »!,..., w„ son linealmente dependientes. Prueba. Como {vn ..., ¡?m} es una base, existen números (a,;) tales, que se puede escribir Wi = a¡ it>j + • + amivm r • W» = alnVi + + a„„v„.
82 ALGEBRA LINEAL Si xIt..., x„ números, entonces XjWi + • •• + x„w„ = (xjüh + + x„ui„)t>i + • + (xjaml + • • + x„amn)v„ (únicamente sume los coeficientes de t>1( ..., v„ verticalmente hacia abajo). Con- forme al teorema, el sistema de ecuaciones Xian + ••• + x„a¡„ = 0 Xia„i + - • + x„am„ = 0 tiene una solución no trivial, ya que n > m. En vista de la observación precedente, dicha solución (xj,..., x„) es tal que XjWi +••• + x„w„ = 0, como se deseaba.
CAPITULO IV " * Aplicaciones lineales Primero definiremos la noción general de aplicación, la cual generaliza la noción de función. Entre las aplicaciones, las lineales son las más importantes. Una buena parte de las matemáticas está dedicada a resolver interrogantes rela- cionados con las aplicaciones arbitrarias, a aplicaciones lineales. Por una .parte, éstas son de interés en sí mismas y muchas aplicaciones son lineales. Por otra parte, es posible a menudo aproximar una aplicación arbitraria mediante una aplica- ción lineal, cuyo estudio es mucho más sencillo que el estudio de la aplicación original. Esto se hace en el cálculo de diversas variables. §1. Aplicaciones Sean S y S' dos conjuntos. Una aplicación de S en S' es una asociación que adjunta a todo elemento S un elemento de S'. En lugar de decir que F es una apli- cación de S en se escriben a menudo los símbolos F: S -» S'. Una función es un tipo especial de aplicación, o sea, es una aplicación de un conjunto en el conjunto de números, es decir, en R o bien en C. Emplearemos para las aplicaciones, parte de la terminología que se ha empleado para las funciones. Por ejemplo, si T: S -♦ S' es una aplicación y si u es un elemento de S, entonces denotamos por T(w) o por Tu al elemento de S' asociado a u por T. Se dice que T(u) es el valor de T en u. o también se dice que es la imagen de u bajo T. El símbolo T(u) se lee como “T de u”. El conjunto de todos los elementos T(u), cuando u varía sobre todos los elementos de S, se conoce como la imagen de T. Si W es un subconjunto de S, entonces el conjunto de elementos T(w), cuando w varía sobre todos los elementos de W, se conoce como la imagen de W bajo T y se denota por T(W'). Sea F: S -► S' una aplicación de un conjunto S en un conjunto S'. Si x es un elemento de S, se escribe a menudo x >- F(x) con una flecha especial h-> para denotar la imagen de x bajo F. Así, por ejemplo, se puede interpretar la aplicación F tal que F(x) = x2 como la aplicación xh» x2. 83
84 ALGEBRA LINEAL Ejemplo 1. Sean S y S' iguales a R. Sea f : R -♦ R la función f (x) = x2 (esto es, la función cuyo valor en un número x es igual a x2). Entonces, f es una aplicación de R en R. Su imagen es el conjunto de números 2: 0. Ejemplo?. Sea S el conjunto de números ^0 y sea S' =R . Sea g: S -> S' la función tal que g(x) = x1/2. Entonces g es una aplicación de S enR. Ejemplo?. Sea S el conjunto de las funciones que tienen derivadas de todos los órdenes sobre el intervalo 0 < t < 1 y sea S' — S. Entonces, la derivada D = d/dt es una aplicación de S en S. Ciertamente, la aplicación D asocia a la función f la función df/dt = Df. Conforme con nuestra terminología, Df es el •valor de la aplicación D en f. Ejemplo 4. Sea S el conjunto de funciones continuas definidas sobre el inter- valo [0,1] y sea S' el conjunto de las funciones derivables sobre ese intervalo. Definiremos una aplicación J: S -> S' al dar su valor en cualquier función f en S. Por ejemplo, supóngase que Jf (o bien -/(/)) es la función cuyo valor en x es (y/)(x) = dt. Entonces es una función derivable. Ejemplo 5. Sea S el conjunto R 3. esto es, el conjunto de las ternas. Sea A = (2,3,-l).SeaL:R3-R la aplicación cuyo valor en un vector X = (x, y, z) es A X. Entonces, L(X) = A - X. Si X = (1,1, — 1), entonces el valor de L en X es igual a 6. Tal como se hizo con las funciones, se describirá una aplicación al dar sus valores. Así, en lugar de hacer el enunciado del ejemplo 5 que describe la apli- cación L, también se podría decir: sea L :R3 -» R la aplicación L(X) = A • X. Esto no es del todo correcto, pero es más breve y, generalmente, rio da lugar a confusión. En forma más correcta se puede escribir X>—>L(X)oX>—>A-X con la flecha especial i—> para denotar el efecto de la aplicación L sobre el elemento X. Ejemplo6. Sea F:R2 -»R2 la aplicación determinada por F(x, y) = (2x, 2y). Descríbase la imagen bajo F de los puntos que están sobre la circunferencia x2 + y2 = 1. Sea (x, y) un punto sobre la circunferencia de radio igual a 1. Sea u = 2x y v = 2y. Entonces u, i satisfacen la relación (u/2)2 + (t>/2)2 = 1
APLICACIONES LINEALES 85 o, en otras palabras, Por tanto, (u,v) es un punto de la circunferencia de radio igual a 2. Por consiguiente, la imagen bajo F de la circunferencia de radio igual a 1 es un subconjunto de la circunferencia de radio igual a 2. Recíprocamente, dado un punto (u, t>) tal que u2 + v2 = 4, sea x = u/2 y y = v/2. Entonces, el punto (x, y) satisface la ecuación x2 + y2 = 1, y por tanto es un punto sobre la circunferencia de radio igual a 1. Más aún F(x, y) = (u, v). Así, todo punto sobre la circunferencia de radio igual a 2 es la imagen de algún punto sobre la circunferencia de radio igual a 1. Finalmente se concluye que la imagen de la circunferencia de radio igual a 1 bajo F es, precisamente, la circunferencia de radio igual a 2. Nota. En general, sean S y S' conjuntos. Para probar que S = S', frecuente- mente se prueba que S es un subconjunto de 8' y que 8' es un subconjunto de S. Esto es lo que se hizo en el argumento precedente. Ejemplo?. Sea 8 un conjunto y sea V un espacio vectorial sobre el campo K. Sean F y G aplicaciones de 8 en V. Se puede definir su suma F + G como la apli- cación cuyo valor en un elemento t de 8 es igual a F(t) -! G(t). También se define el producto de F por un elemento c de K como la aplicación cuyo valor en un ele- mento t de S es igual a cF(t). Es muy fácil verificar que se satisfacen las condiciones del EV 1 al EV 8. Ejemplo 8. Sea S un conjunto. Sea F: S -> K" una aplicación. Para cada ele- mento t de S, el valor de F en t es un vector F(t). Las coordenadas de F(t) dependen de t. Por tanto, existen funciones j¡,de S en K tales que F(o = (/1(t),...../;(t)). Estas funciones se conocen como las funciones coordenadas de F. Por ejemplo, si K = R y si 8 es un intervalo de los números reales, que se denota por J, entonces una aplicación F:J-»R" también se conoce como una curva (paramétrica) en el espacio de n dimensiones. Nuevamente sea 8 un conjunto arbitrario y sean F, G :S -> K" aplicaciones de S en K". Sean flt las funciones coordenadas de F y g¡, ..., g„ las fun- ciones coordenadas de G. Entonces G(t) = (áfi(t), •••> 3„(0) para todo teS. Además, (F t- G)(t) = F(t) + G(t) = (/*(£) + gM, fW + g„(t)),
86 ALGEBRA LINEAL y para cualquier ce K. (cF)(t) = cF(t) = (cfft), cf„(t)). Se ve que, en particular, las funciones de coordenadas de F + G son fl + Olí • • ,/ii + 9«- Sean U, V y W conjuntos. Sean F: UV y G:V-> W aplicaciones. Entonces, se puede formar la aplicación compuesta de V en W, denotada por G ° F. Esta es la aplicación definida mediante la regla (GoF)(t) = G(F(t)) para todo te U. Ejemplo 9. Si / : R -+ R es una función y g: R -> R también es una función, entonces g ° f es la función compuesta. Sea G: R -> R ” otra aplicación de R en R", y sean #i,. - •, 0» sus funciones coordenadas. Entonces G(0 = (<h(0, • • -, 0»(O)- Entonces (F + G)(t) = F(t) + G(t) = (fi (0 + 0i(O, •, /»(0 + 0»(O), y para cualquier número c, (cF)(t) = cF(t) = (c/JO, - - , c/B(0)- Ejemplo 10. Se puede definir una aplicación F: R -+ R “ mediante la aso- ciación Asi, F(/) - (2r,10',t3) y F(2) = (4,100,8). Las funciones coordenadas de F son funciones tales que fi(t) = 2t, /2(O=1O' y /3(0 = t3- W aplicaciones. Entonces, denotada por G ° F. Poi Sean II, V, W conjuntos. Sean F: G -»• V y G : V -» se puede formar la aplicación compuesta de U en W, definición ésta es la aplicación definida por (GoF)(t)= G(F(0) para todo t e U. Si f : R -» R es una función y g: R R entonces g f es la función compuesta. también es una función
APLICACIONES LINEALES 87 El siguiente enunciado es una propiedad importante de las aplicaciones. Sean U, V, W, S conjuntos. Sean F:U^V, G:V^W, y H:W-*S aplicaciones. Entonces H»(G°F) = (HoG)oF. Prueba. De nuevo, en este caso, la prueba es muy sencilla. Por definición, se tiene para cualquier elemento u de U: (H o (G o F))(u) = H((G o F)(u)) = H(G(u))). Por otra parte, ((« o G) o F)(u) = (H o G)(F(u)) = H(G(F(u))). Por definición, esto significa que (H o G) o F = H o (G o F). Vamos a estudiar las aplicaciones inversas, pero antes es necesario hacer mención de dos propiedades especiales que debe poseer una aplicación. Sea f: S -» S' una aplicación. Se dice que f es inyectiva si y siempre que x, ye S y x y, en- tonces f (x) # /(y). En otras palabras, que f sea inyectiva, significa que f adquiere valores diferentes en elementos distintos de S. Por ejemplo, la aplicación /R-R tal que f(x) = x2, no es inyectiva, ya que /(l) = /(— 1) = 1. La función x >-» sen x tampoco es inyectiva, porque sen x = sen (x + 2n). Sin embargo, la aplicación f: R -» R tal que /(x) = x + 1, es inyectiva, debido a que si x+l=y+l entonces x = y. De nuevo, sea f :S -» S' una aplicación. Diremos que f es suprayectiva si la imagen de f es todo S'. Nuevamente, la aplicación /R-R tal que f(x) = x2 no es suprayectiva, porque su imagen consta de todos los números £ 0 y esta imagen no es igual a R. Por otra parte, la aplicación de R en R determinada por x h» x3 es suprayectiva, debido a que, dado un número y, existe un número x tal que y = x3 (la raíz cúbica de y). Así, entonces, todo número se encuentra en la imagen de la aplicación.
88 algebra lineal Sea R + el conjunto de los número reales 0. Por convención se consideran las aplicaciones diferentes entre si R -> R y R - K dadas por la misma fórmula x h» x2. Lo esencial es que cuando se considere la asociación xt-> x2 como una aplicación de R en R, entonces ésta no es supra- yectiva ni tampoco inyectiva. Pero cuando se considera esta fórmula como una aplicación de R+ en R+, entonces resulta ser una aplicación tanto inyectiva como suprayectiva de R+ en él mismo, debido a que todo número positivo tiene una raíz cuadrada positiva y tal raíz cuadrada está determinada en forma única. En general, al trabajar con una aplicación f.S-^S' siempre se deben, por consiguiente, especificar los conjuntos S y S' para poder decir que f es inyectiva o suprayectiva o que no es de ninguna de estas formas. Para tener una notación completamente exacta se debería escribir fs,s' o algún símbolo que especifique S y S' en la notación; aunque esto resulta demasiado incómodo, se prefiere el contexto para aclarar lo que se quiere decir. Si S es cualquier conjunto, entonces la aplicación identidad Is se define como la aplicación tal que Is (x) = x para todo xeS. Nótese que la aplicación identidad es tanto inyectiva como suprayectiva. Si no necesitamos especificar la referencia a S (porque está clara en el contexto), entonces escribimos I en lugar de Is. Así, se tiene que f(x) = x para todo xeS. Algunas veces denotamos Is por ¡ds o sim- plemente por id. F inalmente, vamos a definir las aplicaciones inversas. Sea F :S -> S' una apli- cación de un conjunto en otro conjunto. Decimos que F tiene una inversa si existe una aplicación G: S' -» S tal que G"F = I¡ y F ° G = /y'. Con esto se quiere decir que las composiciones compuestas G ° F y F ° G son las aplicaciones identidad de S y S' respectivamente. Ejemplo II. Sea S = S' el conjunto de todos los números S; 0. Sea f:S-> S' la aplicación tal que/(x) = x2. Entonces/ tiene una aplicación inversa, a saber, la aplicación g : S -> S tal que g(x) = ^/x. Ejemplo 12. Sea R + el conjunto de los números > 0 y sea f: R -» R + la apli- cación tal que f(x) = ex. Entonces, f tiene una aplicación inversa que no es otra cosa que el logaritmo.
APLICACIONES LINEALES 89 Ejemplo 13. Este ejemplo es particularmente importante en las aplicaciones geométricas. Sea V un espacio vectorial y sea u un elemento fijo de V. Sea V la ap^jcación tal que T„(v) — v + u. Diremos que T„ es la traslación determinada por u. Si S es cualquier subconjunto de V, entonces TJS) se conoce como la tras- lación de S determinada por u, y consta de todos los vectores v + u, con veS. A menudo, se denota por S + u. En el siguiente diagrama aparece un conjunto S y su traslación determinada por un vector u. Figura 1 Dejamos al lector, como ejercicios, las pruebas de los dos enunciados siguientes: Si u¡, u2 son elementos de V, entonces T„,+,2 = TUl ° TU1. Si u es un elemento de V, entonces T„: V—> V tiene una aplicación inversa que no es otra cosa que la traslación T-„. Sea f:S^S' una aplicación que tiene una aplicación inversa g. Entonces, f es tanto inyectiva como suprayectiva. Prueba. Sean x,yeS y x y. Sea g:S' -» S la aplicación inversa de f. Si /W — entonces se debe tener X = g(f(x)) = g (f(yj) = y, lo cual es imposible. Por tanto, f(x) f(y) y, por consiguiente, / es inyectiva. Para probar que f es suprayectiva, supóngase que zeS'. Entonces /($(-)) = *
90 ALGEBRA LINEAL por definición de aplicación inversa y, por tanto, z = f(x), donde x = g(z). Esto prueba que f es suprayectiva. El recíproco del enunciado que se acaba de probar también es cierto, a saber: Sea f:S -> S' una aplicación que es tanto inyectiva como suprayectiva. Entonces f tiene una aplicación inversa. Prueba. Dado zeS', como f es suprayectiva, existe xeS tal que f(x) = z. Como f es inyectiva, este elemento x está determinado en forma única por z y, por consiguiente, se puede definir »(z) = x. Por definición de'g, hallamos que f(g(z)) = z y que g(f(x)) = x, de tal manera que g es una aplicación inversa de f. Por tanto, se puede decir que una aplicación f :S S' tiene una aplicación inversa si y sólo si f es tanto inyectiva como suprayectiva. Ejercicios 1. En ei ejemplo 3, expresar Df como una función de x cuando f es la función: (a) /(x) = sin v (b) /(x) = e* (c) /(x) = logx 2. Probar el enunciado acerca de las traslaciones que aparece en el ejemplo 13. 3. En el ejemplo 5, describir L(X) cuando X es el vector: (a) (1,2,-3) (b) (-1,5,0) (c) (2,1,1) 4. Sea F:R->R2 la aplicación tal que F(t) = (e*, t). ¿A qué son iguales F(l),F(0), F(—1)? 5. Sea G: R-> R2 una aplicación tal que G(t) = (t, 2t). Sea F como aparece en el ejerci- cio 4. ¿A qué son iguales (F + GX1), (F + GX2), (F + GXO)? 6. Sea F como aparece en el ejercicio 4. ¿A qué son iguales (2FX0), (rtFXl)? 7. Sea A = (1,1, —1,3). Sea F:R4 -> Ría aplicación tal que para cualquier vector X = (Xj,x2, x3,x4) tenemos que F(X) = X A + 2. ¿Cuál es el valor de F(X) cuando (a) X = (1,1,0, -1) y (b) X = (2,3, -1,1)? Los ejercicios del 8 al 12 se refieren al ejemplo 6. En cada caso, para probar que la imagen es igual a un cierto conjunto S, el lector deberá probar que la imagen está contenida en S y también que todo elemento de S está en la imagen. 8. Sea F: R2 -> R2 la aplicación definida por F(x, y) = (2x. 3i ). Describir la imagen de los puntos que están sobre la circunferencia x2 + y2 = 1. 9. Sea F :R2 ->R2 la aplicación definida por F(x,y) = (xy, y). Describir la imagen bajo F de la linea recta x = 2.
APLICACIONES LINEALES 91 10. Sea F la aplicación definida por F(x, y) = (é1 eos y, e*seny). Describir la imagen bajo F de la recta x = 1. En forma más general, describir la imagen bajo F de una recta x = c, donde c es una constante. 11. Sea F la aplicación definida por F(t,u) = (eos t, sen t, u). Describir geométricamente la imagen del plano (t, u) bajo F. ’YÍ Sea F la aplicación definida por F(x,y) = (x/3,y/4). ¿Cuál es la imagen bajo F de la elipse? §2. Aplicaciones lineales Sean V y V espacios vectoriales sobre el campo K. Una aplicación lineal F:F-> V es una aplicación que satisface las siguientes dos propiedades. AL 1. Para cualesquiera elementos u y v en V, se tiene F(u + p) = F(u) + F(v). AL 2. Para todo c en K y todo v en V, se tiene F(cv) = cF(v). Si se desea especificar el campo K, también se dice que F es K lineal. Como ge- neralmente se trabaja con un campo fijo K, se omite el prefijo K y simplemente se dice lineal. Ejemplo 1. Sea V un espacio de dimensión finita sobre K y sea {i?i,..., una base de V. Defínase una aplicación F:F->K" asociando cada uno de los elementos ve V con su vector de coordenadas X con respecto a la base. Así, si v = Xifi + ••• + xHvn, con xt e K, entonces se tiene F(v) = (xn ..., x„). Afirmamos que F es una aplicación lineal. Si w = yjVi + ••• + ynv„,
JHIHHHHHHHH OI lll O O O J- 92 ALGEBRA LINEAL con vector de coordenadas Y = (ylt..., y„), entonces v + w = (xj + yOvj + • • + (x„ + y„)t>„, por tanto, F(v + w) = X + Y = F(v) + F(w). Si ce K, entonces CV = CXjtíi + • • • + cx„v„, y de aquí que F(cv) = cX = cF{v). Esto prueba que F es lineal. Ejemplo 2. Sea V = R3 el espacio vectorial (sobre R) de los vectores en el espacio tridimensional. Sea V = R2 el espacio vectorial de los vectores en el espacio bidimensional. Se puede definir una aplicación F:R3-R2 mediante la proyección, a saber: F(x, y, z) = (x, y). Se recomienda al lector la com- probación de que se satisfacen las condiciones AL 1 y AL 2. En forma más general, sean r y n enteros positivos tales que r < n. Entonces, se tiene una aplicación proyección F: K" -> Kr definida por la regla F(xi, ..., x„) = (xj,..., xr). Se verifica trivialmente que tal aplicación es lineal. Ejemplo 3. Sea A = (1,2, —1). Sean V = R3 y V = R. Se puede definir una aplicación L = LA: R3 -* R mediante la regla X >-» X A, es decir, L(X) = XA para cualquier vector X en el espacio tridimensional. El hecho de que L sea lineal, resume dos propiedades conocidas del producto escalar, a saber, para cuales- quiera vectores X y Y en R3 se tiene que (X + y)- A = X- A + YA, (cX) • A = c(X • A). En forma más general, sea K un campo y sea A un vector fijo en K". Se tiene una aplicación lineal (es decir una aplicación K lineal) LA:K"^K tal que LA(X) = X • A para todo X e K”. Esto se puede, inclusive, generalizar a las matrices. Sea A una matriz m x n en un campo K. Se obtiene una aplicación lineal La : Kn -» Km tal que La(X) = AX
APLICACIONES LINEALES 93 para todo vector columna X en K". Nuevamente se infiere la linealidad de las propiedades de la multiplicación de matrices. Si A = (a¡j) entonces AX se asemeja a la forma: "11 "mi Este tipo de multiplicación se hallará frecuentemente en lo sucesivo. Ejemplo 4. Sea V cualquier espacio vectorial. La aplicación que asocia a cualquier elemento u de V este mismo elemento es, obviamente, una aplicación lineal que se conoce como la aplicación identidad, se denota con id o simplemente con I. Así, id(u) = u. Ejemplo 5. Sean V y V espacios vectoriales cualesquiera sobre el campo K. La aplicación que asocia el elemento O en V a cualquier elemento u de V, se co- noce como la aplicación nula y, obviamente, es lineal. Ejemplo 6. El espacio de las aplicacienes lineales. Sean V y V’ espacios vec- toriales sobre el campo K. Considérese el conjunto de todas las aplicaciones lineales de V en V y denótese este conjunto por &(V, V'), o simplemente Já? si resulta clara la referencia a V y V'. Se define la adición de aplicaciones lineales y su multiplicación por números de tal manera que es un espacio vectorial. Sean T:V->V' y F:V —> V dos aplicaciones lineales. Se define su suma T + F como la aplicación cuyo valor en un elemento u de V es igual a T(u) + F(u). Asi, se puede escribir {T + F)(u) = T(u) + F(u). Luego la aplicación T + F es una aplicación lineal. Realmente es fácil de verificar que se satisfacen las dos condiciones que definen una aplicación lineal. Para cualesquiera elementos u y v de V, se tiene (T + F)(u + p) = T(u + v) + F(u + p) = T(ü) + T(p) + F(u) + F(v) = T(u) + F(u) + T(p) + F(v) = (T + F)(u) + (T + F)(v\ Más aún, si ce K, entonces (T + F)(cu) = T(cü) + F(cu) — cT(u) + cF(u) = c[T(u) + F(«)] = c[(T + F)(u)]. Por lo que T + F es una aplicación lineal.
94 ALGEBRA LINEAL Si ae K, y T: V -> V es una aplicación lineal, definimos una aplicación aT de V en V dando su valor en un elemento u de V, a saber (aT)(u) = aT(u). Luego se verifica fácilmente que aT es una aplicación lineal, lo cual se deja como ejercicio. Acabamos de definir las operaciones de adición y de multiplicación por nú- meros en nuestro conjunto í£. Más aún, si T: V -> V es una aplicación lineal, esto es, si es un elemento de entonces se puede definir — T como (— 1)T, es decir, el producto del número — 1 por T. Finalmente, tenemos la aplicación nula que asocia el elemento O de V' a cada elemento de V. Entonces !£ es un espacio vec- torial. En otras palabras, el conjunto de las aplicaciones lineales de V en V es en sí mismo un espacio vectorial. La verificación de que las reglas del EV 1 al EV 8 se cumplen para un espacio vectorial es sencilla y se le deja al lector. Ejemplo 7. Sea V = V el espacio vectorial de las funciones de una variable real con valores en los reales, que tienen derivadas de todos los órdenes. Sea D la derivada. Entonces D: V -> V es una aplicación lineal. Esta es solamente una manera breve de resumir las propiedades conocidas de la derivada, a saber Dtf + g) = Df + Dg, y D(cf) = cDf para cualesquiera funciones derivables f y g y cualquier constante c. Si f está en V y si I es la aplicación identidad, entonces (D + /)/ = D/+ f. Así, cuando f es la función tal que f(x) = entonces (D + l)f es la función cuyo valor en x es igual a e* + e* = 2ex. Si f(x) = sen x, entonces ((£> + 7)/)(x) = eos x + sen x. Sea T: V -» V una aplicación lineal. Sean ü, v y w elementos de V. Entonces T(u + v + w) = T(u) + T(v) + T(w). Fisto se puede ver por pasos, usando la definición de aplicaciones lineales. Asi T(u + v + w) = T(u + t>) + T(w) = T(u) + T(v) + T(w). Análogamente, dada una suma de más de tres elementos, se satisface una pro- piedad análoga. Por ejemplo, sean ut,..., u„ elementos de V. Entonces, T(ui + • • • + u„) = T(wj) + • • • + T(u„). La suma que se encuentra en el miembro derecho de la igualdad se puede tomar en cualquier orden. Se puede dar fácilmente una prueba formal por inducción, que omitimos aquí. Si at, ..., a„ son números, entonces T(a1u1 + • • • + a„u„) = aiT(ut) + + a„T(u„).
APLICACIONES LINEALES 95 Hacemos la demostración para tres elementos. T(aiU + a2v + a3w) = T^uju) + T(a2v) + T(a3w) = atT(u) + a2T(v) + a3T(w). _E1 siguiente teorema muestra cómo queda determinada una aplicación lineal cuando se conoce el valor que toma en los elementos de la base. Teorema 1. Sean V y W espacios vectoriales. Sea {a,,.. . , v„] una base de V y sean w2,.. ,,w„ elementos arbitrarios de W. Entonces, existe una apli- cación lineal única T :V-> W tal que T(i?i) = wj, ..., T(vn) = w„. Si Xi,..., x„ son números, entonces T(xív1 + + x„v„) = XjWi + • - • + x„w„. Prueba. Vamos a probar que existe una aplicación lineal T que satisface las condiciones requeridas. Sea v un elemento de V y sean xB ..., x„ los únicos números tales que v = XjVj + ••• + x„v„. Supóngase T(v) = x,w1 + • • + x„w„. > Entonces se ha definido una aplicación T de V en W y se afirma que T es lineal. Si v' es un elemento de V y si v' = y ¡Vi + • • • + y„v„, entonces v + v' = (xj + yi>i + • • • + (x„ + y„)vn. Por. definición, se obtiene T(v + v') = (xj + yjwi + • • • + (x. + y„)w„ = XiWj + yjW! + • • • + x„w„ + y„w„ = T(t>) + T(v'). Sea c un número. Entonces, cv = cx¡vt + • • + cx„v„ y, por tanto, T(cv) = cxtWi + • • • + cx„w„ = cT(v). En consecuencia se ha probado que T es linea] y que, por tanto, existe una apli- cación lineal como se enunció en el teorema. Tal aplicación es única, debido a que para cualquier elemento XjUi + • • +
96 ALGEBRA LINEAL x„v„ de V, cualquier aplicación lineal F V -» W tal que F(v¡) = w¡(i = también se debe satisfacer + • • + x„v„) = XtF(vi) + + x„F(t?„) = XjWj + •• + x„w„. Esto concluye la prueba. Ejercicios 1. Determinar cuáles de las siguientes aplicaciones F son lineales. (a) F: K3 -» R2 definida por F(x, y, z) = (x, z). (b) F:R‘-f R‘ definida por F(X) - — X. (c) F.R3 -> R3 definida por F(X) = X + (0, -1,0). (d) F:R2 -+ R2 definida por F(x, y) = (2x + y, y). (e) F: R2 -»R2 definida por F(x, y) = (2x. y — x). (1) F:R2 -> R2 definida por F(x,y) = (y,x). (g) F:R2 -»R definida por F(x,y) = xy. (h) Sea U su subconjunto abierto deR3 y sea K el espacio vectorial de las funciones deri- vables sobre V. Sea V el espacio vectorial de los campos vectoriales sobre U. Entonces grad: V—* V es una aplicación. ¿Es lineal esta aplicación? 2. Sea T: V W una aplicación lineal de un espacio vectorial en otro espacio vectorial. Demostrar que T(O) = O. 3. Sea T tal como se definió en el ejercicio 2. Sean u y v elementos de V y sea Tu = w. Si Tv = O, entonces demostrar que T(u + v) también es igual a w. 4. Determinar todos los elementos z de V tales que Tz = w. 5. Sea T: V -> W una aplicación lineal. Sea t? un elemento de V. Demostrar que T( — v) = -T(e). 6. Sea V un espacio vectorial y sean f :V ->R, g :V -* R dos aplicaciones lineales. Sea F: K-» R2 la aplicación definida por F(v) = (f(v\g(v)). Demostrar que F es lineal. Gene- ralizar el resultado. 7. Sean V y W espacios vectoriales y sea F : V -♦ W una aplicación lineal. Sea U el subconjunto de V que consta de todos los elementos v tales que F(v) = 0. Probar que U es un subespacio de V. 8. ¿Cuáles de las aplicaciones que aparecen en los ejercicios 4, 7, 8 y 9 del §1 son lineales? 9. (a) Sea F :R3 -»R4 una aplicación lineal. Sea P un punto de R3, y sea A un elemento no nulo de R3. Describir la imagen bajo F de la linea recta P + tA. [Es necesario distinguir entre los casos F(>4) = O y F(^) / O ] (b) En forma más general, sea F : R" -» R" una apli- cación lineal. Sea P un punto de R" y A un elemento no nulo de R". Demostrar que la imagen bajo L de la línea recta P + tA (t eR) es una línea recta o un punto, (c) Sea V un espacio vectorial y sean v y w elementos de V. El segmento de recta, comprendido entre v y v + w, se define como el conjunto de todos los puntos v + tw, 0 g t g 1.
APLICACIONES LINEALES 97 Sea L : V -* U una aplicación lineal. Demostrar que la imagen.bajo L de un segmento de recta en V es un segmento de recta en U. ¿Entre qué puntos? Sea V un espacio vectorial y sean Pj, v2 elementos de V linealmente independientes. El conjunto de los elementos de V que se pueden escribir en la forma ti «i + t2v2 con los nú- meros ti, t2 donde ' P 0 á tx á 1 y Og t2 g 1, se conoce como un paralelogramo generado por Vj, v2. 10. Sean V y W espacios vectoriales y sea F: V -» W una aplicación lineal. Sean vls v2 elementos de V linealmente independientes y supóngase que F(vt), F(v2) son linealmente independientes. Demostrar que la imagen bajo F del paralelogramo generado por y v2 es el paralelogramo generado por Ffi^), F(v2). 11. Sea F una aplicación lineal de R2 en sí misma, tal que F(E1) = (1,1) y F(£2) = (—1,2). Sea S el cuadrado cuyos vértices están en (0,0), (1,0), (1,1), y (0,1). Demostrar que la imagen bajo F de este cuadrado es un paralelogramo. 12. Sean A y B vectores no nulos en el plano tales que no existe constante alguna c # 0 tal que B — cA. Sea T una aplicación lineal del plano en sí misma de tal manera que T(Et) = A y T(£2) = B. Describir la imagen bajo T del rectángulo cuyos vértices son (0,1), (3,0), (0,0) y (3J). 13. Sean A y B dos vectores no nulos en el piano tales que no existe constante alguna c 0 tal que B = cA. Describir geométricamente el conjunto de puntos tA + uB para valo- res de t y de u tales que 0Stí5y0guS2. 14. Sea T, : V -> V la traslación determinada por un vector u. ¿Para qué vectores u resul- ta ser T, una aplicación lineal? 15. Sean K W espacios vectoriales y sea F: V -» W una aplicación lineal. Sean Wi,..., »v„ elementos de W linealmente independientes y sean vt,..., u, elementos de V tales que F(v,-) = w¡ para i = 1,..., n. Demostrar que ......n, son linealmente independientes. 16. Sea V un espacio vectorial y sea F • V -♦ R una aplicación lineal. Sea W el subcon- junto de V que consta de todos los elementos v tales que F(v) = O. Supóngase que W # V, y que t>0 es un elemento de V que no está en W. Demostrar que todo elemento de V se puede escribir como una suma + cv0, con algún >v en W y algún número c. 17. En relación con el ejercicio 16, demostrar que W es un subespacio de V. Sea {v1;..., una base de W. Demostrar que {e0, vit es una base de V. 18. Sea L :R2 -» R2 una aplicación lineal que tiene el siguiente efecto sobre los vecto- res indicados a continuación: (a) £(3,1) = (1,2) y £(—1,0) = (1,1) (b) £(4,1) = (1,1) y £(1, lj = (3, —2) (c) £(1,1) = (2,1) y £(-1,1) = (6,3). En cada caso, calcular £(1,0). 19. Sea £ tal y como aparece en (a), (b) y (c) del ejercicio 18. Encontrar £(0,1).
98 ALGEBRA LINEAL §3. El núcleo y la imagen de una aplicación lineal Sean V, W espacios vectoriales sobre K y sea F: V -* W una aplicación lineal, i El conjunto de elementos veV tales que F(v) = 0 recibe el nombre de núcleo7 de F. Ejemplo 1. Sea L: R3 -> R la aplicación tal que L(x, y, z) = 3x — 2y + z. Así, pues, si A = (3, —2,1), se puede escribir L(X) = X • A = A • X. Luego el núcleo de L es el conjunto de soluciones de la ecuación 3x - 2y + z = 0. Por supuesto que esto se generaliza hasta el espacio de n dimensiones. Si A es un vector arbitrario en R", entonces se puede definir la aplicación lineal LrR’-R tal que La(X) = A • X.Su núcleo se puede interpretar como el conjunto de todos los X que son perpendiculares a A. Ejemplo 2. Sea P: R3 -♦ R2 la proyección, tal que P(x, y, z) = (x, y). Luego P es una aplicación lineal cuyo núcleo consta de todos los vectores en R3 cuyas primeras dos coordenadas son iguales a 0, o sea, de todos los vectores (0,0. z) con la componente z arbitraria. Vamos a probar que el núcleo de una aplicación lineal F: V ->• W es un sub espacio de V. Como F(O) = O, se ve que O está en el núcleo. Supóngase que v y w están en el núcleo. Entonces F(v + w) = F(y) + F(w) = 0 + 0 = 0, así que v + w está en el núcleo. Si c es un número, entonces F(cv) = cF(t>) = O de tal manera que cv también está en el núcleo. Por tanto el núcleo es un subespacio. El núcleo de una aplicación lineal resulta de utilidad para determinar si la aplicación es inyectiva. A saber, sea F: V -> W una aplicación lineal. Afirmamos que las dos condiciones siguientes son equivalentes: 1. El núcleo de F es igual a {O}. 2. Sí v, w son elementos de V tales que F(t>) = F(w), entonces v = w. En otras palabras, F es inyectiva.
APLICACIONES LINEALES 99 Con el objeto de probar nuestra afirmación, supóngase que F satisface la pri- mera condición y supóngase que v, w son tales que F(v) = F(w). Entonces F(v — w) — F(v) — F(w) = O. Por suposición, v — w = O y, por tanto, v = w. ~ (Recíprocamente, supóngase que F satisface la segunda condición. Si v es tal que F(v) = F(O) = O, se concluye que p = O. El núcleo de F también es de utilidad para describir al conjunto de todos los elementos de V que tienen una imagen determinada bajo F en W. Recomen- damos revisar el ejercicio 5, que se refiere a este tema. Teorema 2. Sea F : V-> W una aplicación lineal cuyo núcleo es {(?}. Si vt,.. .,v„ son elementos de V linealmente independientes, entonces F(vt),..., F(t>„) son elementos de W linealmente independientes. Prueba. Sean Xi,..., x„ números tales que XiF(vi) + • • • + x„F(v„) = O. Por linealidad, se tiene F(xiVi + • • • + x„v„) = O. Porloquexii>i + •• + x„v„ = O. Como»............ v„ son linealmente independientes, se deduce que xf = 0, para i — 1,..., n. Esto prueba el teorema. Sea F: V -> W una aplicación lineal. La imagen de F es el conjunto de Jos ele- mentos w de W para los cuales existe un elemento v de V tal que F( o) = w. La imagen de F es un subespacio de W. Para probar esto, nótese primero que F(O) = O y que, por tanto, O está en la imagen. Después supóngase que están en la imagen. Entonces existen elementos Ui,v2 de v tales que F(vt) = w, y F(v2) = w2. Por tanto, F(vj + v2) = F(t>i) + F(v2) = Wj + w2, con lo que se prueba que m>i + w2 está en la imagen. Si c es un número, entonces F(c»i) = cF(uj) = cwi. Por consiguiente, cw¡ está en la imagen. Esto prueba que la imagen es un subes pació de W. A menudo abreviaremos núcleo e imagen, escribiendo simplemente Ker e Im respectivamente. El siguiente teorema relaciona las dimensiones del núcleo y de la imagen de una aplicación lineal, con la dimensión del espacio sobre el cual está definida la aplicación. Teorema 3. Sea V un espacio vectorial. Sea L: V —► W una aplicación lineal de V en otro espacio W. Sean n la dimensión de V, q la dimensión del núcleo de
100 ALGEBRA LINEAL L y s la dimensión de la imagen de L. Entonces n = q + s. En otras palabras. dim V = dim Ker i. + dim Im L: ? > Prueba. Si la imagen de L consta sólo del O, entonces la afirmación es trivial. Por consiguiente, se puede suponer que s > 0. Sea {wo ..., ws} una base de la imagen de L. Sean vt, ..., v, elementos de V tales que L(v¡) = w, para i = 1, ..., s. Si el núcleo de L no es {O}, entonces supóngase que {u1; es una base del núcleo. Si el núcleo es {O}, entonces debe quedar claro que, en lo que sigue, se omitirá toda referencia a {uj,..., u,}. Afirmamos que {»i,..., t>3, uit ..., u,} es una base de V. Esto será suficiente para probar la afirmación. Sea v cualquier elemento de V; entonces hay números xt, ..., xs tales que L(v) - XjWi + - • + x3w3, porque {wI( ..., ws} es una base de la imagen de E- Debido a la linealidad E(v) = Llxtü! + • • • + xsvs), y nuevamente por la linealidad, restando el miembro de la derecha de la igualdad del miembro izquierdo de la misma, se deduce que E(v — XjV] — • • • — x,v3) = O. Por tanto, v — xiVj — • • • — x,vt está en el núcleo de L y hay números y,, ..., y, tales que v - xt»i - • • - x^ = ytUi + • • • + yquq. Por consiguiente, V = x,t>t + • • + xsvs yiUi + • + y,u, es una combinación lineal de ., v„ un ..., Esto prueba que estos s + q elementos de V generan a V. Ahora vamos a demostrar que son linealmente independientes y que, por tanto, constituyen una base. Supóngase que existe una relación lineal: Xi ti, + • • + x,v, + ytUt + + yquq = O. Al aplicar L a esta relación y al usar el hecho de que L(uj) = O para / = 1,..., q, se obtiene XiLÍPi) + + xsL(os) = O. Pero L(vt), ..., L(vs) no son otra cosa que Wi,.... w,. que se habían considerado
APLICACIONES LINEALES 101 linealmente independientes. Por lo que x¡ = 0 para i — 1,..., s. Por consi- guiente, yi»! + • • • + y,«q = o. Pero Ui,..., m, constituyen una base del núcleo de L y, en particular, son lineal- meíite independientes. Por tanto, todo yj = 0 para j = 1,..., q. Esto concluye la prueba de la afirmación. Ejemplo 1 (Cont.) La aplicación lineal L: R3 -> R del ejemplo 1 se determina mediante la fórmula L(x, y, z) = 3x — 2y + z. Su núcleo consta de todas las soluciones de la ecuación 3x — y + z = 0. Su imagen es un subespacio de R, no es {O},y, por tanto consta de todos los ele- mentos de R, su imagen tiene dimensión igual a 1. Por lo que su núcleo tiene una dimensión igual a 2. Ejemplo 2 (Cont.). La proyección P: R3 -» R2 del ejemplo 2 es obviamente suprayectiva y su núcleo tiene una dimensión igual a 1. En ei capítulo VI, §3, investigaremos, en general, la dimensión del espacio de las soluciones de un sistema de ecuaciones lineales homogéneas. Ejercicios 1. Sean A, B vectores de R2 que forman una base de R2. Sea F : R2 -»R" una aplicación lineal. Demostrar que P(A) y P(B) son linealmente, independientes o bien que la dimensión de la imagen de F es igual a 1, o bien que la imagen de F es .{0} 2. Sea A un vector no nulo de R2. Sea F : R2 -» W una aplicación lineal tal que F(A) — O. Demostrar que la imagen de F es una linea recta ó {O}. 3. Sea F : V -♦ W una aplicación lineal, cuyo núcleo es {O}. Supóngase que V y W tienen la misma dimensión igual a n. Demostrar que la imagen de F es todo W. 4. Sea F : V -» W una aplicación lineal y supóngase que la imagen de F es todo W. Su- póngase que V y W tienen la misma dimensión, igual a n. Demostrar que el núcleo de F es {O}. 5. Sea L: V -» W una aplicación lineal. Sea w un elemento de W. Sea v0 un elemento de V tal que Uy^) = w. Demostrar que cualquier solución de la ecuación L(X) — w es del tipo v0 + u, donde u es un elemento del núcleo de L. 6. Sea V el espacio vectorial de las funciones que tienen derivadas de todos los órdenes y sea D : V -> V la derivada. ¿Cuál es el núcleo de £>? 7. Sea D2 la segunda derivada (esto es, la iteración de D tomada dos veces). ¿Cuál es el núcleo de D2? En general, ¿cuál es el núcleo de D" (la n-ésima derivada)? 8. Sea V como aparece en el ejercicio 6. Escríbanse las funciones como funciones de una
102 ALGEBRA LINEAL variable r y sea D = d/dt. Sean a¡,..., a„ números. Sea g un elemento de V. Describir cómo se puede interpretar el problema de hallar una solución de la ecuación diferencial ¡f-'f . + aof ~ 9 de tal manera que se ajuste a la situación abstracta descrita en el ejercicio 5. 9. (a) Sean V y D como aparecen en el ejercicio 6. Sea L = D — 1, donde I es la aplica- ción identidad de V. ¿Cuál es el núcleo de L? (b) ¿Cuál es el núcleo de L si ahora L = D — al, donde a es un número? 10. (a) ¿Cuál es la dimensión del subespacio de R" que consta de aquellos vectores A = (ai,..., a„) tales que a, + • + a» = 0? (b) ¿Cuál es la dimensión del subespacio del espacio de las matrices (a0) n x n, tales que M l + ' ' ' + am — l¿Uii = 0? i=l [Con respecto a la parte (b), vea el siguiente ejercicio.] 11. Sea A = (aij) una matriz n x n. Definir la traza de A como la suma de los elemen- tos de la diagonal, es decir, tr(4) = £ a¡¡. i= 1 (a) Demostrar que la traza es una aplicación lineal del espacio de las matrices n x n en R. (b) Si A y B son matrices n x n, demostrar que tr(4B) = tr(B/l). (c) Si B es invertible, demostrar que tr(B~IAB) = tr(4). (d) Si A y B son matrices n x n, demostrar que la asociación (4,B)-tr(/lB) = <4,B> satisface las primeras tres condiciones de un producto escalar. (Para la definición general, vea el capítulo VI.) 12. Sea S el conjunto de las matrices simétricas n x n. Demostrar que S es un espacio vectorial. ¿Cuál es la dimensión de S? Demostrar una base para S, cuando n = 2 y cuando n = 3. 13. Sea A una matriz simétrica n x n. Demostrar que trf/M) g 0, y si A O, entonces tr(^4^4) g 0. 14. Una matriz A n x n se llama antisimétrica si ‘A = — A. Demostrar que cualquier matriz A n x n se puede expresar como una suma A = B + C, donde B es una matriz simétrica y C es una matriz antisimétrica. [Sugerencia: sea B = (A + ’A)/2] Demostrar que si A = Bt + Ct, donde B, es una matriz simétrica y Ct es una matriz antisimétrica, entonces B = B, y C = CP 15. Sea M el espacio de todas las matrices n x n. Sea
APLICACIONES LINEALES 103 la aplicación tal que (a) Demostrar que P es lineal, (b) Demostrar que el núcleo de P consta del espacio de las matrices antisimétricas, (c) ¿Cuál es la dimensión del núcleo de P? Sea M el espacio de todas las matrices n x n. Sea F:M->M la aplicación tal que (a) Demostrar que F es lineal, (b) Describir el núcleo de F y determinar su dimensión. 17. (a) Sean U y W espacios vectoriales. Supóngase que U x W es el conjunto de todas las parejas (u, w) con ueU y con we W. Si (ui.wri, (u2, w2) son parejas como las supuestas, defínase su suma como («1, »1) + (“2, >V2) = (Uj + u2, w¡ + w2). Si c es un número, defínase c(u, w) = (cu, cw). Demostrar que con estas definiciones U x W es un espacio vectorial. ¿Cuál es el elemento nulo? (b) Si V tiene dimensión igual a n si W tiene dimensión igual a m, ¿cuál es entonces la dimensión de U x W? Mostrar una base de V x W en términos de una base para V y una base para W. (c) Si U es un subespa- cio de un espacio vectorial V, demostrar que el subconjunto de V x V que consta de todos los elementos (u,u) con ueü es un subespacio. 18. (Hágase este ejercicio después de haber resuelto el ejercicio 17.) Sean U y W sub- espacios de un espacio vectorial V. Demostrar que dim V + dim W — dim (U + W) + dim (U n W). [Sugerencia: demostrar que la aplicación L:V x V determinada por Uu, w) = u — w es una aplicación lineal.] §4. Composición de aplicaciones lineales y aplicaciones lineales inversas En el §1 se mencionó el hecho de que se pueden componer aplicaciones arbi- trarias. En el caso de las aplicaciones lineales se puede decir algo adicional. Teorema 4. Sean U, V y W espacios vectoriales sobre un campo K. Sean F:U->V y G:V-+W aplicaciones lineales. Entonces, la aplicación compuesta G° F es también una aplicación lineal. fHHHtHttfffftttittttfft
104 ALGEBRA LINEAL Prueba. Este teorema es muy fácil de probar. Sean u y v elementos de y Como F es lineal, tenemos que F{u + v) = F(u) + F(t>). Por tanto, (G ° F)(u + v) = G(F(u + v)) = G(F(u) + F(v)). Como G es lineal, se obtiene G(F(u) + F(0) = G(F(u)) + G(F(t>)). Por consiguiente, (G o F)(u + p) = (G o F)(u) + (G » F)(v). Ahora, sea c un número. Entonces, (G o F)(cu) = G(F(cu)) = G(cF(ü)) (debido a que F es lineal). = cG(F(u)) (debido a que F es lineal). Esto prueba que G ° F es una aplicación lineal. El siguiente teorema afirma que algunas de las reglas de la aritmética, refe- rentes al producto y a la suma de números, también se aplican a la composición y a Ja suma de aplicaciones lineales. Teorema 5. Sean U, V y W espacios vectoriales sobre el campo K. Sea F:U^y una aplicación lineal y sean G y H aplicaciones lineales de V en W. Entonces (G + H)°F = G° F + H°F. Si c es un número, entonces (cG) o F = c(G o F). Si T: U -»• V es una aplicación lineal de U en V, entonces G°(F + T) = G°F + G°T. Todas las pruebas son sencillas. Sólo se probará la primera afirmación y se dejarán las demás como ejercicio. Sea u un elemento de U: ((G + H)° F)(u) = (G + H)(F(«)) = G(F(«)) + H(F(u)) = (G o F)(u) + (H o F)(u). Por definición, se deduce que (G + H)°F—G°F + H°F.
APLICACIONES LINEALES ®5 B| v Puede suceder que U = V = W. Sea* F: U -» U y G : U -» U aplicaciones H, lineales. Entonces se puede formar F ° G y G » F. No siempre es cierto que cías B dos aplicaciones sean iguales. Por ejemplo, sea U = R3. Sea F la aplicación l«a< B dada por B F(x,y, z) = tx,y,0) 3 '* y sea G la aplicación lineal dada por t G(x,y,z) -fcc.z, 0). Entonces (G«f)(xj.;)=(x,O,O), pero (F o G)(x, y. z) = (x, z, 0). Sea F: V -> V una aplicación lineal de un espacio vectorial en sí mismo. Al- gunas veces F se designa como operador.Luego se puede formar la composición F ° F, que, nuevamente, es una aplicación liaeal de V en sí mismo. Análogamente, se puede formar la composición F ° F •'of' de F con ella misma n veces para cualquier entero n ¡i 1. Se denota esta composi- ción por F". Si n = O, se defíne F° = l (aplicación identidad). La regla es Fr+l = F°FS para los enteros r, s 2: O. Para simplificar la notación, a menudo se omitirá el pequeño círculo que aparece entre las aplicaciones lineales y en lugar de F ° G se escribirá FG. Teorema 6. Sea F :U —* V una aplicación lineal y supóngase que esta aplica- ción tiene una aplicación inversa G:V-rU. Entonces, G es una aplicación lineal. Prueba. Sean v1( v2 e V. Debemos mostrar primero que G(t>i + v2) = G(vj) + G(v2). Sean uj = G(Vj) y u2 = G(u2). Por definición, esto significa que F(uj) = y F(u2) = v2. Como F es lineal, se encuentra que F(uj + u2) = F(u,) + F(u2) = vi + v2.
106 ALGEBRA LINEAL Por definición de aplicación inversa, esto significa que G(uj + v2) = u> + u2. lo cual prueba lo que se quería. Se deja como ejercicios el hacer la prueba de G(cr) = cG(ü) (ejercicio 3). Corolario. Sea F:U -» Vuna aplicación lineal cuyo núcleo es {O} y la cual es suprayectiva. Entonces, F tiene una aplicación lineal inversa. Prueba. Se vio en 3 que si el núcleo de P es {O}, entonces F es inyectiva. Por lo que se puede concluir que F es tanto inyectiva como suprayectiva, así que existe una aplicación inversa y, por el teorema 6, es lineal. Ejemplo 1. Sea F: R2 —> R2 una aplicación ¡ineal tal que F(x, y) = (3x - y, 4x + 2y). Vamos a mostrar que F tiene una inversa. Primero nótese que el núcleo de F es {O}; ya que si 3x — y = 0, 4x + 2y = 0, entonces se puede resolver para x, y en la forma usual: multiplicar la primera ecuación por 2 y sumarla a la segunda. Hallamos que lOx - 0, por lo que x = 0 y entonces y = 0 debido a que y = 3x. Por tanto, F es inyectiva, debido a que su núcleo es {O}. Por el teorema 2 del §3, se infiere que la imagen de F tiene dimensión igual a 2. Pero la imagen de F es un subespacio de R2 que también tiene dimensión igual a 2 y por tanto esta imagen es igual para todo R2, así que F es suprayectiva. Por tanto, F tiene una inversa y, por el teorema 6, ésta es una aplicación lineal. Una aplicación lineal F:U -» Vque tiene una inversa G:F-» U (también se llama invertible) se conoce como un isomorfismo. Ejemplo 2. Sea V un espacio vectorial de dimensión n. Sea {vi,. una base para V. Sea L:R"-< V la aplicación tal que L(x,. ...,x„) = x^j + ••• + x„v„. Entonces Les un isomorfismo.
APLICACIONES LINEALES 107 Prueba. El núcleo de Les {O}, ya que si Xit?! + •• + X„Vn = 0, entonces todo x¡ = 0 (puesto que v¡, son Encálmente independientes). La imagen de L es todo V, debido a que v¡,.. ,,v„ generan a V. Por el corolario del teofelha 6, se deduce que Les un isomorfismo. Ejercicios 1. Sea L: R2 -» R2 una aplicación lineal tal que L / O pero L2 = L ° L = O. Demostrar que existe una base {A, B] de R2 tal que ' HA) = B y UB) = O. 2. Sea dim V > dim W. Sea L : V -> W una aplicación lineal. Demostrar que el núcleo de L no es {O}. 3. Completar la prueba del teorema 6. 4. Sea dim V = dim W. Sea L : V -» W una aplicación lineal cuyo núcleo es {O}. De- mostrar que L tiene una aplicación lineal inversa. 5. Sean F y G aplicaciones lineales invertibles de un espacio vectorial Ven sí mismo. Demostrar que (FoG)-1 = G~l >r‘. 6. Sea L : R2 -* R2 la aplicación lineal definida por L(x, y) = (x + y, x - y). Demostrar que L es invertible. 7. Sea L: R2 -» R2 la aplicación lineal definida por L(x, y) = (2x + y, 3x — 5y). Demostrar que L es invertible. 8. Sean L : R3 -* R3 las aplicaciones lineales que a continuación se indican. Demostrar que L es invertible en cada caso. (a) L(x, y, z) = (x — y, x + z, x + y + 2z) (b) L(x,y,z) = (2x - y + z,x + y,3x + y + z). 9. Sea L : V -» V una aplicación lineal tal que L2 = O. Demostrar que I — L es inver- tible. (/ es la aplicación identidad definida sobre V.) 10. (a) Sea L : V -» V una aplicación lineal tal que L2 + 2L + 1 = O. Demostrar que L es invertí ble. (b) Sea L : V -+ V una aplicación lineal tal que L3 = O. Demostrar que I — L es in- vertible.
108 ALGEBRA LINEAR 11. Sea V un espacio vectorial. Sea P : V -» V una aplicación lineal tal que P »P = p Sea U la imagen de P y sea IV el núcleo de P. Demostrar que V es la suma directa de U y 1 Sugerencia: para demostrar que V es la suma, escribir un elemento de V en la forma v = v - Pv + Pe.] 12. Sea V un espacio vectorial y sean P¡, P2 aplicaciones lineales de V en si mismo. Su- póngase que se satisfacen las siguientes condiciones: (a) P, + P2 = I (aplicación identidad), (b) P, o P2 = 0 y P2 » Pt = O, (c) P, o P, = P, y P2 « P2 = P2. Demostrar que V es igual a la suma directa de las imágenes de P> y P2 respectivamente 13. Manteniendo la notación como en el ejercicio 12, demostrar que la imagen de P1 es igual al núcleo de P2. [Probar los dos enunciados: La imagen de P¡ está contenida en el núcleo de P2 ; el núcleo de P2 está contenido en la imagen de Pi ] 14. Sean F:V->W y G:W->U isomorfismos de espacios vectoriales sobre K. De- mostrar que tí o F es invertible y que (G»F)‘* = F' °G“*. 15. Sean F :V -» W y G :W -♦ U isomorfismos de espacios vectoriales sobre K. De- mostrar que G ° F :V -» U es un isomorfismo. 16. Sean V y W espacios vectoriales sobre K. de dimensión finita igual a n. Demostrar que V y W son isomorfos. 17. Sea A una aplicación lineal de un espacio vectorial en sí mismo y supóngase que A2 - A + / =0 (donde I es la aplicación identidad). Demostrar que A ~1 existe y que es igual a I — A. Ge- neralícese este resultado. (Refiérase al ejercicio 37 del capitulo III, §3.) 18. Sean A y B aplicaciones lineales de un espacio vectorial en si mismo. Supóngase que AB = BA. Demostrar que (A + B)2 = A2 + 2AB + B2 y que (A + B)(A — B) = A2 — B2. 19. Sean A y B aplicaciones lineales de un espacio vectorial en sí mismo. Si el núcleo de A es {0} y si el núcleo de B es {O}, demostrar que el núcleo de AB también es {0}. 20. En forma más general, sean A :V W y B :W -» U aplicaciones lineales. Supón- gase que el núcleo de A es {0} y que el núcleo de B es {O}. Demostrar que el núcleo de BA es {O}. 21. Manténgase la notación como en el ejercicio 20. Supóngase que A es suprayectiva y que B es suprayectiva. Demostrar que BA es suprayectiva.
APLICACIONES LINEALES 109 §5. Aplicaciones geométricas Sea V un espacio vectorial y sean v y u elementos de V. Se define el segmento Je recta comprendido entre v y v + u como el conjunto de todos los puntos v + tu, 0 g t g 1. • ? gn la siguiente figura se ilustra este segmento de recta. Figura 2 Por ejemplo, si t = |, entonces v + | u es el punto medio que sé localiza entre » y v + u. Análogamente, si t = 4, entonces v + | u es el punto que se encuentra situado a la tercera parte del segmento comprendido entre v y v + u (figura 3). Si v y w son elementos de V, tómese u = w — v. Entonces, el segmento de recta comprendido entre v y w es el conjunto de todos los puntos v + tu, o v + t(w — v), 0 g t ¿ 1. Figura 4
110 ALGEBRA LINEAL Nótese que se puede escribir la expresión para estos puntos, en la forma (1) (1 — t)v + tw, 0 t g 1, y haciendo s=l — t, t=l — s, también se puede escribir como su + (1 — s)w, 0 á s g 1. Finalmente, se pueden escribir los puntos de nuestro segmento de recta en la forma (2) ti» + t2w con ti,t2 iOy tj + t2 = 1. En realidad, haciendo t = t2, se ve que todo punto que se puede escribir en la forma (2) satisface (1). Recíprocamente, hagamos t, = 1 — t y t2 = l, se ve cómo todo punto de la forma (1) se puede escribir en la forma (2). Sea L: V -» V una aplicación lineal. Sea S el segmento de recta en V comprendi- do entre dos puntos v y w. Entonces, la imagen L(S) de este segmento de recta es el segmento de recta en V comprendido entre los puntos L(t>) y L(w). Este resultado es obvio debido a (2), porque L(tjV + 12W) = tiL(v) + í2L(w). Ahora generalizaremos esta discusión a figuras de mayor dimensión. Sean cy w elementos lineales independientes del espacio vectorial V. Se define el paralelogramo generado por v y w como el conjunto de todos los puntos IjV + t2w, 0 á fi = 1 para < = 1,2. Esta definición está claramente justificada puesto que tsv es un punto del segmento comprendido entre Oye (figura 5), y t2w es un punto del segmento comprendido entre O y w. Para todos los valores de t,, t2 que varían independiente- mente entre 0 y 1, se ve geométricamente que t2v + t2w describe todos los puntos del paralelogramo. V1 y' I I t I 0 Figura 5
APLICACIONES LINEALES 111 Figura 6 Al final del §1 definimos las traslaciones. Se obtiene el paralelogramo más general (figura 6) al tomar la traslación del paralelogramo que se acaba de des- cribir. Así, si u es un elemento de V, la traslación determinada por u del paralelo- gramo generado por v y w consta de todos los puntos u + t¡v + t2w, 0 g t¡ íS 1 para i = 1,2. Igual a lo que sucede con los segmentos de recta, vemos que si L: V-+ V' es una aplicación lineal, entonces la imagen bajo L de un paralelogramo es un paralelo- gramo, ya que es el conjunto de puntos L(u + ti» + t2w) = L(u) + tiL(v) + t2L{w} con 0 á t¡ g 1 para i = 1,2. Vamos ahora a describir los triángulos. Este análisis comienza con los triángulos localizados en el origen. Nuevamente sean v y w linealmente independientes. Definimos el triángulo generado por O, v y w como el conjunto de todos los puntos (3) ti» + t2w, 0 á t, y ti + t2 iS 1. Es necesario convencerse de que ésta es una definición razonable. Esto se hace mostrando que el triángulo definido anteriormente coincide con el conjunto de puntos sobre todos los segmentos de recta comprendidos entre v y todos los pun- tos del segmento comprendido entre 0 y w. Vemos en la figura 7 que esta segun- da descripción de un triángulo coincide con la sugerida por nuestra intuición geométrica. w O Figura 7
112 algebra lineal Se denota el segmento de recta comprendido entre O y w, con Ow. Luego un punto sobre Ow se puede escribir como tw con 0 S t á 1. El conjunto de puntos comprendidos entre v y tw es el conjunto de puntos (4) sv + (1 — s)tw, 1, Sean tj = sy t2 ~ (1 — s)t. Entonces, tj + Í2 = s + (1 — s)t S + (1 — $) = 1- Por tanto, todos los puntos que satisfacen (4) también satisfacen (3), Recíprocamente, supóngase que se da un punto t¡v + t2H>que satisface (3), asi que ti + Í2 á 1- Entonces t2 á 1 — h se hace s = tt, t = t2/(l - ti). Entonces t¡v + t2w = ttv + (1 - t|)fj-2^H> = sv + (1 - s)tw, lo que demuestra que todo punto que satisface (3) también satisface (4). Esto jus- tifica la anterior definición de triángulo. Al igual que con los paralelogramos, un triángulo arbitrario se obtiene mediante la traslación de un triángulo localizado en el origen. De hecho, tenemos la si- guiente descripción de un triángulo. Sean p,, v2, v3 elementos de V tales que — v3 y v2 — v3 son linealmente inde- pendientes. Sean v = Vi — v3 y w = v2 — v3. Sea S el conjunto de puntos (5) ttPi + t2v2 + t3v3, 0 g t¡para i = 1,2,3 ti + t2 + t3 — 1. Entonces, S es la traslación determinada por v3 del triángulo generado por O, v, w. 0 Figura 8
APLICACIONES LINEALES 113 Prueba. Sea P = 4- t2v2 + t3v3 un punto que satisface (5). Entonces P = tl(vt — t>3) + t2(P2 — t-’3) + tlv3 + f2y3 + hr3 = t3v + t2w + v3, y tt-£ *2 1- Por tanto, el punto P es una traslación determinada por v3 de un punto que satisface (3). Reciprocamente, dado un punto que satisface (3), que se traslada mediante v3, se hace t3 = 1 — t2 — ti y entonces se pueden invertir los pasos que acabamos de seguir para ver que t]U + t2W + V3 = ttVt + ¡2^2 + t3ü3. Esto prueba lo que se quería. Realmente, (5) es la descripción más útil de un triángulo. Porque los vértices Pi, v2, v3 ocupan una posición simétrica en esta definición. Una de las ventajas de dar una definición de triángulo como se hizo es que, entonces, es fácil ver lo que le sucede a un triángulo bajo una aplicación lineal. Sea L: V-»W una aplicación lineal y sean d y w elementos de Fqueson linealmente independientes. Supóngase que L(v) y L(w) también son linealmente independientes. Sea S el triángulo generado por O, v, w. Entonces, la imagen de S bajo L, a saber: US), es el triángulo generado por O, L(v) y L(-.v). En realidad, es el conjunto de todos los puntos L(tjV + t2w) = tiL(f) + t2L(w) con 0 h y ti + t2 á 1. Análogamente, sea S el triángulo generado por t?i, v2, »3- Entonces, la imagen de S bajo L es el triángulo generado por L(v¡), L(v2) y L(v3), porque consta del con- junto de puntos E(tiVi +' t2n2 + t3n3) = t¡L(Pi) + í2L(p2) + t3L(u3) con 0 g t¡ y t¡ + t2 + t3 = 1. Las condiciones de (5) son aquellas que permiten generalizar al útil concepto de conjunto convexo que a continuación se va a estudiar. Sea S un subconjunto de un espacio vectorial V. Se dice que S es convexo si, dados los puntos P y Q de S, el segmento de recta comprendido entre P y Q está contenido en S. En la figura 9, el conjunto que aparece ilustrado a la izquierda es convexo. El conjunto de la derecha no es convexo, ya que el segmento de recta comprendido entre P y Q no está contenido completamente en S.
114 ALGEBRA LINEAL APLICACIONES LINEALES 115 Figura 9 Figura 10 Teorema 7. Sean P¡, ..., P„ puntos de un espacio vectorial V. Sea S el conjunto de todas las combinaciones lineales hPi + • • • + t„P„ con 0 g t¡ y t¡ + • • • + t„ = 1. Entonces, S es convexo. Prueba. Sean P — i¡Pl + ' ’ + t„Pn y Q — siPi + • • + snP„ con 0 í ti, 0 2 s¡, y h + + t„ = 1, Si + • • + s„ = 1. Sea Oí t íS 1. Entonces: (1 - t)P + tQ = (1 — t)tiPi +••• + (! — t)t„P „ + ts¡P i + • • • + ts„P, = [(1 — t)ti + rsJPi +••• + [(! — t)t„ + ts„]Pn. Se tiene 0 (1 - t)t¡ + ts, para todo i, y (1 - t)t! + tS, + • + (1 - t)tn + ts„ = (1 — tXti + + t„) + t(Si + • • • + sj = (1 -1) +1 = 1. Esto prueba el teorema. A partir del teorema 7 se ve que un triángulo, como se ha definido analítica- mente, es convexo. En consecuencia, el conjunto convexo del teorema 7 es una generalización natural de un triángulo (figura 10). Se dice que el conjunto convexo del teorema 7 es el conjunto convexo generado por Pi,.. ,,P„. Aunque no es necesario el siguiente resultado, se demuestra que este conjunto convexo es el mínimo conjunto convexo que contiene todos los puntos Plt...,P„. Teorema 8. Sean Ply ..., P„ puntos de un espacio vectorial V. Cualquier conjunto convexo S' que contiene a Pt, .... P„ también contiene todas las com- binaciones lineales. tiPl + ’ + tnPn con 0 t¡, para todo i y ti + • • • + t„ = 1. Prueba. Se efectúa la prueba por inducción. Si n = 1, entonces - 1 y el enunciado es obvio. Supóngase que el teorema se ha probado para algún entero n — 1 1. Vamos a probar el teorema para n. Sean t], ..., t„ números que satis- facen las condiciones del teorema. Si t„ = 1, entonces el enunciado es trivial, ya que ti — • • • = tB_i = 0. Supóngase que t„ 1. Entonces, la combinación lineal tiPi + + t„P„ es igual a Sea Entonces s, 0 y st + • + s„_ i = 1, así que, por inducción, se concluye que el punto Q = si?, + + s„-iP„-i está en S'. Pero entonces (1 - t„)Q + t„P„ = tiPi + • • + t„P„ está en S' por definición de conjunto convexo, como se quería mostrar.
116 ALGEBRA LINEAL Ejemplo. Sea V un espacio vectorial y sea L: V -» R una aplicación lineal. Se dice que el conjunto S de todos los elementos v de átales que L(v) < 0 es convexo. Prueba. Sean L(v) < 0 y Ljw) < 0. Sea 0 < t < 1. Entonces L(tv + (1 - t)w) = tUv) + (1 - t)L(w). Luego tL(v) < 0 y (1 — t) L(w) < 0, de modo que tL(v) + (1 — t)L(w) < 0. Por tanto, tv + (1 — t)w está en S. Si t = 0 ó t = 1, entonces tv + (1 — t)w es igual a v óa w y, por consiguiente, también está en 5. Esto prueba el enunciado. Para una generalización de este ejemplo, véase el ejercicio 6. Ejercicios 1. Demostrar que la imagen bajo una aplicación lineal de un conjunto convexo es con- vexa. 2. Sean Si y S2 conjuntos convexos en V. Demostrar que la intersección S, nS2 es convexa. 3 Sea L : R" -» R una aplicación lineal. Sea S el conjunto de todos los puntos A de R" tales que L(A) § 0. Demostrar que S es convexo. 4 Sea L: R" -+ R una aplicación lineal y sea c un número. Demostrar que el conjunto S que consta de todos los puntos A de R" tales que L(/t) > c es convexo. 5. Sea A un vector no nulo en R" y sea c un número. Demostrar que el conjunto de puntos X tales que X A £ c es convexo. 6. Sea L : V -» IV una aplicación lineal. Sea S' un conjunto convexo en W. Sea S el con- junto de todos los elementos P de V tales que L(P) está en S'. Demostrar que S es convexo. 7. Demostrar que un paralelogramo es convexo. 8. Sea S un conjunto convexo en V y sea u un elemento de V. Sea Tu: V -» V la trasla- ción determinada por u. Demostrar que la imagen de TJS) es convexa. 9. Sea S un conjunto convexo en el espacio vectorial V y sea c un número. Sea cS el con- junto de todos los elementos cv con v en S. Demostrar que cS es convexo. 10. Sean v y w elementos de un espacio vectorial V linealmente independientes. Sea F : V -> W una aplicación lineal. Supóngase que F(v) y F(w) son linealmente dependientes. Demostrar que la imagen bajo F del paralelogramo generado por t> y w es un punto o bien un segmento de recta.
CAPITULO V Aplicaciones lineales y matrices §1 . La aplicación lineal asociada con una matriz Sea A = •• a». ••• una matriz m x n. Se puede asociar con A una aplicación La : K" -» K". haciendo La(X) = AX para cada vector columna X de K". Así, LA se define mediante la asociación X i-» AX, en donde el producto es el producto de matrices. Que LA es una apli- cación lineal se deduce simplemente de un caso especial del teorema 3, capitu- la III, §3, a saber, del teorema referente a las propiedades de la multiplicación de matrices. En realidad, tenemos que A(X + Y) = AX + AY y A{cX) = cAX para todos los vectores X, Y de K" y para todos los números c. Se dice que LA es la aplicación lineal asociada con la matriz A. Ejemplo. Si 1\ 5 y entonces 6 + 7 \ -3 + 35/ 13\ 32/ 117
F 1 118 ALGEBRA LINEAL Teorema 1. Si A y B son matrices m x n y si LA = LB, entonces A = B. En otras palabras, si las matrices A y B dan origen a la misma aplicación lineal, entonces son iguales. Prueba. Por definición, tenemos que A¡ X = B¡- X para todo i, si A¡ es la fila i-ésima de A y B¡ es la fila i-ésima de B. Por tanto, (A¡ — B¡) - X =0 para todo i y todo X. Por lo que A, — = O y A¡ = B¡ para todo i. De donde A = B. Se puede ofrecer una nueva interpretación de un sistema de ecuaciones linea- les homogéneas en términos de la aplicación lineal asociada con una matriz. En realidad, tal sistema se puede escribir como AX = O; por tanto, se ve que el conjunto de soluciones es el núcleo de la aplicación lineal LA. Ejercicios 1. En cada caso, encontrar el vector LA(X). /2 1\ ( 3\ (a)4 = V o)’x = (-t) (b)x = r- rn II * o~ q. §2 . La matriz asociada con una aplicación lineal Primero, considérese un caso especial. Sea L:K’-»K una aplicación lineal. Probemos que existe un vector A en K” tal que L = LA. es decir, tal que para todo X tenemos L(X) = A X. Sean Et, ...,£„ los vectores unitarios en K". Si X = XjEi + • • • + x„E„ es cual- quier vector, entonces L(X) = L(xI£I + - - • + xnEn) = XjLlEJ + ••• + x„L(E„). Si ahora se hace a, = L(£¡), se ve que L(X) = xtax + + x„a„ = X A.
APLICACIONES LINEALES Y MATRICES 119 j-sto prueba lo que se quería. Además, se obtiene una determinación explícita del vector A tal que L = LA, de modo que las componentes de A son, precisamen- te, los valores L(Ei\ ..., L(E„), donde Et{i = 1,..., n) son los vectores unita- rios de K". Generalicemos ahora este resultado al caso de una aplicación lineal arbi- traria en Km, no sólo en K. SSa L : Kn -» Km una aplicación lineal. Como es costumbre, sean E1, ..., E" los vectores columna unitarios en K", y sean e1, ..., em los vectores columna unitarios en Km. Se puede expresar cualquier vector X de K" como una combi- nación lineal X = XjE* + • • • + x„E”, donde Xj es la componente j de X. Considérense los vectores E1,..., E" como vectores columna. Por linealidad, se tiene que L(X) = XiHE1) + • • + x„L(E") . y se puede escribir cada uno de los L(E7) en términos de e1,..., e™. En otras pa- labras, existen números tales que E(E’) = aue1 + • + L(É") = alnel - + am„em o en términos de los vectores columna, (fln\ /ain\ : , ..., LfE") = : . 1 / \ / Por tanto. ElX) =xi(alíe1 + •• + «míe") + •• • + xB(alne* + •• • + am„em) = (ai iXi + • + ai.x»)?1 + • • • + (amiX! + • • • + am„x„)em. En consecuencia, si hacemos A = (a,;), entonces se ve que L(X) = AX. Desarrollada completamente, esta expresión tiene la siguiente forma i /xi\ / Uj 1 ... aI" \ I • I allxi + ' ' ' + U1„X„ «mi - - • ' \0mlXl + ’ ’ ’ + «m„X„ muuuiunuuuuuuiuuH
120 ALGEBRA LINEAL Asi, L = La es la aplicación lineal asociada con la matriz A. También designa- mos a A como la matriz asociada con la aplicación lineal L. Por el teorema 1 se sabe que esta matriz está determinada en forma única. Ejemplo 1. Sea F: R3 -» R2 la proyección, o lo que es lo mismo, la aplicación tal que F(x1,x2, x3) = (xi,x2). Entonces la matriz asociada con F es 1 0 0\ 0 1 0/ Ejemplo 2. Sea / : R" -> R" la identidad. Entonces, la matriz asociada con 1, es la matriz 10 0-0 0 1 0 •• 0 0 0 0 •• 1. que tiene componentes iguales a 1 en la diagonal e iguales a 0 fuera de ella. Ejemplo 3. Conforme al teorema 1 del capitulo IV, §2, existe una aplicación lineal única L :R4 -» R2 tal que L(£2) = rj, £(£2) = ( Jj, L(£3) = í L(E4) De acuerdo con las relaciones (♦), se ve que la matriz asociada con L es la matriz 2 3 — 5 1\ ! -1 4 7/ Ejemplo 4 (Rotaciones). Se puede definir una rotación en términos de ma- trices. Realmente, se dice que una aplicación lineal L: R2 -► R2 es una rotación si su matriz asociada se puede escribir en la forma eos 0 sen 0 - sen 0 eos 0 La justificación geométrica para esta definición proviene de la figura 1.
1 APLICACIONES LINEALES Y MATRICES 121 Se ve que L(Et) = (cos0)£] + (sen0)E2, L(E2) = ( — sen 0)Et + (eos 0)E2. Así, nuestra definición corresponde precisamente a la figura. Cuando la matriz de la rotación es como la anterior, se dice que la rotación es de ángulo igual a 0. Por ejemplo, la matriz asociada con una rotación de ángulo igual a rt/2 es /O ~1Y V °/ Finalmente, nótese que las operaciones con matrices corresponden a las ope- raciones con las aplicaciones lineales asociadas. Por ejemplo, si A y B son ma- trices m x n, entonces ¿a + b — Ejt + Lb y si c es un número, entonces LcA — cLa- Esto es obvio, ya que (A + B)X = AX + BX y (cA)X = c(AX). Análogamente para las composiciones de aplicaciones. Ciertamente, sean F : K" -> Km y G : Km - Ks aplicaciones lineales y sean A y B las matrices asociadas con Fy G respectivamen- te. Entonces, para cualquier vector X en K" tenemos (G o FX%) = G(F(X)) = B(AX) = (BA)X. Por tanto, el producto BA es la matriz asociada con la aplicación lineal compues- ta G o F.
122 ALGEBRA LINEAL __Ejercicios - 1. Determinar la matriz asociada con cada una de las siguientes aplicaciones lineales. (Aunque los vectores aparecen escritos horizontalmente por razones tipográficas, considé- rense como vectores columna.) (a) F : R4 -» R2 dada por F(xt, x2, x3,x4) = (x¡, x2) (la proyección) (b) La proyección de R4 a R3 (c) F . R2 -> R2 dada por F(x, y) = (3x, 3y) (d) F : R” - R" dada por F(X) = IX (e) F : R” - R" dada por F(X) = -X (f) F : R4 -> R4 dada por F(x¡, x2, x3, x4) = (xt, x2,0,0) 2. Encontrar la matriz asociada con la rotación para cada uno de los siguientes valores de 0. (a) rt/2 (b) n/4 (c) n (d) -n (e) -n/3 (i) zt/6 (g) 5n/4 3. En general, sea 0 > 0. ¿Cuál es la matriz asociada con la rotación determinada por un ángulo igual a — 0 (esto es, una rotación determinada por 0)? 4. Sea X = (1,2) un punto del plano. Sea F la rotación de ángulo igual a n/4. ¿Cuáles son las coordenadas de F(X) relativas a la base usual {Ei,E2}7 5. La pregunta es la misma que en 4, pero ahora cuando X = (—1,3), y F es la rota- ción de n/2. 6. Sea F: R” -> R" una aplicación lineal invertible. Demostrar que si A es la matriz aso- aada^con F, entonces A~‘ es la matriz asociada con la inversa de F. 7. Sea F una rotación de ángulo igual a 0. Demostrar que para cualquier vector X en R2 se tiene ||X|| = ||F(X)|| (es decir, F conserva las normas). 8. Sea c un número y sea L: R" -» R" la aplicación lineal tal que L(X) = cX. ¿Cuál es la matriz asociada con esta aplicación lineal? 9. Sea F8 la rotación de ángulo igual a 0. Si 0. <p son números, calcular la matriz de la apli- cación lineal F8 Fr y demostrar que es la matriz de F8+v. 10. Sea F8 una rotación de ángulo igual a 0. Demostrar que F8 es invertible y determi- nar la matriz asociada con F¿*. §3. Bases, matrices y aplicaciones lineales En las primeras dos secciones se consideró la relación entre las matrices y ¡as aplicaciones lineales de Kn en K”. Ahora, sean V y W espacios vectoriales sobre K de dimensión finita. Sean % = {r17 ..., t>„} y á?' = {wh ..., wm) bases de V y de W, respectivamente. Por consiguiente, se sabe que los elementos de V y de W tienen vectores de coordenadas con respecto a estas bases. En otras
APLICACIONES LINEALES Y MATRICES 123 palabras, si ve K se puede expresar v en forma unívoca como una combinación lineal V = Xjth + • • • + x„v„, x¡ e K. Entonces V es isomorfo a K" bajo la aplicación K" -> V determinada por "9 (xx, ...,x^)\^ xxVi + + xnvK. Análogamente para W. Si F : V -» W es una aplicación lineal, entonces, usando el isomoríismo anterior podemos interpretar F como una aplicación lineal de K" en Km, y asociar así una matriz con F que depende de la elección de bases; se denota tal matriz con M%(F). Esta matriz es la matriz única A que tiene la siguiente propiecjád: Si X es el vector (columna) de coordenadas de un elementé v de V, relativo a la base £, entonces AX es el vector (columna) de coordenadas de F(v), rela- tivo a la base Sí'. Si A = M*(F), y si X es el vector de coordenadas de v con respecto a B. entonces, por definición, F(v) = (Ai X)wt + + (Am- X)wm. Esta matriz A está determinada por el efecto de F sobre los elementos de la base, de Ja manera siguiente. Sea F(t>i) = anwi + ••• + («) F(v„) = ü,,»! + • • + am„w„. Entonces, A resulta ser la transpuesta de la matriz / «11 «21 • • - «ml\ «12 «22 - • • «m2 I ^2n • • • @mn j Ciertamente, ce tiene F(p) = F(xiVi + + x„r„) = XiF(vi) + + x„F(v„). Usando la expresión (*) para F(vj),..., F(v„), se tiene que F(v) = iWj + • • • + umlwm) + • • • + x„(alnwi + • • • + amnwm),
1 124 ALGEBRA LINEAL y después de agrupar los coeficientes de w,, ..., ivm. se obtiene de nuevo esta ex- presión en la forma («nXi + • • • + a.^wi + + (amlxt + • • • + amnx„)wm = (/li • X)w. + + (4m • X)wn. Esto prueba lo que se quena demostrar. Ejemplo 1. Sea F una aplicación lineal tal que F(t>i) = 3wj — w2 + 17w3, F(f2) = wq + w2 — w3, suponiendo que dim V = 2 y que dim W = 3. Entonces, la matriz asociada con F es la matriz / 3 1\ -1 1 \17 ~1/ que es igual a la transpuesta de /3 -1 17\ V 1 -1J Ejemplo 2. Sea id: V -» V la aplicación identidad. Por tanto, para cualquier base Si de V se tiene Afííid) = 1, donde I es la matriz unitaria n x n (si dim V — n). Esto se verifica de inmediato. Advertencia. Supóngase que V = W, pero que se trabaja con dos bases Si y Si de V distintas entre sí. Entonces, la matriz asociada con la aplicación identidad de V en sí misma, relativa a estas dos bases distintas entre sí, ¡no es la matriz unitaria! Ejemplo 3. Rotaciones. Estudiemos dos situaciones. Primera: se escogen dos sistemas de coordenadas diferentes, los cuales difieren entre sí por una rotación. Luego la aplicación identidad tiene una matriz asociada que no es la matriz uni- taria. Segunda: analizar la matriz asociada con una rotación, con relación a una base fija. Caso 1. Como de 'costumbre, comencemos con el sistema de coordenadas en el plano. Sean E¡ = (1,0) y E2 (0,1) vectores unitarios. Se considera otro sistema de coordenadas obtenido mediante la rotación de un ángulo igual a 6, en senti- do levógiro, del sistema de coordenadas dado. Entonces, los vectores unitarios se transforman en dos nuevos vectores unitarios Ej y E2 (figura 2).
APLICACIONES LINEALES Y MATRICES 125 Observando la figura, se ve que E\ = (eos 0)Ei + (sen 0)E2 E2 = ( —sen0)Et + + (cos0)E2. Si se multiplica la primera ecuación por eos 0, y ía’segunda por — sen 0, y se suman, entonces se obtiene: Ei = (eos 0)E'i — (sen 0)E2. Análogamente, E2 = (sen 0)E'i + (eos 0)E2. Sea id : R2 —> R2 la aplicación identidad. Sean St = {Et, E2} y á?' = {Eí, E2J. Entonces, id(Ei) = Ei = (cos0)E'i + (-sen 0)E'2, id(E2) = E2= (sen 0)E't + (eos 0)E2. Por consiguiente, la matriz asociada con la aplicación identidad relativa a las bases Si y SF es eos 0 — sen 0 sen0' eos 0 Caso 2. Se sigue considerando el sistema estándar de coordenadas, con base Si = {Ei, E2}. Sea F: R2 -»R2 la aplicación obtenida al rotar un ángulo igual a 0 al plano (en sentido levógiro). Se puede escribir F = F0. Entonces, F(Ei) = E'i = (cos0)Ei + (sen 0)E2, F(E2) = E'2 = (-sen 0)Ei + (eos 0)E2. Por tantos la matriz asociada con F relativa a las bases es la transpuesta de la matriz que aparece en el caso 1, a saber: Zcos0 -sen0\ M-|F')’(sa.9 cose) No se está eludiendo el hecho de que la matriz que aparece en el caso 1 re- sulte ser la transpuesta de la matriz que aparece en el caso 2. Por tanto, siempre es necesario tener cuidado en la elección de las bases para calcular la matriz aso- ciada con una aplicación lineal.
r --------------------- 126 ALGEBRA LINEAL Ejemplo 4. Sean Si = {oí,..., t>„} y Si' = {w15 ..., w„} bases del mismo es- pacio vectorial V. Existe una matriz A = (aj tal que wj = ajjPj + ••• + + • • + <W>„. Entonces, para cada i — 1, ..., n se ve que w¡ = id(w¡). Por tanto, por definición, M*'(id) = 'A. Por otra parte, existe una aplicación lineal única F : V -> V tal que F(t>i) = Wi, ..., F(v„) = w„. Nuevamente por definición, se tiene M“(Fj = 'A. Teorema 2. Sean V, W espacios vectoriales. Sea Si una base de V y sea Sí una base de W. Sean f, g dos aplicaciones lineales de V en W. Entonces, M(f + g) = M(f} + M(g). Si c es un número, entonces M(cf) = c.M(f). (La matriz asociada se considera con respecto a las bases dadas Si y Si'.} Se recomienda que el lector efectúe la prueba como un ejercicio. El teorema 2 quiere decir que la asociación es un isomorfismo entre el espacio dé las aplicaciones lineales (V, W) y el espa- cio de las matrices m x n (si dim V = n y dim W = m). Sean U, V, W conjuntos. Sea F: U —> V una aplicación y sea G : V—> W una aplicación. Entonces, se puede formar una aplicación compuesta de U en W como previamente se discutió, a saber. G o F. Teorema 3. Sean V, W, U espacios vectoriales. Sean Si, Si', Si" bases para V, W, U respectivamente. Sean F : V W y G:W->U
APLICACIONES LINEALES Y MATRICES 127 aplicaciones lineales. Entonces, (Nota. Respecto a la selección de bases, el teorema expresa el hecho de que la composición de aplicaciones corresponde a la multiplicación de matrices.) " Prueba. Sea A la matriz asociada con F relativa a las bases Si, Si' y sea B la matriz asociada con G relativa a las bases Si', Si”. Sea v un elemento de V y sea X su vector (columna) de coordenadas relativo a Si. Entonces, el vector de coor- denadas de F(t>) relativo a Si' es AX. Por definición, el vector de coordenadas de G(F(t>)) relativo a Si' es B(AX), el cual per el §2, es igual a (BA)X. Pero G(F(v)) = (G ° FX0- Por tanto, el vector de coordenadas de (G ° F)(v) relativo a la base Si” es (BA)X. Por definición, esto significa que BA es la matriz asociada con G o F y prueba el teorema. Observación. En muchas aplicaciones se trabaja con aplicaciones lineales de un espacio vectorial V en sí mismo. Si se selecciona una base Si de V y si F : V -> V es una aplicación lineal, entonces la matriz Aí2(F) se conoce, generalmente, cómo la matriz asociada con F relativa a Si (en vez de decir que es relativa a Si, Si'). A partir de la definición, se ve que M*(id) = I, donde 1 es la matriz unitaria. Como una consecuencia directa del teorema 5 ob- tenemos el siguiente Corolario. Sea V un espacio vectorial y sean Si, Si' bases de V. Entonces, M¿(id)M* (id) = 1 = M f(id)MÍ(id). En particular, (id) es invertible. Prueba. En el teorema 3 considérese que V = W = U y que F = G = id. En- tonces se infiere el enunciado. La fórmula general del teorema 5 permite describir con precisión cómo cambia la matriz asociada con una aplicación lineal cuando se cambian las bases. Teorema 4. Sea F :V -» V una aplicación lineal y sean Si, Si' bases de V. Entonces, existe una matriz invertible N, tal que M*(F) = N~'M*(F)N.
¡HHH¡HIH1111*4l lili11111111 *- 128 ALGEBRA LINEAL De hecho, se puede considerar N = M¡¡ (id). Prueba. Aplicando el teorema 3 paso a paso, encontramos que M*'(F) = Ml(íd)M^(F)Ml(íd). El corolario del teorema 3 implica que está probada la aseveración. Sea V un espacio vectorial de dimensión finita sobre K y sea F : V -> V una aplicación lineal. Se dice que una base Si de V diagonaliza F si la matriz asocia- da con F relativa a Si es una matriz diagonal. Si existe tal base que diagonaliza F, entonces se dice que F es diagonalizable. No siempre es cierto que una matriz se pueda diagonalizar. Posteriormente se hallarán en este libro condiciones su- ficientes bajo las cuales se puede diagonalizar una matriz. Si A es una matriz n x n en K, se dice que A se puede diagonalizar (en K) si la aplicación lineal definida sobre Kn representada por A se puede diagonalizar. Del teorema 4, se concluye de inmediato: Teorema 5. Sea V un espacio vectorial de dimensión finita sobre K; sea F : V-» V una aplicación lineal y sea M su matriz asociada relativa a una base Si. Entonces, F (ó M) se puede diagonalizar (en K) si y sólo si existe una matriz invertible N en K, tal que N~iMN es una matriz diagonal. En vista de la importancia que tiene la aplicación M N~ *MN, se le da un nombre especial. Dos matrices M,M' se llaman semejantes (en un campo K) si existe una matriz invertible N en K, tal que M' = N'‘MN. Enunciamos una fórmula más que describe los cambios de coordenadas. Teorema 6. Sean V, W espacios vectoriales sobre K y sea F :V->W una aplicación lineal. Sea Si una base de V y sea Si' una base de W. Si v e V, denótese con (v) el vector columna de coordenadas de v con respecto a la base Si. Entonces, M*-(F(v)) = M¡.(F)Mt(v). Prueba. Esta no es más que una reformulación de la definición de la matriz asociada con una aplicación lineal. Corolario. Sea V un espac-o vectorial y sean Si, Si' bases de V. Sea veV. Entonces, Ma(v) = M*(id)Mít(v). El corolario expresa de manera sucinta cómo cambian las coordenadas de un vector cuando se cambia la base del espacio vectorial. Las coordenadas de un vector con respecto a una base dada se pueden en-
APLICACIONES LINEALES Y MATRICES 129 contrar resolviendo de manera intuitiva un sistema de ecuaciones lineales, como se vio en el capitulo II, §2. La matriz se puede hallar exactamente de la misma manera. £ t * r Ejercicios 1. Para cada número real 0, sea Fe: R2 -* R2 la aplicación lineal representada por la matriz (cos0 —sen0\ sen 0 eos 0) Demostrar que si 0, ff son números reales, entonces F¡Fr = !’’»+•'• (Debe emplearse la fórmula de la adición para el seno y el coseno.) Demostrar también que Fj1 — F-t. 2. En cada uno de los siguientes casos, hallar MÍ. (id). El espacio vectorial en cada caso es R3. (a) «={(1,1,0), (-1,1,1), (0,1,2)} sr = {(2, i,i),(o,o,i),(-i,i,i)} (b) « = {(3,2, l),(0, — 2,5), (1,1,2)} «'= {(1,1,0), (-1,2,4), (2,-1,1)} 3. Sea St = {Ej, E2} la base usual de R2 y sea «' la base obtenida después de rotar el sis- tema de coordenadas un ángulo igual a 0. Encontrar la matriz asociada con la identidad re- lativa a «, «' para cada uno de los siguientes valores de 0. (a) n/2 (b) n/4 (c) tz (d) — it (e) — n/3 (1) n/6 (g) 5tr/4 4. En general, sea 0 > 0. ¿Cuál es la matriz asociada con la aplicación identidad y con la rotación de las bases en un ángulo igual a — 0 (es decir, una rotación de ángulo igual a 0 en sentido dextrógiro)? 5. Sea X = (1,2) ur punto del plano. Sea F la rotación de ángulo de rt/4. ¿Cuáles son las coordenadas de F(X) relativas a la base usual {£i,£2}? 6. Esta pregunta es igual a la anterior, pero ahora X = ( -1,3) y F es la rotación de án- gulo de n/2. 7. En general, sea F la rotación de ángulo igual a 0. Sea (x, y) un punto del plano en el sistema de referencia de coordenadas. Sean (x', y') las coordenadas de este punto en el siste- ma rotado. Expresar x', y' en términos de x, y y 0. 8. En cada uno de los siguientes casos, sea £> = d/dt la derivada. Damos un conjunto « de funciones linealmente independientes. Estas generan un espacio vectorial V, y D es una aplicación lineal de V en sí mismo. Encontrar la matriz asociada con D relativa a las bases «, «. (a) {e'.e2'} (b) {l,t} (c) {e’.te1} (d) {l,t, t2} (e) {1, t, e\ e2', te2'} (f) {sen t, eos t}
1 130 ALGEBRA LINEAL 9. (a) Sea N una matriz cuadrada. Se dice que N es nilpotente si existe un entero positivo r, tal que Nr = 0. Probar que si N es nilpotente. entonces / — IV es invertible, (b) Establecer y probar un enunciado análogo para aplicaciones lineales de un espacio vectorial en si mi^o. TlOJfea P„ un espacio vectorial de polinomios de grado g n. Entonces la derivada D': es una aplicación lineal de P„ en si mismo. Sea 1 la aplicación identidad. Probar que las siguientes aplicaciones lineales son invertibies: (a) / — D2. (b) Dm — 1 para cualquier entero positivo m. (c) Dm — el para cualquier número c / 0.
CAPITULO VI - > Productos escalares y ortogonalidad §1. Productos escalares Sea V un espacio vectorial sobre un campo K. Un producto escalar sobre V es una asociación tal que a cada pareja de elementos v y tv de V le asocia un escalar; se denota con <v, w>, o también con v • w, y satisface las siguientes propiedades: PE 1. Se tiene que (v, w) — (w, u) para todo v, w e V PE 2. Si u, v, w son elementos de V, entonces <u, v + w> = <u, e> + <u,w>. PE 3. Si x e K, entonces (xu, = x<«, y <u, xv> = x<u, ü>. Se dice que el producto escalar es no degenerado, si además satisface la condi- ción: Si v es un elemento de Vy si (v, w) =\) para todo w e V, entonces v = 0. Ejemplo 1. Sea V = K". Luego, la aplicación (X, 7) - X Y, que asocia a los elementos X, Y e K* su producto escalar en el sentido definido anteriormente, es un producto escalar en el sentido de esta última definición. Ejemplo 2. Sea Vel espacio de las funciones continuas evaluadas en los reales y definidas sobre el intervalo [0, 1]. Si g e V, entonces se define <f,g> = Jo Se puede ver que es un producto escalar aplicando las propiedades simples de la integral. En ambos ejemplos el producto escalar resulta ser no degenerado. Previamente habíamos señalado tal propiedad para el producto escalar de los vectores en K". En el segundo ejemplo, también se verifica fácilmente el resultado a partir de pro- piedades simples de la integral. 131
132 ALGEBRA LINEAL En cálculo se estudia el segundo ejemplo, que da origen a la teoría de las seríes de Fourier. Por ahora nos concretamos a discutir solamente las propiedades gene- rales de los productos escalares y sus aplicaciones a espacios euclidianos. Se emplea la notación <, > porque al trabajar con los espacios vectoriales de funciones se puede confundir el punto de f- g con el producto ordinario de funciones. Sea Pun espacio vectorial con un producto escalar. Como siempre, se dice que los elementos t> y w de Kson ortogonales o perpendiculares entre sí, y se escribe v 1 iv, si <t’, w> = 0. Si S es un subconjunto de V, denotamos con S1 el conjunto de todos los elementos weV perpendiculares a todos los elementos de S, es decir, <w, = 0 para todo veS. Entonces, empleando PE 2 y PE 3, se puede verificar de inmediato que S1 es un subespacio de L denominado espacio ortogonal de S. Si w es perpendicular a S, también se escribe w 1 S. Sea U el subespacio de V generado por los elementos de S. Si w es perpendicular a S y si Vj, v2 e S, entonces <W, O] + V2> = <W. !>,} + <W, 1>2> = 0. Si c es un escalar, entonces <w, cvxy — c<w, t?!>. Por tanto, w es perpendicular a las combinaciones lineales de elementos de S y, por consiguiente, w es perpendicular a U. Ejemplo 3. Sea (a0) una matriz m x n en K y sean At, ..., A„ sus vectores fila. Sea X = (xt, ..., xn) como siempre. El sistema de ecuaciones lineales homogéneas auXi + + ai„x„ = 0 (**) "i" + amnXn — 0 también se puede representar en una forma abreviada, a saber: A¡ X = 0, ...,A„X = 0. El conjunto de soluciones X de este sistema homogéneo es un espacio vectorial sobre K. En efecto, sea Wel espacio generado por Ai, .. .,Am. Sea U el espacio que consta de todos los vectores de Kn perpendiculares a Ait ..., Am. Entonces U es, precisamente, el espacio vectorial de las soluciones de (**). Los vectores A¡, .. ,,A„ pueden no ser linealmente independientes. Nótese que dim W ií m y se designa dim U — dim IV1 como la dimensión del espacio de soluciones del sistema de ecuaciones lineales. Pos- teriormente se analizará esta dimensión con mayor profundidad. Nuevamente, sea despacio vectorial sobre el campo K. con un producto escalar.
PRODUCTOS ESCALARES Y ORTOGONAL1DAD 133 Sea {Vi, ..., v„} una base de V. Se dice que es una base ortogonal si <y„ v¡) = 0 para todo i # j. Posteriormente se demostrará que si V es un espacio vectorial de dimensión finita, con un producto escalar, entonces siempre existe una base ortogonal. Sin embargo, discutiremos primero algunos importantes casos especia- les sobre los números reales y sobre los números complejos. El caso real definido positivamente Sea Vun espacio vectorial sobre R, con un producto escalar. Se dice que este producto escalar es definido positivamente si <v, v> 0 para todo v e V, y (y, v) > 0 si v / 0. El producto escalar ordinario de vectores de R" es definido positivamente, y también lo es el producto escalar del ejemplo 2 que se acaba de discutir. Sea V un espacio vectorial sobre R, con un producto escalar definido positi- vamente, denotado por <, >. Sea IFun subespacio. Entonces, Wtiene un producto escalar definido mediante la misma regla que define el producto escalar en V. En otras palabras, si w, w' son elementos de W, se puede formar su producto <w, w'>. Es obvio que este producto escalar sobre Wes definido positivamente. Por ejemplo, si W es el subespacio de RJ generado por los dos vectores (1,1,2) y (ti, —1,0) entonces, W es un espacio vectorial por derecho propio y se puede considerar el producto escalar definido positivamente sobre W. A menudo hay que trabajar con tales subespacios y ésta es una razón para desarrollar la teoría sobre espacios arbitrarios (de dimensión finita) sobre R con un producto escalar determinado definido positivamente, en vez de trabajar solamente sobre R" con el producto escalar. Otra razón es el deseo de que esta teoría se aplique a situaciones como la descrita en el ejemplo 2 del §1. Como se hizo en el capítulo L, definimos la longitud, o norma de un ele- mento v e V por INI = V <y, »> Sices cualquier número, entonces se obtiene de inmediato IHI = klllvll, debido a que ||cv|| = X/<CV, CV> = x/c2<«',t’> = |c( ||v||. Así entonces, vemos que aquí se aplica el mismo tipo de argumentos que en el capitulo I. De hecho, cualquier argumento dado en el capítulo I, que no use coorde- nadas se ajusta a la situación más general. Habrá oportunidad de ver más ejemplos a medida que avance el estudio, Como se hizo antes, decimos que un elemento ve V es un vector unitario si ||v|| = 1. Si v e V y v 0, entonces »/||v|] es un vector unitario. Las dos identidades siguientes se infieren directamente de la definición de lon- gitud.
134 ALGEBRA LINEAL El teorema de Pitágoras. Si v, w son perpendiculares entre sí, entonces llv + w||2 = IMI2 + IM2. La ley del paralelogramo. Para cualesquiera v, w, se tiene II» + w|p + ||v _ < = 2|M|2 + 2|M2- Las pruebas son triviales. Haremos la primera y dejaremos la segunda como ejer- cicio. Con respecto a la primera prueba, tenemos que ||f + w||2 = + w, v + w> = <v, + 2<d, w> + <w, w> = IHI2 + IHI2- Sea w un elemento de V tal que ||w|| # 0. Para cualquier v existe un único número c tal que v - oves perpendicular a w. Ciertamente, para que v — cw sea ¡«rperidicular a w hay que tener <t> — cw, w) = 0; por tanto, <v, w> — (cw, w> = 0 y (t>, w) = c (w, w>. Así, <Mv> <w, w>’ Recíprocamente, al alcanzar c este valor se ve que v — cw es perpendicular a w. Se dice que c es la componente de v a lo largo de w, o bien que es el coeficiente de Fourier de v con respecto a w. Se dice que cw es la proyección de v a lo largo de w. En particular, si w es un vector unitario, entonces la componente de v a lo largo de w es simplemente c - (v, w>. Ejemplo 4. Sea V = R" con el producto escalar usual, si £¡ es el í-ésimo vector unitario y si X = (xj, ..., x„) entonces, la componente de X a lo largo de E¡ es simplemente X • £, = x„ es decir, la componente i de X. Ejemplo 5. Sea Peí espacio de las funciones continuas definidas sobre [— n, n]. Sea /la función dada por/x) = sen kx, donde k es un entero > 0. Entonces / f” \l/2 11/11 = J<A/> = sen2kx dx
PRODUCTOS ESCALARES Y ORTOGONALIDAD 135 S¡ g es cualquier función continua definida sobre [— x, n], entonces el coeficiente je Fourier de g con respecto a/es ^Wsenkxdx mismo que en el caso del espacio de n dimensiones, se define la proyección de v a lo largo de w como el vector cw, según la figura ordinaria: Figura 1 Ahora se pueden emplear, exactamente, los mismos argumentos que se dieron en el capitulo I para obtener la desigualdad de Schwarz,a saber: Teorema 1. Para cualquiera v, w, e V se tiene |<P,w>|álH|||w||. Prueba. Si w = 0, entonces los dos miembros de la desigualdad son iguales a 0 y es obvia la afirmación. Supóngase ahora que w = e es un vector unitario, esto es, e e Vy ||e|| = 1. Si c es la componente de v a lo largo de e, entonces v — ce es perpendicular a e y también a ce. Por tanto,, según el teorema de Pitágoras, IHI2 = ||» - ce|P + ||ce|P = ||v - ce¡¡2 + c2. De donde c2 ||v||2, por lo que |c| ||u||. Finalmente, si w es arbitrario y /O. entonces e = w/||w|| es un vector unitario, así que, por lo que se acaba de ver. Esto da por resultado |<t>,w>| ¿ |H| ||w||, tal como se deseaba.
136 ALGEBRA LINEAL Teorema 2. Si v, w e V entonces II» + w|| ¿ |M| + |H|. Prueba. Es exactamente la misma que la del teorema análogo que aparece en el capitulo I. §4. Sean , ..., v„ elementos no nulos de V mutuamente perpendiculares, es decir Vj) -- 0 si i j. Sea c¡ la componente de v a lo largo de t>f. Entonces, V - CjV! - ••• - c„v„ es perpendicular at>b ..v„. Para comprobar esto, todo lo que hay que hacer es tomar el producto con Vj para cualquier j. Todos los términos que envuelven a <t>¡, serán iguales a 0 si i # j y quedarán dos términos restantes <», - Cj<_Vj, vj) que se cancelan. Así, al sustraer combinaciones lineales como se acaba de hacer, se ortogonaliza a rcon respecto a t>i, . El teorema siguiente muestra que c¡vt + • • + c„v„ da la mejoi aproximación a v como una combinación de i], ..., v„. Teorema 3. Sean vt,..., v„ vectores mutuamente perpendiculares, y tales que |M + 0 para todo i. Sea v un elemento de V, y sea c, la componente de v a lo largo dé v¡. Sean at, ..., a„ números. Entonces, " II II n I v - E c*»* á I» - E akVk II II *=*1 Prueba. Se sabe que v - E q»* *=i es perpendicular a cada uno de los u¡, í = 1, ..n. Por tanto, es perpendicular a cualquier combinación lineal de vlt ..., v„. Ahora: II» - E Uk»*l|2 = II» ~ Eq»* + E (»* - 2 = II» - Ec*»»ll2 + II E(c* - «fc)ffc||2
PRODUCTOS ESCALARES Y ORTOGONALIDAD 137 el teorema de Pitágoras. Esto prueba que II» - E ckuk||2 ¿ ||» - 22<akck||2, y por tanto el teorema ha sido probado. siguiente teorema se conoce como la desigualdad de Bessel. Teorema 4. Si son vectores unitarios mutuamente perpendiculares y si ct es el coeficiente de Fourier de v con respecto a v¡, entonces í <1 á IHP. 1= 1 Prueba. Tenemos o á (d - Z c¡v¡, »— E c¡ví) = <», »> - E 2c¡<», i’i> + E c2i = <»,»>-Ed De donde se infiere la desigualdad. Ejercicios 1. Sea V un espacio vectorial con un producto escalar. Demostrar que <0,») — 0 para todo v en V. 2. Supóngase que el producto escalar es definido positivamente. Si »i,..., v„ son ele- mentos no nulos mutuamente perpendiculares, demostrar entonces que son linealmente in- dependientes. 3. Sea M una matriz cuadrada n x n e igual a su transpuesta. Si X, Y son vectores co- lumna de tamaño n, entonces 'XMY es una matriz 1 x 1 que se identifica con un número. Demostrar que la aplicación (X,Y)->'XMY satisface las tres propiedades PE 1, PE 2 y PE 3. Muéstrese un ejemplo de una matriz M2 x 2 tal que no se satisfaga la cuarta propiedad. §2. Bases ortogonales, caso definido positivamente Considérese durante toda esta sección que V es un espacio vectorial con un producto escalar definido positivamente. Se dice que una base {»], de Kes ortogonal si sus elementos son mutuamente perpendiculares, esto es, si <»¡, »,•> = 0
138 ALGEBRA LINEAL siempre que i -/ j. Si además cada uno de los elementos de la base tiene longitud igual a I, entonces la base se conoce como ortonormal. Los vectores unitarios estándar de R" forman una base ortonormal de R" con respecto al producto escalar ordinario. Teorv.tna Sea V un espacio vectorial de dimensión finita con un producto escalar definido positivamente. Sea W un subespacio de V y sea {nq, . . . una base ortogonal de W. Si W V, entonces existen elementos wm+¡, w„ de Vtales que {wj, ..w„} es una base ortogonal de V. Prueba. I:,l método utilizado para la prueba de este teorema es tan importante como el propio teorema y se conoce como el proceso de ortogonalización de Gram-Schmidt. A partir del capítulo III, §3, se sabe que podemos encontrar ele- mentos vm + i, .. vn de V tales que {wj, .. .,wm, vm + i, .. .,v„} es una base de V. Por supuesto que no se trata de una base ortogonal. Sea JVm+I1 el espacio generado por Wj,..wm, vm+ r Obtendremos primero una base ortogonal de Wml t. La idea consiste en considerar a vm+i y restarle sus proyecciones a lo largo de wq, .. .,w,„. Así entonces, sea <W1,W1> <wm, wm> Sea Wm+ i = Vm+ , - CjHq - • • • - cmwm. Por consiguiente, wm+ ] es perpendicular a w1, ..., wm. Además, wm+1 0 (ya que de otra manera wm+ , sería linealmente dependiente de W],...., >vm) y vm+1 está en el espacio generado por wq,..., wm+i debido a que um+1 = Wm+1 + ct W1 + • + c„wm. De donde {wq, ..., wm+es una base ortogonal deWm+¡. Ahora se puede proceder por inducción, demostrando que el espacio generado por wi, .. - , wm, pm+1, ..., rm+s tiene una base ortogonal {wq, . .,wm+I, ..., wm+j} con s — 1, ..,, n — m. Lo cual concluye la prueba. Corolario. Sea V un espacio vectorial de dimensión finita con un producto escalar definido positivamente. Supóngase que V {O}. Entonces, V tiene uno base ortogonal.
PRODUCTOS ESCALARES Y ORTOGONALIDAD 139 | Prueba. Por hipótesis, existe un elemento de V tal que üj O. Sea W el I subespacio generado por t>j y apliqúese el teorema a fin de obtener la base deseada. Se resume otra vez el procedimiento mediante el teorema 5. Supóngase que se nos da una base arbitraria {nls.. ,,v„] de V. Deseamos ortogonalizarla; para ello, procedemos como se indica a continuación. Sea ~ * v\ = »i, vi = V2 - <«2, VÍ> ,,, “7—7 T' "il <«1, Vi) vi = Vj - <Vj,vl>, <v3,vl>, <V1,V1) 2 <V1',Dl’>UV vi = V„ <V„, vi) , ~t~,—rr vi- <V1, Vi) Entonces {i?í,..., es una base ortogonal. Dada una base ortogonal, siempre podemos obtener una base ortonormal al dividir a cada uno de los vectores por su longitud. Ejemplo 1. Encuéntrese una base ortonormal para el espacio vectorial generado por los vectores (1, 1, 0, 1), (1,-2, 0, 0) y (1, 0, — 1, 2). Denótense estos vectores con A, B y C. Sea B' = B-?-^A. A* A En otras palabras, se sustrae de B su proyección a lo largo de A. Entonces B' es perpendicular a A. Resulta que B' = M -5,0, lí Ahora se restan de C sus proyecciones a lo largo de A y de B'; así, „ r C A C B' C = C —-—- A — ——— B. A' A B • B Como A y B' son perpendiculares entre sí, al considerar el producto escalar de C con A y con B' se demuestra que C es perpendicular tanto a A como a B'. Resulta C =4(-4, —2. — 1,6).
140 ALGEBRA LINEAL Los vectores A, B', C son no nulos y mutuamente perpendiculares. Tales vectores están en c) espacio generado por A, B, C. Por tanto, constituyen una base ortogo. nal pata ese espacio. Si deseamos una base ortonormal, entonces se dividen estos vectores por su longitud y asi se obtiene ¡FcT como una base ortonormal. Teorema 6. Sea V un espacio vectorial de dimensión n sobre R con un pro- ducto escalar definido positivamente. Sea W un subespacio de V de dimensión r. Sea W 1 el subespacio de V aue consta de todos los elementos que son perpendicu- lares a IV. Entonces V es la suma directa de W y IV1, y IV1 tiene dimensión igual a n — r. En otras palabras, dim IV 4- dim IV1 = dim V. Prueba. Si W consta sólo del O, o bien si W = V, entonces el enunciado es obvio. Por consiguiente, supóngase que tV # V y que IV / {O}. Sea {«’],..., w,} base ortonormal de W. Por el teorema 5, existen elementos ur+1, ..., u„ de V tales que {wb . . . , Wr. Ur+1, ..., u„} es una base ortonomal de V. Probaremos que {ur+1, ..., u„} es una base orto- normal de tV1. Sea u un elemento de tV1. Entonces hay números x;, ..., x„ tales que u = xpt’i + • • • 4- x,w, 4- xr+ iur+ i 4 -• • • 4- x„u„. Como u es perpendicular a IV, al considerar el producto con cualquier w,(i = 1,.. ,,r), resulta que 0 = <u, vv¡> = x/w,-, w¡> = x¡. (>e donde todo x¡ = 0 (i = 1......r). En consecuencia, u es una combinación lineal de ur+ i, . .., u„. reciprocamente, sea u = xr+1ur+, 4- • • + x„u„ una combinación lineal de ur+ Considerando el producto con cualquier w¡. resulta igual a 0. Por
PRODUCTOS ESCALARES Y ORTOGONAL1DAD 141 íaJ)to, u es perpendicular a todo w¡(i = 1,., r) y, por tanto, es perpendicular a yy. Esto prueba que ur+1, ..., u„ generan a WL. Como estos elementos son Mutuamente perpendiculares y de norma igual a 1, constituyen una base orto- normal de cuya dimensión es, en consecuencia, igual a n — r. Además, un elemento de V tiene una expresión única como combinación lineal ’ P X1W¡ +•• + XrW, + Xr+1Ur + !+••• + XnU„, y tiene, por lo tanto, una expresión única como suma de w + u con w e W y u e WL. pe donde V es la suma directa de W y FE1. __ Al espacio IV1, se le conoce como el complemento ortogonal de W. Ejemplo 2. Considérese a R3. Sean A y B dos vectores linealmente indepen- dientes en R3. Entonces, el espacio de los vectores que son perpendiculares tanto a A como a B es un espacio de dimensión igual a 1. Si {/V} es una base para este espacio, cualquier otra base para este mismo espacio es del tipo {tN} donde t es un número # 0. De nuevo, sea N un vector no nulo en R3. El espacio de los vectores perpendicu- lares a N es un espacio de dimensión igual a 2; es decir, un plano que pasa a través del origen O. Sea V un espacio vectorial sobre R de dimensión finita con un producto es- calar definido positivamente. Sea {elt..., e„) una base ortonormal. Sean v, we I. Entonces hay números xj,..., x„e R y y1;..., y„e R tales que v = x,ei + ••• + x„e„ y w = y^ + • • + y„e„. Luego <», w> = <XjCi + • • • + x„eB, yiCj + • • • + y„eB> n = Z *iyj<.e¡, ej) = *1 n + • • • + xByB. ¡J= 1 Asi, en términos de esta base ortonormal, si X, El son vectores de coordenadas de v y de w, respectivamente, el producto escalar está determinado por el producto escalar ordinario X • E de los vectores de coordenadas. Definitivamente, éste no es el caso si trabajamos con una base que no es ortonormal. Si {t>i,..., i>„} es cualquier base de V y escribimos t? = XiVi + + xnv„, w = Eifi + • + y„v„ en términos de esta base, entonces n <V, w> = E Xiyj^Vi, Vj>. i.j= i Cada <v¡, vj) es un número. Si hacemos a¡j = <v¡, entonces n <V, W> = X OijXiXj. ÍJ- 1
142 ALGEBRA LINEAL Ejercicios 1. ¿Cuál es la dimensión del subespacio de R6 que es perpendicular a los dos vectores (1,1, 2, 5,4,5) y (0,0,1,1,0,7)? 2. Hallar bases ortonormales para los subespacios de R3 generados por los siguientes vectores: (a) (1, 1, - 1) y (1,0, 1), (b) (2, 1, 1) y (1,3, -I). 3. Encontrar una base ortonormal para el subespacio de R4 generado por los vectores (1,2, 1,0) y (1,2,3, 1). 4. Encontrar una base ortonormal para el subespacio de R4 generado por (1,1,0,0), (1,-1,1, l)y( -1,0,2,1). En los siguientes ejercicios se considera el espacio vectorial de las. funciones continuas definidas sobre el intervalo [0,1]. Se define el producto escalar de dos de tales funciones/, g mediante la regla 5. Sea V el subespacio de las funciones, generado por las dos funciones /(t) = t y g(t) = t2. Encontrar una base ortonormal para V. 6. Sea V el subespacio generado por las tres funciones 1, t, t2 (donde 1 es la función cons- tante). Hallar una base ortoaormal para V. Productos hermitianos Vamos ahora a describir la modificación necesaria para adaptar los resultados precedentes a los espacios vectoriales sobre los números complejos. Se preservará la noción, hasta donde sea posible, de producto escalar definido positivamente. Puesto que el producto escalar de vectores con coordenadas complejas puede ser igual a 0 sin que los vectores sean iguales a O, hay que cambiar algo en la de- finición. Resulta que la modificación necesaria es muy pequeña. Sea V un espacio vectorial sobre los números complejos. Un producto hermi- tiaiio sobre V es una regla que a cualquier pareja de elementos v, w de V le asocia un número complejo, denotado nuevamente con <v, w> que satisface las siguientes propiedades: PH 1. Tenemas <t>, w) = (w, vj para todo v,we V. {En este caso, la barra denota el conjugado complejo.) PH 2. Si u, v, w son elementos de V. entonces <u, v + wj = <u, t> + <u, w>. PH3. Si aeC, entonces <au, t>> = a<«, t>> y <(u,av) = a(u,v). Se dice que el producto hermitiano es definido positivamente si (i?, t>> ¡2:0 para todo rt V y <v. t’> > 0 si v / O.
PRODUCTOS ESCALARES Y ORTOGONALIDAD 143 Definimos igual que antes las palabras ortogonal, perpendicular, base orto- gonal y complemento ortogonal. Se conservarán las definiciones de coeficiente de Fourier y proyección de v a lo largo de w, así como en las observaciones que se hicieron en relación con estas mismas definiciones. Ejemplo 3. Sea V = C". Si X = (x1; ..., x„) y Y = (yb ..., y„) son vectores en £"> entonces se define su producto hermitiano como = xiJi + + x„y„. Se pueden comprobar de inmediato las condiciones de PH 1 a PH 3. Este produc- to es definido positivamente, ya que si X O, entonces algún x¡ 0, y x.x,- > 0. De donde <X, T> > 0. Ejemplo 4. Sea V el espacio de las funciones continuas definidas sobre el intervalo [ — n,r] y evaluadas en los complejos. Si f, ge V, entonces </,<?>= P f(MÍ)dt. J — n Nuevamente las propiedades estándar de la integral muestran que esto es un producto hermitiano definido positivamente. Sea f„ la función tal que ___fM = ?"" y (<? vvvj.4 raj Un simple cálculo muestra queQÍ, es ortogonal a jy si n, m son enteros distintos entre sí. Además, tenemos que ------------------ = j" ei’"e~in'dt = 2n. Si f eV, entonces su coeficiente de Fourier con respecto a f, es, por consiguiente, ! igual a que el lector con conocimientos de análisis reconocerá de inmediato. Volvamos a nuestra discusión general de los productos hermitianos. Tenemos el resultado análogo al teorema 5 y su corolario para productos hermitianos definido positivamente, a saber: Teorema 7. Sea V un espacio vectorial de dimensión jinita sobre los números complejos, con un producto hermitiano definido positivamente. Sea W un subes- pacio de V y sea {wj, ..., wm} una base ortogonal de W. Si W =¡£ V, entonces existen elementos wmT1, ..., w„ de V tales que {iV], ..., w„} es una base or- togonal de V. Corolario. Sea V un espacio vectorial de dimensión finita sobre los números complejos con un producto hermitiano definido positivamente. Supóngase que V {O}. Entonces, V tiene una base ortogonal.
144 ALGEBRA LINEAL Las pruebas son exactamente las mismas que las dadas previamente para el caso real y no hay necesidad de repetirlas. Corresponde ahora analizar la teoría de la norma. Sea V el espacio vectorial sobre C con un producto hermitiano definido positivamente. Si veV, entonces definimos su norma de la siguiente manera; ¡mi = y<c v>- Como <t>, v) es real, 2: 0, su raíz cuadrada se considera, como de costumbre, como el único real § 0 cuyo cuadrado es <t>, t?>. . ------------'—-^.7 (Jox'i Tenemos la^desigualdad de Schwarz^ a saber: ¡Hi- las tres propiedades de la norma son válidas como en el caso real: Para todo ve V, tenemos que ||v|| S 0, y — 0 si y sólo si v — O. Para cualquier número complejo a, tenemos que ||av|| = |a| ||v||. Para cualesquiera elementos v,we V, tenemos que ||t> + w|| ¿ + ||w||. De nuevo se pueden verificar fácilmente todas estas propiedades. Las dos primeras se dejan como ejercicios para efectuar completamente la prueba de la tercera propiedad usando la desigualdad de Schwarz. Será suficiente probar que l|v + w||2 (||v|| + ||w||)2. Para esto, nótese que ||t> + w||2 = <T + W, V + w> = (t>, vj + <iv, vj + <l>, Pero <w, r) + <t>, w) = <v, + <i>, w) ¿ 2|<t>, w)|. Por tanto, por Schwarz, l|f + H2 á IM¡2 + 2|<v, w>| + |HI2 á IHI2 + 2||v|| IHI + ||w|I2 = (IHI + IHI)2. Tomando la raíz cuadrada a cada lado de la desigualdad se obtiene lo que se quería. Se dice que un elemento v de V es un vector unitario como en el caso real, si |MJ = 1. Una base ortogonal {t^, ..., se llama ortogonal si consta de vectores unitarios. Como antes, se obtiene una base ortonormal de una ortogonal al dividir cada vector por su longitud. Sea {eí; ..., e„} una base ortonormal de V. Sean v, we V. Sean ..., a„eC y Pi, ..., p„e C tales que v = + + a„e„
PRODUCTOS ESCALARES Y ORTOGONALIDAD 145 y w = fiiet + • + P„en. Entonces, ' <v, w> (aiej + • • + a,e„, P^ + + P„e„) = ¿ i.j= i = ctiPt + + a„p„. Por consiguiente, en términos de esta base ortonormal, si A, B son los vectores de coordenadas de v y de w respectivamente, el producto hermitiano está dado por el producto descrito en el ejemplo 3, a saber A B. A continuación se enuncian simultáneamente dos teoremas, tanto para el caso real como para el caso complejo. Las pruebas se llevan a cabo palabra por palabra, de la misma manera que en el teorema 6 y, por lo tanto, no serán repro- ducidas. Teorema 8. Sea V un espacio vectorial sobre R con un producto escalar definido positivamente, o bien sea un espacio vectorial sobre C con un producto hermitiano definido positivamente. Supóngase que V tiene dimensión finita igual a n. Sea W un subespacio de V de dimensión r. Sea W1 el subespacio de V que consta de todos los elementos de V que son perpendiculares a W. Entonces W1 tiene dimensión igual a n — r. En otras palabras, dim W + dim W1 = dim V. Teorema 9. Sea V un espacio vectorial sobre R con un producto escalar definido positivamente, o bien sea un espacio vectorial sobre C con un producto hermitiano definido positivamente. Supóngase que V es de dimensión finita. Sea W un subespacio de V. Entonces V es la suma directa de W y W1. Ejercicios 1. Encontrar una base ortonormal para los subespacios de R3 generados por los siguien- tes vectores: (a) (1.1. -1) y (1,0,1) (b) (2,1,1) y (1,3, -1) 2. Encontrar una base ortonormal para el subespacio de R4 generado por los siguien- tes vectores: (a) (1,2; 1,0) y (1.2,3,1) (b) (1. 1.0.0), (1; -1. 1, 1) y (-1.0,2, 1)
146 ALGEBRA LINEAL 3. En los siguientes ejercicios se considera el espacio vectorial de las funciones continuas definidas en el intervalo [0, 1] y evaluadas en los reales. Se define el producto escalar de dos de tales funciones f g mediante la regla <f,g> = J1 Verifiqúese que se trata de un producto escalar usando las propiedades de la integral. 4. Sea V el subespacio de las funciones generadas por las dos funciones /, g, tales que /(r) = í y g(t) = r2. Encontrar una base ortonormal para V. 5. Sea V el subespacio generado por las tres funciones 1,1, t2 (donde 1 representa a la función constante). Hallar una base ortonormal para V. 6. Encontrar una base ortonormal para el subespacio de C3 generado por los siguientes vectores: (a) (l,i,0) y (1,1,1) (b) (1, -1, -i) y (i, 1,2) ( 7. Va) Sea V el espacio vectorial de todas las matrices n x n sobre R y defínase el producto esbtriar de dos matrices A y B mediante (A, B> = trfAB), donde tr es la traza (la suma de los elementos diagonales). Demostrar que este es un produc- to escalar y que es no degenerado. (b) Si A es una matriz simétrica real, muéstrese que tr(AA) S 0 y tr(AA) > 0 si A rfc 0. Asi entonces, la traza define el producto escalar definido positivamente sobre el espacio de las matrices simétricas reales. (c) Sea V un espacio vectorial de las matrices simétricas reales de n x n. ¿Cuál es la dimensión de VI ¿Cuál es la dimensión del subespacio W que consta de las matrices A tales que tr(A) = 0? ¿Cuál es la dimensión del complemento ortogonal W2 relativo al producto escalar definido positivamente que se vio en el inciso (b)? 8. Conservando la notación del ejercicio 7, descríbase el complemento ortogonal del subespacio de las matrices diagonales. ¿Cuál es la dimensión de este complemento ortogonal? 9. Sea V un espacio de dimensión finita sobre R con un producto escalar definido po- sitivamente. Sea {v¡,..., v„} un conjunto de elementos de v de norma igual a 1 y mutua- mente perpendiculares (es decir <v¡, Vj> = 0 si i j). Supóngase que para todo ve V tenemos IHI2 = S <v, i= 1 Demostrar que jv).......vm} es una base de V. 10. Sea V un espacio de dimensión finita sobre R con un producto escalar definido po- sitivamente. Probar la ley del paralelogramo, para cualesquiera elementos v, we V, ll« + v||2 + j|u - v||2 = 2(||u||2 + ||v||2).
PRODUCTOS ESCALARES Y ORTOGONALIDAD 147 §3. Aplicación a las ecuaciones lineales El teorema 6 de la sección anterior tiene una interesante aplicación a la teoria de las ecuaciones lineales. Consideremos el siguiente sistema: (**P «iiXi + ••• + ainxn = 0 ’ «miXi + • • + a„„x„ = 0. Su espacio de soluciones se puede interpretar de tres maneras: (a) El espacio consta de aquellos vectores X que dan relaciones lineales XiA1 + + x„A" = O entre las columnas de A. (b) Las soluciones forman el espacio ortogonal a los vectores fila de la matriz A. (c) Las soluciones forman el núcleo de la aplicación lineal representada por A, es decir, son las soluciones de la ecuación AX = O. Supóngase que estas ecuaciones tienen coeficientes ai} en un campo K. Para el siguiente teorema, supondremos que si W es un subespacio de K" y W1 es el sub- espacio de K" que es ortogonal a W, entonces dim W + dim WL — n. Esto ya ha sido probado para el caso definido positivamente y en §5 se hará la prueba general. Si A = (a¡j) es una matriz m x n, entonces las columnas A1,.A" generan un subespacio cuya dimensión se conoce como el rango por columna de A. Las filas A¡,. ..,A„ de A generan un subespacio cuya dimensión se conoce como el rango por filas de A. También se puede decir que el rango por columnas de A es el número máximo de columnas linealmente independientes y que el rango por filas es el número máximo de filas de A linealmente independientes. Teorema 10. Sea A = (ay) una matriz m x n. Entonces el rango por co- lumnas y el rango por filas de A son iguales al mismo número r. Además, n — r es la dimensión del espacio de las soluciones del sistema de ecuaciones lineales (**).
rttt f t f tffttttttttf 148 ALGEBRA LINEAL Prueba. Probaremos todos nuestros enunciados en forma simultánea. Con- sidérese la aplicación L : K" -> K" determinada por L(X) = XlA‘ + •• + x„A". Obviamente, esta aplicación es lineal. Su imagen consta del espacio generado por los vectores columna de A. Su núcleo es, por definición, el espacio de las so- luciones del sistema de ecuaciones lineales. Debido ai teorema 3 del capítulo IV, §3. se obtiene rango por columnas + dimensión del espacio de soluciones = n. Por otro lado, al interpretar el espacio de soluciones como el espacio ortogonal a los vectores fila, y al usar el teorema sobre la dimensión de un subespacio orto- gonal, se obtiene rango por filas + dimensión del espacio de soluciones = n. De esto se infieren, de inmediato, todas nuestras afirmaciones y asi queda probado el teorema 10. i ii virtud del teorema 10, al rango por filas o al rango por columnas se le llama rango. Sean b¡, .b„ números y considérese el sistema de ecuaciones no homo- géneas /tj • X = b¡ (*) ; Am x = bm. Puede ser que este sistema no tenga ninguna solución, es decir, que las ecuaciones sean inconsistentes. Por ejemplo, el sistema Ix + 3y - z = 1, Ix + 3y — z = 2 no tiene solución. Sin embargo, si existe al menos una solución, entonces todas las soluciones se obtienen de ésta al sumar una solución arbitraria del sistema homogéneo asociado (**) (refiérase al ejercicio 7). Por tanto, en este caso se puede hablar nuevamente de la dimensión del conjunto de soluciones. Esta es la di- mensión del sistema homogéneo asociado.
PRODUCTOS ESCALARES Y ORTOGONAL1DAD 149 Ejemplo 1. Determinar el rango de la matriz 2 0 1 1 -1/ Solamente hay dos filas; por lo tanto, eí rango es igual cuando más a 2. Por otra paft% las dos columnas son linealmente independientes, ya que si a y b son números tales que 2a + b = 0, entonces b = 0, por lo que a = 0. Por consiguiente, las dos columnas son linealmente indepen- dientes y el rango es igual a 2. Ejemplo 2. Hallar la dimensión del conjunto de soluciones del siguiente sis- tema de ecuaciones y determinar este conjunto en R3: 2x + y + z = 1, y — z = 0. Nótese que existe al menos una solución, a saber, x — y = z = 0. El rango de la matriz , . /2 í 1\ \° 1 -v es igual a 2. De donde la dimensión del conjunto de soluciones es igual a 1. El espacio vectorial de las soluciones del sistema homogéneo tiene dimensión igual a 1 y se puede ver fácilmente que una solución es la siguiente: y = z = 1, x = Por tanto, el conjunto de soluciones del sistema no homogéneo es el conjunto de todos los vectores (i, 0,0) + r(-|, 1,1), donde t varía sobre todos los números reales. Asi se ve que el conjunto de solu- ciones es una línea recta.
150 ALGEBRA LINEAL Ejemplo 3. Encontrar una base para el espacio de las soluciones de la ecuación 3x - ly + z = 0. El espacio de las soluciones es el espacio ortogonal al vector (3, —2,1) y, por tanto, tiene dimensión igual a 2. Es claro que hay muchas bases para este espacio. Para encontrar una, se extiende primero (3, — 2,1) = A a una base de'R3. Esto se hace seleccionando vectores B, C, tales que A, B, C resulten linealmente inde- pendientes. Por ejemplo, considérense B = (0,1, 0) y c = (0, 0,1). Luego A, B, C son linealmente independientes. Para comprobarlo se procede como de costumbre. Si a, ó, c son números tales que aA + bB H cC = 0, entonces 3a = 0, -2a + b = 0, a + c = 0. Este sistema se resuelve fácilmente y se ve que a = b = c = 0, por lo que A, B, C son linealmente independientes. Ahora se deben ortogonalizar estos vectores. Sean — = (0,0,1)-A(3,-2,1)-A(3, 5,1). Entonces {Bz, C'} es una base para el espacio de soluciones de la ecuación dada.
PRODUCTOS ESCALARES Y ORTOGONALIDAD Ejercicios 151 1. Determinar el rango de las siguientes matrices. (a) 72 1 3\ b) 7-1 2 — 2\ y7 2 0J 1 3 4 -5/ P (c) 71 2 7\ (d) / 1 2 "3\ \2 4 -1] | -1 — 2 3 1 1 4 8 -121 \ 0 0 0/ (e) ¿2 0\ (I) /-I 0 1\ \° ’5/ 0 2 3 ) \ 0 0 7 / (g) / 2 0 o\ (h) / 1 2 -3\ -5 1 2 1-1 -2 3 \ 3 8 ~7/ \ 4 8 -12 \ 1 -1 5/ 2. Sean A y B matrices que se pueden multiplicar entre si. Demostrar que el rango de AB < rango de A y también que el rango de AB g rango de B. 3. Sea A una matriz triangular (an ai2 ai»\ 0 a22 ai« | Ó Ó •• aj Supóngase que ninguno de sus elementos diagonales es igual a 0. ¿Cuál es el rango de A? 4. Hallar la dimensión del espacio de soluciones de los siguientes sistemas de ecuaciones. Encontrar también una base para este espacio de soluciones. (a) 2x + y — z = 0 (b) x — y + z = 0 y + z = 0 / (c) 4x + ly — nz = 0 (d) x + y + z = 0 2x — y + z = 0 x — y =0 y + z = 0 5. ¿Cuál es la dimensión del espacio de soluciones de los siguientes sistemas de ecuacio- nes lineales? mummiminm (a) 2x - 3y + z = 0 . x + y — z = 0 <b) 2x + ly = 0 x - 2y + z = 0 (c) 2x - 3y + z — 0 (d) : x + y + z = 0' ", x + y — z = 0 2x + 2y + 2z = 0 — . 3x + 4y = 0 5x + y + z = 0
152 ALGEBRA LINEAL 6. Sea A un vector no nulo en el espacio de n dimensiones. Sea P un punto en esc mismo espacio ¿Cuál es la dimensión del conjunto de soluciones de la ecuación X A = P • A? 7 Sea AX = B un sistema de ecuaciones lineales, donde A es una matriz m x n, X es un vector de n componentes y B es un vector de m componentes. Supóngase que existe una solución X = Xo. Demostrar que toda solución es de la forma Xo + Y, donde Y es una solución del sistema homogéneo A Y = O y recíprocamente que cualquier vector de la forma + Y es una solución. 8. Sea A una matriz m x n de rango r. Sea LA : R" -» Rm la aplicación lineal usual, tal que EA(X) — AX para X e R" (X es un vector columna). Demostrar que r es la dimensión de la imagen de LA. §4. Aplicaciones bilineales y matrices Sean U, V, W espacios vectoriales sobre K y sea / <p:U x W una aplicación. Se dice que es bilineal si para cada u e U fija la aplicación v <p(u, t>) es lineal, y para cada v e K fija la aplicación u t-* <p(u, v) es lineal. La primera condición desarrollada aparece de la siguiente manera: <p(u, ttj + t>2) = <p(u, + <p(u, v2) <p(u, cv) = c<p(u, v), y análogamente para la segunda condición para la otra componente. Ejemplo. Sea A una matriz m x n, A = Se puede definir una aplicación <pA : Km x K" K haciendo <pA(X, Y) = ‘XA Y,
‘ -í k PRODUCTOS ESCALARES Y ORTOGONALIDAD 153 MraL mal, al desarrollarse, se ve de la siguiente manera: E /a“ ain\(y'\ Kfci • • •’ x")| : ' /1 I k ? @mnl l I E • f ' ' v! ®. Se supone que los vectores X y Y son vectores columna, de tal manera que ’X es, S gomo se muestra, un vector fila. Luego 'XA es un vector fila y ‘XAY es una matriz íí rj x 1, es decir, un número. Así, <pA aplica a parejas de vectores en K. Tal aplica- í alción <?a satisface propiedades análogas a las de un producto escalar. Si se fija X, entonces la aplicación Y i-» ‘XA Y es lineal y si fijamos Y, entonces la aplicación <X h» ‘XA Y también es lineal. En otras palabras, al fijar, por ejemplo, X, se tiene <Pa(X, Y + Y) = <pA(X, Y) + <pA(X, Y'\ v¿x,cY} = cq>A(X, y), y análogamente para la otra componente. Esto es sólo una reformulación de las propiedades de la multiplicación de matrices, a saber: ‘XA(Y + K') = ‘XAY + 'XAY', 'XA(cY) = c'XAY. Es conveniente expresar la multiplicación 'XAY como una suma. Nótese que ’XA = ¿ Xiüij, i=l y así entonces 'XAY = £ Y.xiaijyj= £ £ Consideremos un ejemplo numérico. Sea A-(' 2' \3 -1 Si X = ( ) y Y = p 1 ), entonces \x2J \y2J 'XAY = Xjyj + 2x^2 + 3x2yi - x2y2-
154 ALGEBRA LINEAL Teorema 11. Dada una aplicación bilineal <p: Km x K" -» K, existe una matriz A única, tal que (p = <pA, es decir, tal que <p(X, Y) = 'XA Y. El conjunto de aplicaciones bilineales de K"'Km en K es un espacio vectorial denotado por Bil (K" x Km, K), y la asociación ¿"Va da un isomorfismo entre MatmX„(K) y Bil(K" x Km,K). Prueba. Se prueba el primer enunciado primero, referente a la existencia de una matriz A única, tal que <p = <pA. Este enunciado es semejante al de la repre- sentación de las aplicaciones lineales mediante matrices, y su prueba es una exten- sión de las pruebas previas. Recuérdese que usamos las bases estándar para K* para probar estos resultados previos y que usamos coordenadas. En este caso se hace lo mismo. Sean E1,..., E" los vectores unitarios estándar para Km y sean U1,..., 17" los vectores unitarios estándar para K". Luego podemos expresar cualquier X e K.m como X = Z x¡E‘ i=l y cualquier YeK" como r = ¿ yjü*. i=t Entonces <p(X, Y) = rpixiE1 + • • • + xm£", y, U' + • • • + y„U”). Usando la linealidad sobre la primer componente se halla que <p(X, Y) = Z x¡<p(E‘, y, [/» + • • • + y„l7"). Usando la linealidad sobre la segunda componente se halla que <p(X, Y) = £ ¿ x¡yj<p(E‘, ifi). i=l j=l Sea a¡J = <p(E\ U¡).
PRODUCTOS ESCALARES Y ORTOGONALIDAD 155 Entonces vemos que <p(X, Y) = Í ¿ a^yj, • = i j=i que es precisamente la expresión que se obtuvo para el producto * * 'XAY. donde A es la matriz (a,7). Esto prueba que <p = <pA para las a¡j escogidas ante- riormente. También es fácil probar la unicidad. Supóngase que B es una matriz tal que <p = <pB. Entonces para todos los vectores X, Y se debe tener 'XAY = 'XBY. Restando, resulta 'X(A - B)Y=O para todo X, Y. Sea C = A — B, por lo que se puede expresar la anterior igualdad como ’XCY = 0 * para todo X, Y. Sea C — (c¡j). Hay que probar que todo ci} = 0. Al ser cierta la ecuación anterior para todo X, Y, lo es en particular si se hace X = Ek e Y = Ul (¡los vectores unitarios!). Pero entonces, para esta X, se tiene que 0 = = cu. Esto prueba que cu = 0 para todo k, l, y prueba el primer enunciado. El segundo enunciado, referente al isomorfismo entre el espacio de las matrices y las aplicaciones bilineales, se dejará como ejercicio. Ejercicios 1. Sea A una matriz n x n y supóngase que A es simétrica, esto es A = 'A. Sea <pA : K" x K"-> K su aplicación bilineal asociada. Demostrar que <pA(X,Y) = <pA(Y,X) para todo X,Y e K" y, por tanto, que <pA es un producto escalar, esto es, que satisface las condiciones PE 1, PE 2 y PE 3.
156 PRODUCTOS ESCALARES Y ORTOGONALIDAD 2 Reciprocamente, supóngase que A es una matriz n x n, tal que <Pa(X, Y) = ^(r,X) para todo X, L. Demostrar que A es simétrica. !. Demostrar que las aplicaciones bilineales de K" x K" en K forman un espacio vec- torial. Un más general, sea Bil (U x V, W) el conjunto de las aplicaciones bilineales de V x V en W. Demostrar que Bil (U x V, IV) es un espacio vectorial. 4 Demostrar que la asociación A >-> <¡>a es un isomorfismo entre el espacio de las matrices m x n y el espacio de las aplicaciones bi- lincalcs de Km x K" en K. A1 oía. en calculo, si f es una función de n variables, se asocia con f una matriz de segun- das derivadas parciales. ¿7 \ úx, 5xjj ’ que es simétrica. Esta matriz representa la segunda derivada, que es una aplicación bilineal 5. f tesarrollar totalmente, en términos de las coordenadas, la expresión para'XA Y cuando A es la matriz que a continuación se indica y X, Y son vectores de la dimensión corres- pondiente. 5) (1 2 -1\ -3 1 4 j 2 5-1/ /-i 2-5' (0 1 i 4 \ — 1 0 3 §5. Bases ortogonales generales Sea V nn espacio vectorial sobre el campo K de dimensión finita, con un pro- ducto escalar. Este producto escalar no necesita estar definido positivamente m siquiera sobre los números reales aunque, sin embargo, existen interesantes ejemplos <le tales productos. Por ejemplo, se puede definir el producto de dos vectores X (xitx2) y Y = (Yi.Yz) como x^'i — x2y2. Por consiguiente, <X, X) = xf - x2.
PRODUCTOS ESCALARES Y ORTOGONALIDAD 157 Tales productos aparecen en muchas aplicaciones, por ejemplo en física, donde se trabaja con productos de vectores en el espacio de 4 dimensiones, de modo que si X = (x, y, z, t), entonces <X, X) = x2+y2 + z2 - t2. En esta sección veremos qué se puede rescatar de los teoremas referentes a basas ortogonales. Sea V un espacio vectorial sobre el campo K, de dimensión finita, con un pro- ducto escalar. Si W es un subespacio, entonces no siempre es cierto que V es la suma directa de W y W1. Esto proviene del hecho de que puede haber un vector no nulo v en V tal que <v, v> = 0. Por ejemplo, sobre los números complejos, (1. i) es un vector del tipo mencionado. Ño obstante, el teorema que se refiere a la existencia de una base ortogonal sigue siendo cierto y se probará tal afirmación mediante una modificación conveniente de los argumentos dados en la sección precedente. Comenzaremos con algunas observaciones. Primero, supóngase que para cada elemento u de V se tiene <u, u) = 0. Entonces se dice que el producto escalar es nulo y que V es un espacio nulo. La razón consiste en que necesariamente se tiene <v, w> = 0 para todo v, w en V. Ciertamente, se puede escribir: <», w> = }[<v + w, v + w> — <v, v> — <w, w>]. Per suposición, el miembro de ia ecuación es igual a 0, como fácilmente se puede comprobar desarrollando los productos escalares indicados. Cualquier base de V es, entonces, una base ortogonal por definición. Teorema 12. Sea V un espacio vectorial de dimensión finita sobre el campo K y supóngase que V tiene un producto escalar. Si V # {0}, entonces V tiene una base ortogonal. Prueba. Se prueba este resultado por inducción sobre la dimensión de V. Si V tiene dimensión igual a 1, entonces cualquier elemento no nulo de V es una base ortogonal de V, por lo que la afirmación es trivial. Supóngase ahora que dim V = n > 1. Aparecen dos casos. Caso 1. Para cada elemento u e V, tenemos <u, u> = 0. Se observa entonces que cualquier base de V es una base ortogonal. Caso 2. Existe un elemento Vj de V tal que <Vj, Vi> 0. Por tamo, podemos aplicar el mismo método que se empleó en el caso definido positivamente, esto es, la ortogonalización de Gram-Schmidt. De hecho, se probará que sí es un ele- mento de V tal que <Vj, # 0, y si es el espacio de dimensión igual a 1 generado por Vi, entonces V es la suma directa de y Vj. Sea ve V y sea c como siempre, c = .
158 ALGEBRA LINEAL De ahí que v — cvt esté en Ki y, por lo tanto, la expresión U = (ü — CEj) + CVi muestra que V es la suma de V y K{. Esta suma es directa, ya que K n I7) es un subespacio de Kj que no puede ser igual a V¡ (porque / 0) y, por consi- j'iiiente, debe ser igual a 0, debido a que la dimensión de V3 es igual a 1. Como dim V1 dim V, se puede repetir ahora todo el procedimiento al trabajar con el espa- cio de V¡, en otras palabras, se usa la inducción. Asi, se halla una base ortogonal de Vi, por ejemplo, {v2,..., v„}. Por lo que se infiere de inmediato que {vt, es una base ortogonal de V. Ejemplo 1. Sean, en R2, X = (xl,x2) y Y = (yi,y2). Definasg_su producto como <X, K> = xtyi - x2y2. Entonces sucede que también (1,0) y (0,1) constituyen una base ortogonal para este producto. Sin embargo, (1,2) y (2,1) constituyen una base ortogonal para el producto escalar ordinario. Ejemplo 2. Sea V el subespacio de R3 generado por los dos vectores A = (1,2,1) y B = (1,1,1). Si X = (Xi, x2, x3) e Y = (yi,y2, y3) son vectores en R3, entonces se define su producto como <X, y> = xjj’i - x2y2 - x3y3. Se desea encontrar una base ortogonal de V con respecto a este producto. Nó- tese que <4,4> = 1 — 4 — 1 = — 4^0. Hagamos = A. Así podemos entonces ortogonalizar a B y hacemos = <B,A> _ 1 C <A,A> 2’ Sea v2 — B — \A. Entonces {vt, v2} es una base ortogonal de V con respecto al producto dado. Ejercicios 1. Determinar bases ortogonales del subespacio de R3 generado por los vectores A y B que a continuación se indican, con respecto al producto escalar indicado y que aparece es- crito como X Y. (a) A (1,1,1),B = (1, -1,2); Á y X1yv + 2x2y2 + x3y3 (b) 4 = (1, -1,4), B = (-1,1,3); X y = x^ - 3x2y2 + x,y3 + y,x3 + x3y2 - x2y3
PRODUCTOS ESCALARES Y ORTOGONALIDAD 159 • 2. Encontrar una base ortogonal para el espacio C2 sobre C, si el producto escalar está d8do por X • Y = x,y, - ix2y1 - ix¡y2 - 2x2y2. 3. Se pregunta lo mismo que en el ejercicio 2, pero ahora el producto escalar está dado por X • Y= x,y2 + x2y, + 4xtyi. §«. h espacio dual Sea V un espacio vectorial sobre un campo K. Denótese con V* el conjunto de todas las aplicaciones lineales de V en K (considerado como un espacio de una dimensión sobre sí mismo). Sabemos que K* es en sí mismo un espacio vectorial sobre K, ya que pódemos sumar aplicaciones lineales y multiplicarlas por esca- lares. Los elementos de V* se conocen como funcionales (sobre V) y a V* se le conoce como espacio dual. Sea <p un elemento de V* y sea v un elemento de V. Será conveniente denotar a <p(v) con los símbolos (<p, v). La razón para hacer esto, es que si <p2, <p2 e V*- entonces (<p2 + <p2)(v) = <Pi(v) + <p2(v), y si ceK, entonces (c<p)(t>) = c<p(v). En otras palabras. <<Pi + q>2, y> = P> + <<¡»2, V>, <c«p, t>) = c<<p, v>. Además, si v2, v2 e V, entonces, <<P, Vj + V2> = <<p, Vj> + <<p, v2>, <<p, cv> = c<<p, v>, estas dos últimas propiedades no son otra cosa que la definición de que <p es lineal. Así se tiene el mismo formalismo que con los productos escalares, excepto por el hecho que en el símbolo <<¡p, v> las dos componentes no pertenecen al mismo espacio. Ejemplo 1. Se.a V = K”. Sea <p: K" -» K la proyección sobre el primer factor, esto es, <p(Xi, ..., x„) = x¡. Entonces <p es una funcional. Análogamente, para cada i = 1, ..., n tenemos una funcional <p¡ tal que ..., x„) = x¡.
160 ALGEBRA LINEAL Ejemplo2. Sea V un espacio vectorial sobre K, con un producto escalar. Sea i „ un elemento de V. Se infiere de inmediato que la aplicación V-* <<’. l’0>. UGjZ es una funcional, a partir de la definición de producto escalar. Ejemplo 3. Sea V el espacio vectorial de las funciones continuas definidas sobre el intervalo [0, 1] y evaluadas en los reales. Se puede definir una funcional sobre V mcii: uiii la fórmula L(/) = pat a /1 K Las propiedades estándar de la integral demuestran que se trata de una aplicación lineal. Si f0 es un elemento fijo de V, entonces la aplicación poíOJWt también es una funcional sobre V. Ejemplo 4. Sea V tal como se indica en el ejemplo 3. Sea 5: V -» R la aplica- ción tal que <5(/) = /(O). Entonces ó es una funcional, conocida como funcional <le Dirac. Sea V un espacio vectorial sobre los números complejos y supóngase que V tiene un producto hermitiano. Sea v0 un elemento de V. La aplicación vi-> <t>,L’o>, veV es una funcional. Sin embargo, ¡no es cierto que la aplicación v -> <t’o, v> es una funcional! Ciertamente, se tiene que para cualquier aeC, <t?o, = a<t?0, t>>. )'<» consiguiente, esta última aplicación no es lineal. Algunas veces se dice que es antilineal o semilineal. Teorema 13. Sea V un espacio vectorial de dimensión finita sobre el campo K. Entonces el espacio dual V* también es de dimensión finita y dim V = dim 7*. Prueba. Sea {uj, ..., v„} una base de V. Se busca una base de F*. Conforme al teorema 1 del capítulo IV, §2, para cada i = 1, .... n existe una funcional, que denotamos con v*. tal que
PRODUCTOS ESCALARES Y ORTOGONALIDAD 161 I (gl teorema mencionado nos permite hallar una aplicación lineal que tenga los valores prescritos sobre los elementos de la base). Probaremos que {v*, ..., u*} gs una base de V*. Sea (p e V*. Sea c¡ = <<p, tx). Se dice que <p = Cit>T + ••• + c„v*. para cada i, se tiene <CjV* + • • • + c„v*, V¡> = C,<tí, v¡> = c¡. Como c( = <p(v¡), se infiere que tanto <p como Cjvf + • • + c„v* tienen los mismos valores sobre todos los elementos de la base {t>j,..v„¡. Por lo que tiene los mismos valores sobre las combinaciones lineales de estos elementos de la base y, por lo tanto, son iguales sobre V. En consecuencia, ..., n* generan a K*. Para probar que son liñealmente independientes, supóngase que xivf + • • + x„v* = 0, con elementos x¡eK. Evalúese esta expresión sobre v¡. Hallamos que 0 = <Xll>f + • • • + x„v*, »¡> = x¡(v*, v¡> = x¡. De donde todo x, = 0, y se ha probado lo que se quería. La base {u*,..., t>*} de V* descrita en la prueba del teorema precedente se conoce como base dual de {»i,..., «„}. Usaremos la misma terminología de perpendicularidad tal como lo hicimos con los productos escalares. Así, si S es un subconjunto de V y si <p e V*, decimos que <p es ortogonal o perpendicular a S, si <P(v) = <<p, »> = 0 para todo veS. El conjunto de elementos <p e V* que son ortogonales a S es un subespacio de V* al que, nuevamente, se denotará con S1 (si el contexto aclara que no hay producto escalar sobre V, lo cual podría ser causa de cpnfusión). Cada elemento de S1 es perpendicular al subespacio de V generado pór S. Teorema 14. Sea V un espacio de dimensión finita sobre K. Sea W un sub- espacio. Entonces, \ dim W + dim W1 = dim V. M V Prueba. Sea {wi,..., wr} una base de W. Usando el corolario 1 del teorema 5 del capítulo II, §3, se extiende esta base {»],..., w„} de V. Sea {w|......wj¡ la base dual. Probaremos que {w?+i,..., wj} es una base de IV1, lo que demos- trará el teorema. Bastará con probar que w*+l,..., w* generan IV1, ya que son linealmente independientes.
162 ALGEBRA LINEAL PRODUCTOS ESCALARES Y ORTOGONALIDAD 163 Sea <¡pe IV1. Existen elementos clf.... c„e K tales que <p = CjWf + • • + C„'.V*. Como <pe Wf se tiene que para cada i = 1, .... r: 0 = <p(w¡) = cfw*, w¡> = c¡ por definición de la base dual. De donde <P = cr+iw*+l + •• + c„w*. Esto prueba que IV1 está contenido en el espacio generado por w*+i,..., w*. Recíprocamente, si r + 1 g jí g n, entonces w¡> =0, i = 1, .... r. De donde wf pertenece a W1. Esto prueba que contiene al espacio generado por w*+1,..., h>*, con lo cual Analiza la prueba del teorema. Es evidente, por el argumento precedente, que existe una fuerte relación entre un producto escalar sobre un espacio vectorial y el espacio dual. Precisaremos esta relación. Sea V un espacio vectorial sobre el campo K y supóngase que existe un producto escalar sobre V. A cada elemento v e V le podemos asociar una funcional L„ en el espacio dual, a saber, la aplicación tal que Lv(w) - <v, w> para todo we V. Si vt,vte V, entonces LV1+VJ = LVl + Ln. Si ce K, entonces LcV = cL„. Estas relaciones son, esencialmente, otra forma de enunciar la defi- nición de producto escalar. Podemos decir que la aplicación L„ es una aplicación lineal de V en el espacio dual V*. El siguiente teorema es muy importante. Teorema 15. Sea V un espacio vectorial de dimensión finita sobre K, con un producto escalar no degenerado. Dado un funcional L:V-> K existe un elemento único ve V tal que L(w) = <v,w> para todo we V. Prueba. Considérese el conjunto de todas las funcionales sobre V que son del tipo L„, para algún v e V. Este conjunto es un subespacio de V*, porque la funcional E nula es de este tipo y, además, son ciertas las siguientes fórmulas: y EV1 "I- LVi + 02 > y Lcv = cLv. f Además, si {vi, ..., v„} es una base de entonces L„„ son linealmente f independientes. Prueba: Si xt,...,x,ek son tales que f x,Lv¡ + /+ x„L„n = 0, : entonces / y, por tanto, / f-H»! + •+X„V„ = 0. Sin embargo, si ve V, y L„ = 0, entonces v = O por definición de no degeneración. De donde X1V, + ••• + x„v„ = O, y en consecuencia, xi = • • • = x„ — 0, con lo que se prueba el enunciado. Se con- cluye que el espacio de las funcionales de tipo L„(ve V) es un subespacio de V*. de la misma dimensión que la de V*, por lo tanto igual a V*. Esto prueba el teorema. Con relación al teorema, decimos que el vector v representa la funcional L con respecto a! producto escalar no degenerado. Se puede ofrecer una prueba más breve del teorema 15. En efecto: Teorema 15'. La aplicación v •-> L„ de V en V* es un isomorfismo. Prueba. El núcleo de la aplicación es O, debido a la no degeneración y como dim V = dim V*, entonces se puede aplicar el corolario del teorema 6, capitu- lo IV , §4, con lo que se concluye la prueba. Hicimos una prueba más extensa del teorema 8, con el objeto de poder aplicar ,un argumento semejante a una situación análoga sobre los números complejos. Ejemplos. Supongamos que V = K" con el producto escalar usual, X • y = Xiyj + • • + x„y„, que se sabe es no degenerado. Si <p:V->K es una aplicación lineal, entonces existe un vector único A e K" tal que para todo H e K" tenemos <p(H) = AH. Esto nos permite representar la funcional <p por el vector A.
164 ALGEBRA LINEAL Como un ejemplo adicional, considérese V = R" con el producto escalar usual. Sea f: R" -> R una función derivable. En cálculo, se define la derivada de f en X como una aplicación lineal <p: R" -♦ R. El vector que representa a £ con respecto a! producto escalar se llama gradiente de /en X y se denota con (grd /)(X) o bien con V/(X). Asi, entonces, por definición tenemos que <p(H) = V/(X) H para todo H e R". Como una aplicación de nuestros resultados referentes al espacio dual, obte- nemos el análogo del teorema 3 para productos escalares arbitrarios no dege- nerados, no sólo para los definitivamente positivos. Teorema 16. Sea V un espacio vectorial de dimensión finita sobre un campo K, con un producto escalar no degenerado. Sea W un subespacio de V. Sea W1 el subespacio de V ortogonal a W. Entonces, dim V = dim IV + dim IV1. Prueba. Como se trabajará simultáneamente con el producto escalar sobre V y con el espacio dual, se denotará con PerpvffV) al espacio de los elementos ve V tales que <t>, = 0 para todo we W y con PerpF.m el espacio de los elementos <pe V* tales que <p(w) = 0 para todo w e IV. Por de- finición. un elemento v de V está en PerpF(lV) si y sólo si la funcional L„ está en Perpv-(IV). Por tanto, la aplicación v i-> L„ induce un isomorfismo entre PerpF(W') y Perpk-(IV) el cual, por consiguiente, tiene la misma dimensión. Aplicamos el teorema 14 para concluir la prueba. Observación. Hay que hacer hincapié en que el teorema 16 es cierto a pesar del hecho de que V no es necesariamente la suma directa de W y PerpF(fP). Por ejemplo, sea C = C2 y sea W el subespacio de dimensión igual a 1 generado por el vector (i, i). Deseamos determinar a W1 en C2, donde la perpendicularidad se considera con respecto al producto escalar ordinario de los vectores. Entonces, ciertamente W1 contiene a W, ya que (1, i) • (1, i) = 0. Por otro lado, debido al teorema, dim W1 = dim C2 — dim W = 1. Por lo que W1 = W. El teorema 16 prueba el enunciado que se necesitaba para mostrar que el rango por columnas es igual al rango por filas. (Vea el teorema 10, §3). Ejercicios i. Sean A y B dos vectores linealmente independientes en R”. ¿Cuál es la dimensión del espacio perpendicular tanto a A como a B?
PRODUCTOS ESCALARES Y ORTOGONALIDAD 165 2. Sean A y B dos vectores linealmente independientes en C". ¿Cuál es la dimensión del subespacio de C" perpendicular tanto a A como a B? (La perpendicularidad se refiere al pro- ducto escalar ordinario de los vectores en C*.| 3. Sea V un espacio vectorial de dimensión finita sobre el campo K. Sean U, W sub- espacios^supóngase que V es la suma directa U ffi W. Demostrar que V* es igual a la suma directa l/x ® Wk. fl. Sea W el subespacio de C3 generado por el vector (1, i, 0). Hallar una base de W'i en C3 (con respecto al producto escalar ordinario de los vectores). 5. Sea V un espacio vectorial de dimensión finita igual a n sobre el campo K. Sea <p una funcional sobre V y,supóngase que p / 0. ¿Cuál es la dimensión del núcleo de g>? Pruebe f, su afirmación. 6. Sea V un espacio vectorial de dimensión igual a n sobre el campo K. Sean <p fun- cionales no nulas sobre V. Supóngase que no existe ningún elemento ceK, c / 0 tal que y = ccp. Demostrar que (Ker <p) r> (Ker tiene dimensión igual a n — 2. 7. Sea V un espacio vectorial de dimensión igual a n sobre el campo K. Sea V** el es- pacio dual de V*. Demostrar que cada uno de los elementos v e V da origen a un elemento 2, en V** y que la aplicación v >-* da un isomorfismo de V con V**. 8. Sea V un espacio vectorial de dimensión finita sobre el campo K, con un producto escalar no degenerado. Sea W un subespacio. Demostrar que W11 — W. 9. Demostrar que es válida la misma conclusión que aparece en el ejercicio precedente si pensamos en W1 como el complemento ortogonal de W en el espacio dual V*. 10. Sea V un espacio vectorial de dimensión finita sobre el campo K y sean W¡, W2 subespacios. Expresar (tP] + W'2)1 en términos de Wi y W2. Además, expresar (Wz1 n tPj)1 en términos de Wi y Wj.

CAPITULO VII Determinantes Hemos trabajado durante algún tiempo con vectores y a menudo hemos sen- tido la necesidad de tener método para determinar cuándo los vectores son li- nealmente independientes. Hasta ahora, el único método con que contamos con- siste en resolver un sistema de ecuaciones lineales por el método de eliminación. En este capítulo mostraremos un método computacional muy eficaz para re- solver ecuaciones lineales y para determinar cuándo los vectores son linealmente independientes. Los casos de los determinantes de 2 x 2 y 3 x 3 se tratarán Completamente por separado porque, en el caso general de los determinantes de n x n, la nota- ción se viene a sumar a las demás dificultades que aparecen en el estudio de los determinantes. Se sugiere que en una primera lectura se omitan las pruebas para el caso general. §1 . Determinantes de orden 2 Antes de establecer las propiedades generales de un determinante arbitrario, vamos a considerar un caso especial. Sea A = (“ \c “/ una matriz 2 x 2 en un campo K. Se define su determinante como ad — be. Así, el determinante es un elemento de K. Se denota a c = ad — be. Por ejemplo, el determinante de la matriz 2 1\ 1 4/ es igual a 2 - 4 - 11=7. El determinante de — 2 -3' 4 5 es igual a ( — 2) 5 — ( — 3) - 4 = —10 + 12 = 2. UllUUlllllttllUlttttititir 167
168 ALGEBRA LINEAL Se puede considerar al determinante como una función de la matriz A. Tanb bien se puede considerar como una función de sus dos columnas; sean éstas A1 y 42 como de costumbre. Luego, expresemos al determinante como D(A), Det(/1), ó DIA', A2) Mediante cálculos directos se pueden verificar fácilmente las siguientes pro- piedades, que el lector deberá desarrollar completamente. Considerado como una función de los vectores columna, el determinante es lineal. Por ejemplo: sean b' y d' dos números. Entonces r- , ía b + b' Det \c . = Det d + di a b' c d Detí a b'~ d' Además, si t es un número, entonces a tb c td - tDetr b' d También son válidas las propiedades análogas con respecto a la primera colum- na. Para demostrar la sencillez de la prueba, haremos ésta para la propiedad adi- tiva con respecto a la segunda columna. A saber, se tiene que a(d + d’) — c(b + b’) = ad + ad' — cb — cb' = ad — be + ad' — b'c, que precisamente es la propiedad aditiva deseada. Por lo que, empleando los términos usados en el capitulo VI, §4, se puede decir que el determinante es bi- lineal. Si las dos columnas son iguales, entonces el determinante es igual a 0. Si A es la matriz unitaria, 0\ 1/ entonces DetM) = 1. El determinante también satisface las siguientes propiedades adicionales. Si se suma un múltiplo de una columna a la otra columna, entonces el valor dd determinante no varía. En otras palabras, sea t un número. El determinante de la matriz a -f- tb b' c + td d es el mismo que D(4); sucede algo análogo cuando se suma un múltiplo de lai primera columna a la segunda columna.
169 DETERMINANTES Si se intercambian las dos columnas, entonces til determinante En otras palabras, \ cambia de signo. Det Ia \c a c ’H determinante de A es igual al determinante de su traspuesta, esto es. P04) = D(M). Explícitamente, se tiene Los vectores son linealmente dependientes si y sólo si el determinante ad — be es igual a 0. Haremos una prueba directa para esta propiedad. Supóngase que existen nú- meros x, y los cuales no son iguales a 0 simultáneamente, tales que xa + yb = 0, xc + yd = 0. Se supone que x 0. Se multiplica la primera ecuación por d, se multiplica la segunda ecuación por b y se restan, con lo cual se obtiene xad — xbc = 0, de donde x(ad- — be) = 0. Se deduce que ad — be = 0. Recíprocamente, supón- gase que ad — be = 0 y supóngase que los vectores (a, c) y (b, d) no son iguales simultáneamente al vector nulo (de otra manera, los vectores resultan, claro está, linealmente dependientes). Se supone que a ± 0. Sean y = —ay x = b. Entonces, se ve de inmediato que xa + yb = 0, xc + yd = 0, por lo que (a, c) y (b, d) son linealmente dependientes, lo que prueba el enunciado. §2 . Existencia de los determinantes Definimos los determinantes por inducción y al mismo tiempo damos una fórmula para calcularlos. Discutiremos primero el caso de los determinantes de 3 x 3.
170 ALGEBRA LINEAL Ya se han definido los determinantes de 2 x 2. Sea /«H «12 «13 -4 = («y) = í «21 «22 «23 \«31 «32 «33 una matriz 3 x 3. Se define su determinante de acuerdo con la fórmula conoci- da como desarrollo de una fila, por ejemplo, la primera. Es decir, se define <*) Det(d) = ati «22 «32 «23 - «21 ~ «12 «33 «31 «23 «33 + «13 «21 «31 «22 «32 «11 «12 «13 «21 «22 «23 «31 «32 «33 se puede describir esta suma de la siguiente manera. Sea A¡j la matriz obtenida de A al eliminar la fila i y la columna j. Entonces, la suma que expresa DetfX), se puede escribir como «ii Det(j4n) - «i2 Det(4I2) + ai3 Det(/h3). En otras palabras, cada uno de los términos consta del producto de un elemen- to del primer renglón y del determinante de la matriz 2x2 obtenida al eliminar la primera fila y la columna j y al ponerle el signo apropiado a este término, tal y como se muestra. Ejemplo}. Sea / 2 1 °\ A = 1 1 4 1. \-3 2 5/ Entonces , fl 4\ . ( 1 4\ . _/ 1 1 ^n=l2 5)’ 412-|-3 5)’ —\—3 2 y la fórmula para el determinante de A da como resultado üe'M)-2); J|-lp ^ + °|J = 2(5 - 8) - 1(5 + 12) + 0 = -23. El determinante de una matriz 3 x 3 se puede escribir como D(A) = Det(4) = D(A'. /I2, A3).
DETERMINANTES 171 Si se Qu>ere considerar al determinante como una función de las columnas de A, entonces usamos esta última expresión. Posteriormente se definirá el determinante de una matriz n x n y se usará R la misma notación ff |A| = D(A) = Det(/1) = D(A *,..., A"). fts- Yafce pueden probar, para el caso de los determinantes de 3 x 3, las propiedades expresadas en el siguiente teorema, que se enuncian, sin embargo, para el caso genera!. Teorema 1. El determinante satisface las siguientes propiedades: 1, Como función de cada vector columna, el determinante es lineal, esto es, si la columna j-ésima Aj es igual a una suma de dos vectores columna, digamos Aj = C + C, entonces ¡XA',..., C + C,..., 4") = DÍA1,..., C, ..., A") + D(A‘, ..., C, ..., A"). Además, si t es un número, entonces D(A‘, ..., tAJ, ..., AB) = tDÍA1, ..., AJ, ..., A"). 2. Si dos columnas adyacentes son iguales, esto es, si AJ = A}+1 para algún j = 1,..., n — 1, entonces el determinante D(A) es igual a 0. 3. Si 1 es la matriz unitaria, entonces D(/) = 1. Prueba (para el caso de 3 x 3). La prueba se hace mediante cálculos directos. Supóngase que, por ejemplo, la primera columna es una suma de dos columnas: («n\ /^i\ /C1\ a21 I = i b2 I + I c2 I • «3iy v3/ \Ci/ M sustituir en cada término de (♦), se ve que cada término se descompone en una suma de dos términos correspondientes a B y C. Por ejemplo, «ii Ü22 «31 «23 «33 = fej «22 «31 «23 «33 + Ci «22 «31 «23 «33 «12 Í>2 + C2 i>3 + C3 «23 _ n l>2 = «12 , «33 «3 «23 «33 + «12 C2 C3 «23 «33 y análogamente para el tercer término. La prueba con respecto a la otra columna es semejante. Además, si t es un número, entonces DetftA1, A2, A3) = tan «22 «32 «23 «33 -«12 = tDet(A',A2,A3) t«21 t«3l «23 «33 + «13 t«2 1 t«31 «22 «32 mmmmununnnmnnu
172 ALGEBRA LINEAL porque cada uno de los determinantes de 2 x 2 es lineal en la primera columna y porque se puede sacar t de cada uno de los términos segundo y tercero. Nueva- meryc, la prueba es análoga en relación con las otras columnas. Una sustitución directa muestra que si dos columnas adyacentes son iguales, entonces la fórmula (*) resulta igual a 0 para el determinante. Finalmente, se ve de inmediato que s¡ A es la matriz unitaria, entonces Det(A) = 1. Asi, se han verificado las tres pro- piedades. En la prueba anterior, se vio el uso de las propiedades de los determinantes de 2 x 2 para probar las propiedades de los determinantes de 3 x 3. Además, no hay razón particular por la cual se haya seleccionado la primera fila para efectuar el desarrollo. También podemos usar la segunda y escribir una suma semejante, a saber: -«21 «12 «32 «13 «33 + «22 «11 «31 «13 «33 - «23 «11 «31 «12 «32 — —«2i Det(A21) + «22 Det(/Í22) — «23 DetfAzj). Nuevamente, cada término es el producto de a2; y del determinante de la matriz de 2 x 2, obtenido al eliminar la segunda fila y la columna j, poniendo el signo apropiado al frente de cada término. Este signo está determinado conforme a la siguiente configuración: Se puede ver directamente que el determinante se puede desarrollar conforme a cualquier fila multiplicando todos los términos y desarrollando los determinantes de 2 x 2. obteniendo así el determinante como una suma alternada de seis tér- minos: (*♦) Det(>l) = «11«22«33 — «11«32«23 ~ «12«21«33 + «12«23«31 + «13«21«32 — «13«22a31- Además, también se puede hacer el desarrollo de acuerdo con las columnas con base en el mismo principio. Por ejemplo, desarrollando conforme a la primera columna: «11 «22 «32 «23 «33 “ «21 «12 «32 «13 «33 + «31 «12 «22 «13 «23 se obtienen precisamente los mismos seis términos que aparecen en (**). Aquí, el lector deberá echar al menos una ojeada a la expresión general q aparece en el teorema 2n, dada para el desarrollo conforme a una fila o una lumna, interpretando i y j como 1,2 ó 3 para el caso de 3 x 3. Como el determinante de una matriz de 3 x 3 es lineal como función de s columnas, podemos decir que es trilineai; al igual que un determinante 2 x 2 es bilineal. En el caso de n x n. diríamos n-lineal o multilineal.
DETERMINANTES 173 En el caso de los determinantes 3 x 3 se obtiene el siguiente resultado. Teorema 2. El determinante satisface la regla para el desarrollo corforme a los renglones y a las columnas y Det (A) = Det (’A). Én otras palabras, el de- terminante de una matriz es igual al determinante de su traspuesta. • 9 Se infiere esta última afirmación puesto que al tomar la traspuesta de una matriz se intercambian filas con columnas y viceversa. Ejemplo 1. Calcular el determinante 3 0 1 1 2 5 -14 2 al desarrollarlo conforme a la segunda columna. El determinante es igual a 1 5 2 3 -1 = 2(6 - (-1)) - 4(15 - 1) = -42. Nótese que la presencia de un 0 en la segunda columna elimina un término en el desarrollo, ya que este término sería igual a 0. También se puede calcular el determinante anterior desarrollándolo conforme a la tercera columna, es decir, que el determinante es igual a 1 -1 2 4 - 5 + 1 3 0 -1 4 3 1 0 2 = -42. + 2 El caso n X n En la secuela, trabajaremos preferentemente con las matrices 2 x 2 y 3 x 3,de tal manera que el lector puede omitir la discusión del caso general, o simplemente leer los enunciados de las definiciones y de las propiedades y omitir las pruebas. El caso general de los determinantes de n x n se prueba por inducción. Su- póngase que hemos definido los determinantes para las matrices (n — 1) x (n — 1). Sea i,j una pareja de números enteros comprendidos entre 1 y n. Si se elimina la fila i y la columna j en la matriz A de n x n, obtenemos una matriz de (n — 1) x (n — 1), que se denotará con Ai}. Esta matriz tiene el siguiente aspecto:
174 ALGEBRA LINEAL En seguida se da una expresión para el determinante de una matriz n x n en términos de determinantes de matrices (n — 1) x (n — 1). Sea i un número entero, 1 > i s n. Se define /)(4) = (- l)í+ ‘a,, Det(j4{1) + ••• + (- l)i + "ain Det(4in). Cada Ajj es una matriz de (n — 1) x (n — 1). Se puede describir esta suma con palabras. Para cada elemento de la fila i, tenemos una contribución de un término en la suma. Este término es igual a + ó a — el producto de este elemento por el determinante de la matriz obtenida de A al eliminar la fila i y la correspondiente columna. El signo + ó — queda determinado de acuerdo con la siguiente configura- ción tipo tablero de ajedrez: Esta suma se conoce como desarrollo del determinante conforme a la i-ésima fila. Probaremos que esta función D satisface las propiedades 1, 2 y 3. Nótese que l)(A) es igual a una suma de los términos (—Det(ylij) a medida que j varía de 1 a n. 1. Considérese D como una función de la columna k y considérese cualquier término (-l)i+Ja,j DetM.j). Si j / k. entonces no depende de la columna k-ésima y Det (AtJ depende lineai- mente de la columna k. Si j — k. entonces a¡i depende linealmente de la columna í -ésima y Del (4,;) no depende de la columna k. En cualquier caso, el término depende linealmente de la columna k. Como D(A) es una suma de tales términos, depende linealmente de la columna k y, por tanto, se infiere la propiedad 1 2. Supóngase que dos columnas adyacentes de A son iguales, a saber Ak = 4,+ *. Sea j un índice -A k ó k + 1. Luego la matriz .4,,- tiene dos columnas adyacentes iguales, y por tanto, su determinante es igual a 0. Así entonces, el término corres- pondiente a un índice j + k ó k + 1 contribuye al valor de D(A) con un valor igual a 0. Los otros dos términos se pueden expresar de la siguiente manera: <-l)i+*a« DetfA,*) + (-l)i+‘ + ’a,-*+, Det(A,k+1). Las dos matrices Aik y 4,* + , son iguales debido a la suposición de que la columna
DETERMINANTES 175 fc^sima de A es igual a la columna (k + l)-ésima. Análogamente, aik = aik + 1. Ipe donde estos dos términos se cancelan puesto que aparecen con signos opuestos, testo prueba la propiedad 2. P 3. Sea A la matriz unitaria. Entonces — 0 a menos que i = j, en cuyo caso = 1. Cada A¡j es la matriz unitaria de (n — 1) x (n — 1). El único término en ||a suma que contribuye con un valor distinto de cero, es ? (-l)i+,aHDet(AH), que es igual a 1. Esto prueba la propiedad 3. Ejemplo 2. Se desea calcular el determinante 12 1 — 13 1- 0 1 5 Se emplea el desarrollo según la tercera fila (debido a que aparece un cero en esta fila); sólo aparecen dos términos distintos de cero: Se pueden calcular explícitamente los determinantes de 2 x 2 como se hizo en el §1, y de esa manera obtener el valor 23 para el determinante de la matriz 3x3. En una sección subsecuente se mostrará que el determinante de una matriz ,4 es igual al determinante de su traspuesta. Cuando se haya probado este re- sultado. se tendrá: Teorema 2n. Los determinantes satisfacen la regla para el desarrollo según las Jilas y las columnas. Para cualquier columna AJ de la matriz A = (ay), te- nemos que D(A) = (-l)1+>avD(Au) + •• + (-\y+ianJD(A^. En la práctica, el cálculo de un determinante siempre se hace mediante un desarrollo de acuerdo con alguna fila o columna. Ejercicios 1. Sea c un número y sea A una matriz de 3 x 3. Demostrar que D(cA) = c3D(¿). 2. Sea c un número y sea A una matriz den x n. Demostrar que D(cA) = c’D(A).
176 ALGEBRA LINEAL DETERMINANTES 177 §3 . Propiedades adicionales de los determinantes Para calcular los determinantes de manera eficiente necesitamos propiedades adicionales, las cuales serán deducidas simplemente de las propiedades 1, 2,3 <Jel ('oleína l. Ahora no habrá diferencia entre los casos para 3 x 3 y n x n, ponfo escribimos n. Pero nuevamente puede el lector, si asi lo desea, hacer " 3 en una primera lectura. 4. Sea j algún entero, 1 g j' n. Si se intercambian las columnas j-ésima y(j 4. entonces el determinante cambia de signo. Prueba. En la matriz A se reemplazan las columnas / y (/ + 1) por AJ + 4-i+i Se obtiene una matriz con dos columnas adyacentes iguales y por la propiedad 2 se tiene 0 = D(..., AJ + Ai+\A¡ + Aj+1, ...). Desarrollando y empleando la propiedad 1 repetidamente, se obtiene 0 = £>(..., Aj, A¡,...) + D(..., Ai+',A¡, ...) + Di..., A', AJ+',...) + D(....,Ai+l, Aj+',...Y Al usar la propiedad 2, se ve que dos de estos cuatro términos son iguales aOy que, por tanto, 0 = £>(..., AJ+1, AJ,...) + £>(..., A’, Ai+',.. .). í .n esta última suma, un término debe ser igual al otro pero con signo negativo tal y como se deseaba. 5. Si dos columnas .de A, A’ y A' son iguales, j £ i, entonces el determinante de A es igual a 0. Prueba. Supóngase que dos columnas de la matriz A son iguales. Se puede cambiar la matriz mediante un intercambio sucesivo de columnas adyacentes hasta obtener una matriz con columnas adyacentes iguales. (Esto se podría pro- bar tormahncnte por inducción.) Cada vez que se hace tal intercambio, el deter- minante cambia de signo, lo cual no afecta el que sea o no igual a 0. De donde, por la propiedad 2, se concluye que D(A) = 0 si dos columnas son iguales. 6. Si se suma un múltiplo escalar de una columna a otra, entonces el valor dd determinante no cambia. Prueba. Considérense dos columnas distintas, digamos que sean las columnas k-esima y j-ésima Ak y AJ con k j. Sea t un escalar. Se suma tAj a Ak. Por la pro- piedad 1, el determinante es D(. . ., Ak + tAJ, ...) = D(...,Ak....)+ D(....tAj,...) T T T k k k |||a fc apunta a la columna k). En ambos términos que aparecen en el miembro de ' ja derecha, la columna indicada aparece en el lugar k-ésimo. Pero D(..., Ak,...) simplemente, ^(A). Además, D(...,tAí,...) = tD(.. .,AJ,...). Cotno k ± j, el determinante que aparece a la derecha de la igualdad, tiene dos columnas iguales, debido a que AJ aparece en el lugar k-ésimo y también aparece en el lugar j. De donde es igual a 0. Por lo que D(...,Ak + tAJ,...) = D(. ..,Ak,...), con lo que se prueba la propiedad 6. Con los medios anteriores a disposición, se pueden calcular ahora los deter- minantes de 3 x 3 de manera muy eficiente. Al hacerlo, se aplican las operaciones descritas en la propiedad 6 que como se ve son válidas para filas o para columnas, ya que Det(A) = Det('A). Se trata de hacer que en la matriz A aparezcan varias - componentes iguales a 0. Especialmente, se trata de hacer que todos excepto un elemento de una columna (o fila) sean iguales a 0, para poder después desarro- llar según esa columna (o fila). El desarrollo tendrá sólo un término y nuestro cálculo se reducirá a un determinante de 2 x 2. Ejemplo 1. Calcular el determinante 3 1 -1 1 5 2 0 2 4 Ya se tiene un 0 en el primer renglón. Se resta dos veces el segundo renglón del tercero. Entonces ei determinante es igual a 3 0 1 1 2 5 — 3 0-8 Ahora se desarrolla de acuerdo con la segunda columna. El desarrollo tiene sólo un término =£ 0, con un signo + ; este término es: 2 El determinante de 2 x 2 se puede evaluar mediante la definición ad — be, y se tiene 2( — 24 - (-3)) = -42.
178 ALGEBRA LINEAL DETERMINANTES 179 Ejemplo?. Se desea calcular el determinante 13 11 2 15 2 1-1 2 3 4 1-3 7 Se suma la tercera fila a la segunda y después se suma la tercera a la cuarta. Esto da por resultado: 13 11 13 11 3 0 7 5 3 0 7 5 1-12 3 — 1-12 3 4 1-37 5 0 -1 10 Luego se suma tres veces la tercera fila a la primera y se obtiene: 4 0 7 10 3 0 7 5 1-1 2 3 ’ 5 0 -1 10 el cual se desarrolla según la segunda columna. Hay solamente un término, a saber: 4 7 10 3 7 5 5 -1 10 Se resta dos veces la segunda fila de la primera y después de la tercera, lo que da por resultado: -2-7 0 3 7 5 , -1 -15 0 2. Calcular los siguientes determinantes. 1 1 —2 4 -1 í 2 0 ' 9 0 1 1 3 0 3 2 1 3 1 1 (a) 2 -1 1 0 b) 0 4 1 2 (c) 2 5 5 3 1 2 5 3 1 5 7 8 7 7 4-9 2 4 -1 1 2 0 0 (d) 4-9 2 (e) 2 0 0 (0 1 1 0 3 1 0 1 5 7 8 5 7 4 0 0 5 0 0 2 -1 4 (g) 0 1 0 (h) 0 3 0 (>) 3 1 5 0 0 27 0 0 9 1 2 3 3. En general, ¿cuál es el determinante de una matriz diagonal nn 0 0 ••• 0 0 a22 0 ••• 0 Ó Ó Ó 0 0 0 • am 4. Calcular el determinante lCOS ®. Sen |sen 0 eos ) Sean x,, x2, x3 números. Demostrar que 1 x¡ xj 1 x2 xj 1 x3 xl = (x2 - XiXxa - XiX*3 - x2). (b) Si Xi...x„ son números, entonces demostrar por inducción que que se desarrolla según la tercera columna, con lo que se obtiene: -5(30 - 7) = -5(23) = -115. 1 Xj 1 x2 1 x„ = n (*>-*)- Ejercicios 1. Calcular los siguientes determinantes: (a) 2 0 4 1 2 3 -1 1 1 (b) 3-1 5 -1 2 1 -2 4 3 (c) 2 4 3 -13 0 0 2 1 el símbolo que aparece a la derecha de la igualdad representa el producto de todos los tér- minos Xj — x¡ con i < j e i, j enteros que varían de 1 a n. Este determinante se conoce como determinante V„ de Vandermonde. Para aplicar fácilmente la inducción, se multiplica cada columna por xt y se resta de la siguiente columna a la derecha, comenzando por la derecha. Se hallará que E» = (x. - Xi) • • • (x2 - xJP,.,.
11Ji riti I ífrVi Hll41III1)1' 180 ALGEBRA LINEAL 6. Encontrar los determinantes de las siguientes matrices. Il 2 5\ /— 1 5 2o\ (a) 0 1 7 (b) 0 4 8 1 \0 0 3/ \ 0 0 6/ ¡2 -6 9\ /—7 98 54 \ (c) 0 1 4 1 (d) 1 0 2 46 \0 08/ \ 0 0 -1 / /i 4 ó\ / 4 0 0\ (e) f 0 0 1 | (f) I -5 2 0 \0 0 8/ \ 79 54 1/ /I 5 2 3\ /—5 0 0 0 .,( 0 2 7 61 ,..7 2 0 0 (g)l 0 0 4 1 ) ^*-9410 \0 0 0 5/ \ 96 2 3 1 (i) Sea A una matriz triangular de n x n, tal que todas las componentes que se encuen- tran por debajo de la diagonal son iguales a 0. (flu \ 0 a22 0 0 •. 0 ó am I ¿A qué es igual D(A)? 7. Si o(t), b(t), riO y d(t) son funciones de t, se puede formar el determinante ]n(0 b(t)j |c(0 ¿(OT al igual que con números. Desarrollar totalmente el determinante sen t eos t —cosí sent 8. Desarrollar totalmente el determinante lt+ 1 t - 11 I t 2t + 5|’ 9. Sean /(t) y g(t) funciones que tienen derivadas de todos los órdenes. Sea <p(t) la función obtenida al considerar el determinante 9>(0 = 1/(0 |/'(0 0(0! 0'(O| Demostrar que <p'(0 = 1/(0 |/"(0 s(0| 9"(0| ’ o sea, la derivada se obtiene al tomar la derivada de la fila inferior.
DETERMINANTES 181 10. Sea Aiñ = (b¡{t} uiia matriz 2 x 2 de funciones derivables. Sean B(t) y C(t) sus vectores columnas. * <p(t) = Det(/1(t)). demostrar que ..‘P <p’{t) = C(t)) + D(B(t), C(t)). 11. Sean at,..., a, números distintos entre si, # 0. Demostrar que las funciones , e-> fon linealmente independientes sobre los números complejos. [Sugerencia: supóngase que jjay una relación lineal Cjé"' + •• + c„e’-’ = 0 con constantes c¡, válidas para todo t. Si no todos los c¡ son iguales a 0, sin pérdida de genera- lidad, se puede suponer que ninguno de ellos es igual a 0. Derívese la relación anterior n — 1 veces. Se obtendrá un sistema de ecuaciones lineales. El determinante de sus coeficientes debe ser igual a cero (¿por qué?). Partiendo de esto, llegue a una contradicción.] ^‘¡S^Para este ejercicio suponemos que el lector ha trabajado con polinomios. (a) Sean P¡¡(i,j = 1....n) polinomios. Supóngase que todos los polinomios que aparecen en una columna determinada en la matriz /fu •• Pt.\ yp.i pmj tienen el mismo grado y sean di,... d. estos grados. Sea c,j(^ 0) el coeficiente principal de Ptj. Sea Q el determinante de la matriz anterior. Demostrar que Q tiene una expresión Q(t) = ct* + términos de grado < d donde c = Det(ci;). Por tanto, si Det(c0) 0, entonces vemos que Q / 0. (Si el lector lo pre- fiere, haga esto sólo para n = 2 y después para n = 3 usando el desarrollo conforme a una columna. El caso general se puede hacer por inducción. Análogamente, en las partes sub- secuentes del ejercicio se puede suponer n = 2 ó 3.) (b) Denótese con D la derivada, D = d/dt. Sea P un polinomio y sea a un número, a 0. Demostrar que D(P(t)e“) = (D + a)P(t)é". y por inducción. D^PUte") = (D + a/PItk”1.
182 ALGEBRA LINEAL DETERMINANTES 183 (c) Sean <x>, .... a, números distintos entre sí # 0. Demostrar que las funciones e*1', . son linealmente independientes sobre los polinomios, esto es, que si Pt,..., P, son po. linomios tales que PaCe-' + - • • + P„(l)e’"l = 0 para lodo t, entonces Pt,..., P, son los polinomios nulos. [Sugerencia: derívese la expre. siór» anterior n — 1 veces. Probar que si a # 0, entonces grad(D + a?P = grad P para cualquier polinomio P y para cualquier entero k 2: 0. Se obtiene un sistema de ecuacio- nes lineales p^W" + •• + W = 0 con k = 0,..., n — 1. Por tanto, el determinante Det(Pw) debe ser igual a 0. Apliqúese fa parte (a) para llegar a una contradicción. El lector deberá reconocer el determinante de coe- ficientes principales como cierto tipo especial de determinante.] §4. La regla de Cramer Las propiedades de la sección precedente se pueden usar para probar una regla bien conocida para resolver ecuaciones lineales. Teorema 3. Sean A1, ..., A" vectores columna tales que D(A\ ..., A") ¿ 0. Sea B un vector columna. Si x¡,..., xn son números tales que XiA* + + x„A" = B, entonces para cada j = 1,..., rt tenemos que D(Al,..., B, ..., A") donde B aparece en la columna j en lugar de Aj.En otras palabras, «n t»i ••• Oi„ ^21 b2 tt2n ttnl bn * Una <hl " alJ ” aln a2l a2j ’ ‘ a2n «»i a„j a„„ (El numerador se obtiene de A al reemplazar la columna j-ésima, A’ por B. El denominador es el determinante de la matriz A.) El teorema 3 ofrece una manera explícita de determinar las coordenadas de B con respecto a A‘,..., A". Utilizando el lenguaje de las ecuaciones lineales, diremos que el teorema 3 permite resolver explícitamente en términos de deter- minantes, el sistema de n ecuaciones lineales con n incógnitas: ' F x„ain = bt, xt«m + • • + x„a„„ = b„. Vamos ahora a probar el teorema 3. Sea B como aparece en el enunciado del teorema y considérese el determi- nante de la matriz obtenida al reemplazar la columna j de A por B. Entonces D(A\...,B,...,A") = D(Al,..., x,4} + •• • + x„Al„, ..., A"). Empleando la propiedad t se obtiene una suma: D(Al, ..., xtA\ ..., A") + • • • + D(Al, XjAJ,..., A") + • • + D(Al, ..., x„A", ..., A"). que, nuevamente por la propiedad 1, es igual a xi^', • -, A', ..., A") + • • + XjD(A',..., A") + + xflA1,..., A",..., A"). En cada término de esta suma, excepto el término j-ésimo dos vectores columna son iguales. De donde cada término, excepto el término j-ésimo es igual a 0, de- bido a la propiedad 5. El término J-ésimo es igual a x7W, ..., A"), y es, por consiguiente, igual al determinante con el cual se comenzó, a saber, 0(4*,..., B ..., A"). Se puede resolver para Xj y obtener precisamente la ex- presión dada en el enunciado del teorema. La regla del teorema 3, que da la solución del sistema de ecuaciones lineales mediante el empleo de determinantes, se conoce como regla de Cramer. Ejemplo. Resuélvase el siguiente sistema de ecuaciones lineales: 3x + 2y + 4z = 1, 2x - y + z = 0, x + 2y + 3z = 1.
Jllllkll Hl l l k iiiVW i ini i i U111 • 184 ALGEBRA LJNEAL Nótese que la columna se desplaza de la primera columna al resolver para x, a la segunda columna a| resolver para y, a la tercera columna al resolver para z. El denominador en las tres expresiones es el mismo, a saber, es el determinante de la matriz de los coe- ficientes de las ecuaciones. Sabemos cómo calcular los determinantes de 3 x 3 y, por tanto, x = y = 0. z = j. Los determinantes permiten, además, determinar cuándo los vectores son li- nealmente independientes. Teorema 4. Sean A1, ..., A" vectores columna (de dimensión igual a n). Si son linealmente dependientes, entonces DÍA1,..., A") = 0. Si DÍA1..... A") 0, entonces A', ..., A" son linealmente independientes. Prueba. La segunda afirmación solamente es una formulación equivalente de la primera. En consecuencia, será suficiente probar la primera afirmación. Su- póngase que A¡,..., A" son linealmente dependientes. Podemos encontrar nú- meros xi, ...,x, no todos iguales a 0, tales que x¡A‘ + + x„A" = O. Supóngase que x7 # 0. Entonces, Xj/P = - S xk.4‘. i Nótese que no existe término j en el miembro derecho de la igualdad. Al dividir entre x, se obtiene A1 como una combinación lineal de los vectores Ak con k /j-
DETERMINANTES 1» Uj:n otras palabras, existen números yk(k / j) tales que ' ? = £ ykA\ \ MJ ¿ saber, y* = — *i/xv. Por linealidad, se obtiene •ü «V D(A', ..., A") = DÍA',..., X ykAk, ..., A") = £yJXA,,...,4‘,...,4-’) i/j (Con Ak en la columna j-ésima, y k ¿ j. En la suma que aparece a la doedta de ja igualdad, cada determinante tiene la columna k igual a la columna j-éshia y es, por consiguiente, igual a 0, debido a la propiedad 5. Esto prueba el teorema 4. Corolario. Si A', A’ son vectores columna de R" tales que D(A\ . A*) / 0, y si B es un vector columna de R", entonces existen números xk, - - > tales que x¡A' + •• + x„An = B. Prueba. Conforme al teorema, A1,..., A" son linealmente independíenles y, por tanto, forman una base de R". Por lo que cualquier vector de R" se puede escribir como una combinación lineal de A A". En términos de las ecuaciones lineales, este corolario muestra que: Si un sistema de n ecuaciones lineales homogéneas con n incógnitas tiene ana matriz de coeficientes cuyo determinante no es igual a 0, entonces este sistema tiene una solución que se puede determinar mediante la regla de Cramer. Ejercicios I. Resolver los siguientes sistemas de ecuaciones lineales: (a) 3x + y - z = 0 (b) 2x — y + z = 1 x + y + z = 0 x + 3y - 2z = 0 y - z = i 4x — 3y + z = 2 (c) 4x + y + z + w = 1 (d) x + 2y - 3z + 5w = 0 x - y + 2z — 3w = 0 2x + y — 4z — w = 1 2x + y + 3z + 5w = 0 x + y + z + H' = 0 x + y — z — w = 2 + x — y — z + w = 4 §5. Permutaciones (Nota. Al lector que sea alérgico a los argumentos combinatorios se le reco- mienda que estudie solamente los enunciados de las proposiciones y que omita las demostraciones.)
186 ALGEBRA LINEAL Trabajaremos solamente con permutaciones del conjunto de enteros {1,..., n), al cual denotaremos con J„. Por definición, una permutación de este conjunto es una aplicación a: {1,. .., n} -> de J„ en si mismo, tal que si i, j e J„e i / j, entonces a(ij a(/)- Si <r es una permu- tación de esc tipo, entonces el conjunto de enteros {<r(l),..., a(n)} (iene n elementos distintos entre sí y, por tanto, consta nuevamente de los ente- ros I....n en un arreglo diferente. Así, para cada entero j e J„ existe un entero único k, tal que <r(/c) = j. Se puede definir la permutación inversa denotada por o *, como Ja aplicación a~l : J„ -> J„ tal que a~‘(k) = entero único jeJ„ tal que a(j) = k. Si <r, t son permutaciones de J„, entonces podemos formar su aplicación compuesta a ° r, y esta aplicación será nuevamente una permutación. Con frecuencia, se omitirá el circulo pequeño y se escribirá ar para denotar la aplicación compuesta. Asi, (<tt)(¡) = o(r(i)) Por definición, para cualquier permutación a, tenemos <ra~‘ = id y a~'<j = id, donde id es la permutación identidad, esto.es, la permutación tal que ¿d(í) = i para todo i = 1,. .., n. Si <7|,..., ar son permutaciones de J„, entonces la inversa de la aplicación compuesta <Ti - • a, es la permutación a~ • • • o¡" *. Esto se verifica de manera fácil por multiplicación directa. L'na transposición es una permutación que intercambia dos números y que deja fijos los demás. La inversa de una transposición r es igual, obviamente, a la propia transposición r. de tal manera que t2 = id. Proposición 1. Cada permutación de J„ se puede expresar como un producto de transposiciones.
DETERMINANTES 187 Prueba. Probaremos esta afirmación por inducción sobre Para n = 1, no j)ay nada que probar. Sea n > 1 y supóngase que la afirmación está probada para n - 1. Sea a una permutación de J„. Sea a(n) = k. Si k # n, entonces sea x la trans- posición de J„ tal que x{k) = n y t(n) = k. Si k = n entonces t = id. Luego xa es una permutación tal que rafn = x(k) = n. "9 £n otras palabras, xa deja fijo a n. Por consiguiente, se puede considerar a xa í como una permutación de J„_,, y, por inducción, existen transposiciones ti,- • •, rs de Jn-i, que dejan fijo a n, tales que Tff = ti • • • T« Se puede escribir abora a = t-1Ti ••tJ = tti ••• t,. con lo que se prueba nuestra proposición. Ejemplo 1. Una permutación a de los enteros {1,.... n} se denota por r 1 ••• n ’ afl) ••• a(n) I Asi, L ri 2 3' [2 13 denota la permutación a tal que afl) = 2, cr(2) = 1 y o(3) = 3. Esta permutación es. de hecho, una transposición. Si a' es la permutación 12 3' 3 12' entonces aa' = a a' es la permutación tal que <t<t'(1) = <t(<7'(1)) = a(3) = 3, <t<t'(2) = <r(cr'(2)) = a(l) = 2. = cr(cr'(3)) = o(2) = 1. de tal manera que se puede escribir aa' = "1 2 3” 3 2 1’
ALGEBRA LINEAL DETERMINANTES 189 Además, la inversa de a' es la permutación '1 2 3" 2 3 1 tomo se comprueba de inmediato a partir de las definiciones: como = 3 e debe tener <r'H(3) = 1. Como a'(2) = 1, se debe tener ‘(1) = 2. Por último como <t'(3) - 2, se debe tener a'-1(2) = 3. Ejemplo 2. Se desea expresar la permutación como un producto de trasposiciones. Sea r la trasposición que intercambia 3 con 1 y que deja fijo a 2. Entonces, usando la definición, se tiene de tal manera que xa es una trasposición, que se denota con t'. Luego se puede escribir xo - x, de tal manera que o = t-,t' — tt' debido a que r~l = t. Este es el producto deseado. Ejemplo 3. Exprésese la permutación 1 2 3 4" 2 3 4 1 como un producto de trasposiciones. Sea t l la trasposición que intercambia 1 con 2 y que deja fijos a 3 y 4. En- tonces, fl 2 3 4 Tlff-[1 3 4 2/ Ahora, sea r2 la trasposición que intercambia 2 con 3 y que deja fijos a 1 y 4. Entonces ri 2 3 4~i fe Proposición 2. A cada permutación o de J„es posible asignarle un signo 1 ó — 1, denotado con e(o), que satisfaga las sigédPies condiciones: 1 (a) Si x es una trasposición, entonces t(r) = — 1. (b) Si a. a' son permutaciones de J„, entonces e(aa') - e(cr)€(cr'). Realmente, si A ~ (A1,..., A") es una matriz den x n, entonces e(o) se puede definir mediante la condición D(A°m,AaM) = , A"). Prueba. Nótese que (A*1”,..., A*w) es simptóiente, una ordenación dife- rente de (A ..., A"). Supóngase primero que trabamos con una transposición x, tai que r(i) = j, xlj) = i para i j y rfk) = k si k i» k í- Digamos que i < j. Considérese el determinante D(. ..,Af. ...A1,...) = DÍA'"’,..- • ’ donde A¡ aparece en el lugar i-ésimo y A' aparece el lugar y-ésimo. Haciendo una sucesión de intercambios de columnas adyacentes, se mueve A1 un paso a la derecha cada vez, hasta que aparece en el lugattf — Ij-ésimo. Esto envuelve j — i — 1 intercambios. Después se intercambia a A'-'CPn A', de tal manera que AJ vuelva a quedar en el lugar y-ésimo, y asi se halla determinante £>(....., A'. A/..). Finalmente se intercambian las columnas adyacentes, con lo que A' regresa al lugar i, lo que implica y — i — 1 intercambios. Entonces, se obtiene D[AtW,A’00) = (- ly-i+j-*- 'BJA1,..., A") = (—l)Z)(A,....,A"). Por consiguiente, e(t) =—1. Después, supóngase que «r es una permutación de J„. Entonces, D(Aa<t),..., A”™) = +DIA',..-, A"), y el signo + ó — está determinado por o y no depende de A1..A". Ciertamente, al hacer una sucesión de trasposiciones, se puede llevar (A""’,... . A"'"’) a la ordenación estándar A1,..., A"; cada una de las trasposiciones cambia al deter- minante por un signo. Así, entonces, se puede definir se ve que t2tiu es una trasposición que se puede denotar por r3. Entonces se obtiene t2Tj<t = x3, de tal manera que 0 = T|T2T3- para cualquier selección de A1,..., A" cuyo determinante no sea igual a 0; por ejemplo, los vectores unitarios E". Por supuesto, hay muchas maneras de
190 ALGEBRA LINEAL aplicar una sucesión de trasposiciones para llevar a (/T’1’,..., /T*"’) a la orde- nación estándar, pero como el determinante es una función bien definida, se deduce que el signo í(a) también está bien definido y es el mismo, no importa qué camino se escoja. Así, entonces, ..., 4O<"’) = e(<7)£>(4 *,..., /i"), y esto, naturalmente, es válido, aun si D(A*,..., 4") = 0, debido a que en este caso, ambos miembros de la igualdad son iguales a 0. Finalmente, sean a y a' permutaciones de J„. Sea C1 = A°,J) para j = 1, ..., n. Por una parte se tiene (♦) DC*""01. ..., <4'”") = e(a'a)D(Ai, ..., 4"), y por la otra D(4’'<’”),..., D(C<’,1), ..., CaW) = e(c)D(C\ ..., C) = A°'M) (♦*) = • • •. >4"). S'-an A1, A" los vectores unitarios . En. A partir de la igualdad entre (*) > (+*), se concluye que e(ff’a) — e(a')e(a), lo que prueba asi la proposición. Corolario 1. Si una permutación a de J„ se expresa como un producto de trasposiciones, a = ti • ts, donde cada t¡ es una trasposición, entonces s es par o impar de acuerdo con e(<r) ~ 1 ó — 1. Prueba. Se tiene e(<r) = €(T.i)-e(T,) = (-1)5, de donde la afirmación es evidente. Corolario 2. Si a es una permutación de J„, entonces, e(<r) = «(a-1). Prueba. Se tiene 1 = e(id) = «(aa-1) = í(<7)€(<t-1). Por tanto, e(cr) y «(a-1) son ambos iguales alo bien son iguales a — 1, que era lo deseado. Con respecto a la terminología, una permutación se llama par si su signo es 1, y se llama impar si su signo es — 1. Asi. toda trasposición es impar.
DETERMINANTES 191 Ejemplo 4. El signo de la permutación a que aparece en el ejemplo 2 es igual ;11, debido a que a = tt'. El signo de la permutación a que aparece en el ejemplo 3 cs igual a — 1, debido a que a — X|t2t3. Ejercicios 1. Determinar el signo de las siguientes permutaciones: P1 2 3] (b) p 2 3* (c> 1 2 3" (a) 2 3 d l3 1 2 3 2 1 '1 2 3 4 1 2 3 4] 1 2 3 4 (d) 2 3 1 4 (e) _2 1 4 3j (0 3 2 4 1 '1 2 3 4 (h) "1 2 3 41 (i) 1 2 3 4 (g) 4 2 1 3 3 1 4 2| 2 4 1 3 2. En cada uno de los casos del ejercicio 1, escribir la inversa de la permutación corres- popdkpte. (fl^Jemostrar que el número de las permutaciones impares de para n ¿ 2 es igual al número de las permutaciones pares. [Sugerencia: sea t una transposición. Demos- trar que la aplicación a t-* ta determina una aplicación que es tanto inyectiva como supra- yectiva entre las permutaciones pares y las impares.] §6. Unicidad Son necesarias algunas observaciones referentes al desarrollo de los determi- nantes. Se generalizará el formalismo de la bilinealidad. que se discutió en el ca- pítulo VI. §4, y se estudiará primero el caso de 3 x 3. Sean X1, X2, X2 vectores en R3 y sea (ó;j)(i, j = 1..3) una matriz 3x3. Sean 41 = buXl + í>2lX2 + b3IX3 = ¿ bklXk k= I /l2 = b12X* + b22X2 + b32X3 = ¿ bnX1 i= i A3 = bt3X' + Ó23X2 + b33X3 = ¿ m= 1 Entonces, se puede desarrollar usando la linealidad. D(A', A2, A3) = d( ¿ bkiXk, ¿ bl2X, ¿ bm3X-) \*=1 Í=1 m=l / = ¿ bkiDÍxk, ¿ bl2X‘, ¿ Z>m3A'">) *= 1 \ 1= 1 m= 1 / = z í bkibl2D (Xk, X1, ¿ óm3A"") k= 1 1= l \ m= 1 / = í i. ¿ bkibl2bm3D(Xi,X,,X”). k= 1 l- 1 m= 1 luununtnununnnnui
192 ALGEBRA LINEAL O, af escribir en otra forma el resultado, se encuentra el desarrollo: 3 3 3 D(A‘,A2,A3) = E E E b„bl2bm3D(X*,X,,X’”) k= 1 1=1 m= 1 Si se desea obtener un desarrollo análogo para el caso de n x n, se debe, obvia- mente. ajustar la notación, o sea que no se emplearán las letras k, l, m. Así, en lujjar de usar k, /, m, se observa que estos valores k, l, m, corresponden a una se- lección arbitraria de un entero igual a 1, ó a 2, ó a 3 para cada uno de los nú- meros 1, 2, 3 que aparecen como segundo indice en b(J. Per lo que, si se denota con o dicha selección, entonces se puede escribir k = <r(l), / = <r(2), m = <r(3) y bklbllbmi — baii^ibüiij^batl^í- Así, a: {1,2,3} -» {1,2,3} no es otra cosa que una asociación (esto es, una fun- ción) de J ( a J4 y se puede escribir: D(A',A2,A3) = efectuando la suma para todas las a posibles. Se encuentra una expresión para el determinante que corresponde al desarro- llo de seis términos para el caso de 3 x 3. Al mismo tiempo, nótese que las pro- piedades usadas en la prueba son solamente las propiedades 1, 2 y 3 y sus con- secuencias 4, 5 y 6, de tal manera que la prueba se aplica a cualquier función D que satisfaga estas propiedades. Primero se da el argumento para el caso 2x2. Sea una matriz 2 x 2 y sean \c “/ sus vectores columna. Se puede escribir A1 = aE‘ + cE2 y A2 = bE' + dE2,
DETERMINANTES 193 Solide E1, E2 son los vectores columna unitarios. Entonces D(A) = D(A', A2) = D(aEl + cE2, bEl + dE2) = abDlE', E1) + cbD(E2, El) + adD(El, E2) + cd£>(E2, E2) = -bcD(El, E2) + adD(E¡,E2) = ad — be. ♦ r Esto prueba que cualquier función D que satisface las propiedades básicas de un determinante está determinada por la fórmula del §1, a saber: ad — be. La prueba para el caso general es completamente análoga, tomando en cuenta jas n componentes. Se basa en un desarrollo semejante al que acabamos de usar en el caso 2 x 2. Se puede formular en un lema. Lema. Sean X1,..., X* n vectores en un espacio de n dimensiones. Sea B = una matriz de n x n y sean A1 = buX1 + + bB1X" 4" = b^X1 + + bmX”. Entonces D(A\ .... 4") = £ • b^,nD(X\ ..., Xa\ donde la suma se efectúa sobre todas las permutaciones o de {1,..., n}. Prueba. Hay que calcular D(b¡lX1+ - + bnlX\ .... blnXl + + brJ¡X"). Usando la propiedad de la linealidad con respecto a cada columna se puede es- cribir esta última expresión como una suma o donde <r(l)..... ofn) denotan una selección de un entero que se encuentra entre 1 y n para cada valor de 1,..., n. Asi, cada una de las a es una aplicación del conjunto de los enteros {1,..., n} en si mismo y la suma se efectúa sobre todas estas aplicaciones. Si alguna a asigna el mismo entero a distintos valores i, j que se encuentran entre 1 y n, entonces el determinante tiene dos columnas iguales y por lo tanto es igual a 0. En consecuencia, se puede calcular la suma sólo para
194 ALGEBRA LINEAL aquellas a que son tales que o(i) ± ff(j) siempre que i j, o sea: por las permuta- ciones. Por la proposición 2 del §5, se tiene D(X°"\ ..., %'<">) = e(<r)D(X‘, .... X"). Sustituyendo esto último por la expresión de D(Al, ..., A") obtenida anterior- mente, se halla la expresión deseada del lema. Teorema 5. Los determinantes están determinados en forma única por las propiedades 1,2 y 3. Sea A = (ay.) El determinante satisface la expresión D(y4', . . . , A") — Sí(<r)íl<r(l),l ’ ’ ' a donde la suma se efectúa sobre todas las permutaciones de los enteros {1, ..., n}. Prueba. Supóngase que XJ = Ej es el vector unitario que tiene 1 en la com- ponente j-ésima y hagamos que aparezca en el lema b¡j = a^. Como, por hipó- tesis, se tiene £>(E‘, ..., E”), se ve que la fórmula d?I teorema 5 se cumple de in- mediato. Ejercicios 1. Demostrar que cuando n = 3, el desarrollo que aparece en el teorema 5 es la expresión de seis términos dada en el §2. 2. Seari A', ..., A’ vectores columna de dimensión igual a n y supóngase que son ]j- nealmente independientes. Demostrar que DIA’,..., 4”) # 0. [Sugerencia: expresar cada uno de los vectores unitarios estándar E'......E” considerados como vectores columna, como combinaciones lineales de A'.....A". Usando el hecho de que D(E'...., E”) = 1 y las propie- dades 1 y 2, probar el enunciado.] Así, en vista del teorema 3, ahora se puede decir que A‘. ..., A* son linealmente dependientes si y sólo si Dt?!1, ..., A") = 0. f 3. iean V, V' espacios vectoriales. Supóngase que tenemos un producto, definido entre parBjís de elementos de P y denotado por v A w para t>, w elementos de V. Supóngase que los valores del producto están en el espacio P', esto es, v A w es un elemento de V para todo r.w en P. Supóngase que el producto satisface las siguientes condiciones: AP 1. Se tiene (u -t- v) A w = u A w + v A w y u A (u + w) = u A t> + u A w para todo u, v, w en V. Además, para cualquier número c, leu) A v = c(u A u) = u A AP 2. Se tiene u A u = 0 para todo u en P.
DETERMINANTES 195 E probar los siguientes enunciados: I- (a) Tenemos que u A w = ~|»Au. i' (b) Sea 2 un elemento de V y supóngase que V = R2. Sean e\e2 los dos vectores unita- frios de K2. Demostrar que un producto que satisface API, AP 2 y la condición de que e1 A e2 I -s z está determinado en forma única por estas tres condiciones. , ,/ (cl^Sean z,, z2, z3 elementos de V y sea V = R3. Sean e’,e2,e3 los tres vectores unitarios : de R3- Demostrar que un producto que satisface AP 1, AP2 y las condiciones e1 A e2 = zH el A e3 = zz, e1 A e3 = z3 está determinado en forma única. [Sugerencia: expresar elementos arbitrarios de V en tér- minos de los vectores unitarios y desarrollarlos.] Compárese (c) con las fórmulas para el producto vectorial dadas en el capitulo 1. Nó- tese que el producto vectorial satisface AP 1 y AP 2. Un producto que satisface estas con- diciones se conoce como un producto alternante. 4. Sean V y V espacios vectoriales y considérese un producto como el que se describe en el ejercicio 2 que satisface fas condiciones AP 1 y AP 2. (a) Supóngase que dim V = 2. Demostrar que el conjunto de todos los elementos V A w con v, w en K, es un subespacio de V', de dimensión igual a 0 ó a 1. (b) Supóngase que dim V = 3. Sea U' el subespacio de V generado por todos los ele- mentos v A w con v, w en K Demostrar que U' tiene dimensión 3. § 7. Determinante de una transpuesta Teorema 6. Sea A una matriz cuadrada. Entonces, Det(4) = Det(',4). Prueba. En el teorema 5, se tenia (♦) Det(4) = ZXoKtD.i • • • a Sea a una permutación de {1, ..., n}. Si <r(/) = k, entonces <r— *(k) — j. Por consiguiente, podemos escribir: ~ ak.<r ->(*)• En un producto cada entero k desde 1 hasta n aparece precisamente una vez entre los enteros n(l), ..., ff(n). Por tanto, este producto se puede escribir como / y la suma (*) es igual a £ '(1) @n,a~
196 ALGEBRA LINEAL DETERMINANTES 197 debido a que e(a) = e(<7~ *). En esta suma, cada término corresponde a una mutación a. Sin embargo, a medida que a varía sobre todas las permutaciones, asi también lo hace a’1 debido a que una permutación determina su inversa ej’! fmma única. De donde la suma es igual a (♦*) Ee(<r)a1>on)- • a„.,w. ¡5 prueba. Se tiene 1 = D(¡) = D(AA~') = D(Á)D(A '). Esto prueba lo que se Quería- La suma (**) es, precisamente, la suma dada por la forma desarrollada del de (errninante de la transpuesta de A. Con lo que se ha probado lo que se quería. §9. Inversa de una matriz Consideremos primero un caso especial. Sea i) \C d) § 8. Determinante de un producto Vamos a probar la siguiente regla importante: ' ir <. una matriz de 2 x 2 y supóngase que su determinante ad — be + 0. Se desea hallar ^una inversa para A, esto es, una matriz 2x2 W Teorema 7. Sean Ay B matrices de n x n. Entonces, Det(AB') = Det(4) Det(B). tal 4ue AX = XA = /• El determinante de un producto es igual al producto de los determinantes. Prueba. Sean A = (a,7) y B = (bjt): (all aln\/bn bih Óln\ Uní Unn j y * * bnk * bnn / Sea AB = C y sea C* la columna /c-ésima de C. Entonces por definición, C* = b¡kAl + • • • + bnnA”. Asi, D(AB) = £>(C‘, ...,C) = D{bi 1A1 + • • • + bniA", ..., blnAl + •• • + bn„A”). Si se desarrolla esta última expresión, empleando el lema anterior al teorema 5. se halla una suma Considérese el primer requerimiento, AX = 1, que al desarrollarse aparece en la forma siguiente: (a b\íx y\ _/l 0\. ye dj\z wj \0 1J Sea la primera columna de AX. Hay que resolver las ecuaciones ax + bz = 1, ex + dz = 0. Este es un sistema de dos ecuaciones con dos incógnitas, x y z, que ya se sabe cómo resolver. Análogamente, al observar la segunda columna, vemos que se debe resolver un sistema de dos ecuaciones con dos incógnitas y, w, a saber: ay + bw = 0, cy + dw = 1. D{AB) = E bailKl b,M.nD(A*" ..., 4””’) a <r Conforme a la fórmula que se encontró para los determinantes, esta última ex- presión es igual a D(B]D(A), como se quería demostrar. Ejemplo. Sea Corolario, Sea A una matriz invertible de n x n. Entonces, Det(4~*) = Det(4)”‘. Se busca una matriz X tal que AX = 1. sistemas de ecuaciones lineales 2x + z = 1, 4x + 3z = 0. y Por consiguiente, hay que resolver los 2y -j- w = 0, 4y + 3w = 1.
198 ALGEBRA LINEAL Empleando el método ordinario para resolver dos ecuaciones con dos incógnitas x = 1, z = — 1, y y — — z, w = 1. Así, la matriz es tal que AX = /. El lector puede verificar por multiplicación directa que también XA — I. Esta es la solución deseada. Análogamente, en el caso de 3 x 3, se hallarían tres sistemas de ecuaciones lineales correspondientes a la primera, a la segunda y a la tercera columnas. Cada uno de los sistemas se puede resolver para obtener la matriz inversa. Demos ahora el razonamiento general. Sea A una matriz de n x n. Si B es una matriz tal que AB = 1 y BA = / (/ = matriz unitaria de n x n), entonces se dice que B es una inversa de A y se escribe B = A" *. Si existe una inversa de A, entonces esta inversa es única. Cier- tamente, sea C una inversa de A. Entonces CA = I. Multiplicando el término de la derecha por B, se obtiene CAB = B. Pero CAB = C(AB) = CI = C. De donde C - B. Un argumento análogo es aplicable para AC — I. Teorema 8. Sea A = («.y) una matriz n x n y supóngase que D(A) # 0. En- tonces A es invertible. Sea Ei el vector columna unitario J-ésimo, y sea , _ D(Al, ..., EJ, ..., A") ij D(A) donde EJ aparece en el lugar i-ésimo. Entonces la matriz B = es una inver- sa para A. Prueba. Sea X = (A'j,) una matriz indeterminada n x n. Se quiere hallar la solución para las componentes xi; de tal manera que satisfagan AX = I. De la definición de productos de matrices, esto significa que para cada j se debe re- solver EJ = XijA' + + x„-A". Este es un sistema de ecuaciones lineales que se puede resolver en forma única mediante la regla de Cramer y asi obtener = D{A',...,E¡. ...,An) que es la fórmula dada en el teorema.
DETERMINANTES 199 Todavía hay que probar que XA = 1. Nótese que £>('/!) 0. Por tanto, por lo que ya se ha probado, se puede hallar una matriz Y tal que ‘AY — i. Tomando transpuestas, se obtiene 'YA = I. Ahora tenemos / = ’Y(/4XM = ’YA(XA) = XA, con lo que se prueba lo que se quería, a saber que X = B es una inversa para A. • Se pueden desarrollar las componentes de la matriz B que aparece en el teo- rema 8, de la siguiente manera: un 0 ••• uIn «ji •• 1 % a„t ••• 0 •• a„„ Si se desarrolla el determinante que aparece en el numerador, según la columna i. todos los términos excepto uno son iguales a 0 y, por tanto, se obtiene el nume- rador de b¡j como un subdeterminante de Det(/4). Sea Ay la matriz obtenida de A al eliminar la fila i y la columna j. Entonces , (-iy+J DetMjO y DetM) (¡nótese la inversión de los índices!), y asi se obtiene la fórmula A 1 = transpuesta de I------D~t(4)— Una matriz cuadrada cuyo determinante es 0, o en forma equivalente, que admite una inversa, se conoce como no singular. Ejercicios 1. Hallar las inversas de las matrices que aparecen en el ejercicio 1, del §3. 2. Usando el hecho de que si A y B son matrices n x n. entonces Det(4B) = Det(A)Det(B). probar que una matriz A. tal que DetM) = 0.- no tiene inversa. 3. Expresar explícitamente las inversas de las matrices 2x2: b' d tlili1111111111111111111111111111
200 ALGEBRA LINEAL DETERMINANTES 201 4. Si A es una matriz n x n cuyo determinante es ? 0 y si B es un vector determinado en el espacio n-dimensional, entonces demostrar que el sistema de ecuaciones lineales AX = g tiene una solución única. Si B = O, esta solución es X = O. § 10. El rango de una matriz y subdeterminantes Puesto que los determinantes se pueden usar para probar la independencia lineal, los mismos se pueden emplear para determinar el rango de una matriz. Ejemplo 1. Sea /3 1 2 5\ A= 1 2-1 2 I \1 1 0 1 / Esta es una matriz 3 x 4. Su rango es cuando más igual a 3. Si se pueden encon- trar tres columnas linealmente independientes, entonces se sabe que su rango es exactamente igual a 3. Pero el determinante 3 1 2 1 2 -1 1 1 C no es igual a 0 (a saber, es igual a —3, como se puede ver al restar la segunda co- lumna di la primera y después desarrollando según la última fila). Por tanto, el rango de A — 3. Puede suceder que en una matriz 3x4, algún determinante de una submatriz. 3 x 3 sea igual a 0, pero que la matriz 3x4 tenga rango igual a 3. Por ejemplo, sea / 3 1 2 5 \ B= 1 2-1 2 1. \4 3 11/ l'l determinante de las primeras tres columnas 3 1 2 1 2-1 4 3 1 es igual a 0 (de hecho, la última fila es la suma de las dos primeras). Pero el de- terminante 12 5 2-1 2 3 1 1 no es igual a cero (¿a qué es igual?), por lo que, nuevamente, el rango de B es igual a 3. I ; Si el rango de una matriz 3x4 (ci 1 C12 c13 c,*\ C2l c22 c23 C24 I C31 C32 c33 C34 f es igual a 2 ó menos, entonces el determinante de toda swbmatriz 3x3 debe ser iguífi a 0, ya que de otra manera se podría razonar como antes se hizo para ob- tener tres columnas linealmente independientes. Nótese que hay cuatro de los mencionados subdeterminantes, obtenidos al eliminar sucesivamente una cual- quiera de las cuatro columnas. Recíprocamente, si todo sobdeterminante del tipo considerado, de toda submatriz 3 x 3, es igual a 0, entonces es fácil de compro- bar que el rango es, a lo más, igual a 2. Ya que si el rango fuera igual a 3, enton- ces habría tres columnas linealmente independientes y so determinante no seria igual a 0. Así, entonces, se pueden calcular tales subdeterminantes para obtener una estimación del rango y después usar el procedimiento de prueba y error, y algún criterio, para obtener el rango exacto. Ejemplo 2. Sea /3 1 2 5\ C = I 1 2-1 2 j. \4 3 1 7 / Si se calcula cada subdeterminante 3 x 3, se hallará sólo 0. Por tanto, el rango de C, es, cuando más, igual a 2. Sin embargo, las dos primeras filas son lineal- mente independientes, por ejemplo, debido a que el determinante 3 1 1 2 no es igual a 0. Este último és el determinante de las primeras dos columnas de la matriz 2x4 /3 1 2 5\ \1 2-1 1) Por tanto, el rango es igual a 2. Por supuesto, si se observa que la última fila de C es igual a la suma de las dos primeras filas, entonces se ve de inmediato que el rango es 2. Ejercicios Calcular los rangos de las siguientes matrices: 1 1 5 2 /3 5 ! 4\ 2. 2 -1 1 1 \ 5 4 2 5/
202 ALGEBRA LINEAL /3 5 1 4\ 4.1 2 — 1 1 1 I | 7 1 2 5/ '2 1 6 6\ 7 3 1 1-1 5 2 7 5 \8 3 8 4/ I-' -1 \ 2 1 6 5l • 2 3 2 5 4 1 O 1/ ‘ 1 -1\ 4 3 2 9 7 3 4 2 1/ §11. Interpretación de los determinantes como área y como volumen Resulta interesante ver que el determinante se pueda interpretar como un volumen. Primero discutiremos el caso de 2 dimensiones, y así podremos hablar de área, aunque escribiremos Vol para representar al área de una figura de 2 di- mensiones para conservar la terminología que se generaliza a dimensiones ma- yores. Considérese el paralelogramo generado por los vectores v, n Consideramos v, w como vectores columna, y así se puede formar su determinan- te D(u, w). Este determinante puede ser positivo o negativo, puesto que D(v, w) = -D(w, v). Entonces el determinante en sí no puede ser igual al área de este paralelogramo. ya que el área siempre es ¡2 0. Sin embargo, vamos a probar el siguiente teorema: Teorema 9. El área del paralelogramo generado por v, w es igual al valor absoluto del determinante, a saber: |£>(v, w)|. Para probar el teorema 9 es necesario presentar la noción de área orientada. Sea P(v, w) el paralelogramo generado por v y w. Denótese con Vol0(t’, w) el área de Pft), w), si el determinante D(v, w) 2: 0, y se antepone un signo menos al área de P(v, w), si el determinante £>(v, w) < 0. Así, entonces, al menos Volo(f, w) tiene el mismo signo que el determinante y se dirá que Vol0(f. w) es el área orientada-
DETERMINANTES 203 Designamos con Vol0(v, w) al área del paralelogramo generado por v y w. De k ¿onde Vol0(v, w) = + Vol(v, w). | Para probar el teorema 9, será suficiente probar que: E El área orientada es igual al determinante. En otras palabras, । ' 9 Vol0(v, w) = D(v, w). Ahora bien, para probar esto será suficiente probar que satisface las tres propiedades características de un determinante, a saber: 1. Vol0 es lineal en cada una de las variables vyw. 2. Vol0(t>, a) = 0 para todo v. 3. Volo(£’, E2) = 1 si £*, £2 son vectores unitarios estándar. Sabemos que estas tres propiedades caracterizan a los determinantes y esto se probó en la sección que trató sobre la unicidad, el §6. Por considerar que es conveniente para el lector, repetimos el argumento en forma breve. Supóngase que una función g satisface estas tres propiedades (con g se reemplaza Vol0). En- tonces, para cualesquiera vectores v = a£* + cE2 y w = b£‘ + dE2 se tiene g(aE' + cE2,bE' + dE2) = abg(E',E') + adg(E',E2) + cbg(E2, £‘) + cdg(E2,E2). El primero y el cuarto términos son iguales a 0. Por el ejercicio 1. <?(£2. £‘) = -glE'.E2) . y. por tanto. g[v. w) = (ad — bc)g(E', E2) = ad — be. Esto prueba lo que se quería. Con el objeto de probar que Voln satisface las tres propiedades, usaremos propiedades sencillas del área (o del volumen) como la siguiente: el área de un segfnento de recta es igual a 0. Si A es una cierta región, entonces el área de A es t igqal que el área de una traslación de A, esto es, igual al área de la región A„ tque consta de todos los puntos v + w con v e A). Si A y B son regiones ajenas entre si o tales que. al considerar sus puntos comunes se tiene un área igual a 0. entonces Voi(A u B) = Vol(A) + Vol(B). unnnnnnnnnnnnnniif
204 ALGEBRA LINEAL DETERMINANTES 205 Ahora consideremos Volo. Las últimas dos propiedades resultan obvias. Ciertamente, el paralelogramo generado por v, v es simplemente un segmento de recta y su área en dos dimensiones es, por consiguiente, igual a 0. Asi, la pro. piedad 2 se satisface. Por lo que se refiere a la tercera propiedad, el paralelogramo generado por los vectores unitarios El, E2 es simplemente el cuadrado unitario cuya área es igual a 1. De donde, en este caso, se tiene Vol0(£‘,£2) = 1. I.a propiedad más difícil es la primera. Ahora el lector debería, si es que no lo ha hecho ya, leer las aplicaciones geométricas, del §5 del capitulo IV, antes de leer el resto de esta prueba, la cual se basa en consideraciones geométricas referentes al área. El siguiente lema es necesario. Lema 1. Si v, w son linealmente dependientes, entonces Vol0(v, w) = 0. Prueba. Supóngase que podemos escribir av + bw = 0 con a o b # 0. Sea a # 0. Entonces, b v —-----w = cw a de tal maneia que v, w están sobre la misma recta y el paralelogramo generado por v, »v es un segmento de recta (figura 2). De aquí queVol0(v, w) = 0, lo que prueba el lema. Figura 2 También se sabe que cuando v, w son linealmente dependientes, entonces D(v, w) — 0, por lo que en este caso trivial, el teorema está probado. En los lemas subsecuentes se supone que v, w son linealmente independientes. Lema 2. Supóngase que v, w son linealmente independientes y sea n un entero positivo. Entonces, Vol(nv, w) = n Vol(v, w). Prueba. El paralelogramo generado por nv y w consta de n paralelogramos, tal y como se muestra en la siguiente figura. Estos n paralelogramos son, simplemente, las traslaciones de P(v, w)determinadas por v, 2v,..., (n - l)t? y cada traslación de P(v, w) tiene la misma áre* P(v, w). Estas traslaciones solamente tienen en común segmentos de recta y, por lo tanto, Vol(nv, w) — n Vol(v, w) tal y como se deseaba. Corolario. Supóngase que v, w son linealmente independientes y sea n un entero positivo. Entonces, Vol 0 o, ± Vol(v, w). Si m y n son enteros positivos, entonces, Vol (— v, = — Vol(v, w). I n J n Prueba. Sea vt = (l/n)v. Por el lema, se sabe que Vol(nvi,w) = n Volívj.w). Esto es solamente una reformulación de la primera afirmación, puesto que niq = v. Por lo que sS refiere a la segunda afirmación, se escribe m/n = m • 1/n y se aplican sucesivamente los enunciados probados: Vol i m • - v, w | = m Vol i - v, w | ' \ n J \n ) = m--Vol(v, w) = ™ Vol(v, w).
206 ALGEBRA LINEAL DETERMINANTES 207 Lema 3. Vol( — v, w) — Vol(f, w). Prueba. El paralelogramo generado por — v y w es una traslación determi- nada por — r, del paralelogramo P(v, w). Por tanto, P(v, w) y P( —v, w) tienen la misma área. (Ver la figura 4.) para cualquier número real c y cualesquiera vectores v, w. Ciertamente, si v, w son linealmente dependientes, entonces ambos miembros son iguales a 0. Si u, tv son linealmente independientes, usamos la definición de Vol0 y los lemas 3 y 4. Sea D(v, w) > Oye es negativo, c = — d. Entonces, D(cv, w) g 0 y, por consiguiente, Vol0(c», w)= — Vol(cu, w) = — Vol( — dv, w) • f = — Vol(Jt), w) — — dVol(», w) = c Vo!(v, w) = c Vol0(f, w). Un argumento análogo es válido cuando D(y, w) 0. Por consiguiente, se ha probado una de las condiciones de la linealidad de la función Volo- La propiedad análoga es válida, por supuesto, para la otra componente, a saber: Vol0(t>, cw) = c Vol0(v, H>). Para la otra condición, nuevamente se tiene un lema. Lema 5. Supóngase que v, w son linealmente independientes. Entonces, Lema 4. Si c es cualquier número real > 0, entonces Vol(ct>. w) = c Vol(t>. w). Prueba. Sean r, r' números raciónales tales que 0 < r < c < r' (figura 5). Entonces, P(rv, w) c: P(cv, w) <= P(r'v, w). De donde, por el lema 2, r Vol(v, w) = Vol(rv, w) Vol(ct>, w) Vol(r'v, w) = r1 Vol(v, w). Haciendo que r y r' se aproximen a c como limite, se tiene Vol(cv, w) = c Vol(u, w). como se tenia que mostrar. Partiendo de los lemas 3 y 4 se puede probar ahora que Vol(ü w, w) = Vol(v, w). Prueba. Hay que probar que el paralelogramo generado por v, w tiene la misma área que el paralelogramo generado por v + w, w. Vol0(cv, w) = c Vol0(v, w) El paralelogramo generado por », w consta de dos triángulos Ay B, tal como se muestra en la figura. El paralelogramo generado por v + w y w consta del
208 ALGEBRA LINEAL DETERMINANTES 209 triángulo B y de la traslación de A determinada por w>. Como A y A 4- vv tienen la misma área, obtenemos: Vol(t?, w) = Vol(i4) + Vol(B) = Vol(/4 + w) + Vol(B) = Vol(t> + w, w), como se quería mostrar. Ahora estamos en posición de trabajar con la segunda propiedad de la linea- lidad. Sea w un vector fijo no nulo en el plano y sea i> un vector tal que {v, w} es una base del plano. Probaremos que para cualesquiera números c, d se tiene que (1) Vol0(cn + dw, w) = c Volo(», H’). Realmente, si d = 0, entonces esto no es otra cosa sino lo que previamente se demostró. Si d 0, entonces, de nuevo por lo que se demostró previamente, d Vol0(ce + dw, w) = Volo(cu + dw, dw) = c Vol0(w, dw) = cd Vol0(f, w). Dividiendo entre d, se obtiene la relación (1). A partir de esta última fórmula, se infiere ahora la linealidad. Ciertamente, si t>i = c,v + diw y v2 = c2v + d2w, entonces Vol0(vi + v2, w) = VolofíC] + c2)v + (di + d2)w, w) = (ci + C2) Vol0(f, w) = c, Vol0(t’, w) + c2 Vol0(f, w) — Volofi l, **’) + Volo(t’2, w). Esto concluye la prueba de que Vol0(v, w) = D(v, w), y, por tanto, queda probado el teorema 9. Observación 1. La prueba que se acaba de hacer es un poco larga, aunque cada uno de los pasos dados es bastante sencillo. Además, cuando se desea gene- ralizar la prueba a espacios de mayor dimensión (incluso al espacio de 3 dimen- siones), se puede hacer una prueba completamente análoga. La razón para que esto sea asi, es que las condiciones que caracterizan un determinante envuelven solamente dos coordenadas a la vez y, así, siempre se lleva a cabo en algún plano bidimensional. Manteniendo fijas todas las coordenadas excepto dos, la prueba anterior se puede extender de inmediato. Así, por ejemplo, en el espacio de 3 di- mensiones se denota con P(u, v. w) la caja generada por los vectores u, v, w (fi- gura 7), a saber: todas las combinaciones Sea Vol(u, v, w) el volumen de esta caja. Entonces Vol(u, v, w) = |D(«, v, w)| es nuevamente el valor absoluto del determinante. Observación 1. Se han empleado propiedades geométricas del área a fin de desarrollar la prueba anterior. Se puede fundamentar todo esto en forma puramen- te analítica. Si el lector está interesado, puede ver mi libro Analysis I. Observación 3. En el caso especial de 2 dimensiones, realmente se podría haber dado una prueba más sencilla de que el determinante es igual al área. Pero preferimos hacerlo de manera un poco más complicada, debido a que es lo que nos permite generalizar al caso de 3 dimensiones o al caso de n dimensiones. Daremos una interpretación del teorema 9 en términos de aplicaciones lineales. Dados los vectores v, w en el plano, se sabe que existe una aplicación lineal única L : R2 - R2 tal que L(£’) = v y L(£2) = w. De hecho, si v = aE* + c£2, w = i>£’ + dE2, entonces la matriz asociada con la aplicación lineal es Za íA \c d) Además, si se denota con C el cubo unitario generado por £*, £2 y por P el para- lelogramo generado por vyw, entonces P es la imagen bajo L de C, esto es, L(C) = P. Realmente, como se ha visto, para 0 t¡ 1 se tiene 4- (2^ "I" Í3W con L(t1£1 + t2E2) = tiUE1) + t2L(E2) = ttv + t2w. 0^ t, á 1.
210 ALGEBRA LINEAL DETERMINANTES 211 Si se define el determinante de una aplicación lineal como el determinante de syl matriz asociada, concluimos que (*) (Area de P) = ¡Det(L)|. Considérese un ejemplo numérico: el área del paralelogramo generado por l^] vectores (2,1) y (3, — 1), (figura 8), es igual al valor absoluto de i 2 1 = -5 3 -1 y, por lo tanto, es igual a 5, | Teorema 10. Sea P el paralelogramo generado por dos vectores. Sea L: R2 -»R] una aplicación lineal. Entonces, Area de L(P) = |Det L| (Area de P). Prueba. Supóngase que P está generado por dos vectores v, w. Entonces Uf está generado por L(r) y L(w). (Refiérase a la figura 9). Existe una aplicación linea Li: R2 -» R2 tal que Li(£’) = v y ¿i(£2) = w. >L(w) (a) (b) (c) Figura 9 I Entonces P = Lj (C), donde C es el cuadrado unitario y I L(P) = L(L,(C)) = (Lo Lt)(C). f por lo que se probó anteriormente en (*), se obtiene Vol L(P) = |Det(Lo L,)| = |Det(L) Det(Lj)| = |Det(L)| Vol(P), qtfe prueba así el enunciado. Corolario. Para cualquier rectángulo R con los lados paralelos a los ejes y para cualquier aplicación lineal L: R2 -> R2, se tiene Vol L(R) = |Det(L)| Vol(R). u = (a, c) c2^2 EHH3||M| --- Figura 10 Prueba. Sean ct,c2 las longitudes de los lados de R. Sea Rj el rectángulo ge- nerado por CjE1 y c2E2. Entonces R es la traslación de Rj determinada por algún vector, digamos R = R¡ + u. Entonces, L(R) = L(Rj + u) = L(R,) + L(u) es la traslación de L(Rt) determinada por L(u). (Refiérase a la figura 10). Como el área no cambia bajo traslaciones, sólo es necesario aplicar el teorema 8 para concluir la prueba. Ejercicios 1- Si g satisface los primeros dos axiomas de un determinante, probar que g(v,w) = — g(w,v) para todos los vectores i>, w. Este hecho se empleó en la prueba de la unicidad. [Sugerencia: desarrollar g(v + w, v + w) = 0]. 2. Determinar las áreas de los paralelogramos generados por los siguientes vectores: (a) (2,1) y (-4.5) (b) (3,4) y (-2,-3)
jiiiimmmmmimiiiiii ni 212 ALGEBRA LINEAL 3. Determinar el área de cada paralelogramo de tal manera que tres de los vértices cada uno de ellos estén determinados por los siguientes puntos: (a) (1,1), (2, -1),(4,6) (b) (-3,2),(1,4),(-2, -7) (c) (2, 5),(-1,4),(1,2) (d) (1,1),(1,0),(2,3) 4. Determinar el volumen de cada paralelepípedo generado respectivamente por los si- guientes vectores en el espacio de 3 dimensiones: (a) (1,1,3),(1,2,-1),(1,4,1) (b) (1,-1,4),(1,1,0),(-1,2,5) (c) (—1,2,1),(2,0,1),(1,3,0) (d) (-2,2,1),(0,1.0),(-4,3,2)
SEGUNDA PARTE TEOREMAS de ESTRUCTURA

i CAPITULO VIII i • 9. í Formas bilineales y los operadores estándar §1. Formas bilineales Sea K un campo y sean V, W espacios vectoriales sobre K. Recordemos que una aplicación g: V x W -> K se llama bilineal si satisface las siguientes propie- dades: BI1. Para todo v¡, v2eV y weW se tiene que g{»i + »2, w) = g(yi, w) + g(y2, w) y para todo ve V y wj, w2 e IT se tiene que g(v, wj + w2) = g(v, wj + g(v, w2). BI 2. Para todo ceK, veV y weW, g(cv, w) = cg(v, w) = g(y, cw). Por lo tanto, se puede decir que una aplicación bilineal es una aplicación tal que para todo v e V, la aplicación w >-> g(v, w) es lineal y para todo w 6 W, la aplicación » h» g(v, w) es lineal. Si no hay necesidad de referirse explícitamente a la aplica- ción g, se escribirá frecuentemente g(t>, w) = <v, w>. Así, entonces, las propiedades son análogas a las correspondientes propiedades del producto escalar. Si los espacios V y W son iguales al mismo espacio V, de tal manera que g aplique a V x V en K, entonces se dice que g es una forma bilineal sobre V. Son estas las aplicaciones con las que trabajaremos en este capítulo. Si g, g': V x V K son formas bilineales sobre V, entonces se puede consi- derar su suma g + g'. Nuevamente es una forma bilineal. Si ceK, entonces cg es una forma bilineal. Así, el conjunto de las formas bilineales sobre V es un espacio vectorial sobre K, que se denota por Bil(F x V, K) o simplemente por Bil( V) si la referencia a K no se presta a confusión. En el capitulo VI, §4, se relacionaron las formas bilineales con las matrices. Considerando que los dos espacios son iguales entre sí y teniendo en cuenta una 215
216 ALGEBRA LINEAL I kk H k k k k k kk4 k kk k4 k k k k evidente propiedad de linealidad, se tiene como consecuencia inmediata Z teorema 11, capitulo VI, §4: Teorema 1. Si C = (c¡j) es una matriz n x n y gc es la forma bilineal sobre jp determinada por 0C(X, Y) = ‘XCY. Entonces, la asociación gc es un isomorjismo entre Bil(K" x K”, K) y el espacio de las matrices n x n enft Se dice que la matriz C que aparece en el teorema 1, representa la fonm bilineal. Una forma bilineal denotada por <,> da origen, por tanto, a un cierto tip< de producto entre elementos de V. A menudo, se considerarán tales producía de sumas. Sean t>b ..., t>,y vvm elementos de V. Entonces, se puede des» rroliai el producto <l’l + •• + V„, w,, . . ., wm> = <t>i, W] + • • • + wm> + • • • + <V„, W| !-• + wm> = <t’i, Wi> + •• + <fi, wm> + • •• + <r’„, «!> + • • + <v„, w,) En esta suma, cada uno de los términos es del tipo <v¡, w¡) con i = 1,..., nj / 1, . .., m. Así, entonces, esta suma se puede abreviar de la manera siguiente n m E E <v.-, *,> ¡= i j=i o más aún, E <r¡, Wj>, ¡,j si la referencia a los indices i, j no es causa de confusión. Por ejemplo, <t’ + w, v + w) = <t/, r) + <u, w> + <w, + <w, w>. Dado que puede suceder que <f, w> / <w, v> en general, no es posible simpfé licar más. ? Se dice que una forma bilineal g: V x V K es simétrica si g{v, w) = g(w, v)
FORMAS BILINEALES Y LOS OPERADORES ESTANDAR 217 para todo v, w e V. Asi, una forma bilineal simétrica no es otra cosa que un pro- ducto escalar, tal y como se definió en el capitulo VI. Corolario. Una matriz C n x n en K representa una forma bilineal simétrica si y sólo si es una matriz simétrica. Prueba- Supóngase que C es simétrica, esto es, que 'C = C. Como para todo la matriz ’XCY es una matriz 1 x 1, es decir, un elemento de K es igual a su propia traspuesta. En consecuencia. ’XCY = '(’XCY) = ’Y’C'X = ’YCX. Esto muestra que C representa una forma bilineal simétrica. Reciprocamente, supóngase que C representa úna forma bilineal simétrica; por ejemplo: que ’XCY = ’YCX para todo X, Ye K". Como ’YCX = '(’YCX) = ’X’CY = ’X’CY, se tiene ’XCY = ’X’CY para todo X, Y e K" y, en consecuencia, C = ‘C; en otras palabras, la matriz C es simétrica. Ejemplo. La matriz / 1 -2 3\ C=1—2 1 1 \ 3 1 4/ es una matriz simétrica. Sean ’A’ = (X],x2, x3) y'Y = (yi,y2,y3)- Si g es la forma bilineal asociada, entonces, g(X, K) = Xiyi - 2x2yt + 3x3yi - 2x^2 + x2y2 + *3?2 + 3x¡y3 + x2y3 + 4x3y3 = g(Y,X). Sea V un espacio vectorial de dimensión finita sobre K y sea g: V x V K una forma bilineal. Sea {n1( una base de V. Sean v, w elementos de V y escríbanse estos elementos en términos de la base: v - x¡Vi + ••• + x„v„, w = yjVj +---------1- y„v„- Entonces, g(v, w)= £ Xiyjg(v¡, vj). ¡,j=i Si se tiene c¡j = g(v¡, vj), entonces, n g(»,w) = £ c^yj. i.J=l
218 ALGEBRA LINEAL Por tanto la forma bilineal se puede expresar en términos de los vectores de coor- denadas X, Y y de la matriz C = (ci?), precisamente como en el ejemplo 1. Supóngase que la forma g es simétrica. Si {iq, es una base ortogonal, entonces g(v¡, v¡) = 0 si i / j. En con- secuencia, la matriz (cy) es una matriz diagonal, por ejemplo: / c¡ 0 •• 0\ 0 c2 •• 0 | \ ó ó •• • cn] entonces se dice que la forma está diagonalizada. Luego el producto escalar está dado en términos de los vectores de coordenadas con respecto a la base orto- gonal mediante la expresión más simple siguiente: g(y, w) = CjXiyi + • • + c„x„y„. Si {e(, ..., t>„} es una base ortonormal sobre los números reales, en donde, además, g(v¡, t>¡) = 1, entonces en este caso, g(v, w) = xiy, + • • • + x„y„ es, simplemente, el producto escalar. Concluimos esta sección con el estudio de los cambios de coordenadas. Sea C una matriz cuadrada que representa una forma bilineal g. Así, la forma bilineal está determinada por g(X, K) = 'XCY en términos de los vectores de coordenadas X y Y. Supóngase que cambiamos las bases en el espacio vectorial. Existe una matriz N no singular, tal que X = NX' y y = NE', si A" y Y' son los vectores de coordenadas con respecto a la otra base. En ese caso, se tiene 'XCY = '(NX')CNY' = 'X"NCNY'. En consecuencia, con respecto a los vectores de coordenadas X', Y', la matriz que representa la forma es 'NCN. Así, a diferencia del cambio de matriz de una aplicación lineal (que cambia median- te la inversa), la matriz de una aplicación lineal cambia mediante la traspuesta. Ajustándonos a la notación que aparece en el capitulo V, §3, vemos que N no es otra cosa que N = M“(id).
FORMAS BILINEALES Y LOS OPERADORES ESTANDAR 219 Ejercicios 1. Sea g escrita como < , >, la forma bilineal sobre Rs, cuya matriz asociada con respec- to a la base estándar, es (1 2 3\ -111 1 0 1/ Hallar dos vectores X, Y en R ', tales que <Y, 2. Hallar la matriz asociada con g con respecto a la base {(1,1,0), (0,1,0), (1,1,1)}, si g es la forma que aparece en el ejercicio 1. 3. (a) Sea V un espacio vectorial sobre el campo K y supóngase que V es una suma di- recta, V — W¡ ® 1^2, de subespaáos W,, W2. Sea gt una forma bilineal simétrica sobre y sea g2 una forma bilineal simétrica sobre W2. Demostrar que existe una forma bilineal única g sobre V tal que si v = + v2 y w = w1 + w2 son elementos de V, con vt, wteWt y v2, w2eW¡, entonces g(y,w) = gi(vt, w,) + g2(v2,tv2). (b) Si áf| es una base para Wt y 3t2 es una base para ¿cómo es la matriz de la forma g con respecto a las bases 9ltH2 de VI 4. Sea V el espacio vectorial sobre R que consta de todos los polinomios de grado S n. Si f,ge V, sea <f,9> = í’/UMOdL Hallar la matriz de este producto escalar con respecto a la base {1, r.í"}. 5. Sea V el espacio vectorial sobre R cuya base es {sen t, eos t}. Defínase el producto escalar como </.9> = J* f(t)g(t)dt. ¿Cuál es la matriz de este producto escalar con respecto a la base dada? 6. Sea V un espacio vectorial de dimensión finita sobre el campo K y sea g una forma bilineal sobre V, escrita como < , >. (a) Demostrar que para cada w e V, la aplicación v >-» <p, w> es una funcional Lw sobre V y que la aplicación wh L, es una aplicación lineal de V en el espacio dual V*. (b) Demostrar que las siguientes condiciones son equivalentes: (i) El núcleo de la aplicación L, dada anteriormente, es {O}. (ii) La aplicación L es un isomorfismo entre V y V*. (üi) Si C es la matriz que representa la forma bilineal con respecto a una base de V, entonces Det(C) + 0. Se dice que una forma bilineal que satisface las tres condiciones anteriores es no degenerada.
220 ALGEBRA LINEAL 7. (a) Recíprocamente, sean V y W espacios vectoriales de dimensión finita sobre j< Sea y :V x ¡V -> K una aplicación bilineal, expresada como g(v, m) = <r, w). De. mostrar que a cada pareja de bases Si de V y ¡Ü' de W se le puede asociar una matriz C, tal que, si ve V y we W, y X = Mu (r), Y — M.v' (w), entonces, = ’XCY. (b) Sea y : V x W -» K una aplicación bilineal, expresada como < , >. Para cada w<= EV demostrar que la aplicación de V en K determinada por Lw :vt-> <e, w> es una funcional sobre V y que la aplicación w -» es una aplicación lineal de W en el espacio dual V*. (c) Demostrar que las siguientes condiciones son equivalentes: (i) La aplicación L : W -» V* es inyectiva (su núcleo es {O}). (ii) Si C es una matriz asociada con y, como en (b), entonces C tiene rango igual a n, donde n — dim W. 8. Una matriz cuadrada C se conoce como antisimétrica si ’C = - C. Una forma bili- neal g sobre K’ se llama alternante si g(X, X) = 0 para todo X e K”. Probar que una matriz C representa una forma alternante si y sólo si es antisimétrica. §2. Formas cuadráticas Sea Vun espacio de dimensión finita sobre el campo K. Sea g = <,} una forma bilineal simétrica sobre V. Una forma cuadrática determinada por g será la función f: K lal que f(v) = g(v, i?) = <t?, p>. Ejemplo 7. Si V = K", entonces f(X) = X • X = xí + • • • + x* es la forma cuadrática determinada por el producto escalar ordinario. En general, si V = K" y C es una matriz simétrica en K, que representa una forma bilineal simétrica, entonces la forma cuadrática está determinada como una función de X mediante f(X) = 'XCX= ¿ cijXiXj. 0=1 Si C es una matriz diagonal, por ejemplo: /c¡ 0 ••• 0\ c = p c2 • • • ° \Ó Ó ••• c.j j
7 FORMAS BILINEALES Y LOS OPERADORES ESTANDAR 221 entonces la forma cuadrática tiene una expresión más simple, a saber: /W = CiX2, + •• + c„x¡¡. Nuevamente, sea K un espacio vectorial de dimensión finita sobre el campo K. Sea g una forma bilineal simétrica y sea f su forma cuadrática. Entonces, sus va- lores^de g se pueden recuperar completamente a partir de los de f, ya que para v, tveK <v, w> = |[<v + w, t> + w> — - w, v - w>] o, empleando g, f, ¿(v, w) = + w) - J(v - w)]. Además, hay la fórmula <u, = i[<u + w, v + w> - <v, v> - <w, »v>]. La prueba es sencilla al hacer el desarrollo empleando la bilinealidad. Por ejemplo, para la segunda fórmula, se tiene <t> + W, V + W> - <U, v) - <W, M>> = <t>, v> + 2<i?, w> + <w, w> — <t>, v) — <w, w> = 2<v, w>. Dejaremos como ejercicio la comprobación de la primera fórmula. Ejemplo 2. Sea V = R2 y supóngase que 'X = (x, y) denota los elementos de R2. La función f, tal que f(x, y) = 2x2 + 3xy + y2 es una forma cuadrática. Vamos a determinar la matriz de su forma bilineal simé- trica g. Se expresa esta matriz de la manera siguiente: /a b\ y se debe tener o sea, en otras palabras, 2x2 + 3xy + y2 — ax2 + 2bxy + dy2.
7.?:¿ ALGEBRA LINEAL De donde se obtiene a = 2,2b = 3 y d = 1. Por consiguiente, la matriz es 3 I 1 C = Ejercicios 1 Sea V un espacio vectorial de dimensión finita sobre un campo K. Sea una función y supóngase que la función g tal que 9(v, w) = J(v + w) - f(v) - f{w) es bilineal. Supóngase que f(av) = a2f(v) para todo ve V y ae K. Demostrar que f es una forma cuadrática y determínese una forma bilineal de la cual provenga. Demostrar que esta forma bilineal es única. 2 . ¿Cuál es la matriz asociada de la forma cuadrática /(X) = x2 — 3xy + 4y2 si X = (x, y, z)? fySea f: R" » R una función con segunda derivada continua, tal que f(tX) = t2f(X] pata todo X gR”. Demostrar que f es una forma cuadrática. (Para hacer esto, el lector ne- vc-sita recuirír a algunas fórmulas del cálculo en varias variables.) 4. Sean x,, x2, x3, x4 las coordenadas de un vector X y sean y2,y3,y4 las coordenadas de un vector Y. ¡expresar, en términos de estas coordenadas, cada forma bilineal asociada con las siguientes formas cuadráticas. (a) Xjx2 (b) Xjx3 + x4 (c) 2xtx2 - x3x4 (d) x2 - 5x2x} + x4 5. Demostrar que si f¡ es la forma cuadrática de la forma bilineal g, y si f2 es la forma cuadrática de la forma bilineal g2, entonces ft + f2 es la forma cuadrática de la forma bi- lineal <ji + g2. §3. Operadores simétricos Sea V un espacio vectorial de dimensión finita sobre un campo K. En esta sección se supone que V tiene una forma bilineal simétrica fija, no degenerada, denotada con <, >. Si el lector lo desea, puede considerar que V = K" y también puede considerar la forma bilineal fija como el producto escalar ordinario <x, y> = ‘xy, donde X y Y son vectores columna de K". Una aplicación lineal de V en sí mismo se llama un operador. Sea A: V V un operador. Entonces podemos definir por medio de A, una forma bilineal sobre V, mediante la aplicación (v, w) i-* (Av, w>
FORMAS BILINEALES Y LOS OPERADORES ESTANDAR 223 para v, w e V. La verificación de que ésta es, ciertamente, una aplicación bilineal es trivial. Recíprocamente, cada forma bilineal se puede representar de esa manera. Teorema 2. Sea V un espacio vectorial de dimensión finita sobre el campo K, con una forma bilineal simétrica no degenerada <, >. Sea g cualquier forma bilineal sobre V. Entonces existen operadores únicos A y B de V, tales que g(v, w) = (Av, w> = <v, Bw> para todo v,weV. Prueba. Para cada w e V, la aplicación L„: v g(v, w) es una aplicación lineal de V en K, es decir, una funcional. En el teorema 15 del capitulo VI, §6, vimos que toda funcional sobre V se puede representar mediante un elemento único de V, es decir, existe un elemento único w' de V tal que, para todo v e V, se tiene Lw(v) = <p, w’>. La asociación w >-> w' es, por consiguiente, una aplicación de V en sí mismo, que se denota por B. Asi, w' = Bw y produce la fórmula g(v, w) = <t>, Bw> para todo v,weV. La aplicación B es lineal. Con el objeto de comprobar esto último, supóngase que w1; w2 e V y que w'i, w'2 e V son tales que g(v, wi) = <v, Wj> y g(v, w2) = <v, w'2> para todo v g V. Entonces, g(v, wj + w2) = g(v, w2) + g(v, w2) = <»,*'!> + <v, w'2> = <», w'j + w'2>. Por tanto, B(wt + w2) = Bwi + Bw2 Por consiguiente, si ceK, entonces, g(v, cwi) = cg(v, Wj) = c<¡?, w'f} = <v, cw'ff Por tanto, B(cwj) = cB(wi). Esto prueba que B es lineal. El hecho de que B está determinado de manera única se debe a que para cada w sabemos que existe un elemento único w' = Bw. tal que g(v, w) = <t>, Bw> para todo ve K
224 ALGEBRA LINEAL Como la forma < , > es simétrica, se podía haber considerado además la ap|¡. cación lineal w >-♦ g(v, w) para cada v e K y así entonces existe un operador único 4 lal que g(v, w) = w> para todo i>, we K Esto prueba el teorema. Con respecto al teorema se dice que el operador A representa la forma g Por definición, el operador B que aparece en la prueba anterior se conoce como el traspuesto de A y se denota con ‘A. Si ‘A = A, entonces se dice que el operador A es simétrico (con respecto a la forma simétrica fija no degenerada <,». Para cualquier operador A de V, se tiene, por definición, la fórmula (Av, = <u, 'Awj para cualesquiera v, we V. Si A es simétrico, entonces {Av, w> = <t>, Aw) y re- ciprocamente. Ejemplo I. Sea V = K" y supóngase que el producto escalar ordinario es la forma simétrica. Entonces, se puede considerar A como una matriz en K y los ele- mentos de Kn como los vectores columna X, Y. Su producto escalar se puede expresar como una multiplicación matricial, <X, E> = 'XY. Se tiene <4X,Y> ='(AX)Y =’X'AY = (XAAYj, donde, ahora, ’A denota la traspuesta de la matriz A. Por tanto, cuando se trabaja con el producto escalar ordinario de n-uplas, el traspuesto del operador está representado por la traspuesta de la matriz asociada. Esta es la razón por la que se ha usado la misma notación en ambos casos. Un operadoi simétrico A da origen a una firma cuadrática f, tal que f(v) = <4n, v), conocida como la forma cuadrática determinada por A. Ejemplo 2. Sea V = R2 y sea A la matriz Entonces la forma cuadrática determinada por A (considerada como una apli- cación lineal de R2 en sí mismo) está dada por /3 5\ íx\ f(x,y) = (x,y)( )í = 3x2 + lO.xy + 13/. \5 \3J\yJ
FORMAS B1LINEALES Y LOS OPERADORES ESTANDAR 225 Finalmente, el traspuesto satisface el siguiente formalismo: Teorema 3. Sea V un espacio vectorial de dimensión finita sobre el campo K, con una forma bilineal simétrica no degenerada <, >. Sean A y B operadores de V y sea c e K. Entonces, ‘(A + B) = ‘A + 'B ‘(AB) = ‘B'A ‘(cA) = ¿A “A = A Prueba. Se probará sólo la segunda fórmula. Para todo v, w e V, tenemos que (ABv, w> = = (v,'B'Aw). Por definición, esto significa que '(AB) = 'B'A. Las otras fórmulas son igualmente fáciles de probar. Ejercicios 1. (a) Una matriz A se conoce como antisimétrica si 'A = — A. Demostrar que cualquier matriz M se puede expresar como una suma de una matriz simétrica y de una matriz antisimétrica y que estas últimas están determinadas de manera única. [Su- gerencia: sea A = )(M + ’M).] (b) Si A es antisimétrica, entonces A2 es simétrica. (c) Sea A antisimétrica. Demostrar que Det(A) es igual a 0 si A es una matriz de n x n y n es impar. 2. Sea A una matriz simétrica invertible. Demostrar que A~‘ es simétrica. 3. Demostrar que una matriz simétrica triangular es diagonal. 4. Demostrar que los elementos diagonales de una matriz antisimétrica son iguales a 0. 5. Sea V un espacio vectorial de dimensión finita sobre el- campo K con un producto escalar no degenerado. Sean »0, w0 elementos de V. Sea A : V -» V la aplicación lineal tal que A(v) = <v0, u>wo- Describir ‘A. 6. Sea V el espacio vectorial sobre R de los polinomios de grado g 5. Definir el produc- to escalar como de costumbre, mediante <f,9>= í' f(t)9(‘)dt. Jo Describir la traspuesta de la derivada D con respecto a este producto escalar. 7. Sea V un espacio de dimensión finita sobre el campo K con un producto escalar no degenerado. Sea A:V~* V una aplicación lineal. Demostrar que la imagen de 'A es el espa- cio ortogonal al núcleo de A. 8. Sea V un espacio de dimensión finita sobre R con un producto escalar definido posi- tivamente. Sea P:V ->V una aplicación lineal tal que PP = P. Supóngase que 'PP ~ P'P Demostrar que P = ’P.
226 ALGEBRA LINEAL (9. Se dice que una matriz A real simétrica de n x n es definida positivamente si ‘XAX > Q para todo X / 0. Si A y B son simétricas (del mismo tamaño), entonces se define A < fí al decir que B - A es positiva. Demostrar que si A < B y B < C, entonces A < C. I 10. Sea V un espacio vectorial de dimensión finita sobre R, con un producto escalar de- finido positivamente < , >. Se dice que un operador A de V es positivo si (Av, i>) g 0 para todo v e V, v O. Supóngase que V = W + IV1 es la suma directa de un subespacio W y su complemento ortogonal. Sea P la proyección sobre IF y supóngase que W ¿ {O}. De- mostrar que P es simétrica y positiva. 11. Manténgase la notación como la que aparece en el ejercicio 10. Sea c un número rea] y sea A el operador definido por ( Av = cw si se puede escribir v = w + w' con we W y w'e Wl. Demostrar que A es simétrica. < 12. Manténgase la notación como aparece en el ejercicio 10. Nuevamente sea P la pro- yección sobre W. Demostrar que existe un operador simétrico A tal que A2 = / + P. \ / 13. Sea A = (a,j) una matriz real o compleja de m x n. Definir una generalización del " f valor absoluto, a saber: t |>4| = mn • max o (No debe haber confusión con el determinante, el cual no aparece en este contexto.) Si A y 11 B son matrices que se pueden sumar entre si, demostrar que | M + ®l á MI + 14 II Si se pueden multiplicar entre si, muéstrese que I Hb| á M| |b|. 1 Si c es un número, entonces demostrar que l M| = |c|M|. \ 14. Sea A una matriz real simétrica. Demostrar que existe un número real c tal que A + el \ es positiva. 15. Sea V un espacio vectorial de dimensión finita sobre el campo K con una forma bi- lineal no degenerada < , >. Si A : V -» V es una aplicación lineal, tal que </lt>, Aw) = <t>, paratodo v, weV, entonces demostrar que Det (4) = +1. UltySea Q = = 1, ..., n) una matriz cuadrada de funciones q¡j (infinitamente de- rivSBles y evaluadas en los reales) de una variable real. Denótese con Y = '(yj, ..., y„) un vector columna de funciones. Sea Sc el conjunto de todos los Y tal que Y' = QY. Demostrar que Se es un espacio vectorial (sobre R). Sea <I> = *(<¡f>t, ..., <p„) un vector columna de funciones y sea <<I>. Y> = <piyt + + <p„y„.
FORMAS BILINEALES Y LOS OPERADORES ESTANDAR 227 Sea I> la derivada. Defínase D aplicada a una matriz de funciones como la matriz que se ob- tiene al aplicar D a cada una de las componentes. Demostrar que Y> = <M>, Y> + <O,DY> = <(D + 'CYK, Y>. por inducción, probar que para cualquier entero positivo k, Y> = <(D + Y>. ’lf. Sea A una matriz real simétrica # O. Demostrar que tr (A, A) > 0. 18. Sean A y B matrices simétricas del mismo tamaño sobre el campo K. Demostrar que AB es simétrica si y sólo si AB = BA. §4. Operadores hermitianos Sea V espacio vectorial de dimensión finita sobre los números complejos. Supon- gamos que Vtiene un producto hermitiano definitivamente positivo denotado con <, >. Un producto hermitiano también se conoce como una forma hennitiana. Si el lector lo desea, puede considerar que V = C" y puede tomar al producto hermitiano fijo como el producto estándar <X,Y> ='XX donde X, Y son vectores columna de C”. Sea A: V -» V un operador, esto es, una aplicación lineal de V en sí mismo. Para cada w e V, la aplicación Lw: C tal que Lw (v) = <Av, w> para todo v e Ves una funcional. Teorema 4. Sea V un espacio vectorial de dimensión finita sobre C con una forma hermitiano definida positivamente <, ). Dada una funcional L sobre V, existe un único w'e V tal que L(v) = para todo ve V. Prueba. La prueba es análoga a la que se efectuó para el caso real, a saber la del teorema 15' del capitulo VI, §6. Se deja al lector efectuar la mencionada prueba. A partir del teorema 4, se concluye que dado w existe un único w' tal que (A’J, H’'> para todo ve V. Observación. ¡La asociación w*—>LW no es un isomorfismo de V con el espacio dual! En efecto, si a e C, entonces L. = Sin embargo, esto no importa para la existencia del elemento
’28 algebra lineal La aplicación w w' de Len si mismo será denotada por A*. Por definición, tenemos la fórmula (Av, w) = <r>, 4*w> para todo re W. La aplicación A* es lineal; para esta última afirmación se recomien. da al lector que suministre todos los detalles para su comprobación. La prueba es análoga a la del caso de las formas simétricas y nada se interpone para la lineali- dad de A*. Se dice que A* es el adjunto de A. Es el único operador que satisface la fórmula precedente. Ejemplo. Sea V — C" y la forma es, en este caso, la forma estándar dada por (x,y)i-> 'xy= <x,y>, para Y vectores columna de C". Entonces, para cualquier matriz A que repre- senta una aplicación lineal de V en si mismo, tenemos </L¥. E> = ‘(AX)Y = ‘X’AY = ’X^ÁY). Además, por definición, el producto (AX, Y> es igual a <X,4*y>= ‘X(A*Yj. Esto significa que A* = ‘A. Se ve que no habría sido razonable usar el mismo símbolo t para el adjunto de un operador sobre C, como para el traspuesto sobre R. Se dice que un operador A es hermitiano o (autoadjunto) si A* = A. Esto significa que para todo v, w e V tenemos </4r, = <u, Aw). En vista del ejemplo precedente, una matriz cuadrada A de números complejos se conoce como hermitiana si ’A = A, o en forma equivalente, 'A = A. Si A es una matriz hermitiana, entonces se puede definir sobre C" una forma hermitiana, mediante la regla |X,Y)hW (Verificar en detalle que esta aplicación es un producto hermitiano.) La operación * satisface reglas análogas a las de la traspuesta, a saber:
FORMAS BILINEALES Y LOS OPERADORES ESTANDAR 229 |' Teorema 5. Sea V un espacio vectorial de dimensión finita sobre C con una f forma hermitianafija definitivamente positiva ( , >. SeanAyB operadores de Vy [ sea a e C. Entonces, | (A + B)* = A* + B* (AB)* = B*A* (aA)* = aA* $A** = A. ‘ f- Prueba. Vamos a probar la tercera regla y se dejan las otras dos para que el lector las demuestre. Tenemos que para todo v, we V: w) = w) = a<y, A*wj — <u,54*w). Esta última expresión también es igual, por definición, a y en consecuencia (a/í)* = áA*, como se afirmó. El teorema análogo del teorema 2 para operadores hermitianos: Teorema 6. Sea V un espacio vectorial de dimensión finita sobre los números complejos, con una forma hermitiana definida positivamente <, >. Sea g otra forma hermitiana sobre V. Entonces, existe un operador hermitiano único A de V. tal que para todo v, w e V, g(v, w) = (Av, w). Prueba. La prueba es completamente análoga a la del teorema 2 y se le dejará al lector. Con relación al teorema 6 se dice que el operador A representa la forma g. Se tiene el análogo de las formas cuadráticas para las formas hermitianas. Sea g una forma hermitiana, representada por el operador A. Se define el análogo de la forma cuadrática como la función / tal que f(t>) = (Av, v). Se tiene la identidad de polarización: (A(v + w),v + tv) — <A(v — w), v — i>> + (.Av, w>] para todo v, w e V, o también + w), v + w) — (/tu, u> — </lw, w) = (Av, + (Aw, f>. Las verificaciones de estas identidades se hacen en forma trivial, sólo desarrollando el miembro izquierdo que aparece en las ecuaciones.
230 ALGEBRA LINEAL Teorema 7. Sea V como antes. Si A es un operador tal que </4v, = Q para todo v eV, entonces A = O. Prueba. El miembro izquierdo de la identidad de polarización, es igual a 0 para todo v, w e V. De donde se obtiene {Aw,v) + w) = 0; para todo v, w e V. Reemplácese v por iv. Entonces, por las reglas para el producto hermitiano, se obtiene — i(Aw, i’> + i(Av, w) — 0 por lo que — <4w, + (Av, w> = 0. Sumando esta relación y la relación obtenida anteriormente, se tiene 2</lv, w> = 0; por tanto, (Av. w> = 0. De donde A = 0, como s§ quería demostrar. Teorema 8. Sea V como antes. Sea A un operador. Entonces A es hermitiano si y sólo si (Ai;, u> es real para todo v c V. P. ueba. Supóngase que A es hermitiano. Entonces v> = <v, Av> = (Av, t’>. Como un número complejo que es igual a su conjunto debe de ser un número real, se concluye que (Av, es real. Recíprocamente, supóngase que (Av, t>> es real para todo v e V. Entonces, (Av, t>> = <4t>, = <v, Av> = v>. De donde <(4 — A*)v, v> = 0 para todo ve Vy, por el teorema 7, se concluye que i - A* = O, de donde A — A*, como se quería demostrar. Ejercicios 1. Sea A una matriz hermitiana invertible. Demostrar que A~‘ es hermitiana. 2. Demostrar que el análogo del teorema 7, cuando V es un espacio de dimensión finita sobre R, es falso. En otras palabras, puede ocurrir que Av sea perpendicular a v para todo ve V, ¡sin que A sea la aplicación nula! 3. Demostrar que el análogo del teorema 7, cuando V es un espacio de dimensión finita sobre R, es cierto si se supone, además, que A es simétrica.
FORMAS BILINEALES Y LOS OPERADORES ESTANDAR 231 4. ¿Cuáles de las siguientes matrices son hermitianas? 2 \ /i 2\ / * 1 + < 5\ . s) ,bH t' • (c) 1 2 ' I 5/ \ 2 5‘J \ 5 -i 7/ E 5. Demostrar que los elementos de la diagonal de una matriz hermitiana son reales. k ~ & Demostrar que una matriz hermitiana triangular es diagonal. E 7. Sean A y B matrices hermitianas (del mismo tamaño). Demostrar que A + B es her- E mitiana. Si AB = BA, entonces demostrar que AB es hermitiana. | 8. Sea V un espacio vectorial de dimensión finita sobre C con una forma hermitiana definitivamente positiva. Sea A : V -> V un operador hermitiano. Demostrar que tanto 1 + ¡A como / — ¡A son invertibles. [Sugerencia: si c / O, entonces demostrar que ||(f + »4)e|| # 0.] 9. Sea A una matriz hermitiana. Demostrar que 'A y A son hermitianas. Si A es inver- tible, entonces demostrar que A ~1 es hermitiana. ~ 10. Sea V un espacio de dimensión finita sobre C, con una forma hermitiana definida positivamente < , >. Sea A: V -» V una aplicación lineal. Demostrar que las siguientes con- ' diciones son equivalentes: (i) Sea AA* = A*A. (ii) Para todo t>e V, ||z4t>|| = ||4*o|] (donde ||v|| = t>>). (iii) Se puede escribir A = B + iC, donde B y C son hermitianas y BC = CB. 11. Sea A una matriz hermitiana no nula. Demostrar que tr (44*) > 0. §5. Operadores unitarios Sea V un espacio vectorial de dimensión finita sobre R con un producto escalar definido positivamente. Sea A: V -* V una aplicación lineal. Se dirá que A es una aplicación unitaria real si {Av, 4w> = {v, w> para todo v, w e V. Se puede decir que A es unitaria cuando A preserva el producto. En la literatura podrá encontrar que una aplicación unitaria real también se conoce como aplicación ortogonal. La razón del por qué se emplea el término unitaria aparece en el siguiente teorema. Teorema 9. Sea V un espacio como el que se acaba de mencionar. Sea A: V-» V una aplicación lineal. Las siguientes condiciones sobre A son equivalentes: (1) A es unitaria. (2) A preserva la longitud de los vectores, esto es: para todo ve V se tiene IHVII = IHI- (3) Para cada vector unitario v e V, el vector Av también es un vector unitario. iiniiniinuiittimnmnnn
1 232 ALGEBRA LINEAL Prueba. Se dejar;» al lector el probar la equivalencia entre (2) y (3). Que (¡j implica (2) es obvio, ya que el cuadrado de la norma (Av, Av^ es un caso especial de un producto. Recíprocamente, probemos que (2) implica (1). Se tiene </l(y + vv), /4(i> + w)> — {A(v — w), zl(y — w)> = 4<Xy, Xw). Usando la suposición (2) y observando que el miembro de la izquierda consta délos cuadrados de las longitudes, se ve que el miembro de la izquierda de la ecuación es igual a (y + w, v + — (y — w, v — w) lo que también es igual a 4<y, w>. De todo esto, se deduce la prueba del teorema. El teorema 9 muestra el por qué se llaman unitarias las aplicaciones: se carac- terizan por el hecho de que aplican vectores unitarios en vectores unitarios. Por supuesto, una aplicación unitaria U preserva la perpendicularidad, esto es, si r, w son perpendiculares, entonces Uv, Uw también son perpendiculares, ya que <t/y, Uw) — <y, vv> = 0. Por otra parte, no es cierto que una aplicación que preserva la perpendicularidad es necesariamente unitaria. Por ejemplo, sobre los números reales, la aplicación que manda un vector y sobre 2v preserva la perpendicularidad, pero no es unitaria. Desafortunadamente, la terminología estándar designa las aplicaciones unitarias reales como aplicaciones ortogonales. Queremos enfatizar que tales aplicaciones hacen algo más que preservar la ortogonalidad: también preservan la longitud. Teorema 10. Sea V un espacio vectorial de dimensión finita sobre R con un producto escalar definido positivamente. Una aplicación lineal A : V -» V es unitaria si y sólo si 'AA = I. Prueba. El operador A es unitario si y sólo si (Av, Aw) = <y, w) para todo v, w e V. Esta condición es equivalente a (,‘AAv, w> = <y, w> para todo y, w e V y, por tanto, es equivalente a 'AA = I. Sólo falta interpretar en términos de matrices la condición de que A es unitaria. Primero se debe observar que una aplicación unitaria es invertible. Ciertamente, si A es unitaria y Av = O, entonces v = O, debido a que A preserva la longitud.
FORMAS BILINEALES Y LOS OPERADORES ESTANDAR 233 Si en el teorema 10 se supone que V = R" y si se considera que el producto escalar es el producto escalar usual, entonces se puede representar A mediante una matriz real. Así, entonces, resulta natural el definir una matriz real A como unitaria (u ortogonal) si 'AA = o de manera equivalente, •A = A-1. Ejemplo. Las únicas aplicaciones unitarias del plano R2 en sí mismo son las aplicaciones cuyas matrices son del tipo ZcosO—sen0\ .. /eos 0 sen0\ I n n I 0 bien | n nl lsen0 costil lsen0 —costil Si el determinante de tal aplicación es igual al, entonces la matriz que representa la aplicación con respecto a una base ortonormal es, necesariamente, del primer tipo y la aplicación se conoce como una rotación. Al dibujar una gráfica se ve de inmediato que esta terminología está justificada. En los ejercicios aparece un cierto número de enunciados referentes a las aplicaciones unitarias del plano. Son fáciles de demostrar y suministran una base práctica que seria lastimoso desperdiciar en el texto. Estos ejercicios se pueden considerar como ejemplos adicionales para esta sección. El caso complejo. Como de costumbre, para el caso complejo tenemos nociones análogas a las que se acaban de considerar. Sea V un espacio vectorial de dimensión finita sobre C con un producto hermitiano definido positivamente. Sea A: V -» V una aplicación lineal. Se dice que A es unitaria compleja si (Av, Awj = (y, w) para todo v,weV. El análogo del teorema 9 es cierto al pie de la letra: la aplicáción A es unitaria si y sólo si preserva la longitud y también si y sólo si preserva los vec- tores unitarios. Recomendamos al lector que haga la prueba como ejercicio. El análogo del teorema 10 es: Teorema 11. Sea V un espacio vectorial de dimensión finita sobre C con un producto.hermitiano definido positivamente. Una aplicación lineal A: V —> Ves unitaria si y sólo si A*A = I. También se recomienda que el lector efectúe la prueba como ejercicio. Considerando V = C" con la forma hermitiana usual determinada por <X, 1> = xJi + • • + x„y„, se puede representar A mediante una matriz compleja. Así resulta natural el defi- nir una matriz A como unitaria si 'AA = o bien si 'A = A-1.
234 ALGEBRA LINEAL Ejercicios I. (a) Sea V un espacio de dimensión finita sobre R con un producto escalar definitiva- mente positivo. Sean {v,, y {wi, ...,»„} bases ortonormales. Sea A : V -* y un operador de V tal que Av¡ = Demostrar que A es unitario real. (b) Enunciar y probar que existe el resultado análogo en el caso complejo. 2. Sea V tal y como aparece en el ejercicio 1. Sea ¡Di, ..., una base ortonormal de V. Sea A un operador unitario de V. Demostrar que {/1ií|, ..., es una base ortonormal. 3. Sea A una matriz unitaria real, (a) Demostrar que 'A es unitaria, (b) Demostrar que A ~1 existe y es unitaria, (c) Si B es unitaria real, entonces demostrar que AB es unitaria y que B~‘AB es unitaria. 4. Sea A una matriz unitaria compleja, (a) Demostrar que 'A es unitaria, (b) Demostrar que A~' existe y es unitaria, (c) Si B es unitaria compleja, entonces demostrar que AB es unitaria y que B~'AB es unitaria. 5. (a) Sea V un espacio de dimensión finita sobre R con un producto escalar definido positivamente y sean {»],..., r„} = SI y {wj,..., w„} = SI' bases ortonormales de V. Demostrar que la matriz (id) es unitaria real. [Sugerencia: emplear <h>í, w,> = 1 y <w„ wj) = 0 si i j, asi como la expresión w, = para un aü6R] a (b) Sea F : V -» V tal que F(v¡) = w¡ para todo i. Demostrar que es Ma(F) unitaria 6. Demostrar que el valor absoluto del determinante de una matriz unitaria real es igual a 1. Se concluye que si A es real unitaria, entonces Det(/1) = 1 ó — 1. 7. Si A es una matriz cuadrada compleja, entonces demostrar que Det(/1) = Det(A). Nó- tese que el valor absoluto del determinante de una matriz unitaria compleja es igual a 1. 8. Sea A una matriz unitaria real. Demostrar que los elementos diagonales de A son iguales a 1 ó a —1._ 9. Sea A una matriz unitaria compleja y diagonal. Demostrar que cada elemento diago- nal tiene valor absoluto igual a 1 y que por tanto es del tipo el#, donde 0 es real. Los siguientes ejercicios describen varias propiedades de las aplicaciones unitarias reales del plano R2. 10. Sea V un espacio vectorial de 2 dimensiones sobre R con un producto escalar defi- nido positivamente, y sea A una aplicación unitaria real de V en si mismo. Sean {«>,02} y {»i, w2} bases ortonormales de V tales que Av¡ — w, para i = 1,2. Sean a,b,c y d números reales Wi = av¡ + bv2, w2 = cv, + dv2. Demostrar que a2 + b2 = 1, c2 + d2 = 1, ac + bd = 0, a2 = d2 y c2 = b2. 11. Demostrar que el determinante ad — be es igual a 1 ó a — 1. (Demostrar que su cua- drado es igual a 1.)
FORMAS BILINEALES Y LOS OPERADORES ESTANDAR 235 12. Defínase una rotación de V como una aplicación A unitaria real de V cuyo determi- nante es igual a 1. Demostrar que la matriz de A relativa a una base ortogonal de V es del tipo a — b\ b a) pai* algunos números reales a, b, tales que a2 + b2 — 1. Probar también el enunciado reciproco, o sea: que cualquier aplicación lineal de V en si mismo representada por la susodicha matriz sobre una base ortogonal es unitaria y tiene determinante igual a 1. Empleando el cálculo, se puede concluir entonces que existe un número 0 tal que a = eos 0 y b = sen 0. 13. Demostrar que existe una matriz U unitaria y compleja, tal que si 'cosO — sen (A /?* 0 \ I V B = I .. 1 ’ sen 0 eos 0) y 0 e entonces, U lAU = B. 14. Considérese V =C como un espacio vectorial de 2 dimensiones sobre R. Sea-agC y sea L, : C-»C la aplicación z >-» az. Demostrar que L, es una aplicación R-lineal de V en sí mismo. ¿Para cuáles números complejos a resulta ser L„ una aplicación unitaria respecto al producto escalar <z, = Re(ziv)? ¿Cuál es la matriz de L. con respecto a la base {1, i} de C sobre R? §6. Teorema de Sylvester Sea Pun espacio vectorial de dimensión finita sobre los números reales, de di- mensión > 0. Sea <, > un producto escalar sobre V(esto es: una forma bilineal simétrica). Como sabemos por el teorema 12 del capítulo VI, §5 siempre se puede hallar una base ortogonal. La forma no necesita estar definida positivamente y, por tanto, puede ocurrir que exista un vector v e Pial que < v, v> o que <v, = — 1. Ejemplo. Sea V = R2 y represéntese la forma mediante la matriz + 1 -1 Entonces, los vectores forman una base ortogonal para la forma y se tiene <t>i, t»!> = - 1, tanto como <v2, v2> = 0.
i,¡i h h h h n ¡ m i h h u i n ii n u 236 ALGEBRA LINEAL I Por ejemplo, en términos de coordenadas, si 'X = (1, l)es el vector de coordena- da;; de, digamos, t>2 con respecto a la base estándar de R2 determinada por {e\ e2i entonces, por medio de un sencillo cálculo directo, se demuestra que <X, X> = 'XCX = 0. 1 Nuestro propósito en esta sección es el de analizar la situación general en di- iiiutsioncs arbitrarias. Sea {vt, ..., una base ortogonal de V. Sea ; c¡ = <y¡, <’;> Luego de renumerar a los elementos de la base, si fuera necesario, se puede suponer que {v1, ..., n„} están ordenados de tal manera que c,, .. ,,cr > 0, cr+i, .. ,,cs < 0, cs + 1, .. ,,c„ = 0. listamos interesados en determinar el número de términos positivos, de términos negativos y de términos nulos que se encuentran entre los «cuadrados» <u;, n¡>; ei; olías palabras, estamos interesados en los números r y s. En esta sección, vere- mos que estos números no dependen de la elección de la base ortogonal. Si X es el vector de coordenadas de un elemento de V con respecto a la base y si/es la forma cuadrática asociada con el producto escalar, entonces, en términos del vector de coordenadas, se tiene /(X) - CjX? + • • + c,x2 + cr+1x2r+l + • • • + csx2. Se ve que en la expresión de/en términos de coordenadas existen exactamente r tér- minos positivos y s — r términos negativos. Además, n — s variables han desapare- cido. Se puede ver aún más claramente lo que acabamos de decir al normalizar más todavía la base. Generalicemos la noción de base ortonormal. Recuérdese que una base orto- ¡ gonal {v i,..., u„} es ortonormal si para i se tiene | <V¡, !>,•>= 1 o <u¡, v¡> = - 1 O <Ü¡, l’,> = 0. I Si {tij,.. .,v„}es una base ortogonal, entonces se puede obtener de ella una 1 base ortonormal, así como se hizo en el caso definitivamente positivo. Sea c¡ = Si c¡ = 0, se hace v'¡ = t>¡. Si c¡ > 0, se hace i , Vi Vi = —— • y/~c¡ I FORMAS BILINEALES Y LOS OPERADORES ESTANDAR 237 »<i c¡ < 0, se hace H v¡ ü¡ = — ~ Bgntonces {v\,... ,v'„} es una base ortonormal. B- Se^{t?i,.. -, t>„} una base ortonormal de V para el producto escalar. Si X es el vector de coordenadas de un elemento de V, entonces, en términos de la base orto- B normal, B f(X) = x2 + + x2 — x2r+t — - x2- ¿Asi, entonces, sobre una base ortonormal.se ve claramente el número de términos g positivos y negativos. Al probar que el número de estos términos no depende de la I base ortonormal, vamos a trabajar primero con el número de términos que desapa- P recen y luego daremos una interpretación geométrica de este hecho. Teorema 12. Sea V un espacio vectorial de dimensión finita sobre R con un producto escalar. Supóngase que dim V > 0. Sea Vo el subespacio de Vque consta de todos los vectores ve V tales que <,t>, vv> = 0 para todo w e V. Sea {»i, ..., una base ortogonal para V. Entonces el número de enteros i tales que <t>¡, vj) = 0 es igual a la dimensión de Vo. Prueba. Supóngase que {vi, ...,vn} están ordenados de tal manera que <Vi, th> ± 0,..., vs> # 0 aunque <u¡,v¡>=0 si i > s. Como {vj,..., t>„} es una base ortogonal, entonces es claro que ...,v„ están en Vo. Sea v un elemento de Vo, y sea V = Xj»! + • • + xsv, + • • + con x,- g R. Considerando el producto escalar con cualquier v¡ para j s, se encuen- tra 0 = <p, Vj) = Xjtyj, vj). Puesto que < v¡, vj) 0, se deduce que x¡ = 0. Por lo que v está en el espacio gene- rado por v, + I,..., v„. Se concluye que vj +1,..., v„ forman una base dé Vo. En el teorema 12, la dimensión de Vo se conoce como índice de nulidad de la forma. Se ve que la forma es no degenerada si y sólo si su índice de nulidad es igual a 0. Teorema de Sylvester. Sea Vun espacio vectorial de dimensión finita sobre R con un producto escalar. Existe un entero r 0 que tiene la siguiente propiedad. Si {t>j, ..., u„} es una base ortogonal de V, entonces existen exactamente r enteros i, tales que <u¡, ü¡> > 0.
238 ALGEBRA LINEAL FORMAS BILINEALES Y LOS OPERADORES ESTANDAR 239 Prueba. Sean {v1( ..d„} y .., wB} bases ortogonales. Supóngase que sus elementos están ordenados de tal manera que Ejercicios <v¡, v¡> > 0 SÍ 1 i á r <v¡, v¡> < 0 si r + 1¿ i s <v¡, v¡> = 0 si s + 1 í Análogamente, <w¡, w¡> > 0 si 1 S i S r' <w¡, w¡> < 0 si r' + 1 i s' <wf, w¡> = 0 si s' + 1 i íí n. Primero se prueba que 1. Determinar el índice de nulidad y el índice de positividad para cada forma determi- nada por las siguientes matrices simétricas sobre R2: E ^^Eea V un espacio de dimensión finita sobre R y sea < , > un producto escalar sobre R y. Demostrar que V admite una descomposición en suma directa | v = V* © V- © Vo, | donde Vo se define tal y como se hizo en el teorema 12 y donde la forma está definida posi- * tivamente sobre V+ y definida negativamente sobre V~. (Esto significa que ve E+ vi,. ..,v„wr-+1, <t>, v> > 0 <v, »> < 0 para todo para todo son linealmente independientes. Supóngase que existe una relación xi Vi + • • • + x,vr + yr-+ j wr-+1 + • • • + y,», = 0. Entonces, Xjvi + • • • + xrvr = - (yr + !», +1 + • • • + yBwB). Demostrar que las dimensiones de los espacios V+,V son iguales en todas las menciona- das descomposiciones. 3. Sea V el espacio vectorial sobre R de las matrices reales simétricas 2x2. (a) Demostrar que la función f sobre V tal que f(A) = Detfd) es una forma cuadrá- tica sobre V. (b) Sea W el subespacio de V que consta de todas las A tales que tr(4) = 0. Demos- trar que la forma bilineal asociada con la forma cuadrática f está definida nega- tivamente sobre W. Sean c¡ = <v¡, v¡> y d¡ — para todo i. Considerando el producto escalar de cada miembro de la ecuación precedente consigo mismo, se obtiene Cixl + • • • + crx2r = dr+iy^ + i + • • • + d^y2-. El miembro de la izquierda de la ecuación es ¿ 0. El miembro de la derecha es á 0. La única forma en que esto se puede dar, es que ambos miembros sean iguales a 0 y esto se da sólo si xj = • • • = xr = 0. De la independencia lineal de wr +1,..., w„ se deduce que todos los coeficientes yr+i, ...,y„ también son iguales a 0. Como dim V = n, se concluye que r + n — r' n o en otras palabras, r r". Pero la situación resulta ser simétrica al ser aplicable con respecto a las dos bases y, por tanto, r' íS r. Se infiere que r' = r, y así se ha probado el teorema de Sylvester. El entero r que aparece en el teorema de Sylvester se conoce como índice de positividad de la forma.

CAPITULO IX i • • r Polinomios y matrices §1. Polinomios Sea K un campo. Definimos un polinomio sobre K como una función de K en sí mismo, tal que existen elementos a0,.. ,,a„ 6 K tales que flt) = ant" + • • • + Oo para todo t e K. Sea 3(0 = bmtm + • • + bo otro polinomio, donde bj e K, entonces se puede formar la suma f + g. Si para n S m se puede escribir bj = 0 cuando j > m, 3(0 = Oí" + ' ‘+ bmtm + • + bo, entonces se pueden escribir los valores de la suma/ + g como (f + 3X0 = («» + b„)t" + • • • + (a0 + bo)- Así, f + g nuevamente es un polinomio. Si c e K, entonces (c/XO = ca„t” + • • • + ca0 y, por tanto, cf es un polinomio. De donde los polinomios forman un espacio vec- torial sobre K. También se puede considerar el producto de dos polinomios, fg y (Á/XO = (onbm)tn+m + • • • + aobo, de modo que fg es un polinomio. En efecto, si se escribe (/3XO = c„+mt"+'" + • • • + c0, entonces, * c* = 22 a¡b»-i = flob* + Uibfc-i + + akb0. ¡=o Todas las reglas precedentes son, probablemente, familiares para el lector; sin embargo, se han mencionado para obtener una disposición adecuada. 241
242 ALGEBRA LINEAL Teorema 1. Sean f y g polinomios tales que f(t) = g(t) para todo t e K. Escríbase f(t) = a„t" + ••• + «<,, 9(0 = b„t“ + ’ ' ’ + b0- Entonces a, = b¡ para todo i. Prueba. Sólo se da la prueba para el caso K — RoC. Considérese el polinomio h = f — 9 Luego h(x) = 0 para todo x en K. Hay que demostrar a, — b, = 0 para todo ¡. Supóngase que éste no es el caso. Sea r el mayor entero tal que ar / br Entonces se puede escribir, para todo t, 0 = (ar — br)tr + • + (a0 — b0). Divídase por f. Entonces, 0 = ar - b, F + ... + aA - .Lo. t tr Ahora hágase que t alcance valores muy grandes (considerando valores reales para t). Entonces, todos los términos que aparecen a la derecha de ar — br tienden a 0 De donde ar — br = 0, lo que es una contradicción. Queda así probado el teorema. Nota. Hemos empleado la noción de limite. En el capitulo XII, §1, vamos a probar el mismo enunciado para campos más generales mediante un método que es completamente algebraico. En este capitulo vamos a discutir, principal- mente, propiedades simples de los polinomios para aplicarlas a los siguientes dos capítulos, en los cuales se trabajará con los números tanto reales como complejos. Por tanto, emplearemos una pequeña cantidad de análisis. El teorema 1 muestra que cuando se expresa un polinomio f en la forma /(O = a„t" -} + a0 con a¡ e K, entonces los números a0, ..a„ están determinados de manera única. Estos números se conocen como coeficientes del polinomio. Si n es el máximo entero, tal que a„ / 0, entonces se dice que n es el grado de/y se escribe n = gradj También se dice que a„ es el coeficiente inicial de f. Se dice que a0 es el término constante de f. Si f es el polinomio nulo, entonces se usa la convención de que grad / = — 00. Aceptaremos la convención de que — 00 + —00 = —00, — 00 + a = — oc, — 00 < a para todo entero a y no se definirá ninguna otra operación con — 00 La razón para esta convención es que hace válido sin excepciones el siguiente teorema:
POLINOMIOS Y .MATRICES 243 Teorema 2. Sean f, g polinomios con coeficientes en K. Entonces, grad (/i?) = grad/ + gradó?. Prueba. Sean /(O = a„t" + • + a0 y g(t) = bmtm + • • + i>o • con a„ # 0 y bm 0. Entonces, de la regla de multiplicación para fg, se ve que /(t)g(t) = anb«/,+'" + términos de menor grado, y a„b„ # 0. De donde grad fg — n + m = grad f + grad g. Si/ó g es igual a 0. entonces la convención acerca de — oo hace que el enunciado también sea válido. Un polinomio de grado 1 también se conoce como polinomio lineal. Se dice que un número a es una raíz de f si /(a) = 0. Se acepta sin prueba el siguiente enunciado: Teorema 3. Sea f un polinomio con coeficientes complejos de grado ¡í 1. Entonces f tiene una raíz en C. Este teorema se probará en un apéndice, empleando algunos hechos del análisis. Teorema 4. Sea f un polinomio con coeficientes complejos, el coeficiente inicial igual al y grad f = n¿. i. Entonces existen números complejos ..., a„ tales que /(O = (t - ai) " U - a,)- Los números at,..., a„ están determinados en forma única, salvo permutaciones. Cada raíz a de f es igual a algún a¡, y reciprocamente. Prueba. En el capítulo XII, daremos la prueba completa del teorema 4 (su- poniendo cierto el teorema 3). Como en este capitulo y en los dos siguientes no necesitamos saber nada acerca de los polinomios, excepto los enunciados simples de esta sección, creemos que es mejor el posponer la prueba hasta el capítulo mencionado. Además, la teoría adicional de los polinomios que se desarrolla en el capitulo XII es también de utilidad en la teoría de las aplicaciones lineales y las matrices. Consideremos que a,, ...,ar son los raíces del polinomio f en C distintas entre sí. Entonces se puede escribir con enteros m,......mr > 0 determinados de manera única. Se dice que m¡ es la multiplicidad de a, en f.
244 ALGEBRA LINEAL §2. Polinomios de matrices y de aplicaciones lineales El conjunto de los polinomios con coeficientes en K se denota con los símbolos K[t]. Sea A una matriz cuadrada con coeficientes en K. Sea f e K[t] y escribamos /(t) = a„t" + ••• + a0 con o, e K. Se define f(A) = anA'+-+a0/. Ejemplo 1. Sea /(í) = 3t2 — 2t + 5. Sea A = 1 2 -1\ _ , q I. Entonces /I —1\2 /2 ^)=3(2 i - 4 0\_/4 -5\ 5y~\o -i/ TeoremaS. Sean f, Sea A una matriz cuadrada con coeficientes en K. Entonces, (f+ eXA) =/G4) + (fyXA) = f(A)g(A). Si ce K, entonces, (cf)(A) = cf (A). Prueba. Escríbanse f(t) y g(t) en la forma /(t) = a„f + • • • + a0 y g(t) = + • • + b0 con a¡, bj e K. Entonces, Ü&XO = + "+”'+ Co donde k Ck = 22 a¡í’k-i- i=0 Por definición, ifgXA) = cm+nA”^+-+col. Por otra parte, f(A) = a„A" + • • + aol y g(A) = bmAm + • • • + bol-
POLINOMIOS Y MATRICES 245 |>or tanto, f(A)g(A) = ¿ E a^bjA^ Z Z afijA^J = "i'c^. í=0 j = 0 í=0 j=0 k = 0 *Ot»n respecto a la suma, supóngase que n 2í m y sea bj = 0 si j > m. Se tiene {[ + ffXA) = (a- + bJA" + •' + (a0 + be)] = a„4" + t>„4" + + üq] + b0I = f(A) + g(A). Si c e K, entonces, (cfXA) = ca„A" + + ca0] = cfiA). ¡ Esto prueba el teorema. Ejemplo 2. Sea /(t) = (t — 1X( + 3) = t2 + 2t — 3. Entonces f(A) = A2 + 2A - 31 = (A - 1)(A + 31). Si se multiplica este último producto directamente usando las reglas para la mul- tiplicación de matrices, de hecho se obtiene ¿42 - IA + 3A1 - 312 = A2 + 2A- 31. Ejemplo 3. Sean at, ...,a„ números. Sea f(t) = (t -«!) • • • (t - a„). Entonces, f(A) = (A — a¡/)- -(A-a,!). Sea V un espacio vectorial sobre K y sea A: V -* Kun operador (es decir, una aplicación lineal de Ven sí mismo). Entonces se puede formar A2 = A ° A = AA y, en general, A" = iteración de A tomada n veces para cualquier entero n positivo. Sea A o = l (donde 1 denota ahora la aplicación identidad). Se tiene = AmAn para todos los enteros m, n 2: 0. Si/es un polinomio en K[t], entonces podemos formarf(A) de la misma manera que se hizo para las matrices y son válidas las mismas reglas, como se enunciaron en el teorema 5. Las pruebas son las mismas. La parte esencial que se usó fueron las leyes ordinarias de la adición y de la mul- tiplicación y éstas también son válidas para las aplicaciones lineales. Teorema 6. Sea A una matriz n x n en un campo K. Entonces existe un polinomio no nulo fe Kft], tal que f(A) = 0.
246 ALGEBRA LINEAL Prueba. El espacio vectorial de las matrices n x n sobre K es de dimensión finita igual a n2. Por tanto, las potencias /, A, A2, ..Av son linealmente dependientes para N > n2. Esto significa que existen números a0, .. .,aN e K tales que no todos los a¡ = 0, y tales que a^AN + • • • + UqI — O. Se hace flt) - aNtN + - • - + a0, para obtener lo que se quiere. Como sucedió con el teorema 5, se puede observar que el teorema 6 también es válido para una aplicación lineal A de un espacio vectorial de dimensión finita sobre K. De nuevo, la prueba es la misma y vamos a emplear el teorema 6 indis- criminadamente para matrices o para aplicaciones lineales. Posteriormente, en el capitulo X, §2, se determinará un polinomio P(t) que se puede construir explícitamente de tal manera que P(4) = O. Si se divide el polinomio f del teorema 6 por su coeficiente inicial, entonces se obtiene un polinomio g con coeficiente inicial igual a 1 y tal que g(/l) = 0. Generalmente, resulta conveniente trabajar con polinomios cuyo coeficiente inicial es igual a 1, ya que simplifican la notación. Ejercicios 1. Calcular f(A) cuando /(t) — t3 — 2t + 1 y A = • 2. Sea A una matriz simétrica y sea f un polinomio con coeficientes reales. Demostrar que también f(A) es simétrica. 3. Sea A una matriz hermitiana y sea f un polinomio con coeficientes reales. Demostrar que f(A) es hermitiana. 4. Sean A y B matrices de n x n en un campo K y supóngase que B es invertible. Demos- trar que (B-'ABy = B~'A’B para todos los enteros positivos n. 5. Sea f g K[tJ. Sean A y B tal y como aparecen en el ejercicio 4. Demostrar que f(B~'AB) = B~‘f{A)B. §3. Vectores propios y valores propios Sea V un espacio vectorial sobre un campo K y sea A: V un operador de V (es decir, una aplicación de V sobre sí mismo). Se dice que elemento v e V se llama vector propio (eigenvector) de A si existe 2 e K
POLINOMIOS Y MATRICES 247 que Av — Av. Si v O, entonces A está determinado en forma única, debido a que = A2v implica A¡ = A2. En este caso, se dice que A es un valor propio de A co- rrespondiente al vector propio v. También se dice que v es un vector propio con el valor propio A. En vez de vector propio y valor propio también se usan los tér- minos vector característico y valor característico. Si A es una matriz cuadrada n x n con coeficientes en K, entonces un vector propio de A es, por definición, un vector propio de la aplicación lineal de K" en sí mismo representado por esta matriz relativa a la base usual. Así, un vector propio X de A es un vector (columna) de K” para el cual existe A eK talque/íJf = AX. Ejemplo 1. Sea Vel espacio vectorial sobre R generado por todas las funciones infinitamente derivables. Sea A eR. Entonces, la función f tal que f(t) = e* es un vector propio de la derivada d/dt, ya que df ¡di = Ae¡‘. Ejemplo 2. Sea una matriz diagonal en K. Entonces, todo vector unitario e'(i = 1, ..., ríf es un vector propio de A. En efecto, /le1 = a¡e': ai 0 0\/° 0 a2 • • • 0 Ó 0 a„/\¿ Ejemplo 3. Si A: V -» V es una aplicación lineal y si v es un vector propio de A, entonces para cualquier escalar c no nulo, cv también es un vector nulo de A con el mismo valor propio. Teorema 7. Sea V un espacio vectorial sobre el campo K y sea A : V—> V una aplicación lineal. Sea AeK. Sea V2 el subespacio de V generado por todos los vectores propios de A que tienen A como valor propio. Entonces, todo elemento no nulo de V2 es un vector propio de A que tiene A como valor propio. Prueba. Sean t?i,v2e V, tales que Avt = Aui y Av2 = Av2. Entonces, A(i?i + t>2) = + 4v2 = Avi 4- Av2 = A(i?i + t>2). Si ce K, entonces /4(cui) = cAv, = cAv¡ = Acv¡. Esto prueba el teorema. Al subespacio Ki, que aparece en el teorema 7, se le conoce como el espacio propio (eigenspace) de A correspondiente a A.
248 ALGEBRA LINEAL POLINOMIOS Y MATRICES Nota. Si v, y v2 son vectores propios de A con diferentes valores propia # 22 entonces, por supuesto, ti] + v2 no es un vector propio de A. En efecto tenemos el siguiente teorema: Teorema 8. Sea V un espacio vectorial sobre K y sea A:V—+V un ope- rador. Sean v¡, ..., v„ vectores propios de A con valores propios ^i, • •., 2* respectivamente. Supóngase que estos valores propios son distintos entre ¡i, es decir: 2¡ / 2j si i j. Entonces v¡, ..., v„ son linealménte independientes. Prueba. Por inducción sobre m. Para m = 1, un elemento vt e V, v¡ / 0 es linealmente independiente. Sea m > 1. Supóngase la relación (*) fifi + • • + c„vm = 0 con c¡e K. Hay que probar que todo c¡ = 0. Se multiplica la relación (*) por 2¡ para obtener CiÁjUj + ••• + c„A,v„ = O. También se aplica A a la relación (*). Por linealidad, se obtiene CjliVj + ••• + cmA„vm = O. Ahora se sustraen estas dos últimas expresiones y se obtiene c2(22 — 2i)ut + • • • + cm(2m — 2t)vm = O. Como2j — 2] # Opara/ = 2,..., m se concluye, por inducción, que c2 = • • • — c„, =0. Volviendo a la relación original, se ve que c^ = O, con lo que Cj = 0 y el teorema queda probado. Ejemplo 4. Sea V el espacio vectorial sobre C que consta de todas las funciones derivables evaluadas en los complejos de una variable real t. Sean ai, ..,am números complejos distintos entre si. Las funciones ea,t, ..., e’"' son vectores propios de la derivada, con distintos valores propios a¡,..., y, por tanto, son linealmente independientes. Frecuentemente, en análisis, se consideran las funciones e2”’”' con n ~ 1,2,... Teorema 9. Sea V un espacio vectorial de dimensión finita sobre K y sea 2 e K. Sea A:V-r V una aplicación lineal. Entonces, A es un valor propio de A si y sólo si A — Al no es invertible. Prueba. Supóngase que 2 es un valor propio de A. Entonces existe un elemento ve V, v O tal que Av = Av. De donde Av — Av = O y (A — 2/)v = O. Por lo i 248¿. ¡A — AI tiene un núcleo no nulo y A — AI no puede ser invertible. Recipro- ente, supóngase que A - AI no es invertible. Por el corolario del teorema 6, tulo IV, §4, se ve que A — AI debe tener un núcleo no nulo, lo que significa existe un elemento ve V, v + O tal que (A - AI)o = O. Por tanto, Av — Av = O , = Av. Así, 2 es un valor propio de A. Esto prueba el teorema. teorema 10. Sea V un espacio vectorial de dimensión finita sobre los mi- neros complejos y supóngase que dim V 1. Sea A : V—> V una aplicación ineal. Entonces existe un vector propio no nulo de A. ’rueba. Conforme al teorema 6 del §2, existe un polinomio no nulo /eC[t] ,ue f(A) = O y se puede suponer que f tiene coeficiente inicial igual a 1. Por orema 4 del §1, existen números complejos 2],... , 2„ tales que /(t) = (t-2I)--(t-2.). Se concluye O=/(A) = (A-21/) - (A-2„/). * No todas las aplicaciones lineales A — A,I son invertibles, ya que, si asi fuera, la composición (A - AtI)--(A - AJ) también seria invertible. Por tanto, para algún i, existe un elemento v e V, v 4- O tal que (A - A¡I)v = O. Pero entonces Av = A¡v y se ha hallado el vector propio deseado. Observación. El enunciado del teorema 10 es falso si V es un espacio vectorial sobre R en vez de serlo sobre C. Por ejemplo, una rotación según un ángulo 0 en R2 no tiene un vector propio real si 0 no es un múltiplo entero de ir. (Vea el ejercicio 3.) , Teorema 11. Sea V un espacio vectorial sobre el campo K y sea A : V—> V una aplicación lineal. Supóngase que existe una base {vj,..., v„} de V que consta de vectores propios de A con valores propios Ait ..., 2„ respectivamente. En- tonces, la matriz asociada con A con respecto a esta base es la matriz diagonal (2i 0 ••• 0\ 0 a2 0 Ó Ó 2„/ Prueba. Es obvia.
250 ALGEBRA LINEAL POLINOMIOS Y MATRICES 251 Ya se vio en el ejemplo 2 el recíproco del teorema 11. Así, es importante prel cisar ejemplos de cuándo un espacio vectorial tiene una base que consta de veo.] tores propios para un operador. Estos ejemplos son, precisamente, los que se i encuentran cuando el operador se puede diagonalizar. Por ejemplo, ahora e|| teorema 8 permite afirmar: 1 Corolario 1. Sea V un espacio vectorial de dimensión finita sobre K, de d¡. mensión igual a n. Sea A :V->Vun operador. Supóngase que A tiene n valores propios distintos entre si. Entonces, V tiene una base que consta de vectores propios para A y, por consiguiente, A se puede diagonalizar. O bien en términos de matrices: Corolario 2. Sea A una matriz n x n sobre un campo K. Supóngase que 4 tiene n valores propios, distintos entre sí en K. Entonces existe una matriz «o singular B en K tal que B~'AB es una matriz diagonal. En los ejercicios, se tratará el caso de las matrices de 2 x 2. A continuación se da un ejemplo. Ejemplo 5. Encontrar los valores propios y los vectores propios de la matriz I F Recíprocamente, si A es una raíz del polinomio precedente, entonces el deter- | minante anterior es igual a 0 y existe una solución del sistema de ecuaciones x(A - i) - 2y = 0 x + (A - l)y = 0 B dond^ni x ni y son iguales a 0. De esta manera, se halla un valor propio A y un । vector propio Se puede hacer esto explícitamente. Sea Aj = 1 + i\/2 y I Ai = 1 — Al resolver el sistema de ecuaciones lineales con A = Ai se obtiene í el vector propio Al resolver el sistema de ecuaciones lineales con A = A2 se obtiene el vector propio . . / 1 \ -/x/2 • Observación. Cualquier vector propio con valor propio Ai es igual a ct’i con algún número c / 0. Cualquier vector propio con valor propio A2 es igual a c'v2 con algún número c' 0. Nótese que los valores propios y los vectores propios son complejos y que no hay valores propios reales. Si hay un vector propio 1 ) y un valor propio A, entonces Ejercicios x + 2y = Ax, — x + y = Ay, y, en consecuencia, restando el miembro de la izquierda de la ecuación del miembro de la derecha, se debe tener 1. Sea /a \c *7 una matriz 2 x 2 en un campo K. Demostrar que cualquier valor propio A de esta matriz es una raíz del polinomio x(A - 1) - 2y = 0, x + (A - l)y = 0. Como ni x ni y pueden ser igual a 0, el determinante t — a — c —b I t - d| = (t — aXt — d) — be. A - 1 —2 1 A - 1 es igual a 0 y A es una raíz del polinomio (A — l)2 + 2 = 0, 2. Reciprocamente, demostrar que cualquier raíz del polinomio t — a — b — c t — d es un valor propio de la matriz dada. 3. Demostrar que si 0 e R y 0 no es un múltiplo entero de ir, entonces la matriz o bien A2 — 2A + 3 = 0. Las raíces son 1 + i^/2 y 1 — i^/2 eos 0 sen 0 — sen 0 eos 0 no tiene un vector propio no nulo en R2.
751 ALGEBRA LINEAL 4. Demostrar que si OeR, entonces la matriz (eos 0 sen 0\ senO eos 0] siempre tiene un vector propio en R2 y, de hecho, que existe un vector f1 tal que Avt [Sugerencia sea la primera componente de t>i, igual a sen 0 x =---------- 1 — eos 0 si eos 0 + 1. Entonces resolver para y. ¿Qué pasa si cosO = 1?] 5. En el ejercicio 4, sea un vector de R2, perpendicular al vector t^ determinado en ese ejercicio. Demostrar que /tt>2 = - v2. Definirlo para dar a entender que A es una reflexión. 6. Demostrar que cualquier matriz unitaria real 2x2 cuyo determinante es igual a — 1, se puede expresar como un producto /1 0\ / eos 0 — sen 0\ (0 - 1J y sen 0 eos 0J para algún número real 0. 7. Sea V un espacio vectorial de dimensión finita sobre K y sea A : V -» V una aplicación lineal. Sea ue V un vector propio de A, sea Av — Áv. Si f es un polinomio en K[t], entonces demostrar que f(A)v = /(2)v. X Sea V un espacio vectorial de dimensión finita sobre un campo K. Sean A y B aplica- ciones lineales de V en si mismo. Supóngase que AB = BA. Demostrar que si v es un vector propio de A con valor propio 2, entonces Bv es un vector propio de A con valor propio 2 también si Bv # O. 9. Sea l' un espacio vectorial de dimensión finita sobre ¡os números complejos. Sean A B dos aplicaciones lineales de V en si mismo, tales que AB = BA. Demostrar que A y B tienen un vector propio en común. [Sugerencia: si 2 es un valor propio de A, considérese el espacio V j que consta de todos los vectores v tales qué Av = 2v y demostrar que B aplica a este es- pacio en si mismo. Luego proceda por su propia cuenta.] 10. Sea V un espacio vectorial de dimensión finita sobre el campo K. Sean A y B aplica- ciones lineales de V en si mismo y supóngase que AB = BA. Supóngase que existe una base de V que consta de vectores propios de A y cna base de V que consta de vectores propios de B. Demostrar que existe una base cuyos elementos son vectores propios tanto para A como para B (esto es: A y B se pueden diagonalizar simultáneamente.) § 4. El polinomio característico En los ejercicios de la sección precedente, se determinó un polinomio para cualquier matriz 2x2 cuyas raíces eran los valores propios de la matriz. Esto se hizo mediante eliminación ordinaria. Ahora se estudiará el caso general, para matrices arbitrarias. Sea A una matriz de n x n en un campo K, A = (a¡2). Vamos a definir el po- linomio característico PA de A como el determinante PA(t) = Det(tJ - A),
253 t - a„„ POLINOMIOS Y MATRICES l0 desarrollado totalmente, t — «i i t — On — a¡2 — Otn I P(t)= : = -a¡- K ~ «ni — «i,2 t — a„„ 1 I * t I Ejemplo 1. El polinomio característico de la matriz I / 1 -1 3\ I A= 1—2 1 1 | \ 0 1 — 1 / | es f t - 1 1 -3 ' 2t-l-l, 0 -1 t + 1 que se puede desarrollar conforme a la primera columna, para hallar PA(t) = ? _ t2 - 4t + 6. Para una matriz arbitraria A = (a¡j), el polinomio característico se puede hallar al desarrollar según la primera columna y siempre consistirá en una suma (t — at i) • • • (t — a„„) + Cada uno de los demás términos distintos del que hemos desarrollado tendrá grado < n. De donde el polinomio característico es del tipo Pa(0 = t" + términos de menor grado. Teorema 12. Sea A una matriz de n x n en un campo K. Un elemento leK es un valor propio de A si y sólo si A es una raíz del polinomio característico de A. Prueba. Supóngase que A es un valor propio de A. Entonces AI = A no es invertible según el teorema 9 y, por tanto, Det(2J — A) = 0, debido al teorema 8 del capítulo Vil, §9. En consecuencia, A no es una raíz del polinomio caracte- rístico, entonces Det(2J — A) = 0 y, por tanto, debido al mismo teorema 8 del capitulo Vil, §9, se concluye que AI — A no es invertible De donde A es un valor propio de A, debido al teorema 9. El teorema 12 da una manera explícita para determinar los valores propios de una matriz, suponiendo que se puedan determinar explícitamente las raíces de su polinomio característico. Algunas veces esto es fácil, especialmente en los ejercicios que aparecen al final de los capítulos, cuando las matrices se han ajustado
254 ALGEBRA LINEAL de tal manera que se pueden determinar las raíces mediante un reconocimiento o mediante dispositivos sencillos. En otros casos, resulta considerablemente más difícil. Así, para determinar las raíces del polinomio del ejemplo 1, habría que de- sarrollar la teoría de los polinomios cúbicos. Esto se puede hacer, pero envuelve fórmulas que son algo más difíciles de resolver que la fórmula necesaria para resolver una ecuación cuadrática. También se pueden encontrar métodos para determinar las raíces aproximadamente. En cualquier caso, la determinación de tales métodos corresponde-a otro rango de ideas distintas de las estudiadas en el presente capítulo. Ejemplo?. Determinar los valores propios de la matriz /1 1 -1\ A= 0 1 0 \1 0 1/ Se calcula el polinomio característico, que es el determinante t - 1 -1 1 0 t - 1 0 ’ -1 0 t- 1 que se obtiene fácilmente y da como resultado P(t) = (t - l)(t2 - 2t + 2). Sus raíces son 1, 1 + í, 1 — i; éstas son las raíces características. Nótese que hay sólo una raíz característica real. Ejemplo 3. El polinomio característico de la matriz /i 1 2\ ¡O 5—11 \0 0 7/ es (t — l)(t — 5)(t — 7). ¿Puede el lector generalizar este último resultado? Teorema 13. Sean A y B dos matrices n x n y supóngase que B es inver- tible. Entonces el polinomio característico de A es igual al polinomio caracte- rístico de B~'AB. Prueba. Por definición y por las propiedades del determinante, se tiene Det(t/ - A) = Det(B~ '(ti - A)B) = Detftñ' lB - B~ 'AB) = Det(tl - B-'AB). Esto prueba lo que se quería.
POLINOMIOS Y MATRICES 255 Vamos a definir ahora a] polinomio característico de una aplicación lineal. Se seguirá el patrón usual y se empleará su representación por matrices. Sea A: V -+ V una aplicación lineal de un espacio vectorial de dimensión finita sobre el campo K. Si Si es una base de V, sea M la matriz que representa a A con respecto a Si. Si Si' es otra base, entonces existe una matriz invertible jV tai que la matriz M' de A con respecto a áT está dada por M' = N~lMN. Por el teorema 13, el polinomio característico de M es el mismo que el de Al'. A este polinomio característico se le conoce como polinomio característico de la aplicación lineal A. Si 1 es un valor propio de A, entonces la multiplicidad de A se define como su multiplicidad, considerada como una raíz del polinomio característico de A. Ejercicios 1. Sea A una matriz diagonal, (a, 0 ••• o\ 0 0 . Ó Ó aj (a) ¿Cuál es el polinomio característico de A? (b) ¿Cuáles son sus valores propios? 2. Sea A una matriz triangular, fln 0 •• 0* 4 = a22 •• 0 °»2 ‘ O„ ¿Cuál es el polinomio característico de A y cuáles son sus valores propios? 3. Determinar el polinomio característico de las siguientes matrices; hallar también los valores propios en los números complejos y determinar los vectores propios. (a) i\ -2 J (b) ( 1 */ C) \0 2/ , (2 4\ Z1 2\ / 3 2' (d)(5 3) (e) | 12 -2J (-2 3
256 ALGEBRA LINEAL 4. Sea A una matriz 4x4 cuyo polinomio característico es (t - 2Xt + l)(t + ¿Xt + 2i). Probar que A se puede diagonalizar sobre los números complejos. 5. Sea V un espacio vectorial de n dimensiones sobre los números complejos y supón- gase que el polinomio característico de una aplicación lineal A :V -» V tiene n raíces distin- tas entre si. Demostrar que V tiene una base que consta de vectores propios de A. 6. Sea A la matriz. Z1 a\ \° V con algún número complejo a 0. Demostrar que A no puede ser diagonalizada. 7. Usando el teorema del valor intermedio para las funciones continuas, probar que cualquier matriz real n x n tiene un vector propio no nulo si n es impar. 8. Sea A una matriz cuadrada. Demostrar que los vectores propios de 'A son los mismos que los de A. ¿Son los vectores propios de 'A iguales a los de 4? 9. Demostrar que los valores propios de la matriz (0100^ 0 0 10 0 0 0 1 1 0 0 0^ en los números complejos son ± 1 y ± i. 10. Sea V el espacio generado sobre R por las dos funciones sen t y eos r. ¿Tiene la deri- vada (considerada como una aplicación lineal de V en sí mismo) cualesquiera vectores propios no nulos en K? En caso afirmativo, ¿cuáles son? 11. Hallar los valores propios y los vectores propios de /2 -1\ V °/ Demostrar que los vectores propios generan un espacio de 1 dimensión. 12. Hallar los valores propios y los vectores propios de las siguientes matrices: Zt 1 1 °\ (a) (n 1) (b) 0 1 1 (c) (0 1 1 ' ' \0 0 1/ \0 0 1 ]
CAPITULO X Triangulación de matrices y de aplicaciones lineales §1. Existencia de la triangulación Sea V un espacio vectorial de dimensión finita sobre el campo K y supóngase que n = dim V g 1. Sea A:V-> V una aplicación lineal. Sea W un subespacio de V. Se dice que W es un subespacio invariante de A, o bien que es ^-invariante, si aplica a W en si mismo. Esto significa que si we W, entonces Aw también está contenido en W. También se puede expresar esta propiedad escribiendo AW c W. Se designa por un abanico de A (en F) una sucesión de subespacios {Vt,..., V„} tal que F¡ está contenido en Fi+I para cada 1,..., n — 1, tal que dim V¡ = i; y por último, tal que V¡ es A invariante. Se ve que las dimensiones de los subespacios Vt,..., K aumentan en 1 al pasar de un subespacio al siguiente. Además, V = V„. A continuación se da una interpretación de los abanicos mediante matrices. Sea {V¡,..., K} un abanico para A. Por una base en abanico deberá entenderse una base {»i, ..., de V tal que {dj, ..., v,} es una base para Se ve de inme- diato que existe una base en abanico. Por ejemplo, sea V] una base para Vt. Exten- damos a v, una base {t>i, i>2} de F2 (posiblemente con base en un teorema anterior), después a una base {vt,v2,v3} de V3, y así sucesivamente, en forma inductiva hasta una base {v,,..., v„} de V„. Teorema 1. Sea {t?i,..., u„} una base en abanico para A. Entonces la matriz asociada con A relativa a esta base es una matriz triangular superior. Prueba. Como AV¡ está contenido en para cada i = entonces existen números a¡j tales que . Ai?! = anVi Av2 = at2Vi + a22v2 Av¡ = ai,!?! + a2iv2 + • + Av„ = ai.Vj + a2nv2 + + a,,nv„. 257
258 ALGEBRA LINEAL Esto quiere decir que la matriz asociada con A con respecto a la base es la matriz triangular /«n «12 •• «U 0 «22 ' • «2« \ ó 0 a„„ , como se quería mostrar. Observación. Sea A una matriz triangular superior como la que se acaba de mostrar. Considérese a A como una aplicación lineal de Kn en sí mismo.Entonces, los vectores unitarios columna el, ..., e" forman una base en abanico para A. Si suponemos que V¡ es el espacio generado por e1, ..., e‘, entonces {V¡t ..., r¡,} es la base en abanico correspondiente. Asi, también el reciproco del teorema 1 es, obviamente, cierto. Hay que recordar que no siempre se puede encontrar un vector propio (o un valor propio) para una aplicación lineal si el campo dado K no es el de los nú- meros complejos. Análogamente, no siempre es cierto que se pueda hallar una base en abanico para una aplicación lineal cuando K es el campo de los números reales. Si A : P -» V es una aplicación lineal y si existe una base para V para la cual la matriz asociada de A sea triangular, entonces se dice que A es triangulable. Análogamente, si A es una matriz n x n, sobre el campo K, se dice que A es triangulable sobre K si es triangulable como aplicación lineal de K" en sí mismo. Esto es equivalente a decir que existe una matriz B no singular en K tal que B~lAB es una matriz triangular superior. Usando la existencia de vectores propios sobre los números complejos, vamos a probar que cualquier matriz o aplicación lineal se puede triangular sobre los números complejos. Teorema 2. Sea V un espacio vectorial de dimensión finita sobre los números complejos y supóngase que dim V 1. Sea A: V -+ V una aplicación lineal. Entonces existe una base en abanico de A en V. Prueba. Este teorema se puede probar por inducción. Si dim V = 1, entonces no hay nada más que probar. Supóngase que el teorema es cierto para cuando dim V = n — 1, n > 1. Por el teorema 10 del capítulo IX, §3, existe un vector propio no nulo tq para A. Supóngase que V¡ es el subespacio de dimensión igual a 1, generado por v¡. Se puede expresar V como una suma directa V = Ej © W para algún subespacio W (por el teorema 8 del capitulo II, §4, que asegura, esen- cialmente. que se puede extender a vectores linealmente independientes hasta una base). El problema que aparece ahora es que A no aplica a W en sí mismo. Sea P1 la proyección de V sobre Pj y sea P2 la proyección de V sobre W. Entonces, P2A es una aplicación lineal de V en sí mismo, la cual aplica a IV en W (porque P2 aplica a cualquier elemento de V en W). Así, consideramos P2A como una apli- cación lineal de W en sí mismo. Por inducción, existe una base en abanico de P2A en W, digamos {W}, ..., Sea K = V¡ +
TRIANGULACION DE MATRICES Y DE APLICACIONES LINEALES 259 para i = 2,..., n. Entonces, V¡ está contenido en l^+1 para cada i = 1, ..,, n y se verifica de inmediato que dim V¡ = i. (Si {«t,..., u„-1) es una base de W tal que {«j, ..., u¡] es una base de Wj, entonces , m¡_ ,} es una base de Vf para i = 2,,.., n.) Para probar que {K,..., V„] es una base en abanico para A en V, será sufi- ciente probar que AV, está contenido en V¡. Para hacer esto, nótese que ’ * A = 1A = (P, + P2)A = PtA + P2A. Sea ve Vi. Se puede escribir v = cv¡ + wh con ce C y tv, e W¡. Entonces, PiAv = Pjylv) está contenido en V¡ y, por tanto, en V¡. Además, P2Av = P24(cü1) + P2Aw¡. Como P2^(cvI) = cP2Av¡ y puesto que v, es un vector propio de A, por ejemplo /Ivi = AjEi, encontramos que P2A(cvi) = P2(c2ii?i) = O. Por la hipótesis de inducción, P2A aplica a en sí mismo, y por tanto P2Aw¡ está en De donde P2Av está en V¡ + W¡ — V¡. Finalmente, concluimos que lAv = P,Av + P2Av está en V¡, con lo que se ha probado el teorema. Corolario J. Sea V un espacio vectorial de dimensión finita sobre los números complejos y supóngase que dim 1. Sea A: VV una aplicación lineal. Entonces existe una base de V, tal que la matriz de A con respecto a esta base es una matriz triangular. Prueba. Ya se dieron los argumentos del enunciado del teorema 1. Corolario 2. Sea M una matriz de números complejos. Existe una matriz no singular B, tal que B~tMB es una matriz triangular. Prueba. Este corolario es la interpretación estándar del cambio de matrices cuando cambiamos bases aplicado al caso cubierto por el corolario 1. Ejercicios ). Sea A una matriz triangular superior: Olí «12 0 a22 Ó Ó «2. am Considerando a A como una aplicación lineal, ¿cuáles son los valores propios de A2, A3 y en general de A' donde r es un entero S 1? 2. Sea A una matriz cuadrada. Se dice que A es nilpotente si existe un entero r ¿ 1, tal que Ar = O. Demostrar que si A es nilpotente, entonces todos los valores propios de A son iguales a 0.
TRIANGULACION DE MATRICES Y DE APLICACIONES LINEALES 261 260 ALGEBRA LINEAL 3. Sea V un espacio de dimensión finita sobre los números complejos y sea A . V -» y V una aplicación lineal. Supóngase que todos los valores propios de A son igua es a . Demos- 1 I raí que A es nilpotente. S (lili los dos ejercicios anteriores, trátese primero en forma explícita el caso de _ x 2.| i 4. Usando bases en abanico, hacer una prueba de que la inversa de una matriz triangular I invertible también es triangular. De hecho, si V es un espacio vectorial e intensión finita J si A . U -♦ V es una aplicación lineal que es invertible y si J V.. KJ es uaa ( ase en aba- I nico para A, entonces demostrar que también es una base en abanico para 5. Sea A una matriz cuadrada de números complejos tales que A - 1 para algún en- tero positivo r. Si a es un valor propio de A, entonces demostrar que a — 6. Hallar una base en abanico para las aplicaciones lineales de C representadas por las matrices «(I!) <b>('i:) (c,C 0 7. Probar que un operador A : V - V sobre un espacio vectorial de dimensión finita se puede escribir como una suma A - D + N, donde D es diagonalizable y N es ni potente. (b) §2. Teorema de Hamilton-Cayley S<;a V un espacio vectorial de dimensión finita sobre un campo K y sea A . V V una aplicación lineal. Supóngase que V tiene una base que consta e vectores • , , i 7 „ > epan ÍJ. k 1 los valores propios propios de A, por ejemplo ¡Vi, .... c„). bean jzi. • • •» correspondientes. Entonces el polinomio característico de A es P(r) = (í - Aj) - (t - A„), y = M- M - V)- Si ahora aplicamos P(A) a cualquier vector v¡, entonces el factor A — Á¡/ anulará a v,; en otras palabras, P(A)vi = O. En consecuencia, PIA) = O. En general, no se puede hallar una base como se acaba de hacer. Sin embargo, al usar abanicos se puede construir una generalización del argumento que se acaba de emplear en el caso diagonal. Teorema 3. Sea V un espacio vectorial de dimensión finita sobre los nú- meros complejos, de dimensión 2: 1, y sea A : V -* V una aplicación lineal. Sea P su polinomio característico. Entonces, P(A) = O. Prueba. Por el teorema 2, se puede hallar una base en abanico para A, digamos {Vi, K}- Sea an 0 ai„ ^2n \0 - la matriz asociada con A con respecto .gntonces, *2 fe i Av¡ = aaVj + un elemento de ,0, en otras palabras, como (A — a¡¡/)Vi — Av¡ — «¡.u,, se tiene ' (A — auljvi está en V¡-t. rjtderqRs, el polinomio característico de A está dado por ; P(0 = O - fliO ’ O - an„), de tal manera que ? P(A) = (A-áltl)-(A-amD. F Se puede probar por inducción que (A -a¡tI) - (A-a¡¡l)v = O para todo v en V¡, i = 1,..., n. Cuando i = n, esto da por resultado el teorema. * Sea i = 1. Entonces, (A - anf)vj= At^ — ant>i = 0 y caso concluido. 3 Sea i > 1 y supóngase que la afirmación está probada para i — 1. Cualquier i elemento de V¡ se puede escribir como una suma v' + cv¡ con v' en y¡-t y algún ‘ escalar c. Nótese que (A — aul)v' está en b debido a que AV¡-, está contenido en P¡-1 y también lo está a¡,t/. Por inducción, Por otro lado, (A — a¡i!)cv¡ está en V(_ ¡ y, por tanto, por inducción M - - a^cvi = O. De donde para v en Vh tenemos que (A - a¡tJ) • (A - a¡¡I)v = O, con lo que se prueba el teorema. Corolario I. Sea A una matriz n x n de números complejos y sea P su poli- nomio característico. Entonces, P(A) — 0. Prueba. Considérese A como una aplicación lineal de C en sí mismo y apli- qúese el teorema. Corolario 2. Sea V un espacio vectorial de dimensión finita sobre el campo K y sea A:V~* V una aplicación lineal. Sea P el polinomio característico de A. Entonces, P(A) — O. Prueba. Tómese una base de V y sea M la matriz que representa a A con respecto a esta base. Entonces, PM = PA y es suficiente probar que PUÍM) = O. Pero se puede aplicar el teorema 3 para concluir la prueba. ^nn j a una base en abanico. {v,. .... «»}•
262 ALGEBRA LINEAL Observación. Se puede basar una prueba del teorema 3 sobre un argumento de continuidad. Dada una matriz compleja A, se puede, por varios métodos que no vamos a discutir ahora, probar que existen matrices Z del mismo tamaño que 4 que están suficientemente próximas a A (esto es, cada uno de los componentes de Z está cerca del correspondiente componente de A) tal que Pz tiene todas sus raíces de multiplicidad igual a L De hecho, los polinomios complejos que tienen raíces de multiplicidad > 1 están distribuidos en forma escasa entre todos los polinomios. Ahora bien, si Z es como antes, entonces la aplicación lineal que re- presenta es diagonalizable (debido a que Z tiene valores propios distintos entre sí) y, por tanto, P2(Z) = O sencillamente, como se observó al principio de esta sección. Sin embargo, Pz(Z) se aproxima a P^(4) a medida que Z se aproxima a 4. De donde P^(4) = O. <1’2, 7--------7 v‘ ¡§3. Diagonalización de aplicaciones unitarias Teorema 4. Sea V un espacio vectorial de dimensión finita sobre los nú- meros complejos y sea dim V 2: 1. Supóngase que se da un producto hermitiano definido positivamente sobre V. Sea A : V -» V una aplicación unitaria. Entonces existe una base ortonormal de V que consta de vectores propios de A. Prueba. Primero se observa que si w es un vector propio para A con valores propios A, entonces Aw = Aw y A / 0 porque A preserva la longitud. Por el teorema 2, se puede encontrar una base en abanico para 4: por ejemplo: {fj, ..., P„}- Sea {vi,..., una base en abanico. Se puede usar el proceso de ortogonalización de Gram-Schmidt para ortogonalizarla. Recuérdese el pro- ceso: t’j = ^1 v'z = v2 A partir de esta construcción, se ve que {vj, ..., es una base ortogonal, que es, nuevamente, una base en abanico, porque {tXx, ..., es una base del mismo espacio V¡ como {tq....u¡}. Al dividir cada uno de los por su longitud, se ob- tiene una base en abanico {wx,..., w„} que es ortonormal. Afirmamos que cada uno de los w¡ es un vector propio para A. Se procede por inducción. Como Aw, está contenido en fj, entonces existe un escalar Ax tal que Aw, = Á,w¡, de tal forma que W| es un vector propio y Ax / 0. Supóngase que ya se ha probado que wx, ..., w.-i son vectores propios con valores propios no nulos. Existen escalares cx,..., c¡ tales que 4w¡ = c,w, + • • + c,w¡. Como A preserva la perpendicularidad, 4w¡ es perpendicular a 4w* para todo k < i. Pero 4wt = A^w,,. De donde Aw¡ es perpendicular al propio wk y, por tanto.
I TRIANGULACION DE MATRICES Y DE APLICACIONES LINEALES 263 ct = 0. De donde Aw¡ = c.w, y c¡ / 0, debido a que A preserva la longitud. Se puede proceder así desde 1 hasta n para probar el teorema. Corolario. Sea A una matriz unitaria compleja. Entonces existe una matriz unitaria U, tal que V~XAU es una matriz diagonal. Prueba. Sea {e*,..., e*} = Si la base ortonormal estándar de C" y sea {uq, ..., vv„} = Si' una base ortonormal que diagonaliza a A considerada como una aplicación lineal de C" en sí mismo. Sea U = M* (id). Entonces í/ es unitaria (vea el ejercicio 5 de! capítulo VIII, §5) y si M' es la matriz de A relativa a la base entonces, M' = U~'AU. Se deduce que M' es unitaria. Para otra prueba (más sencilla), refiérase al §4 del siguiente capítulo. Ejercicios 1. Sea A una matriz unitaria compleja. Demostrar que cada uno de los valores propios de A se pueden expresar como e1’ con algún 0 real. 2. Sea A una matriz unitaria compleja. Demostrar que existe una matriz diagonal B y una matriz unitaria compleja V tal que A = .niiiuuuuiiiiuiuuuuu

CAPITULO XI El teorema espectral § 1. Vectores propios de aplicaciones lineales simétricas a A lo largo de este capítulo vamos a trabajar con vectores propios y con va- lores propios para un tipo especial de operadores, a saber: simétricos (o bien her- mitianos en el caso complejo). Comenzamos con el caso simétrico sobre los nú- meros reales. Sea V un espacio vectorial de dimensión finita sobre los números reales, con dimensión ¡2 1. Supóngase que V tiene un producto escalar simétrico fijo y de- i finido positivamente, denotado con <, >. Si el lector quiere, puede pensar que V . es R" con su producto escalar ordinario, aunque también se consideran los sub- espacios de V, y entonces estos subespacios tienen el producto escalar determi- nado por el de F; sin embargo, no son iguales a R" y sólo cuando se han selec- cionado bases convenientes resultan isomorfos a R”. El punto principal de este capítulo es el de seleccionar bases sujetas a ciertas condiciones. Sea A: F -» V una aplicación lineal. Recordemos que se dice que A es simé- trica si (Av, = <v, Aw> — (Aw, v) para todo v, w e V. Si V = R", y el producto escalar es el producto escalar ordi- . nario y si representamos a A mediante una matriz relativa a la base usual, enton- ces A es simétrica si y sólo si esta matriz es simétrica. Si V está dado en forma abs- tracta, pero se selecciona una base ortonormal de V y se representa A mediante una matriz con respecto a esta base, entonces, nuevamente, A resulta ser simé- trica si y sólo si la matriz es simétrica. De hecho, convendrá usar R" y C" en algunos argumentos explícitos. Por ejemplo, en el siguiente teorema que, esencialmente, ha sido probado con an- terioridad, pero que se repite aquí por conveniencia del lector. Teorema 1. Sea A una matriz real y simétrica den x n. Si A es un valor propio de A en C, entonces A es real. Prueba. Emplearemos el producto hermitiano en C", tal que si Z, Z'e C, entonces <Z, Z'> = 'ZZ' = Zjzj + • • • + znz‘„. 265
f 266 ALGEBRA LINEAL Sea Z un vector propio que tenga a A como un valor propio, asi que Z ji q * AZ = AZ. Se tiene <AZ,Z> = <AZ,Z> = A<Z,Z>. Por otro lado, como A es simétrica y real, se tiene <_az, zy = <z, 'Azy = <z, Azy = <zz? z>. De donde A(Z, Z> es igual a su conjugado complejo y es real. Como Z.Z, Z) es real y + 0, se concluye que A es real. Sea Z un vector en C". Se puede escribir Z de manera única como una suma Z — X 4 i Y, donde X, Y son vectores reales en R". Esto es cierto para cada una de las componentes de Z y asi, entonces, para la propia Z. Por ejemplo: /3 + 2A Z3\ ./ 2\ Teorema 2. Sea A una matriz simétrica real n x n. Entonces, A tiene un vector propio real no nulo. Prueba. < Isemos el hecho de que si se considera A como una aplicación lineal de €1" en C", entonces A tiene un vector propio Z complejo y no nulo. Así, existe A e C tal que AZ = AZ y por el teorema 1, A es real. Escribamos Z = X + iY donde X, Y son vectores reales. Entonces, AZ = AX + iAY y AZ = AZ = aX + ZAY. Piic.mo que A es real y como las partes real e imaginaria de un vector complejo están ucteiminadas en forma única, se concluye que AX = AX y AY=AY. V 11 m- al menos uno de los vectores X, Y no es el vector nulo, uno de ellos es un vector propio real y no nulo, como se quería demostrar. Corolario. Sea V un espacio vectorial de dimensión finita sobre R, de di- mensión > 1 y con un producto escalar definido positivamente. Sea A : V -> V * una aplicación lineal simétrica. Entonces. A tiene un vector propio no nulo en V. | a 5 Prueba. Tómese una base ortonormal para V. Entonces, A esta representada a p i una matriz real simétrica con respecto a esta base. Si X es un vector propio | EL TEOREMA ESPECTRAL 267 K, nulo de A en R", entonces el elemento v de V que tiene a X como vector de Kordenadas con respecto a la base es un vector propio no nulo de A en V. K La prueba precedente del teorema 2 se basó en un hecho acerca de los números Knmplejos, a saber: la existencia de un vector propio complejo para una matriz Knmpleja. Usando otra idea que aparece en el cálculo, resulta divertido dar una Kruet»^ diferente para el teorema 2, basada en consideraciones de un máximo Kara una función conveniente. K Denótese con S la esfera unitaria en R": es decir, el conjunto de todos los vec- tores X en R" tales que ||X|¡ = 1. Con cada matriz real simétrica A se asocia la forma cuadrática f: R” -> R gil que f(X) — (AX, X). Ahora veamos los valores de f definida sobre la esfera unitaria. L Teorema 3. Sea A una matriz simétrica real de n x n. Sea \ fW = (AX,xy para X e R". Supóngase que v está en la esfera unitaria tal que f(v) Si f(X) para todo X en esta esfera. Entonces v es un vector propio de A. | Prueba. Sea w un vector unitario en R" que es perpendicular a v. Se demuestra | fácilmente que existe una curva diferenciable f C:(a,b)->R" que está sobre la esfera, definida sobre un intervalo abierto que contiene al 0, I. tal que CÍO) = v y tal que el vector tangente de C en 0 es w, a saber: C(0) = w. j [Por ejemplo, la curva C(t) = (eos t)i> + (sen t)w i es una curva de ese tipo.] Como /(v) = /(C(0)) es un máximo para / sobre S. i es un máximo para f °C sobre el intervalo (a,b) y, por tanto,(/°C)'(0) = 0. Pero i mediante el empleo de la regla para la derivación de un producto, se tiene (/oQ'(í) = ^<AC(t),C(t)> at = <AC(t),c(t)y + <AC(t),c(t)y = <C'(í),AC(t)> + (C(t),AC(t)y = 2<AC(t), C'(t)>- De donde o = (J o C)'(0) = 2<AC(0), C'(0)> = 2<y4tz, w>. Por tanto, Av es perpendicular a todo vector w que sea perpendicular a v y se in- fiere que Av está en el espacio generado por v; en otras palabras, existe AeR, tal que Av = Ai?. Esto prueba el teorema. tnmnnnuntmtut
268 ALGEBRA LINEAL EL TEOREMA ESPECTRAL 269 Usando el hecho que se prueba en el análisis de que la estera es compaqj! y, por tanto, que cualquier función continua tiene un máximo, se puede conclu¡r' que existe siempre un vector como el que aparece en el teorema 3 y asi es com0 dado otra prueba de la existencia de un vector propio de A. Ejercicios I Sea A una matriz simétrica real de 3 x 3. Sea f(X] = (AX, X) para todo -YeR". Sq p un vector en la elipsoide definida por la ecuación 3x2 + 4y2 + 5z2 = 1, tal que f(y) S f(X) para todo X en la elipsoide. Demostrar que ti es un vector propio de A. 2. De manera más general, sea <p : R3 -» R una función continuamente diferenciable. Sea X la superficie definida por la ecuación <p(X) = 0. Supóngase que Para ca^a ? en ?raá n( /’> 0 y supóngase que S es cerrado y acotado. Sea A una matriz real simétrica 3 x 3 j sea y(X) = (AX, X). Sea v un punto de S tal que f(v) g f(X) para todo X en S. Demos- trar que v es un vector propio de A. 3. sea A una matriz real n x n (no se supone que es simétrica). Sin embargo, supóngase que todos los valores propios de A son reales. Demostrar que A tiene un vector propio no nulo. §2. El teorema espectral Hagamos de nuevo algunas consideraciones de tipo algebraico. En toda esta sección se supone que V es un espacio vectorial de dimensión finita sobre R con un producto escalar definido positivamente También se supone que dim V g 1. Teorema 4. Sea A:V-> V una aplicación lineal simétrica. Sea v un vector propio no nulo de A. Si w es un elemento de V perpendicular a v. entonces Aw también es perpendicular a i\ Prueba. Absolutamente trivial: (.Aw. r> = <w. Av) = <hUi-> = j(w. v) = 0. Teorema 5. Sea A : V -> V una aplicación lineal simétrica. Entonces existe una base ortogonal de V que consta de los vectores propios de A. Prueba. Por inducción sobre la dimensión de V. Si dim V = no hay nada que probar. Supóngase que dim V > 1. Por el teorema 2, existe un vector propio ¡jo nulo v, de A en V. Sea W = vf- el espacio ortogonal de iq. Entonces dim W = dim V — 1. por el teorema 4, A aplica a W en si mismo. Nótese que W tiene un producto escalar definido positivamente, a saber: el inducido por el producto escalar de V. Adenfas, si se considera a A como una aplicación lineal de W en si mismo, entonces es simétrica. Por inducción, existe una base ortogonal de W que está constituida por vectores de A, digamos {v2,..., t>„}. Entonces i’¡ es perpendicular a iq para [cada i > 1 y, por tanto, {ot,es la base cuya existencia se afirmaba en el [ teorema. Ejemplo. Sea A la matriz /2 1\ ' V 37 Hállese una base ortogonal de R2 que conste de vectores propios de A. Los valores propios de A son I 5 ± V5 F 2 ’ * (Se determinan tales valores mediante ecuaciones lineales, o bien como raíces e del polinomio característico, que es t2 — 5t + 5.) Al resolver para un vector propio, i debemos resolver las ecuaciones 2x + y = 5 + V5 2 x + 3y = 5 2 y- i Se halla x = 2, y ~ 1 + ^/S. Así, t / 2 X es un vector propio. El espacio ortogonal a tq tiene dimensión igual a 1, de donde se deduce que está constituido por todos los múltiplos reales de un vector perpen- ¡ dicular a Vp Se puede considerar, por ejemplo, que . ”-G-W Necesariamente este elemento es un vector propio de A, ya que A aplica al espacio ortogonal a tq en sí mismo. Entonces, {tq, v2} es la base deseada.
270 ALGEBRA LINEAL Corolario. Sea A una matriz real simétrica de n x n. Entonces, existe unj matriz unitaria real U n x n tal que 'UAU = U~lAU es una matriz diagonal Prueba. Considérese A como la matriz asociada de una aplicación linea)] F: R" - ♦ R” relativa a la base estándar Si = {e1, ..., e"}. Por el teorema 5, sj puede hallar una base ortonormal Si’. = {«p, ..., >v„} de R” tal que M*-'(P) diagonal. (Vea el ejercicio 2 que aparece en esta sección.) Sea U - Entonces IT'AU es diagonal. Más aún, U es unitaria. Ciertamente, sea U = (ci;). Entonces, n w¡ ~ 52 ^eiev, i , a. v= i Las condiciones w¡ • w, = 1 y w¡ = 0 si i =£ j implican, como de inmediato se puede ver, que 'UU — I, esto es: que ’U = U~*. Esto prueba el corolario. Observación 1. En el teorema 5, trabajamos con dos formas sobre el espacio vectorial V; primero, con la forma definida positivamente <, > y luego con la forma g tal que g(”, w) = w5. Observamos que una base ortogonal {t>f, de V constituida por vectores propios de A también es una base ortogonal para la segunda forma. Prueba. g(Vi,Vj) = <Av„Vj) = <A¡V¡,1>,> = Esta última expresión es igual a 0, obviamente, si i j, con lo que se prueba que nuestra base es también ortogonal para la segunda forma. Observación 2. El producto escalar dado y definido positivamente sobre V, origina una forma cuadrática f¡: V R tal que /i(f) = <»,»> El operador A da origen a una segunda forma cuadrática (¡no es necesario que sea definida positivamente!), a saber: la forma f2 tal que /2(v) = <Xv,v>. Sea {Pj,..., t?n} una base ortogonal de V constituida por vectores propios de A. Sea c¡ = <p¡, Vi). Sea v — x,vt + • • • + x„v„, x,eR donde X es el vector de coordenadas de v con respecto a la base. Entonces, Av = x,Atv, + + x„A„v„,
EL TEOREMA ESPECTRAL 271 si 2i,, 2„ son los valores propios de A correspondientes a v1;..., v„ respec- tivamente. En consecuencia, Ji(v) = CiX2t + + Cnxi y f2(v) = ¿iCixl + • • • + ü„c„x2. se interpreta diciendo que las dos formas cuadráticas están diagonalizadas simultáneamente. Se puede enunciar el teorema 5 diciendo que dos formas cua- dráticas reales, una de las cuales está definida positivamente, se pueden diagonalizar simultáneamente. Una base que tenga las propiedades enunciadas en el teorema 5 se conoce como base espectral para A Ejercicios 1. Determínese una base ortogonal de R2 que esté constituida por vectores propios de matriz dada. 2/ 2. Sea A una matriz real simétrica normal de R" constituida por vectores n x n. Demostrar que se propios de A. puede hallar una base orto- »i 3. Sea V tal y como aparece en §2. Sea A V—♦ v2 vectores propios de A con valores propios trar entonces que v¡ es perpendicular a o2. V una aplicación lineal simétrica. Sean 12 respectivamente. Si / Á2, dernos- 4. Sea A una matriz real simétrica 2x2. Demostrar que si los valores propios de A son distintos entre si, entonces sus vectores propios forman una base ortogonal de R2. tiene 5. Sea V tal y como aparece en §2. Sea A : V V una aplicación lineal simétrica. Si A sólo un tituida valor propio, entonces demostrar que cualquier base ortogonal de V está cons- por vectores propios de A. 6. Sea V tal y como aparece en §2. Sea A : V -» V una aplicación lineal simétrica. Su- póngase que dim V que sus vectores propios y que existen n valores propios de forman una base ortogonal de V. A distintos entre si. Demostrar 7. Sea V tal y como aparece en §2. Sea A : V -» V una aplicación lineal simétrica Si el núcleo de A es {O}, entonces ningún valor propio de A es igual a 0 y reciprocamente. n B 8. Demostrar que toda matriz real simétrica se puede escribir en la forma 'UBU donde es diagonal y 17 es unitaria real. 9. Sea V tal y como aparece en §2. Y sea A: V -> V una aplicación lineal simétrica. Probar que las siguientes condiciones sobre A se implican mutuamente. (a) Todos los valores propios de A son > 0. (b) Para todos los elementos ve V, v # O, tenemos que (Av, i>> > 0.
m ALGEBRA LINEAL ti i > aplicación A satisface estas condiciones, se dice entonces que está definida positiva, j mente. Tenemos el mismo resultado cuando se trabaja con R" en sí mismo. Así, entonces, J la segunda condición en términos de los vectores de coordenadas se expresa: j (b) Para todos los vectores X e R”, X O, tenemos que ‘XAX > 0. Jó J minar cuáles de las siguientes matrices están definidas positivamente: «G 0 Z1 2 3\ (d) I 2 0 I \3 ’ । / 2' 1 11. Pruébese que las siguientes condiciones relativas a una matriz simétrica real son equi- valentes. Se dice que una matriz que satisface estas condiciones está definida negativa- mente. (a) Todos los valores propios de A son < 0. (b) Para todos los vectores X eR”, X # O, tenemos que 'XAX < 0. 12. Sea A una matriz rea] simétrica no singular n x n. Probar los siguientes enunciados: (a) Sí J un valor propio de A, entonces i Z 0. (b) Sie:, un valor propio de A, entonces 1 es un valor propio de A ~ ’. (c) Las matrices A y A~ 1 tienen el mismo conjunto de vectores propios. I ' Sea A una matriz real simétrica definida positivamente. Demostrar que A~l existe V que está dclinida positivamente. 14. Sea A una matriz real simétrica cuyos valores propios (todos) son ¡g 0. Demostrar ..ü, existe una matriz B real simétrica tal que B2 = .4 y AB = BA. 15. Probar que una matriz A real simétrica está definida positivamente si y sólo si existe ni’’ matriz N real no singular tal que A = ’NN. [Sugerencia: úsese el corolario del teore- ma 5 y exprésese ’UAU como el cuadrado de la matriz diagonal, a saber B1. Escríbase N = UB~'.\ 16. Sea V tal y como aparece en el §2. Sea A : V V una aplicación lineal simétrica. Haciendo referencia al teorema de Sylvester, demostrar que el índice de nulidad de la forma (v, w) i-» wy s irual a la dimensión del núcleo de A. Demostrar que el índice de positividad es igual al >uu. -.o de vectores propios en una base espectral que tiene un valor propio positivo. 17. Sea V tal como aparece en el §2. Sean A y B dos operadores simétricos de V tales que AB = BA. Demostrar que existe una base ortogonal de V que es una base espectral para A
EL TEOREMA ESPECTRAL 273 y para B simultáneamente, esto es, que consta de los vectores propios, tanto para A como Rpara B. [Sugerencia: Si A es un valor propio de A y V2 consta de todo ve V tal que Av = Av, demostrar que BV2 está contenido en V2. Esto reduce el problema al caso de cuando A = A/.] 18. Sea V tal y como aparece en §2 y sea A: V -» V un operador simétrico. Sean Aj,.. -, A, I ios valores propios de A distintos entre si. Si A es un valor propio de A y, suponiendo que r yJJtpconsta del conjunto de todos los ve V tales que Av = Av, entonces | (a) demostrar que V2(A) es un subespacio de V y que A aplica a V2(A) en sí mismo; h (b) demostrar que V es la suma directa de los espacios ; y que cualesquiera de estos dos subespacios son mutuamente ortogonales. । Se dice que V2(A) es el espacio propio de A correspondiente a A. 19. Manténgase la notación del ejercicio anterior. Supóngase que A está definido posi- tivamente. Demostrar que existe un operador B simétrico definido positivamente de V tal que B2 = A y tal que B está determinado en forma única. [Sugerencia: demostrar primero que los espacios propios de B y de A son iguales, procediendo como a continuación se indica. Sean jii,..., p, los valores propios de B distintos entre si y sea V= V,,(B)®-"®V„(B) la descomposición de V en una suma directa de espacios propios de B. Demostrar que cada V,,,(B) es un espacio propio de A, correspondiente a algún valor propio A¡ de A y que si p,- # entonces A¡ / Aj. Demostrar que s = r, KMJ(B) = y, por tanto, que el efecto de B está determinado en forma única por A] 20. Sea V ta) y como aparece en el §2 y sea A : V -> V un operador invertible arbitrario de V. Demostrar que existen un operador U real unitario y un operador P simétrico defini- do positivamente, tales que A = VP y que V y P están determinados de manera única. [Su- gerencia.' sea P el operador simétrico definido positivamente, tal que P2 = 'AA. Sea U = AP~'. Demostrar que U es unitario. Esto es la prueba de la existencia. Para probar la unicidad, supóngase que A = UtPt, donde U, es unitario y Pi es simétrico definido positivamente. Sea l/2 = PPi '• Entonces I — 'U2Ui (¿por qué?) y, por tanto, P2 = P2. Empléese el ejercicio 19 para concluir qüe P = Pt y finalmente, demostrar que V = Ut.J 21. Si PIt P2 son dos matrices reales simétricas definidas positivamente (del mismo ta- maño) y si t y u son números reales positivos, entonces demostrar que tPt + uP2 es simé- trica definida positivamente. 22. Sea V tal y como aparece en el §2 y sea A : V -» V un operador simétrico. Sean A|,..., Ar los valores propios de A distintos entre si. Demostrar que (A - AJj - M - A,7) = O. 23. Sea V tal y como aparece en el §2 y sea A : V -► V un operador simétrico. Se dice que un subespacio W de V es invariante bajo A, si Awe W para todo we W. es decir, A W c W. Probar que si A no tiene otro subespacio invariante distinto de O y de V, enton- ces A = Al para algún número A. [Sugerencia: demostrar primero que A tiene sólo un valor propio. ]
274 ALGEBRA LINEAL §3 . El caso complejo Como es costumbre, tenemos un resultado análogo al teorema espectral en el caso complejo. Teorema 6. Sea V un espacio vectorial de dimensión finita, sobre los números complejos, con dimensión > 0. Sea <, > una forma hermitiana definida po¡¡. tivamente sobre V. Sea A: V -> V una aplicación lineal hermitiana. Entonces existe una base ortogonal de V constituida por vectores propios de A. Prueba. Igual que la prueba del teorema 5. Como ejercicios adicionales, háganse todas las observaciones relativas al caso hermitiano que son análogas a las que se hicieron en la sección precedente acerca del caso simétrico. Nótese, además, que si {pj, ..., v„] es una base como la que aparece en el teorema, entonces la matriz de A relativa a esta base es una matriz diagonal real. Esto significa que la teoría de las aplicaciones hermitianas (o las matrices) se puede manejar tal como en el caso real. Ejercicios En los siguientes ejercicios, suponemos que V es un espacio vectorial de dimensión fini- ta sobre C, con un producto hermitiano definido positivamente. Se supone además, que dim V > 0. 1. Se dice que un operador A : V -> V es normal si AA* = A*A. Si A es normal, entonces enunciar y probar un teorema espectral para A. [Sugerencia para la prueba: determinar un vector propio común para A y A*.] 2. Si f es un polinomio con coeficientes reales y A es un operador hermitiano, entonces demostrar que f(A) es hermitiano. 3. Definir lo que se entiende por definido positivamente para los operadores hermitianos y probar los enunciados semejantes a los de los ejercicios 9 y 12 del §2. 4. Si A es hermitiano y definido positivamente, entonces demostrar que existe un ope- rador hermitiano B tal que B2 = A y AB = BA. ¿Está determinado B en forma única? 5. Un operador hermitiano A se conoce como positivo (no necesariamente definido) si todos sus valores propios son 2:0. Demostrar que esta condición es equivalente a la condi- ción (Av, t>> § 0, para todo ve V. 6. Demostrar que un operador hermitiano positivo A tiene una raíz cuadrada, es decir, un operador hermitiano positivo B tal que B2 = A y tal que B está determinado en forma única. 7. Demostrar que la matriz es positiva y hallar una raíz cuadrada.
EL TEOREMA ESPECTRAL 275 8. Sea A un operador hermitiano. Demostrar que existen operadores hermitianos po- sitivos Pt, P2, tales que A = Pt — P2. 9. Sea A un operador invertible. Demostrar que existen un operador U unitario com- plejo y un operador P hermitiano definido positivamente, tal que A = UP donde U y P están determinados de manera única. [Sugerencia: procédase como en el ejercicio 20, §2.] * t 10. Sean A y B operadores normales tales que AB = BA. Demostrar que AB es normal. 11. Sea A una matriz hermitiana n x n. Demostrar que existe una matriz U unitaria com- pleja n x n tal que U*AU es una matriz diagonal. Determinar una matriz U como la men- cionada, cuando A es igual a: 12. Sea A una matriz compleja no singular. Demostrar que A es hermitiana definida po- sitivamente si y sólo si existe una matriz N no singular, tal que A = N*N. §4 . Operadores unitarios En el teorema espectral de la sección anterior, hallamos una base ortogonal para el espacio vectorial, constituida por los vectores propios para un operador hermitiano. Ahora, trataremos el caso análogo para un operador unitario. Sea V un espacio vectorial de dimensión finita sobre los reales con un producto escalar definido positivamente. Sea T'.V-rV un operador unitario. Esto quiere decir que T satisface cualquiera de las siguientes condiciones equivalentes: T preserva la longitud, es decir: ||Tv|| = ||v|| para todo ve V. T preserva productos escalares, es decir: (Tv, Tw> = <v, w) para v, we V. T aplica a vectores unitarios sobre vectores unitarios. Veamos, primero, dos ejemplos sencillos. dim V = 1. Entonces V tiene una base que consta de un elemento {v} y Tv = + v, ya que T preserva la longitud y Tv = cv para algún ceR. De donde c debe ser +1. dim V = 2.
276 ALGEBRA LINEAL Sea {p. w} una base ortonormal de V. Escríbase Tv = av + bw, Tw = cv + dw donde a, b, c, JeR. Entonces, la matriz que representa a T con respecto a esta base es (a c’\ b dj Como estamos en el caso real, nótese que T* = 'T es la traspuesta de T y que T* = T"1 Como det(T) — det('T) y det(TT*) = 1, se infiere que det T = 1 o bien det T = — 1. Analicemos estos dos casos. Caso I. det T = 1. Como Tv tiene longitud igual a 1, se tiene av + bw, av + bw = 1 y, por tanto. (1) a2 + b2 = 1. Análogamente, (2) c2+d2 = l. Sin embargo, T también preserva la perpendicularidad y como <v, w> = 0, a partir de <Tv, Tw> = 0, se concluye que (3) ác + bd = 0. Entonces, ac = —bd y a2c2 = b2d2. Multipliqúese a (1) por c2 y sustitúyase el último valor b2d2 por a2c2. Se obtiene b2 = c2, de donde b = + c, y, además. o2 = d2, por lo que a = +d. Añonamos que b = — c. De lo contrario, b -c asi que fr# Oye# 0 (debido a que en este caso b = c). Entonces, de (3) se halla a - —d y, por tanto, el determinante de T es — a2 — c2 que es igual a — 1, contrario a la suposición del caso presente. De donde, en este caso, tenemos que b = — c. También tenemos que a = d. ya que de otra manera
EL TEOREMA ESPECTRAL 277 a = — d 0, y de (3) se concluiría que b = c. Por tanto, la matriz de T es del tipo Entonces se puede hallar un número 0 tal que a = eos 6 y b = sen 0, asi que la m&tpz de T es del tipo eos 9 — sen 0 sen 0 eos 0 y se ve que T es una rotación determinada por 0. Caso 2. det T — —1. Entonces se multiplica T por la aplicación lineal S cuya matriz con respecto a la base dada es -1 0\ 0 1/ Nótese que Sv = — v y que Sw = w. Así, se puede interpretar S como una reflexión sobre w. El diagrama correspondiente es: Obsérvese que det S = — 1 y, por tanto, que det TS = 1. Así, se puede analizar TS mediante el estudio anterior y resulta ser una rotación. Sea R = TS. Multi- plicando ambos miembros de la igualdad por S y observando que S2 = I, hallamos T = RS por lo que T es igual a una reflexión seguida de una rotación. Reduciremos ahora el caso general a los casos anteriores. Teorema 7. Sea V un espacio vectorial de dimensión finita sobre los reales, con dimensión > 0, y con un producto escalar definido positivamente. Sea T un operador unitario sobre V. Entonces, V se puede expresar como una suma directa V = V. © • • • © K de subespacios T-invariantes, que son mutuamente perpendiculares (es decir: es ortogonal a Vj si i j) y dim V¡ es igual a 1 ó a 2 para cada i.
278 ALGEBRA LINEAL Prueba. La prueba es muy semejante a la que se hizo para el teorema espec. 1 tral, aunque en eí caso presente debemos tomar en cuenta la posibilidad de qUe | dim V¡ = 2. Esencialmente, damos la prueba en dos lemas. Lema 1. Existe un subespacio T-invariante W de V que tiene dimensión igual a 1 o bien igual a 2. Prueba. Sea f el polinomio característico de T; factorícese f en un producto de factores irreducibles sobre los reales, a saber /(t) = P1(t) - donde pj es irreducible y tiene coeficiente inicial igual a 1. Entonces, el grado de p¡ es 1 ó 2. No se supone que los p¡ sean distintos necesariamente. Sabemos que J(T) = O. De donde para cualquier ve V, v 0 tenemos que f(T)v = O. Con- sideremos el primer índice j 2: 1 tal que pl(T)...pi(T)v = O. Entonces, p((T) ... pj-i(T)v O, y se escribe w = Pi(T)... Pj-i(T)a. Tenemos que p(T)w = O aunque w / O, donde p(t) = pj(t). El grado de p(t) es igual a 1 ó 2. Si grad p = 1, entonces se puede escribir p(t) = t + b con alguna constante b y, por tanto, Tw + bw = O de donde, Tw = — bw. Así, entonces, w es un vector propio para T y el espacio generado por w satisface nuestros requisitos. Si grad p = 2, entonces se puede escribir p(t) = t2 + at + b donde a y b son constantes reales y T2w + aTw + bw = 0. De donde T2w = — aTw — bw. Sea W el espacio generado por w y Tw. Entonces, dim IV 2 y la fórmula que se acaba de derivar muestra que W es T-invariante, lo que prueba así nuestro lema. Lema 2. Sea W un subespacio T-invariante de V. Entonces W1 también es T-invariante. Prueba. Sea ve W1 de tal manera que <w, v> = 0 para todo weW. Recuér- dese que T* = T~ *. Como T | W: W W aplica a W en sí mismo y como T
EL TEOREMA ESPECTRAL 279 tiene núcleo {0}, se deduce que T 1 aplica también a W en sí mismo. Ahora <w, Tv> = (T*w, v) = <T-Iw, = 0, jo que prueba así el segundo lema. La conclusión de la prueba del teorema 7 es simple rutina aplicando la in- ducción. Antes, se halló un subespacio V¡ T-invariante de dimensión igual a 1 ó’ ?. Entonces, dim Kf < dim V y, por inducción, se puede expresar como una suma directa de subespacios T-invariantes que son mutuamente ortogonales, de dimensión igual a 1 ó a 2. Esto prueba el teorema 7. El teorema 7 nos da una buena descripción del efecto de un operador uni- tario sobre los reales. Siempre podemos hallar una descomposición del espacio V en una suma ortogonal tal que sobre cada sumando, T es una rotación, una re- flexión o una rotación seguida de una reflexión. En términos de una base para el subespacio V¡ del teorema, podemos enunciar un corolario. Corolario. Sea V un espacio vectorial de dimensión finita sobre los reales con dimensión > 0 y con un producto escalar definido positivamente. Sea T un operador unitario sobre V. Entonces existe una base de V, tal que la matriz de T con respecto a esta base consta de bloques Mi 0 0 \ 0 m2 ••• 0 \ ¿ ó M, 1 tal que cada uno de los es una matriz 1 x 1 o una matriz 2 x 2 de los si- (1), (-1), guientes tipos: eos 9 — sen (A / — cosO senO senfl cosOJ’ \ sen0 cosO El caso complejo Aunque discutimos primero el caso real, el caso complejo es, en cierto sentido. sencillo aún. mas Teorema 8. Sea V un espacio vectorial no nulo de dimensión finita sobre los números complejos, con un producto hermitiano definido positivamente. Sea T: V-» V un operador unitario. Entonces V tiene una base ortogonal cons- tituida por vectores propios de T. Prueba. Sea Vj un vector propio no nulo y sea Vi el espacio de 1 dimensión generado por u1 Al igual que en el lema 2, se ve que el complemento ortogonal Vj es T-invariante y, por inducción, se puede hallar una base ortogonal {v2, ...,
280 ALGEBRA LINEAL de V, que consta de vectores propios para T. Entonces, {vt,..., u„} es la base deseada de V. Observación. Ya habíamos probado el teorema 8 en el capítulo sobre triangu. lación,a saber: en el teorema 4 del capitulo X, §3. Sin embargo, la prueba que se da ahora es, en cierto sentido, más natural, ajustándola a la del teorema espectral para aplicaciones hermitianas. Como un valor propio de un operador unitario tiene valor absoluto igual a 1 se puede expresar en la forma e1* donde 0 es real y, nuevamente, se ve que en este caso el operador unitario se puede interpretar como una rotación sobre el espacio complejo de 1 dimensión (y, por consiguiente, sobre el espacio real de 2 dimen- siones) generado sobre C por un vector propio complejo. Así, entonces, los teoremas 7 y 8 combinados muestran geométricamente que se puede obtener un operador unitario como una composición de rotaciones y de reflexiones.
CAPITULO XII Polinomios y descomposición primaria §1. El algoritmo euclidiano En el capítulo IX se definieron los polinomios y su grado. En este capítulo trabajaremos con las otras propiedades estándar de los polinomios. La propiedad básica es el algoritmo euclidiano, o división larga, que se enseña (creemos) en todas las escuelas de enseñanza elemental. Teorema 1. Sean f, g polinomios sobre el campo K, es decir, polinomios en K [t] y supóngase que grad g 0. Entonces existen polinomios q y r en K [r], tales que f(t) = + Ht), y grad r < grad g. Los polinomios q, r estar, determinados en forma única por estas condiciones. Prueba. Sea m = grad g 0. Escríbase f(t) = a„t" + • + a0, g(t) = bmtm + + bQ, donde bm jt 0. Si n < m, sea q = 0, r = f. Si n ¡i m, sea (Este es el primer paso en el proceso de división larga.) Entonces grad ft < grad f. Continuando en esta forma, o más formalmente por inducción sobre n, se pueden hallar polinomios qit r tales que fi = <hg + r, con grad r < grad g. Entonces, f(t) = aJt-H-^t) + ft(t) = a^-f-^t) + qMg(t) + r(t) = (aJú + ^(t) + r(t), y. en consecuencia, se ha expresado el polinomio en la forma deseada. 281
282 ALGEBRA LINEAL Para probar la unicidad, supóngase que 1 f = + r¡ = q2g + r2. | con grad n < grad g y grad r2 < grad g. Entonces, I (<7i - (¡1)9 = r2 - r,. 1 El grado del miembro de la izquierda de la igualdad es grad g o bien el mismo ] miembro es igual a 0. El grado del miembro de la derecha de la igualdad es < grad gt j o bien el mismo miembro es igual a 0. Por tanto, la única posibilidad es que ambos > sean iguales a 0, de donde j Qt = Qi y ri = r2, como se quería mostrar. Corolario 1. Sea f un polinomio no nulo en K[t]. Sea a e K tal que /(a) = o Entonces, existe un polinomio q(t) en K [t] tal que f(t) = (t- a)q(t). Prueba. Se puede escribir /(í) = q(t)(t - a) + r(t), donde grad r < grad(t — a). Pero grad(t — a) = 1. De donde r es constante. Como 0 = /(a) = q{a.)(a - a) + r(a) = r(a), se deduce, como se deseaba, que r = 0. Corolario 2. Sea K un campo tal que todo polinomio no constante en K[t] tiene una raíz en K. Sea f dicho polinomio. Entonces, existen elementos alf ... ,a„eK y ce K tales que f(t) = c(t - a,) - -(t - a„). Prueba. Nótese en el corolario 1 que grad q = grad f — 1. Sea a = aj en el mismo corolario 1. Por suposición, si q no es constante, se puede hallar una raíz a 2 de q y así se puede escribir /(O = ?2(í)(í - «i)(t - a2). Procediendo inductivamente, se continúa hasta que q„+i es constante. Suponiendo, como lo hacemos, que los números complejos satisfacen las hipótesis del corolario 2, se ve que se ha probado la existencia de una factorización de un polinomio sobre los números complejos en factores de grado igual a 1. En la siguiente sección se probará la unicidad.
POLINOMIOS Y DESCOMPOSICION PRIMARIA 283 Corolario 3. Sea f un polinomio de grado n en K[t]. Entonces existen, cuando más, n raíces de f en K. Prueba. En caso contrario, si m > n y a15 ..., am son raíces distintas entre sí, de f en K, entonces • f /(O = (1 - oti) • • (í - am)g(t) para algunos polinomios g, en donde grad f Si m, lo que es una contradicción. Ejercicios 1. En cada uno de los siguientes casos, expresar f — qg + r con grad r < grad g. (a) f(t) = t1 - 2g + 1, g(t) = t - 1 (b) /(O = t3 + t - 1, g(t) = t1 + 1 (c) /(t) = t3 + t, g(t) = i (d) /(t) = t3 - 1, g(t) = t - 1 2. Si f(t) tiene coeficientes enteros y si g(t) tiene coeficientes enteros y coeficiente inicial igual a 1, entonces demostrar que cuando se expresan / = qg + r con grad r < grad g, los polinomios q y r también tienen coeficientes enteros. 3. Usando el teorema del valor intermedio del cálculo, demostrar que todo polinomio de grado impar sobre los números reales tiene una raíz en ios números reales. 4. Sea f(t) = t" + • • • + a0 un polinomio con coeficientes complejos, de grado n y sea a una raiz. Demostrar que |a| g n • max. laj. [Sugerencia; escribir — a" = a„_ tan“1 + • • + a„. Si |a| > n • max, |a,|, entonces divídase entre a" y tómese el valor absoluto, junto con un cálculo sencillo, para obtener una contradicción.] §2. Máximo común divisor Definiremos una noción que viene a ser al conjunto de los polinomios K [í] lo que un subespacio es a un espacio vectorial. Un ideal de K[t], o un ideal de polinomios, o, más brevemente, un ideal es un subconjunto de J de K[t] que satisface las siguientes condiciones: El polinomio nulo está en J. Si f, g están en J, entonces f + g está en J. Si f está en J y g es un polinomio arbitrario, entonces gf está en J. A partir de esta última condición, se observa que si ce K y f está en J, enton- ces cf está también en J. Así, un ideal puede ser considerado como un espacio vectorial sobre K. Pero es más que eso, en vista de que existe la multiplicación por elementos arbitrarios de K[r], no sólo por constantes. Ejemplo 1. Sean fi, ,fn polinomios en K[t]. Sea J el conjunto de todos los polinomios que se pueden escribir en la forma 9 = 9lfl + + 9nfn con algún g¡eK[t]. Entonces, Jes un ideal. Ciertamente, si = ^i/i + • • • + h„fn
284 ALGEBRA LINEAL con h¡£ K[t], entonces, S + h — (.91 + (11)/1 + ' ’ ’ + (#n + también está en J. Además, 0 = 0/, + • • • + 0/„ está en J. Si f es un polinomio arbitrario en K[t], entonces, fg = í/9i)/i + ' ’ + (foM' también está en J. Así. se satisfacen todas las condiciones. Se dice que el ideal J que aparece en el ejemplo 1 está generado por /[,... y se dice que .... f„ es un conjunto de generadores. Nótese que cada una de las f está en el ideal J del ejemplo 1. A saber: fi = 1 ’ fi + 0/z + • ‘ + 0/„. Ejemplo 2. El elemento 0 es un ideal. Además, el propio K[t] es un ideal. Nótese que 1 es un generador para K[t], al cual se conoce como ideal unitario. Ejemplo 3. Considérese el ideal generado por los dos polinomios t — 1 y t — 2. Afirmamos que es el ideal unitario. A saber: (t - 1) - (r - 2) = 1 está en él. Asi, puede ocurrir que se den varios generadores para un ideal y que aún podamos encontrar un generador sencillo para él. Describiremos con más precisión la situación en ios teoremas subsecuentes. Teorema 2. Sea J un ideal de K[t]. Entonces, existe un polinomio g que es un generador de J. Prueba. Supóngase que J no es el ideal nulo. Sea g un polinomio en J, el cual no es igual a 0 y que es de mínimo grado. Aseguramos que g es un generador de J. Sea f cualquier elemento de Por el algoritmo euclidiano, sabemos que se pueden encontrar polinomios q, r, tales que / = gg + r con grad r < grad g. Entonces, r = f — qg y, por la definición de un ideal, se de- duce que r también está en J. Como grad r < grad g, se debe tener r = 0. De donde f = qg y g es un generador de J, como se deseaba. Observación. Sea g¡ un generador no nulo de un ideal J y sea g2 también un generador. Entonces, existe un polinomio q tal que g¡ = qg2. Ya que grad#! = grad# 4- grad#2, se sigue que grad g2 S grad g2. Por simetría, se debe tener grad #2 = grad#,.
POLINOMIOS Y DESCOMPOSICION PRIMARIA 285 | pe donde q es una constante. Se puede escribir 1 gt = cg2 donde c es alguna constante. Escríbase <h(t) = a’f + • + «O doníe a„ 0. Considérese b = «„" *. Entonces, bg2 también es un generador de J y su coeficiente inicial es igual a 1. Asi, siempre podemos encontrar un generador para un ideal 0) cuyo coeficiente inicial es igual a I. Además, es claro que este generador está determinado de manera única. Sean /, g polinomios no nidos. Decimos que g divide a f y se escribe g | f, si existe un polinomio q tal quej = gq. Sean j\,f2 polinomios 0. Un polinomio g se llama máximo común divisor de f¡,f2 si g divide a y J2 y si, además, n también divide a /r y f2, entonces h divide a g. Teorema 3. Sean ft y f2 polinomios no nulos en K[t]. Sea g un generador del ideal generado por j\,f2. Entonces g es un máximo común divisor de y f2. Prueba. Como J\ está en el ideal generado por fi, f2, existe un polinomio q¡ tal que fi = de donde g divide a /t. Análogamente, g divide a f2. Sea h un polinomio que di- vide tanto a j\ corno a f2. Escríbase /i = *1* Y fi = h2h donde h¡ y h2 son algunos polinomios. Como g está en el ideal generado por f2, existen polinomios g¡, g2 tales que g = gtf¡ + g2f2, por lo que g -= gihih + g2h2h = + g2h2)h. En consecuencia, h divide a g, con lo que queda demostrado el teorema. Observación 1. El máximo común divisor está determinado excepto en un múltiplo constante no nulo. Si se selecciona un máximo común divisor con coefi- ciente inicial igual a 1, entonces está determinado en forma única. Observación 2. Se aplica exactamente la misma prueba cuando se tienen más de dos polinomios. Por ejemplo, si fit..., f„ son polinomios no nulos, y si g es un generador del ideal generado por ft, entonces g es un máximo común divisor de ft.....f„. Se dice que los polinomios J\, ..., f„ cuyo máximo común divisor es igual a 1 son primos relativos.
286 algebra lineal Ejercicios 1. Demostrar que t" — 1 es divisible entre l - 1. 9 2. Demostrar que í4 + 4 se puede factorizar como un producto de polinomios de grado 2 I con coeficientes enteros. I 3. Si n es impar, hallar el cociente de dividir at"+ I por t + I. 4. Sea A una matriz n x n sobre un campo K y sea J el conjunto de todos los polinomios 9 f(t) en K[t] tales que f(A) = O. Demostrar que J es un ideal. I §3. Factorización única I Se dice que un polinomio p en K[t] es irreducible (sobre K) si es de grado 1. 1 y si, dada una factorización p = fg con f, ge K[t] entonces grad f o grad g = 0 (es decir, uno de los dos f o g es constante). Así, salvo un factor constante no nulo, I los únicos divisores de p son el propio p y 1. 1 Ejemplo 1. Los únicos polinomios irreducibles sobre los números complejos | son los polinomios de grado 1, esto es: los múltiplos constantes no nulos de los 1 polinomios del tipo t - a, donde aeC. I Ejemplo 2. El polinomio t2 + 1 es irreducible sobre R. I Teorema 4. Todo polinomio en K[t] de grado 2: 1, se puede expresar como I un producto p¡ p„ de polinomios irreducibles. En dicho producto, los poli- I nomios pi, ..., pm están determinados de manera única, salvo reordenamientos 1 y salvo factores constantes no nulos. 1 Prueba. Probaremos primero la existencia de la factorización en un producto I de polinomios irreducibles. Sea f en K[t] de grado 2 1. Si f es irreducible, el I problema está resuelto. En caso contrario, se puede escribir I / = 9h I donde grad g < grad f y grad h < grad f. Si g, h son irreducibles, el problema I está resuelto. En caso contrario, de nuevo se factorizan g, h en polinomios de I grado menor. No se puede continuar este proceso indefinidamente y, por tanto, I se ha encontrado una factorización para f. (Obviamente, podemos considerar I la prueba como una inducción.) I Ahora hay que probar la unicidad. Para eso requerimos del siguiente lema: 1 Lema. Sea p irreducible en K[t]. Sean f, ge K[t] polinomios no nulos y su- 1 póngase que p divide a fg. Entonces p divide a f o p divide a g. | Prueba. Supóngase que p no divide a f. Entonces, el máximo común divisor | de p y de f es igual a 1 y, por tanto, existen polinomios hl,h2 en K[t] tales que 3 1 = htp + h?/. 5
POLINOMIOS Y DESCOMPOSICION PRIMARIA 287 (Usamos el teorema 3.) Al multiplicar por g se obtiene g = ghiP + h2fg. pero fg - ph3 para algún h3, de donde g = (g/ij + h2h3}p, y p íivide a g, como se quería demostrar. B El lema se aplica cuando p divide a un producto de polinomios irreducibles E q i • • q¡- En ese caso, p divide a q, o p divide a q2 - • • q¡. De donde existe una cons- E tante c tal que p = cqt,o p divide a q2 • • • q,. En d último caso se procede induc- I tivamente y se concluye que, en cualquier caso, existe algún i tal que p y q¡ difieren K por un factor constante. | Supóngase ahora que tenemos dos productos de polinomios irreducibles h P1 ’ ‘ ' Pr = ’ ir Luego de renumerar los q¡ se puede suponer que p¡ = Ctq¡ para alguna cons- tante ct. Cancelando q¡, se obtiene ctPz''' Pr = 41" ' ?r Repitiendo el argumento inductivamente, se conduye que existen constantes c, tales que p¡ = para todo i, después de hacer una posible permutación de ii, ..., qs. Esto prueba la unicidad deseada. Corolario 1. Sea f un polinomio en de grado 2: 1. Entonces, f tiene una factorización f = cpi • • p„ donde p2,..., p, son polinomios irreducibles con coeficiente inicial igual a 1, determinada en forma única salvo una permutación. Corolario 2. Sea f un polinomio enCfij, de grado 2: 1. Entonces f tiene una factorización f(t) = cft -«!)•••(* - a»), con a¡eC y ceC. Los factores t — a¡ están determinados en forma única, salvo una permutación. Trabajaremos principalmente con polinomios que tengan coeficiente inicial igual a 1. Sea f uno de esos polinomios de grado 2; 1. Sean p1; ..., pr los distintos polinomios irreducibles (con coeficiente inicial igual a 1) que aparecen en su fac- torización. Entonces se puede expresar f como un producto f = P‘l " Pr' donde i,.....ir son enteros positivos, determinados en forma única por pt,.... pr. k
288 ALGEBRA LINEAL Se dirá que esta factorización es una factorización normalizada para f. En particu- lar sobre los números complejos, se puede escribir /(O = (t — aj’- -(í - a,)'r- Un polinomio con coeficiente inicial igual a 1 se llama, a veces, mónico. Si p es irreducible y si / = pmg, donde p no divide a g y m es un entero 0. entonces se dice que m es la multiplicidad de p en f. (Se define p° igual a 1.) Se denota esta multiplicidad con ordp/ y, además, se designa como el orden de / en p. Si a es una raíz de f y f(t) = (t - <x)”g(t), con g(a) 0, entonces t — a no divide a g(t), y m es la multiplicidad de t — a en/ También se dice que m es la multiplicidad de a en /. Existe una prueba sencilla para m > 1 en términos de la derivada. Sea /(t) = a„t" + • • • + a0 un polinomio. Definase su derivada (formal) como Df{t) = f(t) = na„t" + (n - i)an-tt"~2 + •• + a,. Entonces se tienen los siguientes enunciados, cuyas pruebas se dejan como ejer- cicios. (a) Si /, g son polinomios, entonces (/ + g)' = f + g'- Además, {fg)' = fg + fg'- Si c es constante, entonces (c/)' = c/'. (b) Sea a. una raiz de / y supóngase que grad f 2: 1. Demostrar que la mul- tiplicidad de a en f es > 1 si y só’o si /'(a) = 0. Por tanto, si /'(a) 0, demostrar que la multiplicidad de a es igual a i. Ejercicios 1. Sea / un polinomio de grado igual a 2 sobre un campo K. Demostrar que / es irre- ducible sobre K o bien que / tiene una factorización en factores lineales sobre K. 2. Sea / un polinomio de grado igual a 3 sobre un campo K. Si / no es irreducible sobre K, entonces demostrar que / tiene una raiz en K. 3. Sea /(t) un polinomio irreducible con coeficiente inicial igual a 1 sobre los números reales. Supóngase que grad f = 2. Demostrar que /(t) se puede escribir en la forma /(t) = (t - a)2 + b2 para algún o, b e R y b 0. Reciprocamente, probar que cualquiera de dichos polinomios es irreducible sobre R.
» 'Twar'’, | POLINOMIOS Y DESCOMPOSICION PRIMARIA 289 f 4. Sea f un polinomio con coeficientes complejos, a saber /W = ®id" + • • • + «o- i Defínase su conjugado complejo /(O = a,t" + • • + a» tonfóMo el conjugado complejo de cada uno de los coeficientes. Demostrar que si f, g están en C [t], entonces (/ + ?) = / + 9, (fg) = fy, y si P e C, entonces (Pf) = Pf. 5. Sea /(t) un polinomio con coeficientes reales. Sea a una raíz de f, que es compleja pero no real. Demostrar que a también es una raíz de f. 6. Manteniendo la misma terminología del ejercicio 5, demostrar que la multiplicidad de a en / es la misma que la de a. 7. Sea A una matriz n x n en un campo K. Sea J el conjunto de los polinomios f en K[t] tales que f(A) = O. Demostrar que J es un ideal. El generador mónico de J se conoce como el polinomio mínimo áeA sobre K. Se tiene una definición semejante para el caso en que A es una aplicación lineal de un espacio vectorial V de dimensión finita en sí mismo. 8. Sea V un espacio vectorial de dimensión finita sobre K. Sea A : V -» V una aplicación lineal. Sea f su polinomio mínimo. Si A se puede diagonalizar (esto es: si existe una base de K que esté constituida por vectores propios de /!), entonces demostrar que el polinomio mí- nimo es igual al producto (r — <zj) - - -(r — a,), donde at, ..., a, son los valores propios de A. diferentes entre sí. 9. Demostrar que los siguientes polinomios no tienen raíces múltiples en C. (a) t* + t (b) t5 - 5t + 1 . (c) cualquier polinomio t2 + bt + c si b y c son números tales que b2 — 4c no es igual a 0. ~ 10. Demostrar que el polinomio r" — 1 no tiene raíces múltiples en C. ¿Puede usted de- terminar todas las raíces y dar su factorización en factores de grado 1? 11. Sean f, g polinomios en K[t] y supóngase que son primos relativos. Demostrar que se pueden hallar polinomios ft, g, tales que el determinante 1/ di |/i di| es igual a 1. 12. Sean ft, f2, f2 polinomios en y supóngase que generan al ideal unitario. Demos- trar que se pueden hallar polinomios f¡j en K[t] tales que el determinante /> f2 f3 f 21 .1 22 f 23 f 3X .1 32 f 33 cs igual a 1.
290 ALGEBRA LINEAL 13. Sea a un número complejo y sea J el conjunto de todos los polinomios f(t) en K[f| tales que /(a) = 0. Demostrar que J es un ideal. Supóngase que J no es el ideal nulo. Demos- trar que el generador mónico de J es irreducible. 14. Sean f, g dos polinomios escritos en la forma f = Pi' • Prr 7 9 = Pll'PÍ' donde i„jv son enteros S 0 y pt,..., p, son polinomios irreducibles distintos entre si. (a) Demostrar que el máximo común divisor de f y g se puede expresar como un producto pí*... pf', donde k¡,..., k, son enteros S 0. Expresar /t„ en términos de i„ y de j„. (b) Definir el minimo común múltiplo de polinomios y expresar al mínimo común múltiplo de f y g como un producto pV • • P*ir con enteros fc„ 0. Expresar k, en términos de i„ y de ¡r 15. ¿Cuáles son el máximo común divisor y el mínimo común múltiplo dé las siguientes parejas de polinomios? (a) (t - 2)J(t - 3)4(t - i) y (t - IXr - 2Xt - 3)3 (b) (t2 + IXt2 - 1) y (t + i)’(z3 - 1) §4. Los enteros La teoría de factorización de los enteros se ajusta muy de cerca a la teoría correspondiente de los polinomios sobre un campo. Denotar con Z a los enteros. Tenemos el algoritmo euclidiano. Teorema 1Sean m, n enteros SO y m > 0. Entonces, existen enteros q, r S 0 con 0 á r < m tales que n — qm + r. Los enteros q, r están determinados en forma única por estas condiciones. Prueba. Si n < m, entonces hacemos q = 0 y r = n. Si n S m, entonces 0 ¿ n — m < n. Por inducción, se pueden hallar enteros q1; r S 0 y r < m tales que n — m = qjtn + r. Entonces, n = m + q¡m + r = (1 + q,)m + r. Esto prueba la existencia. Dejamos como ejercicio que el lector pruebe la unicidad. Definamos como un ideal J de enteros al subconjunto de Z que tiene las si- guientes propiedades: El entero 0 está en J. Si m y n están en J, entonces m + n está en J. Si m está enjyn es un entero arbitrario, entonces nm está en J.
POLINOMIOS Y DESCOMPOSICION PRIMARIA 291 Tal y como se hizo con los polinomios vamos a definir lo que significa que un ideal esté generado por los enteros m¡,..., m„. Tenemos el ideal cero y el ideal unitario (a saber: el propio Z). Teorema 2'. Sea J un ideal de Z. Entonces, existe un entero d que es un gene- rador de J. . f Prueba. Completamente análoga a la del teorema 2. Será conveniente que el lector la efectúe a manera de un ejercicio sencillo. [Sugerencia: en vez de un po- linomio de grado mínimo, tómese el entero positivo mínimo en el ideal]. Tenemos la noción de divisibilidad, definida tal como con los polinomios. Teorema 3'. Sean m¡,m2 enteros positivos. Sea d un generador positivo ideal generado por Entonces, d es un máximo común divisor de mt y m2. Prueba. Seguramente que será para el lector un placer el efectuar la prueba. En realidad, no es otra cosa más que copiar mutatis mutandis, la prueba del teorema 3. Definimos un número primo p como un entero 2 tal que, dada una fac- torización p = mn con enteros positivos m y n, entonces m- 1 o n = 1. Teorema 4'. Todo entero positivo n Sí 2 se puede expresar como un producto de números primos, n = pi Pr, determinado en forma única salvo permutaciones. Prueba. La prueba es una copia de la prueba del teorema 4, omitiendo refe- rencias irrelevantes a las constantes. Ejercicios 1. Sea f(t) = t" + a„-,«*1 + + a0, a0 / 0 un polinomio con coeficientes enteros. De- mostrar que si a es una raíz de f en Z, entonces a divide a a0. 2. Sea f(t) un polinomio de grado 1 con coeficiente inicial igual a 1 y con coeficientes enteros. Demostrar que cualquier raíz de f que sea un número racional debe ser, de hecho, un entero. 3. Demostrar que los siguientes polinomios son irreducibles sobre los números racio- nales. (a) t2 + 1 (b) t2 - 2t + 2 - (c) t2 - t + 4 (d) t3 - t + 1 (e) t3 + 3t - 1 (f) t3 - 4t + 5 4. Sean a, b enteros primos relativos. Demostrar que existen enteros c, d tales que el determinante Ia ^1 c d es igual a I.
292 ALGEBRA LINEAL 5. (Euclides) Demostrar que existe una infinidad de números primos. [Sugerencia: dados números primos Pi,..., p, distintos entre si, construyase uno nuevo de la manera siguiente-. Sea u = pi • p„ + 1. Demostrar que cualquier número primo p que divide a a no puede ser igual a ninguno de los p,.J 6. Enunciar y probar un ejercicio que sea el análogo del ejercicio 14 de la sección ante- rior, para los enteros positivos. 7. ¿Cuáles son el máximo común divisor y el mínimo común múltiplo de las siguientes parejas de enteros positivos? (a) 53263 y 5217 (b) 248 y 28 §5. Aplicación a la descomposición de un espacio vectorial Sea V un espacio vectorial sobre el campo K y sea A: V -» V un operador de K Sea W un subespacio de V. Se dice que W es un subespacio invariante bajo A, si Aw está en W para cada uno de los w en W, es decir, si A W está contenido en IV. Ejemplo 1. Sea Vj un vector propio no nulo de A y sea el espacio de una dimensión generado por up Entonces es un subespacio invariante bajo A. Ejemplo 2. Sea 2 un valor propio de A y sea el subespacio de V que consta de todo t> g V tal que Av — 2v. Entonces, es un subespacio invariante bajo A, conocido como el espacio propio de 2. Ejemplo 3. Sea /(t)e K[t] un polinomio y sea W el núcleo de f(A). Entonces, W es un subespacio invariante bajo A. Prueba. Supóngase que f(A)w = O. Como tf(t) = f(t)t, se obtiene Af(A) = f[A)A, de donde f(A)(Aw) = f(A)Aw = Af(A)w = O. Así, Aw también está en el núcleo de f(A), con lo que se prueba nuestra afirmación. Nótese en general que para cualesquiera dos polinomios f, g se tiene f(A)g(A) = g(A)f(A) ya que f(t)g(t) — Este hecho se emplea con frecuencia en lo que sigue. Describiremos ahora cómo la factorización de un polinomio en dos factores cuyo máximo común divisor es igual a 1, da lugar a una descomposición del espacio vectorial V en una suma directa de subespacios invariantes.
POLINOMIOS Y DESCOMPOSICION PRIMARIA .293 Teorema 5. Sea f(t)eJí[t] un polinomio y supóngase <fte f ~f¡f2, donde /i>/2 son polinomios de grado S 1 y su máximo común dirisor es igual a 1. Sea A: V-> V un operador. Supóngase que f(A) = O. Se» E Wi = núcleo de fi(A) y W2 = núcleo de fdA). K . £ monees V es la suma directa de Wi y W2. S Prueba. Por suposición, existen polinomios g\,g2 tales que k thW/iG) + = 1- g De donde I'’ (*) + 9i(A}f2(A} = I. I e ; Sea v e V. Entonces, v = 9dA)fi(A)v + g2(A)f2(A)v. El primer término de esta suma pertenece a JV2, ya que f2(A)gdA)fdA)v = 9dA)fdA)f2(A)v = gAA)f(A)v = O. Análogamente, el segundo término de esta suma pertenece a W2. Asi, V es la suma de Wt y W2. Para mostrar que esta suma es directa, se debe probar que una expresión V = Wj + w2 con w¡ e WZ1 y w2 e W2, está determinada en forma única por v. Al aplicar gdA)fi(A) a esta suma, se obtiene íhMUiM)» = gd.A)fdA)w2, debido a que /i(4)wi = 0. Aplicando la expresión (*) a la propia w2, se obtiene "2 = gdA)fdA)w2, debido a que f2(A)w2 — O. En consecuencia W2 = gi(A)ft(A)v y, por tanto, w2 está determinada de manera única. Análogamente, wt = g2(A)f2(A)v está determinada de manera única y, por consiguiente, Ja suma es directa. Esto prueba el teorema. El teorema 5 se aplica además cuando f se expresa como un producto de varios factores. A continuación se enuncia el resultado sobre los números com- plejos.
POLINOMIOS Y DESCOMPOSICION PRIMARIA 295 294 algebra lineal Teorema 6. Sea V un espacio vectorial sobre C y sea A: V -> V un operador Sea P(t) un polinomio tal que P(A) = O y sea P(t) = (í - «!)"" • -(t - arr su factorización, donde a... ,ar son las raíces distintas entre sí. Sea U¡ el núcleo de (A — a¡l)m'. Entonces, V es la suma directa de los subespacios U¡,. ..,U Prueba. La prueba se puede efectuar por inducción, descomponiendo a los factores (t — at)"", (t — a2)"2,... uno a uno. Así, obtenemos primero una des- composición en suma directa en el núcleo Ut de (A — ajy"’ y el núcleo W de (A - aj)"2 • • (A - Ahora, inductivamente, se puede suponer que W está expresado como una suma directa W = U2®--© Ur donde Uj{j = 2,.... r) es el núcleo de (A - a/f2 en W. Entonces, v = ut © u2 © • • • © u, es una suma directa. Aún tenemos que probar que UAj = 2...., r) es el núcleo de (A - en V. Sea V = U¡ + U2 + • + u, un elemento de V, con u, e y tal que v está en el núcleo de (A — Entonces, en particular, v está en el núcleo de (A - a2iy2 - (A - a,l)n', de donde v debe estar en Wy, en consecuencia, ut = 0. Como v está en W, se puede concluir ahora que » = uj, debido a que W es la suma directa de U 2,..., Ur. Ejemplo 4. Sea V el espacio de soluciones (infinitamente diferenciables) de la ecuación diferencial D"f + a„~¡D“ */+••• + aof = 0, con coeficientes complejos constantes a,. Sea P(t) = r' + a,-,!"'1 + ••• + a0. Factorícese P(t) tal y como se hizo en el teorema 6, P(t) = (t - a,)"1 •••(t - arr. Entonces, V es la suma directa de los espacios de soluciones de las ecuaciones diferenciales (£> - ajr/ = 0, para i = 1, ..., r. Así, entonces, el estudio de la ecuación diferencial original se reduce al estudio de la ecuación mucho más sencilla, * (D - a/)mJ = 0. Las soluciones de esta ecuación se hallan fácilmente. Para cualquier a com- plejo, se tiene (D - aff / = ea'Dm(e~"f). (La prueba es una simple inducción.) En consecuencia, f está en el núcleo de (D — al)m si y sólo si D"(e-"/) = 0. Las únicas funciones cuya derivada de orden m-ésimo es igual a 0 son los poli- nomios de grado íS m — 1. Por tanto, el espacio de soluciones de (D — a/)m/= 0 es el espacio generado por las funciones e“, te", ...,tm~ le". Se puede verificar fácilmente que estas funciones son linealmente independientes y, en consecuencia, que el espacio de soluciones es de dimensión finita igual a m. Ejercicios 1. Demostrar que, en el teorema 5, la imagen de ft(A) = núcleo de /2(A). §6. Lema de Schur Sea V un espacio vectorial sobre K y sea S un conjunto de operadores de V. Sea W un subespacio de V. Se dice que W es un subespacio S-invariantesi BW está contenido en W2 para todo B en S. Se dice que V es un S-espacio simple si F / {O} y si los únicos subespacios S invariantes son V mismo y el subespacio nulo. Observación 1. Sea A: V -> V un operador tal que AB = BA para todo BeS. Entonces la imagen y el núcleo de A son subespacios S invariantes de V. Prueba. Supóngase que w está en la imagen de A, por ejemplo w = Av con algún v e V. Entonces Bw = BAv = ABv. Esto muestra que Bw también está en la imagen de A y, por tanto, que la imagen de A es S invariante. Supóngase que u está en el núcleo de A. Entonces, ABu = BAu = O. De donde Bu también está en el núcleo, el cual, por consiguiente, es un subespacio S invariante.
296 ALGEBRA LINEAL POLINOMIOS Y DESCOMPOSICION PRIMARIA 297 Observación 2. Sea S como aparece en la observación anterior y sea A : K-+ p un operador. Supóngase que AB = BA para todo BeS. Si f es un polinom¡0 en K[t], entonces f(A)B = Bf(A) para todo BsS. Pruébese esta afirmación como un ejercicio simple. Teorema 7. Sea V un espacio vectorial sobre K y sea S un conjunto de opera, dores de V. Supóngase que V es un S espacio simple. Sea A : V -♦ V una aplicación lineal tal que AB = BA para todo B en S. Entonces A es invertible, o bien A es la aplicación nula. Prueba. Supóngase que Ay O. Por la observación 1, el número de A es {0} y su imagen es todo V. Por tanto, A es invertible. Teorema 8. Sea V un espacio vectorial de dimensión finita sobre los nú- meros complejos. Sea S un conjunto de operadores de V y supóngase que V es un S-espacio simple. Sea A:V-* V una aplicación lineal tal que AB = BA para todo B en S. Entonces, existe un número A tal que A = Al. Prueba. Sea J el ideal de los polinomios f enC[t] tales que f(A) — 0. Sea 3 un generador de este ideal, con coeficiente inicial igual a 1. Entonces, g / 0. Afir- mamos que g es irreducible. De lo contrario, se podría escribir g — h1h2 con los polinomios ht,h2 de grados < grad g. En consecuencia, h,(A)^ O. Por el teorema 7 y las observaciones 1 y 2, se concluye que fiJA) es invertible. Análogamente, es invertible. Por tanto, hiG4)h2(/l) es invertible, lo cual es imposible y de- muestra que g es irreducible. Pero los únicos polinomios irreducibles sobre los números complejos son de grado 1 y, por tanto, g(t) = t - A para algún AeC. Como g(A) — O, se concluye que A — Al = O, por lo que A = Al, como se quería demostrar. Ejercicios 1. Sea V un espacio vectorial de dimensión finita sobre el campo K y sea S el conjunto de todas las aplicaciones lineales de V en sí mismo. Demostrar que V es un S espacio simple 2. Sea V = R2, supóngase que S consta de la matriz considerada como una aplicación lineal de V en si mismo. En este caso, a es un número real fijo no nulo. Determinar todos los subespacios S-invariantes de V. 3. Sea V un espacio vectorial sobre el campo K y sea {fj,..., v„} una base de V. Para cada permutación <7 de {1, ..., n} considerérese a A, : V -> V como la aplicación lineal tal que A,(v i) = oció- la) Demostrar que para cualesquiera dos permutaciones a, t tenemos A„A, = y A,d = I. R (b) Demostrar que el subespacio generado por v = vt + • • + v„ es un subespacio invariante para el conjunto S„ que consta de todos los A,. H (c) Demostrar que el elemento v de la parte (b) es un vector propio de cada A„. ¿Cuál es el valor propio de A„ correspondiente a t>? (d) Sea n = 2 y sea a la permutación que no es la identidad. Demostrar que i', - v2 ge- ñera un subespacio de una dimensión que es invariante bajo A„. Demostrar que . 1’1 - »2 es un vector propio de A„. ¿Cuál es el valor propio? 4. Sea V un espacio vectorial sobre el campo K y sea A : V -» V un operador. Supóngase I que A' = l para algún entero r ¡5 1. Sea T= 1 + A + • • • + A'~'. Sea t>0 un elemento de V. E Demostrar que el espacio generado por Tv0 es un subespacio invariante de A y que Tv0 es i un vector propio de A. Si Tt>0 / 0, ¿cuál es el valor propio? i 5. Sea V un espacio vectorial sobre el campo K y sea S un conjunto de operadores de ft V. Sean U y W subespacios S invariantes de V. Demostrar que U + W y U r\ W son sub- te espacios S invariantes. §7. La forma normal de Jordán En el capítulo X, §1, probamos que una aplicación lineal sobre los números complejos siempre se puede triangular. Este resultado es suficiente para muchas aplicaciones, pero es posible mejorarlo y hallar una base tal que la matriz de la aplicación lineal tenga una forma triangular excepcionalmente simple. Esto es lo que ahora se hará, usando la descomposición primaria. Primero considérese un caso especial, que después resultará ser más bien típico. Sea V un espacio vectorial sobre los números complejos. Sea A: V -> V una aplicación lineal. Sean ote C y ve V con v # 0. Diremos que v es (A — al) cíclico si existe un entero r 2í 1 tal que (A — al/v = 0. El mínimo entero positivo r que tiene esta propiedad recibe el nombre de período de v relativo a A — al. Si r es dicho período, entonces tenemos que (A — al/v 0 para cualquier entero k tal que 0 k < r. Lema 1. Si v yt 0 es (A — al) cíclico, con periodo r, entonces los elementos v, (A — al)v, ..., (A — al)r~1v son linealmente independientes. Prueba. Sea B = A — al, para simplificar la notación. Una relación de de- pendencia lineal entre los elementos anteriores se puede expresar de la manera siguiente: f(B)v = 0
298 ALGEBRA LINEAL donde f es un polinomio / 0 de grado S r — 1, a saber: cnv + <’i Bu + • • + r,Bsv = 0. con J(í) = c0 + C|t + • + c/y s á r - 1. Tenemos también que B'v = 0, por hipótesis. Sea </(t) = t’. Si h es el máximo común divisor de f y de g, entonces se puede escribir h = fif + gt9, donde j\,gi son polinomios, y así h(B) = f,(B)f(B) + g¡(B)g(B). Se deduce que h(B)v = 0. Pero fi(t) divide a t' y es de grado á r — 1, así que h(t) = td con d < r. Esto contradice a la hipótesis de que r es un período de v y prueba el lema. El espacio vectorial V se conoce como cíclico si existe algún número a y un elemento ve V que es (A — al) cíclico. Si este es el caso, entonces el lema 1 implica que (*) {C4 — al)r 'v, ..., (A — al)v, r} es una base de V. Con respecto a esta base, la matriz de A es, entonces, particu larmente simple. Ciertamente, para cada k se tiene A{A - al)kv = (A — aJ)l+1t> + a(/4 — al/v. Por definición, se infiere que la matriz asociada para A es igual a la matriz triangular con respecto a esta base a 1 0 0 0 0 a 1 ••• 0 1 Ó Ó Ó ••• a í 0 0 0 ••• 0 a Esta matriz tiene a a en la diagonal, a 1 arriba de la componentes. El lector podrá observar que (A — diagonal y a/)'~'v es ceros en las demás un vector propio para A, con valor propio a. La base (*) se conoce como una base de Jordán para A. Supóngase que V se expresa como una suma directa de subespacios J-inva riantes y supóngase que cada V-, es cíclico. Si se selecciona una base de Jordán cada P,-, entonces la sucesión de estas bases forma una base para V, para conocida nuevamente como una base de Jordán para A. Con respecto a esta base, matriz para A se divide, por consiguiente, en bloques (figura 1). la V= V, ® &?„,
POLINOMIOS y DESCOMPOSICIÓN PRIMARIA 299 Figura 1 En cada uno de los bloques se tiene un valor propio a¡ en lá diagonal. Tenemos unos arriba de la diagonal y ceros en las demás componentes. Esta matriz se co- noce como forma normal de Jordán para A. El teorema principal en esta sección afirma que esta forma normal siempre se puede lograr, a saber: Teorema 9. Sea V un espacio de dimensión finita sobre los números comple- jos y sea V / {O}. Sea A: V -» V un operador. Entonces, K se puede expresar como una suma directa de subespacios cíclicos A-invariantes. Prueba. Se puede suponer, por el teorema 6, §5, sin pérdida de generalidad, que existe un número a y un entero r S 1 tal que (A - a/f = O. Sea B = A — al. Entonces, Br = O. Supóngase que r es el mínimo de dichos enteros. Entonces. Br-1 O. El subespacio BV no es igual a V debido a que su dimensión es estric- tamente menor que la de V. (Por ejemplo: existe algún weV tal que B'~ *w # 0. Sea v = B,-1w. Entonces, Bv= 0. Nuestra afirmación se infiere de la relación de las dimensiones dim BV + dim Ker B = dim K) Por inducción, se puede escribir BV como una suma directa de subespacios 4-invariantes (o B-invariantes) que son cíclicos, sea BV = © • • © P/M, tal que tiene una base que consta de elementos B*w, para algún vector cíclico w.e de período r(. Sea v,e V tal que Bv¡ = w;. Entonces, cada uno de los es un vector cíclico, debido a que si Br‘w¡ = 0, entonces Br,+ ’t>, = 0.
300 ALGEBRA LINEAL POLINOMIOS Y DESCOMPOSICION PRIMARIA 301 Sea V, el subespacio de V generado por los elementos Bkt\ para k = 1..... r¡ 4. 4 Afirmamos que el subespacio V' igual a la suma ] V'=Vi+--+Vm ’ es una suma directa. Tenemos que probar que cualquier elemento u de esta suma se puede expresar de manera única, en la forma u = ut + 4- um, con u¡e Cualquier elemento de es del tipo f(B)v¡ donde /¡ es un polinomio, de grado S r, + 1. Supóngase que (1) + ••• + fm(B)vm = 0. Aplicando B y observando que Bf¡(B) = f¡(B)B, se obtiene fi(B)wt + + fm(B)wm = 0. Sin embargo, + • • • + W„ es una descomposición en suma directa de BV di* dnndp Ciertamente, sea ce K Entonces, Bv = Bv' para algún v' e V y, por tanto. B(v — v') = 0. Así v = v' + (v — v'), I se prueba así que V = V + Ker B. Por supuesto, esta suma no es directa. Sin em- I bargo, sea 3S’ una base de Jordán de V. Se puede extender Si' a una base de V usan- I do elementos de Ker B. A saber, si {u1;..., us} es una base de Ker B, entonces í {Si , Uj,, . . . , Uj,} I es una base de V para indices convenientes jI;.,., jt. Cada uno de los Uj satis- | face Buj = 0, de donde Uj es un vector propio para A y el espacio de una dimensión || generado por uj es A invariante y cíclico. Se denotará este espacio por Uj. Entonces í se tiene f V=V'®UJt®--®UJl = H© --© Vm® (/,,©•••© Uj„ dando asi la expresión deseada de V como una suma directa de subespacios cí- clicos. Esto prueba el teorema. fi{B)w-, = 0, todo i = 1,..., flt Por consiguiente, tr‘ divide a /¡(i) y, en particular, t divide a f(t). Así, se puede es- cribir fM = para algún polinomio g¡ y, por tanto. ¿(B) = S,(B)B. Se deduce (1) que gAB)Wl + + g„(B)wm = 0. Nuevamente, divide a g^t), de donde Ir,+ 1 divide a /¡(0 y, por consiguiente, » fi(B)v¡ = 0. Esto prueba lo que s? quería, a saber: que V es una suma directa dePi,.,.,K.. I A partir de la construcción de V se observa que BV = BV, debido a que S cualquier elemento en BV es de la forma * fi(B)wl+ + fm(B)vm, Ejercicios En los siguientes ejercicios, se supone que V es un espacio vectorial de dimensión finita sobre los números complejos y que A : V -» V es un operador. 1. Demostrar que A se puede escribir en la forma A — D + N, donde D es un operador diagonalizable, N es un operador nilpotente y DN = ND. 2. Supóngase que V es cíclico. Demostrar que el subespacio de V generado por vectores propios de A es de una dimensión. 3. Supóngase que V es cíclico. Sea f un polinomio. ¿Cuáles son los valores propios de f(A) en términos de los de Al La misma pregunta pero cuando no se supone que V es cíclico. 4. Si A es nilpotente y diferente de O, entonces demostrar que A no es diagonalizable. 5. Sea PA el polinomio característico de A; escríbalo como un producto PaU) = lí (' - a.f', J = ] donde ot¡, ..., a, son distintos entre si. Sea / un polinomio. Expresar el polinomio caracte- rístico P/(A> como un producto de factores de grado 1. con algunos polinomios f y, por consiguiente, es la imagen bajo B del elemento que está en V. De esto se concluye que V = V + Ker B.

TERCERA PARTE RELACIONES con OTRAS ESTRUCTURAS

CAPITULO XIII • f Productos multilineales §1. El producto tensorial Sean V, W espacios vectoriales sobre un campo K. Vamos a definir un nuevo tipo de producto entre elementos de V y de W. El valor del producto debe estar en un espacio vectorial y, por así decir, no deseamos tener relaciones en este producto salvo relaciones bilineales. En otras palabras, si se denota con v ® w el producto de los elementos v e V y w e W, entonces debemos tener so- lamente las siguientes relaciones: Si v2 e V y we W, entonces (Vj |- V2) ® W = V, (x) w + v2 ® w. Si Wj,w2e W y ve V, entonces V ® (»1 + W2) = v ® Wj + V ® w2. Si c 6 K, entonces (cp) ® w - c(v ® w) = v ® cw. Construiremos dicho producto y probaremos varias de sus propiedades. Sean U, V, W espacios vectoriales sobre K. Recuérdese que una aplicación bilineal g:V x W -> U es una aplicación que a cada pareja de elementos (y, w) con ve V y we W le asocia un elemento g(v, w) de 17, que tiene la siguiente propiedad: Para cada v e V, la aplicación w h» g(v, w) de W en U es lineal y para cada i weW, la aplicación v >-> g(y, w) de V en U es lineal. Así, una aplicación bilineal queda definida de una manera completamente similar a una forma bilineal; la única diferencia consiste en que se pide que los valores de la aplicación estén en un espacio vectorial en vez de estarlo en un campo K. Teorema 1. Sean V, W espacios vectoriales de dimensión finita sobre el cam- po K. Existe un espacio T de dimensión finita sobre K y una aplicación bilineal V x W—-> T denotada con (v, w) >-» V ® w, gue satisface las siguientes propiedades. 305 1
306 ALGEBRA LINEAL TP 1. Si U es un espacio vectorial sobre K y g: V x X es una aplicación bi- lineal, entonces existe una aplicación lineal única g*:T-*U tal que, para todas las parejas (v, w) donde veV y weW, g(v, w) = g*(v ® w). TP 2. Si {t?i,..., v„} es una base de V y {»>!,..., »vm} es una base de W, en- tonces los elementos (i = 1, ..n y j = 1,. ,.,m) constituyen una base de T. Prueba. Sea {v,,..., una base de V y sea {w,,..., una base de W. Para cada pareja (i,j) con 1 ¿i £n y 1 < y á m sea t¡j una letra. Como se ex- plica en el apéndice de este capítulo, se considera que T es el espacio vectorial sobre K que consta de todas las combinaciones lineales formales de estos elemen- tos tij con coeficientes en K, asi que estos elementos forman una base de T sobre K. Por tanto, los elementos de T constan de combinaciones lineales n m S S cijtij i=lj=l donde cy e K. Si v = Xjt?] + • + x„v„ y w = + • • + con x¡, yj en K, entonces se define v ® w como el elemento n m V ® w = X Z Xiyjtij ¡=i J=t de T. En particular, v¡ ® wj = ty. Ahora probemos que el producto v ® w tiene todas las propiedades requeridas. Prueba de TP 1. Para simplificar la notación, abreviemos las sumas ti m Z Z por ZZ' í«ly=l i í Primero se prueba que la aplicación (v, w) >-» o ® w es bilineal. Sea l/ = Xj»i + • ’ + X'„V„ y supóngase que v, w están expresados como combinaciones lineales de los ele- mentos básicos, como antes. Entonces, v + v' = (x¡ + xj >i + • • • + (x„ +
PRODUCTOS MULTILINEALES 307 por definición, (p + v') ® w = £ £(x¡ + i j = + Ma i i ' * = Z Z (Xiyjtij + Xj/u) « J = Z Z x¡yjtij + Z Z j i > = V ® w + v' ® w. La prueba para la distributividad por el otro lado es semejante y la omitiremos. Si c e k, entonces, (cv) ® w = £ £ (cx^y/ii ' i = ZZ«¡Mj i J = cZZWu i = c(v ® w). Esto prueba que el producto ® es bilineal. Sea g: V x IV-+ U una aplicación bilineal. Usando el teorema en el que se pueden prescribir arbitrariamente los valores de una aplicación lineal sobre los elementos de la base (teorema 1 del capítulo IV, §2) sabemos que existe una apli- cación lineal única g*:T-U tal que ~ g(p¡, wj. Entonces, para cualesquiera t>, w expresados como antes mediante combinacio- nes lineales de los elementos básicos, 0(u,w) = g (£xipi,£yjw; \ i J = ZZ^iyjSÍ^Wj) i j = g*(v ® w). Así. la aplicación requerida g* existe y está determinada en forma única. Prueba de TP 2. Sea {vj,..., vj} cualquier base de V y sea {wj...., wj,} cualquier base de W. Debemos probar que los elementos v} ® wj forman una iiuuuuuuunvu'WVUHHi
308 ALGEBRA LINEAL base de T. Cualesquiera elementos veV yweJV se pueden expresar como com- binaciones lineales V = X|1>1 + • • ’ + x'„v'„ y w = + • • + y>¡, donde x'¡ y y'jeK. Entonces, V ® w = £ 52 ® w'j). • j De donde los elementos »í ® w'j generan a T sobre K. Hay mn de tales elementos. Si fueran linealmente dependien- tes, la dimensión de T sería < mn, lo que sería una contradicción con el hecho de que los elementos tjj forman una base de T. Esto prueba el teorema. El espacio T que aparece en el teorema 1 se conoce como el producto ten- Borial de V y W y se denota con V ® W. Nótese que su dimensión está dada por dim (V ® W) = (dim EXdim IV). Al elemente v ® w asociado con la pareja (v, w) también se le conoce como un producto tensorial de v y w. Ejercicios 1. Sean V, W espacios de dimensión finita sobre K. Sea F: V® W—> U una aplicación lineal. Demostrar que la aplicación (b, w) i-> F(y® w) es una aplicación bilineal de V x W en U. 2. Demostrar que la correspondencia g w g* del teorema 1 es un isomorfismo entre el espacio de las aplicaciones bilineales de V x W en U y el espacio de las aplicaciones linea- les <ew ® w. u). 3. Sea V un espacio vectorial de dimensión finita sobre K. Sea A : V -* V una aplicación lineal. Demostrar que existe una aplicación lineal única F'.V ® V -» V ® F tal que F(»® w) = ®4w para todo v.weV. Esta aplicación se denota A ® A. 4. Generalícese el ejercicio 3 a un producto tensorial V ® W. Sean A : V -♦ V y B: IF -♦ W aplicaciones lineales. Dígase como definir la aplicación lineal A®B: V ®W -* V ®W.
PRODUCTOS MULTILINBH.ES 309 f §2. Isomorfismos de productos tensoriales Con frecuencia ocurre que deseamos considerar un producto tensorial de más i de dos espacios. Tenemos la asociatividad para este producto. Teorema 2. Sean U, V, W espacios vectoriales de dimensión finita sobre K. Entonces existe un único isomorfismo U ®(V ®W)->(U ®V)®W tal que U ® (V ® w) r-> (u ® V}® w para todo ue U, ve V y we W. Prueba. Sean {u¡}, {wk} las bases de U, V y W, respectivamente. Enton- ces los elementos («i ® Vj) ® wk forman una base de (U ® V) ® W y los elementos W¡ ® (Vj ® w») forman una base de U ® (V ® W). Por el teorema general sobre la existencia y unicidad de las aplicaciones lineales existe una aplicación lineal única F : U ® (V ® W) ->(U ® V) ® W que aplica a (w,- ® v}) ® wk sobre u, ® (v, ® wk). Se verifica fácilmente mediante los desarrollos lineales usuales que para cualquier u ® (v ® w) en U ® (V ® W'), la aplicación F tiene el efecto deseado. Como F aplica a una base de U ® (V ® W) sobre una base de (U ® V) ® W, se deduce que F es un isomorfismo. El teorema 2 permite omitir los paréntesis en el producto tensorial de varios factores. Así, si V¡,..., Vr son espacios vectoriales sobre K, entonces se puede formar su producto tensorial . Vt ® V2 ® • • ’ ® V„ y el producto tensorial t>i ® v2 ® • • • ® de elementos v¡ en V¡. Los teoremas 1 y 2 dan las útiles propiedades generales del producto tensorial. Existen algunos isomorfismos interesantes que se pueden formar de los produc- tos tensoriales. Sólo presentamos uno en este texto, el cual se usa con frecuencia en el cálculo de la geometría diferencial. Teorema 3. Sea V un espacio vectorial de dimensión finita sobre K. Sea V*
310 ALGEBRA LINEAL el espacio dual y sea P} el espacio de las aplicaciones lineales de P en ¡i mismo. Existe un isomorfismo único v*® P), que a cada elemento tp ® v (donde tpeP*yveP) le asocia la aplicación lineal tal que = <p(w]v. Prueba. A cada pareja (tp, i?) del producto directo V* x V se le asocia la apli- cación lineal L„ „ tal que ív.Xw) = <¡’(h’)v. Se verifica de inmediato que esta asociación (<P, v) ~ LVtV es una aplicación bilineal de P* x V en £C(P, V). En consecuencia, por el teore- ma 1, existe una aplicación lineal única de P* ® P en ¡£(P, V) que a cada elemen- to tp ® v le asocia la aplicación lineal Lvv. Ahora debemos probar que la apli- cación tp ® v -» Lv v da un isomorfismo de P* ® P y ^(P, P). Sea {vn ..., t>„} una base de V y sea {tpi,..., tp„} la base dual. Entonces, <p,(v*) = 0 si i / k, y =1 si i = k. Con el objeto de simplificar la notación hagamos que Lij ~ Afirmamos que los elementos Li¡ (i = 1,..., n y j = 1,..., n) son linealmente independientes. Supóngase que tenemos una relación j » donde c:jeK. Apliqúese el miembro izquierdo a cualquier vk. Se obtiene O = E E c¡jL¡¿vk). j ‘ En la suma, = 0 a menos que i = k, en cuyo caso es igual a v¡. Por tanto, O = E CkjVi- j De la independencia lineal de v)(..., ü„ se concluye que ckj = 0 para todo j y todo k, con lo que se prueba que las aplicaciones lineales L,j son linealmente inde- pendientes. Hay n2 de tales aplicaciones y la dimensión de Sf'Í.P, P) es, precisamen-
PRODUCTOS MULTINEALES 311 te, igual a n2. De donde estas aplicaciones L,7 forman una base de V). Puesto que la aplicación V*® V->£(V, V) envía una base {<?,• ® v}} de V* ® V sobre una base {L,7} de <£{V, V), se deduce que la aplicación es un isomorfismo, tal y como se quería demostrar. • p E’ERCICIOS 1. Sean V, W espacios vectoriales de dimensión finita sobre K. Demostrar que existe un isomorfismo único de V ® W sobre W®V que envía v ® w sobre w ® v para todo v e I y »v6 W. 2. Sean V, W tal y como aparecen en el ejercicio anterior. Demostrar que existe un iso- morfismo único V* ® W -> 5?(7. W) tal que <p ® w H L,.», donde Lv.„ es la aplicación lineal tal que L,-W(v) — 3. Sean V, W tal y como aparecen en el ejercicio anterior. Demostrar que existe un iso- morfismo único K*® W*->(7® IV)* que a cada producto tensorial (<peV* y e W*) le asocia una funcional de V ® IV que tiene la propiedad de que ® w) = <p(v}^w). Describir este isomorfismo en términos-de bases y bases duales. §3. Productos alternantes: caso especial Consideremos otro tipo de producto, usado todo el tiempo en la teoría de las formas diferenciales en cálculo. Como este producto es un tanto complicado cuando se considera en general, vamos a emplear un poco de tiempo estudian- do un caso especial que es equivalente al producto vectorial de vectores. Sin em- bargo, se tratará de una manera que se ajuste a la generalización de dimensiones arbitrarias. Sea V un espacio vectorial trí-dimensional sobre el campo K. Sea f: V x V->U una aplicación bilineal de V en algún espacio vectorial U sobre K. Se dice que f es alternante si f(v, v) = 0 para todos los elementos v de V. (¡Esto es muy parecido a la condición que ya encontramos cuando estudiamos deter- minantes!) Deseamos construir un producto de elementos de V, considerando sus valores en un espacio vectorial, y tal que las únicas relaciones en este produc- to sean las relaciones bilineales y la relación alternante, es decir, si se denota el
312 ALGEBRA LINEAL producto de dos elementos de V con v A w, entonces debemos tener v A v = q 1 Supóngase que tenemos tal producto. Entonces para cualesquiera v,weV, 1 (t> + w) A (t> + w) = O, ‘ y por linealidad, el miembro izquierdo de la igualdad es igual a pAü + h’Av+vAw + wAw. De donde la relación alternante implica que (1) v A w — — w A v. Sea {fi, u2, Uj} una base de V. Cualesquiera elementos v, w de V se pueden es- cribir como combinaciones lineales de los elementos de esta base, sea V = X,V( + X2»2 + X3V3, w = yii>| + y2v2 + y3v3. Sea f : V x V -> U una aplicación alternante bilineal. De las relaciones bilinea- les, se obtiene f(v, w) = Xiyif(vi, t?i) + Xiy2f(vu v2) + Xiy3/(tA, fs) + x2ytf(v2, vt) + x2y2f(v2, v2) + x2y3f(v2, v3) + *3ji/(f3>fi) + x3y2f(v3,v2) + x3y3f(v3, v3) = 'LY.xiy¡f(vi,vJ). Usando las relaciones alternantes, vemos que tres términos son iguales a 0 y que los otros se pueden expresar como combinaciones lineales de f(v¡, v2), f(v¡, v3) y f(v2, ü3)- Simplemente, se utiliza el hecho de que fl'i, t>i) =-/(»>, v2), = -/Oh, »3), y /(»3. V2) = -f(»2, V3}- De donde (2) f(v, w) = (xty2 - x2yi)f(vi, v2) + (x,y3 - x3yt)f(vt, v3) + (*2y3 - x3y2)f(v2, v3). Así. si tenemos una aplicación f alternante bilineal. el espacio generado por todos los valores f(v, w) con v, w en V tendrá dimensión, a lo más, igual a 3. Ahora, probemos que existe un producto alternante de V x V en un espacio de- notado con V A V, generado por todos los productos v A w con v, w en V, y tal que EA E tiene dimensión igual a 3 precisamente.
PRODUCTOS MULTINEALES 313 Se seleccionan tres letras tu, (33 y t|3 como elementos de la base para este respacio. Si v, w son elementos de V, expresados como antes en términos de la base fi, v2 y v3, entonces se define su producto v A w como (Xiy2 - x2y¡)t¡2 + (x(y3 - XjyOtu + (x2y3 - x3y2)t23. blótes*et)ue si i < j, entonces u¡ A v2 = t¡j. Ahora es fácil verificar directamente que el producto es bilineal y alternante. La relación alternante es especialmente trivial, ya que si v = w, cada uno de Jos coeficientes es del tipo x¡Xj — XjX¡ = 0. Sea f: V x V U una aplicación alternante bilineal. Entonces, existe una apli- cación lineal única f>: V A V - U tal que para todas las parejas (v, >v) de elementos de V, se tiene f(v,w) = /*(v Aw). Prueba. Por el teorema referente a la existencia y a la unicidad de las aplica- ciones lineales que tiene valores prescritos sobre los elementos de la base, se sabe que existe una aplicación lineal única -> U tal que para cada pareja de índices i,j donde 1 i j ¿ 3. De (2) se concluye de in- mediato que f(v, w) = f*(v A w) para todo v, we V. Así, cuando V tiene dimensión igual a 3, queda probado para productos al- ternantes el análogo del teorema 1 para aplicaciones alternantes bilineales. Se puede preguntar si no es posible considerar productos superiores. La res- puesta es que si y dejamos que el lector lo verifique a través de los ejercicios 1, 2 y 3. Ejemplo 1. La teoría de los productos alternantes se emplea bastante en el cálculo de formas diferenciales y, por tanto, tomamos un ejemplo de este campo. Sea f : R3 -> R una función diferenciable. Por definición, para cada X en R3 existe una aplicación lineal denotada con df(X) de R3 en R tal que para pequeños vectores H, f(X + H) = df(X)H + o(H). (La notación o(H) está tomada del análisis y no nos detendremos en explicarla.) Así, df asocia con cada punto X e R3 una funcional df(X) en ^?(R3, R). Si se hace R3 = V, entonces JZ’fR3, R) no es otra cosa que el espacio dual V*.
314 ALGEBRA LINEAL Sean x, y, z las coordenadas de X. Tenemos tres funciones de coordenadas fi, f 2 Y f 2 «les que JiW = x, /2(X) = y, f3(X) = z. Entonces generalmente se escribe, df¿X) = dx, df2(X) = dy, df3(X) = dz. De las definiciones, se verifica de inmediato que dx, dy, dz forman una base de V* y que en efecto forman la base dual de la base estándar de vectores unitarios {e‘,e2,e3}. Una forma diferencial sobre R3 de grado 2, es una aplicación (¡no necesa- riamente lineal!). <u: R3 V* A V* de R3 en el producto alternante del espacio dual consigo mismo. Como para cada X en R3, dx, dy, dz forman una base de V*, se deduce que dx A dy, dx A dz y dy Adz forman una base de V* A F*. En consecuencia, existen funciones w,/R3->R (1 á i < j á 3) tales que aXX) tiene una expresión como una combinación lineal ¡ w(A') = coi2(X)dx A dy + a>í3(X)dx Adz + a>23(X)dy A dz. Estas funciones no son otra cosa que las funciones de coordenadas de a> con respecto a la base dada de V* A F*. Ejemplo 2. Sea V = R3. Si X = (xi,x2,x3) e Y = (yi,y2, ys) son elementos de R3, entonces se define su producto vectorial como X x Y = (x2y2 - x2yi,xiy3 - x3y3,x2y3 - x3y2). El lector reconocerá esta expresión como, esencialmente, la del producto altera nante X A Y en términos de las coordenadas. En la siguiente sección, veremos cómo generalizar lo expresado a dimensiones mayores al dar las coordenada^ del producto alternante en términos de determinantes de orden superior. i Ejercicios 1. Sea V un espacio vectorial de 3 dimensiones sobre K. Definase V x V x V como conjunto de todas las ternas (u, v, w) de elementos de V. Una aplicación trilineal f :V x V x F- U
PRODUCTOS MULTIL1NEALES 315 un espacio vectorial U sobre K es una aplicación que es lineal en cada componente. De- cinios que la aplicación trilineal f es alternante si w) = 0 siempre que u = v o v = w. Si f es alternante, entonces demostrar que f(u,v,w) = O si 2. Sea (t’i.Uj.t'j} una base de V. Sea V A V A V el espacio vectorial de una dimensión sobre K generado por una sola letra tI23. Si X, Y, Z son los vectores de coordenadas de los elementos u, v, w de V con respecto a la base dada, defínase el producto u A v A w = Det(X, Y, Z)t 123. Probar que este producto es trilineal y alternante, usando la definición de los determinan- tes. Nótese que tt23 = iq A v2 A p3. 3. Sea f:V xV x V-*U una aplicación alternante trilineal en un espacio vectorial U sobre K. Demostrar que existe una aplicación lineal única ft: V V V—♦ L;, tal que f(u, u, w) = y,(u A v A w) para todo u. v, w en V. 4. Sea V un espacio vectorial de dimensión igual a n sobre K. Definir VA V de manera análoga a la usada en el caso de tres dimensiones y probar propiedades análogas a las pro- badas en ese caso especial. [Sugerencia: úsense todos los determinantes 2x2 con 1 á i <j£"] §4. Productos alternantes: caso general Esta sección es bastante abstracta y seria razonable que algunos lectores la omi- tieran. Para definir el producto alternante de un número arbitrario de factores, nos basamos en el producto alternante descrito en la sección precedente. Nótese que cada expresión xdi - XjYt con i < j es un determinante y que todos los determinantes de este tipo aparecen como coeficientes de v, A v¡. Generalicemos este resultado en forma natural. Sea V un espacio vectorial sobre el campo K. Sea r un entero S 1. En forma abreviada se designa con K<r> el conjunto de todas las r-uplas de elementos de V, esto es = V x x V. Un elemento de V(r) es, por consiguiente, una r-upla (wi,..., wr) donde w, e V. Cada componente de la r-upla es un elemento de V. Sea U un espacio vectorial sobre K. Una aplicación r-multilineal de V en U es una aplicación f:V x ••• x V - U
316 ALGEBRA LINEAL de K(r) en U que es lineal en cada componente. En otras palabras, para cad3» i = 1, ..., r, tenemos que /(Wj, . . ., w¡ 4- vv¡, . .., vvr) = /(Wi, ..., w,) + f(wb . . . , w'j, . . . , wr), , CW¡, . . . , Wr) = cf(Wi, .... »vr) para todo w¡e K y ce K. Se dice que una aplicación multilineal f como ]a anterior es alternante si, además, satisface la condición /(Wj, ...,w,) = O siempre que dos componentes adyacentes sean iguales, es decir, siempre que exista un índice j < r tal que Wj = Wj+ r Nótese que una aplicación alternante multilineal satisface condiciones com- pletamente análogas a las primeras dos propiedades que son satisfechas por los determinantes. Por tanto, las aplicaciones alternantes multilineales se pueden considerar como generalizaciones de los determinantes. En efecto, ahora se puede decir que un determinante es una aplicación alternante multilineal sobre K" que tiene la propiedad adicional de que Det(e’, ..., e") = 1, si {e1, ..., e"} es la base estándar de K". Si recordamos las propiedades 4, 5 y 6 de los determinantes, se ve que las pruebas de estas propiedades dependían sólo de 1 y 2. Por lo que estas pruebas son válidas en la situación más general. Asi, si se intercambian dos componentes adyacentes, digamos w¡ y wJ+I, entonces el valor de la aplicación alternante mul- tilineal cambia de signo. Si cualesquiera dos componentes distintas entre si y Wj son iguales (con i / j), entonces /(wt, ..., wr) = O. Estas propiedades se usan constantemente para calcular los valores de las apli- j caciones alternantes. j 'i El problema más general consiste en definir un producto entre r elementos i de V, que satisfaga las relaciones alternantes y multilineales y nada más. En el t teorema 6, se resuelve este problema. Sin embargo, antes de hacer esto, deduz- ; camos consecuencias de estas relaciones. ; Teorema 4. Sean V, V espacios vectoriales sobre K y sea f: V'r> - U una aplicación alternante r-multilineal. Sean Wi, ..., wr elementos de V y sea A — (aij) una matriz r x r en K. Sea “i = aiiw! + ••• + aírwr, ur = ar¡Wt + + arrwr. •
PRODUCTOS MULTILINEALES 317 Entonces f(ui,..., u,) = Det(/()/(wi,.... wr). Prueba. Tenemos , f /(«i, -••,«,) = f(auWi + + alrw„ a,¡w, + • + arrwr). Se desarrolla esta expresión por multilinealidad y se obtiene una suma de tér- minos zL /(al,<r(l)'v«(l)> • • • > ar,ff(r)wa(r)) a sobre todas las aplicaciones posibles <r(l),..., <r(r), es decir: a: {1,..., r} -» {1,..., r}. Esta suma es igual a 22 ‘ ar.»(r)/(w<r(l), • • • > w<7(r>) sacando los escalares de /. Si a no es una permutación de {1,..., r}, entonces dos componentes entre si de la r-upla (wa(lh • • - , wa(r)) serán iguales y, por tanto, el término correspondiente en la suma es igual a 0. De donde se puede considerar la suma sólo sobre las permutaciones a de {1,..., r}. Si se hace esto y se lleva a , wa(r)) a su posición estándar (w>,..., wr), entonces el signo de cada término cambia por el signo de la permutación o. Así, finalmente, /(ul ..., u,) = ..., wr), lo que es igual a Det(^4)/(H,i, ...,wr) por una de las expresiones que se obtuvieron para el determinante. Esto prueba el teorema. Para productos alternantes superiores, aún es necesaria una fórmula para el desarrollo más general para aplicaciones alternantes, a saber: se necesita el caso cuando A = (a¡j) es una matriz r x n con r y n distintas entre sí. Por ejemplo, en la sección precedente, r = 2 y n = 3. Por consiguiente, es necesario estudiar la notación. Consideremos que 1 á r í n. Sea S un subconjunto de los enteros {1,..., n} que consta de, precisamente, r elementos. El número de tales conjuntos posibles S es igual al coeficiente bi- nomial (:)• Los elementos de tal conjunto S se pueden ordenar, de tal manera, que si ij,..., i, son estos elementos, entonces i i < • • < ir.
318 ALGEBRA LINEAL Sea cr: {1, ..., r}-» S una aplicación, es decir, una regla que a cada entero de 1 hasta r le asocia un ele- mento de S. Supóngase, además, que a(i) / o(j) si i / /. Entonces, se puede con- siderar a a como una permutación de S. Ciertamente, si ii,,,., i, son los ele- mentos de S y están ordenados de tal manera que ¡i < • ’ < ¡r, entonces a da origen a la permutación denotada simbólicamente con ’ ¡i • • ir ’ . <t(1) • • <r(r) Asi, la permutación es la asociación i, i-> a(l), i21-> <r(2), ..., ir>-> a(r). El signo de esta permutación se denotará con e5(a). Ejemplo. Sean n = 4 y r = 3. Sea S = {1,3,4}. Defínase <r como j(1) = 4, <r(3) = 1, a(4) = 3. Entonces a da la permutación [1 3 41 [4 1 i] del conjunto {1,3,4}. Su signo es igual a «S(ff)=-L Una observación sobre la notación: se denota con P(S) el conjunto de apli- caciones a: {1,..., r} -» S tales que a(¿) ± <r(j) si i ± j. Así, P(S) es esencialmente el conjunto de permuta- ciones de S. Sea A = (a¡j) una matriz r x n en K. Para cada subconjunto S de {1,..., n] que consta de r elementos precisamente, se puede tomar la submatriz r x r de A que consta de aquellos elementos a,, tales que j e S. Se denota con DetsfA) al determinante de esta submatriz. También se designa como el subdeterminante de A correspondiente al conjunto S. Entonces se puede escribir DetsfA) = X ís(fir)al,<r<l)‘"ar,<r<r)> 0tP(S)
PRODUCTOS MULTIUNEALES 319 donde la suma se considera sobre todas las aplicaciones a en el conjunto P(S). Esto es sólo un reformulamiento de una expresión para el determinante, toman- do en cuenta la notación actual. Sean vt,..., elementos de V. Para cada subconjunto S como el que se acaba de considerar, se denota con vs a la r-upla ’ * vs = •, donde h,..., ir son los elementos deS, ordenados de tal manera que h < • < ir. Ahora tenemos toda la notación necesaria para enunciar la generalización deseada del teorema 4. Teorema 5. Sean V, U espacios vectoriales sobre K. Sea f: r<r> -»u una aplicación alternante r-multilineal. Sean v,,..., elementos de V y sea A = (a¡j) una matriz r x n en K. Sea U¡ = «11^1 + • • • + «r = a,i”i + •• + ar„v„. Entonces, f(ui,..., nr) = £ Dets(A)/(vs), s donde la suma se toma sobre todos los subconjuntos S de {1, ..., n} que constan, precisamente, de r elementos. Prueba. Tenemos que /(ui, ..., ur) = /(anvi + • • • + a¡„v„, ..., arlVi + + arnv„). Desarrollando por multilinealidad, se obtiene una suma sobre todas las elecciones posibles de a que asignan a cada entero desde 1 hasta r un entero desde 1 hasta n. Así, la suma se efectúa sobre todas las aplicaciones a:{l, {1, ...,n). Como antes, nótese que si a(ij = <r(j) para algún i j, entonces el término corres- pondiente es igual a 0, porque f es alternante. Por tanto, en la suma se pueden considerar solamente aquellas a tales que o(í) <r(j) s> 1 J-
320 ALGEBRA LINEAL La suma se puede descomponer en una doble suma, al agrupar a todas las apli- caciones o que envían a {1,..., r) en un conjunto dado S y tomando después la suma sobre todos los susodichos conjuntos S posibles. Así, entonces, se puede escribir simbólicamente 22 = 22 22 a S En cada una de las sumas interiores 22 ' ar.a(of(va(l), , aeF(S) se lleva lar-upla(t>o(1),..., t\,w)a la posición estándar (v„, ..., v,r)donde ¡i,. . . , ir son los elementos de S ordenados de tal manera que i'i < •• • < ir. Entonces, f cambia de signo según e^a) y, en consecuencia, cada una de las sumas interiores es igual a 22 1,«(1) ’ ’ ‘ ar,<7(r)/(üs)- <reP(S) Tomando la suma sobre todos los posibles conjuntos S, se obtiene exactamente la fórmula enunciada en el teorema. El siguiente teorema trata el caso genera] de los productos alternantes. Teorema 6. Sea V un espacio vectorial de dimensión finita sobre K, de di- mensión igual a n. Sea r un entero 1 á r n. Existe un espacio de dimensión finita sobre K, denotado con fi’V, una aplicación alternante r-multilineal Vlr) /\'V, denotada con («!,..., ur) u¡ A • • • A u„ que satisface las siguientes propiedades. AP 1. Si Ú es u.i espacio vectorial sobre K y g: l/|r’-> U una aplicación al- ternante r-multilineal, entonces existe una aplicación lineal única g*-. f\'VU tal que para todo ut, ure V se tiene g(u¡, ..., u,) = g*(u¡ h--- A ur). AP 2. Si {uj, ..., t>„} es una base de V, entonces el conjunto de elementos {v(1 A • • • A c¡r} (1 i] < • • < ir á ") es una base de ArK Prueba. Para cada subconjunto 5 de {1, ..., n} que consta precisamente de r elementos, se selecciona una letra ts. Estas letras ts forman una base de un es-
PRODUCTOS MULTILINEALES 321 pació vectorial sobre K, cuya dimensión es igual al coeficiente binomial (?). Se denota este espacio con ArK Sea {i>j, una base de V. Sean ut,..., ur elementos de V. Sea A = (a¡j) la matriz en K tal que “i = fli iüi + ' ’ ’ + ulnv„, ' * Ur = arívt + •••• + ar„v„. Definase Ui A • • • A ur = £ Dets(^)ts. s Afirmamos que este producto tiene las propiedades requeridas. Primero probemos que es multilineal. Esta es esencialmente una observación de rutina, a saber: Dets(/1) es multilineal como una función de las filas de A. Supóngase que wí = uíiVi + • • • + ai„vn. Sean Aly ..A„ las filas de A y A¡ = (on, ..., a'in). Al escribir el determinante como una función de las filas, se tiene Dets(/4i,..., A¡ 4- A’¡,..., A„) = DetsG-h,..., A„) + Det^/h,..., A¡,..., A„) y para c e K, Detsf/lj,..., cAb... ,A„) = c Dets A). Estas ecuaciones se deducen directamente de la definición de determinante. En consecuencia, Wi A • • • A («j + m¡) A • • • A ur = (uj A • • • A ur) + (10 A • • • A Uj A • • • A ur). Además, Ui A (cu,) A • • • A ur = cut A • • • A ur. El producto es alternante, ya que si u¡ = ui+t para algún i, entonces dos filas adyacentes de la matriz A son iguales. Por tanto, para cada S, dos filas adyacentes de la submatriz de A correspondientes al conjunto 5 son iguales y, por tanto. Dets(A) = 0. Nótese que ts = Vi, A - • • A v¡r si ij,..., i, son los elementos de S ordenados de tal. manera que ¿i < ' • • < i,-
322 ALGEBRA LINEAL A partir del teorema referente a la existencia y unicidad de las aplicaciones lineales que tienen valores prescritos sobre los elementos básicos, se concluye que si y. VM -+ U es una aplicación alternante multilineal, entonces existe una aplicación lineal única g*: A'P- U tal que para cada conjunto S, se tiene 9*(ts) = ff(vs) = gívi,,.... v¡J, si los elementos it,..., ir son como antes. Por el teorema 5, se deduce que ' í(«t,•••,«,) = »*(«i A-Au,) para todos los elementos u(,..., ur de V. Esto prueba AP 1. En cuanto a AP 2, sea w!.....w„ una base de V. Del desarrollo del teorema 5, se infiere que los elementos w, es decir, los elementos {w¡, A • A H'lr} con todas las elecciones posibles para las r-uplas (iJ(..., ir) que satisfacen ¿i < • • < ir, son generadores de A rK El número de tales elementos es exactamente, igual a C). Por tanto deben ser linealmente independientes y forman una base de A rV, como se quería demostrar. La notación vs resultó conveniente para abreviar las expresiones que apare- cen en el desarrollo anterior. Sin embargo, también la suma se escribe frecuente- mente para preservar los índices ij,..., ir. Así, si {i?I(..., v„} es una base de V, entonces todo elemento de A ’V tiene una expresión única como combinación lineal E c¡,A • • • A vir, donde la suma se efectúa sobre todas las r-uplas (i,,..., ir) de enteros desde 1 hasta n, que satisfacen ii < < ir. Se puede abreviar esta notación, al escribir (i) = (i],..., ir). Así, la suma anterior se escribiría entonces S c<í)víi A • • • A vir. (i)
r PRODUCTOS MULTILINEALES 323 Teorema 7. Sea V un espacio vectorial de dimensión finita sobre K. Para cada pareja de enteros r, s 3t 1 existe una aplicación bilineal única A'Kx A*k-* Ar+sr tal que si ut,..., u, f wt,son elementos de V, entonces bajo esta apli- cación ’ 9 (u! A • • • A ur) x (»?! A • • A w,) h» »] A • • • A ur A rv, A • A w,. Prueba. Dados u1;ure V, vemos que la aplicación V’2 3 * s)-»Ar+íV deter- minada por (wj,.w,)-» U) A • • A ur A Wj A • • Aws es s multilineal y alternante. De donde existe una aplicación lineal única L(„...: A’l''-» Ar+sV tal que Wj A A w, « u, A- - A ur A H’t A A ws. Además, la asociación (Uj,..., ur) es una aplicación r multilineal Ew->5’(AsF,Ar+sV), lo que, claramente, es alternante, por lo que existe una aplicación lineal única A ^(Ajk Ar+JK) denotada con tal que Uj A- - Aur-> Ahora es claro que si coeArF y r¡e ASV, entonces la asociación (co, rj) >->• L„(t¡) es la aplicación bilineal deseada. Ejercicios 1. Sea V un espacio vectorial de dimensión n sobre K. Demostrar que A"k tiene dimensión igual a 1 sobre K. 2. Sea V tal y como aparece en el ejercicio 1. Sea {v,, ..., t>„} una base de V y sea 4 = (<fy) una matriz de n x n en K. Escríbase ut - a^Vi + + Oi,VK u, =a„tv, + + amv.. Expresar ut A ... A u„ en términos de O) A ... A r„. 3. Sea V un espacio vectorial de dimensión n sobre K y sea r un entero > n. Demostrar que cualquier aplicación alternante r multilineal f : - U en un espacio vectorial U es la aplicación nula.
324 ALGEBRA LINEAL 4. Sea A una matriz antisimétrica nxnenK.es decir, 'A = -A. Demostrar que la apli- cación (X, Y)i-► 'XAY define una Forma alternante sobre K". 5. Sea V un espacio vectorial de dimensión n sobre K. Sea {v¡, ..., t>„} una base de V. Sea c e K. (a) Probar que existe una forma alternante n multilineal única f,: E'"’ -♦ K tal que /<(»!, ...,».) = c. (b) Sea ft la Forma alternante n multilineal única de V en K tal que , t>„) = 1. Si g es una forma alternante n multilineal sobre V tal que g(v............ t>„) = ce K, entonces demostrar que g ~ cf\. 6. Sea V un espacio vectorial de dimensión n sobre K. Sea A : V -» V una aplicación lineal. Sea /rK1"’-» K una forma alternante n multilineal. Definase g : V’"1 -> K como 9(wi,• ••,»„) = f(Awi, Aw,). Demostrar que g es n multilineal y alternante. 7. En forma más general, sean V, W espacios vectoriales sobre K y sea A : V—» W una aplicación lineal. Sea f: FF'1”1-> U una aplicación alternante n multilineal de FE en un es- pacio V. Defínase g : P'"’ -» U como ......».) = .... Av„). Demostrar que g es n multilineal y alternante. 8. Sea V un espacio vectorial de n dimensiones sobre K. Sea A : V -* V una aplicación lineal. Sean wlt..., w, elementos de V y sea f: FzW -> U una aplicación alternante n mul- tilineal. Demostrar que HAw,.......= DetMI/lwi................w„). Apéndice. El espacio vectorial generado por un conjunto Sea K un campo y sea S un conjunto finito de objetos. Se numeran, para sim- plificar, los elementos de S y, por tanto, se supone que estos elementos son Si, , S„. Deseamos definir lo que se entiende por el espacio vectorial T de combinaciones lineales “formales” de elementos de S con coeficientes c,- en K. Si queremos ser bastante precisos, entonces debemos dar primero una descripción de los elementos del espacio vec- (orial T y después definir la adición entre estos elementos. De lo contrario, el signo + no tiene sentido. Esto no quiere decir que no se pueda ignorar comple- lamente el problema y que se pueda proseguir como si todo estuviera claro.
PRODUCTOS MULTILINEALES 325 Sin embargo, el propósito de este apéndice es el de demostrar cómo se puede ser preciso en esta materia. De hecho, esto es bastante simple. ¿Qué se quiere que sea tal «suma»? CpS, + • • + c„s„ Bien, ,se quiere que esté completamente determinada por los «coeficientes» ti,..., c„ y que cada «coeficiente» c¡ esté asociado con el elemento s¡ del con- junto S. Pero una asociación no es sino una función. Esto sugiere cómo definir los elementos del espacio T. Para cada s¡ e S y c e K, se define el símbolo cs¡ como la función que asocia c a s¡> y 0 a Sj si j i. Si a e K, entonces es obvio que u(cs¡) = (uc)s¡ y (c + c')s¡ = cs¡ + c's¡. Se define T como el conjunto de todas las funciones de S en K que se pueden escribir en la forma CjSj + • • • + c„s„ con algún c, e K. Usando las obvias propiedades precedentes, se ve de inmediato que T es un espacio vectorial sobre K. (Obsérvese que no tenemos ningún pro- blema al considerar sumas, puesto que sabemos cómo sumar funciones de S en K.) Afirmamos que las funciones Isi, ...,ls„ son linealmente independientes y que, en consecuencia, formar una base de T sobre K. Para probar lo afirmado, supóngase que cx......c„ son elementos de K tales que CjSj + • • + c„s„ = 0 (la función nula). Entonces, por definición, el miembro de la izquierda toma el valor c¡ en s¡ y, por tanto, c¡ = 0. Esto prueba la independencia lineal buscada. En la práctica, resulta conveniente abreviar la notación y escribir simplemente s, en vez de ls¡. Los elementos de T se conocen ahora como combinaciones lineales formales de los elementos de S y se ha justificado con precisión esta terminología.

CAPITULO XIV Grupos §1. Grupos y ejemplos Ascendamos un pequeño grado en la escala de la abstracción y definamos una noción que incluirá muchos ejemplos previos como casos especiales. Un grupo G es un conjunto, junto con una regla (denominada ley de compo- sición) que a cada pareja de elementos x, y en G le asocia un elemento denotado con xy en G, que tiene las siguientes propiedades. GR 1. Para todo x, y, z en G tenemos la asociatividad, a saber (xy)z = x(yz). GR 2. Existe un elemento e de G tal que ex = xe = x para todo x en G. GR 3. Si x es un elemento de G, entonces existe un elemento y de G tal que xy = yx = e. Estrictamente hablando, se dice que G es un grupo multiplicativo. Si se de- nota el elemento de G asociado con la pareja (x, y), con x + y, entonces escri- bimos GR 1 en la forma (x + y) + z = x + (y + z), GR 2 de manera que existe un elemento 0 tal qué 0+x=x+0=x para todo x en G y GR 3 en tal forma que dado x e G, exista un elemento y de G tal que x + y = y + x = 0. Con esta notación, se llama a G un grupo aditivo. Se usa la notación + sólo cuando el grupo satisface la regla adicional x + y = y + x para todo x, y en G. Con la notación multiplicativa, esto se expresa así, xy — yx para todo x, y en G, y si G tiene esta propiedad entonces se dice que G es un grupo conmutativo o abeliano. 327
32K ALGEBRA LINEAL Ejemplo 1. Los números racionales forman un grupo bajo la adición. También 1 los números reales y asimismo los números complejos. En efecto, para cualquier 1 campo K, los elementos de K forman un grupo bajo la adición. 1 Ejemplo 2. Los números racionales no nulos forman un grupo bajo la muí- | tiplicación. Así también los números reales no nulos, los números complejos no | nulos y los elementos no nulos de cualquier campo K. | Ejemplo 3. Los números complejos de valor absoluto igual a 1, forman un j grupo bajo la multiplicación. í Ejemplo 4. Las permutaciones de {!,...,«} forman un grupo bajo la muí- ] tiplicación (es decir, composición de aplicaciones), conocido como el grupo si- métrico sobre n elementos. Ejemplo 5. Los elementos de un espacio vectorial forman un grupo bajo la adición. Ejemplo 6. Las matrices m x n sobre un campo K forman un grupo bajo la adición. Grupos multiplicativos de matrices Ejemplo 7. (a) Las matrices invertibles n x n sobre un campo K forman un grupo bajo la multiplicación, denotado con GL„(K) o GL(n, K). Se conoce como el grupo lineal general. (b) Sea V un espacio vectorial sobre K. Las aplicaciones lineales invertibles de V en si mismo forman un grupo bajo la multiplicación (composición de apli- caciones), denotado con GL(V). Ejemplo 8. Las matrices unitarias reales n x n forman un grupo bajo la mul- tiplicación, denotado con U„(R) o U (n, R). Ejemplo 9. Las matrices unitarias complejas n x n forman un grupo bajo la multiplicación, denotado con U„(C) oU(n, C). Ejemplo ¡0. Las matrices triangulares superiores invertibles n x n sobre un campo K, forman un grupo bajo la multiplicación. Ejemplo 11. Las matrices invertibles n x n sobre un campo K que tienen determinante igual a 1, forman un grupo bajo la multiplicación. Este grupo se conoce como grupo lineal especial. Terminología. Los grupos aditivos de matrices o de aplicaciones lineales no son interesantes. Por tanto, en todas las matemáticas, a menos que se espe- cifique lo contrario, al hablar de un grupo de matrices siempre se tratará de un grupo multiplicativo de matrices. Lo mismo se aplica a un grupo de aplicaciones lineales, siendo la ley de composición la relativa a las aplicaciones lineales, expre- sado con frecuencia como multiplicación.
GRUPOS 329 Obsérvese que los diversos ejemplos de grupos multiplicativos de matrices ¡jados anteriormente son no conmutativos cuando n 2: 2. En cada caso, la veri- jjcación de que el conjunto dado es un grupo, es solamente una repetición resu- jnida de las propiedades conocidas de los objetos considerados. K Un grupo que consta de un elemento se conoce como grupo trivial. Un grupo, en general, puede tener infinidad de elementos o bien sólo un número Kjnitó. Si (f tiene sólo un número finito de elementos, entonces G se conoce como un gruP° finito y el número de elementos en G se conoce como su orden. El grupo de permutaciones del ejemplo 4, es un grupo finito. La determinación de su orden se verá en los ejercicios. El grupo cuyos elementos son {1, — 1} (y la ley de composición es la multiplicación), tiene orden igual a 2. Ejemplo 12. El producto directo. Sean G, G' grupos. Sea G x G' el con- junto que consta de todas las parejas (x, x') con x e G y x' e G'. Si (x, x') y (y, y') son parejas de ese tipo, defínase su producto como (xy, x'y’). Entonces G x G' I es un grupo. Como ejercicio verifiqúese, con detalle, que se satisfacen todas las condiciones. Se llama a G x G' el producto directo de G y G'. I Ejercicios 1. Demostrar que el orden del grupo simétrico S2 es igual a 2. Demostrar que el orden del grupo simétrico S3 es igual a 6. En general, probar por inducción que el orden del grupo E simétrico S„ es igual a n'. 2. En cada uno de los ejemplos dados en el texto, establecer explícitamente cuál es el K elemento unidad del grupo. (El elemento unidad es el elemento cuya existencia se asegura K en GR 2. En la siguiente sección, se probará que está determinada en forma única.) 3. Demostrar que el conjunto de los números complejos que son raíces del polinomio f(t) = t” - 1 es un grupo (bajo la multiplicación). ¿Cuál es el orden de este grupo? f 4. Sea S un conjunto con, al menos, un elemento. Sea G él conjunto de todas las aplica- 1 cienes f :S -> S que son tanto inyectivas como suprayectivas. Demostrar que G es un grupo. K siendo la ley de composición la composición de aplicaciones. (Ya es conocida la condición h GR 1 como la ley de Ja asociatividad de aplicaciones.) Se dice que este grupo G es el grupo r de todas las aplicaciones invertibles de S en si mismo. Es una generalización de ]a noción B. de grupo de permutaciones sobre n elementos. K 5. Sea V un espacio vectorial sobre el campo K y sea <, > un producto escalar sobre V. I es decir, una forma simétrica bilineal. Un automorfismo de la forma es una aplicación lineal || invertible A : V -* V tal que < At¿ Aw> = <v, w) para todo », w e W. Demostrar que el con- K junto de automorfismos de la forma es un grupo. | 6. Sea G un grupo y sean a, b, c elementos de G. Si ab = ac, entonces, demostrar que I é = c- | 7. Sean G, G' grupos finitos de órdenes m, n, respectivamente. ¿Cuál es el orden de G x G"? 8. Sea G un grupo abeliano finito de orden igual a n y sean alt..., a„ sus elementos. L Demostrar que el producto «i, ..., a„ es un elemento cuyo cuadrado es el elemento unidad.
330 ALGEBRA LINEAL §2. Propiedades simples de los grupos Probemos ahora varios enunciados sencillos que son validos para todos los grupos. Sea G un grupo. El elemento e de G, cuya existencia está asegurada en GR 2. está determinado en forma única, ya que si e, e' satisfacen esta condición, entonces e' = ee' = e. Se dice que este elemento es el elemento unidad de G. También se dice que es el elemento nulo en el caso aditivo. Sea xg G. El elemento y, tal que yx = xy = e está determinado unívocamente. porque si z satisface zx = xz = e, entonces z = ez = (yx)z = y(xz) = ye = y. Se dice que y es el inverso de x y se denota con x~ *. Usando la notación adi- tiva, se escribe y = - x. Sea G un grupo y sea H un subconjunto de G. Decimos que H es un subgrupo si contiene al elemento unidad y si, siempre que x, ye H, entonces xy y x'1 son también elementos de H. (En notación aditiva escribimos x + ye El y — xeEi> Entonces, el propio Ei es un grupo por si mismo, siendo la ley de composición en H la misma que en G. El elemento unidad de G constituye un subgrupo y G es un subgrupo de sí mismo. Ejemplo 1. Un subespacio W de un espacio vectorial V es, en particular, un subgrupo. Ejemplo 2. El grupo de las matrices unitarias complejas es un subgrupo de) grupo de todas las matrices complejas invertibles (de un determinado tamaño), etc Hay una manera general de obtener subgrupos de un grupo. Sea S un sub- conjunto de un grupo G, que tiene al menos un elemento. Sea H el conjunto de elementos de G que consta de todos los productos Xj,..., x, tales que x¡ o x¡ 1 es un elemento de S para cada i y que, además, contiene al elemento uno. Entonces H es, obviamente, un subgrupo de G, conocido como el subgrupo generado por S. También se dice que S es un conjunto de generadores de H. Esta noción es análoga a la noción de generadores de un espacio vectorial, estudiada anteriormente en este libro. Los ejemplo de generadores se darán en los ejercicios. Sean G, G' grupos. Un homomorfismo f:G-*G' de G en G' es una aplicación que tiene la siguiente propiedad: para todo x, y e G, se tiene f(xy) = f(x)f(y) (y usando la notación aditiva, f(x + y) = /(x) + f (y)).
GRUPOS 331 Ejemplo 3. Una aplicación lineal es un homomorfismo. Ejemplo 4. Sea K un campo y denótese con Kx su grupo multiplicativo de elementos no nulos. Sea G el grupo de matrices invertibles n x n en K. Entonces, Det:G~ Kx es un homomorfismo. Esto no es más que la regla para la multiplicación de ma- trices. Ejemplo 5. La aplicación z>-> lzl es un homomorfismo del grupo multiplicativo de los números complejos en el grupo multiplicativo de los números complejos (de hecho, en el grupo multipli- cativo de los números reales positivos). Ejemplo 6. La aplicación x>->e* es un homomorfismo del grupo aditivo de los números reales en el grupo multi- plicativo de los números reales positivos. Su aplicación inversa, el logaritmo, también es un homomorfismo. Ejemplo?. Sea G un grupo. Sea x un elemento de G. Si n es un entero positivo, entonces se define xn como xx•• • x tomándose el producto n veces. Si n = 0, entonces se define x° = e. Si n = — m donde m es un entero > 0, entonces se define x“m = (x-1)”1. Así, resulta una rutina el verificar que la regla x’"+" = x”x” es válida para todos los enteros m, n. Como esta verificación es un poco tediosa, la omitimos. Sin embargo, nótese que en vista de esta propiedad, la aplicación es un homomorfismo del grupo aditivo de los enteros Z en G. Cuando G se es- cribe en forma aditiva, se escribe nx en lugar de x". Por brevedad, algunas veces se dice: “sea f :G-> G'un homomorfismo de grupos” en lugar de decir : “sean G, G' grupos y sea f un homomorfismo de G en G”.
332 algebra lineal Sea f .G—*G' un homomorfismo de grupos y sean e, e' los elementos uno de G, Q respectivamente. Entonces f(e) = e'. Prueba. Se tiene f(e) = f(ee) = fie)f(e). Al multiplicar por se obtiene el resultado deseado. Sea f : G -> G' un homomorfismo de grupos. Sea x e G. Entonces, Prueba. Se tiene e' = f(e) = f(xx~ ’) = f(x)f(x- *). Sean f: G -» G' y g: G' -» G" homomorfismos de grupos. Entonces la aplicación compuesta g* f es un homomorfismo de grupos de G en G”. tHttttttttttttttmnt Prueba. Se tiene (9°f)(xy) = g(f(xy)) = g(f(x)f(y)} = g(f(x))g(f (y)). Sea f: G G' un homomorfismo de grupos. Se define el núcleo de f como todos los elementos x e G tales que f(x) = é. Fácilmente se puede verificar que el núcleo es un subgrupo de G. (Contiene a e porque probamos fie) = e'. Como ejer- cicio, pruébense las otras propiedades.) Nótese que el núcleo de una aplicación lineal de espacios vectoriales es el mismo que el núcleo de la aplicación, cuando se considera como un homomorfismo de grupos (esto es, homomorfismos de grupos aditivos). Recuérdese que una aplicación f: S -> S' de un conjunto en otro se llama ínyectiva si f(x) f(y) siempre que x y. Sea f :G G' un homomorfismo de grupos. Si el núcleo de f consta solamente de e, entonces f es inyectiva. Prueba. Debe hacerla el lector, trasponiendo al caso presente el argumento que se dio anteriormente para el enunciado análogo sobre las aplicaciones lineales. Sea f:G G' un homomorfismo de grupos. La imagen de f es un subgrupo de G. Prueba. Si x' = f(x) con xe G y si y' = f(y) con yeG, entonces, *7 = f(xy) = /(x)/(y) también está en la imagen. Además, e' está en la imagen y x-1 = /(x-*) está en la imagen. Por tanto, la imagen es un subgrupo. Sea f: G -» G' un homomorfismo de grupos. Se dice que f es un isomorfismo (o, con más precisión, un isomorfismo de grupos) si existe un homomorfismo g: G' G tal que f a g y g o f son las aplicaciones identidad de G' y G respec- tivamente.
GRUPOS 333 •u Ejemplo 8. La función exp es un isomorfismo del grupo aditivo de ios nú- meros reales sobre el grupo multiplicativo de los números reales positivos. Su inversa es el log. Ejemplo 9. Dos espacios vectoriales que son isomorfos como espacios vec- toriales, también son isomorfos como grupos aditivos. • p Un homomorfismo de grupos f :G -» G' que es tanto inyectivo como suprayectivo (es decir: tal que la imagen de f es G') es un isomorfismo. Prueba. Debemos definir la inversa de f. Para cada x' e G', suponemos que g(x) es la única x tal que f(x) = x'. La existencia se debe a que f es suprayectiva y la unicidad se debe a que/es inyectiva. Se debe probar que g es un homomorfismo. Sean x', y' e G, y sean x, y e G tales que /(x) = x' y f(y) = /. Entonces, j (xy) = x'y. De donde por definición, g(x'y') = xy = Lo que prueba la afirmación. La prueba del enunciado precedente es, esencialmente, igual a la prueba del enunciado análogo sobre aplicaciones lineales, aunque en notación multiplicativa. Un automorfismo de un grupo es un isomorfismo del grupo con él mismo. Ejemplo 10. Sea V un espacio vectorial de dimensión finita sobre el campo K y sea A : V -+ V una aplicación lineal invertibie. Entonces, A se puede considerar como un automorfismo del grupo aditivo de V. Ejemplo 11. Sea G un grupo conmutativo. La aplicación XHX‘‘ es un automorfismo de G. Pruébese este resultado como ejercicio. ¿Cómo aparece este automorfismo con notación aditiva? Ejercicios 1. Sea Rx el grupo multiplicativo de los números reales. Descríbase explícitamente el núcleo del homomorfismo valor absoluto XH |x| de Rx en si mismo. ¿Cuál es la imagen de este homorfismo? 2. Sea Cx el grupo multiplicativo de los números complejos. ¿Cuál es el núcleo del ho- momorfismo valor absoluto de Cx en R’?
334 ALGEBRA LINEAL 3. Sea S el conjunto de todas las aplicaciones de R" en sí mismo, que son aplicaciones unitarias o bien traslaciones. (Una T traslación: R" -»R" es una aplicación para la cual existe un vector B en R" tal que T(X) = X + B para todo X e R’.) Sea G el grupo generado por los elementos de S. Entonces, G se conoce como el grupo de los movimientos rígidos de R". Demostrar que si F es iin movimiento rígido, entonces F preserva distancias, es decir, la distancia entre F(X) y F(Y) es la misma que la distancia entre X e Y para todo X, y en R*. El grupo unitario es un subgrupo de G. 4. (a) Sea G el conjunto de todas las aplicaciones de R en si mismo, del tipo x >-» ax + fe donde <reR,a^OybeR. Demostrar que G es un grupo. Denotemos tal aplica- ción con <ro_». Así, <r«,h(x) =» ax + Z>. (b) A cada aplicación <r,.s le asociamos el número a. Demostrar que la asociación <r«.» >-» a es un homomorfismo de G en Rx. Describir e! núcleo. 5. Sea G el conjunto de todas las aplicaciones de R" en si mismo, del tipo aA,t:X^AX + B, donde A es una matriz invertible n x n y B está en R". Demostrar que G es un grupo. De- mostrar que la aplicación es un homomoríismo de G en el grupo lineal general. Describir el núcleo. ó. Sea V un espacio vectorial de dimensión igual a n sobre el campo K. Demostrar que GL(n, K) es isomorfo a GIAV). 7. Demostrar que el grupo simétrico S3 está generado por las permutaciones [1 2 3*1 [12 31 |_2 3 1] y [2 1 3] 8. Sea G un grupo. Sea a un elemento de G; sea o. : G -> G la aplicación tal que <r,(x) = axa~l. Demostrar que el conjunto de todas estas aplicaciones a„ con a e G. es un grupo. 9. Demostrar que el conjunto de automorfismos de un grupo G es un grupo, denotado con Aut(G). 10. Manténgase la misma notación que la empleada en el ejercicio 8. Demostrar que la asociación a a, es un homomoríismo de G en Aut(G). La imagen de este homomoríismo se conoce como el grupo de automorfismos interiores de G. Por tanto, un automorfismo in- terior de G es aquel igual a alguna para algún a e G. 11. Sea K un campo. Demostrar que el grupo aditivo de K es isomorfo al grupo (¡mul- tiplicativo!) de las matrices del tipo 1 a\ 0 V con ae K.
GRUPOS 335 12. Sea G el grupo de todas las matrices ía b\ donde a, b, d están en un campo K y ad + 0. Demostrar que la aplicación (a b\ - o <rM es un homomoríismo de G sobre el producto K" x K ’ (donde Kx es el grupo multiplica- tivo de K). Descríbase el núcleo. También se podría considerar el homomoríismo definido en el grupo de las matrices diagonales 'a 0\ 0 d) el cual es isomorfo a K * x K 13. (a) Sea K un campo y sea G = Go el grupo de las matrices 3x3 triangulares supe- riores en K, que constan de todas las matrices invertibles «n «12 a¡3 0 <122 <¡23 0 0 <¡33 Sea Gi el conjunto de las matrices (1 <¡12 <¡13\ 0 1 «23I • 0 0 l Demostrar que G¡ es un subgrupo de G y que es el núcleo del homomoríismo que a cada matriz triangular T le asocia la matriz diagonal que consta de los ele- mentos diagonales de T. (b) Sea G2 el conjunto de las matrices 1 0 <¡13 0 1 0 ,0 0 1, Demostrar que G2 es un subgrupo de G¡. (c) Demostrar que la aplicación T 0 0 «12 1 0 «13| «23 I •-» («12> «23) 1 / es un homomorfismo del grupo Gt sobre el producto directo del grupo aditivo de K con él mismo. (Denótese este grupo con K x K.) ¿Cuál es el núcleo? (d) Demostrar que el grupo G2 es isomorfo de K. 14. Generalizar el ejercicio 13 al caso 4 x 4 y después al caso n x n.
336 ALGEBRA LINEAL 15. (a) Sea V un espacio vectorial sobre un campo K y sea t>i un elemento de V. Sea G el conjunto de todas las aplicaciones lineales invertibles A de V en si mismo, tales que Av, = Dp Demostrar que G es un grupo. (b) En forma más general, sea {o,, ..., t>, } un subconjunto de K Sea G el conjunto de todos los operadores invertibles A de V tales que /I»] — t>i, ..., Av¡ = Vi. Demostrar que G es un grupo. (c) Sean S un conjunto y S' un subconjunto y sea G el conjunto de todas las aplica- ciones f de S en sí mismo, tal que f es invertible y tal que f(x) = x para todo x 6 S'. Demostrar que G es un grupo. 16. Sea V un espacio vectorial de dimensión finita igual a n sobre el campo K. Sea JE, K,} una sucesión de subespacios, tal que dim V¡ = i y tal que está contenido en ।. Sea G el conjunto de todos los operadores invertibles de V para los cuales {V,,..., V,} es una base en abanico. Sea Gf el subconjunto de G que consiste de todos los operadores A tales que Av = v para todo r e K¡. Demostrar que G, Gt,..., G, son grupos y que Gi+i es un subgrupo de G,-. Compárese esta descripción geométrica con los grupos de matrices del ejercicio 14 o del 13. 17. Sean G un grupo y V un espacio vectorial de dimensión finita sobre el campo K. Se define como una representación de G sobre K un homomorfismo p: G —♦ GHV) de G en el grupo de aplicaciones lineales invertibles de V sobre si mismo. La representación se cono- ce como fiel si el núcleo de p es el elemento uno de G, es decir, si p es inyectivo. Si se selec- ciona una base de V, entonces p es equivalente a un homorfismo de G en el grupo de las ma- trices GL(n, K), donde n = dim V. Demostrar que un grupo finito G siempre admite tal re- presentación, procediendo como a continuación se indica: sea V el espacio vectorial de las combinaciones lineales formales de elementos de G, tal y como se explicó en el apéndice del capitulo XIII. Por tanto, los elementos de G forman una base de este espacio, sea {u,,..., a,}. Para cada a e G, sea A„ la aplicación lineal de V en si mismo tal que -4«(<r.) = <r<r¡. Demostrar que la aplicación a—>A, es un homomorfismo inyectivo de G en GL(V). 18. Describir algunos ejemplos para el ejercicio 17. (a) Sea G el grupo que consta de dos elementos {e, <r} con <r2 = e. (b) Considérese a G como el grupo simétrico S3. En cada caso, desarróllese la matriz asociada con cada elemento de G, después de seleccionar un orden definido para los elementos de G. 19. Si en el ejercicio 17, oe G y a e, demostrar entonces que todos los elementos diago- nales de A„ son iguales a 0. ¿Cuál es la matriz de At, en el ejercicio 17? §3. Clases laterales y subgrupos normales Sea G un grupo y sea H un subgrupo. Sea a un elemento de G. El conjunto de todos los elementos ax con x e H se conoce como clase lateral de H en G. De- notémosla con aH. Usando la notación aditiva, una clase lateral de H se escribiría a + H.
GRUPOS 337 Ejemplo 1. Sea A un vector fijo en R", con- siderado como un grupo aditivo, y sea W un subespacio de R". Entonces, el conjunto de todos los vectores A + X con X e W es una clase lateral de W en R". Así, se puede considerar a A + W7 como la traslación de W determinada por* fl. En la siguiente figura, se ilustra esta situación cuando W es una linea recta en R2. Como un grupo G puede no ser conmuta- tivo, se designa, de hecho, a aH como una clase lateral izquierda de H. Análogamente, se pueden definir las clases laterales derechas, aunque en la secuela, a menos que se especifique lo con- trario, clase lateral significará clase lateral izquierda. Figura 1 Teorema 1. Sean aH y bH clases laterales de H en el grupo G. Estas clases laterales son iguales o bien no tienen ningún elemento en común. Prueba. Supóngase que aH y bH tienen un elemento en común. Probáremos que son iguales. Sean x, y elementos de H tales que ax = by. Entonces, a = byx~ *. Pero yx'1 es un elemento de H. Si ax' es un elemento arbitrario de aH con x' en H, entonces ax’ - b(yx ')x'. Como (yx_,)x' está en H, se deduce que ax' está en bH. Por tanto, aH está con- tenido en bH. Análogamente, bH está contenido en aH y, por tanto, las clases la- terales son iguales. Teorema 2. Sea G un grupo y sea H un subgrupo finito. Entonces, el número de elementos de una clase lateral aH es igual al número de elementos en H. Prueba. Sean x, x' elementos distintos entre sí de H. Entonces, ax y ax! son distintos entre si, ya que si ax = ax', entonces al multiplicar por a-1 por la izquierda se obtiene x = x'. Por tanto, si xt,..., x„ son los elementos de H dis- tintos entre sí, entonces axr, ...,ax, son los elementos de aH distintos entre sí, de donde nuestra afirmación queda probada. Sea G un grupo y sea H un subgrupo. El número de clases laterales de H en G distintas entre sí, se conoce como el índice de H en G. Este índice puede ser, por supuesto, infinito. Si G es un grupo finito, entonces el índice de cualquier subgrupo es finito. El indice de un subgrupo H se denota con (G: H). Corolario. Sea G un^grupo finito y sea H un subgrupo. Entonces orden de G = (G: 77)(orden de H). Prueba. Todo elemento de G está en alguna clase lateral (a saber: a está en la clase lateral aH, ya que a = ae). Por el teorema 1, todo elemento está precisamente en una clase lateral y por el teorema 2, cualesquiera dos clases laterales tienen el mismo número de elementos. Por consiguiente, la fórmula del corolario es evi- dente.
338 ALGEBRA LINEAL El corolario también muestra que el orden de un subgrupo de un grupo finito divide el orden del grupo. Sea G un grupo. Se dice que un subgrupo H es normal si es el núcleo de algún homomorfismo de G en algún grupo. Teorema 3. Sea f :G -> G' un homomorfismo de grupos. Sea H su núcleo y sea a' un elemento de G', que está en la imagen de f, digamos que a' = f(a) para aeG. Entonces, el conjunto de elementos x en G tales que f(x) = a' es precisamente la clase lateral aH. Prueba. Sea xeaH, así que x = ah con algún heH. Entonces, /(*) = f(a)fW - /(«) Recíprocamente, supóngase que xeG y que f(x) = a’. Entonces, fla-'x) = /(a)"‘/(x) = a'~la' = e'. De donde a~lx está en el núcleo H, digamos que a~*x = h con algún heH. Entonces x = ah, como se quería demostrar. Sea f :S—>S' una aplicación. Si x' es un elemento de S', se denota con f~ ’(x') el conjunto de todos los xeS tales que f{x) = x', y se llama imagen inversa de x' bajo f. Generalmente consta de más de un elemento. En el teorema 3, se puede decir que la imagen inversa de un elemento a' de G' es una clase lateral de G. Ejemplo 2. Sea A una matriz n x n en un campo K y sea LA : K" -> K" la apli- cación lineal asociada. Sea B e K". Entonces, LAl(B) es el conjunto de soluciones de las ecuaciones lineales AX = B. El teorema 3 es una generalización del hecho de que este conjunto de soluciones es una clase lateral del núcleo de L¿, siempre y cuando exista al menos una solución. Cierta- mente, si Xo es una solución y si W es el núcleo de LÁ, entonces, = Xo + W. Ya se había visto esto cuando se estudiaron las ecuaciones lineales y ahora hay un nuevo nombre para este fenómeno. La estipulación de que exista al menos una solución,equivale a decir que B está en la imagen de L¿. Ahora vamos a describir una prueba sencilla para reconocer cuándo un sub- grupo es normal. Es necesaria una notación conveniente. Sean S y S' subconjuntos de un grupo G. Se define SS' como el conjunto de todos los elementos xx' con x e S y x' e S'. Entonces es fácil de verificar que si Si, S2 y S3 son tres subconjuntos de G, entonces (SiS2)S3 = S,(S2S3). Este producto consta simplemente de todos los elementos xyz, con xeS],yeS2 y z e Sj. Si H es un subgrupo de G, entonces se verifica fácilmente que HH — H.
GRUPOS 339 Teorema 4. Sean G un grupo y H un subgrupo que tiene ¡a propiedad de que xH — Hx para todo xeG. Si aH y bH son clases laterales de H, entonces el producto (aH) (bH) también es una clase lateral y la colección de clases laterales es un grupo; el producto está definido como antes se indicó. Prueba. Tenemos que (aH)(bH) = aHbH = abHH = abH. De donde el pro- duqt^ de dos clases laterales es una clase lateral. La condición GR 1 se satisface en virtud de las observaciones precedentes sobre la multiplicación de subcon- juntos de G. La condición GR 2 se satisface, en donde el elemento uno es la clase lateral eH = H. (Verifiqúese con detalle tal afirmación.) La condición GR 3 se satisface, siendo a~iH el inverso de aH. (Nuevamente verifiqúese esta afirmación con detalle.) Por tanto, el teorema 4 queda probado. El grupo de las clases laterales que aparece en el teorema 4 se conoce como el grupo cociente de G por H y se denota con G/H. Nótese que es un grupo de clases laterales izquierdas o derechas y que no existe diferencia entre ellas por suposición sobre H. Hacemos hincapié en que es esta suposición la que permite definir la multiplicación de clases laterales. Si la condición xH = Hx para todo xeG no se satisface, entonces no se puede definir un grupo de clases laterales. Corolario. Sean G un grupo y H un subgrupo que tienen la propiedad de que xH = Hx para todo xeG. Sea G/H el grupo cociente y sea f :G^ G/H la aplicación que a cada aeG le asocia la clase lateral f(a) = aH. Entonces,/ es un homomorfismo y su núcleo es precisamente H. De donde H es normal. Prueba. El hecho de que f es un homomorfismo no es otra cosa que una re- petición de la definición del producto de clases laterales. Con relación al núcleo, es claro que todo elemento de H está en el núcleo. Recíprocamente, si x e G y f(x) = xH es el elemento uno de G/H, entonces resulta ser la propia clase lateral H, por lo que xH = H. Esto significa que xe = x es un elemento de H, así que H es igual al núcleo de f, tal y como se deseaba. Ejercicios 1. Sea f: G -»G' un homomorfismo con núcleo H. Supóngase que G es finito. Demos- trar que: orden de G = (orden de la imagen de f) (orden de H). Compárese este resultado con el teorema análogo sobre las dimensiones de aplicaciones lineales. 2. (a) Sea H un subgrupo normal de un grupo G. Demostrar que si x e H y a e G, en- tonces axa~l también está en H. (b) Sea H un subgrupo normal de G. Demostrar que la clase lateral izquierda aH es igual a la clase lateral derecha Ha. 3. Sea H un subgrupo de G y supóngase que xHx~' ~ H para todo x e G. Entonces, x~'Hx = H para todo xeG. y Hx - xH para todo xeG.
340 ALGEBRA LINEAL 4. Sea G un grupo y sea H un subgrupo. Demostrar que H es normal si y sólo si xHx 1 = H para todo x e G. 5. Si G es conmutativo, entonces demostrar que todo subgrupo es normal. 6. Sean Ht, H2 dos subgrupos normales de G. Demostrar que Ht n H2 es normal. 7. Sea J : G -> G' un homomoríismo y sea H' un subgrupo de G'. Demostrar que es un subgrupo de G. Si H' es normal en G', demostrar que f~ *(H')es un subgrupo normal de G. 8. Sea f :G->G' un homomoríismo suprayectivo. Sea H un subgrupo normal de G. Demostrar que f(H) es un subgrupo normal de G'. 9. En cada uno de los siguientes casos, damos un grupo y un subgrupo. Determinar si el subgrupo es normal en el grupo dado. (a) G = GL„(K) y H = grupo de las matrices n x n en K con determinante igual a 1. (b) G = GL.(R) y H = U.(R). (c) G = GL„(K) y H — grupo de las matrices diagonales (invertibles) en K. (d) G = grupo de las matrices triangulares superiores en K y H = grupo de las ma- trices triangulares superiores en K en las cuales los elementos diagonales son iguales a 1. (e) G = grupo simétrico S„ y H = subgrupo de permutaciones pares. (f) G = grupo simétrico S„ y H = subgrupo de permutaciones que dejan fijo al en- tero n (es decir, tales que <r(n) = n). 10. Sea Go el grupo de todas las matrices Za í>\ \c “v con enteros a, b, c, d y que tienen determinante igual a 1. Exhibir tres elementos de este grupo. 11. Sea G el grupo de todas las matrices (a v V donde a, b. c, d son enteros que tienen determinante igual a 1 o a — 1. Demostrar que el grupo del ejercicio 10 es un subgrupo normal de G. Demostrar que el grupo cociente G/Go tiene orden igual a 2. 12. Sea G un grupo. Definase el centro de G como el subconjunto de todos los elementos a en G tales que ax = xa para todo x 6 G. Demostrar que el centro es un subgrupo y que es un subgrupo normal. Demostrar que es el núcleo del homomoríismo que aparece en el ejer- cicio 10, §2. 13. Sea G un grupo conmutativo y sea H un subgrupo. Demostrar que G/H es conmu- tativo. 14. Sea G un grupo finito con n elementos, digamos at, ..., a„. Para cada xeG, demos- trar que los elementos xa¡,..., xa„ son distintos entre sí y que, por tanto, constituyen una permutación de a¡,..., a„. Por tanto, que se puede asociar con cada xeG una permuta- ción <r, de {1,..., n} tal que xa¡ = aax(0
GRUPOS 341 para i = 1,..., n. Demostrar que la aplicación x >-♦ a, es un homomoríismo inyectivo de G en el grupo simétrico S„. De esta manera, se puede considerar a G como un subgrupo de un grupo de permutaciones. 15. Sea f:G->G' un grupo de homomorfismos y sea H su núcleo. Supóngase que G' es la imagen de f. Demostrar que G/H es isomorfo de G'. 16. Sea G un grupo y sea H un subgrupo. Sea Na el conjunto de todos los x e G tales que xHx~' <z H. Demostrar que NH es un grupo que contiene a H y que H es normal en /V„. 17. Sean G un grupo, H un subgrupo y N un subgrupo normal. Demostrar que NH es un subgrupo y que NH - HN. §4. Grupos cíclicos Los enteros Z forman un grupo aditivo. Determinemos sus subgrupos. Sea H un subgrupo de Z. Sea a el mínimo entero positivo en H, si es que H no es trivial. Afirmamos que H consta de todos los elementos na, con n e Z. Para probar esta afirmación, considérese que ye H y digamos que y > 0. Existen enteros n y r con 0 r < a tales que y = na + r. Como H es un subgrupo y r = y — na, tenemos que reH, de donde r = 0. Si y < 0, entonces se aplica el argumento precedente a —y que está en H ya que H es un subgrupo. Sea G un grupo. Se dice que G es cíclico si existe un elemento a de G tal que todo elemento x de G se puede escribir en la forma a" para algún entero n. (Esto es equivalente a decir que la aplicación f: Z -> G tal que f(ri) = a" es supra- yectiva.) Tal elemento a de G se conoce entonces como un generador de G. Sea G un grupo y sea a e G. El subconjunto de todos los elementos a"(n e Z) obviamente es un subgrupo cíclico de G. Si m es un entero tal que am = e y m > 0, entonces se dice que m es un exponente de a. Sea G un grupo y sea a un elemento de G. Sea f: Z -» G el homomoríismo tal que f(ñ) = a" y sea H el núcleo de f. Aparecen dos casos: (i) El núcleo es trivial. Entonces f es un isomorfismo de Z sobre el subgrupo de G generado por a, ya que f es inyectivo y la imagen de f es, precisamente, igual a este subgrupo. Además, este subgrupo es cíclico infinito. Si a genera a G, entonces G es cíclico. También decimos que a tiene período infinito. Ejemplo 1. El número 2 genera un subgrupo cíclico infinito del grupo mul- tiplicativo de los números complejos. Sus elementos son ..., 2-5, 2“4, 1, 2, 4, 8, 24, 25, ...
342 algebra lineal (ii) El núcleo no es trivial. Sea d el mínimo entero positivo en el núcleo. Entonces d se conoce como el período de a. Si m es un entero tal que am = e, entonces m = ds para algún entero s, por lo que se probó al principio de esta sección. Nótese que los elementos e,a,..., tf~l son distintos entre sí Ciertamente, supóngase que ar = as con 0 r ¿ d ~ ly OSsgd- 1, digamos que r á s. Entonces a’~' = e. Como 0 g s - r < d, se debe tener s - r = 0, de donde r = s. Se concluye que el grupo cíclico gene- rado pora, en este caso, tiene orden igual a d. Ejemplo 2. El grupo multiplicativo {1, —1} es cíclico de orden 2. Ejemplo 3. Los números complejos {1, i, -1, - i} forman un grupo cíclico de orden 4. El número i es un generador. Ejemplo 4. La matriz / 0 +1\ V-l oj es el generador de un grupo cíclico de orden 4 (ley multiplicativa de la compo- sición). Verifiqúese este resultado con detalle. Teorema 5. Sea G un grupo finito y sea a un elemento de G. Entonces el pe- riodo de a divide al orden de G. Prueba. El orden del subgrupo generado por a es igual a d. Se puede aplicar ahora el corolario del teorema 2, §3. Teorema 6. Sea G un grupo cíclico. Entonces, cualquier subgrupo de G es cíclico. Prueba. Sea a un generador de G, por lo que tenemos un homomorfismo /:Z—>G tal que /(n) = a". Sea H un subgrupo de G. Entonces /"’(//) (el conjunto de los neZ tales que f(n)e H) es un subgrupo A de Zy, por tanto, es cíclico En efecto, se sabe que existe un entero positivo único d tal que/-1(H) consta de todos los enteros que se pueden escribir en la forma md con m e Z. Como f es suprayectivo. se deduce que f aplica a A sobre todo H. es decir, todo elemento de H es de la forma amd con algún entero m. Se infiere que H es cíclico y que, en efecto, a* es un generador.
GRUPOS 343 Ejercicios 1. Una raíz de la unidad en los números complejos es un número a> tal que a)‘ = I para algún entero positivo n. Entonces se dice que w es una raíz enésima de la unidad. Des- críbase el conjunto de las raíces enésimas de la unidad en C. Demostrar que este conjunto es un grupo cíclico de orden n. ’2#Determinar los períodos de las siguientes matrices: (0 1 0 0 0 1 1 0 0 0 0 1 0 0 1 0 0 Generalizar al caso n x n. 3. Sea G un grupo finito. Demostrar que todo elemento de G tiene período finito. 4. Sean ci>i,..., <o„ raíces de la unidad y supóngase que si se hace 0 • 0 0 <o2 0 0 • 0 o». entonces A tiene período d. Sea B una matriz invertible n x n. Demostrar que B lAB tam- bién tiene periodo d. 5. En general, sea A cualquier matriz invertible n x n y sea B una matriz invertible n x n. Demostiar que los periodos de A y de B~'AB son los mismos. 6. Sea f-.G-*G' un isomorfismo de grupos. Sea a e G. Demostrar que el periodo de a es el mismo que el período de /(a). 7. Considérese el grupo aditivo de los enteros Z. Demostrar que tiene sólo dos genera- dores, a saber 1 y — 1. En general, demostrar que un grupo cíclico infinito tiene sólo dos ge- neradores. 8. Sea S3 el grupo simétrico y sea e:S3 -»{1, — 1} el homomorfismo dado por el signo de la permutación. ¿Cuál es el orden del núcleo de e? 9. Esta pregunta es semejante a la del ejercicio 8, pero ahora aplicada a S, en lugar de S3. 10. Demostrar que un grupo finito cuyo orden es un número primo es necesariamente cíclico. 11. Demostrar que un grupo de orden 4 es cíclico, o bien contiene dos elementos a, b con a / b tales que a2 = b2 = e y ab = ba. 12. Demostrar que si A tiene una matriz n x n de período finito, entonces todos los va- lores propios de A son raíces de la unidad. 13. Sean A, B dos grupos cíclicos finitos de órdenes m y n respectivamente. Supóngase que m, n son primos relativos. Demostrar que A x B es cíclico. ¿Cuál es el orden? 14. Sea G un grupo cíclico y seaf: G—>G’ un homomorfismo. Demostrar que la imagen de f es cíclica.
344 algebra lineal 15. Sea G un grupo cíclico finito de orden n. Demostrar que para cada entero positivo </ que divide a n, existe un subgrupo de orden d. 16. Demostrar que el subgrupo de orden d que aparece en el ejercicio 15 está determina- do en forma única. 17. Sea G un grupo cíclico finito de orden n. Sea a un generador. Sea r un entero ¿ 0 que es primo relativo de n. Demostrar que a, es también un generador de G. Demostrar que todo generador de G se puede escribir en esta forma. 18. Sea G cíclico de orden p, donde p es un número primo. ¿Cuántos generadores tiene G? 19. Sean A y B grupos abelianos. Demostrar que los homomorfismos de A en B forman un grupo. (Si se escriben A y B en forma aditiva, y f,g : A -» B son homomorfismos, defi- nase f + g como la aplicación tal que (/ + g\x) = f(x) + g(x). ¿Cuál es el elemento uno? 20. Supóngase que G es un grupo cíclico de orden n y que Z„ es otro grupo cíclico de orden n. Demostrar que el grupo de homomorfismos de G en Z, es cíclico de orden n. 21. Sea A un grupo abeliano, escrito en forma aditiva, y sea n un entero positivo tal que nx = 0 para todo xeA. Supóngase que se puede escribir n = rs, donde r y s son enteros po- sitivos primos entre sí. Supóngase que A, consta de todos los x e A tales que rx — 0, y aná- logamente que A, consta de todos los x e A tales que sx = 0. Demostrar que todo elemento a e A se puede expresar de manera única, en la forma a = b + c, con be Ar y ce A,. (Este resultado es semejante al del teorema 5 del capítulo XII, §5.) 22. Sea A un grupo abeliano aditivo y sean B y C subgrupos. Supóngase que B + C consta de todas las sumas b + c, con be B y ce C. Demostrar que B + C es un subgrupo, conocido como la suma de B y C. Definir, análogamente, la suma de un número finito de subgrupos. Se dice que A es la suma directa de B y C si todo elemento x e A se puede expresar de manera única en la forma x = b + c con be B y ce C y análogamente para varios subgrupos. 23. Demostrar que el grupo abeliano aditivo A es la suma directa de los subgrupos B y C si y sólo si A = B + C y B r>C = {O}. 24. Sea A un grupo abeliano finito de orden n y sea n = p? • p? su factorización en primos elevados a ciertas potencias, con los p¡ distintos entre sí. Demos- trar que A es una suma A = ®,..., © A„ donde todo elemento de A¡ tiene periodo divisor de p-'. §5. Grupos abelianos libres A lo largo de esta sección trabajaremos con grupos conmutativos. Deseamos analizar bajo qué condiciones podemos definir el análogo de una base para tales grupos. Sea A un grupo abeliano. Una base de A es un conjunto de elementos »i, ..., vn(n g 1) de A, tal que todo elemento de A tiene una expresión única como una suma CjU] + • • • + c„v„
GRUPOS 345 con enteros c¡ e Z. Asi, una base para un grupo abeliano se define de una manera completamente análoga a una base para espacios vectoriales, salvo que se requiere que los coeficientes ct,..., c„ sean enteros. Teorema 7. Sea A un grupo abeliano con una base {vj,....»,}. Sea B un • grupo abeliano y sean wt, ..., w, elementos de B. Entonces existe un homo- morfismo de grupos f : A -» B, único,' tal que f(v¡) = w¡ para todo i = 1,..., n. Prueba. Copíese la prueba análoga para los espacios vectoriales, omitiendo constantes que no vienen al caso, etc. Los teoremas relativos a la posibilidad de extender bases de un subgrupo ya no son válidos para los grupos abelianos. Sin embargo, se puede rescatar algo de la teoría. Para evitar confusión al trabajar con bases de grupos abelianos como antes, y con bases de espacios vectoriales, designemos las bases de los grupos abelianos como Z-bases. Ajustándonos al espíritu geométrico de este libro, se usan argumentos geomé- tricos para probar el resultado. Teorema!. Sea A un subgrupo no nulo de R". Supóngase que en cualquier región acotada del espacio existe sólo un número finito de elementos de A. Sea m el número máximo de elementos de A que son linealmente independientes sobre R. Entonces podemos seleccionar m elementos de A que son linealmenie independientes sobre R, y forman una Z-base de A. Prueba. Sea {wlt..., wm} un conjunto máximo de elementos de A linealmente independientes sobre R. Sea V el espacio vectorial generado por estos elementos y sea Vm-i el espacio generado por ..., w„-i. Sea Am-¡ la intersección de A y Kn-j. Entonces, ciertamente, en cualquier región del espacio, existe solamente un número finito de elementos de A„_t. Por consiguiente, si m > 1, se puede suponer inductivamente, que {w];..., »„->) es una Z-base de A. Ahora considérese el conjunto S de todos los elementos de A que se pueden escribir en la forma tjWj + • • • + tmwm con 0 íg r, <1 si i = 1,.,., m - 1 y 0 ¿ tm g 1. Este conjunto S ciertamente está acotado y, por tanto, contiene sólo un número finito de elementos (entre los cuales está w„). Seleccionemos en este conjunto un elemento vm cuya última coordenada t„ es la mínima posible > 0. Probemos que {w,,..., wm-1, vm}
346 ALGEBRA LINEAL es una Z-base para A. Escríbase vm como una combinación lineal dewi,...1)F con coeficientes reales, = CjWi + • • • + cmwm, 0 < cn < 1. Sea v un elemento de A, y escríbase V = XiW! + • • • + xmw„ con x¡ e R. Sea qm el entero tal que QmCm S *. < (qm + l)cm. Entonces, la última coordenada de v — q„vm con respecto a {un, ..., ivm} es igual a xm - qmvm, y 0 á x, - qmc„ < (<?m + ÍK - = Cm 1. Sean q¡(i — 1, ..., m — 1) enteros tales que q¡ S x¡ < q¡ + 1. Entonces, (1) V - qiWi - -qm-iWm-i es un elemento de S. Si su última coordenada no es 0, entonces es un elemento cuya última coordenada es menor que cm, lo que resulta contrario a la construc- ción de vm. De donde la última coordenada es 0 y, por tanto, el elemento de (1) está en Pm_1.Por inducción, se puede escribir como una combinación lineal de w1(..., wm_! con coeficientes enteros, de donde se infiere de inmediato que p se puede expresar como una combinación lineal de wlt..., wm-i, vm con coefi- cientes enteros. Además, es claro que w,,..., wM-i, vm son linealmente indepen- dientes sobre R y, por tanto, satisfacen los requisitos del teorema. Ahora se puede aplicar el teorema a grupos más generales. Sea A un grupo aditivo y sea f: A -> A' un isomorfismo de A con un grupo A’. Si A’ admite una base, por ejemplo {vj,..., p^} y si v¡ es el elemento de A tal que f(v¡) = p'¡, entonces se puede verificar inmediatamente que {vi,..., p„) es una base de A. Teorema 9. Sea A un grupo aditivo que tiene una base con n elementos. Sea B un subgrupo # {0}. Entonces, B tiene una base con á n elementos. Prueba. Sea {u¡,..., p,} una base de A. Por el teorema 7 se sabe que existe un homomoríismo
GRUPOS 347 tal que /(v,) = e‘ para i = 1,..., n, y este homomoríismo es, obviamente, inyectivo. De donde da un isomorfismo de A con su imagen en R". Por otro lado, es fácil de verificar que en cualquier región acotada de R", existe sólo un número finito de elementos de la imagen f(A), ya que en cualquier región acotada, los coefi- cientes de un vector ' * (ci, •••,£«) están acotados. Por tanto, por el teorema 8 se concluye que f(B) tiene una Z-base, de donde B tiene una Z-base. Teorema 10. Sea A un grupo aditivo que tiene una base con n elementos. Entonces, todas las bases de A tienen este mismo número n de elementos. Prueba. Considérese el homomoríismo f :A -» R" como en la prueba del teorema 9. Sea {wi,..., una base de A. Cada v¡ es una combinación lineal con coeficientes enteros de w1(..., wm. Por tanto, /(«,) = es una combinación lineal con coeficientes enteros de /(wj),..., De donde e1, ..., e" están en el espacio generado por /(wj,..., /(wm). Por la teoría de las bases para es- pacios vectoriales, se concluye que m n, de donde m = n. Ejercicios 1. Sea A un grupo abeliano con un número finito de generadores y supóngase que A no contiene ningún elemento de periodo finito, saivo al elemento unidad Escribamos A aditi- vamente. Sea d un entero positivo. Demostrar que la aplicación x -» dx es un homomoríismo inyectivo de A en sí mismo, cuya imagen es isomorfa de A. 2. Manténgase la notación usada en el ejercicio 1. Sea {a,,..., un conjunto de genera- dores de A. Sea {at,..., a,} un subconjunto máximo linealmente independiente sobre Z. Sea B el subgrupo generado por a¡,..., a,. Demostrar que existe un entero positivo d tal que dx está en B para todo x en A. Usando el teorema 8 y el ejercicio 1, deducir que A tiene una base.
mutnuuntttHttntHtuuu
CAPITULO XV Anillos En la mayor parte del trabajo desarrollado hasta ahora no hemos trabajado con la división, sólo con la adición y la multiplicación. En consecuencia, vale la pena axiomatizar la estructura que envuelve solamente esas operaciones. En este capitulo, se dejan muchos ejemplos y «unciados como ejercicios muy sencillos que el lector deberá desarrollar con detalle. §1. Anillos e ideales- Un anillo R es un conjunto cuyos objetos se pueden sumar y multiplicar (es decir, se dan asociaciones (x,y)«x + y y (x, $•-* xy de parejas de elementos de R en R), que satisfacen las siguientes condiciones: AI 1. Bajo ¡a adición, R es un grupo (abeliano) aditivo. AI 2. Para todo x,y,zeR se tiene x(y + z) = xy + xz y (y + z)x = yx + zx AI 3. Para todo x, y, z e R se tiene (xy)z = x(yz). AI 4. Existe un elemento eeR tal que ex = xe — x para todo x6R. Ejemplo 1. Sea R los enteros Z. Entonces, R es un anillo. Ejemplo 2. Cualquier campo es también un anillo. Ejemplos. Sea R el conjunto de las funciones continuas definidas sobre [0,1] y evaluadas en los reales. Se definen la suma y el producto de dos funciones f, g, de la manera usual, a saber (/ + g)(t) = f(t) + g(t) y (fg)(t) = f(t)g(f). Entonces R es un anillo. Por supuesto, el ejemplo 3 se puede generalizar al considerar funciones sobre cualquier conjunto, con valores en un campo o en un anillo. Ejemplo 4. Si K es un campo, entonces los polinomios de K[t] forman un anillo. Ejemplo 5. Los polinomios en varias variables K[tj, •••,£„] forman un anillo. 349
350 ALGEBRA LINEAL Ejemploó. Las matrices n x n Mat„(K) sobre un campo K forman un anillo. Esto es simplemente una breve manera de volver a enunciar algunas propiedades referentes a la adición y a la multiplicación de matrices. Ejemplo?. Sea V un espacio vectorial sobre el campo K. Entonces, los opera- dores de V en sí mismo forman un anillo %!iy, F). Ahora el producto es la com- posición de aplicaciones. Nuevamente, el hecho de que los axiomas de anillo se satisfacen no és nada distinto de enunciar las propiedades referentes a la com- posición de aplicaciones lineales. Como con los grupos, se ve de inmediato que el elemento e de un anillo es único. A menudo se denota con 1 y se conoce como el elemento unidad. En un anillo, las reglas ordinarias de la aritmética se pueden deducir fácil- mente de los axiomas. Por ejemplo, tenemos que Ox = 0 y que ( — e)x = — x para todo xeR. Se dejan como ejercicios las pruebas de estas afirmaciones. También se tiene que(-e)(—e) = e. Para probar lo dicho, nótese que e + ( — e) = 0. Al multiplicar por — e, se tiene -e + (-e)(-e) = 0. Sumando a ambos miembros e, se obtiene (— e)( — e) = e, como se deseaba. Observación. Algunas veces resulta útil el considerar sólo las primeras dos condiciones AI 1 y AI 2, especialmente en el contexto, cuando se trabaja con un espacio vectorial. Con más precisión, sea V un espacio vectorial sobre un campo K y supóngase que se da una aplicación bilineal V x V -+ V que se considera como una multiplicación. Entonces se dice que V es una K-álgebra, para distinguir a Fde un anillo, ya que no se ha supuesto la asociatividad o un elemento unidad. Ejemplo8. Sea V el espacio de las funciones continuas, sobre la recta real, periódicas de período igual a 2a. Sean f, g e V y definase su producto f* g me- diante la fórmula (f*g)W = j /(t - Ca- usando propiedades sencillas de la integral, se verifica fácilmente que se satisfacen las condiciones AI 1, 2 y 3. El producto en este ejemplo se conoce como con- volución. Ejemplo 9. Sea G un grupo finito. Sea K un campo y sea V el espacio vectorial de las funciones de G en K. Si f,g son dos de tales funciones, entonces se define su producto convolución /» g mediante la fórmula Nuevamente se deja como ejercicio el verificar que se satisfacen las condiciones AI 1, 2 y 3. Sin embargo, esta vez también se satisface AI 4. ¿Cuál es el elemento unidad? Vea el ejercicio 8 para un ejemplo de la no asociatividad.
ANILLOS 351 Si un anillo satisface la condición xy = yx para todo x, y e R, entonces el anillo se conoce como conmutativo. Sea R un anillo. Un ideal izquierdo de R es un subconjunto J de R que tiene las siguientes propiedades: si x,yeJ, entonces x + yeJ también; el elemento nulo está en J y si x e J y a e R, entonces ax e J. IJsando el negativo — e, se ve que si J es un ideal izquierdo y xe J, entonces — xeJ también lo es, ya que — x = ( — e)x. Por lo que los elementos de un ideal izquierdo forman un subgrupo aditivo de R y se puede decir además que un ideal izquierdo es un subgrupo aditivo J de R tal que, si xe J y ae R entonces ax e J. Nótese que R es un ideal izquierdo, conocido como el ideal unitario, y que también lo es el subconjunto de R que consta sólo del 0. Análogamente, se puede definir un ideal derecho y un ideal bilateral. Así, un ideal bilateral J es, por definición, un subgrupo aditivo de R tal que si x e J y aeR, entonces ax y xa eJ. Ejemplo 10. Sea R el anillo de las funciones continuas definidas sobre el in- tervalo [0,1], y evaluadas en los reales. Sea J el subconjunto de las funciones f tales que /(l) = 0. Entonces, J es un ideal (bilateral, ya que R es conmutativo). Ejemplo 11. Sea R el anillo de los enteros Z. Entonces, los enteros pares, es decir, los enteros del tipo 2n con n e Z, forman un ideal. ¿Forman los enteros un ideal? Ejemplo 12. Sea R un anillo y sea a un elemento de R. El conjunto de los ele- mentos xa con x e R es un ideal izquierdo, conocido como el ideal izquierdo principal generado por a. (Verifiqúese con detalle que es un ideal izquierdo.) Denótese con (a). En forma más general, sean ot,... ,a„ elementos de R. El con- junto de todos los elementos Xíüj + •• • + x„a„ con x¡ e R, es un ideal izquierdo denotado con (ai,..., a„). Se dice que a¡,..., a„ son los generadores de este ideal. Ejemplo 13. Sea R un anillo. Sean L y M ideales izquierdos. Se denota con LM el conjunto de todos los elementos x^ + • • • + x„y„ con x¡ e L y y^M. Es un ejercicio sencillo para el lector, el verificar que LM también es un ideal izquierdo. Verifiqúese además, que si L, M y N son ideales izquierdos, entonces (LM)N = L(MN). Ejemplo 14. Sean L y M ideales izquierdos. Se define L + M como el sub- conjunto que consta de todos los elementos x + y con xeL y yeM. Entonces, L + M es un ideal izquierdo. Además de verificar esta afirmación con detalle, muéstrese que si L, M y N son ideales izquierdos, entonces L(M + N) = LM + LN. Formular y probar, además, enunciados análogos a los ejemplos 13 y 14 para ideales derechos y bilaterales.
352 ALGEBRA LINEAL Ejemplo 13. Sea L un ideal izquierdo y denótese con LR el conjunto de los elementos x(yt + • • • + x„y„con x¡e Ly y¡e R. Entonces,LRes un ideal bilateral. Hágase la prueba como ejercicio. Sea R un anillo. Un subanillo R’ es un subconjunto de R tal que el elemento uno de R está en R' y si x, y e R!, entonces — x, x + y y xye R'. Se deduce que R' es un anillo, y las operaciones de adición y de multiplicación en R' son iguales a las de R. Ejemplo 16. Las funciones diferenciales definidas sobre R y evaluadas en las reales, forman un subanillo del anillo de las funciones continuas. Ejemplo 17. Sea V un espacio vectorial sobre el campo K y sea A un operador de V. El conjunto de todos los operadores de V del tipo /(4), donde f es un poli- nomio en K[t], es un subanillo del anillo de las aplicaciones lineales de V en sí mismo. Observaciones sobre los campos abstractos. Un anillo conmutativo K tal que 1 # 0 y tal que el conjunto de los elementos no nulos es un grupo bajo la multi- plicación, se conoce como campo abstracto. Esta segunda condición también se puede expresar diciendo que cualquier elemento no nulo del anillo tiene un inverso multiplicativo. La mayor parte de los teoremas del álgebra lineal es válida sobre campos abstractos. Solamente hemos empleado propiedades especiales de los números reales y complejos de la manera siguiente: (1) Usamos las propiedades de orden al estudiar los productos escalares definidos positivamente. (2) Usamos el hecho de que todo polinomio de grado S 1 sobre los números complejos tiene una raíz en los números complejos. Sin embargo, lo que se hizo en este caso se ajusta también a un campo abstracto que tenga esta propiedad y asi se dice que es algebraicamente cerrado. (3) De manera muy incidental, con respecto al criterio de la derivada para las raíces múltiples, usamos el hecho de que nuestros campos contienen los números racionales como un subcampo. Este fue un punto de importancia menor en toda la teoría. El estudiante al que le gusten las matemáticas más abstractas puede, por consiguiente, leer el libro interpretando la palabra campo como equivalente a campo abstracto, observando únicamente las excepciones que se acaban de mencionar. Sin embargo, esto es realmente de importancia secundaria, a nivel incluso de sofisticación con respecto al curso y, por tanto, creo que es mejor evi- tarle problemas al lector con esta abstracción adicional. Ejercicios 1. Demostrar que un campo no tiene ideales bilaterales distintos de los ideales nulo y unitario. 2. Puede ocurrir que en un anillo R un producto xy sea igual a 0, pero que x 0 y y 0. Dar un ejemplo de este hecho en el anillo de las matrices y también en el anillo de las fun- ciones continuas sobre el intervalo [0.1],
ANILLOS 353 3. Sea R un anillo conmutativo. Si M es un idea), entonces abrevíese MM por M2. Sean Mi,M2 dos ideales tales que Mt + M2 = R. Demostrar que M2 + Ma = R- 4. Sea R un anillo y sean Ji y J2 ideales izquierdos. Demostrar que J2 es un ideal izquierdo. 5. Sea R el anillo de las matrices n x n sobre un campo K. Demos»r que el conjunto de las ^¡ia trices de) tipo I ai 0 • 0\ \ a„ Ó • • Ó / que tienen componentes iguales a 0 salvo, posiblemente, en la primera «dumna, es un ideal izquierdo de R. Probar un enunciado semejante para el conjunto de las Matrices que tienen componentes iguales a 0, excepto, posiblemente, en la columna j. 6. Sean A y B matrices n x n sobre un campo K, en las cuales todte las componentes son iguales a 0, excepto, posiblemente, las de la primera columna. Supóngase que A # 0. Supóngase que existe una matriz C n x n en K tal que CA = B. Sugaencia Considérese primero un caso especial en donde I l 0 0\ . 0 0- 0 A = . . r . Ó Ó ••• Ó i 7. Sea V un espacio vectorial de dimensión finita sobre el campo K- Sea R el anillo de aplicaciones K-)ineales de V en si mismo. Demostrar que R no tiene ideales bilaterales salvo ¡0} y el propio R. [Sugerencia: sean Ae R, A O. Sean v, e K »i / 0 y 4fi / O. Complé- tese v, a una base {v,,..., v„¡ de V. Sean {o,,..., tt„} elementos arbitrarios de V. Para cada i -- 1,..., n existe B¡e R tal que B& = y BíVj = O si j # i, y existe C¡ e R tal que CiAv, — tv¡ (justifiqúense con detalle estos dos enunciados de existen- cia). Sea F = CiABt + • • • + C,AB„. Demostrar que F(v¡) = wi partí todo i = 1,..., n. Dedúzcase que el ideal bilateral generado por A es todo el anillo R.] 8. Sea R un anillo conmutativo. Se dice que una aplicación D: R -» R es una derivación si D(x + y) = Dx + Dy y D(xy) = (Dxjy + x(Dy) para todo x, y r R. Si D<, D-> son deriva- ciones, entonces definase el producto paréntesis rectangular de la manera siguiente [Di, D2J — Di o D2 — D2 ° Di. Demostrar que [Di,D2] es una derivación. Ejemplo. Sea R el anillo de las funciones de, digamos, dos variables reales evaluadas en los reales infinitamente diferenciables. Cualquier operador diferencial f(x,y)— o g(x,y)-~ dx dy con coeficientes j, g, que son funciones infinitamente diferenciables, es una derivación sobre R. De donde el conjunto de los productos paréntesis rectangular y los productos paréntesis rectangulares iterados de tales operadores, es un álgebra que no es asociativa. Efectúe la prueba de tal afirmación. 9. Sea R un anillo en el cual x2 = x para todo xe R. Demostrar que R es conmutativo.
354 ALGEBRA LINEAL §2. Homomorfismos Sean R y R' anillos. Un homomoríismo de anillos / : R —* R' es una aplica- ción que tiene las siguientes propiedades: para todo x, ye R f[x + y) = f{x) + f(y), f(xy) = f(x)f(y), f(e) = e' (si e, e' son los elementos uno de R y R', respectivamente). Un núcleo de un homomoríismo de anillos /: R -» R es el núcleo de f consi- derado como un homomoríismo de grupos aditivos, es decir: es el conjunto de todos los elementos xeR tales que f(x] — 0. Ejercicio: probar que el núcleo es un ideal bilateral de R. Ejemplo l. Sea R el anillo de las funciones definidas sobre el intervalo [0,1] y evaluadas en los complejos. La aplicación que asocia a cada función fe R el valor /(j) es un homomoríismo de anillos de R en C . Ejemplo?. Sea R el anillo de las funciones definidas sobre el intervalo [0,1] y evaluadas en los reales. Sea R' el anillo de las funciones definidas sobre el inter- valo [0,]] y evaluadas en los reales. Puede considerarse cada función fe R como una función definida sobre [0, y cuando así se hace, se denomina la función j como la restricción de / a [0,1]. En forma más general, sean S un conjunto y S un subconjunto. Sea R el anillo de las funciones definidas sobre S y evaluadas en los reales. Para cada f e R, se denota con f |S' la función definida sobre S', cuyo valor en cada elemento xeS' es /(x). Entonces, f | S' se conoce como la restricción de f a 5'. Sea R' el anillo de las funciones definidas sobre S' y evaluadas en los reales. Entonces la aplicación es un homomoríismo de anillos de R en R'. Ejemplo?. Sea K un campo y sea R = K[t] el anillo de polinomios. Sea A una matriz en Mat„[K], Entonces, la aplicación es un homomoríismo de R en Mat„(K). Esta es sólo otra manera de enunciar las propiedades de la aplicación f f-> f(A) consideradas con anterioridad. En todos los ejemplos precedentes, descríbase de manera explícita el núcleo del homomorfismo de anillos dado. Como el núcleo de un homomorfismo de anillos se define sólo en términos de los grupos aditivos involucrados, sabemos que un homomorfismo de anillos cuyo núcleo es el trivial, es inyectivo. Sea f _• R R' un homomorfismo de anillos. Si existe un homomorfismo de anillos g :R' -> R tal que g°f y /» g son las respectivas aplicaciones identidad, entonces se dice que f es un isomorfismo de anillos. Como pasa con los espacios vectoriales y los grupos, es cierto también que si f es un homomorfismo de anillos que es inyectivo y suprayectivo, entonces es un isomorfismo de anillos. Recomen- damos que el lector efectúe la prueba.
r ANILLOS 355 Ahora definiremos una noción semejante a la de grupo cociente, pero apli- cada a anillos. Sea R un anillo y sea M un ideal bilateral. Si x, y e R, entonces sea x congruente con y mod M lo que significa que x — y e M. Se expresa esta relación de la siguiente forma: ' * x = y (mod M). Son muy fáciles de probar los siguientes enunciados, lo que deberá hacer el lector: (a) Tenemos que x = x (mod M). (b) Si x = y e y = z (mod Af), entonces x = z (mod M). (c) Si x = y, entonces y = x (mod M). (d) Si x = y (mod M) y z e R, entonces xz = yz (mod M) y también zx = zy (mod M). (e) Si x = y y x’ = y’ (mod M), entonces xx' s yy' (mod M). Más aún, x + x' = y + y' (mod M). Las pruebas de los asertos anteriores son triviales. Por ejemplo, hagamos la prueba de (e). La hipótesis significa que se puede escribir x = y + z y x' = / + z' con z, z'eM. Entonces, xx' = (y + z)(V + z') = yy' + zy' + yz' + zz'. Como M es un ideal bilateral, cada uno de zy', yz' y zz' está en M y, en consecuencia, su suma está en M. De donde xx' = yy' (mod M), como se quería demostrar. Si x 6 R, se denota con x el conjunto de todos los elementos de R que son congruentes con x (mod M). Recordando la definición de grupo cociente, se ve que x no es otra cosa que la clase lateral aditiva x + M de x, relativa a M. Se conoce como representante de la clase lateral (también conocida como clase de congruencia de x mod M) a cualquier elemento de esa clase lateral. Se denota con R el conjunto de todas las clases de congruencia de R mod M. En otras palabras, se denota con R = R/M al grupo cociente aditivo de R mó- dulo M. Así entonces, ya se sabe que R es un grupo aditivo. Ahora definamos una multiplicación qué convierta a R en un anillo. » Si X, y son clases laterales aditivas de M, entonces se define su producto como la clase lateral de xy, es decir, como xy. Usando la condición (e) dada anteriormente, i se ve que esta clase lateral es independiente de los representantes seleccionados x en x e y en y. Así, la multiplicación está bien definida mediante la regla (x + M)(y + M) = (xy + M). Resulta ahora trivial el comprobar que se satisfacen los axiomas de un anillo. En particular, que el elemento unidad de R es 1 + M, si 1 es el elemento unidad de R. L
356 ALGEBRA LINEAL También resulta trivial el verificar que la aplicación f : R-> R tal que f(x) = x = x + M es un homomorfismo de anillos de R sobre R, cuyo núcleo es M. Dejamos que el lector efectúe la prueba. Ejercicios 1. Sea f: R -» R' un homomorfismo de anillos. Demostrar que la imagen de f es un sub- anillo de R'. 2. Sea V un espacio vectorial de dimensión finita sobre el campo K. Sea át una base de V. Demostrar que la aplicación f>~* M*(/)esun isomorfismo del anillo V) sobre el anillo de las matrices n x n (si n = dim V). (Este ejercicio no es otra cosa que la interpretación de los enunciados referentes a en el lenguaje presente.) 3. Sea R un anillo. Sea G el conjunto de los elementos x g R para los cuales existe un ele- mento yeR tal que xy = yx = e. Demostrar que G es un grupo, que se conoce como el grupo de las unidades de R. (Si R es el anillo de las matrices n x n sobre un campo K, en- tonces G no es otra cosa que el grupo de las matrices invertibles.) 4. Demostrar que un homomorfismo de anillos de un campo K es la aplicación nula o bien un isomorfismo de K sobre su imagen. 5. Como un ejemplo de clase residual, supóngase que R = Z es el anillo de los enteros. Sea M un ideal no nulo y que no es el ideal unitario. Entonces se sabe que M tiene un gene- rador positivo n único y, por tanto, M = (n). A menudo, se escribe mod n en vez de mod (n). (a) Demostrar que cualquier entero x es congruente con un entero m único, tal que 0 S m g n. (b) Demostrar que cualquier entero x * 0. primo relativo con n, es congruente con un entero único m primo relativo con n, tal que 0 < m < n. (c) Demostrar que si x es un entero # 0, y primo relativo con n, entonces x**"’ = 1 (mod n), donde <p{n) es el número de enteros m primos relativos con n, tales que 0 < m < n. (d) Si p es un número primo, ¿a qué es igual <p(p)? (e) Determinar <p(n) para cada entero n con 1 g n g 10. 6. (a) Sea p un número primo. Demostrar que en el anillo Z/(p) todo elemento no nulo tiene un inverso multiplicativo y que los elementos no nulos forman un grupo multiplicativo, (b) Si o es un entero, a 0 (mod p), demostrar entonces que ap~1 = 1 (mod p). 7. Sean n y ri enteros positivos primos relativos y sean a y b enteros. Demostrar que las congruencias x = a (mod n), x = b (mod rí) se pueden resolver simultáneamente con algún xeZ.
ANILLOS 357 8. Formular los ejercicios 5(a) y (b) para el anillo de los polinomios sobre un campo X. 9. Sea R un anillo y sean M y M' dos ideales bilaterales. Supóngase que M contiene a Ai’. Si x e R, entonces denótese su clase residual mod M con x(M). Demostrar que existe un homomorfismo de anillos (único) R/M' - R/M que aplica a x(AÍ') sobre x{M). K»Si n y m son enteros 0, tales que n divide a m, entonces apliqúese el ejercicio 9 para obtener un homomorfismo de anillos Z/(m) -» Z/(n). 11. Sean R y R' anillos. Sea R x R' el conjunto de todas las parejas (x, x') con xeR y x' e R'. Demostrar cómo se puede convertir a R x R' en un anillo, definiendo la adición y la multiplicación por componentes. En particular, ¿cuál es el elemento unidad de R x R'? 12. Sean m y n enteros positivos primos relativos. Demostrar que Z/(mn) es isomorfo como anillo a Z/(n) x Z/(m) bajo la aplicación x (mod mn) >-» (x mod n, x mod m). 13. Probar que si m y n son enteros positivos primos entre sí, entonces <p(mn) = <p(m)<p(n). 14. Sea f: R -> R' un homomorfismo de anillos. Sea J' un ideal bilateral de R' y sea J el conjunto de los elementos x de R tales que /(x) está en J. Demostrar que J es un ideal bilateral de R. 15. Sea R un anillo conmutativo y sea N el conjunto de los elementos x e R tales que x" = 0 para algún entero positivo n. Demostrar que N es un ideal. 16. En el ejercicio 15, demostrar que x = 0, si x es un elemento de R/N, y si existe un entero n g 1 tal que x" = 0. 17. Sea R un anillo y sea Z el conjunto de les elementos xeR tales que xy = yx para todo y e R. Demostrar que Z es un subanillo y que Z es conmutativo. §3. Módulos Se puede hacer una generalización de la noción de espacio vectorial sobre un campo, a saber, módulo sobre anillo. Sea R un anilló; un modulo (izquierdo) sobre R, o bien un R- módulo, es un grupo aditivo M junto con una aplicación R x M -> M, que a cada pareja (x, v) donde xeR y v e Ai le asocia un elemento xt> de Ai que satisface las siguientes condiciones: MOD 1. Para todo x,yeR y v,weM, tenemos (x + y)v = xv + yv, x(v + w) = xv + xw. MOD 2. Tenemos que (xy)» = x(yu). MOD 3. Si e es el elemento unidad de R, entonces ev = v. Ejemplo!. Todo ideal izquierdo de R es un módulo.
358 ALGEBRA LINEAL Ejemplo 2. Sea M un módulo sobre el anillo R. Entonces, M también es un módulo sobre cualquier subanilio R' de R. Ejemplo 3. Sea V un espacio vectorial sobre el campo K y sea R = V) el anillo de las K-aplicaciones de V en si mismo. Entonces, V es un módulo sobre R; si se define el producto de un elemento A e R y v e K como el elemento Av = 4(v) de V. Las propiedades de las aplicaciones lineales y la definición de la suma de apli- caciones lineales muestran que se satisfacen nuestros axiomas MOD 1,2 y 3. Ejemplo 4. Sea K un campo. Entonces K" es un módulo sobre el anillo de las matrices n x n en K, a saber, si A es una matriz de n x n en K y si X e K", entonces el producto de matrices ordinario AX satisface las condiciones MOD 1,2 y 3. Sea R un anillo y sean M y M' R-módulos. Una aplicación R-lineal (o R. homomorfismo) f: M -»M' es una aplicación tal que para todo xeRyv, weAf tenemos f(xv) = xf(v\ f(v + w) = f(v) + f(w). Así, una aplicación R-lineal es la generalización de una aplicación K-líneal, cuando el módulo es un espacio vectorial sobre un campo. El conjunto de todas las aplicaciones R-lineales de M en Ai' se denota por ^«(AÍ.AÍ'). Ejemplo 5. Sean M, M', M" R-módulos. Si f y g :M' -*M" son aplicaciones R lineales, entonces la aplicación compuesta g o f es R lineal. Si /1,/2 6^(AÍ,AÍ'), entonces 3 ° (/i + /z) = g ° fi + g ° fi- Si gi, gi e M"). entonces, (g¡ + <fz) ° f — gi ° f + gz° f- Pruébense, a manera de ejercicio, estas relaciones. Como con los espacios vectoriales, ahora tenemos que considerar con mucha frecuencia el conjunto de las aplicaciones R lineales de un módulo M en sí mismo; es conveniente tener una nomenclatura para estas aplicaciones, conocidas como R endomorfismos de M. El conjunto de R endomorfismos de M se denota por EndK(Af). Ejemplo 6. Sea R un anillo y sea M un ideal izquierdo. Sea y e M. La aplicación r,: M -» Ai tal que r/x) = xy
ANILLOS 359 es una aplicación R lineal de M en si mismo. Ciertamente, si xeM, entonces xy e Al, ya que M es un ideal izquierdo y las condiciones para la R linealidad son reformulaciones de las definiciones (¿cuáles?). Se dice que ry es la multiplicación por la derecha por y. Asi, entonces r, es un R endomorfismo de M. Ejemplo 7. Sea V un espacio vectorial sobre un campo K y sea A una apli- cación £ lineal de V en sí mismo. Sea R el anillo que consta de todos los elementos f(A), donde f es un polinomio en K[t], Entonces, V es un R módulo. Sea B cual- quier aplicación K lineal de V en si mismo. Entonces, B es un R endomorfismo de V si y sólo si AB = BA, ya que en este caso, como se ha visto, f(A)B = Bf(A) para todos los polinomios f. Ejemplo 8. Sean R un anillo y M un R módulo. Sea R' = End^fM). Entonces. R' es un anillo. El hecho de que se satisfacen los axiomas de anillo, se sigue de las definiciones y del ejemplo 5. Nótese que se puede considerar a M como un R' módulo. Ciertamente, si f eR' y veM.se puede asociar f(v) con la pareja (/, a). Resulta rutinaria la verificación de que se satisfaqgp todas las condiciones que convierten a Ai en un R' módulo. Discutamos ahora algo más sobre la situación que se presenta en el ejemplo 8. Con cada elemento x e R se puede asociar una aplicación Ax: M Al, a saber, la aplicación tal que Ax(v) = xv. Entonces, para todo v, w e M tenemos Ax(v + w) = x(v + w) = xv + xw = Ax(v) + Ax(w). Además, si feR' — EndR(Ai), entonces, por definición, /(xv) = x/(v), y en consecuencia, /oAx(v) = Axo/(v). De donde Ax es una aplicación R' lineal de Al en sí mismo, es decir, un elemento de EndR (A4). La asociación A: x •-> Ax es un homomorfismo de anillos de R en EndR (AÍ), como se puede verificar de in- mediato. (Hágalo con detalle.) Teorema 1. Sea R un anillo y sea M un R módulo. Sea J el conjunto de los elementos xe R tales que xv = 0 para todo veM. Entonces, J es un ideal bi- lateral de R.
360 ALGEBRA LINEAL + Prueba. Si x, y e J, entonces (x + y)v = xo + yv = 0 para todo v e M. Si a e R, entonces (ax)t> = a(xv) = 0 y (xa)v = x(av) = 0 para todo v e M. Esto prueba el teorema. Nótese que el ideal bilateral del teorema 1 no es otra cosa que el núcleo del homomorfismo de anillos X >-» A, descrito en la discusión precedente. Teorema 2. (Wedderburn-Rieflel). Sea R un anillo y sea L un ideal izquierdo no nulo, considerado como R módulo. Sean R' = EndR(L) y R" = EndR(L). Sea X.R^R" el homomorfismo de anillos tal que = xy para xeR y ye L. Supóngase que R no tiene más ideales bilaterales que 0 y el propio R. Entonces, A es un homomorfismo de anillos. Prueba (Rieflel). El hecho de que A sea inyectivo se deduce del teorema 1 y de la hipótesis de que L no es nulo. Por consiguiente, lo único que se tiene que probar es que A es suprayectivo. Por el ejemplo 15 del §1, se sabe que LR es un ideal bilateral, no nulo, ya que R tiene una unidad y, por lo tanto, es igual a R por hipótesis. Entonces A(LR) = A(L)A(R) = A(R). Ahora, afirmamos que A(L) es un ideal izquierdo de R". Para probar tal afirmación, supóngase que f eR" y xeL. Por el ejemplo 6 se sabe que, para todo y e L, r, está en R' y, por tanto, que f°r, = r,°f. Esto quiere decir que f(xy) = f(x)y. Se puede escribir ahora esta relación eii la forma /»A,(y) = A/W(y). De donde Ax es un elemento de A(L), a saber: A/u). Esto prueba que A(L) es un ideal izquierdo de R". Pero entonces, R''A(R) = R"A(L)A(R) = A(L)A(R) = A(R). Como A(R) contiene la aplicación identidad, digamos que es e, se infiere que para todo f g R", la aplicación, f ° e = f está contenida en A(R), es decir, R" está con- tenida en A(R) y, por consiguiente, R" = A(R), tal y como se quería probar.
ANILLOS 361 • Ejercicios 1. Sea R un anillo y sea M un R módulo. Si veM, demostrar entonces que 0t> = 0 (el primer 0 es el cero de R y el segundo es el cero de M). 2. Sea V un espacio vectorial sobre un campo K y sea R un subanillo de Endjjk) que contiene |odas las aplicaciones escalares, esto es, todas las aplicaciones el donde ce K. Sea L un ideal izquierdo de R. Sea LV el conjunto de todos los elementos /4i»i + • • + con A¡ e L y v.: e V. Demostrar que LV es subespacio R-invariante de V. 3. Sea R un álgebra sobre los números complejos. Se supone que la multiplicación en R es asociativa, que R tiene un elemento unidad (por lo que R es un anillo) y que R no tiene otros ideales bilaterales distintos de 0 y de R. También, se supone que R es de dimensión fi- nita > 0 sobre C. Sea L un ideal izquierdo de R, de mínima dimensión > 0 sobre C. (a) Probar que EndR(Z.) = C (es decir, las únicas aplicaciones R-lineales de L constan de la multiplicación por números complejos)'. [Sugerencia: refiérase al lema de Schur.] (b) Probar que R es isomorfo como anillo, al anillo de las aplicaciones C lineales de L en sí mismo. 4. Definir la noción de submódulo de un módulo. Definir la noción de isomorfismo de módulos. 5. Sea R un anillo. Se dice que un R módulo M es simple si M * {0} y si no tiene otro sub- modulo distinto de {0} o el propio M. Sean M, M' R módulos simples y f: M —> M' un R homomorfismo. Demostrar que f = 0 o bien f es un isomorfismo. 6. Sea R un anillo, M un módulo y L un ideal izquierdo. Demostrar que LM es un sub- módulo de M. Supóngase que tanto L como M son simples. Demostrar que LM = M o LM = {0}. §4. Módulos cocientes Ya hemos estudiado los grujios cociente y los anillos módulo, un ideal bilateral. Estudiemos ahora la noción análoga para un módulo. Sea R un anillo y sea M un R módulo. Un submódúlo N es un subgrupo adi- tivo de Aí tal que para todo xeR y ve N se tiene xve N. Así, el mismo N es un módulo (esto es R módulo). Ya se sabe cómo construir el grupo cociente M/N. Como M es un grupo abe- liano, N automáticamente es normal en M, de modo que esto es historia vieja. Los elementos del grupo cociente son las clases laterales v + N con ve M. Vamos a definir ahora una multiplicación de estas clases laterales por elementos de R. Esto se hace de manera natural. Si xe R, entonces se define x(v + N) como la clase latera] xv -f- N. Si es otra clase lateral representativa de v + M, entonces se puede escribir Uj = v + w con weN. De donde XVt = xv + xw, y xwe N. En consecuencia, xv¡ + N = xv + N. Por tanto, la definición es indepen- diente de la elección de la v representativa de la clase lateral v + N. Ahora resulta
362 ALGEBRA LINEAL trivial el verificar que esta multiplicación satisface todos los axiomas de un módulo. Se dice que M/N es el módulo cociente de M por N, o si se quiere el M módulo N. También se podria emplear la notación de las congruencias. Si v, v' son ele- mentos de M, entonces se escribe v = v' (mod N) para significar que v - v'eN. Esto equivale a decir que las clases laterales v + N y u' + N son iguales. Asi, pues, una clase lateral v + N no es otra cosa que la ciase de congruencia de elementos de M que son congruentes con v mod N. Se puede reformular el enunciado de que la multiplicación de una clase lateral por x está bien definida, de la siguiente manera: si v = v' (mod N), entonces para todo x e R, se tiene xv = xw'(mod N). Ejemplo ]. Sea V un espacio vectorial sobre el campo K. Sea W un subespacio; en este caso, el módulo cociente V/W se conoce como el espacio cociente. Sea M un R módulo y sea N un submódulo. La aplicación /:Af-M/N que a cada v e M le asocia su clase de congruencia f(y) = v + N es obviamente un R homomorfismo, debido a que /(xv) = xv + N = x(v + N), por defini- ción. Se conoce como el homomorfismo canónico; su núcleo es N. Ejemplo2. Sea V un espacio vectorial sobre el campo K. Sea W un subespacio. Entonces, el homomorfismo canónico / :F-> V/W es una aplicación lineal y, obviamente, es suprayectiva. Supóngase que V es de dimensión finita sobre K •y sea W' un subespacio de V tal que V es la suma directa, V = W® W'. Si ce V y se escribe v = »v + w' con weWyw’e W’, entonces /(v) = /(») + /(w') = /(»'). Consideremos la aplicación / sobre W' y denotémosla con /'. Así, para todo w’ e W' tenemos que, por definición, /'(w') = /(**')• Entonces /' aplica a W' sobre V/Wy el núcleo de/' es {O}, debido a que Wr>W' = {0}.De donde /': W’~> V/W es un isomorfismo entre el subespacio complementario W' de W y el espacio cociente V/W. Se tiene tal isomorfismo para cualquier selección del subespacio comple- mentario W'. Ejercicios 1. Sea V un espacio vectorial de dimensión finita sobre el campo K y sea W un subespacio. Sea {Pi,..., tí,} una base de W y extendida a una base («,, de V. Sea f.V -► V/W la aplicación canónica. Demostrar que (/(í>,+ >),.... /(».)} es una base de V/W.
ANILLOS 363 2. Supóngase que V y W son como en el ejercicio 1. Sea A : V -» V una aplicación lineal y supóngase que A W c W (es decir, Awe W para todo w e W). Sea (rb ..., la base de V, como en el ejercicio 1. Demostrar que la matriz de A con respecto a esta base es del tipo M, M3\ O M2) donde es una matriz cuadrada r x r y M2 es una matriz cuadrada (n - r) x (n - r). 3. Considerando todavía la misma notación que en los ejercicios 1 y 2, demostrar que se puede emplear A para definir una aplicación lineal Á : V/W -» V/W, definiendo 4(t> + W9 = Av + W. (Con la terminología de las congruencias, si v = v' (mod W), entonces Av = Av (mod H7).) Escríbase v en lugar de f(v). Demostrar que la matriz de Á con relación a {úr+ b ..., ú,} es, precisamente, la matriz M2 del ejercicio 2. Se dice que Á es la aplicación lineal inducida por A sobre el espacio cociente. 4. Sea V el espacio vectorial generado sobre R por las funciones 1, t, tz, e1, te", t2?. Sea W el subespacio generado por 1, t, t2, te2. Sea D la derivada. (a) Demostrar que D aplica a H7 en sí mismo. (b) ¿Cuál es la aplicación lineal í> inducida por D sobre el espacio cociente V/W'! 5. Sea V el espacio vectorial sobre R que consta de todos los polinomios de grado g n (para algún entero n 2: 1). Sea W el subespacio que consta de todos los polinomios de grado g n — 1. ¿Cuál es la aplicación lineal D inducida por la derivada D sobre el espacio cocien- te V/Wl rmuumiiiiuimiiiiiiiiiiHi
rtttttttttttttttttttttttttttttttt
APENDICE I * f Conjuntos convexos §1. Definiciones Sea S un subconjunto de R". Se dice que S es convexo si, dados los puntos P y Q en S, el segmento de recta que une a P con Q también está contenido en S. Recuérdese que el segmento de recta que une a P con Q es el conjunto de todos los puntos P + t(Q — P) con Ogtá 1. Por tanto, es el conjunto de puntos (1 - t)P + tQ, con 0 t g 1. Teorema 1. Sean Pt, ..., Pn puntos de Rm. Cualquier conjunto convexo que contiene a P^, ... ,P„, también contiene todas las combinaciones lineales XiPt + + x„P„, tales que 0 á Aj í 1 para todo i y xt + + x,~ 1. Prueba. Esta prueba es un precioso ejercicio que no arruinaremos desarro- llándolo completamente. Sólo se dará una sugerencia: úsese inducción y el hecho de que si x„ 1, entonces la combinación lineal anterior es igual a \* A / Teorema 2. Sean Pit ..., P„ puntos de RM. El conjunto de todas las combi- naciones lineales xtPi + • + x„Pn con 0 á x¡ 1 y X! + • • • + x„ = i, es un conjunto convexo. Prueba. Recomendamos que el lector efectúe la prueba como un ejercicio muy sencillo. En vista de los teoremas 1 y 2, se puede concluir que el conjunto de las combina- ciones lineales descritas en estos teoremas es el mínimo conjunto convexo que contiene todos los puntos Pi,..., P„. Los siguientes enunciados ya han aparecido como ejercicios y se recuerdan ahora para tener un panorama más completo. (1) Si S y S' son conjuntos convexos, entonces la intersección S n S' es convexa. 365
366 ALGEBRA LINEAL (2) Sea F: Rm -> Rn una aplicación lineal. Si S es convexo en R”, entonces F(S) (la imagen de S bajo F) es convexa en R". (3) Sea F: Rm -* R" una aplicación lineal. Sea S' un conjunto convexo de R". Sea S = F" *(S') el conjunto de todos los X e Rm tales que F(X) está en S'. Entonces, * S es convexo. Ejemplos. Sea A un vector en R". La aplicación F tal que F(X) = A X es lineal. Nótese que un punto ce R es un conjunto convexo. Por tanto, el hiper- plano H que consta de todos los X tales que A • X = c es convexo. Además, el conjunto S' de todos los x e R tales que x > c es convexo. De donde el conjunto de todos los X e R" tales que A • X > c es convexo; este conjunto se conoce como un semiespacio abierto. Análogamente, el conjunto de todos los puntos X e R”, tal que A • X c se llama semiespacio cerrado. En la siguiente figura, hemos ilustrado' un hiperplano (recta) en R2, y un semiespacio determinado por él. Figura 1 La recta está definida por la ecuación 3x — 2y = -1. Pasa por el punto P = (1,2) y N = (3, —2) es un vector perpendicular a la recta. Hemos sombreado al semiespacio de los puntos X tales que X • N -1. Vemos que un hiperplano cuya ecuación es X N — c determina dos serni- espacios cerrados, a saber, los espacios definidos por las ecuaciones X N^c y X N Se, y análogamente para los semiespacios abiertos. Como la intersección de conjuntos convexos es convexa, la intersección de un número finito de semiespacios es convexa. En las siguientes figuras (figuras 2 y 3), se han dibujado las intersecciones de un número finito de semiespacios. Tal in- tersección puede ser o no acotada. (Recuérdese que un subconjunto S de R" se llama acotado si existe un número c > 0 tal que ||X|| c para todo X eS.)
APENDICE 367 §2. Hiperplanos separantes Teorema 3. Sea S un conjunto convexo cerrado en R". Sea P un punto de R". Entonces, P pertenece a S o bien existe un hiperplano H que contiene a P y tal que S está contenido en uno de los semiespacios abiertos determinados por H. Prueba. Empleemos un resultado del cálculo. Supóngase que P no pertenece a S. Considérese que la función para el conjunto cerrado S está dada por f(X) = ||X - P||. En un curso de cálculo se prueba (con e y <5) que esta función tiene un mínimo sobre S. Sea Q un punto de S tal que He - p|| s ||% - p|¡ para todo X en S. Escribamos N = Q - P. Como P no está en S, se tiene que Q — P ¿Oy N ¿O. Afirmamos que el hiper- plano que pasa por P, perpendicular a N, satisface nuestros requisitos. Sea Q' cualquier punto de S y sea Q' ± Q. Entonces, para todo t con 0 < t £ 1 se tiene lie - p|| á lie + no' - e) - p|| = iko - n + «e' - eii- Elevando al cuadrado se obtiene ie - p)2 á ie - p)2 + 2rie - p> • (e* - e> + r2<Q' - e>2- Cancelando y dividiendo por 2r. se obtiene 0 á 2(2 - P) • (2' - 6) + KQ' ~ ®2-
368 ALGEBRA LINEAL Haciendo que t tienda a 0 se obtiene 0^(Q-P)(Q'-Q) á N • (Q' - P) + N • (P - Q) á N • (Q' - P) - N N. Pero N • N > 0. De donde Q' N> P N. Esto prueba que S está contenido en el semiespacio abierto definido por X N > P N. ) Sea S un conjunto convexo en R". Entonces el cierre de S (denotado por S) es convexo. Esto se prueba fácilmente, ya que si P, Q son puntos del cierre, es posible hallar puntos de S, por ejemplo P*, Qk, que tienden a P y Q respectivamente como limite. Entonces, para 0 g t g 1, tPk + (1 - t)e* tiende a tP + (1 — t)Q, que en consecuencia está en el cierre de S. Sea S un conjunto convexo en R". Sea P un punto frontera de S. (Esto quiere decir un punto tal que para toda e > 0, la bola abierta con centro en P de radio e en R" contiene puntos que están en S y puntos que no están en S). Se dice que un hiperplano H es un hiperplano soporte de S en P, si P está contenido en H y si S está contenido en uno de los dos espacios semicerrados determinados por H. Teorema 4. Sea S un conjunto convexo en R" y sea P un punto frontera de S. Entonces, existe un hiperplano soporte de S en P. Prueba. Sea S el cierre de S. Entonces se ve que S es convexo y que P es un punto frontera de S. Si se puede probar el teorema para 5, entonces, ciertamente, el resultado será válido para S. Asi, sin pérdida de generalidad, se puede suponer que S es cerrado. Para cada entero k > 2, se puede hallar un punto Pk que no está en S, sino a una distancia < l/k de P. Por el teorema 3, se halla un punto Qk en S cuya dis- tancia a Pk es mínima y se escribe Nk = Qk — Pk. Sea N'k el vector con la misma dirección que Nk pero de longitud igual a 1. La sucesión de vectores N'k tiene un punto de acumulación en la esfera de radio igual a 1, por ejemplo N', debido a que la esfera es compacta. Se tiene, por el teorema 3, que para todo X e S, X-Nk>Pk-Nk para todo k, de donde al dividir a cada miembro por la longitud de Nk, se obtiene X N'k > Pk N'k
APENDICE 369 para todo k. Como N' es un punto de acumulación de {Ni} y como P es un límite de {P*}, se deduce, por continuidad, que para cada X en S, X • N' S P • Nr. Esto prueba el teorema. Qbjervación. Sea S un conjunto convexo y sea H un hiperplano definido por una ecuación X • N = a. Supóngase que para todo X e S tenemos que X • N a. Si P es un punto de S que está en el hiperplano, entonces P es un punto frontera de S. En caso contrario, para e > 0 y e suficientemente pequeño, P- eN seria un punto de S y, por tanto, (P - eN) • N = P • N - eN • N = a - eN • N < a, contrario a la hipótesis. Por consiguiente, se concluye que H es un hiperplano soporte de S en P. §3. Puntos extremos e hiperplanos soporte Sea S un conjunto convexo y sea P un punto de S. Se dice que P es un punto extremo de S si no existen puntos Qt, Q2 de S con Qi Q2, tales que P se puede escribir en ¡a forma P = tQi + (1 — t)Q2 con 0 < t < 1. En otras palabras, P no puede estar en un segmento de recta contenido en S, a menos de que sea uno de los puntos de los extremos del segmento de recta. Se define un conjunto S como inferiormente acotado si existe un vector B = (£»,,..., b„) tal que para todo X = (xi,..., x„) en S se tiene x¡ b¡ para i = 1, ..., n. Teorema 5. Sea S un conjunto convexo cerrado que está inferiormente aco- tado. Entonces, todo hiperplano soporte de S contiene un punto extremo. Prueba. Sea H un hiperplano soporte, definido por la ecuación X N = Po • N en un punto frontera Po y sea X N = PQ - N para todo X e S. Sea T la inter- sección de S y del hiperplano. Entonces, T es convexo, cerrado e inferiormente acotado. Afirmamos que un punto extremo de T también es un punto extremo de S. Esto reduce el problema a determinar puntos extremos de T. Para probar la afir- mación, supóngase que P es un punto extremo de T y supóngase además que se puede escribir P — rCi + (1 — t)Q2 0 < t < 1.
370 ALGEBRA LINEAL Efectuando el producto escalar con N y usando el hecho de que P está en el hiper- plano y que, por tanto, P N = Po • N, se obtiene (1) Po ' N = tQ, • N + (1 - t)Q2 N. Se tiene Q¡ N y Q2 N Po • N ya queQn y Q2 están en S. Si uno de estos puntos es > Po • N, sea Q¡ • N > Po • N,. entonces el miembro de la derecha de la ecua- ción (1) es > tP0 N + (1 - t)P0 -N,= P0-N, lo cual es imposible. De donde tanto Q, como Q2 están en el hiperplano, lo que contradice la hipótesis de que P es un punto extremo de T. Determinemos ahora un punto extremo de T. Entre todos los puntos de T, existe al menos un punto en el cual la primera coordenada es mínima, debido a que T es cerrado e interiormente acotado. (Proyectemos sobre la primera coor- denada. La imagen de T bajo esta proyección tiene una cota máxima inferior cuyo valor se toma por un elemento de T, ya que es cerrado.) Sea T¡ el subconjunto de T que consta de todos los puntos cuya primera coordenada es igual a la mí- nima mencionada. Entonces, T¡ es cerrado e inferiormente acotado. De donde se puede hallar un punto de T! cuya segunda coordenada es mínima entre todos los puntos de 7\ y el conjunto T2 de todos los puntos de Ti que tienen esta segunda coordenada es cerrado e inferiormente acotado. Se puede proceder de esta manera hasta hallar un punto P de T que tenga sucesivamente mínimas primera y segun- da,..., n-ésima coordenadas. Afirmamos que P es un punto extremo de T. Sea P = (pi,..., p„). Supóngase que se puede escribir P = tX + (1 - t)Y, 0 < t < 1 y que los puntos X = (x1;..., x„), Y = (yj,..., y„) están en T. Entonces, x¡ e Yi Pi y Pi = tx¡ + (1 - t)ji. Si Xj o yj > pi, entonces txi + (1 - t)y, > tp¡ + (1 - t)Pi = Pi, lo cual es imposible. Por tanto, Xi = yi = pi Procediendo inductivamente, supóngase que hemos probado que x, = y, = p¡ para i = 1,..., r. Entonces, si r < n, pr+1 = txr+I + (1 - t)yr+i, y se puede repetir el argumento precedente. Se sigue que X = Y = P, de donde P es un punto extremo y el teorema queda probado.
APENDICE 371 § 4. El teorema de Krein-Milman Sea E un conjunto de puntos en R" (con al menos un punto en él). Deseamos describir el mínimo conjunto convexo que contiene a E. Se puede decir que es la intersección de todos los conjuntos convexos que contienen a E, ya que esta in- tersección es convexa y, claramente, es la mínima. También se puede definir de otra manera este mínimo conjunto convexo. Sea E‘ el conjunto de todas las combinaciones lineales tiP । + • • • + tmPm de puntos ,..., Pm en E con coeficientes reales t¡ tales que o = ¿i = 1 y ti + • + t„ = 1. Entonces, el conjunto Ec es convexo. Es conveniente que el lector haga la verifi- cación trivial. Cualquier conjunto convexo que contiene a E debe contener a £7 y, por tanto, £' es el mínimo conjunto convexo que contiene a E. Se dice que Ec es el cierre convexo de E. Sea S un conjunto convexo y sea E el conjunto de sus puntos extremos. Enton- ces, Ec está contenido en S. Nos preguntamos por las condiciones bajo las cuales Ec = S. Geométricamente, se puede pensar que los puntos extremos son puntos como los de la cáscara de un huevo o como los puntos de los vértices de un polígono, a saber: Un conjunto convexo no acotado no es necesariamente el cierre convexo de sus puntos extremos, por ejemplo: el semiplano superior cerrado que no tiene puntos extremos. Además, un conjunto convexo abierto no es necesariamente el cierre convexo de sus puntos extremos (el interior del huevo no tiene puntos extremos). El teorema de Krein-Milman establece que si se pueden eliminar estas dos posibilidades, entonces no pueden aparecer otros problemas. Teorema 6. Sea S un conjunto convexo, acotado y cerrado. Entonces, S es el cierre convexo de sus puntos extremos. Prueba. Sea S' el cierre convexo de los puntos extremos de S. Se debe demostrar que S está contenido en S’. Sea PeS y supóngase que P£ S’. Por el teorema 3 se sabe que existe un hiperplano H que pasa por P, definido por una ecuación X • N = c, utiniuntinnnnnnnnuir
372 ALGEBRA LINEAL tal que X N > c para todo X e S'. Sea L: R" -♦ R la aplicación lineal tal que L(X) = X N. Entonces, L(P) = c y L(P) no está contenido en L(S). Como 8 es cerrado y acotado, la imagen L(S) es cerrada y acotada y esta imagen también es convexa. Por tanto, L(S) es un intervalo cerrado, por ejemplo [a, i»], que con- tiene a c. Asi, a c b. Sea Ha el hiperplano definido por la ecuación X • N = á. Por la observación que aparece después del teorema 4, se sabe que Ha es un hiper- plano soporte de 8. Se puede deducir, por el teorema 5, que contiene un punto extremo de 8. Este punto extremo está en S'. Se obtiene así una contradicción del hecho de que X • N > c 2: a para todo X en S', y así queda probado el teorema de Krein-Milman. Ejercicios 1. Sea A un vector en R". Sea F :R" -> R" la traslación F(X) = X + A. Demostrar que si S es convexo en R", entonces F(S) también es convexa. 2. Sea c un número > 0 y sea P un punto en R". Sea S el conjunto de los puntos X tales que ||X — P|| < c. Demostrar que 8 es convexo. Análogamente, demostrar que el conjunto de los puntos X tales que ||X — P|| á c es convexo. 3. Dibujar el cierre convexo de los siguientes conjuntos de puntos: (a) (1,2), (1,-1), (1,3), (-1,1) (b) (-1,2),(2,3),(-1,-1),(1,0) 4. Sea L: R" R" una aplicación lineal invertible. Sean 8 convexo en R" y P un punto extremo de S. Demostrar que L(P) es un punto extremo de L(S). ¿Es cierta la afirmación, aun cuando L no sea invertible? 5. Probar que la intersección de un número finito de semiespacios cerrados en R" puede tener sólo un número finito de puntos extremos. 6. Sea B un vector columna en R" y sea A una matriz n x n. Demostrar que el conjunto de soluciones de las ecuaciones lineales AX = B es un conjunto convexo en R".
APENDICE II Temas adicionales Recordemos primero en este apéndice qué es la inducción. La hemos usado muchas veces a través de todo el libro y la mayoría de los estudiantes seguramente la conoce también, pero puede resultar útil para algunos el recordar con precisión lo que dice este principio. Después probaremos el cierre algebraico de los números complejos, usando sólo un hecho elemental del análisis. Finalmente, menciona- remos la noción de relación de equivalencia. §1. Inducción Al probar distintos enunciados paso á paso, hemos usado, a menudo, la in- ducción. Ahora enunciamos con precisión la propiedad de los enteros, que se conoce con el nombre de inducción. Supóngase que para cada entero n 1 se nos da una afirmación <4(n). Vamos a probar que todas las afirmaciones /l(n) para n = 1,2,... son ciertas. Supón- gase que podemos probar las siguientes dos propiedades: (1) La afirmación 4(1) es válida. (2) Para cada entero n S 1, si se supone válida la afirmación A(n), entonces A(n + 1) es válida. Entonces, la inducción establece que todas las afirmaciones A(n) son válidas para todos los enteros n 1. Ejemplo!. Vamos a probar que para cada entero n 1, A(n): , ~ nín + 1) 1 + 2 + • • • + n = -T- -< Ciertamente, esto es válido cuando n = 1, debido a que 1 = 1(1 + l)/2. Supón- gase que la ecuación es válida para un entero n 1. Entonces, 1 + - + n + (n + 1) = + (n + 1) = + Q..+ P _ n2 + n + 2n + 2 _ (n + l)(n + 2) 2 “ 2 373
374 ALGEBRA LINEAL Por lo tanto, hemos probado las dos propiedades (1) y (2) para los enunciados de- notados con A(n) y concluimos por inducción que ^(n) es válido para todos los enteros n ¿ 1. Se ha hecho hincapié en el hecho de que la inducción es un axioma corres- pondiente a los enteros. Se ha considerado como una propiedad de los enteros. Es, no obstante, una suposición muy razonable. §2. Cierre algebraico o envolvente de los números complejos Probemos ahora, usando algunos hechos elementales del análisis, que los números complejos son algebraicamente cerrados; en otras palabras, que todo poli- nomio /eC[t] de grado 1 tiene una raíz en C. Se puede escribir /(t) = ant" + a„-it" 1 + • • • + flo con a„ 0. Para todo R > 0 real, la función |/1 tal que M/Wl es continua sobre el disco cerrado de radio R y, por tanto, tiene un valor mínimo sobre este disco. Por otro lado, de la expresión se ve que cuando |t| es muy grande, entonces |/(t)| también es muy grande; es decir, dado C > 0 existe R > 0 tal que si ]r| > R entonces |/(t)| > C. En consecuencia, existe un número positivo Ro tal que si z0 es un punto mínimo de |/| sobre el disco cerrado de radio Ro, entonces 1/(012? I/(M para todos los números complejos t. En otras palabras, z0 es un mínimo absoluto para |/|. Probemos que J(z0) = 0. Expresemos f en la forma /(O = co + ci(t ~ zo) + ' + c„(t — z0)“ con constantes c,. (Lo hicimos en el texto; sin embargo, también se ve el resultado escribiendo t = z0 + (t — z0) y sustituyéndolo directamente en /(O ) Si /(z0) / 0, entonces c0 = /(z0) / 0. Sea z = t — z0 y sea m el mínimo entero > 0 tal qúé c„ # 0. Este entero m existe porque se supuso que f tiene grado £ 1. Entonces, se puede escribir /(í) = /i(z) = co + c„zm + z™+ lg(z)
APENDICE 375 para algún polinomio g y algún polinomio j\ (obtenido de f al cambiar la variable). Sea Z] un número complejo tal que = —c0/c„ y considérense valores de z del tipo z = Azj dond? ¿ es real, 0 g A g 1. Se tiene /(O = = Co - A"c0 + A^z^^Az,) = c0[l - A" + A’"+1zT+1c0-1?(Az))]. Existe un número C > 0 tal que para todo A con 0 A 1, se tiene |zT+ ’có *<j(Az ,)l g C, por tanto, l/.ÍAz.)! |c0|(l - A” + CA'n+1). Si ahora se puede probar que para A suficientemente pequeño, con 0 < A < 1 se tiene 0 < 1 - A” + CAm+1 < 1, entonces, para tal A se obtiene |/i(Az!)| < |c0|, lo que contradice la hipótesis de que |/(z0)| ií |/(í)| para todos los números complejos t. La desigualdad de. la izquierda es, por supuesto, obvia, ya que 0 < A < 1. La desigualdad de la derecha es equivalente a CAm + 1 < Am, o bien a CA < 1, la cual, ciertamente, se satistace para A suficientemente pequeño. Esto concluye la prueba. EJERCIOOS 1. Tomando en cuenta el resultado que se acaba de probar acerca de los números com- plejos, pruébese que todo polinomio irreducible sobre los números reales tiene grado igual a 1 o 2. [Sugerencia: descompóngase el polinomio sobre los números complejos y aparéense las raíces conjugadas complejas.] §3. Relaciones de equivalencia Sea S un conjunto. Una relación de equivalencia en S es una relación escrita en la forma x ~ y, entre ciertas parejas de elementos de S, que satisfacen las si- guientes condiciones: ER 1. Tenemos que x ~ x para todo xeS. ER 2. Si x ~ y e y ~ z, entonces x ~ z. ER 3. Si x ~ y, entonces y ~ z. Supóngase que tenemos tal relación de equivalencia en S. Dado un elemento x de S. supóngase que Cx consta de todos los elementos de S que son equivalentes nnnnnnunnuuninnnu
376 ALGEBRA LINEAL a x. Entonces, todos los elementos de Cx son equivalentes entre si, como se puede ver de inmediato a partir de las tres propiedades. (Verifiqúese esta afirmación con detalle.) Además, también podrá el lector verificar de inmediato que si x, y son elementos de S, entonces Cx = Cy o bien Cx, Cy no tienen elementos en común. Cada uno de los Cx se conoce como una clase de equivalencia. Se puede ver que la relación determina una descomposición de S en clases de equivalencia disyuntas entre sí. Cada elemento de esta clase recibe el nombre de representante de la clase. Ejemplo 1. Sea G un grupo y sea H un subgrupo. Defínase a x ~ y como xH = yH para los elementos x, y e G. Se ve de inmediato que ésta es una relación de equivalencia. Una clase de equivalencia recibe el nombre de una clase lateral de H (esto es, clase lateral izquierda). Ejemplo 2. Sean R un anillo y Ai un ideal bilateral. Entonces, una congruencia módulo M es una relación de equivalencia entre elementos de R. Ejemplo 3. Sea 5 el conjunto de todas las figuras geométricas en el plano R2 (es decir, el conjunto de todos los triángulos, cuadrados, rectángulos, etc.). Sea G el grupo generado por todas las traslaciones y todas las aplicaciones unitarias reales de R2. Se dice que G es el grupo de los movimientos rígidos del plano. (Vea el ejercicio 3 del capítulo XIV, §2). Si a y /? son elementos de S, entonces se define a a como equivalente a /?, y se escribe a ~ si existe un elemento Te G tal que T(a) = ff. Pruébese que ésta es una relación de equivalencia; es la relación de equivalencia de la geometría plana. Cuando en la escuela elemental se dice que dos figuras del plano son "iguales” esto significa un abuso fantástico del len- guaje. Por ejemplo, los siguientes dos triángulos Figura 1 no son definitivamente “iguales”, esto es, no son el mismo triángulo; aunque son equivalentes en nuestro sentido. Asi, en geometría plana, la regla que trata sobre la sustitución de iguales por iguales realmente es una regla acerca de los elementos equivalentes y no establece nada más que RE 2. En matemáticas, la palabra igual significa lo mismo. Por ejemplo, cuando se escribe 1+ 2 = 4-1 tenemos el mismo número a cada lado de esta igualdad, a saber: el número 3. Por supuesto, el número 3 está representado de dos maneras diferentes, aunque el valor de 1 + 2 es lo mismo que el valor de 4 — 1, a saber: 3. Por supuesto, la igualdad es un caso especial de una relación de equivalencia cuando hay precisamente un elemento en cada clase de equivalencia.
APENDICE 377 Ejemplo 4. Una función racional es un “cociente” de dos polinomios, f /g. Si c es un número tal que <?(c) = 0, entonces tal cociente no está definido en c. Por tanto, una función racional no puede ser considerada como una función de todos los números y afrontamos la tarea de definir rigurosamente las funciones racionales. De hecho, esto es bastante fácil. Sea K un campo. Sean (/, g)y (fi,gi) parejas de polinomios en K, tales que ni g ni gi son iguales a 0. Se dice que tales parejas son equivalentes, si fgt =gf¡- Como ejercicio, pruébese que esta es una relación de equivalencia. La clase de equivalencia de la pareja (f,g) se denota con f /g y se conoce como función racional. Nótese que nuestra definición de equivalencia es tal que se ajusta a la regla de la “multiplicación vectorial”. Ahora se puede definir la adición y la multiplicación de funciones racionales. Si f /g y fi/gi son funciones racionales, entonces se define f/g + /i/3i = (/gi + g/i)/0gi. .. (f/gHh/gJ = (#i)/(^!)- Nuevamente, como ejercicio, es fácil demostrar que esta suma y que este producto son independientes de la selección de los representantes (f,g) y (fi,gi) para las funciones racionales f /gy fjgi respectivamente. Las funciones racionales forman, por consiguiente, un anillo y así, como ejercicio, es fácil probar con detalle que la adición y la multiplicación satisfacen todos los axiomas de un anillo. Nótese que, conforme a nuestra definición, si h es uñ polinomio no nulo, en- tonces Jh/gh = f/g. Ciertamente, esto significa simplemente que fhg = ghf, lo cual, ciertamente, es verdadero. Así, es válida la ley de la cancelación ordinaria. Ejercicios 1. Sea V un espacio vectorial de dimensión finita sobre el campo K y sea p : G -» GL(V) un homomorfismo de grupos de un grupo G en el grupo de las aplicaciones invertibles de V. Dados los elementos v, w e F, definase v ~ w si existe a e G tal que p(api = w. Demos- trar que esta es una relación de equivalencia. 2. Sea V un espacio vectorial de dimensión finita sobre el campo K. Si v, w e V, entonces definase v ~ w si existe una aplicación lineal invertible A : V -» V tal que Av = w. Demos- trar que existen precisamente dos clases de equivalencia para esta relación, una que consta sólo de O y la otra que consta de todos los elementos no nulos de V. 3. Sea G un grupo. Defínanse dos elementos a, b de G como conjugados y escríbase a ~ b, si existe x e G tal que xax~1 = b. Demostrar que esta es una relación de equivalencia. 4. Sea G el grupo simétrico sobre 3 elementos. Usando la relación de equivalencia del ejercicio 3, determinar las clases de equivalencia en G. Demostrar que dos permutaciones que están en la misma clase de equivalencia tienen el mismo signo.

APENDICE III Angulos En la mayor parte de esta sección, discutimos la geometría del espacio de 2 dimensiones. Esta discusión es, lógicamente, independiente del cálculo y sólo tiene que ver con el álgebra lineal. Al final relacionamos la geometría con las funciones seno y coseno. Sea V un espacio vectorial de 2 dimensiones (sobre los números reales), con un producto escalar (definido positivamente). Se dice que la circunferencia uni- taria en V es el conjunto de todos los elementos v de V tales que ||v|| = 1. Asi, la circunferencia unitaria es, justamente, el conjunto de los vectores unitarios en V. Sea A un elemento no nulo de V. El conjunto de todos los elementos tA, donde t es un número 0, se conoce como una semirrecta, determinada por A. Si E es el vector unitario en la dirección de A, es decir, entonces se ve de inmediato que E determina la misma semirrecta que A y es el único vector unitario en V que asi lo hace. Por tanto, para determinar una semi- rrecta es necesario y suficiente especificar el vector unitario que tenga la misma dirección. Se define un ángulo como una pareja ordenada de semirrectas (Li, L2). Si P es el único punto del círculo unitario que está en la semirrecta Li y Q es el único punto en la circunferencia unitaria que está en la semirrecta L2, entonces se de- nota también el ángulo (LiL2) con los símbolos /_ PQ. Sean ¿9 y Si' dos bases de V. Si F: V -> V es una aplicación lineal y si M es su matriz asociada relativa a á?, á? (o, como también se dice, relativo aá?) y M' la matriz asociada de F relativa a á?', entonces se sabe que existe una matriz N tal que M' = NMN~l. Usando la regla referente al producto de determinantes, se concluye que el determinante de M es igual al determinante de M'. De donde el determinante, no depende de la elección de las bases. Se designa este determi- nante como el determinante de F. Recuérdese que una aplicación ortogonal es una aplicación lineal que preserva longitudes (o productos escalares). Proposición 1. El determinante de una aplicación ortogonal F es igual a 1 o a — 1. 379
380 ALGEBRA LINEAL ttr t r r 11 r t t t r 11111 t t 111 trt Prueba. Sea {»,, v2} una base ortonormal de V. Sean a, b, c, d números tales que F(Ví) = avi + bv2, F(v2) = cv2 + dv2. Como F es ortogonal, las longitudes de F(vt) y F(v2) son iguales a 1 y estos dos elementos son perpendiculares entre sí. Esto significa que a2 + i»2 = 1, c2 + d2 = 1, ac + bd = 0. Por tanto, 1 = (a2 + b2)(c2 + d2) = a2c2 + b2c2 + a2d2 + b2d2, 0 = (ac + bd)2 — a2c2 + 2abcd + b2d2. De éstas se obtiene [ad — be)2 = 1, con lo que se prueba que el determinante elevado al cuadrado es igual a 1. De donde el propio determinante es igual a 1 o a — 1. Se define una rotación como una aplicación ortogonal cuyo determinante es igual a 1. Proposición 2. Sea 39 una base ortonormal de V y sea F una aplicación lineal de V en si mismo. Entonces F es una rotación si y sólo si existen números a, b tales que a2 + b2 = 1, y tales que la matriz de F relativa a 39 es /a — /A a) Si F es una rotación, a, b son como se acaba de mencionar y 39' es otra base ortonormal de V tal que la aplicación lineal que manda a 39 sobre 39' es una ro- tación, entonces M^{F) = Ma(F). Prueba. Supóngase primero que F es una rotación y manténgase la notación empleada en la proposición 1. Se tiene que ad — be = 1. Por tanto, — be — 1 — ad, ac = —bd. Multiplicando la primera de estas ecuaciones por a, la segunda por b y sumando, se obtiene 0 = a — a2d — b2d. Como a2 + b2 = 1, se obtiene a = d. De esto se sigue de inmediato que c = — b y nuestra primera aseveración queda probada. Recíprocamente, se verifica de manera trivial que una aplicación lineal representada por una matriz del tipo dado es una rotación.
APENDICE 381 Sea, ahora, SS'— {wj, w2} otra base ortonormal de V y supóngase que difiere de {t>i, v2} por una rotación. Por lo que se acaba de probar se sabe que existen números x, y tales que x2 + y2 = 1, y fi = xw, + yw2, v2 = — yw, + xw2. Así,.entonces, la matriz es igual a Ai* (id), por definición. Puesto que N mediante un cálculo directo), se infiere que y\ / r I (como se verifica xl M%(F) = y un cálculo directo muestra que esta es la misma matriz que .. ía —b\ \b al’ con lo que se prueba nuestra proposición. Proposición 3. Sean F y G dos rotaciones. Entonces F°G es una rotación. Existe una inversa F~¡ para F y F~ ‘ es una rotación. Prueba. La primera afirmación se infiere directamente de la regla del producto para determinantes. La segunda se deduce de las ecuaciones 1 = D(I) = D(FF~l) = D(F)D(F-‘), junto con la suposición de que D(F) = 1, y siempre que sepamos que existe la inversa. El hecho de que una aplicación ortogonal tiene una inversa y que esta inversa es ortogonal, se dejará como ejercicio. Sea Et un vector unitario en V. El subespacio de V que es perpendicular a E2 tiene dimensión igual a 1 (debido a que V tiene dimensión igual a 2). Si E2 es un vector unitario que genera este espacio, entonces cualquier otro vector perpen- dicular a E¡ se puede escribir como tE2 para algún número t. Por tanto existen exactamente dos vectores unitarios en V perpendiculares a Ei y estos son E2 y -e2. Proposición 4. Sean P y A vectores unitarios en V. Entonces existe una única rotación F tal que F(P) = A. Prueba. Sean Ft y F2 rotaciones que aplican a P sobre A. Entonces, FF¡(F2(P)) = P. De donde, Fí¡F2 es una rotación que deja fija a P. Si se puede probar que tal rotación es la aplicación identidad, entonces se concluye que F¡ lF2 = I.yF2 = Ft,
382 ALGEBRA LINEAL como se deseaba. Sea G una rotación que deja fija a P. Sea £ un vector unitario perpendicular a P. Entonces {P, £} es una base para V. Como G es ortogonal, se infiere que G(£) es perpendicular a P, de donde es igual a £ o a — £. Si G(£) fuera igual a — £, entonces el determinante de G sería igual a — 1, lo cual es im- posible. Por tanto G(£) = £. Por lo que G deja fijas tanto a P como a £ y como G es lineal, debe ser la aplicación identidad. Por consiguiente, hemos probado nuestro enunciado acerca de la unicidad. Por lo que toca a la existencia, sea £ como antes y sean a, b números tales que A= aP + bE. Existe una aplicación lineal F única, tal que F(P) = A y F(£) = — bP + aE. Como A es un vector unitario, se tiene a2 + b2 = 1 y, por tanto, el determinante de F es igual a 1. Además, F(P) y F(£) son perpendiculares entre sí (su producto escalar es igual, obviamente, a 0). De donde F es una rotación y tiene el efecto deseado. Nuestra siguiente tarea consiste en definir el seno y el coseno de un ángulo. Debemos, para ello, considerar una estructura adicional sobre el espacio vec- torial que es la orientación. Se dice que las bases ortonormales Si y Si' de V tienen la misma orientación si la aplicación ortogonal (única) F que manda a Si en Si' es una rotación. Si esta aplicación ortogonal no es una rotación, entonces se dice que Si y Si' tienen orientación opuesta. Observación. Si Si y Si' tienen la misma orientación y si Si', Si" tienen la misma orientación, entonces Si y Si" tienen la misma orientación. Además, Si tiene la misma orientación que ella misma. Si Si y Si' tienen la misma orientación, en- tonces Si' y Si tienen la misma orientación. Estos enunciados se prueban fácil- mente y los argumentos deben ser suministrados por el lector. Se dice que el conjunto de todas las bases ortonormales de V que tienen una orientación dada, determinan una orientación de V. Existen exactamente dos orientaciones de V. (La prueba trivial se deja como un ejercicio). Supongamos ahora que se da una orientación sobre V. Sea PQ un ángulo. De los dos vectores unitarios que son perpendiculares a P, exactamente uno de ellos, por ejemplo £, es tal que {P, £} tiene la orientación dada (debido a que {P,£} y {P, — £} tienen orientaciones opuestas). Existen números a, b tales que Q = aP + bE. Como Q tiene longitud igual a 1, se ve que Q • Q = 1 = a2 + b2. Por lo que, re- lativo a esta base {P, £}, se ve que el punto que tiene coordenadas (a, b) está en la circunferencia unitaria. Definamos el coseno del ángulo ¿PQ como el número a y el seno del ángulo ¿PQ como el número b. Usaremos las abrevia- turas eos y sen para estos conceptos.
APENDICE 383 SeanZPgy ¿AB dos ángulos y sea F la rotación tal que F(P) = A.SiF(Q) = B, entonces se dice que ¿PQ es congruente con ¿AB. Fácilmente se prueba que en este caso ¿AB es congruente con ¿PQ. Es trivial que ¿PQ es congruente con- sigo mismo. También se prueba fácilmente que si ¿PQ es congruente con ¿AB y ¿AB es congruente con ¿CD, entonces ¿PQ es congruente con ¿CD. Las pruebas de estas afirmaciones las dejamos como ejercicios sencillos. - » Proposición 5. Dos ángulos ¿PQ y ¿AB son congruentes si y sólo si eos ¿ PQ = eos ¿AB, sen ¿ PQ = sen ¿ AB. Prueba. Supóngase primero que los dos ángulos son congruentes y sea F la rotación tal que F(P) = A, F(Q) = B. Sea E el vector unitario tal que {P, £} es la base ortonormal que tiene la orientación dada. Por definición, {F(P), F(E)} tiene la misma orientación que la dada. Sean a, b números tales que Q = aP + bE. Como F es lineal, se obtiene F(g) = aF(P) + bF(E). Como F(P) = A, se sigue, por definición, que los cosenos de los dos ángulos son iguales y asi también sus senos. Dejamos como ejercicio la prueba del recíproco. Sea ¿ PQ un ángulo. Definamos menos ¿ PQ como el ángulo ¿ QP, escri- bámoslo como — ¿PQ y digamos también que es el negativo de ¿ PQ. Queda como ejercicio para el lector probar que si dos ángulos son congruentes, enton- ces sus negativos son congruentes. Sean Z PQ y ¿QR dos ángulos. Definamos su suma como el ángulo ¿ PR. Sea {P, E} una base ortonormal que tiene la orientación dada. Se dice que el ángulo Z PE es un ángulo recto positivo. Se dice que ¿PQ es un ángulo plano si Q =-P. Entonces es posible probar completamente dentro del contexto del álgebra lineal, directamente de nuestras definiciones, todas las propiedades de los senos y de los cosenos de los ángulos, las cuales han sido probadas en el libro First Course in Calculus para las funciones sen y eos. Se han hecho ahora todas las definiciones pertinentes. En efecto, nótese que la fórmula de la adición para la función coseno se probó en nuestro First Course por un método que se aplica al pie de la letra, ya que todos los conceptos implicados en el método han recibido ahora una definición analítica. Resulta ser un buen ejercicio para quienquiera que esté interesado en desa- rrollar estas pruebas. También es posible efectuar las pruebas al relacionar primero los senos y los cosenos de los ángulos con las funciones sen y eos, como se definió analíticamente niiiiiiiiiiiiiiiiiiiiiiiiiiuiii
384 ALGEBRA LINEAL iirirmrminiinniHniiiHU en un apéndice de nuestro First Course, digamos por series de potencias, y que satisfacen las propiedades básicas f = g, g' = — f, /(O) = 0, g(0) =1, de las cuales se derivan todas las otras propiedades analíticas. Esto se hace como sigue: Proposición 6. Supóngase que se ha fijado una orientación de V. Dado un nú- mero 0, sea Fg la rotación cuya matriz asociada con respecto a cualquier base ortonormal que tiene la orientación dada, es cos0 — sen sen 0 eos 0 J Si 0 y <p son números, entonces Fg+9 = FgFv = FvFg. Además, F-g — Fg1. Tenemos que Fg = F9 si y sólo si 0 y <p difieren en un periodo igual a 2nn. Prueba. En la proposición 2, se probó el hecho de que la matriz de una rota- ción es la misma que la matriz de dos bases ortonormales que tienen la misma orientación. Una multiplicación directa de matrices mostrará que estas afirma- ciones son verdaderas, usando las fórmulas de la adición para el seno y para el coseno. Dado un ángulo Z PQ, observamos que se puede hallar su seno y su coseno como a continuación se indica. Sea F la rotación tal que F(P) = Q. Por la pro- posición 2 y por las propiedades del seno y del coseno, sabemos que existe un número 0 tal que F = Fe. Entonces, eos Z PQ = eos 0 y sen Z PQ = sen 0. A cada ángulo se le ha asociado una rotación y, por lo tanto, un conjunto de nú- meros del tipo 0 + 2mt. Recíprocamente, dada una rotación F y un punto P en el círculo unitario, se les puede asociar el ángulo ZPQ donde Q = F(P). Sean ZPfi un ángulo y 0 un número. Definamos la expresión “¿PQ tiene 0 radianes” como que Fg es la rotación asociada con el ángulo ¿PQ. Si <p = 0 + 2nn y si ¿PQ tiene 0 radianes, entonces Z PQ también tiene <p radianes. Ahora se infiere fácilmente, usando la proposición 5, que el coseno de la suma de dos ángulos satisface la fórmula usual de la adición si usamos la fórmula análoga para la función eos. Hacemos la prueba a manera de ejemplo. Supóngase que ZPg tiene 0 radianes y que ¿QR tiene q> radianes. Entonces F»(P) = Q y FV(Q) = R- De donde Fe+v(P) = F9(Fe(P)) = R. Por tanto, ZPR tiene 0 + <p radianes. Aplicando la fórmula eos (0 + <p) = eos 0 eos <p — sen 0 sen <p, y las definiciones, se obtiene la fórmula de la adición para el coseno de la suma de dos ángulos. La fórmula de la adición para el seno se prueba de la misma manera.
Respuestas a los ejercicios

Respuestas a los ejercicios Capítulo I,§1 A + B A - B 3A -2B 1. (1,0) (3, —2) (6,-3) (2, -2) 2. (-1,7) (-1,-1) (-3,9) (0,-8) 3. (1,0,6) (3,-2,4) (6,-3,15) (2,-2,-2) 4. (-2,1,-1) (0, -5,7) (-3,-6,9) (2,-6,8) 5. (3rt,0,6) ( — 71,6, -8) (3n,9,-3) ( —4n, 6, —14) 6. (15 + ít, 1,3) (15 -7t,-5,5) (45,-6,12) (-2ti, -6,2) Capitulo I, § 2 1. No 2. Sí 3. No 4. Sí 5. No ' 6. Sí 7. Sí 8. Sí Capítulo I, § 3 1. 5,10, 30,14,10 + n2, 245 4. (b) y (d) 2. -3,12,2, -17. 2tt2 - 16, 1 5tt - 10 6. H,0 Capítulo I, § 4 I. Js, vía s/3a yK Vio + n2 V245 2. y/2,4, >/4? + 58, Jn2 + 10 3. (0,3), $(-1,1,1), «(1,-3,4), 7t2 — 8 2tt2 + 29 (2n, -3, 7), 15n - 10 n2 + 10 (*, 3,-1) 4. Ü-2,l),f(-l,3),A(2,-l,5),H(l,2, -3), 2it2 — 16 ~¡t2 + 10 (n, 3,-1), — (15, -2,4) 5. 0,0 7. y/lñ 8. 2 13. (a) 7 , o 741-35 741 6 (b) -j-L-, -/2L_, ------ 717'26 7>7'41 726 41 387
^4^388 ALGEBRA LINEAL Cadmio I, § 5 I. X = (1, 1, - 1) + t(3,0, -4) 2. X = (-1,5,2) + r(-4,9,1) —3. x + 8 4. 4y = 5x - 7 6. (c) y (d) 7. (a) x - y + 3z = — 1 (b) 3x + 2y — 4z = 2n + 26 (<) x — 5z = —33 8. (a) 2x + y + 2z = 7 (b) 7x - 8y - 9z = - 29 (>' v + z = 1 9, (1, -9, —5),(1, 5, —7) (Otros serían múltiplos constantes de éstos!_ ^10 (a) 2(t2 + 5)1'2 11. (15t2 + 26t + 21)1'2, 7146/15 __12. ( 2,1,5) 13. (11,13,-7) *^Vl4. (a) X = (1,0, -1) + t£-2,1,5) (b) X = (1,0,0) + í(ll, 13, -7) ^^15. (a) -i (b) -2/742 (c) 4/766 (d) -72/3 17‘ (1>3> ~2) 18' 2/^~ 19’ -JL 21. (a) K-3,8,1) (b) (-1V,O),(-ÍV,1) 22- ^QEapítulo I, § 6 1 (-4,-3,1) 4 0 2. (-1,1,-1) 3. (-9,6,-1) 5. £3, Eít E2 en ese orden. ^apitulo ¡, § 7 1. (a) - -L - — (b) 2 k 10 10 ' ’ (c) -1 + 3i (d) -1 + 3i (e) 6it + (7 + jr2)í (f) (g) ít^/T- 3 + (ti + 372)í (h) — 8 — 6i !• (a) i 4- i¡ (b) A - A' (c) i + jí (d) j + i¡ . ^^^ipítulo II, § 2 (a) A - B, (1, - 1) (b) lA + IB, (l,i) (c) A + B, (1,1) (d) 3/1 4- 2B, (3,2) (a) (i,-i,i) (b) (1,0,1) (c) (i,-i, -i) 7. (3.5) 8. (-5.3) ^^pítulo ///,§/ Sobre matrices 15 -6' 3B = 1 3 3 -3 ( -1 12 -1' A + 2B = Í l 1 2 0
RESPUESTAS 389 7. Iguales „ /O 2\ . , 8. IQ _2j, iguales r — 6 11. Filas de A .(1,2,3),(-1,0,2) Columnas de A: ( Q) Filas de B: (-1,5, -2),(1,1,-1) Columnas de B: 12. Filas de A : (1, — 1), (2,1) Columnas de A: Filas de B: (-1, l),(0, -3) Columnas de B: Capítulo III, § l Sobre dimensiones 1.4. Bases posibles: Q ¡¡), (° °) 2. mn; {£.->} donde E¡j tiene a 1 como componente en el lugar (i,y) y a 0 en otro caso 3. n 4. n(n + l)/2 0-G 9(” °) 6. n(n + l)/2 7. n; Ei donde E¡ es la matriz n x n cuyo término ii es 1 y todos los demás términos son 0. 8. 0, 1 ó 2 9. 0,1,2 6 3
390 ALGEBRA LINEAL Capitulo III, § 3 1. IA = Al = A 2. 0 \4 1/ 4/ \H -,87 5. AB=(4 BA=(2 \5 -i) VI/ 6. AC = C4 = Q BC = CB = (14 0) Si C = xl, donde x es un número, entonces AC = CA = xA. 1- (3,1> 5)> primera fila 8. Segunda fila, tercera fila, fila i 10. Una M posible es (0 0 1 0 0 0 0 0 0 1 1 \ 1*1. 0 1 I entonces 0 0 / 0 0 0 0 0 0 \0 0 !1 2 0 1 0 0 (b) 10 4 1 16. Columna i-ésima de A 15. Segunda columna de A
RESPUESTAS 391 25. (a) 2 (b) 4 (c) 8 (1 O o\ O o\ /i o o 0 4 0,0 8 O I, I O 16 O O O 9/ \0 O 27/ \0 O 81 31. Matriz diagonal con elementos diagonales a*, a2k,... a„k 31. Q,(J Capitulo IV, § 1 1. (a) eos x (b) e* (c) 1/x 3. (a) 11 (b) 13 (c) 6 4. (a)(e, 1) (b) (1,0) (c) (1/e, -1) 5. (a) (e + 1,3) (b) (e2 + 2,6) (c) (1,0) 6. (a) (2,0) (bJOte-tr) 7. (a) 1 (b) 11 8. La elipse 9x2 + 4y2 = 36 9. La recta x = 2y 10. El circulo x2 + y2 = e2, el círculo x2 + y2 = e2' 11. El cilindro, radio igual a 1, eje z = eje del cilindro 12. El círculo x2 + y2 = 1 Capítulo IV, § 2 1. Todos excepto (c), (g) 4. Si u es un elemento tai que 7u = w, entonces el conjunto de todos esos elementos es el conjunto de los elementos u + v donde Tv = 0. 8. Sólo el ejemplo 8. 9. Si F(/l) = 0, entonces la imagen = punto F(P). Si F(/t) / 0, entonces la imagen es la recta F(P) + tF(A). 12. El paralelogramo cuyos vértices son B, 3A, 3A + B,0 13. El paralelogramo cuyos vértices son 0,2B, 5A, 5A + 2B 14.0. 18. (a) (-1,-1) (b) (-2/3,1) (c) ( — 2,-1) 19. (a) (4,5) (b) (11/3,-3) (c)(4,2) Capítulo IV, § 3 6. Funciones constantes 7. Ker D2 = polinomios de grad g 1, Ker D" = polinomios de grad í? n — 1 9. (a) Múltiplos constantes de e* (b) Múltiplos constantes de e“x 10. (a) n — 1 (b) n2 - 1 12. n(n + l)/2 Base para cuando n = 2 J/0 1W1 ®W° o\) |yi 0^0 oj\o ijj Base para cuando n = 3 i o o\/o o o\/o o o\ /o i o\/o 0 i\/o 0 0 o o o o i olio o o h o olio o olio 0 1 o o o/yo 0 0/\0 0 l/\0 0 0/\1 0 0/\0 1 o nnnnnnnnnnnnnnuit
392 ALGEBRA LINEAL 5. (c) n(n - I )/2 16. n(n + l)/2 17. (a) O (b) m + n, j(u¡,0), (0,«;)}; i = 1, ..., m; j = (7 y jtvj es una base de W. Si (u,} es una base de 'upítuli' V, § / |.(a)(5,3) (b) (5,0) (c) (5, 1) (d) (0,-3) ¡ipitulo V, § 2 O O O O O O 1 o 1 ,a) O ») ,w j (c) 3/ (d) 7/ (e) -1 (0 O O O O O O O O 2. (a) P 0. (b) -1 O -1 -1 O o' -1, 1 x/3 /3 1 1 /-I 1 7R-1 -1 0 0 1 0 0 0 0 o 3 1 o 3. eos 8 sen ' i . . | ~~r\ ~ 1, -sen0 cos0/ J2 5. (-3, -1) 8. cí /eos 0 eos <p — sen 0 sen </> Veos 0 sen ip + eos 0 sen <p — (eos 0 sen <p + eos 0 sen <p) eos 6 eos <p — sen 0 sen <p Capítulo V7, § 2 1. dim 4 2. (a) -^(1,1,-1) (b)-U(2,l,l), y -^(1>O,1) 3. i-.(l,2,1,0) /6 y -J—(—1,-2,5,3) 4. -^(1,1,0,0), Kl,-1,1,1), ’ (-2,2,3,1) v/ 5. 6. x/8Ó (t2 - 3t/4)iv/3r y8Ó (i2 - 3t/4Xv/3t, 10z2 - 12z + 3 'apítulo VI, § 3 I. (a) 2 (b) 2 (c) 2 (d) 1 (e) 2 (í) 3 (g) 3 (h) 2 n
RESPUESTAS 393 4. (a) dimensión = 1 bases = (1, -1,1) (b) dimensión = 2 bases = (1,1,0X0,1,1) (c) dimensión = 1 bases = (-—-, 71 + 1 ) \ 10 5 / (d) dimensión = 0 5. (a) ¿ (b) 1 (c) 0 (d) 2 6. n - 1 Capítulo VI, § 4 5. (a) 2xtyt - 3xiy2 + 4x2y, + x2y2 (b) 4xlyi + xty2 - 2x2yt + 5x2y2 (c) 5xj/| + 2x¡y2 4- 7tx2yi + lx2y2 (d) *!)>! + 2xty2 - x,y3 - 3x2^ + x2y2 + 4x2y3 + 2x3j| + 5x3y2 - x3y3 (e) —4x1yI + 2xty2 + x,y3 + 3x2jíj + x2y2 + x2y3 + 2x3yi + 5x3y2 + 7x3y3 1 2 (O -^iTi + 2xty2 - 5x,y3 + x2Ji + -x2y2 + 4x2y3 - x-,^ + 3x3y3 Capítulo VII, § 3 1. (a) -20 (b) 5 (c) 4 (d) 5 (e) -76 (í) -14 2. (a) -18 (b) 45 (c) 0 (d) 0 (e) 4 (1)14 (g) 108 (h) 135 (i) 10 3. ana22 • • • a„„ 4. 1 N 6. (a) 3 (b) -24 (c) 16 (d) 14 (e) 0 (1)8 (g) 40 (h) -10 (i) [] a„ i- 1 7. 1 8. t2 + St + 5 Capítulo VII, § 4 (a) x = -|,y = i,z = -| (b) x =-ft.y = -A,z = (c) x = -Á,y = %,z = \,w = -O (d) x = y, y = 45, z = A, w = 2 Capítulo VII, § 5 1. (a) 1 (b) 1 (c) -1 (d) 1 (e) 1 (1) 1 (g) 1 (h) -1 (i) -1 ")[! 2 3 41 1 4 3J 2 3 41 4 1 3j 2 3 41 2 1 3j 2 3 4" 1 4 2. (g)|j M’[j í 2 3 4" 2 4 1 3 41 2 4J Capítulo VII, § 9 / 4 1 —7 \ ¡2 23 - 11 \ 1. (a) -- 1—4 -6 2 I (b)| 1 19-8 y 12 2 6 / 5 yo -10 5 /
394 ALGEBRA LINEAL / 3 2 -9\ ?5 -16 3\ (c)i 1 2-3 (dU O 7 -1 4 \-2 -4 10/ \o — 2 1/ . / 0-19 0 (e) -32 -14 12 \ 28 17 -20 , . . 1 í d -b\ 3* (c) I } ad — bey —c a] Capítulo Vil, § 10 1. 2 2. 2 3. 2 4. 3 5. 4 6.3 7. 2 3. 3 Capitulo Vil, § 11 2. (a) 14 (b) 1 3. (a) 11 (b) 38 (c) 8 4. (a) 10 (b) 22 (c) 11 (d) 1 (d) 0
Indice de materias abanico, 257 abeliano, 327 adjunto, 228 álgebra, 350 algoritmo euclidiano, 281 ángulo entre planos, 28 — entre vectores, 22 anillo, 349 antilineal, 160 aplicación, 83 — bilineal, 152 — compuesta, 86 — geométrica, 109 — hermitiana, 228 — identidad, 88 — lineal, 91, 93, 358 inversa, 91 simétrica, 224 — multilineai, 315 — nula, 89, 90, 93 — ortogonal, 231 — unitaria, 231, 275 área, 202 autoadjunto, 228 automorfismo, 329, 333 — interior, 334 cierre algebraico envolvente, 352, 374 — convexo, 371 clase lateral, 336 clases residuales, módulo M, un ideal, 356 coeficiente de Fourier, 134,143 — de un polinomio, 242 — inicial, 242 columna, 60 combinación lineal, 43 componente, 134 — de una matriz, 59 congruente, 355 conjugado, 35, 377 conjunto, 39 — convexo, 113, 365 — máximo de elementos linealmente inde pendientes, 49 conmutativo, 327 convolución, 350 coordenadas con respecto a una base, 48 — vector de, 4, 48 curva, 85 definido negativamente, 272 derivación, 353 desarrollo de determinantes, 170, 174 desigualdad de Bessel, 137 base de Jordán, 298 — de un espacio vectorial, 47 — de un grupo abeliano, 344 — dual, 161 — en abanico, 257 — espectral, 271 — ortogonal, 137 — de Schwarz, 135 — del triángulo, 23 determinante, 167 — de Vandermonde, 179 diagonalizar, 128, 218 dimensión, 52 — finita, 53 — infinita, 53 campo, 39 — abstracto, 352 cíclico, 297-298 dirección, 9, 16 distancia, 16 divide, 285 397
398 INDICE DE MATERIAS ecuaciones diferenciales (lineales), 295 ecuaciones homogéneas, 64 elemento unidad, 330,350 elementos diagonales, 63 eliminación, 79 endomorfismo, 358 enteros, 290 escalar, 40 espacio de las matrices, 59 — dual, 159 — nulo, 157 •— propio, 247, 292 — vectorial, 40 exponente de un elemento, 341 hiperplano soporte, 368 homomorfismo, 331 — canónico, 362 — de anillos, 354 ideal, 283 — bilateral, 351 — derecho, 351 — izquierdo, 351 principal, 351 — unitario, 284 imagen, 83,99 — inversa, 253 indice de nulidad, 237 — de positividad, 238 factorización única, 286 fiel, 336 fila, 59,62 forma, 215 --bilineal, 215 — cuadrática, 220, 224 — hermitiana, 227 — normal de Jordán, 299 — nula, 157 — simétrica, 216 función racional, 377 funcional, 159 — de Dirac, 160 funciones coordenadas, 85 — de un subgrupo, 337 inducción, 373 inferiormente acotado, 369 intersección, 39, 44 inversa, 73,88 invertible, 73, 329 inyectiva, 87 irreducible, 286 isomorfismo de espacios vectoriales, 106 — de grupos, 332 — de productos tensoriales, 308 lema de Schur, 295 linealmente dependiente, 46 — independiente, 46 generado, 15, 43 generadores de un espacio vectorial, 43 — de un grupo, 330 — de un ideal, 284, 351 gradiente, 164 grado de un polinomio, 242 grupo, 327 — abeliano libre, 344 — cíclico, 341 — cociente, 339 — finito, 329 — lineal especial, 328 - general, 328 — simétrico, 328 — trivial, 329 longitud, 13,133 matrices semejantes, 128 matriz, 59,120 — antisimétrica, 102,220 — cuadrada,60 — diagonal, 62 — hermitiana, 228 — nula, 60 — simétrica, 62 — unitaria. 62.233 máximo común divisor (m.c.d.), 285 mismo sentido, 16 módulo, 357 — cociente, 362 — M, un ideal, 355, 361 Hamilton-Cayley, 260 hiperplano, 27 — separante, 367 mónico, 288 movimiento rígido, 334 multiplicación de matrices, 69
INDICE DE MATERIAS 399 multiplicación por la derecha, 359 multiplicidad, 243,288 — del valor propio, 255 nilpotente, 79, 259 no degenerada, 69, 131 -.syigular, 73 norma de un vector, 13,133 normal, 274, 338 núcleo, 98, 354 — de una aplicación lineal, 98 — de un homomorfismo de anillos, 354 número primo, 291 números complejos, 34 operador, 105,222 — definido positivamente, 226,272 — hermitiano, 227 — simétrico, 222 — unitario, 231 orden, 329 orientación, 382 ortogonal, 12,132,141,161 ortogonalización de Gram-Schmidt, 138 ortonormal, 138 paralelogramo, 97 paralelos, 9,28 período, 342 permutación, 186 — impar, 190 — par, 190 perpendicular, 12,132,161 plano, 26 polarización, 229 polinomio, 24 — característico, 252,255 — lineal, 243 — mínimo, 289 positivo, 226,274 primos relativos, 285 producto alternante, 195, 311 — definido positivamente, 133,142 — directo, 56,329 — escalar, 10,131 — hermitiano, 142 — interno, 10 — tensorial, 308 - vectorial, 32 proyección, 19,134 punto, 4 — extremo, 369 — final, 8 — inicial, 8 raíz, 243 — de la unidad, 343 rango, 149,200 — por columna, 148 — por fila, 148 recta, 24 regla de Cramer, 182 relación de equivalencia, 375 representa, 163,216, 224,229 representación, 336 representante, 355 rotación, 233 segmento de recta, 109 semiespacio, 366 sentido opuesto, 16 signo de permutación, 189 simultáneamente diagonalizables, 271 solución trivial, 65 subanillo, 352 subcampo, 40 subconjunto, 39 — propio, 39 subespacio, 42 — invariante, 257, 273, 295 — simple, 295, 361 subgrupo, 330 submódulo, 361 suma de subespacios, 45, 55 — directa suprayectiva, 87 teorema de Hamilton-Cayley, 260 — de Krein-Milman, 371 3 — de Pitágoras, 18 — de Sylvester. 235 — de Wedderbum-Rieffel, 360 — espectral, 268 transposición, 186 transpuesta de la aplicación lineal, 224 — de la matriz, 62 traslación, 89 traza, 77
400 INDICE DE MATERIAS triangulable, 258 triangular estrictamente superior, li — superior. 78 triángulo, 112 unión, 39 valor, 83 — absoluto, 36 valor caracteristico, 247 — propio, 247 vector, ?, 41,42 — columna, 60, 62 — de coordenadas, 4, 48 — localizado, 9 — propio, 246 — unitario, 15,133 vectores equivalentes, 8 volumen, 202 1
luiuiuiiiiHHHinnnrnin