Text
                    les maths
en tête
ALGÈBRE
2e édition
Xavier GOURDON


LES MATHS EN TÊTE Mathématiques pour MP* ALGÈBRE 2e édition Xavier GOURDON Ancien élève de l'école polytechnique
Du même auteur chez le même éditeur : Analyse, 2e édition, Les maths en tête, 432 pages, 2008. ISBN 978-2-7298-4294-9 © Ellipses Édition Marketing S.A., 2009 32, rue Bargue 75740 Paris cedex 15 Le Code de la propriété intellectuelle n'autorisant, aux termes de l'article L. 122-5.2° et 3°a), d'une part, que les « copies ou reproductions strictement réservées à l'usage privé du copiste et non destinées à une utilisation collective », et d'autre part, que les analyses et les courtes citations dans un but d'exemple et d'illustration, « toute représentation ou reproduction intégrale ou partielle faite sans le consentement de l'auteur ou de ses ayants droit ou ayants cause est illicite » (art. L. 122-4). Cette représentation ou reproduction, par quelque procédé que ce soit constituerait une contrefaçon sanctionnée par les articles L. 335-2 et suivants du Code de la propriété intellectuelle. www. éditions-ellipses. fr
Avant-propos de la deuxième édition Plus de dix ans après la sortie de la première édition, cet ouvrage est encore largement utilisé pour la préparation des concours (grandes écoles, agrégation). Les retours de mes lecteurs (grâce à internet notamment) sont nombreux et m'ont encouragé à réaliser cette deuxième édition. Cette dernière contient des corrections de coquilles, quelques retouches et améliorations de preuves et solutions, ainsi que quelques exercices et problèmes supplémentaires dans l'esprit de l'édition précédente. Une nouvelle annexe (annexe C) propose une introduction aux fractions continues. J'espère que les améliorations de cette deuxième édition seront utiles à mes lecteurs pour la préparation de leur concours. Je remercie chaleureusement les personnes qui m'ont aidé à apporter ces améliorations, en particulier les internautes dont les commentaires ont étés nombreux. Enfin, cette deuxième édition doit beaucoup à la patience de ma femme Laurence et de mes enfants, Gaspard, Anne-Sybille et Léopoldine ; je suis infiniment reconnaissant de leur support pendant les longues journées et soirées passées à cette mise à jour. xavier.gourdon_livres@yahoo.fr
Avant-propos de la première édition Cet ouvrage propose aux étudiants des classes de mathématiques spéciales (programme M') des rappels et des compléments de cours assez complets, ainsi que des exercices et des problèmes corrigés. Il pourra également intéresser les élèves préparant l'agrégation. L'ouvrage est orienté sur la relation étroite qui existe entre le cours et les exercices. Dans le fond, une bonne lecture du cours amène à s'interroger sur chaque résultat présenté : à quel niveau intervient-il dans l'articulation du cours, quelles en sont les conséquences, que se passe-t-il si on modifie les hypothèses ? Dans cet esprit, de multiples remarques ponctuent les parties de cours, mettant en avant ses subtilités, et faisant le lien avec les exercices qui suivent. Les parties de cours ne sont pas un substitut au cours du professeur, mais plutôt un résumé exhaustif qui l'éclairé d'une façon différente. Les compléments sont des résultats très classiques qui ne figurent pas au programme mais dont la connaissance est utile et parfois indispensable pour mener à bien un exercice ou un problème. Les résultats présentés sont démontrés lorsqu'ils sont à la limite du programme ou lorsqu'ils constituent un point important dont la démonstration met en place des techniques instructives que l'étudiant doit connaître et savoir maîtriser. À la fin de chaque section, on trouve une liste d'exercices de difficultés progressives, classiques ou parfois originaux, qui constituent une illustration du cours qui les précède. Je me suis efforcé à chaque fois de passer en revue tous les problèmes qui tournent autour du thème de l'exercice. Les nombreuses références au cours sont là pour inviter le lecteur à s'y reporter, le but étant de savoir et de comprendre précisément les résultats que l'on utilise. Une liste de problèmes ponctue la fin de chaque chapitre, ces problèmes étant des exercices plus longs, plus difficiles ou plus originaux que les précédents et faisant appel à l'ensemble du cours du chapitre. À la fin de certains chapitres, on trouve des sujets d'étude introduisant des théories élégantes dans le thème du chapitre. Des annexes présentent des curiosités mathématiques liées au programme d'algèbre. Les résultats du cours ou les exercices les plus importants sont indiqués par une flèche clans la marge de gauche. Je tiens enfin à remercier toutes les personnes qui m'ont aidé, Erwan Berni, Georges Papadopoulo et Alexia Stefanou pour la relecture de certains chapitres, le projet ALGORITHMES grâce à qui j'ai pu donner à mon ouvrage sa version typographique actuelle et la collection ELLIPSES pour avoir accueilli mon travail. Je serais reconnaissant à ceux de mes lecteurs qui me feront parvenir leurs remarques sur cette première édition. Xavier Gourdon
Table des matières Avant-propos de la deuxième édition 3 Avant-propos de la première édition 4 Chapitre 1. Arithmétique, Groupes et Anneaux 7 1. Arithmétique sur les entiers 7 2. Groupes 17 3. Anneaux 29 4. Problèmes 34 5. Sujets d'étude 43 Chapitre 2. Corps, Polynômes et Fractions Rationnelles 53 1. Corps, polynômes et arithmétique dans K[X] 53 2. Fonction polynôme, racines d'un polynôme 59 3. Fractions rationnelles 70 4. Polynômes à plusieurs indéterminées 77 5. Problèmes 81 6. Sujets d'étude 98 Chapitre 3. Algèbre linéaire : généralités 109 1. Espaces vectoriels 109 2. Applications linéaires 113 3. Matrices 119 4. Dualité 126 5. Formes multilinéaires, déterminants 134 6. Problèmes 148 Chapitre 4. Réductions d'endomorphismes 161 1. Diagonalisation, trigonalisation 161 2. Polynômes d'endomorphismes 174 3. Topologie sur les endomorphismes 182 4. Sous-espaces caractéristiques - Réduction de Jordan 191 5. Problèmes
6 TABLE DES MATIÈRES Chapitre 5. Espaces euclidiens 227 1. Formes quadratiques - Formes hermitiennes 227 2. Espaces préhilbertiens 240 3. Compléments de cours 256 4. Problèmes 269 Annexe A. Résolution des équations du troisième et du quatrième degré 285 1. Introduction 285 2. Techniques historiques 285 3. Méthode de Lagrange 286 Annexe B. Invariants de similitude d'un endomorphisme et réduction de Frobenius 289 1. Introduction 289 2. Invariants de similitude 290 3. Applications 292 Annexe C. Fractions continues 293 Index des notations 298 Index 300
CHAPITRE 1 Arithmétique, Groupes et Anneaux Jusqu'au début du vingtième siècle, l'algèbre désignait essentiellement l'étude de la résolution d'équations algébriques (en témoigne la dénomination du théorème fondamental de l'algèbre). Avec la résolution des équations algébriques apparut, de manière plus ou moins confuse, la notion de nombre complexe : on utilisa le symbole v7—L Parallèlement, la théorie des congruences se développa. Ainsi, de nouveaux objets mathématiques entrèrent en scène. Bientôt, les mathématiciens y virent des analogies étroites qu'ils cherchèrent à expliquer : l'algèbre devint progressivement l'étude abstraite des structures algébriques, jusqu'à ce que connaît l'étudiant d'aujourd'hui. 1. Arithmétique sur les entiers Nous supposons acquises les notions de base sur l'ensemble des entiers naturels N et des entiers relatifs Z, ainsi que les calculs dans l'anneau quotient Z/nZ. Une étude plus approfondie de ce dernier fait l'objet de la section 3 de ce chapitre. 1.1. Divisibilité - pgcd, ppcm DÉFINITION 1. Soient a et 6 deux entiers relatifs. On dit que a divise b (ou que b est un multiple de a), et on note a | 6, s'il existe un entier n tel que b = an. Si a ne divise pas 6, on note a \ b. Proposition 1 (Division euclidienne). Soient a e Z, b e N*. Il existe un unique couple (g, r) G Z x N tel que a = bq + r, avec 0 < r < b — 1. q s'appelle le quotient, r le reste, de la division euclidienne de a par b. Classes de congruence modulo n. DÉFINITION 2. Soit n un entier naturel non nul. On note nZ = {nk, k G Z}. Si x et y sont deux entiers, on note x = y (mod n) si x — y G nZ. et on dit alors que x et y sont congrus modulo n. Définition 3. Soit n un entier naturel non nul. L'anneau quotient de Z par nZ est noté Z/nZ. On note généralement x (ou x) la classe d'un entier x clans Z/nZ. Ainsi, Z/nZ={Ô,ï,...,n~=l}. PGCD. Définition 4. - Soient ai,..., an des entiers. Il existe un unique entier naturel d tel que a{Z + • • • + anZ = dZ. Ainsi défini, d s'appelle le pgcd de ai,..., an et on note d = pgcd (ai,..., an). L'entier d est aussi le plus grand entier naturel divisant tous les a{ (1 < i < n). - Lorsque pgcd (ai,..., an) = 1, on dit que les entiers ai,..., an sont premiers entre eux dans leur ensemble. Lorsque pgcd (ai,aj) = 1 dès que i ^ j, les entiers a^ sont dits premiers entre eux deux à deux.
8 1. ARITHMÉTIQUE, GROUPES ET ANNEAUX Remarque 1. - Des entiers premiers entre eux deux à deux sont premiers entre eux dans leur ensemble. - Il résulte de la définition du pgcd que les diviseurs communs à une famille d'entiers sont les diviseurs du pgcd. - Lorsque ai,..., an sont des entiers, on a Va G Z, pgcd (aai,..., aan) = \a\ pgcd (ai,..., an). - Le pgcd de deux entiers a et b se note aussi a A b. Théorème 1 (Bezout). Des entiers ai,...,an sont premiers entre eux dans leur ensemble si et seulement s'il existe des entiers u\,...,un tels que U\a\ + • • • + unan = 1. Remarque 2. Lorsque deux entiers a et b sont premiers entre eux, le théorème de Bezout assure l'existence d'un couple (utv) G Z2 tel que au + bv = 1. Il existe un moyen pratique de calculer un tel couple (u,v), appelé algorithme d'Euclide (voir l'exercice 2). Théorème 2 (Gauss). Soient a, b et c trois entiers. Si a divise le produit bc et si a et b sont premiers entre eux, alors a divise c. Proposition 2. Si un entier a est premier avec des entiers &i,..., bn, alors a est premier avec le produit b\... bn. Proposition 3. Soient ai,...,an n entiers premiers entre eux deux à deux et b un entier. Le produit ai • • • an divise b si et seulement si pour tout i, a* divise b. PPCM. Définition 5. Soient ai,... ,an des entiers. Il existe un unique entier naturel d tel que aiZ D • • • D anZ = dZ. Ainsi défini, d s'appelle le ppcm de ai,..., an et on note d = ppcm (ai,..., an). L'entier d est aussi le plus petit entier naturel non nul multiple de tous les ai (1 < i < n). Remarque 3. - Il résulte de cette définition que les multiples communs à une famille d'entiers sont les multiples de leur ppcm. - On a facilement Va G Z, ppcm (aai,..., aan) = \a\ ppcm (ai,..., an). - Le ppcm de deux entiers a et 6 se note aussi a V b. Proposition 4. Soient ai,..., an des entiers premiers entre eux deux à deux. Alors ppcm (ai,... ,an) = |ai • • -an\. Proposition 5. Pour deux entiers a et b, on a pgcd (a, b) x ppcm (a, b) = \ab\. 1.2. Nombres premiers Définition 6. On dit qu'un entier naturel p > 2 est un nombre premier si ses seuls diviseurs sont p, —p, 1 et —1. Théorème 3 (Théorème fondamental de l'arithmétique). Tout entier naturel n > 2 s'écrit de manière unique à l'ordre prés sous la forme où les pi sont des nombres premiers distincts et les ai des entiers naturels non nuls. La relation (*) s'appelle la décomposition de n en facteurs premiers. Remarque 4. - Tout entier n, \n\ > 2, est divisible par un nombre premier.
1. ARITHMÉTIQUE SUR LES ENTIERS 9 - Si n = Pi1 ■ ■ -p£fc et m = y\l • • -ppkk, où les pi sont des nombres premiers distincts et les ai,Pi des entiers naturels, alors pgcd(n,m) = pj1 ■••p]!c et ppcm(n,m) = p\l • - -pSkk où 7i = inf(ai,/?i) et ^ = sup(aiifii). Proposition 6. Si un nombre premier p ne divise pas un entier a, alors p et a sont premiers entre eux. PROPOSITION 7. Si un nombre premier divise un produit d'entiers ai • • -an, il divise au moins l'un des facteurs ai de ce produit. PROPOSITION 8. L'ensemble des nombres premiers est infini. Démonstration. Raisonnons par l'absurde et supposons qu'il y ait un nombre fini de nombres premiers. Soit N le plus grand d'entre eux. Posons M = iV! + 1 et désignons par p un nombre premier divisant M. Comme p < N, on a p | (AT!), donc p \ (M — N\) = 1, ce qui est absurde. □ Proposition 9. Soit p un nombre premier et k un entier, 1 < k < p — 1. Alors p \ Cj;. Proposition 10. Soit n > 2 un entier. L'anneau Z/nZ est un corps si et seulement si n est premier. -*- Théorème 4 (Fermât). Soitp > 2 un nombre premier. Alors Va G Z, ap = a (mod p) et Va G Z,p f a, ap_1 = 1 (mod p). Théorème 5 (Wilson). Un entier p > 2 est un nombre premier si et seulement si (p — 1)! = —1 (mod p). Démonstration. Condition nécessaire. Si p = 2 ou p = 3, c'est évident. Pour traiter le cas p > 3, on commence par rechercher les éléments x du groupe multiplicatif (Z/pZ)* égaux à leur inverse. Ils vérifient x2 = 1, c'est-à-dire (x — l)(x + 1) = 0. Les seuls éléments de (Z/pZ)* égaux à leurs inverses sont donc x = l et x = — 1. On range les autres 2,3,... ,p — 2 en ^^ paires d'éléments {xiiVi} telles que Xiyi = 1. Si k = ^-, on peut écrire k 2-3---p^2 = Y[{xiyi) = T donc (p-l)! = -l (mod p). Condition suffisante. Supposons p non premier, et notons a un diviseur de p vérifiant 1 < a < p. On a a \ [(p — 1)! + 1] par hypothèse, et a \ (p — 1)! puisque 1 < a < p, donc a \ 1 ce qui est absurde. □ 1.3. Exercices Exercice 1. Déterminer les triplets (a,b,c) G (N*)3 tels que (i) ppcm(a, b) = 42 (ii) pgccl(a, c) = 3 (iii) a + b + c = 29. Solution. D'après (ii), 3 | a et 3 | c, donc 3 | (a + c). Comme b = 29 — (a + c), 6 n'est pas un multiple de 3, et 3 étant premier, 3 A b = 1. En utilisant (i) on a b \ 42 = 3 x 14 et d'après le théorème de Gauss, b \ 14. Donc b G {1,2,7,14}. Mais 29 — b = a + c est divisible par 3, ce qui restreint les valeurs possibles de b à 2 et 14. - Si b = 2, a G {21,42} d'après (i). Mais a < 29 d'après (iii), donc a = 21 et c = 6 avec (iii). - Si b = 14, a G {3,6,21,42} d'après (i). La relation (iii) entraîne a < 29 — b = 15, d'où a G {3,6}. Si a = 3, c = 12 par (iii) ; si a = 6, c = 9.
10 1. ARITHMÉTIQUE, GROUPES ET ANNEAUX Nécessairement, on a donc (a, 6, c) = (21,2,6), (3,14,12) ou (6,14,9). Réciproquement, on vérifie facilement que ces triplets sont solution. Exercice 1. 1/ Soient a et b > 2 deux entiers naturels non nuls premiers entre eux. Montrer que 3\(u0, v0) e N2, u0a — v0b = 1, avec u0 < b et v0 < a (*) et exprimer en fonction de «o, ^o> & et b tous les couples (u, v) G Z2 solutions de ua—vb = 1. 2/ Déterminer deux entiers u et v vérifiant 47w + lllv = 1. Solution. 1/ Le théorème de Bezout assure l'existence de deux entiers u\ et v\ vérifiant u\a — v\b = 1. On effectue ensuite la division euclidienne de u\ par b : u\ = bq+uo, avec 0 < uq < b. On obtient (bq + uo)a — v\b = 1 = uqcl — vob, avecvo = v\—aq. Donc — 1 < vç>b = u$a — 1 < uoa < 6a, et en divisant par b > 2, on tire 0 < vo < a. Ainsi, notre couple (uo>fo) vérifie l'assertion (*). Ceci étant, considérons un couple (u,v) vérifiant ua — vb = 1. En retranchant à (*), on obtient (u — uo)a = (v — vo)b. (**) Ceci montre que a \ (v — vo)b et comme a et 6 sont premiers entre eux, le théorème de Gauss entraîne a \ (v — vo). Soit k G Z tel que v = vo + ka. En remplaçant dans (**), on obtient (u,v) = (wo + kb,vo + ka). Ceci prouve que le couple (uo,t>o) est bien l'unique couple vérifiant la propriété (*), et réciproquement, on vérifie facilement que les couples de cette forme sont solutions de ua — vb = 1. 2/ Les nombres 47 et 111 sont premiers entre eux, u et v existent donc. Nous allons les déterminer grâce à l'algorithme d'Euclide. On effectue d'abord la division euclidienne de 111 par 47 111 =47x2 + 17, puis on itère en divisant toujours le dividende par le reste, jusqu'à ce que le reste égale 1 : 47=17x2 + 13, 17=13x1+4, 13 = 4x3 + 1. On part maintenant de 1 = 13 — 4 x 3 et on remonte : 1 = 13 - 4 x 3 = 13 - (17 - 13 x 1) x 3 = 4 x 13 - 3 x 17 = 4 x (47 - 17 x 2) - 3 x 17 = 4 x 47- 11 x 17 = 4 x 47- 11 x (111-47 x 2) = 26 x 47- 11 x 111, d'où le résultat avec u = 26 et v = -11. Remarque. Il existe des résultats analogues sur les polynômes (voir l'exercice 3 page 56). Exercice 2. a) Montrer que pour tout entier naturel n, 5 | (23n+5 + 3n+1). b) Montrer que pour tout entier n, 30 | (n5 — n). c) Quel est le reste de la division euclidienne de 16^2 ) par 7 ? Solution, a) On a 25 = 2 (mod 5) et 23n = 8n = 3n (mod 5) donc 23n+5 = 2 • 3n (mod 5) et 23n+5 + 3n+i = 2 • 3n + 3 • 3n = 0 (mod 5). b) D'après le théorème de Fermât, n5 = n (mod 5), c'est-à-dire 5 | (n5 — n). De même, n3 = n (mod 3) donc n5 = n3 • n2 = n • n2 = n3 = n (mod 3), i. e. 3 | (n5 — n). Les entiers n et n5 ayant même parité, on a aussi 2 | (n5 — n). De plus 2, 3 et 5 sont premiers entre eux deux à deux, et finalement 30 = 2 • 3 • 5 divise (n5 — n). c) Posons N = 16(2l0°°). Il s'agit de déter miner la classe de congruence de N modulo 7. Comme 16 = 2 (mod 7), on a déjà TV = 22l°°° (mod 7). En vue d'utiliser la relation 26 = 1 (mod 7) (théorème de Fermât), recherchons le reste de la division de 21000 par 6. La relation 42 = 4
1. ARITHMÉTIQUE SUR LES ENTIERS 11 (mod 6) permet d'obtenir, par récurrence sur n, la relation 4n = 4 (mod 6), vraie pour tout n. En particulier, 21000 = 4500 = 4 (mod 6), donc il existe un entier naturel q tel que 21000 = 6ç + 4. Il ne reste qu'à écrire N = 26<?+4 = (26)9 • 24 = 1924 = 24 = 2 (mod 7), et le reste recherché est 2. Exercice 3 (Nombres de Mersenne, nombres de Fermât), a) Nombres de Mer- senne. Soient a > 2 et n > 2 deux entiers. Si an — 1 est un nombre premier, montrer que a = 2 et que n est un nombre premier (un nombre de la forme 2P — 1 où p est un nombre premier, est appelé nombre de Mersenne). b) Nombres de Fermât. Soit n G N*. Si 2n + 1 est un nombre premier, montrer que n est une puissance de 2. Solution, a) L'identité xn — 1 = (x — l)(rcn_1 H + x + 1) montre que \/x G N,x > 2, (x- 1) divise (x11 - 1). (*) L'entier an — 1 étant premier, on en déduit a — 1 = 1, c'est-à-dire a = 2. Écrivons n = pq où p et g sont deux entiers naturels. On a an — 1 = 2n — 1 = (2q)p - 1 de sorte que (29 — 1) divise an — 1 d'après (*), ce qui entraîne q = 1 ou q = n puisque an - 1 est premier. L'entier n est donc premier. b) Lorsque n est impair, l'identité xn + 1 = (x + l)(x,7?_1 — • • • + x2 — x + 1) entraîne Vz G N, Vn G N,n impair , (z + 1) divise (xn + 1). (**) Si n n'est pas une puissance de 2, n a au moins un facteur impair p > 1. Écrivons n = pq avec q G N*. L'entier 2n + 1 = (2«)p + 1 est divisible par (2« + 1) d'après (**), donc non premier. Ainsi, n doit être une puissance de 2. Remarque. La réciproque du résultat de la question a) est fausse. Par exemple, 211 — 1 = 23 x 49 n'est pas premier. Cependant, on peut tester facilement la primalité des nombres de Mersenne grâce au test suivant (test de Lucas). Soit (Yn) la suite définie par Y0 = 2 et Yn+1 = 2Yn2 - 1. Si n > 3, 2n - 1 est premier si et seulement si (2n — 1) | Yn-2- Ce test a permis de trouver le plus grand nombre premier connu en août 2008 : 243112609-1 (nombre à presque treize millions de chiffres décimaux). On ignore s'il y a une infinité de nombres de Mersenne premiers ou pas. Notons que les nombres de Mersenne apparaissent dans les nombres parfaits (voir l'exercice 9 page 14). - Nombres de Fermât. Fermât avait vérifié que 22" + 1 était premier pour 0 < n < 4 et pensait que 22" + 1 était premier pour tout n. Mais Euler montra que 225 + 1 = 641 x 6700417, et on a jusqu'ici trouvé aucun autre nombre de Fermât premier. On ne sait même pas s'il y en a ! Le sujet d'étude 2 page 46 donne un test de primalité simple des nombres de Fermât. Exercice 4. Soit A la somme des chiffres de 44444444 (écrit dans le système décimal) et B la somme des chiffres de A. Que vaut C, la somme des chiffres de B ? Solution. L'exercice repose essentiellement sur la remarque suivante. Tout entier naturel N est congru à la somme de ses chiffres (en base 10) modulo 9. (*)
12 1. ARITHMÉTIQUE, GROUPES ET ANNEAUX En effet. On peut écrire N = oq + ai • 10 H 1- ap • 10p, où les a; sont des entiers compris entre 0 et 9. La congruence 10 = 1 (mod 9) entraîne 10* = 1 (mod 9) pour tout i donc p p N = J^IO* = J2ai (mod 9)- i=0 i=0 On applique maintenant ce résultat. OnaC = B = i4 = 44444444 (mod 9). D'après (*), 4444 = 16 = -2 (mod 9) donc 44443 = (-2)3 = 1 (mod 9), et comme 4444 = 3 • 1481 + 1, on a 44444444 = (44443)i48i . 4444 = x . (_2) = 7 (mod 9). Finalement, C = 7 (mod 9). (**) Majorons maintenant C de manière à montrer C = 7. Le nombre 44444444 étant inférieur à 100005000 = 1020000, il a au plus 20000 chiffres. Donc A vaut au plus 9 x 20000 = 180000, donc a au plus 6 chiffres, donc B vaut au plus 6 x 9 = 54, donc C < 5 + 9 = 14. De (**), on tire C = 7. Remarque. C'est la propriété (*) qui explique le principe de la preuve par 9 que l'on effectue dans les classes de l'école primaire. Exercice 5. Soit P = Xn + c\Xn l-\ \-cn-\X + cn un polynôme à coefficients entiers. Montrer qu'une racine rationnelle de P est nécessairement entière. Solution. Soit x = a/b une racine rationnelle de P (a G Z, b G N*, a A b = 1). On a 0 = bnP (|) = an + cian~lb + • • • + cn-xabn-1 + cnbn donc an = -b(dan-1 + • • • + Cn-xaV1-2 + c»^"1), ce qui montre que b divise an. Les entiers a et b étant premiers entre eux, ceci n'est possible que si b = 1, d'où le résultat. Remarque. On en déduit en particulier que la racine n-ième de tout entier N est soit entière, soit irrationnelle (considérer le polynôme Xn — N). Exercice 6. Montrer qu'il y a une infinité de nombres premiers de la forme 6k — l, keW. Solution. Raisonnons par l'absurde en supposant qu'il n'y en ait qu'un nombre fini. Désignons par iV le plus grand d'entre eux. L'entier M = — 1 + 6(./V!) est impair donc 2 f M. De même, M = -1 (mod 3) donc 3 \ M. Soit p un facteur premier de M. Si p est de la forme 6fc — 1, alors p < N donc p | (6 • AT!), d'où p | (6iV! — M) = 1, ce qui est impossible. Le nombre p n'est donc pas de la forme 6k — 1. De plus p & {2,3} comme on l'a vu plus haut, donc p est de la forme 6k + 1, k G N*. Dans la décomposition M = p"1 • • • p%n de M en facteurs premiers, on a donc pi = 1 (mod 6) pour tout i, d'où M = 1 (mod 6), ce qui est absurde car M = — 1 (mod 6) par construction. Remarque. On peut démontrer de la même manière qu'il y a une infinité de nombres premiers de la forme 4k — 1. Il existe un théorème plus général (théorème de Dirichlet, 1837) qui dit : V(a, b) G (N*)2, a A b = 1, il existe une infinité de nombres premiers de la forme ak + 6, A; G N.
1. ARITHMÉTIQUE SUR LES ENTIERS 13 Malheureusement, ce résultat n'a encore jamais pu être obtenu par des moyens élémentaires et simples. On peut cependant le démontrer clans certains cas particuliers (voir le problème 4 page 37, la partie 6/ du sujet d'étude 2 page 46 ou le problème 10 page 92). En notant 7raj&(:c) le nombre de nombres premiers < x de la forme ak + b, le théorème de Dirichlet assure également que lorsque a A b = 1, on a iratb(x) ~x—+00 'K{x)lv(.a) (où ir(x) désigne le nombre de nombres premiers < x et ip(a) l'indicateur d'Euler de a). EXERCICE 7. a) Montrer qu'il n'existe pas de polynôme P non constant à coefficients entiers, tel que P(n) soit premier pour tout entier n supérieur à un certain rang N. b) On considère un polynôme P h h variables et à coefficients entiers. On pose /(n) = P(n, 2n, 3n,... ,kn), et on suppose limn^oo/(n) = +oo (ceci pour éviter des fonctions comme /(n) = 2n5n — 10n + 7). Montrer que /(n) ne peut pas être un nombre premier pour tout entier n supérieur à un certain rang N. Solution, a) Supposons qu'un tel polynôme existe. Écrivons P = Yl^o^X**. L'entier p = P(N) = X)fc=o ak Nk est premier. Or tout entier naturel r vérifie n n P(N + rp) = Y^ ak(N + rp)k = ^ akNk = 0 (mod p), fc=0 k=0 autrement dit P(N + rp) est divisible par p pour tout entier naturel r. Comme P(N + rp) est premier, on a P(N + rp) = p pour tout entier naturel r. Ainsi, le polynôme P(X) — p a une infinité de racines, il est donc nul, ce qui est contraire aux hypothèses. b) Supposons l'existence d'une telle fonction. Un peu d'attention montre que / peut se mettre sous la forme m / qr \ /(n) = 5Z(SCr^nja?' r=l \s=0 / où les ar et cryS sont entiers, avec 1 < a\ < 0,2 < • • • < am. Comme limn_*oo/(n) = +00, on peut supposer f(N) > am > • • • > ai > 1 (quitte à augmenter N). Notons p le nombre premier p = f(N). On a W G N, Vs G N, [N + £p(p - l)]5 = Ns (mod p), et d'après le théorème de Fermât, lorsque 1 < r < m on a oPr~l = 1 (mod p) donc W G N, a^^"1) = a^ (mod p). Finalement, W G N, [TV + £p{p - lJl'ajy+^fr-1) = Nsa^ (mod p), et ceci pour tous les entiers r, s donc f[N + £p(p— 1)] = f(N) = 0 (mod p). Ceci étant vrai pour tout entier naturel £, on aboutit à une absurdité. Exercice 8. Pour tout entier naturel n, on pose Fn = 22" + 1 (nombres de Fermât). a) Montrer que les nombres (Fn)nGN sont premiers entre eux deux à deux. b) En déduire une autre démonstration du fait qu'il y a une infinité de nombres premiers. Solution, a) Si n G N, A; G N*, il s'agit de montrer que Fn et Fn+k sont premiers entre eux. La relation entraîne Fn+k - 1 = (Fn - l)2" = (-1)2" = 1 (mod F„)
14 1. ARITHMÉTIQUE, GROUPES ET ANNEAUX donc Fn | (Fn+k - 2). Ainsi, le pgcd d de Fn et Fn+k divise Fn+k - 2. Comme de plus d \ Fn+k, d divise 2, et Fn étant impair, on a nécessairement d = 1. b) Pour tout n G N, notons pn un facteur premier de Fn. Les Fn étant premiers entre eux deux à deux, les (pn)neN sont distincts deux à deux. On a donc trouvé une infinité de nombres premiers. Remarque. Profitons en ici pour rappeler quelques résultats dans l'histoire des nombres premiers. Les grecs savaient déjà qu'il y en avait une infinité. Le gros résultat suivant fut le théorème des nombres premiers. Si Va; > 0, ir(x) désigne le nombre de nombres premiers inférieurs à x, on a ir(x) ~ a;/log(:r) lorsque x tend vers l'infini. Il fut démontré pour la première fois et presque simultanément par J. Hadamard et C. De la Vallée Poussin en 1896. Les démonstrations les plus classiques de ce résultat font appel à la fonction £ de Riemann. Une preuve en est proposée en annexe du tome d'Analyse (deuxième édition). Exercice 9 (Nombres parfaits). 1/a) Pour tout entier naturel non nul n, on note a(n) la somme des diviseurs de n. Exprimer a(n) en fonction des termes intervenant dans la décomposition de n en facteurs premiers. Montrer que n A m = 1 => a(nm) = a(n)a(m). (*) b) On dit qu'un entier naturel non nul n est parfait s'il est égal à la somme de ses diviseurs autres que lui même (i. e. si a(n) = 2n). Si 2P — 1 est un nombre premier, montrer que n = 2P_1(2P - 1) est un nombre parfait. c) Réciproquement, démontrer qu'un nombre parfait pair n est de la forme 2P_1(2P — 1), où 2P — 1 est nécessairement un nombre premier. 2/ (Nombres parfaits impairs), a) (Théorème d'Euler). Montrer que s'il existe un nombre parfait impair n, alors il est nécessairement de la forme n = p1+4aQ2 avec p premier, p = 1 (mod 4), a G N, et Q G N* avec p A Q = 1. (Indication : à partir de la décomposition en facteurs premiers n = fj pf*, étudier la valeur de cr(p^) modulo 4.) b) Montrer qu'un nombre parfait impair a au moins 3 facteurs premiers distincts. Solution, a) Si n = p"1 • • • p^k est la décomposition de n en facteurs premiers, on a <*»)= e î>?ipf2---pf'=n(i+R+'-'+p?i)=n(Çr 0</?i<<*i i=l i=l \ Pt 0</?fc<afc La propriété (*) en découle immédiatement. b) On applique les résultats de la question précédente pour écrire a{n) = C7[2p"1(2p - 1)] = a(2p-1)cr(2p - 1) = (2P - 1)2P = 2n. c) La réciproque est plus délicate. Comme n est pair, il existe un entier p > 2 tel que n = 2p-1ra avec m impair. Le fait que 2P_1 A m = 1 nous autorise à utiliser (*), de sorte que a{n) = o-(2p_1)c7(m) = (2P - l)a(m). Or a(n) = 2n = 2pra donc (2P - 1) | 2pm, et comme (2p - 1) A 2P = 1, d'après le théorème de Gauss on a (2P - 1) | m. Autrement dit, il existe £eN* tel que m = (2P-1)^. La relation 2pra = 2n = a(n) = (2p-l)cr(m) entraîne a (m) = 2P£ = m+L Si £ > 1, m a au moins trois diviseurs distincts qui sont 1, £ et m, d'où a(m) > m + £ + 1, ce qui est absurde. Donc ^=l,m = 2p — let cr(ra) = ra + ^ = ra + l;onen déduit que •
1. ARITHMETIQUE SUR LES ENTIERS 15 les seuls diviseurs de m sont 1 et m, donc m est un nombre premier. En résumé, on doit avoir n = 2P~"1(2P — 1) où 2P — 1 est un nombre premier. 2/a) Considérons la décomposition de n en facteurs premiers n = p±l • • -p£*. D'après 1/a), on a c(n) = cr(Pil) • • • o-(p^k). Comme n est un nombre impair, on a 2n = 2 (mod 4). Si n est parfait, alors cr(n) = 2n donc cr(p^) • • • cr(p^) = 2 (mod 4). Ceci implique forcément qu'il existe un et un seul indice i pour lequel cr(p^) = 2 (mod 4) et que les autres vérifient cr(p^i) = ±1 (mod 4). Quitte à renuméroter les pi, on peut donc supposer que afâ1) = 2 (mod 4) et \/i > 2, a(pfl) = ±1 (mod 4). (**) Les Pi sont des nombres premiers impairs car n est impair. Nous traitons deux cas selon que Pi = -1 ou 1 (mod 4). (i) Si pi = — 1 (mod 4), alors l'égalité cr(p^) = 1 +pi + • • • +p(*i entraîne a(^) = l + (_l) + ... + (_l)^ = /° (mod4) « «< est impair, 1 [ 1 (mod 4) si ai est pair. D'après (**) on en déduit i > 2 et ai est forcément un nombre pair, (ii) Lorsque Pi = l (mod 4), on a a(p^) = 1 +pi + • • • +p? = a{ + 1 (mod 4). Avec (**), on en déduit que a\ = 1 (mod 4) et que ai est pair pour i > 2. En résumé, on a forcément p\ = 1 (mod 4), a\ = 1 (mod 4) et dans tous les cas, ai est pair lorsque i > 2. Le résultat en découle avec p = pi, a = (ai — l)/4 et Q = p%2 • • • p£ . b) Soit n = p^1 • • -p%k la décomposition en facteurs premiers de n, avec p\ < p<i < ... < p^. Si n est parfait, l'égalité cr(n) = 2n entraîne 2=^)=^^)=i^a+i+...+ m^ i^. Si A; = 1, on a pi > 3 et (***) entraîne 2 < (1 — 1/pi)-1 < 3/2 ce qui est absurde. Si fc = 2, alors Pi > 3 et p2 > 5, donc d'après (***) on a 2 < (1 - l/pi)_1(l - VP2)"1 < (3/2) • (5/4) = 15/8 ce qui est absurde. Donc k > 3. Remarque. On ne connaît aucun nombre parfait impair, on ne sait même pas s'il y en a. Outre le résultat 2/a), on sait que s'il en existe un alors il a au moins 300 chiffres décimaux et il a au moins 9 facteurs premiers distincts dont le plus grand est supérieur à 108. Exercice 10 (Théorème de Liouville). Soitp > 5 un entier. Montrer que l'équation en m G N* (p-l)! + l=pm n'a pas de solution. Solution. Comme p > 5, (p — 1)! + 1 est impair donc pm est impair, donc p est impair. Or p > 5 donc 2 < £=i <p-l, d'où (p-l)2 = 2-(^).(p-l) divise (p-1)!. Ceci étant, supposons (p — 1)! + 1 = pm. Comme (p — 1)! = pm — 1, (p — l)2 divise pm — 1 = (p- 1)(1 + p + • • • + pm_1), donc (p - 1) divise 1 + p + • • • + pm_1. Or p = 1 (mod p-1) donc 1 +p + • • • + pm_1 = m (mod p — 1), ce qui prouve (p — 1) | m. Ceci montre m > p — 1 donc pm > pP-1 > (p _ i)p-i > (p - 1)!, et finalement (p - 1)! + 1 < pm et l'équation proposée n'a pas de solution.
16 1. ARITHMÉTIQUE, GROUPES ET ANNEAUX Exercice 11 (Critère de factorisabilité des nombres de Mersenne). a) Soit p un nombre premier de la forme 4/c + 3 avec k G N*. Montrer que 2^p~1^2 = (—l)fc+1 (mod p). b) On rappelle que les nombres de Mersenne sont les nombres de la forme Mp = 2P — 1 où p est un nombre premier (voir l'exercice 3). Si p est un nombre premier de la forme Ak + 3 (A; G N*) et si 2p + 1 est premier, montrer que Mp n'est pas premier. Solution, a) Posons N = 2{-p~v>'2 (—) •' = 2^-1)/2(2fc + 1)!. L'astuce est de donner une autre expression de N modulo p. On écrit ou encore N = 2(p-1)/2(l • 2- • • ?—-) = 2 • 4- • • (p - 1) (mod p), N = (2 • 4 • • • (2Â;)) • ((2k + 2) • • • (4fc) • (4fc + 2)) (mod p). Les congruences 2k + 2 = -(2fc + l) (modp) 2A; + 4 = -(2fc-l) (modp) 4fc + 2 = -1 (modp) entraînent (2fc + 2) • (2fc + 4) • • • (4ife) • (4fc + 2) = (-l)k+1(2k + 1) • (2k - 1) • • • 3 • 1 (mod p) donc TV = (2 • 4 • • • (2*0) • (-l)k+1((2k + 1) • • • 3 • 1) (mod p), d'où 2(p-i)/2(2/b + i)! = AT = (-l)k+1(2k + 1)! (mod p), d'où le résultat car comme p est premier et 2k + 1 < p, on a (2k + 1)! ^ 0 (mod p). b) Supposons p = Ak + 3 premier, ainsi que ç = 2p + 1 = 8k + 7. Le résultat précédent appliqué à q = A(2k + 1) + 3 donne 2(g-l)/2 = 2p = (_1)2fc+2 = x (mod ^ donc 2P — 1 = 0 (mod 2p +1). Autrement dit, 2p+1 divise Mp > 2p +1 et Mp n'est pas premier. Remarque. En appliquant b) aux petits nombres premiers, on montre que Mp n'est pas n'est pas un nombre premier pour p = 11, 23, 83, 131, 179, 191, 239, 251. Exercice 12. Résoudre x2 + y2 = z2y avec (x,yy z) e (N*)3. (Indication : se ramener au cas où x}y et z sont premiers entre eux, puis étudier leur parité.) Solution. Quitte à tout diviser par pgcd(#,2/,z)2, on peut supposer x,y et z premiers entre eux dans leur ensemble. On vérifie alors facilement que x, y et z sont premiers entre eux deux à deux. - Étudions la parité de x, y et z. Tout nombre impair N = 2n + 1 vérifie N2 = 4n2 + 4n + 1 = 1 (mod 4). Donc si x et y sont impairs, x2 + y2 = 2 (mod 4), donc z est pair et on aboutit à une absurdité car z2 = 0 (mod 4). L'un des entiers x ou y est donc pair, par exemple x. Comme #, y et z sont premiers entre eux deux à deux, y et z sont impairs. - On écrit x\2 (z — y\ (z + y' (§)- 2 7 V 2 7 (z et y étant impairs, ^^ et ?±1L sont entiers). Ceci montre que ^- et ^^ sont des carrés 2- d'entiers. Si tel n'était pas le cas, la décomposition de (f )2 en facteurs premiers entraînerait
2. GROUPES 17 l'existence d'un nombre premier p divisant {j-^) et (^-). L'entier p diviserait (^-^ + ^-) = z et /£±2/ — £=2) = y ce qui est impossible car y A z = 1. - Finalement, il existe (n,ra) G N2, tel que ^^ = n2 et ^- = m2. On en déduit x = 2mn, y =z m2 — n2 et z = m2 + n2. Réciproquement, ce triplet est solution. La solution du problème général est donc (x,y) ou (y,x) = (2kmn,k(m2 - n2)); z = k{m2 + n2) k G N*,(ra,n) G N2,ra > n. Remarque. Cet exercice est un cas particulier de l'équation xn + yn = zn. Fermât énonça en 1637 que pour tout entier n > 3, cette équation n'a pas de solution (x,y, z) G (Z*)3, et affirmait qu'il en possédait une démonstration. La prétendue preuve n'a jamais été retrouvée et les mathématiciens, après de très nombreuses recherches aux cours des siècles suivants, ont sérieusement douté de l'existence de la preuve de Fermât. Une démonstration complète du théorème de Fermât a finalement été trouvée en 1993 par le mathématicien anglais Andrew Wiles, résolvant ainsi le problème le plus célèbre des mathématiques. Inutile de dire que le niveau de la preuve dépasse largement celui des classes préparatoires. - Pour ceux que la théorie des nombres intéresse, on ne peut que conseiller l'excellent ouvrage de Hardy et Wright : An Introduction to the Theory of Numbers. 2. Groupes 2.1. Généralités DÉFINITION 1. On appelle groupe un ensemble G muni d'une loi interne * telle que (i) La loi * est associative (i. e. pour tous x, y, z clans G, (x * y) * z = x * (y * z)). (ii) Il existe un élément neutre e (i. e. pour tout x € G, x*e = e*x = x). (iii) Tout élément a un symétrique (i. e. pour tout x G G, il existe y G G tel que x * y = y*x = e). Si la loi * est commutative, on parle de groupe commutatif (ou abélien). Remarque 1. - L'élément neutre e de (G,*) est unique. - Pour tout x G G, x a un unique symétrique, souvent noté x-1. Définition 2. Soit (G,*) un groupe; on dit que H c G est un sous-groupe de G si la restriction de la loi * à H lui confère une structure de groupe. Exemple 1. L'ensemble Z des entiers, muni de la loi d'addition, est un groupe. Pour tout n G N, nZ est un sous-groupe de (Z, +). Réciproquement, on peut démontrer que tous les sous-groupes de (Z, +) sont de la forme nZ avec n G N. Dorénavant, la loi * d'un groupe sera notée multiplicativement (la notation additive est réservée aux groupes abéliens). Proposition 1. Soit G un groupe et H c G. L'ensemble H est un sous-groupe de G si et seulement si H ^ 0 et pour tout couple (x, y) E H on a xy~l G H. Proposition 2. Une intersection de sous-groupes d'un groupe G est un sous-groupe de G. Remarque 2. Le résultat est faux clans le cas d'une réunion (voir l'exercice 2). Définition 3. Soit (G, •) un groupe. On appelle centre de G, noté Z(G), l'ensemble des éléments de G commutant avec tous les éléments de G. L'ensemble Z{G) est un sous- groupe de G.
18 1. ARITHMÉTIQUE, GROUPES ET ANNEAUX Définition 4. Si G est un groupe fini, Card(G) s'appelle l'ordre de G. Théorème 1 (Lagrange). Soit G un groupe fini. L'ordre de tout sous-groupe H de G divise Vordre de G. Démonstration. La relation x 1Z y 4=> xy~l G H est une relation d'équivalence. Si on note x la classe de x G G, on a x = Hx = {zx, z G H}. (En effet : y G x <=> ylZx <=> yx~l G H <*=> y G Hx). Pour tout x G G, l'application H —> Hx y \-^ yx est une bijection comme on le vérifie facilement, donc Card(#:c) = Card(if). Ainsi, les classes ont toutes Card(#) éléments. Les classes d'équivalences formant une partition de G, on a donc Card(G) = nCard(if) où n = Card(G/ 1Z ) désigne le nombre de classes d'équivalence. □ Remarque 3. - Les classes utilisées dans la preuve du théorème (de la forme Hx) sont appelées classes à droite suivant le sous-groupe H. On aurait aussi pu considérer la relation d'équivalence définie par xlZy <=> x~ly G H, dont les classes sont de la forme xH et sont appelées classes à gauche suivant H. - L'entier Card(G/ 1Z ) est appelé indice de H dans G, et noté [G : H]. On a Card(G) = [G:H]x Card(#). sous-groupes distingués. Définition 5. Soit G un groupe. Un sous-groupe H de G est dit distingué (ou normal, ou invariant) dans G si pour tout x e G, xH = Hx. Exemple 2. - Tout sous-groupe d'un groupe abélien G est distingué dans G. - Le centre Z(G) d'un groupe G est distingué dans G. Plus généralement, tout sous- groupe de Z{G) est un sous-groupe distingué dans G. Remarque 4. Lorsque H est un sous-groupe distingué de G, on note parfois H < G. Il faut prendre garde à cette notation qui n'est pas transitive. Autrement dit, si L < H et si H < G, il est faux d'écrire L <G. Le résultat qui suit est parfois un moyen pratique de montrer qu'un sous-groupe est distingué. Proposition 3. Soit G un groupe. Un sous-groupe H de G est distingué dans G si et seulement si pour tout x G G, xHx~l c H. Groupes quotient. Soit G un groupe. On recherche les relations d'équivalence 7Z sur G telles que G/1Z soit un groupe. Un moyen naturel de faire de G/TZ un groupe est de le munir de la loi x • y = (xy) (la notation x désigne la classe de l'élément x). Encore faut-il que (xy) ne dépende pas des représentants x et y des classes x et y, c'est-à-dire que si xlZx' et ylZy', on veut (xy)TZ(x'y'). Si tel est le cas, on dit que 1Z est compatible avec la structure de groupe. On montre que les relations d'équivalence compatibles avec la structure de groupe sont les relations xlZy <=> xy-1 G H, où H est un sous-groupe distingué de G (dans ce cas, les classes à gauche suivant H coïncident avec les classes à droite suivant H). Muni de la loi quotient définie plus haut, l'ensemble quotient G/1Z est alors un groupe appelé groupe quotient et noté G/H. Si G est fini, on a Card(G) = Card(G/#) • Card(if). Exemple 3. Si n est un entier naturel non nul, riL est un sous-groupe du groupe additif (Z, +). Ce dernier étant commutatif, on est même assuré du fait que nL est un sous-groupe distingué de Z. Ainsi, on peut définir le groupe quotient Z/nZ (défini tel quel, Z/nZ ne possède qu'une structure additive ; la structure d'anneau de Z/nZ n'est introduite que lorsque l'on parle d'anneau quotient — voir l'exemple 3 de la partie 3.2).
2. GROUPES 19 Morphismes de groupes. Dans ce paragraphe, G et G' désignent deux groupes, dont les éléments neutres sont notés respectivement e et e'. DÉFINITION 6. Soit (p : G —> G' une application. On dit que ip est un morphisme de groupes si pour tous x,y eG, ip(xy) = <p{x)y(y). - Si (p est bijective, on dit que tp est un isomorphisme de groupes ; si de plus G' = G, on dit que (p est un automorphisme du groupe G. - L'ensemble <p~l({e'}) est appelé noyau de </? et noté Kery>. Le morphisme tp est injectif si et seulement si Kery> = {e}. Proposition 4. 5o# (p : G —> G' un morphisme de groupes, H et H' deux sous-groupes de G, G'. Alors - <p(H) est un sous-groupe de G', distingué si H est distingué dans G et si (p est surjectif. - ip~l(H') est un sous-groupe de G, distingué dans G si H' est distingué dans G'. En particulier, {e'} étant distingué dans G', Kenp = </?_1({e'}) es^ distingué dans G. De plus, le groupe quotient G/Kevtp est isomorphe à <p(G). •>• Remarque 5. Ce dernier résultat est important. En particulier, si tp : G —> G' est un morphisme surjectif, le groupe G' est isomorphe à G/ Ker <p. Cet isomorphisme est souvent utilisé lors de la résolution d'un exercice ou d'un problème sur les groupes. Groupe des automorphismes intérieurs. DÉFINITION 7. Soit G un groupe. Pour tout a e G, l'application ipa\ G —> G x i-> axa-1 est un automorphisme de G. L'ensemble A = {(pa, o, G G}, muni de la loi de composition, est un groupe (on a d'ailleurs ipa0iPb — <Pab), appelé groupe des automorphismes intérieurs de G. 2.2. Génération d'un groupe Dans toute cette partie, G désigne un groupe, dont l'élément neutre est noté e. DÉFINITION 8. Soit A C G. Il existe un plus petit sous-groupe H de G contenant A, qui est l'ensemble des éléments de G qui s'écrivent comme le produit d'éléments de A et d'inverses d'éléments de A. On l'appelle sous-groupe engendré par A et on note H = (A) . Lorsque l'ensemble A = {xi,..., xn} est fini, on note aussi H = (x\,..., xn). Exemple 4. Pour tout a G G, (a) = {am \ m G Z}. Si deux éléments a et b de G commutent, alors (a,b) = {ambn \ (m,ri) G Z2}. Définition 9. - Un groupe G est dit monogène s'il existe a G G tel que G = (a). Si de plus G est fini, on dit que G est cyclique. - Un groupe G est dit de type fini s'il existe un nombre fini d'éléments ai,... ,an de G tels que G = (ai,..., an). Un tel n-uplet (ai,..., an) est appelé système de générateurs de G. Remarque 6. - Tout groupe monogène est abélien. - Pour tout entier naturel non nul n, (Z/nZ, +) est un groupe cyclique. De plus, tout groupe cyclique à n éléments est isomorphe à (Z/nZ, +). Définition 10. Un élément a de G est dit d'ordre p G N* si (a) est fini d'ordre p. L'ordre de a est aussi le plus petit entier naturel non nul p tel que ap = e, et on a (a> = {e,a,...,aP-1}. "*" Théorème 2. Si G est fini d'ordre n, alors l'ordre de tout élément de G divise n. En particulier, tout élément a de G vérifie an = e.
20 1. ARITHMÉTIQUE, GROUPES ET ANNEAUX Théorème 3. Soit a un élément de G d'ordre p. On a l'équivalence (aq = e) <=> (p I q). Théorème 4. Si l'ordre de G est un nombre premier, le groupe G est cyclique, engendré par tout élément différent de l'élément neutre. Proposition h. Si G est cyclique d'ordre n, G = (a), alors ((ak) = G) <=^ (ifeAn = l). Démonstration. Comme G = (a), l'assertion (ak) = G est équivalente à l'existence d'un entier v tel que akv = a. Ceci s'écrit aussi akv~l = e, ou encore n | (kv — 1), c'est-à-dire 3u,v G Z | kv — 1 = un, ce qui équivaut d'après le théorème de Bezout à k A n = 1. □ 2.3. Groupe symétrique Définition 11. Pour tout entier naturel n non nul, on note <Sn le groupe des permutations de {1,..., n} (muni de la loi de composition). Le groupe <Sn est appelé groupe symétrique d'indice n. Si s e.«S„, on note 5 = (s(\) s(22) Z 8"n)). Remarque 7. On a Card(«Sn) = n!. Définition 12. Lorsque i ^ j, on appelle transposition sur i, j la permutation notée r^ permutant les éléments i et j : = ( l ••• i - 1 i i + 1 • • • j - 1 j j + 1 • • • n\ r,J \l • • • i - 1 j i + 1 • • • j - 1 i j + 1 • • • n J ' Théorème 5. Tout élément de Sn se décompose en produit de transpositions. Définition 13. Si s e Sn et a e {1,... ,n}, on appelle orbite de a suivant s l'ensemble Os(a) = {sk(a),keZ}. Définition 14. Soit 7 G Sn. On dit que 7 est un cycle si parmi les (97(a), 1 < a < n, il n'existe qu'une seule orbite non réduite à un élément. Autrement dit s'il existe p > 2 et a e {1,... ,n} tels que <97(a) = {a,7(a),... ,7p_1(a)} et Vx g (97(a), y(x) = x. L'orbite 07(a) est appelé support du cycle, son cardinal la longueur du cycle, et on note 7= (a,7(a),...,7p-1(a)). Exemple 5. - Une transposition est un cycle de longueur 2. - Dans <S5, s = (1,3,5) = (32541) est un cycle de support {1,3,5} et de longueur 3. - L'élément s = (2143) de<S4 n'est pas un cycle (deux orbites, {1,2} et {3,4}). Remarque 8. - Des cycles à supports disjoints commutent. - L'ordre d'un cycle dans le groupe <Sn est sa longueur. Théorème 6. Toute permutation s ^ là se décompose de manière unique à l'ordre prés en un produit de cycles dont les supports sont deux à deux disjoints. Exemples. - (J f \ |) = (1,2) ■ (3,4) = (3,4) • (1,2). -Gti?iin = (l,2,6,4)-(3,5) = (3,5)-(l,2,6,4).
2. GROUPES 21 Siqnature d'une permutation. DÉFINITION 15. Soit s e Sn. On appelle signature de 5 le produit x A l — i On a s(s) G {—1,1}. Si e(s) = 1 (resp. e(s) = — 1), s est dite paire (resp. impaire). Proposition 6. Si s et t sont deux éléments de Sn alors e(st) = £(s)e(t). Remarque 9. - Une transposition est de signature — 1. - La proposition précédente exprime le fait que e : <Sn —» {—1,1} est un morphisme de groupe. L'ensemble An = £_1({1}) = Kere est un sous-groupe distingué de Sn, d'indice 2 : on a Card(,4n) = n\/2 et An s'appelle le groupe alterné d'indice n. Proposition 7. La signature d'un cycle de longueur p est (—l)p_1. Démonstration. Soit s = (ai,a2, • • • , ap) un cycle de longueur p. Le cycle s peut se décomposer sous la forme s = (ai, ap) • (ai, ap-\) • • • (ai, as) • (ai, 02), c'est le produit de p — 1 transpositions. Une transposition étant de signature —1, on en déduit le résultat. □ 2.4. Groupe opérant sur un ensemble Dans cette partie, G désigne un groupe dont l'élément neutre est noté e, X un ensemble quelconque. Définition 16. On dit que G opère sur X s'il existe une application G x X ^ X (5, x) h-» s • x telle que (i) V(M) e G2yx eX} s-{t-x) = (st) • x (ii) VxGl, e ■ x = x. (Remarquer l'analogie avec un espace vectoriel sur un corps K.) Exemple 7. - Le groupe G opère sur lui même par l'application G x G —*■ G (s, x) h-» sx. - Le groupe des permutations S d'un ensemble X opère sur X par l'application S x X —> X (s, x) 1-* s(x). Equivalence d'intransitivité. Dans ce paragraphe, G est un groupe opérant sur un ensemble X. Définition 17. La relation sur X définie par x T y <=> 3s e G, y = s ■ x est une relation d'équivalence, appelée relation d'intransitivité. La classe d'équivalence d'un élément x de X est Gx = {s • x \ s G G}, on l'appelle classe d'intransitivité (ou orbite, ou trajectoire) de x. Définition 18. Le stabilisateur d'un élément a; de X est le sous-ensemble de G défini par 5a; = {s G G | 5 • x = x}. Proposition 8. Pour tout élément x de X, Sx est un sous-groupe de G. Démonstration. L'ensemble 5a,- n'est pas vide car e G 5a;. Par ailleurs, pour tout s,t G G on a t-x = x donc x = t-1 • (t• x) = t~l • x. Ainsi, (st-1) • a; = 5• (t-1 • x) = s• x = x, d'où si-1 G 5X. D
22 1. ARITHMÉTIQUE, GROUPES ET ANNEAUX Théorème 7. Si G est fini, pour tout x e X on a Card(G) = Caid(Gx) ■ Caxd(Sx). Démonstration. On fixe x. Soit 7lx la relation d'équivalence sur G définie par : 5 Tlx t ^=^ s • x = t • x. On a s 1ZX t <*=>• {t~1s) • x = x <=*► t_1s G Sx 4=> s G fS^. Les classes d'équivalences sont donc de la forme tSx, t e G, ce qui montre qu'elles sont toutes de cardinal Card(5x). Il y a autant de classes d'équivalences que de valeurs prises par s-a:, x G (3, c'est-à-dire qu'il y a Ca,rd(Gx) classes d'équivalence. Donc Card(Gf) = C&vd(Gx) • Card(5a?). □ Corollaire 1 (Équation aux classes). SiX et G sont finis, en désignant par 6 une partie de X contenant exactement un représentant de chacune des classes d'intransitivité, on a Card(C) CardW = £Card(G,) = £^ Application aux automorphismes intérieurs. Théorème 8. Soit G un groupe fini. Il existe une famille finie de sous-groupes stricts de G (\. e. 7^ {e} et ^ G) (Hi)i€l telle que Card(G) = Card(.E(G)) + £ ^^21 Card(fli) où Z(G) désigne le centre du groupe G. Démonstration. Faisons opérer G sur lui même par les automorphismes intérieurs : G x G —> G} (s}x) »—► (ps(x) = sxs'1. Si x G Gy on a Gx = {sxs~x \ s G G} et Sx = {s G G \ sx = xs} (dans ce cas, Sx est aussi appelé centralisateur ou normalisateur de x). D'après le corollaire précédent il existe 0 C G tel que Cal.d(G) = £ £!$f> £gCard(S*) Or Sx = G <=► Vs 6 G, sx = xs -^=s- x 6 Z(G), En notant 0' = 0 \ Z(G), on a donc d'où le théorème car les {Sx)xeQ' constituent une famille finie de sous-groupes stricts de G (ce sont des sous-groupes d'après la proposition 8, différents de G car x G" Z{G), différents de {e} car {e,x} C Gx). □ Remarque 10. Ce dernier résultat est très puissant car il permet d'avoir des renseignements sur C&ïd(Z(G)) connaissant a priori la forme des ordres des sous-groupes de G (voir l'exercice 11 page 27, le problème 7 page 40 et le problème 9 page 41). Cependant, cette formule n'est pas au programme de mathématiques spéciales et il faut au besoin savoir la redémontrer. 2.5. Exercices Exercice 1. Soit G un groupe quelconque, soient x,y G G. On suppose que xy est d'ordre fini p dans G. Montrer que yx est également fini d'ordre p. Solution. Si x et y commutent, c'est bien sûr évident. Plaçons nous maintenant dans le cas général. On commence par remarquer que pour tout n G N*, (xy)n = (xy) • • • (xy\ = xjyx) • • • (yx)y = x{yx)n~ly. n termes n—1 termes
2. GROUPES 23 Ainsi en désignant par e l'élément neutre de G> on a {xy)n = e *=> x(yx)n-ly = e ^=> yx(yx)n-ly = y *=> (yrr)n = e ce qui prouve que les ordres de xy et de yrr sont identiques. EXERCICE 2. Soient G un groupe et #i, H2 deux sous-groupes de G. a) On suppose que Hi U H2 est un sous-groupe de G. Montrer que Hi C H2 ou i/2 C H\. b) Si les ordres de H\ et #2 sont finis et premiers entre eux, que dire de H\ n H2 ? Solution, a) Raisonnons par l'absurde. Si #1 ç£ #2 et #2 £ #1, il existe rri e #1, x\ 0 #2 et il existe £2 G #2* #2 & H\. Comme H\ U #2 est un sous-groupe, le produit x\X2 appartient à H\ U #2- Si rrirr2 G #1, alors X2 = x^l(x\X2) G #1, ce qui est absurde. De même, on parvient à une absurdité en supposant x\x<i G #2- D'où le résultat. b) On sait que H\ fl #2 est un sous-groupe de H\ et #2- Ainsi, l'ordre de H\ n #2 divise l'ordre de H\ et l'ordre de #2* et vaut donc 1. Finalement, en désignant par e l'élément neutre de G> ona#in#2 = {e}. Exercice 3. Soient G un groupe et #1, H2 deux sous-groupes de G. On pose HiH2 = {xy | x G Huy G H2}. a) A quelle condition nécessaire et suffisante HiH2 est-il un sous-groupe de G ? b) Si H\ et #2 sont finis et si HinH2 = {e} (où e désigne l'élément neutre de G), montrer Card(#!#2) = Card(Jïi) ■ Card(#2). c) On suppose G abélien, H\ et H2 d'ordres finis p et g, où p et q sont deux nombres premiers distincts. Montrer que H\H2 est un sous-groupe cyclique de G. Solution, a) Nous allons montrer que H1H2 est un sous-groupe de G si et seulement si H1H2 = H2H1. Condition nécessaire. Soit a G H1H2. Alors a-1 G H1H2 autrement dit 3(rr,y) e H\X H2,a~l = xy. Ainsi a = y~lx~l, d'où a G H2H1. Donc #1^2 C H2H1. Il reste à montrer l'inclusion réciproque. Soit a = yx G #2#i avec x e Hi et y e H2. Comme a"1 = x~ly~l G H1H2, on a a G H1H2 car #1^2 est un sous-groupe. Ainsi, H2H1 C H1H2. Condition suffisante. Bien sûr, #1^2 7^ 0- Soient a, 6 G H1H2. Il s'agit de montrer a&_1 G H1H2. Écrivons a = a\a,2 et 6 = &i&2> avec ai,61 G #1 et a2,&2 G H2. On a a&_1 = a^&^&f1 = aiyrr avec y = a2&^~1 G #2 et x = b^1 G #1. Comme H1H2 = #2#i, il existe (xf,yf) e H\ x H2 tel que yx = x'y*. Donc a&_1 = a\x'yf = (a\xf)(yf) G H1H2, d'où le résultat. b) Considérons l'application (p : H\ x H2 —> #i#2 (^1,^2) h-> £i#2- Elle est surjective (par construction de l'ensemble d'arrivée H1H2), et injective car si ip(xi>X2) = ^(2/1,2/2), alors x\X2 = 2/12/2 donc yïlx\ = yix^, d'où yïxx\ e HinH2 = {e}, donc x\ = y\ et donc X2 = 2/2- Finalement, (p est une bijection, donc Card(ifi) • Card(iÏ2) = Card^iiife)- c) Le groupe G étant ici abélien, on a H1H2 = H2H1 donc H1H2 est un sous-groupe de G d'après a). Par ailleurs, on a Cardai #2) = PQ d'après b) car H\ n H2 = {e} (voir l'exercice précédent, question b)). Les sous-groupes H\ et H2 sont cycliques car leur ordre est un nombre premier. Soient x G H\ et y g H2 tels que H\ = {x) et H2 = (y). Montrons que #1^2 = (xy). Il s'agit de prouver que l'élément xy est d'ordre pq = Cardai#2)- Le fait que (xy)n = e entraîne xn = (y~l)n. Or HiH H2 = {e}, donc xn = (y~l)n = e, donc p \ n et q | n, et p et q étant premiers entre eux (car premiers et distincts), pq \ n. Donc l'ordre de xy est supérieur à pq et comme il est toujours inférieur à Cardai#2) = pq, son ordre est bien pq.
24 1. ARITHMÉTIQUE, GROUPES ET ANNEAUX Exercice 4. Soient G\, • • • > Gn des groupes cycliques d'ordres respectifs ai,..., an. Donner une condition nécessaire et suffisante portant sur les a* pour que le groupe G ~ G\ x • • • x Gn soit cyclique. Solution. Commençons par montrer le résultat suivant : Lemme. Pour tout i, soit xi un élément de G{ d'ordre /?;. Alors x = (rri,... ,rrn) est dyordre ppcm (/?i,...,(3n) dans G\ x • • • x Gn. Preuve. Pour 1 < i < n, notons ei l'élément neutre de G{> de sorte que e = (ei,...,en) est l'élément neutre de G. On a : (xp = e) <=> (Vz,rrf = e;) <=> (Vz,$ | p). Le plus petit entier naturel non nul p tel que xp = e est donc le plus petit multiple communs aux $, d'où le lemme. Montrons maintenant la condition nécessaire et suffisante : Le groupe G est cyclique si et seulement si les ai sont premiers entre eux deux à deux. Condition nécessaire. Soit x = (x\}...,xn) engendrant G. Il est clair que pour tout i} Xi engendre Gi} donc est d'ordre a;. D'après le lemme, l'ordre de x est ppcm (ai,..., an). Comme x engendre Gy son ordre est aussi Card(G) = ai • • • an. Donc ppcm(ai,..., an) = ai • • • an, ce qui entraîne que les a* sont premiers entre eux deux à deux. Condition suffisante. Pour tout z, considérons Xi G Gi d'ordre ai (xi existe puisque Gi est cyclique par hypothèse). D'après le lemme, x = (x\y... ,rcn) est d'ordre ppcm (ai,... ,an) dans G, et ce dernier terme égale ai • • • an = Card(G) puisque les a* sont premiers entre eux deux à deux. Finalement, G = (x) est cyclique. Exercice 5. Soit G un groupe, e son élément neutre. On suppose que tout élément x de G vérifie x2 = e. a) Montrer que G est un groupe abélien. b) Si G est fini et si G ^ {e}, montrer qu'il existe un entier n tel que G soit isomorphe au groupe [(Z/2Z)n,+]. Solution, s) Si x e G l'égalité x2 = e s'écrit aussi x = rr_1. Si x et y sont dans G, on a donc xy = (xy)~l = y~lx~l = yx. b) Soit (#i,..., xn) un système de générateurs minimal de G (il en existe car G est fini). Si à = /3 dans Z/2Z, alors 2 | a — (3 donc pour x G G, xa = x&. Ceci permet d'affirmer que l'application (p : [(Z/2Zy\+] -> G (di,... ,an) -> x? ■ ■ ■<» est bien définie. Le groupe G étant abélien, y> est un morphisme de groupe, et il est surjectif par définition d'un système de générateurs. Montrons que ip est injectif. Soit (di,...,dn) G Ker<£>. S'il existe i tel que ai = 1, par exemple dn = 1, l'égalité rr^1 "-x^^Xn = e entraîne xn = x~l = x±l • • • x^nSi . Donc (#i,...,xn-\) est un système de générateurs, ce qui est absurde puisque (#i,... >xn) est un système de générateurs minimal. Finalement Ker ip = {(Ô,... ,Ô)} et <p est injectif. C'est un isomorphisme. Exercice 6. Soit n G N*, n > 2. Montrer que tout élément du groupe des permutations Sn s'écrit comme le produit de transpositions de la forme (z, i + 1) avec 1 < i < n — 1. Solution. Soit P le sous-ensemble des permutations de Sn qui s'écrivent comme le produit de transpositions de la forme (z,z + 1). Soient i et j deux entiers vérifiant 1 < i < j < n. Le cycle (z, i + 1,..., j) s'écrit sous la forme (i, i + 1,..., j) = (i, i + 1)(< + M + 2) • • • (j - 1, j)
2. GROUPES 25 donc (z,» + 1, • • • »i) € P- De même, (j, j - 1,... ,i) = 0 - 1, j) •■•(t + l,i + 2)(i,t + 1) G P. Or lorsque 1 < i < j < n, on a ihj) = (j, j - 1, • • •, i + 1)(», » + 1,. • •, j) donc toute transposition appartient à P. Comme toute permutation peut s'écrire sous forme d'un produit de transpositions, on en déduit P = Sn. EXERCICE 7. On rappelle que le groupe alterné An d'indice n est le sous-groupe de S constitué des permutations paires. Si n > 3, montrer que les cycles de longueur 3 engendrent An. Solution. Puisque tout élément de Sn peut s'écrire comme un produit de transpositions et qu'une transposition est de signature — 1, An est aussi l'ensemble des produits pairs de transpositions. Appelons Afn le sous-groupe de Sn engendré par les cycles de longueur 3. On a A!n C An car un cycle de longueur 3 est de signature 1 (voir la proposition 7). Montrons maintenant An C Afn. D'après la remarque précédente, il suffit de prouver que le produit de deux transpositions est dans An- Ceci est vrai car : - Si iyjyk^l sont distincts deux à deux, (i,j)(k}l) = (i,j}k)(j}k}l) - Si iy j,k sont distincts deux à deux, (i,j)(i,k) = (i>kyj). - Si i ^ j, (hj)(jyi) =Id. EXERCICE 8. On rappelle que si G est un groupe fini et H un sous-groupe de G} l'indice de H dans G est l'entier [G : H] = §£$g}. Soit p > 5 un nombre premier. Si H est un sous-groupe du groupe symétrique Sp tel que [Sp: H] <p — lj montrer que [Sp : H] G {1, 2}. (Indications : Montrer que H contient tous les cycles de longueur p puis utiliser le résultat de l'exercice précédent.) Solution. Montrons d'abord que H contient tous les cycles de longueur p. Soit 7 G Sp un cycle de longueur p. Pour tout entier z, l'ensemble *fH est de cardinal Card(jHr). Comme H est d'indice <p-l dans <SP, les ensembles H,7^,...,/yp~lH ne peuvent pas être deux à deux disjoints (sinon Card(<Sp) > Yh=o Caxd^H) = p-C&vd(H)). Donc il existe deux entiers i et j, 0 < i < j < p— 1, tels que YHn^H ^ 0. On en déduit facilement 7J_Î G H. Or 1 < j — i < p donc 7J_Î engendre le sous-groupe (7) d'ordre p (voir le théorème 4 page 20), ce qui entraîne 7 G (7J_Î) C H. - Montrons maintenant que H contient tous les cycles d'ordre 3. Comme p > 3, il suffit de remarquer que H contenant tous les cycles d'ordre p, on a {hj,k) = (fc,j,z,ai,a2,...,ap_3)(z,fc,j,ap_3,...,a2,ai) G H. ~ D'après le résultat de l'exercice précédent, H contient donc Ap, le groupe alterné d'indice d'indice p. Donc Card(#) > Card(^p) = ±Card(*Sp), d'où [Sp : H] G {1,2}. Remarque. Ce résultat appliqué avec p = 5 montre qu'il n'existe pas de sous-groupe de <S5 d'ordre 30 ou 40, bien que Card(<S5) = 120. Ainsi, un entier peut diviser l'ordre d'un groupe fini sans qu'il n'existe de sous-groupe d'ordre cet entier. Exercice 9. Soit G un groupe fini d'ordre pair 2n (n G N*). a) Soit H un sous-groupe de G d'ordre n. Montrer que H est distingué clans G.
26 1. ARITHMÉTIQUE, GROUPES ET ANNEAUX b) On suppose qu'il existe deux sous-groupes H\ et H2 de G d'ordre n et tels que HiC\H2 ~ {e}, où e désigne l'élément neutre de G. Montrer que n = 1 ou n = 2. c) On suppose qu'il existe deux sous-groupes H\ et H2 de G, distincts et tout deux d'ordre n. Montrer que H = H\C\H2 est un sous-groupe distingué dans G. En déduire que l'ordre de G est un multiple de 4. Solution, a) Il s'agit de montrer : xH = Hx pour tout x G G. - Si x G H, on a xH = Hx = H. - Si x Ç- H, xH fl H = 0 (en effet, si y G ## fl #, il existe a G iï tel que y = xa donc rr = ya~l G iï, absurde), c'est-à-dire xH c G \ H. Or rriï et G \ H sont de cardinal n, donc xH = G \ H. On montrerait de même que Hx = G \ if, donc ## = ##. b) Comme Card(#i U #2) = Card(#i) + Card(#2) - Card(#i n H2) = 2n - 1, il existe a G G, a g #i, a g #2, tel que G = #i U H2 U {a}. Si n = 1, c'est terminé. Sinon n > 2. On remarque alors que V(rc,y) G (#i n {e}) x (#2 \ {e}), rry = or. (En effet. Si xy G #i, alors y € x~lH\ = H\ donc y e H\ D H2 = {e}, donc 2/ = e, ce qui est absurde; de même, rry 0 if2-) Ceci n'est possible que si Card(iïi \ {e}) = Card(iï2 \ {e}) = 1, c'est-à-dire n = 2. D'où le résultat. c) D'après a), H\ et H2 sont distingués dans G donc pour tout x G G, xH = rriïi n rr.Er2 = H\x fl i72# = Hx, ce qui prouve que H est distingué dans G. Notons 7r la surjection canonique de G dans le groupe quotient G/H. Comme H est un sous- groupe de #i, tt(#i) = #i/# est de cardinal ç^ffi = Car^(/f). De même, tt(#2) = #2/# est de cardinal Caï%/H\ • Or (H\/H) fl (H2/H) = (H\ fl H2)/H est réduit à l'élément neutre de G/#. Le groupe quotient G/iï étant d'ordre cJj/g\, on peut appliquer b) à G/#, H\/H et #2/# ce qui donne Carj/g) G {1>2}. Comme #i ^ H2, on a Card(iï) = Card(#i fl H2) < n donc Car2(m = 2- Finalement, Card(G) = 2n = 4Card(iï), d'où le résultat. Exercice 10 (Exposant d'un groupe abélien fini). Soit G un groupe abélien fini. a) Si £, y sont deux éléments de G d'ordres respectifs m et n, avec m A n = 1, quel est l'ordre de :n/ ? b) On appelle exposant de G le plus grand des ordres des éléments de G et on le note r. Montrer que r divise Card(G) et que si a: G G, l'ordre de x divise r. c) Montrer que r a les mêmes facteurs premiers que Card(G). En déduire que pour tout facteur premier p de Card(G), il existe un élément de G d'ordre p. Solution, a) Si (xy)p = e alors xp = {y~l)p donc xp G {y), d'où (xp)n = xpn = e, donc m | pn. Or m A n = 1 donc d'après le théorème de Gauss, m | p. De même n | p et les entiers m et n étant premiers entre eux, mn \ p. Or (xy)mn = (xm)n(yn)m = e, l'ordre de xy est donc ran. b) Par définition de r, il existe un élément rr de G d'ordre r et on a r \ Card(G) d'après le théorème 2 page 19. Soit y G G, q son ordre. Il s'agit de montrer que q \ r. Supposons q \ r. En écrivant la décomposition en facteurs premiers de q et r, on voit qu'il existe un nombre premier p vérifiant { q-V^i avec «>/?>0 et pAq' = pAr' = l. Or a = xp est d'ordre r' et 6 = j/9 est d'ordre pa. D'après a), ab est donc d'ordre r'pa > r, ce qui contredit la définition de r. Donc q \ r.
2. GROUPES 27 c) Soit (#1, • • • >xn) un système de générateurs de G. Notons ri,...,rn les ordres de #i,..., xn. Considérons l'application (p : (xi) x • • • x (xn) -> G (2/1, • • •, 2/n) »-> 2/1 • • • 2/n- Le groupe C? étant abélien, y? est un morphisme de groupes. De plus, (p est surjectif (puisque (x\ ..-ixn) est un système de générateurs de G), donc G est isomorphe au groupe quotient ({xi) x • • • x (xn))/Ker(p, donc Card(G) x Card(Kertp) = Card((#i) x • • • x (xn)) = r\---rny donc Card(G) | n • • -rn. Or tous les r* divisent r d'après b), donc Card(G) | rn. On en déduit que tout facteur premier p de Card(G) divise r. Soit p un facteur premier de Card(G). On vient de prouver que p \ r donc on peut écrire r = pr' avec r' entier. Si on choisit un élément x de G d'ordre r, l'élément xr est d'ordre p, d'où le résultat. Remarque. Les résultats de cet exercice permettent de montrer que si K est un corps commutatif et G un sous-groupe fini du groupe multiplicatif (K*, x), alors G est cyclique. En effet. Soit r l'exposant de G. K étant un corps commutatif, l'équation xr = 1 a au plus r solutions dans K, donc au plus r solutions dans G. Or Vrc G G, xr = 1 d'après b). On en déduit Card(G) < r, et comme r | Card(G), on a r = Card(G) et le résultat annoncé. - Ce dernier résultat est également une conséquence du problème 6 page 39. - En l'appliquant au corps Z/pZ (où p est un nombre premier), on démontre que le groupe multiplicatif (Z/pZ)* est cyclique, résultat non évident a priori EXERCICE 11 (Les p-GROUPES). Soit p un nombre premier et G un groupe fini d'ordre pa avec a G N* (on dit que G est un p-groupe). a) Montrer que Z(G), le centre de G, est différent de {e}, où e désigne l'élément neutre de G. (On pourra utiliser l'équation aux classes — voir le théorème 8 page 22). b) Que dire sia = l?sia = 2? c) Montrer que pour tout entier m, 0 < m < a, il existe un sous-groupe de G d'ordre pm. Solution, a) D'après le théorème 8, il existe une famille finie (Hi)i€i de sous-groupes stricts de G telle que Card(G) Card(G) = Card(Z(G)) + ^^^. (*) Pour tout i G /, H{ est un sous-groupe strict de G donc d'après le théorème de Lagrange, son ordre divise Card(G) = pay de sorte qu'il existe un entier /%, 1 < A < a, tel que C&vd(Hi) = jp1. Donc pour tout i G J,p divise cavîm =Pa~/3i- Orp \ Card(G) donc d'après (*),p | Card(Z(G?)). Comme de plus C&rd(Z(G)) > 1 car e G Z{G), ceci entraîne Card(Z(<3)) > p. b) Si a = 1, G est cyclique d'après le théorème 4. Si a = 2, comme £((2) est un sous-groupe de G, différent de {e} d'après a), on a forcément Card(Z(G)) G {p,p2}. Nous allons montrer que Z(G) = G en raisonnant par l'absurde. Supposons Card(Z(<3)) = p. Soit x e G} x g Z(G). L'ensemble Sx = {u e G \ ux = xu} (appelé normalisateur de rr) est un sous-groupe de G. Or x G Sx et £((2) C Sx, donc Card(5x) > p + 1. Comme Card(5x) | p2 = Card(G), ceci entraîne Card(5x) = p2 donc 5X = Gy et par définition de &P, on a rr G Z(G)y ce qui est contradictoire. Finalement Card(Z((2)) = p2, c'est-à-dire G est abélien. c) Nous allons montrer ce résultat par récurrence sur a G N*. (Le principe est de considérer le quotient par un sous-groupe distingué d'ordre p pour se ramener à l'hypothèse de récurrence). - Si a = 1, le résultat est évident.
28 1. ARITHMÉTIQUE, GROUPES ET ANNEAUX - Supposons le résultat vrai pour a, montrons le pour a + 1. Soit m, 0 < m < a + 1. Si m = 0, {e} est un sous-groupe d'ordre pm et le résultat est montré. Sinon, supposons m > 1. D'après a), Z{G) est différent de {e}. Soit x G Z(G),x ^ e. L'ordre de x divisant pa+1, il est de la forme p0 avec P > 1. Donc y = xp est d'ordre p, et le groupe H = (y) est d'ordre p. Par ailleurs, c'est un sous-groupe de Z(G) et il est donc distingué dans G. Le groupe quotient G/H est d'ordre pa et d'après l'hypothèse de récurrence, il existe un sous-groupe K de G/H d'ordre pm~l. Soit ir la surjection canonique de G dans G/H et considérons F = 7r_1 (K). Comme tt est un morphisme de groupes, F est un sous-groupe de G, et par ailleurs K = n(F) est isomorphe à F/Kern = F/H ce qui entraîne Card(F) = Card(X) x Card(#) = pm. D'où le résultat. Remarque. Ce résultat est un cas particulier du théorème de Sylow (voir le problème 7 page 40). Exercice 12 (Un théorème de Cauchy sur les groupes finis). On suppose que la théorie des groupes opérant sur un ensemble est connue (voir la partie 2.4). Soit G un groupe fini (non forcément abélien) d'ordre h, et soit p un nombre premier divisant h. On note S = {(ai,..., ap) G Gp | ai • • • ap = e}, où e désigne l'élément neutre de G, et on note 7 le cycle (1,2,... ,p) G <SP. a) On fait opérer (7) sur S en posant VA; G Z, 7k(au • • •, ap) = (a^(1)}..., a7*(p)). Déterminer le cardinal des orbites. b) (Théorème de Cauchy). Démontrer que le nombre de solutions dans G de l'équation xp = e est un multiple de p. En déduire qu'il existe au moins un élément d'ordre p dans G. Solution, a) Pour tout x € G} on note Gx l'orbite de x et Sx son stabilisateur. On sait que l'on a p = Card((7)) = Card(Gfx) x Card(S,a;), et p étant premier, Ca,rd(Gx) = 1 ou Ca,rd(Gx) = p. b) L'application f : S —> Gp~l (ai,..., ap) i-> (ai,..., ap_i) est bijective puisque chaque élément (ai,...,ap_i) de Gp~l a un unique antécédent par / qui est (ai,...,ap_i, (ai • • • ap_i)-1). Donc Card(5) = Card(GP~1) = hp~l. Soit O une partie de S contenant exactement un représentant de chaque orbite Gx. Soit A = {x e S | Card(Gx) = 1}. Soit 9' = 6 \ A. D'après a), Va; G 0', Cârd(Gx) = p. Or hp~l = Card(S) = ^ Card(GT) = Card(A) + ^ Card(<3x). x6© x€0' Comme de plus p | /i, on en déduit que p \ Card(^4) = hp~l — pCard(0/). Par définition de A, A est l'ensemble des p-uplets (a;,... ,x) tels que xp = e. Le nombre Card(^4) représente donc le nombre de solutions de xp = e, et comme p \ Card(i4), on en déduit le théorème de Cauchy. On a ep = e, ce qui entraîne Card(A) > 1, et comme p \ Card(.A), Card(^4) > p. Donc il existe x G Gy x ^ e tel que xp = e. Le nombre p étant premier, x est d'ordre p. Remarque. Ce résultat entraîne que lorsqu'un nombre premier p divise l'ordre d'un groupe, il existe un sous-groupe de cardinal p. On savait que c'était déjà vrai dans le cas d'un groupe abélien (voir l'exercice 10). Le problème 7 page 40 généralise ce dernier résultat.
3. ANNEAUX 29 3. Anneaux 3.1. Définitions DÉFINITION 1. Soit A un ensemble muni de deux lois internes notées "+" et "•". On dit nue (A, +, •) est un anneau si : (i) (j4, +) est un groupe abélien, (ii) la loi • est associative, (iii) le loi • est distributive par rapport à la loi +. Si la loi • admet un élément neutre, on parle d'anneau unitaire ; si la loi • est commutative, on parle d'anneau commutatif; un élément de A est dit inversible s'il l'est pour la loi •. Notation. Le neutre de la loi + est souvent noté 0, celui de la loi • est noté 1 (ou e). Dans toute la suite, (A, +, •) désigne un anneau. DÉFINITION 2. Un élément a de A est dit diviseur de 0 à droite (resp. à gauche) si a ^ 0 et s'il existe b ^ 0 tel que oh = 0 (resp. ba = 0). DÉFINITION 3. Un anneau A est dit intègre s'il est sans diviseur de zéro, autrement dit si(a^0,6^0^a6^0). DÉFINITION 4. Un élément a G A est dit nilpotent s'il existe un entier naturel non nul n tel que an = 0. L'indice (ou l'ordre) de nilpotence de a est le plus petit entier naturel non nul n tel que an = 0. DÉFINITION 5. Un sous-ensemble B de A est dit un sous-anneau de A si (B, +, •) est un anneau. Exemple 1. - Z est un anneau unitaire intègre. - Z/8Z est un anneau non intègre (2-4 = 0), clans lequel 2 est nilpotent d'indice 3. - L'ensemble des matrices carrées Mn(M), muni des opérations classiques d'addition et de multiplication de matrices, est un anneau unitaire non intègre. 3.2. Idéaux DÉFINITION 6. Soit I C A. On dit que 7 est un idéal de l'anneau A si (i) (7, +) est un sous-groupe de (A, +), (ii) V(x, a) e I x A, ax e I et xa G 7. Remarque 1. - Un idéal est un sous-anneau. - La notion d'idéal est en quelque sorte l'analogue pour les anneaux de la notion de sous-groupe distingué. En revanche, la notion de sous-anneau est beaucoup moins utilisée que la notion de sous-groupe. - Si A est commutatif et si a: G A, l'ensemble xA = {xa, a G A} est un idéal de A. - Si A est unitaire et si 1 G 7" où 7" est un idéal de A, la propriété (ii) d'un idéal entraîne que 7 = A. Si un idéal 7 de A possède un élément inversible x de A, alors 1 = x~lx G 7 d'après (ii) et donc I = A. - Lorsque 7 C A vérifie (i) et vérifie seulement ax G 7 (resp. xa G 7) pour tout (x, a) G 7 x A, on dit que 7 est un idéal à gauche (resp. à droite) de A. Si 7 est à la fois idéal à gauche et idéal à droite de A, I est donc un idéal de A (on précise parfois en disant que 7 est un idéal bilatère). Proposition 1. Une intersection d'idéaux de A est un idéal de A. Une somme finie d'idéaux de A est un idéal de A.
30 1. ARITHMÉTIQUE, GROUPES ET ANNEAUX DÉFINITION 7. Soit (A, +, •) un anneau commutatif. Un idéal I de A est dit principal s'il existe x G A tel que / = xA. On note alors I = (x). L'anneau A est dit principal s'il est commutatif, unitaire, intègre et si tous les idéaux de A sont principaux. Exemple 2. Les anneaux Z et R[X] sont principaux. -Anneatoî quotients. Comme pour les groupes, on peut définir la notion de quotient sur les anneaux. Étant donnée une relation d'équivalence 71 sur A, on cherche à faire de A/'R, un anneau en le munissant des lois x + y = x + yet x^y = x • y (où x désigne la classe de x). Si ces lois sont bien définies (c'est-à-dire que x + y et xy ne dépendent pas des représentants choisis de x et y), on dit que 11 est compatible avec la structure d'anneau. On montre que les relations d'équivalence compatibles avec la structure d'anneau sont de la forme x1Zy <=^ x — y G /, où / est un idéal de A. Si tel est le cas, A/1Z est un anneau (muni des lois définies plus haut) appelé anneau quotient et noté A/I. Exemple 3. Pour tout entier n > 0, riL est un idéal de Z et on peut définir l'anneau quotient Z/nZ. Morphismes d'anneaux. Définition 8. Soient A et A' deux anneaux. On appelle morphisme d'anneaux de A dans A' toute application / : A —► A' telle que f(x+y) = f(x)+f(y) et f(xy) = f(x)f(y) pour tous x,y G A. Lorsque / est bijective, on parle d'isomorphisme d'anneaux. L'ensemble noté Ker/ = /_1({0}) est appelé noyau de /. C'est un idéal de A qui vérifie : (/ est injective <=> Ker / = {0}). Proposition 2. Soient A et A' deux anneaux et f : A —> A' un morphisme d'anneaux. - Si I est un idéal de A et si f est surjectif, alors f(I) est un idéal de A'. - Si V est un idéal de A', f~l(I') est un idéal de A. - L'image et l'image réciproque par f d'un sous-anneau est un sous-anneau. - Le sous-anneau f(A) est isomorphe à l'anneau quotient A/Ker f. Remarque 2. La dernière assertion de la proposition est importante. C'est souvent le moyen le plus pratique pour montrer qu'un anneau est isomorphe à un anneau quotient. Caractéristique d'un anneau. Définition 9. Soit A un anneau unitaire dont l'élément neutre pour la loi • est noté e. Soit le morphisme d'anneaux / : Z —» A m-^ ne. - Si Ker / = {0}, (t. e. ne = 0 => n = 0), on dit que A est caractéristique 0. - Si Ker / ^ {0}, alors Ker / étant un idéal de l'anneau principal Z, il existe un unique entier naturel non nul c tel que Ker / = cL. L'image /(Z) est isomorphe à Z/cZ. L'entier c est aussi le plus petit entier > 0 tel que ce = 0. On dit alors que A est de caractéristique c. On a d'ailleurs ne = 0 <£=> c \ n. Proposition 3. La caractéristique d'un anneau unitaire intègre est 0 ou un nombre premier. Démonstration. Si la caractéristique c d'un anneau A unitaire intègre est non nulle et si c n'est pas premier, on peut écrire c = ab avec l<a<cetl<b<c. Donc 0 = ce = (ae)(be), et A étant intègre on en déduit ae = 0 ou be = 0, absurde car c est le plus petit entier > 0 tel que ce = 0. D 3.3. Groupe des inversibles d'un anneau unitaire On rappelle que les élément d'un anneau unitaire (A, +, •) inversibles pour la loi • sont appelés les inversibles de l'anneau A.
3. ANNEAUX 31 DÉFINITION 10. L'ensemble des inversibles d'un anneau unitaire A, muni de la loi multi- olicative, est un groupe appelé groupe des inversibles de A. Proposition 4. Soit un entier n > 2 et k un entier. L'élément k (classe de k dans nZ) est inversible dans Z/nZ si et seulement si k An= 1. THÉORÈME 1 (des Chinois). Soient m et n deux entiers naturels non nuls premiers entre eux. Les anneaux (Z/mZ) x (Z/nZ) et Z/mnZ sont isomorphes. Démonstration. On considère l'application / : Z->Z/raZxZ/nZ x ^ (x,x). C'est un morphisme d'anneaux, de noyau Ker/ = {x G Z | m | x et n | x}. Comme m An = 1, on a aussi Ker/ = {x G Z | mn \ x} = ranZ. Donc /(Z) et Z/ranZ sont isomorphes. En particulier, Card(/(Z)) = Card(Z/mnZ) = mn et donc /(Z) = Z/raZ x Z/nZ. Finalement, on vient de montrer que Z/mnZ et Z/raZ x Z/nZ sont isomorphes. □ Remarque 3. - En procédant par récurrence sur p, on montre que si n1}... ,np sont premiers entre eux deux à deux, alors Z/n\ ■ ■ • npZ et Z/n\Z x • • • x Z/npZ sont isomorphes. - La surjectivité de l'application / prouve que si m A n = 1, alors (Va, 6 G Z, 3x G Z), x = a (mod m) et a; = b (mod n). Dans la pratique, la méthode de recherche d'un tel élément x peut se faire comme suit. - On cherche u et v tels que uvn + vn = 1 grâce à l'algorithme d'Euclide (voir l'exercice 2 page 10) - Il suffit alors de prendre x = a + um(b — a) (par exemple). Indicateur d'Euler. DÉFINITION 11. Soit un entier n > 1. Notons Gn le groupe des inversibles de Z/nZ. On appelle indicateur d'Euler de n l'entier <p(n) = Card(Gn). D'après la proposition 5, <p(n) est aussi le nombre d'entiers k G {1,2, • • • ,n} tels que k An = 1. Remarque 4. En vertu de la proposition 5 page 20, le nombre de générateurs d'un groupe cyclique d'ordre n (typiquement Z/nZ) est </?(n). Théorème 1 (Euler). Soit un entier n > 1. Si k est un entier premier avec n, on a h?to = \ (modn). Démonstration. Si k A n = 1, alors k est élément du groupe Gn des inversibles de Z/nZ d'après la proposition 4. Comme l'ordre de Gn vaut </?(n), on en déduit kvW = i dans Z/nZ, d'où le résultat. □ Ce dernier résultat généralise le théorème de Fermât. Le calcul de ip(n) fait l'objet de la proposition suivante. Proposition 5. Soit n > 2 un entier, n = pj1 •••p£fc sa décomposition en facteurs premiers. Alors V(n)=Pr1.-.^'-I(Pi-l)---(pt-l) = n(l-^)---(l-^). Démonstration. Soit p un nombre premier et a G N*. Alors k n'est pas premier avec pa si et seulement si p \ k. L'ensemble des nombres de {1,2,... }pa} non premiers avec p est donc iP, 2p, 3p,..., (pa~1)p}. Ce dernier étant de cardinal pa~l, on en tire tp(pa) = pa — pa"1 (*).
32 1. ARITHMÉTIQUE, GROUPES ET ANNEAUX - Si m et n sont premiers entre eux, d'après le théorème des Chinois, Z/mZ x Z/nZ est isomorphe à Z/mnZ. En restreignant l'isomorphisme à Gm x GU} on voit que Gm x Gn est isomorphe à Gmn. Donc (p(mn) = (p(m)(p(n) (**). - Si maintenant n > 2 est un entier dont la décomposition en facteurs premiers est n = p^1 • • • p£*, on a d'après (**) cp(n) = tp(Pil) • • • ^(p£*)> d'où le résultat d'après (*). D Remarque 5. En particulier si p est un nombre premier, tp(p) = p — 1 et on retrouve le théorème de Fermât avec le théorème 2. Proposition 6. Pour tout entier n>2, on an = y*]<p(d). d\n Démonstration. Considérons les fractions 12 n-1 n n n n n Nous cherchons à les mettre sous forme irréductible ^ ou d doit nécessairement diviser n. Pour chaque d divisant n, il y a tp(d) numérateurs a possibles (puisque le nombre d'entiers a tels que a A d = 1 est y(d)). Comme il y a en tout n fractions, on en déduit le résultat. D 3.4. Exercices Exercice 1. Soit A un anneau unitaire dont l'élément neutre pour la loi • est noté 1. a) Soit x G A nilpotent. Montrer que 1 — x est inversible. b) Si n G N* (et x toujours nilpotent), simplifier l'expression n Un = (1 + x)(l + x2) • • • (1 + x2") = Y[(l + x2k). k=0 Solution, a) Soit p l'indice de nilpotence de a;, de sorte que xp = 0. On a (l-x)(l + x + --- + xp~l) = (1 + x + • • • + a?p-1)(l - x) = 1 - xp = 1, d'où le résultat car on a prouvé que xy = yx = 1 avec y = 1 + x -\ + xp~l. b) On va montrer par récurrence sur n G N que Un = {1 — x)~l {1 — x2" ). - Pour n = 0 c'est vrai car (1 - x)U0 = (1 - x)(l + x) = 1 - x2, d'où U0 = (1 - ^)_1(1 ~ ^2)- - Supposons Un-i = (1 - a:)"1^ - *2")- Alors C/n = t/„_i(l + ar2") = (1 - rr)"1^ '- *2'l+1). Remarque. Le résultat a) appliqué aux matrices carrées entraîne que si TV est une matrice nilpotente, alors I — N est inversible (ceci reste vrai dès que \\N\\ < 1 — où || • || est une norme d'algèbre sur les matrices, voir le tome analyse sur les espaces vectoriels normes). Exercice 2 (Anneau de Boole). Soit A un anneau tel que tout élément de A soit idempotent (i. e. Va; G Ayx2 = x). a) Si a; G A, montrer que 2x = 0. Montrer que A est commutatif. b) Montrer que si a:, y G A alors xy(x + y) = 0. Que dire si A est intègre ? Solution, a) Si x £ A, alors (2a:)2 = 2a; donc 4a;2 = 2a;, ce qui entraîne 4x = 2x puis 2a; = 0. Ceci s'écrit encore x = —x. Si x,y G A, (x + y)2 = x + y donc a;2 + xy + yx + y2 = x + y = x2 + î/2, d'où on tire xy -\-yx = 0, donc a;?/ = —ya; = yx. b) Si a;, y G .A, alors xy(x + y) = xyx + xy2 = a;2^/ + a;?/2 = 2xy = 0. - Si A est intègre, alors iaau plus deux éléments. En effet, sinon il existe x,y G A distincts et différents de 0. Donc (x + y) ^ 0 (sinon a; = — y = y) et A étant intègre xy(x + y) ^ 0, absurde.
3. ANNEAUX 33 EXERCICE 3 (Radical d'un idéal). Soit A un anneau commutatif unitaire et / un déal de A. On appelle radical de / l'ensemble noté y/1 = {x e A \ 3n eN*}xn e I}. a) Montrer que y/1 est un idéal de A. h) Déterminer le radical d'un idéal de Z. Solution, a) - Montrons tout d'abord que (y/1, +) est un sous-groupe de (A, +). Il est clair que 0 G y/1 puisque / C y/1. Par ailleurs, si a: G y/1 alors — x G y/1 puisque le fait que xn G / entraîne (—l)nxn = (—x)n G /. Prenons maintenant x,y G y/1. Il existe m et n G N* tels que xm £ I et yn G /. L'anneau A étant commutatif, la formule du binôme entraîne fm—\ (x + y)m+n-1 = V" £ Ckm+n_1x"y'"-1-k )+x">{ £ C£+»-i* >k=0 „fc—m,, ra+n—1—fc y et puisque / est un idéal, ce terme appartient à /. Donc x + y G \/7. - Enfin, si a G -A et si a; G y/1, il existe n G N* tel que xn G / et donc .A étant commutatif, (ax)n = an#n € -f• Donc ax G \/7. Finalement, y/1 est un idéal de A. b) Soit / un idéal de Z. L'anneau des entiers étant principal, il existe n G N* tel que / = nZ. Si n = 0, on a bien sûr \/7 = 0 et si n = 1, y/1 = Z. Sinon n > 2, et on écrit la décomposition de n en produit de facteurs premiers n = p"1 • • • p%k. Montrons que y/1 = pi • • • Pk%- - On a y/1 C p\ • • -pk^- En effet. Si x G y/1 alors il existe m G N* tel que xm G nZ, donc n | rrm, donc Vi, 1 < i < k,pi \ xm, donc Vi, 1 < i < k,pi \ x d'où p\--pk \x puisque les pi sont premiers entre eux deux à deux (ils sont premiers et distincts). - On a p\ - - - Pkl> C y/1. En effet. Soit x G p\ • • • Pk%>- H existe r G Z tel que x = p\ • • • p^r. Si m = maxi<;<fc a^, on a n = p"1 • • -p%k \ xm = p™ • • -p^rm donc xm G /, ou encore xeVl. Exercice 4 (Idéal premier, idéal maximal). Soit A un anneau commutatif unitaire. a) Un idéal V ■=/ A de A est dit premier si pour x, y G A le fait que xy G V entraîne x €V ou y €V. Montrer que V est un idéal premier si et seulement si l'anneau quotient A/V est intègre. b) Un idéal M ^ A de A est dit maximal si les seuls idéaux contenant M sont M et A. Montrer que M est un idéal maximal si et seulement si A/M est un corps. c) Montrer que tout idéal maximal est premier. d) Si l'anneau A est principal, montrer qu'un idéal premier V ■=/ {0} est maximal. Solution, a) Si a: G A, notons x sa classe dans A/V. Alors {V est premier) <==$■ (xy G V => x ou y E V) <*=> (x • y = Ô ==> x = Ô ou y = Ô) 4=> (^/P est intègre). b) Condition nécessaire. Soit M un idéal maximal. Soit x G .A tel que x (classe de x dans A/M) vérifie x ^ 0. Alors s 0 .M de sorte que M + [x) = A (en effet, / = M + (a:) est un idéal contenant M, différent de M puisque x g M, donc I = A). Donc il existe a G A et m G M tels que 1 = m + aa:, ce qui s'écrit i = àx. L'anneau A/M est donc un corps. Condition suffisante. Soit / un idéal de A tel que M C I et M ^ I. Soit a G /, a g M. On a à ,é 0 de sorte que A/A^ étant un corps, il existe b G A, àb = i. Donc il existe m G M, ab = 1 + m, d'où 1 = a& — m G i\ Donc / = A et M est maximal. c) Soit M un idéal de A maximal. L'anneau quotient A/M est un corps donc un anneau intègre, donc M est premier.
34 1. ARITHMÉTIQUE, GROUPES ET ANNEAUX d) Soit / un idéal de A tel que VcIetV^I. Comme A est principal, il existe m G V tel que V = (m) et il existe a e I} I = (a). Comme m G /, il existe q G A tel que m = aq. L'idéal V étant premier, on a a G V ou q G V. Or a 0 P sinon V = I. Donc g G P, de sorte qu'il existe p G -A tel que g = mp. Donc m = aq = amp d'où ra(l — ap) = 0 d'où ap =1 (car i4 est principal donc intègre et m ^ 0 sinon P = 0). Or ap G /, donc 1 G /, donc I = A, d'où le résultat. Exercice 5. Soit n > 2 un entier. Si a est un entier premier avec n montrer anl = 1 (mod n). Solution. D'après le théorème d'Euler, on sait que a^n) = 1 (mod n) où tp désigne l'indicateur d'Euler. Le résultat sera donc démontré si on prouve cp(n) | n!, ce qui est immédiat car (p(n) < n. Exercice 6 (Anneaux noethériens). On dit qu'un anneau commutatif unitaire A est noethérien si tout idéal I de A est engendré par un nombre fini d'éléments (i. e. il existe xu... ,Xk G / tels que (xi) + • • • + (xk) = /). Montrer que A est noethérien si et seulement s'il n'existe pas de suite d'idéaux de A strictement croissante au sens de l'inclusion. Solution. Condition nécessaire. Soit (In)neN une suite croissante d'idéaux de A. On vérifie facilement que / = UneNln est un idéal de A. Il est donc engendré par un nombre fini d'éléments rri,... yXp G /. Or chaque Xi appartient à / = Une^In et donc il existe ni tel que Xi G Inr Si N = sup1<i<pn;, la suite (In) étant croissante, tous les Xi (1 < i < p) appartiennent à 7/v, et donc / = (rri) + • • • + (rrp) C In- Par ailleurs In C / puisque / = (Jie^In. Donc In = /, ce qui entraîne que la suite (In) est stationnaire pour n> N. Condition suffisante. Soit / un idéal de A. Supposons que / ne puisse pas être engendré par un nombre fini d'éléments. Sous cette hypothèse, nous allons construire une suite (xn) d'éléments de / tels que rrn+i 0 (xi) H h (xn). - On choisit un élément x\ G /. - x\)..., xn G / étant supposés construits, on sait que (x\)-\ h (rrn) ^ / car / ne peut pas être engendré par un nombre fini d'éléments. On choisit alors rrn+i G /, rrn+i & (x\)-\ h (rrn). Ainsi, si on pose In = (x\) + • • • + (xn)} la suite (In) est une suite d'idéaux de A strictement croissante au sens de l'inclusion, ce qui est contraire aux hypothèses. Donc / peut être engendré par un nombre fini d'éléments, d'où le résultat. Remarque. Tout anneau principal est noethérien. 4. Problèmes Problème 1 (Cryptographie : le système de chiffrement RSA). On se donne deux nombres premiers p et q distincts et on pose n = pq. Soient c, d deux entiers tels que cd = 1 (mod (p(n)) où (p désigne l'indicateur d'Euler. Montrer que pour tout t G Z, on a tcd = t (modn). Solution. Les nombres p et q étant premiers et distincts, on a (p(n) = (p — l)(q — 1). Soit k £ Z tel que cd = 1 + k(p(n). Soit t G Z. Pour prouver que tcd = t (mod n), il suffit de prouver tcd = t (mod p) et tcd = t (mod q) (conséquence de Pisomorphisme de Z/pZ x Z/qZ et Z/pqZ). Prouvons par exemple tcd = t (mod p) (le calcul modulo q est analogue).
4. PROBLÈMES 35 __ Si t ap = 1 alors tp~l = 1 (mod p) (théorème de Fermât) donc tcd = (tp-l)k^-lh = t (mod p). - Si t A p 7^ 1) alors p divise £, et alors on a tcd = t = 0 (mod p). Remarque. L'application g : Z/nZ —» Z/nZ i i-> £c s'appelle une fonction de c/w/- frernent, f : i *-^ id fonction de déchiffrement L'exercice affirme que f o g(i) = i. On peut donc chiffrer un message (représenté par un élément i de Z/nZ) avec #, puis on le déchiffre avec /. Le couple (n, c) est appelé la c/e/ publique, l'entier d la c/e/ secrète. La sécurité de ce système repose sur le fait que connaissant la clef publique, il est très difficile de déterminer d : un moyen consiste par exemple à factoriser n pour trouver p et q, ce qui est encore impossible à réaliser lorsque p et q sont grands, typiquement (pour l'année 2007) de l'ordre de 150 chiffres (le record est la factorisation d'un nombre entier sans forme particulière de 200 chiffres, obtenue en 2005 après une petite centaine d'année de calcul distribué). En d'autres termes, tout le monde peut chiffrer mais seuls ceux connaissant la clef secrète peuvent déchiffrer. Ce système de chiffrement est apparu en 1976. Il est appelé RSA (du nom des inventeurs Rivest, Shamir et Adleman) et est couramment utilisé aujourd'hui car il est extrêmement robuste. Son apparition explique l'intérêt que l'on porte aujourd'hui aux algorithmes de factorisation et de primalité. Problème 2 (Nombres pseudo-premiers et nombres de Carmichael). Le théorème de Fermât affirme que si n est premier et si a A n = 1, alors an_1 = 1 (mod n). Le but du problème est d'étudier la réciproque. 1/ (Nombres pseudo-premiers). Soit un entier a > 2. Un entier n est dit pseudo-premier en base a (ce que l'on note brièvement pp-a) si n n'est pas premier et si on_1 = 1 (mod n). Si p > 2 est un nombre premier ne divisant pas a (a2 — 1), montrer que n = (o2p — l)/(a2 — 1) est un nombre pp-a. En déduire qu'il existe une infinité de nombres pp-a. 2/ (Nombres de Carmichael). Un entier n > 2 est appelé nombre de Carmichael si n n'est pas un nombre premier et si pour tout entier o, an = a (mod n) (en particulier, pour tout entier a premier avec n, n est pp-a). a) Si n = pi • • • pk (où les pi sont des nombres premiers distincts) et si pi — 1 | n — 1 pour tout i, montrer que n est un nombre de Carmichael. b) Réciproquement, montrer que tout nombre de Carmichael peut se mettre sous la forme n=pi- • -pk où les pi sont des nombres premiers distincts et où pi — 1 | n — 1 pour tout i. (Indication : On pourra utiliser le fait que si p est premier, le groupe multiplicatif (Z/pZ)* est cyclique — voir la remarque de l'exercice 10 page 26). c) Montrer qu'un nombre de Carmichael a au moins 3 facteurs premiers. d) Soit n = pqr un nombre de Carmichael à trois facteurs premiers p < q < r. Si p est fixé, montrer que g et r sont bornés. Solution. 1/ Remarquons tout d'abord que n = (^Er)(^+r) = (aP_1 + • • • + a + 1) • K_1 - ap~ + • • • — a + 1) est un entier composé. Ceci étant, on a a2p = 1 + n(a2 — 1), de sorte que a p = 1 (mod n) (*). Le résultat sera donc acquis si on montre que 2p | n — 1. On a (a2 - l)(n - 1) = a2p - a2 = a{ap-1 - l)(ap + a). D'après le théorème de Fermât, p | (ap_1 — 1) puisque par hypothèse p ne divise pas a. On a donc P\ (a — l)(n — 1). Or p ne divise pas a2 — 1, donc p est premier avec a2 — 1 (car p est premier) et d'après le théorème de Gauss, p\n — 1. Orn — 1 = a2p~2 H h a4 + a2 est une somme paire de termes de même parité, donc 2 | n — 1. Comme 2 et p sont premiers entre eux, on en déduit 2p | n — 1, donc n est pp-a d'après (*).
36 1. ARITHMÉTIQUE, GROUPES ET ANNEAUX Il n'y a qu'un nombre fini de nombres premiers p divisant a(a2 — 1). Comme il y a une infinité de nombres premiers, on en déduit qu'il y a une infinité de nombres premiers p > 2 ne divisant pas a(a2 — 1), donc une infinité de nombres pp-a. 2/ a) Soit a un entier et soit z, 1 < i < k. Si pi \ a, le théorème de Fermât entraîne aPi~l = 1 (mod pi)} et comme pi — 1 divise n — 1, on en déduit an~1 = 1 (mod pi)} donc an = a (mod pi). Cette dernière égalité reste évidemment vraie si pi \ a. Ainsi, pour tout entier a on a montré an = a (mod pi). Ceci s'écrit aussi pi \ (an — a). Ceci étant vrai pour tout z, on en déduit n = pi • • • p/- | (an — a) puisque les pi sont premiers entre eux deux à deux. On a donc bien an = a (mod n). b) Soit n un nombre de Carmichael et p un nombre premier divisant n. Comme n est un nombre de Carmichael, n divise pn — p, et comme p2 \ pn — p (car n > 2), on en déduit p2 \ n. - On peut donc écrire n = p\ • • • p^, où les pi sont des nombres premiers distincts. Soit z, 1 < i < k. Il est bien connu que (Z/piZ)* est un groupe cyclique, donc il existe un entier a tel que à soit d'ordre pi — 1 dans (Z/p;Z)*. Comme n est un nombre de Carmichael, on a n | an — a donc Pi | an — a, ou encore an = a (mod p;). Comme à G (Z/p^Z)*, on en déduit an_1 = 1 (mod pi). Or l'ordre à dans (Z/p^Z)* est p^ — 1, donc p^ — 1 | n — 1. Ceci est vrai pour tout z, d'où le résultat. c) Supposons que n = (a + 1)(6 + 1) soit un nombre de Carmichael avec a + 1 et b + 1 premiers et a 7^ 6. On a n = a6 + o + 6 + 1. Or a | n — 1 donc a | 6 = (n — 1 — a& — a) ; de même b \ a. Donc a = 6, ce qui impossible d'après la question précédente. d) Comme n est un nombre de Carmichael, onag- l|n — 1, et donc q — 1 | (n — 1) — (g — 1) = g(pr — 1). Or g A (g — 1) = 1 donc d'après le théorème de Gauss, q — 1 | pr — 1. De même r - 1 | pq — 1, donc finalement (q - l)(r - 1) | (pr — l)(pq — 1). Ceci entraîne (q - l)(r - 1) | (pr - l)(pg - 1) -p2(q - l)(r - 1) = p2(r + g) -p(r + g) + 1 -p2, d'où on tire (g — l)(r — 1) < p2(r + g). Comme g < r, on a donc (q — l)2 < 2p2r (*). Nous avons vu plus haut que r — 1 | pq — 1, ce qui entraîne r <pq donc r2 < p2g2, et d'après (*) r2 < p24p2r} donc r < 4p4. En remplaçant cette dernière inégalité dans (*) on tombe sur q < >/8p3 + 1. En résumé, on a prouvé que q < \/8p3 + 1 et r < 4p4. Donc si p est fixé, q et r sont bornés. Remarque. Le plus petit nombre de Carmichael est 561 = 3-11-17. Les suivants sont 1105, 1729, 2465, 2821. - On sait depuis 1992 qu'il existe une infinité de nombres de Carmichael, et que si x est assez grand, il y a au moins x2^ nombres de Carmichael inférieurs à x. Problème 3 (Quelques tests de primalité). a) Soit un entier n > 2 vérifiant 3a G Z, (an_1 = 1 (mod n) et Vç | n — 1, ç premier, aq ^ 1 (mod n)). Montrer que n est un nombre premier. b) Soit n > 2 un entier, n— 1 = p*1 • • -p£* la décomposition en facteurs premiers de n— 1. On suppose que pour tout z, 1 < i < /c, il existe un entier ai tel que a^-l = l (mod n) et a\n~1)/Pi ^ 1 (mod n). Montrer que n est un nombre premier. c) Soit p > 2 premier, et soit h G N tel que 1 < h < p — 1. On pose n = 1 + hp2. Si 2n-1EEl (mod n) et 2/l ^ 1 (modn), montrer que n est premier. (Indication : utiliser l'ordre de 2 pour montrer qu'il existe un nombre premier q divisant n avec p | q — 1.)
4. PROBLÈMES 37 Solution, a) Soit m Tordre de à dans le groupe des inversibles de Z/nZ. Nous allons montrer nue m = n — 1- Supposons m < n — 1. Comme an_1 = 1 (mod n), m | n — 1 et donc il existe un nombre premier q divisant n - 1 tel que m | (n - l)/g. Ceci entraîne que a^n~l^q = 1 (mod n), ce qui est contraire aux hypothèses. Donc m = n — 1, ce qui prouve que le groupe des inversibles de Z/nZ admet au moins n — 1 éléments, ce qui n'est possible que si n est premier. D'où le résultat. b) Pour tout z, notons m* l'ordre de à{ dans le groupe des inversibles de Z/nZ. Comme a™-1 = 1 (mod n), on a m; | n — 1 = rijP^- Comme de plus a\n~ ),Vl ^ 1 (mod n), on a aussi m- \ Vai~~l Ilj&Pj* ' ^es relati°ns concernant m; permettent d'affirmer que p?1" | m;, et donc p?1 I </>(n) (°ù ^ désigne l'indicateur d'Euler) puisque l'ordre de ai divise l'ordre du groupe des inversibles de Z/nZ qui est (p(n). Ceci étant vrai pour tout z, on en déduit, les pi étant premiers distincts, que n — 1 = riiPf1' I ^(n)> donc °llie ^(n) > ^ — 1- Donc le groupe des inversibles de ZlnL comporte au moins n — 1 éléments, ce qui n'est possible que si n est premier. c) Soit m l'ordre de 2 dans le groupe des inversibles de Z/nZ. On a 2n_1 = 1 (mod n) donc m | n _ i = frp2. Or 2/l ^ 1 (mod n) donc m \ h. Finalement, p \ m (si p \ m, alors p étant premier m Ap2 = 1 et donc m | /i d'après le théorème de Gauss). Comme m divise l'ordre du groupe des inversibles de Z/nZ qui est <£>(n), on en déduit p \ (p(n) (*). Si n = Pi1 • • • p£* désigne la décomposition de n en facteurs premiers, on sait que (p(n) = Pi1"1 • • •Pfc*~1(Pi -I)'" (Pfc - 1). Comme p \ n = 1 + hp2, on a p ^ p; pour tout z donc il existe d'après (*) un indice i tel que p | pi — 1. Autrement dit, il existe un facteur premier q de n tel que q = 1 (mod p). Soit r l'entier vérifiant qr = n. On a qr = n = 1 + /ip2 = 1 (mod p), donc r = 1 (mod p). En résumé, on a montré qu'il existe q premier, q \ n et r entier tels que qr = n avec q=l + up, r = 1 + vp, u} v G N. Le nombre q étant premier on a d'ailleurs u > 2 (si u = 0, ç = 1 et si u = 1, g est pair). Supposons r > 1. Alors v > 1. Or on a 1 + /ip2 = n = qr = (1 + up)(l + i>p) donc hp = (uv)p + (u + v), ce qui entraîne (i) uv < h < p — 1 et (ii) (u + v)>p car p | (u + i>) ^ 0. Comme u > 2, (i) entraîne i> < (p — l)/2, et d'après (ii) u > 1 +p/2, donc toujours d'après (i), ?; < (p — 1)/(1 + f ) < 2. Finalement v = 1, ce qui est absurde car (i) entraînerait u < p — 1 et (ii) entraînerait u > p — 1. On a donc forcément r = 1, ce qui entraîne que n = q est premier. Remarque. Le test c) fut utilisé avec le nombre premier p = 2127 — 1 pour montrer que n = 1 + 190p2 est premier (Miller et Wheeler, 1951). Les tests de primalité de ce type permettent d'obtenir des nombres premiers ayant une forme particulière. Un problème beaucoup plus délicat est de savoir si un nombre donné n est premier ou pas ; en 2007, le record est la preuve de primalité d'un nombre d'un peu plus de 20000 chiffres sans forme particulière a priori Problème 4 (Quelques cas particuliers du théorème de Dirichlet). 1/ a) Soit p > 2 un nombre premier. Montrer que —1 est un carré dans Z/pZ si et seulement si p = 1 (mod 4). b) En déduire qu'il existe une infinité de nombres premiers de la forme 1 + 4n, n G N. 2/ (Un résultat plus général). Soient un nombre premier p > 2 et un entier m > 1. Montrer que l'ensemble Vm des nombres premiers de la forme l + 2mpn (n G N), est infini. (Indication. Si Vm est fini, considérer un nombre premier q divisant (Mp + 1)/(M + 1) où M = K2m~\ K = p(Y\neVm n), et montrer que q G Vm).
38 1. ARITHMÉTIQUE, GROUPES ET ANNEAUX Solution. 1/ a) Condition nécessaire. Supposons qu'il existe x G Z/pZ, x2 = — 1. Le groupe multiplicatif (Z/pZ)* étant d'ordre p — 1 (car p est premier), on a xp~l = ï. Donc (x2)^p~1^2 = (_l)(p-i)/2 _ i^ ce qUj n'est possible que si (p — l)/2 est pair. D'où la condition nécessaire. Condition suffisante. C'est plus difficile. Donnons deux méthodes. - Première méthode. Comme p est premier, Z/pZ est un corps. L'équation x^p~1^2 = ï a donc au plus (p — l)/2 solutions dans Z/pZ. Comme (Z/pZ)* contient p — 1 > (p — l)/2 éléments, il_existe x G (Z/pZ)*_tel que y_= x^-1)/2 ^ 1 On a y2 = xp~l = ï donc (y — l)(y + 1) = 0, donc y = — 1 (car y ^ 1). Or p = 1 (mod 4), donc il existe un entier k tel que (p - l)/2 = 2k. Si z = xk} on a donc z2 = x2k = x^~1^2 = y = -ï, d'où le résultat. - Seconde méthode (cette méthode est moins générale que la précédente). Soit l'entier k tel que p = 1 + 4k. Comme p est premier, on a d'après le théorème de Wilson 1 • 2• • • (2k) • (2fc + 1) • • • (4k - 1) • (4k) = -1 (mod 4k + 1), ce qui s'écrit aussi 1 • 2 • • • (2k) • (-2fc) • • • (-1) = -1 (mod p) ou encore (_l)2fe(! . 2... (2fc))2 = -1 (mod p). Si on pose a; = 1 • 2 • • • (2k), ceci s'écrit âT2 = — 1 dans Z/pZ, d'où le résultat. b) Supposons qu'il y ait un nombre fini de nombres premiers de la forme 4k + l,k G N. Soit p le plus grand d'entre eux et soit N = 1 + (p!)2. Soit un nombre premier q divisant N. Alors (p!)2 = —1 (mod q), donc —1 est un carré dans Z/qZ et donc q est de la forme 4k + l,k G N d'après a). Donc q < p, donc ç | p!, donc q \ 1 = AT — (p!)2, ce qui est absurde. Il y a donc une infinité de nombres premiers de la forme 4k + 1, fc G N. 2/ Supposons T^m fini. Suivons l'indication en considérant l'entier N = (Mp + 1)/(M + 1) = M?"1 - MP-2 + M + 1 avec M = K2"1'1 où K = p(T[neVm n). Comme N > 1, il existe un nombre premier q divisant N. On a Mp + 1 = 0 (mod q) donc K2m~lp = Mp = -1 (mod?) et tf2"^ = 1 (mod q). L'égalité de droite montre que l'ordre r de K dans le groupe multiplicatif (Z/qZ)* divise 2mp. L'égalité de gauche montre que r \ 2m~1p. Comme p est premier, on a donc r = 2m ou r = 2mp. Si r = 2m, comme N divise /»r2xp-l nr2 , M2p - 1 Mp - 1 Mp + l (M2)p l + • • • + M2 + 1 = —= = — rr—r v/ M2 -1 M-1M+1 et que M2 = K2"1 = 1 (mod g), on a 0 = (M2)p~l + • • • + M2 + 1 = p (mod g) donc g | p, donc g | M, ce qui est absurde vu que q | Mp + 1. Ainsi, r = 2mp et comme l'ordre de tout élément de (Z/qZ)* divise q — 1, on a 2mp | g — 1 c'est-à-dire q G "Pm. Ceci entraîne q \ M ce qui est impossible. L'ensemble Vm est donc infini. Remarque. Ces résultats sont des cas particuliers du théorème de Dirichlet (voir la remarque qui suit l'exercice 6 page 12). D'autres formes particulières du théorème de Dirichlet font l'objet du sujet d'étude 2 page 46 ou du problème 10 page 92. Problème 5 (Anneaux euclidiens). 1/ Soit A un anneau commutatif unitaire intègre. On dit que A est euclidien s'il existe une application / : A* = A \ {0} —> N telle que (i)Vx,ye^*, f(xy)>f(y), (ii) Va G A, V6 G A*, 3(q,r) e A2, tel que a = bq + r, avec r = 0 ou f(r) < f(b).
4. PROBLÈMES a) Si A est euclidien, montrer que A est principal. b) Si l'application / vérifie l'hypothèse supplémentaire (iii) Vz,y eA\x^ y, f(x -y)< sup{/(x),/(?/)}, montrer que le couple (#, r) dans (ii) est unique. c) Caractériser les éléments inversibles d'un anneau unitaire euclidien. 2/ Soit Vanneau des entiers de Gauss Z[i] = {x + iy | (x,y) G Z2}. a) Montrer que si z G C, il existe z0 G Z[i] tel que \z — z0\ < 1. b) En déduire que Z[i] est un anneau principal. c) Quels sont les inversibles de Z[i] ? Solution. 1/ a) Soit i" un idéal de A. Si I = {0}, / est évidemment principal. Si / ^ {0}, on considère l'ensemble T = {f(x) \ x G /*} C N. Soit a G I* tel que f(a) = inf F. Prenons maintenant un élément x e I. D'après (ii), 3(<7,r) G A2, (x = aq + r avec /(r) < f(a) ou r = 0). Remarquons que r = x — aq G /. Si r ^ 0, alors /(r) < /(a) ce qui est absurde puisque r e I* et f[a) = inf T. Donc r = 0, donc x = ag. On vient de montrer que / C (a). Réciproquement, comme a G /, on a (a) C I. Donc / = (a) et A est principal. b) Soit (a,6) G ^ x A*. Soient deux couples (g,r) et (</,r') vérifiant (ii) pour (a,6). L'égalité jjq + r = bq' + r' s'écrit aussi b(q — q') = r' — r. Si q ^ q', on a r' — r ^ 0 et /(&) < /[&(# — g')] = f{r' — r) (*). Si r = 0 (le cas r' = 0 se traite en échangeant les rôles de (g,r) et (</,r')), (*) entraîne /(&) < /(r') < /(&), ce qui est absurde. Si r ^ 0 et r' ^ 0, alors (*) entraîne f{b) < sup{/(r),/(r/)} < /(&), ce qui est également absurde. On a donc forcément q = q' et donc r = r'. c) Soit a = inf{/(x) \ x e A*}. Nous allons montrer que x e A* est inversible si et seulement si f(x) = oc. Condition nécessaire. Si x est inversible, alors il existe y G A*} xy = 1. Donc Vz G ^4*, /(z) = f[x(yz)] > f(x) d'après (i), donc f(x) = a. Condition suffisante. Appliquant (ii) à (a, b) = (1,#), on voit qu'il existe (q, r) G A2 tel que 1 = bx + r avec r = 0 ou /(r) < f(x). Cette dernière assertion est impossible car f(x) = a, donc r = 0 et donc bx = 1. L'élément # est donc inversible (on a aussi xb = 1 car .A est commutatif). 2/ a) Soit ^ = x + Ï2/ G C, (x, y) G R2. En désignant par #o,2/o e ^ les entiers les phis proches de x et y, on & \x — xo\ < 1/2 et \y — yo\ < 1/2. Ainsi l'entier de Gauss zq = xq + m/o G Z[z] vérifie |z - z0\2 = (x - x0)2 + {y - yo)2 < 1/2, donc \z - z0\ < 1. b) D'après le résultat de la question 1/a), il suffit de montrer que Z[i] est euclidien. Soit (a, 6) G 1i[i] x Z[i]*. D'après la question précédente, il existe q G Z[i] tel que \q — a/b\ < 1. En posant r = a — bq, on a donc a = bq + r avec |r| = |6||a/6 — q\ < \b\, ce qui montre qu'en prenant f{z) = \z\2 = x2 + y2 pour z = x + iy e Z[ï\*, (ii) est vérifié. Or pour tout x G Z[z]*, /(z) > 1, donc Vy G Z[z]*, f(xy) = f{x)f(y) > f(y). La condition (i) est donc vérifiée. Finalement, Z[i] est euclidien. c) D'après 1/c), les inversibles de Z[i] sont les éléments z vérifiant f(z) = \z\2 = 1. Ce sont donc 1, -1, i et — i. Remarque. Les anneaux euclidiens généralisent les propriétés de la division euclidienne des anneaux Z et K[X] (on a f(x) = \x\ pour Z et f(P) = deg(P) pour K[X]). Problème 6. Soit G un groupe fini tel que pour tout entier d > 1, l'équation xd = e (où e désigne le neutre de G) a au plus d solutions dans G. Montrer que G est un groupe cyclique.
40 1. ARITHMÉTIQUE, GROUPES ET ANNEAUX Solution. Notons n Tordre du groupe G. Pour tout entier d divisant n, notons ^d l'ensemble des éléments de G d'ordre d. L'ordre de tout élément de G divise n, donc la famille (^d)d\n forme une partition de G. Si ipd = Card(^d), on a donc Y^d\n ^d = n (*)• Nous allons maintenant montrer que si d | n, ipd < <f{d) (**) où (p désigne l'indicateur d'Euler. Si Vd = 0, c'est terminé. Sinon ipd > 1 et donc il existe rro £ ^d- Tous les éléments x de (rro) vérifient alors xd = 1. Or (rro) a d éléments et l'équation xd = e a au plus d solutions. Les éléments qui vérifient xd = e sont donc les éléments de (rro). Donc ^d C (rro) et ^d correspond donc à l'ensemble des générateurs de (rro) qui* d'après la proposition 5 page 20, est de cardinal ip(d). Donc îpd = <p(d), d'où (**). Or Z)din^(^) = n (v0*r proposition 6 page 32). De (*) et (**) on en déduit que pour tout diviseur d de n, on a Vd = <p(d). En particulier Vn = <p(n) > 0, donc il existe au moins un élément d'ordre n, d'où le résultat. Remarque. Il découle de ce problème le résultat annoncé dans la remarque de l'exercice 10 page 26. Problème 7 (Théorème de Sylow). a) Soit G un groupe abélien fini. Soit p un nombre premier divisant l'ordre de G. Montrer qu'il existe un sous-groupe de G d'ordre p (sans utiliser le résultat de l'exercice 10 page 26 ou de l'exercice 12 page 28). b) Soit G un groupe fini d'ordre /i, non supposé abélien. Démontrer le théorème de Sylow : Si pa | h où p est un nombre premier et a G N, alors il existe un sous-groupe de G d'ordre pa. (Indication : on pourra procéder par récurrence sur Card(Gf) en utilisant l'équation aux classes — voir le théorème 8 page 22.) Solution, a) On procède de manière analogue à la question c) de l'exercice 10 page 26. G étant fini, il existe un système de générateurs (#i,..., xn) de G. Notons ri,..., rn les ordres de x\}..., xn. Considérons l'application (p : (xi) x • • • x (xn) -> G (î/i,...,2/n) »-> 3/1 • • • 3/n- Le groupe G étant abélien, <p est un morphisme de groupes. De plus, (p étant surjectif (puisque (rri,... ,rrn) est un système de générateurs de G), G est isomorphe à ((rri) x • • • x (rrn))/Ker y>, donc Card(G) x Card(Kery>) = Card((rri) x ••• x (xn)) = ri---rn, donc Card(G) | ri---rn. Donc p | ri • • • rn, donc il existe ri tel que p \ ri. Si ri = pqy q G N*, alors x = x\ est d'ordre p et H = (x) est un sous-groupe de G d'ordre p. b) Procédons par récurrence sur h = Card(G). - Si Card(G) = 1, c'est évident. - Sinon, supposons le résultat vrai pour les groupes d'ordres < h = Card(G). Si a = 0, c'est évident, sinon a > 1. D'après le théorème 8 page 22 il existe une famille finie (Hi)iej de sous- groupes stricts de G telle que h = Card(G) = Card(2(G)) + E cJ^- M Deux cas se présentent : - Il existe i e I tel que pa \ Card(jF/;). Comme Card(jHrf) < Card(G), d'après l'hypothèse de récurrence il existe un sous-groupe H de Hi d'ordre pa. Ainsi H est un sous-groupe de G d'ordre pa. - Pour tout i e I) pa \ C&rd(Hi). Comme pa \ /i, p divise h/C&rd(Hi) pour tout i € L D'après l'équation aux classes (*), on a donc p \ Card(Z(G)), et Z{G) étant un groupe commutatif, il existe un sous-groupe C de Z(G) d'ordre p d'après a). Comme C C 2(G)} C est distingué dans G. Soit n la surjection canonique de G dans G/C. L'ordre du groupe quotient G/C est Card(G)/Card(C) = h/p <h = Card(G) et comme pa~l \ Card(G/C),
4. PROBLÈMES 41 on sait d'après l'hypothèse de récurrence qu'il existe un sous-groupe Hf de G/C d'ordre p"-1. Le sous-groupe H = ^~l{Hr) est donc d'ordre Card(C)Card(///) = pa. D'où le résultat. PROBLEME 8. Soit G un groupe fini et H un sous-groupe de G. On suppose que Card(G) = pCaxd(H) où p est le plus petit facteur premier de Card(Gf). Montrer que H est distingué dansj^j Solution. Considérons la relation d'équivalence sur G définie par xlZy <=> x~ly G H. La classe d'équivalence d'un élément x G G est de la forme x = xH (classe à gauche suivant H). Notons X l'ensemble quotient G/71. Pour les mêmes raisons que dans la démonstration du théorème de Lagrange, Card(X) = Caxd(G)/Caxd(H) = p. Fixons g € G. Pour tout x G G la classe ~gx ne dépend pas du représentant x de x car xUy => x~ly G H => (gx)~l(gy) = rr"1?/ G # => ^cft^y. Ainsi, l'application cry : X —> X x ^-^'gx est bien définie, et il est facile de vérifier que c'est une permutation de X. Comme aQQi — agoafg, l'application (p : G —> S g *-* crg (où S désigne le groupe des permutations de X) est un morphisme de groupes. On en déduit que Im</> est isomorphe à G/Kertp, donc que Card(Im^) = Card(G)/Card(Kery>). De plus limp est un sous-groupe de <S, donc Card(Im^) | Card(«S) = p\. Finalement, Card(G) Card(Kerp) ' P' ' Comme p est premier et que c'est le plus petit facteur premier de Card(G), on en déduit facilement que Card(G)/Card(Kery>) divise p. Ainsi, Card(Kery>) > Card(G)/p = Card(iï). Un peu d'attention montre que Kerip = {</ G G | Va; G G, x~lgx G #}, (*) en particulier Kenp C H. Comme Card(Kery>) > Card(iï), ceci entraîne Kenp = H. D'après (*), ceci s'écrit Vg G if,Va; G G, x~lgx G H, c'est-à-dire que H est distingué dans G. Problème 9.1/ Soit G un groupe. Si A C G, on note A' = {x e G | Va G A, ax = xa}. a) Si A c G, montrer que A' est un sous-groupe de G. b) Soit Z) un sous-groupe de G distingué dans G. On note A(D) le groupe des automor- phismes de D. a) Montrer que D' est distingué dans G et que G/D' est isomorphe à un sous-groupe de A(D). (3) Si D est d'ordre m premier, montrer que A(D) est isomorphe au groupe multiplicatif (Z/mZ)*. 2/ Soit G un groupe fini non abélien d'ordre pq, où p et q sont des nombres premiers, avec p < q. On note e le neutre de G. a) Montrer que le centre Z(G) de G est réduit à {e}. b) Montrer qu'il existe clans G au moins un sous-groupe d'ordre q (on pourra utiliser "équation aux classes, voir le théorème 8 page 22). c) Montrer qu'il n'existe qu'un seul sous-groupe K de G d'ordre g, et que K est distingué
42 1. ARITHMÉTIQUE, GROUPES ET ANNEAUX dans G. d) Montrer que K = K1 puis que p | (q — 1). 3/ Soit G un groupe d'ordre pq avec p et q premiers, p < q et p\ (q — 1). Montrer que G est cyclique (on pourra utiliser le résultat a) du problème 7 page 40). Solution. 1/ a) On a e G A!. Par ailleurs, si rc G A\ alors pour tout a € A} ax = xa donc en multipliant à gauche et à droite par rc-1, x~la = ax~l. Ainsi, x~l G A!. Il ne reste plus qu'à montrer que si x}y G -A', alors rcy G -A', ce qui est le cas car si a G -A, a(xy) = (ax)y = (xa)y = x(ay) = x(ya) = (xy)a. b) a) Soient x G G et y G IX Le sous-groupe 1} étant distingué dans G} on a, x^ax £ D pour tout a e Dy donc (rc-1^)?/ = ^(a;"1^), ce qui entraîne a(xyx~l) = (xyx~l)a et ceci pour tout a G D} donc xyx~l G £>', ce qui prouve que Dr est distingué dans G. - Pour tout a G G, on note tpa : D —> G x >-> (pa(x) = axa~l. C'est un morphisme injectif, et D étant distingué dans G> tpa est une bijection de D sur D. Autrement dit, tpa est un automorphisme de D. Notons A! = {(pa \ a e G}. C'est un sous-groupe de A(D) pour la loi de composition. Soit / : G —> A! a >—> cpa. L'application / est un morphisme de groupe surjectif. Par ailleurs, Ker/ = {a G G | Vrc G D} (pa{x) = x} = D'y donc G/Ker / = G/Df est isomorphe à A\ qui est un sous-groupe de A(D). P) L'ordre de D étant un nombre premier, D est cyclique donc il existe xq G D tel que D = (xq). Pour tout entier p, m \ p, on note y>p : D —> D x \-+ xv. Comme 1} est abélien (car cyclique), ipp est un morphisme de groupe. Or si xp = e alors x = e (sinon x est d'ordre m donc m | p, contradictoire). En d'autres termes, Ker tpp = {e}. Le morphisme (pp est donc injectif, donc bijectif (<pp va de D dans D et D est fini). En résumé, on a montré que tpp G A(D). - Soit / : (Z/mZ)* -> 4(2?) p »-> </V / est bien une application (si p = q} alors m | (p — g) donc tpp = (pq). f est un morphisme de groupe : (ppq = (pp o <pq. f est injective. En effet, si p G Ker /, alors tpp =Id£> donc Xq = xq donc p = 1 (mod m). Ainsi, Ker/ = {i}. / est surjective. En effet. Soit (p G A(D). Alors il existe p, 1 < p < m — 1, tel que <^(#o) = ^o (car si ^>{xq) = e alors Vfc, <^(#o) = e e^ V> n'est pas bijective). Soit y G i?. Il existe g G Z, y = £q, donc y>(y) = (p(xq0) = (p(x0)q = xvQq = yp. Donc <p = <pp = f(p). f est donc un isomorphisme, d'où le résultat. 2/ a) Soit pi l'ordre de Z(G). Supposons p\ > 1. L'ensemble Z{G) est un sous-groupe de G donc pi | pq = Card(Cr) donc p\ G {p, g} car G n'est pas abélien. Le centre de G est distingué dans G, et le groupe quotient G/Z{G) est d'ordre pq/pu donc premier, donc cyclique. Soit a e G tel que à (la classe de a dans G/Z(G)) engendre G/Z{G). Si x e G> il existe un entier n tel que à = ân, autrement dit il existe y G -Z(G) tel que x = yan. On voit donc que x commute avec a, et ceci pour tout x e G. Donc a G Z(G), donc à = é, ce qui est absurde puisque à engendre G/Z(G) ï {é}. Donc Pl = 1. b) D'après le théorème 8 page 22, il existe une famille finie de sous-groupes stricts (Hi)iei de G telle que w = Card(G) = Card(2(G)) + £^|^. S'il n'existe aucun sous-groupe de G d'ordre q} alors pour tout i on a forcément Caxd(Hi) = P (car Card(jHi) | pq} ^ 1, ^ pq et ^ g). L'équation aux classes s'écrit donc pg = 1 + gCard(J), donc 1 = q(p — Card(J)), absurde. Il existe donc au moins un sous-groupe de G d'ordre q. c) Supposons qu'il existe deux sous-groupes distincts K\ et K2 d'ordre q. Alors KiD K2 = {e} (car Ki n K2 est un sous-groupe de K\} son cardinal divise donc q} donc vaut 1 ou q — car q est premier . Si son ordre est q} c'est que K\ = K2). L'application / : K\xK2 —> G {x\,x<i) »-> x\Xi est donc injective (si x\X2 = 2/12/2> alors xjf 1yi = X2y^} G 7<i Pl i^2 donc x\xy\ = x^y^} = 6)-
5. SUJETS D'ÉTUDE 43 Donc Card(G) > Cardai x K2) = q2, absurde car p < q. Il n'y a donc qu'un seul sous-groupe % d'ordre q. - Montrons que K est distingué dans G. Si x G K et si a G G, alors (axa~1)q = axqa~l = aea~l = e, donc arca-1 est d'ordre q ou 1 (g est premier), donc arca-1 G K d'après l'unicité d'un sous-groupe d'ordre q. Le sous-groupe K est donc distingué dans G. d) Le sous-groupe K étant cyclique (car d'ordre q premier), il est commutatif. Donc K C K'. Or K' est un sous-groupe de G, donc Card(JftT/) | pç. Or Card(Ar/) > Caxd(K) = q > p> 1 donc Card(i^') G {<7,p<7}. Si Card(JK'') = pq, c'est que K' = G et en retournant à la définition de K'> ceci entraîne K C £((?) = {e}, ce qui est absurde. Donc Ca,rd(K') = qy donc K = K'. -D'après 1/b), K' = K étant distingué dans G, G/K' est isomorphe à un sous-groupe de A(K). Donc p = Ca,rd(G)/K divise Cavd(A(K)). Or d'après 1/b)/?), A{K) est isomorphe à {Z/qLf. Donc Card(^l(K)) = q - 1, donc p | (q - 1). 3/ Comme p \ q — 1, G est abélien d'après 2/. D'après la question a) du problème précédent, on peut donc trouver deux sous-groupes H\ et #2 de G d'ordre p et q. Les nombres p et q étant premiers, #1 et Hi sont cycliques et donc il existe x E H\ d'ordre p et y G #2 d'ordre g. L'élément z = xy est alors d'ordre pç (si zm = e alors £m = y-m donc xmq = e donc p \ mq donc p | m d'après le théorème de Gauss ; de même q \ m donc pq | m), donc G = (z) est cyclique. Remarque. Le résultat de cet exercice est un cas particulier du résultat suivant : si G est un groupe fini d'ordre n et si n et </?(n) sont premiers entre eux (où <p désigne l'indicateur d'Euler), alors G est cyclique. 5. Sujets d'étude Sujet d'étude 1 (Théorème de Tchébycheff). Pour tout x g M, on note [x] sa partie entière. Si n > 2, on note V(ri) l'ensemble des nombres premiers < n, et 7r(n) = Card(P(n)). Enfin, si n G N* et si p est un nombre premier, on note vp(n) le plus grand entier naturel a tel que pa \ n (valuation p-adique de n). 1/ Montrer que si n est un entier, n > 2, on a 2/ a) Si A; G N*, montrer C%k+1 < 4k. b) En déduire que pour n > 2, Pn = Ylp€V(n) < 4n. 3/ Montrer que si n > 14, 7r(n) < n/2 — 1. 4/ Si n G iV et p est premier, montrer 00 vp(n\) = J2 i=l n pi 5/ Soient p un nombre premier. Montrer que pr < 2n, où r = VpCCJJ. En déduire 6/ Soit n > 2. Soit p premier, 2n/3 < p < n. Montrer que p \ CJn. 7/ Soit n > 2. On note P = V(2n) \ P(n) et #n = ElpepP- Si n > 98, montrer 471/3 = < i?n < (2n)7r(2n)"7r(n). 2^(2n)VW2 8/ Si rc G E, x > 7, montrer que 2* > 18x. Si x > 5, montrer que 2X > 6x. En déduire que si n G N, n > 450, .Rn > 2rc.
44 1. ARITHMÉTIQUE, GROUPES ET ANNEAUX 9/ a) Montrer que si n G N, n > 5, il existe au moins deux nombres premiers p tels que n < p < 2n. b) En déduire le théorème de Tchébycheff : Si n est un entier, n > 4, alors il existe au moins un nombre premier p vérifiant n < p < 2n — 2. Solution. 1/ La majoration de C^n est une conséquence de l'identité du binôme, qui entraîne 2n C2nn<EC2n = (l + l)2n = 4n. k=0 Montrons l'autre inégalité par récurrence sur n > 2. Pour n = 2, c'est vrai car C| = 6 > 42/(2-\/2). Supposons le résultat vrai pour n, montrons le pour n + 1. On écrit rn+i _ ,^ + 1 2(2n + l) _ 2n +1 +1 °2n+2 - n + ! ^2n > (n + 1)2^ ~ ^^^ + X)J^ > et il suffit alors de voir que 4n(n + 1) < (2n + l)2 = 1 + 4n(n + 1). 2/ a) On écrit tout simplement 2fc+l Z°2fc+1 — °2fc+l + °2fc+l < Z^ °2fc+l — Z — Z.4 . n=0 b) Procédons par récurrence sur n. - Pour n = 2 c'est vrai car P2 = 2 < 42. - Supposons le résultat vrai jusqu'au rang n — 1. Si n est pair, alors Pn = Pn-\ < 4n_1 < 4n. Sinon n est impair. Soit A; G N tel que n = 2A; + 1. Pour tout nombre premier p tel que k + 2<p<2k + l}p divise &!C2fc+1 = (A: + 1) • • • (2k + 1). Or p est premier avec A;!, donc d'après le théorème de Gauss, p | C'Ifc+r ^ N désigne le produit des nombres premiers p tels que k + 2 < p < 2k + 1, on a donc TV | C$k+V donc TV < Cjfc+1 < 4fc. Or Pfc+1 < 4fc+1. Donc P2M = NPk+l < 4fc4fc+1 = 42fc+1. 3/ On vérifie facilement que 7r(14) = 6 = 14/2 — 1. Supposons n > 15. Parmi 1,2,... ,n, les [n/2] — 1 nombres pairs 4,6,..., 2[n/2] sont composés. Par ailleurs 1,9 et 15 ne sont pas premiers. On trouve donc au moins ([n/2] — 1) + 3 = [n/2] + 2 nombres composés parmi 1,2..., n. Donc 7r(n) < n — ([n/2] + 2) < n — (n/2 + 1) = n/2 — 1. 4/ Si A; 6 N*, vp(k) s'interprète comme l'exposant de p dans la décomposition de k en facteurs premiers. Donc vp(n\) = Y^k=ivp(^)' Par commodité, nous utilisons le symbole de Kronecker défini par 6lk = 1 si p1 \ k} Slk = 0 si p1 \ k. On a bien sûr vp(k) = YaLi <%> de sorte Que n n / 00 \ 00 / n \ fc=l fc=l \i=l / i=l \k=l / Pour tout z, Y^k=i ai représente le nombre d'entiers ky 1 < k <n tels que p1 \ k. Ces entiers sont de la forme £pl où l G N* et £ < n/pl> donc au nombre de [n/p1]. Donc vp(n\) = YaIi^/p1]- 5/ Notre point de départ est la formule suivante (conséquence immédiate du résultat de la question précédente) : r = Vp(C2n) = vp[(2n)\] - 2vp(n\) = £ 2n SVLPfcJ -2 n pk (*) Lorsque a; G M, les inégalités 2x — 1 < [2a;] < 2x et x — 1 < [x] < x entraînent — 1 < [2a;] — 2[x] < 2, et comme [2x] — 2[x] est entier, on a 0 < [2a;] - 2[x) < 1. (**)
5. SUJETS D'ÉTUDE 45 Lorsque pk > 2n, [2n/pk] = [n/pk] = 0 donc on peut se restreindre dans la somme (*) aux indices h tels que pk < 2n, ou encore k < log(2n)/logp, ce qui entraîne \2n lPk -2 n 1 pk J l<fc<log(2n)/logp log(2n) logp \2n lPk -2 n 1 = o, l<fc<log(2n)/logp On en déduit pr <2n. Finalement, ceci conduit à l'inégalité C8i = Il PVp{C*n) < II (2n) = (2n)^2n). peV(2n) peV(2n) 6/ Les hypothèses sur p s'écrivent aussi 2n/p < 3 et n > p, donc [2n/p] < 2 et [n/p] > 1. Les inégalités (**) entraînent alors nécessairement [2n/p] — 2[n/p] = 0. Lorsque fe > 2, on a pk >p2 > 4n2/9, ce qui pour n > 5 donne pk > 2n et donc [2n/pk] = [n/pk] = 0. Ainsi oo Vn>5, vp(C%n) = YJ k=\ d'où le résultat si n > 5. Lorsque n = 3 ou n = 4, on a nécessairement p = 3. Or C| = 20 et C| = 70 ne sont pas divisibles par 3, le résultat est donc démontré pour tout n > 3. 7/ Il est clair que ^=n^ < n^2n)=(2n)7r(2n)-?r(n). pev pev - Comme pour 2/b), on voit que Rn \ C^. Soit Qn G N* tel que C^ = RnQn- D'après 5/, si p est premier, n < p < 2n, on a p \ Qn. Donc tout nombre premier p divisant Qn vérifie p < n. D'après 6/, on a même p < 2n/3. Le produit des nombres premiers de Qn sera donc au plus égal à jP[2n/3]> donc inférieur à 42n/3. D'après 5/, l'exposant de p dans la décomposition de Qn en facteurs premiers ne sera > 1 que si p < V2n. D'après 3/, comme >/2n > \/2 • 98 = 14, ce nombre de facteurs premiers de Qn est inférieur à [y/2n]/2 — 1, donc strictement inférieur à y/2n/2 = y/n/2. Le produit des puissances de ces nombres premiers divisant Qn sera donc au plus égal à (2n)vn/2, et finalement Qn < 42n/3(2n)V^ et comme RnQn = C^, on tire de 1/ 4^ 4^/3 RnQn > 77-7= donc Rn > 2y/n 2y/E(2n)y/^' 8/ La première partie de cette question se résout facilement (en utilisant par exemple une étude de fonctions ou une récurrence sur rr). Traitons maintenant la seconde partie. Lorsque n > 450, on a y/2n/6 > 5 donc 2^/6 > y/2n, d'où 2n/3 = ^x^/6^ > (^2^)x^ = (2n)V^/2. (***) On a aussi 2n/9 > 7, donc 22n/9 > An donc 2n/3 > (4n)3/2 > Arty/n. En combinant cette dernière inégalité avec (***), on obtient au/3 > 2n/3 > 4ny/n, (2n)V/^72 d'où le résultat d'après 7/. 9/ a) D'après 8/ et 7/, si n > 450, on a (2n)7r(2n)"7r(n) > Rn > 2n, donc 7r(2n) - 7r(n) > 2. Il reste à vérifier le résultat pour 6 < n < 450. Les nombres premiers 7, 11, 13, 19, 23, 37, 43, 73, 83, 139, 163, 277, 317, 547, 631 suffisent à l'affirmer. b) Pour n = 4 c'est vrai (4 < 5 < 6) ainsi que pour n = 5 (5 < 7 < 8). Pour n > 6, il existe d'après 9/a) deux nombres premiers p tels que n < p < 2n, donc il en existe au moins un vérifiant n < p < 2n - 2.
46 1. ARITHMÉTIQUE, GROUPES ET ANNEAUX Remarque. Ce résultat fut conjecturé par J. Bertrand en 1845 et démontré pour la première fois par Tchébycheff en 1850. Sujet d'étude 2 (Symbole de Legendre et applications). Soitp > 2 un nombre premier. Pour alléger les notations, on note Fp le corps Z/pZ et p' = (p— l)/2. Pour tout ïGl, on note [x] sa partie entière. 1/ Calculer le cardinal de l'ensemble (F*)2 = {x2 | x G ¥*}. 2/ Si x G Z, p \ x, on note (-) = 1 si x G (F!)2, (£) = — 1 sinon (symbole de Legendre). a) Si p\ x, montrer que (-) = xp' (mod p), puis montrer Va:,y, p\x, p\y, [ ^-j = (^ 1 P, b) Calculer (f). 3/ Soit S = {i, 2,... ,p'} et soit a G Z, p \ a. Si 5 G N, 1 < s < p\ on peut écrire de manière unique as = es(a)èa avec es(a) G {—1,1} et sa G £. a) Montrer que l'application / : S —► S s *-> èa est bijective. b) Soit iia = Card{s G S | es(a) = -1}. Montrer (^) = (-1)^. 4/ (Loi de réciprocité quadratique.) Soit q > 2 premier, ç 7^ p. On note q' = (q — l)/2. a) On considère les sommes p ^<7.P — Z^ s=l sq Pi et ^p.9 — Z^f s=l sp Montrer que SPyq + Sq,p = p'q'. b) Montrer que SqyP = \iq (mod 2). c) En déduire la loi de réciprocité quadratique P q- ) = (-1)" Application i. 5/ a) (Un test de primalité.) Soient h et m deux entiers tels que m > 2 et 1 < h < 2m - 1. On pose n = /i2m + 1. Soit p > 2 premier tel que (-) = -1. Montrer que n est premier si et seulement si p(n-1)/2 = — 1 (mod n). b) (Test de Pépin). On rappelle que les nombres de Fermât sont les nombres de la forme Fk = 22 +1 où k G N* (voir l'exercice 3 page 11). Montrer que F^ est un nombre premier si et seulement si 3^Ffc_1^2 = — 1 (mod Fk). Application 2. 6/ a) Soit p > 3 un nombre premier. Montrer que —3 est un carré clans Fp si et seulement si p = 1 (mod 6). En déduire qu'il existe une infinité de nombres premiers de la forme 6n + 1. b) Soit p > 5 un nombre premier. Montrer que 5 est un carré dans Fp si et seulement si p = ±1 (mod 10). En déduire qu'il existe une infinité de nombres premiers de la forme lOn - 1, n G N. Solution. 1/ L'application (p x G Ker ip 4=^ x2 = 1 F! p (F*)2 x i-> x2 est un morphisme de groupe surjectif. Or (x - l)(x + 1) = 0 donc Card((F;)2) = Card(F;)/Card(Ker (p) = (p - l)/2 = p'. x G {-1,1}. Donc Card(Kery>J = 2,
5. SUJETS D'ÉTUDE 47 Q C \Q R P y S o p p FiG. 1. La diagonale OC sépare les points de OPRQ en deux régions. 2/ a) Si a; G (F*)2, alors il existe j/€FJ tel que x = y2 et donc xp> = yp~l = i. L'équation xp> -1 ayant au plus p' racines dans le corps F*, comme Card((F;)2) = p' on en déduit l'équivalence ^p' = i) <^> (x G (F;)2). Or si a; G F;, xp~l = x2p' = i donc {xp> - \){xp' + i) = Ô donc xp' g {-i, i}- Donc si x <£ (F*)2, xp' = -i, d'où le résultat. On a donc ^ j = {xVy = (x^x/) = (mod p) 1 ) (V ,PJ \PJ et comme p > 2, on en déduit le résultat. b) D'après 2/a), (=±) = (-1)"' (mod p), et comme p > 2 et que (f) G {-1,1}, (f) = (-l/. 3/ a) Remarquons que si s G 5, alors /(s) = es(a)às. Ceci étant, / est injective. En effet, si f(s) = /(s')> alors es(a)às = esi(a)àsf donc es(a)s = es>{a)s\ doncp divise es^s — es'^s' = n. Or \n\ < \s\ + |s'| < 2pr < p, donc n = 0, ce qui prouve es(a)s = est{a)sr et en passant aux valeurs absolues 5 = s'. L'application / est injective et comme le cardinal de l'ensemble de départ est égal à celui de l'ensemble d'arrivée, / est bijective. b) On écrit I] è\ (j) = (i • 2 • • -p'K' = à(2à) • • • (p'à) = (j[ s) m es(a)\ . Comme / est bijective, FLeS^ = T\seSes(a)> et ce terme étant non nul, on obtient (-)=IIc'(fl)-(-1)'lft (modp)' ^p' ses d'où le résultat. 4/ a) Nous allons établir la preuve à l'aide d'un dessin (voir la figure ci contre). Remarquons déjà que p et q étant premiers et distincts, ils sont premiers entre eux. Autrement dit, dans la figure, aucun point à coordonnées (z,jf) entières (l<i<p\l<j< qf) ne rencontre la diagonale OC. Soit 5 G N, 1 < 5 < pf. [sq/p] représente le nombre de points à coordonnées entières, d'abscisse 5, d'ordonnée > 0, se trouvant sous la diagonale OC. Le nombre SQiP = Y1Ï=i[sq/p) représente donc le nombre de points à coordonnées entières d'ordonnées > 0 dans le rectangle OPRQ se trouvant sous la diagonale OC. Pour des raisons analogues, SP)Q représente le nombre de points à coordonnées entières d'abscisse > 0 dans le rectangle OPRQ se trouvant au dessus de la diagonale OC. La somme SP)Q + SQiP est donc le nombre de points à coordonnées entières dans le rectangle OPRQ d'abscisse et d'ordonnées > 0, c'est-à-dire SPiQ + SQiP = p'q*. b) Lorsque 5 G N, 1 < 5 < p\ on écrit sq = p[sq/p] + uSy où 1 < us < p — 1. On a la propriété suivante : Si us < p\ us = sq et es(q) = 1 ; si us > p\ us=p- sq et es(q) = -1.
48 1. ARITHMÉTIQUE, GROUPES ET ANNEAUX Par sommation de l'égalité sq = p[sq/p] + us on obtient • -, p' v' s=l s=l L P J s=l s=l Par ailleurs, en travaillant modulo 2 on a p' J2us= Yl 59+ Y (p~sq)~ Yl s<? + W + Y, s9 (mod2)> s=l e5(g)=l es(g)=-l es(g)=l es(q)=-l p' P' = Ys<j+fj''ip=J2s+fj'<i (mod 2)- s=l s=l En injectant ceci dans l'identité (*) on obtient p' p' p' qJ2s~pSw + Ys + ^q = 5<?,p + J3S + ^ (mod 2)' 5=1 5=1 5 = 1 Comme q = 1 (mod 2) ce résultat entraîne que SQ)P et fiq ont la même parité. c) D'après 4/b), SQ)P et \iq ont la même parité ; pour les mêmes raisons, SPiQ et [xv ont également même parité. Donc d'après 3/b) cette dernière égalité provenant de 4/a). 5/ a) Condition nécessaire. Comme m > 2, n' = (n — l)/2 est pair, donc d'après la loi de réciprocité quadratique © - G) - -• ce qui d'après 2/a) entraîne p(n l^2 = — 1 (mod n). Condition suffisante. Soit ç un facteur premier de n (q ^ p car p An = 1). On a p(n-l)/2 _ _x (m()d ^ pn-l = x (mod q^ pq-l = X (mod qy En désignant par d l'ordre de p dans (Z/qrZ)*, on a donc n — 1 df —-—, d\(n-l) et d\q-l. Les deux premières assertions s'écrivent aussi d \ 2m~1h et d | 2m/i, donc 2m \ d et 2m \ (q — 1). Soit rr G N* tel que q = 2mx + 1. Si r est tel que n = qr, de n = 1 = q (mod 2m) on tire r = 1 (mod 2m) donc il existe y G N, r = 2my + 1. Donc n = qr = {2mx + l)(2my + 1) = 22mxy + 2m(rr + y) + 1 d'où on tire 2mxy < 2mxy + x + y = h < 2m, donc y = 0, et donc n = q est premier. b) On veut appliquer le test précédent avec h = 1 et m = 2k > 2. Comme 2m = (-l)m = 1 (mod 3), on a n = 2 (mod 3) donc (|) = — 1 comme on le vérifie facilement. Le test précédent s'applique donc (avec p=3), d'où le résultat. 6/ a) D'après la loi de réciprocité quadratique |) (!)=(-!)'" donc e)=(-lf'(|; On a donc, en utilisant 2/a) et 2/b) :t)-(t) ®-<-"-"(§)-(§)■
5. SUJETS D'ÉTUDE 49 Si p = 1 (mod 3), alors (§) = 1 ; si p = 2 (mod 3), alors (|) = -1. D'après (**), -3 est donc un carré dans Fp si et seulement si p = 1 (mod 3), autrement dit si et seulement si p = 1 + 3k avec A; G N*, ou encore p = 1 + 6n avec n G N* car k doit être pair. Supposons qu'il y ait un nombre fini de nombres premiers de la forme l + 6n. Nous les notons pi,-" iPk- On pose N = 1 + 223(pi • •-pfc)2. Soit p un nombre premier divisant N. Comme g | TV - 1, on a p > 3. Par ailleurs -1 = 223(pi • • -pk)2 (mod p) donc - 3 = (2 • 3 -pi • • -pfe)2 (mod p), donc —3 est un carré dans Fp, donc p = 1 (mod 6), donc il existe i tel que p = pi. Mais alors p | TV — 1, ce qui est absurde puisque p = Pi divise TV. D'où le résultat. b) D'après la loi de réciprocité quadratique G) (!) - «-^ - * - ©-©■ (~> On vérifie facilement que les carrés dans Fljj sont —1 et 1. D'après (***), 5 est donc un carré dans Fp si et seulement si p = ±1 (mod 5), c'est-à-dire p = ±1 + 5k, k G N*, où encore p = ±1 + lOn, n G N* car fc doit être pair pour que p soit premier. Supposons qu'il y ait un nombre fini de nombres premiers de la forme lOn — 1, n G N*. Nous les notons pi, • • • ,Pk- Posons N = — 1 + 22325(pi • • -pk)2- Soit p un nombre premier divisant N. Comme (2 • 3 • 5) | N + 1, p > 5. Par ailleurs, 1 = 22325(pi • • • pkf (mod p) donc 5 = (2 • 3 • 5pi • • • pk)2 (mod p), donc 5 est un carré dans Fp. Donc p = ±1 (mod 10). Si p = —1 (mod 10), alors il existe i tel que p = Pi et donc p | TV + 1, ce qui est absurde puisque p \ N. Nous venons donc de montrer que tout diviseur premier p de N vérifie p = 1 (mod 10), ce qui en écrivant la décomposition en facteurs premiers de N entraîne N = 1 (mod 10). Ceci est absurde puisque la forme de N entraîne N = — 1 (mod 10). Il y a donc une infinité de nombres premiers de la forme lOn — 1, nGN*. Remarque. On retrouve avec la question 2/b) le résultat 1/a) du problème 4 (page 37). Le résultat de 6/a) est un cas particulier de la question 2/ de ce même problème. - Les nombres de Fermât F* sont premiers pour k < 4. On n'a jusqu'ici jamais trouvé d'autres nombres de Fermât premiers, et on ne sait pas s'il y en a. On sait que Fk n'est pas premier pour 5 < k < 32. Le test de Pépin a été utilisé en 1999 pour montrer que F2a n'est pas premier. Sujet d'étude 3 (Sur les entiers somme de deux carrés). Le but de ce sujet d'étude est de donner une condition nécessaire et suffisante sur n pour qu'un entier n soit somme de deux carrés. On note A2 = {x2 + y2 \ (se, y) G Z2}. On suppose connu le résultat 1/a) du problème 3 : Si p > 2 est premier, alors — i est un carré dans Z/pZ <=^> p = 1 (mod 4) (*). 1/ Si X et Y appartiennent à A2, montrer que XY G A2- 2/ Soit p un nombre premier tel que p = 1 (mod 4). a) Montrer qu'il existe un entier m, 1 < m < p, tel que mp G A2. Soit m,Q la plus petite valeur de m non nulle telle que mop G A2. Supposons rao > 1. b) Montrer qu'il existe deux entiers x\ et y\ tels que x\ + y2 = rairao, avec m,\ un entier vérifiant 1 < rai < ra0. c) Montrer qu'il existe deux entiers X et Y tels que X2 + Y2 = rti\p. Conclure.
50 1. ARITHMÉTIQUE, GROUPES ET ANNEAUX 3/ Démontrer le résultat suivant : Un entier n > 0 est somme de deux carrés d'entiers si et seulement si tous les facteurs premiers de n de la forme 4m+ 3, m G N, ont un exposant pair dans la décomposition en facteurs premiers de n. Solution. 1/ Soit X = x\ + x\ et Y = y2 + y\ deux éléments de A2. On peut écrire X et Y comme le carré des modules des nombres complexes x = x\ -\-ix2 et y = y\ + iy2- Il suffit ensuite de remarquer que XY = \xy\2 = (x\X2 + 2/12/2)2 + (#12/2 - #22/i)2. 2/ a) D'après (*), —i est un carré dans Z/pZ. Autrement dit, il existe x G Z,tel que —1 = x2 (mod p). On peut même choisir x tel que 0 < x < p — 1. Comme x2 + 1 = 0 (mod p), il existe m G Z tel que x2 + 1 = mp} et comme 0 < rr < p — 1, on a 0 < m < p, d'où le résultat. b) Par hypothèse, il existe rr, y G Z tels que x2 + y2 = mop (**). Si mo divise x et y, alors mo ! (x2 + 2/2) donc mo I P) ce Qui est absurde puisque 1 < mo < m < p. Donc mo ne divise pas x ou ne divise pas y. En désignant par c et d les entiers les plus proches de x/mo et y/mo, les entiers rri = rr — cmo et y\ = y — dmo vérifient 1 1 \x\\ < 2mo, |î/i|<2mo et £2 + 2/2>0. Or rri = x (mod mo) et 2/1 = y (mod mo) donc x\-\- y2 = x2 -\- y2 = Q (mod mo), et donc il existe m\ G N tel que rr2 + y2 = m\mo. Comme x\ + y2 > 0, mi > 0. Par ailleurs, x2 + y2 < (mo/2)2 + (mo/2)2 = rn^/2 donc mi < mo- c) Multipliant (**) par l'égalité x\ + y2 = mimo, on obtient mlmip = (x2 + y2)(x2 + y2) = (xxi + yyi)2 + (xyi - rriy)2. Mais {^^1 + 2/2/1 = #(# — cmo) + 2/(2/ " d^o) = moX avec X = p — ex — dy eZ xy\ — rriy = x{y — dmo) — y(rr — cmo) = moY" avec Y = cy — dx G Z/ Donc mip = X2 + Y"2 G *Â2- Or 1 < m\ < mo ce qui est contraire à l'hypothèse de rninimalité faite sur mo. Donc mo = 1, c'est-à-dire pG^- 3/ Condition nécessaire. Soit n = x2 + y2 (avec rr, y G Z) et p un facteur premier de n tel que son exposant dans la décomposition de n en facteurs premiers soit impair. Notons d = pgcd (rr, y). Les nombres X = x/d et Y = y/d sont des entiers qui vérifient X A Y = 1. Comme n = d2(X2 + Y2) et que l'exposant de p dans la décomposition de n en facteurs premiers est impair, on a forcément p | X2 + Y2. Or p \ X (sinon p \ X donc p \ Y, absurde car X A Y = 1), X est donc non nul dans Z/pZ. Comme X2 + Y2 = Ô dans Z/pZ, on a -i = (X-1 Y)2 donc -i est un carré dans Z/pZ, donc p = 2 ou p = 1 (mod 4) d'après (*). D'où la condition nécessaire. Condition suffisante. Soient pi,... ,p& les facteurs premiers de n dont l'exposant dans la décomposition en facteurs premiers de n est impair. On peut écrire n = m2p\ • • -pfc, où m G N*. Par hypothèse, pour tout i on a pi ^ 3 (mod 4), ce qui, les pi étant des nombres premiers, entraîne Pi = 1 (mod 4) ou pf = 2. Donc p* G ^2 (d'après 2/ et parce que 2 = 12 + 12 G ^2)- Donc d'après 1/, pi • • -pk G ^2- Or m2 = m2 + O2 G *Â2, et toujours d'après 1/, n = (m2)(pi • • -p&) G ^2- D'où le résultat. Remarque. Ce résultat fut complété par Jacobi qui montra que si d\(ri) (resp. d^{n)) désigne le nombre de diviseurs de n de la forme 4n + 1 (resp. 4n + 3), alors Card{(x,y) G Z2 | n = x2 + y2} = 4^(n) - d3{n)\ Sujet d'étude 4 (Tout entier est somme de quatre carrés). Le but de ce sujet d'étude est de montrer que tout entier naturel est somme de quatre carrés. On note A4 = {x2 + y2 + z2 +12 | (x,y,z,t) G Z4} et Z[i] = {x + iy | (rc,y) G Z2} (anneau des entiers de Gauss).
5. SUJETS D'ÉTUDE 51 \l Soient x,y,z et t des nombres complexes. Vérifier que (M2 + M2)(M* + l*l2) = I*î + yl? + \xt - yz\2. En déduire que si X et Y G Ai, alors XY G A4. 2) Soit p > 2 un nombre premier. a) Montrer qu'il existe x,y G Z tels que —1 = x2 + y2 (mod p). (On pourra utiliser le résultat de la question 1/ du sujet d'étude 2 page 46). b) En déduire qu'il existe m G N, 1 < m < p tel que rap G Ai. Soit rriQ le plus petit entier > 0 tel que tïIqp G A4. Supposons rao > 1. c) Montrer que rao est impair. d) Montrer qu'il existe x,y G Z[z] tel que mop = \x\2 + \y\2. e) Montrer qu'il existe c et d £ Z[i] tels que 2 = x — ciuq et t = y — dmo vérifient \z\2 + \t\2 = ra0rai avec 1 < rai < ra0. f) En utilisant 1/, montrer que m\p G A4. Conclure. 3/ En déduire le théorème de Lagrange : tout entier naturel est somme de quatre carrés d'entiers. Solution. 1/ Pour la première partie de la question, il suffit d'écrire \xz + yi\2 + \xt - yz\2 = (xz + yï)(xz + yt) + (xt - yz)(xt - yz) = (\xz\2 + \yt\2 + xz~yt + xzyt) + (|:r£|2 + |2/z|2 - xtyz - xlyz) = \xz\2 + M2 + \xt\2 + \yz\2 = {\x\2 + \y\2){\z\2 + |*|2). Maintenant, considérons X = x\ + rr| + x\ + £4 et Y = y2 + 2/2 + v\ + 2/4 deux éléments de A*. Appliquons la relation précédente avec rr = x\ + irr2, 2/ = #3 + i#4, 2; = y\ + iy2 et t = ys + 22/4. On a X = \x\2 + \y\2 et Y = \z\2 + \t\2. Le carré du module d'un élément de Z[i] étant la somme de deux carrés d'entiers, on en déduit que XY = |rrz + yt\2 + \xt — yz\2 est somme de quatre carrés d'entiers, d'où le résultat. 2/a) D'après la question 1/ du sujet d'étude 2, on a Card{rr2 | x G (Z/pZ)*} = (p - l)/2. En comptant Ô, on voit donc que F = {x2 \ x G Z/pZ} a (p + l)/2 éléments. De Pinjectivité de l'application Z/pZ -> Z/pZ y »-> -1 -y, on voit que r' = {-1 -y2 | y G Z/pZ} a aussi (p+1)/2 éléments. Donc mr ^ 0 (car si mr' = 0, alors p = Card(Z/pZ) > Card(r)+Card(r') = p+1, absurde), ce qui entraîne l'existence de rr,y G Z/pZ tels que — i — y2 = x2, d'où le résultat. b) D'après la question précédente, il existe xyy G Z tels que — 1 = x2 + y2 (mod p). On peut même supposer 0<rr<petO<y<p, et quitte à changer rr en p — rr, y en p — y, supposer 0 < x < (p - l)/2 et 0 < y < (p - l)/2. Comme p | 1 + rr2 + y2, il existe m e Z tel que 1 + x2 + y2 = mp. Donc 0 < rap < 1 + 2(^)2 < p2, d'où 1 < m < p. c) Supposons rao pair. Soient rri,rr2,rr3,rr4 G Z tels que raop = rr2 + x2 + rr§ + rr2. Comme rao est pair, les éléments rri,rr2,rr3,rr4 sont (i) soit tous pairs, (ii) soit tous impairs, (iii) soit deux d'entre eux sont pairs et deux sont impairs, et quitte à renuméroter, on peut supposer rri,rr2 pairs et £3,0:4 impairs. Dans tous les cas, les éléments rri - X2 x\+ X2 xz — X4 X3 + rr4 2 ' 2 ' 2 ' 2 sont des entiers. Comme ^P = [-2-) + [-2-) + {-2-) + {-^2-) • l'hypothèse de minimalité de rao est contredite. Donc rao est impair. d) Si £i,rr2J#3,rr4 G Zsont tels que raop = rrf+rr^+rrl+rr2, si rr = rri+zrr2 et y = £3+20:4 G Z[z], alors ra0p = |rr|2 + \y\2.
52 1. ARITHMÉTIQUE, GROUPES ET ANNEAUX e) Montrons auparavant le résultat suivant : VZ = a + ib G C, 3Z' G Z[i) tel que \Z - Z'\2 < -. (*) Il suffit en effet de prendre Z' = a' + ib' où a' et b' sont des entiers tels que \a — a'\ < 1/2 et \b - b'\ < 1/2. On a alors \Z - Z'\2 = \a- a'\2 + \b- b'\2 < (1/2)2 + (1/2)2 = 1/2. D'après (*), il existe c G Z[ï\ tel que \x/mo — c\2 < 1/2. Autrement dit, si z = x — raoc, on a \z\2 ^ wio/2- Comme |z|2 est un entier et que rao est impair, on a même \z\2 < ml/2. De même, il existe d G Z[i] tel que t = y - dm,Q vérifie \t\2 < ml/2. Or \z\2 + |*|2 = |rc|2 + \y\2 - m0[(xc + xc) + (2/d + j/d)] = m0(p - [(xc + xc) + (yd + yd)], donc rao divise \z\2 + \t\2. Soit rai G N tel que \z\2 + \t\2 = rairao- On tire des majorations de \z\2 et \t\2 que rai < rao- Par ailleurs rai > 0 car si rai = 0, alors z = t = 0 donc x = crao et y = drrtQ donc prriQ = |a:|2 + |2/|2 = |rao|2(|c|2 + |d|2), donc rao | p ce qui est absurde car 1 < rao < p (d'après 2/a)). Donc 1 < rai < rao d'où le résultat. f) En multipliant les égalités rriQp = |rr.|2 + \y\2 et raorai = \z\2 + |£|2, on obtient d'après 1/ ra^raip = |#2 + yt\2 + \xt — yz\2. (**) Or xz + yi = x(x — cmo) + y(y — dmo) = \x\2 + \y\2 — mo(xc + yd) = raoa, a = p — xc — yde Z[i\. Par ailleurs, xt — yz = —drriQX + cmoy = rao/? où (5 = —dx + cy G Z[i]. D'après (**), on peut écrire raip = \a\2 + |/?|2, et comme le carré du module d'un élément de Z[i] est la somme de deux carrés d'entiers, raip G A4. Ceci contredit l'hypothèse de minimalité faite sur rao. On a donc rao = 1, c'est-à-dire p G A4. 3/ D'après 2/, tout nombre premier p > 2 est somme de quatre carrés. Il en est de même de p = 2 = l2 + l2 + 02 + 02. Tout nombre premier est donc élément de A4. Si n est un entier, n peut s'écrire comme le produit de nombres premiers d'après le théorème fondamental de l'arithmétique, et donc n e A4 d'après 1/. D'où le résultat. Remarque. Il faut au minimum additionner quatre carrés d'entiers pour représenter tout entier naturel n, comme le montre le cas de n = 7. - On peut se poser le problème plus général suivant. Étant donné un entier k > 2, que vaut g(k), le plus petit entier m > 0 tel que tout entier est somme de m puissances fc-ièmes d'entiers, et que vaut G(k), le plus petit entier m > 0 tel que tout entier suffisamment grand est somme de m puissances fc-ièmes d'entiers ? La recherche (et l'existence) de g{k) et G(k) s'appelle le problème de Waring. Nous venons de montrer que #(2) = 4. On peut montrer que G(2) = 4. On sait par exemple que g (S) = 9 et 4 < G(3) < 7, 19 < g(4) < 22 et G(4) = 16, g(S) = 37 et G(5) < 23.
CHAPITRE 2 Corps, Polynômes et Fractions Rationnelles HISTORIQUEMENT, la recherche des solutions des équations polynomiales précède l'étude des polynômes. Elle marque l'entrée des mathématiques dans une nouvelle ère. En effet, la première en date des grandes découvertes en mathématiques allant nettement au delà des connaissances de l'antiquité est la formule de résolution de l'équation du troisième degré x3 — px = q obtenue sans doute au début du seizième siècle par Scipione del Ferro, professeur à l'université de Bologne. Cardan est le premier à rendre publique cette formule vers 1545. Vers 1540, Ferrari, élève de Cardan, obtient la formule de résolution de l'équation du quatrième degré. L'équation du cinquième degré tient cependant les mathématiciens en échec pendant 200 ans ; ce n'est qu'en 1826 qu'Abel démontre qu'il est impossible de donner des formules explicites de type de celles données pour les degrés inférieurs pour les solutions des équations de degré supérieur ou égal à 5. Quelques années plus tard, Galois donne un critère de résolubilité par radicaux de toutes les équations polynomiales. La théorie des polynômes est née. Parallèlement, on essaye de démontrer le théorème fondamental de l'Algèbre (tout polynôme complexe de degré n a n racines complexe). On s'y attaque vers 1746, d'abord en essayant de donner une démonstration purement algébrique, avant de s'apercevoir qu'il fallait utiliser les propriétés topologiques de R. Lagrange en publia une démonstration dans ses mémoires en 1771. 1. Corps, polynômes et arithmétique dans K[X] 1.1. Corps DÉFINITION 1. Soit K un ensemble muni de deux lois internes "+" et "•". On dit que (K, +, •) est un corps si (i) (K, +) est un groupe abélien. (ii) (K*, •) est un groupe. (iii) La loi • est distributive par rapport à la loi +. Remarque 1. - Si la loi • est commutative, on parle de corps commutatif. - Il revient au même de dire qu'un corps est un anneau dans lequel tout élément non nul est inversible. - Les corps les plus couramment rencontrés sont Q, R,C et Z/pZ (p premier). Définition 2. Soit (L, +, •) un corps et K c L. On dit que K est un sous-corps de L si la restriction à K des lois + et • lui confère une structure de corps (on dit aussi que L est un surcorps ou une extension de K). Remarque 2. Si K est un sous-corps commutatif de L, L est un K-espace vectoriel. Avec la définition de la caractéristique d'un anneau donnée page 30, on a : Proposition 1. La caractéristique d'un corps est 0 ou un nombre premier. Démonstration. Immédiat avec la proposition 3 page 30 car un corps est un anneau intègre. D
54 2. CORPS, POLYNÔMES ET FRACTIONS RATIONNELLES Exemple 1. Les corps, Q, M et C sont de caractéristique 0; si p est un nombre premier, le corps Z/pZ est de caractéristique p. Corps premier, sous-corps premier. DÉFINITION 3. Un corps est dit premier s'il n'admet pas d'autres sous-corps que lui même. Exemple 2. Les corps Q, Z/pZ (où p est un nombre premier) sont premiers. DÉFINITION 4. Soit (K,+, •) un corps dont l'élément neutre de (K*, •) est noté e. - Si K est de caractéristique 0, alors Qi = {^J, (n,m) G Z x Z*} est un corps premier isomorphe à Q. C'est le sous-corps premier de K. - Si K est de caractéristique p premier, l'application / : Z —► K n ^ ne est un morphisme d'anneaux et Ker / = pZ. Donc Z/Ker / = Z/pZ est isomorphe à K' = /(Z), donc K' est un corps premier. C'est le sous-corps premier de K. Exemple 3. Le corps Q est le sous-corps premier de R (ou de C). Le corps Z/pZ est le sous-corps premier de Z/pZ (où p est un nombre premier). 1.2. Polynômes DÉFINITION 5. Soit A un anneau commutatif unitaire. On appelle polynôme à une indéterminée à coefficients dans A toute suite (an)nGN d'éléments de A tous nuls à partir d'un certain rang. Les polynômes sont munis des opérations usuelles d'addition et de produit de polynômes. On rappelle que tout polynôme P = (ai)^ à une indéterminée à coefficients dans A s'écrit P = ^i€N aiX% où X désigne la suite X = (0,1,0, • • • , 0, • • • ). On appelle degré de P, noté deg(P), le plus grand indice i tel que a* ^ 0 (avec par convention deg(P) = —oo si P = 0). L'ensemble des polynômes à une indéterminée à coefficients dans A est noté A[X], C'est un anneau commutatif unitaire, intègre si A est un anneau intègre. Si A = K est un corps, K[X] est un K-espace vectoriel. DÉFINITION 6. Soit A un anneau commutatif unitaire. - On dit que P, Q G A[X] sont associés s'il existe À G A inversible tel que P = XQ. - Un polynôme P G A[X] est dit unitaire si son coefficient dominant (i. e. le coefficient du monôme de plus haut degré de P) est égal à l'élément neutre 1 de la loi •. 1.3. Arithmétique dans K[X] Dans toute cette section, K désigne un corps commutatif. Le caractère euclidien (donc principal) de l'anneau des polynômes K[X] lui confère une structure arithmétique tout-à-fait analogue à celle sur les entiers. Pour cette raison, nous ne passerons en revue que les propriétés arithmétiques de K[X] les plus importantes. Théorème 1 (Division euclidienne). Soient A, B g K[X], B ^ 0. Alors 3!(Q, R) G K[X]2 tel que A = BQ + R avec deg(P) < deg(P). Remarque 3. Dans le cas de A[X] où A est un anneau commutatif unitaire, si le coefficient dominant de B est inversible, alors (3(Q, R) G A{X]2), A = BQ + R avec deg(fl) < deg(P). Si de plus A est intègre, il y a unicité du couple (Q,R). Ceci est en particulier vrai sur Z[X] si B est unitaire. Théorème 2. L'anneau K[X] est principal.
1. CORPS, POLYNÔMES ET ARITHMÉTIQUE DANS K[X] 55 Remarque 4. Ceci est faux sur A[X] lorsque A n'est pas un corps (voir l'exercice 1). DÉFINITION 7. Soient Pi, • • • , Pn des polynômes de K[X]. L'unique polynôme unitaire P engendrant l'idéal (Pi) H h (Pn) s'appelle le pgcd des polynômes Pi,..., Pn. Il est noté pgcd (Pi, • • • , Pn)- C'est aussi le diviseur unitaire de plus haut degré divisant tous les P*. DÉFINITION 8. Des polynômes Pi, • • • , Pn G K[X] sont dits premiers entre eux dans leur ensemble si on a pgcd (Pi, • • • ,Pn) = 1. Ils sont dits premiers entre eux deux à deux si Vt^J, pgcd(Pi,Pi) = l. On définit également, comme dans Z, la notion de ppcm de n polynômes. Théorème 3 (Bezout). Des polynômes Pi,..., Pn G K[X] sont premiers entre eux dans leur ensemble si et seulement s'il existe Ui,..., Un G K[X] tels que U\Pi-\ \-UnPn = 1. Remarque 5. - Lorsque P,Q G K[X] sont premiers entre eux, on peut même avoir UP + VQ = 1 avec deg(f/) < deg(Q) et deg(l/) < deg(P) (voir la remarque de l'exercice 3, page 56). - Comme dans Z, il découle du théorème de Bezout le théorème de Gauss : Si P | QR et si pgcd (P, Q) = 1, alors P | R. Ce qui dans Z joue le rôle des nombres premiers est ici appelé polynôme irréductible. Plus précisément : DÉFINITION 9. Un polynôme P G K[X] est dit irréductible dans K[X] si P n'est pas constant (i. e. deg(P) > 1) et si ses seuls diviseurs dans K[X] sont les constantes non nulles et les polynômes associés à P. Remarque 6. Attention. Un polynôme irréductible dans K[X] ne l'est pas forcément dans h[X] où L est un surcorps de K. Par exemple, P = X2 + 1 est irréductible dans M[X], mais pas dans C[X] puisque P = (X — i)(X + i). Comme dans Z, on a le résultat suivant. —*■ Théorème 4. Soit P G K[X] un polynôme non nul. Alors P se décompose de manière unique à l'ordre prés sous la forme P = ÀPf1 • • • iÇ* où À G K*, ai G N* et les Pi sont des polynômes distincts, unitaires et irréductibles dans K[X]. Rappelons enfin le théorème de division selon les puissances croissantes. Théorème 5. Soient A, B G K[X], le coefficient du terme constant de B étant non nul. Soit keN*. Alors (3!(Qfc,Pfc)<EK[X]2), A = BQk + Xk+lRk avec deg(Pfc) < k. Déterminer (Q^, Rk)> c'est effectuer la division de A par B selon les puissances croissantes à l'ordre k. 1.4. Exercices Exercice 1. Soit A un anneau commutatif unitaire intègre. Montrer que A est un corps si et seulement si A[X] est un anneau principal. Solution. La condition nécessaire est une question de cours. Montrons la condition suffisante. Soit a G A, a ^ 0. Il s'agit de montrer que a est inversible. Comme A[X] est principal, il existe P G A[X] tel que (a) + {X) = (P). Comme a G (P), il existe Q G A[X] tel que a = PQ. On en déduit, A[X] étant intègre, que P e A.
56 2. CORPS, POLYNÔMES ET FRACTIONS RATIONNELLES Comme P e (a) + (X), il existe U et V G A[X] tels que aU + XV = P. Si b G A désigne le coefficient du terme constant de [/, on en déduit ab = P puisque P est constant. Comme X G (P), il existe Q G j4[X] tel que PQ = X. Si c e A désigne le coefficient du terme en X de Q, on a donc Pc = 1. Finalement, on a abc = Pc = 1, et A étant commutatif, a(bc) = (bc)a = 1 donc a est inversible. D'où le résultat. Exercice 2. Soient A = Xa - 1 et B = Xb - 1 G K[X], avec a, 6 G N*. Quel est le pgcd de A et de B ? Solution. Nous allons déterminer pgcd (.A, B) grâce à l'algorithme d'Euclide. Rappelons en le principe. On effectue à partir de A et B des divisions euclidiennes successives. On écrit A = BQ0 + R0 avec Q0i R0 G K[X] et deg(R0) < deg(P), et on recommence, en divisant toujours le dividende par le reste : B = RoQi + Ri avec QuRieK[X] et deg(Pi) < deg(P0)- Au rang k, on fait Rk-i = RfcQk+i + Rk+i avec Qk+i,Rk+i G K[X] et deg(Rk+i) < deg(Rk). La suite (deg(Rk))ke^ décroît strictement et donc il existe n G N* tel que Rn = 0 et Rn-\ ^ 0. On remarque alors que pgcd (A, B) = pgcd (B, Ro) = • • • = pgcd {Rn-i, Rn), de sorte qu' a une constante multiplicative près, pgcd (A,B) = Rn-\ (cet algorithme reste valable dans Z). Avant d'appliquer l'algorithme, remarquons d'abord que si m > n G N* et si m = nq + r est la division euclidienne dans Z de m par n, on a vm i _ ( vn -iw v-m—n ■ vm—2n i . . , _i_ vm—qn\ _i_ /vm—qn i\ Comme m — qn = r < m, cette égalité constitue la division euclidienne de Xm — 1 par Xn — 1. Nous venons donc de montrer que le reste de la division euclidienne de Xm — 1 par Xn — 1 est Xr — 1 où r est le reste de la division euclidienne de m par n. (*) Appliquons l'algorithme d'Euclide (dans Z) à a et b : a = bq0 + r0, 0 < r0 < 6, b = r0qi + ri, 0 < n < r0, n-\ = nQk+i + rk+u 0 < rk+i < rk. On s'arrête au rang n lorsque rn = 0 ^ rn-\. Comme pour les polynômes, on a pgcd (a, b) = pgcd (6, r0) = • • • = pgcd (r„_i, rn) = r„_i. D'après le principe (*), si les .Rfc désignent les polynômes introduits plus haut, on a Rq = Xr° - 1, Ri = Xri - 1, • • • , Rn_i = Xrn~l -ltRn = 0. Donc pgcd(A, B) = #„_i = X7»-1 - 1 = j£Pgcd(a,6) _ ! Exercice 3. Déterminer l'ensemble des polynômes P G R[X] tels que P = l (mod (X - l)3) et P = -1 (mod (X + l)3). Solution. Notons F l'ensemble des polynômes P vérifiant la condition requise. Un polynôme P appartient à F si et seulement s'il existe C/, V G R[X] tels que P =1 + *7(X-1)3 (P =l + U(X-l)3 „ , xo ou encore < , x„ , ' Q . P =-l + K(X + l)3 |l + C/(X-l)3 =-l + K(X + l)3
1. CORPS, POLYNÔMES ET ARITHMÉTIQUE DANS K[X] 57 En d'autres termes, F représente l'ensemble des polynômes de la forme 1 + U(X — l)3 où U appartient à l'ensemble A = {U G R[X] | 3V G R[X], U(X - l)3 + V(X + l)3 = 2}. (*) Au facteur 2 près, on est ramené au problème de trouver les couples ([/, V) tels que U(X — l)3 + y[X + l)3 = 1. C'est un problème classique qui rentre dans le cadre du résultat suivant. Lemme. Soient P, Q G K[X], premiers entre eux. Alors il existe (Uq,Vq) G K[X]2 tel que U0P + VqQ = 1, et les couples (U, V) solution de UP + VQ = 1 vérifient : UP + VQ = 1 (U,VeK[X}) <*=> 3ReK[X], U = U0 + RQ,V = V0 - RP. Preuve. L'existence de (Uq,Vq) est assurée par le théorème de Bezout. Si UP + VQ = 1 on a y _ uQ)P + (V - V0)Q = 0 donc (U - U0)P = -(V - V0)Q. Donc P \ (V - V0)Q et comme P et Q sont premiers entre eux, d'après le théorème de Gauss, P \ V — Vq. Donc il existe R G K[X] tel que V = Vq — RP, et en remplaçant dans l'équation (U — Uq)P = — (V — Vq)Q, on tire U = U$ + RQ. Réciproquement, on vérifie facilement que ce couple est solution. D'où le lemme. Les polynômes X — 1 et X + 1 étant premiers entre eux, il en est de même des polynômes p = (X — l)3 et Q = (X + l)3, et le lemme s'applique donc. On détermine Uq et Vq en utilisant l'algorithme d'Euclide (déjà rencontré dans l'exercice précédent, et de manière similaire à l'exercice 2 page 10 dans Z), ce qui donne : . {X + l)3 = (X - l)3 + QX2 + 2, (X-l)3 = (6X2 + 2)(|-0+|x, 6X2 + 2=(|x)gx)+2. Maintenant, on remonte les calculs (la méthode s'appelle algorithme d'Euclide étendu) 2 = {QX2 + 2) - (X-lf-(6X2 + 2)(f-1- * = (~^XJ (X - l)3 + (6X2 + 2) S-flï*« = (-\x) (x -1)3 + [(x +1)3 - (x -1)3] gx2 - f* +1) = (-§** - f* -1) (x -1)3 + gx2 - \x +1) (x +1)3. Ainsi, les polynômes vérifient C/o(-AT — l)3 + Vb(X + l)3 = 1. Le lemme entraîne que l'ensemble défini dans (*) est égal à A = {Uq + R(X + l)3, R G M[X]}, on a donc r={l + (2f/o + ^(^ + l)3)(^-l)3|^GR[X]}, avec U0 = -^X2 - -^X - i. Remarque. On peut tirer du lemme un résultat analogue à celui de la question a) de l'exercice 2 page 10, qui ici s'exprime sous la forme suivante. Si P et Q € K[X] sont premiers entre eux, alors il existe un unique couple (U0, Vq) e (K[X])2 tel que U0P-\-V0Q = 1 avec deg([/0) < deg(Q) e*deg(l/0)<deg(P). (Pour montrer ce résultat, partir d'une solution UP + VQ = 1 puis effectuer la division euclidienne de U par Q.)
58 2. CORPS, POLYNÔMES ET FRACTIONS RATIONNELLES Exercice 4 (Lemme de Gauss et critère d'Eisenstein). 1/ a) Soient P, Q e Z[X] et p un nombre premier. On suppose que p divise tous les coefficients du produit PQ. Montrer que p divise tous les coefficients de P ou tous les coefficients de Q. b) (Lemme de Gauss). Si P G Z[X], on note c(P) le pgcd des coefficients de P (et c(P) = 1 si P = 0). Montrer que si P, Q G Z[X]t alors c(PQ) = c(P)c(Q). 2/ Montrer que si $ G Z[X] est irréductible dans Z[X], il est irréductible dans Q[X]. 3/ a) (Critère d'Eisenstein). Soit P = anXn + • • • + axX + a0 G Z[X]. On suppose qu'il existe un nombre premier p tel que (i) Vfc, 0 < k < n - 1, p | a/t (ii) p \ an (iii) p2 \ a0. Montrer que P est irréductible dans Q[X]. b) Application. Soit p un nombre premier et $(X) = Xp~l -\ h X + 1. Montrer que $ est irréductible dans Q[X]. Solution. 1/ a) Si a G Z, on note a" sa classe dans Z/pZ. Si P = anXn H 1- a\X + ao G Z[X], on note P = â"nXn + • • • + ôi-AT + â"o G Z/pZ[X]. Si p divise tous les coefficients de PQ, on a, avec ces notations : PQ = PQ = 0. Comme Z/pZ est intègre, Z/pZ[X] est intègre. Donc P = Ô ou Q = Ô, d'où le résultat. Remarque : on peut également résoudre cette question "à la main", sans passer par Z/pZ. b) Soient P,Q G Z[X). Il est clair que Pi = ^P et Qi = ^Q G Z[X], et on a c(Pi) = c(Qi) = 1. Si c(PiQi) > 1, alors il existe un nombre premier p divisant c{P\Q\). D'après 1/a), on a donc p \ c{P\) ou p \ c(Qi), ce qui est absurde. Donc c{P\Q\) = 1, ce qui entraîne c(PQ) = c(P)c(Q)c(P1Q1) = c(P)c(Q). 2/ Soient P,Q G Q[X] tels que $ = PQ. Soient a,(3 G N* tels que Pi = aP et Qi = PQ € Z\X\. On a a(3$ = P\Q\ donc d'après le lemme de Gauss a/?-c($) = c(Pi)c(Qi). Posons Pi = ^tjttPi et Q2 = jjttttQi- ^es polynômes sont à coefficients entiers. Par ailleurs, aP$ = c(Pi)c(Qi)P2Q2 = afi • c{$)P2Q2- Si P3 = c(<É>)P2, on a donc $ = P3Q2 avec P3, Q2 G Z[X]. Comme $ est irréductible dans Z[X], on a nécessairement deg(Ps) = 0 ou deg(Q2) = 0, donc deg(P) = 0 ou deg(Q) = 0, ce qui prouve que $ est bien irréductible dans Q[X]. 3/ a) Supposons P réductible dans Q[X]. D'après la question précédente, $ est réductible dans Z[X] et donc il existe Q, Re Z[X] tels que P = QR, avec a = deg(Q) > 1 et 6 = deg(R) > 1. Dans Z/pZ, on a, d'après les hypothèses, P = ânXn. Écrivons Q = Ya=o Qi^1 et R = J2i=o riXl- Dans Z/pZ[X], on a P = QR donc a~nXn = QP, donc Q = qaXa et R = fbXb. Ceci entraîne % = ^0 = 0, donc p | go et p | ro, donc p2 | qoro = ao, ce qui est contraire aux hypothèses. Finalement, P est irréductible dans Q[X]. b) L'astuce est d'utiliser le critère d'Eisenstein en considérant $(X+1). L'identité (X—1)$(X) = XP - 1 entraîne X$(X + 1) = (X + If - 1, d'où on tire p k=l Il est maintenant facile de vérifier que $(X + 1) satisfait les hypothèses du critère d'Eisenstein avec le nombre premier p (rappelons que si p est premier etsil<fc<p — 1, alors p | Cp), donc $(X + 1) est irréductible dans Q[X]. Donc $(X) est irréductible dans Q[X]. Remarque. Le résultat 3/ b) est un cas particulier d'un résultat général concernant les polynômes cyclotomiques (voir le problème 9, page 91).
2. FONCTION POLYNÔME, RACINES D'UN POLYNÔME 59 2. Fonction polynôme, racines d'un polynôme Dans toute cette section, K désigne un corps commutatif. 2.1. Fonction polynôme Soit A une K-algèbre (c'est-à-dire un K-espace vectoriel muni d'un produit interne — noté ici multiplicativement — faisant de A un anneau et tel que si A G K, et a;,y € A, alors X(xy) = (Xx)y = x(Xy)) non nécessairement commutative (par exemple A = K, >1 = K[X] ou A = Mn(K)). Pour tout F = a0 + a\X -\ h anXn G K[X], on note F l'application n F : A -> A x i-> ^OiX*. t=0 - Si F, G G K[X], on a F+"S = F + G et fS = F<5. - Si A = K[X], on note F o G = F (G). Pour toute K-algèbre A, on a alors F o G = FoG. Remarque 1. En général il n'y a pas d'ambiguïté, la fonction polynôme x h-> F(x) est notée plus simplement x i-> F(:c). 2.2. Racines d'un polynôme DÉFINITION 1. Soit F G K[X] et L une extension de K. On dit que a G L est une racine (ou un zéro) de F si F (a) = 0. Proposition 1. £W a G K e£ F G K[X]. L'élément a est une racine de F si et seulement si X — a divise F. DÉFINITION 2. Soit F G K[X], a G K et /i G N*. On dit que a est une racine d'ordre h de F si (X - a)'1 | F et (X - a)h+1 \ F. -*• Proposition 2. Soit F G K[X] rfai,...,or€K des racines de F d'ordre hi,..., /ir ("/es a^ é£an£ deuz à dewz distincts). Alors il existe Q G K[X] tel que F(X) = (X- ai)hl • • • (X - ar)hrQ(X) et Vi, Q(oi) ^ 0. Conséquence. Si F G K[X] est de degré n > 1, alors F a au plus n racines (comptées avec leur ordre de multiplicité). Remarque 2. Attention ! La proposition précédente est fausse lorsque l'on remplace le corps K par un anneau. Par exemple, dans Z/8Z, le polynôme F = ÀX G Z/8Z[X] a 3 racines Ô, 2 et 4, mais deg(F) = 1. Proposition 3. Soit F e K[X] tel que pour tout a; G K, F(x) = 0. Si K est infini, on a F = 0. Remarque 3. Si K est fini, le résultat précédent est faux. Par exemple, si on note ai,..., an les éléments de K, le polynôme F = (X — ai) • • • (X — an) est non nul et pourtant tous les éléments ideK vérifient P(x) = 0. Il ne faut donc pas confondre polynôme et fonction polynôme. Par contre, si K est infini, la proposition précédente nous dit qu'il y a bijection entre K[X] et les fonctions polynômes de K dans K. Définition 3. Un polynôme F g K[X] est dit scindé (ou dissocié) sur K si on peut écrire F = X(X - cn)hl • • • (X - ar)hr avec A G K et pour tout i, aieK et h{ G N*.
60 2. CORPS, POLYNÔMES ET FRACTIONS RATIONNELLES Remarque 4. Deux polynômes F et G de K[X] scindés sur K sont premiers entre eux si et seulement s'ils n'ont aucune racine commune. Théorème 1 (Relations entre coefficients et racines). Soit un polynôme P = aQXn + ai Xn~l + • • • + an_i X + an G K[X], a0 ^ 0, scindé sur K, dont les racines (comptées avec leur ordre de multiplicité) sont X\y... }xn (de sorte que P = ao(X — Xi) ■ • • (X — xn)). Alors VpG {l,...,n}, ap= "}2 xh--'Xip = (-ï)PJ?-. \<i\<>~<ip<n En particulier n n a1 = yy'xi = —-, a2= ^ XiXj = —y an = T\xi = (-l)n—. t=l l<î<j<n t=l 2.3. Dérivation dans K[X] DÉFINITION 4. Soit F = a0 + axX H (- anXn G K[X]. On appelle polynôme dérivé de F le polynôme F' = ax+ 2a2X + • • • nanXn-\ Remarque 5. - Si F est constant, F' = 0. La réciproque est vraie si K est de caractéristique 0, fausse en caractéristique non nulle (par exemple si F = X2 + i G Z/2Z[X], on a F' = 2X = Ô et pourtant F n'est pas une constante). - Les règles de dérivations de somme, produit et composée pour les polynômes sont identiques aux règles de dérivations usuelles sur les fonctions dérivables. D'ailleurs, sur M[X], la fonction polynôme dérivé coïncide avec la dérivée de la fonction polynôme. Théorème 2 (Formule de Taylor). Si le corps K est de caractéristique nulle, tout polynôme F de K[X] de degré inférieur ou égal à n vérifie Va G K, F(X) = F(a) + ^^-F'(a) + • • • + (X ~ fl)Vw>(a). JL • f L» Une conséquence importante de la formule de Taylor est la caractérisation de l'ordre d'une racine : Théorème 3. Si le corps K est de caractéristique 0, et si F G K.[X], F ^ 0, alors a G K est racine d'ordre h de F si et seulement si (i) Vi,0<i<h- 1, F(f)(a) = 0 (xi) F{h)(a) ^ 0. Remarque 6. - Le cas de F = X3 G Z/3Z[X] et a = Ô montre que ceci est faux en caractéristique non nulle (a est racine d'ordre 3 de F et pourtant F^(a) = Ô). - Le résultat du théorème reste vrai en caractéristique quelconque pour caractériser les racines simples. Plus précisément, on a le résultat suivant. Si F G K[X], F/0, et si a G K, alors a est racine simple de F si et seulement si F (a) = 0 et F'(a) ^ 0. En effet. Si F = (X - a)G, alors F' = G + (X - a)G' donc F'(a) = G{a) et on en déduit facilement le résultat.
2. FONCTION POLYNÔME, RACINES D'UN POLYNÔME 61 2.4. Polynômes d'interpolation de Lagrange Soient aiy... yan G K, deux à deux distincts, et &i,..., bn G K. Nous allons prouver qu'il existe un unique polynôme L G K[X]y deg(L) < n — 1, tel que Vz, L{ai) = bi. - Existence. Pour 1 < i < n, on pose L=(X-al)'"{X- a.-i)(X - ai+1) - - (X - an) (^ - ai) • • ■ (ai - ai-X)(ai - ai+i) • • • (a* - an) (les polynômes L; s'appellent des polynômes d'interpolation de Lagrange). On a Li(ai) = 1 et pour tout j ^ i, L{(aj) = 0. Si L = X^Li^»» on a al°rs ^(ai) = biLi(ai) = bi pour tout i et comme deg(L) < n — 1, L convient. - Unicité. Supposons que F et G conviennent. On pose H = F — G. Pour tout i, 1 < i < n, on a H(ai) = F(ai) — G(ai) = bi — bi = 0. Le polynôme H a donc au moins n racines. Or deg(H) < n — 1, donc d'après la conséquence de la proposition 2, H = 0, c'est-à-dire F = G. Remarque 7. Il existe une autre expression utile de L. Posons 3> = (X — ai) • • • (X — an) et pour tout z, 1 < i < n, <3>j le polynôme tel que $ = (X — a;)<3>j. Par dérivation, on obtient $' = $* + (X - ai)$J et donc $'(ai) = $t(o*), d'où on tire L.(X) = |i(g2 = *W x donc L(X) = $(X)[Y— ^-t-tV lK } §i(ai) (X-ai)$'(ai) v ' v } \^ (X - *)&(*)} Remarque 8. Plus généralement, on peut aussi définir Vinterpolation de Hermite en imposant au polynôme interpolant des conditions sur l'évaluation et les dérivées aux abscisses ai (voir l'exercice 7 page 66). 2.5. L'anneau quotient K[X]/(P) Notation. - Si P G K[X], on note (P) l'idéal (P) = {PQ | Q G K[X]}. - Si A P G K[X], on note A = B (mod P) lorsque i-5e(P). Soit P G K[X], P^O. Comme (P) est un idéal de K[X], le quotient K[X]/(P) définit une structure d'anneau (voir la partie 3.2 du chapitre I). Si A G K[X], la classe de A dans K[X]/(P) est À = A + (P) = {A + PQ | Q G K[X]}. On a par ailleurs i = P <=^ A = B (mod P) <=> P | (P - A). Théorème 4. 5o# P G K[X], deg(P) > 1. Alors K[X]/(P) est une K-algèbre de dimension finie n = deg(P). Si on note x = X, la famille (l,x,... ,xn_1) en est une base. Démonstration. L'anneau quotient K[X]/(P) est évidemment une K-algèbre. Montrons que la famille (1 1) en est une base. - C'est une famille génératrice. En effet. Soit A G K[X]. Il existe Q, R G K[X) tels que A = PQ + R avec deg(R) <n = deg(P). Donc À = Re Vect(l,rr,... ,rrn"1). - C'est une famille libre. Si ao + a\x + • • • + an-\xn~l = Ô , alors le polynôme A = ao + a>iX H h an-\Xn~l vérifie À = 0. Donc P | j4, et comme deg(i4) < deg(P), on a A = 0, donc a0 = ai = ... = an-i = 0. □ Proposition 4. 3W P G K[X], deg(P) > 1. L'anneau K[X]/(P) est un corps si et seulement si P est irréductible. Démonstration. Condition nécessaire. Si P est réductible, alors il existe Q et R G K[X] tels que P = Q#, avec 1 < deg(Q) < deg(P) et 1 < deg(J?) < deg(P). Donc Ô = QR avec Q ^ Ô et R i1 0, ce qui est absurde puisque K[X]/(P) est un corps par hypothèse. Donc P est irréductible. Condition suffisante. Supposons P irréductible. Soit A G K[J£], À ^ Ô. Le polynôme P ne divise pas A et P étant irréductible, P et i4 sont premiers entre eux. D'après le théorème de Bezout, il
62 2. CORPS, POLYNÔMES ET FRACTIONS RATIONNELLES existe U} V G K[X] tels que UP + VA = 1, d'où VA = i. Donc À est inversible, et ceci dès que À ^ Ô. Finalement, K[X]/(P) est un corps. □ Remarque 9. Ce résultat est analogue à la proposition 10 page 9 (ici aussi, on voit que les propriétés arithmétiques de Z et de K[X] sont semblables.) 2.6. Corps des racines d'un polynôme Toutes les extensions de corps considérées dans cette sous-partie seront commutatives. Notation. Si L est une extension de corps de K, pour tout A c L on note K(A) le plus petit sous-corps de L contenant K et A (il existe, c'est l'intersection des sous-corps de L contenant K et ^4). Lorsque A = {ai, • • • , an} est fini, on note souvent K(A) = K(oi,..., an) pour alléger les notations. Remarque 10. Si A et B sont deux parties de L, on a facilement K(A)(B) = K(AU B). Proposition 5. Soit P e K[X] irréductible dans K[X]. Il existe une extension h deK telle que P admette une racine x dans L. Démonstration. D'après la proposition 4, L = K[X]/(P) est un corps. L'injection canonique (p : K —> L a »->• à (c'est une injection car deg(P) > 1) permet d'identifier les éléments de K et de <£>(K). Ainsi, L apparaît comme une extension de K. En posant x = X G L, on voit que P{x) = P = 0. D Théorème 5. Soit F G K[X], deg(F) > 1. Alors il existe une extension LdeK sur laquelle le polynôme F soit scindé. Démonstration. Nous allons procéder par récurrence sur n = deg(F). Pour n = 1, c'est évident. Supposons le résultat vrai jusqu'à n — 1 et montrons le pour n. Soit G un facteur irréductible de F, et H tel que F = GH. D'après la proposition précédente, il existe une extension Li de K dans laquelle G admette une racine a\. On peut écrire G = (X — a\)G\ avec G\ G Li[X], et donc F = (X — a\)F\ avec F\ = G\H G Li[X]. Comme deg(Fi) = n — 1, il existe d'après l'hypothèse de récurrence une extension L de Li telle que F\ soit scindé sur L. Dans L[X], F est donc scindé. D Remarque 11. Une telle extension L de K dans laquelle F soit scindé s'appelle un corps de dissociation de F. Dans ce corps, on peut écrire F = X(X — ai) ■ • • (X — an) avec À G K* et ai,..., an G L. Le corps Li = K(ai,... ,an) est le plus petit sous-corps de L sur lequel F soit scindé. On peut montrer que Li ainsi défini est unique à un isomorphisme près (l'unicité n'est pas immédiate car il n'y a pas unicité du corps de dissociation L). On l'appelle corps des racines du polynôme F. DÉFINITION 5. Un corps K est dit algébriquement clos si tout polynôme de K[X] de degré > 1 a au moins une racine dans K. Remarque 12. Une récurrence immédiate sur le degré montre que si K est un corps algébriquement clos, tout polynôme de K[X] est scindé sur K. - On peut montrer que tout corps K admet une extension L algébriquement close (théorème de Steinitz). La plus petite extension L vérifiant cette propriété est unique à un isomorphisme près, et on l'appelle clôture algébrique de K. Nous ne démontrerons pas ce résultat. On a cependant le résultat suivant.
2. FONCTION POLYNÔME, RACINES D'UN POLYNÔME 63 Théorème 6 (Théorème fondamental de l'algèbre). Le corps C des nombres complexes est algébriquement clos. Remarque 13. Deux preuves différentes de ce résultat sont proposées dans le problème 4 page 84. - Le théorème fondamental de l'algèbre entraîne que les polynômes irréductibles de C[X] sont de degré 1. On montre que les polynômes irréductibles de R[X] sont les polynômes de degré 1 et les polynômes de la forme aX2 + bX + c avec b2 — Aac < 0. 2.7. Exercices EXERCICE 1. Montrer qu'un corps fini n'est pas algébriquement clos. Solution. Soit K = {ai,..., an} un corps fini. Le polynôme P = 1 + (X — ai) • • • (X — an) G K[X] vérifie P(a^) = 1 pour tout i. Donc P n'a pas de racine dans K, et K n'est pas algébriquement clos. EXERCICE 2. a) Si n e N, n > 2, factoriser Pn = {X + l)n - (X - l)n dans C[X]. b) En déduire pour tout p G N* la valeur de Ap = Vcot2f * \ et Bp = t] cot ( —-^-r P t[ V2P+V P £1 Vfc+l. Solution, a) Il s'agit de trouver les racines de Pn. Comme 1 n'est pas racine de P, on peut écrire pn(z) =0^ (^-^] =1^3M<fc<n-l, 2—^- = e2ifc7r/n. \z — 1J z+1 Le cas k = 0 est à exclure car on ne peut pas avoir j^ = 1. Sil<fc<n — 1, l'équivalence z + 1 _ 2ikn/n _ e2ik«'n + 1 _ eikn/n + e"ifc7r/n _ _. //çtt\ Z — \ ç2ik7r/n __ j çikn/n __ g—ikn/n V 72 / montre que z est une racine de Pn si et seulement s'il existe fce{l,...,n — l}tel que z = -icot (^f). Ainsi on a trouvé n — 1 racines distinctes de Pn. Le monôme de plus haut degré de Pn étant 2nXn~1} Pn est de degré n — 1 et n_1 T fkir^ IX + z cot — Pu = 2n II fc=i L b) Notons / kir Ck = COt 2p+lJ La relation de symétrie C2P+i-/c = — ck montre que Ap = ^ Y^kLi cfc- Les racines de P2p+i sont les Uk = —ick (avec 1 < k < 2p). Comme P2p+i(X) = 2(2p + 1)X2? + 2CÏp+1X2?-2 + ••• les relations entre coefficients et racines (voir le théorème 1 page 60) montrent que v^ Y- 2C2P+i P(2p-1) <ti = ^u* = 0 et a2= ^ ukUl = = . k=i i<k<e<2P v r ' Donc a 1Vr2 !^ 2 1f 2 n \ P(2P ~1) Ap=2l^Ck = ~2^k = ~2^1 " 2) = 3 " fc=i fc=i
64 2. CORPS, POLYNÔMES ET FRACTIONS RATIONNELLES - Par ailleurs, le terme constant de P2P+i est 2 et son coefficient dominant est 2(2p+ 1), donc le produit de ses racines est 2/(2(2p + 1)) = l/(2p + 1), donc Bv = fi cot ( kir 2p+l (-l)PIIcot fc=l kir .1/2 2p+l ■2P ,fc=i 1/2 1 x/2^TT EXERCICE 3. a) Montrer que pour tout n G N, n > 2, le polynôme n'a que des racines simples dans C. b) Montrer que pour tout n > 2, le polynôme Pn = Xn — X + 1 n'a que des racines simples dans C. Solution, a) Supposons que Pn ait une racine multiple zq G C. Alors Ph{zq) = Pnizo) = 0 et comme P'n = Pn_i, on a Pn_i(zo) = 0, donc Zq/tù = (Pn - Pn-i)(zo) = 0 d'où zq = 0. Ceci entraîne Pn(zo) = Pn(0) = 1 7^ 0, ce qui est absurde. Le polynôme Pn n'a donc que des racines simples dans C. b) Supposons que Pn ait une racine multiple z$ G C. Alors Pn(zo) = Pn(zo) = 0, c'est-à-dire Zq - zq + 1 = uzq~1 -1 = 0. Donc z% - zq + 1 = 0 et z% = z0/n, d'où zo(l/n - 1) + 1 = 0, c'est-à-dire zq = n/(n — 1). Ceci entraîne P^(zq) = nzj"1 - 1 = n (^) n-l - 1 > n - 1 > 0, ce qui est absurde. Le polynôme Pn n'a donc que des racines simples dans C. Exercice 4. 1/ Soit P G Q[X] irréductible dans Q[X]. Montrer que P n'a que des racines simples dans C. 2/ (Deux applications) a) Soit P G Q[X] un polynôme ayant une racine À G C d'ordre de multiplicité \i > deg(P)/2. Montrer que A G Q. b) Soit P G Q[X]t deg(P) — 2n + 1 avec n G N*, tel que P admette une racine d'ordre n. Si n > 2, montrer que P admet une racine clans Q. Solution. 1/ Il suffit de montrer d'après le théorème 3 que P et P' n'ont aucune racine commune, ce qui équivaut (voir la remarque 4) à montrer que P et P' sont premiers entre eux dans C[X], ce qui n'est qu'un cas particulier du résultat plus général suivant (d'ailleurs utile !). Lemme. Soit K un corps commutatif, L un surcorps commutatif de K. Soient P et Q e K[X] deux polynômes premiers entre eux dans K[X]. Alors P et Q sont premiers enfre eux dans h[X]. En effet, cela provient de l'égalité de Bezout. Il existe U et V G K[X] tel que UP + VQ = 1, égalité qui reste évidemment vraie dans h[X], d'où le lemme. Maintenant le polynôme P étant irréductible dans Q[X]y P et P' sont premiers entre eux dans Q[X] (car deg(P') < deg(P)) donc dans C[X] d'après le lemme précédent. 2/ a) Soit P = aP\ •••Pfc la décomposition de P en facteurs irréductibles de Q[X]. Parmi Pi,... ,Pfc, il y a r polynômes dont À soit racine, par exemple Pi,... ,Pr. Si À ^ Q, comme Pi, • • • ,Pr sont à coefficients rationnels, on a deg(Pf) > 2 pour 1 < i < r. Or d'après 1/, les Pi
2. FONCTION POLYNÔME, RACINES D'UN POLYNÔME 65 étant irréductibles, À est racine simple de Pi pour 1 < i < r. Donc fi = r. Donc k r deg(P) = ^2deg(Pi) > ^deg(Pi) >2r = 2/jl, i=l i=\ ce qui est contraire aux hypothèses car fi > deg(P)/2. On a donc forcément À G Q. b) Par hypothèse, il existe une racine À G C d'ordre n de P. Supposons que P n'ait aucune racine dans Q. Alors dans la factorisation de P en facteurs irréductibles de Q[X], P = aPi • • • Pfc, on a deg(Pi) > 2 pour tout i. Parmi Pi,... , Pfc, il y a r polynômes dont À soit racine, par exemple Pi,... ,Pr. D'après 1/, les Pi étant irréductibles, À est racine simple de Pi pour 1 < i < r. Donc r = n (et donc k>r = n). - On a fc = n. En effet. Si A; > n, alors k n n deg(Pk) < J^deg^) - J>eg(Pi) = deg(P) - J>eg(Pf) < deg(P) - 2n = 1, ce qui est absurde car on a vu deg(Pfc) > 2. - Donc P = aPi • • • Pn. Le degré de P étant impair, il existe un polynôme Pi de degré impair, par exemple deg(Pi) impair. Comme de plus deg(Pi) > 2, on a deg(Pi) > 3. - Il existe un polynôme Pi de degré 2 (sinon pour tout z, deg(P^) > 3 donc 2n + 1 = deg(P) = X^Lideg(P;) > 3n, absurde car n > 2), par exemple deg(P2) = 2. Effectuons la division euclidienne de Pi par P2 : Pi = QP2 + R} avec R G Q[X] et deg(R) < deg(P2) = 2. On a R ^ 0 car Pi est irréductible et deg(Pi) > deg(P2). Or À est racine de R (car Pi (A) = 0 = Q(A)P2(A) + J?(À) = jR(A)), donc comme Jî ^ 0 et deg(iî) < 1, on en déduit A G Q, ce qui est contradictoire. Le polynôme P admet donc au moins une racine rationnelle. Remarque. Si n = 1, le résultat 2/b) est faux (prendre par exemple P = X3 — 2). Exercice 5. Déterminer les polynômes P non constants de C[X] vérifiant P(X2) = P(X)P(X+l). (*) Solution. Soit P G C[X] vérifiant (*) avec deg(P) > 1. Soit a une racine de P. Comme P(a2) = P(a)P(a + 1) = 0, a2 est une racine de P. En itérant le procédé, on voit que a2, a4,... ,a2n,... sont des racines de P. Le polynôme P n'ayant qu'un nombre fini de racines, on doit avoir a = 0 ou \a\ = 1. (**) D'après (*), P[(a - l)2] = P(a - l)P(a) = 0, donc (a - l)2 est une racine de P. D'après (**), on doit avoir \(a — 1)2| = 0 ou \(a — 1)2| = 1, c'est-à-dire a = 1 ou \a — 1| = 1. (***) D'après (**) et (***), on a soit (i) a = 0, soit (ii) a = 1, soit (iii) |a — 1| = |a| = 1. On vérifie facilement que la condition (iii) s'écrit aussi a = 1 + j ou a = 1 + j2 où j = exp(2z7r/3). Or (a - l)2 est une racine de P donc d'après (**), \(a — l)2 - 1| G {0,1}, et comme \j2 - 1| > 1 et IC?2)2 — 1| = \j' — 1| > 1) on voit que les solutions (iii) ne conviennent pas. Nécessairement, on a donc a G {0,1}. Ainsi, le polynôme P est de la forme P = \XP(X — l)qy A G C*. Comme P vérifie (*), on a \X2P(X2 - l)q = X2Xp(X - l)q(X + 1)^«, d'où on déduit p = q et A = 1. Réciproquement, si P est de la forme XP(X — l)p, on vérifie facilement que P vérifie (*). Les solutions sont donc les polynômes de la forme XP(X - l)p, p G N*.
66 2. CORPS, POLYNÔMES ET FRACTIONS RATIONNELLES Exercice 6. a) Soit P G C[X], deg(P) > 2. Montrer que les racines de P' appartiennent à l'enveloppe convexe des racines de P. b) Que dire sur les racines de P' si P G R[X] a toutes ses racines réelles ? Solution, a) Soient a\,..., an les racines de P, comptées avec leur ordre de multiplicité, de sorte que si /? désigne le coefficient dominant de P, P = fi(X — a\) • • • (X — an). On a facilement P'{X) _ y, 1 P(X) -LtX-Oi' Soit a une racine de Pf. Si a est une racine de P, le résultat est évident. Sinon P^a) = y^ 1 = A 5-5Î et en passant au conjugué n / n 1 \ n d'où le résultat. b) D'après a), les racines de P' sont réelles. On a même plus de renseignements sur leur localisation. Soient ai,... ,ap les racines de P avec a\ < • • • < ap , d'ordre de multiplicité ai, • • • ,ap, de sorte que si P est le coefficient dominant de P, P = (3{X — a\)ai • • • (X — ap)ap. D'après le théorème de Rolle, pour tout i G {1,.. .p — 1}, il existe bi G ]ai,ai+i[ tel que P'(bi) = 0. On a ainsi trouvé p — 1 racines de P'. - Pour tout i tel que o>i > 2, ai est racine de P' d'ordre de multiplicité ai — 1 (voir le théorème 3). Comptées avec leur ordre de multiplicité, on a ainsi localisé (p— 1) + Ylï=i(ai— 1) = Œ,i ai) ~ 1 = deg(P) —1 = deg(P') racines. On a donc localisé toutes les racines de P' : ce sont les bi G ]a;,aj+i[ et les ai tels que ai > 2. Exercice 7 (Interpolation de Hermite). Soit p G N*, p entiers naturels non nuls ni,...,np et n = Y%=inî- a) Soit K un corps commutatif et x\>..., xp G K, deux à deux distincts. Soient des points yi,k de DC, définis pour 1 < i < p et 0 < k < rii. Montrer qu'il existe un unique polynôme P G K[X] tel que deg(P) < n et tel que V(i, fc) G N* x N, 1 < i < p, 0 < k < niy P(fc)(^) = !/<,*. b) Soit / un intervalle de E et / : / —> M une fonction de classe Cn. On considère p points #1 < ... < xp de I. Si P est le polynôme d'interpolation de Hermite de degré < n vérifiant P(k\xi) = f^k\xi) pour 1 < i < p et 0 < k < n^ montrer que Vx G /, 3£ G /, f(x) - P(x) = ï^ f[(x- Xi)ni • (*) ni fx Solution, a) Notons Vn le s.e.v des polynômes de K[X] de degré < n, et considérons l'application linéaire (p : P„ - Kn P -> (P(m),..., P^1-1^);... ; P(zp),..., P^"1^)). Il s'agit de montrer que <p est bijective. Calculons son noyau Ker<£>. Supposons <£>(P) = 0 avec P e Vn. Pour z = 1,... ,p, on a P(k\xi) = 0 pour 0 < k < n^, donc Xi est une racine d'ordre
2. FONCTION POLYNÔME, RACINES D'UN POLYNÔME 67 hi > ni d'après le théorème 3 page 60. Ceci étant vrai pour tout z, on peut donc écrire P sous la forme p P = Q Y[(X - Xi)hi avec Q G K[X). gi Q ^z 0, on a degP > Ya=i h% ^ Ya=i ni = n> ce Qu^ est impossible puisque P G Pn. Donc Q = 0, ce qui entraîne Kenp = {0}. Donc (p est injective. Comme l'e.v d'arrivée Kn de l'application linéaire (p a même dimension que son e.v de départ Pn, on en déduit d'après le théorème du rang que (p est bijective. b) Soit x e I. S'il existe i tel que x = x\ le résultat (*) est immédiat puisque f(xi) = P(xi). Dans le cas contraire, on considère A G M tel que p <px : / -> M t .-> /(*) - P(t) - ^11^ " *<)"* vérifie tpx(x) = 0. La fonction ipx est de classe Cn. Notons N(f) le nombre de zéros de / dans I comptés avec leur ordre de multiplicité (l'ordre de multiplicité k d'un zéro a d'une fonction g de classe Cn est le plus petit entier k < n tel que g^k\a) ^ 0 ; on prend k = n + 1 si #(a) = ... = g^n\(y) = 0). On a N((px) > n + 1 car <#c(#) = 0 par construction, et tpx (#i) = 0 pour 1 < i < p et 0 < k < ni. On remarque maintenant que pour toute fonction g : / —> M de classe Cm, on a Af(</) > N(g) — 1 (la preuve est immédiate en remarquant que si a est un zéro de g d'ordre fc, alors a est un zéro de g1 d'ordre k — 1, et qu'entre deux zéros de g il y a au moins un zéro de g1 d'après le théorème de Rolle). Ainsi, N{^x) > n, N(ipx) > n — 1,..., N((px) > 1- Donc il existe £ G / tel que <Px(Ç) = 0, ce qui s'écrit aussi f(n\Ç) - ni A = 0, d'où le résultat. Exercice 8. Donner la forme des polynômes P G R[X] scindés sur R, de degré n > 2, à racines toutes distinctes ai < a<i < • • • < an, tels que Vi,l<i<n-1, p/^+^+A 0 w Solution. Nous allons montrer que les polynômes vérifiant la condition sont ceux de degré 2. Si P = a(X — ai)(X — a2) est de degré 2 (avec ai < a<i et a G M), on a P' = a(2X — ai — a2) donc P vérifie la condition (*). Si maintenant P = o^Y17=i(^ " ai) est de degré n > 3 (ai < • • • < an, a ^ 0), on écrit P = (X — ai)(X — a2)Q avec Q = o^Yl7=3(^ " a*)- ^ar dérivation, on obtient P'(X) = (2X -ai- a2)Q{X) + (X - oi)(X - a2)Q'(X). Si P vérifie (*), on a donc Q;(a*^a?) = 0, ce qui est impossible car - Si deg(Q) = 1, Q' est une constante non nulle. - Si deg(Q) > 2, Q1 s'annule au moins une fois sur chaque intervalle ]a;,a;+i[ (2 < i < n — 1) d'après le théorème de Rolle, donc Qf a au moins n — 3 racines distinctes dans l'intervalle ]a2,an[. Comme deg(Q') = n — 3, on en déduit que toutes les racines de Qf sont dans ]a2,an[ et comme Qi+Q2 0 ]fl2,an[, on aboutit à une contradiction. Exercice 9 (Principe du maximum). Soit P G C[X] un polynôme non constant. Soit r > 0. Montrer W0 G C, |2q| < r, |P(*o)| < sup \P{z)\. \z\=r Solution. Tout découle du résultat suivant.
68 2. CORPS, POLYNÔMES ET FRACTIONS RATIONNELLES Lemme. Va eC,V/j> 0, 36 G C, \b-a\< p tel que \P(b)\ > |P(a)|. En effet. Quitte à multiplier P par e1^ avec ip G R bien choisi, on peut supposer P(a) G R+. Soit n = degP, et posons Q(X) = P(X + a) = £?=o qiX\ On a q0 = Q(0) = P(a) G R+. Par ailleurs, qn ^ 0 de sorte que fc = inf {i | 1 < 2 < n, a* ^ 0} existe. On peut écrire Q(-z) = Qo + 9fc2fc(l + <K<z)) avec lim V^O2) = 0. z—*0 Il existe p', 0 < p' < p tel que Vz G C, \z\ < p', \(p(z)\ < 1/2. Écrivons qk = \qk\eie, 6 G R. Soit zo = p'e~t6fk. On a Q(zo) = tfo + kfcl/^tl + ¥>(zo)}> donc comme (fo € R+ : \Q(zo)\ > \qo + N/| - ||flb| A>(«>)| > <7o + N/ - i|%|/ = q0 + i|tt|/ > go = |Q(0)|. Si 6 = a + z0> on a donc \b - a\ = p' < p et \P(b)\ = \Q{z0)\ > |Q(0)| = |P(a)|, d'où le lemme. Montrons maintenant le résultat demandé. L'ensemble C = {z G C, \z\ < r} est compact, et l'application z t-> \P{z)\ étant continue 3*1 € C, H < r, |P(*!)| = sup \P(z)\. (*) l*l<r Si |zi| < r, le lemme entraîne l'existence de Z2 G C, \z2\ < r tel que |P(*2)| > |P(*i)|> ce qui est absurde d'après (*). Donc \z\\ = r et donc sup|2|<r \P(z)\ = sup|2|=r |P(*)|, d'où : Si zq g C, ko! < r, \P{z0)\ < supN<r \P{z)\ = supN=r \P(z)\. Remarque. On trouve dans le tome d'analyse (voir le chapitre sur les fonctions de plusieurs variables) un résultat équivalent sur les fonctions harmoniques. - Plus généralement, le lemme permet également de montrer que pour tout compact o on a : Vzq G C, |F(zo)| < suP^çFr(C) 1^(^)1 °ù Fr(C) désigne la frontière de C. Exercice 10. On considère n entiers distincts ai,a2, • • • , an. a) Prouver que P = (X — ai)(X — a2) • • • (X — an) — 1 est irréductible dans Z[X] (c'est- à-dire que si P = F G avec F, G G Z[-AT], alors F ou G est constant). b) Prouver que P = (X - ai)2(X - a2)2 • • • (X - an)2 + 1 est irréductible dans Z[X]. Solution, a) Supposons P réductible dans Z[X]. Il existe deux polynômes F, G G Z[X)y deg(F) < n et deg(G) < n, tels que P(X) = {X- ai)(X - 02) • • • (X - on) - 1 = FpQGPQ. Pour tout i, 1 < i < n, on a F(ai)G(a,i) = — 1 (*). Comme F et G sont à coefficients entiers, F(a;) et (2(a;) sont entiers. Avec (*), on en déduit que pour 1 < i < n, F(ai) = —G(ai) = ±1. Le polynôme F+G s'annule donc aux points a;, 1 < i < n. Or deg(F+G) < sup{deg(F), deg(G)} < n, ce qui entraîne la nullité de F + G. Donc F = —G} d'où P = —F2. Cette dernière égalité est impossible puisque P est unitaire et que —F2 ne l'est pas. D'où le résultat. b) Supposons P réductible dans Z[X). Il existe F, G G Z[X], deg(F) > 1 et deg(G) > 1, tels que P = (X- cn)2(X - a2)2 • • • {X - an)2 + 1 = F(X)G(X). On peut supposer F et G unitaires (l'égalité précédente entraîne que les coefficients dominants de F et G sont égaux tout deux soit à 1, soit à -1). Soit k = deg(F), £ = deg(G)> de sorte que k + H = 2n. La forme de P montre que pour tout réel rr, P(x) > 1. Ainsi, P ne s'annule pas sur R, il en est donc de même de F et G qui alors gardent un signe constant sur M. De plus F et G sont unitaires et prennent donc des valeurs > 0 sur M. Pour tout z, 1 < i < n, F(ai)G(ai) = 1 (**). Comme de plus F{ai) et G(ai) sont entiers et positifs, on en déduit que pour tout z, F(ai) = G(ai) = 1.
2. FONCTION POLYNÔME, RACINES D'UN POLYNÔME 69 Si k = deg(F) < £ = deg(G), alors k < n. Or pour tout i, F{aî) = 1 ; autrement dit, le polynôme F — 1 s'annule en n points donc est nul (son degré est < n). Finalement F = 1, ce qui est absurde car deg(F) > 1. De même l'inégalité i < k est impossible. On a donc deg(F) = âeg(G) = n. D'après (**), pour tout i, 1 < i < n, F(a,i) = G{cn). Le polynôme F — G s'annule donc en n points. Or deg(F—G) < n— 1 (F et G sont de degré n et sont tout deux unitaires), donc F—G = 0. Donc F = G. Finalement, on a P{X) = F(X)2, c'est-à-dire F(X)2 - (X - ai)2 • • • (X - an)2 = 1 ou encore [F-(X-a1)---{X-an)][F + {X-ai)---(X-an)] = lt égalité impossible à réaliser. Le polynôme P est donc irréductible dans Z[X]. Remarque. On peut également montrer que (X — ai)4 • • • (X — an)A + 1 est irréductible dans Z\X\, mais c'est plus difficile. - En fait, les polynômes exhibés sont irréductibles dans Q[X]. En effet, d'après le lemme de Gauss (voir l'exercice 4 page 58) tout polynôme de Z[X] irréductible dans Z[X] est irréductible dans Q[X]. Exercice 11 (Quelques polynômes irréductibles). Si F = a0 + aiX-\—anXn g Z[X], on note (pour p G N*), F = ô^ + a~{X -\ h a~^Xn G Z/pZ[X] où pour tout i, ai désigne la classe de ai clans Z/pZ. 1/ Si P G Z[X]t unitaire, est tel que P G Z/pZ[X] est irréductible dans Z/pZ[X], montrer que P est irréductible dans Z[X\. La réciproque est elle vraie ? 2/ Montrer que F = X4 + X + 1 est irréductible dans Z[X]. 3/ Soit p e N* un nombre premier et F = Xp - X - 1 e_Z[X]. a) Soit a une racine de F dans le corps des racines de F. Montrer que les racines de F sont exactement a, a + 1, • • • , a + p — 1. b) En déduire que F est irréductible dans Z/pZ[X], et que F est irréductible dans Z[X]. Solution. 1/ C'est immédiat. Si P = FG avec F, G G Z[X], unitaires, alors P = F G dans Z/pZ[X]. Comme P est irréductible dans Z/pZ[X], ceci entraîne deg(F) = 0 ou deg(G) = 0. Les polynômes F et G étant unitaires, on a deg(F) = deg(F) et deg(G) = deg(G) et donc F ou G est constant, ce qui prouve l'irréductibilité de P dans Z[X] (P est alors irréductible dans Q[X], voir l'exercice 4 page 58). La réciproque est fausse. Par exemple, P = X2 — 2X — 1 est irréductible dans Z[X] et pourtant P = (X — ï)2 n'est pas irréductible dans Z/2Z[X]. 2/ On va montrer que F est irréductible dans Z/2Z[X], ce qui prouvera le résultat en vertu de 1/. Supposons F = PQ avec P,Q e Z/2Z[X], deg(P) > 1, deg(Q) > 1. Le polynôme F n'a aucune racine dans Z/2Z, donc deg(P) = deg(Q) = 2. Le coefficient dominant et le coefficient constant de F étant égaux à 1, P et Q sont nécessairement de la forme P = X2 + aX + ï et Q = X2 + bX + ï, a,beZ/2Z. Donc F = X4 + X + Ï = PQ = XU- (a + b)(X3 + X) + (2 + a + b)X2 + ï, et donc_le coefficient de X3 est égal à celui de X dans F, ce qui est absurde étant donnée la forme de F. 3/ a) Notons K le corps des racines de F, a une racine de F dans K. Le corps K étant de caractéristique p (car surcorps de Z/pZ), on a Va; G K, F(z) = F(x) - F(a) = xp - ap - (x - a) = (x - af - (x - a) (pour se convaincre de la dernière égalité, développer (x — a)p par la formule du binôme et utiliser le fait que p \ Cp si 1 < k < p — 1). Donc a: G K est une racine de F si et seulement si x — a
70 2. CORPS, POLYNÔMES ET FRACTIONS RATIONNELLES est une racine de Xp — X, c'est-à-dire si et seulement si x — a G {0,1,... ,p — 1} (les racines du polynôme Xp — X sont Ô, 1,... }p — 1 en vertu du théorème de Fermât). b) Soit G un facteur irréductible unitaire de F dans Z/pZ[X]. Notons k = deg(G). D'après la question précédente, les racines de G dans K sont de la forme a + ai, • • • , a + a^ où les a^ sont dans Z/pZ. De plus G étant unitaire, le coefficient du monôme de degré k — 1 de G est au signe près la somme de ses racines. Comme G a ses coefficients dans Z/pZ, on en déduit que Yli=i(a + ai) e Z/pZ, et comme les a; G Z/pZ, ka G Z/pZ. Or a £ Z/pZ (sinon F(a) = (ap — a) + 1 = 1 ^ 0). Le fait que ka G Z/pZ entraîne donc que k = 0 et donc A; = p puisque 1 < fc < p. Donc G est de degré p ce qui entraîne que F = G est irréductible dans Z/pZ. Donc F est irréductible dans Z[X] d'après la question 1/. Exercice 12 (Polynômes de Tchébycheff). a) Montrer que pour tout n G N*, il existe un unique polynôme Tn G R[X] tel que V0 G M, Tn(cos0) = cosn0 et calculer le coefficient dominant de Tn (les Tn s'appellent les polynômes de Tchébycheff). b) Montrer que tout P G R[X] unitaire de degré n G N*, on a ||P||oo > 21_n où on note ||P||oo = 8UPt6hl|1]|P(t)|. Solution, a) En posant x = cos0, on voit que Tn(cos0) = cosn0 si et seulement si [n/2] [n/2] Tn(rc) = &[(cos 0 + i sin 0)n] = £ Cf cos7*"2* 0 (- sin2 6)k = £ C2^n"2fc(a;2 - l)fc. (*) fc=0 fc=0 Ceci montre l'existence et l'unicité de Tn, dont la forme polynomiale est donnée par le dernier membre de (*). D'après (*), Tn est de degré n et son coefficient dominant est YJk=o ^nk = 2n_1. b) Remarquons déjà que l'identité Tn(cos#) = cos n6 entraîne ||Tn||oo = 1. Donc le polynôme unitaire Un = 21~nTn vérifie ||£/n||oo = 21-n. Soit P G R[X] unitaire et de degré n. Raisonnons par l'absurde et supposons ||P||oo < 21_n = ||£/n||oo- Le polynôme Q = Un — P est de degré < n — 1 (car P et Un sont unitaires et de degré n). En posant Xk = cos kir/n} on remarque maintenant que Tn(xk) = coshn = (—l)k pour 0 < k < n. Donc Q{xk) = (—l)k21~n — P(xk)} et comme |P(^)| < ||P||oo < 21_n ceci montre que Q{xk) est non nul et a le signe de (—1)*. Ainsi, les n + 1 points {xk)o<k<n vérifient — 1 = xn < xn-\ < ... < x\ < xq = 1 et Q change de signe entre Xk+i et Xk (pour 0 < fc < n — 1). Donc Q a au moins n racines, et comme deg(Q) < n on a forcément Q = 0, donc P = Un ce qui est absurde puisque ||P||oo < 21_n par hypothèse. Remarque. La propriété de mini-max ||P||oo > ||^n||oo pour tout P G R[X] unitaire et de degré n est remarquable, et fait de la famille (Tn) des polynômes de Tchébycheff une base commode pour l'interpolation polynomiale. 3. Fractions rationnelles Dans toute cette partie, K désigne un corps commutatif. 3.1. Généralités L'anneau K[X] étant intègre, son corps des fractions existe bien. On le note K(X). Proposition 1. Soit F e K(X), F ^ 0. On peut écrire F = P/Q avec P etQ e K[X], Q unitaire, P et Q premiers entre eux, et ceci de manière unique. L'écriture P/Q s'appelle la forme réduite de F.
3. FRACTIONS RATIONNELLES 71 DÉFINITION 1. Soit F G K(X), F ^ 0, F = N/D sa forme réduite. Un élément a G K est dit pôle de F d'ordre h si a est racine de D d'ordre h. Le résultat fondamental portant sur les fractions rationnelles est le suivant. Théorème 1 (Décomposition en éléments simples). Soit F g K(X), F ^ 0, N/D sa forme réduite. Soit D = D*1 • • • D%n la décomposition de D en facteurs irréductibles de K[X]. On peut écrire, de manière unique n fou F=E+i:[t% e de F relative au "avec E G K[X], A{j G K[X] et deg(Aij) < deg(A)- Le polynôme E s'appelle la partie entière de F et s'obtient comme le quotient de la division euclidienne de N par D. Les deux parties suivantes s'attachent à donner des méthodes de calcul des éléments simples Ai4/D\ pour K = C et K = R. 3.2. Pratique de la décomposition dans C(X) Il est indispensable de bien savoir décomposer en éléments simples (on s'en sert en particulier pour le calcul de primitives de fractions rationnelles). Soit F G C(X),F 7^ 0, de forme réduite N/D. Le corps C étant algébriquement clos, on peut écrire D = (X — ai)ai • • • (X — an)an avec ai G C pour tout i et ai G N*. Appliquant le théorème précédent, on voit que l'on peut écrire de manière unique F=E+ib[è,{xa-aiy) avec a«ecetEec[x]- Comme on l'a déjà dit, on obtient E comme le quotient de la division euclidienne de N par D. Pour tout i, le terme YJ . %'3 v s'appelle partie principal pôle ù{. Nous allons donner des méthodes pratiques de calcul des aij. Partie principale relative à un pôle simple. Soit F G C(X), F^O, N/D sa forme réduite. Soit a un pôle simple de F. La partie principale de F relative à a est de la forme — avec À G C, et on peut écrire F = — = — h G avec G G C(X), a n'étant pas a — a D X — a un pôle de G. On peut également écrire D = (X — a)Di avec Di G C[X] et D\(a) ^ 0, de sorte que ^- = \ + (X-a)G donc A =-£§-. (*) D\ Di(a) Par ailleurs, l'égalité D' = D\ + (X — a)D[ donne D'(a) = D\(a), ce qui donne un autre moyen de calculer À : A - ^L (**) Remarque 1. (*) et (**) s'utilisent dans des circonstances différentes : (*) quand on connaît une forme explicite de Dïy (**) sinon (voir les exemples qui suivent). Exemple 1. - Soit _ X + 3 a b F = -r— .. w,-—rr = T7 r + (X-l)(X + 2) X-l X + 2 Grâce à (*), on trouve a = 4/3 et b = —1/3.
72 2. CORPS, POLYNÔMES ET FRACTIONS RATIONNELLES - Soit F = ^P , avec P G C[X], deg(P) < n. Notons v = e2i^n. On a Xn - 1 = A n — 1 n—1 n—1 Y[(X — u>k), donc F = S2 y fc» a* e ^- Grâce à (**), on trouve fc=0 &=0 Ûfc = P(uk) ujk u, k, A „ 1 vi w*P(w*) - -P(^), donc F=-J21TZ-T n(ujk)n-1 n v y nf-* X-uk Partie principale relative à un pôle multiple. Soit F G CjX], N/D sa forme réduite, et a G C un pôle d'ordre h > 2 de F. On peut écrire £> = (X - a)hD0 avec £>0 € C[X] et D0(a) ^ 0. Posons DX(T) = D0(T + a), Ni(T) = N(T + a) et Fi(T) = F(T + a). On a ^iCH = J^Tlx • Ainsi, si M = K + - • • + a1T/l-1)D1+T/l,S', (5 G C[X]) est la division lnVi{l ) selon les puissances croissantes de N\ par £>i à l'ordre h — 1, on a : T T2 Th Di(T) et donc 1 J X-o (X-o)fci- D0(X) ' On a ainsi obtenu la partie principale relative au pôle a. X + 3 Exemple 2. Recherchons la partie principale de F = —— —— relative au pôle 1 d'ordre 4. On a, avec les notations précédentes, NX(T) = T + 4 et £>i(T) = T + 2. On effectue la division euclidienne de T+4 par T+2 selon les puissances croissantes à l'ordre 3, ce qui donne 4 +T -T \rp2 21 4 1 2+T 2-±T+±T2-§T3 On en déduit que la partie principale de F relative au pôle 1 est -1112 + TTT7 TT^-^TTT TTX + 8(X-1) 4(X-1)2 2(X-1)3 (X-1)4' En pratique, on n'utilise cette méthode que si l'ordre du pôle est grand (typiquement supérieur à 3 ou 4). La plupart du temps, on procède par identification en donnant à X certaines valeurs particulières et en utilisant certaines propriétés de F comme la parité, le fait que F est à coefficients réels, et en utilisant la remarque suivante : Si a est un pôle N d'ordre h de F, on peut écrire F = — yrpr> A)(a) ^ 0, et a n'étant pas un pôle de G. En multipliant cette dernière égalité par (X — a)h, on obtient -£■ = ah + (X - a) [afc_i + • • • + ax(X - a)h~2 + (X - a)h~lG] . En donnant à X la valeur a, on trouve un moyen commode de calculer ah : £>o (a)
3. FRACTIONS RATIONNELLES 73 X + 2 Exemple 3. F = —-—~so,„—rr^ se décompose en éléments simples sous la forme (A + lr{X - 2)z „ a b c d F= — T + TT7 ^ + T7 7 + X-2 {X-2)2 X + l (X + l)2' En utilisant la relation (***), on trouve b = 4/9 et d = 1/9. Par ailleurs, en multipliant F par X, en regardant X comme un nombre réel et en le faisant tendre vers +oo, on trouve (i) 0 = a + c. Or F(0) = \ = =± + | + c + d, donc [il) | = — a + 2c. De (i) et (ii), on trouve a = ^ et c = J^. D'autres décompositions en éléments simples dans C(X) sont traitées à l'exercice 1. 3.3. Pratique de la décomposition dans R(X) On trouve dans R(X) les deux types d'éléments simples suivants : Ceux du premier type sont appelés éléments simples de première espèce, ceux du second type des éléments simples de seconde espèce. Pour décomposer F G R(X) en éléments simples dans M(X), on peut - Soit décomposer F en éléments simples dans C(X) et regrouper les termes conjugués (en général à éviter). - Soit procéder par identification, en utilisant les propriétés de F (parité, ...). Des exemples sont traités dans l'exercice 2. 3.4. Exercices EXERCICE 1. Décomposer en éléments simples clans C(X) les fractions rationnelles suivantes : a) (x2-i)2(x2 + iy ' Ix^Tï' Solution, a) On commence par scinder le dénominateur de F dans C[X], ce qui donne (X2 - 1)2{X2 + 1) = {X - 1)2(X + 1)2(X + i)(X - i). On peut donc écrire t-> a b a> V c c' , , , Comme F est impaire, l'unicité de la décomposition de F en éléments simples permet d'identifier la décomposition de F(X) et de F(—X), ce qui donne a = a! et b = —br. De plus F est à coefficients réels, donc F(X) = F{X) et par identification c — d. La relation (***) de la partie 3.2 donne b = g et c = ^ = |. Donc br = — | et d = |. Multipliant F par X, regardant X comme un nombre réel et en le faisant tendre vers +00, on tire 0 = a + a' + c + d. Donc 2a = a + 0! = -{d + c) = - J, d'où a = a! = -\. b) Recherchons les racines de Xb + 1. On a x5 + 1 = 0 <=ï rr5 = -1 = e™ <=ï x = e***/^2**/5) = wfcl (A; G {0,1,2,3,4}). Ainsi les (u;fc)o</c<4 sont 5 racines distinctes du dénominateur de F, et comme ce dernier est de degré 5, tous les pôles de F sont simples. On obtient le coefficient de la partie principale ûfc/pf - cjk) de F en utilisant l'identité (**) page 71, qui donne ak = wjS/(5a;jJ) = V^- Donc F=if -J-.
74 2. CORPS, POLYNÔMES ET FRACTIONS RATIONNELLES Exercice 2. Décomposer en éléments simples dans R(X) les fractions rationnelles suivantes. X2 1 a) F= (x4 + x2 + i)2' b^ F= x(x2 + i)2' ^ r, X7 + 2 1X „ 1 c) F=WTxTW d) F = ^rn-"€N*- Solution, a) On a (X4 + X2 + l)2 = (X2 + X + 1)2(X2 - X + l)2 donc -, L , , , m „ aX + 6 cX + d eX + f gX + h 3a,6,c,rf,e,/,^,/iG]R, F= v9 , v , , +/Tr9 , v , iX9 + ^ tttt + X2 + X + l (X2 + X + l)2 X2-X + l (X2-X + l)2' Comme F est paire, l'unicité de la décomposition en éléments simples permet d'obtenir e = —a, / = 6, g = —c, h = d. Multipliant F par (X2 + X + l)2 puis en remplaçant X par j = e2î7r/3, on obtient j2 j2 1 1 cJ + d = T^ • , i\o = t? = 7 donc c = 0etd=-. 02-J + l)2 4j2 4 4 On a F(0) = 0 = 6 + d + f + h = 26+ |, d'où 6 = -±. OnaF(i) = -1 = 2Sjbè_(ci + d)-2+Z-(^ + /i), donc -1 = 2a+^-z(c+s)-(<2+/i) = 2a - 2d = 2a - §, d'où a = -±. Finalement on a trouvé 1,1 rt , 1 1^1 « t 1 a = ~4> 6=-4> c = 0> d=i> e = i> / = "i' ^ = 0' /l=4" i \ ti ii ttt, i t-. a bX + c dX + e - r . — b) Il existe a, 6, c, a,e G M tels que F = — + -zp^—- + 7^775—7775-. La fraction F est impaire, a xz +1 (a ^ + iy donc c = e = 0. D'après la relation (*) de la partie 3.2, on a a = 1. Multiplions F par (X2 + l)2 puis remplaçons X par i. On obtient \ = di + e = di donc d = — 1. Multipliant F par X, regardant X comme un nombre réel et en le faisant tendre vers +00, on obtient 0 = a + 6, donc b = — a = — 1. c) Il s'agit d'un cas classique, qui se traite par divisions euclidiennes successives. On trouve X7 + 2 = (X2 + X + l)(Xb -X4 + X2-X) + (X + 2), d'où X7 + 2 _ X + 2 X5-X4 + X2-X (X2 + X + l)3 ~ (X2 + X + l)3 + (X2 + X + l)2 ' W On recommence, en divisant cette fois ci Xb — X4 + X2 — X par X2 + X + 1. On obtient Xb - X4 + X2 - X = (X2 + X + 1)(X3 - 2X2 + X + 2) - 4X - 2, donc X5-X4 + X2-X 4X + 2 X3-2X2 + X + 2 (X2 + X + l)2 (X2 + X + l)2 X2 + X + 1 ' ^ ) De même la division X3-2X2 + X+ 2 = (X2 + X+ 1)(X - S) + (SX + 5) entraîne X3 - 2X2 + X + 2 _ 3X + 5 X2 + X + 1 ~ X2 + X + 1 De (*), (**) et (***), on tire F= * + 2 4X + 2 3X + 5 (X2 + X + l)3 (X2 + X + l)2~1~X2 + X + li~l ;' Ce procédé est facile et à retenir. d) On décompose d'abord dans C(X). On pose u = e™ln, de sorte que X2n-1 = Y}S^(X-u)k)' Donc F = Y^Jq ^z^, où d'après l'identité (**) page 71, ak = l/[2n(wfc)2n"1] = wfc/(2n)- + X - 3. (***)
3. FRACTIONS RATIONNELLES 75 Il ne reste plus qu'à regrouper les termes conjugués. Lorsque 1 < k <n — 1, on a k w(2n-fc) ^k wk 2cos(hir/n)X-2 X-uk X-u(2n~k) X-uk X-ûk X2-2ç.os{kir/n)X + r donc 2n-l .. in— i r. 1 I 1 1 n—i _ _ 1 ^ UT _ 1 1 1 y^ 2 C = 2^ ^ X-U}k~2^l \X-1~X + 1+^X2- k=0 L fc=l n * 2cos(fc7r/n)X-2 + 1 £-'X2-2cos()br/n)X + l EXERCICE 3. a) Pour tout n G N*, montrer qu'il existe un polynôme Pn G R[X] de degré n tel que b) Pour tout n G N*, décomposer la fraction rationnelle Fn = l/Pn en éléments simples dans R(X). Solution, a) On procède par récurrence sur n G N*. Pour n = 1, c'est évident en prenant P\{X) = X. Supposons le résultat vrai jusqu'au rang n — 1 et démontrons le au rang n. On a AC—U K — JL où m = [(n — l)/2] est la partie entière de (n — l)/2 et où rn = Cn si n est pair, rn = 0 si n est impair. On peut donc écrire XU + ~h = {X + ^)n " Î2CnPn-2k (X + £) - rn, AC = JL Ainsi, le polynôme PnP0 = Xn — Y^k=i CnPn-2k{X) — rn vérifie la propriété requise, et on a bien deg Pn = n. b) Commençons par chercher les pôles de Fn, qui sont les racines de Pn. On a Pn(x+-\=0 <^=>- Xn + — = 0 <=ï X2n = -1 *=>> X = Uk = e*(2*+lW(2") (jfe € Z). Ainsi, pour tout fc G Z, la valeur ^ = Wfc + J- = c<(2*+l)ir/(an) + e-<(2fc+l)ir/(2n) = 2œs (2fc + V* est une racine de Pn. On remarque que les Xk sont deux à deux distincts lorsque 0 < k < n — 1, et comme deg(Pn) = n, ceci montre que rro,rri,... , rrn_i sont les racines de Pn et qu'elles sont simples. Maintenant, on peut écrire (grâce à la relation (**) page 71) " p» hp^xk) x-xk' Il ne reste plus qu'à remarquer, après dérivation de la relation Pn(X + l/X) = Xn + l/Xn} que donc oît^ (2A 2 _ - (2A;+l)7r d'où la décomposition en éléments simples de Fn en reportant cette égalité dans (*).
76 2. CORPS, POLYNÔMES ET FRACTIONS RATIONNELLES Exercice 4. Pour tout F G C(X), on note DF = C \ {ai,..., an} (où ai,..., an sont les pôles de F) et on identifie F avec la fonction Dp —> C 2 »-> F(z). a) Si F G C(X) est non constante, montrer que (i) F(DF) = C ou (ii) 3a G C I F(L>F) = C \ {a} et caractériser les fractions rationnelles F vérifiant l'assertion (ii). b) Si F, G G C(X), et si G n'est pas une constante qui est un pôle de F, il est possible de définir la composée F o G e C(X). Donner la forme des fractions rationnelles F et G G C(X) telles que la fraction rationnelle F o G soit un polynôme. Solution, a) Soit F = N/D la forme réduite de F. Par hypothèse, F est non constante donc l'un au moins des polynômes TV, D est non constant. Pour tout À G C, l'équation F(z) = X (z G Dp) est équivalente à (TV — XD)(z) = 0 {z G C). (En effet, si (TV — XD)(z) = 0 alors on doit avoir D(z) ^ 0 sinon TV et D ont une racine commune, donc z G Dp). Deux cas se présentent : (i) Pour tout À G C, le polynôme TV — XD est non constant. Le corps des nombres complexes étant algébriquement clos, TV — XD admet une racine z\ pour tout À G C. Ainsi, pour tout A G C, F(zx) = X et on en déduit F(DF) = C. (ii) Il existe a G C tel que TV — aD est constant. Pour tout À ^ a, le polynôme TV — XD est non constant (si TV — XD est constant pour À ^ a, il est facile de voir que l'on doit avoir TV et D constants, ce qui est contraire aux hypothèses) donc admet au moins une racine z\ qui vérifie F(z\) = X. Ainsi, C \ {a} C F(DF)- De plus, le polynôme TV — aD est une constante non nulle (si elle est nulle, F est constant égal à a), donc l'équation TV — aD = 0 n'a pas de solution. Finalement, F (Dp) = C \ {a}. Les fractions rationnelles F = N/D vérifiant (ii) sont celles vérifiant 3c G C* | TV — aD = c. Ainsi, F = N/D = (aD + c)/D = a + c/D est de la forme F = a + 1/P où P est un polynôme non constant et réciproquement, une fraction rationnelle de cette forme vérifie (ii). b) Si F est constant, F o G = F est toujours un polynôme. De même, si G est constant et si G n'est pas un pôle de F, F o G est une constante donc un polynôme. Supposons maintenant F et G non constants. Si a est un pôle de F, on a lim*-<> \F(z)\ = +00, donc si a = G (fi) G G(Dg), le théorème de composition des limites entraîne lim \FoG(z)\ = +00 Z-+0 ce qui est impossible si F o G est un polynôme. Ainsi nous venons de montrer Si F o G est un polynôme, tout pôle de F appartient àC\ G(Dq). (*) D'après la question précédente, l'ensemble C \ G(Dq) a au plus un élément, ce qui montre que nécessairement F a au plus un pôle. - Si F n'a pas de pôle, c'est-à-dire si F est un polynôme, alors si F o G est un polynôme, G est un polynôme. En effet, si G admet un pôle /?, alors lim*-»/? \G(z)\ = +00 et le polynôme F étant non constant on en déduit lim \F o G(z)\ = +00 car lim \F(z)\ = +00, z-+0 \z\->+oo et F o G ne peut donc pas être un polynôme. - Si F admet un seul pôle a, on peut écrire F sous la forme F=P(xX-~ar PeClx] et herr Pour que F o G soit un polynôme, la propriété (*) entraîne C \ G(Dq) = {oc}. Comme G n'est pas constant (le cas G constant a été traité plus haut), d'après la question a), ceci entraîne G = a + 1/Q où Q est un polynôme non constant. On a alors FoG=w=Qfep(r/Q)-
4. POLYNÔMES À PLUSIEURS INDÉTERMINÉES 77 En écrivant P = Y2=o ak xk (où n = degP), ceci s'écrit aussi F o G = Y%=0 ak Qh~k, et ceci est un polynôme si et seulement si n = deg(P) < h. Réciproquement, il est facile de vérifier que les solutions trouvées conviennent. Finalement, F o G est un polynôme si et seulement si l'une des conditions suivantes est vérifiée : (i) F est constant. (ii) G est constant et n'est pas un pôle de F. (iii) F et G sont des polynômes. (iv) F est de la forme F = /v ^ \, où P G C[X] et deg(P) <h,etG de la forme G = a + l/Q [X — a)'1 où Q € C[X]. 4. Polynômes à plusieurs indéterminées 4.1. Généralités Soit A un anneau commutatif unitaire. L'ensemble A[X] est aussi un anneau commuta- tif unitaire. On peut donc définir l'anneau des polynômes à une indéterminée à coefficients dans A[X]. C'est ^4[X][F], noté aussi A[X, Y], appelé anneau des polynômes à coefficients dans A à deux indéterminées. Les éléments de A[X, Y] sont ceux de la forme P = YJHJXiY^ HjeA où la somme sur (i, j) est finie. Par récurrence, on définit même j4[Ai, ..., Xn] = A[Xi,..., Xn_i][Xn], anneau des polynômes à coefficients dans A kn indéterminées. - Si A = K est un corps commutatif, K[Xi, • • • , Xn] est une K-algèbre, dont {XÎ1 • • • X% | (zi,..., in) e Nn} est une base. - Si A est intègre, A[Xi,..., Xn] est un anneau intègre. Si n > 2, et K est un corps, K[Xi, • • • ,Xn] n'est pas un anneau principal (en revanche c'est un anneau factoriel, ce qui lui confère des propriétés arithmétiques ; cette notion n'est pas au programme de mathématiques spéciales). Définition 1 (Degré partiel). Soit P e A[Xi,...,Xn] et i, 1 < i < n. On peut écrire P = J^. PjXf avec pour tout j, Pj G A[Xi,..., Xi-i,Xi+i,..., Xn\. On appelle degré partiel de P selon Xi le degré de P considéré comme polynôme en Xi et on le note degXi(P) (avec les notations précédentes, degx.(P) = sup{j | Pj ^ 0}). Définition 2 (Degré total). Le degré total d'un monôme aX\l • • -Xnn, a ^ 0, est ii + • • • 4- in> Si P G A[Xi,..., Xn], le degré total de P, noté deg(P), est le plus grand degré total des monômes qui forment P. De même que dans K[X], on peut définir dans K^,..., Xn] des fonctions polynôme de n variables. On a en particulier le résultat suivant. PROPOSITION 1. Soit K un corps commutatif infini et un polynôme P G K[Xi,... ,Xn]. Si P(x\,..., xn) = 0 pour tout n-uplet (rci,..., xn) de Kn, on a P = 0. Remarque 1. - Comme pour les polynômes à une indéterminée, ce résultat est faux si K est un corps fini. Par exemple dans Z/pZ[Xi,... ,Xn] (p premier), le polynôme P = (Xi)(J^i — T) • • • (Xi — (p — l))X2 • • • Xn est non nul et pourtant, pour tout #1,..., xn G Z/pZ, P(xi,..., xn) = 0.
78 2. CORPS, POLYNÔMES ET FRACTIONS RATIONNELLES - Attention, même si K est un corps infini, on peut avoir P(x\,... ,xn) = 0 pour une infinité de n-uplets (#i,... ,£n) sans que P = 0 (prendre par exemple P(X, Y) = X-Y smR[X,Y]). 4.2. Polynômes symétriques Définition 3. Un polynôme P G A[X\,.. .,Xn] est dit symétrique si pour tout a G <Sn (où <Sn désigne le groupe symétrique d'indice n), P(Xa^,... ,Xa(n)) = P(X\,..., Xn). Exemple 1. Dans R[Xt Y,Z], P = XY + YZ + ZX est symétrique. Définition 4 (Symétrisé d'un monôme). Soit M = X?1 • -X%n G ;4[Xi, • • -Xn\. Si <j G <Sn, on pose Ma = X^l, ■ • --^Qjv. Le polynôme y^ Ma est symétrique dans Ma distincts A[Xi,..., Xn]. On l'appelle symétrisé de M dans A[X\,..., J£n] et on le note J^ M. Exemple 2. Dans K[Xi, X2], £*i2*2 = X?X2 + XXX\. Dans K[Xi,Xa.Xa], E^i^2 = *i2*2 + *i*22 + X|X3 + X\X2 + X?X3 + Xi*32. (On voit sur cet exemple que les symétrisés d'un monôme dans A[Xi,... ,Xm] et dans A[Xi,..., Xn] sont différents si n ^ m). Polynômes symétriques élémentaires. On appelle polynômes symétriques élémentaires de A[Xi,..., Xn] les polynômes notés Ep (1 < p < n) et définis par Ep = 2^ Xi • • • Xp = 2_^ Xh---Xip. i\<--<ip On a en particulier Ei = 2_^ Xi = Xi + ■ ■ - + Xn, E2 = 2_^ -^1^2 = 2_^ XiXj, T,n = X\ • - ■ Xn. Les polynômes symétriques élémentaires vérifient l'égalité fondamentale (T - X^ • • • (T - Xn) = Tn - EiT71"1 + E2Tn~2 + • • • + (-l^E^T + (-l)nEn. En particulier, si P = Xn + a\Xn~l H h an est un polynôme de K[X] scindé sur K et si iii,..., un sont ses racines, alors Vi, 1 < i < n, (—1)^ = Ej(wi,..., tin). Remarque 2. Si $ G A[XU ..., Xn], alors 3>[Ei(Xi,..., Xn),..., En(Xi,..., Xn)] est un polynôme symétrique de A[Xi,..., Xn]. La réciproque est vraie : tout polynôme symétrique peut se mettre sous cette forme. Plus précisément, on a le théorème suivant : Théorème 1. Soit A un anneau commutatif unitaire et P G A[Xi,..., Xn] un polynôme symétrique dans A[Xi,..., Xn]. Il existe un unique polynôme <É> G A[Xi,..., Xn] tel que P = $(E!,...,En). Remarque 3. Une preuve classique de ce résultat consiste à utiliser la méthode de Waring dont le principe est de faire diminuer la hauteur de P en lui retranchant le produit d'une constante et de polynômes symétriques élémentaires. Un cas typique d'utilisation de cette méthode fait l'objet de l'exercice 1. Exemple 3. Dans A[XU ..., Xn], £ xi = si - 2^2 et £ X\X2 = EiE2 - 3E3. Remarque 4. Ce théorème entraîne le résultat suivant. Soit P G %[X] un polynôme unitaire. Les fonctions symétriques <7i,..., an de ses racines ui,..., un sont donc entières. Si F G Z[Xi,..., Xn] est symétrique, alors F(wi,..., un) G Z (en effet. D'après le théorème il existe G G i\Xu ..., Xn] tel que F = <7(Ei,..., En), et donc F(«i,..., un) = <?(o-i,...,o-n) €Z).
4. POLYNÔMES À PLUSIEURS INDÉTERMINÉES 79 4.3. Exercices EXERCICE 1. Exprimer les polynômes P suivants comme un polynôme $ en les polynômes symétriques élémentaires o*. a) p = X3 + Y3 + Z3 G R[Xt Y", Z]. b) P = E *i*2*3 G R[Xi, ...,Xn] pour n > 5. SWttrton. a) On a (X + y + Z)3 = X3 + Y3 + Z3 + 3X2y + 3X2Z + 3y2X + 3y2Z + 3Z2X + 3^2y + 6XYZ, et donc X3 + Y3 + Z3 = E? - 6E3 - 3£X2y. Or £X2y = EiE2 - 3E3. Finalement, on a P = E? - 3EiE2 + 3E3. b) Rappelons que la méthode générale (méthode de Waring) pour trouver le polynôme $ consiste à faire diminuer la hauteur de P (la hauteur de P est la plus grande des hauteurs de ses monômes, la hauteur d'un monôme aX^1 • • • X%n étant (ai,..., an), ordonnée par l'ordre lexicographique). Ici, le monôme de plus haut de P est X2X2X^. On va donc commencer par retrancher P à Q3X\X2){^2X\X2X^) = E2E3. Calculons ce dernier terme. Chaque monôme de E2E3 est de degré total 5 (produit de deux monômes de degré total 2 et 3) et est moins haut que X^X^X^. On peut donc écrire 3a, 6, c, E2E3 = a^2 X\X\XZ + b J^ X2X2X3X4 + c J^ X1X2X3X4X5. Le nombre a est le coefficient de X2X2X^ dans E2E3. C'est donc le nombre de manières de former X2X2X^ par un monôme de E2 multiplié par un monôme de E3. Il n'y a qu'une seule façon de faire ceci. C'est X\X\XZ = (X1X2)(X1X2X3)1 donc o = 1. - De même, on a b = 3 car les façons d'écrire X2X2X^X4 comme le produit d'un monôme de E2 par un monôme de E3 sont X2X2X3X4 = (X1X2)(X1X3X4) = (X1X3)(X1X2X4) = (XiX4)(XiX2X3). - On trouve de même c = C\ = 10. - Finalement, on a P - E2E3 = -3 £ X\X2X3X4 - 10J2XiX2X3X4X5. Par des méthodes analogues aux précédentes, on trouve E1E4 = 2_^ Xi X2XzX± + 5 2_^ XiXiXzXtXs, et donc Y^X2X2X$X± = E1E4 — 5E5. Finalement, on a P = E2E3 - 3(EiE4 - 5E5) - IOE5 = E2E3 - 3EiE4 + 5E5. Remarque. Il est conseillé dans ce type de calcul de vérifier les résultats, en donnant par exemple an, Xi,..., Xn des valeurs particulières. Exercice 2. Soit P = X3 +pX + q e R[X] et ce, £,7 ses racines complexes. a) Calculer A = (a — P)2(/3 — 7)2(7 — ce)2 en fonction de p et q. b) En déduire une condition nécessaire et suffisante portant sur p et q pour que P ait trois racines réelles. Solution, a) Posons ai = a 4- P + 7, cr2 = oc(3 + /?7 + 7a, «73 = a/?7. La relation entre coefficients et racines d'un polynôme (voir le théorème 1 page 60) donne a\ = 0, o~2 = p et 03 = —q. Comme A est symétrique en a, /?, 7, on peut l'exprimer comme un polynôme en ai, o~2, 03. Plutôt que de calculer directement ce polynôme (les manipulations sont lourdes), nous allons utiliser une technique dont les calculs sont plus simples. Supposons dans un premier temps q ^ 0, c'est-à-dire a/?7 = 0-3 ^ 0, de sorte que a, fî et 7 sont non nuls. On a (a - (5)2 = a2 + (52 - 2a/?. Or a2 + fi2 + 72 = a\ - 2o2 = -2p, donc (a - p)2 = -2p - 72 - 2a/3 = -2p - 72 + —. 7
80 2. CORPS, POLYNÔMES ET FRACTIONS RATIONNELLES On montrerait de même (/3-7)2 = _2p_a2 + ^ et (7-a)2 = -2p-/?2 + ^. Où p Finalement, on a x racine de P Recherchons un polynôme Q dont les racines sont les y = —2p — x2 + 2q/x (x = a,/?, 7). { x3 + px + q =0 ( x2 = -p- q/x ( 0 = 1 + p/x2 + q/x3 -2p - x2 + 2q/x = y \ y = -p + 3g/a; \ x = 3q/(y + p) 3g y V 39 Donc Q = X3 + 6pX2 + 9p2X + (4p3 + 27g2). Le nombre A apparaissant comme le produit des racines de Q, on en déduit A = -(4p3 + 27g2). Ceci est vrai pour q ^ 0. Si q = 0, alors une des racines de P est nulle, par exemple a, et alors A = /?V(/? - 7)2. Or <n = 0 = /? + 7, donc 7 = -/? et donc A = /34 ■ (2/3)2 = 4/36. Il ne reste plus qu'à remarquer que p = a<i = /?7 = —/32, et donc A = —4p3. Finalement, dans tous les cas, A = -(4p3 + 27g2). b) Le polynôme P G R[X] est de degré impair et admet donc au moins une racine dans R (c'est classique ! Comme \imx-++00 P(x)P(—x) = —00, il existe a > 0 tel que P(a) et P(—a) aient des signes opposés, et P étant continue, il existe x G ] — a,a[ tel que P(x) = 0 d'après le théorème des valeurs intermédiaires). Notons par exemple a une telle racine réelle. Deux cas se présentent. - Premier cas. p et 7 sont réelles. Alors A = (a — fi)2 (fi — a)2 (7 ~~ a)2 ^ 0- - Second cas. p et 7 sont non réelles. Alors elles sont complexes conjuguées. Autrement dit, on peut écrire (5 = x + iy et 7 = x — iy avec x, y G M, y ^ 0. On a alors A = ((a - /?)(<* - 7)) V - 7)2 = (|a - pffpiy)2 = -%2|a - /?|4 < 0 Finalement, on voit que P a trois racines réelles si et seulement si A = — (4p3 4- 27ç2) > 0. Remarque. Ce dernier résultat peut également s'obtenir à partir des formules de Cardan donnant les racines de P en fonction de ses coefficients (voir l'annexe A). - Le nombre A s'appelle le discriminant de P. De manière générale, pour tout polynôme Q de degré n > 2 dont on note rci,..., xn les racines, le discriminant de Q est défini par A = Ilio-te ~xj)2- Comme A est symétrique en les a^, il s'exprime comme un polynôme en les coefficients de Q. On voit par ailleurs que Q n'admet que des racines simples si et seulement si A ^ 0. Exercice 3 (Formules de Newton). Soit un entier n > 2. On appelle sommes de Newton les polynômes n Sp = 2^ Xf G K[Xi,..., Xn]. Comme Sp est symétrique, il s'exprime comme polynôme en les polynômes symétriques élémentaires : Sp = $p(Ia,..., En). On se propose de donner des formules simples permettant de calculer le polynôme $p. a) Soit (#1,... ,rcn) G Rn. Pour tout p G N*, on pose sp = Y^=i x\ et Pour tout *> on pose ai = Sj(xi,... ,rcn), a\ = (—l)Vf. Soit P = ECliP^ ~~ x*)- ^n Partant de l'identité
5. PROBLÈMES 81 P' = E?=i x^> montrer VA;, 1 < k < n - 1, Sk- EA-i + • • • + (-l)*"1^^ + (-l)kkXk = 0. (*) b) Pour tout p G N, donner une relation entre Sn+P, Sn+p-i,..., Sp. Solution. On a P = Xn + a'-^X11-1 + • • • + o'n-\X + a'n. Pour tout i, la division euclidienne de P par X — X{ donne -JL- = Xn~l + (xi + a[)Xn-2 + (xf + fflxi + ^)Xn"3 + • • • si — X{ ••• + Kn"1+^n_2 + ---+<-2^ + ^n-l)- (**) En sommant l'égalité (**) pour 1 < i < n, on trouve n P P' = J2 IFZ— = nXH~l + (Sl + n°'i)xn~2 + (s2 + o-[Sl + n^)Xn"3 + • • • »=i X Xi • • • + (Sn_i + aisn-2 H + 0"n-2sl + no^). Or on sait que P' = nXn~l + (n — l)a[Xn~2 + • • • + o',n_1. En identifiant les coefficients, on trouve Vfc, 1 < k < n - 1, s*. + Sfc-i</i H 1- si^fc_i + ka'k = 0. Autrement dit, si Pk = Sfe-S^-iEiH h(-l)*-15iEjfe_i + (-l)*fcEjfe, on a Pk(xi, ■•■ ,xn) = 0, et ceci pour tout {x\>..., rcn) G Rn, donc P^ = 0 (1 < k < n — 1) d'où le résultat. b) Il suffit de remarquer que Vi, x*+n + (riaf-"-1 + • • • + a'n_lX\+l + ^ = 3*P{xi) = 0, et en sommant cette égalité pour 1 < i < n : Sp+n + ViSp+n-i H 1- (Jn_1Sp+i + <7nSp = 0. Ceci étant vrai pour tout (x\,... ,xn) G Mn, on en déduit que Sp+n — £i<Sp+n-i + • • • + (—1) £n_i5p+i + (—1) Sn5p = 0. Remarque. En procédant par récurrence sur p, ces formules permettent de trouver facilement les polynômes en Ei,..., En égaux à Sp. Elles peuvent en particulier s'inverser (pour 1 < p < n), ce qui prouve que les E^ (1 < i < n) s'expriment comme des polynômes en les Si (1 < i < n). Donc tout polynôme symétrique de R[Xi,... ,Xn] peut s'exprimer comme un polynôme en les sommes de Newton Si,..., Sn. 5. Problèmes Problème 1 (Transformée de Fourier discrète d'un polynôme). On se fixe un entier n > 1 et on note uj = e2î7r/n. a) Pour tout polynôme P G C[X], on définit les polynômes n—1 n—1 Fd(P) = Y,P(uk)Xk et 7d(P) = ^P(a;-yGC[I]. fc=0 A;=0 Si P G C[X] et deg(P) < n - 1, montrer que ~Td \Td{P)\ = nP. b) Conséquence. Soit P G TL\X\ vérifiant (i) Vj G Z, \P(u>j)\ < 1 (u) 3k G {0,1,..., n - 1} tel que P(uk) = 0. Montrer que (Xn - 1) divise P.
82 2. CORPS, POLYNÔMES ET FRACTIONS RATIONNELLES Solution, a) Écrivons P = ao + a\X + • • • + an-\Xn 1. Si 0 < & < n — 1, le coefficient de Xk dans Fd[Fd(P)] es^ [^(p)](w-*)=£p(^>-j'fc=x; i=o j=o n-l J2aiujii i=0 U) ~jk n-l = £ w^'E" 0<tj'<n-l i=0 n-l Dw<~fc)J' (*) Lorsque 0 < z < n — 1, Ç = ul fc est une racine n-ième de l'unité égale à 1 si et seulement si i = fc, donc 7-^ In si z = fc 3=0 K Ainsi, (*) s'écrit [Fd{P)]{v~k) = nafc- Donc n—1 n—1 fc=0 fc=0 b) Commençons par effectuer la division euclidienne de P par Xn — 1 : P = (Xn — 1)Q + i?, deg(i?) < n - 1 et (Q, i?) G Z[X] (le quotient et le reste sont à coefficients entiers car Xn - 1 est unitaire, voir la remarque 3 de la partie 1.3 — page 54). Pour tout entier jf, on a P(uji) = R{u^) dont R vérifie également (i) et (ii). Or deg(i?) < n — 1, donc d'après a), 3=0 -XK n n (**) Ml-l n-l Or Fd(R)(u-3) = E?=0 R{ul)u~v, donc \Td(R)(u)-J)\ < E?=o \R(v%)\, et R vérifiant (i) et (ii), cette dernière inégalité entraîne Fd(R)(*>-j) n n (***) D'après (**), comme R est à coefficients entiers, on a ^^rf(i2)(ci;~J') G Z, donc d'après (***), ^^rf(i2)(u;~J') = 0, et ceci pour tout j, 0 < j < n — 1. De (**) on en déduit R = 0 et donc Xn — 1 divise P. Problème 2. 1/ Soit P G C[X] tel que Vn G N, P(n) G Z. a) Montrer que P G Q[X]. b) Plus précisément, si d = deg(P), montrer que d\P G Z[X]. 2/ Soit F G C(X) une fraction rationnelle telle que pour tout entier n G N qui n'est pas un pôle de P, F(n) G Q. Montrer que F G Q(X). 3/ Soit P G C(X) une fraction rationnelle vérifiant : pour tout entier n G N qui n'est pas un pôle de P, F(n) G Z. Montrer que P est un polynôme de Q[X]. Solution. 1/ a) Si P est constant, le résultat est évident. Sinon d = deg(P) > 1. Considérons les polynômes d'interpolation de Lagrange Lk = TT I ——r ) pour 0 < k < d, de sorte que si 0<i<d V k ~ % J ijik j G N, 0 < j < d, Lk(j) = 0 si j'^ k et Lk(k) = 1. Le polynôme Q = J2k=op(k)Lk Prend les mêmes valeurs que P aux d+ 1 points 0,1,...,d. Autrement dit, P — Q s'annule en d+ 1 points. Or deg(P - Q) < d, donc P - Q = 0, et donc P = Q = T,î=0P(k)Lk G Q[X] car P(fc) G Z et £* G Q[X}.
5. PROBLÈMES 83 /7I M b) Remarquons que d\Lk = (-l)d~fc ' JJ (X - i), et comme . = C\ est un entier, on en déduit d\Lk G Z[X]. Donc d!P = £fc=oP(fc) ■ (d!Lfc) G Z[X]. Remarque : On ne peut pas faire mieux. Par exemple, P = X(X — 1) • • • (X - d + l)/d! est de degré d et vérifie Vn G N, P(n) G Z. 2/ Nous allons en fait montrer le résultat plus fort suivant. Si F G C(X) vérifie (3N > 0,Vn G N,n > iV, si n n'est pas un pôle de F, F(n) G Q) alors F G Q(X) (*). Si F = P/Q où P et Q G C[X] sont premiers entre eux, nous allons prouver (*) par récurrence sur r = deg(P) + deg(Q) (si F = 0, il n'y a rien à montrer). - r = 0. Alors P et Q sont constants et le résultat est évident. - Supposons le résultat vrai jusqu'au rang r — 1 et montrons le au rang r. Quitte à considérer 1/F, on peut supposer deg(P) > deg(Q). Soit a G N un entier suffisamment grand. Par hypothèse, P(a)/Q(a) est rationnel et si G= l X-a F(X) - P^ = £1 où p*{x)=P(X)Q(a)-Q(X)P(a) Q(a)\ Q v ' Q{a)(X-a) alors P* G C[X] et deg(P*) < deg(P). De plus \/n,n > a, G(n) G Q. On peut donc appliquer l'hypothèse de récurrence qui entraîne G G Q(X). Donc F = (X - a)G + P(a)/Q(a) G Q(X). 3/ D'après 2/, F G Q(X). Écrivons F = E + P/Q, où E> P et Q sont des polynômes de Q[X) avec deg(P) < deg(Q). Soit a G N* tel que aE G Z[X\. Comme deg(P) < deg(Q) on a limn^+00 P(n)/Q(n) = 0 et donc il existe N > 0 tel que pour tout n> N, \aP(n)/Q(n)\ < 1. Or aE G Z[X], donc pour tout n G N,n > Nt aP(n)/Q(n) = aF(n) - aE(n) G Z. On en déduit P(n) = 0 pour tout n G N tel que n> N. Ceci implique P = 0 et donc F = E e Problème 3. Soit P = Xn + aiXn_1 + • • • + an_iX + an e C[A"]. On note p > 0 le plus grand des modules des racines de P, et on suppose que les a* ne sont pas tous nuls, de sorte que p ^ 0. 1/a) Montrer que p < sup{l, Y%=i M}- b) Montrer que p < 1 4- sup^^ |oj|. 2/ a) On pose f(x) = xn - (|oi| rcn_1 + • • • + |an_i| x + |an|). Montrer que / admet une unique racine strictement positive a, que si 0 < x < a alors f(x) < 0, et que si x > a alors f(x) > 0. Prouver ensuite (21/71 — 1) a < p < a. b) Si R = sup!<fc<n Kl1/*, montrer R/n < p < 2R. Solution. 1/a) Si p < 1, c'est terminé. Sinon, considérons a G C une racine de P telle que |a| = p. L'égalité P{a) = 0 s'écrit aussi an = —aian_1 — • • • — an-\a — an, donc &2 Où = —CL\ a p=\a\< \ai\ &7l— 1 &71 syTl ~ C\^ , M . , Kl p pn~l ce qui entraîne 1/TrJ l/7.„l (*) p- - Comme p > 1, on en déduit /? < |ai| 4- K| + • • • 4- |an|. b) Si p < 1, c'est terminé. Sinon, en posant a = sup1<i<n K, l'inégalité (*) entraîne
84 2. CORPS, POLYNÔMES ET FRACTIONS RATIONNELLES et donc p — 1 < a d'où p < 1 + a. 2/a) La fonction g(x) = f(x)/xn est une fonction croissante (somme de fonctions croissantes) strictement sur ]0, +oo[. De plus, elle vérifie lim g(x) = — oo et lim g(x) = 1. Ceci montre qu'il existe a > 0 et b > 0 tels que #(a) < 0 et g(b) > 0. D'après le théorème des valeurs intermédiaires, il existe donc a > 0 (compris entre a et b) tel que #(a) = 0. Comme g est strictement croissante, on a g(x) < 0 pour 0 < x < a et #(a;) > 0 pour x > a. Comme f(x) = xng(x), on en déduit /(a) = 0, f(x) < 0 pour 0 < x < a, /(x) > 0 pour x > a. (**) Ceci étant, l'inégalité (*) entraîne /(p) < 0, d'où on tire p < a d'après (**). Il reste à prouver l'inégalité (21/71 — 1) a < p. L'expression des coefficients d'un polynôme en fonction de ses racines montre que \dk\ < Ckpk pour 1 < k < n, donc Va; > 0, J2 \ak\xn-k < £ Cknpkx^k = (p + x)« - s», fc=i fc=i ce qui entraîne Va; > 0, f(x) >xn- ((p + x)n - zn) = 2xn - (p + z)n. Le terme 2xn - (p + x)n s'annule lorsque 2l/nx = p + a;, c'est-à-dire lorsque a; = —. . Ainsi, / f —. j > 0 et on en déduit grâce à (**) que —^ > a, ou encore p > (21/71 — 1) a. b) Pour montrer p < 2R il suffit de montrer a < 2R d'après la question précédente. En vertu du principe (**), on se ramène donc à prouver que f(2R) > 0. Par définition de R, on a \ak I < Rk pour tout jfe, 1 < k < n. Si r = 2#, on a donc \ak\ rn~k < rn/2k, d'où |a1|r-1 + ... + K_1|r + |an|<r-(i + ... + i)<r", d'où f(r) = f(2R) > 0. - Montrons maintenant R/n < p. On a vu plus haut que |ajt| < Ckpk pour 1 < k < n. Or Ck = n--- (n-k + l)lk\ < nk, donc |ajt| < nkpk, donc si 1 < k < n, —— < p, d'où le résultat. n Problème 4 (Théorème fondamental de l'algèbre). Le but du problème est de prouver que tout polynôme de C[X] de degré > 1 admet au moins une racine dans C, c'est-à-dire que le corps C est algébriquement clos. 1/ Première méthode. Soit P G C[I], unitaire, deg(P) > 1. a) Montrer qu'il existe z0 G C tel que |P(^o)| = inf^c |-P(^)|. b) Montrer que P(z0) = 0. 2/ Seconde méthode. Soit P G R[X] unitaire, d = deg(P) = 2nq avec q impair et d > 1. On veut montrer par récurrence sur n G N que P admet au moins une racine dans C. a) a) Montrer le résultat pour n = 0. /3) Supposons le résultat vrai jusqu'au rang n — 1. On sait (voir le théorème 5 page 62) qu'il existe une extension de corps K de C et x\t..., xj G K tels que P = Yu=i(X — x^). Pour tout c G M et pour 1 < i < j < d, on pose yij(c) = jc» 4- Xj + cxiXj. Montrer que pour tout c G M, il existe (ic, jc) tels que yic,jc(c) G C. 7) Montrer qu'il existe c G R tel que xic + yic et xicyic G C. Conclure. b) En déduire le théorème fondamental de l'algèbre.
5. PROBLÈMES 85 Solution. 1/ a) Écrivons P = Xn + a\Xn~l + • • • + aniX + an. Pour tout z G C*, on a p[z) = zn(l + ^-\ + f£), donc ^m\z\^+oo \P(z)\ = +oo, et donc il existe M > 0 tel que pour tout nombre complexe z tel que \z\ > M, on ait \P(z)\ > |P(0)|. Ceci entraîne m(\P(z)\= in( \P(z)\. z€C \z\<M Or K = {z e C | \z\ < M}, fermé borné de C, est compact, et l'application z *-* \P{z)\ étant continue, il existe zq G K tel que |P(^o)| = '^z€i< \P(z)\- On a donc |P(^o)| = infzeC l-P(^)|- b) Raisonnons par l'absurde. Si P{zq) ^ 0, posons 2=0 Ici, 6o = Q(0) = 1 et bn ^ 0, donc k = mî{i G N, 1 < i < n \ bi ^ 0} existe bien. On peut d'ailleurs écrire Q(z) = 1 + bkzk(l + ip(z)) avec lim ip(z) = 0. z—>0 Soit r > 0 tel que |p(*)| < 1/2 pour |z| < r. Écrivons 6fc = \bk\eie, 9 G M. Soit z = re"^e+^'k. On a Q(z) = l-|6fc|rfc(l + v?(z)). Quitte à diminuer r > 0 on peut supposer \bk\rk < 1, et donc IQWI < |1 - Nrfc| + |&fcr\>(*)| < (1 - Ifcfclr*) + \\bk\rk = 1 - i|6fc|rfc < 1. Ceci prouve que \P(z + 2o)|/|P(*o)| < 1> donc que \P(z + ^o)| < |P(2o)|> ce qui est absurde car |P(*o)| = infz6c |PMI- On a donc bien P(z0) = 0. 2/ a) a) Si n = 0, alors deg(P) = q est impair. Le polynôme P étant à coefficient réels et unitaire, on peut écrire P(x)~+OQXq et Pfân-ooX9 donc q étant impair, lim P(x) = +oo et lim P(x) = — oo. x—>+oo x—>—oo On en déduit qu'il existe a G M+ tel que P(a) > 0 et P(—a) < 0. La fonction polynôme P étant continue sur M, d'après le théorème des valeurs intermédiaires il existe c G ] — a,a[ tel que P(c) = 0. D'où a). /?) Fixons c G M. Soit Q = Yli<i<j<d(^ ~~ Vhji0))- Les coefficients de Q sont des polynômes symétriques à coefficients réels en les Xi, et donc (voir le théorème 1 page 78) ce sont des polynômes à coefficients réels en les fonctions symétriques élémentaires des Xi, qui sont eux mêmes les coefficients de P donc réels; ainsi, les coefficients de Q sont réels, c'est-à-dire Q G R[X]. On a deg(Q) = Card{(z, j), 1 < * < j < d} = ^=1{j - 1) = d(d - l)/2 = 2^q(d - 1), où q(d — 1) est impair (car q est impair et d est pair). On peut donc appliquer à Q l'hypothèse de récurrence, ce qui entraîne l'existence de (zc, jc) tel que yicjc(c) G C. 7) Notons r = {(i,j) G N2,l < i < j < d}. D'après la question /?), on peut construire une application R —> T ci-* (iajc) telle que pour tout c G M, yicjc(c) G C. Comme R est infini et r fini, cette application n'est pas injective donc 3c G M,3c' eR,c^ c', tels que (icJc) = (v, je')- Posons (r, 5) = (ic,ic)- Du fait que (xr + xs) + c(xra;5) G C et (xr + x5) + d{xrxc) G C avec c 7^ c;, on tire 5 = xr + xs G C et P = xrxs G C. Les éléments xr et x5 sont donc les racines de X2 — SX + P e C[X], ce qui permet facilement de conclure que xr G C et xs G C. Le polynôme P a donc au moins une racine complexe (on en a même trouvé deux, xr et xs). b) Le raisonnement par récurrence de a) prouve que tout polynôme à coefficients réels a au moins une racine dans C. On veut maintenant prouver le résultat dans C[X]. Soit F = J2i=oaiXl G
86 2. CORPS, POLYNÔMES ET FRACTIONS RATIONNELLES "ô v^d — C[X]. On pose F = JXo3*-*"*» et on voit que P = FF G Le polynôme P admet donc au moins une racine complexe a, donc F(a)F(a) = 0, et donc F(a) = 0 ou F(a) = 0. Si F(a) = 0, c'est terminé, sinon F(a) = 0 donc F(â) = 0, d'où le résultat. Remarque. La deuxième méthode, plus longue, présente l'avantage de n'utiliser qu'une simple conséquence de la topologie : tout polynôme de R[X] de degré impair admet une racine réelle, résultat connu au dix-huitième siècle. Problème 5 (Existence de nombres transcendants, nombres de Liouville). On rappelle qu'un nombre complexe a est algébrique sur Q si il existe un polynôme P G Z[X] non nul, tel que P{ot) = 0. Dans le cas contraire, a est dit transcendant. On se propose de prouver par deux méthodes différentes l'existence de nombres transcendants. 1/ Méthode non constructiviste. Montrer que l'ensemble des nombres réels algébriques sur est dénombrable. Conclure. 2/ Méthode constructiviste. a) Soit o G R algébrique sur Q, racine de P G Z[X], deg(P) = n > 0. Si o 0 Q, montrer que 3a >0, V(p,ç)GZxN*, n P a - qn (Indication. On pourra remarquer que qnP(p/q) G Z.) b) (Nombres de Liouville). Soit a G M, a ^ Q, tel que VA; G N*, 3(p, g)GZxN*,g>2 tel que n P a q 1 qK (a est appelé nombre de Liouville). Montrer que a est transcendant, c) Montrer que a = Ylt=o 10~fc! es* un nombre de Liouville. Solution. 1/ Pour tout n € N*, notons Zn[X] = {P G Z[X] \ deg(P) < n}. L'application Zn+1 —> Zn[X] (ao,... ,an) i—> ao + • • • + anXn est bijective. Ainsi, Zn+1 étant dénombrable, Zn[X] est dénombrable, et donc Z[X] = VJnç^Zn[X] est dénombrable (réunion dénombrable d'ensembles dénombrables). Pour tout P G Z[X], deg(P) > 1, l'ensemble noté R(P) des racines de P est fini. Si A désigne l'ensemble des nombres réels algébriques sur Q, on a donc A= |J R(P) pez[x) deg(P)>l et donc A est dénombrable (réunion dénombrable d'ensembles finis). L'ensemble des nombres réels n'étant pas dénombrable, on en déduit qu'il existe dans R des nombres transcendants. 2/ a) On a P(a) = 0 et P n'a qu'un nombre fini de racines, donc (37? > 0),Vx G [a-rj,a + rj\,x ^ a, P(x) ^0. - Si p/q e [a — 77, a + 77], alors p/g 7^ a (car a ^ Q par hypothèse), donc P(p/q) ^ 0. Or qnP(p/q) G Z, et ce terme étant non nul, \qnP(p/q)\ > 1. D'après l'inégalité des accroissements finis, si M = supxe[a__T]a+T^ |P;(a;)|, on a p *- p g)-™ <M a Q donc P n a Q - M P*- > Mqn - Si p/q g [a - 7/, a + 77], alors |p/g — a| > 77 > 77/9".
5. PROBLÈMES 87 On conclut de tout ceci que a = inf{l/M,r;} convient. b) Supposons a algébrique. D'après la question précédente, 3n G N*,3a > 0,V(p,g) G Z x N*, n P a Q - qn Fixons k G N*, k > n, tel que 2n~k < a. Par hypothèse, il existe (p,q) G Z x N*, g > 2, tel que |a - P/^I < l/fl*- On a donc a/qn < \a — p/q\ < l/qk, donc a < qn~h < 2n~k < a, ce qui est absurde. Le nombre réel a est donc transcendant. c) Le développement décimal de a n'est pas périodique, donc a $ Q. Soit n G N*. Le nombre p = 10n!(££=o 10_fc!) est un entier > 2, et avec q = 10n!, on a r, P a q11 = 10 / +oo \ +oo +00 1 ,nn! ( ^2 1Q~kl )= y2 ionn-~kl < y2 ion_A: = - \k=n+l / k=n+l k=n+l (lorsque A; > n + 1 nous avons utilisé la majoration nn\ — k\ = n\[n — (n + 1) • • • k] < n — k). Ainsi, on a 1 < — qn et ceci est possible pour tout n G N*. Finalement, le réel a un nombre de Liouville, donc transcendant. P a Q qn < 1, c'est-à-dire n P a Q Remarque. Le résultat 2/ date de 1844 et est historiquement la première preuve d'existence de nombres transcendants. Il n'admet pas de réciproque. Par exemple, ir est transcendant, et on sait que \tt—p/q\ < 1/g1465 n'a qu'un nombre fini de solutions (Chudnovsky, 1984). Ainsi 7r n'est pas un nombre de Liouville. - La preuve 1/ est plus récente. Les notions d'équipotence introduites par Cantor datent en effet de la fin du XlX-ième siècle. - S'il est relativement simple, avec 2/, de construire des nombres transcendants, il est beaucoup plus difficile de dire si un nombre donné est transcendant ou non. Le sujet d'étude 2 page 100 démontre que e et 7r sont transcendants. Problème 6 (Nombres algébriques). Soient K et L deux corps commutatifs, K étant un sous-corps de L. On dit que a G L est algébrique sur K s'il existe P G K[X], ?^0, tel que P(a) = 0. 1/ Pour tout a G L, on pose K[a] = {P(a) \ P G K[X]} et Ia = {P G K[X] \ P(a) = 0}. a) Soit a G L algébrique sur K. Montrer que K[a] est un corps, et que c'est un K-espace vectoriel de dimension finie. b) Montrer que si le K-espace vectoriel K[a] est de dimension finie, alors a est algébrique sur K. 2/ Si Ki C K2 sont deux corps commutatifs, on note [K2 : Ki] G N*U{+oo} la dimension de K2 considéré comme un Ki-espace vectoriel. a) Soient Kj C K2 C K3 trois corps commutatifs. Montrer l'équivalence ([K2 : Ki] < +oo et [K3 : K2] < +oo) «=> ([K3 : Kj] < +oo). b) Soit oi,..., a,» G L. On rappelle que la notation K(ai,..., an) désigne le plus petit sous-corps de L contenant K et ai,..., an. Montrer que ai,..., an sont algébriques sur K si et seulement si [K(ai,..., an) : K] < +00. c) Montrer que A, l'ensemble des nombres algébriques sur K, est un corps. 3/ Si L est algébriquement clos, montrer que A est algébriquement clos.
88 2. CORPS, POLYNÔMES ET FRACTIONS RATIONNELLES Solution. 1/ a) L'ensemble Ia est un idéal de l'anneau principal K[X], donc il existe un unique polynôme P G K[X] unitaire tel que Ia = (P). Le polynôme P est irréductible dans K[X]. En effet, si P = QR avec Q,R G K[X], alors 0 = P(a) = Q(a)R(a) et donc Q(a) = 0 ou R(a) = 0, donc Q ou i? appartient à Ia = (P) donc deg(Q) > deg(P) ou deg(P) > deg(P), ce qui prouve l'irréductibilité de P. (P s'appelle le polynôme minimal de a, deg(P) le de#ré de a). L'application </? : K[X] —> L F i-> P(a) est un morphisme d'anneaux. Or Ker </? = Ia = (P), donc Im</? = K[a] est isomorphe à K[X]/(P). Le polynôme P étant irréductible, c'est donc un corps (voir proposition 4 page 61) de dimension deg(P) en tant que K-espace vectoriel. b) Soit n la dimension du K-espace vectoriel K[à\. La famille (1, a,..., an) constitue un système de n + 1 vecteurs de K[a], ces vecteurs sont donc liés. Autrement dit, il existe xo, - - - ,xn G K tels que xq + x\a + • • • + xnan = 0, avec les (xi)o<i<n non tous nuls. Donc si P = Ya=qxî^1 ^ P(a) = 0 et P 7^ 0. Donc a est algébrique sur K. 2/ a) Condition nécessaire. [K2 : Ki] < +00 donc K2 est isomorphe comme Ki-espace vectoriel à K[ 2' . De même K3 est isomorphe comme K2-espace vectoriel à K2 3' 2 , a fortiori isomorphe comme Ki-espace vectoriel à K2 3' (comme Ki C K2, tout isomorphisme de K2-espace vectoriel est un isomorphisme de Ki-espace vectoriel), donc isomorphe comme Ki-espace vectoriel à (Kf2:Kl])[K3:K2]) donc à K^^l-pKs^l^ Donc [Ks . Kj = [Ks . Ka] m [K2 . Kj < +Qa Condition suffisante. K2 C K3 donc [K2 : Ki] < [K3 : Ki] < +00. Montrons maintenant [K3 : K2] < +co. Comme [K3 : Ki] < +co, il existe une base finie ei,..., en du Ki-espace vectoriel K3. On remarque alors que ei,..., en est une famille génératrice finie de K3 vu comme un K2 espace vectoriel. Donc [K3 : K2] < +co. b) Condition nécessaire. Procédons par récurrence sur n G N*. Pour n = 1, c'est une conséquence de 1/. Supposons le résultat vrai au rang n, montrons le au rang n + 1. D'après l'hypothèse de récurrence, [K(ai,...,an) :K] < +00. (*) L'élément an+\ est algébrique sur K, a fortiori sur K(ai,..., an). Le résultat 1/ reste évidemment vrai si on remplace K par K(ai,..., an) C L, donc [K(ai,...,an)(an+i) : K(au ... ,an)] < +00. Or K(ai,..., an)(an+i) = K(ai,..., an+i), donc cette dernière assertion s'écrit [K(ai,...,an+i) :K(ai,...,an)] < +00. (**) De (*) et (**), on tire d'après 2/ a) [K(ai,... ,an+i) : K] < +00, d'où la condition nécessaire. Condition suffisante. Pour tout z, K[a{] C K(a^) C K(ai,... ,an), donc K[a^] est un K-espace vectoriel de dimension finie, et donc ai est algébrique sur K d'après 1/b). c) Soient (x, y) G A2. On a K(x — y)c K(x, y) donc comme [K(x, y) : K] < +00, on a [K(x — y) : K] < +00, et donc x — y e A d'après 2/b). De même si y ^ 0, comme K(x?/"'1) C K(x,?/), on tire xy"1 G A. Finalement, A est un corps. 3/ Soit P = ao + a\X + '-anXn G A[X], P ^ 0. Le corps L étant algébriquement clos, il existe a G L tel que P(a) = 0, et donc d'après 1/a) appliqué au corps K(ao,... ,an), K(ao,..., an)[a] est un corps (donc égal à K(ao,..., an)(a) = K(ao,..., an, a)) de dimension fini comme K(ao,..., an)-espace vectoriel. Autrement dit, [K(ao,..., an, a) : K(ao,..., an)] < +00. Or [K(ao,... ,an) : K] < +co d'après 2/b), donc d'après 2/a), [K(ao,... ,an,a) : K] < +00, et donc a G A d'après 2/b), d'où le résultat. Remarque. En particulier, l'ensemble A des nombres complexes algébriques sur Q est un corps algébriquement clos. On l'appelle la clôture algébrique de Q (c'est la plus petite extension de Q algébriquement close).
5. PROBLÈMES 89 Problème 7 (Théorème de Kronecker). Soit P G Z[X] un polynôme unitaire de degré n > 1 et irréductible dans Q[X]. On suppose que toutes les racines de P sont de module < 1. Montrer qu'alors P = X ou bien il existe k e N* tel que P \ (Xk - 1). (Indication. On pourra utiliser le résultat suivant, conséquence d'un exercice du tome d'Analyse : Si a G R \ Q, alors (Ve > 0,3n G N*), |e2i7rna - 1| < e.) Solution. Soient ai,..., an les racines de P. Notons a G Z le terme constant de P. Le polynôme F étant unitaire, on a ai • • • an = (—l)na. S'il existe i tel que \ai\ < 1, par exemple |ai| < 1, alors \a\ = |ai| • |a2 • • • an\ < \a\\ < 1, et comme a G Z, a = 0. Donc X divise P, et P étant irréductible et unitaire, P = X. Dans le cas contraire, on a \ai\ = 1 pour tout i. Considérons pour tout entier k > 1 nk = (a1-l)(ak2-l)---(ahn-l). Pour tout k, 7Tfc s'écrit comme un polynôme à coefficients entiers symétrique en les a^, et donc 7Tfc G Z d'après la remarque 4 page 78. Nous allons montrer qu'il existe k tel que -Kk = 0. Comme |ai| = 1, il existe 6 G R tel que ai = e2in0. Si 6 G Q, alors il existe A; G N* tel que k6 G Z, donc afe _ e2vKke _ ^ rïonc ^k _ q Sinon, 0 G R\Q. Compte tenu de la majoration \ak - 1| < 2, l'expression de 7Tfc entraîne \ïïk\ < \a\ — 1| • 2n_1. Or 0 G R\Q donc (on utilise l'indication) il existe k G N* tel que \a\ — 1| < 21-n, ce qui entraîne \ïïk\ < 1 et comme 7r/t est un entier, on a forcément 7r/t = 0. Il existe donc A; G N* tel que 7Tfc = 0, ce qui entraîne l'existence de i tel que ak = 1, par exemple af = 1. Soit Xk — 1 = Pi • • • Pr la décomposition de Xfc — 1 en polynômes irréductibles unitaires de Q[X]. Comme ai est racine de Xk — 1, il existe i tel que Pi (ai) = 0, par exemple Pi(&i) = 0- Ainsi, Pi et P ont ai comme racine commune et ne sont donc pas premiers entre eux dans Q[X] (l'égalité de Bezout UP\ + VP = 1 appliquée à ai mène à une contradiction). Ces polynômes, étant de plus irréductibles et unitaires, sont donc égaux. En définitive P = P\ divise Xk - 1. Remarque. Dans le second cas, P est un polynôme irréductible dans Q[X] divisant Xk — 1. C'est donc un polynôme cyclotomique (voir le problème 9). Problème 8 (Théorème de l'élément primitif). 1/ Soit K un corps commutatif de caractéristique nulle (donc K est infini) et L un surcorps commutatif de K. Le corps L est un K-espace vectoriel. S'il est de dimension finie, on va montrer qu'il existe x £h tel que L = K[x] = {P(z), P G K[X]}. a) Pour tout a; G L, montrer qu'il existe un unique polynôme unitaire de degré minimal Mx G K[X] tel que Mx(x) = 0 (Mx s'appelle le polynôme minimal de x). Montrer que Mx est irréductible dans K[X]. b) On rappelle que pour oi,..., am G L, K(ai,..., am) désigne le plus petit sous-corps de L contenant K et ai,..., am. Soient x, y G L. On veut montrer qu'il existe z G L tel que K(x, y) = K(z). On sait (voir le théorème 5 page 62) qu'il existe un surcorps M de L, commutatif, sur lequel MxMy soit scindé. Autrement dit, dans M[X], on peut écrire p q Mx = Y[{X - x^, My = Y[(x ~ Vi) (avec x = xuy = yx). a) Montrer qu'il existe t G K* tel que les nombres Xi + tyj (1 < i < p, 1 < j < q) soient deux à deux distincts. P) On pose alors z = x + ty. Montrer le pgcd de My(X) et Mx(z — tX) dans K(z)[X] est X -y. 7) Montrer que K(z) = K(x,y). c) Montrer qu'il existe x G L tel que L = K[x\.
90 2. CORPS, POLYNÔMES ET FRACTIONS RATIONNELLES 2/ Montrer que ce résultat reste vrai si K est fini. Solution. 1/ a) Si n désigne la dimension du K-espace vectoriel L, les n +1 vecteurs 1, a;,..., xn de L sont linéairement dépendants sur K. Donc il existe P G K[X], P^O, tel que P(x) = 0. Donc Ix = {P G K[X] \ P(x) = 0} est différent de {0}. L'ensemble Ix étant un idéal de l'anneau principal K[X], on voit qu'il existe Mx G K[X], unitaire, tel que Ix = (Mx). Tout polynôme P unitaire s'annulant en x est donc un multiple de Mx. Ceci suffit pour affirmer que Mx est l'unique polynôme unitaire de plus bas degré s'annulant en x. Supposons Mx = PQ avec P,Q G K[X]. On a P(x)Q(x) = Mx(x) = 0 donc P(x) = 0 ou Q(x) = 0, donc deg(P) > deg(Ma;) ou deg(Q) > deg(Mx), et donc Mx est irréductible dans K[X]. b) a) Les xi sont distincts. En effet, Mx étant irréductible, Mx et M£ sont premiers entre eux dans K[X] (car deg(M,J.) < deg(Mx) et M'x ^ 0, K étant de caractéristique non nulle). Donc il existe U,V e K[X] tels que UMX + T^MJ. = 1, égalité qui vaut aussi dans M[X]. Les polynômes Mx et M'x sont donc premiers entre eux dans M[X] et n'ont donc aucune racine commune dans M. On en déduit que Mx n'a que des racines simples et les Xi sont donc distincts. De même, les yj sont distincts. Soit [yj-yr i J L'ensemble T est fini et K est infini, donc il existe t G K*, t $ T. Ainsi choisi, t convient (l'égalité %i + tyj = %i' + fr/f entraîne en effet t eT si j ^ f et i = i' si j = f). P) Plaçons nous pour commencer dans M[X]. Soit a G M une racine commune de My(X) et Mx{z — tX). Il existe j tel que a = yj et il existe i tel que z — ta = a;^, et donc z = Xi + tyj donc d'après a), comme z = x\+ty\ = x + ty, on &Xi = x et ?/j = y, donc a = y. Par conséquent, dans M, y est la seule racine commune à My(X) et Mx{z — tX). Ces polynômes étant scindés sur M à racines toutes simples, on en déduit que le pgcd de ces polynômes dans M[X] est X — y (*). Ceci étant, soit D(X) le pgcd de My(X) et Mx(z - tX) dans K(z)[X]. On peut écrire My(X) = P1(X)D(X) et Mx(z - tX) = P2(X)D(X), avec PUP2 G K(z)[X], où Pi et P2 sont premiers entre eux dans K(z)[.X]. Donc il existe C/, V G K(z)[.X] tels que UP\ + VP2 = 1, égalité qui vaut aussi dans M[X], donc P\ et P2 sont premiers entre eux dans M[X\. Le pgcd de My(X) et Mx(z - tX) dans M[X] est donc D(X), d'où le résultat demandé d'après (*). 7) D'après /?), y G K(z). La relation x = z — ty montre que x G K(z). Donc K(x,y) C K(z). Or z = x + ty donc K(z) C K(x,y). Finalement, on a prouvé que K(z) = K(x,y). c) L'utilisation du résultat l/b)7) permet de montrer par récurrence sur m que si ai,..., am G L, alors il existe z G L tel que K(ai,..., am) = K(z). Ceci étant, soit ai,..., an une base du K-espace vectoriel L. On a L = K(ai,..., an), et donc il existe a; G L tel que L = K(ai,..., an) = K(x). Il reste à montrer que K(x) = K[x]. Considérons le morphisme d'anneau <p : K[X] -* K[x] P \-^ P(x). Avec les notations de 1/a), on voit que Kery? = {P \ P(x) = 0} = Ix = (Mx). Comme tp est surjective, K[x] est isomorphe à K[X]/Kenp = K[X]/(MX) qui est un corps car Mx est irréductible (voir la proposition 4 page 61). L'anneau K[x] est donc un corps, et donc K(x) C K[x]. L'inclusion réciproque étant évidente, on a montré K[x] = K(x) = L. 2/ Si K est fini, L est fini (c'est un K-espace vectoriel de dimension finie). On sait (voir la remarque de l'exercice 10 page 10) que (L*,-) est un groupe cyclique. Soit x l'engendrant. On voit facilement que L = K[x]. Remarque. Cet exercice utilise le résultat suivant, qu'il est utile de garder en mémoire. Si P,Q G K[X] et si L est un surcorps de K alors les pgcd de P et Q dans K[X] et dans h[X] coïncident.
5. PROBLÈMES 91 Problème 9 (Polynômes cyclotomiques). Pour tout entier naturel non nul n, on note Un = {e2îkn/n \ k G Z} C C. On dit qu'un élément x G Un est une racine primitive n-ième de l'unité si x engendre le groupe multiplicatif Un. On note IIn l'ensemble des racines primitives n-ièmes de l'unité, et on définit le polynôme cyclotomique d'indice n par £enn 1/ a) Calculer <Ê>P lorsque p est un nombre premier. b) Montrer que Xn - 1 = []d|n $<*• En déduire que pour tout n G N*, $n G Z[X]. 2/ On veut prouver que les $n sont irréductibles dans Q[X]. a) Montrer que l'on peut écrire $n = F\F2 • • • Fr avec les Fi G Z[X], unitaires et irréductibles dans Q[X] (on pourra utiliser le lemme de Gauss, voir l'exercice 4 page 58). b) Soit £ une racine de Fi dans C. Soit p un nombre premier tel que p \ n. Montrer qu'il existe i G N, 1 < i < r tel que F^) = 0. _ c) Pour tout F = Y%=o°>kXk G Z[X], on pose F = JXoô*** eJVpZpf] (ë désignant la classe dans Z/pZ de x G Z). Montrer que pour tout F G Z[J£], T(XP) = [~F(X)]P. d) Montrer que dans Z/pZ[X], $n n'est divisible par le carré d'aucun polynôme non constant. e) Montrer que i = 1, c'est-à-dire que -Fi(£p) = 0. f) Montrer que pour tout entier k premier avec n, Fi(£k) = 0. Conclure. Solution. 1/ Posons u = e2î7r/n, de sorte que Un = (w). D'après la proposition 5 page 20, on a nn = {vk | 1 < k < n — 1, k An = 1}, et donc deg(<3>n) = <p{n) où <p désigne l'indicateur d'Euler. a) Le nombre p étant premier, on a ici Up = {uk \ 1 < k <p— 1} (où u = e2î7r/p), et donc 1 XP — 1 teup b) Soit u = e2™/71. Soit fc, 0 < k < n - 1. Soit d l'ordre de uk dans C/n. On a d | n. Par ailleurs (u;fc)d = 1, donc uk G Ud, et uk étant d'ordre d, on a même ujk G 11^. Ainsi, (X - uk) divise <3>d donc divise f^din $d- Les valeurs uk (0 < k < n — 1) étant distinctes, on en déduit que Xn — 1 = rifc=o(^ ~~ uk) divise Yld\n ^d- Ces polynômes étant de plus unitaires et de même degré (car £d(n deg($d) = £d|n</>(d) = n), ils sont égaux. Montrons maintenant par récurrence sur n G N* que <3>n G Z[X]. Pour n = 1, c'est vrai car $i = X — 1. Supposons le résultat vrai jusqu'au rang n — 1 et montrons le au rang n. D'après l'hypothèse de récurrence, le polynôme P = Yl d\n $rfG Z[X]. Par ailleurs, on a Xn — 1 = $nP. Comme P est unitaire, on peut effectuer la division euclidienne de Xn — 1 par P dans Z[X] (voir la remarque 3 page 54) : (3Q, R G Z[X])> Xn - 1 = PQ + R avec deg(R) < deg(P). Il y a unicité du couple (Q, i?) dans C[X] donc dans Z[X], et comme Xn — 1 = P$n on en déduit R = 0 et <3>n = Q. Donc <3>n G Z[X], ce qui achève le raisonnement par récurrence. 2/ a) Soit <3>n = G\ • • • Gr la décomposition de <3>n en facteurs irréductibles unitaires de Q[X]. Pour tout z, il existe a* G N* tel que otiGi G Z[X]. On a ot\ • • • ar$n = (aiGi) • • • (arGr). Utilisons le lemme de Gauss (voir l'exercice 4 page 58, dont on reprend les notations). Comme c($n) = 1 (car <3>n est unitaire), on a r ai • • • ar = c(ai • • • ûv$n) = Yl c(<*iGi)- (*)
92 2. CORPS, POLYNÔMES ET FRACTIONS RATIONNELLES Pour tout i, le polynôme Fi = aiGi/c{ctiGi) est dans Z[X] et d'après (*), on a $n = F\ • • • Fr. Pour tout i, Fi G Z[X] est irréductible dans Q[X] et est forcément unitaire puisque $n est unitaire. b) L'élément £ est racine de Fi donc de <3>n, donc £ G IIn. Or p est premier et p \ n, donc p A n = 1, et donc £p G IIn, d'où £p est racine de $n. Il existe donc i tel que Fi(£p) = 0. c) On montre cette relation par récurrence sur m G N, où m = deg(F). Pour m = 0, c'est évident. Supposons le résultat vrai jusqu'au rang m — 1 et montrons au rang m. Écrivons F = EfcLo akXk = G + amXm. D'après l'hypothèse de récurrence, on a G(X)P = G{XP). Or F = (G + â^XmY = GP + â^pXmp + ^ C*Gfâiïn-kX<r-k>mi k=i et comme ô^ = a^ et que pour 1 < k < p — 1, p | C*, on en déduit F(X)P = G{Xf + â^Xmp = G(XP) + â^(Xp)m = F(Xp). d) Supposons 1^ = Q2P dans Z/pZ[X). Si R = Yl <t\n $d G Z[X], onaIn-U $nP d'après 1/b), et donc Xn - ï = $nP = Q25 (avec S = PP), d'où par dérivation nXn-1 = 2QQ'~S + Q2~S' donc Q | nXn~l. Donc Q | nXn. Or Q \ (nXn — n) donc Q divise la différence, c'est-à-dire Q \ n. Or p \ n donc n 7^ 0, et donc Q est constant. e) Comme Ff(£p) = 0, Fi(A") et Fi(Xp) ne sont pas premiers entre eux dans Q[X] (l'égalité de Bezout U(X)Fi(X) + V{X)Fi{Xp) = 1 avec U,V G Q[X] appliquée à X = £ mène à une contradiction). De plus Fi est irréductible dans Q[X] donc Fi(X) \ Fi{Xp) dans Q[X]. Comme F\ est unitaire, Fi(A") divise Fi(Xp) dans Z[X] (voir la remarque 3 de la partie 1.3, page 54). On en déduit que F\(X) \ Fi(XP) = ¥i{X)p. Ceci_étant, soit P G Z/pZ[X] un facteur irréductible de ~F\ dans Z/pZ[X]. On a P | Ti{X)p donc P | Fi(X). Par conséquent, si i ^ 1, on voit que P | $n = Pi • • • Fr, ce qui est impossible d'après la question précédente. On a donc i = 1. f) Soit & premier avec n. Écrivons & = piP2--'P$, les Pf étant des nombres premiers. Nous allons prouver par récurrence sur s que Fi(£fc) = 0. Pour s = 1, c'est le résultat de la question précédente. Supposons la résultat vrai au rang s — 1 et montrons le au rang s. Comme k/\n = 1, on a p\ • • -Ps-i A n = 1, donc d'après l'hypothèse de récurrence Fi(ÇPl"'Ps-1) = 0. Or ps A n = 1 donc Fi[(Çpl'"Pa-l)Ps] = Fi(£fc) = 0, ce qui achève le raisonnement par récurrence. Pour tout nombre premier k premier avec n, on a donc Fi(£fc) = 0. Or £ G IIn donc IIn = {Çk | k/\n = 1}. Tous les éléments de IIn sont donc des racines de Pi, ce qui prouve que $n = Pi, donc <3>n est irréductible dans Q[X]. Remarque. Avec 1/a) et 2/, on retrouve le résultat 3/b) de l'exercice 4 page 58. Problème 10 (Théorème de Dirichlet, version faible). Ce problème réutilise les résultats sur les polynômes cyclotomiques de la question 1/ du problème précédent. Soit entier naturel n > 2. L'objectif du problème est de montrer qu'il y a une infinité de nombres premiers p vérifiant p = 1 (mod n). a) Soit p un nombre premier. Montrer que s'il existe a G Z et h G Z[X] tels que Xn — 1 = (X - a)2h(X) (mod p) {Le. si Xn - ï G Z/pZ[X] admet une racine d'ordre > 2 dans Z/pZ), alors p divise n. b) Soit a G N. Montrer que si un nombre premier p divise $n(a) (où $n(X) désigne le polynôme cyclotomique d'indice n), alors p = 1 (mod n) ou p \ n. c) Montrer qu'il existe une infinité de nombres premiers de la forme kn + 1, avec & G N.
5. PROBLÈMES 93 Solution, a) Si Xn — 1 = (X — a)2h(X) (mod p), alors en substituant X par X + a on obtient (X + a)n — 1 = X2h(X + a) (mod p). Ainsi, les coefficients des termes de degré 0 et 1 du polynôme (X + a)n - 1 sont divisibles par p. Ceci s'écrit p \ (an - 1) et p \ C\an"1 = nan~~l. Comme p \ (an — 1), p \ a donc a est premier avec p. Comme p \ na71"1 et que p est premier avec a71"1 (car premier avec a), on a donc p \ n. b) La propriété Xn — 1 = ridin^ ^es P°lynômes cyclotomiques (voir la question 1/b) du problème précédent) entraîne l'existence d'un polynôme F G ri\X\ tel que Xn — 1 = $nF. On a donc an — 1 = <3>n(a)F(a), et comme F(a) e Z, on a p \ (a71 — 1), autrement dit an = 1 (mod p). Notons m l'ordre de a dans le sous-groupe multiplicatif (Z/pZ)*. Comme ân = ï dans Z/pZ, on a m | n. On traite maintenant deux cas selon la valeur de m. - Si m = n, alors a est d'ordre n, donc n divise le cardinal du sous-groupe (Z/pZ)*. Autrement dit n | (p — 1), c'est-à-dire p = 1 (mod n). - Sinon on a m < n. Comme m | n, on a Par hypothèse, on a p \ $n(û) donc <3>n(a) = 0 (mod p), et par ailleurs am = 1 (mod p). Autrement dit, â est racine de $n et de Xm — î dans Z/pZ[X]. D'après (*), ceci entraîne le fait que â est racine au moins double de Xn — î, donc p \ n d'après la question précédente. c) Raisonnons par l'absurde et supposons qu'il n'y ait qu'un nombre fini de nombres premiers de la forme 1 + kn. Nous les notons pi,... ,pm. On considère l'entier N = &n(&) avec a = np\ • • • pm. On a N = olq (mod a), où clq est le coefficient constant de <3>n. L'identité Xn — 1 = ridln^ entraîne —1 = rid|n^(0) et C0mme les ^d(O) sont entiers, on a forcément clq = $n(0) = ±1. Ainsi, N = ±1 (mod a). Or |iV| > 2 (IIn désignant l'ensemble des racines primitives n-ièmes de l'unité, on a \N\ = \$n(a)\ = n^enn \a ~ £l> e^ comme û; > n, on a |o: — ^| > 1 pour tout £ e IIn donc \N\ > 1). Il existe donc un nombre premier p divisant N. D'après la question précédente, on doit avoir p \ n ou p = 1 (mod n). Mais ceci est impossible étant donnée la congruence N = ±1 (modnpi---pm). Remarque. La version forte du théorème de Dirichlet est discutée dans la remarque qui suit l'exercice 6 page 12. Problème 11 (Théorème de Wedderburn : tout corps fini est commutatif). Pour faire ce problème, il est nécessaire de connaître la partie 1/ du problème 9 page 91 ainsi que l'équation aux classes (voir le corollaire 1 page 22). Soit K un corps fini. On veut montrer que K est commutatif. Pour cela, on procède par récurrence sur Card(K). Si Card(K) = 2, le résultat est évident. On suppose maintenant que pour tout corps L tel que Card(L) < Card(K), L est commutatif (*). Nous allons montrer que K est lui aussi commutatif. Nous raisonnerons par l'absurde en supposant K non commutatif. a) Montrer que le centre de K défini par Z = {x G K | Vy G K, xy = yx} est un sous-corps de K. Prouver ensuite qu'il existe n G N, n > 2, tel que Card(K) = qn où q = CardZ. b) Pour tout rc G K, on pose Kx = {y G K \ yx = xy}. Prouver qu'il existe un entier d divisant n tel que Card(Kx) = qd. c) Montrer que l'on peut écrire Card(K*) = g-l + ^Ad^lI avec W,ÀdGZ. d\n $ ~ djin
94 2. CORPS, POLYNÔMES ET FRACTIONS RATIONNELLES d) En observant que le polynôme cyclotomique $n divise (Xn — l)/(Xd — 1) si d | n, d^n, montrer que K est commutatif. Solution, a) Nous aurons besoin du lemme suivant. Lemme. Soient h\ c L2 deux corps finis, avec h\ commutatif. Alors il existe keN* tel que Card(L2) = (Card(Li))fc. En effet, Li étant un sous-corps commutatif de L2, L2 est un Li-espace vectoriel, de dimension finie k car L2 est fini. Le corps L2 est donc isomorphe comme Li-espace vectoriel à Lf, et on en déduit que Card(L2) = Card(Lf) = (Card(Li))*. Ceci étant, on vérifie facilement que Z est un sous-corps commutatif de K. D'après le lemme, il existe donc n G N* tel que Card(K) = (Card(Z))71. Or K ^ Z (car K n'est pas commutatif alors que Z l'est), donc n > 1, d'où le résultat. b) On remarque ici aussi que pour tout a;, Kx est un sous-corps de K. Si Kx = K, alors on a Card(Kx) = Card(K) = qn. Sinon, Kx est strictement inclus dans K et donc d'après (*), Kx est commutatif. On peut donc appliquer le lemme qui entraîne l'existence de k G N* tel que Card(K) = (Card(Kx))fc (**). Par ailleurs, Z est aussi un sous-corps commutatif de Kx, donc d'après le lemme il existe d G N* tel que Card(Kx) = (CardZ)d = qd. Avec (**), on trouve donc qn = Card(K) = (Card(Kx))fc = (qd)k = qdk. Donc n = dk, ce qui entraîne que d | n, d'où le résultat. c) C'est l'équation aux classes appliquée au groupe multiplicatif (K*, •). En effet, le centre de ce groupe est Z*. Avec les notations de la partie 2.4 du chapitre I, on a Card(K*) = CaxdZ* + Y Card(K*) ^ Card(5x) où Sx désigne le stabilisateur de x, c'est-à-dire Sx = {y G K* | xy = yx) = K*. D'après la question précédente, il existe donc d G N* divisant n tel que Card(5x) = qd — 1, et d ^ n (car x G 0f et & fl Z* = 0). Si maintenant pour tout d | n, À^ désigne le nombre de x G 0f tel que Card(Sx) = qd — 1, on peut réécrire l'équation aux classes sous la forme qn-l = Card(K*) = (q - 1) + £ \d (^Tf) • (***) d) Si d | n, d ^ n, on a e|n \c|d / \ «In I \ e\n e^n N ' \e^n,efd / \e^n,efd donc $n divise (Xn — l)/(Xd — 1) dans Z[X]. Ceci étant vrai pour tout diviseur d de n distinct jçn — 1 de n, <3>n divise V^ A^-r^i—7 dans Z[X]. Comme de plus $n divise Xn — 1 dans Z[X], il divise d\n d^n dans Z[X]. Donc $n(q) divise çn-l («"-d-EHf^ï d\n d^n et ce d\n djtn dernier égale q—1 d'après (***). Donc |$n(g)| < 9 — 1. Or n > 2 donc |$n(<7)| = Il^eiln l#-£l > 11^=1 Iq — 1| ^ \Q — 1|) ce Qui est absurde. Le corps fini K est donc commutatif. Le raisonnement par récurrence est ainsi achevé et montre que tout corps fini est commutatif. Remarque. Si on veut trouver un corps non commutatif, il faut donc que celui ci soit infini. Hamilton fut le premier en 1843 à exhiber un corps non commutatif : le corps H des quaternions (H est un surcorps de C. Ses éléments sont des quadruplets a+bi+cj+dk, munis de la loi d'addition usuelle et d'une loi de multiplication associative et distributive
5. PROBLÈMES 95 par rapport à l'addition, vérifiant ij = —ji = k, jk = —kj = i, ki = —ik = j et i2 = j2 = k2 = — 1. Le lecteur pourra bien sûr vérifier que l'on a bien affaire à un corps). Problème 12 (Polynômes de Tchébycheff et applications). Soit / = [-1,1]. On muni C(7, C) (espace vectoriel des fonctions continues de / dans C) de la norme ||. ||oo définie pour tout / G C(7, C) par ||/||oo = sup^j |/(#)|. De même, si / : R —» C est 27r-périodique, on note H/H^ = supx€R \f(x)\. Pour tout n G N*, on note Tn : / —► R x t-> cos[narccos(rc)] et Un = Tn+1/(n + 1). 1/ Montrer que Tn et Un sont des fonctions polynômes de degré n. Après avoir explicité Un, calculer \\Tn\\oo et ||C/n||oo- 2/ Soit n G N*. Pour 1 < i < n, on pose x{ = cos (2f~n1)7r. Montrer VP G C[X], deg(P) < n - 1, P(X) = i ^(-l)'-1 jT^tfPfo) ^l 3/ a) Soit P G C(7, C) une fonction polynôme de degré n — 1 telle que pour tout x G /, |i/l-a:2P(rc)| < 1. Montrer que HP^ < n. b) Soit 5 : R —> C 6 t-> $^*=i M* sin(&0) avec les /i^ G C. Si ||5||oo = 1> montrer que S(0) V6eR\ ttZ, sin0 <n. 4/ Inégalité de Bernstein. Soit p : 1R —► C 0 >-> ]Cfc=_n ^k^ke, où les À*; G C. Montrer que Hp'IIoo < n\\g\\ OO' 5/ Inégalité de Markov. Soit P G C[J£], deg(P) = n G N*. On regarde P comme un élément de C(J,C). Montrer que ||P'||oo < ^2||^||oo. Solution. 1/ Soit x e I. Posons 0 = arccos(a;), de sorte que x = cos9. On a [n/2] [n/2] Tn(x) = *R[(cos0 + zsin0)n] = ]£ C2k cosn-2k 9(-sin2 0)k = ^ Cf xn-2k{x2 - l)k. k=0 k=0 Ainsi, Tn est une fonction polynôme de degré n (son terme dominant est X^o<2fc<n C2k i1 0). Donc Un = T'n+l/(n + 1) également, et par ailleurs, lorsque x G ] — 1,1[ on a . __ T^+^x) _ n + 1 / sin[(n + 1) arccos(a;)] \ __ sin[(n + 1) arccos(a;)] . n^ ~ n + 1 ~ " y/l - x2 \ n + 1 y ~ sin[arccos(a;)] ' W Calculons maintenant HT^co et ||£/n||oo- Lorsque x G /, la forme Tn(a;) = cos[narccos(a;)], entraîne |Tn(a;)| < 1, et comme Tn(l) = 1, on a ||Tn||oo = 1. Lorsque x G ] — 1,1[, A partir de l'inégalité | sin(n0)| < n\ sin(0)| (que l'on obtient immédiatement par récurrence sur n), la forme (*) montre que pour a; G ]-l, 1[, |£/n(z)| < n + 1. Or lim*-i Un(x) = n + 1. Donc ||C/n||oo = n + 1. 2/ Si 1 < i < n, on a Tn(xi) = cos[narccos(a;;)] = cos[(2i — 1)tt] = 0. Les n valeurs distinctes (xi)i<i<n sont donc des racines de Tn. Or deg(Tn) = n, donc il existe À ^ 0 tel que Tn{X) = A(X-*i)...(X-zn). L'interpolation de Lagrange assure l'existence d'un unique polynôme de degré < n — 1 égal à P(xi) en Xi (voir la page 61). Ce polynôme est donc P et on a La forme (*) donne Tn{xi) = nUn-i(xi) = (—1)* ln/Jl — xf, d'où le résultat.
96 2. CORPS, POLYNÔMES ET FRACTIONS RATIONNELLES 3/ a) L'hypothèse |\/l — x2P{x)\ < 1 entraîne, compte tenu du résultat de la question précédente et du fait que Tn{x) > 0 et x — X{ > 0 pour x\ < x < 1, l'inégalité n. v*e ]*,,i], \P(x)\ < l£|ZkM| = IJ2Z»£l = Iî-nW = Un_l(x) < n f—' \x — xA n f—' a; - a;^ n On montrerait de même l'inégalité \P(x)\ < n lorsque x G [—l,xn[. Si maintenant x G [xn,a;i], alors x/r^>yr^=sin(f)>2.f = i - V i V2n/ _ 7T 2n n (l'inégalité sin# > |# sur [0,7r/2] est une conséquence de la concavité du sinus sur [0,7r/2]), donc \P{x)\ < 1/Vl - x2 < n, d'où le résultat. b) L'expression (*) donnant Un s'écrit aussi V^6R\ 7rZ, Un-i(cos9) = sin(n0)/sin(0). Si P désigne le polynôme Y^=i HkUk-i, son degré est < n — 1 et on a P(cos0) = S(ô)/sm6 pour 9 # 7rZ. Or ||5||oo = 1, donc pour tout 0, |P(cos0)| • |sin0| < l, ce qui entraîne que pour tout x G /, |P(rc)|-\/l — x2 < 1. Donc d'après la question précédente, on a ||P||oo < ^> ce qui entraîne que pour tout 9 £ 7rZ, |5(0)/sin0| < n. 4/ Fixons 9q £ ^- Quitte à diviser g par ||^||oo, on peut supposer ||^||oo = 1 (si g = 0, le résultat est évident). Soit S l'application définie sur R par S(9) = \[g{9o + 9) — g(9o — 9)]. Comme \[e^9o+e) - e^0-^] = i{sm9)ei9°, on voit que S a la forme de 3/b), et donc si 9 (£ ttZ, \S(9)/sm9\ < n. On en déduit \9'(0o)\ = S(9) lim 0-0 0 OjtO »-o sin0 <n. Ceci est vrai pour tout 9q £ K, d'où le résultat. 5/ Là encore, quitte à diviser P par ||P||oo) on peut supposer ||P||oo = 1 (le cas P = 0 est évident). Posons g(9) = P(cos9) = P[(ete + e~t6)/2]. Cette application a la forme de l'application g de 4/, et donc on a V0 G R, |p'(0)| = |sin0| • |P'(cos0)| < n. Cette inégalité entraîne que sur [—1,1], on a \/l — x2\P'(x)\ < n, donc d'après 3/a), |P'(rc)| < n2 sur L D'où le résultat. Remarque. Les polynômes Tn (resp. Un) s'appellent les polynômes de Tchébycheff de première espèce (resp. de deuxième espèce). Ce sont des polynômes orthogonaux, dont l'étude générale fait l'objet du sujet d'étude 3 page 104. - Nous avions déjà rencontré les polynômes de Tchébycheff de première espèce dans l'exercice 12 page 70, et nous avions montré qu'ils vérifient la propriété de mini-max suivante : le minimum de ||P||oo lorsque P parcourt les polynômes unitaires de degré n est égal à 21—n\\q~< M ol—n IKnlIoo — *» PROBLÈME 13. Pour tout n G N*, on note ir(n) le nombre de nombres premiers p vérifiant p < n. Le but du problème est d'obtenir des minorations intéressantes de 7r(n), en utilisant des intégrales de polynômes à coefficients entiers. Pour tout n G N, on note Zn[X] l'ensemble des polynômes de degré < n à coefficients entiers. 1/ a) Pour tout A; G N, on considère l'ensemble Ek = {Pe Zk[X] | P(l - X) = (-l)kP(X)} et on note Zfc[X(l - X)] = {P(X(l - X)) \ P G Zk[X]}. Montrer que pour tout A; G N, on a E2k = TLk\X{\ - X)] et E2k+1 = (1 - 2X) Zk[X{\ - X)].
5. PROBLÈMES 97 b) Pour tout P G R[X], on note ||P||oo = supfG[0)i] \P(t)\. Montrer que pour tout k G N, il existe Pk G Ek tel que Hflfelloo = mk, où mk = inf ||P||oo- Pezk[x],Pïo 2/a) Pour tout n G N*, on note dn = ppcm (1,2,..., n). Montrer que dn < n^n\ b) Soit P G Z[X] de degré n tel que /(P) = JJ,1 P(£) oft ^ 0. Montrer que |/(P)| > l/d„+i. c) Soit P G Z[X] non nul tel que ||P||oo < 1. Montrer que Cette borne inférieure motive la recherche de polynômes P G Z[X] maximisant C(P). 3/a) Pour tout A; G N*, on note Ck = —(\ogmk)/k. Calculer Ci et en déduire une première borne inférieure sur 7r(n). b) Calculer C$ puis une nouvelle borne inférieure sur 7r(n) (on pourra utiliser l'inégalité de Markov HP'Hoo < 2(degP)2||P||(X>, conséquence de la question 5/ du problème précédent). Solution. 1/a) Montrons d'abord le résultat pour E^k- L'inclusion Zfc[X(l — X)] C E2k est immédiate. Pour montrer l'inclusion réciproque, on procède par récurrence sur k. Pour k = 0 c'est immédiat. Supposons le résultat vrai au rang k — 1 et montrons le au rang k G N*. Soit P G Eik- Le polynôme P(X) — P(0) s'annule en X = 0 ainsi qu'en X = 1 par symétrie. On peut donc écrire P(X) - P(0) = X(l - X)Q(X) où Q G Q[X]. La division euclidienne d'un polynôme à coefficients entiers par un polynôme dont le terme dominant vaut ±1 est à coefficients entiers, donc Q G Z[X] (voir la remarque 3 page 54). De plus Q G £,2fc-2) et il suffit d'appliquer l'hypothèse de récurrence à Q pour montrer que P = P(0) + X(l - X)Q e Zk[X(l - X)]. Il s'agit maintenant de montrer i?2&+i C (1 — 2X)Zk[X(l — X)]. Soit P G -E^fc+i- On a P(l/2) = (-l)2fc+1P(l/2) = -P(l/2) donc P(l/2) = 0. Ainsi, P est divisible par (1 - 2X) donc il existe Q G Q[X] tel que P = (1 - 2X)Q. Lorsque |rc| < 1/2, l'égalité g(a°= r~izL= p{x){l+2*+4*2 + " '} montre que les coefficients de Q(x) (vu comme une série entière) sont entiers, donc Q G Z[X]. On conclut en remarquant que Q G i?2fc- b) On montre d'abord l'existence de Qk G Z^pf] tel que ||Qfc||oo = ^fc- On remarque que l'ensemble F = {P e Zfc[X]\{0} | ||P|| < 1 + rrik} est fini (les normes dans le s.e.v de dimension finie Mfcpf] sont équivalentes, donc si P = J2e=oatXe G T il existe A > 0 tel que J2e=o \at\ — •^ll^lloo < B = A{1 + mfc)). Donc il existe Qk G T tel que ||Qfc||oo = infper ll^lloo? et comme infpGr ll^lloo = ™>k par définition de T, on a bien le résultat voulu. On considère maintenant les deux polynômes Ri{X) = XQk(X) + (-1)*(1 - X)Qk(l - X), R2(X) = (1 - X)Qk(X) + (-l)hXQk(l - X). Ces polynômes sont de degré < k (le terme éventuel de degré k + 1 s'annule) et on a Ri(X) = (-l)kRi(l-X) donc Ri G 2s*. Lorsque £ G [0,1] on a donc II^Hoo < mk. Le déterminant Ri(t)\ < t||Qfc||oo + (l-*)IIQ*IU = IIQfclloo, = (-\)k(2X -1) est non nul, donc Qk(X) x (-i)fc(i-X) (1-X) (-l)kX et Qk(l — X) s'expriment linéairement en fonction de Pi et P2 donc l'un des deux polynômes Ri,R2 est non nul. Il suffit alors de choisir Pk comme l'un non nul de ces deux polynômes. 2/a) Notons k = 7r(n) et pi,...,Pk les nombres premiers < n. On a dn = Yli^PV ou pour tout i, ai est la plus grande puissance de pi dans la décomposition en facteurs premiers des n premiers entiers. Ainsi, pf* < n, donc dn <nh = nn(n\ b) En écrivant P = Y?k=oakXk) on a I(P) = Z)fc=oafc/(^ + -0 donc en réduisant au même dénominateur, on voit que I(P) = m/dn+i avec m G Z. Comme m G Z*, on en déduit le résultat.
98 2. CORPS, POLYNÔMES ET FRACTIONS RATIONNELLES c) Notons k = deg(P). Pour tout a G N*, le polynôme P2a G 1\X\ est positif non nul et de degré 2ka, donc I(P2a) > l/d2ka+i- Par ailleurs I{P2a) < ||P||g ce qui entraîne 1 1 Ihrv {2ka + 1V^^>d2ka+1>w^>w^ donc „{2ka + l)>]-^-TT)C(P). On en déduit facilement le résultat demandé. 3/a) D'après 1/b), il existe P G Zi[X(l - X)] tel que \\P\\oo = ra2. Le polynôme P a la forme P = a + bX(\ — X) avec a,b e Z. Comme rri2 < \\X(1 — X)||oo = 1/4, on doit avoir \a\ = |P(0)| < m,2 < 1/4 donc a = 0. On en conclut que P = bX(l — X) et forcément, b = ±1. Ainsi, m<i = 1/4 donc C2 = log2. On en conclut grâce à la question précédente que 7r(n) > (log2)n/logn + 0(l/logn). b) La question 1/b) assure qu'il existe P de la forme P = (l-2X)[a + bX(l-X) + cX2(l-X)2] avec a, 6, c G Z tel que ||P||oo = m5- Comme m^ < m,2 < 1, on a forcément a = P(0) = 0. Un calcul facile montre que Q = (1 - 2X)X2(1 - X)2 vérifie ||Q||oo = 5~5/2. D'après l'inégalité de Markov on a donc |6| = \P'm < ll^lloo < 2 • 52||P||oo < 2 • 52^ = ^ < 1 donc 6 = 0. Ainsi, P est de la forme P = c(l — 2X)X2(\ — X)2, et on a forcément c = ±1 donc P = ±Q. Donc ms = \\Q\\oo = 5-5/2, d'où C5 = log(5)/2. Ceci donne la minoration 7r(n) > ^n/logn + 0(l/logn) pour n suffisamment grand. Remarque. Nous avons obtenu les minorations 7r(n) > C^n/logn 4- 0(l/logn) dans 3/a) et 3/b), avec C2 — 0,6931 et C5 ~ 0,8047. Le théorème des nombres premiers (dont une démonstration est proposée en annexe du tome d'analyse — deuxième édition) assure que ir(n) ~ n/logn. Ainsi, les minorations de 7r(n) que nous avons obtenues donnent le bon ordre de grandeur de 7r(n). On peut cependant démontrer que l'on ne peut pas, en utilisant la technique du problème, obtenir des minorations du type 7r(n) > Cn/log(n) +0(l/logn) avec C arbitrairement proche de 1 (en effet, on peut montrer que Ck < 0,866 pour tout k). - Ce type de minoration de ir(n) est à rapprocher du théorème de Tchébycheff (voir le sujet d'étude 1 page 43). En effet, les questions 1/ et 5/ de ce sujet d'étude entraînent facilement la minoration 7r(2n) > (log2 + o(l))fofe- 6. Sujets d'étude Sujet d'étude 1. Soit p un nombre premier. Pour alléger les notations, on pose ¥p = Z/pZ. 1/ Soit K un corps commutatif contenant Fp. Montrer que pour tout R G ¥P[X] et pour tout x G K, on a pour tout n G N la relation R(xpn) = (R(x))p . 2/ a) Soit Q G ¥P[X], irréductible dans WP[X], de degré d. Soit n G N*. Montrer que Q | (Xpn — X) si et seulement si d \ n. b) Pour tout n G N*, on note K™ l'ensemble des polynômes unitaires irréductibles de FP[.AT], de degré n. Montrer que An \Q€K$
6. SUJETS D'ÉTUDE 99 3/ Pour tout n G N*, on note I£ = Card(^). a) Montrer que pn = £d|n àl*. b) Montrer que pour tout n e N*, Ç ^ 0. 4/ Une application aux corps finis (on rappelle que tout corps fini est commutatif, voir le problème 10 page 93). a) Soit K un corps fini. Montrer qu'il existe un nombre premier p et un entier n G N* tels que Card(K) = pn. Réciproquement, si p est un nombre premier et si n G N*, montrer qu'il existe un corps fini K de cardinal pn. b) Soit K un surcorps de Fp tel que Card(K) = pn avec n G N*. Soit P G K%. Montrer qu'il existe x G K tel que P(x) = 0. c) En déduire que deux corps finis de même cardinal sont isomorphes. Solution. 1/ Le corps K contenant Fp, il est de caractéristique p. On peut donc écrire p-i Vs.y G K, (x + yf = xp + yp + ^CpfcaV~fc = *p + Vv k=\ car si 1 < k < p - 1, p \ Cp. Par récurrence sur n G N*, on en déduit que pour tout entier n G N, (x + y)pH = xpn + yp", puis par récurrence sur k, on montre que pour tout (x\,... ,Xk) G Kfc, pour tout n G N, (xi + • • • + xkfn = xf + • • • + xf. Par ailleurs, pour tout a G Fp, aP = a donc (par récurrence), pour tout n G N, ap" = a. Ceci étant, soit R = clq 4- a\X -\ + o,dXd G JFP[X]. Pour tout x G K,, on a R(*r = ( e o^) = e aT(xiy*=E a>(xpy=«(*"")• \i=0 / z=0 i=0 2/ a) Le polynôme Q étant irréductible dans Fp[X], K = ¥p[X]/(Q) est un corps ; K est d'ailleurs un Fp-espace vectoriel de dimension d, donc isomorphe (comme Fp-espace vectoriel) à F^, d'où Card(K) = Card(F^) = pd. Le groupe multiplicatif K* est donc d'ordre pd — 1, et donc pour tout y 6 K*, yp ""1 = 1, ce qui entraîne que pour tout y G K, yp = y, et par récurrence sur k : \/y e K, Vfc G N, s/d = y. (*) Ceci étant, montrons l'équivalence demandée. Condition suffisante. Supposons d \ n. En notant X la classe de X dans le corps ¥P[X]/(Q) = K, pkd pfi on a d'après (*), X = X pour tout k G N. Comme d \ n, on en déduit X = X, c'est-à-dire Q\(Xpn -X). Condition nécessaire. Supposons Q \ (Xp — X), c'est-à-dire X = X. Soit y G K. Il existe R e ¥P[X] tel que y = RÇX), donc yPn = R(X)Pn = R(XpH) = R(X) = y (**). Effectuons maintenant la division euclidienne de n par d : n = gd + r, 0 < r < d— 1. La relation (**) s'écrit (yPq yr — y^ et d'après (*), on a yp1 = y. On a donc ypr~~l = 1 pour tout y G K*. Or K*, sous- groupe multiplicatif fini d'un corps commutatif, est cyclique (voir la remarque de l'exercice 10 page 26). Il existe donc y G K* d'ordre pd — 1. Or on a vu que ypV~~l = 1. comme 0 < r < d, ceci entraîne r = 0, c'est-à-dire d \ n. b) Commençons par montrer que XpH — X est sans facteur carré non constant dans FP[X]. Supposons Xpn-X = Q2P, avec P,Q G ¥p[X]. Par dérivation, on ^pnXpn-1-l = 2QQ'P+Q2P' donc Q | (pnXpn"1 - 1) = -1 (pn = 0 dans Fp), et donc Q est constant. Le résultat précédent entraîne que dans la décomposition de Xp —X en facteurs irréductibles de ¥p[X] : XpU — X = Y\i=\ Qf\ on a ^ = 1 pour tout i. Or d'après la question précédente, pour tout i on a Qi G Kd avec d \ n. On en tire (XpU - X) \ Yld\n [IlQeKd Q)m
100 2. CORPS, POLYNÔMES ET FRACTIONS RATIONNELLES Pour tout entier d, d \ n, et pour tout Q G K^ on a Q \ (Xpn — X). Ces facteurs Q étant irréductibles, ils sont premiers entre eux deux à deux, et donc fldln (llQeK'<* Q) I (XpU — X). On conclut à l'égalité en remarquant que ces polynômes sont unitaires. 3/ a) Cette relation se déduit de 2/b) en passant aux degrés. b) Le résultat précédent entraîne que pour tout n G N*, nlg < Yld\n^î = Vn- Si on fixe maintenant n G N*, on en déduit m;=Pn-J2dIï^pn-T,pd^pn-Y,pd=pn- ^f > °- d\n d\n d=l ^ d^n d^n 4/ a) Soit p la caractéristique de K. On a p ^ 0 car K est fini, et p est un nombre premier (voir la proposition 1 page 53). Notons e l'élément unité de K. L'application (p : Z —> K n i-> ne est un morphisme d'anneaux et Kercp = pZ. Si K' = Innp C K, K' est isomorphe à Z/Ker </? = Z/pZ = ¥p et c'est donc un sous-corps de K isomorphe à ¥p (K' s'appelle le sous-corps premier de K, voir la définition 4 page 54). Le corps K apparaît alors comme étant un K'-espace vectoriel, de dimension finie n car K est fini. Le corps K est donc isomorphe (comme K'-espace vectoriel) à K/n, donc Card(K) = Card(K/n) = (Card(K,))n = (Card(Fp))n = pn. Réciproquement, soit p un nombre premier et n G N*. D'après 3/6), Kg ^ 0. Soit P G Kg. K = ¥P[X]/(P) est un corps (car P est irréductible), de cardinal pn car K est un Fp-espace vectoriel de dimension n. b) Le groupe multiplicatif K* étant de cardinal pn — 1, pour tout a; G K*, xpn~~l = 1, donc pour tout a; G K, xpU = x. Autrement dit, les éléments de K sont tous racine du polynôme Xpn — X. Le degré de ce polynôme étant pn = Card(K), on en déduit que les racines de XpU — X sont exactement les éléments de K. Or d'après 2/b), P \ (Xpn — X), donc il existe a; G K tel que P(x) = 0. c) Soit Pq G Kg, soit K un corps de cardinal pn. La caractéristique de K est p (en effet, c'est un nombre premier qui de plus divise pn car (K, +) est un groupe d'ordre pn), et on a vu au 4/a) que ¥p est isomorphe à un sous-corps de K. Autrement dit, à un isomorphisme près, K est un surcorps de Fp, et donc d'après 4/b), il existe xq G K tel que Po(xo) = 0. Soit $ le morphisme ¥P[X] -> K Q^ Q(x0). On a Ker $ = {Q G ¥P[X] \ Q(x0) = 0}. C'est un idéal de ¥P[X] donc principal. Soit P unitaire tel que Ker $ = (P). On a Po G Ker $ = (P) et Po est irréductible, donc P = Po, et donc Ker $ = (Po). Donc Im $ est isomorphe à FP[X]/ Ker $ = ¥p[X]/(Po). Ce dernier est un Fp-espace vectoriel de dimension n, donc de cardinal pn, et donc Im <3> est de cardinal pn. Or Card(K) = pn, donc Im$ = K. En résumé, K est isomorphe au corps Fp[X]/(Po), et ceci pour tout corps Kàpn éléments. Deux corps de même cardinal sont donc isomorphes. Sujet d'étude 2 (Transcendance de e et de n). 1/ Si P g C[X], (deg(P) = n), on définit (avec F^ = F par convention) : +oo n v(f) = y^ p(fc) = y^ p(fc) = f+p; h h F(n\ fc=0 fc=0 a) Si F G C[X] et a G C, montrer que >a£>(F)(0) = a f ca(1-'>F(o0 dt + 2>(F)(a). i/o b) Soit Q G Z[X] et p G N, p > 2. Si F(X) = Q(X)Xp-l/(p - 1)!, montrer que £>(F)(0) est un entier vérifiant P(F)(0) = Q(0) (mod p).
6. SUJETS D'ÉTUDE 101 2/ (Transcendance de e). On rappelle qu'un nombre transcendant est un nombre non algébrique sur Q. Supposons e algébrique. Alors il existe Q G Z[X], Q ^ 0, tel que Q(e) = 0. Soit n = deg(Q). Pour tout nombre premier p, on note a) Si k G N, 1 < k < n, montrer que V(Fp)(k) est un entier divisible par p. b) Si k G N, 1 < k < n, montrer que lim / efc(1_<)FJkt) dt = 0. c) Conclure. 3/ (Transcendance de n). Supposons n algébrique sur Q. a) Montrer qu'alors in est algébrique. Il existe donc Q = dXn + diXn~l + - • • + dn-iX + dn G Z[X], d ^ 0, tel que Q(i7r) = 0. Soient a>i,..., wn les racines de Q, de sorte que Q = d(X — ui) • • • (X — un). b) Si $ G Z[Xi,..., Xn] est symétrique, montrer que $(dui,..., dwn) est un entier. Comme il existe k tel que Uk = in, on a Ilfc=i(l + e"k) = 0> ce Qui en développant s'écrit aussi 2n-l 1 + J2 e«> = 0, i=i ai,... ,ûf2n_i étant les nombres de la forme J^te/0*'*» ^ étant une partie non vide de {1,..., n}. Supposons que C de ces 2n — 1 nombres soient nuls. Si m = 2n — 1 — C, on peut, quitte à renuméroter, supposer que les otj non nuls sont ai,... ,am. c) Montrer que si un polynôme $ G Z[Xi,..., Xm] est symétrique dans Z[Xi,..., Xm], alors $(<£ai,..., dam) est entier. Pour tout nombre premier p, on pose jmp+p-l VP-1 Fp{X) = (p-i)i [(* ~ ai) ' ' '(* ~ am)]P ■ d) Montrer que 2fc=i^C^p)(afc) est un entier divisible par p. e) En procédant comme au 2/, conclure. Solution. 1/ a) On pose f(t) = e-atV(F)(at). Comme £>(F)' = V(F) - F, on a pour tout * G [0,1] : f(t) = -ae-atV(F)(at) + ae_afP(F)/(at) = -ae~atF(at), et donc par intégration /(l) — /(0) = —a/g e~atF(at)dt, d'où le résultat compte tenu de la valeur de /. b) Écrivons Q = V^a^X^, de sorte que F = 22iakl ïTT fc=0 A==0 W~ '' Alors (fc + p-l)! ^ / 7 1 \ I n V(F)(0) = J2^k Y -IV =Qo + ^afc(fc+p-l)---p, fc=0 ^ '' fc=l donc î>(ir)(0) est un entier qui vérifie 2?(jF)(0) = a0 == Q(0) (mod p). 2/ a) Fixons k G N, 1 < k < n. Si <2(X) = FP(X + fc), on voit facilement que G a la forme vp-i G(X) = T^ rr[X • if(X)] avec tf G Z[X], donc d'après 1/b), N = V(G){0) = V(Fp)(k) est (p - 1)! un entier vérifiant N = 0 (mod p). b) Si t G [0,1], ek^~^\Fp(kt)\ < ekkP~l[nnY/{p - 1)!, donc e^-^FJHJdt I \Jo 1 < nnA^£ri - (p-l)I"
102 2. CORPS, POLYNÔMES ET FRACTIONS RATIONNELLES Or limp_+00[fcnn]^V(p - 1)! = 0, d'où 2/b). c) Écrivons Q = clq + a\X H + a>nXn, avec Q(e) = 0 et Q ^ 0. Quitte à diviser Q par X, on peut supposer ao ^ 0. Pour tout nombre premier p, on a d'après 1/a) / n \ n /»1 n X)a*eA: ) V(Fp)(°) = 5p + Tp avec 5p = S a*fc / e**1"0*^**) rf*> Tp = Safc£>(iy (fc). \fc=0 / A;=0 ^° fc=0 Or EÏ=0Ofeefc = Q(e) = 0, donc 0 = Sp + Tp (*). D'après 2/a), pour fc G N, 1 < k < n, on a V(Fp)(k) = 0 (mod p) donc d'après 1/b) : n Tp = ^2akV(Fp)(k) = aoD(Fp)(0) = a0(-l)pn(n\y (mod p). fc=0 Or ao 7^ 0, et donc pour tout nombre premier p supérieur à max{|ao|,n}, on a Tp jà 0 (mod p). Tp est donc un entier non nul, et vérifie donc \TP\ > 1. Or d'après 2/b), limp-x^Sp = 0, ce qui est absurde d'après (*). Le nombre réel e est donc transcendant. 3/a) Avec le résultat du problème 5, c'est immédiat. En effet, l'ensemble des nombres algébriques étant un corps, si n est algébrique, comme i est algébrique (racine de X2 +1), in est algébrique. Nous allons néanmoins montrer ce résultat directement. Si n est algébrique, il existe n G N* et ao,..., an G Z, an ^ 0, tels que ao + aiir H + an7rn = 0. En notant 0 = m, on a (ao - a202 + •■■)- i(ai0 - a393 + ■■■) = 0, et en posant Q = (a0- a2X2 + • • • )2 + (aiX - a3X3 + • • • )2 G Z[X], on a donc Q(0) = Q(i7r) = 0 et Q ^ 0. D'où le résultat. b) Les nombres complexes dw\^... ,du;n sont les racines du polynôme dn~~lQ(X/d) = Xn + diXn-1 + dd2Xn~2 + • • • + dn~2dn-2X + dn"1dn = R(X). Ce polynôme est unitaire à coefficients entiers, donc toute expression polynomiale à coefficients entiers et symétrique en les racines de R(X), est un entier (voir la remarque 4 page 78), d'où le résultat. c) Le polynôme $ étant symétrique dans Z[Xi,... ,Xm], il existe P G Z[Xi,... >Xm] tel que $ = jP(EÏ, ..., E£J, les E* désignant les fonctions symétriques élémentaires de Z[Xi,... >Xm]. Si maintenant on note E; les fonctions symétriques élémentaires de Z[Xi,... , A^n-i], on vérifie facilement que Vi, 1 < i < m, cr^ = £*(dai,... >dam) = Eî(dai,... ,dam,0,... ,0) = Ei(dc*i,... ,dc*2»-i). Notons P l'ensemble des parties non vides de {l,...,n}, et désignons par / la bijection de J = {1,..., 2n - 1} vers V telle que ctj = YLiei(j)UJi' P°ur tout .7 € J on note Mj = 2ie/(j) ^* Le polynôme Qi(Xu ...,Xn) = Ei(Mi,..., M2n_i) G Z[Xi,..., Xn] est symétrique dans Z[X\y... ,Xn] (puisqu'une permutation des indéterminées (Xi)i<i<n donne lieu à une permutation des (Mj)i<j<2n et que E; est symétrique dans Z[Xi,..., X^-i]). Comme dctj = Mj(dui,..., dujn), on a Gi = E^(dai,... yda2n_i) = Qi{dw\^... ,du;n) d'où on déduit ai G Z d'après 3/b) puisque Q^ est symétrique dans Z[Xi,... >Xn]. Finalement, on voit que $(dai,..., dam) = P(au ..., am) est un entier. d) On peut aussi écrire FP(X) sous la forme FP(X) = —l—idxy-1 \{dX -dai)---(dX- dam)]*• (**) Un peu d'attention montre alors que le polynôme G(X) = (p - 1)! YlT=i Fp(X + ak) a Pour coefficients des polynômes symétriques à coefficients entiers en les (daic)i<k<m, et donc d'après 3/c), G(X) G Z[X]. Or pour tout k, 1 < k < m, X? \ Fp(X + ak), donc X? \ G(X), et
6. SUJETS D'ÉTUDE 103 donc il existe H G Z[X] tel que G(X) = XPH(X). Finalement, on a montré que F(X) (£Tïji EfcLi fp(x + <*k) a la forme F(X) = j^H{X), et donc d'après 1/b), m V(F)(0) = !>(*»(«*) = 0 (mod p). fc=i e) La relation de la question 3/b) s'écrit (C + 1) 4- YlT=i e<*j = 0 avec ^ e N et d'après 1/a), en posant 771 /.J 771 Sp = J2^k ea^-^Fp(akt)dt, TP = (C+1)£>(FP)(0), f/p^WK), on a 0 = Sp + Tp + Up (***). Or pour tout fc, pour tout p, pour tout t G [0,1], I^»(a**)l < -*—, TVt [(2M)T = |d|ro(2M)m (p-1)! lv y J ' ' v ' (p-1)! où M = sup1<fc<n |afc| et AT = |d|m+1M(2M)n sont des constantes. On en déduit que 1/ Mo e*ic(i-t)Fp(akt)dt < eM\d\m(2M)m Kp -î (p-1)!' et donc \imp->+00 JQ eak^ ^Fv{otkt) dt = 0, et ceci pour tout k, donc lim Sv = 0. (****) D'après (**), on peut écrire FP(X) = (p - 1)! où les ai sont des polynômes à coefficients entiers symétriques en doc\,... ,dam, donc d'après 3/c) les a£ sont entiers. Par ailleurs, on vérifie facilement que ao = (—l)mpdp~1(da\ • • • dam)p = dp~lU> où L = (—\)m{doc\ • • -dam) est une constante, entière d'après 3/c). D'après 1/b), on voit donc que V(Fp)(0) est un entier vérifiant V(Fp)(0) = ao (mod p). Finalement, on obtient Tp = (C + l)a0 = (C + l)dp-1Lp (mod p). Comme de plus Up = 0 (mod p) d'après 3/d), on voit que Tp + Up = {C + VjdP^LP (mod p). Donc si p > sup{C 4- l,d, L} est un nombre premier, Tp + Up est un entier non nul, donc \TP + Up\ > 1. De (***), on tire alors \SP\ > 1, ce qui est absurde d'après (****). Le nombre n est donc transcendant. Remarque. La transcendance de 7r a été démontrée pour la première fois par Lindemann en 1882, qui a établit de manière plus générale que si a* et $ sont algébriques (avec les ai non nuls et les $ distincts), alors J2aiel3i ¥" 0- - Un autre résultat célèbre de transcendance est le théorème de Gelfond-Schneider (1934). Si a et (5 sont algébriques, a ^ {0,1}, p ^Q, alors oP est transcendant. - Actuellement, on connaît peu de classes de nombres transcendants. On sait que e, 7r, log2, log3/log2, ew, T(l/4) sont transcendants, mais on ne sait même pas si 2e, 2*, 7re, e + 7r, £(5) ou 7 (constante d'Euler) sont irrationnels. - On peut démontrer assez facilement que ir2 (donc 7r) est irrationnel (voir le chapitre intégration du tome analyse). Ceci est aussi une conséquence de la transcendance de ir. - En démontrant la transcendance de 7r, Lindemann résolvait le célèbre problème de la quadrature du cercle. Ce problème consiste à partir d'un cercle, de tracer à l'aide d'une règle et d'un compas un carré ayant même aire que celle du cercle. Le transcendance de 7r montre que ce problème est insoluble (on montre en effet que tout point construit avec une règle et un compas à partir du cercle unité a des coordonnées algébriques).
104 2. CORPS, POLYNÔMES ET FRACTIONS RATIONNELLES Sujet d'étude 3 (Polynômes orthogonaux). Soit / un intervalle réel non réduit à un singleton, et w : / —» M une fonction continue strictement positive sur /. On suppose que pour tout n G N, la fonction x t-> xnw(x) est intégrable sur /. On note C l'ensemble des fonctions continues / : / —» R telles que x t-> f2(x)w(x) est intégrable sur I. Les fonctions polynômes appartiennent à C d'après l'hypothèse sur w. 1/a) Montrer que C est un espace vectoriel, et que (f>9) = f(x)g(x)w(x)dx définit un produit scalaire sur C. On munit C de ce produit scalaire et on note || • || la norme associée. b) Montrer qu'il existe une unique base (Pn) de l'e.v des polynômes R[X], orthonormale pour ce produit scalaire, et vérifiant deg Pn = n pour tout n G N et telle que le coefficient dominant 7n de Pn est positif. Les Pn sont appelés polynômes orthogonaux associés à w. c) Montrer que les polynômes Pn vérifient une relation de récurrence de la forme Vn > 2, Pn(X) = {anX + PO + cnPn_2(X) (*) pour des suites réelles (an), (6n) et (cn) que l'on explicitera. d) (Formule de Darboux). En déduire que le noyau Kn(x,y) = Yn=o ^0*0-F* (y) vérifie Vh€N,V(*,y)€RWyf ±Pi{x)Pi(y) = J^Pn^x)Pn(y) - Pn(x)Pn+1(y) ê? Tn+i x~y et calculer également Kn(x,y) lorsque x = y. 2/ (Zéros des polynômes orthogonaux). a) Montrer que pour tout n G N*, Pn a n zéros réels distincts dans l'intervalle L b) Montrer qu'entre deux zéros consécutifs de Pn+i, il y a un et un seul zéro de Pn. c) Soit / G C et n G N. Soit fn le meilleur approximant de /, au sens de la norme || • ||, dans Vect(Po> • • • > Pn)' Montrer que / — fn s'annule au moins en n + 1 points à l'intérieur de/. 3/ (Quadrature de Gauss). Soit n G N*. On note x\ < ... < xn les zéros de Pn. a) Montrer qu'il existe des nombres réels uniques Ai,..., Àn tels que » n VQ G R[X], deg(Q) < 2n, / Q(x)w{x) dx = V A^Qfe). (**) Jl <=i Montrer À* > 0 pour tout i. b) Montrer que 7n+l 1 Vi, 1 < i < n, \i = 7n Pn+1(Xi)Pn(Xi)' c) Montrer l'unicité des nombres réels (a^)i<f<n et {\i)i<i<n vérifiant l'identité (**). d) Si / est un segment de M, et / : / —» R est de classe C2n, montrer que / f(x)w{x)dx-^2^if(xi) (Indication : utiliser le résultat de l'exercice 7 page 66). ^ 1 sup,6J l/Wfr)! - f2„ (2n)l Solution. 1/a) Si / G C il est immédiat que À/ G C pour tout A G E, et si /,p G C alors (f+g)2w est intégrable puisque positive et majorée par [(/ + g)2 + (/ - tf)2^ = 2(/2 + g2)w. Ainsi, C est bien un espace vectoriel.
6. SUJETS D'ETUDE 105 L'application (/, g) »-> (/, g) est un produit scalaire : en effet, c'est une forme bilinéaire, elle est positive car w > 0, et elle est bien définie car si Jj f2w = 0, alors la fonction f2w étant continue et positive, ceci entraîne f2w = 0 donc / = 0 car w ne s'annule pas. b) Il est immédiat que le procédé d'orthogonalisation de Schmidt s'étend à une famille dénom- brable de vecteurs. Ainsi, à partir de la base canonique (Xn)ne^ de K[X], on peut former une famille libre (Pn)neN orthogonale pour le produit scalaire </? telle que Pq = 1 et pour tout n, Pu = Xn + vn avec vn G Vect(Po, • • • > Pn—i)- Une récurrence immédiate sur n, montre alors que deg(Pn) = n pour tout n. Par construction du procédé d'orthonormalisation de Schmidt, on a Vect(l, X,..., Xn) = Vect(P0,..., Pn) pour tout n, ce qui prouve que la famille libre orthogonale (Pn)neN est une base de R[X]. En normant les polynômes Pn, on obtient alors une base orthonormale de K[X], et le coefficient dominant de Pn est bien positif. Une telle base est bien unique. En effet, supposons qu'une autre base (Qn) vérifiant les mêmes propriétés diffère de (Pn). Soit k le plus petit indice tel que Qk ¥" Pk- Comme deg Qk = k on peut écrire Qk = Y2i=o^iPi avec ^es ^ e ^- Lorsque 0 < i < fc, on a À; = {Qk^Pi) = {QkiQi) = 0, donc Qk = AfcPfc. On a 1 = ||Qfc||2 = A£||Pfc||2 = A|, donc Xk = 1 ou Xk = -1. Comme les coefficients dominants de Pk et Qk sont strictement positifs, on a forcément Xk = 1, donc Pk — Qk ce qui est absurde. c) Supposons la relation (*) vérifiée. En la projetant sur les vecteurs Pn, Pn-\ et Pn-2 on obtient 1 = an(XPn_i,Pn), 0 = an(XPn_i,Pn_i) + bn 0 = an(XPn_i,Pn_2) + Cn- (***) Montrons que (XPn_i,Pn) est non nul en explicitant sa valeur. Comme XPn_i est de degré n, il existe des réels À& tels que n fc=0 ce qui entraîne (XPn_i,Pn) = An, et l'égalité des coefficients dominants donne 7n-i = An7n donc finalement (JPn_i,Pn) = 7n-i/7n- De même, on a (XPn-uPn-2) = I Pn-l{x)xPn-2{x)w{x) dx = (Pn-l,IPn-2) = (XPn-2,Pn-l) = ^^• Jl 7n-l Finalement, les trois égalités (***) sont équivalentes à In , 1n(XPn-\,Pn-l) dji — ) On — , Cn — 2 • 7n-l 7n-l 7n-l Réciproquement, le choix de ces valeurs entraîne que la projection de (*) le long des vecteurs Pn, Pn-\ et Pn-2 est vérifiée. Les deux termes de (*) sont également égaux le long des vecteurs Pk pour k < n - 2 car (IPn_i,Pfc) = (Pn_i,IPfc) = 0 vu que deg(XPk) < n - 1 donc XPk G Vect(Po,... ,Pn-2)- Ainsi, nous avons démontré que le choix des valeurs entraîne que (*) est vrai le long de chaque vecteur Pk pour k < n, et comme les polynômes de (*) sont de degré < n, cela montre que (*) est bien vérifié. d) On procède par récurrence sur n. Pour n = 0 la relation est vraie car 7o Pi(x)P0(y) - Pi(y)P0(x) 70 ia(Pi(x) - Pi(y)) lQ 2 = = —7o7i = 7o = Pq\?)Pq\V)- 7i x-y 7i x-y 71 Supposons maintenant la formule de Darboux vraie au rang n — 1 et montrons la au rang n. En remplaçant les expressions de Pn+\{x) et Pn+i(y) par la formule obtenue dans la question précédente, on obtient Pn+l(x)Pn(y) ~ Pn(x)Pn+l(y) n p ,* p ,v , r Pn-l(x)Pn(y) - Pn(x)Pn-1(y) = o,n+iPn{x)Pn{y) + Cn+i , x-y x-y ce qui compte tenu des valeurs de an+\ et c^+i obtenues précédemment entraîne 7n Pn+i(x)Pn(y) - Pn(x)Pn+i(y) = p + 7n-i Pn(x)Pn-i(y) - Pn-i(x)Pn(y) 7n+i x-y 7n x-y
106 2. CORPS, POLYNÔMES ET FRACTIONS RATIONNELLES Compte tenu de l'hypothèse de récurrence, ceci démontre bien la formule de Darboux lorsque xi-y. Pour calculer Kn(x,x) on calcule la limite de Kn(x,x + h) lorsque h ^ 0 tend vers 0. En substituant Pn(x + h) et Pn+i(x + h) par leur développement limité à l'ordre 1 dans la formule précédente appliquée à y = x + h, on obtient K< , ^ In Pn+l(x)(Pn(x) + hFn(x) + o{h)) - (Pn+l(x) + hPn+1(x) + o(h))Pn(x) Bll,I+ j'7n+l ("*) ce qui en faisant tendre h vers 0 donne Kn(x,x) = ^(PUl(x)Pn(x) - P^)Pn+l(x)). 7n+l 2/a) Fixons n G N* et notons A; G N le nombre de zéros de Pn dans / d'ordre de multiplicité impaire. Si on note ai, • • • , a& ces zéros et Q = (X — ai) • • • (X — a^) (avec Q = 1 si k = 0), le polynôme PnQ garde un signe constant sur /. Supposons k < n - 1. Alors Q e Vect(l, X,..., X71"1) = Vect(Po, • • • > Pn-i)- De plus pour tout fc < n - 1, (Pn,Pk) = 0. On en conclut (Pn,Q) = 0 = JjPn(t)Q(t)w(t)dt. Or la fonction £ »-> Pn{^)Q{i)^{i) est continue et garde un signe constant sur /, donc PnQw = 0, et comme w > 0, ceci entraîne PnQ = 0 sur /, ce qui est impossible vu que PnQ est un polynôme non nul. Donc k > n, et comme deg(Pn) = n, Pn a n racines distinctes dans /. b) La formule obtenue précédemment pour Kn(x,x) montre que pour tout zéro a de Pn+i) on a Pn+M)Pn{a) = P^+i(a)Pn(a) - P»Pn+i(a) = ^±1 ^P,(a)2 > ^P0(a)2 > 0. In .=Q 7n- Maintenant considérons deux zéros consécutifs a et (5 de Pn+i. La fonction Pn+i garde un signe constant sur [a,/3], par exemple positif. Comme Pn+i(a) = 0 on en déduit P^+1(a) > 0, de même on obtient P^+1(P) < 0. Compte tenu de l'inégalité P^+1(a)Pn(a) > 0, on en déduit Pn(a) > 0. De même, l'inégalité P^+1(/3)Pn(/3) > 0 entraîne Pn(fi) < 0. Ainsi Pn change de signe dans ]a,/?[ donc contient au moins un zéro dans cet intervalle. Comme Pn+i a n + 1 zéros dans /, Pn a un zéro dans chacun des n intervalles délimités par deux zéros consécutifs de Pn. Or Pn a n zéros donc il n'y en a qu'un seul entre deux zéros consécutifs de Pn+i. c) La propriété de projection sur un s.e.v de dimension finie (voir la proposition 2 page 242) assure que fn est la projection orthogonale de / sur Vect(Po,..., Pn) = Vect(l,..., Xn). Donc f — fn est orthogonal à ce sous-espace, c'est-à-dire (/ — /n, Q) = 0 pour tout polynôme Q de degré < n. On procède ensuite de manière analogue à la solution de la question 2/a), (sauf qu'ici, on ne peut pas utiliser la notion de zéro de multiplicité impaire). Raisonnons par l'absurde et supposons que / — fn ne s'annule qu'en k points x\ < ... < Xk de l'intérieur de /, avec k < n. Par commodité, notons xo et Xk+i les extrémités de l'intervalle /. Sur chaque intervalle ]xj,a;j+i[ la fonction continue / — fn ne s'annule pas donc garde un signe constant. Notons 1 < j\ < ... < je < k les indices j pour lesquels f — fn change de signe entre ]xj_i, Xj[ et ]xj, Xj+i[. La fonction f — fn garde un signe constant sur chacun des intervalles l^o^it) \xjx^Xj2[^ ..., ]xje,Xk+i[ et change de signe à chaque Xjm. Ainsi, le polynôme défini par Q = rim=i(^ — xjm) (ou Q = 1 si ^ = 0) est tel que (/ — fn)Q garde un signe constant sur / tout entier. Donc la fonction continue (/ — fn)Qw garde également un signe constant sur /, et comme deg(Q) < n on a (/ - /n, Q) = fj(f — fn)Q^ = 0 donc (/ — fn)Qw = 0, donc (/ — fn)Q = 0. Ceci entraîne que f — fn s'annule sauf éventuellement aux zéros de Q, et par continuité / — fn = 0 sur / tout entier. Ceci est absurde car on a supposé que / — fn ne s'annulait qu'en un nombre fini de points. Donc f — fn s'annule bien en au moins n + 1 points de l'intérieur de /. 3/a) Montrons l'existence des (À;). Notons L{ le polynôme de Lagrange de degré < n qui vérifie Li(xi) = 1 et Li(xj) = 0 pour j ^ i. Soit Q e K[X], deg(Q) < 2n, et considérons le polynôme d'interpolation de Lagrange L(X) = £?=i Q(xi)Li(X) qui vérifie Q{xi) = L(xi) pour tout i. Le polynôme Q - L s'annule aux points £;, donc il existe un polynôme R tel que Q — L = PnR. On
6. SUJETS D'ETUDE 107 a deg(R) = degQ — degPn < n, donc (Pn, R) = 0, donc fj(Q — L)(x)w(x) dx = 0. On en déduit / Q(x)w(x) dx = / L(x)w(x) dx = / I V^ Q{xi)Li{x) 1 w(x)dx = V^ XiQ{xi) Ji Ji Ji\pi ) èï avec Ai = J7 Li(x)w(x) dx. Les À* sont bien uniques, car l'expression (**) appliquée au polynôme de Lagrange Li montre qu'on a forcément A* = fj Li(x)w(x) dx. Enfin, l'expression (**) appliquée à Q = Lj (dont le degré est < 2n — 2) entraîne 0 < fj Li(x)2w(x) dx = Xi. b) L'idée est de calculer de deux manières différentes l'expression fj Kn(x,Xi)Li(x)w(x) dx. Comme deg(Kn(X, Xi)Li(X)) < 2n, on peut appliquer l'expression (**) ce qui donne / Kn(x,Xi)Li(x)w(x)dx = y2\jKn(xj,Xi)Li(xj) = \iKn(xi,Xi). (****) En utilisant maintenant l'expression du noyau Kn, on obtient /» n p n \ Kn(x,Xi)Li(x)w(x)dx = y^Pj(xi) / Pj(x)Li(x)w(x)dx = Y"*Pj(xi)(Pj,Li). Ji U " U Par ailleurs, deg(L^) < n donc Li e Vect(Po, • • • >Pn-i) donc on peut écrire Li = Y^kZo f^kPk avec les /i^ G M, dont l'expression précédente entraîne n n n /IV IV IV Kn(x,Xi)Li(x)w(x)dx = ^2Pj(xi)^2tik(Pj,Pk) = ^PjMfjij = Li(xi) = 1. j=0 fc=0 j=0 Avec (****), on en déduit A; = l/Kn(xi,Xi), d'où le résultat souhaité grâce à l'expression obtenue dans 1/d) pour Kn(x,x). c) Supposons l'identité (**) vraie pour des nombres (x^ et (À*), avec x\ < ... < xn. Alors le polynôme Q = Yl?=i(X ~~ x\) vérifie f n VP G R[X], deg(P) < n, / Q(x)P(x)w(x) dx = Y" \iQ(xï)P(xi) = 0 autrement dit on a (Q, P) = 0 pour tout polynôme P de degré < n. Donc Q = YL7=o (Q> Pi)Pi = (Q, Pn)Pn, autrement dit Q et Pn sont proportionnels, ce qui entraîne que les (x^ sont les racines de Pn, et sont donc uniques. Nous avons déjà vu qu'alors les (A;) étaient uniques, d'où le résultat. d) Soit P le polynôme d'interpolation de Hermite, deg(P) < 2n, tel que P(xi) = f(xi) et P'{xi) = f(xi) pour tout i. D'après l'exercice 7 page 66, on a sma\f{2n)(t)\ Vxel, \f(x)-P(x)\ <M\[{x-Xi)2 avec M = i=l Comme Pn(x) = 7n Iir=i(a' ~~ xi) on en déduit, par intégration (2n)! 72 171 f\f(x) - P(x)\w{x)dx < f M^^-w{x)dx = ^(Pn,Pn) = Jl Jl On Tn Par ailleurs, comme f(xi) = P{xi), on a Jj P(x)w(x) dx = Yh=i ^if(xi) donc / f(x)w(x) dx~y2 ><if(xi) = / (/M - P(x))w(x) dx Jl S Jl d'où le résultat souhaité à partir de la majoration J7 |/ — P\w qui nous avions obtenue. Remarque. Les polynômes orthogonaux classiques sont les suivants : (i) Lorsque / = ] — 1,1[ et w(x) = (1 — s2)-1/2, les Pn sont les polynômes de Tchébycheff de première espèce, et vérifient Pn(x) = Tn(x) = cos(narccos(a;)) (déjà rencontrés dans l'exercice 12 page 70 et le problème 12 page 95).
108 2. CORPS, POLYNÔMES ET FRACTIONS RATIONNELLES (ii) Lorsque / = ] — 1,1[ et w(x) = (1 — a;2)1/2, les Pn sont les polynômes de Tchébycheff de seconde espèce, et vérifient Pn(x) = Un(x) = ^^T^+1(x). (iii) Lorsque / = [— 1,1] et w(x) = 1, les Pn sont les polynômes de Legendre. Ils vérifient Pn\x) = 2"n!<teïï' V^ ~ x ) • (iv) Lorsque / = ] — oo, 4-oo[ et w(x) = e~x , les Pn sont les polynômes d'Hermite. (v) Lorsque / = [0, +oo[ et w(x) = e~x, les Pn sont les polynômes de Laguerre.
CHAPITRE 3 Algèbre linéaire : généralités HISTORIQUEMENT, l'algèbre linéaire naît de l'étude des systèmes linéaires. Abordés dès 1678 par Leibnitz, Maclaurin en 1748 donne les formules de résolution à deux ou trois inconnues, complétées dans le cas général par Cramer en 1754. À partir de là, Vandermonde puis Laplace ont l'idée de définir un déterminant d'ordre n par récurrence sur n, en le développant par rapport une ligne ou une colonne. D'autre part, dans les Recherches Arithmétiques, Gauss avait adopté, pour désigner une transformation linéaire, une notation sous forme de tableau : la notation matricielle. Il y définit même le produit de deux matrices. Ce passage devait suggérer à Cauchy la règle du produit de deux déterminants, publiée en 1815 dans un mémoire. Jusqu'alors, les concepts de déterminant et de matrice sont encore très liés. En 1826, Cauchy, cherchant à déterminer les axes principaux d'une surface du second degré, introduit le polynôme caractéristique d'une matrice. Avec Cayley et Sylvester, au milieu du dix-neuvième siècle, la théorie des matrices se développe. On en est encore au plan et à l'espace. La familiarisation des mathématiciens aux déterminants et aux matrices s'accroissant, elle suggère à ceux ci la conception d'un espace à n dimensions. Mais il fallait oser ! Vers 1843-1845, Cayley et Grassmann franchissent le pas et parlent d'espaces à n dimensions. Cayley se fonde sur la généralisation de la géométrie analytique des coordonnées et introduit les n-uplets (x\y... ,xn). Grassmann a quant à lui l'idée de développer une "analyse géométrique", capable de calculer sur des grandeurs orientées de façon intrinsèque (c'est-à-dire indépendante du choix des coordonnées). Il donne la définition de l'indépendance linéaire d'un système de vecteurs et celle de la dimension d'un sous-espace vectoriel. Enfin c'est Peano qui, en 1888, axiomatise l'algèbre linéaire. Jusqu'en 1930, c'est le point de vue des matrices et des coordonnées qui prédominera, par rapport à un point de vue plus intrinsèque des espaces vectoriels. Remarques préliminaires. On abrégera souvent "espace vectoriel" par "e.v", "sous-espace vectoriel" par "s.e.v". Dans toute la suite, K désigne un corps commutatif. 1. Espaces vectoriels 1.1. Généralités DÉFINITION 1. On appelle K-espace vectoriel (ou e.v sur K) un ensemble E muni d'une loi interne (notée +) et d'une loi externe (notée •) admettant K comme ensemble d'opérateurs et vérifiant : (i) (E1, +) est un groupe abélien. (ii) Pour tout (x,y) G E2 et (A,//) G K2, a) A • (x + y) = A • x + A • y, b) (A + n) • x = A • x + \i • x, c) A • (/j, • x) = (Xfi) • x, d) 1 • x = x.
110 3. ALGÈBRE LINÉAIRE : GÉNÉRALITÉS Remarque 1. - Cette définition entraîne : (À • x = 0) •<=>• (À = 0 ou x = 0). - On dit que E est une K-algèbre s'il existe de plus une loi interne, notée o, vérifiant (i) (F,+,o) est un anneau, (ii) V(ar, y) G E2, VA G K, A • (x o y) = (A • x) o y = x o (A • y). Exemple 1. Les ensembles suivant sont des K-espaces vectoriels : K, Kn (muni des lois (xi,...,xn) + (yi,...,2/n) = (a?i + 2/i, • • • ,xn + î/n) et A • (xu... ,xn) = (\xu...i\xn))1 toute extension de corps L de K, l'ensemble des fonctions d'un ensemble Q dansUC, K[X], K[A"i,... ,Xn]. DÉFINITION 2. Les éléments d'un K-e.v s'appellent des vecteurs, ceux de K des scalaires. DÉFINITION 3. Soit (E, +, •) un K-e.v et F C E. On dit que F est un sous-espace vectoriel de E si (F, +, •) est un K-e.v. Exemple 2. Les ensembles {0} et E sont des s.e.v de E ; Kn[J£] = {P G K[J£], deg(P) < n} est un s.e.v de K[X] ; C(R, R) (ensemble des fonctions continues de R dans R) est un s.e.v du R-e.v des fonctions de R dans R; si P G K[X], l'idéal (P) est un s.e.v de K[X]. Proposition 1. Soit (E, +, •) un K-e.v et F C E. Alors (F, +, •) est un s.e.v de E si et seulement si (i) F^0 (ii) V(x, y) G F2, V(A, fj) G K2, Xx + fiy G F. Remarque 2. On montre rarement directement qu'un ensemble est un e.v, mais souvent que c'est un s.e.v d'un e.v connu (à l'aide de la proposition précédente). PROPOSITION 2. Soit E un K-e.v et (Ei)iei une famille de s.e.v de E. Alors C\i€iEi est un s.e.v de E. Remarque 3. Attention, ce théorème est faux pour la réunion (voir l'exercice 1). Somme de sous-espaces vectoriels. DÉFINITION 4. Soit E un K-e.v, (Ei)i€i une famille de s.e.v de E. On note Yliei -^ = {Y^ieixi I les xi ^ Q étant tous nuls sauf un nombre fini}. L'ensemble ^2iejEi est un s.e.v de E appelé somme des s.e.v (Ei)iei. Définition 5. Soient Fi,..., En n sous-espaces vectoriels d'un K-e.v F. On dit que F est somme directe de E\,..., Fn si tout vecteur x £ E s'écrit de manière unique sous la forme x = x\ H h xn où Vi, xi G F*. On note alors F = Ex © • • • 0 Fn = 0"=1Ff. Remarque 4. Si F = Fi 0 • • • 0 Fn, on a bien sûr F = Ya=i Ei = Ei-\ \- En. Proposition 3. Soient Ex et E2 deux s.e.v d'un K-e.v F. Alors F = Fi 0 F2 si et seulement si F = Fi + F2 ei Fi D F2 = {0}. Remarque 5. - Cette proposition est fausse s'il y a plus de deux s.e.v. - On dit que n s.e.v Fi,..., Fn sont en somme directe si Y^=i -^ = ®?=i-^<- On a Ie résultat pratique suivant : Les (Fj)i<i<n sont en somme directe si et seulement si l'égalité x\ H \- xn = 0 avec Vê, Xi € Ei, entraîne Vê, a;* = 0. Familles génératrices, familles libres. DÉFINITION 6. Soit (xi)iei une famille de vecteurs d'un K-e.v F. On appelle combinaison linéaire des (xi)iei toute somme 2i€j A^ où pour tout i, Xi G K et où les Xi sont tous nuls sauf un nombre fini. - L'ensemble F des combinaisons linéaires des (xi)iei est un s.e.v de F noté Vect(xi)iei- C'est le plus petit s.e.v de F contenant tous les je».
1. ESPACES VECTORIELS 111 Définition 7. Soit E un K-e.v et A C E. On note Vect^ = Vect(a)aeA- On dit que A est une partie génératrice de E (ou (a)a£A une famille génératrice de E) si Vect A = E. Définition 8. Soit (xi)ieI une famille d'un K-e.v E. Alors (i) et (ii) sont équivalents : (i) Toute combinaison linéaire vérifiant 2te/ ^txi = 0 vérifie Vi, À; = 0. (ii) Aucun vecteur de la famille n'est combinaison linéaire des autres. Une famille de vecteurs vérifiant (i) ou (ii) est dite libre (on dit aussi que les vecteurs (a?»)tei sont linéairement indépendants). Dans le cas contraire, la famille est dite liée. Citons enfin le théorème qui est à la base de la théorie sur la dimension des espaces vectoriels. THÉORÈME 1. Dans un e.v E engendré par un nombre fini n de vecteurs (c'est-à-dire 3(#i,..., xn) G En, E = Vect(xi,..., xn)), toute famille libre a au plus n éléments. 1.2. Bases et dimension d'un espace vectoriel Base d'un espace vectoriel. DÉFINITION 9. Une famille libre et génératrice d'un e.v E est appelée une base de E. PROPOSITION 4. Soit E un K-e.v admettant une base (e*)^/. Alors tout vecteur x de E s'écrit de manière unique comme combinaison linéaire des (ei)iei : x = Y^iei ^ixi (avec les Xi tous nuls sauf un nombre fini) . Les (\i)i£i s'appellent les coordonnées de x dans la base (eijiçj. Exemple 3. La famille (ei)i<i<n (où e* = (0,..., 0,1,0,..., 0), le 1 se trouvant à la i-ième coordonnée), est une base de Kn appelée base canonique de Kn. - La famille (Xn)n€^ est une base de K[X] appelée base canonique de K[X]. DÉFINITION 10. On dit qu'un K-e.v E est de dimension finie s'il existe une famille génératrice finie de E. Dans la cas contraire, on dit que E est de dimension infinie. L'existence de base en dimension finie est assurée par le théorème suivant. Théorème 2. Soit E un K-e.v de dimension finie, G un système fini de générateurs de E, C C G un système libre. Alors il existe une base B de E telle que C C B C G- Conséquences en dimension finie. - Tout K-e.v de dimension finie admet une base. - De toute famille génératrice de E on peut extraire une base de E. - Toute partie libre peut être complétée en une base (résultat connu sous le nom de théorème de la base incomplète). Remarque 6. Le théorème 2 reste vrai en dimension infinie, mais sa démonstration fait appel à l'axiome du choix. Théorie de la dimension. Théorème 3. Soit E un K-e.v de dimension finie. Toutes les bases de E ont même cardinal n. L'entier n s'appelle dimension de E, et est noté dim^ E (avec par convention dimK E = 0 si E = {0}). PROPOSITION 5. Soit E un K-e.v de dimension finie n G N*. Alors - Tout système libre de n vecteurs de E est une base de E. - Tout système générateur de n vecteurs de E est une base de E. PROPOSITION 6. Soit E un K-e.v de dimension finie n G N*. Soient Ei,..., Ek k s.e.v de E. Alors E = E\®- • -®Ek si et seulement si E = E\-\ Y Ek etn = Y^e=i ^m Et.
112 3. ALGÈBRE LINÉAIRE : GÉNÉRALITÉS Proposition 7. Soit E un K-e.v et E\, E2 deux s.e.v de E de dimension finie. Alors Ei + E2 est un s.e.v de dimension finie et dim(Ei + E2) = dimi?i + dimi?2-dim(i?in.Éy. COROLLAIRE 1. Soit E un K-e.v de dimension finie, E\ et E2 deux s.e.v de E. Alors (i), (ii) et (iii) sont équivalents : (i) E = EX®E2. (ii) dim£ = dim£i + dim£2 et EiCiE2 = {0}. (iii) dim E = dim Ex + dim E2 et E = E\ + E2. Si (i), (ii) ou (iii) est vérifié, on dit que E2 est un supplémentaire de E\ dans E. Remarque 7. Si F est un s.e.v de E, il y a en général une infinité de supplémentaires de F dans E. 1.3. Exercices Exercice 1. Soit K un corps commutatif et E un K-e.v. a) Soient F et G deux s.e.v de E. Si F U G est un s.e.v de E, montrer que F C G ou G CF. b) Soit k > 2 et (Vi)i<i</c une famille finie de k s.e.v stricts de E (i. e. pour tout i, Vi ^ {0} etVi^E).SiE = ViU---U Vk, montrer que K est fini et que k > Card(K) + 1. Cette inégalité peut-elle être une égalité ? Solution, a) Raisonnons par l'absurde et supposons que F (jL G et G (jL F, de sorte qu'il existe x G F} x £ G, et il existe y G G, y £ F. Le vecteur x + y est dans le s.e.v FuG, donc x + y e F ou x + y G G. Supposons par exemple x + y G F. Comme F est un s.e.v et que x G F, on a (x + y) — x G F, c'est-à-dire y e F, ce qui est absurde. D'où le résultat. b) C'est plus délicat. Quitte à retirer Vi, on peut supposer V\ <f. (V2 U • • • U Vk). Il existe donc x G Vi tel que x g V2 U • • • U V*. Or (V2 U • • • U Vk) (jL V\ (sinon Vi = E), donc il existe y G V2 U • • • U Vk tel que y g V\. Si A G K, alors y + \x G E. Or y + Xx g V\ (sinon y G Vi car x G Vi), donc pour tout A G K, il existe i\ G {2,..., k] tel que y + Xx G V{x. L'application K —> {2,..., k} X*-^ i\ est injective (en effet, si i\ = i^ alors y + Xx et y + \ix G VfA donc (A — /i)x G V*A, et comme x & VfA, on doit avoir A = /i). De cette injectivité, on déduit que Card(K) < Card{2,. ..,&} = & — 1, d'où l'inégalité souhaitée. Cette inégalité peut être une égalité. Par exemple, si K = Z/2Z et E = K2, si Vi = {(0,0), (Ô, i)}, V2 = {(0,0), (i,Ô)} et V3 = {(0,0), (i, i)}, alors Vi, V2 et V3 sont des s.e.v stricts de E etV1UV2UV3 = E. EXERCICE 2. Montrer que dans le R-e.v des fonctions continues de R dans R, les familles de fonctions suivantes sont des familles libres : a) (/a)age où /a : R -+ R x ~ eXx. b) (/a)agir+ où fx : M -> M a; »-> cos(Arc). c) (/a)a6R où /a : R -> R s h+ |s - A|. Solution, a) Supposons cette famille liée, de sorte qu'il existe (A;)i<;<n G Mn et (^) G Rn tels que X)iLi Mi/Ai = 0 avec les in non tous nuls. Quitte à retirer des termes, on peut supposer IH 7^ 0 pour tout i. Quitte à réordonner des termes, on peut même supposer Ai > À2 > • • • > An. On a / n \ n lim e-Aia: ( yVeA<x I = lim yVe(A'~Al)x = Mi, \Z=1 / 2=1 car pour i > 2, À; — Ai < 0. Or J2i f^ifXi = 0> et cette limite est donc nulle, donc fi\ = 0, ce qui est contradictoire.
2. APPLICATIONS LINÉAIRES 113 b) Montrons par récurrence sur n G N* que si YA=if1ifXi = 0 (avec les A; distincts dans M+), alors pour tout i, fa = 0. Pour n = 1 c'est évident. Supposons maintenant le résultat vrai jusqu'au rang n — 1 et montrons le au rang n. Si J27=i fafXi = 0 (*)> les (^î) distincts dans R+y par double dérivation, on obtient S2=iMi("^?/Ai) = 0 (**). En multipliant l'égalité (*) par A^ et en l'ajoutant à (**), on obtient Ya=i Mt(^i ~~ ^n)f^i = 0> donc d'après l'hypothèse de récurrence, pour tout 1 < i < n — 1, fa{\^ — A^) = 0. Les À; étant positifs et distincts, on en déduit fa = 0 pour 1 < i < n — 1. Donc d'après (*), finf\n = 0> d'où \in = 0. Finalement on a montré fa = 0 pour 1 < i < n. c) Supposons la famille (/a)agk liée. Alors il existe Ào 6 M tel que f\0 s'écrive comme une combinaison linéaire des (/a)à^a0> autrement dit : n 3n G N*, BÀi,..., An G R \ {A0}, 3/ui> • ••.^eK, /a0 = ^Hif\r Or pour tout i > 1, Xi ^ Ao donc /^ est dérivable au point Ao (l'application x h-> |x — A| est dérivable partout sauf en A), d'où on tire que J2ï=i VifXi es^ dérivable en Ao, ce qui est absurde car ceci égale f\0. D'où le résultat. Remarque. On aurait pu résoudre le a) comme on l'a fait pour b). L'avantage de cette dernière méthode est qu'elle aurait permit de conclure même si l'intervalle de définition des (/a) n'était pas R tout entier. EXERCICE 3. Soit E un K-espace vectoriel de dimension finie, et A et B deux s.e.v de E de même dimension r. Montrer que A et B admettent un supplémentaire commun {i. e. il existe un s.e.v S de E tel que A 0 S = B 0 S = E). Solution. Nous allons effectuer une récurrence descendante sur r < dimE. Si r = dimi?, c'est évident car {0} est un supplémentaire commun à A et à B. Supposons le résultat vérifié au rang r 4-1 < dim E et démontrons le au rang r. On a AUB ^ E. En effet, supposons AuB = E. Comme A(/lB (sinon E = AuB = B), il existe x G A tel que x £ B. De même, il existe y G B, y $. A. Or x 4- y G E = A U B, donc £ + 2/G.Aou:e + 2/G.B, par exemple x + y e A. Alors y = (x 4- 2/) — x G -A, ce qui est absurde. On a donc bien Al)B ^ E. Donc il existe x e E,xg AuB. Soit A' = A + Vect(x), B' = B + Vect(x). On a dim 4' = dirai?' = r + 1, donc d'après l'hypothèse de récurrence, il existe un s.e.v S' de E tel que A'0S' = B'0S' = E. Si S = S'4- Vect(x), on a donc ^ = ^'©5' = ^®Vect(x)0S' = A0S et E = B'mS' = Bm Vect(rc) © S' = B 0 5, d'où le résultat. 2. Applications linéaires 2.1. Généralités DÉFINITION 1. Soient E et F deux K-e.v et / : E —> F une application. On dit que / est linéaire si V(x, y) G F2, V(A, M) g K2, f(Xx 4- w) = A/(s) 4- fif(y). L'ensemble des applications linéaires de E dans F est un K-e.v noté C(E, F). Exemple 1. - L'application (p : C([0,1],R) —► R / t-> /0 /(£) cft est linéaire. - Si A G K,. l'application <p : E —> £ x t-> Ax est linéaire. Remarque 1. - Une application linéaire de £" dans K est appelée forme linéaire.
114 3. ALGÈBRE LINÉAIRE : GÉNÉRALITÉS - Une application linéaire de E dans E est appelée endomorphisme. - Si / est linéaire, alors /(0) = 0. - La composée de deux applications linéaires est linéaire. - Si / : E —> F est linéaire et bijective, on dit que / est un isomorphisme de K-e.v. L'application f~l : F —> E est aussi linéaire. - Si / G C(E, F), la linéarité de / entraîne que pour connaître (resp. pour définir) /, il suffit de la connaître (resp. définir) sur une base de E. PROPOSITION 1. L'image (ou l'image réciproque) d'un s.e.v par une application linéaire est un s.e.v. DÉFINITION 2. Soient E et F des K-e.v et / G C(E, F). On appelle noyau de / l'ensemble noté Ker/ = /-1({0}) = {x e E \ f(x) = 0}. On appelle image de / l'ensemble noté Im/ = f(E). Les ensembles Ker/ et Im/ sont des s.e.v. Par ailleurs, / est injective si et seulement si Ker/ = {0}. DÉFINITION 3. Soient E et F des K-e.v et / G C(E, F). On dit que / est de rang fini si Im / est de dimension finie. Dans ce cas, l'entier dim(Im /) est appelé rang de / et noté rg/- 2.2. Espaces vectoriels quotients DÉFINITION 4. Soit E un K-e.v et F un s.e.v de E. La relation 1Z définie par (xlZy •£=> x — y G F) est une relation d'équivalence sur E. L'espace quotient est noté E/F, et c'est un K-e.v muni des lois x + y = x + y, Xx = \x. DÉFINITION 5. Soit E un K-e.v, F un s.e.v de E. Si E/F est de dimension finie, on dit que F est de codimension finie dans E. On appelle alors codimension de F dans E l'entier codim^ F = dim(E/F). Si codim^ F = 1, on dit que F est un hyperplan de E. PROPOSITION 2. Soit E un K-e.v. Un s.e.v F de E est de codimension finie dans E si et seulement si F admet un supplémentaire S dans E de dimension finie. On a alors dim S = codini£ F. Démonstration. Condition nécessaire. Supposons E/F de dimension finie. Pour tout x e E, on note x sa classe dans E/F. Soit (e'i,... ,en) une base de E/F. Soit S = Vect(ef)i<f<n. Alors - FnS = {0} car si x = Yh=i ^iei G F n 5, alors x = Ô = ]C?=i ^i et donc pour tout i, Xi = 0. - F + S = E. En effet, soit x G E. Il existe Ai,..., Àn G K tels que x — Z-/i=i ^i^i- Si y = Ya=i ^eî> on a d°nc z = x — y € F (car z = x — y = 0) et x = z + y, y e S. Donc F 0 S = E, et dim S = n = dim(E/F) = codim^ F. Condition suffisante. Supposons F 0 S = £", où S est de dimension finie n. Soit (ei,..., en) une base de S. Nous montrons que (e'i,..., ën) est une base de E/F. - (e'i,..., e'n) est une famille génératrice de E/F. En effet, si x G E, il existe y e F et z e S tel que x = y + z et donc x = y + z = ze Vect(e'i,..., ën). - (e'i,..., e'n) est une famille libre. En effet, si J27=i ^îe"î = Ô, alors X^=i ^*e* e ^ ^onc est nul car FnS = {0}. Donc pour tout z, À; = 0. Finalement, on a donc codim^ F = dim(E/F) = n = dim S. □ Corollaire 1. Si E est un K-e.v de dimension finie, si F est un s.e.v de E, alors F est de codimension finie dans E et codim^ F = dim E — dim F. Factorisation d'une application linéaire. Théorème 1. Soient E et F deux K-e.v et f e C(E,F). Alors Im/ est isomorphe à E/Kevf.
2. APPLICATIONS LINÉAIRES 115 Théorème 2. Soit E un K-e.v de dimension finie, F un K-e.v et f e C(E,F). Alors f est de rang fini et dimE = dim(Ker/) + dim(Im/) = dim(Ker/) + rg/. Corollaire 2. Soit f G C(E, F) où E et F sont deux K-e.v de même dimension finie. Alors : (f est bijective) ^=> (/ est injectivé) <£=> (/ est surjective). Remarque 2. Ce dernier résultat est très important. Il est faux en dimension infinie; par exemple, / : R[X] —> R[X] P h-> P' est linéaire surjective mais pas bijective. 2.3. Algèbre des endomorphismes Les endomorphismes sont des applications linéaires très importantes. Ils vérifient de nombreuses propriétés et c'est pour cela qu'on les étudie plus particulièrement. Dans toute la suite de cette section, E désigne un K-e.v. On note C(E) = C(E, E). Muni de la loi o de composition, C(E) est une K-algèbre unitaire. On note Çê(E) l'ensemble des endomorphismes bijectifs (encore appelés auto- morphismes) de E. Muni de la loi o de composition, Q£(E) est un groupe appelé groupe linéaire de E. Définition 6. On dit que / G C(E) est une homothétie de rapport À G K si / = ÀId# (où Id^ désigne l'application identité de E). Remarque 3. L'ensemble des homothéties de rapport non nul forme un sous-groupe de Gt{E). On montre à l'exercice 6 page 118 que c'est le centre du groupe Ç£(E). Proposition 3. Soit f G C{E). Alors f est une homothétie si et seulement pour tout x G E, la famille (x,f(x)) est liée. Démonstration. Condition nécessaire. C'est immédiat. Condition suffisante. Par hypothèse, pour tout x e E, il existe Xx e K tel que f(x) = \x - x. Fixons xq e E, xo^ 0. Nous allons montrer que pour tout x e E (x ^0), Xx = XXo. - Si x G Kxo et x ^ 0, alors il existe // G K tel que x = fixo. Donc \xx = f(x) = (J,f(xo) = ^XXqxq = XXo(/j,x0) = XXox. On en conclut Ax = AXo. - Sinon x et xq forment une famille libre, et on a alors AaH-xo(£ + X0) = f(x + X0) = f(x) + f(x0) = XXX + XXQX0, donc comme (xyxo) est libre, Xxo+x — ^xo — ^x> d'où le résultat. □ Projecteurs et symétries. Définition 7. Soient Ex et E2 deux s.e.v de E tels que Ei@E2 = E, de sorte que Vx G E, 3\(xi,x2) G Ei x E2 tel que x = X\ 4- x2. L'application p: E —> E x i-> x\ est linéaire et s'appelle projection sur E\ parallèlement à E2. On a Kerp = E2, Imp = E\ et p o p = p. Définition 8. Un endomorphisme p G C(E) est appelé projecteur si pop = p. Proposition 4. Soit p G C(E). Alors p est un projecteur si et seulement si p est la projection sur Imp parallèlement à Kerp. On a alors E = Kerp 0 Imp. Remarque 4. Si p est un projecteur, alors y G Imp si et seulement si y = p(y). Définition 9. Soient Ex et E2 deux s.e.v de E tels que E = Ei © E2, de sorte que Va; G E, 3\(xi,x2) G Ex x E2 tel que x = x\ + x2. L'application s : E —> E rr h-> xi — x2 s'appelle symétrie par rapport à Ei parallèlement à E2. On a s G C(E) et si p est la projection sur Ei parallèlement à E2, s = 2p — Id#.
116 3. ALGÈBRE LINÉAIRE : GÉNÉRALITÉS PROPOSITION 5. Supposons que la caractéristique du corps K soit différente de 2. Alors s G C(E) est une symétrie si et seulement si s o s = Id^. Si p = |(s + Id#), p est un projecteur et s est la symétrie par rapport à lmp parallèlement à Kerp. Remarque 5. Si K est de caractéristique 2, on peut avoir s2 = Id# sans que s soit une symétrie (prendre par exemple 5 telle que [s] = f n 1 G A^2(^/2Z)). 2.4. Exercices Exercice 1. Soit E un K-e.v de dimension finie et F un K-e.v. a) Soient /, g G C(E,F). Montrer les inégalités I rg/ - rgg\ < rg(/ + g) < rg/ + rgg. b) Soient deux endomorphismes /, g G C(E) tels que fg = Oetf + gest inversible. Montrer que rg / + rg g = dim E. Solution, a) Im(/ + g) = (/ + g)(E) c f(E) + g(E), donc rg(/ + g) = dim(Im(/ + g)) < dim[f(E) + g(E)\ < dim f(E) + dimg(E) = rg/ + Tgg. Comme / = (/ + g) + (-g) et que rg# = rg(-#), on a aussi rg/ < rg(/ + p) + rgg. De même, rg# < rg(/ + g) + rg/. On en déduit finalement que |rg/ — rgp| < rg(/ + p). b) Comme / + g est inversible, rg(/ + #) = dimi?, donc d'après a), rg / + rg g > rg(/ + g) = dim E. (*) Comme fg = 0, on a lm.g c Ker/, donc rgp < dim(Ker/) = dimi? — rg/, c'est-à-dire rg/ + rg# < dmxE. Avec (*), on en déduit le résultat. EXERCICE 2. Soit E un K-e.v (où K est de caractéristique différente de 2), et p, q G £(£) deux projecteurs. a) Montrer que p + q est un projecteur si et seulement sipoq = qop = 0. b) Montrer que si p + q est un projecteur, Im(p + q) = Imp0 Img et Ker(p +q) = Ker pC\ Ker q. Solution, a) Condition nécessaire. Comme p + q est un projecteur, on a {p + q) = p + q, c'est-à- dire p2+poq + qop + q2 = p + q. Or p2 = p et q2 = q, doncpoq + qop = 0 (*). En composant (*) par p à droite, on obtient poqop + qop2 = 0 = poqop + qop. En composant (*) par p à gauche, on obtient p2oq + poqop = 0 = poq + poqop. On en déduit p o q = q o p, et d'après (*), K étant de caractéristique différente de 2, p o q = q op = 0. Condition suffisante. C'est immédiat car (p + g)2 = p2 + p o g + q o p + q2 = p2 + q2 = p + q. b) Montrons que Im(p 4- q) = Ivcip 0 Iraq. - On a déjà lmp Dlmq = {0}. En effet. Soit y G lmp D Imq. Il existe x et x' e E tels que y = p(x) = q{x'). Donc p{y) = p2{x) = p o q(x) = 0 d'après la question précédente. Or p2(x) = p(x) = y, donc y = 0. - Il nous reste à montrer que Im(p + g) = Imp + Img. L'inclusion Im(p + ç) C Imp + Imq est immédiate. Montrons l'inclusion réciproque. Soit y G Imp + Img, de sorte qu'il existe x et x' € E tels que î/ = p(x)+q(x'). On a alors (p+g)(2/) = p2{x)+qp(x)+q2(x')+pq(x') = p{x)+q{x') = y, donc y = (p + q)(y) e lm(p + q), d'où le résultat. Montrons maintenant que Ker(p + q) = KerpDKerg. L'inclusion KerpDKerg C Ker(p + q) est immédiate. Montrons l'inclusion réciproque. Soit x G Ker(p-\-q). Comme p(x) + q(x) = 0, on a, en composant par p à droite p2{x) + q op(x) = 0 d'où p(x) = 0. De même, en composant par q à droite, on obtient p o q{x) + q2(x) = 0 = q(x). Donc x G Kerp n Ker g.
2. APPLICATIONS LINÉAIRES 117 EXERCICE 3. Soit E un K-e.v de dimension finie, soit / G C(E). Montrer l'équivalence (E = Im/eKer/) «=» (Im/ = Im/2). Cette équivalence reste-t-elle vraie en dimension infinie ? Solution. Condition nécessaire. On a f{E) c E donc f2(E) = f[f(E)] c f(E), c'est-à-dire Im/2 C Im/. Montrons maintenant Im/ c Im/2. Soit y = f(x) G Im/. Il existe (x\,X2) G Im/ x Ker/ tel que x = x\ + #2, donc ?/ = /(x) = f{x\) G Im/2. Condition suffisante. Soit rc G £. On a f(x) G Im/ = Im/2 donc il existe x' e E tel que /(s) = f2{x'). Donc /[s-/(a/)] = °> d'où V = x-f{x') G Ker/. Si z = f(x') G Im/, on a donc x = y + z avec y G Ker/ et z G Im/. Autrement dit, on vient de montrer E = Im/ 4- Ker/. Comme de plus dim(Im/) + dim(Ker/) = dimi?, on en déduit E = Im/ © Ker/ (voir le corollaire 1 page 112). En dimension infinie, ce résultat est faux. Par exemple, si / G £(R[X]) est définie par f(P) = P1 y on a Im/2 = R[X] = Im/ et pourtant Im/ et Ker/ ne sont pas en somme directe (Im/ = R[X) et Ker/ ^ {0}). Exercice 4. Soit i? un K-e.v (de dimension quelconque), et soient F et G deux s.e.v de E tels que (i) G C F et (ii) F et G sont de même codimension finie dans E. Montrer que F = G. Solution. Pour tout x G E, on note x sa classe dans E/G, x sa classe dans E/F. Six = y, alors x = y (car x — y = 0 donc x — y G G donc x — y e F, c'est-à-dire # = y). Considérons l'application / : E/G —> E/F x h-> x. Elle est linéaire et surjective donc bijec- tive car E/G et E/F sont des K-e.v de même dimension finie (voir le corollaire 2). L'application / est donc injective, de sorte que si x G F, x = 0 alors x = 0, i. e. x G G. En d'autres termes, F C G. Comme G C F par hypothèse, on a F = G. Exercice 5 (Suites exactes), a) Soient £0, Eu...,En des K-e.v de dimension finie; on note a^ = dim Ef.. On suppose qu'il existe n applications linéaires /o, /i, • • •, }n-i telles que pour tout k, fk G C(Ek,Ek+i), et vérifiant (i) /o est injective, (ii) VA;, 1 < k < n - 1, Im/fc_i = Ker/fc, (iii) /n_i est surjective. (On dit que (/o, • • •, /n-i) constitue une suite exacte.) Montrer que ]Cfc=o(—l)kak = 0. b) (Application). Soit E un K-e.v, F et G deux s.e.v de E de codimension finie dans E. Montrer que F + G et FC\G sont de codimension finie dans E et que codim^fF + G) = codim^ F + codim^ G — codim£(F D G). Solution, a) L'assertion (ii) entraîne dim(Ker/fc) = rgfk-i pour 1 < k < n — 1, donc Vfc, 1 < k < n - 1, ak = dim(Ker fk) + rg fk = rg /fc_i + rg fk. Or ao = rg/o car /o est injective, et an = rg/n_i car /n_i est surjective. On en déduit n ^(-l)fcafc = (rg/o) - (rg/o + rg/i) + • • • + (-l)n~\rg fn-2 + rg/„-i) + (-l)nrg/n_i = 0. fc=0 b) Pour tout x G £", on note x sa classe dans E/(F n G), x dans .B/jP, x dans .B/G et 5 dans E/(F + G). Définissons /: E/(FC\G)^E/FxE/G x^{x,x)
118 3. ALGÈBRE LINÉAIRE : GÉNÉRALITÉS et g : E/F x E/G - E/(F + G) (x, y) •- {x^y). Nous allons montrer que (/, g) constitue une suite exacte. - / est bien une application, car si x = y, alors x — y G F H G donc x = y (car x — y G F) etx = y (car x — y e G). - g est aussi une application, car si (x, y) = (x',y')> on a x - x' 6 F et j/ - ^ 6 G, donc (x - a/) — (y - y') = (x - y) - {x' - y') G F + G, c'est-à-dire x - y = x' — y'. - Il est clair que f et g sont linéaires. - / est injective, car si (x,x) = (0,0), x G F et x G G donc xGFflG, c'est-à-dire a; = Ô. Comme E/F x £"/£ est de dimension finie (car E/F et E/G le sont), Pinjectivité de / permet d'affirmer que F n G est de codimension finie (en effet, si E/(F fl G) était de dimension infinie, on pourrait trouver dans E/(F fl G) une famille libre contenant plus d'éléments que la dimension de E/F x E/G, absurde car l'image de cette famille libre par / injective est aussi une famille libre). - g est surjective car si z G E/(F + G), z = g(z,0). Donc E/F x E/G étant de dimension finie, E/(F + G) = g(E/F x E/G) est de dimension finie. - Im/ = Kevg. En effet, on a déjà Im/ C Ker# car g(f(x)) = g(x,x) = x — x = 0. On a également Kerg C Im/ car si (x,y) G Kerg, x — y e F + G donc il existe xi G F et j/iGG tels que x — y = x\ — y\. Donc x — x\ = y — y\ = u, d'où x = û et y = u, donc On est donc dans les conditions d'application de a), ce qui nous donne dim(J5/(F n G)) - à\m(E/F x F/G) + dim(E/(F + G)) = 0, d'où le résultat car dim(E/F x E/G) = à\m(E/F) + à\m(E/G). Exercice 6 (Centre du groupe linéaire). Soit E un K-e.v de dimension finie. Quel est le centre du groupe linéaire Qt[E) (i. e. l'ensemble des / G Q£(E) tels que V# G Qt[E), fg = gf) ? Solution. Nous allons montrer le résultat suivant. Si / G C(E) commute avec tous les éléments de Gi(E)y alors / est une homothétie. En particulier, le centre de G£(E) est {AId# | À G K*}. Soit / G C(E) tel que \/g G Qi{E), gf = fg. Supposons que / ne soit pas une homothétie. D'après la proposition 3 page 115, il existe u G E, u ^ 0, tel que la famille (u, f(u)) forme une famille libre. Complétons là en une base (u, f(u), es,..., en) de E. Définissons g G C(E) sur cette base comme suit g(u) = u, g(f(u)) =u + f(u), Vi > 3, g (et) = e*. On a g G Gi(E) car g transforme une base de E en une base de E. Or g o f{u) = u + f(u) et / o g{u) = f(u)y donc / o g ^ g o f car u^0. Finalement, / est une homothétie. Exercice 7. Soit E un K-e.v de dimension finie n. Soit / G C(E). On suppose qu'il existe xq G E1 tel que £ = (/(x0), f2(xo)> • • • > fn(xo)) forme une base de £". a) Montrer que / est bijective. b) Montrer qu'il existe (a0,..., On-i) £ Kn tel que fn + an-ifn~~l H h ai/ + a0 Id# = 0 (sans utiliser, bien sûr, le théorème de Cayley-Hamilton). Solution, a) Soit y e E. Comme (/(xo), - - -, fn(xo)) est une base de E, il existe (Xi)i<i<n G Kn tels que y = Ai/(x0)+- • -+An/n(a;o), donc y = /[AiXo+A2/(xo)+- • •+An/n""1(a;o)] G Im /, et ceci pour tout y G E. L'application / est donc surjective, donc bijective car c'est un endomorphisme en dimension finie.
3. MATRICES 119 b) Comme B formé une base de E, il existe Ai,..., An € K tels que fn+1(xo) = Xnfn(xo) H h Ai/(x0). Posons g = fn+1 - \nfn Ai/. On a g(x0) = 0. Or Vt, 1 < * < n, glftxo)] = fn+i+1(x0) - Xnfn+i(x0) Aif+1(x0) = r\g(x0)] = 0, autrement dit g s'annule sur la base B, donc g = 0. En composant g à gauche par /_1, on obtient fn_Xnfn-l Aild£ = 0. 3. Matrices 3.1. Généralités DÉFINITION 1. Soient pet q e N*. On appelle matrice de type (p, q) ou matrice à p lignes et q colonnes à coefficients dans K, toute famille (a^) i<t<P avec pour tout (z, j), au G K. On note cette matrice de la manière suivante q colonnes p lignes / Ûl.l «1,2 * ' ' Ol,q \ Û2,l ^2,2 * " * Q>2,q \ ûp.i oPi2 • • • aPtQ ) DÉFINITION 2. On note MPiq(K) l'ensemble des matrices de type (p, q) à coefficients dans K. - (Cas 9 = 1). Un élément de A1P)i(K) s'appelle une matrice colonne. - (Cas p = 1). Un élément de Mi>q(K) s'appelle une matrice ligne. - (Casp = q). Les éléments de MP)P(K) s'appellent des matrices carrées. On note alors MP(K) = MP>P(K), appelé ensemble des matrices carrées d'ordre (ou de taille) p. Définition 3. Soit A = (ûjj) i<t<P G MPtq(K). On appelle matrice transposée de A et on note M. la matrice B = (b^j) i<i<q G A^g,p(K) avec bu = du- Remarque 1. - La représentation sous forme de tableau de la matrice M. est le symétrique de celle de A par rapport à la diagonale constituée des coefficients aiyi. - Pour toute matrice A, t(tA) = A. DÉFINITION 4 (DÉFINITIONS RELATIVES AUX MATRICES CARRÉES). Soit n G N* et une matrice A = (ojj-)i<*<n G Mn(K). l<j<n - Les (ot,»)i<*<n s'appellent les éléments diagonaux de A. - La diagonale principale de A est l'ensemble de ses éléments diagonaux. o - Si Ojj = 0 pour i > j, A est dite triangulaire (ou trigonale) supérieure - Si Oij = 0 pour i < j, A est dite triangulaire (ou trigonale) inférieure - Si Ojj = 0 pour i ^ j, A est dite diagonale. - S'il existe A G K tel que pour tout i, a»,» = A et pour tout i ^ j, a^ = 0, on dit que A est une matrice scalaire. - Si pour tout (i, j), Ojj = a^ (de manière équivalente si lA = A), A est dite symétrique. - Si pour tout (i, j), Ojj = —a,jti (de manière équivalente si lA = —A), A est dite antisymétrique. Dans ce cas, si K est de caractéristique différente de 2, les éléments diagonaux de A sont nuls.
120 3. ALGÈBRE LINÉAIRE : GÉNÉRALITÉS 3.2. Matrices et applications linéaires Soient E et F deux K-e.v de dimension finie, dimE = q G N*, dimF = p G N*. Soit B = (ei,..., eq) une base de E, B' = (e[,..., e'p) une base de F. Soit / G C(E, F). Pour tout j, 1 < j < q, on peut écrire f(ej) = Ya=i ai,jei ou les ai,j € K. La matrice A = (a>ij)i<i<p est appelée matrice de / dans les bases B et B' et notée [/]f. Il revient au même de dire que les vecteurs colonnes de la matrice [/]#' sont les coordonnées dans la base B' des images par / des vecteurs composant la base B. On munit MPtq(K) des opérations suivantes : - Si A = (ojj) i<i<P et B = (bij) i<i<P, on définit A + B = (au + 6».-) i<t<P. - Si A = (dij) i<t<p et À G K, on définit XA = (Àa*j) i<t<P. Muni de ces opérations, Mp>q(K) est un K-e.v. Si pour tout (ê, j), 1 < i < p, 1 < j < q, Eitj désigne la matrice dont tous les éléments sont nuls sauf celui d'indice (i,j) qui vaut 1, les Eij (1 < i < p, 1 < j < q) forment une base de MPtq(K) appelée base canonique de Aip>q(K). Ceci entraîne en particulier le résultat suivant. Proposition 1. Le K-e.v Mp,q(K) est de dimension finie pq. Fixons deux bases B de E et B' de F. L'application *: C(E,F)^Mp,q(K) f~\f\% est un isomorphisme de K-e.v. En particulier, dim(C(E, F)) = dim(Mp>q(K)) = pq = (dim£)-(dimF). Multiplication de matrices. DÉFINITION 5. Soient p,q,r G N* et A = (aitj)i<i<P G MPtQ(K), B = (bu)i<i<q G l<j<q ' ' l<j<r MQtr(K). On définit la matrice C = (citj) i<t<P G AlP)r(K) par citj = Yll=i ai,kbkj- La matrice C est appelée produit des matrices A et B et on note C = AB. Remarque 2. - Attention, le produit de A par B ne peut être réalisé que si le nombre de lignes de B est égal au nombre de colonnes de A. - Le produit de matrices est associatif (mais pas commutatif) et distributif par rapport à l'addition. - Soit / G £(E, F), B une base de E, B' une base de F. Soit x G E et y = f(x). On note X la matrice colonne dont les éléments sont les coordonnées de x dans la base B, Y la matrice colonne dont les éléments sont les coordonnées de y = f(x) dans la base B'. On a alors Y = [/]%'X, au sens du produit de matrices défini plus haut. PROPOSITION 2. Soient E, F et G des K-e.v de dimensions finies. Soit B une base de E, B' une base de F et B" une base de G. Si f G C(F,G) et g e £(E,F), on a Remarque 3. (Produit par blocs). Si M G Mp>q(K) et M' G Mq,r(K), r q—r M-f^^l M'-(A' 5'Vrlignes M ~ y C D y M \C' D' ) }q-r lignes alors , _ / A A' 4- BC' AB' + BD' MM -\CA' + DC' CB' + DD' Tout se passe comme si on multipliait deux matrices 2 x 2, en prenant garde à l'ordre dans les produits (il n'y a pas commutativité).
3. MATRICES 121 3.3. Matrices carrées Soit n G N*. Le K-e.v Mn(K) = Mn,n(K), muni de la loi produit sur les matrices, est un anneau (c'est même une K-algèbre) unitaire (l'élément unité est la matrice identité, notée /„, qui est une matrice scalaire dont les coefficients diagonaux sont égaux à 1). Cet anneau est non commutatif et non intègre dès que n > 2. L'ensemble des éléments inversibles de l'anneau Mn(K) est un groupe appelé groupe linéaire d'indice n et noté Q£n(K). Soit E un K-e.v de dimension finie n G N*, B une base de E. Si f e £(E), on note [/]b = [/]! et on l'appelle matrice de / dans la base B. L'application $ : C(E) —> .Mn(K) / *-*■ [J]b est un isomorphisme d'algèbre. Ceci entraîne que A G Mn(K) est inversible si et seulement s'il existe / G C(E), inversible, tel que [f]s = A. D'où le corollaire suivant : (A G .Mn(K) est inversible) <(=> (3B G Mn(K), AB = In) <^> (3B G Mn(K), BA = In) et B = A~\ 3.4. Changement de base Soit E un K-e.v de dimension finie n G N*, B = (ei,..., en) et B' = (e[,..., e'n) deux bases de E. Pour tout j, 1 < j < n, on peut écrire e'j = Y^i=iPijeï avec les Pi,j € ^- La matrice P = (ptj) i<t<n (dont les colonnes sont les coordonnées des vecteurs de B' dans la l<j<n base B) s'appelle matrice de passage de B à B'. La matrice P est inversible. Si x e E, si X (resp. .X7) désigne le vecteur colonne dont les éléments sont les coordonnées de x dans la base B (resp. dans la base B'), alors onaI = PX'. Remarque 4. Attention à l'erreur courante qui consisterait à écrire X' = PX. PROPOSITION 3. Soient E et F deux K-e.v de dimensions finies respectivement égales à p et q. Soient Bq et B'0 deux bases de E, P la matrice de passage de B0 à B'0, B\ et B[ deux bases de F, Q la matrice de passage de B\ à B[. Soit f G C(E,F). Si A = [/]fj, A' = \f\% onaA' = Q~lAP. DÉFINITION 6. Soient A, B G Mp,q(K). On dit que A et B sont équivalentes s'il existe P G Çtq(K) et Q e Q£P(K) telles que B = QAP. La relation "est équivalente à" est une relation d'équivalence. Remarque 5. On a vu un peu plus haut que les matrices d'une même application / G C(E, F) dans des bases différentes sont équivalentes. Proposition 4. Soit E un K-e.v de dimension finie n G N*, B et B' deux bases de E, P la matrice de passage de B à B'. Soit f G C{E). Si A = [/]# et A' = [/]b', alors A' = P~lAP. Définition 7. Deux matrices A et B G Mn(K) sont dites semblables s'il existe P G Ç£n(K) tel que B = P~lAP. La relation de similitude est une relation d'équivalence. 3.5. Propriétés des transposées Proposition 5. - Si A, B e Mp,q(K), \A + B) = lA + lB. - SiAe Mp,q(K) etXeK, \XA) = \lA. - SiAe Mp[q(K) etBe Mq>r(^)> *(AB) = %B%A. - Soit A G A^n(K)- On a A G É/^n(K) si et seulement si lA G Ç£n(K) et dans ce cas, (tA)-1=t(A~1). Remarque 6. La transposition inverse l'ordre dans les produits de matrices. Cette remarque peut parfois être utile dans les exercices.
122 3. ALGÈBRE LINÉAIRE : GÉNÉRALITÉS 3.6. Rang d'une matrice DÉFINITION 8. Soit A G Mp,q(K). On appelle rang de A le rang de ses vecteurs colonnes dans Kp, et on le note rg A. Si A est la matrice d'une application linéaire /, on a vgA = rg/- Remarque 7. - Si A G Mp>q(K), alors vgA < inî{p,q}. - Si A G MnÇiïQ, alors A est inversible si et seulement si vgA = n. Théorème 1. Soit A G Mpq(K). Si r = vgA > 1, A est équivalente à la matrice Jr \ 0 0 )' Corollaire 1. Deux matrices A et B £ Mp>q(K) sont équivalentes si et seulement si vgA = vgB. DÉFINITION 9. Soit A = (au)i<i<P G Mp>q(K), et soient deux sous-ensembles non vides / C {1,... ,p} et J C {1,..., q}. La matrice B = (o^j) te/ s'appelle matrice extraite de A, A s'appelle une matrice bordante de B. Théorème 2. Soit A G Mp>q(K). Le rang de A est le plus grand des ordres des matrices carrées inversibles extraites de A. Corollaire 2. Le rang de toute matrice est égal au rang de sa transposée. Remarque 8. En d'autres termes, le corollaire précédent dit que le rang des vecteurs colonnes d'une matrice est égal au rang de ses vecteurs ligne. - Dans la pratique, pour trouver le rang d'une matrice, on utilise le résultat suivant : on ne change pas le rang d'une matrice en multipliant une colonne par un scalaire non nul, ou en ajoutant a une colonne une combinaison linéaire des autres colonnes (même chose sur les lignes). Par exemple, en opérant sur les lignes, / 2 13 -3 \ / 2 1 3 -3 \ rg -12 1 4 = rg 0 3 3 3 \ 1 12-1/ \ 1 1 2 —1 / / 2 1 3 -3 \ / 2 1 3 -3 \ = rg 0 1 1 1 ) = rg I 0 1 1 1 =2. \ 2 2 4 -2 / \ 0 1 1 1 / 3.7. Trace d'un endomorphisme Définition 10. Soit A = (o>ij)i<i,j<n £ Mn(K). On appelle trace de A le scalaire tr^4 = Ya=i ai,i- L'application A h-> tr.A est une forme linéaire. Proposition 6. - Si A et B g Mn(K), tv(AB) = tv(BA). -SiAe >W„(K), tiA = tr(*A). - Si A et B G Mn(K) sont semblables, alors tvA = tv B. La dernière assertion de la proposition précédente permet la définition suivante. Définition 11. Soit E un K-e.v de dimension finie, B une base de E et f e C(E). Alors la trace de la matrice [/]b ne dépend pas de la base B choisie. Cette valeur s'appelle la trace de / et est notée tr /. Proposition 7. Soit E un K-e.v de dimension finie, p G C(E) un projecteur. Alors tvp = (rgp)lK (où 1k désigne l'élément unité de K). En particulier, si K = R ouK = C alors tvp = vgp.
3. MATRICES 123 Démonstration. Comme p est un projecteur, Imp © Kerp = jE.Soit r = rgp, (ei,...,er) une base de Imp et (er+i,..., en) une base de Kerp. Alors B = (ei,..., en) est une base de E et la matrice de p dans cette base est [p]# = ( g" J), ^onc trP = (r8P)lK- O 3.8. Exercices Exercice 1 (Matrices diagonalement dominantes). On considère une matrice A = (ai,j)i<i,j<n £ Mn(C) vérifiant Vi, 1 < i < n, \~^ I I l I l<j<n 3±i Montrer que A est inversible. Solution. Il s'agit de montrer que rgA = n, c'est-à-dire que les n vecteurs colonnes de A forment une famille libre. Pour cela, raisonnons par l'absurde en supposant ces n vecteurs liés, ce qui s'écrit n 3Ài,..., An G C tels que Vi G {1,...,n}, 2_)^jai,j = 0> les Àf étant non tous nuls. Soit k tel que |Afc| = sup1<J<n |Aj|. Alors A& ^ 0 et n A IAI yZX3ak,j = 0 donc ofc>fe = - V -pflfc,j) d'où |ofc>fc| < V 7^7^^| < Y^ la*jl» i<i<n A* i<;<n lAfcl i=i i#fc j#fc ce qui est contraire aux hypothèses. Exercice 2. Soit n G N* et soit la matrice /Il 1 • 0 Cl C\ • m= 1 ; ••. c2 • 1 \ Ci n c n \o 0 ci) Montrer que M est inversible et calculer M-1. GM n+l Solution. On note Rn[X] = {Pg R[X] | deg(P) < n}. Soit l'endomorphisme / : Rn[X] -> Rn[X] P(X) »-> P(X + 1). La famille B = (1,X,... ,Xn) est une base de Rn[X], et on voit facilement que M est la matrice de / dans la base B. Or / est inversible, son inverse étant g : P(X) i-> P(X - 1). Donc M est inversible, et ?-i M"1 = [/-1]* = [g)B = ( 1 "I 0 C\ Vo Co2 0 (-l)n \ (-ir1^ (-i)n"2c2 Q / EXERCICE 3. Soient ietBe A4n(K) telles que Ai? = A + B. Montrer que A et B commutent (i. e. montrer que ^45 = BA).
124 3. ALGÈBRE LINÉAIRE : GÉNÉRALITÉS Solution. Comme AB = A + B, on a, In- A- B + AB = In donc (In - A)(In - B) = In. Donc In — A est inversible, son inverse est (In — B), donc (In — B)(In - A) = Jn, ce qui en développant donne BA = B + A = A + B. EXERCICE 4. a) On considère la matrice / 0 rai)2 M = 0 mltn \ Tft"n— l,n o ) eMn Montrer (sans utiliser le théorème de Cayley-Hamilton) que M est nilpotente. 3 10 b) Soit M = \ 0 3 2 ) G A43M- Pour tout entier p > 1, calculer Mp. 0 0 3 Solution, a) Soit (ei,... , en) la base canonique de Mn (ef est le vecteur colonne dont tous les éléments sont nuls sauf le i-ième qui vaut 1). La forme de la matrice M montre que t-i Me\ = 0 et Vi > 2, Mei = J^ m^ek G Vect(ei,..., ei-\). k=l Montrons par récurrence sur p e {1,... ,n} que pour tout i, 1 < i < p, on a Mpei = 0. Pour p = 1 c'est vrai car Mei = 0. Supposons le résultat vrai au rang p — 1, montrons le au rang p. Si 1 < i < p - 1, l'égalité Mv~lei = 0 entraîne Mpef = 0, et si i = p : /p-i \ p-i M% = MV-\Mep) = MP-1 [J2™k,Pek =J2mk,P(MP~lek) = 0. \fc=l / A:=l - En particulier, le résultat est vrai pour p = n ce qui entraîne que Mn s'annule sur tous les vecteurs de la base canonique de Rn, donc est nul. / 0 1 0 b) On écrit M = 3/3 + N où N = l 0 0 2 ). D'après la question précédente, iV3 = 0. \ 0 0 0 Comme 1$ et N commutent, on peut écrire Vp G N*, Mp = f2CpNk(3I3)P~k = 3/3 +p3p_1AT + P^~^3P~2AT2. fc=0 /010\ /002\ f 9 3p p(p-l) Comme iV= 0 0 2 etJV2= 0 0 0, ceci donne Mp = 3P~2 09 6p \000/ \000/ \00 9 Remarque. Au a), une étude plus poussée aurait permis de montrer que la matrice Mp a tout ses coefficients nuls en dehors de la partie triangulaire supérieure des n — p premières lignes et n — p dernières colonnes. Autrement dit, Vp, 1 < p < n - 1, on a Mp = ( \ x x \ (0) X /
3. MATRICES 125 Exercice 5. Quelles sont les matrices A G Mn(K) telles que A2 = 0 ? Solution. Soit / l'endomorphisme de Kn dont A est la matrice dans la base canonique de Kn. On a f2 = 0, donc Im/ C Ker/. Soit r = rg/. Si r = 0, on a / = 0. Sinon r > 1. Soit (ei,... , er) une base de Im /. Comme Im / c Ker /, on peut compléter cette base en une base (ei,..., en_r) de Ker/ (au passage, on remarque que r <n — r donc r < n/2). Pour 1 < i < r, ei G Im/ donc il existe U{ G Kn tel que f(m) = ei. Montrons que B = (ei,..., en_r, ni,..., ur) est une base de Kn. Il suffit de montrer que c'est une famille libre (il y a n éléments). Supposons (Aiei H h An_ren_r) + (f^iui H h /xrer) = 0 où les Xiifij G K. En composant par /, on trouve fiie\ + • • • + fj,rer = 0, donc Vz,^ = 0. Donc Aiei H h An_ren_r = 0, et donc \/i> X{ = 0. B est donc bien une base de Kn. Dans cette base, / a pour matrice Mr = ( n n ) > avec r ^ n/2> et A est donc semblable à M. Réciproquement, si À = 0 ou si A est semblable à Mr avec r < n/2, alors A2 = 0. Les matrices recherchées sont donc celles semblables à Mr avec r < n/2 et la matrice nulle. Exercice 6. Soit M e .Mn(R) une matrice de trace nulle. a) Montrer que M est semblable à une matrice n'ayant que des 0 sur la diagonale principale. b) Montrer qu'il existe X et Y G MnW tels que M = XY - YX. Solution, a) On va montrer ce résultat par récurrence sur n G N*. Pour n = 1 c'est évident car M = tr M = 0. Supposons le résultat vérifié au rang n — 1 et montrons le au rang n. Soit / l'endomorphisme de M71 dont M est la matrice dans la base canonique de M71. Si \fx G Mn, la famille (x, f(x)) est liée, alors / est une homothétie (voir la proposition 3 de la partie 2.3), c'est-à-dire qu'il existe A G R tel que / = AId#. Or nA = tr f = tr M = 0 donc A = 0 et donc / = 0, ce qui entraîne que la matrice M est nulle. Sinon, il existe xGRn tel que la famille (x, f(x)) soit libre. Complétons cette famille en une base B = (x, /(#), 63,..., en) de Rn. Dans cette base, on a N = lf]B = ( 0 1 0 \ : X N' X à \ ) Or 0 = tr/ = triV = trA/7 donc d'après l'hypothèse de récurrence, il existe Q G £^n-i(IR) telle que Q lNrQ n'ait que des zéros sur la diagonale principale. Si P = on a donc /1 0 V° 0-- 0 \ Q J e çtn(R), P~lNP = ( 1 \ 0 0 0 ••• 0 \ / 1 N Q -1 / 0 0-- 0 \ Q I ( ° X • lx X Q- • • • X lN'Q * \ / 0 x x 0 / V x x \ X x 0 / La matrice M, semblable à N, est donc semblable à cette dernière matrice, d'où le résultat.
126 3. ALGÈBRE LINÉAIRE : GÉNÉRALITÉS b) D'après a), il existe P G Ç£n(^) telle que M = P 1NP où N est une matrice n'ayant que des zéros sur la diagonale principale. Notons bij les coefficients de la matrice N. Fixons X = /ai 0 • • • 0 \ 0 û!2 '• : ; •. ••. o V 0 • • • 0 an / G Mn(R), avec ai ^ ctj si i ^ j. Si Y = (a>i,j)i<i,j<n G Mn(R), un calcul rapide montre que XY — YX = {oaaij — ctjaij)i<i,j<n- En prenant pour tout i a^ = 0 et pour tout i ^ j a^j = bij/(ai—aj), on voit que XY—YX = N, donc M = {P-lXP){P~lYP) - {P-lYP){P~lXP). Exercice 7. Soit E un R-e.v de dimension finie n G N*. Soient pi,... ,p* G C{E) des projecteurs. Montrer que p = p\ H Ypk est un projecteur si et seulement si pi opj = 0 pour tout (i,j) tel que i ^ j. Solution. Condition suffisante. Il suffit de remarquer que p2 = p\ + • • • + Pl + Y^Pi o pj = p\ + • • • + p\ = pi + • • • + pk = p. Condition nécessaire. D'après la proposition 7, le rang d'un projecteur égale sa trace, donc k k rgp = trp = ^2tr pi = ^rgPi- On a aussi Imp = (pi + -~+Pk)(E) Cpi(E) + -'-+pk(E) = Impi + ••• + Impfc. Ces deux dernières assertions permettent de conclure que Imp = Impi 0 • • • ©Impfc. (*) Ceci étant, fixons i, 1 < i < k. D'après (*), si x e E, Pi(x) G Imp donc Pi(x) = p(Pi(x)) = pi o pi(x) + • • • + pi o Pi(x) + • • • + pfc o pi(x). Comme pi opi(x) = Pi(x), on en déduit Ylj^iPj °Pi(x) — 0- Or Pour tout j, pj opi(x) G Impj donc d'après (*), l'écriture Ylj^iPj °Pi(x) — 0 entraîne \/j ^ i, pj opi(x) = 0. Ceci est vrai pour tout x e E, donc si j ^ i, Pj o p{ = 0, d'où le résultat. 4. Dualité Dans toute cette partie, E désigne un K-espace vectoriel. 4.1. Généralités Définition 1. On appelle forme linéaire sur E toute application linéaire de E dans K. L'ensemble C(E,K) des formes linéaires sur E est aussi noté E*. C'est un K-e.v appelé espace dual de E. Notation. Si x G E et ip G E*, on note parfois <p(x) = (<£, x). Définition 2. On appelle bidualde E l'espace dual de E*, noté E**.
4. DUALITÉ 127 4.2. Étude du dual en dimension finie Dans cette sous-partie, sauf mention contraire, E est de dimension finie n G N*. DÉFINITION 3. Soit B = (ei,... ,en) une base de E. Pour tout i, 1 < i < n, la forme linéaire e* définie sur B par e*(ej) = 0 si j' ^ i, e*(ei) = 1, s'appelle forme linéaire coordonnée d'indice i. Remarque 1. Si E est de dimension infinie et (e»)i€/ une base de E, on définit de même les formes linéaires coordonnées e* pour i G /. Théorème 1. Soit B = (ei,...,en) une base de E. Alors B* = (ej,...,e*) est une base de E* appelée base duale de B, et donc dimE* = dimE. Pour tout ip G E*, on a Démonstration. La famille B* est libre, car l'égalité \ie\-\ h Ane£ = 0 appliquée aux vecteurs ei,..., en de E donne Ai = • • • = Àn = 0. La famille B* est génératrice. En effet, si <p e E*, alors pour tout x G E, x = \ie\-\ hÀnen, on a n n t=l i=l et ceci étant vrai pour tout x G E, on a (p = Y17=i v(ei) et• D Remarque 2. Si E est de dimension infinie et (e*)^/ une base de E, (e*)iGj est une famille libre de E* mais non génératrice. Bidual en dimension finie. THÉORÈME 2. Si x e E, on note x : E* —» K (p h-> y?(rc). On ax e E** et l'application f : E —> E** x h-> x est un isomorphisme. Démonstration. On vérifie facilement que x est linéaire (i. e. que x G i?**), ainsi que /. Prouvons que / est injective. Soit x G Ker/. Si x ^ 0, on peut compléter x en une base (x,e2,... ,en) de E. On a alors x*(x) = 1, autrement dit x(x*) ^ 0, donc x ^ 0. Donc Ker/ = {0}. D'après le théorème 1, dimi?** = dimE* = dimi?. Ainsi / est bijective, et c'est donc un isomorphisme. □ Remarque 3. - Cet isomorphisme est canonique (i. e. il ne dépend pas du choix d'une base). On convient alors d'identifier E et E** en identifiant x à x pour x £ E. - En dimension infinie, / : x t-> x est injective mais pas surjective. Base antéduale. Proposition 1. Soit (/i,..., fn) une base de E*. Il existe une unique base (ei,..., en) de E telle que pour tout i, e* = fo. Cette base s'appelle base antéduale de (/i,..., fn)- Démonstration. Existence. D'après le théorème 2, pour tout i, il existe e^ G E tel que /* = e*. Donc pour tout j ^ i, /*(//) = 0 = £(£) = fjfa) et /?(/*) = 1 = /ife). En résumé, fi(ej) = 0 si j ^i et /i(ef) = 1. On voit donc que pour tout i, fi = e*. Unicité. Soit (ei,...,en) une base de E telle que pour tout z, e* = fi. Si j ^ i, e*(ej) = fi(ej) = 0 = êj(fi) et pour tout i, e*(ef) = /i(ef) = 0 = ëi(fi). En résumé, on a montré que ëi(fj) = 0 si j 7^ i, = 1 si j = i. Autrement dit, ëi = f*. D'après le théorème 2, il existe un unique vecteur e^ de E vérifiant ëi = f* ; les e* sont donc uniques, d'où le théorème. □ Remarque 4. Nous verrons dans la partie 4.5 (page 130) des moyens de calcul de la base antéduale.
128 3. ALGÈBRE LINÉAIRE : GÉNÉRALITÉS 4.3. Orthogonalité Définition 4. Des éléments x G E et <p G E* sont dit orthogonaux si (p(x) = {<p,x) = 0. - Si A C £, on note A1 = {(p e E* | Vrc G A, <^(rc) = 0}. L'ensemble A-1 est un s.e.v de E* appelé orthogonal de A. - Si B C £7*, on note B° = {x G E | VV G B,tp(x) = 0}. L'ensemble P° est un s.e.v de £ appelé orthogonal de B. Remarque 5. Si </? G £*, alors {ip}° est le noyau de (p. La proposition qui suit se prouve facilement. Proposition 2. - Si Ai c A2c E, alors A% c A{. - Si Bx C B2 C £7*, a/ors ££ C 5?. - Si A CE, alors A± = (Vect A)L. - Si B C E*, alors B° = (VectB)0. Orthogonalité en dimension finie. Théorème 3. Soit E un K-e.v de dimension finie. Alors : (i) Si F est un s.e.v de E, dimF + dimF1 = dim£ et FLo = F. (ii) Si G est un s.e.v de E*, dimG + dim(3° = dim£ et G0± = G. Démonstration, (i) Soit r = dimF et (ei,... , er) une base de F} que nous complétons en une base (ei,..., en) de E. On a F = Vect(ei,..., er) donc d'après la proposition précédente, F1 = {d,...,er}1. Soit (peE*,(p = £"=1 A* e\. Alors (y>€{ei,...,er}-L) <*=> (Vt € {l,...,r}, 0 = y>(e<) = A*). Ainsi, <p G F1 si et seulement si (p G Vect(e*+1,..., e£) d'où la première égalité de (i). Maintenant, toujours d'après la proposition précédente, on a F±0 = {e*+1,..., e£}°. Donc n (x = J2aieieF±°) ^=^ (ViG {r + l,...,n}, 0 = e?(x) = af), t=i ce qui prouve F±0 = Vect(ei,..., er) = F. \ (ii) Soit r = dim(7, (/i,..., fr) une base de G, complétée en une base (/i,..., fn) de £?*. Soit (ei,...,en) une base antéduale de cette dernière, de sorte que Vi, fi = e*. On a G = Vect(eï,..., e*) et en procédant comme plus haut, on trouve G° = Vect(er+i,..., en) et G0± = Vect(eî,...,e*) = G. D Conséquence. En dimension finie, un sous-espace est égal à l'espace tout entier si et seulement si son orthogonal est nul. Remarque 6. L'égalité FLo = F reste vraie en dimension infinie. Par contre l'égalité B = BoL est fausse en dimension infinie. Prenons par exemple E = R[X] et B le s.e.v de E* engendré par les formes linéaires ipn : P i-> P(n)(0) (n G N). Si P G 5°, alors pour tout n G N, P(n\0) = 0 donc d'après la formule de Taylor, P = 0. Autrement dit, B° = {0}, donc Bo1 = {0}1 = E*. On a donc B ^ B0± = E* (par exemple, cp : P h-> P(l) est dans E* et on vérifie facilement que ip $. B). Cependant l'inclusion B C BoL est vraie en dimension infinie. En traduisant le théorème précédent en termes d'équations, on obtient le corollaire suivant. Corollaire 1 (Équations d'un s.e.v en dimension finie). Soit E un K.e.v de dimension finie n. - Soient p formes linéaires (pi,..., (pp de E* telles que rg(</?i,..., ipp) = r. Le s.e.v F = {x G E | Vi, <Pi(x) = 0} est de dimension n — r.
4. DUALITÉ 129 - Réciproquement, si F est un s.e.v de E de dimension q, il existe n — q formes linéaires linéairement indépendantes ipi,... ,<pn-q telles que F = {x G E | Vi, 1 < i < n-q,ifi(x) = 0}. Proposition 3. Soit E un K-e.v de dimension finie et Ai et A2 deux s.e.v de E. Alors (i) (Ax + A2)L = Af Cl Ak (ii) (^n^^^f^. Soient B\ et B2 deux s.e.v de E*. Alors (iii) (B1 + B2)° = B{ n B°2 (iv) (B1nB2)° = BÏ + B°2. La preuve est simple. Pour montrer chaque assertion, on montre une inclusion triviale puis l'égalité des dimensions grâce au théorème 3. Orthogonalité et hyperplans. PROPOSITION 4. Soit (p e E* une forme linéaire non nulle. Alors Kercp est un hyperplan de E. Réciproquement, tout hyperplan de E est le noyau d'une forme linéaire non nulle. Démonstration. Soit (p G E*, <p ^ 0. On sait que E/Kenp est isomorphe à Im<£> = K, donc de dimension 1, ce qui n'est autre que de dire que Kercp est un hyperplan de E. Réciproquement, soit H un hyperplan de E. D'après la proposition 2 page 114, il existe un s.e.v S = Kxo de E de dimension 1 tel que H © S = E. Si maintenant on définit <p G E* par <p(x) = 0 si x G H et <p{\xq) = A sur 5, on voit que Ker <p = H. □ PROPOSITION 5. Soit H un hyperplan de E. L'ensemble HL des formes linéaires sur E qui s'annulent sur H est une droite de E*. Démonstration. D'après la proposition précédente, il existe <po G E* tel que Ker<po = H. Maintenant, soit <p G E* une forme linéaire qui s'annule sur H. Soit xo e E tel que H(BKxo = E. On a V'oC^o) 7^ 0 (sinon <po s'annule sur H et sur K#o donc sur E, ce qui est absurde car Ker<po = H). Posons A = <p{xq)/<pq{xq) et ip = (p — \(fo. Comme <p et <£>o s'annulent sur H, i/j s'annule sur H. Or par construction de A, VK^o) = 0. L'application ip s'annule donc aussi sur Kxo, donc sur E tout entier, et donc (p = \<po G Vect(^o)- Réciproquement, on vérifie facilement que si (p G Vect((po), alors <p s'annule sur H. □ Remarque 7. On peut montrer de manière plus générale que si F est un s.e.v de E de codimension finie, alors F1 est un s.e.v de E* de dimension codim^ F. 4.4. Applications transposées Définition 5. Soient E et F deux K-e.v de dimension quelconque. Soit u G £(E,F). Pour tout / G F*, on a fou G E*. L'application linéaire F* —> E* f »-> fou est appelée application transposée de u et notée tu. PROPOSITION 6. Soient E et F deux K-e.v. Si E et F sont de dimension finie, on a (i) rgw = rg('w) (U) Im('w) = (Kern)"1, et en dimension quelconque (iii) Ker('u) = (Iraw)1. Démonstration, (i) est démontré dans l'étude des problèmes matriciels (voir partie 4.5 page 130). (ii) Soit g G Im('tt). Il existe f e F* tel que g = /ou, donc pour tout x G Keru, g(x) = 0, et donc g G (Kern)1. On vient donc de montrer que Im(tn) C (Kern)1. Or dim(Im*n) = rg'tt = rgn = dimE - dim(Kertt) = dim(Kertt)-1-, d'où (ii). (iii) Il suffit de remarquer que (peKei^u ^=> <pou = 0 4=> TmuCKerip 4=> (p e (Imu)1. n
130 3. ALGÈBRE LINÉAIRE : GÉNÉRALITÉS Proposition 7. Soient E, F, G trois K-e.v, u G C(E, F) etv e C(F, G). Alors '(tiou) = tU O tV. Démonstration. Il suffit d'écrire que si g G G*, go(vou) = (gov)ou = tu(gov) =l uo[tv(g)]. □ Proposition 8. Supposons E de dimension finie. Soit u G C(E). Un s.e.v F de E est stable par u si et seulement si F1 est stable par tu. Démonstration. Condition nécessaire. On a u{F) C F donc pour tout (p G F-1, comme <p(F) = {0} on a (pou(F) = {0}. Autrement dit, si <p G F1 on a tu((p) G FL. Finalement, FL est stable par tu. Condition suffisante. D'après le corollaire 1, il existe r formes linéaires </?i,..., <pr telles que F = fl[=1 Ker<pi. En particulier, pour tout i, F C Ker (fi c'est-à-dire que <pi G F1. Maintenant, comme FL est stable par tu, on a tu((pi) = (fi o u G FL pour tout i, donc <pi o u(F) = <pi[u(F)] = {0}. Autrement dit, pour tout i, u(F) C Ker<£>i et donc u(F) C D[=1Ker^ = F, d'où la condition suffisante. □ Remarque 8. - Ce résultat reste vrai en dimension infinie mais sa démonstration fait appel à l'axiome du choix. - Cette proposition peut être très utile dans certains raisonnements par récurrence en dimension finie n relatifs aux réductions d'endomorphismes. En effet, si x G E* est un vecteur propre de tu, alors Kx est stable par tu et donc (Krc)°, hyperplan de E, est stable par u (appliquer la proposition à F = (Ka;)°). Le tour est joué, on est ramené en dimension n — 1 (on trouve des raisonnements de ce type dans la démonstration du théorème de trigonalisation par exemple). 4.5. Problèmes matriciels Applications transposées. Soient E et F deux K-e.v de dimension finie, soit p = dim E et q = dim F. Soit u G C(E,F), B une base de E et B' une base de F. Soit / G F*, (ai,..., aq) = [/]§, sa matrice dans la base B'. Si g = f o u et (/?i,..., (3P) = [^]|, on a (A, •••,&) = (afi,...,a,)[w]|/ donc en transposant ces matrices, V PP ) \aq) De la définition d'une application transposée, on vérifie facilement que ceci équivaut à dire [*w]f* = *[w]f, où B* et B'* sont les bases duales de B et B'. En d'autres termes, la matrice dans les bases duales de B et B' de lu est la transposée de la matrice de u dans les bases B et B'. On déduit de ce résultat que rg*u = rgw, résultat annoncé dans la proposition 6. Changement de base dans le dual. Soit E un K-e.v de dimension finie n. Soit B = (ei,...,en) une base de E, B* = (ej,...,e*) sa base duale. On se pose le problème suivant : quelle est dans la base B* les coordonnées de la base duale B'* d'une nouvelle base B' = (ei,..., en) de E ? Soit C la matrice de passage de la base B à la base B'. Soit / G E*, (ai,... ,an) sa matrice dans la base B*, (Pi,... ,pn) sa matrice dans la base B'*. Soit x G E, X sa matrice (colonne) dans la base B, Y sa matrice dans la base B'. On a X = CY, et f(x) = (ai,...,an)X = ((3i,...,pn)Y donc (au... ,an)CY = (ft,... ,(3n)Y,
4. DUALITÉ 131 et ceci pour tout F donc (/?i,..., (5n) = (ai,..., an)C. En d'autres termes, A\ ' /«l\ / Ot! \ (Pi : =*C[ : où encore : = fC)"1 : La matrice de passage de B* à 5'* est donc tC~1 où C est la matrice de passage de B à B'. 4.6. Exercices EXERCICE 1. Soit E un K-e.v, ipi,...,(pp e E* et (p : E —» Kp définie par y> = (</?i, • • •, ifp). Montrer que (p est surjective si et seulement si <^i,..., <pp sont linéairement indépendantes. Solution. Condition nécessaire. Supposons \\<p\ H \- \ptpp = 0 (*) avec les A* G K. Comme ip est surjective, si on fixe i, 1 < i < p, il existe a; G .E tel que ^(rc) = 1 et pour tout j ^ i, <Pj(x) = 0. Appliqué à (*), ceci entraîne Xi = 0, et ceci pour tout i, d'où la condition nécessaire. Condition suffisante. Soit (ei,..., ep) la base canonique de Kp, (e^,..., e*) sa base duale. Soit i/j G (Im^)-1. Écrivons V> = Aie^H l-Ape£. Pour tout x G £?, tf)((p(x)) = 0 = Ài^i(rc)H hApy?p(a;), donc Ai^?i H 1- \p<pp = 0, ce qui entraîne Ai = • • • = Xp = 0, donc ip = 0. Autrement dit, on a montré (Im^)1- = {0}, donc Innp = Kp, c'est-à-dire que <p est surjective. EXERCICE 2. Soit £ un R-e.v de dimension 3, (ei, e2, e3) une base de E. Soit /J, /|, /3 G E* définis par /i — 2e! 4- e2 + e3, /2 = —ei "+" 2e3, /3 = e^ 4- 3e2. Montrer que (/f, /2, /g) est une base de E* et calculer la base (/i, /2, /3) (en l'exprimant dans la base (ei, e2, e3)) de E dont elle est la duale. Solution. Les colonnes de la matrice M = sont les coordonnées des /* dans la base (eî,e2,e3). Pour montrer que (/i,/2,/3) est une base de E*, il faut montrer que le rang de la matrice M est égal à 3. Des opérations élémentaires sur les colonnes donnent 2 1 1 -5 -2 0 M 3 0 i / = rg ' \ < 2 1 k 1 -5 -2 0 13 2 0 0 rgM = rg 1 -2 3 =rg 1 -2 0 =3 \ 1 0 0/ \ 1 0 0/ (on vérifie en effet facilement que cette dernière matrice est inversible), (/j*, /2, /3 ) est donc bien une base de E*. On a vu (voir la partie 4.5) que la matrice M de passage de (ei,e2,e3) à (/i,/!,/!) est fC_1, C étant la matrice de passage de (ei, e2, e3) à (/i, /2, /3). Donc M = tC~1, ce qui entraîne C = tM~1 = (*M)_1. On calcule facilement ('M-1) (inverser le système Y = tMX en un système donnant X en fonction de Y). On trouve , / 6-3-2 C = 'M-1 = — -2 1 5 13 V 3 5-1, Les coordonnées de /i,/2,/3 dans la base (ei,e2,e3) sont les vecteurs colonnes de C = tM"1.
132 3. ALGÈBRE LINÉAIRE : GÉNÉRALITÉS Exercice 3 (Formes linéaires de A4n(K)). a) Soit / G A4n(K)* une forme linéaire sur Mn(K). Montrer qu'il existe A G Mn(K) telle que pour tout X G Mn{K), f(X) = tr(AX). b) Déterminer les éléments / G Mn{K)* tels que pour tout X, Y G Mn(K), f{XY) = f(YX). Solution, a) Si -A G Mn(K), on note $a la forme linéaire sur A^n(K) définie par Ja{X) = tr(AX"). Soit <p : Mn(K) —* Mn(K)* ii-> Ja- C'est une application linéaire. Nous allons montrer que <p est bijective, ce qui prouvera le résultat. Soit A = (dij)i<ij<n G Kertp. Alors pour tout (i, ji), tr(AEij) = a,jti = 0 (Eij désignant la matrice de .Mn(K) dont tous les coefficients sont nuls sauf celui d'indice (i,j) qui vaut 1), et donc A = 0. Donc Ker<p = {0}, et tp est donc injective. Comme de plus dim(A^n(K)*) = dim(A/fn(K)), cp est bijective, d'où le résultat. b) Soit / une telle forme linéaire. D'après la question précédente, il existe A = (o,ij)i<i,j<n G Mn(K) telle que / = fA, et on a pour tout X,Y G Mn(K), f(XY) = tr(AXY) = f(YX) = tr(AYX). En particulier, pour tout (i,j, k) avec i ^ k on a tr (AEijEj^) = tr(AEjtkEij) (*). Or EijEjtk = Eitk et Ej^Eij = 0 car k ^ i, donc (*) s'écrit aussi tt{AE^k) = 0, c'est-à-dire &k,i = 0. Ceci étant vrai dès que i ^ k, on en déduit que A est une matrice diagonale. Maintenant pour tout (i,j) on a tr(AEijEjti) = tr(AEjjEij), c'est-à-dire tr(AE^) = tr(AEjj)} donc a^ = djj et ceci pour tout (i,j). Ainsi, A est une matrice scalaire, donc il existe À G K tel que / = Atr. Réciproquement toute forme linéaire de cette forme répond au problème posé. Exercice 4. On note Rn[X] l'espace vectoriel {P G R[X] | deg(P) < n}. Soit %1 P{t) dt tp : Rn[X] ^R P ^ ! y + *2 a) Soient xo, • •., xn n + 1 nombres réels distincts deux à deux. Démontrer qu'il existe Ao, • • •, An G R tels que pour tout P G Kn[X], ip{P) = Y17=o Af-Pfe). Donner une méthode pratique de calcul des A*. b) On suppose n impair. Démontrer qu'il existe n réels xi,..., xn et Ai,..., An G R tels que VP€Rn[X], <p(P) = Y\iP(xi) n -E i=l Solution, a) L'application (p est une forme linéaire sur Kn[X]. Par ailleurs, on a dim(Mn[X]*) = dim(Rn[X]) = n + 1 (une base de Rn[X] est (1, X,..., X71)). Ceci étant, pour tout i, 0 < i < n, on définit la forme linéaire (pi sur Mn[X] par ^(F) = P{xi). Nous allons montrer que les ((pi)o<i<n forment une famille libre. Supposons Yl^o^Wi — 0 (*)• Pour tout k définissons P& = n°^n(^ "~ xù e ^n[-AT]- On a ViCPfc) = 0 si fc 7M, et donc en appliquant la relation (*) à F^, on trouve MfclIiaÉfcO1'*: "~ xi) = 0- Les a;^ étant distincts, ceci entraîne //& = 0, et ceci pour tout k. Les ((pi)o<i<n forment donc une famille libre de n + 1 éléments de Mn[X]*. Comme Mn[X]* est de dimension n + 1, on en déduit que c'est une base de Mn[X]*. En particulier, il existe Ao, - - -, An G M tels que (p = Ya=o ^Wû et donc n n vp g Rn[x), <p(P) = J2 *i<pi(p) = E A^p(^)- 2=0 2=0
4. DUALITÉ 133 Donnons maintenant une méthode pratique de calcul de A&. Comme pour tout i ^ k, Pi(xk) = 0 on trouve en appliquant la relation précédente à P& que AfcPfc(^fc) = y(-Pfc)> donc Afc = = j-£ r. (**) b) H s'agit en fait de choisir les (a^)o<i<n de sorte que le coefficient Ào de P{x$) soit nul. D'après (**), ceci sera vérifié si ,(Po) = JJ 1 Po(t) dt = 0, /F x0 dt = 0, d'où le résultat. (Remarquons que l'on peut choisir + *2 ce qui sera le cas si l'intégrande est une fonction impaire. Pour cela, notons k l'entier tel que n = 2k + 1 et fixons des nombres réels 0 < a\ < ... < a^. Si 1 < i < k, on pose X2i-i = a* et X2i = _ai> et x2k+i = 0, de sorte que 2fc+l k P0(X) = U(X-xi) = Xl[(X2-al). i=l i=l On s'aperçoit que 11—> Po(t) est une application impaire ; il en est donc de même de l'application —2, et donc A„ = J^ ^ xq comme l'on veut pourvu qu'il soit différent des Xi déjà choisis pour 1 < i < n). Remarque. Dans cadre de l'étude des polynômes orthogonaux (voir le sujet d'étude 3 page 104), on montre qu'il existe une identité du type <p(P) = J^Li ^iP(xi) (avec les Xi et Xi bien choisis) valable pour tout polynôme de degré < 2n. EXERCICE 5. Soit E un R-e.v de dimension finie n G N*. 1/ Soit (ei,...,en) une famille de vecteurs de E, (cpi,... ,<pn) une famille de formes linéaires sur E. Soit / : E —► E x h-> 2"=1 (pi(x)ei. On a / G C{E). Montrer que rg/ + n > rg{ei,..., en} + vg{(pi,..., ipn}. Peut-on remplacer n par une constante plus petite ? 2/ a) Soit y?i,..., ipr r formes linéaires sur E indépendantes et ei,..., er r vecteurs de E indépendants. Soit / G C(E) défini par f(x) = Yh=i <Pi{x)ei- Quel est Ie ranê de / ? b) Soit u G £(£), rgw = g > 1 et (ei,... ,eg) une base de Imu. Montrer qu'il existe q formes linéaires y?i,..., (pq telles que pour tout x G E, u(x) = Yli=i &{?)£%• Que dire de la famille (<£>i,..., ipq) ? c) Montrer que tout endomorphisme est la somme de deux automorphismes. Solution. 1/ Soit p = rg{ei,... ,en} et q = rg{y>i,... , y?n}- Soit u G £(E,Rn) définie par u(x) = ((pi(x),... ,<pn(z)) et soit v G C(Rn,E) définie par v(xi,... ,xn) = Y^!i=ixiei> de sorte que f = v ou. D'après le théorème 3 page 128, Keru = {x G E \ Vi,(pi(x) = 0} est de dimension n — q, donc rgu = n — dim(Kerw) = q. On a îmv = Vect{ei,..., en} donc rg v = p. Ceci étant, on a lm(v ou) = i>(Imu). Soit F = Imw n Kerv et S un supplémentaire de F dans Imu de sorte que Imu = F®S. Comme SnKerv = {0}, la restriction de v à S est injective donc v(lmu) = v(F) + v(S) = v(S) est de dimension dim5. On en déduit rg(vou) = dim5. Or F c Kerv donc dimF < dim(Keri;) = n — rgi>, donc rg/ = rg(v ou) = dimS = rg u — dimi*1 > rgu + rgi> — n = p + q — n, d'où le résultat. On ne peut pas remplacer n par une constante plus petite (prendre tous les <pi nuls et (ei,...,en) une base de E). Remarque : On a montré le résultat général suivant : pour tout (w, v), rg(vou) > rgu + vgv — n.
134 3. ALGÈBRE LINÉAIRE : GÉNÉRALITÉS 2/ a) On a x G Ker / <£=>• ]T)i=i Vf(a;)ei = 0> e^ comme les e* sont indépendants, ceci entraîne Ker/ = {x G jE1 | Vi,<pi(x) = 0} = (Vect{y?i,... ,<pr})°- Les ^ étant linéairement indépendants, on a donc dim(Ker /) = n — dim(Vect{</?i,..., ipr}) =n — r, d'où rg / = n — dim(Ker /) = r. b) Pour tout i, 1 < i < q, il existe £i €. E tel que «(e*) = e^. La famille (£f)i<i<g est libre car si Y^i ^i£i = 0> al°rs 0 = u(J2i ^i€i) = "£2i ^iei donc pour tout i, Xi = 0. Soit (eg+i,... ,en) une base de Keru. Si 1 < i < q, £% & Keru, on en déduit que (e\,... , en) est une base de E. On remarque maintenant que n n q Vx = ^XiEi, u{x) = ^2xiu(ei) = ^2e*(x)ei. i=l i=l i=l On obtient donc le résultat en prenant <pi = e* pour 1 < i < q. Il est clair que {<pi,..., ipq) forme une famille libre. c) Soit u G C{E). D'après la question précédente, si (ei,..., eq) est une base de Imu, il existe q formes linéaires indépendantes y>i, • • •, <Pq telles que u = X)î=i fi' ei- Complétons (ei,..., eq) en une base (ei,..., en) de E, et (y>i,..., ipq) en une base (cpi,..., (pn) de E*. On pose - q n .. q n Ul = ~ ^ W ' ei + ]C V* ' ei et U2 = 2 ^ ^* ' 6i ~ ^ ^ ' 6i' i=l i=q+l t=l i=ç+l D'après 2/a), rgui = rg«2 = n. Or u = ni + it2- On peut donc écrire u comme somme de deux automorphismes. 5. Formes multilinéaires, déterminants Dans toute cette partie, E désigne un K-e.v. 5.1. Formes multilinéaires DÉFINITION 1. Soient des K-e.v Eu ..., Ev et F. Une application / : Ei x • • • x Ep -> F (xi,... ,xp) h-> f{xu ...,xp) est dite p-linéaire si en tout point les p applications partielles sont linéaires. Si p = 2, / est dite bilinéaire. L'ensemble de ces applications est noté C(Ei,... ,EP,F). C'est un K-e.v. Si Ei = • • • = Ep = E et F = K, on parle de forme p-linéaire sur E, et l'ensemble des formes p-linéaires sur E est noté CP(E,K). Exemple 1. - L'application E* x E —> K (<^, x) t-> </?(#) = (y?, rc) est une forme bilinéaire. - Si (fi,..., cpp G £*, l'application £"p —» K (xi,..., xp) t-> (^i(rci) • • • ipp{xp) est une forme p-linéaire sur £\ Proposition 1. dim£p(£,K) = (dim£)p. DÉFINITION 2. Soit / G £P(E,K). - f est dite alternée si /(#i,..., xp) = 0 dès que deux vecteurs parmi les Xi sont égaux. - / est dite antisymétrique si l'échange de deux vecteurs dans la suite (xi,...,xp) donne à / des valeurs opposées. Remarque 1. On montre facilement que / est antisymétrique si et seulement si pour tout a G Sp (groupe des permutations de {1,... ,p}) et pour tout (xi,..., xp) G Ep, on a /0Mi)> . •., xa(p)) = e(a)f(xi,..., xp), e(a) étant la signature de a.
5. FORMES MULTILINÉAIRES, DÉTERMINANTS 135 THÉORÈME 1. Soient K un corps commutatif de caractéristique différente de 2, E un %-e.v et f G £P(E, K). Alors f est antisymétrique si et seulement si f est alternée. Proposition 2. Soit E un K-e.v, f G CP(E,K) alternée. Si (#i,... ,xp) est un système lié, alors f(xu ...,xp) = 0. COROLLAIRE 1. Soit f une forme p-linéaire alternée sur E. On ne change pas la valeur de f(x\,..., xp) en ajoutant à un des vecteurs X{ une combinaison linéaire des autres vecteurs. Définition 3 (Antisymétrisation d'une forme p-linéaire). Pour toute forme p-linéaire / G £P(E, K), on note /" : Ep -> K (xi,... ,xp) h-> ^2 e{a)f[xaii),.. .,xa{p)]. aeSp Ainsi construite, fî est une forme p-linéaire alternée. 5.2. Déterminants Dorénavant, E est de dimension finie n G N*. THÉORÈME 2. L'ensemble des formes n-linéaires alternées sur un K-e.v E de dimension n est un K-e.v de dimension 1. De plus, il existe une et une seule forme n-linéaire alternée prenant la valeur 1 sur une base donnée de E. Démonstration. Soit B = (ei,..., en) une base de E. On définit d G Cn(E, K) par d(xi,...,xn) = e\{x\) - • • e* (rcn), de sorte que si pour tout i, Xi = YJj=\ xi,jej> d(x\>..., xn) = x\f\ • • • xn,m et d\x\, ...,xn) = £<r€<s„ e(<r)za(i),i • • • xa^>n. On a en particulier d^{eu ..., e„) = 1, donc S ^ 0. Soit / G Cn(E, K) une forme n-linéaire alternée. La n-linéarité de / entraîne que j\Xi,...1xn)= y j x\j,x ••• xnj,nj\eix,...,ein). Or si ik = ii pour k ^ /, /(e^, ..., e{n) = 0, et on a donc f(xi,...,Xn) = ^ xl,*W"Xn,<r(n)f(e<r(l)>--->e<r(n)) = /(«l» • • • > en)^(^l, • • • , Xn). (*) creSn Donc / G Vect^), et comme S 7^ 0, ceci prouve que l'ensemble des formes n-linéaires alternées sur E est de dimension 1. Si /(ei,..., en) = 1, (*) prouve que / = $> d'où l'existence et l'unicité de la forme n-linéaire alternée valant 1 sur la base B. D DÉFINITION 4. Soit B = (ei,...,en) une base de E. Le théorème précédent affirme qu'il existe une et une seule forme n-linéaire alternée sur E prenant la valeur 1 sur la base B. On l'appelle déterminant dans la base B et on la note det#. Si #i,..., xn G E (xi = 2?=i xi,jej)> Ie déterminant de (jci, ..., xn) dans la base B est detjB(rCi, . . . , Xn) = ^2 £(a)XlMl) ' * * xn,a(n)' aeSn Remarque 2. - En utilisant le théorème 2, on montre facilement que pour toute forme n-linéaire alternée /, on a / \x 1 ) • • • ? xn) — / (^1 ) • • • ) ^nJ Cletg {Xi, . . . , Xn). - (Changement de basé). En particulier, si B et B' sont deux bases de E, alors dets/(a;i,..., xn) = det^/ BdetB(xi, • • •, xn)- On en déduit det#' B • det# B' = 1. Théorème 3. Soient x\,..., xn G E. Les propositions suivantes sont équivalentes, (i) Les vecteurs forment une famille liée.
136 3. ALGÈBRE LINÉAIRE : GÉNÉRALITÉS (ii) Pour toute base B de E, dets(xi,..., xn) = 0. (iii) Il existe une base B de E telle que detJB(rci,..., xn) = 0. Déterminant d'un endomorphisme. DÉFINITION 5. Soit un endomorphisme / G C(E) et B = (ei,... ,en) une base de E. Le scalaire dets(/(ei),..., f(en)) ne dépend pas de la base B choisie. On l'appelle déterminant de / et on le note det /. Proposition 3. (i) Si f,g G C(E), det(/ o g) = det / x àetg. (ii) det Id^ = 1. (iii) Soit / G C(E). Alors (/ G Qi{E) 4=» det/ ^ 0) et on a det(/~1) = (det/)"1. Déterminant d'une matrice carrée. DÉFINITION 6. Soit A = (ûf,j)i<i,j<n € .A/fn(K). On appelle déterminant de >l le déterminant des vecteurs colonnes de A dans la base canonique de Kn, et on le note det A. On a detA= 22 £(a) a<r(l),l ' ' * flcr(n),n = /2 £^ a^0) * ' ' ^.'(n)' Remarque 3. Si ^4 = (atj)i<tj<n £ A^n(K), on note aussi le déterminant de .A en l'écrivant sous la forme Ûl.l • * " al,n &n,l * * * Q,n,n Propriétés. Soit A G Mn{K). Alors : - detA = det(*i4). - det A dépend linéairement des colonnes (resp. des lignes) de A. - Pour tout A G K, det(AA) = An det A. - On a (det A ^ 0 <(=> A G (74 (K)). - Si on effectue une permutation a G <Sn sur les colonnes (ou les lignes) de A, le déterminant de A est multiplié par e{p) (signature de a). - Si A est triangulaire, det A est le produit des éléments diagonaux de A. - On ne change pas la valeur d'un déterminant en ajoutant à une colonne une combinaison linéaire des autres colonnes. Même chose sur les lignes. - Si A est la matrice de / G C(E) dans une base de E, alors det / = det A. - Si A, B G Mn(K)t det(AB) = det A • det B. - Deux matrices semblables ont même déterminant. - (Déterminant par blocs). Si M = Ç\ G .Mn(K) 0 avec A G MP(K) et B e Mn-P(K), alors det M = det A • det B. Mineurs et cofacteurs. Définition 7. Soit A = {a>i,j)\<ij<n G Mn(K). Pour tout (i,j), on appelle mineur de l'élément a+j le déterminant A^- de la matrice obtenue en supprimant la i-ième ligne et la j-ième colonne de la matrice A. Le scalaire Aij = (—l)*+J'Aij s'appelle le cofacteur de Ojj. On appelle mineurs principaux de A les déterminants A* = det(ajj)i<ij<fc pour 1< A; < n.
5. FORMES MULTILINÉAIRES, DÉTERMINANTS 137 Proposition 3 (Développement selon une ligne ou une colonne). Soit une matrice A = (<kj)i<ij<n £ A1n(K); Aij les cofacteurs des éléments de A. Alors : - (Développement par rapport à la j-ième colonne) Y^=iahj^h3 = det A - (Développement par rapport à la i-ième ligne) ]T)?=i ai,j^i,j = det A. DÉFINITION 8. Soit A G A1n(K). La matrice (A,i)i<j,i<n des cofacteurs des éléments de A, est appelée comatrice de A et on la note com(.A) ou encore A. Proposition 4. Soit A e Mn(K). Alors Al = lAA = (detA) ■ In. Exemple 2. La proposition précédente entraîne que si une matrice A est inversible, alors A"1 = (1/ det A) • tA. Ce résultat appliqué aux matrices 2x2 entraîne que si A = ( acbd) G MiÇS£) est inversible, alors son inverse s'obtient par la formule A~l = -^ç. ( j*c ^6). Déterminant de Vandermonde. Beaucoup de déterminants sont classiques (voir les exercices). Nous allons étudier ici l'un des plus classiques appelé déterminant de Vandermonde. Pour n > 2 et pour tous oi,..., an G K, on note y(ai,...,on) = 1 Oi a\ 1 ai a\ 1 an al «r1 ar1 a, n-l n (déterminant de Vandermonde de ). Nous allons montrer que V(oi,..., On) = Yl (aô ~ ai)- l<i<j<n Démonstration. On procède par récurrence sur n. Pour n = 2, c'est évident. Supposons le résultat vrai pour n — 1 et montrons le pour n. Dans V(a\,..., an), on retranche à chaque colonne a\ fois la précédente (en commençant par la dernière colonne). On obtient 1 0 0 1 ai — a\ ai — a\ai 1 an — a\ an — a\an 0 aj_1-aiaj-2 <"* - ai<"2 (22 — Cb\ Q>2~ 0,\(L2 a2 — &1&2 an ~~ al an~ ala °n a n-l n — a\a n-2 n (après développement par rapport à la première ligne). On factorise ensuite chaque ligne par (ai — ai), ce qui donne V(ai,... ,an) = (a2 -ai)--- (an -ai) 1 a2 1 an a n-2 a n-2 n n PJ(af — ai) li=2 V(a2,... ,an) d'où le résultat car d'après l'hypothèse de récurrence, Vr(a2,... ,an) = Yl2<i<j<n(aj ~~ a0- D 5.3. Systèmes linéaires On considère le système de p équations à q inconnues suivant : aM£i + a^2x2 + a2,iXi + a2y2x2 + aPiiXi + aPy2x2 + + 0L\%q Xq = b\ + 0>2,q Xq = b2 i ^p^q Xq — Op (S)
138 3. ALGÈBRE LINÉAIRE : GÉNÉRALITÉS Systèmes de Cramer. Supposons que dans le système (S), p = q = n. Posons A = (o>i,j)i<i,j<n € Mn(K), B la matrice colonne dont les composantes sont les {bi)\<i<n et X la matrice colonne dont les composantes sont les (a^)i<i<n. Le système (S) s'écrit aussi AX = B, et on voit donc que (S) admet une unique solution X pour tout B si et seulement si det^4 ^ 0. Dans ce cas, comme B = X\Ai + \- xnAn (les Ai désignant les vecteurs colonnes de la matrice A), on a, Bq désignant la base canonique de Kn, detBo(,4i,..., ;4i_i, B, Ai+U ..., An) = x{ detBo(A1, ...iAn)=xi det A. On en déduit que les composantes a;» de X sont données par dets0(^4i,..., Ai-i, B, ./4i+i,..., An) Xj. — det A (formules connues sous le nom de formules de Cramer). Cas général. On note A = (a^) \<i<P G Mp>q(K). Soit r = rg A II existe un déterminant A d'ordre r non nul extrait de A (d'après le théorème 2 de la partie 3.6). Ainsi choisi, A s'appelle le déterminant principal du système (S) (il n'est en général pas unique). - Les équations dont les indices sont ceux des lignes de A s'appellent les équations principales. - Les inconnues dont les indices sont ceux des colonnes de A s'appellent les inconnues principales. On peut écrire A = det(oij) te/. On appelle déterminants caractéristiques les déterminants d'ordre r + 1 de la forme avec k 0 J. Les déterminants caractéristiques n'existent que si r < p, et il y en a alors p — r. Avec les notations que nous venons d'introduire, on a le (Oij)<6/ (ak,j)jeJ (bi)izi h Théorème 4 (Rouché - Fontené). Le système (S) admet des solutions si et seulement sip = r ou lesp—r déterminants caractéristiques sont nuls. Le système est alors équivalent au système des équations principales, les inconnues principales étant déterminées par un système de Cramer à l'aide des inconnues non principales. Exemple 3. Soit le système (S) : Ici on a Xi + 2^2 — X$ + X4 X\ — Xz — X4 -xi + x2 + xz 4- 2a;4 A = = 1 = 1 = m m G Un calcul rapide montre que rg A = 2. Nous choisissons le déterminant principal |} 11, issu de la matrice A en considérant ses deux premières lignes et ses deux premières colonnes. Il n'y a ici qu'un seul déterminant caractéristique, qui est 1 2 1 1 0 1 1 1 m = -2(m+l).
5. FORMES MULTILINÉAIRES, DÉTERMINANTS 139 D'après le théorème de Rouché-Fontené, (S) admet des solutions si et seulement si m = —1, et dans ce cas, le système (S) est équivalent au système xi + 2x2 = 1 + x3 - x4 Xi = 1+ Xz + £4 <*=> Xi = 1 + X3 + £4 X2 = —X4 5.4. Exercices Il existe plusieurs déterminants classiques qu'il faut savoir calculer. Les méthodes de calcul sont parfois astucieuses ; faites donc les exercices pour les connaître. EXERCICE 1. Soit n > 2 un entier. Pour tout k, 1 < k <n — l,on considère un polynôme Pk = Xk + dk,iXk~l H h afc)A; G R[X]. Si #i,..., xn G M, calculer le déterminant A = 1 Pi(ai) 1 Pi(*2) 1 Pi(*„) Pn-l(X2) Solution. Après avoir retranché a\^ fois la première colonne à la deuxième, on obtient A = 1 X\ P2{X\) 1 X2 P2(X2) 1 Xn P2(xn) Pn-lM Pn-lM *:n— l\Xn) On retranche ensuite à la troisième colonne a2^2 fois la première et 02,1 fois la deuxième, et on remarque que la troisième colonne n'est plus composée que de xf. On recommence ainsi jusqu'à parvenir à la dernière colonne, et on obtient finalement une expression en fonction du déterminant de Vandermonde A = 1 X\ 1 x2 1 xn n-1 1 n-1 X n-1 n = V(xi,...,xn)= Y[ fa-Xi). l<i<j<n EXERCICE 2. Soient a, 6 G K et rci,..., xn G K. On définit le déterminant d'ordre n An = Cl b * b a x2 ' . • • • • # b a a xn a) Si a 7^ 6, calculer An. (Indication : on pourra considérer le déterminant An(rc) obtenu à partir de An en ajoutant x à chaque terme, et montrer que An(rc) peut se mettre sous la forme Ax + B.) b) On suppose ici que K = R. Calculer An si a = b. c) Si a = b et K est quelconque, calculer An.
140 3. ALGÈBRE LINÉAIRE : GÉNÉRALITÉS Solution. Suivons l'indication et considérons, pour tout x G K, le déterminant x\ + x a + x ••• a + x b + x X2 + x " ■. : An (a;) = : "•. "•. a + x b + x ••• b + x xn + x En retranchant aux n — 1 premières colonnes la dernière, puis en développant par rapport à la dernière colonne, on voit qu'il existe A,BeK tels que pour tout x G K, An(x) = Ax + B. On remarque maintenant que An(—b) est le déterminant d'une matrice triangulaire supérieure dont les coefficients diagonaux sont les X{ — 6, donc An(—b) = (x\ — b) • • • (xn — b) = —Ab + B. On obtient de même An(—a) = (x\ — a) • • • (xn — a) = —Aa + B. De ces deux valeurs, on en déduit A _ B = bYli(xi - a) - alL-fo - &) 6 — a b) On fixe a G M, et on regarde An comme une fonction de b que nous notons /(&). L'expression d'un déterminant d'une matrice en fonction de ses coefficients montre que la fonction b i-> f(b) est continue sur M. Maintenant, on a vu au a) que si b ^ a, alors /(&) = — OU P{X) = [[{Xi - X). i Autrement dit, si Q(x) = xP(a) — aP(x), on a f(b) = —^7 . En faisant tendre b vers a, b — a la continuité de / permet donc d'affirmer que An = f(a) = Q'(a) = P(a) - aP'(a) = J](^ - a) + a I ]£ J]^- - o) j . (*) c) Ici, la méthode utilisée au b) ne marche plus. On va s'en tirer autrement. Dans An, substituons à b l'indéterminée Xy donnant ainsi un déterminant que nous notons D. Le déterminant D a ses coefficients dans le corps K(X), et d'après a) (puisque évidemment X et a sont différents dans K(X)) : ^ XP(a)-aP(X) „ -n-, vx ^rvi D = K-t ^ où P = T\(xi-X)eK[X]. t Posons Q(X) = XP(a) - aP(X) £ K[X\. Comme Q(a) = 0, il existe R £ K[X] tel que Q(X) = (X-a)R{X), de sorte que D = R(X). Par dérivation, on obtient Q'{X) = R(X) + (X-a)R'(X), donc Q'(a) = R(a). Il ne reste plus qu'a substituer à X la constante a, ce qui entraîne An = R(a) = Q'(a) = P(a) — aP'(a), ce qui permet de retrouver l'expression (*). Exercice 3. Soit M G Mn(Z) (i. e. une matrice à coefficients dans Z). Donner une condition nécessaire et suffisante pour que M soit inversible et que M-1 G Mn(%)- Solution. Nous allons montrer que (M est inversible et M-1 G Mn(Z)) si et seulement si (detM = ±l). Condition nécessaire. On a M G Mn(Z) donc det(M) G Z. De même, M-1 G 7Wn(Z) donc det(M_1) = l/det(M) G Z. Ainsi, det(M) est un entier d'inverse entier, d'où det(M) = ±1. Condition suffisante. On a M G Mn(Z) donc les cofacteurs de M sont des entiers, donc la comatrice M de M vérifie M G Mn(Z). Or det(M) = ±1 donc l/det(M) G Z. Donc M est inversible et :
5. FORMES MULTILINÉAIRES, DÉTERMINANTS 141 EXERCICE 4. a) Soient ai,..., an et /?i, ...,/?„ G R. On note M la matrice M = ( (ai+A)"-1 (ai+A)"-1 («2+A)""1 (aa+ft)"-1 ^ K + A)n_1 K + A) n-1 («1 + A)""1 \ (<*2 + A)n_1 eMn Calculer le déterminant de M. b) Soit p G N et un entier n tel que n > p + 1. On note A la matrice A = / 1 7? I 2p sp \np (n + l)p np \ (n + 1)p (2n - l)p J eMn Calculer A = det A. Solution, a) L'astuce est d'écrire M comme le produit de deux matrices. Si m^j désigne l'élément d'indice (i,j) dans la matrice M, on a n-l n m iJ = ^2Cn-lai0j 1 k = ^2PiMk,j (*) A:=0 fc=l où pitk = C^l}^-1 et qkj = pj-~h. En d'autres termes, si P = (Pij)i<i,j<n G Mn(R) et Q = (qij)i<ij<n G A^n(R), la relation (*) s'écrit M = PQ. On a donc detM = detP • detQ. Or le déterminant de P vaut C°_! Cj_,«*i ••• CÎTÎoï n— l^.n— 1 CS-i Ci-iû2 ••• C^lja n—l^.n—1 •w-l n-l CO /ml /n»n—1 n-l°n-l ' ' "un-l Cn-1 Cn-l^n • * donc det P = C*_x ■ ■ ■ C^ll Ui<j(aj ~ <**)• Par ailleurs, 1 oc\ 1 #2 1 an a a a ,n-l ,n-l 2 n-l n detQ = on-l A 1 A» 1 = (-i) n(n-l)/2 1 A 1 A K ,n-l on Hn >n-l (cette dernière égalité s'obtient en effectuant (n — 1) + • • • + 2 + 1 = n{n — l)/2 transpositions sur les lignes), donc detQ = (_i)»(n-i)/2 [^(ft - A)- On a donc <n-l detM = detP • detQ = J] C^ (-l)^"1)/2 J] [(^ - a,)(A - &)]. u=0 i<3 b) Si p + 1 = n, alors d'après la question précédente appliquée à la matrice M avec ai fy = j - 1, on a det A = ( if Ci.,) (-l)-(-»/» I] [0 - if] • \i=0 / i<j Or = i et no - «)=n t<i j=2 _t=i n n—1 =no-i>!=nj J=2 j=l
142 3. ALGÈBRE LINÉAIRE : GÉNÉRALITÉS et (n - 1)! [(n - 1)!]- 'n-l \ n-1 2> donc finalement A = (-l)"^"1)/2 [(n - l)!]n. Si maintenant n > p + 1, nous allons montrer que A = 0. Notons P = Xp G R[X] et pour tout i G {1,..., n}, Pi = P(X + z) = (X + î)p, de sorte que la matrice A s'écrit / Pi(0) Pi(l) ••• Pi(n-l) \ P2(0) P2(l) ••• P2(n-1) ^= • \ Pn(0) Pn(l) ••• Pn(n-l) / Pour tout i, Pi G RP[X] = {Q G R[X] | degQ < p}. Comme RP[X] est un R-e.v de dimension p + 1 ((1,X,...,Xp) en est une base) et que n > p + 1, on en déduit que Pi,..., Pn forme une famille liée. Donc il existe Ai,..., Àn G R, non tous nuls, tels que J27=i ^i^i = 0> e* donc pour tout j, 0 < j < n — 1, XZfLi ^ï-Pitt) = 0- Autrement dit, les vecteurs lignes de la matrice A sont linéairement dépendants, ce qui entraîne A = det A = 0. Exercice 5. Soit n G N*. Lorsque p < n, calculer le déterminant d'ordre p + 1 1 Ci C* ••• Cl AP = 1 Cn+l Cn+1 * ' ' Cn+1 i n1 r*2 np x ^n+p ^n+p ' ' ' ^n+p Solution. En retranchant à chacune des p dernières lignes la précédente (en commençant par dernière), on obtient : 1 C„ C„ la AP = o es cl c° n cl -1 r*0 n\ r*P- n ^ ni ... i^P-1 un+p-l un+p-l ' ' ' ^n+p-1 (on a utilisé la relation C^\ - Cfc+1 = Cf ). Donc Ap = Ap_i = • • • = Ai = 1. = Ap_i Exercice 6. a) Calculer le déterminant d'ordre n à coefficients dans K An = Oi + X\ CL\ ai û2 + #2 a n ai ai t*n ^n ~r "'n b) Calculer le déterminant d'ordre n + 1 à coefficients dans K An = X ûl • Oi ûl a; a2 Û2 a2 «2 ... ... «n Un «n On rc
5. FORMES MULTILINÉAIRES, DÉTERMINANTS 143 Solution, a) Nous allons prouver par récurrence sur n que An = x\ • • • xn + Y^j=\{aj Ylk^j xk)- Le résultat est évidemment vrai pour n = 1. Supposons le vrai au rang n — 1 et montrons le au rang n. En utilisant la linéarité du déterminant par rapport à la dernière colonne, on voit que An = ai + x\ a\ a>2 a n ai a2 an__i + xn—\ + ai + x\ d\ CL2 a n o an_i + xn-i 0 = Di+ D2. Si on retranche, dans le déterminant D\y la dernière colonne aux n — 1 premières, on s'aperçoit que D\ = Par ailleurs, en développant D<i par rapport à la dernière colonne, on obtient D<i = xnAn-i. Finalement, An est égal à D1+D2 = anx\ • • • xn-i+xn n-1 X\ • • • X n-1 + J2 \ai II Xk i=i l<k<n-\ n = xi • • • xn+^ a, Yl xk b) En ajoutant les n premières colonnes à la dernière, on obtient Gn-l 1 : 1 Gn-1 ! n An = X + ^ Oi i=l a; ai ai a; a2 ai a2 a; : an 1 *n puis en retranchant, pour 1 < j < n, à la jf-ième colonne a* fois la dernière, n An = a; + ^ ai i=l a; — ai x 0 x — a2 ; o 0 0 x 1 x : x — an 1 0 1 n n = [x+^2ai] n^-0*)- i=i / t=i Exercice 7 (Déterminant de Cauchy). Soient ai,..., an e K et 61,..., bn e K tels que pour tout (z, j), a* + bj ^ 0. Calculer le déterminant d'ordre n An = ai+61 1 ai+62 1 a>2+bi a,2+b2 cin+bi an+b2 ai+bn 1 a>2+bn a>n+bn Solution. C'est classique. Il y a plusieurs moyens de procéder. Nous donnons ici une solution assez générale. Supposons dans un premier temps les a^ distincts deux à deux et n > 2. L'existence de la décomposition d'une fraction rationnelle en éléments simples permet d'affirmer 3Ài,..., Àn G K, R(X) = (6l - X) ■ • • {bn-i ~ X) = Ai {X + ai)--- (X + an) X + ai + ••• + An X + an
144 3. ALGÈBRE LINÉAIRE : GÉNÉRALITÉS Le calcul des coefficients A& correspondant aux pôles simples (—a^) est classique et donne Vfc, Afc = Si maintenant on note L\, Li An = Ln-i An ,Ln les lignes de An, on a 1 7^0. Ln-i An ai+6i R(h) a>i+bn-i a\+bn R(bn-i) R(bn) Compte tenu des égalités R(bi) = 0 pour 1 < i < n — 1, le développement de ce dernier déterminant par rapport à la dernière ligne donne Il?=l (bi ~ bn) n?=l (ai - an) A -&1a - Sachant que Ai = \/{a\ + 6i), une récurrence sur n donne UiKjiaj ~ ai)Tli<j(bj ~ bi) A„_i An = n<j(fli+*j) (*) Rappelons que nous avions supposé que les ai étaient distincts deux à deux. Si maintenant deux des ai sont égaux alors les deux lignes correspondantes dans An sont égales et donc An = 0. L'égalité (*) est donc vraie dans tous les cas. Remarque. Cette méthode, ainsi que le résultat, sont à retenir. On peut par exemple calculer par cette technique un déterminant de Vandermonde. - Grâce à ce résultat et à la formule A-1 = *Â/(det A), il est facile d'inverser une matrice dont l'élément d'indice (i,j) est 1/(oj + bj) puisque les mineurs d'une telle matrice sont aussi des déterminants de Cauchy. Exercice 8. Soient cei,..., an G K. Calculer le déterminant A = 1 ai 1 a2 a a, jfe-i i fc-i a a k+l i k+l a a, 1 a n a k-l n a: k+l n a Solution. On introduit l'indéterminée X et on considère le déterminant A(X) = 1 ai 1 Oin 1 X a fc-i ai a k+l a n X X X "^ Otn Xn e K[X]. A apparaît comme le mineur de l'élément X1 dans A(X). En développant A(X) par rapport à sa dernière ligne, on s'aperçoit que A est le coefficient de Xk multiplié par (—l)n+fc dans le polynôme A(X). Or A(X) est un déterminant de Vandermonde : n A(X) = V(au...,an,X)= J] (aj - on) J[(X - oh). l<i<j<n i=\
5. FORMES MULTILINÉAIRES, DÉTERMINANTS 145 D'après ce que l'on a dit plus haut, on a donc l'égalité A = (-l)n+k(-l)n-kvn.k> II {*j-ai) = an-k- J] (ctj-Oi), l<i<j<n l<i<j<n où (Jn-k désigne la valeur prise au point (ai,... , an) par le polynôme symétrique élémentaire Y^X\ • •• xn-k e k[Xi,. .. ,xn). Remarque. On peut ainsi connaître les cofacteurs d'une matrice de Vandermonde, donc inverser une matrice de Vandermonde. Exercice 9. Soit E un K-espace-vectoriel, où K est un corps commutatif de caractéristique différente de 2, et soit p G N*. Soit / : Ep —> K une forme p-linéaire. On suppose que /(xi,... ,xp) = 0 dès qu'il existe k G N*, k < p, tel que xk = xk+\. Montrer que la forme p-linéaire / est alternée. Solution. Soit x = (xi,... >xp) G Ep. Soit k G N*, k < p. L'application (p : E2 -» K (u,i>) i-> /(xi,... ,Xfc_i,w,t;,Xfc+2,...,Xp) est une forme bilinéaire, et elle est alternée d'après les hypothèses, donc antisymétrique (en effet, ip(u + v,u + v) = 0 = (p(u,u) + <p(u,v) + ip{v>u) + ¥>(viv) entraîne <p(u,v) = —</?(i>,u) ; c'est un cas particulier du théorème 1 page 135). Pour tout a e Sp (groupe des permutations de {l,...,p}), on note xa = (xa(i),... ,xa^). L'égalité (p(xk,xk+i) = -<p(xk+i,xk) s'écrit aussi f(xa) = —f(x) = e(a)f(x), où a est la transposition (fc, k + 1). Or les transpositions de la forme (fc,fc + 1) engendrent Sp (voir l'exercice 6 page 24), c'est-à-dire que pour tout a G <SP, on peut écrire a = r\ • • • rn où r^ est une transposition de la forme (fc, k + 1), donc /(**) = /(^Ti-rn) = £(ti)/(zt2...t71) = • • • = e(ri) • • -e(rn)/(a:) autrement dit f(xa) = e(a)f(x). Ceci est vrai pour tout a G Sv donc la forme p-linéaire / est antisymétrique, donc alternée d'après le théorème 1 page 135. Exercice 10. Soit E un K-espace vectoriel de dimension n G N*, où K est un corps commutatif de caractéristique différente de 2. Soit / une forme n-linéaire alternée sur E. Pour tout u G C(E), on définit : n ju: ej > 1& (#i,..., xn) h-> y ^ /(#i> • • • ? 2^-i> w(aîîj, ^î+ij • • • 5 %n)> i=\ Montrer que fu = tr(îz)/. Solution. Fixons u G £(£?). L'application /u est une forme n-linéaire alternée comme on le vérifie facilement ; l'ensemble F des formes n-linéaires alternées de E étant un K-espace vectoriel de dimension 1, on a donc : (V/6F,/^0,3!A/6K), fu = Xrf. Soit g ^ 0 une autre forme n-linéaire alternée. Il existe fi G K* tel que / = fig. Donc \ff = fu = ^9u = {n^g)9i et comme / = fig, on tire À/ = Àp. Le scalaire À/ ne dépend donc pas de / G F, mais seulement de u. On peut donc écrire : 3AneK, V/6F, /„ = *„/. (*) Montrons maintenant que Àu = tr(u). Soit J3 = (ei,... ,en) une base de E, A = (aij)i<i<j<n la matrice de u dans cette base. En appliquant (*) à l'application det (déterminant dans la
146 3. ALGÈBRE LINÉAIRE : GÉNÉRALITÉS base J3), qui est bien une forme n-linéaire alternée, on obtient detn = Àudet, donc An \u det(ei,..., en) = detu(ei,..., en), donc n Au = y^det(ei,...)ei-i,n(ej),ej+i)...)en) f=i n n = 53 det(ei,..., ej_i, J^ %,* «j » Ct+i, • • •, O n / n \ n = 53 I S aJ«* detfl(el> • • • ' ei-l> eJ> e*+l> • • • » en) ) =53 °»>* = trW" t=l \j=l I *=1 Exercice 11. a) Soit A G .Mn(]R). On note A sa comatrice. Donner le rang de A en fonction du rang de A. b) Si n > 3, résoudre dans Mn{R) l'équation A = A. Solution, a) Si rgA = n, l'égalité *AA = (detA)Jn entraîne A = (det A)*A-1, donc comme detA ^ 0, rgA = n. Si rgA = n — 1, alors il existe un mineur d'un élément de A non nul (d'après le théorème 2 page 122), donc A ^ 0. De plus, on a lAA = (det A)Jn = 0 donc Imic Ker'A, donc dim(Ker'A) > n — 1 et donc rg'A = vgA = n — dim(Ker'A) < 1. Comme on a vu que ^4^0, ceci entraîne rgA = 1. Si rg A < n — 2, alors tous les cofacteurs de A sont nuls, donc rgA = 0. b) L'égalité A —A entraîne l'égalité rgA = vgA. Si rgA < n — 2, alors d'après a), rgA = 0, donc rgA = 0, donc A = 0. Si rgA = n — 1, alors rg A = 1, et donc n — 1 = rgA = vgA = 1 donc n = 2, contraire aux hypothèses. Si vgA = n, alors (detA)/n = lAA = lAA. Or det('AA) = det (*A) det (A) = (detA)2 et det[(detA)/n] = (detA)n. Comme detA ^ 0, on en déduit (detA)n~2 = 1, et donc detA G {—1,1} car detA G R. Si A = (a^j), le terme d'indice (1,1) de lAA est YLjaij ^ 0> et comme tAA = (detA)In, ce terme vaut detA. Donc detA > 0, et donc detA = 1. Finalement, on a montré que detA = 1 et tAA = In. Réciproquement, si tAA = In et detA = 1, comme lAA = (detA)In = In, on a A = A car A est inversible. L'ensemble des matrices A vérifiant A = A est donc la matrice nulle et les matrices A telles que detA = 1 et lAA = In (ces dernières sont l'ensemble des matrices orthogonales de déterminant 1, 0+, i. e. le groupe spécial orthogonal). Exercice 12 (Déterminant circulant). Soit n G N* et u = e2in/n. On considère la matrice Q = (a/'-W-^i^xn G Mn(C). a) Soient Oi,..., an G C et / oi a2 û3 • • • an \ I an CL\ 0,2 ' ' ' Q>n-1 I A = an-\ 0>n 0,1 '" 0>n-2 £ Mn(C). \ a2 «3 «4 •" ûi /
5. FORMES MULTILINÉAIRES, DÉTERMINANTS 147 Calculer det(AQ) et en déduire la valeur de det A. b) (Application). Si 0 G R, calculer le déterminant n x n A(0) = cos 0 cos 20 cos nO cos 0 cos 20 cos 30 cos nO cos(n — 1)0 COS0 Solution, a) Un peu d'attention montre que le coefficient d'indice (i,j) du produit AQ, est ^(i-iXj'-iîp^-i) où P désigne le polynôme P = ai + a2X + • • • + anXn~l. Autrement dit, AQ = ( PO) P{") P(l) uP(u) P{ujn~l) \ un-lP{un-1) \P{\) 0Jn~lP{uj) ••• ^n-l^n~l)p{un~l) j On en déduit det(Aft) = P(l)P(w) • • • P{un~l) 1 1 1 w u 1 n-l 1 a/ n-l w(n-l)(n-l) = P(l)P(w)---P(a;n-1)deta (*) Comme detfi ^ 0 (c'est un Vandermonde dont les paramètres sont deux à deux distincts), on en déduit det A = P(l)P(u>) • • • P{un-1). b) On pose Un = {e2lk7r/n \ k G Z}. Le résultat de la question précédente entraîne A(0) = fj (cos 0 + v cos 20 + • • • + a/1"1 cos n0) weUn Supposons dans un premier temps 0 $ ^Z. Si a; G C/n, on pose S(u) = cos6 + u cos20 + --- +un"1 cosn9 et T(a;) = sin0 + u; sin 20 + • • • + un~l sinn0 On a 1 _ pinO ta 1 6 1 '\ 1 — ^my 5(w) + tT(w) = - Y^(ue*)k = e i_ a et 5(w) ~ *T(W) = e 1 _ f,-in9 -iO l e 1 - we-iô ' ç. . /n0\ sin(^0)-o;sin(f) S lu) = 2 sin — • 7- .,,w, ^-. En effectuant la demi-sommes des deux expressions précédentes, on en déduit, après calculs, que (**) \ * / l1 — u/tr"^! — u;e -; Avec la formule (*), on en déduit ii v 2 ; iw (i - <*••) il», (i - <*-••) Lorsque a G C*, le polynôme Xn — an a n racines simples qui sont les ua avec u e Un, donc Xn — an = ria;Gî/n (^ ~~ ua)m ^n utilisant cette identité pour a = sin ^ puis a = ete et a = e~~te, on en déduit /n„N sin" (« - sin" (f ) AW = 2"si„"(f)-7A-^-—^ et comme (1 - enie)(l - e~nie) = 4sin2 (^) on a finalement A(0) = 2*-2sinn-2(^ sin n n + 2 n& n 0 - sinn . n 2 12
148 3. ALGÈBRE LINÉAIRE : GÉNÉRALITÉS Nous avons démontré cette relation pour 6 £ ^Z. Le déterminant étant une fonction continue de ses coefficients (c'est un polynôme en ses coefficients), la fonction 0 h-> A(0) est continue, et par continuité on en déduit que la relation trouvée est valable pour tout 9 G M.. Remarque. Une autre démonstration de a) fait l'objet de l'exercice 4 page 180. Exercice 13. Soient a, b e K avec a ^ b. On pose ( a + b ab 0 ••• 0 \ 1 a + b ab ' •. : 0 1 a + b ••. 0 : '*• '•• *•• ab 1 a + b ) An — \ 0 0 G M»(K). Calculer det^4n. Solution. Supposons n > 3. En développant par rapport à la première ligne on obtient 1 ab 0 ••• 0 0 a + b ab • • : 0 1 a + b '•■ 0 : 0 '•• '•• ab 0 ••• '•• 1 a + b det An = (a + b) det An-i — ab puis en développant le dernier déterminant de cette égalité par rapport à la première colonne, det An = (a + b) det An-\ — ab det An-2- Sachant que det A\ = a + b = — et det A2 = a1 + ab + bl = r-, a — b a — b on démontre facilement par récurrence sur n que det An = an+l _ bn+l a — b Remarque. Si a = 6, une récurrence donne det An = (n + l)an. - À partir du résultat de cet exercice, on peut facilement calculer les déterminants de la forme P 7 (0) a '•• '•• '•• *•• 7 (0) a (3 6. Problèmes Problème 1. Résoudre dans Mn{R) l'équation A2 = -In. Solution. Comme A2 = —7n, on a det(>l2) = (det A)2 = (—l)n donc n est pair. Soit p e N* tel que n = 2p. Soit / l'endomorphisme de Rn dont A est la matrice dans la base canonique de Mn. On va démontrer, en procédant par récurrence sur k, le résultat suivant : pour tout k, 1 < k < p, il existe x\>...,Xk G E = Rn tels que (x\,/(rci),... ,Xk, f(xk)) forme une famille libre.
6. PROBLÈMES 149 Montrons ce résultat pour k = 1. Soit x\ € E, x\ ^ 0. Si Xx\ + f^f(x\) = 0, alors par composition par /, on tire Xf{x\) — fixi = 0. Finalement, on en déduit : (A2 + fj?)xi = X [Xxi + nf{xij\ - fi [Xf(xi) - fixi] = 0. Donc À2 + fj? = 0, c'est-à-dire À = fi = 0. La famille (#i, f(xi)) est donc libre. Supposons maintenant le résultat vrai au rang k — 1 et montrons le au rang k < p. D'après l'hypothèse de récurrence, il existe #i,..., x^-i G E tels que (#i, /(xi),..., a^-i, f(xk-i)) forme une famille libre. Soit Ffc_i = Vect{xi, /(#i),... ,£fc-i, /(x^-i)}. On a dimjFfc_i = 2fc — 2 < 2p, donc on peut choisir Xk € E, Xf~ & i^-i- Supposons maintenant une égalité du type : Aixi + fJLif(xi) + • • • + Afea;fc + fJ>kf(xk) = 0. Alors XkXk + [ikf(xk) £ Ffc_i et Ffc_i étant stable par /, / [Xkxk + faf(xk)] = >^kf(xk) - faxk G Ffc-i. Donc : (A| + ^)xfc = Xk [Xkxk + faf{xk)] - fa [A*/(a;*) - /^a;*] e iV-i- Or xfc £ Ffc_i, donc X\+n2k = 0, d'où Xk = fa = 0. On a donc XiXi+fJLif(xi)-{ t-Xk-ixk-i+fa-if(xk-i) = 0, donc d'après l'hypothèse de récurrence, Vz, X{ = fii = 0. Le cas particulier k = p, entraîne l'existence de 1 ) • • • ) 2? G i? tels que la famille B = (xi, /(#i),..., a;p, f(xp)) soit libre. Comme n = 2p) B est une base de £?. La matrice A est donc semblable à [/]* = / ' 0 -1 ' 1 0 (0) \ ^ (0) ' 0 -1 ' 1 0 / et réciproquement, si A est semblable à une matrice de cette forme, A2 = —In. Problème 2 (Endomorphismes nilpotents en dimension finie). Soit E un K-e.v de dimension finie n G N*. Soit / G C(E), nilpotente, (t. e. il existe p G N* tel que fp = 0). On note g G N* Vindice de nilpotence de /, défini par q = inf{p G N* | fp = 0}. 1/ On veut montrer que q <n. a) (Première méthode). Montrer que la suite (Im /p)pgn décroît strictement jusqu'à p = q puis devient stationnaire. Conclure. b) (Deuxième méthode). Montrer qu'il existe x0 G E tel que (xo,f(xo),... ,/9-1(#o)) forme une famille libre. Conclure. 2/ Si r = dim(Ker /), montrer que r ^ 0 et que n/r < q < n + 1 — r. Solution. 1/ a) Pour tout p, comme f(E) C E, on a fp+1(E) = fp[f(E)\ C /p(£). La suite (Im fp)pem est donc décroissante. - Soit s le plus petit entier naturel tel que Im/S+1 = Im/S (s existe car Im/9+1 = lmfq = {0}). Alors pour tout p> s, Im/P+1 = fp-s[fs+1(E)} = fp~s[fs(E)] = lmfp. La suite (Im/p)pGN est donc stationnaire à partir du rang s. Or (Im/p)p€N est stationnaire à {0} à partir de p = q, donc on a forcément q = s. Pour tout p < ç, on a donc Im/P+1 C lmfp et Im/P+1 ^ Im/**, d'où rg/p+1 <vgfp- 1. On en déduit facilement par récurrence sur p que si p < q, rg /p < rg f° — p = n — p (rappelons que /° = Id£ par convention). En particulier, 0 = rg fq < n — q, donc q < n. b) Comme fq~l ^ 0, il existe xq e E tel que fq~1(xo) ^ 0. Nous allons montrer que la famille (#0, f(xo),..., /9_1 (œo)) est libre. Si Yn=o ^iP(xo) = 0 avec les A^ non tous nuls, on considère le plus petit entier k tel que À^ ^ 0. On a YliZk ^iP(xo) — 0> donc en composant par p~x~k à
150 3. ALGÈBRE LINÉAIRE : GÉNÉRALITÉS gauche, \kfq-\xo) + \k+ifq(xo) + • • • + Xç-if^-Hxo) = 0. Comme fp = 0 pour p> q, cette dernière égalité entraîne Ajfc/9_1(a;o) = 0, et comme fq~1(xo) ^ 0, Afc = 0, ce qui est absurde. La famille considérée est donc libre. Elle a q éléments, donc q < dimE = n. 2/ On a vu au 1/a) que si p < q, rg fp+1 < rg fp—1, ce qui entraîne que 0 = rg fq < rg f—(q—l) = n — r — (q — 1), donc q < n — r + 1. Il reste à montrer l'inégalité n/r < q. Pour cela, commençons par montrer que Vp G N, rg fp+1 = rg fp - dim(Im fp n Ker /). (*) - Soit S un s.e.v de E tel que (lmfp n Ker/) 0 S = lmfp. On a S n Ker/ C (Im/P n Ker/)nS' = {0}, donc 5flKer/ = {0}. Ceci entraîne que f\s (restriction de / à S) est injective, et donc dim/(5) = dim5. Or Im/P+1 = f(lmfp) = f[(lmfp n Ker/) 0 S] = f(S), donc rg /P+1 = dim f(S) = dim S = rg fp - dim(Im fp n Ker /). L'égalité (*) entraîne que pour tout p, rg/p+1 > rg/p — r. Ceci entraîne 0 = rg/9 > rg f° — qr = n — qr, donc q > n/r. Remarque. En particulier, si / est nilpotente et si dim Ker/ = 1, alors l'indice de nilpo- tence de / est q = n. - Il est important de retenir le résultat suivant (utilisé dans 1/a), et non spécifique aux endomorphismes nilpotents) : Si / G C(E), la suite (Im/p)p€N décroît strictement puis devient stationnaire. On montrerait de même que la suite (Ker /p)pgn croît strictement puis devient stationnaire (à partir du même rang que (Imfp)p€^). PROBLÈME 3. 1/ a) Soit N G A^n(^) une matrice nilpotente (i. e. il existe p G N* tel que Np = 0) d'indice q (i. e. q est le plus petit entier naturel vérifiant Nq = 0). Montrer que In — N est inversible et donner son inverse. b) (Application). Montrer l'inversibilité et calculer l'inverse de la matrice M = ( 1 -a 0 '•• ^\ 0 1 '-. 0 : '*. —o \o -■ o i y eMn 2/ a) Soit TV G Mn(R) une matrice nilpotente d'indice 2. Pour tout p G N*, calculer (In + N)p. b) (Application). Soit M = ( _J * j G M2(K). Calculer M100. Solution. 1/ a) Il suffit de remarquer que (In- N)(In + N H h iV9-1) = In-Nq = In, donc In-Ne Ç£n{R) et (In - AT)"1 = /n + iV + • • • + TV*"1. b) On peut écrire M = In — aN avec N = I n n~ 1. Une récurrence facile donne VpeN*, l<p<n-l, Wp=(q /n0"p ) etAT = 0.
6. PROBLÈMES 151 En appliquant 1/a), on voit donc que M = In — aN est inversible et que /la a2 ••• an~l \ 0 1 a *-. : r-l .2Ar2 M~l = In + aN + azNl + • • • + an~lNn-1 = n—1 a m— 1 \o *•• a 0 1 / 2/ a) Les matrices In et AT commutant, on peut écrire (/n + ivf = £ c$Nkiz-k = J2 ckNk = c% + qjw = in+P;v. fc=0 fc=0 b) Si iV = I _ 1, on a M = 21<l + N et AT2 = 0, donc d'après la question précédente, Mioo = 2ioo (h + 1 ^A 10° = 2ioo(/2 + mN) = 2ioo ^ -49 50 \ Remarque. Au 1/a), on a forcément q <n. On peut montrer ce résultat sans faire appel au théorème de Cayley-Hamilton, en procédant comme suit. Soit / l'endomorphisme de Rn dont N est la matrice dans la base canonique B de Rn. Pour tout entier r, l'égalité [/r]s = Nr entraîne que les ordres de nilpotence de / et de N sont égaux. Or d'après le problème précédent, l'ordre r de nilpotence de / est < n, et donc q <n. - En fait, on identifie souvent une matrice M G Mn(K) et l'endomorphisme / de Kn dont M est la matrice dans la base canonique de Kn. Si les vecteurs de Kn sont notés en matrices colonnes, on a même f(X) = MX. Problème 4. Soit E un ensemble et /i, /2,..., /„ n fonctions de E dans K, formant un système libre dans le K-espace vectoriel des fonctions de E dans K. Démontrer qu'il existe n points Xi,..., xn de E tels que la matrice (fi(xj))1<ij<n soit inversible : a) En procédant par récurrence sur n G N*. b) En considérant F = Vect(/i,..., fn) et si x G E en notant x : F —» K / t-> /(#), en montrant que 3#i,..., xn G £" tels que 5i,..., xn forment une base de F*, dual de F. Solution, a) Pour n = 1, c'est évident. Supposons le résultat vrai au rang n — 1 et montrons le au rang n. On définit la fonction AiE^K x f2(xi) fn(xi) fl(Xn-l) fl(x) f2(xn-l) Î2{x) fn{xn-l) fn(x) xi,... ,xn-\ étant pris tels que det(/j(xj))i<jj<n_i ^ 0. En notant, pour tout i, Ai le mineur de l'élément fi(x) de A, on a, en développant A(x) par rapport à la dernière colonne : n Vrc G E, A(x) = ^(-ir+% • fi(x). i=l Or An 7^ 0, et comme les (fi) forment une famille libre, on ne peut avoir Yn=i ^ifi(x) — 0 Pour tout x, donc 3xn G E, A(xn) ^ 0, de sorte que (fi(xj))i<ij<n est inversible.
152 3. ALGÈBRE LINÉAIRE : GÉNÉRALITÉS b) Pour tout x G E, l'application x : F —> K / h-> f(x) est un élément de F*. Soit V = {x | x G E}. L'orthogonal de Y dans F est : r° = {/ € F | Vx G £,£(/) = 0} = {/ G F | Va; G £,/(*) = 0} = {0}. Soit G = Vect(r). On a G° = T° = {0} donc dimG = dimF - dimG° = dimF = n, et comme G C F* on en déduit G = F* = Vect(r). Donc il existe xi,..., xn G E tels que (aTT,...,x^) soit /«ï(/i)\ une base de F*. Les vecteurs I : J pour 1 < j < n sont donc linéairement indépendants, ce qui revient à dire que la matrice A = [#j(/i)]i<jj<n = Problème 5 (Identité de Jacobi, identité de Sylvester). 1/ (Identité de Jacobi) a) Soit A G Q£n(K). On note T = A-1 et on considère l'écriture par blocs A=[ n „ ] et T= [ „ avec B,WeMr(K), où r vérifie 1 < r < n. Montrer que (det >l)(det W) = det E. b) Soient I et J deux sous-ensembles de {1,... , n} de même cardinal r et A = (a^j) G Mn(K). On note .A^j = (ctij)ieijeJ la matrice de A1r(K) obtenue à partir de A en ne conservant que les lignes d'indice i G I et les colonnes d'indice j G J. Si A G GZn{C) et T = A-1, montrer que (det A)(det TJfj) = (-l)5(/'J)(det A/.,,.), avec 5(7, J) = £t 4- ^> où 7* et J* sont les complémentaires de I et J dans {1,... ,n}. 2/ (Identité de Sylvester.) Soit A = (a^-) G Mn(K) et A = (Aitj) sa comatrice. Soient I et J deux sous-ensembles de {1,... , n} de r éléments, avec 1 < r < n. Montrer r/|J = (-l)^J).A/|J-(detAr-1 où TIyJ = det (A) f|j = det(Aij)ieIJej et où AJfj = det A/*,j* = det(a^)^Wj. Solution, a) En écrivant par blocs l'égalité AT = In puis en considérant les blocs à gauche on obtient BW + CY = Ir et DW + EY = 0. On en déduit / B C \ / W 0 \_(BW + CY C\_(lr C\ \D E ) \ Y In-r ) ~ \ DW + EY £J"\0 E ) et en prenant le déterminant on a donc (det A) (det W) = det£". b) L'idée est de se ramener au cas précédent (qui correspond au cas où / = J = {1,... ,r}) par permutation des indices. Considérons l'endomorphisme / de Kn dont A est la matrice dans la base canonique B = (ei,..., en) de Kn. Notons i\ < ... < ir les éléments de / et k\ < ... < kn-r ceux de /*, j\ < ... < jr les éléments de J et i\ < ... < £n-r ceux de J*. Considérons les bases 5/ = (eily...yeiryekl,...,ekn_r) et Bj = (eJn ... ,eJr,e^,... ,e£n_r). La matrice de / dans les bases S/ et Bj s'écrit sous la forme par blocs [f]BJ = {% #), où E = Ai*j*. De même on peut écrire [Z""1]^ = (y" §)> avec W = Tjj. La matrice [f]%J est inversible, d'inverse [Z""1]^. On peut donc appliquer le résultat de la question précédente, qui donne (det[f]BJ) (det W) = detE. Si Pi (resp. Pj) désigne la matrice de passage de la base S à la base Bi (resp. jBj), on a [/11; = PjlAPi, et donc (detP71)(detA)(detP/)(detrJi/) = det A/.fj.. (*) Il reste à calculer det Pi et det Pj. La matrice Pi est obtenue à partir de In en effectuant sur les colonnes la permutation a définie par a(is) = s pour l < s < r et a(k$) = r + s pour
6. PROBLÈMES 153 1 < s < n — r. On a donc det P/ = e(a) det In = e(cr), où e(a) est la signature de a. En notant C(i>j) le cycle (i,i + l,...,jf), un peu d'attention montre que a = C(r> ir) • • • C(2,Z2)C(l,ii). On a donc r r det PI = e(a) = ]Je(C(s,is)) = l[(-l)ia-s. s=l s=l De même on trouve det Pj = ni=i(—1)^ s- Avec (*) on en déduit finalement (det A) (det TJyI) = (det P,) (det P/)-1 (det A/V*) r = l[(-l)ia+ja-2s det Aj.,j* = (-l)^1^ det AI%J*. s=l c) Remarquons que le cas r = 1 est une conséquence immédiate de la définition des cofacteurs de A. Supposons donc 2 < r < n — 1. Lorsque det .A = 0, la comatrice de A est de rang 0 ou 1 (voir l'exercice 11 page 146), donc comme r > 2, on a Titj = 0, donc l'identité souhaitée est bien vérifiée. Supposons maintenant det A ^ 0. L'égalité A = (det A^T avec T = A~l montre que {A)iyj = (det A)Tjti, donc Tjtj = (det A)r det Tjj. On conclue aisément car d'après le résultat de la question 1/b), on a (det A) detTjj = (-l)5(/)J)A/)j. Problème 6. a) Soit M e Mn(C). Montrer l'équivalence (M t Qin(C)) «=> ((3P G ^4(C)), VA G C, P - XM G Qin(C)). b) Soit ip G C(Mn(C)) telle que VM G ^4(C), (^(M) G Q£n(€). Montrer que si ^(M) G </4(C), alors M G Ç£n(C). Solution, a) Condition nécessaire. Supposons M non inversible. Si r = rg M, on sait que M est équivalente à la matrice Kr = ( ^ q ), autrement dit il existe A, B G ^^n(C) tels que M = AKrB. /0 ••• 0 1 \ Posons J = 0 V (0) 10/ G £4(C). Pour tout A G C on a J - \Kr = ( "A 1 0 0 0 1 \ 0 -A 0 1 0 V o r lignes (*) 0 10/ Le rang d'une matrice reste inchangé lorsque l'on ajoute à une ligne une combinaison linéaire des autres. En ajoutant à la r-ième ligne dans (*) A fois la suivante, on fait disparaître le —A se trouvant à la position (r,r). En itérant ainsi le procédé aux lignes d'indice r — 1,..., 1, on fait disparaître tous les —A, de sorte que rg(J — \Kr) = rg J = n. Ainsi, J — \Kr G ^n(C), donc A(J - \Kr)B = P - XM (avec P = AJB G G£n(C)) est inversible pour tout A G C, d'où la condition nécessaire. Condition suffisante. Raisonnons par l'absurde et supposons M inversible. Si Q = M~1P, on a VA G C, det(P - XM) = (det M)(det(Q - A/n)) ^ 0
154 3. ALGÈBRE LINÉAIRE : GÉNÉRALITÉS donc det(Q—A/n) ^ 0 pour tout A G C. Ceci est impossible puisque det(<5 —A/n) est un polynôme de degré n en A (c'est le polynôme caractéristique de Q) donc s'annule au moins une fois sur C. D'où la condition suffisante. b) Raisonnons par l'absurde en supposant M G' G^ni^)- D'après la question précédente, il existe P G ^n(C) telle que pour tout A G C, P - XM G G^n(Q- En vertu de l'hypothèse faite sur <p et de la linéarité de </?, ceci entraîne VA G C, <p(P) - \<p(M) G Ç£n(C)t donc d'après la question précédente, <p(M) $■ Gtn(C), ce qui est contradictoire. Finalement, on aM€04(C). Problème 7. Soit A = (<iij)i<ij<n € Mn(R)- 1/ Soit ip : N* —► R une fonction. Si pour tout (i, j), ai,j = J2 ^)' k\i et k\j montrer que det A = ^(1)^(2) • • -^(n). 2/ (Applications). Calculer det.4 si a) dij est le nombre de diviseurs communs à i et à j. b) aiyj est la somme des diviseurs communs à i et à j. c) dij = iAj =pgcd(ij). Solution. 1/ On définit la matrice B = (&i,j)i<i,j<n par bij = 1 si i \ j, bij = 0 si i \ j. Elle est triangulaire supérieure et n'a que des 1 sur la diagonale principale, donc deti? = 1. On définit aussi la matrice C = (<Hj)\<ij<n comme étant une matrice diagonale avec c^ = ijj(i). On pose maintenant D = lBCB = (dij)i<ij<n. Pour tout (z, j), on a di,j = Ylbk>iCWbtJ = Ylbk^k}bkJ = S ^(fc) = aiJ' k,l k k\i et k\j Donc D = A = lBCB, et donc det A = det(*5) • detC • det£ = detC. Le déterminant de la matrice diagonale C est le produit de ses coefficients diagonaux, donc finalement det .4 = tf(l)---lKn). 2/ a) Il suffit d'appliquer 1/ avec tjj(k) = 1. On en tire det .4 = 1. b) On applique cette fois ci 1/ avec tjj(k) = ky et on en tire det .4 = n!. c) Remarquons d'abord que l'on a l'équivalence (k\ietk\ j) <=> (k | pgcd(z, j)). Rappelons que <£>, l'indicateur d'Euler, possède la propriété suivante : pour tout m, J2k\m vK^) = m (voir la proposition 6 page 32). On a donc <Hj = Pgcd(z, j) = Yl ^(fc) = S ^ fc|pgcd(z,j) k\i et k\j et d'après 1/ appliqué à ^ = ^, on a det A = <£>(!) • • • (p(n). Problème 8. Soient n > 2 un entier et K un corps commutatif. Montrer que tout hyperplan de Mn(K) contient au moins une matrice inversible. Solution. Soit H un hyperplan de .Mn(IK). Il existe une forme linéaire non nulle 99 de (Mn(K))* telle que H = Kertp. D'après l'exercice 3 de la partie 4.6 (page 132), il existe une matrice
6. PROBLÈMES 155 A G Mn(K) telle que ip(M) = tv(AM) pour tout M G Mn(R). Comme ip ^ 0, on a A ^ 0. Finalement, H = Kenp = {M G Mn(R) \ tr(AM) = 0}. Il s'agit donc de montrer que (VA G M„(R), A ^ 0,3M G ^n(K)), tr(AM) = 0. (*) Commençons par transformer A pour la rendre "sympathique". En posant r = rg(A) > 1 (car A 7^ 0), on sait que A est équivalente à la matrice par bloc ( gr o) (von' ^ théorème 1 page 122), c'est-à-dire 3P,QeÇ£n(K) tels que PAQ = Jr avec Jr = Fixons une matrice inversible M n'ayant que des 0 sur sa diagonale principale (on peut prendre par exemple M = ( J /n0_1 )). En écrivant la matrice M sous forme de blocs M = (£r ^r ), avec Ar G MrÇ&), on a JrM = ( * * ) , ce qui montre que, comme M, la matrice JrM n'a que des 0 sur sa diagonale principale. Ainsi, tr(JrM) = 0. En posant N = QMP G £4(K), on a M = Q~lNP~l et 0 = tr(JrM) = tr ((PAQ)(Q-1NP-1)\ = tr (p(AA0P_1) = tr(AW) (deux matrices semblables ont même trace), d'où le résultat d'après (*). Remarque. On peut prouver un résultat plus fort qui dit que la dimension maximale d'un sous-espace de .Mn(K) ne contenant aucune matrice inversible est n(n — 1). Le résultat de l'exercice en découle puisque la dimension d'un hyperplan de Mn(K) est n2 — 1 > n(n— 1). Problème 9. Soit n G N* et une application p : Mn(C) —► R+ vérifiant (i) \/A e Mi(C), VA g C, p(XA) < \X\ p(A). (ii) VA, B G À4„(C), p(A + £) < p(A) + p(B). (iii) VA, 5 G À4„(C), p(A£) < p(A)p(£). Montrer que p = 0 ou que p est une norme sur Mn(C). Solution. Commençons par remarquer que d'après (i), VA G C*,W1 G M»(C), p(XA) < \X\p(A) = \X\p(j(XA)\ < \X\ • ce qui entraîne p(XA) = \X\p(A) pour tout A G C. Supposons p 7^ 0. Pour montrer que p est une norme, il nous reste à prouver que p(A) = 0 implique A = 0. Pour cela, raisonnons par l'absurde en supposant p(A) = 0 et A ^ 0. Si r = rg A > 0, on sait A est équivalente à la matrice Jr = ( Qr J ) de sorte qu'il existe P,Q G GV-nity telles que Jr = PAQ. D'après la propriété (iii), on ap(Jr) = p(PAQ) < p(P)p(A)p(Q) = 0, donc p{Jr) = 0. La propriété (iii) appliquée à l'égalité J\ = J\Jr donne p{J\) < p{Ji)p(Jr) = 0, donc p{J\) = 0. Désignons par D{ la matrice dont tous les coefficients sont nuls sauf celui d'indice (i,i) qui vaut 1. La matrice D{ est de rang 1, donc équivalente à la matrice J\, et comme p{J\) = 0, un raisonnement similaire au précédent donne p(A) = 0. Maintenant, l'assertion (ii) entraîne p{In) = p(D1 + • • • + Dn) < p(Di) + • • • +p(Dn) = 0. Donc pour toute matrice A, p(A) = p(AIn) < p(A)p(In) = 0 donc p(A) = 0. Ainsi p = 0, ce qui est contraire aux hypothèses que nous avons faites. Finalement, on a montré que p = 0 ou que p est une norme sur Mn(C).  p(XA)=p(XA),
156 3. ALGÈBRE LINÉAIRE : GÉNÉRALITÉS Problème 10 (Matrices de transvection). On se fixe un entier naturel non nul n et on note <Sln(K) = {M G Mn(K) | det M = 1}. Pour i, j G {1,... ,n}, on note Eitj la matrice de .Mn(K) dont tous les coefficients sont nuls sauf celui d'indice (i,j) qui vaut 1. On appelle matrices de transvection les matrices de la forme In + XEij avec i ^ j et ÀeK, matrices de dilatation les matrices ■•• 0 \ Sn(<*) = 0 0 1 0 0 a) G Mn(K), avec a G K. 1/ a) Montrer qu'une matrice de transvection est inversible et que son inverse est aussi une matrice de transvection. b) Si A G Ç£n(K), montrer qu'il existe des matrices de transvection Bi}..., Bp, B[,...,Bq telles que A = Bx • • • Bp • 5n(det A) • B[ • • • B'q. 2/ On appelle commutateur toute matrice pouvant se mettre sous la forme ABA~lB~l avec A, B G <Sln(K). Soit D le sous-groupe de ^n(K) engendré par les commutateurs. a) Montrer que D = <Sln(K) si n > 3. b) Montrer que D = S\n(K) si n = 2 et Card(K) > 4. 3/ On suppose Card(K) > 4 et n > 2. Soit ip un morphisme de groupe de Qtn(¥>) dans un groupe commutatif G. a) Montrer qu'il existe un morphisme de groupes g : K* —> G tel que ip = g o det. b) Si G = K* et K est fini, montrer qu'il existe q G N tel que pour tout A G ££n(K), (p(A) = (detA)q (on pourra utiliser le fait que (K*,-) est cyclique, voir la remarque de l'exercice 10 page 26). Solution. 1/ a) Il suffit de remarquer que lorsque i ^ j, Ef, = 0. Ainsi, Eij est une matrice nilpotente d'indice 2, donc (In-\-XEij)(In — XEij) = In — \2Ef^ = In. La matrice de transvection In + XEij est donc inversible, et son inverse est la matrice de transvection In — XEij. b) Soit M G Ç£n(K). Si i ^ j, on remarque que (i) (In + XEij)M se déduit de M en ajoutant à la i-ième ligne de M À fois la j-ième, (ii) M(In + XEij) se déduit de M en ajoutant à la j-ième colonne de M À fois la i-ième. Ceci étant, on va maintenant prouver le résultat par récurrence sur n G N*. Pour n = 1, c'est évident car A = (det A). Supposons le résultat vrai au rang n — 1 et montrons le au rang n. Soit A G Ç£n(K). Comme A est inversible, la première colonne de A est non nulle. Il existe donc une matrice de transvection T\ = In + A-E^j telle que le coefficient d'indice (2,1) de T\A soit non nul. On voit alors qu'il existe \i tel que si Ti = In + fiEit2, alors T2T1A ait son coefficient d'indice (1,1) égal à 1. D'après (i), on voit maintenant que l'on peut trouver des matrices de transvection Bi,..., Bp (de la forme In + A-Ë^i) telles que / 1 (Bl---Bp)(TiT2A) = 0 x \ X X \ 0 | x ••• x y puis d'après (ii), on voit que l'on peut trouver des matrices de transvection B[,. forme In + XEij) telles que ,BL (de la / 1 {Bl>--BpTiT2A)(B[>--Bq) = A' avec A' = \ 0 0 0 o\ /
6. PROBLÈMES 157 Or det A = det B donc d'après l'hypothèse de récurrence, il existe des matrices de transvection Ci,..., Cr et C{,..., C's de Mn-i(K) telles que B = C1--Cr-Sn-i(detA)-C[- C's- Les matrices Di = ( 1 0 0 ••• 0 \ Ci ) et £>; = .7 / î 0 • 1° 0 •■■ 0 \ c; , / sont des matrices de transvection de .Mn(IK), et on a A' = Di---Dr-Sn(detA)-D[ et donc Di A = {T^T^){B~l ■ B^1)(D1 --Dr)- Sn(detA) - (D[ - ■ - D's){B'q)-1 ■ ■ ■ (B[) -î 1 a(fi2-l) 0 1 M d'où le résultat puisque l'on a vu plus haut que l'inverse d'une matrice de transvection est une matrice de transvection. 2/ a) Tout d'abord, tout commutateur ABA~lB~l est dans <Sln(K) puisque det(ABA~1B~1) = (det A)(det B)(det A~l)(det B~l) = 1. On en déduit donc D c <Sln(K). Montrons maintenant que <Sln(K) c D. Soit M G <Sln(K). D'après la question précédente, M est le produit de matrices de transvection, et D étant un groupe, il suffit donc de montrer que les matrices de transvection sont des commutateurs pour montrer que M € D. Soit T = In + XEij avec i ^ j une matrice de transvection. Comme n > 3, il existe k G {1,..., n} tel que k £ {i,j}- On remarque alors que T = (In + XEitk)(In + Ek,j)(In - ^Ei,k)(In ~ -Efcj) et comme In — XE^ = (In + XEi^)~l et In — Ekj = (Jn + Ekj)~l, on en déduit que T est un commutateur, d'où le résultat. b) Remarquons tout d'abord que si (a,/?) G K x K*, f fi 0 \ / 1 a\f fi-1 0\( 1 -a \ \0 fi-1 )\0 1 )\ 0 fi )\0 l J' On choisit maintenant j3 tel que /?2-1^0et/?^0 (c'est possible car Card(IK*) > 3 et l'équation polynomiale fi2 — 1 = 0 a au plus deux racines dans K). La relation (*) prouve alors que toute matrice du type ( J f ) est un commutateur. De même, on montrerait que toute matrice du type ( * Ç) est un commutateur. Autrement dit, toutes les matrices de transvection sont des commutateurs, et comme à la question précédente, ceci suffit pour conclure que D = S\n(K). 3/ a) Notons e l'élément neutre de G. Si M = ABA~~lB~~l G G£n(^) est un commutateur, alors ip(M) = ^(AMBMA-'MB-1) et le groupe G étant commutât if, tp(M) = rtAMA^MBMB-1) = tpiAA-'MBB-1) = y>(Jn)2 = e. Comme D = S\n(K) est engendré par les commutateurs, on en déduit que tout élément M G fSln(K) vérifie ip(M) = e. Ceci étant, soit A G <#n(K). Soit A' G G£n{K) telle que A = A'Sn(detA). On a det,4 = det .4' • det(5n(det .4)) donc det .4' = 1 car det (5n (det .4)) = det .4 ^ 0. Autrement dit, A' G fSln(K) et donc (p(A') = e, d'où on tire ip(A) = ip(A')(p(Sn(det A)) = (p(Sn(det A)). Si g : K* -► G a i-> (p[Sn(a)]y g est un morphisme de groupe de K* dans G, et on vient donc de montrer que (p = g o det, d'où le résultat. b) On recherche la forme de g. Le groupe K* est cyclique donc il existe a G K* tel que K* = (a). En particulier, il existe p G N tel que g(a) = ap. Donc pour tout x G K*, x = a9, on a <?(*) = y(a«) = g{af = (o?)« = (a«)* = ^, et donc pour tout A G ^n(K), ip(A) = g(detA) = (detA)p.
158 3. ALGÈBRE LINÉAIRE : GÉNÉRALITÉS Problème 11. a) Soient Aet B e Mn(R) deux matrices semblables sur C (i. e. il existe P e £4(C) telle que A = P~lBP). Montrer que A et B sont semblables sur R (i. e. il existe Q G Gen{R), A = Q~lBQ). b) Plus généralement, soit K un corps infini et L une extension de K. Soient A et B G Mn{K) deux matrices semblables sur L. Montrer que A et B sont semblables sur K. Solution, a) Soit P G Q£n{Q telle que A = P~lBP, ou encore PA = BP. Écrivons P = P\+iP2 avec Pi,P2 G Mn(^)- En égalant parties réelles et imaginaires, on a Pi A = BP\ et P2-A = BP2. (*) On définit le polynôme ip(X) = det(Pi + XP2) G R[X]. Comme y>(i) = detP ^ 0, (p est non nul et donc n'a qu'un nombre fini de racines, de sorte qu'il existe x G M. tel que (p(x) ^ 0, c'est-à-dire que Q = P\ + xP2 G A1n(]R) est inversible. De (*) on tire QA = BQ donc A = Q~lBQ, d'où le résultat. b) On procède un peu comme précédemment. Soit P G G£n(^<) tel que A = P~lBP, ou encore PA = BP. On écrit P = (Pi,j)i<i,j<n- Le corps L est un K-e.v. Soit E = Vect(pitj)i<itj<n, s.e.v de L de dimension finie sur K. Soit (ei,... , ep) une base de E. Pour tout (z,j) on peut écrire Pi,j = Yfk=\PiJ,kek avec les pitjtk G K. Pour tout k, on note Pk = {Pi,j,k)i<i,j<n G Mn(&), de sorte que P = eiPi + • • • + epPp. Comme PA = BP, on a pour tout fc, 1 < k < p, P^A = £Pfc (**). Posons F(Xi, ...,XP) = det(XiPi + • • • + XPPP) G K[XU..., Xp\. On a P ^ 0 car P(ei,..., ep) = det(P) ^ 0. Or K est un corps infini, donc F ne s'annule pas sur Kp, et donc il existe (xi,...,xp) G Kp tel que F(x\,..., xp) ^ 0. Si Q = ziPi H £PPP G A1n(K), on a donc Q G G£n{K) et d'après (**), QA = BQ donc A = Q~lBQ, d'où le résultat. Remarque. Le résultat reste vrai lorsque K est un corps fini (voir l'annexe B, page 292). Problème 12 (Splines cubiques). Soit / = [a, b] un segment de R avec a < b, n e N, n > 2 et a = xo < Xi < ... < xn = b une subdivision de [a, b]. Une fonction s : / —► M est appelée spline cubique si elle est de classe C2 sur / et si pour tout i (1 < i < n), la restriction de s à [xi_i, Xi] est une fonction polynôme de degré < 3. a) Soit a0 < ai deux réels, et zo,Z\,qo,qi G M. Montrer l'existence et l'unicité d'un polynôme H de degré < 3 tel que H(ao) = z0, H'(ao) = qo, H(a\) = Z\, H'(a\) = qi, et expliciter la valeur de H"(glq) et H"(ai) en fonction de zo, z\t qo, q\ et Oi — Oo- b) On fixe dorénavant des nombres réels (yi)o<i<n et po, pn- On cherche une spline cubique vérifiant les trois conditions (i) Vi G {0,1,..., n}, s(xi) = y{ (ii) s'{a) = p0 (iii) s'{b) = pn. (*) Soit s une fonction C1 sur / vérifiant (*), et telle que pour i = 1,... ,n, la restriction s* de s à [#i_i,£;] soit polynomiale de degré < 3. Exprimer sous forme d'un système linéaire une condition nécessaire et suffisante sur les inconnues pi = s'(xi) (1 < i < n — 1) pour que s soit une spline cubique. c) Montrer que ce système linéaire est inversible et en déduire l'existence et l'unicité d'une spline cubique s vérifiant (*) (une telle spline est appelée spline scellée). d) (Théorème de Holladay). On note H2 l'espace vectoriel des fonctions de classe C1 sur / et dont la restriction à chaque intervalle [xi_i,a;i] (1 < i < n) est déclasse C2. On note H.2 l'ensemble des fonctions de H2 vérifiant les conditions (*). Montrer qu'il existe une unique fonction 5 G H2 vérifiant j\s"{x)fdx=Mij\f{x)fdx et que cette fonction s est la spline scellée vérifiant les conditions (*). (Indication : si 5 est la spline scellée vérifiant (*), montrer que f s"(f" — s") = 0 pour tout f e H^.)
6. PROBLÈMES 159 Solution, a) L'existence et l'unicité du polynôme H de degré < 3 vérifiant ces conditions d'interpolation est une conséquence du résultat de l'exercice 7 page 66. Nous allons retrouver ce résultat directement, et calculer explicitement H"(ao) et H"(ai) en fonction de zo,zi,qo,qi. Notons rao = H"(ao) et m\ = H"(ai). Comme H est polynomiale de degré < 3, H" est une fonction affine, donc par interpolation linéaire on obtient vin \ mo, \ , mi/ \ u H (x) = ~r(ai - x) + -^-(z - ao), h = ai - ao. h h Une double intégration de la formule précédente entraîne, après une manipulation simple, l'existence de a, fi e 1R tels que H(x) = g^fai - x)3 + -^(x - a0)3 + a(ai - x) + /3(x - a0). Les égalités if (ao) = z$ et H(a{) = zi donnent les égalités zq = ^h2 + ah et zi = ^h2 + f3h. On en déduit les valeurs de a et (3 et après substitution dans (**) on obtient rao/i 8-M«i-*;i-ifc m0 rai zq *(«> = ^-*)8 + i(*—)8 + lT- (ai - x) + ( ^ - ^- ) (x - a0). (**) En dérivant cette expression, et en substituant x par ao et ai, on obtient q0 = H (a0) = m0 mi zi-zo ttI, s "«a , . ^10, . Zi~ Zq qi = H (ai) = —h + — h + Ceci permet d'obtenir directement les valeurs rao et rai sous la forme H"(a0) _ rap_ _ _2q0 + qi t 0zi - z0 H"(ai) _ rai _ q0 + 2gi 2 -3 h Zl - Zq (***) 2 2 h h2 ' 2 2 /i /i2 Ainsi, partant de 2o>2i,ao,gi il y a une et une seule valeur possible pour rao et rai, donc on a bien l'existence et l'unicité de H d'après la formule (**). b) Soit pi = s'(xi). La restriction si de s à [xi_i,Xi] est un polynôme de degré < 3 vérifiant Si(xi-i) = yi-i, sfai-i) = pi-i, Si(xi) = m, sfai) = pi. D'après le résultat de la question précédente, Si existe et est unique, ce qui définit s de manière unique dès que s vérifie (*) et s'(xi) = pi pour i = 1,... ,n — 1. La seule condition manquante pour que s soit une spline cubique est qu'elle soit de classe C2. Ceci est équivalent à la condition s"(xi) = s"+i(xi) pour 1 < i < n — 1, ce qui d'après la formule (***) s'écrit aussi 2/i-i 2pi + pi+i l02/i+i-2/i Pi-i + %Pi _ nVi hi-i /i2_x hi h2 fli—i — Xi Xï—if fïi — Xi-^-i X{. En résumé, s est une spline cubique si et seulement si le système linéaire suivant est satisfait Vi€{l,...,n-1}> c) En posant Pi-i hi-i + 1Pi 1 Tl h = -r et di = ci-—, hi ho ' 1 V M-i hij ai = C2, hi Vi -Vi-i 32/i+i - Vi h2 A? dn-2 = Cn-2, ^n-1 = Cn-1 ~ Pn le système linéaire précédent s'écrit aussi en fonction des inconnues pi, / 2(4 + ^i) 4 0 ••• 0 \ / Pi \ h 2(4 + 4) 4 '•■ '• I I P2 o e2 ■•• ••• o \ 0 '•• '•• ^n-2 0 tn-2 2(tn-2 + tn-l) ) hn-\ tPn-i sous la forme / di \ d2 \ Pn-l 1 \ dn-l I Notons M la matrice carrée d'ordre n — 1 du membre de gauche de cette égalité. Si MX = 0 avec X = XI Xn-1 , alors si k est tel que \xk\ = sup^ \x{\, la ligne k du système MX = 0 s'écrit £k-iXk-i + 2(4-1 + 4)^ + 4^+1 = 0 (où on pose x0 = xn = 0). Ceci entraîne 2(4-i +4)zfc = -4_ixfc_i - £kxk+i donc 2(4_i + £k)\xk\ < 4-ikfc-i| +4k*+i| < (4-1 + 4)NI ce qui n'est
160 3. ALGÈBRE LINÉAIRE : GÉNÉRALITÉS /' Ja possible que si Xk = 0 (nous venons d'utiliser la propriété que M est diagonalement dominante, voir l'exercice 1 page 123). On en déduit que X = 0, donc que M est inversible, ce qui prouve bien l'existence et l'unicité des inconnues (p;)i<z<n-i- D'après le résultat de la question précédente, ceci montre l'existence et l'unicité d'une spline cubique vérifiant les conditions (*). d) Soit s la spline scellée vérifiant les conditions (*). Soit / G H%. On note u = f — s. On a / (f"(x))2dx= f (s"(x))2dx + 2 f s"(x)u"(x)dx+ f (u"(x))2dx. (****) Ja Ja Ja Ja Sur [xf-ijXi], la fonction s est égale à la fonction polynomiale s;, sa dérivée troisième y est donc bien définie, et on peut écrire l'intégration par partie H s,,(x)u,,(x)dx=[s,,(x)u\x)]2i-fXl s'"(x)u'(x)dx. Comme s = Si est polynomiale de degré 3 sur [xf-i,^], la fonction s,n est constante sur cet intervalle. On peut donc écrire f1 s"{x)u"{x)dx = [AsKOCL -*"'(**) r *'(*)<& = [s"(x)u,(x)]x;i_i, Jxi-i x Jxt-i car comme f et s vérifient les conditions (*), la fonction u = f — s s'annule aux points X{ donc fx*- u'(x)dx = u(xi) — u{xi-\) = 0. En sommant cette relation sur z, on en déduit s"(x)u"(x) dx = [s"(x)u'(xj\ba = s"(b)u'(b) - s"(a)u'(a) = 0 fa car comme f et s vérifie la condition (ii) et (iii) de (*), on a u'(a) = u'(b) = 0. Finalement la formule (****) s'écrit / (f"(x))2dx= f (s"(x))2dx+ f {f"{x)-s"{x))2dx. Ja Ja Ja On en déduit bien que fa{s"(x))2 dx = inf/e#* fa{f"(x))2 dx. La fonction s est bien la seule à atteindre ce minimum. En effet, considérons une autre fonction / G H\ qui l'atteint. La formule précédente entraîne f*{f"{x) - s"{x))2 dx = 0, donc f*{_ (f"(x) - s"{x))2 dx = 0 pour tout i. Donc sur chaque intervalle [a?i_i,aji], /" — s" s'annule donc (/ — s) y est affine. Comme de plus f et s vérifient (*), f — s s'annule aux extrémités de [a?i_i,a;i] donc / — s = 0 sur [a^i-i,^]. On en déduit / = s, d'où le résultat. Remarque. On définit également les splines cubiques dans le plan ou l'espace. Ces dernières sont utilisées en conception assistée par ordinateur, pour faire passer une courbe par des points donnés. Le théorème de Holladay exprime que ces courbes ont la propriété de "minimiser" la courbure tout en passant par les points. - Les splines sont des courbes interpolantes qui oscillent moins que les polynômes d'interpolation de Lagrange, et elles évitent le phénomène de Runge (voir le tome Analyse). - En remplaçant les conditions (ii) et (iii) de (*) par s" (a) = s"(b) = 0, on définit de même les splines cubiques naturelles. Les propriétés d'existence et d'unicité, ainsi que le théorème de Holladay, restent vraies pour les splines naturelles. On peut également définir les splines d'ordre quelconque r, lorsque 5 est polynomiale de degré < r sur [^-i,^].
CHAPITRE 4 Réductions d'endomorphismes T 'algèbre linéaire au sens moderne se développe progressivement à partir des *-J années 1840. Vers 1880, la théorie des systèmes d'équations linéaires généraux (sur R et C) est enfin achevée, ainsi que celle des valeurs propres des matrices carrées et de la réduction de ces dernières à une forme canonique. La notion générale de valeur propre d'un endomorphisme apparaît en fait au dix-huitième siècle, non à propos des transformations linéaires, mais dans la théorie des systèmes d'équations différentielles linéaires à coefficients constants, étudiés par Lagrange en 1762. Le théorème de Cayley-Hamilton apparaît quant à lui dans un mémoire de Cayley en 1858, démontré uniquement dans le cas n = 2 et n = 3. Les travaux de Cayley paraissent être pratiquement ignorés jusque vers 1880 et c'est grâce au développement de la théorie des formes bilinéaires notamment avec Cauchy, Sylvester, Hermite et Weierstrass, que l'étude des matrices est remise au goût du jour. Weierstrass obtient d'ailleurs la réduction dite de Jordan. C'est Probenius qui, dans plusieurs mémoires publiés entre 1877 et 1880 tiendra le rôle de législateur dans ce domaine en développant de manière systématique les résultats obtenus, avant de parvenir à l'axiomatisation de l'algèbre linéaire par Peano en 1888. Dans tout le chapitre, K désigne un corps commutatif. 1. Diagonalisation, trigonalisation 1.1. Généralités en dimension quelconque La lettre E désigne un K-e.v de dimension quelconque, / un endomorphisme de E. DÉFINITION 1. Soit a G K. Le scalaire a est dit (i) Valeur régulière de f si f — a Id# est inversible. (ii) Valeur spectrale de f si f — a Id# est non inversible. (iii) Valeur propre de f si f — a Id# est non injective, autrement dit s'il existe x ^ 0 tel que f(x) = cxx, et on dit alors que x est vecteur propre de f attaché à la valeur propre a. On appelle spectre de f l'ensemble de ses valeurs spectrales. Remarque 1. - En dimension finie, (ii) et (iii) sont équivalents. - 0 est valeur propre de / si et seulement si Ker/ ^ {0}. - Pour une matrice A G .Mn(K), on dit que a G K est valeur propre de A s'il existe un vecteur X ^ 0 tel que AX = aX. On dit alors que X est vecteur propre de A attaché à la valeur propre a. Si A est la matrice d'un endomorphisme /, a est valeur propre de A si et seulement si a est valeur propre de /. DÉFINITION 2. Soit À une valeur propre de /. L'ensemble E\ = {x G E \ f(x) = Xx} = Ker(/ — Àlds) est un s.e.v de E stable par /, appelé sous-espace propre de f associé à la valeur propre À.
162 4. RÉDUCTIONS D'ENDOMORPHISMES Théorème 1. Soient Ai,..., A* des valeurs propres de f, distinctes deux à deux. Alors les sous-espaces propres E^,..., E\k sont en somme directe. 1.2. Étude en dimension finie La lettre E désigne désormais un K-e.v de dimension finie n G N*. Polynôme caractéristique. DÉFINITION 3. Soit A G Mn(^)- On appelle polynôme caractéristique de A le polynôme de K[X] défini par PA(X) = det[A - XIn}. Remarque 2. - On a Pa(0) = det A (i.e. le coefficient constant de Pa est égal à det A). - Une matrice a même polynôme caractéristique que sa transposée. - Deux matrices semblables ont même polynôme caractéristique. DÉFINITION 4. Soit / G C(E). Le polynôme caractéristique de la matrice de / dans une base B de E ne dépend pas de la base B choisie. On l'appelle polynôme caractéristique de / et on le note Pf. Remarque 3. Un endomorphisme / G C{E) a même polynôme caractéristique que son application transposée */ (car [*/]s = *[/]s). Proposition 1. A est valeur propre de f e C(E) si et seulement si P/(A) = 0. Remarque 4. Bien sûr, ce résultat reste vrai pour les matrices. En fait, en dimension finie, tout ce qui est vrai pour les endomorphismes est vrai pour les matrices et réciproquement (en effet, toute matrice A G Mn(K) peut s'associer à l'endomorphisme de Kn : X i-> AX, c'est-à-dire l'endomorphisme de Kn dont A est la matrice dans la base canonique de Kn). Remarque 5. - Si K est algébriquement clos (par exemple K = C), tout élément / G C(E) a au moins une valeur propre A G K. - Pour montrer que A est valeur propre d'une matrice A, on peut montrer que rg(^4 — XIn) < n (ce qui est parfois plus simple que de montrer Pa(A) = 0). Par exemple si n> 2 et ( a 1 ••• 1 ^ 1 ••• ••• : A = eMn : '-. '-. 1 \ 1 ••• 1 a ) on voit que rg(^4 — (o — l)/n) = 1 < n donc a — 1 est valeur propre de A et dim^a-i = n — 1. - Dans la pratique, pour déterminer E\ lorsque A est valeur propre d'une matrice A — iai,j)i<i,j<n £ Mn(K), on résout le système AX = XX qui s'écrit (ûi,i - A) xi + Oi)2 x2 + • • • + altn xn = 0 û2,i xi + (a2)2 - A) x2 + • • • + a2>n xn =0 an,i xi + an>2 x2 + • • • + (an,n - A) xn =0 (voir l'exercice 1.6 page 167). Coefficients du polynôme caractéristique d'une matrice. Soit A G Ain(K). On peut écrire pA(x) = (-i)n [xn - Ar-1 + p2xn~2 + • • • + (-ly-'pn^x + (-i)n/?n], où fii = tï A, fin = detA, et pour tout k, fik est la somme des mineurs principaux de A d'ordre k (rappelons qu'un mineur principal d'ordre k est un mineur obtenu comme
1. DIAGONALISATION, TRIGONALISATION 163 intersection de k lignes et de k colonnes de même numéros). En particulier, si A désigne la comatrice de A, (3n-i = trA. Proposition 2. Soit f G C(E), F un s.e.v strict de E (le. F ^ E et F ^ {0}) stable par f. Soit g = f\p la restriction de f à F. Alors g G C(F) et Pg divise Pf. Démonstration. F étant stable par /, g = f\F est bien un endomorphisme de F. Ceci étant, soit (ei,..., er) une base de F complétée en une base B = (ei,..., en) de E. La matrice de / dans B a la forme [/]* = 0 -J 0Ù A= (^.....e,.), et donc Pf = det([f}B - XIn) = A-XIr 0 c JD — Ain_r = det{A - XIr) • det(B - XIn-r) = Pg • det(B - XIn-r). D Proposition 3. Soit f e C(E) un endomorphisme nilpotent. Alors Pf = (—l)nXn (où n = dim E). Démonstration. Nous donnons deux méthodes de démonstration de ce résultat. Soit q G N* tel que /« = 0. Première méthode. Soit A la matrice de / dans une base de E, K' le corps des racines de Pa{X). Dans K', on peut écrire Pa = (—l)nIli(^ — ^ô- On peut bien sûr regarder A comme une matrice de A^K'). Pour tout i, Xi est valeur propre de A, associé à un vecteur propre X ^ 0. Un calcul rapide donne AqX = XjX, et comme Aq = 0, on en tire Ai = 0. Donc PA = (-l)nIli(X-Xi) = (-l)nXn. Seconde méthode. Nous allons montrer ce résultat sans faire appel au corps des racines de P/, en procédant par récurrence sur n G N*. Pour n = 1, c'est évident. Supposons le résultat vrai au rang n — 1, montrons le au rang n. On a (det f)q = det(fq) = 0, donc det/ = 0 et donc Ker/ ^ {0}. Soit e\ G Ker/, e\ ^ 0, de sorte que /(ei) = 0. Complétons e\ en une base B de E. Alors [/]* = 0 0 x M et 0 = lf«]B = (lf}B)* = 0 0 x x Af« donc Mq = 0, et d'après l'hypothèse de récurrence Pm = (—l)n Xn , donc Pf(X) = -X 0 x x M - XIn-! = (-X)PM = (-l)nXn. D Remarque 6. Un résultat plus fort sera donné à la remarque 6 page 177. 1.3. Endomorphismes diagonalisables DÉFINITION 5. Soit / G C(E). On dit que / est diagonalisable s'il existe une base de vecteurs propres de /. On dit que A G Mn(K) est diagonalisable si A est semblable à une matrice diagonale. Remarque 7. Un endomorphisme / est diagonalisable si et seulement si sa matrice dans une base quelconque de E est diagonalisable. Proposition 4. Soit f G C(E). Si Pf est scindé sur K et a toutes ses racines simples, alors f est diagonalisable.
164 4. RÉDUCTIONS D'ENDOMORPHISMES Démonstration. Écrivons Pf = (—l)nri?=i(^ — ^)- P°ur t°ut h ^i es* valeur propre de / donc il existe X{ un vecteur propre de / associé à la valeur propre A^. D'après le théorème 1, les Xi forment une famille libre, à n éléments, et forment donc une base de E. □ Proposition 5. Soit f G C{E), A G K une racine de Pf d'ordre de multiplicité h. Alors dim Ex < h. Démonstration. Le sous-espace propre E\ est stable par /. Soit g = f\Ex G C{E\). D'après la proposition 2, Pg divise Pf. Comme g = X Id#A, on a Pg = (A - X)dmEx, donc dim.E\ < h. D Théorème 2. Soit f G C(E). Les propositions suivantes sont équivalentes. (i) f est diagonalisable. (ii) Pf est scindé sur K et pour toute racine Xi de Pf d'ordre de multiplicité hi, hi = dim E\i. (iii) Il existe des valeurs propres Ai,..., Ap de f vérifiant E = EXl 0 • • • 0 EXp. Démonstration, (i) ==> (ii). Soit B une base de vecteurs propres de /. La matrice M de f dans B est diagonale, et si Ai,..., Ap désignent les valeurs propres de /, la diagonale de M est constituée des A^. Pour tout i, 1 < i < p, notons hi le nombre de fois que A^ apparaît dans la diagonale de M, de sorte que Pf = Pm = (—l)n n?=i(^ — ^i)hi- P°ur tout », 1 < * < p, il existe hi vecteurs de la base B vérifiant f(x) = XiX, c'est-à-dire hi vecteurs linéairement indépendants dans E\v donc dimiï^ > hi. Donc dim^i = hi d'après la proposition précédente. (ii) => (iii). Écrivons Pf = (-l)nnî=i(* ~ Ai)/lS les ^ étan* distincts. Soit F = ®?=1EXi. On a dim F = £?=1 dim EXi = £?=i hi = deg(P/) = n, donc F = E. (iii) => (i). Si pour tout i, Bi désigne une base de E\iy alors il est clair que B = B\ U • • • UBp est une base de vecteurs propres de /. D Proposition 6. Soit f e C(E) diagonalisable et F un s.e.v de E stable par f. Alors f\F G C(F) est diagonalisable. A ce stade du cours, ce résultat est non trivial. Il sera démontré ultérieurement dans ce chapitre (voir la conséquence du théorème 2 page 175). 1.4. Trigonalisation Définition 6. Un endomorphisme / G C(E) est dit trigonalisable s'il existe une base B de E dans laquelle la matrice de / soit triangulaire supérieure. On dit alors que la base B trigonalise /. Une matrice A G Mnfâ) est dite trigonalisable si A est semblable à une matrice triangulaire supérieure. Remarque 8. Un endomorphisme / est trigonalisable si et seulement si sa matrice dans une base quelconque de E est trigonalisable. Théorème 3. Un endomorphisme f G C(E) est trigonalisable si et seulement si son polynôme caractéristique Pf est scindé sur K. Démonstration. Condition nécessaire. C'est le plus facile. Soit B une base de trigonalisation de /. On a /Ai x • • • x \ 0 A2 '•• ! T = U)b = : x V 0 ••• 0 An / G Mn(K),
1. DIAGONALISATION, TRIGONALISATION 165 donc Pf = PT = (-l)n Il?=i(^ - ^i) est scindé sur K. Condition suffisante. Nous allons procéder par récurrence sur n G N*. Pour n = 1, c'est évident. Supposons le résultat vrai au rang n — 1. Nous allons donner deux méthodes pour montrer le résultat au rang n. Première méthode. Le polynôme caractéristique de l'application transposée */ vérifie Ptf = Pf, don Ptf est scindé sur K, donc d'après la proposition 1, */ admet un vecteur propre x dans le dual E*, donc Kx est stable par '/. On en déduit que l'orthogonal H de Kx dans Kn est un hyperplan stable par / (voir la proposition 8 page 130). D'après la proposition 2, le polynôme caractéristique de la restriction de / à H (f\H est bien un endomorphisme puisque H est stable par /) divise Pf donc est scindé sur K, ce qui entraîne d'après l'hypothèse de récurrence l'existence d'une base B\ = (ei,... ,en_i) de H dans laquelle /|# se trigonalise. Complétons cette base de H en une base B = (ei,..., en) de Kn. La base B triangule / car / [f}B = [/|Jï]Bi Vo 0 X X \ / / x 0 V o x \ 0 x / Seconde méthode. D'après la proposition 2, il existe un vecteur propre e\ de /. Complétons e\ en une base B = (ei,..., en) de Kn, et notons H = Vect(e2,..., en). On a / [f)B = a 0 ^0 x x \ M avec M G Mn_i(K), / où M est la matrice de l'endomorphisme g G C{H) défini par g = p o f\H) où p est la projection sur H parallèlement à Kei. OnaP/ = (a-X)Pm = (a — X)Pg, donc Pg est scindé sur K, donc d'après l'hypothèse de récurrence, il existe une base B\ = (/2,..., fn) de H qui trigonalise g. La base B' = (ei, /a,..., fn) trigonalise / car on a / U\b> = a 0 0 x \9\bx X \ / D Remarque 9. - La version matricielle de ce résultat est la suivante : une matrice M G Mn(^) est trigonalisable si et seulement si son polynôme caractéristique est scindé sur K. - Si / G C(E) est trigonalisable et si F est un s.e.v de E stable par F, alors l'endomorphisme f\p est trigonalisable (en effet, P/|F divise Pf donc est scindé sur K). - Si K est algébriquement clos (par exemple K = C), tout endomorphisme du K-espace vectoriel E est trigonalisable. - La trigonalisation d'une matrice est parfois un passage commode pour montrer un résultat. Notons la relation suivante entre le produit de deux matrices triangulaires supérieures : f ai x ••• x\//?i x ••• x^ / aiPi x • • • x \ 0 a2 \ 0 0 x 0 & V o 0 x PnJ 0 a2p2 \ 0 0 x ttnfin ) - On verra dans la section 4 page 191 des réductions plus poussées.
166 4. RÉDUCTIONS D'ENDOMORPHISMES 1.5. Réductions simultanées Proposition 7. Soient f,g e C(E) tels que f og = go f. Alors (i) Tout sous-espace propre de f est stable par g (en particulier Ker f). (ii) Im / est stable par g. Démonstration, (i) Soit E\ un sous-espace propre de /. Pour tout x G E\, f[g(x)] = g[f(x)] = g(Xx) = Xg{x) donc g(x) G E\. (ii) Soit y G Im/, et x G E tel que y = f(x). On a g(y) = g[f(x)] = f[g{x)] G Im/. □ Théorème 4 (Diagonalisation simultanée). Si f et g e C(E) sont diagonalisables et commutent, il existe une base commune de diagonalisation de f et g (on dit alors que f et g sont codiagonalisables,). Démonstration. Soient Ai,..., Ar les valeurs propres de /, E\l,...,E\r les sous-espaces propres correspondants. Pour tout i, E\t est stable par g. La restriction de g à E\0 g\Ex., induit un endomorphisme de E\{, diagonalisable d'après la proposition 6. Il existe donc une base Bi de Ex{ de vecteurs propres de g (et bien sûr de / car f\Ex = AjId£A.). Or E = ©f=1£?Ai» d°nc B = (Bi,...,Br) est une base de diagonalisation commune de f et g. □ Remarque 10. La réciproque est vraie : si / et g se diagonalisent dans une même base, alors f et g commutent (il suffit de remarquer que f et g commutent sur cette base). Théorème 5 (Trigonalisation simultanée). Si f et g e C(E) sont trigonalisables et commutent, alors il existe une base de trigonalisation commune de f et g (on dit alors que f et g sont cotrigonalisables/ Démonstration. Préliminaire. Remarquons déjà que f et g ont un vecteur propre commun. En effet, / admet une valeur propre A G K (puisque / est trigonalisable). Le sous-espace propre Ex est stable par g, et g^x est trigonalisable (voir la remarque 9), donc admet un vecteur propre x £ Ex- Finalement, x est un vecteur propre commun à, f et g. On procède maintenant par récurrence sur n. Pour n = 1, c'est évident. Supposons le résultat vrai au rang n — 1. Pour le montrer au rang n, nous donnons deux méthodes. Première méthode. Comme / o g = g o /, on a lg o */ = */ o lg, donc d'après le préliminaire appliqué à */ et lg, il existe un vecteur propre x £ E* commun à '/ et à lg. Ainsi, Kx est stable par */ et lg, donc l'orthogonal H de Kx dans E, est un hyperplan de E stable par / et g. D'après l'hypothèse de récurrence, f\j{ et g\fj sont trigonalisables dans une même base B' de H. Soit e G E tel que B = (B',e) forme une base de E. Alors \S\b = ( \!\h\b> \0 ••• 0 x ••• x x \ / et comme la matrice de /[# dans B' est triangulaire supérieure, on en déduit que [/]# est triangulaire supérieure. De même, [q\b est triangulaire supérieure, d'où le résultat au rang n. Seconde méthode. Le préliminaire assure l'existence d'un vecteur propre commun x k f et k g. Complétons x en une base B = (x, e2,..., en) de E. On a / u]b= a 0 Vo x x \ M et [g]B = ) ( I3 0 1° X N x \ /
1. DIAGONALISATION, TRIGONALISATION 167 Comme Pf = (a — X)Pm, Pm est comme Pf scindé sur K, donc M est trigonalisable. De même, N est trigonalisable. Or fg = gf, donc [/]b[#]b = Mb[/]b, ce qui s'écrit / x 0 \o x \ MN ( I 0 \o x \ NM ) et donc MN = NM. Soit B\ = (c2,...,c„) et H = VectBi, hyperplan de E. On note p la projection sur H parallèlement à Kx. Soit /i = p o /|# et pi = p o p|# e C(H). Comme [/i]-Bi = M et [pi]si = N, /i et pi commutent donc d'après l'hypothèse de récurrence, il existe une base B\ de H qui trigonalise à la fois f\ et g\. Dans la base B7 = (x, B\) on a / x Mb' = V 0 0 x \ [ZiU, / ce qui montre que [/]#' est triangulaire supérieure. De même [g]B> est triangulaire supérieure, d'où le résultat. □ Remarque 11. - La formulation matricielle de ces deux théorèmes est la suivante : Soient A, B G Mn(&) diagonalisables (resp. trigonalisables) telles que AB = BA. Alors il existe P G G£nfâ) telle que P~lAP et P~lBP soient diagonales (resp. triangulaires supérieures). - La première méthode des démonstrations des théorèmes 3 et 5 montre l'intérêt de l'utilisation des applications transposées */ G C(E*) dans les raisonnements par récurrence (voir la partie 4 page 126 du chapitre III). Ce procédé est à retenir ! 1.6. Exercices Exercice 1. Diagonaliser ou trigonaliser dans Mn(C), en donnant la matrice de passage, les matrices suivantes. a) M = b) M = / V c) M = d) M = 0 0 0 -1 2 5 -3 0 0 1 0 2 1 4 0 -1 0 0 -3 -5 0 1\ 0 0 0/ \ . / Solution, a) On calcule le polynôme caractéristique de M : Pm = -X 2 -1 3 -2 - X 0 -2 2 l-X 1-X 2 -1 l-X -2-X 0 1-X 2 l-X = (1-X) 1 0 0 1 -4-X 1 1 0 2-X = (1-X) = (1-X) 1 2 -1 1 -2-X 0 1 2 1-X -4-X 1 0 2-X = -(X-l)(X-2)(X + 4). D'après la proposition 1, M a donc trois valeurs propres qui sont 1, 2 et —4. Ces valeurs propres étant distinctes, M est donc diagonalisable d'après la proposition 4. Recherchons
168 4. RÉDUCTIONS D'ENDOMORPHISMES - Un vecteur propre X\ = ( y j associé à la valeur propre 1 : MXl = X1 ^=> -x + 2y - 3x - 3y -2x + 2y z =0 = 0 = 0 { x = y x = z Donc X\ = ( i J convient. - Un vecteur propre X2 = ( y ) associé à la valeur propre 2 MX2 = 2X2 ( -2x + 2y - z =0 l Sx - 4y =0 { -2x + 2y - z =0 Sx = z = 4y 2{y - x) Donc X2 = ( 3 j convient. - Un vecteur propre X% = ( y J associé à la valeur propre —4 MI3 = -4X3 Ax + 2y - z =0 Sx + 2y =0 -2x + 2y + 5z =0 3x + 2y = 0 x = z Donc *-(*) convient. - L'endomorphisme / G £(C3) ayant M pour matrice dans la base canonique de C3 est donc diagonalisable, et B = (X\,X2,Xz) est une base de diagonalisation de /. On a [f)B = D = donc P~1MP = D avec P = (P est la matrice de passage de la base canonique de C3 à la base B). b) Un calcul donne PM = (X2 + l)2 = (X + i)2(X - i)2. - On recherche Ei, le sous-espace propre associé à la valeur propre z. On a / -i 0 0 1 \ ., .r 0 -i -1 0 M-^=\ 0 1 -i 0 \ -1 0 0 -i J On remarque que dans cette dernière matrice, la dernière colonne vaut i fois la première, c'est- à-dire qu'en sommant la première colonne à i fois la dernière, on tombe sur le vecteur nul. Autrement dit, (M — U4) f jj J = 0. De même, on trouve (M — 1I4) I 2^ ) = 0. On a donc £4 = Vect{(j),(_J,)} (ces deux vecteurs forment une famille libre de E^ donc une base de Ei car d'après la proposition 5, on a dimEi < 2). On en déduit en particulier que dimi^ = 2. En procédant de la même manière, on trouve que dim E-i = 2 et que £_< = Vect{ ( g J, Q }• D'après le théorème 2, M est donc diagonalisable et on a / >-i P~lMP = D avec D = \ i 0 0 0 i 0 0 0 -i 0 0 0 0 \ 0 0 "* / et F = / 1 0 0 1 \ 0 110 0 -i i 0 \ i 0 0 -i )
1. DIAGONALISATION, TRIGONALISATION 169 c) Ici Pm = —{X — 2>){X — 2)2. Comme Pm a une racine double, M n'est pas forcément diagonalisable. - Recherchons E3, le sous-espace propre associé à la valeur propre 3. La résolution du système MX = 3X montre que E3 = Vect{ (j ) }. - Recherchons E<i, le sous-espace propre associé à la valeur propre 2. La résolution du système MX = 2X montre que E2 = Vect{( 3 J}. Donc dimi?2 = 1 < 2, et donc M n'est pas diagonalisable. On va donc trigonaliser M. Désignons par B la base canonique de C3, et soit / € £(C3) telle que [f]B = M. Soit ei = (l)' e2=(!)' e3=(î)' La famille B' = (ei,e2,e3) est une base, et on a E3 = Vectei et E2 = Vecte2. On calcule les valeurs de / sur cette nouvelle base : /(ci) = 3ei, /(e2) = 2e2, /(c3) = (=3) = e2 - 6ci + 2e3, donc la matrice de / dans la base B* est / 3 0 -6 [f\B, = T = 0 2 1 \ 0 0 2 donc si P est la matrice de passage de la base B à la base B\ P = on a P"1[/]bP = [/]#', ou encore P~lMP = T. Au passage, on remarque que les termes de la diagonale principale de la matrice triangulaire T sont les racines du polynôme caractéristique de M, répétés avec la même multiplicité. Ceci est cohérent car T et M étant semblables, elles ont même polynôme caractéristique. d) Ici, PM = (1 - X)3. Un calcul donne rg(M - J3) = 2, donc dim£i = dim[Ker(M - J3)] = 3 - rg(M - I3) = 1. D'après le théorème 2, M n'est donc pas diagonalisable. Nous allons la trigonaliser. (C'est plus complexe qu'à la question précédente. Au c), on avait trouvé deux vecteurs propres indépendants. Il ne restait plus qu'à en trouver un troisième, formant une base avec les deux autres, puis à en exprimer l'image par M pour trigonaliser M. Ici il n'y a qu'un seul vecteur propre et cette méthode ne va pas fonctionner. Nous allons procéder comme dans la démonstration du théorème 3 de trigonalisation. Nous allons donner deux méthodes, correspondant chacune à l'une des deux démonstrations du théorème 3.) - Première méthode. On note B la base canonique de C3. Soit / € £(C3) telle que {f]B = M. On cherche un hyperplan stable par /. Soit B* la base duale de B, de sorte que ['/]#* = *M. On a Ptf = PtM = Pm = (1 — -X")3, 1 est donc valeur propre de */• Recherchons en un vecteur propre u. Si U désigne la matrice colonne de u dont les éléments sont les coordonnées de u dans la base B*, on a '/(«) = u <==> tMU = U. En résolvant le système tMU = U, on trouve que U = l 1 ) convient. L'orthogonal H de Cu dans C3 est stable par /. On a H = Keru = {( y J , —2x + y + z = 0}, dont B\ = (ei,e^) = (f o J , ( _i J) forme une base. On trouve /(ei) = —4ci - 5e2 et fiez) = 5ei + 6e2, donc [AhUi = ^ _5 = N. Au passage, on remarque que Pn = (X — 1) = Pf]H divise Pf, conformément à la proposition 2.
170 4. RÉDUCTIONS D'ENDOMORPHISMES Nous allons maintenant trigonaliser N. On recherche d'abord un vecteur propre de TV (qui est associé à la seule valeur propre 1). En résolvant NY = V, on trouve que Y = (\) convient, donc que f(e\ + e2) = e\ + e2. On pose ei = ei + e2 = ( j J et e2 = e2 = ( ^ J , de sorte que (e^, e'2) est une autre base de H. Un petit calcul donne f{e'l) = e[ et /(e^) = 5e[+e2. Si maintenant on pose e'3 = ( o ], B1 = (e[} e'2, e^) forme une base de C3 et /(eg) = — 3e7!—2e'2+e3, donc [/]**= I 0 1 -2 )=T = P-1[/]bP avec P = et donc T = P~lMP. - Seconde méthode. Commençons par rechercher un vecteur propre u\ pour / associé à la valeur propre 1. Un petit calcul devenu maintenant routinier montre que u\ = ( 1 ) convient. On pose maintenant u2 = ( i J et ^3 = [ 0 j, de sorte que Bq = (^1,^2^3) forme une base de C3. En exprimant les valeurs prises par / sur les vecteurs de Bq dans cette même base, on trouve t/u = Soit H = Vect(^2>^3) et soit p la projection sur H parallèlement à Cu\. Soit g = p o f\H e C(H). La matrice de g dans la base (^2^3) de H est ' 1 0 0 2 -1 2 -3 -2 3 A = M(tt2,tt3) = ( On a Pa = Pg = (X — l)2. Recherchons un vecteur propre de g associé à la valeur propre 1. On remarque que u'2 = ui — u% convient. On pose alors 1*3 = 1*2, de sorte que {v!2,u'3) forme une nouvelle base de H. Dans la nouvelle base B'0 = (ui,u2,u'3) de C3, on trouve 1 5 2 [/]*, = ( 0 1 -2 \=T = p-1[f}BP avec P = 0 0 1 Jo Donc T = P~lMP : on a trigonalisé M. On remarque au passage que les termes de la diagonale principale de la matrice triangulaire trouvée correspondent aux racines du polynôme caractéristique de la matrice M de départ. Remarque. Pour suivre correctement les deux méthodes exposées au d), il est bon de relire les démonstrations du théorème 3. Bien sûr, on ne retrouve pas les mêmes matrices triangulaires et de passage à l'arrivée selon la méthode utilisée (il n'y a pas unicité). Exercice 2. Soit E un K-e.v de dimension finie et / G C(E) un endomorphisme de rang 1. Donner une condition nécessaire et suffisante sur / pour que / soit diagonalisable. Que peut-on dire lorsque / n'est pas diagonalisable ? Solution. On note n = dim E. Par hypothèse, dim Ker f = n — rg/ = n — 1, autrement dit 0 est une valeur propre de / d'ordre n — 1, donc racine du polynôme caractéristique Pf de / d'ordre au moins n - 1. Par conséquent, il existe a e K tel que Pf = (-l)nXn~1(X -a). La somme des valeurs propres de / étant égale à la trace de /, on a a = tr/. Ainsi, si tr / ^ 0, / admet une valeur propre a ^ 0. Les sous-espaces propres E$ et Ea de / vérifient alors dim E0 + dim Ea = n donc / est diagonalisable.
1. DIAGONALISATION, TRIGONALISATION 171 Lorsque tr/ = 0, 0 est la seule valeur propre de /. Si / était diagonalisable, / serait nulle, ce qui est absurde. Finalement, / est diagonalisable si et seulement si tr/ ^ 0. Lorsque / n'est pas diagonalisable, c'est-à-dire lorsque tr/ = 0, on a f2 = 0. En effet. Soit ei G E tel que Im/ = Vectei. Complétons e\ en une base B = (ei,... ,en) de E. Dans cette base, la matrice de / a la forme \f)B = 0 0 0 \ 0 0 ••• 0 / Comme tr/ = ai = 0, on a [/]| = 0, c'est-à-dire /2 = 0. Exercice 3. Soient ai,... , an-i 6t &i,..., 6n-i des nombres réels, avec n > 3. Donner une condition nécessaire et suffisante pour que la matrice A = soit diagonalisable dans Mn ( \ 0 0 ai 0 61 \ 0 6n-l ûn-1 0 / eMn Solution. Si tous les a* sont nuls, A est une matrice triangulaire dont les valeurs propres sont données par ses éléments diagonaux, montrant ainsi que toutes les valeurs propres de A sont nulles. Si A est diagonalisable, A est donc nulle et tous les b{ sont nuls. De même, si tous les bi sont nuls et si A est diagonalisable, alors tous les ai sont nuls. Supposons maintenant les ai non tous nuls et les b{ non tous nuls. Alors le rang de A est 2, ce qui montre que 0 est valeur propre de A et que le sous-espace propre Eq associé est de dimension n — 2. Notons Ai, A2 G C les deux autres valeurs propres de A. La somme des valeurs propres de A est sa trace donc Ai + À2 = 0. Il nous faut un autre renseignement pour pouvoir évaluer Ai et A2. Pour cela, on remarque que les valeurs propres de A2 sont les carrés des valeurs propres de A (pour s'en persuader, trigonaliser A dans Mn(C)), donc Af + A2 = tr(A2). Un petit calcul donne tv(A2) = 2(^":T11 a{bi). Finalement on a montré Ai + A2 = 0 et 'n-l Ai + Ai = 2(^]ai6i (*) Si A = Ya=i ai h < 0> (*) montre que Ai et A2 ne peuvent pas être des nombres réels (et donc A n'est pas diagonalisable dans Mn(M)). Si maintenant A > 0, (*) montre que Ai = —A2 = \/Â. SiA = 0,Ai = A2 = 0etA n'est pas diagonalisable sinon A serait nulle (sa seule valeur propre est 0). Si A > 0, Ai et A2 sont réelles, distinctes et non nulles, et les sous-espaces propres E\iyE\2 associés sont de dimension 1. Dans ce cas, dimEq + dimE\t +dimi?A2 = n, donc A est diagonalisable dans Mn(^)- De tout ceci, le lecteur conclura facilement que A est diagonalisable dans Mn(R) si et seulement si A = 0 ou A = Ya=i ai bi > °- Exercice 4. Soit E un K-e.v de dimension finie n G N*. On considère une famille {fi)i^i d'endomorphismes de E commutant deux à deux. a) Si les fi sont diagonalisables, montrer que l'on peut les diagonaliser tous dans une même base.
172 4. RÉDUCTIONS D'ENDOMORPHISMES b) Si les fi sont trigonalisables, montrer que l'on peut les trigonaliser tous dans une même base. Solution, a) Procédons par récurrence sur n. Pour n = 1, c'est évident. Supposons le résultat vrai jusqu'au rang n — 1 et montrons le au rang n. Si tous les fi sont des homothéties, c'est terminé. Sinon il existe îq tel que fi0 n'est pas une homothétie. Si on note Exx,..., Exr ses sous-espaces propres, on a donc r > 2, et pour tout j, dirni*^ < n. Par ailleurs, d'après la proposition 7 page 166, pour tout j, E\j est stable par tous les /*, et chaque U\ex. est diagonalisable d'après la proposition 6. Donc d'après l'hypothèse de récurrence il existe une base Bj de E\j qui soit une base de diagonalisation de tous les f^Ex . Donc B = (f?i,..., Br) est une base de diagonalisation de tous les (/»)»€/. b) Commençons par montrer par récurrence sur n qu'il existe un vecteur propre commun à tous les (fi)iei. Pour n = 1, c'est évident. Supposons le résultat vrai jusqu'au rang n — 1 et montrons le au rang n. Si tous les fi sont des homothéties, c'est terminé. Sinon, il existe un endomorphisme / de la famille qui n'est pas une homothétie. Comme / est trigonalisable, / admet une valeur propre À, donc un sous-espace propre correspondant Ex- On a dimEx < n (car / n'est pas une homothétie) et Ex est stable par tous les fi. D'après l'hypothèse de récurrence, il existe donc un vecteur propre commun à tous les /î|ea, qui est bien sûr un vecteur propre commun à tous les Achevons la démonstration par récurrence sur n. Pour n = 1, c'est évident. Supposons le résultat vrai au rang n — 1 et montrons le au rang n. En appliquant le résultat précédent aux applications transposées lfi (elles commutent également et sont également trigonalisables puisque Ptf. = P/J, on voit qu'il existe x G E* un vecteur propre commun à tous les tfi. L'orthogonal H de Kx dans E est donc un hyperplan de E stable par tous les fi. D'après l'hypothèse de récurrence, il existe une base B de H trigonalisant tous les f^. Soit e G E tel que B1 = (B,e) forme une base de E. On a pour tout i G / X • • • (0) 0 ••• X X 0 X X X donc la base B' trigonalise tous les fi. Remarque. Dans cette dernière partie de b), nous avons utilisé une technique analogue à celle de la première démonstration du théorème 5. On pourrait également procéder comme dans la seconde démonstration de ce théorème. Exercice 5 (Lemme de Schur). a) Soit E un C-e.v de dimension finie. Soit Q c C(E) irréductible, c'est-à-dire que les seuls sous-espaces de E stables par tous les éléments de Q sont {0} et E. Montrer que les seuls éléments commutant avec tous les éléments de Q sont les homothéties. b) Si E est un M-e.v de dimension finie, montrer que le résultat est faux dans le cas général. Quand peut-on dire qu'il est vrai ? Solution, a) Soit / € C{E) commutant avec tous les éléments de Q. Le corps C étant algébriquement clos, / admet au moins une valeur propre À. Soit E\ le sous-espace propre correspondant. On a E\ ^ {0}. Par hypothèse sur /, pour tout g € Q,on&fog = gof. D'après la proposition 7 page 166, E\ est stable par tous les éléments de Q. Comme E\ ^ {0} et que Q est irréductible, ceci entraîne E\ = E. Donc / = À Id# est une homothétie. b) Sur un R-e.v, le résultat est faux dans le cas général. Par exemple, en dimension 2, l'ensemble Q des rotations (voir la remarque 1 page 257) est irréductible car aucune droite n'est stable par
1. DIAGONALISATION, TRIGONALISATION 173 toutes les rotations. Or tous les éléments de Q commutent avec tous les éléments de Q. Il existe donc des éléments de C(E) qui ne sont pas des homothéties qui commutent avec tous les éléments deQ. Cependant, si n = dirai? est impair, le résultat reste vrai. En effet, soit / G C(E) commutant avec tous les éléments de Q- Le polynôme caractéristique Pf de / est un polynôme réel de degré impair, donc Pf admet au moins une racine réelle À, donc / admet une valeur propre À. En procédant comme au a), on en déduit que / est une homothétie. Remarque. On en déduit que sur un C-espace vectoriel de dimension finie, les éléments commutant avec tout ceux de C(E) sont les homothéties. Ce résultat est un cas particulier du résultat de l'exercice 6 page 118 dans le cas où K = C. Exercice 6. Soit K un corps commutatif et A, B,C, D G Mn(K) telles que DC = CD. Montrer que det ( C DJ= det(AD ~ BCÏ> a) si D est inversible, b) si K est de cardinal infini. Solution, a) On part de la relation AD - BC BD~l \ _ ( AD-BC BD~l \ CD-DC In )-\ 0 In ) ' d'où l'égalité voulue en passant aux déterminants. b) Cette fois, D n'est pas supposée inversible. La matrice D n'ayant qu'un nombre fini de valeurs propres et K étant infini, il existe une partie infinie T de K telle que pour tout À G T, D — XIn soit inversible. D'après a), le polynôme P G K[X] défini par P(X) = det (ç D ^^ ) - det[A(D - XIn) - BC] s'annule sur tout À G T. Comme V est infini, P est nul et donc P(0) = 0, d'où le résultat. Remarque. En fait, si K est fini, le résultat reste vrai. En effet, K se plonge dans un corps infini L (prendre par exemple pour L le corps des fractions K(X)) et il suffît alors d'appliquer b) en remplaçant K par L. Exercice 7. Soit E un C-e.v de dimension finie n G N*. Si u,v G C(E), on pose [u,v] = uv — vu (crochet de Lie de u et v). Soient / et g G C(E). 1/ On suppose qu'il existe a G C* tel que [/, g] = af. a) Montrer que / est nilpotente. (Indication. On pourra calculer [fp,g] pour tout p G N*.) b) Montrer que f et g sont trigonalisables dans une même base. 2/ On suppose maintenant qu'il existe a, (3 G C* tels que [/, g] = af + /3g. Montrer qu'également, f et g sont trigonalisables dans une même base. Solution. 1/ a) Par récurrence sur p G N*, on obtient facilement [fp,g] = apfp. Comme Pendomorphisme de C[C(E)] défini par Lg: h\-> [h, g] n'a qu'un nombre fini de valeurs propres (on est en dimension finie) et que pour tout p G N*, Lg(fp) = apfp avec a ^ 0, on en déduit qu'il existe p G N* tel que fp = 0.
174 4. RÉDUCTIONS D'ENDOMORPHISMES b) Commençons par montrer que f et g ont un vecteur propre en commun. Le s.e.v Ker/ est stable par g car Vx G Ker /, f[g(x)} = g[f(x)} + af(x) = 0. Or / étant nilpotente, on a Ker/ ^ {0}. Le corps C étant algébriquement clos, on en déduit que p|Ker/ admet au moins un vecteur propre x. Le vecteur x est également propre pour / car x G Ker/. Ceci étant, montrons par récurrence sur n G N* que f et g sont trigonalisables dans une même base. Pour n = 1, c'est évident. Supposons le résultat vrai au rang n — 1 et montrons le au rang n. Comme fg — gf = a/, les applications transposées vérifient tftg — tgtf = (—a)lf. En appliquant le résultat précédent à */ et tg, on voit donc qu'il existe un vecteur propre x £ E* commun à */ et lg. L'orthogonal H de Cx dans E est donc un hyperplan stable par / et g. Or [Î\Hi9\h] = af\H> donc d'après l'hypothèse de récurrence il existe une base B de H dans laquelle f\H et 9\h se trigonalisent. Soit e G E tel que B' = (B, e) soit une base de E. Alors / [/]* = [Î\h]b \ X \ X / 0 ••• 0 donc la base B trigonalise /. On montrerait de même que la base B trigonalise g. 2/ On pose /' = / + {(3/a)g et on remarque que [f\g] = otf. D'après 1/ b), /' et g sont donc trigonalisables dans une même base. Il en est donc de même pour /' — (fi/a)g = f et g. 2. Polynômes d'endomorphismes Dans toute cette partie, E désigne un K-espace vectoriel de dimension finie n G N*. 2.1. Généralités Notation. Soit P = a0 + ai X H \-apXp e K[X], Conformément à la définition d'une fonction polynôme sur une K-algèbre (voir la partie 2.1 page 59), on définit les fonctions polynômes sur C(E) ou .Mn(K) comme suit : - Pour tout / G £(£), on note P(f) = a0 IdE +01/ + • • • + apfp G C(E). - Pour tout A G Mn(K)y on note P(A) = a0In + ai A H h apAp G Mn{K). Remarque 1. Si / G £(E), pour tous P, Q G K[X] on a P(f)oQ(f) = (PQ)(f). L'ensemble {P(f) | P G Kpf]} est une sous-algèbre commutative de C(E). - Un polynôme d'une matrice triangulaire est une matrice triangulaire. Plus précisément, si P G K[X] on a / ai x • • • x \ / P(ai) x • • • x \ M = 0 a2 V 0 0 x P(M) = 0 P(a2) x V o 0 P(an) ) En d'autres termes, si M est trigonalisable, les valeurs propres de P(M) sont les valeurs prises par le polynôme P sur les valeurs propres de M. Proposition 1. Soit f G £(E) et P e K[X] tel que P(/) = 0. Si X est valeur propre de f, alors P(À) = 0. Démonstration. Soit a;^0un vecteur propre de / associé à la valeur propre À. On a f(x) = À:r, donc 0 = P(f)(x) = P(X)x, d'où le résultat. D
2. POLYNÔMES D'ENDOMORPHISMES 175 Remarque 2. Attention, la réciproque est fausse. Par exemple, P = X(X — 1) annule Id^, et pourtant 0 qui est racine de P n'est pas valeur propre de Id#. —*- Théorème 1 (Décomposition des noyaux). Soit f e C(E) et P = Pi ■ ■ ■ Pk G K[X], les polynômes Pi étant premiers entre eux deux à deux. Alors Ker P(/) = KerPx(/) 0 • • • 0 Ker Pk(f). Démonstration. On procède par récurrence sur k > 2. - Pour k = 2 : P\ et P2 étant premiers entre eux, il existe (théorème de Bezout) U et V G K[X] tels que UPi + VP2 = 1. Soit x G KerPi(/) n KerP2(/). On a {UPi + VP2)(f)(x) = x, autrement dit x = U{f) o Pi(/)(*) + V{f) o P2(f)(x) = 0. Donc KerPi(/) n KerP2(/) = {0} (*). Soit x G KerP(/). Onaa; = UPi{f)(x) + VP2(f)(x) (**). Or W)[UPi(f)(x)] = UP!P2(f)(x) = U{f) o P(f)(x) = 0, donc UPi(f)(x) G KerP2(/). De même, VP2(f){x) G KerPi(/). De (**), on tire KerP(/) = KerPi(/) + KerP2(/), d'où le résultat pour k = 2 avec (*). - Supposons le résultat vrai au rang k et montrons le au rang k + 1. On a P = Q\Q2 avec Qi = Pi • • • P/j et Q2 = Pk+i- Les polynômes Q\ et Q2 sont premiers entre eux donc d'après le cas k = 2, KerP(/) = KerQi(/)0KerQ2(/), et d'après l'hypothèse de récurrence, KerQi(/) = ©f=1KerPj(/). Finalement, Ker P(/) = [KerPi(/) © • • • © Ker Pk(f)] © Ker Pk+1(f) = KevP^f) © • • • © KerPfc+1(/). □ Remarque 3. - Ce théorème est important. Il reste vrai en dimension infinie. - Il existe beaucoup d'autres résultats du même type. Par exemple, soit / G £{E)- Pour tout (p e K[X], on note 1^ = Im</?(/) et Nv = Kery?(/). Soient P,Q G K[X]. Alors si D =pgcd(P, Q) et M =ppcm(P, Q), on a NPC\NQ = ND, NP + NQ = NMt Ip + Iq = Id, IPr\IQ = IM. Ces résultats se généralisent par récurrence à k polynômes. —*■ Théorème 2. Soit f G £(E). L'endomorphisme f est diagonalisable si et seulement s'il existe P G K[X] scindé sur K ayant toutes ses racines simples tel que P(f) = 0. Démonstration. Condition nécessaire. Notons Ai,... ,Àr les valeurs propres (distinctes) de / et Exx,..., E\r les sous-espaces propres correspondants. Soit P = (X — Ai) • • • (X — Ar) G K[X]. Le polynôme P est scindé dans K[X] et a toutes ses racines simples. Par ailleurs, les polynômes (X — Xi) sont premiers entre eux deux à deux, donc d'après le théorème de décomposition des noyaux, r r KerP(/) = 0Ker(/ - XildE) = @EXi, z=l i=l donc KerP(/) = E car / est diagonalisable, c'est-à-dire P(f) = 0. Condition suffisante. Écrivons P = a(X — Ai) • • • (X — Xr) avec les X{ G K distincts et a ^ 0. Les X{ étant distincts, les polynômes (X — Xi) sont premiers entre eux deux à deux, donc d'après le théorème de décomposition des noyaux, E = Ker P(f) = Ker(/ - Ai ldE) 0 • • • 0 Ker(/ - Ar Id£). (*) Soit I = {i\ Ker(f — Xi Id#) ^ {0} }. Pour tout i e /, À; est valeur propre de / et E\{ = Ker(/- Xi Id#) n'est autre que le sous-espace propre correspondant. L'identité (*) s'écrit E = ®iejE\^ donc / est diagonalisable d'après le théorème 2 page 164. D
176 4. RÉDUCTIONS D'ENDOMORPHISMES Conséquence . Il découle de ce dernier théorème la proposition 6 page 164. En effet, soit / G C(E) diagonalisable et F un s.e.v de E stable par /. Il existe P G K[X] scindé sur K, à racines toutes simples, tel que P(f) = 0. Alors P(f\F) = 0> donc f\p est diagonalisable d'après le théorème 2. 2.2. Polynôme minimal Soit / G £(£), et soit I = {P e K[X] | P(f) = 0}. Le K-e.v C(E) est de dimension n2, la famille Id^, /,..., fn est donc liée. Autrement dit, il existe (ao,..., ani) ^ (0,..., 0) tel que a0 Id£ +axf + • • • + an2/n2 = 0. Donc si P = Y%10 (kX*, P(f) = 0. Donc / ^ {0}. On voit que / est un idéal de K[X]. L'anneau K[X] étant principal, il existe un unique P G K[X], P unitaire, tel que I = (P) = P • K[X]. Le polynôme P s'appelle le polynôme minimal de f. On le note II/. C'est le polynôme unitaire de plus bas degré annulant /, et si Q(f) = 0, alors 11/ | Q (car Qel = (II/)). Remarque 4. - En dimension infinie, cette définition reste valable à condition qu'il existe un polynôme non nul P tel que P(f) = 0 et P ^ 0. On dit alors que / admet un polynôme minimal. - En terme de polynôme minimal, le théorème 2 s'interprète comme suit : / est diagonalisable si et seulement si son polynôme minimal est scindé et a toutes ses racines simples. - Si F est un s.e.v stable par /, alors g = f\F vérifie : ïlg divise 11/ (en effet, 11/(g) = 0). Proposition 2. Soit f G C(E). Un scalaire X est valeur propre de f si et seulement si X est racine de son polynôme minimal II/. Démonstration. Condition nécessaire. Cela résulte de la proposition 1. Condition suffisante. Soit À une racine de II/. Soit P G K[X] tel que 11/ = (X—X)P. On a P(f) ^ 0 car 11/ est le polynôme minimal de f et degP < degll/. Or II/(/) = 0 = (f - XldE)P(f) = 0, et comme P(f) ^ 0, on en déduit que / — À Id# n'est pas injectif, donc que À est valeur propre de /. • □ Remarque 5. Le polynôme minimal de / a donc les mêmes racines que le polynôme caractéristique de /. 2.3. Théorème de Cayley-Hamilton Théorème 3 (Cayley-Hamilton). Soit f e C(E), Pf son polynôme caractéristique. Alors.Pf{f) = 0. Démonstration. Nous proposons deux démonstrations de ce théorème. Première démonstration. Soit A G Mn(K) la matrice de / dans la base canonique de Kn. Soit L le corps des racines de Pa = Pf- On regarde A comme une matrice de Mn(h). D'après le théorème de trigonalisation, il existe une matrice T = (Uj) G Mn(h) triangulaire supérieure et semblable à A : T = 0 y tn,n ) On a Pf = PT = (-l)nrfë=i(x - *t,t)- Soit (#1. • • • ,-En) la base canonique de Ln (Ek est le vecteur colonne dont tous les éléments sont nuls sauf le /c-ième qui vaut 1). Pour tout k, on pose Pu = Ili=i(^ — U,i)- Nous allons montrer par récurrence sur k G {1,... ,n} que pour tout * G {1,..., k}, [Pk(T)]Èi = 0. Pour k = 1, c'est vrai car TE\ = *i,i£i, donc (T - t\t\In)Ei = 0 = P\{T)E\. Supposons le résultat vrai au rang k — 1 et montrons le au rang k. On a pour tout i, 1 <t <fc-l, Pk(T)Ei = (T- tktkIn)Pk-i(T)Ei = 0,
2. POLYNÔMES D'ENDOMORPHISMES 177 et on a Pk(T)Ek = JVi(T) • (T - tk>kIn)Ek = Pfc-i(T) fc-1 / , U,kEi Li=l fc-1 = ^*i,*A-i(r)^ = o. i=l En particulier, avec k = n, on en déduit que pour tout i G {1,... ,n}, Pn{T)Ei = 0, donc Pn(T) = 0, c'est-à-dire PT(T) = 0, donc Pf(f) = 0. Seconde démonstration (elle ne fait pas appel au corps des racines d'un polynôme). Préliminaires. Soit / 0 • • • 0 -a0 \ 1 ••. : : A = \ g MP{K). '' • 0 —Op_2 (0) 1 -o„_i / Alors le polynôme caractéristique de A est ■Pa(X) = (—l)p(Xp + ap-\ Xp~1-\ l-ao) (pour cette raison, la matrice A est appelée matrice compagnon du polynôme Xp + ap-\Xp~l + -- + ao). Pour montrer ce préliminaire, nous procédons par récurrence sur p. Pour p = 1, c'est évident. Supposons le résultat vrai au rang p, montrons le au rang p + 1. En développant par rapport à la première ligne, on a Pa(X) = -X 1 (0) -ao (0) — X —CLp-l 1 -X-ar -X 1 = -X (0) (0) -X 1 -ai —ap_i —X — aT + (-l)p+1ao 1 0 0 -X 1 (0) 0 -X 1 et donc d'après l'hypothèse de récurrence PA(X) = {-l)p+1X{Xp+apXp-1+. • .+a!)+(-l)P+1a0 = {-l)p+1{Xp+1+apXp+- • •+a1X+a0). Démontrons maintenant le théorème. Soit x G E, x ^ 0. Il existe un plus petit entier p > 0 tel que la famille (x,f(x),...,fp(x)) soit liée. La famille (x, f(x),..., /p-1(x)) est donc libre et (3oo, • • • ,Op_i G K), /p(z) + ap-i/P"1^) + • • • + a0x = 0. (*) Complétons (x, f{x),..., /p-1(#)) en une base B de E. Alors on a la forme par blocs / 0 • • • 0 -ao \ [/]* = 0 C avec A = 1 V (0) 0 — ap-2 1 -ap-\ ) Comme Pf = PaPc, on a Pf(f)(x) = Pc{f) ° Pa(/)(^). Or d'après le préliminaire et d'après M, PA(f)(x) = fp(x) + ap-xfp-\x) + • • • + a0x = 0, donc Pf(f)(x) = 0. Ceci est vrai pour tout x donc Pf{f) = 0. □ Remarque 6. - En d'autres termes, le théorème dit que le polynôme minimal de / divise son polynôme caractéristique. Avec la proposition 2, on en déduit que si ^/ = (-l)nII(*-Ai)ri' alors n/ = JI(X-A<)*J l<qi<ri. i=l i=l
178 4. RÉDUCTIONS D'ENDOMORPHISMES - Ce théorème permet, avec la proposition 3 d'affirmer que / G C(E) est nilpotent si et seulement si Pf = (-l)nXn. 2.4. Exercices Exercice 1. Soit E un K-e.v et f e C(E) admettant un polynôme minimal. Si / est inversible, montrer que f~1 est un polynôme en /. Solution. Montrons déjà que X ne divise pas le polynôme minimal 11/ de /. En effet, s'il existe P G K[X] tel que Uf = XP, alors 0 = Uf(f) = / o P(f), et comme / est inversible, P(f) = 0. Comme degP < degll/, ceci contredit le fait que 11/ est le polynôme minimal de /. Donc X \ II/. Comme X est irréductible, X et 11/ sont premiers entre eux, donc il existe U, V G K[X] tels que UX + VUf = 1, d'où on tire U(f) o / + V(f) o Uf(f) = Id£, c'est-à-dire [/(/) o / = IdE. Donc /-1 = £/(/), d'où le résultat. Remarque. En dimension finie, on aurait pu raisonner avec le polynôme caractéristique Pf de / : comme P/(0) = det / ^ 0, on a X \ Pf et on procède ensuite comme plus haut. - On peut également donner une forme explicite d'un polynôme U tel que /_1 = U(f) en fonction du polynôme minimal : il suffit de prendre U = (11/(0) — ïlf(X))/(îlf(0)X). Exercice 2. Soit K un corps commutatif fini à q éléments, E un K-e.v de dimension finie et / G C(E). Montrer que / est diagonalisable dans E si et seulement si fq = f. Solution. Commençons par montrer Xq-X=\[{X-a). (*) Muni de la loi produit, 1K* est un groupe multiplicatif à q — 1 éléments, donc pour tout & £ K*, xq~l = 1, d'où pour tout x G K, xq = x. On a ainsi déterminé q racines distinctes du polynôme Xq — X qui est de degré q, d'où (*). Concluons. D'après le théorème 2, on peut affirmer que / est diagonalisable si et seulement s'il existe P G K[X], scindé sur K, à racines toutes simples, tel que P(f) = 0, autrement dit si et seulement s'il existe P G K[X], P | Ua€K{X - a) = Xq - X tel que P(f) = 0. En d'autres termes, / est diagonalisable si et seulement si fq — f = 0. Exercice 3. Soient E un K-espace vectoriel et f e C(E) admettant un polynôme minimal Uf. Pour tout x e E, on note Px le polynôme unitaire de K[X] de plus bas degré tel que Px(f)(x) = 0 (Px s'appelle le polynôme minimal de x relatif à /). 1/a) Montrer que Px existe et est unique, et que si P(f)(x) = 0 avec P G K[X], alors P*\P. b) Montrer que Ex = {P(f)(x) \ P G K[X]} est un s.e.v de dimension deg^). 2/ a) Si Exn Ey = {0}, montrer que Px+y = ppcm (Px,Py). Généraliser à p vecteurs 3?1, . . . , Xp. b) Si Px et Py sont premiers entre eux, montrer Ex+y = Ex®Ey. Généraliser à p vecteurs X\, . . . , Xp. 3/ a) Soit M G K[X] un facteur irréductible de II/, a sa multiplicité dans la décomposition de 11/ en facteurs irréductibles de K[X]. Montrer qu'il existe x G KerMa(/) tel que Px = Ma. b) Montrer qu'il existe x G E tel que Px = II/.
2. POLYNÔMES D'ENDOMORPHISMES 179 Solution. 1/ a) Soit Ix = {P G K[X] \ P(f)(x) = 0}. C'est un idéal de K[X], non réduit à {0} car 11/ G Ix. Il existe donc un unique polynôme unitaire Px G K[X] tel que Ix = (Px). Ainsi, Px est le polynôme unitaire de plus bas degré tel que Px(f)(x) = 0. Si maintenant P(f)(x) = 0, alors on a P G Ix = (Px), donc Px | P. b) L'application linéaire (p: K[X\-+EX P~P(f)(x) est surjective. On en déduit que le s.e.v Ex est isomorphe à K[X]/Ker<p = K[X]/(PX), donc de dimension deg(Px). 2/ a) Comme Px+y(f)(x + |/) = 0, on a Pa.+y (/)(#) = —Px+y(f)(y)• Ces deux termes sont donc éléments de Ex D Ey = {0}, donc nuls. Donc d'après 1/ a), Px \ Px+y et Py | Px+y, d'où ppcm (Px, Py) |Px+y (*). Or Px | ppcm (Pc, Py) donc ppcm (P^Py )(/)(#) = 0. De même, ppcm (Px,Py) (f)(y) = 0, donc ppcm(PX) Py){x + y) = 0. Donc Px+y | ppcm (Px,Py), ce qui d'après (*) entraîne Px+y = ppcm (Pc, Py), ces deux polynômes étant unitaires. - Par récurrence sur p, on montre maintenant facilement que si EXl,..., EXp sont en somme directe, alors PXl+...+Xp = ppcm (PXl,..., PXp). b) Montrons tout d'abord que Exf\Ey = {0}. Soit z e Ex n Ey. l\ existe P,Q G K[X] tels que z = P(/)(*) = Q(/)(</).Or 0 = P(f) o Px(f)(x) = (PPx)(f)(x) = Px(f) o P(f)(x) = Px(f)(z) = (PxQ)(f)(y), donc d'après 1/ a), Py \ PXQ. Or Px et Py sont premiers entre eux, donc d'après le théorème de Gauss, Py | Q, et donc z = Q(f){y) = 0. Ainsi, on a bien Exf)Ey = {0}. - D'après 2/ a), on a donc Px+y = ppcm (Px,Py) = PxPy, d'où dimKc+y = deg(Pc+y) = deg(Px) + deg(Py) = dirn^ + dim Ey. (*) Par ailleurs lorsque P G K[X]t l'égalité P(f)(x + y) = P(f)(x) + P{f)(y) entraîne l'inclusion Ex+y cEx + Ey = Ex® Ey, donc d'après (*), Ex+y = EX® Ey. Par récurrence sur p, on montre maintenant facilement que si PXl,..., PXp sont premiers entre eux deux à deux, alors EXl+...+Xp = EXl © • • • © EXp. 3/ a) On peut écrire 11/ = MaN où N e K[X] est premier avec M (donc avec Ma). D'après le théorème de décomposition des noyaux, on a E = Ker Ma{f) © Ker N{f). (**) Pour tout x G KerMa(/), on a Ma(f)(x) = 0, donc d'après 1/ a), Px \ Ma et comme M est irréductible, il existe /3X < a tel que P^ = M&x. Il s'agit de montrer qu'il existe x G KerMa(/) tel que /3X = a. Raisonnons par l'absurde et supposons le contraire, de sorte que pour tout x G KerMa(/), Px \ M""1, i. e. Ma-1{f)(x) = 0, autrement dit KerMa(/) = KerM*-^/). D'après (**), E = KerMa_1(/) ©KeriV(/) ce qui d'après le théorème de décomposition des noyaux entraîne Ker(Ma-1iV(/)) = E, ou encore Ma~1N(f) = Q(f) = 0, ce qui contredit la minimalité du degré du polynôme minimal 11/ de / car degQ < degll/. Donc il existe x G KerMa(/) tel que Px = Ma. b) Soit 11/ = IliLi-M?* la décomposition de 11/ en facteurs irréductibles de K[X]. D'après la question précédente, pour tout i, il existe xi G Ker M"'(/) tel que Px. = M?*. D'après la question 2/ b), on a donc EXl+...+Xk = EXl © • • • © EXfc, et donc d'après la question 2/ a), on a k k pxl+...+Xk = l[pXi = l[M«i = nf, i=l i=l d'où le résultat.
180 4. RÉDUCTIONS D'ENDOMORPHISMES Exercice 4 (Diagonalisation d'un déterminant circulant). On considère la matrice circulante ( a\ û2 • • • a>n \ A = an a\ e Mn(C). : * • * • û2 \ a2 ••• an ai ) En exprimant A comme un polynôme en la matrice /O 1 (0) \ J = 0 '-. 1 V î o ••• o ) G Mn(C), diagonaliser A. Solution. Si B = (ei,... ,en) désigne la base canonique de Cn, J est la matrice de Pendomor- phisme qui à ei associe e^-i si i > 2, et à e\ associe en. Pour tout p, 1 < p < n — 1, Jp est donc la matrice qui à e* associe ei_p si i > p, à e* associe ei+n-p si i < p, autrement dit Vp, 1 < p < n - 1, Jp = On en déduit que pour tout ai,..., an € C, / ai a2 i=l a ai V <*2 a 0 /„_, /» 0 an \ &2 ai / n Ceci montre en particulier que A = P{J) où P = YA=\aiXx~l- Ceci montre également que si Q G K[X], Q ^ 0 et degQ < n, alors Q(J) ^ 0. Le polynôme minimal de J vérifie donc degllj > n. Or Jn — / = 0, on a donc IIj = Xn — 1. Or IIj divise le polynôme caractéristique Pj de J et degPj = n, donc Pj = (-l)nUj = (-l)nnï=o(x ~ w*)» oùw = e2Wn- D'après le théorème 2, J est donc diagonalisable, et il existe Q € £^n(Q telle que / 1 >-i Q~lJQ = U) 0 \ 0 \ u n-l On en déduit / P(l) 4-1 -1 Q~lAQ = Q-lP{J)Q = P{Q~lJQ) = P(u) 0 \ 0 \ Piu"-1) ) Remarque. On retrouve ainsi le résultat de l'exercice 12 page 146. Exercice 5. Donner une condition nécessaire et suffisante sur A G Mn(K) pour que la A A matrice par blocs B = 0 A G M2nfâ) soit diagonalisable.
2. POLYNÔMES D'ENDOMORPHISMES 181 Solution. Notons F le s.e.v de IK2n engendré par les n premiers vecteurs de la base canonique de K2n. Le s.e.v F est stable par B. Si B est diagonalisable, sa restriction à F, qui n'est autre que A, est diagonalisable. Allons plus loin. Si B est diagonalisable, il existe un polynôme P G K[X], scindé sur K, dont toutes les racines sont simples, tel que P(B) = 0. Par récurrence sur fc, on a facilement / Ap vAp \ Bk = ( n aP ) pour tout fc G N. De ceci, on déduit o-^-(T W) donc P(A) = AP'(A) = 0. Comme P(A) = 0, on retrouve le fait que A est diagonalisable. Soit A une valeur propre de A. Comme AP'(A) = 0, on a XP'(X) = 0. Or À étant racine simple de P, on a P'(X) 7^ 0, donc À = 0. En résumé, A est diagonalisable et À = 0 est la seule valeur propre de A, autrement dit, A = 0. Réciproquement, si A = 0, B est diagonalisable. Finalement, B est diagonalisable si et seulement si A = 0. Exercice 6 (Commutant d'un endomorphisme). Soit E un K-espace vectoriel de dimension finie n G N*. Soit / G C(E). On note Vf le s.e.v de C(E) défini par rf = {geC(E)\fog = gof}. 1/ a) Si / est diagonalisable, déterminer dimT/. b) Si de plus les valeurs propres de / sont toutes distinctes, montrer que T/ = {P(f) | P G K[X]}. 2/ On suppose que le polynôme minimal 11/ de / est de degré n. En utilisant le résultat établi à l'exercice 3 (il existe x G E, Px = II/), montrer que T/ = {P(/), P G K[J£]}. Solution. 1/ a) Soient Ai,..., Àr les valeurs propres de /, E\x,..., E\r les sous-espaces propres correspondants. Si g G T/, alors pour tout z, E\. est stable par g. Réciproquement, si E\{ est stable par g pour tout z, alors : \/xeEXi, / o p(œ) = Aip(x) =go f(x), donc comme i? = E\x 0 • • • 0 E\r, on a p G T/. Donc r/ = {g G £(£) | Vz,^ est stable par p}. Pour tout z, soit 5; une base de E\iy de sorte que B = B\ U • • • U Br est une base de S. Les matrices des endomorphismes de T/ dans la base B sont celles de la forme Mi 0 \ avec Vz, Mi G ^Wdim ea. (K). 0 Mr ) On voit donc que dimT/ = Z)[=i(^m^Ai)2- b) Nous donnons deux méthodes de résolution. Première méthode. Ici, pour tout z, on a dimi^ = 1, donc dimT/ = Ya=i l2 = n- Pour tout z, 11/(Xi) = 0 donc (X — Xi) | II/, et comme les À; sont distincts deux à deux, IliLiC^" ~ ^i) divise II/, donc deg(Il/) > n. Or 11/ divise le polynôme caractéristique de /, donc deg(II/) < n. On en déduit deg 11/ = n. Soit C = {P(f) | P G K[X}}. L'application (p : K[X] -+C P •-> P(/) est linéaire surjective, donc C est isomorphe comme K-e.v à K[X]/Ker(p = K[X]/(Uf)y donc dimC = deg(II/) = n. Or C C T/ et dimT/ = n, donc C = Tf.
182 4. RÉDUCTIONS D'ENDOMORPHISMES Seconde méthode. Pour tout z, d\mExi = 1 donc il existe X{ G E tel que E\i = Vect(xi). Soit g e Tf. Pour tout z, £^. est stable par g e Vf, donc il existe fa € K tel que #(£;) = faX{ (au passage, on remarque que, (x\}..., xn) étant une base de Ey g est diagonalisable). La théorie des polynômes d'interpolation de Lagrange (voir le chapitre II page 61) nous assure l'existence d'un polynôme P tel que P(Xi) = fa pour tout i. Ainsi, Vz G {1,..., n}, P(f)(xi) = P(Xi)xi = faxi = g(xi) et comme (xi,... yxn) est une base de E, P(f) = g. Donc Vf C {P(f) \ P G IK[X]}. L'inclusion réciproque étant immédiate, on en déduit le résultat demandé. 2/ On utilise les notations de l'exercice 3. D'après la question 3/ b) de l'exercice 3, il existe x G E tel que Px = II/, donc deg(Px) = n et d'après la question 1/ b) du même exercice, dimEx = deg(Px) = n donc Ex = E. Soit g e Tf. Comme Ex = E, il existe P G K[X] tels que g(x) = P(f)(x). Or pour tout y = Q(f)(x) e Exy 9(y) = 9 o Q(f)(x) = Q(f) o g(x) = Q(f) o P(f)(x) = P(f) o Q(f)(x) = P(f)(y). Les endomorphismes g et P{f) prennent donc la même valeur sur Ex. Or Ex = E, donc g = P(f). On a donc montré que Vf C {P(f) \ P G K[X]}. L'inclusion réciproque est évidente, d'où l'égalité. Remarque. On aurait pu montrer 1/ b), en utilisant 2/ car on avait montré que deg(Il/) = n dans la première méthode. - La réciproque de la question 2/ est vraie : si T/ = {P(f) \ P G K[X]}, alors deg(II/) = n, mais la démonstration est plus difficile (voir la dernière application de la théorie des invariants de similitude dans l'annexe B page 292). 3. Topologie sur les endomorphismes Dans toute cette partie, E désigne un K-espace vectoriel norme (avec K = R ou C). Nous commençons par donner quelques rappels (l'étude générale des espaces vectoriels normes est traitée dans le chapitre de topologie du tome d'analyse). L'espace vectoriel des endomorphismes continus de E est noté CC(E). On norme habituellement CC(E) par : V/ G CC(E), ll/l = supua;^! ||/(a;)||. C'est une norme d'algèbre (i. e. elle vérifie |||/ • #|| < l/l • I(/|||). Enfin, en dimension finie, tout endomorphisme est continu et toutes les normes sont équivalentes. 3.1. Quelques normes classiques en dimension finie Soit X = l : 1 un vecteur de Kn. Pour tout a > 1, ii*ii«= En* et ii*n°°= sup m définissent des normes sur Kn. (La notation ||^||oo provient du fait que lima-^oo \\X\\a = \\Y\\ \ llA lie»;- Si E est un K-e.v de dimension finie n, on peut le normer en privilégiant une base B de E et en écrivant que la norme de x £ E est la norme du vecteur X = l : 1 G Kn, où les Xi sont les coordonnées de x dans la base B. Soit M = {rrn^i^n G Mn(K).
3. TOPOLOGIE SUR LES ENDOMORPHISMES 183 ~~ 11^11 = J2i<i,j<n \mi,j\ définit une norme d'algèbre sur Mn(K). - ||M|| = suipij \mij\ définit une norme sur Mn{K), mais ce n'est pas une norme d'algèbre. - Pour tout a > 1, ||M|a = sup||X||Q=1 ||AOr||Q définit une norme d'algèbre sur Mn(K). Au passage, notons que l'on peut montrer JM^ = sup^J^. \rriij\) et |Mli=*»pj(E,K,|). Si E est un K-e.v de dimension finie n, on peut normer C(E) en privilégiant une base B de E et en écrivant que la norme de u est celle de [u]b (matrice de u dans la base B) dans Mn(K). 3.2. Propriétés Proposition 1. Soit E un K-e.v.n et f e CC(E). Soit X une valeur propre de f. Alors |A| < ll/ll • Démonstration. Soit x ^ 0 un vecteur propre de / pour la valeur propre À. On a ||/(x)|| < Il/Il • H- Or \\f(x)\\ = \\Xx\\ = \X\ • Ilxll, donc |A| < |/|. D Proposition 2. L'ensemble Ç£n(K) est un ouvert dense dans Mn(K). Démonstration. L'application Mn(K) —> K M ■—► detM est continue (car detM s'exprime comme un polynôme en les coefficients de M). L'ensemble K* est ouvert dans K, donc Ç£n{K) = (det)_1(K*) est ouvert. Densité. Soit M G A/fn(K). Le polynôme caractéristique Pm de M n'a qu'un nombre fini de racines, donc 3/9 > 0 tel que VA e K, 0 < |A| < p, PM(X) ^ 0. En d'autres termes, pour tout A G K, 0 < |A| < p, M-XIn £ Ç£n{K). Or M = linu_o(M- A/n). M est donc limite d'éléments de Ç£n(K). D Remarque 1. - Ce dernier résultat est important. Il est parfois aisé de montrer des propriétés sur jMn(K) en les montrant d'abord sur Ç£nfâ) puis en les étendant par densité (voir les exercices). - Cette dernière proposition est également vraie pour les endomorphismes en dimension finie. De manière générale, algébriquement et topologiquement, tout ce qui est vrai pour les matrices est vrai pour les endomorphismes (en dimension finie) et réciproquement. - En dimension infinie, Ç£C(E) est ouvert si E est un espace de Banach (voir le chapitre topologie du tome d'analyse). 3.3. Séries entières d'endomorphismes Ici, E désigne un K-espace de Banach. Rappelons que dans ce cas, CC(E), muni de la norme ||/| = sup^^ ||/(x)||, est un K-espace de Banach. PROPOSITION 3. Soit z i-» J^nS)0»*" ^a somme d'une série entière de rayon de convergence 0 < R < +00. Alors si f e CC(E), ||/|| < R, la série X)n€Na^/n converge et sa somme est élément de CC(E). De plus, l'application +oo r = {/ € CC{E) | l/ll < R} -» CC{E) / ~ £ a, /" 71=0 est continue. Démonstration. Comme CC(E) est un IK-espace de Banach, il suffit de montrer que si |/| < i?, la série J2anfn converge absolument, ce qui est immédiat puisque |an/n| < \an\ • |/|n et que E \an\ l/IIP converge. La somme X^S an fn existe donc et appartient à CC(E).
184 4. RÉDUCTIONS D'ENDOMORPHISMES Pour tout r G ]0, R[, on pose rr = {/ G CC(E) | |/|| < r}. La série de fonctions f >->J2anfn converge normalement sur Tr, puisque sur Tr, ||an/n| < |an|-|/|n < \an\rn et X) \a>n\rn converge. Chacun des termes / *-> anfn est continu sur Yr. On en déduit que / ■-» Ylm=o an fn es* continue sur rr, et ceci pour tout r G ]0, R[, donc sur T. □ Remarque 2. - Un résultat plus fin fait l'objet du problème 6 (page 210). - La proposition 3 reste vraie sur .Mn(K). Conséquence . Soit / G CC(E), |/| < 1. Alors IdE-f est inversible, et son inverse est g = J2tS) fn- En effet, g existe d'après la proposition précédente et (Id# — f)g = g — fg = EnS fn ~ EnZ fn = M* 5 de même, g(IdE -f) = ldE. Exponentielles d'endomorphismes. DÉFINITION 1. Soit / G CC(E). D'après la proposition 3, +oo 1 n=0 existe et g G CC(E). L'endomorphisme g s'appelle l'exponentielle de / et on note g = exP(/) = ef- Remarque 3. - On a ||| exp(/)| < e^™. En effet, pour tout n G N, Z-kV - ^ k\ et le résultat se déduit en faisant tendre n vers +oo. - D'après la proposition 3, l'application CC(E) —> CC(E) f i-> exp(/) est continue. Proposition 4. Soit u G CC(E). Soit v G CC(E) inversible avec v'1 G CC(E). Alors exp(i>-1m;) = i>_1 exp(u)v. Démonstration. Il suffit de remarquer que pour tout n G N on a (v~1uv)n = v~1unv) ce qui entraîne +2^ (v-luv)n t^v~lunv _ fï^un\ exp^m;) = J2 -y = 22—nl—=v \YI^TIV = V leMu)v- n=0 ' n=0 ' \n=0 ' / D La version matricielle de ce résultat est VM G Mn(K), VP G ^n(K), exp(p-1MP) = P~l exp(M)P. Deux matrices semblables ont donc des exponentielles semblables. Proposition 5. Soient u,v G Cc(E) tels que uv = vu. Alors exp(w + v) = exp(u) exp(v) = exp(t;) exp(tt). Démonstration. La série X)n(w +v)n/n! est en fait un produit de Cauchy des deux séries ^ ul/i\ et J2j rf/JU dont nous redémontrons ici la convergence. On pose n i \ / n 4 \ n ^.■EïE -E (u + v)h .1=0 / \j=0 J ) k=0 Il faut montrer que limn^+0O An = 0. Comme u et v commutent, on a i+j=n i+j=n
3. TOPOLOGIE SUR LES ENDOMORPHISMES 185 donc Ï3>> i+j<n n+l<i+j<2n d'où on tire lAnll < £ n+l<i+j<2n 0<i,j<n M t! III7 / u f=te n h n EtJl -E ,i=0 3=0 fc=0 NI + M k\ Lorsque n tend vers +oo, ce dernier terme tend vers e^'eM — e't*l+"t'l = 0, donc limn_»+00 An = 0, d'où exp(w + v) = exp(u) exp(v). On a de même exp(v) exp(w) = exp(t> + u) = exp(w + v). D Conséquence . Pour tout u G CC(E), eue~u = e~ueu = eu~u = e° = Id^, donc eu est inversible et (eu)_1 = e_w. Remarque 4. - Si « et v ne commutent pas, la proposition précédente est fausse en général. - Si u et v commutent, alors u et exp(i>) commutent. - On a souvent affaire aux exponentielles de matrices lors de l'étude des équations différentielles linéaires (voir le tome d'analyse). En effet, les exponentielles de matrices vérifient les propriétés suivantes : - Soit A G A^n(K). L'application R —> A4n(K) t »-> etA est dérivable, sa dérivée est AetA. - Si X : M -> Kn est dérivable et si ^ = AX, alors pour tout t eM, X(t) = etAX(0). - Le calcul d'exponentielles de matrices est traité à la partie 3 page 196 du présent chapitre. 3.4. Exercices Exercice 1 (Densité des matrices diagonalisables dans Mn(C)). a) Montrer que l'ensemble des matrices diagonalisables de Mn(C) est dense dans Mn{C). b) Que dire dans Mn(m ? Solution, a) Soit A G .Mn(C). Il s'agit de montrer que A est limite de matrices diagonalisables. Le corps C étant algébriquement clos, A est trigonalisable, donc 3PeÇen(C)t P~1AP = T avec T = I Ai x A2 0 x \ x An ) Soit fi = inf{|Ài — Xj\, X{ ^ Xj} > 0, fj, = 1 si les À^ sont tous égaux. Pour tout p 6 N*, on pose /Ai + g Tp = X X \ A2 + ^- 2p (0) \ An+^y / 1 1 2 (0) \ V (0) h ) Les valeurs propres de Tp, les À; + (/i/ip), sont deux à deux distinctes. En effet, supposons i ^ j : - Si Ai = Àj, il est clair que À; + (fJ>/ip) ^ \j + (y>/jp)- - Sinon À; ^ À^, donc si À; + (/i/ip) = À^ + (/i/jp), alors |A» - Àj| = /x|(l/îp) - (l/jp)| < M, absurde par construction de /i.
186 4. RÉDUCTIONS D'ENDOMORPHISMES Pour tout p G N*, Tp ayant toutes ses valeurs propres deux à deux distinctes est donc dia- gonalisable. Or T = limp_>+00Tp, donc A = PTP~l = Y\mp^+00 PTvP~l est limite de matrices diagonalisables, d'où le résultat. b) Dans Mn(R), le résultat est faux. Nous donnons un contre-exemple. Soit A = (Ç ~^) g M2{R)- On considère l'application A: M2 R M ^M où Am désigne le discriminant du polynôme caractéristique Pm de M. Comme A^ s'exprime comme un polynôme en les coefficients de M, A est continue. Si A était limite d'une suite (An) G A^2(^)N de matrices diagonalisables dans M2(R), on aurait An > 0 pour tout n (car Pah est scindé sur R), et donc A étant continue, A a = limn^+00 AAn > 0, ce qui est absurde car après calculs on trouve A a = — 4. Remarque. Grâce au résultat a), on peut parfois prouver certains résultats sur .Mn(C) en les montrant d'abord pour les matrices diagonalisables, puis en les étendant par densité. Le lecteur pourra par exemple démontrer par cette méthode le théorème de Cayley-Hamilton pour les matrices complexes. - Si A G Mn(R) est trigonalisable, alors A est limite d'une suite de matrices diagonalisables de Mn(R) (la solution de la question a) ne repose en effet que sur l'hypothèse que A est trigonalisable et reste valide dans notre cas). Exercice 2. a) Soit n G N* et A G Mn(C). Montrer que det(exp(i4)) = exp(tr(i4)). b) Soit M G A^n(R). Montrer que si M est l'exponentielle d'une matrice réelle, alors det(M) > 0. Montrer que la réciproque est fausse (indication : montrer que la matrice M = (~q _\) n'est pas un carré) Solution, a) Le corps C étant algébriquement clos, on peut trigonaliser la matrice A, donc x \ BPG^n(C), A = P~1TP avec T = \ 0 x An / La matrice Tk est une matrice triangulaire supérieure dont les coefficients diagonaux sont les Af, donc / \k x X \ / ^Ai \k A2 : +oo - +oo - exp(r) = £>= = £! fc=0 fc=0 k\ 0 \ x A„ n } X 0A2 \ 0 V x I Ceci entraîne n n det(exp(T)) = J^[ eAi = exp ^ Af = exp(tr(T)). i=l vi=l Comme A et T sont semblables, il en est de même de exp(A) et exp(T), et on en déduit det(exp(;4)) = det(exp(T)) = exp(tr(T)) = exp(tr(A)). b) Si M = exp(A) avec A G Mn(R)> alors on a det(M) = exp(tr(A)) d'après le résultat précédent, donc det(M) > 0 car tv(A) est un nombre réel. La réciproque est fausse, comme le montre le contre-exemple de la matrice M = (~q }1). Si M était l'exponentielle d'une matrice
3. TOPOLOGIE SUR LES ENDOMORPHISMES 187 réelle A, la matrice réelle N = exp(^A) vérifierait N2 = exp(A) = M. Or ceci est impossible car en écrivant N = ( ° bd ), on aurait M_(-l 1\_ M2_fa2 + bc ab + bd\ M~[0 -l)~N -\ca + dc cb + d2)' Ceci entraîne 1 = b(a + d), donc a + d est non nul. Les termes inférieurs gauches donnent 0 = c(a + d), donc c = 0. L'égalité des termes diagonaux donneraient alors a2 = — 1 et d2 = —1, ce qui est impossible puisque a et d sont des nombres réels. Ainsi, la matrice M a bien un déterminant positif (on a det(M) = 1) mais cette matrice réelle n'est pas l'exponentielle d'une matrice réelle. Remarque. On peut montrer qu'une matrice réelle est l'exponentielle d'une matrice réelle si et seulement si elle est le carré d'une matrice réelle inversible. - Toute matrice complexe inversible est l'exponentielle d'une matrice complexe (voir l'exercice 5 page 202). Exercice 3.1/ Soit K un corps commutatif. Soient A, B G Mn(K). a) Si A G £^n(K), montrer que Pab, le polynôme caractéristique de AB, est égal à celui de B A, PBA. b) Si A est quelconque et K = R ou C, montrer, en utilisant un argument de densité, que le résultat reste vrai. c) Si A est quelconque et K est infini, montrer que le résultat est encore vrai. 2/ K est un corps commutatif quelconque. Soient p,q G N*. Soit A G MPiq(K) et B e MqiP(K). Comparer PAB et PBa- Solution. 1/ a) Il suffit de remarquer que les matrices AB et BA sont semblables, comme le montre la relation BA = A~~1(AB)A, elles ont donc même polynôme caractéristique. b) On sait que Ç£n(K) est dense dans Mn(K) (voir la proposition 2). On peut donc écrire A = limn^+00 An avec pour tout n, An G Çt,n(K). Or d'après a), pour tout n, Paub = Pbau e* Par continuité de l'application déterminant, en faisant tendre n vers +oo, on en déduit Pab = Pba- c) Le corps K étant infini, A n'ayant qu'un nombre fini de valeurs propres, il existe T C K, T infini, tel que pour tout À G T, À n'est pas valeur propre de Ay i.e A — \In G Ç£n(K). Fixons x G K. D'après 1/ a), on a VA G T, P{A-\in)B(x) = PB(A-\in)(x)- Le polynôme P(A-xin)B(x) — PB(A-xin)(x) e K[X] s'annule donc sur T, donc est nul puisque T est infini. En particulier, ce polynôme s'annule lorsque X prend la valeur 0, c'est à dire Pab(x) = Pba(x)- Ceci étant vrai pour tout x G K, on en déduit, K étant infini, que Pab = Pba- 2/ Soit r = rgA. Supposons dans un premier temps que r > 0. On sait que A est équivalente à la matrice ( gr q)> c'est-à-dire 3P G 0*P(K), 3Q G Glq(K), A = F"1 f Qr Mq. Écrivons où Bi e Mr(K). On a
188 4. RÉDUCTIONS D'ENDOMORPHISMES d'où Pab = B\ — X Ir 0 £3 .A ip—r = (-l)P-rXp-rPBl. De même, on trouve PBA = (-l)q-rXq-rPBl. On a donc {-X)qPAB = (-X)PPBA. (Si p = q, on retrouve les résultats de 1/). Lorsque r = rgA = 0, on a A = 0 et cette identité reste vraie. Exercice 4. Soient n un entier naturel, n > 2, et p e N, 1 <p <n — 1. a) Montrer que F = {A G Mn(^) \ ïgA< p} est fermé dans Mn{^)- b) Déterminer l'adhérence de l'ensemble A = {A G Mnfà) \ vgA = p}. Solution. Il suffit de montrer que l'ensemble A = À<n(R) \ T = {A G Mn vgA >p+ 1} est ouvert. Fixons A = {dij)i<ij<n G A. Comme rgA > p + 1, il existe une matrice carrée extraite de A inversible d'ordre p+ 1 (voir le théorème 2 page 122). Autrement dit, il existe I et J inclus dans {1,... ,n} avec Cardi" = CardJ = p+ 1, tels que la matrice extraite A' = {au) i6/ vérifie det A' ^ 0. Définissons l'application (p: Mn B = {Ki)l<i,3<n *-* det(&i,j) «6/ L'application ip s'exprime comme polynôme en certains des coefficients de B, elle est donc continue. Or <p{A) = det A' ^ 0, donc il existe un voisinage V de -A dans Mn(R) tel que pour tout B G V, <p{B) ^ 0. Autrement dit, pour tout B G V, la matrice extraite (bij) te/ est inversible, donc rgi? > p + 1. Ainsi, on a trouvé un voisinage de A inclus dans A. L'ensemble A est donc ouvert. b) Nous allons montrer A = T. D'après a), T est fermé. Or A C T, donc ÂcT. Montrons maintenant l'inclusion réciproque. Soit A G T. Il s'agit de montrer que A est limite d'une suite de points de A. Si rgA = p, alors A G A et c'est terminé. Sinon, r = rgA < p. On sait que A est équivalente à la matrice I * n j, ce qui s'écrit aussi 3P,QeÇ£n A = P -1 Ir 0 Q- \ 0 0 Pour tout m G N*, on note Bm la matrice définie par blocs par / Ir 0 0 \ Bm = 0 ±Ip-r 0 G Mn \ 0 0 0 / Pour tout m, rgl?m = p donc Am = P~1BmQ est de rang p. Or limm^+00Bm = donc limm^+00 Am = A et pour tout m, i4m G A. On a donc A G A. Jr 0 0 0 Exercice 5. a) Soit M G Mn(C). Pour tout e > 0, montrer qu'il existe P G GL(C) tel que T = P~lMP = ( *i,i V ^2,2 0 CM "\ £n,n / avec Vi < j, \Uj\ < e.
3. TOPOLOGIE SUR LES ENDOMORPHISMES 189 b) Soit A e Mn(C). Montrer que A est nilpotente si et seulement s'il existe une suite de matrices (Ap)p£N vérifiant (i) Vp, Ap est semblable à A (ii) lim Ap = 0. p—>+oo Solution, a) Soit / l'endomorphisme de Cn dont la matrice dans la base canonique de Cn est égale à M. Le corps C étant algébriquement clos, / est trigonalisable. Il existe donc une base g = (ei,..., en) de Cn telle que [/]# (matrice de / dans la base B) soit triangulaire supérieure. Écrivons [/}b = (ai,j)i<i,j<n- Pour tout p G N*, Bp = (ei, „-e2,..., -^rren) est une base de Cn. Calculons l'image par / de cette base, exprimée dans cette même base. Pour tout j, on a f \jFïej) = T,pl ja^ei = Î2pi jai>j (^r e* On en déduit Tp = U)bp = 1 ai.i \ Ql,2 p Û2.2 0 Ql,3 Q2,3 P ^3,3 ' pn-l Q2>n Qn-1,71 P ûn,n \ / Ceci étant, soit fi = sup^j \aij\ et soit p G N* tel que /i/p < e. La matrice T = Tp = (tij)i<ij<n = [f]sp est triangulaire supérieure et pour tout i < j, \tij\ = \aitj • p%~i\ < /u/p < e. De plus T est semblable à [/]# donc à M, d'où le résultat. b) Condition nécessaire. D'après a), pour tout p G N*, il existe Av = [aitj(p)]i<itj<n G Mn(C) semblable à A, triangulaire supérieure et telle que pour tout i < j, \aij(p)\ < 1/p. Or pour tout i > j, Oij(p) = 0 et pour tout z, a^p) = 0 (Ap étant nilpotente, ses valeurs propres a^i{p) sont nulles). On en déduit que pour tout (i, j), |aï,j(p)| < 1/p. Donc linip-^+ooAp = 0, d'où le résultat. Condition suffisante. Pour toute matrice M G Mn(C), on note Pm son polynôme caractéristique. L'application A^n(C) —> C[X] M ■-» Pm est continue (en effet, les coefficients de Pm s'expriment comme des polynômes en les coefficients de M). Or limp^+oo-Ap = 0, on a donc lrnip-^+ooPap = Po = {-\)nXn. Or pour tout p, Ap est semblable à A donc Pap = Pa- On en déduit Pa = (-l)nXn. Le théorème de Cayley-Hamilton entraîne alors An = 0. Exercice 6. Soit A e Mn{R) et une suite réelle (am) telle que B = X)m5)a™ Am existe. Montrer qu'il existe P G R[X] tel que B = P(A). Solution. L'ensemble F = {P(A) | P G R[X]} est un s.e.v de Mn(R), et Mn(R) étant de dimension finie, T est fermé. Pour tout fc G N, on pose Pk = Z)m=o a™ Xm de sorte que B = lim^+oo Pk{A). En d'autres termes, B est limite d'une suite de points de T. Comme T est fermé, on en déduit BgT, donc il existe P G R[X] tel que B = P{A). Remarque. En particulier, l'exponentielle d'une matrice M est un polynôme en M. La formule de Rodrigues (voir l'exercice 5 page 266) est un exemple de calcul explicite de l'exponentielle d'une matrice sous forme d'un polynôme de cette matrice.
190 4. RÉDUCTIONS D'ENDOMORPHISMES Exercice 7. Soit E un K-e.v.n (avec K = R ou C). On note CC(E) l'algèbre des endo- morphismes continus de E. Soit / G CC(E). a) Montrer que lim (ldE+-f) =exp(/). n—>+oo y n J b) Plus généralement, si (/n) est une suite de CC(E) qui tend vers /, montrer 1 n lim [IdE+-fn) =exp(/). c) Soient u,v G CC(E). Montrer jsa. H (D exp ©)"=exp(u+v)- Solution, a) Le résultat suivant nous sera utile. V<7 G CC(E), En effet. On a exp(flf)- (ld+-gj <exp(|rf)-(l + M)n. (*) Or donc x ' k=0 fc=0 w/1/7/ Cn n n -1 n - A: +1 1 1 VA;, 1 < k < n, -^ = < - , n n 111 fc=l ^ ' fc>n ^ ' En appliquant (*) à /, on en déduit le résultat demandé car limn_>+00(l + ||/|/n)n = exp(|/|). b) On remarque déjà que limexp(/„)-(Id+i/n] =0. (**) n—»oo En effet, en posant Mn = |/n|, on a d'après (*) exp(/n)-(ld+^y < exp(Mn) -11 + Mn\n n (***) Or limn_>oo.Mn = |/| = M, donc limn^ooexp(Mn) = exp(M) et comme 1 -\ ) = exp ( n log ( H n n = exp n \- o [ — \ \ n \n = exp(Mn + o(l)), on a aussi limn_>0O(l + Mn/n)n = exp(M). D'où (**) avec (***). Par ailleurs, la continuité de l'application g i-> exp(p) (voir la proposition 3) entraîne que limn^ooexp(/n) — exp(/) = 0. On en déduit avec (**) le résultat car (ld+i/n) = f f ld+±/n) - exp(/n)) + (exp(/n) - exp(/)) + exp(/). c) Lorsque n tend vers +oo, on a exp(-) =Id + - + o(- ) et exp (-) = Id+- + o ( - j , \n/ n \nj \nJ n \nj donc fn = n (exp (-) exp (-) - IdJ vérifie fn = u + v + o(l).
4. SOUS-ESPACES CARACTÉRISTIQUES - RÉDUCTION DE JORDAN 191 Autrement dit limn^oo/n = u + v, donc d'après la question précédente, limn^oo(Id+/n/n)n = exp(^ + v), d'où le résultat car (Id+/n/n) = exp(u/n) exp(v /n). Remarque. La proposition 5 (page 184) peut se déduire facilement du résultat de la question a). EXERCICE 8. Soit E un C-e.v de dimension finie n G N*. Soit g e C(E). Montrer que g est diagonalisable si et seulement si l'ensemble <3> = {y~lgy \ <p G G£(E)} est fermé. Solution. Condition nécessaire. Soit II le polynôme minimal de g. Comme g est diagonalisable, II n'a que des racines simples. Pour tout (p G G£(E)y on a Tl((p"1g(p) = y>~~lT[(g)y) = 0, donc pour tout h G $, U{h) = 0. Soit h G $. L'endomorphisme h est limite d'une suite (hp) de points de $. Comme pour tout p, U(hp) = 0, on a Il(/i) = limp_>oon(/ip) = 0. L'endomorphisme h étant annulé par un polynôme n'ayant que des racines simples, on en déduit que h est diagonalisable. Or le polynôme caractéristique P}x de h vérifie Ph = \imp->+00Php = Pg car pour tout p, Php = Pg. Les endomorphismes g et h ont donc même liste de valeurs propres ; comme ils sont de plus diagonalisables, on en déduit que g et h sont semblables, donc que /i6$. Condition suffisante. Supposons $ fermé. Le corps C étant algébriquement clos, g est trigonali- sable. Il existe donc une base B = (ei,..., en) de E dans laquelle la matrice de g ait la forme [9}b = ( Ai *i,2 0 A2 V 0 ... 0 t\,n \ tn—l,n An / 1 Pour tout p G N*, on définit ipp G C(E) sur la base B par ipp(ei) = — e{ pour tout i. On a Jr [<PP 19<Pp]b = tl,2 *i,3 P A2 I Ai v P *2,3 P 4^r \ p7l-l \ A3 0 \ *n—l,n v K ) donc lorsque p tend vers +00, <^p 1g<pp tend vers un endomorphisme diagonalisable h. Comme $ est fermé, on a /i G $ donc # est semblable à /i, donc # est diagonalisable. Remarque. La condition suffisante fait appel au résultat de la question a) de l'exercice 5 page 188, redémontré ici. 4. Sous-espaces caractéristiques - Réduction de Jordan Dans toute cette partie, E désigne un K-e.v de dimension finie n G N*. On utilisera la notation AÇ B lorsque A C B et A ^ B. 4.1. Sous-espaces caractéristiques Définition 1. Soit / e C(E) tel que le polynôme caractéristique Pf de / soit scindé sur K : Pf = (-l)n(X - Aj)ai • • • {X - Xs)as. Pour tout i, le s.e.v Ni = Ker(/ - AJd)ai s'appelle le sous-espace caractéristique de / associé à la valeur propre A*.
192 4. RÉDUCTIONS D'ENDOMORPHISMES - Pour tout i, Ni est stable par /. - On a E = Ni 0 • • • 0 N8t - Pour tout i, dim Ni = ai. Démonstration. Le s.e.v Ni est bien stable par / car si x £ Ni, (/ - \i Id)*« (/(*)) = fo(f-\i ld)*« (x) = 0. - Le fait que E = N\ 0 • • • © Ns résulte du théorème de décomposition des noyaux (voir 2.1, théorème 1). - Pour tout i, la restriction fi de / à Ni vérifie (fi —Xi IdjvJ0* = 0. En d'autres termes, fi —Xi Id^. est nilpotente, donc d'après 1.2 proposition 3, le polynôme caractéristique de fi — À^Id^ est {-X)d'imNi, donc celui de fi est (A* - X)dimNi. Or Pfi divise Pf d'après la proposition 2 de la page 163, et donc dimiVi < on (*). Comme E = N\ 0 • • • 0 Ns, on a n = 2J=i dim M- De plus X)t=i at = n> et on en déduit avec (*) que dirniV^ = ai pour tout i. D Définition 2 (Indice d'un endomorphisme). Soit / e C(E). Il existe un unique entier naturel r tel que {0} = Ker/° Ç Ker/ £ • • • £ Ker/r = Ker/r+1 = Ker/r+2 = • • • = Ker/9 = • • • . L'entier r s'appelle Y indice de /. C'est aussi le plus petit entier naturel tel que Ker/r = Ker/r+1. Démonstration. On part du fait que Vp G N, Ker fp c Ker /p+1 (*) (en effet, si x G Ker/*\ alors /p(x) = 0 donc /p+1(z) = f(fp(x)) = 0). On en déduit en particulier que pour tout p, dim(Ker fp) < dim(Ker fp+1). Autrement dit, la suite (up)peN définie par up = dim(Ker fp) est croissante. Cette suite est à valeurs dans / = {0,1... ,n}. L'ensemble / étant fini, (up) étant croissante, l'entier r = inf{p € N | uv = up+i} existe. On a alors - Pour tout p < r, Ker/P Ç Ker fp+1 (d'après (*) et parce que up < i*p+i). - Ker/r = Ker/r+1 (d'après (*) et parce que ur = ur+\). - Pour tout p > r, Ker/P = Ker/P+1 car Ker/P+1 = {xeE\ fr+\fp-r(x)) = 0} = {x G E | fp~r(x) G Ker/r+1} = {x e E \ fp~r{x) G Kerf} = Ker/P. L'unicité est évidente. D Remarque 1. - Les propriétés vérifiées par r montrent que l'indice r de / est aussi l'unique entier naturel vérifiant Vq < r, dim Ker fq < dim Ker fr et Vq > r, dim Ker fq = dim Ker fr. - Si / est nilpotente, l'indice r de f n'est autre que inf{p | fp = 0}, c'est-à-dire l'indice de nilpotence de /. - On peut montrer que si r est l'indice de /, alors Ker fr 0 Im fr = E. - L'indice r de f vérifie aussi la propriété E = Im/° ^ Im/ ^ • • * 2 Wr = Im/r+1 = Im/r+2 = • • • = Im/9 - Ces résultats sont à rapprocher de celui de la question 1/ a) du problème 2 page 149. Théorème 1. Soit f G C(E) tel que son polynôme caractéristique Pf soit scindé sur K : Pf = (-^nUU(X-\i)ai. Alors
4. SOUS-ESPACES CARACTÉRISTIQUES - RÉDUCTION DE JORDAN 193 (i) Le polynôme minimal 11/ de f est de la forme s Uf(X) = Y[(X - \i)ri avec Vi, 1 < n < a*. i=l (ii) L'ordre de multiplicité r* de Xi dans 11/ est l'indice de Vendomorphisme (f — A< Ida). Démonstration, (i) est démontré à la remarque 6 page 177. (ii) Pour alléger les notations, nous allons montrer (ii) pour i = 1. On pose Q = 111=2(^ — Ai)rS de sorte que 11/ = (X — Xi)VlQ. Comme (X — Ai)7'1 et Q sont premiers entre eux, on a, en appliquant le théorème de décomposition des noyaux (voir le théorème 1 page 175), E = Ker(/ - Ai Id)n © M avec M = KerQ(/). On en déduit dimKer(/ - Ai)ri + dimM = n (*). Soit q un entier naturel. On pose P = (X — X\)qQ. En appliquant le théorème de décomposition des noyaux, on a KerP(/) = Ker(/ - Ai Id)9 © KerQ(/) = Ker(/ - Ai Id)9 © M. On en déduit dimKer(/ - Ai)9 + dimM = dimKer P(/) (**). - Si q > 7*1, alors 11/ divise P donc P(f) = 0, i.e KerP(/) = E, donc avec (*) et (**), on tire dim Ker(/ - Ai)9 = dim Ker(/ - Ai)ri. - Si maintenant q < ri, alors 11/ ne divise pas P, donc P(f) ^ 0, i.e KerP(/) ^ E, et d'après (*) et (**), on tire dimKer(/ — Ai)9 < dimKer(/ — Ai)ri. On en déduit que l'indice de l'endomorphisme / — Ai Id# est ri (voir la remarque 1). D Remarque 2. - En conséquence, les sous-espaces caractéristiques Ni de / sont égaux àKer(/-Ai)r<. - Pour tout i, ri est aussi l'indice de nilpotence de l'endomorphisme /^ — A^Id^. - Ce théorème permet de calculer le polynôme minimal de / : on commence par calculer le polynôme caractéristique de /, puis on calcule ensuite pour tout i l'indice de / — A^Id (dans la pratique, les calculs peuvent être longs). 4.2. Décomposition de Dunford Nous allons maintenant donner une nouvelle réduction plus poussée que la simple trigo- nalisation (mais moins que la réduction de Jordan), appelée décomposition de Dunford. Nous donnerons deux moyens d'y parvenir. Théorème 2 (Décomposition de Dunford). Soit f e C(E) tel que le polynôme caractéristique Pf de f est scindé sur K. Il existe un unique couple (d, n) G (C(E))2 avec d diagonalisable et n nilpotente, tel que (i) f = d + n (ii) no d = don. Démonstration. On écrit P/ = (—l)n Yli=i(X—Ai)Qi, et pour tout i, on note Ni = Ker(/—A; Id)a* les sous-espaces caractéristiques de /. Existence. Comme E = Ni © • • • © NS) il suffit de définir d et n sur chaque A^. On les définit comme suit : Vi,Vx€A^, d(x) = XiX et n(x) = f(x) — XiX. Autrement dit, pour tout i on a di = d^ = A^Id^ et ni = n^ = f^. — À^ Idjjv,. Les di et n^ sont des endomorphismes de Ni car Ni est stable par / donc par d et n. Ainsi définie, d est diagonalisable. Pour tout i, on a nf* = 0 (puisque par définition de Ni, pour tout x e Ni, (f — Xi Id)a,(:r) = 0). Si a = sup^ ai, na s'annule donc sur chaque A^ donc sur E = ©?=i^t, c'est-à-dire nQ = 0. Il reste à montrer que d et n commutent. Pour tout i, on a di = A^ Id^ donc niodi = diom, c'est-à-dire que d et n commutent sur chaque A^, donc sur E = ©f=iiVi.
194 4. RÉDUCTIONS D'ENDOMORPHISMES Unicité. Soit (d',n') un autre couple vérifiant les conditions. On remarque d'abord que f od! = d! o /, donc pour tout î, Ni est stable par d! (pour tout x G N^ (f - Xild)ai[d'(x)] = d' o (/ - Ai Id)ai (x) = 0). Comme d\^i = Xi Idjvt, on en déduit que d o d' = d' o d sur Ni. Ceci étant vrai pour tout z, comme E = 0f=1A^, on en déduit que d et d' commutent. De plus d et d1 sont diagonalisables, on peut donc les diagonaliser dans une même base, ce qui prouve que d1 — d est diagonalisable. Comme n = / — d, n' = f — d' et que d o d' = d' o dy n et n' commutent. Si on choisit p et q tels que np = n,q = 0, on a donc (n-n'r+q= E CW^-tfn''= 0 (dans chaque terme de la somme, on a soit i > p, soit j > q). Donc n — n7 = d' — d est nilpotent. Or nous avions montré que d! — d est diagonalisable, donc d' — d = 0. Autrement dit, d = d' et donc n = n'. D Conséquence. Soit / G £(£) avec P/ = (—l)n ni=i(^ — ^)ai scindé sur K. Reprenons les notations utilisées dans la démonstration. Pour tout i, fi = f\^{ G C(Nj) est trigonalisable et Xi est sa seule valeur propre (car fi — Xi Idw{ = rit est nilpotente) et donc il existe une base Bi de Ni dans laquelle la matrice de fi a la forme / ^ (x) [fi]Bi=Ai = \ (0) A, Comme E = &ï=1Ni, on voit que B = B\ U • • • U Bs est une base de E dans laquelle la matrice de / a la forme / M (0) [/]* = V (0) >1. Cette réduction est plus poussée que la simple trigonalisation que nous avions vue au théorème 3 page 164. Un autre moyen d'aboutir à la décomposition de Dunford. Nous présentons une autre technique pour aboutir à la décomposition de Dunford, qui présente l'avantage de montrer que les endomorphismes d et n sont des polynômes en /. Nous aurons besoin pour cela d'un résultat préliminaire qui fait l'objet de la proposition ci dessous. Proposition 1. Soit f e C(E) et F e K[X] un polynôme annulateur de f. Soit F = PM*1 - - - Mgs la décomposition en facteurs irréductibles de K[X] du polynôme F. Pour tout i, on note Ni = Ker M^(f). On a alors E = 7Vi0- • -®NS et pour tout i, la projection sur Ni parallèlement à ®j^Nj est un polynôme en f. Démonstration. La fait que E = N\ÇB- • -(&NS résulte du théorème de décomposition des noyaux. Pour tout i, notons Qi = Ylj^i^'j3 • Aucun facteur n'est commun à tous les Qi, c'est-à-dire que les Qi sont premiers entre eux dans leur ensemble. En appliquant l'égalité de Bezout, on voit qu'il existe U\,..., Us G K[X] tels que U\Qi -\ 1- USQS = 1, de sorte que ldE = Ui(f) o Qi(/) + • • • + Us(f) o Qs(f). Pour tout i, on note Pi = UiQi et pi = Pi{f). On a Id = Ya=iPï (*)• Par ailleurs, pour tout j 7^ z, F divise QiQj donc V? ï h Pi oPj = QiQj(f) o ViUjU) = 0. (**) On déduit de (*) que pour tout i, pi = J2t=iPi °Pj et d°nc d'après (**), pi = pf. Les pi sont donc des projecteurs. - Montrons que pour tout i, Impi = Ni.
4. SOUS-ESPACES CARACTÉRISTIQUES - RÉDUCTION DE JORDAN 195 Soit y = Pi(x) G Impi. On a K«(/)(y) = KV) o Pi(f)(x) = Ui(f) o F(f)(x) = 0, ce qui prouve que Im p* C KerM?'(/) = Ni. Il reste à montrer l'inclusion réciproque. Soit x G Ni = KerM"'(/). D'après (*), x = pi (a:) H \-Ps(x). Or pour tout j ^ *, pj(œ) = Ï7j(/) o Qj(f)(x) = 0 car M"{ divise Q/, donc finalement x = pi(x) G Imp*. Donc Imp* = Ni. - Il ne reste plus qu'à montrer que pour tout i, Kerp* = (&j^iNj. Pour tout j / i, on a Nj C Kerp< car si & G Nj, alors Pi(x) = Ui(f) o Qi(f)(x) = 0 car M^ divise Qj- On en déduit que (Bj^iVj C Kerp^. Soit maintenant x G Kerpj. D'après (*), x = Ylj^iPj{x) donc x G (Bj^Nj. Finalement, Kerpi = QtfiNj. La démonstration est terminée puisque par construction, les projecteurs pi sont des polynômes en/. □ Théorème 3 (Décomposition de Dunford, bis). Soit un endomorphisme f e C(E) tel que son polynôme caractéristique Pf soit scindé sur K. Il existe un unique couple (d, n) d'endomorphismes tel que (i) d est diagonalisable, n est nilpotente. (ii) f = d + n et don = no d. De plus, d et n sont des polynômes en f. Démonstration. Existence. Écrivons Pf = (—l)nrii=iP^ — ^i)ai e* Pour tout i, notons A^ = Ker(/—Xi)ai. La proposition précédente s'applique avec F = Pf et pour tout i, Mi = (X—Xi). En utilisant les notations précédentes, pour tout i, pi = Pi(f) est le projecteur sur Ni parallèlement à (BfêiNj. Posons d = Ya=\ ^iPi (ainsi construit, d est diagonalisable) et n = / — d = ]Ci=i(/ — Xi Id)pi. En utilisant le fait que les pi sont des projecteurs, que pi opj = 0 si i ^ j, et que les pi commutent avec / (ce sont des polynômes en /), on obtient facilement par récurrence sur q s VçGN*, n^ = Y^(f-^à)qPi. Or si q = sup^ Qj,ona(/-À; Id)9pi = [(X — Xi)qPi](f) = 0 pour tout i car Pf divise (X — Xî)qPi, donc nq = 0. Ainsi construits, d et n sont des polynômes en / vérifiant (i) et (ii). Unicité. Soit (d',n') un autre couple vérifiant (i) et (ii). Les endomorphismes d' et n' commutent avec d' + n' = f donc avec d et n qui sont des polynômes en /. Ainsi, d et d' sont diagonalisables dans une même base, ce qui entraîne que d — d' est diagonalisable. Comme d — d' = n' — n est nilpotente (on montre ceci comme dans la démonstration du théorème 2), on en déduit que d — d' = n' — n = 0. D Calcul pratique de la décomposition de Dunford. Nous allons donner un moyen pratique de calculer les endomorphismes d et n donnés par la décomposition de Dunford. Nous allons pour cela calculer les projecteurs pi, et il suffira ensuite d'écrire que d = 2Z ^iPï et n = f — d. i=l Commençons par remarquer que dans la démonstration du théorème précédent (partie existence), on aurait pu remplacer Pf par n'importe quel polynôme F annulant / et ayant les mêmes facteurs premiers que Pf, en particulier par le polynôme minimal 11/ de /. Si F = Y\i=1{X — Xi)ri est un tel polynôme, on commence par décomposer 1/F en éléments
196 4. RÉDUCTIONS D'ENDOMORPHISMES simples clans K(X) i s ^ = £ EXi,j (X - \AJ fr L£ (* - wj ' Pour tout i, on pose ensuite Ui = S^Xij(X — Xi)Vi J", de sorte que j=l 1 s 77. s F=£/y_Vv, ou encore 1 = 2jI/*<3*> F tKx- X<Y' t=l où Qi = Ilj/i(^ — ^j)rj- Les projecteurs p* sont alors donnés par pi = Pi(f) où Pi = UiQi (voir la démonstration de la proposition 1). Il est en général préférable de prendre pour le polynôme F le polynôme minimal 11/ de / (les degrés des polynômes intermédiaires sont moins élevés). Mais le calcul de 11/ peut être assez long, c'est pourquoi on choisit parfois de prendre F = Pf. Application au calcul d'exponentielle. L'écriture f = d + n donnée par la décomposition de Dunford est intéressante car d et n commutant, on peut utiliser la formule du binôme pour calculer fp : fp=(d + nf = J2C%dk o np-k. k=0 Dans l'expression ci dessus, on peut retirer les termes de la somme pour lesquels p — k est plus grand que l'indice de nilpotence de n. Un autre intérêt est le calcul d'exponentielle. En effet, d et n commutant, on a exp(/) = exp(d+n) = exp(rf) exp(n). Le calcul de exp(d) est simple si une base B de diagonalisation de d est connue : si [d]B = Ai (0) (0) An ,Ai (0) , [exp(d)]B = exp([d]B) = (0) j^n 9-1 Quant à exp(n), il suffit d'écrire que exp(n) = Y^ — où q est l'indice de nilpotence de n p=0 pi Dans la pratique, on calcule d et n grâce à la méthode décrite plus haut. Avec les notations précédentes, rappelons que d=^XiPi et n = ^(/-ÀiId)pi i=\ i=l On peut alors calculer exp(/) sans diagonaliser d, à partir des projecteurs pi. En effet, les relations sur les pi entraînent que pour tout p, dP = Yli=i KPi donc +oo dP +00 exp(<i) = J2 -T = £ p=o 1 p=o n=i s .p pi +oo .p' p]- = £ Pi = J2 eXipi i=l Par ailleurs, +oo - +oo np exp(n) = £ T7 = £ P —' VI =0 y p=0 ii=l £ (/ - Xi Id)" P-1 Pi = £ i=l r,-l £ Lp=o (/ - A, Id)*> p\ Pi-
4. SOUS-ESPACES CARACTÉRISTIQUES - RÉDUCTION DE JORDAN 197 Finalement, on en déduit exP(/) — exp(d) exp(n) = Y^ eXi i=l Vi-l £ p=0 (/ - a, idy pi Pi- (Un calcul d'exponentielle de matrice est traité à l'exercice 1 page 199). 4.3. Réduction de Jordan Nous allons maintenant donner une réduction encore plus poussée que la précédente, appelée réduction de Jordan. En un certain sens, la réduction de Jordan est la plus poussée que l'on puisse obtenir. Il existe cependant d'autres types de réduction qui ont aussi leurs avantages et qui s'utilisent dans des circonstances différentes (voir l'annexe B). La réduction de Jordan ne figure pas au programme des classes de mathématiques spéciales. Cependant, les techniques utilisées dans sa démonstration sont très classiques et leurs connaissances permettent de répondre à beaucoup de problèmes. Réduction de Jordan d'un endomorphisme nilpotent. Nous allons commencer par donner la réduite de Jordan d'un endomorphisme nilpotent. Nous verrons par la suite que la réduction d'un endomorphisme quelconque s'en déduit facilement. Théorème 4 (Réduction de Jordan d'un endomorphisme nilpotent). Soit u G C{E) un endomorphisme nilpotent. Alors il existe une base B de E dans laquelle la matrice de u a la forme /0 V! (0) \ [u]B = v. \o n-l avec Vi, Vi G {0,1}. Démonstration. Soit r G N* l'indice de nilpotence de u, de sorte que ur l ^ 0 et ur = 0. Pour tout i G N, on note Fi = Ker(ul). 1) Montrons que (i) {0} = F0 Ç Fx Ç • • • Ç Fr-i ÇFr = E. (ii) Pour tout i G N, 1 < i < r, u{Fi) C Fi-i. La partie (i) résulte de la définition 2, car r n'est autre que l'indice de u (voir la remarque 1). Montrons (ii). Soit i G N, 1 < i < r. Pour tout x € Fi, ut-1 [«(#)] = ul(x) = 0 donc u(x) G Fi-i. Donc u(Fi) C F;_i. 2) Nous allons maintenant montrer l'existence de s.e.v G\}..., Gr et Hi,..., Hr-\ de E tels que (i) Vi, l<i<r, Fi = Gi®Fi-i. (ii) Vz, 1 < i < r — 1, u applique injectivement Gi+\ dans G{. (iii) Vi, 1 < i < r - 1, G{ = u(Gi+1) © H{. Soit Gr un supplémentaire de Fr-\ dans Fr, de sorte que Fr = Gr © Fr-\. On a ( (Ker«) f)Gr = F1n Gr C Fr_i n Gr = {0} \ u(Gr) C u(Fr) C Fr_i donc u applique injectivement Gr dans Fr-\. u(Gr) n Fr_2 = {0}. En effet, soit x G u(Gr) n -Fr-2- Il existe y G Gr tel que u(y) = x, et on a 0 = ur~2(x) = ur~l{y), donc y G Fr_i n Gr = {0}, donc y = 0, donc x = u(y) = 0. On a donc u{Gr) ©i^-2 C Fr-\. Il existe donc un s.e.v Hr-\ tel que u(Gr) ©Fr-2 ®Hr-\ = Fr_!. Si on pose Gr-\ = u(Gr)®Hr-\, on a donc Fr_i = Gr_i©Fr_2, et w applique injectivement Gr dans Gr-i.
198 4. RÉDUCTIONS D'ENDOMORPHISMES Ainsi (i), (ii) et (iii) sont démontrés pour i = r - 1. Pour montrer (i), (ii) et (iii) pour i g {1,..., r — 2}, nous allons utiliser une récurrence descendante. Supposons le résultat prouvé pour i + 1 G {2,..., r — 1} et montrons le pour i. On s'intéresse au comportement de u sur Gi+\. On a f (Ker u) n Gi+i = F1n Gi+Y C^fl Gi+i = {0} \ u(Gi+i) C u(Fi+1) C Fi donc u applique injectivement Gi+\ dans Fi. u(Gi+i) n Fi-i = {0}. En effet, soit x G u(Gi+i) D i^-i- Il existe y G C^+i tel que x = u(y). Or x G Fi-i donc 0 = ui-1(x) = i**(y), d'où y e Fi C\ Gi+\ = {0}, c'est-à-dire y = 0, donc x = wQ/) = 0. On a donc u(Gi+i)(BFi-i c Fi. On peut donc trouver un s.e.v Hi tel que u(Gi+i)®Fi-\(BHi = Fi. On pose alors Gi = u(Gi+i) © Hi, de sorte que i^ = Gi © i^-i et u applique injectivement Gi+i dans Gi. Les s.e.v Gr,..., G\ et Hr-\,..., H\ sont ainsi construits de proche en proche. Les propriétés (i) et (iii) à l'ordre 1 sont Kerw = Fi = G1 © F0 = Gx © {0} = <?i Ci = u(G2) © #i En résumé, la suite G\,..., Gr vérifie { e = Gr e Gr-i e • • • e Gi d=JFi=Keru Vz, 2 < z < r, u applique injectivement G^ dans G;_i 3) Partant d'une base e^i,... ,£;)Si de G;, ^(^i),... ^u{e^Si) est une famille libre de G{-\ que Ton peut compléter par £;-i,i,... ,Ei-\,Si_x pour obtenir une base de G%-\. Nous obtenons en réunissant toutes ces bases une base de E que nous pouvons écrire sous la forme du tableau à double entrée suivant. Grr \Gr-\ 1 ^Y-2 ... Gi 1 er,l w(er,l) w2(er)i) ... ^"Vr.l) er,Sr | w(er,Sr) ^2(er,Sr) ... wr_1(er)Sr) 1 ^-1,1 ^(er-i,!) ... |ur-2(er_u) 6r-l,sr_i ^(er-l.s,--!) ... ^^(er-l.s^i) | er_2,i ... wr-3(er_2li) leu ehsi\ 4) En lisant le tableau précédent colonne par colonne, de bas en haut puis de gauche à droite, nous obtenons un nouvel ordre (ei,..., en) des vecteurs de cette base. On voit alors que u(ej) = ej-\ si ej n'est pas situé sur la dernière ligne, u{ej) = 0 si ej est situé sur la dernière ligne. La base B = (ei,..., en) convient donc pour le théorème. D Remarque 3. Une autre manière de voir les choses est de remarquer que [u]b est constituée de blocs nuls et de blocs de la forme /0 (0) \ ; ••. i \ o o / centrés sur sa diagonale principale. - On peut aussi obtenir la réduction de Jordan d'un endomorphisme nilpotent dans le cadre de la théorie des invariants de similitude (voir l'annexe B page 292).
4. SOUS-ESPACES CARACTÉRISTIQUES - RÉDUCTION DE JORDAN 199 Théorème 5 (Réduction de Jordan d'un endomorphisme). Soit f g C(E) tel que son polynôme caractéristique Pf soit scindé sur K : s Pi = (-i)nII(* " A*)°'' (A< * xisi i * J)- Alors il existe une base B de E dans laquelle la matrice de f ait la forme f Ai n \ ( xi vi,i (0) \ , où Vi, Ai = [Î\b = 0 V o As 7 0 Xi Vo ... '• vi,ai-l 0 Xi I eMai(K) avec pour tout (i,j), Vij G {0,1}. Démonstration. Pour tout i, on note Ni = Ker(/ — À^ Id)a« les sous-espaces caractéristiques de /. On a E = Ni © • • • 0 Ns et les Ni sont stables par /. Pour tout i, on pose fi = f^.. On a fi G C(Ni) et (fi — Xi Id)ai = 0, donc ni = fi — Xi Id est nilpotent. D'après le théorème précédent, il existe donc une base Bi de Ni telle que / 0 viti (0) \ /Xi t*,i (0) \ 0 Ai ••• Wft = Vo Vi,cti-1 o / donc [fi]B. = [Xi Id^ +ni]Bi = \ 0 0 Xi / avec pour tout j, 1 < j < ai — 1, Vij G {0,1}. Comme E = Ni © • • • © NS) on voit que B = (i?i,..., Bs) est une base de E et que [/i] £i (0) [f)B = (0) [/Js. d'où le résultat en posant, pour tout i, Ai = [/i]^. □ Remarque 4. Ce théorème peut aussi s'interpréter comme suit : [f]s est constituée de blocs de taille 1 du type (À*) ou de taille > 1 du type (Xi 1 0 Ai • • V o ••• (o) \ ••• i 0 Xi J centrés sur sa diagonale principale. 4.4. Exercices Exercice 1. Calculer l'exponentielle de la matrice 14-2 M = I 0 6 -3 ) G M3 -14 0 Solution. Le polynôme caractéristique de M est Pm = —(X — 2)2(X — 3). Les valeurs propres de M sont donc Ai = 2 et A2 = 3. Pour calculer l'exponentielle de M, nous allons utiliser la méthode décrite page 196, en employant les mêmes notations. On part ici du polynôme annulateur F = (X - 2)2{X - 3). On a ici Qi = (X - 3) et Q2 = (X - 2)2. On recherche maintenant
200 4. RÉDUCTIONS D'ENDOMORPHISMES Ui,U2 G R[X] tels que U\Qi + U2Q2 = 1- On effectue pour cela la décomposition de 1/F en éléments simples. Après calculs, on trouve 1 1 1111 X-l + F (X-2)2(X-3) X-2 (X-2)2 ' X-3 X-Z {X-2)2 donc (X-2)2-(X-l)(X-3) = 1, et donc U\ = -(X-l) et U2 = 1 conviennent. Si maintenant •Pi = U1Q1 = -(X - 1)(X - 3) et P2 = U2Q2 = {X - 2)2, les projecteurs pi et P2 sont donnés par pi = Pi (M) et p2 = i^C^O- On sait alors que exp(M) = eXl (l3 + i(M - 2/3) J pi + eA2p2 = e2(M - /3)pi + e3p2. Un calcul donne / -2 -4 6 pi = Pi(M) = -(M -/3)(M- 3/3)= -3 -3 6 \ -3 -4 7 et /3 4 -6\ P2 = Pi(M) = (M - 2/3)2 =34-6, \3 4 -6/ (au passage, on vérifie que pi +P2 = -^3), donc -6e2 + 3e3 -4e2 + 4e3 10e2 - 6e3 exp(M) = [ -6e2 + 3e3 -3e2 + 4e3 9e2 - 6e3 -7e2 + 3e3 -4e2 + 4e3 lie2 - 6e3 Exercice 2. Soit M e Mn(C). Donner une condition nécessaire et suffisante sur la matrice M pour que limt^+00 etM = 0. Solution. Nous allons montrer que lim^+oo etM = 0 si et seulement si pour toute valeur propre A de M, la partie réelle 9fc(A) de A vérifie U(X) < 0. Condition nécessaire. Supposons que limt_>+00 etM = 0. Soit A une valeur propre de M, et X un vecteur propre associé. On a facilement Vp G N, MpX = XpX donc +00 p +00 ,p Vt G R, etMX = Y -MpX = Y -XpX = éxX. p=0y p=0y Ainsi, limt-^oo etx = 0, ce qui entraîne 9ft(A) < 0. Condition suffisante. Supposons que pour toute valeur propre A de M, on ait 5?(A) < 0. Si A = (ai,j)i<i,j<n G Mn(C), on pose ||;4|| = J^ . |oij|. La norme || • || est une norme d'algèbre sur Mn(C). D'après le théorème 2, on peut écrire M = D + N avec D diagonalisable, N nilpotente et DN = ND. Comme D et N commutent, on a exp(M) = exp(£>)exp(iV). Soit P G Gin(Q tel que / Ai (0) \ P~lDP= =D'. \ (0) An / Les Xi sont les valeurs propres de M, et par hypothèse fi = sup^ 3ft(A;) < 0. On a etAl (0) n V* G R, exp(W) =\ •.. donc || exp(tD')\\ = J^ \etXi\ < né». (0) etXn I i=1
4. SOUS-ESPACES CARACTÉRISTIQUES - RÉDUCTION DE JORDAN 201 Comme exp(tD) = P 1 exp(tD')P, ceci entraîne || exp(*L>)|| < HP"11| • ne* ■ \\P\\ = Ke*t K = n \\p-*\\ • ||P|| Maintenant, TV étant nilpotente, on a M n^tk V* > 0, exp(tN) = ^2-T\Nk donc fc=0 exp(«JV)||<X;g"»»* fc=0 = /«. Avec (*), on peut maintenant écrire ||exp(*M)|| = \\exp(tD)exp(tN)\\ < ||exp(*D)|| ■ \\exp(tN)\\ < Ke^f(t). Comme t ■-» f(t) est polynomiale et \i < 0, on en déduit que \ïmt^+00etM = 0. Exercice 3. Soit M G Mn(C). Donner une condition nécessaire et suffisante sur M pour que M et 2M soient semblables. Solution. Supposons M et 2M semblables. Alors si À est valeur propre de M, 2À est valeur propre de 2M, donc de M (car M est semblable à 2M). De même, 2(2À) est valeur propre de M. On itérant le procédé, on voit ainsi que pour tout p G N, 2PX est valeur propre de M. M n'ayant qu'un nombre fini de valeurs propres, on doit donc avoir À = 0 pour toute valeur propre À de M. Le corps de base C étant algébriquement clos, on en déduit que la seule racine du polynôme caractéristique Pm de M est 0, donc Pm = (—l)nXn, et donc M est nilpotente d'après le théorème de Cayley-Hamilton. Réciproquement, supposons M nilpotente. Soit / l'endomorphisme de Cn dont la matrice dans la base canonique B de Cn est M. On sait (théorème 4) qu'il existe une base B\ = (ei,..., en) de Cn telle que m* = / 0 «i 0 0 Vo ••• (0) \ Vn-1 o / avec Vijt;» G {0,1}. On note maintenant Bi la base B^ = (ei,2e2,... ,2n 1en). Pour tout i G {1, f{ei+i) = Viôi donc /(2iei+i) = (2vi)(2i~1ei), et donc ,n — 1}, on a [/]b2 = / 0 2vi 0 0 Vo .• (0) \ 2t>n-l 0 / = 2[/] fli donc 2[/]b1 et f/]^ sont semblables, donc 2M et M sont semblables. En résumé, M et 2M sont semblables si et seulement si M est nilpotente. Exercice 4 (Toute matrice est semblable à sa transposée), a) Soit une matrice M G Mn{C). Montrer que M et lM sont semblables (on pensera à la réduction de Jordan), b) Que dire dans MJW
202 4. RÉDUCTIONS D'ENDOMORPHISMES Solution. D'après le théorème 5 et la remarque 4, il existe Q G £4i(C) et des nombres complexes ai tels que M' = Q~lMQ = Ml (0) (0) Mq avec Mi = ( cti 1 (0) \ 0 ai '•■ V 0 '•• 1 0 ai I ou (a^. Pour tout i, on va montrer que Mi et tMi sont semblables. Soit ni la taille de la matrice M^ Si ni = 1 on a Mi = (a*) donc M; = lMi donc M* et *Mi sont semblables. Si n* > 1, on considère l'endomorphisme fi de Cn* dont Mi est la matrice dans la base canonique B = (ei,... ,eni) de Cni. Soit B' la base (eni,..., e2, ei) de Cni. On a facilement [/i]*' = / oti 1 " V (0) 0 o \ ai 0 1 ai J = %h donc tMi = [fi]B' est semblable à Mi = [fi]B- Pour tout i, on peut donc trouver une matrice Pi inversible telle que lMi Pi >-i PrlMiPi. La o matrice P = G A1n(C) est inversible, son inverse est P l = -i _ et on a >-i P-1M'P = prMii\ 0 0 P^lMqPq *Mi 0 0 lMn = tM' ce qui entraîne ^Q^MQ) = P~l(Q-lMQ)P donc *M = R~lMR avec # = QPlQ. b) Dans A^n(K)) on ne peut plus procéder comme plus haut car le corps de base R n'est pas algébriquement clos et donc on n'est pas assuré de la réduction de Jordan de M. On s'en tire autrement. Si M G Mnfâ) C Mn(C) alors d'après a), il existe P G G^n{^) tel que tM = P~lMP. On a vu au problème 11 page 158 que deux matrices réelles semblables dans Mn(C) sont semblables sur A^n(K), autrement dit, il existe Q G £^nW tel que lM = Q~lMQ. Remarque. Le résultat de a) reste vrai sur tout corps K dès que Pm est scindé sur K. On en déduit que pour tout corps K, M G Mn(K) est semblable dans MnÇL) à lM où L désigne le corps des racines de Pw Si K est infini, on en déduit (toujours grâce au résultat du problème 11 page 158) que M et lM sont semblables dans .Mn(K). (En fait, ceci est vrai même si K est un corps fini — voir l'annexe B, partie 3.2.) Exercice 5 (Logarithme d'une matrice inversible). 1/ a) Soit M e Ç£n(C). Montrer qu'il existe A G Mn(C) telle que exp(A) = M. b) Déterminer l'ensemble des matrices B G Mn(€) telles que exp(J3) = In. 2/ (Application). On se donne un entier p > 2. a) Soit A G £C(C). Montrer l'existence d'une matrice B telle que Bp = A. b) Lorsque A G Mn(C) n'est pas inversible, existe-t-il toujours une matrice B telle que A = Bp ? 3/ (Seconde application). Montrer que £Ai(C) est connexe.
4. SOUS-ESPACES CARACTÉRISTIQUES - RÉDUCTION DE JORDAN 203 Solution. 1/ a) D'après la conséquence du théorème 2, M est semblable à une matrice de la forme / Bi M' = B2 0 \ 0 \ B. , les blocs B{ étant de la forme p ) / A x 0 A V 0 ••• x \ •• x 0 A / Soit B G Mm(C) un tel bloc. On a A ^ 0 puisque M est inversible. On peut écrire B = \(Im+N) où N est une matrice nilpotente. Posons C = Im + N. Par analogie avec le fait que pour \t\ < 1, , on pose iog(i+i) = t-4 + f + D = N - — + + (-l)m N m—1 m — 1 Comme on s'y attend, nous allons montrer que exp(D) = Im + N = C. Ceci peut se déduire d'un calcul formel analogue au cas des séries entières sur C. Pour le lecteur non convaincu, nous allons donner une autre démonstration. Pour tout t G M, on pose t fTïl—l m L 7\rm—1 D{t) = tN--N' + - + (-l) l m — 1 Par dérivation, on obtient D'(t) = N - tN2 + • • • + {-l)mtm-2Nm-1, et comme Nm = 0 (car N est nilpotente), on a (Jm + tN)D'(t) = N. Si S(t) = exp[D(t)}, on a donc {Im + tN)S'(t) = NS(t) (*), et en dérivant une nouvelle fois (Im + tN)S"(t) = 0, d'où on tire S"(t) = 0 car (Im + tN) est toujours inversible (son inverse est Im-tN + t2N2 + • • • + (-l)m-1Mm-1). Pour tout t, S'(t) est donc une fonction constante, égale à ^(O) = N d'après (*). Or 5(0) = Im donc pour tout t, S(t) = Im + tN. En particulier, C = 5(1) = exp[£>(l)] = exp(£>). Ceci étant, soit fi € C tel que eM = A (si A = |A|etô, il suffit de prendre fi = log |A| + id). Alors exp(fj,Im + D) = exp(fj,Im) exp(D) = (XIm)C = B. Ainsi, pour tout i, il existe une matrice Ai telle que exp(j4;) = Bi. Si on note A' = Ai (0) (0) Af on a exp(A') = exp(^i) (0) (0) exp(^p) = M'. Si P est une matrice inversible telle que P lM'P = M, on voit que la matrice A = P lA'P vérifie exp(A) = P"1 exp(^7)^ = M. b) Considérons une matrice B G Mn(C) telle que exp(B) = In. On peut écrire B = D + N où D est une matrice diagonalisable, TV une matrice nilpotente, avec DN = ND. Nous allons montrer que TV = 0. On a In = exp(B) = exp(D)exp(N) donc exp(N) = exp(D)"1 = exp(—D). L'exponentielle d'une matrice diagonalisable étant diagonalisable (pour s'en convaincre, se placer dans une base de diagonalisation et remarquer que l'exponentielle d'une matrice diagonale est diagonale), exp(N) = I + TV + • • • + AP-1 /(n — 1)! = exp(-D) est donc diagonalisable. Si on pose Q = 1+X + - • • + Xn-1/(n-l)! G R[X], on a exp(iV) = Q(N). Comme N est nilpotente, sa seule valeur propre est 0 donc la seule valeur propre de Q(N) est Q(0) = 1 (voir la remarque 1 page 174). De plus, on a vu que Q{N) = exp(N) est diagonalisable ; elle est donc semblable à l'identité, donc égale à /, et donc N + • • • + Nn~l/{n — 1)! = 0. Autrement dit, le polynôme R = X + • • • + Xn~1/(n — 1)! annule N. Le polynôme minimal Un de N est de la forme IIjv = Xa puisque N est nilpotente. Comme R(N) = 0, on a IIjv = Xa \ R, ce qui entraîne que a = 1. Finalement, 0 = IIn(N) = N. En résumé, on a montré que B = D est diagonalisable. Soit P € G^n{^) tel que >-i P~lBP = (0) (0) An
204 4. RÉDUCTIONS D'ENDOMORPHISMES On a ,Ai (0) >-i -1 In = p-1 exp{B)P = exp(p-lBP) = (0) jAn donc pour tout j, exJ = 1, c'est-à-dire Xj € 2z7rZ. Réciproquement, si B est diagonalisable à valeurs propres dans 2Ï7rZ, on a facilement exp(B) = In. Les matrices B telles que exp(B) = In sont donc les matrices diagonalisables à valeurs propres dans 2inZ. 2/ a) Le résultat de la question 1/a) nous assure l'existence d'une matrice M telle que A = exp(M). En posant B = exp(M/p), on a Bp = exp(M) = A. b) Non ! Considérons une matrice nilpotente A dont l'indice de nilpotence est n, i. e. vérifiant An = 0 ^ An_1. Une telle matrice existe, par exemple le bloc de Jordan /0 1 (0) \ i4 = V 0 1 0/ Si A = Bp, alors An = Bnp = 0 donc B est une matrice nilpotente, donc Bn = 0 (en effet, d'après la remarque 6 page 177, Pb = (—l)nXn donc £n = 0 d'après le théorème de Cayley- Hamilton). Or 0 ^ An~1 = Bv^n~l\ donc forcément p(n — 1) < n, ce qui est impossible dès que n>2. 3/ Il suffit de montrer que G£n(C) est connexe par arcs. Soient P,Q € ^n(Q. Il existe deux matrices A et B telles que P = exp(A) et Q = exp(B). Le chemin <p : [0,1] —» A^n(C) £ >-► exp(£A + (1 — £)i?) relie continûment Q = exp(B) à, P = exp(A). De plus, pour tout t G [0,1], (p(t) est l'exponentielle d'une matrice, donc inversible. Finalement, (p relie continûment P et Q dans ^n(C), d'où le résultat. Remarque. Une matrice réelle inversible, même de déterminant positif, n'est pas forcément l'exponentielle d'une matrice réelle (voir l'exercice 2 page 186). 5. Problèmes Problème 1. Soit un entier n > 2 et / a b ••• b \ b a '•. : M = \b ••• b b a J eMn avec 6^0. a) Déterminer les valeurs propres de M et montrer que M est diagonalisable. b) Lorsque M est inversible, calculer l'inverse de M. c) Pour tout p G N, calculer Mp. Solution, a) La matrice M—(a—b)In n'est constituée que de 6, elle est donc de rang 1. Autrement dit dimKer[M — (a — b)In] = n — 1, ce qui montre que a — b est valeur propre de M et que le sous-espace propre correspondant est de dimension n— 1. Le polynôme caractéristique Pm de M s'écrit donc sous la forme PM = (-l)n[X - (a - b^-'iX -a), ae
5. PROBLÈMES 205 On sait que (n — l)(a — 6) + a = tr M = na, donc a = a + (n — 1)6 ^ a — 6, et a est valeur propre de M. La somme des dimensions des sous-espaces propres trouvés est égal à n, ce qui prouve que yi est diagonalisable, semblable à / a-b \ 0 a — b 0 ^ a + (n-l)6 y Au passage, si b ^ 0, le polynôme minimal de M est I1m = [X — (a — b)][X — (a + (n — 1)6)]. b) La matrice M est inversible si et seulement si il n'a aucune valeur propre nulle, autrement dit si et seulement si a — b ^ 0 et a + (n — 1)6 ^ 0. Dans ce cas, la relation nM(M) = 0 = M2 - (2a + (n - 2)b)M + (o - b)(a + (n - l)6)/n entraîne M[M - (2a + (n - 2)6)/n] = (6 - a)(a + (n - l)6)/n, donc M'1 = (a-6)(al(n-l)6) ^ + <» " 2>6>7» " ^ " c) On commence par effectuer la division euclidienne de Xp par 11^/. On sait que (3L> G R[X],3op,ft, G R), ^ = UM{X)D{X) + (c*pX + ft>). Dans cette dernière relation, en donnant à X les valeurs a — 6 et o + (n — 1)6, on obtient (o - b)p = 0 + ap(a - 6) + (3P et (a+(n- l)6)p = ap(a + (n - 1)6) + (3P, d'où (a + (n - l)b)P - (a - 6K _ (a + (n - l)6)(a - bf - (a - 6)(a + (n - 1)6)? ap = ^6 et ^ = ri • Finalement, on a Mp = D(M)UM(M) + otpM + (3pIn = apM + /3pIn. Problème 2. Soit M e M2(Z) telle qu'il existe un entier n G N* vérifiant Mn = I2. Montrer que M12 = I2. Solution. Regardons M comme une matrice de M2(C). Par hypothèse, Mn — I2 = 0, et donc le polynôme Xn — 1 annule M. Ce polynôme n'ayant que des racines simples dans C, M est diagonalisable dans M2{€) : 3P G Çl2(C), P~lMP = ( q °0 J = D avec a,/? G C. Comme Mn = J2, on a Dn = I2) donc an = f3n = 1. En particulier, \a\ = \0\ = 1 (*). Onaa + /? = tr.D = trMGZ. De (*), on en déduit a + (3 G {-2,-1,0,1,2}. - Si a + /? = 2, de (*) on tire a = (3 = 1. De même, si a + /? = -2, a = /? = -1. - Si a + (3 = 1, un peu de calcul montre grâce à (*) que (a, (3) = (e"i7r/3, ei7r/3) ou (a, 0) = (ei7r/3, e"^3). - Si a + /? = —1, on a de même (a, (3) = (e-2i"/\e2i"'3) ou (a, /?) = (e2i7r/3, e"2-/3). - Si a+/3 = 0, on (3 = -a. Or a(3 = det M G Z, donc a2 G Z, donc d'après (*), a2 G {-1,1}, d'où a G {—1,1,— i,i}. Donc K/?)G{(-i,i),(i,-i),(i,-i),H,i)}.
206 4. RÉDUCTIONS D'ENDOMORPHISMES Dans tous les cas, on voit que a12 = (312 = 1, ce qui prouve que D12 = li et donc M12 = J2. Problème 3. Soit E un C-e.v de dimension finie n G N*. 1/ a) Soit / G C(E) tel que Vp, 1 < p < n, tr(/p) = 0. Montrer que / est nilpotente. b) Pour tout u, v G £(E), on note [w, v] = uv — vu (crochet de Lie de u et i>). Soient f,g G £(£) tels que [[/,p],/] = 0. Montrer que [f,g] est nilpotente. 2/ Soient f,g G £(£) tels que pour tout p G {1,... ,n}, tr(/p) = tï(gp). Montrer que / et g ont même polynôme caractéristique. (On pourra utiliser le résultat de la remarque de l'exercice 3 page 80.) Solution. 1/ a) Il suffit de montrer que toutes les valeurs propres de M sont nulles (voir la remarque 6 page 177). Comme le corps C est algébriquement clos, il existe une base B qui trigonalise /. Notons Ai,..., Xq les valeurs propres de / (distinctes deux à deux), etoci,...,aq leur ordre de multiplicité dans le polynôme caractéristique de /. Les termes de la diagonale principale de [f]pB sont les puissances p-ièmes des termes de la diagonale principale de [/]# et on en déduit Vp, 1 < p < n, Yl <**? = tr^P) = °- i=l Raisonnons par l'absurde et supposons que / ait au moins une valeur propre non nulle. Quitte à renuméroter les Ai, on peut supposer que les Ai non nuls sont Ai,..., Ar (avec 1 < r < q) ce qui donne i=l Vp,l<p<r, ^<*iAf = 0. Ceci s'écrit matriciellement sous la forme ai M = 0 avec M = I Ai A2 X1 A2 Ctr Xr \ V Aï X\ K / G Mr(C). Ceci entraîne que M n'est pas injective et donc que det M = 0. Or 1 1 1 Ai A2 • • • Ar det M = Ai • • • Ar \i—1 \r—1 Al A2 \r—1 = Ai-.-A9 J] (A,-A,) l<i<j<r (on a affaire à un déterminant de Vandermonde). Comme det M = 0 et que les À; (1 < i < r) sont distincts deux à deux, on en déduit qu'il existe i < r tels que À; = 0, ce qui est absurde car nous avions choisit les (A;)i<;<r non nuls. Les valeurs propres de / sont donc toutes nulles, et donc / est nilpotente. b) La trace d'un crochet de Lie est toujours nulle car si u,v G C(E)y tr[u,v] = tr(uv — vu) = tr(uv) — tr(vu) = 0. Ceci étant, d'après la question précédente, pour montrer le résultat il suffit de montrer que pour tout p, 1 < p < n, tr([/,#]p) = tr[(fg — gf)p] = 0. Fixons un tel entier p. On a (fg - gf)p = (fg - gf)p-\fg - gf) = (fg - gfV^fg - (fg - gfT^gf, et comme / et (fg — gf) commutent par hypothèse, (fg - gff = f(fg - 9f)p-lg - (fg - gf^gf = [/, (fg - gff-'g}- D'après la remarque précédente, on a donc tr[(/# — gf)p] = 0, et ceci pour tout p, 1 < p < n, d'où le résultat.
5. PROBLÈMES 207 2/ Notons Ai,..., An les valeurs propres de / (répétées avec leur ordre de multiplicité). Comme plus haut, on obtient, en trigonalisant /, que tr(/p) = Af + • • • + A£. D'après les formules de Newton (voir l'exercice 3 page 80), les ap = ]T) X\ • • • Xp, polynômes symétriques élémentaires de C[Xi,. • •, Xn], s'expriment en fonction des sommes de Newton Sp = Ya=i Xf 0- — P — n)- ®n peut donc exprimer les coefficients du polynôme n£=i(^ — -X*) en fonction des Sp (1 < p < n). On en déduit que les coefficients du polynôme caractéristique riiLiC^ — ^ô ^e / s'expriment en fonction des tr(/p) = X)?=i A? (1 < p < n). Il en est de même pour #, et comme tr(/p) = tv(gp) pour 1 < p < n, on a Pf = Pg. Problème 4 (Endomorphismes de C(E)). Soit E un K-e.v de dimension finie n. Si u,v G £(E), on note Lu G C(C(E)) l'endomorphisme défini sur C(E) par Lu(f) =«o/, et on note Ry G C(C(E)) celui défini par Ry(f) = f ov. 1/ a) Calculer dim(KerLu) et dim(Ker.Ru) en fonction de dim(Kertt) et de dim(Kerv). b) Montrer que u (resp. v) est diagonalisable si et seulement si Lu (resp. Ry) est diago- nalisable. c) Donner les matrices de Lu et Ry dans des bases commodes. 2/ On note AU)V = LU-Rye C(C(E)). a) Si u et v sont diagonalisables, montrer que AUtV est diagonalisable. b) On suppose que Pu, le polynôme caractéristique de «, est scindé sur K. Si AUtU est diagonalisable, montrer que u est diagonalisable. Solution. 1/ a) On a / G Ker(Lu) «=>• u o f = 0 «=>• Im/ C Kerw, on en déduit Ker(Lu) = C(E, Ker u), d'où dim(KerLu) = ndim(Keru). Pour Ry, on a feKer(Ry) <^=> fov = 0 ^=> Imv C Ker/. Si S désigne un supplémentaire de Imv dans E, Ker Ry est donc isomorphe à £(S,E), d'où din^Ker-Ru) = ndimS = n(n — dim(Imv)) = ndim(Kerv). b) Si P G K[X], on vérifie facilement que P(LU) = LP^uy On a donc l'équivalence P(u) = 0 <^=>- V/, P{u) o f = 0 ^=> LP(tl) = 0 <^=>- P(LU) = 0. On en déduit que u et Lu ont même polynôme minimal. Donc d'après le théorème 2 page 175, u est diagonalisable si et seulement si Lu est diagonalisable. On procède de même pour Ry. c) Soit B = (ei,..., en) une base de E. On définit la base {eij)i<i,j<n de £(£) par f \ x x Jl sij = fc, ei,j{ek) = àjtkei avec d^fc = < 10 sinon. Notons [u]b = (ai,j)i<i,j<n la- matrice de u dans la base B. On a n n u ° eio,jo\ek) = Vjo,ku{eio) = °jo,k / vQi,io ei = / yai,io ei,jo\ek)) donc Lu(eitj) = ]T)ï=i o>k,i^k,j- Dans la base #1 = (ci,i,- •• »en)i; ei^,... , en>2;... ; ei)Tl,... ,en)n), la matrice de Lu s'écrit donc par blocs sous la forme M (0) [Lv]b1 = | ••. | , où M=[u]B. (0) M
208 4. RÉDUCTIONS D'ENDOMORPHISMES Si on écrit [v]b = (bi,j)i<i,j<n> un calcul analogue donne Rv(eij) = Sï=i fy,fcet,fc- Ceci entraîne que dans la base &2 = (ci.ii- •• iCi,n;e2,i,.. • ,e2,n;-- -;en,i,.. • ,en,n), la matrice de Ry s'écrit / 'N (0) \ [Rv}B2= "-. , Où N=[V]B. V (0) 'N ) 2/ a) On sait déjà que Lu et Ry sont diagonalisables d'après 1/b). Or V/g£(£), Luo Rvif) = uo f ov = Rviuo f) = Rv o Lu{f), c'est-à-dire que Lu et ily commutent. On peut donc les diagonaliser dans une même base, et cette base diagonalise Au>v = Lu — Ry. b) Comme Pu est scindé sur K, on peut écrire (décomposition de Dunford, voir la partie 4.2 page 193) u = d + n, d diagonalisable, n nilpotente, avec nod = don. Pour alléger les notations, on note, pour / G C(E), Af = Afj. On a Au = Ad + An. Or il existe p G N* tel que np = 0, ce qui entraîne {An)p = AnP = 0, c'est-à-dire que An est nilpotent. D'après 2/ a), Ad est diagonalisable. Les endomorphismes d et n commutant, L</> P<f, Ln et Rn commutent, donc Ad et An commutent. Au = Ad + ;4n est donc Y unique décomposition de Dunford de Au. Comme Au est diagonalisable, on a donc An = 0, c'est-à-dire que pour tout / G C(E), no/ —/on = 0. En d'autres termes, n commute avec tous les éléments de C(E) ; c'est donc une homothétie. Or n est nilpotente, donc n = 0, et donc u = d est diagonalisable. Remarque. Une conséquence de 1/ a) est que pour tout À, dim(Ker(Lu — Aid)) = ndim(Ker(u — Aid)). Cette égalité permet également de montrer 1/b). Avec 1/c), on aurait pu démontrer directement 1/a) et 1/b). Problème 5 (Résultant de deux polynômes et application). 1/ Résultant de deux polynômes, a) Soient P et Q deux polynômes non constants de C[X). Montrer que P et Q ont un facteur commun non constant si et seulement si (3A, B e C[X], A^0,B^0), AP = BQ avec deg(^) < deg(Q), deg(£) < deg(P). b) Pour tout r G M, on note Tr = {P e C[X] | degP = r}. Pour tout m,n G N*, déterminer une fonction continue R: rmxrn^C (P, Q) h» R[P, Q] vérifiant (P et Q sont premiers entre eux) 4=> (R[P,Q] ^ 0). 2/ Soit n G N*. On note D l'ensemble des matrices diagonalisables de M.n{€). Quel est o D, l'intérieur de D ? Solution. 1/ a) Condition nécessaire. Supposons l'existence de R G C[X], deg(R) > 1, divisant P et Q. Soient Pi et Ri G C[X] tels que P = #Pi et Q = tfQi. Si A = Qx et B = P1} on a AP = flPiQi = PQ avec deg(A) = deg(Qi) < deg(Q) et deg(P) = deg(Pi) < deg(P). Condition suffisante. Supposons que P et Q n'aient aucun facteur commun non constant, c'est- à-dire que P et Q sont premiers entre eux. Si AP = BQ, d'après le théorème de Gauss, on a P | B. Comme B ^ 0, ceci entraîne deg(P) > deg(P), ce qui est absurde. b) Soit P = a0 -I- ai X + • • • + am Xm G Tm et Q = b0 + fei X + • • • + bn Xn G Tn. D'après la question précédente, P et Q ont un facteur premier non constant si et seulement il existe
5. PROBLÈMES 209 A, B € C[X] non nuls, deg(A) < deg(Q) et deg(B) < deg(P) tels que AP = BQ, autrement dit si et seulement si les vecteurs P, XP,..., Xn~1P et Q, XQ,..., Xm~1Q forment une famille liée de C[X], c'est-à-dire si et seulement si detB(P,XP,...}r-1?,Q,XQ,...,Xm-XQ) = 0, où B désigne la base (1, X,..., xm+n~1) de Cm+n-i[X]. En d'autres termes, P et Q ne sont pas premiers entre eux si et seulement si le déterminant R[P, Q) = dQ 0 0 bo 0 0 ai ao h ai 0 bn-\ • • • 0 Q>m . ao &n &n-l bo 0 &m ai 0 K K-\ 0 0 ^m 0 0 bn est nul (ce déterminant est appelé résultant de P et Q). Ainsi définie sur Tm x Tn, i? est une fonction continue de P et Q (car polynomiale en les coefficients de P et Q), et vérifie : P et Q sont premiers entre eux si et seulement si R[P, Q] ^ 0. o 2/ Un peu d'intuition nous guide. Nous allons montrer que D = T, où T désigne l'ensemble des matrices diagonalisables dont les valeurs propres sont toutes distinctes. o Montrons rcD. Soit M G T. Dire que M G T équivaut à dire que le polynôme caractéristique Pm de M n'a que des racines simples, ou encore que Pm et P'M sont premiers entre eux, ou encore R[Pm,P'm] i1 0. L'application <P : Mn(Q -+ C Mh ^[Pm,P'm] est continue. On vient de voir que V = 99_1(C*), et donc F est ouvert (image réciproque d;un o ouvert par une fonction continue). Or F C D, donc rcD. o o Montrons D C F. Soit M € D et supposons M g F. La matrice M est diagonalisable et admet une valeur propre multiple A, de sorte qu'il existe P G £4i(Q telle que / A P-XMP = A 0 \ A3 0 \ Pour tout entier p > 0, on pose I A \ A Mp = 0 An / \ A3 0 \ An / A I Pour tout p, Mp n'est pas diagonalisable, sinon la restriction I p 1 de Mp aux deux premiers vecteurs de la base canonique de Cn serait diagonalisable, absurde car alors cette matrice serait semblable à A/2, donc égale à A^- Or M = rimp_>+00 PMvP~l, donc M est limite d'une suite o de matrices n'appartenant pas à D, donc M £ D. Ceci est absurde, et on a donc avoir M € T. D'où le résultat.
210 4. RÉDUCTIONS D'ENDOMORPHISMES Remarque. On peut montrer (voir la démonstration de l'exercice 1 page 185) que F est dense dans Mn(C). Problème 6 (Rayon spectral d'un endomorphisme continu). Soit E une algèbre de Banach sur C, munie d'une norme d'algèbre || • ||. 1/ Soit u G E, u ^ 0. Pour tout n G N*, on note Un = ||un||1/n. a) Soit m G N* fixé. Prouver que Ve > 0, 37V G N, Vn >N,Un< Um{\ + e). b) Soit p(u) = inî{Un \ n G N*}. Montrer que limn^+00 Un = p(u). c) Pour tout u,v G E, montrer que p(uv) = p(vu). 2/ Soit ^2anzn une série entière de rayon de convergence R G ]0, +oo]. Soit u G E. Si p(u) < R, montrer que ^2anun converge dans E. Si p(u) > R, montrer que J2anun diverge. 3/ On considère ici le cas particulier où E = Mn(C). Soit A G Mn(C). Montrer que p(A) = sup{|À| | À valeur propre de A}. (Indication. On pourra utiliser le résultat a) de l'exercice 5 page 188.) Solution. 1/ a) Pour tout n G N*, on considère n = q(n)m + r{n), 0 < r(n) < m, la division euclidienne de n par m. On a Vn G N*, Un = |K||1/n = \\uq^m • ur^\\l'n < ||um||9^/n • ||w||r^/n. (*) Pour tout n, \r(n)\ < m donc \imn^+00r(n)/n = 0 et limn_>+00q(n)/n = 1/ra. Le terme de droite de (*) tend donc vers Um lorsque n tend vers l'infini, d'où a). b) Soit e > 0. Par définition de p(u), il existe m G N* tel que Um < p(u) + e. D'après a), 3N G N, Vn > MN, Un < Um{\ + e) < {p{u) + e){\ + e) donc Vn > N, p(u) <Un< (p(u) + e){l + e). On en déduit que limn_>+00 Un = p{u). c) Si u = 0 ou v = 0, c'est évident. Sinon, l'égalité (uv)n = u(vu)n~lv entraîne HMi1/" = \\u{vu)n-lv\\l/n < llwll^llM""1!!17"!!^!!17"- (**) Or lim ||w||1/"= lim ||w||i/» = l et lim ||(tm)n-1||1/n = lim (IKvt*)**-1 ||i/(«-i>)(»-i)/~ = n—>+oo n^+oo n^+oo n—>+oo p(vu). En faisant tendre n vers l'infini dans (**), on obtient donc p(uv) < p(vu). Par symétrie, on a de même p(vu) < p(uv), d'où l'égalité recherchée. 2/ Supposons p(u) < R. Nous allons montrer que ]T) \an\ • \\un\\ converge, ce qui entraînera que la suite (]C/k=o ak uk)neN* est de Cauchy donc converge. Soit \i e R tel que p(u) < \i < R. Comme R est la rayon de convergence de la série entière J2n anzn,Yj \an\ Hn converge (voir le tome d'analyse sur les séries entières). Or il existe iVGN*, tel que pour tout n > N, \\un\\l/n < /i, et donc \\un\\ < p,71. On en déduit que J2n>N M hn\\ converge et donc J2neN \an\ \\uTl\\ converge. Supposons maintenant p(u) > R. Alors la suite (\an\p(u)n) n'est pas bornée. Comme p(u) = inflH^H1/71} on a pour tout n, \\un\\ > p(u)n et donc la suite (\an\ \\un\\) n'est pas bornée, ce qui entraîne la divergence de la série ]T)an^n- 3/ Notons fi(A) = sup{|À| | À valeur propre de A}. Remarquons ici que p(A) ne dépend pas de la norme d'algèbre choisie sur Mn(C) (en effet, en dimension finie, les normes sont équivalentes et pour tout x > 0, limp_>+00 xl/p = 1). Toute l'astuce va consister en le choix d'une bonne norme d'algèbre pour montrer notre résultat.
5. PROBLÈMES 211 Soit e > 0. Montrons qu'il existe une norme d'algèbre ||-|| sur Mn(C) telle que \\A\\ < n{A)+e. Munissons Cn de la norme ||(œi,... ,£n)||oo = supf |a?»|. Pour tout M = {mi,j)i<ij<n € Mn(C), ||M||oo = suP||X||in/t =i ||-W-X"||oo défini une norme d'algèbre sur Mn(C). Un petit calcul donne d'ailleurs facilement ||M||oo = sup(J^ |mij|). (***) * j D'après la question a) de l'exercice 5 page 188, il existe P G Çên(C) telle que P~lAP = T = (Uj) soit triangulaire supérieure et vérifie \fi < j, \tij\ < e/n. Munissons Mn(C) de la norme d'algèbre \\M\\ = WP^MPWoq. De (***), on tire facilement ||i4|| = ||r||oo < sup; \titi\ + e. Les tiyi étant les valeurs propres de T donc de A, ceci s'écrit aussi ||j4|| < fi(A) + e. Donc p(A) = {inf pi1/*, p e N*} < ||A|| < v(A) + e. La matrice T = (Uj) étant triangulaire supérieure, les coefficients de la diagonale principale de la matrice Tp sont les iPii et donc d'après (***), pour tout p, PI Hl^lcx, > SUP MP = /W, i ce qui s'écrit aussi ||j4p||1/p > fJ>(A). En faisant tendre p vers l'infini, on obtient p(A) > fJ,(A). Finalement, on a montré que fi(A) < p(A) < fi(A) + e, et ceci pour tout e > 0, d'où l'égalité recherchée. Remarque. Les résultats de 1/ et 2/ restent vrais sur l'algèbre des endomorphismes continus CC(E) sur un espace de Banach E (on sait en effet que CC(E) est une algèbre de Banach). On a ainsi généralisé le résultat du théorème 3 page 183. Problème 7. Soit E un C-e.v de dimension finie n > 2. Soit A une sous-algèbre de C(E), unitaire, (i. e. Id# G A) et transitive (i. e. les seuls s.e.v de E stables par tous les éléments de ,4 sont {0} et E). a) Soit x e E, x ^ 0. Montrer que {u(x) \ u G A} = E. b) Soit u e A, vgu > 2. Montrer qu'il existe v G A tel que uvu et u forment une famille libre. c) Montrer qu'il existe ÀeCet^Glmu, z^O, tels que uv(z) = Xz. d) Montrer que A contient au moins un élément de rang 1. e) Conclure. Solution, a) On pose Fx = {u(x) \ u G A}. Une sous-algèbre est un s.e.v de C(E)y donc A est un s.e.v de C(E). On en déduit que Fx est un s.e.v de E. Pour tout v G j4, v(Fx) = {vu(x) \ u € A] C Fx. En d'autres termes, Fx est stable par tous les éléments de A. Or Fx ^ {0} puisque x G Fx (l'algèbre A est unitaire), et donc Fx = E. b) Comme rgu > 2, il existe deux vecteurs ei, e<i de E tels que ^(ei) et ufa) forment une famille libre. En particulier, u(e\) ^ 0 donc d'après a), il existe v G A tel que v[^(ei)] = e2. La famille formée par uvu et u est donc libre car l'égalité X(uvu) + ym = 0 entraîne \{uvu){e\) + nu{e\) = 0 = Xu(e2) + Am(ei), et donc À = \i = 0 puisque par construction, la famille u(ei), ufa) est libre. c) Le corps C est algébriquement clos et E est de dimension finie, l'endomorphisme uv admet donc au moins une valeur propre À. On traite deux cas. Premier cas : l'endomorphisme uv admet au moins une valeur propre À ^ 0 associé à un vecteur propre z ^ 0. Alors z = \uv(z) elmuet le résultat est montré. Second cas : toutes les valeurs propres de uv sont nulles. Dans ce cas, uv est nilpotent. Soit r G N* tel que (uv)r = 0 et (uv)r~l ^ 0. Soit z G lm(uv)r~l, z ^ 0. Alors uv(z) = 0 car uv(z) G lm(uv)r = {0}. Or r > 2 car d'après b), uv ^ 0. Donc z G Im(m>)r~1 C Imu. En résumé, on a trouvé z G Imu, z ^ 0, tel que uv(z) = 0.
212 4. RÉDUCTIONS D'ENDOMORPHISMES d) L'algèbre A étant unitaire, il existe u G A tel que rgu > 2. On a alors trouvé v G A, v ^ 0 tel que uvu et u forment une famille libre, et tel que (3z G Imu, z ^ 0, 3X G C), uv(z) = Xz. Posons w = uvu — Xu. On a w G A car A est une algèbre. On a w ^ 0 d'après b). On a Keru C Kerw car w = (uv — Àld) o u. Par ailleurs si y e E est tel que z = u(y)> on a w(y) = uv(z) — Xz = 0. L'inclusion Kevu C Kerw est donc stricte, car y $ Keru et y e Kerw. Donc dim(Keru) < dim(Kerw), et on conclue avec le théorème du rang que rgu; < rgu. Autrement dit, pour tout u G A, rgu > 2, il existe w G A, 1 < rgu; < rgu - 1. Ceci suffit pour conclure que A contient au moins un élément de rang 1. e) On va montrer que A = C(E). Pour cela, il suffit de montrer que A contient tous les éléments de C(E) de rang 1. Le lemme suivant nous sera utile. Lemme Soit u G C(E), rgu = 1. Alors il existe a G E, a ^ 0, et il existe (p e E* (dual de E), (p ^ 0, tels que \/x G E, u(x) = (p(x) • a. En effet. Soit a G E tel que Imu = Vect a. Pour tout x G E, u(x) G Imu donc il existe (p(x) G C tel que u(x) = (p(x) • a. La linéarité de u entraîne la linéarité de x ■-» y>(x). Autrement dit, (p est une application linéaire de E dans C, c'est-à-dire (p e E*. Ceci étant, la question précédente assure l'existence de uq G A tel que rguo = 1. D'après notre lemme, il existe a G £, a ^ 0 et (p G £*, (p ^ 0, tels que uq = (p • a. Soit v G £(£) un autre élément de rang 1. On veut montrer v e A. Écrivons v = ij> • 6, où b G E et t/; G E*. On a a 7^ 0 donc d'après a), il existe w G A tel que w(a) = 6. Considérons G = {(p o u\\ u G j4}, s.e.v de S*. Soit a; appartenant à l'orthogonal G° de G. Pour tout u G j4, (99 o u)(x) = 0 donc pour tout wG A, u(x) G Ker<£>. En d'autres termes, Fx = W#) | ^ G ^4} c Ker<£> ^ S. D'après a), on doit donc avoir x = 0. Finalement, G° = {0} et donc G = E*. Il existe donc £ G A tel que (pot = i/;. Alors pour tout x G E, (wuot)(x) = w[((po t)(x)a] = i/j(x)w(a) = %l){x)b = v(x), donc v = wuot G A. L'ensemble A contient donc tous les éléments de rang 1. Ceci suffit pour conclure que A = C(E) (on montre en effet facilement que tout endomorphisme est somme d'endomorphismes de rang 1). Problème 8. Soit E un C-e.v de dimension finie, G un sous-groupe fini de G£(E). Soit F = {x e E \\fg e G,g(x) = x}. Siq = Card(G), montrer g-dimF = ^tr(#). geG Solution. Comme G est un groupe, pour tout h G G, l'application G —> G g \-> h o g est bijective. Ceci entraîne V/iGG, X> = E/l°2' geG geG ce qui en posant / = J2geG9 s'écrit / = h o /, et ceci pour tout h G G. On a donc heG heG heG Le polynôme X(X — q) annule donc Pendomorphisme /. On en déduit que / est diagonalisable et que ses valeurs propres sont éléments de {0, q}. Si Eq désigne le sous-espace propre de / associé à la valeur propre g, on a alors qdimEq = tr / = YlgeG tr#-
5. PROBLÈMES 213 L'exercice sera donc résolu si on prouve Eq = F. On a déjà F C Eq. En effet, V# G F, Vp € G, <7(#) = x donc /(x) = ^ #(#) = Y^ a; = qx. geG g€G L'inclusion réciproque est également vraie. En effet, si x G Eq et g G G, gof(x) = g(qx) = qg{x). Or go f = f, donc (# o /)(x) = f(x) = qx, ce qui entraîne çp(:r) = qx, et donc x e F, d'où le résultat. Problème 9. Soit E un C-e.v de dimension quelconque, et u,v e C(E) vérifiant uv — vu = a Id#, a G C. a) Si E est de dimension finie, montrer a = 0. b) Si .E est norme et u et v continus, montrer a = 0. c) Si v admet un polynôme minimal, montrer a = 0. d) Exhiber deux endomorphismes u et v vérifiant uv — vu = Id^. Solution, a) Si «v — im = alds, alors tr(uv — vu) = o:tr(Id£) = adimE. Or tr(uv — vu) = tv(uv) — tr(t>u) = 0, donc adimE = 0, ce qui entraîne a = 0. b) Une récurrence facile donne la propriété VfcGN*, uvk -vku = kavk~1. (*) Ceci étant, soit ||-|| la norme d'algèbre sur CC(E) issue de la norme sur E (\\u\\ = supi^ii-! ||u(:r)||). D'après (*), on a Vfc G N*, k\a\ • Ht;*"1!! < ||uw*|| + \\vku\\ < 2\\u\\ • \\vk\\ et donc VA; G N*, k\a\ ■ \\vk\\ < k\a\ ■ «v*"1!! • \\v\\ < 2\\u\\ • ||v|| • ||v*||. (**) Si pour tout k,vk^0 alors (**) entraîne que pour tout k, k\a\ < 2\\u\\ • ||v||, ce qui n'est possible que si a = 0. Sinon, il existe k G N* tel que vk = 0 et vfc-1 ^ 0. L'identité (*) entraîne alors ka = 0, donc a = 0. c) Soit P le polynôme minimal de v. Par linéarité, l'identité (*) entraîne 0 = uP(v) - P{v)u = aP'{v). Or P'(v) 7^ 0 car P est le polynôme minimal de v. Donc a = 0. d) Les questions précédentes montrent déjà que l'on doit se placer en dimension infinie, considérer des endomorphismes non continus et n'admettant pas de polynôme minimal. On choisit uetve C{C[X}) définis par u(P) = P' et v(P) = XP. Alors pour tout P G C[X], {uv - vu){P) = u{XP) - v(P') = (P + XP') - XP' = P, donc uv — vu = Idqx] • Remarque. Il n'y a aucun lien entre la continuité et le fait d'admettre un polynôme minimal. Munissons par exemple R[X] de la norme || Yl1k=oakXk\\ — siip*. |ofc|. L'endomorphisme v de R[X] défini sur la base canonique de R[X] par v(Xn) = Xn/{n + 1) est continu mais il admet une infinité de valeurs propres, donc pas de polynôme minimal. L'endomorphisme v de R[X] défini par v(X2n) = nX2n+1 et v(X2n+1) = 0 n'est pas continu mais admet un polynôme minimal car v2 = 0.
214 4. RÉDUCTIONS D'ENDOMORPHISMES Problème 10. Soit K un corps commutatif et E un K e.v de dimension n > 2. Soient u,v e C(E) et w = uv — vu tel que rg(u>) = 1. a) Soit x elmw. Montrer que pour tout A; G N, uk(x) G Keru>. b) En déduire que le polynôme caractéristique Pu de u n'est pas irréductible dans K[X]. Solution, a) Commençons par remarquer que w est nilpotent (ceci découle de l'exercice 2 page 170, car rg(tu) = 1 et tr(tu) = tr(uv) — tr(vu) = 0). Ceci étant, soit fc 6 N. On a wuk = u(vuk) — (vuk)u donc tr(wuk) = 0. Si wuk = 0, alors wuk(x) = 0, c'est-à-dire ^fe(x) G Kerw. Sinon, rg(umfc) > 1. Or lm(wuk) C Imw, donc rg(wuk) < 1. On a donc rg(wuk) = 1, de sorte que comme tr(wuk) = 0, wuk est nilpotente. Comme x elmw, que wuk(x) G Imw et que dim(Imu>) = 1, on voit que x est vecteur propre de wuk. L'endomorphisme wuk étant nilpotent, on en déduit que wuk(x) = 0, i. e. uk(x) G Kerw. b) L'idée est de trouver un s.e.v strict de E stable par u. Fixons x G Imw, x ^ 0. Soit F = {uk(x) | A; G N}. Le s.e.v G = Vect F est stable par u. Comme x ^ 0, on a même G ^ {0}. Par ailleurs, d'après a), on a G C Kerw. En notant p = dimG, on en déduit 1 < p < dimKerw = n — rgw = n— l. Soit (ei,..., ep) une base de G complétée en une base (ei,..., en) de E. On a [u]b = ( o C ) ' Ae ^(K)' C e M"-p(KÎ> donc Pu = Pa* Pc n'est pas irréductible dans K[X]. Problème 11. Soient A et B G Mn(C). a) Montrer que (3P G Mn(C), P ï 0), AP = PB si et seulement si A et B ont au moins une valeur propre commune, b) Soit r G N, 0 < r < n. Montrer que s'il existe P G .Mn(C) avec rgP = r tel que AP = PB, alors les polynômes caractéristiques Pa et Pb de A et B vérifient deg(pgcd (Pa, Pb)) > r. La réciproque est elle vraie? Solution, a) Avant de commencer, remarquons que si P est inversible, AP = PB s'écrit P~1AP = B, donc A et B sont semblables et le résultat est évident. Le cas général est plus délicat. Condition nécessaire. Donnons deux méthodes. Première méthode. Par récurrence sur fe 6 N, on a facilement AkP = PBk, donc pour tout polynôme F G C[X], F(A)P = PF(B). (*) Ceci étant, supposons que A et B n'ont aucune valeur propre commune. Alors les polynômes caractéristiques Pa et Pb de A et B n'ont aucune racine commune dans C et sont donc premiers entre eux. D'après le théorème de Bezout, il existe donc U, V G C[X] tels que UPa + VPb = 1. On a alors U(B)PA(B) = Jn, et donc Pa(B) est inversible. Or PA(A)P = PPa(B) d'après (*), donc PPa(B) = 0, et comme Pa(B) est inversible, ceci entraîne P = 0. Ceci est absurde, d'où la condition nécessaire. Seconde méthode. Soit (ei,... ,en) une base de Cn qui triangularise la matrice B. Pour tout z, on a Bei = Xiei + Ylj<i ^hjej- Soit i le plus petit indice tel que Pe{ ^ 0 (i existe, sinon P = 0). Alors APei = PBei = P À;e* + J^&zje, = XiPeiy donc Xi est valeur propre de A (un vecteur propre associé est Pe^), donc valeur propre commune à A et B.
5. PROBLÈMES 215 Condition suffisante. Trigonalisons A supérieurement et B inférieurement, en supposant que À G C est valeur propre commune à A et B : il existe Pi, Pi € G£n{^) tels que / A x ••• x \ / A 0 ••• 0 \ 0 x '•• : | . „ . i„_ I x x T = P{lAPi = SiY = ( 1 0 0 0 V 0 0\ 0 / •• x 0 x / et S = P2lBP2 = V x '•• 0 X X / >-l , on a TY = XY et YS = XY. Ainsi, {P^AP^Y = Y{P2~lBP2), et y 0 0 ••• 0 en multipliant à gauche par Pi et à droite par P2_1 on obtient AP = PB avec P = P\YP2~1 ^ 0. b) Le cas r = 1 est une conséquence du résultat de la question précédente, et lorsque r = n c'est immédiat car les matrices A et B sont alors semblables, donc ont même polynôme caractéristique. Pour traiter le cas général, on se ramène au cas plus simple où la matrice P est de la forme Jr = (^ q). Comme la matrice P est de rang r, elle est équivalente à la matrice Jr ce qui s'écrit P = QJrR avec Q, R e G£n(C). On a donc A(QJrR) = (QJrR)B donc A'Jr = JrB', avec A' = Q~lAQ et B' = RBR~l. La matrice A! est semblable à A donc Pa> = P4, de même Pb> = Pb- En écrivant les matrices A! et B' par blocs sous la forme A! = (*? *} ) et B' = (^ %} ) (avec A'0 et B'0 dans Mr{C)) l'égalité A'Jr = JrB' s'écrit A' A' B', donc B'o B[ \^2ra3/\uu/ \ " v ; \ -lj2 ^3 / \ ^2 ce qui entraîne A'0 = B'0, A'2 = 0 et B[ = 0. En notant S = A'0 = B'0, on a donc 0 0 A! = A', et B' = 0 B', et l3 / \ ^2 ^3 Ceci montre que Pa> = P5P/1' et Pb> = PsPb' > donc le polynôme P5 divise P4 = P4 ^Pb = Pb'> et comme deg(Ps) = r ceci entraîne bien deg(pgcd (P4, P^)) > r. La réciproque est vraie lorsque r = 1 (on a exhibé une matrice P de rang 1 vérifiant AP = PB dans la solution de la question précédente), mais fausse dans le cas général. Par exemple, lorsque r = n avec n > 2, on peut avoir Pa = Pb sans que A et B vérifient AP = PB avec rg(P) = n, car ceci impliquerait que P est inversible, donc A et B seraient semblables. Or deux matrices ayant même polynôme caractéristique ne sont pas forcément semblables, comme le montre le contre-exemple où A = 0 et B une matrice nilpotente non nulle. Problème 12. Soit A e Mn(C). Montrer que det(J + ÂÀ) e R+. (Indication : si U est un vecteur propre de A A associé à une valeur propre À 0 R+, montrer que V = AU est aussi un vecteur propre de AA, et que la famille (U, V) est libre). Solution. Nous procédons par récurrence sur n. Si n = _1 le résultat est immédiat. Supposons maintenant n > 2. Si toutes les valeurs propres (À^) de A A sont des nombres réels positifs, alors en trigonalisant AA on s'aperçoit que det(/ + AA) = Y\iQ + ^i)> donc a bien det(7 + AA) e R+. Sinon, la matrice AA a au moins une valeur propre À ^ R+. Soit U un vecteur propre associé. Le vecteur V = AU vérifie AAV = AAAU = A(AAU) = AXU = XV. La famille (Z7, V) est bien libre, car si on avait V = fiU avec fi G C, alors on aurait XU = AÂU = AV = JiAÛ = W = \V>\2U
216 4. RÉDUCTIONS D'ENDOMORPHISMES donc A = |/i|2 ce qui est impossible puisque A £ R+. Si n = 2, la famille (£/, V) est une base de vecteurs propres de A A associés aux valeurs propres A et A, et en diagonalisant A A on obtient det (I+AÂ) = (1 + A)(1+Â) = |1 + A|2 e R+. Sinon n > 2, et on complète la famille (£/, V) en une base B de Cn. Notons P la matrice de passage de la base canonique (E\,..., En) de Cn à la base , _ / ao \ B. On a la forme par blocs P lAAP = [ o A I mais pour appliquer l'hypothèse de récurrence, il faut montrer que le bloc inférieur droit est de la forme MM, ce qui n'est pas immédiat a priori. Afin de montrer ce résultat, on remarque que P~lAAP = BB où B = P~lAP. Les matrices B~B et ÀÂ sont semblables, donc / + BB et I + Al également, d'où det(7 + BÎB) = det(J + Al). Comme PE\ = U et PE2 = V et que les vecteurs E\ et E2 ont leurs coordonnées réelles, on a BEi = P^ÀPEx = P~lAV = P~lV = E2) BE2 = P-1A~PE2 = P~lAV = P~lA~ÀU = \P~lU = XEV Ceci montre que la matrice B a la forme par blocs B = 0 A 1 0 0 C donc BB = D A 0 0 Â 0 E DD Cette écriture entraîne det(7 + BB) = |1 + A|2det(7 + DD)y et ceci est bien un nombre réel positif d'après l'hypothèse de récurrence appliquée à la matrice DD. Remarque. _D'après l'exercice 3 page 187, le polynôme caractéristique de AA est égal à celui de AA. Ceci entraîne PA-% = PAA = PAA-, donc PAA- a ses coefficients réels. En particulier, det(/ + >L4) = PAA(—1) G 1R, mais ceci est un résultat moins fort que det(J + ÀÀ)e Problème 13. Soit p un nombre premier. On considère la matrice A = ( Q>0 Cil ' ' ' flp-2 Ûp-1 \ <2p_i ao a\ ap-2 : ap-i ao '• : • ■ o-i \ ai op_i a0 / avec pour tout i, ai G Z. Montrer que det A = ao + ai H h ap_i (mod p). Solution. Cela ressemble à l'exercice 4 page 180. On commence de la même manière. Soit /O 1 (0) \ J = 0 \ 1 0 1 0/ eMn On avait montré à l'exercice 4 page 180 que le polynôme caractéristique de J est Pj = (—1)P(XP— 1), et que A = Q(J), où Q = ao + oi X -\ 1- op_iXp_1 G 1\X\. Regardons A et J comme des matrices à valeurs dans Z/pZ. Dans Z/pZ, Pj = (-l)p(Xp - i) = (~l)p(X - i)p. Comme A = Q(J), on a alors Pa = (—1)P[X — Q{ï)]p (pour s'en rendre compte, trigonaliser J dans Mp(Z/pZ) — voir la remarque 1 page 174), donc det A = Q(l)p = Q(l) = a0 + • • • + ap_i (mod p).
5. PROBLÈMES 217 Problème 14. Le polynôme caractéristique Pa d'une matrice A G Mn(C) peut s'écrire PA = (-l)n (Xn + fl(A)Xn~1 + • • • + fn.1(A)X + fn(A)), où les fi(A) sont des polynômes en les coefficients de A. a) Montrer que pour toutes matrices A,Be A4n(C), on a fi{AB) = fi(BA) pour tout i. b) Réciproquement, soit Q : Mn(C) —*■ C A = (ûtjOi^tjXn ■-* Q(^) une fonction polynôme en les coefficients aij de A. Si pour toutes matrices A, B G .Mn(C), on a $(AB) = Q(iL4), montrer qu'il existe un polynôme F G C[Xi,... ,Xn] tel que WlG.Mn(C), Q(i4) = F(/1(A)>...>/n(i4)). Solution, a) Il s'agit de prouver que Pab = Pba pour tous A, B € Mn(C), ce qui est précisément le résultat démontré dans l'exercice 3 page 187. b) C'est plus délicat. Commençons par noter que deux matrices semblables prennent la même valeur par Q (si B = P~lAP avec P G Q£n(C), on a Q(B) = Q((P-1A)P) = Q(P(p-lA)) = Q(A)). Cette remarque va nous permettre de traiter aisément le cas des matrices diagonalisables, puis de toutes les matrices par densité (les matrices diagonalisables forment un ensemble dense dans Mn(C)y voir l'exercice 1 page 185). Pour tout n-uplet (Ai,...,Àn) de Cn, on note £>(Ài,... ,Àn) la matrice diagonale dont le coefficient d'indice (z,i) est À;. L'application Cn —> C (Ai,..., Àn) ■-» Q(D(\i,..., Àn)) est une fonction polynôme en les À; que l'on note II. Supposons maintenant A diagonalisable et notons Ai,..., Àn ses valeurs propres. Pour toute permutation a G <Sn, A est semblable à la matrice diagonale Aa = D(Xa^^..., Aa(n)), ce qui prouve que Q(A) = Q(Aa) = Yl(\a{1),...,\a{n)). Ceci étant vrai pour tout a G Sn et pour toute matrice diagonalisable Ay on en déduit que II est un polynôme symétrique en ses n variables. On peut donc l'écrire comme un polynôme F en les polynômes symétriques élémentaires Ei,... ,En (voir le théorème 1 page 78). On sait que la valeur ai prise par E; au point (Ai,...,Àn) est (—l)lai où a; est le coefficient de X1 dans le polynôme IlILi^ "~ ^)- ^e dernier polynôme étant égal à (—l)nP.4, on en déduit que ai = (-lYfi(A). Finalement, Q(A) = F(au ...,an) = F(-h(A),..., (-l)n/n(^)). (*) Cette égalité est vraie pour toute matrice diagonalisable A. Les matrices diagonalisables formant un ensemble dense dans Mn(C), les applications de l'égalité (*) étant des fonctions continues de A (ce sont des fonctions polynômes), on en déduit que (*) est vrai pour toute matrice A de Mn(C). Problème 15 (Dérivée d'un déterminant, algorithme de Faddéev). Le but du problème est de proposer une méthode pratique efficace pour calculer le polynôme caractéristique d'une matrice. 1/ (Dérivée d'un déterminant). On considère A : M -► Mn(R) t» A(t) = (a^t)) une application dérivable sur R. Montrer que l'application (p : t *-* det(A(t)) est dérivable sur R et que n <pf(t) = Y^ det(Ci(i),..., CUiW, CÎW, Ci+1(t),. • •, Cn(t)), où Ci(£),..., Cn(t) désignent les vecteurs colonnes de la matrice A(t).
218 4. RÉDUCTIONS D'ENDOMORPHISMES 2/ (Méthode de Faddéev pour le calcul du polynôme caractéristique d'une matrice). Soient K un corps commutatif et une matrice A G .Mn(K). On note \a = det(A7n - A). a) Montrer que x'a = tr[com(XIn — A)] où com(XIn-A) désigne la comatrice de XIn—A. b) On définit des matrices B0,..., Bn-\ G Mn(K) par Montrer B0 = In et Vfc,l<A;<n-l, Bk = ABk-1-t^ ^k l>In. Xa(X) = X" - tv(AB0)X^ - 1<^AX^ tr(^-l) 2 n et si A est inversible, A~l = —^—zBn- n tr(i4Bn_i) <p'(t) = £ e(a) aeSn Solution. 1/ L'expression tp(t) = detA(t) = Y^ sW^iW'"^!') aeSn montre que (p est dérivable et permet d'obtenir, par dérivation, n 22 aa(l),l(*) ' ' ' ^€7(fc-l),fc-l(*) <£(*),*(*) a^(fc+l),fc+l(*) ' ' ' aa(n),n(*) Jfe=l ce qui, en échangeant l'ordre des signes sommes, est précisément le résultat demandé. 2/a) Le résultat de la question 1/ reste valable pour les polynômes dérivés (la démonstration peut être reprise telle quelle). En l'appliquant au polynôme dérivé de xa(X) = det(XIn — A)y on s'aperçoit que XaC^O est ^a somme des cofacteurs des éléments diagonaux de XIn — A, autrement dit X'a(x) = tr[com(X/n - A)]. b) Écrivons xa = Xn + a\ Xn~l + h an_i X + an. Chaque cofacteur de la matrice XIn — A est un polynôme en X de degré au plus n — 1, ce qui montre l'existence de matrices Bq} ..., £n-i telles que 'com(XJn -A) = B0 X71'1 + B1 X71'2 + ■ ■ • + Bn_i. L'égalité x'a = tr[com(-X7n - A)] = tr[*com(-X7n - A)] entraîne (n - l)ai = tr(jBi), ..., 1 • an_i = tr(£n_i). (*) Ceci étant, la relation (XIn — A)lcom(XIn — A) = det(XJn - A) In s'écrit B0 Xn + (B1 - AB0)Xn'1 + ■ ■ ■ + (£n-i - ABn-2)X - ABn^ = Xa(X) Jn, ce qui en identifiant les coefficients donne Bq = Iu, Bi-AB0 = aiIn, ..., Bn-i - ABn-2 = a>n-iIn, -ABn-i = anIn, (**) donc en prenant la trace nai = tr(Bi) - tr(AB0), ..., nan_i = tr(£n_i - ABn_2), nan = - tr(ABn_i). En retranchant à chacune de ces égalités celles de (*), on obtient 1 . ai = - tr(AB0), ..., (n - l)an_i = - tr(ABn_2), nan = - tr(ABn_i). (***) Ainsi, on a ajt = — tr(ABfc+i)/fc, et en reportant ceci dans (**) on obtient R -T R AR tv(ABo) r o AR tr(ABn-2) T 130 — in, &1 = At}$ in, . . . , JDn-1 = ABn-l : in- 1 71—1 relations qui permettent de définir les matrices Bk par récurrence, et on obtient avec (***) la première partie du résultat. Lorsque A est inversible, la dernière égalité de (**) entraîne i 1 n A = Bn—i = —, Bn—\. an tr(ABn_i)
5. PROBLÈMES 219 Remarque. Cet algorithme permet en particulier d'obtenir le déterminant (—l)na„ de A. C'est une méthode beaucoup plus rapide que celle consistant à calculer det A en développant récursivement les déterminants par rapport à une ligne ou une colonne, technique qui demande d'effectuer n! opérations (ce qui est très coûteux lorsque n est grand). Problème 16. 1/ Soit n G N* et H le sous-ensemble de Mn(R) des matrices M telles que Um (polynôme minimal de M) égale, au signe près, Pm (le polynôme caractéristique de M). Montrer que Cl est ouvert dans MnW- 2/ Soit M e Q, et (Mm)m€N une suite de matrices de .Mn(M) tendant vers M et telle que pour tout m, Mm est diagonalisable dans Mn(R). a) Montrer qu'il existe l G N tel que pour tout m > £, Mm a n valeurs propres distinctes deux à deux. b) Montrer qu'il existe K > 0 tel que pour tout m et pour toute valeur propre À de Mm, |A| < K. c) Pour tout m > £, on note Ai (m) < • • • < An(m) les n valeurs propres de Mm. Pour tout i G {1,... ,n} montrer que À; = limm^oo Xi(m) existe. Montrer également que Ai < ... < An et que PM = (-l)n(* - Ai) • • • (X - An). Solution. 1/ Dire que I1m = (—l)n^V/ équivaut à dire que degEU/ = n (car IIm divise Pm), ou encore que (7n, M,..., Mn~~l) forme une famille libre de MnQ&)- Soit M G il. La famille (InyM,... , M71"1) étant libre, on peut la compléter en une base B0 = (Jn, M,..., Mn_1, £n+i,..., £n2) de Mi W- Fixons une base B de .Mn(R). On définit l'application (p : yWn(R) -► R TV .-> detB(Jn,7V,... ,Nn-\En+u .. .,En*). L'application (p est continue et par construction, <p(M) ^ 0. Il existe donc un voisinage V de M dans Mn(M) tel que pour tout TV G V, <£>(Af) ^ 0. Ceci entraîne que pour tout TV G V, (Jn, TV,..., N71"1) forme une famille libre de Mn(M), et donc V C n. L'ensemble ft est donc ouvert. 2/ a) On a M G n et M est la limite de la suite (Mm). Comme Q est ouvert, il existe £ G N tel que pour tout m > £y Mm G il. Pour tout m, Mm est diagonalisable dans MnQ&) et IlMm est donc scindé sur R, à racines toutes simples. Or pour m > £, degIlMm = n, IlMm a donc n racines distinctes qui sont les valeurs propres de Mm, d'où le résultat. b) Soit ||. || une norme d'algèbre sur Mn(M). La suite (Mm)m€N converge donc est bornée, i. e. il existe K > 0 tel que pour tout m G N, ||Mm|| < K. D'après la proposition 1 page 183, pour tout m G N et pour toute valeur propre À de Mm, on a |À| < ||Mm|| < K. c) Montrons d'abord que Pm est scindé sur R. La suite (Km))m>e = [(Ai(m),..., \n(m))]m>e prend ses valeurs dans le compact [—Ky K]n. On peut donc en extraire une sous-suite convergente A(<£>(ra))mGN- Soit A = (Ai,..., An) = limn_>oo X((p(n)). Pour tout m, n PM^^i-irUiX-XiMm))} 2=1 donc Pm = limm_>TO^Àfv(m) = (-l)nnr=i(^ ~~ A*) est scindé sur R. Comme pour tout m, \i((p(m)) < • • • < An(<£>(ra)), on obtient en passant à la limite Ai < • • • < An. Montrons maintenant que la suite (A(ra))m>^ converge. Cette suite étant à valeur dans un compact, il suffit de montrer qu'elle n'admet qu'une seule valeur d'adhérence. Soit fi = (/zi,... ,^n) une valeur d'adhérence de (A(m))m>^. Il existe une sous-suite (\(ijj(m)) convergeant
220 4. RÉDUCTIONS D'ENDOMORPHISMES n vers fi. On a /ii < • • • < \in et p« - jSo •Pm*"»>=(-i)n n<* - «>• 2=1 Des relations n n J](X - Ai) = ]J(X - m), Ai < • • • < An et m < • • • < un, i=l i=l on tire fi\ = Ai,... ,/in = An, i. e. A = /i. L'élément A est donc la seule valeur d'adhérence de (A(ra))m>£, donc cette suite étant à valeur dans un compact, elle converge vers A. Pour tout i, on a donc Ai = limn^oo Ai (m) et on a vu que Pm = (~l)n FELiC^" - ^0» d'où *e résultat. Remarque. La méthode utilisée tout au long de 2/ est à retenir. On procède souvent ainsi lorsqu'un polynôme est limite d'une suite de polynômes. Problème_17. Soit n e N* et T = {M e Mn(C) | 3p e N*,MP = In}. Déterminer l'adhérence T de T dans Mn(C). Solution. Notons 7 = {M £ Mn(C) \ pour toute valeur propre A de M, |A| = 1}. Nous allons montrer que T = 7. Montrons d'abord T c 7. Soit M G T. On peut trouver une suite (Mp)p^ de T telle que limp^oo Mp = M. Pour tout p, il existe q G N* tel que Mg = Iny i. e. le polynôme Xq — 1 annule Mp. Toute valeur propre de Mp est donc racine de ce polynôme, donc de module 1. Pour tout p, on note Ai(p),..., An(p) les racines de Pmp (polynôme caractéristique de Mp). Pour tout i, on a vu que |Ai(p)| = 1, la suite \(p) = (Ai(p),..., An(p)) est donc à valeurs dans le compact Cn, où C désigne le cercle unité complexe. On peut donc en extraire une sous-suite convergente X((p(p)) convergeant vers A = (Ai,..., An) G Cn. Pour tout £, on a |Aj| = limp_>oo |Ai(p)| = 1, et comme M = limp_»00Mv,(p), n n Pm = UmiV^, = «m U* " M**P))] = ("Dn 1K* " A<)- t=l i=l Les valeurs propres de M sont donc les Ai et ont leur module égal à 1. Donc M G 7. Montrons maintenant l'inclusion réciproque 7 C T. Soit M G 7. Il existe une matrice Q G Ç£n(C) telle que Q~lMQ = /Ai 0 V 0 x A2 0 x \ x An / Pour tout i, Xi est valeur propre de M donc |Ai| = 1 car M G 7. En réfléchissant un peu, on voit qu'il existe une suite fip = (n\{p),... ,fin{p)) de Cn vérifiant, pour tout p G N : - Pour tout j et pour tout p, il existe r G Q tel que Hj{p) = exp(2Î7rr). - Les {Hi{p))i<i<n sont distincts deux à deux. - Pour tout i, limp-^oo/Ui(p) = Ai. Pour tout p, on pose Mp = / /*i(p) 0 \ 0 x \ A*2(p) X 0 fJ,n(p) / (où la partie triangulaire supérieure est celle de Q~lMQ). Les m(p)i<i<n étant distincts, Mp est diagonalisable, donc semblable à la matrice diagonale Dp dont les éléments diagonaux sont ceux
5. PROBLÈMES 221 de Mp. Pour une valeur de p donnée, pour tout j, 1 < j < n, on peut écrire fJ,j(p) = exp(2iTra,j/bj) où (a,j, bj) G Z x N*. Si q = ppcm (6i,..., bn), on a Hj(p)q = 1 pour tout j, donc D^ = In, donc Mp = In, c'est-à-dire pour tout p, Mp G T. Or par construction, M = limp^oo QMpQ~l. Comme pour tout p, QMvQ~l G T, on en déduit M G T. Problème 18 (Théorème de Perron, matrices stochastiques). Si A = (cnj) e MnQ&) est une matrice, on note A > 0 si ay > 0 pour tout (i,j), et on note A > 0 si aitj > 0 pour tout (i,j). Pour un vecteur X G Mn, on définit de la même manière les notations X > 0 et X > 0. Si X, Y sont deux vecteurs de Rn, on note X > Y (resp. X > Y) lorsque X - Y > 0 (resp. X - Y > 0). 1/ (Théorème de Perron). Soit une matrice A G Mn(R) telle que A > 0. a) On note «S l'ensemble des vecteurs X = (x^ G Rn tels que X > 0 et J3<Li Xi = 1 (de tels vecteurs sont appelés vecteurs de probabilité). Montrer que l'ensemble A={AGR| (3X eS),AX> XX} est majoré et que sa borne supérieure Ao est une valeur propre de A strictement positive associée à un vecteur propre X > 0. b) Montrer que pour toute valeur propre complexe A =^ Ao de A, on a |A| < Ao (on dit alors que Ao est valeur propre dominante de A). c) Montrer que le sous-espace propre E\0 de A associé à la valeur propre Ao est de dimension 1. d) Montrer que Ao est racine simple du polynôme caractéristique de A (on dit alors que Ao est valeur propre simple de /l). (Indication : raisonner par l'absurde en considérant deux vecteurs indépendants X et Y tels que X > 0 avec AX = XoX et AY = XoY + aX, puis considérer AkY). 2/ (Matrices stochastiques) Soit A = (aitj) G Mn(R) une matrice vérifiant A > 0 et telle que pour tout i, on a J21=i ai,j = 1 (on dit que A est une matrice stochastique). a) Si A > 0, montrer que 1 est valeur propre simple et dominante de A. b) S'il existe k eN* tel que Ak > 0 (on dit alors que A est régulière), montrer que 1 est valeur propre simple et dominante de A. c) Si A est régulière, montrer que la suite de matrices (Ak) converge, et que sa limite est un projecteur de rang 1. Solution. 1/ a) L'ensemble A est non vide (car 0 G A) et évidemment majoré (par exemple par la somme des éléments de A). Par définition de Ao, il existe une suite (Xn) de S et (7n) de A telle que lim 7n = Ao et Vn, AXn > 7nXn. n—»oo L'ensemble S est un fermé borné de W1, donc compact, de sorte que l'on peut extraire de la suite (Xn) une sous-suite convergente (X^)). Notons X G S sa limite. Comme AX^n) > 7v,(n)XyJ(n) pour tout n, on obtient en passant à la limite sur chaque composante la relation AX > XoX. Si AX ^ XoX, en composant par A à gauche, on obtient, du fait que A > 0, l'inégalité AY > XoY, où Y = AX. Il existe donc e > 0 suffisamment petit tel que AY > (Ao + e)Y, ce qui contredit la définition de Ao car quitte à multiplier Y par une constante positive non nulle, on peut supposer Y eS. Ainsi, AX = XoX avec X G S. Le fait que A > 0 entraîne AX > 0, donc XoX > 0 et on en déduit X > 0 et A0 > 0.
222 4. RÉDUCTIONS D'ENDOMORPHISMES b) Soit À une valeur propre de A, et notons Z un vecteur propre associé. Les (z{) désignant les composantes de Z, on a n n Vî, ^2di,j Zj = Xzi donc Vz, J^a^- \zj\ > \X\ • \z{\. 3=1 j=l En d'autres termes, A\Z\ > \X\\Z\ où \Z\ désigne le vecteur dont les composantes sont les |^|, ce qui prouve que |À| G A (car quitte à multiplier \Z\ par une constante non nulle, on peut supposer \Z\ e S), et donc |À| < Ào par définition de Ào- Il nous reste à prouver que si À ^ Ào, alors |À| < Ào- Supposons |À| = Ào- Comme A > 0, il existe ô > 0 suffisamment petit tel que As = A — ôln > 0. Comme Ào est la plus grande valeur propre réelle positive de A, Ào — ô est la plus grande valeur propre réelle positive de A$. En répétant l'argument précédent à la matrice As et à la valeur propre À — 5, on obtient |À - ô\ < Ào - S. Mais À0 = |À| = |À - S + S\ < \X - S\ + ô < À0, de sorte que |À| = |À — ô\ + £, ce qui n'est possible que si À est un réel positif. Donc À = |À| = Ào, ce qui contredit le fait que À ^ Ào- Donc |À| < Ào- c) D'après a), il existe X > 0 tel que X e E\0. Supposons dim^o ^ 2, de sorte qu'il existe un vecteur réel Y e E\0 tel que la famille (X, Y) soit libre. Choisissons fi tel que X - fiY > 0 et X - fiY ^ 0 (on a /i = inf {xi/yi \ yi ^ 0}). Comme (X, Y) est une famille libre, X — \iY n'est pas nul, et comme A > 0 et X — \iY > 0, on a facilement A[X — \iY) > 0, c'est-à-dire Xo(X-fiY) > 0 (c'est le même argument que dans a)), donc X — fiY > 0. Ceci est en contradiction avec le choix de /i. Ainsi, dim^o = 1- d) Supposons que Àq est racine d'ordre > 2 de P4. D'après 1/a), il existe un vecteur propre X > 0 de A vérifiant AX = X0X. Complétons X en une base B = (X,X2,.. .,Xn) de Rn et notons P la matrice dont les vecteurs colonnes sont ceux de B. On a / A0 P^AP = \ 0 0 x • • • x \ avec B e Mn-\ B I L'égalité Pa = (Ào — X)Pb montre que Ào est racine du polynôme caractéristique Pb de B (car Ào est racine d'ordre > 2 de Pa par hypothèse), donc valeur propre de B. Ainsi, il existe Z e M71"1 non nul tel que BZ = X0Z, donc le vecteur Y = P ( % ) vérifie AY = X0Y + aX avec a G M (en d'autres termes, on a commencé à triangulariser la matrice A à partir de la valeur propre Ào, et on a considéré les deux premiers vecteurs X et Y de la base correspondante). On a forcément a ^ 0 sinon Y serait un vecteur propre de A, et comme la famille (X, Y) est libre, ceci est impossible compte tenu du résultat obtenu précédemment. Maintenant, l'égalité AY = X0Y + aX donne facilement AkY = X$Y + kaX^X pour tout keN*. Comme Ak > 0, on en déduit Ak\Y\ > \AkY\ = |À§r + JfeaÀJ-1*! > {kaX^Xl - \X%Y\ = Xk^(k\aX\ - X0\Y\). Comme a ^ 0 et X > 0, il existe keN* tel que k\aX\ - Xo\Y\ > Xo\Y\, ce qui entraîne Ak\Y\ > Xq\Y\. Comme Ak > 0, ceci entraîne, d'après le résultat de la question 1/a), que Ak a une valeur propre > À§. Or les valeurs propres de Ak sont les puissances fc-ièmes des valeurs propres de Ay et ces dernières sont de module < Ào d'après 1/b), ce qui est absurde. Ainsi, Ào est bien racine simple de P4. 2/a) La matrice A vérifiant A > 0, on peut lui appliquer les résultats précédents. Soit X = (xi)i<i<n e S un vecteur de probabilité. Soit k tel que Xk = sup^x;. Soit Y = (yi) le vecteur Y = AX. On a j/fe = ]Cj=i akjXj < Z)j=i akj%k = %k- Ainsi, si AX > XX avec À G M, alors en extrayant la fc-ième composante on en déduit y^ > Àxjt, donc À < 1 car y^ < £&. En reprenant les notations de la question 1/a), nous avons montré que sup A < 1, donc la valeur propre Ào vérifie Ào < 1. Maintenant on remarque que le vecteur X$ dont toutes les coordonnées sont égales à 1 vérifie AXq = Xq, donc 1 est valeur propre de A, donc on a forcément Àq > 1. Ainsi, on a Àq = 1,
5. PROBLÈMES 223 D'après le résultat de la question 1/b), on en déduit que 1 est valeur propre dominante de A, et d'après 1/c), que cette valeur propre est simple. b) Remarquons qu'une matrice A > 0 est stochastique si et seulement si elle vérifie AXq = Xo, où Xo est le vecteur dont toutes les coordonnées sont égales à 1. Ainsi, si A et B sont deux matrices stochastiques, le produit AB vérifie AB > 0 (c'est immédiat) et de plus ABXq = AXq = Xo donc AB est stochastique. On en déduit que Ak est une matrice stochastique. Comme de plus Ak > 0 par hypothèse, le résultat de la question précédente entraîne que 1 est valeur propre simple et dominante de Ak. L'égalité AX$ = Xo montre que 1 est valeur propre de A. Si A ^ 1 est une autre valeur propre de A associée à un vecteur propre Xi, alors \k est valeur propre de Ak associée au même vecteur propre, donc |Afe| < 1 ou \k = 1. Si Xk = 1 alors AkXi = Xi, donc 1 serait valeur propre non simple de Ak (on a également AkXo = Xq et les vecteurs Xq et X\ sont bien indépendants car associés à des valeurs propres distinctes de A)y ce qui est absurde. Donc |Afe| < 1, ce qui montre que 1 est bien valeur propre dominante de A. Enfin, 1 est bien valeur propre simple de A, car en triangularisant A, on s'aperçoit que les valeurs propres de Ak (en comptant leur multiplicité dans le polynôme caractéristique) sont les puissances fc-ièmes de celles de A. Ainsi, si 1 n'était pas valeur propre simple de A, 1 ne serait pas valeur propre simple de Ak. c) Comme 1 est valeur propre simple de A, la décomposition de Dunford assure l'existence d'une matrice P G £4i(C) telle que -1 T = P~lAP = ( \_ 0 V 0 0 0\ B I avec B e Mn-i(K), où B = D + TV, avec D une matrice diagonale et N une matrice nilpotente, telles que DN = ND. Comme 1 est valeur propre dominante de A, les valeurs diagonales (A;)i<;<n_i de D vérifient |A;| < 1. Comme les matrices D et N commutent, on a n VA; > n, Bk = (D + N)k = J2Ck Dk~jNj = J2Ck Dk~jNj, car Ni = 0 pour j > n. Choisissons une norme quelconque de l'espace des vecteurs, et normons l'espace des matrices par la norme d'algèbre ||M|| = sup||x||=i II^X||- On a ll^ll < 1 car ll^ll est le maximum des modules |A;| de ses termes diagonaux. L'égalité précédente entraîne n n n 11**11 <E^iidii*"W < Pii*-n£cïiw" < p>ii*-nxy m'- j=0 j=0 j=0 Ainsi, H-B^H est majoré par ||.D||fc-nF(fc) où F est une fonction polynôme. Comme \\D\\ < 1 ceci entraîne lim^oo Bk = 0. On a Ak = P ( 1 0 \ \o o ... o \ Bk ) ( 1 >-l La matrice ir est de rang 1 et vérifie 7r2 = 7r, c'est donc bien un projecteur donc lim Ak = 7T, 7T = P k—^oo \ 0 0 0 o\ 0 / >-l Remarque. Le théorème de Perron s'étend au cas où A > 0, avec des résultats plus faibles. Il est également vrai sous des hypothèses différentes (théorème de Frobenius sur les matrices irréductibles). Les matrices stochastiques apparaissent dans l'étude des chaînes de Markov à espace d'états finis.
224 4. RÉDUCTIONS D'ENDOMORPHISMES Problème 19 (Endomorphismes semi-simples). Soit E un K-e.v de dimension finie. On dit que / G C(E) est semi-simple si pour tout s.e.v F de E stable par /, il existe un supplémentaire S de F stable par /. Une matrice M G Mnfâ) est dite semi-simple si l'endomorphisme / de Kn dont M est la matrice dans la base canonique de Kn est semi-simple. 1/ Soit / G C(E). On note 11/ son polynôme minimal. Soit 11/ = M"1 • • • M?r la décomposition de 11/ en facteurs irréductibles de K[X], a) Soit F un s.e.v stable par /. Montrer que r F = 0[KerM^(/)nF]. t=i b) Si 11/ est irréductible, montrer que / est semi-simple. c) Dans le cas général, montrer que / est semi-simple si et seulement si 11/ = M1M2 • • • Mr est produit de polynômes irréductibles unitaires distincts deux à deux. d) Que dire si K est algébriquement clos ? 2/ Soit M G Mn(R). a) Montrer que M est semi-simple (dans .Mn(]R)) si et seulement si M est diagonalisable dans Mn{C). b) On suppose M semi-simple. Montrer que M est semblable dans ,Mn(R) à une matrice de la forme ( § ^), avec D diagonale et B constituée de blocs de la forme (£ ~£) centrés sur sa diagonale principale. Solution. 1/ a) Pour tout t, on note Fi = KerMfi(f). On sait que F = Fi 0 • • • 0Fr. Pour tout i G {1,..., r}, on note pi la projection sur Fi parallèlement à (Bj^Fj. On a vu à la proposition 1 page 194 que pour tout i, pi est un polynôme en /. Comme F est stable par /, F est donc stable par pi, ce qui s'écrit Pi{F) c F. On a aussi Pi(F) C Pi(E) = Fi. Finalement, on a Pi{F) c Fi H F, et comme Ids =p\-\ + pr, F c pi(F) + • • • + pr(F) = pi(F) e • • • ®pr(F) c (Fi n F) e • • • e (Fr n F). L'inclusion réciproque est facile puisque pour tout i, F^nF C F donc (FiflF)©- • -0(FrnF) C F. b) Soit F un s.e.v stable par /. Il s'agit de montrer l'existence d'un supplémentaire S de F dans E stable par /. Si F = F, c'est terminé avec S = {0}. Sinon, soit x\ € E \ F. On considère EXl = {P(f)(x\) \ P € K[X]}. Le s.e.v EXl est stable par /. Nous allons montrer que EXl C\F = {0}. Soit IX1 = {P e K[X] | P{f){xi) = 0}. C'est un idéal de K[X], non réduit à {0} car 11/ € IX1, donc il existe un polynôme unitaire IIX1 tel que IX1 = {U.Xl) = TlXlK[X]. Comme 11/ G IXl, le polynôme nxi divise II/, et 11/ étant irréductible, II^ = II/. Le polynôme 11^ est donc irréductible. Soit y G EX1 D F. Il existe un polynôme P G K[X] tel que y = P(f)(xi). Si y ^ 0, alors P # IX1 = {IlXl), donc nxi ne divise pas P, et 11^ étant irréductible, 11^ et P sont premiers entre eux. D'après le théorème de Bezout, il existe donc U, V G K[X] tels que UP + VUXl = 1, donc xi = U(f) o P(/)(a:i) + V(f) o nxi(/)(*!) = U(f)(y). Or y e F et F est stable par /, donc x\ = U(f)(y) G F. Ceci est absurde par construction de x\. On a donc y = 0 et FXl D F = {0}. On vient de montrer que EXl et F sont en somme directe et EXl stable par /. Si F®EXl = F, c'est terminé. Sinon, on choisit X2 G E \ (F © FXl ) et on recommence en remplaçant cette fois ci F par F0 F^. Itérant ainsi le procédé, on voit qu'au bout d'un nombre fini d'itérations (E est de dimension fini), on aura trouvé des vecteurs xi,...tXk tels que E = F © EXl 0 • • • © EXfc et pour tout z, EXi stable par /. Le s.e.v S = EXl 0 • • • 0 EXk est donc stable par / et vérifie F 0 S = E.
5. PROBLÈMES 225 c) Condition nécessaire. Supposons / semi-simple. Soit 11/ = Mj*1 • • • M7?r la décomposition de 11/ en facteurs irréductibles unitaires de K[X]. Il s'agit de montrer que pour tout z, at = 1. Supposons au contraire qu'il existe i tel que c^ > 2. Si M = M*, on voit qu'il existe TV G K[X) tel que 11/ = M2N. Soit F = KerM(/). Le s.e.v F est stable par / semi-simple donc il existe un supplémentaire S de F stable par /. Montrons que MN(f) s'annule sur S. Si x G S, alors MN(f)(x) G F car M(f)[MN(f)(x)] = ÏLf(f)(x) = 0, et MN(f)(x) G S car S est stable par /. Donc MN(f)(x) e FnS = {0}, et donc MN(f)(x) = 0. L'endomorphisme MN(f) s'annule donc sur S. Il s'annule aussi sur F car si y G F = KerM(/), alors MN(f)(y) = N[M(f)(y)) = 0. Comme F@S = Ey MN(f) s'annule sur E tout entier, i. e. MN(f) = 0. Ceci contredit la minimalité du degré du polynôme minimal 11/ = M2N. D'où la condition nécessaire. Condition suffisante. Supposons 11/ = M\ • • • Mr avec les Mi irréductibles unitaires et distincts deux à deux. Soit F un s.e.v de E stable par /. Pour tout z, notons Fi = Ker Mi(f). On a E = Fi © • • • © Fr, et on a vu à la question a) que F = ®l=1[F n Fi]. Pour tout z, Fi est stable par /. Notons fi G C(Fi) la restriction de / à Fi. On a Mi(fi) = 0 et Mi est irréductible, ce qui prouve que le polynôme minimal de fi est M*. D'après b), fi est donc semi-simple. Or F n Fi est stable par /;, donc il existe un s.e.v Si stable par fi (donc par /) tel que (Fi n F) © Si = Fi. Si maintenant on pose S = S\ © • • • © Sr, on a r r r E = Fie...eFr = 0[(F<nF)e5i] = [0(F<nF)]e[05,i) = Fe5> 2=1 i=l 2=1 et 5 est stable par /. L'endomorphisme / est donc semi-simple. d) Si K est algébriquement clos, les polynômes irréductibles de K[X) sont les polynômes de degré 1. D'après c), / est donc semi-simple si et seulement si 11/ n'a que des racines simples dans K, i. e. si et seulement si / est diagonalisable. 2/ a) Condition nécessaire. Supposons M semi-simple. D'après 1/c), Hm peut s'écrire Hm = M\- - Mr où les Mi sont irréductibles dans K[X], unitaires et distincts deux à deux. Montrons que IIm n'a que des racines simples dans C. Soit a G C une racine de Hm. Il existe i tel que Mi(a) = 0, par exemple M\(a) = 0. Comme M\ est irréductible dans K[X], a est racine simple de M\ (en effet, M\ étant irréductible dans R[X], M\ et M[ sont premiers entre eux dans R[X] donc il existe Z7, V G R[X] tels que UM\ + VM[ = 1. Cette relation appliquée à a montre que M[(a) ^ 0). Par ailleurs, si i ^ 1, Mi(a) ^ 0 (en effet, M\ et M; sont irréductibles dans R[X]} unitaires et distincts, donc premiers entre eux dans M[X], donc il existe Z7, V G R[X] tels que UMi + VMi = 1. Cette relation appliquée à a montre que Mi(a) ^ 0). En définitive, on a montré que a est racine simple de Hm- Condition suffisante. Soit Hm = M±l • • • M*r la décomposition de Hm en facteurs irréductibles unitaires de R[X], D'après 1/c), il suffit de montrer que pour tout z, a; = 1. Comme M est diagonalisable dans Mn(C)y Hm n'a que des racines simples dans C (le polynôme minimal de M dans C[X] est le même que dans R[X) car si Mp + ai Mp_1 H h ap In = 0 avec les ai G C, alors Mp + 5R(ai) Mp_1 H h 5R(ap) 7n = 0). Ceci suffit à montrer que pour tout z, a* = 1. b) On regarde M comme un endomorphisme de Rn. Démontrons le résultat par récurrence sur n G N*. Pour n = 1, c'est évident. Supposons le résultat vrai jusqu'au rang n — 1 et montrons le au rang n. Si IIm est scindé sur R, c'est immédiat car alors I1m est à racines simples d'après 1/c) et donc M est diagonalisable dans Mn(M). Sinon Hm a au moins un facteur irréductible dans R[X] de degré 2 de la forme [(X-a)2+P2], a G R et p > 0. On peut écrire HM = [(X - a)2 + p2) Q avec Q G R[X}. Posons S = Ker[(M - aln)2 + /?2/n]. On a E ^ {0}, sinon (M - aln)2 + /?2/n est inversible et donc Q(M) = 0, ce qui contredit la minimalité du degré de IIm- Soit e\ G E, e\ ^ 0. Les vecteurs e\ et Me\ sont linéairement indépendants. En effet, s'il existe À G M tel que Me\ = Àei, alors 0 = (M - a /n)2(ei) + /?2 ei = (A - a)2ei + P2ex = [(A - a)2 + p2} ex ± 0,
226 4. RÉDUCTIONS D'ENDOMORPHISMES ce qui est impossible. Si on pose e2 = \[Me\ — aei], la famille (ei,e2) est donc libre. Remarquons que Me\ = ae\ + (3e2 et comme e\ e Ker[(M - aln)2 + p2In], on a Me2 = (M -aln){e2) + ae2 = -^{M - aln)2(ei) + ae2 = -foi + ae2. En résumé, F = Vect(ei, e2) est stable par M et Me\ = aei + (3e2, Me2 = -pe\ + ae2. (*) La matrice M étant semi-simple, on peut trouver un s.e.v G de W1 stable par M tel que F®G = W1. Le restriction M\q de M à G est semi-simple (son polynôme minimal vérifie 1/c) car il divise YIm)- Or dimG = n — dimF = n — 2, donc d'après l'hypothèse de récurrence il existe une base # = (/i, • • •, fn-2) de G dans laquelle la matrice de M\q ait la forme (% %) avec D diagonale et B constituée de blocs de la forme ( £ ~6 ) centrés sur sa diagonale principale. Dans la base B' = (8, ei, e2), la matrice de M a donc la forme ( b 1, où C = ( ^ ~£ ) d'après (*). D'où le résultat. Remarque. - On peut montrer facilement que la réciproque de 2/b) est vraie. - On aurait pu montrer 2/b) en diagonalisant M dans Mn(C) et en travaillant sur les parties réelles et imaginaires de ses vecteurs propres. - La notion de semi-simplicité est une sorte de prolongement de la notion de diagonali- sabilité au cas des corps non algébriquement clos. Dans cette optique, on peut montrer que si K est un corps commutatif quelconque, toute matrice M G Mn(K) peut s'écrire M = S + N avec SN = NS, S G A^n(^) semi-simple et N e .Mn(K) nilpotente (résultat à rapprocher de la décomposition de Dunford, voir la partie 4.2 page 193).
CHAPITRE 5 Espaces euclidiens LA notion de forme quadratique naît avec l'étude des coniques par Fermât au dix- J septième siècle puis celle des quadriques par Euler au dix-huitième siècle. C'est Cauchy qui en 1826, en vue de son enseignement à l'École Polytechnique, unifie les résultats concernant la réduction des formes quadratiques. C'est d'ailleurs sans doute à cette occasion qu'il se pose le problème de la recherche des valeurs propres d'une matrice symétrique (en langage moderne) et démontre la réalité des racines du polynôme obtenu. Ainsi est née la théorie des espaces euclidiens. Le passage à la dimension infinie s'effectue à la fin du dix-neuvième siècle notamment grâce à Hilbert, puis par Schmidt et Fréchet en 1908. Les espaces euclidiens et hermitiens ont beaucoup de propriétés communes, et pour cette raison, nous les étudierons parallèlement. 1. Formes quadratiques - Formes hermitiennes Dans toute cette section, K désigne un corps commutatif. 1.1. Généralités On définit d'abord les formes bilinéaires. DÉFINITION 1 (Forme bilinéaire). Soient E et F deux K-e.v et une application (p : E x F —> K (x, y) *-* (p(x, y). On dit que ip est une forme bilinéaire si pour tout x e E, l'application cp(x, •) : y »-»• (p(x, y) est linéaire et si pour tout y E F, l'application <£>(•, y) : x »-+ <p(x,y) est linéaire. Les formes sesquilinéaires sont définies lorsque le corps de base est C. DÉFINITION 2 (Forme sesquilinéaire). Soient E et F deux C-e.v et une application ip: ExF ^C (x,y)^ ip{xy y). On dit que (p est une forme sesquilinéaire si pour tout x E E, l'application (p(x,-) est linéaire et si pour tout y E F, l'application <p(-,y) est antilinéaire (ie. pour tout X\,X2 G E, (p{x\ + X2,y) = ip(x\,y) + ip(x2,y) et pour tout À G C, pour tout x G £", (p(\x,y) = X(p(x,y)). Remarque 1. - Dans toute la suite, les espaces E et F seront les mêmes. - Toute forme sesquilinéaire sur E x F est une forme bilinéaire lorsque les e.v E et F sont considérés comme des R-e.v. Exemple 1. Si E désigne le C-e.v des fonctions continues de [0,1] dans C, l'application </>: E2-^C (f,g)~ [ 7Ô)g(t)dt Jo définit une forme sesquilinéaire sur E2. Dans toute la suite de cette section, E désigne un K-e.v
228 5. ESPACES EUCLIDIENS Ecriture en dimension finie. Supposons E de dimension finie et fixons une base B = (ei,..., en) de E. Alors pour tout x = Ya=i x*ei e* V = X)j=i Vjej dans -^> ^a bilinéarité de (p entraîne (p(x, y) = ^2 Xiyj cp(ei, ej) = lXMY l<i,j<n où M est la matrice de M.n{K) définie par M = (^(e^e^))^^-^ et où X et Y sont les vecteurs colonne X = l : I, Y = ( : 1. La matrice M est appelée matrice de cp dans la base B. Avec les mêmes notations, si E est un C-e.v et <p une forme sesquilinéaire sur E, on a <p(x> y) = ^2 x-yj<p(ei, e5) = lXMY, l<i,j<n où X désigne le vecteur conjugué de X (ie les composantes de X sont les conjuguées de celles de X). On dit que M est la matrice de (p dans la base B. L'application qui à <p associe sa matrice dans une base fixée de E est un isomorphisme. En particulier, l'ensemble des formes bilinéaires (ou sesquilinéaires) sur E est un K-espace vectoriel de dimension n2 (où n = dirnE"). Lorsque K = R ou K = C, l'écriture précédente entraîne qu'en dimension finie, les formes quadratiques et sesquilinéaires (pour K = C) sont des fonctions continues. Changement de base. On suppose toujours que E est de dimension finie. Soient B et B' deux bases de E, P la matrice de passage de B à B'. Si (p est une forme bilinéaire (resp. sesquilinéaire) sur E, et si M désigne sa matrice dans la base B, M' dans la base B\ alors M' = lPMP (resp. M' = tpMP). On dit que les matrices M et M' sont congrues. Les matrices M et M' sont alors équivalentes, donc de même rang. Ce rang s'appelle le rang de (p. Le rang de (p est aussi la dimension du s.e.v des formes linéaires {<p(x, •) | x G E} dans le dual de E. Symétries dans les formes bilinéaires et sesquilinéaires. DÉFINITION 3. Soit (p une forme bilinéaire sur E. On dit que - (p est symétrique si pour tout (x,y) G E2, <p(x,y) = cp(y,x), - (p est antisymétrique si pour tout (x,y) G E2, (p{x,y) = —ip(y,x). Remarque 2. - Si K est de caractéristique 2, l'antisymétrie équivaut à la symétrie. - Si E est de dimension finie et si B est une base de E, une forme bilinéaire (p sur E est symétrique (resp. antisymétrique) si et seulement si sa matrice dans la base B est symétrique (resp. antisymétrique). - Si la caractéristique de K est différente de 2, une forme bilinéaire (p est antisymétrique si et seulement si ip(x, x) = 0 pour tout x e E (cas particulier du théorème 1 page 135 dans le cas bilinéaire). - Si la caractéristique de K est différente de 2, si on désigne par <Sn (resp. An) le s.e.v des matrices symétriques (resp. antisymétriques) de Mn(&), on a <Sn©*4n = Mn(K). En effet, Sn D An = {0} car si A = lA = -lA, alors lA = 0 donc A = 0. Sn + An = Mn(K) car VA G A^n(K),
1. FORMES QUADRATIQUES - FORMES HERMITIENNES 229 De plus, dim<Sn = n(n + l)/2 et dim.4n = n(n - l)/2 (si E^ désigne la matrice dont tous les coefficients sont nuls sauf celui d'indice (i,j) qui vaut 1, la famille ((Ei,t)i<i<n* (Ei,j + Ej,i)i<i<j<n) est une base de Sn, la famille (Eiyj - Ejti)i<i<3<n est une base de An)- - En conséquence, si la caractéristique de K est différente de 2, l'ensemble S (resp. A) des formes bilinéaires symétriques (resp. antisymétriques) sur E (avec dim E = n) est un K-e.v de dimension n(n + l)/2 (resp. n(n — l)/2). De plus, si B désigne le K-e.v des formes bilinéaires sur E, on a S 0 A = B. DÉFINITION 4. Soit (p une forme sesquilinéaire sur un C-e.v E. On dit que (p est à symétrie hermitienne si pour tout (x,y) G E2, y>(x,y) = (p(y,x). Remarque 3. - Si (p est à symétrie hermitienne, alors pour tout x G E, (p(x,x) G R (ceci car (p{x,x) = cp(x,x)). - Si E est de dimension finie sur C et si B est une base de E, alors une forme sesquilinéaire y? sur E est à symétrie hermitienne si et seulement si sa matrice M dans la base B vérifie lM = M. On dit alors que M est une matrice hermitienne. Toute matrice hermitienne M G Mn{£) peut s'écrire de manière unique sous la forme M = S + iA, où S, A G Mn(R) avec S symétrique et A antisymétrique. L'ensemble des matrices hermitiennes de Mn(C) forme un M-e.v de dimension n2 (mais attention, ce n'est pas un C-e.v). Formes quadratiques. On suppose ici que la caractéristique de K est différente de 2. DÉFINITION 5. On appelle forme quadratique sur E toute application q de la forme q : E —> K x »-»• </?(x, x) où y? est une forme bilinéaire symétrique sur E. PROPOSITION 1. Soit q une forme quadratique sur E. Il existe une unique forme bilinéaire symétrique ip telle que pour tout x £ E, q(x) = ip(x,x). La forme bilinéaire (p s'appelle la forme polaire de q et on a 1 1 V(x,y) eE2, <p(x,y) = -[q(x + y) - q(x) - q(y)\ = -[q(x + y) - q(x - y)]. Exemple 2. - Si <p(x, y) = Ylij aijxiVi-> ^a forme quadratique associée à <p est - Réciproquement, si q(x) = J2iai,ixl + Y^i<j ai,j xixj-> alors q est une forme quadratique et sa forme polaire est <p(x> y) = y%2 <*>*XiVi + 2 S ai'j ^XiVj + XjVi^' i i<j DÉFINITION 6. Soit q une forme quadratique sur E, où E est de dimension finie, et B une base de E. On appelle matrice de q dans la base B la matrice de la forme polaire (p de q clans la base B, et rang de q le rang de cette matrice. Le rang de q est aussi le rang de sa forme polaire. Exemple 3. On se place dans R3 et on y définit la forme quadratique q par u = (x, y, z) h-* q{u) = Sx2 + y2 + 2xy — 3xz.
230 5. ESPACES EUCLIDIENS 3 1 1 1 -*- 0 2 u 3 2 0 0 Alors la matrice de q dans la base canonique de R3 est A = Formes hermitiennes. DÉFINITION 7. On appelle forme hermitienne sur un C-e.v E toute application de la forme $ : E —» R sh ip{x,x) où y? est une forme sesquilinéaire à symétrie hermitienne. Proposition 2. Soit$ une forme hermitienne. Il existe une unique forme sesquilinéaire à symétrie hermitienne <p telle que pour tout x G E, $(x) = cp(x, x). La forme (p s'appelle la forme polaire de <ï>, et on a V(x,y) G E2, <p{x,y) = j[$(x + y) - $(x -y) + i$(x -iy) -i$(x + iy)\. DÉFINITION 8. Soit $ une forme hermitienne sur un C-e.v E de dimension finie et B une base de E. On appelle matrice de <ï> dans la base B la matrice de sa forme polaire (p dans B, et rang de <Ê> le rang de cette matrice. Le rang de $ est aussi le rang de sa forme polaire. Exemple 4. Sur C2, si <Ê> : u = {x,y) »-* xx — 2yy + \yx + \yx, alors <Ê> est une forme hermitienne de forme polaire 3 3 <p(uu u2) = x~lx2 - 2y{y2 + -yïx2 + -^iy-i, et la matrice de <Ê> dans la base canonique de R2 est I 3 2o ) > son ranê es^ 2. 1.2. Orthogonalité E désigne toujours un K-e.v (ou un C-e.v lorsque l'on parle de forme hermitienne). On se fixe une forme quadratique (resp. hermitienne) $ sur E, de forme polaire (p. DÉFINITION 9. On appelle cône isotrope de $ l'ensemble C$ = {x G E \ $(x) = 0}. On dit que $ est définie si C$ = {0}. Un vecteur x G E est dit isotrope (pour $) si $(x) = 0, î. G. I fc 0<$. DÉFINITION 10. Deux vecteurs x et y de E sont dit orthogonaux selon <£> (ou selon </?) si <p(x,y) = 0 (ce qui équivaut à (p(y,x) = 0). Soit A C E. On appelle orthogonal de A selon <Ê> (ou (p) l'ensemble AL = {y G E | Vz G Ayfoy) = 0}. Deux sous-ensembles ^ et B de E sont dit orthogonaux selon $ (ou selon <£>) si pour tout x e A et pour tout y G B, <^(x, y) = 0. On note alors A ± B. Remarque 4. - Si Ac E, A1 est un s.e.v de E et on ai4x = (Vect A)1. - Si B désigne le sous-ensemble de E* (dual de E) défini par B = {(p(x, •) | x G j4}, A-1 est l'orthogonal (au sens dual) de B, i. e. AL = B° (voir la partie 4.3 page 128). Proposition 3. On parle d'orthogonalité au sens de $. (i) Si F CE, F c F11 (ii) Si A c B c E, BL c A"1.
1. FORMES QUADRATIQUES - FORMES HERMITIENNES 231 OÉFINITION 11. On appelle noyau de $ le s.e.v de E noté Ker<É> défini par Ker$ = E± = {xeE\Vye E,(p(x,y) = 0}. La forme $ est dite non dégénérée si Ker<£> = {0}, dégénérée si Ker$ ^ {0}. Proposition 4. On a Ker$ c C$. En particulier, si $ es£ définie, alors $ es£ non dégénérée. Remarque 5. La réciproque est fausse. Par exemple, si <Ê>(ii) = ${x,y) = x2 — y2, <Ê> est non dégénérée mais n'est pas définie puisque pour tout x, $(x, x) = $(#, — x) = 0. Notation. Pour unifier les notations, pour toute matrice M à coefficients dans K, on note M* la transposée de M. Lorsque le corps de base est C et que l'on parle de forme hermitienne, la notation M* désigne la transconjuguée de M (le. M* = lM). Ainsi en dimension finie, si A désigne la matrice de (p dans une base B de E, on a A* = A et pour tout x, y, <p(x, y) = X*AY. Cette notation est avantageuse puisqu'elle permet de traiter en même temps le cas des formes quadratiques et des formes hermitiennes. Proposition 5. Supposons E de dimension finie. Soit B une base de E. En identifiant les vecteurs de E et leur représentation en vecteurs colonne dans la base B, on a Ker $ = Ker .A, où A désigne la matrice de <Ê> dans la base B. Démonstration. On a x G Ker$ «=» Vj/ G Et <p{x,y) = 0 <=ï VY, X*AY = 0 <é=> X*A = 0 <ï=ï (X*A)* = A*X = AX = 0 <=$> X e Ker A. D Bases $-orthogonales. DÉFINITION 12. Une base B de E est dite ^-orthogonale si pour tout couple d'éléments distincts (e, e') de B, on a </?(e, e') = 0. Remarque 6. En dimension finie, si B = (ei,... ,en) est une base ^-orthogonale, alors / n \ n Autrement dit, la matrice de $ dans la base B est diagonale. Théorème 1. Si E est de dimension finie, il existe une base ^-orthogonale de E. Démonstration. On procède par récurrence sur la dimension n de E. Pour n = 1, il n'y a rien à montrer. Supposons le résultat vrai au rang n — 1 et montrons le au rang n. Si $ est identiquement nulle, alors toute base de E est ^-orthogonale. Sinon, il existe v G E tel que <&(i>) ^ 0. Dans ce cas, l'application / = <p(v, •) définie par f(x) = (p(vy x) est une forme linéaire non nulle sur E. Son noyau H est un hyperplan de £", et comme v # H, on a E = H®Vect(v). Comme dimH = n — 1, d'après l'hypothèse de récurrence, il existe une base (ei,... ,en_i) de H orthogonale pour <3>|#. On voit alors facilement que (ei,..., en_i,i>) est une base ^-orthogonale. D Corollaire 1. Soit A G Mn(K) telle que A* = A. Il existe une matrice inversible P G G£n(K) telle que P*AP soit une matrice diagonale. Démonstration. L'application <3> définie sur Kn par $(X) = X*AX est une forme quadratique (resp. hermitienne) dont la forme polaire est (p : (Xy Y) i-> X*AY. D'après le théorème précédent, il existe une base B de Kn qui est ^-orthogonale. La matrice M de $ dans B est diagonale, et si P désigne la matrice de passage de la base canonique de Kn à jB, on a M = P*AP} d'où le résultat. D
232 5. ESPACES EUCLIDIENS Remarque 7. Lorsque K = R (où K = C dans le cas hermitien), un résultat plus fort fait l'objet du corollaire 1 page 244, qui affirme que l'on peut choisir pour P une matrice orthogonale (ou unitaire dans le cas hermitien). L'intérêt du résultat précédent est qu'il est valable pour n'importe quel corps K. Si $ est une forme quadratique, le théorème 1 assure en dimension finie l'existence d'une base (ei,... ,en) ^-orthogonale. En posant À* = $(ei), on a n n V* € E, »(*) = *$>'(*) e, )= £) A, (e*(x))2. \i=l / i=l En d'autres termes, on a écrit <Ê> comme combinaison linéaire de carrés de formes linéaires indépendantes. Dans la pratique, ces formes linéaires peuvent être calculées grâce à la méthode qui suit. Méthode de Gauss. Donnons nous une forme quadratique n W^3?i, . . . , Xn) = y ^ ai^i X^ ■+" y j &iyj XiXj. En procédant par récurrence, nous allons écrire <Ê> comme combinaison linéaire de carrés de formes linéaires indépendantes. Il y a deux cas. Premier cas. Il existe au moins un indice i tel que a^i ^ 0, par exemple a = a^i ^ 0. On peut écrire $ sous la forme $(rci,...,a;n) = ax\ + xiB(x2,... ,£„) + C{x2,... ixn)i où B est une forme linéaire en (x2,..., xn) et C une forme quadratique en (x2,..., xn). On réécrit <Ê> comme 2 $(x1,...,xn) = a(x1 + g(a:2'2a-'a")| + C{x2,... )Xn) — B{x2,...,xny 4o En d'autres termes, on a écrit $ comme la somme d'une constante multipliée par le carré d'une forme linéaire (ici a[x\ + B/(2a)]2) et d'une forme quadratique en x2,... ,xn (ici, C — B2/(Aa)). On itère alors la méthode de Gauss en partant cette fois de C — B2/(4a) , et on obtient finalement la réduction souhaitée. Second cas. Pour tous les indices i, a^ = 0. Si <Ê> est nulle, c'est terminé, sinon il existe au moins un a^ non nul (avec i < j), par exemple a = aiy2 ^ 0. On peut écrire <Ê> sous la forme $(xi, ...,xn)= axix2 + xi B(x3, ...,xn) + x2 C(x3, ...,£„) + D(x3,..., x„), où BetC sont des formes linéaires et D une forme quadratique en (#3,..., xn). On réécrit $ comme $(xu...,xn) = a(xi + —j (^2 + — J + (#- — o 4 £1 + £2 + B + C a - [xi - x2 + C-B' a + D- BC a Les deux premiers termes du dernier membre de cette égalité sont les carrés de formes linéaires, et on itère la méthode de Gauss en partant cette fois de D — BC/a, forme quadratique en (#3,..., xn). Remarque 8. - Il existe bien sûr d'autres moyens d'écrire une forme quadratique comme combinaison linéaire de carrés de formes linéaires. L'avantage de la méthode
1. FORMES QUADRATIQUES - FORMES HERMITIENNES 233 de Gauss est qu'elle assure l'indépendance des formes linéaires obtenues (résultat non démontré ici, mais facile à obtenir). - Le cas des formes hermitiennes se traite de manière analogue, en remplaçant les carrés par les carrés des modules. Par exemple la forme hermitienne $(x,y) = xy + xy se réduit en $(x,y) = -(\x + y\2 — \x — y\2). La forme hermitienne $(#, y, z) = xx + yy - 2ixy 4- 2ixy + 2yz + 2yz se réduit en $(rc, y, z) = (x- 2iy)(x + 2iy) - Syy + 2yz + 2yz = \x - 2iy\2 - 3 2z 2 4 Propriétés des orthogonaux selon $. La lettre <£> désigne toujours une forme quadratique (resp. hermitienne) sur E et lorsque l'on parlera d'orthogonal, ce sera par rapport Proposition 6. Supposons E de dimension finie. Tout s.e.v F de E vérifie (i) dim F + dim F1 = dim E + dim(F n Ker <£>). (ii) F-LL = F + Ker$. Démonstration, (i). On considère l'application ip : F —» E* a? •—> ip(x, •). Cette application est linéaire, donc dim(KerV>) + dim(ImV>) = dim F. Or Kert/j = F nKer<3> et (lmip)° = F1 (voir la remarque 4). Comme d'après le théorème 3 page 128, on a dim(ImV')0 = dim E — dim(ImV'), on en déduit dim F1 = dim E - (dim F - dim(Ker^)) = dim E - dim F + dim(Fn Ker$), d'où (i). (ii). On a F C F-1-1 et Ker$ C F-11, donc F + Ker$ C F1-1. Pour prouver l'égalité, nous allons prouver l'égalité des dimensions. En appliquant (i) à F1, on a dim F1 + dim F11 = dim E + dim KeviF1 n Ker $) = dim E + dim(Ker $) (comme Ker $ C F-1, F1- n Ker$ = Ker<3>). En retranchant (i) à cette égalité, on obtient dim F11 - dim F = dim(Ker $) - dim(F D Ker $) donc dim F11 = dim(F + Ker $) et le résultat. D Proposition 7. Soit F un s.e.v de dimension finie de E (mais E de dimension quelconque). Alors (i) Si la restriction $\p de $ à F est définie, on a F 0 F1 = E. (ii) Si $ est définie, on a F = F11. Démonstration, (i). Si x G FnF1, alors <p(x,x) = 0 et comme la restriction de $ à F est définie par hypothèse, on a forcément x = 0. Autrement dit, F D F1 = {0} (*). D'après le théorème 1, il existe une base (ei,... ,ep) de F, orthogonale pour la restriction de $ à F. Soit x G E. On cherche à écrire x = y + z avec y G F et z G F-1. Écrivons y = Y%=i ^iei- Alors z = x — y G F1 si et seulement si pour tout j G {1,... ,p}, <p{ej,z) = 0, ie. si pour tout j, iûiS' X) <p{ej,x) — Xj(p(ej,ej) = 0. En choisissant Xi = . —r, on voit donc que x = y + z, avec y £ F tÇKpii Ci) et * G F1. Donc F + F1 = F d'où (i) avec (*). (ii). On sait (voir proposition 3) que F C F11. Montrons l'inclusion réciproque. Soit x G F11. D'après (i), il existe y G F et z G F1 tels que x = y+z. Or ip(x, z) = 0 = </?(?/, z)+ip(z, z) = <p(z, z), donc 2 G C$ et $ étant définie, z = 0. Donc x = y e F, d'où F11 c F. D
234 5. ESPACES EUCLIDIENS Loi d'inertie de Sylvester. Dans toute la suite, <É> représente soit une forme quadratique sur un R-e.v E, soit une forme hermitienne sur un C-e.v E. Supposons E de dimension finie n. D'après le théorème 1, il existe une base (ei,..., en) qui est ^-orthogonale. Ceci entraîne que pour tout x = Y^=i xieu n n $(x) = y}2\xi\2$(ei) = Y,xi\e*i(x)\2, où Xi = $(ef) G R. Chaque A* est soit positif, soit négatif, soit nul. Supposons par exemple Ai,..., Xp > 0, Ap+i,..., Xp+q < 0 et Xp+q+i = • • • = An = 0. Pour z, 1 < i < p, on peut écrire Xi = u}f et pour z, p + 1 < i < p + q, on peut écrire Af = —cof, où les Ui sont réels non nuls. En posant fi = o^e*, on a *(z) = iawi2 + • • • + |/P(x)|2 - |/P+1(x)|2 IW*)|2, (*) et /i,..., /p+g sont des formes linéaires linéairement indépendantes. Théorème 2 (Sylvester). Quelle que soit la décomposition de <Ê> du type (*) $(z) = \gi(x)\2 + • • • + Mz)|2 - lv+iWl2 l<V+9'(*)|2> (**) ow #i,... ,gp>+q> sont des formes linéaires linéairement indépendantes, on a p' = p et q' = q. Le couple (p, q) s'appelle la signature de $, et le rang de $ est égal à p + q. Démonstration. Supposons p' ^ p, par exemple p' > p. Complétons gi,... ,gp'+q' en une base g\, ■ ■ • >g-n de E*. Les formes linéaires /i,..., fp,gp>+\,...,gn sont au nombre de p + n — p' < n, et donc 3z ^ 0, fi(x) = • • • = /p(œ) = v+i(z) = • • • = 0n(s) = 0. Ceci entraîne $(z) < 0 d'après l'expression (*) de $. Au moins l'un des gi{x) pour 1 < i < p' est non nul, car sinon on aurait gi(x) = ••• = gp'(x) = gp>+i(x) = ••• = gn(x) = 0 et donc x = 0 car (gi)i<i<n est une base de E*. Donc $(x) > 0 d'après l'expression (**) de $, ce qui est contradictoire. Ainsi p = p'. On montrerait de même que q = q'. Quant au rang de $, il suffit de remarquer que la matrice de $ dans la base ^-orthogonale /iP o o\ (ei,..., en) est o -iq o ), donc de rang p + q. D V o o 0/ Remarque 9. Si on trouve trois s.e.v F+,F~,F° de E qui sont ^-orthogonaux deux à deux, tels que F+ ® F~ 0 F0 = E, $(x) > 0 sur F+ \ {0}, $(z) < 0 sur F~ \ {0} et $(#) = 0 sur F0, alors la signature de <Ê> est (dimF+,dimF~). En effet, si (ei,.. .,ep) (resp. (ep+i,..., ep+q), (ep+q+i,..., en)) est une base orthogonale pour la restriction de $ à F+ (resp. à F-, à F0), alors (ei,..., en) est une base de E, et on peut écrire p p+q *(*)=x;*fe) kwi2 + e *(*) kwi2 i=l i=p+l avec $(e*) > 0 pour 1 < i < p et $(ei) < 0 pour p + 1 <i <p + q. 1.3. Formes quadratiques et hermitiennes positives Ici aussi, $ désigne une forme quadratique sur un R-e.v E ou une forme hermitienne sur un C-e.v E, associé à la forme polaire (p. On dira que $ est positive si pour tout x e E, $(x) > 0. En dimension finie, la signature d'une forme positive est de la forme (P,0).
1. FORMES QUADRATIQUES - FORMES HERMITIENNES 235 ^ Théorème 3 (Inégalité de Schwarz). Si $ est positive, alors V(x,y)eE\ |^,y)|2<$(a;)$W. (*) Si de plus $ est définie, il y a égalité si et seulement si x et y forment une famille liée. Démonstration. Même si $ est une forme hermitienne, on peut supposer <p(x, y) G R, quitte à multiplier x par e%e avec 9 G R bien choisi. On a VAGR, ${\x + y) = \2$(x) + 2\<p(x,y)+<ï>(y) > 0. (**) Si $(x) = 0, pour tout À G R, (**) s'écrit 2\(p(x,y) + $(y) > 0, ce qui entraîne (p(x,y) = 0. Sinon $(x) ^ 0, et le trinôme du second degré (**) en À a un discriminant négatif, ce qui s'écrit ip{x,y)2 - $(x)$(y) < 0, d'où l'inégalité. Supposons $ définie et x ^ 0 (le cas x = 0 est trivial). Alors <3>(z) ^ 0, de sorte que (*) est une égalité si et seulement si le discriminant de (**) est nul, c'est à dire si et seulement s'il existe Ao G R tel que $(\ox + y) = 0, ce qui équivaut à Xox + y = 0 puisque $ est définie, c'est-à-dire que la famille (x, y) est liée. □ Conséquence. Si $ est positive, alors C$ = Ker<Ê>, C$ désignant le cône isotrope de $. En particulier, une forme positive $ est définie si et seulement si elle est non dégénérée. Corollaire 2 (Inégalité de Minkowsky). Si $ est positive, alors V(x,2/)G£2, y/${x + y) < y/ô{x) + y/Ô(y). L'inégalité de Minkowsky est une conséquence immédiate de l'inégalité de Schwarz. Elle exprime que si $ est positive, S{x) = ^/$(x) définit une semi-norme. Si de plus $ est définie, S est une norme (on dit alors que </? est un produit scalaire, voir la section 2). 1.4. Exercices EXERCICE 1. Décomposer sous forme de somme de carrés les formes quadratiques ou hermitiennes suivantes ; en déduire leur signature et leur rang. a) $(x, y, z, t) = xy + yz-\- zt + tx, (x, y, z, t) G M4. b) $(x, y, z) = x2 - 2y2 + xz + yz, (x, y, z) G R3. c) $(£, y, z) = xx + yy + zz + xy-\-xy-yz- yz, (rc, y, z) G C3. Solution. On va appliquer la méthode de Gauss, garantissant ainsi l'indépendance linéaire des formes linéaires obtenues, ce qui nous permettra de calculer la signature de la forme correspondante. a) Il suffit d'écrire $(xyy,z,t) = (x + z){y + t) = -[{x + z + y+ t)2 - (x + z-y - t)2]. La signature de $ est donc (1,1), son rang 1 + 1 = 2. b) On a / Z \ 2 Z / Z\*^ / Z\*^ Z Z La signature de $ est donc (1,2), son rang est 3. c) On a $(z, y, z) = {x + y)(x + y) + zz-yz-yz = (x + y)(x + y) + {z-y)(z-y)-yy=\x + y\2 + \z- y\2 - \y\2. La signature de $ est donc (2,1) et son rang est 3.
236 5. ESPACES EUCLIDIENS Exercice 2. Soit n e N*. On note Cn[X] = {P G C[X] | deg(P) < n}. Démontrer que l'application $ : Cn[X] -► C Ph/ ~P(x)P(-x) dx est une forme hermitienne et calculer sa signature. Solution. La forme sesquilinéaire <p: Cn[X]2^C (P,Q)i-* / P(^)Q(-rc)dx est à symétrie hermitienne (on le vérifie facilement en effectuant le changement de variable x —> — x dans l'intégrale), et $ est sa forme hermitienne associée. Notons V (resp. 1) le s.e.v des fonctions paires (resp. impaires) de Cn[X]. On a P0T = Cn[X] puisque si P G P n J, P(-X) = P{X) = -P{X) donc P = 0, ainsi P n X = {0} ^ vpec„m, fm^W^)/W-^), donc P+I = c„m. " v ' N v ' eP ex Si P G P, P t^ 0, est une fonction paire, alors $(P)= / ¥{x)P{x)dx= f \P(x)\2dx>0, et si P G X, P ^ 0, est impaire, $(P) = / P(^)(-P(x))^ = - / \P(x)\2dx < 0. De plus, V et J sont ^-orthogonaux car V(P, Q) G P x J, / P(^)Q(-x) cte = / P(^)(-Q(z)) dx = - f T{x)Q{-x) dx, donc ip(P,Q) = 0. Avec la remarque 9 page 234, on en conclue que la signature de $ est (dimPjdimJ) = ([n/2] + 1, [(n + l)/2]) (où la notation [#] désigne la partie entière de x). Exercice 3 (Quelques formes quadratiques sur Mn(R)). Montrer que les applications suivantes sont des formes quadratiques et calculer leur signature. a) qi : Mn(R) -> R Ai-» (trA)2. b) q2 ■ Mn(R) -> M Ah tr('AA). c) qz ■ Mn(R) -> M Ah tr(A2). d) ç4 : .MnW —> R Ai-» tr(5A'A), où S G A1n(lR) est une matrice symétrique fixée. Solution. Tout au long de l'exercice, nous aurons besoin du résultat suivant : Si P = (Pi,j)i<i,j<n et Q = fc)i<i,i<nGjMn(l)) on a tr(PQ) = ^ Pij^i- (*) La preuve est simple, il suffit de remarquer que l'élément d'indice (i, i) dans la produit PQ est a) L'application #i est bien une forme quadratique, sa forme polaire étant pi : (A,B) \-> tv(A)tr(B).
1. FORMES QUADRATIQUES - FORMES HERMITIENNES 237 L'application tracé est une forme linéaire sur Mn(M). Son noyau H est donc un hyperplan de Mnfà)- Soit S un supplémentaire de H dans .Mn(IR), de sorte que dim5 = 1 et Wl G 5\{0}, tr^^O. Ainsi, VAeH, qi(A) = 0 et VB G 5\{0}, qi(B) > 0. (**) De plus, pour tout couple (A,B) G H x 5, ipi(A,B) = tr(A)tr(B) = 0, donc H et S sont ^-orthogonaux. Avec (**) et d'après la remarque 9 page 234, ceci suffit pour conclure que la signature de q\ est (1,0). b) On a bien affaire à une forme quadratique, la forme polaire associée étant ^2 • (A, B) 1—> tr(lAB). Maintenant, en appliquant le principe (*), on voit que toute matrice A = {o>ij)i<ij<n £ Mnfâ) vérifie q2(A) = X^,ja?,j> ce °lui suffit à prouver que 92 est une forme définie positive, donc de signature (n2,0) (en d'autres termes, c'est un produit scalaire sur .Mn(R)). c) La forme polaire associée à 43 est (^3 : (AyB) 1—> tr(AB). La relation (*) prouve que si A G S (s.e.v des matrices symétriques de .Mn(R)), Q3(A) = Y^ijal,j d°nc ^a restriction #3|5 de 43 à S est définie positive. Si A G A (s.e.v des matrices antisymétriques), (*) montre que q3(A) = — J2u a?,j> ce Quî prouve que q^A est définie négative. De plus, S 0 A = Mn{R) (voir la remarque 2) et S et A sont (^-orthogonaux puisque si S G S et A G A, <Ps(S,A) = tv{SA) = tr(\SA)) = tr(U'S) = tr(-AS) = - tr(5i4) = -^sOM), donc ips(S}A) = 0. D'après la remarque 9, ceci suffit pour conclure que la signature de 43 est (dim<S,dim.A) = (n(n + l)/2,n(n - l)/2). d) Remarquons tout d'abord que q^{A) = tr(5i4*i4) = tr(*AS^4). La forme polaire de 94 est ip4: (A,B)t-+tr(tASB). La matrice S est symétrique. L'application En —> R Ih lXSX est une forme quadratique. //p 0 o\ Si on note (p, 4) sa signature, on s'aperçoit que S est congrue à la matrice J = I 0 -iq 0 , \ 0 0 0/ autrement dit / /p 0 0 3PG^n(R), <PSP = J = 0 -/, 0 \ 0 0 0 Maintenant, on se donne B G Mn(R) et on écrit B = PA avec A = (<kj)i<ij,<n € A^n(K). Un peu d'attention montre que p n p+q n qA{B) = q4(PA) = trfA'PSPA) = trfAJA) = E Eah ~ E E a'r (***) j=l i=l j=p+l i=l Les applications /^j : B i-> a^j où aij est le coefficient d'indice (z, j) dans ^4 = P~lB formant une famille libre de formes linéaires de .Mn(K)*, l'expression (***) montre que la signature de ^4 est (np) nq). Exercice 4. Soit E un R-e.v de dimension finie et $ une forme quadratique sur E. Si <ï> est définie, montrer que $ est soit positive soit négative. Solution. Soit (p, 4) la signature de $ (au passage, on a p + 4 = dim E car $ étant définie, $ est non dégénérée, c'est à dire rg<3> = p + 4 = dim J5). Il s'agit de montrer que p = 0 ou q = 0. Nous allons raisonner par l'absurde en supposant p ^ 0 et q ^ 0. On peut écrire *(*) = E^)2-E^)2> où (pi}...}<Pp}i/)i,".}il>q sont des formes linéaires (on peut même les supposer linéairement indépendantes, mais nous n'en aurons pas besoin).
238 5. ESPACES EUCLIDIENS Les formes linéaires <pi—ipi, <p2, • • • ><pp, 1P2,• • • >i>q sont au nombre dep+q — 1 < dimF, donc si F désigne le sous-espace de E* (dual de E) engendré par ces formes linéaires, on a dimF < n, et donc l'orthogonal F° de F (au sens dual) est différent de {0}. En particulier, il existe x G E, x^O, tel que <fl(x) - 1pl{x) = <f2(x) = • • • = <fp(x) = tj)2(x) = ••• = 1pq(x) = 0, ce qui entraîne <f\{x) = i>i(x) et $(a0 = v?i(a02-Vi(z)2 = O, ce qui est contraire aux hypothèses puisque $ est définie. Remarque. Une autre approche consiste à passer par un argument topologique de continuité. Si $ n'est ni positive ni négative, il existe x ^ 0 et y ^ 0 tels que $(x) > 0 et $(2/) < 0. On considère alors l'application /: [0,1]^ R \^$(\x + {l-\)y). Comme $ est quadratique, / est une fonction polynôme de degré < 2 donc est continue. Or /(0) = $(y) < 0, /(l) = $(x) > 0 donc d'après le théorème des valeurs intermédiaires, il existe A G ]0,1[ tel que /(A) = 0 = $(Aa;+(l — X)y), et $ étant définie, on a \x+(l—X)y = 0, donc y = 0x avec (5 = -A/(l - A). Ceci entraîne $(y) = $((3x) = f32$(x) > 0, ce qui est absurde, donc notre résultat est prouvé. Cette dernière démonstration montre que le résultat de l'exercice est vrai en dimension infinie. - Le même type de résultats vaut pour les formes hermitiennes. Exercice 5 (Sous-espaces totalement isotropes). Soit $ une forme quadratique sur un K-e.v E de dimension finie n e N*. On appelle sous-espace totalement isotrope (en abrégé SETI) un s.e.v F de E tel que pour tout x G F, $(x) = 0, ce qui équivaut à F C F1. On appelle SETI maximal (en abrégé SETIM) un SETI F tel que pour tout SETI G vérifiant F C C, on a G = F. 1/ a) Soit F un SETI. Montrer que dimF < n - r/2, où r est le rang de $. b) Montrer que tout SETI est inclus dans un SETIM. 2/ On suppose dorénavant que $ est non dégénérée. a) Soient i*\ et F2 deux SETIM. On pose F = Fi n F2, Si un supplémentaire de F dans Fi, £2 un supplémentaire de F dans F2, de sorte que F®Si = Fi et FÇBS2 = F2. Montrer que Si D S^ = S^ HS2 = {0}. En déduire dim Fi = dim F2. Les SETIM ont donc tous même dimension ; cette dimension est appelée indice de $. b) On suppose ici K = R et $ de signature (p, q). Quel est l'indice de <É>? Solution. 1/ a) On a F C F1, donc dim F < dim F1, et avec la proposition 6 page 233, 2 dim F < dim F + dim FL = n + dim(F D Ker $) < n + dim(Ker $) = 2n - r, d'où le résultat. b) Soit F un SETI et Y l'ensemble des SETI contenant F. On pose m = sup{dimG, G G T}. Par construction, il existe un SETI G tel que F C G et dim G = m. Le s.e.v G est alors un SETIM (si H est un SETI et si G C H, alors F c H de sorte que H G T et donc dim if < m, ce qui entraîne dimiï = m = dim G et G = H). 2/ a) Soit x G Si D S£. On a déjà a; G Frj-. En effet, comme F2 = F 0 S2, on a F^- = F1 D 52", et il suffit de montrer que x G F1. Ceci est vrai car x G Fi C Fj1 C F1 (la première inclusion provient du fait que Fi est un SETI et la seconde est une conséquence de ce que F C Fi).
1. FORMES QUADRATIQUES - FORMES HERMITIENNES 239 Poursuivons. On a z G Si C Fi donc x est isotrope. Considérons le s.e.v G = F<z + Kx. Soit z = y + kx G G (y G F2, k G K). En notant </? la forme polaire de $, on a $(z) = $(y) + fc2$(z) + 2k(p(x, y). (*) On a 2/ G F2 donc $(?/) = 0 ; on a vu que <3>(z) = 0, et on a montré plus haut que x G Frj-, de sorte que <p(x,y) = 0, et donc (*) entraîne $(z) = 0. Ceci étant vrai pour tout z G G, on en déduit que G est un SETI. Comme F2 C G et que F2 est un SETIM, ceci entraîne G = F2 et donc x G i<2. Or rc G 5i cFi, donc £ G Fi D F2 = F, donc £ G Si D F = {0}, ce qui entraîne x = 0. - Nous venons de montrer S\C\ S$r = {0}, c'est à dire que Si et S^r sont en somme directe, ce qui entraîne dim Si + dim S2 < dim E = n. La forme quadratique $ étant non dégénérée, "la proposition 6 entraîne dirnS^ = n — dimS2, donc finalement dim Si + n — dimS2 < n, i.e dim Si < dimS2. Par symétrie, on a également dimS2 < dim Si, d'où dim Si = dimS2 et dimFi = dim(F 0 Si) = dim F + dim Si = dim F + dimS2 = dim(F 0 S2) = dimF2. b) La non dégénérescence de $ entraîne p + q = n. Notons k = inf{p, q}. Il existe une base (ei,..., en) de E dans laquelle la matrice de $ a la forme [ ? , J. Posons F = Vect(ei + ep+i,..., ejt + ep+k). Pour tout i, 1 < i < k, $(ej + ep+i) = $(ej) + $(ep+i) = 1 - 1 = 0. Les vecteurs e* étant de plus deux à deux orthogonaux, on en déduit que F est un SETI. Soit G un SETI tel que F G G. Donnons nous x G G, et écrivons x = Yli \e%- On a $(z) = 0 = £a?- £ \l («) i=l i=p+l En désignant toujours par y> la forme polaire de <3>, on a Vi, 1 < i < /c, </?(x, et + ep+i) = - [$(x + e» + ep+i) - $(x) - $(e^ + ei+p)] = 0 = Xi- Xi+P) ce qui entraîne À; = Xp+i pour 1 < i < k. Avec (**) on a donc x = Yli=i ^i(ei + ep+î) e F> et ceci pour tout SETI G contenant F. Le s.e.v F est donc un SETIM et l'indice de $ est dim F = k = inf{p, q}. Exercice 6. Soit E un K-e.v de dimension finie, soit (p : F x E —> K une forme bilinéaire vérifiant la propriété suivante : V(x, y) G F2 tel que <^(x, y) = 0, on a <p(y, x) = 0. Montrer que (p est symétrique ou antisymétrique. Solution. Supposons dans un premier temps ip non dégénérée (i.e pour tout x ^ 0, <^>(x, •) ^ 0). L'hypothèse sur (p entraîne que pour tout x G £", les formes linéaires </?(x,-): y^y>{x,y) et <,?(•, x) : y^<p(yyx) ont même noyau. Comme elles sont non nulles, il existe Xx G K tel que <^>(x, •) = Xxtp(-,x) (voir la proposition 5 page 129). On considère maintenant les applications /: E —> J5* xh^(x,') et g : E-^> E* x «-><£>(•, x). Ces applications sont linéaires, injectives (car <p est non dégénérée), donc bijectives (car dimE = dimE*). Or, comme on a vu plus haut, pour tout x G £", /(x) = Xxg(x), ou encore f og~1(x) = Xxx avec Àx G K. D'après la proposition 3 page 115, f og'1 est donc une homothétie, autrement dit il existe À G K tel que / o g~l = Àld ou encore / = Xg. Ceci s'écrit aussi Vx G £", <£>(x, •) = A<£>(-, x) et donc Vx, yeE, </?(x, y) = A^(j/, x) = \2tp(x, y).
240 5. ESPACES EUCLIDIENS On en déduit que À2 = 1, donc que À G {—1,1}. La forme bilinéaire ip est donc symétrique ou antisymétrique. - Traitons maintenant le cas général. On considère Kerip = {x G E \ <p(x,-) = 0}. Soit F un s.e.v de E tel que Kerip © F = E. Comme F n Ker</? = {0}, la restriction de </? à F est non dégénérée, de sorte que l'on peut appliquer ce que l'on vient de montrer : {3e G {-1,1}), V(œ,y) G F2,ip(x,y) = e<p(y,x). Ceci étant, on se donne (x,y) G E2 et on écrit x = x\ + x2, y = 2/1 + 2/2 (#i,2/i G Ker<^, £2,2/2 G F). On a (p(x,y) = <p(xiiyi + y2) + (p(x2,yi + y2) = <p(x2,yi+y2) = <p(x2,y2) = €(p(y2,x2) =e(p(y1x), d'où le résultat. 2. Espaces préhilbertiens 2.1. Généralités Soit $ une forme quadratique (resp. hermitienne) sur un R-e.v (resp. un C-e.v) E. On rappelle que $ est positive si pour tout x e E, $(x) > 0. Supposons <Ê> définie positive. Sa forme polaire (p s'appelle un produit scalaire (resp. un produit scalaire hermitien). On note souvent <p(x,y) = x-y (ou (x\y), ou encore (x,y)). On a, x -y = y ■ x (resp. x • y = W7^)- On écrit souvent x2 pour a; • x. Dans ce cas, l'inégalité de Minkowsky (voir le corollaire 2 de la partie précédente) montre que ||rc|| = y/$(x) = y/x • x définit une norme sur E. Cette norme s'appelle norme euclidienne (resp. norme hermitienne) et fait de E un e.v norme. Un R-e.v muni d'un produit scalaire s'appelle un espace préhilbertien réel (s'il est de plus complet — pour la norme issue du produit scalaire — on dit que c'est un espace hilbertien réel). S'il est de dimension finie, on l'appelle également espace euclidien. Sauf mention explicite, la norme utilisée sur un espace préhilbertien est la norme euclidienne. Un C-e.v muni d'un produit scalaire hermitien s'appelle un espace préhilbertien complexe. S'il est de dimension finie, on l'appelle également espace hermitien. L'inégalité de Schwarz Vxty€Et \x • y\ < \\x\\ • \\y\\ entraîne la continuité du produit scalaire dans l'espace préhibertien E. Si E est un espace préhilbertien réel, cette inégalité entraîne Vrc,2/ € E,x ? 0,2/ ? O,3!0 G [0,tt], cos0 = X'V Le nombre réel 6 s'appelle Y écart angulaire de x et y. Remarque 1. On ne définit pas l'écart angulaire dans un espace préhilbertien complexe. Dans toute la suite, nous utiliserons ces notations. 2.2. Orthogonalité L'orthogonalité définie pour une forme quadratique ou hermitienne s'applique en particulier pour un produit scalaire. Ainsi, deux vecteurs x et y sont dit orthogonaux si et seulement si x • y = 0 (ou encore si et seulement si y • x = 0). Une famille de vecteurs non nuls (ei)i£i est dite orthogonale si elle vérifie e* • ej = 0 dès que i ^ j (et c'est alors une famille libre). Si de plus on a ||ei|| = 1 pour tout i G /, la famille est dite orthonormale (ou orthonormée).
2. ESPACES PRÉHILBERTIENS 241 On peut ainsi parler de base orthogonale ou orthonormale. Si E est un espace euclidien (resp. hermitien) et si (ei,..., en) est une base orthonormée de E, alors n n n n Vrc = ^2Xiei e E' ^y = YlViei e E> x-y = J£2xiyi (resp. x ■ y = ^xlyi). i=l i=l i=l i=l Les coordonnées (#*) de x dans la base orthonormale (e*) de E vérifient Proposition 1. Si (ei)i£i est une famille finie orthogonale de vecteurs de E, on a l'égalité UX^II^E^Ihll2- Remarque 2. Dans un espace préhilbertien réel, si \\x + y\\2 = \\x\\2 + ||t/||2, alors x et y sont orthogonaux. Ceci est faux dans un espace préhilbertien complexe (par exemple, si x ^ 0, ||rrr + zx||2 = |1 -H|2||a;||2 = 2||a;||2 = ||x||2 + \\ix\\2 et pourtant x et ix ne sont pas orthogonaux). Théorème 1 (de la médiane). Pour tout couple (x,y) G E2, on a \\x + yf + \\x-yf = 2(\\xf + \\yf). Remarque 3. - On peut montrer réciproquement que si une norme vérifie cette relation, c'est une norme euclidienne (resp. hermitienne) — voir l'exercice 9 page 252. - Le théorème de la médiane est encore appelé identité du parallélogramme. Procédé d'orthogonalisation de Schmidt. Nous allons construire, en partant d'une famille libre finie (ei,...,en) de vecteurs de E, une base orthogonale (ui,...,un) de Vect(ei,..., e„) telle que pour tout &, Uk G Vect(ei,..., e^). On procède par récurrence. • On prend U\ = e\. • On cherche u<i sous la forme e<i + Ai^ u\. On veut que U\ • u<i = 0, ce qui sera réalisé si et seulement si x ui • e2 Al>2 — _"îi—ii?- • Les vecteurs U\,..., Uk-i étant construits, on cherche Uk sous la forme eu + Ai^ U\ + • • • + \k-i,kUk-i- On veut que Ui • u^ = 0 pour l<i<A; — 1, ce qui sera réalisé si et seulement si on prend _ Ui ■ ek a~ INI2' En normant les vecteurs u^ on obtient même une base orthonormée. Remarque 4. La matrice de passage de la famille (e*) à la famille (uj) est de la forme / 1 x ... x \ 0 1 ••• : P = : -. -. x V o ••• o i / Théorème 2. Soit E un espace préhilbertien (réel ou complexe) et F un s.e.v de E. Alors (i) F c FL± (ii) Si F est de dimension finie, on a E = F © F1 et F = F11. Démonstration. L'assertion (i) résulte de la proposition 3 de la section 1 et la (ii) est une application de la proposition 7 page 233. □ Remarque 5. L'assertion (ii) reste vraie en dimension infinie si F est complet mais est fausse dans le cas général (voir l'exercice 11 page 253).
242 5. ESPACES EUCLIDIENS Projection et symétrie orthogonale. DÉFINITION 1. Soit E un espace préhilbertien et F un s.e.v de E de dimension finie. Le théorème précédent dit que F 0 FL = E. - On appelle projection orthogonale sur F la projection sur F parallèlement à F1. - On appelle symétrie orthogonale par rapport à F la symétrie par rapport à F parallèlement à F1. Remarque 6. Si (ei,..., en) est une base orthonormale de F, alors la projection orthogonale de x sur F est égale à y = XX=i At^t avec A* = e* • a:. Proposition 2. Soit E un espace préhilbertien et F un s.e.v de E de dimension finie. Soit x G E et p la projection orthogonale sur F. Alors la distance de x à F vérifie d(x,F) = \\x-p(x)\\. Démonstration. Soit y G F. On &x—y= (x—p(x))-\-(p(x)—y). Or x—p(x) G F1 etp(x)—y G F, donc ||z-ï/||2 = ||z-p(z)||2 + ||p(z)-ï/||2, donc infy€F \\x - y\\2 = \\x -p(x)\\2, d'où le résultat. □ Remarque 7. Comme x — p(x) est orthogonal à p(x), la relation x = (x — p(x)) -\-p(x) entraîne ||a;||2 = \\x-p(x)\\2 4- |b(z)||2, donc d{xt F)2 = \\x\\2 - \\p(x)\\2. Si (ei,..., en) est une base orthonormale de F, on a donc d(x, F)2 = \\x\\2 — Y17=i M2> ou A* = e» • x. 2.3. Isométries et endomorphismes unitaires DÉFINITION 2. Soit E un espace préhilbertien et f e £{E) telle que pour tout x G E, n/(*)ii = ii*ii. - Si E est préhilbertien réel, / est appelé isométrie (on dit aussi endomorphisme orthogonal). - Si E est préhilbertien complexe, / est appelé endomorphisme unitaire. Proposition 3. Soit E un espace préhilbertien et f une application de E dans E. Alors f est une isométrie (resp. un endomorphisme unitaire) si et seulement si V(x,y)eE2, f(x)-f(y) = x-y. (*) Remarque 8. Noter que la propriété (*) implique la linéarité de /. Proposition 4. Si f e C(E) est une isométrie (resp. un endomorphisme unitaire) alors f est injective. Si de plus E est de dimension finie alors f est bijective. Proposition 5. - L'ensemble des isométries d'un espace euclidien E est un groupe (muni de la loi o de composition), appelé groupe orthogonal de E et noté 0{E). - L'ensemble des endomorphismes unitaires d'un espace hermitien E est un groupe appelé groupe unitaire de E et noté U(E). Propriétés matricielles des isométries et des endomorphismes unitaires. Proposition 6. Soit E un espace euclidien (resp. hermitien) et f G C(E). Alors f est une isométrie (ou un endomorphisme unitaire) si et seulement si l'image d'une base orthonormale de E par f est une base orthonormale de E. Conséquence. Soit B une base orthonormale de E et / G C{E). Soit A la matrice de / dans B. Alors / une isométrie (resp. un endomorphisme unitaire) si et seulement si lAA = A1 A = In (resp. tÂA = Al = In). On en déduit que det('A) det(A) = 1 = (det(A))2 (resp. det('Â) det(i4) = 1 = |det(A)|2). - Si / est une isométrie, on a donc (det f)2 = 1, ou encore det / G {—1,1}. - Si / est un endomorphisme unitaire, on a | det/|2 = 1, donc | det/| = 1.
2. ESPACES PRÉHILBERTIENS 243 DÉFINITION 3. - Si A G Mnfâ) vérifie lAA = In,A s'appelle une matrice orthogonale. - Si A G Mn(C) vérifie lAA = 7n, A s'appelle une matrice unitaire. - L'ensemble des matrices orthogonales de A^n(M) constitue un groupe noté (9n, celui des matrices unitaires de Mn(C) est un groupe noté Un. DÉFINITION 4. - Soit / une isométrie d'un espace euclidien E. On dit que / est une isométrie directe si det/ = 1, une isométrie indirecte si det/ = — 1. - L'ensemble {/ G O(E) | det/ = 1} est un sous-groupe distingué de O(E) appelé groupe spécial orthogonal de E et noté G+(E) (on le note encore SO(E)). - Si E est hermitien, l'ensemble {/ G U(E), det f = 1} est un sous-groupe distingué de U{E) noté SU(E). - Pour les matrices, on note également SOn = 0+ = {AeOn | detA = l} et SUn = {A G Un | det A = 1}. L'ensemble <S(9n est un sous-groupe distingué de On, SUn un sous-groupe distingué de Un. Remarque 9. La réduction des endomorphismes orthogonaux ou unitaires fait l'objet de la partie 3.1. Dans le cas particulier du plan ou de l'espace, on trouve les résultats classiques suivant : - La matrice d'une isométrie directe du plan s'écrit dans n'importe quelle base orthonormale B sous la forme R{9) = (<**$ '<££) avec ® e K (r°tation d'angle 0). - La matrice d'une isométrie directe de l'espace s'écrit sous la forme f 5n0 cosi o ) dans une base orthonormale B bien choisie (rotation d'angle 9 autour du dernier vecteur de la base B). 2.4. Endomorphismes adjoints Définition 5 (Adjoint). Soit E un espace euclidien (resp. hermitien) et f et g e C(E). Les endomorphismes f et g sont dits adjoints si V(z,2/)G£2, f(x)-y = x-g(y). (*) L'endomorphisme / étant donné, il existe au plus un endomorphisme g vérifiant (*). Lorsqu'il existe, on l'appelle adjoint de / et on le note /*. Lorsque / = /*,/ est dit autoadjoint. Remarque 10. - L'adjoint /* d'un endomorphisme / n'existe pas toujours (nous verrons cependant qu'en dimension finie, et plus généralement dans un espace hilbertien lorsque / est continu, l'adjoint de / existe). - Lorsque /* existe, (/*)* = /** existe et on a /** = /. Etude en dimension finie. Notation. Nous utiliserons la notation introduite dans la partie 1.2 : si M désigne une matrice complexe, on note M* = tM sa transconjuguée. Ainsi, lorsque M est une matrice réelle, M* désignera tout simplement la transposée de M. Soit E un espace euclidien ou hermitien, B une base orthonormée de E. Soit / G C(E), M la matrice de / dans la base B : M = [/]#. On cherche un endomorphisme g qui soit l'adjoint de /. En notant N = [g]B, on voit que (*) est vérifiée si et seulement si pour tous vecteurs X, Y, (MX)*Y = X*(NY) ou encore X*M*Y = X*NY. L'endomorphisme g est donc l'adjoint de / si et seulement sa matrice N dans la base B vérifie N = M*. En résumé, pour tout / G £(£), /* existe et [f*]B = [f]*B.
244 5. ESPACES EUCLIDIENS Remarque 11. - Attention, ceci n'est vrai que lorsque B est une base orthonormée de E. - Si E est euclidien, un endomorphisme / G C(E) est autoadjoint (on dit encore symétrique) si et seulement si la matrice de / dans une base orthonormée quelconque de E est symétrique. - Si E est hermitien, / est autoadjoint si et seulement si sa matrice M dans une base orthonormée de E est hermitienne {Le si elle vérifie lM = M). Réduction des endomorphismes autoadjoints. Nous aurons besoin de la proposition suivante. Proposition 7. Soit E un espace euclidien ou hermitien, et f e C{E) un endomorphisme autoadjoint. Si F est un s.e.v de E stable par f, alors FL est stable par /. Démonstration. Il suffit d'écrire que Va: G FtVy G F\ x- f(y) = f{x)-y = 0. D Théorème 3. Soit E un espace euclidien (resp. hermitien) et f S £{E) un endomorphisme autoadjoint. Alors il existe une base orthonormée de vecteurs propres pour f, et de plus ses valeurs propres sont réelles. Démonstration. On procède par récurrence sur la dimension n de E. Pour n = 1, c'est évident. Supposons le résultat vrai jusqu'au rang n—1 et montrons le au rang n. On considère l'application $ : E —» R i h a; • /(s), C'est une forme quadratique (resp. hermitienne), de forme polaire <p(x,y) = x • f{y). Comme on est en dimension finie, la sphère unité S = {x G E, \\x\\ = 1} de E est compacte, et $ étant continue (toujours parce que l'on est en dimension finie), il existe xo G S tel que $(xo) = supx€s $(z) = À. Ceci étant, on considère la forme quadratique (resp. hermitienne) définie par $i(x) = À||x||2- <J>(z). La forme $i est positive par construction de À. Or <J>i(#o) = 0, i.e $i n'est pas définie, et donc $i est dégénérée (rappelons qu'une forme positive est définie si et seulement si elle est non dégénérée, voir la conséquence de l'inégalité de Schwarz, partie 1.3). La forme polaire de $i étant <pi(x,y) = x-g(y) avec g = Ald^ —/, la dégénérescence de $i entraîne l'existence de x ^ 0 tel que pour tout y G E, <p\(x,y) = 0 = x-g{y). L'application g n'est donc pas surjective (x n'est pas atteint), donc non injective (g est un endomorphisme en dimension finie), ce qui entraîne l'existence d'un vecteur norme e\ tel que g{e{) = 0 = Àei — f{e{). Autrement dit, À G M est valeur propre de / associée au vecteur propre e\. Posons H = (Vectei)-1. D'après la proposition précédente, H est stable par /. La restriction de / à H étant autoadjointe, l'hypothèse de récurrence assure l'existence d'une base orthonormée (e2,...,en) de H qui diagonalise /|# (à valeurs propres réelles). La base (ei,... ,en) est alors une base orthonormée qui diagonalise /, et les valeurs propres de / sont toutes réelles. D La version matricielle de ce théorème est la suivante. Corollaire 1. Soit M e MnW (resp. M e Mn(C)) une matrice symétrique (resp. hermitienne). Alors il existe une matrice C orthogonale (resp. unitaire) telle que C~lMC = C*MC = D, D étant une matrice diagonale réelle. Démonstration. On note E = Rn (resp. E = Cn). Munissons E du produit scalaire (resp. du produit scalaire hermitien) usuel : n n (xi,..., xn) ■ (yi,..., yn) = ^2 xiVi (resP- = ^2 Biy*)'
2. ESPACES PRÉHILBERTIENS 245 Soit / G C{E) dont la matrice dans la base canonique B de E est M : [/]# = M. Comme / est autoadjoint (car M est symétrique, resp. hermitienne), il existe d'après le théorème précédent une base B' orthonormée de E telle que [/]#/ = D soit diagonale réelle. Si on désigne par C la matrice de passage de la base B à la base B', C est une matrice orthogonale (resp. unitaire) et C'lMC = C*MC = D. D Remarque 12. On rappelle qu'une matrice symétrique (resp. hermitienne) M est positive si la forme quadratique (resp. hermitienne) X i-> X*MX est positive. Elle est dite définie positive si cette forme quadratique est définie positive. Le corollaire montre que M est positive (resp. définie positive) si et seulement si toutes ses valeurs propres sont positives (resp. strictement positives). Corollaire 2. Soit $ une forme quadratique (resp. hermitienne) sur un espace euclidien (resp. hermitien) E. Alors il existe une base orthonormée de E dans laquelle la matrice de $ est diagonale réelle. Démonstration. Soit B une base orthonormée de E et soit M la matrice de $ dans la base B. La matrice M est symétrique (resp. hermitienne), et d'après le corollaire précédent, il existe une matrice C orthogonale (resp. unitaire) telle que C*MC = D est diagonale réelle. La matrice C défini un changement de base orthogonal qui fait passer de la base B à une base orthonormée B', et la matrice de $ dans la base B' est D, d'où le résultat. D Remarque 13. Notez bien la différence entre ce dernier corollaire et le théorème 1 de la page 231. Ici, la base qui diagonalise $ a en plus la propriété d'être orthonormée pour le produit scalaire de l'espace E. —*■ Corollaire 3. Soient M,N deux matrices symétriques (resp. hermitiennes), telles que la matrice M soit définie positive. Alors il existe une matrice C inversible telle que C*MC = In et C*NC = D, où D est une matrice diagonale réelle. Démonstration. Sur E = Rn (resp. sur E = Cn), l'application $ : (X,Y) •-+ X*MY défini un produit scalaire, et * : X •-> X*NX une forme quadratique (resp. hermitienne). D'après le corollaire précédent, il existe une base B orthonormée (pour le produit scalaire $) telle que la matrice D de ^ dans B soit diagonale réelle. En désignant par C la matrice de passage de la base canonique de E à la base B, on a C*MC = In et C*NC = D, d'où le résultat. D Remarque 14. Ce dernier corollaire rend parfois de précieux services. On peut le voir comme un résultat de pseudo-réduction simultanée. Prenez garde au fait que la matrice C n'est en général pas orthogonale (ou unitaire). 2.5. Exercices ^** Exercice 1 (Racine carrée d'une matrice hermitienne positive). Soit H e A4n(C) une matrice hermitienne positive. Montrer qu'il existe une unique matrice R hermitienne positive telle que H = R2. Solution. Existence. La matrice H étant hermitienne, il existe une matrice unitaire C telle que ( Al (0) \ tCHC = C~1HC= .. =D, V (0) An )
246 5. ESPACES EUCLIDIENS D étant diagonale réelle. Comme H est positive, tous les \ sont positifs donc pour tout i, il existe ^ > 0 tel que À* = fif. En posant / A*i (0) V=[ , V (0) Mn onaD/2 = Dde sorte que R = CD'C~l = CDnC est hermitienne positive et vérifie R2 = CD,2C~l = CDC~l = H. Unicité. Soit R hermitienne positive telle que R2 = H. Soient h et r les endomorphismes de Cn dont H et R sont les matrices dans la base canonique de Cn. Comme H est hermitienne, h est autoadjoint. Ses valeurs propres Ai,..., Xp sont positives car H est positive. Notons E\x,..., E\ les sous-espaces propres correspondants. Comme r commute avec r2 = /i, chaque E\{ est stable par r (voir la proposition 7 page 166). On note r^ = r\Ex.. On a r2 = X{ ldsx., et ri est autoadjoint positif ; toute valeur propre /j, de ri vérifie /j,2 = À;, donc /x = \Aï est la seule valeur propre possible de r^ (car les valeurs propres de r^, qui sont des valeurs propres de r donc de i?, sont positives). Comme r^ est de plus diagonalisable (car autoadjoint), on en déduit r^ = y/\IdEx.. Résumons. Si r2 = /i, alors forcément pour tout z, r^x. = \Aïld|^A , ce qui définit r de manière unique, d'où l'unicité de R. Exercice 2. Soit E un espace hermitien et / et g deux endomorphismes autoadjoints de £{E) tels que fg = gf. Montrer que f et g sont diagonalisables dans une base commune de vecteurs propres orthonormés. Solution. Les endomorphismes f et g étant autoadjoints, on sait déjà qu'ils se diagonalisent chacun dans une base orthonormée. Il nous reste à montrer que l'on peut prendre la même base pour les deux. Notons Ai,..., Àr les valeurs propres (distinctes) de /, E\iy..., E\r les sous-espaces propres correspondants. Les E\. sont deux à deux orthogonaux (pour s'en persuader, diagonaliser / dans une base orthonormée). Comme f et g commutent, les E\i sont stables par g. La restriction de g à E\. étant autoadjointe, il existe une base orthonormée Bi de E\{ diagonalisant g\Ex.- Les E\. étant deux à deux orthogonaux, on en déduit que B = (i?i,..., Br) est une base orthonormée. Cette base diagonalise g par construction ainsi que / puisque chaque vecteur e de B{ vérifie /(e) = Aie. Remarque. De la même manière que dans l'exercice 4 page 171, ce résultat se généralise à toute famille (fi)iei d'endomorphismçs autoadjoints commutant deux à deux. Exercice 3. Soit E un espace hermitien et f eC(E). a) Montrer que / est trigonalisable dans une base orthonormée de E. b) Si f et g e £{E) commutent, montrer qu'il existe une base orthonormée de E trigo- nalisant à la fois f et g. Solution, a) Nous allons donner deux moyens de procéder. Première méthode. Le corps C étant algébriquement clos, / est trigonalisable dans une base B = (ei,... ,en) de £", et donc pour tout ky /(e^) G Vect(ei,... ,efc). Soit (tii,... yun) la base orthonormée de Schmidt associée à B (voir page 241). Pour tout fc, on a Vect(ui,... yUk) = Vect(ei,... ,efc), et donc V/c,l < k < n, f(uk) e /(Vect(ei,... ,efc)) C Vect(ei,... ,efe) = Vect(ui,... ,ufe).
2. ESPACES PRÉHILBERTIENS 247 Ceci prouve que la matrice de / dans la base orthonormée (u\}..., un) est triangulaire supérieure. Seconde méthode. On procède par récurrence sur la dimension n de E. Si n = 1, c'est évident. Supposons maintenant le résultat vrai au rang n — 1 et montrons le au rang n. Soit À G C une valeur propre de /* et e un vecteur propre norme associé. Alors Vx G (Vect e)\ f(x) -e = x- /*(e) = x • Ae = X(x • e) = 0, autrement dit l'hyperplan H = (Vecte)1- est stable par /. On peut donc appliquer l'hypothèse de récurrence à /|//, ce qui montre l'existence d'une base orthonormée (ei,... ,en_i) de H qui trigonalise f\H. La matrice de / dans la base orthonormée (ei,..., en_i, e) (elle est orthonormée car e est orthogonal à, H) de E est donc de la forme X • • 0 " 0 •• X : . x • 0 x • X X donc triangulaire supérieure, d'où le résultat. b) Nous allons ici aussi donner deux méthodes. Première méthode. D'après le théorème 5 page 166, il existe une base B = (ei,...,en) de E trigonalisant / et g. Pour les mêmes raisons que dans la première solution de la question a), la base de Schmidt orthonormée associée à B trigonalise /, ainsi que #, d'où le résultat. Seconde méthode. Procédons par récurrence sur la dimension n de E. Pour n = 1, c'est évident. Supposons le résultat vrai au rang n — 1 et montrons le au rang n. Dans une base orthonormée de £", les matrices de /* et g* sont les transposées de celles de / et g donc elles commutent, ce qui entraîne que /* et g* commutent. Il existe donc un vecteur propre e norme commun à /* et g* (c'est classique, voir le préliminaire de la preuve du théorème de trigonalisation simultanée page 166). Pour les mêmes raisons que dans la deuxième solution de la question a), H = (Vect e)1- est un hyperplan de E stable par / et g. Comme /|# et g\u commutent, l'hypothèse de récurrence entraîne l'existence d'une base orthonormée (ei,..., en_i) de H trigonalisant /[# et #|#. La base (ei,... ,en_i,e) est orthonormée et on voit facilement qu'elle trigonalise / et g. Remarque. De la même manière qu'à l'exercice 4 page 171, le résultat b) se généralise à une famille quelconque {fi)iei d'endomorphismes commutant deux à deux. Exercice 4 (Caractérisation des matrices positives). Soit M = (aij)i<ij<n e Mn(R) une matrice symétrique. a) (Critère de Sylvester). Pour tout k G {1,... ,n}, on note Mk = (ai,j)i<i,j<fc G Mkfâ). Montrer que M est définie positive si et seulement si pour tout k G {1,..., n}, det Mk > 0. b) Pour tout / C {1,... ,n}, on note M/ = (aï,j)(ï,j)e/2- Montrer que M est une matrice positive si et seulement si pour tout /, det Mj > 0. Solution, a) Condition nécessaire. Notons q la forme quadratique dont M est la matrice dans la base canonique (ei,... ,en) de M71. Pour tout fc, Mk est la matrice de la restriction de q à Vect(ei, • • • ? efc). Cette restriction est, comme g, définie positive, donc Mk est une matrice définie positive, d'où on tire det Mk > 0, et ceci pour tout k. Condition suffisante. Raisonnons par récurrence sur n G N*. Pour n = 1, c'est évident. Supposons le résultat vrai jusqu'au rang n — 1 et montrons le au rang n. Notons H l'hyperplan défini par H = Vect(ei, • • • > ^n-i)- D'après l'hypothèse de récurrence, la restriction q^ de q à H est définie positive. Désignons par (e^,... je^.J une base orthonormée pour q\jj- D'après la proposition 7 page 233, l'orthogonal HL de H (l'orthogonal est ici par rapport à la forme quadratique q) vérifie H 0 HL = Rn. Ainsi, si e'n désigne un vecteur non nul de HL) la famille B = (ej,..., e,n_1) e'n)
248 5. ESPACES EUCLIDIENS est une base de Rn et la matrice de q dans cette base s'écrit sous la forme / 1 0 ... 0 \ i n • N = : •• 1 0 V 0 •• 0 a I Si P désigne la matrice de passage de la base canonique de W1 à la base B, on a N = tPMPi donc det N = (det P)2 det M > 0. Ainsi, a = det N > 0, ce qui prouve que q est définie positive. La matrice M est donc définie positive. b) Condition nécessaire. On désigne toujours par q la forme quadratique de Rn dont M est la matrice dans la base canonique (ei,..., en) de Rn. Pour tout i", M/ est la matrice de la restriction de q à Vect(ei)fe/, qui est positive. La matrice M/ est donc positive, ce qui entraîne det M/ > 0. Condition suffisante. Commençons par montrer Vz > 0, det(M + xln) > 0. (*) On sait que l'on a (voir page 162) det (M + xln) = xn + (5ixn-1 + • • • + pn-ix + /?„, où pour tout i, fa est la somme des mineurs principaux d'ordre i. D'après les hypothèses, on a donc Pi = X)card i=i ^et ^i > 0. La positivité des Pi entraîne alors (*). On applique maintenant le résultat (*) à chacune des matrices Mk (on peut, les hypothèses sont vérifiées), ce qui donne Vz > 0,Vfc G {1,... ,n}, det(il4 + xlk) > 0. En appliquant le résultat de la question a), On en déduit que pour tout x > 0, la matrice M+xIn est définie positive. Autrement dit, pour tout x > 0, on a \/X G Rn, *X(M + xIn)X > 0. En fixant X et en faisant tendre x vers 0, cette inégalité entraîne lXMX > 0, et ceci pour tout X G Rn, donc M est positive. Remarque. Le critère de Sylvester peut s'avérer utile ; il est donc souhaitable de le connaître et de savoir le redémontrer. Exercice 5. a) Soit une application continue M: [0,1] -> Mn{R) t^M(t) = [aij(t)] telle que pour tout t G ]0,1[, M(t) est symétrique définie positive. Montrer que la matrice A = I M(t) dt= ( I Oijit) dt) l<i,j<n est symétrique définie positive. b) Application. Montrer que la matrice ~ \1 + \i-3\/i<ij<n est définie positive (on pourra utiliser le critère de Sylvester, voir l'exercice précédent). Solution, a) Il est clair que la matrice A est symétrique. Maintenant, remarquons qu'une somme finie de matrices {Mi)\<i<p symétriques définies positives est définie positive. En effet, il suffît
2. ESPACES PRÉHILBERTIENS 249 de remarquer que polir tout vecteur colonne X ^ 0 de Rn, on a p / p Vi, lXMiX > 0 donc J^ tx^hX = lX ^ M, \ X > 0. i=l ,i=l Ceci étant vrai pour tout X ^ 0, on a prouvé que ^ Mj est définie positive. Ici, on a affaire non pas à une somme finie, mais une somme continue. On procède de la même manière. Fixons un vecteur colonne X de Mn, 1^0. Pour tout t G ]0,1[, on a tXM(t)X > 0, donc par continuité de t ■-» tXM{t)X t lXM{t)Xdt>0 ou encore tx(f M{t)dtj X = lXAX > 0. Ceci étant vrai pour tout X ^ 0, A est définie positive, b) On remarque que i + l*-j| h D'après a), le résultat sera prouvé si on montre que pour tout t G ]0,1[, la matrice symétrique M(t) = (tl<-J'l) i<iyj<n est définie positive. Pour tout r, 1 < r < n, on pose Dr(t) = det(t^^)i<ij<r. Nous allons prouver que Dr(t) = (1 — t2)r~l ce qui prouvera, en vertu du critère de Sylvester, que M(t) est définie positive pour t€]0,l[. On procède par récurrence sur r. Pour r = 1, c'est évident car D\(t) = 1. Supposons le résultat vrai au rang r et montrons le au rang r + 1. En retranchant à la dernière colonne t fois l'avant dernière, on obtient ••• f Dr+i(t) = t 1 t r-l t 1 f tr~l d'où le résultat. *-l • 1 t f tr-l t 1 1 t tr-l tr t 1 * . f"1 j.r—1 o o 0 1-t2 = (l-t2)Dr(t), Exercice 6 (Décomposition polaire). Soit A e Mn(€). Montrer qu'il existe un couple de matrices ([/, H), U étant unitaire et H hermitienne positive, tel que A = UH. Si A est inversible, montrer que le couple (U, H) ainsi défini est unique. Solution. C'est très classique. Existence. Si A = UH, alors A* = HU~l donc 4M = H2 (on rappelle que la notation A* désigne la matrice lA). Nous allons par conséquent commencer par chercher une matrice hermitienne H vérifiant A*A = H2. La matrice A*A est hermitienne car (A*A)* = A*A** = A*A. Par ailleurs, pour tout vecteur colonne X, on a X*(A*A)X = {AXfAX = \\AX\\2 > 0 (||.|| désignant la norme hermitienne standard sur Cn), ce qui prouve que A*A est positive. D'après l'exercice 1 page 245, il existe donc une matrice hermitienne H positive telle que A*A = H2. Supposons maintenant A inversible. Alors H est inversible, et en posant U = AH-1, on a U*U = H'1 A*AH-1 = Jn, donc U est unitaire et A = UH, d'où l'existence. Si A n'est pas inversible, c'est un peu plus délicat. Nous allons donner deux méthodes, la première étant de nature constructive, la seconde de nature topologique.
250 5. ESPACES EUCLIDIENS Première méthode. Notons a et h les endomorphismes de Cn dont les matrices dans la base canonique de Cn sont A et H. Comme a*a = h2 avec h autoadjoint, on a Vx G Cn, ||a(x)||2 = a(x) • a(x) = x • a*a(x) = x • h2(x) = h(x) • h(x) = \\h(x)\\2, (*) donc Ker/i = Kera. En diagonalisant h dans une base orthonormée on s'aperçoit que Im/i = (Kerh)1- et Cn = Im/i© Ker/i, et que la restriction de /i à Imh est un automorphisme de Imh. Pour que a = u o h sur Cn = Im /i 0 Ker /i, il suffit que cette égalité soit vraie sur Im h puisque si x G Ker/i = Kera, l'égalité a(x) = u o h(x) est toujours vraie (les termes sont nuls dans ce cas). Pour cette raison, nous définissons u par u(x) = ao hT^^x) lorsque x G Imh. Pour que u soit unitaire, il faut que lorsque x G Ker/i le vecteur u(x) soit orthogonal à Ima. Si uq désigne un isomorphisme unitaire fixé qui envoie Ker/i sur (Ima)-1 (c'est possible puisque dimKer/i = dimKera = dim(Ima)-1-), on pose donc u(x) = uo(x) lorsque x G Kerh. En résumé, on a définit u sur Cn = Im h 0 Ker h par {Vx G Im/i, u(x) = ûo/ii"^^) Vx G Ker/i, u(x) = uo(x) Par construction, on a bien a = u o h. Il reste à vérifier que u est bien unitaire. Pour cela, donnons nous un vecteur z G Cn. Comme Cn = Im/i 0 Ker /i, il existe x G Cn et y G Ker/i tels que z = /i(x) + y. On a alors u(z) = u(h(x)) + u(j/) = a(x) + uo(î/)> et comme uo(y) G (Ima)1 l|t*WII2 = l|aWII2 + l|tio(y)ll2. Par construction de tto, on a llwo(2/)|| = ||y||* Comme de plus ||a(x)|| = ||/i(x)|| d'après l'identité (*), Porthogonalité de h(x) G Im/i et y G Ker/i entraîne finalement ll«WII2 = IIM«)ll2 + IMI2 = INI2- Notons C/ la matrice de u dans la base canonique de Cn. On a a = u o h donc A = UH, avec U unitaire, d'où le résultat. Seconde méthode. L'ensemble des matrices inversibles étant dense dans .Mn(C) (voir la proposition 2, page 183), on peut écrire A comme une limite de matrices inversibles (Ap)pe^. Le cas A inversible nous permet d'affirmer que pour tout p G N, il existe deux matrices Up unitaire et Hp hermitienne positive telles que Ap = UpHp. L'ensemble des matrices unitaires étant compact (c'est un fermé borné de Mn(C)} fermé comme image réciproque de {/n} par l'application continue {/ »-> £/*£/, borné car tous les vecteurs colonnes d'une matrice unitaire sont de norme 1), il existe une sous-suite (Uv^) de (Up) qui converge. Notons U sa limite (U est unitaire). L'égalité Hv^ = U*, ^A entraîne la convergence de la suite (H^^) vers H = UA, et comme H<p(p) est hermitienne positive pour tout p, H est hermitienne positive (en effet, H est clairement hermitienne, et positive car pour tout X G Cn fixé, on a X*H{p(p)X > 0, donc en faisant tendre p vers l'infini on obtient X*HX > 0, et ceci est vrai pour tout X). Finalement, on a A = UH avec U unitaire et H hermitienne positive. Unicité (lorsque A est inversible). D'après l'exercice 1 page 245, il existe une unique matrice H hermitienne positive telle que A*A = H2 (rappelons que A*A est hermitienne positive), ce qui prouve l'unicité de #, donc de U car U = AH'1. Exercice 7 (Décomposition d'Iwasawa). a) Soit A e Mn(C) une matrice hermitienne définie positive. Montrer qu'il existe une unique matrice triangulaire supérieure T à coefficients diagonaux positifs, telle que A = T*T. b) Soit A G .Mn(C) une matrice inversible. Montrer qu'il existe un unique couple de matrices (t/, T), avec U unitaire et T triangulaire supérieure à coefficients diagonaux positifs, tel que A = UT.
2. ESPACES PRÉHILBERTIENS 251 Solution, a) Comme A est hermitienne définie positive, A est la matrice d'un produit scalaire hermitien dans la base canonique B = (ei,..., en) de Cn. Écrire A = P*P, c'est dire que P est la matrice de passage d'une base B1 orthonormée pour ce produit scalaire à la base B. Il s'agit par conséquent de déterminer les bases Bf = (e^,... ,eJJ orthonormées pour ce produit scalaire telles que la matrice de passage P de Bf à B soit triangulaire supérieure et à coefficients diagonaux positifs, ce qui s'écrit Met! <n\ I Vect(ei)---)eifc) = Vect(ei,...,efe), V/cG|l,...,n), | e/fc.efc>0. Le procédé d'orthonormalisation de Schmidt assure l'existence et l'unicité d'une telle base, d'où l'existence et l'unicité de T. b) Comme on l'a vu à l'exercice précédent, la matrice A*A est hermitienne positive. Comme A est inversible, A*A est inversible, et c'est donc une matrice hermitienne définie positive. D'après la question a), il existe une matrice T triangulaire supérieure à coefficients diagonaux positifs telle que A*A = T*T. Soit U = AT'1. Alors U*U = {t*)-1A*AT~1 = I. Donc U est unitaire et A = UT, d'où l'existence du couple (C/,T). Unicité. Si A = UT, alors A*A = T*T, donc d'après a), T est déterminée de façon unique ; il en est de même pour U = AT~l. Remarque. On peut montrer que le résultat reste vrai lorsque A n'est pas supposée inversible, mais il n'y a plus unicité du couple (U,T). (On peut par exemple procéder en utilisant des critères de nature topologique comme dans la seconde méthode de la preuve de l'existence dans l'exercice précédent). Exercice 8. À partir de la norme euclidienne standard || • ||2 sur Rn VX=Q^€Rn, ||X||2 = ^Î+ •.. + **, on norme .Mn(M) en posant, pour tout A G A1n(M), ||A||2 = sup||X||2=1 ||j4X ||2. Montrer que ||j4||2 = y/p(A*A)> où p(A*A) = sup{|A| | A valeur propre de A*A}. Solution. On remarque déjà que pour tout X G Rn, ||X||2 = y/X*X, de sorte que \\A\\l= sup (AX)*AX= sup X*(A*A)X. 11*112 = 1 ll*l|2 = l La matrice A* A est symétrique positive (c'est hyper-classique, elle est symétrique car (A*A)* = A*A** = A*A, positive car VX G ŒT, X*(A*A)X = (AX)*AX = \\AXg > 0). Il existe donc une matrice orthogonale P telle que A* A = P~1DP = P*DP où D est une matrice diagonale. On a ||i4||i= sup X*(P*DP)X= sup (PX)*D(PX). 11*112 = 1 ||*||2 = 1 L'application X i-+ PX étant une isométrie de Rn, ceci s'écrit aussi ||j4||!= sup Y*DY. (*) mi2=i En notant Ai,..., An les coefficients diagonaux de D (ce sont les valeurs propres de la matrice définie positive A*A, donc positives, et vérifient sup^ A* = p(A*A)2), on a / 3/1 \ n n W =1 : g R» tel que ||Y||2 = 1, Y*DY = ^A^ < p(AM)2]£y? = p{A*A)\ \Vn ) i=\ i=l donc d'après (*), ||A||2 < p(A*A). En choisissant k tel que Afc = p(A*A)2 et par Ek le fc-ième vecteur de la base canonique de Rn, on a \\Ek\\2 = 1 et ElDEk = Xk = p(A*A)2, donc d'après (*) on a ||A||2 > p(A*A). Finalement, on a montré ||A||2 = p(A*A).
252 5. ESPACES EUCLIDIENS Exercice 9. Soit E un M-espace vectoriel norme et vérifiant V(x,y)eE\ \\x + yf + \\x-y\\2 = 2\\xf + 2\\yf. (*) Montrer que E est préhilbertien réel (i.e la norme est issue d'un produit scalaire). Solution. Il s'agit de montrer qu'il existe un produit scalaire {x,y) i-> tp(x>y) sur E tel que pour tout x e Ey <p(x,x) = \\x\\2. On raisonne par conditions nécessaires. Si un tel produit scalaire existe, alors Vx.yeE, 4<p(x,y) =(p(x + y,x + y)-tp(x-y,x-y) = \\x + y\\2 - \\x-y\\2. On définit donc (p par tp: ExE-*R (Xyy)»±\\x + y\\2-±\\x-y\\2. Nous allons montrer que ij) = 4tp est un produit scalaire, ce qui montrera le résultat pour (p. Montrons que ty est bilinéaire. Comme ij) est symétrique en ses arguments, il suffit de démontrer la linéarité pour l'un d'entre eux, par exemple le premier. - Montrons que ty est additive par rapport à son premier argument. Pour tout x,y,z G Ey on a 2(^(z, z) + V(V, z)) = (2\\x + zf + 2\\y +\f) - (2\\x - zf + 2\\y - z||2), = (\\x + y + 2z\\? + ||a: - yf) - (\\x + y- 2z\\2 + \\x - yf) = $(x + y, 2z\ où nous avons utilisé l'identité (*). Posons alors xq = x + y : V>(s0,2«) = ll*o + 2z||2 - ||x0 - 2z||2 = (\\x0 + 2*||2 + ||z0||2) - (||x0 - 2*||2 + ||z0||2) = (2||x0 + *||2 + 2||z||2) - (211a* - *||2 + 2||^||2) = 2tP(x0, z). Finalement, on a 2(ip(x, z) + ip(y, z)) = ^(xo, 2z) = 2ip(x0> z) = 2ip(x + y, z) donc ip(x,z) +i>{y, z) = ip(x + y, z). (**) Il nous reste à montrer que pour x, z G E et À G R, ip(\x,z) = Xtp(x,z). C'est classique ! - Si p G N*, alors ip(px,z) = ip(x + • • • + x,z) = pip(x,z) d'après (**). Or tp(0,z) = 0 = ip(x — x, z) = ip(x, z) + i>{—x, z), donc ip(—x, z) = —ip{x, z). Finalement, pour tout p G Z, i>(pxtz) = pip(x,z). - Soit q G N*. Alors 11 11 ip{x,z) =ip{q • -x,z) = qij){-X)Z) donc i>(-x,z) = -tpix,z). Q Q Q Q - Pour tout r G Q, r = |, on a 1 11 •0(rz,z) = tf)(p • -x,z) = ptp(-x,z) = p-ip(x,z) = rip(x,z). (***) Par construction, V est continue, et comme Q est dense dans R, (***) entraîne VA G M, ip(\x,z) = \ip(x,z). (****) Les relations (**) et (****) assurent la bilinéarité de ip. Comme ip est symétrique et définie positive (on a ip{x,x) = 4||a:||2), ip définit bien un produit scalaire. Il en est donc de même de <p = 1-0, et comme ||a:||2 = <p(x, x), \\ • || est bien une norme euclidienne. Exercice 10. Soit A et B deux matrices symétriques de Mn(R). On note ai> ... > an les valeurs propres de A, b\ > ... > bn celles de B, et c\ > ... > cn celles de la matrice C = A + B. Montrer que pour tout k, on a Ck > a>k + bn.
2. ESPACES PRÉHILBERTIENS 253 Solution. Quitte à remplacer la matrice B par B - bnIn, on peut supposer bn = 0. Il s'agit donc de montrer ck > bk. Comme toutes les valeurs propres de B sont positives, B est une matrice positive. En notant (E\,... ,En) une base orthonormée de vecteurs propres de A associés aux valeurs propres oi > ... > an, on a VX G Vect(£i,..., Ek), *X(A + B)X = lXAX + *XBX > lXAX > ak\\X\\2 (*) car si X = £*=1 À^, on a lXAX = £*=1 a^À2 > ak £*Li >H = "k\\X\\2. Si (Fu..., Fn) désigne une base orthonormée de vecteurs propres de C associés aux valeurs propres c\ > ... > cn, on obtient de manière similaire l'inégalité VXGVect(Ffc,...,Fn), lXCX < cfc||X||2. (**) Comme dimVect(i?i,..., Ek) + dim Vect(F^,..., Fn) = k + (n — k + 1) = n + 1, les deux sous- espaces vectoriels Vect(£'i,... ,Ek) et Vect(Fjt,... ,Fn) ont une intersection non réduite à {0}, donc il existe un vecteur X non nul appartenant à ces deux sous-espaces. Pour ce vecteur X, les inégalités (*) et (**) entraînent ak\\X\\2 < lX{A + B)X = lXCX < cfc||X||2, donc ak < ck. -+ Exercice 11 (Projection orthogonale dans un espace préhilbertien réel). Soit E un espace préhilbertien réel et F un s.e.v de E. 1/ Pour tout x e E, on note Fx = {yeF\\\x- y\\ = d{x, F) = inf ||z - z\\}. ZÇ.F a) Montrer que y G Fx si et seulement si x — y e F1. b) Montrer que Fx a au plus un élément. 2/ On suppose ici que F est complet. a) Pour tout x e E, montrer que Fx a exactement un élément. On le note xp. b) Montrer que E = F®F1 et que x ■-> Pf(x) = xF s'identifie à la projection orthogonale sur F. c) Montrer que F = F11. 3/ On considère ici E = C([0,1],R) (fonctions à valeurs réelles continues sur [0,1]), muni du produit scalaire (M = f f(t)g(t) àt. Jo Soit F = {/ G E | /(0) = 0}. Que représente F1 ? Conclure. Solution. 1/ a) Condition nécessaire. Soit y G Fx. Posons z = x — y et considérons w G F. Pour tout pGl, on a \\z + pw\\ > \\z\\ car z + pw = x — (y — pw) et y — pw G F. On réécrit ceci en Vp G R, \\z + H|2 = INI2 + M* • w) + p2\\w\\2 > \\z\\2. Cette inégalité exprime que la fonction p h-> ||z||2 + 2p(z • w) + /92||w||2 atteint son minimum en p = 0, donc sa dérivée par rapport à p en 0 est nulle, ce qui s'écrit z-w = 0. Ceci étant vrai pour tout w G F, on en déduit que z = x — ?/ G Condition suffisante. Soit 2/ G E tel que x — y e F1. On a V* G F, ||* - z\\2 = \\(x -y) + (y- z)\\2 = \\x - y\\2 + \\z - y\\2 (*) (car x — y G F1- et z — y e F). La, relation (*) entraîne \\x — y\\ = mîzep \\x — z\\, donc y G Fx. b) Supposons que Fx ait deux éléments y et z. Alors x — yetx — z€ F1 d'après a), et donc y - z = (x - z) - (x - y) G F1. Or y- z e F. Comme F n FL = {0}, on en déduit y - z = 0, d'où le résultat.
254 5. ESPACES EUCLIDIENS 2/ a) L'idée est d'utiliser le fait que F soit complet. Nous allons construire une suite de Cauchy et montrer que sa limite vérifie la condition requise. Soit S = infzeF \\x — ^||- Par définition de <S, il existe une suite (yn)nen de points de F telle que limn_oo \\x - yn\\ = <5, et donc lim^oo \\x - yn\\2 = ô2. Dans un e.v.n général, cette relation n'entraîne pas la convergence de (yn). C'est le caractère préhilbertien de E qui va nous permettre de montrer qu'elle converge (comme le montre un dessin). Nous allons pour cela montrer que (yn) est une suite de Cauchy. La clé est d'utiliser le théorème de la médiane (voir le théorème 1 page 241), qui entraîne Vp, q e N, \\yp - yq\\2 + ||(z - yp) + (x - yq)\\2 = 2\\x - yp\\2 + 2\\x - yq\\2, donc \\yp-yq\\2 = 2\\x-yp\\2 + 2\\x-yq\\2-4 Soit e > 0. Il existe N G N tel que pour tout n> N, \\x - yn\\2 < ô2 + e, donc Vp, q > N, \\yp - yq\\2 < 2(ô2 + e) + 2(62 + e) - 4 Or &±2i G F, donc ||z - ^|| > ô, d'où Vp, 9 > N, \\yp - yq\\2 < 2(ô2 + e) + 2(<52 + e) - 4<52 = 4e. Ceci suffit à prouver que (yn) est une suite de Cauchy. Comme F est complet, cette suite converge vers une valeur y G F. La continuité de la norme assure le fait que \\x—y\\ = limn-^ \\x—yn\\ = 8, donc y G Fx. L'ensemble Fx est donc non vide, et a donc un seul élément d'après 1/ b). b) On sait que F D F1 = {0}. Il reste à montrer E = F + F1, ce qui découle du fait que pour tout x G E, x = xp + {x — xp) avec xf G Fx C F et x — xp G F1 d'après 1/ a). Pour tout x G E, la décomposition de x selon F © F1 est x = xf + {x — xf)-, ce qui prouve que x i-+ zf est la projection orthogonale sur F. c) On sait que F C F-11. Il reste à montrer F11 C F. Soit x G F-1-1. Comme F © F1 = F, il existe (y, z) G F x F1 tels que rc = 2/ + z. Or z G F-1- donc 0 = x- z = y • z + \\z\\2 = ||z||2, donc z = 0, donc x = y e F. Finalement, on a montré F = F11. 3/ Nous allons montrer que F1 = {0}. Soit / G F1. Soit g : x ■-» xf(x). On a # G F, donc (/!<?)= f1xf2(x)dx = 0. Jo Comme x •-» xf2(x) est continue et positive, ceci entraîne que pour tout x G [0,1], xf2(x) = 0, donc pour tout x G ]0,1], f(x) = 0, donc / = 0 car / est continue. On a donc F © F1 ^ F, ce qui montre que le résultat 2/ b) est faux lorsque F n'est pas supposé complet. Remarque. Ces résultats font des espaces hilbertiens (espaces préhilbertiens complets) des espaces vectoriels très maniables, même en dimension infinie. Une étude plus approfondie de ces espaces fait l'objet d'une annexe dans le tome d'analyse. Exercice 12 (Produit de Schur de deux matrices). Soient A = (ai}j)i<i,j<n et ■^ — (Kj)i<i,j<n € Mn(R) deux matrices symétriques. Le produit de Schur de A et B est défini par la matrice symétrique A o B = (ûij&ijji^tjxn- a) Si A et B sont positives, montrer que la matrice A o B est positive. b) Si de plus A et B sont définies, montrer que A o B est définie. c) Si A est positive, montrer que la matrice E = (eai>j)i<ij<n est positive, et qu'elle est définie si A est définie. _ x yP + yq x — yP + yq
2. ESPACES PRÉHILBERTIENS 255 Solution, a) On montre d'abord le résultat lorsque vgA = rgB = 1. La signature des formes quadratiques X ■-» X*AX etXi-> X*BX est (1,0), donc il existe deux formes linéaires f(X) = C"=1 \xi et g(X) = 2?=i ViXi telles que X*AX = f2(X) et X*BX = p2(X). En développant f2 et #2, on s'aperçoit alors que A = {\i\j)i<i,j<n et B = (A*iA*j)i<ij<n- Donc £oB = [(AiAti)(<\7-/ij)]i<i,j<n, donc cette matrice est positive car n X*(A o B)X = h2(X) > 0 avec h{X) = ^(A^)^. Traitons maintenant le cas général. L'entier r désignant le rang de A, on peut écrire r X*AX = Y,fi(X)2, où /i, • • • > fr sont des formes linéaires indépendantes (ceci parce que la signature de A est (r, 0)). pour tout iy 1 < i < r, notons Ai la matrice de la forme quadratique /?, de sorte que X*A{X = fi(X). Les matrices ^ sont symétriques positives et de rang 1 (leur signature est (1,0)) et A = Ya=\ Ai- On écrirait de même B sous la forme B = Y^Sj=i Bj où s = rg B et où les Bj sont des matrices symétriques positives de rang 1. Donc Ao B = Ylu^i ° &j> somme de matrices positives, est positive. b) Les matrices A et B étant définies positives, on peut écrire n n X*AX = J2fi(X) et X'BX^gjiX), t=i i=i où les formes linéaires (fi)i<i<n sont linéairement indépendantes, ainsi que les (gj)i<j<n- Notons (\k,i)i les coefficients de /&, (^ej)j ceux de g^ de sorte que n n fk(X) = ^2\k,iXi et gt(X) = ^2fJ>e,jXj- Les matrices des formes quadratiques /| et g2, sont Ak = {Xk,i^k,j)i,j et Bg, = (MjMjkji et on a A = 2ï=i 4fc et B = E?=i #«• Ainsi> ^°5 = Efc,< 4fc°#£- Maintenant, l'égalité X*(AoB)X = 0 entraîne Efc ^""C^fc ° ^)^ — 0, et les matrices A^ o Be étant positives, VA;, A X* (Afc o £,)X = 0 = (£ \ktilHtXi ] • (*) Fixons £ L'égalité (*) entraîne n l M>\*\ VA;, y^^kAMjXi)= ° ou encore fk{Ye)=0 avec Ye = l : Les n formes linéaires (fk)i<k<n étant linéairement indépendantes, ceci entraîne Y( = 0, donc Ki#i = 0 pour tout i, et par sommation ge(X) = 0. Ceci étant vrai pour tout £, comme les formes linéaires (ge)i<e<n sont linéairement indépendantes, on a nécessairement X = 0, ce qui prouve que A o B est définie. c) En utilisant le résultat de la question a), on a facilement par récurrence sur m G N que la matrice Am = (û<j)i<*j'<» est positive. Maintenant, pour tout entier M positif, on a VX G Rn, X" (M \ m E ~^m )X=Y, —,X*AmX > 0. En passant à la limite lorsque M tend vers l'infini, on obtient X*EX > 0, et ceci pour tout X, ce qui prouve que E est positive.
256 5. ESPACES EUCLIDIENS Si de plus A est définie, alors E est définie car VX ± 0, X*EX > X*AX > 0. 3. Compléments de cours Cette section propose quelques études complémentaires très classiques, et souvent utiles dans les exercices ou les problèmes. 3.1. Réduction des isométries et des endomorphismes unitaires Nous allons voir que les isométries (resp. les endomorphismes unitaires), bien que n'étant pas des endomorphismes autoadjoints, peuvent se réduire de manière intéressante dans une base orthonormale. Nous commençons par les isométries. Proposition 1. Soit E un espace euclidien (resp. hermitien) etue C(E) une isométrie (resp un endomorphisme unitaire). Si F est un s.e.v de E stable par u, alors FL est stable par u. Démonstration. Il s'agit de montrer que pour tout x G F1- et pour tout y G F, u(x) • y = 0. Comme u\p est une isométrie, u\p est bijective (on est en dimension finie), donc il existe y' G F tel que y = u(y'). On a maintenant u(x) • y = u{x) • u(y') = x • y' = 0. Ceci étant vrai pour tout x G F1 et pour tout y G F, F1 est bien stable par u. 0 Réduction des isométries. Théorème 1. Soit E un espace euclidien etu G C(E) une isométrie. Alors il existe une base orthonormale B de E dans laquelle la matrice de u a la forme par blocs l R(0i) \ [u]B = 0 R{fir) M 0 V £s J où pour tout j, Ej G {—1,1} et pour tout i, R{Bi) = ( sTn0- "cos^f ) G M*W> avec ei£R>°iïQ (mod *)• Démonstration. On procède par récurrence sur n = dimE. Pour n = 1, c'est évident. Supposons le résultat vrai jusqu'au rang n — 1 et montrons le au rang n. Nous traitons deux cas. Plumier cas. L'isométrie u admet au moins une valeur propre réelle e. Soit x un vecteur propre norme associé. Comme ||^(x)|| = ||sx|| = |s| ||x|| et ||^(x)|| = ||x||, on a |s| = 1. De plus s G E, on en déduit e G {—1,1}. Maintenant, comme F = Vect(x) est stable par u, F1- est stable par u d'après la proposition 1. En appliquant l'hypothèse de récurrence à U\F±, on trouve une base orthonormale Bq de FL dans laquelle la matrice de u\F± a la forme (*). En ajoutant x a la base i?o, on obtient une base orthonormale B de E dans laquelle la matrice de u a la forme (*). Second cas. L'isométrie u n'a aucune valeur propre réelle. On considère l'endomorphisme v = u + u*. Comme v est symétrique, v admet une valeur propre réelle À associée à un vecteur propre x. On a (u + u*)(x) = Xx donc u(u + u*)(x) = u2(x) + x = Xu(x)y d'où u2(x) = Xu(x) — x (**)• Par ailleurs, la famille (x>u(x)) est libre puisque u n'admet pas de valeur propre réelle. En
3. COMPLÉMENTS DE COURS 257 posant F = Vect(x,w(x)), on voit que dimF = 2 et que F est stable par u (d'après (**)). Soit jV = (bd) la matrice de u\p dans une base orthonormale Bq de F. Comme u\p est une isométrie, pj*pj = In = NN*. Parmi les équations issues de ces égalités, on trouve a2 + b2 = a2 + c2 = 1 et ab + cd = 0. (***) La première assertion de (***) entraîne c = ±6. On ne peut pas avoir c = b car N serait symétrique ce qui est impossible vu que u n'admet pas de valeur propre réelle. Donc c = — b ^ 0, et d'après la deuxième assertion de (***) on en déduit d = a. Comme de plus a2 + b2 = 1, il existe B G R tel que a = cos# et b = sin0 (et 0 ^ 0 (mod n) car b ^ 0). Finalement, la matrice jV est de la forme v ' y sin0 cos0 J ' Maintenant, d'après la proposition 1 le s.e.v FL est stable par u, et U|F± est une isométrie donc il existe d'après l'hypothèse de récurrence une base orthonormale B\ de F1- qui diagonalise u\F±. La base B obtenue en concaténant Bq et B\ est orthonormale et dans cette base, la matrice de u a la forme voulue, d'où le théorème. D Remarque 1. On retrouve ainsi la forme des isométiïes du plan et de l'espace : - Les isométiïes directes du plan sont des rotations d'angle 6 (elles ont pour matrice R{6) = ( slnô cos"/ ))' ^es isométries indirectes des symétries par rapport a des droites (matrice (J -°i))- Notez d'ailleurs la relation R(O)R(0') = R(0 + 0'), qui entraîne la commutativité des rotations dans le plan. - Les isométries directes de l'espace sont des rotations d'angle 6 autour d'un axe /cos0 -sin0 0\ (matrice I sin0 cos0 o J, le dernier vecteur de la base étant l'axe de rotation). Lorsque 6 = 7r, on parle de retournement. fcosO -sin0 0 \ Les isométries indirectes de l'espace ont pour matrice \ sm9 cos0 o I. Lorsque V o o -i) 6 = 0, on a affaire à une symétrie par rapport à un plan et on parle alors de réflexion. Remarque 2. La version matricielle de ce théorème est la suivante. Soit M € Mn(R) une matrice orthogonale. Alors il existe une matrice orthogonale P telle que P~lMP = P*MP ait la forme (*). Réduction des endomorphisme s unitaires. Théorème 2. Soit E un espace hermitien etue. C(E) un endomorphisme unitaire. Alors il existe une base orthonormale qui diagonalise u, et toutes les valeurs propres de u ont leur module égal à 1. Démonstration. La preuve est plus simple que la précédente. Il est d'abord clair que toute valeur propre À de n vérifie |À| = 1, car si u(x) = Xx avec x ^ 0, on a ||z|| = ||w(£)|| = |À| \\x\\. On procède ensuite par récurrence sur n = dimi?. Le cas n = 1 est immédiat, et le passage du rang n — 1 au rang n se fait comme suit. Le corps de base C étant algébriquement clos, u admet au moins une valeur propre complexe A. Soit x un vecteur propre associé, \\x\\ = 1. La droite F = Vect(rc) est stable par n, donc d'après la proposition 1, Phyperplan F1 est également stable par u. L'endomorphisme u\Fx est unitaire, et d'après l'hypothèse de récurrence, il existe une base orthonormale Bq de FL qui diagonalise u\F±. En ajoutant x à Bo, on obtient une base orthonormale de E qui diagonalise u et le théorème est prouvé. D
258 5. ESPACES EUCLIDIENS Corollaire 1 (Version matricielle). Soit U G Mn(C) une matrice unitaire. Alors U existe une matrice unitaire P telle que P~lUP = P*UP = ( eidl e,_ o \ 0 \ eidn ) où les 0{ sont des nombres réels. 3.2. Endomorphismes normaux Les endomorphismes normaux généralisent les endomorphismes autoadjoints. Comme nous allons le voir, ils sont caractérisés par la propriété de diagonalisation dans une base orthonormée. Dans cette section, sauf mention explicite, E désigne un espace hermitien (on rappelle qu'un espace hermitien est nécessairement de dimension finie). DÉFINITION 1. Soit u G C(E). On dit que u est normal si u et u* commutent. Une matrice M G Mn(C) est dite normale si M et M* commutent. Proposition 2. Soit u G C(E) un endomorphisme normal. Alors pour tout x G E, \\u(x)\\ = \\u'(x)\\. Démonstration. Il suffit d'écrire que Vz G E, \\u(x)\\2 = u{x) • u{x) = x • u*[u(x)] = x • u[u*(x)] = u*(x) • u*(x) = |K(x)||2. □ Nous allons montrer qu'un endomorphisme est normal si et seulement s'il se diago- nalise dans une base orthonormée. Les quelques résultats qui suivent nous serviront de préliminaires à la démonstration de ce théorème. Lemme 1. Soit u G C(E) et F un s.e.v de E stable par u. Alors F1 est stable par u*. Démonstration. Soit x e F. Par hypothèse, u(x) G F donc Vî/GF"1, 0 = u(x) -y = x-u*{y). Ceci étant vrai pour tout a; G F, on a u*{y) G FL. Or on peut choisir y comme l'on veut dans F1, et donc FL est stable par u*. □ Remarque 3. Notez que ce résultat n'est pas spécifique aux endomorphismes normaux. Lemme 2. Soit u G C{E) un endomorphisme normal. Si E\ est un sous-espace propre de u (associé à une valeur propre X), alors E^ est stable par u. Démonstration. Comme u et u* commutent, E\ est stable par u* (voir la proposition 7 page 166), donc d'après le lemme 1, E^ est stable par (u*)* = u. D Nous pouvons maintenant énoncer et démontrer notre résultat principal. Théorème 3. Soit u G C{E). Les assertions (i), (U) et (iii) sont équivalentes. (i) u est normal. (U) u se diagonalise dans une base orthonormale de E. (iii) u et u* se diagonalisent dans une base orthonormale commune.
3. COMPLÉMENTS DE COURS 259 Démonstration. Nous montrerons (i) => (ii), (ii) => (iii) et (iii) => (i). - (i) => (ii). On procède par récurrence sur n = dimE". Pour n = 1, c'est évident. Sinon, supposons le résultat vrai jusqu'au rang n — 1 et montrons le au rang n. Le corps de base de E est C, donc u admet au moins une valeur propre À. Soit E\ le sous-espace propre correspondant. Le sous-espace F = E^ est stable par u (lemme 2) et par u* (lemme 1). Comme u\p et (u\F)* = (u*)\f commutent et que dimF < n — 1, il existe d'après l'hypothèse de récurrence une base orthonormale B\ de F qui diagonalise u\p. Si maintenant B2 désigne une base orthonormale de E\> on voit que B = (jBi,^) est une base orthonormale de E diagonalisant u. - (ii) => (iii). Soit B une base orthonormale diagonalisant u, M la matrice de u dans B. La matrice de u* dans B est M*. La matrice M est diagonale donc M* est diagonale, ce qui entraîne que la base B diagonalise u et u*. - (iii) => (i). Soit B une base orthonormale diagonalisant u et u*. Les matrice M = [u]b et M* = [u*]b étant diagonales, elles commutent, donc u et u* commutent. □ Corollaire 2 (Version matricielle). Soit M e Mn(C) une matrice. Alors M est normale si et seulement s'il existe P G Mn(C), P unitaire, telle que P*MP = P~lMP est diagonale. Démonstration. Notons B la base canonique de Cn. On muni Cn du produit scalaire hermitien usuel, et on désigne par u l'endomorphisme de Cn tel que [u]b = M. On montre la condition nécessaire. Si M est normale, alors u est normal donc il existe une base B1 orthonormale qui diagonalise u. Si P désigne la matrice de passage de B à i?', P est unitaire et P~lMP est diagonale. La réciproque est immédiate, car si D = P*MP, D est diagonale, donc D et D* commutent, d'où (P*M*P)(P*MP) = (P*MP)(P*M*P) donc P*M*MP = P*MM*P, ce qui entraîne que M et M* commutent. D Remarque 4. Attention, à la différence du cas autoadjoint, la matrice diagonale obtenue n'est pas forcément à coefficients réels. Cas des matrices réelles. Lorsque M est une matrice normale à coefficients réels, il est intéressant d'avoir une réduction de M dans Mn(ïïl). C'est le but de ce qui suit. Nous commençons par un petit lemme. Lemme 3. Soit E un espace euclidien de dimension 2. Soit u G C{E) un endomorphisme normal n'admettant pas de valeurs propres réelles. Dans toute base B orthonormale de E, la matrice de u a la forme Mb =(l a ) > avec b ¥> 0. Démonstration. Écrivons M = [u)B = (l Cd). On a b ^ 0 puisque u est sans valeur propre réelle. Comme u est normal, M*M = MM*. Parmi les équations découlant de cette égalité, on trouve a2 + c2 = a2 + b2 et ab + cd = ac + bd. (*) La première assertion de (*) entraîne b = c ou b = — c. Si b = c, alors M est symétrique, ce qui est impossible puisque u est sans valeur propre réelle. Donc b = —c. Maintenant, la deuxième assertion de (*) s'écrit 2(a — d)b = 0, et comme 6^0, on a a = d. Finalement, on a c = — b et d = a, on en déduit que la matrice de u dans la base B a bien la forme annoncée. D
260 5. ESPACES EUCLIDIENS Théorème 4. Soit E un espace euclidien, etu G C(E) un endomorphisme normal. Alors il existe une base orthogonale B de E telle que /Ai [u]b = \ 0 A, 0 \ W où pour tout i, Xi G M et pour tout j, T3 = _ I a3 bj ÛU Démonstration. On procède par récurrence sur n = dimE. Pour n = 1, c'est évident. Supposons le résultat vrai jusqu'au rang n — 1 et montrons le au rang n. Nous nous servirons des lemmes 1 et 2 qui restent vrais lorsque E est euclidien. Si u admet au moins une valeur propre réelle À, on pose E\ = Ker(u — Àld^). Le s.e.v F = E^ est stable par u (lemme 1) et par u* (lemme 2). Comme u\p et uTF commutent et que dimF < n — 1, il existe d'après l'hypothèse de récurrence une base orthonormale Bi de F telle que [u|jt]bi a la forme (*). Si B2 désigne une base orthonormale de E\, on voit alors que B = (jBi,i?2) est une base orthonormale de E dans laquelle [u]b a la forme (*). Sinon u est sans valeur propre réelle. Soit Q = X2 — 2aX + J3 un facteur irréductible dans R[X] (on a donc a2 — (5 < 0) du polynôme caractéristique de u, et N = Ker Q(u). OnaiV^ {0}. En effet, comme Q est irréductible dans R[X]} on peut écrire Q = (X — X)(X — À) où À G C. Soit M la matrice de u dans une base de E. Le nombre complexe À est racine de Q, et comme Q divise le polynôme caractéristique de M, on a det(M — À/n) = 0. Donc det Q(u) = det Q(M) = det(M - A/n) det(M - Jln) = 0, ce qui prouve que N = Ker Q(u) ^ {0}. Il est clair que N est stable par u. Le s.e.v N est également stable par u* car la commutât i vite de u et u* entraîne u*Q(u) = Q(u)u*. Posons v = u\N. On a v* = uïN, de sorte que l'endomorphisme v*v = (u*u)\N est symétrique et admet donc une valeur propre fi G E. Soit x G TV, x ^ 0, tel que v*v(x) = fix. Posons F = Vect(x,u(x)). Comme u n'admet pas de valeur propre réelle, x et u(x) forment une famille libre donc dimF = 2. Le s.e.v F est stable par u puisque comme x G AT, on a u2(x) = 2au(x) — (3x (**). Nous allons montrer que F est également stable par u*. Remarquons tout d'abord que l'égalité (**) entraîne F = Vect(u(x),u2(x)) (ceci car fi ^ 0, Q étant irréductible sur E[X]). On écrit maintenant u*[u(x)] = v*v(x) = fix G F et comme u et u* commutent, u*[u2(x)] = u o u*[u(x)] = u(/ix) = fjbu(x) G F, ce qui achève de montrer que F est stable par u*. Comme (u\p)* = (^*)|f> u\f est un endomorphisme normal. D'après le lemme 3, dans une base orthonormée B2 de F, la matrice de u\p est de la forme »(:?)■ Maintenant, on a vu que F est stable par u*, donc F1 est stable par u** = u d'après le lemme 1. Le même lemme montre que, F étant stable par uy F1 est stable par u*. Donc (u\F±)* = (u*)\F±> ce qui prouve que U\F± est normal. Comme dimF1 = n —2 < n, l'hypothèse de récurrence assure l'existence d'une base Bi orthonormale de F1 dans laquelle la matrice de u a la forme (*). La base B = (2?i,i?2) est alors une base orthonormale dans laquelle la matrice de u a la forme (*). □
3. COMPLÉMENTS DE COURS 261 Remarque 5. En termes de matrice, ce théorème s'exprime comme suit. Soit M G M.n{ une matrice normale. Alors il existe une matrice orthogonale P G Mn{^) telle que p~lMP ait la forme (*). Réduction des matrices antisymétriques. Les matrices réelles antisymétriques sont normales. Il est donc possible de leur appliquer les résultats précédents. Plus précisément, nous avons le théorème suivant. Théorème 5. Soit M G Mn(C) une matrice vérifiant M* + M = 0. Alors il existe une matrice unitaire U telle que U~lMU = U*MU = D soit diagonale, et les coefficients de D sont imaginaires purs. Démonstration. Comme M* = —M, M est une matrice normale, et d'après le corollaire du théorème 3, il existe une matrice unitaire U telle que /A, D = U~1MU = U*MU = \ ° avec pour tout i, Xi G C. Comme Ai+ÂT 0 \ D* + D= | •-. =U*M*U + U*MU = U*(M* + M)U = 0, 0 Xn + K ) on a Xi + Xi = 0 pour tout i, ce qui prouve que les Xi sont imaginaires purs, d'où le résultat. D Remarque 6. Ce résultat est vrai en particulier pour les matrices réelles antisymétriques. Si on veut rester dans R, on utilise le résultat qui suit. Théorème 6 (Version réelle). Soit M G A4nfâ) une matrice antisymétrique. Alors il existe une matrice orthogonale P telle que /0 P~lMP = P*MP = \ 0 0 n o \ où les Ti sont des matrices de «A^M de la forme 0 b -b 0 où b G Démonstration. Comme M* = —M, M est une matrice normale. On peut donc utiliser le théorème 4 qui assure l'existence d'une matrice orthogonale P telle que /Ai \ 0 P~lMP = P*MP = r\ 0 V TS I où les À,- G et où Tj = aj bj -bj aj G Af2(R). Comme D* = P*M*P = -P*MP = -D, D est antisymétrique. Ses termes diagonaux sont donc nuls, c'est-à-dire Xi = 0 pour tout i et aj = 0 pour tout j, d'où le résultat. D
262 5. ESPACES EUCLIDIENS Remarque 7. Lorsqu'on applique le théorème pour M G Ain(R) antisymétrique avec n impair, on voit qu'il doit y avoir au moins un zéro sur la diagonale de P~lMP. La matrice M n'est donc pas inversible. On peut retrouver directement ce résultat en écrivant que det M = det('M) = det(-M) = (-l)ndet(M) = - det M, ce qui entraîne det M = 0. Les endomorphismes unitaires et les isométries sont aussi des endomorphismes normaux. En appliquant les théorèmes 3 et 4, on retrouve facilement les réductions obtenues dans la partie 3.1. Il est possible d'obtenir la réduction des matrices antisymétriques par des moyens plus directs, en utilisant des méthodes du même type que celles de la partie 3.1 (cela constitue un excellent exercice). 3.3. Inégalité d'Hadamard Nous nous proposons de montrer le théorème suivant. Théorème 7. Les vecteurs colonnes X\,... ,Xn d'une matrice M G Mn(C) vérifient |detM|<||X1||...||Xn||> (*) où pour tout i, || A* || = y/XfXl désigne la norme hermitienne standard. Si pour tout i, Xi ^ 0, l'inégalité (*) est une égalité si et seulement si la famille (Xi) est orthogonale. Démonstration. Si det M = 0, l'inégalité est évidemment vérifiée. Sinon, (X\,..., Xn) forme une base de Cn. En utilisant le procédé d'orthonormalisation de Schmidt (voir la partie 2.2 de ce chapitre), on construit une base orthogonale (Y\,... ,Yn) de Cn telle que V*, Yk = Xk + Ai)jfcYi + • • • + Afc_i>fcyfc_i, Xi)k G C. On ne change pas un déterminant en retranchant à une colonne une combinaison linéaire des autres, ce qui prouve det M = det AT, où N = (Yi|---|l^) est la matrice dont les vecteurs colonnes sont les Yi. Posons D = N*N = (dij)i<ij<n- On voit facilement que dij = Y*Yj. Les Yi étant orthogonaux deux à deux, on a dij = 0 dès que i ^ j. Par ailleurs, d^i = Y*Yi = ||1^||2, d'où / mu2 o N*N = \ 0 KH2 et donc n det(N*N) = det(AT) det(iV) = | det(iV)|2 = f] ||yf||2, ce qui entraîne | det N\ = n?=i II*tïl- Or pour tout fc, Xk = Yk - Xi)kYi Afc-i^Yfc-i, donc ll^ll2 = linil2 + |Ai,*|2||Yi||2 + • • • + \\k-i,k\2\\Yk-i\\2- (*) Cette égalité entraîne ||Yfc|| < \\Xk\\, donc n n |detM| = |detiV| = JJn^n < Y[\\Xi\\. (**) Cas d'égalité. Si les Xi sont orthogonaux entre eux deux à deux, on a X{ = Yi pour tout i, et d'après ce que l'on a vu plus haut, |detM| = |det JV| = ||Yi|| • • • ||Yn|| = ||Xi|| • • • ||X„||. Réciproquement, supposons qu'il y ait égalité et que pour tout i, Xi ^ 0. Alors det M ^ 0. Il faut alors que (**) soit une égalité, c'est à dire ||Yi|| • • • ||1^|| = ||Xi|| • • • ||Xn|| ^ 0. Or, pour tout i, \\Yi\\ < \\Xi\\, on doit donc avoir \\Xi\\ = \\Yi\\ pour tout i. Ceci entraîne avec (*) que tous les Xj}k sont nuls, donc que Yk = Xk pour tout k. Les Xi sont donc deux à deux orthogonaux. D Remarque 8. Le théorème reste vrai dans Mnfâ) C Mn{C).
3. COMPLÉMENTS DE COURS 263 3.4. Matrices de Gram Définition 2. Soit E un espace préhilbertien (réel ou complexe) et x\, • • -xn n vecteurs de E. On appelle matrice de Gram de X\,..., xn la matrice [(xi-Xj)]i<i,j<n et déterminant de Gram le déterminant de cette matrice, noté G(x\,..., xn). Proposition 3. Toute matrice de Gram est hermitienne positive. Réciproquement, toute matrice hermitienne positive est une matrice de Gram. De plus, la matrice de Gram de n vecteurs X\,..., xn est définie si et seulement si la famille (xi)i<i<n est libre. Démonstration. Soient x\,... ,xn des vecteurs d'un espace préhilbertien E et M leur matrice de Gram. Soit F = Vect(#i,... ,xn) et m = dimF. Fixons nous une base orthonormée B de F, et pour tout i notons Xi le vecteur colonne des coordonnées de Xi dans B. On a Xi • Xj = X*Xj, de sorte que M = N* N où N désigne la matrice mx n dont les colonnes sont les X^ Ceci montre que la matrice carrée M de taille n est hermitienne (M* = N*N** = N*N = M) et positive (car pour tout vecteur colonne X, X*MX = (X*N*)(NX) = {NX)*(NX) = \\NX\\2, || • || désignant la norme euclidienne (resp. hermitienne) standard). Réciproquement, si M = (ai,j)i<i,j<n est une matrice hermitienne positive, d'après l'exercice 1 page 245, il existe une matrice n x n hermitienne H telle que M = H2 = H* H. Si on désigne les vecteurs colonne de H par X\,..., Xn, on voit facilement que la relation M = H*H entraîne a^j = X*Xj = Xi • Xj. La matrice M est bien une matrice de Gram. Cas défini. Une matrice de Gram M est définie si et seulement si (X*MX = 0 =ï X = 0). En réutilisant les notations précédentes, on a X*MX = \\NX\\2. Donc M est définie si et seulement si (||ATX||2 = 0 => X = 0). Ceci équivaut à dire que Ker N = {0}, ou encore que les vecteurs Xi forment une famille libre. □ Les déterminants de Gram permettent de calculer la distance d'un point à un s.e.v, avec le théorème suivant. Théorème 8. Soit E un espace préhilbertien, V un sous-espace de E muni d'une base (ei,...,en) (pas forcément orthonormale). Soit x G E. Alors la distance d de x à V (d = infy€v ||a: - y\\) vérifie 2 _ 0(ei,..., en, x) G(ei,...,en) Démonstration. D'après la proposition 2 de la partie 2.2 (page 242), on a d = \\z\\ où z = x — y, y étant la projection orthogonale de x sur V. On a alors Vi, ei-y = ei-x et ce qui entraîne \x\\2 = 2 + IUI»2 M = ( ex-ex • • en • ex • • \ x-ex •• • ex • en en ' en x • e<n ex • x e^i • x x • x \ / ei • ei • • en • ei • • \ y-ei •• • ei • en en • en • y-en ei-y "] en-y \\y\\'z + IW1 ) La linéarité de det M par rapport à sa dernière colonne entraîne det M = det P + det Q, où P = / ei • ei • ■ en • ei •• \ yei •■ • ei • en en • en • y-en ei -y en-y \\y\\'2 . \ et Q = I / ei • ei • • en • ei •• \ y-ei •• • ei • en en • en • y-en 0 \ 0 IMIa ) Or detP = G(ei,... ,en,y) = 0 car y G Vect(ei,... ,en) et detQ = ||z||2(3(ei,... ,en). Finalement <3(ei,...,en,x) = detM = detQ = \\z\\2G(ei,... ,en) = d2G(ei,... ,en). D
264 5. ESPACES EUCLIDIENS 3.5. Exercices Exercice 1. Soit A = ((Hj)i<ij<n € Mn{R) telle que 3c>0,V(i,j), |oij|<c. Montrer que | det M| < cnnn/2. Solution. Il suffit d'utiliser l'inégalité d'Hadamard (qu'il faut, au besoin, savoir redémontrer). Notons Ai,..., An les vecteurs colonnes de A. D'après le théorème 7, on a | det M\ < \\Ai|| • • • ||y4n|| où pour tout j, \\Aj\\ = yJÂÏÂ- = On en déduit |detM| < (y/nc)n = cnnn/2. n Exercice 2. Soit E un espace euclidien de dimension n e N*. a) On suppose qu'il existe n + 1 vecteurs ui,..., un+i de E de norme 1, vérifiant 3a e R, a ^ 1, tel que Vi ^ j, w* Uj = a. Déterminer a. (Indication. On pourra utiliser les matrices de Gram.) b) Démontrer qu'il existe effectivement de tels vecteurs dans E. Solution, a) Notons M la matrice de Gram des vecteurs ni, ( 1 a ••- a \ a 1 '•• : • >wn+i (voir la partie 3.4). On a M = \a •• a a 1 / Par ailleurs, la famille (iti,... ,un+i) est liée (n + 1 vecteurs en dimension n), donc d'après la proposition 3, det M = G(ui,... ,nn+i) = 0. Nous allons maintenant exprimer det M en fonction de a. On peut procéder de deux façons. La première est de montrer directement detM = (l-a)n(l + na). (*) Ce résultat peut s'obtenir également à partir du résultat décrit dans le problème 1 page 204 donnant la liste des valeurs propres de M. Comme det M = 0, la relation (*) montre a = —1/n car a ^ 1 par hypothèse. b) Notons M la matrice symétrique / i M = n ¥\ =1 n ^ î \i£ n n n eA<n+i(R). 1 I D'après le problème 1 page 204, les valeurs propres de M sont 0 et 1 + ^. Elles sont donc positives, ce qui prouve que M est une matrice positive. D'après la proposition 3, M est une matrice de Gram, c'est-à-dire qu'il existe n + 1 vecteurs C/i,..., Un+\ de En+1 tels que M soit la matrice de Gram des U{. Ainsi, les vecteurs U{ vérifient la condition de a) avec a = — ^. Comme det M = 0 = G(U\y..., C/n+i), la famille (C/i)i<i<n+i est liée. Autrement dit, il existe un s.e.v F de En+1 de dimension n contenant les U{.
3. COMPLÉMENTS DE COURS 265 Résumons. Nous avons trouvé un espace euclidien de dimension n (ici F) et n + 1 vecteurs de cet espace vérifiant la condition de la question a). Par isomorphisme d'espace euclidien, on peut donc trouver n + 1 vecteurs tti,... ,un+i dans E vérifiant cette condition. Exercice 3. Soit E un espace hermitien et u e C(E). Montrer que l'endomorphisme u est normal si et seulement s'il existe P eC[X] tel que u* = P(u). Solution. Tout polynôme en u commutant avec u, la condition suffisante est immédiate. Montrons maintenant la condition nécessaire. Supposons u normal. D'après le théorème 3, u se diagonalise dans une base B orthonormée de E. Autrement dit, il existe des nombres complexes distincts Ai,..., Ar tels que / Ai/ai 0 [u}b=\ \ 0 XrIQr où les ai sont des entiers naturels non nuls. La base B étant orthonormée, on a / ÂT/ai 0 [u*}B = t[u}B= '-. _ \ o xriar Notons P G C[X] le polynôme de Lagrange (voir la partie 2.4 page 61) tel que P(\i) = Xi pour tout i (on peut car les (Ai)i<i<r sont deux à deux distincts). On voit alors que P([w]b) = [w*]b, donc P(u) = u*. Exercice 4. a) Soit A = ((kj)i<ij<n € Mn(C) une matrice hermitienne définie positive. Démontrer que det A < a^i • • • an>n. Donner une condition nécessaire et suffisante pour que cette inégalité soit une égalité. b) Soit p G N tel que 0<p<netq = n — p. On écrit A sous la forme A = \ B* A2 ) aveC Al e Mp(£Î et Â2 e Mq(C)- Montrer que det A < det Ai • det^42- Solution, a) D'après la proposition 3, on peut voir A comme la matrice de Gram de n vecteurs £/i,...,C/n de Cn. Si M désigne la matrice dont les vecteurs colonnes sont Ui,...,Un, on a A = M*M. D'après l'inégalité d'Hadamard (théorème 7), on a |detM| < n?=i ll^tlli ou Pour tout i, \\Ui\\2 = U*Ui = a^i. Finalement, on peut écrire n n det,4= |detM|2 < flll^ll2 = IIav i=l i=l L'égalité se produit lorsque la matrice M vérifie |detM| = Yli=i ll^ll> c'est ^ ^re lorsQu^ les Ui sont orthogonaux entre eux deux à deux (voir le théorème 7), ce qui équivaut à dire que ^ ¥" h Ui • Uj = aij = 0, ou encore que A est diagonale. b) Nous nous ramenons d'abord au cas plus simple où Ai et A<i sont des matrices diagonales. Les matrices A\ et A<i sont symétriques, il existe donc deux matrices unitaires P G MP(C) et Q e Mq(C) telles que P*A\P = D\ et Q*A<iQ = D^ où D\ et D<i sont deux matrices diagonales réelles. En définissant la matrice par blocs M = (J3) eM n(C), un calcul simple donne M*AM - ( P'MP P'BQ \- C avec C - ( Dl P'BQ \ l Q*B*P Q'A2Q ) ~ I Q*B*P D2 I '
266 5. ESPACES EUCLIDIENS La matrice C est congrue à A, donc hermitienne définie positive, donc d'après le résultat de la question précédente, le déterminant de C est inférieur au produit de ses coefficients diagonaux. Comme D\ et D2 sont des matrices diagonales, ceci s'écrit detC < det-Di • det£>2. Comme detM = detP • detQ = 1 (M est même une matrice unitaire), on en déduit det A = det(M*AM) = det C < det £>i • det D2 = det Ai • det A2. Exercice 5 (Exponentielle d'une matrice antisymétrique). 1/ Soit 9 g Montrer l'égalité 0 -9 \ _ f cosO -sinO 9 0 ) ~ [ sinO cos0 exp 2/ a) Soit n G N*. Montrer que P G Mn{^) est une matrice orthogonale directe si et seulement s'il existe une matrice antisymétrique A G MnW telle que P = exp (A). b) En déduire que le groupe spécial orthogonal SOn est connexe par arcs. 3/ (Cas de R3) Soit v = (a, b, c) un vecteur non nul de l'espace euclidien a) Montrer que l'exponentielle de la matrice antisymétrique v = 0 c -b —c 0 a b —a 0 est la matrice de la rotation d'axe e = v/||v||, d'angle 9 = \\v\\, où || • || désigne la norme euclidienne (indication : remarquer que v est la matrice de l'endomorphisme X *-^ v AX, où A désigne le produit vectoriel). b) Montrer la formule de Rodrigues exp(v) = h + -q-v + sin 9 , 1 — cos 9 92 ■v Solution. 1/ Notons J = (Ç g1). Un calcul facile donne J2 = —I2, ce qui entraîne pour tout n G N les égalités J2n = (-l)nh et J2n+1 = (-l)nJ. On en déduit +°° on +°° (_-\\no2n +°° /__i \no2n+l exp(W) = £ ^ J» = j: Sâbr/2 + ^ \2» + 1)! J = («» <Dh + (sin 0)J, *-L (2n + l)! n=0 v ' n=0 "" n=0 ce qui est précisément le résultat demandé. 2/ a) La condition suffisante est immédiate : si A G Mn(R) est une matrice antisymétrique, alors la matrice P = exp(^4) vérifie lPP = exp(lA) exp(^4) = exp(—A) exp(^4) = In. Enfin, on a det(P) = det(exp(^4)) = exp(tr^4) = 1 (voir l'exercice 2, page 186). Montrons maintenant la condition nécessaire. Soit P G Mn(R) une matrice orthogonale directe, soit u G C(Rn) son isométrie associée. D'après le théorème 1 page 256, il existe une base orthonormale B de Rn dans laquelle la matrice de u a la forme / R(01) \ 0 [u]B = R(0r) ei 0 V €s )
3. COMPLÉMENTS DE COURS 267 0Ù pour tout i, R(9i) est la matrice de rotation 2x2 d'angle fy, et où ej G {—1,1} pour tout i Par hypothèse, u est une isométrie directe donc detu = 1. Le calcul de déterminant par blocs donne det u = det R(0i) • • • det R(0r) ei es = £\ Ainsi, le produit des e* vaut 1, donc il y en a un nombre pair 2p (avec p G N) qui valent —1, et les q autres valent 1 (avec 2p + q = s). Quitte à permuter les 5 derniers vecteurs de la base B, on peut même supposer que les 2p premiers Ej valent —1, et les q derniers valent 1. Comme la matrice (~q _?j) est une matrice de rotation d'angle 7r, il revient au même de dire que la matrice de u dans B a la forme / R(0{) [u]b = \ 0 V 0 R{9m) I avec Oi = n pour r<i<m = r + p. Le résultat de la question 1/ nous permet maintenant de remarquer que / 0i J [u]b = exp(M) où M = \ 0 \ 0 OmJ 0 / avec J = ( i "q-). La matrice par blocs M est antisymétrique car J est antisymétrique. En notant Q la matrice de passage de la base canonique de W1 à la base B (c'est une matrice orthogonale), on a donc montré que P = lQexp(M)Q. En posant A = lQMQy on a donc P = exp(A) et la matrice A est antisymétrique car lA = tQtMQ = tQ(-M)Q = -A, d'où le résultat. b) Étant données deux matrices P et Q dans SOn) on peut écrire P = exp(^4) et Q = exp(B) avec A et B antisymétriques d'après la question précédente. La question précédente nous assure également que le chemin continu [0,1] —> A^n(^) t •—► exp((l — t)A + tB) est à valeur dans SOU) donc le groupe spécial orthogonal est bien connexe par arcs. 3/ a) Suivons l'indication et considérons Pendomorphisme u : E3 —> E3 X i-> v A X. On remarque aisément que la matrice de u dans la base canonique de E3 est la matrice v. Partant du vecteur e = v/\\v\\ = \v^ on le complète avec deux vecteurs e\ et e^ de sorte que (ei,e2,e) soit une base orthonormale directe de E3. Comme v = 9e, on a u(ei) = 9eAei= Qe^ ufa) = 0e A e<i = —9eiy u(e) = 9e A e = 0, autrement dit la matrice de u dans la base B a la forme par blocs [u]B = °ù J = (i "o1)- N°us avons vu que exp(0J) est la matrice 2 x 2 de rotation d'angle 0, donc cos 9 — sin 9 0 expQuJs) = [ sin0 cos# 0 | . 0 0 1 (*) (**) Comme exp([u]#) est aussi la matrice de exp(n) dans la base B, ceci entraîne que exp(w) est la rotation autour du vecteur e d'angle 6, d'où le résultat. b) En utilisant la forme par bloc (*) de la matrice de u dans la base B, on obtient /3 + sin# [u]b + 1 — cos 6 e2 j o (Mb)2 = /3 + sin0( "Q ^ l+(l-cos0)l Q ■h 0 0
268 5. ESPACES EUCLIDIENS ce qui s'écrit encore . a 1/3 / cos0 — sin# 0 sin0r . 1— cost',, . -o / . n n /3 + -5-MB + —72—(Mb) =\ sm0 cos0 0 9 B V 0 0 1 D'après la forme (**), ceci est précisément l'exponentielle de la matrice u dans la base B. D'où le résultat par changement de base. EXERCICE 6. Soit n un entier naturel non nul. On considère l'application (p: Rn -> R (ai,..., an) •-► / (1 + 01 a; 4- • • • + an xnf dx. Jo Montrer que <p admet un minimum //, atteint en un point unique de lRn, et calculer /j. (Indication. On pourra utiliser les déterminants de Gram.) Solution. Munissons le R-e.v E = C([0,1], M) des fonctions continues de [0,1] dans R du produit scalaire V/,<?G£, (f\g)= f f(t)g(t)dt. Jo Par commodité de notation, pour tout entier i on désigne par xl la fonction [0,1] —> R ïh xl. En notant En = Vect(a;,..., zn), on remarque que n </>(ai,...,an) = ||1-P||2, où P = -J2aixi eEn, et où II. Il désigne la norme issue du produit scalaire (|). Déterminer \i = infa€]Rn </?(a), c'est donc rechercher d(l,En)2 = infp€£n ||1 - P||2 = /j,. La proposition 2 de la page 242 assure l'existence et l'unicité d'un point Po de En tel que ||1 — P0|| = d(l,En) (de plus, Po est la projection orthogonale de 1 sur En). Le minimum de <p est donc atteint en un point unique de Rn. D'après le théorème 8 sa valeur fi est donnée par M = d(l,B„) = G(x<xn) ■ W Comme (x*\x^) = l/(i +j + 1), on a G(lix,...,xn) = det(-—î—-] et G{x,..., xn) = det ' l i+j~ Vl<îj<n+1 V* + 3 + 1/ l<ij<n Ces déterminants sont des déterminants de Cauchy (voir l'exercice 7, page 143) que l'on sait calculer. Ils valent respectivement m t Tn\ - ni<i<j<n+i(*-i) r( n) _ ni<t<j<n(* ~ 3) G(* *■•■• '■n^W'+j-1) ( )~ni<u<»(<+;+i)" En utilisant l'égalité (*) et l'identité rii<tj<n+i(* + •? ~ *) = ïlo<i,j<n(i + 3 + !)> on a donc = Ui<i<nli ~ (" +1)]2 n!2 1 M (n + 1)!2 (n+1)!2 (n+1)2' Remarque. On pourrait de même calculer r+00 inf / e~x(l + ai2H \-anxn)2dx. ,...,a„)eR» y0 - Cet exercice est à rapprocher du problème du tome d'analyse portant sur le théorème de Mùntz.
4. PROBLÈMES 269 4. Problèmes Problème 1 (Théorème de Fisher-Cochran). Soit E un espace euclidien de dimension n et u\t..., up des endomorphismes symétriques de E. On suppose que (i) rgui + --- + vgUp = n. (ii) qi(x) + • • • + qp(x) = x • x, où qt désigne la forme quadratique qi(x) = Ui(x) • x pour tout i. Montrer que E = Im u\ 0 • • • © Im itp, que les Im i^ sont orthogonaux entre eux deux à deux, et que pour tout i, Ui est le projecteur orthogonal sur Imi^. Solution. La relation (ii) s'écrit aussi VxeE, {ui + --- + up-IdE){x)-x = 0. (*) L'endomorphisme v = u\ H \-up — Id^ étant symétrique, (*) entraîne v = 0 (en effet, v est diagonalisable et (*) montre que la seule valeur propre de v est 0). Donc u\ + • • • + up = Id^, d'où on tire E = Imu\ -\ (-lmup. Comme de plus Ya=i dim(Imui) = dimE d'après (i), on a E = Im u\ 0 • • • 0 Im up (**) (voir la proposition 6 page 111). En appliquant maintenant l'égalité \<\e = u\-\ + up au vecteur Uk(x), on obtient Vfc,VzGi?, uk(x) = U\Uk{x) H \-upuk{x). (***) D'après (**), la décomposition d'un élément de Imu^ se fait de manière unique dans 0f=1 Imi4j, d'où on déduit, avec (***) que Uk{x) = u\{x) et W ^ k, UkUe(x) = 0. Ceci étant vrai pour tout x G E, on en tire uk = u\ et W 7^ k, UkUg, = 0. Les endomorphismes uk sont donc des projecteurs, orthogonaux puisqu'ils sont symétriques (ses sous-espaces propres sont orthogonaux, et ce sont ici Keritfc et Imt^). Il nous reste à montrer que les Imt^ sont orthogonaux entre eux deux à deux. Pour k 7^ £, on a vu UkUg, = 0, ce qui entraîne Imu^ C Kertifc. L'endomorphisme Uk étant un projecteur orthogonal, on a Keritfc = (Imuk)1, donc Imit^ C (Imuk)1, ce qui prouve que Imue et Im-u^ sont orthogonaux. Ceci est vrai dès que le couple (k,£) vérifie k ^ £, d'où le résultat. PROBLÈME 2. Soit n G N*. On note «S le s.e.v des matrices symétriques de Mn(M-)- Pour tout A G Mn(M), on définit l'endomorphisme de S cpA: S -> <S M i-> lAMA. Montrer que |det<p>i| = |detA|n+1. Solution. Commençons par traiter le cas où A est diagonale (cas qui semble intuitivement simple). Notons Ai,... ,Àn les coefficients diagonaux de A. Considérons la base B de S constituée des matrices de la forme (£,i)i)i<i<n et (Eij + #j,i)i<i<j<n, où Eij désigne la matrice dont tous les coefficients sont nuls sauf celui d'indice (i,j) qui vaut 1. Un calcul rapide montre que Vi, ipA(Ei,i) = X*Eifi et \/i < j, <pA(Ei,j + Ejti) = XiXj(Eij + Ejti). La base B diagonalise donc tpa, les valeurs propres correspondantes étant X{Xj (1 <i < j <n), ce qui montre que / n \ "+1 det <p A = J] XiXj = m xA = (det A)n+1. (*) l<i<j<n \i=l J Traitons maintenant le cas général. Commençons par munir S d'un produit scalaire. Si S, T G S, on définit le produit scalaire de (5,T) par (S \ T) = tv(ST). Il s'agit bien d'un produit scalaire
270 5. ESPACES EUCLIDIENS puisque c'est une forme bilinéaire symétrique, et la forme quadratique associée est définie positive car VS = (sij)i<ij<n G <S, tr(52) = J2 shjs3,i = J2 slr L'introduction de la structure euclidienne sur S va nous permettre de définir l'adjoint de (pA. Comme V5,T G <S, (<Pa(S)\T) = trfASAT) = tr(AT*AS) = ^(T) | S), l'adjoint <p*A de y>A est c^. Maintenant, on remarque que (p*Aoy>A = H>tA°H>A = <Pa*a- La formule (det cpa)2 = det <p\ ^et Va = det((p*A<pA) = det y>AlA va nous permettre de trouver la valeur de |det<^>i|. Posons M = A1 A. C'est une matrice symétrique, donc diagonalisable, de sorte qu'il existe une matrice orthogonale P telle que M = lPDP où D est une matrice diagonale. On vérifie facilement que vm = tpp o tp£> o (ptp. Comme ippçuptp = iptpp = Ids, y>M est semblable à tpo donc det (pM = dettpo = (det D)n+1 d'après (*). Comme detD = det M = (det^4)2, ceci s'écrit aussi (detipA)2 = det W = (det A)2(<n+1\ d'où le résultat. Problème 3. a) Soit H G Mn(C) une matrice hermitienne positive. On note T l'ensemble des matrices hermitiennes positives A telles que detA > 1. Montrer inf tx(AH) = n(detH)l,n. (On pourra utiliser l'inégalité de la question a) de l'exercice 4 page 265). b) En déduire que pour deux matrices hermitiennes positives A et B, on a [det(A + B))l'n > (detA)1/71 + (detB)1/n. Retrouver ce résultat sans utiliser la question a). Solution, a) Commençons par montrer que pour toute matrice A G T, tr(AH) > n(det H)1/71. Le problème étant invariant par changement de base orthonormale, on peut supposer H diagonale. Notons Ai,... ,Àn les coefficients diagonaux de H et considérons A = (dij)i<ij<n G T. On a tr(AH) = Y^i=\ ^iahi- Le logarithme étant une fonction concave, on peut écrire _1 n n ^2(^iai,i) ,i=l > n Yl(^iai,i) .i=l 1/n / n \ 1/n = (detH)1/n(noi, i=l et comme 1 < det^4 < nr=iav d'après la question a) de l'exercice 4 page 265, ceci implique tr(AH) ynidetH)1/71. Achevons notre raisonnement. Nous venons de montrer que mîA£rtr{AH) > n(detH)l/n. Il s'agit maintenant de prouver l'inégalité réciproque. Il y a deux cas. Premier cas. Si H est définie, alors pour tout i, Xi > 0. Soit A la matrice définie par A = (det H)1'*1 X{1 0 0 An -î On a A G I\ et tr(AH) = tr[(det H)VnIn] = n{àetH)lln, d'où le résultat.
4. PROBLÈMES 271 Second cas. Si la matrice H n'est pas définie, l'une au moins des valeurs propres À* est nulle, par exemple An = 0. Pour tout p G N*, on définit \ 0 / p-1 Ap — n-1 V 0 P -1 P ,n-l er. / Onatr(Ap#) = Eïïa. , donc lim tr(AVH) = 0 = n(det H)1/71, ce qui prouve le résultat. p p->oo b) Pour toute matrice M G T, on a donc tr[(A + B)M] = tr(AM) + tr(BM) > inf tv(AM) + inf tr(£M), Mer Mer inf tr[(;4 + 5)M] > inf tr(AM) + inf tr(£M), Mer Mer Mer ce qui prouve le résultat en vertu de la question a). - Résolvons la question sans l'aide de a). Si A et B ne sont pas définies, c'est évident car det A = det B = 0 et comme A + B est positive, det(^4 + B) > 0. Sinon, l'une des matrices A ou 5 est définie. Supposons par exemple A définie. Le corollaire 3 page 245 assure l'existence d'une matrice inversible P telle que A = P*P et B = P*DP, où D est une matrice diagonale. Ainsi, on se ramène à montrer que [det(/n + D)]l'n > (det In)l'n + (det D)l'n. En notant À; > 0 les termes de la diagonale principale de D, cette inégalité s'écrit 1/n / n \ 1/n II(1 + A') ,i=l >i+ n^ (*) Ki=l Nous allons prouver (*) en utilisant des critères de convexité. Considérons l'application 1/n <p : [0,1] -> R iM n Ile+A<) ,i=l Il s'agit de montrer </?(l) — <p(0) > 1, ce qui sera vrai si on prouve ip'(i) > 1 pour t G ]0,1]. On a T1/» / n V*G]0,1], </>'(*) = i n ne+a*) i=l E^ a=l i + Af ou encore W6]0,1], ,ogv<W = log(iÊ^)4t.og^, \ 1=1 / 1=1 donc, en vertu de la concavité du logarithme, log^i) > 0, c'est à dire <p'(t) > 1 pour t G ]0,1], d'où le résultat. Remarque. Notez l'utilisation fructueuse du corollaire 3 page 245 dans la preuve directe de la question b). Problème 4. Soit (E, \\. ||) un espace euclidien et u un projecteur de E tel que \u\ < 1 (en notant ||w|| = sup||x||=1 ||w(a;)||, norme d'algèbre sur C(E)). Montrer que u est un projecteur orthogonal.
272 5. ESPACES EUCLIDIENS Solution. Il s'agit de montrer que Kern et Imw sont orthogonaux. Soit x G Kerw et y G Irau. Pour tout t G M, on a u(y + tx) = u(y) = y, et comme par hypothèse \\u(y + tx)\\ < \\y + tx\\} on a V* G R, \\y\\2 = \\u(y + tx)\\2 < \\y + txf = \\y\\2 + 2t(x ■ y) + i2||z||2. Cette inégalité exprime que la fonction t1-> \\y\\2 + 2t(x • y) + i2||x||2 atteint son minimum pour t = 0. Sa dérivée en 0 est donc nulle, ce qui s'écrit x • y = 0. Ceci étant vrai pour tout x G Ker-u et pour tout j/Glmw, on en déduit que Ker u et Im u sont orthogonaux. Remarque. Tout projecteur non nul w vérifie |w| > 1. En effet, on a u2 = u donc |ti|| = ||tt2| < ! u 12, et le résultat car |w| ^ 0. Un projecteur orthogonal non nul u vérifie M = î. Problème 5. Déterminer les matrices hermitiennes positives A = {o>i,j)i<i,j<n G Mn(C) à coefficients a^j tous non nuls, telles que la matrice B = (l/ûi,j)i<i,j<n est aussi hermitienne positive. Solution. Soit A = {o>i,j)i<ij<n une telle matrice. D'après la proposition 3 page 263, A est une matrice de Gram, c'est-à-dire qu'il existe n vecteurs iti,... ,nn de Cn tels que Vz, j, o^j = ttj -Uj. D'après, l'inégalité de Schwarz, on a donc V*,j, Kjl2 = \ui • uj\2 < IN|2|KH2 = <k,iajj. Cette inégalité, vraie pour toute matrice positive, l'est également pour la matrice B, ce qui s'écrit Vt,j, 1 1 1 < a h 3 I ai,i aJJ On en déduit que la^jl2 = a^ajj pour tout i, j. Il y a donc égalité de Schwarz l^r^jl = II^IHI^jll> donc Ui et Uj sont liés. Ceci étant vrai pour tout i,jf, le rang des vecteurs u\,... }un est 1 (ces vecteurs sont non nuls car A ^ 0). Ceci suffit pour affirmer rg^4 = 1. Réciproquement supposons A = (dij)i<ij<n hermitienne positive, de rang 1 et telle que (Uj ^ 0 pour tout i,j. La signature de la forme quadratique X i-> X*AX est (1,0), il existe donc une forme linéaire f(X) = X^Li ^ xi *e^e <lue VX, ^Oijxïx,- = X*AX = \f(X)\2 = Y^(%xj)Wj- ij i,3 Ceci prouve que a^j = \{\j pour tout i, j. On en déduit B= — CL{ j J \<i<n Ai. A, et l<i<n l<j<n VA", X*£X = n Si Xf >o. Ainsi, B est matrice positive. En conclusion, les matrices positives cherchées sont celles à coefficients tous non nuls et de rang 1. Problème 6. a) Montrer que si le coefficient diagonal d'indice (z, i) d'une matrice symétrique positive A G Mn(R) est nul, alors la i-ième ligne de A est nulle. b) Soit M G A4n(R) une matrice symétrique positive. On écrit la matrice M sous la forme A B \ , _ . . ,«x ,. . . x ,, . „ ( A B M=\*B C est diagonalisable avec A G MP(R) (1 < p < n). Montrer que A/" = 0 0 eMn
4. PROBLÈMES 273 Solution, a) Comme A est symétrique positive, A s'écrit comme la matrice de Gram de n vecteurs iti,..., un de Rn. Le coefficient d'indice (i, j) de A vérifie donc aij = Ui • Uj pour tout uj). Ainsi, si a^i = 0 on a ||uj||2 = a,i,i = 0 donc Ui = 0, donc o^j = ui • Uj = 0 pour tout j. b) Nous nous ramenons d'abord au cas où A est diagonale. Comme M est symétrique positive, A l'est également donc il existe une matrice orthogonale P G MP(R) telle que D = tPAP soit une matrice diagonale. Quitte à changer l'ordre des vecteurs colonnes de P, on peut même supposer que les éventuels termes nuls de la diagonale de D sont les derniers (ce choix sera utile par la suite). Notons q = n — p et U = (JjM.La matrice U est orthogonale et un produit par blocs donne tTTMTT ( D tPB \ 4. tTTATTT ( D lPB \ UMU={tBp c ) et tUNu={ o o )• La matrice lUMU est congrue à M, donc positive. Donc d'après la question a), pour chaque indice i tel que le i-ième coefficient diagonal de D est nul, toute la i-ième ligne de lUMU est nulle, en particulier la 2-ième ligne de lPB est nulle. Par construction, les éventuels termes nuls de la diagonale de D sont les derniers. En désignant par r le nombre de coefficients non nuls de la diagonale de D, on voit donc que seules les r premières lignes de tUNU sont non nulles. En notant D' G Mr(M) la matrice formée des r premières lignes et colonnes de D, on voit donc que lUNU a la forme >unu=( d; e0 ) w où E est une matrice à r lignes et n — r colonnes. Les r premiers vecteurs ei,...,er de la base canonique de W1 sont des vecteurs propres de WNU associés à des valeurs propres non nulles, et la forme de cette matrice montre que le rang de ses vecteurs lignes est r, donc son noyau est de dimension n — r. En désignant par /i,... ,/n-r une base de Ker^UNU) on voit facilement que (ei,...,er, /i,..., fn-r) est une base de vecteurs propres de tUNU. Ainsi ^NU est diagonalisable, et comme U est une matrice orthogonale ceci entraîne que N est diagonalisable. Remarque. On peut aussi montrer directement que la matrice de droite dans (*) est diagonalisable grâce à la formule (J D'-lE) (D0' f ) (£ D'-^y1 = (^ oy - Le résultat de la question b) est aussi une conséquence du résultat du problème 10 page 277 dans le cas particulier où A = ( ^ [j ). Problème 7 (Réduction des matrices antisymétriques). Soit K un corps com- mutatif de caractéristique différente de 2. a) Soit E un K-espace vectoriel de dimension finie n et ip une forme bilinéaire antisymétrique sur E. Montrer qu'il existe une base B = (ei)i<i<n de E et un entier r < n/2 tels que / n n \ r Vfe), (yi) e Kn, (f I ^ Xie^ ^2 yJeJ J = ^2(X2k-lV2k ~ X2kV2k-l)- (*) \i=l j=l J k=l b) Soit A e Mn(K) une matrice antisymétrique. Montrer qu'il existe P G Ç£n(K) tel que / J \ lPAP = (0) J 0 (0) V o / avec J = ( _°x J ) G M2(K). c) Montrer que le déterminant d'une matrice antisymétrique A à coefficients entiers est le carré d'un entier.
274 5. ESPACES EUCLIDIENS Solution. 1/a) On procède par récurrence sur n = dimi?. Pour n = 1, <p est nulle et si n = 2 le résultat est immédiat. Supposons donc n > 3. Si <p = 0 le résultat est évident (dans ce cas r = 0), sinon il existe deux vecteurs e\ et e2 de E tels que </?(ei,e2) ^ 0. Quitte à multipHer ei par l/</?(ei,e2) on peut supposer </?(ei,e2) = 1. Ces vecteurs sont forcément non nuls, et ils forment une famille libre car si e^ = Àei avec A G K, on aurait </?(ei>e2) = A</>(ei,ei) = 0. Les formes linéaires L\ = y?(ei, •) et L2 = v?(e2» •) forment une famille libre car si \\L\ + A2L2 = 0 alors 0 = (A1L1 + A2-L2)(ei) = —A2, de même 0 = (A1L1 + \2L2){&2) = Ai. Donc le s.e.v F = KerLi DKev L2 est de dimension n — 2. D'après l'hypothèse de récurrence, on peut trouver une base (es,..., en) de F et r < n/2 telle que la restriction tp de <p à F x F s'écrive n n ip ^Xieu^yiei = ^2{x2k-iV2k ~ X2kV2k-i)- (**) \i=3 j=3 J i=2 Par ailleurs Vect(ei, e<i) est en somme directe avec F (si e = Aiei + A2e2 G F alors 0 = L2(e) = Ai</?(e2,ei) + A2</?(e2,e2) = -Ai donc Ai = 0 et de même 0 = L\(e) = A2), donc (ei,e2,e3,... ,en) est une base de E. Par construction de F, on a (p(x,y) = (p(y,x) = 0 dès que x G Vect(ei,e2) et y G F, donc / n n \ / n n <p ^2xiei,^2yjej I = y>(xiei +z2e2,2/iei +2/262) + ^ I Xl^^'S^'^ \i=l 3=1 J \î=3 j=3 Comme (p(x\ei +x2e2,yiei+y2e2) = xiy2ip{ei,e2) + X2yi<p(e2,ei) = x\y2 - x2yi, on en déduit avec (**) le résultat au rang n. b) Soit </? la forme bilinéaire sur Kn dont A est la matrice dans la base canonique B de Kn. La question précédente assure l'existence d'une base #' = (ei,... ,en) et de r < n/2 dans laquelle </? s'écrive sous la forme (*). En d'autres termes, la matrice M de </? dans la base B' est formée de r matrices J sur sa diagonale et de zéros partout ailleurs. En désignant par P G Gtn{1&) la matrice de passage de la base B à la base B'> on a donc lPAP = M, d'où le résultat. c) Les coefficients de A sont dans le corps K = Q, donc la question précédente assure l'existence de P G Gtn(Q) telle que lPAP = M où M est constituée de r matrices J sur sa diagonale et de zéros partout ailleurs. Si M a au moins un zéro sur la diagonale, alors det M = 0 donc det A = 0 est bien le carré d'un entier. Sinon, det M = (det J)r = 1 donc det-A = l/(detP)2. Comme P G G£n(Q) on a detP G Q, donc det A est le carré d'un nombre rationnel. Comme A a des coefficients entiers, det-A est un entier. Un entier qui est le carré d'un rationnel est forcément le carré d'un entier, donc det A est bien le carré d'un entier. Remarque. Lorsque K = R, ce résultat (bien que légèrement différent) est plus faible que le théorème 6 page 261, mais il présente l'intérêt d'être vrai sur d'autres corps K. Problème 8 (Pfaffien). Soit K un corps commutatif de caractéristique différente de 2. On désigne par Anfâ) l'e.v des matrices antisymétriques de Mn(K). a) Si A G Anfâ) et si n est un entier impair, montrer que det A = 0. b) Soit E un K-espace vectoriel. Pour toute forme bilinéaire antisymétrique (p sur E, on définit une suite cp^ pour p G N* par la récurrence suivante : ip^ = (p et pour p > 2 et (xu...,x2p)eE2p, 2p (P{P)(XU ...,X2p)= ^2(-iyip(xUXi) lpiP~l){x2, • • .,£<_!, Si+i, • • • yX2p). (*) i=2 Montrer que ip^ est une forme 2p-linéaire alternée. (Indication : traiter d'abord le cas p = 2, puis montrer (p^(xit... ,x2p) = 0 si Xk = #fc+i — v°ir l'exercice 9 page 145.) c) Si A G ^2m(K), on désigne par ipA la forme bilinéaire sur E = K2m dont A est la matrice
4. PROBLÈMES 275 dans la base canonique B = (ei,...,e2m) de E, et on note Pf(^4) = <p™ (ei,... ,e2m) (pfaffien de A). Montrer que V(ai,...,a;2m) £ #2m> P^fai, • • • ,x2m) =Pf(i4)detB(a;i,...,a;2m), où detg désigne le déterminant dans la base B. d) Calculer Pf(A) pour A G Ai(]K), et montrer que Pf(A) est un polynôme en les coefficients de A e A2m(K). e) Montrer que pour tout A e v42m(K) et P G A^2m(K), on a Pî(*PAP) = det(P) Pf(4). f) Montrer que pour tout A G v42m(K), on a det(A) = Pf(A)2 (on pourra utiliser le résultat de la question b) du problème précédent). Solution, a) Comme A = -M, on a detA = (-l)ndet*A = (-l)ndetA = -detA, donc det A = 0. Ce résultat est aussi une conséquence du résultat du problème précédent qui entraîne que le rang d'une matrice antisymétrique est pair. b) La propriété de 2p-linéarité de (p^ est immédiate par récurrence sur p. Montrons maintenant que <p^ est alternée. Il suffit pour cela de montrer par récurrence sur p que <p(p\xi,..., x2p) = 0 dès que Xk = x^+i (voir l'exercice 9 page 145). Pour p = 1 le résultat est immédiat car <pW = ip est antisymétrique. Pour p = 2, on écrit </>(2)(zi, X2, Z3> Xi) = <p(xi,X2)<p(x3, Xi) - <p(xi,X3)<p{x2, Xi) + (p(XiiXi)(p(x2i X3). (**) Dans chacun des cas x\ = x2i x2 = x3 et x3 = £4, on remarque que l'un des termes de la somme est nulle et les deux autres opposés, donc ip^ s'annule bien dans ces cas. Supposons maintenant p > 3. Si x^ = Xk+i avec 2 < k < p — 1, les termes d'indices i g {k, k + 1} et de la somme (*) s'annulent d'après l'hypothèse de récurrence, et les termes d'indices i = keti = k + l sont opposés, donc ip^ est bien nul dans ce cas. Il nous reste à traiter le cas x\ = x2. L'idée est d'exprimer <p^ en fonction de ip(p~2\ Par commodité, nous noterons x = (a?i,... ,x2p) et si ii,... ,ifc sont des indices distincts, on note x*x t le (p — k)-up\et obtenu à partir de x en retirant les termes d'indices i\, ..., i^. Avec cette notation, (*) s'écrit 2p <P{p)(x) = ^(-îr^i,^)^-1^^). i=i Si i > 3, la récurrence définissant <£>(p_1) donne 3<j<i i<j<2p (on a pris en compte le fait que Xj est la (j — l)-ième coordonnée de x\^ si 3 < j < i, la {j - 2)-ième coordonnée si j > i) donc (p(p\x) = <p(xux2)<p(p~1)(x3)... ,x2p) + E (-i)i+i~V(^ 3<i<2p 3<j<i 3<i<2p i<j<2p Lorsque x\ = x2 le premier terme de cette somme est nul, et on peut donc écrire ^\x)= y. (-ly^-MxuxiMxux^^Hxt^) 3<j<i<2p + E (-^'MxuXiMxux^-'Hx^j). 3<i<j<2p Chaque terme d'indice (j,i) de la première somme est l'opposé du terme d'indice (i,j) de la seconde, on en déduit (pb\x) = 0.
276 5. ESPACES EUCLIDIENS c) L'ensemble des formes 2m-linéaires alternées sur l'e.v E de dimension 2ra est un e.v de dimension 1 (voir le théorème 2 page 135). Comme cpA } et det# sont des formes 2m-linéaires alternées et que det# est non nul, on en déduit l'existence de À G K tel que V(xi,..., x2m) e E2m, (p^\xu • • • ) x2m) = Adetfi(xi,..., x2m). En appliquant cette égalité pour xi = e* (1 < i < 2m), on obtient A = Pf(^4), d'où le résultat. d) Lorsque A = (a^j) G At(K), on a m = 2 et l'expression (**) entraîne Pf(^4) = a\^a^A - ^1,3^2,4 + ^1,4^2,3- Lorsque A = (aij) G A2m(K), montrons maintenant que Pf(^4) est un polynôme en les coefficients (o>ij)i<i<j<2m de A. Pour cela, nous allons prouver, en procédant par récurrence sur p, que si 1 < p < m et 1 < ki < ... < k2p < 2m, alors ip% (efel,... ,efe2p) = Pku...Mp(A) où Pfc1)..#)fe2p(i4) est un polynôme en les coefficients (<k,j)i<i<j<2m de A. Cette propriété est vraie pour p = 1 car tpA (e^e^) = Q>kuk2- Si elle est vraie pour p — 1, alors l'écriture (*) entraîne 2p i=2 2p i=2 donc ^ (efc15..., efe2p) est bien un polynôme en les coefficients (aij)i<i<j<2m de A. La propriété souhaitée est donc démontrée pour tout p, 1 < p < m. En particulier, elle est vraie pour p = m donc Pf(i4) = <p™ (ei}..., e2m) est un polynôme en les coefficients de A. e) Pour tout x,y G E = K2m on a (ptPApfay) = lxlPAPy = t(Px)A(Py) = <pA(Px,Py). Une récurrence immédiate sur p entraîne alors V(xi,..., x2p) G E2p, ^AP(xu..., x2p) = <Pa\Pxu • • •, Px2p). Ainsi, si B = (ei,..., e2m) désigne la base canonique de IK2m, on a PîfPAP) = ip[p\P(eu - - -, e2m) = <P(A](Peu ..., ^e2m) = Pf (A) detB(Pci,..., Pe2m). On conclut en remarquant que det#(Pei, • • • > Pe2rn) = det P. f) Si ^4 n'est pas inversible, alors il existe un vecteur #i ^ 0 tel que Ax\ = 0 donc ipA(xi,y) = 0 pour tout vecteur y. Complétons x\ en une base (xi,... ,£2™) de IK2m. Comme ^a(^I)^) = 0 pour tout i > 2, l'égalité (*) donne «p^ (xi,... >x2m) = 0- D'après c), on a donc 0 = <^ ,(xi,...,x2m) = Pf(i4)detfl(a;i,...,a;2m). Comme (rci,..., X2m) est une base, on a det# (zi,..., #2m) 7^ 0 donc l'égalité précédente entraîne Pf(A) = 0. Ainsi, on a bien det>l = Pi(A)2 si A n'est pas inversible. Si A est inversible, le résultat de la question b) du problème précédent nous assure l'existence de P G £^2m(K) tel que B = tPAP soit constituée de m matrices J = ( _?i J) sur sa diagonale et de 0 partout ailleurs. Le Pfaffien de B se calcule facilement. En effet, comme <^s(ei,e2) = 1 et </?£(ei,ei) = 0 si i > 3, la relation (*) donne <PB (el>--->e2m) = <Pb '(e3,...,e2m). En poursuivant, on en déduit ainsi </?# (ei,... ,e2m) = <pB (e2m-i^2m) = 1. Donc Pf(B) = 1 et le résultat de la question précédente entraîne donc 1 = Pf (B) = Pf (* PAP) = Pf {A) det P. Par ailleurs, un calcul de déterminant par blocs donne det.6 = (det J)m = 1, et comme B = lPAP on en déduit det (A) det(P)2 = 1, donc det A = l/det(P)2 = Pf(A)2. Remarque. Ainsi, le déterminant d'une matrice antisymétrique A d'ordre pair est le carré d'un polynôme en les coefficients de A (le Pfaffien). Ce résultat remarquable a été établi par Cayley au milieu du XlX-ième siècle.
4. PROBLÈMES 277 Problème 9. Soit (E, \\.\\) un M-e.v norme de dimension n G N*. On note Bp,q l'ensemble des formes bilinéaires symétriques sur E de signature (p, q). Si p + q = n, montrer que BP)Q est un ouvert de l'espace vectoriel B des formes bilinéaires symétriques sur E. Solution. Munissons B de la norme |||. ||| définie par V</? G B, |||</?| = sup^^ \\<p(x, x)\\ (B étant de dimension finie, toutes les normes y sont équivalentes). Donnons nous (po G Bp>q, où p + q = n. La signature de ipo étant (p,q), il existe deux s.e.v F+ et F~ de E tels que dimF+=p, dimF =g et ^ w ' _/n ï w n • Comme p + g = n, on a ici F+ 0 F- = E. L'ensemble S+ = {x G F+ | ||x|| = 1} est compact, donc ipo étant continue 3x G 5+, y>o(x,x) = inf <p0(y,y). yeS+ En notant a = <fo(x, x) > 0, on voit que pour tout y G 5+, <Ad(2/> 2/) > <*> donc pour tout y G F+, VoiViV) ^ allî/l|2- On montrerait de même l'existence de (3 > 0 tel que tout y G F- vérifie <P0(V>V)<-P\\V\\2- Soit 7 = inf (a, fi) et ip e B tel que |^| < 7/2. Alors ^ = tpo + ip vérifie V*GF+, V>(x,x)=V0(x,x)+^(x,x)> 7lW2-^IN|2= \\\A? Vx G F", ^(x,x) = ^o(x,x) +^(x,x) < -7H2 + \\\x\? = -2||*||2 On a donc (p(x,x) > 0 sur F+ \ {0} et tp(x,x) < 0 sur F~ \ {0}. Ceci suffit pour conclure que ip est de signature (p, 4) (voir la remarque 9 page 234). La boule de centre y>o de rayon 7/2 est donc incluse dans BPyQ} d'où le résultat. Problème 10. Soient A et B e MrSpj deux matrices hermitiennes positives. a) Si A est définie, montrer que la matrice AB est diagonalisable, à valeurs propres réelles positives. b) Montrer que le résultat de la question précédente subsiste lorsque A n'est pas supposée définie. c) Soient 0 < Ai < • • • < An les valeurs propres de A, 0 < \±\ < • • • < \in celles de B. Si À est une valeur propre de AB, montrer Ai/^i < A < An/xn. Solution, a) La matrice A étant hermitienne positive, il existe une matrice a G .Mn(C) hermi- tienne positive telle que A = a2 (c'est très classique, voir l'exercice 1 page 245). Comme A est définie, a est inversible. L'égalité AB = a2B = a(aBa)a~l montre que AB est semblable à aBa. Cette dernière matrice est hermitienne, et positive car la matrice B étant positive, VX, X*(aBa)X = (aX)*B(aX) > 0. Finalement, on a montré que AB est semblable à une matrice hermitienne positive, ce qui suffit à montrer que AB est diagonalisable à valeurs propres réelles positives. b) C'est plus délicat. Comme à la question précédente, nous allons passer par la matrice aBa. Soit k = rg(aBa). La matrice aBa étant hermitienne positive, on est assuré de l'existence d'une famille libre de k vecteurs propres ei,...,efc associés à des valeurs propres strictement positives Ai,..., Afc. Pour tout i G {1,..., &}, l'égalité (aBa)e{ = Xiei entraîne (a2Ba)ei = Xiaei donc (AB)fi = Ai/i, avec fi = aei.
278 5. ESPACES EUCLIDIENS La famille (fi)i<i<k est libre car k k k ^2v>ifi = 0 => 0 = J2fii(aB)(fi) = J^fiiXiei => Vi G {1,... ,/c},^A^ = 0, i=l i=l z=l ce qui entraîne fii = 0 lorsque 1 < i < k puisque À; ^ 0. Finalement, on vient d'exhiber une famille libre (fi)i<i<k à k éléments de vecteurs propres de AB associés à des valeurs propres non nulles. Nous allons prouver que toutes les autres valeurs propres sont nulles. Pour cela, nous commençons par montrer rg(AB) = rg(aBa) = k. La matrice aBa est hermitienne positive (voir plus haut), donc X G Ker(aBa) si et seulement si X*(aBa)X = 0. Comme B est positive, on en déduit XeKer{aBa) «=> 0 = X*(aBa)X = (aX)*B(aX) «=► aX eKev(B) «=> X eKev(Ba). Ainsi, Ker(aBa) = Ker(jBa), donc rg(aBa) = rg(Ba). La matrice a est hermitienne donc Ima = Ima2 = Im^4 (pour s'en convaincre, diagonaliser a dans une base orthonormale), donc lm(Ba) = B(lma) = B(ImA) = lm(BA), d'où rg(Ba) = rg(BA). Finalement, on a montré rg(aBa) = rg(BA). Le rang d'une matrice est égal à celui de sa transconjuguée, donc rg(jB^4) = rg[(iL4)*] = rg(A*B*) = rg(AB), et finalement on a bien rg(aBa) = rg(AB) = k. Le fait que dim(Ker(AB)) = n — k nous permet de prendre une base (/fe+i,... ,/n) de Ker(i4jB). Ces n — k vecteurs correspondent à des vecteurs propres de AB associés à la valeur propre 0. Ainsi, les vecteurs /i,..., /&, fk+u • • • > fn forment une famille libre à n éléments de vecteurs propres de AB, donc une base de vecteurs propres de AB. La matrice AB est donc diagonalisable, ses valeurs propres étant Ai,..., Xk > 0 et 0. c) En désignant par || • || la norme euclidienne usuelle sur Cn, tout vecteur colonne X de Cn vérifie M \\Xf < \\AXf < \H\Xf et M?||X||2<||BX||2<^||X||2 donc A?M? Il^ll2 < A? \\BXf < \\ABXf < Xl \\BX\\2 < A^ W|2. {t) Si À est une valeur propre de AB, on a ||ABX||2 = |À|2 \\X\\2 (où X ^ 0 est un vecteur propre associé), ce qui entraîne avec (*) la relation \\fxi < |À| < Àn)Un, d'où le résultat puisque l'on a vu que À était réelle positive. Problème 11. Soient R,S,T G Mn(C) trois matrices hermitiennes positives telles que la matrice M = RST est hermitienne. Montrer que M est positive. Solution. Il y a certainement beaucoup de façons de procéder. Celle que nous décrivons se décompose en trois étapes, selon les propriétés vérifiées par la matrice T. Première étape. Supposons T définie. Alors T est la matrice d'un produit scalaire, de sorte qu'il existe P G É/4i(C) telle que T = P*P. Comme RST est hermitienne, on a facilement RST = TSR donc RSP*P = P*PSR d'où {P^RSP* = PSRP~1 ou encore R'S'= S'R' avec R' = {P*)~lRP~l et S' = PSP*. Ainsi, les matrices R' et S' commutent. Comme elles sont diagonalisables (car hermitiennes), on peut les diagonaliser dans une même base. De plus, leurs valeurs propres sont positives (R! et S' sont hermitiennes positives) donc les valeurs propres de R'S' sont positives. Ainsi, la matrice hermitienne R'S' est positive. Comme RST = P*(R'S')P est congrue à R'S', c'est aussi une matrice hermitienne positive. Deuxième étape. Supposons KerTnKeri? = {0}. Pour tout e > 0, la matrice T + eR est définie positive. En effet, elle est positive comme somme de matrices positives, et elle est définie car si X*(T + eR)X = 0, le fait que X*TX > 0 et X*RX > 0 entraîne X*TX = X*RX = 0, donc XeKerTnKer#={0}.
4. PROBLÈMES 279 On peut donc appliquer le résultat de la première étape à la matrice hermitienne RS(T + eR) = RST + sRSR. Ainsi, pour tout X e Cn, pour tout e > 0, X*RS(T + eR)X > 0 donc en passant à la limite lorsque e —> 0 on obtient X*RSTX > 0. Ceci est vrai pour tout X G Cn, donc RST est positive. Troisième étape. Il ne reste plus qu'à traiter le cas oùF = KerT n Ker R ^ {0}. Soit r tel que n - r = dim F. Soit (ei,..., en) une base orthonormale de Cn telle que F = Vect(er+i,..., en). Quitte à faire un changement de base orthonormale pour se ramener dans cette base, on voit que R=(* 0 o\ fSl 0 ' V 52 S*2 \ _. rr, ( TX et T = 0 0 0 avec Ri,Si,Ti G A4r(C) et Keri^i flKerTi = {0}. La matrice M = RST étant hermitienne, on a facilement M = -RiSlT* °\ M o | o ; ' où Ri,Si,T\ vérifient les mêmes propriétés que R,S,T dans la deuxième étape. La matrice RiS\Ti est donc positive, donc d'après (*) M est positive. Problème 12. Soit A = (a>i,j)i<i,j<n £ Mn(C) une matrice hermitienne, dont les valeurs propres sont notées Ai,..., An et numérotées telles que Ai > • • • > An. a) Pour tout entier k compris entre 1 et n, montrer k k EaM<EA*- (*) b) Lorsque k < n et A^ > A^+i, donner une condition nécessaire et suffisante sur la matrice A pour que l'inégalité (*) soit une égalité. Solution, a) Lorsque k = n, (*) est une égalité car Ya=i av = *rC^) = Ya=i ^*- Sinon on a k < n. Notons $ la forme hermitienne sur Cn dont A est la matrice dans la base canonique (ei,..., en) de Cn. Pour tout i G {1,... ,n}, on a a^ = $(ej). Soit (/i,..., /n) une base orthonormale de Cn, orthogonale pour la forme hermitienne $, et telle que Vt€{l,...,n}, Xi = *(/<)• On note P = {Pij)i<i,j<n € Mn(C) la matrice (unitaire) de passage de la base (/i,..., /„) à la base (ei,..., en), de sorte que e3- = Ya=i Pi,jfi pour tout,;'. Pour donner l'idée de ce qui suit, nous commençons par le cas k = 1 qui est facile. Il suffit d'écrire ai,i = *(ei) = J2 \PiM2*(fi) = È A< M2 < Ai (J2 \Pi,i\2) = Ai||ei||2 = Ai. 2=1 2=1 \Z=1 / Le cas général est plus délicat. On écrit k k k / n \ n ( k \ E";-; = E *(e;) = E E A< M2 = EM £ IwjI2 • (**) j=l j=l j=l \i=l / t=l \j=l / Si on pose \ii = Ylj=i \Pi,j\2> ^es Mi vérifient les propriétés suivantes TY k / TY \ k k 7X W Ew = Ê £k/ =£lMI2 = *. (») w = ËiKil2 <ËIp^I2 = 1 2=1 j=l \i=l / j=l j = l j=l (la dernière égalité résulte du fait que les vecteurs lignes de la matrice P forment également une base orthonormale). Ainsi, on a affaire à une pondération des (Xi)i<i<n à coefficients positifs et < 1, dont la somme des poids vaut k. La valeur maximale de cette pondération se produit lorsque
280 5. ESPACES EUCLIDIENS les poids sont les plus grands possibles pour les plus grandes valeurs possibles de Àt-, ce qui est précisément le résultat attendu. On démontre ceci en partant de l'égalité (**) qui entraîne k n k / n \ Xa™ = XXifj,i - XA^+Afe+i ( X ^ 1 • j=l i=\ i=\ \i=k+\ I L'assertion (ii) permet d'écrire chaque \i{ sous la forme /a* = 1 — ^ avec 7* > 0 pour 1 <i < k n / k \ k et d'après (i), ]P Hi = k- I X^f ) = 5Z^f" Finalement, i=k+l \i=l / i=l k k / k \ k k k J2 a3,3 ^ X Xi^ " ^ + Afe+J ( S7i ) = X! Xi + X)(Afe+! " A*)7* ~ X Xi- (***) b) Si (*) est une égalité, alors la dernière inégalité de (***) est une égalité, et compte tenu des hypothèses, ceci entraîne 7* = 0 pour 1 < i < k. Autrement dit, fi\ = ... = jik = 1 ce qui en vertu de l'assertion (ii) entraîne pij = 0 pour l<i<ketk + l<j<n. Ainsi, ej = Ya=i Pi,jfi G Vect(/i,..., fk) pour 1 < j < k, donc Vect(ei,..., ek) = Vect(/i,..., fk). Les bases (ei,...,en) et (/i,..., fn) étant orthogonales, on a alors Vect(efc+i,..., en) = Vect(/fc+i,..., fn). Il n'en faut pas plus pour conclure que A, matrice de $ dans la base (ei,..., en), se met sous la forme A = 0 A2 0 où les valeurs propres de Ai G Mk(C) sont Ai,..., Xk. k k Réciproquement, si la matrice A possède cette propriété, alors XaM = M-^i) — X Xi' i=l t=l Problème 13. Soit A = {a^j)i<iyj<n e Mn(^) une matrice symétrique définie positive. Montrer que la matrice B est définie positive, où B est définie par B= ( _Hl ,l + 3 J i<ij< <n Solution. On considère l'application A: %\}^Mn{R) t~A(t) = (ai,rti+i-1)1^n. Si on montre que A(t) est définie positive pour tout t G ]0,1[, alors d'après l'exercice 5 page 248, on aura prouvé que la matrice f A(t) dt=(f au t «-1 dt) = (£L\ = B JO \J0 J l<iyj<n \l "*" J / l<ij<n est définie positive. Or si t > 0 on a, pour tout vecteur colonne non nul X = ( : J l'égalité ( xi \ I txo 'XA^X = ^aijf+^XiXj = t -^aijixif-^ixjti-1) = t • CXtAXt), Xt = \ . \ tn~lxn J et comme A est définie positive, on en déduit tXA{t)X = t^XtAXt) > 0. Ainsi, A{t) est bien définie positive pour tout t > 0, d'où le résultat.
4. PROBLÈMES 281 Problème 14. Soit P e R[X] un polynôme de degré n > 1, dont on note (on)i<i<n les racines complexes. Pour tout A; G N, on note Sk = Ya=i aï e* on considère la matrice A = ( S0 Si -•• Sn-i \ Si S2 Sn \ Sn-i Sn • • • S2n-2 / On note q la forme quadratique dont A est la matrice dans la base canonique de Rn. Montrer que la signature de q est égale à (r + s, s) où r est le nombre de racines réelles distinctes de P et 2s le nombre de racines complexes non réelles distinctes de P. Solution. Notons (ei,..., en) la base canonique de Rn. On remarque tout d'abord que u=l / l<i,j<n l<i,j,k<n k=l \e=l Autrement dit, on peut écrire n VxGRn, q{x) = Y,f«k{x)2 où fe=i \i=\ / e=i Notons /?i,...,A- les racines réelles distinctes de P et mi,...,mr leur ordre de multiplicité respectives, et 71,71,... ,7s,7s les racines complexes non réelles distinctes de P, Tordre de multiplicité de 7i étant noté n;. On peut écrire r s V* G R", q(x) = Y^mkUk{x)2 + ^nfe(/7fc(x)2 + flk{x)2). fc=i fc=i Pour tout fc, 1 < k < s, notons u^ et ^ les parties réelles et imaginaires de /7Ac, de sorte que 7fc T <>7fc /7fc = ^fc + Wfc et /^ = uk- ivk. On a /* + té = 2u| - 2v\, donc finalement Vx G En, g(x) = X)mfe/^(x)2 + ^ïnk(uk{x? - vk{x)2). fe=i fc=i Ainsi, q s'écrit sous la forme de la somme de r + 5 carrés de formes linéaires sur Rn retranché à la somme de 5 carrés de formes linéaires sur Rn. Nous allons montrer que les formes linéaires en présence sont linéairement indépendantes, ce qui prouvera que la signature de q est (r + 5,5). Pour prouver que ces formes linéaires forment une famille libre dans (En)*, il revient au même de montrer que les matrices de ces formes linéaires sont linéairement indépendantes. Notons Ak = (l,/?fc,..., Pk~l) la matrice de fpk dans la base canonique de En, Uk celle de uk et Vk celle de vk. On a Uk+iVk = (1,7^,..., 7fc_1). Soit p = r+2s et considérons la matrice M G MPyn(R) dont les lignes sont constituées des matrices Ak) Uk et Vfc, ce que nous notons par commodité sous la forme M = L(Aiy..., i4r, C/i,..., C/s, Vi,..., Vs). Soit M' G MP(R) la matrice carrée extraite de M en ne conservant que les p premières colonnes. En notant A'k, U'k et Vk les matrices lignes constituées des p premiers coefficients de Ak, Uk et Vk, on a M1 = L(A[,..., A'r, [/{,..., t/J, V/,..., V^). Regardons M' comme une matrice complexe. Son rang est inchangé en ajoutant à une ligne une combinaison linéaire (à coefficients complexes) d'autres lignes, ou en multipliant une ligne par un scalaire non nul. Ainsi, M' a le même rang que la matrice N = L(A'1,...,A'r,U[+iV{,...}U,s+iV^Ui-iV{}...,U,s-iV:). Cette matrice est la matrice de Vandermonde V((3i>...,/?r>7i> • • • >7s>7i> • • • >7s)> et comme les $fc> les 7/. et 7fc sont distincts deux à deux, on en déduit que TV est inversible. Donc rg(M') = rg(N) = p, donc M' est inversible dans MP(C). Comme M' est une matrice réelle, son inverse est une matrice réelle, donc le rang de M' vu comme une matrice réelle est aussi égal à p. Ainsi, on en déduit rg(M) = p donc les formes linéaires fpk, uk et vk forment bien une famille libre, d'où le résultat.
282 5. ESPACES EUCLIDIENS Remarque. Les coefficients Sk sont les sommes de Newton des racines de P, et peuvent se calculer aisément à partir des coefficients de P grâce aux formules de Newton (voir l'exercice 3 page 80). Problème 15. Soient A, B e Mn(R) deux matrices réelles unitairement semblables, i.e. 3U e Mn{C), U unitaire, A = TBU. Montrer que A et B sont orthogonalement semblables, c'est-à-dire 3Q <E Mn(R), tt orthogonale, A = 'ftMl (Indication : montrer l'existence de P G </4(R) telle que A = P~lBP et lA = P~l lBP, puis considérer la décomposition polaire P = QS, avec Q, orthogonale et S symétrique — voir l'exercice 6 page 249.) Solution. Suivons l'indication et commençons par montrer l'existence d'une matrice réelle inversible P telle que PA = BP et PlA = lBP. Le principe ressemble à la solution de la question a) du problème 11 page 158 (c'est classique). On écrit la matrice unitaire U sous la forme U = Ui+iU2, où J7i, U2 G .M„(R). L'égalité A = TBU entraîne VA = BU etUlA = tBV', donc UiA = BUu U2A = BU2 et U1tA = tBUu U2tA = tBU2. (*) Le polynôme <p{X) = det(Ui + XU2) G R[X] ne s'annule pas puisque tp(i) = detU ^ 0, donc n'a qu'un nombre fini de racines. En choisissant x G R tel que ip(x) ^ 0, la matrice P = U\ + xU2 G Mn(R) est inversible et par linéarité, les égalités (*) donnent PA = BP et PtA = tBP. Nous considérons maintenant la décomposition polaire de P. Nous la retrouvons ici dans le cas des matrices réelles (l'exercice 6 page 249 traite le cas des matrices complexes). La matrice lPP est symétrique positive (c'est classique, la positivité provient de l'identité tX(tPP)X = t(PX)(PX) = ||PX||2), donc on peut trouver une matrice symétrique positive S G .Mn(R) telle que lPP = S2 (c'est également classique, il suffit de diagonaliser tPP dans une base orthonormée, voir l'exercice 1 page 245). Comme P est inversible, S l'est également et la matrice Q, = PS-1 vérifie lQQ = 5_1 (tPP)S~1 = In, donc est orthogonale. Ainsi, on a P = QS avec Q, orthogonale et S G Mn(R) symétrique définie positive. Achevons notre raisonnement. En prenant en compte la forme polaire de P, les égalités PA = BP et PtA = lBP entraînent respectivement A = p-1BP = S~ltQBQS et A = tPBtP~1 = S^BÙS'1. On en déduit SAS-1 = S-1 AS, donc S2 commute avec A. Nous allons montrer que cela entraîne le fait que S et A commutent. Pour cela, désignons par 0 < Ai < ... < Àr les valeurs propres de S et {Exi{S))i<i<r les sous-espaces propres associés. En diagonalisant 5, on s'aperçoit que S et S2 ont les mêmes sous-espaces propres : Exi(S) = EX2(S2). Maintenant, si a; G Ex^S), on a S2Ax = AS2x ce qui entraîne S2(Ax) = X2(Ax). On en déduit Ax G EX2(S2), donc Ax G Ex^S), donc SAx = \{Ax = ASx. Ainsi, A et S commutent sur chaque sous-espace propre de 5, donc sur Rn tout entier. En repartant de A = S'1 ^BQS, on en déduit AS = SA = tQBQS, donc A = tQBQ est orthogonalement semblable à B. Remarque. On montre de même que deux matrices symétriques réelles semblables sont orthogonalement semblables. Problème 16 (Hausdorffien d'une application linéaire en dimension finie). Soit E un espace hermitien de dimension finie n G N*.
4. PROBLÈMES 283 1/ Soit / G C(E). On définit le hausdorffien de / par "(/) = {^T I * « E x {0}} = {/(s) • x | ||*|| = 1}. a) Montrer que H(f) est convexe et compact. (Indication. Pour montrer que [£, 77] C #(/) si £,77 G #(/), on se l'amènera à montrer que [0,1] C H(g) où g = af + /3Id avec a et /? bien choisis. Puis on écrira g = u + iv, avec it et i> autoadjoints.) b) Si / se diagonalise dans une base orthonormale, déterminer H(f). 2/ Soit / G C(E) telle que tr/ = 0. Montrer l'existence d'une base B orthonormale de E dans laquelle la matrice de / ait tout ses termes diagonaux nuls. Solution. 1/ a) L'ensemble H(f) est compact car c'est l'image par l'application continue x i-> f(x) • x du compact {x G E, \\x\\ = 1}. Montrons que H(f) est convexe. Donnons nous x,y G E, \\x\\ = \\y\\ = 1 et posons £ = f(x)-x et 77 = f(y) • y. Il s'agit de montrer [£,77] C H(f). Si £ = 77 c'est terminé. Sinon, £ ^ 77, et on va se ramener sur [0,1]. Il existe deux nombres complexes a et fi tels que a£ + /? = 1 et m7 + /3 = 0. On pose g = âf + (3 Id^. On a K, 77] C H(f) *=* Vi G [0,1], tf + (1 - i)r? e #(/) 4=» V* € [0,1], 3* €E, 11*11 = 1, #+(!-*)»? = /(*)•* * V* e [0,1],3* G E, ||z|| = 1, t = a(*£+ (1 " *)!?)+£ = yW • « * [0,1]C #(<?). Montrons donc [0,1] C H (g). On sait que g(x) • x = 1 et g(y) - y = 0. Écrivons g = u + iv avec u et v autoadjoints (il suffit de prendre u = ^(g + g*) et v = |(gr* — g)). Quitte à multiplier x par À G C, |À| = 1, on peut supposer v(x) • y G i R. Par ailleurs g(x) • x = 1 = u(x) • x — û>(x) • x donc t>(x) • x = 0 (ceci car u et v étant autoadjoints, u(x) • x et t>(x) • x sont des nombres réels). On a de même v(y) • y = 0. Ceci étant, on pose h(t) = tx + (1 — i)y pour t G [0,1]. Comme £ = /(x) • x ^ /(y) • ?/ = 77, les vecteurs x et ?/ forment une famille libre. Ceci prouve que h(t) ^ 0 pour tout t G [0,1] et v[h(t)] • /i(i) = t2v(x) • x + t(l - t)[v(a:) • 2/ + v(x) • y] + (1 - i)2^) - j/ = 0 (car v(x) • y e ÏR). La fonction ,/, ■ m 11 _ r ,^ glft(01 ' MO *-[°>1l-,c tM ||ft(i)IP prend donc ses valeurs dans E. De plus ij) est continue, ip(0) = 0 et ip(l) = 1 donc d'après le théorème des valeurs intermédiaires, [0,1] C ip([0> 1]) C H (g), d'où le résultat. b) Soit (ei,..., en) une base orthonormale de vecteurs propres de /, associés aux valeurs propres Ai,..., Àn de /. Pour tout x = Ya=i xiei e E te^ Que INI = 1, on a /(x) • x = / f ^2 Xiei 1 • ^2 x^ = ]C M2**- \ i / i i Comme ^ \xi\2 = 1> on en conclue que H(f) est l'enveloppe convexe des À*. Dans le plan complexe, on peut aussi voir H(f) comme l'intérieur du polygone convexe dont les sommets sont les Yi. 2/ On procède par récurrence sur n = dimE". Pour n = 1, c'est évident. Supposons le résultat vrai au rang n — 1 et montrons le au rang n. Montrons déjà que 0 G H(f). Soit B = (ei,..., en) une base orthonormée et A la matrice de / dans cette base. Les termes de la diagonale principale a^ de A vérifient la relation ô^" = /(e^) -e*,
284 5. ESPACES EUCLIDIENS ce qui prouve que a^ G H(f) et H(f) étant convexe, -y/â^i = -tU = OeH(f). n '-^ n i Il existe donc un vecteur norme f\ tel que /(/i) • /i = 0. Notons F l'hyperplan {/î}1 et 9 = Pf° f\Fi ou Pf désigne la projection orthogonale sur F, de sorte que dans toute base B' de F, ( 0 [/](/!,£') = V x x X \ \9h ) On a donc tr # = 0, donc d'après l'hypothèse de récurrence, il existe une base B' orthonormale de F dans laquelle la matrice de g n'ait que des zéros sur la diagonale principale. Ainsi, la base B = (fi,Br) est une base orthonormale de E (car f\ G FL) et / 0 [f]B = \ X X X \ bh I ( ° X \ x X 0 X x > X 0 ) Remarque. On peut répondre à la partie 2/ sans utiliser la partie 1/ si on suppose / autoadjoint.
ANNEXE A Résolution des équations du troisième et du quatrième degré Cette annexe propose la résolution des équations du troisième et du quatrième degré. Deux techniques sont exposées, d'abord celles dues à Cardan (troisième degré) et Ferrari (quatrième degré), découvertes historiquement en premier, puis la méthode de Lagrange qui en un certain sens, est plus générale que les précédentes et offre un point de vue intéressant. 1. Introduction On se donne un polynôme F = a0 Xn + oi Xn~l H 1- an G K[X] (où K est un corps commutatif quelconque), tel que a0 ^ 0 et n > 1. On se propose de résoudre l'équation F(x) = 0. Quitte à diviser le polynôme F par oo, on peut supposer aç = 1. Enfin, en effectuant le changement de variable x = z — Oi/n, on se ramène au cas où le coefficient de Xn~l est nul. Finalement, on est amené à résoudre une équation de la forme zn + a2zn~2 + • • • + an_i2 + an = 0. Dans la suite, le corps de base K est le corps des nombres complexes C. 2. Techniques historiques 2.1. Méthode de Cardan pour la résolution de l'équation du troisième degré On veut résoudre l'équation z3 + pz + q = 0. Si on pose z = u + v, l'équation sera vérifiée si u3 + v3 + 3u2v + Suv2 +pu + pv + q = 0 = u3 + v3 + (u + v)(Suv + p) + q = 0. Ceci sera vérifié si on a f u3 + v3 = -q \ uv = —p/S c'est-à-dire si u3 + v3 = —q et u3v3 = —p3/27, les déterminations des racines cubiques de u et v étant choisies telles que uv = — p/S. En d'autres termes, il suffit que u3 et v3 soient racines de p3 z2 + qz — — = 0 avec uv = —p/S. (*) Si on note Z\,z2 les racines de cette équation du second degré, si u et v sont des racines cubiques de Z\ et z2 telles que uv = —p/S, les racines recherchées sont alors u + v, uj + vj2, uj2 + vj où j = e2™/3. Lorsque (p, g) 6 R2, le nombre de racines réelles de l'équation z3 + pz + q = 0 peut être discuté. Celui-ci dépend du signe du discriminant de l'équation du second degré (*), qui est du signe de 4p3 + 27g2. On montre facilement que (i) Si Ap3 + 27g2 > 0, il y a une racine réelle et deux racines complexes conjuguées. (ii) Si Ap3 + 21 q2 = 0, il y a une racine triple 0 si q = 0, une racine réelle double et une réelle simple si q ^ 0. (iii) Si Ap3 + 27g2 < 0, il y a trois racines réelles.
286 A. RÉSOLUTION DES ÉQUATIONS DU TROISIÈME ET DU QUATRIÈME DEGRÉ Ce dernier résultat est à rapprocher de celui de l'exercice 2 de la page 79. 2.2. Méthode de Ferrari pour la résolution de l'équation du quatrième degré On se donne F = z4 + az2 + bz 4- c et on veut résoudre F(z) = 0. Pour cela, on recherche A, p et g tels que F{z) = (z2 4- À)2 — (pz + q)2. Ceci sera réalisé si et seulement si le polynôme (z2 + A)2 - F(z) = (2A - a) z2 - bz + (A2 - c) (**) est un carré parfait, autrement dit si et seulement si le discriminant de (**) est nul, ce qui s'écrit A = b2 - 4(A2 - c)(2A - a) = -8A3 + 4oA2 + 8Ac + b2 - 4ac = 0. Cette dernière équation peut être résolue grâce à la méthode de Cardan. Si A désigne l'une quelconque de ses solutions, il est maintenant facile de trouver p et q puis de résoudre {z2 + A)2 - (pz + q)2 = 0. 3. Méthode de Lagrange On doit à Lagrange une ingénieuse idée de résolution des équations. Pour résoudre F(z) = 0 où F est de degré d, l'idée de Lagrange est la suivante. Notons ai,... ,ad les racines de F. Si on trouve un polynôme P en les c^ qui ne prend que d—l valeurs par toute permutation sur les c^, on saura (grâce aux formules donnant les coefficients d'un polynôme en fonction de ses racines, et compte tenu du fait que tout polynôme symétrique peut s'exprimer au moyen seulement des polynômes symétriques élémentaires) trouver un polynôme de degré d—l qui annule les d — 1 valeurs prises par P sur les on. On est ainsi ramené à un polynôme de degré inférieur. Ce principe encore un peu vague va prendre tout son sens dans les parties qui suivent. 3.1. L'équation du troisième degré Notons a, /?, 7 les racines de F = z3 + pz + q. Le polynôme (X +jY + j2Z)3 ne prend que deux valeurs par toutes les permutations effectuées sur a, p, 7, qui sont A = (a + jp + j27)3 et B = [a + j7 + j2(3f. Compte tenu du théorème 1 de la page 60, on a ax = a + p + 7 = 0, 02 = cap + /?7 + 7a = p, cr3 = a/?7 = -q. Un calcul donne A + B = 2(a3 + P3 + 73) - 3(a2P + p2^ + 72a + a27 + p2a + 72/?) + 12a/?7 = 2(a-i - 3cricr2 + 3<73) - 3(<7icr2 - 3a3) + 12cr3 = -27g et AB = (a2 + p2 + i2-aP-P^- 7a)3 = (a2 - 2a2 - a2f = -27p3. Ainsi, A et B sont trouvées simplement comme solutions de z2 + 27qz-27p3 = 0. (***) Si on note u (resp. v) une racine cubique de A (resp. de B), les déterminations étant choisies telles que uv = (a + jp + j27) (a + j'y + j2p) = —3p, on s'est ramené à résoudre le système û:+/?+7=0 ( a = | (u + v) a + jP + j2l = u dont les solutions sont < P = | (uj2 + vj) • » + 31 + fP = v [l = 3 (UJ + v32)
3. MÉTHODE DE LAGRANGE 287 Noter que le test du nombre de racines réelles s'effectue simplement grâce au discriminant de l'équation (***) qui est 27(4p3 + 27g2). 3.2. L'équation du quatrième degré On note a, /?, 7,6 les racines de F = z4 + az2 + bz + c. Le polynôme XY + ZT ne prend que trois valeurs par toutes les permutations effectuées sur a, /?, 7, <5, qui sont A = a/3 + 7<5, 5 = cry + #5, C = a<5 + £7. Ici, les fonctions symétriques des racines de F valent respectivement ai = 0, a2 = a, <73 = — 6 et 0-4 = c. Les calculs qui suivent sont légèrement plus simples que ceux de la partie précédente. A + B + C = a2 = a, AB + BC + CA = <7i<j3 - 4<j4 = -4c et ABC = (a\ - 2a2)a4 + a\ - 2a2aA = b2 - 4ac. Ainsi A, B et C sont obtenus comme solutions de l'équation z3 - az2 - Acz - b2 + 4ac = 0, que l'on sait désormais résoudre. Si on note u,v,w ses racines, on est ramené à résoudre le système a + /? + 7 + (5 =0 ( a + /? + 7 + <5 = 0 ap + 7(5 = u éauivaut à J (<* + /?) (7 + *) = v + ti; <*7 + /W = v qm eclulvaut a S (a + ô)(p + i) = u + v • a<5 + /?7 = w [ (a + 7)(/? + £) = u + w à l'aide de deux premières équations de ce dernier système, on trouve a + (3 = pi et 7 + <5 = —pi, où pi = \/—v — w, de même avec la première et la troisième équation a + ô = p2 et /? + 7 = -p2, où p2 = yj—u — v et avec la première et la dernière équation, a + 7 = p3 et (3 + 5 = -p3, où p3 = \/-u - w. Pour qu'il y ait équivalence entre ces trois dernières assertions et le système précédent, il faut et il suffit que les déterminations des racines carrées pi,p2, pz soient choisies de sorte que p\p2pz = —b, compte tenu du fait que (a + 0)(a + 7) (a + S) = a(a + (3 + 7 + S) + a3 = -b. Maintenant, on en déduit facilement que les solutions sont <*= ^(Pi+^+Ps), P = -j[p\-p2-pz), 7 = ^(~Pi-p2-\-p3), S= -(-P1+P2-P3).
288 A. RÉSOLUTION DES ÉQUATIONS DU TROISIÈME ET DU QUATRIÈME DEGRÉ 3.3. L'équation du cinquième degré ? L'approche de Lagrange est une technique très efficace pour abaisser le degré d'une équation. Il est naturel de chercher à l'appliquer sur l'équation générale de degré cinq. La difficulté est ici de trouver un polynôme de cinq variables qui ne prend que quatre valeurs par toute permutation de ses variables. En fait, un tel polynôme n'existe pas. Nous allons prouver ce résultat. Pour tout polynôme P G C[Xi, X2, X3, X4, X5], pour toute permutation a G «S5, on note P<r = P(Xa(i), Xa(2), ^<r(3) » ^cr(4), ^ct(5)) Supposons que P G C[Xi, X2, X3, Xt, X5] soit tel que l'ensemble T = {Pa | a G <S5} vérifie Card(r) = 4. Le groupe des permutations <S5 opère sur T par le biais de la fonction S5xT-^r (<t,Q)»Q*. D'après le théorème 7 de la page 22, le stabilisateur H = {a G <S5 | Pa = P} de P est un sous-groupe de <S5 d'indice 4 dans S$ (puisque par construction, l'orbite de P est T tout entier, de cardinal 4). D'après l'exercice 8 de la page 25 ceci est impossible, d'où le résultat. Cette démonstration ne prouve pas qu'il est impossible de "résoudre" par des formules générales l'équation de degré cinq, mais elle montre simplement que la méthode de Lagrange ne s'applique pas. C'est Abel qui le premier montra que des formules générales pour les solutions de l'équation de degré cinq n'existent pas. Galois compléta quelques années plus tard ce résultat en donnant une condition nécessaire et suffisante sur un polynôme pour qu'il soit résoluble par radicaux (en termes intuitifs, on dit qu'une équation est résoluble par radicaux si ses solutions peuvent s'exprimer au moyen de "radicaux emboités les uns dans les autres").
ANNEXE B Invariants de similitude d'un endomorphisme et réduction de Frobenius Cette annexe présente la théorie des invariants de similitude des endomorphismes en dimension finie. Cette notion est assez éloignée de l'esprit du programme de mathématiques spéciales, et c'est plus à titre de curiosité qu'elle est présentée. Comme nous allons le voir, elle propose un cadre agréable de réduction des endomorphismes qui permet une caractérisation simple de la classe des matrices semblables à une matrice donnée. En première lecture, les démonstrations des résultats énoncés peuvent être sautées. Dans toute l'annexe, E désigne un espace vectoriel sur un corps commutatif K de dimension finie n. 1. Introduction On se donne un endomorphisme / G C(E). Nous commençons par donner quelques rappels des résultats de l'exercice 3 de la page 178. Notation. On note 11/ le polynôme minimal de /, et £/ l'ensemble {P(f) \ P € K[X]}. Si x G E, on note Px le polynôme unitaire engendrant l'idéal {P G K[X] \ P(f)(x) = 0} et Ex l'ensemble {P(f)(x) \ P G K[X}}. Proposition 1. Si k = deg(II/), l'ensemble Cf est un s.e.y de C(E) de dimension k, dont une base est (Id#, /,..., fk~1)- Si t = deg(Pa;), l'ensemble Ex est un s.e.v de E de dimension £, dont une base est (x,...,f-l(x)). Démonstration. L'application K[X] —> C(E) P i-> P(f) est linéaire. Son image est £/, c'est donc un s.e.v, et son noyau est {P G K[X] \ P(f) = 0} = (II/). Ainsi, Cf est isomorphe à ik—1 K[X]/(Uf). Ce dernier étant de dimension k dont une base est (1,-X",... ,X ) (voir la théorème 4 de la page 61) on en déduit par isomorphisme la première partie de la proposition. La seconde partie se traite de manière analogue en considérant l'application K[X] —> E P i-> P(f)(x). □ La propriété qui suit est cruciale dans la suite de cette annexe (elle est prouvée dans l'exercice 3 page 178). Proposition 2. // existe x e E tel que Px = Uf. Endomorphismes cycliques. Définition 1. On dit que / est cyclique s'il existe x G E tel que Ex = E. D'après les propositions précédentes, ceci équivaut à dire que deg(II/) = n (ou encore que 11/ = (-l)nP/ où Pf désigne le polynôme caractéristique de /).
290 B. INVARIANTS DE SIMILITUDE D'UN ENDOMORPHISME ET RÉDUCTION DE FROBENIUS DÉFINITION 2. Soit P = Xp+ap-iXp~l-\ ha0 G K[X). On appelle matrice compagnon de P la matrice C(P) = / 0 0 -a0 \ 10 : -oi o i ••. ; ; G MP(K). : '•. '*. 0 -op_2 V 0 • • • 0 1 -ap_! / Nous avons déjà rencontré les matrices compagnons lors de la seconde démonstration du théorème de Cayley-Hamilton, et nous avions montré que le polynôme caractéristique de C(P) est (-1)PP. Proposition 3. Soit f G C(E) un endomorphisme cyclique. Il existe une base de E dans laquelle la matrice de f soit égale à C(II/). Démonstration. Comme / est cyclique, il existe x G E tel que Ex = E. On sait alors que (x,/(x),.. .,/n_1(a;)) est une base de E, et dans cette base, la matrice de / est C(II/) (si 11/ = Xn + an-\Xn~l + • • • + oo, l'image du dernier vecteur fn~l(x) de la base par / vaut fn(x) = -an-if»-1^) a0x car Uf(f)(x) =0). □ 2. Invariants de similitude Le théorème qui suit est le point central de notre discussion. Théorème 1. Soit f G C(E). Il existe une suite Fi} F2,..., Fr de s.e.v de E, tous stables par f, telle que (i) E = Fl®F2®---®Fr, (ii) pour tout i G {1,... ,r}, la restriction fi = /|p. de l'endomorphisme f au s.e.v Fi est un endomorphisme de Fi cyclique, (iii) si Pi désigne le polynôme minimal de fi, on a Pi+\ \ Pi pour tout iG {l,...,r-l}. La suite de polynômes Pi,..., Pr ne dépend que de f et non du choix de la décomposition. On l'appelle suite des invariants de similitude de f. Démonstration. Existence. Soit k = deg(II/) et soit x G E tel que Px = II/. Le s.e.v F = Ex est de dimension k et il est stable par /. Comme deg(Px) = k, la famille de vecteurs ei=x, e2 = /(«),••• , ek = fk~l(x) forme une base de F = Ex. Complétons cette base en une base (ei,..., en) de E. En désignant par (ej,..., e* ) la base duale associée, on note G = T° où r = {tfi(e*k)\ieN} = {e*kof\ ieN} (orthogonal vis-à-vis du dual). En d'autres termes, G est l'ensemble des x e E tels que la fc-ième coordonnée de P(x) (dans la base (ei,..., en)) soit nulle pour tout i. L'ensemble G est un s.e.v de £", et il est stable par / comme on le vérifie facilement. Nous allons montrer F 0 G = Ey et pour cela, nous prouvons successivement F n G = {0} et dim F + dim G = n. Soit y e F n G. Si y ^ 0, on peut écrire y = a\ e\ H + ap ep avec ap ^ 0 et p < k. En composant par lfk~p(el) = e\ o fk~p) on obtient 0 = e*k(ai ek-p+i H hapefc) = ap, ce qui est absurde. Donc F D G = {0}. Comme G = (VectT)0, pour montrer dim G = n — dim F = n — fc, il suffit de prouver dim(Vect F) = k. Pour cela, on considère l'application linéaire <p : Cf = {P(f) | P e K[X}} -> Vectr g~e*kog.
2. INVARIANTS DE SIMILITUDE 291 Par définition de VectF, tp est surjective. De plus, ip est injective. En effet, si e\ o g = 0 avec g ^ 0, on peut écrire g = a\ \&e H \-ap fp~l G £/ (avec p < k et ap ^ 0) et 0 = e% o g(fk-p(x)) = el{axfk-p{x) + • • • + apfk~\x)) = ej(ai efe_p+i + • • • + ap ek) = ap, ce qui est absurde. Finalement, ip est un isomorphisme donc dim(Vectr) = dim£/ = k. Résumons. Nous avons trouvé un sous-espace G stable par / tel que F (&G = E. Notons Pi le polynôme minimal de f\p} (qui est le polynôme minimal de / car Px = Px = II/), et P2 le polynôme minimal de /[£. Comme G est stable par /, P2 \ P\. On applique ce qui précède à /|g, et au bout d'un nombre fini d'étapes, on obtient la décomposition voulue. Unicité. Supposons l'existence de deux suites de sous-espaces Fi,..., Fr et Gi,..., Gs tous stables par / et vérifiant les conditions (i), (ii) et (iii). Notons Pi = II/|F et Qj = Uf.G . On voit que Pi = 11/ = Q\. Supposons la liste (Pi,...,Pr) différente de (Qi,...,Qs) et notons j le premier indice tel que Pj ^ Qj (un tel indice existe toujours même si r ^ s, car J^.deg(Pi) = n = ^deg(Qj)). L'égalité E = Fi © • • • © Fr avec les Fi stables par /, et la propriété Pj(f)(Fk) = 0 pour k > j, entraînent Pj(f)(E) = Pi(/)(F1) e • • ..e PjimFj^) (*) et par ailleurs l'égalité E = G\ 0 • • • 0 Gs avec les Gj stables par / entraîne Pjtf)(E) = PjtfXG!) 0 • • • 0 PjtfKGj-!) 0 PjifXGj) 0 • • • 0 Pj(f)(Gs) (**) On a dimPj(f)(Fi) = dimPj(f)(Gi) pour 1 < i < j — 1 (en effet, d'après la proposition 3, on peut trouver une base B{ de Fi et une base B\ de Gi telles que la matrice de f\p. dans Bi coïncide avec la matrice de f\Q. dans B^). En prenant les dimensions dans (*) et (**), on en déduit 0 = dim PjifXGj) = ■■■ = dimP^/NGJ, ce qui prouve que Qj | Pj. Par symétrie de rôle , on a aussi Pj \ Qj, donc Pj = Qj ce qui est absurde. Finalement, on doit avoir r = s et Pi = Qi pour tout i. □ Théorème 2 (Réduction de Frobenius). SiPi,...,Pr désigne la suite des invariants de similitude de f G C{E), il existe une base B de E telle que 0 C(Pr) On a d'ailleurs P\ = 11/ et Pi • • • Pr est le polynôme caractéristique de f (au facteur (—l)n près). Démonstration. Il suffit pour tout i de considérer une base Bi de Fi dans laquelle la matrice de fi = f\p{ est C(Pi) (ce qui est possible d'après la proposition 3), puis d'écrire la matrice de / dans la base B = (i?i,..., Br). □ Comme pour les matrices, on dit que deux endomorphismes /, g G £>{E) sont semblables s'il existe h G Q£(E) tel que / = hrlgh. Muni de cette définition, on a le résultat suivant. Corollaire 1. Deux endomorphismes f et g e. C(E) sont semblables si et seulement s'ils ont les mêmes invariants de similitude. Démonstration. Si f et g sont semblables, on montre facilement en reprenant la preuve de l'unicité dans le théorème 1 que f et g ont les mêmes invariants de similitude. Réciproquement, si / et g ont les mêmes invariants de similitude, le théorème précédent assure l'existence de deux bases B et Bf de E telles que [/]# = [#]#' ce qui signifie que f et g sont semblables. □
292 B. INVARIANTS DE SIMILITUDE D'UN ENDOMORPHISME ET RÉDUCTION DE FROBENIUS 3. Applications 3.1. Réduction de Jordan Une fois que l'on sait réduire un endomorphisme nilpotent sous forme de Jordan, il n'est pas difficile de trouver la réduction de Jordan d'un endomorphisme quelconque (voir le théorème 5, page 199). Comme nous allons le voir, cette première tâche peut être réalisée au moyen de la théorie des invariants de similitude. Soit / G C(E) un endomorphisme nilpotent. Désignons par Pi,...,Pr la suite des invariants de similitude de /. Le produit Pi • • • Pr est au signe près le polynôme caractéristique de /, qui est (—l)nXn, ce qui montre que Pi est de la forme Xni pour tout i. Ainsi, C(Pi) est la transposée d'un bloc de Jordan pour tout i, et on en déduit avec le théorème 2 l'existence d'une base B = (ei,..., en) de E dans laquelle la matrice de / est de la forme / 0 0 \ Vl ou Vt€{l,...,n-1}, vfe{0,l}. \ 0 vn-x 0 / La matrice de / dans la base B' = (en,..., e{) est / 0 Vn-i 0 \ \0 Vl 0 / qui a bien la forme voulue. 3.2. Autres applications Il existe une multitude de résultats qui peuvent être prouvés grâce à la théorie des invariants de similitude. Par exemple : - Dans Mn(M) (n = 2 ou n = 3), deux matrices sont semblables si et seulement si elles ont même polynôme minimal et même polynôme caractéristique (ce résultat est faux dès que n > 4). - Si L est un surcorps commutatif de K, si A, B G Mn(K) sont semblables sur Mn(h), alors A et B sont semblables sur Mn(K). En effet, en vertu de l'unicité, les invariants de similitude dans MnÇ^) sont les invariants de similitude dans Mn{^) (car de plus, le polynôme minimal d'une matrice de Mn(K) est le même dans K[X] ou dans L[X]). Ce résultat généralise celui de l'exercice 11 de la page 158. - Si / G C(E) et si les seuls endomorphismes commutant avec / sont des polynômes en /, alors / est cyclique. En effet, si tel n'est pas le cas, on a deg(II/) < n donc le nombre r d'invariants de similitude de / vérifie r > 2. Avec les notations du théorème 1, on peut écrire E = Fi © G où G = F2 0 • • • 0 Fr ^ {0}. Si on note p la projection sur G parallèlement à Fi, p et / commutent (car Fi et G sont stables par /). Si on avait p = Q(f) avec Q G K[X], comme p\Fl = 0 on en déduirait Q(f\Fi) = 0, donc 11/ = II/|F divise Q, et donc p = Q(f) = 0, ce qui est absurde. Ceci constitue la réciproque de la question 2/ de l'exercice 6 de la page 181.
ANNEXE C Fractions continues Nous proposons ici une introduction aux fractions continues, qui décrivent un moyen simple de générer les meilleurs approximants fractionnaires d'un nombre réel irrationnel. Dans une deuxième partie, nous caractérisons les fractions continues périodiques. Problème 1 (Fractions continues). Étant donnée une suite réelle (an), avec an > 0 pour n > 0, on appelle fraction continue l'expression [ao, ai,..., an] = ao H . ai + a2 4- 1 * + 1 De manière équivalente, on définit les fractions continues par [ao] = ao, [ao, ai] = ao + l/ai et par la récurrence Vn > 2, [ao,.. .,an] = 1 ao,..., an_2, an_i H (*) 1/ (Développement en fraction continue d'un nombre irrationnel). Soit f un nombre réel irrationnel. Partant de £o = £, on définit les suites (an) et (£n) par la relation de récurrence Vn G N, an = [£n], £n+i = ———, où pour tout x G K, [x] désigne la partie entière de x. La valeur an s'appelle quotient incomplet d'indice n, et £n le quotient complet d'indice n. a) Montrer que les suites (an) et (£n) sont bien définies, que an > 0 et £n > 0 pour tout n G N* et que de plus Vn G N*, f = [a0,...,On-uÇn]- b) On définit les suites (pn) et (qn) par PO = «0, Pi = «1^0 + !> Pn = ÛnPn-l + Pn-2, <70 = 1> 9l = Gl, 9n = ÛnÇn-1 + <7n-2- Montrer que w ^ n w ^ n r 1 Vn-\X + Pn-2 Vn>2,Va:>0, [ao,... ,an_i,a:J = . qn-\x 4- gn-2 c) Montrer que les valeurs [ao,..., an] (appelées réduites de £) vérifient Vn G N, [a0, ...,an] = —. d) Montrer que pour tout n G N*, on a la relation pnqn-\ — Pn-iQn = (—l)n_1. e) Montrer que pour tout n G N, pn/qn est une fraction irréductible.
294 C. FRACTIONS CONTINUES f ) Montrer VnGN*, £--= ( 1)n Qn Qn ( Qn-1 + Qn£n+1 ) En déduire que les réduites pn/qn sont des approximations fractionnaires de £ qui vérifient qn 1 g) Montrer que sur deux réduites consécutives, il en existe une qui vérifie t_Pn qn 1 < 2<g h) Montrer que pour tout n G N* on a V(p,g)GZ2,0<ç<tfn, \qÇ-p\> \qnÇ-Pn\- On dit alors que la réduite pn/qn est une meilleure approximation fractionnaire de £. 2/ (Fractions continues périodiques). On rappelle qu'un nombre £ G M est quadratique s'il est racine d'un polynôme de degré 2 à coefficients entiers et irréductible dans Q[X). a) Montrer qu'un nombre quadratique est irrationnel. b) Soit £ G M un nombre irrationnel et (an) et (£n) les suites de quotients incomplets et complets associés au développement en fraction continue de £. Montrer que le développement en fractions continues de £ est périodique à partir d'un certain rang (c'est-à-dire qu'il existe T G N* et r G N tel que ak+r = &k pour tout k > r) si et seulement s'il existe T G N* et r G N tels que £r = £r+T. c) Montrer que si le développement en fraction continue d'un nombre irrationnel £ G R est périodique à partir d'un certain rang, alors £ est quadratique. d) Soit £ G R quadratique et Q = aX2 +/3I + 7G Z[X] (a ^ 0) tel que Q(£) = 0. (i) Montrer que le quotient partiel £n d'indice n est racine du polynôme Qn(X) = (*_,* + qn-2?Q (P^X+J>n-2 \qn-\X +qn-2 (où pn et qn sont les entiers définis en 1/b) associés au développement en fraction continue de £). Montrer que Qn et Q ont même discriminant, puis montrer que les polynômes Qn sont en nombre fini. (ii) Montrer que le développement en fraction continue de £ est périodique à partir d'un certain rang. Solution. 1/ a) L'existence des suites (on) et (£n) revient à montrer que £n — an ne s'annule jamais. Ceci découle du fait que £n est un nombre irrationnel, propriété que l'on obtient immédiatement par récurrence sur n. On a bien an > 0 et £n > 0 pour tout n G N* car comme on_i est la partie entière du nombre irrationnel £n-i, on a 0 < £n-i - an_i < 1 donc £n = l/(£n-i - an-i) > 1 et donc an = [£n] > 1- Il reste à démontrer l'égalité £ = [oo,... ,an-i,Çn]- Nous procédons par récurrence sur n. Pour n = 1, c'est vrai car [o0,£i] = a0 + — = a0 + (£0 - oo) = £o = £• Ci Supposons maintenant le résultat vrai au rang n, de sorte que £ = [ao,... ,an_i,£n]. Comme £n+i = l/(£n - on), on a $„ = an + l/£n+i, et en appliquant (*), on obtient £ = [ao,... ,art_i,an + l/£n+i] = [ao,- •• >an_i,an,£n+i] ce qui est précisément le résultat souhaité au rang n + 1.
C. FRACTIONS CONTINUES 295 b) On procède par récurrence sur n > 2. Pour n = 2 le résultat est vrai car V# > 0, [oq,ai,x] = ao + 1 = a0 + - x aoaix + ao + x p\x + po ai + 1/x " ' aix + 1 aix + 1 q\x + <?o Supposons maintenant le résultat vrai au rang n et montrons le au rang n+ 1. En appliquant la propriété au rang n on obtient pour tout x > 0 1 ao,... ,an_i,an H— x (an + l/x)pn-i + pn-2 (anX + l)pn-l + Pn-2% Pn% + Pn-1 (an + l/x)qn-i + gn_2 (ana; + l)qn-i + <?n_2z OnZ + qn-\ Le premier membre de cette expression est égal à [ao,..., an, x], le résultat est donc bien démontré au rang n + 1. c) Le résultat pour n = 0 et n = 1 est immédiat compte tenu de la définition de po,qo et pi,qi. Pour n > 2, il suffit d'appliquer le résultat de la question précédente a x — Q'Ti* d) Lorsque n = 1, le résultat découle de l'égalité piqo — poqi = (aoai + 1) — aoai = 1 et lorsque n > 2 c'est une conséquence de la relation PnQn-l -Pn-lQn = {a>nPn-l + Pn-2)Qn-l ~ Pn-\{o>nQn-\ + Qn-2) = -(Pn-lQn-2 -Pn-2Qn-l)- e) Les valeurs an sont entières (ce sont des parties entières), donc pn et qn sont des entiers. Pour n = 0, <?o = 1 donc po/qo est bien une fraction irréductible et pour n > 1, la relation PnQn-i — QnPn-i = (—l)n_1 montre que pn et qn sont premiers entre eux (théorème de Bezout), d'où le résultat. f) Les résultats des questions 1/a) et b) entraînent Pn m = [ao,... ,an,£n+i] Pn Qn PnÇn+1 +Pn-1 QnÇn+1 + Qn-1 Pn Qn QnPn-1 - PnQn-l ("l)n donc d'après le résultat de la question d) t __Pn = Qn(Pn£n+l + Pn-l) - Pn{QnÇn+l + Qn-l) = = Qn Qn (qn£n+1 + Qn-1 ) Qn (Qn£n+1 + Qn-1 ) Qn (Qn£n+1 + Qn-1 ) Comme £n+i > 1 (on Ta vu dans la solution de la question 1/a)), ceci entraîne |£— pn/Qn\ < 1/Qn- g) Soit n G N. Le résultat de la question précédente montre que ^ — PnJQn et £ — pn+i/Qn+i sont de signe contraire, donc e Pn Qn + É- Pn+1 Qn+1 Pn Qn Pn+l Qn+1 1 < 1 QnQn+1 2q2 + 1 2^+1 (la dernière inégalité est une conséquence de l'inégalité 2xy = x2 + y2 — (x — y)2 < x2+y2 lorsque x ¥" 2/> appliquée à x = l/qn et y = l/qn+i) ce qui entraîne le résultat voulu. h) Raisonnons par l'absurde, en supposant \q£ — p\ < \qnÇ — pn\ avec 0 < q < qn et n > 0. Comme pn+iQn —PnQn+i = (—l)n (d'après 1/d)), il existe deux nombres entiers x et y tels que P = Wn + yPn+u Q = xqn + yqn+v On a forcément x ^ 0 (sinon q = yqn+i > Qn car n > 0, ce qui est contraire aux hypothèses), et y ^ 0 (sinon |ç£ — p| = \x\ • |#n£ — pn| > \qnÇ — pn|, ce qui est contraire aux hypothèses). On doit également avoir x et y de signe opposé, sinon on aurait \q\ > \qn\ + \qn+i\ > tfn- De plus d'après 1/f), les valeurs qnf; — pn et qn+i£> — Pn+l ont des signes opposés, donc x(qnÇ — pn) et 2/(tfn+i£ ~Pn+i) sont de même signe. Comme q£-p = x(qnÇ - pn) + 2/(tfn+i£ - Pn+l) ceci entraîne Ité - P\ = \x(Qn£ - Pn)\ + |î/fan+l£ - Pn+l)| > M^nÉ " Pn)| > |«n^ - Pn\- Cette inégalité est une contradiction, ce qui prouve le résultat. 2/a) Soit £ G E un nombre quadratique et un polynôme Q G Z[X] de degré 2, irréductible dans Q[X], tel que Q(£) = 0. Si £ G E était rationnel, alors Q ne serait pas irréductible dans Q[X] (il serait divisible par X — £), ce qui est absurde. (De manière équivalente, on montre facilement
296 C. FRACTIONS CONTINUES que les nombres quadratiques sont ceux de la forme A+g D où A, By D G Z, avec B ^ 0 et D un entier naturel qui n'est pas un carré.) b) Compte tenu des formules permettant d'obtenir les quotients incomplets et complets d'un nombre irrationnel, il est immédiat que le quotient incomplet de £& d'indice n est égal à an+k. Ainsi, si £r = £r+T> l'égalité des quotients incomplets d'indice n de ces deux nombres entraîne an+r = an+r+T pour tout n G N, c'est-à-dire ak = ak+r pour tout k > r. Réciproquement, si aie = cik+T pour tout k > r, alors tous les quotients incomplets de £r et £r+T sont égaux, donc les réduites de £r et Çr+T sont égales. Comme un nombre irrationnel est égal à la limite de ses réduites (conséquence du résultat de la question 1/f)), ceci entraîne £r = £r+T- c) Soit r G N et T G N* tels que les quotients incomplets £r et Çr+r de £ soient égaux. Posons s = r + T. Les quotients complets et incomplets d'indice n de £r sont ceux de £ d'indice n + r, donc d'après 1/a) on peut écrire £r = [ar,... ,as-i,£s]. Par ailleurs, le résultat de la question 1/b) appliqué au développement en fraction continue de £r permet d'écrire £r = [ar,...,as_i,£s] = 8 , kT-i,kT-2jT-i>h-2 G N* (où hn/£n désigne la n-ième réduite de £r). Comme £r = £s cette égalité entraîne *t-i& + (*r-2 - fcr-iKr - fcr-2 = Q«r) = 0, Q = Ht-xX2 + (*r-2 - kT-i)X - /cT_2. Le polynôme Q est à coefficients entiers et de degré 2, il est forcément irréductible car £r est irrationnel. Ainsi, £r est un nombre quadratique. Maintenant, la question 1/b) nous assure qu'à partir des réduites pn/Qn de £, on peut écrire i = Pr-lHr+Pr-2 ^ fr=-*-rf+J*-2 Ceci entraîne que Qr-lÇr + Qr-2 Qr-l£ ~ Pr-1 r> ( v \2^ l—Qr-2X + pr-2 R= {qr-iX -Pr-lYQ ' qr-\X -Pr-i ) annule £. Or R est un polynôme à coefficients entiers de degré 2 (son coefficient dominant q^_iQ(qr-2/qr-i) est non nul car Q n'a pas de racine rationnelle), et comme £ est irrationnel, R est forcément irréductible. Ainsi, £ est bien quadratique. d) (i) Un calcul montre que l'on peut écrire Qn = a(Pn-lX+pn-2)2+P{Pn-lX+Pn-2){qn-\X^ = anX2+pnX+Jn où an, fin et 7n sont trois entiers, avec an = qn-iQ(Pn-i/qn-i)- Comme Q n'a pas de racine rationnelle, ceci entraîne an ^ 0 donc Qn est bien un polynôme de degré 2 à coefficients entiers. Comme Q(£) = 0, la formule £ = gnllfn+çfa-2 (v0*r */**)) montre que £n est bien racine de Qn- Montrons que le discriminant An de Qn est égal au discriminant A de Q. Plutôt que de calculer explicitement an, fin et 7n et de développer directement l'expression fi\ — 4an7n (les calculs sont lourds), on va utiliser le fait que le discriminant d'un polynôme de degré 2 est égal au carré de la différence de ses racines, multiplié par le carré de son coefficient dominant. Ainsi, si £' désigne la deuxième racine de Q de sorte que Q = a(X — Ç)(X — £'), on a A = a2(£ — £')2- Les deux racines de Qn étant £n = ~q"~**-p„~* et & = ~qn-$-Pn-\ ? et comme ^e P^us an = ql-lQ(Pn-l/qn-l) = a(pn-l ~ Qn-lOiPn-l ~ 4n-l£')> On a A lit d \2 2/ c\2,„ âr\2 f ~Qn-2^ + Pn-2 -Qn-2^' + Pn-2\ \ Qn-lÇ - Pn-1 tfn-lÇ ~ Pn-1 J = a2 ({qn-2Ç - Pn-2)(qn-iÇ' ~ Pn-i) - {qn-2? - Pn-2)(qn-iÇ - Pn-i)) = a2 ({-qn-2Pn-l +Pn-2qn-l)Ç - {-qn-2Pn-l +Pn-29n-l)0 = a2(pn-iqn-2 - Pn-2qn-i)2{Ç - ^')2 et comme pn-iqn-2 -Pn-2<?n-i = (-l)n~2 (voir 1/d)), ceci entraîne bien An = a2(Ç -Ç')2 = A.
C. FRACTIONS CONTINUES 297 Montrons maintenant que les polynômes Qn sont en nombre fini. Il suffit pour cela de montrer que les coefficients an, fîn et 7n de Qn sont~bornés, ce qui prouvera le résultat compte tenu du fait que ces coefficients sont entiers. Pour le coefficient dominant an, on part de la relation «n = Qn-iQ(Pn-i/Qn-i) ce qui entraîne, en appliquant l'inégalité des accroissements finis à la fonction polynôme x i-> Q(x) M = Ql-i Q[^)-Q(0 \Qn-lJ < Ql-iM Pn-1 . Qn-1 M= sup \Q'(x)\ \*-t\<l car \pn-i/Qn-i — £| < 1 d'après 1/f). D'après 1/f) encore une fois, ceci entraîne |an| < M. Poulie terme constant de Qn, on remarque que jn = q2l-2Q{Pn-2/ qn-2) = «n-i donc |7n-i| < M. Il ne reste plus qu'à remarquer que (3% = An — 4an7n = A — 4an7n donc fi\ < A + 4M2, donc (3n est borné également. (ii) Comme il n'y a qu'un nombre fini de valeurs prises par la suite de polynômes (Qn), il y a au moins trois indices distincts ni, n2, nz tels que Qni = Qn2 = Qnz. Or chacun de ces polynômes n'a que deux racines et £nfc est racine de Qnk, cela entraîne que parmi £ni, £n2, £„3, deux valeurs au moins sont identiques. Ainsi, nous avons montré l'existence de deux indices distincts r et 5 tels que £r = £s, donc le développement en fraction continue de £ est bien périodique à partir d'un certain rang d'après 2/b). Remarque. On peut également développer en fraction continue tout nombre rationnel £ = a/6, mais la fraction continue est finie et s'arrête dès que £n est un entier. On montre alors que l'algorithme permettant d'obtenir la fraction continue de £ est l'algorithme d'Euclide. Le résultat 1/f) entraîne que tout nombre irrationnel £ est développable en fraction continue infinie. Réciproquement, on peut montrer que toute fraction continue infinie converge vers un nombre irrationnel. Par ailleurs, l'égalité des limites de deux fractions continues infinies n'est possible que si les quotients incomplets de l'une sont égaux à ceux de l'autre. On peut montrer que si un nombre rationnel p/q vérifie |£ — p/q\ < l/(2g2), alors p/q est forcément une réduite de £. Une application classique des fractions continues est la résolution de V équation de Pell- Fermat (recherche des solutions entières x et y telles que x2 — ny2 = ±1, lorsque n est un entier qui n'est pas un carré).
Index des notations Les numéros en fin de ligne indiquent les pages où apparaissent les notations correspondantes. a | d a\b x = y (mod p) pgcd a A 6 ppcm aVb Z{G) Card(G) [G: H] H<G G/H Ker/ (A) \X\) . . . , Xn) (SQ (1) s(2) - S( (n)) 'î.J (ai,..., ap) (P) G/H <p{n) M deg(P) pgcd (•P) a: = y (mod n) K(i4) K(X) A[XU £M Si,... £i + - £i®- • • » ■^Ln\ ' + En, 2*=i -^ Vect(A) ou Vect(xi)i£i a divise 6, 7 a ne divise pas 6, 7 £ est congru à y modulo n, 7 plus grand diviseur commun, 7 pgcd de a et 6, 8 plus petit multiple commun, 8 ppcm de a et 6, 8 centre du groupe G, 17 cardinal de l'ensemble G, 18 indice de H dans G, 18 H est distingué dans G, 18 groupe quotient ou anneau quotient, 18 noyau du morphisme ou de l'appl. linéaire /, 19, 30, 114 sous-groupe engendré par A, 19 sous-groupe engendré par x\,... ,rcn, 19 groupe symétrique d'indice n, 20 permutation de {1,..., n}, 20 transposition sur i, j, 20 cycle de longueur p, 20 groupe alterné d'indice n, 21 idéal engendré par P, 30 groupe quotient ou anneau quotient, 30 indicateur d'Euler de n, 31 partie entière de x, 43 degré du polynôme P, 54 polynômes à coefficients dans A, 54 plus grand diviseur commun, 55 idéal engendré par P, 61 x est congru à y modulo n, 61 plus petit sous-corps contenant A et K, 62 fractions rationnelles sur K, 70 polynômes à plusieurs indéterminées, 77 polynôme symétrisé de M, 78 polynômes symétriques élémentaires, 78 somme des s.e.v Ei,..., En, 110 somme directe des s.e.v £?!,..., En, 110 s.e.v engendré par A ou par (xi)i£i} 110
INDEX DES NOTATIONS 299 dim(£) C(E,F) Im/ rg/ C{E) Gt{E) ïdB (aitj) i^p MM(K] Mn(K) lA U)BB In ^n(K) [/]* TgA tiA, tr/ A^, B° C(Ei,..., CP(E,K) det/ com(A), A V(aii...ian) Ex Pf f\F n/ £c(£) Ep,F), ll*ll« exp(/), ef AÇB [UyV] y>(z,.), V>(-, a?) Ker$ M* 0{E) U(E) SOn, 0+, SUn, SO(E), 0+{E), SU{E) r G(xi,...,xn) [0-0,0.1,... ,an] dimension-de E, 111 e.v des applications linéaires de E dans F, 113 image de l'application linéaire /, 114 rang de l'application linéaire /, 114 algèbre des endomorphismes de E, 115 groupe linéaire de E, 115 application identité de E, 115 matrice de type p x g, 119 matrices de type (p, q) à coefficients dans K, 119 matrices carrées n x n, 119 matrice transposée de A, 119 matrice de / dans les bases B et B', 120 matrice identité de Mn(K), 121 groupe linéaire d'indice n, 121 matrice de Pendomorphisme / clans la base B, 121 rang de la matrice A, 122 trace de la matrice A, de Pendomorphisme /, 122 crochet dual égal à <p(x) pour (p G E*, 126 dual, bidual de E, 126 orthogonal de A, de B (dans le dual), 128 application transposée de u, 129 formes p-linéaires, 134 déterminant de /, 136 comatrice de A, 137 déterminant de Vandermonde de 01,..., on, 137 sous-espace propre associé à À, 161 polynôme caractéristique de /, 162 restriction de Pendomorphisme / à F, 163 polynôme minimal de /, 176 endomorphismes de E continus, 182 norme de / G CC(E), 182 norme de X, 182 exponentielle de Pendomorphisme /, 184 A c B et A ^ B, 191 crochet de Lie de u et v : uv — vu, 206 pour x fixé, forme linéaire y ■-> <p(x,y) ou ip(y,x), 227 cône isotrope de <£>, 230 A est orthogonal à B, 230 noyau de la forme quadratique ou hermitienne $,231 transconjuguée de M G A4„(C), t. e. M* = 'M, 231 groupe orthogonal de E, 242 groupe unitaire de E, 242 groupe des matrices orthogonales ou unitaires, 243 groupe spécial orthogonal, 243 endomorphisme adjoint de /, 243 déterminant de Gram de X\,..., xn, fraction continue, 293 263
Index abélien (groupe -), 17 adjoint (endomorphisme -), 243 algèbre, 110 algébrique (nombre -), 86, 87 algébriquement clos (corps -), 62 alterné (groupe -), 21, 25 alternée (forme multilinéaire -), 134 anneau, 29 anneau - commutatif, 29 - de Boole, 32 - des entiers de Gauss, 39 - euclidien, 38 - intègre, 29 - noethérien, 34 - principal, 30 - quotient, 30 - unitaire, 29 caractéristique d'un -, 30 idéal d'un -, 29 sous- -, 29 antilinéaire (application -), 227 antisymétrique forme bilinéaire - , 228 forme multilinéaire -, 134 application linéaire, 113 associés (polynômes -), 54 autoadjoint (endomorphisme -), 243 automorphisme - d'un espace vectoriel, 115 - de groupe, 19 - intérieur, 19 Banach (espace de -), 183 base - ^-orthogonale, 231 - antéduale, 127 - canonique (de Kn, de K[X]), 111 - d'un espace vectoriel, 111 - duale, 127 - incomplète (théorème de la -), 111 - orthogonale, orthonormale, 241 Bernstein (inégalité de -), 95 Bezout (théorème de -), 8, 55 bidual, 126 bilinéaire (forme -), 134, 227 Boole (anneau de -), 32 caractéristique - d'un anneau, 30 - d'un corps, 53 caractéristique (polynôme -), 162 Cardan (formules de -), 80, 285 Carmichael (nombres de -), 35 Cauchy déterminant de -, 143 théorème de -, pour les groupes finis, 28 Cayley-Hamilton (théorème de -), 176 centre - d'un groupe, 17 - du groupe linéaire, 118 changement de base, 121, 228 chinois (théorème des -), 31 clôture algébrique d'un corps, 62 codiagonalisables (endomorphismes -), 166 codimension (d'un sous-espace), 114 cofacteur, 136 comatrice, 137 combinaison linéaire, 110 commutant d'un endomorphisme, 181 compagnon (matrice -), 177, 290 congrues (matrices -), 228 corps, 53 corps - algébriquement clos, 62 - commutatif, 53 - de dissociation, 62 - des racines d'un polynôme, 62 - premier, 54 clôture algébrique d'un -, 62 extension de -, ou surcorps, 53 sous- -, 53 cotrigonalisables (endomorphismes -), 166 Cramer (systèmes de -), 138 cryptographie, 34 cycle, 20 cyclique endomorphisme -, 289 groupe -, 19 cyclotomique (polynôme -), 91 décomposition polaire, 249 définie (f. quadratique, hermitienne -), 230 dégénérée (f. quadratique, hermitienne -), 231 degré partiel, 77
INDEX 301 degré total, 77 déterminant, 135 déterminant - de Vandermonde, 137 - caractéristique (d'un système), 138 - circulant, 146, 180 - d'un endomorphisme, 136 - d'une matrice carrée, 136 - de Cauchy, 143 - principal (d'un système), 138 dérivée d'un -, 217 diagonale (matrice -), 119 diagonale principale, 119 diagonalisable (endomorphisme -, matrice -), 163 diagonalisation simultanée, 166, 171, 246 dimension (d'un sous-espace), 111 Dirichlet (théorème de -), 12, 37, 92 discriminant d'un polynôme, 80 distingué (sous-groupe-), 18 division euclidienne, 7, 54 division selon les puissances croissantes, 55 dual (espace -), 126 Dunford (décomposition de -), 193 écart angulaire, 240 Eisenstein (critère d'-), 58 élément - inversible, 29 - neutre, 17 - nilpotent, 29 élément primitif (théorème de 1'-), 89 éléments simples - de première, de seconde espèce, 73 décomposition en -, 71 endomorphisme, 114, 115 endomorphisme - adjoint, 243 - autoadjoint, 243 - normal, 258 - orthogonal, 242 - symétrique, 244 - unitaire, 242 équation aux classes, 22 équivalentes (matrices -), 121 espace vectoriel, 109 espace vectoriel - de dimension finie, 111 - de dimension infinie, 111 - norme, 182 Euclide (algorithme d'-), 8, 10, 57 euclidien (anneau -), 38 euclidien (espace -), 240 euclidienne (norme -), 240 Euler constante d'-, 103 indicateur d'-, 31 théorème d'-, 31 théorème d'- sur les nombres parfaits, 14 Euler, L., 11 exponentielle d'endomorphismes, 184 exposant d'un groupe abélien fini, 26 Faddéev (algorithme de -), 217 famille (génératrice, libre, liée), 111 Fermât grand théorème de -, 17 nombres de -, 11, 13, 46 théorème de -, 9 Ferrari (méthode de -), 286 forme hermitienne, 230 forme linéaire, 113, 126 forme linéaire -sur.Mn(K), 132 forme quadratique, 229 fraction rationnelle, 70 fraction rationnelle décomposition en éléments simples d'une -, 71 pôle d'une -, 71 partie entière d'une -, 71 fraction continue, 293 Frobenius matrices positives de -, 221 réduction de -, 291 Gauss (méthode de-), 232 anneau des entiers de -, 39 lemme de -, 58 quadrature de -, 104 théorème de -, 8, 55 Gelfond-Schneider (théorème de -), 103 génératrice (partie -, famille -), 111 Gram (matrice de -, déterminant de -), 263 groupe, 17 groupe p-groupe, 27 - abélien, commutatif, 17 - alterné, 21, 25 - cyclique, 19 - de type fini, 19 - des inversibles d'un anneau unitaire, 30 - des permutations, 20 - linéaire, 121 - linéaire (d'un e.v), 115 - monogène, 19 - opérant sur un ensemble, 21 - orthogonal, 242 - quotient, 18 - spécial orthogonal, 243 - symétrique, 20 - unitaire, 242 sous- -, 17 Hadamard (inégalité d'-), 262 hausdorffien (d'une application linéaire), 282 hauteur d'un polynôme, 79 Hermite
302 INDEX interpolation de -, 66 polynômes de -, 108 hermitien (espace -), 240 hermitienne forme -, 230 matrice -, 229 norme -, 240 hilbertien (espace -), 240, 254 Holladay (théorème de -), 158 homothétie, 115 hyperplan, 114, 129 idéal - maximal, 33 - premier, 33 - principal, 30 radical d'un -, 33 idéal (- d'un anneau), 29 image (d'une application linéaire), 114 indépendants (vecteurs linéairement -), 111 indicateur d'Euler, 31 indice - d'un endomorphisme, 192 - d'un sous-groupe, 18 - de nilpotence, 29 intègre (anneau -), 29 intérieur (automorphisme -), 19 intransitivité (relation d'-, classe d'-), 21 invariants de similitude, 290 inversible (élément -), 29 irréductible (polynôme -), 55 isométrie, 242 isométrie directe, indirecte, 243 isomorphisme - d'anneaux, 30 - de K-e.v, 114 - de groupes, 19 isotrope (cône -, vecteur -), 230 Iwasawa (décomposition d'-), 250 Jacobi, 50 Jacobi identité de -, 152 Jordan (réduction de -), 197, 199 Kronecker (théorème de -), 89 Lagrange méthode de -, 286 polynômes d'interpolation de -, 61 théorème de -, 18, 51 Laguerre (polynômes de -), 108 Legendre polynômes de -, 108 symbole de -, 46 libre (famille -), 111 Lie (crochet de -), 173, 206 liée (famille -), 111 Lindemann, 103 Liouville nombres de -, 86 théorème de -, 15 logarithme d'une matrice inversible, 202 loi de réciprocité quadratique, 46 Lucas (test de -), 11 Markov (inégalité de -), 95 matrice, 119 matrice - antisymétrique, 119, 228, 261, 273 -carrée, 119, 121 - compagnon, 177, 290 - de passage, 121 - diagonalement dominante, 123 - extraite, - bordante, 122 - hermitienne, 229 - ligne, - colonne, 119 - scalaire, 119 - symétrique, 119, 228 - triangulaire, trigonale, 119 ordre, taille d'une -, 119 matrices - équivalentes, 121 - semblables, 121 - congrues, 228 maximum (principe du -), 67 Mersenne (nombres de -), 11, 16 mineur, 136 mineur principal, 162 minimal (polynôme -), 176 Minkowsky (inégalité de -), 235 monogène (groupe -), 19 morphisme - d'anneaux, 30 - de groupes, 19 multilinéaire (application -), 134 neutre (élément -), 17 Newton (formules de -), 80 nilpotence (indice de -), 29 nilpotent élément -, 29 endomorphisme -, 149, 163, 178, 197 noethérien (anneau -), 34 normal (endomorphisme -), 258 noyau - d'un morphisme d'anneaux, 30 - d'un morphisme de groupes, 19 - d'une application linéaire, 114 - d'une f. quadratique, hermitienne, 231 noyaux (th. de décomposition des -), 175 orbite, 20, 21 ordre - d'un élément, 19 - d'un groupe, 18 orthogonal (endomorphisme -), 242 orthogonale famille -, 240 matrice -, 243
INDEX 303 orthogonalité - dans le dual, 128 - dans un espace préhilbertien, 240 - selon une f. quadratique, hermitienne, 230 orthogonaux (polynômes -), 104 orthonormale, orthonormée (famille -), 240 parallélogramme (identité du -), 241 parfaits (nombres -), 14 partie entière d'une fraction rationnelle, 71 partie principale d'une fraction rationnelle, 71 Pépin (test de-), 46 permutation (groupe des -), 20 Perron, théorème de -, 221 Pfaffien d'une matrice antisymétrique, 274 pgcd, 7, 55 p-groupe, 27 polaire (forme -), 229, 230 polaire (décomposition -), 249 pôle d'une fraction rationnelle, 71 polynôme - à plusieurs indéterminées, 77 - à une indéterminée, 54 - caractéristique, 162 - cyclotomique, 91 - d'endomorphisme, 174 - d'interpolation de Lagrange, 61 - dérivé, 60 - symétrique, symétrique élémentaire, 78 - unitaire, 54 corps des racines d'un -, 62 racine, zéro d'un -, 59 polynômes orthogonaux, 104 positive forme quadratique ou hermitienne -, 234 matrice -, matrice définie -, 245 ppcm, 8 préhilbertien (espace -), 240 premier corps -, 54 idéal -, 33 nombre -, 8 nombre pseudo-, 35 sous-corps -, 54 premiers entre eux entiers - , 7 polynômes - , 55 primalité (tests de -), 36 primitive n-ième de l'unité (racine -), 91 principal (anneau -, idéal -), 30 produit scalaire, - hermitien, 240 projecteur, projection, 115 projection orthogonale, 242 propre (valeur -, vecteur -), 161 pseudo-premier (nombre -), 35 quadratique (forme -), 229 quadrature de Gauss, 104 quaternions (corps des -), 94 quotient anneau -, 30 espace vectoriel -, 114 groupe -, 18 réflexion (de l'espace), 257 racine d'un polynôme, 59 racine primitive n-ième de l'unité, 91 racine carrée d'une matrice positive, 245 radical (d'un idéal), 33 rang - d'une application linéaire, 114 - d'une f. bilinéaire ou sesquilinéaire, 228 - d'une forme hermitienne, 230 - d'une forme quadratique, 229 - d'une matrice, 122 rayon spectral, 210 réduction - des endomorphismes autoadjoints, 244 - des endomorphismes normaux, 258 - des endomorphismes unitaires, 257 - des isométries, 256 - des matrices antisymétriques, 261, 273 régulière (valeur -), 161 résultant de deux polynômes, 208 retournement (de l'espace), 257 Rodrigues (formule de -), 266 rotation (du plan, de l'espace), 257 Rouché-Fontené (théorème de -), 138 RSA (algorithme-), 35 scalaire, 110 Schmidt (procédé d'orthogonalisation de -), 241 Schur (lemme de -), 172 Schur (produit de -), 254 Schwarz (inégalité de -), 235 scindé (polynôme -), 59 semblables (matrices -), 121 semi-simples (endomorphismes -), 224 séries entières d'endomorphismes, 183 sesquilinéaire (forme -), 227 signature - d'un cycle, 21 - d'une f. quadratique, hermitienne, 234 - d'une permutation, 21 similitude (invariants de -), 290 simultanée (diagonalisation -, trigonalisation -), 171 somme, somme directe de sous-espaces, 110 sous-anneau, 29 sous-corps, 53 sous-corps - premier, 54 sous-espace caractéristique, 191 sous-espace propre, 161 sous-espaces totalement isotropes, 238 sous-groupe, 17 sous-groupe - distingué, normal, invariant, 18 spectrale (valeur -), spectre, 161 splines cubiques, 158
304 INDEX stabilisateur (d'un élément), 21 Steinitz (théorème de -), 62 stochastique, matrice -, 221 suites exactes, 117 supplémentaire (d'un s.e.v), 112 surcorps, 53 Sylow (théorème de -), 40 Sylvester critère de -, 247 identité de -, 152 loi d'inertie de -, 234 symétrie, 115 symétrie - hermitienne, 229 - orthogonale, 242 symétrique - élémentaire (polynôme -), 78 élément -, 17 endomorphisme -, 244 forme bilinéaire -, 228 groupe -, 20 matrice -, 119, 228 polynôme -, 78 symétrisé d'un polynôme, 78 système linéaire - de Cramer, 138 système linéaire, 137 Taylor (formule de -), 60 Tchébycheff polynômes de -, 70, 95, 107 théorème de -, 43 théorème de la médiane, 241 théorème des nombres premiers, 14 théorème fondamental de l'algèbre, 63, 84 théorème fondamental de l'arithmétique, 8 trace, 122 transcendance (de e, de 7r), 100 transcendant (nombre -), 86 transconjuguée (matrice -), 231 transformée de Fourier discrète, 81. transposée application -, 129 matrice -, 119 transposition, 20 transvection (matrice de -), 156 trigonalisable (endomorphisme -, matrice -), 164 trigonalisation, 164 trigonalisation - simultanée, 166, 171 unitaire endomorphisme -, 242 matrice -, 243 unitaire (polynôme -), 54 unitaire (anneau -), 29 valuation p-adique, 43 Vandermonde (déterminant de -), 137 vecteur de probabilité, 221 vecteurs, 110 Waring méthode de -, 79 problème de -, 52 Wedderburn (théorème de -), 93 Wiles, Andrew, 17 Wilson (théorème de -), 9 Groupe CPI - Aubin Imprimeur - Ligugé, D.L. janvier 2008 / Impr. : L 72689 Imprimé en France
> Cette deuxième édition rassemble dans un même volume des rappelo de cours complets, des compléments de cours, ainsi que 215 exercice o et problèmes corrigés, classiques ou originaux, le tout portant sur le programme d'algèbre de mathématiques spéciales MP*. L'accent est porté sur la relation cours-exercice, indispensable pou parvenir à une compréhension globale des concepts. Tous les thèmes classiques sont présentés, expliqués, exploités, et fournissent ainsi un bagage mathématique solide pour affronter les concours scientifiques. Tout au long de l'ouvrage, de multiples remarques et renvoi - ponctuent les résultats et permettent à l'étudiant de trouver des points de repère. Cette nouvelle édition apporte des améliorations de preuves et de solutions, ainsi que quelques exercices et problèmes supplémentaires dans l'esprit de l'édition précédente. C'est l'outil idéal de l'élève des classes préparatoires scientifiques pour la révision des concours. Il pourra également intéresser les candidats à l'agrégation. Illustration de couverture: LÉcole d'Athènes, Raphaël, Vatican. 9 ll782729"850142 w w w.editions-ellipses .fi