/
Author: Colmez P.
Tags: mathematiques théorie des nombres algèbre analyse mathématique
ISBN: 978-2-7302-1587-9
Year: 2011
Text
Pierre Colmez
Éléments d'analyse
et d'algèbre
(et de théorie des nombres)
2/7T JqW - Z
a,_.,)=2„^.IM.c(s): ■ 'V V' ï»-5»
2 (27r)s
y
4>{Q= li**"*(x)<lx
|G| = |II|-|G/H|
^(cliuiW)2 = |C!|
Eléments d'analyse
et d'algèbre
(et de théorie des nombres)
Pierre Colmez
NOUVELLE
ÉDITION
Ce logo a pour objet d'alerter le lecteur sur la menace que représente
pour l'avenir de l'écrit, tout particulièrement dans le domaine
universitaire, le développement massif du « photocopillage ».
Cette pratique qui s'est généralisée, notamment dans les établissements
d'enseignement, provoque une baisse brutale des achats de livres, au
point que la possibilité même pour les auteurs de créer des œuvres
nouvelles et de les faire éditer correctement est aujourd'hui menacée.
Nous rappelons donc que la production et la vente sans autorisation,
ainsi que le recel, sont passibles de poursuites.
Les demandes d'autorisation de photocopier doivent être adressées à
l'éditeur ou au Centre français d'exploitation du droit de copie :
20, rue des Grands-Augustins, 75006 Paris. Tél. : 01 44 07 47 70.
www.editions.polytechnique.fr
> Éditions de l'École Polytechnique - Septembre 2011
91128 Palaiseau Cedex
SYNOPSIS
Introduction 1
Vocabulaire Mathématique 9
I. Représentations des groupes finis 233
II. Espaces de Banach 269
III. Intégration 297
IV. Transformée de Fourier 331
V. Fonctions holomorphes 355
VI. La formule de Cauchy et celle des résidus (de Cauchy) 379
VII. Séries de Dirichlet 399
A. Le théorème des nombres premiers 429
B. Volume de SLn(R)/SLn(Z) 449
C. Groupes finis et représentations : exemples 465
D. Fonctions d'une variable p-adique 479
E. Irrationalité d'une infinité de C(2n + 1) 497
F. Le problème des nombres congruents 507
G. Introduction au programme de Langlands 523
H. Problèmes corrigés 555
Index 641
TABLE DES MATIÈRES
Introduction 1
Vocabulaire Mathématique 9
1. Grammaire élémentaire 10
2. Structures algébriques 16
3. Groupes finis 38
4. Polynômes 48
5. Algèbre linéaire 61
6. Déterminants 71
7. Matrices 74
8. Fragments de théorie des corps (commutatifs) 88
9. Système d'équations 100
10. Réduction des endomorphismes 110
11. Topologie 129
12. Compacité 139
13. Connexité 148
14. Complétude 151
15. Séries numériques 156
16. Convergence de fonctions 165
17. Espaces vectoriels normes 167
18. Espaces préhilbertiens : 172
19. Tératologie 183
20. Construction de nombres 190
21. Corrigé des exercices 201
I. Représentations des groupes finis 233
1.1. Représentations et caractères 235
1.2. Décomposition des représentations 242
1.3. Construction de représentations 256
II. Espaces de Banach 269
11.1. Espaces de Banach 269
11.2. Espaces de Hilbert 283
11.3. Exercices 289
TABLE DES MATIÈRES vii
II.4. Espaces de Banach p-adiques 292
III. Intégration 297
III. 1. Intégrale de Lebesgue 297
111.2. Quelques espaces fonctionnels 310
111.3. Intégrales multiples 315
111.4. Construction de l'intégrale de Lebesgue 323
IV. Transformée de Fourier 331
IV. 1. Intégrales dépendant d'un paramètre 331
IV.2. Transformée de Fourier dans L1 334
IV.3. Formules d'inversion 337
IV.4. Transformée de Fourier dans L2 349
V. Fonctions holomorphes 355
V.l. Fonctions holomorphes et fonctions analytiques complexes 355
V.2. Exemples de fonctions holomorphes 359
V.3. Premières propriétés des fonctions holomorphes 361
V.4. La formule intégrale de Cauchy et ses conséquences 365
V.5. Construction de fonctions holomorphes 371
V.6. Inversion globale et image ouverte 375
VI. La formule de Cauchy et celle des résidus (de Cauchy) 379
VI.l. Homotopie de lacets et formule de Cauchy 379
VI.2. Indice d'un lacet par rapport à un point 385
VI.3. La formule des résidus de Cauchy 389
VII. Séries de Dirichlet 399
VII.l. Séries de Dirichlet 399
VII.2. Séries de Dirichlet et transformée de Mellin 403
VII.3. La fonction zêta de Riemann 409
VII.4. Fonctions L de Dirichlet 415
VILS. Autres exemples 422
VII.6. Formes modulaires 423
A. Le théorème des nombres premiers 429
A.l. Introduction 429
A.2. Les fonctions ip et ipi 433
A.3. Formules explicites 435
A.4. Démonstration du théorème des nombres premiers 443
A.5. Compléments 445
B. Volume de SLn(R)/SLn(Z) 449
B.l. Volume d'objets arithmétiques 449
B.2. La mesure de Haar de SLn(R) 458
C. Groupes finis et représentations : exemples 465
Cl. p-Groupes 465
C.2. Représentations du groupe symétrique Sn 467
viii TABLE DES MATIÈRES
C.3. Représentations de GL2(F) 470
D. Fonctions d'une variable p-adique 479
D.l. Analyses fonctionnelles réelle et p-adique 479
D.2. Fonctions fc-fois uniformément dérivables 480
D.3. Fonctions localement analytiques sur Zp 484
D.4. La fonction zêta p-adique 489
E. Irrationalité d'une infinité de C(2n + 1) 497
E.l. Indépendance linéaire de nombres réels 497
E.2. Transcendance de n et indépendance linéaire des Ç(n) 499
F. Le problème des nombres congruents 507
F.l. Courbes elliptiques et nombres congruents 507
F.2. Équations diophantiennes 517
G. Introduction au programme de Langlands 523
G.I. La conjecture d'Artin 525
G.2. Le théorème de Kronecker-Weber revisité 535
G.3. Le programme de Langlands 549
H. Problèmes corrigés 555
H.l. Exercices d'examen 556
H.2. Table des caractères de A5 569
H.3. Représentations de GL2(F3) 574
H.4. Table des caractères de GL3(F2) 579
H.5. Coefficients de Fourier des fonctions continues 587
H.6. Fonctions d'Hermite et transformée de Fourier dans L2 589
H.7. Transformée de Fourier et convolution 593
H.8. Loi d'addition sur une courbe elliptique 597
H.9. Coefficients de Fourier des fonctions analytiques 603
H.10. Prolongement analytique d'intégrales et de séries 605
H.11. La fonction r\ de Dedekind 612
H.12. Irrationalité de C(3) 622
H.13. Le critère de Borel 626
H.14. Le théorème de Mordell-Weil 629
Index 641
Index terminologique 642
Énoncés mathématiques 650
Index des noms propres 652
Repères chronologiques 655
TABLE DES MATIÈRES DÉTAILLÉE
Introduction 1
Bibliographie sommaire 3
Préface de la seconde édition 5
Notations standard 7
Vocabulaire Mathématique 9
1. Grammaire élémentaire 10
1.1. Coefficients binomiaux 11
1.2. L'anneau Z des entiers relatifs 11
1.3. Parallélisme entre logique élémentaire et langage ensembliste 14
1.4. Ensembles dénombrables 14
2. Structures algébriques 16
2.1. Lois de composition 17
2.2. Exemples de structures algébriques 18
2.3. Sous-trucs de trucs 21
2.4. Morphismes 22
2.5. Noyau et image 23
2.6. Produits et sommes 25
2.7. Relations d'équivalence 27
2.8. L'anneau Z/DZ des entiers relatifs modulo D 29
2.9. Quotients d'espaces vectoriels et de A-modules 32
2.10. Anneaux quotients, idéaux 33
2.11. Groupes quotients 35
3. Groupes finis 38
3.1. Groupes cycliques 38
3.2. Groupes abéliens finis 40
3.3. Le théorème de Lagrange et ses variantes 41
3.4. Le groupe symétrique Sn 42
3.5. Les théorèmes de Sylow 46
4. Polynômes 48
4.1. Polynômes en une variable 48
4.2. Anneaux euclidiens et principaux 50
4.3. Polynômes en plusieurs variables 56
4.4. Polynômes symétriques 58
4.5. Anneaux noethériens 59
5. Algèbre linéaire 61
TABLE DES MATIÈRES DÉTAILLÉE
5.1. Espaces vectoriels 61
5.2. Morphismes d'espaces vectoriels 62
5.3. Familles libres, familles génératrices, bases 64
5.4. Espaces vectoriels de dimension finie 66
5.5. Dualité 69
6. Déterminants 71
6.1. Formes multilinéaires alternées 71
6.2. Déterminant de n vecteurs 72
6.3. Déterminant d'un endomorphisme 74
7. Matrices 74
7.1. Matrices à coefficients dans un corps 74
7.2. Produit de matrices 75
7.3. Le théorème fondamental de l'algèbre linéaire 76
7.4. Matrice d'une application linéaire 76
7.5. Matrices carrées 78
7.6. Déterminant d'une matrice carrée 79
7.7. Matrices à coefficients dans un anneau 83
7.8. Matrices par blocs 87
8. Fragments de théorie des corps (commutatifs) 88
8.1. Sous-extensions finies 89
8.2. Algébricité, transcendance 90
8.3. Extensions algébriques, clôture intégrale 92
8.4. Constructions à la règle et au compas 93
8.5. Degré de transcendance 94
8.6. Constructions d'extension^algébriques 95
8.7. Corps finis 97
8.8. La clôture algébrique d'un corps 99
9. Système d'équations 100
9.1. Systèmes linéaires 101
9.2. Systèmes d'équations polynomiales 104
10. Réduction des endomorphismes 110
10.1. Généralités 110
10.2. Modules de torsion sur K[X] et réduction des endomorphismes 112
10.3. Modules de torsion sur les anneaux principaux 118
10.4. Modules sur les anneaux principaux 121
10.5. Extension des scalaires 125
11. Topologie 129
11.1. Espaces topologiques >. 129
11.2. Espaces métriques & 130
11.3. Continuité 132
11.4. Sous-espaces, produits, quotients 133
11.5. Espaces séparés 135
11.6. Intérieur, adhérence, densité 136
11.7. Suites dans un espace topologique 137
12. Compacité 139
12.1. Espaces compacts 139
12.2. Compacité et suites 140
12.3. Propriétés de base des compacts 141
12.4. La droite réelle achevée 145
12.5. L'espace topologique T = R/Z 147
TABLE DES MATIÈRES DÉTAILLÉE xi
13. Connexité 148
13.1. Ensembles connexes 148
13.2. Connexité par arcs 149
14. Complétude 151
14.1. Suites de Cauchy 151
14.2. Principales propriétés des espaces complets 152
14.3. Complétion d'un espace métrique 154
15. Séries numériques 156
15.1. Séries à termes positifs 156
15.2. Séries standard 158
15.3. Séries absolument convergentes 159
15.4. Séries entières 161
15.5. L'exponentielle complexe 162
15.6. Sommation de séries divergentes 163
16. Convergence de fonctions 165
16.1. Convergence simple 165
16.2. Convergence uniforme 166
17. Espaces vectoriels normes 167
17.1. Corps normes 167
17.2. Normes et applications linéaires continues 168
17.3. La norme d'un opérateur 168
17.4. Normes équivalentes 169
17.5. Norme spectrale d'un opérateur 170
17.6. La boule unité d'un espace vectoriel norme 171
17.7. Applications bilinéaires continues 172
18. Espaces préhilbertiens 172
18.1. Produits scalaires 172
18.2. Orthogonalité 173
18.3. Unitarité 175
18.4. Opérateur autoadjoint, matrice hermitienne 179
19. Tératologie 183
19.1. Fonctions continues dérivables nulle part 183
19.2. L'escalier du diable 184
19.3. L'ensemble triadique de Cantor 186
19.4. La courbe de Peano 186
19.5. Ensembles connexes non connexes par arcs 188
20. Construction de nombres 190
20.1. Entiers naturels 190
20.2. Entiers relatifs, nombres rationnels 191
20.3. Nombres réels, nombres complexes 192
20.4. Nombres p-adiques 193
21. Corrigé des exercices 201
I. Représentations des groupes finis 233
1.1. Représentations et caractères 235
1. Représentations de groupes, exemples 235
2. Caractère d'une représentation, exemples 237
3. Morphismes de représentations 239
1.2. Décomposition des représentations 242
1. Décomposition en somme directe de représentations irréductibles 242
2. Le lemme de Schur et ses conséquences immédiates 244
xii TABLE DES MATIÈRES DÉTAILLÉE
3. Orthogonalité des caractères 246
4. Applications du théorème principal 247
5. Le cas des groupes commutatifs 249
6. Table des caractères d'un groupe fini 252
1.3. Construction de représentations 256
1. Restriction et inflation 256
2. Constructions tensorielles de représentations 257
3. Représentations induites 260
4. Exercices 265
II. Espaces de Banach 269
11.1. Espaces de Banach 269
1. Convergence normale, séries sommables 269
2. Espaces de suites 271
3. Espaces de fonctions continues 272
4. Équations différentielles linéaires 274
5. Complétion d'espaces vectoriels normes 279
6. Applications linéaires continues entre espaces de Banach 280
7. Le dual d'un espace de Banach 282
11.2. Espaces de Hilbert 283
1. Espaces de Hilbert 283
2. Le théorème de projection sur un convexe 286
3. Le dual d'un espace de Hilbert 288
11.3. Exercices 289
1. Espaces de Banach 289
2. Espaces de Hilbert 290
3. Séries de Fourier ."* 291
11.4. Espaces de Banach p-adiques 292
1. Définition et exemples 292
2. Bases orthonormales 293
3. Le dual d'un espace de Banach p-adique 295
III. Intégration 297
III. 1. Intégrale de Lebesgue 297
1. Dallages et fonctions en escalier 297
2. Ensembles de mesure nulle 299
3. Fonctions mesurables, ensembles mesurables 301
4. Définition de l'intégrale de Lebesgue 304
5. Les théorèmes de convergence monotone et de convergence dominée 308
6. Premières applications 309
111.2. Quelques espaces fonctionnels 310
1. L'espace LX(X) 310
2. L'espace L2(X) ..312
3. Convergence dans L1 et L2 313
4. Comparaison des différents modes de convergence 314
5. Espaces Lp 315
111.3. Intégrales multiples 315
1. Le théorème de Fubini 315
2. La formule du changement de variable 319
3. L'intégrale de la gaussienne 321
4. Exercices 322
TABLE DES MATIÈRES DÉTAILLÉE xiii
III.4. Construction de l'intégrale de Lebesgue 323
1. Le théorème de convergence dominée pour les fonctions en escalier bornées 323
2. Mesure et mesure extérieure des ensembles mesurables 326
3. Le théorème de convergence monotone pour les fonctions bornées à support compact 327
4. Limites simples p.p. de fonctions mesurables 328
5. Le théorème de convergence monotone et ses conséquences 329
IV. Transformée de Fourier 331
IV. 1. Intégrales dépendant d'un paramètre 331
IV.2. Transformée de Fourier dans L1 334
1. Caractères linéaires de R et Rm 334
2. Définition et premières propriétés 334
3. Le théorème de Riemann-Lebesgue 335
4. Transformée de Fourier et dérivation 336
IV.3. Formules d'inversion 337
1. Séries de Fourier 337
2. Séries de Fourier multidimensionnelles 341
3. La formule de Poisson 345
4. La formule d'inversion de Fourier dans S? 346
5. Formules d'inversion dans L1 347
6. Exercices 348
IV.4. Transformée de Fourier dans L2 349
1. Transformée de Fourier des fonctions en escalier 349
2. Définition de la transformée de Fourier dans L2 351
3. Comparaison des transformées de Fourier dans L1 et L2 352
4. Dérivation 352
V. Fonctions holomorphes 355
V.l. Fonctions holomorphes et fonctions analytiques complexes 355
1. Séries entières 355
2. Rayon de convergence d'une série entière 357
V.2. Exemples de fonctions holomorphes 359
1. Définition 359
2. Logarithme et fonctions puissances 360
V.3. Premières propriétés des fonctions holomorphes 361
1. Relations de Cauchy-Riemann 361
2. Théorème des zéros isolés et unicité du prolongement analytique 362
3. Principe du maximum 364
V.4. La formule intégrale de Cauchy et ses conséquences 365
1. Généralités sur les chemins 365
2. Intégration le long d'un chemin 366
3. La formule de Cauchy 367
4. Holomorphie des fonctions dérivables au sens complexe 368
5. Rayon de convergence et inégalités de Cauchy pour les dérivées 369
V.5. Construction de fonctions holomorphes 371
1. Séries de fonctions holomorphes 371
2. Produits infinis de fonctions holomorphes 372
3. Fonctions holomorphes définies par une intégrale 373
V.6. Inversion globale et image ouverte 375
1. Le théorème d'inversion locale holomorphe 375
2. Structure locale des fonctions holomorphes 376
xiv TABLE DES MATIÈRES DÉTAILLÉE
VI. La formule de Cauchy et celle des résidus (de Cauchy) 379
VI.l. Homotopie de lacets et formule de Cauchy 379
1. Vocabulaire de topologie algébrique 379
2. Un cas particulier de la formule de Stokes 380
3. Seconde démonstration de la formule de Cauchy 383
VI.2. Indice d'un lacet par rapport à un point 385
1. Primitives 385
2. Nombre de tours d'un lacet autour d'un point 386
VI.3. La formule des résidus de Cauchy 389
1. Fonctions holomorphes sur une couronne 389
2. Fonctions holomorphes sur un disque épointé ; résidus 392
3. La formule des résidus 395
4. Exercices 395
VII. Séries de Dirichlet 399
VII.l. Séries de Dirichlet 399
1. Abscisse de convergence absolue 399
2. Demi-plan de convergence d'une série de Dirichlet 401
VII.2. Séries de Dirichlet et transformée de Mellin 403
1. La fonction T dans le plan complexe 403
2. Une formule intégrale pour les séries de Dirichlet 404
3. Prolongement analytique de séries de Dirichlet 406
4. Croissance dans une bande verticale 406
VII.3. La fonction zêta de Riemann 409
1. Séries de Dirichlet attachées à des fonctions multiplicatives 409
2. Prolongement analytique de la fonction £ 410
3. Équation fonctionnelle de la fonction zêta 411
4. Les zéros de la fonction £ 415
VII.4. Fonctions L de Dirichlet m 415
1. Caractères de Dirichlet et Fonctions L de Dirichlet 415
2. Conducteur et sommes de Gauss 416
3. Le théorème de la progression arithmétique 417
4. Équation fonctionnelle des fonctions L de Dirichlet 419
VII.5. Autres exemples 422
1. La fonction de Moebius 422
2. La fonction r de Ramanujan 422
VII.6. Formes modulaires 423
Al. Le théorème des nombres premiers 429
A.l. Introduction 429
A.2. Les fonctions ip et ipi 433
1. Théorème des nombres premiers et comportement de r/)\ en +oo 433
2. Une formule intégrale pour ip\ 434
A.3. Formules explicites 435
1. Énoncé du résultat 436
2. Les fonctions L et ^ en dehors de la bande critique 438
3. La fonction L dans la bande critique 439
4. La fonction ^ dans la bande critique 440
5. Conclusion 441
A.4. Démonstration du théorème des nombres premiers 443
1. Non annulation sur la droite Re(s) = 1 443
TABLE DES MATIÈRES DÉTAILLÉE xv
2. Conclusion 445
A.5. Compléments 445
1. L'hypothèse de Riemann et ses conséquences 445
2. L'hypothèse de Riemann et la fonction M de Mertens 446
3. L'hypothèse de Lindelôf 447
B. Volume de SLW(R)/SL„(Z) 449
B.l. Volume d'objets arithmétiques 449
1. Résultats 449
2. Intégration sur un quotient 451
3. Un dévissage du groupe SLW(R) 453
4. Intégration sur Rw et sur SLW(R)/SLW(Z) 455
5. Apparition de £(n) et fin du calcul 456
6. Le lemme de Minkowski 458
B.2. La mesure de Haar de SLW(R) 458
1. Transvections et structure du groupe SLW(K) 459
2. Invariance de dg par translation 461
3. De SLw_i (R) à SL»(R) 462
C. Groupes finis et représentations : exemples 465
Cl. p-Groupes 465
1. Généralités sur les p-groupes 465
2. Représentations des p-groupes 466
C.2. Représentations du groupe symétrique Sw 467
1. Partitions de n et représentations de Sw 467
2. Diagrammes de Young et représentations de Sw 469
3. Caractères de S» 469
C.3. Représentations de GL2(F) 470
1. Le groupe GL2(F) 470
2. Construction de représentations de GL2(F) 471
3. Les classes de conjugaison de GL2(F) 472
4. La table des caractères de GL2(F) 474
5. Démonstrations 475
D. Fonctions d'une variable p-adique 479
D.l. Analyses fonctionnelles réelle et p-adique 479
D.2. Fonctions fc-fois uniformément dérivables 480
1. Fonctions de classe Vk et fonctions de classe *#£ 480
2. Fonctions continues sur Z™ 482
3. Coefficients de Mahler des fonctions de classe ^ 483
D.3. Fonctions localement analytiques sur Zp 484
1. Fonctions analytiques 484
2. Fonctions localement analytiques 486
3. Bases orthonormales d'espaces de fonctions localement analytiques 487
4. Démonstration du lemme D.3.4 488
D.4. La fonction zêta p-adique 489
1. Intégration p-adique 490
2. La mesure \ia 492
3. Continuité de la fonction n i-> xn 492
4. Restriction de \ia à Z* 494
5. Construction de la fonction zêta p-adique 495
xvi
TABLE DES MATIÈRES DÉTAILLÉE
E. Irrationalité d'une infinité de £(2n +1) 497
E.l. Indépendance linéaire de nombres réels 497
1. Le critère de Nesterenko 497
E.2. Transcendance de 7r et indépendance linéaire des £(n) 499
1. Génération de combinaisons linéaires entre les £(n) 499
2. Un choix judicieux de fonction rationnelle 499
3. Propriétés archimédiennes et arithmétiques des a^l) 500
4. Évaluation de S„ 503
5. Utilisation du critère de Nesterenko 504
F. Le problème des nombres congruents 507
F.l. Courbes elliptiques et nombres congruents 507
1. Introduction 507
2. Arithmétique des courbes elliptiques 509
3. L'heuristique de Birch et Swinnerton-Dyer 511
4. Fonction L d'une courbe elliptique 511
5. La stratégie de Tunnell 513
6. Formes modulaires 514
7. Courbes elliptiques et formes modulaires 515
F.2. Équations diophantiennes 517
1. Généralités 517
2. La topologie des solutions complexes gouverne l'arithmétique ! 519
G. Introduction au programme de Langlands 523
G.I. La conjecture d'Artin 525
1. Le groupe #q 525
2. Représentations de #q 526
3. Fonctions L d'Artin 528
4. Fonctions L de degré 2 r 529
5. La théorie du corps de classes ï~. 533
G.2. Le théorème de Kronecker-Weber revisité 535
1. Adèles 535
2. La formule de Poisson adélique 539
3. Transformée de Mellin adélique et fonctions L 542
4. Application aux fonctions L de Dirichlet 546
G.3. Le programme de Langlands 549
1. Représentations automorphes 549
2. Des formes modulaires aux représentations automorphes 551
3. Quelques autres aspects du programme de Langlands 553
H. Problèmes corrigés 555
H.l. Exercices d'examen 556
1. Énoncés 556
2. Corrigés 560
H.2. Table des caractères de A5 569
H.3. Représentations de GL2(F3) 574
H.4. Table des caractères de GL3(F2) 579
H.5. Coefficients de Fourier des fonctions continues 587
H.6. Fonctions d'Hermite et transformée de Fourier dans L2 589
H.7. Transformée de Fourier et convolution 593
H.8. Loi d'addition sur une courbe elliptique 597
TABLE DES MATIÈRES DÉTAILLÉE xvii
H.9. Coefficients de Fourier des fonctions analytiques 603
H.10. Prolongement analytique d'intégrales et de séries 605
H.ll. La fonction rj de Dedekind 612
H.12. Irrationalité de C(3) 622
H.13. Le critère de Borel 626
H.14. Le théorème de Mordell-Weil 629
Index 641
Index terminologique 642
Énoncés mathématiques 650
Index des noms propres 652
Repères chronologiques 655
INTRODUCTION
Les mathématiques sont à la fois un outil d'une puissance surprenante, utilisé à des
degrés divers par les autres sciences, et une des plus incroyables constructions collectives
de l'humanité, s'appuyant sur des bases consolidées génération après génération pour
permettre à l'édifice de monter toujours plus haut.
Ce cours est une introduction à trois des théories qui servent de socle aux
mathématiques. La première (chap. I) est la théorie des représentations des groupes finis et de
leurs caractères, développée dans les années 1895-1905 par F. Frobenius, W. Burnside
et I. Schur. Cette théorie est une extension de l'algèbre linéaire (il s'agit de comprendre
l'action simultanée de plusieurs isomorphismes sur un espace vectoriel de dimension fini,
et donc l'action du groupe qu'ils engendrent), mais la théorie des caractères est aussi
une première approche de la transformée de Fourier dans un cadre fini où les difficultés
analytiques sont absentes. La théorie des représentations des groupes joue un rôle central
en mathématiques, dans certaines branches de la physique (par exemple en physique des
particules) ou encore dans une petite partie de la chimie classique (cristallographie) ; le
cas des groupes finis sert souvent de guide pour deviner ce que l'on est en droit d'espérer
dans des cas plus compliqués.
La seconde (chap. II, III et IV) est l'analyse fonctionnelle des années 1900-1930
(espaces de Banach, intégration de Lebesgue, transformée de Fourier), dans laquelle se sont
illustrés R. Baire, S. Banach, M. Fréchet, H. Hahn, D. Hilbert, H. Lebesgue, M. Plan-
cherel, F. Riesz, H. Steinhaus... Cette théorie, née des préoccupations du siècle précédent
concernant les équations différentielles, les équations aux dérivées partielles..., forme la
base de l'analyse réelle moderne. Ses applications à l'étude des équations aux dérivées
partielles provenant de la physique (équations de la chaleur, des ondes, de Schrôdinger...)
sont innombrables.
La dernière partie du cours (chap V, VI et VII) est consacrée à la théorie des fonctions
analytiques d'une variable complexe, qui s'est développée entre les mains de A. Cauchy
dans les années 1820-1840, mais a été revisitée régulièrement depuis ; la présentation suivie
dans ce cours doit beaucoup aux apports de K. Weierstrass et de H. Poincaré datant de
2
INTRODUCTION
la seconde moitié du XIXe siècle. Cette théorie est probablement, avec la théorie générale
des groupes, celle qui est utilisée dans le plus grand nombre des autres branches des
mathématiques ou de la physique théorique. Par exemple, la représentation conforme des
ouverts du plan, à laquelle nous ne ferons qu'une brève allusion (note 1 du chap. VI),
a des applications à l'étude de l'équation de la chaleur avec conditions au bord dans un
domaine plan, à l'aérodynamique (transformation de Joukovski), à l'étude du mouvement
brownien ou celle des polymères, etc.
Le problème majeur d'un cours de ce type est que l'on est conduit à privilégier les
résultats qui ont le plus d'applications futures et à reléguer en exercice tout ce qui fait
le sel des mathématiques, ce qui revient un peu à visiter une cathédrale en ne s'intéres-
sant qu'aux consolidations successives de la base de ses piliers. Pour essayer de lutter
contre cette tendance, nous avons privilégié des objets analytiques, issus de la théorie
des nombres, ayant la faculté étonnante d'interagir avec quasiment tous les domaines des
mathématiques (voire de la physique théorique) et, ce faisant, de contribuer fortement au
développement de ces domaines. Il s'agit des fonctions L, dont la fonction zêta de Riemann
(définie par Ç(s) = X)nS ^r pour Re(s) > 1) est le prototype. L'un des premiers
résultats remarquables concernant ces objets est probablement la célèbre formule Ç(2) = ^l.
de L. Euler (1734), répondant à une question posée en 1644 et connue sous le nom de
« problème de Bâle ». Le même Euler a mis au jour un lien heuristique entre la fonction Ç
et la répartition des nombres premiers qui ne fut rigoureusement établi qu'en 1896 par
J. Hadamard et C. de la Vallée Poussin en suivant une stratégie suggérée par B. Riemann
en 1858. Entre-temps, G. Dirichlet avait introduit en 1837 les premières fonctions L pour
démontrer l'existence d'une infinité de nombres premiers dans les progressions
arithmétiques. L'annexe A, consacrée à ces résultats, fournit une illustration frappante de l'utilité
des fonctions holomorphes pour attaquer des problèmes qui en semblent fort éloignés.
Depuis, le monde des fonctions L s'est enrichi au point de former un édifice imposant dont
l'annexe G essaie de donner une idée en partant de la constatation que, pour apprécier
l'élégance et la majesté de la voûte de Notre-Dame, il n'est nul besoin de comprendre
pourquoi elle ne s'écroule pas ni, a fortiori, comment on a fait pour la construire sans
que tout tombe au fur et à mesure. Nous nous sommes restreint à l'aspect analytique des
fonctions L; celui-ci fait intervenir d'autres objets mathématiques ayant un don
d'ubiquité assez époustouflant, à savoir les formes modulaires que nous avons reléguées dans
une série d'exercices en vertu du principe énoncé plus haut. Nous avons (presque) résisté
à la tentation d'explorer les propriétés arithmétiques de ces fonctions L : leurs valeurs aux
entiers cachent des trésors qui font l'objet de conjectures générales de P. Deligne (1977,
dont la conjecture met en perspective le n2 de la formule d'Euler, et la non apparition
de 7r3 pour C(3)), de A. Beilinson (1985, qui vise, en particulier, à expliquer quels objets
interviennent dans £(3)) et de S. Bloch et K. Kato (1989, dont la conjecture donne une
formule totalement générale fournissant, par exemple, une signification à l'apparition de 691
dans la formule C(12) = âë^fenâ)- ^n exemPte de ces trésors cachés est la conjecture
INTRODUCTION
3
de Birch et Swinnerton-Dyer, qui date du début des années 1960, et à laquelle l'annexe F
est consacrée.
Bibliographie sommaire
Le lecteur désirant approfondir^ certains des thèmes développés dans ce cours est invité
à consulter les ouvrages ci-dessous. Ces ouvrages partent à peu près au même niveau que
le présent cours, mais sont plus spécialisés, ce qui leur permet d'aller plus loin.
P. Biane, J-B. Bost et P. Colmez, La fonction zêta, Presses de l'École Polytechnique.
Le lecteur y trouvera divers aspects de la fonction zêta en lien avec l'arithmétique ou les
probabilités.
J-B. Bost, Fonctions analytiques d'une variable complexe, École Polytechnique.
Couvre les chapitres V à VII, et une partie de l'annexe A.
D. Bump, Automorphic forms and représentations, Cambridge University Press.
Version développée de l'annexe G ; sa lecture demande un investissement non négligeable.
H. Cartan, Théorie élémentaire des fonctions analytiques d'une ou plusieurs variables
complexes, Hermann.
Couvre les chapitres V et VI, et poursuit en direction de la géométrie (surfaces de Ricmann,
et fonctions de plusieurs variables).
W. Ellison, Les nombres premiers, Hermann.
Couvre l'annexe A, et bien plus.
W. Fulton et J. Harris, Représentation theory. A first course, GTM 129, Springer-Verlag.
Débute par le chapitre I et l'annexe C, et poursuit en direction des représentations des groupes
de Lie.
R. Godement, Analyse mathématique II, III et IV, Springer-Verlag.
Couvre l'essentiel du cours, et de ce que j'aurais voulu y mettre, en prenant son temps, ce
que son nombre de pages permet. Les formes modulaires y sont traitées avec le respect qu'elles
méritent.
N. Koblitz, Introduction to elliptic curves and modular forms, GTM 97, Springer-Verlag.
Offre un voyage à travers la théorie des nombres en prenant comme fil conducteur le problème
des nombres congruents (annexe F).
S. Patterson, An introduction to the theory of the Riemann Zeta-function, Cambridge
University Press.
Couvre l'annexe A, et poursuit en direction des hypothèses de Riemann et Lindelôf.
W. Rudin, Real and complex Analysis, Me Graw-Hill
Un cours d'analyse qui couvre en particulier la partie analyse du cours (chapitres II à VI),
mais ne s'arrête pas là, loin s'en faut.
J-P. Serre, Cours d'arithmétique, Presses Universitaires de France.
(^La manière standard pour fabriquer des exercices est de prendre des résultats démontrés dans des
ouvrages plus spécialisés et de les découper en questions. Le lecteur trouvera donc dans ces ouvrages la
solution de la plupart des exercices de ce cours...
4
INTRODUCTION
Un fort joli livre pour en apprendre davantage sur les formes quadratiques à coefficients
rationnels et les formes modulaires.
J-P. Serre, Représentations linéaires des groupes finis, Hermann.
Couvre le chapitre I et une partie de l'annexe C, et continue sur des sujets plus pointus
concernant les représentations des groupes finis.
A. Weil, Elliptic functions according to Eisenstein and Kronecker, Springer-Verlag.
Un livre semi-historique très agréable à lire, illustrant à un niveau élémentaire les liens entre
les fonctions holoniorphes et la théorie des nombres.
Enfin, voici deux livres portant sur l'histoire des idées mathématiques dont beaucoup
de notes de bas de page du présent texte sont issues. Les périodes couvertes par ces deux
ouvrages ne sont pas identiques bien qu'il y ait une intersection non vide ; celle du second
est plus récente et demande un bagage mathématique un peu plus solide.
A. Dahan-Dalmedico et J. PeifFer, Une histoire des mathématiques, routes et dédales,
Points Sciences, Éditions du Seuil.
J. Dieudonné, Abrégé d'histoire des mathématiques, Hermann.
INTRODUCTION
5
Préface de la seconde édition
Le cours dont est issu ce livre a pris fin, et j'en ai profité pour inclure le matériel
pédagogique de la dernière année, et divers compléments (près de 200 pages au total).
Le Vocabulaire Mathématique a vu sa taille doubler par rapport à la première édition,
et offre maintenant (si on lui adjoint un peu de l'analyse réelle des chapitres II, III et IV)
un survol assez complet d'un cours correspondant aux deux années de classe préparatoire
dans un lycée ambitieux*2), avec plus d'une centaine d'exercices corrigés dont beaucoup
sont des classiques faisant partie de la culture de ces classes. Il ne s'agit pas d'un cours
organisé, et je ne pense pas que ce soit l'endroit parfait pour un premier contact avec les
sujets qu'il regroupe (les cours sont faits pour cela) ; son but est plutôt de rassembler et
de préciser, sous une forme compacte, les résultats d'usage constant^.
Le chapitre « Problèmes corrigés » a été enrichi d'exercices posés lors des examens
finaux, et de quatre problèmes : l'un (prob. H. 12) propose une démonstration de
l'irrationalité de Ç(3) qui utilise la fonction T dans le plan complexe, un autre (prob. H.ll) vise à
démontrer l'identité g1/24 EL^iC1 _?n) = Emezl-1)"1^^1^24 due à Euler et en profite
pour passer en revue la plupart des techniques de transformée de Fourier et de
fonctions holomorphes, le troisième (prob. H. 13) présente un résultat très frappant de Borel
concernant la rationalité d'une série J2 anzn à coefficients entiers, et le dernier (prob. H.4)
établit la table des caractères du plus petit groupe simple après A5. Les problèmes de ce
genre sont une spécialité bien française, et je pense qu'ils expliquent en grande partie
les succès de l'École Française de mathématiques : ils permettent d'illustrer l'unité des
mathématiques en montrant, à un niveau relativement élémentaire, l'intérêt de combiner
des techniques différentes. Ils offrent une aide irremplaçable pour assimiler les énoncés
du cours et apprécier leur puissance, et mon conseil serait de chercher à les résoudre (et
d'aller voir*4) la solution en cas d'échec), avant d'essayer de maîtriser les démonstrations
des théorèmes fondamentaux (lire lesdites démonstrations peut toutefois être utile pour
(2)Cela correspond à peu près à ce que j'ai eu la chance de recevoir comme cours en math. sup. (la pénurie
de professeurs de mathématiques n'avait pas encore été résolue par une diminution drastique des heures
d'enseignement au collège et au lycée et on arrivait en classe préparatoire nettement mieux aimé qu'à
l'heure actuelle) ; je voudrais en profiter pour remercier D. Monasse du riche et beau cours qu'il nous a
offert cette année-là, et dont j'utilise le contenu tous les jours de ma vie de mathématicien.
(3)Avec des démonstrations en petits caractères pour ceux qui aiment bien pouvoir vérifier que l'on n'est
pas en train de leur raconter des sornettes ; certaines de ces démonstrations sont d'ailleurs assez belles
(4)Lire la solution d'une question à laquelle on n'a pas réfléchi est la recette idéale pour ne rien apprendre ;
par contre essayer de résoudre une question soi-même est la meilleure manière pour préparer le cerveau
à recevoir et assimiler la solution. Les puristes prétendront qu'il ne faut jamais aller voir la solution et
tout résoudre soi-même (c'est la position des japonais en ce qui concerne les problèmes de go ; celle des
chinois est plutôt qu'il faut réfléchir dix minutes et aller voir la solution si on ne trouve pas ; il y a 30
ans, les japonais étaient de loin les plus forts, mais ils se sont depuis fait dépasser par les chinois et les
coréens...).
6
INTRODUCTION
se faire une idée de la manière dont les concepts s'articulent, mais s'acharner à les retenir
est plutôt une perte de temps).
Les autres ajouts notables sont :
un appendice (annexe E) démontrant la transcendance de ir et l'existence d'une
infinité de £(2n + 1) irrationnels (en écho au prob. H.12),
une construction complète de la fonction zêta p-adique (§ D.4),
des remarques sur les équations diophantiennes (§ F.2).
J'ai appris énormément de choses en écrivant ce texte, et j'espère que le lecteur y
trouvera de quoi satisfaire sa curiosité. Étant arithméticien, j'ai privilégié les problèmes issus
de la théorie des nombres pour illustrer l'unité(5) des mathématiques ; quelqu'un de plus
proche de la physique aurait probablement pu écrire autant d'appendices inspirés de
problèmes physiques et mettant en jeu les mathématiques du Vocabulaire et des chapitres I
à VII. La géométrie et les probabilités sont presque totalement absentes ; c'est fort
regrettable car la vision que ces théories apportent est fondamentale (en particulier en théorie
des nombres ou en physique), mais c'est un reflet de l'organisation de l'enseignement des
mathématiques dans notre pays.
(5)ll est assez fascinant de voir comment les concepts se répondent d'une théorie ou d'un monde à l'autre.
La note 50 du Vocabulaire en fournit une illustration assez frappante. De même, le prob. H.9 m'a été
inspiré par le th. D.3.2 du monde p-adique, dont je me suis demandé ce qu'il pouvait bien devenir dans
le monde réel (ou complexe) ; j'ai réalisé par la suite qu'il s'agissait d'un résultat parfaitement classique
dans la veine du th. de Paley-Wiener.
INTRODUCTION
7
Notations standard
On note N l'ensemble {0,1,2,...} des entiers naturels, Z l'anneau des entiers relatifs,
Q le corps des nombres rationnels, R le corps des nombres réels et C le corps des nombres
complexes. On note Q*, R* et C* les groupes multiplicatifs de Q, R et C.
On note R+ (resp. R* ) l'ensemble des nombres réels positifs (resp. strictement positifs)
et R_ (resp. R*) l'ensemble des nombres réels négatifs (resp. strictement négatifs).
On note R = R U {±00} la droite réelle achevée, et R+ = R+ U {+00} la demi-droite
réelle achevée.
Si t G R, on note [t] sa partie entière, et {t} = t — [t], sa partie fractionnaire.
Si X est un ensemble, on note |X| € N U {+00} son cardinal ; si Y C X, on note
1y : X —» {0,1} la fonction caractéristique de Y (elle est définie par IyM = 1 si x G Y,
et 1y(#) = 0 si x £ Y). Si X et Y sont deux sous-ensembles d'un ensemble E, on note
X — (X D Y) ou simplement X — Y le complémentaire de X D Y dans X.
Si I et X sont des ensembles, on note X1 l'ensemble des applications de I dans X ; un
élément de X1 est noté i 1-» Xi ou i \-> x(i) ou encore (xi)i€i (par exemple si I = N).
On écrit très souvent « a, 6 G X » pour « a € X et 6 € X », et on n'explicite pas tous
les quantificateurs : par exemple, on écrit souvent « \f(x)\ < e si \x\ ^ S » au lieu de
« 1/0*01 ^ £ pour tout \x\ ^ô»
Si A est un anneau, et si n G N — {0}, on note Mn(A) l'anneau des matrices n x n à,
coefficients dans A, GLn(A) C Mn(A) le groupe des matrices inversibles (celles dont le
déterminant est inversible dans A), et SLn(A) le sous-groupe de GLn(A) des matrices de
déterminant 1.
x » 0 (resp. x «C 0) désigne un nombre réel suffisamment grand (resp. petit).
Si /, g sont deux fonctions d'un espace topologique X dans R ou C, la notation / = O(g)
au voisinage de Xq signifie qu'il existe un voisinage V de x0 et une constante C > 0 telle
que \f(x)\ ^ C|p(x)| pour # G V; la notation / = o(g) au voisinage de x0 signifie qu'il
existe un voisinage V de x0 et une fonction e : V —> R+, tendant vers 0 en xo, telle que
\f(x)\ < e(x)\g(x)l pour tout x G V.
VOCABULAIRE MATHÉMATIQUE
La nécessité de définir précisément les objets avec lesquels ils travaillent s'est imposée
graduellement aux mathématiciens confrontés à des contradictions d'ordre presque
métaphysique. L'avènement de la théorie des ensembles (à partir des travaux fondateurs de
G. Cantor datant des années 1870) et l'axiomatisation croissante des mathématiques ont
d'une part fait disparaître un certain nombre d'obstacles psychologiques à la création
d'objets nouveaux^, et d'autre part débouché sur la création d'un vocabulaire extrêmement
précis, qui a rendu possible l'explosion des mathématiques au cours du XXe siècle.
Ce mouvement a fini par atteindre l'enseignement avec l'introduction des « maths
modernes » au collège (et même en grande section de maternelle). Dans les années 70, le
programme enseigné dans le secondaire et dans les classes préparatoires reposait sur le
slogan : « Dieu créa l'ensemble vide et l'homme fit le reste ». C'était un peu radical, mais
avait le mérite de présenter les mathématiques de manière cohérente et de montrer que
l'on pouvait créer de nouveaux objets à partir d'objets déjà existants. La présentation en
était malheureusement extrêmement dogmatique, et l'impression qu'on en retirait était
plutôt que Dieu avait créé l'ensemble vide et la théorie des ensembles, et sur sa lancée, les
entiers, les entiers relatifs, les nombres rationnels, puis les groupes, les anneaux, les corps
et les espaces vectoriels, puis les nombres réels, ensuite il avait introduit des e et des 8,
puis créé la topologie..., et quand il avait enfin été content du résultat, il avait fait don
aux hommes d'une théorie immuable et parfaite, à la beauté froide et lisse.
(f,)Les nombres complexes ont mis près de deux siècles à être acceptés (et même les nombres négatifs ont
eu leurs détracteurs ; un cas extrême est Augustus de Morgan qui continuait à les considérer, au milieu
du XIXc-siècle, comme dénués de tout fondement, et a passé une bonne partie de sa vie à essayer de
prouver qu'on pouvait fort bien s'en passer), alors que, de nos jours, des objets nettement plus compliqués
sont acceptés dès qu'ils ont fait la preuve de leur utilité pour résoudre, ou même formuler proprement,
certains problèmes ; c'est par exemple le cas de l'anneau des « nombres complexes p-adiques » construit
par J.-M. Fontaine (1982). Les obstacles psychologiques n'ont toutefois pas complètement disparu;
l'apparition d'un objet nouveau ne se fait pas sans heurt, et provoque des conflits parfois brutaux entre
les anciens, dont le point de vue « On a fait de très bonnes maths pendant 2000 ans sans avoir
besoin de ces horreurs » reflète l'appréhension devant la perspective de devoir étudier un nouveau sujet
"incompréhensible", et les modernes qui voient dans le nouvel objet la solution à tous les problèmes...
10
VOCABULAIRE MATHÉMATIQUE
Le dogme a changé vers le milieu des années 90, et on est reparti sur le mode : « Dieu
a créé les nombres réels, puis les nombres complexes, et envoyé Gauss sur terre pour
expliquer qu'il n'y avait pas besoin de chercher plus loin. ». Tout procédé de construction
a été soigneusement banni du programme officiel, et une grande partie du vocabulaire
mathématique de base a disparu ou a été vidé de sa substance ^. C'est fort regrettable
car la maîtrise du vocabulaire mathématique demande du temps : il décrit des concepts
qui reposent souvent sur d'autres concepts, et il faut voir fonctionner ces concepts pour
saisir véritablement le sens des mots. Or ce temps fait cruellement défaut une fois passée
la période des classes préparatoires.
Ce chapitre essaie de pallier ces disparitions ; la plus grande partie de son contenu n'est
pas utilisée dans le texte principal W, mais est incluse car elle est susceptible de faire
son apparition dans n'importe quel domaine utilisant des mathématiques. Il ne prend
pas les mathématiques à leur début&\ et le lecteur est supposé avoir déjà des notions
même vagues de la plupart des sujets qui suivent. Plutôt qu'un cours organisé, il s'agit
d'une espèce de dictionnaire, et comme dans un dictionnaire, il n'est pas rare que certains
passages fassent appel à des notions définies ultérieurement.
1. Grammaire élémentaire
L'axiome du choix postule qu'un produit d'ensembles non vides est non vide (i.e. si X* ^ 0, pour
i G I, alors ILei^i ^ 0). Autrement dit, on peut choisir simultanément un élément dans chacun des X*,
si les Xi sont non vides. Cet axiome a l'air évident, mais il est indépendant des axiomes de la théorie
des ensembles sur lesquels reposent les mathématiques modernes, ce qui veut dire qu'on peut choisir de
l'inclure ou non (en analyse, on peut difficilement se passer de l'axiome du choix dénombrable, qui est de
toute façon assez raisonnable : on peut imaginer que face au problème de choisir un nombre dénombrable
d'éléments, on devienne de plus en plus performant, et donc arriver à choisir t^us ces éléments en un
temps fini ; avec un nombre non dénombrable d'éléments, ceci est voué à l'échec, si on doit les choisir un
par un). L'inclure a d'énormes avantages pour démontrer des résultats d'existence, mais il a l'inconvénient
(7>Le programme de la filière PC est à cet égard assez catastrophique, puisque sa dernière mouture a vu
l'introduction de faux concepts, et même de définitions fausses.
(8>Les résultats exposés dans le cours sont en grande partie antérieurs à la mise en valeur des concepts
présentés dans ce chapitre, ce qui fait que l'on peut les présenter, en se contorsionnant un peu, sans
recourir à ces concepts. D'un autre côté, lire « Les misérables » ou les « Disquisitiones arithmeticae » à
la lumière d'une lampe électrique est nettement plus confortable qu'à la lueur d'une chandelle, même si
ces œuvres datent d'avant l'invention de l'ampoule électrique et si la chandelle a un charme certain...
(9>I1 a été écrit de la manière suivante. J'ai d'abord, pour chaque concept de base, fait une liste des
énoncés que j'utilise régulièrement sans me poser de question. C'est plus ou moins ce qui se trouve en
gros caractères. J'ai ensuite rajouté les démonstrations (en général en petits caractères). Une exception
à ce principe est le traitement de la réduction des endomorphismes, où j'ai remplacé le point de vue
enseigné en classes préparatoires par une autre qui donne des résultats plus puissants. J'ai aussi rajouté,
pour les amateurs, une collection de monstres mathématiques, et quelques résultats plus culturels comme
la construction des nombres p-adiques, les théorèmes de Sylow ou la simplicité de An.
1. GRAMMAIRE ÉLÉMENTAIRE
11
de rendre ces résultats d'existence ineffectifs, et on est toujours plus content quand on peut s'en passer.
J'ai essayé de signaler dans le texte les endoits où utiliser l'axiome du choix fait une différence.
1.1. Coefficients binomiaux
On note (*) e Q[X], pour fceN, les polynômes binomiaux ; ils sont définis par (*) = 1
et G) = x(x-'Hx-*+", si k > 1 ; on a donc (x) = X, (x) = 3*=!!, etc.
. Si *>1, alors (x«) - © = (*-i)-
On a : (*+') - © = ((x+i)-(x-W)^(x-„...(x-W) _ xtx-.^x-W) . (^
• Les nombres binomiaux (£), pour fc G N et n € Z sont des entiers vérifiant la relation
Ct1) = © + (fc-i) du trian8le de PascaL
La relation du triangle de Pascal résulte du point précédent. Montrons, par récurrence sur fc,
que (J) G Z pour tout n G Z. C'est clair si k = 0 puisqu'alors (£) = 1. Si A: ^ 1, on a (£) = 0,
et la formule ("J1) - (£) = (k\) permet de déduire de l'hypothèse de récurrence (^J G Z
pour tout n, que (£) G Z pour tout n ^ 0, par récurrence montante sur n, et (£) G Z pour
tout n < 0, par récurrence descendante sur n. Ceci prouve que le résultat est vrai pour k et
permet de conclure.
• Si k, n G N, alors (£) = , _^!)!fc, est aussi le nombre C£ de parties à k éléments dans un
ensemble à n éléments.
La formule (£) = (n_^!)!fc, est immédiate sur la définition. Maintenant, C£+1 = C£ + C*"1
car les parties à k éléments de {1,... ,n + 1} se partitionnent en celles qui ne contiennent
pas n + 1 (il y en a C£) et celles qui contiennent n + 1 et donc ne contiennent que k — 1
éléments de {1,..., n} (il y en a C£-1). Les C£ et les (£) vérifient donc les mêmes relations de
récurrence. Comme C£ = 1 = (£) pour tout n, et comme C§ = 0 = (£), si k ^ 1, on en déduit,
par récurrence sur fc, que C£ = (£) pour tout n G N (ce dernier énoncé se démontre, k étant
fixé, par récurrence sur n). On trouvera une démonstration plus conceptuelle dans l'ex. 3.8.
• On a (-1) = (-1)* et ("») = (-l)*^"1), si *,n e N.
Il suffit de revenir à la formule.
1.2. L'anneau Z des entiers relatifs
• Si A est un sous groupe de Z (muni de +), il existe D > 0 unique, tel que A = DZ.
Si A = {0}, alors D = 0. Si A ^ {0}, alors A contient des éléments > 0 puisque A est stable
par xh-x; soit D le plus petit de ces éléments. Une récurrence immédiate montre que A
contient nD, pour tout n G N, et donc aussi pour tout n G Z puisque A est stable par x »-> — x.
Autrement dit, A D DZ.
Maintenant, soit a G A, et soit r G {0,..., D - 1} le reste de la division euclidienne de a
par D. Alors a - r G DZ c A, et donc r = a - (a - r) G A. Comme D est, par hypothèse, le
plus petit élément strictement positif de A, cela implique r = 0, et donc a G DZ. On en déduit
l'inclusion A c DZ et l'égalité A = DZ que l'on cherchait à démontrer.
On écrit a \ b (pour a divise b) pour signifier que b est un multiple de a, et a \ b pour
signifier le contraire. Si a, 6 G Z, on définit le plus grand diviseur commun pgcd(o,6) de a
12
VOCABULAIRE MATHÉMATIQUE
et b comme étant 0 si o = b = 0, et comme étant le plus grand entier d > 0 divisant à la
fois a et 6, si a ^ 0 ou b ^ 0. On dit que a et 6 sont premiers entre eux, si pgcd(a, b) = 1.
Un élément p de N est premier, si p ^ 1 et si les seuls diviseurs de p sont 1 et p. On
note & = {2,3,5,...} l'ensemble des nombres premiers. Il est clair que si p G ^, et si
o G N, alors soit p \ a auquel cas pgcd(p, a) = p, soit p \ a auquel cas p est premier à a.
Remarquons que aZ + 6Z = {ax + 6?/, #,?/ G Z} est un sous-groupe de Z ; et c'est le
plus petit sous-groupe de Z contenant a et 6 (en effet, un sous-groupe de Z contenant a
et b contient ax et by et donc aussi ax + &?/, pour tous x,y G Z). On note (a, 6), l'élément
de N tel que aZ + &Z = (o, 6)Z ; cet élément existe et est unique d'après le point ci-dessus.
• Si a, b G Z, alors (a, b) = pgcd(a,6) ; en particulier, a et b sont premiers entre eux si et
seulement si il existe u, v G Z tels que l = au + bv (théorème de Bézout^10) ).
Si a = b = 0, le résultat est immédiat. Suposons donc a ^ 0 ou b ^ 0. Par définition de (a, 6),
a et 6 sont des multiples de (a, 6), et donc (a, 6) < pgcd(a, b). Réciproquement, si d ^ 1 divise
a et 6, alors d divise ax + by, quels que soient x,j/6Z;en particulier, d divise (a,6) et donc
d < (a, b). On en déduit l'inégalité (a, 6) ^ pgcd(a, 6) qui permet de conclure.
• Si a est premier avec b et c, alors a est premier avec 6c ; si a divise bc et si a est premier
avec 6, alors a divise c (lemme de Gauss).
Si (a,6) = (a,c) = 1, il existe u^vi tels que aui + bv\ = 1 et ^2)^2 tels que at^ + CV2 = 1.
On a donc 1 = (a^i + bv\){au2 + c^) = an + 6ci>, avec u = au\U2 + bv\U2 + cu\V2 etv = i>iV2,
ce qui prouve que (a, bc) = 1. On en déduit le premier énoncé.
Si 6c = ad et an + 6v = 1, alors acu + adv = c, et donc a(cu + dv) = c, ce qui prouve que a
divise c ; d'où le second énoncé.
• Si n G Z — {0}, il existe des nombres premiers pi,... ,pr tels Que n = sign(n)pi • • -pr ;
de plus, les p^ pour 1 ^ i ^ r, sont uniquement déterminés à Tordre près. En d'autres
termes, n peut se factoriser de manière unique comme un produit de facteurs premiers <n)
(théorème fondamental de l'arithmétique).
Le cas n < 0 se déduit du cas n > 0 ; on peut donc supposer n > 0.
L'existence se démontre par récurrence. C'est évident pour n = 1, auquel cas, on a r = 0
(un produit vide vaut 1 par définition). Maintenant, si n ^ 2 est premier, alors n = n est
une factorisation de n sous la forme voulue. Si n ^ 2 n'est pas premier, alors n = aè, avec
2<a^n-let2^6<n-l. On peut donc appliquer l'hypothèse de récurrence à a et 6,
ce qui permet d'écrire a sous la forme a = pi • • -ps, et b sous la forme b = ps+i • • -pr, où
Pi,... ,pr sont des nombres premiers. On a alors n = p\ • • -pr, ce qui prouve que n admet une
factorisation sous la forme voulue.
(10)I1 est en fait dû à C.-G. Bachet de Méziriac (1624) ; Bézout (1730-1783) a démontré l'énoncé analogue
dans l'anneau K[X].
(11)Si n est le produit de deux nombres premiers ayant chacun un millier de chiffres, on peut prouver, avec
l'aide d'un ordinateur, que n n'est pas premier, mais il est impossible, à l'heure actuelle, de retrouver les
deux nombres premiers qui divisent n. Ceci est à la base de la sécurité du système RSA, datant de 1977,
en vigueur pour les transactions sur Internet. C'est aussi une bonne illustration de la différence entre la
théorie et la pratique, qui en théorie sont la même chose, mais en pratique...
1. GRAMMAIRE ÉLÉMENTAIRE
13
L'unicité se démontre en utilisant le lemme de Gauss. Si pi • • -pr = qi • • • qs où les pi et les
qj sont des nombres premiers, le lemme de Gauss montre que pr divise l'un des qj et donc
lui est égal. Quitte à permuter les ty, on peut supposer que pr = qs, et en divisant les deux
membres par pr = qSy on se ramène à r - 1 et s - 1, ce qui permet de conclure par récurrence.
• Il y a une infinité de nombres premiers.
Supposons le contraire, et soient pi,... ,pr les nombres premiers. Soit n = (pi • • -pr) +1, et
soit p un nombre premier divisant n (il en existe grâce au point précédent). Comme p ne peut
pas être un des pi puisque le reste de la division par pi est 1, on aboutit à une contradiction
qui permet de conclure.
• Si n G Z — {0}, et si p est un nombre premier, on note vp(n) le nombre de fois que p
apparaît dans la décomposition en facteurs premiers de n ; alors pv^n^ est aussi la plus
grande puissance de p divisant n, et vp(n) est la valuation p-adique de n.
On étend cette définition à n G Z en posant vp(0) = +oo. On dispose alors d'un
critère de divisibilité assez utile : a divise b si et seulement si vp(a) ^ vp(b) pour tout
nombre premier p. En revenant à la définition de pgcd(a,6), on en déduit la formule
pgcd(a,6) = Hppinf(^(a)^(6)).
Exercice 1.1. Si a, 6 G Z, on définit le plus petit commun multiple ppcm(a, b) de a et 6 comme le plus
petit entier ^ 0, multiple à la fois de a et b.
(i) Montrer que aZ n 6Z est un sous-groupe de Z, et que aZnbZ = ppcm(a, 6)Z.
(ii) Montrer que ppcm(a,6) = nppsup(^(a),Vp(6)), si a ^ 0 et b ^ 0.
Exercice 1.2. (i) Montrer que vp(ab) = vp(a) +vp(b) et vp(a+b) ^ inf(vp(a)y vp(b))y pour tous a, 6 G Z.
(ii) Montrer que vp a un unique prolongement à Q tel que vp(xy) = vp(x)+vp(y), pour tous x, y G Q,
et que l'on a alors vp(x + y) ^ inf(vp(x)yvp(y))y quels que soient x,y G Q.
(iii) Montrer que \/2 est irrationnel.
Exercice 1.3. (i) Montrer que vp(a + b) = inï(vp(a), vp(b)), si vp(a) ^ vp(b).
(ii) Montrer que vp(]£™=i a*) = infi^n vp(di), si l'inf. n'est atteint que pour une valeur de i.
(iii) Montrer que 1 + 5 + § H h £ n'est pas un entier, si n ^ 2.
Exercice 1.4- (i) Soient n ^ 1 et p un nombre premier. Montrer que vp(n\) = [^] + [fi] + [fi] H .
En déduire que vp(n\) = n~pJ?[n', où Sp(n) est la somme des chiffres de n en base p.
(ii) Montrer que [x] - [f] - [f ] - [f ] + [f ] est toujours ^ 0. En déduire que (l^n^^(an)i est un
entier*12), pour tout n G N.
(iii) Montrer que ^p((a*6)) est le nombre de retenues dans l'addition de a + b en base p, si a, 6 G N.
(iv) Soit p un nombre premier. Montrer que (?) est divisible par p, si 1 < i < p - 1. En déduire que
np -n est divisible par p pour tout n G Z (petit th. de Fermât).
<12) Cette observation, couplée avec la formule de Stirling, a permis à P. Tchebychev de montrer, en 1852,
que le nombre n(x) de nombres premiers < x vérifie (0,92 + o(l))y^ < n(x) < (1,05 + o(l))y^,
encadrement que l'on pourra comparer avec le th. des nombres premiers de l'annexe A. En 2005, F. Rodriguez-
Villegas a démontré que la série Z)n^o (isn)f(ion)\!(6n)! ^n ^ta*fc algébrique, ce qui signifie qu'il existe un
polynôme P à coefficients dans Q(T) qui l'annule ; il a aussi prouvé que le degré minimal d'un tel polynôme
est 483840, ce qui rend son explicitation problématique...
14
VOCABULAIRE MATHÉMATIQUE
1.3. Parallélisme entre logique élémentaire et langage ensembliste
Si p est un prédicat (i.e. une application à valeurs dans {vrai, faux} = {0,1}), alors p
est aussi la fonction caractéristique de l'ensemble {x, p(x)} des x pour lesquels p(x) = 1.
• La négation p i-* p = l—p correspond au passage au complémentaire : {x, p(x)} est le
complémentaire de {x, p(x)}.
• A ("et") correspond à l'intersection : {x, p(x) A q(x)} = {x, p(x)} D {x, q(x)}.
• V ("ou") correspond à la réunion : {x, p(x) V q(x)} = {x, p(x)} U {x, q(x)}.
• La formule pVg = pAq (resp. pAq = p\/q) devient : le complémentaire de la réunion
(resp. l'intersection) est l'intersection (resp. la réunion) des complémentaires.
• =>• correspond à l'inclusion : p =>■ q si et seulement si {x, p(x)} C {x, q(x)}.
• V correspond à une intersection : {x, Vi G I,Pi(x)} = C\i€i{x, Pi(x)}.
• 3 correspond à une réunion : {x, 3i € l,Pi(x)} = Ui€i{#, Pi(x)}.
Considérons, par exemple, deux espaces métriques X et Y, et une suite de fonctions (/n)neN de X
dans Y. Soit A l'ensemble des a; G X tels que fn(x) converge. Alors A peut s'écrire sous la forme :
A ={x G X, 3y G Y, Vj G N, 3N G N, Vn ^ N, d(fn(x),y) < 2"'}
= U^y Hj-eN UN6N nn>Nf-l({y' G Y, d(y,y') < 2^}).
Si Y est complet, on peut utiliser le critère de Cauchy au lieu de donner un nom à la limite, et on obtient
[en notant /n>p : X -» Y x Y la fonction x •-► (/n(z), /?(#))] :
A ={x G X, V? G N, 3N G N,Vn,p ^ N, d(fn(x),fp(x)) < 2^}
= ni6N UN6N nn,p^N /-J({(î/,y') G Y x Y, d(y,y') < 2">'}).
La seconde formulation a l'avantage de ne faire intervenir que des intersections et réunions indexées par
des ensembles dénombrables.
1.4. Ensembles dénombrables
Un ensemble est dénombrable s'il est fini ou s'il peut être mis en bijection avec N.
• Un sous-ensemble d'un ensemble dénombrable est dénombrable.
Il suffit de démontrer qu'un sous-ensemble X de N, qui n'est pas fini, peut être mis en
bijection avec N. Si a; G X, soit (p(x) = \{y G X, y < x}\. Si xq est le plus petit élément de X,
on a (p(xo) = 0, ce qui montre que </?(X) contient 0. Si (p(x) = n, et x' est le plus petit élément
de X strictement supérieur à x, on a (p(x') = n + 1, ce qui prouve que ip est surjective. Par
ailleurs, y? est injective car strictement croissante (si x\ < #2, alors {y G X, y < #2} contient
{y G X, y < xi} et xi). Ceci permet de conclure.
• Si (p : X —» Y est injective et si Y est dénombrable, alors X est dénombrable; si
(p : X —> Y est surjective et si X est dénombrable, alors Y est dénombrable.
Si (p : X —» Y est injective, alors y? réalise une bijection de X sur <p(X) qui est dénombrable
comme sous-ensemble d'un ensemble dénombrable, et X est dénombrable. Si <p : X —> Y est
surjective, on peut choisir (cela demande l'axiome du choix), pour toutj/ G Y, un antécédent
s(y) G Y de y par (p. Alors s : Y -> X est injective car s(yi) = s(y2) implique j/i = y>(s(î/i)) =
<p(s(y2)) = î/2) et donc Y est dénombrable si X l'est, d'après ce qui précède.
1. GRAMMAIRE ÉLÉMENTAIRE
15
• Un produit fini d'ensembles dénombrables est dénombrable.
Soient Xi,..., X& des ensembles dénombrables, X = Xi x • • • x X&, et pi,... ,p& des nombres
premiers distincts. Soit ipi : X* —> N injective, pour tout i G {1,..., fc}. Alors <p : X —> N,
définie par <p(xi,..., Xk) = p*l^Xl' • - - p^*1*' est injective d'après le « théorème fondamental de
l'arithmétique » (unicité de la factorisation d'un entier naturel non nul en produit de nombres
premiers).
• Une réunion dénombrable d'ensembles dénombrables est dénombrable.
Soit (Xi)ieiî avec I dénombrable et chacun des X* aussi. Soient ipi : X* —> N, pour i G I,
des applications injectives, et soit YcIxN l'ensemble des couples (i, <#(#)), pour i G I et
x G Xf. Alors Y est dénombrable comme sous-ensemble de l'ensemble dénombrable I x N, et
l'application (i,y) i-> fyl(y) de Y dans Uie\Xi est surjective, ce qui prouve que U^iX* est
dénombrable.
• Z, Nd, Zd, si d e N, et Q sont dénombrables<13>.
L'application (a, b) i-> a - b est une surjection de N x N sur Z, et comme N x N est
dénombrable, en tant que produit fini d'ensembles dénombrables, il en est de même de Z. Les
ensembles Nd, Zd sont dénombrables puisque ce sont des produits finis d'ensembles
dénombrables. Enfin, (a, 6) i-> | induit une surjection de Z x (Z - {0}) sur Q qui, de ce fait est
dénombrable, Z et Z - {0} l'étant.
• R et l'ensemble {0,1}N des suites à valeurs dans {0,1} ne sont pas dénombrables.
Supposons que {0,1}N est dénombrable. Il existe donc une bijection n i-> xn de N sur {0,1}N.
Chaque xn est une suite xn = (Xn^keNi où xn^ G {0,1}, ce qui permet de considérer la suite
y = (yk)k€Ni où yk = 1 - Xk,k- Pai% construction, la suite y a sa n-ième valeur distincte de celle
de xn, pour tout n, et on a donc y^xn, quel que soit n G N, ce qui est en contradiction avec
l'hypothèse selon laquelle n i-> xn est surjective ; c'est donc que {0,1}N n'est pas dénombrable.
Cet argument est l'argument diagonal de Cantor (1891).
Pour démontrer que R n'est pas dénombrable, il suffit de constater que si X désigne le
sous-ensemble de [0,1[ des nombres dont le développement décimal ne comporte que des 0 et
des 1, alors X est en bijection avec {0,1}N, et donc n'est pas dénombrable. Il en est a fortiori
de même de R, qui contient X.
Exercice 1.5. Montrer que l'ensemble ^(N) des parties de N n'est pas dénombrable, mais que
l'ensemble des parties finies de N est dénombrable.
Exercice 1.6. On rappelle que x G C est algébrique s'il existe P G Q[X] non nul tel que P(x) = 0, et
que x G C est transcendant s'il n'est pas algébrique. Montrer que l'ensemble Q des nombres algébriques
est dénombrable. En déduire qu'il existe des nombres transcendants.
Exercice 1.7. Soit (B^)^-6i une famille de disques ouverts non vides de C. Montrer que si les B^ sont
deux à deux disjoints, alors I est dénombrable.
(13>Ces résultats, la non dénombrabilité de R et la dénombrabilité de l'ensemble des nombres algébriques
sont le fruit d'un échange de lettres entre G. Cantor et R. Dedekind datant de la fin 1873. Cantor prouvera
en 1877 que [0,1] et [0,1] x [0,1] peuvent être mis en bijection ; comme il l'écrit à Dedekind : « Je le vois,
mais je ne le crois pas ».
16
VOCABULAIRE MATHÉMATIQUE
Exercice 1.8. Soit / : R —» R une fonction croissante.
(i) Montrer que / admet une limite à droite et une limite à gauche en tout point et que, si #o € R,
alors f(x$) = mfx>Xo f(x) et f(xô) = supx<a;o f(x) ; en déduire que f(xô) < f(x0) < /(a?J). A quelle
condition / est-elle continue en #o ?
(ii) Montrer que, si x0 < Xi, alors /(xj) < f(xï).
(iii) Montrer que l'ensemble D des points où / est discontinue est dénombrable.
Exercice 1.9. Soient X un sous-ensemble dénombrable de R, dense (i.e. ]a, 6[nX ^ 0, pour tous a < b),
etnt-*xn une bijection de N sur X. On définit, par récurrence, une suite n •-> y?(n), en posant <p(0) = 0,
<p{\) = 1 et en prenant pour </?(n) le plus petit entier i ^ ip{n—\) tel que xi soit entre x^n-i) et xv,(n_2).
Montrer que la suite (a^n^neN a une limite et que cette limite n'appartient pas àX. En déduire que R
n'est pas dénombrable.
Exercice 1.10. (difficile) Un « huit » est la réunion de deux cercles dans le plan, de même rayon (non
nul), tangents en un point. Montrer que l'on peut mettre dans le plan au plus un nombre dénombrable
de huit deux à deux disjoints.
Exercice 1.11. (difficile) Un « tripode » est la figure formée de trois segments [G, A], [G, B] et [G, C],
où A, B, C sont les sommets d'un triangle équilatéral (non réduit à un point) et G est le centre de gravité
du triangle. Montrer que l'on peut mettre dans le plan au plus un nombre dénombrable de tripodes deux
à deux disjoints.
2. Structures algébriques
Dans ce §, on réunit les définitions concernant les structures algébriques les plus
courantes ; les exemples illustratifs utilisent des objets qui sont en général étudiés plus loin
dans le texte. Les structures algébriques se sont imposées graduellement aux
mathématiciens au cours du XIXe : le terme de « groupe » a été introduit par Galois (1830) dans son
étude de la solubilité des équations polynomiales par radicaux, mais il a-fallu attendre
1854 pour que Cayley donne une définition axiomatique d'un groupe abstrait (ce que
Galois appelle groupe correspond plutôt à une orbite sous l'action d'un groupe fantôme).
De même, les calculs dans R2, R3 remontent à assez loin, mais il a fallu attendre le
développement de l'analyse fonctionnelle dans les années 1930 pour que la définition
axiomatique d'espace vectoriel [proposée par Grassmann (1862) et précisée par Peano (1888) )
soit universellement adoptée et que l'on remplace avantageusement <14) coordonnées et
matrices par vecteurs et applications linéaires. Une des grandes forces des mathématiques
réside dans ce processus en deux temps : identification de propriétés communes d'objets
a priori très différents (comme les permutations de {1,... ,n} où les isométries du plan,
ou comme l'espace R2 et celui des fonctions continues sur [0,1]), puis définition, à partir
de ces propriétés, d'une catégorie d'objets (les groupes dans le premier cas, les espaces
vectoriels dans le second) que l'on peut étudier pour eux-mêmes, ce qui fournit des outils
(14>Nous encourageons le lecteur à essayer de résoudre directement l'équation A2 + 1 = 0 dans M;J(R)
ou même M2(R).
2. STRUCTURES ALGÉBRIQUES
17
pour comprendre à la fois les objets initiaux ayant permis de dégager la notion et d'autres
que l'on n'avait pas forcément pensé à mettre sur le même plan jusque-là.
2.1. Lois de composition
Soit X un ensemble. Une loi de composition 9 sur X est une règle permettant de
fabriquer, à partir de deux éléments quelconques x, y de X, un élément xVy de X ; c'est
donc une application de X x X dans X. Les exemples ne manquent pas :
o Si E est un ensemble, l'ensemble des applications u : E —► E est muni de la composition o.
o L'ensemble des propositions logiques est muni des lois A (= et), V (= ou) et de l'implication =>.
o L'ensemble <^(E) des parties d'un ensemble E est muni de la réunion U, l'intersection n, la différence
symétrique A (A A B est le complémentaire (A U B) - (A n B) de A n B dans A U B).
o L'ensemble Z des entiers relatifs est muni de l'addition -f, la multiplication x (ou •), la soustraction —.
La loi 9 est commutative^ si xVy = yVx, pour tous x, y G X.
Elle est associative^ si (xVy)Vz = xty(yVz)y pour tous x,y,z G X. Si la loi est
associative, on peut faire les opérations dans l'ordre que l'on veut, ce qui permet de supprimer
les parenthèses : on écrira donc souvent xWyVz au lieu de (xVy^z ou xVtytyz), si la
loi 9 est associative.
On dit que e G X est un élément neutre^ pour 9, si eVx = xVe = x, pour tout x G X.
Un élément neutre est unique car e = eW = e' si e et e' sont des éléments neutres.
Si 9 admet un élément neutre, on dit que a est un inverse à gauche (resp. à droite)
de x si aVx = e (resp. xVa = e). Si 9 est associative, on dit que x est inversible s'il
admet des inverses à droite et à gauche (18> ; ceux-ci sont alors uniquement déterminés et
égaux puisque a = a9e = atyfaVb) = (aVx^b = eVb = b, si a et b sont des inverses à
gauche et à droite de x.
Si 9 et 4 sont deux lois de composition sur X, on dit que 4 est distributive par
rapport*19* à 9, si (aVb)+x = (a+x)V(béx) et x*(a96) = (x4>a)V(xéb), pour tous
a, 6, x G X.
(15)C'est le cas de toutes les lois ci-dessus à l'exception de la composition o, de => sur l'ensemble des
propositions logiques et de - sur Z.
(16)C'est le cas de toutes les lois ci-dessus à l'exception de => et de -.
<17)Les lois o, u, n, A, + et x possèdent des éléments neutres, à savoir id, 0, E, 0, 0 et 1.
<18)Dans le cas de la loi o, une application u : E —► E admet un inverse à gauche si et seulement si elle
est injective ; elle admet un inverse à droite si et seulement si elle est surjective (cela demande l'axiome
du choix dans le cas où E est l'infini), et elle est inversible si et seulement si elle est bijective; pour la
loi A, tout élément est son propre inverse; dans Z, tout élément n admet un inverse —n pour la loi +,
mais seuls 1 et -1 admettent un inverse pour la loi x.
<I9)Dans les exemples ci-dessus, A est distributive par rapport à V, et V l'est par rapport à A; U est
distributive par rapport à n et A, et n l'est par rapport à U ; x est distributive par rapport à + et -.
18
VOCABULAIRE MATHÉMATIQUE
2.2. Exemples de structures algébriques
2.2.1. Groupes. Un groupe G est un ensemble non vide, muni d'une loi (g, h) —► gh,
associative, possédant un élément neutre e, et telle que tout élément g soit inversible (on
note g~l l'inverse de g).
Si la loi est commutative, on dit que G est commutatif on abélien. La loi de groupe d'un
groupe commutatif est souvent notée +, auquel cas l'élément neutre est noté 0 et l'inverse
de x e G est noté — x et appelé l'opposé de x. Une loi notée + ou 0 ou ffl est implicitement
commutative, à moins que l'auteur n'ait vraiment décidé de rendre son texte illisible.
Si la loi de groupe est notée multiplicativement, l'élément neutre de G est en général
noté 1 au lieu de e ; s'il s'agit d'un groupe de bijections d'un ensemble X, l'élément neutre
est l'identité de X, et est souvent noté id.
Comme groupes, citons le groupe /jd des racines D-ièmes de l'unité dans C (alinéa 3.1.1), le groupe
symétrique Sn et son sous-groupe An (n° 3.4), le groupe GLn(A) des matrices nxn inversibles à coefficients
dans un anneau A et son sous-groupe SLn(A) des matrices de déterminant 1 (n° 7.7), le groupe des points
rationnels sur une courbe elliptique (prob. H.8 et annexe F). Notons aussi qu'un anneau (cf. ci-après) est
un groupe pour l'addition, et que l'ensemble de ses éléments inversibles (non nuls) est un groupe pour la
multiplication (par exemple (R,+), (Q,+), (R*, x), (Q*, x) sont des groupes).
2.2.2. Anneaux. Un anneau A est un ensemble non vide muni d'une loi d'addition +
qui fait de A un groupe commutatif (d'élément neutre 0) et d'une loi de multiplication x
ou -, associative, possédant un élément neutre 1, et distributive par rapport à l'addition.
On dit que A est commutatif si la multiplication est commutative. On dit que A est intègre
si A ^ {0} et si xy = 0 => x = 0 ou y = 0 ; on dit que # G A est un diviseur de 0 s'il
existe y ^ 0 tel que xy = 0 ; un anneau A est donc intègre si et seulement si A ^ {0} et
le seul diviseur de 0 est 0.
Comme anneaux commutatifs, citons l'anneau Z des entière relatifs, l'anneau Z/DZ des entiers mo-
dulo D (n° 2.8), l'anneau Zp des entiers p-adiques, l'anneau A[X] des polynômes en la variable X à
coefficients dans un anneau commutatif A (n° 4.1), l'anneau A[Xi,..., Xn] des polynômes en n variables
(alinéa 4.3.1), l'anneau K[[T]] des séries formelles à coefficients dans un corps commutatif K (n° 1 du § V.l) ;
comme anneau non commutatif, nous aurons surtout affaire à l'anneau Mn(A) des matrices n x n &
coefficients dans un anneau commutatif A (n° 7.7).
• Si A est un anneau, l'ensemble A* des éléments inversibles(2°) non nuls de A est un
groupe pour la multiplication s'il est non vide*21).
Il s'agit de prouver que le produit de deux éléments inversibles est encore inversible, mais
on a (xy)(y~lx~1) = x{yy~l)x~l = xx~l = 1 et (y~1x~l)(xy) = y~l(x~1x)y = y~ly = 1, ce
qui prouve que xy est inversible d'inverse y~lx~l si x et y le sont.
• Si A est un anneau, on a 0-x = x-0 = 0, pour tout a; G A, et x-{—y) = (—x)-y = — (x-y)
pour tous x, y G A.
(2°)Pour la multiplication ; l'inversibilité pour l'addition est incluse dans la définition d'un anneau.
*21)Si A = {0}, alors 0 = 1 et 0 est inversible, mais A* n'est pas un groupe car il est vide ; on remarquera
que l'inversibilité de 0 pour la multiplication implique A = {0} d'après le point suivant.
2. STRUCTURES ALGÉBRIQUES
19
y • x = (0 + y) • x = (0 • x) + (y • x), et donc 0 = 0 • x, comme on le voit en ajoutant
-(y • x) des deux côtés ; de même x • y = x • (y + 0) = (x • y) + (x • 0), et donc 0 = x • 0.
De même x • (—y) + x • y = x • (-y + y) = x • 0 = 0, et donc x • (—y) = —(x • y), et
(-x) • y + x • y = (-x + x) • y = 0 • y = 0, et donc (-x) • y = -(x • y).
2.2.3. Corps. Un corps K est un anneau dans lequel tout élément non nul est inversible
(on note x-1 ou £ l'inverse de x ^ 0), et K* = K - {0} est non vide(22) (c'est donc un
groupe). Un tel corps est dit commutatif si la multiplication est commutative.
Comme corps, citons le corps Q des nombres rationnels (n° 20.2), le corps R des nombres réels (n° 20.3),
le corps C des nombres complexes, le corps Qp des nombres p-adiques (n° 20.4), le corps K(X) des fractions
rationnelles à coefficients dans un corps K (alinéa 4.2.3), ou encore le corps Fq à q éléments, si q est une
puissance d'un nombre premier (n° 8.7).
• Si A est un anneau commutatif intègre, on construit son corps des fractions Fr(A)
comme l'ensemble des classes d'équivalence de couples (a, b) e A x (A — {0}) pour la
relation(23> (a, b) ~ (a', bf) si et seulement si ab1 — a'b = 0, muni des lois + et • définies par
(a, b) + (a', b') = (ab' + a'b, bb') et (a, b) • (a', b') = (aa\ btf). La classe de (a, b) est notée f,
celle de (a, 1) est simplement notée a, ce qui permet de considérer A comme un sous-
ensemble de Fr(A), et on a | = b~la dans Pr(A). Les lois d'addition et de multiplication
prennent alors les formes plus habituelles f + f = ab'^a'b et f $■ = fg£.
Par exemple, on a FY(Z) = Q, Fr(K[X]) = K(X) et, plus généralement, le corps des fractions de
K[Xi,..., Xn] est le corps K(Xi,..., Xn) des fractions rationnelles en n variables.
2.2.4- Modules et espaces vectoriels. Si A est un anneau, un A-module M (ou un
module sur A) est un groupe commutatif pour une loi + (d'élément neutre 0), muni d'une
action (a, x) h^ ax de A, vérifiant :
1 x = x, a(x -t- y) = ax + ay, (a + b)x = ax + bx, (ab)x = a(bx),
quels que soient x,y e M et a, b G A. On a alors Ox = 0, a0 = 0 et (—a)x = —(ax) =
a(—x), si a G A et x € M pour les mêmes raisons que ci-dessus.
Si K est un corps commutatif, un K-module est en général appelé un K-espace vectoriel
ou un espace vectoriel sur K.
L'analyse fournit une pléthore d'espaces vectoriels sur R ou C, par exemple les espaces de fonctions
<â?(Rm), «r°°(Rm), J/"(Rm), Lx(Rm), continues, <*f°°, de Schwartz (§ IV.3, n° 3), sommables (§ III.2, n° 1)
sont des C-espaces vectoriels. Il est souvent profitable de considérer un K-espace vectoriel de dimension
fini muni d'un endomorphisme u comme un K[X]-module (n° 10.2).
• Une différence fondamentale entre les espaces vectoriels et les modules sur un anneau
qui n'est pas un corps est que Xx = 0 et À ^ 0 impliquent x = 0 dans un espace vectoriel
(car x = X~l\x = À-10 = 0), mais pas dans un module sur un anneau qui n'est pas un
corps (par exemple, on a 2-3 = 0 dans le Z-module Z/6Z sans que 3 soit nul dans Z/6Z).
*22)()n impose donc 1^0 dans un corps; l'anneau {0} n'est pas un corps.
(23)Cf no 2 7 La transitivité résulte de la relation b'(ab" - a"b) = 6"(a6' - a'b) - b{a"b' - a'b") qui
implique, car A est intègre et b' ^ 0, que ab" - a"b = 0 si ab' - a'b = a"b' — a'b" = 0.
20
VOCABULAIRE MATHÉMATIQUE
• Tout groupe commutatif (et donc tout anneau, tout corps, tout module sur un anneau,
etc.) est naturellement un Z-module, en définissant nx par récurrence sur n, par Ox = 0,
(n + l)x = nx + x si n € N, et nx = —((—n)x), si n ^ 0.
Montrer que ceci définit bien une action de Z est un exercice fastidieux qui n'est pas sans
rappeler la démonstration du fait que Z est un anneau en partant des axiomes de Peano.
2.2.5. Algèbres. Si A est un anneau commutatif, une A-algèbre A est un A-module
muni d'une multiplication notée -, associative, distributive par rapport à l'addition, et qui
vérifie a (x-y) = (ax)-y = x-(ay), pour tous a e A et x,y e A (i.e. l'action de A commute
à la multiplication). Une algèbre est commutative si la multiplication est commutative,
unitaire si elle possède un élément neutre pour la multiplication (c'est alors un anneau).
• Tout anneau est naturellement une Z-algèbre ; toute A-algèbre est une Z-algèbre, si A
est un anneau commutatif.
Il s'agit de vérifier que la structure de Z-module définie ci-dessus satisfait les relations
n (xy) = (nx) y = x (ny), ce qui se démontre par une récurrence sans mystère pour n ^ 0, et
par passage à l'opposé pour n ^ 0.
Si A est une Z-algèbre, et si x € A, on définit xn, pour n ^ 1, par x1 = x et xn+1 = xnx,
si n ^ 1, et on vérifie, par récurrence sur m, que xn+m = xnxmJ si n,m € N. Si A est
unitaire, on pose x° = 1 pour tout a: € A (y compris x = 0), et si x est inversible dans A,
on pose xn = (x~l)~n, si n ^ 0; on vérifie que xn+m = xnxm pour tous n,m € Z, et donc
que nHi" est un morphisme de groupes de Z dans A*.
• Si a, b € A commutent, alors :
o an - bn = (a - b)(an-1 + an~2b + • • • + 6n_1), si n est un entier ^ 2,
o (a + 6)n = (J)an + ©an-16+ ^an~2b2 + • • • Qbn, si n est un entier 2*1 (formule du
binôme qui peut se condenser en (a+b)n = Y%=o (")an-i&\ pour n € N, si A est unitaire).
La première formule se démontre en développant le membre de droite, la seconde se prouve
par récurrence : elle est immédiate si n = 1, et on passe de n à n + 1 en utilisant l'identité
(n+l) = (J) + (.^), et en traitant directement les termes an+1 et 6n+1.
Si A est une Z-algèbre, on dit que # € A est nilpotent s'il existe m e N tel que xm = 0,
et si A est unitaire, on dit que x est unipotent si x — 1 est nilpotent.
• Si x e A est unipotent, alors x est inversible et xn = X)fceN ©0e- *)*> Pour tout n ^ Z,
où la somme dans le membre de droite est finie car (x — X)k = 0 si k est assez grand ; en
particulier, si A est une Q-algèbre, xn est un polynôme en n .
Il suffit de vérifier que (1 + (x - l))(ET=o C)(* " 1)*) = T,T=o (TH* " *)*• si n 6 N,
et si m G N est tel que (x — l)m = 0. En effet, une récurrence montante (la même que ci-
dessus) permet d'établir la formule pour n G N, et pour n = — 1 la formule prouve que x
est inversible (son inverse étant 1 + (1 - x) + • • • (1 - #)m-1 puisque ("jfc1) = (— l)fc) et une
récurrence descendante permet d'en déduire la formule pour n < 0. Comme (x - l)m = 0, le
membre de gauche se réécrit sous la forme 1 + Y,T=i (O + (&-i))(x ~ 1)fc> et la formule est
donc une conséquence de l'identité (£) + (fc"x) = ("jj"1) entre nombres binomiaux.
2. STRUCTURES ALGÉBRIQUES
21
Exercice 2.1. Soit A un anneau.
(i) Montrer que x+y est nilpotent si x et y commutent et sont nilpotents ; le résultat est-il encore vrai
si a: et y ne commutent pas ?
(ii) Montrer que ax est nilpotent si x l'est et si a et a; commutent ; le résultat est-il encore vrai si a et
y ne commutent pas ?
(iii) On suppose A commutatif. Montrer que l'ensemble des éléments nilpotents est un idéal de A.
2.3. Sous-trucs de trucs
Un sous-truc d'un truc est un sous-ensemble non vide stable par les lois définissant la
structure de truc. Dans les cas considérés plus haut, cela se traduit de la manière suivante.
Si G est un groupe, un sous-groupe H de G est un sous-ensemble de G contenant
l'élément neutre, stable par la loi de groupe (i.e. xy G H, si x,y G H) et par passage à
l'inverse (x~l G H si x G H) ; il suffit pour cela que H ^ 0 et que xy~l G H si x, y G H.
Si A est un anneau, un sous-anneau A' de A est un sous-groupe de A pour l'addition,
qui contient 1 et qui est stable par multiplication (i.e. x • y G A', si x,y G A').
Si K est un corps, un sous-corps K' de K est un sous-anneau de K stable par passage
à l'inverse (i.e. x~l G K' si x G K' - {0}).
Si M est un A-module, un sous-A-module M' de M est un sous-groupe de M pour
l'addition qui est stable pour l'action de A (i.e. a x G M' si a G A et x G M'). Un
sous-A-module de A est appelé un idéal de A.
Si V est un K-espace vectoriel, un sous-espace de V est un sous-K-module de V.
Si A est une A-algèbre, une sous-A-algèbre de A est un sous-A-module de A stable par
multiplication.
Exercice 2.2. (Quaternions de Hamilton, 1843) Soit H = {(_^£), a,&€C}
(i) Montrer que H est un sous-anneau de M2(C), puis que c'est un corps non commutatif.
(ii) Résoudre l'équation x2 + 1 = 0 dans H ; le résultat est-il surprenant ?
Dans tous les cas ci-dessus, un sous-truc d'un truc est encore un truc (i.e. un sous-
groupe d'un groupe est un groupe, un sous-anneau d'un anneau est un anneau, etc.) avec
les lois et actions héritées de celles du truc initial.
• L'intersection d'une famille quelconque de sous-trucs est un sous-truc; on définit le
sous-truc engendré par un sous-ensemble X d'un truc T comme l'intersection de tous les
sous-trucs de T contenant X ; c'est aussi le plus petit sous-truc de T contenant X.
Montrons par exemple (les autres démonstrations sont exactement du même type) que
H = DieiGi est un sous-groupe de G, si les G* sont des sous-groupes d'un groupe G.
o L'élément neutre e de G appartient à tous les G*, et donc e G n^iG* et H ^ 0.
o Si x G H, alors x G G*, pour tout i, et donc x"1 6 Gj pour tout i puisque G* est un
sous-groupe de G, et donc x"1 G H.
o Si x,y G H, alors x,y G G*, pour tout i, et donc xy G G* pour tout i puisque G* est un
sous-groupe de G, et donc xy G H.
Ceci prouve que fligiGi est un sous-groupe de G.
22
VOCABULAIRE MATHÉMATIQUE
2.4. Morphismes
Un morphisme entre des trucs est une application qui commute aux lois définissant la
structure de trucs. Dans les cas qui nous intéressent, cela se traduit de la manière suivante.
Si Gi,G2 sont des groupes, un morphisme de groupes (p : Gi —> G2 est une application
qui commute aux lois de groupe (i.e. (p(xy) = (p(x)(p(y), pour tous x,y G Gi).
• Si (p : Gi —> G2 est un morphisme de groupes et si e* est l'élément neutre de G*, pour
i = 1,2, alors <^(ei) = e2 ; si rc 6 Gi, alors <p(x~l) = (p(x)~l.
On a eiei = ei, et donc <p(ei)<p{ei) = y>(ei). En multipliant les deux membres à droite par
y>(ei)-1, on obtient <p(ei) = e^. Maintenant, <p(xx~l) = ip(x)(p(x~1), et comme xx~l = e\ et
¥>(ei) = e2> cela nous donne <p(x)<p(x~l) = e2 et <p{x~l) = <p{x)~l.
Si Ai,A2 sont des anneaux, un morphisme d'anneaux (p : Ai —► A2 est une
application qui commute aux additions et multiplications (i.e. <p(x + y) = (p(x) + (p(y) et
<p(xy) = ip(x)(p(y), pour tous x,y G Ai), et qui vérifie ip(l) = 1; c'est en particulier,
un morphisme du groupe (Ai,+) dans le groupe (A2,+), et sa restriction à A* est un
morphisme de groupes (multiplicatifs) de A* dans A2.
• Si cp : Ai —> A2 est un morphisme d'anneaux, on dispose d'une action de Ai sur A2,
à savoir celle définie par a • x = (p(a)x, et donc A2 peut être considéré comme une
Ai-algèbre. Réciproquement, si A2 est une Ai-algèbre unitaire, alors a h-> a • 1 est un
morphisme d'anneaux de Ai dans A2; en particulier, si A est un anneau, il existe un
unique morphisme d'anneaux de Z dans A à savoir le morphisme envoyant n e Z surn • 1
(que l'on note encore n G A).
Si Ki,K2 sont des corps, un morphisme de corps (p : Ki —» K2 est juste un morphisme
d'anneaux (mais il induit en prime un morphisme de groupes de Kf dans K2).
Si Mi,M2 sont des A-modules, un morphisme de A-modules ip : Mi -> M2 est une
application qui commute aux additions et qui est A-linéaire, ce qui signifie qu'elle commute
à l'action de A (i.e (p(ax) = atp(x), pour tous a G A et rc G Mi) ; c'est en particulier, un
morphisme du groupe (Mi, +) dans le groupe (M2, +). Dans le cas particulier où A est un
corps commutatif, on parlera de morphisme d'espaces vectoriels ou d'application linéaire.
Si Ai, A2 sont des A-algèbres, un morphisme de A-algèbres (p : Ai —> A2 est un
morphisme de A-modules qui commute aux multiplications.
• Si T!,T2,T3 sont des trucs, et si <p\ : Ti —» T2 et y?2 : T2 —> T3 sont des morphismes
de trucs, alors ip20(P\ • Ti —* r^3 est un morphisme de trucs.
Montrons, par exemple (les autres démonstrations sont exactement du même type), que le
composé de deux morphismes de groupes est encore un morphisme de groupes. Six,y € Ti,
alors ip2o<pi(xy) = <p2{<pi(xy)) = <P2(<pi(x)<pi(y)) = ip2{<Pi{x))y2{ipi{y)) = <p2°<Pi(x)<p2<><pi(y).
(On a utilisé successivement la définition de o, le fait que y>i est un morphisme de groupes, le
fait que <p2 est un morphisme de groupes, et la définition de o.)
Un morphisme de trucs qui est en plus bijectif est appelé un isomorphisme de trucs.
2. STRUCTURES ALGÉBRIQUES
23
• Si (p : Ti —> T2 est un isomorphisme de trucs, alors </>_1 : T2 —> Ti est un isomorphisme
de trucs.
Considérons par exemple le cas d'un isomorphisme (p : Ai —► A2 d'anneaux.
o <P((P~10c + 2/) -^_1(x) -^_1(2/)) = (^((P~10c + 2/)) - ¥>(¥>"* 0*0) -<p(<P~l(y)) car ¥> est un
morphisme d'anneaux. Par ailleurs <p(<p~l(z)) = z pour tout z G A2, par définition de tp~l.
On obtient donc <p(<p~l(x + y) -<p~l(x) -<p~l(y)) = x + y-x-y = 0>et comme tp est injectif,
cela implique <p~l(x + y) - <p~l(x) - <p~l(y) = 0. Autrement dit, <p~l est un morphisme de
groupes de (A2, +) dans (Ai, +).
o <p(<p~l(xy)-(p~l(x)<p~l(y)) = <p(<p~l(xy))-<p(<p~l(x))<p(<p~l(y)) car tp est un morphisme
d'anneaux. Il s'ensuit que <p(<p~l(xy) - <p~l(x)<p~l(y)) = xy - xy = 0, et comme tp est injectif,
cela implique ^p~l(xy)-(p~1(x)(p~l(y) = 0. Autrement dit, <p~l commute aux multiplications.
o (p(l) = 1 et donc <p~l(l) = 1-
Ce qui précède prouve que <p~l est un morphisme d'anneaux, et comme il est bijectif, c'est
un isomorphisme d'anneaux.
On dit que des trucs Ti, T2 sont isomorphes, ce qui s'écrit rl\ = T2, s'il existe un
isomorphisme de trucs (p : Ti —> T2. On fera attention au fait que cela dépend de la
structure considérée sur Tx et T2.
Par exemple, les anneaux R x R et C ne sont pas isomorphes (R x R n'est pas intègre puisque
(1,0) ■ (0,1) = (0,0)), par contre R x R et C sont isomorphes en tant que groupes additifs, ou que
R-espaces vectoriels (on peut prendre le même isomorphisme dans les deux cas, à savoir (x, y) ■-> x + iy).
Si T est un truc, un isomorphisme de trucs tp : T —> T, s'appelle un automorphisme
de T ; l'ensemble Aut(T) des automorphismes de T est un groupe pour la composition
d'après les deux points précédents. On fera attention que Aut(T) dépend de la structure
mise sur T.
Par exemple, le groupe Aut(C) des automorphismes du corps C (i.e. les bijections a de C vérifiant
cr(l) = 1, et a(x + y) = <r(x) + a(y), a(xy) = <r(x)a(y) pour tous x, y G C) est un groupe gigantesque*24)
que l'on aimerait bien arriver à comprendre ; le groupe des automorphismes de C, vu comme un R-espace
vectoriel, est isomorphe au groupe GL2(R) des matrices 2x2 inversibles, à coefficients dans R.
2.5. Noyau et image
• Si (p : Ti -> T2 est un morphisme de trucs, P image Imtp = {y G T2, 3x G Ti, y = <p(x)}
de tp est un sous-truc de T2, et cp est surjectif si et seulement si Imtp = T2.
Que cp soit surjective si et seulement si Irrup = T2 est une simple traduction. Maintenant,
montrons, par exemple (les autres démonstrations sont exactement du même type), que l'image
d'un morphisme d'anneaux <p : Ai —> A2 est un sous-anneau de A2.
o On a <p(l) = 1 par hypothèse, et donc 1 G Imip.
o Si 2/1,2/2 G Im<p, il existe #i,x2 G Ai tels que 2/1 = <p(xi) et y2 = <p(x2). Mais alors
2/i +2/2 = <p{xi +x2) et 2/12/2 = <p(xix2) appartiennent à Im<p, qui est donc stable par addition
et multiplication.
(24>Du moins si on accepte l'axiome du choix ; dans le cas contraire, ce groupe peut fort bien ne comporter
que deux éléments : l'identité et la conjugaison complexe.
24
VOCABULAIRE MATHÉMATIQUE
o Si y G Im<p, il existe x G Ai tel que y = <p(x). Mais alors —y = <p(-x) appartient à Imip
qui est donc stable par passage à l'opposé.
Il s'ensuit que Imip est un sous-groupe de A2 pour l'addition, contient 1 et est stable par
multiplication ; c'est donc un sous-anneau de A2.
• Si (p : Gi —> G2 est un morphisme de groupes, on note Kertp = {x G Gi, tp(x) = 1}
le noyau de tp. Alors Kercp est un sous-groupe de Gi et cp est injectif si et seulement si
Kercp = {1} (on dit que le noyau est trivial, si Kercp = {1}).
o (^(1) = 1, et 1 G Kercp qui est donc non vide.
o Si x}y G Ker<p, on a <p(xy) = <p(x)<p(y) = 1, et donc xy G Ker (p.
o Enfin, si x G Ker<p, on a <p(x~l) = <p(x)~l = 1.
Ceci prouve que Ker<p est un sous-groupe de Gi. Maintenant, si (p est injectif, Kev<p a au
plus un élément puisque c'est l'image inverse de 1 G G2, et comme il contient l'élément neutre
de Gi, on a Kertp = {1}. Réciproquement, supposons Kerip = {1}. Si <p(x) = (p(y), alors
<p(xy~l) = <p(x)<p(y)~l = 1, et donc xy~l G Kevip. Comme on a supposé Kertp = {1}, on en
déduit xy~l = 1, et donc x = y. L'injectivité de (p s'en déduit.
• Plus généralement, le noyau d'un morphisme de trucs (p : Ti —► T2 est le noyau de tp vu
comme morphisme de groupes<25) en oubliant les structures additionnelles sur rl\ et T2 ;
un tel morphisme est donc injectif si et seulement si le noyau est trivial.
• Si (p : Ti —► T2 est un morphisme d'anneaux, son noyau est un idéal de A ; si cp : rl\ —> T2
est un morphisme de corps, alors Kercp = {0}, et donc un morphisme de corps est injectif;
si (p : Ti —> T2 est un morphisme de A-modules, de K-espaces vectoriels ou de A-algèbres,
son noyau est un sous-truc de rJLV
Montrons, par exemple (les autres démonstrations sont du même type), que le noyau d'un
morphisme d'anneaux <p : Ai —> A2 est un idéal de Ai (i.e. un sous-Ai-module de Ai).
o Comme (p est un morphisme de groupes additifs, on a <p(0) = 0, et donc Kevip est non
vide puisqu'il contient 0.
o Si x, y G Ker (p, on a <p(x - y) = <p(x) - <p(y) = 0 - 0, et donc x - y G Ker <p. (Ceci prouve
déjà que Ker<p est un sous-groupe additif de Ai.)
o Si a G Ai et si x G Ker (p, alors <p(ax) = <p(a)<p(0) = <p(a) -0 = 0, ce qui prouve que Ker (p
est stable par multiplication par un élément de Ai, et donc est un sous-Ai -module de Ai, ce
que l'on cherchait à établir.
Enfin, si <p est un morphisme de corps, et si Ker (p contient un élément x non nul, alors il
contient 1 = xx~l d'après ce qui précède, et comme on a <p(l) = 1 par hypothèse, on obtient
1=0 dans T2 ce qui est en contradiction avec l'hypothèse que T2 est un corps.
• Si (p : Ti —> T2 est un morphisme de trucs, et si T est un sous-truc de T2, alors (p~l(T2)
est un sous-truc de Ti.
C'est une démonstration du même type que celle prouvant que le noyau est un sous-truc.
La seule différence est que le résultat est aussi valable dans le cas des anneaux car T 3 1 et
donc <p-1(T) 3 1, et dans le cas des corps.
(25)Tous les trucs autres que les groupes sont en particulier des groupes pour la loi +, ce qui fait que
Ker<p = {x G Ti, <p(x) = 0} dans le cas d'un morphisme de trucs plus riches que des groupes.
2. STRUCTURES ALGÉBRIQUES
25
• Si A est un anneau commutatif intègre, tout corps K contenant A contient aussi Fï(A) :
si i est un morphisme d'anneaux injectif de A dans K, il existe un unique morphisme de
corps (automatiquement injectif) de Pr(A) dans K dont la restriction à A est t.
On doit avoir t(|) = 4|y, et on vérifie que ceci définit bien un morphisme de corps.
2.6. Produits et sommes
2.6.1. Produits de trucs
Si (Ti)i€i est une famille de trucs, on munit le produit riiei 1* ^es *°*s et acti°ns
définies composante par composante [i.e. en posant (xi)i€i(yi)i€i = (#i2/i)i€i dans le cas
d'une loi multiplicative, (xi)i€i + (yi)i€i = {xi + 2/*)iei dans le cas d'une loi additive, et
a • (#i)i€i = (a • Xi)i€i pour une action extérieure (dans le cas d'un A-module ou d'une
A-algèbre)]. Les éléments neutres et inverses s'obtiennent alors aussi composante par
composante (i.e. si yi est l'inverse de Xi pour tout i pour une loi de T», alors (yijisi est
l'inverse de (xf)i€i pour la loi produit).
• Un produit de trucs est encore un truc dans le cas des groupes, des anneaux, des A-
modules, des K-espaces vectoriels, ou des A-algèbres ; par contre, un produit de plus de
deux corps n'est pas intègre [(1,0)(0,1) = (0,0)] et donc est un anneau, mais pas un
corps. On dispose, pour tout à, d'une projection naturelle Pj : Yli€ï T< —► Tj envoyant
(xi)içi sur Xj, qui est un morphisme surjectif de trucs (d'anneaux si les rJL\ sont des corps).
• Le produit vérifie la propriété universelle suivante : si T est un truc, et si fj : T —> Tj
est un morphisme de trucs pour tout j G I, il existe un unique morphisme de trucs
/ : T -> n*€iT*tel <lue Pj°f = fj> <Iuel <lue soit J e !•
On doit poser f(x) = (/i(ar))igi. Il est alors évident que / est un morphisme de trucs, et
que pjof = fj, quel que soit j € I.
2.6.2. Somme directe de trucs
Si (Mi)i6l est une famille de groupes commutatifs (de loi notée additivement), on définit
leur somme directe 0i€iMj comme le sous-groupe du produit Yli€î M* des (xi)i€i vérifiant
Xi = 0 pour presque tout i (i.e. à l'exception d'un nombre fini de i). On dispose alors,
pour tout j, d'une injection naturelle ij : Mj —» ®i€iMi, envoyant a G Mj sur (£i)i€i, avec
Xj = a et Xi = 0, si i ^ j, qui est un morphisme de groupes.
Si les Mi sont en plus des A-modules alors SieiMi est stable par l'action de A et donc
est un sous-A-module de J^^M* (idem pour des K-espaces vectoriels).
Les Mf n'ont pas de raison d'être distincts : par exemple, si K = C, et si Mi = M2 = C, alors
Mi © M2 = C2, et ti(M!) (resp. t2(M2)) est la droite engendrée par ti(l) = (1,0) (resp. t2(l) = (0,1)) ;
autrement dit, C © C est égal à C2, muni de sa base canonique.
• Si I est fini, la somme directe est égale au produit, mais pas si I est infini^26).
(26)Le lecteur désireux de comprendre plus en profondeur la différence entre les notions de produit et de
somme est invité à se munir d'une loupe et à consulter l'alinéa 2.6.3.
26
VOCABULAIRE MATHÉMATIQUE
• La somme directe de trucsW vérifie la propriété universelle suivante : si M est un truc,
et si fi : Mi —> M est un morphisme de trucs pour tout i G I, il existe un unique morphisme
de trucs / : 0ieiMi —> M tel que / o ^ = fu quel que soit i e I.
On doit poser /((#i)iei) = Y^iei fi(xi)> ce Qui a un sens car la somme est en fait finie. Il est
alors évident que / est un morphisme de trucs, et que / o ^ = /i} quel que soit i G I.
• Si M est un truc, et si (Mi)iGi est une famille de sous-trucs de M, on dispose d'un
morphisme naturel de trucs de 0iGiMi dans M, induit par l'identité sur M*, pour tout i.
On note Y^i&^i l'image de ce morphisme; c'est le sous-truc de M engendré par les M*.
On dit que les Mi sont en somme directe dans M, si l'application naturelle de 0iGiMi
dans M est injective. On dit que M est la somme directe des M* si cette application est
un isomorphisme, et on écrit alors que M = ©i€iMi, ce qui signifie que tout x G M peut
s'écrire, de manière unique, sous la forme x = ^2iel X{, avec Xi G Mi pour tout i, et Xi = 0
pour presque tout i.
• Si M = Mi 0 M2, on dit que Mi et M2 sont supplémentaires ; c'est le cas si et seulement
si Mi fl M2 = {0} et tout x G M est somme d'un élément de Mi et d'un élément de M2.
2.6.3. Produit et somme dans une catégorie
On définit la notion de catégorie pour mettre sous un même chapeau les objets ayant les mêmes propriétés. Le
lecteur connaît déjà, sans en avoir forcément conscience, un certain nombre de ces catégories (celle des ensembles,
celle des groupes ou celle des espaces vectoriels sur R ou C par exemple ; il y en a beaucoup d'autres comme celle
des espaces topologiques, des espaces de Banach...).
Une catégorie C est une collection d'objets (les objets de la catégorie), et de flèches entre ces objets (les
morphismes de la catégorie) : si X et Y sont deux objets de C, on note Homc(X,Y) les morphismes de X
vers Y dans la catégorie C. On impose que l'identité idx soit un morphisme de X dans X, et que l'on puisse
composer les morphismes : si X, Y et Z sont trois objets de C, on dispose d'une application (/,<;) •—> f o g de
Home(X, Y) x Homc(Y,Z) —► Homc(X, Z) vérifiant les propriétés évidentes : M
/ o idx = /, idy o / = / et (/ o g) o h = / o (g o h).
Les exemples les plus simples de catégories sont les suivants :
— La catégorie des ensembles ; les morphismes de X dans Y sont les applications de X dans Y.
— La catégorie des groupes ; les morphismes sont les morphismes de groupes.
— La catégorie des groupes commutatifs ; les morphismes sont les morphismes de groupes.
— La catégorie des anneaux commutatifs ; les morphismes sont les morphismes d'anneaux.
— La catégorie des K-espaces vectoriels, K un corps ; les morphismes sont les applications K-linéaires.
— La catégorie des espaces topologiques ; les morphismes sont les applications continues.
— La catégorie des espaces métriques ; les morphismes sont les applications continues.
— La catégorie des K-espaces de Banach, K = R ou K = C ; les morphismes sont les applications K-linéaires
continues.
Dans une catégorie, on définit les notions de produit et somme par les propriétés universelles suivantes (la
propriété universelle implique l'unicité d'un tel objet, mais pas son existence qui doit se démontrer cas par cas).
Si C est une catégorie et les (X;)iGi sont des objets de C, le produit X = n^i X* des X* est un objet de C muni
de morphismes pi € Homc(X,Xt), pour tel, tel que, si Y est n'importe quel objet de C, et si fi € Homc(Y,X*),
pour tout z € I, alors il existe / € Homc(Y,X), unique, tel que PiO f = fc pour tout z € I.
<27)lci truc signifie « groupe commutatif », « A-modules » ou « K-espaces vectoriels ».
2. STRUCTURES ALGÉBRIQUES
27
La somme X = Uieï Xi des Xi est un objet de C muni de morphismes u € Home (Xi, X), pour tel, tel que, si
Y est n'importe quel objet de C, et si fi € Homc(Xi, Y), pour tout tel, alors il existe / e Homc(X, Y), unique,
tel que / o a = fi pour tout tel.
Montrons par exemple l'unicité du produit. Si X (resp. X'), muni des p* : X —► X* (resp. des p\ : X' —► Xi), est
un produit des Xi, alors en particulier, il existe / : X' —► X, unique, tel que pi o / = pj pour tout t, et il existe
g : X —► X', unique, tel que p* o g = pi pour tout t. Alors / o g : X —► X vérifie Pi o (/ o g) = pi pour tout t,
ce qui implique que f o g = idx puisque idx vérifie la même propriété, et que par hypothèse, il n'y a qu'un seul
morphisme de X dans X ayant cette propriété. Pour la même raison, onajo/ = idx, ce qui prouve que X et X'
sont isomorphes (à isomorphisme unique près puisque f et g étaient uniques). Cette démonstration s'étend à tout
objet solution d'un problème universel.
On dit qu'une catégorie admet des produits (resp. des sommes), si tout couple (et donc toute famille finie)
d'objets de la catégorie admet un produit (resp. une somme). Toutes les catégories ci-dessus admettent des
produits, car on peut munir le produit ensembliste de deux objets des structures additionnelles demandées. Elles
admettent aussi toutes une somme, mais celle-ci peut prendre des formes assez variées.
— Dans la catégorie des ensembles, la somme d'une famille (Xi)i€i d'ensembles est leur réunion disjointe
ILeiXi-UfcittOxX,).
— Dans la catégorie des K-espaces vectoriels, ou dans celle des groupes commutatifs, la somme est la somme
directe, et la somme d'un nombre fini d'objets est isomorphe à leur produit comme on l'a vu ci-dessus.
— Dans la catégorie des groupes, la somme de deux groupes A et B est leur produit libre A • B : les éléments
de A • B sont les mots finis composés d'éléments de A et B modulo la relation d'équivalence selon laquelle on
peut remplacer toute lettre x dans un mot par deux lettres £i,£2 appartenant au même groupe si a;ia;2 = x, et
réciproquement, on peut remplacer deux lettres consécutives appartenant au même groupe par leur produit. La
somme de deux groupes commutatifs n'est donc pas la même dans la catégorie des groupes que dans celle des
groupes commutatifs. Par exemple, on a (Z/2Z) e (Z/3Z) = (Z/6Z), alors que (Z/2Z) * (Z/3Z) est un groupe
infini, isomorphe au groupe PSL2(Z), quotient de SL2(Z) par son centre { ± (ô °)}.
2.7. Relations d'équivalence
2.7.1. Relations d'équivalence et partitions
Si E est un ensemble, une partition de E est une famille de sous-ensembles non vides
de E, deux à deux disjoints, dont la réunion est E.
Par exemple, {R^., R*, {0}} est une partition de R. Si D e N- {0}, les r+DZ, pour r € {0,..., D-1}
forment une partition de Z.
Une relation R sur E est un sous-ensemble de E x E. Si (x, y) e E x E, on écrit souvent
xRy pour signifier (x, y) € R.
Une relation R sur E est une relation d'équivalence si elle est réflexive (xRx quel que
soit x € E), symétrique (xRy implique yRx) et transitive (xRy et yRz impliquent xRz).
Si R est une relation d'équivalence sur E, et si rc G E, la classe d'équivalence de x est
l'ensemble Cx = {y e E, yRx}. Un sous-ensemble C de E est une classe d'équivalence
(pour R), s'il existe # G E tel que C = C^. Si x,y G E, alors C^ D Cy ^ 0 si et seulement
si xRy, et on a alors Ca; = Cy. Les classes d'équivalence forment donc une partition de E.
Réciproquement, si les (Q)i6i forment une partition de E, alors la relation R définie
par xRy si et seulement si il existe i e I tel que {x, y} C Q est une relation d'équivalence
dont les classes d'équivalence sont les Q. En d'autres termes, il revient au même de munir
un ensemble d'une relation d'équivalence ou de faire une partition de cet ensemble.
28
VOCABULAIRE MATHÉMATIQUE
Par exemple, la partition de R ci-dessus correspond à la relation d'équivalence « x ~ y si et seulement
si x et y ont même signe » ; celle de Z correspond à la relation d'équivalence « a ~ b si et seulement si a
et b ont même reste dans la division euclidienne par D ».
2.7.2. Passage au quotient par une relation d'équivalence. Si R est une relation
d'équivalence sur E, on définit le quotient E/R de E par la relation d'équivalence R comme
l'ensemble des classes d'équivalence. On dispose d'une application naturelle de E dans E/R,
à savoir l'application qui à x associe sa classe d'équivalence (souvent notée x) ; cette
application est surjective par construction de E/R. Un sous-ensemble S de E est un système
de représentants de E/R, s'il contient un et un seul élément de chaque classe
d'équivalence^28^. Autrement dit, S C E est un système de représentants de E/R si et seulement
si l'application naturelle de E dans E/R induit une bijection de S sur E/R.
Cette manière de définir de nouveaux objets en passant au quotient par une relation
d'équivalence est une des plus universelles qui soit^29^. Pour le petit enfant, le nombre 5
est la classe d'équivalence des ensembles pouvant être mis en bijection avec l'ensemble
{un,deux,trois,quatre,cinq} (ce n'est pas une raison pour le lui définir de cette
manière...). Pour le commun des mortels, un nombre réel est un nombre avec une infinité de
chiffres derrière la virgule, et comme certains nombres ont deux écritures, il faut passer
<28)Si E/R est infini, l'existence d'un système de représentants peut demander l'axiome du choix, mais
celui-ci peut vous tirer de situations délicates. Par exemple, un dictateur démoniaque a enfermé un
ensemble infini I de mathématiciens et leur offre l'alternative suivante : je vais placer dans le dos de
chacun de vous un nombre réel tiré au hasard et demander a chacun de deviner quel est le nombre
qui se cache derrière son dos (vous verrez les nombres dans le dos des autres mais ne pourrez rien
dire) ; si tout le monde, sauf un nombre fini, a raison, je vous libère, dans le cas contraire, vous êtes
condamnés à résoudre des systèmes linéaires à perpétuité. La situation a l'air assez désespérée mais si nos
mathématiciens croient en l'axiome du choix, il leur suffit de choisir un système S de représentants de R1
modulo la relation d'équivalence (xi)iei ~ (yi)iei si et seulement si Xi = yi pour tout % sauf un nombre
fini. Voir ce qu'il y a dans le dos des autres suffit à déterminer dans quelle classe d'équivalence on est,
et si (si)iei G S est le représentant de cette classe d'équivalence, il suffit au mathématicien % d'annoncer
qu'il a le nombre si dans son dos pour qu'au plus un nombre fini d'entre eux se trompent.
(2f))L'expérience montre que les premiers passages au quotient que l'on rencontre sont un peu
traumatisants, mais on finit par s'y faire... Il fut un temps pas si lointain, où l'on définissait Z comme le quotient de
N x N par la relation d'équivalence (a, 6) ~ (a', b') si et seulement si a + b' = a' + 6, l'idée étant que (a, 6)
représente l'entier relatif a - b. Au bout de 3 semaines, on avait enfin le droit d'écrire 2-3 + 5-7 = -3,
ce que n'importe qui ayant regardé un thermomètre comprend très bien. Pour en arriver là, il avait fallu
passer par (2,0) + (0,3) + (5,0) + (0,7) = (7,10) = (0,3), puis par (+2) + (-3) + (+5) + (-7) = (-3). On
achevait de traumatiser les élèves (et leur parents) en définissant, en classe de4ômc, un vecteur comme
une classe d'équipollence de bipoints (un bipoint (i.e. un couple de points) (A, B) est équipollent à (C, D),
si (A, B, D, C) est un parallélogramme). Dans une période plus récente, les aléas de la conjoncture ayant
provoqué un tarissement des vocations de professeurs de mathématiques, on s'est retrouvé avec une
pénurie que l'on a traitée en diminuant l'horaire de mathématiques dans l'enseignement, et on en a profité
pour jeter allègrement à la poubelle toutes ces horribles mathématiques modernes...
2. STRUCTURES ALGÉBRIQUES
29
au quotient... Une couleur aussi est définie par un passage au quotient nettement plus
délicat que les passages au quotient mathématiques...
En général, on aime bien que E/R hérite des propriétés que pouvait avoir E (i.e. on
aime bien que les propriétés de E passent au quotient), ce qui impose des contraintes aux
relations d'équivalence que l'on peut considérer. Par exemple, une fonction / : E —» X
passe au quotient si et seulement si on a f(x) = /(#) pour tout couple d'éléments de E
vérifiant xRy (si c'est le cas, on définit / : E/R —» X par f(z) = f(x) pour n'importe quel
élément # de E ayant pour image z dans E/R. Si ir : E —*■ E/R est l'application naturelle,
on a / = / o 7r ; on dit que / se factorise à travers E/R ou que / se factorise à travers n,
ce qui est une terminologie assez parlante puisqu'elle signifie que l'équation / = g o n a
une solution g = /).
2.8. L'anneau Z/DZ des entiers relatifs modulo D
Dans tout ce qui suit, D est un entier ^ 1. On note DZ l'ensemble des multiples de D.
On définit une relation de congruence modulo D sur Z, en disant que a est congru à b
modulo D (ou modulo DZ), ce qui se note a = b [D] ou a = b mod D, si b — a G DZ.
• La relation de congruence modulo D est une relation d'équivalence sur Z. On note Z/DZ
l'ensemble des classes d'équivalence. L'image d'un entier dans Z/DZ est sa réduction
modulo D.
Cette relation est réflexive car 0 est un multiple de D, symétrique car si 6—a est un multiple
de D, il en est de même de a — 6, et transitive car si b — a et c — b sont des multiples de D, il
en est de même c - a = (c — b) + (b — a).
• Un système naturel de représentants de Z/DZ dans Z est l'ensemble {0,1,..., D — 1} ;
en particulier, Z/DZ est de cardinal D.
Si a, 6 6 {0,1,..., D - 1} sont distincts, et si 6 > a, alors 1^6-a^D-l. En particulier
b — a n'est pas un multiple de D, ce qui prouve que 6 et a sont dans des classes distinctes
modulo D, et donc que l'application naturelle de {0,1,...,D - 1} dans Z/DZ est injective.
Par ailleurs, si a 6 Z est quelconque, et si r 6 {0,1,...,D - 1} est le reste de la division
de a par D, alors a - r est un multiple de D et a est dans la même classe que r modulo D ;
l'application naturelle de {0,1,... ,D - 1} dans Z/DZ est donc surjective.
• L'addition et la multiplication sur Z passent au quotient, et Z/DZ muni des lois
d'addition et multiplication ainsi définies est un anneau commutatif^30).
Si x — x' et y — y' sont divisibles par D, alors (x + y) — (x' + y') = (x — x') + (y — y') et
xy — x'y' = x(y - y') + y'(x — x') sont divisibles par D, ce qui prouve que le résultat modulo D
de l'addition et la multiplication de deux entiers ne dépend que de leurs réductions modulo D ;
(,3°)La manière qui est probablement la plus efficace pour penser à l'anneau Z/DZ est de le voir comme
étant l'anneau Z auquel on a rajouté la relation D = 0 ; on fait donc les additions et les multiplications
comme si on était dans Z, mais on se permet d'enlever le multiple de D que l'on veut au résultat. Par
exemple, dans Z/21Z, on a 6 x 14 = 4 x 21 = 0 et 4 x 16 = 1 + 3 x 21 = 1, ce qui montre que 6 et 14
sont des diviseurs de 0, alors que 4 est inversible, d'inverse 16
30
VOCABULAIRE MATHÉMATIQUE
en d'autres termes, l'addition et la multiplication passent au quotient. Par ailleurs, les identités
à vérifier pour prouver que Z/DZ est un anneau sont déjà vraies dans l'anneau Z ; elles le sont
donc, a fortiori, dans Z/DZ.
• a G Z est inversible (pour la multiplication) dans Z/DZ si et seulement si a est premier
à D. On note (Z/DZ)* l'ensemble des éléments inversibles ; c'est un groupe dont le cardinal
est traditionnellement noté </>(D), et la fonction cp est la fonction indicatrice d'Euler.
Si a est premier à D, il existe, d'après le théorème de Bézout (n° 1.2), u,v G Z tels que
au + Dv = 1, ce qui prouve que a est inversible dans Z/DZ, d'inverse u. Réciproquement, si
ab = 1 dans Z/DZ, cela signifie que ab - 1 est divisible par D, et donc qu'il existe v G Z tel
que ab + Dv = 1 ; d'après le théorème de Bézout, cela implique que a et D sont premiers entre
eux, ce qui permet de conclure.
• D est premier si et seulement si Z/DZ est un corps.
L'anneau {0} n'est pas un corps (si K est un corps, K - {0} est un groupe pour la
multiplication et donc est non vide) et 1 n'est pas un nombre premier ; on peut supposer D ^ 2.
Si D ^ 2 n'est pas premier, on peut le factoriser sous la forme D = ab, avec ae {2,..., D-1}
et 6 G {2,..., D-1}. Donc a et 6 ne sont pas nuls dans Z/DZ alors que ab = D = 0 dans Z/DZ ;
l'anneau Z/DZ admet donc des diviseurs de 0 et n'est pas un corps.
Si D est premier, et si a n'est pas divisible par D, alors a est premier à D et donc inversible
dans Z/DZ d'après le point précédent. Ceci permet de conclure.
Un nombre premier a tendance à être noté p, et si on veut insister sur le fait que Z/pZ
est un corps, on le note Fp. Par exemple, on parlera d'espaces vectoriels sur F2 au lieu
d'espaces vectoriels sur Z/2Z pour parler des objets qui peuplent Internet <31) et dans
lesquels vivent les codes correcteurs d'erreurs.
• Tout corps de cardinal p est isomorphe à Fp, et donc Fp est le corps à p éléments^.
Soit K un corps à p élément. On dispose d'un morphisme d'anneaux / : Z —> K envoyant 1
sur 1. Ce morphisme d'anneaux est en particulier un morphisme de groupes additifs. Son image
est donc un sous-groupe du groupe (K, +), et son cardinal est un diviseur de |K| = p, d'après
le th. de Lagrange (n° 3.3), et comme cette image a au moins deux éléments, à savoir 0 et 1,
c'est K tout entier. On en déduit que / induit un isomorphisme de Z/Ker/ sur K, et comme
|K| = p, on a Ker / = pZ, et donc K = Z/pZ = Fp. Ceci permet de conclure.
(31)lnternet aime beaucoup Z/DZ. Non content de faire voyager des milliards de F2-espaces vectoriels,
Internet est très gourmand de grands nombres premiers, par exemple pour le système RSA de sécurité à
clé publique (1977). Ce système et la fabrication de grands nombres premiers reposent sur l'arithmétique
dans Z/DZ qui s'avère être nettement plus subtile que ce que l'on pourrait attendre d'un objet aussi
petit. On peut saluer la clairvoyance de la commission ayant accouché des programmes actuels, qui a fait
disparaître Z/DZ des programmes de la filière PC au moment même où Internet prenait son envol...
(32)pius généralement (cf. n°8.7), si q est une puissance d'un nombre premier, il y a, à isomorphisme
près, un unique corps à q élément, et ce corps est noté Fq. On a beaucoup fantasmé ces dernières années
autour du corps Fi « à 1 élément » dont on voit la trace dans plusieurs phénomènes sans comprendre
quel genre d'objet cela pourrait bien être (pas l'anneau {0} en tout cas). Certains y voient la clef d'une
démonstration de l'hypothèse de Riemann.
2. STRUCTURES ALGÉBRIQUES
31
• Si D' est un diviseur de D, alors l'application naturelle Z —> (Z/D'Z) se factorise à
travers une application naturelle (Z/DZ) —> (Z/D'Z) qui est un morphisme d'anneaux.
Si D' est un diviseur de D, alors un multiple de D est aussi un multiple de D'. On eh déduit
que, si a = b mod D, alors a = b mod D ; autrement dit l'application naturelle Z —> (Z/D'Z)
se factorise à travers une application naturelle (Z/DZ) —> (Z/D'Z). On obtient un morphisme
d'anneaux car les identités à vérifier sont déjà valables en remontant à Z.
• Si a et b sont premiers entre eux, l'application naturelle Z/abZ —> (Z/aZ) x (Z/6Z)
est un isomorphisme d'anneaux qui induit un isomorphisme de groupes de (Z/abZ)* sur
(Z/oZ)* x (Z/bZy (th. des restes chinois).
L'application naturelle Z/abZ —► (Z/aZ) x (Z/6Z) est un morphisme d'anneaux d'après
le point précédent. Il est injectif car, si x G Z a une réduction modulo ab qui est dans le
noyau, c'est que x est divisible par a et par 6, et donc par ab puisqu'on a supposé a et
b premiers entre eux ; autrement dit, le noyau est réduit à 0. Comme les deux ensembles
considérés ont même cardinal ab, une application injective est aussi bijective, ce qui montre
que Z/abZ —► (Z/aZ) x (Z/6Z) est un isomorphisme. On conclut en remarquant que si A et
B sont deux anneaux, alors (A x B)* = A* x B*.
En fait, on peut décrire explicitement l'isomorphisme inverse. Comme a et 6 sont premiers
entre eux, il existe u,v G Z tels que 1 = au + bv. Si (xyy) G (Z/aZ) x (Z/6Z), et si x,y G Z
ont pour image x et y dans Z/aZ et Z/6Z respectivement, alors l'image de bvx + auy dans
Z/abZ ne dépend pas des choix de x et y et s'envoie sur (xyy) dans (Z/aZ) x (Z/6Z), comme
le montre un petit calcul immédiat. On remarque que x i-> bvx induit un isomorphisme de
Z/aZ sur le sous-groupe bZ/abZ de Z/abZ et que y »-> ciuy induit un isomorphisme de Z/6Z
sur le sous-groupe aZ/abZ de Z/abZ. On en déduit le résultat suivant :
• Si a et 6 sont premiers entre eux, Z/abZ est la somme directe de ses sous-groupes
bZ/abZ et aZ/abZ ; de plus, on a des isomorphismes de groupes additifs bZ/abZ = Z/aZ
et aZ/abZ *é Z/6Z, et donc Z/a&Z ^ (Z/oZ) 0 (Z/6Z), comme groupe additif.
Exercice 2.3. Montrer que si a ^ 0 et b ^ 0 ne sont pas premiers entre eux, les groupes additifs Z/abZ
et (Z/aZ) © (Z/6Z) ne sont pas isomorphes.
Exercice 2.4. Résoudre les équations Ax + 3 = 0, 14x + 2 = 0 et 14x + 7 = 0 dans Z/21Z.
Exercice 2.5. Résoudre l'équation x2 + x + 1 = 0 dans Z/91Z. (Comme 91 est relativement petit*33*,
on peut tester chaque élément de Z/91Z et voir lesquels conviennent, mais c'est un peu fastidieux...)
<33>Essayer de résoudre de la même manière l'équation x2 = 5 dans Z/DZ, avec D = 22802 - 2521 - 22281 +1
est voué à l'échec, même avec l'aide d'un ordinateur. Par contre, en partant deD = (2521 - 1)(22281 - 1),
si on sait que pi = 2521 - 1 et pi = 22281 - 1 sont premiers (ce sont des nombres premiers de Mersenne
découverts par Robinson en 1952), alors on peut sans trop d'effort calculer le nombre de solutions de
l'équation et, avec l'aide d'un ordinateur et d'algorithmes astucieux, calculer explicitement ces solutions.
Le calcul du nombre de solutions repose sur la loi de réciprocité quadratique conjecturée par Euler en 1783
et démontrée par Gauss en 1801. Si p est un nombre premier, et si a G Z n'est pas divisible par p,
on pose (|) = 1, si a est un carré modulo p (i.e. si l'équation x2 = a a des solutions dans Fp) et
(jj) = -1 si a n'est pas un carré modulo p (si l'équation x2 = a n'a pas de solutions dans Fp). La loi
de réciprocité quadratique s'énonce alors ainsi : si p et q sont deux nombres premiers impairs distincts^
32
VOCABULAIRE MATHÉMATIQUE
Exercice 2.6. (i) Soit p6^. Montrer que si p ^ 3, et si l'équation x2 + x + l = 0a une solution
dans Fp, alors elle en a deux.
(ii) (difficile) Montrer qu'il existe une infinité de nombres premiers p tels que l'équation x2 + x + 1 = 0
ait deux solutions dans Fp.
(iii) En déduire que quel que soit M > 0, il existe D G N tel que x2 + x +1 = 0 ait plus de M solutions
dans Z/DZ.
Exercice 2.7. Montrer qu'il y a une infinité de nombres premiers de la forme An— 1.
Exercice 2.8. (i) Soit X(pi,... ,pr,g) l'ensemble des entiers < x dont tous les facteurs premiers
appartiennent à l'ensemble fini {pi,... ,pr}. Montrer que |X(pi,... ,pr,x)\ = 0(logrx).
(ii) Montrer que tout nombre premier divisant 4k2 + 1 est de la forme 4n + 1. (On pourra utiliser le
petit th. de Fermât.)
(iii) En déduire que l'ensemble des nombres premiers de la forme 4n + 1 est infini.
Exercice 2.9. Montrer que si p G ^, alors Z/pnZ a pn - pn_1 éléments inversibles. En déduire que,
si D ^ 2, alors <p(D) = D • IlppC* ~ p)> °ù <P est la fonction indicatrice d'Euler.
2.9. Quotients d'espaces vectoriels et de A-modules
Soit E un espace vectoriel sur un corps K, soit R une relation d'équivalence sur E, et
soit F C E la classe d'équivalence de 0. Pour que la structure d'espace vectoriel de E
passe au quotient, on doit en particulier avoir Xx G F si À G K et x G F (puisque À0 = 0
dans E/R) et x + y G F si x, y G F (puisque 0 + 0 = 0 dans E/R) ; en d'autres termes, F
doit être un sous-espace vectoriel de E. De plus, comme o + 0 = o dans E/R, les classes
d'équivalence doivent être de la forme o + F.
Réciproquement, si F est un sous-espace vectoriel de E, la relation ~p, définie sur E
par x ~p y si et seulement si x — y G F, est une relation d'équivalence. Le quotient E/ ~p
est traditionnellement noté E/F. Comme « x — y G F »=> « Xx — Xy G F » , et comme
« x — y G F et x' — y' G F »=>« (x + x') — (y + y') G F », la structure d'espace vectoriel
sur E passe au quotient.
Si F' c E est un sous-espace vectoriel supplémentaire de F, les classes d'équivalence pour ~p sont les
a + F, pour a G F', et l'application naturelle F' —> E/F est un isomorphisme d'espaces vectoriels. En
d'autres termes, dans le cas des espaces vectoriels, un quotient est toujours isomorphe à un sous-objet,
mais il est très souvent nocif de remplacer, dans les raisonnements, un quotient par un sous-objet qui lui
est isomorphe. Par exemple, si F est un sous-espace vectoriel d'un espace vectoriel E, le dual F* de F (i.e.
l'ensemble des formes linéaires de F dans K) est naturellement un quotient du dual E* de E (on peut
restreindre à F une forme linéaire sur E, et F* est le quotient de E* par le sous-espace des formes linéaires
identiquement nulles sur F), et n'est pas, en général, un sous-espace de E*, de manière naturelle.
• L'espace E/F vérifie la propriété universelle suivante : si u : E —> E; est une application
K-linéaire, et si Kerw contient F, alors u se factorise à travers E/F (i.e. il existe une
alors (J) = (-l)(p-1)te-1)/4(j)- Qn applique ce qui précède àp = px et q = 5. Comme px = 2521 - 1 =
24.i30+i _ i = 2 . (24)130 -1 = 2-1 = 1 dans F5, on a (£) = 1 et donc (£) = 1, d'après la loi de
réciprocité quadratique. On en déduit que l'équation a;2 = 5a deux solutions dans FPl. Pour la même
raison, elle en a aussi 2 dans FP2 et donc 4 dans Z/DZ.
2. STRUCTURES ALGÉBRIQUES
33
unique application linéaire u : E/F —> E', telle que u = uoir, où 7r : E —> E/F est la
projection canonique).
• Si w : E —> E' est une application linéaire, alors u se factorise à travers E/Kerw, et
l'application induite û : E/Keru ->Im« est un isomorphisme d'espaces vectoriels.
Ce qui précède s'étend au cas des A-modules, si A est un anneau : si R est une
relation d'équivalence sur un A-module M, la structure de A-module passe au quotient si et
seulement si la classe d'équivalence de 0 est un sous-A-module N et celle de x est x + N,
pour tout # € M. On note M/N le A-module quotient ; il vérifie la propriété universelle
suivante : si u : M —► M' est une application A-linéaire, et si Kerw contient N, alors u se
factorise à travers M/N ; en particulier u se factorise à travers M/Ker u, et l'application
induite û : M/Keru->Imu est un isomorphisme de A-modules.
Contrairement à ce qui se passe dans le cas des espaces vectoriels, le module M/N n'est pas, en général,
isomorphe à un sous-module de M. Par exemple Z/DZ n'est pas isomorphe à un sous-Z-module de Z.
2.10. Anneaux quotients, idéaux
Dans ce n°, les anneaux sont supposés commutatifs.
2.10.1. Quotient d'un anneau par un idéal
Soit A un anneau, soit R une relation d'équivalence sur A, et soit I C E la classe
d'équivalence de 0. Pour que la structure d'anneau de A passe au quotient, on doit en
particulier avoir Xx G I si À G A et x G I (puisque À0 = 0 dans A/R) et x+y G I si x, y G I
(puisque 0 + 0 = 0 dans A/R) ; un sous-ensemble de A vérifiant ces deux propriétés est
un idéal de A. De plus, comme a + 0 = a dans A/R, les classes d'équivalence doivent être
de la forme a + I.
Réciproquement, si I est un idéal de A, la relation ~I? définie sur E par x ~\ y si et
seulement si x - y G I, est une relation d'équivalence. Le quotient A/ ~i est
traditionnellement noté A/I. Comme « x - y G I et x' - y' G I »=>« (x + x') - (y + y?) G I », et
comme « x — y G I et x' — y1 G I »=>« xx1 — y\j = x(y — jf) + j/{x — x1) El», la structure
d'anneau sur A passe au quotient.
• L'anneau A/I vérifie la propriété universelle suivante : si / : A —» A' est un morphisme
d'anneaux, et si Ker/ contient I, alors / se factorise à travers A/I (i.e. il existe un unique
morphisme d'anneaux / : A/I -> A', tel que f = f on, oÙ7r:A—> A/I est la projection
canonique).
• Si / : A —> A7 est un morphisme d'anneaux, alors Ker / est un idéal de A, / se factorise
à travers A/Ker/ et l'application induite / : A/Ker/ —» Im/ est un isomorphisme
d'anneaux.
Le lecteur connaît déjà beaucoup d'anneaux définis de cette manière. Par exemple :
le corps Fp, quotient de Z par l'idéal pZ (p étant un nombre premier),
l'anneau Z/DZ quotient de Z par l'idéal DZ (D entier quelconque),
34
VOCABULAIRE MATHÉMATIQUE
l'anneau Z[X]/(10X—1) des nombres décimaux (prendre le quotient de Z[X] par (10X—1)
revient à rajouter à Z un élément X vérifiant 10X = 1, et anXn H h a0 e Z[X] devient
le nombre décimal fjfe -\ h fj + a0),
le corps des nombres complexes*34) C = R[X]/(X2 +1) (prendre le quotient de R[X] par
l'idéal*35) (X2 + 1) revient à rajouter à R un élément X vérifiant X2 + 1 = 0, et donc X
devient une racine carrée de —1 dans le quotient).
On en rencontre beaucoup d'autres, par exemple les anneaux suivants.
Z[X]/(X2 + 1), anneau des entiers de Gauss; en envoyant X sur i ou —t, cet anneau s'identifie au
sous-anneau Z[i] = {a + «6, a, 6 € Z} de C.
Z[X]/(X3 - 2). Il s'identifie à un sous-anneau de C de trois manières différentes : on peut envoyer X
sur ^2, ou sur e2i*/3 \/2 ou sur e4**/3 \/2. Dans le premier cas, l'image est un sous-anneau de R, dans les
autres cas, elle n'est pas incluse dans R.
L'anneau K[e]/(e2) des nombres duaux, où K est un corps; e est alors l'analogue algébrique d'un
infiniment petit *36).
L'anneau C[X, Y]/(DY2 - (X3 - X)) des fonctions rationnelles sur la courbe algébrique Cd d'équation
DY2 = X3 - X dans C2 (si / € C[X, Y], la restriction de / à Cd ne dépend que de l'image de / modulo
l'idéal engendré par P(X, Y) = DY2 - (X3 - X), puisque P est identiquement nul sur Cd).
Exercice 2.10. Montrer que, si D' est un diviseur de D, alors Z/D'Z est le quotient de Z/DZ par
l'idéal engendré par D'.
2.10.2. Idéal premier, idéal maximal
Rappelons qu'un anneau A est intègre s'il n'est pas réduit à 0 (i.e. si 0 ^ 1 dans A), et
s'il ne possède pas de diviseur de 0 (i.e. xy = 0 => x = 0 ou y = 0). Un idéal I de A est
dit premier si l'anneau A/I est intègre, ce qui équivaut, en remontant dans A, à « I ^ A
et xy e I => x € I ou y e I ». En particulier, l'idéal nul {0} est premier si et seulement si
A est intègre.
• Si I est un idéal de A, distinct de A, les conditions suivantes sont équivalentes (I est dit
maximal s'il les satisfait) :
(i) A/I est un corps.
(ii) Si x e A — I, l'idéal engendré par I et x contient 1.
(iii) Les seuls idéaux de A contenant I, sont A et I.
Si I vérifie (iii) et si x £ I, alors l'idéal engendré par I et a; contient strictement I et donc
est égal à A; en particulier, il contient 1, ce qui démontre l'implication (iii)=>(ii).
(34) Cette définition de C est due à Cauchy (1847).
(3r>)De manière générale, si A est un anneau, et si a est un élément de A, on note souvent (a) l'idéal de
A engendré par A ; on a donc (a) = a A.
(36>On peut difficilement faire plus petit puisque e ^ 0, alors que e2 = 0 ; si P € K[X] est un polynôme, on
a P(X + e) = P(X) + P'(X)e dans K[e]/(e2), comme le montre la formule de Taylor pour les polynômes.
Peut-on rêver de développements limités plus sympathiques ?
2. STRUCTURES ALGÉBRIQUES
35
Si I vérifie (ii), et si x £ I, alors il existe b 6 I et u G A tels que b+ux = 1. On en déduit que
x est inversible dans A/I d'inverse w, et donc que tout élément non nul de A/I est inversible ;
autrement dit, A/I est un corps. D'où l'implication (ii)=>(i).
Enfin, si A/I est un corps, et si J est un idéal de A contenant I, alors J/I est un idéal de
A/I, et donc est soit réduit à 0 (ce qui implique J = I), soit égal à A/I (ce qui implique J = A).
On en déduit l'implication (i)=>(iii), ce qui permet de conclure.
• Un corps étant intègre, un idéal maximal est premier, mais la réciproque est fausse. Par
exemple, l'idéal (X) de Z[X] est premier puisque Z[X]/(X) = Z est intègre, mais il n'est
pas maximal puisque Z n'est pas un corps.
2.11. Groupes quotients
2.11.1. Groupe opérant sur un ensemble. Soit G un groupe d'élément neutre 1, et
soit X un ensemble. On dit que G opère à gauche sur X ou que l'on a une action à gauche
de G sur X si on dispose d'une application (g,x) *-+ g • x de G x X dans X telle que
1-x = x, quel que soit x G X, et g • (</ • x) = ggl • x, quels que soient g, g' G G et x G X.
On remarquera que si g G G, alors x i-> cg(x) = g • x est une bijection de X dans X, la
bijection réciproque étant x i—> ag-i(x) = g-1 • x, et que l'on a ogg> = ag o og>, quels que
soient g, g' G G. Définir une action de G sur X revient donc à se donner un morphisme
de G dans le groupe des permutations de X (i.e. les bijections de X dans X) muni de la
composition.
On dit que G opère à droite sur X si on a une application (g, x) h-» x • g de G x X
dans X telle que x• 1 = x, quel que soit x G X, et (x*g)*g' = x*gg', quels que soient
g, g' G G et x G X. On peut toujours transformer une action à gauche en action à droite
(et vice-versa), en posant x*g = g~l • x.
Par exemple, si K est un corps commutatif, le groupe GLn(K) opère naturellement (à gauche) sur
beaucoup d'objets :
— par définition, il opère sur l'espace vectoriel Kn ;
comme l'action est linéaire, elle transforme une droite vectorielle en droite vectorielle et doncGLn(K)
opère sur l'ensemble Pn-I(K) des droites vectorielles de Kn {espace projectifde dimension n — 1 sur K) ;
-— il opère sur l'ensemble Mn(K) des matrices nxn à coefficients dans K, par multiplication à gauche
(i.e. A • M = AM), par multiplication à droite (i.e. A • M = MA-1) et par similitude (i.e. A • M = AMA-1,
ce qui correspond à un changement de base).
Il opère sur les ensembles des matrices symétriques et antisymétriques par A • M = AM *A,
Le groupe GLn(C) opère sur l'ensemble des matrices auto-adjointes (i.e. vérifiant 'M = M) par
A • M = AMA*, avec A* = *Â.
Exercice 2.11. Soit K un corps commutatif. On rajoute à K un élément oo, et on étend l'arithmétique
de K en posant § = oo, si a ^ 0 (on ne donne pas de sens à j}), et {j^fjj = f, si a ^ 0 ou c ^ 0.
(i) Montrer que l'application qui à v = (x,y) G K2 - {(0,0)} associe X(v) = J G K U {oo} induit une
bijection de la droite projective PX(K), ensemble des droites vectorielles de K2, sur K U {oo}.
(ii) Montrer que l'action de GL2(K) sur K U {oo} qui s'en déduit est donnée par- ("d) ' z = cz+3*
36
VOCABULAIRE MATHÉMATIQUE
Si G opère (à gauche ou à droite) sur X, et si x G X, un translaté de x est un point de X
dans l'image de G x {#}, et l'orbite Ox de x est l'ensemble des translatés de X (i.e. l'image
de G x {x} dans X). Une orbite pour l'action de G est un sous-ensemble O de X de la
forme Ox pour un certain x G X.
• La relation ~q définie sur X par « x ~q V si et seulement si ilexiste g G G tel que
y = g • x (si l'action est à gauche) ou y = x * g (si l'action est à droite) » est une relation
d'équivalence sur X dont les classes d'équivalence sont les orbites.
On peut se contenter de traiter le cas d'une action à gauche. On a x = 1 • x, et donc ~g
est reflexive. Si y = g • x, alors x = g~l • y, et donc ~g est symétrique. Enfin, si y = g • x et
z = h • y, alors z = hg • x, et donc ~g est transitive. Cela prouve que ~g est une relation
d'équivalence sur X. La classe d'équivalence de x est Ox par définition de Ox, ce qui prouve
que les classes d'équivalence sont les orbites.
L'espace quotient X/ ~q> ensemble des orbites, est traditionnellement noté G\X si
l'action est à gauche, et X/G si l'action est à droite. On dit que G agit transitivement
sur X s'il n'y a qu'une orbite. Un système de représentants de G\X ou X/G dans X est
parfois appelé un domaine fondamental.
• Si x G X, l'ensemble Gx des g G G fixant x (i.e. # • x = x) est un sous-groupe de G,
appelé stabilisateur de x.
Comme 1 • x = x, on a 1 G Gx. Si g • x = x, alors x = </_1 • (g • x) = </_1 • x, et donc Gx est
stable par passage à l'inverse. Enfin, si g • x = x et /i • x = x, alors ghx = g-(h-x)=g-x = x,
ce qui prouve que Gx est stable par la loi de groupe de G, et donc est un sous-groupe de G.
On fabrique des tas de groupes intéressants en considérant les stabilisateurs d'éléments d'ensembles
munis d'actions de groupes.
Si M est une matrice symétrique, le stabilisateur de M dans GLn(K) pour l'action A • M = AM*A est
le groupe orthogonal associé à M ; si M = In, ce groupe est noté On(K). Si K = R, si p + q = n, et si M
est la matrice diagonale avec p fois 1 et q fois -1 sur la diagonale, le groupe obtenu est noté 0(p, q) ; en
particulier O(n) = On(R).
Si M est une matrice antisymétrique, le stabilisateur de M dans GLn(K) pour l'action A • M = AM *A
est le groupe symplectique associé à M ; si n = 2m est pair, et si M est la matrice par bloc ( _jm !y ), ce
groupe est noté Spn(K).
Le stabilisateur de In pour l'action A • M = AMA* de GLn(C) est le groupe unitaire U(n).
Exercice 2.12. Montrer que, si y = g • x, alors Gy = gGxg~l = {gxg~l, x G Gx}. En déduire que, si
G est fini, le cardinal du stabilisateur est constant dans chaque orbite.
Exercice 2.13. (i) Montrer que le groupe D4 des isométries du carré de sommets A = (1,1),
B = (-1,1), C = (-1, -1) et D = (1, -1) est un groupe d'ordre 8, et expliciter ses éléments.
(ii) Soit O = (0,0), et soit S = {0,A,B,C, D}. Montrer que S est stable sous l'action de D4, et
déterminer les orbites sous l'action de D4, ainsi que le stabilisateur d'un des éléments de chaque orbite.
(iii) Soit T l'ensemble des paires d'éléments distincts de S. Déterminer les orbites de T sous l'action
de D4, ainsi que le stabilisateur d'un élément de chaque orbite.
(iv) Quel lien y a-t-il entre le cardinal d'une orbite et celui du stabilisateur dans tous les cas ci-dessus ?
2. STRUCTURES ALGÉBRIQUES
37
2.11.2. Classes de conjugaison
• Si G est un groupe, alors (g, x) i-> g • x = gxg~l est une action (à gauche) de G sur
lui-même.
Si g,h,x G G, alors ghx = ghx(gh)~l = ghxh~1g~1 = g • (hxh~l) = g • (h • x).
L'action de G sur lui-même ainsi définie est l'action par conjugaison. L'orbite de rc G G
est alors la classe de conjugaison de #, les éléments de la classe de conjugaison de x
sont dits conjugués à x (et donc x et y sont conjugués dans G s'il existe h e G tel que
y = hxh~l), et l'ensemble Conj(G) des orbites est l'ensemble des classes de conjugaison
de G. Le stabilisateur Zx de x pour cette action est appelé le centralisateur de x ; c'est
l'ensemble des g e G qui commutent à x.
• G est commutatif si et seulement si les classes de conjugaison sont réduites à un élément.
La classe de conjugaison de a; G G est l'ensemble des gxg-1, pour g G G. Comme elle
contient x, elle est réduite à un élément si et seulement si gxg~l = x, quel que soit g G G, et
donc si et seulement si x commute à tous les éléments de G. Ceci permet de conclure.
• Le centre Z de G est l'ensemble des £ € G commutant à tout élément de G ; c'est aussi
l'ensemble des x e G dont la classe de conjugaison est réduite à un point, et c'est un
sous-groupe de G.
Si xg = gx et y g = gy quel que soit g G G, alors xyg = xgy = gxy, ce qui montre que xy
commute à tous les éléments de G et donc que Z est stable par la loi de groupe. De même, si
xg = gx quel que soit g G G, alors gx-1 = x~lxgx~l = x~lgxx~l = x~lg, ce qui prouve que
Z est stable par passage à l'inverse. Comme il contient l'élément neutre ; c'est un sous-groupe
de G. Le reste ayant été démontré ci-dessus, cela permet de conclure.
Exercice 2.14- (i) Soient X un ensemble et G un groupe opérant sur X. Si g G G, on note Xg l'ensemble
{x G X, g • x = x} des points fixes de g.
(a) Si g, h G G, quel lien y a-t-il entre les points fixes de g et ceux de hgh~l ?
(b) Montrer que si X est fini et si g, g' sont conjugués dans G, alors ils ont le même nombre de
points fixes.
(ii) Soient V un espace vectoriel sur un corps K et G un groupe. On dit que G opère linéairement sur V
si G opère sur V et si v ■-» g • v est une application linéaire de V dans V, pour tout g G G (on dit alors
que V est une représentation de G).
(a) Montrer que, si c'est le cas et si g G G, l'ensemble des points fixes de g est un sous-espace
espace vectoriel de V.
(b) Montrer que, si V est de dimension finie et si g, g' sont conjugués dans G, alors leurs points
fixes sont des espaces vectoriels de même dimension.
2.11.3. Quotients de groupes. Si G est un groupe, et si H est un sous-groupe de G,
on peut utiliser la multiplication dans G pour faire agir H sur G à gauche (h • x = hx)
et à droite (x*h = xh). Une classe à gauche est alors de la forme Hx = {hx, h e H},
pour £ € G, et une classe à droite, de la forme xH. = {xhy h e H}, pour x e G. Les
quotients H\G (à gauche) et G/H (à droite) de G par H ne sont, en général, pas des
groupes, mais la multiplication dans G les munit d'actions de G (à droite pour H\G et à
38
VOCABULAIRE MATHÉMATIQUE
gauche pour G/H). Réciproquement, si R est une relation d'équivalence sur G telle que
la multiplication dans G induise une action à gauche (resp. à droite) de G sur G/R, et
si H est la classe d'équivalence de e, alors H est un sous-groupe de G et G/R = G/H
(resp. G/R = H\G).
• Si G opère (à gauche) sur un ensemble X, si x € X, et si Gx est le stabilisateur de x
dans G, alors g *-*■ g • x induit un isomorphisme de G/G^ sur l'orbite Ox de x (c'est un
isomorphisme de G-ensembles, i.e. d'ensembles munis d'une action de G).
Commençons par remarquer que, si gu 91 ont même image dans G/Gx, alors il existe h G Gx
tel que #2 = 9\K ce qui implique que gi -x = (gih) x = gi • (h-x) = gi x ; l'application g i-> gx
passe donc au quotient et nous définit une application 1 : G/Gx —► Ox qui est surjective par
définition de Ox. Maintenant, si gx • x = gi • x, alors g^yg\ • x = x et donc g^gi G Gx ; on en
déduit que g\ G p2Gx et donc que gi et gi ont même image dans G/Gx, ce qui prouve que 1 est
injective et donc bijective. Enfin, si h G G et g G G/Gx, alors h-t(g) = h-{gx) = hgx = t(hg),
ce qui prouve que 1 commute à l'action de G et donc est un morphisme de G-ensembles.
• La classe de conjugaison de x est isomorphe à G/Z-c, où Zx est le centralisateur de x.
C'est un cas particulier du point précédent.
Pour que la structure de groupe de G passe au quotient G/H, il faut et il suffit que,
quels que soient x,x' e G et h, h! e H, on puisse trouver h" e H tel que xhx'b! = xx'h".
Comme h"{h')~l = (xf)~lhxl, on voit que la condition précédente est équivalente à ce que
H soit laissé stable par la conjugaison h h-> ghg~l, quel que soit g G G. Si tel est le cas on
dit que H est distingué {normal en "franglais") dans G.
Un groupe simple est un groupe dont les seuls sous-groupes distingués sont {1} et le
groupe lui-même.
• Le groupe G/H vérifie la propriété universelle suivante : si / : G —> G' est un morphisme
de groupes, et si Ker / contient H, alors / se factorise à travers G/H (i.e. il existe un unique
morphisme de groupes / : G/H —» G', tel que / = /o7r, oÙ7r:G—> G/H est la projection
canonique).
• Si u : G —> G' est un morphisme de groupes, alors Kertx est distingué dans G et u se
factorise à travers G/Kertt et induit un isomorphisme de groupes de G/Kerw sur Imw.
Si G est simple, alors u est soit injectif soit trivial (u(g) = 1, quel que soit g e G).
3. Groupes finis
3.1. Groupes cycliques
3.1.1. Structure des groupes cycliques, ordre d'un élément
Si G est un groupe d'élément neutre 1 et si rc e G, on définit xn, pour n G Z, en posant
x° = 1, et xn+1 = xnx, si n € N, et xn = (x_1)_n, si n ^ 0. On vérifie facilement que
si n G Z, alors xn+ï = xnx et xn~l = xnx~1, ce qui permet de montrer, par récurrence
sur m, que xm+n = xmxn quels que soient ra,n e N. Autrement dit, n i-> xn est un
3. GROUPES FINIS
39
morphisme de groupes de Z dans G. Si x et y commutent, on a (xy)n = xnyn, mais s'ils
ne commutent pas, c'est en général faux (et si n = 2 ou si n = — 1, cela n'est vrai que si
x et y commutent).
Si G est commutatif et si la loi est notée +, l'élément xn est noté nx, et on a Ox = 0 et
(-l)rc = -x.
• Si x € G, le sous-groupe (x) engendré par x est l'ensemble des xn, pour n € Z.
En effet, d'une part un sous-groupe qui contient x contient xn, pour n G N, comme le
montre une récurrence immédiate, et comme il contient x-1, il contient aussi xn, pour n ^ 0 ;
d'autre paît, l'ensemble des xn, pour n G Z, est un groupe qui contient x, puisque c'est l'image
de Z par le morphisme x i-» xn.
Un groupe est cyclique s'il peut être engendré par un seul élément. Autrement dit, G
est cyclique, s'il existe rc G G tel que le morphisme x h* xn de Z dans G soit surjectif. Si
G est cyclique, un générateur de G est un élément # de G tel que le morphisme x i-> xn
de Z dans G soit surjectif.
• Le groupe Z est cyclique, et il admet deux générateurs 1 et — 1. Si D > 1, le groupe
Z/DZ est cyclique et les générateurs de Z/DZ sont les éléments de (Z/DZ)*, c'est-à-dire
les (réductions modulo D des) entiers premiers à D.
L'énoncé concernant Z est immédiat. Il est aussi immédiat que Z/DZ est cyclique et que
1 en est un générateur. Maintenant, si a G Z/DZ en est un générateur, alors il existe en
particulier 6 G Z tel que 6a = 1, ce qui fait que la réduction modulo D de 6 est un inverse
de a, et donc que a est inversible. Réciproquement, si a est inversible, alors rn^na est bijectif
de Z/DZ dans Z/DZ et donc rn^no est surjectif de Z dans Z/DZ, ce qui prouve que a est
un générateur de Z/DZ.
• Le groupe /xD des racines D-ièmes de l'unité dans C est cyclique, engendré par e2i,r/D,
et n h-> e2wn/D induit un isomorphisme de groupes Z/DZ = /xD- Un générateur de /LtD est
une racine primitive D-ième de l'unité, et les racines primitives D-ièmes de l'unité sont,
d'après le point précédent, les racines de la forme e2z7ra/D, pour a premier à D.
• Un groupe cyclique infini est isomorphe à Z; un groupe cyclique de cardinal D est
isomorphe*37) à Z/DZ. En particulier, un groupe cyclique est commutatif.
(37)un groupe cyclique est donc un objet parfaitement ennuyeux d'un point de vue théorique. La situation
est, en pratique, assez différente : il est très difficile, étant donné un groupe cyclique G de cardinal N
très grand (~ 10100), un générateur g de G et x G G, de déterminer l'élément n de Z/NZ tel que
x = gn (problème du logarithme discret), alors que calculer gn se fait sans problème. Ceci est à la
base des signatures électroniques : G, N et g sont publics et on attribue à chaque personne P un code
n(P) g Z/NZ (tenu secret), à partir duquel P fabrique une signature publique s(P) = gn^. Deux
personnes P et Q peuvent s'assurer de leur identité mutuelle de la manière suivante : P calcule s(Q)n(p)
et Q calcule s(P)n<Q), chacun de son côté; si les résultats sont les mêmes (à savoir pn(p)nW)), alors P
et Q sont bien P et Q (sinon, cela veut dire que quelqu'un a réussi à retrouver le code de l'un des deux à
partir de sa signature publique, ce qui est réputé être impossible). Les groupes cycliques utilisés sont en
général construits à partir de courbes elliptiques sur les corps finis (cf. annexe F).
40
VOCABULAIRE MATHÉMATIQUE
Soit G un groupe cyclique, et soit x un générateur de G. Alors / : Z —» G défini par
/(n) = xn est un morphisme surjectif, et il y a deux cas :
/ est injectif et alors G est isomorphe à Z ;
le noyau de / est non nul et donc de la forme DZ, avec D ^ 1, puisque c'est un sous-groupe
de Z ; alors / se factorise à travers / : Z/DZ —► G, et / est surjectif puisque / l'est et injectif
puisqu'on a factorisé modulo Ker / ; autrement dit / est un isomorphisme de Z/DZ sur G et,
en particulier, G et Z/DZ ont même cardinal.
Ceci permet de conclure.
• Si G est un groupe quelconque et rc G G, le sous-groupe (x) de G engendré par x est
cyclique par définition. On définit l'ordre de x comme le cardinal du groupe {x). Si x est
d'ordre D, le noyau du morphisme n —> xn de Z dans G est DZ d'après ce qui précède, et
l'ordre de x est aussi le plus petit entier n > 0 tel que xn soit égal à l'élément neutre.
3.1.2. Sous-groupes des groupes cycliques
• Si D > 1, l'application d i-> dZ/DZ est une bijection de l'ensemble des diviseurs de D
sur celui des sous-groupes de Z/DZ.
Si G est un sous-groupe de Z/DZ, on peut considérer son image inverse dans Z, qui est
un sous-groupe de Z contenant DZ; on obtient ainsi une bijection de l'ensemble des sous-
groupes de Z/DZ dans celui des sous-groupes de Z contenant DZ, la bijection inverse étant
G —» G/DZ. Comme un sous-groupe de Z contenant DZ est de la forme dZ, avec d diviseur
de D, cela permet de conclure.
• Si G est un groupe cyclique, tous les sous-groupes de G sont cycliques, et si G est de
cardinal D, alors G admet exactement un sous-groupe de cardinal D', pour tout diviseur D'
deD.
Si G est infini, alors G est isomorphe à Z, et tous les sous-groupes non nuls de G sont
isomorphes à Z, et donc cycliques.
Si G est fini de cardinal D, alors G est isomorphe à Z/DZ, et on sait que les sous-groupes
de Z/DZ sont de la forme dZ/DZ, pour d diviseur de D. Or n i-> dn induit une surjection
de Z sur rfZ/DZ dont le noyau est D'Z, où D' = D/rf, ce qui montre que dZ/DZ ^ Z/D'Z.
Comme d i-> D' = D/d est une permutation de l'ensemble des diviseurs de D, cela permet de
conclure. >
3.2. Groupes abéliens finis
Soit & l'ensemble des nombres premiers. D'après le théorème des restes chinois, si
D € N — {0}, alors Z/DZ = 0p6^»(Z/pv'^D)Z). La somme ci-dessus est en fait une somme
finie car vp(D) = 0, sauf pour un nombre fini de nombres premiers. Ce résultat se généralise
à tous les groupes abéliens finis sous la forme (cf. n° 10.3 du § 10 pour la démonstration).
Théorème 3.1. (Kronecker, 1867) Soit G un groupe abélien fini et, sipe &, soit Gp
l'ensemble des éléments de G d'ordre une puissance de p.
(i) Gp est un sous-groupe de G, nul pour presque tout p, et G = 0pe^»Gp.
3. GROUPES FINIS
41
(ii) Si p € &, il existe une suite finie d'entiers aPj > 1, décroissante et uniquement
déterminée, telle que l'on ait Gp = ei(Z/pa"-iZ).
Remarque 3.2. Avec les notations du théorème, |G| = E[p litPai? et donc 1^1 est un
multiple de pûi, pour tous p et i, ce qui prouve que la multiplication par |G| annule tout
élément de G, puisqu'elle annule tous les Z/p^Z. Autrement dit, dans un groupe com-
mutatif, l'ordre d'un élément divise l'ordre du groupe (cas particulier du th. de Lagrange).
Exercice 3.3. Décomposer (Z/108Z)* et (Z/200Z)* sous la forme ci-dessus.
Exercice 3-4- (i) Soit K un corps fini commutatif*38^. Montrer que le groupe K* est cyclique (on pourra
considérer le nombre de solutions de l'équation xp = 1, pour p premier divisant |K*| et utiliser le th. 3.1).
(ii) Soit p ^ 2 un nombre premier. Montrer que x est un carré dans F* (i.e. x = y2, avec y G F*) si et
seulement si x(p-1)/2 = 1.
(iii) En déduire que —1 est un carré dans F* si et seulement si p est de la forme An + 1.
(iv) Soit p de la forme An + 3. Montrer que l'équation a? + b2 =p n'a pas de solution avec a, b G Z.
Exercice 3.5. (i) Soit p un nombre premier. Montrer que, si x = l+pka mod pk+l, et si k ^ 1 (k ^ 2,
si p = 2), alors xp = 1+ pk+la mod pk+2. En déduire que (1 + p)p"~2 ^ 1 dans (Z/pnZ)*, si p ^ 2 et
n > 2, et que (1 + 4)p"~3 ^ 1 dans (Z/2nZ)*, si n ^ 3.
(ii) Soit N le noyau de la réduction modulo p de (Z/pnZ)* dans F* (dans (Z/4Z)*, si p = 2). Montrer
que N est isomorphe à Z/pn~lZ (à Z/2n_2Z, si p = 2).
(iii) En utilisant le résultat de l'ex. 3.4, montrer que (Z/pnZ)* ^ (Z/(p - 1)Z) e (Z/pn_1Z) en tant
que groupe commutatif, si p ^ 2 et n ^ 1.
(iv) Montrer que (Z/2nZ)* ^ (Z/2Z) e (Z/2n"2Z), si n > 2.
3.3. Le théorème de Lagrange et ses variantes
Si G est un groupe fini, et si H est un sous-groupe de G, alors h •-» xh induit une bijection
de H sur xH, ce qui fait que les classes à droite xU ont toutes le même cardinal |H|. Comme
G est la réunion disjointe des #H, pour x e G/H, on en déduit la formule
|G| = |G/H|-|H|.
En particulier, |H| divise |G|, ce qui se traduit par :
• Si G est un groupe fini, alors le cardinal de tout sous-groupe de G divise celui de G
(th. de Lagrange).
On peut spécialiser cela au sous-groupe engendré par un élément x de G : le cardinal de ce
sous-groupe est, par définition, l'ordre de x, ce qui nous donne :
• Dans un groupe fini Tordre d'un élément divise le cardinal du groupe.
Enfin, |G/H| divise aussi |G|. Si X est un ensemble sur lequel G agit, si O est une orbite, si
x e O, et si H est le stabilisateur de x, on sait que O = G/H. On en déduit que :
• Dans un ensemble sur lequel agit un groupe fini, le cardinal d'une orbite divise le cardinal
(38)Cette hypothèse est en fait superflue car tout corps fini est commutatif (théorème de Wedderburn).
42
VOCABULAIRE MATHÉMATIQUE
du groupe et, plus précisément, le produit du cardinal de l'orbite par celui du stabilisateur
d'un de ses éléments est égal au cardinal du groupe.
En particulier, en appliquant ceci à l'action de G sur lui-même par conjugaison intérieure,
on obtient :
• Dans un groupe fini, le cardinal d'une classe de conjugaison divise le cardinal du groupe.
• Si X est un ensemble fini sur lequel agit un groupe fini G, on peut découper X en orbites
pour cette action. Si on choisit un élément par orbite, et si on utilise l'isomorphisme
Os = G/G-c, où G;ç est le stabilisateur de x, on obtient la formule des classes :
W = £ l°-l = M ■ £ Tg-r
*eG\x xeG\x ' x|
Exercice 3.6. Montrer que tout élément x G F* vérifie xp~l = 1. En déduire le petit théorème de
Fermât*39) (si n G Z, alors np -n est divisible(40) par p).
Exercice 3.7. (démonstration combinatoire du petit th. de Fermât). Soient n ^ 1 et X l'ensemble des
applications de Z/pZ dans {1,... ,n}. Si g G Z/pZ et <\> G X, on définit g • <\> par (g • <t>){x) = </>(x + g),
pour tout x G Z/pZ (la loi de groupe de Z/pZ est notée additivement).
(i) Vérifier que ceci définit une action de groupe.
(ii) Quels sont les points fixes de cette action ? Combien y en a-t-il ?
(iii) Combien d'éléments a une orbite non réduite à un point ?
(iv) Calculer le nombre de ces orbites, et en déduire le petit théorème de Fermât.
3.4. Le groupe symétrique Sn
3.4-1- Permutations
Si n G N — {0}, on note Sn le groupe des bijections de {1,... ,n}. Comme il y a n
manières de choisir l'image de 1, n — 1 de choisir celle de 2 une fois celle de 1 choisie, etc.
le cardinal de Sn est n(n — 1) • • • 1 = n\. Par définition, Sn opère sur {1,... ,n} ; il opère
donc aussi sur toutes sortes d'objets construits à partir de {1,... ,n} comme l'ensemble
des parties de {1,..., n} (l'image d'une partie {i\,..., ip} par a est \o{i\),..., 0"(*p)}).
(39)Énoncé dans une lettre à Frenicle du 18 octobre 1640.
(40)ii n>y a pas fe réciproque au petit théorème de Fermât : il existe des entiers n dit de Carmichael tels
que an - a soit divisible par n pour tout a, et qui ne sont pas premiers. Le résultat le plus proche est
le test de primalité de Lucas (1876) généralisé par Lehmer (1927) : s'il existe a G {2,..., n - 1} tel que
an-i = i moc| n et a(n-i)/p ^ i moc| n p0ur tout diviseur premier p de n — 1, alors n est premier. En
effet, la première congruence montre que a est premier à n, et que son ordre m dans (Z/nZ)* est un
diviseur de n - 1 ; les non congruences montrent vp(m) = vp(n - 1) pour tout premier p divisant n — 1,
et donc m est un multiple den-letm = n-l. Comme |(Z/nZ)*| est un multiple de l'ordre m de a et
est < n - 1, il en résulte que |(Z/nZ)*| = n - 1 et donc n est premier. Prendre a = 5 suffit à prouver que
2iooi3I600 _j_ 1 est premier (ies calculs prennent une poignée de secondes sur un ordinateur; par contre
pour un entier n quelconque, il faut d'abord factoriser n - 1, ce qui est plus dur que de prouver que n
est premier par d'autres méthodes).
3. GROUPES FINIS
43
Exercice 3.8. On fait agir Sn sur l'ensemble des parties de {1,..., n} comme ci-dessus,
(i) Si p < n, quelle est l'orbite de {1,... ,p} ?
(ii) Quel est le stabilisateur de {1,... ,p} ; quel est son cardinal ?
(iii) Retrouver la valeur , ^'y pour le nombre de parties à p éléments d'un ensemble à n éléments.
Un élément de Sn est une permutation. Si a e Sn, on définit le support de a comme
l'ensemble des i € {l,...,n} tels que a(i) ^ i. Il est plus ou moins évident que deux
permutations de supports disjoints commutent entre elles.
On peut représenter une permutation a de Sn sous la forme d'une matrice à 2 lignes et
n colonnes en mettant les nombres de 1 à n sur la première ligne et leurs images par o
juste en-dessous. Cette représentation est très commode pour faire le produit de deux
permutations (en n'oubliant pas que c'est la matrice de droite qui agit en premier).
Par exemple, si a et r sont les permutations de Sq définies par a(l) = 2, a(2) = 4, <r(3) = 5, a(4) = 6,
a(5) = 1 et a(6) = 3, et r(l) = 4, r(2) = 2, r(3) = 1, r(4) = 6, r(5) = 5 et r(6) = 3, alors
/T_/12345 6\ T_/123456^ pf „- _ (l 2 3 4 5 6 W I 2 3 4 5 6 \ _ ( 1 2 3 4 5 6 \
a - 12 4 5 6 1 3 ) ' r-U21653J el ar — 12 4 5 6 1 3 A 4 2 1 6 5 3 ) — U 4 2 3 1 5 ) '
Une permutation a G Sn est un k-cycle s'il existe ti,... ,i* distincts, tels que
a(zi) = i2, a(t2) = *3, • • •, 0"(4) = *i, et <r(j) = j, si j £ {ii,... ,ik}-
On note (ïi, »2» • • • » h) le A:-cycle défini ci-dessus ; son support est l'ensemble {ti,..., t*} ;
il est d'ordre k. On remarquera que le &-cycle (ii,t2> • • • >**) est aussi égal au &-cycle
(io,*o+i> • • • >Wfc-i)> si on écrit les indices modulo k, et a est n'importe quel élément de
Z/kZ. Pour rétablir une unicité de l'écriture, il suffit d'imposer que i\ soit le plus petit
élément de {ti,...,»*}. Il est commode d'étendre la notation ci-dessus aux «cycles de
longueur 1 » (qui sont tous égaux à l'identité...).
• Si o- est un &-cycle, alors ak = id.
• Une permutation peut s'écrire comme un produit de cycles de supports disjoints.
Si a est une permutation, on fabrique une partition de {l,...,n} en prenant les orbites
Oi,..., Os sous l'action de a (i.e. sous l'action du sous-groupe cyclique de Sn engendré par a).
Si Of est une de ces orbites, de cardinal ki% on peut considérer le cycle c* = (a, a(a),..., afci-1(a)),
où a est le plus petit élément de O* ; c'est un cycle de longueur ki et de support O*, et a est
le produit des c*, pour i € {1,..., s}.
Comme des cycles ayant des supports deux à deux disjoints commutent entre eux, on
peut faire le produit dans n'importe quel ordre dans la décomposition d'une permutation
en cycles de supports disjoints.
Par exemple, soit a G Sa la permutation définie par : <r(l) = 3, <r(2) = 2, a(3) = 5, a(4) = 6,
a(5) = 1 et a(6) = 4. Alors on a a = (1,3,5)(4,6)(2) = (4,6)(2)(1,3,5)... Très souvent on omet les
cycles de longueur 1 de la décomposition ; on écrit donc plutôt la permutation précédente sous la forme
a = (1,3,5)(4,6) ou a = (4,6)(1,3,5).
• Tout élément de Sn est conjugué à un unique élément de la forme
(i,...,^1)(^1 + i,...,^1+^)...(^i + ... + 4-i + i,...^i + --- + 4-i + 4),
44
VOCABULAIRE MATHÉMATIQUE
où (tu...,t8) est une partition de n (i.e. une suite décroissante d'entiers > 1 dont la
somme est n). Les classes de conjugaison de Sn sont donc en bijection naturelle avec les
partitions de n.
Soit a G Sn. La conjugaison a i-> aaa~l par un élément a de Sn transforme un fc-cycle
»i h-» Î2 »->•••»-> ifc »-> ti, en le fc-cycle a(i\) i-> afo) i-> • • • »-» a(ik) »-» #(ii). Les longueurs
des cycles apparaissant dans les décompositions de deux permutations conjuguées sont donc
les mêmes, ce qui implique l'unicité d'un conjugué de la forme voulue, puisque les £j sont les
longueurs des cycles apparaissant dans la décomposition decr rangées dans l'ordre décroissant.
Écrivons donc a comme un produit de cycles ti...ts à supports disjoints. Soit £j la longueur
de Tj. On a t\ H YCS = ny et quitte à permuter les r^, on peut supposer que t\ ^ £2 • • • ^ 4-
On peut alors écrire tj sous la forme tj = (i*1+...+*i_1+i,... ,i£1+...+€i_1+€i)î et k i-> i^ nous
définit une permutation a de {l,...,n}, car les supports des Tj forment une partition de
{1,... ,n}. Alors a~~laa est un conjugué de a de la forme voulue, ce qui permet de conclure.
• Un 2-cycle est appelé une transposition, et Sn est engendré par les transpositions ; plus
précisément, tout élément de Sn est produit de moins de n — 1 transpositions.
La démonstration se fait par récurrence sur n. Pour n = 1 (et n = 2), le résultat est
immédiat. Si n ^ 2, et si a G Sn vérifie a(n) ^ n, alors r = (cr(n),n) est une transposition et
ra fixe n, et donc peut être vu comme un élément de Sn_i. D'après l'hypothèse de récurrence,
ra est un produit de moins de n - 2 transpositions à support dans {l,...,n- 1}, et donc
a = r(rcr) est un produit de moins de n - 1 transpositions. On en déduit le résultat, le cas
a(n) = n se traitant directement.
Exercice 3.9. Calculer (1,2)(2,3)(3,4)(4,5) dans S5.
Exercice 3.10. Montrer que Sn est engendré par les transpositions (1,2), (2,3),..., (n - 1, n).
Exercice 3.11. Soit a G Sn dont la décomposition en cycles disjoints est n • • -rs, chaque r* étant de
longueur ^. Quel est l'ordre de al
Exercice 3.12. (i) Combien y a-t-il de cycles de longueur k dans Sn.
(ii) Montrer que le nombre moyen de cycles dans la décomposition d'un éléments de Sn tend vers
l'infini avec n. (On pourra se demander dans combien de permutations apparaît un cycle donné.)
Exercice 3.13. (difficile mais très surprenant) Le DGAE voulant tester le niveau de compréhension
des X a décidé de les mettre à l'épreuve. Pour ce faire, il réunit les 500 membres de la promotion dans
l'amphi Poincaré et leur tient ce langage : « J'ai disposé dans l'amphi Arago vos 500 noms dans des casiers
numérotés de 1 à 500, à raison d'un par casier. Je vais vous appeler un par un, et demander à chacun
d'entre vous d'ouvrir des casiers un par un à la recherche de son nom puis de les refermer sans changer
le contenu et de regagner sa chambre sans possibilité de communiquer quoi que ce soit à ses camarades
restés dans l'amphi Poincaré. Si tout le monde trouve son nom dans les 250 premiers casiers qu'il a
ouverts, vous pouvez partir en vacances. Si l'un d'entre vous ne trouve pas son nom, on recommence le
jour suivant (et je change le contenu des casiers bien évidemment). Voilà, vous avez deux heures pour
concevoir une stratégie. » Désespoir des X qui se rendent compte que chacun a une chance sur deux de
tomber sur son nom, et qu'au total ils ont une chance sur 2500 de partir en vacances au bout d'un jour,
et donc qu'ils ne partiront pas en vacances. Pourtant au bout d'un certain temps, l'un de nos X déclare :
« pas de panique, avec un peu de discipline, on a 9 chances sur 10 de partir en vacances avant la fin de
la semaine ». Saurez-vous retrouver son raisonnement ?
3. GROUPES FINIS
45
34-%- Signature d'une permutation
Si o e Sn, on définit la signature sign(a) de a par la formule
sign(<7)= I] i_i ■
• sign : Sn —» {±1} est un morphisme de groupes.
Si <r,r G Sn, on a
**->- n ^f^=( n £f^f)( n %?%
Le second terme est égal àsign(r), et le premier à sign(a) car ^{ijl^ffi = ^(jj-T^' ce *ïui
permet d'écrire le produit sous la forme Iïi<T(«)<Ta)<n ^$1$)^ = siën(a)-
• Si r est un &-cycle, alors sign(r) = (-l)fc_1.
On a sign(a<ro-1) = sign(a)sign(a)sign(a)_1 = sign(a), ce qui prouve que la signature est
invariante par conjugaison et donc que tous les fc-cycles ont même signature. Cela permet de
prendre r = (n - l,n) pour calculer la signature d'une transposition. On a alors
*»<*>=< n *£%nIUVknT-^)-X-Vn]
=( n i4^T))( n ^^) •(-!)=-!.
ce qui prouve le résultat pour une transposition. Maintenant, le fc-cycle a^ = (ii,... ,i&) est
le produit des transpositions (21,22) • • • (ù-i,ifc), et comme il y a k - 1 transpositions dans ce
produit, on a sign(crfc) = (-1)*"1, ce qu'on cherchait à démontrer.
Exercice 3.14- Montrer que sign(cr) = (-i)n-w(a), où u(a) est le nombre d'orbites de a.
Exercice 3.15. Si a G Sn, on note ua l'endomorphisme de Cn envoyant un élément e* de la base
canonique de Cn sur ea(i).
(i) Montrer que a i-> ua est un morphisme de groupes de Sn dans GLn(C).
(ii) Montrer que si r est une transposition, alors uT est une symétrie par rapport à un hyperplan que
l'on déterminera. Que vaut detuT?
(iii) En déduire que detua = sign(cr) pour tout a G Sn.
3.4-3. Groupe alterné
Le groupe alterné An est le noyau de la signature. Comme sign : Sn —> {±1} est
surjective, on a |An| = ||Sn| = y. Un fc-cycle est dans An, si et seulement si k est impair.
• An est engendré par les 3-cycles.
Cela se démontre par récurrence sur n. Le résultat est évident (et vide) si n < 2. Soit n ^ 3,
et soit a G An. Si a(n) ^ n, on peut choisir un 3-cycle (n,cr(n),c), où c £ {n,cr(n)}, et alors
r~la fixe n et peut être écrit comme un produit de 3-cycles à support dans {1,... ,n — 1}
d'après l'hypothèse de récurrence; donc a = r(r~la) peut être écrit comme un produit de
3-cycles. On en déduit le résultat, le cas a(n) = n se traitant directement.
46
VOCABULAIRE MATHÉMATIQUE
• Si n > 5, tous les 3-cycles sont conjugués dans An.
Il suffit de prouver qu'ils sont tous conjugués àcro = (1,2,3). Soit a un 3-cycle. Comme les
3-cycles sont tous conjugués dans Sn, il existe a G Sn tel que a = olgqol~1. Si a G An, on a
gagné. Sinon, r = (4,5) commute avec g0 puisque leurs supports sont disjoints, et (3 = ar G An
vérifie PgqP~1 = arcror"1a~1 = olgqol~1 = a, ce qui montre que g est conjugué à Go dans An.
• Le groupe A5 est un groupe simple.
Soit H un sous-groupe distingué de A5 non réduit à l'identité. On veut prouver que H = A5
et il suffit de prouver que H contient un 3-cycle, car ceci implique qu'il contient tous les 3-cycles
puisque ceux-ci sont conjugués dans A5, et donc H = A5 puisque les 3-cycles engendrent Ar).
Soit donc crGH-{l}.Ilya trois possibilités : g est un 3-cycle et il n'y a rien à faire, ou
a est un 5-cycle ou c'est le produit de 2 tranpositions de supports disjoints.
• Si g est le 5-cycle (a,6,c,d, e), soit r = (a, 6, c). Alors H contient t~1g~1t puisqu'il est
distingué et donc aussi h = gt~1g~1t. Or r-1 est le 3-cycle (c, 6, a) et gt~1g~1 est le 3-cycle
(cr(c),cr(6),a(a)) = (d,c, b). Donc h = (d, c,6)(a, 6,c) laisse fixe e et a ^ 6 ^ d, 6 ^ c m 6,
ci->ai->a, etd»->di->c; c'est donc le 3-cycle (a, d, c).
• Si g = cri(72, avec gi = (a, 6), 02 = (c, d), et a, 6, c, d distincts deux à deux, et si
r = (c,d,e), où e fi {a,6,c,d}, alors H contient h = gt~1g~1t. Or g\ commute à g^ et r,
donc h — G2T~1G2lr. Maintenant, r~1(7^1r est la transposition (r"1(c),r"I(d)) = (e,c) et
donc /i = (c, d)(e, c) = (c, e, d) est un 3-cycle.
• Si n > 5, le groupe An est un groupe simple<41).
Soit n ^ 5, soit H un sous-groupe distingué de An, et soient g ^ id un élément de H et
r = (a,6,c) un 3-cycle. Alors H contient h = tgt~1g~1 qui est le produit des 3-cycles r et
gt~1g~1 = ((7(c),cr(6),(7(a)). Soit alors b = cr(a), et soit c ^ {a,cr(a),(72(a)}, non fixé par g
si jamais g échange a et g{q) (un tel c existe toujours, sinon g serait une transposition, ce
qui est impossible puisque g G An). La condition mise sur c fait que h ^ id, et celle mise
sur b implique que le support de h est inclus dans {a,a(a),(72(a),c,(7(c)} et donc comporte
au plus 5 éléments. Soit X de cardinal 5 contenant le support de /i, et soit Perm(X) le groupe
des permutations de X. Alors HnPerm(X) est un sous-groupe distingué de Perm(X), et donc
contient un 3-cycle d'après l'étude du cas n = 5. On en déduit que H = An comme-ci-dessus
puisque An est engendré par les 3-cycles qui sont tous conjugués dans An.
Exercice 3.16. (i) Montrer que si G est un groupe fini abélien, et si d divise |G|, alors G a un sous-
groupe de cardinal d. (On pourra utiliser le théorème de structure.)
(ii) Montrer que si / : Sr> —► S3 est un morphisme de groupes, alors Im(/) a 1 ou 2 éléments.
(iii) Montrer que S5 n'a pas de sous-groupe d'ordre 40.
3.5. Les théorèmes de Sylow
Cauchy a démontré (cf. ex. 3.18) que, si G est un groupe fini d'ordre (l'ordre d'un groupe
est, par définition, son cardinal) divisible par un nombre premier p, alors G contient un
élément d'ordre p (et donc un sous-groupe (cyclique) d'ordre p). D'un autre côté, Tordre
d'un sous-groupe divisant l'ordre du groupe (théorème de Lagrange), tout sous-p-groupe
(41>Ce résultat, conjugué avec la théorie de Galois, explique que l'on ne puisse pas trouver de formule
générale donnant les racines d'une équation de degré n, si n ^ 5.
3. GROUPES FINIS
47
(un p-groupe est un groupe dont Tordre est une puissance de p) de G d'ordre pa vérifie
a ^ i>p(|G|). Un p-Sylow de G est un sous-groupe d'ordre pMIGI). (Dans le cas vp(|G|) = 0,
un tel sous-groupe est donc réduit à l'élément neutre.)
• Si G est un groupe commutatif d'ordre divisible par p, alors G contient un sous-groupe
cyclique d'ordre p.
Si x G G, soit nx l'ordre de x. Par définition cela signifie que le morphisme de groupes
de Z dans G envoyant a G Z sur xa admet pour noyau nxZ, et donc induit un isomorphisme
de Z/nxZ sur le sous-groupe de G engendré par x. Soit alors X c G engendrant G (on peut
prendre X = G par exemple). Comme G est commutatif, l'application ©xex(Z/nxZ) —> G,
envoyant (ax)xex sur Ylxexxa* est un morphisme de groupes, et comme X engendre G, ce
morphisme est surjectif. L'ordre de G est donc un diviseur de Ylxexnx- Comme p divise |G|,
cela implique que p divise un des nx, et alors y = xn*/p est d'ordre p et le sous-groupe de G
engendré par y est d'ordre p. Ceci permet de conclure.
Théorème 3.17. (Sylow, 1872) Si G est un groupe fini, l'ensemble des p-Sylow de G
est non vide. De plus :
(i) Tous les p-Sylow de G sont conjugués.
(ii) Si Q est un sous-p-groupe de G, alors il existe un p-Sylow de G contenant Q ; en
particulier, tout élément d'ordre p est contenu dans un p-Sylow de G.
La démonstration se fait par récurrence sur |G|, le cas |G| = 1 étant évident (et vide). Soit
Z le centre de G, et soit k = vP(|G|).
• Si p divise l'ordre de Z, alors Z contient, d'après le point précédent, un sous-groupe
cyclique C d'ordre p. On peut appliquer l'hypothèse de récurrence à H = G/C qui est
d'ordre mpk~l. Si Ph est un p-Sylow de H, l'image inverse de Ph dans G est un sous-groupe
d'ordre |PH| • |C| = pk~lp = pk ; c'est donc un p-Sylow de G.
• Si p ne divise pas |Z|, on fait agir G par conjugaison intérieure (g • x = gxg~l) sur G.
Par définition du centre, les orbites (qui ne sont autres que les classes de conjugaison de G)
ne comportant qu'un seul élément pour cette action, sont exactement les {c}, pour c G Z.
Comme |Z| est premier à p et comme |G| est divisible par p, il y a une orbite O, non réduite
à un élément, de cardinal premier à p. Si x G O, et si H est l'ensemble des éléments de G
commutant à x, on a O = G/H. On en déduit que |H| = j§[. Comme vP(|0|) = 0, on a
vp(|H|) = vp(|G|) = fc, et comme |0| > 1, on a |H| < |G|. L'hypothèse de récurrence montre
que H contient un sous-groupe d'ordrepfc, et donc que G aussi; d'où l'existence de p-Sylow.
Maintenant, si P est un p-Sylow de G, et si Q est un sous-p-groupe de G, on peut faire
agir Q sur G/P par translation à gauche. Comme G/P est de cardinal premier à p, puisque
P est un p-Sylow, au moins une des orbites O a un cardinal premier à p. Mais O est de la
forme Q/H, où H est un sous-groupe de Q, et comme Q est un p-groupe, on a |Q/H| premier
à p si et seulement si H = Q. Il existe donc x G G/P fixe par Q tout entier. En prenant un
représentant x de x dans G, cela se traduit par QxP c #P, ou encore par Q c xPx~x.
Si Q est un p-Sylow, on en déduit que Q = xPx~l pour des raisons de cardinal, ce qui
démontre le (i). Si Q est un sous-p-groupe, cela montre que Q est contenu dans un sous-groupe
d'ordre pk, c'est-à-dire dans un p-Sylow. Ceci démontre le (ii) et permet de conclure.
48
VOCABULAIRE MATHÉMATIQUE
Exercice 3.18. Soient p un nombre premier et G un groupe fini de cardinal divisible par p. On fait
agir Z/pZ sur Gp par i • (#o, • • •,Xp-\) = (#*,a?i+i, • •., Xi-i) (i.e. on décale les indices de «, en identifiant
Z/pZ et {0,... ,p- 1}). Soit X le sous-ensemble de Gp des (x0, • • •,#p-i) vérifiant x0 • • • xp-i = 1.
(i) Montrer que X est stable par Z/pZ. Quels sont les points fixes de cette action?
(ii) Montrer que |X| est divisible par p ; en déduire que G admet des éléments d'ordre p.
4. Polynômes
4.1. Polynômes en une variable
4.1.1. Polynômes
Si A est un anneau commutatif, on note A[X] l'ensemble des polynômes à coefficients
dans A, en la variable X, i.e. l'ensemble des expressions de la forme P = EneN anXn, avec
an = 0 sauf pour un nombre fini de n € N ; les an sont les coefficients de P, et on dit que
P est nul (ou P = 0) si tous ses coefficients son nuls.
On munit A[X] d'une structure d'anneau (et même de A-algèbre unitaire) en posant^42) :
O C ' ( £neN ûnX") = En€N(Cûn)Xn, si C € A,
O ( £„€N "nX") + ( En€N W») = En^K + MX»,
o ( En€N a»*») ( EnGN M») = E„€n *X", avec * = Ei+j=n ^r
L'anneau ainsi obtenu est Vanneau des polynômes à coefficients dans A en la variable X ;
on définirait de même les anneaux A[T], A [Y], A[Xi], etc. des polynômes à coefficients
dans A en la variable X, Y, Xi etc. Tous ces anneaux sont isomorphes entre eux<43) de
manière naturelle^ et donc sont « les mêmes », mais il est commode de pouvoir changer
de variable.
Si P G A[X] est non nul, le degré deg P de P est le plus grand n G N tel que an ^ 0 ;
par convention(45), on pose degO = -00. Si N > degP, on peut se permettre d'ignorer
les termes de degré > N, et donc d'écrire P sous la forme a^XN H h ao ou Eilo ^X*.
Si deg P = d, le coefficient ad est le coefficient dominant et P est unitaire si ce coefficient
est 1 ; si c'est le cas, P s'écrit sous la forme Xd + Od_iXd_1 H h a0.
<42) Vérifier que ceci définit bien une structure de A-algèbre unitaire est fastidieux mais sans difficulté
(43)L'isomorphisme consiste à envoyer 5TneNanXn sur X)neNanTn, Z)neNa»iYn> etc. En fait, on peut
d'éfinir l'anneau des polynômes à coefficients dans A, sans référence à une variable, comme l'ensemble
A(N) des suites (an)n6N presque nulles (i.e. an = 0 sauf pour un nombre fini de n), muni de
l'addition (an)n6N + (MneN = (ûn + &n)n€N et de la multiplication (an)n€N • (MneN = (cn)n€N, avec
cn = J2i+j=naibj* mais ce point de vue n'est pas utilisé en pratique car on préfère l'autre écriture qui
suggère fortement qu'un polynôme est aussi une fonction.
(44)Signalons le problème ouvert suivant : soient A, B des anneaux commutatifs. On suppose qu'il existe
un isomorphisme d'anneaux <p : A[X] —» B[X] ; est-ce-que cela implique que les anneaux A et B sont
isomorphes (l'isomorphisme (p n'est pas supposé envoyer A dans B ni X sur X) ?
(45)Une des raisons est que l'on veut que la formule degPQ = degP + degQ ait une chance d'être vraie.
4. POLYNÔMES
49
• Si P,Q e A[X], alors deg(P + Q) ^ sup(degP,degQ) et degPQ ^ degP + degQ avec
égalité si le coefficient dominant de P ou de Q n'est pas un diviseur de zéro; si A est
intègre, alors A[X] est intègre et degPQ = degP + degQ, pour tous P,Q e A[X].
Les inégalités deg(P + Q) ^ sup(deg P, deg Q) et deg PQ ^ deg P + deg Q sont immédiates.
Maintenant, si P = anXn-\—+a0 et Q = bmXm-\ h60 sont de degrés n et m respectivement
(i.e. an ^ 0 et bm ^ 0), le coefficient de Xn+m dans PQ est anbm ; il est donc non nul si an ou bm
n'est pas un diviseur de zéro et alors degPQ = m+n = deg P +degQ. C'est automatiquement
le cas si A est intègre, et donc PQ ^ 0 si P ^ 0 et Q ^ 0, ce qui prouve que A[X] est intègre
si A l'est.
4.1.2. Fonctions polynomiales
Si B est une A-algèbre unitaire (par exemple, si B = A), alors P = EneN^ € A[X]
définit une fonction polynomiale P : B —» B par la formule P(x) = J2n anxn, où la somme
est en fait une somme finie puisqu'il n'y a qu'un nombre fini de termes non nuls, et x° = 1
(unité de B) par convention. L'application P h* P(x) est un morphisme d'anneaux (et
même de A-algèbres unitaires) de A[X] dans B.
La fonction polynomiale définie par P G A[X] sur B est aussi celle de (p(B) e B[X],
où (p : A[X] —> B[X] est le morphisme d'anneaux défini par <p(^anXn) = ^y?(on)Xn, et
a i-* <p(a) = a • 1 est le morphisme d'anneaux de A dans B déjà rencontré au n° 2.4.
Par exemple, P € Z[X] définit une fonction polynomiale sur Fp, pour tout p € & ; ceci est souvent
utilisé pour étudier la factorisation de P dans Z[X].
Si V est un K-espace vectoriel et si u 6 End(V), alors P ■-» P(w) est un morphisme d'anneaux de K[X]
dans End(V) qui joue un grand rôle dans la réduction de Pendomorphsime u (cf. n° 10.1).
Si Xq e B vérifie P(zo) = 0, on dit que xo est une racine de P (dans B), ou que xq est
un zéro de P (dans B).
• Si P = adXd + • • • + oo € A[X], où d ^ 1 et ad ^ 0, et si x0 e B, alors P - P(x0)
peut se factoriser dans B[X] sous la forme P — P(xo) = (X — £0)Q, avec Q € B[X], et
degQ = d - 1, si ad ^ 0 dans B.
On utilise la formule Xn - a# = (X - x0)(Xn_1 + x0Xn_2 + • • • + a#_1). On en déduit la
factorisation P -P(x0) = (X-x0)(ad(Xd-1 + x0Xd~2 + -•• + x^~l) + ••• + a2(X + x0) + ai)
et le résultat.
• Si A est intègre (par exemple, si A est un corps), et si P G A[X], non nul, admet
#i,...,£r comme racines distinctes dans A, alors P peut se factoriser sous la forme
P = (X — xi) • • • (X — £r)Q, et degQ = degP — r ; en particulier, P a au plus^ degP
racines distinctes dans A ; si P de degré < n s'annule en n + 1 points distincts, alors P = 0.
On raisonne par récurrence sur r, le cas r = 0 étant vide. Si P(xi) = 0, on peut, d'après le
point précédent, écrire P = P - P(xi) sous la forme P = (X - xi)Pi, avec deg Pi = degP - 1.
Maintenant, 0 = P(#i) = (xi-xi)Pi(xi), si i = 2,..., r, et comme Xi ^ #i et A est intègre, cela
*46)Ce résultat est faux si A n'est pas intègre, cf. ex. 2.5 et 2.6 ; il est aussi faux dans le cas non commutatif,
cf. ex. 2.2.
50
VOCABULAIRE MATHÉMATIQUE
implique xi -x\ ^ 0 et Pi(xi) = 0. On conclut en utilisant l'hypothèse de récurrence appliquée
à Pi, dont on déduit que Pi = (X - X2) • • • (X - xr)Q, avec deg Q = deg Pi — (r -1) = deg P - r.
• Si K est un corps infini, P € K[X] est identiquement nul sur K si et seulement si P = 0.
C'est une conséquence immédiate du point précédent. Notons que le résultat est faux si K
est fini : le polynôme Ila€K(X — <*) est identiquement nul sur K, mais n'est pas nul.
• Soient ao,... ,an des éléments distincts d'un corps K, et soit P G K[X], de degré n.
Alors P = YA=o^(ai) IljVi ^^f: (polynômes d'interpolation de Lagrange).
Le polynôme P - Yh=o p(a0 H&i 37=^ est de degré n, et il s'annule en a0,..., an ; il a
donc n +1 zéros, ce qui implique qu'il est nul, d'où le résultat.
Si P = £ioa*xi e K[X], on définit la dérivée P' de P par P' = Eto***'""1» et on
définit la dérivée n-ième P<n) de P, par récurrence, en posant P(0) = P et P<n+1> = (P<w>)'.
On a donc P<n> = £to i(i - 1) • • • (i - n + lJoiX"-* = n!PW, où pH = £^=0 QoiX"-*
est la dérivée divisée n-ième de P.
• Si P G A[X] est de degré < d, et si a G A, alors P(X) = En=o PW(a)(X - ot)n (formule
de Taylor pour les polynômes). Si d\ est inversible dans A (par exemple, si A est un corps
contenant Q), cette formule peut se réécrire sous la forme P(X) = Y^%=o P^(a) ni •
On a X* = (X-a+a)1 = J2n=0 (£)(X-a)na*-B. Ceci permet de mettre P(X) = ^^o a*x*
sous la forme P(X) = Eto«i(EUo(n)(X-«)n«i-n) =Eto(X-a)n(Etn(n)^"n) =
En=o P[n,(«)(X - a)n. Ceci permet de conclure.
4.2. Anneaux euclidiens et principaux
4.2.1. Division euclidienne
• Soit B G A[X], non nul, de coefficient dominant inversible(47\ Alors tout P G A[X] peut
s'écrire de manière unique sous la forme P = BQ + R, avec deg R < deg B (on dit que R
est le reste de la division euclidienne de P par B).
Notons m le degré de B et 6 le coefficient de son terme dominant ; par hypothèse, il a un
inverse 6"1 dans A.
L'existence se démontre par récurrence sur n = deg P. Si n < m, on peut prendre Q = 0 et
R = P. Si P = anXn + • • • + a0, avec n^m, alors P - 6_1anXn-mB est de degré ^ n - 1 car
on s'est débrouillé pour tuer le terme de degré n. Grâce à l'hypothèse de récurrence on peut
donc l'écrire sous la forme BQX + R, avec degR < m, et P = (b-lanXn-m + QX)B + R est une
écriture de P sous la forme voulue.
Maintenant, si P = BQ1+R1 = BQ2+R2, avec deg Ri < degB et degR2 < degB, on obtient
(Ri - R2) = B(Q2 - Qi). Le coefficient du terme dominant de B n'étant pas un diviseur de
zéro, cela implique que deg(Ri -R2) = degB+deg(Q2-Qi), et comme deg(Ri -R2) < degB,
on en déduit que deg(Q2 — Qi) < 0, et donc Qi = Q2 et Ri = R2. D'où l'unicité.
Si A est un anneau commutatif, un idéal de A est principal s'il est engendré par un
élément. Un anneau principal est un anneau intègre dans lequel tout idéal est principal.
<47) C'est automatiquement le cas si A est un corps.
4. POLYNÔMES
51
• Z est un anneau principal.
Un idéal est en particulier un sous-groupe pour l'addition, et on a vu que tout sous-groupe
de Z est de la forme DZ, avec D G N ; c'est donc aussi un idéal principal, et tout idéal de Z
est principal.
• Si K est un corps commutatif, K[X] est un anneau principal.
Soit I un idéal de K[X] non réduit à 0, et soit B G I - {0} de degré minimal. Soit P G I,
et soit R le reste de la division euclidienne de P par B. Alors R = P - BQ G I puisque P G I
et B G I, et degR < degB par définition du reste. Ceci implique que R = 0, par construction
de B, et donc P est un multiple de B et I = (B) est principal.
Dans les deux cas ci-dessus (A = Z et A = K[X]), le fait que A est principal découle
de l'existence d'une division euclidienne dans A ; un anneau qui est muni d'une division
euclidienne est dit euclidien [de manière précise, cela signifie que Ton dispose d'une
application N : A — {0} —> N permettant de mesurer la taille des éléments de A, telle que si
b ^ 0 et si x G A, il existe q G A et r G A vérifiant N(r) < N(6) ou r = 0, avec x = bq + r ;
on n'impose pas de condition d'unicité à b et r], et un anneau euclidien est principal(48)
pour les mêmes raisons que ci-dessus.
Exercice 4.1. Si x G R, on peut écrire x de manière unique sous la forme n + u, avec n G Z et
u e [^, j[. Ceci permet d'écrire z = x + iy G C, de manière unique, sous la forme z = [z] + {z}, où
[z] = n + ira, avec n,m G Z et {z} = u + iv, avec u,v e [^, |[.
(i) Vérifier que K = {x + iy, x,y G Q} est un sous-corps de C et que A = {x + iy, x,y G Z} est un
sous-anneau de C (c'est l'anneau des entiers de Gauss).
(ii) Si z = x + iy G K, soit N(z) = x2 + y2. Vérifier que N(^i^2) = N(^i)N(^2), pour tous 2:1,2:26 K.
(iii) Montrer que u est inversible dans A si et seulement si N(u) = 1. En déduire que A* = {1, — 1, i, -i}.
(iv) SiaGAet&GA- {0}, soit r = 6{|}. Montrer que N(r) < N(6). En déduire que l'on peut écrire
a sous la forme a = bc + r, avec c, r G A et N(r) < N(6).
(v) Montrer que A est un anneau principal.
4.2.2. Factorisation dans un anneau principal
• Si A est un anneau principal, et si I est un idéal premier non nul de A, alors A/I est un
corps, et donc un idéal non nul de A est maximal si et seulement si il est premier.
Soit J un idéal de A contenant strictement I. Soient a un générateur de J et p un générateur
de I. Comme I c J, il existe 6 G A tel que p = ab. Comme J ^ I, on a a £ I, et comme I
est premier, l'égalité p = ab implique que 6 G I, et donc qu'il existe c G A tel que b = pc. On
a alors p(l — ac) = 0, et comme A est intègre et p ^ 0, cela implique que a est inversible,
d'inverse c, et donc que J = A. On en déduit que I est maximal, ce qui permet de conclure.
• Toute suite croissante d'idéaux de A est stationnaire. (Un anneau vérifiant cette
propriété est dit noethérien, et donc un anneau principal est noethérien.).
(48)fl existe des anneaux principaux non euclidiens comme Z[\/-19], mais ils sont plutôt rares; à la
surprise générale des experts du sujet, un sous-anneau naturel du corps des nombres complexes p-adiques
de Fontaine (l'anneau B^1 pour être précis) s'est révélé, en 2009, être principal et non euclidien.
52
VOCABULAIRE MATHÉMATIQUE
Soit (In)n€N une suite croissante d'idéaux de A, et soit I = UneNÏn- Si a, 6 G I, il existe
n,m G N tels que a G In et 6 G Im, et comme la suite est croissante, a et 6 appartiennent à
Isnp(n,m)) et donc a + b G ISiip(n,m) C I. Comme I est aussi stable par multiplication par À G A,
cela montre que I est un idéal. Maintenant, I est principal puisqu'on a supposé A principal ; il
est donc de la forme (À), pour un certain À G I, et il existe n G N tel que À G In. On a alors
(À) C In C I = (À), ce qui montre que Im = In, quel que soit m^ n. Ceci permet de conclure.
• Tout idéal propre de A est contenu dans un idéal maximal.
Supposons le contraire. Soit I ^ A un idéal de A contenu dans aucun idéal maximal. En
particulier, I n'est pas maximal et il existe Ii ^ A contenant strictement I. Alors Ii n'est
contenu dans aucun idéal maximal, sinon un idéal maximal qui contiendrait Ii contiendrait
aussi I, ce qui permet de réitérer le processus, et donc de construire une suite strictement
croissante (In)n€N d'idéaux de A. Comme ceci est contraire au point précédent, cela permet
de conclure.
• Si b G A — {0}, et si p est premier et divise 6, l'idéal (b/p) contient strictement (b).
Supposons le contraire. Il existe alors a G A tel que b/p = 6a, et donc 6(1 -ap) = 0. Comme
A est intègre, cela implique que p est inversible dans A d'inverse a, ce qui est contraire à
l'hypothèse selon laquelle p est premier. Ceci permet de conclure.
On dit que o et b sont premiers entre eux, si l'idéal (a, b) de A engendré par o et b
est égal à A, ce qui équivaut à l'existence de u,v G A tels que au + bv = 1 puisque
(o, 6) = {au + bv, u,v G A}, et qu'un idéal de A contenant 1 est égal à A. On écrit
souvent (o, b) = 1, pour dire que o et 6 sont premiers entre eux.
• (lemme de Gauss)
o Si o est premier avec b et c, alors o est premier avec bc.
o Si o divise bc et si o est premier avec 6, alors o divise c.
Si (a, 6) = (a, c) = 1, il existe uuvi tels que au\ 4- 6^i = 1 et u2, v2 tels que au2 + cv2 = 1.
On a donc 1 = (aui + bv{)(au2 + cv2) = au + bcv, avec u = auiu2 + bviu2 + cu\v2 et v = Viv2,
ce qui prouve que (a, 6c) = 1. On en déduit le premier énoncé.
Si bc = ad et au + bv = 1, alors acu + adv = c, et donc a(cu + dv) = c, ce qui prouve que a
divise c; d'où le second énoncé.
Si A est un anneau, on dit que x G A est irréductible si x = ab implique o G A* ou
b G A* ; autrement dit, x est irréductible s'il ne peut pas se factoriser.
• Si A est principal, et si x G A est non nul, alors l'idéal (x) engendré par x est premier
si et seulement si x est irréductible.
Si x n'est pas irréductible, on peut l'écrire sous la forme x = ab, où a et 6 ne sont pas
inversible. Mais alors x ne divise ni a ni 6 car s'il divisait a (par exemple) on aurait a = xa\
et donc x = xa'b et a'b = 1 puisque A est intègre, ce qui contredit le fait que 6 n'est pas
inversible. Il s'ensuit que (x) n'est pas premier.
Si x n'est pas premier, il existe a, 6 G A, non divisibles par P, tels que ab soit divisible par
x sans que ni a ni 6 le soit. L'idéal (a, x) ne contient pas 1 car sinon, x serait premier à a et
x diviserait 6 d'après le lemme de Gauss, et il n'est pas égal à (x) car x ne divise pas a. Si d
en est un générateur, alors d divise x et on peut factoriser x sous la forme x = d(x/d), ce qui
4. POLYNÔMES
53
prouve que x n'est pas irréductible car ni d ni x/d n'est une unité de A puisque (d) n'est égal
ni à (1) ni à (x).
Exercice 4.2. Soit A = Z[v^5].
(i) Montrer que A est un sous-anneau de C.
(ii) Montrer que les seuls diviseurs de 2 sont ±1,±2; en déduire que 2 est irréductible.
(iii) Montrer que (2,1 + V^5) n'est pas un idéal principal et que (2) n'est pas un idéal premier.
On choisit un générateur de tout idéal premier non nul de A, et on note &\ l'ensemble
de ces générateurs. Dans le cas de Z (resp. K[X]), le choix naturel est de prendre l'ensemble
des nombres premiers (resp. des polynômes irréductibles unitaires).
• Si a G A — {0}, il existe u G A* et pi,... ,pr G 0*a tels que a = upi • • -pr ; de plus,
les pu pour 1 ^ i ^ r, sont uniquement déterminés à Tordre près. En d'autres termes,
a peut se factoriser de manière unique comme produit de facteurs premiers.
Commençons par montrer l'existence d'une telle factorisation. Si a est une unité, il n'y a
rien à faire puisque a = a est une factorisation sous la forme souhaitée. Si a n'est pas une
unité, il existe un idéal maximal I de A contenant a, et donc p\ G «^a divisant a. On pose
ai = a/p\ ; alors, d'après un point ci-dessus, l'idéal (ai) contient strictement (a). En réitérant
le processus, on construit une suite d'éléments Pi de ^a et une suite d'éléments a* de A, avec
ai+iPi+i = a^ La suite d'idéaux (a*) est alors strictement croissante, ce qui implique que le
processus s'arrête puisque A est noethérien. Autrement dit, il existe s tel que as soit une unité
de A, et a = aspi '-ps est une factorisation de a sous la forme voulue.
L'unicité se démontre en utilisant le lemme de Gauss. Si up\ • • -pr = vq\ • • • qs où les pi et
les qj sont des nombres premiers et u, v des unités de A, le lemme de Gauss montre que pr
divise l'un des qj et donc lui est égal. Quitte à permuter les qj, on peut supposer que pr = qs,
et en divisant les deux membres parpr = qs (ce qui est licite car A est intègre), on se ramène
à r — 1 et 5 — 1, ce qui permet de conclure par récurrence.
• Z* = {±1} et K[X]* = K*, si K est un corps.
Si D G Z, alors |Z/DZ| = |D|, et donc DZ = Z si et seulement si D = ±1 ; autrement dit,
D G Z* si et seulement si D = ±1.
Si P G K[X]*, il existe Q tel que PQ = 1. Mais alors 0 = degPQ = degP + degQ, et donc
degP = 0. On en déduit le résultat.
Exercice 4-3. Soit A = K[e]/(e2) l'anneau des nombres duaux, et soit <p : A[X] —> K[X] la réduction
modulo e. Montrer que P G A[X]* si et seulement si <p(P) G K*.
Exercice 4-4- (Tout nombre premier de la forme 4n +1 est somme de deux carrés (Fermât, 1640)). On
aura à utiliser le fait que, si p ^ 2 est un nombre premier, l'équation x2 + 1 a une solution dans Fp si et
seulement si p est de la forme 4n+ 1 (ex. 3.4). Soit A = Z[i]. D'après l'ex. 4.1, A est un anneau principal
et A* = {1, -l,i, -i} est aussi l'ensemble des z = x + iy G A vérifiant N(z) = 1, où N(z) = x2 + y2 est
multiplicative (i.e. N(ziz2) = N(2i)N(22), si zuz2 G A).
Notons A+ l'ensemble des x + iy G A, avec x > 0 et y ^ 0. Tout élément non nul de A peut alors
s'écrire de manière unique sous la forme ua, avec u G A* et a G A+. On dit que q est un nombre premier
de A si q G A+ et si l'idéal (q) est premier ; on note ^a l'ensemble des nombres premiers de A et, comme
d'habitude, & celui des nombres premiers usuels.
(i) Montrer que, si q G ^a, alors Z n (q) est un idéal premier de Z. En déduire que q divise un unique
54
VOCABULAIRE MATHÉMATIQUE
p G & et que N(q) = p ou N(q) = p2.
(ii) Soit q G A+. Montrer que g G «^a si N(g) G &.
(iii) Soit p G 9 de la forme 4n+1. Montrer qu'il existe a G A - {0} tel que p | N(a) et 0 < N(a) < p2,
et que pgcd(a,p) est premier dans A et divise strictement p.
(iv) Montrer que tout nombre premier de la forme 4n + 1 est somme de deux carrés.
(v) Soit p G & impair. Montrer que, si p £ £P^ il existe qp = x + iy G A+, unique, avec x > y,
vérifiant N(çp) = p et que la factorisation de p est p = (-ï)qPqp, où q* = ï%.
(vi) Montrer que tout p G & de la forme 4n + 3 est premier dans A.
(vii) Montrer que les éléments de ^a sont 1 + i, les p G & de la forme 4n + 3, et les gp, g*, pour p G ^
de la forme 4n + 1.
On note vp(o) le nombre de fois que p apparaît dans la factorisation de o en
facteurs premiers. Alors pVp^ est la plus grande puissance de p divisant o; on a donc
vp(ab) = vp(a) + vp(b) et vp(a + b) > inf(vp(a),vp(6)).
Si ai,..., an e A - {0}, on définit pgcd(ai,..., an) par pgcd(ai,..., an) = f]ppinf^p(ai),
ce qui fait de pgcd(oi,..., an) le plus grand diviseur commun des a* (à multiplication près
par une unité de A)
• pgcd(oi,... ,on) est un générateur de l'idéal engendré par les a^ (th. de Bézout)
Commençons par démontrer le résultat pour n = 2, et posons ai = a et a<i = b. Il est
clair que tout élément de (a, b) est un multiple de pgcd(a, 6) ; il suffit donc de prouver que
d = pgcd(a, 6) G (a, b). Pour cela, écrivons a et 6 sous la forme a = udpi • • • pr et b = vdqi • • • qs,
où u, v sont des unités de A et pi,... ,pr,tfi,.. .qs des éléments de ^a- Par définition de d,
on a pi ^ qj quels que soient i et jf, ce qui prouve, d'après le lemme de Gauss, que a/d et
b/d sont premiers entre eux. Il existe donc x,y G A tels que (a/d)x + (b/d)y = 1, et alors
d = ax + by e (a, 6), ce que l'on cherchait à démontrer.
Maintenant, comme infi^nvp(ai) = inf(infi^n_! vp(ai)yvp(an)), on a
pgcd(ai,..., an) = pgcd(pgcd(ai,...,an_i), an).
De même, l'idéal (ai,... ,an) est l'idéal engendré par (ai,... ,an_i) et par an, ce qui permet
de déduire, par récurrence, le cas général du cas n = 2.
Les Oi sont dits premiers entre eux dans leur ensemble si pgcd(oi,... ,on) = 1, ce qui
équivaut (cf. point précédent) à l'existence de ai,..., an G A tels que «iOiH \-anan = 1.
Exercice 4-5. Soient A, B, C G C[X], non tous constants, premiers entre eux deux à deux, et vérifiant
A+B = C, et soit A = AB'-BA7 (où F désigne la dérivée de P ; on a aussi A = AC'-CA7 = CB'-BC7).
(i) Montrer que A ^ 0 et deg A < inf(deg A + deg B, deg B + deg C, deg C + deg A) - 1.
(ii) Montrer que, si z est un zéro de ABC de multiplicité mz ^ 1, alors la multiplicité de z comme zéro
de A est mz - 1.
(iii) Si Q G C[X] est non nul, on note r(Q) le nombre de ses zéros (sans multiplicité^49)). Montrer que
(49)pius généralement, si K est un corps, et si P G K[X] est non nul, on définirait r(Q) comme le degré
du radical rad(P) de P, produit des polynômes unitaires irréductibles divisant P [e.g. si K = R, alors
rad(X5(X2 + 1)2(X - 2)) = X(X2 + 1)(X - 2) ].
4. POLYNÔMES
55
l'on a la minoration*50* r(ABC) ^ sup(deg A, deg B, deg C) + 1.
(iv) Montrer que, si n ^ 3, si A, B, C sont des éléments de C[X], premiers entre eux deux à deux, et si
pji + Bn = Cn, alors A, B et C sont constants (th. de Fermât pour les polynômes).
4.2.3. Décomposition en éléments simples
On note F le corps des fractions de A. Si A = Z, on a F = Q, et si A = K[X], alors
F = K(X) est le corps des fractions rationnelles en une variable à coefficients dans K.
• Soit x = f G F, avec a, 6 G A premiers entre eux. On suppose donné, pour tout p G HP a
divisant 6, un système Sp C A de représentants de (A/p)*. Alors on peut écrire x, de
manière unique, sous la forme x = a0 + J2p\b £i=?* ^> avec ao € A, et siyP G Sp pour tous
p et i (décomposition en éléments simples).
On raisonne par récurrence sur n(x) = supp\bvp(b) = -infp6#»A vp(x). Si n(x) = 0, alors
x e A, et x = x est l'écriture cherchée. Si n(x) ^ 1, on pose c = Ylp\bPVp^' Alors ex e A, et
les images ex de ex modulo p et c^ de cp = p~v^c sont des unités de A/p, car vp(cx) = 0
et v^Cp) = 0. Soit sp G Sp le représentant de c^~lcx dans A. Alors ex - cpsp est divisible
par p, et donc vp(x —£fa) ^ -vP(&) + 1, et sp est le seul élément de Sp pour lequel ceci soit
vrai. Soit x' = x - Ylp\b "m«ô- D'après ce qui précède, n(x') < n(x) - 1, ce qui permet de lui
appliquer l'hypothèse de récurrence. On en déduit le résultat, avec sPyi = sp si i = -vp(x).
Le résultat précédent est particulièrement utile dans le cas A = K[X]. Dans ce cas, il y a un choix
canonique pour Sp si P est irréductible et unitaire, de degré n, à savoir K[X](n_1) - {0}. On obtient donc
les résultats suivants.
• Tout F G K(X) peut s'écrire, de manière unique, sous la forme R+^Pe^K Xi Sî2T T^>
où R G K[X] et Sp^ est un élément non nul de K[X] de degré < degP, pour tous P et i.
Si tous les polynômes irréductibles P divisant le dénominateur de F sont de degré 1 (c'est
automatique si K est algébriquement clos), alors F peut s'écrire, de manière unique, sous
la forme R + J2\eK T,7=Î{F) J0kp> où R G KIX1> et SM e K* Pour tous A et *'
Exercice 4-0. (i) Soit F = (x-Ao^x-Anj^ °^ °^esQ ^n et les À* sont distincts deux à deux.
Déterminer la décomposition de F en éléments simples.
(50> On dispose d'un dictionnaire heuristique entre K[X] et Z qui est un guide précieux pour essayer de
deviner ce qui peut être vrai en théorie des nombres. Dans ce dictionnaire, degP devient log|n| (voir
ci-dessous), et l'énoncé ci-dessus devient (en définissant le radical rad(n) d'un entier n, non nul, comme
le produit des nombres premiers divisant n (le radical de 720 = 6! est 2 • 3 • 5 = 30)) : pour tout e > 0, il
existe C(ê:) > 0 tel que, si a, 6, c sont des entiers, non nuls, premiers entre eux deux à deux, et vérifiant
a + b = c, alors
sup(log |a|, log |6|, log \c\) ^(1 + e) log(rad(oôc)) + C(e).
Cet énoncé, connu sous le nom de « conjecture abc », date de 1985, et ne semble pas sur le point d'être
démontré (comme quoi, l'équation a + b = c est plus subtile qu'elle n'en a l'air...). Nous laissons au lecteur
le plaisir d'expliciter ce que cet énoncé implique au sujet du théorème de Fermât. Pour justifier l'analogie
entre degP et log|n|, on peut regarder le cas où K est un corps fini, par exemple Fp : dans ce cas, le
cardinal de l'anneau FP[X]/P est lié à degP par la formule log|Fp[X]/P| = degP • logp, que l'on peut
mettre en parallèle avec la formule log \n\ = log |Z/nZ|.
56
VOCABULAIRE MATHÉMATIQUE
(ii) Si A G K et Q G K[X], déterminer la décomposition en éléments simples de (x-X)n •
(iii) Déterminer, en fonction des zéros et des pôles de F, la décomposition de |r en éléments simples,
si F G K(X) - {0}, où K est algébriquement clos.
(iv) Soit P G C[X]. Montrer que les zéros de P' sont dans l'enveloppe convexe des zéros de P.
4.3. Polynômes en plusieurs variables
4.3.1. L'anneau A[Xi,...,Xn]
On définit par récurrence A[Xi,..., Xn] comme étant A[Xi,..., Xn_i][Xn], si A est un
anneau. Alors P G A[Xi,... ,Xn] s'écrit, de manière unique, sous la forme J2kakXk, où :
o ak G A est nul sauf pour un nombre fini de k,
Si i,j G Nn, on pose i + j = (ti + ii,... ,tn + jn)- L'addition et la multiplication dans
A[Xx,..., Xn] sont alors données par :
o (Ek«kXk) + (E^) = £,>k + MX",
o (Ek«kXk)(Ek6kXk) = Ek(<*)Xk, avec <* = £,+J=k«>6i-
L'anneau A[Xi,... ,Xn] est une A[Xi,..., Xn_i]-algèbre, et donc en particulier une A-
algèbre, l'action de A étant donnée par c- (X^kafcXk) = Z)k(cak)Xk, si c G A. Il est clair
sur ces formules que les variables Xi,..., Xn jouent exactement le même rôle contrairement
à ce que la construction par récurrence pourrait laisser croire.
Si B est une A algèbre commutative^51) unitaire, alors P = J2n anXn définit une fonction
polynomiale P : Bn —» B par la formule P(x) = SnûnIIii x¥> s* x = (xu • • • >xn)> où
la somme sur n est une somme finie car tous les termes sauf un nombre fini sont nuls.
L'application P h-» P(z) est un morphisme d'anneaux (et même de A-algèbres unitaires)
de A[Xi,...,Xn] dans B.
• Si K est un corps infini, alors P G K[Xi,... ,Xn] est identiquement nul sur Kn si et
seulement si P = 0.
Montrons que P = 0 si P est identiquement nul sur Kn. La démonstration se fait par
récurrence sur n, le cas n = 1 ayant déjà été démontré. On écrit P sous la forme Yh=o PiX^,
avec P» G K[Xi,... ,Xn_i]. Par hypothèse, si xi,... ,xn-i sont fixés, alors Px1,...,x,,_1(Xn) =
Yli=o Pifai» • • • > ^n-i)Xjj G K[Xn] est identiquement nul sur K, et donc est nul. On en déduit
que Pi(a?i,. ..,xn_i) est, pour tout i, identiquement nul sur Kn_1, et donc P* = 0 d'après
l'hypothèse de récurrence. D'où la nullité de P. La réciproque étant immédiate, cela permet
de conclure.
Si k G Nn, on note |k| la quantité £?=1 A* G N. Alors \k + £\ = |k| + \£\. On définit
le degré total degP du polynôme P = X^kakXk comme le maximum des |k| pour les k
vérifiant ak ^ 0, si P est non nul ; si P = 0, alors degP = -oo. Si 1 < i < n, on définit le
(51)On a besoin que xi,... ,xn commutent si on veut que P(x)Q(x) = PQ(x).
4. POLYNÔMES
57
degré partiel degx. de P en la variable X* comme le maximum des ki, pour les k vérifiant
ak ^ 0, si P est non nul ; si P = 0, alors degx. P = —oo.
• Si d = deg,degx., alors d(P + Q) < sup(d(P),d(Q)) et d(PQ) < d(P) + d(Q) ; si A est
intègre, alors A[X1}..., Xn] est intègre et d(PQ) = d(P) + d(Q).
Les énoncés pour degXj se démontrent en utilisant le cas des polynômes en une variable
et l'isomorphisme A[Xi,...,Xn] = A[Xi,...,X*,...,Xn][Xj]. Ceux concernant le degré total
peuvent se démontrer en faisant les changements de variables X* = TY* et en utilisant degT
sur k[Yu..., Yn,T], car deg-r^TY^... ,TYn)) = degP.
On dit que P = £kakXk est homogène de degré d, si ak = 0 pour tout k vérifiant
|k| ^ d. Tout polynôme peut s'écrire, de manière unique, comme une somme de polynômes
homogènes de degrés distincts : si P = J2k akXk, alors P = £i€N P»> ou P* = £|k|=i akXk
est la partie homogène de degré i de P.
Exercice ^.7. Soient K un corps infini et P G K[Xi,... ,Xn], de degré total d. Montrer qu'il existe
tu • • •. tn-i G K, tels que Ptlt...ttn-i = p(xi + *iXn, • • • ,Xn_x + *„_iXn,Xn), soit de degré d en Xn, à
coefficient dominant appartenant à K*.
4.3.2. Polynômes en une famille de variables
Soit A un anneau. Si I est un ensemble (éventuellement infini^), on note ApQ, i el]
l'ensemble des polynômes en les variables X*, pour i e I. Un élément P de ApQ, i e I]
s'écrit, de manière unique, sous la forme J^k akXk, où :
o k parcourt l'ensemble N^ des applications i h* m de I dans N ne prenant qu'un
nombre fini de valeurs non nulles,
o ak € A est nul sauf pour un nombre fini de k,
o Xk est un symbole représentant le monôme riiei^, ce Pr°duit étant en fait un
produit fini puisque presque tous les exposants sont égaux à 0 et X° = 1 par convention.
On fait de A [Xf, i e I] un anneau grâce aux formules :
o ( Ek «kXk) + ( £k 6kXk) = £kK + 6k)Xk,
o (£kakXk)(£k&kXk) = £k(ck)Xk, avec ck = £j+£=kaj&£.
Si I = {1,..., n}, on retombe sur l'anneau A[Xi,..., Xn] du n° précédent.
Si B est une A algèbre commutative unitaire, alors P = J^k akXk e ApQ, i G I] définit
une fonction polynomiale P : B1 —► B par la formule P(x) = J2k ak ]]m x^\ si x = (£i)iei,
où le produit infini Yliel x^ est en fait un produit fini car tous les termes sauf un nombre
fini valent 1, et la somme sur k est une somme finie car tous les termes sauf un nombre
fini sont nuls. Si x = ((#i)iei) € B1, l'application P h* P(x) est un morphisme d'anneaux
(et même de A-algèbres) de ApQ, i el] dans B.
(52)g^ v a une infinite de variables, on n'en utilise qu'un nombre fini dans chaque calcul, ce qui fait que l'on
peut toujours raisonner comme si on travaillait dans A[Xi,..., Xn]. Par ailleurs, même dans le cas où I est
fini, il est souvent utile de ne pas numéroter ses éléments ; par exemple, si on veut parler d'un polynôme
en les coefficients d'une matrice n x n, on préfère que l'ensemble des indices soit {1,..., n} x {1,..., n}
plutôt que {l,...,n2}.
58
VOCABULAIRE MATHÉMATIQUE
Si i € I, on définit le degré degXi de P en la variable X* comme dans le cas de
A[Xi,..., Xn], et on définit le degré total deg P de P comme dans le cas de A[Xi,..., Xn]
en posant |k| = J2iە h G N.
Remarque 4-8. Tout anneau commutatif est une Z-algèbre unitaire. Il en résulte qu'une identité entre
polynômes à coefficients dans Z induit, pour tout anneau commutatif A, une identité entre les fonctions
polynomiales associées.
Par ailleurs, pour vérifier que P, Q € Z[Xi,..., Xn] sont égaux il suffit de vérifier que P = Q dans
C[Xi,..., Xn] puisque Z s'injecte dans C, et il suffit donc de vérifier que les fonctions polynomiales qu'ils
définissent sur Cn sont les mêmes.
Par exemple, si on cherche à montrer que les polynômes caractéristiques de AB et BA sont les mêmes
pour deux matrices A = (aj)i7-),B = (bij) € Mn(A), où A est un anneau commutatif quelconque, il suffit
de prouver que P = det(X - AB) et Q = det(X — BA) sont égaux dans l'anneau Aulliv des polynômes
en les 1 + 2n2 variables X et Oij,&ij,pour 1 ^ i,j ^ n. Maintenant, si A G Mn(C) est inversible, on a
det(X - AB) = det(A_1(X - AB)A) = det(X - BA). On en déduit que la fonction polynomiale (P - Q)R,
où R = det A G Aul,iv, est identiquement nulle sur C x Mn(C) x Mn(C). Il s'ensuit que (P - Q)R = 0
dans Aulliv, et comme R ^ 0 et Aulliv est intègre, cela implique P = Q.
4.4. Polynômes symétriques
On dit que P e A[Xi,... ,Xn] est symétrique en Xi,... ,Xn, si P(Xa(i),... ,Xa(n)) =
P(Xi,... ,Xn), pour toute permutation o e Sn. Par exemple, Ei,..., En, définis en
développant le polynôme
n
P(X) = Y[(X - Xi) = Xn- ExX""1 + EaX»"2 + • • • + (-l)nEn,
i=l
sont symétriques en Xi,..., Xn car P l'est ; ce sont les fonctions symétriques élémentaires
de Xi,..., Xn, et ce sont aussi, au signe près, les coefficients du polynôme dont les racines
sont Xi,... ,Xn. On a
Ei = Xi H h Xn, En = Xi • • • Xn, et, en général, Ek = ^ Xfl • • • Xik.
h<i2<-<ik
• Soit K un corps. Si P = anXn + an_iXn_1 H \-a0€ K[X], avec an ^ 0, a pour racines
ai,..., an dans un corps contenant K, alors an-i = (—l^OnE^ai,..., an) ; en particulier,
la somme des racines de P est -^p, le produit est (-l)nf^, et E^ai,..., an) e K, pour
tout i.
On a ^P = Iir=i(x~<*i) = Xn + E?=i(-l)*Si(ai,...,an)Xn"i. On en déduit le résultat.
• Un polynôme en Ei,... ,En est symétrique en Xi,... ,Xn. Réciproquement, tout
polynôme symétrique en Xi,... ,Xn est un polynôme en les fonctions symétriques
élémentaires : si P G A[Xi,..., Xn] est symétrique, il existe Q e A[Ei,..., En] tel que
P(Xi,...,Xn) = Q(Ei(Xi,...,Xn),...,En(Xi,...,Xn)).
4. POLYNÔMES
59
La symétrie d'un polynôme en 2ji, ..., 2un résulte de celle de Ei,..., En. La démonstration
de la réciproque se fait par récurrence sur n, le cas n = 1 étant tautologique puisque Xi = Ei.
Supposons le résultat vrai pour n - 1, et notons E*n~ , pour i ^ n - 1, les fonctions
symétriques élémentaires en Xi,... ,Xn_i. Alors E*n_1) = E*(Xi,... ,Xn_i,0), si i < n - 1
et En(Xi,..., Xn_i,0) = 0. Soit P, symétrique en Xi,..., Xn. Alors P(Xi,..., Xn_i, 0) est
symétrique en Xi,..., Xn_i et peut donc s'écrire sous la forme Q(E[n~ ,..., E^i ).
Maintenant, R = P — Q(Ei,..., En_i) est symétrique en Xi,..., Xn et, par construction, vérifie
R(Xi,...,Xn_i,0) = 0. Cette dernière condition montre que R est divisible par Xn et, par
symétrie, par Xi} pour tout i. On peut donc l'écrire sous la forme Xi • • -XnS = EnS, où S
est symétrique. En fait R est constitué des monômes de P qui sont divisibles par En, et donc
degR < degP et degS = degR - n < degP, et on conclut par récurrence sur le degré de P.
Exercice 4-9- Soit P G Q[X] de degré n ^ 1, et soient ai,..., an G C les racines de P.
(i) Montrer que Yn=i ai e Q> Pour tout & € N.
(ii) Montrer que n?=i(X - a?) G Q[X].
Exercice J^.10. Si k ^ 1, on définit la somme de Newton S^ par S* = Xf H h X£.
(i) Établir la formule £?=1 ^ = ^-^^X^^^"'" '
(ii) En déduire l'identité £+~ S&Tfe = x-^T+s^tl;3ff+.... et calculer S2,S3.
(iii) Soit M G Mn(C) tel que Tr(M&) = 0, pour tout k ^ 1. Montrer que M est nilpotente.
Exercice 4 11- a G C est un entier algébrique s'il existe P G Z[X], unitaire, tel que P(a) = 0.
(i) Soient a, P deux entiers algébriques. Montrer que a + P et aft sont des entiers algébriques. (On
pourra considérer les polynômes ri(i,j)eixj(^ ~ ai ~ Pj) et IT(i,j)eixj(X - <*i#f)> où les a*, pour i G I
(resp. Pj, pour j G J) sont les racines d'un polynôme unitaire P (resp. Q), à cofficients dans Z, tel que
P(a) = 0 (resp. Q(0) = 0).)
(ii) En déduire que les entiers algébriques forment un anneau. Cet anneau contient-il \ ?
4.5. Anneaux noethériens
Un anneau A est noethérien si toute suite croissante d'idéaux est stationnaire (i.e., si
Io C Ii C ... sont des idéaux de A, il existe no 6 N tel que In = Ino pour tout n > no).
Un corps K est noethérien car il n'a que deux idéaux {0} et K ; un anneau principal
est noethérien (cf. n° 4.2), et dans un anneau noethérien^53) tout idéal propre est contenu
dans un idéal maximal (cf. n° 4.2).
Si A est un anneau, on dit qu'un A-module M est de type fini, si on peut trouver
une famille finie x\y...yxn d'éléments de M engendrant M, ce qui équivaut à ce que
l'application (ai,..., an) i-> J27=i a*x* s0^ une surjection de An sur M.
• A est noethérien si et seulement si tout idéal de A est de type fini.
Supposons que tout idéal soit engendré par un nombre fini d'éléments, et soit Io C Ii C ...
une suite croissante d'idéaux de A. Alors I = Un€NÏn est un idéal de A car la suite est
croissante, et il existe xi,... ,xm tel que I = (xi,... ,xm). Comme les Xi appartiennent à I,
il existe n* tel que Xi G Inj, et comme la suite est croissante les Xi appartiennent à In pour
53^C'est vrai pour un anneau quelconque, si on admet l'axiome du choix.
60
VOCABULAIRE MATHÉMATIQUE
tout n ^ sup1<i<mrii. Mais alors In contient l'idéal engendré par les xu c'est-à-dire I, et donc
In = I pour tout n ^ sup^^n* ; la suite est donc stationnaire, et A est noethérien.
Réciproquement, si I est un idéal de A, on construit une suite d'éléments de I de la
manière suivante. On part de xo G I quelconque. Si #o,... ,#n sont construits, on note In l'idéal
(xQy..., xn) engendré par #o,. - -, xn. Si I = In, cela prouve que I est engendré par un nombre
fini d'éléments. Si In ^ I, on choisit xn+i G I - In, et donc In+i contient strictement In. Si
A est noethérien, le processus doit s'arrêter sinon on aurait une suite strictement croissante
d'idéaux de A ; on a donc I = In pour un certain n, ce qui prouve que I est engendré par un
nombre fini d'éléments.
Ceci permet de conclure.
Exercice 4.12. Soit K un corps commutatif et soit In l'idéal de K[X, Y] engendré par les produits de n
éléments de (X, Y). Montrer que In ne peut pas être engendré par moins de n+1 éléments. (Considérer le
K[X, Y]-module In/In+i ; la solution demande de savoir ce qu'est la dimension d'un K-espace vectoriel.)
• Si A est noethérien et I est un idéal de A, alors A/I est noethérien ; autrement dit, tout
quotient d'un anneau noethérien est noethérien.
Soit J un idéal de A/I. Alors l'image inverse J de J dans A est un idéal de A ; il est donc
de type fini puisque A est noethérien, et l'image d'une famille génératrice finie de J est une
famille génératrice de J, ce qui prouve que J est de type fini, et que A/I est noethérien.
• Si A est noethérien, alors A[X] est noethérien (th. de la base de Hilbert, 1890).
Soit I un idéal de A[X]. Soit J l'idéal de A engendré par les coefficients dominants des
éléments de I, et si n G N, soit Jn l'idéal engendré par les coefficients de Xn des éléments
de degré ^ n de I. Comme A est noethérien, J et les Jn sont de type fini, et on peut
trouver Qi,..., Qm G I dont les coefficients dominants engendrent I, et Rn,i,..., Rn,m„ G I, de
degré ^ n, dont les coefficients de Xn engendrent Jn. Soit N le maximum des degrés des Q*.
Montrons que I est engendré par les Q* et les Rnj, pour n ^ N - 1. Pour ce faire, notons I7
cet idéal, et prouvons, par récurrence sur n = degP, que P G I7 si P = anXn H h ao G I.
o Si n ^ N-1, alors an G Jn, et il existe donc Ai,..., Am„ G A tels que P7 = P-£Sl AîR^
soit de degré ^ n - 1. Alors P7 G I puisque P et les R^i sont des éléments de I, et l'hypothèse
de récurrence implique que P7 G I7, et donc P G I7 puisque les Rnj sont des éléments de I7.
o Si n ^ N, alors an G J, et il existe donc Xu..., Am G A tels que P7 = P-£2=i A<Xn"-dc«cJ|Q<
soit de degré ^ n - 1. On en déduit, comme ci-dessus, que P G I7.
Ceci permet de conclure.
• K[Xi,..., Xn], si K est un corps, et Z[Xi,..., Xn] sont noethériens.
Cela suit, par récurrence, du point précédent et de ce que K et Z sont noethériens.
• Si A est noethérien, tout sous-A-module d'un A-module de type fini est de type fini.
Commençons par prouver, par récurrence sur n, qu'un sous-A-module de An est de type fini.
Le résultat a déjà été établi pour n = 1 (tout idéal de A est de type fini). Supposons donc n ^ 2,
et soit M un sous-A-module de An. Notons n : An —> A la projection sur le dernier facteur :
7r(a;i,... ,xn) = xn. Le noyau de n est A71"1 x {0} et est naturellement isomorphe à An~~l.
Soient Mi = M n Ker 7r, et M2 = 7r(M) c A. Alors M2 est un sous-A-module de A et donc est
de type fini, et on peut trouver xi,...,xreM tels que 7r(a;i),... ,7r(a;r) engendrent M2 ; de
même Mi est un sous-A-module de Ker tt = An_1, et on peut, grâce à l'hypothèse de récurrence,
5. ALGÈBRE LINÉAIRE
61
trouver yi,... yys € Mi engendrant Mi. Montrons que xi,... ,xr>2/i>... ,ys engendrent M, ce
qui permettra de conclure. Si z € M, on a it{z) € M2, et il existe Oi,...,ar € A tels que
7r(z) = ai7r(xi) H 1-ar7r(xr). Mais alors z' = z — aiX\ arxr vérifie n(z') = 0," et donc
z' € Ker 7r. Comme z' € M puisque z et les Xi sont des éléments de M, on a z 6 Mi et il existe
61,..., bs € A tels que z = aiXi H h arxr + 612/1 H 1- bsys. D'où le résultat.
Maintenant, si M est de type fini sur A, alors M est un quotient de An (si xi,...,xn
engendrent M, alors M est le quotient de An par le noyau de (01,... ,on) •-> Y%=i aixi car ce
morphisme de An dans M est surjectif par hypothèse). Si M' est un sous-A-module de M, son
image inverse M' est un sous-A-module de An et donc est de type fini d'après ce qui précède ;
mais alors l'image dans M' d'une famille génératrice finie de M' est une famille génératrice
finie de M', et donc M' est de type fini.
Ceci permet de conclure.
5. Algèbre linéaire
Dans tout ce qui suit, K est un corps commutatif.
5.1. Espaces vectoriels
Rappelons (cf. alinéa 2.2.4) qu'un espace vectoriel V sur K (ou un K-espace vectoriel)
est un groupe commutatif pour une loi +, muni d'une action de K (i.e. une application
(A, x) i-> A • x de K x V dans V) vérifiant les propriétés suivantes :
1 • x = x, A • (x + y) = (A • x) + (A • y), (A + fj,) • x = (A • x) + (fj, • x), A • (/i • x) = (A/i) • rr,
pour tous x, y € V et A/i € K. En général, on note simplement \x l'élément A • x de V.
Un élément d'un espace vectoriel est un vecteur un élément de K est un scalaire.
Si V est un K-espace vectoriel, un sous-espace vectoriel (ou simplement sous-espace)
de V est un sous-groupe de V stable sous l'action de K; c'est donc naturellement un
K-espace vectoriel, l'action de K étant celle induite par celle sur V.
• Si n e N, alors Kn muni de l'action A • (x\,..., xn) = (Arri,..., \xn) est un K-espace
vectoriel. (Si n = 0, on a Kn = {0} par convention.)
• Plus généralement, si I est un ensemble, l'ensemble K1 des fonctions i i-> Xi ou i i-> x(i)
(notées aussi (xi)^) de I dans K, ou celui K^ des fonctions nulles presque partout
(i.e. des (xi)i€i avec Xi = 0 sauf pour un nombre fini de i) sont des K-espaces vectoriels
(avec (Xi)i£i + (yi)i€i = (xi+yi)i€i et X-(xi)i€i = (\xi)i€î). De plus, K(I) est un sous-espace
vectoriel de K1, strictement inclus dans K1 si I est infini ; par contre, on a K*1) = K1 si I
est fini, et si I = {1,2,... ,n}, on retombe sur l'espace Kn du point précédent.
• L'intersection niGiVj d'une famille quelconque de sous-espaces est un sous-espace
vectoriel (cf. n° 2.3). La somme 5Di6lVj d'une famille quelconque de sous-espaces est un
sous-espace vectoriel (c'est l'image de l'application linéaire (xi)i€i i-> J2ieixi ^e ®t€iVi
dans V, cf. alinéa 2.6.2) ; c'est aussi le sous-espace de V engendré par les V*. On rappelle
que les V* sont en somme directe dans V, si (xi)i€i i-> Yli& xi est injective, et que V est la
62
VOCABULAIRE MATHÉMATIQUE
somme directe des V* si c'est une bijection (ce que l'on note sous la forme V = ©i€iVj) ;
si V = Vi 0 V2, on dit que Vi et V2 sont supplémentaires.
• Voici quelques exemples moins banals d'espaces vectoriels :
o Si X est un espace topologique, l'espace ^(X, K) des fonctions continues / : X —> K est un sous-K-
espace vectoriel de Kx, si K = R ou C (ou plus généralement un corps muni d'une norme de corps) : cela
suit de ce que la somme de deux fonctions continues est continue et le produit d'une fonction continue
par une constante aussi.
o Si I est un intervalle de R, l'espace ^fc(I) des / : I -» C de classe 1fk (avec feeNU {oo}) est un
sous-C-espace vectoriel de ^(I.C).
o L'anneau K[X] des polynômes à coefficients dans K est un K-espace vectoriel ; il en est de même du
sous-espace des polynômes de degré ^ n, pour tout n € N.
o Si E est un ensemble, l'ensemble t?(E) des parties de E est un espace vectoriel sur K = F2 :
l'application A n-* 1a l'identifie à l'espace vectoriel KE, l'addition dans KE correspondant à la différence
symétrique (AUB) - (AnB) dans &(E) pour laquelle l'élément neutre est 0 (c'est en fait une F2-algèbre,
la multiplication des fonctions correspondant à l'intersection dans tP(E)).
5.2. Morphismes d'espaces vectoriels
Un morphisme u : Vi —> V2 de K-espaces vectoriels ^ est aussi appelé une application
linéaire. Si u est en plus bijectif, on dit que c'est un isomorphisme de K-espaces vectoriels.
Si Vi = V2 = V, on parle aussi d'endomorphisme de V (et d'automorphisme dans le cas
bijectif) pour souligner le fait que l'espace d'arrivée est le même que celui de départ. Un
endomorphisme s'appelle aussi souvent un opérateur (en particulier en analyse
fonctionnelle). On note Hom(Vi, V2) l'espace des morphismes de Vi dans V2 et End(V) celui des
endomorphismes de V.
• Si u e Hom(Vi, V2) et u' e Hom(V2, V3), alors u'oue Hom(Vi, V3), et l'ensemble des
automorphismes de V est un groupe pour la composition (cf. n° 2.4) ; la tradition veut
qu'on le note GL(V) (pour « groupe général linéaire ») au lieu de Aut(V).
Si u : Vi —► V2 est un morphisme de K-espaces vectoriels, le noyau Keru et l'image Imu
de u> définis par Kerw = {x G Vi, u(x) = 0} et Imu = {y € V2, 3x e Vi, u(x) = y},
sont des sous-espaces vectoriels de Vi et V2 respectivement. De plus, u est injectif si et
seulement si Kert* = {0}, et surjectif si et seulement si Imu = V2.
• Hom(Vi,V2) est naturellement un K-espace vectoriel (avec (ui+u2)(x) = Wi(rc) + w2(a:)
et (\u)(x) = Xu(x)).
La vérification est un pur jeu d'écriture.
• End(V) muni de + et o est un anneau et même une K-algèbre, dont GL(V) est le groupe
des éléments inversibles (cf. alinéa 2.2.2).
Comme End(V) est déjà un K-espace vectoriel, il s'agit de vérifier la distributivité de la
composition par rapport à l'addition, ainsi que l'identité u o (Xu1) = X(u o u') = (Au) o u'.
<54)On renvoie aux nos 2.4 et 2.5 pour les propriétés de base des morphismes, en particulier ce qui concerne
noyau et image.
5. ALGÈBRE LINÉAIRE
63
o ((ui+U2)ou')(x) = (ui+U2){u'(x)) = Ui(u'(x))+U2(u'(x)) = (uiou' + u2ou')(x), pour
tout x € V, et donc («i + W2) o u' = ui o u' + u2 ° «',
o (uo(u'1+tt2))(rc) = «((ui+u^)^)) = u(ui(x)+u2(x)) = uiu'^x^+uiu'^x)) par linéarité ;
on en déduit la formule u o (u'i + u2) = u o u[ + u o u^,
o («o (Xu'))(x) = u((\u')(x)) = m(A«'(x)) = Xu(u'(x)) par linéarité, et donc u o (Au') =
A(u o u') ; de même ((Au) o u')(x) = (Xu)(u'(x)) = Xu(u'(x))y et donc (\u) ou' = \(u o u').
Si u e End(V) on dit que A € K est une valeur propre de u s'il existe x € V, non nul,
tel que u(x) = Xx. Si A € K est une valeur propre de u, Y espace propre associé à A est
l'ensemble Va des x eV vérifiant u(x) = Xx ; alors Va est aussi le noyau de u — X id, et
donc est un sous-espace vectoriel de V ; les éléments de Va sont les vecteurs propres pour
la valeur propre A, et on dit que 1 € V est un vecteur propre s'il existe A e K tel que
u(x) = Xx.
• Si les A^ pour iel, sont des valeurs propres distinctes de u, les Va; sont en somme
directe dans V.
Soit J c I fini, et soient Xj € Va_, pour j € J, tels que J2jgj xj = 0. Montrons, par
récurrence sur |J| que tous les Xj sont nuls, ce qui permettra de conclure. Si |J| = 1, le résultat
est évident. Supposons donc |J| ^ 2. Alors 0 = u(J2jeJ xi) = X)j6J XjXj> et si jo € J, on a
aussi 5Dj-gj_{j0}(Aj - Xjo)bj = 0. L'hypothèse de récurrence implique que (Xj - Xjo)xj = 0, et
donc que Xj = 0 puisque Xj — Aj0 ^ 0, pour tout j ^ jQ ; d'où le résultat.
5.2.1. Homothéties, projections, symétries
• Si A € K, on note encore A Yhomothétie de rapport A : c'est l'élément de End(V)
défini par X(v) = Xv, pour tout v e V. Si u e End(V), on a A o u = Xu = u o À, et
donc l'homothétie de rapport A est dans le centre de End(V) (i.e elle commute à tout
élément de End(V)), et l'homothétie de rapport 1 est l'élément neutre de End(V) pour la
multiplication.
On a Aou(v) = X(u(v)) = Xu(v) = (A«)(v), et uoX(v) = u(X(v)) = u(Xv) = Xu(v) = (Au)(v),
pour tout v € V. On en déduit que A o u = Xu = u o A. Le reste s'en déduit.
• On dit que p G End(V) est une projection si p o p = p. Si p est une projection, alors
Imp est un supplémentaire de Kerp et on a p[v\ +V2) = V\, si V\ e Imp et v-i G Kerp;
en particulier, Imp est l'ensemble des points fixes de p, et les valeurs propres de p sont 0
et 1 sauf si p = 0 (resp. p = 1) où 0 (resp. 1) est la seule valeur propre.
Réciproquement, si Vi,V2 sont deux sous-espaces supplémentaires de V, l'application
p : V —> V, définie par p(vi + v2) = vx si vx e Vi et v2 € V2, est une projection dont
l'image est Vi et le noyau V2 : c'est la projection sur Vi parallèlement à V2.
On peut écrire v € V sous la forme v = vi+t>2> avec Vi = p(v) € Imp et v2 = v—p(v) € Kerp
car p(v — p(v)) = p(v) —pop(v) = p(v) — p(v) = 0. Par ailleurs, si v € Impn Kerp, alors
v = p(v') et p(v) = p op(v') = p(v') = v car v € Imp, et p(v) = 0, puisque v € Kerp, et donc
v = 0. On en déduit que Imp et Kerp sont des sous-espaces supplémentaires dans V, et que ce
sont les espaces propres associées aux valeurs propres 0 et 1 ; il n'y a donc pas d'autre valeur
propre que 0 et 1. Le reste de l'énoncé est immédiat.
64
VOCABULAIRE MATHÉMATIQUE
• On dit que s € End(V) est une symétrie si s o s = 1. Si s est une symétrie, alors V est
la somme directe des espaces propres V+ et V~ associés aux valeurs propres 1 et —1, et
on a s(v\ + V2) = v\ — V2, si v\ G V+ et v2 6 V~.
Réciproquement, si Vi,V2 sont deux sous-espaces supplémentaires de V, l'application
s : V —> V, définie par s(v\ +V2) = V\—V2 si V\ € Vi et V2 € V2, est une symétrie vérifiant
Ker (s - 1) = Vi et Ker(s + 1) = V2 : c'est la symétrie par rapport à Vi parallèlement
à V2, et on a s = 2p — 1, si p est la projection sur Vi parallèlement à V2.
Soit p = âfi. Alors pop= (*+lWs+l) = sos+soi+ios+i = i+s+s+i = p comme s(v) = v
équivaut à p{v) = v et s(v) = — v à p(v) = 0, on peut déduire l'énoncé de celui concernant
les projections. En particulier, v\ = p(v) = v+^ et V2 = (1 - p){v) = î^|iH2. (On
pourrait aussi raisonner directement en modifiant convenablement la démonstration faite pour les
projections.)
Exercice 5.1. Notons ^^(R) le C-espace vectoriel des <j> : R -» C, de classe <^°°. Soient
u : tf°°(R) -» ^°°(R) et v : tf°°(R) -» tf°°(R) définies par u(0) = 0' et (v(0))(x) = /0x 0(t) ofe.
(i) Vérifier que « et v sont linéaires.
(ii) Que vaut uov'ï Montrer que v o m est une projection, et déterminer son noyau et son image.
Exercice 5.2. Notons ^(R) le C-espace vectoriel des <j> : R —» C, continues. Si 0 € ^(R), on note
s(<j>) la fonction définie par (s(<f>))(x) = (f>{—x).
(i) Vérifier que s est une symétrie de fé'(R).
(ii) On dit que <j> € fé'(R) est paire si (f>{—x) = 0(rc) pour tout x € R et impaire si <£(—x) = —<t>{x) pour
tout x € R. Montrer que tout 0 € fé'(R) peut s'écrire de manière unique sous la forme <j> = <f>+ + <j>~,
avec <f>+ € fé'(R) paire, et <£~ € ^(R) impaire.
5.3. Familles libres, familles génératrices, bases
Soit V un K-espace vectoriel et soit (vi)i€i une famille d'éléments de V. On dit que
v G V est une combinaison linéaire des Vi si v est dans l'image de l'application de K^
dans V, qui envoie (xi)i€i sur J^igI XiVi (notons que cette somme est en fait finie puisqu'il
n'y a qu'un nombre fini de Xi ^ 0 ; par ailleurs (xi)i€i i-> J^i€l rr^ est linéaire de manière
évidente) ; autrement dit, v est une combinaison linéaire des Vi s'il existe J C I fini et des
Xj e K, pour j e J, tels que v = X)jeJ ^i^-
• L'ensemble Vect(vj, i e I) des combinaisons linéaires des Vi est le plus petit sous-espace
vectoriel de V contenant les Vi ; autrement dit, c'est le sous-espace vectoriel de V engendré
par les v*. On dit que les Vi forment une famille génératrice de V si le sous-espace vectoriel
de V engendré par les Vi est V tout entier, ce qui équivaut à la surjectivité de l'application
(Zi)i€i •-> J2iei xivi de K(I) dans v-
L'ensemble des combinaisons linéaires des vi est l'image de K*1) par l'application linéaire
{xi)iç.\ ■-* J2i£i xtvi 5 c'est donc un sous-espace vectoriel de V. Par ailleurs, si V est un sous-
espace vectoriel de V qui contient les v*, alors V contient toute combinaison linéaire des Vi
puisqu'il est stable par multiplication par un élément de K et par addition.
• On dit que les Vi forment une famille libre si (xi)iei i-> Y^iei xiv^ de K(I) dans V, est
injective. Dans le cas contraire, on dit que la famille est liée. Comme une application
5. ALGÈBRE LINÉAIRE
65
linéaire est injective si et seulement si son noyau est nul, les Vi forment une famille libre
si et seulement si la nullité de X^€j XjVj, où J C I est fini, implique celle des Xj.
• Si les Vi forment une famille libre et si v G V n'appartient pas à Vect(vj, i € I), la
famille formée de v et des Vi est encore libre.
Soi xv + J2je.i xjvj> avec J c I nru\ une combinaison linéaire nulle de v et des v*. Si x ^ 0,
on obtient v = J2jgj ~Ti~vj> ce 91" montre Que v € Vect(t>i, i € I) contrairement à l'hypothèse.
On a donc x = 0 et J2jçj xivi ~ 0> et comme les Vi forment une famille libre, cela implique
que Xj = 0 pour tout j. On en déduit le résultat.
• On dit que les v* forment une base de V si c'est une famille libre et génératrice, ce qui
équivaut à ce que l'application linéaire (xi)i€i i-> ]£i€l x&i soit un isomorphisme de K(I)
sur V. Autrement dit, les Vi forment une base de V si et seulement si tout élément v de V
peut s'écrire, de manière unique, sous la forme YneiXiVi » ^es Xi sont ^es coordonnées de v
dans la base des Vi (elles sont donc nulles sauf pour un nombre fini).
• Si n ^ 1, les vecteurs e» = (0,..., 0,1,0,... 0) (le 1 est à la i-ième place), pour 1 < i ^ n,
forment une base de Kn ; c'est la base canonique de Kn (en particulier, l'ensemble vide 0
est une base de l'espace vectoriel {0}).
Tout x = (#i,..., xn) € Kn peut s'écrire de manière unique comme une combinaison linéaire
des eu à savoir x = 52"= i xiei-
• Les monômes Xn, pour n G N, forment une base de K[X] ; c'est la base canonique de
K[X] ; de même, les X*, pour i < n, forment une base de l'espace K[X]^ des polynômes
de degré < n.
• Plus généralement, soit e* : I —► K est la fonction définie par ei{j) = 1 si i = j et ei{j) = 0
si i ^ j ; alors les e*, pour * € I, forment une base de K^ ; c'est la base canonique de K^.
• Soit u : Vi —> V2 un morphisme de K-espaces vectoriels. Si (ei)i€i est une base de Vi,
alors :
o u est surjectif, si et seulement si (u(ei))i€i est une famille génératrice de V2 ;
o u est injectif, si et seulement si (u(ei))iei est une famille libre de V2 ;
o u est bijectif, si et seulement si (u(ei))i€i est une base de V2.
Im u est le sous-espace de V2 engendré par les ufa) puisque les e* engendrent Vi ; on en
déduit le premier point.
52i€i ^iei € Kerti si et seulement si 53ieI Xiu(ei) = 0. Il s'ensuit que Kern n'est pas réduit
à {0} (ce qui équivaut à u non injectif) si et seulement si les u(ei) forment une famille liée ;
d'où le second point.
Le dernier point résultant des deux premiers, cela permet de conclure.
Exercice 5.3. Soient «o,..., an € K, distincts. Montrer que les polynômes d'interpolation de Lagrange
Q» = Tlj^i *<-%*• f°rment une base sur K de K[X](n>. Quelles sont les coordonnées de P dans cette base?
Exercice 5.4. (i) Montrer que les polynômes binomiaux (*) forment une base de C[X], et que les (*),
pour i < n, forment une base de C[X](n>.
66
VOCABULAIRE MATHÉMATIQUE
(ii) Soit P G C[X](n\ Calculer les coordonnées de P dans la base des (*), pour i ^ n. (On pourra
remarquer que (x+*) - (*) = (£), si i > 1.)
(iii) En déduire que P(fc) G Z pour tout fc G Z, si P(0), P(l),..., P(n) G Z.
Exercice 5.5. Montrer que les x ■-* |# - a|, pour a e R, forment une famille libre dans ^(R).
Exercice 5.6. Montrer que les familles suivantes de fonctions de R dans C sont libres dans ^(R).
(i) Les x h-* eax, pour a G R. (Regarder le comportement en +oo.)
(ii) Les x \-> eiaxy pour a G R. (Intégrer contre e~ibx.)
(iii) Les x ■-* eAx, pour À G C. (Dériver ou translater.)
(iv) Montrer que la famille des x ■-* sinax et a; h-» cosax, pour a G R*, est libre et que l'espace
engendré ne contient pas les fonctions constantes non nulles.
Exercice 5.7. Si k G N, on définit le polylogarithme Lifc(g) sur ] - 1,1[, par Lifc(#) = X)n^i ïï^-
Montrer que les LU, pour fc G N, forment une famille libre. (On pourra calculer a^Li^.)
Exercice 5.8. Un caractère linéaire x d'un groupe G est un morphisme de groupes de G dans C*.
(i) Montrer que les caractères linéaires d'un groupe G forment une famille libre. (Remplacer g par hg
dans une relation de longueur minimale.)
(ii) Retrouver les résultats de l'ex. 5.6.
Exercice 5.9. Montrer que les logp, pour p nombre premier, sont linéairement indépendants sur Q.
5.4. Espaces vectoriels de dimension finie
5.4-i- Dimension d'un espace vectoriel
Soit V un K-espace vectoriel. On dit que V est de dimension finie s'il possède une
famille génératrice finie. Dans le cas contraire, on dit que V est de dimension infinie.
• Un K-espace vectoriel de dimension finie possède des bases : on peut extraire de toute
famille génératrice finie une base(55).
Soit (vi)i€i une famille génératrice finie. Il y a deux cas :
o Cette famille est libre, et alors c'est une base et il n'y a rien à faire.
o II existe une combinaison linéaire J2ieix^ nuUe> sans Que les x% soient tous nuls. Soit
io e I tel que Xi0 ^ 0 ; alors vi0 appartient au sous-espace engendré par les Vi, pour i e I- {io},
et donc les vu pour i G I - {io}, forment une famille génératrice de V puisque l'espace qu'ils
engendrent contient la famille génératrice des vu pour tel.
Dans le second cas, on a réussi à extraire de (vi)iei une famille génératrice strictement
plus petite (pour l'inclusion). En réitérant le processus, on construit de la sorte, tant que
l'on n'est pas dans le premier cas, une suite de familles génératrices strictement décroissante
(pour l'inclusion) et, le cardinal de I étant supposé fini, le processus s'arrête en un nombre
fini d'étapes, et la famille obtenue est une base d'après la discussion ci-dessus, extraite de la
famille des vi par construction.
Si V est de dimension finie, on définit la dimension de V comme le minimum des
cardinaux des bases de V.
• Si V est de dimension n, toutes les bases de V sont de cardinal n.
(55)L'axiome du choix permet d'en faire autant en dim. infinie, à partir d'une famille génératrice infinie.
5. ALGÈBRE LINÉAIRE
67
La démonstration se fait par récurrence sur n, l'énoncé étant vide si n = 0. Soit donc V de
dimension n ^ 1, et soit ei,... ,en une base de V. Soit vu • • • >vm une autre base de V ; on
a donc m ^ n et on veut prouver que m = n. Comme v\,..., vm est une famille génératrice
de V, il existe % tel que vi n'appartienne pas au sous-espace vectoriel W engendré par e2,..., en
et on peut supposer, quitte à renuméroter les viy que c'est v\. On écrit Vi dans la base des tj
sous la forme Vi = J2^=i xijej> et on a #i,i ¥" 0 puisque V\ ^ W, ce qui nous permet de définir
des vecteurs fi=Vi — f^vi, pour 2 < i < m. Par construction, les fi appartiennent à W.
Montrons qu'ils en forment une base, ce qui permettra de conclure puisque W est de dimension
n - 1 (car de base e2,... ,en, et donc de dimension < n - 1 et donc exactement n - 1 par
l'hypothèse de récurrence) et donc le cardinal de la famille des fi (c'est-à-dire m - 1) est égal
à n - 1, et m = n comme souhaité.
o Si J2?=2*ifi = 0, on a ( - E£2^)ui + E£2 ^ = 0, et donc A2 = • • • = Am = 0,
puisque les Vi forment une famille libre. Il s'ensuit que les fi forment une famille libre.
o Comme les Vi forment une famille génératrice de V, on peut écrire tout v e W sous la fôf me
E?=i xiyi = EÏU Xih + (A* "~ SU ^StJ^i- L'appartenance de v et des /< à W entraine
alors celle de (Ai - El^^ffr)^ à W, et comme Vi n'appartient pas à W par hypothèse,
cela implique que Ai - EH2 ^flT = 0 et t; = Er=2 ^</<- ^ s'ensuit que les fi forment une
famille génératrice de W, ce qui permet de conclure.
• Si Vi et V2 sont de dimension finie, alors Vi©V2 aussi et dim(Vi©V2) = dim Vi+dim V2.
Si ei,..., en est une base de Vi et si /1,..., fm est une base de V2, alors ei,..., en, /1,..., fm
est une base de Vi © V2.
• Si vi,..., vr est une famille libre, on peut trouver une base de V contenant v\,..., vr ; plus
précisément, si tui,..., ws est une famille génératrice de V, on peut compléter v\,..., vr
en une base de V en lui ajoutant des Wi (th. de la base incomplète).
Soit X l'ensemble des parties I de {1,..., s} telles que vu • • • > vr et les w^ pour t € I, forment
une famille libre. Soit JcX maximale pour l'inclusion. Alors v\,... ,vr et les w,-, pour j e J,
forment une famille libre par hypothèse. Par ailleurs, comme J est maximale, le sous-espace
vectoriel W qu'ils engendrent contient wiy si i £ J ; il s'ensuit que W contient tous les w^ et
donc est égal à V puisque les Wi engendrent V. On en déduit que vi,... ,vr et les Wj, pour
j e J, forment une famille génératrice et donc une base, ce qui permet de conclure.
• Si V est de dimension n, une famille libre de V a au plus n éléments ; la dimension de
V est donc aussi le maximum des cardinaux des familles libres de V.
C'est, compte-tenu de ce qu'une base a (au plus) n éléments, une conséquence immédiate
du point précédent.
• Si V n'est pas de dimension finie, alors V possède des familles libres infinies.
Commençons par remarquer qu'une famille infinie est libre si et seulement si toutes ses
sous-familles finies le sont (une combinaison linéaire ne fait intervenir qu'un nombre fini de
vecteurs). Pour construire une famille libre infinie, il suffit donc de construire par récurrence
des vecteurs v\,... ,vn,... telle que vi,... ,vn soit libre pour tout n, et pour cela il suffit,
vi,...,vn étant donnés et formant une famille libre, de prendre vn+i n'appartenant pas à
l'espace engendré par v\,..., vn, ce qui est possible car V ne possède pas de famille génératrice
finie (et donc vi,..., vn n'engendrent pas V tout entier).
68
VOCABULAIRE MATHÉMATIQUE
• Si V est de dimension ra, et si v\,..., vn sont des vecteurs de V, alors :
« wi,..., vn est libre » ^ « vu ..., vn est génératrice » O « V\,..., vn est une base ».
Si vi,..., vn est libre mais pas génératrice, on peut la compléter en une base de cardinal > n,
ce qui est absurde et donc vu... ,vn est aussi génératrice. Si vi,..., vn est génératrice mais
pas libre, on peut en extraire une base de cardinal < n, ce qui est absurde et donc vu... ,vn
est aussi libre.
• Si V est de dimension finie, et si W est un sous-espace vectoriel de V, alors W est de
dimension finie et on a dimW < dim V avec égalité si et seulement si W = V.
Une famille libre de W est aussi libre dans V, et donc toute famille libre de W est de
cardinal ^ dim V. On en déduit que W est de dimension finie et que dim W ^ dim V. Maintenant,
supposons que dimW = dimV; alors une base de W est une famille libre de V de cardinal
dim V ; c'est donc aussi une base de V d'après le point précédent ; on en déduit que W = V ce
qui conclut la démonstration.
• Si V est de dimension finie, et si W est un sous-espace de V, alors W possède des
supplémentaires, et si W est un supplémentaire de W, alors dim W7 = dim V - dim W.
Pour construire un supplémentaire^56* de W, il suffit de partir d'une base ei,... ,er de W,
de la compléter en une base eu... ,en de V, et de prendre pour W7 l'espace engendré par
er+i,..., en : si x = Xiei + h xnen G V, alors x = y + y' avec y = Xiei + h xTeT G W
et y' = #r+ier+i H h xnen G W7, et donc V = W + W7. par ailleurs, si a; G W n W7, on
peut écrire x sous la forme #iei H h xrer et sous la forme #r+ier+i H h xneny et donc
#iei + h xrer — #r+ier+i — . — xnen = 0, ce qui implique X\ = • • • = xn = 0, puisque
les ei forment une base de V ; on a donc W n W7 = {0}, et V = W © W7.
Enfin, si W7 est un supplémentaire de W, on a V = W©W7, et donc dim V = dim W+dim W7
et dim W7 = dim V - dim W.
5.4-2. Morphismes
• Soit u : Vi —> V2 un morphisme de K-espaces vectoriels. Alors Vi est de dimension
finie si et seulement si Keru et Imu le sont, et dimVi = dim(Keru) + dim(Imu). (La
dimension de Imu s'appelle le rang de u, et est aussi notée rgu; la formule précédente
peut donc aussi s'écrire dim Vi = dim(Keru) + rgu.)
Supposons Vi de dimension finie. Alors Keru l'est aussi puisque c'est un sous-espace de Vi
et Imu l'est car l'image par u d'une famille génératrice de Vi engendre Imu.
Supposons maintenant Keru et Imu de dimension finie, et choisissons une base ei,... ,er
de Keru, une base /i,..., fr de Keru et un relèvement gi de fi dans Vi (i.e. un gi G Vi tel
que u{gi) = fi). Montrons que eu... ,er,#i,... ,gs est une base de Vu ce qui prouvera à la
fois que Vi est de dimension finie et que dim Vi = dim(Keru) + dim(Imu).
° Si J2ri=i ^iei + J2Sj=i N9j = 0) appliquer u à cette relation nous donne £j=i fijfj = 0,
ce qui implique que les fij sont tous nuls ; on a alors J2l=i ^iei = 0» ce Qui implique que les À*
sont aussi tous nuls. On en déduit que eu ..., er, pi,...,gs est une famille libre.
56^La même construction marche en dimension infinie, si on admet l'axiome du choix.
5. ALGÈBRE LINÉAIRE
69
o Si v € Vi, il existe /*i,... ,/*s tels que u(v) = 5ZJ=i A*j/r Alors v - Y%=i V-j9i appartient
à Kerw et il existe Ai,..., Ar tels que l'on ait v - Yfj=i N9i = X3i=i ^iei- ^n en déduit que
ei, • • •,er,#1,...,ga est une famille génératrice.
Ceci permet de conclure.
• Soit u : Vi —> V2 un morphisme de K-espaces vectoriels de dimension finie,
o Si u est surjectif, alors dimVi ^ dimV2.
o Si u est injectif, alors dimVi < dimV2.
o Si u est un isomorphisme, alors dimVi = dimV2 : deux espace isomorphes ont la
même dimension.
Si u est surjectif, alors Imtt = V2 et dim Vi - dim V2 = dim(Keru) ^ 0. Si u est injectif,
alors Kerw = 0 et donc Imtt est de dimension dimVi ; comme c'est un sous-espace de V2,
on a dim Vi ^ V2. Enfin, si u est un isomorphisme, alors u est surjectif et injectif, et on a
dimVi ^ dim V2 et dim Vi ^ dimV2 et donc dim Vi = dim V2.
• Soient Vi, V2 des sous-K-espaces vectoriels de dimension finie d'un K-espace vectoriel W.
Alors Vi + V2 et Vi D V2 sont de dimension finie et
dim(Vi + V2) + dim(Vi G V2) = dim Vx + dim V2 (Grassmann, 1862).
On applique le point précédent à u : Vi © V2 —» W défini par u(x> y) = x + y ; l'image de
u est Vi + V2 et le noyau est l'ensemble des (x, -x) avec x € Vi n V2 (il est donc isomorphe
à Vi n V2, en particulier il a la même dimension). Comme dim(Vi © V2) = dim Vi + dim V2,
cela permet de conclure.
• Soit u : Vi —> V2 un morphisme de K-espaces vectoriels. Si dimVi = dimV2 < +co,
« u est injectif » <=*► « u est surjectif » <=> « u est un isomorphisme ».
« u est inversible » ^««aun inverse à droite » ^ « « a un inverse à gauche ».
Si u est injectif, on a dim(Keru) = 0, dim(Imw) = dim Vi = dim V2 et donc Imu = V2 et
u est surjectif. Si u est surjectif, on a dim(Imu) = dim V2 = dim Vi, et donc dim(Keru) = 0
et u est injectif.
Maintenant, si u o v = id, cela implique en particulier que u est surjectif et donc bijectif ;
l'existence d'un inverse à droite implique donc que u est inversible. Si v o u = id, cela implique
en particulier que u est injectif et donc bijectif; l'existence d'un inverse à gauche implique
donc que u est inversible.
Notons que le résultat est faux en dimension infinie (cf. ex. 5.1).
5.5. Dualité
5.5.1. Espace dual, orthogonal, morphisme transposé
Si V est un K-espace vectoriel, une forme linéaire sur V est une application linéaire
de V dans K. On note V* le dual de V, c'est-à-dire l'espace Hom(V, K) des formes linéaires
sur V (c'est un K-espace vectoriel comme cas particulier de Hom(Vi,V2)). Si A € V* et
ïeV, nous noterons souvent (A, x) l'élément X(x) de K, de manière à établir une certaine
symétrie entre V et V*. En effet, si x G V*, l'application A ■-> (A,x) est linéaire par
70
VOCABULAIRE MATHÉMATIQUE
définition de la structure d'espace vectoriel sur V*, ce qui nous fournit une application
naturelle*57* Ly : V —> (V*)* avec (iV(i), A) = (A,rr), qui est linéaire de manière évidente.
Si W est un sous-espace vectoriel de V, on définit l'orthogonal W1 de W dans V* comme
l'ensemble des A e V* tels que (A, x) = 0 pour tout x € W (c'est donc l'intersection des
noyaux des ty(x), pour a; e W, ce qui prouve que c'est un sous-espace vectoriel de V*).
Symétriquement, si W est un sous-espace vectoriel de V*, on définit l'orthogonal W1- de
W dans V comme l'ensemble des x e V tels que (A,x) = 0 pour tout A € W. Il est
immédiat que W C (W-1)1 si W C V ou si W c V*.
Si u : Vi —> V2 est linéaire, on définit sa transposée *u : VJ —> Vf par ^(A) = A o u ; on
a donc (^(A),^) = (A,u(x)>, pour tout x e Vi et A € VJ.
• Si u : Vi —> V2 et v : V2 —► V3 sont linéaires, alors 1tio«) = ^ o fy.
On a (A,vou(x)) = (*u(A),u(a:)) = (t,uot,y(A),rc) ; d'où le résultat.
5.5.2. Le dual d'un espace de dimension finie
Dans le reste de ce n°, les espaces sont implicitement de dimension finie.
• Si V est de dimension n, alors V* est de dimension n; plus précisément, si ei,... ,en
est une base de V, il existe une (unique) base e*,..., ej de V*, la base duale de ei,..., en,
telle que (e*, e*) = 1 et (e*, ej) = 0, si j ^ i.
Soit A € V* et soit ai = (A,ei). Alors (A,x) = oirci + • • • + anxn par linéarité, si x =
#iei H Vxnen ; réciproquement, si ûi, ...,on € Kn, alors x •-* 01X1H \-anxn est l'unique
forme linéaire A sur V vérifiant (A,ef) = a*. En d'autres termes A h-* ((A,ei),..., (A,en)) est
un isomorphisme de V* sur Kn. L'énoncé s'en déduit, la base duale de ei,..., en étant l'image
réciproque de la base canonique de Kn par cet isomorphisme.
• L'application naturelle ty : V —► (V*)* est un isomorphisme; autrement dit le dual
de V* est V. De plus, si ei,..., en est une base de V, et si e*,..., e* est la base de V*
duale de ei,..., en, alors la base de V, duale de e*,..., e*, est ei,..., en.
Soit x = x\e\ + ••• + xnen € Kertv; alors (A,x) = 0, pour tout A € V* et donc
0 = {e*,x) = xi, pour tout i. On a donc Kerty = 0, ce qui prouve que tv est injective.
Comme dim(V*)* = dimV* = dimV, Pinjectivité de tv entraîne sa bijectivité. Le résultat
s'en déduit (l'énoncé sur la dualité des bases est immédiat).
• Si u : Vi —> V2 est linéaire, alors Xhi) = u.
Xu) est un morphisme de (V*)* dans (V^)*, et pour le voir comme un morphisme de Vi
dans V2, il faut utiliser les identifications naturelles tvi : Vi = (V*)* et t,y2 : V2 = (V|)*.
Cela dit, le résultat suit de ce que (*(*•*)(*Vi(aî))i A) = (tv1(«)/w(A)) = (^(A),») = (A,«(x)) =
(tv2(«(#))> A), pour tous x € Vi et A € V|, ce qui nous donne \*u) o tVl = ^v2 ° «•
(57^ Comme nous le verrons ci-dessous cette application est un isomorphisme si V est de dimension finie,
ce qui permet d'identifier le dual de V* à V et donc de faire jouer des rôles totalement symétriques à V
et V* ; si V est de dimension infinie, la situation est plus compliquée : si on admet l'axiome du choix,
alors ty est injective, mais très loin d'être surjective car (V*)* a un cardinal beaucoup plus grand que
celui de V; si on n'admet pas l'axiome du choix, on peut construire des espaces pour lesquels V* = {0}.
6. DÉTERMINANTS
71
• Si W est un sous-espace de V, alors dim W1- = dim V—dim W. En particulier, V-1 = {0}.
Soit ei,..., er une base de W, que l'on complète en une base ei,...,en de V (c'est
possible d'après le th. de la base incomplète). Alors Wx est le sous-espace de V* engendré par
e*+1,.. •, e* (en effet, on a 0 = (e*, e*) si j ^ r + 1 et i ^ r, ce qui prouve, par linéarité, que
e* € W1 ; réciproquement, si A = X)"=i ^jej e W-1-, on a 0 = (A,ei) = A* si i ^ r, ce qui
prouve que les e*, pour j ^ r + 1, engendrent W-1-). On en déduit le résultat.
• Si W est un sous-espace de V, alors (W-1)-1 = W.
On a W c (W-1-)-1-, et cette inclusion est une égalité car
dim(W-L)± = dim V* - dim W-1- = dim V - (dim V - dim W) = dim W.
• Si u : Vi —> V2 est linéaire, alors
Kerhi = (Imîi)-1, Im^ = (Keru)-1, et rg*u = rgw.
« A € (Imw)1 » <=> « (X,u(x)) = 0, Vx € Vi » «► « (*u(A),aî> = 0, Vx € Vi » <=> « *u(A) € Vj1 »,
et comme Vj- = {0}, la dernière propriété équivaut à A € Ker*u. On en déduit la première
égalité. La seconde s'obtient alors en échangeant les rôles de u et *u ce qui est loisible car
*(*ii) = u, et en prenant les orthogonaux.
Enfin, rg*u = dim(Imtu) = dim(Keru)-1- = dim V! - dim(Keru) = dim(Imu) = rgti.
6. Déterminants
Les déterminants et les formes multilinéaires alternées interviennent dans des contextes
variés. En algèbre linéaire, ils peuvent servir à décider si des vecteurs sont liés ou pas
(n° 6.2) ou si des polynômes ont des zéros communs (résultant de deux polynômes,
alinéa 9.2.1), à donner des formules pour les solutions d'un système linéaire (formules de
Cramer, alinéa 9.1.1) ; en géométrie, ils permettent de calculer des volumes (le volume du
parallélépipède supporté par des vecteurs vi,..., vn de Rn est la valeur absolue de leur
déterminant, ex. III.3.11).
6.1. Formes multilinéaires alternées
Soit V un K-espace vectoriel. Une forme bilinéaire f sur V est une application de V x V
dans K, telle que x ►-► f(x,y) soit linéaire pour tout y € V (i.e. / est linéaire en la
première variable) et y i-> f(x,y) soit linéaire pour tout x e Y (i.e. / est linéaire en la
seconde variable). Plus généralement, une forme k-linéaire sur V est une application de
V* = V x • • • x V dans K, linéaire en chacune des variable, ce qui signifie que, quel que
soit i € {1,..., k}, vi i-» f(vi,..., Vk) est linéaire pour tout(58) (vi,..., î)i,..., Vk) € V*-1.
Une forme fc-linéaire / est dite alternée si elle change de signe quand on échange deux
vecteurs consécutifs : i.e. si /(vi,..., viy vi+i, ...Vk) = —/(«i,. • •, vi+i, vh ..., Vk) pour
tous i e {1,..., k} et (wi,..., vk) € Vk.
Comme S& est engendré par les transpositions («,« + 1), pour l^i^fc-1, on obtient :
<58>On utilise la notation standard (vi,..., i)i,..., v&) pour dénoter le (fc — l)-uplet obtenu en retirant v%
à(vi,...,v*).
72
VOCABULAIRE MATHÉMATIQUE
• Si / est fc-linéaire alternée, alors /(va(i)» • • • ,va(k)) = sign(a)/(vi,... ,vk), pour tous
a 6 Sfc et («!,...,«*) 6 V*.
En utilisant le point précédent pour amener les deux termes égaux aux deux premières
places, on obtient :
• Si / est fc-linéaire alternée, alors f(v\,..., v*) = 0 si deux des Vi sont égaux.
• Si / est A:-linéaire alternée, alors /(vi,..., vk) ne change pas si on rajoute à un des v<
une combinaison linéaire des autres ou des multiples d'un des Vi aux autres :
f(vi,..., vt-i, Vi + Y^j^i V^> v<+i,..., vk) = /(vi, ...yvk)
f(vi + AiVj,..., Vi_i + \_iVi, Vi, vi+l + Aj+iVj,..., vk + AfcVi) = f(vu ...,vk).
Établissons la seconde formule par exemple. La ^-linéarité montre que le membre de gauche
est égal à f{vu.. • ,«*)+£ic{i k}-{i},i& (Uj& aj)/(vU>• • • »«fc,i)»ou vj,i = vi si3 € Iu{i}
et Vjt\ = Vj sinon. Comme I ^ 0, il y a au moins deux Vjt\ qui sont égaux et /(vi,i,..., vk,i) = 0
pour tout I, ce qui permet de conclure.
6.2. Déterminant de n vecteurs
On suppose dorénavant que V est de dimension n. Soit ei,... ,en une base de V.
• Si x = Yn=i xiei et si / est une forme linéaire sur V, alors f(x) = £"=1 ^/(e»).
Si x = YZ=i x^u siy = J2]=i Vj^j et si / est bilinéaire, f{x, y) = J27=i Ê"=i ^iVjf^u ej).
Plus généralement, si Xj = Y%=i xUeî-> et s* / est ^-linéaire, alors
(6.1) f(xi,...,xk) Yl
xl,ii ' ' ' xk,ikJ\eii> • • • ) eifc/
l<ti,...,tfc<n
L'énoncé est immédiat pour une forme linéaire. Si / est bilinéaire, la linéarité par rapport à
la seconde variable nous donne /(£"=1 a^e», J2"=i yjei) = £j=i Ifr/ŒXLi s*6*» ei) '■>on obtient
donc /(£?=i xiei> £j=i 2/iej) = 5Z?=i Y%=ixiyjf(eùej) en utilisant la linéarité par rapport
à la première variable. Le cas d'une forme fc-linéaire se démontre par récurrence sur A:, en
utilisant la linéarité par rapport à la dernière variable.
• Si V est de dimension n, l'espace detV* des formes n-linéaires alternées sur V est de
dimension 1. De plus, si ei,..., en est une base de V, il existe un unique élément detei(...>en
(le déterminant de n vecteurs dans la base t\,..., en) de det V* prenant la valeur 1 sur
(ei,...,en), et on a :
o deteir..)en(vi,... ,vn) = 0 si et seulement si Vi,... ,vn est une famille liée ;
o detei)...)en(vi,..., vn) ^ 0 si et seulement si vi,..., vn est une base ;
o si /i,..., fn est une autre base de V, alors det/l(...(/,>i, ...,«„) = d^r^tAl---!/")'
pour tout (vi,..., vn) G Kn.
En utilisant le point précédent, on peut éliminer de la formule (6.1) (avec k = n) les n-
uplets (ii,...,in) où deux ij sont les mêmes, on a alors une somme portant sur des n-uplets
(*i,...,*n) où tous les termes sont distincts, c'est-à-dire sur les permutations de {l,...,n}
(il existe une unique a € Sn telle que ij = a(j), pour tout j € {1,... ,n}, si les ij sont tous
6. DÉTERMINANTS
73
distincts). Comme /(e<7(1),...,ea(n)) = sign(o-)/(ei,...,en), on obtient :
n n
f(vu. ..,«*) = /(ci,... ,en)( ]T sign(<j) JJ *«.*«>)> si v< = 5Z^«ci-
a€S„ i=l j=l
Notons detei,...,eTl la forme (vi,... ,vn) »-* Z)a€STl ^S11^) riiLi #*,*(*)• La formule ci-dessus se
réécrit sous la forme / = /(ei,... ,en) detCli...|Cn, ce qui prouve que det V* est de dimension
au plus 1, engendré par detCll...|Cn si cette forme est alternée.
On a detCll...|Cn(ei,... ,en) = 1 car tous les termes de la somme sont nuls sauf celui
correspondant à a = id, ce qui prouve que detCli...|Cn ^ 0. Par ailleurs, si r G Sn, alors
k
e drt (t;T(1)>...,vT{n)) = ]T sign((7) f] xT{j)Mj).
1 n <r£Sk j=l
On écrit a(j) sous la forme <tt~1(t(j)) et sign(cr) sous la forme signer"1 )sign(r), et on fait
les changements de variables f = r(j) et a' = ar"1. On obtient
k
edetg (t;T(i)>...>t;T(n)) = sîgn(r)( ]T sign(</) n*J'.W>) = siSn(r) e dete (t>i>--->t>n)-
Ceci prouve que detei,...,e„ est alternée. Comme detei,...,en ^ 0, il en résulte que det V* est de
dimension au moins 1, et donc de dimension exactement 1, et que detei,...,eri en est une base.
Si / G det V*, il existe donc À G K tel que / = AdetCll...|Cn, et si / vérifie /(ei,... ,en) = 1,
cela implique À = 1, et donc que / est la forme detei,...,e„ définie ci-dessus (en particulier, il y
a unicité d'une telle forme).
Maintenant, si /i,...,/n est une autre base de V, il existe À G K tel que detfUmm.jn =
Àdetei,...,eTl puisque detei,...,eTl est une base de l'espace detV* dont detfly„mjn est élément.
En évaluant les deux membres en (/i,...,/w), on obtient 1 = AdetCli...|Cn(/i,. ■ • ,/n) (en
particulier detei,...,ew(/i,... ,/n) ^ 0), et donc A = dctci J(/l /w).
Si vi,... ,vn est libre, c'est une base et detei,...,en(^i, - - - ,vn) ^ 0, d'après ce qui précède.
Si vi,... yvn est liée, on peut exprimer l'un des vi comme une combinaison linéaire des autres
et donc detei,...,en(^i, -. - ,vn) = 0 (c'est vrai pour n'importe quelle forme alternée).
Ceci termine la démonstration.
• detClf...|Cn(t;i,..., vn) = T,*esn siën(^) 112=1 *i,*<ih si vi = EJ=i xijej-
Cela a été établi au cours de la démonstration du point précédent.
Exercice 6.1. Soit V un espace vectoriel de dimension n, et soit ei,... ,en une base de V. On note
A*V* l'espace des formes fc-linéaires alternées sur V.
(i) Si 1 ^ ii < • • • < %k ^ n, on note e£ A ■ ■ • A e*fc la forme fc-linéaire définie par
k n
(e? A ■ • • A eJJ(t;i,... ,vk) = ]T sign(a) JJ xjAa{jV si vt = J2xJAeù pour 1 ^ j ^ k.
a£Sk j=l i=\
Montrer que e£ A • ••A e*fc est alternée.
(ii) Calculer (e£ A • • • A e*fc)(e*n... ,e£fc), si 1 ^ l\ < • • ■ < ik ^ n. En déduire que les e? A ■ • • A e*fc
forment une famille libre de A*V*.
(iii) Montrer que A*V* est un espace de dimension (£) et que les e£ A • ■ • A e*fc en forment une base.
74 VOCABULAIRE MATHÉMATIQUE
6.3. Déterminant d'un endomorphisme
On suppose toujours que V est de dimension n.
• Si u e End(V), il existe un unique A € K tel que f(u(v\),... ,u(vn)) = A/(wi,... ,un),
pour tous / G det V* et Vi,..., vn e V. Ce À est le déterminant detu de u> et on a :
o detu = detei(...>en(w(ei),... ,u(en)) pour toute base ei,... ,en de V ;
o detu = 0 <==> u non injectif <=> u non surjectif •<=>• u non bijectif ;
o detu ^ 0 <=> u injectif •<=>• u surjectif <*=*► u bijectif;
o det u o v = det u det w, pour tous u,v G End(V).
L'application (vi,...,vn) ■-* /«(vi, ...,vn) = /(u(vi),... ,u(vn)) est n-linéaire car / est n-
linéaire et u linéaire. Par ailleurs, elle est alternée car / l'est, et donc /•-*/« est une application
de det V* dans lui-même. Soit alors e une base de det V* ; notons det u l'élément de K défini
paient = (detu)e. Comme /•-*/« est linéaire de manière évidente, on a fu = (detu)/, pour tout
/ € detV*, et donc /(u(vi),. ..,u(vn)) = (detw)/(«i,...,un), pour toute forme n-linéaire
alternée / sur V et tous vi,..., vn € V.
On peut appliquer l'identité précédente à / = detei>...ie„ et à V{ = e*, où ei,...,en est
une base de V. On en déduit la formule det m = detei,...,e„(«(ei),...,«(en)). Il s'ensuit que
detu = 0 si et seulement si w(ei),... ,«(en) est une famille liée, et donc si et seulement si u
n'est pas injectif (cf. n° 5.2). On en déduit les deux premiers points (cf. alinéa 5.4.2), le second
étant obtenu en niant les propositions équivalentes du premier.
Enfin, on a
det«ov= det (u(v(ei)),... ,u(v(en))) = (detu) det (v(ei ),..., v(en)) = detu det v.
ei,...,e„ ei,...,e„
7. Matrices
7.1. Matrices à coefficients dans un corps
Soit K un corps commutatif. Si n, m sont des entiers ^ 1, on note Mnxm(K) l'ensemble
des matrices A = (ûi,j)i<n,i<m à n lignes et à m colonnes à coefficients dans K (i.e. aiyj € K
pour tous iyj). Pour les calculs, il est souvent commode de représenter A = (aij)t<n,i<n»
(notée simplement (o^), si n et m sont clairs) sous la forme d'un tableau nxm
/<*i,i ••• oi,m\
A- h -. ; .
\on,i • • • a,n,m/
L'ensemble Mnxm(K) des matrices nxm est, de manière naturelle, un espace vectoriel
avec l'addition et la multiplication par un scalaire définies composante par composante :
• dimMnxm(K) = nm
(aitj) ■-► (6&)fc<mn, avec bm(i_l)+j = aitj, est un isomorphisme de Mnxm(K) sur Knm.
Si A = (oi(J) € Mnxm(K), on note *A = (^j) € Mmxn(K), où \j = ajti la matrice
transposée de A (c'est la symétrique de A par rapport à la diagonale).
7. MATRICES
75
Par exemple, *A = I 4 5 1 si A = ( ].
On identifie Kn aux matrices n x 1 (i.e. à n lignes et 1 colonne), mais pour économiser le
papier, on écrit un élément de Kn sous la forme \x\,..., xn) (i.e. comme le transposé d'une
matrice 1 x n). On note en général X ou Y un élément générique de Kn ; la base canonique
de Kn est notée e[ ,..., en (ou simplement ei,..., en si la dimension est claire).
Si A = (ûtj)t^n,i^m e Mnxm(K), on note ua le morphisme de Km dans Kn donné par
uaK^i» • • • »^m)) = *(î/ii • • •,î/n)» avec yi = Y%Li aijxj> ce <lui fait Que les colonnes de A
sont les uA(e^m)), pour je{l,...,m}.
• A i-> Ua est un isomorphisme d'espaces vectoriels de Mnxm(K) sur Hom(Km,Kn),
l'isomorphisme réciproque étant celui qui envoie u : Km —> Kn sur la matrice Mat(u) dont
la j-ième colonne est u(e^) e Kn.
La linéarité de A i-» ua est un jeu d'écriture. Par ailleurs, si u(ej) = X)"=i °*Jei > et si
« = Er=i^e$m)'alors
m m n n m
«(*> = E*,^"0) = £*;(£««*ï">) = E (E«i*jK°-
j=l j=l i=l t=l j=l
On reconnaît les formules pour «a> où A = (aij) € Mnxm(K). Le résultat s'en déduit.
7.2. Produit de matrices
Si A = (oi(i) e Mnxm(K) et B = (bjjk) € Mmx*(K), leur produit AB e Mnx*(K) est
défini par AB = (c*,*), avec ciik = £Jli a» A*-
• uA(X) = AX, si X e K™ = Mmxl(K).
• «AB =UAOUB,
Par linéarité, il suffit de vérifier que «a °«b et uab coïncident sur la base canonique de Ke,
ce qui résulte de :
m tn m n
•a <•«*(«?>) = «A(£&«e<"*>) = £^«A(e}m)) = EM£«U«{"')
n m
= E(E^^)^n)=«AB(ai"),
• Le produit de matrices est associatif et distributif par rapport à Paddition :
A(BC) = (AB)C, A(Bx + B2) = ABx + AB2, et (Ax + A2)B = AxB + A2B.
Pour pouver que A(BC) = (AB)C, il suffit de prouver que ua(bc) = ^(ab)c> mais ceia résulte
de ce que ua(bc) = ^a°^bc = ua°ub°uc et U(ab)c = ^ab°^c = ua°^b°^c- On démontre les
autres formules de la même manière en remarquant queuA°(uBi +^b2) = (^a°^Bi)+(^a°^b2)
par linéarité de ua, et (ua! + u\2) o ub = (^Ai ° ^b) + (v>a2 ° ^b) par définition.
• «(AB) = <B*A.
76
VOCABULAIRE MATHÉMATIQUE
Posons AB = C = (cf.fc). On pose *aitk = o&,j, %j = bjti et *<:&,* = Ci,k de telle sorte que
*A = (*»M), 'B = Ofty) et «C = (**,*). On a donc ^ = cM = Ef=i «*J*i.< = Ejli VA*.*,
et on reconnaît dans le membre de droite les coefficients de 'B'A ; d'où le résultat.
7.3. Le théorème fondamental de l'algèbre linéaire
• L'accouplement ( , > : Kn x Kn -» K donné par (X,Y> = <XY, où Kn = Mnxl(K),
identifie le dual de Kn à Kn (i.e. toute forme linéaire sur Kn est la forme Yh'XY pour
un unique X G Kn).
Une forme linéaire sur Kn est de la forme *(2/i> • • • > 2/n) ■-» o-iVi H H on2/n, pour un unique
\ai,..., on) € Kn ; elle est donc aussi de la forme Y •-» *X Y, pour un unique X = *(oi,..., on).
Si A G Mnxm(K), le morphisme transposé ^a de ua : Km —► Kn est un morphisme de
Kn dans Km si on utilise l'identification (Kn)* = Kn précédente.
• ^a = t**A ; autrement dit la matrice de la transposée est la transposée de la matrice.
Cela résulte de ce que (X,uA(Y)) = (X, AY) = <XAY = *(*AX)Y = (*AX, Y) = (u.A(X), Y).
Le rang d'une famille de vecteurs d'un espace vectoriel V est la dimension du sous-
espace engendré par cette famille ; c'est aussi le maximal du cardinal d'une sous-famille
libre. Le rang rg A d'une matrice A est le rang de ses colonnes ; on a donc rg A = rgwA-
• Le rang d'une matrice est égal à celui de sa transposée ; autrement dit les dimensions
des espaces engendrés par les colonnes et les lignes d'une matrice sont égales.
Cela résulte de ce que rg A = rg«A = rg*WA = r6*A (cf. alinéa 5.5.2).
• La dimension du sous espace de Km (resp. Kn) orthogonal de l'espace engendré par les
lignes (resp. colonnes) de A est m — rg A (resp. n — rgA).
Cela résulte de ce que dimW+dim W-1- = d, si W est un sous-espace de Kd (cf. alinéa 5.5.2),
et de ce que les dimensions des espaces engendrés par les colonnes et les lignes sont égales àrg A.
7.4. Matrice d'une application linéaire
Si V est un espace vectoriel de dimension n> le choix d'une base e = (ei,..., en) fournit
un isomorphisme te : V = Kn, à savoir celui qui envoie un vecteur x € V sur
l'élément de Kn formé des coordonnées de x dans la base e ; l'isomorphisme réciproque est
\x\t... ,xn) i-» x\e\ + • • • + xnen. Nous noterons^ e\x l'élément Le(x) vu comme une
matrice nxl. Plus généralement, si v = (v\,... ,vm) est un m-uplet de vecteurs de V, on
note e\v la matrice nxm dont les colonnes sont e\wi,..., e\vm.
Si u : Vi —► V2 est un morphisme, on note u-x au lieu de u(x) l'image de x par u.
De même, si v = (wi,.. .,vTO) est un m-uplet de vecteurs de Vi, on note u-v le m-
uplet (u-vi,..., U'Vm). Si maintenant, Vi est de dimension m et V2 de dimension n, et si
e = (ei,...,em) est une base de Vi et f = (/1,..., fn) est une base de V2, on définit la
(59>Ce n'est pas une notation standard, mais elle a des propriétés assez agréables : une base est une unité
de mesure en dimension supérieure, et pour mesurer un vecteur on fait le rapport de ce vecteur par l'unité
de mesure, mais il faut spécifier de quel côté se fait la division, car on est dans un monde non commutatif.
7. MATRICES
77
matrice de u relativement aux bases e et f comme f\u-e ; les colonnes de cette matrice
sont donc u{e{),..., u{em) écrits dans la base /i,..., /».
• Si s € Vi, on a<60> f\t*-a; = (f\t*-e)(e\a;).
Soit A la matrice f \ue. L'identité à vérifier équivaut à tf (u(x)) = «A(te(#)) et, par linéarité,
il suffit de le vérifier pour ei,... ,em. On tombe alors sur un pur exercice de traduction en
revenant aux définition de te, tf et ua- Notons que le résultat se réécrit aussi sous la forme
«A = lfOUOl~l.
• Si e et f sont deux bases de V, la matrice de passage de e à f est la matrice f\e
dont les colonnes sont les vecteurs^ de e exprimés dans la base f. Si x € V, on a
f\x = (f\e)(e\rr). Autrement dit, on obtient les coordonnées de x dans la base f à partir
de celles dans la base e en multipliant par la matrice de passage de e à f.
Il suffit d'appliquer le point précédent à id : V —> V, en munissant le V de départ de la
base e et celui d'arrivée de la base f.
• Si Vi,...,Vfc sont des espaces de dimension finie, si e* est une base de V<, et si
ta : Vj —> Vj+i est un morphisme pour 1 < t < fc — 1, alors
ejb\(t*jb_i o • • • o ui)-ei = (efc\tAjb_i-efc_i)-(efc_i\ttfc_2-efc_2) • • • (e2\ui-ei).
Il suffit de démontrer le résultat pour k = 3 ; le cas général s'en déduit par récurrence.
Si Vi est de dimension n$, on dispose d'un isomorphisme t* = ce. : V* = Knf. Notons A la
matrice e3\«2*e2» B la matrice e2\«i*ei et C la matrice e3\(tt2°wi)'ei. Alors, par construction,
ua =t3°«2°^2~1» uq = L2OU10tj"1, et uc = (>3 ° (^2 °«i) ° ^i"1. Le résultat est donc une
traduction de l'identité «a°«b = (t.3 0U20l^1) o (t2 0^0 t~l) = i3oit2ouioiJ"1 = uc, qui
est équivalente à AB = C.
• Si e et f sont deux bases de V, alors (f\e)(e\f) = 1. Autrement dit, les matrices de
passage de e à f et de f à e sont inverses l'une de l'autre.
Il suffit d'appliquer le point précédent à V! = V2 = V3 = V et v.2 = «1 = id, en munissant
le premier V de la base f, le second de la base e et le troisième de la base f.
• Soit u : V —> V un morphisme. Si e et f sont des bases de V et e' et f7 sont des bases
de V7, alors
f \tt-f = (f \«0(eVe)(e\f).
Autrement dit, si M est la matrice de u dans les bases e et e', M' celle dans les bases f
et f, P' la matrice de passage de e7 à f, P celle de f à e, on a M7 = P'MP-1.
Il suffit d'appliquer le résultat ci-dessus à Vi = V2 = V, V3 = V4 = V, en munissant Vi
de f, V2 de e, V3 de e', V4 de f, et en prenant tti = id, U2 = u et 113 = id.
*60)()n obtient donc le membre de gauche en « simplifiant » par la base e dans le membre de droite ; cela
constitue une contrainte assez forte sur les expressions permises : pour pouvoir simplifier, il faut que la
base apparaisse au numérateur du terme précédant celui où elle apparaît en dénominateur.
(61>Notons qu'en général, on connaît les coordonnées de x et des fi dans la bas e, et donc la matrice que
l'on peut écrire sans effort est P = e\f ; comme f\e = (e\f)"1 d'après un des points suivants, la formule
de changement de base prend la forme X' = P-1X, si X = e\x et X7 = î\x.
78
VOCABULAIRE MATHÉMATIQUE
• Soit u : V —> V un endomorphisme. Si e est une base de V, la matrice de u dans la
base e est la matrice e\w-e. Si e et f sont des bases de V, alors
f\u-f = (f\e)(e\ti-e)(e\f).
Autrement dit, si on note M la matrice de u dans la base e, M' celle dans la base f et P
la matrice de passage de e à f, on a M' = PMP-1.
La formule correspond au cas particulier du point précédent où V = V et e = e', f = f ;
sa traduction résulte de ce que f\e = P par définition, et donc e\f = P"1.
7.5. Matrices carrées
Si n ^ 1, on note simplement Mn(K) l'espace Mnxn(K). D'après ce qui précède, c'est
une K-algèbre de dimension n2, unitaire ayant pour unité la matrice ln (notée en général
simplement 1, si n est fixé) ayant des 1 sur la diagonale et des 0 ailleurs (l'endomorphisme
uin de Kn associé est l'identité) :
/l 0 ... o\
ln= ° ■'■ M.
I : "' °l
\0 ••• 0 1/
• Si A e Mn(K), alors
« A est inversible » <& « A a un inverse à droite » <=> « A a un inverse à gauche ».
A est inversible (resp. a un inverse à droite, resp. a un inverse à gauche) si et seulement si
c'est le cas pour ua ; les trois conditions sont donc équivalentes puisqu'on est en dimension
finie (cf. alinéa 5.4.2).
Une matrice de la forme A • ln, avec A e K, est dite scalaire, et souvent notée
simplement A; si A = A est scalaire, alors ua est l'homothétie de rapport A, et on a
AB = BA = AB pour tout B G Mn(K).
Une matrice n x n est diagonale si tous les coefficients non diagonaux sont nuls (une
matrice scalaire est diagonale), elle est triangulaire supérieure (resp. inférieure si tous les
coefficients en-dessous (resp. au-dessus) de la diagonale sont nuls (une matrice diagonale
est à la fois triangulaire supérieure et triangulaire inférieure) :
par exemple, les matrices D, A et B sont respectivement diagonale, triangulaire supérieure et
triangulaire inférieure,
/l 0 0\ /l 2 3\ /l 0 0\
D= 0 2 0 , A= 0 2 4 , B= 5 2 0 .
\0 0 0/ \0 0 5/ \2 0 5/
On dit qu'une matrice est triangulaire si elle est triangulaire supérieure ou inférieure.
• Si A est triangulaire inférieure (resp. supérieure), alors fcA est triangulaire supérieure
(resp. inférieure).
7. MATRICES
79
• Le produit de deux matrices diagonales est une matrice diagonale, le produit de deux
matrices triangulaires supérieures (resp. inférieures) est une matrice triangulaire
supérieure (resp. inférieure), et dans les trois cas, les coefficients diagonaux du produit sont
les produits des coefficients diagonaux.
A est diagonale si et seulement si Re* est stable par ua> pour tout i€{l,...,n}. Comme
cette condition est stable par composition, on en déduit le premier énoncé. De même, A est
triangulaire supérieure si et seulement si les sous-espaces V* = Kei ® • • • © Re* de Kn sont
stables par ua pour tout i € {1,.. .,n}. Comme cette condition est stable par composition,
on en déduit le fait que le produit de deux matrices triangulaires supérieures A = (<H,j) et
B = (bij) est une matrice triangulaire supérieure C = (cij). De plus, ujife) — b^ei € V^-i,
et donc UA(un(ei)) - b^u^ei) € V^-i puisque Vj_i est stable par ma- On en déduit que
«c(ei) - Q>i,ibitiei € Vi-i, et donc que c*,* = Oijbij, ce que l'on cherchait à établir. Le cas de
deux matrices triangulaires inférieures s'en déduisant en passant aux transposées, cela permet
de conclure.
• Une matrice triangulaire est nilpotente (resp. unipotente) si et seulement si ses
coefficients diagonaux sont nuls (resp. égaux à 1) ; de plus An = 0 si A est nilpotente.
Il suffit de traiter le cas nilpotent puisque A est unipotente si et seulement si A — 1 est
nilpotente. Maintenant, les coefficients diagonaux de Am sont les puissances n-ièmes des coefficients
diagonaux de A. S'il existe m tel que Am = 0, cela implique donc que les coefficients diagonaux
de A sont nuls. Réciproquement, si ces coefficients diagonaux sont nuls, on a«A(Vi) C Vi_i, si
Vi = Kei © • • • ©Ré*. Il en résulte que t*Afc(Kn) c Vn-k, et donc que An = 0 ; d'où le résultat.
A e Mn(K) est dite symétrique (resp. antisymétrique) si *A = A (resp. si *A = —A).
• Tout A G Mn(K) est, de manière unique, la somme d'une matrice symétrique et d'une
matrice antisymétrique.
A i-* *A est une symétrie du K-espace vectoriel Mn(K), et les matrices symétriques (resp.
antisymétriques) sont l'espace propre de cette symétrie associé à la valeur propre 1 (resp. —1).
Le résultat s'en déduit.
7.6. Déterminant d'une matrice carrée
7.6.1. Trace et déterminant d'une matrice
Si A = (ay)i^tj^n € Mn(K), on note IVA sa trace (c'est la somme J27=iai,i des
coefficients diagonaux).
• Tr(AB) = Tr(BA).
Si A = (ou) et B = (6,,*), alors Tr(AB) = YZ=i ( Ej-i <**,AO, et Tr(BA) = £?=1 ( £Li 6Ma*j),
et l'identité cherchée s'en déduit en remplaçant k par i dans la seconde somme.
Si A = (Oijji^jj^n € Mn(K), on définit son déterminant det A par la formule
n
det A = ^2 sign(a) Il a^W-
<r€S„ i=l
Alors det A est aussi le déterminant des colonnes de A dans la base canonique de Kn
(n° 6.2) ; c'est donc aussi le déterminant de Pendomorphisme u\ (n° 6.3).
80
VOCABULAIRE MATHÉMATIQUE
• det(AA) = Andet A, si A G Mn(K) et A G K.
C'est une conséquence de la n-linéarité du déterminant de n vecteurs.
• Si V est de dimension finie sur K, et si u G End(V), le déterminant de u est égal au
déterminant de la matrice de u dans n'importe quelle base.
Si ei,..., en est une base de V, la matrice de u dans la base e\,..., en est la matrice dont les
colonnes sont u(ei),... ,u(en) exprimés dans la base ei,..., en, et le résultat suit (cf. n° 6.3)
de ce que detu = detCl,...,en(^(ei),... ,u(en)).
• Si A G Mn(K), alors :
« det A^O» <*=> « ua est bijectif » 4=> « A est inversible ».
On note GLn(K) l'ensemble des matrice nxn vérifiant ces propriétés ; c'est le groupe des
éléments inversibles de l'anneau Mn(K).
« det A ^ 0 »<^ detUA ^0 <& «ua bijectif » <^ « ua a un inverse v » & « A a un inverse
Mat(v) ».
• det AB = (det A) (det B) si A,B G Mn(K) (Cauchy, 1815).
On a uab = ua°ub et donc detUAB = det(uA o ub) = (detUA) (detuo) = (det A) (det B),
puisque det(u o v) = (det u)(det v), cf. n° 6.3.
• SLn(K) = {A G Mn(K), det A = 1} est un sous-groupe de GLn(K).
D'après le point précédent, A ■-> det A est un morphisme de groupes de GLn(K) dans K*,
et SLn(K) est le noyau de ce morphisme; c'est donc un sous-groupe de GLn(K).
Exercice 7.1. On note B (resp. D) l'ensemble des matrices triangulaires supérieures (resp. diagonales)
dont les coefficients diagonaux sont non nuls, et U C B l'ensemble des matrices ayant des 1 sur la
diagonale.
(i) Montrer qu'une matrice diagonale A est inversible si et seulement si elle appartient à D. Quel est
l'inverse de A si c'est le cas? En déduire que D est un sous-groupe de GLn(K).
(ii) Montrer que T G B peut s'écrire de manière unique sous la forme AN, où A G D et N G U.
(iii) En déduire que B est un sous-groupe de GLn(K).
(iv) Montrer que T «-> A est un morphisme de groupes de B dans D. Quel est le noyau? En déduire
que U est un sous-groupe de GLn(K).
• On dit que À G K est une valeur propre de A G Mn(K), si c'est une valeur propre de «a,
ce qui équivaut à ce que Ua — A ne soit pas inversible, et donc à det(À — A) = 0.
7.6.2. Méthodes de calcul de déterminants
• detA = dettA.
Si a G Sn, on a sign(cj) = sign^"1). Donc det A = £a€Sn sign^"1) U7=i a°-l(°(ï)),°{ï)> et
on obtient det A = £r€Su sign(r) nJU <Mi'),i' = ETes„ si6n(r) lir=i 4,r(i')> où °*j = Hi
est le coefficient de la i-ème ligne et j-ième colonne de *A, en faisant le changement de variables
t = a"1 et i' = a(i). On reconnaît alors dans le membre de droite la définition de det*A, ce
qui permet de conclure.
• Si A est triangulaire, son déterminant est le produit des termes diagonaux.
7. MATRICES
81
Si a ^ id, il existe au moins un i tel que a(i) > i et un i tel que <j{i) < «, et le terme
lir=i ai,<r(.i) es^ nul> s* ^ est triangulaire supérieure ou inférieure. Le seul terme qui contribue
à det A est donc a = id, ce qui permet de conclure.
• det A ne change pas si on rajoute des multiples d'une ligne fixée aux autres ou des
multiples d'une colonne fixée aux autres; si on fait une permutation des lignes ou des
colonnes, il est multiplié par la signature de la permutation.
L'énoncé concernant les colonnes vient juste de ce que le déterminant est une forme linéaire
alternée sur les colonnes de la matrice ; on ramène le cas des lignes à celui des colonnes en
prenant la transposée.
Par exemple, en échangeant la première et la dernière ligne, puis en retranchant 3 fois la première
(resp. 2 fois) à la seconde (à la troisième), puis en échangeant la seconde et la dernière colonne, puis en
ajoutant 2 fois la troisième ligne à la dernière, on obtient :
0 1
3 2
2
-1
3
2
0
5
-2
-1
1 3
3 2
2 4
0 1
1 -1
0 8
0 0
0 0
2
-1
3
2
-1
5
-2
0
2
-7
-1
2
3
-7
-2
1
=
13 2-1
0-7-7 8
0 -2 -1 0
0 12 0
1-12 3
0 8 -7-7
10 0 -1 -2
0 0 0-3
= l-8-(-l)-(-3) = 24.
Si A € Mn(K), et si 1 ^ a, (3 ^ n, on note ka^ la matrice (n — 1) x (n — 1) obtenue
en retirant la a-ième ligne et la /?-ième colonne de A, et \Aa^\ son déterminant.
• Si a G {1,... ,n}, alors det A = Y^=i(~l)a+/3aa,/3|Aa,/3| (développement par rapport
à la a-ième ligne) et, si (3 € {1,... ,n} det A = YZ=i(~ l)a+/3aa,/3|AQ,/3| (développement
par rapport à la (3-ième colonne).
On ramène l'énoncé concernant le développement par rapport à une colonne à celui par
rapport à une ligne en passant à la transposée.
Posons A(A) = Z)/?=i(-1)a'H?aa,/3|Aa,/?|. On doit vérifier que A(A) = det A pour tout A.
o Si A = ln, on a \Aatp\ = 0 si /? ^ a car on a supprimé deux 1 de la matrice, et donc il
ne reste que n - 2 coefficients non nuls et le produit de n — 1 coefficients est toujours nul. Si
/3 = a, on a Aa,p = ln-i> et donc |AQ>^| = 1. On obtient donc A(ln) = 1 = det ln.
o Pour conclure, il suffit donc de prouver que A i-> A(A) est n-linéaire alternée en les
colonnes de A puisqu'il existe une unique telle forme prenant la valeur 1 sur la base canonique
de Kn. La n-linéarité est évidente sur les formules ; vérifions que A(A) change de signe quand
on permute deux colonnes consécutives de A. Soit donc &€ {l,...,n — l},et soit A' la matrice
obtenue en échangeant les deux colonnes d'indice A; et A; + 1 de A. Alors |A^(/3| = — \Aatp\
sauf si p = A; ou 0 = k + 1, et on a \A.'ak\ = |Aa>jk+i| et |A^fc+1| = |AQ>fc|, ainsi que
aa,k = ûa.Jfc+i et a'ak+l = aQtk On obtient donc A(A') = E^fc,&+i(-1)ot+^+1Oa>/3|Aû,/3| +
(-l)0+/V*+l|A0.*+l| + (-l)Û+/3+1ûa,fc|Aa,ifc| = -E/j(-l)°+/V/j|Aa,/j| = -A(A).
Ceci permet de conclure.
82
VOCABULAIRE MATHÉMATIQUE
Par exemple, en développant par rapport à la première ligne, puis en développant les déterminants
3x3 par rapport à la première colonne, et enfin en utilisant la formule | ° £ | = ad — 6c, on obtient :
0 12 0
3 2-15
2 4 3-2
13 2-1
= -
—(
3
2
1
'3
-1
3 -
2 -
3 -2
2 -1
5
-2
-1
-
+ 2
2
-]
2
3 2
2 4
1 3
L 5
-1
5
-2
-1
+
-1 5
3 -2
)+2(3
4 -2
3 -1
-2
2 5
3 -1
-
2 5
4 -2
)
= -(31-2. (-9) + 1 • (-13)) + 2(3 • 2 - 2 • (-17) + 1 • (-24)) = -8 + 32 = 24.
• Soient cof(A) = ((—l)a+^\Aa^\)a^^n la matrice des cofacteurs de A et ^offA) sa
transposée. Alors AWfA) = (det A) • ln = WfA) A ; si det A ^ 0, alors A"1 = -^^ foffA).
En développant det A par rapport à la a-ième ligne, on obtient det A = ^"=1 (- l)a+/*a;a j \Aaj |.
Si a' ^ a, alors S"=i(~l)a+^a^|Aaj| est le déterminant de la matrice obtenue en
remplaçant la a-ième ligne de A par la a'-ième, et comme la matrice ainsi obtenue a deux lignes
égales, son déterminant est nul. On a donc Z)"=i#a'j|Aaj| = 0, si a' ^ a. Les identités
ci-dessus sont équivalentes à A*cof(A) = (det A) • ln. La formule (det A) • ln = *cof(A) A se
démontre de même, en considérant les colonnes au lieu des lignes.
• Soient «i,..., an G K. Le déterminant de Vandermonde VdM(«i,..., an) est le
déterminant dont la i-ième ligne est 1, a*,..., aj1"1 ; on a VdM(«i,..., an) = Yli<j(aj - aj,
et donc VdM(ai,..., an) = 0 si et seulement si deux des a» sont égaux.
On soustrait la première ligne aux autres, ce qui fait apparaître des 0 dans la première
colonne, puis ai x la i-ième colonne à la (i + l)-ième, pour 1 ^ % ^ n- 1. On peut alors mettre
en facteur ai - ot\ en facteur dans la i-ième ligne, et le déterminant qui apparaît est égal à
VdM(a2, • • -, an), et donc VdM(ai,..., an) = VdM(a2,. -., ocn) Y\^=2(ai - ai). On conclut
par récurrence.
Exercice 7.2. Montrer que det A = 0 si A G Mn(K) est antisymétrique et si n est impair.
Exercice 7.3. (déterminant de Cauchy) Soient a* et bj, pour 1 ^ i, j ^ n des éléments d'un corps K,
tels que ai+bj ^ 0 pour tous i, j. Calculer le déterminant C(ai,..., an, &i,..., bn) de la matrice des jj^jt-
(On pourra retirer la première ligne aux autres.)
Exercice 74. (déterminant circulant) Soient a0,... ,an_i G C et soit A = (ar^j))o^ij^n-u où
r(k) G {0,..., n -1} est le reste de la division de k par n. Montrer^62* que det A est un produit de formes
linéaires en les ai. (On pourra considérer le produit de A par B = (vij)o^ij^n-i, où 7/ = e2i7r/n.)
(G2)Si on utilise Z/nZ au lieu de {0,..., n - 1} pour numéroter les aiy la matrice A devient celle des ai+j,
pour i,j G Z/nZ. On peut remplacer Z/nZ par n'importe quel groupe fini G, et regarder le déterminant
de la matrice des agh, pour g.heG (on obtient un polynôme homogène de degré |G| en |G| variables). La
factorisation de ce déterminant par Frobenius est à l'origine de la théorie des caractères ; la présentation
moderne de la théorie, via le lemme de Schur (th. 1.2.9), occulte complètement cet aspect.
7. MATRICES
83
Exercice 7.5. (i) Soit a € C* et, si n ^ 1, soit An € Mn(C) la matrice avec des a + a-1 sur la
diagonale, des 1 juste en-dessous et juste au-dessus de la diagonale, et des 0 partout ailleurs. Montrer
n +1 —1 — n
que det An = ° al£-i— si a ^ ±1. Que vaut det An si o = ±1 ?
(ii) Soit Un la matrice nxn ayant des 0 sur la diagonale, des -1 juste en-dessous et juste au-dessus de
la diagonale, et des 0 partout ailleurs. Montrer que les valeurs propres de cette matrice sont les 2 cos ^py,
pour 1 < k ^ n.
Exercice 7.6. Soit A = (aitj) € Mn(Z), avec aiyj = pgcd(i, j). Montrer que det A = nïLi ¥>(*)» ou *P
est la fonction indicatrice d'Euler. (On pourra commencer par montrer que J2d\n vK^) = n.)
7.6.3. Calcul du rang d'une matrice
Si A € Mnxm(K), et si r ^ inf(n,m), un mineur d'ordre r de A est le déterminant
d'une matrice r xr obtenue en ne gardant que r lignes et r colonnes de A (il y a (") (™)
tels mineurs, un pour chaque choix de r lignes parmi n et de r colonnes parmi m).
• Soient v\t..., vr des vecteurs de Kn, et soit A G Mnxr(K) la matrice dont les colonnes
sont wi,..., vr. Alors V\,..., vr est une famille libre si et seulement si r ^ n et il existe un
mineur d'ordre r de A qui est non nul.
La condition r ^ n est obligatoire car une famille libre de Kn a au plus n éléments. Supposons
la donc satisfaite. Si I C {1,... ,n} est de cardinal r, le mineur obtenu en ne gardant que les
lignes de A d'indice dans I est aussi égal, au signe près, au déterminant de vi,..., vr et des e,-,
pour j £ I. Le résultat suit donc du th. de la base incomplète dont il résulte que vi,..., vr est
libre si et seulement si on peut compléter vi,..., vr par des ej pour obtenir une base de Kn.
• Si A G Mnxm(K), le rang de A est le maximum des ordres des mineurs non nuls de A.
C'est une traduction du point précédent. Comme les mineurs de A et 4A sont les mêmes, on
retrouve le résultat selon lequel le rang d'une matrice est égal à celui de sa transposée.
7.7. Matrices à coefficients dans un anneau
Si A est un anneau commutatif, on note Mnxm(A) l'ensemble des matrices à n lignes et
m colonnes à coefficients dans A. Alors Mnxm(A) est, de manière naturelle, un A-module
avec l'addition et la multiplication par un scalaire définies composante par composante.
Si A = (dij) G Mnxm(A) et B = (bjtk) G Mmx*(A), on définit le produit AB de A et B
par AB = (c,,*) G Mnx*(A), avec c*,* = Y%Li ai,jbj,k-
On note simplement Mn(A) l'ensemble des matrices carrées n x n à coefficients dans A,
et si A G Mn(A), on définit son déterminant det A G A par la formule habituelle
n
det A = ^2 sign(a) II^W"
a€S„ i=l
Toutes les formules des nos 7.2, 7.5 et 7.6 sont encore valables dans ce cadre. La raison
en est que l'on peut considérer les coefficients des matrices intervenant dans les formules
comme des variables, et on est alors ramené à prouver que des polynômes à coefficients
dans Z en ces variables coïncident. Pour ce faire, il suffit de prouver que les fonctions
polynomiales complexes qu'ils définissent sont les mêmes, ce qui est assuré par le fait que
84
VOCABULAIRE MATHÉMATIQUE
la formule qui nous intéresse est vraie pour des matrices à coefficients dans C. Les énoncés
dont il s'agit sont les suivants.
• A(BC) = (AB)C, A(Bi + B2) = ABi + AB2 et (A! + A2)B = AiB + A2B.
• l(AB) = S'A.
• Si A = À est scalaire, alors AB = BA = ÀB pour tout B € Mn(A).
• Le produit de deux matrices diagonales (resp. triangulaires supérieures, resp.
triangulaires inférieures) est une matrice diagonale (resp. triangulaire supérieure, resp.
triangulaire inférieure).
• det AB = (det A)(detB) et det A = det'A.
• Si A est triangulaire, son déterminant est le produit des termes diagonaux.
• Le déterminant d'une matrice est une forme multilinéaire alternée des colonnes ou des
lignes de la matrice ; il ne change pas si on rajoute des multiples d'une ligne (resp. colonne)
fixée aux autres ou si on rajoute à une ligne (resp. colonne) une combinaison linéaire des
autres.
• Le déterminant d'une matrice peut se calculer en développant par rapport à une ligne
ou une colonne.
• Afc>f(A) = (det A)ln = W(A) A.
• Le déterminant de Vandermonde VdM(ai,... ,an) est égal à Yli<j(aj ~ ai)-
Par exemple, si on veut prouver la formule detAB = (det A) (det B) pour des matrices
A = (aij),B = (bij) G Mn(A), où A est quelconque, on commence par travailler dans
l'anneau Aiiniv des polynômes à coefficients dans Z en les variables Aij et Bij pour 1 ^ i, j ^ n
(si n = 2, on a Alllliv = Z[Alfl, A1|2, A2|i, A2|2,Bili,B1|2,B2li,B2l2])- Soient Alllliv = (A<fi)
et Buniv = (Bij) ; ce sont des éléments de Mn(Au„jV) que Ton voit comme un couple uni-
versel de matrices n x n dans le sens où tout couple d'éléments de Mn(A), pour un
anneau commutatif A, s'obtient en donnant des valeurs dans A aux A^ et aux Bij. Alors
R = det(A„nivB„„iv) - (det A,iniv)(detB„„iv) est un élément de A„„iV. La fonction polynomiale
qu'il définit sur Mn(C) x Mn(C) est identiquement nulle puisque detAB = (det A)(detB), si
A, B G Mn(C). On a donc R = 0, et la fonction polynomiale définie par R sur n'importe quel
anneau A est identiquement nulle, ce qui prouve que detAB - (detA)(detB) = 0, pour tous
A,B G Mn(A), quel que soit A.
Exercice 7.7. On se place dans l'anneau Z[Xi,...,Xn].
(i) Quel est le degré en Xn de VdM(Xi,... ,Xn) et quel est le coefficient dominant? (On pourra
développer par rapport à la dernière colonne.)
(ii) Calculer VdM(Xi,... ,Xn) ; en déduire que VdM(ai,... ,an) = Hi<j(ai "" ai)> si ai> ■ ■ ■ >a" aP"
partiennent à un anneau commutatif A quelconque.
Si À est un anneau, Mn(A) est un anneau, et même une À-algèbre unitaire, puisque
la multiplication est associative et distiïbutive par rapport à l'addition (cf. premier point
ci-dessus).
• A G Mn(À) est inversible si et seulement si det A G À* ; on note GLn(À) le groupe des
éléments inversibles de l'anneau Mn(À).
7. MATRICES
85
Si B est l'inverse de A, alors detB est l'inverse de det A puisque detAB = (detA)(detB).
Réciproquement, si det A est inversible, alors A l'est et son inverse est (det A)-ltcof(A).
• L'ensemble SLn(A) des A € Mn(A) vérifiant det A = 1 est un sous-groupe de GLn(A).
C'est le noyau du morphisme de groupes A i-» det A.
• Si <p : Ai —> A2 est un morphisme d'anneaux, alors (oij) i-> {^{a^)) induit des mor-
phismes d'anneaux (p : Mn(Ax) —► Mn(A2) et de groupes tp : GLn(Ax) —► GLn(A2) et
p : SLn(Ax) - SLn(A2).
La vérification est un peu fastidieuse mais complètement automatique.
Exercice 7.8. Montrer que l'ensemble B(A) des matrices triangulaires supérieures de Mn(A) dont les
coefficients diagonaux sont inversibles est un sous-groupe de GLn(A).
Exercice 7.9. Soit D ^ 1 un entier.
(i) Montrer que l'ensemble T(D) des (* £) € SL2(Z) telles que D divise o — l,d - 1,6 et c, est un
sous-groupe de SL2(Z).
(ii) Montrer que l'ensemble To(D) des (" j}) € SL2(Z) telles que D divise c, est un sous-groupe de
SLa(Z).
7.7.1. Polynôme caractéristique et trace
Si A G Mn(A), on définit le polynôme caractéristique CarA € A[X] de A comme le
déterminant de X - A e Mn(A[X]).
• Si A = (ciij) e Mn(A) est triangulaire supérieure, alors CarA = ECLiP^ — aij)-
X-A est triangulaire supérieure ; son déterminant est donc le produit des termes diagonaux
X-ai,i,. ..,X-ûn)„.
• Une matrice et sa transposée ont le même polynôme caractéristique.
On a \X - A) = X - *A, et donc det(X - 'A) = det(X - A).
• Deux matrices semblables ont le même polynôme caractéristique : CarpAP-1 = CarA si
P e GLn(A).
Si B = P_1AP, alors X - B = P_1(X - A)P puisque X est une matrice scalaire, et donc
det(X - B) = (detP-^detCX - A))(detP) = det(X - A).
• Si À est un corps K, les valeurs propres de A sont les racines de CarA-
À G K est une valeur propre de A, si et seulement si ua - A n'est pas inversible, et donc si
et seulement si det(À - A) = 0.
• CarA = Xn - (Tr A)Xn~x H h (- l)n det A ; en particulier CarA est unitaire, de degré n.
Le terme constant de CarA est det(-A) = (-l)ndetA. Maintenant, si on revient à la
définition du déterminant, on voit que le seul terme comportant des termes enXn et Xn-1 est
celui correspondant à a = id. Il s'ensuit que CarA - IlILi^ ~" ûm) est de degré ^ n - 2, et
donc que CarA = Xn - QXi a^X71'1 + • • • D'où le résultat.
• CarAB = CarBA si A, B G Mn(K) ; en particulier, Tr(AB) = Tr(BA).
L'identité CarAB = CaroA a été établie dans la rem. 4.8. La formule Tr(AB) = Ti'(BA) s'en
déduit en identifiant les termes de degré n-1.
86
VOCABULAIRE MATHÉMATIQUE
• Si V est un K-espace vectoriel de dimension finie, et si u G End(V), le polynôme
caractéristique de la matrice de u dans une base ne dépend pas du choix de la base ; on le
note Carn : c'est le polynôme caractéristique de u ; les valeurs propres de u sont les racines
de Caiv
Comme les matrices A et B de u dans deux bases différentes sont semblables (B = PAP-1),
l'indépendance du choix de la base résulte de ce que deux matrices semblables ont le même
polynôme caractéristique; le reste en découle en choisissant une base quelconque deV.
• Si Caru est scindé sur K, il existe une base de V dans laquelle la matrice de u est
triangulaire supérieure ; les coefficients diagonaux sont alors les racines de Caru (i.e. les
valeurs propres de u) répétées avec multiplicité.
Le second énoncé est une conséquence de ce que Car a = Iir=i(^ ~~ ûm)> si A = (a^) est
triangulaire supérieure.
La démonstration du premier se fait par récurrence sur n = dim V ; il n'y a rien à prouver
si n = 1. Supposons donc n ^ 2. Comme Caru est scindé, u a au moins une valeur propre Ai.
Soit ei un vecteur propre non nul pour Ai, et soit Vx = K e\. Soit W un supplémentaire de Vx
dans V et soit p la projection sur W parallèlement à Vi. Alors la restriction de pou à W est un
endomorphisme de W et l'hypothèse de récurrence nous fournit une base e2,..., en de W dans
laquelle la matrice Ai de pou est triangulaire supérieure. Celle de u dans la base ei, e2,..., en
est alors ( ^ Jpx ), où C = (a2, • • •, ocn) et a^ei = u(ek) — p o u(ek) est la projection de u{ek)
sur Vi parallèlement à W ; elle est donc triangulaire supérieure, ce qui permet de conclure.
Théorème 7.10. (Cayley-Hamilton, 1858) Si À est un anneau commutatif et si
A G Mn(À), alors CarA(A) = 0; autrement dit une matrice est annulée par son
polynôme caractéristique.
Soit A,„iiv l'anneau Z[Xij, 1 < t,j ^ n], et soient A,„iiV = O^ij) S Mn(AulliV) et
B„niv = CarAmiiv(Alllliv) 6 Mn(Alllliv). Il suffit de prouver que Blllliv = 0 (car CarA(A) est
la valeur de Blllliv en Xitj = a^-, pour 1 ^ i, j ^ n, si A = ((Hj) 6 Mn(A), où A est un anneau
commutatif quelconque) et, pour ce faire, il suffit de prouver que les fonctions polynormales
définies par les coefficients de Bu„jV sont identiquement nulles sur Mn(C). Autrement dit, on
peut supposer A = C.
Comme C est algébriquement clos, il existe (cf. point précédent) une base /i,..., fn de Cn
dans laquelle la matrice (cij) de ua est triangulaire supérieure, et alors Car a = Tl^iQL-Cij).
Si 1 ^ i ^ n, soit V* le sous-espace de Cn engendré par fu... ,/* (on a donc Vn = Cn et
on pose V0 = {0}). Alors (ua - Q,i)(Vi) C V*_i, puisque (cij) est triangulaire supérieure, et
une petite récurence montre que (Yiii=k(uA - (Hti))(Cn) C V^_i, si k ^ n. Pour k = 1, cela
prouve que (CarA(^A))(Cn) = {0}, et donc que CarA(uA) = 0 et CarA(A) = 0 car CarA(tiA)
est l'endomorphisme de Cn associé à Cai%A(A).
Si dimV = n, on a Cartt(X) = Xn - Tr^X71"1 + • • • + (-l)ndetu, où Tr(u) est, par
définition, la trace de u : c'est la somme des termes diagonaux de la matrice de u dans
une base quelconque de V.
• Si «i,«2 G End(V), alors Tr(«i«2) = Tr(«2«i).
Le choix d'une base permet de déduire l'énoncé du résultat correspondant pour les matrices.
7. MATRICES
87
7.8. Matrices par blocs
Sin = (ni,..., nr), on pose |n| = ni H \-nr. Si n = (m,... ,nr) et m = (rai,.. . ,ras),
et si A = {aat/s) G M|„|X|m|(A), on peut écrire A par blocs sous la forme (A^)^.,^, où
GM„iXmi(A).
Par exemple, sin = 3 = l + 2etm = 4=l+3:
l°\ i i)=(£;! £) •avecAw -(1)-Ai'2=(2'M)-A"=G) •A™=C 21) ■
8 1^ 4/
La décomposition par blocs induit un isomorphisme de M|n|x|m|(A) sur l'espace Mnxm(A),
des matrices par blocs (Ajj)^r>^, où Aitj G MniXmj.(A), pour tout A.
Maintenant, si £ = (£i,... ,£t), on peut utiliser l'isomorphisme précédent pour définir
le produit
M„xm(A) x Mmx*(A) ^ M|„|XH(A) x MMx,£|(A) -> MWx|fl(A) = M„X*(A)
des matrices par blocs.
• Ce produit peut se calculer par blocs : si A = (A^-)^^ et si B = (B^)^^ sont
deux matrices par blocs avec Aiyj G Mn.xmj.(A) et B^ G MmiX4(A), le produit C = AB
est la matrice par blocs (Ci)jfc)i<r> k<t, où Citk = £J=i KjBj>k.
Par exemple, si on découpe A G Mnxm(A) suivant ses lignes X*A = (a^i,... ,ai)m) et
B G Mmx^(A) suivant ses colonnes Xk)s = Xh^,... ,bmik), alors AB est la matrice par
blocs (ses blocs sont des matrices lxl) des X*AX/k(B = Y%Li aî,A>
La formule AB = (X*AXk,Ti)i^n, k^e est immédiate sur la définition du produit de deux
matrices. On en déduit que (a,,)(B', B") = (£%, filg„ ) en découpant A' et A" en lignes et B' et
B" en colonnes. Maintenant, si A = (ai,j) € Mnxm(A) est découpé sous la
forme A = (A',A"), avec A' = (o^) € Mnxmi(A), A" = (aitj+mi) € Mnxm2(A), et si
B = (fy.fc) € MmX£(A) est découpé sous la forme B = (3,,), avec B' = (6J)&) € MmiX£(A),
B" = (bj+muk) € Mm2xC(A), l'identité AB = A'B' + A"B" est une traduction de la
décomposition YÏJLi a>i,jbj,k = Ejl'i ai,3b3,k+T,?2i Oi,j+m1&j+m1,&. On a donc vérifié le résultat dans le
cas d'un découpage en deux blocs. Le cas général s'en déduit par récurrence sur la somme des
nombres de colonnes et lignes de blocs : quand on découpe une ligne de blocs ou une colonne
de blocs en deux, on rajoute des produits de blocs 1 x 2 et 2 x 1 que l'on sait traiter.
Si n = ra, r = s et ni = rai,... ,nr = rar, on obtient des matrices carrées par blocs.
On note simplement Mn(A) l'espace des matrices carrées n x n par blocs. Le produit de
deux éléments de Mn(A) est encore un élément de Mn(A).
Une matrice carrée par blocs est dite diagonale (resp. triangulaire supérieure, resp.
triangulaire inférieure) si tous les blocs en dehors (resp. en-dessous, resp. au-dessus) de la
diagonale sont nuls ; elle est triangulaire si elle est triangulaire inférieure ou supérieure.
• Le produit de deux matrices diagonales (resp. triangulaires supérieures, resp. trian-
88
VOCABULAIRE MATHÉMATIQUE
gulaires inférieures) par blocs est une matrice diagonale (resp. triangulaire supérieure,
resp. triangulaire inférieure) par blocs.
Si t € {1,... r}, on note V* le sous-espace de K|n| engendré par eni+...+ni_l+i,..., eni+...+n..
Alors A est diagonale par blocs si et seulement si V$ est stable par ua, pour tout i G {1,..., 5}
et A est triangulaire supérieure si et seulement si les sous-espaces Vi © • • • © V* de K'n' sont
stables par ua pour tout ie{l,...,r}. Comme ces conditions sont stables par composition,
on en tire les deux premiers énoncés. Le cas triangulaire inférieur s'en déduit en passant aux
transposées.
• Le déterminant d'une matrice triangulaire par blocs est le produit des déterminants des
blocs diagonaux.
Le cas triangulaire inférieure se ramène au cas triangulaire supérieure en prenant la
transposée. Par ailleurs, une récurrence immédiate montre qu'il suffit de traiter le cas d'une matrice
2x2 par blocs. Soit donc A = (A^-) G M(ni>n2)(A) une matrice triangulaire supérieure. On
note (aa,£)a,/^ni+n2 les coefficients de A. L'hypothèse selon laquelle A est triangulaire
supérieure par blocs se traduit par le fait que aa^ = 0 si a ^ ni et (3 > rt\. Il s'ensuit que dans
le déterminant det A = X)a€Sn +n sign(a) ria=în2 aa,a(a)> les seuls termes non nuls sont ceux
correspondant aux g qui stabilisent Ii = {1,... ,ni} et donc aussi I2 = {ni + 1,... ,ni + 712}.
Une telle permutation s'écrit alors sous la forme g\02, où ai est une permutation de I*, que
l'on voit comme une permutation de {1,... ,ni +n2} laissant fixe h-û et cette écriture induit
un isomorphisme de Perm(Ii) x Perm(I2) sur le sous-groupe de Sni+n2 stabilisant Ii et I2.
Comme sign(ai<72) = sign(ai)sign(<72), on obtient
222 2
det a = ]r risisn(aon n a<w*)=n (x^s^) n **.**«))=ndet ^
ce que l'on voulait.
8. Fragments de théorie des corps (commutatifs)
Tous les corps de ce § sont supposés commutatifs.
• Si F est un corps, et si (p : F —> A est un morphisme d'anneaux où A ^ {0}, alors (p est
injectif. Un morphisme ip d'un corps F dans un anneau A ^ {0} s'appelle un plongement
de F dans A. Si F C K sont des corps, et si (p est un plongement de F dans K, un
prolongement de y? à K est un plongement de K dans A dont la restriction à F est ip.
• Si K est un corps, et si u : A —> K est une injection d'anneaux (A est donc intègre),
alors l se prolonge en une injection de corps de Fr(A) dans K, en posant i(|) = 4g.
• Si F est un corps, il existe un unique morphisme d'anneaux de Z dans F, et on dit que
F est de caractéristique 0 si ce morphisme est injectif, auquel cas F contient Fr(Z) = Q-
Dans le cas contraire, comme l'image de Z dans F est intègre (et que c'est un quotient
de Z et donc de la forme Z/DZ), il existe un nombre premier p tel que cette image soit
le corps Fp à p éléments, auquel cas on dit que F est de caractéristique p. Alors F est un
Fp-espace vectoriel et on a, en particulier, px = 0, pour tout x € F.
8. FRAGMENTS DE THÉORIE DES CORPS (COMMUTATIFS)
89
• Si F est de caractéristique p, alors ip : F —► F, défini par ip(x) = xp, est un morphisme
(le morphisme de Frobenius) de corps.
On a (p{\) = 1, <p(xy) = (xy)p = xpyp = <p{x)<p{y) et, comme (?) est divisible par p si
1 ^ i < p - 1, on a <p(x + y) = {x + y)p = xp + £?"* (î)aV~* + ï/p = *p + Vp = ¥>(*) + <p(v)-
Ceci permet de conclure.
On rappelle que si F est un corps, et si P € F[X] est irréductible, l'idéal engendré par P
est maximal et donc F[X]/P est un corps, ce qui nous fournit un procédé de construction
de corps. Plus généralement, si A est un anneau commutatif, et si I est un idéal distinct
de A, on peut trouver un idéal maximal*63* m qui contient I, et alors A/m est un corps.
8.1. Sous-extensions finies
Si F et K sont des corps, avec F c K, on dit que F est un sous-corps de K et que K
est une extension de F. Alors K est un espace vectoriel sur F et sa dimension, en tant
qu'espace vectoriel sur F, est le degré [K : F] de l'extension K/F. On dit que K est une
extension finie de F si [K : F] < +oo ; dans le cas contraire, on dit que K est une extension
infinie de F.
Si K est un corps, et si Z est un sous-ensemble de K, l'intersection de tous les sous-corps
(resp. sous-anneaux) de K contenant Z est un sous-corps (resp. sous-anneau) de K : c'est
le sous-corps (resp. sous-anneau) de K engendré par Z.
— Si F est un sous-corps de K et si a € K, on note respectivement F(a) et F[a] les
sous-corps et sous-anneau de K engendrés par F et a.
— Plus généralement, si ai,...,an € K, on note respectivement F(ûi,... ,an) et
F[«i,..., an] les sous-corps et sous-anneau de K engendrés par F et ai,..., an.
— Si Fx,F2 sont deux sous-corps de K, on note Fi • F2 le sous-corps de K qu'ils
engendrent.
• Si K/F est une extension de corps et si M est un sous-F-espace vectoriel de dimension
finie ^ 1 de K, stable par multiplication, alors M est un sous-corps de K.
L'hypothèse selon laquelle M est un sous-F-espace vectoriel de K implique que c'est un
sous-groupe additif. Comme il est stable par multiplication par hypothèse, il suffit de prouver
1 € M et que tout élément non nul 7 de M a un inverse dans M. Soit a € M—{0}. L'application
x i-> ixa de M dans M est F-linéaire ; par ailleurs elle est injective car 7 est inversible dans K ;
elle est donc surjective puisque M est de dimension finie, et il existe x € M tel que 7x0; = a,
ce qui implique que *yx = 1, et donc que 1 € M et que x est l'inverse de 7. Ceci permet de
conclure.
• Si K est une extension finie de F, et si L est une extension finie de K, alors L est une
extension finie de F et on a [L : F] = [L : K] [K : F].
Supposons que [K : F] = r et [L : K] = s. Soient ai,..., ar une base de K sur F et fa,...,0a
une base de L sur K. Les aiiPj, pour 1 ^ i < r et 1 ^ j < s, sont des éléments de L ; montrons
qu'ils forment une base de L sur K, ce qui permettra de conclure.
^L'existence d'un tel idéal, pour un anneau quelconque, repose sur l'axiome du choix.
90
VOCABULAIRE MATHÉMATIQUE
• Soit a; G L. Comme les fy forment une base de L sur K, on peut écrire x sous la forme
x = J23j=i xjPj> avec xj e K> et comme les ai forment une base de K sur F, on peut écrire
chaque Xj sous la forme £X=i xjAau avec Xij e F. On en déduit que x = J2j=i J2l=i xjAaiPj
est combinaison linéaire des aifij à coefficients dans F, et que les aify forment une famille
génératrice de L sur F.
• Si J?j=i T,i=ixj>i<*iPj = °> avec xiJ e F, on a £J=1 (J2i=iXj,i<*i)0j = 0. Or les fy
forment une famille libre sur K et^J=1 Xj^oti G K ; on a donc J2l=i xjAai = 0 Pour tout h et
comme les a* forment une famille libre sur F et xij € F, on en déduit la nullité des Xitj, ce
qui prouve que les otiPj forment une famille libre sur F.
Ceci permet de conclure.
• Soient F un corps et L une extension de F. Si Fi, F2 sont deux extensions finies de F
contenues dans L, il existe une extension finie K de F, contenue dans L, et contenant Fx
et F2. En particulier, Fi • F2 est une extension finie de F.
Si 1 = ai,... ,ar (resp. 1 = /?i,... ,0S) est une famille génératrice de F! (resp. F2), on peut
prendre pour K le sous-F-espace vectoriel de L engendré par les otiPj. En effet, K contient Fi
(resp. F2) car il contient les a* = otiPi (resp. les Pj = a\Pj) ; de plus,
K est de dimension finie < rs sur F.
K contient ap si a € Fi et p € F2 (il suffit d'écrire a = ^I=1 ai<*i et /? = £J=1 bj0jy
où les Oi et bj appartiennent à F, et de développer) ; il contient donc les {otiPj){ockPt) =
(ai<Xk)(PjPe), ce qui permet de montrer qu'il est stable par multiplication.
On peut donc conclure en utilisant le premier point.
8.2. Algébricité, transcendance
• Les conditions suivantes sont équivalentes (on dit que a est algébrique sur F si elles sont
vérifiées, dans le cas contraire on dit que a est transcendant sur F) :
(a) l'extension F(a)/F est finie,
(b) il existe une extension finie F' de F contenue dans K et contenant a,
(c) il existe P e F[X], non nul, tel que P(a) = 0.
• (a)=>(b) est une évidence (prendre F' = F(a)), et sa réciproque aussi puisque F(a) c F'.
• Si a € F' et si [F' : F] = d, alors l,a,... ,ad forment une famille liée dans le F-espace
vectoriel F' qui est de dimension d. Il existe donc ao,...,a,d € F, non tous nuls, tels que
Ht=oaiai = °> et on Peut Pendre P = X)t=oa*xi Pour démontrer l'implication (b)=>(c).
• Si P(a) = 0, avec P € F[X] de degré n ^ 1, on peut écrire an sous la forme an =
an-ian~l H + ûo, avec û0> • • • >an_i € F. Il en résulte que le sous-F-espace vectoriel M
de K engendré par l,a,... ,an_1 est stable par multiplication par a; il l'est donc aussi par
multiplication par a1, pour tout i € N, et donc aussi par toute combinaison linéaire J2?=o ^iai-
Autrement dit, il est stable par multiplication, et comme il est de dimension finie sur F, c'est
un sous-corps de K d'après le premier point du n° 8.1. On en déduit l'implication (c)=^(b), ce
qui permet de conclure.
• Si a est algébrique sur F, l'ensemble des Q G F[X] tels que Q(a) = 0 est un idéal non
nul de F[X] ; son générateur unitaire P (le polynôme minimal de a) est irréductible, et
F(a) est isomorphe à F[X]/P.
8. FRAGMENTS DE THÉORIE DES CORPS (COMMUTATIFS)
91
Que l'ensemble des Q G F[X] tels que Q(a) = 0 soit un idéal de F[X] est une évidence ; il
est non nul car a est supposé algébrique. Si P est le générateur unitaire, et si P = P1P2, avec
Pi,P2 unitaires, alors Pi(a)P2(a) = 0, ce qui implique que Pi(a) = 0 ou P2(a) = 0 puisque
L est un corps. Il s'ensuit que P divise Pi ou P2, et donc lui est égal pour des questions de
degré ; le polynôme P est donc irréductible.
Maintenant, F(a) étant un sous-anneau de K contenant F et a, il contient tout polynôme
en a à coefficients dans F; autrement dit, il contient l'image L de F[X] par l'application
Q h-* Q(a). Or le noyau de cette application est l'idéal engendré par P; elle induit donc un
isomorphisme du corps F[X]/P sur L, et donc L est un sous-corps de K contenant F et a, et
donc aussi F(a). On en déduit que L = F(a), ce qui permet de conclure.
• Si a est algébrique sur F, et si P est son polynôme minimal, alors [F(a) : F] = degP
(c'est le degré de a sur F).
Soit P = Xd + ad-iXd~l + • • • +a0 G F[X], irréductible. Compte-tenu du point précédent, il
suffit de prouver que K = F[X]/P est une extension de degré d de F et, pour ce faire, il suffit
de prouver que 1, X,..., X^"1 forment une base de K sur F.
• Ils forment une famille libre, sinon il existerait 6o>--->&d-i> non tous nuls, tels que
J2i=o biX* = 0, ce qui se traduit par la divisibilité de J2i=o ^î^ Par P et est absurde pour
des raisons de degré.
• Pour prouver qu'ils forment une famille génératrice, il suffit de prouver que Xn est une
combinaison linéaire de 1, X,..., X^"1, pour tout n G N. C'est clair pour n ^ d-\ ; pour n ^ d,
si X-1 = Eto Cn-uX*, on a X» = EÏo cn-i,iXm = Eto c^X*, avec c*,, = c*-„-!-*,
ce qui permet, par récurrence, de conclure.
On dit que a, (3 G K, algébriques sur F, sont conjugués sur F, s'ils ont le même polynôme
minimal. Deux éléments conjugués ont en particulier le même degré. Si a G K a comme
polynôme minimal P sur F, les conjugués de a dans K sont les racines de P appartenant
à K. Si K est algébriquement clos, et si a est de degré d, alors a & d conjugués dans K,
comptés avec multiplicité. On dit que a est séparable si son polynôme minimal n'a pas de
racine double, ce qui est automatique en caractéristique 0, mais pas en caractéristique p.
Si P est iréductible, il est premier à P', si P' ^ 0 (sinon il le diviserait, ce qui est absurde
puisque degP' < degP), et donc P n'a pas de racine double si P' ^ 0. Cette dernière condition
est automatique si F est de caractéristique 0, mais pas en caractéristique p comme le montre
l'exemple de Xp - T sur FP(T).
• Si a est transcendant sur F, alors F(a) est isomorphe au corps F(T) des fractions
rationnelles en une variable.
Le morphisme d'anneaux de F[X] dans K envoyant T sur a a un noyau réduit à 0 puisque
a est transcendant. Il peut donc s'étendre en un morphisme d'anneaux du corps F(T) dans K,
en envoyant ^ sur ^£4. Comme F(T) est un corps, l'image L de F(T) par ce morphisme est
aussi un corps, et § *-> S£4 est un isomorphisme de F(T) sur L.
Maintenant, L contient F et a; il contient donc F(a). Réciproquement, F (a) contient an,
pour tout n, et donc P(a), pour tout P G F[X], et donc aussi ^^, pour tout P G F[X] et tout
Q G F[X] - {0} ; il contient donc L, ce qui prouve que L = F(a) et permet de conclure.
92
VOCABULAIRE MATHÉMATIQUE
8.3. Extensions algébriques, clôture intégrale
• Si a et (3 sont algébriques sur F, alors a+/?, ap aussi, ainsi que a-1, si a ^ 0. L'ensemble
des éléments de K qui sont algébriques sur F (la clôture intégrale de F dans K) est donc
un sous-corps de K.
L'algébricité de a"1 résulte de son appartenance à l'extension finie F(a) de F. Maintenant,
si a et 0 sont algébriques sur F, alors F(a) et F(0) sont des extensions finies de F et, d'après
le 3-ième point du n° 8.1, il existe une extension finie L de F contenue dans F et contenant
F (a) et F(0). Alors L contient a + 0 et a/3, ce qui prouve que a + 0 et a0 sont algébriques
sur F. Ceci permet de conclure. (On pourrait utiliser les fonctions symétriques des racines pour
aboutir au résultat, cf. ex. 4.11.)
On dit que l'extension K/F est algébrique si tout a € K est algébrique sur F ; dans le
cas contraire, on dit que l'extension K/F est transcendante.
• Si les extensions L/K et K/F sont algébriques, il en est de même de l'extension L/F.
Soit a € L. Par hypothèse, a est algébrique sur K, et il existe donc P € K[X], de degré ^ 1,
tel que P(a) = 0. Par ailleurs, K/F étant algébrique, le sous-corps F' de K engendré par les
coefficients de P et par F est une extension finie de F. On a alors [F'(a) : F'] < degP, ce qui
fait que [F'(a) : F] est fini ; il en est donc a fortiori de même de [F(a) : F] ce qui prouve que
a est algébrique sur F. On en déduit le résultat.
Soit K/F une extension de corps. On dit que P € F[X] se factorise complètement dans K
ou encore que P a toutes ses racines dans K, si on peut l'écrire, dans K[X], comme un
produit de facteurs de degré 1.
On dit que K est algébriquement clos si tout P € K[X] se factorise complètement dans K,
ce qui équivaut à ce que les polynômes irréductibles de K[X] soient de degré 1, ou encore
à ce que tout P e K[X], de degré n ^ 1, a n racines (comptées avec multiplicité) dans K.
Une récurrence immédiate, portant sur le degré, montre qu'il suffit de vérifier que tout
polynôme P e K[X] de degré > 1 a au moins une racine dans K. L'exemple fondamental
de corps algébriquement clos est celui du corps C des nombres complexes (th. fondamental
de l'algèbre, cf. ex. 8.3 pour une démonstration).
• Un corps est algébriquement clos si et seulement si il n'a pas d'extension algébrique.
Cela résulte de ce que F[X]/P est une extension algébrique de degré degP, si P € F[X] est
irréductible.
On dit que K est une clôture algébrique de F si K est algébriquement clos et si K est
une extension algébrique de F. Par exemple, C est une clôture algébrique de R. On verra
au n° suivant comment, si P e F[X] est fixé, construire une extension algébrique de F
contenant toutes les racines de P et, au n° 8.8, comment construire une clôture algébrique
de F en rajoutant les racines de tous les P e F[X] (ceci demande d'utiliser l'axiome du
choix si on part d'un corps quelconque, mais pas si on part d'un sous-corps de C comme
le montre le point suivant).
• Si K/F est une extension de corps et si K est algébriquement clos, la clôture intégrale F
8. FRAGMENTS DE THÉORIE DES CORPS (COMMUTATIFS)
93
de F dans K est une clôture algébrique de F. Par exemple, Pensemble Q des nombres
algébriques (i.e. l'ensemble des a G C, algébriques sur Q) est une clôture algébrique de Q.
Il suffit de prouver que F est algébriquement clos. Soit donc P G F[X] irréductible. Si
deg P = n > 1, alors P a une racine a dans K, n'appartenant pas à F, et F(a) est une extension
algébrique de F contenue dans K et contenant strictement F. Comme F est algébrique sur F,
il en est de même de F(a) d'après le point précédent, et on aboutit à une contradiction avec
la définition de F. Ceci permet de conclure.
Exercice 8.1. (i) Montrer que X3+X+l est irréductible dans Q[X] (on pourra commencer par montrer
qu'une racine éventuelle de X3 + X + 1 dans Q appartient à Z).
(ii) Soient a G C vérifiant a3 + a + 1 = 0, et K c C une extension finie de Q contenant a. Montrer
que [L : Q] est divisible par 3.
(iii) Montrer que a n'appartient pas au sous-corps de C engendré par Q et les \/ny pour n G N.
Exercice 8.2. (i) Montrer que Q(\/2, \/3) est une extension de degré 4 de Q.
(ii) Soient ai, <*2, <*$ les racines de X3 - 2 dans C. Montrer que [Q(ai, a2, a3) : Q] = 6.
(iii) Soit K/F une extension de corps, et soient a, (5 G K, algébriques sur F, de degrés respectifs r et s.
Montrer que si r et s sont premiers entre eux, alors a est de degré r sur F(/?). Le résultat est-il toujours
vrai si (r,s) ^ 1 ?
8.4. Constructions à la règle et au compas
Les grecs étaient facinés par les constructions à la règle et au compas, et il nous ont légué trois
problèmes sur lesquels ils se sont cassé les dents, à savoir :
o la duplication du cube : construire un cube de volume moitié d'un cube donné,
o la trissection de Vangle : couper un angle en 3 angles égaux (il est très facile de bissecter un angle
avec une règle et un compas),
o la quadrature du cercle : construire un carré dont l'aire est égale à celle d'un disque donné.
Les deux premiers problèmes ont été résolus (négativement : la duplication du cube est impossible
et la trissection d'un angle quelconque aussi) par Wantzel (1837), le troisième l'a été (négativement : la
quadrature du cercle est impossible) par Lindemann (1882) en prouvant que7r est un nombre transcendant
(cf. annexe E pour une démonstration de cette transcendance). Pour expliquer comment on peut arriver
à démontrer un tel résultat^64*, nous allons avoir besoin de formaliser un peu le problème.
Si I est un ensemble de cardinal ^ 2 de points du plan identifié au plan des nombres complexes, on
se permet de tracer toutes les droites joignant deux points de I et tous les cercles de centre un point de
I et de rayon la distance entre deux points de I. On note V la réunion de I et des points d'intersection
des droites et cercles ainsi obtenus. On définit alors, par récurrence, une suite croissante d'ensembles de
points du plan en posant tf0' = I et lln+1l = (1^')', et on dit que P est constructible à la règle et au
compas à partir de I s'il appartient à l'un des llwl (1^ est l'ensemble des points constructibles en moins
de n étapes). On peut toujours faire un changement de repère dans le plan complexe et supposer quel
contient 0 et 1. La duplication du cube demande une construction de s/2 à partir de 0 et 1, la trissection
de l'angle demande une construction de eia^ à partir de 0,1 et eia, et la quadrature du cercle demande
une construction de y/ïr à partir de 0 et 1.
(64)ll y a beaucoup de mathématiciens amateurs qui ont du mal à concevoir ce qu'un tel énoncé signifie
exactement, et qui croient que cette absence de solution n'est qu'un constat d'échec d'une méthode
particulière et qu'il existe une autre méthode (la leur) permettant de résoudre le problème positivement.
94
VOCABULAIRE MATHÉMATIQUE
Comme on a supposé que I contient 0 et 1, un peu d'astuce permet de montrer que l'ensemble des
nombres constructibles à partir de I est un sous-corps de C [ par exemple, en prouvant que z est
constructible si et seulement si ses parties réelle et imaginaire le sont, et en utilisant le th. de Thaïes pour faire
des multiplications et des divisions de nombres réels (on peut construire la parallèle à une droite
donnée passant par un point donnée)]. De plus, une petite analyse des équations donnant l'intersection de
cercles et de droites montre que le corps des nombres constructibles s'obtient par une suite d'extensions
de degré 2 du corps engendré par les parties imaginaires et réelles des éléments de I (un peu plus d'astuce
montre que, réciproquement, tout élément d'un corps obtenu par une suite d'extensions de degré 2 du
corps engendré par les parties imaginaires et réelles des éléments de I est constructible à partir de I).
Pour démontrer l'impossibilité de la duplication du cube, il suffit de prouver que \/2 n'appartient à
aucun sous-corps L de C obtenu à partir de Q par une suite d'extensions de degré 2, ce qui suit de ce
que s/2 est de degré 3 sur Q, alors que le degré d'un tel L est de la forme 2n qui n'est pas divisible par 3.
De même, on peut par exemple montrer que les angles aigus du triangle rectangle de côtés 3,4,5 ne
sont pas trissectables. En effet, si P = 34pî, on a P = |^|, et 2 + i et 2 — i engendrent des idéaux premiers
distincts de Z[i], et donc V2+i(/3) = 1, ce qui prouve que p n'est pas un cube dans Q(i) = Q(/3), et donc
que le polynôme X3 - P est irréductible dans Q(i)[X]. Il en résulte que les racines cubiques de P sont de
degré 3 sur Q(i) et ne sont donc pas constructibles à partir de P (dont les parties réelle et imaginaire
sont rationnelles). Il existe toutefois des angles trissectables : par exemple, comme (~4+3i)' = n^544i,
les angles du triangle rectangle de côtés 117,44,125 sont trissectables.
8.5. Degré de transcendance
Soit K/F une extension de corps. On dit que x\t... ,xn e K sont algébriquement
indépendants sur F s'il n'existe pas de P € F[Xi,..., Xn] non nul, tel P(xi,... ,xn) = 0 (si
n = 1, on retombe sur la définition d'un élément transcendant) ; cela se traduit aussi par
l'injectivité du morphisme d'anneaux P i-> P(zi,..., xn) de F[Xi,..., Xn] dans K ou par
la transcendance de Xi sur F(rri,... ,Xi,... ,xn) pour tout i. Si c'est le cas, le sous-corps
de K engendré par F et X\,... ,xn est isomorphe au corps F(Xi,... ,Xn) des fractions
rationnelles en n variables.
On dit que Xi,... ,xn est une base de transcendance de K sur F si les Xi sont
algébriquement indépendants et si K est une extension algébrique de F(#i,... ,xn) ; on dit que
K est de degré de transcendance fini sur F s'il possède une base de transcendance finie
sur F ; dans le cas contraire on dit que K est de degré de transcendance infini sur F. Si
K est de degré de transcendance fini sur F, on définit le degré de transcendance de K/F
comme le minimum des cardinaux des bases de transcendances. Une extension de degré
de transcendance 0 est donc une extension algébrique.
• Si K/F est de degré de transcendance n, toutes les bases de transcendance de K/F sont
de cardinal n, et xi,... ,xn forment une base de transcendance si et seulement si ils sont
algébriquement indépendants sur F.
La démonstration se fait par récurrence sur n. Pour n = 0, l'énoncé se réduit au fait qu'une
extension algébrique ne contient pas d'élément transcendant. Si n ^ 1, et si rci,...,xn et
2/i > • • • > Vm sont des bases de transcendance de K sur F, il existe j tel que yj soit transcendant
sur F' = F(xi,...,xn-i), sinon K serait une extension algébrique de F' ce qui contredit
l'hypothèse que x\t... ,rcn sont algébriquement indépendants. Quitte à réordonner les yj} on
8. FRAGMENTS DE THÉORIE DES CORPS (COMMUTATIFS)
95
peut supposer que j = m, et alors ym est transcendant sur F7 et algébrique sur F'(xn). Le
polynôme minimal de ym sur F'(xn) est donc de la forme y^ + fd-iy%^1 H + /0, où les fi
n'appartiennent pas tous à F7. En multipliant par le ppcm des dénominateurs, on obtient une
équation du type P(xn,ym) = 0 où P G F'[X, Y] est de degré ^ 1 en X, ce qui montre que xn
est algébrique sur F'(?/m), et donc que xu... ,xn-i,ym est une base de transcendance de K
sur F. Mais alors #i,...,xn-i et yi,..., ym-i sont des bases de transcendance de K sur F(j/m),
et l'hypothèse de récurrence permet d'en déduire que n-l = m-l, et donc que n = m, ce
qui démontre le premier énoncé.
Si £i,..., £n sont algébriquement indépendants sur F, et si ?/i,..., yn est une base de
transcendance de K sur F, on peut compléter #i,... ,xn par des yi de manière à obtenir une base
de transcendance (il suffit de prendre une partie I maximale de {1,... ,n} telle que les Xj et
les yi pour i e I soient algébriquement indépendants : la maximalité de I assure que les autres
sont algébriques sur l'extension F7 engendrée par les Xj et les yi pour i G I, et donc que K
est algébrique sur F7). La base ainsi obtenue étant de cardinal n d'après ce qui précède et
contenant les Xj, cela prouve que #i,... ,#n est une base de transcendance de K sur F. Ceci
permet de conclure.
8.6. Constructions d'extensions algébriques
• Si P G F[X] est irréductible, alors K = F[X]/P est une extension finie de F, dans laquelle
P a une racine.
On a déjà vérifié, au n° précédent, que K est une extension finie de F (de degré degP). Par
ailleurs, P(X) = 0 dans K (par construction), et donc X est une racine de P dans K.
• K = F[X]/P est « la plus petite » extension de F ayant cette propriété (on l'appelle
le corps de rupture de P) : si i est un plongement de F dans un corps L, Pensemble des
prolongements de i à K = F[X]/P est en bijection avec celui des racines de(65) PL dans L ;
en particulier, il existe un tel prolongement si L contient une racine de PL et il y a au plus
[K : F] tels prolongements.
Si a G L, il existe un unique morphisme d'anneaux de F[X] dans L coïncidant avec i sur F
et envoyant X sur a (à savoir celui envoyant Q(X) sur Q6(a)). Ce morphisme se factorise à
travers F[X]/P = K (et donc fournit un prolongement de t à K), si et seulement si P6(a) = 0,
ce qui nous fournit la bijection annoncée entre les prolongements de t à K et les racines de P6
dans L.
• Soient K/F une extension finie et i un plongement de F dans un corps L. Si L est
algébriquement clos, il existe^66) un prolongement de i à K, et si L est quelconque, il y a
au plus [K : F] tels prolongements.
Soient ai,... ,an tels que K = F(ai,... ,an) (on peut par exemple prendre une base de
l'espace vectoriel K sur F). On fait une récurrence sur n, le cas n = 0, qui correspond à K = F,
(65>Si Q = YZ=0 anXn G F[X], on note Q6 l'élément Y%=0 *MXn de L[X] ; il est immédiat que Q ^ Q'
est un morphisme d'anneaux de F[X] dans L[X].
*66)Ce résultat est aussi valable pour une extension infinie, voir plus loin. Il permet, si on dispose d'un corps
algébriquement clos L contenant F, de supposer que toutes les extensions algébriques de F considérées
sont des sous-corps de L.
96
VOCABULAIRE MATHÉMATIQUE
étant évident. Soient F' = F(c*i,... ,an_i) et P G F'[X] le polynôme minimal de an. D'après
le point précédent, l'ensemble des prolongements de i à K est en bijection avec la réunion,
pour i! prolongement de i à F7, de l'ensemble des racines de */(P) dans L.
• Si L est algébriquement clos, cet ensemble est non vide pour chaque i! et il y a donc au
moins un prolongement de i à K pour chaque prolongement de t à F7, ce qui prouve qu'il y a
au moins un prolongement de t à K.
• Si L est quelconque, pour chaque choix de */, il y a au plus [K : F7] racines de l(P) dans
L, et comme il y a au plus [F7 : F] choix de il d'après l'hypothèse de récurrence, on en déduit
qu'il y a au plus [K : F7] [F7 : F] = [K : F] prolongements de i à K. Ceci permet de conclure.
• Si Pi,..., Pn G F[X] sont unitaires, il existe une extension finie K de F dans laquelle les
Pj se factorisent complètement ; autrement dit, il existe une extension finie de F
contenant toutes les racines des P^ (une telle extension est un corps de décomposition pour
Pi,..., Pn si elle est engendrée par les racines des P^ ; si L est un corps algébriquement
clos contenant F, le sous-corps de L engendré par F et les racines des P* est un corps de
décomposition pour Pi,..., Pn).
On déduit le cas n quelconque du cas n = 1 en considérant le polynôme P = Pi • • Pn.
On construit K en rajoutant les racines de P une à une ; l'extension ainsi obtenue est donc
un corps de décomposition de P puisqu'elle est engendrée par les racines de P. Si tous les
facteurs irréductibles de P sont de degré 1, il n'y a rien à faire. Sinon, on choisit un facteur
irréductible Qi de P de degré ^ 2, et on pose Ki = F[X]/Qi, de telle sorte que Qi (et donc
aussi P) acquiert un facteur irréductible de degré 1 dans Ki. On factorise P dans Ki, et on
recommence : si tous les facteurs irréductibles de P sont de degré 1, il n'y a rien à faire, sinon,
on choisit un facteur irréductible Q2 de P de degré ^ 2, et on pose K2 = Ki[X]/Q2. Comme
le nombre de facteurs irréductibles de degré 1 augmente strictement à chaque étape, au bout
d'au plus d - 1 étapes^*57), on obtient un corps dans lequel tous les facteurs irréductibles de P
sont de degré 1, ce que l'on voulait.
• Si K/F est un corps de décomposition de Pi,..., Pn, si 1 est un plongement de F dans un
corps L dans lequel les i(Pi) se factorisent complètement, alors il existe un prolongement
de l à K.
Soit P = Pi • • • Pn. Par hypothèse, on peut factoriser P sous la forme P = rGLi(X-<*<)
dans K, et on a K = F(<*i,... ,0:4). Prouvons, par récurrence sur i, que l'on peut prolonger 1
à Fi = F(ai,..., ai). Il n'y a rien à faire si i = 0, et si % ^ 0, notons Q* G Fi[X] le polynôme
minimal de oti+i sur F*. Alors Q* divise P, et donc ti(Qi) divise *,(P), si ti est un prolongement
<67) Remarquons que le procédé peut converger en beaucoup moins de d - 1 étapes.
• Si P(X) = Xp-lG Q[X], avec p premier, alors P = (X - l)(Xp~l + • • • + 1), et si on rajoute une
racine du polynôme X^"1 H h 1 à Q (i.e. une racine primitive p-ième Ç de l'unité), alors P se factorise
complètement sous la forme P = (X - 1) Il^CX - 0)- H ne ^aut donc qu'une étape dans ce cas.
• Si P(X) = Xp - 2 G Q[X], et si on rajoute une racine a de P à Q, alors P se factorise sous la forme
p = (X - a)(XP~l + aXp~2 + • • • + ap~l). Si on rajoute une seconde racine (3 de P, alors C = f est une
racine primitive p-ième de l'unité, et P se factorise dans Q(a,/?)[X] sous la forme (X - a) l\pr} (X - oC*)-
Il ne faut donc que deux étapes dans ce cas.
• Par contre, si on part de P G Q[X] choisi au hasard, alors il faut en général d - 1 étapes pour obtenir
toutes les racines de P (th. d'irréductibilité de Hilbert, 1892).
8. FRAGMENTS DE THÉORIE DES CORPS (COMMUTATIFS) 97
de i à Ff. comme t(P) est complètement factorisable dans L par hypothèse, ti(Qi) a toutes ses
racines dans L, et tout choix de racine nous fournit un prolongement de i à Fi+i. Ceci permet
de conclure.
• Deux corps de décomposition sont isomorphes (6S\
Soient Ki,K2 deux corps de décomposition de Pi,... ,Pn. Le point précédent fournit des
plongements de Kx dans K2 et de K2 dans Ki, et [Ki : F] < [K2 : F] et [K2 : F] < [Ki : F]. On
en déduit que [I^ : F] = [K2 : F] ; les plongements précédents sont donc des isomorphismes,
ce qui permet de conclure.
Exercice 8.3. Soit P € R[X], unitaire, de degré n ^ 1, et soit L une extension finie de R, contenant C,
dans laquelle P se factorise complètement sous la forme P = n"= i(X - (*i). Si t € R, on note Qt € L[X]
le polynôme Ui<jO^ -<*- <*j - toiOy).
(i) Montrer que Qt € R[X].
(ii) Comparer v2(degQt) et v2(degP), si v2(degP) ^ 1 (où v2 désigne la valuation 2-adique) ; en
déduire, par récurrence sur r = v2(degP), que P a une racine dans C. (On pourra commencer par vérifier
qu'un polynôme de degré 2 de C[X] a deux racines dans C.)
(iii) Montrer que C est algébriquement clos.
8.7. Corps finis
Si F est un corps fini, alors F ne peut pas être de caractéristique 0, il est donc de
caractéristique p pour un certain p, et F est une extension finie de Fp. Dans tout ce qui
suit, on note (p le morphisme de Frobenius x\-+ xp sur tout corps de caractéristique p. Si
i G N, on note (p% le composé i fois de ip\ c'est le morphisme de corps x \-> xv%.
• Si K est de caractéristique p, et si i e N, alors {x G K, ^(x) = x} est un sous-corps
de K qui est égal à Fp si i = 1.
Comme ipl est un morphisme de corps, l'ensemble de ses points fixes est stable par addition,
multiplication, et passage à l'inverse ; c'est donc un sous-corps de K.
Maintenant, (p(x) = xp, et donc l'équation <p{x) = x a au plus p solutions dans K ; comme
l'ensemble des solutions contient Fp d'après le petit th. de Fermât, le sous-corps de K fixé par
(p est exactement Fp.
• Le cardinal de F est une puissance de p : si [F : Fp] = n, alors |F| =pn.
Si [F : Fp] = n, le choix d'une base de F sur Fp fournit une bijection de F£ sur F ; on a
donc |F| = |F£| = pn.
• Soit P G FP[X], irréductible, unitaire de degré d, et soit K une extension de Fp dans
laquelle P a une racine a. Alors ipd(a) = a et P = rÉoPt-^05)) dans K[X] ; autrement
dit, les conjugués de a sont les ap\ pour 0 < i < d — 1.
Écrivons P sous la forme Xd + ûd_iXd_1 H + a0, et appliquons <p à l'identité P(a) = 0.
Comme ai € Fp, on a <p(a,i) = Of, pour tout i, et comme <p est un morphisme de corps, on
obtient P(<p(a)) = 0. Il en résulte que (p(a) est une racine de P ; il en est donc de même, par
récurrence, de y>*(a), pour tout i € N.
(68>La structure d'un corps de décomposition fait l'objet de la théorie de Galois.
98
VOCABULAIRE MATHÉMATIQUE
Comme P est de degré fini, l'application i \-* ^(a) n'est pas injective et il existe i < j tels
que ¥*(&) - ^{oc) = 0. Comme ^(a) - ip*{a) = ipl{a - ^"^(a)), on en déduit qu'il existe
k ^ 1 tel que <pk(a) = a, et les <pl(a)y pour 0 ^ i ^ k - 1, soient distincts deux à deux. Alors
Q = nto(x " **(<*)) = x* + frfc-i**-1 + • ■ • + 6o divise P.
Pour conclure, il suffit donc de prouver que P divise Q, et comme P est le polynôme
minimal de a sur Fp puisqu'il est irréductible, et que Q(a) = 0, il suffit de vérifier que Q est à
coefficients dans Fp. Or bk-% = ±£i(a,<p(a),... ,<pk~l{a)), et <p(Ei(a,<p(a),... jtffi"1 (a))) =
Ei((p(a),..., <ph(a)) est égal à £*(#, <p(a),..., <pk~l(a)) puisque (pk(a) = a et que £$ est
invariant par permutation des variables. On en déduit l'appartenance de £*(#, <p(a)y..., <pk~~l(a))
à Fp, et donc aussi celle de bk-u ce qui permet de conclure.
• Soit K un corps de caractéristique p. Si F est un sous-corps fini de K, de cardinal q,
alors F={a6K, ofl = a}.
Posons q = pn de telle sorte que [F : Fp] = n. Soit a G F. Alors d = [Fp(a) : Fp] divise n, et
comme ap< = a d'après le point précédent, on ofl = a. Autrement dit F c {a G K, aq = a}.
Cette inclusion est une égalité car |F| = q, alors que \{a G K, aq = a}\ ^ q, un polynôme
de degré q ayant au plus q racines dans K.
Exercice 8.4- Soient F de cardinal q, P G F[X], irréductible, unitaire de degré d, et K une extension
de F dans laquelle P a une racine a. Montrer que ofl = a et P = nf=o(^ ~~ aQ) (^ans K[X].
• Si q = pn, il existe, à isomorphisme près, un unique corps Fq de cardinal q. De plus, les
automorphismes de Fq sont id, cp,... ipn~l, et Fpd C Fpn si et seulement si d \ n.
D'après le point précédent, un corps de cardinal q est un corps de décomposition pour
Xq - X ; on en déduit l'existence de Fq et son unicité à à isomorphisme près.
Maintenant, id, (p,... (p71"1 sont des plongements de Fq dans Fq laissant fixe Fp et comme
il y a au plus [Fq : Fp] = n tels plongements, il suffit de vérifier qu'ils sont tous distincts pour
prouver que ce sont tous les automorphismes de Fq. Si tp* = y? avec j > i, on a ^~% = id, ce
qui se traduit par xpJ % = #, pour tout x G Fqy et est impossible si j - i < n car le polynôme
XpJ~l - X a au plus pj"i racines ; d'où le résultat.
Enfin, si Fpd C Fpn, alors d = [Fpa : Fp] divise n = [Fpn : Fp]. Réciproquement, si d | n,
les points fixes de <pd (à savoir Fpd) sont aussi des points fixes de <pn, et donc Fp<i c Fpn.
• Si on choisit un plongement de Fpn\ dans Fp(n+i>!, pour tout n, alors Fp = UnGNFpni est
une clôture algébrique(69^ de Fp.
Soit P G FP[X]. Il existe n G N tel que P G Fpni[X]. Maintenant, il existe une extension
finie K de Fp»! dans laquelle P se factorise complètement ; K est alors un corps fini, et donc
de la forme Fpm, et il est inclus dans Fpm! et donc aussi dans Fp. Il s'ensuit que P se
factorise complètement dans Fp, ce qui prouve que Fp est algébriquement clos. Comme c'est une
extension algébrique de Fp, puisque les Fpn\ le sont, c'est une clôture algébrique de Fp.
(69)()n a Fp» c Fpm si n divise m. Or n divise 0 pour tout n, ce qui permet, avec un peu d'audace,
d'espérer une "inclusion" Fpn c Fpo, pour tout n, et donc une "inclusion" de Fp dans Fi. Il s'ensuit que
le corps Fi "à un élément" doit être un objet assez énorme, s'il existe, puisqu'il doit "contenir" Fp, pour
tout p (remarque due à Zagier).
8. FRAGMENTS DE THÉORIE DES CORPS (COMMUTATIFS)
99
8.8. La clôture algébrique d'un corps
• Si L est une extension algébrique de K dans laquelle tout P G K[X] a une racine, alors
L est une clôture algébrique de K.
Il suffit de prouver que L est algébriquement clos. Soient donc P G L[X] irréductible,
V = K[X]/P et a G L7 l'image de X. Alors a est algébrique sur K puisque L est algébrique
sur K ; on note Q son polynôme minimal, et on choisit une extension finie L" de L dans laquelle
Q est scindé et donc se factorise sous la forme Q(X) = n*Li(X - a*), avec ai = a.
• Si K est fini, l'hypothèse implique que l'un des a* appartient à L, et on montre directement
(cf. n° 8.7) que les autres otj sont des puissances de a*, et donc en particulier que a G L, ce
qui permet de conclure dans ce cas.
• Soit K infini. Si tu ..., U G K, le polynôme Rt(X) = \[a^d (X- (*iaa(1) + • • • + tdaa{d)))
est symétrique en ai,..., ad (on s'est débrouillé pour) ; ses coefficients sont donc des polynômes
en les U et les coefficients de Q, et Rt(X) G K[X]. Il découle de l'hypothèse qu'il existe a G Sd
tel que <iaa(i) H h tdaa(d) G L, ce qui équivaut à iT(i)ai H h tT(d)Ocd G L, où r = a"1.
Soit W = {(tu• • • ,td) G Kn, haï + • ■ • tdad G L}. Alors W est un sous-espace vectoriel
de Kn, et on a Kn = UtGs,,^t(W) d'après ce qui précède, où uT : Kn —> Kn est l'endomorphisme
défini par la formule uT(£i, ...>td) = (£T(i)> • • • > *r(d))« Comme K est infini, il résulte de l'ex. 8.5
que l'un des uT(W) est égal à Kn, et donc que W = Kn. On en déduit l'appartenance de a
à L, ce qui permet de conclure.
• Tout corps K possède une clôture algébrique (Steinitz, 1910).
Partons de l'anneau K[Xp, degP ^ 1] des polynômes en une infinité de variables (une pour
chaque P G K[X], non constant). L'idéal engendré par les P(Xp), pour P G K[X] non constant,
ne contient pas 1 (en effet, s'il contenait 1, on aurait une relation 1 = ^)QpP(Xp), où les Qp
sont presque tous nuls; cette relation ne fait intervenir qu'un ensemble fini de Xp, et donc
un ensemble fini Z de polynômes P, et on peut construire une extension finie L de K dans
laquelle tout P G Z a une racine ap ; si on évalue l'identité 1 = J2 QpP(Xp) en Xp = ap, pour
P G Z, on obtient 1 = 0, d'où une contradiction qui montre que cet idéal ne contient pas 1) ;
on peut donc trouver un idéal maximal I qui le contient. Le quotient L de K[Xp, degP ^ 1]
par I est alors un corps, algébrique sur K puisque engendré par les images des Xp qui sont
algébriques^70) sur K puisque, par construction, P(Xp) = 0 dans L, et tout P G K[X] non
constant a une racine clans L, à savoir Xp. Il résulte du point précédent que L est une clôture
algébrique de K.
Exercice 8.5. Soient F un corps infini et V un sous-espace vectoriel sur F. Soient Wi,...,Wn des
sous-espaces vectoriels de V tels que W = Wi U • • • U Wn soit un sous-espace vectoriel de V. Montrer qu'il
existe i G {1,... ,n} tel que W^- c W*, pour tout j G {1,... ,n}.
• Soit K/F une extension algébrique. Si L est algébriquement clos, et si i est un plongement
de F dans K5 alors uun prolongement à K.
^Quotienter K[Xp, degP ^ 1] par l'idéal engendré par les P(Xp) revient à rajouter une racine de
chaque polynôme non constant. L'anneau ainsi obtenu n'est pas un corps car les racines ainsi rajoutées
n'ont aucune cohérence, et c'est le passage au quotient par un idéal maximal qui restaure cette cohérence.
100
VOCABULAIRE MATHÉMATIQUE
On peut écrire K comme le quotient de l'anneau F[Xa, a G K] par l'idéal I des relations
polynomiales entre les a (i.e. I est l'ensemble des P((Xa)aGK) s'annulant si on pose Xa = a,
pour tout a).
L'idéal V de L[Xa, a G K], engendré par l'image de I par i (on applique i aux coefficients des
polynômes) ne contient pas 1 : si 1 = J2a Qc^(Pa)> où la somme est finie, Qa G L[Xa, a G K]
et Pa G I, on choisit une base de L sur l(F) contenant 1 (cela demande l'axiome du choix), et
on écrit les coefficients des Qa dans cette base ; en ne gardant que la composante de l'élément 1
de la base, cela nous fournit une relation 1 = J2a IW(Pa)> où les coefficients des Ra sont tous
dans l(F) ; on en déduit une relation 1 = J2a t"1(^a)Pa dans F[Xa, a G K], ce qui est absurde
car I ne contient pas 1.
On peut inclure V dans un idéal maximal m, et L[Xa, a G K]/m est une extension algébrique
de L (elle est engendrée par les Xa, et on a ^(Pa)(Xa) = 0, si Pa G F[X] est le polynôme minimal
de a) ; il s'ensuit que l'injection de L dans L[Xa, a G K]/m est un isomorphisme puisque L
est algébriquement clos. Le plongement i : K —> L cherché s'obtient alors en composant
l'application naturelle K ^ F[Xa, a G K]/I -» L[Xa, a G K]/I' avec celle de L[Xa, a G K]/I'
dans L[Xa, a G K]/m puis avec l'inverse de l'isomorphisme L[Xa, a G K]/m = L induit par
l'injection de L dans L[Xa, a G K]/m.
• Si K et K7 sont deux clôtures algébriques de F, il existe un isomorphisme de corps de
K sur K7 induisant l'identité sur F ; autrement dit, une clôture algébrique d'un corps est
unique à isomorphisme près(71).
Le point précédent fournit une injection i de K dans K' ; notons L l'image de K par i de
telle sorte que L est une clôture algébrique de F contenue dans K'. Soit a G K7. Comme a est
algébrique sur F, il l'est a fortiori sur L, et donc a G L puisque L est algébriquement clos. On
en déduit que L = K' et donc que t est surjective ce qui permet de conclure.
• Si F est une clôture algébrique de F, et si a, (3 G F sont conjugués sur F, il existe un
isomorphisme de F fixant F et envoyant a sur /?.
Soit P G F[X] le polynôme minimal de a ; c'est aussi celui de (5 puisque a et fi sont conjugués.
Les deux extensions F(a) et F(fi) de F étant isomorphe à F[X]/P, on dispose d'un isomorphisme
l de F(a) sur F(fi) induisant l'identité sur F et envoyant a sur fi. Comme F est algébrique
sur F(a) et est algébriquement clos, on peut prolonger t en un plongement de F dans F, et
la démonstration du point précédent montre que ce plongement est un isomorphisme, ce qui
permet de conclure.
9. Système d'équations
Beaucoup de questions se ramènent à chercher les solutions simultanées de plusieurs
équations en plusieurs variables. Dans ce §, on explique comment Palgèbre linéaire
développée dans les § précédents permet de résoudre ce genre de problème dans le cas de
systèmes d'équations linéaires ou polynomiales.
<71)ll est toutefois dangereux de parler de « la » clôture algébrique de F.
9. SYSTÈME D'ÉQUATIONS
101
9.1. Systèmes linéaires
9.1.1. Théorie générale
Un système de n équations linéaires à m inconnues Y%Li ai,jxj = 0 Pour 1 ^ * ^ n
peut s'encoder sous la forme AX = 0 avec A = (ay) € Mnxm(K) et X = \xi,... ,xn) €
M[mXl(K) = Km; autrement dit, on est en train de calculer le noyau de up, : Km —> Kn.
On définit le rang du système comme le rang de la matrice A.
• Si A e Mnxm(K) est de rang r, l'ensemble des solutions du système AX = 0 est un
sous-espace vectoriel de dimension m — r de Km.
On a dim(Ker«A) + dim(ImuA) = m. Comme dim(ImuA) = rg«A = rg A = r, on obtient
dim(KertiA) = m - r, ce qui permet de conclure.
Il arrive souvent que les équations qui nous intéressent comportent un second membre
(i.e. soient de la forme Y^jLi aijxj = Vi) auquel cas on est ramené à une équation du type
AX = YavecY = tyi,...,!/»j.
• Si A e Mnxm(K) est de rang r, alors :
o le système A X = Y n'a pas de solution si Y n'est pas dans l'image de î*a ;
o si Y est dans l'image de up, et si X0 e Km vérifie «a(Xo) = Y et donc AX0 = Y,
l'ensemble des solutions du système AX = Y est X0+KeruA = {X0+X, AX = 0} ;
autrement dit, on obtient les solutions de AX = Y en rajoutant à une solution particulière Xo
une solution de l'équation sans second membre A X = 0.
Le premier cas est la définition de Im«A puisque ua(X) = AX. Dans le second, il suffit de
remarquer que A (X - X0) = 0 si A X = A X0 = Y.
• Un cas particulier intéressant est celui où n = m (autant d'inconnues que d'équations)
et le rang du système est n (ce qui équivaut à det A ^ 0 ou à ce que l'équation AX = 0 a
0 comme unique solution) ; un tel système est dit de Cramer. Si Y = *(2/i> • • • ,Vn) € Kn,
l'équation AX = Y a une unique solution X = \xi,... ,#„) e Kn, et on a Xk = ^fë,
où Afc est la matrice obtenue en remplaçant la A;-ième colonne de A par Y (formules de
Cramer, 1750).
Si le rang du système est n, cela signifie que celui de «a est n, et que «a est surjective et
donc bijective. Autrement dit l'équation ua(X) = Y, équivalente à AX = Y, a une et une
seule solution dans Kn. Cette solution est X = A-1 Y, et on pourrait déduire les formules de
Cramer de la formule A-1 = ^A"*cof(A), mais nous allons procéder autrement.
Notons Xi,...,Xn les colonnes de A. Le système AX = 0 peut encore s'écrire sous la
forme J27=i x*x* = Y> et comme det A = det(Xi,... ,Xn) ^ 0, les formules de Cramer sont
équivalentes à l'identité £"=1 det(Xi,... ,Xi_i, Y,Xi+1,Xn.)Xi = det(X1}... ,Xn)Y. On peut
réécrire cette identité à vérifier de manière plus symétrique en posant Y = X0, en ordonnant
les Xi dans l'ordre croissant des indices dans les déterminants (cela demande de faire passer
Y de la i-ième place à la première, et donc de faire un i-cycle sur les i premiers vecteurs, ce
qui multiplie le déterminant correspondant par (-l)i_1), et en faisant tout passer au second
membre. On obtient alors 0 = SUC-1)* det(X0,..., X*,... Xn)Xj. Si on regarde la j-ième
coordonnée du second membre, on reconnaît le développement par rapport à la ligne d'ordre 0
102
VOCABULAIRE MATHÉMATIQUE
du déterminant (n + 1) x (n + 1) (les lignes et les colonnes sont numérotées de 0 à n) dont la
i-ième colonne est formée de X* (pour les lignes de 1 à n), et de la j-ième coordonnée de X$
(sur la ligne d'ordre 0) ; les lignes d'ordre 0 et j étant égales, le déterminant est nul. On en
déduit que le second membre a toutes ses coordonnées nulles, ce qui permet de conclure.
• Si A G MnX7n(K) est de rang r, on peut utiliser les formules de Cramer pour décrire les
solutions du système AX = 0 : il suffit d'isoler un mineur d'ordre r non nul et de faire
passer dans le second membre les inconnues n'intervenant pas dans le mineur pour se
retrouver avec un système de Cramer avec second membre de r équations à r inconnues.
Exercice 9.1. Montrer que les x »-» log(x + a), pour a > 0 forment une famille libre dans les fonctions
de R+ dans C. (Dériver.)
Exercice 9.2. Soit 0&ij)o^t,^n+i un carré de nombres complexes. On dit que ce carré vérifie
Impropriété de la moyenne si tout nombre intérieur est la moyenne des 8 nombres qui l'entourent (i.e. si
xi,j = g E(a,6)€{-l,0,l}2-{(0,0)} Zi+aJ+6, Si 1 ^ ij ^ 7l).
(i) Montrer que si (xij) vérifie la propriété de la moyenne, alors \xij\ est atteint sur le bord du carré
(principe du maximum).
(ii) Montrer que si (xij) vérifie la propriété de la moyenne, et si Xij = 0 sur le bord, alors xiyi = 0
pour tous i,j.
(iii) En déduire que pour tout choix de valeurs sur le bord, il existe un unique carré vérifiant la propriété
de la moyenne avec ces valeurs au bord.
9.1.2. La méthode du pivot de Gauss
Les formules de Cramer sont très utiles pour Pétude théorique des solutions d'un
système linéaire ; par exemple pour comprendre comment ces solutions varient si on fait
dépendre les coefficients des équations de paramètres. En pratique, si on cherche à résoudre
un système linéaire, on utilise en général la méthode du pivot de Gauss, ce qui est un nom
un peu ronflant pour un procédé aussi évident... Il s'agit d'un algorithme qui fonctionne^
comme suit (on cherche à résoudre le système AX = Y, avec A = (ojj) G Mnxm(K) et
Y = tyi,...,^)eKndonné) :
o Si Oij = 0 pour tous ij, et si yt = 0 pour tout î, alors tout X G Km est solution,
tandis que si un des yi est non nul, il n'y a pas de solution.
o Si les Oij ne sont pas tous nuls, on choisit un a^ qui ne l'est pas (c'est le pivot);
l'équation Y%Li aii,jxj = Vh permet d'exprimer Xjx en fonction des autres Xj : en effet, on
<72)Les gens ne se sont bien sûr pas privés de programmer cet algorithme, ce qui fait que la résolution de
systèmes linéaires explicites assez gros (à partir de 5 x 5, une résolution à la main commence à devenir
vraiment fastidieuse) peut être confiée à un ordinateur sans trop de risques. Notons que la résolution
d'un système numérique demande de faire attention aux choix des pivots : il est assez périlleux de diviser
par quelque chose de trop petit. Par ailleurs, certains sont amenés à résoudre des systèmes vraiment
gigantesques et je ne sais pas comment ils font pour s'assurer qu'il n'y a pas d'erreur dans la saisie
des données (par exemple pour un système 1000 x 1000, cela demande rentrer un million de données,
ce qui demande un temps non négligeable et est incroyablement ennuyeux, et donc propice aux erreurs
d'inattention...).
9. SYSTÈME D'ÉQUATIONS
103
a Xji = —î—(yix _ Y^jïh ah,jxj)- On peut alors reporter la valeur de xjt dans les autres
équations et obtenir, en ne considérant que ces équations, un système de n — 1 équations
en m — 1 variables (puisque xix a disparu), auquel on peut appliquer ce qui précède.
Au bout de r étapes, avec r < inf(n,m), on se retrouve avec un système de la forme
suivante :
xh = MY) + *52<*iijxj> xh = 4*00 + ^2 ai2jXj, • • • ,%• = A-(Y) + J2 ai>>3x3
0 = 4+i(Y) = -.-=4(Y)
où les û5ij sont des éléments de K, les £ sont des formes linéaires sur Kn (si r = n, la
seconde ligne n'apparaît pas). Soit J = {1,... ,m} — {jly... ,jr} ; on a |J| = m — r. Il est
alors apparent sur la forme de ce système qu'il n'y a pas de solution si ^i(Y) ^ 0 pour au
moins un t € {r + 1,... ,n} et que si ^(Y) = 0 pour tout i € {r + 1,... ,n} (condition
vide si r = n), alors pour tout (xj)j€j G KJ, le système a une unique solution : la dernière
équation fournit Xjr ; en reportant cette valeur de Xjr dans la précédente, on en déduit
xjr_iy etc.
En posant Xj = 0 pour tout j G 3, cela nous fournit une solution particulière X0 de
l'équation A X = Y. On en obtient m-r autres, Xk pour A: € J, en posant Xk = 1 et Xj = 0
si j G J—{k}. Les X^—Xo, pour A; € J, sont des solutions de l'équation A X = 0 qui forment
une base de l'espace vectoriel KerîiA- L'application (xk)kej »-* X0 + S&eJ xfc(X& — X0)
est alors une bijection de KJ sur l'ensemble des solutions du système A X = Y, ce qui en
fournit une description paramétrée.
9.1.3. Méthode du pivot et opérations sur les matrices
La méthode du pivot ne permet pas uniquement de résoudre des systèmes linéaires ; on
peut aussi l'utiliser pour démontrer de vrais résultats.
Si o G Sn, on note Pa la matrice n x n de l'endomorphisme ua de Kn envoyant e*
sur ea(i), si 1 < i ^ n. Cette matrice a exactement un 1 par ligne et par colonne, et tous
ses autres coefficients sont nuls ; une telle matrice est dite de permutation.
• a h-* Pa est un morphisme de groupes de Sn dans GLn(K).
C'est une traduction du (i) de l'ex. 3.15.
• Si A G Mnxm(K), multiplier A à droite (resp. à gauche) par une matrice de
permutation Pa avec a€Sm (resp. o G Sn) revient à permuter les colonnes (resp. les lignes) de A ;
de manière précise, la j-ième colonne de APa est la a^-ième colonne de A et la i-ième
ligne de PaA est la a-1(£)-ième colonne de A.
On a «a o ua{ej) = t*A(e<rO")) ; on en déduit l'énoncé concernant les colonnes de AP^.
De même, ua ouA{ej) = u*(Èi=i<Hjei) = £?=1 aitjea{i) = E?=i VHOje« i on en deduit
l'énoncé concernant les lignes de P^A.
104
VOCABULAIRE MATHÉMATIQUE
Soit In,mM la matrice n x m dont tous les coefficients sont nuls sauf les r premiers
coefficients diagonaux qui valent 1.
• Si A G Mnxm(K) est de rang r, il existe des matrices de permutations P € GLn(K)
et P' € GLm(K), et des matrices T 6 GLn(K), triangulaire inférieure, et T' € GLm(K),
triangulaire supérieure, telles que TPAP'T" = ln,m(r).
Reprenons la méthode du pivot. Quitte à faire des permutations des inconnues (ce qui revient
à permuter les colonnes de A et donc à multiplier A à droite par une matrice de permutation P')
et des équations (ce qui revient à permuter les lignes de A et donc à multiplier A à gauche
par une matrice de permutation P), on peut supposer que i\ = ji = 1,...,ir = jr = r (ce
qui implique en particulier que oi,i ^ 0 puisqu'on peut le prendre comme pivot). Reporter la
valeur de Xi dans les équations suivantes revient alors à multiplier A à gauche par la matrice
/îTT ° - °\ /l
Ti =
-Q2.1
«1.1
\-
0
pour obtenir A' = TiA =
V
*1,2
*l,m
\
0 «2,2 '•• «2,n
\0 a\
■n,2
On multiplie alors A' à gauche par la matrice
/l 0 ••• ()\
0 -+- ••• 0
T2 =
î
a2.2
0
-°».2
a2.2
1
pour obtenir A" = T2TiA =
0
«1,2
1
\0 0
«1,3
4,3
un,3
"l,m
a'im
J
V û2.2 /
Au bout de r étape, on aboutit à A<r> = TA, où A<r> a tous ses coefficients nuls en-dessous de
la diagonale ou en-dessous de la r-ième ligne, et ses coefficients diagonaux a^l,..., aty sont
égaux à 1, et T est triangulaire inférieure inversible car T = Tr • • Ti et Tj est triangulaire
inférieure inversible (ses coefficients en dehors de la^-ième colonne sont des 1 sur la diagonale
et des 0 ailleurs, et le coefficient diagonal de la j-ième ligne est l'inverse du j-ième pivot, et
donc est inversible). On peut alors faire subir le même traitement à la transposée de A^ en
remarquant que l'on peut prendre les coefficients diagonaux comme pivots successifs, ce qui
permet de trouver une matrice triangulaire inférieure inversible T0 telle que To'A^ = Im,n(^)-
Alors A(r>To = ln,m(r) et TATo = In,m(r), et comme T' = To est triangulaire supérieure
inversible, cela permet de conclure.
Exercice 9.3. (i) Montrer que rg(UAV) = rg(A), si A € Mnxm(K), si U € GLn(K) et si V € GLm(K).
(ii) Soit G = GLn(K) x GLm(K). Montrer que ((U, V),M) h-» (U, V) • M = UMV"1 définit une action
de G sur Mnxm(K).
(iii) Combien cette action a-t-elle d'orbites ?
9.2. Systèmes d'équations polynomiales
Soient Pi,... ,Pn e K[Xi,... ,Xm], Si L est un corps contenant K, notons V(L)
l'ensemble des solutions dans Lm du système Pi(z) = • • • = Pn(z) = 0.
Si Pi,..., Pn sont de degré 1, le système ainsi obtenu est un système linéaire avec second
membre, et la méthode du pivot nous fournit une description de V(K) : si V(K) est non
9. SYSTÈME D'ÉQUATIONS
105
vide, il existe de {0,1,... ,m} tel que, quitte à permuter les variables, la projection de
Km sur Kd induise une surjection de V(K) sur Kd et l'image inverse de x e Kd consiste en
exactement un point qui peut se calculer à partir de x en résolvant successivement m — d
équations en 1 variable, de degré 1.
Dans le cas général, la théorie de l'élimination fournit, si K est algébriquement clos, une
description analogue de V(K). Pour que le résultat soit plus esthétique, il faut se permettre
un changement linéaire de variable X* = J^jLi ai,jYj avec A = (aitj) e GLm(K), ce qui
est un peu plus général que de permuter les coordonnées, mais ne présente pas vraiment
d'inconvénient pour décrire les solutions du système initial, étant donné qu'on les retrouve,
à partir des solutions du système modifié, en résolvant le système de Cramer exprimant les
Xi en fonction des Y,-. La description de l'ensemble des solutions est alors la suivante (73) : si
V(K) est non vide, il existe de {0,1,..., m} tel que, quitte à faire un changement linéaire
de variables, la projection de Km sur Kd induit une surjection de V(K) sur Kd et l'image
inverse de x e Kd est finie, et peut se calculer à partir de x en résolvant successivement
m - d équations polynomiales en 1 variable dont les degrés ne dépendent pas de x.
9.2.1. Résultant de deux polynômes, discriminant
On note Z[A,B] l'anneau des polynômes à coefficients dans Z en les indéterminées
A0, • • •, An, Bo,..., Bm. On note PA, Qb les éléments AnXn + • • • + An et BmXm + • • • + B0
de Z[A,B,X] (et donc Pa, Qb sont les polynômes universels de degrés < n et < m).
On note Sylvnm la matrice (dite de Sylvester) de PA et Qb dont les colonnes sont
les coordonnées de Xm_1PA,..., Pa, Xn_1QB,..., Qb dans la base Xn+m_1,..., 1 : par
exemple, si n = 3 et m = 2, on obtient la matrice
/As 0 B2 0 0\
|A2 A3 Bi B2 0 I
I Ai A2 Bo Bi B2 I .
A0 Ai 0 B0 Bi
\0 A0 0 0 Bo/
On note Resnjm e Z[A,B] le déterminant de la matrice de Sylvester Sylvnm; c'est le
résultant des polynômes universels Pa et Qb-
• Il existe U, V e Z[A, B, X] tels que Resn>m = UPA + VQB.
On ajoute à la dernière ligne du déterminant la combinaison linéaire des autres où le
coefficient de la i-ième ligne est xn+m_t. Ceci ne change pas la valeur du déterminant, et la
*73)Cette description est relativement satisfaisante d'un point de vue ensembliste mais ne dit rien de la
géométrie des solutions ; ceci fait l'objet de la géométrie algébrique. L'étude des solutions d'un tel système
sur un corps K non algébriquement clos (par exemple Q ou un corps fini) est nettement plus délicate
et fait l'objet de la géométrie arithmétique ; de manière assez surprenante la géométrie des solutions du
même système sur un corps algébriquement clos contenant K (par exemple C si K = Q) a une très forte
influence (pas encore complètement comprise) sur la taille de l'ensemble des solutions sur K.
106 VOCABULAIRE MATHÉMATIQUE
dernière ligne devient (Xm~1PA,.,PA,Xn~1QB,...,QB). Un développement du
déterminant par rapport à la dernière ligne fournit l'identité cherchée.
Si À est un anneau, et si P = anXn + • • • + an et Q = bmXm + • • • + 60 sont des
éléments de A[X], on définit le résultant Resn,m(P,Q) € A de P et Q comme la valeur en
(a0,..., On, 6q, ..., bm) de Resn(7n ; c'est donc aussi le déterminant de la matrice de Sylvester
de P et Q (obtenue en évaluant Sylvnm en (o0,... ,an,b0j... ,6m)). Si P,Q € K[X] sont
de degrés n et m, le résultant de P et Q est Resn>m(P,Q) (i.e. les entiers n et m sont
implicitement les degrés des polynômes P et Q s'ils ne sont pas explicitement mentionnés).
• Il existe U, V G A[X] tels que Resn,m(P,Q) = UP + VQ.
Il suffit de spécialiser la relation Resn>m = UPa + VQB en (a0,..., any b0,..., bm).
On suppose dans la suite que l'anneau A est un corps K. Si an = bm = 0, la première
ligne de la matrice de Sylvester est nulle et donc le résultant est nul. On suppose donc
an ^ 0 ou bm ^ 0 dans ce qui suit.
• Les conditions suivantes sont équivalentes :
oResn,m(P,Q) = 0,
opgcd(P,Q)^l,
o il existe un corps contenant K dans lequel P et Q ont une racine commune,
o P et Q ont une racine commune dans tout corps algébriquement clos contenant K.
Posons D = pgcd(P,Q). Si D ^ 1, et si L est un corps algébriquement clos contenant K,
alors D se factorise complètement dans L, et toute racine de D est une racine commune de
P et Q ; la seconde condition implique donc la quatrième, et celle-ci implique la troisième
de manière évidente. Maintenant, si a est une racine commune de P et Q dans un corps L
contenant K, alors a est algébrique sur K et le polynôme minimal de a divise P et Q, ce qui
prouve que la troisième condition implique la seconde et donc que les trois dernières conditions
sont équivalentes.
La matrice de Sylvester est la matrice de (U, V) ■-* UP + VQ dans les bases canoniques
de Kpt]^-1) © KIX]*11-1) et K[X](n+m"1). Si D ^ 1, on peut factoriser P et Q sous la forme
P = DP! et Q = DQi, et alors Pl e Rpt]^"1) et Qx 6 K[X]lm-V et (Qi,-Pi) est dans
le noyau de (U, V) ■-* PU + QV, ce qui prouve que Resn>m(P,Q) = 0. Ceci montre que la
seconde condition implique la première. Réciproquement, si P et Q sont premiers entre eux,
alors PU + QV = 0 implique que P divise V et Q divise U, et comme an ^ 0 ou bm ^ 0, cela
implique U = 0 ou V = 0 (et donc U = V = 0), puisque degU ^ m - 1, deg V ^ n - 1. Il
s'ensuit que (U,V) *-> PU + QV est injective et donc bijective, et que Resn>m(P,Q) ^ 0. La
première condition implique donc la seconde, ce qui permet de conclure.
• Si an ^ 0 et bm ^ 0, et si L est une extension de K dans laquelle P et Q se factorisent
complètement sous la forme P = an n^=1(X — c^) et Q = bm njLi(X — fy), alors
n m n m
R*s„,ro(p, q) = « rj rj(ai _ A) = a- j] Qfa) = (-îrt» rj po%).
i=l j=l i=l j=l
On a Resn>m(P,Q) = detx»+m-i ^X™"1?,.. ^P.X^Q,....*^. On peut écrire X*Q
sous la forme PA* + Qj, avec deg Qj < n - 1 et deg Af=i + ra-n<m-l, sii + m-n^0
9. SYSTÈME D'ÉQUATIONS
107
(dans le cas contraire, Ai = 0). Donc PA* est une combinaison linéaire de Xm-1P,..., P, et le
déterminant ne change pas si on retranche PA* à X*Q, ce qui revient à remplacer X*Q par Q*. La
matrice obtenue est alors triangulaire par blocs (^p), avec Ai € Mm(K), A2 € Mnxm(K),
B € Mn(K) ; de plus Ai est triangulaire inférieure avec des an sur la diagonale et on obtient
Resn,m(P,Q) = <CdetB.
Maintenant, B est la matrice de la multiplication par Q sur K[X]/P, dans la base Xn_1,..., 1.
Or le polynôme caractéristique de la muliplication par X sur K[X]/P est P (ex. 10.4) ; il
s'ensuit que les valeurs propres de la multiplication par X sont oti,..., an, et donc celles de la
multiplication par Q sont Q(ai),... ,Q(an). Comme le déterminant est le produit des valeurs
propres (alinéa 10.1.6), on obtient detB = IlILiQC01*)- ^n en déduit les deux premières
égalités. La dernière s'obtient en échangeant les rôles de P et Q.
• Soit An e Z[A] défini par An = (-l)n(n"1)/2Resn,n_i(PA,P,A) ; c'est le discriminant du
polynôme universel de degré n. Si A est un anneau et P = anXn + • • • + ao € A[X], on
définit le discriminant A(P) de A comme la valeur de An en a0,..., an.
• Si K est un corps, si L est une extension de K dans laquelle P = Xn H (- 00 6 K[X]
se factorise sous la forme n?=i(X - «i)> alors A(P) = YliKji.0^ ~ aj)2> et A(P) = 0 si et
seulement si P a une racine double.
On a Resn,m(P, P') = Uti **(«<) = FEU TlJtt{<*i-<*j)' La formule A(P) = Ui^i-^j)2
s'en déduit en regroupant les termes («, j) et (j,i). Le reste est alors immédiat.
9.2.2. Théorie de l'élimination
Soit K un corps infini. Soient Pi,..., Pn e K[Xi,..., Xm]. Si L est un corps contenant K
et si A = (aij) e GLm(K), on note Va(L) l'ensemble des solutions dans Lm du système
Pi,a(2/) = ••• = PnAv) = °» où Pi,a,• • •,Pn,A € K[Yi,...,Ym] sont les polynômes
obtenus à partir de Pi,... ,Pn via le changement linéaire de variable X = AY (i.e. on a
xi = EJLi û»jYj-, si 1 < i < m).
On dit qu'un système polynomial est triangulaire de dimension d s'il est de la forme
Qi(x) = - - = Qm-d(x) = 0, avec Q* e K[Xi,..., Xd+i], unitaire en Xd+i. Un tel système
se résoud sans problème (à condition de savoir résoudre les équations en une variable) :
si on fixe (jci, ... ,Xd)> les autres Xi s'obtiennent successivement en résolvant une équation
polynomiale en une variable (en particulier, il n'y a qu'un nombre fini de solutions pour
Xd+i,...,xmsixi,...,Xd sont fixés).
Théorème 9.4- On est dans l'un des deux cas (exclusifs) suivants :
o V(L) = 0 pour tout corps algébriquement clos L contenant K.
o iï existe un changement de variable X = AY, un entier de {0,... ,ra}, et un
système triangulaire Qi(y) = • • -Qm-div) = 0 de dimension d tels que, si L est un corps
algébriquement clos contenant K, Va(L) soit inclus dans les solutions de ce système et se
surjecte sur Ld ; si ci,... ,Q G hd l'ensemble Vc des y = (j/i,... ,ym) G Va(L) vérifiant
V\ = ci,..., yd = Cd est donc non vide et fini.
108
VOCABULAIRE MATHÉMATIQUE
La démonstration se fait par récurrence sur m. L'idée est la même que pour la méthode du
pivot de Gauss. On a besoin d'une équation dans laquelle Xm apparaît, et on l'utilise pour
éliminer Xm des autres équations, ce qui se fait en utilisant les résultants. Pour que le résultat
soit le plus sympathique possible, il faut que le polynôme utilisé soit unitaire en Xm : dans
le cas d'un système linéaire, il suffit de diviser l'équation correspondante par le coefficient
de Xm après avoir permuté les variables, dans le cas général, cela peut demander d'effectuer
un changement linéaire de variable.
Pour m = 1, il y a deux cas suivant que tous les Pi sont nuls (auquel cas on est dans le second
cas de l'alternative du théorème avec d = 1 et pas de Q* puisque tout x G L est solution), ou
que l'un d'entre eux ne l'est pas (auquel cas, l'idéal engendré par les Pi est principal, engendré
par un polynôme unitaire Q, et les solutions du système sont les racines de Q ; si Q = 1, on
est dans le premier cas de l'alternative du théorème, si Q ^ 1, on est dans le second cas avec
d = 0et Qi = Q).
Supposons maintenant m ^ 2. Si tous les Pi sont nuls, on est dans le second cas de
l'alternative du théorème avec d = m, et pas de Qi car tout x G Lm est solution. Dans le cas
contraire, quitte à réordonner les Pi, on peut supposer que Pi ^ 0. Si degPi = 0, alors Pi est
une constante et l'équation Pi(#) = 0 n'a de solution dans aucun corps L contenant K, et on
est dans le premier cas de l'alternative du théorème. Si deg Pi = k\ ^ 1, on peut, quitte à faire
un changement linéaire de variable et à muliplier par un élément deK*, supposer (cf. ex. 4.7)
que Pi est unitaire en Xm.
Pour condenser un peu les expressions, posons X = (Xu... ,Xm) et X7 = (Xu... ,Xm_i) ;
on a donc X = (X',Xm). Par ailleurs, L désigne un corps algébriquement clos contenant K
dans tout ce qui suit. On définit P G K[T, X] par P = P2 + TP3 + • • • + Tn"2Pn, et on note R le
résultant de Pi et P par rapport à Xm ; on peut écrire R sous la forme Ro + RiT H , où les
Ri appartiennent à K[X']. Maintenant R appartient à l'idéal de K[T, X] engendré par P et Pi ;
on a donc une relation du type R = UP +VPi, où U = U0 + UiT+... et V = V0 + ViT + - • •,
et les Ui et les Vi sont des éléments de K[X]. En identifiant les puissances de T des deux
cotés, on obtient Ro = U0P2 + V0Pi, Ui = U0P3 + U1P2 + V1P1, etc., ce qui montre que si
x = (x\xm) G Lm est une solution du système des Pi, alors x' est une solution du système
des Ri.
Réciproquement, si x7 G L est une solution du système des Ri, alors, pour tout t € K, le
résultant des polynômes Pi (a;7, Xm) et P(£, x\ Xm) est nul, et comme le coefficient dominant de
Pi(#'>Xm) ne l'est pas puisqu'on s'est arrangé pour qu'il vaille 1, cela implique que Pi(#',Xm)
et P(t,x',Xm) ont un zéro commun dans L. Or les zéros de Pi(#',Xm) sont en nombre fini et
ne dépendent pas de t ; il en résulte que l'un d'entre eux a est racine de P(tyx',Xm) pour une
infinité de t, et donc que le polynôme P(T,#',a) est identiquement nul puisqu'il a une infinité
de zéros. Cela implique que P2(#',a) = • • • = Pn(#',a), et comme Pi(#',a) = 0, on vient de
prouver l'équivalence des conditions suivante pour x' G Lm~~l : « x' est solution du système
des Ri » et « il existe a G L tel que (#',a) soit solution du système des Pi ».
On a donc réussi à éliminer Xm et à construire un système polynomial en X' = (Xi,..., Xm_ 1)
dont les solutions V'(L) sont exactement les projections des solutions du système initial. On
peut alors appliquer l'hypothèse de récurrence à ce système. Quitte à faire un changement
linéaire de variable X' = A'Y' (ce qui ne change pas Xm), on peut supposer que l'on est dans
un des deux cas exclusifs suivants :
o Pour tout L, on a V'(L) = 0, et donc V(L) = 0, et on est dans le premier cas de l'alternative
du théorème.
9. SYSTÈME D'ÉQUATIONS
109
o II existe un entier d G {0,... ,m - 1} et un système Qi(#) = •■■ = Qm-i-d(x) = 0,
triangulaire de dimension d tel que V'(L) soit inclus dans l'ensemble des solutions de ce système
et se surjecte sur Ld, pour tout L. Alors le système Qi (#) = ••• = Qm-i-d(x) = Pi(#) = 0 est
triangulaire de dimension d, et V(L) est inclus dans les solutions de ce système et se surjecte
sur Ld d'après l'équivalence ci-dessus.
Ceci permet de conclure.
Corollaire 9.5. (th. des zéros de Hilbert, 1893). Si Pi,..., Pn G K[Xi,..., Xm], et si
le système P\(x) = • • • = Pn(x) = 0 n'a pas de solution dans une clôture algébrique de K,
alors Vidéal de K[Xi,..., Xm] engendré par Pi,..., Pn contient^ 1, et le système n'a de
solutions dans aucun corps contenant K.
Si cet idéal ne contient pas 1, on peut l'inclure dans un idéal maximal m, et alors le système
P\(x) = ■ ■ ■ = Pn(#) = 0 a une solution dans le corps L0 = K[Xl5...,Xm]/m, à savoir l'image
de (Xi,...,Xm), et donc il en a dans une clôture algébrique de ce corps qui est un corps
algébriquement clos contenant K car L0 contient K. Il s'ensuit que l'on est dans le second cas
de l'alternative du th. 9.4, et donc que le système a des solutions dans tout corps algébriquement
clos contenant K.
• Si K est algébriquement clos, Tout idéal maximal de K[Xi,... ,Xm] est de la forme
ma = (Xi - xi,..., Xm - xm), avec x = (xu ..., xm) G Km, et x i-> m^ est une bijection
de Km sur Pensemble des idéaux maximaux de K[Xi,..., Xm].
Un idéal I de la forme (Xx - #i,..., Xm - xm) est maximal (le quotient est K puisque les
constantes forment un supplémentaire de I dans K[Xl5..., Xm]).
Réciproquement, soit I un idéal maximal de K[Xi,..., Xm]. Comme K[Xi,..., Xm] est noe-
thérien, I est de type fini ; soient Pi,..., Pn engendrant I. Comme I ne contient pas 1, il existe
x = (#i,... ,xm) G Km solution du système Pi(#) = ■ ■ • = Pn(#) = 0. Or P(x) = 0 implique
que P est dans l'idéal (Xi - x\,... ,Xm - xm) (écrire Xi sous la forme (X* - xi) + Xi et
développer) ; il s'ensuit que I est inclus dans (Xi - #i,... ,Xm - #m), et donc lui est égal par
maximalité. Ceci prouve le premier énoncé.
On en tire la subjectivité de x ■-* mx. L'injectivité résulte de ce que, si a; = (xïy... ,#m)
et V = (î/i>--jî/m) sont distincts, il existe i tel que Xi ^ yi, et alors mx + my contient
Xi—yi = (Xi - yi) - (Xi - Xi) y et donc aussi 1, ce qui prouve que mx ^ my.
On suppose K algébriquement clos. Si I est un idéal de K[Xi,... ,Xm], on note V(I)
Pensemble des x G Km vérifiant P(x) = 0 pour tout P G I (il suffit de vérifier ceci pour
des Pi engendrant I) ; c'est la sous-variété algébrique de Km définie par I. Si x G V(I), le
morphisme d'anneaux P ■-> P(x) de K[Xi,... ,Xm] dans K est identiquement nul sur I, et
donc se factorise à travers K[Xi,..., Xm]/I ; son image étant le corps K, son noyau est un
idéal maximal m^ de K[Xi,..., Xm]/I.
• L'application x \-^mx est une bijection^75) de V(I) sur Pensemble des idéaux maximaux
deKpC1>...lXm]/I.
^>I.e. il existe Vu...,U„ € K[Xi,... ,Xm] tels que U1P1 + • • • + UnPn = 1.
^75^Cette bijection entre points et idéaux maximaux est à l'origine de la théorie des schémas de Gro-
thendieck (1955) : si A est un anneau, on définit l'espace topologique SpecA (le spectre de A) comme
110
VOCABULAIRE MATHÉMATIQUE
Les idéaux maximaux de K[Xi,... ,Xm]/I sont en bijection avec les idéaux maximaux de
K[Xi,...,Xm] qui contiennent I (l'image inverse d'un idéal maximal de K[Xi,...,Xm]/I dans
K[Xi,..., Xm] est un idéal maximal de K[Xi,..., Xmj). D'après le point précédent, un tel idéal
est de la forme (Xi - xi,...,Xm - xm), avec x = (#i,...,xm) € Km ; c'est alors l'idéal des
P € K[Xi,... ,Xm] vérifiant P(x) = 0, et il contient I si et seulement si x € V(I). Les idéaux
maximaux de K[Xi,... ,Xm] contenant I sont donc en bijection avec V(I). On en déduit le
résultat.
10. Réduction des endomorphismes
Dans le n° 10.1, on rappelle (et complète) sans démonstration les résultats vus en
classe préparatoire concernant la réduction des endomorphismes (diagonalisation, mise
sous forme de Jordan...). Au n° 10.2, on explique comment on peut retrouver ces résultats
en utilisant le théorème de structure des modules de torsion sur les anneaux principaux
démontré au n° 10.3. L'intérêt de cette nouvelle approche est de ne rien supposer sur le
corps K, alors que l'approche vue en classe préparatoire impose plus ou moins à K d'être
algébriquement clos (ce qui, il faut le reconnaître, est le cas de C (cf. ex. 8.3, th. V.4.15
et ex. V.3.13, VI.3.21, V.3.2), mais est loin d'être celui de F2).
10.1. Généralités
Soit K un corps commutatif, et soit V un K-espace vectoriel de dimension finie.
10.1.1. Endomorphismes
On note End(V) l'ensemble des endomorphismes de V, c'est-à-dire, l'ensemble des
applications u : V —► V qui sont linéaires. Muni de l'addition (ui + U2){v) = Ui(v) + u^iv),
et de la composition des endomorphismes, End(V) est un anneau non commutatif (sauf
en dimension 1), possédant un élément unité (que nous noterons 1) en la personne de
l'application identité id : V —> V (cf. n°5.1). Uhomothétie de rapport À est l'application
v ■-> Xv. On la note simplement A, ce qui est compatible avec le fait que l'identité (que
l'on a notée 1) peut aussi être vue comme l'homothétie de rapport 1.
10.1.2. Le théorème de Cayley-Hamilton
Si u € End(V), on note det(u) € K son déterminant (cf. n°6.3). Si Ui>U2 e End(V),
alors det(uiU2) = det(wi) det(w2)- On note Caru(X) le polynôme caractéristique de u
l'ensemble des idéaux premiers de A, muni de la topologie de Zariski (un fermé pour cette topologie est
un sous-ensemble de la forme V(I), où I est un idéal de A et V(I) est l'ensemble des idéaux première
de A contenant I). L'anneau A devient alors l'anneau des fonctions continues sur SpecA; la valeur de
/ € A en un idéal p étant l'image de / dans A/p. Il y avait eu plusieurs tentatives en ce sens avant Gro-
thendieck, mais celui-ci a réalisé que l'on obtenait une théorie parfaitement satisfaisante en ne mettant
aucune condition sur les anneaux considérés (contrairement à ses prédécesseurs), et en considérant des
idéaux premiers au lieu d'idéaux maximaux ; cela donne à la théorie des schémas une souplesse et une
richesse assez phénoménales.
10. RÉDUCTION DES ENDOMORPHISMES
111
défini par Cartt(X) = det(X — u) (cf. alinéa 7.7.1). Si V est de dimension d, c'est un
polynôme de degré d, dont le développement est donné par
Cartt(X) =Xd- 'hiuJX*-1 + • • • + (-l)ddet(u),
où Tr(tt) est, par définition, la trace de u. On a rlY(uiu2) = rlï(t*2t*i), si Ui>v,2 € End(V).
L'ensemble des P € K[X] tels que P(u) = 0 est un idéal de K[X], non nul car End(V) est
de dimension (dim V)2 et donc l,u,... ,îi^dimV^ forment une famille liée. On note Minu le
générateur unitaire de cet idéal. C'est le polynôme minimal de u et, d'après le théorème
de Cayley-Hamilton (1858), Car„ annule u; autrement dit, Car„ est un multiple de Min^
(cf. cor 10.8).
10.1.3. Automorphismes
Si u e End(V), le noyau et l'image de % définis par
Ker(îi) = {veV, u{v) = 0} et Im(w) = {v € V, 3v' € V, u(y') = v},
sont des sous-espaces vectoriels de V, et on a les équivalences (cf. alinéa 5.4.2) :
detw ^ 0 <$■ Ker(w) = 0 & u injectif & u bijectif & u surjectif & lm(u) = V.
Un automorphisme de V est un élément de End(V) vérifiant les conditions ci-dessus. On
note GL(V) C End(V) l'ensemble des automorphismes de V ; c'est le groupe des éléments
inversibles de l'anneau End(V).
10.1.4. Matrices
Si V est de dimension d, et si on choisit une base ei,... ,e<{ de V, on peut associer à
tout élément u de End(V) sa matrice dans la base ei,... ,ed (cf. n° 7.4). C'est l'élément
iai,j)i^i,j<d de Md(K) défini par u(ej) = Ym=\ ai,jei- La trace de u est alors la somme
Z)i=i ai,i des coefficients diagonaux de la matrice de u ; cette somme ne dépend donc pas
du choix de la base. Le groupe GL(V) s'identifie au groupe GLd(K) des matrices d x d
inversibles (ce qui équivaut à ce que le déterminant soit non nul) à coefficients dans K.
Si /1,..., fd est une autre base de V, si P est la matrice dont les colonnes sont /1,..., /d
exprimés dans la base ei,... ,ed, les matrices M et M' de u dans les bases e\,... ,ed et
/i) • • • > fd sont reliées par la formule M' = P-1MP.
10.1.5. Espaces propres, espaces caractéristiques
Soit u e End(V). On dit que A € K est une valeur propre de u> si u — A n'est pas
inversible, ce qui équivaut à Ker(u — A) ^ 0, et donc à l'existence de v e V, non nul, tel
que u{v) = Xv, un tel v est un vecteur propre de u pour la valeur propre A (cf. n° 5.2).
Le spectre Specîi de u est l'ensemble des valeurs propres de u. C'est aussi l'ensemble des
racines du polynôme caractéristique Carît(X) = det(X — u) de u.
Si A e Specu, le noyau de Ker(w —A) est Vespace propre associé à la valeur propre A. On
dit que u est diagonalisable, si V = 0A€Spec«Ker(îi — A). Ceci équivaut à l'existence d'une
base (ei)iei de V (constituée de vecteurs propres) dans laquelle la matrice de u est une
112
VOCABULAIRE MATHÉMATIQUE
matrice diagonale (i.e. a^j = 0 si i ^ j). Le polynôme minimal de u est alors le produit
des (X — A), pour A G Specîi (cor. 10.9) ; en particulier, tous ses zéros sont dans K et ces
zéros sont simples. Réciproquement, s'il existe P € K[X], dont tous les zéros sont simples
et appartiennent à K, avec P(u) = 0, alors u est diagonalisable (cor. 10.9).
Si A G SpecUy la suite des Ker (u—X)k est croissante, et donc stationnaire (i.e. constante
à partir d'un certain rang). On note e\ le plus petit k tel que Ker (u — \)k' = Ker (u — A)&,
quel que soit k' > k. Alors Ker (u — A)eA est le sous-espace caractéristique associé à A.
Si Car„ est scindé sur K, alors V est la somme directe ©AeSpecuVA de ses sous-espaces
caractéristiques (cor. 10.10). On note d\ la dimension de Va; c'est la multiplicité de la
valeur propre A, et c'est aussi la multiplicité de A en tant que racine de Caru.
10.1.6. Mise sous forme de Jordan
Un bloc de Jordan JA,r d'ordre r pour A est une matrice rxr avec des A sur la diagonale,
des 1 juste au-dessus de la diagonale et des 0 partout ailleurs. Les polynômes minimal et
caractéristique de JA,r sont tous deux égaux à (X — A)r. Une matrice est sous forme de
Jordan si elle est diagonale par blocs, et si chacun des blocs est un bloc de Jordan (on ne
demande pas aux blocs d'être de la même taille, ni d'être associés au même A).
On peut trouver une base de Va dans laquelle la matrice de u est sous forme de Jordan
(ex. 10.5 et cor. 10.11). La taille des blocs ta,i ^ ta,2 ^ • • • ^ r\ykx est alors indépendante
du choix de la base, et on a ta,i = e\ et X^ii r\ô = d\^ e\.Eïi juxtaposant les bases
des Va, pour A G Specu, cela permet, si Caru est scindé, de mettre la matrice de u sous
forme de Jordan. On en déduit que les polynômes minimal Minu et caractéristique Carw
de u sont donnés par
Minu(X)= fj (X-A)e* et Caru(X) = fj (X - A)d\
AeSpecu AeSpecu
On déduit aussi de l'existence de la forme de Jordan que Tr(u) (resp. det(u)) est la somme
(resp. le produit) des valeurs propres de u, comptées avec multiplicité.
10.2. Modules de torsion sur K[X] et réduction des endomorphismes
10.2.1. Anneaux et modules. Nous renvoyons au § 2 pour des compléments sur les
points rappelés ci-dessous. Si A est un anneau (avec élément unité 1), un A-module M est
un groupe commutatif pour une loi +, muni d'une action (o, x) i-> ax de A, vérifiant :
Ox = 0, 1 x = x, a(x + y) = ax + ay, (a + b)x = ax + bx, (ab)x = a(bx),
quels que soient x,y eM et a,b G A.
• Si A est un corps commutatif, on retombe sur la définition d'un espace vectoriel, et il y
a de grandes similarités entre la théorie des modules sur un anneau commutatif et celle
des espaces vectoriels sur un corps commutatif. La grosse différence est que ax = 0 et
a^0 n'impliquent pas forcément x = 0.
10. RÉDUCTION DES ENDOMORPHISMES
113
• Tout groupe commutatif est naturellement un Z-module, en définissant nx par
récurrence sur n, par Ox = 0, (n + l)x = nx + x si n e N, et nx = -((-n)x), si n ^ 0.
• Si A est commutatif, un sous-A-module de A n'est autre qu'un idéal de A.
• Si K est un corps commutatif, et si V est un K-espace vectoriel, alors V est un module
sur l'anneau End(V) (non commutatif si dim V ^ 2).
• Si (Mi)i€i est une famille de A-modules, les groupes commutatifs 0i€iMj et Yli€l M* sont
naturellement munis d'une action de A, et sont donc des A-modules.
• Si M' C M sont deux A-modules, le groupe commutatif quotient M/M' est muni d'une
action de A et donc est un A-module.
• Un morphisme u : Mi —> M2 de A-modules est un morphisme de groupes additifs
commutant à l'action de A (i.e. u(ax) = au(x), si x € Mi et a e A) ; si A est un
corps commutatif, on retombe sur la définition d'une application linéaire entre espaces
vectoriels.
• Si u : Mi —► M2 est un morphisme de A-modules, alors Ker u et Imu sont des A-modules,
et u induit un isomorphisme de A-modules de Mi/Keru sur Imu. En particulier, u est
injectif si et seulement si Ker m = {0} et u est surjectif si et seulement si Imu = M2.
Si M est un A-module et si les M*, pour i€l, sont des sous-A-modules de M, alors
l'intersection des M* est un A-module. Ceci permet de définir le sous-A-module engendré
par une famille (ej)j€j d'éléments de M, comme l'intersection de tous les sous-A-modules
de M contenant les ej. Comme dans le cas des espaces vectoriels, ce module est l'ensemble
des combinaisons linéaires finies, à coefficients dans A, en les ej.
A l'exception (importante) de l'anneau End(V), où V est un espace vectoriel, tous les
anneaux que nous considérerons sont commutatifs ; sauf mention explicite du contraire,
« anneau » signifie « anneau commutatif » dans tout ce qui suit.
Un A-module M est de type fini si on peut trouver un ensemble fini ei,..., e<* d'éléments
de M tels que l'application (ai,..., a^) i-> aiei H f-a^d soit une surjection de Ad sur M ;
autrement dit, M est de type fini s'il admet une famille génératrice finie. Une différence
essentielle avec le cas des espaces vectoriels est qu'un A-module ne possède pas, en général,
de base sur A. Un module qui possède une base finie est dit libre de type fini.
• Un A-module M, libre de type fini, est isomorphe à Ar pour un unique r G N appelé le
rang de M.
Par définition, un A-module M, libre de type fini, est isomorphe à Ar pour un certain r (le
choix d'une base ei,... ,er fournit un isomorphisme (#i,... ,xr) •-* Yh=i x%ei de Ar sur M).
H s'agit donc de prouver que Ar = As implique r = s.
Supposons que s > r, et notons B 6 Msxr(A) la matrice de l'isomorphisme Ar —» As et
C g Mrxs(A) la matrice de son inverse; on a alors BC = ls et donc detBC = 1. Par ailleurs,
les s colonnes de BC sont des combinaisons linéaires des r colonnes Ci,..., cr de C. En utilisant
la multilinéarité du déterminant, vu comme une fonction des colonnes, on voit que detBC est
une combinaison linéaire de termes de la forme det(cjl,... ,CjH). Or tous ces termes sont nuls
114
VOCABULAIRE MATHÉMATIQUE
car s > r, ce qui fait que deux des jk sont égaux. Il s'ensuit que det BC = 0, ce qui conduit à
une contradiction qui permet de conclure.
Un A-module M est de torsion si, pour tout i e M, on peut trouver a € A - {0}, tel
que ax = 0. Un A-module de torsion non nul est un exemple de module ne possédant pas
de base puisque toute famille ayant plus d'un élément est liée. Un exemple typique de
A-module de torsion est A/I ou plus généralement J/I, où I C J sont des idéaux de A et
I ¥" {0} ; Par exemple, Z/DZ est un Z-module de torsion, si D ^ 2.
• Si A est intègre, et si M est un A-module, l'ensemble Mtors des éléments de torsion
(i.e l'ensemble des x € M tels qu'il existe a € A — {0} vérifiant a • x = 0) est un sous-A-
module de M (c'est le plus grand sous-module de torsion de M).
Si ax = 0 et by = 0, alors ab(x + y) = 0 et ab ^ 0 si a ^ 0 et b ^ 0 ; il s'ensuit que Mtors
est un sous-groupe de (M, +). De plus a(Xx) = 0 si ax = 0, ce qui prouve que Mt0rS est stable
sous l'action de A, et permet de conclure.
Exercice 10.1. (i) Soit A un anneau intègre noethérien, et soit M un A-module de type fini. Montrer
qu'il existe a € A - {0} tel que ax = 0 pour tout x € Mtors-
(ii) Soit M un Z-module de type fini. Montrer que Mt0rs est fini. Un Z-module de torsion est-il
nécessairement fini?
10.2.2. Structure des modules de torsion sur K[X]. Soit K un corps commutatif.
Comme le montre la discussion suivant le th 10.3 ci-dessous, un K-espace vectoriel de
dimension finie muni d'un endomorphisme K-linéaire u est la même chose qu'un K[X]-
module de torsion et de type fini. Ce changement de point de vue est particulièrement
intéressant à cause du théorème de structure (th. 10.3) ci-dessous, que le lecteur pourra
comparer avec le théorème de structure (th. 3.1) pour les groupes finis abéliens (nous
démontrons les deux simultanément au n° 10.3).
Un polynôme P e K[X] est dit irréductible s'il est de degré ^ 1 et si on ne peut pas
le factoriser sous la forme P = Q1Q2, avec Qi,Q2 € K[X] et degQi ^ 1, degQ2 ^ 1. Un
corps K est algébriquement clos si et seulement si les polynômes irréductibles de K[X]
sont de degré 1 ; les polynômes irréductibles de R[X] sont de degré 1 ou 2, ceux de Q[X]
ou de FP[X] ont des degrés arbitraires. On note i^Kpc] l'ensemble des polynômes unitaires
irréductibles de degré ^ 1.
Si Q e K[X], on note K[X]/Q (au lieu de K[X]/QK[X] ou K[X]/(Q)) le quotient de
K[X] par l'idéal engendré par Q.
Exercice 10.2. Montrer que K[X]/Q est un corps si Q € «^k(x)-
Théorème 10.3. Soit M un K[X]-module de torsion et de type fini. Si P € &k[x\>
soit Mp l'ensemble des x e M tués par une puissance de P.
(i) Mp est un sous-K[X]-module de M, nul sauf pour un nombre fini de P G ^k[x]> e*
M = 0P€^KIX)Mp.
10. RÉDUCTION DES ENDOMORPHISMES
115
(ii) // existe rp G N et une unique famille décroissante d'entiers ap^ ^ 1, tels que
Mp = ®l^rpK[X]/Pû^.
10.2.3. Exemples. Soit M un K[X]-module de torsion et de type fini, et soient ei,..., e^
engendrant M. Par définition, cela veut dire que (x\,..., xj) »-» X\e\-\ Yx^e^ de (K[X])d
dans M, est surjective. Par ailleurs, si P* G K[X] — {0}, pour i G {1,..., d}, vérifie P^i = 0
(de tels Pj existent puisque M est de torsion), alors le noyau de l'application précédente
contient (Pi) x • • • x (Pd), et donc M est un quotient de K[X]/Pi x • • • x K[X]/Pd, qui est
un K-espace vectoriel de dimension finie deg Pi • • • deg P^. On en déduit que M est un K-
espace vectoriel de dimension finie. De plus, la multiplication par X sur M est K-linéaire,
ce qui munit M d'un élément privilégié um de End(M).
Réciproquement, si V est un K-espace vectoriel de dimension finie, et si u est un endo-
morphisme de V, alors P i-> P(w) induit un morphisme d'anneaux de K[X] dans End(V).
Comme V est un End(V)-module, cela muni V d'une action de K[X] (où P G K[X] agit
par P(w) G End(V)), ce qui permet de voir V comme un K[X]-module; par construction,
on a uy = u. De plus, le K[X]-module V est de torsion car Min„ G K[X] tue tous les
éléments de V puisque, par définition, Min„ agit par Minu(u) sur V, et Mmu(u) = 0.
• Si V est un K-espace vectoriel de dimension finie, u, u' G End(V) sont conjugués (i.e. il
existe g G GL(V) tel que u' = gug~l) si et seulement si les K[X]-modules associés sont
isomorphes.
Il s'agit d'un pur exercice de traduction. Si M et M'sont des K[X]-modules, un isomorphisme
i : M = M' de K[X]-modules est une application K-linéaire qui commute aux actions de X, ce
qui se traduit par «m' o t = t o um. Maintenant, si M et M' sont associés à (V,u) et (V,u'),
on a M = M' = V en tant que K-espace vectoriel, avec um = u et uw = u'. L'hypothèse
M = M' se traduit donc par l'existence de i G GL(V) vérifiant vl o i = i o «, ce qui se traduit
par u' = gug~l si g = iTl. Pour montrer que M = M' si u' = gug~l, il suffit de reprendre les
traductions précédentes dans l'autre sens.
Exemple 10.4. (Modules cycliques) Soit Q = Xd + od_iXd_1 + • • • + a0 G K[X], avec
d ^ 1, et soit M = K[X]/Q. Alors la matrice de uM dans la base 1, X,..., Xd_1 est
/O ... 0 -oo \
1 '•• : —ai
; ••. 0 ;
\0 ... 1 -ad_ij
et les polynômes minimal et caractéristique de uu sont tous deux égaux à Q.
Par construction Q(X) est la multiplication par 0 sur M, et donc Q(um) = 0, ce qui implique
que le polynôme minimal de um divise Q. Par ailleurs, si P(«m) = 0, alors en particulier,
P(um) • 1 = P(X) est nul dans M = K[X]/Q, et donc P est un multiple de Q. Ceci prouve que
le polynôme minimal de um est bien Q.
Le polynôme caractéristique de wm, qui n'est autre que le déterminant de X — um> peut se
calculer en développant par rapport à la dernière colonne. Le coefficient de X + o^-i est le
AQ =
116
VOCABULAIRE MATHÉMATIQUE
déterminant d'une matrice (d-1) x (d-1), triangulaire inférieure, avec des X sur la diagonale, et
donc est égal à Xd_1. Si « > 2, le coefficient de a<i-i est (—l)i_1 x le déterminant d'une matrice
diagonale par blocs, un des blocs de dimension (d - i) x (d — i) étant triangulaire inférieur avec
des X sur la diagonale, et l'autre, de dimension (i - 1) x (i - 1), étant triangulaire supérieur
avec des -1 sur la diagonale; il est donc égal à (—l)i_1Xrf-i(—l)i_1 = Xd_i, et on a
det(X - uM) = (X + Orf-OX*"1 + ad_2Xd"2 + • • • + a„ = Q(X).
Exemple 10.5. (Modules nilpotents) Soit A € K, et soit M = K[X]/(X - \)d. Alors la
matrice de uu dans la base f\ = (X — A)rf-1, /2 = (X — A)d~2,..., fd = 1 est un bloc de
Jordan Ja.^.
On aX(X-A)d"i = (X-A)d-(i-1> + A(X-A)d"i, ce qui se traduit par uM(/i) = fi-i +\fû
si i ^ 1, et par «m(/i) = A/i car (X - A)d = 0 dans M.
10.2.4- Application à la réduction des endomorphismes
Lemme 10.6. Soit (Qi)i€i une famille finie d'éléments de K[X] de degrés > 1.
Si M = ©jGiK[X]/Qi, alors le polynôme minimal de Um est le ppcm des Q*, pour i el, et
le polynôme caractéristique de um est le produit des Q*, pour tel.
Le polynôme minimal de mm doit en particulier annuler K[X]/Qi pour tout i ; il doit donc
être divisible par Q* d'après les résultats de l'exemple 10.4, et donc aussi par le ppcm des Q*.
Réciproquement, le ppcm des Q* est divisible par Q* ; il annule donc K[X]/Qi pour tout i et
est un multiple du polynôme minimal de um ; d'où le résultat en ce qui concerne le polynôme
minimal de «m-
Pour calculer le polynôme caractéristique de «m> on remarque que chaque KpCj/Q* est
stable par um, et donc que la matrice de um est diagonale par blocs, avec un bloc pour
chaque i correspondant à l'action de um sur K[X]/Qi. Comme le polynôme caractéristique
d'une matrice diagonale par blocs est le produit des polynômes caractéristiques des blocs, les
résultats de l'exemple 10.4 permettent de conclure.
Soit V un espace vectoriel de dimension finie muni d'un endomorphisme u. On peut
supposer que V est un K[X]-module de torsion et de type fini, et que u est la multiplication
par X. Si on note Specu l'ensemble des P G &k[x] tels que Vp ^ 0 (dans les notations
du théorème 10.3), on déduit du lemme 10.6 le résultat suivant.
Corollaire 10.7. Si les apti sont les entiers définis au th. 10.3, alors
Minu(X)= [J P0"-1 et Càïu{X)= JJ piu+~+ap.rp.
PeSpectt P€Specu
Corollaire 10.8. (Cayley-Hamilton) Le polynôme minimal de u divise le polynôme
caractéristique de u.
C'est, modulo le résultat précédent, une traduction de l'inégalité op,i < op,i H h ap,rp.
Corollaire 10.9. Les conditions suivantes sont équivalentes.
(i) u est diagonalisable.
(ii) u est annulé par un polynôme scindé, sans racine double.
10. RÉDUCTION DES ENDOMORPHISMES
117
(iii) Specu est constitué de polynômes de degré 1, e^76* Min„ = riA€Specu(X — A),
(iv) Dans la décomposition V = ©pçspecu (©Ki^rp K[X]/Pap^), les éléments de Specu
sont de degré 1 et les apj sont tous égaux à 1.
L'équivalence des conditions (iii) et (iv) résulte du cor. 10.7.
Si u est diagonalisable, V est la somme directe de ses espaces propres Va, pour À G Specu.
Alors u - A est nul sur Va et donc riA€Spocu(u ~~ ^) est nu^ sur tous ^es ^à* et donc aussi
sur V. Comme respect* (^ ~~ ^) est scindé, sans racine double, cela prouve que (i)=>(ii).
Comme Minu divise tout polynôme annulant u, l'hypothèse (ii) entraîne que Minu est scindé,
sans racine double. Il s'ensuit, d'après le cor. 10.7, que les éléments de Specu sont de la forme
X - A, avec A G K, et que V ^ ©A€SPcc(u)(K[X]/(X - A))d\ ce qui prouve que (i)=>(iv).
Enfin, comme X agit par multiplication par A sur K[X]/(X-A), on voit que (K[X]/(X-X))dx
est contenu dans l'espace propre pour A, et un isomorphisme V = ©Aespcc(u)(K[X]/(X - X))dx
est donc équivalent à exhiber une base de V constituée de vecteurs propres, ce qui prouve que
u est diagonalisable, et que (iv)=>(i).
Ceci termine la démonstration.
Corollaire 10.10. Si V est un K-espace vectoriel de dimension finie, et si u G End(V)
est annulé par un polynôme scindé, alors V est la somme directe des sous-espaces
caractéristiques de u.
Pour les mêmes raisons que ci-dessus, le polynôme minimal de u est scindé, et donc les
éléments de Specu sont de la forme X - A, avec A G K. Le (i) du th. 10.3 nous fournit donc
une décomposition de V sous la forme ©aVx-à, et Vx-a est exactement l'ensemble des x G V
tués par une puissance de u - A ; autrement dit Vx-a est le sous-espace caractéristique de u
associé à la valeur propre A, et comme V = ©aVx-a> cela permet de conclure.
Corollaire 10.11. Si V est un K-espace vectoriel de dimension finie, et si u G End(V)
est annulé par un polynôme scindé, alors il existe une base de V dans laquelle la matrice
de u est sous forme de Jordan.
Comme ci-dessus, on déduit du th. 10.3 une décomposition V = ©îGiK[X]/(X - Xi)ai (dans
laquelle plusieurs A* peuvent être égaux). On conclut en utilisant le résultat de l'exemple 10.5,
selon lequel la matrice de la multiplication par X sur K[X]/(X - Xi)ai peut se mettre sous
forme de Jordan.
Corollaire 10.12. (décomposition de Dunford) Si V est un K-espace vectoriel de
dimension finie, et si u G End(V) est annulé par un polynôme scindé, alors u peut se
décomposer de manière unique sous la forme u = D + N, où D est diagonalisable, N est
nilpotent, et D et N commutent.
L'hypothèse implique que V est la somme directe des sous-espaces caractéristiques Va de u.
Soit D G End(V) défini par D(x) = As, si x G V\. Alors D est diagonalisable par construction,
et commute à u car u laisse stable les Va et la restriction de D à Va est une homothétie. De
plus, u - X est nilpotent sur Va par définition de Va, et donc u - D est nilpotent sur V (on a
(76)On se permet d'identifier un polynôme X - A de degré 1 avec sa racine A.
118
VOCABULAIRE MATHÉMATIQUE
(u - D)eA = 0 sur Va et donc (u - D)e = 0 sur V, si e = supA eA). Enfin, D commute à u - D
puisqu'il commute à n, ce qui prouve que la décomposition u = D + N, avec N = u - D, est de
la forme voulue. (On aurait aussi pu utiliser l'existence d'une base dans laquelle la matrice A
de u est sous forme de Jordan : on a A = D + N où D est la matrice diagonale ayant les mêmes
coefficients diagonaux que A, et N est triangulaire supérieure avec des 0 sur la diagonale, et
donc est nilpotente (et on a Nd = 0, si dim V = d) ; la commutation de D et N se vérifie bloc
par bloc.)
Réciproquement, si D et N commutent, ils commutent aussi à u et donc aussi à tout
polynôme en u. Soit À une valeur propre de u, et soit Va le sous-espace caractéristique associé. Si
x G Va, on aO = D((u-X)ex(x)) = (u- A)eA(D(a;)), et donc Va est stable par D. Maintenant,
par hypothèse, u - D est nilpotent, et donc sa restriction à Va Test. Par ailleurs, u - À est
nilpotent sur Va par définition, et comme u - D et u - À commutent puisque u et D
commutent, il s'ensuit que D - À = (u - À) - (u - D) est nilpotent sur Va (cf. ex. 2.1). Enfin, D
étant supposé diagonalisable, il est annulé par un polynôme P, scindé sans racine double. La
restriction de D à Va est aussi annulée par P, et donc est diagonalisable ; il en est donc de
même de D - À, et la nilpotence de D - À entraîne que D = À sur Va. D'où l'unicité.
La décomposition de Dunford est particulièrement utile pour calculer les puissances d'un endomor-
phisme (ou d'un matrice) : comme D et N commutent, et comme Nd = 0, la formule du binôme devient
un = Dn +nDn-1N + • ■ • + (d^1)Dn"d+1Nd-1, et si Ton dispose d'une base dans laquelle D est diagonal,
calculer les puissances de D se fait sans effort. Ceci s'applique, par exemple, à l'étude d'une suite
récurrente du type Xn+i = AXn, où A G M^(K), ce qui inclut les suites numériques vérifiant une relation de
récurrence du type un+d = a\un+d-i H h ûrfUn, pour tout n G N ; elles correspondent^77* à prendre
Xn = t(un,...,un+rf_i) et
/0 1 0\
A =
0 ... 0 1
\ad .. a2 ai/
10.3. Modules de torsion sur les anneaux principaux
Les anneaux Z et K[X] sont principaux (cf. alinéa 4.2.1), ce qui fait que le théorème 10.13
ci-dessous a pour conséquences les th. 3.1 et 10.3.
Soit A un anneau principal (cf. alinéa 4.2.2), et soit <^A l'ensemble des idéaux premiers
non nuls de A. Choisissons pour tout élément de <^a un générateur, et identifions <^a à
Pensemble de ces générateurs. Si p G <^a, alors A/p est un corps.
De plus, tout élément non nul x de A se factorise, de manière unique, sous la forme
x = uHpe^ApVp(<X)' où u est inversit>le dans A. Si rci,... ,xn G A, soit pgcd(xi,... ,xn)
le générateur llpe^A pinfi(Vp(a?i)) de Pidéal (rci,... ,xn) : cet idéal est A (ce qui équivaut à
ce que Xi,... ,rcn sont premiers entre eux), si et seulement si mU(vp(xi)) = 0 pour tout
(77)Cela dit, pour étudier une telle suite, il vaut mieux considérer la série génératrice Z)SUnTn' la
multiplier par 1 - a\T a^Td pour obtenir un polynôme P, et décomposer la fraction rationnelle
i-aiT-P..-a(iTJ en éléments simples.
10. RÉDUCTION DES ENDOMORPHISMES
119
Si M est un A-module, et si a G A, on note aM C M l'image du morphisme x »-> ax
de A-modules. C'est un sous-A-module de M, et le quotient M/aM est, par construction,
tué par a ; l'action de A sur M/aM se factorise donc à travers A/a, ce qui fait de M/aM
un A/a-module. En particulier, si p G <^a, alors M/pM est un espace vectoriel sur le
corps A/p.
Théorème 10.13. Soit M un A-module de torsion et de type fini. Si p G <^a> soit Mp
l'ensemble des x G M tués par une puissance de p.
(i) Mp est un sous-A-module de M, nul sauf pour un nombre fini de p} et M = ©pG^AMp.
(ii) Si rp = dimA/p(M/pM), alors il existe une unique famille décroissante d'entiers
aPyi ^ 1, pour l^i^rp, telle que Mp = ei^^A/p"^.
Si pax = 0 et pby = 0, alors psup(a,6)(Aa; + fiy) = 0 quels que soient \,/jl G A. On en déduit
que Mp est un sous-A-module de M.
Soient x\,...,Xd engendrant M. Si i G {l,...,d}, soit À* G A tel que XiXi = 0, et soit
\ = Ai • • • Àrf. On a Xx = 0 quel que soit a; G M. Si p G &a ne divise pas À, et si a; G Mp
est tué par pa, alors x est tué par tout élément de l'idéal (A,pa) de A engendré par À et pa,
c'est-à-dire par A, puisque À et pa sont premiers entre eux. On a donc x = 0, et Mp = 0 si p
ne divise pas À.
Soit ^a(A) C &a l'ensemble des diviseurs premiers de A, et soit A = IlPe&>A(\)Pnp la
factorisation de A en facteurs premiers. Les -è^-, pour p G «^a(A) sont premiers entre eux dans
leur ensemble. Il existe donc, d'après le théorème de Bézout, des éléments ap de A tels que
l'on ait X)pg^a(A) ap^k = 1- On en déduit que l'on peut décomposer tout élément xdeM
sous la forme J2Pe&>A(\) xp> avec xp = f^ir^* et xp e Mp car xp est tué par pn*\ En résumé,
M = EpG^MP-
Enfin, si xp G Mp, pour p G ^a(A), et si J2Pe^A(\)xP = °> alors xp = -J2e^pxe est à
la fois tué par pn*> et par p~~nr\ qui sont premiers entre eux par définition de np. On a donc
xp = 0 quel que soit p, ce qui termine de démontrer le (i).
Passons à la démonstration du (ii). Commençons par montrer que l'on peut calculerrp en ne
considérant que Mp. Si £ G ^a est distinct de p, la multiplication par p induit une surjection
sur M^ : en effet, il existe n tel que £nMe = 0, et comme p et ln sont premiers entre eux, il
existe a, 6 G A tels que ap + b£n = 1. Les multiplications par a et p sont inverses l'une de
l'autre sur M^, et donc Me/pMe = 0. Il en résulte que rp est aussi la dimension de Mp/pMp
sur A/p.
La démonstration du (ii) va se faire en deux étapes. On commence par démontrer, par
récurrence sur r = rp (le cas r = 0 étant vide), l'existence d'une décomposition sous la forme
voulue, puis on démontre, toujours par récurrence, l'unicité de la famille ap^.
Si a; G Mp, on note n(x) le plus petit n G N tel que pnx = 0. Donc pn^x = 0 et
pn(x)-ix ^ o, si n(x) ^ 1. Soient e\ G Mp réalisant le maximum de n(#), pour x G Mp (comme
n(x) ^ np, pour tout x G Mp, il existe un tel ei), et ai = n(ei). Soit N = Mp/(A/pai)ei. Alors
N/pN est, d'après le lemme 10.14 ci-dessous (avec M = Mp, M7 = pMp et M" = (A/pai)ei), le
quotient de Mp/pMp par le sous-(A/p)-espace vectoriel engendré par l'image de ei, et comme
cette image est non nulle (sinon, on aurait ei = pf et n(f) = n(ei) + 1 > n(ei)), on en déduit
que dimA/p(N/pN) = r - 1, ce qui permet d'appliquer l'hypothèse de récurrence àN. Il existe
donc ë2,... ,ër G N et a* ^ • • • ^ aT tels que N = @2&^r(A/pai)êi.
120
VOCABULAIRE MATHÉMATIQUE
Soit ej G Mp un relèvement quelconque de ë*. On a alors pa£ej = fc^ei, avec bi G A,
bien défini modulo pai. Comme pûlej = 0, on en déduit que pai~~aibi G paiA, et donc que
bi G paiA. Soit Ci = p~~aibi G A, et soit e* = ej - qei. On a alors paiei = 0. Maintenant,
soit x G Mp, et soit x son image dans N. Il existe alors À2 G A/pû2,..., Àr G A/pa?, uniques,
tels que x = À2Ê2 + • • • + Arër. Comme paiei = 0, l'élément À^i de Mp est bien défini, et
* - E!=2 xiei e (A/pûl)ei, et donc Mp = (A/pa')el + ((A/pû2)e2 © • • ■ © (A/pa')er). De plus,
(A/pûl)ei n ((A/pû2)e2 © • • • © (A/pûr)er) = 0 car un élément de l'intersection a une image
nulle dans N, et que a; ■-* x induit une bijection de (A/pû2)e2 © • • • © (A/pûr)er sur N. Il en
résulte que Mp = (A/pai)ei © (A/pa2)e2 © • ■ • © (A/pûr)er. Comme ai ^ a2, cela fournit une
décomposition de Mp sous la forme voulue.
Il reste l'unicité des aPii. Supposons que Mp = ©i^r(A/pai)e* = ®i^j^s(A/pbj)fj, avec
ai ^ a>2 ^ •• ar ^ 1 et 61 ^ 62 ^ - -• ^ 65 ^ 1. Soit n(Mp) le maximum des n(#), pour
a; G Mp. Alors n(Mp) = ai et n(Mp) = 61, et donc ai = 61. Maintenant, on peut écrire
ei sous la forme e\ = J2Sj=iXjfj> et comme pai"le\ ^ 0, cela implique qu'il existe j tel
que pai~~l\jfj i=- 0. En particulier, on a pai~lfj ^ 0, ce qui prouve que bj ^ a\ = b\ et
donc que bj = 61. Quitte à permuter les fj, on peut donc supposer j = 1. La propriété
Pai"1Ai/i ^ 0 implique alors (car ai = 61) que Ai ^ pA, et donc que Ai est premier à p
et pai, et est inversible dans A/paiA. En notant /ii son inverse, cela permet d'écrire /1 sous la
forme \i\e\ - £j=2Mi^j fj, ce qui prouve que l'on a aussi Mp = (A/p6l)ei ©2<j<« (A/P60/.r
On en déduit que Mp/(A/pbl)ei = ©2^r(A/pûi)ei = @2^j^s(A/pbj)fj, et une récurrence
immédiate permet d'en conclure que l'on a a* = bi quel que soit i (et donc aussi que r = s).
Ceci termine la démonstration.
Lemme 10.14- Soient M un A-module, et M'jM" dewz sous-modules de M. i4/ors :
(i) M7 + M" = {x + y, x e M', y e M"} es* un sous-module de M ;
(ii) l'image de M' dans M/M" est™ M'/(M' n M") e* celle de M" dans M/M7 est
M7(M' n M") ;
(iii) les A-modules (M/M")/(M7(M' n M")) et (M/M')/(M7(M' n M")) sont
naturellement isomorphes à M/(M' + M") ; en particulier, ils sont isomorphes entre eux.
Le (i) est immédiat. Maintenant, la composée de l'injection de M7 dans M avec la projection
de M sur M/M" fournit un morphisme de A-modules dont le noyau est M7 n M77 ; l'image est
donc isomorphe à M7/(M7 nM"). L'argument étant le même dans l'autre cas, en inversant les
rôles de M7 et M", cela démontre le (ii).
Enfin, l'application naturelle de M7 dans (M7 + M77)/M77 est surjective (si x G M7 et y G M77,
alors l'image de x + y est aussi celle de x), et son noyau est M7 n M77. L'image de M7 dans
M/M77 est donc aussi (M7 + M77)/M77, ce qui fait que
(M/M77)/(M7/(M7 n M77)) = (M/M77)/((M7 + M77)/M77) = M/(M7 + M77).
(Le noyau de la projection de M sur M/(M7 + M77) contient M7 et donc cette projection se
factorise à travers M/M7 ; comme l'application induite est surjective et que son noyau est
(M7 + M77)/M77, cela fournit l'isomorphisme (M/M77)/((M7 + M77)/M77) = M/(M7 + M77) ci-
dessus.) On en déduit le (iii).
(78)pjus exactement : « est naturellement isomorphe à »
10. RÉDUCTION DES ENDOMORPHISMES
121
Exercice 10.15. Soit G un groupe, et soient G', G" deux sous-groupes distingués de G.
(i) Montrer que G' n G" et G'G" = {xy, x € G' y € G"} sont des sous-groupes distingués de G.
(u) Montrer que (G/G')/(G7(G' n G")) et (G/G")/(G7(G' n G")) sont isomorphes. (On pourra les
comparer à G/(G'G").)
10.4. Modules sur les anneaux principaux
On continue à supposer que A est un anneau principal. Nous allons étendre le théorème
de structure aux A-modules de type fini pas nécessairement de torsion. Un tel module
M peut se décomposer sous la forme (cf. alinéa 10.4.3), M = Ar 0 Mtors, où Mtors est
l'ensemble des éléments de torsion de M, et est un module de type fini et de torsion (on
peut donc utiliser le th. 10.13 pour le décrire), et r est le rang de M. En particulier, un
groupe commutatif de type fini M peut se décomposer sous la forme M = Zr 0 Mt0rs> où
Mtors est un groupe fini (cf. ex. 10.1).
104-1. Opérations matricielles
Si M € Mnxm(A), et si j ^ inf(n,m), on note Ij(M) l'idéal de A engendré par les
mineurs d'ordre j de M.
• I^UMV) = L,(M), si U e GLn(A) et V e GLm(A).
Il suffit de prouver que l'idéal engendré par les mineurs d'ordre j ne change pas si on
multiplie M à gauche ou à droite par une matrice inversible, et il suffit de traiter l'un des deux
cas, l'autre s'en déduisant par passage à la transposée. Une colonne deMV est une combinaison
linéaire à coefficients dans A des colonnes de M. Il s'ensuit qu'un mineur de MV, vu comme
une forme alternée sur les colonnes de MV, est une combinaison linéaire, à coefficients dans A,
de mineurs de M, et donc que Ij(MV) c Ij(M). Si V est inversible, on peut appliquer ce qui
précède à MV et V"1 au lieu de M et V pour en déduire l'inclusion dans l'autre sens. On en
déduit le résultat.
Si s = inf(n,m), on note Diag(<5i,... ,6S) la matrice (a^) € Mnxm(A) définie par
û»,t = h, si i ^ s, et dij = 0 si i ^ j (si n = m, les matrices de ce type sont exactement
les matrices diagonales).
• Soit M e Mnxm(A).
o II existe ô\,... ,6S) uniquement déterminés à multiplication près par des unités de A,
tels que ôi \ Ô2 | • • • | ôs et Ii(M) = (<5i), I2(M) = (6162),... (les Sj sont les diviseurs
élémentaires de M).
o II existe U e GLn(A) et V e GLm(A) telles que UMV = Diag(^,... ,£s).
Remarquons que Ij(Diag(Ji,...,£*)) = (£1 • • -fy), si ôi \ ô2 \ ••• | Ss. Le premier point
résulte donc du second et du résultat précédent.
Passons à la démonstration du second point. On peut faire agir G = GLn(A) x GLm(A)
sur Mnxm(A) par (U, V) • M = UMV-1. L'énoncé à démontrer peut alors se paraphraser sous
la forme : dans l'orbite de M sous l'action de G (cette orbite est l'ensemble des UMV-1 pour
(U, V) € G, et donc aussi celui des UMV, puisque (U,V-1) € G si (U, V) € G), il existe une
122
VOCABULAIRE MATHÉMATIQUE
matrice Diag(5i,... ,55), avec Si | ••• | 6S. Nous allons démontrer*79) l'existence de M0 par
récurrence sur s, le cas s = 0 étant vide.
Si M = (aiyj) G Mnxm(A), on note ô(M) le pgcd des aiyj (c'est un générateur de Ii(M)).
Notons que 5(UMV) = Ô(M) si U G GLn(A) et V G GLm(A), puisque Ii(UMV) = I^M).
Si a G A-{0}, notons £(a) la longueur de a, i.e. le nombre de facteurs premiers de a, comptés
avec multiplicité (par exemple, si A = Z, et a = -120 = -23 • 3 • 5, on a £(a) = 3+1 + 1 = 5).
Si M = (dij) G Mnxm(A), on note £(M) le minimum des t(a,iyj), et on choisit un couple
(h j) tel que £(a>iyj) = £(M). Quitte à multiplier M à droite et à gauche par des matrices de
permutation, ce qui fournit un élément de l'orbite de M, on peut supposer que (i, j) = (1,1),
et donc que £(aiyi) = iaf ij£(aij). Comme ô(M) divise ai,i, on a Z{a>iyi) ^ £(S(M)) et il y a
deux cas :
o ^(ûi.i) = £(ô(M)), ce qui signifie que aiyi = a<S(M), où a est une unité dans A, et
donc que aiyi divise aij pour tout (i, j). On peut alors écrire M, par blocs, sous la forme
(aï(M)l tm£ )> avec u e M(n-i)xi(A), v G Mlx(m_1}(A) et M' G M(n_1)x(m_1}(A). Soient
U0 = (°Lu i°_x) et V0 = (S î^J î alors U0MV0 = (J^mVJ- Maintenant, on peut
appliquer l'hypothèse de récurrence à M'0 et trouver U7 G GLn_i(A) et V G GLm_i(A) tels
que U'M^V = Diag(*'lf... ,5^), avec S[ | ... | 6'^. Si U = (J °,) et V = (J£), alors
UU0MV0V = (^ *(M)U°M, V' ) = Diag(5(M),S(M)S[,..., S(M)6'3_l) est de la forme voulue.
o *(ûi,i) > l(S(M)). Dans ce cas, nous allons construire U G GLn(A) et V G GLm(A)
tels que £(VMV) < ^(M), ce qui nous permettra de recommencer en partant de UMV au lieu
de M. Comme £(M) ne peut pas baisser indéfiniment, au bout d'un nombre fini d'étapes, on
se retrouve dans le cas £(M) = C(S(M))y ce qui permet de conclure d'après ce qui précède.
L'hypothèse t(aiyi) > C(ô(M)) implique qu'il existe aiyi tel que £(pgcd(aifi,aij)) < £(aiyi)
[sinon ai,i diviserait aiyj pour tout (i, j), et on aurait ai,i | ô(M) et £(aiyi) < £(S(M))]. Il y a
trois cas :
o II existe,? tel que aïyi ne divise pas aij. Quitte à multiplier par une matrice de permutation
à droite, on peut supposer j = 2. D'après le théorème de Bézout, il existe alors u,v G A tels
que uai,i + va\y2 = a, si a = pgcd(aifi,aij) (on a donc £(a) < ^(M)). Soit V la matrice par
blocs (Y i,,^), avec V = (j) "Jj"^)- Alors v' est à coefficients dans A puisque a divise
01,1 et ai,2 et son déterminant vaut 1. Il en résulte que V G GLm(A) (et même V G SLn(A)).
Par ailleurs, si MV = (biyj)y on a &i,i = ua\yi + vaiy2 = a, et donc £(MV) < £(M), ce que l'on
cherchait.
o II existe j tel que a\y\ ne divise pas a^i. Ce cas se ramène au précédent en prenant les
transposées.
o ûi,i divise aïyj et aiy\ pour tous j. Auquel cas, on peut trouver U et V inversibles tels
que UMV soit une matrice par blocs de la forme (aJ)1 ^,) (cf. le cas C(aiyi) = C(S(M))).
<79)La démonstration fournit une construction algorithmique deU, V et M0, à condition de savoir vraiment
exprimer le pgcd d de deux éléments a et 6 de A sous la forme d = au + bv ; si A est euclidien, on peut
utiliser l'algorithme d'Euclide pour ce faire. On peut même combiner les deux algorithmes en essayant
de minimiser le minimum de la taille des coefficients de UMV au lieu de leur longueur ; cela permet de
montrer que l'on peut imposer à U et V d'être des produits de matrices ayant des 1 sur la diagonale, et un
seul coefficient non diagonal non nul. Le résultat est que l'on peut parfaitement, de nos jours, demander à
un ordinateur de calculer les diviseurs élémentaires d'un sous-Z-module de Zn ou d'un sous-K[X]-module
de (K[X]r.
10. RÉDUCTION DES ENDOMORPHISMES
123
Quite à remplacer M par UMV, on peut donc supposer que M = (aJ)1 ^, ). L'hypothèse
^(ûi.i) > t(S(M)) implique qu'il existe aiyj non divisible par a^i et, quitte à multiplier M
par des matrices de la forme (q u0 et (o v' )> où U' et V sont des matrices de permutation,
on peut supposer que a^i ne divise pas 02,2- Comme ci-dessus, il existe u,v G A tels que
e(ualyl + va2t2) < t(al%l). Or on a ( J ?)(g °)( J ?) = (au«dv J) ; on en déduit que si U et V
sont les matrices par blocs U = (tf ^J V = (£ ^oj, avec U7 = (J?) et V7 = (J?),
alors UMV admet uai,! + va2t2 parmi ses coefficients (2-ième ligne et 1-ère colonne) et donc
que £(UMV) < ^(M), ce que l'on cherchait à obtenir.
104-%• Sous-modules de modules libres
On note F le corps des fraction de A.
# Soit À un sous-A-module de An. Alors il existe une base /1,... ,/n de An sur A, un
entier r < n, et des éléments 8\ \ 82 | • • • | Sr non nuls de A tels que £1/1,..., ôrfr soit une
base de A sur A. De plus, r et ô^... ,ôr sont déterminés de manière unique (r est appelé
le rang du A-module A ; c'est la dimension du sous-F-espace vectoriel de Fn engendré
par A).
Soit r la dimension du sous-F-espace vectoriel V de Fn engendré par A. Soit I l'idéal de
A engendré par les mineurs d'ordre r de toutes les matrices n x m, pour m ^ r, obtenues
en écrivant m éléments de A dans la base canonique de An sur A. Comme A est noethérien,
il existe une famille finie (Mj)jçj de telles matrices dont les mineurs d'ordre r engendrent I,
et la matrice M obtenue en utilisant tous les éléments de A apparaissant dans les M,,- a pour
propriété que ses mineurs d'ordre r engendrent I.
D'après le point précédent, on peut trouver des matrices U G GLn(A) et V G GLm(A)
telle que UMV = Diag(5i,..., ôs), avec Sj = 0 si j ^ r + 1 et (ôi • ■ ■ ôr) = I. Or multiplier à
droite par V revient à faire des combinaisons linéaires des colonnes de M, ce qui nous donne
d'autres éléments de A, et multiplier à gauche par U revient à changer la base de An sur A dans
laquelle on calcule les coordonnées des éléments de An. On a donc trouvé une base /1,..., fn
de An sur A telle que S\f\y..., 5TfT appartiennent à A. De plus, si #1,...,xm G A, les mineurs
d'ordre r de la matrice des Xj dans la base des fi sont aussi ceux de UM7, où M' est la matrice
des Xj dans la base canonique de An, et comme Ir(UM7) = Ir(M7), on déduit de la définition
de I et de ce que (ô\ • ■ ■ ôr) = I que A = ô\... ôn divise tout mineur d'ordre r de la matrice
des Xj dans la base des fi. Montrons que ceci implique que 5i/i,... ,5r/r est une base de A
sur A, ce qui prouvera l'existence.
Comme /i,.--,/r est libre sur F, il en est de même de £1/1,. -. ,Srfr qui est donc une
base de V sur F, puisque V est de dimension r par définition de r. Si a; G A, on peut donc
écrire x, de manière unique, sous la forme J2l=i Wifu avec Ai,... ,Àr G F, et on cherche à
prouver que À^ G A, pour tout j. Les mineurs d'ordre r de la matrice dont les colonnes sont
^1/1 > • ■ ■ > ôrfr y x dans la base f\,..., fn appartiennent à A et sont divisibles par A d'après la
discussion ci-dessus. En considérant le mineur obtenu en ne gardant que les r premières lignes
en enlevant la j-ième colonne, on en déduit que AÀ^ est divisible par A, ce qui prouve que
Xj G A pour tout j, et donc que 5i/i,..., Srfr engendrent A.
Ceci prouve l'existence. L'unicité se déduit de l'alinéa 10.4.3 appliqué àM = An/A.
• Un sous-A-module d'un A-module libre de rang fini est libre de rang plus petit.
C'est une paraphrase un peu appauvrie du point précédent.
124
VOCABULAIRE MATHÉMATIQUE
Un sous-A-module de Fn est un réseau (ou un A-réseau) s'il est de type fini et s'il
engendre Fn ; par exemple An est un réseau de Fn : c'est le réseau standard.
• Si A est un réseau de Fn, il existe une base fu..., fn de An sur A et Su ..., Sn e F*,
tels que Sifi,... ,Snfn soit une base de A sur A; en particulier, un réseau A de Fn est
libre de rang n sur A et une base de A sur A est aussi une base de Fn sur F.
Soient x\}... ,xm engendrant A sur A. Il existe alors bi € A - {0} tel que biXi € An [si
xi = Y%=i ^±ei-> on Peut Pendre bi = Yl^=iKjh et on a donc bxi € An pour tout i, si
b = ni^i &»• H s'ensuit que 6A est un sous-A-module de An, et comme il engendre Fn, il est
de rang n et il existe une base /i,..., fn de An sur A et S[,...,S'n € A, tels que #i/i,..., ô'nfn
soit une base de 6A sur A. Alors 6-1<Si/i,..., b~l8'nfn est une base de A sur A.
• Si Ai, A2 sont des réseaux de Fn avec Ai C A2, il existe une base /1,..., fn de A2 sur A
et Siy..., Sn e A, tels que Sifi,..., Snfn soit une base de Ai sur A.
D'après le point précédent, A2 est libre de rang n sur A et le choix d'une base permet de se
ramener au cas A2 = An qui découle de ce qui précède.
Exercice 10.16. Soient n ^ 2 et 01,... ,an € Z, premiers entre eux dans leur ensemble. Montrer qu'il
existe A € SLn(Z) dont la première colonne est *(ai,... ,an).
10.4-3. Modules de type fini
• Si M est un A-module de type fini, il existe r € N, Si,... ,SS e A, avec Si £ A* et
Si \ S2 \ - - \ Ss, tels que M = Ar © A/<5i © • • • 0 A/ôs. De plus, r et les idéaux (<5i),..., (Ôs)
sont uniquement déterminés.
Soient xi>...txn une famille génératrice de M. On dispose donc d'un morphisme surjectif
(01,.. .,On) *-* J27=i aixi de A-modules de An sur M. Notons A le noyau, de telle sorte que
M = An/A. D'après l'alinéa précédent, il existe une base /i,- •• ,/n de An, et des éléments
$1,...,$ de A, avec ô[ \ ••• \ ô't, tels que ^/i,. ..,ô'tft soit une base de A sur A. Alors
M ^ A/Ô[ e • • • © A/ô't © An_t, et on en déduit l'existence avec r = n - t, en supprimant les
aï qui sont des unités.
Passons à l'unicité. On est ramené à prouver que si l'on dispose d'isomorphismes de A-
modules M s An © A/(61) © • • • © A/{5S) et M ~ Am © A/(S[) © • • • © A/(^,), où r,r' € N,
et S\ | 62 | • • • | ô3 et Ô[ | 6'2 | • • • | ô's,, alors n = m, s = s', et (<$*) = (5^) pour tout i ^ s.
Commençons par constater que A/(<5i) © • • • © A/(ôs) et A/(<5'1) © • • • © A/(^/) sont isomorphes
au sous-A-module Mt0rs de M. Les isomorphismes ci-dessus induisent donc un isomorphisme
An S M/MtorS = Am, et donc n = m.
On est donc ramené au cas où M = Mt0rs et n = m = 0. Si p € &a, soit aPyi = vp(ôs-i) et
bPti = vP(<5s/_i). Alors aPti ^ oP)i+i puisque <5s_i_i | 63-i et bPti ^ 6Pii+i puisque ^/.^i | S'sl_v
D'après le th. des restes chinois, on a A/(5s-i) = ©pe^AA/p0"1' et A/(5's,_i) = ©P6.^»AA/p6,,,S
et on déduit de l'unicité dans le th. 10.13 que aPti = bPti pour tous p,i, ce qui prouve que
{5s-i) = (ô3>-i) pour tout i, et donc que s = s' et (<$*) = (ô^) pour tout i.
• Si A e Mn(K), le K[X]-module correspondant à Kn muni de l'endomorphisme «a est
le quotient M de (K[X])n par le sous-K[X]-module engendré par les Xe* - ua(^)j ou
ei,..., en est la base canonique de Kn et K[X]n. On peut donc utiliser l'algorithme décrit
10. RÉDUCTION DES ENDOMORPHISMES
125
dans l'alinéa 10.4.1 pour mettre M sous une forme sympathique ou pour déterminer son
polynôme minimal et son polynôme caractéristique.
L'application naturelle Kn c (K[X])n —> M est surjective car Xnej a même image que u%(ei),
si n € N; elle est injective car YZ=i ^%e% = Z)?=i p* (Xet _ ^A(ei)) dans (K[X])n implique,
en regardant les termes de plus haut degré, que les Pi sont nuls et donc aussi les Ai ; elle est
donc bijective, et on s'est débrouillé pour que la multiplication par X dans M correspondent à
l'action de ua sur Kn.
Maintenant, si M ^ (K[X]/Pi) 0 • • • 0 (K[X]/Pn), avec Pi | • • • | P», le polynôme minimal
de la multiplication par X est Pn et son polynôme caractéristique est Pi • • • Pn (lemme 10.6).
10.5. Extension des scalaires
La réduction des endomorphismes est plus agréable sur un corps algébriquement clos ;
on peut s'y ramener en étendant les scalaires : par exemple, un R-espace vectoriel peut
se complexifier en un C-espace vectoriel.
10.5.1. Complexification d'un espace vectoriel réel
Si V est un R-espace vectoriel, on note Vc le R-espace vectoriel V © iV (un élément
de Vc s'écrit de manière unique sous la forme x + iy, avec x, y G V) ; en particulier, V
est un sous-R-espace vectoriel de Vc- On fait*80) de Vc un C-espace vectoriel en faisant
agir a + ibe C sur Vc par la formule évidente (a + ib)(x + iy) = (ax — by) + i(ay + bx) ;
le C-espace vectoriel ainsi obtenu est le complexifié du R-espace vectoriel V.
• Si V est de dimension finie, et si ei,... ,en est une base de V sur R, alors c'est aussi
une base de Vc sur C.
On peut écrire tout élément de V, de manière unique, sous la forme Y%=kxkek> avec
xi,... ,xn € R, et donc on peut écrire tout élément de Vc = V 0iV, de manière unique, sous
la forme Y^=k xkek + « J2ï=k Vkek, avec «î. • • • » «n» »i» • • • » y* € R, ce qui prouve que l'on peut
écrire tout élément de Vc, de manière unique, sous la forme Yl7=k zkek, avec Zk = Xk+iyic € C.
• Vc vérifie la propriété universelle suivante : si u : V —> W est R-linéaire, et si W est un
C-espace vectoriel, alors il existe une unique application C-linéaire uq '■ Vc —» W dont
la restriction à V est u.
Si uc : Vc —» W est C-linéaire et coïncide avec u sur V, alors uc(x + iy) = u(x) + iu(y), si
xyy € V; on en déduit l'unicité d'une application linéaire wc étendant u à Vc- Maintenant,
la formule uc(x + iy) = u(x) + iu(y) définit une application de Vc dans W qui est R-
linéaire de manière évidente; sa C-linéarité résulte du calcul suivant : uc((a + ib)(c + iy)) =
uc((ax — by) + i(ay + bx)) = u(ax — by) + iu(ay + bx) = (au(x) — bu(y)) + i(au(y) + bu(x)) =
(o + ib)(u(x) + iu(y)) = (o + ib)uc(x + iy). D'où l'existence.
Si u : Vi —> V2 est un morphisme de R-espaces vectoriels, on peut composer u avec
l'injection de V2 dans V2,c> et le point précédent implique que le résultat s'étend, de
manière unique, en une application C-linéaire Uq : VJ(c —> V2)c- Si Vi et V2 sont de
dimension finies, si ei,... ,em est une base de Vi sur R (et donc aussi une base de V^c
(80>Nous laissons au lecteur le soin de vérifier que Ton obtient bien ainsi un C-espace vectoriel.
126
VOCABULAIRE MATHÉMATIQUE
sur C) et /i,...,/n est une base de V2 (et donc aussi une base de V2(c sur C), les
matrices de u et uq dans ces bases sont les mêmes puisque uq{&j) = u(ej). En particulier,
si Vi = V2, alors u et uc ont le même polynôme caractéristique, et donc les mêmes valeurs
propres (réelles).
• Si u G End(V) n'a pas de valeur propre, u laisse stable un sous-espace de dimension 2.
Si u n'a pas de valeur propre, toutes les valeurs propres deuc sont non réelles. Si A = a+ib>
avec b ^ 0, est une valeur propre non réelle de wc> et si z = x + iy € Vc - {0}, avec x, y € V,
est un vecteur propre de «c pour la valeur propre A, cela se traduit par u(x) + iu(y) =
(a + ib)(x + iy) = {ax - by) + i(ay + bx), et donc par u(x) = ax - by et u(y) = ay + bx.
De plus, x et y ne sont pas colinéaires car si y = ex, cela nous donne u(x) = (a — bc)x et
cu(x) = (ac + &)#, et donc ac + b = ca — bc2, et b = 0. Il en résulte que le plan engendré par x
et y est stable par u, et que la matrice de u dans la base x, y de ce plan est ( _?6 J ).
• Si /x est une valeur propre de wc> alors JL aussi et les multiplicités de \i et /Z sont les
mêmes ; si uç> est diagonalisable et si ses valeurs propres (répétées avec multiplicité) sont
Ai,..., Ar,/zi,7Zï\... ,//s,/ZI, où Ai,..., Ar sont réelles, et fij = aj + ibj, avec ajybj G R et
bj 7^ 0, alors il existe une base de V dans laquelle la matrice de u est la matrice diagonale
par blocs Diag(Ai,..., Ar, (_% £),..., (\ £))•
Comme C est algébriquement clos, les valeurs propres de ttc (avec multiplicité) sont les
racines de CarUc = Caru- Le premier énoncé résulte donc de ce que Caru € R[X).
On peut supposer que V est un R[X]-module de torsion, et que u est la multiplication par X,
et le th. 10.3 nous fournit une décomposition V = ©pespcc«( ©i<KrP R[X]/Pap<), où les P
sont irréductibles (de degré 1 ou 2). Alors Vc — ©P€Spccu(©i<i^rP C[X]/Pap,<). Par ailleurs,
C[X]/POI>< s (C[X]/(X - n)api) © (C[X]/(X - /I)ap<), d'après le th. des restes chinois, si
P = (X - /j)(X — /I) et il ^ Jl. L'hypothèse selon laquelle ttc est diagonalisable implique donc,
d'après l'équivalence entre les (i) et (iv) du cor. 10.9, que lesap,* sont tous égaux à 1. On en
déduit une décomposition V s* (©|=1R[X]/(X-Ai))e(e|=1R[X]/(X2-2ojX+o^+6^)), et pour
conclure il suffit de remarquer que dans la base X-a, b de R[X]/(X2—2aX+a2+62), où b ^ 0, la
matrice de la multiplication par X est ( f6 J) car X (X-o) = a(X-o)-66+(X2-2oX+o2+62)
etX6 = 6(X-o) + a6.
10.5.2. Extension des scalaires à un sur-corps
Si K C L sont des corps, et si V est un K-espace vectoriel, on peut transformer V en un
L-espace vectoriel en étendant les scalaires de K à L (si K = R et L = C, cette opération
correspond à la complexification d'un espace vectoriel réel étudiée dans le n° précédent) ;
le L-espace vectoriel Vl (noté aussi L<g>K V) que l'on obtient est V extension des scalaires
deK à L de V ; il est caractérisé (à isomorphisme unique près) par la propriété universelle
suivante : V est un sous-K-espace vectoriel de Vl engendrant Vl et, si u : V —> W est une
application K-linéaire de V dans un L-espace vecoriel W, il existe une unique application
L-linéaire Ui, : Vl —» W dont la restriction à V est u.
Si Vl et VL sont deux extensions de scalaires de V, ce sont des en particulier des L-
espaces vectoriels, et id : V —» V s'étend, de manière unique, en des applications L-linéaires
u : Vl -» V'L et u' : V'L -» Vl- Mais alors u' o u : VL -» Vl est une application L-linéaire
10. RÉDUCTION DES ENDOMORPHISMES
127
dont la restriction à V est l'identité ; par unicité d'une telle application, on en déduit que
u' ou est l'identité de VL. De même, uou' est l'identité de Vl, ce qui prouve que u et v!
sont des isomorphismes inverses l'un de l'autre et donc que Vl est uniquement déterminé à
isomorphisme unique près (s'il existe).
Il nous reste à construire Vl- Pour cela, partons du L-espace vectoriel L<v) des applications
de V dans L ne prenant qu'un nombre fini de valeurs non nulles. Si a; G V, on note ex l'élément
de L<v) défini par ex(x) = 1 et ex(y) = 0 pour tout y ^ x. Alors (ex)x€v est une base de L<v).
On définit Vl comme le quotient de L<v) par le sous-L-espace vectoriel R engendré par les
ex+y — ex — eyy pour x,y G V, et les e\x - Àex,pour a; G V et À G K. Si a; G V, on note ll(x)
l'image de ex dans Vl- Alors ll est K-linéaire car on s'est débrouillé pour (on ex+î/ -ex -ey = 0
et e\x -Xex = 0 dans Vl, si x,y G V et À G K). Par ailleurs tL est injective comme le montre le
point suivant, ce qui permet d'identifier V à son image par ll dans Vl, et donc de considérer
V comme un sous-K-espace vectoriel de Vl- Comme les ex engendrent L<v), leurs images
engendrent Vl, et donc V engendre Vl- Enfin, si u : V —> W est K-linéaire et W est un L-
espace vectoriel, on définit une application L-linéaire ûl : I^v) —> W, en posant û^ex) = u(x)>
si a; G V (une telle application existe et est unique car les ex forment une base de L<v)). Alors
Uh(ex^y —ex- ey) = u(x + y) - u(x) - u(y) = 0 et ûh(e\x - \ex) = u(Xx) - Xu(x) = 0
pour tous x} y G V et À G K. Il s'ensuit que R c KerÛL, et donc que ûl se factorise à travers
L<v)/R = Vl, et l'application L-linéaire ul : Vl —> W ainsi obtenue coïncide avec u sur V par
construction. Comme V engendre Vl, il y au plus une telle application, ce qui prouve que Vl
vérifie la propriété universelle demandée.
• Si wi,..., vn G K sont liés dans Vl (sur L), ils sont liés dans V (sur K) ; s'ils sont libres
dans V (sur K), ils le sont dans Vl (sur L) ; si (e^i est une base de V sur K, c'est aussi
une base de VL sur L.
Les deux premiers énoncés se déduisent l'un de l'autre par contraposée ; le troisième résulte
du second puisqu'il implique que (e^i est libre (sur L) dans VL et comme, par ailleurs, (e^i
est une famille génératrice de V qui engendre Vl, c'est aussi une famille génératrice, et donc
une base de Vl. Il suffit donc de prouver le premier énoncé.
Si J27=i x*vi = 0 dans Vl> cela signifie que l'on dispose dans L<v) d'une relation du type
n
S = Y^xievi ~ ($^fi*,v(c*+v - ex - ey) + YlUx^eXz " Ae*)) = °'
i=l xty Xtz
où les fj,Xyy et v\yZ sont des éléments de L nuls sauf un nombre fini, les x, y, z sont des éléments
de V et les À des éléments de K. Le sous-K-espace vectoriel de L engendré par les xi, les /j,Xty et
les v\^z est de dimension finie sur K ; choisissons en une base /i,..., fr. En décomposant les x^
les /j,Xyy et les v\yZ dans cette base, cela permet de mettre S sous la forme S = £^=1 S^/j, avec
S°'} = £?=i x^eVi - (£Xty vt&^+y - ex - ey) + £A,, i/J» (eA, - Ae,)) G K<v>, et il suffit
de prouver que S = 0 implique S^ = • • • = S<r) = 0 car cela implique que J2?=i xivt = 0
dans V, pour tout j ; si les Xj n'étaient pas tous nuls, il existe un j tel que les x\j' ne sont pas
tous nuls, ce qui prouve que vi,... ,vn sont liés dans V s'ils le sont dans Vl-
Soient donc Sw = J2X A**^, pour 1 ^ j ^ r, des éléments de K<v> tels que £J=1 fjS^ = 0
dans L(v). Alors £X(£J=1 ^j,xfj)ex = 0, et donc £ï=i^J,*/j = 0 pour tout a;, puisque les
ex forment une base de L^v) sur L, et donc \jyX = 0 pour tous j> x puisque les fj forment une
famille libre sur K. Ceci permet de conclure.
128
VOCABULAIRE MATHÉMATIQUE
10.5.3. Extension des scalaires à un sur-anneau
Si M est un module sur un anneau A, et si <p : A —> B est un morphisme d'anneaux, on peut étendre les
scalaires de A à B pour obtenir un B-module MB (aussi noté B <8>a M), muni d'une application A-linéaire
l : M —> Mb (i.e. i{ax) = (p(a)t(x), si a G A et x G M), et vérifiant la propriété universelle suivante : si
u : M —> M7 est une application A linéaire de M dans un B-module M7, il existe une unique application
B-linéaire ub : Mb —> M7 telle que ub°i = u. On construit Mb comme Vl : on prend le quotient de B<M)
par le sous-B-module engendré par les et les eax - <p(a)ex, pour x, y G M et a G A. Alors
Mb est engendré, en tant que B-module, par l(M), mais i n'est, en général, pas injectif.
Par exemple, si A = Z et B = Fp, alors Mb = M/pM et i est la réduction modulo p.
Si A = Z, si B = Q, et si M est un Z-module de torsion, alors Mb = 0 : en effet, si a; G M, et si
n G N - {0} est tel que nx = 0 dans M, alors nu(x) = u(nx) = 0 dans Mb, et comme n est inversible
dans B, cela implique que l(x) = 0 ; on a donc l(M) = 0, et Mb = 0.
Si A = Z, si B = Q, et si M = Zn, alors Mb = Qn et i est l'inclusion : en effet, si u est un morphisme
de Z-modules de Zn dans un Q-espace vectoriel V, l'application Q-linéaire de Qn dans V envoyant e$
sur u{ei) est l'unique telle application coïncidant avecu sur Zn.
Ce qui précède marche de la même manière si A est un anneau principal et si B = Fr(A). On en déduit
que si M est un A-module de type fini, alors Mb est un B-espace vectoriel de dimension le rang de M, ce
qui donne une définition un peu plus conceptuelle du rang de M.
10.5.4- Application à la similitude des matrices
• Soient A, B G Mn(K). S'il existe un corps L contenant K et Q G GLn(L) tel que
B = QAQ"1, alors il existe P G GLn(K) tel que B = PAP"1 ; autrement dit, s'il existe
une extension de K sur lequel A et B sont semblables, alors A et B sont semblables sur K.
Notons u et u' les endomorphismes de V = Kn associés à A et B ; les endomorphismes ul
et u'L de Vl = Ln qui s'en déduisent par extension des scalaires sont encore ceux associés à
A et B. Il s'agit donc de prouver que si ul et u'h sont conjugués, alors u et u' le sont. En
passant aux K[X] et L[X]-modules associés, on est ramené à prouver que si M et M7 sont deux
K[X]-modules et si les L[X]-modules Ml et M'L sont isomorphes, alors M = M7. Autrement dit,
on doit prouver que si M est un K[X]-module, la connaissance du L[X]-module Ml permet de
retrouver M (à isomorphisme près).
On a M = ©pe<^K[X|(©i€N(K[X]/Pi)np'£), où les np,i sont des entiers presque tous nuls,
et uniquement déterminés (th. de structure des modules de torsion sur K[X]). Il s'ensuit
que ML = ©PG^K[x|(®^N(L[X]/Pi)npi). Maintenant, tout P G ^k[x] peut se factoriser,
de manière unique, sous la forme P = YIq£^pQ6q^ où ^p est l'ensemble des polynômes
unitaires irréductibles de L[X] qui divisent P dans L[X]. Le th. des restes chinois nous
fournit un isomorphisme L[X]/P* = ©QG#>PL[X]/Qec^, et la décomposition de Ml est donc
Ml = ©P€#»k[xi ©Qg£»p (©<€N(L[X]/QeQ*)np-'), et comme les ^p sont disjoints 2 à 2, on
voit que npyi = nQ^/eQ pour n'importe quel Q G ^l[x] divisant P. On peut donc retrouver
les npti à partir des tiq^, et donc aussi la structure de M comme K[X]-module à partir de celle
de Ml comme L[X]-module. Ceci permet de conclure.
Exercice 10.17. Soient A, B G Mn(Q). On suppose qu'il existe P0 G GLn(C) tel que A = PoBPq !-
(i) Soient Mi,..., Mr G Mn(Q), libres sur Q ; montrer que Mi,..., Mr sont libres sur C. (On pourra
s'intéresser à la matrice des M& dans la base constituée des Vij, où Vij est la matrice dont tous les
coefficients sont nuls sauf le coefficient aij qui vaut 1.)
11. TOPOLOGIE
129
(ii) Montrer que l'ensemble Ec des M € Mn(C) vérifiant AM = MB est un C-espace vectoriel qui
possède une base Mi,... ,Mr constituée d'éléments de Mn(Q).
(iii) Soit Q(Xi,..., Xr) = det(XiMi + • • • + XrMr). Montrer que Q € Q(Xi,..., Xr] et que Q ^ 0.
(iv) En déduire qu'il existe P € GLn(Q) tel que A = PBP"1.
11. Topologie
Les notions de topologie générale interviennent directement dans toutes les branches
des mathématiques, comme on s'en est aperçu graduellement à partir des travaux de
Hausdorff (1906). Parmi les espaces topologiques, les espaces métriques (dont les espaces
vectoriels normes sont un cas particulier fondamental(81)), définis par Fréchet (1906),
forment une catégorie d'objets aux propriétés particulièrement agréables. Les suites y
jouent un rôle privilégié permettant souvent de simplifier les démonstrations qui, pour un
espace topologique général, utilisent le langage de la théorie des ensembles. Chaque fois que
c'est le cas, nous avons doublé la démonstration dans le cas général d'une démonstration
propre aux espaces métriques afin de diversifier les approches.
11.1. Espaces topologiques
11.1.1. Ouverts, fermés, voisinages
Si X est un ensemble, une topologie BF sur X est un sous-ensemble de l'ensemble des
parties de X, contenant X et 0, stable par intersection finie et par réunion quelconque.
Avec des quantificateurs, cela se traduit par :
• 0e<^etXe«^;
• si I est un ensemble fini, et si U* € <ïT, pour t € I, alors r\iei\Ji € SF ;
• si I est un ensemble quelconque, et si U* € BF, pour i e I, alors Uiei\Ji G &.
Si (X, &) est un espace topologique (i.e. un ensemble X muni d'une topologie 3F), les
éléments de & sont les ouverts. On dit que F C X est fermé, si son complémentaire
est ouvert. Donc X et 0 sont des fermés, et les fermés sont stables par réunion finie et
intersection quelconque.
Une base d'ouverts pour une topologie SF est un sous-ensemble «^ de SF tel que tout
élément de SF soit réunion d'éléments de 3. Par exemple, dans un espace métrique (voir
plus loin), les boules ouvertes forment une base d'ouverts.
Si (X, &) est un espace topologique, et si x e X, un voisinage V de x est un sous-
ensemble de X contenant un ouvert contenant x. Un ensemble est donc ouvert si et
seulement si il est voisinage de chacun de ses points.
'Mais il y a quand même des exemples parfaitement naturels de distances qui ne sont pas induites par
une norme sur un espace vectoriel ambiant ; par exemple, la distance sur la terre n'est pas induite par
une norme sur l'espace (à moins que la terre ne soit redevenue plate...).
130
VOCABULAIRE MATHÉMATIQUE
Une base de voisinages de x est une famille de voisinages de x telle que tout ouvert
contenant x contienne un élément de la famille. Par exemple, dans un espace métrique, les
boules ouvertes de centre x ou les boules fermées de centre x et de rayon non nul forment
une base de voisinages de x.
11.1.2. Exemples
• La topologie discrète sur un ensemble X est celle pour laquelle & = <^(X), ensemble des
parties de X. De manière équivalente, X est muni de la topologie discrète si les singletons
sont des ouverts (en effet toute partie de X est la réunion des singletons qu'elle contient).
• La topologie grossière sur X est la topologie dont les seuls ouverts sont X et 0.
• La topologie naturelle sur R est celle pour laquelle les segments ouverts forment une
base d'ouverts.
• Si E est un espace vectoriel sur R ou C muni d'une norme || ||, la topologie sur E
associée à || || est celle pour laquelle les boules ouvertes forment une base d'ouverts.
• La topologie de Zariski sur Cn est définie de la manière suivante : F C Cn est un fermé de
Zariski si et seulement si il existe une famille de polynômes P* e C[Xi,..., Xn], pour tel,
telle que F soit l'ensemble des zéros communs des P* (i.e. F = ni€î{z e Cn, Pi(z) = 0}).
Alors Cn est un fermé de Zariski (en prenant une famille vide), 0 est un fermé de Zariski
(en prenant Pi = Xi et P2 = Xi — 1), et une intersection quelconque de fermés de Zariski
est un fermé de Zariski (si F^, pour j e J, est l'ensemble des zéros communs de la famille
(Pilier,» alors C\jejFj est l'ensemble des zéros communs de la famille (Pi,j)je3,i€ij)y ce
qui montre qu'en définissant un ouvert de Cn pour la topologie de Zariski comme le
complémentaire d'un fermé de Zariski, on obtient bien une topologie dont les fermés sont
les fermés de Zariski.
• On peut munir un ensemble quelconque de la topologie du filtre des complémentaires
des parties finies, pour laquelle une partie non vide est un ouvert si et seulement si elle a
un complémentaire fini.
11.1.3. Comparaison de topologies
Si £F\ et SFi sont deux topologies sur X, on dit que «^ est plus fine que «^ si 3\
contient «^. Le summum de la finesse est donc la discrétion; à l'opposé, la topologie
la moins fine est la topologie grossière. On fera attention au fait que, si on prend deux
topologies quelconques, il n'y a aucune raison pour qu'il y en ait une qui soit plus fine
que l'autre (cf. ex. 17.3).
11.2. Espaces métriques
Si X est un ensemble, une application d:XxX-> R+ est une distance sur X si elle
vérifie les propriétés suivantes :
• d(x, y) = 0 si et seulement si x = y (séparation) ;
• d(x, y) = d(y, x) quels que soient x, y e X ;
11. TOPOLOGIE 131
• d(xyz) < d(x,y) + d(y,z) quels que soient x,y,z € X (inégalité triangulaire).
• Si la distance vérifie l'inégalité d(x, z) < sup(rf(x,2/), d(y> z)), plus forte que l'inégalité
triangulaire, on dit qu'elle est ultramétrique ou non archimédienne.
Si x e X et r > 0, on note B(a:, r) = {y € X, d(x, y) ^ r} la 6ow/e fermée de centre x et
de rayon r, et B(a:,r~) = {y € X, d(x,y) < r} la ôow/e ouverte de centre x et de rayon r.
• Une boule ouverte contient une boule ouverte centrée en chacun de ses points.
L'inégalité triangulaire montre que, si r > 0, si y € B(x,r~), et si s = r - d(rc,2/), alors
B(y,s-)cB(x,r-).
• L'ensemble «^ constitué de 0 et des réunions (quelconques) de boules ouvertes est une
topologie sur X, et U € <^ si et seulement si, quel que soit x € U, il existe r > 0 tel que
B(i,r)cU.
Par construction &d contient 0 et X et est stable par réunion quelconque. Il suffit donc de
prouver que &d est stable par intersection finie. Soit U € && non vide, et soit x € U. Par
définition de ^, il existe y € X et r > 0 tels que B(y,r~) c U et x € B(y,r~) ; le point ci-
dessus montre qu'il existe s > 0 tel que B(rc,s~) c B(y,r~) c U. La stabilité par intersection
finie s'en déduit puisque si (Uj)j6i est une famille finie d'éléments de «^d, et si x € n^iUi, alors
pour tout «, il existe s* > 0 tel que B(x,s^) C U*, ce qui fait que nieiUj contient B(x,s~), si
s = infiei Si (et s ^ 0 car I est fini).
On note en général (X, d) au lieu de (X, <^) l'espace topologique ainsi obtenu. Un espace
topologique obtenu de cette manière est appelé un espace métrique. Par construction, les
boules ouvertes forment une base d'ouverts de la topologie.
Deux distances sur X sont équivalentes si elles définissent la même topologie.
Un espace topologique (X, &) est métrisable s'il existe une distance d sur X telle que
l'on ait & = &d.
• Dans un espace métrique, les boules fermées sont des fermés.
Si x $. B(#o,r), et si s = d(x,xo) - r, alors s > 0 et le complémentaire de B(xo,r) contient
B(x,s~). On en déduit que ce complémentaire est ouvert et donc que B(xo,r) est fermée.
• Si (X, d) est un espace métrique, et si x G X, les B(x, r~) forment une base de voisinages
de x ; il en est de même des B(x, r), pour r > 0.
On a vu ci-dessus que si U est un ouvert non vide contenant x, alors U contient une boule
ouverte B(x,r~), avec r > 0, ce qui prouve que les B(x,r~) forment une base de voisinages
de x. De plus, B(x,r~) contient B(x,r/2) qui contient B(x, (r/2)~), ce qui prouve que les
B(x,r) forment aussi une base de voisinages de x.
• Deux distances d\ et efe sur un ensemble X sont équivalentes si et seulement si, pour tout
ieX, toute boule ouverte de centre x pour d\ contient une boule ouverte de centre x
pour d2 et réciproquement.
Si di et efe sont équivalentes, la boule ouverte B(x,rf ) pour di est ouverte pour efe et
donc contient une boule ouverte B(rc,r^") pour ek> ce qui prouve une des deux implications.
Réciproquement, si toute boule ouverte de centre x pour d\ contient une boule ouverte de
132
VOCABULAIRE MATHÉMATIQUE
centre x pour efe, et si U ^ 0 est un ouvert pour cfo, alors U = Ux6uB(a;,r^a.), où les B(x,r^x)
sont des boules ouvertes pour d\. Alors B(x, r^x) contient une boule ouverte B(x, r^x) pour ofe,
et donc U est ouvert pour d.2 car c'est la réunion des B(x, r^x). On en déduit l'autre implication.
• Si d est une distance sur X, il existe une distance d', équivalente à d, telle que d'(x, y) < 1,
pour tous x,y GX.
Il suffit de poser d'(x,y) = inf(d(x,y), 1). Alors
d'(x,y) + d'(y, z) = inf(d(rc, y) + <%, *), 1 + d(y, 2),d(z,y) + 1,2) ^ inf(d(rc, 2), 1) = d'(x, z),
ce qui montre que d'est une distance. De plus, d'est équivalente à d car les boules de rayon < 1
sont les mêmes pour d et d'.
Exercice 11.1. Montrer que, si (X,d) est un espace métrique, et si x € X, les B(x,2"J), pourj € N,
forment une base de voisinages de x.
Exercice 11.2. Soit X un ensemble. Montrer que d:XxX-> R+, définie par d(x,y) = 0 si x = y et
d(x,y) = 1, si x ^ y, est une distance (la distance triviale) sur X. Quelle est la topologie associée?
Exercice 11.3. Soit / : R —» R définie par f(x) = -fpbï. Montrer que (x,y) *-* d'(x,y) = \f(x) — f(y)\
est une distance sur R, qui est équivalente à la distance usuelle d(x,y) = \x — y\.
11.3. Continuité
Si X et Y sont deux espaces topologiques, si / : X —► Y est une application, et si 2: € X,
on dit que / est continue en x> si quel que soit l'ouvert V de Y contenant /(#), il existe
un ouvert U de X, contenant x, tel que /(U) C V. De manière équivalente, / est continue
en rr si, quel que soit le voisinage V de f(x) dans Y, il existe un voisinage U de a: tel que
/(U) C V. Il suffit de vérifier ceci pour V dans une base de voisinages de f(x).
On dit que / : X —> Y est continue, si elle est continue en tout point x GX.
On dit que / : X —> Y est un homéomorphisme si / est continue bijective, et si sa
réciproque /_1 : Y —> X est continue. On dit que X et Y sont homéomorphes^ s'il existe
un homéomorphisme / : X —> Y.
Si (X, d) est un espace métrique, si (Y, &) est un espace topologique, et si xq € X, on
voit, en revenant à la définition, que / : X —> Y est continue en Xq si et seulement si,
pour tout U ouvert de Y contenant f(x0), il existe S > 0 tel que d(xo,x) < ô implique
f(x) € U. Si Y est aussi métrique, cela se traduit (au choix) par :
• pour tout s > 0, il existe S = ô(x,e) > 0 tel que dx(xo,x) < Ô => dy(f(xo)>f(x)) < e;
• pour tout j e N, il existe ô = Ô(x>j) > 0 tel que dx(^o> x) < ô =>• dv(/(^o), /M) ^ 2~*.
On dit que / : X —► Y est uniformément continue sur X, si pour tout e > 0 il existe
ô = ô(e) > 0 tel que dx(x,x') < ô implique dy(/(#),/(#')) < s. La différence entre la
(82)Montrer que deux espaces topologiques ne sont pas homéomorphes est loin d'être évident en général
(le lecteur est invité à essayer de prouver qu'un pneu et un ballon de football ne sont pas homéomorphes) ;
la topologie algébrique (Analysis in situ de Poincaré) fournit des tas d'outils permettant de le faire.
11. TOPOLOGIE
133
continuité et la continuité uniforme est que ô ne dépend pas de x ; en particulier, une
application uniformément continue est continue.
Si « e R+, on dit que / : X —> Y est n-lipschitzienne (ou lipschitzienne de rapport /c),
si on a dy (/(#),/(#')) < K,dx(x,x'), quels que soient x,x' € X. Une application
lipschitzienne est uniformément continue et donc aussi continue.
Exercice 11.4- Soit (X,d) un espace métrique. Montrer que d : X x X —» R est continue.
• Les conditions suivantes sont équivalentes :
(i) / : X —> Y est continue ;
(ii) il existe une base d'ouverts «^ de Y telle que l'image réciproque par / de tout
U € «^ est un ouvert de X ;
(iii) l'image réciproque par / de tout ouvert de Y est un ouvert de X ;
(iv) l'image réciproque par / de tout fermé de Y est un fermé de X.
L'équivalence de (iii) et (iv) vient juste de ce que l'image réciproque du complémentaire est
le complémentaire de l'image réciproque (si A c Y, alors /_1(Y - A) = X - /-1(A)).
Si / est continue, si V est un ouvert de Y, et si y € V n /(X), il existe, pour tout
x € X vérifiant f(x) = y, un ouvert Ux de X qui contient x et vérifie f(Ux) C V. Alors
U = UyeVn/(X)( uxef-i(y) Ux) est un ouvert qui contient Uî,eVn/(X)/"1(î/) = /_1(v)> et Qui
vérifie /(U) C V, ce qui prouve que /-1(V) = U et donc que /-1(V) est ouvert. On en
déduit l'implication (i)=>(iii), et comme l'implication (iii)=>(i) est immédiate (si V est un ouvert
contenant /(rc), alors U = /-1(V) est un ouvert de X qui contient x et qui vérifie /(U) C V),
cela prouve que les propriétés (i) et (iii) sont équivalentes.
L'implication (iii)=$>(ii) est immédiate. Réciproquement, soit «^ une base d'ouverts de Y, et
soit V un ouvert de Y. Il existe alors une famille (Vi)i£v d'éléments de «^ telle que V = UieiVi.
On a alors /-1(V) = Ui6i/_1(Vj), et si f~l(Vi) est ouvert pour tout i, il en est de même
de /-1(V). On en déduit l'équivalence des propriétés (ii) et (iii), ce qui permet de conclure.
• Soient X, Y, Z des espaces topologiques. Si / : X —> Y est continue en x> et si g : Y —► Z
est continue en f(x), alors g o f : X —> Z est continue enrr;si/:X—>Yetp:Y—>Z
sont continues, alors g o f : X —> Z est continue.
Soit W un ouvert de Z contenant g(f(x)). Comme g est continue en /(x), il existe un ouvert
V de Y qui contient f(x) et qui vérifie g(V) C W, et comme / est continue en x, il existe un
ouvert U de X qui contient x et qui vérifie /(U) C V. Alors g o /(U) C W, ce qui permet de
démontrer le premier énoncé ; le second en est une conséquence immédiate
11.4. Sous-espaces, produits, quotients
11.4-1. Topologie induite
Si (X, &) est un espace topologique, et si Y C X, alors 5y = {U D Y, Ug^} est
une topologie sur Y appelée la topologie induite. Autrement dit, tout sous-ensemble d'un
espace topologique est naturellement un espace topologique.
134
VOCABULAIRE MATHÉMATIQUE
114-2. Topologie produit
Si (Xi, &i)is\ est une famille (éventuellement infinie) d'espaces topologiques, on appelle
topologie produit sur X = IlieiXi, ^a topologie la moins fine rendant continues les
projections naturelles pi : X —> X*, pour i e I. De manière explicite, une base d'ouverts pour
cette topologie est constituée des Yli£3 ^ x Oiei-J X»» °ù J décrit les sous-ensembles finis
de I, et Ui est, si i e J, un ouvert de X*.
• Si Y est un espace topologique, alors / : Y —> Iligi X» est continue si et seulement si
Pi o / : Y —> Xi est continue, quel que soit t € I.
Comme la composée d'applications continues est continue, si / : Y —> FJiei x* est continue,
alors Pi o / : Y —» X* est continue, quel que soit i € I. Réciproquement, si les p* o /, pour i € I,
sont continues, et si U = ni€J U* x Oigi—j Xi, où J C I est fini, est un élément de la base
d'ouverts ci-dessus, alors /_1(U) = Diçjfa o/)-1(Ui) est un ouvert comme intersection finie
d'ouverts. Ceci implique que / est continue, ce qui permet de conclure.
On fera attention qu'il ne suffit pas de vérifier que x h-* f(x, y) est continue sur X pour tout y et
y i-* /(#, y) est continue sur Y pour tout rc, pour en déduire que / est continue sur X x Y. Par exemple, si
/ : R2 -» R est définie par f(x, y) = gff a si (x, y) ^ (0,0) et /(O,0) = 0, alors / est continue en chaque
variable séparément, mais n'est pas continue en 0 car /(e,e) = § et donc /-1(]^-, |[), qui contient 0, ne
contient aucun point de la forme (e,e) et donc n'est pas ouvert.
• Si (X, dx) et (Y, dy) sont deux espaces métriques, toute distance sur X x Y, équivalente
à dxxY((z,2/),(z',î/')) = swp(dx(x,x'),dY(y,y')) (par exemple y/dxfax')2 + dY(y,y')2),
définit la topologie produit.
La distance rfxxY fait qu'une boule de X x Y est le produit d'une boule de X et d'une boule
de Y, ce qui prouve que la topologie qu'elle définit est bien la topologie produit.
• Un produit dénombrable d'espaces métriques est métrisable. Plus précisément, si les
(Xn,dn), pour n e N, sont des espaces métriques, alors d, définie sur X = IlneN^n par
d((xn)n€n, (j/»)«6n) = EneN £ inî(dn(xn,yn), 1), est une distance induisant la topologie
produit.
Soient x = (£n)n€N> y = (î/n)neN et z = (2n)neN des éléments de X. Quitte à remplacer dn
par la distance d'n définie par d'n(xny yn) = inf (dn(xn, yn), 1) (cf. n° 11.2, dernier point), on peut
supposer que dn(xn,yn) ^ 1 pour tous xn,yn € Xn, et alors d(x,y) = £neN £ïdn(xn,yn)'
o Si d(x,y) = 0, alors dn(xn,yn) = 0 et xn = yn, pour tout n, et donc x = y.
o d(x,y) = d(y,x) car dn(xn,yn) = dn(yn,xn) pour tout n.
o d(x,z) = £neN £dn(xn,zn) ^ £neN ±(dn(xn,yn) + dn{yn,zn)) = d(x,y) + d{y,z).
Ceci prouve que d est une distance sur X. Maintenant, soit U un ouvert de (X, d) et soit
x = (zn)neN € U. Il existe r > 0 tel que U contienne Bx(x,4r~). Soit N tel que ^t < 2r ; alors
En<N ér + E„^n+i & < 2r + W < 4r> et u contient Un^N Bxn(œ»,r-) x II»>n+i xn> qui
est un ouvert de X pour la topologie produit. On en déduit que U est aussi ouvert pour la
topologie produit.
Réciproquement, si U est ouvert pour la topologie produit, et si x = (#n)ngN ^ U> il existe
r > 0 et N € N tels que U contienne nn<NBx„(#n,r~) x Iln^N+ixn- Alors U contient
Bx(s> fn-) car d(x,y) < ^r implique d(xn,yn) < Çf < r, si n ^ N, et U est ouvert pour d.
Ceci permet de conclure.
11. TOPOLOGIE
135
iî.J^.S. Topologie quotient
Si X est un espace topologique et ~ est une relation d'équivalence sur X, on définit la
topologie quotient sur X/ ~ en disant que U est ouvert dans X/ ~ si et seulement si son
image inverse dans X est ouverte dans X. C'est la topologie la plus fine rendant continue
la surjection canonique tt : X —> X/ ~.
• Si Y est un espace topologique, alors / : X/ ~—> Y est continue si et seulement si
/ o 7r : X —> Y est continue.
/ : X/ ~—> Y est continue est continue si et seulement si /"1(U) est ouvert pour tout
ouvert U de Y, ce qui équivaut, par définition de la topologie quotient, à ce que 7r"1(/~1(U))
est ouvert dans X, pour tout ouvert U de Y, et donc à ce que / o n : X —> Y soit continue.
Exercice 11.5. Quelle est la topologie quotient sur R/Q?
Voici quelques espaces que Ton peut construire par des passages au quotient. Le lecteur est invité à
s'armer de ciseaux et de colle pour voir à quoi ressemblent les trois premiers espaces, et à chercher sur
Internet (par exemple sur le site http : //www. mathcurve. com/surf aces/surf aces. shtml de R. Ferréol)
des images des deux derniers (on ne peut pas les plonger physiquement dansR3).
—■ Le cylindre : c'est le quotient de [0,1] x [0,1] par la relation d'équivalence (x, 0) ~ (s, 1), si a; G [0,1].
La bande de Moebius : c'est le quotient de [0,1] x [0,1] par la relation d'équivalence (#, 0) ~ (1 -x, 1),
sise [0,1].
— Le tore : c'est le quotient de [0,1] x [0,1] par la relation d'équivalence (#,0) ~ (x, 1), si a; 6 [0,1]
et (O,?/) ~ (1,2/), si y G [0,1]. C'est aussi le quotient de R2 par Z2 ou encore le produit (R/Z)2 de deux
cercles.
— La bouteille de Klein : c'est le quotient de [0,1] x [0,1] par la relation d'équivalence (#,0) ~ (#, 1),
si a; 6 [0,1] et (0,2/) ~ (1,1 - y), siye [0,1].
— Le plan projectif réel : c'est le quotient de la sphère unité de R3 par la relation d'équivalence
a; ~ —a; ; il est homéomorphe au quotient de [0,1] x [0,1] par la relation d'équivalence (x, 0) ~ (1 - x, 1),
si a; 6 [0,1] et (0,2/) ~ (1,1 - 2/), si y G [0,1].
11.5. Espaces séparés
Une topologie est séparée si, quels que soient x, y G X, avec x ^ y, on peut trouver des
ouverts U, V de X, avec x G U, y G V, et U n V = 0. Par exemple, la topologie discrète
est séparée (prendre U = {x} et V = {y}), et la topologie grossière est on ne peut moins
séparée (sauf si X a 0 ou 1 élément). Dans un espace séparé, les points sont fermés, mais
la réciproque n'est pas vraie(83).
^83)Par exemple, dans Cn muni de la topologie de Zariski, les points sont fermés puisque z = (zi,..., zn)
est l'ensemble des zéros communs de la famille de polynômes X* - zi, pour tel, mais la topologie de
Zariski est fort peu séparée puisque tout ouvert de Zariski non vide est dense (pour la topologie de Zariski
et aussi pour la topologie usuelle de Cn). Il a fallu attendre les travaux de A. Weil (1952) et J-P. Serre
(Géométrie algébrique et géométrie analytique, connu sous le nom de GAGA, 1956) pour que Ton se
rende compte que cette topologie, loin d'être une curiosité pathologique, permet de retrouver, de manière
algébrique, la plupart des invariants que Ton peut définir en utilisant la topologie usuelle. Ceci servit de
point de départ à la révolution grothendieckienne.
136
VOCABULAIRE MATHÉMATIQUE
• Un espace métrique est séparé.
Six ^ y, on ad(x,y) > 0, et sir = \d{x,y), alors B(a;,r)nB(j/,r") = 0, d'après l'inégalité
triangulaire.
• Si les Xi sont séparés, alors X = Ylieî X< est séparé.
Si x = (xi)i£i et y = (yi)i£i sont deux éléments distincts de X, il existe j e I tel que
Xj 7^ yj, et comme Xj est séparé, il existe des ouverts disjoints Uj et Vj de Xj contenant Xj
et yj respectivement. Alors U = U^ x Yli^j Xt et V = Vj x Yli^j Xi sont des ouverts disjoints
de X contenant x et y respectivement. On en déduit la séparation de X.
• X est séparé si et seulement si la diagonale A = {(x, x), x G X} est fermée dans X x X.
Si X est séparé, alors quels que soient x,y G X distincts, il existe des ouverts U^y, Vx%y
disjoints, avec x G \Jx%y et y e VXiV. La condition « UX|y, Vx%y disjoints » est équivalente à ce
que l'ouvert Vfx,y = UXiy x Vx%y de X x X ne rencontre pas A. De plus, Vfx# contient (x,y),
ce qui fait que la réunion des W^y, pour x ^ y, est égale à (X x X) - A qui est donc ouvert
en tant que réunion d'ouverts. On en déduit que A est fermée.
Réciproquement, si A est fermée, alors (X x X) - A est ouvert. Par définition de la topologie
produit, cela implique que si (x,y) G (X x X) - A (i.e. si x ^ y), alors il existe U, V ouverts
de X tels que U x V c (X x X) - A et (x,y) G U x V. Alors x G U, y G V et U n V = 0. On
en déduit la séparation de X.
Exercice 11.6. Montrer que, si / : X —> Y est injective et continue, et si Y est séparé, alors X est
séparé.
Un espace métrique est séparé grâce à la condition de séparation « d(x,y) = 0 => x = y ». Si on
supprime la condition de séparation, on obtient une semi-distance qui permet encore de définir une
topologie 5d dans laquelle un ouvert non vide est une réunion (quelconque) de boules ouvertes. L'espace
topologique (X, <5^) n'est plus forcément séparé (si x ^ y, mais d(x, y) = 0, alors tout ouvert de X
contenant x contient aussi y). C'est le cas des espaces JSf 1(Rm) et Jèf2(Rm) du § III.2, par exemple.
On peut fabriquer un espace séparé à partir de (X,d), en identifiant deux points dont la distance est
nulle. De manière précise, on définit une relation ~ sur X par x ~ y si et seulement si d(x, y) = 0 ; la
relation ~ est une relation d'équivalence grâce à la symétrie de d et à l'inégalité triangulaire. De plus,
d(x,y) = d(x',y') si x ~ x1 et y ~ y\ toujours grâce à l'inégalité triangulaire. On en déduit le fait que
d définit une distance sur l'ensemble X/ ~ des classes d'équivalence pour la relation ~, et le séparé de
(X, d) est l'ensemble X/ ~ muni de la distance induite par d.
Un exemple de cette construction est le passage de Sfl(Km) à L^R™) ou de Jèf2(Rm) à L2(Rm)
rencontré dans le cours (cf. § III.2).
11.6. Intérieur, adhérence, densité
o
Si X est un espace topologique, et Y c X, alors la réunion Y de tous les ouverts de X
contenus dans Y est un ouvert, et donc est le plus grand ouvert contenu dans Y; c'est
o
l'intérieur de Y. On dit que Y est d'intérieur vide si Y= 0-
De même, l'intersection Y de tous les fermés de X contenant Y est un fermé appelé
l'adhérence de Y. On dit que Y est dense dans X si Y = X. De manière équivalente, Y
est dense dans X si et seulement si Y D U ^ 0 pour tout ouvert non vide U de X, ou
11. TOPOLOGIE
137
encore si et seulement si tout point de X admet au moins un point de Y dans chacun de
ses voisinages. Si (X, d) est un espace métrique, cela se traduit encore par : Y est dense
dans X si et seulement si, pour tous x G X et s > 0, il existe y G Y tel que d(x, y) < s.
• Q est dense dans R et Qp (par construction).
• Les polynômes sont denses dans l'espace des fonctions continues sur [0,1] muni de la
norme ||</>||oo = suPa;e[o,i] W3')! °^e ^a convergence uniforme (th. de Weierstrass, ex. II.1.10).
• Si X est muni de la topologie grossière, tout point est dense dans X.
• Si Y est dense dans X, si Z est séparé, et si /, g : X —> Z sont continues et coïncident
sur Y, alors f = g.
Il suffit de prouver que l'ensemble A des x € X vérifiant f(x) = g(x) est fermé dans X,
puisque A contenant Y, et Y étant dense dans X, cela implique A = X. Or A est l'image
inverse de la diagonale A = {(x,x), x € X} dans X x X par l'application x ■-► (f(x),g(x)),
qui est continue, et l'hypothèse Z séparé est équivalente à ce que A soit fermé dans X x X, ce
qui fait que A est fermé comme image inverse d'un fermé par une application continue.
Exercice 11.7. — Soit X un espace topologiquc. Montrer que Y C X est d'intérieur vide si et
seulement si son complémentaire est dense dans X.
Exercice 11.8. — (i) Montrer que si Yi est dense dans Xi et si Y2 est dense dans Xi, alors
Yi x Y2 est dense dans Xi x X2.
(ii) Soit / : Y —> Z une application continue entre espaces métriques. Montrer que si X est
dense dans Y, et si la restriction de / à X est une isomôtrie, alors / est une isométrie.
Exercice 11.9. (i) Montrer que si U est ouvert, l'intérieur de l'adhérence de U contient U, et qu'on n'a
pas toujours égalité, mais que l'adhérence de l'intérieur de l'adhérence de U est l'adhérence de U.
(ii) Montrer que, si F est fermé, l'adhérence de l'intérieur de F est contenu dans F, et qu'on n'a pas
toujours égalité, mais que l'intérieur de l'adhérence de l'intérieur de F est l'intérieur de F.
Exercice 11.10. Montrer que A = {(n, en), n € N} est dense dans C2 muni de la topologie de Zariski.
Est-t-il dense dans C2 pour la topologie usuelle ?
11.7. Suites dans un espace topologique
11.7.1. Suites, suites extraites
Soit X un espace topologique. Si (xn)n€^ est une suite d'éléments de X, et si a e X, on
dit que xn tend vers a ou que xn a pour limite o, si pour tout voisinage V de o, il existe
N 6 N, tel que xn G V, si n ^ N. Il suffit bien évidemment de vérifier ceci pour V dans
une base de voisinages de a.
On peut remplacer N par un ensemble I quelconque : on dit que (£i)iei tend vers a quand i —» 00
(i.e. suivant la topologie du filtre des complémentaires des parties finies) si pour tout voisinage V de a
l'ensemble des i € I tel que Xi£V est fini.
Si X est séparé, une suite a au plus une limite comme on le constate aisément en revenant
à la définition d'espace séparé. On prendra garde au fait que ce n'est plus forcément le
cas, si l'espace n'est pas séparé. On dit qu'une suite est convergente si elle a au moins une
138
VOCABULAIRE MATHÉMATIQUE
limite. On réserve la notation limn_>+00 xn = a au cas où l'espace est séparé et donc la
limite est unique.
On obtient une traduction agréable de la notion de suite convergente en introduisant l'espace
topologique N = NU {+00}, muni de la topologie pour laquelle les ouverts sont les parties de N auxquelles on
a rajouté les complémentaires dans N des parties finies de N. C'est alors un simple exercice de montrer
que limn_>+00 xn = a si et seulement si la suite xn se prolonge en une fonction continue de N dans X
prenant la valeur a en +00 (i.e. l'application de N dans X obtenue en envoyant n sur xn et +00 sur a est
continue).
Une suite (yn)neN est dite extraite de (xn)nGN s'il existe ip : N —> N tendant vers +00
quand n tend vers +00, telle que yn = a^(n), pour tout n G N.
• Si a est une limite de x = (xn)ne^, alors a est aussi limite de toute suite extraite.
Soit ip : N —> N tendant vers +00 quand n tend vers +00, ce qui se traduit par le fait que
ip peut s'étendre par continuité à N, en posant <p(+oo) = +00. Si a est une limite de x, alors
x peut aussi s'étendre par continuité à N, en posant x(+oo) = a et donc x o <p est continue
sur N, ce qui se traduit par le fait que a est limite de la suite extraite (£<p(n))n€N.
On peut aussi se passer de N, et revenir à la définition. Si V est un voisinage de a, alors
il existe N G N tel que xn G V, pour tout n ^ N. Par ailleurs, si ip : N —> N tend vers +00
quand n tend vers +00, il existe N' G N tel que ip(n) ^ N, si n ^ N'. On a donc x^n) G V,
pour tout n ^ N7, ce qui permet de montrer que (^(n))nGN tend vers a.
• Soit X = Yliei Xi un produit d'espaces topologiques séparés, et soient vfà = (u\n^)ieh
pour n G N, une suite d'éléments de X et a = (a,i)iei G X. Alors u^ —> a si et seulement
si ?4 —> ai pour tout i G I.
L'implication « u^ —> a » => « u\n' —> ai pour tout i G I » est une conséquence de la
continuité des projections X —► X$. Réciproquement, supposons que u\n' —> ai pour tout tel.
Soit U un ouvert de X contenant a. Alors U contient un ouvert de la forme ]Ji£3 U* x rit€i-J ^'
où J est fini et U* est un ouvert de X* contenant ai si i G J. Comme , il existe N* € N
tel que u\n' € Ui pour tout n ^ Ni, et alors u^ € U, pour tout n ^ supi€J Ni. On en déduit
que u^ —» a, ce qui termine la démonstration.
11.7.2. Suites et continuité
• Si / : X —> Y est continue, et si x = (xn)n€^ est une suite d'éléments de X admettant a
comme limite, alors (/(#„))n€N admet /(a) pour limite.
La suite x se prolonge en une fonction continue de N dans X prenant la valeur a en +00,
et comme / est continue, / o x est continue sur N, ce qui se traduit par le fait que /(o) est
limite de la suite (/(#n))n€N.
On peut aussi se passer de N, et dire que si V est un voisinage de /(o), alors f~l(V) contient
un voisinage U de a puisque / est continue, et qu'il existe N € N tel que xn € U, si n ^ N, ce
qui implique f(xn) € V, si n ^ N.
• Si X est un espace métrique, alors / : X —> Y est continue en x si et seulement si pour
toute suite (rcn)n€N d'éléments de X tendant vers x, la suite (/(zn))n€N tend vers f{x).
On a déjà démontré (dans le cas d'espaces topologiques généraux) que si / : X —» Y
est continue en x, alors pour toute suite (xn)neN d'éléments de X tendant vers #, la suite
12. COMPACITÉ
139
(/(#n))n€N tend vers f(x). Maintenant, si / est non continue en x, il existe un voisinage V
de /(#), tel que, pour tout n G N, il existe xn G B(x,2"n) avec f(xn) £ V. Alors xn —> x
dans X, tandis que f(xn) /> f(x). En prenant la contraposée, on en déduit que, si pour toute
suite (xn)n€N d'éléments de X tendant vers x, la suite (/(xn))n€N tend vers /(x), alors / est
continue en x. Ceci permet de conclure.
On prendra garde au fait que cette caractérisation de la continuité par les suites n'est
pas valable pour un espace topologique général.
Exercice 11.11. Soit X un espace métrique (ou métrisable).
(i) Soit Z c X. Montrer que a G X est dans l'adhérence Z de Z si et seulement si il existe une suite
(#n)n€N d'éléments de Z, ayant a pour limite.
(ii) Montrer que Z est dense dans X si et seulement si tout a G X est limite d'une suite d'éléments de Z.
(iii) Montrer que, si Y est un espace métrique, si /, g sont deux applications continues de X dans Y,
telles que l'on ait f(x) = g(x), pour tout x G Z, où Z est dense dans X, alors / = g.
12. Compacité
12.1. Espaces compacts
Un espace topologique X est dit compact s'il est séparé, et si de tout recouvrement
de X par des ouverts, on peut extraire un sous-recouvrement fini <84). Autrement dit,
X (séparé) est compact si, quelle que soit la famille (Ui)iei d'ouverts de X telle que
UieiUi = X, il existe J C I fini tel que U^jU* = X. En passant aux complémentaires, on
voit que la compacité de X (séparé) est équivalente à ce que de toute famille de fermés
de X d'intersection vide, on puisse extraire une famille finie d'intersection vide.
• Un ensemble fini, muni de la topologie discrète, est compact.
• L'espace N = NU {+oo}, muni de la topologie pour laquelle les ouverts sont les parties
de N et les complémentaires dans N des parties finies de N, est un espace compact.
N est séparé car, si x ^ y, alors x ^ +oo ou y ^ +oo, ce qui fait que l'un des deux singletons
{x} ou {y} est ouvert, ainsi que son complémentaire. Par ailleurs, si les (Ui)iei forment un
recouvrement ouvert de N, alors un des U* contient +oo, et son complémentaire est fini ; on
peut donc extraire du recouvrement par les U$ un sous-recouvrement fini.
• Le segment [0,1] est compact.
Soit (Ui)iei une famille d'ouverts de [0,1] formant un recouvrement. Soit A l'ensemble
des a G [0,1] tels que [0,a] puisse être recouvert par un nombre fini de U*, et soit M la borne
supérieure de A. Par hypothèse, il existe i(M) G I et e > 0 tels que ]M-e, M+e[n[0,1] C U^m),
et par définition de M, il existe a G]M - e, M[ et J C I fini, tels que [0,a] C U^U*. Mais alors
[0,6] c Ui£3u{i{M)]\Ju quel que soit 6 G [M, M + e[n[0,1], et donc [M, M + e[n[0,1] C A. Par
définition de M, ceci implique M = 1, et permet de conclure.
^84^La notion de compacité a été dégagée en 1894 par Borel (pour des questions de mesure, cf. (ii) de
l'ex. 12.1, auquel Borel se référait sous le nom de théorème fondamental de la théorie de la mesure) et
par Cousin (pour des applications aux fonctions de plusieurs variables complexes).
140
VOCABULAIRE MATHÉMATIQUE
Exercice 12.1. (i) Soit X un sous-ensemble dénombrable de [0,1]. Montrer que pour tout e > 0, il
existe une suite de segments ouverts ]an,6n[ telle que ]£nGN(&n - an) < e et Un£iq]an,bn[ contienne X.
(ii) Soit ]an,6n[, pour n G N, une suite de segments ouverts tels que [0,1] C Un£iq]an,bn[. Montrer
que ]Cn€N(^n - an) > 1. (On pourra admettre que le résultat est vrai pour une famille finie.)
(iii) Montrer que [0,1] et R ne sont pas dénombrables.
12.2. Compacité et suites
Si X est un espace topologique, et si (xn)nGN est une suite d'éléments de X, on dit
que a G X est une valeur d'adhérence de la suite (xn)ne^, si tout voisinage de a contient
une infinité de termes de la suite. Ceci équivaut à ce que a soit dans l'adhérence Fk de
{xm n ^ A;}, pour tout A; G N. En particulier, l'ensemble des valeurs d'adhérence d'une
suite est un fermé, puisque c'est l'intersection des fermés Ffc, pour A; G N.
• Si X est un espace métrique, alors a est une valeur d'adhérence de la suite (xn)nGN, si
et seulement si on peut extraire une sous-suite de la suite (£n)neN ayant pour limite a.
Si on peut extraire de (a;n)n€N> une sous-suite (£<p(n))n€N de limite a, et si V est un voisinage
de a, alors #<p(n) G V, pour tout n assez grand, ce qui prouve que a est une valeur d'adhérence
de la suite (noter que ce sens n'utilise pas le fait que X est métrique). Réciproquement, si X
est métrique, et si a est une valeur d'adhérence de (£n)neN> alors pour tout n G N, il existe
une infinité de termes de la suite dans B(a,2"n), et donc on peut choisir (p(ri) ^ n tel que
z<p(n) G B(a,2"n). La suite (z<p(n))n€N est alors extraite de la suite (xn)n€N et converge
vers a. Ceci permet de conclure.
• Dans un compact, toute suite admet une valeur d'adhérence ; dans un compact métrique,
on peut extraire de toute suite une sous-suite convergente.
Soit X un compact, et soit (xn)n€N une suite d'éléments de X. Soit Fn, si n G N, l'adhérence
de l'ensemble {xn+p, p G N} ; l'intersection des Fn est, par définition ou presque, l'ensemble
des valeurs d'adhérence de la suite (xn)n€N. Comme l'intersection d'un nombre fini de Fn est
toujours non vide puisqu'elle contient les xn, pour n assez grand, la compacité de X assure
que l'intersection des fermés Fn, pour n G N, est non vide, ce qui permet de conclure.
Exercice 12.2. (i) Montrer que dans un compact, une suite ayant une seule valeur d'adhérence converge,
(ii) Le résultat est-il valable dans R?
• Un espace métrique est compact si et seulement si toute suite (xn)nGN d'éléments de X
admet une valeur d'adhérence(85) (th. de Borel-Lebesgue).
On sait déjà que dans un compact (même non métrique), toute suite admet une valeur
d'adhérence; montrons la réciproque dans le cas d'un espace métrique. Soit (U^i un
recouvrement ouvert de X. Alors, quel que soit x G X, il existe k(x) ^ 0 et i G I, tels que
<85> Cette caractérisation est parfois prise comme définition des espaces compacts. Elle est effectivement
d'un maniement plus facile que la caractérisation en termes de recouvrements ouverts si on cherche à
vérifier qu'un espace (métrique) est compact. Par contre, si on veut utiliser la compacité d'un espace pour
en tirer des conséquences, c'est en général la caractérisation par les recouvrements ouverts qui est la plus
naturelle et la plus puissante.
12. COMPACITÉ
141
B(x,r(x)~) c Ui, où r(x) = 2~k^xK On cherche à prouver qu'on peut extraire du
recouvrement par les U$ un recouvrement fini, et il suffit de prouver qu'on peut en faire autant du
recouvrement par les B(x>r(x)~).
Pour cela, construisons par récurrence une suite xn d'éléments de X vérifiant :
• xn G Yn, où Yn est le fermé complémentaire de Uj^n-iB(xj,r(xj)~),
• Kxn) ^ k(y)> quei Que so^ y e Yn.
Si la construction s'arrête, c'est que les B(xj,r(xj)~), pour j ^n-1 recouvrent X, ce que l'on
veut. Sinon, la suite (xn)n€N a une valeur d'adhérence y0, et onaj/0£ Yn, quel que soit n G N,
car Yn est fermé et xn+p G Yn, quel que soit p G N. Par construction de la suite (£n)n€N, on
a d(xn,xn+p) ^ 2~k^Xn\ quels que soient n,p G N. Comme on peut extraire une sous-suite de
Cauchy de la suite (£n)neN> on en déduit que k(xn) —> +00. En particulier, il existe n tel que
k(xn) ^ k(y0) +1, en contradiction avec la construction de xn (puisque y0 G Yn). Ceci permet
de conclure.
12.3. Propriétés de base des compacts
Les énoncés qui suivent sont d'un usage constant.
12.3.1. Compacts d'un espace topologique
• Si X est compact, alors Y C X est compact, si et seulement si Y est fermé.
Supposons Y fermé. Soit (Ui)iei un recouvrement*86) ouvert de Y. Par définition, il existe,
pour tout i G I, un ouvert V$ de X tel que U* = V$ n Y, et comme U = X - Y est ouvert,
les V$, pour i G I, et U forment un recouvrement ouvert de X. Comme X est supposé compact,
il existe J c I fini, tel que X c U U ( U^j V$), et les U$, pour i G J forment un recouvrement
ouvert de Y extrait du recouvrement initial. On en déduit la compacité de Y.
Réciproquement, supposons Y c X compact. Soit a £ Y. Comme X est séparé, pour tout
y G Y, il existe des ouverts Uy, Vy tels que y G Uy, a G Vy et Uy nVy = 0. Les Uy, pour y G Y,
forment un recouvrement ouvert de Y; il existe donc J C Y fini tel que Y c Uy€jUy. Mais
alors V = ny€JVy est un ouvert de X contenant a et ne rencontrant pas Y, ce qui prouve que
a n'appartient pas à l'adhérence Y de Y. On a donc Y c Y, ce qui prouve que Y est fermé.
• L'image d'un compact X par une application continue / : X —> Y, où Y est séparé, est
un compact.
Soit (Ui)i£\ un recouvrement*87* ouvert de /(X). Par définition, si i G I, il existe UJ ouvert
de Y tel que U* = UJ n /(X), et comme / est continue, V* = /-1(Ui) est ouvert dans X, et
(Vi)iei est donc un recouvrement ouvert de X. Comme X est compact, il existe J C I fini tels
(86)gj x est un espace métrique, on peut passer par les suites. Comme X est compact, une suite (yn)neN
d'éléments de Y a une valeur d'adhérence dans X, et si Y est fermé, cette valeur d'adhérence est dans
Y, ce qui prouve que Y est compact. Réciproquement, si Y est compact, si a est dans l'adhérence de Y,
il existe une suite (yn)n€N d'éléments de Y ayant pour limite a dans X, et sa seule valeur d'adhérence
dans X est alors a. Comme Y est supposé compact, cette suite admet une valeur d'adhérence dans Y, et
comme sa seule valeur d'adhérence dans X est a, cela implique a G Y. On en déduit que Y est fermé.
(87)Si X et Y sont des espaces métriques, on peut raisonner en termes de suites. Soit (yn)neN une suite
d'éléments de /(Y), et, si n G N, soit xn G X tel que yn = f(xn). Comme X est compact, la suite (xn)n€N
admet une valeur d'adhérence a G X, et comme / est continue, /(a) est une valeur d'adhérence de la
suite (î/n)n€N. On en déduit la compacité de /(X).
142
VOCABULAIRE MATHÉMATIQUE
que les V*, pour i G J, recouvrent X, et les U*, pour iG J, forment alors un recouvrement
ouvert fini de /(X) extrait du recouvrement initial. On en déduit la compacité de /(X).
• Si X est compact, et si / : X —► Y est bijective continue avec Y séparé, alors / est un
homéomorphisme.
Notons g : Y -* X l'application réciproque de / de telle sorte que si F c X, alors on a
<rr(F) = {y € Y, 3x G F, g(y) = x} = {y G Y ,3* G F, y = f(g(y)) = /(*)} = /(F). On
veut prouver que g~l(F) est fermé dans Y si F Test dans X. Or g~l(F) = /(F), et comme F
est compact puisque fermé dans un compact, et que Y est séparé, /(F) est compact et donc
fermé. Ceci permet de conclure.
• Si X est compact, et / : X —► R est continue, alors / atteint son maximum et son
minimum.
Comme X est compact et / continue, cela implique que /(X) est compact, et donc admet des
bornes inférieure et supérieure finies [sinon on peut construire une suite d'éléments de/(X)
tendant vers ±00 et donc n'ayant pas de valeur d'adhérence dans /(X)], et les contient car il
est fermé.
• Si Xx et X2 sont compacts, alors Xx x X2 est compact.
Soit (Ui)iÉi une famille d'ouverts de Xi x X2 formant un recouvrement*88*. Si y G X2, soit
I(y) l'ensemble des i G I tels que Uin(Xi. x {y}) ^ 0. Si i G %), et si (a, y) G U*, il existe Viiy,a
ouvert de Xi contenant a et Wi>y>û ouvert de X2 contenant y tels que U* D Viïî/ïa x Wiïî/ïa.
Les U^, pour i dans I, formant un recouvrement de Xi x X2, les Viï2/ïa, pour i G l(y) et
(a,y) G Ui, forment un recouvrement de Xi. Comme Xi est compact, il existe un ensemble
fini 3(y) de couples (i,a), avec i G I(y) et (a,y) G U* tels que Xi = U(iïa)Gj(y)Viïyïa. Soit alors
Wy = n(î,a)€J(î/)Wî,2/,a' C'est un ouvert de X2 contenant y, et U* contient V^y^a x Wy, quel
que soit (z,a) G 3(y). Comme X2 est compact, on peut trouver Y fini tel que X2 = Uy€YWy,
et alors
uy€Y U(i|a,€j(y, U; D Uy€Y( U(i|a)€J(y) Viïy,a x Wy) = Uy€Y(Xi x Wy) = Xl x X2,
ce qui montre que l'on peut extraire du recouvrement par les U* un sous-recouvrement fini.
• Un produit dénombrable de compacts métriques est compact(89).
Soient X$, pour i G N, des compacts métriques, et soit X = II^nX*. Comme un produit
dénombrable d'espaces métriques est métrisable (alinéa 11.4.2), il suffit de prouver que toute
suite (#n)neN d'éléments de X admet une sous-suite extraite convergente.
Écrivons xn G X = IliEN^ sous ^a ^oi%me xn = (#n,t)i€N> avec xnj G X* pour tout i.
Comme X0 est compact, on peut extraire une sous-suite (£<p0(n))n€N telle que (^0(n),o)nGN
(88)Si Xi et X2 sont des espaces métriques, on peut raisonner en termes de suites. Soit (xmyn)nei* une
suite d'éléments de Xi x X2. Comme Xi est compact, on peut extraire de la suite (xn)n€N une sous-suite
(x<p(n))neN ayant une limite a dans Xi. Comme X2 est compact, on peut extraire de la suite (ï/<p(n))n€N
une sous-suite (y^(n))n€N ayant une limite 6 dans X2, et alors (a^(n), y^(n))neN admet (a, 6) comme limite
dans Xi x X2 puisque (a^(n))neN est extraite de (£<p(n))n€N> et donc tend vers a dans Xi. Autrement
dit la suite (xn,yn)n€N admet une valeur d'adhérence.
(89)pius généralement, un produit de compacts est toujours compact (Tychonov, 1935), mais la
démonstration du cas général est un peu plus délicate et utilise l'axiome du choix.
12. COMPACITÉ
143
ait une limite ao dans Xo. Pour la même raison, on peut extraire de la suite (#<p0(n))n€N
une sous-suite (x(pi(n))n€N telle que (a^n^OneN ait une limite ai dans Xl5 et on a encore
aVi(n),o —> ao puisque (a^n^neN est extraite de (av0(n),o)n€N. Par récurrence, cela permet
de définir a,k G Xk et une suite (a^(n))neN, extraite de (a^.^n^neN, telle que ^.(n),* -> au
pour tout i ^ k. La suite (avn(n))neN est alors extraite (par extraction diagonale) de (xn)n€N>
et aussi de (^fc(n))nGN pour n ^ fc; il s'ensuit que £<pn(n),t —> &*> pour tout % G N, et donc
que £<prl(n) —> a dans X, si a = (a^N. Ceci permet de conclure
Exercice 12.3. Montrer que [0,1] est compact en passant par les suites.
12.3.2. Compacts d'un espace métrique
• Si E est un espace métrique, un compact X de E est fermé dans E et borné, mais la
réciproque est en générale fausse.
On a déjà vu qu'un compact est toujours fermé. Par ailleurs, si X est compact, et si xo G X,
alors x »-> d(x0>x) est continue sur X et donc est bornée puisque toute fonction continue à
valeurs réelles sur un compact est bornée. Autrement dit, il existe M G R+ tel que X c
B(x0,M), et X est borné.
Soit E le segment [-1,1[ de R muni de la distance induite par la valeur absolue sur R ; c'est
un espace métrique parfaitement respectable. Alors X = [0,1[ est fermé dans E puisque c'est
l'intersection de E avec le fermé R+ de R, et il est borné. Il n'est pas compact car on ne peut
pas extraire de recouvrement fini du recouvrement de X par les ouverts Un = Xfï]^, 1 - £[.
• Si E est un espace vectoriel de dimension finie sur R ou C, alors les compacts de E sont
les fermés bornés (9°).
Par définition de la norme || ||oo sur Rn, un borné de Rn est inclus dans [-M, M]n, si M est
assez grand. Or [-M, M] est compact, puisque c'est l'image de [0,1] par l'application continue
x »-> (2x - 1)M, et donc [-M, M]n est compact comme produit de compacts. Comme un fermé
d'un compact est compact, on en déduit qu'un fermé borné de (Rn, || ||oo) est compact. Le
résultat dans le cas d'un R ou C-espace vectoriel de dimension finie quelconque s'en déduit
si on sait que deux normes sur un R-espace vectoriel de dimension finie sont équivalentes
(cf. n° 17.4), et donc que les fermés bornés sont les mêmes, quelle que soit la norme.
• Une fonction continue sur un compact non vide d'un espace métrique est uniformément
continue (théorème de(91) Heine, 1872).
/ : X —> Y, où X et Y sont des espaces métriques, est uniformément continue si
Ve > 0, 3ô> 0, tel que dx(x,x') < 6 => dY(y,y') < e.
(90>En filière PC, cette propriété est prise comme définition de compact ; on peut difficilement imaginer
un point de vue plus nocif : être fermé est une notion relative (un ensemble est toujours fermé dans
lui-même), alors que la compacité est une notion intrinsèque. Qui plus est, cette propriété devient fausse
en dimension infinie, et les espaces de dimension infinie ne sont pas qu'une lubie de mathématicien.
*91)Ce théorème a en fait été démontré par Dirichlet en 1854, pour les fonctions continues sur un segment,
mais Heine a donné son nom à la continuité uniforme alors que Dirichlet se contentait de démontrer le
résultat avec des e et des ô en vue de justifier l'intégration de Cauchy pour les fonctions continues, ce
que Cauchy avait omis de faire en confondant les notions de continuité et continuité uniforme.
144
VOCABULAIRE MATHÉMATIQUE
Supposons X compact. Soit e > 0. Comme / est continue, pour tout x G X, il existe ôx > 0
tel que dx(x,x') < 2ôx => dY(f(x),f(x')) < §. Les Bx(x,ôx) forment un recouvrement*92)
ouvert de X; on peut donc en extraire un recouvrement fini X = Ux€jBx(x,5x), où JcX
est fini. Alors, par construction, si x' G X, il existe x G J tel que dx{x,x') < ôx. Soit alors
ô = infx€J ôx. Si xuX2 G X vérifient dx(xi,x2) < 5, et si x G J est tel que dx(x,xx) < <5X, alors
dx(x,x2) < 25x, et donc dY(f(x)J(xi)) < f, dY(f(x)J(x2)) < f et dY(f(x2)J(xx)) < e.
Ceci montre que / est uniformément continue.
Exercice 12.4- Soit / : [a, 6] —> R une fonction dérivable.
(i) Montrer que si f(a) = /(&), il existe c e]a, b[ tel que /'(c) = 0 (lemme de Rolle).
(ii) Dans le cas général, montrer qu'il existe c G]a,6[ tel que /(&) - f(a) = f'(c)(b - a) (th. des
accroissements finis*93) ).
(iii) En déduire que / est strictement croissante sur [a, 6], si /'(c) > 0 pour tout c G]a,6[.
Exercice 12.5. Soit (E, || ||) un espace vectoriel norme de dimension finie. On dit que / : E —> C tend
vers 0 à l'infini, si pour tout e > 0, il existe M > 0, tel que \f(x)\ < e, si ||x|| ^ M. Montrer que, si
/ : E —> C est continue et tend vers 0 à l'infini, alors / est bornée et |/| atteint son maximum.
Exercice 12.6. Soit (X,d) un espace métrique. Si F c X, et si x G X, on définit la distance d(x,F) de
x à F comme la borne inférieure des d(x,y), pour y G F.
(i) Montrer que x »-> d(x, F) est continue et même 1-lipschitzienne sur X.
(ii) Montrer que d(x, F) = 0 si et seulement si x est dans l'adhérence F de F.
(iii) En déduire que si Fi et F2 sont des fermés disjoints, il existe des ouverts disjoints Ui, U2 avec
Fr c Ui et F2 C U2.
(iv) On définit la distance entre Fi et F2 par d(Fu F2) = infx€plf v^f2 d(x, y). Montrer que si Fx et F2
sont des compacts disjoints, alors d(Fi,F2) > 0.
(v) Montrer que si Fi n F2 = 0, si Fi est fermé et si F2 est compact, alors d(Fu F2) ^ 0.
(vi) Construire des fermés disjoints de R ou R2 dont la distance est nulle.
Exercice 12.7. Soient X un compact métrique et / : X —> X une application contractante (i.e. vérifiant
d(f(x),f(y)) < d(x,y), quels que soient x ^ y).
(i) Montrer que / a un unique point fixe x0.
(ii) Montrer que si x G X, et si fn = f o • • • o / (n fois), alors fn(x) —> xo-
(iii) Montrer que fn —> x0 uniformément sur X (i.e. supx£Xd(fn(x),xo) —> 0 quand n —► +00).
Exercice 12.8. (difficile) Soit X un espace métrique. Montrer que si toute fonction continue de X
dans R est bornée, alors X est compact.
<92> Comme on travaille avec des espaces métriques, on peut aussi passer par les suites. Supposons donc
que X est compact, que / : X —► Y est continue mais pas uniformément continue. En niant la définition de
la continuité uniforme rappelée ci-dessus, on voit qu'il existe e > 0, tel que, quel que soit n G N, il existe
(xn,x'n) G X x X tels que dx{xn,x'n) ^ 2"n et dY(f(xn),f(x'n)) ^ e. Comme X est supposé compact, il
en est de même de X x X, et la suite (xn, a4)n€N admet une valeur d'adhérence (a, 6) dans X x X. De
plus, comme dx(xn, x'n) —> 0, on a a = 6, et comme / est continue, (/(a), /(&)) est une valeur d'adhérence
de la suite (f(xn),f(x,n))n£N dans Y x Y. Comme f(a) = /(&), cela est en contradiction avec le fait que
dY(f(xn),f(x'n)) ^ e, quel que soit n G N (en effet, (y,y') »-> dY(y,y') est continue sur Y x Y, et une
valeur d'adhérence (c,c') de la suite (/(xn),/(a4))nGN doit donc vérifier dY(c,cf) ^ e > 0). Ceci permet
de conclure.
(93)Voir l'ex. 15.6 pour une généralisation.
12. COMPACITÉ
145
12.3.3. Compacité locale
La compacité d'un espace est une propriété très agréable, mais rarement vérifiée. Dans
les applications, il suffit souvent que cette propriété soit vraie localement : on dit qu'un
espace est localement compact si tout point possède une base de voisinages constituée de
compacts.
• R, C et, plus généralement, un espace vectoriel de dimension finie sur R ou C sont
localement compacts.
• Un espace compact est localement compact.
Soient X un compact et a; € X. Comme X est séparé, il existe, pour tout y ^ x, des
ouverts UXiî/ et VXiy, d'intersection vide, contenant x et y respectivement. Il en résulte que y
n'appartient pas à l'adhérence FXiy de UXiy, et donc que, si V est un ouvert contenant x et
si F est son complémentaire, alors F D ( nyeX-{x} ^x,y) = 0- Or F est compact, en tant que
fermé d'un compact, et F n Fx<y est fermé dans F pour tout y ; on en déduit l'existence d'un
sous-ensemble fini Y de X - {x} tel que F n ( ny€y Fx,y) = 0- Soit Uy = f\eY^x,y ; alors Uy
est un ouvert de X, en tant qu'intersection finie d'ouverts, qui contient x, et dont l'adhérence
Fy est contenue dans V, puisque cette adhérence est contenue dans le fermé FXiî/, pour tout
y € Y. Comme Fy est compact, il résulte de ce qui précède, que tout ouvert V contenant x
contient un compact Fy qui, lui-même, contient un ouvert Uy dont x est élément. Ceci prouve
que les compacts forment une base de voisinage de x, et permet de conclure.
12.4. La droite réelle achevée
I2.4.I. Les espaces topologiques ordonnés R et R+
On note R = R U {±00} la droite réelle achevée. On étend < de manière naturelle en
une relation d'ordre totale sur R, en convenant que —00 < a ^ +00, quel que soit a G R.
On fait de R un espace topologique, en prenant les ]a,b[, pour a < b G R, et les [—00,a[
et ]o,+00], pour a € R, comme base d'ouverts. La topologie induite sur R est donc la
topologie usuelle.
• Une suite de nombres réels xn tend vers +00 dans R si et seulement si xn tend vers +00
au sens classique. (Idem pour —00.)
Les ]o, +00] forment une base de voisinages de +00, et donc xn —► +00 dans R si et seulement
si, quel que soit a € R, il existe N € N tel que xn e]a, +00], si n ^ N.
• L'espace topologique R est isomorphe à [—1,1] en tant qu'espace ordonné et en tant
qu'espace topologique ; en particulier, il est compact et métrisable, et tout sous-ensemble
non vide de R admet une bonne inférieure et une borne supérieure.
L'application x 1-» /(#), avec f(x) = j^rn si a; € R, /(+00) = 1 et /(-oo) = —1, est
un homéomorphisme strictement croissant de R sur [—1,1], dont l'inverse est g défini par
g(x) = ï^bi, si rc G R, g(l) = +00, g(-l) = -00 (nous laissons au lecteur le soin de vérifier
que f et g sont bien des applications continues inverses l'une de l'autre).
• Une suite (zn)n6N croissante (resp. décroissante) d'éléments de R converge vers la borne
supérieure (resp. inférieure) de {xn, n G N}.
146
VOCABULAIRE MATHÉMATIQUE
• Si X C R est non vide, alors supX et inf X sont dans l'adhérence de X.
En utilisant l'homéomorphisme / : R -» [-1,1], qui est strictement croissant, on se ramène
à démontrer le même énoncé pour X c [-1,1] ce qui permet de traiter tous les cas de la même
manière. Maintenant, si la borne supérieure M de X appartient à X, elle appartient a fortiori
à son adhérence. Si M n'appartient pas à X, alors pour tout n > 0, il existe xn G X avec
M - 2"n < xn < M, ce qui prouve que M est limite d'une suite d'éléments de X et donc est
dans son adhérence. Ceci permet de conclure.
On note R+ la demi-droite achevée. C'est l'ensemble des x G R vérifiant x ^ 0. On
étend l'addition à R+ de la manière évidente, en posant x + (+oo) = +oo, si x G R+.
Comme toute suite croissante d'éléments de R+ admet une limite dans R+, on en déduit
que :
• Toute série J2neN un à termes dans R+ converge dans R+. Si les un sont dans R+, alors
Y^neNun < +°° s* et seulement si la série ^2neNun converge au sens usuel.
12.4-2. Limite supérieure, limite inférieure
• Toute suite (xn)nGN d'éléments de R admet une plus grande valeur d'adhérence lim sup xn
limite supérieure de la suite xn et une plus petite valeur d'adhérence liminf xn, limite in-
férieure de la suite xn. De plus, (xn)nGN converge si et seulement si ses limites supérieure
et inférieure sont égales, et la limite de la suite est alors la valeur commune des limites
supérieure et inférieure(94).
La compacité de R implique que l'ensemble des valeurs d'adhérence d'une suite (xn)nGN
d'éléments de R est non vide. Comme cet ensemble est fermé, les bornes inférieure et
supérieure de cet ensemble sont encore des valeurs d'adhérence ; autrement dit toute suite (xn)nGN
d'éléments de R admet une plus grande et une plus petite valeur d'adhérence. De plus, comme
R est un espace compact métrisable, une suite converge si et seulement si elle a une seule
valeur d'adhérence et donc si et seulement si ses limites supérieure et inférieure sont égales.
On en déduit le résultat.
• On a aussi lim sup xn = inf ( sup xn) et lim inf xn = sup ( inf xn).
Pour éviter d'avoir à traiter séparément les cas où une des limites est infinie, on utilise
l'homéomorphisme / : R -* [-1,1] ci-dessus pour se ramener au cas de suites à valeurs dans
[-1,1]. Soient a = lim sup xn et 6 = inf^N (supn^fcxn), et soit e > 0. Comme a est une
valeur d'adhérence, il existe pour tout k G N, un entier n ^ k tel que \xn - a\ < e. On a
donc supn^/, xn ^ a - e, pour tout fc, et donc 6 ^ a - e, pour tout e > 0. On en déduit que
b ^ a. Par ailleurs, comme a est la plus grande valeur d'adhérence, il n'y a qu'un nombre
fini de n tels que xn ^ a + e, et donc supn^fc xn ^ a + e, si k est assez grand, et 6 ^ a + e,
pour tout e > 0. On en déduit que 6 ^ a, ce qui permet de démontrer la première égalité. La
seconde se démontre de même en renversant les inégalités.
(94>Ça a l'air un peu tautologique, mais il est très utile de disposer des quantités lim sup xn et lim inf xn
sans aucune hypothèse sur la suite (xn)ne^.
12. COMPACITÉ
147
12.5. L'espace topologique T = R/Z
Z étant un sous-groupe de R pour l'addition, on peut considérer le quotient R/Z qui
est un groupe commutatif ; on le munit de la topologie quotient, ce qui en fait un espace
topologique.
• Si 7r : R —► R/Z est l'application naturelle, l'application / i-> / o ir est une bijection de
l'ensemble des fonctions sur R/Z sur celui des fonctions sur R vérifiant f(x + ri) = f(x)
pour tous x G R et n G Z. Autrement dit, une fonction sur R/Z est la même chose
qu'une fonction périodique de période 1 sur R. Par ailleurs, par définition de la topologie
quotient, une fonction / sur R/Z est continue si et seulement si / o ir est continue sur R.
Autrement dit, l'espace ^(R/Z) des fonctions continues sur R/Z s'identifie naturellement
à l'espace des fonctions continues sur R, périodiques de période 1.
• L'application x i-> exp(2Ï7r:c) induit des homéomorphismes de R/Z et [0, l]/(0 ~ 1),
munis de la topologie quotient, sur le cercle^95) S1 = {z G C, \z\ = 1} muni de la topologie
induite par celle de C. En particulier, R/Z est un espace compact métrisable.
Notons 7r : R —► R/Z l'application naturelle et / : R —» S1 l'application x h-* exp(2i7rrc).
Comme / est périodique de période 1, elle induit une application / de R/Z dans S1 qui est
bijective de manière évidente, et on a / = fon par construction. De plus, / est continue de R
dans C, et donc / est continue de R/Z (muni de la topologie quotient) dans S1 (muni de la
topologie induite par celle de C). Comme / est injective et comme S1 est séparé car métrique,
on en déduit que R/Z est séparé (cf. ex. 11.6).
Maintenant, l'application x *-* x de [0,1] dans R est continue, et donc la composée avec
7r est une application continue de [0,1] dans R/Z qui est surjective. Comme la seule relation
modulo Z entre les éléments de [0,1] est 0 ~ 1, cette application continue induit, par passage
au quotient, une injection continue i : [0, l]/(0 ~ 1) —» R/Z, et comme elle est surjective,
c'est une bijection continue de [0, l]/(0 ~ 1) sur R/Z. Comme R/Z est séparé, on en déduit,
par le même argument que ci-dessus, que [0, l]/(0 ~ 1) est séparé. Comme [0,1] est compact
et comme l'application naturelle de [0,1] dans [0, l]/(0 ~ 1) est continue par définition de la
topologie quotient, on en déduit, en utilisant les deux avant-derniers points de l'alinéa 12.3.1,
que :
• [0, l]/(0 ~ 1) est compact ;
• l : [0, l]/(0 ~ 1) —» R/Z est un homéomorphisme et R/Z est compact ;
• / : R/Z —►S1 est un homéomorphisme.
Ceci permet de conclure.
Ces diverses identifications permettent de voir un lacet 7 dans un espace topologique X
comme, au choix :
• une application continue 7 : S1 —> X,
• une application continue 7 : R —> X, périodique de période 1,
• une application continue 7 : R/Z —> X,
• une application continue 7 : [0,1] —> X vérifiant 7(1) = 7(0).
C'est cette dernière description qui est utilisée la plupart du temps dans le cours.
^^Visuellement, si on prend un segment et qu'on attache ses deux extrémités, on obtient un cercle.
148
VOCABULAIRE MATHÉMATIQUE
13. Connexité
13.1. Ensembles connexes
• Si X est un espace topologique, les propriétés suivantes sont équivalentes :
(i) toute application continue de X dans {0,1} (muni de la topologie discrète) est
constante ;
(ii) toute application continue de X dans un espace topologique discret Y est constante ;
(iii) X ne peut pas s'écrire comme réunion de deux ouverts non vides disjoints ;
(iv) X ne peut pas s'écrire comme réunion de deux fermés non vides disjoints ;
(v) si Y C X est à la fois ouvert et fermé, alors Y = 0 ou Y = X.
L'implication (ii)=Ki) suit juste de ce que {0,1} est un ensemble discret. Réciproquement,
si Y est discret, toute application g : Y —► {0,1} est continue ; on en déduit que si X vérifie (i),
et / : X —» Y est continue, alors toute application composée g o f : X —» {0,1} est constante,
ce qui implique que / est constante. Les conditions (i) et (ii) sont équivalentes.
Maintenant, si / : X -» {0,1} est continue, alors Ui = f~l({0}) et u2 = /"Ht1}) sont
ouverts puisque {0} et {1} sont ouverts dans {0,1}, sont disjoints, et X = Ui U U2.
Réciproquement, si Ui et U2 sont ouverts, disjoints, et si X = Ui U U2, l'application / : X —» {0,1}
définie par f(x) = 0, si x € Ui et f(x) = 1 si x € U2 est continue. On en déduit qu'il existe
/ : X —» {0,1} continue non constante si et seulement si on peut écrire X comme réunion
de deux ouverts non vides disjoints ; d'où l'équivalence de (i) et (iii). L'équivalence des autres
propriétés avec (iii) est immédiate.
Un espace topologique X est connexe s'il est non vide et vérifie une des (et donc
toutes les) propriétés équivalentes précédentes.
• Si Xi et X2 sont deux ensembles connexes avec Xx n X2 ^ 0, alors Xi U X2 est connexe.
Soit / : Xi U X2 —» {0,1} continue. Les restrictions de / à X! et X2 sont continues et donc
constantes. Comme on a supposé Xx 0X2 ^ 0, on peut choisir y € Xi nX2, et / vaut f(y) sur
Xi et X2 ; par suite elle est constante sur Xi U X2. On en déduit la connexité de Xi U X2.
Ceci permet, si X est un espace topologique quelconque, et rc G X, de définir la
composante connexe Cx de x dans X comme le plus grand sous-ensemble connexe de X
contenant x ; c'est la réunion de tous les connexes de X contenant x. On appelle composante
connexe de X tout sous-ensemble de la forme Cx, pour x G X. On a y G C^ si et
seulement si Cy = Cx, ce qui fait que les composantes connexes de X forment une partition
de X, la partition en composantes connexes. Un ensemble est totalement discontinu si les
composantes connexes sont réduites à un point.
• Dans R, les connexes sont les segments (tous les segments, i.e. les [a, 6], [a,6[, ]a,6],
]o, 6[, pour a, 6 G R, ainsi que les demi-droites ou R tout entier obtenus en permettant à
o ou 6 de prendre les valeurs ±00).
Si X c R n'est pas un segment, c'est qu'il existe o £ X et x\,X2 € X, avec xi < a et
£2 > û. Alors Ui = Xn] - 00, o[ et U2 = Xn]a, +oo[ sont des ouverts de X, qui sont non vides,
disjoints, et dont la réunion est X, ce qui prouve que X n'est pas connexe. Autrement dit, si
X est connexe, alors X est un segment.
13. CONNEXITÉ
149
Maintenant, soient a ^ 6, et soit / : [a, 6] —> {0,1} continue. Quitte à remplacer / par 1 - /,
on peut supposer que f(a) = 0. Soit X = {x e [a,6], f(x) = 1}, et soit c la borne inférieure
de X, si X n'est pas vide. Par définition de c, il existe une suite d'éléments de X (qui peut être
la suite constante c, si c G X) ayant pour limite c, et comme / est continue, on a f(c) = 1. En
particulier, on a c ^ a, et si x G [a, c[, alors f(x) = 0, par définition de c. Comme / est continue
et comme c est dans l'adhérence de [a,c[, cela implique que /(c) = 0. D'où une contradiction
qui prouve que X est vide et donc que / est constante sur [a, 6]. On en déduit la connexité du
segment [a, 6].
Pour prouver la connexité de [a,6[, on prend une suite croissante bn tendant vers 6, et
on écrit [a, b[ comme réunion croissante des segments [a, 6n] qui sont connexes d'après ce qui
précède. Comme une réunion de connexes dont l'intersection est non vide est connexe, cela
prouve que [a, b[ est connexe. Les autres cas se traitant de la même manière, cela permet de
conclure.
• L'image d'un ensemble connexe par une application continue est un ensemble connexe.
Si X est connexe, si / : X —> Y est continue, et si g : /(X) —> {0,1} est continue, alors
gof : X —► {0,1} est continue, et donc constante puisque X est connexe. Comme / : X —> /(X)
est surjective, cela implique que g est constante. On en déduit la connexité de /(X).
• Soit / : [a, 6] —> R continue. Si /(a) et f(b) sont de signes opposés, alors il existe
x G [a, b] tel que f(x) = 0 (théorème des valeurs intermédiaires).
Comme [a, 6] est connexe, son image par / l'est aussi et donc est un segment de R, et comme
cette image contient des réels négatifs et positifs par hypothèse, elle contient 0.
• Si X et Y sont connexes, alors X x Y est connexe.
Soit / : X x Y —► {0,1} continue. Si x G X, la restriction de / à {x} x Y est continue et
donc constante, et si y G Y, la restriction de / à X x {y} est continue et donc constante. Ceci
implique que si 0&i,yi),0&2>lte) G X x Y, alors /feïfc) = /feï/i) = /(&i,yi)> et donc que
/ est constante. On en déduit la connexité de X x Y.
• Si X est un espace topologique, et si Y C X est connexe, alors l'adhérence de Y dans X
est connexe.
Soit / : Y —> {0,1} continue. Comme Y est connexe, la restriction de / à Y est constante.
Soit a e {0,1} l'image de Y. Alors f~l(a) est un fermé de Y contenant Y, et donc est égal
à Y par définition de l'adhérence. Autrement dit, / est constante. On en déduit la connexité
de Y.
• Les composantes connexes d'un espace topologique sont fermées.
Exercice 13.1. (i) Peut-on trouver / : R —> R, continue, prenant chaque valeur exactement 2 fois?
(ii) Pour quelles valeurs de n ^ 1 peut-on trouver une fonction continue / : R —> R prenant chaque
valeur exactement n fois ?
13.2. Connexité par arcs
Un espace topologique X est dit connexe par arcs si, quels que soient ï,j/6X, il existe
t* : [0,1] —> X continue, avec u(0) = x et u(l) = y (i.e. si on peut joindre n'importe
quelle paire d'éléments de X par un chemin continu). Si Xi et X2 sont connexes par arcs,
150
VOCABULAIRE MATHÉMATIQUE
et si Xi n X2 est non vide, alors Xi U X2 est connexe par arcs puisqu'on peut joindre
n'importe quel point de Xi U X2 a un point de l'intersection par un chemin continu, et
donc n'importe quel couple de points de Xi UX2. Ceci permet, comme ci-dessus, de parler
des composantes connexes par arcs de X.
• Un espace connexe par arcs est connexe(96), mais il existe des ensembles connexes qui
ne sont pas connexes par arcs.
Soit X connexe par arc, et soit xo G X. Par hypothèse, il existe, pour tout x G X, une
application continue u : [0,1] —> X avec u(0) = x0 et u(l) = x. Comme [0,1] est connexe et
comme l'image d'un connexe par une application continue est connexe, cela montre que a; est
dans la composante connexe de x0. Par suite la composante connexe de xq est X tout entier
qui, de ce fait, est connexe.
Pour des exemples de connexes non connexes par arcs, voir la rubrique tératologie.
• Un ouvert connexe de Rn est connexe par arcs.
Soit U un ouvert connexe de Rn, et soient xq G U et X la composante connexe par arcs
de £0. Soit x G X. Comme U est ouvert, il existe r > 0 tel que B(x,r) soit incluse dans U.
Si y G B(x,r), le segment [x,y] est inclus dans U, et comme il existe un chemin continu
joignant x0 à x dans U, il suffit de composer ce chemin avec le segment [x, y] pour obtenir
un chemin joignant xo à y dans U. On en déduit l'appartenance de y à X, et donc l'inclusion
de B(0,r) dans X, ce qui prouve que X est ouvert. Maintenant, soit x dans l'adhérence de X
dans U, et soit r > 0 tel que B(x,r) soit incluse dans U. Par définition de l'adhérence, il existe
y G XnB(x,r), et comme le segment [y, x] est contenu dans U, on déduit comme ci-dessus que
x G X, ce qui prouve que X est fermé. On a donc prouvé que X est à la fois ouvert et fermé
dans U, et comme il est non vide et que U est supposé connexe, cela implique que X = U. Ceci
permet de conclure.
• Un ouvert de Rn est une réunion dénombrable d'ouverts connexes. Un ouvert de R est
une réunion dénombrable de segments ouverts.
Soit U un ouvert de Rn. Si x G U, il existe r > 0 tel que B(x,r) c U, et comme B(x,r) est
connexe par aies (et même par segments), la composante connexe de x contient B(x,r). On
en déduit que les composantes connexes de U sont des ouverts. Maintenant, un ouvert de Rn
contient un point dont toutes les coordonnées sont rationnelles, et comme les composantes
connexes de U sont disjointes, on obtient une injection de l'ensemble de ces composantes
connexes dans Qn, en choisissant un point à coordonnées rationnelles dans chacune d'entre
elles. Comme Qn est dénombrable, cela montre que l'ensemble des composantes connexes deU
est dénombrable. On en déduit le premier énoncé. Le second en est une conséquence immédiate
puisqu'un ouvert connexe de R est un segment ouvert.
Exercice 13.2. Montrer que si n ^ 2, et si U est un ouvert connexe de Rn, alors U - {x} est connexe,
quel que soit x G U.
Exercice 13.3. (i) Montrer que R et R2 ne sont pas homéomorphes; que [0,1] et [0, l]2 ne sont pas
homéomorphes.
(ii) Montrer que [0,1] et le cercle C = {z G C, \z\ = 1} ne sont pas homéomorphes.
(96>C'est le principal intérêt de la connexité par aies ; la connexité est d'utilisation nettement plus facile.
14. COMPLÉTUDE
151
Exercice 13.4- Montrer que [0,1] et ]0,1[ ne sont pas homéomorphes.
Exercice 13.5. Soit X le sous-ensemble de R constitué de trois cercles de rayon 1 dont les centres
forment les trois sommets d'un triangle équilatéral dont la longueur des côtés est 2 (chacun des cercles
est donc tangent aux deux autres). Soit Y formé de trois cercles de rayon 1 centrés en (0,0), (2,0) et (4,0).
Montrer que X et Y ne sont pas homéomorphes.
Exercice 13.6. (difficile)
(i) Soit (Fn)n€N une suite décroissante (Fn+i c Fn) de fermés connexes de R2, et soit F = nn€NFn.
(a) Donner un exemple où F n'est pas connexe.
(b) Montrer que, si F0 est compact, alors F est connexe.
(ii) Soit (#n)neN une suite d'éléments de R2 telle que d(xn+i,xn) -* 0.
(a) Montrer que, si la suite est bornée, l'ensemble de ses valeurs d'adhérence est connexe.
(b) Est-ce forcément le cas si la suite n'est pas bornée ?
Exercice 13.7. (difficile, sa solution utilise la notion d'espace contractile introduite plus tard dans le
cours) Montrer que le cylindre et la bande de Moebius ne sont pas homéomorphes.
14. Complétude
14.1. Suites de Cauchy
Soit (X,d) un espace métrique. Une suite (xn)ne^ est de Cauchy (ou vérifie le critère
de Cauchy) si le diamètre de {xk, k^ n} tend vers 0 quand n —> +oo, ce qui se traduit,
au choix, par :
• quel que soit e > 0, il existe N G N, tel que d(xn+p, xn) < e, si n ^ N et p G N ;
• limn^+00 (suppGNd(xn+p,xn)) = 0.
On remarquera qu'une suite de Cauchy est en particulier bornée.
Exercice H.l. (i) Montrer que si d est ultramétrique, alors (xn)n€N est de Cauchy si et seulement si
d(xn+uxn)->Q.
(ii) Construire une suite (xn)n€N d'éléments de R, vérifiant d(xn+i,xn) -* 0, mais pas de Cauchy.
• Une suite de Cauchy ayant au moins une valeur d'adhérence a une limite.
Soit (xn)n€N une suite de Cauchy. Supposons que a en soit une valeur d'adhérence. Comme
X est un espace métrique, il existe une suite (£<p(n))n€N extraite de (xn)n€N ayant a pour limite.
Soit alors e > 0. Comme (xn)n€N est de Cauchy, il existe N0 G N tel que d(xm+p,xm) < e,
si m ^ No et p G N. Comme (p(n) tend vers +00, il existe Ni G N tel que <p(n) ^ No, si
n ^ Ni, et comme x^n) -* a, il existe N2 ^ Ni tel que d(x(p^n),a) < e, si n ^ N2. Alors
d(&p(n)+p,a) < 2e, si n ^ N2 et p G N, et donc d(xm,a) < 2e, si m ^ <p(N2). On en déduit
que xn -* a, ce qui permet de conclure.
L'espace (X, d) est complet si toute suite de Cauchy admet une valeur d'adhérence ou,
ce qui revient au même, une limite. Le critère qui suit permet de ne considérer que des
suites convergeant "normalement".
• (X,d) est complet si et seulement si la condition Y^Zd(xn+i,Xn) < +00 implique que
(xn)neN a une limite.
152
VOCABULAIRE MATHÉMATIQUE
Si T,t™od(xn+uxn) < +00, alors suppeNd(xn,xn+p) ^ T,k™od(xn+k+i,xn+k) tend vers 0
quand n —> +00 puisque majoré par le reste d'une série convergente. On en déduit que la suite
(#n)n€N est de Cauchy, et donc converge si (X,d) est complet.
Réciproquement, si toute suite (xn)neN telle que En^o^n+i^n) < +00 a une limite,
et si (î/n)nGN est une suite de Cauchy, on peut en extraire une sous-suite (ï/<p(n))neN telle
que suppGN d(3/<p(n+p)>VV>(n)) ^ 2"n quel que soit n G N. Il suffit de définir <p(n) comme le
N correspondant à e = 2~n dans la définition d'une suite de Cauchy. La suite xn = y^n^
vérifie X!n^^n+i^n) < +00; elle converge donc, et comme elle est extraite de (î/n)neN,
cela prouve que (yn)nei* a une valeur d'adhérence et donc une limite puisqu'elle est de Cauchy.
On en déduit la complétude de X.
• Si (X, d) est complet, et si Y est fermé dans X, alors (Y,d) est complet.
Si (#n)neN est une suite de Cauchy dans Y, alors c'est une suite de Cauchy dans X ; elle a
donc une limite dans X qui appartient à Y puisque Y est fermé. D'où la complétude de Y.
• Un espace métrique compact est complet.
Si (#n)neN est de Cauchy dans un espace métrique compact X, alors (xn)neN admet une
valeur d'adhérence puisque X est compact, et donc converge d'après le point ci-dessus, ce qui
prouve que X est complet.
D'après le point précédent, un espace compact est complet quelle que soit la distance
utilisée pour définir la topologie. Ce n'est pas le cas en général : la complétude est une
propriété métrique et pas topologique.
Exercice 14-2. (i) Montrer que d'(x,y) = \f(y) - /(x)|, avec f(x) = yq^ï est une distance sur ] -1,1[
équivalente à la distance usuelle.
(ii) Montrer que ] - 1,1[ est complet pour d' mais pas pour la distance usuelle.
• R est complet.
Soit (xn)neN une suite de Cauchy d'éléments de R. En particulier, la suite est bornée et
il existe M > 0 telle que (xn)neN soit à valeurs dans [—M, M]. Comme [-M,M] est compact,
cela implique que (xn)neN a une valeur d'adhérence, et donc qu'elle a une limite puisqu'elle
est de Cauchy. Ceci permet de conclure.
• Si X et Y sont complets, alors X x Y est complet.
Si (#n>ï/n)neN est une suite de Cauchy dans X x Y, alors (xn)nçN est de Cauchy dans X
et (î/n)nGN est de Cauchy dans Y, et si a et 6 désignent les limites respectives de (xn)neN et
(î/n)neN) alors (xn>ï/n)neN tend vers (a, 6). On en déduit la complétude de X x Y.
14.2. Principales propriétés des espaces complets
L'intérêt principal de travailler dans un espace complet est que les problèmes d'existence
sont nettement plus faciles. Le théorème du point fixe ci-dessous a de multiples
applications à l'existence d'objets (solutions d'équations différentielles, racines de polynômes à
coefficients réels, complexes, ou p-adiques, inversion locale de fonctions de classe if1.. .)•
Le lemme de Baire est un autre de ces outils magiques fournissant l'existence d'une in-
14. COMPLÉTUDE
153
finité de solutions à des problèmes pour lesquels on a du mal à en exhiber une (97> ; son
utilisation nécessite nettement plus d'astuce que celle du théorème du point fixe.
• Dans un espace complet, une application strictement contractante admet un unique
point fixe, et la suite des itérés de tout point tend vers ce point fixe (th. du point fixe).
Soit (X, d) un espace métrique complet, soit / : X —» X une application strictement
contractante (i.e. il existe a < 1 tel que d(f(x),f(y)) ^ ad(x,y) pour tous x,y G X), et soit x G X.
Définissons par récurrence une suite (a;n)n€N en posant xq = x et xn+i = f(xn), si n G N (en
notant fn l'application / o • • • o / composée n fois, on a aussi xn = fn(x)). Soit a = d(#o> xi).
Une récurrence immédiate montre que d(xn,xn+i) ^ ana quel que soit n G N. On a donc, si
p G N, et n G N
d(xn+P)xn) < d(xnixn+i) + • • • + d{xn+p-Uxn+p) ^ a(an + ■■■ + an+p~l) ^ a11 y-^.
La suite (xn)n€N est donc de Cauchy puisque an tend vers 0 quand n tend vers +oo. Notons
£ sa limite. Une application contractante étant en particulier continue, on a
f(i) = /( lim xn) = lim f(xn) = lim xn+i = l,
n—*+oo n—*+oo n—*+oo
ce qui prouve que l est un point fixe de /. On a donc prouvé que, si x est un point quelconque
de X, alors la suite des itérés de x par / tend vers un point fixe de /. Maintenant, si x et y
sont deux points fixes de /, on a d(x,y) = d(f(x),f(y)) ^ ad(x,y), et donc d(x,y) = 0, et
x = yy ce qui prouve que / a un unique point fixe. Ceci permet de conclure.
• Dans un espace complet, l'intersection d'une suite de fermés emboités, non vides, dont
le diamètre tend vers 0, est non vide et réduite à un point (th. des fermés emboités).
Soit (X,d) un espace métrique complet, et soit (Fn)n€N une suite de fermés emboités
(i.e. Fn+i c Fn quel que soit n G N), non vides, dont le diamètre tend vers 0 (le diamètre
d'un sous-ensemble Y de X est la borne supérieure de l'ensemble des d(x,y), pour x,y G Y).
Choisissons, pour tout n G N, un élément xn de Fn, et notons dn le diamètre de Fn. Par
hypothèse dn tend vers 0 quand n tend vers +oo. Par ailleurs, xn+p et xn sont deux éléments
de Fn et donc d(xn+p,xn) ^ dn quels que soient n,p G N. La suite (xn)n€N est donc de
Cauchy. Comme X est supposé complet, cette suite admet une limite x. De plus, si on fixe m,
alors xn G Fn c Fm, si n ^ m, et comme Fm est fermé, cela implique que x G Fm. Ceci étant
vrai pour tout me N, on axGF = nn€NFn, ce qui prouve que F est non vide. Enfin, si x,y
sont deux éléments de F, on a x, y G Fn pour tout n G N, et donc d(x, y) ^ dn quel que soit
n G N. On en déduit la nullité de d(x,y), ce qui implique x = y, et permet de conclure.
• Dans un espace complet, une intersection dénombrable d'ouverts denses est dense et
donc, en particulier, est non vide (lemme de Baire).
Soit (X,d) un espace métrique complet, et soit (Un)n€N une suite d'ouverts denses de X.
Notre but est de prouver que, si x0 G X, et si r0 > 0, alors B(x0,r^) n (nn€NUn) est non vide.
Pour cela, nous allons contruire une suite B(xn,rn) de boules fermées vérifiant :
0 < rn+1 ^ *f et B(xn+1,rn+1) c Un+1 n B(xn,r").
Supposons B(xn,rn) construite. Comme Un+i est dense dans X, Un+i nB(xn,r~) est non
vide. Prenons xn+i G Un+i n B(xn,r~) quelconque. Comme Un+i n B(xn,r~) est un ouvert,
(97>On tombe alors sur le problème quasi-théologique de savoir si on peut vraiment prétendre avoir
démontré qu'un ensemble est non vide si on est incapable d'en produire un élément.
154
VOCABULAIRE MATHÉMATIQUE
il existe rn+i €]0,*f] tel que B(sn+1,2rn+1) c Un+i n B(sn,rn), et donc B(sn+1,rn+1) c
Un+i D B(rcn,r~), ce qui permet de faire la construction à l'ordre n + 1.
Maintenant, par construction, les B(xn,rn) forment une suite de fermés emboités (car
on a imposé B(xn+i,rn+i) c B(xn,r~)) dont le diamètre tend vers 0 (car rn+i < !f), et
B(xn,rn) C B(xo,rô) n (nfc^nU&), si n ^ 1, ce qui implique que nn€NB(a:n,rn), qui est non
vide d'après le théorème des fermés emboités, est inclus dans
nneN(B(x0,r^) n (nfc<nufc)) = B(x0,r^) n (nn€Nun).
Ceci permet de conclure.
Le lemme de Baire s'utilise souvent en passant aux complémentaires.
• Dans un espace complet, une réunion dénombrable de fermés d'intérieur vide est
d'intérieur vide ; autrement dit, si une réunion dénombrable de fermés est d'intérieur non vide,
alors au moins un des fermés est d'intérieur non vide.
Exercice 14-3. (i) Montrer qu'une intersection dénombrable d'ouverts denses de R est non
dénombrable.
(ii) Peut-on trouver une suite (/n)neN de fonctions continues sur R telle que la suite des fn(x), pour
n € N, soit bornée pour tout x irrationnel et non bornée pour tout x rationnel ?
14.3. Complétion d'un espace métrique
Un espace métrique n'est pas forcément complet, mais il peut se compléter de manière
unique. Plus précisément :
• Si (X, d) est un espace métrique, il existe, à isométrie près, un unique espace métrique
complet (X,d), contenant X comme sous-espace dense, qui vérifie la propriété universelle
suivante : toute application uniformément continue / de X dans un espace métrique Y
complet se prolonge de manière unique en une application continue de X dans Y.
Cet espace est le complété de X, et un espace complet est son propre complété; plus
généralement, si X est dense dans Y, et si Y est complet, alors Y est le complété de X.
L'unicité suit du résultat plus général (et très utile) suivant appliqué au cas où Y et Z
sont deux complétés de X, et / est l'identité sur X, l'application / : Y —> Z qu'on en tire
est alors une isométrie puisque c'en est une sur X (cf. ex. 11.8).
• Soient (Y, dy) et (Z, dz) deux espaces complets. Si X est dense dans Y, et si / : X —» Z
est telle qu'il existe p > 0, tel que / soit uniformément continue sur Bx(#,p), pour tout
ieX, alors / s'étend de manière unique en une application continue de Y dans Z.
Soit y € Y, et soit (xn)n€N une suite d'éléments de X tendant vers y quand n tend vers +oo.
La suite (xn)neN est alors de Cauchy, et il existe n € N tel que xn € Bx(xno,p), quel que
soit n ^ no- Comme on a supposé que / est uniformément continue sur Bx(xnolp), la suite
(/(#n))n€N est de Cauchy dans Z, et comme Z est complet, cette suite a une limite, et cette
limite ne dépend pas de la suite (xn)n€N de limite y (sinon on pourrait construire une telle
suite de telle sorte que que (/(#n))n€N ait deux valeurs d'adhérence). Notons cette limite/(y).
Maintenant, soit e > 0 et soit xq € X. Comme / est uniformément continue sur Bx(#o>P)>
il existe ô > 0 tel que dz(f(x),f(x')) ^ e, si dy{x,x') < ô et x,x' € Bx{xo,p). Si 3/1,3/2 €
14. COMPLÉTUDE
155
By(zo>/>) vérifient ^(3/1,3/2) < 5, et si (£i,n)n€N et (x2,n)n€N sont des suites d'éléments de
X tendant vers 3/1 et y2 respectivement, alors Xiiiux2in € Bx(x0,p) et dY(#i,n>#2,n) < S si n
est assez grand. On a donc dz(/(#i,n)>/(#2,n)) ^ e pour tout n assez grand, et un passage à
la limite montre que dz(/(ï/i)> /(î/2)) ^ £> ce qui prouve que / est uniformément continue sur
By(#o>p)- Comme les By(#o,p), pour x0 G X, recouvrent Y, puisque X est dense dans Y, cela
permet de conclure.
L'existence se démontre en rajoutant(98) de force les limites des suites de Cauchy.
Pour ce faire, notons Cauchy(X) l'ensemble des suites de Cauchy à valeurs dans X. Si
x = (^n)n€N et y = (yn)n£N sont deux éléments de Cauchy(X), la suite (d(xn,yn))n£^ est de
Cauchy dans R car
\d(xn+p,yn+p)-d(xn,yn)\ = \d(xn+p,yn+p)-d(xmyn+p)+d(xn,yn+p)-d(xn,yn)\ ^ d(xn+p,xn)+d(yn+p,yn)
d'après l'inégalité triangulaire. Comme R est complet, cette suite admet une limite que l'on
note d(x,y). De plus, si x = (£n)n€N>ï/ = (ï/n)n€N,2 = (2n)neN sont trois éléments de
Cauchy(X), un passage à la limite dans l'inégalité triangulaire d(xn, zn) ^ d(xm yn)+d(yn, zn)
montre que d vérifie l'inégalité triangulaire d(x,z) ^ d(x,y) + d(y,z). De même, d vérifie la
symétrie d(x,y) = d(y,x), mais elle ne vérifie pas la séparation de la distance (i.e. il n'est pas
vrai que d(x,y) = 0 implique x = y). De fait, il est assez clair que d(x,y) = 0 équivaut au
fait que x et y ont moralement la même limite. Cela nous conduit à introduire la relation ~
sur Cauchy(X) définie par, x ~ y si et seulement si d(£, y) = 0, ce qui fait de ~ une relation
d'équivalence, et nous permet de considérer le quotient X de Cauchy(X) par cette relation
d'équivalence (ce qui revient à considérer comme égaux deux éléments £, y de Cauchy(X)
vérifiant d(x,y) = 0).
Il n'y a plus qu'à vérifier que l'objet que Ton a construit est bien celui que Ton voulait.
L'inégalité triangulaire montre que d(x,y) = d(x',y') si x ~ x' et y ~ y', ce qui montre que
d passe au quotient, et définit une distance sur X puisque, par définition de X, la condition
d(x, y) = 0 implique x = y.
On peut identifier x G X, à la classe dans X de la suite constante t(x) = (£n)neN, avec
xn = x pour tout n G N. Si x, y G X, on a d(x, y) = d(t(x), t(y)) = limn_+00 d(x, y) = d(x, y),
ce qui montre que d induit la distance d sur X. Par ailleurs, si x = (xn)n€N est un élément
de Cauchy(X), alors <2(£,&(#&)) = limn—+00d{xn,Xk) ^ supn^fcd(xn,x/c), et comme la suite
(#n)n€N est de Cauchy, supn^fcd(xn,Xk) tend vers 0 quand k tend vers +00. On a donc
x = limfc_>+oo Xk dans X, ce qui prouve que X est dense dans X.
Il reste à prouver que X est complet. Pour cela soit (£n)neN une suite de Cauchy dans X.
Comme X est dense dans X, on peut trouver, quel que soit n G N, un élément xn de X tel que
d(xn,xn) ^ 2"~n. Soit x = (£n)neN. On a
d(xn, xn+p) = d(xn,xn+p) ^ d(xn,xn) + d(xn,xn+p) + d(xn+p,xn+p) ^ 21"71 + d(xn,xn+p),
et comme la suite (xn)n€N est de Cauchy, on en déduit que x G Cauchy(X). De plus,
d(xn> x) ^ d(xn> xn) + d(xn, x) ^ 2"n + lim d(xn, xm) ^ 2"n + sup d(xn, xn+p),
m—+00 p€N
(98)Beaucoup d'objets mathématiques sont obtenus de cette manière, à commencer par R qui est le
complété de Q pour la distance usuelle d(x, y) = \x - y|, où \x - y\ est la valeur absolue de x - y, et Qp
qui est le complété de Q pour la norme p-adique.
156
VOCABULAIRE MATHÉMATIQUE
et comme (rcn)n€N est de Cauchy, suppeNd(rc„,a;n+p) —► 0. Autrement dit, xn —» x dans X.
On en déduit la complétude de X.
15. Séries numériques
Dans ce §, on passe en revue la théorie des séries de nombres complexes. Il s'agit d'un cas
particulier de la théorie de l'intégration (on intègre sur un ensemble discret, dénombrable),
et les énoncés sont formulés avec ce point de vue en tête.
15.1. Séries à ternies positifs
Soit I un ensemble dénombrable("). Si (xi)i€\ est une famille d'éléments de R+, on note
J2i€i Xi G R+ la borne supérieure de l'ensemble des Y^i^j x» ou ^ décrit l'ensemble des
parties finies de I : c'est la somme de la série J2i€î x% (noter de la même manière une série
et sa somme peut parfois prêter à confusion, mais c'est le système que nous adopterons).
On dit que la série Y^xi est convergente ou qu'elle converge si Y^ieixi < +°° î dans le cas
contraire on dit que la série est divergente ou qu'elle diverge.
• Si Y^isi xî converge, alors Xi —> 0 quand^100* i —> oo, mais il existe des familles vérifiant
Xi —> 0 quand i —> oo sans que la série J2i€îXi converge^101).
On a ^ -» 0, mais X)n>i n = +°° (vou" ci-dessous*102)), ce qui prouve le second point. On
démontre le premier en prenant la contraposée : si Xi ■/* 0, il existe k € N et un sous-ensemble
infini I' de I tel que Xi ^ 2-fc, pour tout i € I' ; on a alors ^Zi€J Xi ^ 2~fc|J|, pour toute partie
finie J de I contenue dans I', et donc supJcI/ X)ieJ x* = +°°> ce ^ prouve que Yliei x% — +°°.
et permet de conclure.
• Si Xi < 2/i, pour tout i € I, alors J2igI Xi ^ J2i& V% (monotomie de la somme).
On a 5ZieJ x* ^ X)feJ ^*» Pour tout J c I n'ni. La bonne supérieure de l'ensemble des Y^iej x%
est donc inférieure ou égale à celle des Yli<=j Vi-
• Si X)i€ix* < +00' a^ors Pour tout e > 0» il existe I(e) C I, fini, tel que ^2ieJ Xi^e pour
tout J C I - l(e). (Le reste d'une série convergente tend vers 0.)
Soit S = X)jgi xi- F31' définition de S, il existe I(e), fini, tel que 5Zt€i(e) Xi ^ S — e.
Maintenant, si J C I - I(e) est fini, on a (£ie.,Xi) + (EieiOO^) = £i€Jui(e) ** < S> et donc
Z)ieJ x* ^ e- ^n Passant à la borne supérieure, on voit que l'on a encore Y^iç.3 xi ^ e, si
J C I - I(e) n'est pas fini.
(">On peut définir de même la somme d'un nombre non dénombrable d'éléments deR+ mais comme
R+ - {0} = Un€N[2-n,+oo], on voit que l'on est dans un des deux cas exclusifs suivants :
• il existe n € N tel que [2-n, +oo] contient un nombre non dénombrable de Xi et alors Yliei xi = +00'
• l'ensemble J des i tels que Xi ^ 0 est dénombrable et ^ieI Xi = 5ZieJ £*•
L'étude des séries convergentes se ramène donc au cas dénombrable.
(I0°)Cela veut dire que, pour tout e > 0, l'ensemble des i € I vérifiant \xi\ > e est fini.
(I01)Ce désagrément est absent du mondep-adique ou, plus généralement, ultramétrique... (alinéa 20.4.1)
(102>La divergence de la série harmonique £n>1 £ est due à N. Oresme (1360).
15. SÉRIES NUMÉRIQUES
157
• Si n i-> i(ri) est une bijection de N sur I, alors Y^ieix^ est ^a ^m^e de ^a su^e des
sommes partielles En^Nx*fa)- Autrement dit, on peut sommer une série à termes positifs
dans Tordre que Ton veut : l'addition des nombres positifs est commutative ! -
Posons S = J2ieixi- La suifce 3/n = Z)n^Nx*(n) est croissante; elle a donc une limite £
dans R+ qui est aussi la borne supérieure de {j/n> N G N}. Maintenant, l'ensemble des ?/n>
pour N G N, est inclus dans celui des J2iej xu pour J décrivant les parties finies de I ; on en
déduit l'inégalité £ ^ S des bornes supérieures. Réciproquement, soit M < S. Par définition
de S, il existe J c I, fini, tel que Yliej Xi ^ ^, et comme n »-> i(n) est surjective, il existe
N G N tel que J c {i(n), n ^ N} ; on a alors y^ ^ M et donc £ ^ M. Ceci étant vrai pour
tout M < S, on en déduit l'inégalité £ ^ S qui permet de conclure.
•
Si X.fJi e R+, alors ^2ieî(Xxi + nyi) = A(X).Gl£i) + ^(Y^ieiV^ avec la convention
0 • (+oo) = 0 et a • (+oo) = +oo si a > 0 (linéarité de la somme).
Il suffit de choisir une bijection n »-> i(n) de N sur I, et de passer à la limite dans l'égalité
de sommes finies En^(Aaîi(n) + A*3/t(n)) = A(
)+A*(E„<N»i(»))-
• Si les Ij-, pour j e J, forment une partition de I, alors ^2i€ïXi = ^2j€J (J2i€i Xi)-
Autrement dit, dans une série à termes positifs, on peut regrouper les termes comme on
veut : l'addition des nombres positifs est associative !
Soit S = J2iei xi et si = Eteij x*> si 3 e J. Avant de prouver que S — Y2j£j *^j> commençons
par montrer que, si K est fini, et si Y&, pour k G K, est un sous-ensemble de R+ de borne
supérieure M&, alors la borne supérieure M de l'ensemble des J^keKVk) °ù (Vk)keK décrit
Uk£K Yfc> est EfceK M^- En effet> on a y* ^ Mk pour tout A;, et donc £fc€K Vk < EfceK Mfc>
pour tout (yk)k£K € IlkeK Yfc> ce <ïu* nous f°urnit l'inégalité M ^ Y^keK ^fc 5 réciproquement,
si M7 < J2keK Mfc> on peut écrire M7 sous la forme J2keK ^fc» avec ^fc < M/t, Pour tout k eK,
et il existe yk G Y& tel que y^ ^ M'k, ce qui implique que J2k£KVk ^ M7, et donc M ^ M7,
d'où l'inégalité M ^ £fc(EK Mfc.
On peut appliquer ce qui précède à un sous-ensemble fini K de J et, pour A; G K, à l'ensemble
Yfc des J2ieif xû où I7 décrit l'ensemble des parties finies de I&, de telle sorte que M& = J2ieik xi-
Comme l'ensemble des Y^keKVk) P°ur (Vk)k£K G ELeR ^fc est inclus dans celui des Z)i€L#t,
pour L décrivant l'ensemble des parties finies de I, on a J2keK $k ^ S, pour tout sous-ensemble
fini K de J. On en déduit l'inégalité £i€J S, ^ S.
Réciproquement, soit M < S. Il existe alors L c I, fini, tel que J2i£L ^ ^ M, et K c J, fini,
tel que L c Ujenh- On a alors M ^ J2keK Sfc> et donc M ^ J2jej &j 5 on en déduit l'inégalité
S ^ J2j£3 Sj, ce qui permet de conclure.
• Si (»ij)(*j)6ixj est à termes positifs, £i6j ( £.6l xid) = E(*j)6ix J XV = E*6i ( Ejgj xv)
(Pubini pour les séries à termes positifs).
C'est un cas particulier du point précédent : on partitionne I x J comme la réunion des
I x {j}> pour j G J, ou comme la réunion des {i} x J, pour i G I.
• Si (x\n')iei, pour n G N, est une suite croissante (103) de familles d'éléments de R+, alors
^m J2ieixi = Eîgi ( ^m xi) W1- ^e convergence monotone pour les séries).
(103>I.e. x\n) ^ x\n+l\ pour tout i G I et tout n G N.
158
VOCABULAIRE MATHÉMATIQUE
Posons £o,i = eJ et xUti = x\n' -x\n 1 , si n ^ 1 (avec la convention (+00) - (+00) = 0).
L'hypothèse de croissance fait quexn,i € R+, et on aa^N) = X)n^N ^M, et donc limn_>+00 x\n) =
DnGN xn,û si i € I. Maintenant, £i€l xjn) = 5^<n Diei X:M P^' linéarité de la somme, et
donc limn_>+00Eieixï = ^2jeN^2i<=ixj,i- D'après le th. de Fubini, ceci est aussi égal à
Yli€iY,jeNx3,i> c'est-à-dire à £ieI (\imn^+00 x\n)), ce qui permet de conclure.
• Soient (xi)i€\ et {yi)i€i deux familles de nombres positifs. On suppose qu'il existe CeR*
tel que xi ^ Cyi pour tout tel. Alors la convergence de Y^i& Vt implique celle de ^2i€l xi
et la divergence de J2mxi implique celle de J^mVi-
O11 a IZieJ xi ^ ^ £f€J V* P°ur toute Pai'tie finie J de I, et donc £i€l xi ^ c Z)t€i V«- On
en déduit le résultat.
Le critère précédent, couplé avec les résultats concernant les séries de référence ci-
dessous, permet de démontrer la convergence ou la divergence de la plupart des séries
raisonnables.
15.2. Séries standard
• séries géométriques. Soit a e R+. Alors X)neN aU converge si a < 1 et diverge si a ^ 1.
Si a ^ 1, la suite an ne tend pas vers 0, et donc la série diverge. Si a < 1, alors 5Zn<N fln =
l-an
l-a
< -j^ pour tout N, et donc la série converge (sa somme est égale à jh^)-
• séries de Riemann. Soit s G R. Alors J2n>i ^ converge si s > 1 et diverge si s < 1.
Il y a plusieurs manières d'arriver au résultat. La plus naturelle est probablement de
comparer la série avec l'intégrale de la fonction x~a.
• Si s > 1, on a x~s ^ n~s sur [n-1, n], on en déduit que £n=i n~s < 1+X)«=2 JT-i x~s rfx ^
1+ /j x~s dz = 1 + 5zy (1 - N1_s) < 1 + ^y, ce qui prouve la convergence de la série.
. Si s = 1, on a J ^ J sur [n, n + 1] et donc ELi J > EÏ-i XT+1 i <** = j"+1 ï ** =
log(N + 1), ce qui prouve la divergence de la série.
On peut aussi remarquer que, si on poseun = log(n + l) -logn- ± = log(l + £)-±, alors
un = O(^)) ce Qui prouve que la série £n>1 txn converge puisque £n>1 ^ < +00 d'après ce
qui précède. Or Y^=i un = log(N + 1) — X^n=i n > on en déduit que la suite de terme général
Sn=i ^ - logN a une limite quand N —> 00 (cette limite est la constante d'Euler\ elle est
souvent notée 7), ce qui prouve, en particulier, que J2n^i n diverge.
• si s < 1, on a £ ^ £, et on déduit la divergence de X^i ^ de celle de X^i n*
Exercice 15.1. Soit (an)neN une suite d'éléments de R+ telle que X)neNa" = +°°- Si n G N, on
note Sn la somme partielle X)t^na*-
(i) Montrer que X)neN §£ < +00. (On comparera la série à une intégrale.)
(ii) Montrer que X)neN t^ = +°°- (^n pourra séparer les cas limsup ^ = 1 et limsup §^ < 1.)
• séries de Riemann en plusieurs variables. Soient d G N, || || une norme sur Rd (par
exemple la norme euclidienne), et s G R. Alors J^n jAp converge si s > d et diverge si
s < d, la somme portant sur n = (m,..., nj) G Zd - {(0,..., 0)}.
15. SÉRIES NUMÉRIQUES
159
Toutes les normes étant équivalentes sur Rd, il suffit de prouver le résultat pour l'une d'entre
elles, par exemple ||(rci,...,Xd)\\ = sup1^i^d \xi\. Si N € N il y a (2n+ l)d — (2n- l)d d-uplets
n vérifiant ||n|| = n, et la convergence de la série qui nous intéresse est équivalente à celle de
En>i (2n+1)"n»(2n"ir<- Comme (2n+l)d-(2n-l)d = 2d(2n)d"l + 0(nd-2), cette convergence
est équivalente à celle de En^i 21F~' ce Qu* Permet de déduire le résultat du cas des séries de
Riemann ordinaires.
15.3. Séries absolument convergentes
Si z G C, on note Re+(z) l'élément sup(0, Re(z)) de R+. On a alors(104)
3 3
z = VifcRe+(i-^) et 0 ^ sup Re+(rkz) < \z\ ^ Y)Re+(i-**)-
Soit I un ensemble dénombrable. Si (xi)i€i est une famille d'éléments de C, on dit que
la série J^gi2* est absolument convergente si J2i€î \xi\ < +oo (i.e. si la série des modules
est convergente). Il résulte des encadrements ci-dessus que cette condition équivaut à
Ei€i Re+(ikXi) < +oo, pour fc G {0,1,2,3}, et on définit la somme de la série Yli& x% Par
la formule
E^Ê^E*^'-**»-
iei fc=o iei
• EieiXi est absolument convergente si et seulement si elle vérifie le critère de Cauchy :
pour tout £ > 0, il existe I(£) C I fini tel que | Y^ieJ x*\ ^ £ Pour tout ^ c ^ — ^(£) ^n^
Si Z)tei NI < +°° et si e > 0, il existe I(e) C I, fini, tel que Eiei(e) NI ^ (Etei \xi\) " €>
par définition de Etei NI comme borne supérieur de l'ensemble des sommes partielles finies.
On a alors Et€i-i(e) NI ^ e> et ^onc I ^t€J Xi\ ^ € Pour tout J c I ~~ K€) fini, ce qui prouve
que J2i£i xi vérifie le critère de Cauchy.
Si EteiNI = +°°, il existe k G {0,1,2,3} tel que Y^i£i^-e+(^kxi) = +°° et> quitte à
remplacer xi par i~kxi, on peut supposer que k = 0. Soit V = {i G I, Re(#i) > 0} ; on a
J2iei'Re(xi) = EieiRe+N) = +°° puique Re+(xi) = 0 si Re(xi) ^ 0. On en déduit que,
quel que soit J C I fini, il existe J' C V- (JnF) avec Etej' ReN) ^ h et donc | Etej' xi\ ^ h
ce qui prouve que Etei x% ne vérifie pas le critère de Cauchy, et permet de conclure.
• Si Yli& Xi est absolument convergente, et si n »-> i(n) est une bijection de N sur I, alors
J2ieixi est ^a limite de la suite des sommes partielles En^N1^)' Autrement dit, on peut
sommer une série absolument convergente dans Tordre que Ton veut.
On
a Sn^N xt(n) — E/c=o ^( Sn^N Re+(i hxi(n)))> et il résulte du cas des séries à termes
positifs que En<NRe+(i~fc&i(n)) -* J2i£i^e+0L~kxi)- ^n en déduit le résultat.
• Si J2ieixi est absolument convergente, alors | X^îgi XiI ^ Siei M-
On choisit une bijection de N sur I et on passe à la limite dans l'inégalité pour les sommes
finieS | En^N XHn)\ < En^N N(n)l-
(104>Dans ce n°, on note i une racine carrée de -1 pour pouvoir continuer à utiliser i comme un indice
dans les termes des séries.
160
VOCABULAIRE MATHÉMATIQUE
• Si J2ieixi et Etei^ sont absolument convergentes, et si \,/j, e C, alors Ei€i(^z + M2/i)
l'est aussi et Eiei^* + A*!/«) = ^( Eiei x*) + A*( Eiei2/*) (linéarité de la somme).
On a \Xxi + /tyi| < |A| \xi\ + |/t| |yd» et donc, par linéarité de la somme des séries à termes
positifs, Eiei |Azi + m\ < Eiei (|A| M + H |n|) = |A|(£ieI M) + N(Ei€i toi) < +oo.
On en déduit la convergence absolue de X)iei(ArEi + Mi).
Enfin, si on choisit une bijection de N sur I et si on passe à la limite dans l'identité
£n<N(Axi(n) + /*V«(n)) = A( £n<N xi(n)) +/*(E»<N»<(n))» on obtient la formule désirée.
• Si Eieix* conver8e absolument et si les I7-, pour j e J, forment une partition de I, alors :
o pour tout j e J, la série Et€i- Xi est absolument convergente,
o si on pose Sj = Eieijx» ^a sei*ie Ejej ^i est absolument convergente,
o J2i€îXi = J2j€j (J2ieixi)- Autrement dit, dans une série absolument convergente,
on peut regrouper les termes comme on veut.
Si j € J, on a Ij C I et donc Etei^ NI ^ Eiei M»ce °lui prouve que E«€i* xi est absolument
convergente ; de plus, la somme Sj de la série Eiei- »t vérifie |Sj| ^ Eieij NI- ^n a donc, en
utilisant le cas des séries à termes positifs, £jeJ |S;| < £jeJ (Eiei, \xi\) = Eiei 1^1 < +°°>
d'où la convergence absolue de la série EjeJ Sj.
Maintenant, soit e > 0, et soit I(e) c I, fini de cardinal M, tel que Eiei-i(e) \%i\ < e. On
a ( Eiei xi) - ( Efei(e) ^0 = Eiei-i(e) xi [en e^et> on Peut choisir une bijection n i-» i(n)
de N sur I, telle que [0,M - 1] soit en bijection avec I(e) et [M,+co[ avec I - I(e), et on
obtient l'identité X)ieI Xi = Etei(e)Xi + Eiei-i(e)^ en Passant a la limite dans l'identité
En^N »i(n) = EnJi)1 ««(n) + EÎLM x«n)] 5 on en déduit que | ( £i€I x<) - ( E«€i(e) *«) I < e-
Maintenant, soit îj(e) = I7- n I(e) et soit J(e) = {j € J, Ij(e) ^ 0} ; alors J(e) est un sous-
ensemble fini de J et |(Ei€JS,) - (£.6J(e)S,)| ^ Eiej-j(e) N < Eiej-j(«) Ei6i, toi
pour les mêmes raisons que précédemment. De plus, |S7- - (E<€ii(e)aî*)l ^ E<€i;-(i;(e)) fol»
si j € J(e), ce qui nous donne, en remarquant que I(e) est la réunion disjointe des lj(e) pour
3 G J(e),
KEs;)-(E*OI^I(Es;)-( E s*)l + E ls;-( E **)l
j€J i€l(c) j€3 j€3(e) j€J(e) ielj(e)
<( E En)+ E E foi = E N^e
j€ J-J(e) i€L, jeJ(e)i€lj-Ij(e) i€l-I(e)
Donc KEiei^O ~ (Ei€JSi)l ^ 2e P°ur tout e > 0, et (Eiei^) = (Ejejsi). ce <lue r°n
cherchait à démontrer.
• Si E(i,j)6ixJ ^U est absolument convergente, alors :
o Ej€J ^.i est aDS°lument convergente pour tout i e I, et E^6i ( EjeJ ^j) aussi>
o Ysiei xt,j est absolument convergente pour tout j G J, et EjeJ ( Eiei ^«j) aussi>
o Ei6j (Ei€i*ij) = E(ij)€ixJ^,i = EiGi (Ei€j^j) (Fubini pour les séries).
C'est un cas particulier du point précédent : on partitionne I x J comme la réunion des
I x {i}> P°ur 3 ^ J> °u comme la réunion des {i} x J, pour « € I.
• Soit (x\ )tgi, pour n G N, des familles de nombres complexes. On suppose :
o x\n' a une limite Xi quand n —> +oo,
15. SÉRIES NUMÉRIQUES
161
o il existe (yi)i€i telle que \x\n'\ < y*, pour tous n et i, et J2ieiVi < +°° (domination).
Alors Ylt& \xi\ < +°° et Diei^ = ^im ^2i€ixi^ (tn- ^e convergence dominée).
On a \xi\ ^ yi par passage à la limite ; d'où la convergence absolue de ^2ieî X{. Maintenant,
soit e > 0. Comme le reste d'une série convergente tend vers 0, Il existe I(e) c I, fini, tel que
ITî€i-i(e) V* ^ £- ^°^ ^ te^ (lue \xl ~ xi\ ^ ïî^TT' Pour tous n ^ no et * e I(e) (l'existence
d'un tel no résulte de l'hypothèse rcjn) —► Xi et de la h'nitude de I(e)). On obtient, si n ^ no,
IE*«-E*i",l<Ei««-»S")i+ E n+ E i^n)i
tel iei tei(e) fei-i(e) fei-i(e)
<|I(e)lîïéïï + 2 ^ yi<3£-
1 * '' t€l-I(e)
On en déduit que limn_>+00 £)ieI x\n' = X)i€l #*, ce qui permet de conclure.
15.4. Séries entières
Une série entière est une série de la forme F(z) = X)n€N anZn, où (on)n€N est une suite
de nombres complexes, et z G C varie.
• Il existe un unique p(F) e R+, le rayon de convergence de F, tel que J2n€^o,nzn soit
absolument convergente si \z\ < p(F) et anzn, pour n G N, ne soit pas borné (et donc
^2n€vfO>nzn soit divergente) si \z\ > p(F).
Soit X l'ensemble des z € C tels que (a„zn)neN ne soit pas bornée. Comme \anzn\ est une
fonction croissante de |z|, on a z € X, si \z\ ^ |2o| et zq € X. Notons p(F) la borne inférieure de
l'ensemble des \z\, pour 2 € X. Si |2| > p(F), il existe zq € X avec |20| < kl. par définition de
p(F), et donc (anzn)n<=w n'est pas bornée. Si \z\ < p(F), et si \z\ < \z0\ < p(F), alors (anz£)neN
est bornée, et donc il existe C > 0 tel que l'on ait |an2n| ^ lan2ol(j§ï)n ^ ^(îSf)"' Pour
tout n. Comme Mr < 1, cela implique que I^neN*"2" est absolument convergente. Ceci
permet de conclure.
• /0(F)-1 = limsup|on|1/n.
Si \z\ < p(F), la suite |an2n| tend vers 0, et donc est ^ 1 à partir d'un certain rang.
Il s'ensuit que limsup|a„2n|1/n ^ 1, et donc que limsup|a„|1/'n < A, ce qui nous fournit
l'inégalité limsup|on|1/n < p(F)-1.
Si \z\ > p(F), la suite (anzn)n€N n'est pas bornée, et donc il existe une infinité de n tels
que |an2n| ^ 1. Il s'ensuit que limsup|anzn|1/n ^ 1, et donc que limsuplonl1/" ^ A, ce qui
nous fournit l'inégalité limsuplonl1/" ^ p(F)-1 inverse, et permet de conclure.
• La fonction x i-> F(x) = X)n€Nan£n est de classe #°° sur ] — p(F),p(F)[} et sa dérivée
fc-ième est la série entière ZlneN^C1*^)2^' <lm a même rayon de convergence que F.
52n€N (nfcfc)an+fc^n a même rayon de convergence que Y^n^k (l)anxn (on s'est contenté de
multiplier par xh et de changer les indices), et comme (£) = exp(ilog(£)) —» 1 quand
n —> +00, elle a aussi même rayon que convergence que 5Zn€N an#n> d'après la formule du
point précédent pour p(F).
162
VOCABULAIRE MATHÉMATIQUE
Maintenant, (x + h)n = xn + nhxn~1 + h2 /„* (1 - t)n(n -1) (x + th)n~2 dt d'après la formule
de Taylor avec reste intégral ; d'où la majoration \lx+k)£-*n _ nxn~l\ ^ 1^1 (2) (1^1 + \h\)n~2.
Si |x| < p(F), on peut choisir 6 > 0 tel que \x\ + 6 < p(F), et on obtient, pour tout h €] - <5,<S[,
lF<*+/fF(*> - £ wa»*tt"ll < cw> où c = £ KIGXM+*)tt-2 < +00,
n€N n€N
puisque |a?| + <5 < p(F) et I^neN G)!*»!^"2 est de ray°n de convergence p(F), d'après ce
qui précède. Il s'ensuit que F est dérivable en x, de dérivée Z)neNnana;n~I- Une récurrence
immédiate permet d'en déduire que F est de classe tf00 sur ] - p(F),p(F)[, et que sa dérivée
k-ième est la série entière I3neN(n + &)••• (n +1) an+kXn, ce qui permet de conclure.
15.5. L'exponentielle complexe
• Si z G C, la série X)n€N S est absolument convergente ; on note ez ou exp(^) sa somme.
Si a est la partie entière de \z\, alors n! ^ o!(o + l)n_a, et donc |^| < c(^+r)n> avec
C = ^r^- Comme ^ < 1, on en déduit la convergence absolue de la série.
• La fonction exponentielle z ■-> ez [ou z 1-» exp(2)] vérifie les propriétés suivantes :
o C'est un morphisme de groupes de (C,+) dans (C*, x) (i.e. ezl+Z2 = eZxeZ2, et donc
e° = 1 et e~z = l/ez).
o Sa restriction à R est un isomorphisme de groupes sur R+, et ex —> +00 quand
x —> +00 et ex —> 0 quand x —> —00 (et même x~Nex —► +00 quand x —> +00 et
rcNea: —> 0 quand rc —> -00, si N G N) ; de plus a; h-» e* est solution de l'équation
différentielle y' = y.
o Sa restriction à iR est un morphisme surjectif sur le groupe U = {z e C*, \z\ = 1}
dont le noyau est 2î7tZ, où^105) ir = f*™ j^ ; si a G R, la restriction de t \-* êl à
[a, a + 27r[ est un paramétrage du cercle unité U.
o Le morphisme z i-> ez est surjectif de C sur C* et son noyau est 2inZ ; la fonction
exponentielle est périodique de période 2m.
E^rf1^ - EteN(Em€N^^) = Ew.'tf.w = ai-ieNi < +TO.
Aï m
La série Z)(fc,m)eN2 ikl^J est donc absolument convergente, ce qui permet de regrouper les
termes comme on veut. En sommant d'abord sur m, puis sur &, on voit que sa somme est
exp(^i) exp(22)> et en sommant sur m + k = n, puis sur n, on obtient
(fc,m)€N2 ' ' n€N fc=0 ' n€N
ce qui prouve le premier point.
Maintenant, il est clair sur la formule que exp est strictement croissante sur R+ car x*-+ xn
l'est pour tout n, et que ex ^ (n+i)i ce W* Prouve Que #~Nex -* +00 quand x -* +00.
Il s'ensuit que x »-> ex est une bijection strictement croissante de R+ sur [l,+oo[. Comme
(io5)çecj est une définition possible du nombre n. Comme t »-> eil est un paramétrage du cercle unité par
[-7r,7r[, la longueur de ce cercle est f*n |(ei*),| dt = f*n dt = 27r, puisque (e**)' = ieu comme il est établi
au cours de la démonstration. Cette définition est donc équivalente à celle utilisée depuis la plus haute
antiquité.
15. SÉRIES NUMÉRIQUES
163
ex = l/e"x et xNex = (-l)n/((-x)"Ne"x), on en déduit que x h-* ex est une bijection
strictement croissante de R_ sur ]0,1] et xNex —> 0 quand x —> -oo. Enfin, la dérivée de
xne1 est Y^n^i nXn\ = Y^n^i (n-i)i = e* *> ce qu* Permet de prouver le second point.
On a exp 2 = exp(z) par continuité de z h-* ~z. Il s'ensuit que le conjugué complexe de
u = eil est e~il si t G R, et donc que \u\ = 1 puisque \u\2 = uv, = eite~it = 1 ; l'image
de iR par exp est donc incluse dans U. Par ailleurs, la dérivée dexn eil = X)n€N ^r
<St En^l in(n!H"1 = »En€NÏ = **" î Celle de * ~ *i/W eSt d°nC t/W/(0- Soit
</(') = ei/(t)(fe£ + *ÏÎW. 20ù /(*) = -2/o ï% (sa dérivée est /'(*) = ïîH On obtient
fl'(i) = eim^T^^+i^^)+i^ei^(^+i1^) = 0, ce qui prouve que la fonction
t h-* #(£) est constante sur R, et comme elle vaut 1 en 0, on a e~ifW = j^p + ij^çp, si t G R.
Maintenant, j^p +i-^p est l'intersection du cercle U- {-1} avec la droite de pente t passant
par -1, il s'ensuit que t h-* e"*/(*) induit une bijection de R sur U - {-1} et que t h-* eil induit
une bijection de ] - 7r,7r[ sur U - {-1} et, en passant à la limite, que ein = e~in = -1 ; il en
résulte que t h-* eil est surjectif de R sur U. De plus, e2in = ein(e~in)~l = 1, ce qui prouve
que le noyau de t h-* eu contient 27rZ. Par ailleurs, si t < 27r, on a t = a - 6 avec -n < a, 6 < n
et eli = eia/eib ^ 1 puique t h-* eil est injectif sur ] - 7r,7r[; le noyau de t ^ eil est donc
exactement 27rZ (cf. (i) de l'ex. 15.2). Enfin, si a G R et si n = [9^-\, on peut découper
[a,a + 2n[ en [a, (2n + l)n[ et [(2n + l)7r,a + 27r[, et [(2n + l)7r,a + 27r[ est le translaté de
[-7r,a - 2nn[ par 2(n + l)n et [a, (2n + l)7r[ est celui de [a - 2n7r,7r[ par 2n7r. On montre
que t h-* e** est un paramétrage de U par [a, a + 2n[ en constatant que c'est le cas si a = -n
d'après ce qui précède, et en utilisant la 27r-périodicité de t h-* e%t et le fait que [—7r, a — 2n7r[
et [a - 2n7r,7r[ forment une partition de [-7r,7r[.
Pour prouver la subjectivité de z h-* ez, il suffit d'écrire w G C* sous la forme w = Mnjïï î il
existe alors x, y G R tels que ex = |w| et eiy = t^t d'après les second et troisième points, et on
a ex+iy = w. Enfin, ex+iy = 1 implique |ex+iî/| = 1 et donc ex = 1 et x = 0 ; le noyau de exp
est donc inclus dans iR, et est donc 2inZ d'après le troisième point.
Exercice 15.2. (i) Soit À un sous-groupe de (R, +). Montrer que À est dense dans R ou bien est de
la forme Z • a = {na, n G Z}, avec a G R+.
(ii) Existe-t-il n G N tel que 2n = 3141592a0ai • • • en base 10?
(iii) Montrer que les solutions de a2 - 262, avec (a, 6) G N2 sont les (an,6n), pour n G N, avec
an + bny/2 = (3 + 2\/2)n. (On pourra commencer par vérifier que si ai, &i, a2,62 € Z vérifient a2 - 262 = 1
et a2 - 26| = 1, alors a\ - 26§ = 1, si a3 + &3\/2 = (ai + biy/2)(a2 + &2\/2).)
15.6. Sommation de séries divergentes
Il y a beaucoup de séries naturelles qui ne sont pas absolument convergentes, mais
auxquelles on aimerait bien donner un sens. On dispose de tout un arsenal de recettes en
ce sens, mais celles-ci demandent toujours de faire attention au sens exact que revêt la
somme (cf. ex. 15.5).
Le cas le plus simple est celui d'une série ^2neNxn dont la suite des sommes partielles
Sn^N xn converge ; une telle série est dite semi-convergente et on définit sa somme comme
la limite des sommes partielles (il est clair que ceci redonne la somme de la série au sens
précédent si la série est absolument convergente). Dans le même genre d'idées, une série
164
VOCABULAIRE MATHÉMATIQUE
de Fourier ^2neZ Q>ne2i*nx se somme souvent en regardant la limite (si elle existe) des
sommes symétriques Y^n=-nane2™nx> On remarquera que dans le premier cas, la semi-
convergence de X)n^N xn implique que xn —> 0 quand n —> +00, mais que cette condition
n'est pas suffisante comme le montre l'exemple de la série X)n€N ^+ï- Un des rares résultats
généraux simples dont on dispose est celui des séries alternées ci-dessous.
• Soit (wn)n€N une suite décroissante d'éléments de R+, tendant vers 0, alors la série
X)nGN(—l)nwn est semi-convergente (critère de Leibnitz, 1675).
Notons Sn la somme partielle 5Zn^N(_l)nwn- Nous allons utiliser la formule sommatoire
d'Abef106* £n=oûn&„ = En=o(£r=o«i)(6n-&n+i) + &N+i EÎLo*_<& se démontre en
remarquant que le terme en facteur de bn est a0 si n = 0, £"=0 ai - Yli=o ai = an si 1 ^ n ^ N, et
EiLoat ~ £!Loa» = 0 si n = N + 1. On applique ceci à an = (-l)n et bn = «„, et on pose
sn = £lUa* = K1 + (-1)n) î on obtient donc SN = T,n=osn(un - «n+i) + snWn+i-
Maintenant, comme «„ est décroissante, la série £neN(«n - «n+i) est à termes positifs,
convergente de somme u0 - limN->+oottN = «o ; comme \sn\ ^ 1 pour tout n, il en résulte que
£neN 5n(«n_wn+i) est absolument convergente, et donc que £n^N sn(un-un+i) a une limite.
Enfin, sn^n+i —* 0, ce qui prouve que Sn tend vers la somme de la série £neN sn(un — wn+i),
et permet de conclure.
.Un exemple^ :E„eN^f = l-è + |-! + ••• = !•
On peut écrire Sn = Z)n^N 2ÏÏ+T sous ^a f°rme
Le résultat suit donc de ce que | ï+x* | < x2N+2, et donc | /0 î+x* dx\ ^ 2ï7+3> ce ^
montre que /0 *+x* dx —> 0 quand N —> +00.
Exercice 15.3. Montrer que J2t™i ^~^T— est semi-convergente de somme log2.
Exercice 15.4- (i) Soit Y^neNun une sél'ie semi-convergente de somme S. Montrer que J2n£NunxTl
est absolument convergente si x e] - 1,1[ et que<108) S = lim^x- ( £)nGN un%n)- (On utilisera la formule
sommatoire d'Abel.)
(ii) Si
Sn€Na" e^ En€N ^ son^ deux séries, on définit leur produit de Cauchy J2n£^Cny où Ton a
(io6)Qn peut s)en passer) mais cette formule est extrêmement utile pour l'étude des séries ; c'est l'analogue
discret de l'intégration par partie.
(107) Cette formule est en général attribuée à Leibnitz (1682) qui en était, ajuste titre, très fier, mais il avait
été précédé de quelques siècles par le mathématicien Madhava (~1350 ~1425) du Kerala (en Inde). C'est
l'ancêtre de toutes les formules concernant les valeurs de fonctions L aux entiers : si X4 • (Z/4Z)* —> {±1}
est le caractère de Dirichlet (cf. n° VII.4) défini par X4(l) = 1 et X4(-l) = -1> la fonction L associée est
L(x4> s) = l-^ + rp-~~7^H et la formule de Madhava-Leibnitz devient L(*4> 1) = f •
(i08)çet exercice permet de montrer que le procédé de convergence lim^x- ( X)neN unxn) donne le même
résultat que la sommation naturelle quand celle-ci converge, mais qu'il permet de sommer beaucoup plus
de séries, y compris des séries pour lesquels un ne tend pas vers 0. C'est aussi le cas du procédé de
l'ex. 15.6.
16. CONVERGENCE DE FONCTIONS
165
posé Cn = Yli+j=naibj- Montrer que si 5ZneNa" et Z)neN^n sont absolument convergentes, il en est de
même de }-jneN c«
et que £n(ENcn = (£n€N°n) • (£n(EN&n).
(iii) En déduire que si les séries £nGNan> £nGN6n et £nGNcn sont semi-convergentes, alors
£n€N °n = ( £n€N an) ' ( £n€N M •
(iv) Donner un exemple où £nGN an et £nGN bn sont semi-convergentes, mais pas £nGN cn. La limite
en 1" de £nGNcn£n existe-t-elle? Si oui, que vaut-elle?
Exercice 15.5. Soit £nGN xn, une série semi-convergente, à termes réels, non absolument convergente,
(i) Montrer que, pour tout l G R, il existe une bijection <p : N —► N telle que limN—+oo £n*jN xv>(n) = l-
(ii) Montrer que le groupe des bijections de N dans N n'est pas dénombrable.
On peut souvent améliorer la convergence d'une série alternée en remplaçant les sommes partielles par
la moyenne S'N = ±(SN + SN+1) (il est clair que S'N converge et a même limite que SN si Sn converge), et
rien n'empêche de recommencer et de définir par récurrence sur k une suite S'fc' = (S^ )ngn par S{J' = Sn
et SJÎ1 = J(SJÎ"11 + SJÎ+J1), si k > 1 ; on a donc sJJ1 = £(£j=0 (})sn+j)- Par exemple, en partant de
EugnC-1)71^ +1). on obtient S[o1 = (1, -1,2, -2,3, -3,4,-4,5f-5f...),Slll = (0,^0,^0,^0,1,...)
et S'2' = ( J, J, |, J,... ), d'où la formule l-2 + 3-4 + 5-6 + 7-8 + -- = J d'Euler. Nous encourageons
le lecteur à appliquer le même procédé àl-4 + 9-16 + 25-36H . L'exercice suivant fournit une
explication du phénomène.
Exercice 15.6. On s'intéresse à £nGN(-l)n/(n)> où f : R+ —> R est une fonction. On note S'fc', pour
k G N, les suites obtenues à partir de la suite des sommes partielles de la série comme ci-dessus. On
définit une suite de fonctions /'fc' par récurrence, en posant /'°' = / et flk+l^(x) = f^(x + 1) - f^(x).
(i) Établir l'identité sg1 - SJJL, = iz^/W(N).
(ii) Que vaut P^' si P est un polynôme de degré < fc?
(iii) On suppose / de classe <€k. Soit a G R+. Montrer qu'il existe ce [a, a + k] tel que l'on ait
/Ifcl(a) = /(/c)(c), où /(fc) désigne la dérivée fc-ième de /. (On pourra considérer un polynôme ayant les
mêmes valeurs que / en a, a + 1,..., a + k.)
(iv) Soit f(x) = (x + l)~~s, avec s G R. Montrer qu'il existe k tel que S'*l ait une limite F(s).
(v) Montrer que F(a) = (1 - 21-*)C(s), où C(a) = En^i £> « « > 1-
(vi) On définit*109* C00 par COO = ïz^rF(s), si s < 1. Montrer*110) que C(-m) G Q, si m G N.
16. Convergence de fonctions
16.1. Convergence simple
Si X et Y sont deux espaces topologiques, une suite de fonctions fn : X —► Y converge
simplement vers f si, pour tout x G X, la suite fn(x) a pour limite f(x) dans Y. Si c'est
le cas, on dit que / est la limite simple de la suite fn.
Il est, en pratique, largement inutile de savoir quelle topologie se cache derrière la convergence simple.
Cette topologie n'a rien de mystérieux : c'est la topologie produit sur l'espace des fonctions Yx de X
dans Y. En effet, les conditions suivantes sont équivalentes :
• fn(x) —► /(x), pour tout x G X ;
(109)C'est une des manières de prolonger la fonction zêta de Riemann là où la série de converge pas ; on
trouvera des procédés plus sophistiqués un peu plus loin, cf. n° VII.3.
(110)On a par exemple £(-1) = ^, et donc l + 2 + 3 + 4 + 5 + -- = ^, comme l'aurait écrit Euler.
166
VOCABULAIRE MATHÉMATIQUE
• (fn(x))x€i -> (f(x))x& Pour tout I C X fini ;
• pour tout I C X fini, et tout ouvert de Y1 de la forme U = Y\xei Ux qui contient (/(#))xei, il existe
N G N, tel que (fn(x))x& G U, si n ^ N ;
• pour tout I C X fini, et tout ouvert de Yx de la forme U = (FUeiUx) x (ELgi Y) ^ contient
(/(«))«€X, il existe N G N, tel que (fn(x))x€X G U, si n ^ N ;
• /n -> / dans Yx.
D'après l'exercice ci-dessous, les fonctions continues sont denses dans l'ensemble CR des fonctions de
R dans C pour la topologie produit. Or, Baire a montré qu'une limite simple de fonctions continues deR
dans C est continue en au moins un point. Donc il existe des éléments de CR qui ne sont pas limite simple
d'une suite de fonctions continues, ce qui n'est possible que si la topologie ci-dessus sur CR n'est pas
définissable par une distance. Cela explique qu'il existe des fonctions qui sont limites simples de limites
simples de fonctions continues, mais qui ne sont pas limites simples de fonctions continues (ex. II. 1.11).
Exercice 16.1. Montrer que l'ensemble des fonctions continues de R dans C est dense dans CR (muni
de la topologie produit).
16.2. Convergence uniforme
Soient X un ensemble et Y un espace métrique (par exemple Y = C). Soient / et /n,
pour n G N, des fonctions de X dans Y. On dit que fn converge uniformément vers / sur X
ou que / est la limite uniforme des /n, si limn^+00 ( supxGX dY(f(x), fn(x))) = 0. Ceci peut
se réécrire sous la forme : pour tout s > 0, il existe N = N(e) tel que dY(f(x),fn(x)) < e,
pour tous n ^ N et x G X.
La différence avec la convergence simple est que N(e) est le même pour tout x G X; en
particulier, la convergence uniforme(111) implique la convergence simple.
• Si X est un espace topologique, si fn —> f uniformément sur X, et si fn est continue
en £o, pour tout n G N, alors / est continue en xq. Si les fn sont continues sur X, il en
est de même de /.
Soit e > 0, et soit n G N tel que supx€X dY(f(x),fn(x)) < e. Comme fn est continue en x0,
il existe V ouvert de X contenant xo tel que dY(fn(x), /n(#o)) < e, pour tout x eV. Alors
dY(f(x)J(x0)) < dY(f(x)Jn(x))+dY(fn(x)Jn(Xo))+dY(fn(Xo)J(x0)) < 3f,
pour tout x G V. On en déduit la continuité de / en x0. Le second énoncé en étant une
conséquence immédiate, cela permet de conclure.
Exercice 16.2. Soient u = (uk)keN et u^ = (u^1 )keN> pour n G N, des suites à valeurs dans C.
On suppose que u^ —► u uniformément sur N et que limfc_>+00 u^ = 0, pour tout n. Montrer que
limfc^+oo<Ufc = 0.
Exercice 16.3. (i) Montrer que (an)n€N *-* Z)neN uffft-i est continue sur {0,1,... ,9}N.
(ii) En déduire que [0,1] est compact.
<m)En filière PC, la convergence uniforme (concept universellement reconnu) a été remplacée par les
deux demi-concepts que constituent la convergence normale (pour une norme qui n'est autre que celle de
la convergence uniforme), et par l'approximation uniforme d'une fonction par des fonctions d'un certain
ensemble. J'avoue avoir du mal à saisir la subtile différence.
17. ESPACES VECTORIELS NORMES
167
Si X est un ensemble et si Y est un espace métrique, une suite de fonctions fn : X —» Y
vérifie le critère de Cauchy uniforme sur X si lim ( sup a\(fn(x), fn+p(x))) = 0.
n-+oo x€x,p€N
• Si X est un espace topologique, si Y est un espace métrique complet, et si (/n)n€N est
une suite de fonctions continues de X dans Y vérifiant le critère de Cauchy uniforme, alors
(/n)n€N a une limite simple / qui est continue, et fn converge uniformément vers / sur X.
Si a; € X, la suite (/n(«))n€N est de Cauchy, et donc admet admet une limite /(#), puisque
Y est complet. Soit Sn = sup^x.peN dy(fn+p(x), fn(x)) ; par hypothèse, on a ôn —» 0. Un
passage à la limite montre que dY(f(x)ifn(x)) ^ <5n, pour tout x, et comme ôn —► 0, cela
prouve que fn—>f uniformément sur X, ce qui permet de conclure puisqu'une limite uniforme
de fonctions continues est continue.
Exercice 16.4- Soit (E, || ||) un espace vectoriel norme (sur R ou C). On dit que / : E —» C tend vers l
à l'infini, si pour tout e > 0, il existe M > 0 tel que \f(x) - £\ < e pour tout x vérifiant ||x|| > M. Soient
/ et fn, pour n € N, des fonctions de E dans C. On suppose que fn—>f uniformément sur E, et que fn
tend vers ln à l'infini. Montrer que (£n)n€N a une limite £ € C, et que / tend vers l à l'infini.
Exercice 16.5. Soit / : [0,1] -» C continue.
(i) Montrer que fn = X^ô* /(^r)l[i/2»,(i+i)/2»[ tend uniformément vers / sur [0,1[.
(ii) Montrer que un = -^ Ya=q1 fié*) a une limite quand n -» +oo (déf. de l'intégrale de Cauchy).
17. Espaces vectoriels normes
17.1. Corps normes
Si K est un corps, une norme sur K est une application x •-> \x\ de K dans R+ vérifiant
les trois propriétés suivantes :
(i) \x\ = 0 <£► x = 0, (ii) \xy\ = \x\\y\, (iii) \x + y\ < \x\ + |y|.
Une norme qui vérifie l'inégalité \x + y\ ^ sup(|a;|, \y\) est dite ultramétrique.
Des exemples de tels objets sont, bien évidemment, R et C munis de la norme usuelle,
mais il y en a bien d'autres, comme le corps Qp des nombres p-adiques, muni de la
norme | |p, que nous verrons au n°20.4, ou le corps des fractions K((T)) de l'anneau
K[[T]] du n° 1 du § V.l. Le théorème d'Ostrowski (th. G.2.1) classifie toutes les normes
que l'on peut mettre sur Q.
Si K est un corps muni d'une norme | |, et x,y sont deux éléments de K, on pose
d(x,y) = \x—y\. Les propriétés (i) et (iii) des normes assurent que d est une distance sur K
et donc définit une topologie sur K. Deux normes sur un corps K sont dites équivalentes
si elle définissent la même topologie. Une norme est dite triviale si elle induit la topologie
discrète sur K (on a alors \x\ = 1 quel que soit x ^ 0). On dit que K est complet s'il l'est
pour la distance d [c'est le cas de R et C ; c'est aussi celui de Qp et K((T)) ].
168
VOCABULAIRE MATHÉMATIQUE
17.2. Normes et applications linéaires continues
Soit (K, | |) un corps norme complet (par exemple, R ou C). Si E est un espace vectoriel
sur K, une norme \\ || sur E est une application x i-> ||z|| de E dans R+ vérifiant :
(i) ||z|| = 0 si et seulement si x = 0 ;
(ii) ||Àz|| = |A| • ||z||, si x e E et A G K;
(iii) ||a: + y||<||a;|H-||y||,8ix,yeE.
Si || || est une norme sur Ë, alors d : E x E —» R+ définie par d(x,y) = \\x — y\\ est une
distance sur E, ce qui permet de voir un espace vectoriel norme (E, || ||) comme un cas
particulier d'espace métrique.
• Si (E, || ||e) et (F, || ||p) sont deux espaces vectoriels normes, et si u : E —» F est une
application linéaire, les conditions suivantes sont équivalentes :
(i) u est continue ;
(ii) u est uniformément continue ;
(iii) il existe M G R+ tel que ||w(#)||f < M • ||#||e, quel que soit x G E.
Si u est continue, l'image inverse de la boule unité ouverte de F contient un voisinage de 0
dans E, et donc une boule ouverte B(0,r~), avec r > 0. Autrement dit, ||x||e < r implique
||«(x)||f < 1, et donc, quel que soit x € E - {0},
i«Mb = l^-iiia-«(*)|p<JÇ!!ï-
r ||z||E r
On en déduit l'implication (i)=^(iii) (avec M = £). Maintenant, si ||«(£)||p ^ M • ||x||e> quel
que soit a; € E, alors u est lipschitzienne de rapport M, et donc uniformément continue. On en
déduit l'implication (iii)=^(ii), et comme l'implication (ii)=>(i) est une évidence, cela permet
de conclure.
• Si (E, || ||e) et (F, || ||p) sont deux espaces vectoriels normes avec F complet, et si
u : E —» F est linéaire continue, alors u se prolonge, par continuité, en une application
linéaire continue du complété E de E dans F.
C'est une conséquence de la propriété universelle vérifiée par E.
17.3. La norme d'un opérateur
Si (E, || ||e) et (F, || ||f) sont deux espaces vectoriels normes, et si u : E —> F est une
application linéaire continue, la norme d'opérateur \\u\\ de u est la borne supérieure de
l'ensemble des MbNMsOIIfi pour x e E- {0}. On a donc ||«(2;)||f ^ ||u|| • ||z||e, quel
que soit x 6 E, et ||w|| est le plus petit réel ayant cette propriété.
• La norme d'opérateur est une norme sur l'espace vectoriel Hom(E, F) des applications
linéaires continues de E dans F.
Si |M| = 0, alors u(x) = 0, pour tout x, et donc u = 0. Si u € End(E, F) et A € K, alors
||A«||= sup ||x||il||AW(x)||F = sup |A|.|Wli1|K*)||P = |A| sup N|il|K*)||F = |A| • NI-
xGE-{0} x€E-{0} x€E-{0}
17. ESPACES VECTORIELS NORMES
169
On conclut en remarquant que, si u, v € End(E,F), alors
\\u + v\\= sup \\xfclMx)+u(x)fa £ sup Haîlli^lK^Hp + IKaîJllp)
x€E-{0} x€E-{0}
*( sup 11*11^0*») +( sup INli1Hx)||F) = |H| + |H|.
x€E-{0} x€E-{0}
• La norme d'opérateur est une norme d'algèbre sur Panneau End(E) des endomorphismes
linéaires continus de E.
Compte-tenu du point précédent, il ne reste plus que l'inégalité \\uov\\ ^ ||u|| • \\v\\ à vérifier.
Or ||nov(x)||E ^ ||u|| ■ ||v(x)||b ^ NI ■ |M| ■ ||&||e» pour tout x G E, par définition de |M|
et ||t;||. On en déduit l'inégalité cherchée.
Exercice 17.1. (i) On munit E = Rn ou Cn de la norme || ||oo définie par ||o:||oo = suPi^^n \xj\> s*
x = (xi,...,xn). Soit u : E —> E linéaire, et soit (<k,j)i^ij^n la matrice de u. Montrer que
lH|oo = sup1<i<nEj=i|aijl-
(ii) Montrer que 1 - u est inversible si Y^=i \aij\ < 1> Pour 1 ^ i < n. (Exprimer (1 - n)"1 comme
une série en u.)
17A. Normes équivalentes
Deux normes || ||i et || ||2 sur E sont équivalentes, si l'identité est un homéomorphisme
de (E, || ||i) sur (E, || ||2) (i.e. est continue ainsi que son inverse). D'après l'alinéa précédent,
cela équivaut à l'existence de C > 0 tel que CU x||rcr||x ^ IMI2 ^ C|Mli> pour tout x G E.
• Soit E un espace vectoriel de dimension finie sur K. Alors toutes les normes sur E sont
équivalentes et E est complet pour n'importe laquelle d'entre elles.
Soit (ei,..., en) une base de E sur K. Comme K est complet, il suffit de prouver que toute
norme sur E est équivalente à la norme || ||oo définie par
||&iei + ■ ■ ■ + xnen||oo = sup(|xi|,..., |xn|),
ce qui se fait par récurrence sur la dimension de E. Si cette dimension est 1, il n'y a rien à
faire. Sinon, soit || || une norme sur E. On déduit de l'inégalité triangulaire que
||xiei + ■ ■ ■ + xnen\\ ^ (||ei|| + • ■ ■ + ||en||) sup(|&i|,..., |xn|),
d'où l'une des deux inégalités à vérifier. Pour démontrer l'autre, raisonnons par l'absurde.
Supposons qu'il existe une suite x[h*e\ H h Xn en qui tende vers 0 pour la norme || || mais
pas pour la norme || ||oo. Il existe alors C > 0, i G {1,... ,n} et une sous-suite infinie telle que
l'on ait \x\ | ^ C, et donc la suite de terme général Vk = ^7^1 H l-^ffey^n tend encore vers 0
xi xi
pour y ||. On en déduit que e* est dans l'adhérence de W = Vect(ei,..., e^-i, ei+\,..., en), qui
est complet d'après l'hypothèse de récurrence, ce qui implique e$ G W et est absurde puisque
les ti forment une base de E.
• L'énoncé précédent devient totalement faux en dimension infinie : les normes sur un
espace E de dimension infinie ne sont pas toutes équivalentes^112^, et E peut être complet
pour certaines d'entre elles, mais il y en a "beaucoup plus" pour lesquelles il ne l'est pas.
(112>Un des problèmes de base en analyse fonctionnelle est précisément de choisir la bonne norme en
fonction du problème à résoudre.
170
VOCABULAIRE MATHÉMATIQUE
Exercice 17.2. Soit E = ^([0,1]) l'espace des fonctions continues de [0,1] dans C.
(i) Montrer que, si <\> G E, alors ||0||oo = supx€[0|1] \<\>{x)\ est fini et que || ||oo est une norme sur E pour
laquelle E est complet.
(ii) Montrer que || ||i définie par ||0||i = fQ \<t>(t)\dt est une norme sur E pour laquelle E n'est pas
complet.
(iii) Les normes || ||oo et || ||i sont-elles équivalentes?
Exercice 17.3. (i) Montrer que, si 5ï et &2 sont des topologies sur X, alors 5ï est plus fine que 3r2 si
et seulement si id : (X, &i) —> (X, ^) est continue.
(ii) Soit &\ la topologie sur l'espace %(R) des fonctions continues à support compact définie par la
norme || ||i et ^ celle définie par la norme || ||oo. Montrer qu'aucune des deux topologies 5ï et 5^
n'est plus fine que l'autre.
17.5. Norme spectrale d'un opérateur
Soit (E, || ||) un espace vectoriel norme. Si u : E —> E est linéaire continu, on note un le
composé u o • • • o u de n copies de u.
• La suite (ll^ll^în^i admet une limite, la norme spectrale ||«||Sp de l'opérateur u.
On a ||un+m|| ^ ||un|| • ||tim||, pour tous n,ra ^ 1 ; l'exercice 17.4 ci-dessous permet donc,
en passant aux logarithmes, de montrer que la suite (H^71!!1/71)^! admet une limite.
Exercice 17.4- Soit (an)n^i une suite de nombres réels. On suppose que an+k ^ an + a^, pour tous
&,n ^ 1. Montrer que la suite (^)n^i tend vers son inf. (dans R).
• Si || ||x et || ||2 sont deux normes équivalentes sur E, alors |M|i>8p = IMksp P°ur tout
u : E —> E linéaire continu (pour || ||i ou || ||2, les deux conditions sont équivalentes).
Il existe C > 1 tel que G-1 ||a;||i ^ ||x||2 ^ C||x||i, pour tout x G E. On en déduit que
||u»||2 = sup^0 t^ffi < sup^0 ^^ = C*\\u"h. On a donc ||ii»||J'w ^ &'»h»\\\/n,
pour tout n ^ 1, et un passage à la limite nous fournit l'inégalité ||ti||2|8p ^ IMksp- L'inégalité
inverse s'obtenant en échangeant les rôles de || ||i et || ||2, cela permet de conclure.
• Si(113) K = R ou C, et si E est de dimension finie, alors ||«||sp = supAGSpectt |À|.
Comme E est de dimension finie, toutes les normes sont équivalentes, et on peut faire le
calcul de || ||sp en utilisant celle que l'on veut d'après le point précédent.
Commençons par supposer que K = C. La matrice de u peut se mettre sous forme de
Jordan, ce qui signifie qu'il existe une basée*,*, où À décrit Specu avec multiplicités éventuelles
et 1 < i ^ a(À) (et donc £)Aa(À) = dimE), avec u(e\yi) = \e\yi + eA,i_i (avec la convention
e\j = 0, si j ^ 0). On a alors un(eXii) = £Kû(A)_i (J)*"-^-*, pour tout n ^ 1, et tout
i ^ a(A). On munit E de la norme || Z)Aïia;A,teA,z|| = supAi \x\ti\. On choisit \i G Spectx tel
que \\l\ réalise le maximum de |À|, pour À G Specu, et on doit prouver que ||u||sp = \\i\.
• u>n(e^i) = /xneMïi, et donc ||un|| ^ |/z|n et ||txn||1/n ^ |/z|, pour tout n ^ 1. On en déduit
que ||ti||8p ^ |/i|.
(113)L'énoncé est encore valable si K est un corps norme complet quelconque, mais la démonstration
demande d'étendre | | à une extension de K contenant les valeurs propres de u ; on peut utiliser les
techniques de l'alinéa 20.4.5 pour ce faire.
17. ESPACES VECTORIELS NORMES
171
• Si x = EA,txA,teA,t, alors \\un(x)\\ ^ \\x\\ £A>i IK(eA,t)||. Maintenant, si a = supAa(A),
on a \\u"(eXii)\\ ^ EKa(A)-i Ç)Wn~' ^ Nn£^a-i (?) = I^G-})- 0n en déduit «ue
\\un\\ ^ (dimE)|/z|n(™+J), ce qui permet, en prenant les racines n-ièmes et en passant à la
limite, de prouver que ||tx||sp < |/z|.
Ceci permet de conclure dans le cas K = C. Si K = R, on choisit une base, ce qui permet
de supposer que E = Rn que Ton munit de la norme || ||oo- Si u : E —> E est linéaire, on note
uc •' Cn —> Cn l'application C-linéaire dont la matrice est la même que celle de u. Il résulte de
l'ex. 17.1 qu'on a alors ||t/||oo = ll^clloo- En utilisant cette identité pour txn, puis en prenant
les racines n-ièmes et en passant à la limite, on en déduit que ||u||8p = ||uc||si» ce qui permet
de se ramener au cas K = C traité ci-dessus.
Ceci permet de conclure.
Exercice 17.5. (i) Soient u= (g J) et v = (?{]) (agissant sur E = R2). Calculer ||u||8p, |M|8p, \\uv\\sp
et ||ti + t;||8p.
(ii) Soit (E, || ||)sp un espace vectoriel norme, et soient u,v deux opérateurs linéaires continus sur E
qui commutent. Montrer que ||w||8p ^ ||ti||8p |M|8p et (difficile) \\u + v||sp < ||tx||sp + |M|8p (on pourra se
ramener au cas où ||tx||sp < 1 et ||t;||8p < 1).
17.6. La boule unité d'un espace vectoriel norme
On suppose que K = R ou C.
• Si E est de dimension finie, la boule unité fermée est compacte.
Par définition, la boule unité fermée est bornée, et comme elle est fermée, et que l'on est en
dimension finie, elle est compacte.
• Soit E un espace vectoriel norme. Si la boule unité fermée B(0,1) est compacte, alors E
est de dimension finie (théorème de Riesz, 1918).
Si B(0,1) est compacte, on peut extraire un recouvrement fini du recouvrement de B(0,1)
par les B(x, (£)"), pour x G B(0,1). Autrement dit, on peut trouver un sous-ensemble fini
{eiy i e 1} d'éléments de E tels que B(0,1) c Ui£iB(ei, \). Nous allons montrer que le sous-
espace E7, engendré par les (e*)^, est égal à E, ce qui permettra de conclure. Comme E7 est
fermé, puisque complet, car de dimension finie (n° 17.4), il suffit de montrer que E7 est dense
dans E. Soit donc x G E, et soient a G Z et y G E7 tels que \\x - y\\ ^ 2"a (un tel couple
existe : il suffit de prendre y = 0 et a assez petit pour que ||x|| ^ 2"a). On a 2a(x -y) G B(0,1)
et, par définition de la famille (ej)t€i> il existe i G I tel que ||2a(x - y) - ei\\ ^ \. Mais alors
y' = y + 2~aei G E7 et ||x - y7|| ^ 2"a_1. Ceci permet de construire, par récurrence, une suite
(î/n)n€N d'éléments de E7 vérifiant \\x -yn|| ^ 2"n"a, ce qui prouve que x est dans l'adhérence
de E7, et permet de conclure.
Exercice 17.6. Soient K un corps norme complet et E un K-espace vectoriel norme.
(i) Montrer que K est localement compact si et seulement si B(0,1) est compacte.
(ii) Montrer que Be(0, 1) est compacte, si K est localement compact et si E est de dimension finie.
(iii) Montrer, réciproquement, que K est localement compact et E est de dimension finie, si BE(0,1)
est compacte.
172
VOCABULAIRE MATHÉMATIQUE
17.7. Applications bilinéaires continues
Si (Ei, || ||i) et (E2, || H2) sont deux espaces vectoriels normes, l'espace topologique
Ei x E2 est aussi un espace vectoriel norme, la topologie produit étant celle associée à
la norme ||(zi,a;2)|| = sup(||zi||i, \\x2\\2) ou à toute autre norme équivalente comme par
exemple 11(^,^)11 = (lki||? + lk2||22)1/2.
• Soient (E1} || ||i), (E2, || H2) et (F, || ||F) des espaces vectoriels normes, et b : Ex x E2 --> p
une application bilinéaire. Alors :
(i) b est continue si et seulement si il existe C > 0 tel que ||6(a;i,a;2)||F < C- ||#i||i • \\x2\\2
quels que soient x\ e Ex et x2 G E2 ;
(ii) si F est complet et b continue, alors b s'étend par continuité en une application
bilinéaire du complété Ei x E2 de Ei x E2 dans F.
Si 6 est continue, il existe ri, r2 > 0 tels que 6-1 (Bf(0, l~)) contienne Be, (0, rf ) xBe2 (0, rj).
Autrement dit, ||&(zi,a;2)||F < 1 si ||xi||i < ri et \x2\2. < r2. Par bilinéarité, cela implique que
i\M~ „ Ml Ikilli-ll^lbii^ n r2 „ v,. l|a?i||i-||a?2||2
Réciproquement, s'il existe C > 0 tel que ||6(rci,rE2)||F < C • ||rci||i • ||rc2||2, quels que soient
xi € Ei et X2 € E2, alors
||6(X! + hltX2 + h2) - b{xux2)h ^ C(||*i||i • ||^||2 + HMIi • IM2 + UMIi • IIMI2),
ce qui prouve que b est lipschitzienne de rapport C • (||£i||i + ||»2||2 + 1) sur Be^i,!-) x
Be2(«2,1-)- Ceci prouve que b est continue (et donc termine la démonstration du (i)), et
permet de déduire le (ii) du deuxième point du n° 14.3.
Exercice 17.7. Soit K un corps norme complet.
(i) Montrer que (a, 6) •-» a + 6 et (a,6) •-► ab sont continues sur K2.
(ii) En déduire que si X est un espace topologique, et si / : X —* K et g : X —► K sont continues, alors
/ + #:X—►Ket/#:X-»K sont continues.
18. Espaces préhilbertiens
Dans tout ce §, K = R ou C.
18.1. Produits scalaires
Soit E un espace vectoriel sur K.
• Un produit scalaire sur E est une application ( , ) : E x E —» K qui est :
sesquilinéaire, i.e. linéaire par rapport à y (i.e. {x,y\ + 2/2) = {x,y\) + (2,2/2) et
(x,\y) = \{x,y), si A G K, x,y,yi,y2 G E), et semi-linéaire(114) par rapport à x
(i.e. (xi + x2,y) = (xuy) + (x2,y) et (Xx,y) =J(xyy), si A e K, x,y,xux2 G E) ;
symétrique, i.e. (y,x) = (x,y), quels que soient x,y G E;
définie positive, i.e (x, x) ^ 0, si x G E, et {x, x) = 0, si et seulement si x = 0.
(114)Si K = R, on a x = rc, et donc la sesquilinérarité n'est autre que la bilinéarité.
18. ESPACES PRÉHILBERTIENS
173
» Un espace préhilbertien est un espace vectoriel muni d'un produit scalaire. Si E est
préhilbertien, on définit || || : E —> R en posant ||z|| = (z,a;)1/2. Alors || || est une norme,
et on a \{x,y)\ < ||rc|| • ||y|| pour tous x,y G E (inégalité de Cauchy-Schwarz) : l'application
R-bilinéaire (x,y) i-> (x,y), de E x E dans K, est continue.
||# + £y||2 = ||a;||2 + 2£Re((a;,y)) + £2||y||2 est toujours ^ 0, pour <6R; son discriminant est
donc ^ 0, ce qui se traduit par |Re((z,y))| ^ ||x|| • ||y|| pour tous x,y € E. Choisissons alors
0 € R tel que e~i0(x, y) € R+. En utilisant la majoration précédente pour ei0x et y au lieu de
x et y, on obtient \(x,y)\ = Re((ei9x,y)) ^ \\ei9x\\ • \\y\\ = \\x\\ • ||y||, ce qui prouve l'inégalité
de Cauchy-Schwarz. L'inégalité triangulaire s'en déduit car
II* + Vf = INI2 + 2Re«*, y» + |M|2 < NI2 + 2||*|| • \\y\\ + ||y||2 = (||x|| + ||y||)2.
L'identité ||Arc|| = |A| ||x|| étant immédiate, || || est une norme, ce qui permet de conclure.
• Cn et Rn, muni des produits scalaires usuels {x,y) = y^^_| Xjyj et (x,y) = yiljLi Xjyj,
sont des espaces préhilbertiens. Si on utilise l'identification Kn = Mnxi(K), les produits
scalaires usuels s'écrivent aussi sous la forme (X,Y) = *XY (resp. (X,Y) = *XY) si
X = \x\, • • • > xn) et Y = \yi,...,yn) sont des éléments de Cn (resp. de Rn).
• Si E est un espace préhilbertien réel, on peut étendre le produit scalaire ( , ) sur E au
complexifié Ec = E©iE de E en posant (x'+iy', x+iy)c = (x\ x)-i(y', x)+i(x', y)+(y', y),
ce qui fait de Ec un espace préhilbertien complexe.
Exercice 18.1. Montrer que (/,#) h-* (/,#) = fQ f(t) g(t) dt est un produit scalaire sur ^([0,1]).
18.2. Orthogonalité
Dans tout ce qui suit, E est un espace préhilbertien réel ou complexe.
• On dit que x, y e E sont orthogonaux si (x, y) = 0. Si x et y sont orthogonaux, ils
vérifient la relation de Pythagore^115) \\x + y\\2 = \\x\\2 + \\y\\2. Dans le cas général, ils
vérifient l'identité de la médiane \\x\\2 + \\y\\2 = 2||^|| + |||z - y||2, qui se démontre
sans problème en développant le membre de droite.
• Une famille (e^i d'éléments de E est dite orthonormale, si ||ej|| = 1 pour tout i, et si
e* et ej sont orthogonaux pour i ^ j. On a alors (x,y) = Y^i&^iVi et IMI = Si€i W2> s*
x = Eteint et y = Edifie*, Pour tous (xi)ieu(vùiei e K*1).
• Si F est un sous-espace vectoriel de E, et si rc e E, il existe au plus un élément Pf{x) de F,
appelé (s'il existe) projection orthogonale de x sur F, tel que x — Pf(x) soit orthogonal
à F tout entier.
Si î/i, î/2 € F sont tels que x — y\ et x — y2 sont orthogonaux à F tout entier, alors y\ — y-i =
(# - î/i) - (x - y2) est orthogonal à F, et comme yi - y2 € F, on a (yi - y2,yi - y2) = 0, ce
qui implique yi = y2.
(ii5)gj k = R, la relation de Pythagore entraîne Porthogonalité (« théorème » de Pythagore, pauvre
Pythagore...) ; ce n'est plus le cas si K = C : en développant \\x + y||2, on obtient (x, y) + (y, x) = 0 dont
on peut juste déduire que (x, y) est imaginaire pur.
174
VOCABULAIRE MATHÉMATIQUE
• Si F est un sous-espace de dimension finie de E muni d'une base orthonormale (ei,..., e^),
alors pf est partout définie, et Pf(x) = YA=\{eùx)ei- En particulier, si a; G F, ses
coordonnées dans la base (ei,... ,ed) sont les (e^z), et ||z||2 = Ylt=i l(eti^)|2-
Soit y = J^=l(eux) e*. Alors (e,-,x -y) = (e,, x) - DiU(ei> z)(ei>e») = 0, pour tout j. On
en déduit que x — y est orthogonal à chacun des e,-, et donc à F tout entier par linéarité. De
plus, y € F par construction, et donc y = Pf(x). On en déduit le résultat.
• Le procédé d'orthonormalisation de Schmidt, décrit ci-dessous, permet, si (/i)i€i est une
famille libre d'éléments de E, avec I dénombrable, de fabriquer une base orthonormale de
l'espace F engendré par les fi.
On se ramène, en numérotant les éléments del, au cas où I est un intervalle de N contenant 0.
On note Fn le sous-espace de F engendré par les /i, pour i < n. On construit par récurrence
une famille orthonormale et d'éléments de F telle que (eo,..., en) soit une base (orthonormale)
de Fn, pour tout n. Pour cela, on pose eo = ïïrnr/o. et en supposant eo,... ,en_i construits
(et donc Fn_! muni d'une base orthonormale), on note gn = fn - PF^C/n)- On a
gn ^ 0 puisque fn £ Fn_i, la famille des fj étant supposée libre. On pose en = ■jnrTrPn-
Par construction, gn (et donc cLUSSl 6n ) est orthogonal à chacun des e*, pour i ^ n — 1, et
comme ||en|| = 1, cela permet de faire marcher la récurrence.
• Tout sous-espace de dimension finie de E possède des bases orthonormales.
Il suffit d'appliquer le procédé d'orthonormalisation de Schmidt à une base quelconque.
• Si E est de dimension n, et si ei,..., en est une base othonormale de E, les coordonnées
de a; G E dans cette base sont (ei,z),... (en,z), et on a (x,y) = JDïLi {eùx){euV), si
x,y e E; autrement dit, un espace préhilbertien de dimension n sur K est isomorphe
à Kn muni du produit scalaire usuel.
On a (ej,X)J=1 Xjej) = Xi. Le résultat s'en déduit.
• Si F est un sous-espace de dimension finie de E, la projection orthogonale p? sur F est
partout définie, est linéaire et vérifie p? o pF = pF ; c'est donc une projection, son image
est F et son noyau est l'orthogonal F1 de F (i.e. l'ensemble des x eE tels que (x,y) = 0
pour tout y G F) qui est donc un supplémentaire de F. De plus :
o \\pf(x)\\ ^ \\x\\ pour tout a; G E.
o \\x - Pf(x)\\ ^ ||rcr - y\\, pour tout y G F; en d'autres termes, ||rcr - pF(n;)|| est la
distance d(x, F) de a: à F.
Pour montrer que pp est partout définie, il suffit de prendre une base orthonormale ei,..., e<*
de F, et d'utiliser un des points précédents selon lequelpf(x) = J2i=i (ei» x)ei '■> ^a linéarité de pf
s'en déduit en utilisant celle de ( , ) par rapport à la seconde variable.
Maintenant, pf(x) = x si x € F (car x — x est orthogonal à F tout entier), et pf(x) € F
par définition ; on en tire la relation ppopF =pF. Il s'ensuit que pp est une projection et son
image est F d'après ce qui précède. En revenant à la définition, on voit que pf(x) = 0 si et
seulement si x est orthogonal à F, et donc Kerpp = F1-.
Enfin, x - pf(x) et pf(x) étant orthogonaux, on a ||pf(x)||2 = ||x||2 - \\x - Pf(#)||2> et
18. ESPACES PRÉHILBERTIENS
175
donc ||pf(£)|| < ||x|| ; si y € F, alors x - pf(x) et y — pf(x) sont orthogonaux, et donc
\\x-y\\2 = \\x-PF(x)\\2 + \\PF(x)-y\\\et \\x-v\\ > ||*-pp(*)ll-
Ceci termine la démonstration.
Si v\,...,vn G E, soit G(vu...,vn) = ((vi,Vj»i<ij<n £ Mn(C) la matrice de Gram
de vi,..., vn ; son déterminant |G(vi,..., vn)| est le déterminant de Gram de vu ..., vn.
• |G(«i,...,«n)| = d(«i, Vect(v2,..., vn))2\G(v2,... ,vn)|.
On écrit v\ sous la forme v^ + X^=2 ^jvj> avec v\ orthogonal à F = Vect(^2, • • •, vn), et
donc v± = vi -Pf(vi). On ne change pas |G(^i,..., vn)\, si on retire à la première colonne de la
matrice de Gram la combinaison linéaire des autres où le coefficient de la j-ième est Xj, ce qui à
pour effet de remplacer (v^vi) par (vuv{-). Or (vu W") = 0 si z ^ 2, et (vuv^) = ||W"II2> ce Qui
permet, en développant |G(vi,..., vn)\ par rapport à la première colonne, d'obtenir la formule
\G(vi,...,vn)\ = ||vi"||2|G(ifc,...,r;n)|. On conclut en remarquant que \\vî-\\ = d(v\,F).
• Le rang de G(v\,..., vn) est le même que celui de V\,..., vn ; en particulier, V\,..., vn
est une famille libre si et seulement si son déterminant de Gram est non nul.
Quitte à réordonner les v^ ce qui ne fait que permuter les lignes et les colonnes de la matrice
de Gram et ne change pas son rang, on peut supposer que vu..., vr est une famille libre, et
Vj = X)J=i aijvû si j^ r + 1. Si on note X^ = \(vuVj),..., (vn,Vj)) la j-ième colonne de la
matrice de Gram, la linéarité de (, ) par rapport à la seconde variable, nous fournit la relation
Xj = X^f=i aijXi si j^ r + 1. Il s'ensuit que les colonnes de la matrices sont de rang < r, et
donc que le rang de la matrice de Gram est ^ r.
Par ailleurs, le mineur r x r en haut à gauche est le déterminant de Gram de v\,..., vr.
D'après le point précèdent, il est égal à nï=id(vt,Fi_i)2, où F*_i est l'espace engendré par
vi,...,Vi-i\ il est donc non nul puisque vi £ F$_i étant donné que v\,...,vr est libre. Il
s'ensuit que le rang de la matrice de Gram est ^ r. Ceci permet de conclure.
Exercice 18.2. Soit A = (a* j) G Mn(C). Exprimer *AA comme une matrice de Gram ; en déduire que
|detA|2^n;=1(Kil2 + --- + |anJ|2).
Exercice 18.3. (i) Soit A = (a^) G Mn(R), à coefficients non diagonaux tous égaux à k ^ 0, et à
coefficients diagonaux fci,..., kn vérifiant ki > 0, et ki ^ k pour tout i, avec égalité pour au plus un i.
Montrer que A est inversible. (On pourra s'intéresser aux signes des solutions de AX = 0.)
(ii) Soit I un ensemble de parties non vides de {1,... ,ra} tel qu'il existe k G N tel que |E n E7| = fc,
pour tous E, E7 G I avec E ^ E7. Montrer que |I| ^ m.
(iii) Peut-on avoir |I| = m, si k ^ 1 ?
18.3. Unitarité
18.3.1. Endomorphisme unitaire
Un endomorphisme u de E est dit unitaire si (u(x),u(y)) = (x,y) pour tous x,y.
• u est unitaire si et seulement si c'est une isométrie (i.e. ||«(a;)|| = ||z||, pour tout x).
Si u est unitaire, ||n(x)||2 = (u(x),u(x)) = (x,x) = \\x\\2 pour tout x, et u est une isométrie.
Si u est une isométrie, ||u(*) + u(y)\\2 - \\u(x)\\2 - \\u(y)\\2 = \\x + y\\2 - \\x\\2 - |M|2, et
donc Re((u(x),u(y))) = Re((x,y)), pour tous x,y G E. En appliquant ceci à ix et y au lieu de
176
VOCABULAIRE MATHÉMATIQUE
x et y, on obtient lm((u(x),u(y))) = Im((x,y)), et donc (u(x),u(y)) = (x,y), ce qui prouve
que u est unitaire.
• Si E est de dimension finie, les endomorphisme unitaires forment un sous-groupe de GL(E).
Notons H l'ensemble des endomorphismes unitaires. Alors H contient id et donc n'est pas
vide. Si u,v G H, alors ||nov(x)|| = ||tx(v(a:))|| = \\v(x)\\ = ||x||, ce qui prouve que uov
est une isométrie et donc est unitaire. Enfin, si u G H, alors Kern = {0}, puisque u(x) = 0
implique ||x|| = ||tx(x)|| = 0, et donc u est injectif et, par suite, bijectif puisque nous sommes
en dimension finie. Si u~l G GL(E) est son inverse, alors ||x|| = ||t6o^""1(a;)|| = H^""1^)!! Pour
tout x, puisque u est une isométrie. Il s'ensuit que u"1 est une isométrie et donc est unitaire,
ce qui montre que tout élément de H a un inverse dans H. Ceci permet de conclure.
• Si u e End(E) est unitaire, et si F est un sous-espace de dimension finie de E stable
par u, alors F1- est stable par u.
Si u est unitaire, alors u est une isométrie et donc u est injectif; sa restriction à F est a
fortiori injective et donc bijective puisque F est de dimension finie. Si y G F, il existe donc
u~l(y) G F tel que u(u~l(y)) = y. Il s'ensuit que, si x G F1, alors (x,u~l(y)) = 0, et donc
(u(x),y) = (u(x),u(u~l(y))) = (x,u~l(y)) = 0, pour tout y G F. Ceci équivaut à u(x) G F1,
ce qui permet de conclure.
• Si E est de dimension finie sur C, et si u G End(E) est unitaire, les valeurs propres de u
sont de module 1, et il existe une base orthonormale dans laquelle u se diagonalise.
Si u(x) = Xx et x ^ 0, l'égalité ||tx(x)|| = ||x|| se traduit par |À| = 1. Les valeurs propres
de u sont donc de module 1. Prouvons, par récurrence sur n = dimE, qu'un opérateur unitaire
u se diagonalise dans une base orthonormée. Si n = 1, tout x non nul est vecteur propre et
ei = nhx est une ^>ase ^e ^ f°rmée de vecteurs propres. Si n ^ 2, alors u admet une valeur
propre Ai puisque E est de dimension finie. Il existe donc un vecteur propre ei de u pour la
valeur propre Ai, vérifiant ||ei|| = 1, et le supplémentaire orthogonal F de Cei, qui est de
dimension n - 1, est stable par u. La restriction txp de u à F est unitaire, et on peut donc lui
appliquer l'hypothèse de récurrence, ce qui nous fournit une base orthonormale e2,..., en de F
dans laquelle uf se diagonalise, et donc une base orthonormale ei,..., en de E dans laquelle u
se diagonalise.
• Une symétrie s est unitaire si et seulement si les espaces propres V+ et V" pour les
valeurs propres 1 et —1 sont orthogonaux; si c'est le cas, on dit que s est la symétrie
orthogonale par rapport à V+.
D'après le point précédent, si s est unitaire, alors s peut se diagonaliser dans une base
orthonormée et donc les espaces propres associés à deux valeurs propres distinctes sont
orthogonaux. Réciproquement, si V+ et V" sont orthognaux, alors s est une symétrie et donc est
unitaire car V = V+ 0V" et \\s(v+ + v')\\2 = \\v+ - v~\\2 = \\v+\\2 + |Ki|2 = \\v+ + <r||2, si
v+ e v+ et v- G V".
Exercice 18.4- On suppose E de dimension n sur K.
(i) Si Vi ^ V2 et si \\vi\\ = ||v2||> montrer qu'il existe une symétrie orthogonale s par rapport à un
hyperplan telle que s(vi) = v^.
(ii) En déduire, par récurrence sur n, que tout endomorphisme unitaire u de déterminant ±1 est le
composé d'au plus n symétries orthogonales par rapport à des hyperplans (où n = 0 est permis).
18. ESPACES PRÉHILBERTIENS
177
18.3.2. Le groupe unitaire et ses sous-groupes
P = (a,ij) e Mn(K) est dite unitaire si *PP = 1. Une matrice unitaire à coefficients
réels est aussi dite orthogonale, et la condition devient *PP = 1 puisque P = P.
• Si P = {aiyj) G Mn(K), les conditions suivantes sont équivalentes :
o P est unitaire,
o les colonnes de P forment une base orthonormale de Kn,
o les lignes de P forment une base orthonormale de Kn.
Si P est une matrice, *PP est la matrice de Gram des colonnes de P. On a donc *PP = 1
si et seulement si les colonnes de P forment une base orthonormale. Maintenant, si *PP = 1,
alors P*P = 1, et donc P*P = 1 (en appliquant la conjugaison complexe). Il s'ensuit que P est
unitaire si et seulement si *P est unitaire, ce qui, d'après ce qui précède, équivaut à ce que les
colonnes de *P, qui sont les lignes de P, forment une base orthonormale de Kn.
• Si P est unitaire, alors up : Kn —► Kn est unitaire. Réciproquement, si E est de dimension
finie et si u 6 End(E) est unitaire, la matrice de u dans une base orthonormée est unitaire.
Si X,Y € Kn, on a («P(X),tiP(Y)> = (PX,PY> = *(PX)PY = 'X'PPY = «XY = (X,Y>, si
P est unitaire, et donc «p est unitaire.
Réciproquement, si u est unitaire, alors l'image u(ei),... ,u(en) d'une base orthonormale
ei,..., en par u est encore orthonormale puisque (w(e$), «(e,-)) = (e*, e,). Comme l'application
x •-» e\x, qui envoie un vecteur sur la colonne de ses coordonnées dans la base e\,...,en, est
un isomorphisme d'espaces préhilbertiens E sur Kn muni du produit scalaire usuel, il s'ensuit
que e\«-ei,... ,e\«-en est une base orthonormée de Kn, et donc que la matrice e\«-e de u
dans la base ei,..., en, dont les colonnes sont e\«-ei,... ,e\«-e„, est unitaire d'après le point
précédent. Ceci permet de conclure.
On note U(n) C GLn(C) l'ensemble des matrices unitaires et O(n) C GLn(R)
l'ensemble des matrices orthogonales.
• U(n) et O(n) sont des sous-groupes de GLn(C) et GLn(R) ; il en est de même de
leurs intersections respectives SU(n) et SO(n) avec le SLn(C) : les groupes U(n), O(n),
SU(n) et SO(n) sont appelés respectivement groupe unitaire, groupe orthogonal, groupe
spécial unitaire, et groupe spécial orthogonal (de degré n).
Ph«p induit un isomorphisme de U(n) sur le sous-groupe de GL(Cn) des endomorphismes
unitaires de Cn muni du produit scalaire usuel ; il en résulte que U(n) est un groupe. Une
intersection de sous-groupes étant un sous-groupe, on en déduit que O(n), qui est égal à
U(n) n GLn(R), est un groupe, et que SU(n) et SO(ra) sont des groupes.
• Si Q G U(n), il existe P 6 U(n) et D diagonale, avec des termes diagonaux de module 1,
telles que Q = PDP"1 = PD<P.
C'est une traduction du fait que «q : Cn —» Cn se diagonalise dans une base orthonormée
et que toutes ses valeurs propres sont de module 1, puisqu'il est unitaire.
Exercice 18.5. Montrer que U(n) et SU(n) sont connexes par arcs.
• Si P e SO(2), il existe un unique 6 G R/2ttZ, tel que P soit la matrice Ke = (2JÎ "ci"/)
178
VOCABULAIRE MATHÉMATIQUE
de la rotation d'angle 0, et 0 ■-> (jjjj ^o!T/) induit un isomorphisme de groupes de K/2nZ
sur SO(2).
Si P = (l §), l'orthogonalité des colonnes se traduit par ac + 6d = 0, et donc par l'existence
de À G R tel que (c,d) = À(-6,a). Comme detP = 1, cela donne À(a2 + b2) = 1, et comme
les colonnes sont de norme 1, on a a2 + b2 = 1 et À = 1. Maintenant, la relation a2 + b2 = 1
montre qu'il existe un unique 0 G R/27rZ avec cos0 = a et sin0 = 6.
Il en résulte que 9*->Ro est une bijection de R/27rZ sur SO(2). C'est aussi un morphisme
de groupes car R$ est la matrice de la multiplication par ei$ dans la base l,t de C sur R, et
6 h-* el° est un morphisme de groupes.
• Si P G 0(2) - SO(2), alors P est la matrice d'une symétrie orthogonale.
Les deux racines du polynôme caractéristique de P sont réelles car detP = -1, et comme
elles sont de module 1 et quel leur produit est égal à -1, ce sont 1 et -1. D'où le résultat.
• Si P G SO(n), il existe Q G O(n), et 0i,... ,0m G R/27rZ, avec m = [f], uniquement
déterminés à Tordre et au signe près, tels que QPQ"1 soit la matrice diagonale par blocs
Diag(Rôl,..., Rflm) ou Diag(l, R^,..., R0ni) suivant que n est pair ou impair.
Soient Ai,..., Ar, jUi,/^,..., /xs,/xs les valeurs propres de P, répétées avec multiplicité, où
les Xi sont réelles et les \ii ne le sont pas. Comme P est unitaire, on a \ = ±1 et f^jflj = 1, et
comme detP = 1, il y a un nombre pair de À* égaux à -1.
La démonstration de l'existence de Q se fait par récurrence sur n. Si n = 1 le résultat est
trivial, et si n = 2, il est inclus dans un point précédent. Il y a deux cas :
• 1 est valeur propre de u\> : si /i est un vecteur de norme 1 fixe par txp, l'hyperplan W
orthogonal à /i est stable par up. Il s'ensuit que si /2,..., fn est une base orthonormée de W,
et si Q0 est la matrice de colonnes fu... ,/n, alors Q0 G O(n) et Q^PQo est de la forme
(JpJ, avec Pi G SO(n-l). On peut alors appliquer l'hypothèse de récurrence à Pi et trouver
Qi G 0(n - 1) telle que QiPiQr1 soit diagonale par blocs de rotations. Si Q2 = (JqJ, alors
Q2 G O(n) et Q2Q^1PQoQ^1 est de la forme voulue (si n est pair, les deux 1 se combinent
pour former la matrice de la rotation d'angle 0). On peut donc prendre Q = Q2Q0"1.
• 1 n'est pas valeur propre de txp, auquel cas up laisse fixe un plan de Cn (éventuellement
inclus dans l'espace propre associé à -1), et la restriction de up à ce plan est une rotation
puisqu'elle est unitaire et n'admet pas 1 comme valeur propre. L'orthogonal de ce plan est
stable par up, et on peut appliquer l'hypothèse de récurrence à la matrice de la restriction de
up dans une base orthonormée. On en déduit, comme ci-dessus l'existence de Q.
L'unicité, à l'ordre et au signe près, des 9j vient de ce que les valeurs propres de R$ sont e%e
et e"ie, et donc que les e±t0j (auquel il faut ajouter 1 si n est impair) sont les valeurs propres
de P, répétées avec multiplicité.
Exercice 18.6. Montrer que SO(n) est connexe par arcs. Qu'en est-il de O(n) ?
18.3.3. Décomposition d'Iwasawa d'une matrice
• On peut écrire tout A G GLn(C) (resp. tout A G GLn(R)), de manière unique, sous
la forme^116) A = PM, où M G GLn(C) (resp. M G GLn(R)) est triangulaire supérieure
avec des coefficients diagonaux réels > 0, et P est unitaire (resp. orthogonale).
(H6)Qn peut écrire M sous la forme DN ou D est diagonale à coefficients diagonaux > 0, et N est triangu-
18. ESPACES PRÉHILBERTIENS
179
Soient vi,... ,vn G Kn les colonnes de A. Comme A est inversible, fi,... ,vn est une base
de Kn, et le procédé d'orthonormalisation de Schmidt nous fournit une base orthonormale
h = &i,iî>i, h = &2,2^2 + 61,2^1, ..., fn = bninVn + biinvi + -- + bn-iinvn-i, avec 6M réel > 0
(on a biyi = iitt.-p.1.^.)») où Pt-i est ^a projection orthogonale sur le sous-espace engendré par
Vu • • • > Vi-i). Si on note P la matrice dont les colonnes sont les /,, et M la matrice triangulaire
supérieure dont les coefficients sur la diagonale ou au-dessus sont les&ij, les relations ci-dessus
se traduisent par AM = P. Or P est unitaire (resp. orthogonale) et M"1 est triangulaire
supérieure, et A = PM"1 est une écriture de A sous la forme voulue.
Maintenant, si P1M1 = P2M2, avec Pi,P2 unitaires, et Mi,M2 triangulaires supérieures
avec des coefficients diagonaux > 0, alors B = P^Pi = M2M]"1 est à la fois unitaire et
triangulaire supérieure avec des coefficients diagonaux > 0. Il s'ensuit que ses valeurs propres
sont à la fois de module 1 et réelles > 0 ; elles sont donc toutes égales à 1, et comme B = P^Pi
est diagonalisable car unitaire, cela implique que B = 1 et donc que Pi = P2 et Mi = M2.
D'où l'unicité, ce qui permet de conclure.
Exercice 18.7. (i) Montrer que GLn(C) et SLn(C) sont connexes par arcs,
(ii) Montrer que SLn(R) est connexe par arcs. Qu'en est-il de GLn(R)
Exercice 18.8. (i) Montrer que U(n) est un sous-groupe compact de GLn(C)
(ii) Soit M une matrice triangulaire supérieure avec des 1 sur la diagonale. Montrer que (M - l)n = 1 ;
en déduire que Mm est un polynôme en m, et que la suite des Mh est bornée si et seulement si M = 1.
(iii) Montrer que U(n) est un sous-groupe compact maximal de GLn(C) : si H est un sous-groupe
compact de GLn(C) qui contient U(n), alors H = U(n).
18.4. Opérateur autoadjoint, matrice hermitienne
184-1- Réduction des opérateurs autodajoint
Soit u e End(E) un opérateur sur E. Si (u(x),y) = (x,u(y)) pour tous x,y eE, on dit
que u est hermitien ou autoadjoint.
• Si u : E —> E est autoadjoint, et si F est un sous-espace de E stable par u, alors F1- est
stable par u.
Soit x e F1. Alors (x,u(y)) = 0, pour tout y e F, puisque u(F) c F. Comme u est
autoadjoint, on en déduit que (u(x), y) = (x, u(y)) = 0 pour tout y G F, et donc que u(x) G F1.
• Si u : E —> E est autoadjoint, les valeurs propres de u (de uc si E est réel) sont réelles.
Commençons par traiter le cas K = C. Si x ^ 0 est un vecteur propre de u pour la valeur
propre À, la relation (x,u(x)) = (u(x),x) devient (x,Xx) = (Ax,x), et donc A||x||2 = A||x||2. Il
en résulte que À est réel.
Si K = R, on peut étendre u en un endomorphisme uc du complexifié Ec = E © zE de E
qui est un espace préhilbertien complexe. En utilisant successivement la définition det/c> celle
laire supérieure avec des 1 sur la diagonale, et donc est unipotente, ce qui nous fournit la décomposition
A = PDN. Une telle décomposition existe dans un cadre nettement plus général ; elle est connue sous le
nom de décomposition d'Iwasawa.
180
VOCABULAIRE MATHÉMATIQUE
de ( , )c, le fait que u est autoadjoint, la définition de (, )c> et enfin celle de «c, on obtient,
si z = x + iy et z' = x' + iy' sont des éléments de Ec :
(uc{z'),z)c = (u(x')+iu(y'),x + iy)c = (u(x'),x) -i(u{y'),x) +i(u(x'),y) + (u(y'),y)
= (x', u(x)) - i(y\ u(x)) + i(x\ u(y)) + (y', u(y)) = (x' + iy', u(x) + iu(y))c = (*', uc(z))c,
et donc «c est autoadjoint, et ses valeurs propres sont réelles d'après ce qui précède.
• Une homothétie est hermitienne si et seulement si son rapport est réel ; une projection
est hermitienne si et seulement si c'est une projection orthogonale (i.e. si noyau et image
sont orthogonaux, ce qui est le cas de la projection orthogonale sûr un sous-espace de
dimension finie), et une symétrie est hermitienne si et seulement si elle est orthogonale.
Dans un sens, cela résulte des deux points précédents ; dans l'autre, c'est presque immédiat.
• Si E est de dimension finie et si u : E —> E est autoadjoint, alors u se diagonalise dans
une base orthonormée.
Prouvons le résultat par récurrence sur n = dimE. Si n = 1, le résultat est immédiat.
Si n ^ 2, alors u a au moins une valeur propre Ai (c'est clair si E est complexe, puisqu'on
est en dimension finie ; si E est réel, alors «c a une valeur propre, qui est réelle d'après la
démonstration du point précédent, et donc u admet une valeur propre (alinéa 10.5.1)). Soit e\
un vecteur propre associé vérifiant ||ei|| = 1, et soit F l'orthogonal de Ce\. Alors F est stable
par u puisque Cei l'est, et on peut donc lui appliquer l'hypothèse de récurrence : il existe une
base orthonormée e2,..., en de F formée de vecteurs propres pour u. Alors ei,..., en est une
base orthonormée de E formée de vecteurs propres pour u, ce qui prouve que u se diagonalise
dans une base orthonormée.
18.4-2. Réduction des matrices et des formes hermitiennes
A = (aiyj) G Mn(C) est dite hermitienne si A = *A, ce qui se traduit par <Hj = ô^ï, pour
tous i,j. On dit aussi que A est autoadjointe si A est hermitienne (la matrice A* = *A
est l'adjointe de A). Notons que si A G Mn(R), alors A est hermitienne si et seulement si
elle est symétrique (i.e. fcA = A).
• Si A G Mn(C) est hermitienne, et si M e Mn(C), alors ^AM est hermitienne; en
particulier, 'MM est hermitienne(117) pour tout M e Mn(C).
Si B = «MAM, alors *B = ^AM et «B = WÂM = B, puisque e = A.
• Si A e Mn(K) est hermitienne, alors Ua : Kn —> Kn est hermitien. Réciproquement, la
matrice d'un opérateur hermitien u dans une base orthonormée est hermitienne.
«a(X) = AX, et donc (X,«a(Y)) = *XAY. Comme une matrice 1 x 1 est égale à sa
transposée, (X,wA(Y)> = VAX et donc (uA(Y),X) = (X,«A(Y)> = "Y'ÂX = «YAX = (Y,wA(X)>,
ce qui prouve que «A est hermitien.
Réciproquement, si u est un endomorphisme de E, sa matrice A = (ai,j) dans une base
ei,...,en a pour colonnes les coordonnées de «(e,) dans la base ei,...,en. Si la base est
orthonormée, ces coordonnés sont les (ei,«(eJ)), et donc aitj = (ei,u(ej)). Si u est hermitien,
cela implique que Oij = («(e*), ej) = (e,-, ufe)) = ô^ï, et donc A est hermitienne.
(117)Un calcul immédiat montre que *MM est la matrice de Gram des colonnes de M.
18. ESPACES PRÉHILBERTIENS
181
• Si A e M(C) (resp. A e M(R)) est hermitienne (resp. symétrique), il existe P G U(n)
(resp. O(n)) et D diagonale à coefficients réels, telles que A = PDP-1 = PD*?.
C'est une traduction du fait que «a : Cn —► Cn a toutes ses valeurs propres réelles et se
diagonalise dans une base orthonormée puisqu'il est hermitien.
Soit V un espace de dimension finie sur C ou sur R. On dit que (x, y) i-> H(rc, y) est
une forme hermitienne sur V si elle est sesquilinéaire et symétrique (un produit scalaire
est une forme hermitienne définie positive ; si V est réel, une forme hermitienne est une
forme bilinéaire symétrique).
o Si e = (ei,... ,en) est une base de V, la matrice de H dans la base e est celle des
H(ei,ej) ; c'est une matrice hermitienne par symétrie de H; on la note ^He.
o La sesquilinéarité de H fait que R(x,y) = t(e\x)(tBEe)(e\y)J si x,y G V.
o Si f = (/i,... ,/n) est une autre base de V, on a iHe = t(e\f)(<eHe)(e\f), où e\f
est, comme d'habitude, la matrice dont les colonnes sont les fj dans la base e.
• Si V est préhilbertien, et si H est une forme hermitienne sur V, il existe une base
orthonormée e de V dans laquelle la matrice de H est diagonale à coefficients réels.
Si H est une forme hermitienne sur Cn (resp. Rn), il existe une matrice P = (piyj)
unitaire (resp. orthogonale), et d\,... ,dn G R, tels que H(rc,y) = X)ILi rf»Lt(^)L»(l/)» avec
Soit f une base orthonormée de V. La matrice A de H dans cette base est hermitienne, et il
existe donc P € U(n) telle que A = PDP-1 où D est diagonale à coefficients réels. Les vecteurs
dont les coordonnés dans la base f sont les colonnes de P forment une base orthonormée e
de V, et la matrice de H dans cette base est *PAP, et comme *P = P-1, cette matrice n'est
autre que D, ce qui prouve le premier énoncé.
Pour le second, on paît de la matrice A de H dans la base canonique. Cette matrice
est hermitienne et il existe Q unitaire (resp. orthogonale), et di,...,dn € R, tels que
A = QDiag(dii...idn)iQ. Alors P = (pitj) = "Q est encore unitaire (resp. orthogonale),
et on a H(X, Y) = <XAY = «X^Diag^i,... ,dn)PY = J^=1 dÎLjx)U{y)> où U est la forme
linéaire U{\zu..., zn)) = £J=1 pitjZj.
184-3. Décomposition polaire d'une matrice
• Si A e Mn(K), alors (X,Y) •-► 'XAY est sesquilinéaire sur Kn, hermitienne si et
seulement si A est hermitienne, et de plus définie positive si et seulement si les valeurs
propres de A sont > 0.
La sesquilinéarité est immédiate. La symétrie équivaut à 'YAX = tXÂY, et donc à *YAX =
VAX (car une matrice 1 x 1 est sa propre transposée), pour tous X, Y, et donc aussi à A = *A
(dans un sens c'est clair, dans l'autre on utilise le fait que le coefficient bij d'une matrice
B = (bi,j) € Mn(K) est égal à ^Be,-).
Maintenant, si A est hermitienne, on peut l'écrire sous la forme PD*P, où P est unitaire et D
est diagonale à coefficients diagonaux di,..., dn réels (les di sont alors les valeurs propres de A,
car tp = P"1). Si X G Kn, soit X' = *PX = *(»;,...,x'n). Alors X •-» X' est un isomorphisme
de Kn sur Kn, puisque *? est inversible, et on a *XAX = YX=\ «Wl2- H s'ensuit que *XAX > 0
pour tout X ^ 0 équivaut à ce que les dk soient > 0. D'où le résultat.
182
VOCABULAIRE MATHÉMATIQUE
Une matrice hermitienne A G Mn(C) (resp. symétrique A G Mn(R)) est définie positive
si (X, Y) ■-> OCAY est un produit scalaire sur Kn. D'après le point précédent, c'est le cas
si et seulement si les valeurs propres de A sont > 0.
• Si A G GLn(C), alors *A A est une matrice hermitienne définie positive.
On a déjà démontré que B = *AA est hermitienne. Maintenant, *XBX = (AX,AX), et
comme le noyau deX^ AX est trivial puisque A est inversible, cela implique que *XBX > 0,
si X =^ 0, et donc que B est définie positive.
• On peut écrire tout A G GLn(C) (resp. A G GLn(R)), de manière unique, sous la
forme PS, où P est unitaire (resp. orthogonale), et S est hermitienne (resp. symétrique)
et définie positive.
Le cas réel se déduit du cas complexe en utilisant l'unicité de l'écriture et l'observation selon
laquelle A = P S est aussi une écriture si A est réelle et si A = PS en est une.
Si A = PS, alors *ÂA = ^PS = S2, car <PP = 1 et *S = S. Donc S est une solution
de l'équation S2 = ^A. Réciproquement, si S est une matrice hermitienne, définie positive,
solution de cette équation, alors P = AS"1 vérifie *PP = ^"^ÂAS"1 = S"ltÂAS"1 =
S"1(tAAS"2)S = S-1S = 1, ce qui prouve que P est unitaire et que A = PS est une écriture
de A sous la forme voulue. On est donc ramené à prouver que l'équation S2 = B a une et une
seule solution dans les matrices hermitiennes définies positives, si B est hermitienne et définie
positive.
o Pour prouver l'existence, on met B sous la forme QDQ"1, avec Q unitaire et D diagonale
à coefficients diagonaux di,...,dn > 0. Soit y/D la matrice diagonale dont les coefficients
diagonaux sont y/dî,..., \fd^. Alors S = Qv^DQ"1 vérifie S2 = B. Par ailleurs, on a aussi
S = Q\/D*Q, ce qui prouve que S est hermitienne, et définie positive puisque ses valeurs
propres y/dî>..., \fda sont > 0.
o Maintenant supposons que S2 = B, où S est définie positive. Les valeurs propres Ai,..., Àr
de S sont donc > 0, et Kn = Vi © • • • © Vr, où V$ et l'espace propre de us associé à la valeur
propre À*. Par ailleurs V$ est inclus dans l'espace propre W* de ub pour la valeur propre À2,
et comme les À2 sont distincts deux à deux puisque les À* sont > 0, cela prouve que V* = W*
(car n ^ ^dimW^ ^ ^dimV^ = n, et donc dimW$ = dimV*, pour tout i). On en déduit
l'unicité de S (en effet, us doit être l'homothétie de rapport y/dî sur l'espace propre de ub
pour la valeur propre di).
Ceci permet de conclure.
Exercice 18.9. (i) Montrer que (/, g) *-> (/, g) f* J(t)g(t) dt est un produit scalaire sur l'espace ^(R/Z)
des fonctions fé700 sur R, périodiques de période 1.
(ii) Montrer que le laplacien A = -J^ est autoadjoint ; quelles sont ses valeurs propres?
(iii) L'opérateur A est-il continu sur fé700 muni de la norme définie par le produit scalaire ?
Exercice 18.10. (Polynômes orthogonaux).
Soit <t> : [0,1] -► R£ continue, et soit ( , > le produit scalaire défini par (P, Q) = jj P(t)Q(t) <f>{t)dt, si
P, Q G R[X]. On note (Pn)n€N la base orthonormée de R[X] obtenue par le procédé d'orthonormalisation
de Schmidt à partir de la base canonique 1, X, X2,... de R[X].
(i) Montrer que Pn est de degré n, de coefficient dominant pn > 0.
(ii) Montrer que Pn a n racines distinctes dans ]0,1[.
(iii) Montrer que P h-* RP est autoadjoint si R G R[X].
19. TÉRATOLOGIE
183
(iv) Calculer (Pn,XPn_i) en fonction des p*.
(v) Montrer qu'il existe an,bn,cn G R, avec on,cn > 0, tels que P„ - (anX + 6„)Pn_i + c„P„_2 = 0,
si n ^ 2. (On pourra faire le produit scalaire avec Q G R[X]<n~3) bien choisi.)
(vi) Montrer que les racines de Pn et de Pn_i sont entrelacées : si xm,i < xm<2 < • • • < xm,m sont celles
de Pm> alors xn>i < xn-ïyi < xUy2 <••• < £n-i,n-i < zn>n. (On s'intéressera au signe de Pn(#n-i,t)-)
19. Tératologie
Ce § rassemble un certain nombre de monstres mathématiques.
19.1. Fonctions continues dérivables nulle part
Jusqu'au début du XIXe siècle (au moins), il était évident pour tout le monde qu'une
fonction continue de R dans R était dérivable, et même somme de sa série de Taylor, sauf
en des points isolés. C'est malheureusement loin d'être le cas puisque Weierstrass (1875)
a construit une fonction continue dérivable nulle part, et Banach a montré que l'ensemble
de ces fonctions était dense dans celui des fonctions continues.
Soit E = ^°([0,1],|| ||oo). Nous nous proposons de construire un sous-ensemble X,
dense dans E, constitué de fonctions dérivables nulle part. Pour ce faire, fixons a e]|, 1[.
Si n G N, et si À; e {0,1,..., 2n - 1}, soit
u„,, = {0€E, |,(*£!)_,(!)!>„.}.
• Un)A; est un ouvert de E : en eifet (f> t-> |</>(^r) — 0(^)| est continue sur E comme
composée de l'application linéaire continue <f> i-> Anik((j>) = 4>(^r) — (f>(^) 0a continuité
de AHtk résulte de la majoration |An)fc(</>)| < 2||0||oo), et de la valeur absolue.
On en déduit que Un = nj^Un,* et Vn = Um^nUm sont des ouverts de E.
• Vn est dense dans E. En effet, soit <j> e E, et soit e > 0. Comme [0,1] est compact, (j> est
uniformément continue, et il existe no 6 N tel que \(f>(^r) — (t>{4ï) I ^ e> <luels Que soient
n > no et k e {0,1,..., 2n — 1}. Soit m ^ sup(no, n) tel que am < e, et soit tp e E définie
par^(z) = <t>(x) + esm(2mirx). Si k e {0,1,... ,2m - 1}, on a \\ip - ^ < e et
W^)-*(£)IH±fe+*(^)-*(£)l >*-«>«".
ce qui prouve que i/> €\JmC Vn. On en déduit que, pour tout <f> € E, on peut trouver un
élément de Vn dans tout voisinage de 0, et donc que Vn est effectivement dense dans E.
Comme E est complet, il résulte du lemme de Baire que X = Dn€NVn est dense dans E,
et pour conclure, il suffit donc de prouver que, si <j> € X, et si Xq e [0,1], alors <f> n'est
pas dérivable en x$. Pour cela, remarquons que (f> G X signifie que (f> appartient à une
infinité de Un, et donc qu'il existe b : N —» N, tendant vers +oo en +oo, telle que
WI&) - Hwz) I > fl6(n)> P°ur tout n G N et tout ^ G {0,1,..., 26("> - 1}. Soient kn
la partie entière de 2b^x0, et un = ^fey, vn = |gjf (si x0 = 1, on pose un = 1 - ^ry et
184
VOCABULAIRE MATHÉMATIQUE
vn = 1). Par construction, un < x0 < vn et vn - un = ^ô ; en particulier, un -> x0 et
vn -> rc0. Par ailleurs, pour tout n G N, on a |^I^n)| > (2a)6<n>, et comme 2a > l,
cela montre que I^^E^^I tend vers +oo, et donc que <f> n'est pas dérivable en x0 (si
elle l'était, on aurait ^j^lffi*"* —> <f>'(x0)). Ceci permet de conclure.
Exercice 19.1. Adapter la dernière partie de l'argument pour montrer que Yln^ îS" 2» *** est continue
sur R, mais n'est dérivable nulle part.
19.2. L'escalier du diable
Il s'agit d'une fonction / : [0,1] —> R, continue, croissante, valant 0 en 0 et 1 en 1, mais
qui croît subrepticement : il existe une famille de segments ouverts ]an, bn[ disjoints, pour
n G N, tels que / soit constante sur chacun des segments ]on,6n[, et tels que la somme
totale £n€N(&n - Q>n) des longueurs des segments soit égale à 1. La fonction / représente
un contrexemple assez frappant à une extension naturelle du théorème fondamental de
l'analyse | £/»(«)* = /(»)" /(«) I-
On construit /, par un procédé fractal, comme la limite de fn : [0,1] —> [0,1], continues,
croissantes, affines sur chaque intervalle ln>i = [^r,Çr], pour 0 < i < 3n - 1, construites
par récurrence à partir de fo(x) = x en utilisant la recette suivante : l'image de lUfi
par /n+i est la même que par fn, mais le graphe de fn+i sur cet intervalle est obtenu
en coupant en trois le segment constituant le graphe de fn, et en introduisant un palier
horizontal au milieu.
De manière plus précise, si on note an>i et bn>i les valeurs de fn en -^ et ^r, alors les
fonctions fn et /n+i sont données par les formules suivantes sur ln>i :
fn(x) = Onti + (bnii - an>i)(3nx - i)
fn+l(x) =
0>n,i + f (&n,i - ûn,i)(3nZ - i) si X e ln+l,3i,
"'* 2°"'* SIX € In+l,3i+l,
Ki + Ub",i ~ an,i)(3nx ~ * ~ 1) «6 In+l,3i+2-
En particulier, si fn est constante sur In(i, alors /n+i = fn sur ln)i, et dans le cas général,
on a
(bn,i-an,i g. je cm^re (jgg unités dans l'écriture de i en base 3 est 0 ou 2,
bn+l i—^7i+l i = i
1^0 si le chiffre des unités dans l'écriture de i en base 3 est un 1.
Une récurrence immédiate permet d'en déduire que ||/n+i — /n||oo ^ g^rr, et
I -X- si tons les rJiiffrPK r\e> l'prrit.iirp Hp i pn h««p 3 sr
■ ^ si tous les chifTres de l'écriture de i en base 3 sont des 0 ou des 2,
0 si un des chiffres de l'écriture de i en base 3 est un 1.
19. TÉRATOLOGIE
185
Fig. 1. Graphes de /o, /i, h et fc
Comme £]n€N ^ < +oo, la série f0 + YZ=o(fn+i ~ fn) converge normalement, et sa
somme /, qui est aussi la limite de la suite (/n)n€N, est continue. Chaque fn étant
croissante, il en est de même de la limite /. Enfin, / est constante sur ln>ij si un des chiffres
de i dans le développement en base 3 est un 1. Il y a 3n - 2n tels i, ce qui fait que la
réunion Fn des In>i, pour i vérifiant la condition précédente, est de longueur totale égale
à 1 — |J. Comme / est constante sur (chacun des intervalles composant) Fn, un passage
à la limite montre que / est constante sur la réunion des Fn qui est de longueur totale
égale à 1. D'un autre côté, on a /n(0) = 0 et /n(l) = 1, pour tout n, et donc /(O) = 0
et /(l) = 1 par passage à la limite. On a donc bien construit une fonction continue qui
croît subrepticement de 0 à 1.
186
VOCABULAIRE MATHÉMATIQUE
19.3. L'ensemble triadique de Cantor
C'est un fermé K de R inclus dans [0,1], de mesure nulle, mais quand même assez gros
pour qu'il existe une surjection de K sur [0,1]. C'est l'ensemble des points de [0,1] en
lesquels l'escalier du diable croît.
On construit par récurrence une suite (Kn)n€N de fermés de [0,1], chaque Kn étant la
réunion de 2n segments fermés. On part de K0 = [0,1], et si Kn est construit, on obtient
Kn+i en coupant chacun des segments fermés constituant Kn en 3 segments de même
longueur et en enlevant le morceau du milieu (ouvert pour que Kn+i soit fermé). On a
donc
Kl=[0,l]-]y[=[0,i]u[|,l]> Kî-Kl-(]I,§[u]I,|[)-[0,i]u[|,|]u[|.ï]u[|,l].
On note K l'intersection des Kn ; c'est un fermé de [0,1] comme intersection de fermés.
La somme des longueurs des segments constituant Kn est (|)n qui tend vers 0 quand
n —> +oo, ce qui fait que K est de mesure nulle, puisque KcK„ pour tout n.
Par ailleurs, K est l'ensemble des x e [0,1] dont un des développements en base 3 ne
comporte que des 0 et des 2 (les seuls nombres ayant deux développements sont ceux de
la forme ^, avec k G Z et n G N). En effet, les nombres que l'on retire pour passer de Kn
à Kn+i sont précisément ceux dont tous les développements en base 3 ont un 1 en n-ième
position et pas de 1 avant. L'application (on)n^i •—► X^n=i f^ induit donc une bijection de
l'ensemble {0,2}N~W sur K, ce qui nous permet de définir une surjection / : K —> [0,1],
en passant de la base 3 à la base 2, c'est-à-dire en envoyant X)ïS f^ sur Z)nS |k> où
bn = an/2 e {0,1}.
Exercice 19.2. (i) Adapter la construction ci-dessus pour construire un fermé de [0,1] d'intérieur vide,
mais de mesure non nulle.
(ii) Montrer qu'un tel ensemble est totalement discontinu.
19.4. La courbe de Peano
Il s'agit d'une courbe fractale qui remplit tout le carré, ce qui montre que la notion de
dimension est plus problématique que ce qu'on pourrait croire (un probabiliste dirait que
pour obtenir une courbe ayant (presque) cette propriété, il suffit de lancer un mouvement
brownien qui se chargera de remplir (presque) le plan tout seul).
On construit la courbe de Peano / : [0,1] —> [0, l]2 comme une limite de fonctions fn,
affines par morceaux, construites par récurrence. La fonction /o est juste t t-> (t,t)',
son image est donc la diagonale du carré [0, l]2. La fonction fn est une fonction affine
sur chaque intervalle de la forme ln>i = [<£r,^r], et le passage de /n+i à fn se fait en
remplaçant chacun des 9n segments qui constituent l'image de fn par 9 segments par le
procédé indiqués à la figure 2. La figure 3 montre ce que cela donne pour /2 (les fonctions
/o et /i sont représentées sur la figure 2).
19. TÉRATOLOGIE
187
FiG. 2. Procédé d'obtention de /n+i à partir de fn ; pour un segment allant dans
l'autre sens, on renverse juste le sens de parcours.
1/9 2/9 3/9 4/9 5/9 619 7/9 819 1
FiG. 3. La fonction /2 : les nombres apparaissant sur la figure correspondent à
l'ordre dans lequel les 92 = 81 segments sont parcourus.
188
VOCABULAIRE MATHÉMATIQUE
Par construction, les fonctions fn+ï et fn ont une image incluse dans le même sous-carré
de côté de longueur ^r, sur chacun des segments In>i, pour 0 ^ i < 9n - 1. On a donc
||/n+i - /n||oo ^ ^r, si on munit R2 de la norme \\{x,y)\\ = sup(|rc|, \y\). On en déduit que
fn converge uniformément sur [0,1], et comme les fn sont continues, il en est de même de
la limite /.
On a fn+i{é) = /»(£). si ° < * < 9n> et donc /(f) = /»(£)» si n e N et 0 ^ i^ 9n.
Or l'image de {^-, 0^i<9n-l} par fn est l'ensemble An des couples (^r, ^-), avec
o, b entiers, 0 < o, b < 3n, et a + b pair. La réunion des An est dense dans [0, l]2, et est
contenue dans l'image de / d'après ce qui précède ; l'image de / est donc dense dans [0, l]2.
Pour montrer que / remplit tout le carré [0, l]2, il n'y a plus qu'à remarquer que [0,1]
étant compact et / continue, /([0,1]) est compacte et donc fermée dans [0, l]2, et comme
elle est dense, c'est [0, l]2 tout entier !
19.5. Ensembles connexes non connexes par arcs
19.5.1. Le graphe de sin^
Soit X le graphe de la fonction x i-> <j){x) = sin^, pour x > 0. L'ensemble X est
connexe par arcs, vu que c'est un arc en tant qu'image de R* par x *-* (x, <f>(x)) qui est
une application continue de R* dans R2. Son adhérence X dans X est donc connexe ; nous
allons montrer qu'elle n'est pas connexe par arc.
Commençons par montrer que X = XUl, où I est le segment vertical I = {(0, y), y G [—1,1]}.
• Comme R2 est métrique, un point (a, 6) est dans l'adhérence de X, s'il existe une suite
(#mî/n)n€N d'éléments de X convergeant vers (a, 6) dans R2. Or yn = <f>(xn) et <f> est continue
sur R+, ce qui fait que, si a > 0, on doit avoir 6 = (f>(a) par continuité. L'intersection de X
avec R+ x R est donc réduite à X.
• Comme X est contenu dans le fermé R+ x [-1,1], il en est de même de son adhérence; on
en déduit l'inclusion XcXUl.
• Si 6 € [-1,1], alors (0,6) est la limite de (2mr+aîcsin(ft)'6) G X> ^n&ad n ~> +°°> ce ^ui
montre que (0,6) G X, et donc que I c X. On en déduit l'égalité X = X UI que l'on cherchait
à établir.
Démontrons, par l'absurde, que X n'est pas connexe par arcs. Supposons donc le contraire ;
il existe alors u : [0,1] -» X, continue, telle que «(0) = (0,0), et «(1) = (ic~l,0). Soient
A = {£, u(t) G 1} et o G [0,1] la borne supérieure de A. Alors u(a) G I car I est fermé et u est
continue, et u(t) £ I, si t > a. On a donc u(a) = (0,6), et u(t) = (x(t),y(t)), avec x(t) > 0, si
t > a. On peut supposer, sans nuire à la généralité, que 6^1 (sinon, on remplace 1 par -1
dans ce qui suit). Comme u est continue, il existe ô > 0 tel que y(t) ^ 1, si t G [a,a + ô\.
Comme y(t) = (j>(x(t)), cela implique que x(t) n'est pas de la forme 2nn+(n/2) » s* * e [a,a + #]>
Or le seul intervalle de R+ contenant 0 et ne contenant aucun point de la forme 2nn+(n/2V
pour n G N, est {0}. Comme t *-* x(t) est continue sur [o,o + <5], cela implique x(t) = 0, si
t G [a, a + <5], ce qui est contraire à la définition de a. Ceci permet de conclure.
19. TÉRATOLOGIE
189
19.5.2. Le tipi de Cantor
C'est un sous-ensemble T du plan qui défie un peu l'entendement car il est connexe,
et il existe S 6 T tel que, si on retire S à T, le résultat est totalement discontinu (ce qui
signifie, rappelons-le, que les composantes connexes de T — S sont réduites à des points).
Pour construire T, on part de l'ensemble triadique de Cantor K que l'on partitionne en
un ensemble Ki dénombrable et dense (118) et son complémentaire K2.
On identifie K à un sous-ensemble de R2 par t *-> (t, 0), ce qui permet de voir K comme
un sous-ensemble du segment horizontal L = [0,1] x {0}. On note S le point (0,1), et si
P = (t,0), avec t GKi (resp. t G K2), on définit le rayon TP comme l'ensemble des (rc,y)
appartenant au segment [P,S[, avec y G Q (resp. y £ Q). On définit le tipi de Cantor T
comme la réunion des Tp, pour PeK, auquel on rajoute le sommet S de T. Nous allons
montrer que T est connexe, mais que T privé de S est totalement discontinu.
Pour montrer que T est connexe, considérons une partition de T en deux ouverts Ui et
U2, et supposons que S € Ui. Comme Ui est non vide, il s'agit de montrer que U2 l'est.
Comme il est plus confortable de travailler dans un carré que dans un triangle, on remarque
que (x, y) •-» ((1 -y)rc, y) induit un homéomorphisme de [0,1] x [0,1[ sur le triangle de sommets
A = (0,0), B = (1,0) et S = (0,1), privé de son sommet S ; l'homéomorphisme réciproque étant
(x,y) 1-» (j3y,î/). Via cet homéomorphisme, le rayon Tp devient T'P = {P} x ([0,1] D Q), si
P € Ki, et Tp = {P} x ([0,1] n (R - Q)), si P € K2, et T - S devient la réunion T' de
Kx x ([0,1] n Q), et de K2 x ([0,1] n (R - Q)). L'ouvert Ui - S devient un ouvert U^ de T'
contenant ([0, l]x]l - ô, 1[) DT', si ô > 0 est assez petit, U2 devient un ouvert U2 de T', et V[
et U2 forment une partition de T'.
On est alors ramené à prouver que U2 est vide. On définit une fonction h : K —> [0,1], par
h{P) = 0, si T'p n U2 = 0, et hÇP) = sup{y, (P, y) G TP n U'2}, si T'P n U'2 ^ 0. Comme U2 est
ouvert, sa vacuité est équivalente à h = 0 sur K ; on va donc s'intéresser aux points où h ^ 0.
• h{P) < 1 pour tout P G K, car Uî n U2 = 0 et U; contient ([0,1] x]l - <5,1[) n T', si ô > 0
est assez petit.
• h(P) G Q si P G K2, car sinon le point (P,/i(P)) de Tp appartiendrait à UJ, pour i = 1
ou i = 2, et comme UJ est ouvert, il existerait un segment ouvert J c]0,1[, contenant hÇP),
tel que {(P, i), teJ}n T', soit contenu dans U^. Dans les deux cas i = 1 et i = 2, on obtient
une contradiction avec la définition de h(P).
• Si q g]0, l[nQ, et si P G Ki, il existe un ouvert I de K contenant P tel que h(Q) ^ q pour
tout Q G I. En effet, le point (P,g) appartient à TP par construction, et donc appartient àU£,
pour i = 1 ou i = 2. Comme UJ est ouvert et contient (P,</), il contient un ouvert de la forme
(I x J) n T', où I est un ouvert de K contenant P, et J est un ouvert de ]0,1[, contenant q ; la
définition de h montre que l'on a h(Q) £ J, si Q G I.
Si q G]0,l[nQ, soit Fq l'adhérence de {P G K, h(P) = q}. C'est un fermé de K par
construction, et il ne rencontre pas Ki d'après le point précédent. Il est donc d'intérieur vide
puisque Ki est dense dans K. Comme K est un compact métrique, il est complet, et le lemme
de Baire implique que la réunion X de Ki et des F9, pour q G Qn]0, l[, est d'intérieur vide,
(u8)Qn peut} par exemple, prendre pour Ki l'ensemble des éléments de K dont le développement en base 3
est limité, i.e. l'ensemble des nombres de la forme Yl?=i f£> avec n G N, et Of G {0,2}, si 1 ^ i ^ n.
190
VOCABULAIRE MATHÉMATIQUE
puisque c'est une réunion dénombrable de fermés d'intérieur vide (Qn]0,1[ est dénombrable et
Ki est dénombrable et donc est une réunion dénombrable de singletons). L'ensemble K - X est
donc dense dans K. Or P G K-X implique h(P) = 0, et donc aussi {P} x (]0, l[n(R-Q)) c \J\.
Donc U;! contient (K - X) x (]0, l[n(R - Q)) qui est dense dans T' car il l'est dans K x [0,1[
qui contient T'. Son complémentaire U2 est donc d'intérieur vide, et comme il est ouvert, il
est vide. On en déduit la connexité de T.
Il reste à montrer que T-S est totalement discontinu, et comme T-S est homéomorphe àT',
il suffit de prouver que T'l'est. Pour cela considérons deux points distincts (Pi,î/i) et (P2.3/2)
de T'. Si Pi 7^ P2, il existe Q ^ K dans l'intervalle ouvert d'extrémités Pi et P2 puisque K est
d'intérieur vide. La droite verticale {Q} x R ne rencontre pas T', et les deux demi-plans ouverts
qu'elle délimite partitionnent T' en deux ouverts, l'un contenant (Pi, 3/1), l'autre (P2,î/2). On
en déduit que (P2>!/2) n'est pas dans la composante connexe de (Pi,yi). Une composante
connexe de T' est donc incluse dans un rayon T'P, or un tel ensemble est totalement discontinu
puisqu'il est homéomorphe à Q n [0,1[ ou à (R - Q) n [0,1[. Les composantes connexes de T'
sont donc des points, ce qui permet de conclure.
20. Construction de nombres
Dans ce §, on explique rapidement (sans démonstration) comment construire toutes les
quantités usuelles à partir d'un système minimal d'axiomes. Cette problématique n'est
apparue que relativement récemment dans l'histoire des mathématiques puisqu'il a fallu
attendre 1872 pour que Weierstrass s'aperçoive que les nombres réels n'avaient pas été
définis, ce qui aurait pu avoir des conséquences fâcheuses... Une des raisons qui ont poussé
les mathématiciens à s'intéresser à ces questions de fondements a été l'apparition de
monstres (cf. § précédent) montrant que l'intuition pouvait se révéler fort trompeuse, et
de paradoxes menaçant de faire s'écrouler tout l'édifice.
20.1. Entiers naturels
La première présentation axiomatique des entiers remonte à 1888 (Dedekind), simplifiée
l'année suivante par Peano. L'ensemble des nombres entiers qui semble être constitué des
objets les plus évidents (tout le monde comprend ce que sont 0,1,2,... ; le problème est
dans le « ... »), ne peut pas être construit; on est plus ou moins forcé de postuler son
existence et d'espérer que le ciel ne va pas nous tomber sur la tête.
• La présentation la plus efficace postule l'existence d'un ensemble N, l'ensemble des
entiers naturels, muni d'un élément 0 et d'une application « successeur » s : N —> N,
vérifiant les axiomes (de Peano) suivants :
(Al) l'application s est injective ;
(A2) 0 n'est le successeur d'aucun entier naturel ;
(A3) Si X C N est tel que 0 6 X et s(n) G X pour tout n € X, alors X = N (axiome
de récurrence).
On définit alors l'addition et la multiplication par récurrence par a + 0 = a et a+s{b) =
s(a + b) (pour l'addition) ; a0 = 0 et as(b) = ab + a (pour la multiplication). On pose
20. CONSTRUCTION DE NOMBRES
191
1 = s(0), et on a s(a) = s(a + 0) = a + s(0) = a + 1, ce qui permet de supprimer
l'application successeur et de la remplacer par a i-> a+1. Vérifier, à partir des axiomes de
Peano, que l'addition et la multiplication sont commutatives et que la multiplication est
distributive par rapport à l'addition, est un exercice un peu répétitif mais très satisfaisant
pour l'esprit.
• On obtient une présentation plus intuitive en partant de l'idée que se fait le petit enfant du nombre 5.
On dit qu'un ensemble X est fini s'il ne peut pas être mis en bijection avec X U {#}, si x £ X. On
postule l'existence d'un ensemble infini Cl (axiome de l'infini), et on munit l'ensemble des parties de Cl
de la relation d'équivalence ~ définie par Xi ~ X2 s'il existe une bijection de X! sur X2. On définit
alors l'ensemble N des entiers naturels comme l'ensemble des classes d'équivalence de parties finies de Cl
pour cette relation d'équivalence. Si X est une partie finie de ffc, on note |X| € N sa classe d'équivalence ;
c'est un entier naturel que l'on appelle le cardinal de X, et une analyse a posteriori de la construction
précédente, montre que l'on a défini l'entier n comme la classe d'équivalence de tous les ensembles (inclus
dans notre Cl) de cardinal n.
On note 0 le cardinal de l'ensemble vide, 1 celui d'un singleton (i.e. un ensemble X, non vide, tel que
x,y G X =>• x = y)... Si o, 6 € N, on choisit X, Y c Cl disjoints, de cardinaux respectifs a et 6, et on définit
a + b comme le cardinal de X U Y, et ab comme le cardinal de (tout sous-ensemble de Cl pouvant être mis
en bijection avec) X x Y. Il est alors quasi-immédiat que a + b = b + a (car X U Y = Y U X), que ab = ba
(car (x,y) *-* (y,x) induit une bijection de X x Y sur Y x X), que 0 • a = a pour tout o G N (l'ensemble
0 x X est vide quel que soit X), et que a(b + c)=ab + ac (car X x (Y U Z) = (X x Y) U (X x Z)).
Les choses se compliquent quand on essaie de montrer que N vérifie l'axiome de récurrence pour
l'application successeur x^x+1.
20.2. Entiers relatifs, nombres rationnels
En partant des entiers naturels, on fait les constructions suivantes.
• On construit Z comme quotient de N x N par la relation d'équivalence (a, b) ~ (a', 6')
si et seulement si a + b' = a' + 6, l'idée étant que (a, 6) représente l'entier relatif a — b.
L'application n i-> (n,0) induit une injection de N dans Z, ce qui permet de voir N
comme un sous-ensemble de Z.
L'addition (a, b) + (a', b') = (a + a7, b + b') passe au quotient, et définit une loi qui
fait de Z un groupe commutatif, l'élément neutre étant (la classe de) (0,0) (ou de (a, a),
pour tout a G N), et l'opposé de (a, b) étant (b, a). L'opposé —n de n est donc représenté
par (0,n), et on peut maintenant définir o — 6, si o et b G Z, et si a, b e N, on a
a — b= (a, 0) + (0,6) = (o, b), ce que l'on cherchait à obtenir.
La multiplication(119^ (a,6)(a',6/) = (aaf + bb',ab' + ba') passe au quotient, et Z muni
de l'addition et de la multiplication est un anneau commutatif.
Enfin, on dit que a ^ b, si a — b e N, et on obtient de la sorte une relation d'ordre
totale sur Z.
(119)On rappelle que (a, 6) représente 6-a, et donc que (aa'+bb',ab'+ba') représente aa'+bb'-ab'-ba' =
(a - b)(a' — 6'), ce qui explique comment la formule pour la multiplication a été obtenue.
192
VOCABULAIRE MATHÉMATIQUE
• On construit Q comme quotient de Z x (Z — {0}) par la relation d'équivalence (a, 6) ~
(a', 6') si et seulement si ab1 = a'6, l'idée étant que (a, 6) représente le nombre rationnel fi.
L'application n h-» (n, 1) induit une injection de Z dans Q, ce qui permet de voir Z comme
un sous-ensemble de Q.
L'addition et la multiplication sur Q sont définies par les formules (a, b) + (a', b') =
(atf + ba',bb') et (a,6)(a',6') = (aa', 66') qui passent au quotient, et Q muni de l'addition
et de la multiplication est un corps commutatif : l'élément neutre pour + est 0, la classe
de (0,6), pour tout b e N, l'opposé de (a, 6) est (-0,6), l'élément neutre pour x est 1,
classe de (6,6), pour tout 6 G Z — {0}, et l'inverse de (0,6), si (0,6) ^ 0 (ce qui équivaut
àû^O) est (6, a). Sia€Zet6eZ — {0}, on peut maintenant diviser a par 6 dans Q,
et b~la est la classe de (l,6)(a, 1) = (a, 6), ce que l'on cherchait à obtenir.
Enfin, on dit que q est positif, si q a un représentant (a, 6) avec 6 ^ 0 et a ^ 0, et que
Q\ ^ #2, si q\ — <72 est positif. On obtient de la sorte une relation d'ordre total sur Q.
20.3. Nombres réels, nombres complexes
Pour construire R à partir de Q, on dispose essentiellement de trois possibilités.
• On peut utiliser les coupures de Dedekind (1872), c'est-à-dire l'ensemble des couples
(A, B) de parties non vides de Q tels que A U B = Q, et tout élément de A est < à tout
élément de B. L'idée étant que si r e R, alors r correspond à la coupure (Ar, Br) donnée
par Ar = {x G Q, x < r} et Br = {x G Q, x ^ r}. Les rationnels s'identifient aux
coupures (A, B) telles que A D B est non vide. Il est alors facile de montrer que l'ensemble
R ainsi construit vérifie la propriété de la borne supérieure (toute partie majorée non vide
admet une borne supérieure), puis qu'il est complet.
• On peut aussi, comme G. Cantor (1872), compléter Q pour la valeur absolue, en
rajoutant de force les limites des suites de Cauchy d'éléments de Q. On considère l'ensemble
Cauchy(Q) des suites de Cauchy d'éléments de Q (i.e. l'ensemble des suites (an)n€N G QN,
telles que, pour tout j G N, il existe Nj G N tel que \ap — an\ < 2~J, quels que soient
n,p > Nj). Alors Cauchy (Q) est un anneau pour l'addition et la multiplication terme à
terme dans lequel l'ensemble I des suites tendant vers 0 est un idéal. On définit R comme
le quotient de Cauchy(Q) par I, ce qui revient à identifier deux suites de Cauchy ayant
même limite (i.e. dont la différence tend vers 0), et donc « à identifier une suite de Cauchy
avec sa limite ». Le résultat R est un corps(120), muni d'une relation d'ordre(121) stricte,
(120)si (o„)n€N est une suite de Cauchy qui ne tend pas vers 0, alors an ^ 0 si n ^ no, et la suite
(1,..., 1, a~*,..., a~\... ) est de Cauchy et son image dans R est l'inverse de celle de la suite (on)n€N-
(I21)Si 0,6 € R, on dit que a < 6, si a ^ 6 et si, pour tous représentants (an)„eN et (6n)n€N de o et 6,
on a an < bp si n et p sont assez grands ; on constate sans problème que si c'est vrai pour un choix de
représentants, alors c'est vrai pour tous.
20. CONSTRUCTION DE NOMBRES
193
totale, dans lequel Q (identifié à l'image des suites constantes) est dense (122>.
• On peut aussi utiliser la construction de « l'homme de la rue » qui part du fait qu'un réel
a un développement décimal. Cela conduit à définir R comme l'ensemble des
développements décimaux an... ao, o_ia_2 ... avec un nombre fini de chiffres avant la virgule et un
nombre infini après, modulo la relation d'équivalence ~, identifiant On... om999999...
à on...am+i(om + 1)00000..., si am ^ 9. Nous laissons au lecteur le soin de définir
l'addition et la multiplication de deux réels de « l'homme de la rue »...
• Une fois les nombres réels construits, on obtient le corps des nombres complexes C en
rajoutant à R une racine carrée i de — 1, ce qui revient à poser C = R[X]/(X2 + 1). Le
résultat est un corps complet pour la norme \z\ = y/x2 + y2, si z = x + iy, et qui est
algébriquement clos (résultat connu sous le nom de « théorème fondamental de l'algèbre »
bien qu'il n'existe aucune démonstration de ce résultat qui n'utilise pas de technique
d'analyse).
20.4. Nombres p-adiques
20.4- 1- Le corps Qp. La construction de R de G. Cantor, bien que plus compliquée, est
nettement plus souple que celle de R. Dedekind, et se généralise facilement. Il n'a fallu que
25 ans après la construction des nombres réels (qui avait pris quelque deux millénaires...),
pour que K. Hensel envisage la construction (1897) des nombres p-adiques, et une petite
dizaine d'années pour qu'il leur donne une forme maniable. De nos jours, on procède de
la manière suivante.
Soit p un nombre premier. Si o € Z — {0}, on définit la valuation p-adique vp(a) comme
le plus grand entier v tel que pv divise a. On a vv(ab) = vp(a) + vp(b) si a, 6 G Z - {0},
ce qui permet d'étendre vp à Q en posant vp(f) = vp(a) - vp(b), si o,6 6 Z - {0},
et vp(0) = +oo. On a alors vp(x + y) ^ mm(vp(x),vp(y)), si x,y G Q car, si x et y
sont divisibles par pv, il en est de même de x + y. On en déduit le fait que, si on pose
\x\p = p~vp(x\ alors |z+y|p ^ sup(|a:|p, \y\v) et donc que dp(x, y) = \x—y\p est une distance
sur Q (la distance p-adique), l'inégalité ci-dessus, dite ultramétrique, étant plus forte que
l'inégalité triangulaire.
On définit Qp, corps des nombres p-adiques, comme le complété de Q pour la norme
p-adique | |p, c'est-à-dire que l'on prend, comme pour définir R, l'anneau des suites de
Cauchy (pour la norme | |p) d'éléments de Q, et on quotiente par l'idéal des suites tendant
vers 0. Si x 6 Qp, et si (an)n€N est un représentant de x, alors \an\p tend vers une limite
dans R (et même dans pz U {0}, car tous ses termes sont dans pz U {0} qui est fermé
dans R+) qui ne dépend que de x, et qu'on note \x\p. Par construction, | |p est une
norme ultramétrique sur Qp, ce qui signifie que \x\p = 0 si et seulement si x = 0, que
<122)Cela signifie qu'entre deux éléments de R on peut toujours trouver un élément de Q. Si a < b sont
deux éléments de R, et si (an)ngN et (6n)n€N sont des représentants de a et 6, alors an < 6P, si n,p ^ no,
et r = a"°2 "ff est un élément de Q vérifiant a <r <b.
194
VOCABULAIRE MATHÉMATIQUE
Mp = \Av\y\p, Quels que soient x,y G Qp, et que \x + y\p ^ sup(|x|p, |y|p), et donc
dp(x, y) = \x — y\p est une distance ultramétrique sur Qp pour laquelle Qp est complet.
On étend vp à Qp par continuité, et on a encore |:c|p = p~^x\ si x e Qp.
• Dans Qp, une suite (zn)n€N converge si et seulement si xn+i — xn tend vers 0 et une
série £]n6N un converge si et seulement si un tend vers 0.
D'après l'inégalité ultramétrique, on a \xn+k — xn\p < supo^j^ |#n+m - xx+i\p, ce qui
montre que si |#n+i - xn\P tend vers 0, alors la suite est de Cauchy. La complétude de Qp
permet de conclure (l'argument est le même pour une série).
Exercice 20.1. Montrer que la série 1 + 2 + 4 + 8H converge vers -1 dans Q2.
Exercice 20.2. (i) Montrer que \x + y\p = \x\p, si \x\p > |y|p.
(ii) Montrer que £neN un ^ 0, et | £neN un\p = |tio|P, si un -» 0, et si |u0|p > KU pour tout n ^ 1.
• La topologie de Qp possède des propriétés un peu déroutantes au premier abord,
(i) Tout point d'une boule de Qp en est « le » centre.
(ii) Deux boules de Qp sont soit disjointes soit l'une est contenue dans l'autre (comme
des billes de mercure),
(iii) Les boules de Qp sont à la fois ouvertes et fermées,
(iv) La topologie de Qp est totalement discontinue.
Si xi G B(x0,r) et y G B(xi,r), alors dp(x0,y) ^ sup(dp(x0,a;i),dp(a;i,y)) ^ r (ou < r si on
parle de boules ouvertes), et donc B(xi,r) c B(xo,r). L'inclusion dans l'autre sens s'obtient
en échangeant les rôles de xq et Xi, ce qui permet de démontrer le (i).
D'après le (i), si deux boules ont une intersection non vide, tout élément de l'intersection
est le centre des deux boules, ce qui démontre le (ii).
Si B est une boule ouverte de rayon r, le complémentaire de B contient la boule ouverte de
rayon r autour de chacun de ses points d'après le (ii), ce qui montre que ce complémentaire
est ouvert et donc que B est fermée. Si B est une boule fermée de rayon non nul, alors B est
un voisinage de chacun de ses points puisque ceux-ci en sont "le" centre. On en déduit le (iii).
Enfin, si x G Qp, si Cx est la composante connexe de x, et si r > 0, alors Cx n B(x,r) est
à la fois ouvert et fermé dans Cx, et non vide puisque contenant x. Comme Cx est connexe,
cela implique Cx n B(x,r) = Cx, quel que soit r > 0, et donc Cx = {x}. On en déduit le (iv).
20.4-2. Construction algébrique de Qp
L'alinéa précédent a donné une construction analytique de Qp comme complété de Q
pour la norme p-adique. Dans cet alinéa, on présente une autre construction de Qp, à
partir des Z/pnZ, qui est purement algébrique. L'existence de ces deux points de vue
sur les nombres p-adiques offre la possibilité de jongler avec un mélange de techniques
d'analyse et d'algèbre, ce qui s'avère précieux pour de nombreuses questions.
• L'ensemble Zp = {x e Qp, \x\p < 1} est un sous-anneau fermé de Qp qui contient Z.
La multiplicativité de | |p montre que Zp est stable par multiplication et l'inégalité
ultramétrique montre que Zp est stable par addition. C'est donc un sous-anneau de Qp qui contient
Z de manière évidente et qui est fermé puisque c'est l'image inverse de [0,1] par x h-* |x|p.
20. CONSTRUCTION DE NOMBRES
195
• Zp est l'ensemble des x G Zp vérifiant \x\p = 1 ; c'est aussi Zp - pZp.
Si x G Zp - {0}, l'inverse x~l de x dans Qp vérifie |&-1|p|&|p = 1. Comme \x\p ^ 1, cet
inverse appartient à Zp si et seulement si \x\p = 1. Maintenant, pour les mêmes raisons que
ci-dessus, l'ensemble des x G Zp vérifiant \x\p < 1 est un idéal de Zp, et comme \x\p < 1
implique \x\p ^ p"1, c'est l'idéal pZp. On a donc Z* = Zp - pZp.
• L'application naturelle de Z/pnZ dans Zp/pnZp est un isomorphisme.
Si x est un élément de Z n pnZp, on a vp(x) ^ n, ce qui signifie que x est divisible
par pn dans Z. On en déduit l'injectivité. Prouvons la subjectivité. Soient x G Zp/pnZp et
x G Zp ayant pour image x modulo pn. Comme Q est dense dans Qp, il existe r G Q vérifiant
vp(x - r) ^ n; en particulier vp(r) ^ 0. Écrivons r sous la forme | avec a,6 G Z. Comme
vp(r) ^ 0, on a vp(b) ^ vp(a) et quitte à tout diviser par pvr(b\ on peut supposer vp(b) = 0,
et donc (6,p) = 1, ce qui implique que 6 est premier à pn et donc est inversible dans Z/pnZ.
Soit c l'inverse de 6 dans Z/pnZ et c G Z dont la réduction modulo pn est c. On a alors
vp(r - ac) = vp(a) - vp(b) + vp(l - bc) ^ n et donc vp(x - ac) ^ n, ce qui prouve que ac a
pour image x dans Zp/pnZp, et permet de conclure.
• L'application t, qui à x G Zp associe la suite de ses réductions modulo pn, est un
isomorphisme d'anneaux de Zp sur la limite projective^123) lim Z/pnZ des Z/pnZ.
L'inclusion pnZ c pn-1Z, induit un morphisme d'anneaux nn : Z/pnZ —» Z/pn-1Z, surjec-
tif. Si x G Zp, la réduction xn de x modulo pn peut être vue comme un élément de Z/pnZ
d'après le point précédent, et on a nn(xn) = xn_i. Il en résulte que l'application t est un
morphisme d'anneaux de Zp dans limZ/pnZ. Si x G Ker(,, on a x G pnZp et donc \x\p ^ p"n,
pour tout n G N, ce qui implique x = 0 et prouve que i est injectif. Si (yn)n£N G limZ/pnZ
et si yn est un relèvement de yn dans Zp, alors yn+i -yne pnZp puisque 7rn+1(î/n+1) = yn ;
la suite (yn)neN a donc une limite y dans Zp et, par construction, y -yn G pnZp, pour tout
n G N ; autrement dit, i(y) = (yn)neN> d'où la subjectivité de t.
• Le point précédent permet de définir Zp, algébriquement (124), comme étant limZ/pnZ,
et comme Qp = Zp[^], cela fournit une définition algébrique de Qp.
(123>Si (Xn)n€N est une suite d'ensembles munis d'applications nn : Xn —> Xn_!, pour n ^ 1, on définit
la limite projective limXn des Xn (relativement aux nn) comme le sous-ensemble de Yln£N Xn des suites
Mneish avec xn G Xn et 7rn(xn) = xn-u si n ^ 1.
(124> On dit que Zp est le complété de Z pour la topologie (p)-adique. Cette construction est un cas
particulier d'une construction générale permettant d'analytifier beaucoup d'objets algébriques : si A est
un anneau et si I est un idéal de A, on peut définir le complété A de A pour la topologie I-adique (un
cas particulier de cette construction (cf. note 1 du chap. V) est l'anneau K[[T]] des séries entières qui est
obtenu à partir de K[T] en complétant pour la topologie (T)-adique ; c'est d'ailleurs par analogie avec
cette situation que Hensel a été amené à la construction des nombres p-adiques). De manière précise, si
n G N, on définit l'idéal In de A comme l'ensemble des sommes de produits de n éléments de A (on a
1° = A par convention). On a In C I71"1 et l'identité de A induit un morphisme (surjectif) d'anneaux
7rn : A/In —> A/P1"1. On définit A comme la limite projective limA/In des A/In (relativement aux
morphismes 7rn), et on dispose d'une application naturelle t : A —> A qui n'est pas forcément injective
(par exemple, si I = A, alors A = 0).
196
VOCABULAIRE MATHÉMATIQUE
20.4.3. Topologie de Qp
• Tout élément de Qp peut s'écrire de manière unique sous la forme x = Yn^-k a*P*> avec
Q*i £ {0,... ,p — 1} pour tout i. Il admet donc une unique écriture en base p
x = . ..afl_i...a0,a_i ...a_fe,
et on a \x\p = pk, si a_fc ^ 0. Une différence avec les nombres réels est qu'il y a une infinité
de chiffres avant la virgule et un nombre fini après. Les éléments de Zp sont ceux dont
l'écriture en base p n'a pas de chiffre après la virgule (du point de vue de l'écriture en
base p, ils correspondent au segment [0,1] de R).
Si n G N, alors {0,... ,pn -1} est un système de représentants de Z/pnZ. Soit alors x G Q*,
et soit k = -vp(x) de telle sorte que y = phx G Z*. Si n ^ -fc, soit yn G {0,... ,pn+/c - 1} le
représentant de l'image de y dans Zp/pn+kZp = Z/pn+kZ (en particulier, y-k = 0 et yi_fc ^ 0,
car y ^ pZp). Alors yn+i -yn est divisible par pn+/% ce qui permet de définir an G {0,... ,p-1}
par an = p~n~fc(yn+i - 3/n). On a alors yn = £jj*-1 a^p* ; autrement dit, an_!an_2 ... a_fc
est l'écriture de yn en base p. Par suite, an_i... a0, a_i... a_fc est l'écriture de xn = p~kyn en
base p. Or yn - pkx G pn+kZp par construction, ce qui se traduit par \yn -pkx\p ^ p-(n+fc)5
ou encore par |xn - x\p ^ p"n, et montre que xn -> x dans Qp. On a donc x = Y,î^-kaiPi
(la somme converge puisque son terme général tend vers 0). On en déduit l'existence d'une
écriture sous la forme voulue.
Pour démontrer l'unicité, il suffit de constater que si Ylî™-kai'Pi = Z)Efc&tPS alors en
multipliant les deux membres par p*, et en regardant modulo pZp, on obtient a_fc — &_* G pZp.
Comme les ai et les 6* sont dans un système de représentants modulo pZp, cela prouve que
a_fc = &_fc. Une récurrence immédiate permet d'en déduire que ai = bi pour tout i. Le reste
découle de la manière dont les ai ont été construits ci-dessus.
• N et Z sont denses dans Zp et Z[^] est dense dans Qp.
Cela résulte de l'existence de l'écriture en base p d'un nombre p-adique (si on coupe cette
écriture au n-ième chiffre avant la virgule, on obtient un élément x de N (resp. Z[^]), si on est
parti d'un élément de Zp (resp. Qp), et la suite de nombres ainsi obtenue converge vers x).
• Zp est compact.
Zp = lim(Z/pnZ) est un fermé de nneN(z/Pnz) <luî est compact en tant que produit de
compacts [et même en tant que produit dénombrable de compacts métriques car lesZ/pnZ
sont discrets, et donc métrisables (ex. 11.2)]. On aurait aussi pu, si (xn)n€N est une suite
d'éléments de Zp, construire, par extraction diagonale, une sous-suite (xv>n(n)) telle que les k
premiers termes du développement en basep de a^n(n) ne dépendent pas de n, si n ^ fc; la
suite extraite converge alors vers l'élément de Zp dont les k premiers termes développement
en base p sont les mêmes que ceux de a^fc(fc), pour tout k G N.
• Qp est localement compact.
Une boule ouverte B(a,r") de Qp est aussi de la forme a + pnZp, où n est le plus grand
élément de Z tel que p~n < r. Elle est donc homéomorphe à Zp, et la compacité de Zp permet
de conclure.
20. CONSTRUCTION DE NOMBRES
197
204-4- Une description arboricole des nombres p-adiques
La figure 4 ci-après fournit une description de Z2 comme limite (projective) des Z/2nZ :
• Les éléments de Z2 correspondent aux bouts des branches de l'arbre infini (pour
obtenir une description analogue de Zp, il suffit de remplacer l'arbre de la figure par un
arbre dans lequel il part, de chacun des noeuds, p branches, numérotées de 0 à p — 1, au
lieu de 2).
FiG. 4. L'arbre des entiers 2-adiques.
• Les ensembles Z/2Z, Z/4Z, etc. sont identifiés à {0,1}, {0,1,2,3}, etc., mais les
nombres sont tous écrits en base 2 (si on prend la ligne correspondant à Z/8Z, ces nombres
apparaissent dans l'ordre 0,4,2,6,1,5,3,7).
• On passe (en montant) de la ligne correspondant à Z/2nZ à celle correspondant à
Z/2n-1Z en supprimant le premier chiffre du développement en base 2 (celui correspondant
à 2n_1 dans ce développement), ce qui représente la réduction modulo 2n_1 de Z/2nZ dans
198
VOCABULAIRE MATHÉMATIQUE
• Dans l'autre sens, les deux branches partant d'un noeud a de la ligne correspondant
à Z/2n-1Z aboutissent aux deux classes a et o + 2n_1 modulo 2n ; si l'écriture en base 2
de a est an_2... ûo> celles de a et o + 2n_1 sont respectivement 0an_2... ao et lon_2... o0.
A la limite, on obtient donc l'écriture en base 2 de l'élément de Z2 correspondant à la
branche infinie de l'arbre.
• La distance entre deux entiers 2-adiques x et y se lit aussi sur l'arbre : c'est la moitié
de la hauteur verticale parcourue pour aller de a; à y en suivant l'arbre (ou, de manière
équivalente, c'est la hauteur du noeud le plus bas appartenant aux branches de a; et y).
Par exemple, pour aller de 0 à —1, il faut remonter tout en haut, et donc la distance
est 1 ; pour aller de 2 = ... 00010 à ^p = ... 101010, il faut passer par le noeud 010 et la
distance est |.
20.4-5. L'anneau des nombres complexes p-adiques
• Si F est une extension finie de Qp, il existe une unique norme sur F dont la restriction
à Qp est | \p.
Supposons que l'on en ait deux | |i et | I2. Alors | |i et | I2 sont deux normes sur le Qp-
espace vectoriel F, de dimension finie, et comme Qp est complet, | |i et | I2 sont équivalentes.
Il existe donc C > 1 tel que l'on ait C-1|a|i < |a|2 < C|a|i pour tout a G F. En utilisant
cet encadrement pour an, et en prenant les racines n-ièmes, cela permet de montrer, par un
passage à la limite, que |a|i = |a|2- D'où l'unicité.
On peut associer à a G F l'élément à de EndQp(F) correspondant à la multiplication par o.
Nous allons vérifier que(I25> \a\ = ||â||sp convient, où || ||sp est la norme spectrale sur EndQp(F).
On choisit une norme || ||o de Qp-espace vectoriel sur F (on peut par exemple prendre une
base ei,... ,e<£ de F sur Qp, et poser || £Ti=1 a^dlo = sup^^ |»i|P), et on note || || la norme
d'opérateur sur EndQp(F) qui s'en déduit. On a alors \a\ = lim ||ân||1/'n.
• Si o G Qp, on a ||â|| = \a\p car ||ox||o = Hp||#||o pour tout x G F, et donc ||â|| = |o|p, ce
qui fait que \a\ = ||â||sp = lim ||ân||l/n = lim |an|p/n = |o|p.
• Comme o et 6 commutent, on a ||(ô6)n|| = ||ân6n|| ^ ||ân|| ||6n|| ; on en déduit l'inégalité
|a6K|a||6|.
• De même (car |(") | < 1), on a
ll(â + 6)nH £ l|ai|||6n-iK(n + l)sup(||â|r,||6|n
on en déduit l'inégalité \a + 6| ^ sup(|a|, |6|).
• L'ensemble des u G EndQp(F) tels que p"1 ^ \\u\\ < 1 est fermé et borné; il est donc
compact puisque Qp est localement compact. Son intersection S avec l'image de F par a^à
est donc aussi compacte puisque l'image de F est fermée dans EndQp (F) car elle est complète
en tant que Qp-espace vectoriel de dimension finie. Par ailleurs, \\pnu\\ = p~n \\u\\ si n G Z et
u G EndQp(F) ; il existe donc n G Z tel que pnx G S, si x G F*.
Maintenant, l'application (u,v) h-* \\uv\\ de S x S dans R est continue; elle atteint donc
son minimum C qui est strictement positif car \\u\\ = 0 si et seulement si u = 0. On a
alors \\uv\\ ^ C||tx|| \\v\\ pour tous u,v G S. Soient alors a, 6 G F* ; il existe i, j G Z tels que
(i2^)Nous encourageons le lecteur à examiner ce que donne ce procédé pour l'extension C/R.
20. CONSTRUCTION DE NOMBRES
199
p%p>b G S et on a ||&6|| = pi+Wâtfb\\ ^ p^CWp^W \\pfb\\ = C ||â|| \\b\\. On peut appliquer
ceci à an et 6n, ce qui nous donne ||(a6)n|| ^ C||an|| ||6n||, quel que soit n G N. En prenant
les racines n-ièmes et en passant à la limite, on en déduit l'inégalité \ab\ ^ \a\ \b\. Comme on
a déjà démontré l'autre inégalité, on en déduit que \ab\ = \a\ \b\ pour tous a, 6 G F (le cas où
a = 0 ou 6 = 0, non couvert par la discussion précédente, étant trivial).
• Enfin, l'équivalence « \x\ = 0 <& x = 0 » résulte des égalités \xy\ = \x\ \y\ et |1| = 1.
• Si Qp est une clôture algébrique de Qp, alors | |p a un unique prolongement à Qp.
Compte-tenu du point précédent, cela résulte des deux propriétés suivantes de Qp :
• Qp est réunion d'extensions finies de Qp : si a G Qp, alors Qp(a) est une extension finie
de Qp contenant a.
• Si Fi,F2 sont deux extensions finies de Qp contenues dans Qp, il existe une extension
finie F de Qp, contenue dans Qp, et contenant Fi et F2 (cf. n° 8.1 du Vocabulaire).
• Si T) est une racine de l'unité d'ordre une puissance de p, alors \r\ — l|p < 1.
77 - 1 est racine du polynôme (T + l)p" - 1 dont tous les coefficients a*, pour i ^ pn - 1,
sont divisible par p et donc vérifient \ai\p < 1. Comme (77 - l)p" = - X^Lô"1 ^(77 - 1)^, on a
\q - l\f < supi^pn_1 \q - l|j,. Il s'ensuit que l'on ne peut pas avoir \q - l|p ^ 0.
Exercice 20.3. (i) Soit pn = p-l/b>-l)Pn . Montrer que |r7 — l|p = p^, si 77 est une racine primitive
pn-ième de l'unité. (On pourra raisonner par récurrence sur n, en remarquant que t] - 1 est racine du
polynôme (1+^)P~1, si n = 1.)
(ii) En déduire que Qp est une extension infinie de Qp.
• On note Cp le complété de Qp pour la norme | |p. Alors Cp est algébriquement clos.
Il s'agit de prouver que tout P G CP[X], unitaire, a un zéro dans Cp. Pour cela, on prend
Q G QP[X] dont les coefficients sont proches de ceux de P. Si a G Qp est un zéro de Q, alors
P(a) est petit, ce qui permet d'appliquer l'algorithme de Newton pour construire un zéro de P.
Le corps Cp qui est complet et algébriquement clos, est abstraitement isomorphe àC. Le seul problème
est que J. Tate (1966) a démontré que Cp ne contient pas d'analogue raisonnable de 2z7r, ce qui est un
peu ennuyeux vu le rôle joué par 2in dans le monde usuel (cf. la formule de Cauchy par exemple). Le
problème a été résolu par J.-M. Fontaine (1982) qui a construit un anneau B(|R (sa construction est assez
compliquée...), l'anneau des nombres complexes p-adiques, qui contient un 2in naturel, et qui est muni
d'un morphisme d'anneaux surjectif 0 : B(|R —> Cp dont le noyau est engendré par le 2in de Fontaine (ce
qui explique qu'on ne le voit pas dans Cp).
20.4-6. Fragments d'analyse p-adique
L'anafyse p-adique a, au moins au début, un petit côté paradisiaque quand on la
compare à l'analyse réelle (la vie serait nettement plus agréable si on disposait d'une
description de ^([0,1], R) aussi simple que celle de ^(Zp, Qp) fournie par le théorème de Mahler
ci-dessous).
Soit ^(Zp, Qp) l'ensemble des fonctions continues de Zp dans Qp. Comme Zp est
compact, une fonction continue sur Zp est bornée. Ceci permet de munir ^(Zp,Qp) de la
norme || ||oo de la convergence uniforme, définie par ||/||oo = suVxezp \f(x)\p- Une
limite uniforme de fonctions continues étant continue, l'espace ^(Zp, Qp) est complet. Par
200
VOCABULAIRE MATHÉMATIQUE
ailleurs, la norme || ||oo vérifie l'inégalité ultramétrique ||/ + #||oo ^ sup(||/||oo, \\g\\oo) ; en
effet, on a |(/ + g){x)\p ^ sup(|/(z)|p, \g{x)\p), pour tout x G Zp.
Si n G N, soit (*) le polynôme binomial, défini par
0 1 1 si n = 0
-|s(*-l)..j»-n+l) s.n>1
On a (J) = 1 et donc ||(*)||oo ^ 1. D'autre part, (J) est le nombre de manières de choisir n
objets parmi k et est donc entier. On en déduit que |(£)|p < 1, pour tout A; € N, et N étant
dense dans Zp, cela implique que |(*)|p ^ 1 quel que soit x G Zp ; d'où le résultat.
On définit la fc-ième dérivée discrète f^ d'une fonction / par récurrence à partir des
formules /l°l = / et f[k+l](x) = fW(x + 1) - f[k](x), et le fc-ième coefficient de Mahler
de / par Ofc(/) = /'fc'(0). On a aussi
/«(«) = £(-i)jÇ)/(*+k-<) et a*(/) = D-tfQ/t*-*)•
• Si A; est un entier ^ 1, alors (^ ) est divisible par p, sil^t^p* — 1.
En écrivant de deux manières la dérivée de (1 + X)p , on obtient «(^ ) = pfc(piJ"1l) ; on en
déduit la divisibilité de i(pf ) par pk et celle de (^ ) par p, si 1 ^ i < pk — 1.
• Si / e y(Zp,Qp), il existe A; e N tel que H/^IU < P~l\\f \\oo-
Comme Zp est compact, / est uniformément continue et il existe A; € N tel que l'on ait
\f(x + pk) - f(x)\p ^ p_1||/||oo, quel que soit x G Zp. Maintenant,
flp\x) = f(x+pk)-f(x)+(f^(-l)i^f(x + pk-i)) +
Tous les termes de la somme Y%=ï ont> d'après le point précédent, une norme ^ p / oo>
et (1 + (— l)p )f(x) est nul si p ^ 2 et de norme ^ p-l||/||oo si p = 2. Comme on a choisi k de
telle sorte que \f(x +pk) - f(x)\p ^ p_1|l/lloo quel que soit x G Zp, l'ultramétricité de || ||oo
implique que ||/'p l||oo < P-1|l/lloo» ce qui permet de conclure.
Théorème 20.4. (Mahler, 1958) Si f e ^(ZP,QP), alors
(i) limn^+ooon(/) = 0,
(ii) / est la somme de la série J2nZ **»(/)© ^ans ^(^p> Qp) > en particulier, pour tout
xeZp,onaZ:Z«n(f)0=f(x)7
(iii) ll/lloo=supn6N|an(/)|p.
Une utilisation répétée du point précédent permet de montrer que, si / G ^(Zp, Qp) et
si e > 0, il existe A; G N tel que ||/[p '||oo < e- Maintenant, si n ^ pfc, alors an(f) est une
combinaison linéaire à coefficients entiers des /'p '(«), avec i G N. On en déduit l'inégalité
lan(/)| ^ ||/'p '||oo si n ^ pfc, qui montre que an(f) -» 0 quand n -> +00; d'où le (i).
21. CORRIGÉ DES EXERCICES
201
Il résulte du (i), de ce que ||(*)||oo = 1, et de l'ultramétricité de || ||oo, que la série
EnïïM/)© converge dans <*f(Zp,Qp) ; notons g sa somme. Comme (*+}) - (n^) = (*),
une récurrence immédiate nous fournit la formule g^(x) = Si3an+fc(/)(î)> et on a donc
aic(g) = #'*'(()) = ûfc(/), pour tout k. En revenant à la formule donnant a>k(f) en fonction des
valeurs de / sur N, on en déduit que f(k) = g(k), pour tout k G N; comme N est dense
dans Zp et / et g sont continues sur Zp, cela implique / = g, ce qui démontre le (ii).
Enfin, ll/IU ^ supnGN |an(/)|p car / = ES M/)G) et llffllU = 1, et |an(/)|p ^ ||/||oo
car an(f) est une combinaison linéaire, à coefficients entiers des 0(fc), pour k G N. On a donc
ll/lloo ^ supnGN |an(/)|p, ce qui permet de conclure.
Remarque 20.5. On a démontré en passant que, si (an)nGN est une suite d'éléments
de Qp tendant vers 0, alors Y^=oan(n) converge dans ^(Z^Qp) vers une fonction dont
les coefficients de Mahler sont les an.
Exercice 20.6. Si X, Y sont des espaces topologiques, on dit que / : X -* Y est localement constante
si tout x G X admet un voisinage sur lequel / est constante.
(i) Montrer que / est localement constante si et seulement si {x G X, f(x) = y} est ouvert pour tout
y G Y. En déduire qu'une fonction localement constante est continue.
(ii) Quelles sont les fonctions localement constantes sur [0,1] ?
(iii) Montrer que la fonction caractéristique la+p»zp de a + pnZp est localement constante pour tous
a G Zp et n G N.
(iv) Montrer que, si </> : Zp -* Y est localement constante, il existe n G N tel que <j> soit constante sur
a + pnZp, pour tout a G Zp.
(v) Montrer que, si Y = R ou Qp, les fonctions localement constantes de Zp dans Y sont denses dans
les fonctions continues (munies de la norme de la convergence uniforme).
(vi) Construire une fonction continue surjective de Zp sur [0,1]. Quelles sont les fonctions continues
de [0,1] dansZp?
Exercice 20.7. (i) Montrer que J2t™o O^Kïï)" converge vers ^ dans Q7. (On pourra considérer la
fonction x *-> £jfj (|)n(n) et ses valeurs aux entiers.)
(ii) Quelle la somme de la série £+~ (l(?)(l)n dans R?
21. Corrigé des exercices
Exercice 1.1. (i) Si a = 0 ou 6 = 0, on a aZ n 6Z = {0} et ppcm(a, 6) = 0 puisque le seul multiple de 0
est 0. Si a ^ 0 et 6 ^ 0, alors aZ n 6Z est un sous-groupe de Z comme intersection de deux sous-groupes,
qui n'est pas réduit à 0 puisqu'il contient ab. Il existe donc m G N tel que aZnbZ = mZ. Alors m est
un multiple de a (car a G mZ) et de 6 (car 6 G mZ). Donc ppcm(a,6) | m. Réciproquement, si c est un
multiple de a et 6, alors c G aZ et c G 6Z et donc c G mZ et m | c. En particulier, m | ppcm(a, 6), et donc
m = ppcm(a,6), ce qu'il fallait démontrer.
(ii) On a a | c (resp. 6 | c) si et seulement si vp(a) ^ vp(c) (resp. vp(b) ^ vp(c))> pour tout pG^.
Donc c est un multiple de a et 6 si et seulement si vp(c) ^ sup(vp(a),vp(6)), pour tout p G &. Le plus
petit entier multiple de a et 6 est donc n^^p^M^M6)), ce qu'il fallait démontrer.
202
VOCABULAIRE MATHÉMATIQUE
Exercice 1.2. (i) Si a = 0 ou 6 = 0, on a vp(ab) = vp(a) + vp(b) car les deux membres valent +oo. Si
a £ 0 et 6 £ o, on a a = sign(a) Y[P^PVp{a\ *> = sign(6) hPe&PVp{b) et
ab = sign(a6) J] PMab) = sign(o)sîgn(6) JJ pvr>M+v^b\
On déduit de l'unicité de la décomposition en produit de facteurs premiers que sign(a6) = sign(a)sign(6)
et vp(ab) = vp(a) + vp(b), pour tout p G tP.
Maintenant, si m = inf(vp(a),vp(6)), alors pm \ a et pm | 6, ce qui implique pm \ a + 6 et donc
vp(a + b) ^ m, ce qu'on cherchait à démontrer.
(ii) Si x = §, avec oGZet6GZ-{0},on doit avoir vp(x) = vp(a) - vp(b), et il faut vérifier que cela
ne dépend pas de l'écriture choisie. Or, si ^ = f, on a ab' = 6a7 et donc vp(a) + vp(6') = vp(b) + vp(a')
et vp(a) - vp(6) = vp(a') - vp(b'), ce qui prouve que vp(x) est bien défini. De plus, si y = §, alors
vp(xî/) = t;p(ff ) = vp(ac) - t>p(6d) = vp(a) + vp(c) - vp(b) - vp(d) = vp(x) + vp(y). Enfin, si x, y G Q et
si c G N - {0} est tel que ex, cy G Z, on a vp(c(x + y)) ^ inf(vp(cx), vp(cy)) et donc
vp(c) + t>p(x + y) ^ inf(vp(c) + vp(x), vp(c) + vp(y)) = vp(c) + inf(vp(x), vp(y))>
et comme vp(c) est fini, cela permet de conclure.
(iii) Si y/2 est rationnel, il existe x G Q tel que x2 = 2. On a alors 2v2(x) = 1, ce qui est impossible
puisque V2(x) G Z.
Exercice 1.3 (i) Quitte à échanger a et 6, on peut supposer vp(à) < vp(b). Alors vp(a + b) ^ vp(a) puisque
inf(vp(a),Vp(b)) = vp(a). Par ailleurs, on a vp(a) ^ inf(t;p(a + 6),t;p(6)), puisque a = (a + b) -6, et comme
Vp(a) < vp(b), cela nous donne vp(a) ^ vp(a + 6), d'où le résultat.
(ii) On peut ordonner les a* de telle sorte que vp{a{) < vp(ai) pour tout i ^ 2. Une récurrence
immédiate utilisant le (i) montre qu'alors vp( J2i=i ai) = vp(ai)> Pour tout & (et donc aussi pour k = n).
(iii) Il existe k = [j^f ] tel que 2k ^ n < 2fc+1. Il existe alors un unique i ^ n divisible par 2fc, à
savoir 2*. Il s'ensuit que le minimum de ^2(7) est atteint une seule fois, pour i = 2fc, et vaut -k. Le (ii)
montre alors que v2(l + \ H 1- ^) = -fc ; en particulier, 1 + | H h £ n'est pas un entier.
Exercice 1.4. (i) On a n! = nï=i k et donc *>p(n!) = Z)£=i vp(*)- ^r ^ y a exactement [^] - [^r]
entiers ^ n vérifiant vp(k) = i (les multiples de pl privés des multiples de pi+1). On en déduit que
oP(n<) = EX«([£) " lïftr]) = EKlJW " (< " 1)) = ESIJU.
Maintenant, si n = ao+aipH harpr, où a* € {0,... ,p-l}, pour toutz, alors [^] = aH harpr %
et donc
+00 r r r s
i=l ^ i=l 3=i 3=1 i=l
8=1 F 3=1 V 3=0 V V
(ii) La fonction x i-» [rc] - [f ] - [|] - [|] + [^] prend des valeurs entières. Par ailleurs, elle est aussi
égale à{f} + {f} + {f}-{^},cequi montre qu'elle est périodique de période 30 et > -1 sur [0,30[;
elle est donc toujours ^ 0. L'intégralité de on = (15n)?S)?(6nïï s'en ^e<iuit en calculant la valuation
p-adique de on, pour tout p.
(iii) Comme (û+6) = ^ff, on a, d'après ce qui précède, vp((a+b)) = M<0+sPw-sp(a+6) Maintenant,
faire une retenue dans une addition revient à écrire un 'chiffre' u sous la forme 1 u — p, ce qui fait passa*
la somme des chiffres de u à 1+ u — p, et donc diminue la somme des chiffres de p - 1. On en déduit le
résultat.
21. CORRIGÉ DES EXERCICES
203
(iv) Si 1 < i < p— 1, il y a une retenue dans l'addition de i + (p-i) en base p, et donc vP((?)) = 1 et (?)
est divisible par p (cela peut se voir aussi en remarquant quep! est divisible par p alors que il et (p — i)\ ne
le sont pas car ietp-i sont < p). Ceci permet de montrer (par récurrence montante ou descendante, le cas
n = 0étant trivial) que np-n, qui est égal à(n-l + l)p-(n-l)-l = (n-l)p-(n-l)+Y,ï=î Q)(n-l)\
est divisible par p, ce que l'on voulait.
Exercice 1.5. L'ensemble ^(N) est en bijection avec {0,1 }N (on associe à X c N la suite (xfc)fceN
définie par Xk = 1 si k G X et Xk = 0 si k £ X) ; il n'est donc pas dénombrable.
L'ensemble des parties finies de N est la réunion, pour n G N, de l'ensemble des parties de {0,..., n} ;
il est donc dénombrable en tant que réunion dénombrable d'ensembles finis. En fait, on peut donner une
bijection explicite de cet ensemble sur N, à savoir l'application I »-> £\€I 2* (dans l'autre sens, n est
envoyé sur son codage en base 2).
Exercice 1.6. Si n est fixé, l'ensemble Q[X]<n) des polynômes de Q[X] de degré n s'injecte dans Qn+1 en
envoyant P = anXn H \-a0 sur (an,..., a0) ; il est donc dénombrable puisque Q l'est. On en déduit que
Q[X] = UneNQ[X]<n) est dénombrable comme réunion dénombrable d'ensembles dénombrables. Enfin,
un polynôme n'ayant qu'un nombre fini de racines dans C, l'ensemble Q est une réunion dénombrable
(d'après ce qui précède) d'ensembles finis, et donc est dénombrable.
L'ensemble des nombres transcendants n'est pas dénombrable (sinon R le serait comme réunion de
deux ensembles dénombrables) ; en particulier, il est non vide.
Exercice 1.7. Si on choisit dans chaque disque un point de la forme a + z6, avec a, 6 G Q, on obtient une
injection de I dans Q2, et comme Q2 est dénombrable puisque Q l'est, cela permet de conclure.
Exercice 1.8. (i) Soit a = infx>Xo f(x). Par définition de a, on a f(x) ^ a, si x > x0, et pour tout e > 0,
il existe xe > xq tel que f(xe) < a + e. Soit ô = xe - xq. Comme / est croissante, on a a ^ f(x) < a + e,
pour tout x G]xo,Xo + 5[, ce qui prouve que / a une limite à droite /(xq) en xo, égale à a. La limite à
gauche s'étudie exactement de la même manière (ou peut se déduire de ce qu'on vient de faire en étudiant
g{x) = -f(-x) en -x0).
Maintenant, comme / est croissante, on a f(x^) = supx<Xof(x) ^ f(x0) < infx>Xo f(x) = f(x£).
Comme / admet des limites à gauche et à droite en x0, elle est continue en x0 si et seulement si f(xâ) =
f(xo) = f(%o)> et d°nc s* et seulement si f(xû) = /(xq).
(ii) Comme / est croissante, on a /(xj) = infx>Xo f(x) = infXl>x>Xo f(x) ^ supXo<x<Xl f(x) =
supx<Xl/(x) = /(xr).
(iii) Soit x G D un point de discontinuité. On a alors f(x~) < /(x+), ce qui permet de choisir un élément
r(x) G Q dans l'intervalle ]f(x~),f(x+)[. Si x\ < X2 sont deux éléments de D, on a r{x\) < f(x+) <
f(x2) < r(x2)> ce qui prouve que x »-> r(x) est une injection de D dans Q, et Q étant dénombrable, cela
implique que D est dénombrable.
Exercice 1.9. Par construction, la suite (x(p(n))n€N est alternée; l'intersection des [#<p(n)>#<p(n+i)] (ou
[x(p(n+1),x(p(n)]) est donc un intervalle [a, 6], et il s'agit de prouver qu'il est réduit à un point pour prouver
que (x(p(n))n€N a une limite. Si ce n'est pas le cas, il existe i G N tel que Xi G [a, 6], et il existe n G N tel
que (p(n) < i < <p(n+l). Alors xi est entre x^n) et £<p(n_i), ce qui est contraire à la définition de <p(n+l).
Si la limite de (£<p(n))n€N appartient à X, alors cette limite est de la forme xu et si <p(n) < i < <p(n +1),
on aboutit, comme ci-dessus, à une contradiction avec la définition de (p(n +1). La limite n'appartient
donc pas à X.
Maintenant, si R était dénombrable, on pourrait lui appliquer ce qui précède et construire un élément
de R n'appartenant pas à R...
Exercice 1.10. Soit (Hi)iei une famille de huit dans le plan, deux à deux disjoints. Si H* est constitué des
cercles Q,i et Q,2, choisissons un point P^i (resp. P^) à coordonnées rationnelles dans le disque D^i
204
VOCABULAIRE MATHÉMATIQUE
(resp. D^2) délimité par C^i (resp. Q^). On obtient de la sorte une application de I dans Q4. Soient i ^ j
deux éléments de I. Si P^i = Pj,i, alors l'un des disques D^i et Djtï contient l'autre puisque les cercles
Q,i et Cjti sont disjoints. Quitte à permuter i et jf, on peut supposer que c'est D^i qui contient Diu
mais alors D^i contient aussi le point de contact entre C^i et C^, et donc aussi le cercle C^ tout entier
puisque Cj-,2 et C^i sont disjoints, et donc aussi le disque D^ et le point P^. Comme il ne contient
pas Pi,2 par construction, on en déduit que i »-> (P^ijP^) est injective, et comme Q4 est dénombrable,
il en est de même de I.
Exercice 1.11. L'idée est de prouver que deux tripodes disjoints ne peuvent pas être trop proches. Soient
donc Y et Y7 deux tripodes de sommets respectifs (A,B,C) et (A,,B,,C/) et de centres de gravité G
et G7. Soit r = d(G, A). Si d(A, A7), d(B, B7) et d(C, C7) sont toutes trois < §, on a aussi d(G,G7) < § et
un petit dessin montre que suivant le tiers de plan dans lequel se trouve G7, l'un des segments [G7, A7],
[G7,B7] ou [G7,C7] rencontre Y. Maintenant, soit (Yi)i£\ une famille de tripodes dans le plan, deux à
deux disjoints. Si i G I, soient Ai,Bi,Q les sommets de Y*, G* le centre de gravité de (Ai,Bi,Q) et
^ = d(Gi,Ai). Choisissons pour tout i un triplet (Pt,i,Pt,2>Pt,3) de points à coordonnées rationnelles,
avec d(Ai,Piti) < ^-, d(Bi,Piï2) < ^ et d(Q,Piï3) < *J. Il résulte de la discussion préliminaire que l'on
obtient ainsi une injection de I dans Q6, ce qui prouve que I est dénombrable.
Exercice 2.1. (i) Si xm = 0 et ym = 0, alors (x + y)2m = £ÏÏo (2™)x2m-kyh = 0 car 2m - k ou h
est ^ m, et donc x2m~~h = 0 ou yh = 0. Le résultat n'est plus vrai, en général, si x et y ne commutent pas :
les matrices ((0} q) et (? g) sont nilpotentes, mais leur somme (? J) ne l'est pas [elle est même inversible
puisque son carré est (ô ?)]•
(ii) Si a et x commutent, on montre, par récurrence sur n, que a commute à xn, et que (ax)n = anxn ;
on a donc (ax)m = 0 si xm = 0, et donc ax est nilpotent si x l'est. Le résultat n'est plus vrai, en général,
si a et x ne commutent pas : la matrice (g £) est nilpotente, mais pas (g ?) qui est égale à (io)(oo)-
(iii) C'est une traduction des (i) et (ii) puisque tout commute.
Exercice 2.2. (i) On a (^Jj) - (Xn2) = (-&£)' avec o, = ax - a2 et b = bx - 62, et donc H
est un sous-groupe de (M2(C),+). Par ailleurs H contient (à?) et (X^)(X^) = (-ïî)» avec
a = aia,2 - &i&2 et 6 = ai62 + 6iâ2, ce qui prouve que H est stable par multiplication, et donc est un
sous-anneau de M2(C). Enfin, l'inverse de (_^£) est |apj_.fep (g ""**), si (a, 6) ^ (0,0); il s'ensuit que
tout élément non nul de H a un inverse dans H, et donc que H est un corps. Il n'est pas commutatif car
(s.°i)(_°1è)^(_°1è)(j-°<)-
(ii) Si x = (_a6£), alors x2 = (^"J^ 2!jJÎ), et x2 + l = 0 équivaut à a2 - \b\2 = -1 et 6(0 +S) = 0.
Si 6 = 0, cela nous donne a = ±z, et si 6 ^ 0, cela implique que a est imaginaire pur ; donc dans tous les
cas a = ta, avec a G R. Si 6 = (3 + ry, avec (3,7, G R, on voit que x2 + 1 = 0 équivaut a2 + (32 + 72 = 1.
L'ensemble des solutions de l'équation x2 + 1 = 0 est donc en bijection avec la sphère de rayon 1 de R3 ;
en particulier, il est infini, ce qui est un peu surprenant pour une équation du second degré.
Exercice 2.3. Soit m = ppcm(a, 6). Comme a et 6 ne sont pas premiers entre eux, on a m < |a6|. Or m
annule tout élément de Z/aZ puisque c'est un multiple de a et tout élément de Z/6Z puisque c'est un
multiple de 6; on a donc mx = 0, pour tout x G (Z/aZ) © (Z/6Z). Or m n'annule pas 1 dans Z/abZ
puisque m < \ab\ n'est pas un multiple de ab.
Exercice 2.4. 4 admet 16 comme inverse dans Z/21Z ; l'équation Ax + 3 = 0 est donc équivalente à
x + 48 = 0, soit x = -48 = 3 x 21 - 48 = 15.
14x est multiple de 7 dans Z/21Z, ce que -2 n'est pas. L'équation 14x + 2 = 0 n'a donc pas de solution
dans Z/21Z.
Ux + 7 = 0 dans Z/21Z équivaut à 7(2x +1) = 0 dans Z/21Z, soit encore à 2x +1 multiple de 3 dans
Z/21Z. Les solutions sont donc 1, 4, 7, 10, 13, 16 et 19 modulo 21.
21. CORRIGÉ DES EXERCICES
205
Exercice 2.5. On a 91 = 7 x 13 et donc Z/91Z = F7 x F13, ce qui nous ramène à trouver les solutions
dans les corps F7 et F13. On remarque que 2 est racine dans F7, et comme la somme des racines vaut
-1, l'autre est -3 = 4. De même 3 est racine dans F13, et donc l'autre est -1 - 3 = -4 = 9. On est alors
confronté au problème de trouver quels sont les éléments de Z/91Z correspondant aux couples (2,3),
(2,9), (4,3) et (4,9) de F7 x F13. Pour cela, on remarque que 1 = 2 x 7 - 13, et donc que 14 = 2 x 7 a
pour image 0 dans F7 et pour image 1 dans Fi3, alors que -13 a pour image 1 dans F7 et pour image 0
dans F13. On en déduit, que si (a, 6) G Z, alors -13a +146 G Z ne dépend modulo 91 que des réductions
de a et 6 modulo 7 et 13 respectivement, et l'image de -13a + 146 dans F7 x F13 est (a, 6). Les solutions
de l'équation x2 + x + 1 = 0 dans Z/91Z sont donc -13 ■ 2 + 14 • 3 = 16, -13 • 2 + 14 • 9 = 100 = 9,
-13 - 4 + 14 • 3 = -10 et -13 • 4 + 14 - 9 = 74 = -17.
Exercice 2.6. (i) Si a est solution de l'équation x2+x+l = 0, alors -1-a aussi. Or le système d'équations
x2 + x +1 = 0 et 2x = -1 est équivalent à 2x = -1 et x(x -1) = 0. Comme Fp est un corps, x(x -1) = 0
équivaut à x = 0 ou x = 1, ce qui est incompatible avec 2x = -1, sauf si 2 • 1 = -1, c'est-à-dire si 3 = 0,
et donc si p = 3. On en déduit que, si p ^ 3, l'équation x2 + x + l = 0& deux solutions dans FP si et
seulement si elle en a au moins une.
(ii) D'après le (i), si p ^ 3, l'équation x2 + x + l = 0& deux solution modulo p, s'il existe n G N tel
que p divise n2 + n + 1. Supposons, par l'absurde, que l'ensemble desp vérifiant ceci est fini. Cela signifie
qu'il existe des nombres premiers Pi, • • • ,Pfc tels que pour tout n G N, il existe ai,... ,a& G N tels que
n2 + n +1 = p\l • • • p%k. Si n < X -1, cela implique que n2 + n +1 ^ X2, et donc que chacun des a* vérifie
ai ^ ^gpT ^ ïôlN l°êX; on en déduit que n2 + n + 1 peut prendre au plus (j^ logX)* valeurs pour
n < X - 1, ce qui est absurde pour X tendant vers +00, les valeurs de n2 + n + 1 étant toutes distinctes
pour n ^ 0.
(iii) Il existe un ensemble infini {pi,P2,...} de nombres premiers tels que l'équation x2 + x + 1 = 0 ait
deux solutions dans Fp. Soit D& = pi • • -p/.. D'après le théorème des restes chinois, Z/D&Z = 11*= 1 *Vt>
et comme l'équation x2 + x + l = 0a deux solutions dans Fp., pour tout i, elle en a 2k dans Z/D^Z.
Comme 2k peut être rendu arbitrairement grand, cela permet de conclure.
Exercice 2.7. Si cet ensemble est fini, constitué de pi,... ,pr, tous les diviseurs de 4pi • • -pr - 1 sont de
la forme 4n + 1, ce qui conduit à une contradiction en regardant modulo 4.
Exercice 2.8. (i) Si p?1 • • •#- ^,onaa^ g*. On en déduit que |X(pi,... ,pr,x)| < 1^^,
ce qui permet de conclure.
(ii) Si p | (4fc2 + 1), alors p est impair, et -1 = (2A;)2 dans Fp. Comme ap~l = 1 pour tout a G F*
(petit th. de Fermât), on en déduit que (-IJCp-1)/* = {2k)p~l = 1, et donc que ^ = 2n et p = An + 1.
(iii) Si cet ensemble est fini, constitué de pi,... ,pr, l'ensemble S(x) des 4&2 + 1, avec k < \\/x - 1
est inclus dans X(pi,... ,pr,x). Or ceci est absurde puisque |X(pi,... ,pr,x)\ = 0(logr x), d'après le (i),
alors que |S(x)| ~ \y/x.
Exercice 2.9. Les éléments inversibles de Z/pnZ sont en bijection avec les éléments de {0,1,... ,pn - 1}
qui sont premiers àpn. Or être premier àpn est équivalent à être premier àp d'après le lemme de Gauss
et donc aussi à ne pas être divisible par p, puisque p est premier. Comme il y a pn~l multiples de p dans
{0,1,... ,pn - 1}, on en déduit que |(Z/pnZ)*| = pn - p71""1.
Maintenant, si D ^ 2 est quelconque, on peut factoriser D sous la forme D = Ilp|DPnp> avec nv ^ 1»
et le théorème des restes chinois nous dit que l'anneau Z/DZ est isomorphe à IIpiD^/P71''^)- ^n a ^onc
(z/dz)* = nP|D(z/pnpZ)*>ce qui nous donne
^(D)=n(pnp-pnp"i)=Dri(1-^
p|D p|D P
206
VOCABULAIRE MATHÉMATIQUE
Exercice 2.11. (i) Si vi = (xi,yi) et v2 = (£2,3/2) engendrent la même droite, il existe a € K* tel que
v2 = avi, et on a Xfo) = JJ = Jgj- = J}- = A(vi), ce qui prouve que A(v) ne dépend que de la droite
engendrée par v, et donc que À induit une application de P*(K) dans K U {00}. Cette application est
injective car « A(vi) = A(v2) » équivaut à « xiy2 = x2yi », et donc « à v\ et v2 colinéaires ». Elle est
surjective car (1,0) s'envoie sur 00 et (2,1) sur 2, si z € K. C'est donc une bijection.
(ii) Soit z € K U {00}, et soit v = (x,y) tel que | = A(v) = z. Alors, par définition, (j| J) • z =
a((î5) •»)-*<«+»».« + *>-^ = S3-
Exercice 2.13. (i) Une isométrie u du carré permute ses sommets et laisse fixe son centre de gravité O.
En particulier u est linéaire et est déterminée par l'image de deux points non colinéaires avec O, par
exemple A et B. L'image de A doit appartenir à {A, B, C, D}, et comme l'angle {tx(A), O,u(B)} doit être
un angle droit, cela ne laisse que deux possibilités pour u(B) pour chaque choix de u(A). On en déduit que
D4 a au plus 8 éléments. Comme il contient l'identité id, la symétrie -id par rapport à O, les rotations
/9+ et p~ de centre O et d'angles respectifs \ et ^p, les symétries cta,c et ctc,d par rapport aux deux
diagonales, et les symétries an et ay par rapport aux droites horizontale et verticale, on voit que D4 a
exactement 8 éléments qui sont ceux que nous venons d'énumérer.
(ii) S est de toute évidence stable par D4, et il y a deux orbites :
• O est fixe par tout élément de D4 ; son orbite est donc {0} et son stablisateur est D4 ;
• on passe de A à B, C et D en itérant p+, ce qui montre que l'orbite de A est {A, B,C, D} (elle ne
peut contenir O puisque les orbites sont distinctes), et on détermine par inspection que le stabilisateur
de A est le groupe à 2 éléments {id,<7A,c}-
(iii) Les orbites de T sous l'action de D4 sont au nombre de 3 :
• l'orbite de {O, A} consiste en les 4 paires contenant O (on passe de {O, A} aux autres en itérant p+),
et le stabilisateur de {O, A} est {id,<7A,c} ;
• l'orbite de {A, B} consiste en les 4 paires de sommets consécutifs (on passe de {A, B} aux autres en
itérant p+), et le stabilisateur de {A,B} est {id,ay} ;
• l'orbite de {A, C} consiste en les 2 paires de sommets oppososés {A, C} et {B, D}, et le stabilisateur
de {A,C} est {id, -id,<7A,c,<7B,D}.
(iv) On remarque que dans tous les cas, le produit du cardinal de l'orbite par celui du stablisateur
d'un de ses éléments est 8 = |D4| ; il s'agit d'un cas particulier d'un théorème général (si G opère sur X, si
x e X, et si Gx est le stabilisateur de x, alors l'orbite Ox est isomorphe à G/Gx, et donc |Ox| = |G|/|GX|).
Exercice 2.14. (i) Les conditions g • x = x et hgh~l • (h • x) = h • x sont équivalentes. Il en résulte que
x »-> h • x induit une bijection de X^ sur Xhgh-i, ce qui répond au (a). Le (b) s'en déduit puisque si g
et g' sont conjugués dans G, il existe h tel que g' = hgh~l et donc x »-> h • x induit une bijection de X^
sur Xgf qui, de ce fait, ont le même nombre d'éléments.
(ii) L'ensemble V^ des points fixes de g est l'espace propre associé à la valeur propre 1 ; c'est donc un
sous-espace vectoriel de V. Par ailleurs, si g' = hgh"1, alors x »-> h • x induit une bijection de V^ sur Vg*
qui est linéaire puisque G opère linéairement. On en déduit que si l'un des deux espaces est de dimension
finie, alors l'autre aussi et les deux dimensions sont les mêmes.
Exercice 3.3. 108 = 22 x 33, et donc (Z/108Z)* 9* (Z/4Z)* 0 (Z/27Z)*. Or (Z/4Z)* = {±1} est
isomorphe à Z/2Z, et (Z/27Z)* est un groupe de cardinal <p(27) = 2 • 9 qui est donc isomorphe à
(Z/2Z)0(Z/9Z) ou à (Z/2Z)0(Z/3Z)0(Z/3Z). Dans le second cas, tout élément de (Z/27Z)* vérifierait
x6 = 1, or 26 = 64 ? 1 dans (Z/27Z)*. On a donc (Z/27Z)* s (Z/2Z) 0 (Z/9Z) et (Z/108Z)* &
(Z/2Z)20(Z/9Z).
200 = 23 • 52, et donc (Z/200Z)* 9* (Z/8Z)* 0 (Z/25Z)*. Or (Z/8Z)* est un groupe d'ordre 4 dans
lequel tout les éléments sont d'ordre 2 (en effet, l2, 32, 52 et 72 sont congrus à 1 modulo 8) ; il est
21. CORRIGÉ DES EXERCICES
207
donc isomorphe à (Z/2Z)2. Par ailleurs, Z/25Z)* est un groupe de cardinal <p(25) = 4 • 5 qui est donc
isomorphe à (Z/4Z) © (Z/5Z) ou à (Z/2Z)2 © (Z/5Z). Dans le second cas, toute puissance 5-ième serait
d'ordre 2, or 25 = 32 = 7 a un carré égal à 49 = -1 ^ 1, et donc (Z/25Z)* & (Z/4Z) © (Z/5Z) et
(Z/200Z)* Sf (Z/2Z)2 © (Z/4Z) © (Z/5Z).
La solution ci-dessus est un peu artisanale ; on peut aller plus vite en utilisant les résultats de l'ex. 3.5.
Exercice 3.4. (i) Soit ©PG.^(©t(Z/papiZ)) la décomposition de K* fournie par le th. 3.1. Si K* n'est
pas cyclique, il existe p tel que av^ ^ 0; en effet, sinon on aurait K* = Z/DZ, où D = npPap,I>
d'après le théorème des restes chinois, et K* serait cyclique. Mais alors l'équation xp = 1 a au moins p2
solutions dans K [les éléments de (pa^1~lZ/pa^1Z) © {pa»>2~lZ/pa»>2Z)\, ce qui est impossible dans un
corps commutatif.
(ii) Il résulte du (i) que le groupe F* est isomorphe à Z/(p - 1)Z (l'isomorphisme envoie l'élément
neutre 1 de F* sur celui de Z/(p - 1)Z, à savoir 0). Via cet isomorphisme, l'ensemble des carrés devient
2Z/(p - 1)Z. Soit alors x G Z/(p - 1)Z, et soit x G Z ayant pour image x modulo p — 1. On a les
équivalences : « x G 2Z/(p - 1)Z »^«ie2Z»^ « ^x e(p- 1)Z » <& « ^x = 0 ». On en déduit
le résultat.
(iii) On a (—l)^"1)/2 = 1 dans F* si et seulement si p est de la forme 4n+1, ce qui permet de conclure
en utilisant le (ii).
(iv) Si a2 + b2 = p et si p | a, alors p | b2 = p - a2, et donc p | 6 et p2 | p, ce qui est absurde. On
en déduit que a et 6 sont premiers à p, et donc que leurs réductions â, 6 modulo p appartiennent à F*.
Soit x = cTlb G F*. En réduisant modulo p la relation a2 + b2 = p, on obtient â2(l + x2) = 0, et donc
1 + x2 = 0 puisque â G F*. Comme ceci est en contradiction avec le (iii), cela permet de conclure.
Exercice 3.5. (i) On a (l+pka)p = 1 +pk+1a + &^p2ka2 + p3ha3 ( £?=3 ©(p^a)^). Dans cette
somme, tous les termes sauf les deux premiers sont divisibles par pfc+2, si k ^ 1 (ou si k ^ 2, dans le
cas p = 2, où SiSzJl n'est pas divisible par p). On a donc bien x = 1 + ph+la mod pfc+2, dans les cas
considérés, et une récurrence immédiate montre que (1 +p)pn~ = 1 +pn_1 ^ 1 dans Z/pnZ, si p ^ 2 et
n ^ 2, et que (1 + 4)*>n~3 = 1 + 271"1 ^ 1 dans Z/2nZ, si n > 3.
(ii) Supposons p impair. Alors N est le sous-groupe image de 1 +pZ dans (Z/pnZ)*, qui est de cardinal
p71"1 (car x h-* 1 +px induit une bijection de Z/pn-1Z sur 1 +pZ modulo pnZ). Comme (1 +p)pn~2 ^ 1
dans (Z/pnZ)*, dans la décomposition ©$(Z/paiZ) du groupe N (dont le cardinal est une puissance dep),
au moins un des ai est ^ n - 1, et donc N = Z/pn~lZ. Le cas p = 2 se traite de la même manière.
(iii) La réduction modulo p fournit une surjection n : G = (Z/pnZ)* -> F*, et F* est un groupe
isomorphe à (Z/(p - 1)Z) d'après l'ex. 3.4. Comme p - 1 et p71"1 sont premiers entre eux, il résulte du
th. 3.1, que Gp = N ^ Z/pn~lZ et que G est de la forme {Z/pn~lZ) 0 G7, avec G7 = e^pG£. Alors
G/N = G7, et comme G/N = F* par définition de N et subjectivité de 7r, cela permet de conclure.
(iv) Le groupe (Z/2nZ)* est de cardinal Z/2n"1Z, et contient les sous-groupes N et {±1} dont
l'intersection est nulle. Ceci implique que N et {±1} sont en somme directe, et comme |N| • |{±1}| = |(Z/2nZ)*|,
cela prouve que (Z/2nZ)* = N0{±1}, ce qui permet de conclure puisque N ^ Z/2n"2Z et {±1} ^ Z/2Z.
Exercice 3.6. Comme |F*| = p - 1, on a xp~~l = 1 pour tout x G F* d'après le théorème de Lagrange.
On en déduit que xp = x pour tout x G Fp, ce qui se traduit, en remontant dans Z, par p\np — n, pour
tout n G Z.
Exercice 3.7. (i) Si 0 G X, alors (g • (h • 0))(x) = (h • 0)(x + g) = 4>{{x + h) + g) = <f>(x + (g + h)) =
((9 + h) • 4>){x), pour tout x G Zp/pZp. On en déduit que g • (h • 0) = (g + h) • 0, pour tout <f> G X, ce qui
prouve que l'on a bien affaire à une action de groupe.
(ii) Les points fixes sont les fonctions constantes : si g • 0 = 0, pour tout g G Z/pZ, évaluer en 0 donne
0(#) = 0(0), pour tout g G Z/pZ. Il y a n telles fonctions.
208
VOCABULAIRE MATHÉMATIQUE
(iii) Le cardinal d'une orbite divisant celui du groupe, il est égal àp si l'orbite n'est pas réduite à un
point.
(iv) Le cardinal de X est np et comme il y a n orbites réduites à un point, cela laisse np — n éléments qui
se répartissent en orbites à p éléments ; il en résulte que ^^^ est entier puisque c'est le nombre d'orbites
à p éléments.
Exercice 3.8. (i) C'est l'ensemble des parties àp éléments de {1,... ,n}.
(ii) Le stabilisateur de {l,...,p} est l'ensemble des permutations de {l,...,n} qui permutent les
éléments de {1,... ,p} et ceux de {p + 1,..., n} ; il est donc isomorphe à Sp x Sn_p et son cardinal est
p\(n-p)\.
(iii) Le cardinal d'une orbite est le quotient du cardinal du groupe par celui du stabilisateur d'un de
ses éléments (cf. n° 3.3) ; en appliquant ceci à l'orbite de {1,... ,p} sous l'action de Sn, on obtient le fait
que le cardinal de l'ensemble des parties àp éléments de {1,... ,n} est pu^'\\•
Exercice 3.9. On obtient le 5-cycle (1,2,3,4,5).
Exercice 3.10. La démonstration se fait par récurrence sur n. Le résultat est trivial si n = 2. Soit
n ^ 3, et soient a G Sn, et a = a(n). Si a ^ n, alors a1 = (n - l,n) • • • (a,a + l)a fixe n, et est
dans le sous-groupe engendré par (1,2), (2,3),..., (n - 2, n - 1) d'après l'hypothèse de récurrence. Donc
o = (a, a + 1) • • • (n - 1, n)a' est dans le sous-groupe engendré par (1,2), (2,3),..., (n - 1, n). Si a = n,
alors a est déjà dans le sous-groupe engendré par (1,2), (2,3),..., (n - 2,n - 1), ce qui prouve que le
sous-groupe engendré par (1,2), (2,3),..., (n - 1, n) est Sn.
Exercice 3.11. Comme les r* commutent deux à deux, on a on = rj1 • • -r™, et comme les rf sont à
supports disjoints, on a on = 1 si et seulement si r/1 = 1 pour tout i. On en déduit que l'ordre de a est
le ppcm des ordres des r*, et comme Ti est d'ordre ^, l'ordre de a est le ppcm des li%
Exercice 3.12. (i) Choisir un cycle de longueur k revient à choisir les k éléments (n choix pour le
premier,..., n - k + 1 pour le dernier), en tenant compte du fait que les k permutations circulaires des
éléments donnent le même cycle ; il y a donc \(n(n -l)--(n-fc + l)) cycles de longueur k.
(ii) Soit r = (ti,...,t*) un cycle de longueur k. Alors r apparaît dans la décomposition de a si et
seulement si la restriction de <r à {ii,...,%} est r, et a peut permuter les autres éléments comme il veut,
et donc r apparaît dans la décomposition de (n - k)\ permutations.
Maintenant, le nombre total de cycles apparaissant dans les permutations de Sn est aussi la somme
pour chaque cycle du nombre de permutations dans lequel il apparaît. Ce nombre total est donc, d'après
ce qui précède, égal à HJ=1 \(n(n - 1)... (n - k +1)) • (n - fc)! = n!(l + \ H + £), et le nombre moyen
de cycles est 1 + \ H h £ qui tend bien vers +oo.
Exercice 3.14. Si T\.. .rr est la décomposition de a en cycles (en incluant les cycles de longueur 1), et
si Ti est de longueur £iy alors v(a) = r, X^ï=i U = n et
sign(a) = nsignto) = IK-1)^-1 = (-l)n"r = (-irw.
Exercice 3.15. (i) On a uaT(ei) = ear(i) = ea(r(i)) = ua(eT^) = ua(uT(ei)), ce qui prouve que les
endomorphisme uaT et uauT coïncident sur la base canonique, et donc sont égaux. De plus, l'image de
la base canonique est une base (vu que c'est la base canonique à l'ordre près) ; ua est donc élément
de GLn(C) et a h-* ua est un morphisme de groupes de Sn dans GLn(C).
(ii) Si r est la transposition (z, j), alors uT est la symétrie par rapport à l'hyperplan engendré par ^L^L
et les e£, pour £ £ {hj}, de direction la droite engendrée par £L^i. Ceci implique que uT a n - 1 valeurs
propres égales à 1 et une égale à -1 et donc dettxr = -1.
21. CORRIGÉ DES EXERCICES
209
(iii) Comme det : GLn(C) —> C* est un morphisme de groupes, l'application g h-* dettxa est un
morphisme de groupes. Par ailleurs, il ressort du (ii) que l'on adettxa = -1 = sign(a), si a est une
transposition, et comme les transpositions engendrent Sn, cela implique que les deux morphismes de
groupes a h-* detua et a ^ sign(a) coïncident sur Sn.
Exercice 3.16. (i) D'après le théorème de structure, G est isomorphe à une somme directe ©^(Z/p^Z),
où les pi sont des nombres premiers (pas forcément distincts). On a alors |G| = Yl^iPi1, et si d divise |G|,
on peut trouver des entiers 6$, avec bi ^ a*, tels que d = llteiPi'- Comme Z/p?'Z est cyclique, et comme
p6i|paS le groupe Z/p^Z contient un sous-groupe H* d'ordre p6i, et ©ieiHi est un sous-groupe de G de
cardinal d.
(ii) Comme |A5| = 60 > 6 = IS3I, la restriction de / à A5 n'est pas injective, et comme A5 est simple,
cela implique que /(A5) = {id}, et donc que / se factorise à travers S5/A5. Comme le cardinal de S5/A5
est 2, l'image de / a 1 ou 2 éléments.
(iii) Soit H un sous-groupe de S5 d'ordre 40, et soit X = S5/H. Alors |X| = |S5|/|H| = 3. Par ailleurs, S5
agit sur X par translation à droite, et permute les éléments de X. On en déduit l'existence d'un morphisme
de groupes de S5 dans Perm(X) = S3 dont l'image a au moins 3 éléments. Ceci étant en contradiction
avec le (ii), cela prouve que H n'existe pas.
Exercice 3.18. (i) Comme Z/pZ est engendré par 1, il suffit de vérifier que x0'"Xp^i = 1 implique
xi • • -Xp-iXo = 1, ce qui se démontre en multipliant la première relation à gauche par Xq1 et à droite
par Xo. Un point fixe de cette action est de la forme (2,... ,g) et son appartenance à X se traduit par
xp = 1 ; les points fixes sont donc en bijection avec les éléments de G d'ordre divisible par p.
(ii) La condition xo • • • xp-i = 1 peut se réécrire sous la forme xq = x'^ • • • xïl ; on en déduit que
(#0,• • • >xp-i) *~* (#i>• • • ,xp-i) induit une bijection de X sur Gp_1 et donc que |X| = |G|P_1. Comme
p divise |G| par hypothèse, il divise aussi |X|. Maintenant, X est la réunion disjointe des orbites sous
l'action de Z/pZ, et comme le cardinal d'une orbite divise celui du groupe, ces orbites ont pour cardinal
1 ou p. Comme |X| est divisible par p, le nombre d'orbites de cardinal 1 est divisible par p, et comme il
y en a au moins une, à savoir (1,..., 1), il y en a au moins p. Les orbites de cardinal 1 étant en bijection
avec les éléments de G d'ordre divisible par p, et comme un tel élément est d'ordre p s'il n'est pas égal
à 1, cela prouve que G contient des éléments d'ordre p.
Exercice 4.1. (i) K et A sont clairement stables par addition, passage à l'opposé, et multiplication. Ce
sont donc des sous-anneaux de C. De plus, l'inverse de x + iy est x2+ya (x - iy) qui appartient à K, si
%>y G Q ; il en résulte que K est aussi stable par passage à l'inverse et donc est un sous-corps de C.
(ii) On a N(z) = |z|2, et le résultat suit de ce que \ziZ2\ = \zi\ \z2\ (on peut aussi vérifier le résultat en
développant).
(iii) Si u G A*, et si v est son inverse, on a N(tx)N(v) = N(uv) = 1. Comme N(tx) et N(v) sont des
entiers ^ 0, cela implique que N(u) = 1. Réciproquement, si N(tx) = 1, alors uû = 1 et donc u est
inversible, d'inverse û. Enfin, si x,y G Z vérifient x2 + y2 = 1, alors l'un des deux vaut 0 et l'autre ±1, et
donc A* = {1,-1,z,-z}.
(iv) On a N(r) = N(6)N({f}), et comme N({*}) ^ \ + \ = ±, pour tout z G C, on en déduit que
N(r) ^ |N(6) < N(6). Soit c = [f]. Alors c G A par construction, et c + £ = §, ce qui nous donne
a = bc + r, et prouve que r = a - bc G A. D'où le résultat.
(v) Soient I un idéal de A et 6 G A+ ni tel que N(6) réalise le minimum des N(x), pour x G I - {0}. Si
a G I, on peut, d'après le (iv), écrire a sous la forme a = 6c+r, avec N(r) < N(6). Mais alors r = a-bc G I,
et la définition de 6 implique r = 0. Il en résulte que I est l'idéal principal engendré par 6. Ceci permet
de conclure.
210
VOCABULAIRE MATHÉMATIQUE
Exercice 4.2. (i) A contient 1, est stable par addition car (a+byf^)+(a'+b' yf^) = (a+a/)+(6+6/)v^5
et par multiplication puisque (a + by/^h){a' + b'yf^) = (aaf - 566') + (a'b + ab^yf^h. C'est donc un
sous-anneau de C.
(ii) Si a = a + by/^ divise 2, alors \a\2 = a2 + 562 divise |2|2 = 4, et donc 6 = 0 et a G {±1, ±2}. n
s'ensuit que 2 = a(3 implique a = ±1 ou (3 = ±1, ce qui prouve que 2 est irréductible.
(iii) Si (2,1 + y/^b) = (a), alors a divise 2, et donc a = ±1 ou a = ±2. Le second cas n'est pas
possible car ±2 ne divise par 1 + v/^5, et le premier non plus car un élément a + by/^b de (2,1 + v^5)
vérifie a = b mod 2, ce qui n'est pas le cas de ±1. On en déduit que (2,1 + y/^b) n'est pas principal.
Maintenant, 1 + y/^b n'est pas divisible par 2 alors que (1 + y/^b)2 = -4 + 2y/^ l'est. Il s'ensuit
que (2) n'est pas un idéal premier.
Exercice 4.3. Si P G A[X]*, alors <p(P) G K[X]* = K* ; la condition est donc nécessaire. Réciproquement,
si <p(P) = a G K*, on peut écrire P sous la forme P = a + eQ, avec Q G K[X], et alors P est inversible
d'inverse a"1 - a~2eQ car e2 = 0.
Exercice 4.4. (i) Que Z n (q) soit un idéal de Z est immédiat. Soient a, 6 G Z tels que a& G Z n (ç).
Comme (q) est un idéal premier de A, on a a G (q) ou 6 G (#), et donc a G Z n (q) ou 6 G Z n (q), ce qui
prouve que Z n (ç) est un idéal premier de Z. Notons p l'élément de & correspondant. L'appartenance
de p à Z n (q) se traduit par la divisibilité de p par q dans A ; on en déduit que p est l'unique élément de
& divisible par q dans A. Enfin, N(ç) divise N(p) = p2 et n'est pas égal à 1 sinon q serait inversible; il
ne reste donc que N(q) = p et N(q) = p2 comme possibilités.
(ii) Si N(ç) = p G S? et si ç = a&, on a N(a)N(6) = p, et donc N(a) = 1 ou N(6) = 1 ; il en résulte que
a ou 6 est inversible, et que a 6 (?) ou 6 6 (q). L'idéal (q) est donc premier.
(iii) Comme a est de la forme 4n + 1, l'équation x2 + 1 = 0 a une solution dans Fp, et il existe
xG{l,...,p-l}tel que x2 + 1 soit divisible par p. Alors a = x + i vérifie les conditions demandées.
Maintenant, soit ^n^ ^a factorisation de a en produit de facteurs premiers dans A. Alors N(a) =
El N(<fc)> et comme p | N(a), il existe i tel que p | N(ç$), ce qui, d'après le (i) implique que <fo divise p dans A.
Il en résulte que &|pgcd(a,p), et donc que 6 = pgcd(a,p) n'est pas inversible. De plus, N(6) < N(a) < p2,
et comme N(6)|p2, cela implique que N(6) = p. Le (ii) montre alors que 6 est premier, ce qui permet de
conclure.
(iv) D'après le (iii), il existe q G ^a divisant strictement p, ce qui implique N(q) = p. Il n'y a plus
qu'à écrire q sous la forme x + iy, avec x, y G Z, pour obtenir une écriture de p = x2 + y2 comme somme
de deux carrés.
(v) Si p G & impair n'est pas premier dans A, et si q = x + iy est un diviseur premier de p, on a
N(#) = p. Or N(q) = (-i)qq*> et N(g*) = N(q) puisque q* = y + zx. D'après le (ii), cela implique que
q* G ^a et donc que la factorisation de p est (-i)qq*. Enfin, comme p est impair, on a x ^ y, et on
peut, quitte à échanger les rôles de q et q*, supposer que x > y et poser qp = q.
(vi) Voir la solution du (iv) de l'ex. 3.4.
(vii) D'après le (i), les éléments de ^a sont les diviseurs premiers des éléments de &. Le résultat est
donc une combinaison des (v), (vi) et de ce que la factorisation de 2 est 2 = (-z)(l + i)2.
Exercice 4.5. (i) La nullité de A implique, car A est premier à B, que A divise A7 (lemme de Gauss), ce
qui n'est possible que si A7 = 0, et donc si A est constant. De même, cette nullité implique que B et C
sont constants, ce qui est contraire à l'hypothèse. On en déduit que A ^ 0 ; l'inégalité est alors évidente,
(ii) Si z est un zéro de ABC, alors c'est un zéro d'un seul des polynômes A, B ou C puisque ceux-ci sont
premiers entre eux. On peut donc, sans nuire à la généralité, supposer que c'est un zéro de multiplicité
mz ^ 1 de A. Sa multiplicité comme zéro de A7 est alors mz - 1, et comme B ne s'annule pas en z, sa
multiplicité comme zéro de AB7 - BA7 est exactement mz - 1.
21. CORRIGÉ DES EXERCICES
211
(iii) On déduit du (ii) que A est divisible par le produit des (T-z)m*~l, où z parcourt les zéros de ABC,
ce qui nous fournit l'inégalité deg A ^ J2(rnz -1)> et comme J2mz = deg ABC = deg A + deg B + deg C
et Y^z * = r(Q) (P31' définition de r(Q)), on obtient deg A ^ deg A + degB + degC - r(Q). Le résultat
demandé s'obtient alors en comparant cette inégalité avec celle du (i).
(iv) Supposons que An + Bn = Cn, et que A,B,C ne sont pas tous constants. Comme les zéros de
AnBnCn sont ceux de ABC, on déduit du (iii) l'inégalité r(ABC) > nsup(deg A, degB, deg C), ce qui est
absurde, si n ^ 3, car r(ABC) < deg ABC = deg A + deg B + deg C.
Exercice 4.6. (i) On peut utiliser les polynômes d'interpolation de Lagrange pour écrire Q sous la forme
££=0 Q(^t) rif^t xr=^:> et obtenir F = Y^=o fi. Q(a--a )x^Â7' ^n Peut aussi clire ^ue la décomposition
en éléments simples de F est de la forme X^?=o x^7 Pour ^es raisons de degré, multiplier les deux côtés
par X - Xi et évaluer le tout en X = À$ pour obtenir a$.
(ii) Si degQ = d, alors Q(X) = £jL0 Q[il(A)(X - \)\ d'après la formule de Taylor pour les polynômes.
On en déduit que la décomposition en éléments simples de (^*L est R + J27=o rx-ffl-* » où R =
lt„QW(A)(X-A)'-»€K[XI.
(iii) Comme K est algébriquement clos, on peut écrire F sous la forme unr=i(x ~~ ^t)feS où t* G K*,
les Xi G K sont distincts deux à deux et les ki sont des entiers relatifs. Alors Ç = Ya=i x^T> et cette
identité fournit la décomposition de ^r en éléments simples.
(iv) Soient z\,... ,2r les zéros de P, et soit m* la multiplicité de Z{. Si z est un zéro de P' distinct
des Zi (le résultat est clair si z est l'un des Zi), alors 0 = ^>& = Ya=i j^Ti' $i z était à l'extérieur de
l'enveloppe convexe des z^ il existerait 0 G [-7r,7r] tel que Im(e~~ie(z - Zi)) > 0 pour tout i. Mais alors
Im(e^^r) < 0 pour tout z, ce qui contredit la relation YH=\ T=z~ = °-
Exercice 4.7. Commençons par remarquer que le changement de variable ci-dessus n'augmente pas le
degré total de P; on a donc degXn Ptlt...,tn-i ^ degPtli...|tn_1 < degP = d. Soit Q la partie homogène
de degré d de P. Le coefficient de X^ dans P^,...,^^! est R(*i,... ,£n-i) = Q(*i>-• • >*n-i> 1)> et on a
Q(Xi,...,Xn) = X^R(^-,. ..,^^-), ce qui prouve que R ^ 0. Comme K est infini, on peut donc
trouver ii,..., £n_i G K, tels que R(*i,..., £n-i) ¥" 0> ce Qui permet de conclure.
Exercice 4.9. (i) L'expression X^=i ai est un polynôme symétrique, à coefficients dans Z, en ai,..., an ;
c'est donc un polynôme à coefficients dans Z en les coefficients de P qui sont rationnels par hypothèse ;
d'où le résultat.
(ii) Les coefficients de nr=i(^ - ®i) sont des polynômes symétriques, à coefficients dans Z, en
ai,..., an. On peut donc conclure comme dans le (i).
Exercice 4.10. (i) On reconnaît dans le membre de droite Ç, où P = nr=i(X - X*) ; la formule résulte
donc de ce que ^- = ^ + £.
(ii) On multiplie les deux membres par X et on fait le changement de variable X = ^. Le membre
de droite devient n~(^g^ = n + i-x£t^S^S^+-• tandis que celui de ëauche devient
EILi îztx7 = E?=i èt=oThXi = Efc3Tfcs* 5 d'où l'identité cherchée. Un développement limité nous
donne alors S2 = £? - 2E2 et S3 = £? - 3EiE2 + 3E3.
(iii) Si Ai,..., Àn sont les valeurs propres de M, comptées avec multiplicité, on aTr(Mfc) = Sfc(Ài,..., Àn).
L'hypothèse équivaut donc à Sfc(Ài,... ,Àn) = 0 pour tout k ^ 1, et les (i) et (ii) montrent que ceci
implique que Ç = ^, si P = ri^=1(X - À$). On en déduit la nullité des À$, ce qui permet de conclure.
Exercice 4.11. (i) Le polynôme R = ]l(tj)€ixj(x " ai " Pi) e z(x> a<>/^> (m) G I x J] est symétrique
en les fij (et les a$), et donc est un polynôme à coefficients dans Z[X,a$, z G I] (symétrique en les a$)
en les coefficients de Q qui sont des entiers par hypothèse; c'est donc un élément de Z[X,ai, i G I]
(symétrique en les a*), et comme il est symétrique en les a*, c'est un polynôme à coefficients dans Z[X]
212
VOCABULAIRE MATHÉMATIQUE
en les coefficients de P. Comme les coefficients de P appartiennent à Z, on en déduit que R G Z[X], et
comme R est unitaire et admet a + /? comme racine, cela prouve que a + (3 est un entier algébrique. Le
raisonnement est le même pour a(3 en partant du polynôme E[(tj)eix.j(x ~~ ai@j)-
(ii) Le fait que l'ensemble des nombres algébriques soit un anneau est une conséquence directe du (i). I]
ne contient pas \ car on ne peut pas avoir (±)n = an_i(\)n~ H h a0, avec a0,..., an_i G Z, puisque
la valuation 2-adique du membre de gauche est -n, et celle du membre de droite est ^ 1 - n.
Exercice 4.12. Si Pi,...,Pm engendrent In, alors a fortiori Pi,...,Pm engendrent In/In+i qui est
un K-espace vectoriel de dimension n + 1 (les images de Xn, YXn_1,..., Yn en sont une base). Or Ix
tue In/In+i ; il s'ensuit que l'application (Qu..., Qm) »-► YhLi Q*p* de K[X, Y]m dans In/In+i se
factorise à travers (K[X,Y]/Ii)m = Km, et est K-linéaire. Comme elle est surjective par hypothèse, la
dimension m de l'espace de départ est ^ n + 1, ce qu'il fallait démontrer.
Exercice 5.1 (i) La linéarité de la dérivation et de l'intégration sont des résultats de base.
(ii) On&uov = id (th. fondamental de l'analyse). On en déduit que (vou)o(vou) = vo(uov)ou = vou,
et donc que v o u est une projection. En fait, (v o n)(0) est la fonction x h-» <£(#) - 0(0), et donc v o u est
la projection sur les fonction nulles en 0 parallèlement à l'espace des fonctions constantes.
Exercice 5.2 (i) On a s(s(<f>))(x) = s(0)(-a;) = <f)(x), et donc s o s = id. Comme s est linéaire, c'est une
symétrie.
(ii) Une fonction <j> est paire si s{(j>) = $ et impaire si s(0) = -0; l'existence et l'unicité de la
décomposition <f> = 0+ + <f>~~ est donc un cas particulier de la théorie générale. On a <f>+ = *+*M et
(f>- = *=JÎÛ, ce qui se traduit par 0+(s) = »<*)+2»<"a) et 4r{x) = »<*>-*-*>,
Exercice 5.3 Si P = X2=o^Q*> on a Ai = P(ai) ; on en déduit que (A0,--- ,An) i-> Y%=o^iQi est
injective. Par ailleurs, P - Ya=o ^(ai)Qi est de degré ^ n, et a n + 1 zéros, à savoir a0,..., an ; il est
donc nul, ce qui prouve que (A0,- ■■ ,An) h-» Y%=o^iQi est surjective, et donc que les Q* forment une
base de K[X](n). Les coordonnées de P dans cette base sont (P(a0),... ,P(an)).
Exercice 5.4. (i) Il s'agit de prouver que (Ai)ieN •-> Z)i€N^*(*) est une bijection de K<N> sur K[X].
Comme K(N) est la réunion croissante des Kf0,—n) et K[X] celle des K[X](n>, il suffit de prouver que
(A0,...,An) i-> EioM*) est une bijection de K<°--n> sur K[X](n>. L'injectivité résulte de ce que
Y%=o^iÇi) est de degré le plus grand i vérifiant Ai ^ 0, et donc est nul si et seulement si tous les
Ai sont nuls. Pour la subjectivité, on raisonne par récurrence sur n, le cas n = 0 étant évident. Si
P = anXn + • • • + a0, alors P - n\an(*) est de degré ^ n - 1 et peut donc s'écrire sous la forme
Yh=o Mï) d'après l'hypothèse de récurrence. On a alors P = n\an(*) + Yh=o Mï)> ce Qui P°uve la
surjectivité pour n. (Le même argument prouverait que toute famille de polynômes (Pn)n€N> telle que
Pn soit de degré n pour tout n, est une base de K[X].)
(ii) Si P = £ÎLoMÏ)> alors p(°) = Ao- Maintenant, P(X + 1) - P(X) = YZ=i Mi-i)> et donc
P(l) - P(0) = Ai. En réitérant ce procédé, on obtient A* = P[/c,(0), où l'on a défini pl*l par
récurrence par P(°) = P et ptfc+1l(X) = pl*l(X + 1) - P'*1(X), si k > 0. De manière plus explicite, on a
a* = EJLo(-i)«(Î)p(*-0-
(iii) Il résulte de la question précédente que si P(0),... ,P(n) G Z, alors P = XÏ=oMÏ)> avec
Ao, • • •, An G Z. Comme (™) G Z si m G Z, cela permet de conclure.
Exercice 5.5. Si Yh=i ^i\x ~~ ai\ = 0 pour tout a: G R, où les ai sont distincts deux à deux, et si un des
Ai est non nul, on aboutit à une contradiction car le membre de gauche n'est pas dérivable en ai, alors
que le membre de droite l'est. Les Ai sont donc tous nuls, ce que l'on devait démontrer.
Exercice 5.6. (i) Soit x h-» <£(#) = X)L=i ^k^aicX une combinaison linéaire identiquement nulle des
x h-» earc, où les ak sont distincts deux à deux. Quitte à rénuméroter les a*, on peut supposer que
21. CORRIGÉ DES EXERCICES
213
ai ^ ^2 ^ • • • ^ an, auquel cas limx-,+00e~anX<f>(x) = Àn. Comme e~anX<f>(x) = 0 pour tout x, cela nous
donne Àn = 0 et une récurrence montre que les À* sont tous nuls, ce que Ton voulait.
(ii) Soit x h-» (j>{x) = XX=i ^keiakX une combinaison linéaire identiquement nulle des x h-» eiax, où les
ai sont distincts deux à deux. Alors ^ J0 e~~iakX<j>(x) dx tend vers À& quand M —> +oo, et comme <j>(x)
est identiquement nulle, cela implique que À* = 0 pour tout fc, ce qu'il fallait démontrer.
(iii) x h-» eax est vecteur propre de ^ pour la valeur propre a. Le résultat suit donc de ce que les espaces
propres associées à des valeurs propres distinctes sont en somme directe. (On peut aussi remarquer que
x h-» eax est vecteur propre de r& définie par T(,(<f>)(x) = <f>{x + b) pour la valeur propre ea6, et choisir
b de telle sorte que les eakb soient tous distincts si x h-» (f>{x) = Y%=i \k^akX une combinaison linéaire
identiquement nulle des x h-» eax.)
(iv) Si Yl^ii^k cosakx + fiksmakx) = c, pour tout x G R, où les a,k G R+ sont distincts deux à deux,
alors -2ce0x + Y^k=\(^k - i/J>k)eiakX + Y%=i(^k + iHk)e~~iakX est identiquement nul, et comme 0, les a^
et les -aie sont distincts deux à deux, cela implique, d'après le (ii) que c = 0 (et donc que les fonctions
constantes non nulles ne sont pas dans l'espace engendré par les x h-» cosax et les x h-» sin ax), et que
Aa; - ifi>k = Afc + ifJLh = 0, et Xk = /£& = 0, pour tout k (et donc que les x i-» sin ax et x h-» cos ax forment
une famille libre).
Exercice 5.7. On a x-^Lik(x) = ^Sn^in^~ = Lifc-i(z)> si Jb ^ 1. Maintenant, soit YH=o^^k
identiquement nulle sur ] - 1,1[. Montrons, par récurrence sur n, que les À*; sont tous nuls. On a
Lio(^) = ï3£> Lii(a:) = -log(l - x), et Lik(x) a une limite finie Yln>\ ^ en *> si A: ^ 2. Il s'ensuit
que (1 - x) Y%=0 AfcLifc tend vers Ào en 1", et donc que Ào = 0 puisque Y%=0 A^Li/* est identiquement
nulle. En appliquant l'opérateur a:^, on obtient donc la relation Y^k=o ^fc+iLifc = 0 et l'hypothèse de
récurrence entraîne que À* = 0, si & ^ 1. Ceci permet de conclure.
Exercice 5.8. (i) Si les caractères forment une famille liée, il existe n ^ 2 minimal tel que l'on puisse
trouver une combinaison linéaire X)£=i XkXk identiquement nulle sur G, où les Xk sont distincts deux
à deux, et alors aucun À*; n'est nul puisque n est minimal. Si h G G, alors X)£=i XkXk(hg) = 0 pour
tout g G G, et comme Xk(hg) = Xk{h)xk{g), on obtient une seconde relation Y%=i ^kXk(h)xk = 0.
Comme xi ¥" X2, on peut trouver h G G tel que X2(h) ^ Xi(h), et on obtient 0 = Xi(/*)(XX=i ^kXk) -
ELi xkXk(h)xk = EL2 *k(Xi(h)-Xk(h))xk. Par minimalité de n, cela implique \k(xi(h) ~Xk(h)) = 0
pour tout fc, ce qui est en contradiction avec les hypothèses X2W ^ Xi(^) et ^2 ¥" 0- On en déduit le
résultat.
(ii) Si a G C, alors x h-» eax est un caractère linéaire de (R, +), et le (i) montre donc que les x h-» eax,
pour a G C, sont linéairement indépendants, ce qui permet retrouver le (iii) de l'ex. 5.6 qui contient les
(i) et (ii).
Exercice 5.9. Soit Yh=i <M°gPi> ou les Àj sont des rationnels et les pi distincts deux à deux, une
combinaison linéaire nulle des logp. Quitte à multiplier par le ppcm des dénominateurs des À*, on peut
supposer que les A* sont des entiers. Alors FELiP^' = *» et donc A,- = vp. (n?=iP*J) = vpj0) = °> Pour
tout j, ce qu'il fallait démontrer.
Exercice 6.1. (i) On a (e? A • • • A e?J(vT(1),...,vT{k)) = ^a€Sk sign(a) njLi xT{j)M.y si r € Sfc. On
écrit a{j) sous la forme <jt~1{t{j)) et sign(a) sous la forme sign(ar_1)sign(r), et on fait les changements
de variables f = r{j) et a' = ar-1. On obtient
k
(cj A • • • A<)(vT(1),... ,vT{k)) = sign(r)( ^ sign(a') JJ**',«„,„,,) = sign(r)((et A • • • Aé^k)(vu... ,«*)).
er'€Sk j=\
Ceci prouve que e\ A • • • A e? est alternée.
214
VOCABULAIRE MATHÉMATIQUE
(ii) On a (e? A ■ ■ • A cJJ(ein... ,eik) = 1 et (e? A ■ • • A e?J(e£l,... ,e£J = 0 si 1 < £x < ■ ■ ■ < 4 < n>
et si (ii,... ,»*) 7e (^i,... ,4). (En effet, xjiia(j) = 0 sauf si lô = i„(i), et donc nj=i ^.m*) ^ 0 implique
{ii,-■■><*} = {^i>--->4}, et donc ii = £u..m,ik = 4, et a = id). On en déduit que les e£ A • • - A et
forment une famille libre (il suffit d'évaluer en (e^,..., eik) une combinaison linéaire nulle pour en déduire
la nullité du coefficient de e? A • • • A e*J.
(iii) Soit / G A*V*. On a /(E^ *!,<*,... ,£?=1 ^,«c«) = ^.....«n/l^r ■ ■ ^JIIh *,,«,,
par fc-linéarité de /. On utilise le fait que / est alternée pour éliminer les fc-uplets où deux des ù
sont égaux, ce qui nous fournit une somme portant sur les fc-uplets (n,... ,i*) où tous les termes sont
distincts. On utilise alors la formule /(cia(l),---,Cia(fc)) = sign(a)/(ei1,... ,eik) pour ordonner les i^
et on obtient /(£î=i xlyieu..., £î=i awe<) = Ei<n<-<«n £<r€Sfc sign(a)/(eil,..., e<J nj=1 *j,ia(i).
Cette formule peut se réécrire sous la forme / = Ei<il<...<ifc<n f(eii> - - - > c**)c?i A ' ' ' AeiL » ce ^ Pr°uve
que les ej^ A ■ ■ ■ A e*fc forment une famille génératrice de AfcV*, et donc une base d'après le (ii).
La dimension de A*V* est donc le cardinal de l'ensemble des fc-uplets 1 < ii < ■ ■ ■ < i* < n. Or
cet ensemble est en bijection naturelle avec l'ensemble des parties à k éléments de {1,... ,n} (si I est
une telle partie, on lui associe le fc-uplet formé par ses éléments écrits dans l'ordre croissant), qui est de
cardinal (£). Cela permet de conclure.
Exercice 7.1 (i) Soient Ai,..., Àn les coefficients diagonaux de A. On a alors u^{ei) = À^i, et donc ua
n'est pas injective et A n'est pas inversible si l'un des À* est nul (car alors e* est dans le noyau de ua).
Réciproquement, si tous les À* sont non nuls, soit A7 la matrice diagonale dont les coefficients diagonaux
sont les À^1 ; alors ua* ° ^a(^) = u^'iKei) = \iUA'(ei) = AtÀ^e* = e$, ce qui prouve que u^ o up,
est l'identité et donc que A'A = 1, et A est inversible d'inverse A7. Comme D est stable pour le produit
de matrices puisque Diag(Ài,..., An)Diag(/*i,... ,/zn) = Diag(Ài/*i,..., An/zn) et À*/^ ^ 0 si À* ^ 0 et
Iii t£ 0, cela prouve que D est un sous-groupe de GLn(K).
(ii) Si A est diagonale et N triangulaire supérieure avec des 1 sur la diagonale, les coefficients diagonaux
de AN sont ceux de A ; il s'ensuit que A doit être la matrice diagonale formée des coefficients diagonaux
de T, et comme N = A_1T est triangulaire supérieure en tant que produit de matrices triangulaires
supérieures, et a des 1 sur la diagonale puisque les coefficients diagonaux de A_1T sont les quotients de
ceux de T par ceux de A (qui sont égaux par construction), cela montre que T = AN est une écriture de
la forme voulue.
(iii) B est stable par multiplication puisque le produit de deux matrices triangulaires supérieures Ti
et T2 est une matrice triangulaire supérieure dont les coefficients diagonaux sont les produits de ceux de
Ti et T2, et donc sont non nuls si ceux de Ti et T2 le sont. Par ailleurs, si N est triangulaire supérieure avec
des 1 sur la diagonale, alors N est unipotente, et donc N est inversible d'inverse 1 + (1-N) + (1- N)2 H—
triangulaire supérieure puisque tous les termes de la somme le sont. Il s'ensuit que T = AN G B est
inversible d'inverse T_1A_1 G B puisque T"1 G B et A"1 G B, et donc que B est stable par passage à
l'inverse; c'est donc un sous-groupe de GLn(K).
(iv) Que ThA soit un morphisme de groupes est une traduction du fait que les coefficients diagonaux
de T1T2 sont les produits de ceux de Ti et T2, si Ti,T2 G B. Le noyau de ce morphisme est U, et donc
U est un sous-groupe de B, et donc aussi un sous-groupe de GLn(K).
Exercice 7.2. det*A = det A, et comme *A = -A, on a aussi det*A = (-l)ndet A ; d'où le résultat.
Exercice 7.3. Si on retire la première ligne aux autres, on peut mettre ai - a* en facteur dans la i-ième
ligne et Qij_6. dans la j-ième colonne. La matrice ainsi obtenue a des 1 sur la première ligne et les autres
lignes sont celles de la matrice initiale. Si on retranche alors la première colonne aux autres, on fait
apparaître des 0 sur la première ligne et, comme précédemment, on peut mettre 61 - bj en facteur dans
la j-ième colonne et Q.j_6, dans la i-ième ligne, si i ^ 2 ; la matrice obtenue est la même que la matrice
21. CORRIGÉ DES EXERCICES
215
initiale à part la première ligne qui devient (1,0,... ,0) et la première colonne qui devient 4(1,1..., 1).
On en déduit que
n n -
C(a1,...,an,6i,...,6n) = fJ(a1-ai) Y[(bi-bj) fj , C(a2,... ,an,62,... ,6n).
i=2 j=2 i=lonj=l ai+ j
Une petite récurrence donne donc C(au..., an, bu ..., bn) = Yli<i>(ai-ai') Ylj<j>(bj-bj') Ui^ij^n rfôj-
Exercice 7.4. Un petit calcul montre que AB est le produit de B par la matrice diagonale dont les
cofficients diagonaux sont les ao + rfa\ H h an-ir/^"1^, pour 0 ^ i ^ n - 1, et donc que
n-l
det A = (detB)(detB)"1 fj(a0 + rfm + ■ ■ ■ + an-i^n-l%
i=0
ce qui permet de conclure. (On peut calculer explicitement (det B)(det B)"1 : en effet, B et B sont des
matrices de Vandermonde et leurs déterminants sont no<ij<n-i(^ ~ V*) et flexion-îfa""7' ~ */"*)
respectivement. Dans les deux produits ci-dessus, chaque paire de racines n-ième de l'unité apparaît
exactement une fois, et le signe est le même si i = 0 (i.e. si une des racines est 1) ; pour les (n~1Kn~2)
paires {rji,rj2} restantes, rji - r/2 apparaît avec des signes opposés dans detB et detB. Il s'ensuit que
(detB)(detB)"1 = (_i)(n-i)(n-2)/2.)
Exercice 7.5. (i) Un développement par rapport à la première colonne nous fournit la relation de
récurrence det An+i = (a + a_1)(det An) - det An_i. Le résultat s'en déduit par une récurrence sans mystère
si a 7^ ±1. Si a = ±1, la même récurrence (ou un passage à la limite) donne det An = 2n - 1 si a = 1, et
det An = (-l)n(2n - 1) si a = -1.
(ii) À est une valeur propre si et seulement si det(À — Un) = 0. On peut écrire À sous la forme a + a~l>
et le (i) montre que det(A - Un) = 0 si et seulement si a2(n+1) = 1 et a ^ ±1. On en déduit le résultat.
Exercice 7.6. La formule Yld\n vK^O = n s'obtient en remarquant que i »-► i/d induit une bijection de
l'ensemble des i G {1,... ,n} vérifiant pgcd(i,n) = d sur (Z/(n/d)Z)*.
Soient alors B = (bij) et C = (C^*) les matrices définies par bij = 1 si j \ i et bij = 0 si j \ i, et
<h>k = <PU) si j | k et cjtk = 0 si j \ h. Alors £?=i bitjcjtk = Ej\ij\k V>U) = £,|pgcd(i,À0 <pU) = PScd(^ k)>
et donc A = BC. Comme B est triangulaire inférieure avec des 1 sur la diagonale et C est triangulaire
supérieure avec les <p(i) sur la diagonale, on obtient la formule demandée.
Cette solution peut paraître un peu miraculeuse, mais on obtient naturellement la factorisation de A
ci-dessus en faisant des combinaisons linéaires des lignes de manière à faire apparaître un maximum deO :
on retire la première ligne aux autres, puis les lignes correspondant aux nombres premiers à celles de leurs
multiples, puis celles correspondant aux produits de 2 nombres premiers à celles de leurs multiples, etc.
Exercice 7.7. (i) Un développement de VdM(Xi,... ,Xn) par rapport à la dernière ligne montre que
VdM(Xi,..., Xn) est un polynôme de degré n - 1 en Xn, de coefficient dominant VdM(Xi,..., Xn_i).
(ii) VdM(Xi,... ,Xn) s'annule en Xn = Xi,... ,Xn = Xn_i car alors deux lignes du déterminant sont
égales. Comme Z[Xi,... ,Xn_i] est intègre, et comme VdM(Xi,... ,Xn) est de degré n - 1 en Xn, cela
implique que VdM(Xi,..., Xn) = an_i(Xn - Xi) • • • (Xn - Xn_i), où an_i est le coefficient dominant et
est égal à VdM(Xx,... ,Xn_!), d'après le (i). On en déduit que VdM(Xx,... ,Xn) = UkjO^j ~ Xi), par
récurrence, et le résultat pour VdM(ai,..., an) s'obtient en spécialisant en Xi = ai,...,Xn = an.
Exercice 7.8. Il suffit de recopier la solution de l'ex. 7.1.
Exercice 7.9. (i) T(D) est le noyau de la réduction modulo D de SL2(Z) dans SL2(Z/DZ) (induite par
la réduction modulo D de Z dans Z/DZ) ; c'est donc un sous-groupe de SL2(Z).
(ii) T0(D) est l'image inverse dans SL2(Z) de l'ensemble B des matrices triangulaires supérieures
de SL2(Z/DZ). Or une matrice triangulaire supérieure appartenant à SL2(Z/DZ) a ses coefficients
216
VOCABULAIRE MATHÉMATIQUE
diagonaux inversibles puisque leur produit est égal à 1, et son inverse est encore triangulaire supérieure.
Il en résulte que B est un sous-groupe de SL2(Z/DZ) et donc que r0(D) est un sous-groupe de SL2(Z).
Exercice 8.1. (i) Si X3 + X + 1 n'est pas irréductible, on peut le factoriser sous la forme PQ, avec
degP + degQ = 3, ce qui fait que l'un des deux polynômes est de degré 1, et donc que X3 + X + 1 a une
racine a dans Q. Soit p un nombre premier. Si vp(a) < 0, alors vp{pp) = 3vp(a) < vp(a) ^ vp(-a - 1),
et donc a3 ^ -a - 1. Il s'ensuit que vp(a) ^ 0, pour tout p\ autrement dit, a G Z. Mais ceci n'est pas
possible car a3 + a + 1 ^ 1, si a G N, et a3 + a + 1 ^ -1, si a ^ -1.
(ii) Comme X3 + X + 1 est irréductible, c'est le polynôme minimal de a, et donc [Q(a) : Q] = 3.
Maintenant, si K contient a, il contient Q(a), et l'identité [K : Q] = [K : Q(a)][Q(a) : Q] = 3 [K : Q(a)]
permet de conclure.
(iii) Supposons le contraire, alors il existe ni,... ,nr tel que a appartienne à F = Q(y/nï,..., yfrÇ).
Notons Fi le sous-corps Q(y/n{y..., yjnï) de F*, et posons F0 = Q. On a F*+i = Fi(y/n^), ce qui prouve
que [Fi+i : F*] est égal à 1 ou 2. On en déduit que [F : Q], qui est égal à [Fr : Fr_i] • • • [Fi : F0] est une
puissance de 2, ce qui est en contradiction avec l'hypothèse a G F qui implique que 3 = [Q(a) : Q] divise
[F : Q]. On en déduit le résultat.
Exercice 8.2. (i) On a [Q(A\/3) : Q] = [Q(A V5) : Q(v^)] [Q(V^) : Q]. Or [Q(v^2) : Q] = 2 car
le polynôme minimal de \/2 sur Q est X2 - 2 (irrationalité de \/2). Comme le polynôme minimal de v^3
sur Q(\/2) divise X2 - 3, il est de degré 1 ou 2, et pour conclure, il suffit donc de prouver qu'il n'est pas
de degré 1 ou, autrement dit, que y/Z $ Q(\/2). Supposons le contraire; on a alors \/3 = a + 6\/2, avec
a, 6 G Q. On en déduit que 3 = a2 + 262 + 2aè\/2, et comme 1, \/2 sont libres sur Q, cela implique que
ab = 0 et a2 = 3 ou 262 = 3, ce qui est impossible pour les mêmes raisons que \/2 est irrationnel.
(ii) On peut numéroter les racines de telle sorte que ai = \/2 soit réel et a2,a3 soient complexes
conjugués. Le polynôme X3 - 2 est irréductible dans Q[X], sinon il aurait une racine rationnelle a et on
aurait %v2{a) = 1, ce qui est absurde. Il en résulte que [Q(ai) : Q] = 3, si i = 1,2,3. Ceci est en particulier
vrai pour la racine réelle ai = \/2. Maintenant, X3 - 2 se factorise sous la forme (X - ax)(X2 + aiX + a2)
dans Q(ai). Il en résulte que a2 est de degré 1 ou 2 sur Q(ai), et comme a2 n'est pas réel, il ne peut pas
appartenir à Q(ai), et on a [Q(ai, a2) : Q(ai)] = 2. Enfin, comme ai +a2 + a3 = 0, on a a,3 G Q(ai,a2)
et donc Q(ai,a2,a3) = Q(ai,a2). On en déduit le résultat.
(iii) Comme F(a,/î) contient F(a) et F(/î), son degré est divisible par [F(a) : F] = r et [F(/î) : F] = 5,
et donc par rs puisque (r,s) = 1. Il s'ensuit que [F(a,/î) : F(/?)] = ^p^.pr est divisible par r et donc
que le degré de a sur F((3) est un multiple de r. Comme ce degré est le degré du polynôme minimal de a
sur F(/î), et que ce polynôme divise le polynôme minimal de a sur F, il est ^ r, et donc égal à r, ce que
l'on cherchait à prouver.
Le (ii) montre que le résultat n'est pas forcément vrai si (r,s) ^ 1.
Exercice 8.3 (i) Q* est symétrique en c*i,... ,a<j ; ses coefficients sont donc des polynômes en t et les
coefficients de P, qui sont réels par hypothèse ; on en déduit l'appartenance de Qt à R[X].
(ii) On a deg Qt = n^n2""^, et comme l'hypothèse ^(deg P) ^ 1 entraîne v2(n-1) = 0, on a^(deg Qt) =
t*(n)-l=t*(degP)-l.
Maintenant, si r = ^(degP) = 0, cela veut dire que P est de degré impair et donc lim^+oo P(x) =
+00, et lim^-oo P(#) = -00 et P a un zéro dans R (et donc dans C) d'après le th. des valeurs
intermédiaires ; l'hypothèse est donc vraie pour r = 0.
Si r ^ 1, on peut appliquer l'hypothèse de récurrence à Q*, pour tout i, puisque ^(degQ*) = r - 1-
On en déduit que, pour tout t G R, il existe i(t) < j(t) tel que ctyt) +aj(0 +^i(0aj(0 e G. L'application
t h^ (i(t),j(t)) n'est pas injective pour des raisons de cardinal; il existe donc i < j et ti ^ t2 tels que
ai + otj + tkOtiOtj G C, si k = 1,2. On en déduit que s = a$ + olj et p = oliolj appartiennent à C et
21. CORRIGÉ DES EXERCICES
217
donc que a*, oy, qui sont les racines de X2 - sX + p, appartiennent à C (les racines de ce polynôme sont
i(s ± y/s2 - 4p), et ±y/s2 - 4p = ±y/reia/2, si s2 - 4p = reiQ).
(iii) Il s'agit de prouver que tout P G C[X], unitaire de degré ^ 1, a une racine dans C. Or PP G R[X]
et donc a une racine a G C. On a donc 0 = P(a)P(a) = P(a)P(â) = 0, ce qui prouve que a ou â est une
racine de P, et permet de conclure.
Exercice 8.4. Il suffit de recopier la démonstration du cas F = Fp en remplaçant p par q, et en utilisant
le fait que F = {x G K, xq = x} d'après le point précédant l'exercice.
Exercice 8.5. Supposons le contraire, et choisisons v\ G W - Wi,.. . ,vn G W - Wn. Si t G F, soit
v(t) =v\ +tV2-\ h tn~lvn ; c'est un élément de W puisque W est un espace vectoriel par hypothèse,
et il existe donc i(t) tel que v(t) G W^). Comme F est infini, il existe i G {1,..., n} tel que i(t) = i pour
une infinité de t. Soient ti,... ,tn G F, distincts, tels que i(tj) = i, pour j G {1,... ,n}. Le déterminant
du système exprimant les v(tj) en fonction des Vk est non nul (c'est un déterminant de Vandermonde qui
vaut Yl^jitj - ti)), ce qui fait que l'on peut exprimer les Vk comme des combinaisons linéaires des v(tj).
En particulier, on &Vi G W$, contrairement à l'hypothèse, d'où une contradiction qui permet de conclure.
Exercice 9.1. Soit x h* X^i A^ log(a; + a>k) une combinaison linéaire des x h* log(a: + a), où les
a,k sont distincts deux à deux, identiquement nulle sur R+. En dérivant i fois, on obtient la relation
ZX=i ^fc(g+ttfc)« = 0 pour tout x G R+. En prenant i = 1,... ,n et x = 0, on voit que les a^lXk sont
solutions d'un système XX=i &i,fca/^fc = 0, pour 1 < i < n, avec 6^ = a]^%. Le déterminant de ce
système est non nul (c'est un déterminant de Vandermonde), et la seule solution de ce système est donc
Ai = • ■ ■ = Àn = 0. On en déduit le résultat.
Exercice 9.2. (i) Si Zk G C, pour 1 ^ k < N, alors |èX^=i*A;| ^ sup1<A;<N |2*|, avec égalité si et
seulement si les Zk sont tous égaux. On en déduit que si \xij\ atteint son maximum pour i0, jo qui n'est
pas sur le bord, alors Xij = Xi0j0 si \i - io\ ^ 1 et \j - jo\ ^ 1. Mais alors \xij\ est maximum pour tout
(i, j) vérifiant \i - îq\ ^ 1 et \j - jo\ ^ 1- On peut donc recommencer et en déduire que xiyj = xioj0 si
\i - i0| ^ 2 et \j - jo\ ^ 2. Une petite récurrence permet donc de prouver que Xij = Xi0j0 pour tout
couple (iyj)y et donc en particulier pour un couple sur le bord, ce qui prouve que le maximum de \xij\
est atteint sur le bord aussi.
(ii) Si x^ = 0 sur le bord, alors supi:7- \xij\ = 0 d'après le (i), et donc Xij = 0 pour tous i, j.
(iii) On obtient les valeurs au centre du carré en fonction des valeurs au bord en résolvant un système
linéaire de n2 équations à n2 inconnues, avec second membre. D'après le (ii), la seule solution de ce
système est la solution nulle si le second membre est nul ; il s'ensuit que le système est de Cramer, et
donc qu'il y a une et une seule solution pour tout choix de second membre. Ceci permet de conclure.
Exercice 9.3. (i) rg(UAV) = dim(uxjouAouv(Km)). Or uv(Km) = Km, et dimuu(V) = dim V, si V est
un sous-espace de Kn, puisque u\j est injective. On a donc dim(nu°^A°^v(Km)) = dim^A(Km) = rg(A).
(ii) (U2,V2)-((Ui,Vi)-M) = (U2,V2)-U1MVf1 = WJiMVr1^"1 = (U2Ui, V2Vi)-M, ce qui prouve
que l'on a bien défini une action de groupe.
(iii) Il résulte du point précédant l'exercice que toute matrice de rangr est dans l'orbite de In,m(r)>
et donc les matrices de rang r sont incluses dans une orbite. Par ailleurs, le (i) montre que des matrices
de rangs différents sont dans des orbites différentes ; l'ensemble des orbites est donc en bijection avec
l'ensemble des rangs possibles, et il y a s + 1 orbites, si s = inf (n, m).
Exercice 10.1. (i) Comme A est noethérien, tout sous-module d'un module de type fini, et donc Mt0rS
est de type fini. Soient x\,... ,xn engendrant Mtors et, si 1 ^ i ^ n, soit ai G A - {0} tel que a^xi = 0.
Alors a = Yl"=l ai ^ 0 puisque A est intègre, et axi = 0 pour tout i. Il s'ensuit que ax = 0 pour toute
combinaison linéaire x des a;*, et donc pour tout x G Mt0rs puisque les xi engendrent Mt0rs-
218
VOCABULAIRE MATHÉMATIQUE
(ii) Comme Z est noethérien, Mt0rs est de type fini. Si x\,... ,xn engendrent Mt0rS, on dispose d'une
surjection (ai,..., an) h-> Yh=i a%xi de Zn sur Mt0rS. Par ailleurs, il existe di G N- {0} tel que d+Xi = 0 ; la
surjection précédente se factorise donc à travers niLi(^M^) 9U* est un Sr0UPe fini, de cardinal YU=l di ;
il en résulte que Mtors est fini, de cardinal ^ nf=i ^- ^e gr0UPe des racines de l'unité de C* (isomorphe
à Q/Z) est un Z-module de torsion qui n'est pas fini (et donc pas de type fini non plus).
Exercice 10.2. C'est un cas particulier du fait que tout idéal premier d'un anneau principal est maximal,
mais on peut en donner une démonstration plus directe. Soit d = degQ. Alors K[X]/Q est un K-espace
vectoriel de dimension d (de base (1,..., Xd_1)), et si P G K[X] n'est pas divisible par Q, la multiplication
par P est injective sur K[X]/Q (si R est dans le noyau, alors PR est divisible par Q, et comme Q est
irréductible, P est premier à Q, et cela implique que R est divisible par Q, et donc est nul dans K[X]/Q),
et donc est surjective, ce qui prouve que tout élément non nul de K[X]/Q a un inverse (la subjectivité
entraîne en particulier l'existence de R tel que PR = 1).
Exercice 10.16. Soit / = \a\,... ,an), et soit A le sous-Z-module de Zn engendré par A. Comme A est
de rang 1, il existe une base fu..., fn de Zn sur Z et S G Z, tels que Sfi soit une base de A. Or les bases
de A sont ±/, et on peut donc, quitte à changer fx de signe, supposer que Sf\ = / et S > 0. Par ailleurs,
comme les a* sont premiers entre eux, on a S G Z*, et donc S = 1. Il s'ensuit que la matrice A, dont les
colonnes sont /,/2, ■ ■ ■ ,/n> appartient à GL2(Z) ; son déterminant est donc ±1 et, quitte à changer fn
en -/n, on peut s'arranger pour que det A = 1. La matrice A répond alors à la question.
Exercice 10.17. (i) Les M*; forment une famille libre sur Q si et seulement si il existe un mineur d'ordre
r non nul dans la matrice des M& dans la base des XJiyj. Cette condition ne fait pas intervenir le corps
sur lequel on travaille, ce qui prouve que les M& sont libres sur Q si et seulement si ils le sont sur C.
(ii) L'équation AM = MB est une équation linéaire à coefficients dans Q. La dimension de l'espace de
ses solutions Eq sur Q ou Ec sur C est la même puisqu'elle s'exprime en termes de rang de la matrice
du système. On déduit donc du (i) qu'une base de Eq sur Q est aussi une base de Ec sur C.
(iii) Comme Mi,..., Mr G Mn(Q), on a det(XiMi + ■ ■ ■ XrMr) G Q[Xi,..., Xr]. Par ailleurs, P0 G Ec
et comme det Po ^ 0, il s'ensuit que la fonction polynomiale sur Cr définie par Q n'est pas identiquement
nulle, et donc Q ^ 0.
(iv) Comme Q ^ 0 et comme Q est un corps infini, il existe a?i,... ,xr G Q tels que Q(a?i,... ,xr) ^ 0.
la matrice P = a?iMi H h xrMr répond à la question.
Exercice 11.2. La vérification de ce que d est une distance ne pose pas de problème, et comme les
singletons sont ouverts puisque {x} = B(x, (1/2)"), la topologie associée est la topologie discrète.
Exercice 11.3. Si d'(x, y) = 0, on a f(x) = f(y) et donc x = y car / est injective (strictement croissante).
La symétrie est évidente et l'inégalité triangulaire résulte de ce que d'(x,z) = \f(x) - f(z)\ ^ \f(x) -
f(y)\ + \f(v) ~ f(z)\ = d'{x,y) + d'(y,z). Il reste à prouver que si x G R et si e > 0, il existe S > 0 tel
que d(x,y) < S implique d'(x,y) < e et d'{x,y) < S implique d(x,y) < e, ce qui résulte de la continuité
de / et de sa réciproque g(x) = yq^y, si x G] - 1,1[.
Exercice 11.5. C'est la topologie grossière : si x G R et si U est un ouvert non vide de R, alors U contient
un élément de la forme x + r, avec r G Q, et donc tout ouvert non vide de R/Q contient l'image de x,
pour tout x, et donc est égal à R/Q.
Exercice 11.6. Soient a ^ b deux points de X. Comme / est injective, on a f(a) ^ /(&), et comme Y
est séparé, on peut trouver des ouverts disjoints U et V de Y tels que f(a) G U et f(b) G V. Maintenant,
comme / est continue, /_1(U) et f~l(V) sont des ouverts de X, qui sont disjoints car U et V le sont, et
qui contiennent respectivement a et 6. Ceci permet de conclure.
Exercice 11.7. Il suffit de passer aux complémentaires.
21. CORRIGÉ DES EXERCICES
219
Exercice 11.8. (i) Soit U ^ 0 un ouvert de Xi x X2. Il existe alors Ui ^ 0 ouvert de Xi et U2 ^ 0 ouvert
de X2 tels que U contienne Ui x U2. Comme Yi est dense, Yx n Ui est non vide et comme Y2 est dense,
il en est de même de Y2 n U2, ce qui montre que (Yi x Y2) n U qui contient (Yi x Y2) 0 (Ui x U2) =
(Yi n Ui) x (Y2 n U2) est non vide. On en déduit la densité de Yi x Y2.
(ii) Soient j:YxY-^ R+ définie par g{x,x') = dy^x^x') et h : Y x Y —> R+ définie par g{x,x') =
rfz(/(^7)» f(x'))- ^n cherche à prouver que g et h sont égales. Or elles sont égales sur X x X par hypothèse,
et comme X x X est dense dans Y x Y, et Z est séparé car métrique, on peut en conclure qu'elles sont
égales sur Y x Y, en utilisant le point précédant l'exercice (ou l'ex. 11.11).
Exercice 11.9. (i) Comme U contient U, son intérieur, qui est le plus grand ouvert contenu dans U
contient U. Si U est l'ouvert ]0,l[u]l,2[ de R, alors ÏÏ = [0,2] et l'intérieur de ÏÏ est ]0,2[ qui contient
strictement U. Revenons au cas d'un ouvert général U et notons V l'intérieur de son adhérence. Comme
U C V, on a U C V, et comme U est un fermé qui contient V, on a V C U, et donc V = U, ce qui termine
la démonstration du (i).
Le (ii) se déduit du (i) en passant aux complémentaires.
Exercice 11.10. Si A n'est pas dense, son adhérence n'est pas C2, et il existe un polynôme P G C[X, Y]
non nul s'annulant sur A. Soit donc P G C[X, Y] tel que P(n, en) = 0 pour tout n G N. On écrit P sous la
forme P(X, Y) = Pd(X)Yd + ■ ■ ■ + P0(X), avec P0,..., Prf G C[X]. On a donc Pd(n)edn + ■ ■ ■ + P0(n) = 0
pour tout n, et en divisant par edn, on en déduit que Pd(n) —> 0 quand n —> +00. Ceci n'est possible que
si Prf = 0. On en déduit que P = 0 ; d'où la densité de A dans C2.
A n'est pas dense dans C2 pour la topologie usuelle car A ne contient aucun point de l'ouvert
{z = (21,22), sup(|zi|,|z2|) < 1}. En fait, il n'est pas difficile de voir que A est fermé dans C2 pour
la topologie usuelle.
Exercice 11.11. Si X est métrisable, la topologie peut être définie par une métrique d, ce qui permet de
supposer que (X, d) est métrique dans tout ce qui suit.
(i) Soit a G X. Comme les B(a,2"n) forment une base de voisinages de a, on voit que si a G Z,
alors, pour tout n G N, il existe xn G Z avec d(a, xn) ^ 2"n ; la suite (xn)n^^ a alors a comme limite.
Réciproquement, si (xn)nÉN est une suite d'éléments de Z ayant a pour limite, et si U est un voisinage
de a, alors xn G U, pour tout n assez grand, ce qui prouve que U contient des éléments de Z, et permet
de montrer que a G Z (noter que ce sens n'a pas utilisé le fait que X est métrique).
(ii) Z est dense dans X si et seulement si Z = X, et donc le résultat suit du (i).
(iii) Si a: G X, il existe une suite (a:n)nGN d'éléments de Z tendant vers x. Mais alors f(xn) tend
vers f(x) et g(xn) tend vers g(x) puisque f et g sont continues, et comme f(xn) = g(xn) pour tout n,
cela implique que f(x) et g(x) sont des limites de la suite (f(xn))n^^. Comme Y est supposé métrique
et donc séparé, il y a unicité de la limite d'une suite et donc f(x) = g(x).
Exercice 12.1. (i) Soit n*-^ xn une bijection de N sur X. Il suffit de prendre ]an, 6n[=]^n-5^) ^n+5^3 [•
(ii) Comme [0,1] est compact, si les ]an,6n[, pour n G N, recouvrent [0,1], on peut en extraire un
recouvrement fini, et le résultat suit du cas d'une famille finie. (Pour démontrer le résultat dans le cas
d'une famille finie, on peut remarquer que Ylnej(bn - an) est l'intégrale (de Riemann) de la fonction
continue par morceaux <f> = YlneJ l|a„,6„[- Or l'hypothèse [0,1] C Unej]an,6n[ se traduit par <j>(x) ^ 1, si
x G [0,1], et donc l'intégrale de <f> est supérieure ou égale à celle de l[0,i) qui vaut 1. L'exercice permet
de montrer que l'intégrale de Lebesgue de l[0,ij est supérieure ou égale à 1 et donc aussi égale à 1, ce qui
est rassurant...)
(iii) Si [0,1] était dénombrable, il existerait d'après le (i) une suite de segments]an, bn[ recouvrant [0,1]
et telle que YlneN^n - an) ^ è> ce °lui contredit le (ii). Le segment [0,1] n'est donc pas dénombrable;
il en est a fortiori de même de R qui le contient.
220
VOCABULAIRE MATHÉMATIQUE
Exercice 12.2. (i) Soit X un compact métrique, et soient (a:n)nGN ayant une unique valeur d'adhérence a
et U un ouvert contenant a. Alors X — U ne contient qu'un nombre fini de termes de la suite, sinon on
pourrait extraire une sous-suite (^(n))n€N de (a:n)nGN) dont tous les termes sont dans X - U, et comme
X - U est compact puisque fermé dans un compact, cela implique que (£p(ra))n€N et donc aussi (a:n)nGN)
a une valeur d'adhérence dans X - U, contrairement à l'hypothèse. Il existe donc N G N tel que xn e\]
si n ^ N, ce qui prouve que a est la limite de la suite (a:n)nGN-
(ii) La suite (1 + (-l)n)n admet 0 comme unique valeur d'adhérence dans R, mais ne converge pas.
Exercice 12.3. Il suffit d'adapter la démonstration de la compacité d'un produit, en partant du
développement décimal des éléments de [0,1].
Exercice 12.4. (i) Si / est constante, tout c convient. Sinon, le minimum ou le maximum de / n'est pas
égal à f(a). Soit donc c G]a, b[ tel que f(c) soit extrémal (un tel c existe par compacité de [a, 6]). Alors
f(x) - f(c) est de signe constant et donc '^-c^ change de signe en c, ce qui fait que les dérivées à
droite et à gauche sont de signes opposées, et comme on a supposé / dérivable en c, ces dérivées sont
toutes les deux égales à /'(c), et donc /'(c) = 0.
(ii) On applique le (i) à g(x) = f(x) - /(6W^fl) fo _ a) ; on a g(b) = g(a) et g'(c) = 0 implique
(iii) C'est immédiat.
Exercice 12.5. Si / est identiquement nulle, il n'y a rien à démontrer. Sinon, il existe xoGE tel que
l/MI > 0, et comme / tend vers 0 à l'infini, il existe M > 0, tel que \f(x)\ < l^il, si ||a:|| > M. Mais
alors la boule B(0,M) contient x0 et est compacte, puisque E est de dimension finie. Cela implique que
|/| atteint son maximum sur cette boule en un point a?i, et on a |/(a?i)| ^ |/(£o)| > ^g0^, ce qui prouve
que |/(a?i)| est aussi le maximum de |/| sur E tout entier. Ceci permet de conclure.
Exercice 12.6. (i) Si xux2 G X, on a d(xuy) ^ d{xux2) + d(x2,y) pour tout y G F. En passant
à la borne inférieure sur y G F, on en déduit que d(a?i,F) < d(xux2) + d(a;2,F). Par symétrie, on a
d(x2,F) ^ d(xi,x2) + d(xi,F). On en déduit que |d(a?i,F) -d(a;2,F)| ^ d(x\,x2), et donc que d(x,F) est
1-lipschitzienne.
(ii) On a d(x,F) = 0, si x G F, et donc, par continuité, d(x,F) = 0, si x G F. Réciproquement, si
a: G F, alors pour tout n > 0, il existe xn G F avec d(x,xn) < 2~n, ce qui implique que d(x,F) < 2"n,
pour tout n, et donc d(x, F) = 0.
(iii) La fonction f(x) = d(x,Fi)-d(x,F2) est continue sur X, et donc Ui = /_1(R^_) et U2 = /_1(R*)
sont deux ouverts de X (en tant qu'images inverses d'ouverts de R par une fonction continue) qui sont
disjoints puisque R£ et R* sont disjoints. Maintenant, si x G Fi, alors d(x, F2) > 0 puisque F2 est fermé
et x £ F2 ; donc f(x) > 0. On en déduit que Fi c Ui. De même, F2 C U2, ce qui permet de conclure.
(iv) La fonction (a:, y) h* d(x, y) est continue sur X x X. Comme Fi x F2 est compact comme produit
de deux compacts, le minimum de d(x,y) sur Fi x F2 est atteint en (a?o,ï/o), et comme Fi n F2 = 0, on
a d(zo,ï/o) 7^ 0, et donc d(Fi,F2) > 0.
(v) La fonction x h* d(x, Fi) est continue sur F2 et ne s'annule pas car Fi n F2 = 0 et Fi est
fermé. Comme F2 est compact, elle atteint son mimimum qui, de ce fait est > 0. Or ce minimum est
infseF2 d(x,F\) = inf^^ inîy^i d(x,y) = d(Fi,F2), ce qui permet de conclure.
(vi) Dans R, on peut prendre Fx = N et F2 = {n + 2"n_1, n G N}. Dans R2, on peut prendre
Fi = {(x,y),xy= 1} et F2 = {(x,y), xy = 0}.
Exercice 12.7. (i) Soit g : X —► R définie par g(x) = d(x,f(x)). Alors g est continue comme composée
de 01 : X -► X x X envoyant x sur (x,f(x)) et g2 : X x X -► R envoyant (x>y) sur d(x,y). Elle atteint
donc son minimum en un point x0> et on a f(x0) = x0, sinon d(f(f(x0)), f(xo)) < d(f(x0),x0), ce qui est
contraire à la définition de xq. La fonction / admet donc au moins un point fixe. Si elle en admet deux
21. CORRIGÉ DES EXERCICES
221
xi t£ X2, on a d(f(xi),f(x2)) < d{xux2), ce qui est contraire à l'hypothèse f(xi) = xi et f(x2) = x2.
Le point fixe de / est donc unique, ce qui permet de conclure.
(ii) Soit Sn = d(fn(x),xo). Comme / est strictement contractante, 5n+i = d(f(fn(x)),f(x0)) < Sn, si
fn(x) =£ a?0. Maintenant, soit a une valeur d'adhérence de la suite (/n(z))neN> et soit f^n^(x) une suite
extraite tendant vers a. Si a ^ x0, on a
<W0)+i < d(rino)+l(x)J(a)) + d(f(aUo) < d(r^\x)ya)+ d(f(a),x0) < d(a,*0),
si no est assez grand. On aboutit à une contradiction car Sm ^ <^(no) < d(a,x0) pour tout m > </>(n0),
et la suite extraite ^(n) tend vers d(a,a?o) quand n tend vers +00. On en déduit que a = xo et donc
que fn(x) a a?o comme unique valeur d'adhérence dans X. Comme X est compact, cela implique que
fn(x) -> x0.
(iii) Soit Sn = supa;GXd(/n(a:),a:o). H s'agit de prouver que Sn —> 0. Comme / est compact et x h*
d(/n(a:),a:o) est continue puisque / est continue, il existe xn G X tel que d(/n(a;n),a;o) = Sn. On a alors
<Sn+i = d(fn+l(x),x0) = d(fn(f(xn+i)),x0) ^ Sn, ce qui montre que la suite Sn est décroissante. Il suffit
donc d'exhiber une suite extraite de (<Sn)nÉN tendant vers 0.
Soit a une valeur d'adhérence de la suite xn, et soit a:v>(n) une suite extraite tendant vers a. On a alors
ce qui montre que S^n) -> 0 car d(x^n^a) -> 0 par construction, et d(ftp^(a),x0) -> 0 d'après le (ii).
Ceci permet de conclure.
Exercice 12.8. La démonstration se fait par l'absurde. Supposons X non compact, et construisons une
fonction continue <f) : X —> R non bornée. Il existe une suite (a:n)nGN n'ayant pas de valeur d'adhérence
dans X, ce qui se traduit, pour tout a G X, par l'existence de ôa > 0 tel que B(a, 2ô~) contienne au
plus un xn, à savoir a si l'un des xn vaut a. Soit </>n(x) = sup(n - n2d(x,xn),0). C'est une fonction
continue sur X, nulle en dehors de B(xn, £) et valant n en xn. Si a G X, la restriction de <f>n à B(a, ô~) est
identiquement nulle, si £ < 5a et si a:n 7^ a. Comme il n'y a qu'un nombre fini de n ne vérifiant pas ces
conditions, cela montre que <f>(x) = X^nGN^n(^) est la somme d'un nombre fini de fonctions continues
sur B(a,5~), pour tout a; c'est donc une fonction continue sur X. Par ailleurs, on a <f)(xn) ^ n, pour
tout n, et donc <j> est non bornée. Ceci permet de conclure.
Exercice 13.1 (i) Soit / une telle fonction. Soient a < b les deux solutions de f(x) = 0. Alors / est,
d'après le th. des valeurs intermédiaires, de signe constant sur ] - 00, a[, sur ]a, 6[, et sur ]6, +oo[ puisque
/ n'a pas d'autre zéro que a et 6. Quitte à changer / en -/, on peut supposer / > 0 sur ]a, b[. Soit
M = supxG[a6j f(x). Alors il existe c G]a,6[ tel que f(x) = c par compacité de [a,6], et / prend toute
valeur de ]0,M[ deux fois sur ]a,6[ (une fois sur ]a,c[ et une fois sur ]c,6[). On en déduit le fait que /
est ^ 0 en dehors de ]a,6[, sinon son image contiendrait un segment de la forme [0,M;[ et tout élément
de ]0,inf(M,M/)[ aurait plus de 3 antécédents. Mais alors / ne prend aucune valeur ^ M, ce qui est en
contradiction avec l'hypothèse. Il s'ensuit qu'il n'existe pas de fonction continue / : R —► R prenant
chaque valeur exactement 2 fois.
(ii) Il est très facile de construire une fonction continue prenant chaque valeur 2k + 1 fois, si k G N ;
par exemple, la fonction / définie par f(x) = sin2 nx sur [0, Jb + 5], prolongée par l'équation fonctionnelle
f(x + k+±) = f(x) + 1 si x G R.
Par contre, si n = 2fc, cela n'est pas possible. On raisonne par l'absurde comme pour le cas n = 2, et
on note ai < a2 < • • • < a2k les solutions de f(x) = 0. Alors / est de signe constant sur ] - oo,ai[, sur
]û2â:> +°°[ et sur chacun des 2k - 1 segments ]au <*i+i[- Quitte à changer / en -/, on peut supposer / > 0
sur au moins k de ces segments. On en déduit l'existence de M > 0 tel que / prenne 2k fois la valeur y sur
lai)û2A;[ si y G]0,M[, et on montre, comme ci-dessus, que cela implique que / < 0 en dehors de [ai,a2/b],
222
VOCABULAIRE MATHÉMATIQUE
puis que / est bornée supérieurement contrairement à l'hypothèse qui implique en particulier que / est
surjective.
Exercice 13.2. On sait que U est connexe par arcs, et il suffit de prouver qu'il en est de même de
V = U - {x}. Soient donc t/i, t/2 € V, et soit u : [0,1] —> U un chemin continu joignant t/i à y2 dans U. Si
u ne passe pas par x, il n'y a rien à faire. Sinon, il existe r < inf(d(x,yi),d(x,y2)) tel que B(x,r) c U,
et l'ensemble des t tels que d(x,u(t)) ^ r admet un plus petit (resp. grand) élément t\ (resp. t2). Alors
u permet de joindre t/i à u{t{) et u(t2) à y2 dans V, et on peut passer de u(t\) à u(t2) en restant sur la
sphère de rayon r [il suffit de prendre l'arc de cercle délimité par le cône de sommet x et dont les bords
sont les demi-droites [x,u(ti)) et [x,u(t2))].
Exercice 13.3. Si / est un homéomorphisme de X sur Y, alors la restriction de / à X - {x} est encore
un homéomorphisme de X - {x} sur Y - {f(x)} pour tout a: G X. Il ne peut donc pas y avoir d'ho-
méomorphisme de R sur R2 puisque R privé d'un point est non connexe, alors que R2 privé d'un point
est connexe. Les autres cas se traitent de la même manière en enlevant à [0,1] n'importe quel élément
différent de 0 et 1.
Exercice 13.4. Si / est une bijection de [0,1] sur ]0,1[, alors /(]0,1]) =]0, l[-{/(0)} est non connexe,
tandis que ]0,1] est connexe, ce qui prouve que / ne peut pas être continue.
Exercice 13.5. Si on enlève de Y les deux points de contacts, on obtient un ensemble avec 4 composantes
connexes, alors que si on enlève deux points à X, le mieux que l'on puisse obtenir est 3 composantes
connexes.
Exercice 13.6. (i) (a) On peut prendre une échelle avec une infinité dénombrable de barreaux et, si on
retire les barreaux un par un, il ne reste que les deux montants, ce qui n'est pas connexe (i.e. Fn est la réunion
des deux demi-droites verticales partant de (0,0) et (1,0) et des segments horizontaux [(0, fc), (l,fc)],
pour k ^ n).
(b) Si F n'est pas connexe, alors F = F/UF//, où F7 et F" sont des fermés non vides disjoints de F.
Par ailleurs, F est fermé, en tant qu'intersection de fermés, et comme F c F0 qui est compact, F, F7
et F" sont compacts. La distance d = d(F7,F") est donc > 0, et U7 = {x G R2, d(z,F7) < g} et
U77 = {x e R2, rf(a:,F77) < |} sont des ouverts disjoints de R2 contenant F7 et F77 respectivement. Soit
Z = R2 - (F7 U F77). Alors Z est un fermé ne rencontrant pas F, et donc nnGN(Z n Fn) = 0. Comme
Z n Fn est un fermé de F0 qui est compact, on en déduit l'existence de n G N tel que Z n Fn = 0. On a
donc Fn = (U7 n Fn) U (U77 n Fn), ce qui est en contradiction avec l'hypothèse « Fn connexe » puisque
U7 n Fn et U77 n Fn sont des ouverts disjoints de Fn qui sont non vides puisqu'ils contiennent F7 et F77
respectivement. L'hypothèse «F non connexe » était donc absurde, ce qui permet de conclure.
(ii) (a) Soit Xn la réunion des segments [a^a^+i], pour k ^ n, et soit Fn l'adhérence de Xn. Alors Fn
est connexe car Xn est connexe (il est même connexe par aies), F0 est compact car fermé par construction
et borné par hypothèse, et Fn+i c Fn car Xn+i c Xn. Il s'ensuit, d'après le (i) (b), que F = nneNFn
est connexe. Montrons que F est égal à l'ensemble G des valeurs d'adhérence de la suite (xn)neNj ce qui
permettra de conclure.
• Si Yn = {xk> k ^ n) et Gn est l'adhérence de Yn, alors G = nnGNGn. Or Yn c Xn et donc Gn C Fn,
pour tout n G N, et G C F.
• Si a G F, alors pour tout e > 0 et tout N G N, il existe n ^ N et x G [xn,xn+i] tel que d(x,a) < e.
Choisissons N de telle sorte que d(xk>Xk+i) < £, pour tout k ^ N (c'est possible car on a supposé
d(xk+i>Xk) -> 0). On a alors d(xn,x) ^ e et donc d(xnya) ^ 2e. On en déduit que a est une valeur
d'adhérence de la suite {xn)n^^, et donc que F c G.
Ceci permet de conclure.
21. CORRIGÉ DES EXERCICES
223
(b) Il suffit de parcourir l'échelle du (i) (a) en allant d'un pied à l'autre en passant par le fc-ième
barreau ; comme ceci est un peu fatigant, les pas que l'on faits sont de plus en plus petits et l'adhérence
de la suite ainsi construite est constituée des deux montants (il n'est pas sûr qu'ils résistent très longtemps
à ce traitement...).
Exercice 13.7. Définissons le bord du cylindre et de la bande de Moebius comme l'image de {0,1} x [0,1].
Dans le cyclindre, on obtient deux lacets disjoints, alors que dans la bande de Moebius on n'obtient qu'un
seul lacet, car (0,0) est identifié à (1,1). Maintenant, si x est sur le bord, alors x admet une base de
voisinages constituée de demi-disques de centre x, et si on prive un de ces demi-disques de x, on obtient un
ensemble contractile. Si x n'est pas sur le bord, alors tout voisinage de x contient un disque de centre x,
et si on le prive de x, on obtient un ensemble non contractile. On en déduit qu'un homéomorphisme du
cylindre sur la bande de Moebius induit un homéomorphisme entre les bords, mais ce n'est pas possible
car le bord du cylindre n'est pas connexe, alors que celui de la bande de Moebius l'est.
Exercice 14.1. (i) On a d(xm>xm+p) ^ sup0<i<p_1d(a:m+i,a:m+i+i) < supm^nd(a:m,a:m+1) par ultra-
métricité de d. On en déduit que si d(xn+i,xn) -> 0, et donc si lim^+oo (supm^nd(a;m+i,a;m)) = 0,
alors limm_>+00 (suppGNd(a?m+p,a;m)) = 0, et la suite est de Cauchy.
(ii) Si n ^ 1, soit i = [j^f ], de telle sorte que n = 2i + j, avec 0 < j < 2* - 1. Posons alors xn = ^-,
si i est pair et xn = 1 - ^-, si i est impair. On vérifie que xn+i - xn = ^ tend vers 0, mais que la suite
(#n)n€N balaie consciencieusement l'intervalle [0,1] et que l'ensemble de ses valeurs d'adhérence est [0,1].
Elle n'est donc pas de Cauchy. On aurait aussi pu prendre xn = log(n + 1) qui tend vers +oo, et donc
n'est pas de Cauchy.
Exercice 14.3. (i) Soit (Un)nGN une famille d'ouverts denses de R. Supposons que X = nnGNUn est
dénombrable, et choisissons une surjection n h-» xn de N sur X. Alors Vn = Un - {xn} est un ouvert
dense de R pour tout n et nnGNVn = 0, ce qui est contraire au lemme de Baire.
(ii) Si (/n)n€N est une telle suite, et si N G N, soit FN = {x G R, |/n(z)| < N, Vn G N}. Alors FN est
un fermé puisque Fn = nnGN{^ G R, |/n(^)| < N} et que chacun des ensembles de l'intersection est fermé
par continuité des fn. Par ailleurs, l'hypothèse sur la suite (/n)n€N se traduit par UngnFn = R — Q.
En notant Un l'ouvert complémentaire de FN, on obtient PIngnUn = Q, ce qui est en contradiction avec
le (i) (chacun des UN est dense dans R puisqu'il contient Q).
Exercice 15.1 (i) Si n ^ 1, on a §£ = jj^ $r < /^ $r car x < Sn sur [Sn_i,Sn]. On en déduit que
(ii) Si limsup §*- = 1, il y a une infinité de n tels que §*- ^ |, et la série diverge. Si limsup §*- < 1, il
existe c < 1 tel que ^ ^ c, pour tout n ^ 1. On a alors x ^ Sn - an ^ (1 - c)Sn sur [Sn_i, Sn], et donc
§^ ^ fsn-i ^ <te, si n ^ 1. On en tire la minoration X^neN §^ ^ 1 + fa0°° ^ ^x = +°°-
Exercice 15.2. (i) Si A = {0}, on a A = Z - 0 ; on suppose donc A ^ {0} dans ce qui suit.
Si AnR* admet un plus petit élément a, et si a: G A, alors x - [^]a est un élément de A appartenant
à [0, a[ ; il est donc nul par définition de a, ce qui prouve que A = Z • a.
Si la borne inférieure de A n R+ est 0, alors pour tout e > 0, il existe a G A G]0,e[. Maintenant, si
a: G R, alors [|]a G A et x - [§]a G [0,o[, et donc \x - [|]a| < e. Ceci montre que A est dense dans R.
(ii) Soient N = 3141592 et e = log ^±. La question peut se reformuler sous la forme : existe-t-il n G N
et m G Z tels que 0 < nlog2 - logN - m log 10 < e? Or log 2 et log 10 sont linéairement indépendants
sur Q car 2n = 10m implique ra = 0 (en regardant la valuation 5-adique) et donc aussi n = 0. Il s'ensuit
que le sous-groupe de R qu'ils engendrent ne peut pas être de la forme Z • a, sinon on aurait log 2 = ma
et log 3 = na et n log 2 = ra log 3 ; il est donc dense dans R d'après le (i). Par densité, il existe ni, rai G Z
224
VOCABULAIRE MATHÉMATIQUE
tels que |ni log2 - logN - mi loglO - §| < §, et il existe n2,m2 avec n2 > |ni| et m2 > |mi| tel que
|n2 log 2 - m2 log 10| < § ; alors n = ni + n2 et m = mi 4- m2 conviennent.
(iii) Si a3 + b3y/2 = (ai + 61 y/2)(a2 + 62v/2), on a a.3 = aia2 + 26i62 et 63 = aib2 4- a26i, ce qui nous
donne a3 - b3y/2 = (ai - h\/2)(a2 - 62\/2). On en déduit que a§ - 26§ = (a3 4- &3\/2)(a3 - b3y/2) est
aussi égal à (ai + bi\/2)(a2 + 62v/2)(ai - hV2)(a2 - b2\/2) = (a? - 26f)(a| - 26|) = 1.
Maintenant, si a2 - 262 = 1 avec a, 6 € N, il existe n tel que (3 4- 2\/2)n ^ a 4- 6\/2 < (3 4- 2\/2)n+1
(on a n = [}^g+^j]). Alors (3 - 2s/2)n(a + by/2) = c + dy/2, avec c, d € Z vérifiant c2 - 2d2 = l et
1 < c 4- d\/2 < 3 + 2\/2. Comme (c - d\/2)(c 4- d\/2) = 1, cela implique 3 - 2\/2 < c - d\/2 ^ 1. On en
tire donc l'encadrement 2-\/2<c<2 + \/2, et donc c = 1,2 ou 3 ; le seul couple possible vérifiant en
plus c2 - 2d2 = 1 est donc (c, d) = (1,0), ce qui nous donne a 4- by/2 = (3 + 2\/2)n, et permet de conclure.
Exercice 15.3. Il suffit de recopier les arguments de l'exemple précédent en écrivant X)n=i *~1*" * sous
la forme ELi/o1^)71"1^-
Exercice 15.4. (i) Si l^neN un est semi-convergente, on a en particulier un —► 0 quand n —» +00, et donc
\un\ < 1 pour n assez grand ; on en déduit la convergence absolue de la série 13neN wn#n> si |wn| < 1.
Soit Sn = 5Zn<Nwn- Si e > 0, on peut choisir N0 tel que |SN - Sn0| < £ pour tout N > N0, ce qui
se traduit aussi par | Z)n=N0+i Un\ ^ e> P°ur tout N ^ No. La sommation d'Abel nous fournit l'identité
En=N0+i unxU = En=No+i(xn ~ *n+1)(sn - SNo) + *n+1(sn - SNo)> ce qui nous donne la majoration
|(En<N^n)-SN| < En<N„ K\(l-Xn)+(J2n^(xn-Xn+l) + (l-^+l))s < £n<N„ K|(l-^)+2e.
On peut alors choisir ô < 1 tel que En<N0 lMn|(l - x11) ^ e, si x €]<5,1[, et un passage à la limite
quand N -► +00 nous fournit la majoration |(Dn€Nwn£n) ~ sl ^ 3e> si x ^]5,1[. Ceci prouve que
S = lim^i- ( E„6N un*n) •
(ii) La série double à termes positifs E^jeN la*l IM Peut se calculer en sommant d'abord par rapport
à i, puis par rapport à j, et elle vaut donc (Ei€N |ai|)(X)jeN IM)- ^n en déduit que la série double
E(t,i)€N aibj ^ absolument convergente, et donc que l'on peut calculer sa somme S en regroupant
les termes comme on le veut. En sommant d'abord par rapport à i, puis par rapport à j, on obtient
s = ( EjgN ai) ( EjeN bi) î et en sommant sur i + j = n, puis sur n, on obtient S = EneN c^» °ù ^a série
dans le membre de doite est absolument convergente. Ceci permet de conclure.
(iii) Comme CnXn = Ei+j=n(aixi)(bJxJ)> 0n a £n<ENCn*n = (£neNanZn) ■ (£n(EN6nZn) d'aPrès
le (ii), si \x\ < 1, car alors les séries sont absolument convergentes. On en déduit, en passant à la limite
en I" grâce au (i), l'identité £n(ENcn = (£neNan) • (£n(EN&n).
(iv) Si an = bn = (~+ly > avec 0 < 5 < |, les séries £nGN an et £nGN bn sont semi-convergentes d'après
le critère de Leibnitz. Maintenant cn = (-l)n Ei+i=n ((<+1)^+1)).- Or y/(i + l)(j + l) ^ ^4±^, et donc
M ^ (n?i)*ï » et lC^l "* +0° (lUand U "* +0°- Par COntre» la limite de EnGNCn^n = (EnEN^) "
(EnGN6n^n) en 1" existe et vaut (EnGNan) ■ (£n<EN6n) d'après les (i) et (ii).
Exercice 15.5. (i) L'idée est simple : on construit (p(n) par récurrence en posant </>(0) = 0 et en prenant
pour <p(n), le plus petit i n'appartenant pas à {<p(0),... ,</>(n - 1)} tel que xi soit ^ 0 (resp. < 0) si
xtp(o) + - • • + £<p(n-i) est ^ £ (resp. > £) de manière à osciller autour de £ et à n'omettre aucun Xi.
Par construction <p est injective. Par ailleurs, l'hypothèse selon laquelle £iGN \xi\ = +oo et YlieNXi ^
semi-convergente implique que les sommes des xi ^ 0 et des Xi < 0 sont toutes les deux infinies. On en
déduit que x^n) ne peut pas être ^ 0 ou < 0 pour tout n assez grand, et donc qu'il existe une infinité
de n pour lesquels x^n) < 0 et une autre infinité pour lesquels x^) ^ 0 ; comme on a pris à chaque fois
le premier vérifiant une de ces conditions, cela montre que <p est surjective. Enfin, si on note ni,7i2, • • •
les entiers n pour lesquels a;^) H h a:v>(n_1) - £ est de signe différent de a^o) H h x<p(n) - ^ on a
|aV(o) + ■ ■ ■ + av(„) - £\ < sup(|av(nfc)|, |^(nfc+1-i)|), si nk ^ n < n^+i - 1. Or la semi-convergence de
21. CORRIGÉ DES EXERCICES
225
DneN^n implique que xn -> 0 quand n -> +oo; il en est de même de sup(|a?v(nfc)|,|a?v(nfc+l_i)|) quand
fc —» +oo car <p(rik) et y>(rifc+i -1) tendent vers +oo. La suite des X]n<N xv(n) a donc pour limite £ quand
N —» +oo, ce qui démontre le (i).
(ii) Le (i) permet d'exhiber une surjection du groupe des permutations de N sur R; ce groupe n'est
donc pas dénombrable.
Exercice 15.6. (i) Si k = 0, la formule est immédiate. La cas général s'en déduit par récurrence :
Sir"-!»!*" = iftS&.-sPHsB'-sBL,)) = t^V(N+l)-/M(N)) = L*££>MI(N).
(ii) Si P = a,kxk H h a0, alors P[1'(x) = P(x +1) - P(x) = kakxk~l H . Une récurrence immédiate
montre que pM est de degré < k - i, et que le coefficient de xk"i est k(k - 1) • • • (k - i + l)a£. Pour i = fc,
cela nous dit que P^' = k\ak est la dérivée fc-ième de P.
(iii) Soit P = Yli=of(a + ^)n:7e{o,...,i,...,A;} jEf Ie polynôme de degré ^ k prenant les mêmes valeurs
que / en a,a + l,.. .,a + fc. On a donc /^(a) = P^'(a). Alors P-/ s'annule en a,a +1,... ,a + fc. On en
déduit, en utilisant le lemme de Rolle, que P' - /' s'annule en au moins k points distincts de [a, a + k] (au
moins un sur chacun des ]a + i,a + i + 1[), et une récurrence immédiate montre que P^ - /(*) s'annule
en au moins k + l-i points distincts de [a, a + k]. Pour i = k, cela nous dit qu'il existe c G [a,a + fc] tel
que f^(c) = P^(c). On conclut en remarquant que P^(c) = P^'(a) d'après le (ii).
(iv) Soit k tel que -s - k < -1. Alors f^(x) est de la forme C(x + 1)"*, avec t = s + k > 1, et
C = (s)(-s-1) • • • (-5-fc + l). Maintenant, en combinant le (i) et le (iii), on peut majorer |S^ — S^Lil
par |C|(N+1)~* puisque x i-> (x+1)"1 est décroissante sur [N, N+fc]. On en déduit que £N€N(s!}' ~sn-i)
est absolument convergente, et donc que la suite S^' a une limite quand N —> +oo.
(v) Si 5 > 1, la série Ylnen (n+l)« converge absolument et donc F (s) en est la somme. En changeant
n + 1 en n, on obtient aussi F(s) = £+~ i=^-. On a donc F(s) - C(s) = -2 £j5 ^ = -21"aC(«)
etF(a) = (l-21-)C(a).
(vi) Il suffit de prouver que F(-m) G Q si m G N. Si k ^ m + 2, F(-m) est la limite de SJJ1
quand N —» +oo. Or les (i) et (iii), combinés avec le fait que la dérivée fc-ième de x h-» (1 + x)m est
identiquement nulle, impliquent que S^' - S^Li = 0 pour tout N ^ 1. Autrement dit, la suite S^' est
constante et F(-rn) = Sq . On conclut en remarquant que Sq G Q car c'est une combinaison linéaire
finie, à coefficients dans Z[±], de /(0),..., f(k).
Exercice 16.1. En revenant à la définition de la topologie produit, on voit qu'il suffit de prouver qu'on
peut toujours construire une fonction continue de R dans C prenant des valeurs prescrites en un nombre
fini de points. Ceci ne pose pas de problème (on peut par exemple prendre un polynôme d'interpolation
de Lagrange).
Exercice 16.2. On peut prolonger u^ en une fonction continue sur N en posant tt(n)(+oo) = 0. On
prolonge aussi u en posant u(+oo) = 0. Alors u^ —> u uniformément sur N et donc u est continue
en +oo, ce qui se traduit par lim/^+oo Uk = 0.
On peut aussi se passer de N, en recopiant la démonstration du point précédant l'exercice. Soit e > 0.
Comme u^ —> u uniformément sur N, il existe N0 G N tel que [u^ -Ufc\ < £, quels que soient n ^ N0
et k G N. Choisissons n ^ N0. Comme lim/^+oo u^ = 0, il existe N G N tel que |tij. | < e, pour
tout k ^ N, et on a |u*| ^ |^n) - tifc| + |^n)| < 2e, pour tout k ^ N. On en déduit que limfc_+00 ti* = 0.
Exercice 16.3. (i) (an)neN •-> Q>n est continue, et la série converge uniformément vers sa somme (le reste
est majoré par ^) ; on en déduit la continuité de (an)neN ■-> SneN io&i -
226
VOCABULAIRE MATHÉMATIQUE
(ii) L'existence de l'écriture en base 10 montre que [0,1] est l'image du compact {0,1,..., 9}N (c'est un
produit dénombrable de compacts métriques) par l'application continue (an)n6N ■-» Z)neN io°'Vr ; c'est
donc un compact.
Exercice 16.4. Comme fn —» / uniformément sur E, elle vérifie le critère de Cauchy uniforme, et
on a lim ( sup \fn(x) - fn+P(x)\) = 0. Or \en - en+p\ < supxeE \fn(x) - fn+P(x)l et donc
n-H-oo x€E,p€N
lim ( sup \ên - tn+p\) = 0> ce qui prouve que (£n)neN est de Cauchy et comme C est complet, elle
»-*+°° P6N
admet une limite L
Soit maintenant e > 0. Comme fn —► / uniformément sur E, il existe N0 € N tel que l'on ait
\fn(x) — f(x)\ < e, quels que soient n ^ No et x € E. Choisissons n ^ No. En passant à la limite, on en
déduit que \ln - £\ < e. Par ailleurs, il existe M > 0 tel que \fn(x) - £n\ < e, si ||x|| > M ; on a donc
\f(x) -e\< \f(x) - fn(x)\ + \fn(x) - 41 + \en -e\< 3e,
si ||a;|| > M, ce qui prouve que / tend vers l à l'infini.
Exercice 16.5. (i) Soit e > 0. Comme / est continue sur [0,1], qui est compact, elle est uniformément
continue et il existe S > 0 tel que \f(x) - f(y)\ < e si \y - x\ < <5. Soit N € N tel que ^ ^ ô. Alors
1/0*0 - f(é)\ < £ P°ur tout x e [i/2n, (i + l)/2n[, si n ^ N, et donc ||/ - /«H» < e (la norme || H^
étant relative à l'intervalle [0,1[), pour tout n ^ N. Il s'ensuit que fn —► /, uniformément sur [0,1[.
(ii) Il s'agit de prouver que (un)n€N est de Cauchy. Soient e > 0 et N € N tels que \f(x) - f(£)\ ^ e
pour tout x € [t/2», (i+l)/2»[, si n ^ N. On aun-Wn+p = ^ ZZô' E%£ (/(£) -/(£ + sfe)) et
|/(^t)-/(^t + 2^ff)I < £i pour tous t,j, si n> Netp€ N. On en déduit la majoration |«n-«n+p| ^ e,
pour tous n ^ N et p G N, ce qui montre que («n)neN est de Cauchy.
Exercice 17.1 (i) Comme u(x)i = Y%=iai,jxji on a \u(x)i\ ^ H«||ooZ)j=i \ai,j\- On en déduit que
IMIoo < sup1<i<n Y%=i \a>i,j\- Maintenant, si Xj = e~e\ où $j = arg(o*j) (resp. Xj = 1 si aitj = 0), alors
Iklloo = 1 et u(x)i = Y%=i \ai,jl et donc \\u\\oo ^ Y%=i \ahj\- Ceci étant vrai pour tout i, on obtient
IMIoo > supKi<n^=i Wijl ce qui permet de conclure.
(ii) L'hypothèse équivaut à ||u||oo < 1 ; elle implique qu'il existe c < 1 tel que ||wn||oo ^ cn pour tout
n ^ 1. Si on note a\j les coefficients de la matrice An de m", on a donc \a\j\ ^ cn pour tous i,j, ce qui
prouve que la série des An converge, et comme (1 - A)(l + A H h An_1) = 1 - An, un passage à la
limite montre que 1 - A est inversible d'inverse 13neN ^n- ^n en déduit l'inversibilité de 1 - u.
Exercice 17.2. (i) Si <j> € E, alors ||0||oo est fini car [0,1] est compact et une fonction continue sur un
compact est bornée. Que || ||oo soit une norme sur E est alors immédiat. Maintenant, une suite (0n)neN
est de Cauchy pour || H,» si et seulement si elle vérifie le critère de Cauchy uniforme sur [0,1], et C étant
complet, on sait (alinéa 16.2) que (0n)n€N admet une limite simple 0 qui est continue sur [0,1], et que
<t>n -» <f> uniformément sur [0,1], ce qui signifie exactement que (j>n > (j> pour || lloo*
On en déduit la
complétude de (E, || ||oo).
(ii) Que || ||x soit une norme est immédiat à part peut-être le fait que « ||0||i = 0 » implique «0 = 0».
Mais si <j> ^ 0, il existe x0 G [0,1] avec 0(xo) ¥" 0, et comme <j> est continue, il existe un intervalle I de
longueur non nulle l sur lequel |0(x)| ^ |^(x0)/2|. On a alors ||0||i ^ £\<f>(x0)/2\ > 0. Maintenant, soit
(j>n = x~l/2l[i/n%i]. La suite (<f>n)n^i est de Cauchy car
Hn+P ~ Ml = / X^dx = 2(^ - -=t==) < 4-
Si cette suite avait une limite <j> dans E, on aurait limn_»+00 f* \<f>-<f>n\ = 0. Or, pour tous a > 0 et n > 1/a,
on a /o |0 - 0n| ^ ^ \<j> - 4>n\ = fl \(f>{x) - x-l'2\ dx. On devrait donc avoir J1 \<f>{x) - x~l'2\ dx = 0,
21. CORRIGÉ DES EXERCICES
227
quel que soit a > 0, et <f> étant continue, cela implique que <f>(x) = a:"1/2, pour tout x > a et tout a > 0,
et donc que <f>(x) = x~1/2 si x e]0,1]. Ceci n'est pas possible car cette fonction n'est pas la restriction
à ]0,1] d'une fonction continue sur [0,1]. En résumé (<t>n)neN n'a pas de limite dans E, et E n'est pas
complet pour || || x -
(iii) Si les normes étaient équivalentes, les suites de Cauchy seraient les mêmes dans les deux cas, et
donc E serait simultanément complet ou non pour les deux normes, ce qui n'est pas le cas. On peut aussi
remarquer que ||0n||i ^ 2 pour tout n, alors que ||0n||oo —> +oo
Exercice 17.3. (i) id : (X, &[) —> (X, <^) est continue si et seulement si l'image réciproque de tout ouvert
de (X, $2) par id est un ouvert de (X, <^i), et donc si et seulement si tout élément de <^2 est élément
dec^i.
(ii) Si <f)n{x) = </>(f ), où <l>{x) = (1 - |a?|)l[_lfl](aO, alors ||</>n||oo = *> tandis °lue H^»l|i = n tend
vers +oo, ce qui prouve que id : (^(R), || ||oo) —> C^c(R)> Il ||i) n'est pas continue et donc que ^ n'est
pas plus fine que &[.
De même, si <t>n(x) = inf(n, \x\-1/2 - l)l(_M](a;), alors H^Hx ^ f^ (\x\~1'2 - l) dx = 2, tandis que
H^nlloo = n tend vers +oo, ce qui prouve que id : (^C(R), || ||i) —> (^C(R), || ||oo) n'est pas continue et
donc que <^i n'est pas plus fine que <^o.
Exercice 17.4. Soit bn = ^ et soit £ = infn^i bn. Montrons que bn —> £\ il s'agit de vérifier que vn < c,
pour tout n » 0, si c> £. Soit d ^ 1 tel que &</ < c. On a ddq+r < qad+ar, comme le montre une récurence
immédiate (sur q), et donc bdq+r ^ -^bd + -^K. Soit Q ^ 1 tel que sup0<r<l|_i ^ < ^, pour
tout q ^ Q. On a alors bn ^ &</ + ^^ = £^£L ^ c, pour tout n ^ dQ. Ceci permet de conclure.
Exercice 17.5. (i) On a ||ti||8p = |M|sp = 0 car u2 = v2 = 0, et ||tit;||Bp = \\u + v\Uv = 1 car (u + v)2 = 1
et (uv)2 = uv.
(ii) Comme u et v commutent, on a (uv)n = unvn, et donc ||(tw)n|| < ||nn|| ||vn||. En prenant les
racines n-ièmes et en passant à la limite, on en déduit l'une des deux inégalités ||îw||hp ^ IMIsp IMIsp à
démontrer.
Passons à l'autre. Posons a = \\u\\sv et 6 = ||v||Sp- Multiplier u et v par À G C* multiplie ||u||, \\v\\,
\\u + v\l a, b et ||ti + t;||8p par |A|. On peut donc supposer \\u\\ < 1 et ||v|| < 1 ; on a alors H^H < 1,
Ht;* || < 1, pour tout i, et a < 1, b < 1. Soit e > 0 tel que o + e<let6 + e<l. Il existe I ^ 1 tel que
11^*11 ^ (a + £Y et ll^ll ^ iP + e)i» Pour tout O I. On a alors, car u et v commutent,
ii(«+<n = Il E (D^-'W < E (1) ni'hi"-'
i=o VV i=0 \V
<E Q<>+«)"-*+E (")(«+*>'(*+«r-+f Ê C)(fl+e)<
I-l • v
^(a + 6 + 2e)n + ^(n)((6 + er-i + (a + e)n-i)
i=0 ^ '
On peut mettre (a + b + 2e)n en facteur, et dans la parenthèse, il y a 1 plus deux termes du type
<5nX]i=i <**(")> avec 6 < 1, qui tendent vers 0 (car produits d'un polynôme par une exponentielle de
raison < 1). La parenthèse tend donc vers 1, et la limite de \\u + v\\l/n est donc ^ a + b + 2e. Le résultat
s'en déduit en faisant tendre e vers 0.
Exercice 17.7. (i) (a, 6) i-> a + b est linéaire, et on a \a + b\ < |a| + |6| ^ 2||(a,6)||oo ; on en déduit la
continuité de (a, 6) i-> a + 6. De même, (a, 6) i-> ab est bilinéaire, et on a |aè| = |a| |6| ^ |a| |6| ; on en
déduit la continuité de (a, 6) »-► ab.
228
VOCABULAIRE MATHÉMATIQUE
(ii) / + g est la composée de x h-» (f(x),g(x)) de X dans K2, et de (a, 6) h-» a + 6 de K2 dans K-
elle est donc continue comme composée d'applications continues. De même, fg est la composée de
x •-> (f(x)i9(x)) de X dans K2, et de (a, 6) h-» ab de K2 dans K ; elle est donc continue comme composée
d'applications continues.
Exercice 18.1. La sesquilinéarité de ( , ) suit facilement de la linéarité de l'intégration; sa symétrie est
une évidence. Enfin, si / ^ 0 et si f(t0) ^ 0, il existe un intervalle I contenant £0> ouvert dans [0,1],
tel que \f(t) - /(*0)| ^ ^, et donc |/(t)| ^ i^fail, pour tout tel; alors (/,/> = £ \f(t)\2dt i
|/(fa)l lg(I) > 0, ce qui prouve que ( , ) est défini positif.
Exercice 18.2. *AA est la matrice de Gram des colonnes Xi,... ,Xn de A. Son déterminant | det A|2 est
donc Y\j=ld(Xj,vect(Xi,...,Xj-i))2. Par ailleurs, on a |aij|2H h \anj\2 = ||Xj-||2, et on conclut en
remarquant que d(Xj, vect(Xi,... ,Xj-i)) ^ ||Xj-||.
Exercice 18.3. (i) Soit X = \xu... ,xn) G Rn vérifiant AX = 0 et soit s = Y£=ixi- La condition
AX = 0 se traduit alors par ks + (ki - k)xi = 0 pour tout i. Si k = 0, alors A est diagonale et inversible
puisque les coefficients diagonaux sont non nuls par hypothèse car > 0. On peut donc supposer k > 0, et
il y a deux cas :
o ki = k pour un i et alors s = 0, Xj = 0 si j ^ i, et donc xi = 0 aussi puisque 5 = 0.
o ki > k pour tout i, et alors Xi est de signe opposé à celui de s pour tout i, et donc Xi = 0 pour tout i
puisque s est la somme des £*.
Il s'ensuit que dans tous les cas, 0 est l'unique solution de AX = 0, et donc le système est de Cramer
et A est inversible.
(ii) Si E c {1,..., m} soit XE = \xi,..., xm) G Rm définie par Xi = 1 si i G E, et Xi = 0 si i £ E. On
a alors ^eXf = |E n F|, si E, F c {1,..., m}. Soit donc I = {Ex,..., En} vérifiant les conditions de la
question. Alors la matrice de Gram des E* a tous ses coefficients non diagonaux égaux à k ; de plus ses
coefficients diagonaux sont > 0 puisqu'on a supposé les E* non vides, ils sont ^ k puisque |E$| ^ |E$nEj|,
si i t£ j, et au plus un est égal à k car |E^| = |E^| = lE^nE^I implique E* = E,. D'après le (i), ceci implique
que la matrice de Gram est de rang n ; il s'ensuit que Xejl ,..., Xeu est aussi de rang n, et comme ces
vecteurs vivent dans un espace de dimension m, on a n ^ m.
(iii) Si F est un corps fini, de cardinal q, deux droites distinctes du plan projectif P2(F) se coupent
en exactement 1 point, et il y a autant de droites que de points (une droite de P2(F) est l'image d'un
plan de F3, et comme un plan est défini par une équation à scalaire près, cela fournit une bijection
entre les plans de F3 et les droites de F3, et donc une bijection entre les droites de P2(F) et les points
de P2(F)). Ceci fournit un exemple avec |I| = m = q2 + q + 1 et k = 1. Plus généralement, deux
hyperplans distincts de P/c(F) se coupent en un sous-espace de codimension 2, ce qui fournit un exemple
avec |I| = m = qk + ■ ■ ■ + q + 1 et k = qk~2 + - - - + 1
Exercice 18.4. Utilisons « symétrie » pour désigner une symétrie orthogonale par rapport à un hyperplan.
(i) La symétrie orthogonale par rapport à (ui - V2)L fait l'affaire (et c'est la seule).
(ii) Si n = 1, alors s = ±1 est le produit de 0 ou 1 symétries. Supposons donc n ^ 2. Si u(v) = v pour
tout v, alors u est le produit de 0 symétries. Sinon on choisit v G V tel que u(v) ^ v et u étant unitaire,
on a ||u(u)|| = ||v||, et le (i) nous fournit une symétrie s\ tel que s(u(v)) = v. Alors Si o u est unitaire et
laisse fixe v, et donc aussi son orthogonal V7. La restriction de Si o u à V7 est produit d'au plus n - 1
symétries $2 ° " " " ° sr d'après l'hypothèse de récurrence. On prolonge s^ en une symétrie de V en posant
Si(Xv + v') = Xv + sfa') si A G K et v' G V7 (ceci est bien une symétrie par rapport à un hyperplan, et
elle est unitaire car s^ l'est et \v est orthogonal à v' et ^(v7)). Alors si o t; = $2 o ■ ■ ■ o sr car les deux
membres coïncident sur v et sur son orthogonal V7. Comme sfl = Si, on obtient u = Si o ■ • • o sr, ce qui
permet de conclure.
21. CORRIGÉ DES EXERCICES
229
Exercice 18.5. Si A G U(n), il existe P G U(n) tel que A = PDiag(eWl,...,ei*n)P"1. Alors
A(t) = PDiag(eifflt,...,eWwt)P"1 G U(n), pour tout t G [0,1], et t *-+ A(t) est un chemin reliant 1
à A dans U(n). On en déduit la connexité de U(n) par arcs. Celle de SU(n) se démontre en remarquant
que l'on peut imposer Yh=i #î = 0 si A G SU(n), et alors A(t) G SU(n), pour tout t G [0,1].
Exercice 18.6. Si P G SO(n), il existe Q G O(n) tel que QPQ"1 soit de la forme Diag(R^,... ,R^m)
ou Diag(l,R^,...,R^m) suivant que n est pair ou impair. Mais alors t i-> Q"1Diag(R^1,... ,R^m)
(resp. t •-> Q"1Diag(l,R^1,.. -,Rtem)) est un chemin dans SO(n) reliant 1 à P. Il s'ensuit que SO(n)
est connexe par arcs.
O(n) n'est pas connexe car son image par l'application déterminant, qui est continue, est {1, —1} qui
n'est pas connexe.
Exercice 18.7. (i) Soit A G GLn(C). On peut écrire A sous la forme A = PM, avec P G U(n), et M
triangulaire supérieure à coefficients diagonaux > 0. Par ailleurs, d'après l'ex. 18.5, on peut trouver un
chemin t h* P(t) joignant ln à P dans U(n). Alors t h* P(t)(tM + (1 - t)ln) est un chemin joignant ln
à A dans GLn(C). On en déduit la connexité par arcs de GLn(C).
Si A G SLn(C), dans la décomposition A = PM, on a P G SU(n) car detP est à la fois de module 1
et > 0. Par ailleurs, on peut écrire M sous la forme Diag(eai,... ,ea?l)N, où Y%=iai = 0 et N est
triangulaire supérieure avec des 1 sur la diagonale. D'après l'ex. 18.5, on peut trouver un chemin t •-> P(t)
joignant ln à P dans SU(n). Alors t h* P(t) Diag(eai*,... ,eant)(tN + (1 - t)ln) est un chemin joignant
ln à A dans SLn(C). On en déduit la connexité par arcs de SLn(C).
(ii) La démonstration dans le cas de SLn(R) est la même que pour SLn(C) ; il suffit de remplacer
le résultat de l'ex. 18.5 par celui de l'ex. 18.6. Par contre GLn(R) n'est pas connexe car son image par
l'application déterminant est R* qui n'est pas connexe.
Exercice 18.8. (i) L'application P »-> *PP de Mn(C) dans Mn(C) est continue, et U(n) est l'image
inverse du fermé {1} ; il est donc fermé dans Mn(C). Par ailleurs, il est borné car *PP = 1 implique que
les termes diagonaux YHj=i \aij\2 sont égaux à 1 pour tout j, et donc \a^j\ ^ 1 pour tous i, j. Comme
Mn(C) est un espace vectoriel de dimension finie sur C, cela implique que U(n) est compact.
(ii) Le polynôme caractéristique de M est (X - l)n ; on a donc (M - l)n = 0 d'après le th. de
Cayley-Hamilton. Comme (M - l)n = 0, la formule du binôme nous donne Mm = (1 + (M - l))m =
Y%Zo Cfe)(M ~ !)*> ce °lu* est effectivement un polynôme en m. Comme un polynôme est borné si et
seulement si il est constant, il s'ensuit que {Mm, m G Z} est borné si et seulement si Mm = 1, pour tout
m, et donc M = 1 (pour m = 1).
(iii) Soit H un sous-groupe compact de GLn(C) contenant U(n), et soit A G H. On peut écrire A
sous la forme A = PM, où P G U(n), et M est triangulaire supérieure à coefficients diagonaux réels > 0,
et comme H contient P"1, il contient aussi M. Soient Ai,... ,Àn les coefficients diagonaux de M; ceux
de Mm, pour m G Z, sont alors À™,..., À£\ et comme Mm G H qui est compact par hypothèse, on en
déduit que {À?\ m G Z} est borné et donc que À* = 1 pour tout i. Le (ii) montre alors que M = 1 si
{Mm, m G Z} est borné, ce qui est le cas puisque Mm G H pour tout m G Z. On a donc prouvé que
A G U(n), ce qui permet de conclure.
Exercice 18.9. (i) La sesquilinéarité de (, ) résulte de la linéarité de l'intégration, la symétrie est évidente,
et pour prouver que ( , ) est définie positive, il suffit de recopier les arguments de l'ex. 18.1.
(ii) Une intégration par partie nous donne
f f{t)*g(t) dt = [-Jg% + f l\t)g'{t) dt = [-Jg% + {f"g)l0 + f Af(t)g(t) dt.
Jo Jo Jo
Comme [-Jg% = [j"g]l = 0 par périodicité de / et g, on obtient jj J(t)Ag(t) dt = f* &J(t)g(t) dt =
JQ Af(t)g(t)dt, et donc (/, Ag) = (A/,</), ce qui prouve que A est autoadjoint.
230
VOCABULAIRE MATHÉMATIQUE
Maintenant, À € C est valeur propre de A si et seulement si il existe <f> : R —► C, de classe if00,
périodique de période 1, solution de l'équation différentielle <}>" 4- À0 = 0. Les solutions de cette équation
différentielle sont de la forme t h-» ae^1 + /te-"^* si A ^ 0 ; une telle solution peut être périodique de
période 1 si et seulement si \/-Â € 2mZ. Il s'ensuit que les valeurs propres de A sont les 47r2n2, pour
n € N, l'espace propre associé étant engendré par <j>n et <f>-n avec </>n(t) = e2innt, si n ^ 0 (l'espace
propre associé à 0 est l'espace des fonctions constantes ; il est de dimension 1).
(iii) L'opérateur A n'est pas continu car |j^Tr||A0n|| = 4ir2n2 tend vers +oo quand n —► +oo, et donc
A n'est pas lipschitzien.
Exercice 18.10. (i) Pn = |x»-pw1_1(x»)||(Xn ~~ Pn-i(Xn)), où pn_i désigne la projection orthogonale de
R[X](n> sur R[X](n_1). Il est apparent sur cette formule que Pn est de degré n, de coefficient dominant > 0.
(ii) Soient ai,... ,ar les zéros d'ordre impair de Pn dans ]0,1[. Alors Pn ]li=i(X - a*) est de signe
constant sur [0,1], et donc (Pn, ]li=i(x - <*i)) est non nul. Comme Pn est orthogonal à R[X](n-1), cela
implique que r ^ n, et donc que tous les zéros de Pn sont dans l'intervalle ]0,1[ et sont de multiplicité 1.
(iii) Il s'agit de vérifier que (P,RQ) = (RP,Q>, pour tous P,Q, mais c'est immédiat sur la définition.
(iv) XPn_i = £^-Pn + Q, où Q € RpCp-D, et donc (Pn,Q) = 0 et (Pn,XPn_i) = fe=i, Car
<P»,P») = 1.
(v) Si an = ^77, alors Pn - anXPn_i est de degré ^ n — 1. Il existe donc bn,c„, tels que
Q = P - anXPn_i - (6nPn-i - CnPn-2) soit de degré < n - 2. Mais alors
(Q,Pn - (a„X + 6n)Pn_i + cnPn-2> = (Q,Pn> - <(a„X + 6n)Q, P„_i> + (cnQ, Pn_2) = 0,
car Q est orthogonal à Pn et Pn_2 puisque deg Q < n - 2, et (anX + 6n)Q est orthogonal à Pn-i puisque
deg((anX + 6n)Q) < n - 1. On a donc (Q,Q) = 0, ce qui prouve que Q = 0. Il reste à vérifier que
^ > 0. Or 0 = (Pn-2,Pn - (a„X + 6n)Pn-i + CnPn-2> = cn - (Pn_2,anXPn_i> = cn - anf=\, et donc
(vi) On raisonne par récurrence sur n. Il n'y a rien à prouver si n = 1. Si n > 2, l'hypothèse de
récurrence rcn-i,i < rcn_2,i < £n-i,2 < rcn-2,2 < ••• implique que Pn-2(«n-i,n-i) > 0 puisque le
coefficient dominant de Pn_2 est > 0, et Pn-2(^n-i,n-2) < 0,..., Pn-2(xn-i,n-i) est de signe (-1)*"1,
car Pn-2 change de signe en chacune de ses racines. Or Pn-2(^n-i,i) et Pn(«n-i,i) sont de signes opposés
d'après le (v). On a donc Pn(rcn-i,n-i) < 0, Pn(rcn_iin_2) > 0,..., Pn(«n-i,i) de signe (-l)n_1. H y a
donc une racine de Pn entre rcn-i,i et rcn-i,2> une entre xn-i,2 et xn-i,3. etc., ce qui nous en fournit déjà
n - 2. De plus, le coefficient dominant de Pn étant > 0, on a Pn(rc) > 0 pour rc » 0, et donc Pn a une
racine > rcn_i>n_i, et on a Pn(«) de signe (-l)n, pour x < 0, et donc Pn a une racine < rcn_i,i. Ceci
permet de conclure.
Exercice 20.2. (i) On a \x + y\p < |rc|p. Si \x + y\p < \x\p, alors x = (x + y) - y et donc \x\p <
supflrc + y|p, \y\p) < \x\p, ce qui est absurde. Donc \x + y\p = \x\p.
(ii) Comme un —» 0, la série Yn^i un converge et si on note y sa somme, alors \y\p ^ supn^i |wn|p-
Comme on a supposé |«o|p > |«n|p> pour tout n ^ 1, on en déduit \y\p < |«o|, puis |«0 + y\p = l«o|p ; en
particulier, «0 + y = En€N un ¥" 0.
Exercice 20.3. (i) Si n = 1, alors 77 - 1 est racine du polynôme P(X) = (1+^""1 = YX^à a*xi> où
ai = (^j), et donc ao = p, ap_i = 1 et a* est divisible par p, et donc vérifie |ai|p ^ p-1 si i < p - 2.
Maintenant, si \z\p ^ pi, alors \aiZl\p = la^lpl^l*, atteint son maximum pour un unique i € {0,... ,p-l}> à
savoir i = p-1 si \z\p > p\ (auquel cas on a |P(z)|P = Hp1-1), et i = 0 si \z\ < px (et alors |P(z)|P = P-1)-
Il s'ensuit que P(z) ^ 0 pour un tel 2, ce qui permet de conclure.
21. CORRIGÉ DES EXERCICES
231
Si n ^ 2, et si tj est une racine primitive pn-ième de l'unité, alors \rf - l|p = pn-u d'après l'hypothèse
de récurrence, et rj - 1 est racine du polynôme Pn(X) = (X + l)p - rf = XP(X) + (1 - rf). Comme p~l ^
pn_i ^ 1, la méthode précédente montre que Pn(z) ^ 0, si \z\p ^ p)[*v On a donc \rj - l\p = p][*x = pn.
(ii) Supposons [Qp : Qp] = d < +oo, et soient n tel que (p - \)pn~l > d, rj une racine pn-ième de
l'unité et a = rj - 1, de telle sorte que \a\p = pn. Comme [Qp : Qp] = d, les a*, pour i ^ d, forment
une famille liée. Il existe donc ao, - - - ,a<* G Qp, non tous nuls, tels que X^=oa*ai = 0- Mais ceci n'est
pas possible car les aiO;1 pour lesquels a* ^ 0 ont tous des normes différentes (la partie fractionnaire de
VpiaiQ1) est (p-i)Pn-i> et ces parties fractionnaires sont deux à deux distinctes car d < (p - l)pn_1), et
donc | Yi=o ûi^lp = supi<d laiû^lp ^ 0.
Exercice 20.6. (i) Par définition / est localement constante si et seulement si {x G X, f(x) = y} est
voisinage de chacun des ses points (ce qui équivaut à ce qu'il soit ouvert). Il en résulte que l'image inverse
de tout ensemble (en particulier d'un ouvert) est ouverte, et donc que / est continue.
(ii) {x G [0,1], f(x) = /(0)} est ouvert et fermé d'après le (i), et comme il est non vide et que [0,1] est
connexe, c'est [0,1] tout entier. Autrement dit, les seules fonctions localement constantes sur [0,1] sont
les fonctions constantes.
(iii) a + pnZp est à la fois ouvert et fermé, et donc {x, la+pnZp(a:) = 0} et {x, la+pnZp(x) = 1} sont
ouverts, ce qui permet d'utiliser le (i).
(iv) Si (j> : Zp —► Y est localement constante et si a G Zp, il existe na G N tel que <f> soit constante sur
a+pn<lZp. Les a+pUaZp forment un recouvrement ouvert de Zp et, Zp étant compact, on peut en extraire
un sous-recouvrement fini par des a + pn<tZpy avec a G A, où A est un ensemble fini. Soit n = supaGA na.
Si 6 G Zp, il existe a G A tel que b G a+pn<lZp et, comme n ^ na, on a b+pnZp c a+pn<tZp (deux boules
sont soit disjointes soit l'une est incluse dans l'autre). Il en résulte que <f> est constante sur b + pnZp pour
tout b G Zp.
(v) Comme Zp est compact, une fonction continue / sur Zp est uniformément continue. Ceci se traduit,
en notant || || la norme sur R ou la norme p-adique sur Qp, par l'existence, pour tout e > 0, de n G N, tel
que ||/(a?) - /(y)||| ^ e, pour tous x,yeZp vérifiant \x - y\p ^ p~n. Soit alors <j> = YSlô* /(O^+p^Zp-
Par construction, <f> est localement constante, et on a \\f(x) - <i>(x)\\ ^ e pour tout x G Zp (en effet,
sur i +pnZp, on a f(x) - <j>{x) = f(x) - f(i) et \x - i\p ^ p"n). Ceci permet de conclure.
(vi) On peut prendre la fonction qui envoie x G Zp, dont l'écriture en base p est Ylt^o anPn 0es an
sont des éléments de {0,1,... ,p - 1}) sur Yln^oanP~l~n ; nous laissons le soin au lecteur de vérifier que
cette fonction est 1-lipschitzienne et d'imaginer à quoi elle correspond sur la description arboricole de Zp.
L'image d'un connexe par une fonction continue est un connexe, et comme les composantes connexes
de Zp sont des points, toute fonction continue de [0,1] dans Zp est constante.
Exercice 20.7. (i) On a |(|)n|7 = 7"n et donc la série EÏÏ) (£)"£) converge dans if (Z7, Qr) vers une
fonction continue /. De plus, si k G N, alors f(k) = (-jp) , d'après la formule du binôme. On en déduit
que f(2k) = f(k)2 pour tout k G N, ce qui implique, compte-tenu de la densité de N dans Z7 et de la
continuité de /, que /(2a:) = f(x)2 pour tout x G Z7. Il en résulte que la somme S de la série qui nous
intéresse est une racine carrée de ^ ; on a donc S = ±|. Par ailleurs, tous les termes de la série, sauf le
premier, sont dans 7Zy, et donc S - 1 G 7Zy et S = ^, ce que l'on cherchait à démontrer.
(ii) Dans R la somme de la série est |.
CHAPITRE I
REPRÉSENTATIONS DES GROUPES FINIS
Si G est un groupe, une représentation V de G est un espace vectoriel sur un corps K
(ou, plus généralement, un module sur un anneau A) muni d'une action linéaire de G
(i.e. on demande que x h-» g • x soit une application linéaire de V dans V, pour tout
g 6 G). Il arrive souvent que G et V soient munis de topologies, et on demande alors, en
général, que (g, x) i-> g • x soit continue de G x V dans V.
Les représentations de groupes interviennent de multiples façons en mathématique,
en physique, ou en chimie. Par exemple, une des motivations initiales de la théorie des
représentations des groupes finis, dont il sera question dans ce chapitre, est venue de
la cristallographie. La physique des particules utilise grandement les représentations des
groupes de Lie comme le groupe SU(2) des isométries de déterminant 1 de C2 (muni du
produit scalaire usuel ((^1,^2), (2/1,2/2)) = #12/1 + £22/2), ou le groupe d'Heisenberg des
matrices 3x3 unipotentes supérieures (i.e. triangulaires supérieures avec des 1 sur la
diagonale), à coefficients réels, ou encore ceux de Lorentz (i.e. 0(1,3)) et Poincaré.
Si G est un groupe, la connaissance des représentations de G fournit des tas
d'informations sur G, et certains groupes ne sont accessibles qu'à travers leurs représentations. Par
exemple, l'existence du monstre, le plus grand des groupes finis simples sporadiques^), de
cardinal
246 • 320 • 59 • 76 • 112 • 133 • 17 • 19 • 23 • 29 • 31 • 41 • 47 • 59 • 71,
^Un groupe G est simple si ses seuls sous-groupes distingués sont {1} et G. Si un groupe fini n'est pas
simple, il possède un sous-groupe distingué non trivial H, et H et G/H sont deux groupes plus petits
que G à partir desquels G est construit. En réitérant ce procédé, cela permet de casser n'importe quel
groupe fini en une famille finie de groupes simples. La classification des groupes finis se ramène donc à
celle des groupes finis simples, et à comprendre comment on peut composer ces groupes simples pour
fabriquer des groupes plus gros. La classification des groupes finis simples s'est achevée au début des
années 1980 (elle court sur quelques milliers de pages, et personne n'en maîtrise vraiment la totalité...).
Il y a un certain nombre de familles infinies comme les Z/pZ, pour p premier, les groupes alternés An,
pour n > 5, les quotients de SLn(Fg) par leur centre (Fq est le corps à q élément), et quelques autres
découvertes par C. Chevalley en 1954. A côté de ces familles, il y a 26 groupes isolés, dits sporadiques.
234
CHAPITRE I. REPRÉSENTATIONS DES GROUPES FINIS
n'a été démontrée en 1982, par R. Griess, que grâce à la construction d'une de ses
représentations^ (de dimension 196883), alors que l'existence du monstre avait été prédite
en 1973 par R. Griess et B. Fischer (il y a une ressemblance certaine avec la chasse aux
particules élémentaires).
De même, on n'a de prise sur ^q, groupe des automorphismes du corps Q des nombres
algébriques (cf. annexe G), qu'à travers ses représentations. Celles-ci fournissent de
précieuses informations sur Q, et permettent de résoudre des problèmes classiques de
théorie des nombres. Par exemple, la démonstration du théorème de Fermât par
A. Wiles (1994) consiste à relier, de manière à en tirer une contradiction, deux types
de représentations de ^q : d'une part celles provenant des solutions (dans Q) de
l'équation y2 = x(x — ap)(x + 6P), où ap + bP = & est un contrexemple potentiel au théorème de
Fermât, et d'autre part, des représentations provenant des formes modulaires.
L'exemple de ^q agissant sur Q est en fait assez typique. Si on a un ensemble X sur
lequel un groupe G agit, et si on connaît bien les représentations de G, alors on peut
espérer en tirer des informations fines sur X. Ce principe de symétrie joue un grand rôle
dans une partie non négligeable de la physique théorique moderne.
La théorie des représentations présente deux aspects. Le premier de ces aspects
(décomposition d'une représentation en représentations irréductibles) est une généralisation
de la réduction des endomorphismes (valeurs propres, espaces propres, diagonalisation),
qui correspond, modulo un petit exercice de traduction (ex. 1.1.2 et 1.2.3, rem. 1.2.4), au
cas du groupe Z. Le second aspect (théorie des caractères) est une première approche
de l'analyse de Fourier dans un cadre non commutatif (ou commutatif, cf. alinéa 5.1
du n° 1.2). A part le cas de Z qui permet de faire le lien avec l'algèbre linéaire classique,
nous ne considérerons essentiellement que les représentations complexes des groupes finis
dans ce cours. Ce cas présente l'avantage d'être à la fois simple (il n'y a pas à se battre
avec les problèmes de convergence ou autres subtilités analytiques que l'on rencontre, par
W C'est la plus petite des représentations non triviales du monstre ; le début de la liste des dimensions
des représentations irréductibles du monstre est le suivant :
fx = l, f2 = 196883, h = 21296876, /4 = 842609326, /5 = 18538750076, /6 = 19360062527,...
J. McKay a remarqué en 1977, que 196883 avait un rapport avec les coefficients de Fourier de la fonction
modulaire j de l'ex. VII.6.10 : si on écrit j(z) sous la forme j(z) = J + 744 + 53n>1CnÇn, avec q =
e2inz, alors d = f2 + /i, c2 = h + h + /i, c3 = h + h + 2/2 + Vi- Vu la taille des nombres en
présence, il y avait peu de chance que ceci soit une coïncidence fortuite. Ce mystère, connu sous le nom
de "monster's moonshine", a été résolu par R. Borcherds en 1992, en utilisant des objets venant de la
physique mathématique, ce qui lui a valu la médaille Fields (1998). L'expression "monster's moonshine"
est moins poétique que ce qu'elle suggère, car "moonshine" doit être pris dans le sens de "bêtise, faribole",
comme dans la citation suivante de E. Rutherford : « The energy produced by the breaking down of the
atom is a very poor kind of thing. Anyone who expects a source of power from the transformations of
thèse atoms is talking moonshine. ».
1.1. REPRÉSENTATIONS ET CARACTÈRES
235
exemple, dans l'étude des séries de Fourier qui correspondent au groupe R/Z), et tout à
fait représentatif du genre d'énoncés que l'on peut espérer dans d'autres situations.
1.1. Représentations et caractères
1. Représentations de groupes, exemples
Le lecteur est renvoyé au Vocabulaire, n° 2.11.1, § 3 et n° 10.1, pour le vocabulaire et
les résultats de base d'algèbre linéaire et de théorie des groupes.
Soit G un groupe, de loi de groupe (g, h) *-> gh. Une représentation V de G est un
C-espace vectoriel muni d'une action (à gauche) de G agissant de manière linéaire. Une
telle représentation est équivalente à la donnée d'un morphisme de groupes pv de G
dans GL(V) : si g e G, l'application v i-> g • v est linéaire bijective et donc nous définit
un élément pv(g) de GL(V), et l'identité g • (h • v) = gh • v, valable quels que soient
g, h € G et v € V, se traduit par l'identité pv(gh) = pv{g)pv{h). Dans la suite on parlera
indifféremment de la représentation V de G ou de la représentation py de G, suivant
qu'on veut mettre l'accent sur l'espace vectoriel de la représentation ou sur le morphisme
de G dans GL(V). On notera aussi paifois pv,g l'élément pv(g) de GL(V), de manière à pouvoir écrire
pv,g(v) au lieu de pv(g)(v) l'image g ■ v de v € V sous l'action de g € G.
Remarque 1.1.1. (i) L'exemple le plus banal de représentation est celui d'un sous-
groupe G de GL(V) agissant sur V. Par exemple, l'inclusion du groupe orthogonal 0(d)
dans GLd(R) fait de Rd une représentation de 0(d).
(ii) Si pv est injectif, on dit que V est une représentation fidèle de G, auquel cas py
permet de représenter le groupe abstrait G, de manière concrète (d'où la terminologie),
comme un sous-groupe de GL(V). Si V est dimension finie, le choix d'une base fournit
une représentation encore plus concrète comme groupe de matrices.
Exemple 1.1.2. (Représentations de Z)
(i) Si A € C*, alors îihà" est un morphisme de groupes de Z dans C*, ce qui nous
fabrique une représentation de Z que nous noterons C(A) ; l'action de n e Z sur z € C
étant donnée par pc(\),n(z) = X1* (ce qu'on peut aussi écrire sous la forme n • z = \nz).
(ii) Si V est un C-espace vectoriel, et si u : V —» V est un isomorphisme linéaire,
l'application n h-> un est un morphisme de groupes de Z dans GL(V), ce qui fait de V
une représentation du groupe additif Z, l'action de n e Z sur v € V étant donnée par
n-v = un(v). Réciproquement, si V est une représentation de Z, alors u = pv(l) € GL(V),
et on & pv(n) = un pour tout n € Z, et donc n-v = un(v), si n € Z et v € V. En d'autres
termes, une représentation de Z n'est rien d'autre que la donnée d'un C-espace vectoriel V
et d'un élément u de GL(V). /
Exemple 1.1.3. (Représentations de Z/DZ)' Si V est un C-espace vectoriel muni d'un
isomorphisme linéaire u vérifiant vP = 1, l'application n i-> un est un morphisme de
236
CHAPITRE I. REPRÉSENTATIONS DES GROUPES FINIS
groupes de Z dans GL(V) dont le noyau contient DZ ; il induit donc un morphisme de
Z/DZ dans GL(V), ce qui fait de V une représentation de Z/DZ, l'action deneZ sur
v G V étant donnée par n • v = un(v). Réciproquement, si V est une représentation de
Z/DZ, et si u = pv(l) € GL(V), alors uD = pv(D) = pv(0) = 1, car D = 0 dans Z/DZ.
En d'autres termes, une représentation de Z/DZ n'est rien d'autre que la donnée d'un
C-espace vectoriel V et d'un élément u de GL(V) vérifiant uD = 1.
Remarque 1.1.4- Dans les deux cas ci-dessus, on dispose d'une présentation du groupe
à partir de générateurs (dans les deux cas G est engendré par 1) et de relations entre les
générateurs (pas de relation dans le cas de Z, une relation D = 0 pour Z/DZ). Ceci permet
de décrire une représentation de G en disant ce que fait chaque générateur, les relations
entre les générateurs imposant des relations entre leurs actions. Ce type de description
est très efficace quand on dispose d'une présentation relativement simple du groupe G.
Par exemple, le groupe Z2 est engendré par t\ = (1,0) et ei = (0,1), et est décrit par
la relation de commutation e\ +e2 = e2 + e\. Une représentation de Z2 est donc la donnée
d'un C-espace vectoriel V et de deux éléments de GL(V) commutant entre eux.
Le groupe SL2(Z) est engendré par les matrices S = (J ~q) et T = (J }), et toute
relation entre S et T est conséquence des relations S4 = I, S2T = TS2 et (ST)3 = S2;
une représentation de SL2(Z) est donc la donnée d'un C-espace vectoriel V et de deux
éléments u et v de GL(V) vérifiant uA = 1, u2v = vu2 et (uv)3 = u2.
De même, l'exercice ci-dessous montre qu'une représentation du groupe S3 des
permutations de {1,2,3} est juste un C-espace vectoriel V muni de deux symétries S\, s2 vérifiant
S1S2S1 = S2S1S2.
Exercice 1.1.5. Soient <ri,<72 G S3 les permutations (1,2) et (2,3).
(i) Vérifier que (7i<7201 = a2<Ti<T2 est la permutation (1,3).
(ii) Montrer que ai et a2 engendrent S3.
(iii) Montrer que toute relation entre ai et 0-1 dans S.j est conséquence des relations a\ = a\ = 1
et a\<T2<T\ = a2cr\(J2- (On montrera qu'une relation de longueur n ^ 4 peut toujours se ramener à une
relation de longueur n - 2.)
La dimension dim V d'une représentation V est juste la dimension du C-espace
vectoriel V. Par exemple, dimC(À) = 1, pour tout A G C*.
Dans tout ce qui suit, les représentations sont implicitement supposées de dimension
finie. Si dim V = d et si (ei,..., e^) est une base de V, on note Rv(<?) ou Rv,9 la matrice
de pv(g) dans la base (ei,..., e^) (qui dépend du choix de la base bien que ça n'apparaisse
pas dans la notation). Alors Ry : G —* GLrf(C) est un morphisme de groupes.
Exemple 1.1.6. (Construction d'une représentation de dimension 2 de S3)
Soient A = (1,0), B = (-£, ^) et C = (-|, -^). Les points A,B,C sont les sommets d'un triangle
équilatéral de centre de gravité O = (0,0). Les isométries du plan laissant stable ce triangle fixent O et
1.1. REPRÉSENTATIONS ET CARACTÈRES
237
donc sont linéaires; elles forment donc un sous-groupe*3* D3 de 0(2) c GL2(C). L'injection de D3 dans
GL2(C) fait de C2 une représentation du groupe D3, et nous allons montrer que ce groupe est isomorphe
à S3 pour construire notre représentation de S3. Un élément de D3 laisse stable l'ensemble {A,B,C}, et
fournit un morphisme de groupes / de D3 dans le groupe des permutations S{a,b,c} de {A, B, C}. Comme
A, B et C ne sont pas alignés, un élément de D3 est uniquement déterminé par les images de A, B et C,
ce qui signifie que / est injectif. Par ailleurs, / est surjectif car D3 contient les symétries par rapport aux
droites (OA), (OB) et (OC) qui s'envoient respectivement sur les transpositions (B,C), (A, C) et (A,B),
et les rotations d'angles 0, %l et =^ dont les images respectives sont l'identité et les cycles (A, B, C) et
(A, C,B). En résumé, / : D3 —> S{a,b,c} est un isomorphisme de groupes. La bijection 1 m A, 2 m B,
3 •-> C de {1,2,3} sur {A, B, C} fournit un isomorphisme g : S3 = S{a,b,c} - On obtient un morphisme de
groupes de S3 dans GL2(C) en composant f~l o g : S3 —> D3 avec l'injection de D3 dans GL2(C). Ce
morphisme fait de C2 une représentation de S3.
Remarque 1.1.7. Soit G un groupe fini; tout élément de G est alors d'ordre fini. Soit
V une représentation de G. Si g G G est d'ordre n, on a pv(g)n = pv(gn) = 1. Comme
le polynôme Xn - 1 n'a que des racines simples, cela prouve que pv(g) est diagonalisable,
et comme les valeurs propres de pv(g) sont des racines de Xn — 1, ce sont des racines de
l'unité.
Exercice 1.1.8. (i) Soit V = C2 la représentation de S3 construite à l'exemple 1.1.6. Montrer qu'il
n'existe pas de base de V dans laquelle les matrices des actions de tous les éléments de S3 sont
simultanément diagonales.
(ii) Soient V un espace vectoriel de dimension finie sur C, et uu u>2 deux endomorphismes diagonali-
sables de V commutant l'un à l'autre. Montrer que tout espace propre det^i est stable par n2. En déduire
qu'il existe une base de V dans laquelle les matrices de Ui et u2 sont toutes les deux diagonales.
(iii) Soit G un groupe commutatif fini, et soit V une représentation de G. Montrer qu'il existe une
base de V dans laquelle les matrices Rv(</)> pour g G G, sont toutes diagonales. En déduire qu'il existe
une décomposition de V en somme directe de droites stables par l'action de G.
2. Caractère d'une représentation, exemples
Le caractère Xv de V est l'application de G dans C définie par Xv(#) = r^(Pv(g)), où
Tr(pv(#)) désigne la trace de l'endomorphisme pv(g) ; c'est aussi la trace de la matrice
Rv(#) dans n'importe quelle base de V, et c'est aussi la somme des valeurs propres de
pv(g) comptées avec multiplicité.
On a en particulier Xv(l) = ^(1) = dimV; la valeur de xv en l'élément neutre est
donc un entier ; cet entier est appelé le degré du caractère Xv ; d'après ce qui précède,
c'est aussi la dimension de la représentation V; cette observation est d'usage constant.
De plus, comme Tr(AB) = Tr(BA), si A et B sont deux éléments de M^(C), on a
Tr(pv(hgh-1)) = 'toipvWMtiMh)-1) = 'lïfpvfo)),
ce qui montre que xv est une fonction centrale sur G (i.e. xv est constante sur chacune
des classes de conjugaison de G : on a Xv(hgh~l) = Xv(#) quels que soient h,g € G).
(3)Plus généralement, on note Dn le groupe des isométries du plan fixant un polygone régulier à n côtés.
238
CHAPITRE I. REPRÉSENTATIONS DES GROUPES FINIS
Remarque 1.1.9. Si G est fini, et si g G G, les valeurs propres de pv(g) sont des racines
de l'unité. En particulier, elles sont de module 1, et donc A-1 = A, si A est une valeur
propre de pv{g)- Comme les valeurs propres de pv(g~l) = pv{g)~l sont les inverses de
celles de pv(g), et comme la trace est la somme des valeurs propres, on en déduit que
Xvte"1) = XvO), quel que soit g G G.
2.1. Caractères linéaires
Si V est de dimension 1, les endomorphismes de V sont les homothéties, et l'application
qui à une homothétie associe son rapport induit un isomorphisme de GL(V) sur C*.
Une représentation de dimension 1 n'est donc rien d'autre qu'un morphisme de groupes
X : G —» C* ; un tel morphisme est aussi souvent appelé un caractère linéaire de G. On
note G l'ensemble de ces caractères linéaires.
Si V est une représentation de dimension 1 correspondant au caractère linéaire x, on
a xv = X de manière évidente. Autrement dit, le caractère d'un caractère linéaire est le
caractère linéaire lui-même.
La représentation triviale, notée 1, est la représentation de dimension 1 correspondant
au caractère trivial x : G —» C*, défini par x(<?) = 1, pour tout g e G.
Si V est une représentation de G, et si x € G, on note V(x) ou V®x l°> tordue de V par
le caractère linéaire x : c'est la représentation définie par />v(*)(<?) = x(9)pv(g) (l'espace
vectoriel de V(x) est V, mais l'action est tordue par x; la matrice Ry(x)(p) est le produit
de Rv(g) par x(g))- On a Xv(x)te) = x(p)Xv(p), si g € G.
Exercice 1.1.10. On définit le produit X1X2 de deux caractères linéaires par (X1X2X0) = Xi(#)X2(<7)-
Montrer que G, muni de ce produit, est un groupe commutatif.
Exercice 1.1.11. (Orthogonalité des caractères linéaires)
(i) Soit G un groupe fini et soit x € G. Montrer que t^t £)9GG x(#) vaut •"■ s* X est le caractère trivial,
et 0 sinon. (Multiplier la somme par x(^)> pour un h € G bien choisi.)
(ii) En déduire que, si Xi»X2 G G, et si (xi,X2) = jèj £sec Xi(0)X2(#), alors (*i,X2) = 1 si Xi = X2,
et (xi»X2) = 0sixi 7^X2-
2.2. Sommes directes
Si Vi et V2 sont deux représentations de G, on peut munir Vi © V2, somme directe
des espaces vectoriels Vi et V2, d'une action de G. Rappelons que Vi 0 V2 est un espace
vectoriel dont Vi et V2 sont des sous-espaces vectoriels qui sont en somme directe dans
Vi 0 V2. Comme on fait la somme directe d'un nombre fini d'espaces, on a une
identification naturelle de Vi 0 V2 avec le produit Vi x V2, où V\ e Vi s'identifie à (vi, 0) G Vi x V2
et V2 € V2 à (0,^2) € Vi x V2. En utilisant cette identification, l'action de g € G sur
(«i, V2) € V10V2 est donnée par #-(vi, V2) = {g-V\,g-V2). La représentation de G ainsi
obtenue est encore notée V10V2, et appelée somme directe de Vi et V2. Si on choisit une base
61,..., em de Vi et une base fu • • •, fn de V2, alors (ei, 0),..., (em, 0), (0, /1),..., (0, fn)
1.1. REPRÉSENTATIONS ET CARACTÈRES
239
est une base de V, et la matrice Rv{g) dans cette base est la matrice diagonale par blocs
( VJ rv (g) )' ^ont ^a trace est ^a somme des traces de Rvi(#) et Rv2{g). On a donc
Xvi©v2 =Xvi + Xv2-
Le cas Vi = V2 n'est pas exclu, et V © V est une représentation de G contenant deux
copies de V d'intersection nulle et dont la somme est tout. Par exemple, la représentation
C(A) 0 C(À) de Z est C2 muni de l'homothétie À, les deux copies de C(À) obtenue en
identifiant la somme au produit étant C x {0} et {0} x C (il y a beaucoup d'autres
copies de C(À) dans C(À) © C(À) puisque toute droite en est une). Plus généralement, si
m G N, on note raV la somme directe de m copies de V (pour m = 0, on obtient l'espace
vectoriel 0). Si les Vi} pour % € I fini, sont des représentations de G, et si m* G N, pour
tout tel, alors ©^ira^Vi est une représentation de G de caractère
XeteimiVi = y^raiXVj-
2.3. Représentations de permutation, représentation régulière
Si X est un ensemble fini muni d'une action (à gauche) de G donnée par (g, x) i-> g-x, on
définit la représentation de permutation Vx, associée à X, comme l'espace vectoriel Vx de
dimension |X|, de base (ex)x€x, muni de l'action linéaire de G donnée, sur les vecteurs de la
base, par g-ex = e9.x. Si gug2e G, et si x e X, on a gi\g2-ex) = gve92.x = e9l92.x = gig2-ex,
ce qui prouve que la formule précédente définit bien une action de G sur Vx- Dans la base
(Cx)x€X, la matrice de g est une matrice de permutation (i.e. a exactement un 1 par ligne
et par colonne, et tous les autres coefficients sont nuls), et le terme diagonal aXtX est égal
à 1 si et seulement si g • x = x (i.e. si x est un point fixe de g), sinon, il vaut 0. On en
déduit que la trace de la matrice de g est le nombre de points fixes de g agissant sur X.
Autrement dit, on a
Xvx(0) = |{z e X, g-x = x}\.
Un cas particulier intéressant est celui où G est fini, X = G, et l'action de G est donnée
par la multiplication à gauche (i.e. g h = gh). La représentation Vg ainsi obtenue est la
représentation régulière de G. Comme gh = h implique g = 1, on voit que le caractère de
la représentation régulière est donné par la formule
XvG(l) = |6|, et xvG(</) = 0, si g € G - {1}.
Exercice 1.1.12. Soit G un groupe agissant sur un ensemble fini X. Montrer que si g et g' sont conjugués
dans G, ils ont le même nombre de points fixes dans X. Comment ceci se traduit-il en termes du caractère
de Vx ?
3. Morphismes de représentations
3.1. La représentation Hom(Vi,V2)
Soient Vi et V2 deux représentations de G, et soit u : Vi —* V2 une application linéaire.
Si g e G, on définit g • u : Vi —* V2 par la formule (g -u)(v) = g • u(g~l • v)} quel que soit
240
CHAPITRE I. REPRÉSENTATIONS DES GROUPES FINIS
v e Vi. Si <7i,p2 G G, et si v G Vi, on a
(01 • (02 * U))(V) = 01 • (fe • W)(0f1 • «))
= 01 ' (02 ' «(02"1 ' 0l_1 • V)) = 0102 ' «((0102)"1 • V) = (0102 • tt)(v),
et donc 01 • (02 • u) = 0102 • u, ce qui prouve que l'on a défini de la sorte une action de G
sur l'espace Hom(Vi, V2) des applications linéaires de Vi dans V2.
Si 0 € G, l'endomorphisme /0Hom(Vi,v2),5 de Hom(Vi, V2) est alors donné par la formule :
pHom(Vi,V2),9(U) = PV2,9 °UO p~\g, si U G Hoiïl(Vi, V2).
Proposition 1.1.13. Si G est fini, et si g e G, alors
XHom(Vi,V2)(0) =XV!(0)XV2(0)-
Démonstration. Si 0 est fixé, on peut choisir une base (ei)i€i de Vi et une base (fj)j€j de
V2 dans lesquelles les actions de g sont diagonales. Il existe donc des racines de l'unité ah
pour i € I, et /%, pour j G J, tels que g • e* = o:^*, si i G I, et g • /,• = /%/j-, si j € J. On a
alors xvi(0) = £iGi on et Xv2(0) = Ej€j /%•
Si (i, j) € I x J, soit ttij : Vi -^ V2 l'application linéaire définie par Uij{ei) = fj, et
uij(ei') = Oj si *' ¥" *• Les Wij, pour (t,,;) € I x J forment une base de Hom(Vi, V2), et on
a 0 • «ij = ot^fijUij = ci~i(3jUiyj. On a donc
XHom(Vi,V2)(0) = X) Wih = Œ^)Œ^') = XVX(0)XV2(0).
(iJ)€lxJ i€l j€J
Ceci permet de conclure.
Remarque 1.1.14- Si Vi = V et si V2 est la représentation triviale, la représentation
Hom(Vi, V2) = Hom(V, C) est la représentation duale V* de V. On a xv* = Xv, d'après
la prop. 1.1.13.
3.2. Opérateurs d'entrelacement, représentations isomorphes
Notons HomG(Vi,V2) l'ensemble des applications linéaires de Vi dans V2
commutant à l'action de G. C'est un sous-espace vectoriel de Hom(Vi,V2) et un élément u de
Hom(Vi, V2) est dans Homc(Vi, V2), si et seulement si on a g • u(v) = u(g • v), quel que
soit v G Vi. Appliqué à g~l-v, ceci peut aussi se réécrire sous la forme 0-w(0_1 -v) = u{v),
quel que soit v G Vi, ou encore, sous la forme g-u = u. Autrement dit, HomcfVi, V2) est
le sous-espace vectoriel de Hom(Vi, V2) des éléments fixes sous l'action de G. Les éléments
de Homc(Vi,V2) sont souvent appelés des opérateurs d'entrelacement.
Exemple 1.1.15. Si V est une représentation de G, l'ensemble VG des éléments de V
fixes sous l'action de G est un sous-espace vectoriel de V (c'est l'intersection des noyaux
des 0 — 1, pour 0 G G) qui est stable sous l'action de G, et sur lequel G agit trivialement
par construction ; c'est donc une représentation de G. Maintenant, si G est fini, on peut
1.1. REPRÉSENTATIONS ET CARACTÈRES
241
considérer l'opérateur de moyenne M : V —» V défini par M(v) = rk J2geG9 ' v- Alors M
est un opérateur d'entrelacement entre V et VG. En effet, si h e G, et si v e V, on a
h'M^ = h'{]k^g'v) = à\^h'{9'v) = è\^hg'v
11 fl€G ' ' g€G ' ' g€G
et comme g t-> hg et g t-> gh sont des bijections de G dans G, les deux quantités sont
égales à M(v). Cela prouve à la fois que M(v) e VG et que M : V —* VG commute à
l'action de G.
Remarque 1.1.16. L'idée, selon laquelle il suffit de faire la moyenne sous l'action du
groupe pour obtenir quelque chose de fixe par tout le groupe, joue un rôle très important
dans la théorie.
On dit que deux représentations Vi et V2 de G sont isomorphes, s'il existe un
isomorphisme linéaire u : Vi —► V2 commutant à l'action de G, (autrement dit, s'il existe
u e HoniG(Vi,V2) bijectif, ce qui implique, en particulier, que Vi et V2 ont la même
dimension). Traduit en termes des morphismes pyt : G -* GL(Vi) et pv2 : G -* GL(V2)
attachés à Vi et V2, cette relation devient u o pyt(g) = pv2{g) o u, quel que soit g e G.
Traduit en termes matriciels (après avoir choisi des bases de Vi et V2), cela se traduit par
l'existence de T e GLd(C), tel que TRvx(<7) = Rv2(p) 1\ Quel Que sort 9 € G, ce qui peut
encore se mettre sous la forme Ry2(g) = rVRyl(g)rV~1. En particulier, Xvi(p) = Xv2(#)
quel que soit g e G. /
Exercice 1.1.17. Exhiber deux représentations de Z/2Z de même dimension, mais qui ne sont pas
isomorphes.
Remarque 1.1.18. (i) On verra plus loin que, si G est fini, la réciproque est vraie : si Vi
et V2 ont mêmes caractères, alors elles sont isomorphes, ce qui peut sembler un peu
surprenant, le caractère ne permettant, a priori, que de calculer la trace des endomorphismes.
L'exercice 1.1.19 ci-dessous rend le résultat un peu plus envisageable.
(ii) Dans le cas de Z, en notant Rj, pour i = 1,2, la matrice de pvi(l), on voit que Vi et
V2 sont isomorphes si et seulement s'il existe T inversible telle que R2 = TRiT-1 (i.e. si et
seulement si R2 et Ri sont des matrices semblables). Il en résulte que la classification des
représentations de Z à isomorphisme près est équivalente à celle des matrices à similitude
près, ce qui se fait en utilisant la forme de Jordan. Si on impose à R = Rv(l) d'être
diagonalisable, alors V est donnée, à isomorphisme près, par les valeurs propres de R avec
leurs multiplicités.
Exercice 1.1.19. Soit V une représentation d'un groupe fini G. Si g € G, soit P9(T) = det(l -Tpy(g)).
Montrer que l'on a l'identité des séries formelles - J2n™o Xv(#n+1)Tn = p^fj- En déduire que xv permet
de déterminer pv(g), pour tout g € G, à conjugaison près par un élément de GL(V).
242
CHAPITRE I. REPRÉSENTATIONS DES GROUPES FINIS
1.2. Décomposition des représentations
Quand on essaye de classifier les objets d'un certain type (par exemple les groupes
finis, les représentations d'un groupe fini...), on est amené à comprendre quels sont les
objets que l'on ne peut pas casser en morceaux (les groupes simples, si on s'intéresse
aux groupes, les représentations irréductibles dans le cas des représentations d'un groupe
fini...), et comment on peut assembler les morceaux pour décrire tous les objets qui nous
intéressent. Dans le cas des représentations d'un groupe fini, le th. de Maschke (th. 1.2.7)
montre que cette seconde étape ne pose aucun problème ; le cor. 1.2.16, quant à lui, montre
que faire la liste des objets irréductibles n'est pas une entreprise vouée à l'échec.
1. Décomposition en somme directe de représentations irréductibles
Soient G un groupe et V une représentation de G. Une sous-représentation de V est
un sous-espace vectoriel de V stable par G. Par exemple, si v e V - {0}, le sous-espace
vectoriel de V engendré par les g • v, pour g e G, est une sous-représentation de V ; c'est
la sous-représentation de V engendrée par v (i.e. la plus petite sous-représentation de V
contenant v). On dit que V est irréductible si V ne possède pas de sous-représentation
autre que 0 ou V. De manière équivalente, V est irréductible si, quel que soit v e V — {0},
le sous-espace vectoriel de V engendré par les g • v, pour g G G, est égal à V.
Exemple 1.2.1. La représentation de S3 sur C2 de l'ex. 1.1.6 est irréductible. En effet,
comme elle est de dimension 2, une sous-représentation autre que 0 ou C2 serait une droite
de C2. Une telle droite serait en particulier stable par les symétries orthogonales sqk et
sob par rapport aux droites (OA) et (OB), ce qui est impossible vu que les droites stables
par soa sont les axes de coordonnées, et que ces axes ne sont pas stables par sç>b-
Exercice 1.2.2. Soient S3 le groupe des permutations de l'ensemble {1,2,3} et s et t les éléments (12)
et (123) de S3.
(i) Soient s et t les éléments (12) et (123) de S3. Vérifier (ou admettre) que s et t engendrent S3 et
que sts-1 = t2, et déterminer les classes de conjugaison de S3.
(ii) Soit V une représentation de dimension finie de S3, et soient W0, Wi et W2 les espaces propres
de t (i.e. de pv{t)) pour les valeurs propres 1, j = e2*""/3 et j2. Montrer que V = Wo © Wi © W2.
(iii) Montrer que Wo est stable par s, et que s échange Wi etW2.
(iv) Montrer que, si v € Wi - {0}, alors le sous-espace de V engendré par v et s • v est stable par S3,
est irréductible comme représentation de S3, et que la représentation ainsi obtenue ne dépend pas (à
isomorphisme près) du choix de v.
(v) En déduire une décomposition de V en somme de représentations irréductibles de S3 et la liste des
représentations irréductibles de S3.
Exemple 1.2.3. Soit V une représentation de Z, et soit u = pv(l). Comme C est
algébriquement clos, u admet une valeur propre À, non nulle car u est inversible. Soit
e\ G V un vecteur propre pour la valeur propre À. On a alors n ■ e\ = un(e\) = \ne\
pour tout n € Z, ce qui prouve que la droite Ce\ est stable sous l'action de Z et est une
sous-représentation de Z isomorphe à la représentation C(À) de l'ex. 1.1.2. En particulier,
1.2. DÉCOMPOSITION DES REPRÉSENTATIONS
243
si V est de dimension ^ 2, alors V n'est pas irréductible, et donc toute représentation
irréductible de Z est de dimension 1, isomorphe à C(A), pour un A G C* uniquement
déterminé.
Supposons maintenant que u est diagonalisable. Soit Vi,..., Vd une base de V constituée
de vecteurs propres de n, et soit A* la valeur propre associée à e*. Alors V est la somme
directe ©f=1Cef des droites Ce* qui sont des sous-représentations de V, chaque Ce* étant
isomorphe à C(Ai) en tant que représentation de Z. On en déduit que V est, en tant que
représentation de Z, isomorphe à ©f=iC(Af).
Remarque 1.24- (i) Dire que V est isomorphe à ©f=1C(Aj) signifie juste que u = pv(l)
est diagonalisable, et que son polynôme caractéristique est ]^[i=1 (X — A*), ce qui est
nettement moins précis que d'exhiber une base de vecteurs propres, et donc un isomorphisme
de ©f=iC(Ai) sur V entre représentations de Z.
(ii) Si u est diagonalisable, si les valeurs propres de u sont Ai,..., Ar, avec A* ^ Xj si
i ^ j, et si la multiplicité de A* est miy alors V = ©i=i^C(Ai).
(iii) Si u n'est pas diagonalisable, la représentation V ne se décompose pas comme une
somme directe de représentations irréductibles. ^^
Exercice. 1.2.5. Soit r\ un caractère linéaire de G. Montrer que, pour toute représentation irréductible
V de G, la représentation V <g> tj est encore irréductible.
Nous allons prouver que, si G est fini, toute représentation de G est somme directe
de représentations irréductibles. Cela revient, en choisissant une base de chacune de ces
représentations irréductibles, à exhiber une base de V dans laquelle les pv(g)} pour g G G,
se mettent simultanément sous une forme diagonale par blocs ^, la taille des blocs étant la
plus petite possible. (C'est un peu analogue à la forme minimale d'une matrice de rotation
dans Rn.) Nous aurons besoin du résultat suivant.
Théorème 1.2.6. Soit V une représentation de G. Il existe sur V un produit scalaire
( , )v invariant sous l'action de G.
Démonstration. Partons d'un produit scalaire quelconque ( , ), et définissons ( , )v
comme la moyenne des transformés de ( , ) sous l'action de G. Autrement dit,
(vu v2)v = TÔT J2(9 'Vl>9' và-
1 ' g€G
^^C'est assez particulier aux représentations des groupes finis sur un corps de caractéristique 0. Même
dans le cas des groupes finis, si on considère des représentations sur un corps de caractéristique > 0, le
mieux que l'on puisse espérer est une mise sous forme triangulaire supérieure par blocs. Par exemple, si
V est la représentation de dimension 2 de G = Z/pZ sur le corps Fp = Z/pZ, la matrice de n € Z dans
une base (ei,e2) étant (o î). alors le sous-espace Vi, engendré par eu est stable (et même fixe) par G,
mais il est facile de voir que c'est le seul sous-espace propre de V ayant cette propriété. La représentation
V n'est donc pas irréductible, mais n'est pas somme directe de représentations irréductibles.
244
CHAPITRE I. REPRÉSENTATIONS DES GROUPES FINIS
L'action de G étant linéaire, le résultat est bien linéaire par rapport à v2 et sesquilinéaire
par rapport à V\. De plus, (v,v)y ^ p(v,v), ce qui prouve que ( , )v est défini positif.
Enfin, si h G G, on a
(h'VUh> v2)v = TpT ^2(9 • {h • vi),g- (h • v2)) = f^r X^ • vugh • v2) = (vuv2)v,
car g t-* gh induit une bijection de G sur lui-même. Ceci permet de conclure.
Théorème 1.2.7. (Maschke, 1899) Toute représentation de G est somme directe de
représentations irréductibles.
Démonstration. La démonstration se fait par récurrence sur la dimension. Si V est
de dimension 1 ou est irréductible, il n'y a rien à faire. Si V est de dimension ^ 2 et
n'est pas irréductible, alors V possède une sous-représentation Vi distincte de 0 et V. Si
( , )v est un produit scalaire sur V, invariant sous l'action de G, le supplémentaire
orthogonal V2 de Vi est lui-aussi stable par G puisque que « v orthogonal à Vi » équivaut
à « g - v orthogonal à g • Vi = Vi » par invariance du produit scalaire. On a alors
V = Vi © V2, et Vi et V2 sont de dimensions strictement inférieures à celle de V.
L'hypothèse de récurrence permet de les décomposer comme des sommes directes de
représentations irréductibles, ce qui prouve qu'on peut en faire autant de V.
Remarque 1.2.8. Si G est cyclique engendré par g, la décomposition de V en somme
de représentations irréductibles est équivalente à une décomposition de V en droites
invariantes sous l'action de g. On sait bien que si g a une valeur propre de multiplicité > 1,
cette décomposition n'est pas unique. Par contre, la décomposition en sous-espaces propres
est, elle, parfaitement canonique. On verra plus loin (cor. 1.2.20) que la situation est la
même en ce qui concerne la décomposition en somme de représentations irréductibles
d'une représentation d'un groupe fini quelconque.
2. Le lemme de Schur et ses conséquences immédiates
Théorème 1.2.9. (Lemme de Schur, 1905) Soient G un groupe et Vi,V2 des
représentations irréductibles de G.
(i) Si Vi et V2 ne sont pas isomorphes, alors HomG(Vi, V2) = 0.
(ii) Si Vi = V2, alors HomG(Vi, V2) est la droite des homothéties.
Démonstration. Soit u € Homc(Vi, V2). Le fait que u commute à l'action de G, montre
que Ker(w) C Vi et Im(w) C V2 sont stables par G. Comme par hypothèse, Vi et V2 sont
irréductibles, on a soit Ker(u) = Vi, auquel cas u = 0, soit Ker(w) = 0, auquel cas
lm(u) ^ 0 et donc Im(«) = V2. On en déduit que, si u ^ 0, alors u est à la fois injective
(puisque Ker(w) = 0) et surjective, et donc est un isomorphisme. Cela démontre le (i).
Passons au (ii). Comme on travaille avec des C-espaces vectoriels, u admet une valeur
propre À. Donc u — À, qui commute à l'action de G puisque u le fait et qu'une homothétie
1.2. DÉCOMPOSITION DES REPRÉSENTATIONS
245
commute à tout, a un noyau non nul. Le même raisonnement qu'au (i) montre que ce
noyau doit donc être égal à Vi, ce qui se traduit par le fait que u est une homothétie de
rapport À. Ceci permet de conclure.
Remarque 1.2.10. Si Vi et V2 sont seulement isomorphes, et si u : Vi —► V2 est un
isomorphisme de représentations, on déduit du (ii) du lemme de Schur que tout élément
de Hoïïig(Vi, V2) est de la forme X% avec A e ~Ç.
Exercice 1.2.11. Soit G un groupe commutatif. Montrer que toute représentation irréductible de G est
de dimension 1.
Proposition 1.2.12. Soient G un groupe fini et Vi, V2 des représentations de G.
(i) Si Vi et V2 sont irréductibles, non isomorphes, et si u e Hom(Vi,V2), alors
(ii) Si V est irréductible, et si u e Hom(V, V), alors M(u) = Jt, Y2g€G g -u est l'homo-
thétie de rapport ai^v'J-M^)-
(iii) Si V est irréductible, et si <f> est une fonction centrale sur G, alors X^eG <t>(9)pv(9)
est Vhomothétie de rapport -^ J2g€G <f>(g)x(g)-
Démonstration. Si Vi et V2 sont deux représentations de G, si « € Hom(Vi,V2), et
si h e G, on a h • E5€G 9 ' u) = Y29€G ^9 ' u- Comme g i-* hg est une bijection de
G sur lui-même, cette dernière quantité est aussi égale à J2g€G g • u. On en déduit que
M(u) = 1^7 ^2g€Gg - u appartient à Homc(Vi, V2).
Le (i) est donc une conséquence du (i) du lemme de Schur. Le (ii) du lemme de Schur
montre, quant à lui, que M(u) est une homothétie, si u € Hom(V, V) et V est irréductible.
Pour déterminer le rapport de cette homothétie, il suffit d'en calculer la trace et de diviser
par dim V. Or on a M(u) = -^ ^2g€G Pv(g)upy(g)~1J et donc M(u) est la moyenne de |G|
termes dont chacun a pour trace Tr(u), puisque la trace est invariante par conjugaison.
On a donc Tr(M(«)) = Tr(w), ce qui permet d'en déduire le (ii).
Enfin, si <f> est une fonction centrale (i.e., si <j>(hgh~l) = </>(g) pour tous h,g e G), si
u4> = E5€g 4>(9)Pv(9) e Hom(V,V), et si h e G, on a
h • u^ = Pv(h)(Y,(/>(9)pv{9))Pv(h)-1 = ^<l>(g)pv{hgh-1)
g€G g€G
= ^iïihgh-^pvihgh,-1) = ^<t>(g)pv{g) = u+.
g€G g€G
On conclut comme ci-dessus que u<f, est l'homothétie de rapport
dCv^-*) - âSvE*™**)) - dWvE^ïxvto).
g€G g€G
ce qui permet de conclure.
246
CHAPITRE I. REPRÉSENTATIONS DES GROUPES FINIS
3. Orthogonalité des caractères
Soit G un groupe fini. On note Rc(G) l'espace vectoriel des fonctions centrales. Cet
espace contient l'ensemble R+(G) des caractères des représentations de G qui lui-même,
contient l'ensemble Irr(G) des caractères irréductibles de G (i.e. les caractères des
représentations irréductibles de G). Enfin, on note Rz(G) le groupe des caractères virtuels de
G; c'est le sous-groupe (additif) de Rc(G) engendré par R+(G).
Exercice 1.2.13. Montrer que R+(G) est stable par addition et que Rz(G) est l'ensemble des Xi - X2,
avecxi,X2GR+(G).
On munit Rc(G) du produit scalaire ( , ) défini par
Théorème 1.2.14- (Probenius, 1897) Les caractères irréductibles forment une base
orthonormale de l'espace des fonctions centrales.
Démonstration. Soient xi et X2 deux caractères, et soient Vi et V2 des représentations
de G dont les caractères sont Xi etX2- En utilisant la prop. 1.1.13, on peut réécrire (xi>X2)
sous la forme
1 1
(Xl,X2) = T^â^2xi(9)X2{9) = Tfû^XHomiVxMig).
11 S€G M g€G
Comme XHom(Vi,v2)(p) est> Par définition, la trace de g agissant sur Hom(Vi,V2), cela
permet de voir (xi> X2) comme la trace de l'application linéaire u i-» -^ ^2g€Gg-u = M(u)
définie dans la prop. 1.2.12. On déduit alors des (i) et (ii) de cette proposition les faits
suivants.
• Si Xi et X2 sont irréductibles et distincts, alors M est identiquement nul, et donc
<Xi,X2>=Tr(M)=:0.
• Si x est irréductible, et si V est une représentation de caractère x> a^ors M est
l'application associant à«G Hom(V, V) l'homothétie de rapport ^y Tr(u). On en déduit
que M admet comme valeurs propres 1 avec multiplicité 1, l'espace propre correspondant
étant la droite des homothéties, et 0 avec multiplicité (dimV)2 — 1, le noyau de M étant
l'hyperplan des endomorphismes de trace nulle. La trace de M est donc 1, ce qui se traduit
Par (X,X) = 1-
Il résulte des deux points ci-dessus que les caractères irréductibles forment une
famille orthonormale. Il reste à vérifier qu'ils forment une base de Rc(G), et pour cela, il
suffit de vérifier qu'une fonction centrale 0, qui est orthogonale à tous les éléments de
Irr(G), est nulle. Pour cela, considérons la représentation régulière Vg de G, que l'on
décompose en somme directe Vi 0 • • • 0 Vr de représentations irréductibles. Si <f> est une
fonction centrale orthogonale à xv», il résulte du (iii) de la prop. 1.2.12, que l'endomor-
phisme X^eG^Wi^) ^e V* est nul. Donc, si <f> est orthogonale à tous les caractères
1.2. DÉCOMPOSITION DES REPRÉSENTATIONS \ 247
irréductibles, Pendomorphisme ^2g€G 4>{9)pvG (p) de Vq est nul. En faisant agir cet endo-
morphisme sur e\ e Vq, on en déduit que 0 = ^2g€G <t>(g)g • ei = J2geG ^(#)es- ®r ^es es>
pour g € G, forment une base de Vq ; la nullité de Y2geG 4>(9)eg implique donc celle de
<f>(g), quel que soit g € G, et donc aussi celle de (f>. Ceci permet de conclure.
Remarque 1.2.15. Si Vi et V2 sont irréductibles et non isomorphes, l'application M est
identiquement nulle et donc Tr(M) = 0. Or il résulte de la démonstration du th. 1.2.14
que Tr(M) = (xv15Xv2)- On en déduit en particulier que xvi ¥" Xv2- Autrement dit,
l'application W i-» xw est une injection de l'ensemble des représentations irréductibles de G
(à isomorphisme près) dans Irr(G). Comme, par définition de Irr(G), cette application
est surjective, c'est une bijection, ce qui permet de voir Irr(G) aussi comme l'ensemble
des représentations irréductibles de G. C'est cette interprétation de Irr(G) qui est utilisée
dans la suite.
4. Applications du théorème principal
Le théorème 1.2.14 a des tas de conséquences agréables.
4.1. Nombre des représentations irréductibles
Corollaire 1.2.16. Le nombre de représentations irréductibles de G est égal au nombre
|Conj(G)| de classes de conjugaison dans G. En particulier, il est fini.
Démonstration. D'après le th. 1.2.14, le nombre de représentations irréductibles de G est
égal à la dimension de l'espace Rc(G) des fonctions centrales. Or une fonction est centrale
si et seulement si elle est constante sur chaque classe de conjugaison ; une fonction centrale
(f> peut donc s'écrire, de manière unique, sous la forme 0 = 2c€Conj(G) ^dc> où le est la
fonction indicatrice de C, et Aq € C (on a Ac = <f>(g), où g est n'importe quel élément
de C). Les le, pour C G Conj(G) forment donc une base de Rc(G) qui, de ce fait, est de
dimension |Conj(G)|. Ceci permet de conclure.
Remarque 1.2.17. L'ensemble des représentations irréductibles de G et celui des classes
de conjugaison dans G ont le même cardinal mais il n'y a, en général, aucune bijection
naturelle entre ces deux ensembles. Les groupes symétriques constituent une exception
remarquable (cf. n°C2).
4-2. La décomposition canonique d'une représentation
Le résultat suivant est un peu magique et très utile (par exemple pour décomposer une
représentation obtenue par des procédés tensoriels comme au n° 2 du § 1.3, ce qui sert
beaucoup en physique des particules) ; on peut le voir comme une généralisation du calcul
des valeurs propres d'un endomorphisme à partir du polynôme caractéristique. Dans les
deux cas, on n'a pas besoin d'exhiber des vecteurs ayant le bon comportement; on se
contente de prouver qu'ils existent.
248
CHAPITRE I. REPRÉSENTATIONS DES GROUPES FINIS
Corollaire 1.2.18. Si V est une représentation de G, si V = Wi © • • • © W^ est une
décomposition de V en somme directe de représentations irréductibles, et si W € Irr(G),
alors le nombre mw de W* qui sont isomorphes à W est égal à (xw>Xv)- En particulier,
il ne dépend pas de la décomposition, et V = ©w€irr(G)(Xw>Xv)W.
Démonstration. On a xv = Xwi H V Xwfc> et donc
(Xw, Xv) = (Xw, Xwi) + • • • + (Xw, Xw*)-
Or (xw, XwJ est égal à 1 ou 0 suivant que W* est ou n'est pas isomorphe à W ; on a donc
(Xw,Xv) — tt*w« Ceci permet de conclure.
Corollaire 1.2.19. Deux représentations Vi et V2 de G ayant même caractère x sont
isomorphes.
Démonstration. Elles sont toutes les deux isomorphes à ©w€in(G)(Xw, x)W, d'après le
cor. 1.2.18.
Corollaire 1.2.20. (Décomposition d'une représentation en composantes isotypiques)
Si V est une représentation de G, et si W G Irr(G), alors
Pw = —îttt— ^ Xw(p)pv(^),
|G| £g
est un projecteur commutant à l'action de G. De plus, toutes les représentations
irréductibles de G apparaissant dans la décomposition de pw(V) sont isomorphes à W, et V est
la somme directe des pw(V), pour W € Irr(G).
Démonstration. — Soit V = Wi © • • • © W* une décomposition de V en somme directe de
représentations irréductibles. D'après le (iii) de la proposition 1.2.12, la restriction de pw
à Wi est l'homothétie de rapport
dimW v-^ 7-T . . dimW . .
|G|dimW<Z.*wW*w^ = Htaw:^*^-
D'après les relations d'orthogonalité des caractères, cela implique que pw est l'identité
sur Wi, si Wi = W, et est nulle dans le cas contraire. Le résultat s'en déduit.
4.3. Un critère d'irréductibilité
Corollaire 1.2.21. Une représentation V de G est irréductible, si et seulement si
(Xv,Xv) = l
Démonstration. Si V = ©w€in(G)^w W, alors
(Xv,Xv) = ( ^2 mwXw, X^ mwXw> = 5Z mw-
W€lrr(G) W€lrr(G) W€lrr(G)
Comme les mw sont des entiers naturels, on en déduit que (xv,Xv) = 1 si et seulement
si tous les mw sont égaux à 0, sauf un qui est égal à 1. Ceci permet de conclure.
1.2. DÉCOMPOSITION DES REPRÉSENTATIONS
249
Exercice 1.2.22. Soit x € Rz(G). Montrer que les conditions suivantes sont équivalentes,
(i) X € Irr(G).
(ii)(x,X> = letX(l)^0.
44- La décomposition de la représentation régulière
Corollaire 1.2.23. (i) Si W est irréductible, alors W apparaît dans la représentation
régulière avec la multiplicité dimW.
(ii) On a Ew€in(G)(dimW)2 = lGl (formule de Burnside<5>).
(iii) Sig^l, alors £W€lrr(G) dim Wxw(#) = 0.
Démonstration. Le caractère xvG de la représentation régulière est donné (alinéa 2.3
du § I.l) par XvG(l) = K*| et XvG(p) = 0, si g ^ 1. Or la multiplicité de W dans Vq est,
d'après le cor.I.2.18, égale à
(Xw,Xyg) = JQj][)xw(0)XVa(0) = jqïXw(1)|G| = Xw(l) = dim W,
ce qui démontre le (i). On en déduit que xvG = Ew€irr(G) dim Wxw- En appliquant cette
identité à g = 1, on en déduit le (ii), et à g ^ 1, on en déduit le (iii).
5. Le cas des groupes commutatifs
5.1. La transformée de Fourier
Théorème 1.2.24- Si G est commutatif, toute représentation irréductible de G est
de dimension 1. Autrement dit Irr(G) coïncide avec Vensemble G des caractères linéaires
de G.
Démonstration. Si G est commutatif, les classes de conjugaison sont réduites à un
élément, et donc |Conj(G)| = |G|. Comme |Irr(G)| = |Conj(G)| d'après le cor. 1.2.16,
comme Sw€iiT(G)(dim^)2 = M» d'après le (ii) du cor. 1.2.23, et comme dim W ^ 1, quel
que soit W G Irr(G), on en déduit que dimW = 1, quel que soit W € Irr(G), ce que l'on
voulait démontrer W.
Corollaire 1.2.25. Si G est commutatif, toute fonction de G dans C est combinaison
linéaire de caractères linéaires.
Démonstration. D'après le th. 1.2.14, toute fonction centrale (et donc toute
fonction puisque G est commutatif) est combinaison linéaire de caractères irréductibles. Le
th. 1.2.24 permet de conclure.
Comme les caractères linéaires d'un groupe commutatif G forment une base
orthonormale des fonctions de G dans C, il est très facile de décomposer une fonction quelconque
(5)Dans le cas de Sn, on dispose d'une démonstration directe de cette formule, cf. note 2 de l'annexe C
^Des démonstrations plus terre-à-terre sont proposées dans les ex. 1.1.8 et 1.2.11.
250
CHAPITRE I. REPRÉSENTATIONS DES GROUPES FINIS
comme une combinaison linéaire de caractères linéaires. Si <f> est une fonction sur G, on
définit la transformée de Fourier <\> comme la fonction définie sur G par
Hx) = <x,4>) - |4£x(9W</) = |4£x(9rV(<;).
1 ' 9€G I I g€G
La formule d'inversion de Fourier s'exprime alors sous la forme
<l> = ^2<i>(x)x\
c'est une conséquence immédiate du fait que les x> Pour X € G> forment une famille
orthonormale. Par exemple, si on applique ce qui précède à la fonction <f>a : G —» C
valant 1 en a et 0 ailleurs, on a 0o(x) = ]GiX(a)> et on obtient :
Tr\J2x(a)x{x) = \ h]X
M ~ 0 sinon.
iq]Tx(a)xM =
X€G
Un caractère linéaire de (Z/DZ)* est appelé un caractère de Dirichlet modulo D. On
note Dir(D) l'ensemble de ces caractères. Le résultat suivant est un des ingrédients de la
démonstration de Dirichlet du théorème de la progression arithmétique (cf. th. VII.4.7).
Proposition 1.2.26. Si a est premier à D, alors
1 v-^ —rT [ 1 si n = a mod D,
^£mX{aMn)=\0 sinon.
Démonstration. Il suffit d'appliquer ce qui précède au groupe (Z/DZ)*, dont le cardinal
est <£>(D), et à la fonction <f>a : (Z/DZ)* —» C valant 1 en a et 0 ailleurs.
5.2. Le groupe dual
Remarque 1.2.27. Si G est un groupe, lors G est un groupe commutatif pour la
multiplication des caractères linéaires |xiX2(#) = Xi(x)X2{x), pour tout a; € G, si Xi>X2 € G],
et on peut donc considérer le groupe G de ses caractères linéaires. La formule de
multiplication ci-dessus montre que, si x e G, alors x l_^ x(x) est un caractère linéaire de G;
d'où une application naturelle i : G —» G, définie par {i>(x))(x) = xM- Cette application
est un morphisme de groupes puisque, si x,y G G, on a
(t>(xy))(x) = x(xy) = x(x)x(y) = W*))(x) Wî/))(x),
pour tout x € G, et donc t(xy) = o(x)i(y).
Proposition 1.2.28. Si G est un groupe commutatif fini, alors i : G —» G est un
isomorphisme de groupes.
1.2. DÉCOMPOSITION DES REPRÉSENTATIONS
251
Démonstration. Compte-tenu de ce qui précède, il suffit de vérifier la bijectivité de t.
Si H est un groupe commutatif fini, on a |Conj(H)| = |H|, et |Irr(H)| = |H| d'après le
cor. 1.2.25. On en déduit, en utilisant le cor. 1.2.16, que |H| = |H|. En utilisant ce résultat
pour G et G, on en déduit que G et G ont le même cardinal. Il suffit donc de vérifier
que l est injective. Or la décomposition de Fourier de la fonction <f>a, introduite dans le
paragraphe précédant la prop. 1.2.26, montre que, si x(a) = x{b) pour tout x € G, alors
(f>a = 06» et donc a = 6. Ceci permet de conclure.
Exercice 1.2.29. Montrer que le groupe dual de Z/nZ est isomorphe à Z/nZ (en fait à /zn).
Lemme 1.2.30. Soit G un groupe commutatif fini.
(i) Si x G G est d'ordre a, si y G G est d'ordre b, et si a et b sont premiers entre eux,
alors xy est d'ordre ab.
(ii) Si a, b G N - {0}, et si G contient des éléments d'ordre a et b, alors il contient un
élément d'ordre ppcm(o,6).
(iii) Soit N le maximum des ordres des éléments de G. Alors xN = 1 pour tout x G G.
Démonstration. (i) Comme x et y commutent, on a (xy)n = xnyn, pour tout n G N.
En particulier, (xy)ab = a^V*6 = 1> et donc l'ordre de xy divise ab. Réciproquement, si
(xy)n = 1, alors 1 = (xy)an = yan et 1 = (xy)1™ = x1"1, et donc an est un multiple de 6
et bn est un multiple de a. Comme a et 6 sont premiers entre eux, cela implique que n
est un multiple de o et 6 et donc aussi de ab ; autrement dit l'ordre de xy est un multiple
de ab. On en déduit le (i).
(ii) Soit &\ (resp. ^2) l'ensemble des p premiers tels que vp(a) > 0 et vp(a) ^ vp(b)
(resp. vp(b) > vp(a)). Alors &\ et ^2 sont disjoints, ce qui fait que k = IIp€^iPvp(o) et
^ = Ylpe0»aPVp^ sont Premiers entre eux. De plus, on a vp(kl) = vp(a)} si vp(a) ^ vp(b),
et Vp(kC) = vp(6), si vp(a) < vp(b), et donc kl = ppcm(a,6). Maintenant, soient x € G
d'ordre a et y e G d'ordre b. Comme k divise a, cela implique que x1 = xa/k est d'ordre k.
De même y' = ybli est d'ordre £, et le (i) montre que x'y' est d'ordre kl = ppcm(o,6).
D'où le (ii).
(iii) Il résulte du (ii) que G contient un élément d'ordre ppcm(a,N), si a; G G est
d'ordre a. Comme ppcm(o, N) ^ N, cela implique que ppcm(a, N) = N, par définition de
N, et donc que a divise N. On en déduit le (iii).
Remarque 1.2.31. Le cas de S3 montre que les trois résultats du lémme 1.2.30 peuvent
se trouver en défaut, si G n'est pas commutatif.
Si G est un groupe commutatif fini, l'entier N dont le (iii) du lemme 1.2.30 décrit les
propriétés est appelé l'exposant de G.
Lemme 1.2.32. Si G est un groupe commutatif fini, alors G et G ont même exposant.
252
CHAPITRE I. REPRÉSENTATIONS DES GROUPES FINIS
Démonstration. Si H est un groupe commutatif fini, notons N(H) son exposant. Si
X G H, on a
xN(H)(a;) = X(X)N(H) = x(:cN(H)) = x(1) = 1} pour tQut x e G)
et donc xN(H) = 1- On en déduit que l'exposant de H divise celui de H. En utilisant ce
résultat pour H = G et H = G, et l'isomorphisme G = G, on en déduit les inégalités
N(G) = N(G) ^ N(G) ^ N(G), qui permettent de conclure.
5.3. Le théorème de structure des groupes finis commutatif s
Théorème 1.2.33. Si G est un groupe fini commutatif, il existe r G N, et des entiers
Ni,..., Nr, où Ni est l'exposant de G et Ni+i|Ni, si % ^ r - 1, tels que G = 0£=1 Z/N;Z.
Démonstration. La démonstration se fait par récurrence sur |G|, le résultat étant évident
(avec r = 0), si |G| = 1. Suposons donc |G| > 1, et notons N = Ni l'exposant de G. Alors
x{x) est une racine N-ième de l'unité, pour tous x ^ O et rc G G. De plus, comme N
est aussi l'exposant de G (lemme 1.2.32), il existe Xi d'ordre N, et comme Xi(O) est un
sous-groupe du groupe cyclique /zN, c'est fiN tout entier. Il existe donc x\ G G tel que
Xi(^i) = e2i7r/N. Comme l'ordre de X\ divise N, par définition de l'exposant d'un goupe,
il en résulte que X\ est d'ordre N, et donc que le sous-groupe Hi de G engendré par x\
est isomorphe à Z/NZ. Montrons que G est la somme directe de Hi et Gi = Kerxi, ce
qui permettra de conclure en appliquant l'hypothèse de récurrence à Gi, l'exposant d'un
sous-groupe divisant celui du groupe de manière évidente. Pour cela, constatons que Xi
induit un isomorphisme de Hi sur /LtN, puisqu'il est surjectif et que les deux groupes ont
le même cardinal N ; notons a : /zN —» Hi son inverse. Si x G G, alors a = a(xi(^)) G Hi
et 6 = a-1 x vérifie Xi(&) = Xi(a)~lXi(x) = 1» et donc 6 G Gi. On peut donc écrire tout
élément rc de G sous la forme x = 06, avec a G Hi et b G Gi. Enfin Hi DGi = {1} puisque
Xi est injectif sur Hi. Ceci montre que G = Hi © Gi, et permet de conclure.
Exercice 1.2.34- Soit G un groupe commutatif fini. Montrer que G et G sont isomorphes.
6. Table des caractères d'un groupe fini
Soit G un groupe fini, et soit c = |Conj(G)|. La table des caractères de G est un tableau
c x c dont les coefficients sont les valeurs des caractères irréductibles sur les classes de
conjugaison de G, le coefficient à l'intersection de la colonne correspondant au caractère x
et de la ligne correspondant à la classe de conjugaison C, étant x(O). C'est en quelque
sorte la carte du groupe G.
Remarque 1.2.35. Notons Tq la matrice ex c définie par la table des caractères.
Notons aussi K la matrice diagonale dont le coefficient diagonal sur la ligne
correspondant à une classe de conjugaison C est S. Alors les relations d'orthogonalité des
caractères s'expriment de manière compacte par la relation TqKTq = I. On en déduit que
K = (Tq)"1!^1 et K_1 = TqTq. En particulier, les lignes de TG forment une famille
1.2. DÉCOMPOSITION DES REPRÉSENTATIONS
253
orthogonale, ce qui permet de remplir la table des caractères en n'en connaissant qu'une
partie.
Par exemple, le groupe {±1} a deux classes de conjugaison 1 et — 1, et deux caractères
irréductibles 1 et x (de dimension 1 puisque {±1} est commutatif) ; sa table des caractères
est très facile à établir :
1
-1
1
1
1
X
1
-1
FlG. 1. Table des caractères de {±1}
L'exemple du groupe {±1} est un peu trop trivial pour donner une idée de la manière
dont on peut construire la table des caractères d'un groupe. L'exemple de A4, traité ci-
dessous, est nettement plus riche. Le lecteur trouvera dans les exercices d'autres techniques
pour établir des tables de caractères de petits groupes. L'appendice C et les problèmes H.2,
H.3 et H.4 contiennent des exemples un peu plus sophistiqués. Le contraste entre la
simplicité et la puissance de la théorie générale et le côté artisanal du traitement des cas
particuliers est assez saisissant.
Rappelons que A4 est le sous-groupe des permutations de S4 de signature 1. Comme S4
a 24 éléments, on a |A4| = 12, et les éléments de A4 sont :
• l'élément neutre id,
• les trois produits de deux transpositions S2 = (12)(34), S3 = (13)(24) et s4 = (14)(23),
qui sont d'ordre 2,
• les huit 3-cycles (123), (234), (341), (412) et (132), (243), (314), (421), qui sont
d'ordre 3.
Nous nous proposons d'établir la table des caractères de A4. Il y a plusieurs manières
d'arriver au résultat. La manière la plus systématique consiste à déterminer les classes de
conjugaison de A4, construire toutes les représentations irréductibles de A4, et calculer la
valeur de leurs caractères sur les classes de conjugaison. C'est celle que nous explorons en
premier*7* ; ensuite nous montrons un certain nombre de raccourcis possibles qui utilisent
les théorèmes du cours.
(a) Soit t le 3-cycle (123). On a t2 = (132), et comme t est d'ordre 3, le sous-groupe
T = {l,t,t2} de A4 engendré par t est d'ordre 3.
(b) H = {id,S2,S3,s4} est un sous-groupe commutatif distingué de A4.
(7)Nous n'avons pas cherché la solution la plus courte ; au contraire, nous avons essayé d'employer un
maximum de techniques de base de la théorie des groupes finis. On pourrait aller plus vite en utilisant
ce qu'on sait des classes de conjugaison de S4 (n° 3.4 du Vocabulaire).
254
CHAPITRE I. REPRÉSENTATIONS DES GROUPES FINIS
Cela peut se vérifier par un calcul un peu fastidieux. On peut aussi remarquer qu'un 2-
Sylow de A4 est de cardinal 4, et comme H est de cardinal 4 et contient tous les éléments
de A4 d'ordre divisant 4, cela prouve qu'il n'y a qu'un seul 2-Sylow (qui est donc distingué
puisque la conjugaison transforme un 2-Sylow en un 2-Sylow), et que ce 2-Sylow est H. De
plus, tous les éléments de H sont d'ordre divisant 2, et un groupe ayant cette propriété est
commutatif car (xy)2 = 1 = x2y2 implique xy = yx.
(c) Tout élément de A4 peut s'écrire sous la forme tah, avec a G {0,1,2} et h G H, et
ceci, de manière unique.
Les sous-groupes T et H de A4 ont une intersection réduite à {id}. On en déduit que
(c, h) h-» ch est une injection de T x H dans A4 ; en effet, si C\h\ = 02/12 > alors c^ci = /^hf1,
et comme c^ci G T et /12/if1 G H, on a C2 = c\ et /12 = h\. Comme T x H et A4 ont le même
cardinal, une injection est une bijection, ce qui permet de conclure.
(d) t et t2 ne commutent à aucun élément de H — {id}.
Cela peut se vérifier par un calcul un peu pénible. On peut aussi remarquer que si t et
s G H - {id} commutent, le sous-groupe G de A4 engendré par 5 et t est commutatif et
isomorphe à (Z/2Z) 0 (Z/3Z) = Z/6Z, car les sous-groupes {id,s} et T engendrés par s et t
sont en somme directe. Ceci n'est pas possible car A4 ne contient pas d'élément d'ordre 6.
L'argument est le même pour n'importe quel 3-cycle, et donc en particulier pour t2.
(e) Les classes de conjugaison de A4 sont Bi = {id}, B2 = H — {id}, B3 = £H et
B4 = *2H.
Un calcul particulièrement ennuyeux mènerait au résultat...
• Comme dans tout groupe, la classe de conjugaison de l'élément neutre n'a qu'un élément,
et donc Bi G Conj(A4).
• Si s G B2, et si tah, avec a G {0,1,2} et h G H commute à s, on a tahs = stah, et donc
tahsh = stah2, et comme H est commutatif et h2 = id, on obtient tas = sta, ce qui implique
a = 0. Le centralisateur de s est donc H, et le cardinal de la classe de conjugaison de s est
égal à ^ = 3. Comme un conjugué de s est d'ordre 2, cette classe de conjugaison est incluse
dans B2, et donc lui est égale pour des raisons de cardinal.
• Enfin, le centralisateur de t et t2 est T (si taht = ttah, on a ht = th, et donc h = id), ce
qui fait que le cardinal de la classe de conjugaison de t est ^ = 4. Or on a (tah)t(tah)~l =
tahth-H-a = t(ta-lhtl-a)(tah-H-a) G *H, car H est distingué et donc ta-lhtl-a G H et
tah~~lt~a G H. La classe de conjugaison de t est donc incluse dans B3 et lui est égale pour des
raisons de cardinal. De même, la classe de conjugaison de t2 est B4.
Ceci permet de conclure.
(f) Soit p = e~^ une racine primitive 3-ième de l'unité. Si % G {0,1,2}, on définit
rf : A4 -> /x3 par rf(tah) = pia, si o G {0,1,2} et si h G H. Alors 770 = 1, 77 et rf sont des
caractères linéaires distincts de A4.
Si a, 6 G {0,1,2}, et si h, g G H, alors tahtbg = ta+b(rbhtb)g, et comme H est distingué, on
a t~bhtb G H, et donc {t-bhtb)g G H et rf{tahtbg) = pi(a+6> = piapib = rf(tah)rf{tbg).
(g) Soit V la représentation de permutation associée à l'action naturelle de A4 sur
{1,2,3,4}. Rappelons que cette représentation est C4 muni de l'action de A4 définie, dans
1.2. DÉCOMPOSITION DES REPRÉSENTATIONS
255
la base canonique eu ..., e4, par g(ei) = eg^). L'hyperplan W d'équation Xi H hx4 = 0
est stable par A4, et la représentation que Ton obtient est irréductible de caractère donné
par xw(id) = 3, xw(p) = -1, si g G H - {id}, et xw(p) = 0, si g £ H.
La représentation V se décompose sous la forme V7 0 W, où V7 est la droite engendré
païen h e4 (isomorphe à 1 car e\ H h e4 est fixe par A4). Comme V est une représentation
de permutation, xv(</) est le nombre de points fixes de g agissant sur {1,2,3,4}. On a donc
Xv(id) = 4, xv(tf) = 0, si g G H - {id} et xv(tf) = 1, si g £ H. On en déduit le caractère
de W, car xv = Xv +Xw> et Xv(</) = 1 pour tout g G A4, puisque V = 1. Donc xw(id) = 3,
Xw(tf) = -1, si g G H - {id}, et xw(tf) = 0, si g <£ H.
Il reste à vérifier que W est irréductible. Commençons par constater que, si g G A4 et si
v = (a?i,...,a;4) G C4, alors gv = xiegW + • ■ ' + x4eg^) = (xg-iW,... ,^-i(4)). Maintenant,
supposons v G W - {0} et soit W7 le sous-espace de W engendré par les g • v, pour g e A4
(il s'agit de prouver que W7 = W, quel que soit v). Il existe donc i ^ j tel que Xi ^ Xj
et, sans nuire à la généralité, on peut supposer que x\ ^ X2- L'image de v par le 3-cycle
t = (1,2,3) est alors (a?3,a;i,a;2,a;4); il en résulte que W7, qui contient t • v et v, contient
w = t • v - v = (£3 - x\,x\ - #2,22 - £3,0) (on a donc fait apparaître un 0). Le sous-espace
W7 contient aussi w + g • w, si g = (13)(24), et comme w + g • w = (x\ - £2)(e2 + 64 ~ 6i ~ 63)
et a?i — X2 7^ 0, il contient le vecteur /1 = ei — e2 + e3 — e4. Il contient donc aussi les images
h = ei + e2 - 63 - e4 et /3 = ei - e2 - e3 + e4 de ce vecteur par les 3-cycles (243) et (234), et
comme /i,/2,/3 forment une base de W, on a W7 = W, ce qui permet de conclure.
(h) La table des caractères de A4 est celle de la figure 2.
r1
B2
B3
B4_
1
1
1
1
1
V
1
1
P
P2
rf
1
1
P2
P
Xw
3
-1
0
0
FlG. 2. Table des earaetères de A4
En effet, A4 ayant 4 classes de conjugaison, il a aussi 4 représentations irréductibles à
isomorphisme près, qui sont donc les 3 caractères linéaires 1, r) et rj2, et la représentation W
de dimension 3. Les valeurs des caractères de ces représentations ont été calculées ci-
dessus ; ce sont les valeurs reportées dans la table. Ceci permet de conclure.
• Premier raccourci. On peut utiliser le cor. 1.2.21 pour démontrer l'irréductibilité de W : on a
(xw,Xw) = n(32 + 3 • (-1)2 + 8 • 0) = 1, ce qui prouve que W est irréductible.
• Second raccourci. Imaginons que l'on ait construit des représentations 1,77, rj2 et W dont les caractères
prennent les valeurs de la table sur Bi, B2, B3 et B4, mais qu'on ne sache pas quelles sont les classes de
conjugaison de A4. Alors on peut en déduire que ces classes sont exactement Bi, B2, B3 et B4, ce qui
permet de se passer des points (d) et (e) ci-dessus. En effet, comme l2 + l2 +12 + 32 = 12, la formule de
Burnside ((ii) du cor. 1.2.23) montre que 1, t?, t?2 et xw sont les éléments de Irr(A4), et donc (cor. 1.2.16)
256
CHAPITRE I. REPRÉSENTATIONS DES GROUPES FINIS
que A4 a 4 classes de conjugaison. Or on remarque que, si i ^ j, il existe x G Irr(A4) prenant des valeurs
distinctes sur B* et Bj. Comme un élément de Irr(A4) est constant sur une classe de conjugaison, on en
déduit que si C G Conj(A4), il existe i(C) G {1,2,3,4} tel que C C Bi(C). Les éléments de C formant une
partition de A4, l'application C h* i(C) est surjective, et comme les deux ensembles ont le même nombre
d'éléments, elle est bijective ; de plus, on a B^c) = C, sinon un élément de B^c) - C ne serait pas dans
la réunion des classes de conjugaison. En résumé, les classes de conjugaison de A4 sont les B*.
• Troisième raccourci. Supposons W construite. La formule de Burnside ((ii) du cor. 1.2.23) nous fournit
alors l'identité 12 = |A4| = 9 + Z)w/€irr(A4)-{W}(^m W')2> et comme il y a une seule manière d'écrire 3
comme une somme de carrés, on en déduit que A4 a trois caractères linéaires distincts. Autrement dit,
le groupe Â4 (cf. ex. 1.1.10) est de cardinal 3 et donc isomorphe à Z/3Z ; en particulier, il est cyclique et
si on note rj un générateur, les éléments de A4 sont 77, rj2 et le caractère trivial qui est aussi égal à rj3.
Comme 77 est d'ordre 3, il est à valeurs dans le groupe jz3 des racines 3-ièmes de l'unité, et son image étant
un sous-groupe de jz3 non réduit à 1, c'est /jl3 tout entier. En particulier, l'image de 77 est de cardinal 3,
et donc le noyau est de cardinal |A4|/3 = 4. Par ailleurs, on a H c Kerx car le seul élément de jz3 d'ordre
divisant 2 est 1. On en déduit que Kerx = H, ce qui permet de redémontrer le point (b). Enfin, on a
rj(t) 7^ 1 puisque t $. H, et donc rj(t) = p ou rj(t) = p2 ; quitte à remplacer 77 par rj2, on peut supposer que
rj(t) = p. On a alors rj(g) = 1 si g G H = Bi U B2, rj(g) = p si g G B3 = *H, et rj(g) = p2 si g G B4 = t2K
Ceci permet, en utilisant le second raccourci, de compléter la table des caractères de A4 sans avoir utilisé
un seul des points (a)-(e) au sujet de la structure de A4 ni le point (f).
• Quatrième raccourci On suppose ce coup-ci que l'on a construit 7/, ce qui utilise les points (a)-(c)
et (f), mais pas les (d), (e) et (g). La formule de Burnside montre alors, qu'il y a a priori quatre possibilités
pour les caractères irréductibles distincts des caractères linéaires 1,77 et rj2 :
un unique caractère xw de degré 3,
deux caractères de degré 2 et un de degré 1, ou un de degré 2 et cinq de degré 1,
neuf caractères de degré 1.
Si on est dans le premier cas, on a gagné car 1 + 77 + rj2 + 3xw est le caractère de la représentation
régulière, ce qui permet de calculer xw> et donc de compléter la table en utilisant le second raccourci. Il
suffit donc d'éliminer les autres possibilités.
• La dernière implique que |Irr(A4)| = 12, ce qui implique que A4 a 12 classes de conjugaison
(cor. 1.2.16), et donc que celles-ci sont des singletons, et que A4 est commutatif, ce qui n'est pas.
• Si A4 a au moins une représentation irréductible V de dimension 2, alors xv> XvV et XvV2 sont des
caractères irréductibles de degré 2 (cf. alinéa 2.1), et comme il y a au plus deux tels caractères, il existe
Vi ¥" V2 G {l,7/,7/2} tels que xvVi = XW2. Or la condition 771 ^ rj2 implique que rji(t) ^ V2(t), et la
relation xvVi = Xvf?2 entraine donc Xv(*) = 0. Ceci n'est pas possible, car t est d'ordre 3, ce qui fait que
les deux valeurs propres de py{t) sont des racines 3-ièmes de l'unité, et la somme de deux racines 3-ièmes
de l'unité n'est jamais nulle. L'existence d'une représentation irréductible de dimension 2 est donc exclue,
ce qui permet de conclure.
1.3. Construction de représentations
1. Restriction et inflation
Si H est un sous-groupe de G et si V est une représentation de G, on peut considérer la
restriction Res"V de V à H en oubliant l'action des g G G — H. Alors pResHv : H —» GL(V)
est la restriction de pv • G -* GL(V) à H, et XResHvW = Xv(h), pour tout h G H.
1.3. CONSTRUCTION DE REPRÉSENTATIONS
257
Si ip : G —* H est un morphisme de groupes, et si V est une représentation de H, alors
V peut aussi être considérée comme une représentation de G, en faisant agir g G G par
(p(g) € H; la représentation de G ainsi obtenue est l'inflation InfgV de Va G. Alors
Anfgv : G -* GL(V) est égal à la composée pu o cp, et on a Xinfgvtë) = Xv(<?(0)), pour
tout g G G. Si x est un caractère de H, il résulte de ce qui précède que x°^est un
caractère de G : c'est l'inflation de x à G.
Remarque 1.3.1. Supposons (p : G —» H surjectif.
(i) Un sous-espace de V est stable par G si et seulement si il l'est par H, ce qui prouve
que Inf^V est irréductible si et seulement si V l'est, et prouve que x •-► X ° V induit une
injection de Irr(H) dans Irr(G).
(ii) Si N est le noyau de (p, une représentation V de G est obtenue par inflation d'une
représentation de H si et seulement si N agit trivialement sur V. En effet, si V = IngW,
alors g G N agit par (p(g) = 1 sur W et donc N agit trivialement sur V ; réciproquement,
si V est une représentation de G sur laquelle N agit trivialement, alors V est l'inflation
de la représentation de H obtenue en définissant h • v, pour h G H et v G V, par v ■-> h • u,
où h G H vérifie (p(h) = h : ceci ne dépend pas du choix de h car N agit trivialement, et
ip(h) = (p(h') implique l'existence de n G N tel que h' = hn, et donc h'-v = h-(n-v) = h-v.
Exercice 1.3.2. Soient G un groupe fini et <p : G —» H un morphisme de groupes surjectif, de noyau N.
Montrer que x € Irr(G) est l'inflation d'un caractère de H si et seulement si x(<?) = x(l) pour tout jGN.
2. Constructions tensorielles de représentations
2.1. Produit tensoriel d'espaces vectoriels de dimension finie
Soient Vi, V2 deux espaces vectoriels de dimension finie, et soient (ei,..., en) une base
de Vi et (/i,..., fm) une base de V2. Soit Vi <g> V2 le produit tensoriel de Vi et V2 : c'est
l'espace vectoriel de base^ les e^/j, pour 1 ^ i ^ n et 1 ^ j ^ m. Si x = X^Li ^e* e ^1
et y — Y^jLi Vjfj € ^2> on note x <g> y l'élément de Vi <g> V2 défini par la formule
n m
x®y = ^2^2\ifj,jei®fj.
Le produit tensoriel Vi <g> V2 est en général un objet nouveau, mais il arrive qu'il puisse
se décrire de manière plus explicite.
Exemple 1.3.3. (i) Si X est un ensemble fini, on note Cx l'ensemble des fonctions
<f> : X —» C. C'est un espace vectoriel dont une base est l'ensemble des <f>x, pour rc G X,
où <f>x(y) = 1, si y = x et <f>x{y) = 0, si y ^ x. Il est facile de vérifier que, si I et J sont
deux ensembles finis, alors fa <S> <f>j ■-> <f>(ij), pour i G I et j G J, induit un isomorphisme
deCI<g>CJsurCIXJ.
(8)()n aurait pu noter gitj la base de Vi <g> V2, mais la notation et <8> fj est plus parlante pour la suite.
258
CHAPITRE I. REPRÉSENTATIONS DES GROUPES FINIS
(ii) Si Vi, V2 sont deux espaces vectoriels, et si V* et V^ sont leur duaux (V* est l'espace
des formes linéaires sur V*), alors V* <g> VJ est l'espace des formes bilinéaires sur Vx x V2.
Si Ai G V* et À2 G V2, alors Ai <8> A2 est la forme bilinéaire (x,y) v-> Xi(x)\2(y).
Exercice I.3.4. Montrer que Vf <g> V2 = Hom(Vi, V2).
Par construction, (x, y) i-> x<g>y est une application bilinéaire de Vi x V2 dans Vi <g>V2.
Le lemme suivant montre que Vi <8» V2 est universel pour les applications bilinéaires sur
Vi x V2.
Lemme 1.3.5. Si W est un espace vectoriel, et si u : Vi x V2 —* W est bilinéaire, alors
il existe une unique application linéaire û : Vi <S> V2 —* W, telle que û(x <g> y) = u(x,y),
quels que soient x G Vi et y G V2.
Démonstration. On définit û par ses valeurs sur les éléments de la base des e* <g> fj,
en posant û{ei <g> fj) = u(eiyfj). Un calcul immédiat montre alors que la bilinéarité de u
est équivalente à la relation û(x <g> y) = u(x,y), quels que soient x G Vi et y G V2. Ceci
permet de conclure(9>.
Maintenant, si U\ G End(Vi) et Ui € End(V2), alors (x,y) h-> u\(x)®U2{y) est bilinéaire
de Vi x V2 dans Vi <g> V2. D'après le lemme 1.3.5, il existe U\ <S> u2 G End(Vi <g> V2)
unique, tel que («1 <S> U2){x <g> y) = Ui(x) <g> «2(2/)» quels que soient x G Vi et y G V2.
Si A = (oi^Ki^n G Mn(C) est la matrice de «1, et B = (bi'd')i^j%m G Mm(C)
est la matrice de «2, alors la matrice A <g> B G Mnm(C) de U\ 0 U2, dans la base des
ei®fi> = P(i-i)m+t', est la matrice des c(i_i)m+i/)(j_i)m+/, avec 1 < t,,; < n et 1 < i',/ < m
et c(<_i)m+j/>y_i)m+i/ = Oijfci/j/. En particulier, on a
n m n m
Tr(«i <g> u2) = ]T Cfc>& = 5Z S fiiA'f = ( ]C "M ) ( 5Z 6*'.<') = riY(Ml) '^M-
(9) Cette caractérisation de Vi ® V2 comme solution d'un problème universel permet de montrer son
indépendance par rapport aux bases de Vi et V2 choisies pour sa construction. En effet, si X est un espace
vectoriel muni d'une application bilinéaire B : Vi x V2 —> X tel que pour toute application bilinéaire
u : Vi x V2 —> W, il existe une unique application linéaire û : X —> W, telle que û(B(x,y)) = u(x,y),
quels que soient x G Vi et y G V2, alors il existe une unique application linéaire / : Vi ® V2 —» X vérifiant
f(x<8>y) = B(a?,t/), pour tout (a;,t/) G Vi x V2 et une unique application linéaire g : X —> Vi ® V2
vérifiant </(B(a;,2/)) = a:®t/, pour tout (a?,t/) G Vi x V2. Comme l'identité est l'unique application linéaire
h de Vi ® V2 (resp. X) dans lui même telle que h(x <8>y) =x<8>y (resp. h(B(x,y)) = B(x,y)), pour tout
(a:, y) G Vi x V2, on a / o g = idx et g o f = idv!®v2 > ce qui montre que X et Vi ® V2 sont isomorphes,
à isomorphisme unique près respectant les formes bilinéaires sur Vi x V2. Une construction générale,
sans choix de base, consiste à prendre le quotient de l'espace de base les eXf!/, pour (a:, y) G Vi x V2,
par les relations eXiVl+y2 = eXiVl + eXiV2, eXl+X2>y = eXltV + eX2tV et e\x%y = eXi\y = \ex,y. Alors x® y
est l'image de ex%y dans le quotient (cf. alinéa 10.5.2 du Vocabulaire pour une construction similaire). La
construction du texte est moins canonique mais plus concrète... La construction générale a l'avantage de
marcher aussi en dimension infinie où une base n'est pas toujours facile à exhiber.
1.3. CONSTRUCTION DE REPRÉSENTATIONS
259
Enfin, on déduit du lemme 1.3.5 que, si u[,u" € End(Vi), et si n2,w2' € End(V2), alors
(«i o u'{) 0 (u'2 o u2) = (u[ 0 u2) o (u'I 0 u2).
(Il suffit de comparer l'image de x 0 y par les endomorphismes dans les deux membres.)
2.2. Produit tensoriel de représentations
Soient G un groupe fini, et Vi, V2 deux représentations de G. D'après ce qui précède,
si on définit une action de G sur Vi 0 V2 par g • (x 0 y) = (g • x) 0 (g • y), on obtient une
représentation de G. La formule ci-dessus pour la trace de u\ 0 U2 montre que
XVi®v2(0)=Xi(0)X2(0).
Si V2 est de dimension 1, on retrouve la construction de la tordue d'une représentation
par un caractère linéaire (alinéa 2.1 du § 1.1).
Remarque 1.3.6. (i) Si Gi et G2 sont deux groupes finis, et si Vi et V2 sont des
représentations de G1 et G2 respectivement, on peut définir de la même manière une représentation
Vi §V2 de Gi x G2, en faisant agir g = (^1,^2) € Gi x G2 sur l'espace vectoriel Vi 0 V2
par g-(x®y) = (gi-x)® (g2 • y)-
(ii) Si Gi = G2 = G, la représentation Vi <g> V2 de G définie précédemment est la
restriction à G, vu comme ensemble des couples (g, g) de G x G, de la représentation
Vi S V2 de G x G (c'est pour pouvoir faire la distinction que Vi S V2 n'est pas notée
Vi®V2).
Exercice 1.3.7. Montrer que R+(G) est stable par produit, et que Rz(G) est un anneau.
Exercice 1.3.8. Retrouver la formule Xv1®v2(#) = Xi(g)X2(g) en prenant des bases constituées de
vecteurs propres de g.
2.3. Carré symétrique et carré extérieur d'une représentation
Si V est une représentation d'un groupe fini G, la représentation V 0 V n'est pas
irréductible. En effet, les tenseurs symétriques (i.e. les expressions de la forme
xy = \{x 0 y + y 0 x), avec x,y € V, et donc xy = yx, si x, y G V) et les tenseurs
alternés (les x Ay = x0y — y0x, et donc x A y = —y A x, si x, y € V) sont stables sous
l'action de G ; il en est donc de même des sous-espaces de V <g> V qu'ils engendrent.
On note Sym2V le carré symétrique de V ; c'est le sous-espace de V 0 V engendré par
les tenseurs symétriques. Si V est de dimension d, de base (ei,... ,e<f), alors Sym2V est
un espace de dimension d^1) dont une base est constituée des e^-, pour 1 < i < j < d.
On note A2V le carré extérieur de V ; c'est le sous-espace de V 0 V engendré par les
tenseurs alternés. C'est un espace de dimension d(d~l> dont une base est constituée des
ei A ej, pour 1 < i < j ^ d.
De plus, V <8> V = Sym2V 0 A2V (c'est la décomposition en somme d'espaces propres
pour la symétrie s de V 0 V obtenue en linéarisant l'application bilinéaire (rc, y) ■-► y 0 x
de V x V dans V <g> V ; on a s(x 0 y) = (y 0 x) pour tous x, y G V).
260
CHAPITRE I. REPRÉSENTATIONS DES GROUPES FINIS
Exemple 1.3.9. Si V* est le dual de V, alors Sym2V* est l'espace des formes bilinéaires
symétriques sur V et A2V* est celui des formes bilinéaires alternées.
Proposition 1.3.10. Si V est une représentation de G, et si g € G, alors
Xsym'vtë) = 2^v^)2 + Xv(92)) et XaM9) = ^{Xv{9? ~ Xv(92))-
Démonstration. Choisissons une base (ei,..., e^) de V formée de vecteurs propres de g.
On a alors g • ei = À^, g2 • e* = Afe*, et g • e^ej — \{\j e^-, g • e* A ej = X{Xj e* A e$. On
en déduit que
Xsym2v(p) = X) XiXi et X*2v(9) = 5Z XiXJ>
i^j i<j
et comme
W) = I>2 et Xv(<?)2 = (E^)2 = EA.2 + 2E^>
i i i i<j
le résultat s'en déduit.
Remarque 1.3.11. Ce que l'on a fait avec deux copies de la même représentation V de G peut se
généraliser à n copies de V. On note <g>nV le produit tensoriel de n copies de V (avec une définition
évidente). On note Sn le groupe des permutations de {1,... ,n}, et sign : Sn —> {±1} la signature. Un
tenseur symétrique est un tenseur de la forme
1 ^
Xl'"Xn = ri[ ^ ^(i)® '"®x<r(n)>
' <r€Sn
et un tenseur alterné est un tenseur de la forme
xi A ■ ■ ■ A xn = ^ sign(°") x*(i) ® ■ ■ ■ ® Za(n).
<t€S„
La puissance symétrique n-ième de V est le sous-espace SymnV de <g>nV engendré par les tenseurs
symétriques, et la puissance extérieure n-ième de V est le sous-espace AnV de <g>nV engendré par les tenseurs
alternés. Alors SymnV et AnV sont des représentations de G de dimensions respectives (d+^_1) et (^).
(SymnV © AnV est un sous-espace strict de <g>nV, dès que n ^ 3.)
En particulier, AnV = 0 si n > d, et AdV est de dimension 1 ; cette représentation est souvent notée
detV, l'action de g sur detV étant la multiplication par detpy(g). (Voir l'alinéa 6.3 et l'ex. 6.1 du
Vocabulaire pour des constructions analogues.)
3. Représentations induites
3.1. Caractère d'une représentation induite
Soit H un sous-groupe de G, et soit V une représentation de H. On définit l'espace
vectoriel IndfjjV par
Ind^V = {cp : G —» V, cp(hx) = h • (p(x), quels que soient h G H et x G G}.
Soit S C G un système de représentants de H\G. Si x G G, il existe alors un unique
hx e H tel que h~lx G S. Ceci permet d'établir un isomorphisme de Ind^V sur l'espace
Vs des applications de S dans V, en envoyant (p sur (cp(s))ses ; la bijection réciproque
1.3. CONSTRUCTION DE REPRÉSENTATIONS
261
envoie (vs)$€s € Vs sur l'application (p : G —* V définie par (p(x) = hx-vh-\x. Pour vérifier
que (p est bien un élément de Ind^V, il suffit de constater que, si h e H, alors /i/lx = hhx,
et donc
(p(hx) = hhx • v^h^-ihx = hhx • vh-ix = h-(hx- vh-\x) = h • (p(x).
On munit Ind^V d'une action de G en définissant g • (p comme la fonction x i-> ip(xg). Si
h € H, on a
(g • <p)(hx) = (p(hxg) = h • y(xg) = h>((g- (p)(x))>
ce qui prouve que g • (p est bien élément de Ind^V. De plus, si #1, <?2 € G, alors
(9i ' fe • <p))(x) = te • <p)(xgi) = <p(xgig2) = (gm • <p)(x),
ce qui prouve que l'on a bien défini une action de groupe de G sur Ind§ V. La représentation
de G ainsi obtenue est la représentation induite de E à G de la représentation V. L'iso-
morphisme de Ind§V sur Vs montre que la dimension de Ind§V est |S|-dim V = M dim V.
Par exemple, si H = 1, et V = 1 est la représentation triviale, la représentation Ind§ V
est l'espace des fonctions ip : G —* C. Il admet comme base les fonctions (ph, pour h G G,
définies par (ph(x) = 1, si xh = 1, et (ph(x) = 0, si xh ^ 1. Si g € G, on a alors
(9 ' tPhife) — <Ph{xg) = ipgh{x). On en déduit que Ind^j 1 est la représentation régulière
de G.
Remarque 1.3.12. Les représentations induites à partir de représentations de sous-
groupes sont la principale source de représentations d'un groupe G. L'un de leurs intérêts
est que leur caractère se calcule très facilement (cf. annexe C pour un certain nombre
d'applications).
Théorème 1.3.13. Soient H C G deux groupes finis, S C G un système de
représentants de H\G, V une représentation de H, et W = Ind^V. Alors, pour tout g e G :
xw(g)= Y^ xv(sgs~l) = 7777 J2 xv{sgs~l).
s6S I I «6G
«j*-1eH »».»-1eH
Démonstration. On utilise l'isomorphisme de W avec Vs = ©S€sVs. Dans cet iso-
morphisme, si ip est l'image de (vs)s€s, on a (p(x) = hx • vh^ix, et g • (p est l'image de
((9 ' y?)(5))s€S = (<£(s<7))s€S, ce qui fait que l'on obtient
g • (vs)s€S = {hsg • vh7isg)s€S.
Choisissons une base (ei)i€i de V, et notons ei>s l'élément (vt)t€S de Vs défini par vs = e*, et
vt = 0, si t^ s. Les ef)S, pour tel, forment une base de Vs, et les ei)S, pour (i, s) € I x S,
forment une base de Vs. La matrice de g dans cette base est constituée de blocs indexés par
(s, s') G S x S, le bloc correspondant à (s, s') étant nul sauf si s' = hjgSg. En particulier,
les seuls blocs qui vont contribuer à la trace sont ceux pour lesquels s = hj^sg, ce qui
262
CHAPITRE I. REPRÉSENTATIONS DES GROUPES FINIS
peut se réécrire sous la forme hsg = sgs~l. L'action de g sur le Vs correspondant coïncide
alors avec celle de hsg = sgs~l, et sa contribution à la trace est donc Xv(s9s~1)- On
en déduit la première égalité du théorème. La seconde s'en déduit en remarquant que
Xv{hsg (hs)'1) = Xv(h(sgs~l)h~l) = XvCW1), si /i € H et sgs~l e H, et en écrivant
s G G sous la forme hjls.
Exercice 1.3.14. Retrouver la formule dim(IndH V) = j§[ dim V en utilisant le th. 1.3.13.
3.2. La formule de réciprocité de Probenius
Soient H C G deux groupes finis. On définit des applications linéaires
Resg : RC(G)-> RC(H) et Indg : RC(H) -+ RC(G),
de la manière suivante. Si </> e Rc(G), alors ResJÎ</> est juste la fonction centrale sur H,
restriction de <f> à H, et si cf> G Rc(H), alors lnd§0 est la fonction centrale sur G donnée
par la formule
(lnd^)(S) = p J2 4>(sgs-1).
Il est immédiat que, si W est une représentation de G, alors ResJJxw est le caractère de la
représentation de H obtenue en ne considérant que l'action du sous-groupe H de G. Dans
l'autre sens, si V est une représentation de H, alors Indjjxv est, d'après le th. 1.3.13, le
caractère de la représentation induite Ind§ V.
Pour les distinguer, on note ( , )h et ( , )g les produits scalaires sur Rc(H) et Rc(G).
On a alors le résultat suivant.
Théorème 1.3.15. (formule de réciprocité de Frobenius) Si (f>\ et fc appartiennent à
Rc(H) et Rc(G) respectivement, alors
(0i,Resg(/>2)H = (Indg01,</>2>G.
Démonstration. Par définition, on a
(Indg^^G =|4EIndS^^)^(p)
' ' g€G
I l g€G ' ' «eo
En posant h = sgs~l, et donc g = s^hs, on peut réécrire la somme ci-dessus sous la
forme
lGHHU.êc
1.3. CONSTRUCTION DE REPRÉSENTATIONS
263
et comme fa est une fonction centrale sur G, on a fa(s 1hs) = fa(h), quel que soit s € G.
On obtient donc
(Ind^1,02)G = ^^^1 = <<£i> Resg02)H,
ce qui permet de conclure.
Un cas particulier, extrêmement utile, de ce théorème, est le suivant.
Corollaire 1.3.16. Si W (resp. V) est une représentation irréductible de G (resp. de H),
la multiplicité de W dans IndgV est égale à celle de V dans ResJiW.
Démonstration. Il suffit d'utiliser la formule de réciprocité de Probenius pour fa = xv
et fa = Xwj combinée avec le cor. 1.2.18.
Exercice 1.3.17. (i) Montrer que, si V, Vi, V2 sont des représentations de G, alors
HomG (V, Vi 0 V2) = HomG (V, V! ) 0 HomG (V, V2)
HomG(V! 0 V2, V) = HomG(Vi, V) 0 HomG(V2, V).
(ii) En déduire que, si V et V sont deux représentations de G, alors dim(HomG(V, V')) = (xv.Xv)-
(iii) Soit H un sous-groupe de G, et soient W une représentation de H et V une représentation de G. Si
u € HoniH(W, ResG V), on note au : Indg W —» V l'application qui à un élément 0 : G —» W de Ind^ W,
associe au(<f>) = ^ ^gçG9~lu(<f>(g)). Montrer que au G HomG(IndH W, V).
(iv) Montrer que u i-> au, de HomH(W,ResG V) dans HomG(IndH W, V), est une injection linéaire. En
déduire que c'est un isomorphisme (réciprocité de Probenius pour les représentations).
3.3. Transitivité des inductions
Proposition 1.3.18. Soient K C H C G des groupes finis.
(i) Si(f> e R^(K), alors Ind£(Ind£0) = Indg<£.
(ii) Si W est une représentation de K, alors Ind^Ind^ W) = Indg W.
Démonstration. Le (ii) est, modulo le fait qu'une représentation est déterminée par son
caractère (cor. 1.2.19), une conséquence du (i) appliqué à <f> = xw- Pour démontrer le (i),
on part de la formule
Indg(Indg*)(p) = -^ £ (Indgfltea-1)
- m E m E «**«-,*-,>-
l«l £f |K|
*6G I I /»€H
On pose alors hs = t de telle sorte que s = h 1t, ce qui permet de réécrire la somme
ci-dessus sous la forme
/iGH, teG
264
CHAPITRE I. REPRÉSENTATIONS DES GROUPES FINIS
Comme la condition h ltgt 1h e H est automatique, si tgt * G K et h e H, la somme
ci-dessus se simplifie et devient
-^ £ #tgrl) = (Indgflfo),
tgl~l€K
ce qui permet de conclure.
3.4- Les théorèmes d'Artin et de Brauer
Théorème 1.3.19. (Artin, 1930) Soit G un groupe fini, et soit V une représentation
de G, alors il existe un entier non nul dy, et une famille finie de couples (Q,Xi), pour
i € I, où Ci est un sous-groupe cyclique de G, et Xi € Q est un caractère linéaire de Q,
tels que Von ait
dyXv = ^2niInc*CiXt> o,vec n* e Z, si i e I.
t€l
Démonstration. Commençons par démontrer que les Ind§x> où C décrit les sous-groupes
cycliques de G, et x les éléments de C, forment une famille génératrice de Rc(G). Dans
le cas contraire, il existe <f> € Rc(G) non nulle, orthogonale à tous les Ind§x- En utilisant
la formule de réciprocité de Frobenius, on en déduit que (0, x)c = 0, quel que soit x € C-
Soit alors c € G. Le sous-groupe C de G engendré par c est cyclique par définition. Comme
un groupe cyclique est en particulier commutatif, les x £ C engendrent l'espace vectoriel
des fonctions de C dans C (cor. 1.2.25). Si (f)c : C —* C est la fonction valant 1 en c, et 0
ailleurs, on a donc 0 = ((/>, </>c)c = ]èi$(c)> et donc 0(c) = 0. On en déduit le fait que <f> est
identiquement nulle, ce qui permet de prouver notre affirmation selon laquelle les Ind§x
forment une famille génératrice de Rc(G).
Extrayons-en une base e* = Ind^.Xi, pour i e I. Si x G Irr(G), on a (x, e») G N, puisque
(x» ei) est la multiplicité de la représentation correspondant à x dans la décomposition de
Indcl.Xi en ^présentations irréductibles. De plus, e* = Z)X€irr(G)(x»ei)x- La matrice de
passage de la base des eiy pour t G I, à celle des x> pour x G Irr(G), est donc à coefficients
rationnels, et comme xv a, pour la même raison que précédemment, des coordonnées
entières dans la base des x» pour x € Irr(G), cela implique que xv a des coordonnées
rationnelles dans la base des e*, pour t e I. Il suffit alors de prendre pour dy le p.p.c.m.
des dénominateurs des coordonnées de xv dans la base des ei} pour tel, pour obtenir la
décomposition voulue. Ceci permet de conclure.
Théorème 1.3.20. (R. Brauer, 1947) Soit G un groupe fini, et soit V une
représentation de G, alors il existe une famille finie de couples (HùXi)> P°ur « G I, où H* est un
sous-groupe de G, et Xi € H* est un caractère linéaire de H*, tels que Von ait
Xv = ^2iniInd^-Xi» o,vec riiEZ, si i G I.
tel
1.3. CONSTRUCTION DE REPRÉSENTATIONS
265
La principale différence avec le théorème d'Artin est la disparition de l'entier dv, ce
qui a des conséquences assez remarquables (une de ces conséquences est évoquée au n ° 3
du § G.l). L'autre différence est que Ton ne peut pas se restreindre aux groupes cycliques
(R. Brauer montre que Ton peut se restreindre aux groupes élémentaires : un groupe fini H
est dit élémentaire s'il existe un nombre premier p tel que H soit le produit d'un p-groupe
(un groupe d'ordre une puissance de p) par un groupe cyclique d'ordre premier à p). La
démonstration demande d'utiliser des propriétés d'intégralité des Xv(#)> et déborde un
peu du cadre de ce cours. Signalons que ces propriétés d'intégralité permettent aussi de
démontrer le résultat suivant.
Proposition 1.3.21. Si G est un groupe fini et si V est une représentation irréductible
de G, alors dim V divise |G|.
4. Exercices
4.1. Tables de caractères
On rappelle que Sn (resp. An) désigne le groupe symétrique (resp. alterné), cf. n° 3.4 du Vocabulaire.
Exercice 1.3.22. Soit n un entier ^ 1. Quelles sont les représentations irréductibles de Z/nZ?
Exercice 1.3.23. Soit G un groupe non commutatif d'ordre 6.
(i) Quels sont les ordres des éléments de G ?
(ii) Montrer que G a deux caractères irréductibles de degré 1 (notés 1 et rj) et un de degré 2 (noté x)-
(iii) Montrer que G a 3 classes de conjugaison ; quelles sont-elles ?
(iv) Montrer que rj(g) = 1, si g est d'ordre 3, et que rj(g) = -1, si g est d'ordre 2 (on s'intéressera
à V(g2))' En déduire le cardinal de chaque classe de conjugaison.
(v) Dresser la table des caractères de G.
Exercice 1.3.24- (i) Montrer qu'un groupe non commutatif d'ordre 8 a quatre représentations
irréductibles de dimension 1 et une de dimension 2.
(ii) Soit D4 le groupe des symétries du carré. Montrer que D4 est d'ordre 8, et dresser la table des
caractères de D4.
(iii) Soit H4 le groupe des quaternions. C'est l'ensemble des (« -s), avec {a,6} C {0,1,-1,»,-i}, et
a = 0 ou b = 0. Montrer que H4 est un groupe d'ordre 8 non isomorphe à D4, et dresser sa table de
caractères.
Exercice 1.3.25. On fait agir Sn sur Cn par permutation des éléments de la base canonique. Montrer
que l'hyperplan Ya=i xi = 0 est stable par Sn et que la représentation ainsi obtenue est irréductible
(considérer v - a • v, où a est une transposition). En déduire une décomposition de Cn en somme de
représentations irréductibles de Sn.
Exercice 1.3.26. (o) Quelles sont les classes de conjugaison de S4 ?
(i) Montrer que C = {1, (12)(34), (13)(24), (14)(23)} est un sous-groupe distingué de S4 et S4/C = S3.
(On pourra faire agir S4 sur C - {1} par conjugaison.)
(ii) En déduire une représentation irréductible de S4 de dimension 2 et deux de dimension 1.
(iii) On fait agir S4 sur C4 par permutation des éléments de la base canonique. Montrer que l'hyperplan
V = {xi + x2 + X3 + x4 = 0} est stable par S4, et calculer le caractère xv-
(iv) Montrer que V est irréductible, non isomorphe à V<g>sign. En déduire la table des caractères de S4.
266
CHAPITRE I. REPRÉSENTATIONS DES GROUPES FINIS
Exercice 1.3.27. (o) Montrer que S5 a 7 classes de conjugaison, et calculer le cardinal de chaque classe.
(i) On note U la représentation de S5 sur l'hyperplan Yh=i #i = 0 de C5. Calculer xu> et montrer que
U et U <g> sign sont irréductibles non isomorphes.
(ii) Calculer Xa2u et montrer que A2U est irréductible.
(iii) Calculer Xsym2u et montrer que Sym2U = 1 © U © V, où V est irréductible.
(iv) Dresser la table des caractères de Sr>.
Exercice 1.3.28. Soit n ^ 3, et soient Dn le groupe des symétries d'un polygone régulier an sommets
et Cn C Dn le sous-groupe des rotations.
(i) Montrer que Cn est un groupe cyclique d'indice 2 dans Dn. Montrer que, si n est pair (resp. impair),
les symétries forment deux (resp. une) classes de conjugaison, et les rotations § + 1 (resp. I2yi).
(ii) Montrer que, si on identifie la rotation d'angle a avec la multiplication par eia dans le plan
complexe, les représentations irréductibles de Cn sont les Xa> pour a G Z/nZ, définies par Xa(eia) = eaiCL.
(iii) Si a G Z/nZ, calculer le caractère <j>a de Indexa-
(iv) Calculer {<j>a,<l>a) î en déduire dans quel cas Indexa est irréductible.
(v) Dresser la table des caractères de Dn.
4.2. Exercices plus théoriques
Exercice 1.3.29. Soit G un sous-groupe fini de GLn(C). Montrer que X]mggTi:(m) est un entier-
Comment cet entier s'interprète-t-il ?
Exercice 1.3.30. (i) Si a G Sn, soit f(a) le nombre de points fixes de la permutation a. Montrer que
EaeSn f(a)2 = 2nL (Utiliser !'ex- L3-25)
(ii) Quel est le nombre moyen de points fixes d'un élément de Sn ?
Exercice 1.3.31. Si N est un entier ^ 1, on note jzN l'ensemble des racines N-ièmes de l'unité et
Mn c Mn l'ensemble des racines primitives, et on pose S(N) = Y^ne» V et S*(N) = Z)ij€m* V-
(i) Décrire jij à partir des MN/rf, Pour d divisant N. En déduire que S*(N) = Sd|NMrf)s(N/rf)» où
\i : N - {0} -» {-1,0,1} est la fonction de Moebius définie par ^(n) = 0 si n est divisible par le carré
d'un nombre premier et /z(n) = (-l)r si n est le produit de r nombres premiers distincts.
(ii) Montrer que S*(N) G Z, pour N ^ 1.
(iii) Soit V une représentation de Sn, et soit g G Sn d'ordre N. Montrer que l'ensemble des valeurs
propres de pv(g) (avec multiplicité) est stable par À »-► A*, pour tout entier k premier à N. (On
s'intéressera à la décomposition de gk en cycles.)
(iv) En déduire que les caractères de Sn prennent des valeurs entières.
(v) Soit x un caractère irréductible de Sn distinct du caractère trivial et de la signature. Montrer que
x(l) 7^ 1 et en déduire qu'il existe g G G tel que x(g) = 0- (On calculera (x>x)-)
Dans tous les exercices qui suivent, G est un groupe fini.
Exercice 1.3.32. On suppose que G agit 2-transitivement sur X (cela signifie que, pour tous couples
(a:,x') et (3/, y') d'éléments de X avec x ^ x' et y ^ y1, il existe g G G tel que g • x = y et g • x' = y').
(i) Montrer que le stabilisateur Gy de y G X agit transitivement sur X - {y}.
(ii) Montrer que l'hyperplan W = {Y^xex ^*c*> Ylxex ^x = 0} de Vx est une représentation
irréductible de G. (Si v = Ylxex ^*e* G W, et si t/ G X on pourra s'intéresser à t^-t X^€G g • u.)
(ii) Retrouver le résultat de l'ex. 1.3.25.
Exercice 1.3.33. Si. x est Ie caractère d'une représentation de G, soit Kx = {g G G, x(g) = x(l)}-
(i) Montrer que Kx est un sous-groupe distingué de G.
1.3. CONSTRUCTION DE REPRÉSENTATIONS
267
(ii) Montrer que G est simple si et seulement si Kx = {1}, pour tout x G Irr(G) - {1}. Comment
peut-on lire la simplicité d'un groupe fini sur sa table des caractères ?
Exercice 1.3.34- Soit V une représentation fidèle de G (i.e. pv(g) ^ 1 si g ^ 1).
(i) Montrer que Xv(</) ¥" dim V, si g ^ 1.
(ii) Soit W une représentation irréductible de G. Montrer que J2n™o(Xw> Xv) Tn est une fraction
rationnelle que l'on explicitera, mais n'est pas un polynôme.
(iii) En déduire que W apparaît dans la décomposition en représentations irréductibles d'une infinité
de <g>nV.
Exercice 1.3.35. Soit H^Gun sous-groupe de G, et soit V la représentation de permutation associée
à l'action de G sur G/H.
(i) Montrer que V = Ind^l. En déduire que J2geG Xv(g) = |G|.
(ii) Montrer que V n'est pas irréductible; en déduire que t^t J2geG Xv(g)2 ^ 2. (On remarquera que
Xv est à valeurs réelles.)
(iii) Soit Y l'ensemble des g G G vérifiant xv(</) = 0. Montrer que
£(xvfo) - l)(xv(9) - |G/H|) < |G/H| • |Y|.
gtG
(iv) En déduire que |Y| ^ |H|.
(v) Soit X, avec |X| ^ 2, un ensemble sur lequel G agit transitivement (i.e., quels que soient x,t/6X,
il existe g G G, tel que y = g -x). Montrer que la proportion des g G G agissant sans point fixe sur X est
supérieure*10) ou égale à 1/|X|.
Exercice 1.3.36. Soient Gi, G2 deux groupes finis, et soit G = Gi x G2.
(i) Montrer que, si Vi et V2 sont des représentations irréductibles de Gi et G2, alors Vi S V2
(cf. rem. 1.3.6) est une représentation irréductible de G.
(ii) Montrer que toute représentation irréductible de G est obtenue de cette manière.
Exercice 1.3.37. (i) Si a G Sn, soit Ma la matrice de l'isomorphisme ua de Cn, envoyant l'élément e*
de la base canonique sur ea^y Quelles sont, en fonction de la décomposition de a en cycles, les valeurs
propres de Ma (avec multiplicité). En déduire que, si Ma et Mr sont semblables, alors a et r ont le même
nombre de points fixes.
(ii) Montrer que la matrice Tg, définie par la table des caractères de G, est inversible.
(iii) Montrer que, si C G Conj(G), alors C"1 = {g~l, g e C} appartient à Conj(G), et que, si
XGlrr(G),alorsx(C-1)=3SC).
(iv) Montrer que le nombre de classes de conjugaison symétriques de G (i.e. vérifiant C = C"1) est
égal au nombre de caractères irréductibles réels de G (i.e x(C) G R, pour tout C G Conj(G)).
(10>En théorie algébrique des nombres, ce résultat de Jordan permet de montrer que si P G Z[T], de
degré ^ 2, est irréductible dans Q[T], alors il existe une infinité de nombres premiers p tels que P n'ait
aucune solution dans Fp.
CHAPITRE II
ESPACES DE BANACH
La théorie des espaces vectoriels normes complets (appelés « espaces de Banach » en
raison du rôle joué par ce dernier dans sa mise en forme) est issue des travaux du 19-ième
siècle sur les équations différentielles, les équations aux dérivées partielles ou les équations
intégrales du type u(x) + / K(:c, y)u{y) dy = f{x), où u est une fonction inconnue. Il s'est
écoulé une vingtaine d'années entre l'introduction par D. Hilbert (1906) de l'espace qui
porte son nom (l'espace i2 des suites de carré sommable), la réalisation l'année suivante,
par E. Fischer et F. Riesz, de ce que l'espace des fonctions de carré sommable lui était
isomorphe, et la forme définitive de la théorie par l'école polonaise (S. Banach, H. Hahn,
H. Steinhaus). En retour, cette théorie a permis de nombreuses avancées sur les problèmes
qui l'ont motivée. Le problème de la classification des espaces de Banach est toujours
d'actualité^.
II. 1. Espaces de Banach
Dans tout ce qui suit, K désigne soit le corps R des nombres réels*2*, soit le corps C
des nombres complexes, et « espace vectoriel » est une abréviation pour « espace vectoriel
sur K ». Le lecteur est renvoyé au § 17 du Vocabulaire pour le vocabulaire et les propriétés
élémentaires des espaces vectoriels normes.
1. Convergence normale, séries sommables
Soit (E, || ||) un espace vectoriel norme. On rappelle que, si £ € E et si r € R+, on
(^Un problème qui est resté ouvert pendant longtemps était de savoir si un endomorphisme continu d'un
C-espace de Banach possède toujours un sous-espace fermé invariant (c'est le cas en dimension finies 2).
Un contrexemple a été construit par P. Enfio vers 1981, et C. Read (1984) en a construit un dans l'espace
£l des suites sommables, mais on ne sait pas s'il existe des contrexemples dans C2 ou, plus généralement,
dans des espaces réfiexifs (isomorphes au dual de leur dual), ce que^1 n'est pas.
(2)()u, plus généralement, un corps K, complet pour une norme (cf. n° 17.1 du Vocabulaire). Le seul
énoncé qui ne s'étend pas toujours est le th. de Hahn-Banach (th. II.1.29), que nous ne démontrerons
pas.
270
CHAPITRE II. ESPACES DE BANACH
note B(x,r) ou BE{x,r) (resp. B(rc,r~) ou BE(x,r~)) la boule fermée (resp. ouverte) de
centre x et de rayon r.
Une série Y^n&iUn d'éléments de E est normalement convergente, si ^n€N ||wn|| < +00.
Un espace vectoriel norme (E, || ||), qui est complet (pour la distance associée à la
norme), est appelé un espace de Banach. D'après le n° 14.1 du Vocabulaire, (E, || ||) est un
espace de Banach si et seulement si toute série normalement convergente converge dans E.
Comme un sous-espace fermé d'un espace complet est complet, un sous-espace vectoriel
fermé d'un espace de Banach est un espace de Banach.
Les exemples les plus simples d'espaces de Banach sont les espaces de dimension finie,
mais ceux-ci ont des propriétés très spéciales. On a en particulier les résultats classiques
suivants (cf. n08 17A et 17.6 du Vocabulaire).
Proposition II. 1.1. (i) Si V est un espace vectoriel de dimension finie, alors toutes
les normes sur V sont équivalentes et V est complet pour n'importe laquelle d'entre elles.
(ii) Soit E un espace de Banach. La boule unité fermée B(0,1) est compacte si et
seulement si E est de dimension finie.
Remarque II.1.2. Insistons sur le fait que le (i) de la prop. II.1.1 devient totalement
faux en dimension infinie : les normes sur un espace E de dimension infinie ne sont pas
toutes équivalentes, et E peut être complet pour certaines d'entre elles, mais il y en a
"beaucoup plus" pour lesquelles ce n'est pas le cas.
Un espace est dit séparable s'il contient un sous-ensemble dénombrable dense ^ (i.e. s'il
est « pas trop gros »).
Exercice IL 1.3. (i) Montrer qu'un espace vectoriel de dimension finie est séparable.
(ii) Montrer qu'un sous-espace d'un espace séparable est un espace séparable.
Soit E un espace de Banach. Une série ^2i€î £<, avec I dénombrable, est dite sommable
si elle vérifie le critère de Cauchy non ordonné suivant : pour tout e > 0, il existe I(e) C I
fini, tel que pour tout J C I fini avec J n l(e) = 0, on ait || ^2i€J Xi\\ ^ e.
• Si I est fini, toute série ^i€l x^ est sommable.
• Si I est infini, si ^2i€îXi est sommable, alors pour toute bijection n i-> i(n) de N
sur I, les sommes partielles de la série Y2n™oxHn) vérifient le critère de Cauchy usuel, et
comme E est complet, la série converge et la limite ne dépend pas du choix de la bijection
n i-> i(n) ; c'est la somme de la série £V€I 2^.
La sommabilité et la convergence normale sont des notions assez proches. L'exercice
ci-dessous (dans lequel on s'intéresse aux séries Yli& xù où I est un ensemble dénombrable
infini) explore leurs liens.
(3>La plupart des espaces de Banach de l'analyse fonctionnelle sont séparables; une exception notable
étant l'espace ^(R) des fonctions continues bornées sur R (cf. Ex. IL 1.7) ou l'espace £°° des suites
bornées.
II.l. ESPACES DE BANACH
271
Exercice IL 1.4. (i) Montrer qu'une série normalement convergente est sommable.
(ii) Montrer que dans R une série est sommable si et seulement si elle est absolument convergente.
(iii) En déduire que dans un espace vectoriel norme, de dimension finie sur R ou C, une série est
sommable si et seulement si elle est normalement convergente.
(iv) Soit I dénombrable (les espaces ^2(I) et £°°(l) sont définis ci-dessous) et, si i € I, soit e* la suite
(et,j)jGi d'éléments de C, définie par e*,* = 1 et e^- = 0, si i ^ j.
(a) Montrer que ^ZieI a^ei est sommable dans ^°°(I) si et seulement si la suite (aj)i6i tend vers 0 à
l'infini (pour tout e > 0, il existe I(e) C I fini tel que \ai\ <. e, si i £ I(e)).
(b) Montrer que £]ieI a^ei est sommable dans £2(I) si et seulement si X)ieI \a,i\2 < +00.
(c) Quelle est la somme dans ces deux cas ?
2. Espaces de suites
Exemple IL 1.5. (i) On note C°° l'ensemble des suites bornées (zn)n€N. Muni de la
norme || ||oo définie par ||(a;n)n€N||oo = supn€N \xn\, l'espace ê°° est un espace de Banach.
L'espace ^jf, sous-espace de ê°° des suites tendant vers 0 quand n tend vers +00 est un
sous-espace fermé de C°°, et donc aussi un Banach.
(ii) On note i1 l'ensemble des suites (£n)n€N, telles que £n€N \xn\ < +°°- Muni de la
norme || ||i définie par ||(rcn)n€N||i = £n€N W> l'espace tl est un espace de Banach.
(iii) On note C2 l'ensemble des suites (xn)n€N, telles que £n€N \xn\2 < +00. Muni de
la norme || H2 définie par ||(£n)n€N||2 = (Z)„€n \xn\2) > l'espace i2 est un espace de
Banach^.
(iv) Si I est un ensemble dénombrable infini, on définit de même les espaces £°°(I),
^o°(I), ^(1) et i2(l) ; ce sont aussi des espaces de Banach.
Démonstration. Le cas I dénombrable se déduit du cas de N en choisissant une bijection
entre I et N; il suffit donc de démontrer les (i), (ii) et (iii). Soit E un des espaces £°°, i1
ou C2, et soit II II la norme correspondante. Pour prouver que E est un espace de Banach,
il s'agit de vérifier que toute série normalement convergente d'éléments de E admet une
limite dans E. Soit donc (x^)^^ une suite d'éléments de E vérifiant £fe€N \\x^\\ < +°°-
Chaque x^ est une suite (xi, )n€N d'éléments de K, et dans les trois cas, \xn\ ^ ||a;(fe)||
pour tout n € N, ce qui fait que, quel que soit n € N, la série X^eN Xn est normalement
convergente dans K, et donc converge dans K (puisque K est complet) ; nous noterons
yn la somme de cette série et y la suite (2/n)n€N- Pour conclure, il suffit de vérifier que
II2/II < Efc€N \\x{k)\\ ' en effet> ceci Prouve que y € E, que \\y - Ei^^ll < £i^+i H^H
tend vers 0 quand k —* +00, puisque majoré par le reste d'une série convergente, et donc
que y est somme de la série ^2k€N x^ dans E.
• Si E = r°, on a \yn\ ^ £fe€N \Àk)\ ^ £fc€N ||z(fc)||oo, et donc ||y||oo ^ £fc6N H^lloo-
Pour la fermeture de ^ dans ê°°} cf. Vocabulaire, ex. 16.2.
<4>Comme la norme || H2 est définie par un produit scalaire, c'est même un espace de Hilbert.
272
CHAPITRE IL ESPACES DE BANACH
• Si E = i1, on a \yn\ ^ Z)fc€N \x(n'l et donc
iviii = E w < E E i^'i = E E i^'i - E i^'i-
n€N n€NfceN fe€Nn€N fc€N
• Si E = e2, on a
Ew2<E(Ei^D2 = E E i^ii^i
neN neN fceN n€N/bi,Jba€N
= E Ei4*,)n«îf,i= E (i^'i.i^'i)
< E i*(k>iM*(l',b = (Eii*wfe)î
fci,fc2€N ifeGN
où l'on a utilisé le fait que l'on pouvait réordonner les termes comme on le voulait dans
une série à termes positifs, la notation \x^\ pour désigner la suite (\xh, |)neN> et l'inégalité
de Cauchy-Schwarz (cf. n° 18 du Vocabulaire). On en déduit que \\y\\2 < Z)ib€N Ik^lb*
Ceci permet de conclure.
3. Espaces de fonctions continues
Si X est un espace topologique, on note ^(X) l'espace des fonctions continues de X
dans C.
Exemple IL 1.6. (i) Si X est un espace métrique (ou plus généralement un espace
topologique), on peut munir l'espace ^(X) des fonctions continues bornées de X dans C
de la norme || ||oo de la convergence uniforme définie par ||0||oo = suPx€X 100e)I- Alors
(féj,(X), || Hoo) est un espace de Banach. En effet, la complétude de %(X) est une
traduction de ce qu'une limite uniforme de fonctions continues est continue (cf. n° 16.2 du
Vocabulaire).
(ii) On note ^(X) l'espace des fonctions continues sur X, nulles en dehors d'un compact
(le « c » en indice signifie « à support compact »). Comme une fonction continue sur un
compact a une image compacte et donc bornée, on a %(X) C %{X), et cette inclusion
est stricte sauf si X est compact auquel cas ^(X) = %(X) = tf(X). On note ^o(X)
l'adhérence de %(X) dans ^(X) ; c'est l'espace des fonctions continues sur X tendant
vers 0 o l'infini.
(iii) Plus généralement, si W est un K-espace vectoriel de dimension finie muni d'une
norme || ||, l'espace fé&(X,W) des fonctions continues bornées de X dans W, muni de
la norme || ||oo définie par \\<f>\\oo — supx€X ||(/>(a:)||, est un espace de Banach. En effet,
changer la norme sur W revient à changer la norme || ||oo sur ^(X,W) en une norme
équivalente puisque toutes les normes sont équivalentes sur W ; on peut donc choisir une
base ei,..., en de W, et supposer que || || est donnée par ||rcieiH h£nen|| = sup^^ \xi\.
Alors tout 0 G %(X} W) peut s'écrire, de manière unique, sous la forme 0 = Y%=i $&
II. 1. ESPACES DE BANACH
273
avec </>i G ^,(X,K), et <f> i-> (</>i,... ,0n) est une isométrie de %{X,W) sur (^6(X,K))n,
qui est complet puisqu'un produit d'espaces complets est complet.
Exercice IL 1.7. Si A € R, on note e\ la fonction t ■-» e2i,rAt.
(i) Montrer que e\ € ^(R-)» et que \\e\ - e^Hœ = 2 si À ^ /t.
(ii) En déduire que %(K) n'est pas séparable.
Théorème II.1.8. (de Stone-Weierstrass, Stone (1948)) Si X es£ «n espace compact,
et si srf est une sous-algèbre de ^(X) qui contient les fonctions constantes, sépare les
points, et est stable par /•->/, alors srf est dense dans ^(X).
Démonstration. Avant de faire la démonstration de cet important théorème, explicitons
la condition « srf sépare les points » : elle signifie que, si x ^ y, on peut trouver / G «2^,
avec f(x) ^ f(y).
Maintenant, quitte à remplacer srf par son adhérence dans ^(X), qui est encore une
algèbre vérifiant les conditions du théorème, on peut supposer que srf est complète et on
doit démontrer qu'alors srf — tf(X).
Soit £?r = «^n^(X, R). C'est une sous-algèbre fermée (et donc complète) de *^(X, R),
ensemble des fonctions continues sur X, à valeurs dans R, et la condition « srf est stable
par / i-> / » entraîne que «*#r sépare les points puisque «*#r contient Re(/) = §(/ + /) et
Im(/) = ±(f - /), si / G st. Comme if (X) = <*f(X,R) + tff (X,R), il suffit de prouver
que s^yl = ^(X,R). Nous aurons besoin du lemme suivant.
Lemme II. 1.9. Il existe une suite (Pn(0)n€N de polynômes à coefficients réels tendant
vers \t\ uniformément sur [—1,1].
Démonstration. La formule de Taylor avec reste intégral
f(x) = /(0) + xf(0) + ... + ^r/(n)(0) + V / t1 " t)nf{n+1)(t*) dt
n! n! J0
permet de montrer que, si a > 0, la série J2t=o a{a-1)-^x-n+1)xn tend vers (1 + x)a
uniformément sur x G [—1,1]. En particulier, pour a = \ et x = t2 — 1, les sommes
partielles de cette série fournissent une suite de polynômes tendant, uniformément sur
[-1,1], vers (l + t2-l)1/2 = |«|.
Revenons à la démonstration du théorème.
• Si / G Mi, il existe a G R* tel que / prenne ses valeurs dans [—a, a]. Mais alors
aPn(a-1/) est une suite d'éléments de «*#r tendant uniformément vers |/|, et comme «gtfp,
est complète, on en déduit que, si / G «gér, alors |/| G £*r.
• Maintenant, si /, g G «gér, on déduit de ce qui précède, que sup(/, g) = ^ + ^^ et
inf (/, g) = te* — 1£=^ appartiennent toutes les deux à «*#r.
• Soit alors h G ^(X,R). Fixons x G X et e > 0. Comme j#r sépare les points et
contient les constantes, on peut trouver, quel que soit y G X, une fonction fy G «*#r
vérifiant fy{x) = /i(a;) et fy(y) = h(y). Comme h — fy est continue, il existe un ouvert Uy
274
CHAPITRE II. ESPACES DE BANACH
contenant y tel que \h(z) — fy(z)\ < e, si z G Uy. Comme X est compact, et comme les Uy
recouvrent X, on peut trouver un sous-ensemble fini Y de X tel que X = Uy€YUy. Alors
gx = in(y€Y fy est un élément de «*#r, d'après le point précédent, et gx vérifie gx(x) = h(x)
et gx(z) ^ h(z) + e, quel que soit z G X, puisque z appartient à au moins l'un des Uy,
avec y e Y.
• Comme gx(x) = h(x) et comme gx est continu, il existe un ouvert Vx contenant x tel
que \gx(z) — h(z)\ ^ e, si z € Vx. Comme ci-dessus, on peut extraire du recouvrement
de X par les Vx un sous-recouvrement (Vx)xçx', avec X' fini. Comme ci-dessus, la fonction
g = supa-gx/ gx appartient à «*#r et vérifie g(z) ^ h(z) + e, pour tout z, puisque cette
inégalité est vérifiée par tous les gx, et g(z) ^ h(z) — e puisque z appartient à au moins
l'un des Ux, avec x e X'.
On a donc construit, quel que soit e > 0, un élément g de j#r vérifiant \\g — /i||oo ^ e, ce
qui prouve que h est dans l'adhérence de «e^,, et donc dans «gér. Ceci permet de conclure.
Exemple IL 1.10. (i) Si I est un intervalle compact de R, alors les polynômes sont
denses dans fé'(I) (Weierstrass 1885).
(ii) Plus généralement, si K est un compact de Rm, les polynômes (enii,...xm)^ sont
denses dans fé'(K).
(iii) Les polynômes trigonométriques (i.e. les fonctions de la forme X)jk€iafce2i7r&*' ou
I décrit les sous-ensembles finis de Z) sont denses dans l'espace ^(R/Z) des fonctions
continues, périodiques de période 1 (Weierstrass). Ils ne sont pas denses dans ^([0,1]) car
un élément de l'adhérence doit vérifier /(0) = /(l), les point 0 et 1 n'étant pas séparés
par les polynômes trigonométriques.
Exercice II. 1.11. Soit h : R —» R la fonction indicatrice de Q.
(i) Construire une suite double /n>jfc de fonctions continues de R dans R telle que, si n est fixé, alors la
suite fn>k tend simplement (i.e. fn,k(x) —» 0n(£)> quel que soit a; € R) vers une fonction gn quand k tend
vers +oo, et la suite gn tend simplement vers h quand n tend vers +oo. (En bref, h est limite simple de
limites simples de fonctions continues).
(ii) Montrer que h n'est pas une limite simple de fonctions continues. (Si hn est une suite de fonctions
continues tendant simplement vers h> construire une suite extraite h^n) et une suite de segments emboités
[on,6n] tels que l'image de [an,6n] par hV(n) soit incluse dans [|, |] et en tirer une contradiction.)
4. Équations différentielles linéaires
4-1. Le théorème de Cauchy-Lipshitz
Soit V un K-espace vectoriel de dimension finie. On munit V d'une norme || || et
End(V) de la norme d'opérateur associée (cf. n° 17.3 du Vocabulaire; c'est en particulier
une norme de K-espace vectoriel, et \\u(v)\\ ^ ||w|| ||v||, si u € End(V) et v e V).
<5) Attention au fait que, si D est le disque unité de C, les polynômes en z ne sont pas denses dans ^(D) ;
en effet, un élément de l'adhérence est une fonction holomorphe, comme nous le verrons. Le problème
vient de ce que les polynômes en z ne sont pas stables par /•-»/.
II. 1. ESPACES DE BANACH
275
Soient I un intervalle de R et u : I —► End(V) une fonction continue. On cherche
à résoudre le système différentiel </>' = u • 0, i.e. décrire l'ensemble des 0 : I —» V, de
classe tf1, telles que <f/(t) = u(t) • <f>(t), pour tout tel.
Théorème II. 1.12. (Cauchy-Lipschitz) L'ensemble Sf des solutions du système
différentiel <j)' = u • 0 est un espace vectoriel de dimension dimV et l'application cf> •—> <j){t)
induit un isomorphisme de Sa sur V pour tout tel. Autrement dit,
• si t0 e I, alors pour tout z € V il existe, sur I tout entier, une unique solution <f>z du
système différentiel </>' = u • 0, prenant la valeur z en to ;
• sit el, il existe a(t) e GL(V) tel que <f>z(t) = a(t) • z, pour tout z e V {a(t0) = id).
Démonstration. La linéarité de la dérivation et de u(t) : V —» V implique que toute
combinaison linéaire de solutions est encore une solution, et donc Sa est un espace
vectoriel. Comme 0 i-* <f>(t) est linéaire de manière évidente, il suffit de prouver le second
énoncé (existence et unicité d'une solution prenant la valeur z en to) '■> le reste s'en déduit.
Les conditions « 0 de classe if1 », « 0' = u • 0 » et « <f>(to) = z » sont équivalentes à
« 0 continue » et « <f>(t) = z + fto u(x) • <f>(x) dx ». En effet, la continuité de 0 entraîne la
dérivabilité de 11-> ftQ u(x)<f>(x) dx et la relation <f>'(t) = u(t) • <f>(t). En d'autres termes, 0
vérifie les trois premières conditions si et seulement si elle est continue et est un point fixe
de 0 ^ F(0), où F : if(I,V) -> if(I, V) est définie par (F(0))(£) = z + j£ u{x)<f>(x) dx.
Il suffit donc de prouver que F a un unique point fixe dans ^(I,V), et pour ce faire, il
suffit de démontrer le même énoncé en remplaçant I par un intervalle compact arbitraire
J C I (on peut écrire I comme une réunion croissante d'intervalles compacts Jn, et l'unicité
d'une solution <f>z%n sur Jn montre que la restriction à Jn de la solution 0Z)n+i sur Jn+i est
égale à 0z>n, et donc que les 0Z)n se recollent pour donner une solution 0Z de l'équation
0' = u(t)(f> sur I tout entier; cette solution vérifie (f>z(to) = z et c'est la seule car c'est le
cas sur chacun des Jn). On note Fn la composée F o • • • o F de n copies de F.
Soit donc J un intervalle compact de I contenant to, et soit Aj = supt€J ||t*(t)||. Si
0 : J —* V est une fonction continue, on pose ||0||j = supt€J ||0(OII> ce Qui fart de ^(J,V)
un espace de Banach (cf. ex. II. 1.6). On a
||(F(*i))(*)-(F(*,))(0| =S I A«(*)||||fc(*)-é,(*)|<fe| <Aj| fwM^-foWWd*
1 Jto ' ' Jto
En majorant ||0i(#) — 02(#)|| par ||0i — 02||j, pour tout x e J, cela nous fournit la
majoration ||(F(0i))(*) - (F(02))(O|| < Aj||0i - 02||j|* - *o|, pour tout t e J. On peut
alors réinjecter cette majoration dans l'inégalité ci-dessus et une petite récurrence nous
permet de montrer que ||(Fn(0i))(£) - (Fn(02))MII ^ aj 1101 -fah^f-y Pour tout t e J.
Si Mj = supt€J \t-tol on en déduit que ||F»(fc) -F"(02)||j < ^r^Wfa ~<hh- Comme
^Aj^J^" —♦ 0, cela prouve que F a au plus un point fixe (appliquer la majoration précédente
à deux points fixes de F). On peut aussi appliquer la majoration précédente à 0i = F(0)
et 02 = 0, et comme EneN
(Aj^j) < +oo, cela prouve que £n€N(Fn+1(0) ~ pnM) est
276
CHAPITRE IL ESPACES DE BANACH
normalement convergente, et donc convergente puisque ^(J, V) est complet. La suite des
sommes partielles a donc une limite, et Fn(<f>) a une limite pour tout <$> e ^(J, V). Comme
cette limite est un point fixe de F, cela permet de conclure.
Remarque II 1.13. (i) Si Y est un sous-intervalle ouvert de I, il résulte du théorème
que la restriction à I7 induit un isomorphisme de l'espace des solutions sur I sur celui des
solutions sur I' ; autrement dit toute solution sur Y se prolonge de manière unique en une
solution sur I.
(ii) On a démontré en passant que l'on obtient la solution <f>z en itérant l'application
<f> i-> F(0), en partant de n'importe quelle <f>. Par exemple, l'équation différentielle $ = <f>
a une unique solution sur R prenant la valeur 1 en 0, et on obtient cette solution en
itérant la fonctionnelle <f> i-> 1 + /0 <f>(x) dx à partir de n'importe quelle fonction <f> ; si on
part de <j> = 0, les fonctions que l'on obtient sont 1, 1 + t, ..., l + t + ^ -\ h £7, et la
solution est donc t ■-> J2n=o S = e<-
(iii) Plus généralement, si I = R et t1-* u(t) est constante, la solution (f>z obtenue par
ce procédé de point fixe est ]Cn5) ^ïï~ ' 2> ou on a note exponentiellement la composée
de n fois le même endomorphisme. Si on définit Vexponentielle e* d'un endomorphisme (p
par e^ = J^nS ^ 0a convergence normale de la série résulte de ce que || || est une norme
d'algèbre sur End(V), et donc ||wn|| ^ ||w||n) , la formule précédente s'écrit sous la forme
<f>z = etu • z.
Le calcul de etu se fait en utilisant la décomposition de Dunford u = D + N de u ou
bien la mise sous forme de Jordan de la matrice de u dans une base bien choisie : si
ei,..., em est une base de V dans laquelle la matrice A de « est sous forme de Jordan, on
aA = D + NoùD = Diag(Ài,..., Àm) est diagonale, et N est triangulaire supérieure avec
des 0 sur la diagonale et commute à D ; comme D et N commutent, on a etu = e*De'N, et
etD = Diag(eAlt,..., eXmt) et em = En=o T car Nm = °-
(iv) Soient I un intervalle deRet/:VxI—»V lipschitzienne par rapport à u (i.e. si
J C I est un intervalle compact, il existe C(J) tel que ||/(wi, t) — /(W2,011 ^ 0(J)||iti — U2W,
pour tous Ui,v,2 € V et t e J). La même démonstration prouve que l'équation
différentielle u' = f{u,t) admet une unique solution, sur I tout entier, vérifiant la condition
initiale u(to) = u0 quel que soit u0 e V. Le résultat est faux si on supprime la condition
« / : V x I -* V lipschitzienne par rapport à u » : la solution de n' = u2 valant 1 en 0 est
11-> yèï qui explose en t = 1 et donc ne s'étend pas en une solution sur R tout entier.
4.2. Wronskien et variation des constantes
Le th. II.1.12 nous a fourni une fonction a : I —» GL(V), telle que la solution (f>z du
système différentiel $ = u- <f> prenant la valeur z en £0 soit a • z.
Proposition 11,1,14. (i) o : I —♦ GL(V) satisfait le système différentiel a' = ua.
(ii) Le déterminant W de a (c'est le wronskien du système différentiel) satisfait l'équa-
II.l. ESPACES DE BANACH
277
tion différentielle W7 = (Tr(u))W, et on a W(t) = exp ( fiQTr(u{t))dt), pour tout t e I
(formule de Liouville).
Démonstration. Si z e V, alors cf>z = a • z, et donc (\>'z — o! - z. Comme par ailleurs
<j)'z = u- <f>z, on obtient o! - z — ua - z, pour tout z e V, et donc a' = ua, ce qui prouve
le (i).
Pour prouver le (ii), choisissons une base e\,... ,en de V. Comme le déterminant est
n-linéaire, on a
n
W'(*) = ( det (0eiW,--.,0enW)' = £ det (^1W,...,0éiW,---^e„W)
ei,...,en ^—'ei,...,en
Par ailleurs, (f>'e.{t) = u(t) • <f>ei(t), et comme
n
(II.l.l) Y" det (vi,...,t4-t;<,...,vn)=flY(t4) det (vi,...,vn),
r~i ei,...,en ei,...,e„
i=l
on obtient l'équation différentielle annoncée W7 = (Tr(w))W, dont l'unique solution
valant 1 en £o est t i-> exp ( ftQ'Fr(u(t)) dt). Ceci permet de conclure. (Pour vérifier la
formule (II.l.l), on constate que les deux membres sont n-linéaires alternés en (v\,..., vn), et
donc il suffit de vérifier qu'ils coïncident sur une base bien choisie de V ; la base e\,..., en
ne demande qu'à être utilisée, et comme detei>...>en(ei,... ,u • ei}... ,en) = u^ si (uij) est
la matrice de u dans cette base, on en déduit le résultat.)
Exercice II.l. 15. Montrer que det(exp A) = eTrA si A € Mn(C). (Commencer par A triangulaire.)
On s'intéresse maintenant à un système différentiel avec second membre, c'est-à-dire de
la forme fi—u-cf) = v où v : I —► V est continue. Si on dispose d'une solution particulière fo
de ce système, alors <j> i-» <j>—(f>o induit une bijection de l'ensemble des solutions du système
avec second membre <f>' — u • <f> = v sur celui sans second membre <f>' — u • <f> = 0. Résoudre
un système avec second membre est donc équivalent à trouver une solution particulière et
résoudre le système sans second membre.
Par ailleurs, si on sait résoudre le système sans second membre, on peut trouver une
solution particulière du système avec second membre en utilisant la méthode de variation
des constantes. La résolution du système sans second membre nous fournit une solution
a : I —► GL(V) du système différentiel a' = ua, et les solutions du système </>' = u • (f>
sont les t i-> a(t) • z, pour z € V. La méthode de variation des constantes consiste à
chercher une solution de <f>' — u • <f> = v sous la forme (f>(t) = a(t) • z(t). On a alors
<t>'(t) = a'(t) • z(t) + a(t) • z'{t), et donc a'{t) • z(t) + a(t) • z'(t) - u(t)a(t) • z(t) = v(t),
et comme o7 = ua, cette équation se simplifie en z' = a~l • v, qui se résoud par simple
intégration.
278
CHAPITRE II. ESPACES DE BANACH
4.S. Équations différentielles d'ordre supérieur
Corollaire II. 1.16. Soit IcRun intervalle ouvert. Si ao,... ,an_i sont des
fonctions continues de I dans K, l'ensemble Jêf des solutions sur I de l'équation différentielle
<£(") = an_i0(n-1) H 1- Oq4> est un espace vectoriel de dimension n et, pour tout t e I,
l'application <f> h-> (<f>(t),..., ^n~^(t)) est un isomorphisme de ££ sur K. Autrement dit,
• si to e I, et si z = (zq, ... ,zn-\) G Kn, il existe, sur I tout entier, une unique
solution 4>z de l'équation différentielle <fin) = an_i0(n-1) H \-a0</), telle que </>z (to) = zi}
si 0 < i < n - 1 ;
• si tel, il existe A(t) e GLn(K) tel que \(t>z{t), <j>'z{t),..., 4>zn~l\t)) = k(tfz.
Démonstration. Soit
U =
/0 1
0 ...
\a0 •••
... 0 \
0 1
Ûn-2 Ûn-l/
Si $ = '(</>(), ••• ,0n-i) est une solution, sur I, du système différentiel <£' = U$, alors
0o,..., 0n-i sont de classe if1 et 0O = <f>i,..., ^n_2 = 0n_i et ^ = a0</>0+- • •+an_i0n_1.
Il s'ensuit que </> = <f>o est de classe ^n, que <& = <f>® siO < ê < n — 1, et que (f>
vérifie l'équation différentielle (f>^ = an_i</>(n_1) + • • • + a0<f>. Réciproquement, si 0 est
une solution de cette équation, alors $ = *(0,... ,^n_1^) est une solution du système
différentiel $' = U$. Autrement dit $ i-> 0o est un isomorphisme de l'espace des solutions
de $' = U$ sur celui de <f>^ = an-\<f^n~^ + • • • + ao<f>. L'énoncé est alors une simple
traduction du th. II.1.12.
Remarque II. 1.17. (i) Une équation 0<n> - an-i(t)(f)^n-l) + a0(t)(f> = b(t), avec
second membre, se résoud par la méthode de variation des constantes en revenant au
système différentiel associé comme dans la démonstration du cor. IL 1.16.
(ii) Si l'équation différentielle est à coefficients constants, les solutions sont les
coefficients de la matrice e*u, où U est la matrice ci-dessus (et ne dépend pas de t puisqu'on
a supposé les ai constantes). Si Ai,... ,Àr sont les valeurs propres de U et si A* est de
multiplicité a\, il n'y a qu'un bloc de Jordan Ji (d'ordre a\) pour chaque Ai (cela résulte
de l'ex. 10.4, et de ce qu'une matrice et sa transposée ont même polynôme minimal car
P(4A) = *(P(A)) si P e K[X] et A e Mn(K)). Or les coefficients de exp(*J<) sont de la
forme eXitPi(t), où Pi e C[X] est de degré ^ a\ - 1. On en déduit que les t h-> eXittj, pour
l<i<ret0<,7<di — 1, forment une base de l'espace des solutions de l'équation
différentielle. Par exemple, si tous les a* sont nuls, on retrouve le résultat selon lequel
l'ensemble des <f> dont la dérivée n-ième est identiquement nulle est l'espace des polynôme
de degré ^ n — 1.
II.l. ESPACES DE BANACH
279
5. Complétion d'espaces vectoriels normes
La manière la plus standard pour construire des espaces de Banach est de partir
d'espaces vectoriels normes et de les compléter *6\ On renvoie au n° 14.3 du Vocabulaire pour
tout ce qui a trait à la complétion d'un espace métrique. De manière générale, on a le
résultat suivant.
proposition IL 1.18. (i) Si (E, || ||) est un espace vectoriel norme, alors le complété
ErfeE (pour la distance associée à || ||) est un espace vectoriel. De plus, \\ \\ s'étend par
continuité en une norme sur E, et (E, || ||) est un espace de Banach.
(ii) Si F est un espace de Banach, et si u:E —» F est linéaire continue, alors u admet
un unique prolongement continu à E, et ce prolongement est linéaire.
Démonstration. Le (i) est un petit exercice utilisant de manière répétée les résultats
du n° 14.3 du Vocabulaire. Par exemple, pour montrer que l'addition s :ExE-> E
s'étend par continuité en une addition s : E x E —» E, on peut munir E x E de la norme
110e» 2/) Il = SUP(IM,|||/||). Alors s : E x E -> E C E est lipschitzienne de rapport 2, et
donc s'étend par continuité à E x E.
Pour le (ii), voir le n° 17.2 du Vocabulaire.
Exemple II. 1.19. Soit fi un ouvert de Rm.
(i) L'espace Lx(0) défini au n° 1 du § III.2 est un espace de Banach dans lequel ^c(fi)
est dense; on peut donc aussi le définir comme le complété de ^(fi) pour la norme || ||i
définie par ||</>||i = fn \<f>(x)\ dx.
(ii) De même, l'espace L2(Q) défini au n° 2 du § III.2 peut aussi être défini comme le
complété de ^(fi) pour la norme || ||2 définie par \\<j>\\2 = (Jn \<j>(x)\2 dx) ' .
(iii) Si k ^ 1, on définit V espace de Sobolev Hfc(Rm) comme le complété de l'espace
féj (Rm) des fonctions de classe *&k sur Rm, nulles en dehors d'un compact, pour la norme
|| ||H/t définie par
imi* = ( Eai^iw2)1'2 = ( E / i*«*)iï<fc)I/2.
(6>Pour beaucoup de questions c'est très utile, car on obtient un espace dans lequel l'analyse devient plus
facile ; en particulier, il est nettement plus aisé de démontrer des résultats d'existence dans un espace
complet. Évidemment, le problème est qu'il est difficile de retrouver ses petits après complétion. Par
exemple, il est impossible de montrer que deux nombres réels sont égaux (R est obtenu en complétant Q)
sauf si on sait par ailleurs que leur différence est un entier (à multiplication près par un nombre réel
explicite). De même, il est nettement plus facile de démontrer l'existence de solutions d'équations
différentielles dans un espace de Sobolev H*, mais si ce qui nous intéresse sont des solutions de classe ^f*, il
y a un travail supplémentaire pour vérifier que les solutions obtenues conviennent.
280
CHAPITRE IL ESPACES DE BANACH
où, si £ = (ii,..., im) G Nm, on a posé \£\ = Y%Li tj, et noté 0e l'opérateur différentiel
Par définition, si £ = (^i,... ,êm) e Nm vérifie \£\ ^ k, l'application linéaire
* ~ (é)£l ' ' ' (é)é": *?(Rm) "* ^~W(Rm)
est continue (et même 1-lipschitzienne) si on munit ^cfc(Rm) de la norme || ||Hjt et %,T~' '(Rm)
de la norme || ||h*-i£i- Elle s'étend donc, par continuité, en une application linéaire, encore
notée 0e, de Hfc(Rm) dans Hfc-l£l(Rm).
Proposition IL 1.20. Si k e N, si £ € Nm vén^e \£\ ^ k, si <f> e ^(R™), et si
f e Hfc(Rm), alors™
f (0V)/ = (-i)|£|/ (0e/)*.
Démonstration. Les deux membres sont bien définis car #*(/>, /, d*/ et (f> sont de carré
sommable. On en déduit que
/ ~ Lt(f) = / {#*) f - (-l)W / (0ef) 4>
JRm JRm
est une forme linéaire sur Hfc(Rm), qui est continue car
IM/)I < ll/IMI** +11^/11*1*112 < (ll«Vll« + MMI/h»-
Par ailleurs, une (suite d') intégrations par partie montre que L^(/) = 0 si / € féj (Rm),
et comme féJ(Rm) est dense dans Hfe(Rm), cela implique que L^ est identiquement nulle
sur Hfc(Rm). Ceci permet de conclure.
6. Applications linéaires continues entre espaces de Banach
Théorème IL 1.21. (Banach-Steinhaus, 1927) Soient E un espace de Banach, F un
espace vectoriel norme, et («n)n€N une suite d'applications linéaires continues de E dans F.
Alors, de deux choses l'une :
• soit la suite (||un||)n€N est bornée^, et donc un(x) est bornée pour tout a; € E,
• soit {x e E, supn€N ||wn(a;)||F = +00} est dense dans E.
Démonstration. Il s'agit de prouver que, si (||wn||)n€N n'est pas bornée, et si on définit
ip : E —► R+ U {+00} par (p(x) = supn€N ||wn(a;)||F, alors {x e E, ip(x) = +00} est
dense. Pour cela, considérons, si N e N, l'ensemble Un = {x G E, <p(x) > N}. On
a Un = Un€N{£ € E, ||wn(a;)||F > N}, et comme chaque un est continue, Un est une
W Autrement dit, d*f est la dérivée £-ième de / au sens des distributions.
(8)||«n|| est la norme d'opérateur de un. Rappelons qu'elle est définie par ||wn|| = supx?é0 ||a;||Ë1||ttn(aOllF>
cf. n° 17 du § 11.
II.l. ESPACES DE BANACH
281
réunion d'ouverts et donc est ouvert. Si Un n'est pas dense, il existe xq e E et r > 0
tel que ||«n(a; + o;o)||f < N, quel que soient ieE, avec ||rc||E < r, et n € N. Mais alors
||w„(rc)||F = \\un(x + x0) - un(x0)\\p ^ 2N, quel que soit a; € E, avec ||rc||E < r, et quel
que soit n € N. Autrement dit, on a \\un\\ < ^, quel que soit n € N, contrairement
à l'hypothèse. C'est donc que Un est un ouvert dense, quel que soit N e N, et comme
{x e E, (p(x) = +00} = HnénUn, Ie lemme de Baire (n° 14.2 du Vocabulaire) montre
qu'il est dense dans E, ce que l'on cherchait à démontrer.
Remarque II. 1.22. D'après la démonstration, {x € E, supn€N ||wn(a;)||F = +00} est
une intersection dénombrable d'ouverts denses, si ||wn|| n'est pas bornée. Une intersection
dénombrable d'ouverts est appelée un G$, et il résulte du lemme de Baire qu'un G$ dense
dans un espace de Banach E est non dénombrable (cf. ex. 14.3 du Vocabulaire).
Le théorème de Banach-Steinhaus admet comme corollaire le très utile résultat suivant,
qui est un peu surprenant quand on pense à ce qui se passe pour une limite simple de
fonctions continues ^.
Corollaire II. 1.23. Si E est un espace de Banach, et si F un espace vectoriel, alors
une limite simple d'applications linéaires continues de E dans F est une application linéaire
continue de E dans F.
Démonstration. Soit (wn)n€N une suite d'applications linéaires continues de E dans F
telle que la suite (un(x))n€w ait une limite u(x) € F, quel que soit x G E. Si a; G E et
À e K, on a u(Xx) = limn^+00 un(Xx) = limn_»+00 Xun(x) = X\imn_+00un(x) = Xu(x), et
de même, u(x+y) = u(x) +u{y), quels que soient x, y € E, ce qui prouve que u est linéaire.
Maintenant, le fait que la suite (un(x))n€tq a une limite quel que soit x e E, implique,
d'après le théorème de Banach-Steinhaus, l'existence de M € R+ tel que ||«n|| ^ M quel
que soit n € N. On a donc ||wn(a;)||F < M • ||x||e quels que soient n € N et a; € E. On en
déduit, en passant à la limite, que ||«(rc)||F < M • ||:e||e quel que soit x e E, et donc que
u est continue, ce qui permet de conclure.
Théorème II. 1.24- (de l'image ouverte, Banach (1929)) Si E et F sont deux espaces
de Banach, et si u : E —» F est une application linéaire continue surjective, alors il existe
p > 0 tel que u(Be(0, l~)) contienne Bp(0,p~).
Démonstration. Si n € N, soit An l'adhérence dans F de u(Be(0,71-)). Comme E est la
réunion des Be(0, n~), pour n e N, et comme u est supposée surjective, on a Un€NAn = F.
(9)Bien que Cauchy ait réussi à "démontrer", dans son Cours d'analyse, qu'une limite simple de fonctions
continues est continue, on sait bien, à l'heure actuelle, qu'il n'en est rien, en général. Baire (1904) a
démontré qu'wne fonction f : Rn —» R est limite simple de fonctions continues si et seulement si la
restriction de f à tout fermé non vide a au moins un point où elle est continue. C'est à cette occasion
qu'il a introduit son fameux lemme.
282
CHAPITRE II. ESPACES DE BANACH
Le lemme de Baire implique donc l'existence de n tel que An soit d'intérieur non vide.
Ceci se traduit par l'existence de x0 e Be(0,71") et de r > 0, tels que, si \\y\\F < r,
alors quel que soit e > 0, il existe x € Be(0,ti~), avec \\u(x) - {u(x0) + y)\\F < e.
Comme x - x0 e BE(0,2n~), quitte à faire une homothétie de rapport ^, on voit que
l'on a démontré le résultat suivant (avec p = ^) : il existe p > 0 tel que, quel que soit
y G BF(0,/9~) et quel que soit e > 0, il existe x e Be(0, (|)~) avec \\y - u(x)\\F < e.
Ce n'est pas tout à fait le résultat cherché, mais presque. Si y e Bf(0,/o~), on peut
construire par récurrence, en utilisant ce qui précède, une suite {xm)m€w d'éléments de
Be(0, (§)~), et une suite (ym)meN d'éléments de Bf(0,p~) vérifiant :
2/o = 2/, \\Vm ~ u(xm)\\F < |, et ym+l = 2(ym-u{xm)).
On a alors y = u(x0) + 2-1«(rci) + • • • + 2~mu(xm) + 2~m~lym+i, et comme la série
J2tSo^~mxm converge dans E vers un élément x de Be(0, l~), un passage à la limite
montre que y = u(x). Ceci démontre l'inclusion BF(0,/o~) C w(Be(0, 1")) que l'on
cherchait à obtenir.
Remarque II. 1.25. Si x G E et r > 0, alors BE(z,r~) = x + rBE(0, l~) et donc
u(BE(x,r~)) = u(x) + rw(BE(0, l~)). Le théorème ci-dessus montre donc que, si u est
surjective, alors u(Be(x,v~)) contient un voisinage ouvert de u(x). On en déduit le fait
que, si U est un ouvert de E, alors u(U) est voisinage ouvert de u(x)} quel que soit x G U ;
autrement dit u(U) est ouvert. Le théorème ci-dessus peut donc se reformuler sous la
forme « l'image d'un ouvert par une application linéaire continue surjective entre deux
espaces de Banach est un ouvert » ; c'est ce qui explique son nom.
Corollaire II. 1.26. Si E et F sont deux espaces de Banach, et si u : E —» F est une
application linéaire continue bijective, alors u~l : F —» E est aussi continue.
Démonstration. Si U est un ouvert de E, alors (w_1)-1(U) = u(U) est ouvert d'après
la remarque ci-dessus. Ceci permet de conclure.
Exercice II. 1.27. (Théorème du graphe fermé)
Soient E et F deux espaces de Banach, et u : E —» F une application linéaire. Soit G C E x F le graphe
de u (i.e. l'ensemble des couples (x,w(rc)), pour x € E).
(i) Montrer que E x F muni de la norme ||(rc,2/)|| = sup(||#||e) ||î/||f) est un espace de Banach et que
les deux projections pe:ExF—»EetpF:ExF—>F sont continues.
(ii) Montrer que G est un sous-espace vectoriel de E x F et que, si G est fermé dans E x F, alors u est
continue. (On s'intéressera aux restrictions depE et pf à G.)
(iii) Construire / : R —» R, non continue, avec un graphe fermé.
7. Le dual d'un espace de Banach
Si E est un espace vectoriel norme, on note E* le dual de E, c'est-à-dire l'ensemble des
formes linéaires continues sur E. Si A : E —» K est une forme linéaire continue, on rappelle
II.2. ESPACES DE HILBERT
283
que l'on définit sa norme ||A|| comme la borne inférieure de l'ensemble des C e R+ tels
que |A(rc)| < C||a;|| quel que soit x eE.
Théorème II. 1.28. Si E est un espace vectoriel norme, alors (E*, || ||) est un espace
de Banach.
Démonstration. Que || || soit une norme d'espace vectoriel a déjà été démontré dans
le n° 17.3 du Vocabulaire. Maintenant, soit An une suite d'éléments de E* telle que
SneN ll^nll = C < +oo. Si x e E, la série J2n€NAn(x) est alors absolument
convergente, et la somme A(x) vérifie |A(rc)| ^ X)n€N IA*»0*01 ^ C||a:||- Comme par ailleurs,
x i-> A(x) est linéaire, la majoration ci-dessus montre que x i-> A(x) est aussi continue.
On en déduit que A G E* et que ]T)n€N An = A, ce qui prouve que E est complet.
Théorème IL 1.29. (Hahn-Banach, 1927) Si E est un espace vectoriel norme, si F est un sous-espace
vectoriel de E, et si f est une forme linéaire continue sur F, alors il existe A € E* dont la restriction à F
est f et qui vérifie ||A|| = ||/||.
Le théorème de Hahn-Banach, que nous ne démontrerons pas (la démonstration utilise l'axiome du
choix), a un certain nombre de conséquences intéressantes, dont le fait que E* ^ 0. On en trouvera
d'autres dans les exercices suivants.
Exercice II.1.30. Montrer que l'adhérence F de F dans E est l'intersection des noyaux des formes
linéaires, continues sur E, nulles sur F.
Exercice II.1.31. (i) Montrer que, si x0 € E, il existe A G E*, avec ||A|| = 1 et |A(a?0)| = ||«o||-
(ii) Montrer que E* sépare les points (si x ^ y, il existe A G E* tel que A(x) ^ A(y).)
(iii) Montrer que l'application A ■-> A(x) est une forme linéaire continue sur E* et induit une isométrie
de E dans (E*)*. (On dit qu'un espace de Banach E est réflexif si cette isométrie est bijective, et donc
si E s'identifie au dual de son dual ; il peut arriver que (E*)* soit beaucoup plus gros que E, mais les
espaces de Hilbert sont réflexifs d'après le théorème de Riesz (th. II.2.12)).
II.2. Espaces de Hilbert
Les espaces de Hilbert sont des espaces de Banach aux propriétés mathématiques
particulièrement agréables : l'existence de bases hilbertiennes montre que tous ceux qu'on
rencontre en pratique sont isomorphes, et l'existence de projecteurs orthogonaux permet
très souvent de se ramener à la dimension finie. La nature étant bien faite, ce sont
précisément ces espaces qui interviennent naturellement dans beaucoup de questions physiques
(par exemple en mécanique quantique).
1. Espaces de Hilbert
Un espace de Hilbert est un espace préhilbertien (cf. § 18 du Vocabulaire) complet ; c'est
donc un cas particulier d'espace de Banach.
Exemple II.2.1. (i) Un espace de dimension finie muni d'un produit scalaire est un
284
CHAPITRE II. ESPACES DE BANACH
espace de Hilbert.
(ii) Si E est un espace préhilbertien, son complété E est un espace de Hilbert (le produit
scalaire s'étendant par continuité).
(iii) f? et, plus généralement, i2(l) si I est dénombrable, sont des espaces de Hilbert.
(iv) Si O est un ouvert non vide de Rn, alors L2(0) est un espace de Hilbert.
(v) Le complété L2(R/Z) de if (R/Z) pour la norme || ||2 définie par ||/||2 = f* \f(t)\2 dt
est un espace de Hilbert (de produit scalaire {f,g) = f0 f(t)g(t) dt).
(vi) Les espaces de Sobolev Hfc(Rm) sont des espaces de Hilbert.
1.1. Bases hilbertiennes
Soit E un espace de Hilbert séparable^ de dimension infinie. Une base hilbertienne^
de E est une famille orthonormale dénombrable (ei)i€i d'éléments de E telle que le sous-
espace vectoriel de E engendré par les e*, pour tel, soit dense dans E.
Exemple II.2.2. (i) Si I est un ensemble dénombrable, alors i2(l) possède une base
hilbertienne naturelle, à savoir celle constituée des e*, pour i G I, où e* est la suite avec
un 1 en i et des 0 partout ailleurs.
(ii) Les e2i7rnt, pour n G Z forment une base hilbertienne de L2(R/Z).
Démonstration. (i) Que les e^ forment une famille orthonormale est immédiat.
Maintenant, si x = (xi)i€i G ^2(I), et si J C I est fini, alors \\x — J2j€ixjej\\2 — Ej€i-J \xj\2-
Comme Ylj& \xj\2 < +°°> on Peut rendre \\x — Y2jçjxjej\h aussi petit que l'on veut en
augmentant J, ce qui prouve que le sous-espace engendré par les e*, pour i eh est dense
dans f(l). On en déduit le (i).
(ii) Un calcul immédiat montre que les e2innt forment une famille orthonormale ; l'espace
qu'elle engendre est l'espace des polynômes trigonométriques. Si / G L2(R/Z), et si e > 0,
il existe, par définition de L2(R/Z), une fonction continue g sur R/Z avec ||/ — g\\2 < §.
Par ailleurs, l'espace des polynômes trigonométriques est dense dans ^(R/Z) d'après
le théorème de Stone-Weierstrass (cf. (iii) de l'ex. IL 1.10) ; il existe donc P, polynôme
trigonométrique, tel que ||P — p||oo < |. Comme \\h\\2 ^ IHloo, si h € ^(R/Z), on a
||/ - P||2 < e, ce qui prouve que toute boule ouverte de L2(R/Z) contient un polynôme
trigonométrique, et donc que l'espace engendré par les e2Mrnt, pour n G Z, est dense
dans L2(R/Z). Ceci permet de conclure.
Proposition II. 2.3. Un espace de Hilbert séparable admet des bases hilbertiennes.
(10)La théorie qui suit s'étend au cas des espaces de Hilbert non séparables, mais ceux-ci ne se rencontrent
pas en pratique. La seule différence est qu'une base hilbertienne n'est plus de cardinal dénombrable, si E
n'est pas séparable.
(n*Une base hilbertienne est aussi souvent appelée une base orthonormale. On fera attention au fait
qu'une base hilbertienne n'est, en général, pas une base au sens algébrique. Plus précisément, une base
hilbertienne est une base algébrique si et seulement si on est en dimension finie, ce qui est rarement le
cas en analyse fonctionnelle.
II.2. ESPACES DE HILBERT
285
Démonstration. Soient E un espace de Hilbert séparable et A C E un sous-ensemble
dénombrable dense. Pour construire une base hilbertienne à partir de A, on numérote les
éléments de A, on élimine ceux qui se trouvent dans l'espace vectoriel engendré par les
éléments précédents, ce qui nous fournit une base (&i)i€i, avec I C N, de l'espace vectoriel
E7 engendré par A. Enfin, on utilise le procédé d'orthonormalisation de Schmidt pour
construire une famille orthonormale d'éléments de E engendrant le sous-espace E' ; cette
famille est une base hilbertienne de E puisque E7, qui contient A, est dense dans E.
1.2. Projection orthogonale sur un sous-espace fermé
Lemme II.2.4- Soit E un espace de Hilbert, et soit (ei)i€\ une famille orthonormale
dénombrable d'éléments de E.
(i) Si (xi)i€i est une famille d'éléments de C, alors la série Y^i&xiet es^ sommable si
et seulement si {xi)i€i € ^2(I).
(ii) Si (xi)i€\ € i2(l), et si x G E est la somme de la série Y^i&xieù a^ors iehx) — xi>
pour tout i G I, et \\x\\2 = ^2i€l \xi\2.
Démonstration. On a || SieJ^^II = (SejW2) » Pour tout ^ c * *""> Par or~
thonormalité de la famille (ej)j€i. La sommabilité de Y^iç.ixiei est donc équivalente à la
condition £\€l \xi\2 < +oo. On en déduit le (i).
Le (ii) est évident si I est fini. On peut donc supposer I = N. Alors x est la limite de
la suite de terme général yn = Y%=oxjeji et comme on a {ei,yn) = xi} pour tout n ^ i, et
IWI2 = Z)?=o l^il2' k (u) sen déduit par un passage à la limite, en utilisant la continuité
de la norme et du produit scalaire.
Proposition II.2.5. Soit F un sous-espace vectoriel fermé de E muni d'une base
hilbertienne (ei)i€\.
(i) SixeE, alors {(eux))i۔ e e2{l).
(ii) La série Y^iei(ei>x)ei est sommable; sa somme Pf{x) appartient à F, et on a l'iden-
m\\MxW = Y.i&\(eux)?-
(iii) pf : E —> F est un projecteur, et Pf(x) est l'unique élément de F tel que x — Pf{x)
soit orthogonal à F tout entier. De plus, pp est l-lipschitzien.
Démonstration. Si F est de dimension finie, le résultat est démontré dans le n° 18.2 du
Vocabulaire. On peut donc supposer que I = N. Notons F* le sous-espace vectoriel de E
engendré par les e,-, pour j ^ i. Alors yi = Y?j=o(eiix)ei est ^a projection orthogonale
de x sur F*. En particulier, Yl)=o\(eûx)\2 = \M\2 ^ lkll2> <ïuel <lue soit * e N. On en
déduit l'appartenance de ((ei,x))i€w à C2, ce qui démontre le (i).
Le (ii) est une conséquence directe du lemme II.2.4, dont on déduit aussi que x ~Pf{x)
est orthogonal à tous les e*, et donc à F tout entier par linéarité et densité. Le reste du (iii)
résulte de l'unicité de la projection orthogonale sur un sous-espace (pas forcément fermé,
cf. Vocabulaire, n° 18.2). Ceci permet de conclure.
286
CHAPITRE IL ESPACES DE BANACH
Théorème II.2.6. Si (e*)^ est une base hilbertienne de E, l'application x t-> ((e*, x))i€l
induit une isométrië^ de E sur i2(l). Autrement dit,
(a) si x € E, alors ((eux))i€i G t2(l) et J2iei\(ehx)\2 = IMI2 (identité de Bessel-
Parseval) ;
(b) si {xi)i€i G ^2(I), alors Y^i&xîei converge dans E et sa somme x vérifie (e^z) = xi
quel que soit % € I.
Démonstration. Commençons par justifier le « Autrement dit » : le (a) peut se
reformuler en disant que x i-* ((ei}x))i€i est une isométrie de E sur un sous-espace de ^2(I),
tandis que le (b) montre que i2(l) est dans l'image de x i-> ((ei,x))i€i. Maintenant, le (a)
résulte des (i) et (ii) de la prop. II.2.5 utilisée pour F = E, et le (b) suit du lemme II.2.4.
Si on spécialise le th. II.2.6 à la base hilbertienne de L2(R/Z) constituée des e2i7rnt, on
obtient, en particulier, le résultat suivant.
Corollaire II.2.7. Si f € L2(R/Z), soit Cn(f) son n-ième coefficient de Fourier :
CnU) = (e2inntJ) = f f(t)e-2i"ntdt = [ f(t)e-2i«ntdt.
Jr/z Jo
Alors f = E^z^f/)^*" dans^ L2(R/Z) et E„ezM/)l2 = (II/II2)2 - /„' |/M|2d*
(Bessel-Parseval).
Corollaire II.2.8. (critère de totalité). Si (ei)i€i est une famille orthonormale dé-
nombrable d'éléments de E, les conditions suivantes sont équivalentes :
(i) {ei)i€i est une base hilbertienne de E ;
(ii) l'ensemble des a; € E, orthogonaux à tous les e*, est réduit à {0}.
Démonstration. L'implication (i)=^(ii) est une conséquence directe du (a) du th. II.2.6
Pour montrer (ii)=>(i), introduisons l'espace vectoriel F, adhérence dans E de l'espace
engendré par les e*. Alors (e^i est une base hilbertienne de F, et la condition (ii) implique
que l'on a Pf(x) = x, pour tout a; € E, et donc que F = E. Ceci permet de conclure.
2. Le théorème de projection sur un convexe
Rappelons que, si E est un espace vectoriel sur K, un sous-ensemble C de E est convexe
si C contient le segment [x, y] quels que soient x, y € C. En particulier, si C est convexe,
<12)Un sous-espace fermé de dimension infinie de £2 est un espace de Hilbert séparable, et donc, d'après
le théorème, isomorphe à H2. T. Gowers a reçu la médaille Fields en 1998, en grande partie pour avoir
démontré (1996) que ceci caractérise £2 : un espace de Banach séparable, qui est isomorphe à tous ses
sous-espaces fermés de dimension infinie, est isomorphe à^2.
(13)()n prendra garde au fait que cette convergence dans L2(R/Z) (convergence en moyenne quadratique)
n'implique la convergence en aucun point ; de fait, rien n'empêche a priori que tout réarrangement de la
série diverge en tout point sauf celui où on s'est débrouillé pour le faire converger.
II.2. ESPACES DE HILBERT
287
et si x, y e C, alors le milieu ^ de x et y appartient à C. Le théorème suivant joue un
rôle fondamental en analyse fonctionnelle.
Théorème II.2.9. Soient E un espace de Hubert et C ^ 0 un convexe fermé de E.
(i) Quel que soit x e E, il existe Pc(x) € C unique (appelé la projection de x sur C) tel
que d(x,pc{x)) < d(x,y), pour tout y e C.
(ii) pc(x) est l'unique point y de C tel que, quel que soit z e C, l'angle (x — y,z — y)
soit obtus (le. Re((x -y,z-y)) ^ 0).
(iii) L'application x h-> pc{x) est 1-lipschitzienne.
Démonstration. Notons d(x}C) la borne inférieure des d(x,y), pour y e C. Si 2/1,2/2
réalisent cette borne inférieure, et si z = m^il, alors z € C, et l'identité de la médiane
nous donne
Un - 2/2II2 = 211* - *||2 + 2||tb - xf - 4\\z - xf = i(d(x, C)2 - d(x, z?) < 0.
On a donc 2/1 = 2/2» d'où l'unicité de la projection.
Passons à l'existence^14). Par définition de d(x, C), il existe une suite (yn)nçN d'éléments
de C, telle que d(x, yn) tende vers d(x, C) quand n tend vers +00. L'identité de la médiane
se traduit, en notant zn>m le milieu de yn et ym} par
||2/n - Vn+pW2 =2||2/n - x\\2 + 2\\yn+p - x\\2 - 4\\zn,n+p - x\\2
<2(\\yn - x\\2 + \\yn+p - x\\2 - 2d(x, C)2).
Comme par hypothèse, le membre de droite tend vers 0 quand n —» +00 et p G N, la
suite (2/n)n€N est de Cauchy, et comme on a supposé C fermé dans un espace complet,
elle converge vers un élément pc(x) appartenant à C. Par continuité de la norme, on a
d(x,pc(x)) = limn_>+00d(x,yn) = d(x,C), ce qui démontre le (i).
Soit z e C. Si 0 < t < 1, le point yt = (l - t)pc{x) + tz appartient à C, et donc
\\pc(x) - x\\2 ^ \\yt - x\\2 = \\pc(x) - x\\2 + t2\\z - pc(x)\\2 + 2tRe(pc(x) -x,z- pc(x)).
En faisant tendre t vers 0, on en déduit l'inégalité Re(x-pc(x),z-pc(x)) < 0.
Réciproquement, si Re(a; — y,z — y) ^ 0, alors
II* " *ll2 = \\V ~ *ll2 + II* " S/Il2 - 2Re(z -yiZ-y)z\\y- x\\2,
ce qui montre que, si Re(rc -y,z — y) < 0 quel que soit z e C, alors y vérifie la propriété
définissant pc(x). On en déduit le (ii).
Enfin, si x, y e E, on a
Re(x - pc(x),Pc{y) - Pc(x)) < 0 et Re(y - pc(v),Pc(x) ~ Pc(v)) < °-
On en déduit, en faisant la somme, l'inégalité
Re(x-y}pc(y) -pc(x)) > Re(pc(y) -Pc(x),pc{y) ~Pc(x)) = \\pc{y) - Pc{x)\\2.
(14)En dimension finie, un petit argument de compacité permettrait de la démontrer (exercice).
288
CHAPITRE II. ESPACES DE BANACH
On conclut la démonstration du (iii) en utilisant l'inégalité de Cauchy-Schwarz, selon
laquelle
Re(x - y,pc(v) ~ Pc(x)) ^ \(x - y,pc(y) - Pc(x)}\ < ||x - y|| • \\pc(y) - Pc(x)\\.
3. Le dual d'un espace de Hilbert
Dans ce n°, E est un space de Hilbert. Si x G E, on note A^ la forme linéaire définie
par Ax(y) = (x,y).
Lemme II.2.10. Si x G E, la forme linéaire Ax est continue et \\AX\\ = \\x\\.
Démonstration. L'inégalité de Cauchy-Schwarz qui devient |Aa.(?/)| < ||a;|| • \\y\\> nous
donne la continuité de Ax ainsi que l'inégalité ||AX|| ^ ||z||. L'inégalité \\AX\\ ^ ||a;||, se
déduit de ce que |Aa.(a;)| = ||z|| • ||a:||.
Proposition II. 2.11. Soit E un espace de Hilbert séparable.
(i) Si A est une partie de E, alors l'orthogonal A1 de A (i.e. l'ensemble des x eE tels
que (#, a) = 0, quel que soit a G A) est un sous-espace vectoriel fermé de E.
(ii) Si F est un sous-espace vectoriel fermé de E, et si x e E, alors x — Pf(x) G F1, et
on a<15> E = F 0 F1 et (F-L)± = F.
Démonstration. (i) On a (x,a) = 0 si et seulement si Aa(x) = 0, et comme A0 est
continue, son noyau H0 est un hyperplan fermé de E, ce qui démontre le (i) puisque
A1 = nû€AHa.
(ii) Onai- Pf(x) G F1 par définition. Maintenant, si x G F n F1, alors (x, x) = 0, et
donc x = 0 ; on en déduit que F D F1 = {0}. Par ailleurs, x = (x - pF(x)) + Pf(x)} avec
x - pF(x) G F1 et pF(x) G F. On en déduit que E = F + F1 et donc que E = F 0 F1.
Enfin, l'unicité de la projection sur un convexe fermé montre que Pf±(x) = x — Pf(#)> et
donc que x = Pf(x) +Pf±(x). Comme on a aussi x = Pf±(x) +P(Fx)±(a;), on en déduit
que p(F±)±(a;) = Pf(x), quel que soit rc G E, et finalement que (F1)1 = F.
Théorème II. 2.12. (Théorème de Riesz) Si E est un espace de Hilbert séparable,
alors l'application qui associe, à x e E, la forme linéaire AX) définie par Ax(y) = (x,y),
est une isométrie de E sur son dual E*. Autrement dit :
(15)ll ressort de ce théorème que tout sous-espace vectoriel fermé d'un espace de Hilbert admet un
supplémentaire fermé. Réciproquement, J. Lindenstrauss et L. Tfeafriri (1971) ont démontré qu'un espace de
Banach séparable ayant cette propriété est isomorphe h£2.
Une question ouverte concernant la classification des espaces de Banach séparables est de savoir si £2
est le seul pour lequel le groupe des isométries (applications linéaires bijectives, vérifiant ||u(;z)|| = ||z||,
quel que soit z) agit transitivement sur la sphère unité (i.e. si, quels que soient x,y de norme 1, il existe
une isométrie u, avec u(x) = y). En dimension finie, l'énoncé analogue est vrai : le groupe des isométries
de E est compact car fermé et borné dans GL(E), et donc possède une mesure de Haar ce qui permet de
construire un produit scalaire invariant par G en faisant la moyenne comme dans le th. 1.2.6 ; l'hypothèse
de transitivité montre que la boule unité est une homothétique de celle pour ce produit scalaire.
II.3. EXERCICES
289
(i) si x G E, la forme linéaire Ax est continue et ||ÀX|| = ||a;|| ;
(ii) si A : E —> K est une forme linéaire continue, il existe (un unique) x G E tel que
A(y) = {x, y) quel que soit y G E.
Démonstration. Le (i) a déjà été démontré (c'est le contenu du lemme II.2.10). Passons
à la démonstration du (ii)(16).
Première démonstration. Supposons A non nulle sinon il n'y a qu'à prendre x = 0. Soit
H le noyau de A. C'est un hyperplan de E, qui est fermé puisque A est continue. Soit
h G H1, non nul. Comme H D H1 = {0}, et comme H est le noyau de A, on a A(h) ^ 0.
Soit y G E et soit z = y— jMh. On a A(^) = 0, et donc z G H, ce qui implique {h, z) = 0 et
se traduit par {h,y) = ^jA(y) Quel Que s°ft î/ € E. Autrement dit, si on pose x = jgp h,
on a A(y) = Ax(y) quel que soit y G E. Ceci permet de conclure.
Seconde démonstration. Comme E est supposé séparable, il est isométrique à ^2, et on
peut donc supposer que E = C2. On note en, pour n G N, la base hilbertienne standard
de C2 (i.e. en est la suite dont tous les termes sont nuls sauf le n-ième qui est égal à 1),
et on pose an = A(en). Notons 7rn : i2 —> C2, l'application (yiji&q ■-* (2i)ieN, avec Zi = yi,
si i < n, et Zi = 0, si i > n. Alors 7rn est linéaire, continue car ||7rn(2/)||2 < ||y||2> et on a
fln(l/) -> 2/> pour tout y G ê2. Soit An = A o 7rn. Par linéarité, on a
An(y) = A(5Zi<n2/^) = Z^na'^ = (xin)>v)>
où x^ G Z2 est définie par x^ = ôj, si i < n, et £-n) = 0, si i > n. On déduit du (i) que
||An|| = ||a;(n)||2. Par ailleurs, si y G t2, on a An(y) —> A(y), puisque 7rn(2/) —> y et A est
continue. Il résulte du th. de Banach-Steinhaus que ||An|| est bornée et donc que ||a^||2
est majorée. Ceci implique que x = (ô^)nGN € (?. Par ailleurs, y i-> A'(y) = A(y) - (x,y)
est une forme linéaire continue sur ^2, nulle sur en pour tout n, et donc identiquement
nulle puisque les en engendrent un sous-espace dense de P. Ceci permet de conclure.
II.3. Exercices
1. Espaces de Banach
Exercice II. 3.1. Soient / continue et périodique de période 1 et a irrationnel. Montrer que
(commencer par un polynôme trigonométrique).
Exercice 11.3.2. a) La forme linéaire / h-> J!!^/(*)<** = !(/) sur ^C(R) s'étend-elle en une forme
linéaire continue sur L2(R) ?
<16)C'est la partie non triviale du théorème et celle qui a les conséquences les plus spectaculaires en
analyse fonctionnelle. On en déduit sans effort des tas de théorèmes d'existence.
290
CHAPITRE II. ESPACES DE BANACH
b) Soit en la fonction valant £ sur [0,n], et 0 ailleurs. Montrer que en G L2(R), et que la suite (en)n^i
tend vers 0 dans L2. En déduire que le sous-espace {/G ^C(R) • I(/) = 0} est dense dans L2(R).
c) Relation entre a) et b) ?
Exercice II.3.3. Soit a = (an)neN € £°° une suite bornée de nombres complexes.
(i) Montrer que, si x = (#n)nGN G t2, alors (anxn)nen G t2, et que l'application linéaire / : t2 -> t2
ainsi définie est continue.
(ii) Montrer que, si / est surjective, il existe C > 0 tel que \an\ ^ C, pour tout n G N. (On pourra
commencer par montrer que / est injective.)
Exercice ILS.4- (i) Montrer que, si a = (an)neN e £°°, et si b = (6n)neN € ll, alors la série £)nGN anK
converge. On note Aa(6) la somme de la série.
(ii) Montrer que l'application Aa : t1 -> C ainsi définie appartient à (£l)*> et que ||Aa|| = HaHoo.
(iii) Montrer que a •-> Aa est une isométrie de £°° sur (£1)*. (On pourra s'inspirer de la seconde
démonstration du th. II.2.12.)
Exercice ILS.5. Montrer qu'un espace de Banach possédant une famille génératrice dénombrable est
de dimension finie. (Si (en)nGN est une telle famille, on pourra considérer le sous-espace Fn engendré par
les eu pour i ^ n.)
Exercice II.3.6. Soit I un intervalle de R, et soit (/n)neN une suite de fonctions continues sur I tendant
simplement vers une fonction /. Si j G N, soit
Fnj = np>n{x G I, \fn+p(x) - fn(x)\ < 2"'}.
(i) Montrer que Fnj est fermé et que UnÇNFnj = I.
(ii) Soient \Jnj l'intérieur de Fnj et Vj = Uneiq\Jnj. Montrer que Vj est dense dans I.
(iii) Montrer que si a; G Uj, il existe Vx ouvert contenant x tel que \f(x) - f(y)\ ^ 22"-7, si y G Vx. En
déduire que / est continue en au moins un point de I.
2. Espaces de Hilbert
Exercice II.3.7. Quelle est la valeur maximale de J__x xf(x)dx pour / G L2([-l, 1]) soumis aux
conditions J^x f(x)dx = 0 et J^ f(x)2 = 1.
Exercice ILS.8. Soit (an)neN une suite de nombres complexes telle que, quelle que soit (&n)neN € ^2>
la série X)n^oa^^ converge. Montrer que X)n^o lan|2 < +°°- (On pourra considérer la suite de formes
linéaires Ak : t2 -> C, pour k G N, définie par Afc((6n)nGN) = Yln=oanbn- Les nostalgiques des classes
préparatoires pourront considérer la suite de terme général bn = £?QniQ.i2-)
Exercice II.3.9. Soit E un espace de Hilbert de dimension infinie.
(i) Montrer, en exhibant une suite sans valeur d'adhérence, que la boule unité deE n'est pas compacte.
(ii) Construire un sous-ensemble fermé F de E tel que 0 n'ait pas de projection sur F (c'est-à-dire tel
qu'il n'existe pas d'élément de F de norme minimale).
Exercice ILS.10. Soit (E, || ||) un espace de Hilbert.
(i) Soient a, x, y des points de E vérifiant
ll*-a||,||î,-a|Kr2 et ||^±* - a\\ > r,.
Montrer que \\x - y\\ ^ 4(r| -r2).
II.3. EXERCICES
291
(ii) Soit (Cn)neN une suite décroissante de convexes fermés non vides. Vérifier que C = n+^Cn est
un convexe fermé. Montrer que C est non vide si et seulement si supnGN d(0, Cn) < +00. On montrera
en particulier que sous cette condition, si a; G E, alors PcM(#) tend vers Pc(#)-
(iii) Soit ip : E —> R une fonction convexe (c'est-à-dire telle que (p(tx+(l-t)y) < t<p(x)+(l'-t)<p(y) quels
que soient t G [0,1] et #, y G E) telle que lim </>(#) = +00. Montrer que ip est bornée inférieurement
||x||-»oo
sur E et atteint son minimum.
Exercice ILS.11. Soit E un espace de Hilbert et (en)nGN une famille orthonormale. Soit (an)nGN une
suite de réels positifs. Montrer que C = B(0, l)n{^^ xnen \ xn G [-an, an]} est compact si et seulement
rfEÎ5«î<+°o-
Exercice IL3.12. (Polynômes de Legendre) On note Pn le polynôme ^r(l - x2)n. Montrer que les
Pn forment une famille orthogonale dans L2([-l, 1]), et que les Pn/||Pn||2 forment une base hilbertienne
deL2([-l,l]).
Exercice ILS.13. Soit E un espace de Hilbert, et soit A : E —> E, linéaire, vérifiant (Ax,y) = (#, Ay),
pour tous x,y G E. Montrer que A est continue. (On utilisera le résultat de l'ex. IL 1.27.)
Exercice ILS.Il Soit L2([0,1]) le complété de ^([0,1]) pour le produit scalaire (/, g) = f* 7(ï)p(0 dt.
(i) Soient Xi,... ,Xn des variables. Montrer que le déterminant de la matrice des (xi+x)1^^ est
n«j(x«-xi)2
An(Xi,..., Xn) = ^= .
(ii) Soit 1 < ai < a2 < ... une suite d'entiers strictement croissante. Si n G N, notons Vect(#ai,..., xan)
le sous-espace de ^([0,1]) engendré par les xai, pour 1 ^ i < n. Montrer que, si k G N, alors
d(*',vect(*<v..,x°»))* = ^»(* + ê.«;+ !.•••.«■ +à).
(iii) Montrer que Vect(#a', i G N) est dense dans L2([0,1]), si et seulement si YlX^i ^ = +°°-
Exercice ILS.15. (i) Soit ^c([l,+oo[) l'espace des </> : [l,+oo[-> C, continues, à support compact.
Montrer que (f,g) h-> (f,g) = f*°°f(t)g(t)$ est un produit scalaire sur ^c([l,+oo[), pour lequel
^c([l,+oo[) n'est pas complet.
(ii) On note E le complété de ^c([l>+oo[) pour ce produit scalaire. Si n est un entier ^ 2, soit
<j)n : [1, +00[—> C la fonction définie par <f>n(t) = [£] - ^. Montrer que <f>n G E.
(iii) Montrer que l'adhérence dans E de l'espace engendré par les </>n, pour n ^ 2, contient l'espace des
fonctions constantes sur [l,+oo[. (Indication : consulter l'ex. VII.5.2.)
3. Séries de Fourier
Exercice ILS.16. Soit / la fonction périodique de période 1 telle que l'on ait f(x) = x si x G] - 5, 5].
Calculer les coefficients de Fourier de / ; en déduire la valeur de Yln™i n*-
Si / G ^(R/Z), et si N G N, soit AN(/) = EL-nc^(/)- plus généralement, si a; G R/Z, soit
An,x(/) = E^=_N Cfc(f)e2iirkx. Notre but est d'étudier la convergence des sommes partielles symétriques
An,x(/) de la série de Fourier de / vers f(x).
Comme question préliminaire, on montrera que An est une forme linéaire continue sur ^(R/Z), et on
établira la formule AN(/) = /* SN(t)f(t)dt, où SN(«) = 8hl(s2"^1)irt-
292
CHAPITRE II. ESPACES DE DANACH
Exercice II.3.17. (i) Montrer que ||AN || = ||SN || x.
(ii) Montrer que ||AN|| tend vers +oo; en déduire que {/ € ^(R/Z), supN€N |AN(/)| = +00} est
un Gô dense dans <jf(R/Z).
(iii) Montrer que, si r G Q, l'ensemble des / € ^(R/Z) tels que supN€N |AN,r(/)| = +00 est un G6
dense dans ^(R/Z). En déduire qu'il existe un G$ dense X de ^(R/Z) tel que supNGN |AN,r(/)| = +00
quels que soient / G X et r € Q.
(iv) Montrer que, si / G X, et si M G N, alors l'ensemble des x G R/Z tels que supN€N |AN,a;(/)| > M
est un ouvert contenant Q/Z. En déduire que, si / G X, il existe un Gs dense Y/ de R/Z tel que
supN€N |An,x(/)| = +00, quel que soit<17> x G Y/.
Exercice II.3.18. Soit LX(R/Z) le complété de 'T (R/Z) pour la norme \\f\\i = f* \f(t)\ dt.
(i) Montrer que, si k € Z, / ■-> Ck{f) s'étend par continuité à L1(R/Z).
(ii) Montrer que, si / € L^R/Z), alors Ck(f) —> 0 quand |fc| —► +00.
(iii) On suppose / hôlderienne d'exposant a > 0 (i.e il existe C > 0 tel que \f(x) - f(y)\ < G\x - y\a
quels que soient x,y G [0,1]). Montrer que, si a: G R, alors la suite de terme général I3fc=-N ck(f)e2iirhx
tend vers f(x).
II.4. Espaces de Banach p-adiques
1. Définition et exemples
Un espace de Banach p-adique est un espace de Banach sur*18) Qp, mais comme la
norme sur Qp est ultramétrique, il est naturel d'imposer à la norme de l'espace de l'être
aussi, ce qui nous amène à la définition suivante.
Définition II.4.I. Un espace de Banach p-adique est un Qp-espace vectoriel E muni
d'une norme ultramétrique || || (i.e. ||a;+2/|| ^ sup(||a;||, \\y\\) et ||Àa;|| = |A|p||a;||, si À G Qp,
x,y eE) pour laquelle il est complet.
Remarque H.4-%- (i) Si E est un espace de Banach p-adique, l'ultramétricité de la
norme fait que sa boule unité E° = {x € E, ||a;|| ^ 1} est un sous-groupe additif de E
stable par multiplication par un élément de Zp (i.e. c'est un sous-Zp-module du Qp-espace
vectoriel E).
<17)Autrement dit, il existe un sous-ensemble non dénombrable dense X de ^(R/Z) tel que, si / G X,
alors la série de Fourier de / diverge en tout point d'un sous-ensemble non dénombrable dense de R/Z.
Malgré ce résultat peu encourageant, Carleson (prix Abel 2006) a démontré en 1965 que, si / G ^(R/Z)
(et même si / G L2(R/Z)), alors An,x(/) —» /(#) pour presque tout x (au sens du chapitre suivant). Par
contre, Kolmogorov (1926) a montré qu'il existe des éléments de LL(R/Z) dont la transformée de Fourier
diverge en tout point.
(18*De la même manière que l'on peut considérer des espaces de Banach sur R ou C, on pourrait
remplacer Qp par n'importe quel corps complet pour la norme p-adique comme, par exemple, une extension
finie de Qp ou le corps Cp.
II.4. ESPACES DE BANACH p-ADIQUES
293
(ii) L'ultramétricité de la norme et la complétude de l'espace font qu'une série X^Gi xi
converge dans E si et seulement si xi —» 0 à l'infini^19).
Hypothèse 11.4-3. On dit que E vérifie l'hypothèse (N) si quel que soit x G E, il existe
À 6 Qp tel que ||a;|| = |À|P.
Lemme II.4>4- Si (E, || ||) est un espace de Banach p-adique, on peut trouver une
norme || ||i sur E qui est équivalente à \\ \\ et qui vérifie l'hypothèse (N).
Démonstration. Si a; G E, soit vp(x) l'élément de RU {+00} défini par ||a;|| = p~v^x\
et soit II a; Il 1 = p-M*)^ où, si v G R, [v] désigne la partie entière de v. Alors || ||i est une
norme ultramétrique sur E et on a de plus ^\\x\\i ^ ||rcr|| ^ ||a;||i.
Exemple IL4.5. (i) Si I est un ensemble, soit ^°°(I) l'ensemble des suites bornées (ai)i€i
d'éléments de Qp. On munit ^°°(I) de la norme || ||oo définie par IKojJjgiHoo = supiGl |ai|p,
ce qui en fait un espace de Banach p-adique.
(ii) Soit ^o°(I) Ie sous-espace de £°°(I) des suites (ai)i€i tendant vers 0 à l'infini. C'est
un espace de Banach p-adique comme sous-espace fermé d'un espace de Banach p-adique.
C'est aussi l'adhérence dans ^°°(I) de l'espace des suites n'ayant qu'un nombre fini de
termes non nuls.
(iii) Si X est un espace topologique compact, l'espace if (X) des applications continues
de X dans Qp muni de la norme || ||oo définie par ||0||oo = sup^x WsOIp est un espace de
Banach p-adique.
(iv) On trouvera d'autres exemples intéressants dans l'annexe D.
2. Bases orthonormales
La théorie des espaces de Banach p-adiques est très loin d'être aussi riche que son
homologue archimédienne ; elle se rapproche plutôt de celle des espaces de Hilbert. En
particulier, la notion suivante remplace celle de base hilbertienne dans un espace de
Hilbert.
Définition LL.4.6. Soit E un espace de Banach p-adique. On dit qu'une famille bornée
{^i)i€i est une base orthonormale de E si (ai)i€i i-> £\ei a^ est une isométrie de ^(l)
sur E. On dit que c'est une base de Banach si cette application est un isomorphisme
d'espaces de Banach p-adiques (une base orthonormale est donc une base de Banach).
Autrement dit, une famille (ei)i€i est une base orthonormale de E si et seulement si
(i) tout élément rc de E peut s'écrire de manière unique sous la forme d'une série
convergente x = ^2i€l a-ie^ où les a* sont des éléments de Qp tendant vers 0 à l'infini,
(ii) NHsup^loil
(19)Une famille (xi)i&i tend vers 0 à l'infini si {i, \\xi\\ ^ e} est fini, pour tout e > 0 (il faudrait dire
« tend vers 0 suivant le filtre des complémentaires des parties finies », mais c'est un peu lourd...).
294
CHAPITRE IL ESPACES DE BANACH
C'est une base de Banach si elle est bornée et vérifie la condition (i), ce qui implique,
d'après le théorème de l'image ouverte, la propriété suivante :
(ii') il existe une constante C ^ 1 telle que l'on ait
C-1sup|ai| ^ ||a;|| ^ Csup|ai|.
Exemple IL 4-7. (i) Si i G I, soit e* = (eij)jGi, avec eiyi = 1 et eiyj = 0 si j'^ i. Par
définition, ou presque, les e*, pour i G I, forment une base orthonormale de ^o°(I).
(ii) Les (*), pour n G N, forment une base orthonormale de ^(Zp) : c'est une simple
traduction du théorème de Mahler (th. 20.4 et rem. 20.5).
Proposition II.4-8. (i) Tout espace de Banach p-adique possède des bases de Banach.
(ii) Un espace de Banach p-adique possède des bases orthonormales si et seulement si
il vérifie l'hypothèse (N). De plus, sous cette hypothèse, (ei)i£i est une base orthonormale
de E si et seulement si (ëj)iGi est une base algébrique du Fp-espace vectoriel E = E°/pE°,
où E° = {x G E | ||a;|| < 1} est la boule unité de E.
Démonstration. Le lemme II.4.4 implique que le (i) est une conséquence du (ii).
Supposons donc que E vérifie l'hypothèse (N) et montrons que (ei)i€i est une base orthonormale
de E si et seulement si (ëi)iGi est une base algébrique du Fp-espace vectoriel E.
Soit (ei)iei une famille d'éléments de E° telle que la famille (ëj)jGi soit une base du
Fp-espace vectoriel E. Soient S = {0,1,... ,p - 1} et s : Fp —> S l'inverse de la réduction
modulo p. Si rc G E°, on peut écrire son image x modulo p comme une somme finie
Yli£iaiëiy où les ai sont des éléments de Fp presque tous nuls. Soit s(x) = X^ei5(ai)e«-
Par construction, on a x — s(x) G pE°.
Si x G E°, définissons par récurrence une suite (£n)n€N d'éléments de E° par xo = x
et xn+i = ±(xn - s(xn)). Alors x = Yln=oPns(xn) +Pfc+1£fc+i quel que soit k G N, et
donc x = J2n€NPns(xn). De plus, s(xn) = ^2i€iSnfieiy où les sHfi sont des éléments de S
presque tous nuls, ce qui montre que si on pose a* = SnSPn5*M> a^ors ^a su^te des °»
tend vers 0 à l'infini (|ai|p < p~k si snii = 0 pour n < k — 1, ce qui est vérifié pour presque
tout i). On a alors x = Y^iç\aieu ce qui prouve que l'application (ai)i€i h-» X)iGia«ei est
une surjection de ^o°(I) sur E. Si a = (a^i G ^o°(I) vérifie HaH^ = 1, il existe i G I tel
que ai £ pZp, et alors J^tei a*e* ^ ^ modulo p car les ëj, pour i G I, forment une base de E.
Ceci implique que 1 ^ || X)iGiatetll > P~l> et comme on a supposé que E vérifie (N), on
en déduit que ||X^€ia*eill = 1 et Que l'application (ai)i£i h-> Y^iz\aiei est une isométrie
de ^o°(I) sur E- Ceci prouve que si les ëj, pour i G I, forment une base de E, alors les ei,
pour tel, forment une base orthonormale de E.
Supposons maintenant que les e*, pour i G I, forment une base orthonormale de E. Si
a; G E, on peut choisir x G E° ayant pour image x modulo p. Comme \\x\\ ^ 1, on peut
écrire x, de manière unique, sous la forme x = ^2i& aie^ où ai G Zp tend vers 0 à l'infini.
Il en résulte que la réduction ai modulo p de ai est nulle sauf pour un nombre fini de i (on
II.4. ESPACES DE BANACH p-ADIQUES
295
a ai ^ 0 si et seulement si \a,i\p = 1), et que x = X)iei^« est une combinaison linéaire
des ëi ; les ëi forment donc une famille génératrice de E. Enfin, si Yliei a&i = 0 dans E, et
si ai G Zp a pour image ai modulo p, alors x = ^2ieî fyei G pE°, et donc ||a;|| < 1. Comme
||g|| = supiGl |âj|p, cela implique |ôj|p < 1, et donc a; = 0, pour tout t G I. Il s'ensuit que
les ëi forment une famille libre, et donc une base, de E.
Ceci permet de conclure.
3. Le dual d'un espace de Banach p-adique
Si E est un space de Banach p-adique, on note E* son dual (i.e l'espace des formes
linéaires continues de E dans Qp). Comme d'habitude, une forme linéaire A : E —> Qp
est continue si et seulement si il existe C > 0 tel que |A(rc)|p ^ C||a;||, pour tout rc G E,
et on définit la norme ||A|| de A comme la borne inférieure des C vérifiant la condition
ci-dessus; c'est la norme d'opérateur de A et on a aussi ||A|| = supxeE_{0} ||a;||~1|A(a;)|p.
Ceci munit E* d'une norme ultramétrique (l'ultramétricité est une conséquence de celle
de | |p), et il résulte du th. II.1.28 que E*, muni de cette norme, est complet; c'est donc
un espace de Banach p-adique.
Proposition IL 4> 9. Soit I un ensemble.
(i) Si b = (bi)i£i G C°°(l) et si a = (ai)i€i G ^o°(I), la série X^eiat&i converge dans Qp.
(ii) Si Ab(a) désigne la somme de la série ^2i€i<kbi, l'application b m Ab est une
isométrie de £°°(I) sur le dual de ^o°(I).
Démonstration. (i) La convergence de la série vient de ce que 0,6» tend vers 0 à l'infini
puisque ai tend vers 0 et bi est bornée.
(ii) La linéarité de A& et l'égalité ||Ab|| = ||l>||oo sont immédiates. Il n'y a donc que
la surjectivité de l'application b i-> Ab à vérifier. Soit donc A G Q°(I)*. Comme A est
continue, si on pose bi = A(^), on a \bi\p ^ ||A||, ce qui prouve que b = (6j)i€i G C°°(l).
Mais alors A - Ab est nulle sur le sous-espace de ^o°(I) engendré par les S^ et comme
celui-ci est dense dans ^j°(I) et A - Ab continue, cela implique A = Ab- Ceci permet de
conclure.
CHAPITRE III
INTÉGRATION
III. 1. Intégrale de Lebesgue
L'intégrale de Lebesgue (1902-1904) est une extension (ou plutôt une complétion) de
l'intégrale de Riemann^d'une extrême souplesse. Les espaces de fonctions intégrables
deviennent complets(2), ce qui simplifie grandement les problèmes d'existence ou de
convergence d'intégrales, et on dispose, grâce au théorème de convergence dominée de Lebesgue
(th. III. 1.32), d'un outil extrêmement puissant pour intervertir limites et intégrales. Tous
les énoncés classiques de l'intégrale de Riemann (continuité et dérivabilité d'une
intégrale dépendant d'un paramètre, théorème de Fubini) s'étendent avec des démonstrations
souvent simplifiées. Il est toutefois toujours aussi difficile de calculer explicitement les
intégrales dont on a montré l'existence, mais c'est un autre problème...
1. Dallages et fonctions en escalier
Soit Z[|] l'anneau des nombres dyadiques (i.e. des nombres rationnels dont le
dénominateur est une puissance de 2). Une dalle de Rm est un sous-ensemble de Rm de la
formel IlJLi[rj> sjl ou rj < 5j> Pour 1 ^ 3 ^ m> sont des nombres dyadiques. Un dallage
est une réunion finie de dalles. Une dalle élémentaire (de taille 2~r) est un ensemble de
la forme Dr>k, où r e N, k = (klt..., km) e Z™, et Dr,k = Iï^il^ *£M-
Lemme III. 1.1. (i) Si Di et D2 sont des dalles élémentaires (pas forcément de même
taille), alors soit Di et D2 sont disjointes, soit l'une est incluse dans Vautre^.
(ii) Si k G Zm, alors Dr>k est la réunion disjointe des Dr+i^k+a, pour a e {0, l}m.
(iii) Tout dallage est une réunion finie disjointe de dalles élémentaires de même taille.
(^L'intégrale de Riemann date de 1854 ; elle généralise l'intégrale que Cauchy avait définie (cours à l'École
Polytechnique de 1823) pour les fonctions (uniformément) continues (cf. ex. 16.5 du Vocabulaire).
(2>Et on peut même, quitte à se passer de l'axiome du choix, imposer que toute fonction pas trop grosse
(par exemple bornée sur un ensemble borné) soit intégrable (cf. note 14).
(3*Le lecteur est invité à supposer m = 1 ou m = 2, et à faire des dessins; cela rend les énoncés qui
suivent parfaitement évidents.
<4) Autrement dit, les dalles élémentaires se comportent comme des billes de mercure.
298
CHAPITRE III. INTÉGRATION
Démonstration. Exercice.
On définit la mesure A(Dr)k) d'une dalle élémentaire Dr,k par la formule A(Dr>k) = 2~mr.
Si D est un dallage quelconque, réunion disjointes des Dr>k{, pour i 6 I ensemble fini, on
définit A(D) par À(D) = X^ei^(Dr,ki)- On vérifie que cela ne dépend pas du choix de
la taille des dalles élémentaires choisies pour recouvrir D, en utilisant le (ii) du lemme
précédent.
Si r 6 N, et si k € Zm, on note ery la fonction caractéristique de Dr)k. Si r 6 N,
on note Escr(Rm), l'espace vectoriel des combinaisons linéaires des er>k, pour k G Zm;
c'est l'ensemble des fonctions en escalier sur Rm, constantes sur les dalles élémentaires
de taille 2~r. Les er>k, pour k 6 Zm, étant linéairement indépendantes (si x € Rm il existe
exactement un k G Zn tel que er>k(a:) ^ 0), forment une base de Escr(Rm).
Comme er>k = Z)a€{o,i}m eH-i,2k+a, on a Escr(Rm) C Escr+i(Rm), si r e N. La réunion
Esc(Rm) des Escr(Rm), pour r € N, est donc un espace vectoriel ; c'est l'espace vectoriel
des fonctions en escalier sur Rm. (On notera qu'une combinaison linéaire étant une somme
finie, une fonction en escalier est à support^ compact.)
Si X C Rm, on note Esc(X) l'ensemble des fonctions en escalier sur X ; il peut se voir
comme l'ensemble des fonctions en escalier sur Rm qui sont nulles en dehors de X. Plus
généralement, si X C Rm, et si U C C, on note Esc(X, U) l'ensemble des fonctions, en
escalier sur X, prenant leurs valeurs dans U. On a donc Esc(X) = Esc(X, C).
Si <f> G Esc(Rm), il existe r e N tel que l'on puisse écrire </> sous la forme <f> = J^j€l o^k,,
et on définit son intégrale /</> par J <j> = Si€laiA(Dr>k,) = 2~rmY2i£iai- On vérifie, en
utilisant la formule ery = X^a€{o,i}»' er+i,2k+a, que cela ne dépend pas du choix de r, et
que l'on a défini de la sorte une forme linéaire sur Esc(Rm). Suivant le contexte, l'intégrale
de (j) sera notée indifféremment
/(/>= <t>= / </>d\ = (f>(x) dx = <j)(x) dxi--- dxm.
JTV"1 JTVn JRm JRm
Remarque III. 1.2. Si (f> 6 ^c(Rm) est une fonction continue à support compact, et si
on note <j>r la fonction en escalier Y^kzz™ ^(^^m prenant la valeur </>(§£,..., ^) sur la
dalle élémentaire njlj^,-2F-[> Quel Que soit k e Zm, alors (j>r —» <f> en norme || ||oo
(i.e. uniformément^). Ceci permet de montrer que la suite (/0r)r€N converge, et on
définit l'intégrale de Riemann f <f> comme la limite de cette suite. L'intégrale de Lebesgue
va être définie de la même manière, mais en relâchant^ la condition de convergence
uniforme, remplacée par la condition de convergence simple presque partout.
(5>Le support de <f> est l'adhérence de l'ensemble des x tels que <l>(x) ^ 0 ; c'est donc un fermé par
définition.
(6)Cest une conséquence de l'uniforme continuité d'une fonction continue sur un compact.
<7)Comme la convergence uniforme implique la convergence simple presque partout définie plus loin, les
intégrales de Riemann et de Lebesgue d'une fonction continue à support compact coïncident, et l'intégrale
de Lebesgue est bien une extension de l'intégrale de Riemann.
III.l. INTÉGRALE DE LEBESGUE
299
2. Ensembles de mesure nulle
On définit la mesure extérieure A+(A) d'un ensemble A comme la borne inférieure
des ]Cn€N'MDn)> ou (Dn)n€N décrit l'ensemble des suites de dalles de Rm telles que
A C Un€NDn- En décomposant les dalles Dn en dalles élémentaires disjointes de taille
décroissante avec n, et en éliminant les dalles élémentaires de Dn incluses dans un des D*,
pour t < n — 1, on peut se ramener au cas où les Dn sont des dalles élémentaires
disjointes^.
Proposition III. 1.3. (i) Si B C A, alors A+(B) ^ A+(A).
(ii) Si An c Rm, pour n G N, alors A+(UneNAn) ^ £nGN A+(An).
Démonstration. Le (i) est une évidence. Le (ii) est évident si X^n€N ^+(^n) = +oo. Dans
le cas contraire, soit A = Un€NAn, et soit e > 0. Pour tout n € N, on peut trouver une suite
(Dn>fc)fceN de dallages de Rm tels que An C Ufe€NDn(A; et £fceN A(Dn,fc) < A+(An)+2-1"n£.
Mais alors A C Ufc(nGNDn>fc et
£ A(Dn,t) < $>+(An) + r»-»e) = * + £ A+(A»)-
fc,n€N nGN n€N
On en déduit que A+(A) ^ e + X^neN^+(^n) clue^ clue so^ e > 0, ce qui permet de
conclure.
On dit que A est de mesure nulle si A+(A) = 0. En revenant à la définition, on voit que
A est de mesure nulle si et seulement si, quel que soit e > 0, il existe une suite (Dn)n€N
de dallages de Rm tels que A C UneND„ et £n€N A(Dn) < e.
Proposition III. 1.4- (i) Tout sous-ensemble d'un ensemble de mesure nulle est de
mesure nulle.
(ii) Une réunion dénombrable d'ensembles de mesure nulle est de mesure nulle.
Démonstration. C'est une conséquence immédiate de la prop. III. 1.3.
Exercice III.l.5. Montrer que, si A est de mesure nulle dans Rn, alors A x Rm est de mesure nulle
dans Rn+m.
Exercice III. 1.6. (i) Montrer que la diagonale dans R2 est de mesure nulle.
(ii) Montrer, plus généralement, que le graphe dans R2 d'une application continue / : R —* R est de
mesure nulle, et qu'un hyperplan est de mesure nulle dans Rm.
(iii) L'image dans R2 de [0,1] par une application continue est-elle nécessairement de mesure nulle ?
On dit qu'une propriété est vraie presque partout, ou bien est vraie pour presque tout
x G Rm, ou encore est vraie p.p., si l'ensemble des points ne la vérifiant pas est de mesure
nulle. Par exemple, l'ensemble des rationnels étant dénombrable, presque tout réel est
(8>Le résultat n'est pas sans rappeler la manière dont une image apparaît sur un ordinateur.
300
CHAPITRE III. INTÉGRATION
irrationnel. De même, presque tout (9) nombre complexe est transcendant. (Un nombre
complexe est algébrique s'il est racine d'un polynôme unitaire à coefficients dans Q. Un
nombre complexe non algébrique est un nombre transcendant.)
Remarque III. 1.7. (i) Il ne faudrait pas croire qu'un sous-ensemble de R de mesure
nulle est forcément dénombrable. Par exemple, fixons une bijection n i-* rn de N sur Q,
et soient Uk = Un€N]rn - 2-n~k,rn + 2~n-% si k 6 N, et A = nfceNUfc. Alors A est de
mesure nulle puisqu'il est inclus dans U^, pour tout k, et que A+(Ufc) ^ X^S^1-71-*5 =
22~k peut être rendu arbitrairement petit. D'un autre côté, U^ est un ouvert dense pour
tout k, et donc A est dense et non dénombrable d'après le lemme de Baire (cf. n° 14.2 du
Vocabulaire). En particulier, A contient bien d'autres éléments que les rationnels, ce qui
n'est pas totalement transparent sur sa construction.
(ii) Un ensemble de mesure nulle peut avoir des propriétés assez surprenantes. Par
exemple, A. Besicovitch (1919) a construit des ensembles de mesure nulle de Rm, pour
m ^ 2, contenant un segment de longueur 1 dans toutes les directions(10).
Exercice III.1.8. Montrer qu'une fonction continue, qui est nulle p.p., est identiquement nulle.
Théorème III. 1.9. (Borel-Cantelli) Si (an)nGN est une suite d'éléments de R+ telle
Que En€Nan < +°°> e* 5* (An)n€N est une suite de sous-ensembles de Rm vérifiant
À+(An) < an, pour tout n € N, alors presque tout x € Rm n'appartient qu'à un nombre
fini de An.
Démonstration. Il s'agit de prouver que l'ensemble A des x G R appartenant à une
infinité de An est de mesure nulle. Or i G A si et seulement si, quel que soit n G N, il
existe p ^ n tel que x 6 Ap; autrement dit, on a A = nneisr( Up^n Ap). On en déduit
que A+(A) < EP>n^+(Ap)> Quel Que soit n e N, et comme la série X^neN^+(An) est
supposée convergente, son reste tend vers 0, ce qui permet de conclure.
W Au vu de ces résultats, il est raisonnable de penser qu'un nombre n'ayant pas de bonnes raisons d'être
algébrique est transcendant. Démontrer qu'un nombre donné est transcendant ou même irrationnel est,
en général, très difficile. Par exemple, il a fallu attendre 1979 pour que R. Apéry démontre que C(3) est
irrationnel, et il n'y a aucun entier n impair ^ 5, pour lequel on sache prouver que Ç(n) est irrationnel.
Le seul résultat dans cette direction est un résultat de T. Rivoal (2000) qui a démontré que C(n) est
irrationnel pour une infinité de n impairs, et qu'au moins un des 9 nombres Ç(5), • • • , Ç(21) est irrationnel
(amélioré depuis par W. Zudilin : au moins un des 4 nombres Ç(5),C(7),C(9)>C(H) est irrationnel).
(10)Ces ensembles sont sources de contrexemples empoisonnants en analyse (par exemple pour la
convergence des séries de Fourier en dimension ^ 2). Les analystes seraient plutôt contents si on arrivait à
démontrer (problème de Kakeya) qu'un ensemble de Besicovitch n'est pas trop petit, et plus précisément
qu'un ensemble de Besicovitch de Rm est de dimension de Minkowski m : la dimension de Minkowski d'un
ensemble X, si elle existe, est la limite de Iog^^'fc^ quand k —» +oo, où N(X, k) est le nombre minimum de
boules de rayon £ nécessaires pour recouvrir complètement X. Le meilleur résultat connu pour le moment
est dû à N. Katz et T. Tao (2001) : la dimension de Minkowski d'un ensemble de Besicovitch de Rm est
au moins (2 - \/2)(m - 4) + 3, si m > 4.
III. 1. INTÉGRALE DE LEBESGUE
301
Exercice III. 1.10. (i) Montrer que, si e > 0 et C > 0, alors pour presque tout*11) nombre réel x,
l'ensemble des couples d'entiers (p,g), tels que \x - || ^ Cq~2~e, est fini.
(ii) Montrer que l'ensemble des nombres de Liouville est de mesure nulle, non dénombrable, et dense
dans R. (Un réel x est de Liouville^12^ si ce n'est pas un nombre rationnel et si, quel que soit n € N, il
existe un couple d'entiers (p,g), <? ^ 2, tels que \x — || ^ q~n.)
3. Fonctions mesurables, ensembles mesurables
3.1. Fonctions mesurables
Une fonction / : Rm —> C (resp. / : Rm —» R+) est dite mesurable si elle est limite
p.p. d'une suite de fonctions en escalier. Autrement dit, / est mesurable s'il existe A C Rm
de mesure nulle, et une suite (/n)neN d'éléments de Esc(Rm) (resp. Esc(Rm,R+)) tels
que fn(x) —» f(x), quel que soit x £ A.
On note Mes(Rm) l'ensemble des fonctions mesurables sur Rm à valeurs dans C. Plus
généralement, si D C Rm et F C C (ou F C R+), on note Mes(D,F) l'ensemble des
fonctions mesurables sur Rm, qui sont nulles en dehors de D et qui prennent leurs valeurs
dans F.
• Les fonctions constantes sont mesurables (la fonction À est la limite de A1dn, où Dn
est la dalle [-N,NR.
• Mes(Rm) est une C-algèbre (i.e. A/, / + g et fg sont mesurables si À G C, /, g
mesurables). En effet, si (/n)neN et (pn)neN sont des suites d'éléments de Esc(Rm) tendant
respectivement vers / et g en dehors de A/ et A9, où Af et Ag sont de mesure nulle, alors :
A/n —> \f en dehors de A/ et donc À/ est mesurable,
fn + gn -* / + g en dehors de A/ U Ag (qui est de mesure nulle), et donc / + g est
mesurable,
fngn —» fg en dehors de A/ U A5, et donc fg est mesurable.
(n>K. Roth (1955) a démontré, ce qui lui a valu la médaille Fields, que les nombres algébriques ont cette
propriété (c'est évident pour les rationnels ou les nombres algébriques de degré 2 (si a est un nombre
algébrique, le degré de a est le minimum des degrés des polynômes P € Q[X] non nuls, avec P(a) = 0),
mais le cas général représente un tour de force). On ne sait pas démontrer que7r vérifie cette propriété.
Dans le même genre d'idées, si x est un nombre réel non rationnel, on peut prendre son développement
en fractions continues (il s'agit de la suite d'entiers (an)nGN définie par l'algorithme xq = x, an = [xn],
xn+i = x * ; les nombres rationnels *j% obtenus en écrivant x en termes de ao, • • • ,an_i et xn, et
en remplaçant xn par an dans l'expression, sont les meilleures approximations de x par des nombres
rationnels). On montre facilement que, pour presque tout nombre réel x, la suite an n'est pas bornée, ce
qui équivaut à la nullité de la borne inférieure de l'ensemble des q \qx — p|, pour p, q € Z, q ^ 1. Si x est
algébrique de degré 2, la suite an devient périodique à partir d'un certain rang et donc est bornée. On
est persuadé que si x est algébrique de degré ^ 3, alors la suite an n'est pas bornée, mais on ne sait le
démontrer dans aucun cas.
<12)Ces nombres, introduits par Liouville en 1844, sont les premiers nombres dont on ait montré la
transcendance; celle de e a été prouvée en 1873 (Hermite), et celle de n en 1882 (Lindemann).
302
CHAPITRE III. INTÉGRATION
• Si /, g G Mes(Rm, R+), alors inf (/, g) et sup(/, g) sont mesurables. En effet, si (/n)n€N
et (gn)n£N sont des suites d'éléments de Esc(Rm, R+) tendant respectivement vers f et g
en dehors de A/ et Agy où A/ et Ag sont de mesure nulle, alors inf (/„, gn) (resp. sup(/n, gn))
tend vers inf(/,p) (resp. sup(/,#)) en dehors de A/ U Ag.
• f : Rm —» C est mesurable si et seulement si les fonctions^13) Re+(/), Re+(—/),
Re+(if) et Re+(-z/) sont mesurables : / = Re+(/) - Re+(-/) -iRe+(if) + *Re+(-z/),
d'où l'implication « Re+(/), Re+(-/), Re+(if) et Re+(-z/) mesurables » =ï « f
mesurable ». L'implication réciproque résulte de ce que Re+(#) est en escalier, si g est en
escalier, et de ce que Re+ est continue.
Exercice III.1.11. (i) Montrer que h(x,y) = f{x)g(y) est mesurable sur Rn+m, si / est mesurable
sur Rn et si g est mesurable sur Rm.
(ii) Montrer qu'une fonction continue est mesurable.
Proposition III. 1.12. Une limite simple p.p. de fonctions mesurables est mesurable.
Démonstration. Cette proposition est moins évidente qu'il n'y paraît (cf. ex. 11,1.11).
La démonstration sera faite au n°4 du §111.4.
Exercice III.1.13. (i) Montrer qu'une fonction est mesurable si et seulement si elle est limite simple
p.p. d'une suite de fonctions continues.
(ii) En déduire qu'une limite simple p.p. de limites simples p.p. de fonctions continues est limite simple
p.p. d'une suite de fonctions continues. Comparer avec l'exercice II.1.11.
3.2. La tribu des ensembles mesurables
• Un sous-ensemble X de Rm est mesurable si sa fonction caractéristique lx est une
fonction mesurable^14). En particulier :
un ensemble de mesure nulle est mesurable (sa fonction caractéristique est la limite
simple p.p. de la suite dont tous les termes sont la fonction nulle).
si A et B sont mesurables, alors A D B et A U B sont mesurables [ en effet, on a
lAnB = inf(1A, 1b) et lAuB = sup(lA, 1B) ]•
(13)Si z G C, on note Re+(z) le nombre réel sup(0, Re(z)) ; on a alors
z = Re+(z) - Re+(-z) + iRe+(-iz) - iRe+{iz).
<14) S. Banach et A. Tarski (1924) ont construit un découpage d'une boule de rayon 1 dans R3 en un
nombre fini de morceaux (5 morceaux suffisent), tel que si on réarrange ces morceaux (i.e. si on les bouge
par des isométries de R3), on obtient deux boules de rayon 1 (paradoxe de Banach-Tarskî). Ces morceaux
ne sont pas mesurables, et la construction de Banach et Tarski utilise l'axiome du choix.
D'un autre côté, R. Solovay (1966) a démontré que, si on s'interdit l'axiome du choix non dénombrable,
tout en gardant l'axiome du choix dénombrable, on peut, sans introduire de contradiction supplémentaire
aux mathématiques, supposer que tout ensemble est mesurable. La leçon à retenir de ce résultat est,
qu'en pratique, toutes les fonctions et tous les ensembles rencontrés en analyse sont mesurables et qu'il
est inutile de passer son temps à vérifier qu'ils le sont ; le problème est différent en théorie des probabilités
où un même événement peut être mesurable ou non mesurable suivant les conditions.
III. 1. INTÉGRALE DE LEBESGUE
303
Exercice III. 1.14. Montrer que, si X est mesurable dans Rn et Y est mesurable dans Rm, alors X x Y
est mesurable dans Rn+m.
• Si E est un ensemble, une tribu srf sur E est un ensemble non vide de parties de E, stable par passage
au complémentaire (si A G ^, alors E - A G stf) et par réunion dénombrable (si I est dénombrable
et si (Ai)iGi sont des éléments de ^, alors U^iA* G srf). Une tribu sur E contient toujours E et 0
(si A G ^, alors A U (E — A) G ^), et est aussi stable par intersection dénombrable puisque n^iAi est
le complémentaire de la réunion des complémentaires des A*.
• Une intersection de tribus sur E est encore une tribu ce qui permet, si SB est un ensemble non vide de
parties de E, de définir la tribu engendrée par & comme l'intersection de toutes les tribus contenant @.
• Si E est un espace topologique (par exemple E = R,Rm,R+...), la tribu borélienne 3Sor sur E est
la tribu engendrée par les ouverts ou, ce qui revient au même, par les fermés. Un élément de la tribu
borélienne est un borélien; les ouverts et les fermés sont donc des boréliens, mais un borélien quelconque est
assez difficile à décrire*15^. Parmi les sous-ensembles de âSor mentionnons l'ensemble (% des intersections
dénombrables d'ouverts et l'ensemble &G des réunions dénombrables de fermés.
• La tribu borélienne de Rm est aussi la tribu engendrée par les dalles élémentaires. En effet, un ouvert
de Rm est la réunion des dalles élémentaires qu'il contient et celles-ci sont en nombre dénombrable,
ce qui prouve que les ouverts sont dans la tribu engendrée par les dalles élémentaires qui, de ce fait,
contient 3§or. Réciproquement, la dalle n™ Jf^ ^M est l'intersection de l'ouvert n™ il ~ °°> ^M et
du fermé n£Li(f£> +°°[> et donc est un élément de &Sor ; il en résulte que BSor contient toutes les dalles
élémentaires et donc aussi la tribu qu'elles engendrent.
Exercice III.1.15. Soit (/n)neN une suite de fonctions continues de Rm dans C.
(i) Montrer que {x G Rm, fn(x) —> 0} est un borélien.
(ii) Montrer {x G Rm, fn(x) a une limite} est un borélien (penser au critère de Cauchy).
On dit que A et B ne diffèrent que par des ensembles de mesure nulle si 1a = 1b P-P-> ce qui équivaut
à ce que A - (A n B) et B - (A n B) sont de mesure nulle.
Théorème III. 1.16. (i) Les ensembles mesurables forment une tribu surlim.
(ii) La tribu des ensembles mesurables est la tribu engendrée par les boréliens et les ensembles de mesure
nulle (l6K Plus précisément, les conditions suivantes sont équivalentes :
• X est mesurable,
• il existe G G &s tel que X et G ne diffèrent que par des ensembles de mesure nulle,
• il existe F G &a tel que X et F ne diffèrent que par des ensembles de mesure nulle.
Démonstration. Si X est mesurable, alors son complémentaire l'est puisque sa fonction caractéristique
est 1 — lx qui est mesurable comme combinaison linéaire de fonctions mesurables. Si les (X^^n sont
mesurables, alors la fonction caractéristique de la réunion est la limite simple des fonctions sup^nlx£,
et donc est mesurable comme limite simple de fonctions mesurables.
(15*Une description explicite est, de toute façon, parfaitement inutile pour les applications : la manière
dont on démontre une propriété pour un borélien quelconque consiste à vérifier qu'elle est vraie par
passage au complémentaire et par réunion dénombrable, et qu'elle est vrai pour les ouverts (ou toute
autre famille d'éléments de &Sor engendrant 33or).
(16)()n peut montrer qu'il existe des ensembles mesurables qui ne sont pas des boréliens par un argument
de cardinal : l'ensemble des boréliens a même cardinal que R, alors que l'ensemble des mesurables, qui
contient l'ensemble des parties de l'ensemble de Cantor, a un cardinal strictement plus grand.
304
CHAPITRE III. INTÉGRATION
On en déduit le (i). Pour démontrer le (ii) commençons par constater qu'un borélien est mesurable
puisqu'une dalle élémentaire l'est et que la tribu engendrée par les dalles élémentaires est celle des
boréliens. Comme un ensemble de mesure nulle l'est aussi, la tribu des mesurables contient la tribu
engendrée par les boréliens et les ensembles de mesure nulle. Pour montrer l'inclusion réciproque, il suffit
de montrer qu'un ensemble X mesurable admet l'une des descriptions du théorème. Si (fk)keN est une
suite de fonctions en escalier tendant simplement vers lx en dehors de A, où A est de mesure nulle, on
a aussi lx* -> lx en dehors de A, si X^ est le dallage des x G Rm vérifiant \fk(x)-l\ ^ |. Soit \}k
l'intérieur de X/.. Comme X& - U& est de mesure nulle puisqu'inclus dans une réunion finie de faces de
dalles élémentaires, il existe un ensemble de mesure nulle A' tel que lufc —> lx en dehors de A'. Il en
résulte que lx(#) = limsuplufc(^), si x fi A', et donc que X ne diffère de G = nnGN U*^n U& que
par des ensembles de mesure nulle, et comme Ufc->nUfc est un ouvert, on a G 6 ^, ce qui fournit la
première description cherchée. La seconde s'en déduisant en passant aux complémentaires, cela termine
la démonstration.
3.3. Fonctions mesurables et ensembles mesurables
D'après la note 14, toute fonction et tout ensemble raisonnable sont mesurables (pour un ensemble
déraisonnable, cf. ex. III. 1.27), mais si on éprouve une réticence à utiliser ce métathéorème pour vérifier
la mesurabilité d'une fonction, le résultat ci-dessous fournit un critère commode.
Proposition III. 1.17. Les conditions suivantes sont équivalentes si f : Rm —> R+ :
• / est mesurable,
• /_1(X) est mesurable pour tout borélien X de R+,
• f~l([Q>a[) est mesurable pour tout a G R+,
• /-1([0>a]) est mesurable pour tout a G R+.
Démonstration. L'équivalence entre les 3 derniers points résulte de ce que la tribu borélienne de R+
est engendrée par les [0,a[ ou les [0,a], pour a G R+. Il suffit donc de prouver l'équivalence entre les
premier et troisième points. Si f~l([0,a[) est mesurable pour tout a G R+, alors Xn^ = /""^([^r» ^kM) =
/"Ht0» ^r[) - /-1([0, £D !'est aussi> P°ur tous n € N et k G N. Il s'ensuit que fn = £fc€N £lXn,fc
est mesurable, comme limite simple (i.e. série) de fonctions mesurables, et comme fn tend simplement
vers /, on en déduit la mesurabilité de /.
Réciproquement, soit / mesurable, et soit (fk)kevi une suite d'éléments de Esc(Rm, R+) tendant vers /
en dehors de B, où B est de mesure nulle. Si 6 G R+, soit D^ = /^([0,6[), et soient X6 = /"^([O, b[) et
XjJ~ = f~l([0,b]). Alors D6,fc est un dallage, et donc Y6 = nneN Vk^n E>btk est mesurable. Par ailleurs, si
x G X6 - B, alors f(x) < 6, et donc //.(#) < 6, pour tout k assez grand, et donc Xb - B C Y6. De même,
si x G Y& - B, alors /&(#) < 6, pour une infinité de fe, et donc f(x) ^ 6; autrement dit, Y& - B c XjJ".
Comme B est de mesure nulle, on en déduit l'existence de Y£, mesurable, ne différant de Y& que par
un ensemble de mesure nulle, tel que X& c Y£ c XjJ~. On a alors Xa = UneNY^n, si an est une suite
croissante de limite a, ce qui prouve que Xa est mesurable, en tant que réunion dénombrable d'ensembles
mesurables. Ceci termine la démonstration.
4. Définition de l'intégrale de Lebesgue
Une fois qu'on a défini ce qu'était une fonction mesurable, on peut se demander
comment la mesurer. Une mesure naturelle pour beaucoup de questions est fournie par
l'intégrale de Lebesgue (et la mesure de Lebesgue). La présentation que nous avons choisie
III. 1. INTÉGRALE DE LEBESGUE
305
est purement axiomatique^17) ; elle n'est pas sans rappeler le point de vue concernant les
nombres réels adopté en classes préparatoires (où R est présenté comme un corps
totalement ordonné dans lequel toute partie non vide admet une borne supérieure, le rôle joué
par la propriété de la borne supérieure dans cette présentation de R étant tenu ici par le
théorème de convergence monotone).
4.1. Intégration des fonctions positives
Théorème III. 1.18. Il existe une unique application f *-> f f de Mes(Rm, R+) dans R.
vérifiant les propriétés (i) (v) ci-dessous.
(i) Si f est en escalier, alors / / est la quantité précédemment définie.
(ii) (linéarité) f(af + bg) = af f+ b f g, si a,b € R+, et f,g€ Mes(Rm, R+).
(iii) f f = 0 si et seulement si f = 0 p.p.
(iv) Sif^g p.p., alors J f < / g.
(v) (théorème de convergence monotone) Si (/„) est une suite croissante d'éléments de
Mes(Rm, R+), alors limn^+00 / fn = / limn^+00 fn.
Remarque III. 1.19. (i) Les propriétés fondamentales sont la linéarité de l'intégration
(propriété (ii)) et le théorème de convergence monotone (propriété (v)).
(ii) La propriété (iv) découle des (ii) et (iii) : en effet, on a / g + / — inf(0, g — f) =
f f + J sup(# — /, 0), où toutes les fonctions sont positives et — inf (0, g — f) = 0 p.p. par
hypothèse.
(iii) La propriété (i) est une normalisation qui définit une mesure bien particulière
sur Rm, à savoir la mesure de Lebesgue. Comme nous le verrons (th. III.3.8), cette
propriété implique que la mesure de Lebesgue est invariante par translation.
Réciproquement, si / —» / / est linéaire et invariante par translation [ce qui signifie que, pour tous
/ <E Mes(R"\R+) et a e R"\ on a /ïB(/) = //, où (ïa(/))(«) = /(* + a)], et si
/eo,o = 1, alors /er,k ne dépend pas de k, grâce à l'invariance par translation, et donc
vaut 2~rm, grâce à la normalisation /e0)o = 1 (cela suit, par une récurrence sur r, de
l'indépendance de /er,k par rapport à k et de la formule er^ = Dae{o,i}m er+i,k+a) ; la
linéarité implique alors que // vérifie la propriété (i). Autrement dit, on aurait pu
remplacer (18> la propriété (i) par l'invariance par translation et la normalisation /e0>o = 1.
(17>Ceci a pour avantage de faire glisser sous le tapis certains points assez délicats sans diminuer la facilité
d'utilisation de la théorie. Toutefois, dans le but d'atténuer le sentiment d'inconfort que ressent toujours
un peu un esprit mathématicien à l'idée d'utiliser un résultat dont il n'a pas vu (et souvent oublié) une
démonstration, nous avons inclus, au § III.4, une construction de l'intégrale satisfaisant les axiomes.
<18)Ce procédé s'étend à tout groupe localement compact, ce qui inclut Rm, les groupes finis, les groupes
compacts, Z, le groupe additif Qp, les groupes multiplicatifs R*, C* ou Q*, ou plus généralement, si
d ^ 1, les groupes GLd(R), GL</(C), GLd(Qp) et leurs sous-groupes fermés... Un tel groupe possède, à
multiplication près par une constante > 0, une unique mesure invariante à droite (resp. à gauche), ce qui
signifie que /Tj(/) = // (resp. /Tg(/) = //), où (Tda(f))(x) = /(rca"1) et (Tg(/))(*) = f(ax) ; cette
mesure est « la » mesure de Haar à droite (resp. à gauche).
306
CHAPITRE III. INTÉGRATION
4.2. Mesure de Lebesgue d'un ensemble
Si X C Rm est mesurable, sa mesure de Lebesgue est définie par À(X) = /lx € R+.
La résultat suivant montre que la mesure de Lebesgue est dénombrablement additive et
donc définit une mesure(19) sur Rm muni de la tribu des ensembles mesurables.
Proposition III. 1.20. Si les (Xj)i€l, où I est dénombrable, sont des sous-ensembles
mesurables de Rm deux à deux disjoints, alors
A(Ui€iXi)=]^A(X4).
tel
Démonstration. L'hypothèse selon laquelle les Xi sont deux à deux disjoints se traduit
par luigiXi = Siei *xi> et ^ n v a P^us ^'^ numéroter les éléments de I et appliquer le
théorème de convergence monotone (dans le cas I infini) à la suite des sommes partielles
Proposition III. 1.21. Soit f € Mes(Rm, R+ ).
(i) J f = 0 si et seulement si \({t, f(t) ^ 0}) = 0.
(ii) Siff< +00, alors \({ty f(t) = +00}) = 0.
Démonstration. Soit A = {t, f(t) ^ 0}. Alors inf(/, N) < N1A et / inf(/, N) < NA(A),
pour tout N 6 N. Comme inf (/, N) tend en croissant vers /, le th. de convergence
monotone montre que // = 0 si A(A) = 0. Réciproquement, si // = 0, alors /N/ = N// = 0
pour tout N, et comme N/ tend en croissant vers +oo1a, le th. de convergence monotone
implique que +ooA(A) = 0 et donc A(A) = 0. Ceci démontre le (i).
Pour démontrer le (ii), il suffit de remarquer que si A = {t, f(t) = +00}, alors / ^ M1a
quel que soit M G R+, et donc MA(A) ^ // quel que soit M 6 R+.
Corollaire III. 1.22. X est de mesure nulle si et seulement si A(X) = 0.
Démonstration. Si X C Rm est mesurable, alors
X est de mesure nulle <^> lx = 0 p.p. <é=> / lx = 0 <é=S> A(X) = 0.
La première équivalence est par définition, la seconde suit du (iii) du th. III.1.18, et la
dernière résulte du (i) de la prop. III. 1.21.
Le cor. III. 1.22 est un cas particulier du résultat suivant, démontré au n° 2 du § III.4.
Théorème III. 1.23. Si X est mesurable, alors A(X) = A+(X).
Exercice III.I.24. Soient Xn c Rm mesurables, pour n G N, et soient B = Un€NXn et C = nneNXn-
(i) Montrer que si la suite Xn est croissante, alors A(B) = limn^+oo A(Xn).
(ii) Montrer que si la suite Xn est décroissante et si À(X0) < +00, alors A(C) = limn^+oo A(Xn). Le
résultat est-il toujours valable sans l'hypothèse A(X0) < +00 ?
<19)Une mesure \l sur un ensemble de E muni d'une tribu sd est une fonction fj, : sd —» R+ vérifiant
ju(0) = 0 et ^(U^giXi) = E)iGI/i(Xi) pour toute famille dénombrable (X^gi d'éléments de srf deux à
deux disjoints.
III.1. INTÉGRALE DE LEBESGUE
307
Exercice III.1.25. Soit X c Rm mesurable de mesure finie. Montrer que, quel que soit a € [0,1], il
existe B c X mesurable tel que A(B) = aA(X). (On pourra s'intéresser à f(t) = A(X n [-£,*]"*)•)
Exercice III. 1.26. (i) Montrer, en revenant à la définition, que A+([0,1]) = 1 (th. fondamental de la
théorie de la mesure : il n'est pas si évident que A+([0,1]) ^ 0...).
(ii) Un pavé de Rm est un ensemble de la forme fl^LiI?» ou h est un intervalle de n'importe quel
type (ouvert ou fermé à chacune des extrémités). Montrer que, si P = ll^lil.? est un Payé> sa mesure
extérieure est donnée par A+(P) = ll^=i HW> ou KW est ^a longueur de l'intervalle lj [i.e. si a ^ b sont
deux réels, alors A(]a,6[) = A([a,6[) = A(]a,b]) = A([a,b]) = b-a].
Exercice III.1.27. Montrer que, si S c [0,1] est un système de représentants de R/Q (i.e. tout élément
de R peut s'écrire de manière unique sous la forme s+q, avec s € S et q € Q), alors S n'est pas mesurable.
Comparer avec la note 14.
4-3. Intégration des fonctions sommables
En découpant une fonction quelconque en partie réelle positive et négative et partie
imaginaire positive et négative, cela permet de définir l'intégrale d'une fonction mesurable
à valeurs dans C. Toutefois, comme +00—(+00) n'a pas de sens, on est forcé de restreindre
l'ensemble des fonctions considérées.
Définition III. 1.28. (Intégrale de Lebesgue)
(i) / <E Mes(Rm) est sommable, si /1/| < +00. On note 3fl(Rm) C Mes(Rm)
l'ensemble des fonctions sommables.
(ii) Si / 6 &l(TLm), les fonctions Re+(/), Re+(-/), Re+(if) et Re+(-z/) sont
sommables puisque majorées par |/|, et on pose
J f = J Re+(/) - jRe+(-/) + ij Re+(-if) - i J Re+(if).
Remarque III. 1.29. (i) L'intégrale / i-> // est C-linéaire : cela résulte formellement
du (ii) du th. III.1.18. (Il est immédiat que /A/ = A//, si A G R ou si A = z; le
seul problème est donc de prouver que ff + 9 = ff + fg- Après découpage en parties
imaginaire et réelle, positive et négative, on est ramené à montrer que / f — g = f f- f g}
si f et g sont positives. Soient A = {x, f(x) ^ g(x)} et B = {x, f(x) < g(x)}. Alors
J f -9 = /(/ - p)1a - S {9 ~ /)1b par définition. Comme (/ - g)lA + glA = /1A, on a
J(f-g)U+fglA = //U, et donc /(/-<?)1A = //1a-/^a. De même, f(g-f)U =
fglB-fflB,etdoncf(f-g)lA-f(g-f)lB = fflA-fglA+fflB-fglB = ff-fg
car / = /1A + /1B et g = glA + glB.)
(ii) Si / est sommable, si // = pei9, et si h est définie par / = |/|ez/l p.p., alors
/ I/I-I//I = Re(/ l/l-l//l) = M J\I\ ~Je'Wf)= Mj l/l(l-e*-"))>0,
puisque la fonction Re(|/|(l - eih~w)) est positive. En résumé, \ J f\ < / |/|.
(iii) Si X C Rm est mesurable, et si <j> 6 -èf^R™), alors lx4> G 3?l(Rm) car |lx</>| < |</>|.
On note /x<£, si <f> G -^(R™), l'intégrale /Rm lx<t>.
308
CHAPITRE III. INTÉGRATION
5. Les théorèmes de convergence monotone et de convergence dominée
Soit X un sous-ensemble mesurable de Rm. On dit que <f> : X -» C est mesurable si
la fonction obtenue en prolongeant <f> par 0 à Rm est mesurable. L'ensemble Mes(X) des
fonctions mesurables sur X est donc naturellement un sous-espace de Mes(Rm), et on
définit ^fx(X) comme l'intersection de Mes(X) avec &l(Rm).
L'application (j> —» lx</> est une projection de Jfl(Rm) sur son sous-espace Jèf^X).
Théorème III. 1.30. (de convergence monotone)
(i) Si (/n)n€N est une suite croissante d'éléments de Mes(X,R+), alors la limite est
mesurable et limn_>+00 / fn = / limn^+00 fn.
(ii) Si (wn)n€N est une suite d'éléments de Mes(X,R+), alors la somme de la série est
mesurable et J ^2n€Nun = Sn€N /wn (Fubini pour les fonctions positives sur N x X).
Démonstration. Le (i) est immédiat (compte-tenu du théorème de convergence uniforme
sur Rm, cf. (v) du th. III.1.18). Le (ii) se déduit du (i) en considérant les sommes partielles.
Proposition III. 1.31. (Lemme de Fatou) Si fn 6 Mes(X,R+), alors
/ (liminf fn) ^ liminf / fn.
Démonstration. Soit gn = inî k^nfk- Alors gn est mesurable comme limite simple de
fonctions mesurables, et gn —> liminf fn en croissant, par définition de la limite inférieure.
D'après le théorème de convergence monotone, on a donc / gn—> J liminf/„. Par ailleurs,
/ 9n ^ / fn quel que soit n. On a donc
/ liminf fn = lim gn = liminf / gn < liminf / /n,
ce qu'il fallait démontrer.
Si / G -S^pC), on définit sa (semi)-norme ||/||i par ||/||i = /1/|. Il résulte du (iii) du
th. III.1.18 que l'on a ||/||i = 0 si et seulement si / = 0 p.p. On dit que fk tend vers f
dans J&l(X) (ou que fk tend vers f en moyenne), si \\fk — f\\i —» 0. Comme || ||i est une
semi-norme et pas une norme, la limite d'une suite n'est pas unique ; de fait si fk —» /
dans -Sf^X), alors fk —» g dans J?l(X) pour tout g tel que g — f = 0 p.p.
Il résulte du (ii) de la rem. III.1.29 que | //| ^ ||/||i, et donc que f *-> f f est linéaire
continue (et même 1-lipschitzienne) sur Jèf^X).
Théorème III. 1.32. (de convergence dominée)
Si (/n)n€N est une suite d'éléments Jfl(X) vérifiant :
• il existe g € Jèfx(X) telle que, quel que soit n G N, on a \fn\ < g p.p. (domination),
• fn converge simplement presque partout,
alors la limite presque partout f de la suite (/n)n€N appartient à Jèf^X), et fn tend
vers f dans Sa l(X) ; en particulier limn^+00 / fn = f f.
III. 1. INTÉGRALE DE LEBESGUE
309
Démonstration. f est mesurable comme limite simple p.p. de fonctions mesurables et
sommable car |/| < g p.p. (si An = {x, \fn\ > g}, on a |/| < g, si x <£ A = UneNAn,
et comme An est de mesure nulle pour tout n, il en est de même de A). D'autre part,
quitte à modifier g et les fn sur un ensemble de mesure nulle, on peut supposer que l'on
a \fn\ ^ 9 partout. On a alors \fn — f\ < 2g, et on peut appliquer le lemme de Fatou à
hn = 2g - \fn — f\. Comme hn —> 2g, on obtient
J2g < liminf /^ -\fn-f\=J2g- limsup J \fn - f\,
et comme /2g est fini, on en tire limsup/ \fn — /| < 0, et donc / |/n — /| —> 0, puisque
/ \fn — f\ ^ 0? Quel que soit n G N. Ceci permet de conclure.
Exercice III.1.33. Si n > 1, soient fn = nl[0,i/n) et gn = £l[o,n)- Montrer que fn -> 0 p.p et gn -> 0
p.p., et que f fn = f gn = 1. Peut-on en déduire que 1=0?
Exercice 111.1.31 (*) Montrer que T(s) = /0+o° e_tts_1 dt est fini si s > 0.
(ii) Montrer que lirnn-K» /J1 (l - £)n£s-1 dt —> T(s) quand n —> oo.
(iii) En déduire la formule T(s) = limn-,,» a(s+").!!(s+n) de Gauss.
Exercice III. 1.35. Soit / : R+ —> R+ décroissante et sommable. Montrer que limt_»+00 tf(t) = 0.
Exercice III. 1.36. Soient / € Jèf^R"1) et A„, pour n € N, des sous-ensembles mesurables de Rm.
(i) Montrer que si An est croissante et U„6nA„ = Rm, alors /Rm / = limn-Kx, /A /.
(ii) Montrer que, si A(An) —> 0, alors /A / —* 0. (Utiliser le th. de Borel-Cantelli ou le th. III.2.11.)
6. Premières applications
Le résultat qui suit est très utile pour calculer explicitement des intégrales en
dimension 1 ; le théorème de Fubini dont il sera question plus loin permet de ramener le calcul
d'intégrales en dimension quelconque à une suite d'intégrations en une variable (on n'est
heureusement pas forcé de revenir à la définition !).
Théorème III. 1.37. (Théorème fondamental de l'analyse)
Si f : [a, b] —> C est continue, et si F : [a,b] —> C est dérivable de dérivée f, alors
/M/ = P(*)-F(a).
Démonstration. Par linéarité, en considérant séparément Im(F) et Re(F), on peut se
ramener au cas où F est à valeurs réelles. Si n e N, et si i e {0,1,... ,n}, soit cnj =
a + ^> et soit fn : [a,6[-> R, la fonction valant ^(F(c„(i+i) - F^)) sur [cri,i,crM+i[,
pour tout i e {0,..., n - 1}. Alors f fn = ££? (F^i+i) - F(cn,i)) = F(6) - F(o), pour
tout n. Le théorème des accroissements finis montre qu'il existe un%i 6 [cn^c^i+il tel que
fn(t) = f(un>i), si t e [cn^Cnj+xl, et donc que fn(t) = f(un(t)), avec \t-un(t)\ < *=*. On
en déduit que |/n| ^ ||/||oo pour tout net, f étant continue, que /„ tend simplement vers /
sur [a, b[. On peut donc appliquer le théorème de convergence dominée pour intervertir
310
CHAPITRE III. INTÉGRATION
limite et intégrale, ce qui nous donne J[a6r/ = F(6) — F(a). Le résultat s'en déduit en
remarquant que {6} étant de mesure nulle, on a /, b, f = J. 6, /.
Exercice III. 1.38. Soit / : [a, 6] —» C dérivable. Montrer que /' est mesurable et que, si /' est bornée,
alors jba f = f(b) -f{a).
Théorème III. 1.39. (convergence dominée pour les séries)
Soient I un ensemble dénombrable et (an(i)nGN,i€i des nombres complexes vérifiant :
• il existe (&i)iGi, avec J^m M < +°°> te^e aue \an,i\ ^ &» pour tous n G N et i G I,
• limn^+0O aUyi existe pour tout i G I.
Alors limn_>+oo J^6I an>i = £ieI limn^+00 an>i.
Démonstration. On peut supposer que I = N, et on transforme les séries en intégrales
de fonctions « localement constantes » en associant à une suite (wn)neN, la fonction valant
un sur [n,n+ 1[ et 0 sur R*. L'énoncé se déduit alors du th. III.1.32 (en fait, on peut le
démontrer directement, en se fatiguant un peu, cf. n° 15.3 du Vocabulaire).
III.2. Quelques espaces fonctionnels
1. L'espace L*(X)
Dans tout ce qui suit, X est un sous-ensemble mesurable de Rm.
Théorème III. 2.1. (Fubini sur N x X)
Soit («n)n€N une suite d'éléments de ^fx(X) telle que J2U£N I \un\ < +°°-
(i) La série £)n€N un(t) converge (absolument) p.p.
(ii) Si g = X]n6Nun P-P-> al°r$ 9 e -^PO, et la série de terme général un converge
vers g dans J?l(X) ; en particulier, Jxg = X)neNIxUn-
Démonstration. Soit h(t) = X)neN l^nWI- D'après le théorème de convergence
monotone, on a /xh = XlneN/ K»l> et l'hypothèse implique que Jxh < +oo. La prop. III.1.21
permet d'en conclure que Ai = {t G X, Sn€N \un{t)\ = +00} est de mesure nulle, et
comme Ai est précisément l'ensemble des t G X tels que la série X)neN un(t) ne converge
pas absolument, on en déduit le premier point.
Soit A2 l'ensemble des points tels que g(t) ^ SnGNw«W- Alors A2 est de mesure nulle
par hypothèse, et donc A = Ai U A2 est aussi de mesure nulle comme réunion de deux
ensembles de mesure nulle. Soit S la fonction définie par S(t) = ^2neNun(t), si t £ A, et
S(t) = 0 si t G A. Si N 6 N, soit Sn = Sn<Nw« ^a somme partielle de la série. On a
S = 9 pp., et pour démontrer le second point, il suffit de prouver que S est sommable et
||S - SN||i -> 0. Or |SN(*)| ^ h(t) quels que soient t £ A et N G N, et donc |S(*)| < h(t),
quel que soit t £ A. On en déduit le fait que S est sommable. De plus, |Sn — S| < 2/i
en dehors de A et \S^(t) — S(t)\ —» 0, si t £ A. Comme A est de mesure nulle, on est
III.2. QUELQUES ESPACES FONCTIONNELS
311
dans les conditions d'application du théorème de convergence dominée ; on en déduit que
/ |Sn — S| —» 0, ce qui permet de conclure.
Exercice III.2.2. Soient / G Jèf^R) et T G R+. Montrer que fT(x) = £n€Z/(z + nT) converge
presque partout et que /t est sommable sur [0,T].
Exercice III.2.3. Soit / : R -► R+ définie par f(x) = |z|-1/2, si 0 < \x\ < 1, et f(x) = 0, sinon.
(i) Montrer que / est sommable.
(ii) Soit n ■-» rn une bijection de N sur Q. Montrer que I2n^o(^i)n/(a; - rn) converge absolument
p.p., que la somme F(x) est sommable, et calculer JRF(x)dx. À quoi ressemble le graphe de F?
Corollaire III.2.4- Si (/n)n€N est une suite d'éléments de ^(X) tendant vers f
dans ^(X), on peut extraire de la suite (/n)n€N une sous-suite convergeant p.p. vers f.
Démonstration. Extrayons de (/n)neN une sous-suite (pn)neN telle que ||/—pn||i ^ 2~n,
pour tout n € N. Soit un = gn - pn_i, si n ^ 1, et u0 = g0. Alors XlneN ||wn||i < +oo,
puisque ||wn||i < ||Pn-/||i + ||Pn-i-/||i < 21_n. D'après le th. III.2.1, la série £neNwn(z)
converge presque partout, la limite presque partout g appartient à J£?*(X), et gn = J27=o ui
tend vers g dans Jfl(X). Comme gn—>f dans Jf1(X)1 on en déduit que ||/ — g\\i = 0, ce
qui implique que f = g p.p., et que gn tend vers / p.p., ce qui permet de conclure.
Exercice III.2.5. Si 2k < n< 2fc+1, soit fn la fonction caractéristique de [^^f-, n^\û2 [• Montrer que
/„ —► 0 dans -^([0,1]), mais que fn(x) ne tend vers 0 pour aucun x G [0,1[. Ce résultat n'est-il pas en
contradiction avec le corollaire précédent ?
L'espace J&l(X) muni de la semi-norme || ||i n'est pas séparé puisque deux fonctions
différant d'une fonction nulle p.p. sont à distance nulle. On note LX(X) le séparé de Sa*(X).
Comme ||/||i = 0 si et seulement si / = 0 p.p., L*(X) est le quotient de Sfl(X) par le
sous-espace Npp(X) des fonctions nulles presque partout; on peut donc penser à L*(X)
comme étant l'espace Jfl(X) des fonctions sommables, en considérant comme égales deux
fonctions qui sont égales presque partout (20\
Remarque III.2.6. L'intégrale / i-> // est bien définie sur L*(X) car /(/ — g) = 0 si
f = 9 P-P- De plus, /»->//, qui est linéaire puisqu'elle l'est sur ^fx(X), est continue car
i//k;i/i = ii/iii-
Théorème III.2.7. L'espace L*(X) est un espace de Banach.
(20>Cette représentation mentale de L*(X) est probablement la plus facile d'utilisation ; il faut quand même
faire attention qu'un élément de L*(X) a beau être défini presque partout, il n'a de valeur précise en aucun
point puisqu'on peut modifier arbitrairement sa valeur sur un ensemble de mesure nulle. Autrement dit,
on peut parler de /(#), où x est pensé comme une variable (par exemple pour les changements de variable
dans les intégrales, ou pour définir le produit d'une fonction de L*(X) et d'une fonction bornée), mais
pas de f(x0).
312
CHAPITRE III. INTÉGRATION
Démonstration. On s'est débrouillé pour que || ||i soit une norme sur L*(X); il suffit
donc de prouver que LX(X) est complet, et pour cela, il suffit de vérifier que toute série
normalement convergente est convergente, ce qui est précisément le contenu du th. III.2.1.
2. L'espace L2(X)
Si X est un sous-ensemble mesurable de Rm, on note -èf2(X) l'ensemble des / : X —» C
mesurables et de carré sommable (i.e. telles que /x \f(t)\2dt < +co). Il est immédiat que
j£?2(X) est stable par multiplication par un scalaire, et un peu moins qu'il est stable par
addition, mais cela résulte de l'inégalité \a + b\2 ^ 2|a|2 + 2|6|2, si a, b 6 C dont on déduit
Que /x |/ + g\2 ^ (2 /x |/|2 + 2 /x \g\2), si /, g 6 Mes(X). Autrement dit, ^f2(X) est un
espace vectoriel.
Maintenant, comme \ab\ ^ |(|a|2 + |&|2), si a,b G C, on en déduit que, si fyg G =£f2(X),
alors fg € J?l(X.), ce qui permet de définir (/,#) 6 C par (/,#) = /x/#- L'application
( , ) vérifie toutes les propriétés d'un produit scalaire, sauf celle d'être définie. On a :
(/,/) = o «=>• j |/(()|2 = o <=». / e Npp(X).
Autrement dit, l'application / i-> ||/||2 = (/, f)1^2 définit une semi-norme hilbertienne
sur «if2(X). On note L2(X) l'espace séparé associé; d'après ce qui précède, c'est le
quotient de =êf2(X) par Npp(X). Ceci permet, comme pour L*(X), de penser à L2(X) comme
étant l'espace =£f2(X) des fonctions de carré sommable, en considérant comme égales deux
fonctions qui sont égales presque partout. Comme (/,#) = 0, si / ou g est nulle p.p., la
forme sesquilinéaire ( , ) passe au quotient, et induit un produit scalaire sur L2(X), étant
donné qu'on a fait ce qu'il fallait pour la rendre définie.
Théorème III.2.8. (Fischer-Riesz, 1907) L'espace L2(X), muni de la norme || ||2
définie par ||/||2 = (/x |/|2) , est un espace de Hilbert.
Démonstration. D'après la discussion précédant le théorème, il suffit de prouver que
L2(X) est complet, et pour cela, il suffit de prouver qu'une série normalement convergente
a une limite. La démonstration, très analogue à celle du th. III.2.7, fait l'objet de l'exercice
ci-dessous. La convergence dans L2(X) est dite en moyenne quadratique.
Exercice III.2.9. Soit (un)n€N une suite d'éléments de J£?2(X) telle que X)nGN limita < +oo. et soit
h : X -» R+ définie par h(t) = (£„6N M*)|)2.
(i) Montrer que /x h < +oo. En déduire qu'il existe A c X de mesure nulle tel que, si t € X - A, la
série £n€N un(t) converge absolument.
(ii) On note S(t) la somme de la série X)n€N un(t), si t £ A, et on prolonge S par 0 à A, et, si N € N,
on pose Sn(£) = X^n<Nwn(*)- Montrer que |S - Sn|2 est majoré par 4/i, quel que soit N € N.
(iii) Montrer que S € Jê?2(X) et que SN -» S dans L2(X).
(iv) Montrer que, si fn —» / dans jSf2(X), on peut extraire de la suite (/n)n€N une sous-suite
convergeant p.p. vers /.
III.2. QUELQUES ESPACES FONCTIONNELS
313
3. Convergence dans L1 et L2
Remarque III.2.10. (i) Les espaces LX(X) et L2(X) n'ont a priori rien à voir.
Toutefois, comme ils sont tous deux obtenus en prenant le quotient d'un sous-espace de
Mes(X) par Npp(X), nous commettrons l'abus de notations de désigner par L1(X) + L2(X)
(resp. L1(X)DL2(X)) le quotient de &\X)+5?2{X) (resp. ^fl(X)n^2(X)) par Npp(X).
Autrement dit, nous verrons un élément de L*(X) n L2(X) comme une fonction qui est
à la fois sommable et de carré sommable, à addition près d'une fonction nulle presque
partout.
(ii) Il n'y a d'inclusion dans aucun sens entre L^R"1) et L2(Rm). Par contre, si X est
de mesure finie, alors L2(X) c L*(X). En effet, l'inégalité de Cauchy-Schwarz montre que,
si / est de carré sommable sur X, alors
/ l/l < ( / l),/2( / l/l2)1/2 < +°o-
Jx Jx Jx
En fait, l'inégalité ci-dessus montre que l'inclusion t de L2(X) dans L*(X) est continue, et
que l'on a \\t\\ < \(X)1/2.
Soit X un ouvert de Rm. On rappelle que K(X), ^(X) et ^C°°(X) désignent
respectivement l'espace des fonctions continues (resp. de classe fé*, resp. de classe ^f°°) sur X, dont
le support est compact. Comme une fonction continue, nulle p.p., est identiquement nulle,
la projection naturelle de J£l{X) sur L*(X) induit une injection de chacun des espaces
ci-dessus dans L*(X), ce qui permet de les considérer comme des sous-espaces de L*(X).
Pour la même raison, Esc(X) est, de manière naturelle, un sous-espace de L*(X).
Une fonction générale de L*(X) ou L2(X) étant assez difficile à appréhender (ex. III.2.3),
le très utile résultat suivant permet de démontrer des résultats sur L*(X) ou L2(X) en
commençant par des fonctions simples et en utilisant des arguments de continuité pour
traiter le cas général (cf. th. IV.2.7). Il montre que l'on aurait pu aussi définir L*(X) et
L2(X) comme les complétés de ^(X) (ou de Esc(X)) pour les normes || ||i et || ||2-
Théorème III.2.11. Si X est un ouvert de Rm, et si E est un des espaces Esc(X),
%(X), ^(X), avec k G N, ou ^C°°(X), alors E est dense dans Ll(X) et L2(X). De plus,
si (f> e L*(X) D L2(X), il existe une suite d'éléments de E convergeant vers </>, à la fois
dans L\X) et dans L2(X).
Démonstration. Si Dn est la réunion des dalles élémentaires de taille 2-n incluses dans
X n ([—2n,2n[m), alors X est la réunion croissante des dallages Dn, pour n G N. Soit F
un des espaces LX(X), L2(X) ou Ll(X) H L2(X), et soit </> G F [on munit Ll(X) D L2(X)
de la norme sup(|| ||i, || ||2)J. Si n G N, soit (f>n la fonction valant <f>(x), si x G Dn et
l^nMI ^ n> et valant 0 si x £ Dn ou si \(j>(x)\ > n. Alors <j>n(x) —> <K#) quel que soit
a; e X, et comme \<f>n\ ^ \<f>\ et |</>2| ^ |</>2|, cela implique que (f>n converge vers <j> dans F,
d'après le théorème de convergence dominée. On peut donc, si j G N, trouver rij tel que
110 — ^nJlF ^ 2~J. Maintenant, comme <f>nj est une fonction mesurable bornée à support
314
CHAPITRE III. INTÉGRATION
borné, il existe fj G Esc(Dnj.) tel que \\fj - </>ni||F ^ 2~j. On a donc \\fj - <£||F < 21_J.
On en déduit la densité de Esc(X) dans F, ce qui prouve le théorème pour E = Esc(X).
Le reste s'en déduit en utilisant l'existence de fonctions ^°° sympathiques (cf. exercice
ci-dessous).
Exercice HI.2.12. La fonction <po définie par (po(x) = 0 si x < 0 et (po(x) = e-1/* si x > 0 est une
fonction <é"x> sur R (la dérivée n-ième de v?o sur R* est de la forme e~1/'a;Pn(^), où Pn est un polynôme ;
elle tend donc vers 0 en 0+, ce qui permet de la recoller avec la dérivée n-ième de <po sur R* ).
(i) A partir de <po, construire successivement des fonctions <&co sur R :
• (pi : R —» [0,1], nulle en dehors de [0,1], avec f0 <pi = 1\
• (p2 : R —► [0,1], valant 0 si x < 0 et 1 ; si x ^ 1 ;
• (pe : R —► [0,1], pour e €]0, £[, nulle en dehors de [0,1] et valant 1 sur [e, 1 - e].
(ii) Terminer la démonstration du théorème III.2.11.
Corollaire III.2.13. Si f G LX(X) vérifie [x<pf = 0, pour tout tp e ^C°°(X), alors
/ = o.
Démonstration. Il résulte de la démonstration du th. III.2.11 que, si g G LX(X) est
bornée, on peut trouver une suite (gn)n€N d'éléments de fé^X) tendant vers g dans
LX(X) et vérifiant de plus ||<7n||oo ^ l|p||oo> pour tout n. En outre, quitte à extraire une
sous-suite, on peut s'arranger (cor. III.2.4) pour que gn-^ g p.p.
Ce qui précède s'applique en particulier, si Y C X est un ouvert de mesure finie, à
la fonction py définie par gy(x) = 0, si f(x) = 0 ou x ^ Y, et gy(x) = f(x)/\f(x)\, si
f(x) ^ 0 et x G Y. La suite gnf tend alors vers ly|/| P-P- et est majorée, pour tout n,
par ||<7y||oo l/l = l/l- On est donc sous les conditions d'application du th. de convergence
dominée, ce qui permet de montrer que f gnf —> JY l/l- L'hypothèse fx<pf = 0 pour tout
(p G ^°°(X) entraîne donc /Y |/| = 0, pour tout Y, et donc aussi / |/| = 0 par le théorème
de convergence monotone. Ceci permet de conclure.
4. Comparaison des différents modes de convergence
Soit X un ouvert de Rm, et soient (f>n, pour n G N, et / des fonctions de X dans C.
Nous avons rencontré un certain nombre de notions de convergence de la suite (0n)neN
vers / ; il n'est probablement pas inutile de récapituler les liens qu'ont ces divers modes
de convergence.
• <t>n —*■ f uniformément => </>n —> / simplement => <f>n —> f simplement p.p.
• <f>n —* / simplement p.p. et (</>n)neN est dominée par une fonction sommable (resp. de
carré sommable) => <f>n —► / dans LX(X) (resp. dans L2(X)).
• <t>n —* f dans LX(X) ou L2(X) =*> il existe une sous-suite de (</>n)n€N tendant vers / p.p.
• Si A(X) < +co, alors </>n -> / dans L2(X) => <f>n -> / dans L\X).
Terminons ce n° par ce petit résultat qui sera utile plus tard.
Lemme III.2.14- Soit X un ouvert de Rm.
III.3. INTÉGRALES MULTIPLES
315
(i) Soient </> G LX(X), et g €. ^(X). S'il existe une suite ((j>j)jeN d'éléments de Ll(X)
tendant vers <f> dans L*(X), telle que (f>j{x) —> g(x) p.p. , alors g G L*(X) et g = <f> p.p.
(ii) On a le même résultat en remplaçant L*(X) par L2(X).
Démonstration. La démonstration est exactement la même dans les deux cas. Quitte
à extraire une sous-suite de la suite (<J>j)jeN, on peut supposer (cf. cor. III.2.4 et (iv) de
Pex. III.2.9) que (j>j{x) —> (j>{x) p.p., ce qui permet de conclure.
5. Espaces Lp
Les espaces L*(X) et L2(X) vivent dans une famille LP(X), pour p G [l,+oo], d'espaces de Banach
introduits par F. Riesz en 1910, obtenus comme séparés de sous-espaces Jè?p(X) de Mes(X) (de fait, dans
tous les cas, on passe de Jè?p(X) à LP(X) en quotientant par Npp(X)). Les espaces Jè?p(X) sont définis
comme suit.
• Si 1 ^ p < +oo, on définit Jè?p(X) comme le sous-espace de Mes(X) des / tels que |/|p soit sommable.
L'inégalité de Minkowski (/1/ + g\p)l/p < (/ \f\p)l'p + (/ \g\p)l/p permet de montrer que Jè?*>(X) est un
espace vectoriel et que / •-> ||/||p = (/ \f\p)l^p est une semi-norme sur 3fp(X).
• Si p = +oo, on définit l'espace Sf°°(X) comme le sous-espace de Mes(X) des / qui sont essentiellement
bornées, c'est-à-dire qu'il existe AcXde mesure nulle et M G R+ tels que \f(t)\ ^ M, quel que soit
t G X-A. On note ||/||oo la borne supérieur essentiellede |/|, c'est-à-dire la borne inférieure de l'ensemble
des M G R+, tels qu'il existe A c X de mesure nulle tel que \f(t)\ < M, quel que soit t G X - A. Alors
|| ||oo est une semi-norme sur j£f°°(X).
Si X est un ouvert de Rm, et si p < +oo, les fonctions en escalier sont denses dans LP(X). Ce n'est plus
le cas si p = +oo, l'adhérence des fonctions en escalier étant l'ensemble des fonctions bornées tendant
vers 0 à l'infini.
L'espace L2(X) étant un espace de Hilbert, il est son propre dual d'après le théorème de Riesz. Dans
le cas général, on note q G [l,+oo] l'exposant conjugué de p, défini par 1/p + l/q = 1. L'inégalité de
Hôlder J \fg\ < ||/||p||p||g montre que si g G L9(X), alors / •-> / fg définit une forme linéaire Ag continue
sur LP(X), et que l'on a ||AP|| ^ \\g\\q (le résultat est trivial si p = 1 ou p = +oo). Si p ^ +oo, on peut
montrer qu'en fait g •-> Ag est une isométrie*21) de L9(X) sur le dual de l'espace de Banach LP(X). Par
contre, le dual de L°°(Rm) est nettement plus gros que L1(Rm).
Exercice III.2.15. (i) Montrer que L^X) et L2(X) sont séparables, si X C Rm est mesurable,
(ii) Montrer que L°°(Rm) n'est pas séparable.
III.3. Intégrales multiples
1. Le théorème de Fubini
Une somme finie JV,* aj,fc Peut se calculer en sommant d'abord sur j puis sur k ou en
sommant d'abord sur k puis sur j. Le théorème de Fubini ci-dessous dit qu'il en est de
(21>On remarquera que, si X est de mesure finie, les LP(X) forment une famille décroissante d'espaces de
Banach (on a LP(X) c Lp/(X) si p ^ p'), alors que leurs duaux L9(X) forment une famille croissante.
Autrement dit, plus l'espace fonctionnel est petit, plus son dual est gros, ce qui est un peu étrange quand
on pense au cas des espaces vectoriels de dimension finie, mais conduit à la construction des distributions
pour laquelle L. Schwartz a obtenu la médaille Fields (1950).
316
CHAPITRE III. INTÉGRATION
même pour des intégrales (à condition que tout soit sommable).
Lemme III.3.1. (Fubini pour les fonctions en escalier) L'application f \-^ /Rn /
{resp. f i-* /Rm /) est une application linéaire de Esc(Rn+m) dans Esc(Rm) {resp. Esc(Rn))j
et on a
f I / f\< / l/l et / | / /| < / |/|
/ (/ ')=/ /=/ </ ')•
Démonstration. La linéarité est une conséquence de la linéarité de l'intégrale.
Maintenant, soit r 6 N, et soient j = {j\,... ,jn) G Zn et k = (&i,..., km) 6 Zm. On note (j,k)
l'élément (ji,..., jni k\,..., km) de Zn+m. Un calcul immédiat montre alors que
/ er,a,k) = 2~rner,k,. / er>(j(k) = 2"rmerj,
JR» JR»'
/ ( / ^,a,k)) = 2"m / er,k = 2-'<«+-> = / er,a,k) = / ( / «,.(,«).
JR'» JR» «/Rm JR»+'» JR» 7r»'
Le résultat s'en déduit en décomposant / sous la forme / = X^(j,k)a(j.k)er,(j,k)> P°ur r
assez grand (la somme étant une somme finie).
Proposition III. 3.2. (Fubini dans L1) II existe une unique application linéaire
continue f i-> /Rn / {resp. f ^ /Rm /) de L^R71*™) dans L^R™) {resp. Lx(Rn)) coïncidant
avec l'application du même nom sur Esc(Rn+m), et on a
JB>n JR» jRn+m JRn JR,n
Démonstration. L'application linéaire /Rn : Esc(Rn+m) —> Lx(Rm) est, d'après le
lemme III.3.1, uniformément continue (en fait 1-lipschitzienne) si on munit tous les espaces
de la norme || ||i. Comme Lx(Rm) est complet, et comme Esc(Rn+m) est dense dans
Lx(Rn+m), l'application /Rn : Esc(Rn+m) -> L^R"1) s'étend (de manière unique) par
continuité à L1(Rn+m). De même, /Rm : Esc(Rn+m) -> Lx(Rn) s'étend par continuité à
L1(Rn+m). Enfin, les trois applications
/->/ (/ /). /-/ /. /-/ (/ /)
sont continues sur L^R71"1"771) et coïncident sur Esc(Rn+m). Comme cet espace est dense
dans L1{Kn+m)i elles coïncident sur L^R71"1"™) tout entier. Ceci permet de conclure.
On peut rendre la prop. III.3.2 plus concrète (et plus facilement utilisable pour le calcul
d'intégrales multiples) sous la forme du (i) du théorème suivant.
III.3. INTÉGRALES MULTIPLES
317
Théorème III. 3.3. (Pubini)
(i) Sife^iW1*™), alors
• f{-,y) e -èf^R71), pour presque tout y <E Rm, et y •-► fRn f(x,y)dx G 3fl(Rm),
• f(x, •) <E &l(Rm), pour presque tout x e Rn, et x >-> /Rm f(x,y)dy 6 -Sf^R"),
/ ( / f(x, y) dx) dy = f(x, y) dxdy= ( / f(x, y) dy) dx.
(ii) Si f : Rn+m —> R+ est mesurable, alors les fonctions
V^ I f(x,y)dx et x*-* I f(x,y)dy,
à valeurs dans R+, sont mesurables, et
/ (/ f(x,y)dx)dy= f(x,y)dxdy = (/ f(x,y)dy)dx.
JRm JR» JR»+»» 7R" JR™
Remarque III.3.4- (i) Si X C Rn et Y c Rm sont mesurables, alors Xx Y est mesurable
dans Rn+m, et on a un énoncé analogue à celui ci-dessus, en remplaçant Rn par X, Rm
par Y et Rn+m par X x Y. Il se déduit de celui sur Rn+m en écrivant une intégrale sur
X x Y sous la forme /Rn+m 1xxy</>-
(ii) Dans la pratique, on commence par utiliser le (ii) pour vérifier que |/| est sommable,
avant d'utiliser le (i) pour calculer des intégrales, intervertir les variables...
(iii) Le (i) s'utilise aussi comme un théorème de semi-existence : il affirme que si f(x, y)
est sommable, alors / f(x, y) dx converge pour presque tout y, et / f(x, y) dy converge
pour presque tout x ; par contre on ne peut en déduire la convergence de ces intégrales
pour aucun x ou y particulier.
Démonstration. Soit (/fc)fteN une suite d'éléments de Esc(Rn+m), tendant vers / dans Sa^R™"™),
et telle que £fceN ||/fc+i - /*||i < +oo. Il résulte du lemme III.3.1 que la série £fc€N/R„(/fc+i - /*)
est à termes dans Esc(Rm), converge normalement dans Jêf1(Rm), et que, si on note g € -âf1(Rm), la
limite, alors /Rm g = /R„+„, /• Le problème est donc de montrer que, pour y en dehors d'un ensemble B
de mesure nulle, la fonction x •-» f(x,y) appartient à Jèf1(Rn), et g(y) = JRn f(x,y)dx. Nous aurons
besoin du lemme suivant.
Lemme III.3.5. Si A c Rn+m est de mesure nulle, alors les ensembles Ai et A2 définis par
Ai = {x € Rn, A n ({x} x Rm) n'est pas de mesure nulle,}
A2 = {y 6 Rm, A n (Rn x {y}) n'est pas de mesure nulle,}
sont de mesure nulle dans Rn et Rm respectivement.
Démonstration. Par symétrie (entre n et m), il suffit de le prouver pour Ai. Soit e > 0. Comme
A est de mesure nulle, on peut trouver une suite (Dk)keN de dalles de Rn, et une suite (Efc)fcGN de
dalles de Rm, telles que A c Ufc€NDfc x Efc, et £fc€N À(Difc)À(Efc) < e. Si r € N et j € N, soit Be>rtj
l'ensemble des x € Rn tels que Y^k^j,xeDk A(E*) > 2_r î c'est un dallage de Rn, et on a 2~rX(Betrj) ^
Hfc^j- A(Dfc)À(Efc) < e. De plus, la suite des (Be>rj)^€N est une suite croissante de dallages finis, et donc
A+(Ùi€NBe,rj) = limj^+oo A(Be>r)j) < 2re. Or l'ensemble Br des x G Rn tel que A+(A n ({x} x Rm)) >
318
CHAPITRE III. INTÉGRATION
2~~r est inclus dans U^nïWj, quel que soit e > 0; c'est donc un ensemble de mesure nulle puisque
de mesure extérieure ^ 2re quel que soit e > 0. Enfin, Ai = UrGNBr est de mesure nulle, en tant que
réunion dénombrable d'ensembles de mesures nulles.
Revenons à la démonstration du théorème de Pubini. Comme ^fceN ||A+i — A||i < +oo, il résulte du
th. III.2.1, que la série Ylken fk+i(x>V) ~ fk(x>y) converge absolument vers f(x,y) pour tout (x,y) en
dehors d'un ensemble de mesure nulle A. Par ailleurs, d'après le lemme III.3.5, il existe un sous-ensemble
de mesure nulle Bi de Rm tel que, si y £ Bi, alors An(Rn x {y}) est de mesure nulle dans Rn. Si y £ Bl5
on a donc fk(%>y) —> /(#>î/) pour x en dehors d'un ensemble de mesure nulle.
De même, comme ^eN /R»(/fc+i - fk)dx converge normalement dans Jèf1(Rm) vers </, il existe
B2 C Rm tel que, si y $ B2, alors JRn fk(x, y) dx -> g(y).
Maintenant, en appliquant Fubini pour les fonctions en escalier kuk = |A+i - AI, puis deux fois de
suite le théorème de convergence monotone, on obtient :
^2 / \uk(x,y)\dxdy = J2 / ( / \uk(x>v)\dx)dy
= (E / \uk(x>v)\dx)dy
= / (/ ^2\uk(x,y)\dx)dy.
fcGN
Comme on a fait l'hypothèse que ^eN JR„+m \v>k(x>y)\ dxdy < +oo, l'ensemble B3 des y G Rm tels que
/ru DfceN \uk(x>v)\dx = +oo est de mesure nulle. Si y £ B3, la fonction hy(x) = ^eN \uk(x,y)\ est
donc sommable, et comme fk = Z^=o u^ on a \fa(x> î/)| < hy(x) quel que soit k G N.
Si B = Bi U B2 U B3, et si y £ B, on est dans les conditions d'application du théorème de convergence
dominée, et donc
g{y) = lim / fk(x, y)dx = ( lim fk(x, y)) dx = /(s, y) dx.
Ceci permet de terminer la démonstration du (i).
Le (ii) est une conséquence du (i) sauf si JR„+m f(x,y) dxdy = +00. Mais, dans ce cas, il suffit de
prendre une suite (fk)kew d'éléments de Jèf1(Rn+m) tendant vers / en croissant, de constater que les
trois membres de l'identité dépendent de manière croissante de/, et d'utiliser le théorème de convergence
monotone pour montrer que lim^_>+0o fn**™ fk(x,y) dxdy = +00, et en déduire que les trois membres
sont égaux à +00. Ceci permet de conclure.
Exercice III.3.6. Soit / : R+ x R+ -> R définie par f(x,y) = ex~y si x < y, et /(a;,y) = -ey~x,
si y < x. Calculer
/»+oo /»+oo /»+oo /»+oo
/ (/ f(x,y)dx)dy et / (/ f(x,y)dy)dx.
Jo Jo Jo Jo
Peut-on en déduire que -1 = 1?
Exercice 111.3.1. (i) Soit P € R[X, Y] non nul. Montrer que X = {(x,y) € R2, P(rc,y) = 0} est de
mesure nulle dans R2. (On pourra s'intéresser à /R2 lx-)
(ii) Soit P € R[Xi,..., Xm] non nul. Montrer que {x € Rm, P(x) = 0} est de mesure nulle dans Rm.
III.3. INTÉGRALES MULTIPLES
319
2. La formule du changement de variable
Théorème III. 3.8. (invariance par translation de la mesure de Lebesgue)
Si v G Rm, et si (j> : Rm —> C est mesurable, alors x t-> (j>{x + v) est mesurable, et on a
I \<f>(x + v)\ dx = / \(f>(x)\ dx et, si (f> est sommable, / <j>{x + v) dx = / </>(x) dx.
Démonstration. Notons T„ l'application </> i-> Tv (</>), définie par (Tv (</>)) (x) = (f>(x + v).
Si D est une dalle, et si les coordonnées de v sont des nombres dyadiques, alors D — v =
{x — v, x eD} est encore une dalle, et on a TW(1D) = 1D_V ; on en déduit, en découpant D
et D — v en dalles élémentaires de même taille, que /Tv(1d) = / 1d- Dans le cas général,
on prend une suite (vn)n€w d'éléments de Rm à coordonnées dyadiques tendant vers le
vecteur v de la translation : la suite des 1d-w„ tend simplement vers 1d-v en dehors des
faces, mais celles-ci sont de mesure nulle ((ii) de l'ex. III.1.6, par exemple), ce qui montre
que 1d-v est mesurable en tant que limite simple p.p. de fonctions mesurables, et permet
d'utiliser le théorème de convergence dominée pour en déduire que /Tv(1d) = / 1d-
Par linéarité, on en déduit que Tv(</>) est mesurable et jTv(<j>) = /</>, si (f> 6 Esc(Rm).
Le théorème s'en déduit en utilisant la densité de Esc(Rm) dans L^R"1) (et le théorème
de convergence monotone pour traiter le cas / |</>| = +co).
Soit Cl un ouvert de Rm, et soit (p : fi —» (p(Çl) un difféomorphisme de fi sur un ouvert
(p(ù) de Rm, c'est-à-dire une application bijective de classe <^?1 dont l'inverse est aussi de
classe cé>l. L'application (p s'écrit, en coordonnées
(p(x) = ((pi(xu • • • ,zm),... ,(pm(xu • •. ,zm)),
et la condition « ip est de classe të1 » se traduit par le fait que les dérivées partielles |^
sont continues sur fi. On note Jacv,(a;) = (§^(aO)i<tj<m *a ma^ce jacobienne de / au
point x. On définit le jacobien J^(x) de (p au point x comme le déterminant de Jacv,(a;) ;
le fait que (p soit un difféomorphisme implique que Jac^rr) est inversible, et donc que
J<p(x) ^ 0, pour tout a; G fi.
Théorème III.3.9. Si f est une fonction mesurable sur <p(fi), alors f est sommable
si et seulement si la fonction x *-> f((p(x)) • 3<p(x) est sommable sur fi, et on a
f f(y)dy= f f(V(x))-\3v(x)\dx.
Remarque III.3.10. (i) En dimension 1, la matrice jacobienne de (p n'est autre que
la dérivée ipf de cpy et on tombe sur la formule Lnab[\f(y)dy = Jjo6r f(ip(x))\ip'(x)\dx.
Comme (p' ne s'annule pas sur ]a,6[, il y a deux cas : soit ip' > 0 sur ]a,b[ et alors
(p(]a,b[) =]ip{a),(p(b)[, soit ip' < 0 sur ]a,6[ et (p(]a}b[) =]ip(b),(p(a)[. Dans le premier
cas, la formule devient P/ï f(y)dy = f* f(ip(x))ip'(x)dx, et dans le second, elle devient
320
CHAPITRE III. INTÉGRATION
— jvf® f(y) dy = — Ja f(<p(x))<p'(x) dx ; on retombe donc bien, dans les deux cas, sur la
formule classique.
(ii) Une manière très pratique d'écrire la formule du changement de variable est
d'expliciter formellement les éléments de volume dx et dy sous la forme dx = \dx\ A • • • Adxm\
et dy = \dy\ A • • • A dym\. Comme yi = (pi(x), on a dyi = Y,™=i ^(x)^xj- Comme A
est multilinéaire alternée, on a A™x ( 2/Li ai,j ^xj) = det(oij-) Ajlj dxj (c'est une des
manières de définir le déterminant de m vecteurs), ce qui nous donne
TU r\
dy = \ AZi (J2 -^r(x) dxj) | = |Jv(x) dxi A • • • A dxm\ = |Jv(a?)| dx.
j=i 3
Démonstration. Commençons par regarder ce qui se passe dans le cas O = Rm et y?
affine (i.e. de la forme x i-> A • x + 6, avec A G GLm(R), et b € Rm). Dans ce cas, la
matrice jacobienne de (p est constante égale à A ; on a donc J^rc) = | det A| pour tout x.
Par ailleurs, si r 6 N et si k 6 Zm, alors y(Dr>k) est un translaté de <^(Dr)0) et donc a
même volume. On en déduit l'existence de C(A) G R* tel que À(<p(Dr)k)) = 2~rC(A), quels
que soient r 6 N et k 6 Zm. Par linéarité on a /Rm <j>{x) dx = C(A) /Rm </>(A • x + b) dx,
quel que soit (f> G Esc(Rm). Par continuité, cette égalité s'étend à L^R"1). Pour conclure
dans le cas affine, il reste à vérifier que C(A) = | det A|, ce qui constitue l'interprétation
géométrique du déterminant^22\ et fait l'objet de l'exercice III.3.11 ci-dessous.
On démontre le cas général en utilisant le fait que, plus on regarde de près autour
d'un point rr, plus (p ressemble à l'application affine h i-> (p(x) + Jac^rr) • h, et donc que
quand r tend vers +co, l'image de x + Dr(0 ressemble de plus en plus au parallélépipède
ip{x) + Jac^rc) • Dr,0, dont le volume est |Jv(a;)|A(Dr,o).
De manière plus précise, on démontre, en utilisant la continuité uniforme de x ■-»• Jac^rc) (et de
x i-> Jac^-i (x)), que si K c Cl est compact, il existe une suite de fonctions ex.r : K —> R+, pour r assez
grand, tendant uniformément vers 0 sur K, telle que, quel que soit x € K, on ait
<p(x) + (1 - £K,r(«))Jacv,(a;) • Dr>0 C (p(x + Dr,0) C (p(x) + (1+ £K,r(«))Jacv,(rc) • Dr>0.
On en déduit l'existence de e'Kr, tendant uniformément vers 0 sur K, telle que, quel que soit x € K, on
ait X((p(x 4- Dr>o)) = (1 + eK)r(^))|J¥)(«)|A(a; + Dr)0). Maintenant, on peut écrire Q comme une réunion
croissante de dallages Dn dont l'adhérence est contenue dans Q, et il suffit de prouver que la formule du
théorème est valable pour une fonction en escalier / à support dans un des Dn, car ces fonctions forment
un sous-espace dense dans J? 1(H). Par linéarité, on est ramené à prouver que A(<p(D)) = /D IJ^œ)! dx, si
D est une dalle élémentaire dont l'adhérence K est incluse dans Q. Si r est assez grand, D est la réunion
disjointe des Dr,k contenues dans D, et comme Dr,k = £ +Dr)o, on tire de la discussion ci-dessus l'identité
A(fP(D))= £ A(^+Dr,o))= £ (l+4c,r^
Dr<kCD Z D„kCD Z Z J»
où 0r est la fonction en escalier sur D valant (1 + £Kïr(^7))|J<p(£)|, sur Dr,k- Comme e'Kr, tend
uniformément vers 0 sur K, 0r tend uniformément vers |J<p(a;)| sur D. On en déduit le résultat.
<22>Le volume du parallélépipède supporté par des vecteurs vu ..., vm de Rm est égal à la valeur absolue
du déterminant de ces vecteurs.
III.3. INTÉGRALES MULTIPLES
321
Exercice IU.3.11. (i) Prouver que C(AB) = C(A)C(B), quels que soient A,B G GLm(R).
(ii) Montrer que C(A) = | det A| si A est une matrice diagonale ou une matrice de permutation (i.e. si
x h-> A • x induit une permutation des vecteurs de la base canonique de Rm).
(iii) Montrer que toute matrice unipotente supérieure ou inférieure (i.e. triangulaire avec des 1 sur
la diagonale) peut s'écrire sous la forme DUD_1U_1, avec D diagonale, et U unipotente supérieure ou
inférieure. En déduire que C(A) = 1 si U est unipotente inférieure ou supérieure.
(iv) En utilisant la méthode du pivot, montrer que GLm(R) est engendré par les matrices diagonales,
les unipotentes inférieures et supérieures et les matrices de permutation.
(v) En déduire que C(A) = | det A| quel que soit A G GLm(R).
3. L'intégrale de la gaussienne
Nous allons utiliser les résultats des deux précédents nos pour établir les formules
/+oo />+oo
e-xdx = y/^ et / e-*xdx = l.
•oo J— oo
On passe de la première à la seconde par le changement de variable x = y/ïfu\ il suffit
donc de démontrer la première formule. Pour cela, notons I = f^£ e~x dx l'intégrale à
calculer, et posons Io = /R2 e~(x +y ) dxdy.
• e~(x2+y2ï = e~x2e~y2 et, d'après le théorème de Pubini pour les fonctions positives,
Io = / ( f e-x2e-y2dx} dy= f le~y2 dy = I2.
• Soit A la demi-droite ] — co,0] x {0}, et soit Cl' = R2 — A. Comme A est de mesure
nulle, on a aussi Io = JiV e~^x +y ) dx dy.
• Soit O = R* x] - 7r,7r[. Alors (p défini par (p(r,0) = (r cos0,r sin 9) est un difféomor-
phisme de O sur 0;, et comme dx = cosÔdr-r sin 6 dÔ et dy = sin 0 dr + r cos 9 dO, la
matrice jacobienne de ip est ( j?jj "^jj1/ ), et son jacobien est Jv(r, 9) = r cos2 9 + r sin2 9 = r.
La formule du changement de variable appliquée à f(x, y) =
e-(*2+y2) nous
donne :
Io = / e"(r2 cos2 e+r2 sin2 0) | J„(r, 9) | dr d9 = [ e~r2r dr d9.
• On utilise de nouveau le théorème de Fubini pour les fonctions positives :
Io = / e~r2rdrd9 = f °° ( T e-^rd$) dr = 2ir [ e~r2rdr.
jRlx]-ir,n[ JO W-7T ' JO
• Enfin, le changement de variable r2 = u, et donc rdr = \du, nous donne :
/»+oo
Io = 7T / e~u du = nl-e-%00 = tt.
Jo
Comme Io = I2, cela permet de conclure.
322
CHAPITRE III. INTÉGRATION
4. Exercices
Exercice III.3.12. (Convolution de deux fonctions sommables) Soient f,g G Jèf1(Rm).
(i) Montrer que ff\f{x -y)g(y)\ = \\f\\i\\g\\i-
(ii) En déduire que, pour presque tout x la fonction y *-> f(x — y)g(y) est sommable et que / * g définie
p.p. par / * g(x) = J f(x - y)g{y) dy est elle-aussi sommable.
(iii) Montrer que, si /i = f2 p.p. et gx = g2 p.p., alors fi*gi = f2*g2 PP- (L'application (f,g) <-► f*g
passe donc au quotient et définit une application encore notée (/,<;) »-» f * g de L^R™) x L^R"1)
dans L^R"1).)
(iv) Montrer que (f,g) i-> f * g induit une application bilinéaire continue de L^R™) x L^R"1)
dans L^R™), et que l'on a / * g = g * f et / * (g * h) = (f * g) * /i, si f,g, h G L^R™).
Exercice III.3.13. Soit <f> une fonction <^0° sur Rm, à support dans [-1, l]m, à valeurs dans R+, et
vérifiant /Rm <\> = 1. Si e > 0, soit <£c définie par <j>e{x) = e~m0(f ).
(i) Montrer que /Rm 0e = 1, et que <j>e est à support dans [-e,e]m.
(ii) Montrer que, si / est une fonction en escalier, alors / *<f>e —► f p.p, quand e —► 0.
(iii) Montrer que, si / est une fonction en escalier, alors / * <f>e —► f dans L^R"1), quand e —» 0.
(iv) Montrer que, si / € L^R™), alors /*&-►/ dans L^R™), quand e -> 0.
(v) Montrer que, si / G Lx(Rm) +L2(Rm) vérifie /Rm (f>f = 0, pour tout <f> G "^(R™), alors / = 0 p.p.
Exercice III.3.11 Soient /,g G L2(Rn).
(i) Montrer que \\f*g\\oo < \\fh \\gh-
(ii) Montrer que / * g est continue et tend vers 0 à l'infini. (Commencer par des fonctions en escalier.)
(iii) Montrer que si A et B sont deux sous-ensembles de Rn de mesure strictement positive, alors
l'ensemble A + B des a + 6, pour a G A et 6 € B, contient un ouvert.
(iv) Un fermé d'intérieur vide est-il forcément de mesure nulle ?
Exercice III.3.15. (i) Établir la formule fi fi ^£fa = |C(2).
(ii) Soient Qi = {(u,v), u > 0, v > 0, u + v < f} et Q2 = {(x,y), 0 < x,y < 1}. Montrer que (p
défini par <p(u,v) = (^, fj&£) induit un difféomorphisme de fti sur iï2.
(iii) En déduire la formule C(2) = \.
Exercice III.3.16. Soit N G N - {0}, et soit </? : R2 -► R2 l'application déduite de z •-► zN de C
dans C, en identifiant R2 à C. On rappelle par anticipation (cf. (i) de la rem. V.3.1) que le jacobien de<p
en zq € C est |N^-1|2. Montrer que, si / est sommable sur R2, alors
/ f(u,v)dudv = N [ f(<p(x,y))(x2 + y2f-ldxdy.
Exercice III.3.17. (Volume(23) de la boule unité de Rm)
Soit m > 1. On munit Rm de la norme euclidienne standard || ||. Si p G R+, soit B(p) la boule unité
fermée de centre 0 et de rayon p. On note Cm le volume de B(l).
(i) Montrer que A(B(p)) = Cmpm, si p G R+.
(ii) Soit <j>r = Efc=i(^)1"mlB(^)-B(V)- Montrer que /r- *■ ^ /b(i) M^dx.
(iii) En déduire que /B(1) ||sc||1—"* «te = mCm.
(iv) Montrer que, si 0 G Esc(R+), alors mCm/R <f>{t)dt = /Rm ||rc||1"m0(||a;||)cte. En déduire que
<t> G L!(R+) si et seulement si Ha?!!1-*>*^C||xc||) G L^R™), et quemCm /R+ <f>(t)dt = jRm \\x\\l-m<f>(\\x\\)dx,
quel que soit <f> G L^R+J.
(23)pour n = 3} ie résultat était connu du mathématicien indien Bhaskaracarya, vers 1150.
III.4. CONSTRUCTION DE L'INTÉGRALE DE LEBESGUE
323
(v) Soit s G R. Montrer que J^^ \\x\\s < +00 si et seulement si s > -m et que J^x^x \\x\\3 < +00
si et seulement si s < —m.
(vi) En appliquant ce qui précède à la fonction tm"1e"7rt , et en utilisant la définition de n = C2, en
déduire la valeur de fne~nx dx, et montrer que Cm = pT^pzry.
III.4. Construction de l'intégrale de Lebesgue
Ce § est consacré à la démonstration des th. III. 1.18 et III. 1.23 et de la prop. III. 1.12 sur lesquels repose
toute la théorie. Commençons par remarquer que l'unicité n'a pas été utilisée pour déduire le théorème
de convergence dominée du th. III. 1.18. On en déduit que, si on peut définir l'intégrale, alors le résultat
suivant doit être vrai.
Proposition III.J[.l. Soient D un dallage et M > 0. Soit h G Mes(D,[0,M]) et soit (/in)neN une
suite d'éléments de Esc(D, [0,M]) tendant vers h p.p. Alors J hn a une limite qui ne dépend que de h.
De plus, si ce résultat est vrai, les théorèmes de convergence dominée et de convergence monotone
montrent que l'on doit définir l'intégrale de Lebesgue*24* de la manière suivante.
(Ll) Si / G Mes(D, [0,M]), alors / / G R+ est la limite, quand n —> +00, de J/n, où (/n)neN est
n'importe quelle suite d'éléments de Esc(D, [0,M]) qui converge vers / p.p.
(L2) Si / G Mes(Rm,R+), alors //G R+ est la limite, quand N —> +00, de la suite croissante de
terme général /Dn inf (/, N), où DN est la dalle de sommets (±N,..., ±N).
On en déduit l'unicité d'une application /»->// satisfaisant aux conclusions du th. III.1.18. On est
donc ramené à démontrer la prop. III.4.1, et à vérifier les th. III.1.18 et III.1.23 pour l'intégrale définie
par les propriétés (Ll) et (L2). La démonstration se fait en plusieurs étapes, la plus délicate étant la
démonstration de la prop. III.4.1.
1. Le théorème de convergence dominée pour les fonctions en escalier bornées
Ce n° est consacré à la démonstration de la prop. III.4.1 sous la forme renforcée ci-dessous.
Dans tout ce qui suit, D est un dallage de Rm, et M G R+.
<24>La présentation choisie dans ce texte fait ressembler beaucoup l'intégrale de Lebesgue à celle de
Riemann : on part des fonctions en escalier, on définit l'intégrale d'une fonction mesurable par passage
à la limite, et enfin on définit la notion d'ensemble mesurable et de mesure d'un ensemble. L'approche
originelle de Lebesgue était inverse. Son point de départ était le suivant : pour calculer l'aire d'une surface
sous le graphe d'une fonction d'un intervalle [a, 6] dans R+, on peut soit découper verticalement (ce que
fait Riemann), soit horizontalement (ce que fait Lebesgue). Comme le dit Lebesgue, pour calculer la
quantité d'argent dans un tas contenant des pièces de différentes valeurs, l'intégrale de Riemann consiste
à prendre chaque pièce à son tour et à ajouter sa valeur au total, alors que l'intégrale de Lebesgue consiste
à commencer par trier les pièces et compter combien il y en a de chaque sorte. Évidemment, en découpant
horizontalement, on tombe sur des ensembles nettement plus compliqués que verticalement comme un
petit dessin le prouvera aisément. L'approche originelle de Lebesgue a l'avantage de s'étendre telle quelle à
une théorie de la mesure valable dans un cadre très général (et indispensable en théorie des probabilités).
Celle suivie dans ce texte permet d'éviter certains aspects un peu rébarbatifs de théorie des ensembles.
Elle a l'inconvénient d'être limitée à des espaces ressemblant (au moins localement) àRn.
324
CHAPITRE III. INTÉGRATION
Proposition III.4.2. Soit h G Mes(D, [0,M]) et soit (/in)nGN une suite d'éléments de Esc(D, [0,M])
tendant vers h p.p. Alors f hn a une limite notée f h qui ne dépend que de h et pas du choix de (/in)neisr.
De plus, \h - hn\ G Mes(D, [0,M]), et f \h - hn\ -+ 0.
Remarque III.4.3. (i) Comme / hn ^ 0, pour tout n, on a / A > 0.
(ii) Si hn -> / p.p. et tin -> g p.p., alors hn + tin -> / + g p.p. Il en résulte que / / + g = f f + J5)
si /, g G Mes(D, [0, M]). En particulier, si g ^ /, alors f g = f f + f g - f > f f.
Lemme III.4-4- Si A est de mesure extérieure finie, alors, quel que soite > 0, il existe un ouvert U
contenant A et tel que A+(U) ^ A+(A) + e.
Démonstration. Si D = FIjLi [aj>M est une dalle, on peut, quel que soit rj > 0, trouver un pavé
ouvert P = njLiK'>M contenant D, tel que A+(P) ^ A(D) +rj. Soit alors (Dn)nGN une suite de dalles
élémentaires telle que A C UneNDn, et A+(A) ^ DneN^(Dn) + §• D'après la discussion précédente,
il existe Pn, pavé ouvert contenant Dn, tel que A+(Pn) < A(Dn) + ^rrpr, et U = UneNPn répond aux
exigences du lemme.
Lemme 111.4*5. Si (Xn)nGN est une suite décroissante de dallages telle queC\neiqXn est de mesure
nulle, alors limn_>+oo A(Xn) = 0.
Démonstration. Soit Je? la réunion des hyperplans de la forme X{ = r, pour 1 < K m et r 6 Z[|].
Comme {1,..., m} x Z[|] est dénombrable, Sa est de mesure nulle. Maintenant, si n G N, et si Xn désigne
l'adhérence de Xn, on a Xn C Xn U Je?, et donc
nn<ENXn c nnGN(Xn u JSf) c (nneNxn) u Jèf;
on en déduit que nneNXn est de mesure nulle.
Soit alors e > 0. Comme nneNXn est de mesure nulle, il existe un ouvert Ue contenant nnGNXn, avec
A+(Ue) < e. Soit Fe le complémentaire de Ue dans X0. On a Fe n (nneNXn) = 0, ce qui implique qu'il
existe n0 G N tel que Fen(nn^n0Xn) = 0 car X0 est compact et Fe et les Xn sont fermés dans X0. Comme
la suite (Xn)nGN est décroissante, on en déduit le fait que Fe n Xno = 0, et donc que Xn c Xn C Ue,
quel que soit n ^ no. On a donc prouvé que, quel que soit e > 0, il existe no, tel que A(Xn) < A+(Ue) < e,
si n ^ no- Ceci permet de conclure.
Lemme 111.4*6. Si (/in)neN est une suite décroissante d'éléments de Esc(D, [0,M]), tendant vers 0
presque partout, alors limn_>+00 / hn = 0.
Démonstration. Si e > 0, et si n G N, soit Xnï6 = {x G D, hn(x) ^ e}. Alors (Xnï6)nGN est
une suite décroissante de dallages, et nneNXn,e est de mesure nulle puisque hn tend vers 0 presque
partout. D'après le lemme III.4.5, ceci implique que limn_>+00 A(Xnï6) = 0; et donc qu'il existe n G N
tel que A(Xn+Pï£) ^ e, si p G N. Comme hn+p(x) ^ M, si x G Xn+P,e, et hn+p(x) ^ e, si x £ Xn+P,e,
ona/ /in+p < ^(A(D) + M), quel que soit p G N. Ceci permet de conclure.
Lemme 111.4*7. Si (/in)neN est une suite d'éléments de Esc(D, [0,M]), tendant vers 0 presque
partout, telle que £)nGN / |/in+i - hn\ < +oo, alors limn_>+00 fhn = 0.
Démonstration. Supposons le contraire. Il existe alors C > 0 et une infinité de n G N tels que
f hn ^ C. Quitte à extraire une sous-suite de la suite /in, on peut donc supposer que f hn ^ C quel que
soit n G N (cela ne change pas la condition £]neN / |/in+i - hn\ < +oo car, si (p : N —> N est strictement
croissante, on a |/^(n+i) ~^(n)l < ES^n)"* \hk+i-hk\). Comme la série EnGN / |/in+i-hn\ converge,
on peut, quitte à rempacer n par n + n0, supposer de plus que Ea^n/I^M-i ~ M ^ §• Soit alors
III.4. CONSTRUCTION DE I/INTÉGRALE DE LEBESGUE
325
gn = inffc^n/iA:. Par construction, gn est une suite décroissante d'éléments de Esc(D, [0,M]), qui tend
vers 0 presque partout car gn ^ hn. D'après le lemme III.4.6, cela implique limn_>+00 / gn = 0. Par
ailleurs, on a gn(x) ^ h0(x) - YSZo l^fc+ifaO ~ M^OI (avec égalité si et seulement si la suite (hn(x))ne^
est décroissante). On en déduit que /gn ^ f ho - I]/?=o / l^fc+i ~ M ^ C - §, quel que soit n G N.
D'où une contradiction qui permet de conclure.
Passons à la démonstration de la prop. III.4.2. Si n ^ p, soient
fHiP = inf hk et gntP = sup hk.
n^k^p n^k^p
Alors, quand n est fixé, /n,p (resp. gniP) est une suite décroissante (resp. croissante) d'éléments de
Esc(D, [0,M]), alors que quand p est fixé /n,p (resp. gHiP) est croissante (resp. décroissante). En
particulier, si n est fixé, la suite //n,p (resp. / gniP) est une suite décroissante (resp. croissante) d'éléments
de [0,MÀ(D)] ; elle admet donc une limite et est de Cauchy. On peut donc trouver <po(ri) ^ n tel que,
quels que soient Pi,P2 ^ <A)(^), on ait
\ffnipl-Jfnip2\<2-n et \Jgn^- J9n^\<2-n.
On note an la limite, quand p tend vers +oo de la suite croissante f gn,p - fn#, et on choisit ip : N —> N,
avec (p(n) ^ (po(n), et fun ^ ±an, où un = gnitp(n) ~ /n,<p(n)- Par construction, un G Esc(D, [0,M]),
et un —> 0 p.p. car hn a une limite p.p.
Si n G N, et si p ^ <p(n),
/ \9n+i I < / |pn+llV>(n+l) - 5n+l,p| + / \9n+l,p ~ 9n,p\ + / \9n,p
Maintenant, par hypothèse, on a
/ |pn+l,<p(n+l) - 5n+l,p| + / |Pn,p ~ Pn,<p(n)| < 2~~n~1 + 2"n ^ 21-n,
et comme la suite (gnip)n^p est décroissante, on a |</n+i,p - 5n,p| = 9n# - 5n+i,p- On en déduit, quel que
soit p ^ maxn^N ¥>(ft)> la majoration
N-i r N-i . r
Yl / l5n+l,V(n+l) - 9nMn)\ < ]C t2*"" + / 5n'*> ~ ^+1»p) ^ 4 + / ^0,p " PN,p < 4 + MA(D),
n=QJ n=0 ' ^
la dernière inégalité venant de ce que </0,p - Pn,p € Esc(D, [0, M]). On montre de même que
N-i r
Mn+l) ~ fnMn)\ < 4 + MA(D).
On en déduit que
+OO ç +OO .
S / K " wn+l| < Z! ( / l/n+l,v(n+l) ~ /n,V(n)| + l^n+l.^n+l) ~ 5n,v>(n)|) < 8 + 2MA(D) < +OO,
n=0 ^ n=0 ^
ce qui permet d'utiliser le lemme III.4.7 pour montrer que / un —► 0 et donc que an —► 0. Or on a
an = sup (( / sup hk)-( inf hk)) ^ (sup / hk) - (inf / hk).
On en déduit que les limites inférieure et supérieure de la suite (//in)n€N sont égales et donc que
(/MneN a une limite.
Maintenant, si on part de suites (Zin)neN et (/iJJneN d'éléments de Esc(D, [0,M]) convergeant p.p.
vers h, on peut fabriquer une troisième suite (/i£)n€N d'éléments de Esc(D, [0,M]) convergeant p.p.
326
CHAPITRE III. INTÉGRATION
vers /i, en posant h^ = hn et /i2n+i = hn, si n £ N. L'existence de la limite de f h'^ quand n tend
vers +00 implique l'égalité de limn_>+00 / hn et limn_>+00 / h'n, ce qui prouve que la limite ne dépend que
de h et pas de la suite (/in)neN-
Ce qui précède s'applique à fn = mik>nhk = limp_>+00/n,p et gn = supk>nhk = limp_>+00 gHiP qui
sont des éléments de Mes(D, [0, M]) par construction. On a donc f gn-fn = limp_>+00 / gHiP - fHiP = an,
et an -> 0. Comme par ailleurs, fn<hn^ gn, et fn ^ h ^ gn p.p, ce qui implique \h - hn\ < gn - fn
p.p., on a / \h - hn\ < an, et donc / \h - hn\ -> 0.
Ceci termine la démonstration de la proposition.
2. Mesure et mesure extérieure des ensembles mesurables
Ce n° est consacré à la démonstration du th. III.1.23, selon lequel À(A) = A+(A) pour tout ensemble
mesurable A. Si A est mesurable, et si An = A n [-N, N[m, alors À(A) = limn_>+00 À(AN) par définition.
Par ailleurs, on déduit des (i) et (ii) de la prop. III.1.3, que A+(A) = supNGN A+(AN). Il suffit donc de
prouver que à(An) = A+(An) pour tout N pour prouver que À(A) = A+(A). Autrement dit, on peut
supposer que A est borné.
Dans le reste de ce n°, on fixe un dallage D de Rm, et tous les ensembles considérés sont inclus dans D.
On dit que A c D est dallable s'il existe une suite (Dn)nGN de dalles élémentaires disjointes telles que
A = UnGN Dn ; une telle décomposition de A est une décomposition en dalles élémentaires.
Lemme 111.4*8. Si (An)nGN est une suite de sous-ensembles dallables deD, alors A = UneNAn est
dallable.
Démonstration. Écrivons chaque An comme une réunion disjointe dénombrable de dalles
élémentaires Dnïi, pour i G In. Si x G A, soit D^ la plus grande dalle élémentaire contenant x parmi les Dnïi,
pour n G N et i G In (l'existence de D^ vient de ce que les dalles élémentaires se comportent comme des
billes de mercure). Soit J C UneN({^} x In) l'ensemble des (n,i) tels qu'il existe a; G A avec D^ = Dnj.
Alors A est la réunion disjointe des Dnïi, pour (n,i) G J, et donc A est dallable.
Lemme 111.4*9. (i) Si A c D est dallable, alors A est mesurable et A+(A) = A(A) = £]nGN A(Dn),
pour toute décomposition A = UnGN ^n de A en dalles élémentaires.
(ii) Si A c D, alors A+(A) = inf A(B), où B décrit l'ensemble des ensembles dallables, avec A c B c D.
Démonstration. Si n G N, soit fn = £<<n Idi- Alors (/n)n€N est une suite d'éléments de Esc(D, [0,1])
tendant vers 1a en tout point, et donc / fn = £^n A(D$) tend vers / 1d = A(D), d'après la prop. III.4.2.
On en déduit que A est mesurable et que A(A) = £]nGN A(Dn). Le (ii) s'en déduit en revenant à la
définition de A+(A), et l'égalité A+(A) = A(A) du (i) est alors une conséquence immédiate du (ii).
Lemme III.4.IO. Si f e Mes(D,R+), et si M G R+, alors ff^ MA+({z, f(x) > M}).
Démonstration. Le cas M = 0 étant évident, on se ramène au cas M = 1 en multipliant / par M-1,
et quitte à remplacer / par inf(/,2), on peut supposer / à valeurs dans [0,2]. Soit (/in)neN une suite
d'éléments de Esc(D, [0,2]) tendant vers / p.p. On a /1/ - hn\ -> 0 d'après la prop. III.4.2, et quitte à
extraire une sous-suite de la suite /in, on peut supposer que f\f — hn\ ^ 2"2~n. Soit A = {x, f{x) > 1}
et, si n G N, soit An = {x, hn(x) > 1}. Alors An est un dallage, et il existe B c A de mesure nulle
tel que A - B c Un^NAn pour tout N G N. Comme Un^NAn est dallable (lemme III.4.8), le (ii) du
lemme III.4.9 nous fournit la minoration A(Un^NAn) ^ A+(A - B) = A+(A), pour tout N G N, et comme
suPn^N hn ^ lun>NA«> on a aussi /suPn^N ^n ^ A+(A), pour tOUt N G N.
III.4. CONSTRUCTION DE L'INTÉGRALE DE LEBESGUE
327
Par ailleurs, il résulte de la prop. III.4.2 que /supn^N/in est la limite de fsupk^n^Nhn quand
k —> +00, et comme
SUp hn^hN + \hN^l-hN\ + '" + \hk-hk^l\et / |/ln+1 - hn\ < / |/ln+1 - h\ + / \h -hn\ ^ 2"^,
k^n^N J J J
on obtient /supn^N/in ^ 2~~N + //in, et donc A+(A) ^ 2~N + //in, pour tout N. Enfin, comme
//in —> //, un passage à la limite fournit la minoration A+(A) < // voulue, ce qui permet de conclure.
Revenons à la démonstration du th. III. 1.23. Si B est un ensemble dallable contenant A, on a
À(A) ^ À(B) puisque 1a < 1b- En prenant la borne inférieure sur tous les B dallables contenant A,
on obtient À(A) ^ A+(A), d'après le (ii) du lemme III.4.9.
L'inégalité A+(A) ^ A(A) s'obtient en appliquant le lemme III.4.10 à / = (1 + é)1a et M = 1, et en
faisant tendre e vers 0.
Ceci permet de conclure.
3. Le théorème de convergence monotone pour les fonctions bornées à support compact
Lemme 111.4*11- Si (/in)neN est une suite d'éléments de Mes(Rm,R+) tendant simplement p.p.
vers h, et si J hn —> 0, alors h = 0 p.p.
Démonstration. h est la limite p.p. de toute suite extraite de la suite (/in)nGN, ce qui permet, quitte
à extraire une sous-suite, de supposer que l'on a / hn ^ 2""n quel que soit n G N. Pour montrer que
h = 0 p.p., il suffit de montrer que, quel que soit j G N, l'ensemble X^ des x tels que h(x) > 2~~j est
de mesure nulle. Il résulte du lemme III.4.10 que A+({z, hn(x) > 2^}) < 2j J'hn ^ 2^n. Comme
Y^2i~n < +oo, l'ensemble des x tels que hn(x) > 2~~Jf pour une infinité de n G N est de mesure nulle
d'après le théorème de Borel-Cantelli, et comme X^- est inclus dans cet ensemble (à l'ensemble près des x
tels que hn{x) /> h(x), qui est de mesure nulle), cela permet de conclure.
Lemme III.4.12. Si (pn)neN est une suite d'éléments de Esc(Rm), telle que X^nGN/l0n| < +00,
alors la série X^nGN^(^) converge absolument p.p.
Démonstration. Soit C = J2nevif\9n\- Si M G R+, soit XM,n l'ensemble des x G Rm tel que
J2k^n 10*0*01 ^ M. Alors Xm,ti est une suite croissante de dallages, et on a
MA(XM,n) < f £ \gh\ < f £ M = E / l»l < C>
J*M.nk^n J k^n k^nJ
quel que soit n G N. On en déduit que A+(UnGNXM,n) < M_1C, et comme l'ensemble A des a; G Rm tels
que X^ign I#n0*0l = +00 est l'intersection des Xm,ti> pour M G R+, on a A+(A) ^ M_1C quel que soit
M G R+. Ceci implique que A est de mesure nulle, et permet de conclure.
Lemme 111.4*13. Si (hk)kew est une suite croissante d'éléments de Mes(D, [0,M]), alors la limite
h de la suite (/ifc)fceN est mesurable, et f h = \imfhk = sup f hk.
Démonstration. La suite / hk est croissante et majorée par MA(D) ; elle admet donc une limite £ finie,
et, quitte à extraire une sous-suite, on peut supposer que l - f hk ^ 2"ki quel que soit k G N.
Maintenant, comme hk est supposée mesurable, il existe une suite de fonctions en escalier fkte tendant
vers hk p.p. Comme hk est à support dans D et à valeurs dans [0, M], on peut, quitte à remplacer fkie par
la fonction valant 0 si x £ D, ou si Re(fkte(x)) ^ 0, valant Re(fkie(x)) si Re(fkte(x)) G [0,M] et a; G D,
et valant M si Re(fkie(x)) ^ M et x G D, supposer que fkj G Esc(D, [0,M]). D'après la prop. III.4.2,
328
CHAPITRE III. INTÉGRATION
lim£_>+00 / \hk - fkA = 0 ; il existe donc £(k) tel que, si on pose fh = A,£W, alors / \fh - hk\ ^ 2'k. On
a donc
et comme £]feGN3 • 2~~k < +00, le lemme III.4.12 montre que fk(x) a une limite simple f{x) p.p. La
fonction / est alors mesurable comme limite simple p.p. de fonctions en escalier, et / fk —> / / d'après la
prop. III.4.2. Comme / fk et / hk ont même limite, il suffit, pour terminer la démonstration, de prouver
que / = h p.p. Or / - h est la limite p.p. de fk - hk et / \fk - hk\ -> 0 par construction, ce qui permet
d'utiliser le lemme III.4.11 pour conclure.
4. Limites simples p.p. de fonctions mesurables
Le but de ce n°est de démontrer la prop. III. 1.12 selon laquelle une limite simple p.p. de fonctions
mesurables est mesurable. Comme / : Rm —> C est mesurable si et seulement si les fonctions Re+(/),
Re+(-/), Re+(i/) et Re+(-z/) sont mesurables, et comme une fonction positive est mesurable si et
seulement si elle est limite simple p.p. de fonctions en escalier positives, on peut supposer que toutes les
fonctions considérées sont positives.
Lemme 111.4*14- Soit f une fonction positive sur Rm, et si j G N, soit Dj le dallage de sommets
(±2*,..., ±2>).
(i) Si Idj/ est mesurable pour tout j G N, alors f est mesurable.
(ii) Si Idj inf (/, N) est mesurable pour tous j, N G N, alors f est mesurable.
Démonstration. (i) Soit (fj,k)kevi> si j G N, une suite de fonctions en escalier tendant vers ln.f p.p.
Soit gk la fonction en escalier, nulle en dehors de D& et égale à fak sur D, - Dj-i, si j ^ k. On a donc
gk(x) = fj ic(x) si a; G D^ — D^_i et k > j, ce qui permet de prouver que gk tend vers / p.p. On en déduit
le (i).
(ii) Pour démontrer le (ii), compte tenu du (i), on peut supposer que/ est à support dans D,, et donc
que Idj. inf(/,N) = inf(/,N). Soit (/N,&)fceN> si N G N, une suite de fonctions en escalier tendant vers
inf(/,N) p.p. Soit gk la fonction en escalier valant /i,* si fÏ9k < 1, /2,& si /i,/t = 1 et /2,fc < 2, fs^ si
fhk = 1> /2,fc = 2 et f^k < 3, ..., et valant k si fiik = i quel que soit i ^ k. Soit An l'ensemble des points
tels que /n,* ne tende pas vers inf(/, N), et soit A = UngnAn- Alors A est un ensemble de mesure nulle
comme réunion dénombrable d'ensembles de mesure nulle, et si x £ A, on a gk{x) = /i,fc(a;), si k est assez
grand et f(x) e]i - l,t[, et gk(x) G {/*,*(»),/<-i,fc(»)}> si k est assez grand et f(x) = i. On en déduit
que gk(x) tend vers f(x) si x £ A, ce qui permet de conclure.
Passons à la démonstration de la prop. III.1.12. Soit donc (fa) une suite de fonctions mesurables
positives ayant une limite <\> p.p. Pour montrer que <j> est mesurable, il suffit, d'après le lemme III.4.14,
de montrer que Id, (sup(</>, N)) est mesurable, quels que soient j,N G N. Comme 1dj(sup(^,N)) est la
limite p.p. de lDi(sup(^A;,N)), on peut supposer que </> et les fa sont à support dans D, et à valeurs
dans [0,N].
Or on a démontré (lemme III.4.13) qu'une suite croissante d'éléments hn de Mes(D^-, [0, N]) est
mesurable ; il en est de même pour une suite décroissante comme on le voit en remplaçant hn par N - hn.
Comme fa —> <\> p.p., </> est aussi la limite inférieure de fa et donc est mesurable en tant que limite p.p.
de la suite croissante gk = inf^ </>£, où chaque gk est mesurable comme limite de la suite décroissante
gkn = inffc<-£<jn</>£. Ceci permet de conclure.
III.4. CONSTRUCTION DE I/INTÉGRALE DE LEBESGUE
329
5. Le théorème de convergence monotone et ses conséquences
Théorème 111.4*15. Si (/n)neN est une suite croissante de fonctions mesurables positives surHm,
alors limn_>+00 / fn = f limn_>+00 fn.
Démonstration. Notons / la limite de la suite fn ; c'est un élément de Mes(Rm, R+). Si n, N G N, soit
an,N = Jdn inf (/n, N). Par définition, ona//n = limN_>+00 an,N, et donc Jfn = supNGN an,N puisque la
suite est croissante. Par ailleurs, comme fn —> / p.p., cela implique que inf (/n, N) —> inf (/, N) p.p. sur Dn,
et comme la suite inf(/n,N) est croissante, il résulte du lemme IIL4.13 que /D inf(/,N) = supnGNanïN-
On a donc
/ / = sup (sup an,N) = sup an,N = sup(sup an,N) = sup / /n,
J NGN nGN (n.N)GNxN nGN NGN nGN J
et comme la suite (J/n)nGN est croissante, on a aussi supnGN f fn = limn^+ooj/n, ce qui permet de
conclure.
On peut maintenant prouver que l'intégrale que l'on a construite satisfait les propriété (i)-(v) du
th. III.1.18, ce qui terminera la preuve de l'existence de l'intégrale de Lebesgue.
• On vient de prouver la propriété (v).
• La (i) est incluse dans la construction.
• Si f,g G Mes(Rm,R+), alors
inf(/ + </, N) < inf(/, N) + inf(p, N) < inf(/ + </, 2N),
et donc
lDNinf(/ + </, N) ^ 1Dn inf(/, N) + 1Dn inffo, N) ^ 1D2N inf(/ + </, 2N).
On en déduit, en faisant tendre N vers +oo, et en utilisant le théorème de convergence monotone, les
inégalités /(/ + g)<ff + fg< /(/ + g), ce qui prouve que /(/ + g) = / / + / g. Par récurrence, on en
déduit que fnf = n//, si n G N, puis Jaf = a//, si a G Q+, et finalement, en utilisant la croissance
de a h-> /a/, que Jaf = a//, si a G R+. On en déduit la linéarité de l'intégration (propriété (ii)).
• On sait que, si le théorème de convergence monotone (propriété (v) démontrée ci-dessus) est vérifié,
alors la propriété (iii) est un cas particulier du th. III. 1.23 (cf. cor. III. 1.22), démontré au if 2.
• On a remarqué (cf. (ii) de la rem. III. 1.19) que la (iv) pouvait se déduire des (ii) et (iii).
Ceci permet de conclure.
CHAPITRE IV
TRANSFORMÉE DE FOURIER
La représentation d'une fonction périodique comme somme d'une série de Fourier est
un outil très efficace pour la résolution de certaines équations aux dérivées partielles (la
transformée de Fourier et cette représentation des fonctions périodiques ont d'ailleurs été
introduites par Fourier en 1811 dans un mémoire consacré à l'équation de la chaleur). La
formule d'inversion de Fourier (démontrée par Cauchy (1815) et Poisson (1816) dans des
mémoires consacrés à l'équation de Laplace), qui permet d'écrire une fonction raisonnable
sur Rm comme somme continue de caractères linéaires unitaires M continus, rend le même
genre de services pour des équations aux dérivées partielles sur Rm. Cette « boite à
outils » de Fourier s'adapte à tout groupe commutatif localement compact : il s'agit de
décomposer une fonction sur un tel groupe comme une « somme » de caractères ^. Nous
l'avons déjà rencontrée dans le cadre des groupes finis (n° 5 du § 1.2) ; les séries de Fourier
correspondent au groupe R/Z ; nous la rencontrerons de nouveau pour R* (sous le nom
de transformée de Mellin, cf. rem. VII.2.5), pour Qp et pour le groupe des adèles de Q
(cf. n°2du§G.2).
IV. 1. Intégrales dépendant d'un paramètre
De nombreuses fonctions sont définies comme intégrales de fonctions plus simples^, et
le théorème de convergence dominée permet, bien souvent, de démontrer leur continuité
et leur dérivabilité.
Théorème IV. 1.1. (Continuité d'une intégrale dépendant d'un paramètre) Soit X
un espace métrique, et soit x0 € X. Soit f : X x Rm —> C vérifiant :
• la fonction t *-* /(rr, t) est mesurable, quel que soit x eX;
^Un caractère linéaire de Rm est une fonction x '■ R-m -* C* vérifiant x(x + v) = xix)x{y)i quels que
soient x,y € Rm ; un tel caractère est unitaire si 1x0*01 = 1» quel que soit x € Rm.
(2*En probabilité, la transformée de Fourier est connue sous le nom de fonction caractéristique.
(3)C'est par exemple le cas de la fonction T d'Euler définie par T(s) = L e~H3^, ou de la transformée
de Fourier / d'une fonction sommable / définie (en une variable) par f(x) = fRe~2tirxtf(t)dt.
332
CHAPITRE IV. TRANSFORMÉE DE FOURIER
• pour presque tout t G Rm, la fonction x i-> f(x, t) est continue en xq ;
• il existe h G 3flÇRm) tel que, quel que soit x G X, on ait \f{x,t)\ ^ h(t) p.p.
Alors, si x eX, l'intégrale /Rm f(x, t) dt est bien définie et la fonction F : X —> G définie
par F(x) = /Rm f(x,t) dt est continue en x0.
Démonstration. La fonction t i-> f(x, t) appartient à JS?1, quel que soit a; € X, puisqu'on
l'a supposée mesurable et majorée en module par un élément de J?l(Rm). La fonction
F est donc bien définie. Pour montrer que F est continue en xq, il suffit (car X est un
espace métrique) de prouver que pour toute suite (yn)n£N convergeant vers Xq, la suite
(F(yn))n€N ten(* vers F(#o), c'est-à-dire
lim f f(ynyt)dt= f f(x0,t)dt.
Posons gn(t) = f(yn,t), et #(0 = 9(xo,t). On a alors
• limn_>+00gn(0 = 9(t) pp., car x i-> f(x,t) est continue en xq, pour presque tout t;
• l#n(OI ^ MO P-P- et ^ est sommable (et indépendante de n).
On est donc dans les conditions d'application du théorème de convergence dominée, et
limn^+0O /Rm gn(t) dt = /Rm g(t) dt, ce qui permet de conclure.
Théorème IV. 1.2. (de dérivation sous le signe somme) Soient I un intervalle de R
et f : I x Rm —► C vérifiant :
• 1i-> /(x, 0 e$£ sommable, quel que soit x el;
• il existe un ensemble de mesure nulle A C Rm et h : Rm —* R+ sommable, tels que
%{x, t) existe en tout point de Rm - A et \%(x, 01 ^ MO» Powr *0W5 (4) a; G I e£ £ $É A.
i4/ors /a fonction F définie sur I par F(rr) = /Rm /(a;, 0 dt est dérivable et, quel que soit
x el, on a
w-Lï™*-
Démonstration. Quitte à remplacer / par la fonction valant f(x, t), si t£ A, et valant 0,
si t G A, ce qui ne change pas la valeur des intégrales, on peut supposer que A = 0.
Fixons xGl. Soit (a:n)nGN une suite d'éléments de I — {x} tendant vers x quand n tend
vers +00. Soit g(t) = %{x,t), et si n G N, soit gn(t) = î{Xn^~Jx(x,t) • Alors gn tend vers g
simplement, et d'après le théorème des accroissement finis, on a
|pn(0K sup \?f(x + 0(xn-x),t)\^h(t)}
O<0<1
*dx
(4*La dérivabilité étant une propriété locale, pour démontrer la dérivabilité sur un intervalle I, il suffit
de la démontrer sur une suite d'intervalles dont la réunion est I. En d'autre termes, on n'a pas vraiment
besoin d'une majoration sur I tout entier, mais sur une suite d'intervalles dont la réunion est I. Cette
remarque s'applique aussi au cor. IV.1.3 pour lequel on peut aussi commencer par diminuera.
IV. 1. INTÉGRALES DÉPENDANT D'UN PARAMÈTRE
333
quel que soit t G Rm. On est donc dans les conditions d'application du théorème de
convergence dominée, et rimn_>+0O /Rm gn = JRm g. Autrement dit, on a
n—+oo xn — X yRm OX
pour toute suite (a;n)n€N d'éléments de I — {x} tendant vers x quand n tend vers +oo.
On en déduit le résultat.
Si *=(4,..., in) €N», on pose \£\ = e1 + ---+4, et ^ = (^ • • • (^)fc'1.
Corollaire IV. 1.3. Soient fi un ouvert de Rn, k G N et f : fi x Rm —> C vérifiant :
• t •-» /(#, £) est sommable, quel que soit x G fi ;
• e/ ernste «n ensemble de mesure nulle A C Rm et h : Rm —» R+ sommable, tels que,
$it£ Rm — A, la fonction x i-> f(x, t) est de classe tfk sur fi, et \def(xi t)\ < h(t), quels
que soient x G fi, £ G Nn, avec |l| < /c, et t £ A.
Alors la fonction F définie sur fi par F(;c) = /Rm /(x, t) dt est de classe *€k et, quels
que soient £ G Nn, avec \£\ < k, et x G fi, on a
ôeF(x)= / d*-f{x,t)dt.
Démonstration. Cela se déduit du théorème de dérivation sous le signe somme par une
récurrence immédiate.
Exercice IV. 1.4- Soit I =]0,1[, et soit / : I x R —► R définie par f(x, t) = 0 si t ^ 0 ou si t ^ x, et
/(#,£) = 1 si 0 < t < x. Calculer explicitement F(x) = fRf(x,t)dt et F'(x). Peut-on en déduire 1 = 0?
Exercice IV. 1.5. (Fonction F d'Euler)
(i) Montrer que l'intégrale F(s) = /0+°°e-^sf est bien définie si s € R+.
(ii) Montrer que F est de classe <&oa sur R+ et tend vers +oo en s = 0.
(iii) Montrer que F(s + 1) = sF(s) si s > 0 ; en déduire que F(n + 1) = n!, si n G N.
(iv) Formule de Stirling (1730) : montrer que F(s + 1) ~ (f)s\/27rs au voisinage de +oo. Faire le
changement de variable t = s + Uy/s (méthode de Laplace), et montrer que
/-. i m , u\^f~îT si-y/s<u^0,
-uy/s + slog(l + —f) < < z
Vs [-u + log(l+u) siu^Oets^sl.
(v) En déduire la formule de Gauss : ^ = limn^+00 *<*+1>fc.(*+n), si s € R;.
Exercice IV.1.6. Soit B(s, t) = f* xa~l(l - x)*-ldx. Montrer que B(s, t) = rrffiffi, si s > 0 et t > 0.
(On écrira F(s + t)B(s, t) comme une intégrale double.)
Exercice IV.1.7. Soient / G ^(R™) et g € ^cfc(Rm), où A; € N U {oo}. Montrer que la convolée
x*-* f* g(x) = f f(x - y)g(y) dy est de classe tf* sur Rm.
Exercice IV. 1.8. (i) Montrer que l'intégrale /0+o° ^f1 dt est semi-convergente (c'est-à-dire que ^ est
sommable sur [0,T], pour tout T, et que /0 ^ dt a une limite quand T —» +oo).
(ii) Si A >0, soit F(A) = /0+o° e-At^ dt. Montrer que F est de classe «T1 sur R* et calculer F'(A).
(iii) Montrer que F tend vers 0 en +oo ; en déduire F(A), pour A > 0.
334
CHAPITRE IV. TRANSFORMÉE DE FOURIER
(iv) Montrer que F est continue en 0 ; en déduire la valeur de J0+o° ^ dt.
Exercice IV. 1.9. (Fonction de Bessel) Soit u e C.
(i) Montrer que y -> K„(y) = ± /0+o° c-v(*+*_1)/2^ f est tf°° sur R* .
(ii) Montrer que K„(y) ~ \/Ye~y au voisinage dey = +oo. (On pourra couper l'intégrale en 1 pour
se ramener à une intégrale sur [1, +oo[, et faire le changement de variable t = 1 + -3=.)
IV.2. Transformée de Fourier dans L1
1. Caractères linéaires de R et Rm
Si x = (#1,... ,xm) et t = (ti,... ,tn) sont deux éléments de Rm, on note x • t leur
produit scalaire YX=\ x& ', on a,x-t = t-x. Rappelons que, si A G Mm(R), on note fcA la
matrice transposée de A. On a alors lAx -t = x-At pour tous x,t G Rm.
Proposition IV.2.1. (i) Les caractères linéaires continus de R sont les 11-> ext, pour
A G C, et les caractères linéaires unitaires continus sont les t i-> e2twxt, pour a; G R.
(ii) Les caractères linéaires unitaires continus de Rm sont les t >-> e2inxt, pour x G Rm.
Démonstration. Soit x : R —* C* un caractère linéaire continu. On a en particulier
x(0) = 1, et la continuité implique l'existence de ,;' G N tel que \x(t) — 1| < |, si \t\ < 2~K
Notons log : C* —> {x + iy, — tt < y ^ tt} le logarithme complexe. Comme B(l, |) est
incluse dans le secteur angulaire |arg(2)| < J, l'application g = logox : B(l, \) —» C est à
valeur dans la bande {x + iy, \y\ < J}. Maintenant, \og(ziZ2) — logZ\ — logz2 G 2«7r, pour
tous zi,z2 G C*, et comme x(*i + £2) = x(^i)x(^), on a g(h +12) = g(ti) + g(t2) si tu
t2 et ti +12 appartiennent à B(l, |). On en déduit, par récurrence sur n, que g(2~j~n) =
2~ng(2~j), pour tout n G N, et, par récurrence sur k, que g(k2~j~n) = kg(2~j~n)i si
k G {—2n,.. ,,2n}. On a donc p(r2~J) = rp(2~J), si r est un nombre dyadique dans
l'intervalle [—1,1], et comme g est continue, on en déduit que g(t) = Xt, avec À = 2Jp(2~J),
pour tout t G [—2~J, 2~J]. Par définition de g, cela implique que xM = eXt Pour tout
t G [-2-J',2-J]. Enfin, si t G R, il existe n G N tel que t/n G [-2"*, 2"'], et comme
x(t) = x(t/n)n> on a X(t) = ext pour tout t G R.
Maintenant, si x est unitaire, on doit avoir Xt G zR, pour tout t G R, et il existe donc
a; G R tel que A = 2inx. On en déduit le (i).
Si x : R-m ~~* C* est un caractère linéaire unitaire continu, alors sa restriction à
Redéfinit un caractère linéaire unitaire continu de R, pour tout j G {1,..., m}. Il existe donc
Xj G R tel que xfee,) = e2i™^. Or t = £™=1 tfy et donc xW = EÇLi x(^) = e2i™*,
avec x = (xi,... ,xm). Ceci permet de conclure.
2. Définition et premières propriétés
Si / G ^{BT1), on a \e~2ilt xt f {t)\ = |/(*)| quels que soient x,t G Rm; l'intégrale
/Rme~2iirxtf(t)dt est donc bien définie pour toute valeur de a; G Rm.
IV.2. TRANSFORMÉE DE FOURIER DANS L1
335
On appelle transformée de Fourier de / la fonction / définie, pour x G Rm, par
f(x) = f e-*"x4f(t)dt.
Elle ne dépend que de la classe de / dans L^R"1), ce qui permet de définir la transformée
de Fourier d'un élément de L^R"1) par la même formule. On note souvent, pour des
raisons typographiques, &f au lieu de /, la transformée de Fourier de /, et on définit
~Wf par Wf(x) = f{-x).
Exemple IV.2.2. La transformée de Fourier de l[=i,i[ est a(x) = ^^Jjp, comme le
montre un calcul immédiat.
Soit / G L*(Rm). Des changements de variable immédiats montrent que :
• <^(f(at))(x) = \a\~mf(a~lx), si a G R* ; la transformée de Fourier tranforme une
dilatation en dilatation de rapport inverse ;
• &(f(t + b))(x) = e^bxf{x) et &(e2™ctf{t)){x) = f(x - c), si b,c G Rm; la
transformée de Fourier échange les translations et les multiplications par un caractère.
Exercice IV.2.3. Montrer plus généralement que, si / € L1(Rm), si A € GLm(R), si 6,c € Rm, et si
g(t) = e2i*ctf(At + 6), alors g(x) = \detA\-le2intA'1^x-c>bf(tA-l(x - c)).
Exercice IV.2.4- Soit / une fonction continue bornée et sommable sur R, et soit xq G R. Montrer
que, quand A tend vers 0+, la fonction
/+oo
e2i«x°y-xMf(y)dy
-oo
tend vers une limite que l'on calculera. En déduire que si / est identiquement nulle, alors / est
identiquement nulle.
Exercice IV.2.5. Soit / € L^R). Montrer que limT^+0o T-1 /JT \f(x)\2 dx = 0.
3. Le théorème de Riemann-Lebesgue
On rappelle que %(Rm) désigne l'espace des fonctions continues sur Rm, tendant vers 0
à l'infini.
Proposition IV. 2.6. (i) Si r G N, et si k 6 Zm, alors
m
Cr,k(aO = 2"rm JJ (e-2l"ri7r(^+^^o;(2-%)).
3=1
(ii) Si f est une fonction en escalier, alors f G %(Rm).
Démonstration. Le (i) est une conséquence de la formule
m j
enkW^Il1!^2^-^-^'
336
CHAPITRE IV. TRANSFORMÉE DE FOURIER
de la formule de l'exemple IV.2.2, et des formules pour les dilatations-translations. Le (ii)
est une conséquence du (i), de ce que les er>k forment une famille génératrice de Esc(Rm),
et de ce que a est une fonction continue sur R, tendant vers 0 à l'infini.
Théorème IV.2.7. (Riemann-Lebesgue) L'application f t-> / est une application
linéaire 1-lipschtzienne de L^R"1) dans féo(Rm). Autrement dit, si f £ L^R"1), alors f
est une fonction continue sur Rm, tendant vers 0 à l'infini, et on a ||/||oo ^ ||/||i-
Démonstration. La linéarité de / t-> / résulte de la linéarité de l'intégration, et
l'inégalité ll/lloo ^ ||/||i résulte de la majoration
\f e-*"V(t)<ft|< / |e-*"V(«)|<tt= f l/WI*=ll/lli-
JKm ./R'» JR™
Maintenant, si / est une fonction en escalier, la prop. IV.2.6, montre que / G %(Rm).
Comme les fonctions en escalier sont denses dans L^R"1), comme / t-> / est linéaire
continue de L^R"1) dans l'espace <^(Rm) des fonctions bornées sur Rm (muni de la
norme || ||oo) dans lequel féo(Rm) est fermé, on en déduit que / 6 féo(Rm) quel que
soit / e L^R"1) [on peut rendre cet argument moins abstrait en considérant une suite
/„ de fonctions en escalier tendant vers / dans L^R"1); alors /„ —* / uniformément,
et on conclut en utilisant le fait qu'une limite uniforme de fonctions continues tendant
vers 0 à l'infini est encore une fonction continue tendant vers 0 à l'infini (cf. ex. 16.4 du
Vocabulaire)]. Ceci permet de conclure.
4. Transformée de Fourier et dérivation
Une des propriétés fondamentales de la transformée de Fourier est d'échanger la
régularité et la décroissance à l'infini (i.e. plus une fonction est régulière, plus sa transformée de
Fourier est petite à l'infini, et réciproquement, plus une fonction est petite à l'infinie et plus
sa transformée de Fourier est régulière), ainsi que dérivations et multiplications par des
polynômes, ce qui, combiné avec la formule d'inversion de Fourier (prop. IV.3.25), facilite
grandement l'étude de certaines équations aux dérivées partielles ^. On a en particulier
le résultat suivant.
Théorème IV.2.8. (i) Si f e fé*(Rm) a toutes ses dérivées partielles d'ordre < k
sommables, alors (l + \\x\\2)V2f(x) tend vers 0 à l'infini, et &{&f) = (2iirx)£f site Nm
<5>Soit P = 52eaeX£ € C[Xi,...,Xm], et soit P(d) l'opérateur différentiel £^0*. Si on cherche à
résoudre l'équation aux dérivées partielles P(d)u = <f>, où 4> est donnée, et supposée suffisamment
sympathique, on peut appliquer formellement la transformée de Fourier aux deux membres, pour obtenir
P(2ï7r x)û(x) = 4>(x). En appliquant la formule d'inversion de Fourier, cela nous donne « = ^{p^x{}-
Ce qui précède est un jeu d'écriture purement formel, mais donne des résultats utilisables dans de
nombreux cas provenant de problèmes physiques. Cette méthode de résolution d'équations aux dérivées
partielles acquiert une efficacité maximale dans le cadre de la théorie des distributions.
IV.3. FORMULES D'INVERSION
337
vérifie^ \£\ ^ k.
(ii) Si (1 + \\t\\2)k/2f(t) est sommable, f est de classe <é>k, et &f(x) = {-2m)W&{tlf),
si \£\ < k.
Démonstration. Si / 6 féJ(Rm), la formule ^(d^f) = (2iirx)£f s'obtient en intégrant
par partie (on intègre 8e f et on dérive e~2iirxt). Par exemple, si / 6 ^(R2), on déduit
du théorème de Pubini, que
£?(*i,*a) = J2e-^x^+x^^{tut2)dhdt2 = J c-a<«**»(y e-2^x^^-(tlyt2)dt1)dt2.
Une intégration par partie dans l'intégrale entre parenthèses nous donne
/ e~2iirXlh§fl(t^)dt^ = [e-2^1*1/^!,^)]^^ + 2^^!y e-2i«*^f(tlyt2)dtu
et comme / est à support compact, le premier terme du second membre est nul. On
réinjecte alors le second terme dans l'intégrale double, et on réutilise le théorème de
Fubini, pour obtenir
dj(xlyx2)= [ e'^^hinx! f e-2i*x^f{tut2)dtl)dt2
= 2iKxx [ e-2i^Xltl+x^f(tut2)dt1dt2 = 2iirx1f(xux2).
Le cas général se traite, par récurrence, de la même manière.
Pour traiter le cas / général, choisissons (j> G ^(R™) valant 1 sur [—1, l]m, et définissons
fj Par fj(x) = f{x)<t>{2~jx), si j G N. Alors fj G #*(Rm) et un petit calcul utilisant la
formule de Leibnitz pour la dérivée d'un produit montre que 8e fj tend simplement vers
8ef et que 8efj est majorée par une somme de dérivées k-ièmes de /, avec |k| < \£\,
ce qui implique que 8efj tend vers 0ef dans L^R"1). Ceci permet de déduire l'identité
&{&f) = (2iirx)£f par passage à la limite (en utilisant la continuité de (f> t-» (f>(x) qui
découle de la continuité de <j> i-> 0 de L^R"1) dans féo(Rm))- On en déduit le (i) car
^'(8ef) tendant vers 0 à l'infini quel que soit £ G Nm vérifiant \£\ ^ fc, il en est de même
de \x\ll et donc aussi de |(1 + ||s||2)*/2/(aOI car (1 + ||z||2)fc/2 < (1 + £™ x \Xj\)k.
Le (ii) est, quant à lui, une simple application du théorème de dérivation sous le signe
somme, une fois que l'on a remarqué que 8e(e~2iwxt) = (—2iirt)£e~2iirxt.
IV.3. Formules d'inversion
1. Séries de Fourier
Une fonction / : R —► C est périodique de période 1, si /(a;+l) = /(#), pour tout ieR.
On a alors f(x + n) = f(x) pour tous x G R et n G Z, et donc / est périodique de
période Z.
(6>On rappelle que (2inx)e = Yl?=i(2™xj)e*> si x = («i»• • •»«*») et£ = (tu.. .,/„»)•
338
CHAPITRE IV. TRANSFORMÉE DE FOURIER
On peut aussi (et c'est souvent nettement plus agréable) voir une fonction périodique
de période 1 comme une fonction de T = R/Z dans C. Le passage d'un point de vue à
l'autre se fait de la manière suivante, en notant tt : R —> T l'application envoyant rc G R
sur sa classe modulo Z : si / est une fonction sur T, alors / o n : R —> C est une fonction
périodique de période 1, et réciproquement, si g : R —» C est périodique de période 1,
alors il existe / : T —> C unique, telle que g = / o tt.
T est muni de la topologie quotient, ce qui signifie que / : T —» C est continue si et
seulement si / o n : R —» C est continue. L'espace ^(T) des fonctions continues sur T
s'identifie donc à l'espace des fonctions continues sur R, périodiques de période 1.
T est un groupe (quotient du groupe commutatif (R, +) par son sous-groupe Z), et,
par construction, 7r : R —» T est un morphisme de groupes dont le noyau est Z. Si n G Z,
alors t i-> e2i*nt est un caractère continu de R dont le noyau contient Z, et donc est un
caractère continu de T en vertu de notre identification entre les fonctions périodiques de
période 1 et les fonctions sur T. On note Xn le caractère t i-> e2innt de T, si n G N.
Proposition IV.3.1. Les caractères linéaires continus de T sont les Xn, pour n G Z.
Démonstration. Si x : T —> C* est un caractère linéaire continu, alors i/j = x ° ir est un
caractère continue de R, périodique de période 1. D'après la prop. IV.2.1 , il existe À e C
tel que tf)(t) = eAt, pour tout t G R. La périodicité de ip équivaut alors à i/j(1) = ip(0) = 1,
ce qui montre que A doit être de la forme 2i7rn, avec n G Z. Ceci permet de conclure.
Si a G R, tout élément t de R peut s'écrire de manière unique sous la forme t = x + n,
avec x G [a, a + 1[ et n G Z. Autrement dit, l'intervalle [a,a + 1[ est un système de
représentants de R modulo Z, pour tout a G R. On en déduit que l'application ia, qui
à une fonction / sur T associe sa restriction (plus précisément, la restriction de / o tt) à
[a,a+ 1[, est un isomorphisme de l'espace des fonctions sur T sur celui des fonctions sur
[a,a+ 1[. On va utiliser ces isomorphismes pour définir un certain nombre d'espaces de
fonctions sur T.
On vérifie facilement, en utilisant l'invariance de l'intégrale de Lebesgue par translation,
que les définitions suivantes, pour / : T —> C, ne dépendent pas du choix de a G R :
/ est dite nulle p.p., si La(f) est nulle p.p.,
/ est dite sommable, si ua{f) est sommable; si / est sommable, on définit /T/ par
/t/=i:+1 /w *.et n/iii par ii/iii=/x i/i-
/ est dite de carré sommable, si La(f) est de carré sommable ; si / est de carré sommable,
on pose ||/||2 = (/xl/l2)1^2» et si f,g sont de carrés sommables, on définit leur produit
scalaire (f,g) par la formule (/,#) = JTfg.
On note, Jfl(T) (resp. Jè?2(T)) l'espace des fonctions sommables (resp. de carré
sommable), et LX(T) (resp. L2(T)) son quotient par l'espace des fonctions nulles p.p. Par
définition, ces espaces sont isométriques (via La) aux espaces -^([a, a+1[), Jèf2([a, a+1[),
IV.3. FORMULES D'INVERSION
339
Ll([a,a + 1[) et L2([a,a + 1[) respectivement. Comme [a,a + 1[ est de volume fini, on a
L2(T) c L*(T).
On définit Esc(T) comme l'image inverse de Esc([0, l[) par t0; si r G N, et si k G
{0,..., 2r - 1}, on note encore eryk la fonction sur T dont l'image par lq est e^. Les er>k,
pour r G N et k 6 {0,... ,2r - 1} forment une famille génératrice de Esc(T). De plus,
Esc(T) est dense dans L^T) et L2(T) : en effet, Esc(]0,l[) est dense dans L^lD et
L2(]0,1[) (cf. th. III.2.11).
Soit Trig(T) l'espace des polynômes trigonométriques (i.e. des combinaisons linéaires
des Xn> pour n G Z).
Théorème IV. 3.2. (i) Trig(T) est dense dans L2(T).
(ii) Les Xn> pour n G Z, forment une base hilbertienne de L2(T).
Démonstration. On a
ra+l
(Xn,Xm)= / <
Ja
e2in(m-n)t dt =
1 si m = n,
Les Xn forment donc une famille orthonormale, et le (ii) est une conséquence du (i),
puisque les Xn engendrent rlVig(T). La manière standard (cf. ex. II.2.2) pour démontrer
la densité de Trig(T) dans L2(T) est de passer par sa densité dans ^(T) (cas particulier
du théorème de Stone-Weierstrass). Nous proposons ci-dessous une autre approche, via
les fonctions en escalier.
Soit F l'adhérence de Trig(T) dans L2(T). Le lemme IV.3.3 ci-dessous montre que
</>o G F, où </>o G L2(T) est définie par <f>0(t) = £, si t G [^, |[. Nous allons en déduire que
F contient Esc(T), ce qui permettra de conclure, cet espace étant dense dans L2(T).
Soit Ta : L2(T) -> L2(T) définie par (Ta(</>))(£) = <f>(t + a). Alors Ta est une isométrie
grâce à l'invariance par translation de l'intégration ; en particulier, Ta est continue. Comme
Trig(T) est stable par T0, il en est de même de F [si (f> G F, et si (/n)n€N est une
suite d'éléments de Trig(T) tendant vers <f) dans L2(T), alors (Ta(/n))n€N est une suite
d'éléments de Trig(T) tendant vers rVa((f>) dans L2(T)]. Maintenant, si r G N, et si
k G {0,...,2r-l})onaer.)fe = 2"r- T_i_^(</>0) + T_i_*^i(</>o), comme le montre un
petit calcul ; on déduit donc de l'appartenance de fo et des constantes à F, celle de er^
pour tous r G N et k G {0,..., 2r — 1}. Les er,k formant une famille génératrice de Esc(T),
cela implique Esc(T) C F, ce que l'on cherchait à démontrer.
Lemme IV.3.3. (i) Si t e]=±, |[, et si z = e2iirt, alors £+f°i *ïs£r(sn ~zn) = t.
(ii) La séné £n^o ^^e2i7rnt tend vers <f>0 dans L2(T).
Démonstration. Si \a\ = 1 et a ^ -1, on a
^-f 2mn 2tir J0 ^ 2nr J0 l + ua
n=l v n=l
340
CHAPITRE IV. TRANSFORMÉE DE FOURIER
Comme \a\ = 1, la suite de fonctions 1-^~^ , pour N e N, tend simplement vers jz^,
sur [0,1[, et est majorée en module par .^ ■, qui est sommable, puisque a ^ — 1. On peut
donc utiliser le théorème de convergence dominée pour intervertir limite et intégrale. On
en déduit que la série qui nous intéresse converge vers :
z fl du J_ fl du _ 1 fl sm2irt
2iir J0 l+uz 2m J0 1 + uz tt J0 (u + cos 2nt)2 + sin2 2itt
= - [arctg —. 11 = - (arctg (cotg nt) - arctg (cotg 2itt)) = t,
7C Sin Z7TC J u 7T
car arctg (cotg x) est égal à f - x, si 0 < x < ir et à =j- — x, si — ir < x < 0. Ceci démontre
le (i). Maintenant, Y^n^o 4^? < +°°> et comme les Xn forment une famille orthonormale,
la série Zln^o ^~2iim Xn est, d'après le lemme II.2.4, sommable dans L2(T). On note /
sa somme. On peut alors extraire (cf. ex. III.2.9) une sous-suite tendant p.p. vers / de
la suite de ses sommes partielles. Or le (i) montre que toute sous-suite de ses sommes
partielles tend simplement vers (f>0 en dehors de \. On en déduit que f = </>o PP-, et donc
que la série tend vers (f>o dans L2(T). Ceci permet de conclure.
Si / e L^T), on note Cn(f) = (Xn,/) = Jq e~2hrntf(t)dt son n-ième coefficient de
Fourier.
Corollaire IV.3.4- Si f e L2(T), alors ^nez^iÏÏXn est sommable, de somme f,
dans L2(T), et ||/||2 = (E^z M/)P)I/2.
Démonstration. C'est une simple application du th. II.2.6.
Exercice IV.3.5. Calculer de deux manières || 0o II 2 - En déduire la formule Ç(2) = \.
Proposition IV.3.6. Si f e <*f(T), et si £n€ZM/)| < +00, alors Engz^WXn
tend uniformément vers f. En particulier, f(t) = Ên€ZCn(/)e2i7rnt, pour tout t.
Démonstration. La série Y^n£Zcn{f)Xn converge normalement dans ^(T) (muni de
Il ||oo), et la somme g est donc une fonction continue. De plus, comme ||/i||2 ^ ||^||oo> la
série En€Z cn(f)xn converge vers g aussi dans L2(T). Par ailleurs, il résulte du cor. IV.3.4
que la série converge aussi vers / dans L2(T), et donc que f = g dans L2(T). Ceci se
traduit par /0 \f(t) — g(t)\2dt = 0 et, / et g étant continues, cela implique que f — g est
identiquement nulle. Ceci permet de conclure.
Remarque IV. 3.7. La condition EnGZ |cn(/)| < +00 est en particulier vérifiée si / est
de classe cé>l. En effet, si n ^ 0, une intégration par partie nous donne
IV.3. FORMULES D'INVERSION
341
et comme (£^o M/')!2)" < If h, °" *
Eli-(/')N(E4^)1/2(EM/')P),/2<+-
Remarque IV.3.8. Comme L2([a,a + 1[) est isométrique à L2(T), les Xn> pour n € N,
forment aussi une base hilbertienne de L2([a,a + 1[) et donc aussi de L2(]a,a + 1[) ou
L2([a,a + 1]) puisque [a,a+ 1[, ]a,a + 1[ et [a, a + 1] ne diffèrent que par des ensembles
de mesure nulles. Il est très facile d'en déduire une base hilbertienne de L2(I), pour tout
intervalle I de longueur finie.
2. Séries de Fourier multidimensionnelles
L'étude des séries de Fourier en dimension m se ramène de manière assez formelle ^ à
celle des séries de Fourier en dimension 1.
2.1. Le cas du réseau Zm
Une fonction / : Rm —> C est périodique de période Zm, si f(x + u>) = /(rc), pour tous
x G Rm et u G Zm. Pour que ceci soit le cas, il suffit que l'on ait f(x + ej) = f(x), pour
tout x € Rm, et tout je {1,..., m}, où ei,..., em est la base canonique de Rm.
Comme en dimension 1, on voit une fonction périodique de période Zm comme une
fonction du groupe Tm = (R/Z)m = Rm/Zm dans C, et l'espace ^(Tm) des fonctions
continues sur Tm s'identifie à l'espace des fonctions continues sur Rm, périodiques de
période Zm.
Si n = (m,... ,nm) G Zm, on note Xn le caractère de Tm défini par Xn(t) = e2innt.
Proposition IV.3.9. Les caractères linéaires continus de Tm sont les \n,
pour n 6 Zm.
Démonstration. Si x : Tm —* C* est un caractère linéaire continu, la restriction de x
à Kej est un caractère linéaire continu, périodique de période Z, et donc, d'après la
prop. IV.3.1, de la forme tj t-* e2iirnitj. Comme t = X)JLi tje3> et comme X est un caractère,
on a x{t) = IIjli e2innàlà = e2i7rnt, où n = (m,... ,nm). Ceci permet de conclure.
Comme en dimension 1, si a = (ai,..., am) 6 Rm, et si Xa = n^=i[aj> aj +1[>
l'application 6a, qui à une fonction / sur Tm associe la restriction de / à Xa, est un isomorphisme
^7^On peut s'amuser à formaliser le lemme IV.3.11 et son utilisation à grands coups de produits tensoriels
et de produits tensoriels complétés. On a vu (ex. 1.3.3) que l'espace des fonctions suri x J est le produit
tensoriel des espaces de fonctions sur I et J, si I et J sont finis. Si I et J ne sont pas finis, la situation
est plus compliquée, mais certains sous-espaces de fonctions sur I x J sont encore des produits tensoriels
d'espaces de fonctions sur I et J. C'est par exemple le cas des polynômes trigonométriques sur Rm/Zm qui
sont le produit tensoriel de m copies des polynômes trigonométriques sur R/Z. L'espace L2(Rm/Zm) est,
quant-à-lui, obtenu en complétant le produit tensoriel de m copies de L2(R/Z). Ce procédé de réduction
à la dimension est 1 est extrêmement efficace pour beaucoup de questions.
342
CHAPITRE IV. TRANSFORMÉE DE FOURIER
de l'espace des fonctions sur Tm sur celui des fonctions sur Xa. Ceci permet de définir,
comme en dimension 1 :
des espaces 1^(1™) ^ L^XJ et L2(Tm) ^ L2(Xa),
une intégrale / »-» /Tm f = JXof sur L^T™),
une norme \\f\U = /T,„ |/| surVCT»), _
un produit scalaire (/, g) *-* (/, g) = /T,„ fg sur L2(Tm), et la norme ||/||2 = (/, /)1/2
qui va avec.
L'invariance de l'intégrale de Lebesgue par translation implique que ce qu'on obtient
ne dépend pas du choix de a 6 Rm (cf. lemme IV.3.16 pour un énoncé plus général).
On définit Esc(Tm) comme l'image inverse de Esc([0, l[m) par t0; si r G N, et si
k G {0,..., 2r — l}m, on note encore er^ la fonction sur Tm dont l'image par t0 est er^.
Les er>k, pour r 6 N et k G {0,..., 2r — l}m forment une famille génératrice de Esc(Tm).
Soit IVig(Tm) l'espace des polynômes trigonométriques sur Tm (i.e. des combinaisons
linéaires des Xn> pour n G Zm).
Si / G L^T™), on définit ses coefficients de Fourier cn(/), pour n G Zm, par la formule
Cn(f) = (XnJ) = fm,ne-»™*f(t)dt.
Théorème IV.3.10. (i) Trig(Tm) est dense dans dans L2(Tm).
(ii) Les Xn, pour n G Zm forment une base hilbertienne de L2(Tm).
(iii) Si f G L2(T™), alors f = £„Gz»^„(/)xn dans L2(T™).
(iv) Si f G V(Tm), et si £„€Z.» |cn(/)| < +co, alors f = £nGZm c„(/)X„ dans V(Tm),
et en particulier, f(t) = £neZmc„(/)e2i7rn* pour tout t.
Démonstration. Nous allons déduire cet énoncé de l'énoncé analogue en dimension 1.
Si <£i,..., <j>m sont des fonctions de R dans C, on note <f>\ <g> • • • <g> <j>m ou, de manière plus
compacte, <8>i<&, la fonction de Rm dans C définie par
m
{®i<t>i){t) = <t>l <S> • • • <8> (f>m(t) = H MU), Si t = (tu . . . , *m).
i=l
Par exemple,
Xn = <S>iXni, si n = (ni,..., nm) G Zm,
er,k = «S^r^, si r G N, et si k = (kx,..., km) G Zm.
Lemme IV.3.11. (i) Si fa = ipi p.p., pour tout i, alors <g>i</>i = <8>iipi pp.
(ii) Si fa G J&f^T) pour fou* t, a/ors ®^< G &l(Tm), et on a ||<8>i&||i = lit IMIi-
(iii) 5» <f>i G =£?2(T) pour fou* i, alors <&& G i?2(Tm), et on a ||<8>i&||2 = fli IMk
Démonstration. Soit AjCR (resp. A C Rm) l'ensemble des x tels que </>i(;c) ^ ^(a?)
(resp. <S>i0i(ic) ^ <8>iipi(x)). Alors A est inclus dans la réunion des A* x n^»***» QU^ sont
tous de mesure nulle dans Rm, puisque A* est de mesure nulle dans R par hypothèse.
Cela démontre le (i).
IV.3. FORMULES D'INVERSION
343
Les (ii) et (iii) sont des conséquences immédiates du théorème de Pubini.
Revenons à la démonstration du th. IV.3.10. Le (i) du lemme précédent montre que
l'application (</>i,... ,(j>m) »-» 0^ passe au quotient (des deux côtés à la fois) modulo les
fonctions nulles p.p. Comme cette application est linéaire en chacune des fa, les (ii) et (iii)
montre que l'on obtient ainsi des applications multilinéaires continues L^T)"1 —» L^T"1)
et L2(T)m -> L2(Tm).
Pour montrer que lYig(Tm) est dense dans L2(Tm), il suffit de montrer que son
adhérence contient Esc(Tm), et, par linéarité, il suffit de vérifier qu'elle contient les er)k, pour
r ^ 1 et k e {0,..., 2r — l}m. Pour cela, on écrit er>k sous la forme ery = <S>ier>kit et on
choisit, pour chaque i, une suite Pj>n d'éléments de Trig(T) tendant vers e,.,*. dans L2(T).
Il résulte de la continuité de {<j>\,... ,(f>m) t-» ®^ que Pn = <8>iPi,n tend vers er>k dans
L2(Tm), et comme Pn 6 Trig(Tm), on en déduit le (i).
On déduit du théorème de Fubini que (xn,Xe) = rE=i<Xm>X*i)> si n = (m,... ,nm)
et l = (£i,... ,£m), ce qui permet de déduire l'orthonormalité de la famille des Xn> pour
n G Zm, de celle des Xn> pour n G Z ; le (ii) est donc une conséquence du (i).
Le (iii) est alors une application du th. II.2.6, et le (iv) se déduit du (iii) comme dans
la démonstration de la prop. IV.3.6.
Ceci permet de conclure.
Exercice IV.3.12. Montrer que, si A; > ^, et si / est périodique de période Zm et de classe #*, alors
2.2. Le cas d'un réseau quelconque
Un réseau À de Rm est un sous-groupe de Rm de la forme ZvH \-Z>vm, où (vi,..., vm)
est une base de Rm. On dit alors que (vi,..., vm) est une base de A (sous-entendu sur Z).
L'exemple le plus simple est le réseau Zm dont une base est la base canonique de Rm.
Le réseau dual À* de A, est l'ensemble des x G Rm tels que x-u eZ, pour tout w€A.
Le réseau dual de Zm est Zm de manière évidente. Le cas général est décrit par le lemme
suivant.
Lemme IV.3.13. Soit (vi,..., vm) une base de À, soit A la matrice dont la j-ième
colonne est le vecteur Vj. Alors A* = tA_1Zm.
Démonstration. Le fait que (vi,..., vm) soit une base de A se traduit par A = A Zm =
{An, n 6 Zm}. Or x • An = lAx • n. Comme le réseau dual de Zm est Zm, on en déduit
que x G A*, si et seulement si lAx G Zm ; autrement dit, on a A* = tA~1Zm.
Une fonction / : Rm -» C est périodique de période A, si f(x + u) = f(x), pour tous
x G Rm et uj G A. Pour que ceci soit le cas, il suffit que l'on ait f(x + Vj) = f(x), pour
tout x G Rm, et tout j € {!,... ,ra}, si (vi,..., vm) est une base A.
344
CHAPITRE IV. TRANSFORMÉE DE FOURIER
Comme d'habitude, on voit une fonction périodique de période A comme une fonction
du groupe T(A) = Rm/A dans C, et l'espace ^(T(A)) des fonctions continues sur T(A)
s'identifie à l'espace des fonctions continues sur Rm, périodiques de période A.
Si LO G A*, alors t t-» e2mu}t est un caractère de Rm dont le noyau contient A ; c'est
donc un caractère de T(A) ; nous le noterons Xw
Lemme IV.3.14- Les caractères linéaires continus de T(A) sont les Xu, pouruj G A*.
Démonstration. Un caractère de T(A) est de la forme e2iirxt, avec x G Rm, trivial
sur A, ce qui équivaut àï-weZ, pour tout w € A. On en déduit le résultat.
Si A est un réseau de Rm, un domaine fondamental de Rm modulo A, est un ensemble
mesurable X C Rm tel que tout élément x de Rm puisse s'écrire de manière unique sous
la forme u + a, avec a G X et lj G A. Par exemple, si (v\,..., vm) est une base A, alors
{hvi H 1- tmvmj 0 ^ U < 1, pour tout i} est un domaine fondamental modulo A.
Soit X un domaine fondamental de Rm modulo A. On note Vol(A) la mesure de Lebesgue
de X. Le lemme IV.3.16 ci-dessous montre que ceci ne dépend pas du choix de X ; on a donc
Vol(A) = | det(vi,..., vm)\, si (vi,..., vm) est une base de A ; en particulier, Vol(Zm) = 1.
L'application tx, qui à une fonction / sur T(A) associe la restriction de / à X, est
un isomorphisme de l'espace des fonctions sur T(A) sur celui des fonctions sur X. Ceci
permet de définir, comme d'habitude,
des espaces L1(T(A)) ^ Ll(X) et L2(T(A)) ^ L2(X),
une intégrale / •-» /T(A) f = fxf sur L^TfA)),
une norme ||/||i = ^^ /T(A) |/| sur L^TfA)),
un produit scalaire (f,g) i-> (/,#) = w(K)InA)f9 sur L2(T(A)), et la norme
||/||2 = (/,/>1/2quivaavec.
Le lemme IV.3.16 ci-dessous montre que ce qu'on obtient ne dépend pas du choix de X.
Si / G L1(T(A)), on définit ses coefficients de Fourier c^/), pour u G A*, par la formule
CwC/) = (Xw,/) = voi(A) /x^~2îiru,tf(t)dty où X est un domaine fondamental modulo A.
Théorème IV.3.15. (i) Les \u>> pouru G A*, forment une base hilbertienne de L2(T(A)).
(ii) Sife L2(T(A)), alors f = £w€A- cw(/)Xw dans L2(T(A)).
(iii) Si f G tf(T(A)), et si EW€A* \cM)\ < +oo, alors f = E^a* <U/)X« dans
^(T(A)) ; en particulier, f(t) = £u,€A* cU/Je2*™'* pour tout t.
Démonstration. Soit (vi,... ,Vd) une base de A, et soit A la matrice dont la j'-ième
colonne est Vj. Alors A • Zm = A, ce qui fait que ^h^oA transforme une fonction
périodique de période A en une fonction périodique de période Zm. De plus, le facteur
vôïïâ") = idetAi ^ans k* définition du produit scalaire sur L2(T(A)) fait que </> i-» </> o A est
une isométrie de L2(T(A)) sur L2(Tm). Ceci permet, en remarquant que Xu>(A£) = XnW
IV.3. FORMULES D'INVERSION
345
si u = *A 1n G A* (cf. lemme IV.3.13), de déduire le théorème ci-dessus du résultat
pour Zm.
Lemme IV.3.16. Si f : T(À) —» R+ est mesurable, alors Jxf ne dépend pas du
choix du domaine fondamental X modulo A.
Démonstration. Le fait pour X d'être un domaine fondamental modulo A peut se
réécrire sous la forme XLeA lw+x = 1> où a; + X = {a; + a, a G X}.
Soient Xi,X2 des domaines fondamentaux modulo A. En utilisant successivement :
l'identité 1 = Eu6aWx2)
le théorème de convergence monotone pour échanger somme et intégrale,
le changement de variable x = u+t et l'invariance de / par ce changement de variable,
de nouveau le théorème de convergence monotone,
l'identité Ew€a1-«+Xi = 1,
on obtient
/ /= /w= /(£w.)ix./= £/wx2iXl/
JXl J J u>€A u€AJ
= W lx2l-W+Xl/ = / ( E 1-«+Xi)lxa/ = / W = / /,
weA"7 J w€A ^ ''^
ce qui permet de conclure.
3. La formule de Poisson
On note ^(Rm) l'espace de Schwartz des fonctions de classe <tf°° sur Rm, qui sont à
décroissance rapide à l'infini ainsi que toutes leur dérivées, (g est à décroissance rapide à
l'infini, si (l + ||£||2)Np(£) est bornée sur Rm, quel que soit N 6 N.) On déduit du th. IV.2.8
le résultat suivant.
Corollaire IV.3.17. L'image de c^(Rm) par la transformée de Fourier est incluse
dans J^(Rm).
Théorème IV.3.18. (Formule de Poisson, 1816) Si f € ^(R) ou, plus généralement,
si f est de classe tf1, et si f et f sont des 0(|£|-2) au voisinage de ±co, alors
£/(«) = £/(«)•
n€Z n€Z
Démonstration. Soit F(t) = ^2neZf(n + t). La série converge pour tout t grâce à
l'hypothèse / = 0(|£|~2), et la fonction F est périodique de période 1. De plus, sur [0,1],
la série des f'(n + t) converge normalement, grâce à l'hypothèse /' = 0(|£|-2), ce qui
implique que F 6 ^(T). On en déduit, en utilisant la rem. IV.3.7, que F est somme de
346
CHAPITRE IV. TRANSFORMÉE DE FOURIER
sa série de Fourier en tout point. Or, si k G Z, on a (l'interversion de l'intégrale et de la
série ci-dessous est justifiée par la convergence uniforme sur [0,1]) :
ck(F)= f e-2i*ktF(t)dt= [ e-2inkt(^2f(n + t))dt = J2 [ e~2ilTktf(n + t)dt
J° J° n€Z n€ZJ°
/+oo
e-2iirktf(t)dt = f(k).
OO
n€Z'
On en déduit la formule du théorème en comparant la série donnant F(0) avec la série de
Fourier de F en 0.
On démontre de même, en dimension quelconque, le résultat suivant.
Théorème IV. 3.19. (Formule de Poisson dans Rm) Si f G y(Rm), et si A est un
réseau de Rm, alors
u>€A v ' w€A*
Exercice IV.3.20. Comparer ce que donnent la formule du th. IV.3.18 et celle du th. IV.3.19 pour
évaluer X)nez /(An)> avec A G R*.
4. La formule d'inversion de Fourier dans S?
Théorème IV.3.21. Si (p G J^(Rm), alors 'W&cp = <p et &~Wy = (p.
Remarque IV. 3.22. Comme <&(p(x) = &(p(—x), on peut réécrire l'égalité &&(p = (p
sous la forme {& o &ip)(x) = <p(—x) ou encore (p(x) = (p(—x).
Démonstration. Comme on passe de & à & en changeant x en —x> il suffit de
démontrer une des deux formules; nous démontrerons la première. Soient u G Rm et
r G N. Si on applique la formule de Poisson à la fonction f(t) = cp(u + 2rt) et au réseau
A = Zm (et donc A* = Zm), on obtient la formule suivante (où l'on a utilisé l'identité
f(x) = 2~rme2lnu'2~'x(p(2~rx), conséquence des formules pour les dilations-translations) :
^2 ¥>(u + 2rk) = 2~rm ^ e2i™-2~rk<£(2~rk).
k€Z'» k€Z»»
Nous allons montrer que, quand r —> +oo, le membre de gauche tend vers (p(u) et le
membre de droite vers ^(p(u), ce qui permettra de conclure.
• On commence par remarquer que, comme cp tend vers 0 à l'infini, on a (p(u+2rk) —► 0
si k ^ 0, et cp(u + 2rk) = cp(u) si k = 0 ; pour prouver que le membre de gauche
tend vers (p(u)> il n'y a donc qu'à justifier l'interversion de la somme et de la limite.
La décroissance rapide de y? à l'infini implique en particulier l'existence de C tel que
\<p(t)\ ^ C(l + p||2)-(m+1>/2 pour tout t G Rm. Or Ek6Z«(1 + allkll2)"(m+1)/2 < +00 Pour
tout a > 0 (cf. n° 15.2 du Vocabulaire), et, si 2r ^ 2||w||, on a \\u + 2rk|| > a ||k||, avec
a = \\u\\, pour tout k G Zm. La série de terme général C(l + a||k||2)_(m+1)/2 est donc un
IV.3. FORMULES D'INVERSION
347
majorant sommable, pour tout r assez grand, de la série de terme général (p{u + 2r\a). On
conclut en utilisant le théorème de convergence dominée pour les séries.
• Passons à l'étude de la série dans le membre de droite. Le procédé habituel
transformant une somme en intégrale d'une fonction en escalier montre que cette série est égale
à fipr, où ipr est la fonction définie par
A=Y1 ^(2~rkKk> et *(*) = e2i™x<p(x).
k€Z™
Maintenant, si t = (tu... ,*m), alors ipr(t) = ^(*(r)), où t\r) = 2-r[2r^] G [U - 2~r,ti]. En
particulier, t^ —> t, et ip étant continue, on a tpr(t) —> ip(t), pour tout t G Rm. De plus, si
C(t) désigne le cube 112=1 [^ - !>*»]> on a *(r) e C(t), pour tout r € N. La fonction ipr est
donc majorée, pour tout r G N, par g, où g(t) = supueC(t) \ip(t)\ = supueC(t) \<p(t)\. Enfin,
comme <p est à décroissance rapide à l'infini, il en est de même de g qui est, de ce fait,
sommable, ce qui permet d'utiliser le théorème de convergence dominée pour en déduire
que f ipr —» ftp. Comme Jip = <^ip(u), cela permet de conclure.
Corollaire IV.3.23. & et ~& sont des isomorphismes de c^(Rm) dans c^(Rm),
inverses^ l'un de l'autre.
5. Formules d'inversion dans L1
Proposition IV.3.24. Si f,ge L^R™), alors
f 9 *f = [ f &9 et [ gff= [ f?g.
Démonstration. Remarquons que les deux membres sont bien définis car f et g sont
bornées puisqu'éléments de %(Rm). Soit h(x,t) = g(x)f(t)e~2tnxt. Alors h est sommable
sur Rm x Rm, car d'après le théorème de Fubini pour les fonctions positives, on a
/ \h(x,t)\dxdt= [ \f(t)\\g(x)\dxdt= [ (f \f(t)\\g(x)\dx)dt
jRmxRm «/RmxRm JWn «/Rm
- f IMIil/WI* = llffli|/lli<-Hx).
Une application immédiate du théorème de Fubini montre alors que les deux membres
sont égaux à JRmxRB h(xyt)dxdt, ce qui permet de conclure.
Proposition IV. 3.25. Si h £ L*(Rm) a une transformée de Fourier sommable, alors
~&&h = h p.p.
<8)Ce résultat, combiné avec la formule de la prop. IV.3.24, est à la base de la définition de la transformée
de Fourier d'une distribution.
348
CHAPITRE IV. TRANSFORMÉE DE FOURIER
Démonstration. Soit ip <E ^°{Rm). Alors &~&tp = ip d'après le th. IV.3.21. Par ailleurs,
en appliquant la prop. IV.3.24 successivement à / = &h et g = (p, puis à / = /i et p = &(p
(ce qui est licite car h et &h sont dans L^R™) par hypothèse, et (p et ^(p sont dans
y(Rm) qui est inclus dans L^R"1)), on obtient :
/ ~&&hip= I &hWip= [ h##ip= [hep.
JRm 7r»» JR'» JWn
La fonction &&h n'est pas a priori dans L*(Rm) mais, comme elle est continue, sa
restriction à tout ouvert borné X est dans LX(X). Or Jx(^^h — h)(p = 0 pour tout
<p 6 ^C°°(X), d'après ce qui précède, et le cor. III.2.13 permet d'en déduire la nullité
(presque partout) de &&h — h, sur tout ouvert borné X. Ceci permet de conclure.
On trouvera une autre démonstration sous forme d'exercice (utilisant la convolution
introduite dans les ex. III.3.12 et III.3.13) ci-dessous, et encore une autre en passant par
la transformée de Fourier dans L2 au n° 3 du § IV.4.
Exercice IV.3.26. (Formule d'inversion)
(i) Soit h : R -» R définie par h(t) = e-1'1, et, si e > 0, soit he(t) = h(et). Soit ô(x) = h(-x).
(a) Calculer S(x) et vérifier que JRô = 1 et que he(-x) = ôe(x), avec Se(x) = \8{x/e).
(b) Soit / G LX(R). Montrer que ||/ * ôe - /||Li ->e—o 0. (Commencer par / en escalier.)
(c) En déduire qu'il existe une suite (en)n€N, tendant vers 0, telle que / * Sen(x) —» f(x) pour
presque tout a; G R.
(d) Montrer que (/ * 6e)(x) = JRh(et)f(t)e2i"txdt.
(ii) On suppose de plus que / G LX(R). On pose g(x) = /R f(t)e2in tx dt. Vérifier que g est continue,
bornée, que /R h(et)f(t)e2i*tx dt —> 0(2), quand e —» 0, quel que soit a: G R. En déduire que f(x) = g(x),
pour presque tout a: G R.
6. Exercices
Exercice IV.3.27. Soit / : R -> C définie par f(t) = j^.
(i) Montrer que / est définie, de classe fé71, et que \tNf(t)\ —► 0 quand \t\ —► +00, pour tout N G N.
(ii) Soit g : R —► C définie par g(t) = e~2irt, si t > 0, et g(t) = 0, si t < 0. Calculer g ; en déduire la
transformée de Fourier de h(t) = t2g{t), puis /.
(iii) Montrer que la série Y,nez (n+i)3 est absolument convergente, et calculer sa somme.
Exercice IV.3.28. (i) Montrer que, si 0 G ^°, l'équation différentielle u"—u = <f> a une unique solution
dans c5^(R). Cette solution est-elle toujours à support compact?
(ii) À quelle condition portant sur 0, l'équation différentielle u" + u = <f> a-t-elle une solution dans
y(R) V Si solution il y a, est-elle toujours à support compact ?
Exercice IV.3.29. Soit / : R -> R définie par f(t) = e'"'2.
(i) Montrer que / est#°° sur R, et vérifie l'équation différentielle f'(x)
utilisant la formule fRe~wt dt = l, que f(x) = e~*x .
(ii) Si u G R+, calculer la transformée de Fourier de fu définie par fu(t)
(iii) Si u G R;, et si F(u) = Enez*-™2", montrer que F(u) = ^F(J)
—2irxf(x). En déduire, en
IV.4. TRANSFORMÉE DE FOURIER DANS L2
349
Exercice IV.3.30. Si A > 0, soit <j>x{t) = e"**'*' ^f.
(i) Montrer que À •-» j>\(x) est dérivable sur R+, si x € R, et calculer sa dérivée. En déduire <j>\{x).
if-i if,
|-2->5l'
(ii) Remarquer que ^p- est la transformée de Fourier de li=i i., et retrouver directement le (i).
IV.4. Transformée de Fourier dans L2
Si <t> 6 L2(Rm) n'est pas sommable, l'intégrale fRme~2tnxt<l>(t)dt ne converge pour
aucune valeur de x. Malgré ce petit problème, on peut définir la transformée de Fourier
d'un élément de L2(Rm), par un passage à la limite, et ce qu'on obtient fournit une
théorie ayant des propriétés nettement plus agréables que dans L^R"1). Il y a des tas de
manières d'arriver au résultat. Nous avons choisi de privilégier les fonctions en escalier
jusqu'au bout. On trouvera une autre approche dans le problème H.6.
1. Transformée de Fourier des fonctions en escalier
Commençons par quelques calculs en dimension 1.
Lemme IV.4-1- (i) Si À > 0, la transformée de Fourier de e-**l*lsÈaz* e$t
1, ,2x + L ,2x -lxN
— (arctg(—^—) - arctg(—jj—)).
(ii) La transformée de Fourier de j^r est \{\x + 1| + \x - 1| - 2|rr|).
Démonstration. (i) On cherche à calculer fKe-2inxte-*xM^dt. Or sSazi est la
transformée de Fourier de l(=i,i(, alors que la transformée de Fourier de e~2Mrx*e-7rAl*l est
f f+OO
yi_> / e-2«r(aH-y)te-7rA|t|^= / e-irt(\+2i(x+y)) + e-wt(\-2i{x+y)) ^
Jk Jo
_1, 1 1 v _ 2A
~7rK\ + 2i(x + y) \-2i(x + y)' n(X2 + 4(x + y)2) '
Il résulte donc de la prop. IV.3.24 que fRe-***te-*\\t\*&t = /j, y(Aa+ffx+y)a) dy. On
conclut en utilisant le fait que la primitive de ,As+2fo+ )2) est ^arctg(2 ^").
(ii) Nous allons plutôt calculer la transformée de Fourier de e~^AW s!"tff, pour À > 0, et
en déduire le résultat en faisant tendre À vers 0. Si x 6 R, et À ^ 0, soit
G.(A) = j <fe(A, t) dt, avec g.(\, t) = e-**«e-"WS-^.
Comme la fonction ^g^ est un majorant sommable de gx(X, t) pour tout À ^ 0, et comme
A »-> #x(A, t) est continu sur R+, pour tout t^ 0, le théorème de continuité d'une intégrale
dépendant d'un paramètre montre que Gx est continue sur R+. La quantité Gx(0) qui
nous intéresse est donc la limite, quand À —* 0, de GX(À).
350
CHAPITRE IV. TRANSFORMÉE DE FOURIER
On va utiliser la prop. IV.3.24, avec / = 1[^>i[ et g = e-K*»«e-*A|t|sapj puisque
Ga;(A) = fKfg- En utilisant le (i), on obtient GX(A) = /R/p = ± J^{2/2hx(Xyy)dyy avec
M*»!/) = (arctgp y ) - arctgp -^ )).
Maintenant, \hx(\,y)\ est majoré par 7r quel que soit A > 0, et comme arctg(^) tend vers
sign(a)|, quand A —► 0+, on obtient, en utilisant le théorème de continuité d'une intégrale
dépendant d'un paramètre,
G*(0) = - / (sign(2(z + y) + 1) - sign(2(z + y) - 1)) dy.
* J-l/2
On conclut en utilisant la formule J_\,2sign(2y + a)dy = |^| — |^|.
Proposition ÏV.J^.2. Soit m ^ 1.
(i) Si r G N, et si k G Zm, a/ors êr>k G L2(Rm).
(ii) 5e k, k' € Zm, a/ors
/A . . /O sek^k' . .
(er,k, er,k.) = |2_rm s. k = k, = <er,k,er,k,>.
(iii) L'application <j>\-> <j> induit une isométrie de Esc(Rm), muni de la norme || H2, sur
un sous-espace de L2(Rm).
Démonstration. Le (i) est une conséquence du fait que a(t) = ^^ est de carré som-
mable dans R, et de la formule de la prop. IV.2.6 exprimant êr>k en terme de a.
Un calcul immédiat montre que (er>k, er>k/) est nul si k ^ k', et vaut 2"rm si k = k'.
Par ailleurs, en partant de la formule
m
M*) = II {2-re-2l-ri^+k^a(2-rXj))
de la prop. IV.2.6, on obtient (après une application immédiate du théorème de Fubini),
m p
(êr,k,êr,k->=2-2™TT( / e-*-'fc«-W"'o(2-V,«fcci)
t-i Jr
m p
=2_rmIl( / e-^^-^^aiu^dUj).
On reconnaît dans la parenthèse la transformée de Fourier de ct2{t) = s|"t)?, ce qui permet
d'utiliser le (ii) du lemme IV.4.1 pour montrer que JRe~2tw^k'j~k^Uia(uj)2duj est nul si
kj ^ kp et vaut 1 si kj = k'y On en déduit le (ii).
Enfin, le (iii) suit (car les er(k, pour k G Zm, forment une base de Escr(Rm)) du (ii) et
de ce que Esc(Rm) est la réunion des Escr(Rm), pour r G N.
IV.4. TRANSFORMÉE DE FOURIER DANS L2
351
2. Définition de la transformée de Fourier dans L2
Théorème IV.4.3. (Plancherel, 1910) & : Esc(Rm) -> L2(Rm) se prolonge par
continuité en une isométrie de L2(Rm) sur L2(Rm) dont l'inverse est <f> 1-* &(f), avec®)
~&(j)(x) = &$(-x). Autrement dit :
(i) (^1,^2) = (<h,<h)> si <t>\,fa e L2(Rm) {& est une isométrie),
(ii) &{&<\>){x) = <t>(-x), si<t>e L2(Rm) (formule d'inversion de Fourier dans L2).
De plus, les formules du n° IV.2.2, pour les dilatations, translations et multiplications
par un caractère, sont encore valables dans L2(Rm), et si <f> G L*(Rm) H L2(Rm), les deux
définitions de &<j> coïncident.
Démonstration. Il résulte du (iii) de la prop. IV.4.2 et de la densité de Esc(Rm) dans
L2(Rm), que & peut se prolonger par continuité, de manière unique, en une isométrie
de L2(Rm) sur un sous-espace^10^ de L2(Rm). De plus, les formules pour les dilatations,
translations et multiplications par un caractère s'étendent à L2(Rm) par continuité.
Maintenant, si (j> G L^R"1) D L2(Rm), notons (provisoirement) &\<\> (resp. <^*2</>) la
transformée de Fourier de <f> dans L^R™) (resp. L2(Rm)). Soit (/j)jeN une suite d'éléments
de Esc(Rm) convergeant vers <f> à la fois dans \}(Km) et dans L2(Rm) (cf. th. III.2.11).
Alors &ifj = &2Îj tend uniformément vers la fonction continue ^i<j> et en norme || ||2
vers «^2</>. D'après le lemme III.2.14, cela implique &i<f) G L2(Rm) et «^i</> = &2(f> PP-
Pour conclure, il suffit donc de prouver l'on a & o & = s, où 5 : L2(Rm) —> L2(Rm)
est l'application déduite de celle sur j£?2(Rm) définie par s(<f>)(x) = <f>(-x). En effet ceci
prouve à la fois la surjectivité et le fait que & est l'inverse de &'. Par continuité des
applications &o& et s, il suffit de vérifier qu'elles coïncident sur Esc(Rm), qui est un sous-espace
dense, et par linéarité, il suffit de le prouver pour une famille génératrice de Esc(Rm), par
exemple la famille des er>k, pour r G N, et k e Zm. Enfin, comme les er>k sont obtenues
par translation et dilatation à partir de la fonction /3m(t) = njLi l[_i,i[(fy)> il suffit de
prouver que ^A»)(t) = (3m(-t) dans L2(R™). Or on a (^»)(*) = UT=i ^> et on
est ramené à calculer la transformée de Fourier de IlJLi S'"I** • Les arguments étant les
mêmes pour m = 1 que pour m quelconque, nous ne traiterons que le cas m = 1, ce qui
a pour avantage de raccourcir un peu les expressions.
On doit donc calculer la transformée de Fourier de a(t) = Ë1^. Comme a n'est pas
sommable, on ne peut pas utiliser l'expression â(x) = fKe~2™xta(t)dt pour faire le
calcul. Pour contourner le problème, constatons que ct\(t) = e~nX^a(t) tend vers a dans
L2(Rm), quand À tend vers 0, car |û:a| est majoré, pour tout À ^ 0, par \a\ qui est de carré
sommable, et a\(t) tend vers a(t) quand À tend vers 0, pour tout t eK. Par continuité
^Écrire <l>(x) est un abus de notation ; pour être correct, il vaudrait mieux écrire & = & o s, où
s : L2(Rm) -» L2(Rm) est l'application déduite, par passage au quotient, de l'application s sur Jè?2(Rm),
définie par s(<l>)(x) = <j>{—x).
(10)Comme on est en dimension infinie, l'injectivité n'implique pas, a priori, la surjectivité.
352
CHAPITRE IV. TRANSFORMÉE DE FOURIER
de <^", on en déduit que &ol\ tend vers &a dans L2 quand À tend vers 0. Or on a calculé
&ot\ (cf. IV.4.1), et il est apparent sur la formule que &a\{x) tend vers l[_U|(a;), quand
À tend vers 0, pour tout x ^ ±.\. On en déduit que &a = l[_i,i[ PP-, ce qui permet de
conclure.
Remarque IV.4-4- On a été confronté, au cours de la démonstration, au problème du
calcul de la transformée de Fourier d'une fonction </>, de carré sommable, mais non som-
mable. On s'en est sorti par un passage à la limite, en multipliant (f> par e~7rA(l*1l+"'+l*ml), et
en faisant tendre À vers 0. Une autre manière de procéder est de prendre une suite
croissante (Xn)ngn d'ensembles bornés dont la réunion est Rm, et d'écrire &</> comme la limite
de «^*(1Xn</») quand N tend vers +co (en effet, Ixn^ tend vers (f> dans L2(Rm) d'après le
théorème de convergence dominée, et lxN</> est sommable puisque de carré sommable et
à support borné).
Corollaire IV.4.5. Si /,# G L2(Rm), alors /Rm gf = /Rm fg.
Démonstration. Posons <j>\ = &f, et </>2 = g. On a ^(f>i = /, et donc
/ 9/ = (<h,<h) = W>i,^<M = / fg,
ce qu'il fallait démontrer.
3. Comparaison des transformées de Fourier dans L1 et L2
Proposition IV.4.6. Si /1 G L^R"1) et f2 G L2(Rm) ont même transformée de
Fourier, alors f\ = f2.
Démonstration. Si <£ G ^?°(Rm), alors &</> 6 L^R™) HL2(Rm) d'après le cor. IV.3.23 ;
en particulier, <^(«^*</>) = (f>. Comme f et g ont même transformée de Fourier, on déduit de
la prop. IV.3.24 et du cor. IV.4.5, utilisés pour g = &(}>, que /Rm fi</> = /Rm f2(f>. D'après
l'exercice III.3.13, ceci implique /1 = f2.
Proposition IV.4-7. (Formule d'inversion de Fourier dans L1) Si (j> 6 L*(Rm) a une
transformée de Fourier sommable, alors <j> = &$.
Démonstration. Par hypothèse, 0 G L^R™). Par ailleurs, on sait que 0 est bornée
puisque </> G L^R™). Donc \(f>\2 < H^Hoo • |<£|, et $ 6 L2(Rm), ce qui fait que ^<f> est
un élément de L2(Rm) ayant même transformée de Fourier que </> (grâce à la formule
d'inversion de Fourier dans L2(Rm)). La prop. IV.4.6 permet de conclure.
4. Dérivation
Théorème IV.4.8. (i) Si f G Hfc(Rm), alors (l + ||a;||2)fc/2/(a;) est de carré sommable,
J?(d*f) = (2mtc)£/ si teNm vérifie \£\ < k, et ||(1 + ||*||2)*>2/Ï|2 < (1 + §)fc||/||H*.
(ii) Réciproquement, si (1 + ||£||2)fc/2/(£) est de carré sommable, alors f G Hfc(Rm), on
a #/(*) = (-2J7r)W^(«V), » W < *, et ||/||„. < (ar)*|(l + W/ll».
IV.4. TRANSFORMÉE DE FOURIER DANS L2
353
Remarque IV.4.9. (i) Le (i) s'applique en particulier à une fonction de classe if* dont
toutes les dérivées partielles d'ordre ^ k sont de carré sommable.
(ii) On déduit du théorème une définition « par Fourier » de l'espace de Sobolev Hfc(Rm).
C'est l'ensemble des / G L2(Rm) tel que (1 + ||z||2)fe/2/ G L2(Rm). On peut étendre cette
définition àfc€ R+, et parler de l'espace de Sobolev Hs(Rm), pour 5 G R+ (et même
pour s G R en supprimant la condition / e L2(Rm), mais on tombe alors sur un espace
de distributions).
Démonstration. On sait déjà que ^(d1/) = (2i7rx)£f, si / 6 ^cfc(Rm). Maintenant,
^od* : H*(Rm) -> L2(Rm) est continue, comme composée de d* : H*(Rm) -► H*-W(Rro),
qui est continue d'après le n° 5 du § II.2, de l'inclusion de H*~W(Rm) dans L2(Rm) qui est
1-lipschitzienne, et de & : L2(Rm) -» L2(Rm) qui est une isométrie. Comme ^fc(Rm) est
dense dans Hfc(Rm) par construction, cela permet d'en déduire que &{&f) = (2iTrx)efi
quel que soit / G Hfc(Rm). En utilisant le fait que & : L2(Rm) -> L2(Rm) est une
isométrie, on obtient alors (en développant (1 + EJLi \xf\)k sous *a f°rme E|«<fca/M*)>
m
iKi+\\x\\r/2fh < ii(i+e M)*/iia < E <*\\*fh = E ^(^)"Mii^/ii2 •
On conclut la démonstration du (i) en majorant chaque ||^/||2 par ||/||h*> et en
remarquant que E|£Kfc^(27r)"m = 0- + S)*•
Passons à la démonstration du (ii). Soit E l'ensemble des / tels que (1 + ||£||2)fc/2/ soit
de carré sommable. On munit E de la norme || ||e définie par ||/||e = ||(1 + ||*||2)*^2/l|2-
Par définition, l'application / i-> (1 + PU2)*/2/ induit une isométrie de E sur L2(Rm), ce
qui fait que E est un espace de Hilbert.
Maintenant, si / est de la forme (1 + ||£||2)-/i;/2<7, où g est une fonction en escalier, alors
(l + II^H2)*/2/ est sommable, et il résulte du (ii) du théorème IV.2.8, que / est de classe if*,
et que &f = {-2m)^^{tlf), si |l| < k. En utilisant le fait que & : L2(Rm) -► L2(Rm)
est une isométrie, on obtient alors
||/|h. = sup |*/|» = sup(27r)W||tVlb < (27r)fc||(l + ||*||2)*/2/||2 = (2^)*||^||E.
Autrement dit, / t-> / est une application (27r)*-lipschitzienne de (1 + ||£||2)-fc/2Esc(Rm)
muni de la norme || ||e dans H*(Rm) muni de la norme || ||Hfc. Comme Esc(Rm) est
dense dans L2(Rm), l'espace (1 + ||£||2)-*/2Esc(Rm) est dense dans E, et comme H*(Rm)
est complet, on en déduit que / »-» / induit une application (27r)*-lipschitzienne de E
dans H*. Autrement dit, si (1 + PU2)*/2/ est de carré sommable, alors / G H*(Rm) et
||/||h^ (fcr)*||(l + ||t||2)*/2/||2.
Il reste à prouver que l'on a d^f = (—2m)\l\&(iïf), quel que soit / G E, sachant
que que c'est vrai pour / dans un sous-espace dense. Or 8e o & : E —> L2(Rm) est
continue, puisque l'on vient de prouver que & : E —> H*(Rm) est continue et que
354
CHAPITRE IV. TRANSFORMÉE DE FOURIER
0e : Hfe(Rm) -> H*-l*l(Rm) C L2(Rm) est continue. De même, / •-> t£f est continue
(et même 1-lipschitzienne) de E dans L2(Rm), et donc / i-> (—2iK)W&(t?f) est continue
de E dans L2(Rm). On a deux applications continues coïncidant sur un sous-espace dense ;
elles sont donc égales, ce qui permet de conclure.
CHAPITRE V
FONCTIONS HOLOMORPHES
Une fonction holomorphe sur un ouvert Q est une fonction de Q, dans C qui est ^°°
au sens complexe et somme de sa série de Taylor autour de chaque point. Ces fonctions
jouissent de propriétés de rigidité absolument remarquables et qui peuvent sembler
miraculeuses si on se réfère à ce que l'on connaît des fonctions d'une variable réelle. Une des
premières surprises que l'on rencontre est qu'une fonction est holomorphe si et seulement
si elle est de classe tf1 (au sens complexe) ! Ceci est une des nombreuses conséquences
de la formule intégrale de Cauchy (th. V.4.6). Cette formule et ses conséquences
immédiates (rem. V.4.9, th. V.5.1, V.5.4 et V.5.7), couplées avec le principe du maximum
(th. V.3.11), le théorème des zéros isolés (th. V.3.3) et la formule des résidus de Cauchy
du chapitre suivant, permettent d'attaquer une variété de problèmes assez spectaculaire.
Parmi ceux-ci, mentionnons le théorème fondamental de l'algèbre (ex. V.3.13, cor. V.4.15
ou ex. VI.3.21), le théorème des 4 carrés de Lagrange (ex. VII.6.9), la loi de réciprocité
quadratique (ex. VI.3.28), l'irrationnalité de Ç(3) (prob. H. 12) ou encore le théorème des
nombres premiers auquel l'annexe A est consacrée.
V.l. Fonctions holomorphes et fonctions analytiques complexes
1. Séries entières
Soit K un corps. Une série entière (ou série formelle) à coefficients dans K est une
expression du type X^nS an^n, où les an sont des éléments de K. L'ensemble K[[T]] des
séries entières à coefficients dans K contient l'anneau K[T] des polynômes à coefficients
dans K, et on munit K[[T]] d'une structure d'anneau étendant celle de K[T] en posant
+oo +oo +oo +oo +oo +oo n
( E <*•)+( E 6»T") = E^+wt», ( E <n ( E 6»'r) = E ( Ea*6»-*) 'r-
n=0 n=0 n=0 n=0 n=0 n=0 /c=0
On définit la valuation î>t(F) de F = Sn€NûnTn comme étant le plus petit élément
de l'ensemble des n e N vérifiant an ^ 0, si F ^ 0, et comme étant +oo, si F = 0.
On a vT(FQ) = vT(F) + vT(G), et vr(F + G) ^ inf(vr(F), vr(G)). En définissant | |T,
356
CHAPITRE V. FONCTIONS HOLOMORPHES
par |F|T = c~Wt(p), cela se traduit par |FG|T = |F|T|G|T et |F + G|T < sup(|F|T, |G|T).
Cette dernière inégalité (ultramétrique), plus forte que l'inégalité triangulaire, montre que
d(F,G) = |F — G|t est une distance sur K[[T]]. On vérifie facilement, que K[[T]] est
complet pour cette distance, qu'une série X^neN ^n converge, si et seulement si |Fn|T —» 0
(ce qui équivaut à vr(Fn) —» +00), et que K[T] est dense dans K[[T]], ce qui prouve que
K[[T]] est le complété de K[T] pour la (distance associée à la) valuation vr. Ceci fournit
une construction topologiqueW de K[[T]] à partir de K[T].
Si F = En5anTn e K[P11» soit F' = EnS^nT71"1 la dérivée de F. On définit par
récurrence la dérivée k-ième F^ comme la dérivée de F^_1\ en posant F^ = F, et donc
p(i) _ p/ La dérivée seconde F*2) est souvent aussi notée F". Un calcul immédiat montre
Exercice V.l.l. (i) Montrer que, si F,G € K[[T]], alors (FG)' = F'G + FG'.
(ii) Montrer que, si (Fn)neN est une suite d'éléments de K[[T]] telle que 52n€N ^n converge dans K[[T]],
et si F est la somme de la série, alors la série I2n€N ^n converge dans K[[T]], et on a F' = £n€N F'n.
(iii) Montrer que, si F = £n€NanTn € K[[T]], et si G € TK[[T]], alors En€NanGn converge dans
K[[T]], et la limite F o G vérifie (F o G)' = (F' o G) G'.
Exercice V.1.2. Soit (wn)n€N € CN vérifiant la relation de récurrence un+2 — 3un+i + 2un = 1, pour
tout n € N, et soit F = £nGN «nTn G C[[T]]. Calculer (1 - 3T + 2T2)F(T) en fonction de «0 et Ui. En
déduire une formule générale pour un.
On ne s'intéressera, par la suite, qu'au cas K = C, mais les exemples qui suivent ont
un sens sur un corps K de caractéristique 0 quelconque.
Exemple V.1.3. • La série exponentielle. Si À G C, on note exp(ÀT) la série formelle
SnS ITT I™- C'est la solution formelle de l'équation différentielle F' = ÀF dont le terme
constant est 1, et on a exp(ÀT) exp(fiT) = exp((À + fi)T).
• Les séries puissances. Si a € N, alors (1 + T)Q = X^n3 (n)^"' d'après la formule du
binôme, et l'annulation de ("), pour n> a. Par analogie, on définit (1 + T)a, pour a 6 C,
comme la série entière X^nS (n)^n- Si a,/? 6 N, on a
+00 n +00
E ( E O ULù)v = a+ï)"(i+t)' = (i+'ir+" = E (a:")T",
n=0 fc=0 n=0
ce qui se traduit par le fait que les polynômes en 2 variables (X*Y) et X^Ï=o (*) (n-k)
W On obtient une construction algébrique en remarquant que F G K[[T]] est déterminée si on connaît
ses n premiers coefficients, quel que soit n G N. Autrement dit F est déterminée par ses images Fn dans
K[T]/(Tn), pour n G N, et l'application F ■-► (Fn)nGN permet d'identifier K[[T]] à la limite projective
lim K[T]/(Tn) des K[T]/(Tn), ensemble des suites (Fn)nGN, où Fn G K[T]/(Tn), et Fn+1 G K[T]/(Tn+1)
a pour image Fn modulo Tn, quel que soit n G N. On remarquera l'analogie avec la construction des
nombres p-adiques.
V.l. FONCTIONS HOLOMORPHES ET FONCTIONS ANALYTIQUES COMPLEXES 357
prennent les mêmes valeurs sur N x N. Par suite, ils sont égaux, ce qui permet de
démontrer que (1 + T)a(l + riy = (1 + T)a+/3 quels que soient ft^eC.
La dérivée de (1+T)« est ££(*+!)COT" = a(H-T)-1, car (n+1)^) =«{*?)■
• La série du logarithme. On définit log(l + T) comme la série £+~ i=^T». Sa
dérivée est E:ro(-l)nTn = ï^.
Exercice V.l.I (i) Montrer que log(exp(AT)) = AT dans C[[T]].
(ii) Montrer que (1 +T)a = exp(alog(l+T)) dans C[[T]]. (On pourra appliquer l'opérateur (1+T)^
aux deux membres.)
Exercice V.1.5. (i) Si a € C, résoudre l'équation différentielle (1 +T)F' = a¥ dans C[[T]], avec la
condition F(0) = 1 (i.e. F = 1 + 01T + • • • )•
(ii) Résoudre l'équation différentielle T2F' + TF + F = 1 dans Q[[T]].
2. Rayon de convergence d'une série entière
Si Zq 6 C et si r > 0, on note D(z0,r) le disque fermé de centre Zq et de rayon r (i.e.
l'ensemble des z G C vérifiant \z — zq\ ^ r), et D(zo,r~) le disque ouvert de centre Zq et
de rayon r (i.e. l'ensemble des z 6 C vérifiant \z — Zq\ <r).
Rappelons (n° 15.4 du Vocabulaire) que, si F = X^nSan^n € C[[T]], il existe un unique
p(F) 6 R+, appelé rayon de convergence de F, tel que, si \z\ < p} la série J2t=o anzU soit
normalement convergente, et si \z\ > p(F), la suite anzn ne soit pas bornée (et donc la
série soit divergente). On a par ailleurs p(F)~l = limsuplaj1/71.
Si z € D(0,/9(F)~), on note F(z) la somme de la série YltZanzn- La vérification du
résultat suivant est laissée au lecteur.
Lemme V.l.6. Si F,G <E C[[T]], alors
p(F + G) ^ inf(p(F), p(Q)) et p(FQ) > inf(p(F), p(G)),
et on a
(F + Q)(z) = F(z) + G(s) et (FG)(z) = F(z)G(z), si \z\ < inf(p(F), p(G)).
Exemple V.l.7. • Si À e C, alors /9(exp(AT)) = +00.
• p(log(l + T)) = 1, et p((l + rV)a) = 1, si a ^ N (sinon on a affaire à un polynôme dont
le rayon de convergence est infini). En effet, si a 6 C - N, alors |(„+!)/(")! = |^y| —> 1,
et donc K")!1^71 —> 1 (version multiplicative de la moyenne de Césaro).
• La sériel X^S(—^)nn^n a un rayon de convergence nul.
Remarque V.l.8. Comme (1+T)a(l+T)0 = (l+T)a+/? dans C[[T]], et comme les trois
séries entières ci-dessus ont un rayon de convergence ^ 1, on a (l+z)a(l+z)P = (l+z)a+P
(2)C'est la série de Taylor en 0 de la fonction f(x) = /0+o° -fç^dt, qui est <^'00 sur R+, ce qui faisait
dire à Euler que H^(-l)n«! = /o+°°f+ï^- ^n remarquera quand même que / satisfait l'équation
différentielle x2f + xf + f=lde l'ex. V.1.5
358
CHAPITRE V. FONCTIONS HOLOMORPHES
quels que soient z G D(0,1 ), et a, (3 G C. En particulier, si m G N- {0}, alors (1 + 2)1/m
est une racine ra-ième de 1 + 2, quel que soit z G D(0,1~).
Exercice V.1.9. Soit aGR-N'3».
(i) Exprimer (J) en termes de la fonction T.
(ii) En déduire qu'il existe C(a) G C tel que (J) ~ G(a)(-\)nrr1-*. (On utilisera la formule de
Stirling (ex. IV.1.5).)
Proposition V.1.10. (i) Si F = £nSanTn G C[[T]], alors p(F<*>) ^ p(F), gue/ g«e
sotà A; G N, et si \z0\ + \z - z0\ < p(F), alors
FW-E(E("î*)«-*)(.-*)» = g^(«-*)».
fe=0 n=0 ^ ' Jfc=0
(ii) « ko| < P(P), a/ors lim,^ ^£^ = F'(*0).
Démonstration. Si |^o| + |^ - 20| < p(F), on a
+00 +0O • , s +00 /• \
E(E("t )i«^4i)i*-*i*=E E (?)k.ii*ii*-*i*
fc=0 n=0 ^ ' m=0n+fc=m ^ '
+oo
= Z) |ûm|(ko| + \Z~ Zo\)m < +CO,
m=0
ce qui montre que la série double de la proposition est absolument convergente. En fixant k,
on en déduit que F(fc) converge si \zq\ < p(F), et donc /o(F(fc)) ^ p(F). De plus, on peut
réordonner les termes comme on veut, et commencer par sommer sur n + k = m, puis
sommer sur m G N. La somme pour n + k = m étant J2n+k=m {Z)amZo(z ~ zo)n — <W"\
cela démontre le (i).
Le (i) permet, en faisant le changement de variables z = z0 + h, de supposer que z0 = 0
pour démontrer le (ii). Or on a
lFW"F(0) - mi - i^E0»'1""2! < w (Êwwiw-'), si w < ^F)/2'
n=2 n=2
et comme £J2 MMF)/2)n~2 < +°°> on en déduit <lue F(/t)~F(0) - F'(0) tend vers 0
quand h —* 0, ce qui permet de conclure.
Remarque V.l.ll. On peut reformuler le (ii) de la proposition précédente en disant
que, si F G C[[T]] est de rayon de convergence non nul, alors F est dérivable au sens
complexe dans D(0,/o(F)~), et que la dérivée au sens complexe de F est F'. Une
récurrence immédiate permet donc de montrer que F est de classe c€QO au sens complexe sur
(3*Les résultats de cet exercice s'étendent à et € C - N, une fois que l'on dispose de la fonction r dans
le plan complexe (cf. th. VII.2.1 et prop. VII.2.9).
V.2. EXEMPLES DE FONCTIONS HOLOMORPHES
359
D(0,/o(F) ), et que la dérivée fc-ième au sens complexe de F est la fonction associée à la
série entière F^.
V.2. Exemples de fonctions holomorphes
1. Définition
Soient O un ouvert de C, et / : O —► C. Si zq G O, si r > 0, et si D(zo,r~) C O,
on dit que / est développable en série entière sur D(zo,r~), s'il existe F G C[[ï]], de
rayon de convergence ^ r, telle que f(z) = F(z — Zo), pour tout z G D(zo,r~). Il résulte
du (i) de la prop. V.1.10 que si / est développable en série entière sur D(zo,r~)} et si
D(2i,rf ) C D(zo,r~), alors / est développable en série entière sur D(^i,rf).
On dit que / est développable en série entière autour de zq s'il existe r > 0 tel que /
soit développable en série entière sur D(zo,r~), et on dit que / est analytique sur O ou
encore que / est holomorphe sur O, si / est développable en série entière autour de tout
point de O. Il résulte de la rem. V.l.ll qu'une fonction analytique sur O est de classe if°°
au sens complexe sur O.
Exemple V.2.1. (i) Un polynôme est une fonction holomorphe sur C.
(ii) z i-* exp(Xz) est holomorphe sur C, pour tout À G C ; sa dérivée est z i-> Àexp(À2).
(iii) z i-> i est holomorphe sur C — {0} ; sa dérivée est z i-> ^jf.
(iv) z i-* log(l + z) et z t-* (1 + z)s, si s G C, définies à partir des séries formelles de
l'ex. V.1.3, sont holomorphes sur D(0,1~) ; leurs dérivées sont respectivement z *-* ^ et
(v) Si / et g sont holomorphes sur O, alors / + g et fg sont holomorphes sur O ; leurs
dérivées sont respectivement /' + g' et fg + fg'.
(vi) Si / : Oi —► 02 et g : 02 —► C sont holomorphes, alors gof est holomorphe sur Oi ;
sa dérivée est {g' o /)/'.
(vii) Si / : Oi —*■ 02 est holomorphe bijective, sa réciproque f~l : 02 —► ^i est
holomorphe.
(viii) Une fonction rationnelle est holomorphe sur l'ouvert complémentaire de ses pôles.
Démonstration. Le (i) est évident. Le (ii) et le (iv) suivent de l'exemple V.1.7. Le (iii)
se démontre en constatant que \ = X^nS n*{ » si \z — zo\ < \zo\. Le (v) résulte du
lemme V.1.6. Le (vi) et (vii) pourraient se démontrer directement, mais nous attendrons
d'en savoir plus pour en donner une démonstration élégante (cf. cor. V.4.8). Enfin, le (viii)
se déduit des (i), (iii), (v) et (vi).
Exercice V.2.2. (i) Montrer que z ■-» sinz = ^{eiz - e~iz) et z ■-» cosz = \{ëz + e~iz) sont
holomorphes sur C, et que z t-> cotg tcz = ^ff est holomorphe sur C - Z.
(ii) Montrer que z *-* \z\2 est<^'00 au sens réel sur C = R2, mais n'est pas holomorphe.
360
CHAPITRE V. FONCTIONS HOLOMORPHES
2. Logarithme et fonctions puissances
Soit a e R. L'application 2 t-> ez est holomôrphe et est une bijection de la bande
{z, a < lm(z) < a + 2ir}y sur C privé de la demi-droite R+e"* d'argument a(oua + 2ir,
ce qui revient au même). La bijection réciproque
loga : C - R+eia -> {z, a < lm(z) < a + 2n}.
est donc une fonction holomôrphe, d'après le (vii) de l'ex. V.2.1.
Comme exp(loga(2)) = z sur C — R+ei0(, on obtient, en dérivant cette relation, que
la dérivée de loga sur C — R+et0! est \, et donc que loga vérifie les propriétés que l'on
est en droit d'attendre d'une fonction logarithme. Le seul problème est qu'on ne peut
pas définir le logarithme comme une fonction holomôrphe sur C* tout entier, à cause de
la discontinuité le long de la demi-droite R+e"* (les limites « à gauche » et « à droite »
diffèrent de 2iir, le long de cette demi-droite). Ce problème(4) est dans la nature des choses :
le logarithme est une fonction holomôrphe multivaluée sur C*, et chacune des fonctions
loga ci-dessus correspond au choix d'une détermination du logarithme, holomôrphe dans
un ouvert aussi grand que possible. La détermination principale du logarithme est la
fonction log.^ ; c'est donc la détermination du logarithme, définie sur C privé de la demi-
droite réelle négative R_, et qui vaut 0 en 1 ; ses valeurs ont une partie imaginaire dans
l'intervalle ] - 7r,7r[. Dans la pratique, on ne met pas le a en indice, ce qui demande de
faire attention à ce que signifie exactement log z dans la situation que l'on considère ; les
valeurs possibles de log z étant les 2m k + log.,,. z, pour & G Z.
Exercice V.2.3. Soit log la détermination principale du logarithme.
(i) Montrer que log z = log \z\ + iargz, où axgz €] - 7r,7r[ est l'argument principal de z.
(ii) Soient zXyZ2 € C - R_, tels que z\Z2 € C - R_. Déterminer, suivant les cas, la valeur de
log(ziZ2) - logzi - log 22.
Exercice V.2.4- Soient A < B deux réels, et a = eA et b = eB. On note H(A,B) la bande horizontale
{z € C, A < ïm(z) < B} et C(a,6) la couronne {z € C, a < \z\ < b}. Soit / : ft(A,B) -> C, périodique
de période 1.
(i) Montrer qu'il existe une unique / : C(a,6) —» C, telle que f(z) = f(e2i*z), pour tout z € fi(A,B).
(ii) Montrer que / est holomôrphe sur C(a,6) si et seulement si / l'est sur ft(A,B).
Si 5 G C*, on définit zs par la formule zs = exp(slog2). Comme la fonction log z est
multivaluée, il en est de même de zs, et il faut donc bien faire attention au choix que l'on
a fait de log z. Si a est une valeur possible de zs, les autres sont les e2ilTksa, pour k G Z.
En particulier, on peut se débrouiller, par un choix convenable de la détermination de
(4>I1 a fortement perturbé nos ancêtres. Bernoulli et Leibnitz se sont battus (épistolairement), en 1712-
1713, sur la valeur de log(-l), l'un soutenant que log(-l) = 0 car 21og(-l) = log(-l)2 = logl = 0, et
l'autre que log(-l) devait être imaginaire car log(-l) = -2 - \ - \ • • • ne converge pas... Il a fallu
attendre 1749 pour qu'Euler explique qu'un nombre complexe a une infinité de logarithmes. Le lecteur
trouvera dans les exercices corrigés H.l.ll, H.1.13 et dans la démonstration du th. VII.3.7, des exemples
d'utilisation du logarithme complexe.
V.3. PREMIÈRES PROPRIÉTÉS DES FONCTIONS HOLOMORPHES
361
logz, pour que zs soit holomorphe dans C - H+eia, mais, si s £ Z, la fonction zs ne peut
pas se prolonger en une fonction holomorphe sur C*. Même si on prend la détermination
principale du logarithme, il n'est pas toujours vrai que z\z^ = (^î^)5- Par contre, la
fonction s t-> zs est, elle, holomorphe sur C tout entier, et on a zsl+S2 = zslzS2 (si on ne
s'amuse pas à changer la valeur de log^). En particulier, si m G N — {0}, alors zxlm est
une racine m-ième de z, quelle que soit la détermination du logarithme choisie.
Remarque V.2.5. On verra plus loin (prop. V.4.10 et ex. V.4.12) que les restrictions
de^M log(l + z) et z i-> (1 + z)s, si 5 G C, coïncident avec les fonctions du (iv) de
l'ex. V.2.1, si on choisit la détermination principale du logarithme.
Exercice V.2.6. (i) Soit Q = C - [0,1]. Montrer qu'il existe deux fonctions /, holomorphes sur î), dont
le carré est z ■-» z(z — 1).
(ii) Soient ai,..., a2n, des éléments distincts de C. Montrer qu'il existe une permutation a de 1,..., 2n
telle que les segments [a^t-i). a«r(2t)]> pour 1 < i < n soient disjoints, et que si Q est l'ouvert
complémentaire de ces segments, il existe deux fonctions /, holomorphes sur Q, dont le carré est z t-> fli^iC2 - a*)-
V.3. Premières propriétés des fonctions holomorphes
1. Relations de Cauchy-Riemann
Remarque V.3.1. (i) On peut aussi considérer une fonction holomorphe / comme une
fonction, à valeurs complexes, des variables x = Re(z) ety = lm(z). En notant P et Q les
parties réelle et imaginaire de /, cela permet de voir / comme une fonction de classe if1
(et même de classe #°°) d'un ouvert de R2 dans R2. La dérivabilité de / au sens complexe
en zq s'exprime alors par le fait que la différentielle de / en zq est une similitude, ce qui
se traduit par les relations de Cauchy-Riemann
f|(*) = §(*>) = totfW) et Jfo,) = -g(zo) = -Im(/'(*„))
entre les dérivées partielles des parties réelle et imaginaire de / en z0. Le jacobien de /
en zq est alors |/'(2o)|2 ; en particulier, sa nullité est équivalente à celle de f(zo).
(ii) Comme les similitudes ont comme propriété de conserver les angles de vecteurs (mais
pas les longueurs), une fonction holomorphe f hérite de cette propriété, et donc conserve
les angles, ce qui signifie, par exemple, qu'elle transforme deux courbes se coupant à angle
droit en zq en deux courbes se coupant à angle droit en f(zo), si f'(zo) ^ 0.
(iii) Réciproquement, soit / : Q, —> C une fonction, de classe ^x en tant que fonction
de x et y. Soient ^ et J|, les opérateurs différentiels définis par
dz~2^'dx'~%dy> et dz~ 2^dx+îdy)'
Ces notations sont justifiées par les formules
362
CHAPITRE V. FONCTIONS HOLOMORPHES
On en déduit que l'on a f(zo + h) = f(zo) + ^(z0) • h + ^(^o) • h + o(\h\) au voisinage
de h = 0. La différentielle de / est une similitude, si et seulement si %{zo) = 0, et donc
/ est dérivable au sens complexe en zo, si et seulement si %{zq) = 0. Ceci permet de voir
une fonction de classe tf1 au sens complexe, comme une fonction qui « ne dépend que de
z et pas de ~z » ^, et explique un peu le miracle de la prop. V.4.7.
Exercice V.3.2. (i) Soit P € C[X] de degré ^ 2. Montrer que, si P ne s'annule pas dans C, alors 1/P
et ses dérivées partielles par rapport à x et y sont de carrés sommables sur C = R2. En déduire que la
transformée de Fourier de 1/P (vu comme fonction de x et y) est identiquement nulle, puis que C est
algébriquement clos.
(ii) Adapter l'argument ci-dessus pour n'utiliser que la transformée de Fourier dansL^C).
2. Théorème des zéros isolés et unicité du prolongement analytique
Si / est analytique sur O, et si zq G O, on définit l'ordre du zéro vzo(f) G N U {+00}
de f en Zo comme la valuation v-r(F) de la série entière F telle que f(z) = F(z — Zo). Si
cet ordre est +00, c'est que la fonction / est identiquement nulle dans un voisinage de zq
(i.e. il existe r > 0 tel que f(z) = 0 si z G D(z0ir~)). Si cet ordre est fini, égal à &, on
peut factoriser F sous la forme F = T^G, avec G(0) ^ 0. Par continuité, Q(z - z0) ne
s'annule pas dans un voisinage de Zo, ce qui prouve que zq est le seul zéro de / dans ce
voisinage.
Théorème V.3.3. (des zéros isolés) Soit O un ouvert connexe de C. Si f est une
fonction holomorphe sur Q qui n'est pas identiquement nulle, et si zq 6 O est un zéro
de /, alors il existe r > 0 tel que zq soit le seul zéro de f sur T>(zo,r).
Démonstration. D'après la discussion précédant le théorème, Zq est un zéro non isolé
si et seulement si vZo(/) = +00. L'ensemble des zéros non isolés est donc fermé car c'est
l'intersection des fermés {z, /(n)(^) = 0}, pour n G N, et ouvert car si f^(z0) = 0
pour tout n, alors / est identiquement nulle dans D(zo,r~), si / est développable en série
entière dans D(zo,r~). Comme O est supposé connexe, on en déduit que l'ensemble des
zéros non isolés est soit O (auquel cas / est identiquement nulle), soit l'ensemble vide.
Ceci permet de conclure.
Exercice V.3.4- Soit / : Cl —> C holomorphe, et soient x0 € Q et r > 0 tel que D(x0,r) c Cl. On
suppose que f(xo) ^ 0; montrer que / n'a qu'un nombre fini de zéros dans D(xo,r).
Exercice V.3.5. Soit / holomorphe sur C vérifiant /(£) = 4j-, pour tout n € N - {0}. Montrer que
f(z) = z2 pour tout z € C.
(5)Ceci ne doit pas être pris littéralement vu que z et z ne sont pas indépendants, mais se comprend bien
si on regarde un polynôme ena;= \{z + z) et y = ^(2-2) comme un polynôme en z et ~z : on voit que
P{x,y) définit une fonction holomorphe si et seulement si le polynôme Q(z,z) = P(^(z + z), ^(z - z))
n'a pas de terme en z.
V.3. PREMIÈRES PROPRIÉTÉS DES FONCTIONS HOLOMORPHES 363
Exercice V. 3.6. Peut-on trouver une fonction #°°, non identiquement nulle, à support compact dans R,
dont la transformée de Fourier soit à support compact ?
Corollaire V.3.7. (Unicité du prolongement analytique) Soient ficîî' deux ouverts
non vides de C. Si O' est connexe, et si f et g sont deux fonctions analytiques sur Q,'
ayant la même restriction à O, alors f = g sur Q' tout entier.
Démonstration. Il suffit d'appliquer le théorème des zéros isolés à / — g.
Remarque V.3.8. Soit / une fonction holomorphe sur un ouvert O de C, et soit Q! un
ouvert connexe de C contenant Q. Il est, en général, impossible de trouver une fonction
holomorphe g sur Q! dont la restriction à O soit /. Dans le cas où c'est possible, le corollaire
précédent montre que g est unique ; elle est appelée le prolongement analytique de f à Cl'.
On prendra garde au problème suivant. Si Oi et O2 sont deux ouverts connexes,
contenant O, sur lesquels / admet des prolongements analytiques. f\ et /2, on ne peut pas en
conclure, en général, que /1 = fa sur Oi n O2 (le problème étant que Oi n fi2 n'a aucune
raison d'être connexe). Le logarithme fournit un exemple de ce phénomène. Évidemment,
si / admet un prolongement analytique à C tout entier, ce prolongement analytique est
véritablement unique.
Exemple V.3.9. La fonction analytique / définie sur D(0,1~) par f(z) = ^nS2"
admet un prolongement analytique à C — {1} : en effet, elle coïncide^, sur D(0,1~), avec
j^ qui est holomorphe sur C — {1}. Cet exemple n'est qu'à moitié convaincant car on
est parti de la fonction ^ qui est visiblement holomorphe sur C — {1}, mais on verra
des exemples moins banals plus tard (ex. V.5.9, th. VII.3.4 et VII.4.4, ou prob. H. 10 par
exemple).
Exercice V.3.10. Montrer que f(z) = ^*0/' est holomorphe sur D(0,1~), mais n'a de
prolongement analytique à aucun*7* ouvert connexe contenant strictement D(0,1~). Quid de £*f^ ^r ?
(6)On a donc envie d'écrire 1+2+4+8H = -1, ce qu'Euler aurait fait sans aucun scrupule. Dans la
même veine, on a (ex. VII.3.6)
l + l + l + l+.=<(0) = ^, 1+2 + 3 + 4 + ..-= C(-l) = ^, l+4 + 9+16+.=C(-2) = 0,..
Manipuler des séries divergentes est amusant mais demande un certain doigté. Par exemple, il ne faut
pas confondre Ylt^o * = 1 + C(0) = 5.avec Hn^i * = C(0) = ~\- ^es physiciens ont acquis une dextérité
certaine en la matière; les mathématiciens ont plus de complexes depuis que Cauchy a déclaré, dans
son Cours d'analyse à l'École polytechnique, paru en 1821 : « Je me suis vu forcé d'admettre plusieurs
propositions qui paraitront peut-être un peu dures au premier abord. Par exemple (...) qu'une série
divergente n'a pas de somme. »
(7)()n peut montrer, mais c'est nettement plus difficile, que si ^2n™oanzni avec an € Z pour tout n, a
pour rayon de convergence 1, et s'il existe un ouvert connexe contenant strictement D(0,1~) sur lequel
/ admet un prolongement analytique, alors / est une fraction rationnelle de la forme (1^ffi)fc, où P est
un polynôme à coefficients dans Z (th. de Pôlya-Carlson (1921)), cf. prob. H. 13 pour un ancêtre de ce
résultat.
364
CHAPITRE V. FONCTIONS HOLOMORPHES
3. Principe du maximum
Théorème V.3.11. (Principe du maximum) Si fi est un ouvert connexe de C, si
zq G fi, si f holomorphe sur fi, et si \f\ admet un maximum local en zq, alors f est
constante sur fi.
Démonstration. Si / n'est pas constante sur fi, la fonction / — f(z0) n'est pas
identiquement nulle sur fi, et fi étant connexe, le développement en série entière de / — f(z0)
autour de z0 n'est pas identiquement nul. Il existe donc k G N — {0} et a G C* tels que
f(z) = f(zo) + a • (z - z0)k + (z- zo)ke0{z), avec lim^zo e0(z) = 0.
• Si f(z0) = 0, alors z0 est un zéro isolé de /, et \f(z)\ > \f(zo)\, Quel Que soit z dans
un voisinage de zq ; en particulier, |/| n'admet pas de maximum local en zq.
• Si f(z0) ^ 0, soit (3 avec pk = a~lf(z0). On a alors f(z0+tp) = f(z0)(l+tk+tk£i(t))>
avec \imt->oei(t) = 0. Ceci implique que |/(z0 +10)\ > \f(zo)\, si t > 0 est assez petit, et
donc que |/| n'admet pas de maximum local en z0.
Ceci permet de conclure.
Remarque V.3.12. Le principe du maximum est souvent utilisé sous la forme : une
fonction holomorphe atteint son maximum au bord. Autrement dit, si K est un compact
et si / est holomorphe sur un ouvert contenant K, alors le maximum de |/| sur K est
atteint sur la frontière de K.
Exercice V.3.13. Soit P € C(X] non constant. Montrer que, si P ne s'annule pas sur C, alors |1/P|
atteint son maximum en un point de C. En déduire que C est algébriquement clos.
Exercice V.3.14- Soient o < 6 € R, et soit / une fonction holomorphe dans un voisinage ouvert de la
bande verticale B = {z € C, a < Re(z) < 6}. On suppose / bornée sur les droites Re(z) = a et Re(z) = b.
(i) Montrer que, s'il existe C > 0 et c> 0 tels que |/(z)| ^ Cec'Im(z)l, quel que soit z € B, alors / est
bornée sur B. (On considérera la fonction eez f(z).)
(ii) Montrer de même que, s'il existe C > 0, c > 0, et N € N tels que |/(^)| ^ Cec'Im^l , quel que
soit z € B, alors / est bornée sur B.
(iii) Construire une fonction holomorphe sur C, bornée sur chacune des droites Re(^) = a et Re(z) = 6,
et non bornée sur B (penser à des exponentielles d'exponentielles).
Exercice V.3.15. (Lemme de Schwarz) Soit D = {z € C, \z\ < 1}, et soit / holomorphe de D dans D
vérifiant /(0) = 0.
(i) Montrer que |/(.z)| < \z\, quel que soit z € D. (Considérer z ■-> g(z) = ^.)
(ii) Montrer que, si |/'(0)| = 1, alors f(z) = f'(0)z quel que soit z € D.
(iii) Montrer que si / est une bijection holomorphe de D dans D, et si /(0) = 0, alors il existe $ € (0, n]
tel que f(z) = e2iez, quel que soit z € D.
(iv) Montrer que si / n'est pas bijective, alors pour tout compact K de D, il existe ck < 1 tel que
1/(^)1 ^ ck|z|, Pour tout z € K-
(v) Soit fon = fofo--of(n fois). Montrer que, si / n'est pas bijective, alors fon tend uniformément
vers 0 sur tout compact de D.
Exercice V.3.16. Soit 3^ = {z € C, lm(z) > 0} le demi-plan de Poincaré.
(i) Vérifer que, si 7 = ( ac bd ) € SL2(R), alors 7 • z = fffj € J4?, et que l'on a 7172 • z = 71 • (72 • z).
V.4. LA FORMULE INTÉGRALE DE CAUCHY ET SES CONSÉQUENCES 365
(ii) En déduire que 7 1-» y>7, où y>7 est la transformation z •-» 7 • z, est un morphisme de groupes de
SL2(R) dans le groupe Aut(«^) des bijections holomorphes de 3V.
(iii) Montrer que, si z € «#", il existe 7 € SL2(R), avec z = 7 • i. En déduire que, si ip € Aut(c^), alors
il existe 7 € SL2(R) tel que i soit un point fixe de y>7 o y?.
(iv) Soit /i(^) = |=§. Montrer que h est une bijection holomorphe de 34? dans D dont la réciproque
h~l est donnée par la formule h~l{z) = «{^f.
(v) Montrer, en utilisant le lemme de Schwarz (ex. V.3.15), que si y> € Aut(J0*) fixe i, alors il existe
0 € [0,tt] tel que y>(s) = J^ffjff^. (On considéreraij> = ho<poh~l.)
(vi) Montrer que 7 1-» <p7 induit une surjection de SL2(R) sur Aut(«^£') ; en déduire que Aut(3if) est
isomorphe à SL2(R)/{±1}.
V.4. La formule intégrale de Cauchy et ses conséquences
1. Généralités sur les chemins
Un chemin 7 (sous-entendu <^?1 par morceaux) dans un ouvert fi de C est une application
7 : [a, b] —> fi, continue et <^?1 par morceaux, d'un intervalle compact [a, b] de R dans fi.
Le point j(a) est l'origine de 7 et 7(6) en est l'extrémité. On dit que 7 est un /ace£ si son
origine et son extrémité coïncident. Si t € [a, 6] est un point où les dérivées à droite et à
gauche de 7 sont distinctes, on dit que 7(2) est un point anguleux de 7. Par hypothèse, 7
n'a qu'un nombre fini de points anguleux.
Si j(t) = x(t) + iy{t), on définit la longueur lg(7) de 7 par la formule
lg(7)= / y/x>{ty + y>{tydt= f W(t)\dt
Ja Ja
La longueur est invariante par reparamètrage (un reparamètrage de 7 est un chemin de
la forme 71 = 7 o ip, où ip : [ai, 61] —> [a, 6] est une bijection croissante de classe fé71). En
effet, on a
lg(7i) = / * y/{xotpY(t)* + (yotp)'(t)*dt = f ' y/{x' o y>)(i) V(*)2 + (y' o y>)(t) VW2 dt
Jai J a\
= f l v/(î/°riW2 + (ll'ori(i)V(t)<tt = / Vrc'(s)2 + 2/'(s)2d5 = lg(7).
Ja\ Ja
Si 7 : [a, 6] —» fi est un chemin, on définit le chemin opposé 7opp : [a, 6] —» fi de 7, par
-ïopp(t)=j(a + b-t).
Si 71 : [ai,61] —> fi et 72 : [02,62] —* fi sont deux chemins, on dit que 71 et 72 sont
composables si l'origine de 72 coïncide avec l'extrémité de 71, et on définit le chemin
7i • 72 : [ai,62 — û2 + h] —* fi, composé de 71 e£ 72, en posant 71 • 72(t) = 71 (i), si
t e [ai,61] et 71 • 72(£) = 72^ + a2 - 61), si i G [61,62 - a2 + 61].
Exemple V.4-1- (chemins standard)
• Si z0 G C et r > 0, on note C(20,r) : [0,1] —> C le chemin i ■-► 20 + re2iwt ; c'est le
cerde de centre z0 et de rayon r parcouru dans le sens direct. Sa longueur est 2irr.
366
CHAPITRE V. FONCTIONS HOLOMORPHES
• Si a, b E C, on note [a, b] : [0,1] —> C le chemin t i-» a + t(b — a) ; c'est le segment
d'origine a et d'extrémité b. Sa longueur est |6 — a\.
2. Intégration le long d'un chemin
On identifie C à R2, en écrivant z sous la forme z = x+iy. Une 1-forme sur un ouvert Q
de C est une expression^ du type P dx+Qdy, où P, Q sont des fonctions continues sur Q.
Si / est une fonction de classe tf1 sur Q, la différentielle df de / peut être vue comme
une 1-forme : on a df = §£ dx + §£ dy.
Si u> = P dx + Q dy est une 1-forme sur fi, et si 7 : [o, 6] —> fi est un chemin dans fi, on
définit l'intégrale f a; par la formule
/"« = / P(7(*M*(7(*)))+Q(7(t))%(7(*))) = /P(7«)(*°7)'«+Q(7(*))(!/°7)'(*))<fc.
Dans l'intégrale ci-dessus, (#07)'(£) et (2/o7)'(£) sont bien définis sauf aux points anguleux,
mais comme ceux-ci sont en nombre fini, cela n'affecte pas l'intégrale.
Théorème V.^.%. (i) / w est invariante par reparamètrage : si ip : [ai, 61] —> [a, 6]
une bijection croissante de classe tf1, et siji =jo ip, alors f u = f u.
00 /7opp" = -/7w-
(iii) Si 71 et 72 son* composables, alors J uj = f w + f v.
(iv) Si w = df, alors Jyu = /(7(6)) - /(7(a)).
Démonstration. Le (i) résulte du calcul suivant :
[ "= f' (P(7 o ?(*))(* o 7 o <rt'(*) + Q(7 o y,(t))(y o 7 o y>)'(i)) <ft
«'7i «01
M61) /»
= / (P(7(«))(« » 7)'(s) + Q(7(«))(î/ o 7)'W) ds= w.
Le (ii) suit, via le changement de variable t ■-> a+6-£, de ce que les bornes d'intégration
sont échangées.
(8)Plus généralement, si Cl est un ouvert de Rn, et si p ^ n, une p-forme sur Cl est une expression du type
u)= ]C & lpdx^ A * ' ' A rfaV
ii<ia<-«p
où les /ti,...,tp sont des fonctions continues sur fi. (Une 0-forme est juste, par convention, une fonction
continue sur Cl.) On voit aussi souvent une p-forme w sur Cl comme une fonction x »-> a>x, continue sur fi, à
valeurs dans les formes p-linéaires alternées : si u\,..., up sont p vecteurs de Rn, avec ui = (i/i,i,..., u^n),
et si x G fi, alors (cf. ex. 6.1 du Vocabulaire) :
ùfe(tii, • • •, tip) = ]T /*i *p(x) S sW^i.M» • ' ' upMpV
ii<%2<—<iP aGSp
Ces objets jouent un rôle très important en géométrie différentielle. L'exemple de base est la 1-forme df,
si / est de classe tf1 sur fi. Sa valeur en x est la forme linéaire u i-> lim^0 -ffo+^Wfo) = J2"=i §^SX)Ui'
V.4. LA FORMULE INTÉGRALE DE CAUCHY ET SES CONSÉQUENCES 367
Le (iii) est immédiat.
Le (iv) résulte du calcul suivant :
Jdf=[ (ï(7(t))(a: ° 7)'w + %{,y{my ° 7)'w) dt
= / (/°7)'W* = /(7(6))-/(7(a)).
On note dz la différentielle dx + i dy. Si / est une fonction continue sur fi, la 1-forme
f(z)dz n'est donc autre que f(x + zy) dx + î/(x + éy) dy. Si 7 : [o, 6] —> fi est un chemin
tf1 par morceaux, alors
ff(z)dz= f /(7«)((*°7)'M + %°7)'«)d*= f f(y(t)h'(t)dt.
J-y Ja Ja
La très utile majoration du lemme suivant est immédiate, puisque lg(7) = Ja \j'(t)\ dt.
Lemme V.4.3. | /7 f(z) dz\ ^ lg(7) • supzG7(M) \f(z)\.
Exemple V.4-4- (Intégration sur les chemins standard)
(i) Si z0 G C et r-> 0, alors /c(zor) f(z)dz = 2inr f* f(z0 + re2iirt)e2intdt.
(ii) Si a, 6 € C, alors f[a 6] /(*) dz = (b- a) f* /(o + £(6 - a)) eft.
Exercice V.4-5. Soient ^1,^2 des ouverts de C, / : Q\ —> C continue et (p : fÎ2 —* ^i holomorphe.
Montrer que si 7 : [a, 6] —» £Î2 est un chemin, alors / (/ o <p)(p'(z) dz = / /(z) dz.
3. La formule de Cauchy
Théorème V.4>6. (Formule intégrale de Cauchy, 1825) Soit f de classe tf1 au sens
complexe sur fi, ouvert de C, et soient zq G fi et r > 0, tels que D(zo,r) C fi. Alors, pour
tout z G D(zo,r~), on a
'«-i/o
dw.
C(zo,r) W ~ Z
Démonstration. Si w G C(r0,r) et z G D(20,r~), on a \z — z0\ < \w — z0\, et donc
■^1 — X)n5) (i!~^o)'H-i • Comme la convergence de la série est uniforme sur le cercle, on
peut intervertir somme et intégrale, ce qui nous donne, en posant w = z0 + re2mt,
et comme tous les termes de la série sont nuls sauf celui pour n = 0 qui vaut 2m, on
obtient /c, r) ^ = 2î7t. On en tire l'identité
\2™Jc(zo,r)W-Z ' 2™Jc(zo,r) ^-Z
368
CHAPITRE V. FONCTIONS HOLOMORPHES
Maintenant, f{wl~_{{z) = fi f(w + u(z - w)) du, et
/ / f(w + u(z-w))dudw= f [ f'((l-u)(z0 + re2int)+uz)du2iirre2i*tdt
Jc(zo,r)Jo Jo JO
La fonction (t,u) >-► /'((l — u)(z0 -\-re2mt) + uz) 2mre2mt est sommable car continue sur
le compact [0, l]2 ; on peut donc utiliser le th. de Fubini pour intervertir les variables. Or
,1 !
/ f,((l-u)(zo + re2i"t) + uz)2inre2i*tdt= [—l—f((l-u)(z0 + re2iirt)^ Alt"1
Jo 1 —u
pour tout u ^ 1. On en déduit la nullité de l'intégrale double et le résultat.
4. Holomorphie des fonctions dérivables au sens complexe
Le th. V.4.6 a des conséquences totalement surprenantes pour quelqu'un de familier
avec la théorie des fonctions d'une variable réelle(9>. La prop. V.4.7 ci-dessous en est un
premier exemple, puisqu'elle montre qu'une fonction de classe fé71 au sens complexe est en
fait holomorphe (et donc, a fortiori, de classe cé>°°). Le (i) de la rem. V.4.9 et le th. V.5.1
fournissent d'autres exemples de phénomènes un peu miraculeux.
Proposition V.^.7. Si f vérifie la formule de Cauchy, et si on définit an € C, pour
n e N, par
1 f IH ,
2™ Jc(zo,r
r)(w-z0)n+1
la série F(T) = J2nS) an^n a un rayon de convergence ^ r, et on a f(z) = F(z — zo) quel
que soit z € D(z0,r~).
Démonstration. —■■ Soit M = sup^^^ \f(w)\ (M est fini car / est continue sur le
compact C(z0ir)). On a alors
<9)# La fonction (po(x) = e~~x , prolongée par continuité en 0, est ^°° sur R, mais n'est pas développable
en série entière autour de 0, puisque toutes ses dérivées sont nulles en 0 et ipo(x) > 0 si x ^ 0.
• La fonction ^py est analytique sur R, mais n'est pas développable en série entière sur ] - (1 + e), 1 + e[,
si e > 0, car le développement de Taylor ]Cn^o(~~x2)n en 0 a un rayon de convergence égal à 1.
• Il existe des fonctions continues sur R n'ayant de dérivée en aucun point (Weierstrass, 1875) ; en prenant
la primitive d'une telle fonction cela montre qu'il existe des fonctions de classe^1 sur R qui ne sont pas
de classe fé72 et donc, a fortiori, pas analytiques sur R.
D'un autre côté, la théorie des fonctions holomorphes a été développée avant la théorie des fonctions
d'une variable réelle, et c'est les pathologies de cette dernière qui ont beaucoup surpris les mathématiciens
du 19-ième siècle (et un peu ceux du 20-ième). Par exemple, H. Poincaré a eu quelques ennuis avec les
fonctions ^°° qui ne sont pas somme de leur série de Taylor...
V.4. LA FORMULE INTÉGRALE DE CAUCHY ET SES CONSÉQUENCES 369
On en déduit que p(F) ^ r. De plus, si \z — zq\ < r, alors
ir +f^-^nfndwif mdw.
2™ Jc(zo,r) ^ (W - ^û)n+1 2î7T 7c(;î0)r) W - 2
On conclut en utilisant la formule intégrale de Cauchy. (Pour justifier l'échange des signes
f et ^2 ci-dessus, on peut, par exemple, faire appel au théorème de convergence dominée
en majorant | £Lo ^gâSPl sur C(«,,r) par MES ^ff = jq^.)
Corollaire V.J^.8. (i) 5« / es£ holomorphe et ne s'annule pas sur fi, alors 1// es£
holomorphe sur fi; sa dérivée est Z2jr.
(ii) Si f : fii —» fi2 es£ holomorphe e£ $« # : fi2 —► C est holomorphe, alors gof : fix —► C
est holomorphe; sa dérivée est (g' o /) /'.
(iii) Si f : fii —> n2 es£ holomorphe bijective, si sa réciproque /_1 : fi2 —► fii e$£ coniwwe
e£ 5« /' ne annule pas^-10^ dans fi, alors f~l est holomorphe; sa dérivée est 7757=1-•
Démonstration. Il suffit de recopier la démonstration du cas réel pour montrer que 1//
(resp. g o /, resp. /-1) est if1 au sens complexe sur fi (resp. sur fii, resp. sur fi2) ; la
prop. V.4.7 permet d'en déduire Pholomorphie de 1// (resp. gof, resp. /_1). (On aurait
aussi pu démontrer directement que 1// (resp. gof, resp. /-1) est développable en série
entière autour de chaque point, mais ça aurait été nettement plus fatigant.)
5. Rayon de convergence et inégalités de Cauchy pour les dérivées
Remarque V.4-9. (i) La formule f(z) = F(z — zq) montre que les an sont les coefficients
du développement de Taylor de / en zq. Autrement dit, une fonction f, holomorphe sur un
ouvert fi, est somme de sa série de Taylor en zq sur tout disque ouvert D(z0,r~) contenu
dans fi. De plus, si D(z0,r) C fi, alors
(ii) Dans le cas n = 0, on obtient la formule f(zo) = ^ /0 * f(zo + re%e) dO, qui montre
que / vérifie la propriété de la moyenne : f(z0) est la moyenne de f(z) sur tout cercle de
centre zq dont le disque correspondant est inclus dans fi.
(iii) Dans le cas général, on en déduit la majoration (appelée inégalité de Cauchy)
lVn)(*<>)l^r"n SUP l/MI=r"n sup |/(^0 + re^)|.
n! w£C(zo,r) 0€[O,2ir]
(10>Ces deux hypothèses sont en fait inutiles (cf. rem. V.6.3, deuxième point).
370
CHAPITRE V. FONCTIONS HOLOMORPHES
(iv) Plus généralement, si K C Q est un compact, si U est un ouvert^11) contenant K, et
dont l'adhérence U est un compact contenu dans Q, alors, quel que soit n G N, il existe
M = M(n,K,U), tel que
sup|/<nH*)KMsup|/(*)|.
En effet, si r ^ d(K, Q — U), alors C(z,r) C U C f2 quel que soit z G K, et le (i) montre
que M = n\r~n convient.
Proposition V.^.10. Soit log la détermination principale du logarithme. Alors on a
iog(i + ^) = EÏÏfcP^»H<i-
Démonstration. Soit f(z) = X)S ^"T zU- C'est une fonction holomorphe sur D(0,1~)
dont la dérivée est XlnSC-1)71-1^-1 = î+I- ^ar ailleurs, log(l + z) est aussi holomorphe
sur D(0,1~), de dérivée ^. La fonction g(z) = f(z) - log(l + z) est, d'après le (i) de la
rem. V.4.9, somme de sa série de Taylor en 0 sur tout D(0,1~), et comme sa dérivée est
nulle, elle est constante sur D(0,1~). On conclut en remarquant que g(0) = 0.
Exercice V4.ll. (i) Montrer que tg = |^ est somme de sa série de Taylor en 0 sur ]^, §[.
(ii) Quel est le rayon de convergence de la série de Taylor en 0 de 4^ ?
(iii) Quel est le rayon de convergence de la série de Taylor en 0 de ^^f ?
Exercice V.4-12. (i) Soit s € C. On définit (1 + z)s par (1 + z)s = exp(slog(l + z)), où log est la
détermination principale du logarithme. Montrer que (1 + z)s = J2t^o CD*n> SH2I < 1-
(ii) Existe-t-il une fonction / holomorphe sur D(0,1") telle que f(z)2 = z, pour tout z € D(0,1") ?
Exercice V.4-13. Déduire le principe du maximum de la propriété de la moyenne.
Corollaire V.4^4- (Liouville, 1844) Si f est une fonction holomorphe sur C tout
entier, et si f est bornée, alors f est constante.
Démonstration. Par hypothèse, il existe M > 0 tel que \f(z)\ < M, quel que soit z e C.
On déduit de l'inégalité de Cauchy que, si n € N, alors |^/(n)(0)l < r~nM, quel que soit
r > 0. En faisant tendre r vers +00, on en déduit que /(n)(0) = 0, si n ^ 1. Or / étant
holomorphe sur C tout entier, est somme de sa série de Taylor en 0 en tout point de C
et donc f(z) = /(0), pour tout z G C. Ceci permet de conclure.
Corollaire V.4'15- (th. de d'Alembert-Gauss, 1799) C est algébriquement clos.
Démonstration. Soit P G C[T] ne s'annulant pas sur C. Alors / = 1/P est une fonction
holomorphe. De plus / est bornée sur C car elle a une limite quand \z\ -^ +00, et est
continue. On déduit du théorème de Liouville que / est constante, et donc que P est de
^^Un tel ouvert existe toujours : comme K est compact, on a S = d(K, C - Q) > 0, et si 0 < 8' < S,
il surfit de prendre U = {z € C, d(z,K) < S'} qui est ouvert car z ■-> d(z,K) est continue, et dont
l'adhérence U = {z € C, d(z,K) ^ S'} est contenue dans Q car ô' < S, et est compacte car fermée et
bornée puisque K est borné.
V.5. CONSTRUCTION DE FONCTIONS HOLOMORPHES
371
degré 0. En prenant la contraposée, cela montre que, si degP ^ 1, alors P a un zéro
dans C, ce qui permet de conclure.
Exercice V.4-16. Soit / une fonction holomorphe sur C tout entier. On suppose qu'il existe N € N et
C > 0 tels que |/(z)| ^ C|^|N, pour tout z € C. Montrer que / est un polynôme.
V.5. Construction de fonctions holomorphes
1. Séries de fonctions holomorphes
Soit fi un ouvert de C. Rappelons qu'une suite de fonctions (/n)n€N converge
uniformément sur tout compact vers /, si pour tout compact K C fi, et tout e > 0, il existe
N(K,e), tel que \fn(z) - f(z)\ < £, si 2 € K et n ^ N(K,e). Une série J2neNun converge
uniformément sur tout compact, si la suite de ses sommes partielles le fait ; elle converge
normalement sur tout compact, si pour tout compact K C fi, on a J2neN \\un\\K < +00,
où ||wn||K = supz€K |wn(^)| est la norme de un pour la convergence uniforme sur K.
La convergence normale sur tout compact implique la convergence uniforme sur tout
compact qui implique la convergence simple.
Théorème V.5.1. Soit fi un ouvert de C.
(i) Si (/n)n€N est une suite de fonctions holomorphes sur fi convergeant uniformément
sur tout compact de fi, alors la limite f de la suite fn est holomorphe sur fi et, pour
tout k, la suite (fn )neN converge uniformément vers f^ sur tout compact de fi.
(ii) Si («n)n€N est une suite de fonctions holomorphes sur fi telle que la série X)neN un
converge uniformément (resp. normalement) sur tout compact de fi, alors la somme f de
la série est holomorphe sur fi et, pour tout k, la série ^2n€N «n converge uniformément
(resp. normalement) vers f^ sur tout compact de fi.
Démonstration. Le (i) se déduit du (ii), et pour montrer le (ii), il suffit de prouver que /
est holomorphe, le reste s'en déduisant en utilisant le (iv) de la remarque V.4.9 ci-dessus.
Soit zq e fi, et soit r > 0 tel que D(zo,r) C fi. Alors, d'après la formule de Cauchy, on
a, pour tout z G K,
Si ^SJW)"'-*
2™ JC(zo,r) Z^W~Z 2m ^(*o,r) W~Z
l'interversion des signes / et ^2 ci-dessus étant justifiée par la convergence uniforme
(resp. normale) de la série J2nzNun(z) sur Ie compact C(z0>0- La prop. V.4.7 permet
d'en déduire Pholomorphie de / dans D(z0,r~), ce qui permet de conclure.
372
CHAPITRE V. FONCTIONS HOLOMORPHES
Exercice V.5.2. Soient tt un ouvert de C et (/n)nGN une suite de fonctions holomorphes sur Q, tendant
simplement vers /. Montrer que, si pour tout compact K de fi, il existe Mi< > 0 tel que |/n(^)| ^ Mk,
pour tout n G N et z G K, alors / est holomorphe.
Exercice V.5.3. (i) Montrer que la série ]Cn^N+i (ï+n + J^o) est uniformément convergente sur
D(0, (N + |)-). En déduire que z i-> F(*) = \ + £j~ (^ + ^) est holomorphe sur C - Z.
(ii) Montrer que G(z) = F(z) - 7rcotg7T2 est impaire et périodique de période 1.
(iii) Montrer que G se prolonge par continuité en une fonction holomorphe sur C.
(iv) Montrer que G est bornée sur C ; en déduire que \ + J2n™i (ï+n + J^a) = ncotSnz,si z eC- Z.
(v) Soit ]Cn^o^nnT le développement de Taylor de -rzi en i = 0, et, si k est un entier ^ 1, soit
C(2*) = ES Jf-Montrer que
En déduire que n~2hÇ(2k) est un nombre rationnel (Euler, 1734).
2. Produits infinis de fonctions holomorphes
Soit I un ensemble dénombrable, et soit (ui)i€i une suite de nombres complexes. On
dit que le produit Yli£ïUi est convergent si J^€l \ui — 1| < +00. Si Ui = 0, pour tout
i € I, la condition précédente équivaut à ^2i€ï \ \ogui\ < +00, où log : C* —> C désigne la
détermination du logarithme dont la partie imaginaire appartient à ] —7r,7r] (en particulier
log z = J2n=i i=1£—(z ~ !)n» si \Z~M< h et lim^i ^f = 1). Si I est fini, le produit
est convergent et sa valeur est le produit au sens usuel. Si I est infini, et si n h^ i(n) est
une bijection de N sur I, alors xn = FL^n ***(*) est une smte convergente dont la limite
ne dépend pas de la bijection de N sur I choisie, et qui est, par définition, la valeur du
produit infini. En effet :
• s'il existe i tel que Ui = 0, alors xn = 0, pour tout n assez grand, et la valeur du
produit est 0 ;
• si Ui ^ 0, pour tout i, onai„ = exp ( J2k^°ëum), et comme J^i€l | logWi| < +00,
la série E„6Nlog%) converge, et FUi^i = exp (En6Nlogui(n)) = exp (£i€llogtti).
En particulier, un produit convergent est nul si et seulement si un des termes du produit
est nul.
Théorème V.5.4- Soit fi un ouvert de C, soit (wn)neN une suite de fonctions
holomorphes sur C telle que la série XlneN ^ converge normalement sur tout compact de fi,
et soit fn = nLoC1 + uk)> $i n G N-
(i) La suite fn converge uniformément sur tout compact (on dit que le produit infini
Tln€K(l+un) converge uniformément sur tout compact), et la limite f de la suite fn est
une fonction holomorphe sur fi.
(ii) Si fi est connexe, et si aucune des un est identiquement —1 sur fi, alors f(z) = 0
si et seulement si il existe n € N tel que 1 + un(z) = 0, et on a vz(f) = J2n€N vz(l + un),
quel que soit z € fi. De plus, la série J2n=o ï^t conver9e normalement sur tout compact
V.5. CONSTRUCTION DE FONCTIONS HOLOMORPHES
373
de fi sur lequel f ne s'annule pas, et
+00
f'(z) _ Y- <(*) „• ffy\un
Démonstration. Si K est un compact de fi, soit C(K) = exp(^n€N ||«7i||k) ; c'est une
quantité finie, par hypothèse. Si n € N et si z G K, on a alors
n+l n n
in(i+u*(z))-n(i+u^))i=K+iwi-in(i+"^))i
fe=0 k=0 A;=0
< n^+iiiKn(i+ikuk) < c(K)iiWn+1||K.
fe=0
On en déduit, grâce à la convergence de X)neN llwn||K> la convergence uniforme du produit
sur K. La limite / est donc holomorphe sur fi d'après le th. V.5.1.
Maintenant, si zq € fi, on peut choisir r > 0 tel que K = D(zo,r) C fi, et N G N
tel que ||«n||K < 5, si n > N. En particulier, 1 + un ne s'annule pas sur K et, pour tout
zeK = D(*b,r), on a |l+u„(*)| ^ 1 - |K||K > e~2^^. Soit gN = ILW1 + w«)- On
déduit de ce qui précède la minoration |<7n(<z)| ^ exP (— 2^^j+1 ||wn||K)> ce qui permet
de prouver que #n ne s'annule pas sur K. On en déduit que
N N +00
Vzo(f) = Vzofa fj(l + Un)) = ^VzoO- + «n) = 5^(1 + Un^
n=0 n=0 n=0
La convergence normale de la série des un implique alors, d'après le (ii) du th. V.5.1,
celle de la série des u'n. Comme |1 + un{z)\ ^ |, si z € K et n ^ N, on en déduit la
convergence normale de la série des y^-. De même, la convergence uniforme sur K de fn
vers / entraîne celle de fn vers /' ((i) du th. V.5.1). On en déduit que 444 tend vers 4fer,
si f(z) ^ 0. Or j* = J2l=o rSt (ce*a surt' Par récurrence de ce que (t^)' = v[v2 + viv'2),
et donc yQ = ]CïS i+unL) > s* f(z) ^ 0- ^eci Permet de conclure.
Exercice V.5.5. Reprendre la démonstration du théorème en utilisant la série deslogwn (attention au
fait que logwn n'est pas forcément holomorphe sur Q tout entier).
Exercice V.5.6. Montrer que FL^i (* ~~ ïb) est uniformément convergent sur tout compact de C, et
que sa valeur est s*^p. (On utilisera les résultats de l'ex. V.5.3; cf. ex. H. 1.10 pour une autre méthode.)
3. Fonctions holomorphes définies par une intégrale
Théorème V.5.1. Soit X un sous-ensemble mesurable de Rm, et soit fi un ouvert
de C. Soit F : fi x X —* C. On suppose que :
• z\-^ F(z, t) est holomorphe sur fi, quel que soit t € X ;
• t !-»• F(z, t) est mesurable quel que soit z0 G fi, et il existe r^ > 0 et gzo € ££ 1(X) tels
que D(z0,rzo) C fi et \F(z,t)\ < 9zo(t), pour tous z € D(z0lrZQ) etteX.
374
CHAPITRE V. FONCTIONS HOLOMORPHES
Alors la fonction f : fi —► C définie par f(z) = /x F(z,t) dt est holomorphe sur fi. De
plus, sikeK, alors (£)*/(*) = /x (£)*F(*,t)«tt.
Démonstration. L'holomorphie étant une propriété locale, il suffit de prouver que, quel
que soit zq G fi, il existe r > 0 tel que / soit holomorphe sur D(z0,r~). Fixons donc z0,
et soit r = r^. Comme z i-> F(z,t) est holomorphe, quel que soit f 6 X, on tire de la
formule de Cauchy l'identité
2™ JxK Jc(zo,r) W-Z '
r~).
Or on a |^^| ^ r^]o|, si {w,t) G (C(z0,r) x X). Comme &0 est sommable sur X, la
fonction |F^^| est sommable sur C(zo,r) x X, ce qui permet d'utiliser le théorème de
Pubini pour permuter les deux intégrations. On obtient
r").
La prop. V.4.7 permet d'en déduire l'holomorphie de / sur D(zo,r~).
Maintenant, on a jjf{k)(z0) = âfe /c(z0,r) (w-^)^ dw d'aPrès le 0) de la rem- v-4-9-
En majorant |fo-ffii+i I Par r~k~l9zo{t) qui est sommable sur C(z0,r) x X, ce qui permet
d'utiliser Fubini dans l'autre sens, on obtient
Ceci permet de conclure.
Corollaire V.5.8. Soient fi et D deux ouverts de C. Si f est continue sur HxD,
et si z *-* f(z, w) est holomorphe sur fi pour tout w e D, alors z i-> / f(z, w) dw est
holomorphe sur fi, quel que soit le chemin &1 par morceaux 7 inclus dans D.
Démonstration. On a f f(z,w)dw = f0 f{z,ry(t))/y'(t)dt. Soit alors zq € fi. On peut
trouver r > 0 tel que D(zo,r) C fi. La fonction continue (z,t) i-> \f(z,j(t))\ est majorée
sur le compact D(z0, r) x [0,1], et donc f(z, 7(^)7'(£) admet un majorant du type M \Y(t)\
sur D(z0,r) x [0,1]. Comme /0 |y(t)|dt < +00, on est dans les conditions d'application
du th. V.5.7, ce qui permet de conclure.
Exercice V.5.9. (La fonction T dans le plan complexe).
(i) Montrer que F(z) = /0+o° e~Hz & converge si Re(z) > 0, et que z •-» F(z) est holomorphe sur le
demi-plan Rje(z) > 0.
(ii) Montrer que, quel que soit n € N, on a F(z) = z/f+it."fc+CT) > si Re(z) > 0. En déduire qu'il existe
une unique fonction T, holomorphe sur C - (—N), avec des pôles simples aux entiers négatifs, telle que
T(z) = F(z) si Re(z) > 0.
V.6. INVERSION GLOBALE ET IMAGE OUVERTE
375
(iii) Montrer que F(z) est bornée dans toute bande verticale 0 < a <; Re(z) < 6 < +oo ; en déduire que
T est à décroissance rapide à l'infini dans toute bande verticale de largeur finie, c'est-à-dire que, quels
que soient a < b € R et N € N, il existe C(o, 6, N) tel que l'on ait
|r(z)| < C(a, 6, N)|Im(*)rN, si a < Re(z) ^ b et \lm(z)\ > 1.
V.6. Inversion globale et image ouverte
1. Le théorème d'inversion locale holomorphe
Soient Qi,fi2 deux ouverts de C. Une application cp : Qi —* Q2 est biholomorphe, si elle
est bijective et si (p et (p~l sont holomorphe. (On verra plus tard (rem. V.6.3) qu'il suffit
que cp soit injective et holomorphe pour qu'elle soit biholomorphe.)
Théorème V.6.1. (inversion locale pour les fonctions holomorphes) Soient Çl un
ouvert de C, / holomorphe sur Çl, et z0 € Q. Si f'(z0) ^ 0, il existe un voisinage ouvert U
de zq dans Q. et un voisinage ouvert V de f(zo) dans C tels que f soit biholomorphe de U
sur V.
Démonstration. Commençons par supposer que z0 = 0, f(z0) = 0 et f'(z0) = 1 ; nous
allons construire l'application réciproque g de f par une méthode du point fixe (cf. n° 14.2
du Vocabulaire) en partant du fait que g est point fixe de (p\-^ip — f oip + \à.
Il existe a € C tel que f(z) = z + az2 + 0(|,z|3), ce qui fait que
h(u,v) = f(u -v)- f{u) + v = a(v2 - 2uv) + 0({\u\ + |v|)3).
Soit ro < \p{f)- On déduit du développement limité ci-dessus, l'existence de C > 0, tel que l'on ait
\h(u, v)\ < C\u\ • \v\ si \v\ < |«| <; ro- Comme f(z) — z = 0(|,z|2), on peut, quitte à diminuer ro, imposer
de plus que \f(z) — z\ < \\z\ si \z\ < r0, et on peut aussi imposer ro ^ ^.
Soit r = |ro- On construit, par récurrence, deux suites de fonctions (gn)n^i et («n)n^i> en posant
gi(z) = z\ un(z) = f(gn(z)) - z\ gn+i(z) = gn(z) - un(z). Nous allons montrer que gn et un sont
holomorphes sur D(0,r~), et que
(g + âïr)W < \Sn(z)\ ^ (2 ~ 2^'*' et |Un(2)l ^ 2^+ï1*1' quel que SOit Z G D(°'r")-
Le résultat est évident pourn = 1 puisque g\(z) = z et u\(z) = f(z)—z. Si la propriété est vérifiée pour n,
alors l'encadrement de |<?n+i(z)| est une conséquence immédiate de l'encadrement pour |pn(^)l et de la
majoration pour |un(<z)|- Par ailleurs, comme |<?n+i(z)| <; %\z\ < ro < p(f), la fonction z •-» f(gn+i(z))
est bien définie et holomorphe sur D(0,r~), et donc un+\ est holomorphe sur D(0,r~). Maintenant,
un+i(z) = f(gn(z) - un(z)) -z = h(gn(z),un(z)) + f(gn(z)) - un{z) -z = h(gn(z))un(z)).
Comme |un(*)| < ^M < (è + £)M < \9n(z)\, on a
K+1(*)| ^ \h(gn(z),un(z))\ < C\gn(z)\ \un(z)\ ^ ^ • ^L < Cr0 ^ ^ J^.
Ceci montre que l'hypothèse de récurrence est vérifiée au rang n + 1.
On déduit de la majoration \gn+i(z)-gn(z)\ = \un(z)\ < ^r* la convergence uniforme de la suite gn sur
D(0,r"). La limite est donc une fonction holomorphe sur D(0,r~~) qui vérifie g(z) = g(z) - (f(g(z)) - z).
Autrement dit, on a construit une fonction holomorphe p sur D(0, r~) telle que f(g(z)) = z si z G D(0, r~~).
376
CHAPITRE V. FONCTIONS HOLOMORPHES
Dans le cas général, on peut appliquer ce qui précède &F(z) = f'(z0)~1(f(z + z0) - f(z0)) (et donc
f(z) = f'(zo)(F(z - zq) + f(z0)). On en déduit l'existence de r0 > 0, et de G holomorphe sur D(0,r^),
tels que F(G(z)) = z, si z € D(0,r,7). Si on définit g sur D(/(20),r~), où r = \f'(zo)\r0i par la formule
g(z) = zq + G(f(zo)~l(z - f(z0))), un calcul immédiat montre que f(g(z)) = z, si z € D(/(20),r-).
Autrement, dit, on peut trouver un voisinage ouvert Vo de /(zo) et g holomorphe sur Vo tels que fog = id
sur Vo- Ceci implique en particulier que g est injective sur V0. De plus, on a f'(g(z))g'(z) = 1, si z € V0,
et donc g'(f(zo)) ^ 0. En appliquant ce qui précède à g au lieu de /, on en déduit l'existence d'un
voisinage ouvert U de zq (inclus dans Q), et de h : U —» Vo holomorphe, tels que g o h = id sur U. Soit
V = h(\J). Comme g o h = id sur U, on a g(V) = U, et comme g est injective sur V0, on a V = <?-1(U),
ce qui prouve que V est un ouvert (dans Vo et donc aussi dans C puisque V0 est ouvert dans C) qui
contient Zq = h(f(zo)). Enfin, on a / = / o (g o h) = (/ o g) o h = h sur U, et / o g = id sur V (puisque
V C V0) et g o / = g o h = id sur U. En résumé, / induit une bijection holomorphe de U sur V dont
l'inverse g est aussi holomorphe. Ceci permet de conclure.
2. Structure locale des fonctions holomorphes
Théorème V.6.2. Soient fi un ouvert connexe de C et f une fonction holomorphe
non constante sur fi. Si z0 € fi, et si m = vzo(f - f(z0)), il existe un voisinage ouvert U
de zq dans Q, un réel r > 0 et ip : U —> D(0,r~) biholomorphe, avec (p(zo) = 0, telle que
f(z) = f(zo) + <^(2)m, quel que soit z € U.
Démonstration. Par définition de m, on a, dans un voisinage U0 de z0,
/M - f(*o) = (z- zo)m(am + am+i(z - zq) + • • • ),
avec am ^ 0. Soit a € C* une racine ra-ième de am, et soit
La fonction g est holomorphe dans U0, et comme elle vaut 1 en ^0, il existe un voisinage
ouvert Ui de zq tel que g(z) € D(l, 1~) si z € Ui. Mais alors la fonction h = gl/m
est holomorphe sur Ui et vérifie hm = g (cf. rem. V.1.8). Ceci montre que, si on pose
ip(z) = a(z — zo)h(z), alors ip est holomorphe sur Ui, et on a f(z) = f(zo) + (p(z)m quel
que soit z € Ui. Enfin, comme (p'(zo) = a ^ 0, le théorème d'inversion locale holomorphe
montre qu'il existe un voisinage ouvert U de z0 dans Ui et r > 0 tels que ip induise une
bijection biholomorphe de U sur D(0,r~).
Remarque V.6.3. Si m ^ 1, l'application z \-+ zm induit une surjection de D(0,r~),
sur D(0, (rm)~), et tout point de D(0, (rm)~) - {0} a exactement m antécédents. On en
déduit (grâce au th. V.6.2), les résultats suivants.
• Si Q est un ouvert connexe de C, et si f est holomorphe non constante sur fi,
alors /(fi) est un ouvert (théorème de l'application ouverte). En effet, en reprenant les
notations du théorème, on voit que si z0 € fi, alors il existe r > 0 tel que /(fi) contienne
D(/(z0), (rm)~)- Ceci fournit un raffinement du principe du maximum.
V.6. INVERSION GLOBALE ET IMAGE OUVERTE
377
• Si fi est un ouvert de C, et si f est holomorphe injective sur fi, alors f est biholo-
morphe de fi sur /(fi) (inversion globale). En effet, si / est injective, on doit avoir m = 1
dans les notations du théorème (12\ et /' ne s'annule pas sur fi. On déduit du théorème
d'inversion locale que /-1 est holomorphe au voisinage de tout point de l'ouvert /(fi).
Exercice V.6.4- Montrer qu'il n'existe pas de fonction holomorphe / : D(0,1~) —» C qui soit bijective.
(12)Si m ^ 2, et si 0 < |u - /(^o)| < rm, alors « a m antécédents par / dans U, à savoir les images
réciproques par (p des m racines m-ièmes de u - f(zo).
CHAPITRE VI
LA FORMULE DE CAUCHY ET CELLE DES
RÉSIDUS (DE CAUCHY)
Le lecteur a déjà pu apprécier la puissance de la formule de Cauchy pour l'étude des
fonctions holomorphes. La formule des résidus, qui en est une extension, est à la fois
un outil pratique permettant de calculer sans douleur certaines intégrales, et un outil
théorique extrêmement souple dont nous verrons certaines utilisations au chap. VII et
dans l'annexe A. Par ailleurs, les idées qu'elle met en oeuvre sont le point de départ de
constructions plus générales permettant d'associer des invariants aux variétés de
dimension quelconque. Par exemple, on peut utiliser (les idées intervenant dans) la formule des
résidus, pour démontrer qu'un ouvert de R2 n'est pas homéomorphe à un ouvert de Rn,
si n 7^ 2. Démontrer, ce qui est vital si on veut pouvoir parler de dimension d'un point
de vue topologique, qu'un ouvert de Rn n'est pas homéomorphe à un ouvert de Rm, si
n 7^ m, peut se faire en généralisant (grandement) ces idées.
VI. 1. Homotopie de lacets et formule de Cauchy
1. Vocabulaire de topologie algébrique
Soient X et Y deux espaces topologiques et/:X—>Yetp:X—»Y deux applications
continues. On dit que f et g sont homotopes si « on peut passer continûment de / à g».
De manière précise, f et g sont homotopes, s'il existe u : [0,1] x X —► Y continue, telle
que u(0,x) = f(x) et u(l,x) = g(x), quel que soit x € X. Si on note /t : X —> Y
l'application x i-» ft(x) = u(t,x), alors ft est continue, pour tout t € [0,1], et t \-> ft est
une application continue de [0,1] dans l'espace des applications continues de X dans Y
(muni de la topologie de la convergence simple), qui connecte / = /o à g = f\.
Un ouvert fi de C est contractile s'il est homotope à un point, c'est-à-dire, s'il existe
zq € fi tel que id : fi —> fi est homotope, dans fi, à l'application constante z i-> z0i quel
que soit z G fi. Autrement dit, fi est contractile, s'il existe z$ € fi et u : [0,1] x fi —► fi,
continue, telle que u(0,z) = z et u(l,z) = 20> quel que soit z G fi.
Un ouvert fi est étoile s'il existe z0 € fi tel que, quel que soit z € fi, le segment [z0i z] est
inclus dans fi. En particulier, un ouvert convexe est étoile ; C privé d'une demi-droite Y est
380 CHAPITRE VI. LA FORMULE DE CAUCHY ET CELLE DES RÉSIDUS (DE CAUCHY)
étoile (on peut prendre pour zq n'importe quel élément de l'autre demi-droite de la droite
contenant Y). Un ouvert étoile est contractile : il suffit de poser u(t} z) = z(l — t) + tz0 ;
la condition selon laquelle [zo, z] C Cl fait que u est bien à valeurs dans îî.
Si Q, est un ouvert de C, une homotopie de lacets dans fi de 70 : (R/Z) —> fi
sur 71 : (R/Z) —► fi est une application continue u : [0,1] x (R/Z) —> fi, vérifiant
u(0,i) = 7o(£) et u(l,t) = Ji(t); on peut aussi voir u comme une application continue
u : [0,1] x [0,1] —> fi telle que u(s, 0) = u(s, 1), quel que soit s £ [0,1]. On dit qu'un lacet
7 : (R/Z) —► fi est contractile dans fi, s'il existe une homotopie de lacets de 7 sur un
lacet constant. Si fi est contractile*1), alors tout lacet est contractile dans fi.
2. Un cas particulier de la formule de Stokes
Soient A = (0,0), B = (1,0), C = (1,1) et D = (0,1) les sommets du carré [0, l]2. On
note d([0, l]2) le bord orienté du carré [0, l]2 ; c'est la réunion des segments [A, B], [B, C],
[C,D]et [D,A].
Proposition VI. 1.1. Si uj = Pds + Qdt est une 1-forme sur [0, l]2, avec P et Q de
classe tf1, alors^
f u.f (-£ + £)**.
7ô([0,l]2) ^[0,1]2 Ôt ds
Démonstration. En revenant à la définition d'une intégrale curviligne, on obtient
[ cj= [ P(s,0)da, f tj= f P(l-v,l)dv = - f P(s,l)cfa,
J[A,B] Jo </[C,D] J0 JO
f cj= f Q(l,t)cft, / u= I Q(0,1 - u)du = - / Q(0,t)dt.
J[B,C] JO </[D,A] JO JO
W Plus généralement, un espace topologique connexe X est simplement connexe, si tout lacet dans X
est contractile. D'après un célèbre théorème énoncé par B. Riemann (1851) et vraiment démontré par
P. Koebe en 1914, (le théorème de représentation conforme de Riemanri)> un ouvert simplement connexe
de C, non égal à C, est biholomorphe au disque unité D = D(0,1""). En particulier, cela permet de
montrer que tout ouvert U simplement connexe de R2 est difféomorphe à R2 (i.e. il existe une bijection
de classe tf1 de U sur R2 dont la réciproque est aussi de classe tf1). Comme une fonction holomorphe
préserve les angles, on voit que l'on peut transformer (l'intérieur d') un cercle en (l'intérieur d') un triangle
en conservant les angles...
(2^La formule qui suit est un cas particulier de la formule de Stokes fndu = J^cj, qui est une des
formules mathématiques les plus esthétiques, et aussi une des plus utiles. Dans la formule de Stokes, uj
est une p-forme sur un compact K de dimension p+1, dw est sa différentielle, il est l'intérieur de K et dQ
est la frontière orientée de Cl (et donc aussi celle de K). Donner un sens précis à ce qui précède demande
un peu de travail (en particulier définir une orientation sur la frontière, ce qui n'est pas toujours possible).
Si p = 0, la formule de Stokes est « le théorème fondamental de l'analyse » fa df = f(b) - /(a), et si
p = 1 et si Cl est de dimension 2, la formule de Stokes est aussi connue sous le nom de théorème de Green
(on a alors d(Pdx + Qdy) = dP A dx + rfQ A dy = ( - || + |§) dx A dy, en tenant compte de ce que A
est bilinéaire alterné; on retombe donc bien sur la formule de la proposition).
VI. 1. HOMOTOPIE DE LACETS ET FORMULE DE CAUCHY
381
Ceci nous donne
/ lj = f (P(a, 0) - P(s, 1)) ds + f (Q(l, t) - Q(0,0) dt
Jd([0,l]2) JO JO
t ( dP , dQ
J[o,i]
„(-i+i>«-
Si Q est un ouvert de C, si u : [0, l]2 —> fi est une application de classe if1, et si
/ : Q —> C est de classe if1, on définit la 1-forme u*(f(z) dz) sur [0, l]2, par la formule :
u*(f(z)dz) = f(u(Sit))d(u(s,t)) = f(u(s,t))(—(s,t)ds+—(s,t)dt).
Lemme VI. 1.2. Soit £1 un ouvert de C. Si f : Q —> C est une fonction de classe
tf1 au sens complexe, si u : [0, l]2 —> Q est une application de classe c€2, et si on pose
u*(f(z) dz) = P(s,t) ds + Q(s, t) dt, alors -§ + ^ = 0.
Démonstration. Comme / est holomorphe^, on a
f(u(s + h,t)) = f(u(s,t) + h—(s,t) + o(h)) = f(u(s,t)) + f(u(s,t))(—(s,t)h) + o(h).
On en déduit que (avec le même argument pour J^)
d(fou) du „, dif ou) du „,
Comme P = |jJ-/otietQ=§jf-/ot4, on obtient
dP dQ d2u . du du ,, d2u . du du £,
-^ + ^ = -^'fou-Tsm'fou + dïdï'fou-md-s-fou
, d2u d2u. ,
=(-dïdS + ^fou = 0-
Théorème VI. 1.3. Soient Çl un ouvert de C et f une fonction de classe tf1 au sens
complexe sur Çl. Si jo, 71 sont deux lacets homotopes dans Çl, alors
f f(z)dz = f f{z)dz.
/70 ^71
Remarque VI. 1.4- Si 7 est un lacet constant, on a f u = 0 quelle que soit la 1-forme u.
(3)Une démonstration plus savante, mais plus naturelle, consisterait à remarquer que Ton a d'une part
("S + ^)dsAdt = d(u*(f(z)dz))> et d'autre part que d(u*(f(z)dz)) = u*(d(f(z)dz))> et % = 0,
puisque / est holomorphe, et donc d(f(z) dz) = §| dz A dz = 0.
382 CHAPITRE VI. LA FORMULE DE CAUCHY ET CELLE DES RÉSIDUS (DE CAUCHY)
On en déduit, si u = f(z) dz, avec / holomorphe sur fi, les résultats suivants.
(i) Si 7 est un lacet contractile dans fi, alors f f(z) dz = 0.
(ii) Si fi est contractile (en particulier, si fi est étoile), alors f f(z)dz = 0, quel que
soit le lacet 7 dans fi.
Démonstration. Commençons par supposer qu'il existe, dans fi, une homotopie de
lacets, de classe c€2, de 70 sur 71. Autrement dit, il existe u : [0, l]2 —> fi de classe c€2,
telle que w(0, t) = 7oM> W(M) = 7iM> et u(s,0) = u(s, 1) quel que soit s e [0,1]. Notons
u> la 1-forme f(z)dz. Écrivons u*u, sous la forme Pds + Qdt. D'après le lemme VI. 1.2,
on a — H + ^ = 0. On déduit donc de la proposition VI.1.1, la nullité de fd,,Q j,2) u*u.
En notant, A = (0,0), B = (1,0), C = (1,1) et D = (0,1) les sommets du carré [6, l]2, on
voit que
/ u*u= f Q(l,t)dt = f f(u(l,t))^(l,t)dt = f f(ji(t)H(t)dt= f f(z)dz.
De même, J[D A, u*cj = — f f(z) dz. Par ailleurs, on a JjA B, u*u> + Jjc D, u*u = 0, puisque
u(s, 0) = u(s, 1), quel que soit s € [0,1]. On obtient donc
0 = / u*u= u*w+ / u*u+ / u*uj+ I u*u) = I f(z) dz- / f(z) dz,
Jd([0,l}2) J[A,B) J[B,C] J[C,D] J[B,A) J^ Jy0
ce qui permet de conclure dans le cas particulier où 70 et 71 sont homotopes dans fi par
une homotopie de classe c€2.
Passons au cas général. Les chemins 70 et 71 sont fé71 par morceaux, et on dispose de
u : [0, l]2 —> fi, continue, telle que u(0,t) = 7o(*)> W(M) = 7iM> et w(s,0) = u(s,l)
quel que soit s e [0,1]. L'idée est d'approximer u par des fonctions ue de classe c€2, en
régularisant (cf. ex. IV. 1.7) comme dans l'ex. IV.3.26, et de passer à la limite. La mise en
œuvre de cette stratégie demande de prendre un peu de précautions pour s'assurer que
les approximations construites sont des homotopies de lacets et ne sortent pas de fi.
On note [x] la partie entière de x € R. Soit û : [-1,2]2 —» Cl définie par
Iu(0,t-[t]), sis^O,
w(s, t-[t)), siO^s^l,
u(l,t-[t}), si Ol.
Par construction, û est continue, coïncide avec u sur [0, l]2, est la restriction d'une fonction périodique
(en t) de période 1, et son image coïncide avec celle de u. Comme [—1,2]2 est compact, son image K par
û est compacte, et la distance d(K, C - Cl) de K au fermé C - Cl est > 0. Il existe donc 6 > 0 tel que Cl
contienne K$ = {z € C, d(z, K) ^ ô}. Maintenant, si e > 0, soit
Ô(e)= sup \ù(s',t')-û(s,t)\.
(s',t',s,t)£[-l,2)*, \s'-s\^e, \t'-t\^e
Comme [-1,2]2 est compact, û est uniformément continue sur [-1,2]2, ce qui se traduit par ô(e) —► 0
quand e —> 0. On choisit £0^5, tel que ô(e) ^ 5, si e ^ eq. Enfin, on choisit y? : R —» R+, de classe ^2,
nulle en dehors de [-1,1], avec /Ry> = 1, et on définit (pe, par <pe(x) = e~l(p(e~lx), ce qui fait de y?e une
fonction positive de classe if2 sur R, nulle en dehors de [-e,e], avec fRipe = 1.
VU. HOMOTOPIE DE LACETS ET FORMULE DE CAUCHY
383
On note <pe ' R2 —> R+ la fonction définie par ipl-(s,t) = (pe(s)(p£(t). Si e < £o, soit i/e la restriction
de û * yi2' à [-±, §]. On a donc
ps+e pt+e
ue (5, t) = / / û(x, î/)y>e (5 - x)y>e (* - y) dy dx.
Js-e Jt-e
Comme \û(x, y) - û(s, t)\ < ô(e)> si x e [s - e, s + e] et y e [t - e,t + e], on obtient
Urs+e pt+e .
f / (û(x,î/) - û(M))<£e(5 - x)tpe(t - y) dy dx\
s-e Jt-e '
ps+e pt+e
< / / |û(x,2/)-û(5,i)|^e(5-x)^e(«-2/)rfî/rfx
/s+e />*+e
/ 5(e)^e(5 - x)ipe(t -y) = 6(e),
-e Jt-e
ce qui montre à la fois que ue est à valeurs dans K$ c Œ, si e < £0, et que i/e tend uniformément vers û
sur [^j |]2 quand e tend vers 0.
Par ailleurs, comme ip[ est de classe ^2 sur R2 et à support compact, il en est de même de û*y>i2 , et
comme û(s,t + l) = û(s,t), si s e [-1,2], et t G [-2,0], on ai/e(s,£ + l) = u£(s>t)> sis < |, si s G [^ysf],
et si t G [^, 5]. Ceci s'applique en particulier à t = 0; on en déduit que 75|£ = ue(s, •), est un lacet de
[0,1] dans fi, pour tout s G [^, §], et tout e < e0. En résumé, on a prouvé que, si e < e0, u£ est une
homotopie de lacets dans fi, de classe tf2. On en déduit que f e f(z)dz ne dépend pas de s G [^, §].
En particulier, on a
/ f(z) dz = f(z) dz, quel que soit e < e0-
A-l/2,e ^73/2.e
Or, par construction, û(s, t) = 7o(0> si s ^ 0. On en déduit que
/-1/2+e Pt+e j pt+e
/ 7o(*)M-ô " X^£(* -y)dxdy= / 7o(*)<f^(* -y)dy = (70 * ¥>e)(*)>
-1/2-e «/*-e * Jt-e
et donc que 7^1/2,e = 7o * <rV On a déjà montré que 7_i/2,e(0 = ue{^^) tend vers û(^, t) = 70(£) ;
les mêmes arguments montrent que 7!_1/2e(0 ~~> 7o(*)> s* * n'est pas un point anguleux de 70. Enfin, si
te [0,1], on a
|/(7-l/2,e(0)7-l/2,e(0l < SUP \f(z)\ ■ SUP |^(*)|,
zeK6 *e[o,i]
ce qui permet de déduire du théorème de convergence dominée que, quand e —> 0,
/ /(*) d* = /' /(7-i/a,(t))V-i/2,(*)<** - r f(lo(t)h'0(t) dt= f f(z) dz.
Jl-l/2.e JO •'0 >/7o
On montre de même que / /(z) dz —► J f(z) dz, et un passage à la limite permet d'en conclure que
Ao f(z) dz = L f(z) dz. Ceci termine la démonstration du théorème.
3. Seconde démonstration de la formule de Cauchy
Reprenons les notations du th. V.4.6. Si e €]0,r — \z — z0\[, soit
u(s,t) = (l- s)(z0 + re2int) + s(z + ee2iKt) = (1 - s)z0 + sz + ((1 - s)r + se)e2int.
Alors 7S(Q = u(s,t) est le cercle de centre c(s) = (1 — 5)20 + sz et de rayon r(s) =
(1 — s)r + se, parcouru dans le sens direct. On a donc 70 = C(zo,r) et 71 = C(z,e). Par
384 CHAPITRE VI. LA FORMULE DE CAUCHY ET CELLE DES RÉSIDUS (DE CAUCHY)
ailleurs, on a w(s,0) = u(s, 1) quel que soit s € [0,1], et
\u(s,t) - z\ ^ \r(s) - \c(s) - z\\ = se + (1 - s)(r — \z — z0\) ^ s,
\u{s, t) - zo\ < \c(s) - z0\ + r(s) = r - s(r - \z - z0\ - e) < r,
ce qui prouve que u est une homotopie de lacets dans D(zo,r) — D(z,e~) Cfi- {z}, de
C(20,r*) sur C(z,e).
"(0.1)
«<P4>
L'homotopic de C^r) sur C(z,6)
Comme ^^ est de classe fé71 au sens complexe (en w) sur f2 - {z}, on déduit du
th. VI. 1.3, que
1 f /M J 1 f /M J ,
—— / ——L dw = —- / -i-b__i. dw, quel que soit e > 0.
2W yC(zo,r) ™ - 2 2î7r «/C(*)£) W-Z
Or C(e,r) est le chemin t^ z + ee**\ et donc ± /c(ze) ^du; = f* f(z + ee2i7rt)dt
tend vers J^1 /(z) dt = f(z) quand e tend vers 0 (continuité d'une intégrale dépendant
d'un paramètre, / étant continue en z puisque holomorphe dans un voisinage de z). En
passant à la limite, on en déduit la formule ^ /c(zo r) {^ dw = f(z) que l'on cherchait à
établir.
VI.2. INDICE D'UN LACET PAR RAPPORT À UN POINT
385
VI.2. Indice d'un lacet par rapport à un point
1. Primitives
Soit fi un ouvert connexe de C. Si / est holomorphe sur fi, on dit que F : fi —► C est
une primitive de /, si F est holomorphe sur fi et si F' = f. Si 7 : [o, b] —► fi est un chemin
de classe «âf1, alors (Fo7)'(f) = /(7(*))Y(*), quel que soit t € [a, b].
Une fonction holomorphe admet toujours localement une primitive. En effet, si / est
holomorphe sur D(zoir~)i on a f(z) = J2Î2 ^~^L{z~zo)n^ d'après le (i) de la rem. V.4.9,
et / admet la fonction F, définie par F(z) = YlnS) \n+\)i (z ~~ 2o)n+1> comme primitive
sur D(z0,r~). Par contre, une fonction holomorphe sur un ouvert fi quelconque n'admet
pas toujours une primitive sur tout fi.
Proposition VI.2.1. Soit fi un ouvert connexe de C. Si f est holomorphe sur fi, les
conditions suivantes sont équivalentes :
(i) / admet une primitive F sur fi ;
(ii) f f(z) dz = 0, pour tout lacet 7, de classe tf1 par morceaux, contenu dans fi.
Démonstration. Si / admet une primitive F sur fi, alors f(z) dz = dF. On en déduit, en
utilisant le (iv) du th. V.4.2, que fy f(z) dz = F(<y(b)) - F(7(o)), si 7 : [a, b] -> fi est if1.
En particulier, si 7 est un lacet, f f(z)dz = 0, puisque 7(6) = 7(0). D'où l'implication
(i)=4>(ii). Passons à la démonstration de la réciproque. Fixons a G fi. Si 71 et 72 sont
deux chemins^ <^?1 par morceaux dans fi, d'extrémités a et 6, on obtient un lacet 7 en
composant 71 avec l'opposé de 72 ; on a donc f f(z) dz — f f(z) dz = f f(z) dz = 0, par
hypothèse. Ceci permet de définir F : fi —> C, par F(6) = f f(z) dz, où 7 est n'importe
quel chemin fé*1 par morceaux dans fi, d'extrémités a et 6.
Il suffit de prouver que F est dérivable au sens complexe, et qu'en tout point de fi sa
dérivée est f(zo), car la prop. V.4.7 montre qu'alors F est holomorphe. Soit donc zq € fi,
et soit r > 0 tel que D(zo,r~) C fi. Si on fixe un chemin 70 joignant a à z0 dans fi, et si
b G D(z0,r~), on fabrique un chemin 7^, joignant a à b dans fi, en rajoutant le segment
[20,6] au chemin 70. On a alors
F(6) - F(z0)
b- Zq
=r^— ( / f(z) dz+ f f(z) dz - F(zo)) = [ f(z0 + t(b - z0)) dt,
et la continuité de / en Zq permet de montrer (par exemple en utilisant le théorème
de continuité d'une intégrale dépendant d'un paramètre), que F^~^zo^ —> f(z0) quand
b —> zq. Ceci permet de conclure.
(4>On déduit de la démonstration de ce qu'un ouvert connexe de Rn est connexe par arcs qu'un tel ouvert
est aussi connexe par lignes brisées (réunion finie de segments de droite), et donc aussi par chemins fé*1
par morceaux.
386 CHAPITRE VI. LA FORMULE DE CAUCHY ET CELLE DES RÉSIDUS (DE CAUCHY)
Remarque VI.2.2. (i) D'après le (ii) de la rem. VI. 1.4, la condition (ii) est
automatiquement vérifiée si fi est un ouvert étoile ou, plus généralement, contractile. Il en résulte
qu'tme fonction holomorphe sur un ouvert contractile possède une primitive.
(ii) Si a G C, et si 0 < Ri < R2, la fonction l/(z — a) est holomorphe sur la couronne
C(a,Ri,R2), mais /c(ar) ^ = 2nr ^ 0 si Ri < r < R2. La fonction l/(z - a) n'admet
donc pas de primitive sur la couronne C(a, Ri, R2) et cette couronne n'est pas contractile.
Proposition VI.2.3. (logarithme d'une fonction holomorphe)
Soit fi un ouvert contractile de C, et soit f holomorphe sur fi ne s'annulant pas sur fi.
Alors il existe g holomorphe sur fi, telle que f = e9, et on a g' = 4.
Démonstration- Comme fi est contractile, et comme 4 est holomorphe sur fi, il existe,
d'après le (i) de la rem. VI.2.2, h holomorphe sur fi telle que h' = ^. Soit zQ e fi.
Quitte à rajouter une constante à h, on peut supposer que eMz°) = f(z0). Mais alors
(e~hf)' = —h'e~hf + e~hf = 0, et donc e~hf est constante sur fi, et comme elle vaut 1 en
z0i on a / = eh sur fi. Si g est une autre fonction holomorphe sur fi vérifiant e9 = /, on
a e9~h = 1, et donc g — h est holomorphe et à valeurs dans 2nrZ. Comme fi est connexe,
g — h est constante et gf = 4.
Exercice VI.2.4- (Théorème de Morera) Soient zQ € C et r > 0.
(i) Montrer que, si / est holomorphe sur D(20,r~), alors
(VI.2.1) / f(z) dz+ f(z) dz+ f(z) dz = 0 quels que soient a, 6, c € D(z0, r~).
J[a,b] J[b,c] J[c,a)
(ii) Soit / : D(z0,r~) —> C continue, et vérifiant la propriété (VI.2.1). Soit F(^) = f.z ,f(z)dz.
Montrer que £(F(z + h) - F(z)) tend vers f(z), quand h tend vers 0. En déduire que F et / sont
holomorphes.
(iii) Soit fi un ouvert de C. Montrer que / : fi —» C est holomorphe si et seulement si / est continue
et /. 6. f(z) dz + f,b . f(z) dz + J.. f(z) dz = 0 quels que soient a, 6, c € fi tels que le triangle plein
(i.e. avec son intérieur) de sommets o, 6 et c soit inclus dans fi.
2. Nombre de tours d'un lacet autour d'un point
Soit z0 € C, et soit 7 un lacet ne passant pas par z0. Notre but est de définir
mathématiquement le nombre de tours que fait 7 autour de z$.
2.1. Définition
Lemme VI. 2.5. Soit 7 : [0,6] —> C — {z0} un chemin tf1 par morceaux. Si t e [a, b],
soit 7t la restriction déjà [a, t], et soit f(t) = f -^^. Alors e~f^(j(t)—zo) est constante
sur [a, 6].
Démonstration. Par définition, on a f(t) = /0 JL)-zo ^ et ^onc ^'W = -r(t)-zo » s* *
VI.2. INDICE D'UN LACET PAR RAPPORT A UN POINT
387
n'est pas un point anguleux de 7. La dérivée de t ^ g(t) = e /(t)(7M ~ zo) est donc
-/'Me-/<()(7« - *) + e-X'VM = e"/("(-^p^(7(*) - *) + Y(*)) = 0,
et g est constante par morceaux ; comme elle est continue cela permet de conclure.
Corollaire VI.2.6. Si 7 : [a,b] —> C est un lacet të1 par morceaux, ne rencontrant
pas zo, alors 1(7, z0) = 2^/7 ï=fe esi un eniier-
Démonstration. En reprenant les notations du lemme, on voit que e^ = e^ 7Sl^°,
et, comme 7 est un lacet, que exp( f ^^) = e^ = e*^ = 1, ce qui permet de conclure.
L'entier 1(7,20) défini ci-dessus est l'indice de 7 par rapport à z0. Par exemple, si 7
est le chemin C(o,r), et si \zç> — a\ < r, la formule de Cauchy utilisée pour la fonction
constante 1, montre que I(C(a,r),zo) = 1. Par contre, si \zo — a\ > r, le cercle C(zo,r)
est homotope à {a} dans C — {zo}> et comme j^; est holomorphe sur C — {z0}, on a
I(C(a,r),zo) = 0. Autrement dit, si zq est à l'intérieur du cercle parcouru dans le sens
direct, l'indice du cercle par rapport à zq est 1, alors que si z0 est à l'extérieur, cet indice
est 0, ce qui est en accord avec l'idée selon laquelle 1(7, zq) représente le nombre de tours
que fait 7 autour de z0. On fera attention au fait que, si le cercle est parcouru dans le
sens rétrograde, son indice par rapport à un point à l'intérieur est —1.
2.2. Détermination visuelle de l'indice d'un lacet par rapport à un point
Dans les situations considérées dans ce cours, les lacets sont sans point double (et sont
constitués de segments de droite et d'arcs de cercle), et un théorème de Jordan affirme
qu'un tel lacet découpe le plan en deux régions, l'une à l'intérieur du lacet et l'autre à
l'extérieur du lacet, auquel cas on se retrouve dans le même cas de figure que pour le cercle.
Dans le cas général, déterminer sur un dessin l'indice d'un lacet par rapport à un chemin
peut donner le tournis, mais la prop. VI.2.7 ci-dessous fournit un procédé permettant un
calcul en regardant toujours droit devant soi.
La recette est la suivante. On choisit un point a € C assez grand pour que que
7 C D(0, |a|~), et on trace un chemin u allant de a à zq. Alors 1(7,20) = ng — n^,
où ng (resp. nd) est le nombre de points d'intersections de u et 7, où 7 arrive de la
gauche(5) (resp. de la droite), quand on va de a à zq.
Soit 7 un lacet dans C. Comme 7 est compact (en tant qu'image d'un intervalle compact par une
application continue), son complémentaire est ouvert, et chacune des composantes connexes du
complémentaire est un ouvert. D'autre part, si R est assez grand, 7 est inclus dans D(0, R), et comme C-D(0, R)
est connexe, une (et une seule) des composantes connexes de C - 7 contient C - D(0,R), pour R assez
grand. Cette composante connexe est la composante connexe de l'infini
<5)Pour que ceci ait un sens, il vaut mieux prendre quelques précautions ; par exemple, imposer que u
et 7 ne s'intersectent qu'en des points simples non anguleux de 7, et que les tangentes à 7 et à « en un
point d'intersection ne soient pas colinéaires.
388 CHAPITRE VI. LA FORMULE DE CAUCHY ET CELLE DES RÉSIDUS (DE CAUCHY)
/(Y>*0)=3 7W=I /(Y>*2)=-1
Proposition VI.2.7. Soit 7 un lacet fé71 par morceaux.
(i) z i-> 1(7, z) est constant sur chacune des composantes connexes deC — 7.
(ii) 1(7, z) = 0 si z est dans la composante connexe de l'infini de C - 7.
(iii) Soi* 11-> 7(£), i G [a, 6] un paramétrage de 7, fé71 par morceaux, et soit to e]a, 6[ te/ que 7(^0) soi*
un poinÉ simple de 7, e£ 7/(<o) ^ 0. Si ha C vérifie Im(/i) > 0, e£ si e > 0 es£ assez pe£i£, a/ors
• 7(*o) + £h,y(to) et 7(^0) - eh'y'fo) n'appartiennent pas à 7,
• I(7,7(*o) + ehi{to)) - I(7,7(*o) - eh-ffo)) = 1.
Démonstration. Le théorème de continuité d'une intégrale dépendant d'un paramètre montre que
z0 »-> 1(7,20) est continue sur C - 7, et comme 1(7, z0) est à valeurs dans Z, qui est discret, cela démontre
le (i).
Si 7 C D(0, R), et si \z0\ > R, alors 7 est homotope à un point dans C - {z0} (et même dans D(0, R),
puisque D(0,R) est contractile), et comme j^ est holomorphe sur C - {z0}> on a / ^^ = 0. On en
déduit le (ii) pour \zo\ > R, et le (i) permet de terminer la démonstration du (ii).
Passons à la démonstration du (iii). Choisissons h G C, avec Im(/i) > 0. On a donc 0 < arg(/i) < tt.
Quitte à faire une translation sur la variable, on peut supposer t0 = 0, et quitte à transformer la situation
par la similitude z »-> 7/(£o)~~1(* - 7(^0))> on peut supposer que 7(^0) = 0, et 7/(<o) = 1, ce qui permet de
simplifier un peu les formules. On a alors lim^o t~~l^(t) = 1, ce qui implique qu'il existe 6 > 0 tel que,
quel que soit t G [-6,6] - {0},
VI.3. LA FORMULE DES RÉSIDUS DE CAUCHY
389
• largCr^t))! < |inf(arg(/i),7r- (arg(/i)),
• \t~l7(t) - 1| < 1/2.
Par ailleurs, comme 0 = 7(0) est un point simple de 7, il existe 77 > 0 tel que d(0,7(£)) ^ 77, si
t G [a,6]-] - ô,ô[. On en déduit que, si 0 < e < \h\~lfq, alors ±eh n'est pas de la forme j(t), avec
t G [a, 6]-] - 5, S[. Par ailleurs, ±eh n'est pas non plus de la forme 7(£), avec t G [-5,5], puisque ±eh ^ 0
et arg(^y) ^ 0, si t G [-6,6] - {0}, d'après le choix de S. En résumé, si 0 < e < \h\"lfq, alors ±eh
n'appartient pas à 7.
Maintenant, on a 1(7,eh) - 1(7, -eh) = Ii(e) + ^(e), où l'on a posé
1 / \ — ^ [ dz dz __ 1 /* d* d*
2i7r A([a,-<5])U7([5,6]) * -eh z + eh 2z7r J<y([-6tô\) z - eh z + eh'
On a lime_>0+ Ii(£) = 0> puisque j^ - j^ tend vers 0 et est majoré en module par ^|;i|. Comme
1(7, eh) -1(7, -e/i) G Z, il suffit donc, pour montrer que 1(7, eh) -1(7, -eh) = 1, si e > 0 est assez petit,
de prouver que lime_>0+ h(e) = 1. Pour cela, écrivons 2iirÏ2(e) sous la forme
ot,\ f 2eh j fS 2g/i7'(*) M fS/£ 2hj{et) Jx
L'expression sous l'intégrale tend vers jtz^s quand e tend vers 0 et t G R. Par ailleurs, d'après le choix de
<$, il existe c> 0 tel que 2ir-c> arg(/i27(i/)""2) > c, si i/ G [-5,5] ; on en déduit l'existence de C > 0 (avec
C = 1, si cosc < 0, et C = |sinc|, si cosc ^ 0) tel que \\^{t)2 - fih2\ ^ Csup(|À7(£)2|, |/j/i2|), quels que
soient ^ÀG R+. Comme Y){u)\ ^ \\u\, et comme il existe M ^ 0 tel que \jf(u)\ < M, si u G [—5,5], on
peut majorer, en module, £-a^e^a^a sur [-5/e,5/e], par Cw^/4t|/iP)? qu* est une f°ncti°n sommable
sur R, indépendante de e. On obtient donc, via le théorème de continuité d'une intégrale dépendant d'un
paramètre,
/+°° 2/1
- ë^dt
Enfin, en posant h = a + ir, avec r > 0 par hypothèse, cette dernière intégrale devient.
r+oo M M ,+oq ft_g)+iT (t + <7)-tT
7-0O *-/» t + h~J_Q
(t - a)2 + r2 (t + a)2 + r2
d*
ce qui permet de conclure. (On peut fabriquer (exercice) une démonstration de ce que ^(e) —» 1 en
remarquant qu'au voisinage de 0, 7 est le graphe d'une fonction, ce qui permet d'écrire 2iirl2(e) comme
l'intégrale de ^f sur un contour Ce ressemblant à un parallélogramme de sommets ±ô ± eh, privé des
cotés verticaux (dont la longueur tend vers 0). La formule des résidus (th. VI.3.13) montre que l'intégrale
sur Ce est égale à 2m. On évite de cette manière les majorations ci-dessus.)
VI.3. La formule des résidus de Cauchy
1. Fonctions holomorphes sur une couronne
Si z0 E C et si 0 < Ri,< R2, on note C(z0,Ri,R2) la couronne ouverte des z G C,
avec Ri < \z - z0\ < R2. Si Ri = 0, on obtient le disque épointé ouvert de centre Zq et de
rayon R2 (i.e. T>(z0^) - {z0}).
390 CHAPITRE VI. LA FORMULE DE CAUCHY ET CELLE DES RÉSIDUS (DE CAUCHY)
Lemme VI.3.1. Si f est holomorphe sur la couronne C(zo, Ri, R2), si z € C(zo, Ri, R2),
et si Ri < n < \z - Zq\ <r2 < R2, alors
2*7T yC(zo,r2) W-Z 2l7T 7c(zo>r
hn) W-Z 2l<K JC(zo,ri) W~Z
dw.
Démonstration. Le lecteur est invité à suivre les arguments qui suivent ^sur un dessin.
Soit r < inf(r2 — \z — z0|, \z — 201 — ri) de telle sorte que D(z,r) C C(2o> r^r^)- Soit
R e]|z — zq\ — r, |^ —^o|+^[ de telle sorte que les cercles C(z0, R) et C(z, r) s'intersectent en
deux points a et b. Soit 70 Tare du cercle C(z0,R) à l'extérieur de D(z,r), parcouru dans
le sens direct ; quitte à échanger les noms de a et 6, c'est un chemin allant de b à a. Soit 7}
(resp. 72) Tare du cercle C(z,r) à l'intérieur (resp. l'extérieur) de D(z0,R), parcouru dans
le sens rétrograde (resp. direct) ; c'est un chemin allant de a à b. Si i G {1,2}, soit 7* le
lacet dans C(zo,n,r2) — {z} obtenu en composant 70, avec 7-; c'est un lacet homotope^
(6)ll peut aussi préférer utiliser la forme générale de la formule de Stokes, dont on déduit directement que
Ic(zo n) {v^z ^w = Ai w^z dw> car / est holomorphe sur l'ouvert délimité par C(z0,ri) et 7*.
<7)C'est parfaitement évident sur un dessin, mais on peut aussi écrire une formule d'homotopie explicite.
Par exemple, pour aller de 72 à C(z0,r2), on paramètre 70 par j0(t) = z0 + Re2i7r(*~~^\ où (5 est choisit
pour que 7o(£) = 6, et t G [0,a], avec a < 1 vérifiant 70 (a) = a, puis on paramètre 72 sous la forme
72(0 = z + re2i7r<A*+/i\ avec t G [a, 1], ce qui nous fournit un paramétrage t »-> 72(^)5 avec * G [0,1], de
72. Enfin, on paramètre C(zo,r2) sous la forme t »-> S(t) = z0 + r2e2i7r^'"/3), avec t G [0,1], et on fabrique
une homotopie u(s, t) de 72 sur 0(20,^2), en posant u(s, t) = (1 - 5)72(0 + sS(t). Il reste à vérifier que
cette homotopie a bien lieu dans C(z0,Ri,R2) - {z}, ce qui est évident sur un dessin (on s'est débrouillé
pour que l'angle entre 72(0 - z0 et S(t) - z0 soit petit, et u(s> t) parcourt le segment [72(*)>^(*)1 quand
s varie de 0 à 1).
VI.3. LA FORMULE DES RÉSIDUS DE CAUCHY
391
dans C(z0,Ri,R2) - {z} à C(z0iri). On a donc
Jc(zo,r2)W-Z JCizo^W-Z J^W-Z J^ W - Z
= /iwdw_//wdw / mdw.
J^W-Z J1[W-Z JC(z,r) W-Z
h. .
_0\
On conclut en utilisant la formule de Cauchy pour /, qui est holomorphe sur D(z,r ).
Corollaire VI.3.2. Si f est holomorphe sur C(z0,Ri,R2), # existe une unique suite
(a>n)n€Z d'éléments de C vérifiant
392 CHAPITRE VI. LA FORMULE DE CAUCHY ET CELLE DES RÉSIDUS (DE CAUCHY)
(i) J2t,ZanZn conver9e 5« kl < R-2 et J2n=-ooanzTl conver9e M \z\~l < Ri"1 i
(ii) f(z) est somme de la série (de Laurent) ^2n€Zan(z — zo)n> si z G C(20,Ri,R2).
De plus, quels que soient r e]Ri,R2[ et n G Z, on a
an = ^ f (w-z0)-n-1f(w)dw.
Démonstration. Si r,r' g]Ri,R2[, les cercles C(z0,r) et C(z0,r') sont homotopes dans
C(z0, Ri, R2). Comme (z — zo)~n~lf(z) est holomorphe dans C(zo, Ri, R2), cela permet de
montrer que ^ JL Jz — z0)~n~lf(z) dz ne dépend pas du choix de r e]Ri, R2[ ; notons
le an. Maintenant, d'après le lemme VI.3.1, si Ri < ri < \z — z0\ < f2 < R2, on a
2™ Jc(zo,r2) w-z 2^7r t/C(«o,n) w~z
Par ailleurs,
On en déduit, en reportant les développements ci-dessus dans l'intégrale comme dans la
démonstration de la prop. V.4.7, la convergence normale (pour la norme uniforme) de la
série X)nez an(z ~~ zo)n vers f(z) sur la couronne r\ <\z — z0\ < r<i. On conclut en faisant
tendre ri vers Ri et r2 vers R2.
Exercice VI.3.3. Soit / holomorphe sur C*. Montrer qu'il existe une suite (an)n€z d'éléments de C
telle que l'on ait f(z) = Y,n£Zanzn, pour tout z € C*.
Exercice VI.3.4. Soit Jl? = {z € C, lm(z) > 0} le demi-plan de Poincaré, et soit / : Jt? -» C une
fonction holomorphe, périodique de période 1.
(i) Montrer qu'il existe / : D(0, l-) - {0} -» C, holomorphe, telle que f(z) = f(e2iwz).
(ii) En déduire qu'il existe des an(f) € C, pour n € Z, tels que f(z) = ^2nezan(f)e2innz, quel que
soit z € Jff, la série étant normalement convergente sur toute bande horizontale a < lm(z) <; 6, avec
0 < a < b < +00.
(iii) Montrer que an(f) = /[iT1+iT] e~2inzf(z)dz, pour tout T > 0 (on pourra utiliser l'ex. V.4.5).
2. Fonctions holomorphes sur un disque épointé ; résidus
Soient fi un ouvert de C, z0 G fi, et / holomorphe sur fi — {z0}. Soit r > 0 tel que
D(zo,r~) C fi. La fonction / est donc holomorphe sur le disque épointé D(zo,r~) — {zo}
qui peut aussi être vu comme la couronne C(20,0,r). On peut donc lui appliquer les
résultats du n° 1, et on en déduit l'existence d'une suite (an)nGz de nombres complexes
vérifiant les propriétés suivantes :
• la série g{z) = J2n=o an(z ~ zo)n converge sur D(z0, r") ;
• la série h(z) = Z)n<-i an(z ~ zo)n converge, et définit une fonction holomorphe, sur
C-{*>};
• f(z) = En€Z an(z ~ 2o)n, Quel Que soit z € D(20,r_) - {zq}.
VI.3. LA FORMULE DES RÉSIDUS DE CAUCHY
393
La série h{z) est la partie singulière de / en z0> et le coefficient o_i de {z — z0)_1 est le
résidu Res(/, zq) de f en zq.
On dit que / est holomorphe® en z0, si h = 0. Plus généralement, on dit que / est
méromorphe en zç>, s'il existe k G Z, avec an = 0, si n < k. Si & est un entier ^ 1, on dit
que f a un pôle d'ordre k en z0, si o_fe ^ 0 et on = 0, quel que soit n < — k ®\ On dit
que / a une singularité essentielle en zq si elle n'est pas méromorphe en zq.
On peut reformuler les définitions ci-dessus en terme de la valuation vzo(f) de / en zq
définie par
Vzo(f)= inf €ZU{±oo}.
n€Z, ttn^O
On a alors :
• vzo(f) = — co ^=^ / a une singularité essentielle en zq ;
• vz0(f) > —oo <*=> / est méromorphe en z0 ;
• vzo(f) — ~h, k G N — {0} <*=>■ / a un pôle d'ordre k en 20 ;
• v*o(/) ^ 0 *"* / est holomorphe en z0 ;
• vzo(f) — 0 ^=^ f est holomorphe et ne s'annule pas en zq ;
• vz0(f) = k, k G N <é=*> / a un zéro d'ordre k en 20 ;
• vzo(/) — +°° ^^ / est nu^e dans *a composante connexe de 20 dans fi.
Dans les équivalences précédentes, la seule qui ne soit pas une reformulation de la
définition est la dernière, qui est une reformulation du théorème des zéros isolés (th. V.3.3).
Si fi est un ouvert de C, on dit que / : fi —► C est méromorphe sur fi, si / est
méromorphe en tout point de fi.
Pour un certain nombre d'applications, il est important de savoir calculer explicitement
le résidu Res(/,2o) de / en zq. L'exercice ci-dessous fournit quelques recettes (10).
Exercice VI. 3.5. Soient fi un ouvert de C et zq e fi.
(i) Si / est holomorphe en z0, alors Res(/, z0) = 0.
(ii) Si / = J, où g et h sont holomorphes sur fi, si g(z0) ^ 0, et si h a un zéro simple
en z0, alors Res(/,20) = $$•
(iii) Si / a un pôle simple en z0, et si g est holomorphe en 20> alors Res(gf, Zo) =
g(z0)Res(f,z0).
(iv) Si k ^ 1, et / = (z-z0)~kg, où g est holomorphe sur fi, alors Res(/, z0) = g (fc_n?) •
(8)C'est un abus de langage, mais cela veut dire que la fonction / peut se prolonger par continuité en z0,
et que la fonction obtenue est holomorphe sur D(z0,r~).
(9>Une fonction est donc méromorphe en z0 si et seulement si elle est holomorphe ou a un pôle d'ordre fini.
(10)Si / a une singularité essentielle, il est en général impossible de trouver une expression « finie » du
résidu. C'est une des raisons qui fait que certaines intégrales résistent à la méthode des résidus (cf.
exercices du n°4).
394 CHAPITRE VI. LA FORMULE DE CAUCHY ET CELLE DES RÉSIDUS (DE CAUCHY)
(v) Si / est méromorphe sur Q, alors C est méromorphe sur Q, avec des pôles simples
aux pôles et zéros de /, et on a
Res(—,z0) = vzo(f), quel que soit z0 G Q.
Exercice VI.3.6. Soit A G R^. Calculer Res(i^e1/z,0).
Exercice VI.3.7. Montrer que / est méromorphe sur ft, si et seulement si tout point z0 de Q a un
voisinage*11^ ouvert U sur lequel / peut s'écrire sous la forme / = f, avec g et h holomorphes sur U.
Exercice VI.3.8. Soit / : Cl —> C méromorphe.
(i) Montrer que les pôles de / sont isolés (si a est un pôle, il existe r > 0 tel que a soit le seul pôle
de / dans D(a,r~~)).
(ii) Montrer que / n'a qu'un nombre fini de pôles dans D(#o,r), si D(#o,r) C Cl.
Exercice VI.3.9. (i) Montrer qu'une fonction méromorphe bornée à l'infini (il existe M et R tels que
|/(2)| < M, si |;z| ^ R) est une fraction rationnelle. (Commencer par prouver que / n'a qu'un nombre fini
de pôles.)
(ii) Montrer qu'une fonction méromorphe tendant vers l'infini à l'infini est une fraction rationnelle.
Exercice VI.3.10. Soit (xn)neN une suite d'éléments de C* tendant vers l'infini, et soit (fcn)neN une
suite d'éléments de N.
(i) Montrer qu'il existe an G N tel que, si \z\ < ^, alors
(ii) Construire une fonction holomorphe sur C dont les zéros sont les xn avec multiplicité kn.
(iii) Montrer que toute fonction méromorphe sur C est quotient de deux fonctions holomorphes sur C.
(iv) Montrer, en adaptant la méthode, que toute fonction méromorphe sur D(0,1"") est quotient de
deux fonctions holomorphes sur D(0,1"").
Exercice VI.3.11. Soient R > 0 et / holomorphe sur D(20,R~~) - {^o}- Montrer que :
(i) / est holomorphe en z0> si et seulement si / est bornée dans D(z0,r) - {z0}> quel que soit r G]0,R[
(on pourra s'intéresser à ± fc(z0yr)(z - *ô)~1~f7(*)<fc) ;
(ii) / est méromorphe non holomorphe en zq si et seulement si \f(z)\ —> +00 quand z —> z0 ;
(iii) / a une singularité essentielle en z0 si et seulement si l'image de D(z0,r")- {z0} par / est dense*12)
dans C, quel que soit r e]0, R[.
Exercice VI.3.12. (i) Soit / : C —► C holomorphe. Montrer, en utilisant l'exercice précédent, que si /
n'est pas un polynôme, alors /(C - D(0,n)) est un ouvert dense de C, quel que soit n G N. En déduire
que / n'est pas injective.
(ii) Montrer que si / : C —> C est holomorphe bijective, alors il existe a G C* et 6 G C tels que
f(z) =az + b, quel que soit z G C.
(n)()n peut montrer que l'on peut écrire / = f, avec g et h holomorphes sur Cl tout entier, mais c'est
loin d'être évident si Cl est un ouvert quelconque.
<12>Le « grand théorème de Picard » affirme qu'en fait l'image de D(^0)^"") - {^0} par / contient C à au
plus un point près (l'exemple de e1/* montre que ce résultat est optimum). La démonstration repose sur
des techniques un peu plus sophistiquées que celles introduites dans ce cours.
VI.3. LA FORMULE DES RÉSIDUS DE CAUCHY
395
3. La formule des résidus
Théorème VI.3.13. Soient fi un ouvert de C, F un ensemble fini de points de fi,
/ une fonction holomorphe sur fi — F, et 7 un lacet de fi, contractile dans fi, et ne
rencontrant pas F. Alors
f f(z) dz = 2vk ]T 1(7, a)Res(/, a).
a€F
Démonstration. Si a € F, et si ra > 0 est tel que D(a,r~) est inclus dans fi et ne
contient aucun autre point de F, alors il existe une suite (ca>n)n€z d'éléments de C, telle
que f(z) = £n6Zca)n(2 - a)n, si z G D(a,r~). De plus, la série T,n^-2ca,n(z ~ aT
définit une fonction holomorphe ga dans C — {a}, et ga admet Ga(z) = £n^_2 ca>n**~+î
comme primitive sur C — {a}. Soit alors h = f — X)aeP(pa + ^fjr)- Par construction, h est
holomorphe sur fi — F, et a une singularité fictive en tous les points de F ; elle se prolonge
donc, par continuité, en une fonction holomorphe sur fi tout entier. On a alors
• j; m dz=j; h(z) dz+e„€F j; «.w &+e„€P c,-i /, £ ;
• fj Hz) dz = 0 puisque h est holomorphe dans fi et 7 est contractile dans fi ;
• /7 9a{z) dz = 0, si a € F, puisque ga a une primitive sur fi — {0} qui contient 7 ;
• ctt)_i = Res(/,a) et f ^ = 2z7rl(7,a), par définition.
Ceci permet de conclure.
La formule des résidus permet de localiser les zéros d'une fonction holomorphe.
Corollaire VI.3.14- Soit fi C C un ouvert, et soient z0 e fi et r > 0 tels que
D(20, r) C fi. Soit f holomorphe sur fi. Si C(z0, r) ne contient aucun zéro de f, alors le
nombre de zéros de f dans B(z0} r~), comptés avec multiplicité, est égal à ^ /q^ r) 7® dz.
Démonstration. On sait (cf. (v) de l'ex. VI.3.5) que 4^ est méromorphe sur fi, avec
des pôles simples aux zéros de /, le résidu en chacun de ces pôles étant l'ordre du zéro
de /. La formule des résidus permet de conclure.
4. Exercices
Exercice VI.3.15. Soit / définie sur R par f(t) = e_7rt2. Rappel : /Re-7r*2 dt = 1.
(i) Montrer que / se prolonge analytiquement en une fonction (encore notée /) holomorphe sur C.
(ii) Si a € R et R € R+, soit 7a)R. le lacet composé des segments [-R,R], [R,R + <w], [R + ai, -R + ai]
et [-R + ai, -R]. Que vaut /7q r f(z) dz ?
(iii) En déduire, en faisant tendre R vers +00, que f(a) = e~™ .
Exercice VI.3.16. Calculer les intégrales suivantes par la méthode des résidus :
(a) /r («*+!)( J+4)(«*+9) et /R(x+i)(a!-i)(x-2z).-(x-m)- (0n P"»*» Un laCet 7 formé du Se6ment
[-R, R] et d'un demi-cercle convenable.)
(b) limR_+0O f\ ixi+i)<£*+x+l)<te-
396 CHAPITRE VI. LA FORMULE DE CAUCHY ET CELLE DES RÉSIDUS (DE CAUCHY)
(c) /0+o° jÊ-pï dx, avec a,6 G N et 6 ^ a + 2. (On prendra un lacet 7 formé du segment [0, R], d'un arc
de cercle convenable, et d'un segment [Reia,0], avec a bien choisi.)
Exercice VI.3.17. (transformée de Fourier de fonctions rationnelles)
(i) Calculer JR %a+7 dt et JR e^+7)? d* par la méthode des résidus. (On prendra un lacet 7 formé du
segment [-R,R] et d'un demi-cercle convenable*13))
(ii) Calculer de même limR^+oo J_R *ta+t'+| dt.
Exercice VI.3.18. Soit 7£ir le lacet composé du segment [e,R], du demi-cercle C+(0,R) : [0,7r] —► C,
donné par* t •-> Reie, du segment [-R, -e], et demi-cercle C+(0,e)opp, donné par £ i-> eei(7r_"^. (Faire un
dessin.)
(i) Calculer / r Ç dz via la formule des résidus.
(ii) Montrer que /C+(0|R) ^- dz —> 0 quand R —> +00.
(iii) Calculer la limite de /c+(0e)(W ^ rf^ quand s —> 0.
(iv) En déduire que J0+o° ^ rfx = f.
Exercice VI.3.19. Nous nous proposons de démontrer que r(s)r(l - s) = ^f^, pour tout s £ Z
(formule des compléments*14)), où T est la fonction holomorphe sur C - (—N) de l'exercice V.5.9.
(i) Soit s dans la bande -1 < Re(s) < 0. (On peut adapter ce qui suit pour calculer les intégrales
du type $q°° f(t)t3 dt, où / est une fraction rationnelle). Si r > 0, on note C+(0,r) le quart de cercle
0 i-> rew, pour 0 G [0, f ] et C~(0,r) les 3 quarts de cercle 6 i-> reie, pour 6 G [f, 2tt]. Si 0 < e < R, soit
tJr le lacet obtenu en composant C+(0,R), [tR,fe], C+(0,e)opp et [e,R] (faire un dessin!), et soit 7~R
le lacet obtenu en composant [fe,*R], C~~(0,R), [R,e] et C~"(0,e)opp.
(a) Calculer f + ^f- dz et f - ^f- dz en utilisant la formule des résidus, avec log(-2) G R, si
2 G R* . (Attention à la détermination du logarithme !).
(b) Montrer que les intégrales sur les portions de cercle tendent vers 0 quand e —> 0 et R —> +00.
(c) En déduire la valeur de J0+o° Jfj dy, si -1< Re(s) < 0.
(ii) Soit B(s,t) = Jo ^(l - x)*-ldx. Montrer que B(M) = rff^j}, si Re(s) > 0 et Re(t) > 0. (On
écrira T(s + t)B(s,t) comme une intégrale double.)
(iii) Démontrer la formule des compléments (on utilisera la formuleB(s,£) = f*00 r£y\*+idy obtenue
en faisant le changement de variable y = ^zy).
Exercice VI.3.20. Calculer /0+o° (t+i$t+2) dt P3* ^a méthode des résidus. (On intégrera tJfâ?z+2) dz
sur les contours de l'ex. VI.3.19.)
Exercice VI.3.21. Soit P G C[X] unitaire de degré n. Calculer
),R)
R->+oo 2Z7T yC(0,R) P(*)
En déduire que C est algébriquement clos.
Exercice VI.3.22. Soit fi un ouvert connexe de C, Soit / une fonction holomorphe non identiquement
nulle sur fi, et soit fn une suite de fonctions holomorphes tendant vers / uniformément sur tout compact
défi.
(13>Une manière de voir que l'on a pris le bon demi-cercle est de vérifier que ce qu'on obtient tend versO
quand |£| —> +00 ; il faut aussi faire attention à l'indice du lacet par rapport aux pôles...
(14)D'autres démonstrations se trouvent dans les ex. VII.2.2 et H.1.11.
VI.3. LA FORMULE DES RÉSIDUS DE CAUCHY
397
(i) Soient z0 G Q, et r > 0 tels que D(z0,r) c fi. On suppose que C(z0,r) ne contient aucun zéro de /.
Montrer qu'il existe N(z0,r) tel que, si n ^ N(20,r), alors / et fn ont le même nombre de zéros, comptés
avec multiplicité, dans D(z0>r~~).
(ii) Montrer que, si fn est injective sur fi, pour tout n assez grand, il en est de même de /.
Exercice VI.3.23. (Théorème de Rouché et applications).
Soient R > 0, D = D(0,R) et C = dD = C(0,R). Soient fi un ouvert contenant D, / holomorphe
sur fi, ne s'annulant pas sur C, et g holomorphe sur fi, telle que \f(z) - g(z)\ < \f(z)\, si z G C.
(i) Montrer qu'il existe fix c fi ouvert contenant C et h holomorphe sur Cl' tels que % = eh sur fix.
Que vaut h' ?
(ii) Montrer que f et g ont le même nombre de zéros (comptés avec multiplicité) dans D (théorème de
Rouché). Le résultat n'est-il valable que pour un disque?
(iii) Soit G holomorphe sur fi telle que \G(z)\ < R, si z G C. Montrer que G(D) c D et que G a un
unique point fixe dans D.
(iv) Montrer que toutes les solutions de zsinz = 1 sont réelles.
Exercice VI. 3.24- Soit F la fonction méromorphe sur C, holomorphe en dehors de pôles simples en
les entiers négatifs, définie par T(z) = f*°° e~~Hz y, si Re(z) > 0. On rappelle (cf. ex. V.5.9) que l'on a
n*) = Z(ziTtllny quel que soit n G N-
(i) Montrer que \imz->-n(z + n)r(z) = ^""nV .
(ii) Montrer que, si x > 0, et si c £ -N, alors lc(x) = fc-i& x~zT(z) dz converge.
(iii) Si n G N, calculer Ii(x) - Ii _n(x) par la méthode des résidus.
(iv) Montrer que Ii_n(x) —> 0. En déduire que ^ fi*^ x~~zY(z)dz = e~~x.
(v) Retrouver le résultat en utilisant la transformée de Fourier.
Exercice VI.3.25. Si N G N, soit Cn le carré de sommets (2N + l)7r(±l ± i) parcouru dans le sens
direct, et soit IN = /Cn z*$_iy
(i) Calculer In en utilisant la formule des résidus.
(ii) Montrer que In —> 0 quand N —> +oo.
(iii) En déduire la formule Ç(2) = £_.
(iv) Soient Bn, pour n G N, définis par -^zi = X^n^^n^r- Adapter ce qui précède pour calculer
C(2fe), pour k G N - {0}, en fonction des Bn. En déduire que 7r-2kÇ(2k) G Q.
Exercice VI.3.26. Calculer l'intégrale de ffiffi sur le carré de sommets (N + ±)(±1 ±i). En déduire
la valeur de E»€ZÇ?W-
Exercice VI.3.27. (transformée de Fourier de g^)
Calculer JR e2in ** eatl+1 dt de deux manières : d'une part en intégrant e2in z* e£**+l dz sur un rectangle
convenable, en faisant tendre les sommets vers l'infini, d'autre part en écrivant e£l+l comme une série
en ent ou e~"*1 suivant que t est négatif ou positif. Comparer avec l'ex. V.5.3.
Exercice VI. 3.28. (intégrale de la gaussienne et loi de réciprocité quadratique)
Cet exercice fournit une démonstration de la formule JRe"ïït dt = 1 par la méthode des résidus, et
une démonstration de la loi de réciprocité quadratique.
(i) On note I l'intégrale /Re"rf dt et, si a G N - {0}, on pose G(a) = Efcez/aZ e2™^.
(a) Montrer que z »-> F(z) = JR e~"*1 e~~2™tz est holomorphe sur C.
(b) Calculer F(iy), si y G R; en déduire que F(z) = Ie~"*z , pour tout z e C.
398 CHAPITRE VI. LA FORMULE DE CAUCHY ET CELLE DES RÉSIDUS (DE CAUCHY)
(c) Soit *a(z) = EÎÏÏ^"2*0*2^**", oùw = ^. Montrer que /R$a(*)d* = -^G{4a). (On
commencera par montrer que /Re~27ra<2e2lfku}t dt = -^=e2i,r^.)
(ii) Si a € N - {0}, soit tf0(*) = ^'1"' ■
(a) Vérifier que #a(z - w) - #a(.z) = $a(z).
(b) Calculer /R #0(* - f ) d* - /R Va(t + f ) dt par la méthode des résidus.
(c) En déduire que -4^ G (4a) = a», puis que 1=1.
(iii) Si p est un nombre premier, et si (n,p) = 1, on définit le symbole de Legendre (**) par (**) = 1
ou — 1, suivant que n est ou n'est pas un carré dans Fp. On pose aussi Gn(p) = ]C&€F, e2twiip~. On rappelle
que, si a et 6 sont premiers entre eux, alors (x, y) i-» bx+ay induit une bijection (Z/oZ) x (Z/6Z) = Z/abZ.
(a) Relier G (4a) et G (a) si a est impair ; en déduire que G (a) = y/â, si a = 1 mod 4 et G (a) = iy/â,
si a = 3 mod 4 (formule due à Gauss).
(b) Montrer que £m€FP e™*™ = 0; en déduire que Gn(p) = (g)G(p), si (n,p) = 1.
(c) Soient p ^ q deux nombres premiers impairs. Montrer que G(pq) = (£) (|)G(p)G(g) ; en déduire
la loi de réciprocité quadratique (J)(J) = (-1)<p-i)(«-i)/4.
CHAPITRE VII
SÉRIES DE DIRICHLET
Une série de Dirichlet générale est une expression de la forme 2n2 ane~XnS, où les an
sont des nombres complexes, et les Àn sont des nombres complexes dont la partie réelle
tend vers +00. (Si Àn = n — 1 pour tout n, on retombe, modulo le changement de variable
e~s = z, sur le cas des séries entières (avec une indexation bizarre), ce qui permet de voir
les séries de Dirichlet générales comme une généralisation des séries entières.) Dans ce
chapitre, nous ne nous intéresserons qu'au cas où An = logn, pour tout n, qui est le cas
originellement considéré par Dirichlet, mais le cas général intervient naturellement quand,
par exemple, on essaie de définir le déterminant d'un opérateur en dimension infinie, ce
qui a de multiples applications en physique ^ et en mathématiques. Comme illustration
de ce procédé « de zêta-régularisation », mentionnons la formule
l-2-3-4-5--- = >/2Îr,
équivalente à — X)nS^°Sn = — |log27r, dans laquelle le membre de gauche s'interprète
comme la dérivée en 0 de la fonction Ç définie par £(s) = J2n™i ï^> s* R-e(5) > 1, et
prolongée analytiquement^ à C — {1}.
VII. 1. Séries de Dirichlet
1. Abscisse de convergence absolue
On appelle série de Dirichlet une série de la forme L(a, s) = SîS ann~s, où 5 € C et
a = (ûn)n^i est une suite de nombres complexes (et n~s = exp(—5logn), où logn € R+).
Une série de Dirichlet peut ne converger pour aucune valeur de s, mais si elle converge
pour s0, on a en particulier, onn~So —> 0, et donc \an\ = o(nRe(so)). Réciproquement,
^Les fréquences d'une membrane vibrante sont les valeurs propres du laplacien sur l'ouvert de C
représentant cette membrane. La fonction zêta du laplacien (a (s) = J2 A~s, où la somme porte sur les valeurs
propres non nulles, encode des relations entre ces fréquences et la géométrie de la surface. Le déterminant
du laplacien est exp(-(A(0)) ; il intervient par exemple dans des questions de renormalisation.
(2)L'existence de ce prolongement analytique fait l'objet du th. VII.3.4, et une démonstration de la formule
£'(0) = -\ log27r est proposée dans l'ex. VII.3.9.
400
CHAPITRE VIL SÉRIES DE DIRICHLET
si \an\ = 0(na), pour un certain a € R, alors J2n™iann~s converge normalement sur
tout demi-plan de la forme Re(s) > a + 1 + ô, avec ô > 0 ; elle définit donc une fonction
holomorphe sur le demi-plan Re(s) > a+1. De même, si SnS an^~s converge absolument
pour s = s0, alors elle converge normalement sur le demi-plan Re(s — s0) ^ 0, puisque
|ûn^~*| ^ |ûn^-so| sur ce demi-plan; elle définit donc une fonction holomorphe sur le
demi-plan ouvert Re(s — s0) > 0» qui se prolonge par continuité au demi-plan fermé
Re(s - so) >0. _
La discussion précédente amène naturellement à définir les éléments suivants de R :
• 0"coiw = inf{Re(s), L(a, s) converge} abscisse de convergence,
• 0"abs = inf{Re(s), L(a,s) converge absolument} abscisse de convergence absolue-,
• 0"hoi = inf{<7 6 R, L(a, s) admet un prolongement holomorphe sur Re(s) > a}.
• t = inf{a € R, an = 0(na)}.
Le nombre r n'a pas de signification particulière, mais des quantités précédentes, c'est
la plus facile à calculer ; de plus la discussion ci-dessus nous fournit les encadrements :
T < 0coiiv < CTabs < T + 1.
Par ailleurs, contrairement au cas des séries entières (cf. (i) de la rem. V.4.9), on n'a pas
forcément ahoi = 0"abs> comme le montre l'exemple des fonctions L de Dirichlet (th. VII.4.4).
Pour beaucoup de séries de Dirichlet issues de la théorie des nombres ou de la physique
théorique, on conjecture que <7hoi = —oo (i.e. il existe un prolongement analytique à tout le
plan complexe), mais ceci est un petit miracle indiquant des symétries cachées qui restent
fort mystérieuses.
On suppose dans tout ce qui suit que les séries de Dirichlet que l'on considère convergent
quelque part (i.e. aabs ^ +oo), le cas contraire n'ayant qu'un intérêt limité... On peut
alors retrouver les an à partir de la fonction L(a, s) (en effet, ai = \ims^+00L(a.,s),
a2 = lims^+oo 2s(L(a, s) - oi), etc.).
On remarquera que le produit de deux séries de Dirichlet L(a, s)L(b, s) est encore une
série de Dirichlet L(c, s) = X)n^i %si°ùcn = 52d\n adK/d- Cette formule, qui fait intervenir
la factorisation des entiers, est largement responsable de l'intérêt des séries de Dirichlet
pour des questions d'arithmétique.
Théorème VII. 1.1. (Landau) Soit L(a, s) = Y^n^i ^ une sé™e de Dirichlet à
coefficients positifs (i.e. an € R+, quel que soit n ^ 1). Alors aabs n'a aucun voisinage dans C
sur lequel L(a, s) admet un prolongement analytique^.
Corollaire VII. 1.2. Si L(a, s) = J2n>i ^ esi une 5er*e de Dirichlet à coefficients
positifs, alors <Jhoi = <^abs-
(3>I1 arrive que L(a,s) admette un prolongement méromorphe comme le montre le cas de la fonction zêta
de Riemann (cf. th. VII.3.4), mais alors cra\)S est un pôle de ce prolongement.
VII.l. SÉRIES DE DIRICHLET
401
Démonstration. Le corollaire est immédiat. Passons à la démontration du théorème.
Posons a = 0-abs> et supposons, par l'absurde, qu'il existe e > 0 tel que L(a, s) admette un
prolongement analytique au disque D(a,3e~). Alors L(a, s) est holomorphe sur l'ouvert
Q, réunion de D((j,3e~) et du demi-plan Re(s) > a. Comme Q. contient D(a + e,3e~),
L(a, s) est somme de sa série de Taylor en a + e sur ce disque, et en particulier, on a
L(a,a - e) = 2S L ^i,<H"^(-2g)fc. Par ailleurs, comme a + e est dans le demi-plan de
convergence de L(a, s), on peut, d'après le th. V.5.1, calculer L^(a.,a + e) en dérivant
terme à terme la série de Dirichlet. On obtient donc
Ua,.-£) = gL«(ai. + £)^ = g(2^i^)«
fc=0 ' k=0 n=l
En faisant rentrer le (~ffi à l'intérieur de la parenthèse, on obtient une série double à
termes positifs, ce qui permet d'échanger l'ordre des sommations, et d'obtenir :
+00 +OO /r, 1 \t +OO +OO
n=l fc=0 n=l n=l
On en déduit que L(a, s) converge en a — e, ce qui est contraire à la définition de a. Ceci
permet de conclure.
2. Demi-plan de convergence d'une série de Dirichlet
Contrairement au cas des séries entières, on a, en général^, aconv ¥" 0abs> et la
détermination de 0-COnv peut cacher des difficultés redoutables... D'autre part, d'après le
cor. VII. 1.6 ci-dessous, on a 0hoi ^ 0conv> et le cas des fonctions L de Dirichlet (th. VII.4.4)
montre que, contrairement au cas des séries entières, on n'a pas toujours égalité. La
quantité ahoi est très souvent extrêmement difficile à calculer. Une grande partie du programme
de Langlands (cf. annexe G) est destinée à prouver que pour beaucoup de séries de
Dirichlet issues de la théorie des nombres, on a 0hOi = — 00.
L'étude de la convergence des séries de Dirichlet repose sur le lemme suivant.
<4) Supposons par exemple que on € {±1}, pour tout n > 1. On a alors <rabs = 1. Pour étudier <7conv, on
peut utiliser la formule sommatoire d'Abel : on pose An = E)£=i ak de telle sorte que
Ê^^+E/.(»-'-(«+r)=^+E^w.-(i^)-')).
n=l v ' n=l v 7 n=l
On en déduit le fait que, si An = 0(na), avec a < 1, alors c7COnv ^ oc. Or Hausdorff (1913) a démontré
que, presque sûrement (en considérant les an comme des variables aléatoires indépendantes à valeurs
dans {±1} muni de l'équiprobabilité), An = 0(n1/2+e), quel que soit e > 0, et donc aconv < 1/2 presque
sûrement (et 1/2 est sûrement différent de 1).
402
CHAPITRE VIL SÉRIES DE DIRICHLET
Lemme VII. 1.3. Soient a,@ G R, avec 0 < a < (3. Soit z = x + iy, avec x,y € R,
et x > 0. Alors
|e-« - e~Ps\ < \-\(e~ax - e_/fe).
Démonstration. On a e Q2: — e ^z = z f£ e tz dt, et donc
|c-« _ e-^| ^ |z| / e-txdt = |£|(c-« _ c-/fa).
En appliquant ce lemme à a = logn, /? = log(n + 1) et z = s — s0> on obtient :
Corollaire VII. 1.4- Sin^l, et si Re(s — s0) > 0, alors
\n-(sso) _ (n + !)-(.-o)| ^ l*-*ol (n-Re(s-s0) - (n + l)-1^*-*)).
Re(s — 5o)
Théorème VII. 1.5. Soient L(a, s) = EïS ann~s w^^ série de Dirichlet, et s0 € C.
(i) 5« /a sm£e des sommes partielles An(s0) = Sfe=i ak &~So e^i bornée, alors L(a, s)
converge uniformément dans tout compact du demi-plan Re(s — so) > 0.
(ii) 5« la série J2nS. an n~so converge, alors L(a, s) converge uniformément dans tout
secteur angulaire |arg(s — so)\ < a < f du demi-plan Re(s — so) ^ 0.
Démonstration. La démonstration est la même dans les deux cas et repose sur la formule
sommatoire d'Abel. Si pyq € N vérifient p < ç, soit
MP)<Ï = sup |Bn)P|, avec B„)P = An(s0) - Ap_i(s0)
(et Ao(so) = 0» puisqu'une somme vide est nulle par convention). On a
Jonn-' =X>»,p - Bn_x>-<s-*>>
n=p n=p
q-\
=B,,p<r(s-So) + Y, Bn(P(n-(s-S0) - (n + l)"^-s°)).
n=p
Si Re(s — So) > 0? en utilisant la majoration du cor. VIL 1.4, l'inégalité 1 ^ jwJ-'s )» et ^a
définition de MP)g, on en déduit la majoration
| J2 ann-s\ <Mm{q~K<s-^ + ^,~^\ J>-Re<*-*>> ~(n+ l)"*6^))
n=p ^ ' n=p
^M™Re(s-So)P
Maintenant, si |An(so)| < M, quel que soit n € N, on a MPiQ < 2M quels que soient
p < q. Par ailleurs, si K est un compact du demi-plan Re(s — s0) > 0, alors il existe
a > 0 et b > 0 tels que \s — sq\ < a et Re(s — sq) ^ b, quel que soit s G K. On a donc
VII.2. SÉRIES DE DIRICHLET ET TRANSFORMÉE DE MELLIN
403
| Yln=pann~s\ ^ 2Mab~1p~bi si s G K, ce qui prouve que la série J2n^i ann~s satisfait au
critère de Cauchy uniforme sur K. On en déduit le (i).
Pour démontrer le (ii), il suffit de constater que l'hypothèse selon laquelle J^n>1 ann~So
converge est équivalente à MPtQ —> 0, quand p —> +00, d'après le critère de Cauchy.
Comme Rb~l°o) est majoré par tga sur le secteur angulaire |arg(s — 5o)| < û; < | du
demi-plan Re(s — so) ^ 0> et comme p-Re(s-*o) ^ \ sur ie demi-plan, on en déduit que la
série J2n>i an n~s satisfait au critère de Cauchy uniforme sur le secteur angulaire, ce qui
démontre le (ii).
Corollaire VII. 1.6. Soient L(a, s) = ]Cn>i ^ une $é™e de Dirichlet, et aœnv G R
l'abscisse de convergence de L(a, s). Alors L(a, s) converge en tout s du demi-plan
Re(s) > aœnv et définit une fonction holomorphe sur ce demi-plan, et donc Ohoi ^ 0"COnv
Démonstration. Par définition de aconv, pour tout e > 0, il existe s£ G C, tel que
L(a,se) soit convergente et Re(se) ^ (Jconv + £■ D'après le th. VII. 1.5, la série L(a,s)
converge pour tout s du demi-plan Re(s) > (jCOnv + £> car ce demi-plan est une réunion
de secteurs angulaires de sommet se, et comme ceci est vrai pour tout e > 0, cela prouve
que L(a, s) converge en tout s du demi-plan Re(s) > <JCOnv L'holomorphie de L(a, s) sur
ce demi-plan résulte de ce qu'une fonction qui est limite uniforme sur tout compact de
fonctions holomorphes est elle-même holomorphe (th. V.5.1).
VII.2. Séries de Dirichlet et transformée de Mellin
1. La fonction P dans le plan complexe
La fonction F d'Euler a été définie (cf. ex. IV. 1.5) sur R/J. par la formule
F(x) = /0+o° e~Hxj. Nous nous proposons de l'étendre en une fonction méromorphe sur
C tout entier. On trouvera une autre approche dans l'ex. V.5.9; l'approche ci-dessous
montre directement que T ne s'annule pas, ce qui peut aussi se déduire de la formule des
compléments (ex. VI.3.19).
On rappelle que la constante d'Euler 7 est la limite de — logn+^^=1 £, quand n —> +00.
Théorème VII.2.1. (i) Le produit
+00
/(*) = * e-n((l + £)e-^)
est uniformément convergent sur tout compact de C, et coïncide avec £ sur R£.
(ii) La fonction F complexe définie par T(z) = -4^ est méromorphe sur C, holomorphe
en dehors de pôles simples aux entiers négatifs, de résidu ^^ en —n, sineN. De plus,
on a F(z + 1) = zT(z), quel que soit z e C - (-N).
404
CHAPITRE VII. SÉRIES DE DIRICHLET
Démonstration. La fonction h{z) = z~2((l + z)e~z — 1) est holomorphe sur C, et donc
est bornée sur tout compact. En particulier, il existe M tel que |(1 + z)e~z — 1| < M|22|,
si \z\ < 1. Maintenant, si K est compact, il existe R(K) tel que \z\ < R(K), quel que
soit z e K, et on a |(l + l)e~z'k - 1| ^ ^^, si k > R(K) et z e K. On en déduit
la convergence uniforme du produit sur K, et le th. V.5.4 montre que / est une fonction
holomorphe sur C avec des zéros simples en 0 et les — k, pour feeN- {0}. En passant
à l'inverse, cela montre que T est méromorphe sur C, holomorphe en dehors de pôles
simples aux entiers négatifs.
Maintenant, si x e R*, on a, d'après la formule de Gauss (cf. ex. IV. 1.5),
1 x(x + l)---(x + ri)
T(x)
= lim «l»-m;"ts + "J = x lim e-iogn TT (1 + ï}
fc=l
- ^(„^-(i+-"+i/n)*n (i+1))=«^n ((i+1 >-*'%
fe=l k=\
ce qui permet de montrer que / coïncide avec £ sur R*.
Enfin, les fonctions z i-> T(z + 1) et z i-> 2IX2) sont holomorphes sur C — (—N), et
coïncident sur R* ; elle coïncident donc sur C — (—N), d'après le th. des zéros isolés.
Comme T(l) = 1, cela permet de montrer que limz_»_n(2 + n)r(2) = ^p, par récurrence
sur n. Ceci termine la démonstration du théorème.
Exercice VII.2.2. (i) Établir la formule des compléments T(^)r(l - z) = -^^ (on prendra la dérivée
logarithmique^ des deux membres, et on utilisera l'ex. V.5.3). En déduire une démonstration de l'identité
f+°° e~"t2 dt = 1.
j—00
(ii) Établir de même la formule de multiplication : si p € N — {0}, et si 2 € C — (-N), alors
IJr(i±i) = (27r)(p-1)/V2+1/2r(^).
3=0 p
2. Une formule intégrale pour les séries de Dirichlet
Le changement de variable(6) u = Xt montre que, si À € R+, et si Re(s) > 0, alors
r+00
1 J_ f -*f *
a- r(s)J0 e t'
Cette simple remarque va se révéler extrêmement utile pour étudier le prolongement
analytique de certaines séries de Dirichlet.
Soit L(a, s) = J2n>ï ^ une série de Dirichlet convergeant quelque part.
<5>La dérivée logarithmique d'une fonction / est la fonction 4 ; c'est la dérivée de log/.
(6)Une raison pour faire apparaître la mesure y est qu'elle est invariante par ce type de changement de
variable de même que dt est invariante par un changement de variable u = t + a. Autrement dit, y est
une mesure de Haar sur R+.
VII.2. SÉRIES DE DIRICHLET ET TRANSFORMÉE DE MELLIN
405
Lemme VII.2.3. (i) La série entière F&(z) = J2n™i anzn e$t de rayon de convergence
au moins 1.
(ii) fa(t) = Fa(e-*) est tf00 sur R+ et à décroissance rapide à l'infini, ainsi que toutes
ses dérivées.
Démonstration. Il existe r € R tel que on = 0(nT) ; on en déduit le (i) et le fait que
Fa(^) = 0(\z\) au voisinage de 0. Ceci implique que /a est fé*00 sur R+ et 0(e~*) au
voisinage de +oo (et donc à décroissance rapide, ce qui, pour une fonction / : R+ —> C,
signifie, rappelons-le, que tNf(t) est bornée quand t —► +oo, pour tout N G N). Pour
passer au cas d'une dérivée d'ordre quelconque de /a, il suffit de constater que /a ' = /a(/b>,
où aW = ((-n)fean)n6N.
Lemme VII.2.4- Si Re(s) > sup(aabs, 0), la fonction f&{t)ts~l est sommable sur R+,
et on a
1 r+°° Ht
Démonstration. Si Re(s) = a > sup(<7abs,0), on a
f+OO /«+00 +°° Jj.
/ l/.wt-1!*^/ (EW^t
Jo Jo n=l t
= £ kl r e-H° £ = i» g M < +00,
n=l Jo l n=l U
ce qui prouve que f&{t)t8~l est sommable sur R+ et que la série SiS ûne~n^s_1 converge
dans LX(RJ) vers f&(t)ts~l. On a donc
/H-oo +oo /»+oo +o° p/.\
/ fa(t)t°-ldt = yZ / ane-ntts-1 dt = J2 o»^-
^O n=l«/o n=l n
Ceci permet de conclure.
Remarque VII.2.5. (i) Si / : R; -> C, la fonction s ■-> Mel(/, s) = /0+o° /(*)** f est
la transformée de Mellin de /. Le changement de variable t = eu montre que, sur une
droite verticale Re(s) = a, la transformée de Mellin coïncide, à homothétie près, avec la
transformée de Fourier de f(eu)eau, ce qui permet de déduire un grand nombre de ses
propriétés de celles de la transformée de Fourier.
(ii) La fonction fa(t) = ]CÏ2[ o>ne~nt est fé*00 sur R+, mais n'a aucune raison, a priori,
d'être très sympathique en 0. De fait, les propriétés de prolongement analytique de la série
de Dirichlet J2t™i ^ sont étroitement liées à la régularité de /a en 0. La prop. VII.2.6
ci-dessous donne une illustration de ce phénomène.
406
CHAPITRE VIL SÉRIES DE DIRICHLET
3. Prolongement analytique de séries de Dirichlet
Proposition VII.2.6. Soit f une fonction c£co sur R+, à décroissance rapide à
l'infini ainsi que toutes ses dérivées.
(i) La fonction M(/,s) = fhj f^°° f(t)tsj, définie pour Re(s) > 0, admet un
prolongement holomorphe à C tout entier^7)
(ii) Si k e N, alors M(/, -k) = (-l)fc/(A:)(0)-
Démonstration. Sur la bande b > Re(s) > a > 0, on a |/M*S_1| < l/W sup(*û_1, *6_1)|.
Or JJ)+00|/(£)sup(£a~1,£6~1)|d£ < +oo, grâce à la décroissance rapide de / à l'infini, et
à l'hypothèse a > 0 pour ce qui se passe au voisinage de 0. On est sous les conditions
d'application du th. V.5.7, ce qui permet de montrer que M(/, s) est holomorphe sur le
demi-plan Re(s) > 0.
Par ailleurs, une intégration par partie nous donne M(/, s) = — M(//, s+1), si Re(s) > 0.
On a donc, plus généralement, M(/,s) = (-l)nM(/(n),s + n), si Re(s) > 0 et n € N. En
appliquant ce qui précède à f(n\ au lieu de /, on en déduit que (—l)nM(f(n\s + n) est
holomorphe sur le demi-plan Re(s) > — n. Comme cette fonction coïncide avec M(/, s)
sur le demi-plan Re(s) > 0, cela prouve que M(/, s) admet un prolongement holomorphe
au demi-plan Re(s) > —n, et comme ceci est vrai quel que soit n G N, cela permet de
démontrer le (i).
Le (ii) résulte de ce que M(/, -k) = (-l)k+1M(f(k+1\ 1) est aussi égal à
P+OO
(_1)*+1 / /(*+!>(*) dt = (-l^lf^U00 = (~l)kf{k)(0).
Jo
Corollaire VII. 2.7. Si /a est tf00 sur R+, alors L(a, s) admet un prolongement
holomorphe à C tout entier. De plus, si k € N, on a L(a, — k) = (—l)kfi(0).
Démonstration. C'est une conséquence directe du lemme VII.2.4 et de la prop. VII.2.6
puisque /a est à décroissance rapide à l'infini, ainsi que toutes ses dérivées (lemme VII.2.3).
Remarque VII.2.8. La formule L(a, -k) = (-l)kfLk\o) montre que l'on obtient la
même valeur pour la somme de la série divergente J2n>i an^fc, en prenant la valeur de
L(a, s) en -k ou la limite quand x —► 1" de ]CïS a>nnkxn.
4. Croissance dans une bande verticale
La prop. VII.2.11 ci-dessous montre que le prolongement analytique d'une série de
Dirichlet a un comportement raisonnable dans une bande verticale ; ceci nous sera utile
plus tard (lemme A.3.1). Sa démonstration repose sur la formule de Stirling.
(7>La distribution / *-* M(/, s) que ceci permet de définir, est une partie finie de Hadamard. Le (ii) montre
que si k € N, alors M( , —k) est la dérivée A;-ième de la masse de Dirac en 0.
VII.2. SÉRIES DE DIRICHLET ET TRANSFORMÉE DE MELLIN
407
Proposition VII.2.9. Sur tout secteur angulaire de la forme |arg(2)| < a, où a < n,
on a les développement suivants au voisinage de \z\ = oo :
(i)^ = log*-£ + 0(±);
(ii) logT(z) = z\ogz-z + £(log(27r) - logz) + 0(1), où logT(z) = fM T$dw est le
logarithme de T(z), holomorphe dans le secteur angulaire, prenant la valeur 0 en z = 1.
(formule de Stirling complexe).
Démonstration. On paît de la formule Ç^ = -7 - \ 4- YX=\ (l ~ life)> qui decoule (th- V.5.4)
de la définition de £ comme un produit convergent. Si z ^ R_, on peut réécrire cette formule sous la
forme (où [t] désigne la partie entière de t et {t} = t - [t], sa partie fractionnaire)
1 /*+°° 111 1 /»+<» 1 1
Maintenant, [log ^1*°° = log(-z + 1) = logz + \ + O(js) et C = f*°° |^j- dt est une constante. Enfin,
on peut écrire f*°° (z+t\(l+[t\) ^ sous ^a f°rme
f+°° {*> „ f+°° {t} ., , f+0° {t}2
h (z+t)(z + [t)) dt-h {z + tydt + ]x (z + tnz + [t))dt
_ 1 , /-+0OW-l/2 f+°° {t}2
2(* +1)+ A (z+ty at + JX (z+ty{z + [*]) '
et une intégration par parties nous donne
[+°°{t}-l/2 M}2-{t}]+00 f+0°{t}2-{t} [+<*>{t}*-{t}
h (z+ty dt-^2{z+ty Ji +}x (z + tr dt-h (z + tr
En utilisant la minoration
\z + u\2 > 1+°°Sa(\z\ + u)2, si u € R+ et |arg(z)| < a,
cela permet de majorer en module les quantités f*°° (z+M\z+it\) ^ et /1 °° (z+Ô3 ^ par «A (izi-2)3 °^+
J2+°°( i+c2osa)3/2(|Z|+i_i)â dt On en déduit que ces deux intégrales sont des O(^) et comme il en est de
même de 2(z+\) ~ 2z> on obtient finalement :
-J-l = log2 + C-7-- + H(z),
où H est holomorphe dans le secteur angulaire |arg(^)| < a et y vérifie |H(,z)| ^ -As, si \z\ ^ 1, pour une
certaine constante A > 0. On en déduit, en intégrant, que
1 fz
logr(z) = [wlogw - w + (C - 7)w - - logtu]* + / R(w)dw.
Maintenant, si z = reid, on peut écrire /* sous la forme /* + /^e + /^<«, et quand R tend vers +00,
/j H(w)dw tend vers une constante; JRe H(w)dw —» 0 car |H(w)| ^ ^ et la longueur de l'arc de
cercle est 0R, et \ f^ H(w)dw\ ^ f^-fcdu ^ £ = fa. D'où l'existence de C € C, tel que l'on ait
-dt,
dt.
408
CHAPITRE VII. SÉRIES DE DIRICHLET
logT(^) = zlogz - z + (C - 7)2 - \ log 2 + C + O(^) au voisinage de l'infini. La formule de Stirling
réelle :
log(r(x + 1)) = x logx - x + - log(27rx) + o(l), au voisinage de +00
permet alors d'en déduire que C - 7 = 0 et C = \ log 27r, ce qui permet de conclure.
Corollaire VII.2.10. Quand \t\ tend vers +00, on a
|1> + ir)\ = ^|rr h~^2(l + 0(i)),
T
uniformément dans toute bande verticale de largeur finie.
Démonstration. Si s = a + z'r, et a < a < 6, où a, b € R sont fixés, alors
1 1 • 0~ rt/ L ,ii Î7C T G . , 1 .
logS = \0glT + — + 0(-x) = log T + — • -r-r + — + 0(-r).
zr r2 2 |r| %r r2
En utilisant le (ii) de la prop. VII.2.9 et la formule ci-dessus, on en déduit que
7t|t| 11 1
Re(log T(a + ir)) = a log |r| J-1 + o - a - - log |r| + - log27r + O(-).
2 2 2 r
Ceci permet de conclure.
Proposition VII. 2.11. Soit f une fonction ^°° sur R+, à décroissance rapide à
l'infini ainsi que toutes ses dérivées. Si a ^ b sont deux réels, alors pour tout k G N, il
existe Catbtk(f) tel que
|M(/, s)\ < CaAk(f)(l + \r\)-ke%W, si s = a + ir et a < a O-
Démonstration. Choisissons n € N tel que n + a> k-\-\. Si s = o + ir, avec a ^ a ^ 6,
alors
1 /"+oo j^
Cn
|r(« + n)|'
où Cn = f+°° \fW(t)\sup(ta+n,tb+n)f. Par ailleurs, d'après le cor. VII.2.10, il existe
T > 0 tel que, si s = a + z'r, alors
|r(s + n)\~l < -^=(1 + |r|)5-^efM ^ -|=(1 + |r|)-*e* M, si \r\ ^Teta^a^b.
V27T V27T
Donc (1 + IrD^e"?|t||M(/, s)\ est bornée sur {s = a + ir, \t\ ^ T, a ^ a < b}, et comme
elle est continue sur la bande a ^ Re(s) ^ 6, elle est aussi bornée sur la bande toute
entière. Ceci permet de conclure.
VII.3. LA FONCTION ZÊTA DE RIEMANN
409
VII.3. La fonction zêta de Riemann
1. Séries de Dirichlet attachées à des fonctions multiplicatives
On note & l'ensemble des nombres premiers.
Une fonction n i-» a(n) de N — {0} dans C est multiplicative, si a(l) = 1, et si a{nm) =
a(n)a(m) pour tous n et m premiers entre eux; elle est strictement multiplicative, si
a(l) = 1, et a(nm) = a(ri)a(m), quels que soient ra,n ^ 1. On remarquera qu'une
fonction strictement multiplicative est déterminée par les a(p), pour p € & puisque, si
n = riigirf* est ^a décomposition de n en facteurs premiers, on a o(n) = Yli& a(Pi)ki' ^'dr
contre, pour une fonction multiplicative, on a besoin de connaître les a{pk), pour p € &
et k ^ 1. On a alors a(ri) = Yli£ia(Phi)
Proposition VII.3.î. 5i n h a(n) est multiplicative, et si L(o, s) = ^2n>l ^r
converge quelque part, alors pour tout s dans le demi-plan Re(s) > aabs, on a :
(i) 1 + ^r + ^r H est absolument convergent quel que soit p € & ;
(ii) le produit IIpe^(l + ^ + ~p^ "I ) conver9e uniformément sur tout demi-plan
Re(s) > c> aabs, et sa valeur est L(a, s).
Démonstration. Soit c > aabs- Si Re(s) > c, alors
2. l^ + -^r + --|< Z, (1-^-1 +l-^rl + ■■■)< 2.^^ <+0°-
On en déduit le (i) et, en utilisant le th. V.5.4 (ou plutôt la démonstration du (i) de ce
théorème), la convergence uniforme du produit sur Re(s) > c.
Si X € R+, soit «^(X) l'ensemble des nombres premiers ^ X, et soit I(X) l'ensemble des
entiers dont tous les diviseurs premiers sont dans «^(X). Si k € N, soit I(X, k) l'ensemble
des entiers de la forme Tlp€<?(x)P^pi avec 0 ^ &p < &. L'ensemble I(X, k) est donc un
ensemble fini. Par ailleurs, la multiplicativité deni-> a(n) fait que
p€#>(X) F F n€l(X,Jfe)
Comme toutes les séries qui interviennent sont majorées, en valeur absolue, par la série
sommable Yln>\ ll?l> ^e théorème de convergence dominée pour les séries montre, en
faisant tendre A; vers +00, que
nn-i-^x^i-u n V^ a(n)
p€.^(X) y F n€l(X)
puis, en faisant tendre X vers +00, que
nruîMxîWj. , _ y^ a(n)
U + pS + p2s + ' ' ' > ~ 2.. ns >
410
CHAPITRE VII. SÉRIES DE DIRICHLET
ce que l'on cherchait à établir.
Remarque VILS.2. (i) Le facteur 1 + ^ + ^ + • • • du produit est le facteur d'Euler
en p de la fonction L(o, s), et la formule L(a, s) = Yi.Pe#>(l + ^Sr + ^£r + • • • ) est la
décomposition de L(a, s) en produit de facteurs d'Euler (ou en produit eulérien).
(ii) Si a est strictement multiplicative, les facteurs d'Euler sont donnés par des séries
géométriques et on a L(a, s) = \[p€&) yz^pr-
2. Prolongement analytique de la fonction Ç,
La série de Dirichlet L(l, s) = Y^n^i ^ admet 1 comme abscisse de convergence absolue
(et comme abscisse de convergence puisqu'elle est à coefficients positifs (cor. VII.1.2)). De
plus n *-* 1 est on ne peut plus strictement multiplicative ; on déduit donc de la théorie
générale le résultat suivant (dû à Euler, 1737).
Proposition VILS.3. Si Re(s) > 1, alors J2n^i^F = Tlpeâ» i-ï-»' e* ^e Vr°duit est
uniformément convergent sur tout demi-plan Re(s) > c > 1.
Théorème VII.3.4- Il existe une unique fonction, notée Ç (fonction zêta de Rie-
mann), vérifiant :
• £ est méromorphe sur C tout entier, holomorphe en dehors d'un pôle simple en s = 1,
de résidu 1 ;
• C(s) = L(l,s), siRe(s) > 1.
Démonstration. L'unicité est une conséquence de l'unicité du prolongement analytique
(cor. V.3.7). Si h(t) = Y^=i e~nt = tt et si 9® = </i(0. on déduit du lemme VIL2-4
que, quel que soit s, avec Re(s) > 1,
l(m) - ffe jT^ -(8-.);(,-.)f'<=7hï"o>-»-
Comme g(t) est <if°° sur R+, holomorphe au voisinage de 0 (et donc <^7°° sur R+), et à
décroissance rapide à l'infini ainsi que toutes ses dérivées, la prop. VII.2.6 s'applique. On en
déduit que M(p, s) a un prolongement analytique à C tout entier, avec M(#,0) = #(0) = 1.
Le résultat s'en déduit.
Remarque VILS.5. Si s est réel > 1, on a log((s) = -X)Pe^i°g(i - p~s) d'après la
prop. VII.3.3. Or — log(l — p~s) ~ p~s, et l'existence d'un pôle de £ en s = 1 se traduit par
le fait que lims_>i+ J2p€^» p~s = +oo. Il en résulte que la somme des inverses des nombres
premiers diverge (résultat dû à Euler (1737)) ; en particulier, ceci prouve que l'ensemble
des nombres premiers est infini (résultat remontant à l'antiquité), mais en dit un peu plus
sur leur répartition que la preuve des grecs.
VII.3. LA FONCTION ZÊTA DE RIEMANN
411
Exercice VILS.6. Soit EnSB«7ïï le développement de Taylor(8) de g(t) = -^ en 0.
(i) Calculer g{t) - g(-t). En déduire B2jb+i = 0, si k ^ 1.
(ii) Montrer que C(_n) = (_l)nir+iN si n € N. En déduire que C prend des valeurs rationnelles aux
entiers^9) négatifs, et a des zéros en les entiers pairs < 0.
(iii) Montrer que g(z) — z*%i1t + z^1f est holomorphe sur D(0, (47r)~). En déduire des équivalents de
^ï et de C(l - 2n) quand n -> +oo.
3. Équation fonctionnelle de la fonction zêta
Théorème VII. 3.7. (Riemann, 1858) La fonction Ç vérifie l'équation fonctionnelle^
C(*) = 2.(2^rl.r(l-S).siny.C(i_s).
Remarque VII.3.8. (i) Soit Ç(s) = 7r_5r(|)C(s). Modulo les formules (ex. VII.2.2)
r^1 - •> = 5S' r(J)r(i±l) = 2-r(i)r(s), et r(i) = A,
on peut déduire de l'équation fonctionnelle de £ que £ vérifie l'équation fonctionnelle
Ê(«) = fli-«).
(ii) L'équation fonctionnelle de la fonction £ peut s'établir directement (cf. ex. VII.6.6),
mais la démonstration ci-dessous a l'avantage de se généraliser plus facilement aux
fonctions L de Dirichlet. De plus, c'est sous la forme du th. VII.3.7 que nous utiliserons
l'équation fonctionnelle de Ç dans la démonstration du théorème des nombres premiers
(annexe A).
Démonstration. Si c > 0, soit 7C le contour obtenu en composant la demi-droite (+00, c]
suivi du carré Cc de sommets c(±l ± i) parcouru dans le sens direct et de la demi-droite
[c, +00). Soit
<8>Les Bn sont des nombres rationnels, appelés nombres de BernouUi, et qu'on retrouve dans toutes les
branches des mathématiques. On a en particulier
Bo = l, Bi = —, B2 = -, B3=0, B4 = —, ..., Bi2 = —,...
Un test presque infaillible pour savoir si une suite de nombres a un rapport avec les nombres de BernouUi
est de regarder si 691 apparaît dans les premiers termes de cette suite.
(°) Les valeurs aux entiers de la fonction zêta, ou plus généralement des fonctions L de la géométrie
arithmétique, recellent une quantité impressionante d'informations arithmétiques. Kummer fut l'un des
premiers à exploiter cette information, ce qui lui a permis de montrer (1852) que, si p est un nombre
premier ^ 3 ne divisant pets le numérateur de C(-l)> C(-3), ..., Ç(2 - p), alors l'équation ap + bP = cp
n'a pas de solution en nombres entiers avec abc ^ 0 (i.e. le théorème de Fermât est vrai pour un tel p
(dit régulier)). Jusqu'à 100, les seuls nombres premiers irréguliers sont 37, 59 et 67.
<10)Cette équation fonctionnelle avait été conjecturée par Euler (1749) qui se basait sur ses calculs deÇ
en les entiers.
412
CHAPITRE VIL SÉRIES DE DIRICHLET
où fi(z) = -^hi-> et (-z)s = exp(slog(—z)), la détermination du logarithme choisie étant
celle dont la partie imaginaire est comprise entre —n et tt ; en particulier, (—z)s = e~mszs
de +00 à c et (—z)s = eiirszs de c à +00 (après avoir parcouru le carré).
La démonstration consiste à utiliser la formule des résidus pour évaluer Fd(s) — Fc(s),
ce qui fait apparaître la fonction £(1 - s). La fonction £(s) s'obtient en faisant tendre c
vers 0, et un passage à la limite quand c —> +00 donne le lien cherché entre Ç(s) et C(1 — s)-
(-!+»> (l+»)c
x < x
x° Je ► < » <
x y x
(-l-Oc (l-j)c
le chemin yc
• Calcul de Fd(s) — Fc(s). (Un peu plus de familiarité avec les fonctions holomorphes
permettrait de se passer de la cuisine peu ragoûtante qui suit et de démontrer directement
que Fd(s) — Fc(s) est la somme des résidus de la fonction /i(z)^^ (qui est méromorphe
sur C — [0, +00)) en les points à l'intérieur du chemin 7C)d composé de C^, [d,c], Cc
parcouru en sens opposé, et [c,d].)
Les chemins sur lesquels on intègre ne sont pas vraiment contenus dans un ouvert sur lequel la fonction
qu'on intègre est méromorphe ; pour se ramener à ce cas, on va être forcé de tout découper en morceaux.
On note gf (resp. g~) la fonction gf{z) = fiiz)^1^- sur l'ouvert Q+ (resp. Q~) obtenu en enlevant
la demi-droite [0, -ioo) (resp. [0, +ioo)) à C, la détermination de log(-z) étant celle prenant des valeurs
réelles sur la demi-droite [0, -00). Les fonctions gf et g~ sont méromorphes sur Çl+ et fi" respectivement,
et coïncident sur le demi-plan Re(s) < 0 ; par contre, sur le demi-plan Re(s) > 0, on a g~ (z) = e2insg+(z).
On note C+ (resp. C~) le morceau de Cc contenu dans le demi-plan Im(s) ^ 0 (resp. Im(s) < 0). On
a donc C+ = [c,(1 +i)c] ■ [(l+i)c, (-1 +i)c] ■ [(-1 + i)c, -c], et C" = [-c, (-1 -i)c] ■ [(-1 -i)c, (1 -i)c] •
[(1 - ï)c,c]. Soit 7+ (resp. 7") le chemin composé de (+00, c] et C+ (resp. de C~ et [c,+oo)), et soient
Ft(s) = 2^ /7+ 9Î(z) dz et F-(s) = £ /7- gf(z) dz, de telle sorte que Fc(s) = F+(«) + F"(s).
Si c < d, soient 7+d le lacet Cj • [-d, -c] • (C+)°«>»> • [c,rf] et 7+d le lacet C^ • [rf,c] • (C-)°»>»> • [-c, -d],
où (C+)0|>l> et (Cj)0|>l> désignent les chemins C+ et C~ parcourus dans le sens opposé. On a
fjw -F7W -àl^'^-àf^^'^
VII.3. LA FONCTION ZÊTA DE RIEMANN
413
comme on peut le voir sur le dessin ci-dessus. Comme gf(z) = gs (z) sur [-c, -d], l'intégrale sur [-c, —d]
disparaît quand on fait la somme des deux égalités ci-dessus, et on obtient
(-\+Qd
(-!+/)</
té
(!+/)</
-d
-d
X lilin
x(*+l)2m
X k2in
(-1+Ocr î—l(,+/)c
T X2mt
-> i x ' ►■
0 c
+
(-!-/)</
(l+/)rf
(-l-/)c
-c 0 c
X
i X-2/nf
X *2m
(-l+/)c* * *(!+/>•
(1-Oc
(-1-/V
X -*2m
X -«2m
->
*-2ml
(-l-/)c* » *
X-*2/n
(!-/>
(!-')</
(1-Orf
^ X2mf
t OX | > <-
fy ^c Yc,rf \,d
Le membre de droite peut se calculer grâce à la formule des résidus. La fonction gf est
méromorphe sur Q+, avec des pôles simples aux 2iirk, pour k G N — {0}, et comme ez — 1
a une dérivée égale à 1 en 2mk, on a Res(gf,2ink) = {~%*lY = -(2kn)*-le-iir£ïr. De
même, g~ est méromorphe sur Q~, avec des pôles simples aux — 2i7rk, pour k € N—{0}, et
on a Res(gj, -2iitk) = ^î^k = -(2&7r)s-1e"r*t1. Par ailleurs, l'indice de j+d par rapport
à 2iirk est 1, si c < 2k < d, et 0 sinon; l'indice de %d par rapport à —2mk est 1, si
c < 2k < d, et 0 sinon. On obtient donc, en utilisant la formule des résidus,
Fd(s)-Fc(s) = - Y^ 2c0S7r
c<2kw<d
5-1
(2kn)
s-\
414
CHAPITRE VII. SÉRIES DE DIRICHLET
• Une majoration pour \(-z)s\. On a \(-z)s\ = JW'W-*)) = \z\Be(s)e-im(s)&vg(-z)
Comme arg(—z) varie entre —ir et ir sur les domaines considérés, cela montre que, si s est
fixé, il existe une constante c(s) telle que |(—z)s\ ^ c(s)|2:|Re^, pour tout z.
• Lien entre F* et Ç(s). La formule obtenue pour Fd(s) — Fc(s) montre, en particulier,
que Fc ne dépend pas de c dans l'intervalle ]0,27r[, et donc que F7r(s) = limc_>0+ Fc(s). Or
la majoration ci-dessus pour |(—z)s\ implique que, quand c tend vers 0, l'intégrale sur Cc
tend vers 0, si Re(s) > 1. On obtient donc, en passant à la limite si Re(s) > 1,
• Lien entre F^ et Ç(l - s). On a |^j| ^ 1_e_(2N+1)T < \ sur le carré C(2N+i)îr (sur un
bord vertical, on minore \ez —1| par \\ez\ —1|, et on remarque que ez est réel négatif sur les
deux bords horizontaux). On en déduit, en utilisant la majoration |(—z)s\ ^ c(s)|2|Re^s\
que, si Re(s) < 0, alors F(2n+i)7t(s) —> 0 quand N —> +co. En utilisant la formule ci-dessus
pour Fd(s) — Fc(s), avec d = (2N + l)7r et c = 7r, et en passant à la limite quand N —> +co,
on obtient
Fw(s) = 2 • cos(7r^-^) • (27T)5-1 • C(l - 5) si Re(s) < 0.
. Holomorphie de F,. On a F„(a) = éilcji^ T + (**" " ^XT^T )• Sur
un demi-plan Re(s) > a, on a \ts\ < £°, si t € [ïï, +oo[, et comme |^y est sommable sur
[7T, +co[, on déduit du th. V.5.7 que /J~°° ^tiïj est holomorphe en s, sur tout demi-plan de
la forme Re(s) > o, et donc aussi sur C tout entier. Pour prouver que Fw est holomorphe
sur C, il suffit donc de vérifier que fc ^£ y l'est, ce qui résulte du cor. V.5.8.
• Conclusion. Comme F,,., T, sin, cos et £ sont méromorphes sur C tout entier, on en
déduit, en utilisant le th. des zéros isolés, que
5—1
sin7rs • T(s) • Ç(s) = 7r Fn(s) = COS7T-—— • (2n)s • C(l - s),
Z*
pour tout s qui n'est pas un pôle d'une des fonctions ci-dessus. En utilisant la formule
sin7rs = — sin7r(s—1) = —2 sin 7r^-cos 71-^, on peut réécrire cette équation fonctionnelle
sous la forme
C(l - s) = -2(2*-)-* • sin*-^ • T(S) ■ <(*),
et on obtient l'équation fonctionnelle du théorème en appliquant l'équation fonctionnelle
ci-dessus à 1 — s au lieu de s.
Exercice VII.3.9. On note 7 la constante d'Euler comme dans le th. VII.2.1.
(i) Montrer que r'(l) = -7.
(ii) Montrer que C(s) - ^ = £ÎÏÏ /nn+1 (£ - £) dt, si Re(s) > 1. En déduire linw C(s) - ^ = 7,
puis £$ = log27r et C'(0) = -i log27r.
VII.4. FONCTIONS L DE DIRICHLET
415
4. Les zéros de la fonction £
Le théorème VI 1.3.7 permet une bonne localisation des zéros de la fonction £ dans le
plan complexe.
Corollaire VII. 3.10. Les seuls zéros de la fonction Ç qui ne sont pas dans la bande
verticale 0 < Re(s) < 1 sont des zéros simples aux entiers pairs < 0.
Démonstration. Ç(s) est donnée (prop. VII.3.3) par le produit absolument convergent
Y[p€#> 1_p_M sur le demi-plan Re(s) > 1. Comme aucun des termes du produit ne s'annule
sur ce demi-plan, la fonction £ ne s'annule pas sur le demi-plan Re(s) > 1. D'autre part,
si Re(s) < 0, on a T(l - s) ^ 0, et, d'après ce qui précède, £(1 — s) ^ 0. L'équation
fonctionnelle du th. VII.3.7 montre donc que les zéros de Ç sur le demi-plan Re(s) < 0
sont les mêmes que ceux de sin ^. Ceci permet de conclure.
On appelle zéros triviaux les zéros aux entiers pairs < 0. La bande critique est la
bande verticale 0 < Re(s) < 1; c'est un monde mystérieux, où il est difficile de voir
clair. Riemann, à qui on doit la démonstration ci-dessus de l'équation fonctionnelle de la
fonction £ a, le premier (en 1858), dans un mémoire qui est un des grands classiques des
mathématiques, montré comment la répartition des zéros dans cette bande critique est
reliée à la répartition des nombres premiers (cf. annexe A). Ce mémoire contient aussi
l'hypothèse de Riemann, toujours non résolue à ce jour, et dont la tête est mise à prix
pour un million de dollar, selon laquelle tous les zéros de £ dans la bande critique sont
sur la droite Re(s) = |.
VII.4. Fonctions L de Dirichlet
1. Caractères de Dirichlet et Fonctions L de Dirichlet
Si D est un entier, un caractère de Dirichlet modulo D est un morphisme de groupes
X : (Z/DZ)* —► C*. L'image d'un caractère de Dirichlet est un sous-groupe fini de C*,
et donc est incluse dans le groupe des racines de l'unité. On note 1d le caractère trivial,
défini par 1d(û) = 1, quel que soit a € (Z/DZ)*.
Si x est un caractère de Dirichlet modulo D, on considère aussi souvent x comme une
fonction périodique sur Z de période D, en composant x avec la projection naturelle
de Z sur Z/DZ, et en étendant x par 0 sur les entiers non premiers à D. La fonction
X ■-»• x(n) est alors strictement multiplicative : en effet, si m et n sont premiers à D, alors
x(mn) = x(m)x(n) Par multiplicativité de la réduction modulo D et celle de x» tandis
que si m ou n n'est pas premier à D, alors mn non plus, et on a x(mn) = 0 = x{m)x{n)-
La fonction L de Dirichlet attachée à x est alors la série de Dirichlet L(x, s) = 2n>i 1^-
Comme |x(™)| = 1> si (n,D) = 1, l'abscisse de convergence absolue de L(x, s) est 1, et on
a la proposition suivante.
416
CHAPITRE VII. SÉRIES DE DIRICHLET
Proposition VII. 4.1. Soit x un caractère de Dirichlet modulo D.
(i) Si Re(s) > 1, alors L(x,s) = Up£&>T_
-x{p)p-* > et ^e Pr°duit e$t uniformément
convergent sur tout demi-plan de la forme Re(s) > c> 1.
(ii) Si x 7^ 1d, l'abscisse de convergence de L(x,s) est 0.
Démonstration. Le (i) suit juste de la théorie générale (cf. prop. VII.3.1). Maintenant,
si x ^ 1d> il existe a € (Z/DZ)*, tel que x(a) ^ 1. On a alors
X(a) ^2 X(x)= J2 X(ax)= J2 X(s),
x€(Z/DZ)* œ€(Z/DZ)* œ€(Z/DZ)*
puisque x i-> arc est une bijection de (Z/DZ)*. On en déduit Z^z/dz)* x(^) = 0» et
donc J2n=kD+i x(n) = 0 (on aurait pu aussi utiliser Porthogonalité des caractères x et 1d
de (Z/DZ)*). Ceci implique que la suite des sommes partielles X)fe=iXX&) est bornée
(par D en valeur absolue), et permet d'utiliser le (i) du th. VII. 1.5 pour démontrer le (ii).
2. Conducteur et sommes de Gauss
Si D' est un diviseur de D et x est un caractère de Dirichlet modulo D', on peut aussi
voir x comme un caractère de Dirichlet modulo D en composant x avec la projection
(Z/DZ)* —► (Z/D'Z)*. On dit que x est primitif, si on ne peut pas trouver de diviseur D'
de D, distinct de D, tel que x provienne d'un caractère modulo D'. On dit que x est de
conducteur D, si c'est un caractère de Dirichlet modulo D qui est primitif. Si x est de
conducteur D et si N est un multiple de D, on note xn le caractère modulo N obtenu en
composant x avec la projection (Z/NZ)* —► (Z/DZ)*.
Lemme VIL4-2 On a L(xn, s) = L(x, s) Up]N(l - x(p)p~s)-
Démonstration. Il suffît d'utiliser la décomposition en produit de facteurs d'Euler.
Comme 1—x(p)p~s est une fonction holomorphe sur C ayant tous ses zéros sur la droite
Re(s) = 0, on voit que l'étude des propriétés analytiques des fonctions L de Dirichlet se
ramène à celle des fonctions L associées aux caractères primitifs.
Si x est un caractère de Dirichlet modulo D, on note x le caractère de Dirichlet modulo D
défini par x(n) — x(n) si n e (Z/DZ)*. Comme x(^) est une racine de l'unité, on a aussi
X(n)=x(n)~l-
Si D est un entier, si x est un caractère de Dirichlet de conducteur D et si n € Z, on
définit la somme de Gauss tordue G(x,n) par la formule
G&.n)= J2 X(a)e2i"^,
a mod D
et on pose G(x) = G(x, 1).
Lemme VII.4.3. Si n e N, alors G(x,n) = x(n)G(x)
VII.4. FONCTIONS L DE DIRICHLET
417
Démonstration. Si (n, D) = 1, alors n est inversible dans (Z/DZ)*, ce qui permet
d'écrire
G(x,n)= Y, X(«,)e2i^ =x(n) £ rfan)**** = x(n)G(X).
a mod D an mod D
Si (n,D) = d > 1, on peut écrire D = dD' et n = dn'. Comme x est de conducteur D, il
existe 6=1 mod D/d tel que x(6) ^ 1 (sinon x serait de conducteur divisant D'). On a
alors
puisque n est divisible par d et 6 — 1 par D/d. On en déduit que
x(b)G(X,n)= J2 X(a6)e2i'*= £ x(o)e*"* = Gfc.n),
a mod D a mod D
et donc, comme x(&) 7^ 1> que G(x,n) = 0 = x(n)G(x). Ceci permet de conclure.
Théorème VII.4>4- Si x ^t un caractère de Dirichlet de conducteur D^l, alors
L(x, 5) admet un prolongement analytique à C tout entier. De plus, L(x, 5) = M(/x, s),
où fx : R+ —> C est donnée par la formule
ta) 1 v *(6)
G(x)tTe-^'-i'
Démonstration. Il résulte du lemme VII.2.4, que L(x, s) = M(/, s), où / est définie
par f(t) = En~i X(n)e-nt. Si on utilise l'identité*11) x(n) = ^g1 du lemme VII.4.3, on
obtient
+00 .. - D—1 /,\
(La dernière égalité venant de ce que x(n) = 0 si n est un multiple de D, ce qui fait que 0
mod D ne contribue pas à la somme). Maintenant, fx est à décroissance rapide à l'infini
ainsi que toutes ses dérivées, et e2i7r%" ^ 1, si 1 ^ 6 ^ D — 1, ce qui fait que fx est fé*00
sur R+. On conclut en utilisant la prop. VII.2.6.
3. Le théorème de la progression arithmétique
Proposition VII.4-5. F(s) = IlX€Dir(D) L(x>s) est une 5er*e de Dirichlet à
coefficients dans N.
Démonstration. D'après le (i) de la prop. VII.4.1, si x G Dir(D) et si Re(s) > 1, alors
L(x, s) est le produit (convergent) des (1 — x(p)p~s)~1 pour V premier ne divisant pas D.
*n)()n a quand même besoin de vérifier que G(x) ^ 0 (cf. ex. VII.4.10).
418
CHAPITRE VII. SÉRIES DE DIRICHLET
On obtient donc
Fw=ri( n (i-xwp-t1)-
p\D xeDir(D)
Maintenant, l'application p h-> x(p) est un morphisme du groupe Dir(D) dans C* ; son
image est un sous-groupe fini de C*, et donc de la forme /i^p), et son noyau est un sous-
groupe Hp de Dir(D) dont on note h(p) le cardinal. Si 77 G /Ltd(p), il existe h(p) éléments \
de Dir(D) tels que x{p) = V (si Xo en est un, l'application x' *-> XoX' induit une bijection
de Hp sur l'ensemble de ces x)- H en résulte que
n a - x(p)P-s)=( n a-™-))*".
X€Dir(D) V^,t(P)
et comme 11^(1 - *?X) = 1 - Xd(^\ on obtient
FW = n(r^)ftW-
Le résultat suit de ce que t_ irf(p)<t = 1+ p~d^s + p-2d(p)s h est une série de Dirichlet
à coefficients dans N, et un produit de séries de Dirichlet à coefficients dans N est une
série de Dirichlet à coefficients dans N.
Théorème VII.4-6. (i) L(1d,s) a un pôle simple en s = 1, de résidu ^^.
(ii) Si x € Dir(D) - {1D}, alors L(X, 1) î 0.
Démonstration. Compte-tenu de ce que C a un pôle simple en s = 1, de résidu 1
(th. VII.3.4), le (i) résulte des formules L(lD,s) = CMEU^1 ~P~$) (cf- lemme VII.4.2)
et Up\d(1 ~ p") = ^ (ex- 2-9 du Vocabulaire).
Maintenant, s'il existe x € Dir(D) — {1d}> avec L(x, 1) = 0, le zéro de L(x, 5) compense
le pôle simple de L(1d,s) ; il s'ensuit que F(s) = nX€Dir(D) L(x>5) est holomorphe sur C
tout entier. Comme F(s) est, d'après la prop. VII.4.5, une série de Dirichlet J2n>i an^~8
à coefficients dans N (et donc positifs), il résulte du th. de Landau (th. VII.1.1) que la
série ^n>1 ann~s converge pour tout s G C et donc, en particulier, pour s = 0. Comme
les an appartiennent à N, cela implique que seul un nombre fini d'entre eux sont non nuls,
ce qui est clairement absurde (par exemple parce que le coefficient de p~d^s est h(p) et
qu'il y a une infinité de nombres premiers).
On en déduit le (ii), ce qui termine la démonstration.
Théorème VII.4-7. (Dirichlet, 1837) Si (o,D) = 1, il y a une infinité de nombres
premiers de la forme a + riD, avec n G N.
Démonstration. Soit </>a : (Z/DZ)* —> C la fonction valant 1 en a et 0 ailleurs. Il
s'agit de prouver que {p, <j)a{p) = 1} est infini et, pour ce faire, nous allons prouver
que lims_1+F0(s) = +00, où F0(s) = J2 <l)a(p)p~$ ; ceci montrera non seulement que
l'ensemble des p de la forme a + nD est infini, mais aussi que ces nombres premiers sont
VII.4. FONCTIONS L DE DIRICHLET
419
assez denses dans les entiers puisque la somme de leurs inverses diverge [cette stratégie
est inspirée de la démonstration d'Euler de l'existence d'une infinité de nombres premiers
(rem. VII.3.5)).
Il résulte de la prop. 1.2.26 que, si p\ D, alors <f>a(p) = ^ Ex€Dir(D) x(a)x(p)> et donc
Fû^ = M) ^ X{a)^2x(v)v~sï si s est réel > 1.
Maintenant, |x(p)p_s| < |, si p € ^ et s > 1, et comme
M2 M3 1 M2 1
|z + iog(i-z)Kl|- + ^- + ...<iIi^<|z|2, si|*|<i
il en résulte que
| £ (xWp~S + 1°ê(1 " X(P)P~S)) | < L?"2* < C(2), si s > 1.
La fonction — Epplog(l — x(p)p~s) est continue sur ]l,+oo] comme restriction d'une
fonction holomorphe, et son exponentielle est L(x,s) d'après le (i) de la prop. VII.4.1;
il est donc justifié de la noter logL(x, s). Il résulte alors de la majoration ci-dessus que
F°(s) ~ ^) ^oc€Dir(D) x{°) logL(x, s) reste bornée quand s -> 1+. Or le (ii) du th. VII.4.6
et la continuité de log L(x, s) pour s > 1 impliquent que la somme J2x^iD x(a) log L(x> s)
admet une limite finie en 1+, tandis que logL(lD,s) tend vers +oo en 1+ d'après le (i)
du th. VII.4.6, et donc Fa(s) —> +oo en 1+, puisque 1d(û) = 1, ce que l'on cherchait à
démontrer. (En utilisant toute la force du (i) du th. VII.4.6, on montre plus précisément
que linw+ ^^ = ^.)
4. Équation fonctionnelle des fonctions L de Dirichlet
Théorème VII.4>8. Si x est un caractère de Dirichlet de conducteur D ^ 1, alors
L(x, s) vérifie l'équation fonctionnelle
Uys) = i2' °(X) ' D"S '(27r)S_1 * r(1 - 5) • sin T • L(X> 1 - *) si X(-1) = 1,
\-2i- G(x) • D-$ • (2tt)s-1 • r(l - s) • cos f • L(x, 1 - s) si x(-l) = -1.
Démonstration. La démonstration est très semblable à celle de l'équation fonctionnelle
de la fonction £, et nous reprenons les notations de cette dernière en indiquant les points
où l'argument diffère. Soit Fc(x, s) = 2^ L,fx(z)(~zY^f^ ou fx est la fonction définie
dans le th. VII.4.4. Comme fx(z) est à décroissance rapide à l'infini, la fonction Fc(x,s)
est holomorphe sur C pour tout c qui n'est pas de la forme ^ + 2irk, avec k £ N et
6 ^ D premier à D (pour éviter les pôles de fx). Comme fx n'a pas de pôle à l'intérieur
du carré de sommets ^(±1 ± i), on a Fc(x,s) = F7r/D(x,5), quel que soit c e]0, ^[. En
420
CHAPITRE VII. SÉRIES DE DIRICHLET
faisant tendre c vers 0, on en déduit, si Re(s) > 1, la formule
FV0(x.S) = i(^7^^f + e-/+"/^f) = ^-rW.L(X,S).
Maintenant, quand N tend vers +oo, la fonction Fntt(x> s) tend vers 0 quand Re(s) < 0.
La différence entre F7r/D(s) et Fntt(s) peut se calculer grâce au théorème des résidus. La
fonction fx(z)^~ a des pôles en les z = ±^=p, avec 1 ^ fc < ND — 1 dans le contour
délimité par la différence entre 7^ et 7^/D. Si 1 < k ^ ND - 1, on a
iWf (*\L*L 2j/ïïk\ - *(*) (-2«rfe/D)« _ x(k) ,2nkv-i in^
Kes{jx{z) z ,_j_G(_) (2ink/D) - ô(=)-^-; e
n^ff (,\^L ~2ink\ - x(-fe) (2i7rk/Dy _ x(-fe) /M.-i>¥
*>es{Jx{z) z , D j - G(_} (_2i7rjfe/D) - G(-} ' { D ) e
On obtient donc
Fh,(x.«) - P,/dOc,«) = ^jE (^"'(xWe^ +x(-fc)e'^).
En faisant tendre N vers +00, on en déduit, si Re(s) < 0, les formules
F , fy S) = J_I&Y~1 ■ (2008^) .L0?,1 -.) si X(-l) = 1,
»Mx,; G(^jfêri.(_2isinff¥).Lfcl_s) six(_1) = _1.
On en tire l'équation fonctionnelle
sin.s • rW • L(x,s) - ^ (<** ' D1"V C°S^ \L& l ' S) ^ X{~1) = ^
W ' G(x) \-i(2iry • D1"* • sinTr^i • L(x, 1 - s) si *(-l) = -1,
qui peut aussi se mettre sous la forme
L, )= f2G(x) • (2ir)- • D'"1 • sinTr^l • r(.) • L(x,s) si x(-l) = 1,
\-2iG(x)-(27r)->-D'-1-cos7r^i-rW-L(X,s) si *(-l) =-1.
L'équation fonctionnelle du théorème s'obtient en appliquant l'équation fonctionnelle ci-
dessus à x au lieu de x et 1 — s au lieu de s.
Remarque VIL4-9. (i) Si x est un caractère de Dirichlet de conducteur D ^ 1, posons
•w-fl six!T\
(x,)"lr(^)-(E)(8+1»/2.L(x,s) six(-D = -i.
Un petit calcul permet de déduire de l'équation fonctionnelle de L(x, s) que A(x, s) vérifie
VII.4. FONCTIONS L DE DIRICHLET
421
l'équation fonctionnelle
A(x,s)=w(x)A(x,l-s).
(ii) La fonction L(x, s) est holomorphe sur C tou.t entier et ne s'annule pas sur le
demi-plan Re(s) > 1 sur lequel elle est donnée (prop. VII.4.1) par un produit absolument
convergent dont aucun des termes ne s'annule. Elle ne s'annule pas non plus sur la droite
Re(s) = 1 (cf. ex. A.4.4), ce qui est nettement plus profond. L'équation fonctionnelle
du th. VII.4.8 montre donc que, en dehors de la bande 0 < Re(s) < 1, les seuls zéros de
L(x>s) sont des z^ros (dit triviaux) aux entiers négatifs pairs (resp. impairs), si x(—1) = 1
(resp. x(—1) — ~~ !)• O*1 conjecture (hypothèse de Riemann généralisée, GRH en
abréviation anglaise) que tous les zéros de L(x, s) dans la bande 0 < Re(s) < 1 se trouvent sur
la droite Re(s) = |. Ceci aurait des implications profondes sur la répartition des nombres
premiers entre les différentes progressions arithmétiques (12^.
Exercice VII.4.10. Soit x un caractère de conducteur D ^ 1. Montrer que :
GÔÔ = x(-l)G(x), G(x)G(x) = x(-l)D et \w(X)\ = 1.
Exercice VII.4*H* On s'intéresse au nombre r(n) de manière d'écrire un entier n comme une somme
de deux carrés : r(n) = \{(x,y) G Z2, x2+y2 = n}\. Soit A = Z[z], et si a = x+iy, soit(13) N(a) = x2+y2.
D'après l'ex. 4.4, on dispose des résultats suivants :
• N(ab) = N(a)N(6), pour tous a, 6, G A ;
• tout élément a de A-{0} admet une unique factorisation a = ^(l+z)*2 Y\ Q^ilQp%2 Ei Pkp »
p=l mod4 ' ' p=3 niod4
où u G {1, —l,i, —i}, les kp et les kPti sont des entiers ^ 0, et N(^Pïi) = N(^Pï2) = p.
(i) Montrer que
E^= E Wây=4T^ II TTi^jj II îrps <*R«(«)>i.
n^l o€A-{0} V ; p=lmocl4V y } p=3 mod4 F
{0, si vp(n) est impair pour au moins un p de la forme 4n + 3,
4 n (vp(n) + l)i si vp(n) est Pair pour tout p de la forme 4n + 3.
p=l mo(14
(ii) Soit x '• (Z/4Z)* -> {±1} le caractère de Dirichlet défini par x(l) = 1 et x(-l) = -1. Montrer
que En^i ^ = 4C(*)L(x, «) 5 ^ déduire que r(n) = 4 £d,n x(rf).
(12^En particulier, sur la taille du plus petit nombre premier dans une progression arithmétique, ce qui
intervient naturellement dans beaucoup de questions ; par exemple en cryptographie.
(13)On a N(a) = |A/a| (voir plus loin), ce qui fait que la fonction J2aeA-{o) Nffi est> à un facteur
4 = |A*| près, la fonction Ca(s) apparaissant dans l'introduction de l'annexe G. Si on identifie C à R2
via z = x + iy »-> (x,y), alors A et aA deviennent des réseaux : A devient le réseau Z2 dont le volume
est 1 et, si a = x + iy, alors aA est le réseau de base a = (x,y) et ia = (-y,x) dont le volume est le
déterminant de a et ia, c'est-à-dire, x2+y2 = N(a). Par ailleurs, (C/aA)/(A/aA) = C/A. Autrement dit,
si D est un domaine fondamental de C modulo A et si S est un système de représentants de A/aA, alors
les s + D, pour s G S, sont disjoints deux à deux et leur réunion est un domaine fondamental de C/aA.
Comme Vol(À) est le volume d'un domaine fondamental modulo À, pour tout réseau À, on en déduit que
|Vol(aA)| = |A/aA| • Vol(A), et donc N(a) = |A/aA|.
422
CHAPITRE VII. SÉRIES DE DIRICHLET
VII.5. Autres exemples
1. La fonction de Moebius
Soit \i la fonction de Moebius. Elle est définie par /j,(ri) = 0 si n est divisible par le carré d'au moins
un nombre premier, et /j,(ri) = (-l)r, si n = p\ • • pr, où les pi sont des nombres premiers distincts. C'est
une fonction multiplicative, et on a
coo-1=n c1 -p~s)=e ^n)n~s=l(^5)-
pe&> nGN
On en déduit que L(ju, s) a un prolongement méromorphe à tout le plan complexe. Il est facile de voir
que son abscisse de convergence absolue orabs est 1, mais son abscisse de convergence aC0lw est inconnue.
On conjecture que orCOiiv = |> mais c'est équivalent à l'hypothèse de Riemann (cf. n° 2 du § A.5).
Exercice VII. 5.1. (Formule d'inversion de Moebius)
(i) Montrer que J2d\n M^O = 0, si n ^ 2.
(ii) Soit F : [0,+oo[-> C, vérifiant F(x) = 0, si x < 1, et soit G : [0,+oo[-> C définie par G(x) =
ES F(*). Montrer que G(x) = 0, si x < 1, et que F(x) = £+~ ji(")G(*).
(iii) Montrer que £+~ ii(n)[%] = 1, si x ^ 1.
Exercice VII. 5.2. (Critère de Bâez-Duarte)
Soit E l'espace de Hilbert, séparé de l'espace JSf2([l, +oo[, $) des (j> : [1, +oo[—> C telles que t h-> t~l<f)(t)
soit de carré sommable, muni du produit scalaire (/, g) = f*°° f(t)g(t) $.
(i) Vérifier que t ■-» tl~~s appartient à E, si Re(s) > |, et qu'il en est de même de </>n, définie par
(j>n{t) = [ji\ - „ > si n est un entier ^ 2.
(ii) Montrer que /1+0°{*}rs-1 dt = ^ - ^, si Re(s) > 1.
(iii) Montrer que 5 ■-» J*00^}*""5""1^ est holomorphe sur le demi-plan Re(s) > 0. En déduire que
fo°°{t}t-s-1 dt = -^, si 0 < Re(s) < 1.
(iv) Montrer que (tl-*,4>n) = (^ - £)^> si n ^ 2, et si Re(s) > \.
(v) En déduire que si l'adhérence dans E du sous-espace engendré par les </>n, pour n > 2, contient les
fonctions constantes sur [1, +oo[, alors l'hypothèse de Riemann est vraie*14).
2. La fonction r de Ramanujan
La fonction r de Ramanujan. Elle est définie par l'identité
«n(i-«n)a4=ET(n)«B-
n=l n=l
S. Ramanujan a fait deux conjectures à son sujet. La première, démontrée peu après par L. Mordell (1917),
(14>On peut montrer, mais c'est plus difficile, que si l'hypothèse de Riemann est vraie, alors l'adhérence
dans E du sous-espace engendré par les </>n, pour n > 2, contient les fonctions constantes sur [l,+oo[.
Il s'agit d'une variante, due à Bâez-Duarte (2003), du critère de Nyman-Beurling (1955). Il est à noter
que la question (iii) de l'ex. VII.5.1 et la formule YX^i ilP = C(l)""1 = 0> permettent de montrer que
]Cn^i *ir^n(0 = -1) si t ^ 1, mais la série ne converge probablement pas dans E. La convergence de la
série J2n™i i£n^ est P^us délicate qu'il n'y paraît ; elle est plus ou moins équivalente à la non annulation
de la fonction Ç sur la droite Re(s) = 1.
VII.6. FORMES MODULAIRES
423
peut s'énoncer sous la forme
L(T'S) = II l-r(p)ps+pn-2s-
En particulier, r est une fonction multiplicative! Sa démonstration repose sur le fait que, siq = e2ilTZ,
alors z •-» A(z) = gïlîS(l ~ <7n)24 est une forme modulaire de poids 12 pour SL2(Z) (cf. ex. VII.6.3
et VII.6.11).
La seconde conjecture de Ramanujan affirme que les pôles du facteur d'Euler enp de la fonction L(r, s)
sont tous sur la droite Re(s) = -y. Elle peut aussi s'énoncer sous la forme \r(p)\ < 2pn/2, si p G &.
Il a fallu attendre 1973 pour que P. Deligne démontre la conjecture de Ramanujan (généralisée sous le
nom de conjecture de Ramanujan-Petersson aux formes modulaires quelconques) comme conséquence de
sa démonstration (qui lui a valu la médaille Fields en 1978) de l'hypothèse de Riemann pour les variétés
sur les corps finis, conjecturée par A. Weil vers la fin des années 1940. La démonstration de Deligne est
l'aboutissement d'un énorme programme mis sur pied par A. Grothendieck entre 1958 et 1964, et qui a
totalement révolutionné la géométrie algébrique.
D'après le résultat de Deligne, r'(p) = 2rffi2 G [-1,1], et la question se pose de savoir comment les
r'{p) se répartissent dans cet intervalle. La réponse est fournie par la conjecture de Sato-Tate, qui date de
1960 et vient d'être démontrée (en 2009), par M. Harris et R. Taylor (avec l'aide de L. Clozel, N. Sheperd-
Bairon, T. Barnet-Lamb, D. Geraghty...). Dans le cas particulier de la fonction r de Ramanujan cette
conjecture affirme que les r'(p) sont équirépartis dans [-1,1] par rapport à la mesure 2^~*2 dt ; autrement
dit, si -1 < a^ 6^ 1,
lim Hkm<^XHI _ 2 /»^^
VII.6. Formes modulaires
Les exercices qui suivent explorent certaines propriétés des formes modulaires, qui possèdent tellement
de symétries qu'elles ne devraient pas exister, mais se retrouvent, un peu inexplicablement, jouer un rôle
dans les questions les plus variées (cf. note 2 du chap. I, ou note 1 de l'annexe C, par exemple). Ils
sont l'occasion d'utiliser les résultats des chapitres précédents en démontrant une série de jolis résultats
comme le théorème des 4 carrés (le problème H. 11 offre une voie différente pour démontrer beaucoup des
résultats qui suivent*15*).
Soit JF = {z, lm(z) > 0} le demi-plan de Poincaré. On rappelle (ex. VI.3.4) que si / : 34? -> C
est holomorphe et périodique de période 1, alors il existe une suite (an(/))nGz de nombres complexes
telle que l'on ait f(z) = ]Cnez an(/)e2™ nz, quel que soit z G J(f. Il est d'usage de poser e2inz = q et
d'appeler q-développement de / la série J2nez an(f) Qn- On définit alors Voo(f) G Z U {±00} comme l'inf.
de l'ensemble des n tels que an(f) ^ 0 (en particulier, v^f) = +00 si et seulement si / = 0).
Si k G Z, une fonction modulaire de poids k est une fonction holomorphe / sur 3tf, et qui vérifie :
• f(z + 1) = f(z), quel que soit zeJT,
• /(*) = 2""*7(-l/2)> Quel que soit z G Jtf,
• Voo(f) > -00.
Si Voo(f) ^ 0, on dit que / est une forme modulaire de poids fe, et si Voo(f) > 0, on dit que / est
parabolique (ou cuspidale).
(15>I1 est conseillé de commencer par les prob. H.8 et H. 11 avant de s'attaquer à la série d'exercices qui
suit : les méthodes sont assez semblables et les problèmes sont corrigés.
424
CHAPITRE VIL SÉRIES DE DIRICHLET
Soit ft l'ouvert {z € Jf, \z\ > 1 et - \ < Re(z) < |}. Si a,b € 34? vérifient |o| = \b\ = 1, et si C+ est
le demi-cercle de centre 0 et rayon 1 contenu dans Jf, on note A(o, 6) l'arc de C+ allant de a à 6. Soit
a = eiw/3. Le bord d£l de fi est alors la réunion des demi-droites verticales [a, a + ioo) et [a2, a2 + ioo),
et de l'arc de cercle A(a2,a). On note D la réunion de fi, de la demi-droite [a, a + ioo) et de l'arc de
cercle A(i,a).
Exercice VIL6.1. (formule £) Soit / une forme modulaire de poids k non nulle. Le but de cet exercice
est de prouver la formule suivante.
z€D-{i,a}
(i) On suppose que / ne s'annule pas sur dQ,. Si T ^ 2, soit 7t le lacet composé des segments [a, a+ïT],
[a + iT,et2 + iT], [a2 + iT,a2], et de l'arc de cercle A(a2, a). On note # la l-forme*16) ^$ dz.
• Montrer que ^ f[a+iT,a*+iT) */ tend vers ~vo°(f) quand T -» +oo.
• Montrer que f[a<a+iT] f + /(a2+iT)a2, f = 0.
• Montrer que fA(a2i) f = - /A(< a) (f + * dz). En déduire que £ /A(a2,a) f = £.
• Montrer que Voo(/) + £zen «*(/) = A-
(ii) Montrer que, si on ne suppose pas que / ne s'annule pas sur dQ, alors
Voo(f) + £>(/) + \ £ Vz(f) + l(va(f)+V«>(f)) = ^.
zen zedn-{a,a*}
(Si / s'annule en z G dCl, modifier le chemin 7t au voisinage de z en le remplaçant par un arc de cercle,
à l'intérieur de Cl, de centre z et de rayon tendant vers 0.)
(iii) Conclure.
La « formule -j^ » a beaucoup de conséquences intéressantes. En voici quelques-unes ; d'autres se
trouvent dans les ex. VII.6.8 et VII.6.10.
Exercice VII.6.2. (Dimension des espaces de formes modulaires*17))
(i) Montrer qu'une forme modulaire de poids 0 est constante.
(ii) Montrer qu'il n'y a pas*18) de forme modulaire de poids 2 ou de poids impair.
(iii) Montrer que l'ensemble M& des formes modulaires de poids k est un espace vectoriel et que
/ »-> (ûn(/))(Kn^ est une aPPlication linéaire injective de Mk dans Cd(A;), avec d(k) = 1 + [^]. En
déduire que M^ est de dimension finie et que dimM^ ^ 1 + [jg].
Exercice VIL 6.3. (fonction L d'une forme modulaire)
Soit Y = {zeC, ïm(z) ^ ±, |Re(^)| < ±}. Soit / = ^*f°i anQn une forme modulaire parabolique de
poids 2fe, et soit F(*) = lm(z)k\f(z)\.
(i) Montrer qu'il existe M > 0 tel que \F(z)\ < M, quel que soit z eY.
(ii) Montrer que F(z + l) = F(z) et F(-l/z) = F(z).
(iii) Montrer que, si |Re(^0)| < | et si 0 < lm(zo) ^ \> alors il existe z\ vérifiant |Re(^i)| < 5,
Im(^i) ^ 2Im(^0)5 et F{z{) = F(z0). En déduire que F(^) < M, quel que soit z vérifiant |Re(^)| < \.
(16)()n remarquera que ^ = ^ + £- si h = fg et que ^ = (^ o <p)y/ si h = f o y>, et on aura à utiliser
l'ex. V.4.5 pour faire les calculs.
(17>Le lecteur trouvera des compléments dans l'ex. VII.6.12.
(18>Ce résultat intervient de manière cruciale dans la démonstration de Wiles du théorème de Fermât.
VII.6. FORMES MODULAIRES
425
(iv) Montrer que an = f*[2/2 f(x + ±)e-*™(nx+i) dx En déduire que \an\ < e2'Mn&,
(v) Soit L(/,s) = J2n™ilfi' Montrer que L(/,s) a une abscisse de convergence finie, possède un
prolongement analytique à C tout entier, que L(/, -n) = 0, si n G N, et que À(/, s) = <£^L(/> s) vérifie
l'équation fonctionnelle A(/, s) = (-1)*A(/, 2k - s). (On s'intéressera à J0+o° f(iy)ys *£.)
L'exercice suivant montre que l'on n'est pas en train de faire la théorie de l'ensemble vide (dont les
éléments ont, comme chacun sait, beaucoup de propriétés mirifiques...).
Exercice VII.6.4- (Séries d'Eisenstein)
(i) Montrer que \mz + n\ ^ inf(y, A)sup(|m|, |n|), si z = x + iy e J4? et m,n e Z.
(ii) Montrer que, si k ^ 3, la série ]C(m,n)ez2-(o,o) (mz\n)k converSe uniformément sur tout compact
de je.
(iii) Si z G 3V, soit Gft(z) = 2(_j£^ E(m,n)€za-(o,o) (m«Wa Montrer que Gk est une fonction
holomorphe sur JP et que
Gk^+2^ = {CZ + d)kGk^ quel que soit (Si)6 SL2(Z)'
(iv) Montrer que, si k est impair, alors G& = 0, et que si k est pair, G& est une forme modulaire de
poids k non nulle.
Exercice VII. 6.5. (^-développement des séries d'Eisenstein)
Le but de cet exercice est de prouver que, si k est un entier pair ^ 3, le ^-développement de G& est
donné par la formule suivante*19) :
G* = T^w^*^*) + ë^*-^n)«^ où**-i(n) = J2 d*"1-
yrlV*> n=l d|n.d>l
Soit k un entier ^ 2.
(i) Montrer que la série J2nez (z+n)k converge uniformément sur tout compact de Jt?. En déduire que
sa somme Ak(z) est une fonction holomorphe sur Jif.
(ii) Montrer que A& est périodique de période 1. Déduire du (i) que x »-> A^(x + iy) est somme de sa
série de Fourier J2nezan(y)e2innx pour tout x G R.
(iii) Calculer an(y) par la formule des résidus.
(iv) En déduire que T^Ak(z) = ^>in»-lc«™.
(v) Montrer que Gk(z) = (Z§^(C(fe) + J2m^i Afc(m*)), et en déduire le résultat.
Exercice VII. 6.6. (La fonction thêta de Jacobi)
(i) Montrer que 9(z) = J2nez e™n z converge normalement sur tout compact de 3%*. En déduire que 9
est holomorphe sur 3%*.
(ii) Montrer, en utilisant le fait que la transformée de Fourier dee""**2 est e"™2 (cf. ex. IV.3.29), que
0(iu) =-^e(i), si ueRl.
(iii) En déduire que l'on a 9{z) = J^O^), si z G J4? (où \fz est la racine carrée de z holomorphe
sur C - R__, et valant 1 en 1).
<19>On remarquera que tous les termes de ce ^-développement sont visiblement, à l'exception du terme
constant, des nombres rationnels. On peut utiliser ceci pour (modulo un certain travail) en déduire qu'il
en est de même du terme constant, ce qui permet de donner une démonstration du résultat d'Euler sur
les valeurs aux entiers pairs de la fonction zêta.
426
CHAPITRE VIL SÉRIES DE DIRICHLET
(iv) On pose £(s) = r|!(22'((s), où Ç est la fonction zêta de Riemann. Montrer que, si Re(s) > 1, alors
ç(s) = y0+ooWy)-1)ys/2%-
(v) En déduire que, si Re(s) > 1, alors
i{s) = 4 + 7^1+ 5 jfw*) - W+y(1"y2) j.
puis que £ admet un prolongement méromorphe à C, holomorphe en dehors de pôles simples en s = 0 et
s = 1, et vérifie l'équation fonctionnelle £(s) = £(1 - s).
(vi) Montrer que £(5) = O(înèiy) dans toute bande verticale de largeur finie.
Exercice VIL 6.7. (La série d'Eisenstein de poids 2)
Soit G2 la fonction holomorphe sur J4?, périodique de période 1, dont le ^-développement est*20)
_i +°°
G»= 24 +£"(»)«", on cr(n)= £ d.
n=l d\n,d>l
Nous allons montrer*21* que G2 est presque modulaire ; plus précisément, G2 vérifie l'équation fonction-
nelle^-2G2(-lA) = G2(^)-^.
On rappelle (ex. VI.3.24) que ^ f°*j™ ^(s)y"s = e"y, si y G R^ et c> 0, l'intégrale étant absolument
convergente.
(i) Montrer que, si L(a, s) = J2n™i ^ a une abscisse de convergence finie, alors Fa(^) = X^n^a a>ne2il*nz
est holomorphe sur C, et si c> sup(0,orabs), alors
rc+ioo r(5)
-L(a,5)î/ sds = FSL(iy), si^/GR^.
(2tt)*
(ii) Soit a(n) = X^/|n,d^i d- Montrer que L(cr, s) = C(*)C(* - 1).
(iii) Soit H(s) = ^C(*K(* - 1). Montrer que H(s) = ^£(s)£(s - 1). En déduire que H(2 - s) =
—H(s), que H(s) tend vers 0 à l'infini dans toute bande verticale de largueur finie, et que H est holomorphe
sur C en dehors de pôles simples en 0, 1 et 2 de résidus respectifs ^, ^ et ^j, (On pourra utiliser les
formules C(0) = ^, C(-l) = ï£ et C(2) = £■)
(iv) Montrer que, si 2/ > 0, alors G2(ty) + y~2G2(i/y) = à ~ 5F£ + 2^- (0n intégrera H($)îTa sur
le rectangle de sommets 3 - zT, 3 + zT, -1 + zT et -1 - tT.)
(v) Conclure.
Exercice VII.6.8. Cet exercice est un préliminaire pour le théorème des 4 carrés. Son but est de
démontrer que si (an)n^2 est une suite de nombres complexes vérifiant :
• il existe c G N tel que an = 0(nc),
• F(*) = YX=2ane™nz vérifie l'équation fonctionnelle z"A¥{-l/z) = F(s), sizeJf,
alors an = 0 pour tout n ^ 2.
(i) Montrer que F(z) = 0(e'2wlm^) dans Y = {z G C, |Re(z)| < 1, lm(z) > 1}.
(20>Si on reprend l'exercice VII.6.5, et qu'on utilise la formule Ç(2) = ^, on voit que G2(^) est la somme
^es l-2m)tfmz+n)* en sommant d'abord sur n puis sur m.
<21>La méthode de l'exercice consiste à déduire une équation fonctionnelle reliant <p(—l/z) et <p(z)> à
partir d'une équation fonctionnelle reliant À(2 - s) et À(s), où À(s) = /0+o° ip(iy)ys^-. Cette méthode a
beaucoup d'autres applications. On peut par exemple montrer que la fonction dont le ^-développement
est celui de G& est une forme modulaire, sans passer par la construction de G& et le calcul de son
^-développement. Une autre méthode est proposée dans le prob. H.ll.
VII.6. FORMES MODULAIRES
427
(ii) Montrer que F(l - l/z) = 0(lm(*)c+1) dans Y.
(iii) Soit k un entier pair. Si / : Jtf —► C est une fonction, et si 7= (°$) € SL2(R), on définit
/|fc7 : JF -» C par la formule f\kl(z) = (cz + <0""*/(ffU)' Vérifier que ceci est bien défini et que
(/|fc7i)|fc72 = /|fc7i72, pour tous 71,72 € SL2(R).
(iv) Soient I = (lQ?), S = (° ~0l) et T = ( * }). Vérifier que S2 = (TS)3 = -I; en déduire que pour
toute fonction / : J? -» C, on a /US2 = /|fc(TS)3 = /.
(v) Montrer que F|4TS = F|4TST. (On pourra s'intéresser à F|4T2STSTS2 et calculer F|4S et FJ4T2.)
(vi) En déduire<22> que F|4(TS)2 = F,4T et que, si G = F • F|4TS • F,4(TS)2, alors GUaS = G,12T = G
et G = 0(Im(y)c+1-4e-4,rIn,<î'>) dans Y.
(vii) En déduire que G est une forme modulaire de poids 12, que Voo(G) ^ 2, et conclure.
Exercice VII.6.9. (Sommes de 4 carrés)
Le but de cet exercice est de démontrer la formule suivante (C. Jacobi, 1829), dont on déduit une
forme effective du théorème de Lagrange (1770) : tout nombre entier positif est sommé?*) d'au plus 4
carrés de nombres entiers,
|{(a,6,c,rf)€Z4, a2 + b2 + c2 + d2 = n}\=8 ]T d.
d\n, 4fd
On note r(n) la quantité |{(o,6,c,d) € Z4, a2 + b2 + c2 + d2 = n}\ ; autrement dit r(n) est le nombre de
décompositions de n en somme de quatre carrés. On note 6 = ]Cn€Z einn z *a fonction thêta de Jacobi
de l'ex. VII.6.6.
(i) Montrer que £;Sr(n)ei,rn* = 6(z)*.
(ii) Soit F(z) = $(z)4 - 8(G2(f ) - 4G2(2*)). Montrer que F|2S = -F et FJ2T2 = F. (On utilisera
l'ex. VII.6.7.)
(iii) Montrer que r(n) < (1 + 2y/n)A et cr(n) < "Sn+H. En déduire que, si F(*) = £j~ anei1fnz, alors
an = 0(n2).
(iv) En déduire, en utilisant l'ex. VII.6.8, que 04(z) = 8(G2(f ) - 4G2(2z)), et conclure.
On a en particulier (car £(4) = |^ et Ç(6) = 3^7, cf. ex. V.5.3)
G*=2ÏÔ + 5>(n)«» et G«=5Ôi + E^>(n)gn.
On définit alors la forme discrimant A et Vinvariant modulaire^24) j par
A = ï4((240G4)3-(504Go)2) et i-®^-
(22>Ces calculs cachent les résultats suivants. Le sous-groupe de SL2(R) engendré par S et T est SL2(Z),
et celui engendré par S et T2 est le sous-groupe T de SL2(Z) des matrices dont l'image dans SL2(Z/2Z)
est I ou S. Comme |SL2(Z/2Z)| = 6, l'indice de T dans SL2(Z) est 3, et I, TS, (TS)2 forment un système
de représentants de T\SL2(Z).
(23>Ce résultat a été énoncé par Bachet de Méziriac en 1624 et généralisé par Fermât en 1638, sous la
forme : tout nombre entier est somme de 3 nombres triangulaires, 4 carrés, 5 nombres pentagonaux, 6
nombres hexagonaux etc. (un nombre fe-gonal est de la forme n((fc-2)^-(fc~4))? avec n ^ 1), mais on n'a
aucune trace de démonstration. L'énoncé général a été démontré par Cauchy en 1815.
(24)le ^-développement j = q~l + 744 + 196884c + 21493760g2 + • • • recèle des trésors (cf. chap. I, note 2).
428
CHAPITRE VIL SÉRIES DE DIRICHLET
Exercice VIL 6.10. (La forme modulaire A et l'invariant modulaire j)
(i) Montrer que A est une forme parabolique non nulle de poids 12 et, en utilisant la « formule -fa »,
que A ne s'annule pas sur D ou sur Q.
(ii) Montrer que j induit une bijection de D sur C.
(iii) Montrer que le seul zéro de G4 dans D est a et le seul zéro de Gf, dans D est i.
(iv) Montrer que, si A(z) = 0, alors A(z + n) = 0 quel que soit n € Z et A(—1/z) = 0. En déduire que
si A(z0) = 0, et si |Re(2o)| ^ \ et \z0\ < 1, alors il existe z\ € 3tf% vérifiant A(zi) = 0, Im(2i) > Im(z0)
et |Re(^)| < \.
(v) Montrer que A ne s'annule pas sur «#", et que,;' est une fonction modulaire de poids 0.
Exercice VII.6.11. (La formule de Jacobi pour A)
Soit F(q) = grin^Kl - Qn)24- Notre but est de prouver que A (z) = F(e2inz). On utilisera pleinement
le résultat de l'ex. VII.6.7.
(i) Soit f(z) = \og(F(e2i"z)). Montrer que ^f'(z) = -24G2(*)-
(ii) Soit g(z) = /(-1/z) - 121og*. Montrer que g'{z) = f'(z).
(iii) En déduire que, si on pose H(z) = F(e2iirz), alors -—^(z) ^ est constante sur J(f, puis que H
est une forme modulaire de poids 12.
(iv) Conclure.
Exercice VII.6.12. (complément de l'ex. VII.6.2)
(i) Montrer que dimM& = 1, si k € {0,4,6,8,10} (utiliser l'ex. VII.6.5 et la formule -fe).
(ii) Montrer que A-1/ € Mfc_i2, si / = ]Cn€N an<ln € M& et a0 = 0.
(iii) En déduire que dimM& = 1 + [-^], si A; = 0,4,6,8,10 mod 12 et dimM& = [y|], si A; = 2 mod 12.
ANNEXE A
LE THÉORÈME DES NOMBRES PREMIERS
A.l. Introduction
Ce chapitre est consacré à la démonstration du théorème des nombres premiers et du
théorème de la progression arithmétique. On sait depuis les grecs qu'il existe une infinité
de nombres premiers^1). Leur répartition n'a cessé depuis de fasciner les mathématiciens.
Voici, par exemple, ce qu'écrivait Euler en 1747 : « Les mathématiciens ont tâché jusqu'ici
en vain à découvrir un ordre quelconque dans la progression des nombres premiers, et on
a lieu de croire, que c'est un mystère auquel l'esprit humain ne saurait jamais pénétrer.
Pour s'en convaincre, on n'a qu'à jeter les yeux sur les tables des nombres premiers,
que quelques personnes se sont donné la peine de continuer au-delà de cent-mille : et on
s'apercevra d'abord qu'il n'y règne aucun ordre ni règle. Cette circonstance est d'autant
plus surprenante, que l'arithmétique nous fournit des règles sûres, par le moyen desquelles
on est en état de continuer la progression de ces nombres aussi loin que l'on souhaite,
sans pourtant nous y laisser apercevoir la moindre marque d'un ordre quelconque. ».
Le même Euler a, entre autres :
• démontré que ]C£=i \ diverge comme logn, (et même que — logn + ^JÎ=11 tend vers
une limite 7 appelée depuis « constante d'Euler »),
• factorisé £n6N £ sous la forme UperA1 + £ + £•'•)>
• remarqué que le logarithme du produit était J2 « à une somme convergente près.
Ceci lui a fourni, en 1737, une nouvelle démonstration de l'existence d'une infinité de
nombres premiers (puisque la somme de leurs inverses diverge). De plus, en partant de la
formule £ \ ~ l°gEn n)> ^ en avait déduit que y^p^-T - ™ logloga;. Maintenant, si Aa; est
petit devant x, les nombres premiers entre x et x+Ax sont tous de taille x. Si on note tt(x)
le nombre de nombres premiers < rc, on a donc loglog(rc + Ax) - loglogz ~ n(x+Ax)-nix) m
Comme la dérivée de loglogz est ^j^, on en « déduit » que la densité des nombres
(DU
n'est toutefois pas si facile d'en produire explicitement ; le plus grand nombre premier connu à ce
jour est le nombre premier de Mersenne 243112609 - 1, découvert en août 2008; il a plus de 107 chiffres
en écriture décimale.
430
ANNEXE A. LE THÉORÈME DES NOMBRES PREMIERS
premiers autour de x est de l'ordre de ^, et donc que(2) tt(x) ~ L\(x) = /2X A. Il a
fallu attendre plus d'un siècle pour que ce résultat soit rigoureusement (3) démontré, ce
qui fut fait en 1896 par J. Hadamard et de la Vallée Poussin indépendamment.
Théorème A. 1.1. (des nombres premiers) ir(x) ~ j^.
Les démonstrations de J. Hadamard et C. de la Vallée Poussin reposent sur la stratégie
suggérée par B. Riemann, utilisant le lien entre les zéros de la fonction £ et la
répartition des nombres premiers. L'ingrédient fondamental est la non existence de zéros de la
fonction £ sur la droite Re(s) = 1, où la convergence du produit eulérien cesse, ce qui
ne permet pas de conclure quoi que ce soit de la non annulation de chacun de ses
facteurs. De fait, le théorème des nombres premiers est équivalent (cf. ex. A.4.6) à la non
annulation de Ç sur la droite Re(s) = 1. Cette équivalence a longtemps fait penser qu'une
démonstration « élémentaire » (i.e. n'utilisant pas la variable complexe) du théorème des
nombres premiers était impossible mais, en 1948, P. Erdôs et A. Selberg ont obtenu une
telle démonstration, ce qui a valu à A. Selberg la médaille Fields en 1950.
Si P est un polynôme, et s'il n'y a aucune obstruction arithmétique à ce que les valeurs
de P aux entiers puissent être des nombres premiers^, on peut partir du principe que
P(n) a autant de chance d'être premier qu'un nombre de même taille pris au hasard, soit
iogP(W) ~ dëgp ' îôgn- C'est ce genre d'heuristique, convenablement modifiée pour tenir
compte de la probabilité qu'un entier de la forme P(n) soit divisible par p si p e tP, qui
mène à la conjecture de Bateman et Horn ci-dessous.
Soient Pi, • • • , P/t des polynômes distincts, à coefficients entiers, irréductibles dans
Q[X], dont le coefficient dominant est > 0, et soit P = Pi • • -Pfc. Si p € «^, on note
NP(P) le nombre de solutions de l'équation P(x) = 0 dans le corps Fp = Z/pZ, et on
définit une constante*5* C(P) = Up€.<? ((l ~ J)""*(l - ^f1))-
<2>La fonction Li est le logarithme intégral-, au voisinage de l'infini, on aLi(x) ~ ^^— (faire une intégration
par partie, en intégrant 1 et en dérivant 1^77)- On peut donc reformuler le théorème des nombres premiers
sous la forme plus parlante n(x) ~ ^— ; c'est sous cette forme que nous le démontrerons, mais Li(x) est
une bien meilleure approximation (cf. prop. A.5.1) de7r(x) que j^.
(3>Le lecteur pourra vérifier que, si M = U^i[22 ,22 +1[, alors ]CnGNnM n<x i ~ loglogx, mais que
'^yS^'n^a pas de limite.
(4>Par exemple 12n + 9, n(n2 + 1) ou n(n - 1) + 2 ne peuvent prendre qu'un nombre fini de valeurs
premières pour des raisons évidentes.
<5)Le produit définissant C(P) n'est pas convergent ; on définit sa valeur comme la limite quand x —> +00
des produits partiels llp^x- L'existence de cette limite n'est pas du tout évidente, mais la preuve montre,
en outre, que C(P) ^ 0 si NP(P) ^ p pour tout p G &. Ceci traduit le fait que le nombre de solutions
modulo p de l'équation P(x) = 0, pour P G Z[X] sans racine double, est, en moyenne, le nombre de
facteurs de la décomposition de P en produit de facteurs irréductibles dans Z[X].
A.l. INTRODUCTION
431
Conjecture A. 1.2. (Bateman-Horn, 1962) Si C(P) ^ 0, alors l'ensemble des n G N
tels que Pi(n),..., Pfc(n) soient simultanément premiers est infini, et on a
C(P) x ■
|{n<x, Pi(n)€^,...,Pfc(n)€^}|
degPi-'-degPfc (logrc)fe'
Le théorème des nombres premiers correspond au cas k = 1, P = X de la conjecture. Le
seul autre résultat que l'on ait confirmant cette conjecture est celui où k = 1, et P = Pi
est de degré 1. Dans ce cas, P est de la forme Dx + a, où D ^ 2, et a est premier à D,
sinon il existe un nombre premier p pour lequel Dx + a est identiquement nul modulo p,
et C(P) = 0. Si p | D, alors NP(P) = 0, et si p \ D, alors NP(P) = 1. La constante C(P) de
la conjecture de Bateman et Horn est donc
où <p(D) = |(Z/DZ)*| est la fonction indicatrice d'Euler. La conjecture de Bateman et
Horn est donc, dans ce cas, conséquence du résultat suivant (appliqué à Dx au lieu de x).
Théorème A. 1.3. (de la progression arithmétique) Si D ^ 2, si a est premier à D,
etsiir(D,a,x) = \{p€ &>, p = a mod D, p < x}\, alors n(D,a,x) ~ ^ • ^
On peut paraphraser ce théorème en disant que les nombres premiers s'équirépartissent
dans les progressions arithmétiques dans lesquelles ils peuvent exister Sous la forme du
théorème, le résultat est dû à de la Vallée Poussin, mais n'est qu'une petite extension du
théorème des nombres premiers, si on utilise les idées de Dirichlet (1837) qui avait déjà
démontré (th. VII.4.7) un résultat d'équirépartion des nombres premiers dans les
progressions arithmétiques (nettement moins fin, mais quand même spectaculaire : démontrer, à
la main, l'existence d'une infinité de nombres premiers de la forme In + 3 (par exemple),
n'est pas si facile...). La démonstration du th. A. 1.3 suit celle du théorème des nombres
premiers, en utilisant toutes les fonctions L de Dirichlet (que celui-ci avait précisément
introduites pour démontrer son théorème), au lieu de la seule fonction £. Nous l'avons
transformée en une série d'exercices.
Le théorème de la progression arithmétique est aussi le seul cas où on sache prouver
l'existence d'une infinité de n tel que Pi(n),... ,Pfe(n) soient simultanément premiers
(ici k = 1). Par exemple, on ne sait pas démontrer l'existence d'une infinité de p G &
tel que p + 2 soit premier (problème des nombres premiers jumeaux ^ ; il correspond à
(6)ll a fallu attendre 2005 pour que D. Goldston et C. Yildirim démontrent que liminfp"1+',~Pw = 0, si
pn désigne le n-ième nombre premier, ce qui constitue un pas encourageant en direction du problème des
nombres premiers jumeaux. (La division par logn se justifie par le fait que pn est de l'ordre de nlogn
et l'écart moyen entre pn+i —pn est logn.). Chen J. R. démontré (1975) qu'il existait une infinité de
nombres premiers p tels que p + 2 soit presque premier (i.e. produit d'au plus deux nombres premiers)
432
ANNEXE A. LE THÉORÈME DES NOMBRES PREMIERS
k = 2, Pi = X, P2 = X + 2). De même, on ne sait pas démontrer qu'il existe une infinité
de nombres premiers de la forme n2 + 1 (7).
La situation est nettement meilleure si on se permet de rajouter une variable : des
techniques venant des systèmes dynamiques ont permis récemment des progrès spectaculaires.
• En 2004, B. Green et T. Tao ont démontré qu'il existait des progressions arithmétiques
de longueur arbitraire dans l'ensemble des nombres premiers, ce qui joua un rôle certain
dans l'attribution de la médaille Fields à T. Tao en 2006^. Autrement dit, si k € N, il
existe une infinité de (ni,n2) G N2, avec 712 ^ 1, tels que ni,ni + n2,... ,ni + kn-z G &.
• En 2006, T. Tao et T. Ziegler ont démontré que si Pi,...,Pfc e Z[X] vérifient la
condition Pi(0) = • • • = Pfc(0) = 0, il existe une infinité de (ni,712) € N2, avec n2 ^ 1,
tels que n2 + Pi (ni),... ,n2 + Pfc(ni) soient des nombres premiers.
• En 2010, B. Green, T. Tao et T. Ziegler ont montré que si Li,..., L* sont des formes
affines (i.e. L* = Lj+Oi, où LJ est une forme linéaire et a* une constante) sur Rd (d ^ 2), à
coefficients entiers, telles que les L{ soient deux à deux linéairement indépendantes (pour
éviter par exemple Li(n) = ni + n2 et L2(n) = ni + n2 + 2 qui inclurait le problème des
nombres premiers jumeaux), et si
o {ne Nd, Li(n) > 0,..., L'fc(n) > 0} est non vide,
o {n e Nd, Li(n) • • • Lfc(n) non divisible par p} est non vide pour tout p6^.
alors il existe une infinité de n = (ni,... ,n<i) € Nd tels que Li(n),... , Lfc(n) soient
des nombres premiers. Plus précisément, si P = Lx • • • L*., et si NP(P) est le nombre de
solutions de P(x) = 0 dans Fjj, alors
l{n 6 N*' ss.1" **•Li(n)' ■ ■ •M{n) € ^}l ~ c~ n ((^r^-^-ô^p
où Coo est le volume du convexe déterminé par 0 < U < 1 et LJ(£) ^ 0 (Coo est la
proportion de n G Nd tels que L*(n) ^ 0, pour tout t), et \[p^ ((l - J)~*(l - ^jp-))
est un produit convergent, contrairement au cas de la conj. A. 1.2.
<7)()n sait, depuis Fermât (lettre à Mersenne de Noël 1640), que tout nombre premier de la forme 4fc + 1
est somme de deux carrés ; on en déduit qu'il existe une infinité de nombres premiers de la forme n2+m2,
avec n,m G N. Il a fallu attendre 1998 pour que J. Friedlander et H. Iwaniec démontrent l'existence
d'une infinité de nombres premiers de la forme n2 +mA\ on est encore loin de n2 + 1, bien qu'Iwaniec ait
démontré (en 1978) qu'il y a une infinité de n tel que n2 + 1 est presque premier...
(8>P. Erdôs avait espéré que l'on pourrait démontrer ce résultat en utilisant juste la divergence de la somme
des inverses des nombres premiers (il offrait 3000 dollar pour une solution selon ces lignes). Malgré les
efforts de pas mal de gens réputés pour leur astuce (dont Roth, Gowers, Bourgain et Tao, médaillés Fields
tous les quatre), on ne sait toujours pas démontrer (ou infirmer...) que si X c N - {0} ne contient pas
de progression arithmétique de longueur 3 (i.e. il n'existe pas a,b,c G X distincts, tels que a + c = 26),
alors X^nGX n < +°°- ^e meiUeur résultat dans cette direction est un résultat de J. Bourgain (1999) selon
lequel \{n G X, n < N}| = 0(N^gl2SN) (qu'il a amélioré en 2007 avec (logN)2/3 au lieu de V/IôgN,
mais il faudrait pouvoir remplacer 2/3 par 1 + 5, avec 6 > 0).
A.2. LES FONCTIONS $ ET ^i
433
A.2. Les fonctions tp et fa
1. Théorème des nombres premiers et comportement de fa en +00
Si (ûn)n>i est une suite de nombres complexes, l'étude de J2n<x an est étroitement liée
à celle de la série de Dirichlet J2n>i an,n~s comme le montre le cor. A.2.5 ci-dessous. Pour
évaluer n(x), on est donc naturellement amené à considérer la série de Dirichlet J2P£â>»P~Si
qui n'est pas très éloignée de la fonction — logÇ(s), et comme elle a des propriétés
nettement moins agréables que cette dernière, cela nous conduit à introduire les fonctions
auxiliaires suivantes.
• La fonction A de von Mangolt définie par ]CnS i£r = ~f(S- Si Re(s) > 1, on a
CM = Ope.*» iqhr> d'après la prop. VII.3.3, et donc (th. V.5.4),
On en déduit que A(n) = 0, si n n'est pas une puissance d'un nombre premier, et
A(n) = logp, si n = p", et v ^ 1.
• La fonction tp définie par fax) = Z)n<x A(n).
•
La fonction fa définie par fa{x) = Jq fat) dt.
Lemme A.2.1. Les énoncés suivants sont équivalents au voisinage de +00.
(ii) fax) ~ x.
(iii) fa(x) ~ \x2.
Démonstration. Par définition, fax) = ^pu^logp. Or, p" ^ x implique en particulier
v ^ j2||, et v ^ 2 implique p < yfx. On en déduit l'encadrement
^logp< fax) ^ ^logp+(v/x logx)/log2 ^ 7r(a;)loga;-|-(V^loga;)/log2.
p<œ p<œ
Par ailleurs, si /3 < 1, et x& ^ p, on a logp ^ /?log£. On en déduit que
J^logp ^ /?logz((7r(z) - 7r(a^)),
p<x
et comme ^(x'3) ^ a;'3, on obtient, quel que soit (3 < 1, l'encadrement
P{ir(x) logrc — a^logrc) < ^0*0 ^ n(x) logrc + (\/x loga:)/log2.
On en déduit l'équivalence entre (i) et (ii).
L'implication (ii)=>(iii) est immédiate par intégration. Pour démontrer la réciproque,
constatons que V est une fonction croissante, et donc que
fa(x)-fa((l-e)x) < < fa((l + e)x)-fa(x)
ex ^ ^ ex '
434
ANNEXE A. LE THÉORÈME DES NOMBRES PREMIERS
quel que soit e > 0. Maintenant, si ipi(x) = \x2 + x2r)(x), avec \imx^+00r)(x) = 0, on
obtient, en divisant l'encadrement ci-dessus par x, l'encadrement suivant :
x e rj(x) - (1 - e)V(l - e)x) ^{x) e | (1 + g)an((l + e)x) - rj(x)
2 e ^ x ^ 2 e
En faisant tendre x vers +co, on en déduit que liminf^ ^ 1 - § et limsup3^ ^ 1 +1.
Comme ceci est vrai pour tout e > 0, cela prouve que ip(x) ~ x, ce qui permet de conclure.
Exercice A.2.2. Si D ^ 2, si a est premier à D, et si x ^ 1, soient
PX
V>(D,a,x)= JZ A(n) et ^i(D,a,»)=/ V(D,M)<#-
n<s,n=a modD °
Montrer que les deux énoncés suivants sont équivalents au théorème de la progression arithmétique :
« (p(D)ip(D, a,x) ~ x » et « (p(D)ipi (D, a, x) ~ \ ».
Exercice A.2.3. Montrer que le théorème des nombres premier équivaut àppcm(l,... ,n) = en+°(n).
2. Une formule intégrale pour tpi
Lemme A.2.4- Si c> 0 et x > 0, alors
t™ Jc-i
■c+ioo gs+l (0 SÎX<1,
s(s + l) |z-l six^l.
Démonstration. C'est un calcul de résidus parfaitement standard. La fonction ?+i)
est méromorphe sur C, holomorphe en dehors de deux pôles simples en s = 0 et s = — 1,
de résidus respectifs Res(£+^,0) = x et Res( f^1)? —1) = —1.
• Si x ^ 1, on intègre sur le lacet 7t constitué du segment [c — àT,c + tT], et de
C+(T), arc de cercle c + Tetd, avec 0 variant de f à Ç. Si T > c + 1, le lacet 7t a pour
indice 1 par rapport aux deux points 0 et —1. On déduit de la formule des résidus que
è/ 3(5+1) ds = x — 1, si T > c + 1. Par ailleurs, sur C+(T), on a |rcs+1| ^ xc+1 et
1^+1)1 ^ (T-c)(T-c-l)- D°nC /c+(T) ^£ï) dS ^ ° qUaild T "> +°°' et
1 fc+io° xs+1 1 / zs+1 J
tt- / —; 7T ds = lim —— / —; — as
2™ Jc-ioo S(S + 1) T^+oo 2Z7T J[c-iT>c+iT] s(s + 1)
f xs+l
= x — 1 — lim / —; -t- ds = x — 1.
T-+oo,/c+(T)s(s+l)
• Si rc < 1, on intègre sur le lacet 7t constitué du segment [c —tT,c + tT], et de C~(T),
arc de cercle c+Te^, avec $ variant de f à =f. Dans ce cas 7t a pour indice 0 par rapport
aux deux points 0 et —1, et la formule des résidus nous donne ^ / f$+l) ds = 0, quel
que soit T > 0. Le reste de l'argument est le même que ci-dessus.
A.3. FORMULES EXPLICITES
435
Corollaire A.2.5. Soit L(a, s) = £S zr une série de Dirichlet d'abscisse de
convergence absolue <jabS ^ +00. Alors, si c> sup(0, aabs) et x > 0, on a
1 r+iooL(a,s)rcs+1
1 r*"»L(*,8)x»1 J f*,rs ...
Démonstration. Par hypothèse, la série X)nS ^ converge normalement sur la
droite c+iR, et comme la fonction ,*+l) est sommable sur cette droite, on peut échanger
somme et intégrale. Par ailleurs, on a
c+ioo x xs+i f [0 sirc<n,
n(n — l) = x — n six^n.
J_ fc+to° 1 xs+1
2™Jc-ioo n*s(s + l)
On en déduit que
ce qui permet de conclure.
Corollaire A.2.6. Si c> l, et si x > 1, a/ors ^(s) = -£ /ct!^ $#^£îj <*s.
Exercice A.2.7. Si D ^ 2, notons Dir(D) l'ensemble des caractères de Dirichlet modulo D. On utilisera
le résultat suivant démontré dans le n° 5 du § 1.2 :
-y-r- J y>(D) si n = a mod D,
0 sinon.
Si a est premier à D, alors ^ x(a)x(n) = {
XGDir(D) l
x > 1, la formule
2t* c^/m «'c-ioo L(X, 5) S(S+1)
A.3. Formules explicites
La formule du cor. A.2.6 est, en elle-même, assez peu utile en ce qui concerne la
démonstration du théorème des nombres premiers. La seule information qu'on puisse en tirer
est, semble-t-il, en majorant brutalement ce qu'on intègre, l'existence, pour tout c > 1,
d'une constante C(c) telle que if)i(x) < C(c)rc1+C, ce qui était évident dès le départ. Pour
obtenir des résultats plus fins, on va déplacer la ligne d'intégration vers la gauche (9) (de
manière à diminuer le c). La traversée de la bande critique est un peu périlleuse à cause de
(9)()n va envoyer la ligne d'intégration vers —oo, ce qui induit des complications un peu inutiles si on
ne s'intéresse qu'au th. des nombres premiers, mais permet d'établir un lien direct entre la répartition
des nombres premiers et les zéros de la fonction Ç de Riemann (en appliquant le th. A.3.3 à L = C) ; la
démonstration du th. A.3.3 mélange de jolis résultats et des majorations un peu pénibles ; il est conseillé
de lire le § A.4 pour voir comment le th. A.3.3 est utilisé avant de s'attaquer à sa démonstration.
436
ANNEXE A. LE THÉORÈME DES NOMBRES PREMIERS
la présence des zéros de Ç qui entraîne l'existence de nombreux pôles pour la fonction £-,
ce qui fait que la fonction £■ est loin d'être assez petite pour qu'on puisse se dispenser de
prendre des précautions en se déplaçant. On va donc être forcé de majorer cette fonction
€ dans la bande critique, et le miracle des fonctions holomorphes (lemmes A.3.6, A.3.9
et A.3.10) fait que la connaissance de la fonction £ des deux côtés de la bande critique
permet de contrôler un peu ce qui se passe à l'intérieur (on maîtrise bien la fonction £
dans le demi-plan Re(s) < 0 grâce à l'équation fonctionnelle et à la formule de Stirling).
1. Énoncé du résultat
Afin de pouvoir appliquer les résultats de ce § aux fonctions L de Dirichlet, nous
allons partir d'une fonction L méromorphe sur C, holomorphe en dehors d'un pôle simple
éventuel en s = 1, et qui vérifie les conditions (Ll) (L3) ci-dessous, ce qui est le cas de £
(d'après le lemme A.3.1) et des fonctions L de Dirichlet :
(Ll) Si a > 1, il existe c(a), tel que, si Re(s) ^ a, on ait
|LW|<c(o), ILW^KcW, |^§| <c(a).
L(s)
En particulier, L ne s'annule pas sur le demi-plan Re(s) > 1.
(L2) Il existe A € C*, B e R+ et c G [0,2[ tels que L vérifie l'équation fonctionnelle
L(s) = A • Bs • T(l - s) ■ sin l^SLzA . L(i _ s), 0ù L est définie par L(s) = L(f).
z*
(L3) Quels que soient a ^ b réels, il existe C(a, b) > 0 et c(a, b) > 0 tels que, si a < o < b
et \t\ ^ 1, alors
|L(a + ir)KC(o,6)ec(û>6)|T|.
Lemme A.3.1. La fonction £ vérifie les propriétés (Ll) (L3).
Démonstration. Si Re(s) > a, on a
i«*)i=niî^<nîzpEw<iiîZ7:<««).
p€.^ ' y ' p€& F p€& F
icw-,i=nii-"-i<iKi+i'-)<M.
p€.^ p€& SV '
ce qui montre que Ç vérifie (Ll), avec c(a) = sup(Ç(a), £§r). Les propriétés (L2) et (L3)
sont nettement plus délicates mais ont déjà été démontrées (la propriété (L2) fait l'objet
du th. VII.3.7, et la prop. VII.2.11 (allié à la formule ((s) = 5=5^(^,5 - 1) de la
démonstration du th. VII.3.4) montre que l'on peut prendre c(a, b) = f).
A.3. FORMULES EXPLICITES
437
Exercice A.3.2. (i) Montrer que L(x,s) vérifie les propriétés (Ll) (L3), si x est primitif,
(ii) Montrer que, si x est primitif de conducteur divisant D, si c> 1, et si x > 1, alors
W,-*, W,*) L(x,s)^(s + l)dS-^ ^»"K» ">■
En déduire que £ f™~ ($g$ - $*#) ^ <fc est un O(xlogz).
Soit donc L une fonction méromorphe sur C, holomorphe en dehors d'un pôle simple
éventuel (ce pôle simple éventuel pouvant en fait être un zéro) en s = 1, et vérifiant les
propriétés (L1)-(L3). Si x > 1, on note Fx la fonction Fx(s) = —xS sfs+i) • C'est une
fonction méromorphe sur C, holomorphe en dehors de pôles en 0, —1, éventuellement
en 1, et en les zéros de L. Comme L ne s'annule pas sur Re(s) > 0 et vérifie l'équation
fonctionnelle de la propriété (L2), les seuls zéros de L en dehors de la bande 0 < Re(s) < 1
(bande critique) sont les c — 2k, pour k € N — {0}, ce qui peut inclure —1. On note Y(L)
l'ensemble des zéros dans la bande critique, distincts de 0 et 1.
Soient a0 = rc_1Res(Fx,0) et a_i = Res(Fa;, —1) (10). Le résultat que nous avons en
vue est la « formule explicite » suivante (dans laquelle vz(L) e Z désigne la valuation
(i.e. l'ordre du zéro) de L au point z).
Théorème A.3.3. (i) La série X3peY(L) pfp+i) es^ absolument convergente.
(ii) Six>l, alors ± f£™ T^1 ^T) ds est aussi ^al a
sx2 y-^ vp(L)xP+1 ^ xl+c~2k
-Vl(L)- + a«x + a_t - Y! éTTTTV ~ £
les deux séries ci-dessus étant absolument convergentes.
La démonstration va demander un peu de préparation, mais on peut tout de même
remarquer que l'expression finale peut se réécrire sous la forme plus compacte (n)
2ht A-fa. L(.) ,(,+ 1) J^
l'expression du théorème étant obtenue en explicitant le résidu de Fx en tous ses pôles
(qui sont simples sauf peut-être 0 et —1). De plus, comme \xp+1\ < x3, si Re(p) < 2,
la convergence des séries suit juste de la convergence absolue des séries ^2p£Y(L) ptp+l) et
Sfe^i (2fc-c)(2fc-c-i) • ^ sumt donc de démontrer le (i) et la forme compacte ci-dessus.
(10)Si 0 n'est pas un zéro de L, alors ao = "ff. Si 0 est un zéro de L, alors 0 est un pôle double de F,
et ao est de la forme ao.o + ûo.i logz.
Si c ^ 1, alors -1 est un pôle simple de F, et a_i = ^M. Si c = 1, alors -1 est un pôle double de F, et
a_i est de la forme a_i,o + a_i,i logrc.
("^Formellement, cette formule n'est autre que la formule des résidus si on considère la droite Re(s) = 2
comme un lacet entourant le demi-plan Re(s) < 2.
438
ANNEXE A. LE THÉORÈME DES NOMBRES PREMIERS
V
2. Les fonctions L et k- en dehors de la bande critique
3 .
Lemme A.3.4- Si a < 0, la fonction (s — a+ l)a 2 (s — l)L(s) est bornée sur la droite
Re(s) = a.
Démonstration. Sur la droite Re(s) = a, la fonction F(s) = (s — a+ l)a~2(s — l)L(s)
est continue. Par ailleurs, si t G R, on a
L(o + it) = A Ba+it rin(7r(°'~C + **V(l ~ û " **)L(1 - a - **)•
Or A Ba+i'L(l - a - tf) est bornée pour t € R, et e~^/2\ sin ^°~2c+i^| tend vers \ quand
|£| tend vers +00, ce qui permet de déduire du cor. VII.2.10 que
|rin('(a-2C + a>)r(l-a-«)|r^
est borné quand \t\ tend vers +00. Donc |F(a + it)\ = \(it + l)a~ï(a + it- l)L(o + it)\
est borné quand \t\ tend vers +00, et comme F(a + it) est continue sur R, elle est bornée
sur R. Ceci permet de conclure.
Lemme A.3.5. Soit (4j)n^2 (resp. (t~)n^2) une suite de réels vérifiant n ^t„ ^ n+1
(resp. —n—1 < t~ < -n). Notent 6+ = — l+i*J (resp. 6~ = —l+it~) etc+ = c+l-2n+it+
(resp. c~ = c+1 — 2n + it~). Alors il existe C > 0 tels que, \jt^\ < C + logn, quels que
soient n^ 2 et se [6+, c+] U [c+, c~] U [c~, b~].
Démonstration. On part de l'équation fonctionnelle (L2) dont on déduit l'identité
V(s) = in e^-c)/2 + e-i«(s-c)/2 r(1 _ g) 1'^ _ g)
L(s) " °g + 2 ' e^(*-c)/2 - e-^(*-c)/2 T(l - 5) L(l - s) '
Maintenant, quand s décrit [6J,c+] U [c+,c~] U [c~,6~], on a Re(l - s) ^ 2.
• 0r \l$$\ ^ c(2)' si Re(1 " 5) ^ 2' d'après la propriété (Ll).
• D'après la prop. VII.2.9, il existe Ci > 0 tel que |Ç£z^ - log(l - s)\ ^ Ci,
si Re(l - s) ^ 2. On en déduit, si 5 G [&£,c+] U [c+,c~] U [c~,6~], que
I^V ,1 < Tr+d+logll-sl < Tr+d+log y/(2n - c)2 + (n + l)2 < 9r+Ci+log3+logn.
r(l - s)
• Si s appartient à K,c+] ou [c~,6~], on a |Im(s)| ^ n, et donc
eiir(s-c)/2 _|_ e-iw(s-c)/2 çim/2 _j_ g-7rn/2 j _j_ g-îr
I giîr(s-c)/2 _ e-iir(s-c)/2 I ^ gîm/2 _ e-im/2 ^ ]_ _ g-7r '
Si 5 € [c+, c~], et si s = c + 1 — 2n + tà, alors
g«r(s-c)/2 , -m(s-c)/2 -*t/2 _ e*t/2 i , -ir
_ If = ir î I < 1 < L^e
I eiir(s-c)/2 _ e-iir(s-c)/2 I I g-7rt/2 _|_ eirt/2 ' ^ ^ ]_ _ g-îr '
A.3. FORMULES EXPLICITES
439
On en déduit l'inégalité |^| < logB + c(2) + tt + Ci + log3 + § |±fS- + logn,
si s G K, c+] U [c+, c~] U [c~, 6~]. Ceci permet de conclure.
3. La fonction L dans la bande critique
Lemme A.3.6. Soit F une fonction holomorphe sur un ouvert contenant la bande
a < Re(s) ^ b. On suppose que |F(s)| ^ M sur les droites Re(s) = a et Re(s) = b, et qu'il
existe c,C > 0 tels que |F(<t + zt)| ^ Cec|T|, si a < a < b et \t\ ^ 1. Alors |F(s)| < M s«r
la bande toute entière.
Démonstration. Si e > 0, alors F(s)ees tend vers 0 quand s tend vers l'infini dans
cette bande, puisque Re(es2) ~ —elm(s)2 tend vers —oo beaucoup plus vite que c|Im(s)|.
Le principe du maximum (rem. V.3.12) permet d'en déduire que, si T est assez grand, le
maximum de |F(s)ees | sur le rectangle de sommets a±iT et b±iT est atteint sur un des
segments verticaux, et donc que le maximum de |F(s)ees | dans la bande est atteint sur la
droite Re(s) = a ou sur la droite Re(s) = b. On en déduit que |F(s)e"2| ^ M sup(ee°2, ee62),
quels que soient e > 0, et s dans la bande a < Re(s) ^ b. En faisant tendre e vers 0, cela
montre que |F| est majorée par M sur la bande, ce que l'on cherchait à démontrer.
Lemme A.3.7. Si a < 0, la fonction (s — a + l)°~2(s — l)L(s) est bornée sur le
demi-plan Re(s) ^ a.
Démonstration. Comme |—o ^ 1 et comme L est bornée sur le demi-plan Re(s) ^ 1—a,
la fonction F(s) = (s — a + l)a-2(s — l)L(s) est bornée sur le demi-plan Re(s) ^ 1 — a
(et donc en particulier sur la droite Re(s) = 1 — a). Par ailleurs, la fonction F est bornée
sur la droite Re(s) = o, d'après le lemme A.3.4. Enfin, la fonction F est holomorphe dans
la bande a < Re(s) < 1 — a et la propriété (L3) montre que F vérifie les hypothèses du
lemme A.3.6 (avec b = 1 — a et c n'importe quel réel > c(a, 1 — a)). On en déduit le
résultat.
Lemme A.3.8. Il existe Ci > 0 tel que supseD(2+it,i2) Il^hïtI ^ Ci|£|21/2, si t G R
et |*| ^ 15.
Démonstration. On déduit du lemme A.3.7 (avec o = —10) l'existence d'une constante Ci
telle que
ls + lll23/2
|L(*)I < Ci T i » si ReW > ~ia
|s-l|
Maintenant, si s € D(2 + it, 12), on a \s + 11| < |*| + 25, et \s - 1| ^ \s\ - 1 ^ |*| - 13.
Comme de plus, |L(2 + tà)_1| < c(2), d'après la propriété (Ll), on obtient, si \t\ > 13,
«mn I L(g) I < r(W (l*l + 25)23/2
s€D(2+it,12) L(2 + ît) \t\ - là
Le résultat s'en déduit sans problème.
440
ANNEXE A. LE THÉORÈME DES NOMBRES PREMIERS
4. La fonction ^ dans la bande critique
Lemme A.3.9. (Borel-Carathéodory) Soient fi un ouvert de C, R > 0 tel que
D(0,R) C fi, et f holomorphe sur fi, avec /(0) = 0. Si A = sup|s|=RRe(/(s)), alors
f(k)(s) 4AR
I—n—I ^ 7R—■ |Xk ,,, tf«e/s <7«e soient & € N et s e D(0, R").
1 k\ ' (R — |s|)'c+1
Démonstration. On a F(s) = ^J^ûnS71 sur D(0, R). En écrivant an sous la
forme \an\ëe'\ on obtient Re(/(Reiô)) = J^ïïi |am|Rmcos(m0 + 0m) et
/ (1 + cos(n0 + 0n))Re(/(Re*)) dO
+00 ^TT
= ]T |am|Rm / (1 + cos(n0 + Bn)) cos(mÔ + 0m) dO = 7r|an|Rn.
m=l ^0
Comme 0^1 + cos(n0 + 6n) < 2, on en tire la majoration 7r|an|Rn < AirA et donc
\an\ < 4AR_n. (En particulier, A ^ 0.) Maintenant, si \s\ < R, on a
Ceci permet de conclure.
Lemme A.S.ÎO. Soient fi un ouvert de C, R > 0 tel que D(0,3R) C fi, et f
holomorphe sur fi, avec /(0) = 1. Soit M = sups€D(03R) |/(s)|, et soit Y l'ensemble des zéros
de f dans D(0, R). Alors :
Démonstration. Soit p(s) = /(s)rip€Y(l ~ s/p)~vp^\ Par construction, p ne s'annule
pas sur D(0,R), et g(0) = 1 ; il existe donc (cf. prop. VI.2.3) un ouvert fi7 C fi contenant
D(0, R) et h holomorphe sur fi7, avec h(0) = 0, tels que g = eh sur fi7. Soit N = X]pGY vpU)-
Comme |1 — s/p\ ^ 2, si \s\ = 3R, on a \g(s)\ < 2"NM, si \s\ = 3R. Par le principe
du maximum (rem. V.3.12) cela implique que 1 = \g(l)\ < 2~NM, et donc que N <
^^. Enfin, on a \g(s)\ < M, si |s| = 3R et donc, d'après le principe du maximum,
sup|s(=R \g(s)\ < M et sup|s|=RRe(/i(s)) < logM. Le lemme A.3.9 permet d'en déduire que
\h'(s)\ < ^jp, si |*| < R, et comme h'(s) = Ç$ - E^y ïr^> cela permet de conclure.
Si n e N, notons Zn l'ensemble des zéros de L dans le disque D(2 + m, 4).
Corollaire A.3.11. Il existe des constantes C2, C3, telles que, si \n\ est assez grand :
(i)£,Gz„^(LKC2log|n|;
(») It$I ^Caloglnl + CsloglnKinf^zJ*-/?!)"1, si s e D(2 + in, y/ÏÏ).
A.3. FORMULES EXPLICITES
441
Démonstration. On applique le lemme A.3.10 à f(s) = ^tj+ffl *, et R = 4; dans les
notations de ce lemme, on peut prendre M = Ci|n|21/2, d'après le lemme A.3.8. On en
déduit que
^ ftogn+jogQ .L'(s), 16(flogn+JogC0 ^ „,(L)
si |s — (2 H- m)| < \/ÏÔ. Le résultat s'en déduit.
Corollaire A.3.12. Il existe C4 > 0, tel que, si n G N est assez grand, il existe
t+ G [n,n+ 1] et t~ G [—n — 1, — n], tels que
sup |^4| < C4(logn)2 et sup |^| < C4(logn)2.
s€[2+itt,-l+itt] L{<S) s€[-l+itn,2+itZ] bVSJ
Démonstration. Comme |Zn| ^ C2 log n, les segments ]Im(p) - 2Ca{ , lm(p) + 2C2{ogn [,
pour p G Zn ne recouvrent pas complètement [n,n+1], puisque leur réunion est un ouvert
de longueur < 1. Il existe donc t+ tel que |Im(/o) — £+| ^ 2C2| , quel que soit p G Zn. On
a alors infp6Zw \s-p\> inf^z,, |Im(a - p)\> 2C2{ogn> quel que soit s G [2 +1*+, -1 + it+].
De même il existe t~ G [—n — 1, —n] tel que inf^z.,, |s - p\ ^ 2Caj , quel que soit
s G [—1 + it~>2 + i£~]. Le (ii) du lemme A.3.11 permet de conclure (avec C4 = 2C2 + 1
par exemple).
5. Conclusion
Passons à la démonstration du th. A.3.3. Pour prouver la convergence absolue de la
série X)pgy(l) pfp+i) > constatons Que l'ensemble Z'n des éléments de Y(L) dont la partie
imaginaire est comprise entre n et n+ 1 est inclus dans le disque D(2 + m,4), et donc est
un sous-ensemble de Zn. Comme J2Pezn vp(^) ^ ^2 log |n|, si n est assez grand, on déduit
la convergence absolue de £pgy(l) ^pyj de celle de Y^n=i ^r-
Maintenant, choisissons, pour tout n assez grand, des réels t+ et t~ vérifiant les
conclusions du cor. A.3.12. Soient a+, 6+, c+ les points 2 + it+, -1 + it+, c + 1 - 2n + it+, et
a~, 6~, c~ les points 2 + ?!£", -1 + it~, c + 1 - 2n + tà~. On note :
• Vn le segment vertical [c+,c~],
• A+ et A~ les segments horizontaux K,c+] et [c~,6~],
• B+ et B~ les segments horizontaux [a+,6+] et [&n>anl>
• R~ le chemin composé B+ • A+ • Vn • A~ • B~,
• R+ le segment vertical [a~,a+].
Alors Rn = R+ • R~ est le rectangle de sommets a~, a+, c+ et c~ parcouru dans le sens
direct. On note Yn l'ensemble des pôles de Fx se trouvant à l'intérieur du rectangle Rn.
442
ANNEXE A. LE THÉORÈME DES NOMBRES PREMIERS
-2n 1k
o = pôles de -a-
Le chemin R dans le cas de Ç
La formule des résidus nous donne alors
Fx(s)ds = ^2 Res(Fx,p).
J^
P€Yn
Maintenant, /^ Fx(s) ds = f^ Fx(s) ds + fB+ Fx(s) ds+/A+.Vu.Ar F*(5) ds + /B,T F*(s)ds'
. fx Fx(s) ds tend vers ££ =j$ ^ ds.
• Sur B+ et Bn, Fx(s) est, d'après le cor. A.3.12, majorée en valeur absolue, si x ^ 1,
par C4(logn)2|Im(5)||3rn(3+1)| ^ ^Çi^l!. Donc /B+ Fx(s) ds et /BT Fx(s) ds sont majorés
en valeur absolue par 3X C4^°gn> et tendent vers 0 quand n tend vers +oo.
A.4. DÉMONSTRATION DU THÉORÈME DES NOMBRES PREMIERS 443
• Sur A+ • Vn • A~, Fx(s) est, d'après le lemme A.3.5, majorée en valeur absolue, si
x ^ 1, par (C0 + logn)[5(^+1)[ < (C0 + logn)^, et comme la longueur de A+ • Vn • A" est
2(2n — 2) + t+ — t~ < 6n — 2, on en déduit que /A+.v .A- Fx(s) ds tend vers 0 quand n
tend vers +oo.
On en déduit le théorème en faisant tendre n vers +oo, et en remarquant que l'ensemble
des pôles de Fx est la réunion croissante des Yn, et donc que X)peY„ Res(Fx, p) tend vers
ERe(P)<2Res(F*,p).
Exercice A.3.13. On note c/K(T) le nombre de zéros s de la fonction £ dans la bande critique, vérifiant
0 < Im(s) < T. Montrer que ^(T) = ^rlog^j: - ^ + O(logT). (Considérer la partie imaginaire de
l'intégrale de i££ ds sur le rectangle de sommets 2 + i, a+, 6+ et -1 + i, où £(s) = r^*fflC(g)» et utiliser
l'équation fonctionnelle satisfaite par £ (rem. VII.3.8 ou ex. VII.6.6), la formule de Stirling dans le plan
complexe (prop. VII.2.9) et le lemme A.3.10.)
A.4. Démonstration du théorème des nombres premiers
1. Non annulation sur la droite Re(s) = 1
Lemme A.4.I. Sia,(5 G C, et si \z\ < inf(l, |ce|_1, \p\'1, |ce/?|_1), alors
Démonstration. —- Si on multiplie par (1—z){l—az)(l—/3z)(l—a/3z) les deux membres de
l'identité à démontrer, on obtient des séries du type J2nZ Pn(<*> &)zU et Z)n5 Qn(o» P)zU>
où les Pn et Qn sont des polynômes (en deux variables). On est ramené à prouver que
Pn = Qn pour tout n. Or pour prouver que Pn = Qn, il suffit de prouver que Pn = Qn
sur un ouvert, le reste s'en déduisant par prolongement analytique. On peut donc se
restreindre au cas où 1, a, f3 et a(3 sont tous distincts. Dans ce cas, la fraction rationnelle
F(z) = n_z\n-az)?f-0Z)(i-apz) na Que ^es P°les simples, ce qui rend sa décomposition en
éléments simples particulièrement facile à calculer. Soient
JBm.d - 0z)F(z) = (1_rl);r-tA)(l-a) " ~(1-<*f(l-/?) '
JV1 _ aPzW{z) = (l-a-^Kia-r')(l-a-') = (l-«Hl-fl •
aa
444
ANNEXE A. LE THÉORÈME DES NOMBRES PREMIERS
Alors
PW «!_ + ^2_ + ^_ + a«"
1 — 2 1 — az 1 — f3z 1 — a(3z
1 / 1 _ a _ ff «/? \
(l-a)(l-/?)Vl-2 1-a* 1 - 0z 1 - a#J
1 +oo
= (l-a)(l-/8) g (1 - Û"+1 - ^ + (^)n+1)z"
+22 n - ^n+1ui - ftn+1\ i2^
= E (l-a)(l-?) ^" = D1 + a + --- + a'')(1+/? + --- + ^"
Proposition A.4.2. Si t € R, alors F(s) = C(2s)_1Ç(s)2Ç(s + it)Ç(s - it) est une
série de Dirichlet à coefficients positifs.
Démonstration. En utilisant la factorisation de Ç en facteurs d'Euler, on obtient
FW=n v-r")
*£Q-r,m-ir-*)(i-r*+«y
On peut alors utiliser le lemme A.4.1 avec z = p~s, a = pu et P = p~u pour obtenir la
formule
+00
f(*)=n ( e 11+?"+• • •+j^iv*) .
ce qui permet de conclure.
Théorème A. 4.3. La fonction Ç ne s'annule pas sur la droite Re(s) = 1.
Démonstration. Supposons, par l'absurde qu'il existe feR, avec C(l + it) = 0. On a
alors Ç(l — it) = Ç(l + it) = 0. La fonction ((s + it)Ç(s — it) a donc un zéro double en
s = 1, ce qui fait que F(s) = £(2s)-1£(s)2Ç(s + it)Ç(s — it) est holomorphe en s = 1, le
zéro double contrebalançant le pôle double de C(5)2- De même, les zéros de Ç(s) en 1 + it
et 1 — it contrebalancent les pôles de Ç(s + it) en l — it et ((s — it) en 1 + it. On en
déduit que F(s) est holomorphe dans le demi-plan Re(s) > \. De plus, comme C(2s)-1
est holomorphe au voisinage de s = |, et comme F est à coefficients positifs, il résulte
du théorème de Landau (th. VII.1.1) que l'abscisse de convergence absolue de F est < \.
On aboutit à une contradiction car, d'une part F(|) = 0 puisque C(2s)_1 = 0, et d'autre
part F(|) > 0 comme somme d'une série à termes positifs non tous nuls. Ceci permet de
conclure.
Exercice A.4-4- Soit x un caractère de Dirichlet de conducteur D.
(i) Montrer que Çd(2s)_1<d(s)2L(x,s + it)L(x,s - it) est une série de Dirichlet à coefficients positifs
(Cd désigne la fonction Ç privée de ses facteurs d'Euler en lesp divisant D, i.e. Cd(s) = Ilpe&^D i-p-»)-
(ii) En déduire que L(x, s) ne s'annule pas sur la droite Re(s) = 1.
A.5. COMPLÉMENTS
445
2. Conclusion
D'après le lemme A.2.1, pour démontrer le théorème des nombres premiers, il
suffit de prouver que ipi(x) ~ \. Maintenant, comme Ç vérifie les propriétés (Ll) (L3)
(cf. lemme A.3.1), le cor. A.2.6 et le th. A.3.3 nous fournissent la formule explicite
* W ~ 2 «0) + C(-l) Jfa P(P +1) ti 2r<-2r - !)'
Il en résulte que « ipi(x) ~ \ » est équivalent à « limx_+00 Z)PeY«) Jp+n = 0 ». Comme
£ ne s'annule pas sur la droite Re(s) = 1, on a Re(p- 1) < 0, et donc lim^+oo fj"^ = 0,
quel que soit p G Y(Ç). Comme de plus fyj^, | < IJ^+nl» et comme la somme des
| yffij est convergente, on peut utiliser le théorème de convergence dominée pour les
séries pour intervertir sommes et limites, ce qui permet de conclure.
Exercice A.4-5. Adapter les arguments ci-dessus pour démontrer le théorème de la progression
arithmétique.
Exercice A.4-6. On se propose de montrer, en partant de la formule explicite ci-dessus, et en utilisant
la convergence absolue de la série 52p€Y«) p(p+i) » <3ue *e théorème des nombres premiers implique la non
annulation de £ sur la droite Re(s) = 1. On numérote les zéros de Ç sur la droite Re(s) = 1 sous la forme
p = 1+ irn, avec n € I, I sous-ensemble de N, et on pose an = h+i£)(2+iTn)•
(i) Montrer que, si ipi(x) ~ ^-, alors lim^+oo 5Zn€l anxiTn = 0.
(ii) En déduire que limu^+oo u lo \f(u)\2 du = °> où f(u) = Enei ûneir(n)w.
(iii) Exprimer limu->+oo n /o l/(w)l2 du = 0 en fonction des a„.
(iv) Conclure.
A.5. Compléments
1. L'hypothèse de Riemann et ses conséquences
Si on suppose que l'hypothèse de Riemann est vraie, tous les p apparaissant dans la
démonstration ci-dessus ont une partie réelle égale à |, ce qui permet de majorer f^^ |
par x3/2| p{p+i\\) et comme la série J2pçy(ç) p(p+i) est absolument convergente, on en déduit
que tpi(x) = \x2 + 0(x3/2).
On peut montrer, via l'encadrement ipi(x) — ipi(x — 1) < ip(x) < tl)\{x + 1) — if)i(x) et
la formule explicite pour ^i(rc), que l'on a i/j(x) = x + 0(x1^2(\ogx)2).
Enfin, en utilisant l'exercice A.5.2 ci-dessous, on en déduit le résultat suivant, qui montre
que l'hypothèse de Riemann a des implications profondes sur la répartition des nombres
premiers.
446
ANNEXE A. LE THÉORÈME DES NOMBRES PREMIERS
Proposition A.5.1. Si l'hypothèse de Riemann est vraie, alors
1ç(x)= [ Y^—dt + Oix^logx).
J2 l°g *
Exercice A.5.2. On suppose l'hypothèse de Riemann vraie, ce que l'on utilisera sous la forme
ij){x) = x + 0(rc1/2(logx)2). Soient A{x) = £p<x logp et B(x) = A(x) - x.
(i) Montrer que ip(x)-A(x) = 0(x1/2logx) ; en déduire qu'il existe C > OtelqueB(rc) ^ Crc1/2(loga;)2,
si x > 2.
(ii) Montrer que w(x) = E2^* AM^~l).
(iii) En déduire que
(iv) Conclure.
Remarque A. 5.3. De la Vallée Poussin a montré qu'il existe c> 0 tel que £ ne s'annule
pas sur {5 = <r+it, a ^ 1 — i0g(iH-it|) ^- ^n déplaçant la ligne d'intégration sur le contour de
cette région, cela permet de préciser le terme d'erreur dans le th. des nombres premiers :
il existe a > 0 tel que ir(x) = f£ i dt + 0(xexp(—ay/x)).
2. L'hypothèse de Riemann et la fonction M de Mertens
On rappelle que l'on note \i la fonction de Moebius définie par
g^-cw-'=na-^).
n=l p&&>
si Re(s) > 0. On a donc fj,(n) = 0 si n est divisible par le carré d'un nombre premier
et n(n) = (—l)r, si n = pi'--pr, où les pi sont des nombres premiers distincts. La
fonction M de Mertens est définie par M(x) = J^n<»A*(n)> et F. Mertens a conjecturé que
|M(rc)| ^ y/x, si x > 1. Cette conjecture, si elle avait le bon goût d'être vraie, impliquerait
l'hypothèse de Riemann. En effet, la formule de sommation d'Abel nous donne
+00
<(«)-'= 5>(n)(n--(n + l)-),
n=l
et l'hypothèse |M(n)| ^ y/n implique que la série est absolument convergente
pour Re(s) > |, et donc que Ç ne s'annule pas pour Re(s) > |.
On ne connaît aucun contrexemple explicite à la conjecture de Mertens, mais celle-ci
n'est pas très raisonnable à cause de la loi du logarithme itéré (Khinchine 1924), selon
laquelle, si an G {±1} et An = YX=i an> al°rs presque sûrement
A A
lim sup —-. n = = 1 et lim inf —^ n = = —1.
V 2n log log n y/2n log log n
De fait, A. Odlyzko et H. te Riele ont démontré en 1985 que la conjecture de Mertens
est fausse et on sait qu'il existe des contrexemples plus petits que 3,21 • 1064. Par contre,
A.5. COMPLÉMENTS
447
la même loi du logarithme itéré ou le résultat de Hausdorff mentionné dans la note 4 du
chap. VII rendent l'hypothèse de Riemann plus que plausible. D'un autre côté, le résultat
de Odlyzko et te Riele relativise quelque peu les confirmations numériques de l'hypothèse
de Riemann (on a vérifié que les 1013 premiers zéros de la fonction £ dans la bande critique
sont effectivement sur la droite Re(s) = |).
3. L'hypothèse de Lindelof
C'est une conjecture impliquée par l'hypothèse de Riemann, mais qui est a priori plus
faible. Elle est équivalente à un des énoncés suivants (il faut travailler pas mal pour
démontrer l'équivalence de ces énoncés).
• On a |C(| + it)\ = 0(te) au voisinage de +oo, quel que soit e > 0.
• Si a > |, et si c/K(cr,T) est le nombre de zéros de la fonction Ç vérifiant Re(s) ^ a et
0 < Im(s) < T, alors J^(a,T + 1) - c/K(a,T) = o(logT) quand T -> +oo.
• ^2n^tn~^+2iwt) = 0(*e)> au voisinage de +oo, quel que soit e > 0.
Le deuxième de ces énoncés, que l'on peut comparer avec l'ex. A.3.13, est une
conséquence de l'hypothèse de Riemann qui peut s'énoncer sous la forme c/T(a, T) = 0, quels
que soient a > | et T ^ 0. Le troisième ne fait intervenir que des sommes finies et donc
a l'air parfaitement innocent.
Contrairement à l'hypothèse de Riemann, il y a des progrès à intervalles réguliers
concernant l'hypothèse de Lindelof. Par exemple, G. Kolesnik a prouvé en 1982 que
C(l/2 + it) = 0(*1/6-1/216+e), quel que soit s > 0.
F. Bombieri et H. Iwaniec ont démontré en 1986 que
C(l/2 + it) = CK*1/6"1/284-*), quel que soit e > 0.
ANNEXE B
VOLUME DE SLn(R)/SL„(Z)
Cet appendice est consacré au calcul du volume de SLn(R)/SLn(Z) (voir plus loin
pour la signification exacte de cette notion), résultat dû à Siegel (1945). Ce calcul se
fait par récurrence sur n en utilisant astucieusement la formule de Poisson selon une
idée de Weil (1946). Le résultat (th. B.1.4) est à rapprocher de la formule (prop. B.l.l)
pour le cardinal du groupe SLn(Fp) : convenablement réinterprétée, cette formule dit
que le volume du groupe SLn(Zp) est rife=2 (* —*)> et ^a f°rmule Pour Ie volume de
SLn(R)/SLn(Z) donne lieu à une formule du produit^
Vol(SLn(R)/SLn(Z)) • JJ Vol(SLn(Zp)) = 1.
Il s'agit là d'un cas particulier de formules très générales (dont certaines, comme la
conjecture de Bloch-Kato mentionnée dans l'introduction, sont largement conjecturales),
indiquant des liens profonds et encore assez mystérieux entre les mondes réels et p-adiques.
B.l. Volume d'objets arithmétiques
1. Résultats
Proposition B.l.l. Si K est un corps fini de cardinal q, et sin^ 2, alors
|SL„(K)| = q"-1 f[(qn - <T*) = q»2"1 f[ (l - 1).
fc=2 fe=2 ^
Démonstration. L'application g i-> detg, de GLn(K) dans K*, est un morphisme
surjectif de groupes dont le novau est SLn(K). Comme |K*| = q — 1, on en déduit que
|SLn(K)| = ^î|GL„(K)|.
Par ailleurs, si g G GLn(K), les n vecteurs colonnes de g forment une base de Kn et
on obtient de la sorte une bijection de GLn(K) sur l'ensemble des bases de Kn. Comme
^Si A désigne l'anneau des adèles de Q (cf. n° 1 du § G.2), cette formule peut se réécrire sous la forme
plus frappante Vol(SLn(A)/SL(Z)) = 1.
450
ANNEXE B. VOLUME DE SL„(R)/SL„(Z)
une base de Kn est constituée d'un premier vecteur e\ non nul (qn — 1 choix), d'un
second e<i n'appartenant pas à la droite engendrée par e\ (qn — q choix), d'un troisième
ez n'appartenant pas au plan engendré par e\ et e<i (qn - q2 choix)..., il y a au total
(qn - 1) • • • (Qn ~ Qn~l) bases de Kn.
On en déduit le résultat.
Soit n ^ 2. Si A G Mn(R), et si 1 < a, /? < n, on définit (cf. alinéa 7.6.2 du Vocabulaire)
le cofacteur Ma)/?(A) comme (—l)a+/3 fois le déterminant de la matrice (n — 1) x (n — 1)
obtenue en retirant la a-ième ligne et la (3-ième colonne. En développant det A par rapport
à la a-ième ligne, on obtient
n
detA = ^rcaJMa>J(A).
3=1
Pour alléger les notations, on note G le groupe SLn(R) et F son sous-groupe SLn(Z).
Si 1 < a, /? < n, on note I(a, (3) l'ensemble {1,..., n}2 - {(a, /?)} et Ea>/3 = R1^) le R-
espace vectoriel de dimension m = n2 —1 des (^i,j)(ij)€i(a,j9)- On note 7ra))g : Mn(R) —► Ea>/3
l'application linéaire envoyant (a^i^j^n sur (<kj)(ij)£{aj3)' Comme Ma^ ne fait pas
intervenir xa^y on peut ausi voir Ma>Jg comme une fonction sur Eawg, et on note fia>/3
l'ouvert de Eatp défini par la condition Ma))g ^ 0. Si x € Qa,/?> la formule ci-dessus
pour det A montre qu'il existe Lafi(x) € G unique vérifiant Tra^(iatfi{x)) = x.
On dit que </> : G —► R+ est mesurable si (f> o unn est mesurable sur On>n, et on définit
/g <l>{9) dg par la formule /G <f>(g) dg = /^ <f> o in>n ^-.}.
Proposition B.Î.2. Si (f> : G —► R+ est mesurable, alors pour tout 7 € G, on a
/g 4>{9l) dg = /G <f>(g) dg = JG 0(70) dg. Autrement dit, dg est une mesure de Haar (i.e.
invariante) à droite et à gauche sur G.
Remarque B.1.3. Le rôle privilégié joué par le couple (nyn) peut sembler surprenant,
mais les calculs effectués (cf. n° 2 du § B.2) pour prouver que dg est invariante par
multiplication par une matrice de permutation montrent que fG <f>{g) dg = J^ <f> ° *><x£ \m^ i>
pour n'importe quel couple (a,/?), et donc que la situation est, en fait, parfaitement
symétrique.
Si <f> : G —► R+ est invariante à droite par F (i.e. si <f>(sn) = <f>(g) pour tous g e G
et 7 e T), alors fD(f>dg ne dépend pas du choix d'un domaine fondamental D de G/r
(cf. lemme B.1.5). On note fG,r(f> dg cette quantité.
On définit le volume de G/r = SLn(R)/SLn(Z) par la formule Vol(G/r) = /G/r dg.
Théorème B.1.4- Si n ^ 2, le volume de SLn(R)/SLn(Z) est fini et donné par la
formule
n
Vol(SLn(R)/SLn(Z)) = n^)-
k=2
B.l. VOLUME D'OBJETS ARITHMÉTIQUES
451
2. Intégration sur un quotient
Le lemme B.l.5 ci-dessous est une généralisation directe de ce que nous avons fait au n° 2
du § IV.3 (cf. lemme IV.3.16) pour définir l'intégration sur Rn/A, où A est un réseau de Rn.
On peut l'appliquer à G car l'intégration sur G est définie comme l'intégration sur Qn>n,
ce qui fait qu'elle vérifie bien les conditions ci-dessous. Le lemme B.l.6 et son corollaire
sont, quant à eux, des versions du th. de Fubini sur N x X.
Soit G un groupe muni d'une mesure de Haar à droite (notée dg) : on dispose des objets
suivants.
• L'espace Mes(G,R+) des fonctions mesurables positives sur G, qui est stable par
combinaisons linéaires à coefficients positifs, par (f,g) »-> inf (/,<?) et (f,g) •-> sup(/,p),
et par limite simple.
• Une intégration <f> \-* fG <f>dg de Mes(G,R+) dans R+,
qui est linéaire : fG(\i<f>i + A2<fo) dg = Ai /G <f>\ dg + A2 /G <f>2 dg, quels que soient
^,02 G Mes(G,R+) et Ai,A2 ^ 0,
vérifie le théorème de convergence monotone : /G J2iei ^ dg = J^€l fG fc dg, si I
est dénombrable et les fa appartiennent à Mes(G,R+) ,
est invariante par translation à droite : /G (f>(gj) dg = /G 4>{g) dg, quels que soient
0eMes(G,R+)et7er.
• L'espace JSf^G) des fonctions sommables (i.e. des (f> : G —* C telles que Re+(ik(f>)
appartienne à Mes(G,R+) et vérifie fGBje+(ik4) < +00, si A; G {0,1,2,3}) et d'une
intégration <f> i-> fG <f> dg de J£l{G) dans C, définie par JG<t>dg = J2^=o ^~k /g Re+(**0) dg,
qui est linéaire, invariante par translation à droite, et vérifie le théorème de convergence
dominée.
• Les notions d'ensemble mesurable, d'ensemble de mesure nulle, de fonctions nulle p.p.
définies de la manière habituelle : X C G est mesurable si sa fonction caractéristique l'est,
il est de mesure nulle s'il est mesurable et si Jx dg (défini comme étant JG lx dg) est nul,
et <f> est nulle p.p. si {g, <f>(g) ^ 0} est de mesure nulle ; on a /G (f>dg = 0 si <j> est nulle p.p.
Soit T un sous-groupe dénombrable de G. Un domaine fondamental D de G/r est un
sous-ensemble mesurable de G tel que l'on puisse écrire tout élément de G de manière
unique sous la forme g = po7> avec go G D et 7 € T. Ceci peut aussi se réécrire sous la
forme X)7€r 1d7(p) = 1, pour tout g e G, où D7 = {#07> 9o G D}. Plus généralement,
un sous-ensemble mesurable D de G est presque un domaine fondamental de G/r si
9 » E7Gr Wp) = 1 P-P-
On dit qu'une fonction <j> sur G est invariante à droite par F si (j)(gj) = <f>(g) pour tous
9 e G et 7 G T.
Lemme B.l.5. Si <f> : G —* R+ est mesurable et invariante à droite par F, alors
JD(f>dg ne dépend pas de D, si D est presque un domaine fondamental de G/r.
452
ANNEXE B. VOLUME DE SL„(R)/SL„(Z)
Démonstration. Soient Di, D2 deux sous-ensembles de G qui sont presque des domaines
fondamentaux de G/I\ En utilisant successivement :
l'identité 1 = S7Gr 1D27 PP>
le théorème de convergence monotone pour échanger somme et intégrale,
le changement de variable h = gj et l'invariance de <f> et dg par ce changement de
variable,
de nouveau le théorème de convergence monotone,
l'identité £]7Gr 1dx7-i = 1 PP->
on obtient
./D! ./G Jg T€T t€TJg
= ^2 1d21di7-i^= / (y^lDi-r1)1D2 0= / 1d2<£= / </>,
Z^Jg Jg tïr Jg Jd2
7er,/u ^ 7er '^ Jr>2
ce qui permet de conclure.
Si (f> : G —> R+ est mesurable et invariante à droite par T, on note /G/r <j> dg la quantité
fD<f>dg, où D est presque un domaine fondamental de G/r. Si <f> : G —» C est
invariante à droite par T, on dit que <j> est sommable sur G/r, si les fonctions Re+(ik<j))
sont mesurables et vérifient JG/r Re+(ik(f>) < +00, si k G {0,1,2,3}; on pose alors
/o/r 4>dg = Elo •-* Jc/r Re+(^) d9-
Lemme B.1.6. Soient T\ C T2 deuz sous-groupes dénombrables de G, et (f> : G —> R+
«ne fonction mesurable, invariante à droite par Ti.
(i) Si g G G, alors J2$es 0(#s) e **-+ ne dépend pas du choix du système S de
représentants de r2/ri dans IV
(ii) La fonction fr ,r <t> ainsi définie est invariante à droite par T2-
(iii) /G/ri 4>dg = /G/ra ( /ra/ri 0) dp.
Démonstration. Si Si,S2 sont deux systèmes de représentants de ^/lY il existe une
(unique) bijection a : Si —► S2 telle que 0(si) = a(si)-1Si G IV On a alors
si€Si 5i€Si 5i€Si s26a(Si) s26S2
ce qui démontre le (i).
Maintenant, si 7 G T2 et si Si est un système de représentants de IT^/ri, il en est
de même de S2 = {7S1, Si G Si} (en effet, si Si>s[ G Si et s'il existe 71 G Ti tel que
7s'i = 75171, alors si = S171, et donc si = Si, ce qui prouve que S2 —> r2/ri est injective;
si Y G T2, il existe si G Si tel que 7"V G SiTi, et donc 7' G 7SiFi, ce qui prouve que
B.l. VOLUME D'OBJETS ARITHMÉTIQUES
453
S2 —► T2/ri est surjective). Il en résulte que
( / <t>){9l) = £ *tow) = J2 *fo*) = ( / *)(*),
Jr^ ,l&l 526S2 JW*
ce qui démontre le (ii).
Passons à la démonstration du (iii). Soient D un domaine fondamental de G/r2 et
S un système de représentants de r2/Pi. Par définition, le membre de droite est égal à
Jd Sses ^(#5) dg, et comme dg est invariante par translation à droite par un élément de G,
il est aussi égal à /A (f>dg, où A est la réunion disjointe (car S C T2) des Ds, pour s G S.
Pour conclure, il suffit donc de prouver que A est un domaine fondamental de G/Y\. Or
53 1a(P7i) = 53 53 M0*7i)»
7ieri 7ieri ses
et comme S est un système de représentants de r2/ri, l'ensemble {571, s G S, 71 G Ti}
est égal à T2. On a donc E7lerx Eses Mfl^i) = £72Gr2 M072), et comme D est un
domaine fondamental de G/Y2, cette dernière quantité est égale à 1, pour tout g G G.
Ceci permet de conclure.
Corollaire B.l.7. Soit (f> : G —► C une fonction invariante à droite par Yl} et som-
mable sur G/Y\.
(i) La série X^es^(#5) conver9e absolument p.p., et sa somme ne dépend pas du choix
du système S de représentants de ^/Ti dans T2-
(ii) La fonction Jr2/ri 4> ainsi définie p.p. est invariante à droite par T2 et sommable
sur G/r2.
(iii) fG/Ti 4>dg = fG/V2 ( /ra/ri 4>) dg.
Démonstration. Le (iii) du lemme B.1.6 montre que fG,r2 (fr2/ri W) ^9 < +00, et
donc que Jr2/Vl \4>\ < +00 p.p., ce qui permet de démontrer la convergence absolue p.p.
de la série £sGs</>(P5)- Le reste s'en déduit en reprenant les calculs faits pour démontrer
le lemme B.1.6 et en utilisant le fait que l'on peut réarranger comme on veut une série
absolument convergente (pour démontrer les (i) et (ii)), et le théorème de convergence
dominée (pour démontrer le (iii)).
3. Un dévissage du groupe SLn(R)
Soit n ^ 2. On note :
• G7 le groupe SLn_x(R),
• T7 le sous-groupe SLn_i(Z) de G7,
• c (resp. d) le volume de G/r (resp. G7/r7) ; si n = 2, alors c7 = 1.
On cherche à prouver que c = C,{n)d. Le cor. B.l. 10 fait apparaître c7 dans une intégrale
sur G/r. Pour relier c et c7, on est amené à dévisser le groupe G de manière à faire
apparaître G7. De manière un peu plus précise, on montre que G est presque égal à
454
ANNEXE B. VOLUME DE SL„(R)/SL„(Z)
W x V x G', où W et V sont des R-espaces vectoriels naturellement isomorphes à Rn
et Rn-1 respectivement, et pour cela, on est conduit à introduire les objets suivants.
• Soit W l'espace des vecteurs colonnes à n lignes. L'application envoyant w G W sur
le n-uplet de ses coordonnées (tui,..., wn) induit un isomorphisme naturel de W sur Rn ;
on note W* l'ouvert complémentaire de Phyperplan d'équation w\ = 0. Si w G W* a pour
coordonnées Wi,..., wm on note a(w) la matrice diagonale (n — 1) x (n — 1) dont tous
les coefficients diagonaux sont des 1 sauf le dernier, qui est égal à wf*, et on note Ly/{w)
la matrice par blocs (™î a(w))> ou w' est Ie vecteur colonne de coordonnées w2,..., wn.
Comme deta(tu) = tuf1, on a deUw(w) = 1> et donc Lw(w) € G.
• Soit V l'espace des vecteurs lignes à n — 1 colonnes. L'application envoyant v G V sur
le n — 1-uplet de ses coordonnées (vi,..., vn-i) induit un isomorphisme naturel de V sur
Rn_1. On note tv l'application envoyant le vecteur ligne v G V sur la matrice par blocs
( o i,r_i ) • Un calcul immédiat montre que ty est un morphisme de groupes de V dans G
(i.e. lv(vi + v2) = tv(vi)ty(v2)).
• On note lq> '■ G7 —> G le morphisme de groupes envoyant g' € G' sur la matrice par
blocs (J5°,).
• Soit H C G l'ensemble des g € G dont les coefficients de la première colonne sont
1,0,..., 0. Si h = ( J p ), on définit 7rv(/i) e V et 7rG'(/i) G G' par 7rv(/i) = v et 7rG'(^) = gl-
On a alors h = tcC^cC^îî^vC^vC/i)) et ceci est l'unique écriture de h sous la forme
h = tG'(g,)iv(v), avec g1 € G' et v € V. De plus, ttq' : H —> G' est un morphisme de
groupes et on a 7Tv(/ii/i2) = avC^i^G'^) + 7Tv(/i2), comme on le voit sur la formule
/l«i\/lV2\ _ /l Vig'2+V2 \
{Og'JKOg'J ~ \o g'l9'2 )■
• Soit 7Tw : G —> W l'application envoyant g sur sa première colonne. L'image de G par
7rw est W - {0} et on a 7rw o tw = id sur W*. De plus, 7Tw(#i) = flwfe) si et seulement si
il existe h G H tel que g2 = g\h : en effet, si ei,..., en est la base canonique de W = Rn,
alors 7rw(pi) = fl"w(02) équivaut à g\{e\) = g2(ei)> et donc à pf^Cei) = Cii ou encore à
Pi_1p2 € H.
Si (w,v}g') G W* x V x G7, soit (p(w,v,g') = Lw(w)tG'(g')tv(v). Alors ip(w,vyg')
est la matrice par blocs (Z* v/v+a[w)g')- Comme tv(v)tG'(g') G H, cela implique que
7r^((p(w,v}g')) = 7rw(tw(ty)) = w. Réciproquement, si 7rw(p) G W», il existe un unique
triplet {w,v,g') G W* x V x G7 tel que g = <p(w,v,g'). Plus précisément,
w = ttw(p) et v = 7rv(/i), g' = 7rG'(/i), où h = (tw(7rw(p)))_1p.
En résumé, (p induit une bijection de W* x V x G7 (qui est presque égal à W x V x G7) sur
l'ensemble G* = 7r^(W*) des p G G dont le premier coefficient est non nul (cet ensemble
est presque égal à G).
La formule du changement de variable fournit, après un calcul sans grand mystère, mais
un peu désagréable à rédiger (cf. n° 3 du § B.2), le résultat suivant, où dw (resp. dv) est la
B.l. VOLUME D'OBJETS ARITHMÉTIQUES
455
mesure de Lebesgue dw\ • • • dwn (resp. dv\ • • • dvn-\) sur W (resp. V) et dg' est la mesure
sur G7 = SLn_!(R) de la prop. B.l.2 (en remplaçant n par n — 1).
Lemme B.l.8. Si <f> : G —► R+ est mesurable, alors
<f>dg = I <f>o(p dwdv dg'.
JG JW.xRn-ixG'
4. Intégration sur Rn et sur SLn(R)/SLn(Z)
On note A le sous-groupe de V des vecteurs à coordonnées dans Z ; c'est un réseau
de V. On note 0 l'ensemble des éléments de H à coordonnées entières. C'est un sous-
groupe de H, et c'est aussi l'ensemble des h G H tels que 7Ty(h) G A et 7Tg'(/i) G V.
Soient D7 et D" des domaines fondamentaux de G'/V et V/A respectivement. On a
fD„ dv = 1 (on peut prendre D77 = [0, l[n_1) et /D, dg' = d par définition de d.
Lemme B.l.9. Soit <f> : Rn —► R+ une fonction mesurable, invariante à droite par 0.
Alors
S <f>dg= f (/ <f>)dg.
^(w*xd"xd') JG/r Jr/e
Démonstration. D'après le lemme B.1.6, le membre de droite est égal à fG/Q<f>dg> et il
suffit donc de vérifier que A0 = y?(W* x D" x D7) est presque un domaine fondamental
de G/0. On va montrer, plus précisément, que A0 est un domaine fondamental de G*/0.
Il s'agit donc de prouver que tout élément g de G* peut s'écrire, de manière unique,
sous la forme g = Ly/{lWo)f>G'(gb)t'v(vo)0, avec w0 G W*, g'0 G D7, v0 G D77 et 0 G 0. En
appliquant 7Tw à l'égalité ci-dessus, on voit que l'on doit avoir wq = 7Tw(p), et on peut
alors écrire g sous la forme Lyj(wo)h> avec h G H. Comme D7 est un domaine
fondamental de G7/r7, il existe gf0 G D7 et 7 G T7, uniques, tels que 7Tg'(/i) = g'o^y. On a alors
h = t<G'(gb)t<v(v)LG'(l), où v G V est déterminé de manière unique. Comme D77 est un
domaine fondamental de V/A, il existe v0 € D77 et v G A, uniques, tels que v = v0 + v.
On a alors g = Ly/(wo)i<G'(gb)i<v(vo)0, avec 6 = lv{v)lg'{i) G 0. Ceci prouve l'existence
d'une décomposition de g sous la forme souhaitée. L'unicité se démontre en reprenant les
arguments ci-dessus et en utilisant l'unicité des décompositions à chacune des étapes.
Corollaire B.l. 10. (i) Si <f> : W —► R+ est mesurable, alors
ë I <f>dw = / ( / <f>oiryj)dg.
Jw JG/r Jr/e
(ii) Si <f> : W —► R+ est sommable, alors fr,Q<f>o 7rw est sommable sur G/T et
d I <f)dw= / ( / 0O7TW)rfp-
7w JG/r Jr/e
456
ANNEXE B. VOLUME DE SL„(R)/SLH(Z)
Démonstration. Le (ii) se déduit formellement du (i). Comme (f> o nw est invariante
à droite par H, et donc par 0, le membre de droite est, d'après le lemme B.1.9, égal à
/ rw.xD'xD") <i>°7Ç^fdg. Le lemme B.1.8 permet alors d'écrire cette dernière quantité sous
la forme /w xD/xD// <t>°?rw o(p dw dv dx'. Comme 7rw ° <p(w, v, x') = w, on peut écrire cette
intégrale triple sous la forme du produit de fw(f>dw, fD„ dv = 1 et fD,dx' = c7, ce qui
permet de conclure.
5. Apparition de £(n) et fin du calcul
Si p G G, les colonnes de p forment une base de W sur R; le sous-groupe Ag qu'elles
engendrent est donc un réseau de W. De plus, comme detp = 1, le réseau Ag est de
volume 1.
Réciproquement, si A est un réseau de W de volume 1, et si Vi,..., vn est une base de A
sur Z, orientée (i.e. det(vi,..., vn) > 0), alors la matrice g dont les colonnes sont Vi,... ,vn
est un élément de G tel que Ag = A ; il en résulte que g i-> Ag induit une surjection de G
sur l'ensemble des réseaux de W de volume 1.
Maintenant, A9l = A^ si et seulement si on peut écrire les colonnes de p2 (resp. pi)
comme des combinaisons linéaires à coefficients entiers des colonnes de pi (resp. p2).
Traduit en termes matriciels cela équivaut à l'existence de matrices A, B G Mn(Z) telles que
P2 = PiA et pi = p2B. Alors B = A-1 et, A G T puisque pi et p2 ont pour
déterminant 1. Il résulte de cette discussion que l'application p i-> Ag induit une bijection de G/r
sur l'ensemble des réseaux de volume 1 de Rn (autrement dit, G/r peut être vu comme
Vensemble des réseaux rfeW = Rn de volume 1).
Si A est un réseau de W, un élément A non nul de A est dit primitif si on ne peut pas
l'écrire sous la forme a • A7, avec a G N et A7 G A. Si vi,..., vn est une base de A sur Z, et
si A = ai^i H 1- anvn, alors A est primitif si et seulement si les ai sont premiers entre
eux dans leur ensemble. Dans le cas général, si a = pgcd(ai,... ,an), alors A = a\' où A7
est primitif. Il en résulte que, si l'on note A7 l'ensemble des éléments primitifs de A, alors
A — {0} est la réunion disjointes des aA7, pour a G N — {0}.
Maintenant, si 7 G T, alors 7Tw(p7) est une combinaison linéaire, à coefficients entiers
premiers entre eux des colonnes de p ; c'est donc un élément primitif du réseau Ag. Par
ailleurs, il résulte de l'ex. 10.16 (appliqué à la transposée des matrices considérées) que
si pgcd(ai,.. .,an) = 1, alors il existe 7 G T dont la première ligne est (ai,...,an). Il
en résulte que l'application 7 i-> 7Tw(p7) induit une surjection de F sur l'ensemble A^
des éléments primitifs de A5, et donc une bijection de T/9 sur A^ (car 6 = T n H et
^wGh) = TTwfe) si et seulement si pf xp2 G H).
La discussion précédente permet de réécrire le cor. B.1.10 sous la forme
c7 / 4>(w)dw = [ ( Y, <t>W)dg-
B.l. VOLUME D'OBJETS ARITHMÉTIQUES
457
Le facteur £(n) apparaît quand on passe de A^ à Ag. Pour effectuer ce passage, on utilise
la formule de changement de variable (pour a e R+),
/ <f>(aw)dw = a~n / (j>(w)dw,
ce qui nous donne, en sommant sur a e N — {0},
Ç(n)c' / <f>(w)dw = d V] / <f>(aw)dw
Jw û=17w
+00 „ »
= EL(E^))*=L( E *wh-
a=lJG/r AeAj, JG/r A€A,,-{0}
D'après le lemme de Minkowski (th. B.l. 12), un convexe de W, de volume ^ 2n,
symétrique par rapport à l'origine, contient un élément non nul de tout réseau de W
de volume 1. Si on prend pour <f> la fonction caractéristique d'un tel convexe, alors
Z)a6A<,-{0} &W ^ * Quel <ïue soit P ^ G ; on en déduit l'inégalité c = /G/r dg < 2nC,(n)d ;
en particulier, c est fini.
Maintenant, si (f> est une fonction de Schwartz sur W = Rn, et si <j> désigne la transformée
de Fourier de <f>, on dispose de la formule de Poisson (th. IV.3.19, où l'on pose g* = tg~l
(cf. lemme IV.3.13) ; le volume de Ag n'apparaît pas car il est égal à 1) :
£ tf A) = £ $(X).
AeA9 AeAg*
Ceci nous donne, en utilisant le fait que <f>(0) = /w <j)(w) dw> puis en utilisant la formule
de Poisson, et enfin en appliquant la première identité (2) à 0 au lieu de </>,
C(n)c'£(0) + c<#0)= / (j2<t>W)dg
G/r XA€A,
= / ( E ^A))^ = CW4(0) + c J(0).
(2^Cela demande de vérifier que JG/r </>(#*) dg = fG/r(<f>(g)) dg. Pour cela, notons <p : G -» G le difféomor-
phisme g h-> cp(g) = g* ; notons que <p(hg) = <p(h)(p(g), pour tous g, h G G. La formule du changement
de variable nous fournit une fonction continue J : G -» R+ telle que fG<f>dg = fG(<f> o (p) 3dg. Si h G G,
l'invariance de dg par translation à gauche nous donne
/ <f>(<p(hg))3(hg)dg = f <f>(<p(g))3(g)dg = [ ct>{g)dg = f 4>(<p(h)g) dg = [ <K<p{h)<p{g))3{g)dg,
Jg Jg Jg Jg Jg
pour tout h e G et toute <\> sommable. Comme <p(hg) = <p(h)cp(g), il s'ensuit que 3(hg) = 3(g) pour
tous h, g e G, et donc J est constante. Comme (p o (p = id, on en déduit que J2 = 1, et donc que
Jg^(^*)^ = /g(^))^» P°ur toute ^ sommable sur G. Pour conclure, il suffit de remarquer que
<p(T) = T et <p(gi) = <p{g)ip{l) si g e G et 7 G T, ce qui fait que <p transforme un domaine fondamental
de G/r en un domaine fondamental de G/r.
458
ANNEXE B. VOLUME DE SL„(R)/SLn(Z)
Cette formule étant valable quel que soit <f>, la formule d'inversion de Fourier 0(0) = </>(0)
nous permet d'obtenir l'égalité
c = C(n)c'
que l'on cherchait à démontrer.
Remarque B.l.ll. Comme Ç,{n)d = c = Vol(G/r), on a démontré en passant la
formule
h{w)dw = v^crn ( £ #*))*•
jw Voi(G/r) jG/r vA6^{0} /
Autrement dit, l'intégrale sur Rn d'une fonction <f> est la moyenne sur l'ensemble des
réseaux de volume 1 de la somme des valeurs de <f> en les points non nuls du réseau.
6. Le lemme de Minkowski
Le résultat qui suit est d'une utilité assez incroyable en théorie des nombres.
Théorème B.1.12. (Lemme de Minkowski) Soit K C Rm un convexe compact,
symétrique par rapport à l'origine. Si Vol(K) ^ 2m, alors K contient un point de Zm distinct
de l'origine.
Démonstration. Supposons le contraire. Si n G Zm, soit X„ = {n + |, v € K}.
Alors Xni et X„2 sont disjoints si ni ^ n2 : en effet, sinon il existe vi,v2 € K tels que
ni + ^ = n2 + *ff, ce qui peut se réécrire sous la forme \{v2 — V\) = ni — n2, et —V\ G K
puisque K est symétrique par rapport à l'origine, ce qui fait que ni — n2 € K puisque K
est convexe. Il en résulte que le volume de la réunion Kn des X„, pour n = (ni,... ,nm)
vérifiant sup |n<| < N, est égal à (2N + l)m^S^, puisque chacun des X„ a pour volume
v<y, qu'il y a (2N + l)m tels X„, et que les X„ sont disjoints deux à deux. Par ailleurs,
K étant compact, il existe C > 0 tel que K soit inclus dans [—2C, 2C]m. Ceci implique que
KN C [-N - C, N + C]m, et donc que Vol(KN) ^ (2N + 2C)m, pour tout N € N.
• Si Vol(K) > 2m, on obtient, si N est assez grand, une contradiction avec la formule
VoI(Kn) = (2N + l)mV(ff\ ce qui permet de conclure dans ce cas.
• Si Vol(K) = 2m, il suffit d'appliquer ce qui précède à Phomothétique AK de K,
pour A > 1 suffisamment petit (en effet, comme K est compact, la distance de K à
Zm — {(0,...,0)} est strictement positive, et donc AK ne contient aucun élément de
Zm - {(0,..., 0)}, si A > 1 est assez petit).
Ceci permet de conclure.
B.2. La mesure de Haar de SLn(R)
Nous allons vérifier que la mesure dg de la prop. B.1.2 est bien une mesure de Haar
à droite et à gauche. L'invariance à gauche de dg se déduit de son invariance à droite
en passant à la transposée. Il suffit donc de vérifier son invariance à droite et, comme
B.2. LA MESURE DE HAAR DE SL„(R)
459
l'ensemble des 7 G G vérifiant JG(f>(gj)dg = jG<f>{g)dg, pour tout <f> : G —► R+, est
un sous-groupe de G, il suffit de vérifier que c'est le cas pour un ensemble de 7
engendrant G. Le lemme B.2.4 ci-dessous fournit un système de générateurs particulièrement
sympathiques.
1. Transvections et structure du groupe SLn(K)
Soit K un corps commutatif. Une transvection T est un élément de Mn(K) avec des 1 sur
la diagonale, et un unique coefficient non nul en dehors de la diagonale. Si ce coefficient
est celui de la i-ième ligne et de la j-ième colonne (avec i ^ j), alors T = 1 + AN^j,
où Nfj est la matrice dont tous les coefficients sont nuls sauf celui de la i-ième ligne et
de la j-ième colonne, qui est égal à 1. Comme Nfj = 0, on a T-1 = 1 — XNitj, et donc
l'inverse d'une transvection est une transvection. Le déterminant d'une transvection est
égal à 1 puisqu'une transvection est triangulaire supérieure ou inférieure, avec des 1 sur la
diagonale ; c'est donc un élément de SLn(K). Le résultat suivant, selon lequel tout élément
de SLn(K) est un produit d'un nombre fini de transvections, est très utile pour toutes
sortes de questions.
Théorème B.2.1. Sin^2, les transvections engendrent SLn(K).
Démonstration. La démonstration se fait par récurrence sur n. Pour n = 2, cela résulte
du lemme suivant.
Lemme B.2.2. Si K est un corps, et si A € SL2(K), il existe t,x,y,z G K tels que
/'on ait A=(JÏ)(JT)(}ï)(Jî).
Démonstration. On part de la formule ( J f ) ( J ? ) ( J f ) = ( 1+*y X\%T ). On en déduit
que siA= (£ J) e SL2(K) vérifie c ^ 0, alors A est le produit des 3 matrices ci-dessus,
avec y = c, x = c~1(a — 1) et z = c~1(d — 1) et on peut prendre t = 0. Si c = 0, il suffit
de multiplier A par une matrice de la forme (}?) =(itî), pour obtenir une nouvelle
matrice qui peut s'écrire comme produit de 3 matrices comme ci-dessus. Ceci permet de
conclure.
Lemme B.2.3. Soit n ^ 3.
(i) Une matrice de la forme
(l 0 0 Ai \
0 •• 0
0 0 1 An_x
\0 0 0 1 )
est un produit de transvections.
(ii) Une matrice diagonale Diag(l,..., 1, A, A-1), avec A 6 K*, est un produit de
transvections.
V(\l,...J\n_1) =
ou H(Ai,...,An_i) =
/l 0 0 0\
0 ••. 0 0
0 0 10
\Xi ... An_! 1/
460
ANNEXE B. VOLUME DE SL„(R)/SL„(Z)
Démonstration. Le (i) se démontre en constatant que
n-l n-1
V(A1,...,An_1) = JJCl + AA.n) et H(A1,...,An_1) = JJ(l + AiNn>i).
Le (ii) se démontre en écrivant, ce qui est possible d'après le lemme B.2.2, la matrice
(AqX JJ) comme un produit de transvections dans SL2(K), et en complétant toutes les
matrices ainsi obtenue par des 1 sur la diagonale et des 0 ailleurs pour en faire des
éléments de SLn(K).
Revenons à la démonstration du théorème. On suppose le résultat vérifié pour n — 1, et
on cherche à le prouver pour n. Pour cela, il suffit de montrer qu'en partant d'une matrice
quelconque M de SLn(K), et en la multipliant à droite par des transvections Ti,... ,Tm
bien choisies, on peut obtenir une matrice qui est un produit de transvections TJ • • • TJ. : en
effet, on a alors M = T[ • • • Tj-Tm1 • • • Tf1, et les ly1 étant des transvections cela fournit
une écriture de M sous la forme voulue.
Comme M est inversible, ses colonnes wi,..., wn forment une famille génératrice de Kn,
et il existe Ai,..., An € K tels que Aitui H h Xnwn = *((),..., 0,1). Il y a deux cas :
• Ai = ••• = An_i = 0, auquel cas M est, par blocs, de la forme (JjJ), où
Pi e GLn_i(K), A € K* et v\ G Kn_1 (et 0 désigne le vecteur colonne à n — 1 lignes
dont toutes les coordonnées sont nulles). Multiplier à droite M par Diag(l,..., 1, A, A-1)
qui, d'après le lemme B.2.3, est aussi un produit de transvections, fournit une matrice
(par blocs) M2 de la forme (^2 J), où P2 G SLn_i(K) (car le déterminant de M2 est égal
à 1) et v e Kn~\
• Il existe i ^ n— 1 tel que Xi ^ 0. Multiplier M à droite par (l+^ziNn>i)V(Ai,..., An_i)
qui, d'après le lemme B.2.3, est un produit de transvections, fournit une matrice M2 dont
la dernière colonne est v = XiW\ H h Xi(wi + ^^wn) + An_iu;n_i + wn = *(0,..., 0,1),
et donc est de la forme (^2 J) comme ci-dessus.
Maintenant, si on note Vi la i-ième ligne de P2, les Vi forment une base de Kn_1 et il existe
Ai,..., An_i e K (uniques) tels que v + Ai^i H 1- An_ivn_i = 0. Multiplier à gauche M2
par H(Ai,..., An_i) qui, d'après le lemme B.2.3, est un produit de transvections, fournit
donc une matrice (par blocs) M3 de la forme (^3 J), où P3 = P2 e SLn_i(K).
Il ne reste plus qu'à appliquer l'hypothèse de récurrence pour écrire P3 comme un
produit de transvections dans SLn_i(K), et compléter toutes les matrices ainsi obtenues
par un 1 sur la diagonale et des 0 ailleurs pour en faire des éléments de SLn(K). On
obtient de cette manière une écriture de M3 comme un produit de transvections, ce qui
permet de conclure.
Notons ei,... ,en la base canonique de Kn. Soit W l'ensemble des matrices des endo-
morphismes w de Rn tels qu'il existe une permutation a e Sn et £1,... ,en G {±1} tels
que w(ei) = £iea^). Alors W est un groupe et le déterminant d'un élément de w est ±1.
On note W+ l'intersection de W et SLn(K).
B.2. LA MESURE DE HAAR DE SL„(R)
461
Un élément de w permute les axes de coordonnées Ke», pour % G {l,...,n}, ce qui
nous fournit un morphisme surjectif de W sur Sn dont le noyau est le groupe des matrices
diagonales dont les coefficients diagonaux sont des 1 ou des — 1. La restriction de ce
morphisme à W+ est encore surjective : si a G Sn est de signature e G {±1}, alors la
matrice de l'application linéaire envoyant e\ sur eea{\) et e* sur e^i), si i ^ 1, est un
élément de W+ dont l'image dans Sn est a.
Lemme B.2.4- SLn(K) est engendré par W+ et les 1 + ANi^, pour A G K.
Démonstration. Soient i ^ j deux éléments de {1,..., n} et a G Sn tel que a(l) = i et
<r(2) = j. Soit w G W+ dont l'image dans Sn est a de telle sorte qu'il existe ei,e2 G {±1}
tels que w(e\) = £\ei et wfa) = e^ej. Notons Uij l'endomorphisme de Kn dont la matrice
est Njj ; on a donc Uij(ej) = e* et uiyj(ek) = 0, si k ^ j. On en déduit que wuit2W~1(ek) = 0
si k ^ j car w~l(ek) = ±ea-i^ et a~l(k) ^ 2, et wuit2W~1(ej) = e\£2&%- Il en résulte que
toNi^to-1 = £i^2^ij et w(l + ANi^Jty-1 = l + e^ANij. Il s'ensuit que le sous-groupe de
SLn(K) engendré par W+ et les 1 + ANi)2, pour A G K, contient toutes les transvections
et comme celles-ci engendrent SLn(K), cela permet de conclure.
2. Invariance de dg par translation
D'après le lemme B.2.4, pour prouver que dg est invariante à droite, on peut se contenter
de vérifier que $G<t>{gi)dg = JG(j)(g)dg pour tout <f> : G —> R+, pour 7 G W+, et pour
7=1 + AN1>2.
• Si 7 G W+, on peut l'écrire sous la forme Diag(£j)Aa, où les e< sont des éléments
de {±1}, a G Sn et Aa est la matrice (ûij)i<tj<ni avec aitj = 0 si i ^ a(j) et a^i = 1.
Multiplier à droite une matrice par Diag(£i) revient à multiplier la i-ème colonne par e^ et
multiplier à droite une matrice par Aa revient à permuter les colonnes : la i-ième colonne
de BAa est la cr(i)-ième colonne de B. On en déduit que Mn>n(B7) = ±Mn>(r(n)(B).
Soit Qn = nf=1On)i. D'après le lemme B.2.5 ci-dessous, fin>n — fin est de mesure nulle
et donc fG<f>(g)dg=L éo
t>n,n dx. Par ailleurs, g *—> g^y induit une bijection de tn,i{^n,i)
sur tn,a(i)(^n,a(t)), et donc (p(x) = 7rn>n(in)n(rc)7) est un difféomorphisme de f2n sur On, le
difféomorphisme inverse étant ip(x) = 7rn>n(6n>n(rc)7_1). On a alors
|A(iJ)î*(n,n)(#0*Q)»J|
/ <K9i)d9 = f m*)) ry^l = / m I
Jg -/«„ Mn>n(a;) JQn
Or
A(W(n,n) (#0*0 )tj = _|_A(iJ)^(n,n)^i,aO)
Mnjj>(x)) Mn>a(n)(x) '
et la relation (on l'obtient en différenciant la relation det A = 1, et en utilisant le fait que
det A est linéaire en xa^ avec comme coefficient le cofacteur correspondant)
dXn>n = M~TÂ J2 M«AX) dx«,(3
Mn'nW (a,/?)*n,n)
462
ANNEXE B. VOLUME DE SLn(R)/SL„(Z)
montre que
A{iJ)ï(n,n)dXjta(j) = ±A(i,j)^(n,n)dXij
M^(„)(x) Mn>n(a;) '
et donc que /0 <t>{91) dg = fQn 4>{x) \^^-\ = /G m dg.
• Si 7 = 1 + ANi^, les colonnes de B7 sont les mêmes que celles de B sauf la seconde qui
est obtenue en rajoutant A fois la première colonne de B à la seconde. Il s'ensuit que <p(x) =
Kntn{t<n,n(x)'Y) est un difféomorphisme de Qn>n sur Qn>n d'inverse ip{x) = irn,n(hi,n(x),y~1)y
et que l'on a Mn>n(^(x)) = Mn>n(rc) et A«j)^(n,n)(#(x))<j = \i,j)^{n,n)dxi%j. On en déduit
l'égalité /G </>(p7) dg = fG <j>(g) dg qui permet de conclure.
Lemme B.2.5. Si P G R[Xi,... ,Xm] est non nul, et si Z = {x e Rm, P(rc) = 0},
alors Z est de mesure nulle.
Démonstration. La démonstration se fait par récurrence sur m, le résultat étant
immédiat pour m = 1 puisqu'un polynôme non nul n'a qu'un nombre fini de zéros. Supposons
donc m ^ 2, et écrivons P(X) sous la forme S<=o Q»W^î»> avec Q* e R[Xi,... ,Xm_i],
et Qd ¥" 0. L'ensemble Y = {y G Rm-1, Qd(y) = 0} est alors de mesure nulle d'après
l'hypothèse de récurrence, et si y £ Y, la fonction xn i-> lz(y, xn) est nulle p.p. puisqu'un
polynôme non nul n'a qu'un nombre fini de zéros. Il en résulte que A(Z), qui est égal à
/ lz+ / lz= / ( / lz(y,xn)dy)dxn+ / ( / lz(y,xn)dxn) dyy
JYxB. J(Rm-1-Y)xK JK JY «/R"*-i-Y JR
est nul puisque fylz(y,xn)dy < A(Y) = 0, et que /Rlz(2/, xn)dxn = 0 pour tout
y e Rm_1 — Y. Ceci permet de conclure.
3. De SLn_x(R) à SLn(R)
Ce n°est consacré à la démonstration de la formule du changement de variable du
lemme B.1.8. Notons îîj^jjn-1 l'ouvert de R(n_1> -1 défini par la non annulation du co-
facteur MJl_ln_1 obtenu en retirant la (n — l)-ième ligne et la (n — l)-ième colonne d'une
matrice (n — 1) x (n — 1). Par définition de /G,, le membre de droite de l'identité à
vérifier est aussi égal à fTIvn„_iv0' <f> o (p o t! ^dvd9>., où l'(w}v,x') = (w,v,g') et
uxl1 xiin—l,n—1 I n— l,n—il
g' = i'n-\yn-\{x') est l'unique élément de G' s'envoyant sur x' en retirant la coordonnée
sur la (n — l)-ième ligne et la (n — l)-ième colonne.
Maintenant (p = itn<n o cp o l\ induit un difféomorphisme de U x Rn_1 x Çl'n_ltn_i sur
l'ouvert X = {x e On,n, xïfi ^ 0} de En>n, d'inverse x i-> (w(x))v(x)Jg'(x))) avec
w(x) = 7rwoinin(x), v(x) = 7rv(/i(rc)) et g'(x) = 7rG'(/i(x)), où h(x) = 6w(^(^))_1^n,nW-
Or On>n — X est de.mesure nulle puisque inclus dans un hyperplan; il en résulte que
fG<f>dg est aussi égal à /x <f> o tntn *£ m La formule du changement de variable montre que
cette dernière quantité est aussi égale à /UxR«-ixîy <t> ° ^n,n ° $ %j^JJt > et cornme
B.2. LA MESURE DE HAAR DE SL„(R)
463
Ln,n0<P = i<n,n ° ^n,n o ip o l' = <p o l', puisque tn,n o 7rn)n est l'identité sur irn*n(Çlnin), le
lemme B.2.6 ci-dessous permet de conclure.
Lemme B.2.6. (i) Mn^n{(p{w,vyx')) = wiM'^^^x').
(ii) |J^(w,v,x')l = \wi\.
Démonstration. Soient w" le vecteur colonne de coordonnées w<z,..., wn-i> v" le vecteur
ligne de coordonnées Vi,... ,vn-2 et g" la matrice (n — 2) x (n — 2) obtenue en retirant
la dernière ligne et la dernière colonne de tn-i.n-iM- Alors y[nyn{(p(w,v,x')) est le
déterminant de la matrice par blocs (™h w™$+gn). On ne ne change pas ce déterminant en
retirant Vi fois la première colonne à la (i + l)-ième, et ce déterminant est donc aussi
celui de (|J?/ j?/), c'est-à-dire widetg". Comme detg" = MJ^^^rc'), par définition, cela
démontre le (i).
Pour démontrer le (ii), on part de la formule
/\ d((p(w,v,x')iij) = ±3<f>(w,v,x') /\ dwi f\ dvj /\ dx\à.
(ij)ï(n,n) l<i<n l^j^n-1 (itj)^(n-l,n-l)
Comme <p(w,v,x') = (w' w'v+aiw)/,',^! ..^(x'))' on a
• d(<p(w,v}x')iti) = dwi, si 1 < i < n
• d{(p{w,v^x')\tj) = widvj-i + terme en dwi, sil<j<n-l,
• d((f(w}v1x')itj) = dx^ ._! + combinaison linéaire des dwi et des dvj} si 2 ^ i < n — 1
et 2 < j < n,
• d(<£(w,v,a/)nj) = W\ldx'n_lj_l+ combinaison linéaire des dwi et des dvj, si 2 < j < n—1.
Il en résulte, en utilisant le fait que A est multilincaire alterne, que
f\ d(<p(w,v,x')iij)=± /\ dwi /\ (widvj) /\ dx'ij /\ {w^xdx'n_ltj)
(i,j)jL(n,n) l<i<n l^j^n-1 Ki<n-2, l<j<n-l l^j^n-2
= ±Wi f\ dWi f\ dVj /\ dx^.
l^i^n l<j'<n-l (ij)9É(n-l,n-l)
Ceci permet de conclure.
ANNEXE C
GROUPES FINIS ET REPRÉSENTATIONS :
EXEMPLES
Cette annexe vise à illustrer l'intérêt de l'induction pour l'étude des représentations
d'un groupe fini. On s'intéresse à trois séries de groupes : les groupes de cardinal une
puissance de p, le groupe symétrique Sn dont les représentations jouent un rôle important
en physique théorique, et le groupe GL2(F), où F est un corps fini. Ce dernier cas permet
de passer en revue les principaux résultats de la théorie exposée au chap. I.
Cl. p-Groupes
1. Généralités sur les p-groupes
Soit p un nombre premier. Un p-groupe est un groupe d'ordre une puissance de p.
Proposition C.l.l. (i) Si G ^ {1} est un p-groupe, le centre de G est non trivial.
(h) Si G est un p-groupe non commutatif, alors G contient un sous-groupe commutatif
distingué contenant strictement le centre de G.
Démonstration. (i) On fait agir G sur lui même par conjugaison. Les orbites sont
alors les classes de conjugaison et le centre Z est l'ensemble des c G G dont la classe
de conjugaison est réduite à un point. On sait que Z contient l'élément neutre, et notre
problème est de montrer qu'il existe d'autres classes de conjugaison réduites à un point.
Maintenant, si O est une classe de conjugaison, et si x G O, alors O = G/Zx, où Zx est
l'ensemble des éléments de G commutant à x; on a alors |0| = 44, ce qui prouve que
|0| est une puissance de p; en particulier, |0| est divisible par p sauf si |0| = 1. Comme
|G| est divisible par p, et est aussi la somme des cardinaux des orbites, on en déduit que
l'ensemble des orbites réduites à un point a un cardinal divisible par p. Autrement dit,
|Z| est divisible par p, et comme |Z| ^ 1, on a |Z| ^ p, ce qui démontre le (i).
(ii) Supposons maintenant G non commutatif (et donc G ^ Z), et soit H = G/Z. Alors
H est un p-groupe, et son centre Y est non trivial. Soit y un élément du centre de H
distinct de l'élément neutre, soit (y) le sous-groupe de Y engendré par y, et soit A l'image
inverse de (y) dans G. Comme {y) est distingué (car central) dans H, cela implique que A
466 ANNEXE C. GROUPES FINIS ET REPRÉSENTATIONS : EXEMPLES
est un sous-groupe distingué de G, et comme A contient strictement Z, il suffit de vérifier
que A est commutatif. Soit a l'ordre de y> et soit y G A ayant pour image y dans H. Alors
les éléments de {y} sont les y1, avec 0 < z < a — 1, et tout élément de A peut s'écrire sous
la forme y%z, avec 0 < % < a — 1 et z G Z. Si x\ = ynz\ et x2 = yi2z2, on a, en tenant
compte du fait que les éléments de Z commutent à tout,
xix2 = yilz1yi2z2 = ffl0ziZ2 = yil+i2z2zi = yi2z2yilzx = x2xu
ce qui permet de conclure.
2. Représentations des p-groupes
Remarque Cl.2. Soit G un groupe fini. Si A est un sous-groupe distingué de G, si W
est une représentation de A, et si g G G, on peut fabriquer une représentation W5 de A
en posant pv/g(a) = Pw(p-1ûp)> ce qui a un sens puisque g~lag G A si a G A et g G G,
par définition d'un sous-groupe distingué. Il est immédiat que Ws est irréductible si et
seulement si W l'est, et on obtient de la sorte une action (g,x) •-* X9 de G sur Irr(A).
[Si x € Irr(A) est un caractère irréductible, on a xg{a) = x(9~1(l9)-\
Proposition Cl.3. Soit G un groupe fini, et soit A un sous-groupe distingué de G.
Si V est une représentation irréductible de G dont la restriction Res^ V à A n'est pas
isotypique, il existe un sous-groupe H de G contenant A et strictement inclus dans G, et
une représentation irréductible W de H, tels que V = Indjjj W.
Démonstration. Décomposons Resg V en la somme directe ©xgxVx, avec X C Irr(A),
de ses composantes isotypiques. Par hypothèse, on a |X| ^ 2. Si x € X, si g G G, et si
a G A, on a a • (g ■ Vx) = g • (g~lag • Vx), ce qui prouve que g • Vx est stable par a, et
que pg.yx(a) = Pvx(g~1ag). On en déduit que g envoie la composante isotypique Vx sur
la composante isotypique Vx.9, et donc permute les éléments de X.
Soit xo ^ X, et soient W la composante isotypique de ResQ V correspondant à xo, et
H C G le stabilisateur de Xo- Alors W est stable par H et peut donc être considérée
comme une représentation de H. Maintenant J2geG 0 • W = ®56G/hVx9 est stable par G,
et donc est égal à V puisqu'on a supposé V irréductible. On en déduit que X = G/H,
et donc que H ^ G, et que V et Ind^ W ont même dimension |X| • dim W. Par ailleurs,
Homn(W, V) est non nul, et donc Homc(IndS W, V) est aussi non nul (ex. 1.3.17). Comme
V est irréductible, et comme Indjjj W et V ont même dimension, tout élément non nul de
Homc(IndH W,V) induit un isomorphisme de Ind§ W sur V. Ceci permet de conclure.
Proposition Cl.4- Si G est un p-groupe, et si V est une représentation irréductible
de G, il existe un sous-groupe E de G et un caractère linéaire x G H, tels que V = Ind^ X-
Démonstration. La démonstration se fait par récurrence sur |G|. Si G est commutatif,
alors toute représentation irréductible est de dimension 1, et il n'y a rien à démontrer.
Supposons donc G non commutatif, et soit V une représentation irréductible de G.
C.2. REPRÉSENTATIONS DU GROUPE SYMÉTRIQUE Sn
467
• Si le noyau N de py est non trivial, alors py se factorise à travers G' = G/N, et
on peut appliquer l'hypothèse de récurrence à G7 : il existe H' C G' et x € H' tel que
V = Ind^'x) en tant Que représentation de G7. Si H est l'image inverse de H7.dans G, on
peut voir x comme un élément de H en composant avec la projection H —► H7, et on a
V = Ind^X) ce qui permet de conclure dans ce cas.
• Si le noyau de py est trivial, considérons un sous-groupe commutatif A de G, distingué,
et non contenu dans le centre de G (cf. (ii) de la prop. C. 1.1). En particulier, il existe o€Â
et g G G, avec ag ^ ga, et comme le noyau de py est trivial, on a py(a)py(g) ^ pv(g)py(a).
Ceci implique que py(a) n'est pas une homothétie et, A étant commutatif, que Rcsq V
n'est pas isotypique. On en déduit, en utilisant la prop. C.1.3, l'existence d'un sous-groupe
H de G, contenant A et distinct de G, et d'une représentation irréductible W de H, tels
que V = Ind^W. L'hypothèse de récurrence appliquée à H nous fournit un sous-groupe
H7 de H et x ^ H7, tels que W = IndïJ, x- On conclut en remarquant que
V = Indg(Ind3,x) = Ind£,x.
Exercice Ci.5. Soient p un nombre premier et G un groupe non commutatif d'ordre p3. Montrer que
Gap2 représentations irréductibles de dimension 1 et p — 1 de dimension p.
C.2. Représentations du groupe symétrique Sn
La théorie des représentations de Sn fait intervenir une combinatoire assez amusante,
qui est loin d'être triviale. Nous nous contenterons de décrire les résultats, et de renvoyer
le lecteur à des ouvrages plus spécialisés (comme le livre de Fulton et Harris cité dans
l'introduction) pour les démonstrations (qu'il peut aussi voir comme une série de défis...).
1. Partitions de n et représentations de Sn
Soit n un entier ^ 1. Une partition t = (ii,... ,4) de n est une décomposition de n
sous la forme n = l\ H \-êry avec i\ ^ l<i ^ • • • ^ lr ^ 1. Le nombre de partitions M de
n est traditionnellement noté p(n). Par exemple, les partitions de 1, 2, 3, 4, 5 et 6 sont
données par
W L'étude de la fonction p{n) a donné lieu à de nombreux travaux ; la plupart ont pour point de départ
la formule
+oo +oo 1
£*>(«>?" = II ot
n=l £=1
qui se démontre en remarquant que y4p = J^jT**, et en développant brutalement le second membre.
Cette formule fait intervenir l'inverse de la fonction r\ de Dedekind définie par rj(q) = q1/24 n^i (1 ~ Q£)>
avec q = e2in z et z variant dans le demi-plan de Poincaré. En utilisant les propriétés de la fonction 77,
qui se trouve être une forme modulaire de poids | (prob. H. 11), on peut par exemple obtenir l'équivalent
asymptotique p(ri) ~ z^e7r^2n/^35 ce Quî montre que p(ri) croît assez vite avec n.
468
ANNEXE C. GROUPES FINIS ET REPRÉSENTATIONS : EXEMPLES
6
5 + 1
4 + 2
4 + 1 + 1
3 + 3
3 + 2+1
3+1+1+1
2 + 2 + 2
2+2+1+1
2+1+1+1+1
1+1+1+1+1+1
et on a p(l) = 1, p(2) = 2, p(3) = 3, p(4) = 5, p(5) = 7 et p(6) = 11.
On munit l'ensemble des partitions de n de Y ordre lexicographique qui est défini par :
£ = (£j,..., Cr) > k = (&i,..., ks) si et seulement si ^ > /^, si i est le plus petit indice
tel que Ci^h- Les partitions de 1 2, 3, 4, 5 et 6 données ci-dessus sont rangées en ordre
décroissant pour l'ordre lexicographique. (C'est le meilleur moyen pour ne pas en oublier.)
Il y a une bijection naturelle l\-+Ct entre les partitions de n et les classes de conjugaison
de Sn : si l = (^i,...,£r)> alors C/ est la classe de conjugaison de Sn constituée des
permutations a dont la décomposition en cycles est (^i,...,£r) (ce qui, rappelons-le,
signifie que a est le produit de r cycles 7ï,... ,rr de longueurs respectives £i,... ,£., et
dont les supports sont disjoints).
De manière remarquable, il y a aussi une bijection naturelle entre les partitions de n
et les représentations irréductibles de S„. Si A = (Ai,..., A5) est une partition de n, soit
Sa = Sax x • • • x Sa« le sous-groupe de Sn constitué des permutations laissant globalement
stable chacun des sous-ensembles
{l,...,Ai}, {Ai + l,...,Ai + A2},..., {Ai + .. + As_1 + l,...,Ai + -. + As}
de {1,... ,n}, et soit Ua = Indj^ 1- Par exemple :
• Si A = (n), alors Ua est la représentation triviale.
• Si A = (n — 1,1), alors Ua est la représentation standard de Sn sur Cn obtenue en
permutant les éléments de la base canonique; elle se décompose sous la forme l©V(„_i,i),
où 1 est la droite de Cn engendrée par (1,..., 1) et V(n_i i) est l'hyperplan d'équation
• Si A = (1,..., 1), on a Sa = {1}, et donc U(i>..Mi) est la représentation régulière de Sn.
Comme le montre déjà l'exemple de U(n_iti), la représentation Ua n'est pas
irréductible, mais sa décomposition en représentations irréductibles fait apparaître une unique
représentation irréductible Va qui n'apparaît pas déjà dans les UM, pour /x > A. On peut
d'ailleurs donner une construction directe de Va (voir plus loin).
1 4 5
3+1 4+1
2 2+2 3+2
1+1 2+1+1 3+1+1
1+1+1+1 2+2+1
3 2+1+1+1
2+1 1+1+1+1+1
1 + 1 + 1
C.2. REPRÉSENTATIONS DU GROUPE SYMÉTRIQUE S„
469
2. Diagrammes de Young et représentations de Sn
Si A = (Ai,..., Ar) est une partition de n, on note Y a le diagramme de Young attaché
à A : c'est le sous-ensemble du carré nxn obtenu en prenant les Ai premières cases de la
lère ligne, les A2 premières cases de la 2ème ligne, ..., les Ar premières cases de la r-ième
ligne. Si A* = (Af,..., A*) est la partition de n conjuguée de A, obtenue en définissant
A* comme le nombre de Xj qui sont ^ i (et donc A* = r, et s = Ai), alors Ya est aussi
obtenu en prenant les A* premières cases de la lère colonne, les A£ premières cases de la
2ème colonne,... En particulier, les diagrammes de Young de A et A* sont symétriques par
rapport à la diagonale.
La représentation Va admet la construction directe suivante : on remplit le diagramme
de Young associé à A avec les nombres de 1 à n (on obtient de la sorte un tableau de
Young). Ceci permet de définir deux sous-groupes A et B de Sn, en prenant pour A
(resp. pour B) l'ensemble des permutations de {1,... ,n} qui préserve globalement chaque
ligne (resp. chaque colonne). Alors Va est la sous-représentation de la représentation
régulière S^eSnCe^ de Sn engendrée par le vecteur X)a6A,6€Bs^ên(^)ea6- Le sous-espace
engendré par 2aeA,6eBsi&nWea6 dépend du tableau de Young, mais il est facile de voir
que, à isomorphisme près, la représentation obtenue n'en dépend pas ; elle ne dépend que
de la partition A.
Par exemple, si A = (1,..., 1), on a A = {1} et B = Sn. La représentation Va est
engendrée par v = ^2a€Sn sign(a)ea, et comme g • v = s\gn(g)v, si g G Sn (ne pas
oublier que sign(p) G {±1}), cette représentation est la représentation de dimension 1
correspondant au caractère linéaire sign de Sn. Plus généralement, il est facile, sur la
construction ci-dessus, de voir que Va* = Va <S> sign.
La dimension de Va est donnée par la formule des équerres. Si o est une case du
diagramme de Young de A, l'équerre Ea de sommet a, est la réunion des cases se trouvant
à droite, sur la même ligne que o, ou en dessous, sur la même colonne que a (en incluant o) ;
la longueur lg(E0) est le nombre de ses éléments. On a alors
dimVA = ^=f 1 /t-. x-
rwwEa)
Exercice C.2.1. Calculer les dimensions des représentations irréductibles de S3, S4 et S5, et comparer
les résultats avec les ex. 1.3.23,1.3.26 et 1.3.27.
3. Caractères de Sn
Les caractères de Ua et Va ont des expressions compactes assez miraculeuses : si
l = (^1,..., êr), et si A = (Ai,..., As), alors
XuA(Q) = coefficient de X*1 • • • X*" dans P£,
XVa(C£) = coefficient de X^1+n_1 • • • x£" dans P* • JJ (X* - Xj),
470
ANNEXE C. GROUPES FINIS ET REPRÉSENTATIONS : EXEMPLES
où P£(Xi,... ,Xn) = (Xj1 + • • • + X*) • • • (Xf- + • • • + Xjr), et où on a posé A* = 0 si
s + 1 < i ^ n.
La formule pour xuA es* assez facile à établir car Ua est une représentation induite,
ce qui permet d'utiliser le th. 1.3.13. Le passage de U\ à Va utilise la combinatoire des
polynômes de Schur.
Si fj, = (//i,...,(jls) est une partition de n, on note encore /x la famille (/*i,..., fj,n), avec
Hi = 0 si s + 1 < i < n. On définit le polynôme de Schur Sch^ par
(X?1+n-1 ... X£»+"-lN
+n-i :
X?1 ... X£»
det | : Xf
SchM(Xi,...,Xn) =
Si A = (Ai,...,Àr) est une autre partition de n, on définit le nombre de Kostka KM>A
comme le coefficient de X^1 • • • X^r dans SchM(Xi,...,Xn).
On a UA = X^K^aV^, et KM)a = 0, si /x < A, Ka,a = 1- C'est comme ça que
l'on vérifie que Va n'apparaît pas dans les UM, pour \i > A. Comme de plus U^...^
est la représentation régulière, on déduit du cor. 1.2.23, et de la formule ci-dessus, que
dimVM = K^(ii...)i).
Le nombre KM)a a aussi une interprétation combinatoire : c'est le nombre de manières
de remplir le diagramme de Young de A avec Ai fois le nombre 1, A2 fois le nombre 2,...,
Ar fois le nombre r, de telle sorte que chaque ligne soit croissante (au sens large) et chaque
colonne soit strictement croissante.
En utilisant la formule ci-dessus pour la dimension de V^, on en déduit que dim VM est
le nombre de tableaux de Young pour la partition /x dans lesquels les lignes et les colonnes
sont croissantes ; un tel tableau de Young est dit standard^. Il n'est pas totalement évident
de prouver, combinatoirement, que ceci coïncide avec la formule des équerres.
C.3. Représentations de GL2(F)
1. Le groupe GL2(F)
Soit F un corps fini de cardinal q. Il existe alors un nombre premier p tel que l'on
ait p = 0 dans F, ce qui fait que F est un Fp-espace vectoriel de dimension finie (avec
Fp = Z/pZ), et donc que q est une puissance de p.
(2) C. Schensted (1961) a établi une bijection entre les paires de tableaux de Young standard de même
forme et les permutations, ce qui fournit une démonstration combinatoire de la formule de Burnside ((ii)
du cor. 1.2.23) dans le cas de S„ (modulo la formule des équerres).
C.3. REPRÉSENTATIONS DE GL2(F)
471
Soit G = GL.2(F) le groupe des matrices 2 x 2, à coefficients dans F, de déterminant
non nul. Si g = (jj) G M2(F), alors g € G, si et seulement si les vecteurs colonnes de la
matrice sont linéairement indépendants sur F, ce qui signifie que le premier vecteur est
non nul et que le second n'est pas dans la droite engendrée par le premier. On en déduit
que|GL2(F)| = (g2-l)(g2-g).
Le corps F a une unique extension K de degré 2 (cf. n° 8.7 du vocabulaire). Si p ^ 2,
on choisit A € F* qui n'est pas un carrée dans F*, et une racine carrée ô de A dans K.
On peut alors associer à z = x + ôy la matrice Cz = ( % ty ) de la multiplication par z
dans la base 1,5 de K sur F (4). La conjugaison par (J _?i) envoie Cz, avec z = x + ôy,
sur Cz, avec z = x — ôy, comme le montre un calcul immédiat.
2. Construction de représentations de GL2(F)
On cherche à faire la liste des représentations irréductibles de G. Le théorème de Brauer
(th. 1.3.20) montre que l'on peut les obtenir à partir d'induites de caractères linéaires de
sous-groupes. Par ailleurs, comme les dimensions des représentations irréductibles ont
tendance à être assez petites, on a intérêt à induire à partir des sous-groupes les plus gros
possibles. Toutes les représentations ci-dessous sont obtenues avec ces considérations en
tête.
• Représentations de dimension 1. Si 77 G F* est un caractère linéaire de F*, on fabrique
un caractère linéaire 77 o det de G en composant avec le déterminant.
• La steinberg et ses tordues. On note P*(F) l'ensemble des droites vectorielles de F2;
c'est un ensemble à q + 1 éléments sur lequel G agit. Il lui correspond donc une
représentation de permutation VPi(F) = ®xGpi(F)Ce;r, qui n'est pas irréductible puisque la
droite engendrée par X)xePx(F) e% est fixe par G. On note St la représentation de G sur
l'hyperplan "Exer1^) Kex> £X€Px(f) ^x = 0}\ c'est une représentation de dimension q.
Plus généralement, si 77 G F*, on peut considérer la représentation St<g>(?7odet) obtenue
en tordant l'action de G sur St par le caractère linéaire 77 o det.
• La série principale. Soit B le sous-groupe de Borel de G ; c'est l'ensemble des matrices
triangulaires supérieures inversibles. Si 771,772 G F* sont deux caractères linéaires de F*,
on note 771 <g> 772 le caractère linéaire de B défini par
(Vi®ri2)(%bd)=rii(a)ri2(d).
*3) Si p = 2, il faut modifier un peu ce qui suit, car un polynôme de la forme X2 - A n'est .jamais
irréductible. On choisit À € F qui n'est pas dans l'image de x 1-» x2 + rc, et Ô € K vérifiant ô2 + ô = A.
On peut alors associer à z = x + ôy la matrice Cz = ( * £gy ) de la multiplication par z dans la base 1,6
de K sur F. La conjugaison par (£ \ ) envoie C2, avec z = x + ôy, sur Cj, avec ~z = x + (Ô + l)y.
*4*On remarquera la similarité avec la représentation matricielle des nombres complexes.
472 ANNEXE C. GROUPES FINIS ET REPRÉSENTATIONS : EXEMPLES
Si 771 7^ 772, la représentation Ind^ 771 <g> 772 est dite de la série principale. ^
• Autres représentations. Comme nous le verrons, les représentations précédentes sont
irréductibles, mais ne suffisent pas à remplir la liste des représentations irréductibles de G.
Les représentations qui suivent ne sont pas irréductibles (on induit à partir d'un sous-
groupe trop petit), mais contiennent les représentations qui nous manquent.
Soit C C G l'image de K* par l'application z *-* Cz. C'est un sous-groupe(6) de G de
cardinal g2 —1. Si 77 G K*, on peut aussi considérer 77 comme un caractère de C, en utilisant
l'isomorphisme z i-> Cz de K* sur C, et nous aurons à considérer la représentation Ind§ 77.
Soit ZU C B le sous-groupe des matrices ayant une seule valeur propre (Z est là pour
désigner le centre, qui est l'ensemble des matrices d'homothéties de rapport non nul, et U
est le groupe des matrices triangulaires supérieures avec des 1 sur la diagonale ; une telle
matrice est unipotente). On fixe un caractère linéaire non trivial if) € F de F, et si 77 G F*
est un caractère linéaire de F*, on note 77 <g> tp le caractère linéaire de ZU défini par
{V®^){aobo)=v{ama-lb).
Nous aurons à considérer la représentation Ind^y 77(8)^. En fait, le cas qui nous intéressera
est celui où on part d'un élément 77 de K*, que l'on restreint à F* (nous nous permettrons
de garder le même nom pour la restriction).
3. Les classes de conjugaison de GL2(F)
Comme F a une unique extension de degré 2, la classification, à conjugaison près par
une matrice inversible, des matrices 2 x 2 à coefficients dans F, est identique à ce qui se
passe sur R. Il y a quatre types distincts :
• type I : A est scalaire, et donc de la forme ax = ( g x ) 1 avec x GF\
• type II : A a une unique valeur propre x € F, mais n'est pas diagonalisable ; elle est
alors conjuguée à bx = ( g * ) ;
• type III : A a deux valeurs propres x ^ y dans F, et donc est conjuguée à bXtV = (g y),
et donc aussi à by>x ;
• type IV : A n'a pas de valeurs propres dans F, et donc a deux valeurs propres z^~z
dans K, et A est conjuguée à cz et c^.
Comme on s'intéresse aux classes de conjugaison de G, il faut ne garder que les matrices
inversibles dans rénumération ci-dessus. On aboutit à la liste de paramètres de la fig. 1.
<5)Le lecteur pourra vérifier que Ind^ 77 <g> 77 = VPi(P) <g> (77 o det), ce qui explique que l'on ne s'intéresse
pas au cas 771 = 7/2 •
<6)Un tel sous-groupe est un sous-groupe de Cartan non déployé, un sous-groupe de Cartan déployé étant
un sous-groupe conjugué au sous-groupe des matrices diagonales.
C.3. REPRÉSENTATIONS DE GL2(F) 473
Ei
En
Em
Eiv
description
F*
F*
{(x,y) G F* x F*, x ? y}/{x,y) ~ (y,x)
{z G K*, z^ z}/z ~ z
cardinal
q-l
q-l
èfa-i)fa-2)
èffto-i) 1
FlG. 1. Paramètres des classes de conjugaison de GL2(F)
Proposition C.3.1. La liste des classes de conjugaison de GL2(F) est celle de la
figure 2
type
I
II
III
IV
nombre
q-l
q-l
(q-l)(q-2)
2
2
classe
ax, x G Ei
bx, x G En
Kyi 0&> y) € Em
cz, z = x + ôy e EIV
représentant
A.= (J2)
B.= (j5i)
Bx,y = ( 0 y J
c, = (;¥)
cardinal
1
<72-l
</(</+!)
q2-q
FlG. 2. Classes de conjugaison de GL2(F)
Démonstration. La seule chose qui ne suive pas directement de la discussion précédant la
proposition, est la détermination du cardinal de chacune des classes. De manière générale,
si G est un groupe, et x G G, la classe de conjugaison de x est l'orbite Ox de x sous
l'action de G par conjugaison intérieure (g • x = gxg'1) ; si Zx est le centralisateur de
x dans G (i.e. est l'ensemble des éléments de G commutant à rc), on a Ox = G/Zx, et
donc |Ox| = i|jjr. On est donc ramené au problème de déterminer l'ensemble des matrices
inversibles commutant à une matrice donnée. Or, si A G M2(F), l'ensemble des matrices
M G M2(F) qui commutent à A sont :
• M2(F) tout entier, si A est scalaire.
• le sous-espace vectoriel engendré par ( J 5) et A, si A n'est pas scalaire<7).
On déduit de cette discussion les résultats suivants :
• Tout commute à Ax et donc il y a un seul élément dans ax.
• Les matrices commutant à Bx sont de la forme ( g J ), avec a, 6 G F, et une telle matrice
est inversible si et seulement si a ^ 0. Le centralisateur de Bx est donc de cardinal q(q— 1)
et le nombre d'éléments de bx est (g ôfa-^i)"^ =Q2 — 1-
(7)Un calcul brutal montre que l'espace des solutions est de dimension 2 si A n'est pas scalaire, et comme
1 et A commutent à A, et sont linéairement indépendantes, cela permet de conclure. Cet argument est
raisonnable en dimension 2, mais pour déterminer le commutant d'une matrice en dimension quelconque,
il vaut mieux utiliser le point de vue du n° 10.2 du § 10.
474 ANNEXE C. GROUPES FINIS ET REPRÉSENTATIONS : EXEMPLES
• si x ^ y, les matrices commutant à Bx>y sont de la forme ( g J ), avec a, 6 € F, et une
telle matrice est inversible si et seulement si a ^ 0 et b ^ 0. Le centralisateur de Bx>î/ est
donc de cardinal (q - l)2 et le nombre d'éléments de bXtV est ^ 7q_iV^ = q(q + !)•
• si z G K — F, les matrices commutant à Cz sont de la forme Cz/, avec 2' G K, et une
telle matrice est inversible si et seulement si z' ^ 0. Le centralisateur de Cz est donc de
cardinal q2 — 1 et le nombre d'éléments de cz est ~jt_t = q(q — 1).
Ceci permet de conclure.
4. La table des caractères de GL2(F)
On suppose dorénavant que q n'est pas une puissance de 2 (il y a des petites
modifications (cf. note 3) à faire dans le cas p = 2; nous les laissons en exercice). Les caractères
de G se paramétrent de manière parallèle aux classes de conjugaison de G. Il y a aussi 4
types paramétrés par les ensembles Ef, EJ, Efn et Efv de la figure 3.
Ef
Ef,
E*n
E*v
description
pi
F^
{(VuV2) € F* x F% ?7i ^ m}/(Vi,V2) ~ (??2,r7i)
{q e K*, 77* ^ v}/v* ~ V
cardinal
9-1
9-1
è(9-l)(«-2)
k(9~l)
Fig. 3. Paramètres des caractères de GL2(F)
Dans le tableau ci-dessus, on a noté 77* le caractère linéaire z i-> 77(2), si 77 6 K*.
type
1 nombre
caractère
dimension
a>x
bx
bx,y
Cz
I
q-1
«„, 77 e Ef
l
V(x)2
V(x)2
rj(xy)
r)(zz)
II
q-1
Ai, V € Ef!
9
^(z)2
0
rj(xy)
-rj(zz)
III
(g-i)fa-a)
2
/W> (m^JeEfn
9 + 1
(9 + 1)W2(Z)
77i772(x)
mM^W + mtoMz)
0
IV
SiSzll
2
7n, *? € E?v
9-1
(9 - l)rç(z)
-?7(x)
0 1
-(77W+77*(2))
Fig. 4. Table des caractères de GL2(F)
Théorème C.3.2. La table des caractères de GL2(F) est celle donnée par la figure 4-
C.3. REPRÉSENTATIONS DE GL2(F)
475
Démonstration. On note X l'ensemble des fonctions centrales apparaissant dans le
tableau (i.e. de la forme av, (3^ Pm,m ou Irj)- Comme il y a autant de paramètres pour
les éléments de X que pour les classes de conjugaison de G, il suffit de vérifier que les x
correspondant à deux paramètres distincts sont différents (lemme C.3.6) et que x € Irr(G),
si x € X. Pour vérifier ce deuxième point, il suffit, d'après l'ex. 1.2.22, de vérifier que
• x(l) ^ 0 (ce qui est évident),
• (X>X) = 1 (ce Qui fait l'objet du lemme C.3.5),
• X € Rz(G) (ce qui fait l'objet du lemme C.3.4).
Remarque C.3.3. (i) Remplacer le couple (171,172) par (772,771) ne change rien dans la
colonne du type III, ce qui montre que l'on peut effectivement passer au quotient par la
relation d'équivalence (771,772) ~ (772,771).
(ii) De même, remplacer 77 par 77* ne change rien dans la colonne du type IV (car
77*(x) = 77(0;), si x G F*), ce qui montre que l'on peut effectivement passer au quotient
par la relation d'équivalence 77 ~ 77*.
5. Démonstrations
Lemme C.3.4- (i) Si rj G F*, alors av = 77 o det.
(ii) Si 77 G F*, alors f3v est le caractère de St <g> (77 o det).
(iii) Si (771,772) G Em, alors A,^ est le caractère de Ind^i <S>?72-
(iv) Si rj G Eiv, alors 7^ = Ind§u 77 <g> ip — Indc?7.
Démonstration. Le (i) est immédiat. Pour démontrer le reste, nous noterons (ei,e2) la
base canonique de F2.
• Pour démontrer le (ii), il faut commencer par calculer le caractère Xst de St. Pour ce
faire, on commence par calculer le caractère Xpx(f) ^e ^a représentation de permutation
Vpi(p), et on est ramené (alinéa 2.3 du § 1.1) à calculer le nombre de points fixes de l'action
de g G G sur P*(F). Comme les points fixes sont exactement les droites propres de F2
sous l'action de p, on voit que le nombre de points fixes de Ax est q + 1, celui de Bx est 1
(la droite Fei), celui de BX)Î, est 2 (les droites Fei et Fe2) et celui de Cz est 0. Comme
Vpi(F) = St 0 1, on a xst = Xp*(f) - h et donc Xst(Ax) = g, Xst(Bx) = 0, Xst(Bx,y) = 1
et Xst(Cy = -1- Le (ii) s'en déduit en tordant par le caractère 77 o det.
• Passons au (iii). Soit x = Ind^i «8)772, avec 771,772 G F*. Pour calculer x, on part de
la formule du th. 1.3.13
X(9) = igi ^2 Vi® V2(sgs~1).
' ' s€G,S3S-x€B
o Comme Ax est dans le centre de G qui est inclus dans B, on a sAxs-1 G B et
771 <S> 772(sAxs-1) = 771772(2:), quel que soit s G G. On en déduit que
IGI
x(K) = Tjxmmix) = (q + Vvimix).
476
ANNEXE C. GROUPES FINIS ET REPRÉSENTATIONS : EXEMPLES
o On a sBsS-1 € B si et seulement si sBxs~1(ei) G Fei, et donc si et seulement si
Ba.(s_1(ei)) G Fs_1(ei). Comme Fei est la seule droite propre de Bx, cela équivaut à
s_1(ei) G Fei et donc à s G B. Comme 771 <g> ^(sB^s-1) = 771772(2), si 5 G B, on obtient
X(Bx) = TgT ^2viV2(x) = 771Î72W.
o On montre de même que sB^yS'1 G B, si et seulement si BX|y(s-1(ei)) G Fs-1(ei), et
donc si et seulement si s_1(ei) G Fei ou s_1(ei) G Fe2. Le premier cas équivaut à s G B
comme ci-dessus, et on a 7710rj2(sBx>î,s-1) = 771(2)772(2/) ; le second équivaut à s G Bw, où
w = (? J)> et on a 771 ® ^(sB^yS-1) = rji(y)r)2(x). On obtient donc
x(BXty) = T^-A^mWmiy) + ^2 vi(y)v2(x)) = vi(x)v2(y) + rh(y)m(x)'
' ' s€B s€Bw
o Si z G K* - F*, il n'existe aucun 5 G G tel que sCzs_1 G B, et donc x(Q?) = 0.
• Finalement, venons-en au (iv). Soit 77 G K*, soient Xi et X2 les caractères de Ind^y rj<g>if)
et Ind§ 77, et soit x = Xi ~ X2- D'après le th. 1.3.13,
Xi(p)=|2Ûï J2 V®Hs9S~l) et x2(p) = 7çT J2 ^s'1)-
o Comme A^ G ZU et Ax G C, on a, comme ci-dessus,
Xi(A*) = ^77(2) = (g2-1)77(2) et X2(A.) = jgfiy(x) = (g2 -9)77(2),
et donc x(Ax) = (q ~ 1)^(2).
o Xi(Ba;,y) = 0 et Xi(Q?) = 0 car aucun élément de ZU n'est conjugué à BXyV ou Cz.
o X2(Ba:,y) = 0 et X2(BX) = 0 car aucun élément de C n'est conjugué à BXtV ou B^.
o On a ZU C B. Or on a vu plus haut que sBxs_1 G B implique 5 G B. De plus, comme
Bjc a une seule valeur propre, il en est de même de sBxs_1, et donc sB^s-1 G ZU si et
seulement si s G B. Maintenant, on a
(«0\(x l\(a(S\-1 _ (otxot+{3x\(a-1 -/3a"1*-1 \ _ ( x a6~i \
\0 SJ\OxJ\o s) ~ U & A o S-1 > \0 x )■
On en déduit que
' ' a,<$eF*,/?6F 9 a,5€F*
En faisant le changement de variable a' = aô'1, ô' = ô, et en utilisant le fait que
53a,GF^(o;/) = 0 puisque l'on a supposé tj) non trivial (orthogonalité des caractères i()
et 1 du groupe F), on obtient finalement
Xi(Bx)=77(2)H/>(0)) = -77(2) et X(BX) = -V(x).
o Si sQzS-1 G C, alors sCzs_1 est égal à Cz ou Cz (le polynôme caractéristique de Cz
est égal à X2 — (z + ~z)X + z~z, et donc celui de sCzs-1 aussi). Si sCzs_1 = Cz, alors s est
C.3. REPRÉSENTATIONS DE GL2(F)
477
dans le centralisateur de Cz qui, comme on l'a vu (dém. de la prop. C.3.1), est égal à C ; si
sCzs_1 = C*, alors s(J ^i)C^(J _?i)s_1 = C*, et donc s(J -1) est dans le centralisateur
de C^, et s G C(J -\ )■ On en déduit que
X2(Cz) = ^-(£n(z) + Y,^)) = v(z) + r,'(z) et x(C„) =-fo(*) + !»*(*))•
1 I sec sec
Ceci permet de conclure
Lemme C.3.5. Si x € X, alors (x>x) = 1-
Démonstration. Si 0 est une fonction centrale sur G, il résulte de la table des classes
de conjugaison, que
|G|<*,*> = £ W«x)|2 + (g2 -1) £ MMf
xeF* xeF*
+q(q+i) Yl wyf+é-i) £ wc*)i2
(«.»)6(K*)a. */» *€K*-f*
mod (x,î/)i-(y,3:) modzi-fz
Il nous faut vérifier que |G|{<f>,<f>) = |G| = (g2 — 1)(q2 — q), si </> est un des caractères
apparaissant dans la table 4.
• Pour un caractère du type ryodet, il n'y a rien à faire puisque l'on a affaire au caractère
d'une représentation de dimension 1 qui est automatiquement irréductible.
• On remarque que, si <f> est le caractère de la représentation St <S> (r) o det), les
contributions des classes bx%y et cz sont les mêmes que pour rj o det. Il suffit donc de vérifier que
X)x€F* Ma*)|2 + (Q2 - !) ExeF* WMI2 a la même valeur que dans le cas (f> = rj o det, ce
qui est immédiat, les deux sommes valant (q — l)q2.
• Dans le cas où <f> = PVlim, avec 771,772 € F* et 771 ^ 772, la somme à évaluer devient
(9-i)(9 + i)2 + (g-i)(g2-i) + 9(g + i) £ \m(x)m(y) + m(x)vM\2-
(*.j/)e(K*)2, Xfty
mod(x,y)>->(.y,x)
Comme 77(0) = 77(a)_1 = 77(a_1), on peut écrire \r}i(x)rj2(y) + 772(^)771 (y)|2 sous la forme
2 + rji{x)r}2{y)rj2{x)rji(y) + vi(x)m(y)m(x)vi(y) = 2 + (%M(x/y) + (Vm)(î//z).
Ceci permet de mettre ^ \Vi(x)V2(y) + V2(x)rji(y)|2 sous la forme
(g-i)(ç-2)+ £ (mM(x/y) = (q-i)(q-2)+ £ (m/m)(x/v) - (g -1).
(x,î/)G(F*)2, x?éy (x,y)G(F*)2
Maintenant, comme 771 ^ 772, on a J2(x,y)€(F*)2('rli/V2)(x/y) = 0. La somme à évaluer est
donc, finalement, égale à
(<7-l)(ç+l)2 + (?-l)(tf2-l) + ç(ç+W^^
ce que l'on voulait.
478 ANNEXE C. GROUPES FINIS ET REPRÉSENTATIONS : EXEMPLES
• Dans le cas où (f> = jv, avec 77 G K* et 77 ^ 77*, la somme à évaluer est
(9-i)(9-i)2 + (9-i)(92-i)+9(g-i) J2 to(*)+i/"(*)i».
zeK* -F*, mod z*-+z
Les mêmes calculs que ci-dessus (en utilisant le fait que 77*(z) = rj(~z)) permettent de
mettre EzGK*-F*,modz~z M*) + V*(*)\2 sous la forme
q(q-l) + J2 (W)(*) = ^-l)+£(W)M-(?-l),
z€K*-F* z€K*
et comme ci-dessus J2z€K*(v/v*)(z) = 0 puisque 77 ^ 77*. La somme à évaluer est donc,
finalement, égale à
(q-l){q-l)2 + (q-l)tf-l) + q{q-l)(q-l)2 = {q-l)\q-l+q+l + q{q-l))
= (Q-l)2(q2 + q) = (q2-l)(q2-q),
ce que l'on voulait.
Lemme C.3.6. Si x et x' sont deux éléments de X tels que x = x'> a^ors les
paramètres de x et x' soni égaux.
Démonstration. Si x = x'> on a en particulier x(l) = x'M» ce qui implique que x et
X' sont de même type.
• Dans les cas des types I et II, il suffit de regarder la valeur en les bx,y, pour prouver
que les paramètres de x et x' sont les mêmes.
• Pour traiter le cas du type III, associons à un couple (^1,^2) d'éléments F*, le caractère
linéaire ôi®ô2 de F* x F* défini par (ôi 0S2)(x,y) = ôi(x)ô2(y). Si (771,772) et (rfvrf2) sont
deux éléments de Em tels que ^m^2 = Pvvv'2> on voit, en regardant ce que cela signifie sur
les bx,y et les 6X, que les caractères linéaires 771 <S> 772, 772 <8> 771, 77^ <g> 773 et 773 <S> rj[ sont liés
par la relation
771 <S> 772 + 772 <8> 771 = 77! <g> 772 + rj2 <g> rj'v
En utilisant l'orthogonalité des caractères, cela prouve que 771 <S> 772 est égal à un des deux
caractères ?7i<8>772 ou 772<g>77i, et donc que les éléments (771,772) et (77i,772) de Eni sont égaux.
• Le cas du type IV se traite de la même manière. Si 771 et 772 sont deux éléments de Eiv
tels que jm = 7^, alors en regardant ce que cela signifie sur les cz et les bx, on voit que
l'on a 771 + 77* = 772 + 772 sur K*. On en déduit, en utilisant l'orthogonalité des caractères,
que 771 est égal à 772 ou à 773, et donc que 771 et 772 sont égaux dans EIV.
Ceci permet de conclure.
ANNEXE D
FONCTIONS D'UNE VARIABLE p-ADIQUE
Dans cet appendice, on décrit ce que deviennent un certain nombre de notions classiques
dans le monde p-adique (fonctions de classe if*, fonctions analytiques, intégration...). On
termine par une application arithmétique (indépendante du reste) aux congruences
découvertes par Kummer entre les valeurs de la fonction Ç aux entiers négatifs (cf. ex. VII.3.6).
D.l. Analyses fonctionnelles réelle et p-adique
Ce § est consacré à une comparaison entre l'analyse fonctionnelle classique sur R/Z
(i.e. l'étude des propriétés du développement de Fourier des fonctions périodiques) et
l'analyse fonctionnelle p-adique sur Zp (développement de Mahler). Les résultats sont
remarquablement semblables, mais les énoncés p-adiques sont souvent, grâce à l'ultramé-
tricité de la norme p-adique, un peu plus agréables.
Dans ce qui suit, on note Ck(</>), pour feeZ, les coefficients de Fourier d'une fonction
sur R/Z (à valeurs dans C) et an(0), pour n e N, les coefficients de Mahler d'une fonction
sur Zp (à valeurs dans Qp).
Commençons par les fonctions continues. En p-adique, on dispose du th. de Mahler
(th. 20.4) dont nous rappelons l'énoncé.
Théorème D.l.l. (Mahler, 1958) Si <f> G tf{Zp), alors
(i) limn^+00 On(<t>) = 0,
(ii) <f> est la somme de la série EneN^WO dans ^(Zp); en particulier, pour tout
x G Zp, on a EneNÛnMO = </>(*)•
(iii) Réciproquement, si (an)nGN tend vers 0 en +oo, alors EneN^CD conver9e dans
^(Tipy Qp) vers une fonction continue dont les coefficients de Mahler sont les an.
En réel, la situation est nettement moins claire. (Pour avoir un énoncé propre, il faut
considérer l'espace de Hilbert L2(R/Z) au lieu de ^(R/Z), cf. cor. II.2.7.)
Théorème D.l.2. (i) Si <f> e if (R/Z), alors ck(<f>) -> 0 quand \k\ -> +oo.
480
ANNEXE D. FONCTIONS D'UNE VARIABLE p-ADIQUE
(ii) Si EfcGz KWI < +00. alors J2k€Zck{<l>)e2iirkx -> <t> dans if (R/Z). En particulier,
pour tout x e R/Z, on a ^2k€Z ck{<f>)e2™kx = (f>(x).
(iii) Si <j) e ^(R/Z), la suite des somme partielles Efc=-nc*(^)e2iirfet c°nver9e vers
<p(x) p.p., mais il existe <j> G ^(R/Z) tel que cette suite ne soit pas bornée (et donc ne
tende pas vers <f>(x)) pour x dans un sous-ensemble non dénombrable dense de R/Z.
(iv) // existe des suites (ck)k€Z> avec ck —> 0 quand \k\ —> +oo, qui ne sont pas la suite
des coefficients de Fourier d'une fonction continue.
Démonstration. Le (i) est une conséquence du fait que Sfc6zlc*(^)l2 = /o l^(0l2(&
(cf. cor. II.2.7), le (ii) fait l'objet de la prop. IV.3.6, la convergence p.p. de la série de
Fourier d'une fonction continue est un résultat difficile de Carleson (1965), le reste du (iii)
et le (iv) peuvent se démontrer en utilisant le lemme de Baire (cf. ex. II.3.17 et prob. H.5).
Les énoncés deviennent parfaitement identiques quand on augmente la régularité des
fonctions considérées. Rappelons qu'une suite de terme général uk (à valeurs dans un corps
muni d'une norme || ||) est :
• o décroissance rapide, si &N||ufc|| —► 0 quand \k\ —► +oo, pour tout N e N.
• à décroissance exponentielle s'il existe r > 1 tel que r'fcl||ufc|| —> 0 quand \k\ —► +oo.
Théorème D.Î.3. (i) <j> G ^(R/Z) est de classe c&°° si et seulement si la suite de ses
coefficients de Fourier est à décroissance rapide.
(ii) <f> e ^(R/Z) est analytique si et seulement si la suite de ses coefficients de Fourier
est à décroissance exponentielle.
Démonstration. Le (i) se démontre en utilisant la relation entre les coefficients de
Fourier d'une fonction et ceux de ses dérivées (cf. rem. IV.3.7). Le (ii) fait l'objet du
prob. H.9.
En p-adique on a le résultat suivant dont la démonstration du (i) (resp. du (ii)) fait
l'objet du § D.2 (resp. du § D.3).
Théorème D.l.4. (i) <j> € ^(Zp) est uniformément de classe c£co si et seulement si
la suite de ses coefficients de Mahler est à décroissance rapide.
(ii) <j> e ^(Zp) est localement analytique si et seulement si la suite de ses coefficients
de Mahler est à décroissance exponentielle.
D.2. Fonctions fc-fois uniformément dérivables
1. Fonctions de classe fé* et fonctions de classe féj
Une fonction (j> : Zp —► Qp est dérivable en x0 e Zp, si la quantité #xo+fr)-#(so) acjmet
une limite quand h tend vers 0. La limite est alors notée <f>'(x0). Une fonction est dérivable
à l'ordre 1 si elle est dérivable en tout xq G Zp; une fonction dérivable à l'ordre 1 est
en particulier continue. Plus généralement, on définit par récurrence sur k la notion de
D.2. FONCTIONS Jfc-FOIS UNIFORMÉMENT DÉRIVABLES
481
fonction dérivable à l'ordre k : <j> est dérivable à Vordre k si elle est dérivable à l'ordre k — 1,
et si sa dérivée (k - l)-ième <^k~1^ est dérivable à l'ordre 1.
On dit que (f> est de classe ^k si elle est dérivable à l'ordre k et si sa dérivée fc-ième est
continue. La notion de fonction de classe if fc ne se comporte pas très bien en p-adique, et on
préfère la remplacer par celle fonction uniformément de classe <&k (de classe féj pour faire
court) : une fonction <f> sur Zp est de classe &£ si les fonctions <ffi(x, /ii,..., /i*), définies
sur Zp x (Zp - {0})* (pour 0 ^ i ^ k), par récurrence, grâce à la formule (f>^(x) = <f>(x) et
<f>®(x, /ii,..., hi) = ^(<t>li-1](x + hi, /ii,..., /ii_i) - <t>[i-1]& hu..., hi-i)),
se prolongent en des fonctions continues sur Zp+l. Une fonction de classe *&£ est de
classe <é>k, de dérivée i-ème donnée par <f>®(x) = <f$(x> 0,..., 0).
Remarque D.2.1. (i) Sur R, les notions de classe *&£ et de classe fé* coïncident car
</fl(x, hi,...,hi)= I (f>{i)(x + tihi + • • • + Uk) etti... du.
(ii) Sur Zp, l'exemple suivant montre qu'il n'en est rien. L'écriture en base p
permet d'écrire tout élément x de Zp, de manière unique, sous la forme ^2n2)Pnan(x)>
avec an(x) G {0,... ,p — 1}, ce qui permet de définir une fonction <f> : Zp —> Zp grâce
à la formule <f>{x) = ^2n2)P2nan(x)- On a alors \<f>(x) — <f>(y)\p = \x — y\% pour tous
x,y € Zip (en effet, \x — y\p = p~k, où k est le plus petit entier vérifiant ak(x) ^ ak(y))>
ce qui montre que <j> est dérivable, de dérivée nulle, en tout point (elle est donc aussi de
classe <^?°°), bien que <f> ne soit constante dans le voisinage d'aucun point. Par ailleurs, si
(x,hi,h2) = (0,pn,pn), alors <f>W(x,hi,h2) = 0, et si (rc,/ii,/i2) = ((p- l)pn,Pn,Pn), alors
4^(x,hiyh2) = p — p2, ce qui montre que <^ ne peut pas se prolonger par continuité
en (0,0,0).
On munit féJ(Zp) de la norme naturelle || ||g« définie par
WWè = sup sup \(f>®(x, /ii,..., hi)\p.
0<i<fc(x,/ll,...)/li)Gz*+1
Alors ^(Zp) est complet puisqu'une limite uniforme de fonctions continues est continue,
et donc est un espace de Banach p-adique.
Théorème D.2.2. (Barsky, 1973)
(i) </> e fé* si et seulement si la suite de terme général nk\an(<f>)\p tend vers 0 et la
norme supn(n+ l)k\an(<f>)\p est équivalente à \\4>\\^-
(ii) <f> est de classe <&U° si et seulement si la suite de ses coefficients de Mahler est à
décroissance rapide.
Démonstration. Une fonction étant de classe fé^ si et seulement si elle est de classe féj,
pour tout k G N, le (ii) est une conséquence du (i). Le (i), quant-à-lui est une conséquence
482
ANNEXE D. FONCTIONS D'UNE VARIABLE p-ADIQUE
des lemmes D.2.7 et D.2.6 ci-dessous (le lemme D.2.6 permet de montrer que la suite
n *-> (n + l)fcp-L(n,fc) est bornée et le lemme D.2.7 que \\<f)\\^ = s\ipn€NpL(n'k)\an(<f>)\p).
2. Fonctions continues sur Z™
Pour pouvoir étudier les coefficients de Mahler des fonctions de classe fé*, on a besoin
d'une description des fonctions continues sur Z™ (c'est assez naturel, au vu de la
définition d'une fonction de classe tf£). Le résultat suivant montre comment obtenir une base
orthonormale des fonctions continues sur Z™ à partir d'une base orthonormale des
fonctions continues sur Zp. La situation est tout-à-fait analogue^1) à la description d'une base
orthonormale de L2((R/Z)m) en fonction d'une base orthonormale de L2(R/Z). Le lecteur
est invité à comparer l'énoncé ci-dessous et sa démonstration avec ceux du th. IV.3.10.
Proposition D.2.3. Sim^l, les ^,...,*„ = (£) • • • (x£), pour (kXj..., km) G Nm,
forment une base orthonormale de ^(ZJJ1).
Démonstration. Il suffit de prouver que leurs réductions modulo p forment une base
de ^(ZJJ^Fp), sur Fp. Pour montrer qu'ils forment une famille libre, on peut utiliser le
fait que les fa = (£), pour fceN, forment une famille libre modulo p, puisque les (£),
pour A; € N, forment une base orthonormale de fé^Zp). La liberté se déduit alors, par une
récurrence immédiate, du lemme suivant (appliqué à K = Fp, X = Zp et Y = ZJJ1"1).
Lemme D.2.4- Si K est un corps, si X et Y sont des ensembles, et si (/f)iGi et (<7j)jej
sont des familles libres déléments de Kx et KY respectivement, alors (fi <S> 9j)(ij)eix3, où
fi®9j(x>y) = fi(x)9j(v)> esi une famille libre dans KXxY.
Démonstration. Si X) \j fi ® 9j est une combinaison linéaire (seul un nombre fini
de Xitj sont non nuls) identiquement nulle sur X x Y, alors pour tout y G Y, on a
J2j€J (J2i€i^i,jfi(x))9j(y) = 0- Les 9j formant une famille libre ceci implique que, pour
tout j G J, on a 5^ieI Xi,jfi(x) = 0, quel que soit x G X. Comme les fi forment une famille
libre, cela implique que les Xij sont tous nuls, ce qui permet de conclure.
Revenons à la démonstration de la proposition. Il reste à vérifier que les falt...,km forment
une famille génératrice. Soit donc </> : Z™ —► Fp continue. La topologie sur Fp est la
topologie discrète que l'on peut définir par la distance triviale (d(x,y) = 1, si x ^ y), et
comme Z™ est compact, en tant que produit de compacts, <j> est uniformément continue.
Ceci se traduit, en particulier, par l'existence de N G N tel que sup1^i^m \xi — yi\p < p~N
implique d((f>(x), <f>(y)) < 1 (i.e. <f)(x) = (f>(y)) ; autrement dit, <j> est constante sur x+pn7i™,
pour tout x G Zp ; on peut donc l'écrire sous la forme
<t>= Z^f ^ri *,m1(n+PNZp)x-x(rm+pNZp)-
0<ri,...,rm<pN-l
^Dans les deux cas, l'espace de fonctions en plusieurs variables est un produit tensoriel complété de
copies de l'espace de fonctions en une variable.
D.2. FONCTIONS Jfc-FOIS UNIFORMÉMENT DÉRIVABLES
483
Or l(ri+pNzp)x...x(rm+pNzp)(aO = IEi i^+pNZpfe) et lri+pNZp peut s'exprimer comme une
combinaison linéaire des </>&, d'après le th. de Mahler. Il n'y a plus qu'à développer
l'expression obtenue pour aboutir à une écriture de <j> comme combinaison linéaire des <t>ku-.,km-
Ceci permet de conclure.
Remarque D.2.5. (i) Il résulte de la proposition que tout <f> G fé^Z™) peut s'écrire, de
manière unique, sous la forme <f> = Dk=(fci,...,fcm)eN»'akM(fcî) * * * (£")> ou aU4>) ~* ° à
l'infini, et que, de plus, ||#||oo = supkGNm |ûk(</0lp- Réciproquement, si a*. —► 0 à l'infini,
alors Sk=(fci,...,fcm)€N"» ak(fej) " " " (lZ) est une f°ncti°n continue sur Z™ dont les coefficients
de Mahler sont les ak, pour k G Nm.
(ii) Si n = (ni,..., nm) G Nm, alors (Jj) • • • (£™) G N et est nul sauf pour un nombre fini
de k. Il en résulte que les valeurs de <f> sur Nm sont des combinaisons linéaires à coefficients
entiers des ak(</>), pour k G N. Réciproquement, on peut, comme en dimension 1, définir
les coefficients de Mahler ak(</>), à partir des valeurs de <f> aux entiers. On définit l'opérateur
de « dérivée partielle discrète » par
dll]<f>(xu...,xm) = (j>(xi,..., Xi + 1,..., xm) - 4>(xi,..., xh...,xm),
et on note d\h] le composé de k copies de d\1]. Alors ak(<f>) = d[fl] • • -ôKmV(0, •. • ,0),
ce qui montre que ak((f>) est une combinaison linéaire, à coefficients entiers, des </>(n),
pour n G Nm.
3. Coefficients de Mahler des fonctions de classe féjf
Soit L(n, k) = max{vp(ni) H h vv{ni) \ i < &, ni H 1- n* < n, rij ^ 1}.
Lemme D.2.6. Il existe Ck > 0 tel que k1^ - Ck < L(n, k) < fcj^.
Démonstration. Si n; < n, alors vp(nj) < j^an, et donc L(n, fc) < fcjSS* D'autre part,
si & < pr et u = [j^], on peut prendre (ni,... ,nfc) = (pu-r,... ,pu-r) ce qui implique
L(n, fc) ^ &(ïï£ ~ 1 — r) et permet de conclure.
Lemme D.2.7. Les pL^n,k^Q forment une base de Banach de ^f(Zp).
Démonstration. Soit gT(x) = (1+T)X. On a pT(z) = EneN pn(z)Tn, où Pn(rc) = (*)Tn.
Donc
53 pW(x, *„..., a»)=$(*, *,,..., a») = a+-ir li (1+'y~x-
En identifiant les termes de degré n en T, et en utilisant l'identité £(£) = £(*l}), on
obtient la formule
1 fx\fh1-l\ fhi-V
\rn - 1 >
no+niH \-rii=n
ni,...,n*^l
484
ANNEXE D. FONCTIONS D'UNE VARIABLE p-ADIQUE
Soit <f> e ^î(Zp) et soit 9i(x,hu.. .,hi) = 4>W(x,h\ + l,...,/ii + 1). Comme
<t>(x) ~ Sn€Nan(0)Pn(^)) pour tout x e Zp, on déduit de la formule ci-dessus que
\n0) Vni - 1 ) " In* - 1,
ft(*,fc1>...,fc)-£( E ^rC
«<=1ST nn±nt4----4-r>.:=zn. x * >■
n€N n0+ni+-+n£=n
m,...,ni>l
et que les coefficients de Mahler de gi sont donnés par
, x ano+-+ni(<t>)
Clno,nl-l...,ni-l{9i) ~ — ~ •
ni • • • rii
Si i < fc, comme # se prolonge en une fonction continue sur Zp+1 puisque </> e féJ(Zp), le
théorème de Mahler à i + 1 variables (prop. D.2.3) montre que la suite de terme général
a"0ni-+nf tenc* vers 0 Quand (no>■ ■■ >n>i) tend vers l'infini.
Réciproquement, si cette suite tend vers 0, alors la série
Y^ Y^ Y^ Qno+-+n»W (x \( hl \ ( hi
^^i"""^i m-* WW-v "U-i
définit une fonction continue sur Zp+1 qui coïncide avec gi sur Ni+1, au vu du lien entre
les coefficients de Mahler d'une fonction et ses valeurs aux entiers (rem. D.2.5). Comme
Ni+1 est dense dans Zp x (Zp — {—1})*, cela prouve que :
• la fonction ci-dessus est égale à & sur Zp x (Zp - {-1})*,
• pi, et donc aussi </$, se prolonge par continuité à Zp+1,
• H0(i)lloo = llftHoo = supn0)...)n. ^z^i;\ano+...+ni((f>)\p-
En résumé, (f> G ^(Zp) si et seulement si ^~-. tend vers 0 quand n = n0 + ni-\ \-ni
tend vers +co et
IMke = supsup ( SUp |anWlpl ) = supp^'M^)!,,.
i<fc n€N Vn0+ni+- +m=n |fli • • • ni|p/ nGN
ni,...,ni^l
On en déduit le résultat.
D.3. Fonctions localement analytiques sur Zp
1. Fonctions analytiques
Le lecteur est invité à comparer l'énoncé suivant, et sa démonstration, avec la prop. V.1.10.
Proposition D.3.1. Soit F = YZ=o an^n e Qp[[TlL avec an -> 0 quand n -> +co.
(i) F et toutes ses dérivées convergent sur Zp.
(ii) Si z,zo G Zp, alors F(z) = J2t=o ^i^ (* " zo)k> ou F{k)(zo) désigne la somme de
la série F<*> en zq.
(iii) La fonction z i-> F(z) est de classe c£QO sur Zp et sa dérivée k-ième en z$ est la
valeur de la série F^ en zq.
D.3. FONCTIONS LOCALEMENT ANALYTIQUES SUR Z„
485
(iv) Si z0 € Z„ alors ^ - 0 et suPbEN |£^| = SUpn€N |a„
p.
Démonstration. On a ^P = E^o C^K+fcT*- Or | (n+kk) \p < 1, puisque (»+*) G N,
et donc (n£fe)an+fc2fc —► 0, si z G Zp (i.e. si \z\p < 1). On en déduit, grâce à Pultramétricité
de | |p, la convergence de la série de ^ sur Zp, ce qui démontre le (i).
Maintenant, si z, zq G Zp, on a
+oo +oo n / \
F(z) = ^an (z0 + (z- z0))n = J>(£ uH"~*(* - *)*)■
n=0 n=0 V fe=0 W
Or la suite double cinQz^z — z0)n~k tend vers 0 à l'infini, ce qui permet, grâce à l'ul-
tramétricité de | |p, de réordonner la série comme on veut ; on en déduit le (ii) en posant
n = m + k, ce qui nous donne
+oo +oo / , , \ +00
~"(z-zo)k.
-t-oo -t-oo / , v -t-oo
F« = E (E k )«-**•)(* - «y = y,
fc=0 m=0 ^ ' fc=0
F(fc)(*b)
A;!
Le (ii) permet, en faisant le changement de variable z = zq + h, de supposer que 2o = 0
pour démontrer le (iii). On a
|FW7F(0) - F'(0)l = \hf^anhn-\ ^ \h\p sup |an|p, si h G ZP,
et donc ™ \ ~ ^'(0) ten<^ vers 0 quand /i —► 0, ce qui montre que z i-> F(z) est
dérivable en 0 et que sa dérivée en 0 est F'(0). On en déduit que z i-> F(^) est dérivable
sur Zp et que sa dérivée en zq est la somme de la série F7 en zq. Une récurrence immédiate
permet d'en déduire le (iii).
Enfin, |^% < supn€N\(n+kk)an+kzk\p < supn>fc |an|p, si z0 G Zp, et donc ^& - 0
puisque an —► 0, et supfc€N |F fc{*°'| < supn€N |an|p. Pour démontrer l'inégalité inverse, il
suffit d'appliquer ce qui précède à G(z) = J2t=o ^kP1 * : on a an = ? = ^pi.
On dit que </> : Zp —> Qp est analytique s'il existe F = J]n€NW1B € QP[[T]], avec
bn —> 0, telle que <f>(x) = F(x) pour tout x G Zp. Il résulte de la prop. D.3.1 que <f> est
alors fé*00 sur Zp et que bn = * "J® ; en particulier, bn est déterminé par </>, ce qui permet
de le noter bn (</>).
On munit l'espace An(Zp) des fonctions analytiques sur Zp de la norme || ||aii définie
Par II^Hah = supn€N \bn(<f>)\p. D'après la prop. D.3.1, on a aussi ||0||An = supn€N |^^|p,
pour tout x G Zp. De plus, il est clair que <f> i-> (&n(</0)neN est une isométrie de An(Zp)
sur ^q°(N); on en déduit que An(Zp) est un espace de Banach p-adique dont les rcn,
pour nGN, forment une base orthonormale.
486
ANNEXE D. FONCTIONS D'UNE VARIABLE p-ADIQUE
2. Fonctions localement analytiques
On dit que </> : Zp —> Qp est localement analytique^, si pour tout a G Zp, il existe
h(a) G N tel que x i-> <f>(a + ph^x) soit analytique sur Zp. D'après la prop. D.3.1, si
x i-> <f>(a-\-ph^x) est analytique sur Zp, il en est de même de x i-> ^(è+p^rr), pour tout
6 € a+p^^Zp. Maintenant, comme Zp est compact, on peut extraire un sous-recouvrement
fini du recouvrement de Zp par les ouverts a-\-ph^Zp. Si on note h le minimum des h(a)
apparaissant dans ce sous-recouvrement fini, alors x \-> (f>(b + phx) est analytique sur Zp,
pour tout b G Zp ; autrement dit, h(a) peut être choisi indépendamment de a € Zp.
Notons LA(ZP) l'espace des fonctions localement analytiques sur Zp et, si h G N, soit
LAft(Zp) l'espace des fonctions <f> : Zp —> Qp telles que x i-> </>(a + phx) est analytique
sur Zp, pour tout a G Zp. Alors LA/^Zp) C LA^+^Zp), et la discussion ci-dessus montre
que LA(Zp) = U^NLA^Zp).
Soit S un système de représentants de Zp modulo ph. On peut alors écrire toute fonction
<j> : Zp —> Qp, de manière unique, sous la forme X)jgs -^H-p^z^'Cl?)' ou les 4>j sont des
fonctions de Zp dans Qp (de manière explicite, <f>j est la restriction à Zp de x »-► <f>{j+phx)).
Ceci permet de munir LA/t(Zp) d'une norme || Hla/, en posant H^Ula/, = supj€S ||0j||aii>
et la prop. D.3.1 montre que ceci ne dépend pas du choix de S (dans la suite, on prendra
S = {—1,...,— ph}). Par construction, l'application <j> i-> ((j>j)j€s est une isométrie de
LAh(Zp) sur An(Zp)pl, ce qui prouve que LA^(Zp), muni de la norme || Hla/,» est un
espace de Banach p-adique.
Théorème D.3.2. (Amice, 1964)
(i) Les [pWQ, pour n G N, forment une base orthonormale de LA/t(Zp).
(ii) (j> G LA(Zp) si et seulement si la suite de ses coefficients de Mahler est à décroissance
exponentielle.
Démonstration. Le (ii) est une conséquence du (i). En effet, si <f> G LA(ZP), il existe
h G N tel que <f> G LA/^Zp), puisque LA(ZP) = U/lGNLA/l(Zp). D'après le (i), cela implique
que <f> = EneN^nlpl]!©, où bn -> 0. On a alors an(cf>) = bn[fi]\ ; il existe donc C > 0 tel
queM0lp<C|[£]!|p.
Or, d'après l'ex. 1.4 du Vocabulaire, on a vp(m\) = m~51m^, où S(ra) est la somme des
chiffres de m dans son écriture en base p. Comme m a au plus ^^ chiffres non nuls et
comme ces chiffres sont < p — 1, on obtient les encadrements
-^-^WmlX-^ et p-^'Ulml^mp-^1).
(2)Bien que la définition soit identique à celle d'une fonction analytique ou holomorphe sur C, on ne les
appelle pas comme ça car ces fonctions ne vérifient pas l'unicité du prolongement analytique.
D.3. FONCTIONS LOCALEMENT ANALYTIQUES SUR Z;,
487
En appliquant ceci à m = [4-], on en déduit la majoration
|[£]!l < nCfcfî,où rfc = p-V(^i^ et Ch = P-
lpfcJ'ip ^ ft ft' rt ~^ ft p/i '
et la décroissance exponentielle de an((f>).
Réciproquement, si rn\an{<t>)\p —► 0, avec r > 1, il existe /i G N tel que r^ > r_1, et
alors {l3^V)~lan{(f>) —» 0, ce qui implique que <f> G LAft(Zp).
3. Bases orthonormales d'espaces de fonctions localement analytiques
On a démontré que le (i) du th. D.3.2 impliquait le (ii). Pour démontrer le (i), écrivons
n G N sous la forme n = (m(n) + l)ph — à(n), avec i(n) G {1,... ,ph} et m(n) G N (une
telle écriture est unique). On note alors en la fonction x i-> ln+p/»Zp(x)(x+in')m^, et gn
le polynôme [px]'^)- Notre but est de prouver que les gn, pour n G N, forment une base
orthormale de LA/l(Zp). Pour cela, nous allons prouver que :
• les en, pour n G N, forment une base orthormale de LA/l(Zp) (lemme D.3.3),
• 9n appartient à la boule unité B^ de LAft(Zp),
• la matrice exprimant les réductions gnJ pour n < (m + l)ph — 1, en fonction des
ën, pour n ^ (m + l)ph — 1, est une matrice inversible, pour tout m G N (ces deux
derniers points sont une conséquence du lemme D.3.4, comme il est expliqué juste avant
la démonstration dudit lemme).
D'après la prop. II.4.8, le premier point implique que les ën, pour n G N, forment une
base algébrique de B^/pB^ sur Fp. Le dernier implique alors qu'il en est de même des gn,
pour n G N, ce qui, d'après la prop. II.4.8, implique que les gn, pour n G N, forment une
base orthormale de LA/t(Zp), ce que l'on veut démontrer.
Lemme D.3.3. Les en pour n G N forment une base orthonormale de LAft(Zp). Plus
précisément, si <f> G LA/^Zp) et si <t>i{x) = </>(—i + phx), alors
• <f>i est analytique sur Zp et donc <f>i(x) = Z)m€N ai,mXm, où aitm —> 0,
m <t> = l2i=l zZm€Nai,me(m+l)ph-i = 2-m€N ai(n),m(n)en>
• ||0||lA/( = SUpnGN |û!i(n))m(n)|p.
Démonstration. Cela résulte de l'identité <f>{x) = X)?=i l-t+pfez„(a;)^«(a3î) et de ce Que
II^Hla,, = supWp,. H^lUn-
Si j G {1,... ,ph}, soit gn>j le polynôme défini par gnj(x) = gn{-j + Phx). On a donc
y ' fc=o
Lemme D.3.4- (i) 9n,j ^t à coefficients dans Zp.
(ii) «S'a réduction ~gnj modulo p vérifie :
• 9n,j = 0sij> i(n),
488
ANNEXE D. FONCTIONS D'UNE VARIABLE p-ADIQUE
• deg(pnJ) = m(n) si j = i{n),
• deg(pnj) < m(n) si j < i(n).
Ce lemme permet de terminer la démonstration du th. D.3.2. En effet, le (i) implique
que gn appartient à la boule unité de LA/t(Zp). Le (ii) se traduit par l'existence d'éléments
aj,m G Fp, pour m < ra(n), nuls si j > t(n), tels que gnJ = J2Z=o aj,mXm. D'après le
lemme D.3.3, on a alors gn = Em(*Km(n) am,m(k)^k' Maintenant, si n ^ (m + l)ph - 1,
alors m(k) ^ ra(n) implique que k < (m + l)ph — 1. Il en résulte que les pn, pour
n ^ (m + \)ph — 1, s'expriment en termes des ë^, pour k < (m + l)ph — 1. On note Mm
la matrice ainsi obtenue. Le (ii) du lemme implique alors que si on découpe la matrice
Mm en blocs de taille ph x ph, on obtient une matrice triangulaire supérieure par blocs et
chacun des blocs diagonaux est triangulaire inférieur avec des éléments inversibles sur la
diagonale (cette inversibilité résulte de ce que deg(#nj) = ra(n) si j = i(n)). La matrice
Mm est donc inversible, ce qui montre que le lemme D.3.4 fournit les points manquant
pour démontrer le th. D.3.2.
4. Démonstration du lemme D.3.4
Soit Knj = {k < n — 1, vp(j + k) ^ h}. L'application k i-> j; + k induisant une bijection
de Knj sur l'ensemble des entiers de [j, j + n — 1] = [0, j + n — 1] — [0, j — 1] qui sont
divisibles par ph, on a |Knj| = P'ffi"1] - [Çr], et donc |Knj| = m(n) + 1 si j > i(n) et
|KnJ| = ra(n) si j < t(n).
On a gnj = Cnjfnj, OÙ Cnj G Q* et fnJ = Uk€Kntj (X " $0 Uh^Knj (l " j£î) est Un
polynôme à coefficients dans Zp dont la réduction fnj modulo p est ELeR,. C3' — &)> ou
Pk € Fp est la réduction modulo p de *Jr. Comme le degré de /nj est le cardinal de Knj,
le lemme est équivalent aux résultats suivants :
• vp(cnj) > 0, pour tout j,
• vp(cnj) = 0, si j = i{n),
• M°nj) > °> si 3 > *(**)•
On obtient la relation Cnj]\keKn . (^px^) = [pl]!^IYk=o(~J ~ &) en identifiant les
termes constants. On a donc
^=Êi!i ii^ik-j-*)-
En utilisant l'identité vp(n\) - vp([fi]\) = J2e=i [pr] (cf. ex. 1.4 du Vocabulaire), et
k=o e=i e=i p p
D.4. LA FONCTION ZÊTA p-ADIQUE
489
on en déduit la formule
^)=è([^i-[^]-$0-
Comme [x + y] ^ [x] + [y], chacun des termes de la somme est ^ 0, et donc vp(cnj) ^ 0,
ce qui démontre le premier point.
Pour démontrer le second, on utilise la formule — [^] = [^] + 1, valable quels que
soient a € Z et 6 6 N - {0}, ce qui nous donne
Vp(Cn,iin)) =2^[[ ~t J - [—jjT-\ ~ [ ~e \)
= J2((m(n)P'^ - 1) + (l + [^M]) - (m(n)p»-t + £*&])) = 0.
e=i p p
Enfin, pour démontrer le troisième, constatons que ["""À"1] — [^r] — [-lt] = 1, si j > î(n),
et donc vp(cntj) ^ 1.
Ceci permet de conclure.
D.4. La fonction zêta p-adique
Kummer, dans son travail sur le th. de Fermât (cf. note 9 du chap. VII), a
découvert des congruences modulo pn entre les valeurs aux entiers négatifs de la fonction zêta
(cf. ex. D.4.9), ce qui, quand on y pense, est assez intrigant : la fonction £ est définie par
une série ne convergeant pas en les entiers négatifs ; on la prolonge analytiquement
(l'existence d'un tel prolongement est déjà un peu miraculeux), et on découvre que les valeurs
aux entiers négatifs sont des nombres rationnels et, cerise sur le gâteau, que ces nombres
rationnels ont des propriétés p-adiques remarquables, pour tout nombre premier p...
Les congruences de Kummer ont été réinterprétées par Kubota et Leopoldt (1964)
comme une propriété de continuité p-adique de la fonction n »-► Ç(—n), ce qui les a menés
à la construction de la fonction zêta p-adique.
Théorème D.J^.l. Si i € Z/(p — 1)Z, il existe une unique fonction Cp.i, continue
sur Zp (resp. Zp — {1}) si i ^ 1 (resp. si i = 1), telle que (p,i(—n) = (1 — pn)Ç(—n) si
n G N vérifie —n = i modulo p — 1.
Remarque D.4-2. (i) Comme nous le verrons, la continuité de n h C(—n) est une
conséquence de celle de n i-> rcn, si x € Z*.
(ii) Si i e {1,... ,p — 1}, l'ensemble des —n = i, avec n € N, est l'image de N
paire h^ i — (p— l)(x + 1), et comme N est dense dans Zp et p — 1 G ZJ, cet ensemble est
dense dans Zp. On en déduit l'unicité de ÇPti ; par contre son existence n'est pas du tout
automatique et relève un peu du miracle. La fonction ÇPj est appelée la i-ème branche
490
ANNEXE D. FONCTIONS D'UNE VARIABLE p-ADIQUE
de la fonction zêta p-adique. Si i est pair et p ^ 2, alors ÇPj est identiquement nulle car
£(—n) = 0 si n ^ 2 est pair.
(iii) Les zéros de la fonction C, p-adique (contrairement à ceux de la fonction £ de
Riemann...) sont bien compris : ils faisaient l'objet de la « conjecture principale » qui a
été démontrée par Mazur et Wiles (1984).
1. Intégration p-adique
Une mesure \x sur Zp est une forme linéaire continue sur ^(Zp). On écrira /Lt(</>) sous la
forme plus parlante /z <f)(x)fi(x) ou simplement sous la forme /z <f>fi.
Si fi est une mesure sur Zp, on note ||/^||oo la norme de \i en tant qu'opérateur, c'est-à-
dire le sup. de \fz>MP, avec ||0||oo < 1.
• On note n(a + pnZp) la mesure de a + pnZp (i.e. l'intégrale fz la+pnZpfj,).
• Comme a + pnZp est la réunion disjointe des a + jpn +pn+1Zp pour 0 < j < p - 1, on
a fi(a + pnZp) = £££ fi(a + jpn + pn+1Zp).
• Comme ||la+p«zp||oo = 1» les n(a + pnZp) sont bornés (on a \n(a + pnZp)\ < HmIIoo).
Si on utilise le fait que <f> G ^{Zp) est la limite dans if(Zp) de Y?a^ 0(a)la+p»Zp
(cf. solution du (v) de l'ex. 20.6 du Vocabulaire) et la continuité de fi, on obtient
i
p»-i
<f>H= lim V" <f>{a)n(a + pnZp),
n—H-oo •
a=0
formule qui ressemble beaucoup à une somme de Riemann.
Remarque D.4-3. (i) Réciproquement, si on se donne une famille fj,(a + pnZp), pour
a G Zp et n G N, d'éléments de Qp vérifiant les conditions :
• fi(a + pnZp) = /i(b + pnZp) si vp(a - b) > n,
• ^a + pnZp) = Y& K<> + JPn + Pn+1ZP),
• il existe C e R tel que |/ti(a + pnZp)| < C quels que soient a G Zp et n G N,
alors les deux premières permettent d'étendre \i en une forme linéaire sur l'espace LC(ZP)
des fonctions localement constantes sur Zp, et la troisième implique que |//(</>)|p < C||</>||oc»
ce qui permet (cf. n° 17.2 du Vocabulaire) d'étendre /j,y par continuité, à ^(Zp).
(ii) Il n'y a pas de mesure de Haar en p-adique et donc aucun moyen canonique d'associer
une mesure à une fonction. En effet, une mesure /i, qui est invariante par translation sur Zp,
doit vérifier fj,(a + pnZp) = ^//(Zp), et donc \n(a-\-pnZp)\p = pn\n(Zp)\p, quels que soient
a G Zp et n G N. Ceci n'est possible que si fi(Zp) = 0 (et donc si \i = 0) car les fj,(a+pnZp)
doivent être bornés en norme par \\fi\\oo-
A une mesure, on associe la série formelle «e^(T) = J2nS)^nJz ©^0*0 appelée
transformée d'Amice de fi. C'est un analogue p-adique de la transformée de Fourier : on a
formellement ^(T) = fz(l + T)xfi(x) puisque (1 + T)* = ££S ©Tn> et on Peut voir T
D.4. LA FONCTION ZÊTA p-ADIQUE
491
comme un analogue p-adique de e2m — 1 (qui a le mauvais goût d'être nul dans le monde
réel bien que e2inx ne soit pas toujours égal à 1...).
Théorème D.4-4- L'application fi i-> «e^ est une isométrie de l'espace des mesures
muni de || ||oo sur l'espace des séries formelles à coefficients bornés muni de la norme du
sup. des normes des coefficients.
Démonstration. Comme les (*) forment une base orthonormale de ^(Zp), le résultat est
un cas particulier de la prop. II.4.9. De manière explicite, l'application réciproque associe
à £neN bnTn, où (6n)nGN est bornée, la mesure fi définie par n(4>) = J2t=o Mn(#) si <f>
est une fonction continue sur Zp.
Si z G Cp vérifie \z - l|p > 0, alors (z - l)n -> 0, et la série </>z(x) = £+~ 0(z ~ 1)n
converge uniformément et définit une fonction continue x i-> <f>z{x) sur Zp, à valeurs
dans Cp (si z G Qp, cette fonction est à valeurs dans Qp). D'autre part, si k G N, on
a <t>z(k) = zk, ce qui nous permet de noter de manière plus parlante x i-> zx la fonction
x i-> (f>z(x). On a zx+y = zxzy quels que soient x,y € Zp car cette formule est vraie si
rc, y G N, et N2 est dense dans Z2.
Ceci s'applique en particulier à z G /zp„ (cf. ex. 20.3). On a alors zx+pnk = zx quel que
soit A; G N et donc zx = zy, si y G x + pnZp, ce qui fait que la fonction x i-> zx est
localement constante.
Si fi est une mesure sur Zp, on peut étendre n en une forme Cp-linéaire continue sur
l'espace ^(Zp, Cp) des fonctions continues sur Zp, à valeurs dans Cp, grâce à la formule
Jz (f>fi = limn-.+oo XI^q1 </>(a)/i(a + pnZp) (la convergence se démontre en utilisant la
continuité uniforme de </>, comme dans le cas d'une fonction à valeurs dans Qp). Le lemme
suivant montre que l'identité £^(T) = fz (1 + T)xn(x) n'est pas que formelle.
Lemme D.J^.5. Si \z\p < 1, alors /z (1 + z)xfi(x) = ^(z)
Démonstration. La suite de fonctions x i-> X)n=o CD*n converSe uniformément sur Zp
vers x i-> (l + z)x (le reste est plus petit en norme || ||oo que |2|p+1) ; on peut donc échanger
intégration et somme, d'où le résultat.
Corollaire D.4.6. SiieZp etneN, alors fi(i + pnZp) = ± £„6/i n rf1 £#»{?) - 1).
Démonstration. On a
J^ \0 «mon,
et la fonction caractéristique de i + pnZp est donc -^ ^^ r}x~\ On peut donc utiliser
le lemme D.4.5 pour conclure.
492
ANNEXE D. FONCTIONS D'UNE VARIABLE p-ADIQUE
2. La mesure \ia
Dans tout ce qui suit, a est un entier ^ 2, premier à p. On peut appliquer la
proposition VII.2.6 à la fonction
qui est fé700 sur R+ (on s'est débrouillé pour supprimer le pôle en 0), et à décroissance
rapide à l'infini ainsi que toutes ses dérivées. Comme
1 r+co Ht 1 — A1-s f+°° 1 Ht
M mti=~wrL tVt-'1-^ siRe(s)>1-
on obtient la formule suivante pour les valeurs de Ç(s) aux entiers négatifs.
Lemme D4.7. Si n <E N, alors (1 - a1+n)C(-n) = (-l)n/on)(0).
Proposition D.4..8. Il existe une (unique) mesure \xa sur Zp telle que, pour tout
neN, on ait fZp xn^a = (-l)n(l - a1+n)C(-n).
Démonstration. L'unicité de fia vient de ce que la connaissance de Jz rcn//0, pour tout
n G N, équivaut à celle de Jz (*)^a> P°ur tout n € N, et donc à la transformée d'Amice
de fia ; or celle-ci détermine \ia d'après le th. D.4.4.
Soit Fa(T) = f — (1+T)a_p de sorte que F0(e* — 1) = fa(t) (comme série formelle en t).
On peut écrire (1 + T)° - 1 sous la forme aT(l + Tp(T)), où g(T) = En^2 Hn)'1™"2
appartient à ZP[T] car a est inversible dans Zp, puisque premier à p. Il en résulte que
1 +00
Fo(T) = T " (1 + T)°-1 = E(-T)"-l3" € ZP[[T]],
et donc que Fe est la transformée d'Amice d'une mesure \ia puisque F0 est à coefficients
bornés car entiers. Maintenant, fz xn\xa est la dérivée n-ième en t = 0 de la série formelle
&(t) = fZp etxfia. Or ete = (1 + (e* - 1))*, et donc &(t) = Fa(et - 1) = fa(t). On déduit
donc du lemme D.4.7 que fzxnfj,a = (~l)n(l - a1+n)C(-n)> ce qui permet de conclure.
Exercice D.4.9. Montrer que (1 - al+ni)Ç(-ni) = (1 - a1+n2)C(-n2) mod pfc, si ni,n2 > k, et si
ni = ri2 mod (p — l)pfc_1. (On montrera que \\xni — #n2||oo ^ P~k et H^alloo ^ 1-)
3. Continuité de la fonction n i-> xn
Si x G Zp, il n'existe pas toujours de fonction continue 5 i-> xs prenant la valeur xn en
s = n pour tout n G N, mais on dispose d'une fonction multivaluée, dont les branches
sont indexées par Z/(p — 1)Z, qui joue le rôle de xs (cf. prop. D.4.13).
Lemme D.4.IO. Si a,b e Zp, et si \a - b\p < p~l, alors \ap - b"\p < p~l\a - b\p.
D.4. LA FONCTION ZÊTA p-ADIQUE
493
Démonstration. aP-lf = p(a - b) Y%=o ï (ï) (a ~ b)p * * > et tous ^es termes de la somme
appartiennent à Zp grâce à l'hypothèse \a — b\p ^ p-1 et à la divisibilité de (J) par p, si
1 < i < p — 1 (ex. 1.4 du Vocabulaire). Cela permet de conclure.
Proposition D.J^.lî. (i) Si a G Zp, la suite (ap")nGN a une limite u{à) G Zp vérifiant
\a-u(a)\p <p_1.
(ii) On a u{a) = 0 si a G pZp, et u{a) G \ip_x si a G Z*.
(iii) uj{ab) = u(a)u){b), pour tous a,b G Zp.
Démonstration. Si a € N, on a \aP — a\p < p-1 d'après le petit th. de Fermât. Comme N
est dense dans Zp, cette inégalité est vraie pour tout a G Zp, par continuité de a i-> \ap—a\p.
Le lemme D.4.10 permet donc d'en déduire, par récurrence sur n, que \un+i —un\p < p~n,
où l'on a posé un = aP". Il en résulte que un a une limite u(a) puisque un+\ —un—>0, et
que a - u(a) = £*5(«n - «n+i) a une norme < supn€N \un - un+1\p < p-1. D'où le (i).
Maintenant, u>(a)p = u>(a) car u(a)v est limite de la suite (apn )neN-
• Si a G pZp, alors |ap"|p ^ P~p'\ et donc apn —> 0 et u>(a) = 0.
• si a G Z*, alors u>(a) ^ 0 puisque \a\p = 1 et |a — w{a)\p < p-1. Comme o>(a)p = w(a),
on a o>(a)p-1 = 1, ce qui démontre le (ii).
Enfin, w(ab) = lim(a6)p" = lim^V = (limapn)(limftp") = u(a)uj(b).
Remarque D.4.12. (i) Il résulte de la proposition précédente que u : Z* —► iip_x est un
caractère linéaire ; c'est le caractère de Teichmùller.
(ii) Si rr G ZJ, on pose {x} = uj(x)~1x. On a |(x) - l|p < p-1 puisque |rc -u{x)\p ^ p"1.
Proposition D.J^.IS. (i) 5z s G Zp et i G Z/(p — 1)Z, la suite de terme général xn,
pour n G N, n = i modp— 1, a une limite (on note xs,t cette limite).
(ii) On a xs'1 = 0 sixe pZp, et xs'{ = uj(xY{x)s, sixeZ*.
(iii) rcn,i = xn si n G Z es£ congru à i modulo p — 1, et si x eZ*.
Démonstration. • Si a; G 1 + pZp, la fonction shï5 = DnS CD 0e — *)n est> comme
nous l'avons déjà vu, une fonction continue qui vaut xn> si n G N. D'où l'existence de
xs,t _ xs
• Si x G pZp, la suite de terme général xn tend vers 0 quand n tend vers +00.
• Si x G Zp, on peut écrire x sous la forme u(x){x) et rcn sous la forme uj{x)n(x)n.
Comme {x) G 1+ pZp, la fonction n i-> (rc)n se prolonge par continuité et u>(x) étant une
racine (p— l)-ième de l'unité, la fonction n t-> w(x)n est périodique de période p— 1. Ceci
fait que, si on fixe i G {0,1,... ,p — 1} et si x G ZJ, la fonction x i-> rcn de à + (p — 1)N
dans Zp se prolonge par continuité en une fonction continue sur Zp.
On en déduit les (i) et (ii). Le (iii) résulte de ce que {x)n = xnu>(x)n si n G Z et
u(x)n = (jj(xY si n = i mod p - 1 et x G Z*.
Lemme D.4.14- Si n est une mesure sur Zp, et si i G Z/(p— 1)Z, alors s \-> /z rc5,t )U
es£ continue sur Zp.
494
ANNEXE D. FONCTIONS D'UNE VARIABLE p-ADIQUE
Démonstration. On a a** = £+~ (J)(lz; («)"(*)*(<*> - l)n), et comme |(*)|p ^ 1,
si s 6 Zp et ||lz;,(a;)a'(a:)t((rc) — l)n||oo ^ P~n, cette série converge dans ^(Zp), ce
qui permet d'intervertir série et intégrale, et d'obtenir /z xs,t fi = J2t2)an(0> avec
an = /ZplZ|*(a;)w(rc)i((rc) - l)n^. On a alors |an|p < p~n||A*||oo, et donc an -> 0, ce
qui permet de conclure. (La majoration |an|p < P-n||Mlloo montre qu'en fait s i-> /z x5,i/A
est analytique si p ^ 3 (si p = 2, cette fonction est analytique sur 2Z2 et sur 1 + 2Z2).)
4. Restriction de fia à Z*
Si U est un ouvert compact de Zp, et si \i est une mesure sur Zp, on note Resu/x la
restriction de // à U : c'est la mesure définie par /z </>ResuA* = Jz lu^A* (Que l'on note
aussi Ju^n)- Le cor. D.4.18 ci-dessous^ montre que restreindre fia à Z* fait sortir un
facteur d'Euler en p. Il est rare que le lien entre une mesure et sa restriction à Z* soit
aussi simple.
Lemme D.J^.Î5. Soit c un entier ^ 1, et soit i G {0,1,... ,c — 1}.
m lim (!+*)* 1 _ i c-1
W lim*-0 (i+z)c_i - « - -c --&>
(w\ i v ici. — i — ç=i
VXV c Z^7/€/*,:-{l} t;-1 — c 2c •
(iii) Si (a, c) = 1, alors \ E^c-{i} £f = ^ - <£, *û [a"1»] G {0,1,..., c - 1} est
le représentant de a~li G Z/cZ.
Démonstration. On a jfëfc = ^3^ = £(1 + iz - c-^z + • • • ), d'où le (i).
On a 1 V -2IÏ — lim « IV **"* L pf IV **"* _ (1+*)*
Wli <* c Z-fije/Jte-il} 7/-1 ~ limz->0 c Z^t;€M,.. (1+z)t;-1 cz et c ^t/€Mo (l+^)»7-l ~~ (l+z)c-l
(cela résulte de ce que limz^7?-i_1((l + z)rj - l)^)'-! = c^-i^-i = *?"*> si 77 € /zc). Le
(ii) est donc une conséquence du (i).
Enfin, 77 »->• 77° est une bijection de \xc car (a, c) = 1, et on a 77"* = (r}a)~^a~li\ si 77 € /xc,
ce qui permet de déduire le (iii) du (ii).
Si b G Qp a pour écriture ^2^.kp% en base p (les 6* appartiennent à {0,... ,p - 1}),
on note {b} l'élément J^-fcP*^» de Q : c'est l'unique élément de Z[^] D [0,1[ tel que
b - {b} G Zp. On a {b} = {b'} si et seulement si b - b' G Zp.
Lemme D.4.I6. fj,a(i + pnZp) = {^} - a{^r} + g^, pour tous i G Zp et n G N.
Démonstration. Quitte à remplacer i par un représentant mod pn, on peut supposer
i G {0,1,... ,pn - 1}. On a, d'après le cor. D.4.6,
Mi + p"Zp) = i £ „-*<(„ - 1) = 1^.(0) +1 £ (£1 - .-^y).
<3)La démonstration proposée est assez pataude mais elle permet de ne pas sortir de Qp ; l'ex. D.4.19 en
suggère une plus élégante.
D.4. LA FONCTION ZÊTA p-ADIQUE
495
Il résulte du (i) du lemme D.4.15 que «e^a(0) = i^, et du (ii) et (iii) du même lemme
que £ E^Mp„-{i} fi = ^ - ^ et £ E^-d) £r = ^ " ^r- On conclut en
remarquant que {^r1} = ^A
Lemme D.4.17. On a fpZ (j>(^) /ia = fz 4>\ia, pour tout (f> G ^(Zp).
Démonstration. Si <f> G të(Zip), soit [p] • <f> la fonction définie par ([p] • </>)(rc) = (f>(%)>
si z G pZp, et ([p] • <t>){x) = 0, si rc G ZJ. Alors [p] • <£ € ^(Zp) et [p] : <*f(Zp) -► <â?(Zp)
est linéaire, et continue puisque ||[p] • </>||oo < ||0||oo- Il s'ensuit que A = \ia ° ([p] — 1) est
une mesure sur Zp. Maintenant, si i G Zp et n G N, on a [p] • li+p»z,, = lpi+P»+%, car
- G i + pnZp équivaut à z G pi + pn+1Zp. On a donc, d'après le lemme D.4.16,
f li+p»Z„A = fia(i + pnZp) - ^{pi + pn+1Zp)
«i -, ru-1*-. a—lx /rP*-» f a_1pi 1 a—lx
^} - 4^r} + —) - ({^î) - °{^r} + —) = o-
Il s'ensuit, par linéarité, que A est identiquement nulle sur LC(ZP), et donc aussi sur ^(Zp),
puisque LC(ZP) est dense dans ^(Zp) et que A est continue. On en déduit le résultat car
/Zp ^ WpZp ^(p9 Ma "/Zp 0AV
Corollaire D.4.I8. SineN, alors fz. xn\ia = (-l)n(l - an+1)(l - pn)C(-n).
Démonstration. Jz;rc>0 = $ZpXn\ia - fpZpXnfia et fpZpXnfia = Pn/pZp(^)V =
Pn fz ^Va, d'après le lemme D.4.17. Ceci permet de déduire le résultat de la prop. D.4.8.
Exercice D.4.19. (i) Établir la formule lZ;(a;) = 1 - £ E„eM rf-
(ii) En déduire que la transformée d'Amice de Resz;M est ««^(T) - £ Ej,eM «^(C1 + T)7/ ~ *)> si M est
une mesure sur Zp.
(iii) Montrer que la transformée d'Amice de Resz*/*o est $4^ — «c^t0((l + T)p - 1) et retrouver le
résultat du cor. D.4.18.
5. Construction de la fonction zêta p-adique
Passons à la démonstration du th. D.4.1. Si i G Z/(p — 1)Z et si a G ZJ, définissons
une fonction gaj sur Zp par
Cette fonction est continue en dehors des zéros de s h 1 - o>(a)1-ï(a)1_s, d'après le
lemme D.4.14. Par ailleurs, si -n = i [p - 1], on a w(a)1_i = u(a)l+n et u{x)~l = u(x)n
496
ANNEXE D. FONCTIONS D'UNE VARIABLE p-ADIQUE
si x e Z* et donc, d'après le cor. D.4.18,
te(~n) = l-u,(a)H-(a)1+n l. "(*)"<*>"M*) = YT^ /z. *"*(*)
= '(-l)"(l-p")C(-n)
Pour conclure, il suffit donc de trouver un a tel que 5 i-> 1 — w(a)1-î(a)1-s ne s'annule pas
sii ^ 1 et ne s'annule qu'en 5 = 1, si i = 1.
• L'image de 1— o>(a)1-t(a)1-s dans Fp est celle de 1—a1-î. Maintenant, si à ^ 1, on peut
choisir un représentant de i dans Z appartenant à {2,... ,p— 1}, ce qui fait que l'équation
xx~% = 1 a moins de p — 2 solutions dans Fp si i ^ 1. Il existe donc a 6 N tel que l'image
de 1 — a1_t dans Fp soit non nulle, et pour un tel a, la fonction s t-> 1 — a>(a)1_i(a)1_s ne
s'annule pas.
• Si u e 1 + pZp, et si a; G Zp - {0} vérifie ux = 1, alors uax = 1, pour tout a G N,
et donc aussi, par densité de N dans Zp et continuité de a t-> uax, pour tout a e Zp. Si
Vp(:c) = k, et si a = pfcrc_1, on a a e Zp, et donc up ' = 1, ce qui montre que la fonction
«i-»us-lne s'annule pas si w n'est pas une racine de l'unité d'ordre une puissance de p.
On peut donc prendre pour a n'importe quel élément de N tel que (a) ne soit pas une
racine de l'unité (par exemple a = 1 + 2p), et alors s i-> 1 — w(a)1-t(a)1-s ne s'annule
qu'en s = 1, si i = 1.
ANNEXE E
IRRATIONALITÉ D'UNE INFINITÉ DE C(2n +1)
Cet appendice est consacré au résultat de Rivoal (2000) mentionné dans la note 9 du
chap. III selon lequel il existe une infinité de n ^ 1 tels que £(2n + 1) est irrationnel. On
va en fait démontrer un résultat plus fort (cf. (i) du th. E.l.l ci-dessous).
E.l. Indépendance linéaire de nombres réels
Si les Vi, pour i G I, sont des réels, on note Vect(i^, i G I) le sous-Q-espace vectoriel
de R engendré par les v», et on note diniQ Vect(vi, i G I) sa dimension. Par exemple, v
est irrationnel si et seulement si diniQ Vect(l,v) = 2.
Théorème E.l.l. (i) dimQ Vect(C(2n+ 1), n ^ 1) = +oo.
(ii) dimQ Vect(C(2n), n ^ 1) = +oo.
Remarque E.l.2. (i) Le (ii) permet de redémontrer la transcendance de ir due à Lin-
demann (1882). En effet, comme C(2n) G Q7r2n (cf. ex. V.5.3), le (ii) est équivalent à
n'importe lequel des énoncés suivants :
• dimQ Vect(7r2n, n ^ 1) = +oo.
• 7r est transcendant.
• 1 et les 7r2n, pour n ^ 1, sont linéairement indépendants sur Q.
• 1 et les C(2n), pour n ^ 1, sont linéairement indépendants sur Q.
(ii) On conjecture que 1 et les Ç(ri), pour n ^ 2, sont linéairement indépendants sur Q,
mais on est loin de savoir démontrer un tel énoncé : en particulier, on ne sait pas prouver
que £(5) est irrationnel; l'irrationalité de Ç(3) (prob. H. 12) remonte à 1979 (Apéry).
1. Le critère de Nesterenko
Pour démontrer que deux nombres vi, v2 sont linéairement indépendants sur Q, il suffît
de produire deux suites d'entiers (an>i)nGN, pour i = 1,2, telles que aUtiVi + an%2v2 ^ 0,
pour n assez grand, et limn_>+00 dn,iVi + an^2v2 = 0 (en effet, si v2 = ^Vi, avec d G N — {0}
et c G Z, alors \a\V\+a2v2\ = |da*+ca? | ^l ^ ^M, si ai,a2 G Z et a\V\ + a2v2 ^ 0). Dans
le cas général, on dispose du critère suivant, dû à Nesterenko.
498
ANNEXE E. IRRATIONALITÉ D'UNE INFINITÉ DE <(2n + 1)
Théorème E.1.3 (Critère de Nesterenko). Soient V\,...,vb G R. On suppose qu'il
existe B > 1, A > 1 et des combinaisons linéaires Ln = aUy\V\ H \- aHybvb, pour n G N,
0 coefficients entiers, vérifiant :
(i)Ei^K)KBn+0(ft);
(ii) |an)ivi + • • • + an,bvb\ = A~n+°(n).
Alors diiriQ Vect(vi,..., vb) ^ 1 + {^.
Dans le cas qui nous intéresse, on dispose d'une machine (cf. prop. E.2.1 ci-dessous) à
fabriquer des relations linéaires à coefficients rationnels entre les Ç(n), n ^ 2, en partant
de fonctions rationnelles n'ayant des pôles qu'aux entiers < 0 ; le problème est alors de
bien choisir ces fonctions rationnelles pour que les combinaisons linéaires ainsi obtenues
permettent d'utiliser le critère de Nesterenko.
Démonstration. Quitte à diviser vi,..., vb par v1} on peut supposer que V\ = 1. Soit
1 = wo, w\,..., wr une base de Vect(vi,..., vb) sur Q. On peut exprimer les Vi dans cette
base et multiplier tout par le ppcm des dénominateurs des coordonnées des Vi ; les Ln
deviennent alors des combinaisons linéaires de tuo,... , tur> à coefficients entiers, vérifiant
les mêmes estimées que dans l'énoncé (avec de nouveaux o(n), différant des o(n) initiaux
par l'addition de constantes). On s'est donc ramené à prouver l'énoncé suivant :
Si 1 = wo,... ,wr sont linéairement indépendants sur Q, et s'il existe B > 1, A > 1 et
des formes linéaires Ln(xo, ...1xr) = an>urco H 1- a>nyrxr, à coefficients entiers, telles que
E;=o M < Bn+0(n) et An = \Ln(w0). '., wr)\~l = A;+*(«), alors £|f < r.
Soit Cn = {(xo,... ,xr) G Rr+1, |rco| ^ An et \xoWi — wq\ < An , si 1 < i < r}. Alors
Cn est un parallélépipède fermé de Rr+1, de volume (2An) YTi=1(2An1/r) = 2r+1. Il s'ensuit
que Cn est un compact convexe symétrique de volume 2r+1, et le lemme de Minkowski
(th. B.1.12) assure l'existence de (rc0(n),... ,xr(n)) e Zr+1 appartenant à Cn - {0}.
Si n » 0, soit k(n) le plus grand entier tel que |#o(ra)|A^ < \. L'hypothèse selon
laquelle An = An+°^ implique que k(n) = logy + o(log |x0(n)|), et donc :
• *(*) < I^a + 0(log An) = n + o(n),
• Afc(n) = \xo(n)\l+«» et \x0(n)Lk{n)(w0,.. .,wr)\ = \x0(n)\°W = An(1) = A*»>.
Maintenant, J2i=o ak{n)tiXi(n) = x0(n)Lk(n)(wo, •. •, wr) + J^Lo &k(n)Axi(n) ~ xo(n)wî)-
Or le membre de gauche est un entier et |rco(n)Ljfc(n)(w0,... ,u;r)| < \ par
construction. Il s'ensuit que | ZLo^N.tfeW - x0(n)wi)\ ^ |z0(n)Lfc(n)(ttfo,.. • ,wr)\ = Ao(n). Le
membre de gauche est majoré par ( J^ |afc(n))i|) Aû1/r < Bfc<n)+0Wn»A-n/r+0(n\ et comme
k(n) < n + o(n), on a BkW+°Mn» < Bn+0H On obtient donc Bn+°W A-n/r+°W ^ A0<n\
ce qui nous donne BA~1/r ^ 1 et r ^ fe|, ce que l'on voulait (1).
W Cette démonstration est due a Fischler et Zudilin (2010) ; elle est nettement plus simple que la
démonstration originale de Nesterenko.
E.2. TRANSCENDANCE DE n ET INDÉPENDANCE LINÉAIRE DES C(n) 499
E.2. Transcendance de w et indépendance linéaire des Ç(n)
1. Génération de combinaisons linéaires entre les Ç(n)
Soit a e N, et soit F e Q(X), de degré < -2, n'ayant des pôles qu'aux entiers < 0,
ces pôles étant d'ordre < a. Soient oijtk, pour j ^ 0, 1 < k < a et a*, pour 1 < fc < a, les
rationnels définis via la décomposition en éléments simples de F(X) par
+oo a +oo
fw = EEt3^ et a* = £^-
Remarquons que l'on a a^ = 0 sauf pour un nombre fini de couples (j, k) et donc que
les séries ci-dessus sont en fait des sommes finies et, d'autre part, que ol\ = 0 car on a
supposé F de degré < — 2.
Proposition E.2.1. La série Smïi F(ra) converge absolument, et on a
+oo a a +oo j -
£F(m) = l>C«-£2>,*(£^).
m=l fc=2 fc=l j=0 u=l
Démonstration. La convergence absolue découle de l'hypothèse degF < -2. Si N G N
est tel que ctjj = 0 si j ^ N + 1, on a
M N N N+M - N j .. N+M -
m=l j=0 ^ j=0 u=l j=0 u=l u=M+j+l
et comme X^Lo aJA = ®> on obtient, en faisant tendre M vers +00,
+00 N N j -
m=l j=0 J ,7=0 u=l
D'autre part, on a
+00 N a a N +00 a N •? 1
£££^ = ££ £ t = ££^(«fc>-£i)
m=lj=0fc=2v *'' fc=2 j=0 u=j+1 fc=2 j=0 u=l
= £^«-££^(£i).
fc=2 &=2 j=0 u=l
et il n'y a plus qu'à faire la somme des deux expressions ci-dessus pour conclure.
2. Un choix judicieux de fonction rationnelle
Soient a,r e N vérifiant 2r ^ a et r ^ 1. (On cherche des combinaisons linéaires à
coefficients entiers entre 1 et les CM> k ^ a, et r est un paramètre que l'on ajustera de
500
ANNEXE E. IRRATIONALITÉ D'UNE INFINITÉ DE C(2n + 1)
manière à ce que ces combinaisons linéaires soient les plus petites possibles.) Soit
0_2r (X - rn)(X - m + 1) • • • (X + (r + l)n)
Fn(X) = (n!)<
= (n!)<
(X(X+l)---(X + n))°+1
,_2r (X - m) • • • (X - 1)(X + n + 1) • • • (X + (r + l)n)
(X(X + l)---(X + n))«
Soient aussi ajj, pour 0 < j;^ n, 1 < k < o et û:^n) pour 1 < k < a, les rationnels définis
via la décomposition en éléments simples de Fn(X) par
F»(X) = êÊnrEû et c!? = ±<%.
Cette fraction rationnelle a un certain nombre de propriétés intéressantes.
• Fn est de degré (2r + \)n + 1 — (n + l)(a + 1) = (2r — a)n — a < —a < —2 et a des
pôles d'ordre a en 0, — 1,..., —n; la série Sn = Y^l\ Fn(ra) converge donc absolument
et on a
S„ = £<»> + ±at\(k) avec /*»> = -èè^'(Ei) •
fc=2 fc=l j=0 u=l
• Fn(l) = • • • = Fn(rn) = 0, ce qui montre que la somme définissant Sn ne commence
qu'à m = rn + 1 [i.e. Sn = 5^2, Fn(rn + m + 1)] et assure que Sn est petit.
• Fn(ra) ^ 0 si m > 1, ce qui assure que Sn est non nul.
• Fn vérifie l'équation fonctionnelle Fn(—n —X) = (—l)(n+1)°Fn(X), ce qui nous fournit
les relations otn-j,k = (~~l)fc+^n+1*°a-£fc > si 1 ^ k < a et 0 < j < n ; ces relations impliquent
que Oîfc = 0 si k + (n + l)a est impair, ce qui est le point crucial pour arriver à séparer les
valeurs aux entiers pairs des valeurs aux entiers impairs. (Pour ne garder que les valeurs
aux entiers pairs, il suffit de prendre a pair, et pour ne garder que les valeurs aux entiers
impairs, il suffit de prendre a impair et n pair.)
Pour pouvoir appliquer le critère de Nesterenko (cf. n°5), il s'agit alors d'évaluer
précisément Sn (cf. n°4), majorer les coefficients a^' et le p.p.c.m. de leurs dénominateurs
(cf. n° 3) car on a besoin de combinaisons linéaires à coefficients entiers.
3. Propriétés archimédiennes et arithmétiques des cÇ'
Notons dn le p.p.c.m. de 1,2,... ,n.
Proposition E.2.2. Sil^k^aetO^j^ n, alors
flÇ-*4j e z et l4jl < {în)a-\a- l)!2nû(r + l)2H-Dn.
Corollaire B.2.8. (i) c£/?(n) eZ et d^o^ G Z si n G N et k G {2,..., a},
(ii) Si ô > 2°(r+l)2r+2, alors |/?<n>| = 0(ôn) et |a[n)| = 0(ôn), pour tout k G {2,... ,o}.
E.2. TRANSCENDANCE DE tt ET INDÉPENDANCE LINÉAIRE DES <(n) 501
Démonstration. (i) L'appartenance de d£~ka^ = E"=o <% kakj à Z est immédiate ;
celle de <£/?<"> = - ELi ( £?=o *~*alj( EÎ=i $)) résulte de ce <ïue tous les termes du
membre de droite sont entiers puisque u < j ^ n implique « | dn.
(ii) La proposition implique que \a{^\ < (n + l)(2n)0"1(a- l)!2na(r + l)2(r+1)n = 0(ôn),
pour tout <5 > 2a(r + l)2r+2. Par ailleurs, on a la majoration YjL=i ^ ^ 3 ^ n> et donc
|^n)| ^ a(n + l)n(2n)û-1(a - l)!2no(r + l)2(H-i)n = q(^), pour tout * > 2°(r + l)2r+2.
On en déduit le corollaire.
Pour démontrer la proposition E.2.2, écrivons Fn(X) sous la forme :
Fra-17 n!Pi(x)
f={X(X + l)..-(X + n)'
où P<(X) est le polynôme défini par ((x) est le polynôme binomial x(x"1)Jx~n+1))
P*(X) =
^x+(i-r+i)»j si r + i ^ ^ 2r,
1 si 2r + 1 < i ^ a.
Nous aurons besoin d'un certain nombre de résultats préparatoires.
Lemme E.2.4- Soit Q G Q[X], de degré ^ n, prenant des valeurs entières aux entiers
et soient (Pj(Q))o^j^n les rationnels définis par la décomposition en éléments simples de
la fraction rationnelle
nlQ(X) Aft(Q)
( > X(X + l)...(X + n) £X + i
e£ B(Q) = supo^^l/^^Q)!- yl/ors fy G Z g«e/ ç«e soit j G {0, ...,n} e£ B(Q) <
2nsup0^^|Q(-j)|T
Démonstration. On a
/%(Q) = xlim.(X +j)F(X) = (-I)'Qq(-j).
Lemme E.2.5. Soient Q* powr 1 < i < a des polynômes de degrés < n prenant des
valeurs entières aux entiers. Soient a^ pour O^j^netl^k^a, définis grâce à la
décomposition en élément simples de
rm = rr n! Q*(x) = v^ v" aj'k
I{x(X + l)...(X + n) ^^(X + i)*'
Alors d%-kajik G Z et \ajik\ < (2n)a_1(a - 1)! n?=i B(Qi)> tfwe^ ?we 50*en* 0 < j < n et
1 ^ fc < a.
502
ANNEXE E. IRRATIONALITÉ D'UNE INFINITÉ DE C(2n + 1)
Oii.k =
Démonstration. La démonstration se fait par récurrence sur a, le cas a = 1 étant
contenu dans le lemme E.2.4. Si a ^ 2, l'hypothèse de récurrence permet d'écrire
yj n!Qj(X) =yy Tj,fc
llx(X+l)...(X + n) ^^(X + j)*'
avec dr1"^ G Z et |7itfc| < (2n)û"2(a - 2)! U^l B(Qi).
Maintenant, si ji ^ J2, on a
1 _ 1 y^ 1
(X + jx)(X + j2Y " (j2 - ji)'(X + ji) £f (j2 - jiY+l-k(X + j2)* '
On en déduit la formule
f/%(P.hM-i - £«* E^ |Ë^fe si k> 2,
La somme dans le membre de droite comporte au plus 2n(a — 1) termes et chacun de ces
termes est de valeur absolue < B(Pa)(2n)a_2(a — 2)! Yli=i B(Pf) ; on en tire la majoration
voulue pour |a,-,fc|.
Enfin, on a
dn tf-jty+i-k-"* W (j-ji)t+i-k'Pf(F*)eZ
et
<*rs,*-i = <-i-(*-|)7a*-i e z,
et tous les termes intervenant dans le calcul de a^ sont entiers ; il en est donc de même
de otjjti ce qui termine la démonstration.
Lemme E.2.6. Si 1 < i < a, alors P* es£ de degré < n et prend des valeurs entières
aux entiers. De plus, on a
|2n((i±i)n)! sil<i<r
1 (tn)!n! SZ L ^ % ^ r>
2n si 2r + 1 < i < a.
Démonstration. Les (*) prenant des valeurs entières aux entiers (cf. § 1.1 du
Vocabulaire), il en est de même des P*. La majoration de B(Pi), quant à elle, s'obtient en en
majorant le coefficient binomial (") par 2n et en constatant que le maximum de |P<(— j)\
pour 0 < j < n est atteint en j = 0 (resp. j = n) si 1 < i < r (resp. r + 1 < i < 2r).
La proposition E.2.2 est une conséquence des lemmes E.2.6 et E.2.5 et de la majoration
nB(Pi) < 2"(((j+y!)2 < 2-(r + 1)2<^>«,
E.2. TRANSCENDANCE DE n ET INDÉPENDANCE LINÉAIRE DES <(n) 503
la première inégalité s'obtenant en multipliant les majorations du lemme E.2.6 et la
seconde en utilisant la majoration des coefficients multinomiaux (si rai + • • • + rac = ra,
alors mi!"t!m(, est le coefficient de x™1 • • • x™c dans le développement de {x\ + h xc)m
et donc est < cm (poser x\ = • • • = xc = 1) : ce coefficient est le nombre de partitions
de {1,... ,ra} en c ensembles, le premier ayant rai éléments correspondant aux positions
des facteurs x\, le second 7712... ; or Sm permute ces partitions et a € Sm laisse fixe une
partition si et seulement si elle laisse stable chacun des ensembles de la partition ; on en
déduit que le stabilisateur Gp d'une telle partition p est de cardinal rai! • • • rac! et que le
nombre de ces partitions est |H = mJ^mel).
4. Évaluation de Sn
Une expression de Sn sous forme d'une intégrale (prop. E.2.9) va nous permettre
d'étudier le comportement asymptotique de Sn : on obtient le résultat suivant.
Proposition E.2.7. (i) 7/ existe A0 > 0 tel que limn_>+00Sn = A0.
(ii) On a A0 < (2r + l)2H-if2r-a
Lemme E.2.8. Sia.be N, alors f* xa(l - x)bdx = {a+b+l)r
Démonstration. C'est un cas particulier de la formule /0 rcs-1(l — x)*-1 dx = 'ffj+S
d'Euler. (On peut aussi utiliser la formule f* xa(l - xfdx = ^ f* xa+l(l - x)b~l dx.)
Proposition E.2.9. On a
((2r + l)n+l)l f ïï£l*r(l-*e)ndxe
&n —
f
J[0,l
(«02r+1 J[0,l)^ (1 - Xi • • • Xa+1)^Dn+2 «
Démonstration. Si k ^ 1 et \x\ < 1, on a (1 - x)~k = J2^So Cï-i"1)^- Comme toutes
les fonctions considérées sont positives, on peut intervertir somme et intégrale pour obtenir
J[0A]a+1 (l-xi--.rcû+i)fc £^\ k-1 J\J0 K } )
_ y^ (ra+l)---(ra + fc-l) / (rn + m)\n\ \°+i
~ Z^0 (fc-1)! V((r + l)n + m + l)!/ '
Pour k = (2r + l)n + 2, on a
((2r + l)n + l)l(m+l)---(m + fc-l)/ (rn + ra)!n! ^ _ p , , m , u
(n!)2^ (ib-1)! V((r + l)n + ra + l)!/ - *nirn + ra+ij.
On en tire le résultat car Fn(ra) = 0 si 1 < ra < m.
Lemme E.2.10. On a
(((2r + l)» + l)!y/n
n^+ooV (n!)2r+1 / V '
504
ANNEXE E. IRRATIONALITÉ D'UNE INFINITÉ DE C(2n + 1)
Démonstration. C'est une conséquence du comportement asymptotique de n! donné
par la formule de Stirling : n! = nne-nv^7rn(l + 0(£)), cf. prop. VII.2.9.
Lemme E.2.11. Soient K C Ra+1 compact, f une fonction continue, positive sur K,
et g E L*(K) une fonction positive dont l'intégrale sur tout ouvert de K est non nulle.
Alors limn^+00 | fK fngdx\l'n = supxGK f(x).
Démonstration. Soient M = supx€K f(x) et In = fKfn g dx.
• In < Mn fKgdx, et donc ln/n < (1 + e)M, pour tout n > 0, si e > 0.
• / atteint son maximum M en un point u e K, et pour tout e > 0, il existe un ouvert
U de K, contenant u, tel que f(x) ^ M - e, pour tout x G U. Alors In ^ (M - é)n J^ g dx,
et comme flJgdx> 0, on a lj/n ^ (1 - e)(M - e), pour tout n > 0.
Il s'ensuit que In —► M quand n —► +oo, ce que l'on cherchait à démontrer.
Passons à la démonstration de la prop. E.2.7. Le lemme E.2.10 et le lemme E.2.11 utilisé
pour K = [0, l]û+1, f(x) = (^L^gli et g(x) = (1_xl.,1Xa+l)2> montrent que
lim Sj/n = A0, avecA0 = (2r + l)2r+1 sup f(x).
n-+oo x€[0,l]o+1
D'autre part, on a 1 - xi • • • £û+1 ^ 1 - xe pour tout £ G {1,..., a + 1}. On a donc aussi
1 -Xl • • • zû+i ^ nïî(l -*«)1/(a+1)> d'où la majoration f(x) < n£i (*ï(l -a*)^)- Le
maximum de x —> rcr(l-rc)^+î" sur [0,1] est atteint en /> = (l+r?~+n)~ ; le maximum de /
sur [0,1]°+1 est donc < /<a+1)(l - p)a~2r < (1 - p)a~2r, et on termine la démonstration
de la proposition E.2.7 grâce à la majoration
q-2r
5. Utilisation du critère de Nesterenko
5.1. Le plus petit commun multiple des n premiers entiers
Pour appliquer le critère de Nesterenko, nous aurons besoin d'estimer la taille de dn.
Proposition E.2.12. Il existe 7 > 1 tel que l'on ait dn = 0(jn).
Démonstration. Les seuls nombres premiers divisant dn sont ceux < n, et si pv\b < n,
alors v < [i§SJ!]» et donc vp^ = [S?]- n en resulte <Iue
logrfn < V [-j^] logp < ?r(n) logn,
où 7r(n) = |{p€ £*, p < n}\. Le th. des nombres premiers (n(n) ~ j^) implique que
log dn < an, pour tout n ^> 0, si a > 1 ; on peut donc prendre 7 > e quelconque. (On
peut montrer (exercice) que 7 > 4 convient en utilisant le fait que le produit des nombres
E.2. TRANSCENDANCE DE n ET INDÉPENDANCE LINÉAIRE DES <(n) 505
premiers compris entre m + 1 et 2m divise (2^) < 22m, ce qui permet de se passer du
th. des nombres premiers.)
5.2. Minoration de la dimension du Q-espace vectoriel engendré par les ((2j + 1)
Nos efforts sont récompensés par la proposition suivante qui fournit une minoration
non triviale de la dimension du Q-espace vectoriel engendré par les valeurs de la fonction
zêta aux entiers pairs ou impairs.
Proposition E.2.13. Soit a ^ 3 un entier impair. Soit ôPùr(a) (resp. ô~impa.h(a)) la
dimension du sous-Q-espace vectoriel de R engendré par 1 et les Ç(k), k pair (resp. k
impair), 2 < k < a. Alors, quel que soit r < |, les dimensions ôpa,\r(a) et £impair(a) sont
minorées par
(a - 2r) logr - a log7 - (2r + 1) log(2r + 1)
+ a log 27 + (2r + 2) log(r + 1)
Remarque E.2.14- En prenant r = (l0ga)2 + 0(1), on voit que ôpa,n(a) et ôimpa\r(a) sont
minorées par 1 + ^^ + o(l) ; en particulier, ôPùr(a) et Smpa\r(a) tendent vers +00, ce qui
termine la démonstration du théorème E.l.l (modulo la démonstration de la proposition).
Démonstration. La démonstration pour ôpajr(a) est la même (en un peu plus simple)
que la démonstration pour £impair(a) ; nous ne traiterons donc que le cas de ôimpair(a).
Soit Dn un multiple de dn tel que Dn = ^n+°(n)) où 7 vérifie les conclusions de la
prop. E.2.12. Soit b = ^±1. Soient Vi = 1, et v5 = Q(2j - 1) si 2 < j < 6. Soient
Vi = D2n+i/?(2n+1) et <W = D2n+i^il) si 2 ^ j ^ b. D'après la prop. E.2.3, les anJ
sont des entiers, et la conjonction de la prop. E.2.12 et du (ii) du cor. E.2.3 montre que
sup |anJ| = 0(Bn), et donc ^ \anJ\ < Bn+0<n> pour tout B > (7°2a(r + l)2r+2)2.
D'autre part, a étant impair, on a an±V\ H h an^Vb = D2n+1S2n+i puisque û^ = 0
si k est pair. La conjonction des prop. E.2.7 et E.2.12 montre qu'il existe A > 0 tel que
|ûn,l«l + • • • + Cln,bVb\ = A-n+°™ avec A ^ (7û(2r + l)ap+1r2r-a)2.
Le critère de Nesterenko (th. E.1.3) permet de conclure.
ANNEXE F
LE PROBLÈME DES NOMBRES CONGRUENTS
Ce chapitre est une introduction à la conjecture de Birch et Swinnerton-Dyer (un des
problèmes à un million de dollar), à travers le problème des nombres congruents qui est
probablement le plus vieux problème non résolu à ce jour.
F.l. Courbes elliptiques et nombres congruents
1. Introduction
Définition F. 1.1. Un entier D, sans facteur carré (divisible par le carré d'aucun nombre
premier), est congruent, s'il existe un triangle rectangle de cotés rationnels dont l'aire
est D ; autrement dit, si et seulement s'il existe o, 6, c e Q avec a2 + b2 = c2 et D = y.
Pour étudier les nombres congruents, on peut commencer par étudier l'ensemble des
triangles rectangles à côtés rationnels, c'est-à-dire résoudre l'équation a2 + b2 = c2 en
nombres rationnels. On pose u = ^ et v = *, et on est ramené à trouver les points
rationnels sur le cercle u2 + v2 = 1 avec u > 0 et v > 0. Pour cela, on note t la pente de
la droite joignant (u,v) à (—1,0), dont l'équation est donc v = t(u + 1) ; on a t e Q et
(uyv) = (j^ï, ^+ï)- En conclusion, a,6,c G Q sont les côtés d'un triangle rectangle si et
seulement s'il existe t G Q, 0 < t < 1, tel que a = $q^c et b = ^pyc. En posant x = — t
et y = ^±i, ce qui précède permet presque M de démontrer le résultat suivant qui permet
^La relation D = ^ devient D = ^i^, et la condition 0 < t < 1 équivaut à — 1 < a: < 0. On a donc
démontré que D est congruent si et seulement si l'équation Dy2 = r3 - x a une solution dans Q2 avec
-1 < x < 0. La courbe Cd(R) = {(x,y) € R2, Dy2 = r3 - x} a deux composantes connexes : un ovale
dans la région -1 < x < 0, et une courbe avec une direction asymptotique verticale dans la région x ^ 1.
L'application qui, à P = (x,y) 6 Cd(R), associe P' = {x',y'), intersection de la droite (P, (-1,0)) avec
Cd, échange les deux composantes connexes comme le montre un petit dessin (ou un calcul explicite),
et envoie Cd(Q) dans lui-même comme il est expliqué au § 2 (ou comme le montre un calcul explicite).
Ceci permet de montrer que l'existence d'une solution dans Q2 avec -1 < x < 0 est équivalente à celle
d'une solution dans Q2 avec x > 1. On en déduit la proposition.
508 ANNEXE F. LE PROBLÈME DES NOMBRES CONGRUENTS
de rattacher le problème des nombres congruents à celui de la résolution des équations
diophantiennes (cf. § F.2).
Proposition F. 1.2. SiD est un entier positif sans facteur carré, alors les conditions
suivantes sont équivalentes :
(i) D est congruent
(ii) L'équation Dy2 = x3 — x a une solution dans Q2 avec y ^ 0.
Déterminer si un entier est congruent ou pas, est un problème très ancien et très difficile.
On a par exemple le résultat suivant « conjecturé » par Fibonacci (1175-1240).
Théorème F. 1.3 (Fermât (1601-1665)). 1 n'est pas un nombre congruent.
C'est une des nombreuses utilisations que Fermât a trouvées pour sa méthode de « la
descente infinie^2) ». Remarquons que si a, 6, c sont des entiers non nuls vérifiant a4 — bA =
c4, et si x = |s-, y = ^-, alors y = x3 — x. Le fait que 1 n'est pas congruent implique donc
le théorème de Fermât (3) pour l'exposant 4.
Exemple F. 1.4 (Zagier). L'entier 157 est congruent, mais le triangle {a,b,c) le plus
simple d'aire 157 est
_ 6803298487826435051217540 411340519227716149383203
a ~ 411340519227716149383203 ' ~ 21666555693714761309610 '
_ 224403517704336969924557513090674863160948472041
C ~ 8912332268928859588025535178967163570016480830 '
Cet exemple montre que la chasse aux triangles rectangles à côtés rationnels d'aire D
risque d'être un peu acrobatique... Le résultat suivant de Tunnell (1983) n'en est que plus
remarquable.
Théorème F. 1.5. Soit D un entier impair sans facteur carré. Si D est congruent,
alors
|{x,y,*eZ, 2x2 + y2 + 8z2 = D}\ = 2.\{Xjy,zeZ, 2x2 + y2 + S2z2 = D}|. (*)
Réciproquement, si D vérifie (*), et si (une forme faible de) la conjecture de Birch et
Swinnerton-Dyer est vraie, alors D est congruent.
Il y a un résultat similaire pour D pair. Comme il est très facile(4) de décider si D vérifie
ou non (*), cela fournit un critère effectif permettant de décider qu'un nombre donné
est non congruent, ou (sous Birch et Swinnerton-Dyer) congruent, et ce, sans exhiber de
triangle rectangle d'aire D. Un entier congru à 5 ou 7 modulo 8 vérifie (*) car les deux
ensembles sont vides, mais on ne sait pas montrer que cela implique que D est congruent...
(2)Cette méthode fait l'objet du prob. H. 14; en spécialisant ce problème au cas D = 1, on obtient une
démonstration du résultat de Fermât (on n'a besoin que des parties III et IV).
(,3)ll semble que Fermât se soit légèrement laissé emporté par son enthousiasme devant cette découverte...
<4)Le lecteur pourra s'en convaincre en en déduisant le th. F.1.3.
F.l. COURBES ELLIPTIQUES ET NOMBRES CONGRUENTS
509
Comme le lecteur le constatera, la démonstration de ce théorème emprunte des chemins
très détournés (ce qui en fait le charme) ; on peut légitimement se demander si une preuve
plus directe ne serait pas possible, maintenant qu'on connaît la réponse.
2. Arithmétique des courbes elliptiques
Si C est une conique, on peut étudier l'ensemble C(Q), des points de C à coordonnées
rationnelles, comme on l'a fait pour le cercle. On trouve un point P G C(Q) sur la conique
et on paramètre les points de la conique par la pente d'une droite variable passant par P.
Cette stratégie ne marche plus pour une courbe C donnée par une équation de degré 3
(comme la courbe Cd d'équation Dy2 = x3 — x) car, si on coupe par une droite passant par
un point de C(Q), et qu'on élimine y entre les deux équations, on obtient une équation
de degré 3 en x dont on sait seulement qu'une des solutions est rationnelle; les deux
autres vivent donc, en général, dans une extension quadratique de Q, mais pas dans Q.
Par contre, si on prend une droite passant par deux points rationnels de C ou tangente à
un point rationnel de C, alors on obtient une équation dont deux des solutions (ou une
solution double) sont rationnelles ; comme la somme des racines est aussi rationnelle, cela
montre que cette droite recoupe C en un point rationnel.
Une courbe elliptique E sur un corps^5^ K est une courbe d'équation y2 = P(x), avec
P G K[X], de degré 3, sans racine double(6) On note E(K) l'ensemble des solutions dans K2
de y2 = P(rc), et E(K) = E(K) U {oo}, avec la convention qu'une droite passe par oo si et
seulement si elle est verticale(7>. On munit E(K) d'une loi de composition + qui en fait un
groupe commutatif(8) avec oo comme élément neutre et P + Q + R = oo si et seulement
si (P, Q, R) sont alignés (avec les conventions évidentes si deux ou trois des points sont
confondus ; en particulier, P est d'ordre 2 si et seulement si oo appartient à la tangente à
E en P, c'est-à-dire si et seulement si y = 0 ; de même, P est d'ordre 3 si et seulement si
la tangente en P à E a un contact d'ordre 3).
(5)Si K est de caractéristique 2, il faut aussi permettre des équations du type y2 + y = P(x).
(6) Ceci se traduit par la non nullité du discriminant A(P) de P (cf. alinéa 9.2.1 du Vocabulaire).
(7) Cette définition de E(K) est parfaitement artificielle. Une définition naturelle demande de travailler
dans le plan projectif P2, espace des droites de l'espace vectoriel de dimension 3. Celui-ci peut être vu
comme la réunion du plan affine et d'une droite (projective) à l'infini dont les points correspondent aux
directions de droites du plan affine ; notre oo est le point de cette droite à l'infini correspondant à la
direction verticale.
(8) L'associativité n'est pas une évidence. Elle peut se vérifier par un calcul explicite assez pénible (mais on
peut demander l'aide d'un ordinateur...). Une solution plus élégante consiste, si K est un sous-corps de C,
à passer par les fonctions elliptiques (cf. prob. H.8), ce qui permet de montrer que E(C) est isomorphe,
en tant que groupe, à C/A, où A est un réseau de C (pour pouvoir utiliser les résultats du prob. H.8, il
faut savoir que si le discriminant de X3 - aX - b est non nul, il existe un réseau A de C tel que g<z(A) = a
et 03(A) = 6; cela se démontre en utilisant la subjectivité de l'invariant modulaire j (ex. VII.6.7) et
l'homogénéité de g-i et #3 qui permet d'exprimer #2 et #3 en fonction de G4 et Gq). Dans le cas général,
il y a une jolie démonstration passant par la géométrie projective.
510 ANNEXE F. LE PROBLÈME DES NOMBRES CONGRUENTS
-2R
0„ /312 23.31.41 \
FlG. 1. Addition sur la courbe elliptique d'équation Y2 = X(X - 3)(X + 5).
Théorème F. 1.6. SiE est une courbe elliptique sur Q, le groupe E(Q) est engendré
par un nombre fini d'éléments; il est donc isomorphe à E(Q)tors © Zr^E\ où E(Q)tors,
sous-groupe des points d'ordre fini®), est un groupe fini, et r(E) e N.
Ce résultat, conjecturé par Poincaré vers 1900, a été démontré par Mordell en 1922
en adaptant la méthode de la descente infinie(10) de Fermât ; c'est un cas particulier du
célèbre théorème de Mordell-Weil. Le groupe E(Q)t0rs se calcule très facilement ; par contre
la détermination du rang r(E) et des générateurs de Zr(E> est très délicate. À ce jour, il
n'y a pas d'algorithme dont on peut prouver qu'il va permettre de les déterminer, ce
qui ne nous arrange pas en ce qui concerne le problème des nombres congruents, mais la
conjecture de Birch et Swinnerton-Dyer, dont il sera question plus loin, fournirait un tel
algorithme si elle était démontrée.
Exemple F. 1.7. On note Cd la courbe elliptique d'équation Dy2 = x3 — x. Alors
Qi = (-1,0), Q2 = (0,0) et Q3 = (1,0) sont d'ordre 2, et CD(Q)tors = {oo,Qi,Q2,Qs}-
En conséquence, D est congruent si et seulement si r(Co) ^ 1.
(9)Si K est un sous-corps de C, et si Ë(C) = C/A, alors le sous-groupe des points de n-torsion de E(K)
s'identifie à un sous-groupe de £A/A = (Z/nZ)2 ; en particulier il est de cardinal < n2.
(10)Le cas particulier de Cd fait l'objet du problème H. 14.
/ = jc(jc-3)(jc + 5)
F.l. COURBES ELLIPTIQUES ET NOMBRES CONGRUENTS 511
3. L'heuristique de Birch et Swinnerton-Dyer
Si p est un nombre premier, Fp = Z/pZ est un corps. Si r = g 6 Q et p ne divise
pas 6, on peut voir r comme un élément de Fp en réduisant a et 6 modulo p (i.e. en
prenant le quotient des images de a et 6 dans Fp, ce qui ne dépend pas des choix de
a et 6). En particulier, si E est une courbe elliptique sur Q d'équation y2 = P(x), on
peut aussi considérer E comme une courbe elliptique sur Fp pour tous les bons nombres
premiers (ceux ne divisant ni les dénominateurs des coefficients de P, ni le numérateur de
son discriminant (note 6)).
Si E est une courbe elliptique(11) sur Fp, on a trivialement, |E(FP)| < 2p+ 1, mais on
dispose du résultat plus précis suivant.
Théorème F. 1.8 (Hasse, 1933). Si E est une courbe elliptique sur Fp, et si on pose
ap = p+l- |Ë(FP)|, alors \ap\ < 2^/p
L'idée de Birch et Swinnerton-Dyer (1960-1965), est que, si r(E) ^ 1, alors il devrait
y avoir en moyenne plus de points dans E(FP) que si r(E) = 0, à cause de la réduction
modulo p des éléments de E(Q). Comme ce nombre de points est a peu près p d'après le
théorème de Hasse, le produit J|p ]Wf~ïï devrait avoir des chance de diverger (d'être nul),
si r(E) > 1, et de converger, si r(E) = 0. Comme le produit n'est pas convergent au sens
usuel, nous allons devoir passer par les fonctions holomorphes pour donner corps à cette
heuristique.
4. Fonction L d'une courbe elliptique
Soit E une courbe elliptique sur Q. Si p est un bon nombre premier, soit ap l'entier
défini par ap = 1 +p — |E(FP)|. On définit la^12) fonction L(E,s), et des entiers an, pour
n e N - {0}, par
1 +°o
L(E,s) = TT =-5- = y"ann"s.
V ' Al 1 _ ap-s + pl-25 Z-,
p bon yMr n=\
Il est facile de voir que le produit converge pour Re(s) > 2, et même Re(s) > | si on utilise
la majoration \ap\ < 2^/p de Hasse, et définit une fonction holomorphe sur ce demi-plan.
(u)On peut aussi considérer des courbes elliptiques sur Z/DZ, où D n'est pas premier, ou sur Fq. Ceci
est utilisé pour factoriser des grands nombres, prouver la primalité de grands nombres (de plus de 1000
chiffres), ou pour fabriquer des signatures plus sures, à taille égale, que celles fournies par F*.
*12)Cette fonction n'est pas celle qui est habituellement considérée; elle en diffère par la multiplication
par des facteurs en les mauvais p, mais comme ceux-ci ne s'annulent pas en s = 1, cela ne change rien
en ce qui concerne la conjecture de Birch et Swinnerton-Dyer. La bonne fonction L(E, s) a une équation
fonctionnelle plus sympathique que celle considérée dans cet article : il existes G {±1} et N G N tel
que, si A(E, s) = <g^Ns/2L(E, s), alors A(E, 2 - s) = eA(E, s) ; en particulier, si e = -1, alors roo(E) est
impair et L(E, 1) = 0.
512
ANNEXE F. LE PROBLÈME DES NOMBRES CONGRUENTS
Théorème F. 1.9. La fonction L(E, s) admet un prolongement analytique à C tout
entier.
Ce résultat a été conjecturé par Hasse vers 1935 ; c'est un cas particulier de la conjecture
de Hasse-Weil. Le premier résultat dans sa direction est celui, dû à Weil (1952), de la
famille^13) des courbes Cq. Shimura (1958), inspiré par des travaux d'Eichler (1954), a
démontré de nombreux cas de cette conjecture en utilisant la théorie des formes modulaires
dont il sera question plus loin. Le pas le plus important a été accompli par Wiles en 1994,
dans sa quête de la démonstration du théorème de Fermât, qui a démontré cette conjecture
dans le cas où E est d'équation y2 = P(x) et P a toutes ses racines dans Q. Le cas général
a finalement été résolu par Breuil, Conrad, Diamond et Taylor en 1999.
La quantité Ylp bon m^rj, apparaissant dans l'heuristique de Birch et Swinnerton-Dyer
est, au moins formellement, égale à L(E, 1), et leur heuristique devient :
Conjecture F. 1.10 (Birch et Swinnerton-Dyer (forme faible))
« r(E) ^ 1 » si et seulement si « L(E, 1) = 0 ».
On peut préciser cet énoncé^14). Notons r^E) l'ordre du zéro en 5 = 1 de L(E,5). La
conjecture de Birch et Swinnerton-Dyer prend alors la forme suivante.
Conjecture F. 1.11. (Birch et Swinnerton-Dyer) On a l'égalité r(E) = r^E).
(13)Dans ce cas, on définit 6 : Z[i] -> {0, l,t, -1, -i} par
f ô(uj) =0 si a» est divisible par 1 + i dans Z[i],
[u;<S(u;) - 1 est divisible par (1 + «)3 sinon.
On a alors
w€Z[i)-{0} ' ' n=l
Le cas D général se déduit facilement du cas D = 1 : on a L(Cd, s) = ^Zn^i XD(n)ann~3, où xd : Z —>
{—1,0,1} est le symbole de Legendre modulo D. Ce symbole de Legendre est caractérisé par les propriétés
suivantes : Xd(h + 4D) = XD(n), Xd(h) = 0 si (D,n) ^ 1, et
. . . . . . . . f 1 si D est un carré dans F*
XD(nm) = XdMxdM, Xd(p) = < . , . , ™
^—1 si D n est pas un carre dans F*.
L'existence de xd est une conséquence de la loi de réciprocité quadratique conjecturée par Euler en 1783
et démontrée par Gauss en 1801.
(14>En fait, Birch et Swinnerton-Dyer avaient été plus optimistes et avaient conjecturé que
17 —^ C(logz)-r<E>.
Goldfeld (1982) a prouvé que, si c'est le cas, alors roo(E) = r(E), la fonction L(E, s) vérifie l'hypothèse de
Riemann (i.e. elle ne s'annule pas pour Re(s) > 1), mais, de manière surprenante, que l'on a C = - ^
au lieu de C = L(E, 1), si r(E) = 0.
F.l. COURBES ELLIPTIQUES ET NOMBRES CONGRUENTS
513
C'est sous cette forme que le problème vaut un million de dollar. Il y a en fait une forme
plus précise^15) de cette conjecture (donnant une formule pour lims_>i(s — l)-r^L(E, s)),
et plus générale (Q peut être remplacé par une extension finie, ou même par des corps de
caractéristique p> extensions finies du corps FP(T)).
Les résultats sont peu nombreux ; ce sont les suivants.
• Coates et Wiles (1977) ont démontré que, si E = Cd (ou si E est une courbe elliptique
sur Q à multiplication complexe(16)), alors « L(E, 1) ^ 0 » => « r(E) = 0 ».
• Gross et Zagier (1983) ont donné une formule explicite^ pour L/(E, 1) en termes de
certains points rationnels sur E, dits « de Heegner », et qui sont construits de manière
purement analytique (ce sont ces points qui permettent d'amuser la galerie en exhibant des
triangles rectangles à côtés rationnels avec un nombre astronomique de chiffres). Comme
conséquence, ils obtiennent l'implication : « r^E) = 1 » => « r(E) ^ 1 ».
• Kolyvagin (1989) a démontré, en utilisant ces points de Heegner, l'implication suivante
« roo(E) < 1 » => « r(E) = ^(E) ».
C'est tout ! On est dans la situation paradoxale où plus il est censé y avoir de points
rationnels (/^(E) ^ 2), moins on sait en construire... Mentionnons quand-même, qu'en
général, le rang r(E) est égal à 0 ou 1, mais il y a tout lieu de croire que r(E) peut prendre
des valeurs arbitrairement grandes. Le record actuel est détenu par Elkies (2006) avec une
courbe vérifiant r(E) ^ 28; Bhargava et Shankar ont démontré (2011) que le rang moyen
est < 0,98 (il s'agit de la moyenne, quand M —> +oo, des rangs des courbes elliptiques
y2 = x3 + Ax + B, avec sup(B2, A3) < M).
5. La stratégie de Tunnell
Le théorème de Coates-Wiles mentionné ci-dessus fournit un critère pour que D ne
soit pas congruent : il suffit que L(Cd, 1) ^ 0. Réciproquement, si la conjecture de Birch
et Swinnerton-Dyer est vraie (même sous sa forme faible), alors la nullité de L(Cd, 1)
implique que D est congruent. C'est le point de départ de la démonstration du théorème
de Tunnell. Le problème est donc de calculer L(Cd, 1) et de décider si ce nombre est
(15)Celle-ci prend la forme lim^s - l)-'(E)L(E,s) = |III(E)| • Roo(E) • O^E) • rip mauvaise où Cj,
est un nombre rationnel explicite, fioo(E) est la période réelle de E (donnée par îîoo(E) = 2/J"°° fx ,
si E est d'équation y2 = P(x) et a est la plus grande racine réelle de P), Roo(E) est un « régulateur »
mesurant la taille des générateurs de E(Q), et III(E), le groupe de Tate-Shafarevich de E, est un groupe
mystérieux, conjecturalement fini.
(16) Si (x,y) € Cd(C), alors (-x,iy) G CD(C). Si A est le réseau de C correspondant àCo(C) (cf. note 8),
la remarque précédente se traduit par le fait que ïA = A. On dit qu'une courbe elliptique E définie sur
un sous-corps de C a de la multiplication complexe si, A étant le réseau de C qui lui correspond, il existe
t 6 C - R tel que r A c A (c'est donc le cas de Cd, avec r = i) ; un tel r est alors racine d'un polynôme
unitaire de degré 2 à coefficients dans Z.
*17)La démonstration de cette formule occupe une centaine de pages...
514
ANNEXE F. LE PROBLÈME DES NOMBRES CONGRUENTS
nul ou pas. Il y a deux problèmes sérieux qui se posent : le produit définissant L(Cd, 1)
converge beaucoup trop lentement (s'il converge..., cf. note 14) pour qu'on puisse l'utiliser
pour le calcul de L(Cd, 1), et de toute façon, il est impossible de prouver qu'un nombre
réel est nul en le calculant de manière approchée, sauf si on sait par ailleurs qu'il s'agit
d'un entier. La solution que Tunnell apporte à ces deux problèmes est particulièrement
élégante.
On note <ffî = {z € C, lm(z) > 0} le demi-plan de Poincaré. On pose q = e2t,rz, et on
définit G : 3^ -»• C par
nGZ
Le résultat que démontre Tunnell est alors le suivant.
Théorème F.1.12. (Tunnell) Soit O = f+°° ^0=, et soit J2nZbnQn b
développement de
O(z) • 9(22) • (20(32*) - 6(82)),
alors, si D est impair (il y a une formule similaire pour les entiers pairs) sans facteur
carré,
Comme &d est la différence des deux termes apparaissant dans la condition (*) du
th. F. 1.5, cela explique comment ledit théorème peut se déduire du théorème de Coates-
Wiles. La démonstration du théorème F. 1.12 repose sur la théorie des formes modulaires
dont il est question au § suivant.
6. Formes modulaires
Si / est holomorphe sur Jj? et vérifie f(z + 1) = f(z), alors / a un développement de
Fourier (^-développement, cf. ex. VI.3.4) :
f(z) = Y,a,nqn, avecg = e2i-
nGZ
On dit que / est à croissance lente à l'infini si a^, = 0 pour tout n < 0 et s'il existe C 6 R
tel que an = 0(nc).
Si N est un entier, on note r0(N) le sous-groupe de SL2(Z) des (jj) avec c divisible
par N. On note T = ( J J ).
Définition F.1.13. Si k e |N et j : T0(N) -> {racines de l'unité} vérifie j(T) = 1,
l'espace Mjb(r0(N),<;) des formes modulaires de poids k et type j pour To(N) est l'espace
des fonctions /, holomorphes sur ffî, vérifiant
/(^j) = 3{acbd)(cz + d)kf{z), quels que soient z G ^ et (j J) G r0(N),
et qui sont à croissance lente à l'infini.
F.l. COURBES ELLIPTIQUES ET NOMBRES CONGRUENTS
515
Remarque F.l. 14- (i) Il n'est pas du tout clair que de telles formes existent ; et de fait,
il faut choisir correctement la fonction j pour Mfc(r0(N),^') soit non nul.
(ii) M^I^N),,;') est un C-espace vectoriel de dimension finie < 1 + ^ I1pïn(1 + ")•
(iii) Les formes modulaires ont un don d'ubiquité assez remarquable. On les rencontre
en théorie des nombres, en combinatoire ou en physique théorique, bien que ce soient des
objets définis de manière purement analytique.
Pour un aperçu de la théorie des formes modulaires pour SL2(Z), le lecteur est invité
à se reporter aux exercices VIL6.l-VIL6.il du chap. VIL
• La fonction 6(z) = 9(|) est étudiée dans l'ex. VII.6.6, et les résultats de cet exercice
montrent que 9 est une forme modulaire de poids | pour r0(4) et un j un peu compliqué.
• Si k est un entier pair ^ 3, la série d'Eisenstein Gk(z) = ^fe^i? Ylm,n (mz+n)k ^
l'objet des ex. VII.6.4 et VII.6.5 ; elle appartient à Mfc(SL2(Z), 1), et son ^-développement
est donné par Gfc = (fcg$(fc) + E£>fc-iMtfn> où at(n) = Ed\n,d^id^ si i € C et
neN-{0}.
• La fonction G2 = -$rb + Z)nSai(n)^n est étudiée dans l'ex. VII.6.7. Elle n'est pas
modulaire, mais presque, et 4G2(4z) — G2(z) est modulaire.
Comme échauffement pour le théorème de Tunnell, mentionnons (cf. ex. VII.6.9)
l'identité de Jacobi (1829) : 4G2(4Z) - G2(z) = ^B4, qui se démontre en constatant que les
deux membres appartiennent à M2(r0(4), 1) qui est de dimension 2, et que la différence
est divisible par q2. On en tire, en comparant les ^-développements, une forme effective
du théorème des 4 carrés de Lagrange (1770).
|{(a,6,c,d)GZ4, a2 + 62 + c2 + d2 = n}| = 8 ^ d.
d\n,4\d
7. Courbes elliptiques et formes modulaires
Théorème F.l. 15. SiE est une courbe elliptique définie sur Q et L(E, 5) = XlnS ann~s>
alors f = X)nS anQn e M2(Ne, 1), où Ne est un entier explicite ne dépendant que des p
mauvais.
Autrement dit, une courbe elliptique définie sur Q est modulaire. Ce résultat, conjecturé
de manière vague par Taniyama en 1956, et précisé par Weil en 1966 suite aux travaux
de Shimura sus-mentionnés, est celui que démontrent Wiles^18^ (dans un cas particulier)
<18)Si a? + bP = cp est un contre-exemple au théorème de Fermât, on peut considérer la courbe elliptique
introduite par Hellegouarch et Frey, d'équation y2 = x(x — ap)(x + bP). Wiles montre que cette courbe est
modulaire, ce qui est en contradiction avec la « conjecturée » de Serre (1984) démontrée par Ribet (1988).
La « conjecture e » décrit les congruences que l'on peut attendre entre formes modulaires. Dans le cas
qui nous intéresse, cette conjecture prédit une congruence modulo p entre le ^-développement de la
forme modulaire attachée à la courbe elliptique y2 = x(x - ap)(x + b"), et celui de g € M2(r0(2), 1), ce
qui n'est pas possible car cet espace est de dimension 1, et la divisibilité par p du terme constant du
(/-développement de g entraine celle de tous les termes du ^-développement.
516
ANNEXE F. LE PROBLÈME DES NOMBRES CONGRUENTS
et Breuil-Conrad-Diamond-Taylor. Le prolongement analytique de L(E, s) s'en déduit en
utilisant la formule (cf. ex. VII.6.3)
ce qui permet d'utiliser les propriétés analytiques de / pour étudier L(E, s). C'est un cas
particulier de la philosophie de Langlands sur les fonctions L arithmétiques (elle devraient
provenir de formes automorphçg, généralisations des formes modulaires, et donc avoir des
tas de propriétés mirifiques). Dans le cas de la courbe Cd, la forme modulaire que l'on
obtient est une combinaison linéaire de fonctions thêta.
La modularité d'une courbe elliptique E en fournit une description analytique en termes
du demi-plan de Poincaré. Ceci est à la base de la construction des points de Heegner
(ce sont les images^19) des points r G <ffl solutions d'une équation du second degré à
coefficients dans Q) qui, comme nous l'avons déjà mentionné, jouent un rôle essentiel
dans la démonstration du résultat de Kolyvagin (r(E) = r^E) si r^E) ^ 1) ; ce résultat
n'est donc devenu valable pour toutes les courbes elliptiques sur Q que depuis les travaux
de Wiles et Breuil-Conrad-Diamond-Taylor.
Une autre application de la modularité des courbes elliptiques est le résultat suivant
qui permet, modulo un calcul numérique, de déterminer la valeur de L(E, 1), ce qui
fournit, modulo la conjecture de Birch et Swinnerton-Dyer (sous sa forme faible), un
algorithme pour décider de l'existence de solutions en nombres rationnels pour une équation
y2 = P(#), avec P de degré 3.
Corollaire F. 1.16. (Manin-Drinfeld, 1973) Si E est d'équation y2 = P(x), et si a est
la plus grande racine réelle de P, alors
est un nombre rationnel de dénominateur explicite.
Le point de départ de la démonstration du théorème F. 1.12 est un théorème de
Waldspurger (1979). Si / = Y^\anQn e M2fc(ro(N),l), k entier, si D est sans facteur carré
et premier à N, et si xd est le caractère de Legendre (cf. note 13), on peut montrer que
/ ® Xd, défini par / <g>xd = Y^XD{n)anqn, est un élément de M2fc(r0(ND2), 1). Le
théorème de Waldspurger dit, de manière vague, que les L(/<8>xd>&) sont, quand D varie, les
carrés de coefficients de Fourier de formes modulaires de poids h + \ pour ro(N'), avec N'
explicite. « Il n'y a plus qu'à » exhiber une base de l'espace de ces formes modulaires et
calculer quelques coefficients pour obtenir une identité valable pour tout D.
*19>La théorie de la multiplication complexe (note 16) permet de déterminer le corps de définition de ces
points; ce sont, d'après un théorème de Schneider (1937), les seuls éléments deJf, algébriques sur Q,
qui fournissent des points algébriques de E.
F.2. ÉQUATIONS DIOPHANTIENNES
517
F.2. Équations diophantiennes
1. Généralités
1.1. Exemples. Traditionnellement, une équation diophantienne est une équation
polynomiale P (en une ou plusieurs variables) à coefficients entiers (comme X2 = 2,
DY2 = X3 - X, Xn + Yn = Zn, X2 + Y2 + Z2 = 8n + 7, etc.), et on s'intéresse à l'ensemble
Vp(Z) des solutions en nombres entiers ou à celui Vp(Q) des solutions en nombres
rationnels. Plus généralement, on peut considérer une équation polynomiale P à coefficients
dans un anneau A, et, pour toute A algèbre B (i.e. tout anneau B muni d'un morphisme
d'anneaux de A dans B), s'intéresser à l'ensemble Vp(B) des solutions^ dans B.
Résoudre l'équation diophantienne P demande de décrire l'ensemble Vp(Z) ou Vp(Q),
mais on peut se demander, plus modestement, de pouvoir décider si Vp(Z) ou Vp(Q) est
vide ou pas. Il s'agit de problèmes, en général très difficiles, qui ont joué un très grand
rôle dans le développement des mathématiques.
• Les grecs ont été fort traumatisés par la découverte que Vp(Q) = 0, si P est l'équation
polynomiale X2 = 2 (irrationalité de \/2).
• L'étude de l'équation X2 — DY2 = 1 (Pell-Fermat) ou celle, en fonction de n, du
cardinal de Vp(Z), si P est l'équation X2 + DY2 = n, ou, plus généralement, de l'équation
aiX2 + • • • + a^X^ = n, ont donné naissance à la théorie algébrique des nombres et à
celles des formes quadratiques ou des fractions continues, et ont contribué fortement au
développement de celle des formes modulaires.
• L'équation Xn + Yn = Zn a fait couler beaucoup d'encre et donné naissance à un
nombre impressionnant de théories mathématiques pendant plus de 350 ans.
• Euler avait conjecturé (1769), influencé par le th. de Fermât, que X4 + Y4 + Z4 = 1
n'a pas de solutions en nombres rationnels autres que les évidentes (±1,0,0), (0, ±1,0) et
(0,0, ±1), ce qui a été infirmé par Elkies (1988), qui a trouvé (avec l'aide d'un ordinateur)
la relation 268244044+1536563944+1879676044 = 2061567344, et l'a utilisée pour montrer
que les points rationnels sont denses dans les points réels (on peut difficilement faire plus
faux comme conjecture...).
1.2. Le dixième problème de Hilbert. En fait, le problème de la résolution des équations
diophantiennes est encore nettement plus fondamental que ce que la liste d'exemples ci-
dessus laisserait penser. Ceci avait été bien vu par Hilbert dont la série de 23 problèmes
rassemblés pour le congrès international des mathématiciens de 1900, en comportait un
(le 10-ième) demandant de produire un algorithme permettant de décider si une équation
diophantienne a, ou non, des solutions en nombres entiers.
• Il est très facile de produire un tel algorithme en une variable (nous laissons au lecteur
le plaisir de le faire).
(20)Par exemple, si P est l'équation X2 + Y2 + Z2 = 8n + 7, on constate à la main que VP(Z/8Z) = 0, les
carrés de Z/8Z étant 0, 1 et 4 ; cela permet de prouver que P n'a pas de solutions en nombres entiers.
518
ANNEXE F. LE PROBLÈME DES NOMBRES CONGRUENTS
• L'existence d'un tel algorithme en deux variables a été prouvée par Baker (1969), ce
qui lui a valu la médaille Fields en 1970. Ce que fournit Baker, c'est une borne pour la
taille des solutions, et l'algorithme consiste alors à explorer toutes les possibilités jusqu'à
cette borne.
• Ce problème fut finalement résolu par Matiyasevich en 1970, qui prouva qu'un tel
algorithme ne peut pas exister, au grand soulagement des arithméticiens qui voyaient
d'un mauvais œil l'idée qu'un ordinateur puisse les mettre au chômage. En poussant plus
loin les méthodes de Matiyasevich, on peut en fait ramener tout problème mathématique,
de manière parfaitement algorithmique, au problème de savoir si une certaine équation
diophantienne a des solutions ou pas (le projet de Hilbert n'aurait pas mis que les
arithméticiens au chômage...). On peut aussi construire des polynômes explicites pour lesquels on
peut décider arbitrairement de l'existence ou de la non existence de solutions en nombres
entiers, sans rajouter de contradiction dans les mathématiques... C'est un peu ennuyeux,
car cela veut dire qu'on n'est jamais sûr que le problème auquel on s'attaque n'est pas de
ce type.
• Le théorème de Matiyasevich n'exclut pas, a priori, l'existence d'un algorithme pour
décider si un polynôme (en plusieurs variables) a des solutions rationnelles (21) ou pas. Il
n'exclut pas non plus qu'il existe un tel algorithme pour les équations diophantiennes en 3
variables. Les courbes elliptiques constituent le premier test non trivial dans cette
direction, la conjecture de Birch et Swinnerton-Dyer fournissant un tel algorithme (cor. F.1.16),
si elle est vraie...
1.3. L'équation Y2 - Y = X5 — X. Un bon marqueur des progrès effectués est fourni
par l'équation diophantienne P donnée par Y2 — Y = X5 — X :
• On sait depuis 1929, grâce à un résultat de Siegel concernant les points entiers des
courbes algébriques, que VP(Z) est un ensemble fini.
• Le résultat de Baker mentionné ci-dessus permet de montrer que si (X, Y) G Vp(Z),
alors sup(|X|,|Y|) < exp(exp(exp 51250)) ; «l'algorithme» de Baker n'est donc pas très
utilisable en pratique...
• On sait depuis 1983, grâce à un résultat de Faltings démontrant la conjecture de
Mordell (cf. n° suivant), que VP(Q) est un ensemble fini.
• L'augmentation de la puissance des ordinateurs a rendu envisageable une recherche
des solutions en nombres entiers (cela demande quand même de réduire grandement les
bornes fournies par Baker et de cibler intelligemment les solutions éventuelles, par exemple
(21>On peut ramener le problème de décrire l'ensemble Vp(Q) à celui de Vq(Z) en rajoutant une variable
(qui est le ppcm des dénominateurs des solutions) : par exemple, l'équation DY2 = X3 - X devient
Dcb2 = a3 - oc2, en posant X = f, Y = £ et en multipliant le tout par c3. L'équation ainsi obtenue est
d'un type bien particulier : elle est homogène ce qui fait que si (o, 6, c) est une solution, il en est de même
de (na,nb,nc), pour tout n € Z; il suffit donc de considérer les solutions où a,6,c sont premiers entre
eux dans leur ensemble.
F.2. ÉQUATIONS DIOPHANTIENNES
519
en utilisant des méthodes p-adiques). Le résultat complet a finalement été obtenu par
Bugeaud, Mignotte, Siksek, Stoll et Tengely en 2008 :
VP(Z) = ({-1,0,1} X {0,1}) U {(2,1±H), (3, i±H), (30, 1-^)}.
• On ne sait toujours pas calculer Vp(Q)...
2. La topologie des solutions complexes gouverne l'arithmétique !
2.1. Le genre d'une surface de Riemann. Si P G C[X, Y] est non nul, l'ensemble Vp(C)
des solutions dans C2 de l'équation P(X, Y) = 0 est une courbe complexe et peut aussi
être vu comme une surface réelle puisque C est de dimension 2 sur R; c'est ce qu'on
appelle une surface de Riemann.
Si P est l'équation X + Y = 0, alors (X,Y) i-> X induit un homéomorphisme de VP(C)
sur C (d'inverse z *-* (z,—z)). Le plan complexe C se compactifie naturellement en
rajoutant un point à l'infini (noté oo), et on obtient de la sorte une sphère dite sphère de
Riemann-, autrement dit, Vp(C) est homéomorphe à une sphère S moins un point oo : la
projection stéréographique à partir de oo fournit un homéomorphisme de S — {oo} sur le
plan.
FlG. 2. Le plan est une sphère moins un point.
De même, si P est l'équation XY = 1, alors (X,Y) »-> X induit un homéomorphisme
de Vp(C) sur C* que l'on peut voir comme la sphère privée de deux points (0 et oo).
De manière générale, si P est l'équation Q(X, Y) = 0, où Q G C[X, Y] est irréductible
(i.e. ne peut pas se factoriser sous la forme Q = Q1Q2, où Qi,Q2 sont non constants),
alors Vp(C), privé d'un nombre fini de points singuliers^ est homéomorphe à un tore
(22)Par exemple, si P est l'équation Y2 = X2(X + 1), il y a deux branches qui passent par le point (0,0),
l'une tangente a Y = X et l'autre à Y = -X. La surface Vp(C) est alors une sphère privée du point 00,
dont deux des points se retrouvent attachés en (0,0) ce qui crée la singularité. Quand on enlève (0,0),
on obtient une sphère privée de 3 points (00 et les deux points qui étaient collés ensemble).
520
ANNEXE F. LE PROBLÈME DES NOMBRES CONGRUENTS
avec un nombre fini de trous, auquel on a retiré un nombre fini de points. Le nombre de
trous est appelé le genre (noté g) de Vp(C).
8 = 0
XY=\
X+Y=0
*=1
8 = 2
Y2 = Xi-D1X
Y2-Y = X5-X
Fig. 3. Surfaces de Rieinaim de genres 0, 1 et 2.
• Si P est X + Y = 0 ou XY = 1, alors g = 0.
• Si P est l'équation Y2 - Y = X5 - X, alors g = 2.
FiG. 4. Construction de la surface de Rieinaim de la fonction Jzb — z — \.
F.2. ÉQUATIONS DIOPHANTIENNES
521
Expliquons pourquoi la surface de Riemann V>(C) définie par l'équation Y2 - Y = X5 - X
est un tore à deux trous auquel on a retiré un point. On fait le changement de variable
Y = T + | de manière à se ramener à l'équation T2 = X5 - X - |, ce qui ne change pas
la forme de VP(C). Alors VP(C) est l'ensemble des couples (z,±Jzr> - z - |), pour z G C.
Le problème de cette description est que la fonction z h-> wz5 - z - \ est multivaluée sur C
(quand on tourne autour d'un des zéros ai,a^ &i, &2> c du polynôme z5 - z - \ ou de oo, cette
racine carrée change de signe), et donc qu'il faut faire attention à la signification qu'on lui
donne.
Pour remédier à ce problème on effectue des coupures dans le plan complexe. On choisit*23)
des chemins A, B, C disjoints sur la sphère de Riemann Cu{oo}, d'extrémités respectives ai, a<i
(pour A), 61,62 (pour B) et c,oo (pour C) qui ne se recoupent pas (i.e. qui ne comportent pas
de boucles), et on note fi l'ouvert de C complémentaire de ces chemins. Sur fi, le polynôme
25-^-|a une racine carrée holomorphe que l'on note z h-> f(z). De plus, si z appartient
à A, B ou C et n'est pas un zéro de z* - z - 5, alors f(z) admet deux limites opposées,
racines carrées de z* — z — |, suivant que l'on s'approche de z par « en-dessous » du chemin
ou par « au-dessus ». Pour tenir compte de ce phénomène, on dédouble chacun des points z
des chemins A,B,C, à l'exception des extrémités, en deux points 2+,2~, un peu comme si on
ouvrait une fermeture éclair le long de ces chemins. Ceci nous fournit deux chemins A+,A~
joignant ai et a^ deux chemins B+,B~ joignant 61 et 62 et deux chemins C+,C~ joignant c
et 00. La réunion fi de fi et des chemins A+, A~,B+,B~,C+,C~ est alors un compact (on a
rajouté un bord à l'ouvert fi), et / se prolonge par continuité à fi (c'était le but de l'opération),
en une fonction encore notée / qui vérifie f(z~) = —f(z+) si z G A,B,C (avec la convention
que z+ = z~~ = z si z est une extrémité, et /(oo) = 00).
Soient maintenant fi+ = {(z,f(z)), z G fi} et fi_ = {(z, -f(z)), z G fi}. Alors fi+ et fi_
sont deux sous-ensembles de Vp(C)U{oo}, homéomorphes à fi, et qui recouvrent Vp(C)U{oo}.
Pour obtenir V>(C) U {00}, il suffit alors de recoller*24* fi+ et fi_ le long des chemins que l'on
a dédoublés pour construire fi.
Si P est l'équation DY2 = (X - a)(X - 6)(X - c) d'une courbe elliptique, alors g = 1.
Cela se justifie par les mêmes arguments que pour Y2 - Y = X5 - X en faisant des coupures
joignant a à b et c à 00 sur la sphère de Riemann. On peut aussi remarquer que le changement
de variable X = 2T + ^±§±^ et Y = */§Z transforme l'équation en Z2 = 4T3 - BT - C, et on
peut utiliser les résultats du prob. H.8, selon lesquels V>(C) est homéomorphe à C/A moins un
point, où A est un réseau de C. Le choix d'une base de A sur Z fournit un homéomorphisme de
C/A sur (R/Z) x (R/Z), c'est-à-dire sur un produit de deux cercles, ce qui peut se matérialiser
en faisant tourner un des cercles autour d'un axe passant par le centre de l'autre, et on obtient
de la sorte un tore à un trou, comme annoncé.
(23>Nous laissons le lecteur se persuader du fait que c'est possible
(24>Si z G A,B,C n'est pas une extrémité, les deux points {z,±Jz^ — z—\) apparaissent à la fois
dans fi+ et fi_. Pour obtenir VP(C) U {00}, il faut donc recoller fi+ et fi_ en identifiant les points
(*+J(z+)) € fi+ avec (*-,/(*+)) g fi_ et les points (*-,-/(*+)) G_fi+ avec (*+,-/(*+)) G^fi_ (on
recolle A+, B+,C+ sur fi+ avec A", B", C" sur fi_ et A", B", C" sur fi+ avec A+, B+, C+ sur fi_ ; pour
ce faire, il faut, dans la figure, passer de fi+ à fi_ par une rotation par rapport à un axe horizontal et
pas par une symétrie par rapport à un plan horizontal).
522
ANNEXE F. LE PROBLÈME DES NOMBRES CONGRUENTS
• Il y a une formule algébrique permettant de calculer g ; par exemple, g = (""W-il
pour l'équation de Fermât Xn + Yn = 1. La formule générale fait intervenir les points
singuliers de la courbe (la courbe de Fermât n'en a pas, ce qui explique que la formule
soit particulièrement simple).
2.2. Genre et solutions rationnelles. Le comportement des solutions est très différent
suivant que le genre est 0, 1 ou ^ 2.
• Si g = 0, et si Vp(Q) contient au moins un point non singulier, il existe C ^ 0 et
t > 0 tels que
|{fl,MeZ,c>l sup(|o|,|6|,|c|)<a:, (o,6,c) = 1, Q(-,-)}| - Cxl.
c c
Il y a donc beaucoup de solutions rationnelles s'il y en a au moins une (non singulière).
• Si g = 1, il existe C ^ 0 et r G N tels que
|{a,6,ceZ,01 8up(|o|,|6|,|c|)<a;, (a,6,c) = l, Q(-,-)}| - C(logz)r/2.
C C
En particulier, si r ^ 1, il y a une infinité de solutions rationnelles, mais celles-ci sont
assez clairsemées. Une courbe elliptique est de genre 1, et le r précédent n'est autre que
le rang de la courbe elliptique (cf. th. F. 1.6).
• Si g ^ 2, alors Vp(Q) est fini. Ce résultat, conjecturé par Mordell (1922), a finalement
été démontré par Faltings (1983), ce qui lui a valu la médaille Fields en 1986.
ANNEXE G
INTRODUCTION AU PROGRAMME DE
LANGLANDS
Un titre plus honnête pour ce chapitre, qui contient beaucoup d'énoncés magnifiques,
mais peu de démonstrations W, serait « Introduction à l'existence du programme de Lan-
glands », une vraie introduction au programme de Langlands pouvant difficilement se faire
avant le M2.
On peut faire remonter les thèmes menant au programme de Langlands à la loi de
réciprocité quadratique conjecturée par Euler (1783) et démontrée par Gauss (1801). Le
problème est, étant donné un nombre premier £ ou, plus généralement, un entier d G Z
divisible par le carré d'aucun nombre premier, de décrire l'ensemble des nombres premiers p
tels que d soit un carré dans Fp. De manière équivalente, il s'agit de déterminer le nombre
de zéros dans Fp du polynôme X2 - d. La surprise est que la réponse ne dépend que de la
classe de p modulo D, avec D = d si d = 1 mod 4, et modulo D = 4d si d = 2,3 mod 4.
Plus précisément, il existe un caractère de Dirichlet xd de conducteur D et à valeurs dans
{±1} tel que le nombre de zéros de X2 - d dans Fp soit égal à 1 + Xd(p)-
Du point de vue qui va nous intéresser dans ce chapitre, cette loi de réciprocité peut
s'encoder dans une identité multiplicative entre fonctions L. On note Pd le polynôme
X2 — X + i=^, si d = 1 mod 4, et X2 - d, si d = 2,3 mod 4. Dans tous les cas, ce
polynôme est à coefficients entiers, son discriminant est D, et ses racines sont ^^ ou
±Vd suivant la congruence de d modulo 4. On note Ad l'anneau Z[X]/(Pd). On a donc
AD = Zf^J^], si d = 1 mod 4, et AD = Z[\/d], si d = 2,3 mod 4. On définit la fonction
Cad(s) par la formule Cad(5) = Sn lAn/ni* > ou n décrit l'ensemble des idéaux de AD tels
que l'anneau AD/n soit un anneau fini (2\ Un peu de théorie algébrique des nombres
^Les seules démonstrations, outre celles esquissées en notes de bas de page, se trouvent dans le § G.2 où
l'on étend aux adèles la transformée de Fourier du chap. IV et la transformée de Mellin du § VIL2, qui
en est l'analogue multiplicatif. Comme le lecteur le constatera, la plupart des difficultés sont concentrées
sur les nombres réels, les nombres p-adiques se comportant plutôt comme des groupes finis.
(2)()n remarquera que si on remplace Ad par Z dans la définition précédente, on tombe sur la fonction
zêta de Riemann.
524
ANNEXE G. INTRODUCTION AU PROGRAMME DE LANGLANDS
permet de montrer que la série de Dirichlet Cad(5) converge pour Re(s) > 1, et que la loi
de réciprocité quadratique est équivalente à la factorisation Cad(5) = C(s)L(Xd>s)-
Par exemple, si d = — 1 (et donc D = — 4 et Ad = Z[i]), le caractère xd est donné par
Xd(w) = 1 si n = 1 mod 4, et Xd(^) = -1 si n = 3 mod 4. On en déduit la relation(3)
4 E (n2 + m2)s = C(*)L(X4, s) = y^Fs II (i_p-.)2 II T7^>
(n,m)€z2 v ' p=lmod4 v r ' p=3 mod 4 r
(n,m)9((0,0)
et en identifiant les termes en p~s des deux côtés, on retrouve le résultat de Fermât selon
lequel un nombre premier impair est somme de deux carrés si et seulement si il est de la
forme 4n + 1.
La définition de Çad se généralise à tout anneau A = Z[Xi,... ,Xd]/(Pi,... ,Pr), où
Pi,..., Pr sont des polynômes en Xi,... ,X<* à coefficients dans Z, ce qui permet
d'associer à un tel anneau une fonction zêta de Hasse-Weil Ca(s) = Sn iA/ni* comme ci-
dessus. Comme un anneau fini de cardinal n est de manière unique un produit
d'anneaux de cardinaux pvr(n) (lemme des restes chinois), la fonction Ca(s) admet une
décomposition en produit de facteurs d'Euler ÇA(s) = YIp£&Ça,p(s), et A. Weil a conjecturé
en 1949 que Ca,p(s) est une fonction rationnelle de p~s ce qui fut démontré par B. Dwork
en 1959. Weil a aussi conjecturé que cette fonction rationnelle a une factorisation sous une
forme indépendante de p, et ne dépendant que de la géométrie de l'espace des solutions
Pi(z\, ...tZd) = '" = Pr(<zi, • • •, Zd) dans Cd, ce qui fut démontré par A. Grothendieck^
comme aboutissement d'un énorme programme ayant totalement révolutionné la
géométrie algébrique. A la factorisation des facteurs d'Euler correspond une factorisation de la
fonction £a en fonctions L, et l'un des buts principaux du programme de Langlands est de
comprendre chacune de ces fonctions L en vue, en particulier, de démontrer la conjecture
de Hasse- Weil selon laquelle les fonctions zêta de Hasse-Weil possèdent un prolongement
méromorphe à tout le plan complexe.
L'exemple le plus célèbre est probablement A = Z[X, Y]/(Y2 - X3 - aX2 - /3X - 7),
avec a,/?,7 G Z. Dans ce cas, A. Wiles (1994, dans le cas « semi-stable ») et C. Breuil,
B. Conrad, F. Diamond et R. Taylor (1999, dans le cas général) ont démontré, ce qui avait
été conjecturé de manière vague par Y. Taniyama en 1956, et précisé par A. Weil en 1966,
qu'il existe une forme modulaire primitive / (cf. n° 4.1 du § G.l) telle que Ca(s) = ffi/s) »
à multiplication près par un nombre fini de facteurs d'Euler innocents. Ceci a permis à
A. Wiles, en utilisant des résultats antérieurs de K. Ribet (1988), d'en déduire la non
(3^L'anneau Z[i] est principal, et si n + mi € Z[i] est non nul, l'anneau Z[i]/(n + mi) est fini de cardinal
n2 +m2\ le facteur £ s'explique par le fait que a, -a , ia et —ia engendrent le même idéal, si a =
n + mie Z[i)-{0}.
(4)Cela lui a valu une médaille Fields en 1966; P. Deligne en a obtenu une en 1978 pour avoir démontré
la dernière des conjectures de Weil, l'hypothèse de Riemann sur les corps finis, selon laquelle les zéros et
les pôles de Ca,p(s) se répartissent sur un nombre fini de droites verticales explicites.
G.I. LA CONJECTURE D'ARTIN
525
existence d'un A de la forme ci-dessus avec X3 + aX2 + /3X + 7 = X(X - ap)(X + 6?),
où a? + If = & est un contrexemple au théorème de Fermât, et donc de démontrer le
théorème de Fermât.
G.I. La conjecture d'Artin
1. Le groupe &q
Rappelons (cf. nos 8.2 et 8.3 du Vocabulaire) que x G C est algébrique s'il existe
P G Q[X], non nul, tel que P(x) = 0. De manière équivalente, £ G C est algébrique si et
seulement si la sous-Q-algèbre Q[x] de C engendrée par x est de dimension finie sur Q ;
c'est alors un sous-corps de C. Ceci permet de montrer que, si x et y sont algébriques,
alors x+yetxy sont algébriques. On en déduit que l'ensemble Q des nombres algébriques
est un sous-corps de C.
On note &q l'ensemble des automorphismes de corps de Q, c'est-à-dire l'ensemble des
permutations o de Q telles que l'on ait
o{x + y) = a(x) + a{y) et a(xy) = a{x)a(y), quels que soient x,y eQ.
Muni de la composition, ^q est un sous-groupe du groupe des permutations de Q ; c'est
même un sous-groupe du groupe des automorphismes Q-linéaires^ de Q.
Le groupe ^q est un groupe gigantesque et extrêmement mystérieux, mais dont la
compréhension serait cruciale pour beaucoup de problèmes. Le simple fait qu'il existe est
déjà très utile.
• Le seul élément de &q que l'on sache décrire est la conjugaison complexe, que nous
noterons froboo. On a (froboo)2 = 1, et Artin (1924) a démontré que tout élément d'ordre
fini de &q est conjugué à 1 ou froboo, et donc est d'ordre 1 ou 2.
• Si P G Q[X] est irréductible de degré n, et si ai,... ,an G Q sont les racines de P,
alors quel que soient iyj G {l,...,n}, il existe^ a^j G ^q, avec oïj(a») = &j, ce qui
montre qu'il y a bien d'autres éléments que froboo dans ^q.
• Si H est un sous-groupe de ^q, alors l'ensemble Q des éléments de Q fixes par H
est un sous-corps de Q. Réciproquement, si K est un sous-corps de Q, l'ensemble ^k des
jG^q fixant tous les éléments de K est un sous-groupe fermé^ de &q. On obtient de la
(5>On commence par montrer que a(l) = 1, puis que a(n) = n, quel que soit n G Z, et finalement que a
induit l'identité sur Q.
(6)C'est une conséquence de la théorie de Galois.
W On met sur &q la topologie de Krull qui, par définition, est la plus faible rendant continue l'action
de &q sur Q muni de la topologie discrète. Ceci signifie que, si ao 6 ^q, et si a 6 Q, l'ensemble
Ua(oo) = {& € ^Q> v{&) = 0"o(a)} est un ouvert de ^q, et les Ua(a0), pour a0 G &q et a G Q forment
une base d'ouverts de &q. En particulier, tout ouvert de &q contenant 1 contient Ua(l), pour un certain
a G Q, et donc contient un sous-groupe d'indice fini.
526 ANNEXE G. INTRODUCTION AU PROGRAMME DE LANGLANDS
sorte*8* une bijection entre les corps de nombres (i.e. les sous-corps de Q dont la dimension
sur Q est finie), et les sous-groupes fermés d'indicé^ fini de ^q, et on a Q'K = K si K
est un corps de nombres, et S^h = H si H est un sous-groupe fermé d'indice fini de ^q.
• On conjecture que ^q est tellement compliqué que tout groupe fini G est un quo-
tient^10) de ^q (problème inverse de Galois). On sait montrer*11* que c'est vrai pour tout
groupe d'ordre impair (I. Shafarevich, 1954), pour Sn et An quel que soit n, pour le
monstre... ; je ne pense pas qu'on sache le démontrer pour SL3(F9) par exemple (F9 est
le corps à 9 éléments), bien qu'il soit beaucoup plus petit que le monstre.
2. Représentations de ^q
Comme nous l'avons mentionné au chap. I, on n'a de prise sur &q qu'à travers ses
représentations. Nous ne nous intéresserons qu'aux représentations complexes; celles-ci
jouent un rôle fondamental mais sont, pour des raisons topologiques *12*, un peu trop rigides
pour beaucoup d'applications, et on est aussi amené à considérer des représentations de ^q
sur d'autres corps (et mêmes sur des anneaux) que C, comme le corps Qp des nombres
p-adiques. Comme il est expliqué dans la note 12, si V est une représentation complexe
de ^q, alors ^q agit à travers un groupe fini, ce qui permet d'utiliser les résultats du
chap. I. De plus, tous les calculs à effectuer pour expliciter les objets apparaissant dans
(8)C'est encore une conséquence de la théorie de Galois.
^Rappelons que, si H c G sont des groupes, l'indice [G : H] de H dans G est le cardinal de G/H.
(10)Si c'est vrai, alors G x • • • x G est aussi un quotient de #q et donc G est un quotient de #q d'une
infinité de manières différentes.
(n)Pour montrer un énoncé de ce type, on peut procéder de la manière suivante. Si P € Q[X], si a e Q
vérifie P(a) = 0, et si a € &q, alors 0 = a(P(a)) = P(a(a)) (car a fixe les coefficients de P). On
obtient de la sorte un morphisme de groupes de #q dans le groupe des permutations des racines de P.
La description de l'image Galp (qui, par construction, est un quotient de #q) fait l'objet de la théorie
de Galois. Si P est irréductible de degré n, alors Galp est un sous-groupe de Sn, en général égal à Sn ; il
faut pas mal d'astuce pour construire des polynômes irréductibles P tels que Galp ne soit pas un groupe
symétrique. Par exemple, la construction d'un polynôme P tel que Galp soit le monstre utilise un mélange
de géométrie complexe, de topologie algébrique, de théorie des groupes finis, de géométrie algébrique et
de théorie des nombres.
(12> Si p : &q —> GLn(C) est un morphisme continu de groupes, on a p(l) = 1, et la continuité de p
implique (cf. note 7) qu'il existe un sous-groupe H d'indice fini de &q tel que, si p G H, alors p(g) - 1 a
toutes ses coordonnées aiyi vérifiant \aij\ ^ ^. En appliquant ceci àgk, on en déduit que \Tï(p(g)k)-n\ ^
| quel que soit k G Z, et il n'est pas très difficile d'en conclure que ceci implique que toutes les valeurs
propres de p(g) sont égales à 1, puis que p(g) = 1. En conclusion, le noyau de p contient un sous-groupe
d'indice fini, et donc p(&q) est un groupe fini. En particulier, chaque représentation complexe deSfQ ne
fournit de renseignements que sur une toute petite partie de^Q. La situation est nettement plus favorable
sur Qp, et la définition naturelle des fonctions L appaiaissant dans la factorisation de la fonction zêta de
Hasse-Weil Ca de A = Z[Xi,... ,Xrf]/(Pi,... ,Pr) utilise des représentations de ^q que Grothendieck a
associées à la variété d'équation Pi = • • • = Pr = 0.
G.I. LA CONJECTURE D'ARTIN
527
la conjecture d'Artin du n° 3 se font dans le corps de nombres K, fixé par le noyau de py,
ce qui explique qu'ils soient faisables bien qu'on ne maîtrise pas du tout &q.
Si P G Q[X], alors ^q permute les racines de P, ce qui nous fournit une représentation
de permutation Vp de &q. On peut montrer que toute C-représentation irréductible de
^q apparaît comme une composante irréductible d'une représentation Vp, mais essayer
de comprendre ^q en énumérant les éléments P de Q[X], et en décomposant les Vp
en composantes irréductibles est à peu près aussi efficace que d'espérer tomber sur une
démonstration de l'hypothèse de Riemann en faisant la liste de toutes les propositions
logiques. Il y a quand même deux exemples de représentations intéressantes de &q que
l'on peut obtenir de cette manière.
• Racines carrées. Si d G Q* n'est pas un carré dans Q, alors \[d g Q, et si a G ^q, il
existe rjd(a) G {±1} tel que a(Vd) = r)d(a)Vd, et il est facile de vérifier que a »-»• rjd(a)
est un caractère linéaire de ^q.
• Racines de l'unité. Soient D un entier ^ 3 et a = e2i7r/D. Alors aD = 1 et ce ^ 1 pour
tout diviseur strict d de D. Maintenant, si a G ^q, alors cr(a)D = cr(aD) = 1 et a(a)d =
cr(ad) ^ 1, pour tout diviseur strict de D. D'où l'existence de Xcyci,D(o") G (Z/DZ)*
tel que a(a) = e2iwXcyc^a^D = aXcyci,D(*)# On a alors a(an) = a"*^^, quel que soit
ne Z; on en déduit que Xcyci.D : ^q —> (Z/DZ)* est un morphisme de groupes^13).
Ceci permet d'associer une représentation continue px de ^q, de dimension 1, à tout
caractère de Dirichlet primitif : si x est un tel caractère, et si D est son conducteur, alors
px = X°Xcyci.D est un morphisme de groupes de ^q dans C*.
Théorème G. 1.1. (Kronecker-Weber) Toute représentation de dimension 1 de &q
est de la forme px, où x est un caractère de Dirichlet primitif.
Ce théorème a été énoncé par Kronecker (1853), mais il a fallu attendre 1886 pour une
démonstration (presque) juste (par Weber).
Au vu du théorème de Kronecker-Weber, on peut se demander ce qui se passe si on
considère les représentations de dimension 1 de ^k> où K est un corps de nombres, ou
bien si on considère les représentations de dimension n de ^q, avec n fixé, ou encore si on
mélange les deux problèmes et on considère les représentations de dimension n de ^k, où
K est un corps de nombres et n est fixé. La description des représentations de dimension 1
de ^K est ce qu'on appelle la théorie du corps de classes (qui a occupé les arithméticiens
pendant une bonne trentaine d'années au début du 20-ième siècle).
La dimension n > 2 a longtemps été considérée comme sans espoir.
^13)C'est le caractère cyclotomique.
528
ANNEXE G. INTRODUCTION AU PROGRAMME DE LANGLANDS
3. Fonctions L d'Artin
Soit & l'ensemble des nombres premiers. Si p 6 ^, on note | |p la norme p-adique
sur Q, et on choisit^14) une extension de | |p en une norme sur Q. On note alors £fg
l'ensemble des a € &q qui sont des isométries pour | |p. On note Ip le sous-groupe de &qp
des a tels que cr(e2t,r/D) = e2t7r/D, quel que soit D premier à p. On dit qu'un élément a
de &qp est un frobenius en p, si cr(e2i7r/D) = e2i,rp/D, quel que soit D premier à p. Par
définition de Ip, deux frobenius en p ne diffèrent que par un élément de Ip. On choisit un
frobenius frobp en p.
Soit V une représentation de &q de dimension n. Si p est un nombre premier, on
note VIp le sous-espace de V fixe par Ip. On démontre^15) que l'on a VIp = V pour
presque tout^16) p. L'action de frobp sur VIp ne dépend alors pas du choix de frobp, et
EP(V,T) = det(l -T/ovip(frobp)) ne dépend ni du choix de frobp, ni de celui de l'extension
de | |p à Q. C'est un polynôme de degré dimVIp, et donc EP(V,T) est un polynôme de
degré n pour presque tout p. On définit alors la fonction L d'Artin L(V, s) attachée à V
par le produit eulérien
L(V,S)=nEP(V,p-r1.
Exemple G. 1.2. (i) Si V = 1 est la représentation triviale, alors VIp = V et on a
Ep(V,T) = 1 - T, quel que soit p. On a donc L(l, s) = Ylp^A1 ~ P'*)'1 = CM-
(ii) Plus généralement, si x est un caractère de Dirichlet primitif, on a L(px, s) = L(x, s).
(iii) Soit d € Z divisible par le carré d'aucun nombre premier, et soient D et xd le
caractère de Dirichlet modulo D à valeurs dans {±1} apparaissant dans l'introduction.
La loi de réciprocité quadratique de l'introduction peut se reformuler comme une égalité
L(f?dM = L(xdM entre une fonction L d'Artin et une fonction L de Dirichlet.
(iv) Si Vi et V2 sont deux représentations de ^q, et si V = Vi 0 V2, alors on a
L(V,s) = L(Vi,s)L(V2,s). Par exemple, la représentation V = Ind^Q 1, se décompose
sous la forme V = 1 ® %, et l'identité CadM = CML(xdM ^e l'introduction est une
traduction de l'identité L(V,s) = L(lys)L(rjdys).
Le degré d'une fonction L d'Artin est la dimension de la représentation de ^q sous-
jacente; c'est aussi le degré de presque tous les facteurs d'Euler. D'après le théorème
<14)Pour construire une telle norme, il suffit de choisir un isomorphisme de Q sur la clôture intégrale de Q
dans Qp (cf. alinéa 20.4.5 du Vocabulaire, ainsi que les nos 8.3 et 8.8 du Vocabulaire pour le fait que
la clôture intégrale de Q dans Qp est effectivement isomorphe à Q). On démontre, par des techniques
de théorie algébrique des nombres, que si on a deux extensions | |Pii et | |P)2 de | \p à Q, alors il existe
a € #q tel que |a?|p>2 = k(x)|P)i, quel que soit x G Q, ce qui explique que ce qui suit ne dépend pas du
choix de cette extension.
<15)C'est encore un résultat de théorie algébrique des nombres.
(16)L'expression « pour presque tout p » signifie « à l'exception d'un nombre fini dep ».
G.I. LA CONJECTURE D'ARTIN
529
de Kronecker-Weber, les fonctions L de Dirichlet (en incluant la fonction zêta) décrivent
l'ensemble des fonctions L d'Artin de degré 1. Il résulte des th. VII.3.4 et VII.4.4, que :
Théorème G. 1.3. Une fonction L d'Artin de degré 1 possède un prolongement mé-
romorphe à C tout entier, holomorphe en dehors d'un pôle simple en s = 1, si L = £.
Conjecture G. 1.4- (Artin, 1923) Si V est irréductible de dimension ^ 2, alors L(V, s)
a un prolongement holomorphe à C tout entier.
Cette conjecture est très loin d'être démontrée, mais il y a eu récemment des progrès
spectaculaires en dimension 2.
La théorie du corps de classes permet (cf. th. G. 1.8 et G. 1.9) de prouver que, si K est
un corps de nombres, et si x est un caractère linéaire de ^k, alors L(Ind^x>5) est une
fonction holomorphe sur C, sauf si si x = 1 où elle est holomorphe en dehors d'un pôle
simple en s = 1.
Artin lui-même a démontré, en utilisant ce résultat et la théorie des représentations
des groupes finis (plus précisément le th. 1.3.19 dont c'était la motivation principale^17))
qu'une puissance de L(V, s) a un prolongement méromorphe à C tout entier. Si on utilise
le th. de Brauer (th. 1.3.20) au lieu du th. d'Artin, on peut montrer (et c'était la motivation
principale de Brauer) que L(V, s) a un prolongement méromorphe à C tout entier.
R. Langlands (1967) a proposé un gigantesque programme dont un des buts est la
démonstration de la conjecture d'Artin.
4. Fonctions L de degré 2
4-1. Représentations impaires et formes modulaires
Soit D un entier, et soit T0(D) l'ensemble des matrices (^J) à coefficients dans Z,
vérifiant ad — bc = 1 et c = 0 modulo D. C'est le sous-groupe de SL2(Z), image inverse
du groupe des matrice triangulaires supérieures dans SL2(Z/DZ).
Si k ^ 1 est un entier, et si x est un caractère de Dirichlet modulo D, une forme
quasi-modulaire / de poids k, niveau*18) D et caractère x est une fonction holomorphe
sur J^, telle que /(g^) = x(d)(cz + d)kf(z) quel que soit (jj) <E r0(D). Une forme
(17>Soit H le noyau de pv> et soit G = #q/H ; c'est un groupe fini, et V peut être considérée comme une
représentation de G. D'après le th. 1.3.19, il existe dy € N, une famille (Ci, xu ^i)> pour i € I, où C* est un
sous-groupe (cyclique) de G, \i est un caractère linéaire de C*, et n^ € Z, telle que xv = I^gi niïndQ.Xi-
Soit alors K* le corps de nombres tel que ^ soit l'image réciproque de C* dans ^q. On peut considérer
Xi comme un caractère linéaire de #Kn et on déduit du (iv) de l'exemple G. 1.2, la relation
L(V,5)dv=fjL(Ind^jXi,5r.
i€l
(18>Si D = 1, on a T0(D) = SL2(Z) et x = 1- Comme SL2(Z) est engendré par (£ }) et (J ~0l), la
condition de quasi-modularité est équivalente aux conditions f(z + 1) = f(z) et z~kf(—l/z) = f(z)
utilisée dans les exercices du § VIL 5.
530
ANNEXE G. INTRODUCTION AU PROGRAMME DE LANGLANDS
quasi-modulaire est en particulier périodique de période 1, et donc a un développement
de Fourier (q-développement) du type
/(*) = X>(/)flfw, avec<z = e2-*.
nez
On dit que / est une forme modulaire parabolique (ou cuspidale) de poids k, niveau D et
caractère x si e^e est quasi-modulaire, et si elle est à décroissance rapide à l'infini, ce qui
signifie que lm(z)^(cz + d)~kf(^%) est bornée sur le demi-plan lm(z) ^ 1, quels que
soient(19) N G N et (j jj) G SL2(Z). On note Sfe(D,x) l'espace de ces formes.
Si / G Sfc(D,x), on a en particulier an(f) = 0, si n ^ 0 à cause de la condition de
décroissance à l'infini, et on démontre comme dans l'ex. VII.6.3 que an(f) = 0(nfe/2), ce
qui permet d'associer à / une fonction L définie par
... , (2?r)s f^ ... , ,dy
-E
, ns
re=l
Un petit calcul montre que /1-> f\kw, où f\kw est définie par (f\kw)(z) = z~hf(-l/Dz),
envoie Sfc(D,x) dans Sfe(D,x)- Ceci permet, en coupant, comme dans les ex. VII.6.3,
VII.6.6, l'intégrale ci-dessus en \/D, de démontrer que L(/, s) a un prolongement holo-
morphe à C tout entier et vérifie une équation fonctionnelle reliant s et k — s. On dit que
/ est primitive, si L(/, s) admet :
• un développement en produit de facteurs d'Euler
L(/'s)=Si "ap{f)p" Hx ■<h(f)p"+xwp*"1-4' '
• une équation fonctionnelle du type A(/, k — s) = iuA(/*,s), où f*(z) = f(—z), w est
un nombre complexe de module 1, et
A(/'S) = ^D3/2L(/'S)-
L'existence de formes modulaires primitives relève du miracle, mais Atkin et Lehner
ont démontré que les /(^^), où / décrit les formes primitives de poids k, et a,b,d les
entiers (a ^ 0 et d ^ 0) forment une famille génératrice de l'espace vectoriel engendré par
les formes paraboliques de poids k de tout niveau.
Théorème G. 1.5. Si p : &q —> GL2(C) est une représentation irréductible impaire
(2°), alors il existe une forme modulaire primitive f, de poids 1, telle que L(/, s) = L(p, s).
En particulier, la conjecture d'Artin est vérifiée pour une telle représentation.
(19>Comme /(fffs) = x(d){cz + d)kf{z), si (° J) G r0(D), il suffit de vérifier ceci pour un système de
représentants de r0(D)\SL2(Z), qui est un ensemble fini.
(20)Cela signifie que p(froboo) ^ ±1 et donc que detp(froboo) = -1, ce qui est, de loin, le cas le plus
fréquent. Si detp(froboo) = 1, la représentation p est dite paire.
G.I. LA CONJECTURE D'ARTIN
531
Ce théorème est tout récent ; il a été annoncé en janvier 2007, et l'article a été complété
en octobre 2008. Le cas où l'image^21) de p dans PGL^C) est un groupe diédral remonte
aux années 30, et résulte des travaux de Artin et Hecke. L'un des premiers succès du
programme de Langlands a été de démontrer un tel résultat dans le cas où l'image n'est
pas A5 (Langlands (1980) et Tunnell (1981)). Ceci couvre en particulier le cas où l'image
de p dans GL2(C) est le groupe^22) GL2(F3), qui a servi de point de départ à Wiles pour
démontrer le théorème de Fermât. Les méthodes de Wiles ont été transformées en une
machine très efficace, par des mathématiciens de toute la planète, pour passer d'un point à
un autre dans l'ensemble des représentations de dimension 2 de ^q. La touche finale vient
d'être apportée^23) par Kisin (australien, en poste à Havard), Khare (indien, en poste à
Los Angeles) et Wintenberger (Strasbourg). Un des points amusants de la démonstration
est qu'elle passe par une récurrence sur l'ensemble des nombres premiers.
4-2. Un exemple
Comme on l'a déjà remarqué, si P = Xd + ad_iXd_1 + • • • + a0 G Z[X], alors &q
permute les racines de P ; on note Vp la représentation de permutation de &q qui s'en
déduit. Comme toute représentation de permutation, Vp peut se décomposer sous la forme
Vp = 1 + pp, où 1 est la représentation triviale. Cette décomposition donne lieu à une
factorisation L(Vp,s) = Ç(s)L(pp,s).
Si p est un nombre premier, on note NP(P) le nombre de racines de P dans Fp.
• Si P = X2 + X + 6, le discriminant de P est —23 et la loi de réciprocité quadratique
nous fournit un caractère de Dirichlet X23 : (Z/23Z)* —»• {±1} tel que NP(P) = 1 + X23(p)>
pour tout p (pour p = 23, on a X23{p) = 0 par convention, et il y a une racine double
dans F23). Alors L(pp,s) = L(x23,s) est sans mystère.
• Si P = X3 — X — 1, le discriminant est une puissance de 23, et il y a une racine
double dans F23. On a L(pP, 5) = Y[p€â> ^^(p),!^.^^-». (la présence de X23 trahit
le fait que Q(a/—23) est un sous-corps du corps engendré par les racines de P). On définit
des an, pour n ^ 1, en écrivant L(pP,s) comme une série de Dirichlet X)n>i ann~s (on a
donc ap = NP(P) — 1 si p est premier, et la série J3n>i an n~s enc°de le comportement de
<21>L 'image de p dans GL2(C) peut être arbitrairement grande car on peut toujours tordre une
représentation par un caractère linéaire attaché à un caractère de Dirichlet. Par contre, si on regarde l'image de
p dans le quotient PGL2(C) de GL2(C) par le sous-groupe des homothéties, on tue ce degré de liberté,
et l'image de p est soit de type diédral (groupe des symétries d'un polygone régulier), soit isomorphe à
A4, S4 ou A5. Le cas le plus difficile est celui de A5 car ce groupe est simple contrairement aux autres
groupes de la liste qui se dévissent en une suite de groupes commutatifs.
<22>Les représentations du type IV dans la figure 4 de l'annexe C sont de dimension 2 pour GL2(F3).
(23>Ils obtiennent ce résultat en démontrant une conjecture plus fine et plus générale de J-P. Serre (1984)
qui a servi de fil conducteur pour tous les résultats du sujet postérieurs à ceux de Langlands et Tunnell,
dont la démonstration du théorème de Fermât.
532
ANNEXE G. INTRODUCTION AU PROGRAMME DE LANGLANDS
P modulo p quand p varie). Le th. G.1.5 pour L(pp,s) résulte des identités
E«m" = \( E *^wV - E <f*2+^)=«Ild - M1 - «"*)
La première de ces identités se démontre grâce à la théorie du corps de classes qui permet
d'écrire pp comme l'induite d'un caractère linéaire de ^q(./=23). La seconde se démontre
par des techniques similaires à celles employées dans le prob. H. 11 pour prouver que
Ql/24Tlk>i(l ~ Qk) = Emezl-1)"1^6^1^24- le P°int étant <lue les deux membres sont
des formes modulaires de poids 1 (si q = e2t7rz, le membre de droite est 77(2)77(232), où 77 est
la fonction êta de Dedekind et le membre de gauche s'exprime en termes de la fonction 6
de Jacobi).
4.3. Représentations paires et formes de Maass
Les formes de Maass sont des objets beaucoup plus récents que les formes modulaires
puisqu'elles n'ont été introduites, par H. Maass, qu'en 1949.
Une forme de Maass f de niveau D, caractère \ et valeur propre À G C est une fonction
fé*00 sur 3>tf (vu comme un ouvert de R2) et vérifiant les conditions suivantes :
0) /(Sîï) = X(d)f(z), quel que soit (• J) € T„(D) ;
(ii) A/ = A/, où A = — y2(^2 + &) est le laplacien hyperbolique,
(iii) / est à décroissance rapide à l'infini.
Une telle forme a un développement de Fourier du type^24)
/(*)= E an(/)v^KI/(27r|n|2/)e2^,
n€Z-{0}
où I - v2 = A et K„(y) = \ J0+o° e-*t+*~1>/Vf est une fonction de Bessel (cf. ex. IV.1.9
et prob. H.10) dont une des vertus est de vérifier, si Re(s) > |Re(i/)|,
On dit que / est paire si /(— ~z) = f(z) et impaire si /(—2) = —f(z) ; toute forme de
Maass peut s'écrire comme somme d'une forme paire et d'une forme impaire. On attache
une fonction L à une forme de Maass / par la formule L(/, s) = J^iS ^^> et on a :
f+°°mv'-1'*^ = ?r-sr(^)r(^)L(/,.), si / est paire,
L
S'
Jo
+~iï^8+1/ 7=v-n^n^m*), - /- ^.
<24> L'équation aux dérivées partielles satisfaite par / se traduit en une équation différentielle du second
ordre pour les coefficients de Fourier, et une seule des solutions (a multiplication près par une constante)
n'explose pas à l'infini.
G.I. LA CONJECTURE D'ARTIN
533
On dit qu'une forme de Maass / est primitive, si sa fonction L possède :
• un développement en produit de facteurs d'Euler
L(/'s)=Si - a"{f)p's 5 x ■ a"{f)p~s+^p"'1'23'
• une équation fonctionnelle du type A(/, k — s) = wA(f*, s), où f*(z) = f(—z), w est
un nombre complexe de module 1, c = 0 ou 1 suivant que / est paire ou impaire, et
A(/,*) = *-M£±^)r(£±pV2L(/,s).
Conjecture G. 1.6. Si p : &q —► GL2(C) est une représentation irréductible paire, il
existe une forme de Maass primitive f, de valeur propre \, telle que L(/, s) = L(p, 5).
Cet énoncé impliquerait la conjecture d'Artin pour une telle représentation. On sait le
démontrer, grâce aux travaux de Langlands et J. Tunnell sus-mentionnés, si l'image de p
dans PGL2(C) n'est pas A5.
5. La théorie du corps de classes
Soit F un corps de nombres (25). L'ensemble ûp des a; G F annulés par un polynôme
unitaire P G Z[X] (dépendant de x) est un sous-anneau de F appelé anneau des entiers.
Par exemple, si d G Z n'est divisible par le carré d'aucun nombre premier, l'anneau des
entiers Q{Vd) est l'anneau AD de l'introduction.
Un tel anneau n'est pas forcément principal (26\ mais tout idéal n non nul de ûp peut
s'écrire de manière unique sous la forme ^ p?1 • • • p"'', où les pi sont des idéaux premiers
distincts(28). Deux idéaux 0, b de Ûf sont premiers entre eux (ce qui, pour un anneau
quelconque, signifie que a + b = ûp), si et seulement si il n'y a pas d'idéal premier de ûp
apparaissant à la fois dans la décomposition de a et b en idéaux premiers.
On peut généraliser les notions de caractère de Dirichlet et de fonction L de Dirichlet
aux corps de nombres. Si f est un idéal de Ûf, on note If l'ensemble des idéaux de Ûf
premiers à f. Un caractère de Hecke x (d'ordre fini) modulo f est une fonction multiplicative
(25)Tous les énoncés qui suivent sont des résultats de base de théorie algébrique des nombres, ce qui ne
signifie pas, loin de là, qu'ils sont faciles à établir.
(26) Contrairement à ce qu'espéraient Lamé et Cauchy qui se sont disputés, en 1847, la paternité d'une
démonstration du th. de Fermât en découlant jusqu'à ce que Kummer mette tout le monde d'accord en
fournissant un contrexemple.
(27)Un anneau ayant cette propriété est un anneau de Dedekind.
(28>Si I et J sont deux idéaux d'un anneau A, le produit IJ de I et J est l'idéal de A engendré par les
éléments de la forme a6, avec a € I et 6 G J. Par exemple, si I et J sont principaux engendrés par a et (3,
alors IJ est l'idéal principal engendré par a/3. Par ailleurs, un idéal p est premier si la condition ab € p
implique a € p ou b € p.
534
ANNEXE G. INTRODUCTION AU PROGRAMME DE LANGLANDS
X : If —» C*, telle que, si a G Ûf est positif(29\ et si a — 1 G f, alors x(n) = 1, si n est
l'idéal principal engendré par a. La fonction L de //ecfce attachée à un caractère de Hecke x
(d'ordre fini) modulo f est alors définie par
n€lf ^ '
Comme x est multiplicatif et comme n i-> N(n) est aussi multiplicatif, les mêmes
arguments que pour les fonctions L de Dirichlet montrent que l'on a une décomposition en
produit de facteurs d'Euler
L(x's) = îk1 - xwm- = J5 (g i - x(p)n(P)-*)'
et comme Ilp|(p) N(p) = p'F:Q' pour presque tout p, le facteur rip|(p) (l — x(p)N(p)-s) est
un polynôme de degré [F : Q] en p~s, sauf pour un nombre fini de p.
Ce qui précède s'applique en particulier au caractère trivial envoyant tout idéal n de ÛF
sur 1. La fonction L de Hecke associée Çp(s) = 2n nT^j» ava^ ete considérée longtemps
auparavant par Dedekind ; c'est la fonction zêta de Dedekind de F.
Exemple G.1.7. (i) Si F = Q, on retombe sur la fonction zêta de Riemann.
(ii) Si F = Q[V5]> on retombe sur la fonction £ad de l'introduction.
Théorème G. 1.8. (Hecke, 1920) Si \ est un caractère de Hecke primitif, alors L(x, s)
admet un prolongement méromorphe à C tout entier, holomorphe en dehors d'un pôle
simple en s = 1 six es^ Ie caractère trivial.
La situation est donc exactement la même pour un corps de nombres quelconque que
pour Q. La démonstration du théorème de Hecke repose sur les mêmes idées que celles
utilisées dans l'ex. VII.6.6 pour démontrer l'existence d'un prolongement méromorphe pour
la fonction zêta de Riemann. La présence d'unités dans Ûf rend toutefois les arguments
un peu plus délicats.
Le théorème principal de la théorie du corps de classes est alors le suivant.
Théorème G. 1.9. Si p est une représentation de dimension 1 de &F, alors il existe
un caractère de Hecke x de F, d'ordre fini, tel que L(Ind^p,s) = L(x,s).
Le théorème de Kronecker-Weber est déjà un théorème profond, mais sa démonstration
est grandement facilitée par l'existence des racines de l'unité qui donne une construction
systématique des extensions abéliennes de Q (ce sont les corps de nombres fixés par le
noyau d'un caractère linéaire de ^q). Dans le cas d'un corps de nombres général, on ne
(29>Cela signifie que a(a) > 0 si a € ^q et a(a) est réel; il n'y a pas de condition si a(a) n'est pas un
nombre réel.
G.2. LE THÉORÈME DE KRONECKER-WEBER REVISITÉ
535
connaît pas de tel procédé pour construire ces extensions @°\ ce qui explique, en grande
partie, qu'on ait mis tant de temps à démontrer le théorème ci-dessus (il a déjà fallu
beaucoup de temps pour arriver à concevoir son énoncé). L'histoire a commencé dans la fin
des années 1880 avec Kronecker et Weber, s'est continuée avec Hilbert (31) autour de 1900,
et le théorème ci-dessus date de la fin des années 1920, avec des contributions essentielles
de Furtwângler, Takagi, Artin et Hasse^32). Grâce aux efforts de tous ces mathématiciens et
de ceux des trois décennies suivantes, on a maintenant une théorie puissante, parfaitement
bien comprise, aux énoncés compacts, et qui peut très bien s'utiliser comme une boite
noire. Elle fait régulièrement l'objet de cours fondamentaux de M2.
G.2. Le théorème de Kronecker-Weber revisité
Chevalley s'est demandé s'il existait un groupe naturel, construit directement à partir
de Q (resp. de F, où F est un corps de nombres), dont les représentations de dimension 1
seraient exactement les caractères de Dirichlet (resp. les caractères de Hecke d'ordre fini
de F) primitifs. Cela l'a mené à la construction (1940) du groupe des idèles^33) esquissée
ci-dessous. Nous allons aller à l'envers de l'ordre historique (les adèles sont nés, de la
main d'Artin et Whaples, 5 ans plus tard que les idèles (sous le nom fort peu poétique de
"valuation vectors")), mais ce sont toujours les idées simples qui viennent en dernier <34). Les
adèles sont construits en considérant simultanément tous les complétés de Q (resp. d'un
corps de nombres F), et Tate a montré dans sa thèse (1950), sous la direction d'Artin,
comment l'analyse de Fourier sur les adèles permet de démontrer naturellement toutes
les propriétés analytiques des fonctions L de Dirichlet (resp. de Hecke) rencontrées au
chap. VII (resp. mentionnées au n° 5 du § G.l).
1. Adèles
1.1. Le théorème d'Ostrowski
En dehors de la norme usuelle que nous noterons | !«>, on peut définir, pour chaque
nombre premier p, une norme p-adique | \p sur Q. Rappelons que celle-ci est définie
(cf. alinéa 20.4 du § 1) par la formule |f \p = p-M<*)+M*), si a,6 G Z - {0}, et vp(n) est le
plus grand entier v tel que pv divise n.
<3°)C'est un des derniers problèmes (généralisant le "liebster Jugendtraum" de Kronecker) énoncés par
Hilbert en 1900 qu'on ne sait toujours pas résoudre.
(31)Trois des problèmes de Hilbert (les 9-ième, 11-ième et 12-ième) sont reliés à la question.
(32)L'école allemande a joué un rôle absolument primordial dans le sujet, et tous les articles de l'époque
(y compris ceux du mathématicien japonais Takagi) sont en allemand.
(33>Le mot "idèle" vient du mot "idéal" (dans tous les sens du terme...) ; il a donné naissance 20 ans plus
tard au mot "adèle", et Roubaud a fait d'Adèle et Idèle des jumelles dans "La belle Hortense".
*34)Comme le dit Weil : " Pour franchir toutes ces étapes, un bon étudiant ne met guère plus de jours à
présent qu'il n'y a fallu d'années à l'époque..."
536
ANNEXE G. INTRODUCTION AU PROGRAMME DE LANGLANDS
Théorème G.2.1. (Ostrowski, 1918) Une norme non triviale sur Q est équivalente à
la norme usuelle \ \oo ou à la norme p-adique \ \p pour un unique nombre premier p.
Démonstration. Commençons par supposer qu'il existe k G N tel que ||fc|| > 1. Comme ||1|| = i}
l'inégalité triangulaire implique ||fc|| < k et il existe a e]0,1] tel que l'on ait \\k\\ = ka. Soit m € N. On
peut écrire m en base k sous la forme m = Yh=o a^ avec o» € {0,1,..., fc - 1} et an ^ 0 de telle sorte
que l'on a m ^ kn. Comme ||ai|| < a, < k — 1 et ||fcf|| = ||A;||€, on obtient la majoration
IM| < (*- i)£>fa = ^(fc(n+1)a -1) < ^^>*na < cm",
où C = k i^I^ est indépendant de m. On peut appliquer cette inégalité à mn, ce qui nous donne
||m||n < Cmnû et, prenant la racine n-ième de cette égalité et passant à la limite, l'inégalité ||m|| < ma.
En échangeant les rôles de k et m, on en déduit que cette inégalité est une égalité, si ||m|| > 1.
Maintenant, si m G N - {0} est quelconque, il existe n G N tel que l'on ait ||fcnm|| > 1. On a alors
||m|| = Hfc^l^H^mll = k~an{knm)a = ma, ce qui montre que l'on a égalité quel que soit m G N puis,
utilisant la multiplicativité de la norme et le fait que || — 1|| = 1, que ||#|| = |x|^ quel que soit x G Q.
On en déduit que s'il existe k G N tel que ||fc|| > 1, alors || || est équivalente à la norme usuelle.
Dans le cas contraire, on a ||^|| ^ 1 pour tout nombre premier L Comme on a supposé || || non triviale,
il existe au moins un nombre premier p tel que ||p|| < 1. Si il en existe un autre g, alors quel que soit
n G N, on peut, d'après le théorème de Bézout, trouver un, vn G Z tels que l'on ait unpn + vnqn = 1. On
obtient donc
i = pu = \\unPn+Vnqn\\ < ikii • HP»» + ikii • imib ^ ibir + n«ir,
ce qui est impossible pour n assez grand. Il existe donc un et un seul nombre premier p tel que ||p|| < 1
et || || est équivalente à la norme p-adique. Ceci termine la démonstration.
Le résultat suivant est une conséquence immédiate de l'unicité de la décomposition
d'un entier en produit de facteurs premiers, mais est très important ; c'est ce qui justifie
la normalisation utilisée pour | |p.
Théorème G.2.2. (Formule du produit) Si x e Q*, alors
|*E|oo ' J^ |«£|p = ■!■•
p premier
1.2. L'anneau des adèles de Q
On renvoie à l'alinéa 20.4 du § 1 pour ce qui concerne la construction des nombres
p-adiques et leurs propriétés élémentaires.
Soit y = {oo} U «02. Les éléments de Y sont les places de Q. La place oo est la place
à l'infini et les p G & sont les places finies. Si v G y, on note Qv le complété de Q
correspondant ; on a donc Qoo = R.
D'après le théorème d'Ostrowski, les complétés de Q sont exactement les Qv, pour
v G Y. Il est donc naturel^35) d'essayer de considérer tous ces complétés ensemble. On
peut plonger Q diagonalement dans Ylvef Q«> c'est-à-dire en envoyant a G Q sur (xv)vçr>
(35)ç>est naturel, mais il s'est écoulé plus de 50 ans entre la construction des nombres p-adiques par
K. Hensel et les constructions qui vont suivre.
G.2. LE THÉORÈME DE KRONECKER-WEBER REVISITÉ
537
avec xv = a, quel que soit v G Y. On a alors xp G Zp sauf si p divise le dénominateur
de a, ce qui montre que l'image de Q est incluse dans le sous-anneau de Ylver Qv des
x = (Xoo,... ,#p,... ), avec xp G Zp pour presque tout p. Cet anneau est Vanneau des
adèles A de Q ; c'est le produit restreint des Qv relativement aux Zp, pour p G &*. On
note souvent (Xoo*^00') un élément x de A, et x'°°' est la partie finie (i.e. en dehors
de oo) de x. Si v G y, on peut identifier Qv au sous-anneau de A des x dont toutes les
composantes sont nulles sauf la composante en v.
On munit A de la topologie du produit restreint obtenue en prenant comme base
d'ouverts les rLes U*> x Ilpgs ^p> °ù S décrit les parties finies de Y contenant oo, et Uv, pour
v G S, décrit les ouverts de Qv. Les propositions G.2.3 et G.2.4 ci-dessous montrent que
Q est discret dans A, mais n'est pas loin d'être dense.
Proposition G.2.3. (i) Tout élément x de A peut s'écrire de manière unique sous la
forme x = a + y, avec a G Q et y G [0, l[xZ, où Z = Y[pe&> Zp.
(ii) Q est discret dans A et A/Q est compact.
Démonstration. (i) Commençons par démontrer qu'une telle écriture, si elle existe, est unique. Si
ai + 2/i = OL2 + 2/25 avec 0:1,0:2 G Q et 2/1,2/2 G [0, l[xZ, alors en particulier, on a 02 - 01 G Zp quel que
soit p G ^, et donc o2 - 01 G Z. Mais alors 01 + yïy00 = o2 + 2/2,00 implique, puisque yi,oo5 2/2,00 G [0,1[,
que 02 = 01, et donc aussi que 2/2 = 2/1. D'où l'unicité.
Passons à l'existence. Soit S un sous-ensemble fini de & tel que xp G Zp, si p £ S. Comme Z[±] est
dense dans Qp d'après l'alinéa 20.4.3 du Vocabulaire, il existe, pour tout p G S, un élément ap de Z[±]
tel que xp - op G Zp. Mais alors #' = a; - $ZPes op G R x Z, et il suffit de poser a = [x^] + J2Pes av
et y = x' - [x^] (où [x^] est la partie entière de la composante x'^ en 00 de x') pour obtenir une
décomposition de x sous la forme souhaitée. Ceci termine la démonstration du (i).
Que Q soit discret résulte de ce que, si x G A, le voisinage ouvert x + (] — |, |[xZ) de x contient au
plus un élément de Q, vu que la différence de deux de ses éléments est dans ] - 1, l[xZ qui ne contient
que 0 comme élément de Q.
Soient #i,#2 G A/Q, distincts, et soit Xi = (#i,v), si i = 1,2, le représentant de xi dans [0, l[xZ. Si
ki,oo - Z2,oo|^> 0, soient ô = min(|xi,oo - £2,oo|, 1 - |xi,oo - #2,oo|), et U<f00 = ]xii00 - ^xiy00 + ±ô[ et
Ui = Ui,oo x Z, de telle sorte que U* est un ouvert de A contenant Xi. Soit V = {a - 6, a G Ui, b G U2}.
Par construction, V est contenu dans ]g£, 1 - |5[xZ; son intersection avec Q est donc incluse dans
]|5,1 - ^[nZ = 0, et donc V ne contient aucun élément de Q. Il s'ensuit que {a + q\, a G Ui} et
{b + (fe, b G U2} sont disjoints pour tous qu q2 G Q, et donc que les images de Ui et U2 dans A/Q sont
des ouverts disjoints contenant Xi et #2 respectivement.
Si #1,00 = #2,00 = c, il existe p premier et n G N tels que les réductions modulo pn de xiyP et
X2yP modulo pn soient distinctes. On note U* l'ouvert ]c - |,c + |[x(xi,p + pnZp) x rLe^-{p} Z*> et
V = {a - 6, a G Ui, 6 G U2}. Alors V est contenu dans ] - 1, l[x((#i,p - #2,p) +pnZp) x n^G.^-fp} ^
et donc ne contient aucun élément de Q (un élément q de V n Q appartient à (R x Z) n Q = Z, vérifie
\q\ < 1, et donc q = 0, ce qui est incompatible avec son appartenance à (xïyP - x2yP) +pnZp). Comme
ci-dessus cela nous fournit des ouverts disjoints de A/Q contenant xi et #2 respectivement.
On en déduit le fait que A/Q est séparé. Enfin, la restriction de la projection de A sur A/Q à
[0,1] x Z est surjective. Comme [0,1] x Z est compact en tant que produit de compacts (et même en
538
ANNEXE G. INTRODUCTION AU PROGRAMME DE LANGLANDS
tant que produit dénombrable de compacts métriques), et que A/Q est séparé, cela prouve que A/Q est
compact, en tant qu'image d'un compact par une application continue.
Si S = {pi,...,ps} est un sous-ensemble fini de &, on note Z[S-1] le sous-anneau
Z[-^,..., ^] de Q obtenu en rendant pi,... ,ps inversibles.
Proposition G.2.4- Si S C &* est fini, alors Z[S-1] est dense dans Ylp€S QP.
Démonstration. Comme les pf sont premiers entre eux deux à deux, il existe, d'après le théorème des
restes chinois, Oi,„ € Z congru à 1 modulo p", et à 0 modulo p", pour tout j G S - {i}. Si maintenant
Vi € QPi, on peut trouver xit1l € Z[^] tel que \xit„, - yt\ < pjn car Z[^] est dense dans Qp. d'après
l'alinéa 20.4.3 du Vocabulaire. En posant xn = £j=i aj,nXj,n, cela fournit une suite d'éléments de Z[S-1]
vérifiant
\Xn ~ Vi\Vi = Kn^i.n - Jft + Y^a3^XjAPi = Knfo.n ~ Vi) + (a>i,n ~ tyi + ^ aî>nXj,n\p.
&i ' 3&
^ SUp {\<k,n\pt\(Xi,n -Vi)\Pi, IKn - ^)\Pi\yi\Pi,S\ip\aj>n\Pi\Xj,n\Pi)-
Maintenant, on a |a^,„|Pl < 1, si j ^ i, et comme \(xi,n - Vi)\pn \(ait„, - l)\Pi et \aj<n\Pi, si j ^ i, sont
tous ^pjn> on voit que xn tend vers (yi,...,ys) dans Ylp€SQp. Ceci permet de conclure.
1.3. Le groupe des idèles de Q
Le groupe des idèles A* de Q est le groupe des éléments inversibles de l'anneau A;
c'est donc l'ensemble des (xv)v€y, avec xv G QJ, et xp G Z* pour presque tout p.
Autrement dit. A* est le produit restreint des Q* relativement aux ZJ, pour p G «0*, et on
le munit de la topologie du produit restreint dont une base d'ouverts est constituée des
FLes Ut; x ripgs 2Ç> ou S décrit les parties finies de Y contenant oo, et Uv les ouverts
de Q*, si v G S.
Si fi G Q*, on a (3 G Z* sauf si p divise le dénominateur ou le numérateur de /?, ce qui
prouve que l'élément (/?,/?,...) de Ylver Q*> appartient à A*, et permet d'identifier Q* à
un sous-groupe de A*. Si v G Y, on peut identifier Q* au sous-groupe de A des x dont
toutes les composantes sont égales à 1 sauf la composante en v.
Si x = (xv)vÇr G A*, on a \xp\p = 1 pour presque tout p, ce qui permet de définir \x\a
par |o;|a = Ylv£y \xv\v II résulte de la formule du produit (th. G.2.2) que \/3\a = 1, quel
que soit (3 G Q*.
Lemme G.2.5. (i) Tout élément x de A* peut s'écrire de manière unique sous la
forme x = /J&ootf001, avec (3 G Q*, 600 G R;, et b^ G Z*, où Z* = \\p^Z*p.
(ii) A7Q*^R;xZ*.
Démonstration. On peut et doit poser (3 = sign(£00)npe,^P,'^a:p\ et alors b = (3~lx
vérifie les conditions 6,» G R+ et 6'°°' G Ilpe.^ ^J. On en déduit le (i), et le (ii) en est une
conséquence immédiate.
G.2. LE THÉORÈME DE KRONECKER-WEBER REVISITÉ
539
2. La formule de Poisson adélique
2.1. Transformée de Fourier sur Qp
Si p G <^, on note ^(Qp) l'espace (de Schwartz) des fonctions à valeurs dans C,
localement constantes, à support compact dans Qp. Soit <j> G ^(Qp). Comme <f> est à
support compact (et donc borné), il existe m G Z tel que <f)(x) = 0 si \x\p > p~m\
autrement dit, il existe m G Z tel que <f)(x) = 0 si x £ pmZp. Par ailleurs, comme (j>
est localement constante, il existe pour tout x G pmZp, un entier nx G N tel que <j> soit
constante sur B(#,p-nx) = x + pnxZp. Comme pmZp est compact, on peut extraire un
recouvrement fini du recouvrement de pmZp par les x + pnxZp. En notant n le minimum
des nx intervenant dans le sous-recouvrement fini, on voit qu'il existe n G N tel que
<j) soit constante sur x + pnZp, quel que soit x G pmZp. En notant la+p»zp la fonction
caractéristique de a + pnZp, et en utilisant la densité de Z[^] dans Qp, on en déduit le
résultat suivant.
Proposition G.2.6. ^(Qp) est le C-espace vectoriel engendré par les la+p»zp, pour
a G Z[^] et n G N. De plus, les relations entre les la+p»zp sont engendrées par les relations
suivantes :
• la+P»z„ = l6+p»zp, si b G a + pnZ,
• la+p»Z,, = X/i=0 la+ip»+p»+1Zp;
la seconde traduisant le fait qu'il y a p possibilités pour le reste de la division par pn+l, si
on connaît le reste de la division par pn.
Si <f> G y{Qp), on définit JQ (f>(x) dx par linéarité, en posant /Q la+pnzp(#) dx = p~n,
quels que soient a G Z[^] et n G N, ce qui revient à demander que Zp ait mesure 1 et
que l'intégration soit invariante par translation (i.e. soit une mesure de Haar). Que ce soit
possible suit du fait que les seules relations entre les l0+p»zp sont celles ci-dessus.
Si a; G Qp, il existe £ G Z[^] tel que x — £ G Zp (c'est une conséquence de la densité
de Z[-] dans Qp), et £ est bien déterminé à addition près d'un élément de Z[^] n Zp = Z.
On en déduit que e2i7r^ ne dépend que de x, et pas du choix de £, ce qui nous autorise
à le noter e2mx. Il est alors immédiat que x i-> e2i*x est un caractère linéaire de Qp
(e2«r(x+y) _ e2inxe2iny^ localement constant (constant sur a + Zp, pour tout a G Qp).
On définit alors la transformée de Fourier $ = ^p(f> de <f> G ^(QP) par la formule
kv)= f </>(x)e2inxydx,
ce qui a un sens car x i-> <j)(x)e2i*xy a même support que <f> et est localement constante
comme produit de deux fonctions localement constantes.
Exemple G.2.7. (i) La transformée de Fourier de lzp est lzp. En effet, si y G Zp, on
a e2i™v = 1 quel que soit x G Zp, et donc /Q lZp(x)e2i*xy dx = JQ lZp(x)dx = 1. Par
540
ANNEXE G. INTRODUCTION AU PROGRAMME DE LANGLANDS
contre, si vp(y) = —n < 0, le caractère linéaire x i-> e2tnxy de Zp est non trivial et constant
modulo pnZp ; on a donc
/ lz»e2^ dx = f £. e2i7ryûWz„M dx = p~n £ e2i*ya = 0,
^Q" JQ" a€Z;j/p»Z„ o€Z„/p»Z,,
d'après l'orthogonalité des caractères linéaires d'un groupe fini, puisque a i-> e2tirya est un
caractère linéaire non trivial de Zp/pnZp = Z/pnZ.
(ii) Les mêmes calculs montrent que, si <j> est constante modulo pnZp, et à support
dans p~mZp, alors 0 est constante modulo pmZpy et à support dans p~nZp.
(iii) Soit x '• (Z/pnZ)* —> C* un caractère de Dirichlet de conducteur pn, avec n > 1.
En utilisant Pisomorphisme Zp/pnZp = Z/pnZ, on peut associer à x une fonction </>x,
à support dans Zp (et même dans ZJ), constante modulo pnZp, en posant </>x(x) = 0
si x G pZp, et (j>x(x) = x(%), si £ G ZJ et âf est l'image de x modulo pnZp. Alors la
transformée de Fourier de <f)x est donnée par la formule
4(2/) = ^T<k(Pny), oùG(X)= J2 X(a)e2"^
P o€(Z/p»Z)*
est la somme de Gauss introduite au n° 2 du § VIL4. En effet, <j>x étant constante
modulo pnZp, la fonction <f>x est nulle en dehors de p-nZp, et si vp(y) ^ —n, la formule à
vérifier est équivalente à celle du lemme VII.4.3.
La transformée de Fourier sur Qp vérifie les mêmes propriétés que sur R en ce qui
concerne les dilatations, translations... De manière précise, on a le résultat suivant.
Proposition G.2.8. (i) Si a G Q* etb.ce Qp, alors
&p(4>(ax))(y) =|a|p-^(a-12/),
^P(<l>(x + b))(y) = e-2i^4>(y), et ^p(e2i^d>(x))(y) = fo + c).
(ii) (&v o ^p(t>){x) = (f)(—x) (formule d'inversion de Fourier).
Démonstration. Si a G Q* et 6, c G Qp, soit ua,6,c • ^(Qp) —> ^(Qp) l'application définie par
(ua,6,c0)(#) = e2tncx<f>(ax+b). Un changement de variable immédiat dans l'intégrale définissant &poua^c
montre que
&v ° uaAc = \a\p Xe~2in ^ua-iya-iCy_a-ib o &p.
On en déduit le (i). En appliquant le (i) deux fois, on montre que<^p0^pOuaj6c = ua,_6,-c0^p°^p- Soit
Y le sous-espace de c5^(Qp) des 0 tels que &po&p<f) = u_i,o,o0- Comme ua,__6,_cou_lj0,o = u-1,0,0 °Ua,6,c>
on voit que Y est stable par les ua,6,c- Par ailleurs, Y contient lzp, et up-n_p-nay0lzp = la+pnzp ; on en
déduit que Y contient les la+p»z,, pour a G Qp et n G Z, et donc Y = c5^(Qp). Ceci permet de conclure.
2.2. Transformée de Fourier adélique
Soit c5^(A) l'espace de Schwartz de A. C'est l'ensemble des combinaisons linéaires des
fonctions de la forme <t>{x) = Ylves Qvipv) Ylp^s lz7,(#p), où S décrit les parties finies de Y
contenant 00, et </>v G c5^(Qv), si v G S. Une telle fonction sera aussi notée ®ver4>Vi étant
G.2. LE THÉORÈME DE KRONECKER-WEBER REVISITÉ
541
sous-entendu que (f>p = lz,, pour presque tout pG^.
Comme les l0+p»zp engendrent ^(Qp), on voit que y {A) est aussi engendré par des
fonctions de la forme
</>oo(Zoo) JJ la„+p»PZ„(Zp) H lz„(Zp) = 0c»(Zcx>)lû+Nz(z1OOl)>
PGS pgS
où N = Ylp€sPnp et a est un élément de Z[S_1] tel que a — ap G Zp, quel que soit p G S
(l'existence d'un tel a est garantie par le lemme G.2.4). De plus, les relations entre ces
générateurs sont engendrées par les relations (en notant plus simplement cj)^ <g> la+Ng
l'élément de y (A) apparaissant dans le membre de droite ci-dessus) :
• 0oo <S> 10+Nz = 4><*> ® Vnz* si a - b G NZ,
• 0oo ® lû+Nz = E^ô* ^oo ® la+iN+NMZ. si a G Q, M, N G N - {0}.
Si (/> G ^(A), on définit fA<f>dx par linéarité en imposant que /A0oo <8> Iû+nz^ =
ji Sr<I>oo(Foo)dx<x» ce Qui revient à demander que la mesure de [0, l[xZ soit 1, et que
l'intégration sur A soit invariante par translation. On remarquera que si <f> = ^ver^v,
alors fA<f>dx = Tlv€y Jqv (j>v(xv)dxv, et presque tous les termes du produit valent 1.
Si x = (xv)v£r € A, on définit e2inx par e2inx = e-2inXooYlp€âi,e2iirx», et presque
tous les termes du produit sont égaux à 1. Il est immédiat sur la formule que l'on a
e2in(x+y) _ e2iirxe2iiry^ s[ x^y ç. a. De plus, on vérifie sans peine que e2in^x+^ = e2i7rx, si
v G Z ou si v est de la forme -\, avec p G &* et n G N. Comme tout élément de Q peut
s'écrire comme une somme d'éléments de ce type (décomposition en éléments simples),
on en déduit que x i-> e2tnx est périodique de période Q.
On définit la transformée de Fourier adélique <j> = <^a(J> de 0 G y (A) par la formule
(f>(y) = fA<f>(x)e2t1TXydx. Il est clair que si <j> = ®vçy<f>Vi al°rs &a4> = <8>v€r<^v<f>v> (ce qui
a un sens puisque, pour presque tout p, on a <f>p = lzp et donc <^p(f>p = lzp).
On déduit des formules locales (i.e. sur R et sur Qp) d'inversion de Fourier et des
formules locales pour les dilatations, que
{&a o *a4>)(v) = <K-V), et J?A(<f>(bx))(y) = Ibtffab^y), si b G A*.
Théorème G.2.9. (Formule de Poisson) Soit <j> G y (A). Alors
(0 EaGQ </>(<*) = EaGQ *(<*)•
(ii) Plus généralement, si b G A*, alors EaeQ^(°^) = Ma* Ea€Q0(a&-1)-
Démonstration. Par linéarité, on peut supposer que <f> = <t>oo<8> le+Nz> avec û € Q, et N G N. Dans ce
cas, 4>(y) = N~I0(yOo)e2iwaî')oo,lN_ig, et on est ramené à prouver l'identité
E <M«) = ^ E *2i7raa<Ma),
aGa+NZ aGN^Z
ce qui résulte de la formule de Poisson classique (th. IV.3.18) appliquée à la fonction / : R -> C, définie
par f(x) = 0oo(N# + a), dont la transformée de Fourier est f(y) = ^e2tn ^0<x>(n)-
Le (ii) résulte de ce que la transformée de Fourier dex*-+ <t>b{x) = 4>(bx) est <f>b(y) = \b\Âl<f>(b~ly)-
542
ANNEXE G. INTRODUCTION AU PROGRAMME DE LANGLANDS
3. Transformée de Mellin adélique et fonctions L
3.1. Intégration sur Q*
Soit J£?o(QJ) l'ensemble des <f> : Q* —> C, localement constantes et à support compact
dans Q* (autrement dit, Jèfo(QJ) est le sous-espace de c5^(Qp) des <f> vérifiant 0(0) = 0).
Si 0 6 Jz?o(Qp> on définit JQ» <f)(x) d*x par la formule
/ <j>(x) d*x = - / <f>(x) tal"1 dx,
ce qui revient à demander que la mesure de Z* soit 1 et que l'intégration sur QJ soit
invariante par x *-* bx, si b G Q*.
Soit J£f (QJ) l'ensemble des </> : Q* —> C, à support compact dans Qp, dont la restriction
à pnZ* = {x, \x\p = p~n} appartient, quel que soit n G Z, à J^o(QJ), et qui sont
sommables, ce qui signifie que Z)n€Z Jp«z* 100*01 d*£ < +oo. Si <f> G «£?(QJ), on définit
fn„ </>(#) d*x par la formule
f <j>{x)d*x = y^ f </>{x)d*x.
J% nezVz*
3.2. Intégration sur le groupe des idèles
Soit «£?(R*) l'ensemble des <j> : R* —> C* à décroissance rapide à l'infini et telles
que fR„ |</>(£) | d*t < +oo, où l'on a posé d*t = Ê. La mesure d*t est invariante par le
changement de variable 11-> bt, si 6 G R*.
Soit j£o(A*) l'espace engendré par les fonctions de la forme <f>(x) = Y[v£y4>v{xv)^
où (/>oo G «if (R*), <t>p G Jz?o(QJ) et (/>p = lz* pour presque tout p. On notera une fonction
de ce type sous la forme <8>V€r0v> ce qui sous-entend que <f>p = lz* pour presque tout p.
Si <f> e JÉ?o(A*), on définit JA. (/>(#) d*x par linéarité en imposant que
/ ®v€W»v d*X = TT ( / (/><,(#„) </*£„),
'A* vxe^ Jqz
où presque tous les termes du produit sont égaux à 1. Cela revient à demander que la
mesure de [1, a[xZ* soit loga et que d*x soit invariante par x i-> bx, si b G A*.
On note ££(A*) l'espace des fonctions dont la restriction à /?R+Z* appartient à j£o(A*),
quel que soit (3 G Q*, et qui sont sommables, i.e. J2peQ* X?r* z* 100*01 d*z < +°°- Si
<f> G Jèf (A*), on définit JA. </>(#) cfrc par la formule
/ <f>(x)d*x= J2 f 4>{x)dT
jA* 0€Q* JP*-\Z*
Proposition G.2.10. Soit cf>v G Jèf(QJ), pour v G Y, vérifiant :
• (f>p = 1 swr ZJ powr presque tout p,
• river (/q; l^(^v)|rf*xv) < +oo.
G.2. LE THÉORÈME DE KRONECKER-WEBER REVISITÉ
543
Alors <f> : A* —> C définie par (j>{x) = Ylv€y<f>v{%v) est un élément de JÉ?(A*), et
/A* 4>{x) d*x = nvGr ( IQî <t>v{xv) d*xv).
Démonstration. Si (3 G Q*, la restriction de 0 à #1*4 Z* est le produit de 1R. 0oo et des lpM/oz^p»
et comme vp(fi) = 0 pour presque tout p, et <f>p = 1 sur Z* pour presque tout p, cette restriction est
visiblement élément de Jèfo(A*).
Le reste se démontre comme la prop. VII.3.1. Soit ^(X) l'ensemble des nombres premiers < X,
I(X) l'ensemble des /? G Q*, positifs ou négatifs, dont la décomposition en facteurs premiers ne fait
intervenir que des éléments de ^(X) et, si k G N, soit I(X, k) l'ensemble fini des /? € I(X) tels que
-k < vp((3) < fe, si p € t?(X). En notant Cp(-fc, k) la couronne {# € Qp, p~k ^ |xp| ^ p*}, on obtient :
£ / _ |0(x)|<fx = / \4>{x)\d*x.
Ei(x,jb) -w;2* -/r* ><rw Cp(-&,fc)xnf,>x z;
:e qui permet de mettre le membre de droite sous la
(/ IMzocOKzoo) TT(/ \M*p)\d*xp),
Jk* p<x Jcp(-k,k)
ïue </»p = 1 sur Z*, pour tout p > X. En faisant tendn
x; / ^\Hx)\d*x=([ i0oo(*oo)K*oo) n ( / i^(*p)k«p).
0ei(X
Or 0(x) = Ilver Qvfav)* ce Qui permet de mettre le membre de droite sous la forme
p<X
si X est assez grand pour que <f>p = 1 sur Z* pour tout p > X. En faisant tendre k vers +oo, on en déduit
j96l(X) "/>«-+* *«• p<X
et en faisant tendre X vers +oo, on obtient
E / ~ l<K*)Ks=T7(/ \<t>vM\d*xv)<+oo,
et donc <f> est sommable. En particulier la série Y^peQ* //m* z* 0(x) ^*x est absolument convergente,
ce qui permet, en reprenant les calculs ci-dessus sans les valeurs absolues, de démontrer la formule
/a* <f>(x) d*x = river ( /q* ^(xv) d*xv), que l'on cherchait à obtenir.
3.3. Transformée de Mellin sur Qp
Lemme G.2.11. Si x est un caractère linéaire continu de Q*, il existe n G N — {0}
tel que x = 1 sur 1 + PnZp.
Démonstration. Comme x est continu, il existe n > 0 tel que \x(%) — M ^ l/2> si |x - l|p < p~n.
Or B(l,p~n) = l+pn''Zp, est un sous-groupe d'indice fini de Z* (c'est l'image réciproque de 1 € (Z/pnZ)*
par la projection naturelle Z* —> (Zp/pnZp)* = (Z/pnZ)*). Comme x est un morphisme de groupes,
l'image de 1 + pnZp est un sous-groupe de C* inclus dans le disque D(l, 1/2) ; on en déduit que cette
image est réduite à {1}, ce qui permet de conclure.
On dit que x est non ramifié si x = 1 sur ZJ. Si x est ramifié, on note n(x) le plus
petit entier n tel que x = 1 sur 1 + pn7,p ; alors pn^ est le conducteur de x-
Si G est un groupe, un caractère linéaire x : G —> C* est unitaire si |x(<?)l — 1> Quel
que soit g G G. On a alors x(9~l) = x(#)> Pour tout 9 e G.
Proposition G.2.12. Soit x '• QJ —* C* «n caractère linéaire unitaire continu.
(i) & 0 G J^(Qp), a/ors x i-> <f>(x)x(x)\x\*p G if(QJ), « Re(s) > 0.
Si Re(s) > 0, soit Mp(</>, x, 5) = /Q, </»(x)x(^)|^|prf*^ /a transformée de Mellin de <f).
544 ANNEXE G. INTRODUCTION AU PROGRAMME DE LANGLANDS
(ii) Mp(lz„, X, s) = i_x(p)p-*, si x est non ramifié, et MP(1Z;,, x, s) = 0,six est ramifié.
(iii) Dans le cas géiïèral, Mp(</>, x, s) est un polynôme en ps et p~s si x est ramifié, et
de la forme i-fjSjp-» + R-M, où R(s) est un polynôme en ps et p~s, si x est non ramifié.
Démonstration. On écrit <f> sous la forme </>(0)lzp -f Vs où V € JSfo(Qp)- Il existe alors n G N tel
que V>X soit constant modulo pnZp, ce qui permet de l'écrire sous la forme Y,aei ^a^a+pnzp- On a alors
MP(V>, X, s) = £aei K^zr\a\p~l, et comme \a\p G pz, cela montre que MP(V>, x, «) est un polynôme en p*
et p"s.
Maintenant, on a /p„z. ||x|p|d*a; = p-nR°(*). on en déduit que x ■-► lzpOzOxCaOMp' est sommable si
Re(s) > 0. De plus,
+00 p +00 p
Mp(lZf),X,s) = E / x(x)\x\i<Tx = J2 / x(pn*)bns|*<Ts
et le résultat suit de ce que /z. x(%) d*x = 1 si x = 1 sur Z* et est nul si x n'est pas trivial sur Z*
puisqu'il se factorise alors à travers le groupe fini (Z/pnMZ)*, et que la somme des valeurs d'un caractère
linéaire non trivial d'un groupe fini est nulle (orthogonalité des caractères linéaires).
3.4- La transformée de Mellin adélique
Proposition G.2.13. Soit x un caractère continu de A*, et si v € V, soit xv la
restriction de x à Q*. Alors, pour presque tout p G &, on axP = 1 sur Z*, et, six e A*,
x(x) = TlverXv(Xv)-
Démonstration. Comme x est continu sur A*, il est continu sur Z* = X[pe&> Z*, et par définition
de la topologie produit, il existe S c & fini et, si p € S, np € N - {0}, tels que \x(x) - 1| < 1/2, si
x € U = JlpGsC1 + PnpZp) npgs Zp- Or U est un sous-groupe de Z*, et donc son image par x est un
sous-groupe de C* inclus dans le disque D(l, 1/2) ; on en déduit que cette image est réduite à {1}. En
particulier, on a xP = 1 sur Z* pour tout p £ S.
Maintenant, si x € A*, on a Xv(xv) = 1 pour presque tout v, ce qui fait que x'(#) = YlvçyXv(xv)
est bien défini, et que x' est un caractère linéaire continu de A*. On conclut en remarquant que x'
et x coïncident sur le sous-groupe des idèles dont presque toutes les composantes sont égales à 1, et en
utilisant la densité de ce sous-groupe dans A*. (Si U est un ouvert de A*, il contient un ouvert de la
forme n«esUv x FIws^p' e^ donc contient des éléments dont toutes les composantes en dehors de S
sont égales à 1.)
Si <j> € JÉ?(R*), et si x est un caractère linéaire unitaire continu de R*, la transformée
de Mellin M^^x»*) de <f> est la fonction s i-> JR. <f>(t)x{t)\t\s d*t, qui est holomorphe
dans le demi-plan Re(s) > 0, comme le montre le th. V.5.7.
Proposition G. 2.14- Soit x un caractère unitaire continu de A* et, si v € y, soit
Xv la restriction de x àQ*.
(i) Si <j> € y(A), alors x i-> <j>(x)x(x)\x\sA e J£?(A*), si Re(s) > 1.
(ii) La transformée de Mellin Ma(</>,X>s) = Ja* <t>(x)x(x)\x\sAd*x de cf> est holomorphe
sur le demi-plan Re(s) > 1.
G.2. LE THÉORÈME DE KRONECKER-WEBER REVISITÉ
545
(iii) Si<f> = ®ver4>v, et si Re(s) > 1, alors MA(0,X>«s) = FUr Mv(0v,Xt,,s).
Démonstration. Commençons par supposer que <f> = <8>vç-r<t>v, où <f>v € ^(Qv), et <f>p = lzp, pour
presque tout p. Soit ij>v = </>«XvWs- H résulte de la prop. G.2.12 que, si Re(s) > 0, alors ij)v € -£?(QV)
quel que soit v € "A", et que /Q. |V>P| d*
•&P = )_n-itc(«) pour presque tout p. Comme le produit des ._ _nc(w^
est convergent pour Re(s) > 1, et comme ipp = 1 sur Z* pour presque tout p, d'après la prop. G.2.13, on est
dans les conditions d'application de la prop. G.2.10. On en déduit que^ey ipv = <Kx)x(?)\x\A € Sa (A*),
si Re(s) > 1, et que
MA(0,X,s) = II / tivMdTxv = II Mv(^,Xv,s)-
«er^Q* ver
Comme chacune des Mv(</>v,x«,s) est holomorphe sur Re(s) > 0, et comme le produit est absolument
convergent sur tout demi-plan Re(s) > c, si c > 1, on en déduit (th. V.5.4) Pholomorphie de Ma(</»,x>s)
sur le demi-plan Re(s) > 1. Ceci termine la démonstration dans le cas où <f> est un produit. Les (i) et (ii)
dans le cas général s'en déduisent par linéarité. Ceci permet de conclure.
3.5. Le théorème de Tate
Le théorème de Tate ci-dessous permet de prolonger analytiquement les transformées
de Mellin de fonctions adéliques. Sa démonstration repose sur la formule de Poisson adé-
lique et constitue une vaste généralisation de la méthode de l'ex. VII.6.6 pour prolonger
analytiquement la fonction £ de Riemann.
Soit x un caractère unitaire continu de A*, et soit Xv> si v G 'f, la restriction de x à Q*.
Soit S(x), l'ensemble des p tels que xP soit ramifié. D'après la prop. G.2.13 ci-dessus, cet
ensemble est fini. On définit le conducteur D(x) de x par la formule D(x) = ELpescx) Pn^-
Par ailleurs, la restriction de Xoo à R* est unitaire continue ; il existe donc t(x) G R
tel que Xoo(#) = zit(x), si x G R*.
Théorème G.2.15. (Tate, 1950) Si <f> € S*(A), et si x : A* -> C* est un
caractère linéaire unitaire continu, trivial sur Q*, alors Ma(0,X>5) admet un prolongement
méromorphe à C tout entier, holomorphe en dehors de pôles simples en s = —it(x) ei
5=1- it(x), si D(x) = 1, de résidus respectifs —0(0) et 0(0), et vérifie l'équation
fonctionnelle Ma(0,X>5) = Ma(0,X> 1 _ S)-
Démonstration. Si Re(s) > 1, on a
MA(*,X,*)= / <t>(x)X{x)\x\sAd*x = Y, f <t>(x)x{x)\x\sAd*x
Ja* ^q, .//?.r;.z*
Or d*x et xMMa sont invariants par x i-> @x, ce qui permet de réécrire l'expression
précédente sous la forme
/»+oo p /•+(» p
£ / / J>(0x)x(x)\x\Ad*x= / / ( E t(Px))x(x)\x\Ad*x,
p€Q*Jo Jz* Jo Jz* peQ0
l'échange des signes J2 et / étant justifié par la sommabilité de 0(x)x(^)|^|a sur A*.
546
ANNEXE G. INTRODUCTION AU PROGRAMME DE LANGLANDS
Maintenant, comme Q* = Q — {0}, la formule de Poisson adélique (th. G.2.9) permet
d'écrire S/?eQ* 00^) S0US ^a forme
-0(0) + E *(/**) = -*(0) + Ma E 4>W*~l) = «°) Wâ1 - m + Mï1 E &P*-1)-
On peut alors couper l'intégrale f*°° en fQ + f*°°, remplacer X)/?eQ* ^(/^O Par l'ex-
pression ci-dessus dans /0, faire le changement de variable x i-> x~l dans J0, et utiliser
l'identité x(x~l) = x(x) car X est unitaire. Comme
// \*\ixw*=(/^>^)(n/ *(*>««%) - {\ i;SS";•
(si p|D(x), alors Jz» Xp(%) d*£p = 0), on obtient
si D(x) ^ 1, auquel il faut rajouter -sffx) - i_t-it(x)> si DM = 1' 0n en deduit le
théorème car X)/?eQ* OWsOxMM* + <t>(Px)xix)\x\l~s) est sommable pour toute valeur
de 5, et définit une fonction holomorphe de s sur C tout entier, et la formule <f>(x) = (f>{-x)
montre que ce qu'on obtient ne change pas si on remplace simultanément cf> par <£, x par x
et 5 par 1 - 5 (on a t(x) = —t(x))-
4. Application aux fonctions L de Dirichlet
Le th. G.2.15 permet de redémontrer l'existence de prolongements analytiques et
d'équations fonctionnelles pour les fonctions L de Dirichlet. En ce qui concerne les fonctions L de
Dirichlet, le gain n'est pas flagrant, mais les calculs adéliques ne sont pas plus compliqués
pour les fonctions L de Hecke, et dans ce cas, le gain par rapport à la méthode originelle
de Hecke devient très appréciable.
4.1. La fonction zêta de Riemann. Le résultat suivant a déjà été démontré, et la
démonstration proposée ci-dessous n'est qu'une traduction adélique de celle de l'ex. VII.6.6.
Proposition G.2.16. Soit Ç(s) = ^t-Ç(s). Alors Ç(s) a un prolongement méro-
morphe à C, holomorphe en dehors de pôles simples en s = 0 et s = 1, de résidus
respectifs —1 et 1, et vérifie l'équation fonctionnelle £(1 - s) = £(s).
Démonstration. Soit <f> = ®v<f>v G c^(A), avec <f>oo(t) = e~nt*, et </>p = lz,,, quel que
soit p G Zp. On a (f>v = (j>Vi quel que soit v, et donc <f> = <f>. De plus </>(0) = 0(0) = 1.
Il résulte donc du th. G.2.15 que Ma(</>, 1,s) admet un prolongement méromorphe à C,
holomorphe en dehors de pôles simples en s = 0 et 5 = 1, de résidus respectifs — 1 et 1,
et vérifie l'équation fonctionnelle Ma(0, 1,1 — 5) = Ma(</>, 1,s).
G.2. LE THÉORÈME DE KRONECKER-WEBER REVISITÉ
547
Par ailleurs, on a Ma((/>, 1,s) = \[v£y Mv((f>v,l,s)> si Re(s) > 1, d'après le (iii) de la
prop. G.2.14. Or Mp(<f>p, 1,5) = ïz^t> si p G «0*, d'après le (ii) de la prop. G.2.12, et donc
nP€^Mp(^1>5) = CW. Enfin,
Jr* |<| Jo U 7TS/2
On en déduit que £(s) = Ma(0, 1,5), ce qui permet de conclure.
4.2. Fonctions L de caractères de A*
Soit x un caractère linéaire unitaire continu de A*, trivial sur Q*, dont le conducteur
D(x) est différent de 1, et soit Xv la restriction de x à Qï> si v G Y.
Comme x est unitaire, on a soit Xoo(Zoo) = |zoo|it(*\ soit Xoo(zoo) = sign(a;00)|2;oo|tt(x).
Dans le premier cas, on dit que x est pair, dans le second, qu'il est impair. On pose :
/ x fl six pair, fo si x pair,
Woo(x) = < . . . . c(x) = < . .
^ —z si x impair, ^ 1 si x impair.
On définit e(x, s) par la formule e(x, 5) = EL^X» 5)> avec
e ( S\ = /W«>W siv = oo, où^, , (l sipfD(x),
\wP(x)p-n{Xp)s sipe^,' °UWpW [xpd^^GGcp) sip|D(x).
On a donc e(x,s) = (Ylvwv(x))'D(x)~s- (La somme de Gauss G(xp) est la somme de
Gauss du caractère de Dirichlet de conducteur pn^r>) obtenu en utilisant l'isomorphisme
(Zp/pn^Zp)* = (Z/prt*»>Z)*.)
Enfin, on définit la fonction L de x par L(x, s) = Ylp\D(x) i-v,(p)p—» si R-e(5) > 1-
Proposition G. 2.17. La fonction A(x, 5) = rffiffu(îjî$&$2* L(x, s) adrae* wn
prolongement holomorphe à C, et vérifie l'équation fonctionnelle A(x, s) = e(x, s)A(x> 1 — 5).
Démonstration. Soit </> = <8>V0V, on l'on a posé
• 0oo(O = e-71"*2, si x est pair, et (/>«>(£) = £e_7r'2, si x est impair,
•0p = 1z„, sipfD(x),
• 0P = lz;XP> si p | D(x).
Nous allons calculer les facteurs Mv(0v,Xv,s) et Mv(0v,xt;, 1 - 5), pour tout v.
• On a <£oo = itfooM^oo- En effet, si x est pair, ceci est équivalent au fait que la
transformée de Fourier de e-7rt est e~ . Si x est impair, ceci équivaut au fait que la
transformée de Fourier de te~nt est -irce-7™ , ce qui peut se vérifier en remarquant que
-2irte~nt est la dérivée de e_,rt et donc sa dérivée est 2mx fois la transformée de Fourier
de e~nt . On en déduit que
M u y o) r((s + it(x) + c(x))/2) , (x)r((s + it(x) + c(x))/2)
par un petit calcul analogue à celui que l'on a fait pour déterminer M00(e~ir*2, l,s).
548
ANNEXE G. INTRODUCTION AU PROGRAMME DE LANGLANDS
• Si p \ D(x), on a <f>p = lz,,, et donc, d'après le (ii) de la prop. G.2.12, si Re(s) > 0,
^^•''h^f et m>(^^*)=i-^!(p)p-'-
• Si p | D(x), on a Mp(<f>p, \v, s) = 1, comme le montre un calcul immédiat. Par ailleurs,
on a <f>p{x) = ^%TXp(Pn(Xp)^)lp-»(x„)Zj;(^), d'après le (iii) de l'ex. G.2.7, et donc
MP(^,XP,1-*) = 5S/ , i XP(pnix^)xP^)H-Sd*x
P w/ Jp-n<-Xi>)Z*
= %JxP(pn(Xp))pn(x")(1-s) / d*x = wp(X)p-n^'){s).
On a donc, si Re(s) > 1,
w (x \ nu/i N r((5 + ^(x)+c(x))/2) -,-r 1 ., .
De même, si Re(s) < 0, alors Ma(<£,X> 1 — s) = Ylv£y Mv(0v,xv, 1 - «s) est aussi égal à
r((i-g + ^(x) + c(x))/2)( n „. Mp-«cx,)W) n x-
WooV
P|D(X) PtD(x)
c'est-à-dire à e(x, s)A(x, 1 — s). Le résultat suit donc du th. G.2.15, en utilisant le fait
que <f>{0) = 0(0) = 0 car </>p{0) = 4(0) = 0, si p | D(x).
4.3. Caractères de Dirichlet et caractères linéaires continus des idèles
A un caractère de Dirichlet x de conducteur D, on peut associer, grâce au lemme G.2.5,
un caractère linéaire xa de A*, continu, d'ordre fini (et donc unitaire), par la formule
Xa{x) = xK^001))"1, si x = Ax>&loo[, où p e Q*, 6oo G R*, &]ool G Z*, et où l'on note
7Td : Z* —> (Z/DZ)* la projection naturelle^. On remarquera que xa est trivial sur Q*
par construction.
Lemme G.2.18. L(xa,s) = L(x,s).
Démonstration. On note Xp la restriction de xa à QJ, et il s'agit de vérifier que si
p \ D, alors \(p) = Xp(p)- Soit x (resp. y) l'idèle dont toutes les composantes sont 1
(resp. p-1) sauf la composante en p qui est égale à p (resp. 1). On a alors xp(p) = Xa(x)
par définition, et comme x = py, on a Xp(p) = X^dCî^00'))-1- ^r !/'°°' a toutes ses
composantes en les l divisant D égales à p-1 ; on en déduit que ^0(2/'°°') = p-1, et donc
que Xp(p) = X(P-1)-1 = X(p)> ce qui permet de conclure.
(36>On envoie Z£ sur 1, si p \ D, et Z* sur {Zp/pv"^Zp)* = (Z/pwp(D>Z)*, si p | D, et on utilise
l'isomorphisme (Z/DZ)* = np|D(z/PVp(D)z)* fourni par le théorème des restes chinois.
G.3. LE PROGRAMME DE LANGLANDS
549
On déduit de ce lemme, et de la prop. G.2.17, une démonstration adélique de l'existence
d'un prolongement analytique et d'une équation fonctionnelle pour L(x, s). Par ailleurs, ce
lemme permet aussi de reformuler le théorème de Kronecker-Weber sous la forme suivante.
Théorème G.2.19. Si p est une représentation de dimension 1 de &q, il existe un
caractère linéaire unitaire continu x{p) àe A* = GLi(A), trivial sur Q* = GLi(Q), tel
queL{p1s) = L(x{p),s).
G.3. Le programme de Langlands
Le programme de Langlands consiste à remplacer 1 par n dans l'énoncé du th. G.2.19
ci-dessus. (C'est plus facile à dire qu'à faire...)
1. Représentations automorphes
Notons G le groupe GLn, et donc G (A), G(Q), G(R), G(QP) et G(ZP) désignent
respectivement les groupes GLn(A), GLn(Q), GLn(R), GLn(Qp) et GLn(Zp). Alors
G(A) est le produit restreint des G(QV), pour v G y, relativement aux G(ZP), pour
p G & ; autrement dit, un élément x de G(A) est de la forme {xv)vç.y, avec xv G G(QV),
et xp G G(ZP) pour presque tout p. On écrit aussi x sous la forme (a;,», a;'00'), où x^ =
(xp)p£&> est la partie de x en dehors de oo. Comme d'habitude, G(QV) s'identifie à un
sous-groupe de G (A), si v G V.
Soit £^(G(Q)\G(A)) le C-espace vectoriel des formes automorphes^ cuspidales
pour G (A), c'est-à-dire des fonctions <j> : G (A) —> C vérifiant :
(i) (^(jx) = <[>(x) quels que soient 7 G G(Q) et a; G G (A),
(ii) il existe K^ d'indice fini dans riP€<?»Gî(Zp) tel que <j>(xh) = <f>(x) quels que soient
x G G(A) et h G K^, et les <j>{xh), pour(38) h G On(R), engendrent un espace de dimension
finie,
(iii) il existe un caractère linéaire unitaire continu x de A*, trivial sur Q*, tel que
<f>(Azx) = <t>{xkz) = x(z)<l>(x), si Az est la matrice de l'homothétie de rapport z G A*,
(iv) Si x'00' est fixé, <f>(Xoo, a;'00') est une fonction de classe ^°° des coordonnées de a^,
vecteur propre de tous les opérateurs différentiels commutant à l'action de G(R).
(v) <f> est à décroissance rapide à l'infini (en un sens que nous ne préciserons pas).
On fait agir g G G (A) sur les fonctions <j> : G (A) —» C par translation à droite sur la
variable, c'est-à-dire par g • <f>{x) = <f>(xg). L'espace j#o(G(Q)\G(A)) n'est pas stable par
(37)L'automorphie traduit la condition (i) qui est la plus subtile des conditions (i)-(v) ci-dessus, et la
cuspidalité correspond à la condition (v).
(38)Le groupe On(R) est le groupe des isométries de Rn ; c'est un sous-groupe compact de G(R), et il
est maximal pour cette propriété, de la même manière que G(ZP) est un sous-groupe compact de G(QP),
et est maximal pour cette propriété.
550 ANNEXE G. INTRODUCTION AU PROGRAMME DE LANGLANDS
l'action de G(A), mais presque^39*, et nous allons un peu tricher en prétendant qu'il Test
(cf. note 39 pour un énoncé correct), et donc que £*6(G(Q)\G(A)) est une
représentation de G(A). Alors £*o(G(Q)\G(A)) se décompose en somme directe de représentations
irréductibles (ses composantes irréductibles sont les représentations automorphes cuspi-
dales). Le théorème ci-dessous représente un travail certain (dû, pour n = 2, à Jacquet et
Langlands (1969), et pour n ^ 3, à Godement et Jacquet (1972)). La démonstration de
l'existence et du prolongement analytique des fonctions L automorphes a fortement été
inspirée par la méthode introduite par Tate pour étudier les fonctions L de Hecke.
Théorème G. 3.1. Soit U une représentation automorphe cuspidale de degré n. Alors
(i) II admet une factorisation^ sous la forme U = ®'verY[V) où Uv est une
représentation irréductible (de dimension infinie) de G(QV).
(ii) II admet une fonction L se factorisant sous la formel L(II,5) = Tlvev^O^viS),
où Lflloo, s) est un produit de fonctions F qui ne dépend que de 11^, et L(np, 5) = E }-a),
où EP(X) est un polynôme de degré ^ n et de degré n pour presque tout p, dont le terme
constant est 1, et qui ne dépend que de np.
(iii) L(II, 5) admet un prolongement holomorphe à tout le plan complexe, et admet une
(39>I1 est stable par G(A'°°[), par On(R), mais pas par G(R) à cause de la condition (iii) imposant
que les (f>{xh), pour h G On(R), engendrent un espace de dimension finie. Par contre, il est stable par
Vaction infinitésimale de G(R), c'est-à-dire par les opérateurs différentiels #a> pour A G Mn(R), avec
#A0(z) = lim^o rl(<f>(xetA) - <f>(x)), et etA = J2t™o ££f- G G(R) est l'exponentielle de la matrice tA.
Il y a des conditions de compatibilité évidentes que doivent satisfaire les actions de On(R) et Mn(R)
car etA G On(R) si (et seulement si) A est antisymétrique. Dans ce qui suit, nous commettrons l'abus
d'appeler représentation de G(R) (resp. de G(A)) un C-espace vectoriel muni d'actions de On(R) et
Mn(R) vérifiant les relations de compatibilité évoquées ci-dessus.
(40>Le groupe Ga est essentiellement un produit. Or on a vu, dans le cas des groupes finis, que si
G = Gi x G2, alors toute représentation irréductible de G se factorise sous la forme Vi <g> V2 où V* est
une représentation irréductible de G*, si i = 1,2. Il est donc naturel de penser qu'une représentation
irréductible de Ga va aussi admettre une factorisation, et c'est ce que prétend le (i) du th. G.3.1.
D'un autre côté, il n'est pas très raisonnable de faire le produit tensoriel d'une infinité d'espaces vectoriels,
et le produit tensoriel du théorème est un produit tensoriel restreint (On a déjà vu des exemples de cette
notion : c5^(A) est le produit tensoriel restreint des c5^(Qv), pour v G "A, relativement aux fonctions lzp5
pour p G & ; de même, j£b(A*) est le produit tensoriel restreint de Jèf (R*) et des o£?0(Qp)> pour p G <^,
relativement aux fonctions lz-, pour p G &.) De manière précise, pour tout p tel que le polynôme Ep
du (ii) du théorème soit de degré n, la représentation ÏIP possède un vecteur privilégié xp (bien déterminé
à multiplication près par un élément de C*, mais cette indétermination est sans importance) qui est fixe
par G(ZP). Alors le produit tensoriel restreint <8>veyllv relativement aux vecteurs xp est engendré par
des éléments de la forme <8>veYyvi avec yp = xp pour presque tout p. On remarquera que g G G a &&*>
naturellement sur un élément de ce type par la formule g • (<8>ver2/t;) = <8>ver(<7t; • 2/v)5 comme dans le
cas du produit tensoriel de représentations de deux groupes, le point étant que<7p G G(ZP) pour presque
tout p et donc que gp • yp = xp, pour presque tout p.
(41>Ces fonctions L automorphes sont de vastes généralisations des fonctions L de Dirichlet.
G.3. LE PROGRAMME DE LANGLANDS
551
équation fonctionnelle du type L(II,s) = e(s)L(IIv, 1 - 5), où IIV est une autre
représentation automorphe cuspidale (contragrédiente de II), et e(s) est de la forme A • Bs, avec
A G C* et B G R;.
Conjecture G. 3.2. (Langlands, 1968) Si p est une représentation irréductible de
dimension n de&Q, il existe une représentation automorphe cuspidale de degré n telle que
L(p,s) = L(II(p),*).
Au vu du théorème ci-dessus, cette conjecture implique la conjecture d'Artin, mais va
en fait bien au-delà. Ce n'est qu'un petit bout de l'édifice dont Langlands conjecture
l'existence.
Nous montrerons comment transformer une forme modulaire primitive ou une forme
de Maass primitive en une représentation automorphe cuspidale de GL2(A) dans le n° 2,
ce qui permet de voir les représentations automorphes cuspidales comme une vaste
généralisation des formes modulaires (ou de Maass) primitives. Notons qu'en degré ^ 3, il
ne semble pas forcément y avoir d'équivalents des formes modulaires ou de Maass, et le
recours au langage des représentations devient difficilement contournable.
2. Des formes modulaires aux représentations automorphes
2.1. Préliminaires
Si D G N, soit KD le sous-groupe de GL2(Z) = npG^GL2(zp) des h = («£), avec
c G DZ. Si x est un caractère de Dirichlet modulo D, on fabrique un caractère linéaire x
de KD, en posant x(h) = x(d), où l'on a noté d l'image de d dans (Z/DZ)* = (Z/DZ)*.
On a alors x(7) = xM, si 7 = (j J) e r0(D).
Proposition G.3.3. (i) Tout élément de GL2(A) peut s'écrire sous la forme ygooK,
avec 7 G GL2(Q), gw G GL2(R)+ = {g G GL2(R), àetg > 0}, et k G KD.
(ii) Cette écriture est unique à multiplication près de 7 à droite par a G To(D) et de
poo et k à gauche par a-1.
Démonstration. Cf. alinéa 2.3.
2.2. La forme automorphe associée à une forme modulaire
Soit / G Sfc(D, x)- On peut utiliser la décomposition de GL2(A) ci-dessus pour attacher
à / une fonction <f)f sur GL2(A), grâce à la formule,
Mx) = xW-H^^^^/Cg^), - - = 19~h et 9oo = (Z t )•
Le (ii) de la prop. G.3.3 et le fait que (cz + d)~hf(%$) = x(d)f(z\ si ( J *) G r0(D),
montrent que ceci ne dépend pas de la décomposition de x choisie. Il n'est pas très difficile
de vérifier que 0/ est une forme automorphe cuspidale.
552
ANNEXE G. INTRODUCTION AU PROGRAMME DE LANGLANDS
On procède de même avec une forme de Maass /, de caractère \ et valeur propre A
pour r0(D), en définissant </>/ par la formule 4>f(x) = xM-1/(<7oo)-
Dans les deux cas, on note 11/ le sous-espace de «$#u(GL2(Q)\GL2(A)) engendré par </>/
sous l'action de GL2(A). Le théorème ci-dessous peut être considéré comme le point de
départ du programme de Langlands.
Théorème G.3.4- (i) Si f est primitive, alors 11/ est une représentation automorphe
cuspidale de degré 2, et donc admet une factorisation sous la forme 11/ = <8>V€^f,v
(ii) Si f est de niveau D, et si p ne divise pas D, la représentation II/)P est complètement
décrite par le facteur d'Euler Ep(/, s) en p de la fonction L(/, s), et L(II/)P, s) = Ep(/, s)'1.
Pour préciser le (ii), factorisons le facteur d'Euler Ep(/, s) sous la forme
Ep(/, s + ^f1) = (1 - app~s)(l - fSpp~s) si / est une forme modulaire de poids k,
Ep(/, s) = (1 - app~s)(l - ppp~s) si / est une forme de Maass.
Ceci permet de définir deux caractères /Ui,/u2 de Q* par la formule H\(x) = apVp^ et
^(x) = Pi>vp • La représentation II/>P est alors la représentation I(^i,^2) obtenue en
faisant agir GL2(QP), par translation à droite sur la variable, sur l'espace des fonctions
(f> localement constantes sur GL2(QP) telles que
<K(ôd)x) = »i(a)n2(d)\^\1/2<i>(x), si M G Q;, b G Qp, et x G GL2(Qp).
La construction ci-dessus n'est pas sans rappeler la construction des représentations
induites pour les groupes finis (cf. n° 2 du § C.3) et, si on note B le sous-groupe de Borel de
GL2(QP), (i.e. le sous-groupe des matrices triangulaires supérieures), alors I(/xi,/x2) est
l'induite localement constante à G du caractère linéaire (g bd) i-> /zi(a)/z2(d)|^| de B.
La représentation II/)P, pour p divisant D, est plus subtile à décrire. Sa description
rentre dans le cadre de la correspondance de Langlands locale (cf. n° 3).
2.3. La décomposition de GL2(A)
Lemme G.3.5. Si S est un sous-ensemble fini de HP, alors SL2(Z[S-1]) est dense
dans npGSSL2(Qp).
Démonstration. — Soit A = (Ap)p6S € npesSL2(QP)- D'après le lemme B.2.2, on peut écrire Ap
sous la forme Ap = (£ i)(Jaj',)(yP °)(o ?)> avec *P>zp,yp,2p G QP. Comme Z[S_1] est dense dans
ripes Qp» on Peut trouver des suites (t?n)neN, «)neN, Mien et «)neN d'éléments de Z[S_1] tendant
respectivement vers tp, xp, yp et tp, pour tout p € S. Si on pose A^ = (^ i)(oXi")(»î. i)(oZf )' a^ors
(A^)nGN est une suite d'éléments de SL2(Z[S-1]) tendant vers A dans Ilpes^I^Qp)- Ceci permet de
conclure.
Venons-en à la démonstration de la prop. G.3.3. Soit g G GL2(A). Comme detg G A*,
on peut écrire detp de manière unique sous la forme (3b, où b = (600,6'°°'), avec p G Q*,
G.3. LE PROGRAMME DE LANGLANDS
553
boo G R; et &l°°l G Ilpe^ZJ. Mais alors h = (%' ^g^1 ?) G SL2(A). Soit S le sous-
ensemble de & constitués des p divisant D et des p tels que hp £ SL2(ZP). D'après le
lemme G.3.5, on peut trouver 70 G SL2(Z[S-1]) aussi proche que l'on veut de (/ip)pes;
en particulier, on peut trouver 70 G SL2(Z[S-1]) tel que %lhp = (^ j£) G SL2(ZP) quel
que soit p G S, et vérifie vp{cp) ^ vp(D), quel que soit p divisant D. Alors 7 = (o?)7o>
9oo = 7ô"1^oo(V ï) et K = T^1^00^61?1 î) fournissent une décomposition de g ayant les
propriétés voulues. Ceci démontre le (i).
Le (ii) suit juste du fait qu'un élément 7 = (£$) dans l'intersection de GL2(Q) et
de GL2(R)+KD est à coefficients dans Z ainsi que son inverse, de déterminant positif, et
vérifie vp(c) ^ vp(D) quel que soit pe^. Autrement dit, c'est un élément de r0(D).
3. Quelques autres aspects du programme de Langlands
Le programme de Langlands a plusieurs autres facettes. En particulier, on peut
remplacer Q par un corps de nombres F dans tout ce qu'on a fait ; l'anneau des adèles de F
étant construit de la même manière, à partir de tous les complétés Fv de F.
• La correspondance de Langlands locale. Il s'agit d'une correspondance entre les
représentations irréductibles de dimension n de &qp et certaines représentations irréductibles
(les représentations cuspidales) de GLn(Qp). Cette correspondance a finalement été
établie, en toute généralité(42\ par M. Harris (Paris 7) et R. Taylor (Harvard) en 1999, et
simplifiée par G. Henniart (Orsay), toujours en 1999. Ceci fournit une description indirecte
fort utile du groupe &qp.
• La correspondance de Langlands pour les corps de fonctions. Fixons un nombre
premier p. On peut considérer, au lieu de Q et des corps de nombres, les extensions finies K
du corps FP(X) des fractions rationnelles à coefficients dans Fp. L'anneau des adèles de K
est défini à partir des complétés de FP(X) pour les différentes normes que l'on peut mettre
sur FP(X) ; une différence avec le cas des corps de nombres est que ces complétés se
ressemblent beaucoup : ils sont tous de la forme Fg((T)), corps des fractions de l'anneau des
séries formelles à coefficients dans Fq, où Fq est le corps fini à q éléments et q est une
puissance de p. Dans ce cadre, la correspondance de Langlands a été établie par L. Laf-
forgue (I.H.E.S., Bures sur Yvette) en 1999, ce qui lui a valu la médaille Fields (2002). La
démonstration utilise, entre autres, de puissants outils de géométrie algébrique introduits
par A. Grothendieck dans les années 60; le cas n = 2 avait été établi par V. Drinfeld
(médaillé Fields en 1990) dans les années 70, et la démonstration de L. Lafforgue est une
vaste généralisation de celle de V. Drinfeld.
• La fonctorialité de Langlands. Du côté galoisien, on dispose de tas de constructions
donnant de nouvelles représentations à partir de représentations connues. Par exemple, si
F c K sont deux corps de nombres, et si p est une représentation de £fp (resp. de ^k)>
(42^De la même manière que l'on peut considérer un corps de nombres au lieu de Q, on peut considérer
un complété Fv d'un corps de nombres au lieu de Qp.
554 ANNEXE G. INTRODUCTION AU PROGRAMME DE LANGLANDS
on peut considérer la restriction (resp. l'induction) de p à &k (resp. à £&). Toutes ces
constructions devraient avoir des analogues du côté automorphe, mais on est encore bien
loin de comprendre vraiment ce qui se passe même si, en 2008, Ngô B.C. (maintenant à
Chicago) a achevé la démonstration du « lemme fondamental » énoncé 20 ans plus tôt
par R. Langlands et D. Shelstad (« lemme » parce que cela semblait une petite identité
combinatoire et « fondamental » car l'absence de démonstration bloquait tout progrès
ultérieur), ce qui lui a valu la médaille Fields en 2010. La démonstration repose sur
un échafTaudage assez impressionnant de théories et de réductions dues à M. Goreski,
R. MacPherson, R. Kottwitz, G. Laumon et J.-L. Waldspurger (entre autres).
• La correspondance de Langlands géométrique (qui semble beaucoup intéresser l'armée
américaine). Elle ne fait pas partie du programme initial de Langlands : c'est une extension
[due à l'école russe autour de V. Drinfeld et A. Beilinson (maintenant à Chicago tous les
deux)] dont la motivation vient de la physique mathématique en lien avec la théorie des
cordes. Il s'agit d'une correspondance pour les corps de fonctions où on remplace le corps
fini Fp par le corps C des nombres complexes.
ANNEXE H
PROBLÈMES CORRIGÉS
Les exercices et problèmes qui suivent portent sur le contenu des chapitres I à VII.
Les exercices H.1.1, H.1.2, H.1.3 et les problèmes H.2, H.3 et H.4 ont pour but
l'établissement de la table des caractères d'un groupe fini [il s'agit respectivement de S3,
S4, (§{) C GL2(Fg), A5, GL2(F3) et GL3(F2)|. La difficulté va en croissant, mais les
techniques sont assez similaires d'un problème à l'autre ; les 3 problèmes sont conçus pour
passer en revue les principaux énoncés du chap. I.
Le prob. H.5, qui explore les propriétés des coefficients de Fourier des fonctions
continues, et le début du prob. H.6 utilisent le contenu du chap. II ; le reste du prob. H.6,
consacré à la tranformée de Fourier dans L2, et le prob. H.7, qui explore les liens importants
entre la transformée de Fourier et la convolution, mettent en action les résultats des
chap. III et IV.
Les ex. H.1.8 (calcul de f+°° ^J, H.1.9, H.1.10 (formule sin^ = <irz Un>1 (l - £)
d'Euler), H.l.ll (formule T(s)r(l - s) = ^ des compléments), H.1.12, H.1JL3 (th. de
Rouché), H.1.14, et les prob. H.9 (coefficients de Fourier des fonctions analytiques, en
écho au prob. H.5 et à l'annexe D), H.8 (fonctions elliptiques), H.12 (irrationalité de £(3))
et H. 13 utilisent des techniques diverses et variées de fonctions holomorphes. En
particulier, le prob. H.8 utilise une panoplie à peu près complète des résultats des chap. V et VI.
Les ex. H.1.4, H.1.5, H.1.6 et H.1.7 donnent plusieurs manières de calculer des
transformées de Fourier de fonctions rationnelles (équations différentielles ou méthode
des résidus) ou autre, et les ex. H. 1.6 et H.1.7 donnent des exemples d'utilisation de la
formule de Poisson. Ce sont de bons entrainements pour les prob. H. 10 (prolongement
analytique de séries du type s i-> X)neZ p7^> ou P est un polynôme) et H. 11 (formule
Ql/24 Yln^ii1 ~ <ln) = EmezC-1)"1^6™"^2724 d'Euler, et plein d'autres jolies formules) qui
sont destinés à faire utiliser le maximum d'énoncés des chap. IV à VI.
Le prob. H. 14 n'a pas vraiment de rapport avec le cours : c'est l'épreuve de 6 heures
du concours d'entrée 2003 de l'École Normale ; il est là en rapport avec l'annexe F.
556
ANNEXE H. PROBLÈMES CORRIGÉS
H.l. Exercices d'examen
1. Énoncés
1.1. Représentations des groupes
Exercice H. 1.1. — Soit S3 le groupe des permutations de {1,2,3}. On note e, s et t les trois
classes de conjugaison de S3, où e est la classe de conjugaison de l'identité, s celle des
transpositions et t celle des 3-cycles.
(i) Montrer (sans les construire) que S3 a deux représentations irréductibles de dimension 1 et
une de dimension 2.
(ii) On note xi le caractère de la représentation triviale 1, X2 celui de la signature e qui est
l'autre représentation de dimension 1, et 0 celui de la représentation W de dimension 2. De quelle
représentation ip = xi + X2 + 20 est-il le caractère ? Compléter la table
Xi
X2
X1 + X2 + 20
e
e
s
t\
(iii) On fait agir S3 sur lui-même par congugaison intérieure (g • x = gxg-1), et on note V la
représentation de permutation associée et x son caractère. Calculer x- En déduire les multiplicités
de 1, e et W dans la décomposition de V.
Exercice H.1.2. — On se propose d'établir la table des caractères du groupe S4 des permutations
de {1,2,3,4}. Comme les partitions de 4 sont 4, 3+1, 2+2, 2+1+1 et 1+1+1+1, le groupe S4 a 5
classes de conjugaison : la classe Ci de l'élément neutre 1 (1 élément), celle C2 des transpositions
(6 éléments), celle C2,2 des produits de deux transpositions de supports disjoints (3 éléments),
celle C3 des 3-cycles (8 éléments), celle C4 des 4-cycles (6 éléments).
1
6
3
8
6
Ci
c2
02,2
c3
c4
1
1
1
1
1
1
e
1
-1
1
1
-1
e
2
0
2
-1
0
Xi
3
1
-1
0
-1
X2
3
-1
-1
0
1
Fig. 1. Table des caractères de S4
(i) Soit V la représentation de permutation associée à l'action de S4 sur {1,2,3,4}.
H.l. EXERCICES D'EXAMEN
557
(a) Calculer xv et (xv,Xv); en déduire que V est la somme directe Vi ® V2 de deux
représentations irréductibles Vi, V2 non isomorphes.
(b) Déterminer les sous-espaces Vi et V2 de V et montrer, en revenant à la définition, que
ce sont des représentations irréductibles de S4.
(c) Calculer les caractères de Vi et V2 ; quelles colonnes de la table cela permet-il de remplir ?
(ii) Quelle est la seconde représentation de dimension 1 ? Comment peut-on obtenir la seconde
de dimension 3 (pourquoi est-elle irréductible et différente de celle déjà construite?),
(iii) Comment peut-on compléter la table des caractères de S4 ?
Exercice H.1.3. — Soit K un corps, et soit G C GL2(K) le sous-groupe des (g {), avec a G K*
et 6 G K. On fait agir^ G sur K par la formule ( g \ ) ■ x = ax + b.
(i) Calculer (g î)(6 i)(o î)~ • En déduire que les classes de conjugaison de G sont
Ci = {(J?)},N ={(àf), 6eK-{0}}etlcsDû = {(g{), b e K}, pour a G K* - {1}.
(ii) On suppose à partir de maintenant que K est fini, de cardinal q, et donc que |G| = q(q — 1)
et |Conj(G)| = q. On note V la représentation de permutation de G associée à l'action de G
sur K et W l'hyperplan de V défini par W = {J2xçK ^x, Z)x€K ^x = 0}. Montrer que W est
une sous-représentation de V.
(iii) Calculer xw ; en déduire que W est irréductible.
(iv) Quelles sont les dimensions des autres représentations irréductibles de G ?
(v) Comment peut-on construire un caractère linéaire de G à partir d'un caractère linéaire
de K* ? En déduire que si K = F5 (où F5 = Z/5Z), la table des caractères de G est la suivante.
C1
N
D2
D4
D3
1
1
1
1
1
1
V
1
1
i
-1
—i
v2
1
1
-1
1
-1
f
1
1
—i
-1
i
Xw
4
-1
0
0
0
FlG. 2. Table des caractères de G, si K = F5
(vi) On suppose^ q = 4. Établir la table des caractères de G. Cette table vous rappclle-t-clle
quelque chose ? Pouvez-vous expliquer cette coïncidence ?
1.2. Transformée de Fourier et méthode des résidus
Exercice H.l.4. — Soit / : R -► C définie par f(t) = t^s-
WOna(J»)-x = xet (§{)•((§i)x) = (^^-(cx+d) = a(cx + d) + b = acx+(ad+b) = (a^ad+b)-x,
et comme ( ^c adfb ) = (oi)(oi)> ce^a montre que l'on a bien affaire à une action de groupe.
<2>On a alors K = F2[X]/(X2 + X + 1), mais il n'est pas nécessaire de savoir comment est construit K
pour répondre à la question.
558
ANNEXE H. PROBLÈMES CORRIGÉS
(i) Montrer que / est bien définie, est de classe fé^, et que |£N/(£)I —* 0 quand \t\ —► +00, pour
tout N G N.
(ii) Soit g : R -> C définie par g(t) = e~2lTt, si t > 0, et g(t) = 0, si t ^ 0. Calculer £; en
déduire la transformée de Fourier de h(t) = t2g(t), puis /.
(iii) Retrouver le résultat par la méthode des résidus. (On intégrera Ft(z) = etz£\a sur un
contour bien choisi.)
Exercice H. 1.5. — (i) Montrer que l'on a Jfif(x)((t>"(x)-\-a<f)(x))dx = /R(a-47r2£2)/(*)0(*)cfe,
si a G C, / G LX(R) et 0 G ^C°°(R). (On s'intéressera à la transformée de Fourier de <f>" + cm/).)
(ii) On suppose dorénavant que f(t) = jz^- Montrer qu'il existe a G C tel que l'on ait
fRf(x)((f>"(x) + a<f>(x))dx = -4tt20(O), pour tout <f> G ^C°°(R).
(iii) Montrer, en utilisant la méthode des résidus, que f(u) = J^e-W+VW.
(iv) Retrouver le (ii) à partir de cette expression.
Exercice H. 1.6. — Soit O = {z G C, Re(^) > 0}.
(i) Soit a = a + ib G Q, et soit 7r, si R > 0, le lacet constitué des segments [0,R], [R, Ç]
et [s&,0]. Que vaut JlRzne~zdz, si n G N? En déduire que f+°°tne-atdt = ^r.
(ii) Si A G R*, soit f\ : R ->■ C la fonction définie par f\(t) = 0, si i < 0, et f\(t) = te~Xt, si
t^0. Calculer /a(a?), si x 6 R.
(iii) On remarque que a; i-> xf\(x) n'est pas sommable. Pouvait-on le savoir sans calculer f\ ?
(On distinguera les cas f\ non sommable et f\ sommable.)
(iv) Établir la formule £neZ (\+2inn)'* = (e*-i)* » Pour tout A e R*
(v) Comment pourrait-on obtenir une formule analogue pour X)nez (A+2iim)2 ^
(vi) Montrer que X)neZ (z+2i7m)2 converge pour tout z £ 2iirZ et que sa somme vaut r^^s-
Exercice H. 1.7. — Si z G C, on pose chz = e'"l2e~' et shz = f-=2ê~~- ^n aura a utiliser ^a
minoration |ch(#-M2/)| ^ e * ~2e~ * ■
(i) Montrer que 2 ■-> ch7r2 est holomorphe. Quelle est sa dérivée; quels sont ses zéros?
(ii) Si « G R, on note fu la fonction z i-> ^~2muz^^- Calculer I(R) = f fu(z)dz, où tr est
le lacet formé des segments [-R, R], [R, R +1), [R + i, -R + i] et [-R -I- i, —R].
(iii) En déduire que la transformée de Fourier de t ^ gy(t) = ^=s est x ■-> J m^x/v) » s*
y > 0. (On commencera par considérer le cas y = 1.)
(iv) Si a G R, on note fia le demi-plan Re(^) > a. Montrer que la série X)nez dTmrl converge
pour tout z G Œo> et que la fonction 2 ■->• F(^) ainsi définie vérifie l'équation fonctionnelle
F(^) = zF(z), pour tout z G fio- (On commencera par traiter le cas z réel.)
Exercice H. 1.8. — Soit n entier ^ 2, et soit 0 G [0,tt] pas de la forme (2fc+1),r, avec A; G N. Si
R > 1, soient Ii(R), I2(R) et I3(R) les intégrales de j^t sur le segment [0,R], l'arc de cercle de
centre 0 allant de R à et0R, et le segment [eîôR,0]. (Faire un dessin.)
(i) Calculer Ii(R) + I2(R) + I3(R).
(ii) Quelles sont les limites, quand R —► +00, de Ii(R), l2(R) et Ï3(R).
(iii) En déduire, en choisissant judicieusement 0, la valeur de /0+o° jiffc-
H.l. EXERCICES D'EXAMEN
559
1.3. Fonctions holomorphes
Exercice H. 1.9. — (i) Montrer que tg = gg est somme de sa série de Taylor en 0 sur ]^, §[.
(ii) Quel est le rayon de convergence de la série de Taylor en 0 de ^^- ?
Exercice H.1.10. — Si z G C, on pose sinz = s—Tgf—• On a | sinz| ^ 1, si z = (k 4- \)it 4- iy,
avec k G Z, ou si z = x 4- iy, avec \y\ ^ f (dans ce cas, on a même | sin z\ ^ ^(e71"/2 - e-7r/2)).
(i) Montrer que le produit Iln^i (1_ fe) converge pour tout z G C, et que la fonction z ■-> F(z)
ainsi définie est holomorphe sur C.
(ii) Montrer que G(z) = ^^F(z) est paire, holomorphe sur C, et ne s'annule pas.
(iii) En déduire qu'il existe une suite (an)n^i d'éléments de C, telle que :
• la série J2n^i anzn converge pour tout z G C,
• la fonction z i-> g(z) ainsi définie vérifie e9^ = G(z), pour tout z e C.
(iv) Si N est un entier ^ 1, on note Cn le maximum de |G(2)| sur le carré de sommets
±(N 4- \) ± *(N 4- \) (i.e. {x 4- iy, -(N 4- \) < x,y ^ N 4- \), et on pose RN = >/2(N 4- \).
Montrer que CN ^ 7rRN(R^ 4- l)™e^"+iR"/n2. En déduire que N-fclogCN -> 0, si k > 2.
(v) En déduire que an = 0, si n ^ 2. (On écrira On sous la forme |an|etQ!n, avec an G [0,27r[,
on calculera In(r) = /q^I 4- cos(n0 4- an))Re(g(rete)) d0y et on cherchera à majorer In(^)-)
(vi) Montrer que F(z) = saz«> pour tout z e C.
Exercice H. 1.11. — On rappelle que la fonction T est môromorphc dans C, holomorphe en dehors
de pôles simples en les -n, pour n G N, est bornée dans toute bande 0 < a ^ Re(s) < 6, vérifie
l'équation fonctionnelle T(s 4-1) = sT(s), pour tout s £ -N, et que T(l) = 1.
(i) Montrer que s ■-> F(s) = sin7rs r(s)r(l — s) est holomorphe sur C, périodique de période 1.
(ii) En déduire qu'il existe /, holomorphe sur C*, telle que F(s) = /(e2Mrs), pour tout s G C.
(iii) Montrer qu'il existe des an G C, pour n G Z tels que f(z) = J2n€Zanzn> Pour tout
z G C*, et que, pour tout T G R, l'on a an = f,iT 1+iT, e~2tnsF(s)ds.
(iv) Montrer que s i-> e-7rlIm^^F(5) est bornée sur C. (On se ramènera à un ensemble de la
forme 1 ^ Re(s) ^ 2 et |Im(s)| ^ 1.)
(v) En déduire la formule des compléments T(s)r(l — s) = gjfjjj, pour tout s £ Z.
Exercice H. 1.12. — Si g est méromorphe sur C, et si N G N, on dit que g = 0(yN) s'il existe
C,M G R tels que \g(x + iy)| < C|y|N, si |y| ^ M.
(i) Montrer que si g est 0(yN), alors g1 est 0(yN_1).
(ii) Soit / une fonction môromorphc sur C, impaire, périodique de période 1, holomorphe en
dehors de pôles simples de résidu 1 cn les entiers, et 0(yN). Montrer que /2 4- /' est constante.
Exercice H. 1.13. — Soient D = D(0,1) et C = dD le cercle de centre 0 et de rayon 1. Soient Q,
un ouvert contenant D, / holomorphe sur Q, ne s'annulant pas sur C, et g holomorphe sur Q,
telle que \f(z) - g(z)\ < \f(z)\, ai z e C.
(i) Montrer qu'il existe Q' C Q ouvert contenant C et h holomorphe sur Q' tels que % = eh
sur Q!. Que vaut h' ?
(ii) Montrer que / et g ont le môme nombre de zéros (comptés avec multiplicité) dans D.
(iii) Soit G holomorphe sur Q telle que |G(^)| < 1, si z G C. Montrer que G(D) C D et que G
a un unique point fixe dans D.
560
ANNEXE H. PROBLÈMES CORRIGÉS
Exercice H. 1.14- — (0 Soit x e R*. Montrer que la série ]CneN ôï+ïp" converge si Re(s) > l}
et que la somme F(#, s) de cette série est holomorphe en s sur le demi-plan Re(s) > 1.
(ii) Établir la formule F(rc,a) = ^ /0+o° ^its~l dt, si Re(s) > 1.
(iii) Montrer que F(x, s) admet un prolongement méromorphe à C, holomorphe en dehors d'un
pôle simple de résidu 1 en s = 1.
2. Corrigés
Exercice H.l.l. (i) Comme S3 a trois classes de conjugaison, il a aussi 3 représentations irréductibles
Wi, W2 et W3, et comme (dimWi)2 + (dimW2)2 + (dimW3)2 = 6 d'après la formule de Burnside, la
seule possibilité est que deux des dimensions valent 1 et la troisième 2.
(ii) V = Xi + X2 + 20 est le caractère de la représentation régulière d'après le (i) du cor. 1.2.23 ; on a
donc V'(e) = 6, V>(s) = 0 et ip{t) = 0, d'après la formule générale pour le caractère de la représentation
régulière (alinéa 2.3 du §1.1). Ceci nous fournit la table
Xi
X2
Xi + X2 + 20
9
e
1
1
6
2
5
1
-1
0
0
t\
1
1
0
-1
(iii) Comme V est une représentation de permutation, x(g) est le nombre de points fixes de g (alinéa 2.3
du § 1.1), c'est-à-dire le nombre d'éléments h de S3 tels que ghg~l = h, ou encore le nombre d'éléments
de S3 commutant avec g. On a donc x(9) = lzsl = |Ss| • |Cff|_1. On en déduit que x(e) = 6, x(«) = 2 et
X(t) = 3.
Si W est une représentation irréductible, alors la multiplicité de W dans V est (xw»x) d'après le
cor. 1.2.18. Comme
(Xi5X> = è(6 + 3'(1'2) + 2.(1.3)) = 35
(X25X> = è(6 + 3'(-1-2) + 2'(1'3)) = l
(tf>X> = è(2-6 + 3-(0-2) + 2.(-1.3)) = l>
on a V = 3 • 1 ® e ® W.
Exercice H. 1.2. (i) (a) Comme V est une représentation de permutation, Xv(^) est le nombre de points
fixes de a agissant sur {1,2,3,4} (alinéa 2.3 du §1.1). On a donc xv(Ci) = 4, xv(C2) = 2, xv(C2,2) = 0,
Xv(C3) = letxv(C4) = 0.
Le produit scalaire (xv,Xv> est égal à ^(42 + 6-22 + 3-02 + 8-l2+6-02) = 2. Si V = ®weirr(s4)™wW,
ce produit scalaire est aussi égal à Z/weirr(s4) mw puisque les xw forment une famille orthonormale
(th. 1.2.14), et comme la seule écriture de 2 comme somme de deux carrés est l2 + l2, on en déduit que
mw = 1 pour exactement deux W G Irr(S4), et mw = 0 pour les autres, ce qui permet de conclure.
(b) La droite Vi engendrée par e\ H h e± et l'hyperplan V2 d'équation x\ H h #4 sont stables
par S4. Comme Vi est de dimension 1, elle est automatiquement irréductible.
Soit x = (#i,#2,a;3,a;4) G ^2 non nu*' ^ &'&&*> de prouver que le sous-espace vectoriel Ux de V2
engendré par les a-x, pour a G S4, est égal à V2. Il existe i ^ j tels que xi ^ Xy Soit r la transposition (y).
Alors x-t-x est un multiple non nul de e* -e,. On en déduit l'appartenance de e* -e^ à Ux, et donc aussi
H.l. EXERCICES D'EXAMEN
561
celle de a • (e* - ej) = ea^) - ea(j), pour tout a G S4. Comme (cr(i),cr(j)) décrit les couples d'éléments
distincts de {1,2,3,4} quand a décrit S4, cela montre que Ux contient ei - e2, e\ - e3 et ei - e^ et
comme ces vecteurs engendrent V2, cela permet de conclure.
(c) La représentation Vi est la représentation triviale, et donc XVi(C) = 1 pour tout C G Conj(S4).
Comme xvi + Xv2 = Xv> cela permet de déterminer le caractère de xv2 et de remplir les première et
quatrième colonnes de la table.
(ii) (a) La seconde représentation de dimension 1 est la signature e ; ses valeurs sont bien celles reportées
dans la seconde colonne. La seconde représentation de dimension 3 est Vi<g>e. Si elle pouvait se décomposer
sous la forme Vi <g> e = Wi © W2, alors Vi = (Vi <g> e) <g> e pourrait se décomposer sous la forme
(Wi <8>e) © (W2 <8>e), ce qui est absurde. On a XVi®e(g) = XViCtfMtf) (alinéa 2.1 du § 1.1), et donc
XVi<g>e(C2) = -1 est différent de XVi(C2) = 1, ce qui prouve que les représentations Vi <g>e et Vi ne sont
pas isomorphes puisque leurs caractères sont distincts.
(b) Comme S4 a 5 classes de conjugaison, il a 5 représentations irréductibles (cor. 1.2.16). Si on note
d la dimension de la représentation manquante et 6 son caractère, la formule de Burnside montre que
24 = l2 + l2 + 32 + 32 + d2, et donc que d = 2. Pour remplir la dernière colonne, on utilise le fait que
1 + e + 20 + 3xi + 3x2 est le caractère de la représentation régulière ((i) du cor. 1.2.23) qui est connu
(alinéa 2.3 du § 1.1).
Exercice H. 1.3. (i) On a (g *)(g * )(g *)_1 = (cad+(i-c)6) On en déduit qu'un conjugué de (g?) est
de la forme (g f ), et que tout élément de cette forme est un conjugué de (g f ), si c ^ 1. Les Da, pour
a G K* - {1} forment donc des classes de conjugaison. Par ailleurs Ci est la classe de conjugaison de
l'élément neutre, et N est la classe de conjugaison de (£ }), car (g ?)(£ })(§ ?)" = (oî)> si a ^ 0.
(iii) Onaj- (Exgk ^ex) = J2xeK ^xeg.x = Exgk \-i.xex. Or x *-+ g~l • x est une bijection de K,
et donc £xGK A^-i.x = £xGK Ax> ce qui prouve que g • v = £xGK A^-i.xex G W, si v = J2xeK x*e* e w-
(iv) V est une représentation de permutation, et donc Xv(#) est le nombre de points fixes de g agissant
sur K. On est donc amené à calculer le nombre de solutions de l'équation ax + b = x dans K, ce qui nous
donne xv(Ci) = ?, xv(N) = 0 et Xv(Da) = 1, si a G K* - {1}.
Maintenant V est la somme directe de W et de la droite engendrée par J2xeK es> sur laquelle G agit
trivialement. On en déduit que Xv(#) = Xw(#) + 1, ce qui nous donne Xw(Ci) = q — 1, Xw(N) = -1 et
Xw(Da)=0,siaGK*-{l}.
Alors (Xw,Xw> = ^((q - l)2 + |N| ■ l2 + EaeK*-{i} Pal ■ 02) = ^((flf - l)2 + (g - 1)) = 1, ce
qui permet d'en déduire l'irréductibilité de W, en utilisant le cor. 1.2.21.
(v) Comme |Irr(G)| = |Conj(G)|, d'après le cor. 1.2.16, et comme |Conj(G)| = q, il y a q - 1 autres
représentations irréductibles. Notons di,... ,dç-i leurs dimensions. La formule de Burnside nous donne
alors q(q - 1) = |G| = (dim W)2 + Y3Z} <*2, et comme dim W = q - 1, on obtient E?Ji d} = Q(Q - 1) -
(q-l)2 = q—1. Une somme de q - 1 entiers ^ 1 ne pouvant être égale à q - 1 que si tous les entiers sont
égaux à 1, on voit que les q - 1 autres représentations de G sont de dimension 1 (i.e. sont des caractères
linéaires).
(vi) Si x est un caractère linéaire de K*, alors x ° det est un caractère linéaire de G. Le groupe F£
est cyclique d'ordre 4, engendré par 2 (on a 22 = 4, 23 = 8 = 3 et 24 = 16 = 1). Un caractère de F£ est
donc déterminé par sa valeur en 2, qui doit être une racine 4-ième de l'unité (i.e. 1, i, -1 ou -i). Il y
a donc 4 tels caractères et si on note 7/ celui pour lequel 7/(2) = i, les autres sont 7/2, 7/3 et rf qui n'est
autre que le caractère trivial. Les 4 caractères de G que l'on cherche sont donc exactement les rf o det,
pour 0 ^ i ^ 3, ce qui nous fournit bien la table annoncée.
(vii) Le groupe K* est de cardinal 3, et donc est cyclique, engendré par n'importe quel a ^ 1. (K* est
toujours cyclique, si K est un corps fini; dans le cas présent, si a G K* - {1}, le sous-groupe engendré
562
ANNEXE H. PROBLÈMES CORRIGÉS
par a a un cardinal qui divise |K*| = 3, et donc est égal à 3, ce qui fait que ce sous-groupe est K*). Un
caractère linéaire de K* est donc déterminé par sa valeur en a, qui est une racine cubique de l'unité. Il y
a 3 tels caractères, et si on note rj celui pour lequel 7](a) = j = e2i7r/3, les autres sont 7/2 et t/3 = 1. Ceci
nous fournit la table suivante.
C1
N
D0
Dû2
1
1
1
1
1
V
1
1
3
f
v2
1
1
f
3
Xw
3
-1
0
0
FlG. 3. Table des caractères de G, si K = F4
On reconnaît la table des caractères de A4, ce qui n'est pas très étonnant car G est isomorphe à A4.
En effet, le choix d'une bijection entre K et {1,2,3,4} transforme l'action de G sur K en une action de
G sur {1,2,3,4}, et donc fournit une injection de G dans S4. L'image H de cette injection est donc un
sous-groupe de S4, isomorphe à G. Un tel groupe est distingué dans S4 : si g £ H, on a gH = Hg = S4 - H
pour des raisons de cardinal (on remarquera que |H| = |G| = 12 = IA4I et |S^| = 24 = 2|H|), et donc
0H0"1 = ïlgg~~l = H. Le quotient G/H est de cardinal 2, et donc isomorphe à {±1}, ce qui nous fournit
un caractère linéaire 77 : S4 —> {±1}. La restriction de 7/ à A4 est encore un caractère linéaire, mais les
caractères de A4 sont à valeurs dans ^3, ce qui implique 7/ = 1 sur A4 ; autrement dit, A4 est inclus dans
le noyau H de 7/, et donc lui est égal pour des raisons de cardinal. On a donc bien G = A4. (On aurait
aussi pu remarquer que l'image d'un élément de Da ou Da2 est un 3-cycle, et donc appartient à A4, et
que G est engendré par Da U Da2, car Da U Da2 est de cardinal 8 > ^ et ne peut donc pas être inclus
dans un sous-groupe strict de G ; on peut aussi démontrer directement, en utilisant le fait que K est de
caractéristique 2, que l'image d'un élément de N est un produit de deux transpositions et donc appartient
à A4.)
Exercice H.1.4. (i) La fonction / est sommable ainsi que t h-> tf(t). Il en résulte ((ii) du th. IV.2.8)
que / est bien définie et est de classe if1. De plus, / est de classe ^°°, et /(N)(*) = ("3^(7^1nN""2) est
sommable; il en résulte ((i) du th. IV.2.8) que \tNf(t)\ -> 0 quand \t\ -* +00, pour tout N G N.
(ii) g(x) = /0+~e-™<1+to><ft = [^OtS'o"00 = spW Comme *V0 «t sommable, sa
transformée de Fourier est ,__2in)*9^(x) = (2^FF (s-O* ((") °*u t*1' ^-^.8) ; en particulier elle est sommable, et
on peut appliquer la formule d'inversion de Fourier dans L1, ce qui nous donne <^((2^)3 (g_^)3) = t2g(t).
Comme &{txli)&)(t) = fne2intx(x-w dx = (-l)3/(i), grâce au changement de variable x = -y, on
obtient finalement f(t) = ("22i7r)3 t2g(t).
(iii) La fonction Ft(z) est méromorphe sur C, holomorphe en dehors d'un pôle d'ordre 3 en z = -i, et
comme
e-2i*tz = e-2*te-2i*t(z+i) = e-2^(1 _ 2in t(z + •) + L2i7Tt(z + i))2 + -..).
on a Ft(*) = e~™( ^ - fêfe + ^ + •••), et donc Res(Ft, -i) = ®ft*e-™.
H.l. EXERCICES D'EXAMEN
563
Supposons t ^ 0. Si R > 1, soit 7r le lacet formé du segment [-R, R] et du demi-cercle CR paramétré
par t »-► Re~i7r', pour t G [0,1]. Soient
I1(R)=/ Ft(z)dz et I2(R)= / Ft(z)dz.
V[-R,R] JCn
On a I(7r, -i) = -1, et donc
Ii(R) + I2(R) = / Ft(z)dz = 2i7rI(7R, -t)Res(Ftl -i) = ^^t2e~2ir\ quel que soit R > 1.
An 2
Or Ii(R) -> /(i) quand R -> +oo. Par ailleurs, |e"2i7r^| < 1, si Im(z) < 0, et \z + i\ ^ \z\ - 1 = R - 1,
si z G CR ; d'où la majoration |Ft(s)| < jj^, si z G C£. Donc |I2(R)| < (ï^^Cr) = (j^a -> 0
quand R —> +oo. En passant à la limite, cela nous donne f(t) = ^^-t2e~2irt.
Si t < 0, on remplace le demi-cercle CR par le demi-cercle CR dans le demi-plan supérieur. On a alors
I(7r> —0 = 0) et la même méthode que ci-dessus montre que f(t) = 0.
Exercice H. 1.5. (i) Si 0 est fé700 à support compact, il en est de même de ses dérivées, et il résulte du
(i) du th. IV.2.5 que la transformée de Fourier de 0<n> est t h-> (2i7rt)n<f>(t) ; la transformée de Fourier de
(j)" + a<f> est donc t*-+ (a- 47r2£2)0(£), et la formule que l'on cherche est un cas particulier de la formule
fKf(x)g(x)dx = fRf(t)g(t)dt de la prop. IV.3.24, valable pour toutes f,g G L^R).
(ii) Dans le cas f(t) = j^ et a = -8m2, on obtient fKf(x)(<l)"(x) + a<f>{x)) = -4?r2 fK<f>(t)dt,
d'après le (i). Or /R <f>(t) dt est la valeur en 0 de la transformée de Fourier inverse de 0, c'est-à-dire 0(0),
d'après la formule d'inversion dans c5^(R) (th. IV.3.14).
(iii) Pour calculer la tranformée de Fourier u h-> f(u) de /, on introduit la fonction gu définie par
9u(z) = e~2inuz^2+2ï> Qu* est méromorphe sur C, holomorphe en dehors de pôles simples en 1 - i et i -1,
et on a Res(<jw, 1 - i) ^-«"(^O^ = ^e-2™(1+*> et Res(gu,i- 1) = ^e2™(1+<>.
Si u ^ 0, on intègre gu(z)dz sur le lacet constitué du segment [-R,R] et du demi-cercle inférieur de
centre 0 et de rayon R. Si R > >/2, on a I(7r, 1 - i) = -1 et I(7R,i - 1) = 0, et la formule des résidus
nous donne
/ 9u(z)dz = -2i7T Res^ 1 - t) = -^e'2^1^.
Maintenant, quand R —> +oo, l'intégrale sur [-R,R] tend vers /(u), tandis que sur le demi-cercle, on
a les majorations |e~2i7rw*| < 1 et |^^2J < ûtzï• Comme la longueur du demi-cercle est 7rR, l'intégrale
sur le demi-cercle est majorée, en module, par ^f^, et donc tend vers 0 quand R —> +oo. Un passage à
la limite nous donne donc f(u) = y^e-2™*1*^.
Si u < 0, on intègre sur le chemin 7^ constitué du segment [—R, R] et du demi-cercle supérieur de
centre 0 et de rayon R. Si R > >/2, on a I(7R, 1 - i) = 0 et I(7r, i - 1) = 1, et les mêmes arguments que
ci-dessus nous donnent f(u) = y^e27rw(1+i\ (On aurait aussi pu utiliser la parité de / pour en déduire
celle de /.)
(iv) Des intégrations par partie nous donnent*3*
/»+oo /»+oo
/ e-2*<1+i>V'M du = [^(uJe-^^+^lf00 + 2tt(1 + i) / e-27r<1+i> V(") du
Jo Jo
/»+oo
= - 0'(O) - 2tt(1 + i)<t>(0) + (2tt(1 + i))2 / e~2ir(<l^u(t>(u)du.
Jo
^Ce calcul peut se réinterpréter en disant que / est, au sens des distributions, solution de l'équation
différentielle u" - 8ztt2u = -47r2<50, où 6q est la masse de Dirac en 0.
564
ANNEXE H. PROBLÈMES CORRIGÉS
De même, jl00eiw{1+i)u^'('u)du = <f>'(0) - 2tt(1 + i)0(O) + (2tt(1 + i))2 /^ e2ir<1+i>w0(u)du, et donc
/R/(w)(0"(w) - 8in2<i)(u))du = ^(-4^(1 + i)0(O)) = -4tt20(O), ce que l'on voulait.
Exercice H.1.6. (i) La fonction e~z est holomorphe sur C qui est contractile. Son intégrale sur tout lacet
est donc nulle ((i) de la rem. VI.1.4 ou formule des résidus). On en déduit que
/ tne-ldt+ (R + it)ne-R-uidt+ (at)ne~atadt = 0.
Jo Jo Jr
Quand R -^ +oo, on a /0R Pe-'dt -^ /0+°° tne-*dt = n! et
/>— r— kv> ix>
| / " (R + itre-K-tHdtl^e-11 / \(R + it)\ndt^e-R—(R2 + (—)2)n'2-^ 0.
Jo Jo a a
Comme £(at)ne-atadt -> -an+1 f+°° tne-at dt, on obtient an+1 /0+o° tne-at dt = n! en passant à la
limite, ce qui permet de conclure.
(ii) f\(x) = JKe-2i^fx(t) dt = /0+o° te-(x+2i™»dt = (A+^g)a d'après le (i), car A + 2mx G il.
(iii) Si f\ n'est pas sommable, sa restriction à R - [-1,1] n'est pas sommable puisque f\ est continue
d'après le théorème de Riemann-Lebesgue, et donc sommable sur [-1,1]. Comme \xf\(x)\ ^ |/a(^)| sur
R - [-1,1], cela implique que xf\(x) n'est pas sommable sur cet ouvert ni, a fortiori, sur R.
Si f\ est sommable et si xf\(x) est sommable, alors d'après le (ii) du th. IV.2.8, &f\ est de classe tf1
et <^(xf\(x))(t) = ^(^f\Y(t). Maintenant, la formule d'inversion de Fourier dans L1, appliquée à /A,
montre que (<^fx)(t) = fx(-t). On aboutit à une contradiction puisque f\ n'est pas dérivable en 0 ; c'est
donc que xf\(x) n'est pas sommable.
(iv) La fonction f\ et sa dérivée sont des 0(|#|~~2) en l'infini. On peut donc lui appliquer la formule
de Poisson. Par ailleurs, f\ étant sommable, la formule d'inversion de Fourier dans L1 appliquée à f\
montre que (<Pf\)(t) = f\(-t). La formule de Poisson devient donc
1 +oo
£ (XT^F " £ A(n) = £ A<-> - E--A
neZ v ' neZ neZ n=0
,+22 __nAy 1 , e~x ex
^06 H ' = ~'l-e-^ = (1 - e-*)2 = (eA-l)2'
(L'interversion de la dérivée et de la série est justifiée par le fait que l'on a affaire à des séries entières
(en e-A).)
(v) On remarque que (-l)n = einn. On peut donc évaluer la série en utilisant la formule de Poisson
pour eiirxf\(x) dont la transformée de Fourier est t h-> f\(^ — t).
(vi) Si K est un compact de C-2i7rZ, il existe R > 0 tel que \z\ < R, pour tout z G K. Si \n\ > ^, on a
alors l(z+2M2l ^ (27r|ni-R)*> et comme ^M>& (27r|n|-R)^ < +0°>la série est normalement convergente
(et donc en particulier convergente en tout point) sur K. On note f(z) la somme de la série. Comme
chaque tz+2iim)* est holomorphe sur C-2z7rZ, il résulte du th. V.5.1 que / est holomorphe sur C-2i7rZ.
Or elle coïncide avec la fonction holomorphe z h-> ,,e^a sur R+. Comme C - 2inZ est connexe, il résulte
du théorème des zéros isolés que f(z) - fe*eli\* = 0 pour tout z G C - 2z7rZ.
Exercice H. 1.7. (i) z y-+ chirz est holomorphe car z h-> eXz l'est et qu'une combinaison linéaire de
fonctions holomorphes est holomorphe. Sa dérivée est 7rsh7rz.
On a ch7rz = 0 si et seulement si enz = -e"7rz, ce qui équivaut à e2irz = -1, et donc à z = \ + ki,
avec k G Z.
H.l. EXERCICES D'EXAMEN
565
(ii) La fonction fu est méromorphe sur C, avec des pôles simple en les | + ki, pour k e Z. Maintenant,
on a I(7r, | + ki) = 0 sauf si k = 0, où I(7r, |) = 1. On en déduit, grâce à la formule des résidus, que
I(R) = 2mRes(/u, j) = 2m(e-2i™5—î-^) = 2e™.
£ 7rsh7r^
(iii) Quand R -> +00, Jj_RjR] fu(z)dz -> gi(u). Comme fu(z + i) = -e2nufu(z), on en déduit que
/[R+if-R+i]/u(«)^ = e27rw/[-R,R]A(^)^ tend vers e2™£i(u), quand R -> +00. Enfin, sur [R,R + «]
et [-R +t,-R], on a \e-2i™z\ < e2™ et |^| ^ e,ii_2e-^ ; on en déduit que I^R+i] fu(z) dz et
Jj_R+i _r] /uO*) àz sont majorés, en module, par enRe_l-nR > et donc tendent vers 0, quand R —> +00. On
adoncI(R) -> (l+e2iru)gi(u), et comme I(R) = 2e™, pour tout R > 0, on obtient gi(u) = yU^r = g^j.
Le cas y > 0 s'en déduit via la formule pour les dilatations Ç^(f(ty))(x) = ^/(|))-
(iv) Si a > 0 et si z G Qa> on a |ch^wJ ^ eir|n|qJ*e-ir|n|q ' ^ en résu^te Q116 *a sér*e converge normalement
sur Qa, et donc que sa somme F(z) est une fonction holomorphe sur Qa. Elle est donc aussi holomorphe
sur Qo = Ua>o£îa.
Maintenant, si y > 0, alors t h-> ch* est sommable sur R, et sa dérivée t h-> "c*a^J[yt aussi.
On peut donc lui appliquer la formule de Poisson, ce qui nous donne, en utilisant le (iii), l'identité
Dnez ddfeïï = i Dnez arif » Q^e l'on peut retraduire sous la forme F(y) = JF( J).
Enfin, la fonction z h-> zF(z) - F(±), qui est holomorphe sur Q05 est nulle sur R+ ; elle est donc
identiquement nulle sur l'ouvert connexe Q05 d'après le th. des zéros isolés.
Exercice H. 1.8. (i) Comme le chemin 7r formé du segment [0, R], de l'arc de cercle de centre 0 allant de
R à e^R, et du segment [e^R, 0] est un lacet, on a
Ii(R) + l2(R)+l3(R) = 2tir( £ I(7R,a)Res(-^,a)),
a» + l=0 "*"
d'après la formule des résidus. Les solutions de an + 1 = 0 sont les e"1^2**1)/71, pour k = {0,1,..., n - 1}
et le pôle de j^ en chacun d'eux est simple; son résidu est donc waiLi = ^p- Par ailleurs, l'indice
I(7R,ei7r(2*+1>/n) est égal à 1, si 0 < <2*+1)^ < 0, et vaut 0 sinon. On a donc
Ii(R) + I2(R) + I3(R) = — £ c^2**1)/».
(ii) Les fonctions j^ et 1+tieu^ étant sommables sur R+, on a Ii(R) —> /o+°° î+f77 et
I3(R) - -eie /0+o° y^^r^. Maintenant, I2(R) = jj ïflg^r, et on peut majorer lyqf^l par ^
On a donc |I2(R)| < r^ty> et comme n ^ 2, cela montre que I2(R) —> 0.
(iii) Prenons 6 = ^. En passant à la limite dans la formule du (i), on obtient
r+°° dt -2in
(1 _ g»*/») /
Jo
in/n
l+tn Tl
et donc
f+°° d* 2i7rein'n ir/n
f
Jo
1 + *n n(e2i*/n - 1) sin(7r/n) '
Exercice H.1.9. (i) La fonction z h-> tgz est holomorphe en dehors des zéros de cosz. Comme le disque
D(0, (f )") ne contient aucun de ces zéros, tgz est somme de sa série de Taylor en 0 sur tout le disque
((i) de la rem. V.4.9), et donc a fortiori sur ]^, f [.
566
ANNEXE H. PROBLÈMES CORRIGÉS
(ii) La fonction z h-> ^^y est holomorphe sur C sauf peut-être en z = 1 où elle peut avoir un pôle
d'ordre 1. Or, en z = 1, la fonction sin7rz s'annule; il n'y a donc pas de pôle et ^f- est holomorphe
sur C tout entier. Le rayon de convergence de sa série de Taylor en 0 est donc +oo.
Exercice H.1.10. (i) Sur D(0,R~), on a |^| < |§r|, et comme £n>1 W < +0°> le Pr°duit converge
absolument sur D(0, R~). Chacun de ses termes étant holomorphe, il en est de même du produit, d'après le
th. V.5.4. On en déduit que la fonction z »-+ F(z), ainsi construite, est holomorphe sur C = Ur>oD(0, R").
(ii) rinnz est méromorphe sur C, holomorphe en dehors de pôles simples aux entiers, et ne s'annule
pas. Par ailleurs, il résulte du (ii) du th. V.5.4 que les zéros de F sont des zéros simples aux entiers non
nuls. Il en résulte que les zéros de z h-> ttzF(z) sont les entiers et que ce sont des zéros simples, ce qui fait
qu'ils compensent exactement les pôles de ■^^, et que G(z) est holomorphe sur C et ne s'annule pas.
Enfin, G est paire car F l'est et que z h-> sin7rz et z h-> ttz sont impaires.
(iii) Comme C est contractile et comme G est holomorphe sur C et ne s'annule pas, il existe, d'après
la prop. VI.2.3, une fonction /i, holomorphe sur C, telle que eh = G.
Maintenant, h est somme de sa série de Taylor £]nGN Q>nzn en 0 sur C tout entier, d'après le (i) de
la rem. V.4.9. Enfin, on a G(0) = 1 car F(0) = 1 et lim^0 ^^f1 = 1, et donc h(0) = a0 G 2iirZ. Il en
résulte que l'on a aussi G = e9, si g(z) = h(z) - ao = J2n^i anZn- Ceci permet de conclure.
(iv) D'après le principe du maximum, Cn est le maximum de |G(z)| sur le bord du carré.
De plus, comme G est paire, on peut se contenter d'étudier |G(z)| sur les segments
[(N + |)(1 - i), (N + 1(1 + i)} et [(N + i)(l + i), (N + ±)(i - 1)].
Sur ces segments, on a |^n^| < 1, d'après les minorations fournies dans l'énoncé. On obtient la
majoration voulue pour Cn en majorant \ttz\ par 7tRn, chaque 11 - ^ |, pour n < N, par 1 + \z\2 < R^ +1,
et par 1 + *j£ ^ e^'n\ si n > N + 1.
Comme En^N+i £ < E^n+i (ïï=ï - i) = h on obtient 1oSCn < N1°g(RN + 1) + # + log7rRN,
et comme Rn = O(N), on a logCw = O(NlogN), ce qui permet de conclure.
(v) On a Re(g(reie)) = Re(En>1 |an|rV(n'+«»>) = £n>1 K|rncos(n0 + a„). On en déduit que
!n(r) = En^i lankn/o'C1 + cos(fc0 + ak))cos(n0 + an)dQ = n\ak\rk. (On peut intervertir série et
intégrale en utilisant la convergence normale de la série sur [0,2n].)
Par ailleurs, Re(^(re^)) = log|G(re^)| < logCN, où N = [r] + 1. On en déduit la majoration
In(r) = /027r(l + cos(fc0 + ak))Re(g(rei0))d6 < 21ogCN, car 0 < 1 + cos(h6 + ak) < 2.
On en déduit, pour tout r > 0, la majoration \ak\ < glog^lr|+1 = f ^g-Si'y ^K1^ » qui tend vers 0,
si k ^ 2, d'après le (iv). Ceci permet de conclure.
(vi) Il résulte des (iv) et (v) que G (z) = eaiZ, et comme G est paire, on a ai = 0 et G = 1, et donc
F(*0 = ^^7^5 ce que l'on cherchait à démontrer.
Exercice H. 1.11. (i) La fonction s h-> T(s)r(l - 5) est holomorphe en dehors de pôles simples en les
entiers, et comme s h-> sin7rs a des zéros en les entiers, cela implique que F est holomorphe sur C.
Maintenant, on a F(s + 1) = (sin?r(s + 1)) T(s + l)r(-a) = (-sin7rs)(sr(s))(^^) = F(s).
(ii) Comme ^^ est bien défini à addition près d'un entier, et comme F est périodique de période 1,
la quantité F(^§^) ne dépend pas du choix de logz; notons la f(z). Si z0 G C*, on peut choisir une
détermination h du logarithme qui est holomorphe sur D(z0,|2o|~) [par exemple celle obtenue en
retirant la demi-droite R+(-z0)], et on a alors / = F o h sur D(z0, \zo\~), ce qui prouve que / est
holomorphe sur D(zo> l^oD- Ceci étant vrai pour tout zq G C*, il en résulte que / est holomorphe sur
U,oGC*D(2:o5ko|-) = C*.
(iii) L'existence des an résulte du cor. VI.3.2 appliqué à z0 = 0, Ri = 0 et R2 = +00. Par ailleurs,
d'après ce corollaire, on a an = ^ /C/0r) z~n~1f(z)dz, pour tout r > 0. Maintenant, soit </? : C -> C*
H.l. EXERCICES D'EXAMEN
567
défini par <p(a) = e2iirs. D'après l'ex. V.4.5, on a /[<Tfl+iTj(»o^)y/(«) ds = J^([iT,1+iT)) g(z)dz, pour toute
g : C* -* C continue. Comme </?([iT, 1+iT]) = C(0,r), avec r = e~~27rT, on obtient pour g(z) = z~n~lf(z),
l'identité an = ^ /[<Tfi+iTj e-(n+1)2i7rsF(5)(2i7re2i7rs)d5 = JjiT,1+iT, e"2i7rnsF(5) ds, ce que l'on voulait.
(iv) Comme F et Im(s) sont périodiques de période 1, il suffit de prouver que G est bornée dans une
bande verticale de largeur 1, par exemple B = {s, 1 < Re(s) < 2}, et comme G est continue, elle est
bornée sur le compact K = {s G B, |Im(s)| < 1}, et il suffit de prouver que G est bornée sur B - K. Or
r(s) est bornée sur B, et comme T(l - s) = (1^72s2s), et que 3 - s G B si s G B, il s'ensuit que T(l - s)
est aussi borné sur B - K. Enfin, | sin7rs| < ±(é*llmW + e'^lm^) < e*'1"11^». On en déduit le résultat.
(v) D'après le (iv), il existe C > 0 tel que |e"2i7rnsF(5)| < Ce27rnT+7r|T|, si s G [tT, 1+iT]. On en déduit
la majoration \an\ < Ce27rnT+7r'Tl, pour tout T G R. En faisant tendre T vers -oo (resp. +oo) si n ^ 1
(resp. n < -1), on en déduit que an = 0, si n ^ 0. Il en résulte que / est constante; il en est donc de
même de F, et comme on a F(0) = lims_>0 ^f^r(s + l)r(l - s) = 7r, cela permet de conclure.
Exercice H.1.12. (i) D'après l'inégalité de Cauchy ((i) de la rem. V.4.9), on a|07(zo)| ^ ? suPzec(z0yr) \9(z)l
si z0 = x0 + iy0. Si \y0\ ^ M7 = 2M, et si r = Jçl, on a M < |Im(*)| < ^Igal, pour tout z G C(z0,r), et
donc \g(z)\ < C(%^)N. On en déduit que \g'(z0)\ < C'\y0\N-\ avec C7 = 3N21~N, si |y0| > M7.
(ii) Soit g = f2 + /7. Comme / est holomorphe sur D(0,1") - {0}, impaire, et a un pôle simple de
résidu 1 en 0, on a f(z) = \ + J^*f£ &2k+iz2k+l sur D(0,1") (fonction holomorphe sur un disque épointé,
n° 2 du § VI.3). On en déduit que f(z) = ^ + EÏϰo(2fc + l)o2*+i*2*, que f(z)2 = 4, + 2ai + • • •, et
que g(z) est holomorphe en 0. Comme elle est périodique de période 1, elle est holomorphe en tous les
entiers, et comme / est holomorphe sur C - Z, elle est holomorphe sur C tout entier.
De plus, il résulte du (i) que g est un 0(y2N) et que g^k) est un 0(y2N~k) pour tout fc. On en déduit
que #(2N) est bornée sur {z, 0 < Re(z) < 1, |Im(z)| ^ Mn}, si Mn est assez grand. Comme g(2N^ est
continue (car holomorphe) sur {z, 0 < Re(z) < 1}, et comme {z, 0 < Re(z) < 1, |Im(z)| ^ Mn} est
compact, on en déduit l'existence de Cn tel que |<^2N*(2)| < Cn, si 0 < Re(z) < 1. La périodicité de g(2N^
implique alors que |<^2N*(2)| ^ Cn, pour tout z G C, et le théorème de Liouville permet d'en conclure
que #(2N) est constante. On en déduit que g est un polynôme de degré < 2N, et comme g est périodique,
cela implique que g est une constante, ce que l'on cherchait à démontrer.
On aurait pu aussi constater que h(z) = f(z) - ncotgitz est holomorphe sur C, impaire, périodique
de période 1, et 0(yN). Les même arguments que ci-dessus permettent alors de montrer que h = 0, et
donc que f2 + f = -n2.
Exercice H.1.13. (i) Soit Q7 = {z G O, \f(z) - g(z)\ < \f(z)\}. Alors Q7 est un ouvert comme image
réciproque de l'ouvert {(#,y), x < y} de R2 par l'application continue z h-> (\f(z) - g(z)\, \f(z)\), et Q7
contient C par hypothèse. Maintenant, si z G Q7, on a |jt4 - 1| < 1, ce qui permet de définir h comme
la composée de 4 : O7 —> D(l,l~) et log : D(l,l~) —> C, où log est la détermination principale du
logarithme. On a alors h' = ^ = &ff = £ - £•
(ii) La fonction 4 - &- admet -h comme primitive sur Q7 et donc a une intégrale nulle sur tout lacet
contenu dans Q7. En particulier, fc (4v^ - tt)) dz = Q (où C est parcouru dans le sens direct). On en
déduit, en utilisant la prop. VI.3.14 (car / ne s'annule pas sur C par hypothèse, et g non plus puisque
\f(z)-~9(z)\ < 1/0*01> si z G C) que f et g ont le même nombre de zéros dans D, comptés avec multiplicité.
(iii) D étant compact et G continue sur D, il existe ^^D tel que |G| atteigne son maximum en z0,
et le principe du maximum montre que z0 G C. Comme |G(z0)| < 1, par hypothèse, on a |G(z)| < 1, si
z G D, et donc G(D) c D. En appliquant le (ii) à f(z) = z et g(z) = z - G(z), on en déduit que f et g
ont le même nombre de zéros dans D, et comme / a un unique zéro en 0, cela implique que g a un unique
zéro et donc que G a un unique point fixe dans D.
568
ANNEXE H. PROBLÈMES CORRIGÉS
Exercice H. 1.14. (i) Si o > 1 et Re(s) > a, alors | ^xy | < (n+x)a sauf Pour l'ensemble fini de n tels que
\n + x\ < 1. Comme £Îïï (n+s)" < +00'la serie 5ZneN (ïï+ï)7 convei'ge normalement sur Re(s) > o. Il
résulte du (ii) du th. V.5.1 que la somme F(#,s) de cette série est holomorphe sur Re(s) > o. Ceci étant
vrai pour tout a > 1, la fonction F(rc,s) est holomorphe sur Re(s) > 1.
(») 0n a (ÏÏTÏF = rfe /o+°° e"(B+x)'**~1<ft, si Re(«) > 0. Les sommes partielles de £+~ e-<B+*>'*«-i
sont majorées en valeur absolue par- Y£™o e-^n+xHRc^-1 = -f!^r£Ro(s>-2, sommable si Re(s) - 2 > -l
car à décroissance rapide en +oo et équivalente à £Rc(*)-2 en 0. On peut donc, si Re(s) > 1, utiliser le
théorème de convergence dominée pour échanger somme et intégrale, ce qui nous donne
+oo 1 «+00 -, /.+oo +oo 1 .+OQ tx
(iii) Posons gx(t) = [e_e-i • Alors gx est tf00 sur R+ comme restriction d'une fonction holomorphe
en dehors de 2mZ — {0}, et à décroissance rapide à l'infini ainsi que toutes ses dérivées. On est donc
dans les conditions d'application de la prop. VII.2.6, et M(gx,s) = ffe Jo+°° [te-ita~ldt admet un
prolongement holomorphe à C vérifiant M (#3,0) = gx(0) = 1. Or on a F (s) = (s - l)r(s - 1), et donc
F(^>s) = 7rfM(0x»s - !)• Le résultat s'en déduit.
H.2. TABLE DES CARACTÈRES DE A5
569
H.2. Table des caractères de A5
Le but de ce problème est rétablissement de la table des caraetères (fig. 4) du groupe A5
d'ordre 60, appelé aussi groupe de Vicosaèdre.
1
20
15
12
12
Ci
c3
^2,2
c5
<*
1
1
1
1
1
1
Xu
4
1
0
-1
-1
Xv
5
-1
1
0
0
Xw
3
0
-1
1+^
2
1—y/5
2
Xw
3
0
-1
1-^
2
2 1
FlG. 4. Table des caractères de A5
On utilisera sans démonstration les faits suivants :
• Si i,j,k (resp. if,j',kf) sont des éléments distincts de {1,...,5}, il existe g G A5 tel que
g(i) = i\ g(j) = f et g(k) = k' (en fait g est unique).
• Le groupe A5 a 5 classes^4) de conjugaison :
— La classe Ci de l'élément neutre 1, de cardinal 1.
— La classe C3 des 3-cyclcs (d'orde 3), de cardinal 20.
— La classe C2,2 des produits de deux transpositions de supports disjoints (d'ordre 2), de
cardinal 15.
(4>Les classes de conjugaison de A5 peuvent se déduire de celles de S5. On rappelle que si G est un groupe,
si x G G, et si Zx est le centralisateur de x (i.e. l'ensemble des éléments de G commutant à x), la classe
de conjugaison de x est isomorphe à G/Zx par g h-> gxg~l ; en particulier elle est de cardinal |G|/|ZX|.
Pour comprendre ce que devient une classe de conjugaison de S5 dans A5, il s'agit donc de comprendre
le lien du centralisateur Zx de x dans S5 avec son centralisateur Zx n A5 dans A5.
Or A5 est le noyau de la signature e : S5 »-+ {±1}. On en déduit que si H est un sous-groupe de S5, alors
soit HcA5) soit e : H —> {±1} est surjective et donc H n A5 qui en est le noyau est de cardinal |H|/2.
Soit C G Conj(S5). Si C n A5 ^ 0, alors le caractère e de S5 prend la valeur 1 sur un élément de C et
donc sur C tout entier; autrement dit C C A5. Maintenant, si x G C, la classe de conjugaison Cx dans
A5 est incluse dans C, et si Zx est son centralisateur dans S5, il y a deux cas :
• Zx c A5 et alors |CX| = |^4 = 5 j§4 = ||C|, et C se scinde en deux classes de conjugaison dans A5 ;
• Zx contient un élément de signature -1, et alors \ZX n A5| = ||ZX|, ce qui implique que Cx est de
cardinal ,z|^[ . = l^l^ = j|4 = |C|, que Cx = C et que C reste une classe de conjugaison dans A5.
Comme (45) commute à (123), la classe des 3-cycles reste une classe de conjugaison dans A5. De même,
(12) commute à (12)(34) et donc C2,2 est une classe de conjugaison de A5. Par contre, les 5-cycles sont
au nombre de 24, et comme 24 ne divise pas |Ar,| = 60, cela implique que la classe des 5-cycles se scinde
en deux dans A5. Comme (13524) = a(12345)a"1, avec a = (2354) et e(a) = -1, on en déduit que t0 et
*o ne sont pas dans la même classe de conjugaison dans A5, et comme les 5-cycles sont tous conjugués
dans S5, cela permet de montrer que t et t2 ne sont pas dans la même classe, pour tout 5-cycle t
570
ANNEXE H. PROBLÈMES CORRIGÉS
— Deux classes C5 et C5 de cardinal 12 dont la réunion est l'ensemble des 5-cycles (d'ordre 5).
De plus, si t est un 5-cycle, alors t et t2 ne sont pas dans la même classe. Pour fixer les idées, on
note C5 la classe de *0 = (12345) et C'5 celle de *§ = (13524).
Question 1. (a) Montrer que A5 a 5 représentations irréductibles dont au moins une est de
dimension 1.
(b) Montrer que ces représentations sont de dimensions respectives 1, 3, 3, 4 et 5.
(c) Quelle est la représentation de dimension 1 ? On note U la représentation de dimension 4,
V celle de dimension 5, et W, W les deux représentations de dimension 3. Quel morceau de la
table peut-on déduire de ce qui précède ?
Question 2. On note T la matrice 5x5 définie par la table des caractères de A5.
(a) Montrer que TT* est la matrice diagonale de coefficients 60, 3, 4, 5 et 5. (On utilisera la
rem. 1.2.35.)
(b) En déduire une majoration de |x(#)|> puis que |x(#)| ¥" lx(l)l P°ur tous x € ^(As) — {1}
et g ^ 1.
(c) En déduire que A5 est simple (on rappelle que si G n'est pas simple, alors il existe un
morphisme de groupes surjectif / : G —► H, avec H ^ {1}, dont le noyau n'est pas réduit à {1}).
Question 3. Soit U' la représentation de permutation de A5 associée à l'action naturelle de A5
sur {1,..., 5} (i.e. gfe) = e^j, si g e A5 et i e {1,..., 5}), et soit U Phyperplan de U' d'équation
xi-\ h X5 = 0.
(a) Calculer g • x, si x = (#1,... ,£5) et g G A5, et montrer que U est stable par A5.
(b) Soit x e V. Montrer que le sous-espace Ux de U engendré par les g • x, pour g G A5,
est stable par A5, et qu'il contient un vecteur non nul dont 3 des coordonnées sont nulles (on
commencera par montrer qu'il contient un vecteur non nul dont 2 des coordonnées sont nulles
en considérant les éléments de la forme g-x — x).
(c) En déduire que U est irréductible.
(d) Calculer les caractères de U' et U ; retrouver le fait que U est irréductible.
Question 4. (a) Soit Y une représentation de A5. Montrer que g i-» detpy(p) est un caractère
de A5. En déduire que detpy(g) = 1 pour tout g G A5.
(b) Remplir les deux premières lignes des deux dernières colonnes de T. (On considérera une
représentation irréductible Y de dimension 3 de A5, on s'intéressera aux valeurs propres Ai, A2, A3
de py(g), et on utilisera le (b) de la question 2.)
(c) Montrer que C5 et C5 sont stables par g \-> g-1. En déduire que, si g est un 5-cyle, les
valeurs propres de py(g) sont globalement stables par A i-» A-1.
(d) Terminer le remplissage des deux dernières colonnes de T. (On utilisera les formules
cosf = ^,cosf = =4=l.)
(e) Comment peut-on compléter la table des caractères de A5 ?
Question 5. Soit Y la représentation de permutation associée à l'action de A5 sur l'ensemble
à 10 éléments des paires d'éléments distincts de {1,... ,5}. Calculer le caractère xy de Y et les
produits scalaires (xy, 1) et (xy,Xu)- En déduire une autre manière de calculer xv-
H.2. TABLE DES CARACTÈRES DE A5
571
Corrigé
Question 1. (a) D'après le cor. 1.2.16, le nombre de représentations irréductibles de A5 est égal au
nombre de ses classes de conjugaison, c'est-à-dire 5. Par ailleurs, tout groupe admet la représentation
triviale (de dimension 1) comme représentation irréductible.
(b) D'après la formule de Burnside, si cfe, cfo, d\ et cfo désignent les dimensions des représentations
irréductibles de A5 distinctes de la triviale, on a 1 + d\ + d\ + d\ + d\ = |A5| = 60. Or 59 s'écrit d'une
seule manière (à permutation près) comme une somme de 4 carrés, à savoir 59 = 52 + 42 + 32 + 32. (Cela
peut se voir en faisant une recherche systématique ; on peut aller un peu plus vite en regardant modulo8,
ce qui permet de montrer que l'un des di est 4 (car les autres multiples de 4 sont trop grands) et les
autres d* sont impairs.)
(c) La représentation de dimension 1 est la représentation triviale, et comme x(l) est la dimension de la
représentation correspondant à x, on peut remplir la première ligne et la première colonne de la table
des caractères.
Question 2. (a) D'après la rem. 1.2.35, TT* est la matrice diagonale dont le coefficient sur la ligne
correspondant à la classe C est |G|/|C|. C'est donc la matrice diagonale de coefficients 60/1 = 60,
60/20 = 3, 60/15 = 4, 60/12 = 5 et 60/12 = 5.
(b) Le coefficient diagonal de TT* sur la ligne correspondant à la classe C est aussi égal à $^xeirr(A6) |x(C)|2.
Comme ce coefficient est < 5 si C ^ Ci, d'après le (a), cela montre que |x(C)| < 3 pour tout x € Irr(A5),
si C 7^ Ci, et comme |x(l)l ^ 3, si x € Irr(A5) - {1}, cela permet de conclure.
(c) Si A5 n'était pas simple, il existerait un morphisme de groupes surjectif / : A5 —► H, avec H ^ {1},
de noyau Ker/ ^ {1}. Comme H ^ {1}, il existe une représentation irréductible V de H, distincte de la
représentation triviale (cela découle de la formule de Burnside). Mais alors pv ° / est un morphisme de
groupes de A5 dans GL(V), ce qui permet de considérer V comme une représentation de A5. Les images
de v G V sous l'action de A5 étant les mêmes que celles sous l'action de H, la représentation V de A5 est
irréductible, et on a Xv(#) = Xv(l), pour tout g G Ker/. Ceci contredit le (b) et permet de conclure.
Question 3. (a) Onaj- (xiei + ••• + x5e5) = Xieg^) + ••■ + £5^(5) et donc g • (xu... ,x5) =
(x^-i(i),... ,x^-i(5)). On en déduit le fait que les coordonnées de g - x sont les mêmes que celles de
x à permutation près, et donc que les sommes des coordonnées de x et g • x sont les mêmes. D'où la
stabilité de U sous l'action de A5.
(b) La stabilité de Ux par A5 résulte de ce que h- (gx) = hgx, et donc que le translaté d'une combinaison
linéaire de translatés de x est encore une combinaison linéaire de translatés de x.
Soit x = (#1,..., #5). Comme x G U, il existe i ^ j tels que Xi ^ Xj. Quitte à remplacer x par h • x,
avec h G A5 vérifiant /i(l) = i et /i(2) = j, on peut supposer que i = 1 et j = 2. Soit g = (132). Alors
gx = (x2,xs,xuX4,Xry) ety = gx-x = (2/1,2/2,2/3,0,0), avec 2/1 = x2 -#1 ^ 0. Comme y e Ux, on a
établi l'existence d'un élément non nul y de Ux ayant deux coordonnées nulles.
Comme y G Ux, les trois coordonnées non nulles de y ne sont pas toutes égales, et il existe i ^ j tels
que y* 7^ y y Comme ci-dessus, on peut supposer i = 1 et j = 2, et 2/4 = 2/5 = 0. Soit g1 = (12) (45), et soit
w = 9' ' V — 2/- Alors w G Ux, et w = (2/2 - 2/i, 2/1 -2/2,0,0,0) est non nul et a 3 coordonnées nulles.
(c) Il s'agit de prouver que le sous-espace Ux de U engendré par les g • x est égal à U, si x G U est non nul.
Or Ux contient un vecteur de la forme e* -e^, avec i ^ j, d'après le (b). Comme g- (e* -e^) = ^g(i)—^g(j)^
et comme pour tout couple i' ^ j', il existe j6Â5 tel que g(i) = i' et #(jî) = j7, on voit que Ux contient
e% - ej pour tout couple i ^ j. Il contient donc en particulier la base e* - ei, pour 2 < i < 5, de U, ce qui
permet de conclure.
(d) Comme U7 est une représentation de permutation, xu'(^) est Ie nombre de points fixes de g G A5
agissant sur {1,..., 5}. On a donc xu'(Ci) = 5 ; xuKQO = 2> Xu'(C2,2) = 1, et xuKC*) = Xu'(C75) = 0.
572
ANNEXE H. PROBLÈMES CORRIGÉS
La représentation U' est la somme directe de U et de la droite engendrée par e\ H h er, sur laquelle
A5 agit trivialement. On a donc xu'(tf) = Xu(tf) + Xi(0)> d'où xu(tf) = xu'(tf) - 1, pour tout g G A5. En
reportant les valeurs de xus cela nous fournit la seconde colonne de la table des caractères.
Enfin, (xu,Xu) = è(4' + 20 • l2 + 15 • 02 + 12 • (-1)2 + 12 • (-1)2) = ^(16 + 20 + 12 + 12) = 1, ce
qui prouve que U est irréductible (cor. 1.2.21).
Question 4. (a) L'application g h-> detpy(^) est un morphisme de groupes de G dans C* comme
composée des morphismes g h-> py et u h-> detu ; c'est donc un caractère linéaire de A5. Or un caractère
linéaire définit une représentation de dimension 1 qui est irréductible par la force des choses. Comme A5 a
une seule représentation irréductible de dimension 1 (la représentation triviale), cela permet de conclure.
(b) • Si g est un 3-cycle, alors py(g)3 = py(g3) = 1, et Ài,À2,À3 sont des racines 3-ièmes de l'unité
dont le produit est égal à 1 d'après le (a), et qui ne sont pas toutes les trois égales, d'après le (b) de la
question 2. On adonc {Ài,À2,À3} = {l,e2i7r/3,e~2i7r/:*}, et donc Xy(#) = Ai +A2 + A3 = 0, ce qui remplit
la deuxième ligne des deux dernières colonnes de T.
• Si g est d'ordre 2, alors Ai, À2, À3 valent ±1, et ne sont pas toutes égales à 1, et leur produit vaut 1.
Il y en a donc deux qui valent -1 et une qui vaut 1. On en déduit que Xy(#) = Ai + À2 + A3 = -1, ce
qui remplit la troisième ligne des deux dernières colonnes de T.
(c) g *-> g2 échange C5 et Cf)5 et donc g h-> g4 laisse stable C5 et C5. Or g4 = g~l, si g est un 5-cycle
puisque #5 = 1.
On en déduit que, si g est un 5-cycle, alors g et g~l sont dans la même classe de conjugaison, et donc
qu'il existe /16A5 tel que g~l = hgh~l. Ceci implique que py(g)~l = py(g~l) = Pv(h)py(g)py(h)~l, et
donc que py(g)~l et py(g) ont les mêmes valeurs propres comptées avec multiplicité. Comme les valeurs
propres de py(g)"1 sont les inverses de celles de py(g), cela permet de conclure.
(d) Si g e C5, les valeurs propres Ai, A2,A3 de py(g) sont des racines 5-ièmes de l'unité, qui ne sont pas
toutes égales à 1, et l'ensemble est stable par A h-> A-1 d'après le (d). Il n'y a donc que deux possibilités :
{Ai,A2,A3} = {l,e2i7r/5,e-2i7r/5} ou {Ai,A2)A3} = {l,e4i7r/5,e-4i7r/5}. Dans le premier cas, on aurait
Xy(#) = ^2 et ^ans *e second Xy(#) = *~2 • De plus, g2 e C5 et les valeurs propres de py(g2) sont les
carrés des valeurs propres de py(g). Il s'en suit que, si Xy(Cs) = ^^, alors XyCC^) = ^^, et que si
Xy(C5) = ^fi-, alors xy(C'5) = jd^. Comme A5 a deux représentations irréductibles de dimension 3,
et comme le caractère détermine la représentation (cor. 1.2.19), cela implique que les deux possibilités
apparaissent. Ceci permet de conclure.
(e) Il suffit d'utiliser la décomposition de la régulière (cor. 1.2.23), qui nous fournit, pour# ^ 1, la formule
1 + 4xu(#) + 5xv(#) + 3xw(#) + 3xw/(#) = 0, et comme on connaît tous les termes sauf Xv(#)5 cela
permet de conclure.
Question 5. Comme Y est une représentation de permutation, xy(#) est le nombre de points fixes de
g e A5 agissant sur l'ensemble des paires d'éléments distincts de {1,..., 5}. Comme il y a 10 telles paires,
on a Xy(Ci) = 10. La seule paire fixe par (123) est {4,5}, et donc Xy(Q3) = 1. Il y a deux paires fixes
par (12)(34), à savoir {1,2} et {3,4}, et donc Xy(C2,2) = 2. Enfin, aucune paire n'est fixe par un 5-cycle
et donc Xy(Cs) = Xy(C75) = 0. Maintenant,
(Xy, 1) =^(10 + 20 • 1 + 15 • 2 + 12 • 0 + 12 • 0) = -UlO + 20 + 30) = 1
oU oO
(XY5Xu)=^(40 + 201 + 15.0 + 12.0 + 12.0) = -^(40 + 20) = l
On en déduit le fait que Y se décompose sous la forme 1 ©U© Y7, où Y7 est de dimension 5 et ne contient
pas de composante irréductible isomorphe à 1 ou U. Comme les représentations irréductibles restantes
sont de dimensions 5, 3 et 3, on voit que Y est irréductible, isomorphe à V, et donc xv = Xy - Xu - Xi-
H.2. TABLE DES CARACTÈRES DE A5
573
Remarque : On peut construire géométriquement la représentation W en partant d'un icosaèdre
(polyèdre régulier à 12 sommets, de chacun desquels partent 5 arêtes, et dont les faces, au nombre de 20, sont
des triangles équilatéraux). Réciproquement, un travail non négligeable permet de construire à l'intérieur
de W un sous-R-espace vectoriel W0 de dimension 3, stable par A5 (et tel que W = W0 © iW0). En
prenant un produit scalaire sur W invariant sous A5 (cf. th. 1.2.6), cela munit W0 d'un produit scalaire
pour lequel A5 agit par des isométries (et même par des rotations d'après le (a) de la question 4). En
particulier, to = (12345) agit par une rotation d'angle ±^, et si / est un vecteur unitaire de l'axe de
cette rotation, le stabilisateur de / est le groupe d'ordre 5 engendré par £0> ce qui fait que / a 60/5 = 12
translatés sous l'action de A5. On peut montrer que ces translatés sont les sommets d'un icosaèdre.
FiG. 5. L'icosaèdrc
De même, si / est un vecteur unitaire de l'axe de la rotation d'angle ±^ définie par l'action de (123),
alors / a 60/3 = 20 translatés sous l'action de A5. On peut montrer que ces translatés sont les sommets
d'un dodécaèdre (polyèdre régulier à 20 sommets, de chacun desquels partent 3 arêtes, et dont les faces,
au nombre de 12, sont des pentagones réguliers).
FiG. 6. Le dodécaèdre
574
ANNEXE H. PROBLÈMES CORRIGÉS
H.3. Représentations de GL2(F3)
Le but de ce devoir est la construction de la table des caractères du groupe G = GL2(F3), où
F3 = Z/3Z est le corps à 3 éléments (notés généralement 0, 1 et —1) par dévissages^5) successifs
du groupe G. Une autre approche est proposée dans l'annexe C.
Le groupe G est un groupe de cardinal^ 48 qui agit sur le F3 espace vectoriel F3 x F3, et
comme il agit linéairement, il transforme une droite vectorielle en droite vectorielle ; il agit donc
sur l'ensemble P1(Fs) de ces droites qui a 4 éléments : les droites Ai, A2, A3, A4 engendrées
respectivement par ei, e2, e\ + e2, e\ — e<i, où ei, e2 désigne la base canonique de F3 x F3 sur F3.
On en déduit un morphisme a : G —► S4, défini par g ■ A* = A^^j^j, pour tout i G {1,2,3,4}.
1
(1,2)
(1>2)(3,4)
(1,2,3)
(1,2,3,4)
1
1
1
1
1
1
e
1
-1
1
1
-1
9
2
0
2
-1
0
Xi
3
1
-1
0
-1
X2
3
-1
-1
0
1
FlG. 7. Table des caractères de S3 et S4
Nous allons utiliser ce morphisme pour construire la table de G à partir de celle de S4, que
nous admettrons^7).
Si g = (J J) G G, on note -g l'élément ( Ij ij) de G. On définit les éléments suivants de G :
I-(èî).S=(îè).D=(-°iè).T = (èl),C = (î}).
Question 1. (i) Soit K un corps et soit g e GL2(K) qui n'est pas une homothétie
(a) Montrer qu'il existe v G K2 tel que v et g(v) forment une base de K2 sur K.
<5>Le démarrage de la démonstration de Wiles du théorème de Fermât repose sur les deux petits miracles
que constituent l'existence de ces dévissages et celle de la représentation V de G, construite dans le
problème, qui est un relèvement en caractéristique 0 de la représentation naturelle de G modulo 3 : elle
est de dimension 2, et la réduction modulo 3 de la trace de py(g) est la trace de g.
WL'application qui associe à g G G ses deux vecteurs colonnes est une bijection de G sur l'ensemble des
bases de F3 x F3 sur F3. Comme une base est constituée d'un premier vecteur non nul et d'un second
n'appartenant pas à la droite engendrée par le premier, on a |G| = (9 - 1)(9 - 3) = 48.
(7>La méthode utilisée permettrait de construire la table de S4 à partir de celle de S3 : on peut faire agir
S4 sur la classe de conjugaison de (1,2)(3,4) qui a 3 éléments, ce qui nous fournit un morphisme surjectif
de groupes S4 —> S3, et permet d'obtenir les trois premières colonnes de la table de S4. On peut, comme
au (i) de la question 3, montrer qu'il manque 2 représentations qui sont toutes les deux de dimension 3.
Celle Vi correspondant à xi est obtenue en retirant la représentation triviale à la représentation de
permutation associée à l'action de S4 sur {1,2,3,4} (cf. ex. 1.9) ; l'autre est obtenue en tordant Vi par
le caractère linéaire e qui n'est autre que la signature.
1
(1.2)
(1,2,3)
1
1
1
1
e
1
-1
1
e
2
0
-îj
H.3. REPRÉSENTATIONS DE GL2(F3)
575
(b) En déduire que la classe de conjugaison do g dans GL2(K) est celle de (° -™™) ).
(ii) Justifier la liste des classes de conjugaison de la table de G ci-dessous (les éléments de
Irr(G) sont indexes par des représentations au lieu de leurs caractères).
I
-I
s
D
T
-T
C
-C
1
1
1
1
1
1
1
1
1
e
1
1
-1
1
1
1
-1
-1
U
2
2
0
2
-1
-1
0
0
Vi
3
3
1
-1
0
0
-1
-1
v2
3
3
-1
-1
0
0
1
1
W
4
-4
0
0
1
-1
0
0
V
2
-2
0
0
-1
1
iy/2
-iy/2
V
2
-2
0
0
-1
1
-»V5|
iy/2
FlG. 8. Table des caractères de GL2(F3)
Question 2. (i) Montrer que le noyau de a : G —► S4 est {±1}, et que <r est surjectif.
(ii) Déterminer a{g), pour g e {I, —I, S, D, T, -T, C, -C}.
(iii) Construire, à partir des représentations de S4, cinq des représentations irréductibles de
G. Quelles colonnes de la table cela permet-il de remplir ?
Question 3. (i) Calculer le nombre et les dimensions des représentations irréductibles
manquantes.
(ii) Montrer que, si V est une représentation de G, alors V+ = {v e V, (—1) • v = v} et
V- = {v G V, (—1) • v = —v} sont des sous-reprôsentations de V, et que V = V+ © V~. En
déduire que —I agit par —1 sur les représentations manquantes.
(iii) Expliquer comment en déduire les 4 premières lignes des 3 colonnes manquantes (on
s'intéressera au lien entre py(g) et Pv(—<?))•
Question 4. Soit X une des représentations de dimension 2 manquantes.
(i) Montrer que Xx(C) = ±iy/2 (considérer les valeurs propres de w, uz et u4, où u = px(C)).
(ii) En déduire le lien entre les deux représentations de dimension 2 manquantes, et montrer
que l'une des deux (que l'on note V; l'autre est notée V') vérifie Xv(C) = iy/2.
(iii) Montrer que H = {g e G, xv(<?) = 2} est un sous-groupe distingué de G ; en déduire que
Xv(T) 7^ 2 (on pourra considérer STS-1T), puis que Xv(T) = — 1.
(iv) Expliquer comment compléter la table de G.
Question 5. Calculer le caractère de la représentation de permutation Y associée à l'action de
G sur F3 x F3 et la multiplicité des représentations irréductibles dans la décomposition de Y.
576
ANNEXE H. PROBLÈMES CORRIGÉS
Question 6. Soit B C G le sous-groupe des matrices triangulaires supérieures et soit
77 : B -► {±1} le caractère linéaire défini par v((od)) = 1 si d = 1 et vliod)) = -*> si
d=-l.
(i) Calculer |B|.
(ii) Soit W = Ind^rj. Montrer que W = W (calculer xw(=tl) e* Ie signe de xw(T))-
Question 7. Calculer la multiplicité des représentations irréductibles dans la décomposition de
Z = W®W®W.
Corrigé
Question 1. (i) (a) Si v ^ 0 et si (v,g(v)) n'est pas une base de K2, c'est que g(v) est un multiple de v.
Soit ei, e2 la base canonique de K2. Si g(e{) = Àiei et gfa) = À2e2, et si g n'est pas une homothétie,
on a À2 ^ Ai, et alors g(ei + e<i) n'est pas un multiple de e\ + e<i ; on en déduit qu'au moins un des trois
vecteurs ei,e2,ei + e<i est tel que v et g(v) forment une base de K2 sur K.
(i) (b) Comme g n'est pas une homothétie, il existe v G K2 tel que (v,g(v)) soit une base de K2. La
matrice de g dans cette base est alors (Ç g), dont la trace est b et donc 6 = Tr(g), et le déterminant
est -a et donc a = - det(g). On a alors g = P(°l "^ff* )P-1, où P est la matrice dont les colonnes sont
v et g(v), ce qui permet de conclure.
(ii) Les homothéties commutent à tout et donc leur classe de conjugaison n'a qu'un élément. Comme
il y a exactement deux homothéties dans G, à savoir I et -I, cela nous fournit déjà deux classes de
conjugaison.
Les autres classes sont, d'après le (ii), en bijection avec les valeurs possibles du couple (det(^),Tr(^)).
Or det(g) peut prendre 2 valeurs (à savoir 1 et -1) puisque F3 a deux éléments et qu'un élément de G a
un déterminant non nul, et Tr(g) peut prendre 3 valeurs. Ce qui nous fournit 6 classes, et on vérifie que
les images de S, D, T, -T, C et -C par g h-> (det(g),Tr(g)) sont respectivement (-1,0), (1,0), (1,-1),
(1, -1), (-1,1) et (-1, -1), et donc que l'on a bien un représentant de chaque classe de conjugaison.
Question 2. (i) g est dans le noyau de a si et seulement si toute droite vectorielle est invariante par #,
et donc si et seulement si g(v) est colinéaire à v, pour tout v non nul. D'après le (i) de la question 1, cela
implique que g est une homothétie. On en déduit que le noyau de a est {±1}. Comme le noyau de a est
de cardinal 2, son image est de cardinal ^|G| = 24 = IS4I, ce qui prouve que a est surjectif.
(ii) On remarque que cr(-g) = a(g) puisque -I est dans le noyau de a, et on trouve :
. a(i) = a(_i) = id,
• a(S) = (l,2),
• a(D) = (l,2)(3,4),
• a(T) = a(-T) = (2,3,4),
• a(C) = a(-C) = (1,2,3,4).
(iii) Comme a : G —> S4 est un morphisme de groupes surjectif, l'application x *-> X ° a induit une
injection de l'ensemble des caractères irréductibles de S4 dans celui des caractères irréductibles de G, ce
qui permet, en utilisant la table des caractères de S4 et le (ii), de remplir les 5 premières colonnes de la
table de G.
Question 3. (i) Comme il y a autant de représentations irréductibles que de classes de conjugaison
(cor. 1.2.13), il manque 8-5 = 3 représentations. Si on note ^1,^2,^3 leurs dimensions, la formule de
Burnside (cor. 1.2.20) implique que d\ + d\ + d§ + l2 + l2 + 22 + 32 + 32 = 48, et donc d\ + d\ + d§ = 24.
Cette équation n'a qu'une seule solution (à permutation près), à savoir di = 4, cfe = 2 et cfo = 2.
H.3. REPRÉSENTATIONS DE GL2(F3)
577
(ii) Comme (-I)2 = I, on a pv(-I)2 = 1, ce qui montre que pv(-I) est une symétrie, et donc que
V est la somme directe des espaces propres V+ et V~ dé pv(-I) pour les valeurs propres 1 et -1. Par
ailleurs, comme -I commute à tout élément de G, on a (-1) • (g • v) = g • ((-I) • v) = À (g • v), si v est
vecteur propre de pv(-I) pour la valeur propre À; il en résulte que V+ et V~ sont stables pour l'action
de G et donc sont des sous-représentations de V.
Maintenant, si V est irréductible, on a V = V+ ou V = V", mais si V = V+, le noyau de a agit
trivialement sur V, ce qui fait que V est une représentation irréductible de S4 ; elle ne fait donc pas partie
des représentations manquantes, ce qui prouve que -I agit par -1 sur les représentations manquantes.
(iii) La première ligne est constituée des dimensions des représentations, d'où les 4, 2, 2. Maintenant,
on a pv(-g) = Pv(-Ï)pv(g) = -pv(g)> et donc Xv(-tf) = -Xv(tf). On en déduit la seconde ligne et
la nullité de Xv(S) et Xv(D) car les classes de conjugaison de S et D sont invariantes par g *-+ -g car
Tt(-g) = -Tr(g) et det(-g) = det(g).
Question 4. (i) On a C3 = (_\ ~~0l) et C4 = ( ~0l _^). Notons À,/z les valeurs propres de u. Comme
C4 = -I, on a u4 = -1 et donc À4 = /z4 = -1. Maintenant, C3 est dans la classe de conjugaison
de C puisque TV(C3) = 1 = Tr(C) et det(C3) = -1 = det(C). Si g G G est tel que C3 = gCg~l, et
si h = px(g)> on a u3 = huh~~l, et donc u3 et u ont les mêmes valeurs propres. Comme ces valeurs
propres sont des racines 4-ième de -1, on a {A,/z} = {ei7r/4,e3i7r/4} ou {A,/z} = {-ei7r/4,-e3i7r/4}, et
donc xc(X) = TV(u) = ±(ei7r/4 + e3i7r/4) = ±i>/2.
(ii) La représentation X <g> s est une représentation de dimension 2 de G, qui est irréductible puisque
X l'est, et distincte de X puisque Xx®e(C) = e(C)xx(C) = ~Xx(C) et xx(C) ^ 0. Comme par ailleurs
e(—I) = 1, cela implique que —I agit par —1 sur X<g>e, et donc que la seconde représentation manquante
de dimension 2 est X<g>e. Comme {xx(C),Xx®e(C)} = {i\/2, -i\/2}, cela permet de conclure.
(iii) Si g G G, alors xv(#) est la somme de deux racines de l'unité, puisque c'est la somme des valeurs
propres de pv(<7)- On a donc Xv(#) = 2 si et seulement si ces deux valeurs propres sont égales à 1, et
donc si et seulement si pv(#) = 1 puisque pv(#) est diagonalisable (rem. 1.1.7). Autrement dit H est le
noyau de py ; c'est donc un sous-groupe distingué de G.
Si T G H, il en est de même de STS_1T = ( î -1 )> qui est dans la classe de conjugaison de D, ce qui
conduit à une contradiction puisque Xv(D) = 0 ; on a donc Xv(T) ^ 2.
Par ailleurs, T3 = 1, et donc les valeurs propres de v = pv(T) sont des racines 3-ièmes de l'unité. De
plus, T2 = ( q "^ ) est dans la classe de conjugaison de T et donc v2 a les mêmes valeurs propres que v, et
comme au moins une de ces valeurs propres est différente de 1, ces valeurs propres sont e2i7r/3 et e~2i7r/3,
et donc xv(T) = Tv(v) = e2™'3 + e~2i^3 = -1.
(iv) On complète la septième colonne en utilisant la relation xv(-#) = -Xv(#)5 et la huitième en
utilisant la relation Xv'(^) = £(<7)xv(<7)- Enfin, pour compléter la sixième, on peut soit utiliser la
décomposition de la régulière (cor. 1.2.20), soit l'orthogonalité des lignes de la table des caractères (rem. 1.2.32),
ce qui, dans le cas présent, revient au même, car on est forcé d'utiliser la première ligne au signe près.
Question 5. Comme Y est une représentation de permutation, Xy(#) est le nombre de points fixes de g,
c'est-à-dire 3rf^\ où d(g) est la dimension de l'espace propre associé à la valeur propre 1. Or 1 est valeur
propre si et seulement si X2 - Tr(g)X + det(g) est égal à (X - l)2 ou (X - 1)(X + 1), et d(g) est alors
égal à 1, sauf si g = I ; on obtient donc :
XyOO = 9, xy(-I) = 1, Xy(S) = 3, xy(D) = 1, Xy(T) = 3, xy(-T) = 1, xy(C) = 1, xy(-C) = 1.
En comparant les caractères, on en déduit que Y = 21 © Vi © W. Il y a des tas de manières d'arriver à
ce résultat, s'il ne saute pas aux yeux.
• On peut remarquer que l'action de G sur F3 x F3 a deux orbites, à savoir (0,0) et le reste, et donc
que Y contient deux copies de la représentation triviale, à savoir la droite engendré par e(0,o) et celle
578
ANNEXE H. PROBLÈMES CORRIGÉS
engendrée par J2(Xty)^(ofi) e(s,î/)> ce Qu* Permet de décomposer Y sous la forme Y = 21 © Y7. Comme
Xy'O) = 7 et Xy'(-I) = -1) et comme Xy'(C) = Xy'(~"C), on en déduit que Y7 peut se décomposer soit
sous la forme W © Y77 soit sous la forme V © V7 © Y", où Y" est une représentation de dimension 3 sur
laquelle -I agit trivialement. On a alors Xy"(C) = -1 et Xy"(S) = 1, et la seule possibilité qui reste est
Y" = Vi. On élimine alors la possibilité Y 9* V © V7 © Y" en regardant Xy(T).
• Une méthode un peu plus conceptuelle consiste à décomposer Y sous la forme Y+©Y~~, où Y+ et Y~~
sont les sous-espaces propres de py{-1) pour les valeurs propres 1 et -1. L'espace Y+ est engendré par
les ex + (-1) • ex, pour x G F3 x F3, et il se décompose comme la somme directe des deux représentations
constituées de la droite Y0 engendré par e(0,o) et l'espace Yi engendré par les /*, où fi = J2xeA{ ex- La
représentation Y0 est la représentation triviale, la représentation Yi est la représentation de permutation
induite par l'action de G sur les droites vectorielles (elle correspond à la représentation de permutation
de S4 associée à l'action de S4 sur {1,2,3,4}) ; son caractère est 1 + \u et on termine en calculant xy-
grâce à la formule Xy- = Xy - Xy+- On peut utiliser cette méthode pour déterminer les composantes
isotypiques de Y, ce qui est plus précis que de calculer les multiplicités des représentations irréductibles.
• Une solution moins artisanale consiste à utiliser la formule générale pour la multiplicité (cor. 1.2.15),
ce qui demande de calculer le cardinal des classes de conjugaison (cela peut se faire en reliant les classes
de conjugaison de G à celles de S4) pour calculer des produits scalaires de caractères.
Question 6. (i) On a |B| = 12 car g = (g *}) h-> (a,d,6) induit une bijection de B sur (F3)2 x F3.
(ii) D'après le th. 1.3.11, on axw(#) = ]è| ^>seGy sgs-leB v(s9s~1)- Maintenant, |B| = 12, et la formule
ci-dessus pour I et -I nous donne XwOO = f§ = 4 et Xw(~I) = ~4 puisque I et -I commutent à tout
et appartiennent à B. Il en résulte que W7 est de dimension 4 et que -I agit par -1 sur W7 ; on a donc
W'^Wou W7 s* Z© Z7, avec {Z,Z7} c {V,V7}.
Par ailleurs, la seule valeur propre de sTs~l est 1, et donc, si sTs~l e B, alors sTs~l = (£ J), ce qui
fait que T](sTs~~l) ^ 0. On en déduit que xw'(T) ^ 0, ce qui ne laisse que la possibilité W7 = W.
Question 7. On a Xz(#) = Xw(#)3. En particulier, Xz(-I) = -Xz(I), ce qui fait que -I agit par -1
sur Z, et donc que Z = mwW © myV © my/V, et xz = ^wXw + ^vXv + ravXv- En spécialisant cette
identité en C, on obtient my = my, et en la spécialisant en I et T, on obtient 4mw + 4mv = 64 et
mw - 2mv = 1, et donc mw = 11, mv = 5 et Z ^ 11W © 5 V © 5 V7.
H.4. TABLE DES CARACTÈRES DE GL3(F2)
579
H.4. Table des caractères de GL3(F2)
Le but de ce devoir est la construction de la table des caractères du groupe G = GLi3(F2), où
F2 = Z/2Z est le corps à 2 éléments (on al = — 1 et 2 = 0 dans ce corps).
Cx
c2
c4
c3
c7
c7
Xi
1
1
1
1
1
1
X3
3
-1
1
0
a
â
X's
3
-1
1
0
â
a
Xe
6
2
0
0
-1
-1
X7
7
-1
-1
1
0
0
~X8~\
8
0
0
-1
1
1
Cx
c2
c4
c3
c7
c7
card
1
21
42
56
24
24
Car
(x-i)3
(x-i)3
(x-i)3
X3-l
X3 + X + 1
X3 + X2 + 1
Min
X-l
(x-i)2
Car
Car
Car
Car
ord
1
2
4
3
7
7
FlG. 9. Classes de conjugaison et table des caractères de GL3(F2)
I. Classes de conjugaison
Si K est un corps (sous-entendu commutatif), et si A e Mn(K), on note Car(A) le polynôme
caractéristique de A et Min(A) son polynôme minimale.
Question 0. Montrer que, si p est premier, le nombre de bases de F£ sur Fp est ]Ji=o{pn — p1)-
En déduire que |G| = 168.
Question 1. Soient K un corps, P = X3 4- û2X2 -I- a\X + ao G K[X] et Xp l'ensemble des
A e M3(K), avec Car(A) = Min(A) = P.
(0 0 -ao \
1 0 -ai ).
0 1 -02/
(ii) Soit A e Xp. Montrer que dimKer(A - 1) = 0 ou 1 suivant que P(l) = 0 ou P(l) ^ 0.
(ni) Que vaut A si Car(A) = (X - l)3 et Min(A) = X - 1 ? Que vaut dimKer(A - 1) ?
(iv) Montrer que dimKer(A - 1) = 2, si Car(A) = (X - l)3 et Min(A) = (X - l)2. En déduire
qu'alors A est conjuguée à ( 1 2 0 ). (On choisira v £ Ker(A — 1), et on cherchera une relation
entre v, Av et A2v.)
Question 2. Quelles sont les valeurs possibles de Car(A), pour un élément de G = GL3(F2).
En déduire la liste des classes de conjugaison de G et exhiber un élément de chaque classe.
(8)()n aura à utiliser les résultats suivants.
• Les polynômes Car(A) et Min(A) sont invariants par conjugaison par un élément de GLn(A) (i.e.
Ca^PAP"1) = Car(A) et Mi^PAP"1) = Min(A), si P € GL„(K)).
• Car(A) est de degré n, Min(A) divise Car(A) (th. de Cayley-Hamilton), et on a Min(A) = Car(A) si
Car(A) n'a pas de facteur avec un exposant ^ 2 dans sa factorisation en polynômes irréductibles.
• Si v G Kn, l'ensemble des P € K[X] tels que P(A) • v = 0 est un idéal qui contient Min(A), et il existe
v € Kn tel que Min(A) engendre cet idéal, auquel cas v, Av,..., Ad~lv forment une famille libre de Kn,
si d = deg(Min(A)).
580
ANNEXE H. PROBLÈMES CORRIGÉS
Question 3. (i) Calculer l'ordre des différentes classes^9) (on utilisera les factorisations (dans P2[X])
X2 - 1 = (X - l)2, X4 - 1 = (X - l)4 et X8 - X = X(X - 1)(X3 4- X 4- 1)(X3 4- X2 4-1)).
(ii) Montrer que {gh, g G C} G Conj(G), si C G Conj(G) et si A; G Z.
(iii) Montrer que C4 est stable par g ■-»• p3, et que C3 est stable par g\-^ g2.
(iv) Montrer que g i-> g2 envoie C4 sur C2 et Ci, C2 sur Ci.
(v) Montrer que C7 et C7 sont échangées par g ■-»• g~l et sont stables par g i-> g2 (on pourra
utiliser la formule P(X)2 = P(X2) dans F2[X]).
Question 4. (i) Montrer que N = {( 0 1 c J, a,b,c G F2} est un sous-groupe de G inclus dans
le centralisateur de u = ( 0 1 0 J. En déduire que IC2I divise 21 ; que signifierait une égalité?
(ii) Montrer que |C| divise |G|/n, si C G Conj(G) est d'ordre n. A quelle condition y a-t-il
égalité?
(iii) Calculer le cardinal de chacune des classes, montrer que le centralisateur d'un élément g
de C3, C4, C7 ou C7 est le sous-groupe de G engendré par g, et que le centralisateur d'un élément
de C2 est de cardinal 8.
II. Table des caractères
Question 0. Soient u = e2™/7 et a = u+u2+u4. Calculer 2f=0 w*. En déduire que a = =±*±>d
(on pourra calculer a2).
Question 1. Soit V une représentation de G. (On utilisera les résultats de la question 3 du I.)
(i) Montrer que Xv(C2) G Z.
(ii) Montrer que les valeurs propres de />v(G4), comptées avec multiplicité, sont stables par
A i-> A3. En déduire que Xv(C4) € Z.
(iii) Montrer de même que Xv(Cs) G Z.
(iv) Montrer qu'il existe des entiers a, 6, c tels que a 4-36+3c = dim V et XV(C7) = a+ba+câ,
XV (C7) = a 4- ca 4- bâ.
Question 2. D'où sort le caractère xi de la table ? On note Vi la représentation associée.
Question 3. Le groupe G agit sur l'espace vectoriel F3,, et cette action préserve l'ensemble X
des éléments non nuls de F3. On note Vx la représentation de permutation associée.
(i) Calculer le caractère de Vx- (Utiliser la question 1 du I.)
(ii) Montrer que Phyperplan V = {52x€Xaxex> 52xeXax = 0} est staWe Par G, et calculer le
caractère x ^e V.
(iii) En déduire que G a une représentation irréductible Vq de dimension 6 (on note X6 son
caractère) ; quelle partie de la table cela permet-il de remplir ?
Question 4. Soit W le carré alterné de V6-
(i) Calculer xw, (xw,Xw) et (xw,X6)- (Utiliser la question 3 du I.)
(ii) Quelles sont les solutions de 131 = a2 4- b2 4- c2 4- d2, avec a ^ 8 ? En déduire qu'en dehors
de Vi et V6, le groupe G admet comme représentations irréductibles, une représentation Vs de
dimension 8, une V7 de dimension 7, et deux V3, V3 de dimension 3, et que W = V7 © Vs (on
^L'ordre d'une classe de conjugaison est celui de n'importe quel de ses éléments.
H.4. TABLE DES CARACTÈRES DE GL3(F2)
581
note X8> X7> X3 et x's l°s caractères de ces représentations). Quelle partie de la table cela permet-il
de remplir ?
Question 5. (i) Montrer que si x est le caractère d'une représentation de G, alors x ost 'dussi le
caractère d'une représentation de G. En déduire que Irr(G) est invariant par x ■-> X-
(ii) Montrer que xi cst rôcl.
(iii) Montrer que |X7(C7)| < x/168/24. En déduire que X7(C7) = X7(C77) = 0.
(iv) Que valent (x7,Xi)> (X7,Xe) et (x7,X7> ? En déduire *7, puis Xs-
Question 6. (i) Soit V une représentation de dimension 3 de G. Montrer que si Xv(Ct) est réel,
alors XV(C7) = Xv^Ç) = 3. En déduire qu'alors V n'est pas irréductible.
(ii) Montrer que X3 = X3 c* expliquer comment compléter la table des caractères.
Question 7. G agit par conjugaison sur C7 ; soit Y la représentation de permutation associée.
(i) Montrer, cri utilisant la question 4 (iii) du I, que g ^ 1 est dans le centralisateur de h G C7
si et seulement si h est une puissance de g.
(ii) Calculer xy et en déduire que Y = Vi © V7 0 2VV
(iii) Construire des sous-representations Wi, W7, W8,Wg de Y telles que Y = Wi 0 W7 0
Wg 0 Wg. (On pourra considérer les fg£ = eg + peg2 + P2eg4, pour g e C7 et (3 G {l,j,j2}, où
j = e2i7r/3.)
Question 8. Montrer, grâce à la table des caractères, que G est simple^10). (Considérer une
représentation de G obtenue à partir d'une représentation irréductible d'un quotient de G, si G
n'était pas simple.)
Corrigé
I. Classes de conjugaison
Question 0. Si K est un corps, une base de Kn sur K est constituée d'un premier vecteur ei non nul,
d'un second vecteur e2 pas dans la droite engendrée par ei, d'un troisième e^ pas dans le plan engendré
par ei, e^ etc. Si |K| = g, il y a donc qn — 1 choix pour e\, qn — q pour e<i, qn — q2 pour e3, etc., soit au
total {qn - \){qn -q)--(qn- qn~l) bases.
Maintenant, l'application qui envoie une matrice A G GLn(K) sur ses n vecteurs colonnes est une
bijection de GLn(K) sur l'ensemble des bases de Kn; le cardinal de GLn(K) est donc Yl"=o(qn - q1)-
Dans le cas qui nous intéresse, on a n = 3 et q = 2, ce qui nous donne |G| = (8 - 1)(8 - 2)(8 - 4) = 168.
Question 1. (i) Comme Min(A) est de degré 3, il existe v tel que v, Av et A2v forment une base de K3.
De plus, Min(A) • v = 0 et donc A • (A2v) = -d2A2v - a\Av - a0v. On en déduit que U^AU = B, avec
(0 0 —ao \
1 0 -ai ), si U G GL3(K) est la matrice dont les colonnes sont v, Av et A2v.
0 1 — ai /
Réciproquement, si A est conjugué à B, alors Car (A) = Car(B) et Min(A) = Min(B). Maintenant, on
1 x 0 a0 1
obtient Car(B) = (X + a2)X2 -ai(-X) +ao = P, en développant -1 x ai par rapport à la dernière
I 0 —1 X+a2 I
colonne. Enfin, si on note ei,e2,e3 la base canonique de K3, on a Bei = e2 et B2ei = e3, ce qui fait que
(10)C'est le plus petit groupe simple non commutatif après A5 (qui est de cardinal 60) ; il est aussi
isomorphe à PSL2(F7) = SL2(F7)/{±1}, mais il faut se fatiguer un peu pour construire un tel isomor-
phisme.
582
ANNEXE H. PROBLÈMES CORRIGÉS
ei, Bei, B2ei forment une famille libre et qu'un polynôme non nul vérifiant Q(B) • ei = 0 est de degré ^ 3.
Il en résulte que Min(B) est de degré ^ 3, et comme il divise Car(B), on a Min(B) = Car(B) = P, ce qui
permet de conclure.
(ii) Soit v tel que v, kv et k2v forment une base de K3. Comme A3v = -a^v - aïkv - 02k2 v, on
obtient (A - \)(xqv + x\kv + X2k2v) = (-0,0X2 - xo)v + (xo - &\X2 - xi)kv + k2(xi - a2^2 - #2). Il en
résulte que Ker(A - 1) est l'ensemble des x0v + x\kv + X2k2v vérifiant x0 = -ao#25 #1 = -(^o + a{)x2
et X2(a2 + ûo + a\ + 1) = 0, et comme 0,2 + 0,0 + 0,1+ 1 = P(l), on voit que cet espace est de dimension 0,
si P(l) ^ 0 et de dimension 1, si P(l) = 0.
(iii) Si Min(A) = X-1, onaA = let donc Ker (A - 1) est de dimension 3.
(iv) Si (A - l)2 = 0, on a Im(A - 1) c Ker(A - 1) et comme dim(Im(A - 1)) + dim(Ker(A - 1)) = 3,
cela implique dim(Ker(A - 1)) ^ 2. On en déduit que Ker (A - 1) est de dimension 2, car A ^ 1, et donc
dim(Ker(A - 1)) < 3.
Si v £ Ker(A-1), alors v et kv forment une famille libre car 1 est la seule valeur propre. En particulier,
v n'appartient pas à Ker (A - 1), et donc le plan engendré par v et kv n'est pas égal à Ker (A - 1), ce qui
permet de compléter v et kv par un élément w de Ker (A - 1), pour obtenir une base de K3. Par ailleurs,
on a (A - l)2v = 0, et donc A • (kv) = -v + 2kv. Il en résulte que, si on note U G GL3(K) la matrice
dont les colonnes sont v, kv et w, alors U^AU = ( 1 2 0 J, ce qui permet de conclure.
Question 2. Comme le terme constant du polynôme caractéristique est le déterminant, il est non nul si et
seulement si la matrice est inversible. Il y a donc 4 polynômes caractéristiques possibles pour un élément
deG,àsavoirX3 + l = X3-l = (X-l)(X2+X + l),X3 + X + l,X3 + X2 + letX3 + X2 + X+l = (X-l)3.
• Si Car(A) = X3 + 1 = X3 - 1, on a Min(A) = X3 + 1 car X3 + 1 n'a pas de facteur multiple, et donc
A est conjuguée à ( 1 0 0 J, d'après le (i) de la Question 1.
• De même, si Car(A) = X3 + X + 1, alors A est conjuguée à ( 1 0 1 J.
• De même, si Car (A) = X3 + X2 + 1, alors A est conjuguée à ( 1 0 0 J.
• Si Car(A) = (X - l)3, il y a trois possibilités pour Min(A).
Si Min(A) = (X - 1), on a A = (0 1 0).
Si Min(A) = (X - l)2, alors A est conjuguée à ( 1 0 0 J, d'après le (iii) de la Question 1.
Si Min(A) = (X - l)3, alors A est conjuguée à ( 1 0 1 J, d'après le (i) de la Question 1.
Comme Car(A) et Min(A) sont invariants par conjugaison, la discussion précédente montre que les
classes de conjugaison sont en bijection avec les couples (Car(A),Min(A)) possibles. On obtient donc les
classes Ci, C2, C4, C3, C7 et C7 de la table, avec pour représentants respectifs :
/ioo\ /oio\ /ooi\ /ooi\ /ooi\ t /ooi\
(010, 100, (loi), 100), (101) et (100).
V001/' V001/' V011/' Voio/' Voioy V011/
Question 3. (i) • Ci est réduit à l'élément neutre qui est d'ordre 1.
• Comme (X - l)2 = X2 - 1 dans F2pt], l'ordre d'un élément de C2 divise 2, et comme ce n'est pas 1,
c'est 2.
• Comme (X-1)3 divise X4 -1 dans F2[X], l'ordre d'un élément A de C4 divise 4, et comme A2 -1 ^ 0,
puisque le polynôme minimal de A est (X - l)3, l'ordre de A est 4.
• Comme les éléments de C3 sont annulés par X3 — 1, ils sont d'ordre divisant 3 et donc d'ordre 3.
• Comme X3 + X + 1 et X3 + X2 + 1 divisent X7 - 1 dans F2[X], l'ordre d'un élément de C7 ou C^
divise 7, et donc est 7.
(ii) Soit 00 € C. Alors C = {hg0h-1, h G G}, et comme (hgoh~l)k = hg$h~l, on en déduit que
{<A g e C} est la classe de conjugaison de g§.
H.4. TABLE DES CARACTÈRES DE GL3(F2)
583
(iii) Si g est d'ordre 4, alors g3 est d'ordre 4. On en déduit que g h-> g3 envoie C4 sur une classe de
conjugaison constituée d'éléments d'ordre 4, et comme il n'y en a qu'une, à savoir C4, cela prouve que
g h-> g3 laisse stable C4. Le raisonnement est le même pour C3 qui est la seule classe constituée d'éléments
d'ordre 3 et donc est stable par g*-+ g2.
(iv) Le résultat suit de ce que g2 est d'ordre de 2, si g est d'ordre 4, et d'ordre 1, si g est d'ordre 1 ou
2, et de ce qu'il n'existe qu'une seule classe d'ordre 1 ou 2.
(v) Si A G GLn(K), et si Car (A) = P, le polynôme caractéristique de A-1 est donné par Car(A_1) =
det(A-1-X) = (detA"1)Xndet(X-1-A) = (det A)-1XnP(X"1). Cette formule montre que le polynôme
caractéristique de g~l est X3 + X + 1 si celui de g est X3 + X2 + 1, et réciproquement. Les classes C7 et
C7 sont donc échangées par g h-> g~l.
Si P(A) = 0, on a P(A)2 = 0, et comme on travaille dans F2, on a P(A)2 = P(A2), ce qui prouve que
le polynôme minimal de A2 divise celui de A. Dans le cas de C7 et C7, ces polynômes sont irréductibles,
et la divisibilité implique l'égalité, ce qui prouve que C7 et C7 sont stables par g *-+ g2.
Question 4. (i) ( 0 i c ) ( 0 \ c' ) = ( 0 1 c+T ) - Il est apparent sur cette formule que N est stable
\o 0 1/ \o 0 1 / \ 0 0 1 /
par multiplication et donc est un sous-groupe du groupe fini G, et que tout élément de N commute à u.
Maintenant, C2 est la classe de u, puisque C2 contient tous les éléments d'ordre 2. Donc |C2| = |G|/|ZU|,
si Zu est le centralisateur de u. Or Zu contient N et donc |ZU| est un multiple de |N| = 8. Il en résulte
que IC2I divise |G|/8 = 21, avec égalité si et seulement si |ZU| = 8.
(ii) Soit g G C. Si C est d'ordre n, alors le sous-groupe engendré par g est de cardinal n. Comme il est
inclus dans le centralisateur Zg de g, on a n | |ZJ, et comme |C| = |G|/|Z^|, on voit que |C| divise |G|/n,
avec égalité si et seulement si Zg est engendré par g.
(iii) On a |Ci| = 1, et il ressort des (i) et (ii) que |C2| divise 21, que |C4| divise 168/4 = 42, que |C3|
divise 168/3 = 56, et que |C7| et |C'7| divisent 168/7 = 24. Comme 168 = |G| = |Ci| + |C2| + |C4| +
|C3| + |C7| + IC7I, et comme 1 + 21 + 42 + 56 + 24 + 24 = 168, toutes les divisibilités précédentes sont des
égalités. On en déduit le résultat.
II. Table des caractères
Question 0. On a ELo^ = ér = °- 0n en déduit Que
a2 = u)2 +uA +u) + 2u>3 + 2a;5 + 2a;7 = -2 - a.
On a donc a = "** , et comme Im(a) = sin y- + sin ^ - sin f > 0, cela permet de conclure.
Question 1. (i) Xv(#) est la somme des valeurs propres de pv(g), comptées avec multiplicité, et comme
Pv(g)2 = Pv(g2) = 1> si g e C2, ces valeurs propres sont ±1, et sont donc des entiers, ce qui permet de
conclure.
(ii) Soit g e C4.ÏI résulte de la question 3 (iii) du I, que g3 G C4 et donc qu'il existe h G G tel que
(j3 = hgh~~l. On a alors pv(g)3 = Pv(g3) = Pv(hgh~l) = upy(g)u~~l, où u = pv(h). Il s'ensuit que
Pv(g)3 et pv(#) sont conjugués et donc qu'ils ont les mêmes valeurs propres avec les mêmes multiplicités.
Comme les valeurs propres de pv(g)3 sont obtenues en élevant au cube celles de pv(g)> cela prouve que
les valeurs propres de pv(g)> comptées avec multiplicité, sont stables par À ^ A3.
Maintenant, comme g est d'ordre 4, les valeurs propres de pv(#) appartiennent à {1, -1, z, -i}. Notons
a, 6, c et d leurs multiplicités respectives. Comme i3 = -z, on a c = d d'après ce qui précède, et donc
Xv(#) = a + b(—l) + ci + d(-i) = a - b G Z, ce qu'il fallait démontrer.
(iii) Les valeurs propres de pv(#) appartiennent à {1, j, j2}, où j = e2™/3 et comme g est conjugué à
g2 d'après la question 3 (iii) du I, on en déduit, comme ci-dessus, que les multiplicités de j et j2 sont les
mêmes, et comme j + j2 = -1 G Z, cela permet de conclure.
584
ANNEXE H. PROBLÈMES CORRIGÉS
(iv) Soit g e C7. Comme g est d'ordre 7, les valeurs propres de pv{g) appartiennent à {u/, 0 ^ i ^ 6}.
De plus, comme C7 est stable par g h-> g2, la multiplicité de uj est la même que celles de u)2 et u>4 et celle de
a;"1 = v6 est la même que celles de u)~2 = a;5 et a;"4 = a;3. Si on note a la multiplicité de 1, 6 celle de uj et
ccelledea;"1,onaalorsa+36+3c = dimVetxv(C7) = Xv(#) = a+b(w+u)2+v4)+c(v~l+u)-2+u;--4) =
a + ba + câ. Enfin, comme g~l e C7, et comme les valeurs propres de pv(g~l) sont les inverses de celles
de Pv(g)> on a Xv(C7) = xv(0_1) = a + bâ + col.
Question 2. Le caractère xi est le caractère de la représentation triviale.
Question 3. (i) Comme Vx est une représentation de permutation, Xvx(#) est Ie nombre de points fixes
de g, et comme les points fixes de g sont l'espace propre pour la valeur 1 privé de l'origine, on a xvx (9) = 0
si cet espace propre est nul, Xvx(#) = 1 s'îl est de dimension 1, Xvx(#) = 3 s'il est de dimension 2, et
Xvx(#) = 7 s'il est de dimension 3. On obtient donc :
• Xvx(C7) = Xvx(C7) = 0 puisque 1 n'est pas racine du polynôme caractéristique.
• Xvx(Ct3) = I? d'après la question 2 (ii) du I.
• Xvx(Ci) = 7, Xvx(C2) = 3 et xvxC^U) = 1, d'après les (iii), (iv) et (ii) de la question 2 du I.
00 9 ' J2xex axex = Y,xex <*xCg>x = J2xex ag'lx^x, et comme x h-> g"1 • x est une bijection de X, on
a J2xex <*g-l-z = Y,xex a*- 0n en déduit la stabilité de l'hyperplan V = {J2xex a*ex> J2xex ax}-
La droite A engendrée par J2xexex est ^xe Par G, et donc fournit une sous-représentation de Vx
dont le caractère est xi- Comme Vx = A 0 V, on a xv = Xvx - Xi> ce qui nous donne Xv(Ci) = 6,
Xv(C2) = 3, xv(C4) = 0, xv(C3) = 0, xv(C7) = Xv(C7) = "1-
(iii) (Xv, Xv) = îfe(62 + 21 • 22 + 42 • 02 + 56 • 02 + 24• (-1)2 + 24 • (-1)2) = 1, ce qui prouve que V est
une représentation irréductible, et comme Xv(Ci) = 6, elle est de dimension 6. Cela permet de remplir
la colonne de la table correspondant à xg-
Question 4. (i) On a Xw(tf) = |(Xg(^)2 - Xc(02))- On en déduit, en utilisant les (iii), (iv) et (v) de la
question 3 du I, que
Xw(Ci) = |(x6(Ci)2 - xe(Ci)) = 15, Xw(C2) = ^(Xc(C2)2 - Xe(Ci)) = -1,
Xw(C4) = ^(X6(C4)2 - Xg(C2)) = -1 Xw(C3) = i(X6(C3)2 - Xg(C3)) = 0,
Xw(C7) = ^(X6(C7)2 - Xg(C7)) = 1, Xw(C/7) = \(xg(C'7)2 - xeW)) = 1.
On obtient donc (xw,Xw> = ïfe(152 + 21 ' t"1)2 + 42 ' C"1)* + 56 • 02 + 24 • l2 + 24 • l2) = 2, ainsi que
(xwa6> = ïè8(15'6 + 21.(-l).2 + 42.(-l).0 + 56.02 + 24.1.(-l) + 24.1.(-l))=0.
(ii) Il résulte de la question précédente que W est somme de deux représentations irréductibles dont la
somme des dimensions est 15, et qui ne sont pas isomorphes à V6 ; en particulier, G a une représentation
irréductible de dimension ^ 8.
Par ailleurs, comme G a 6 classes de conjugaison, il a quatre autres représentations irréductibles
que Vi et Vq. Si on note a,6,c,d leurs dimensions, il résulte de la formule de Burnside que l'on a
a2 + b2 + c2 + d2 = 168 - l2 - 62 = 131. Les seules solutions de cette équation avec a ^ 8 sont
131 = 92 + 52 + 42 + 32 et 131 = 82 + 72 + 32 + 32.
La première de ces solutions est exclue car elle imposerait à W d'être la somme de Vg et d'une
représentation de dimension 9, et V6 ne fait pas partie des composantes irréductibles de W. On est donc
dans le second cas, ce qui permet de conclure.
Question 5. (i) Soient x le caractère d'une représentation de G, et p : G —> GLn(C) un morphisme
de groupes dont la représentation associée a x pour caractère. Alors p, défini en prenant les conjugués
des coefficients de p(g), est aussi un morphisme de groupes, et le caractère de la représentation associée
H.4. TABLE DES CARACTÈRES DE GL3(F2)
585
est x puisque Tr(~p(g)) = Tr(p(g)) (on aurait aussi pu prendre la représentation duale). Maintenant, on
a (X)X) = (x>x)> et donc (x,x) = 1 si et seulement si (x,x) = 1, ce qui prouve que x € Irr(G) si et
seulement si x € Irr(G). Ceci permet de conclure.
(ii) Comme il y a une seule représentation de dimension 7, on a x7 = X7> et donc X7 est réel.
(iii) On a 1 = (X7,X7> > ^|X7(C7)|2, et donc |X7(C7)| < V168/24 < 7- Par ailleurs (question 1 (iv)),
il existe des entiers a,6,c vérifiant a + 36 + 3c = 7 et a + ba + câ = X7(C7). Comme X7(C7) G R, cela
implique que b = c. On a donc deux possibilité : soit a = 7, b = c = 0, et X7(C7) = 7, ce qui est contraire
à l'inégalité |xr(Cr)| < 7, soit a = b = c = 1 et alors xWi) = X7(C7) = 1 + a + â = £j=0 u/ = 0.
(iv) Les relations d'orthonormalité des caractères impliquent (x7,Xi) = 0, (X7,Xc>) = 0 et (x7,X7) = 1.
En posant a = X7(C2), b = X7(C4) et c = X7(C.3), et en utilisant le fait que X7(Ci) = dimV7 = 7, on
en déduit les relations 7 + 21a + 426 + 56c = 0, 42 + 21 - 2a = 0 et 72 + 21a2 + 4262 + 56c2 = 168. D'où
a = — 1, 36 + 4c = 1 et 362 + 462 = 7. Comme 6 et c sont des entiers, cela nous donne 6=-letc=l, ce
qui permet de remplir la colonne de X7-
On détermine xs à partir de la formule xs = Xw - X7-
Question 6. (i) D'après la question 1 (iv), il existe des entiers a,6,c vérifiant a + 36 + 3c = 3 et
a + ba + cet = Xv(C7). Si Xv(C7) est réel, on a 6 = c, ce qui implique que 6 = c = 0 et donc a = 3. On
a alors Xv(C7) = a + bâ + ca = 3. On en déduit que (xv> Xv) ^ jgg(24 • 32 + 24 • 32) > 1, ce qui prouve
que V n'est pas irréductible.
(ii) Il résulte de la proposition précédente que x.3 n'est pas réel, et donc X3 ^ X3- Comme le seul
autre caractère de degré 3 de G est X35 °n a X3 = Xs- De plus, comme X3(Ct) n'est pas réel, on a
X3(C?) € {a, 5} et, quitte à remplacer xs par son conjugué, on peut imposer que X3(C?) = a. On a alors
X3(CÇ) = 5, X3(C7) = 5 et X3(C7) = a.
Par ailleurs, X3(Ci), X3(C2), X3(C4) et X3(C3) sont réels, puisque entiers. On a donc X3(Ci) = XaCCi),
X3(C2) = XîjCQz)) X3(C4) = XsCQ) et X3(C3) = XsCQ*)- On termine de remplir la table en utilisant le
fait que xi + 3x3 + 3x3 + ^Xc + 7x7 + 8xs est le caractère de la régulière.
Question 7. (i) D'après la question 4 (v) du I, le centralisateur de h est le sous-groupe engendré par /i,
qui est isomorphe à Z/7Z. Il en résulte que tout élément g ^ 1 de ce centralisateur, en est un générateur,
et donc que h est une puissance de #, si g ^ 1 est dans le centralisateur de h. La réciproque étant évidente,
cela permet de conclure.
(ii) Comme Y est une représentation de permutation, Xy(#) est le nombre de points fixes de g. Or
ghg~l = h si et seulement si g est dans le centralisateur de h.
Si g = 1, c'est toujours le cas, et on a xy(Ci) = |C7| = 24.
Si g ^ 1, il résulte du (i) que c'est le cas si et seulement si h est une puissance de g. Autrement dit,
on est amené à compter le nombre de puissances de g appartenant à C7, ce qui nous donne :
• Xy(C2) = Xy(C4) = Xy(Cs) = 0 car un élément d'ordre 2, 3 ou 4 ne peut pas être la puissance d'un
élément d'ordre 7,
• Xy(C7) = 3 (<?, g2, g4 G C7, si g G C7) et xy(C7) = 3 (g'1, g~2, g-4 G C7, si g G C'7).
On a xy = Xi + X7 + 2xs, ce qui prouve que Y est isomorphe à Vi © V7 © 2V8.
(iii) Les vecteurs fx#, fx2y/3 et fx4y/3 sont colinéaires, et on a g • fx# = fgXg-ly/3- D en résulte que
l'espace Yp engendré par les fXyp, pour x G C7, est un espace de dimension < 8, stable par G. De plus,
l'espace engendré par fXyp, fx2^ et fx4^ est le même que celui engendré par ex,ex2 et ex*. On en déduit
que Y = Yi + Y, + Y^-2, et donc, pour des raisons de dimension, que Y = Yi © Y, © Y^-2.
Maintenant, Yi peut se décomposer comme la somme directe de la droite Wi engendrée par J2xec7 e*
et de l'intersection W7 de Yi avec l'hyperplan des J2xec7 axe* avec ^xec7 ax = 0> ^ sont stables par
586
ANNEXE H. PROBLÈMES CORRIGÉS
G pour les raisons habituelles. En posant Yj = W8 et Y^2 = W£, cela nous fournit la décomposition de
Y cherchée.
Question 8. Soit H un sous-groupe distingué de G, distinct de G. Si on note G7 le quotient G/H,
et si V est une représentation irréductible non triviale de G7, alors V peut aussi être vue comme une
représentation de G en faisant agir g e G par son image dans G7. Cette représentation est irréductible
puisque l'ensemble des g • v, pour g e G, est celui des g1 • v, pour g' e G7, et que cet ensemble engendre V,
pour tout v ^ 0. Le caractère xv prend la valeur dim(V) = Xv(Ci) sur H. Or le seul élément de Irr(G)
pour lequel il existe C ^ Ci avec x(C) = x(Ci) est Xi- On en déduit que H = 1, et donc que G est simple.
H.5. COEFFICIENTS DE FOURIER DES FONCTIONS CONTINUES 587
H.5. Coefficients de Fourier des fonctions continues
L'objet de ec problème est de montrer que les coefficients de Fourier d'une fonction de L1(R/Z)
tendent vers 0 (version discrète du th. de Ricmaim-Lcbcsgue), mais qu'une suite tendant vers 0
n'est pas forcément la suite des coefficients de Fourier d'un élément de L1(R/Z).
Partie 1. Notons E l'espace ^(R/Z) muni de la norme <x>>
et notons F = L^R/Z) le complété
de E pour la norme || ||i définie par ||/||i = /0 \f(x)\ dx. Enfin, soit E* le dual de E, muni de la
norme du dual notée || ||e*-
(i) Si f,g G E, on pose Af(g) = /0 f(x)g(x)dx. Montrer que g i-> Af(g) définit un élément
de E*, et que / ■-* A/ est linéaire continue de E, muni de la norme || ||i, dans E*.
(ii) En déduire que / ■-»• A/ se prolonge de manière unique en une application linéaire continue
de F dans E*.
(iii) Si n G N — {0}, soit <f>n : R —> [— 1,1] la fonction impaire continue, définie pour x ^ 0,
par <f>n(x) = 0, si x < l/2n, (f>n{x) = 2nx -_1, si l/2n ^ x ^ 1/n, et <f>n(x) = 1, si x ^ 1/n. Soit
/ G E - {0}. Soit gn définie par gn(x) = j$$i<MI/(*)l), » /(*) ï 0, et gn(x) = 0, si f(x) = 0.
Montrer que gn G E, et que ||<7n||oo = 1, si n est assez grand.
(iv) Soit hn = \f\-gnf- Montrer que HMaOHoo < n- En déduire que ||A/||E* = ||/||i.
(v) Montrer que / i-> Ay est une isomôtrie de F dans E*.
Partie 2. Si n G Z, et si / G F, soit Cn(f) = A/(e_2i7rna:), et soit c(f) la suite (c„(/))neN-
(i) Montrer que / i-> c(f) est linéaire continue de F dans i°°(Z) (muni de || ||oo).
(ii) Montrer que l'espace £^(Z) des suites tendant vers 0 quand \n\ —► +oo est fermé dans ^(Z).
(iii) Montrer que l'espace Trigo des polynômes trigonomôtriques est dense dans F.
(iv) En déduire que l'image de F par / i-> c(f) est incluse ^o°(Z).
(v) Montrer que, si c(f) = 0, alors A/ = 0. En déduire que / ■->• c(f) est injective.
(vi) Soit Sk(x) = sia^J"X = Et-^2"""- Montrer que ||c(S*)|U = 1 et ||S*||, - +00
quand k - +00. (On montrera que 13*1, > Y%îl jff if/pL-D 'Sgggg1 *>■)
(vii) En déduire que / ■-> c(f) n'est pas une surjection de F sur ^q°(Z).
Corrigé
Partie 1.
(i) La linéarité de g »-» A/(#) résulte de la linéarité de l'intégration. De plus,
|A/fo)| ^ fl\f(t)\\9(Jt)\dt<\\g\U f1\f(t)\dt = \\f\\1\\g\U
Jo Jo
On en déduit la continuité de A/ (et donc son appartenance à E*), ainsi que la majoration ||A/||e* < ||/||i-
Enfin, comme / h+ A/ est linéaire, par linéarité de l'intégration, cette majoration montre que / h-> A/
est continue, de E (muni de la norme || ||i) dans E*.
(ii) La question précédente montre que l'application linéaire / *-+ A/ est continue de E muni de la norme
de F dans E* qui est complet (th. IL 1.28). Comme F est le complété de E, le résultat suit du (ii) de la
prop. II.1.18.
(iii) Si f(xo) = 0, on a \f(x)\ < ^ et donc gn(x) = 0 dans un voisinage de #o, la fonction gn est donc
continue en xq. Si f(x0) ^ 0, alors gn est continue comme produit de composées de fonctions continues.
588
ANNEXE H. PROBLÈMES CORRIGÉS
Comme gn est périodique de période 1 si / l'est, on a gn € E. Par ailleurs, ||</»n||oo ^ 1 par construction, et
donc Htfnlloo < 1, et comme \gn(x)\ = 1, si \f(x)\ ^ £, on en déduit que ||pn||oo > 1 (et donc ||0„||oo = 1),
(iv) On a hn(x) = 0 si \f(x)\ ^ £, et \hn(x)\ ^ \f(x)\, si \f{x)\ < £. On en déduit la majoration
IM*)I < i et \Iohn(x)dx\ < I. Or IJJ *»(*)<**! = lll/lli - A/WI, et donc \Af(gn)\ > \\f\U - JL.
Comme ||^n||oo = 1 si n est assez grand, on en déduit, en passant à la limite, la minoration ||A/||e* ^ 1.
Comme la majoration ||A/||e* ^ 1 est immédiate (et a déjà été démontrée), on a ||A/||e* = 1.
(v) / y-+ H/lli est continue sur F par définition de F. Par ailleurs, / »-» ||A/||e* est la composée de / ■-► A/
qui est continue de F dans E*, et de A i-* ||A||e* qui est continue sur E* ; elle est donc continue. Comme
les deux applications continues / »-» ||/||i et / »-» ||A/||e* coïncident sur E qui est dense dans F, elles
sont égales, ce qui montre que / ■-► A^ est une isométrie de F dans E*.
Partie 2.
(i) La linéarité de / ~ c(f) résulte de celle de / -> A/. De plus, |c„(/)| < ||A/||E* ||e-2iwnx||oo = ||/||i,
si n € Z, et donc ||c(/)||00 ^ ||/||i. On en déduit l'appartenance de c(f) à £°°(Z) et la continuité de
(ii) Soit d® = (en )nez5 pour fceN, une suite d'éléments de ^o°(Z) ayant une limite c = (cn)nGZ
dans £°°(Z). Soit e > 0. Comme c<fc) -> c, il existe k tel que \\c^ - c||oo < |, et comme c(A;) G ^8°(Z), il
existe N G N tel que \&k)\ ^ §, si |n| ^ N. On a alors \cn\ < |cP| + |cP - cn\ < |cJfB>| + ||c<*> - c||oo < e,
ce qui prouve que Cn tend vers 0 quand \n\ —> +00, et donc que c G £ç?(Z). Ceci permet de conclure,
(iii) Soient g G F et e > 0. Comme E est dense dans F, il existe / G E avec ||<7 - /||i < §. Par ailleurs
comme Trigo est dense dans E, d'après le théorème de Stone-Weierstrass ((iii) de l'ex. II. 1.10), il existe
P G Trigo vérifiant ||/ - P^ < f. On a alors ||/ - P||x = £ \f(t) - P(t)| dt < ||/ - PU» < f, et donc
||<7 - P||i < £- Ceci permet de montrer que Trigo est dense dans F.
(iv) Si P G Trigo, cn(P) = 0 sauf pour un nombre fini de n; en particulier, c(P) G £ç?(Z). Maintenant,
si / G F, il existe une suite (P/OfceN d'éléments de Trigo tendant vers / dans F. Comme g h-> c(g) est
continue, c(Pfc) —> c(f) dans £°°(Z), et comme £ç?(Z) est fermé dans £°°(Z), et que chacun des c(P^) est
dans ^o°(Z), il en est de même de la limite c(/).
(v) Si c(f) = 0, alors A/(P) = 0, quel que soit P G Trigo. Comme Trigo est dense dans E et A/ est
continue sur E, cela implique A/ = 0. On a donc 0 = ||A/||e* = ||/||i, ce qui prouve que / = 0 et donc
que le noyau de f ^ c(f) est réduit à 0, ce qui permet de conclure.
(vi) On a cn(Sfc) = 1 si \n\ < fc, et cn(Sfc) = 0, si \n\ > k. On en déduit que ||c(Sfc)||oo = 1- Par ailleurs,
comme 0 < sin7nfc < nt, si t G [0,1], on a
et comme la somme des ^ diverge, cela permet de conclure.
(vii) Si / h-> c(f) est une surjection de F sur ^o°(Z), alors c'est une bijection (d'après le (iv)), continue
(d'après le (i)), et comme F et ^j°(Z) sont des espaces de Banach, son inverser est continue (cor. IL 1.26).
Il existe donc C > 0 tel que ||rx(c)||i < C||c||oo, si c G ^o°(z)- En appliquant ceci à c = c(Sfc), on en déduit
que ||u(c(Sfc))||i = ||Sfc||i < C||Sa:||oo = C, quel que soit A; G N, ce qui est en contradiction avec la
question (v).
H.6. FONCTIONS D'HERMITE ET TRANSFORMÉE DE FOURIER DANS L2 589
H.6. Fonctions d'Hermite et transformée de Fourier dans L2
Ce problème fournit une définition de la transformée de Fourier dans L2(R) en passant par la
construction d'une base hilbcrtieime de L2(R).
Partie 1. Soit E l'espace ^C°°(R) muni de la norme || ||oo. On munit le dual E* de E de la norme
|| ||e* du dual.
(i) Soit / G .Sf^R). Montrer que <f> •-► Af(<p) = /R /(t)(f>(t) dt définit un élément de E* qui
ne dépend que de l'image de / dans L1(R), et que l'application / ■-»• A/ ainsi définie est linéaire
continue de LX(R) dans E*.
(ii) Soit / G Esc(R). On écrit / sous la forme / = Etel0*»-^ ^Un ou * c ^ est ^m' ^cs ^
sont distincts et a* ^ 0, si i G I. Soit <f>n : R —> [0,1] de classe ^°°, nulle en dehors de [0,1] et
valant 1 sur [1,1 - ±]. Soit gn = £iGl jg[<£n(2ra; - h*). Montrer que £ |1 - ct>n{t)\ dt ^ g. En
déduire que A/(tfn) -> ||/||i quand n -► +oo, et que ||A/||e* = ||/||i-
(iii) Soit / G L1(R). Montrer que ||A/||e* = ||/||i- En déduire que si JKf<f> = 0, pour tout
<j> G E, alors / = 0.
Partie 2. Injectivité de la transformée de Fourier dans L1.
(i) Soit <t> G E.
(a) Soit t0 G R. Montrer que, si A > 0, alors f\(x,t) = e-AMe-2i7r*(t-to)0(£) est sommable
sur R2. En déduire la formule.
J-oo WR l+<*2
(b) Montrer que ± /R Jfo+jy*") du tend vers <£(*o) quand A -► 0.
(c) Montrer que 0 est sommable et que f^£ e~x^e2twtoXj>(x) dx —> #<f>(to) quand A —► 0.
(d) Montrer qu'il existe g G L*(R) tel que <f> = g.
(ii) Soit / G LX(R) vérifiant / = 0. Montrer que fKf<t> = 0 quel que soit (f> G E. En déduire
que / = 0.
Partie 3. Fonctions d'Hermitc. On rappelle que /Re_,rt dt = 1.
(i) Montrer que {$i)ne~ = e_27rf2Hn(i), où Hn est un polynôme de degré exactement n
dont on calculera le coefficient dominant.
(ii) On définit *n par la formule *n(i) = e-**Kn(t). Montrer que (#n, *m) = 0, si n ^ m,
et calculer (^n,*n) (on fera une intégration par partie).
(iii) Montrer que, si 4>i,<h G L2(R), alors <f>i(f>2 G LX(R).
(iv) Soit / G L2(R) et soit g définie par g(t) = e~nt f(t). Montrer rapidement que tng(t) et
e2n\tx\g(t) sont sommables, quels que soient n G N et # G R. En déduire que, si a; G R,
n »
nm y;/
^ ^-i-g(t)dt = g(x).
(v) On suppose / orthogonale à tous les \I>n. Montrer que g = 0, puis que / = 0.
(vi) Montrer que le sous-espace engendré par les *n, pour n G N, est dense dans L2(R).
590
ANNEXE H. PROBLÈMES CORRIGÉS
(vii) Soit en = (Htfnlh)"1^. Si / G L2(R), soit A(/) la suite (an(/))neN, où an(f) = (en,/).
Montrer que A(/) e £2 et que A est une isométiïe de L2(R) sur £2.
Partie 4. Transformée de Fouiïer dans L2(R).
(i) Montrer que $o est <^°° sur R, et vérifie l'équation différentielle $'0(x) = —2ttx^o(x). En
déduire que #0 = *0-
(ii) Montrer que Vn+i(t) = V'n(t) - 2irtVn(t). En déduire que *n = (-î)n#n, si n G N.
(iii) Soit g l'application (an)n€N •-* ((—«)nan)neN- Montrer que a est une isométrie de £2
sur ê2.
(iv) Montrer qu'il existe une unique application linéaire continue «^2 '• L2(R) —► L2(R), telle
que <^2(*n) = *n, quel que soit n G N, et que ^2 est une isométrie.
(v) Montrer que «^2 ° &2 = s, où (s(<f>))(x) = <p(—x) p.p.
Corrigé
Partie 1.
(i) La linéarité de 0 ^ A/(0) résulte de la linéarité de l'intégration. Maintenant,
|A/(0)| < f |/(0I W)\ dt < ||0||oo / 1/(01 dt =
Jo Jo
On en déduit la continuité de A/ (et donc son appartenance à E*), ainsi que la majoration ||A/||e* < ||/||i-
De plus / f-> A/ est linéaire, par linéarité de l'intégration, et A/ = 0, si / est nulle p.p., ce qui montre
que A/ ne dépend que de l'image de / dans L1(R). Enfin, la majoration ci-dessus montre que / h-> A/
est continue, de L*(R) (muni de la norme || ||i) dans E*.
(ii) La majoration J^ |1 - <f>n\ < \ est immédiate. On a (|/| - gnf)(t) = £iGI HUlo.M ~ 0n)(2r* - h),
et comme f* |l(0,i[ ~ 4>n\ < h on en déduit <lue I/rI/I " 9nf\ < £EiGi2~~rN = îll/lli- Comme
/r l/l - Pn/ = ll/lli - A/(£n), cela montre que Af(gn) -> ||/||i quand n -> +00.
Comme ||0n||oo = 1 par construction, on en déduit la minoration ||A/||e* ^ 11/111? et comme la
majoration ||A/||e* < ||/||i est immédiate, cela permet de conclure.
(iii) / h-> ||A/||e* est continue sur L*(R) d'après la question (i), et f ^ ||/||i aussi, par définition. Or
ces deux fonctions coïncident sur Esc(R) d'après la question (ii), et comme Esc(R) est dense dans L*(R)
(th. III.2.11), elles sont égales sur L*(R) tout entier; autrement dit, ||A/||E* = ||/||i, quel que soit
/ G L*(R). Maintenant, si /R /0 = 0 quel que soit 0 G E, alors A/ = 0 et donc ||A/||E* = 0 ; on en déduit
que H/lli = 0, et donc que / = 0.
Partie 2.
(i) (a) On a \f\(x,t)\ = e~A'xl|0(£)|, et donc, d'après le th. de Fubini pour les fonctions positives,
j^J/A(*,*)|=j^(j^C-A|XH0(OI^)* = J^fl0(t)l*=fll
||l < +OO,
ce qui prouve que fx est sommable. On peut donc appliquer le th. de Fubini pour calculer /R2 fx de deux
manières différentes, ce qui nous donne :
f fx= f { f e-xWe-2i*<i-to)<t>{t)dt)dx= f e-xWe2iirt0X4>(x)dx
Jn? Jk Jr Jk
et le résultat suit en faisant le changement de variable t = to + -à-u.
H.6. FONCTIONS D'HERMITE ET TRANSFORMÉE DE FOURIER DANS L2 591
(b) Wo+W-1^) est majoré en module par J}^», qui est sommable. Comme A *-+ cf>(t0 + (2^)"^^)
est continue pour tout u G R et vaut 0(£o) pour A = 0, le th. de continuité d'une intégrale dépendant
d'un paramètre (th. IV.1.1) montre que J /R +to+(ffilW du^L^^du = ^to^ quand A _^ 0.
(c) Comme 0 est en particulier de classe So2 et à support compact, il résulte du (i) du th. IV.2.8 que
(1 + x2)<j>(x) tend vers 0 à l'infini, et comme 0 est continue d'après le th. IV.2.7, elle est sommable.
Maintenant, e~x^e2tntoX4>(t) est majoré en module par |0|, quel que soit A > 0, ce qui permet de déduire
du th. de continuité d'une intégrale dépendant d'un paramètre que fKe'~x^e2intoX4>(x)dx tend vers
/RlimA_0+ (e-AMe**to*0(aO) dx = /R e2^°*0(x) cte = ^0(*o)> Quand A -> 0.
(d) D'après ce qui précède, on a 0 = g, où g est la transformée de Fourier de t ^ 0(-£)> Qu* est
sommable d'après le (c).
(ii) Si 0 G E, il existe g G LX(R) tel que 0 = g d'après le (d) de la question (i). Or, d'après la prop. IV.3.24,
on a /R/0 = /R/ g = fKf g- En particulier, si / = 0, alors /R/0 = 0, quel que soit 0 G E. D'après la
question (iii) de la partie 1, ceci implique / = 0.
Partie 3.
(i) Si (i)ne-2"t2 = e-2^2Hn(i), alors (£)n+1e-2^2 = e-2^Hn+1(i), avec Hn+1(i) = H'n(t)-*irt}ïn(t).
Comme H0 = 1, une récurrence immédiate montre que Hn est un polynôme de degré exactement n de
coefficient dominant (—47r)n.
(ii) Supposons m < n. On a
/+oo /»+oo j
e-™ Hn(*)Hm(*)dt = J_ ((jt)ne-2irt )Hm(*)dt.
En utilisant le fait que [P(t)e~2irt2]±™ = 0, si P est un polynôme, on obtient, après une intégration par
partie,
«, ((|)B"le"a'rt)Hi»(*)* = (-l)nyoo e-™U%\t)dt.
En particulier, si m < n, alors H^ = 0 et (\I>n, \I>m) = 0, et si m = n, alors H™ = n!(-47r)n, et donc
(*n> *n> = n!(4ir)» JKe'^ dt = 2!$£.
(iii) On a /R |0i02| < (/R l0i|2)1/2(/R |02|2)1/2 d'après l'inégalité de Cauchy-Schwarz, ce qui montre que
si 0i et 02 sont de carré sommable, alors 0102 est sommable.
(iv) Les fonctions £ne_7r* , pour n G N, et e2n^e~nt , pour x G R, sont de carré sommable; on déduit,
en utilisant la question (iii), que les tng(t) et les e2ir^g(t) sont sommables. Maintenant,
| £ t^tgm < wt), g (M . ^mmit
k=o K' h=o
et comme t h-> e27r'x*l|<7(É)| est sommable, on peut appliquer le théorème de convergence dominée, et
intervertir limite et intégrale, ce qui nous donne
(v) Comme ^n(t) = e~nt Hn(£), où Hn est un polynôme de degré exactement n, l'espace vectoriel
engendré par les \I>n est l'espace des e_7r* P(£), où P est un polynôme. Donc, si / est orthogonale à tous
les *n, on a /R/(£)e_7r*2P(£)d£ = /RP(*)^(*)rf* = °> Quel Que soit le polynôme P. Tous les termes du
membre de gauche de l'identité de la question (iv) sont donc nuls, et donc g = 0. Il résulte alors de la
question (ii) de la partie 2 que g = 0, et donc que / = ent g = 0.
592
ANNEXE H. PROBLÈMES CORRIGÉS
(vi) L'adhérence F de F est un sous-espace fermé de L2(R). Si F est strictement inclus dans L2(R), son
orthogonal est non nul (cf. prop. II.2.11 (ii)), ce qui contredit la question (v). Ceci permet de conclure,
(vii) Il résulte des questions (ii) et (vi) que les en, pour n € N, forment une base hilbertienne de L2(R).
Le résultat est donc une conséquence directe du (ii) du th. II.2.6.
Partie 4.
(i) Quel que soit A; € N, la fonction (1 + t2)k/2il>a(t) est sommable, et donc *0 est de classe if*
((ii) du th. IV.2.8). De plus,
/+oo
{-2mt)e-2inxte-1(t dt
-OO
/»+oo
=[ie-*1 c-21**']!* - / ie~nt {-2inxe-2inxt)dt = -2wxV0{x).
J —oo
On en déduit l'existence de a G C tel que #o(#) = ae"wx , et comme #o(0) = ^e^ dt = 1, on a
a = 1, ce qui permet de conclure.
(ii) *n+1(t) = e^dr+te-2** = ^(e^2(^)ne-2^2)-27rte^2(^)-e-2^2 = 9'n{t)-2nMn(t). Comme
d'après le th. IV.2.8, on a &(V'n)(x) = 2inxVn(x) et &(2ntVn(t))(x) = i$'n(x), on obtient :
fcn+iO*) = 2inx4tn{x) - i*'n{x) = (-i)(*'n(*) " 2nx4tn(x)).
On en déduit que in$n et \I>n vérifient la même relation de récurrence, et comme #0 = *o» on a
in$n = \I>n, pour tout n, ce qui permet de conclure.
(iii) C'est immédiat.
(iv) L'unicité résulte du fait que l'espace engendré par les \I>n est dense (partie 3, question (vi)). Pour
l'existence, il suffit de poser ^ = A""1 o a o A, où A est l'application définie à la question (vii) de la
partie 3, ce qui réalise &2 comme la composée de trois isométries surjectives, et montre que &2 est une
isométrie de L2(R) sur L2(R).
(v) Comme &2 ° &i et s sont linéaires et continues, il suffit de prouver qu'elles coïncident sur une base
hilbertienne, par exemple celle des en, pour n G N. Or &2 ° &2(en) = (-i)n^2(en) = (-l)nen d'après
la question (ii), et par ailleurs s(en) = (-l)nen car e~~2lTt est une fonction paire, ce qui montre que
\&n = ent ^e"2lTt est une fonction paire si n est pair et impaire si n est impair.
H.7. TRANSFORMÉE DE FOURIER ET CONVOLUTION
593
H.7. Transformée de Fourier et convolution
Ce problème est une variation sur le thème Fourier-Poisson. On rappelle que /Re-7nc dx = 1.
On ne demande pas de vérifier la mesurabilitc des fonctions rencontrées, celle-ci étant
automatique d'après Solovay.
Question 1. Soient f,g G J&f1 (**•)•
(i) Montrer que /R2 \f(x - y)g(y)\dxdy = ||/||iWi.
(ii) Montrer que, pour presque tout xeRla fonction y i-> f(x — y)g{y) est sommablc, que la
fonction / * g définie par / * g(x) = /R f(x — y)g(y) dy, si l'intégrale converge, et / * g(x) = 0
sinon, est dans J&f^R), et que ||/*p||i ^ ||/||iN|i-
(iii) Montrer que si /i = $2 p.p. et si g\ = #2 PP-, alors /1 * pi = /2 * 02 PP-
(iv) Montrer que les fonctions continues / *g et fg sont égales. (On introduira la fonction
H(£,2/) = e~2zntxf(t — y)g(y), et on justifiera soigneusement les étapes du calcul.)
(v) Existc-t-il une fonction <j> : R —» R+, de classe ^?°° à support compact, non identiquement
nulle, telle que (j> soit à valeurs dans R+ ?
Question 2. Soit fa = lr=i !]•
(i) Montrer qu'il n'existe aucune fonction continue sur R qui soit égale à fa P-P-
(ii) Montrer que, si / G J$f1(R), alors fa* f est une fonction continue sur R.
(iii) On définit par récurrence fa, par fa+i = fa * fa-, si k ^ 1. Montrer que fa est continue
et paire, pour tout k ^ 2.
(iv) Calculer fa, pour tout k. Pour quelles valeurs de k la fonction fa est-elle sommablc?
Quelle est alors sa transformée de Fourier ?
(v) Montrer que fa est de classe fé*-2, pour tout k ^ 2.
(vi) Calculer fa. En déduire la valeur de X)meN (2m+i)2 » Pu*s cc^c ^c C(2) = Zm^i W' (®n
pourra considérer f(t) = fa{\).)
(vii) Que faudrait-il faire pour démontrer avec ce genre de méthodes que 7r-2m£(2m) G Q,
pour tout m ^ 1 ? (On demande juste d'établir une stratégie, pas de mener à bien les calculs.)
Question 3. Si a > 0, soit V'o : R —► R définie par ipa(%) = e~nax . On remarquera que V»o £ &'•
(i) Montrer que Vo * V>6 = 7=^06/(0+6)-
(ii) Montrer que fa(x)k = ^(yfkx), pour tous x G R et A; G N.
(iii) Montrer que ^1 est à valeurs réelles.
(iv) Montrer qu'il existe a G R tel que Vi(#) = e~nax pour tout a; G R.
(v) Montrer que a > 0, puis que a = 1.
Question 4. (i) Montrer qu'il existe e > 0 tel que \^^\ < 1 - eu2, si |u| ^ 3.
(ii) Montrer que |0ik(^) | ^ sup (e~ex , j^z), pour tous k ^ 4 et x G R.
2 .2
(iii) Soit /jfc la fonction définie par fk(x) = 4>k(-jr), et soit / donnée par f(x) = e~^~'.
Montrer que fk tend vers / dans LX(R).
(iv) Soit gk la fonction définie par gk(x) = y/kfa(y/kx). Montrer que g^ tend uniformément
sur R vers une fonction g que l'on déterminera. Ce résultat vous ôvoque-t-il quelque chose ?
594
ANNEXE H. PROBLÈMES CORRIGÉS
Corrigé
Question 1.
(i) D'après le th. de Fubini pour les fonctions positives ((ii) du th. III.3.3), on a
/ \f(x-y)g(y)\dxdy = f ( / \f(x-y)g(y)\dx)dy.
Jn? Jr Jr
Le changement de variable t = x -y dans l'intégrale entre parenthèses nous donne alors
/ \f(x-y)9(y)\dxdy= f ( / \f(t)g(y)\dt)dy= f \\f\U \g(y)\dy = ||/||iN|i.
./r2 Jr Jr Jr
(ii) D'après le (i), la fonction h(x,y) = f(x - y)g{y) est sommable sur R2 et donc, d'après le théorème
de Fubini ((i) du th. III.3.3), pour presque tout x la fonction y ■-► h{xyy) est sommable sur R, et
x •"* /r h(x, y)dy = f* g(x) p.p. est sommable.
De plus, |/ * g(x)\ < /R \h(x,y)\ dy pour tout x et donc ||/ * ^||i ^ /R (/R \h(x,y)\ dy) dx. Or cette
dernière quantité vaut ||/||i||<?||i, d'après le th. de Fubini pour les fonctions positives et le (i).
(iii) En dehors de l'ensemble de mesure nulle où l'une des intégrales diverge, on a /i * g\ - /a * g-i =
(/i - h) * 9\ + h * (9i ~ 92)- On en déduit, en utilisant le (ii), la majoration ||/i * gx - /2 * gj\i ^
||/i - /2II1IMI1 + H/2II1II01 - P2II1. Or le second membre est nul puisque ||/i - /2||i = \\g\ - p2||i = 0.
On conclut en utilisant le fait que ||/||i = 0 équivaut à / = 0 p.p.
(iv)
JTg{x)= f e-2i«t*f*g(t)dt= f ( / e"2-te/(t - y)g(y)dy) dt.
JK JK «/R
Soit H(i,y) = e-2ilTtxf(t - y)g(y). On a |H(i,t/)| = \f(t - y)g(t)lj^qui fait que H est sommable sur R2
d'après le (i). On peut donc utiliser le th. de Fubini pour obtenir / * g(x) = /R2 e~~2intxf(t - y)g(y) dydt.
On fait alors le changement de variable y = u, t = u + v dont le jacobien est 1, ce qui nous donne
/ *g(x) = /R2 e~~2i7r(u+v)x f(u)g(v) dudVy la fonction à intégrer étant sommable d'après le th. III.3.9. On
conclut en utilisant la formule e~~2i7r (u+v)x = e-2™uxe-2invx et je ^ ^ p^bi^ ce qUj nous donne
f^g(x) = f ( / e-2i"uxe-2i"vxf(u)g(v)du)dv= f f(x)e-2i*vxg(v)dv = f(x)g(x).
Jk Jk Jk
(v) Partons de </>0 • R —> R+, de classe Sf°° à support compact, non identiquement nulle. Notons <\>\
la fonction définie par (f>i(x) = <t>o(-x)> et considérons <\> = fà * 4>\. Le changement de variable t »-► -t
dans l'intégrale définissant fa montre que l'on a (f>i(x) = <£o(#) pour tout a; G R. On en déduit que
}(x) = \<f>o(x)\2 est à valeurs dans R+.
Il reste à vérifier que <f> est à valeurs dans R+ (ce qui est immédiat sur sa définition puisque <f>o et (f>i
le sont), que <f> est à support compact (si <f>0 est nulle en dehors de [-M,M], il en est de même de </>i,
et <f>o(x - y)(f>\{y) est identiquement nulle sur R si x £ [-2M,2M], ce qui prouve que <f> est à support
dans [-2M, 2M]), et que <f> est Sf °° (ce qui résulte de ce que 0 = *^"0 appartient à S? puisque <j> = 0o0i
appartient à S? comme produit de deux fonctions de S? ; on peut aussi utiliser le th. de dérivation sous
le signe somme (th. IV. 1.2) pour vérifier que / * g est ^°°, si / G «£°(R) et g G L^R)).
Question 2.
(i) Si g = 0i p.p., alors tout voisinage de \ contient un ensemble de mesure non nul (et donc non vide)
sur lequel g = 1 et un autre sur lequel g = 0. On en déduit que g ne peut pas être continue en |.
(ii) On a 0i * f(x) = Jnh(xyy)dyy avec h(xyy) = l^^(x - y)f(y). Maintenant,
• x »-► h(x, y) est continue en x0 sauf si y = x0 + \ ou y = x0 - 5,
• \h(x>y)\ ^ \f(y)\ Qui est sommable et indépendante de x.
H.7. TRANSFORMÉE DE FOURIER ET CONVOLUTION
595
On est donc sous les hypothèses du th. IV. 1.1, ce qui prouve que fa * / est continue en x0 et donc
sur R puisque x0 est arbitraire.
(iii) Que fa soit continue suit, par récurrence, du (ii). La parité de fa se démontre aussi par récurrence
en faisant le changement de variable t = -y dans l'intégrale définissant fa * fa(-x) : en effet, on a
fa+i(-x) = fn<f>i(-x ~ y)<t>k{y)dy = /R0i(-a: + t)fa(-t)dt = fn<f>i(x ~ t)4>k(t)dt puisque fa et fa
sont paires. Comme la dernière intégrale vaut fa+i(x), cela prouve que fa+\ est bien paire,
(iv) On a fa(x) = J_!(/2 e"2*™' dt = ^[e'2inxt)l^/2 = sùle*. Une récurrence immédiate utilisant le
(iv) de la question (i) montre que fa(x) = (^r) •
La fonction fa est sommable si fc ^ 2 car continue et O(^) à l'infini. La formule d'inversion de Fourier
dans L1 (prop. IV.3.25) appliquée à fa nous donne &fa{x) = fa(-x), et comme fa est paire, on en
déduit que la transformée de Fourier de fa est fa.
La fonction fa n'est pas sommable. En effet, si elle l'était, sa transformée de Fourier serait <f>\ (dans L1)
par le même argument que ci-dessus, et comme il n'existe pas de fonction continue égale h fa p.p., cela
contredit le th. de Riemann-Lebesgue.
(v) (1 4- \x\2)k~2/2fa(%) est un O(^) au voisinage de l'infini, et donc est sommable. Il en résulte, grâce
au (ii) du th. IV.2.8, que la transformée de Fourier de fa est de classe Sf *~2, et comme cette transformée
de Fourier est fa d'après le (iv), cela permet de conclure.
(vi) faix) est la longueur de l'intervalle [^, |] n [x - \,x 4- 5]. On a donc fa(x) = 0, si \x\ ^ 1 et
fa(x) = 1- |x|,si |g| ^ 1.
Soit f(t) = <fo(5)- Alors / est de classe tfl (et même Sf°°) et / et /' sont des O(^) au voisinage de
l'infini. On peut donc lui appliquer la formule de Poisson du th. IV.3.18. Comme f(x) = 2*^02(2a;) =
202(2x), cette formule devient 2Yfnezfa(2n) = £n6Z02(f ). Dans le membre de gauche, le seul terme
non nul est ^2(0) = 1, et dans le membre de droite, seuls 0 et les entiers impairs contribuent, et la formule
devient :
2 = 1+ £.(^ = 1 + J?£(2^T3r etdonc E(2^W = T-
n impair v ' ' mGN v ' m€N v '
Pour en déduire X)n>i n*> on ^C1^ n sous *a f°rme 2fc(2m 4-1), ce qui nous donne :
y-l= y- _i 1 = (V_i_wy- - u-L-^ = ^
^n2 fc^M22*(2m + l)2 K f-f> 22fc A ^ (2m + l)2' l-{ 8 6'
(vii) Il suffirait de prouver que <f>k(2n) G Q et est nul sauf pour un nombre fini de n G Z. Or il n'est
pas très difficile de prouver que fa est nulle en dehors de [^, §], et est un polynôme, de degré fc - 1, à
coefficients dans Q, sur chaque intervalle de la forme [^ 4- i> ^ + i 4-1], pour i G {0,..., fc - 1}.
Question 3.
(i) fa * fa{x) = ^e-'W1-^2) dt. Or a(x - t)2 + bt2 = (a + b)(t- ^)2 + ^x2, et on déduit le
résultat en faisant le changement de variable u = -~t=t^ (t- ^) et en utilisant la formule JR e~~™ du= 1.
(ii) On note %l)\k la fonction fa * • • • * fa (fc facteurs). Alors, d'après le (iv) de la question 1, ^f est la
transformée de Fourier de VJ^. Or on vérifie, par récurrence sur fc, en utilisant le (i), que ipïh = -^Vi/fc,
et comme il>\/k{x) = ^i(77ju)> *a formule pour les dilatations permet de conclure.
(iii) La fonction fa étant paire, on a fa(x) = f*°°(e~2i7rxt + e2inxt)fa(t) dt comme le montre un
changement de variable t h-> -t sur ] - oo,0] dans l'intégrale définissant fa(x). La fonction intégrée étant réelle,
cela permet de conclure.
596
ANNEXE H. PROBLÈMES CORRIGÉS
(iv) D'après le (ii), on a i)\{x) = ^i(-Tf) > pour tout fc ^ 1. L'appartenance de Vi à y implique que
Ûi est de classe <éf°° sur R (cor. IV.3.17). En particulier, elle a un développement limité de la forme
<ij)i{x) = 1 + ax + (3x2 + o(x2) en 0 (on a ipi(0) = /Re"ïït2 dt = 1). En passant au logarithme dans
l'identité i)\{x) = ^i(-yr) > et en faisant tendre fc vers +oo, on en déduit que a = 0 (ce qui peut
aussi se déduire de la parité de Vi)> et log^i(x) = limfc_>+00 fclog (l + ft\ + o{\)) = fix2. On a donc
i>i(x) = e"nax2, avec a = =&.
(v) D'après Riemann-Lebesgue, %j>\ tend vers 0 à l'infini, et donc a > 0. Maintenant, d'après la formule
d'inversion de Fourier dans S? (th. IV.3.21), la transformée de Fourier de $>\ est rl>i(—x) = i/>i(x) et en
particulier, 1 = ip\(0) = JBtC"nax = -4g, et donc a = 1. (On peut aussi remarquer que
P = I#(o) = \( (-2i7rt)2e-"t2 dt = -4tt2 /+°° iV^di.
Le changement de variable t = *£ permet d'écrire l'intégrale sous la forme 2(JtF)3 $q°° ul^2e~udu =
2(^)3^(1 ), et comme T(§) = ±r(±) = ^, on obtient p = -4tt22(7^3 ^ = ~7r> et donc a = L)
Question 4.
(i) Comme ^^ est paire, il suffit de considérer u G [0,3]. Soit g(u) = u""2(l - ^^). On peut prolonger
g par continuité en 0 en posant g(0) = ^-. La fonction g atteint donc son minimum s sur le compact
[0,3], et comme g est strictement positive sur R+ car sinx < x, si x > 0, on a s > 0. L'inégalité g(u) ^ s
si u G [0,3] se traduit alors par l'inégalité cherchée
(ii) Si |x| ^ 3\/fc, on a Àfc(-^) < (1 - ^j)fe d'après le (i), et donc ik(-^k) ^ e~~ex2, car log(l - u) ^ -u,
si 0 < u < 1.
Si \x\ ^ 3\/fc, alors \4>k(-^)\ ^ (jsf )*• Pour montrer que ceci est ^ j^s, on passe au logarithme et on
fait le changement de variables = |^=. On est ramené à montrer que fclogu-log(l + ku2) ^ 0, si fc ^ 4 et
u ^ 3. Or la fonction u h-> fc log u - log(l + fcu2) admet comme dérivée £ - 1^,*^a = un+kv?)(^ + (^ ~ 2)u2)
qui est toujours positive ; elle atteint donc son minimum en u = 3, et comme fc h-> fclog3 - log(l + 9fc)
est croissante sur [4, +00[ et ^ 0 en fc = 4, cela permet de conclure,
(iii) On a s*™ = 1 _ zî£ + 0{u2) au voisinage de 0. On en déduit que fk(x) = (si^^)fe tend
vers e"2^ quand fc tend vers +00. Comme par ailleurs fk est majorée par sup (e~~£X , j^p) qui est
sommable et indépendante de fc, il résulte du théorème de convergence dominée (th. III. 1.32) quefk tend
vers e"~""ô~~ dans L*(R).
(iv) gic est la transformée de Fourier de /&. Or, d'après le th. IV.2.7 (Riemann-Lebesgue), la transformée
de Fourier est continue de L*(R) dans féb(R-) (muni de la norme || ||oo). Comme fk tend, d'après le (iii),
vers / dans L*(R), cela implique que gk tend uniformément sur R vers /. Or f(t) = V>i (•*/§*)> et donc
/(#) = ^^i(-^§#) = -?/§e~~6x2- H s'agit, à normalisation près, d'un cas particulier d'une variante du
théorème de la limite centrale.
H.8. LOI D'ADDITION SUR UNE COURBE ELLIPTIQUE
597
H.8. Loi d'addition sur une courbe elliptique
Soit (u>i,u>2) une base directe (Im(^) > 0) de C sur R, et soit A = {mwi + rwj2, m,n e Z}.
On dit que / : C —> C est A-périodique si f(z + uj) = f(z), quels que soient z G C et u) G A.
Partie I
(o) Montrer qu'il existe C > 0 tel que |aa>i + bu)2\ ^ Csup(|a|, |6|), quels que soient a,6 e R,
et montrer que r(A) = inf^^-io} \cj\ est non nul.
(i) Soit A = {acoi + pu>2, a,/? e [0,1]}. Montrer que A est compact et que , si z G C, il existe
u e A et u G A tels que z = u + u. En déduire que si / : C —» R+ est continue et A-périodique,
alors / est bornée et atteint son maximum.
(ii) Montrer qu'une fonction A-périodique, holomorphc sur C, est constante.
(iii) Montrer que EweA-{0} dp converge si k est un entier ^ 3.
(iv) Montrer que, si R > 0 et si \u)\ ^ 2R, alors z + u ne s'annule pas sur D(0, R) et les séries
2^ ((z + u)2 ~^ Gt ^ (z + l>)3
w€A,|w|>2R \*^w* W W€A,M^2RV T '
convergent normalement sur D(0,R).
(v) En déduire que, si z e C - A, alors la série F(z) = jz + Eu;GA-{u} ({i+bp ~ d0 «raverge,
et que z *-> F(z) est holomorphc^11) sur C — A.
(vi) Montrer que F' est A-pêriodiquc et que F est paire. En déduire que F est A-périodique.
(vii) Si k ^ 3, soit G* = Eu,ga-{0} tk' Montrcr <ïuo la scric EnS(-1)n(n + 1)G«+2 *n <*t de
rayon de convergence exactement r(A), et que sa somme est G(z) = F(z) — ^, si \z\ < r(A).
(viii) Montrer que G^ = 0, si k est impair. En déduire que, si l'on pose g2 = 6OG4 et
gz = 140G6, alors K(z) = F'(z)2 - 4F(z)3 + g2^{z) + gz est holomorphe et nulle en 0.
(ix) Montrer que F'(z)2 = 4F(z)3 - g2^{z) - gz, quel que soit 2 G C - A.
Partie II
Soit C/A le quotient de C par son sous-groupe A. Rappelons que cela signifie que l'on dispose
d'un morphisme de groupes 7r : C —» C/A surjectif et tel que ir(z) = 0 si et seulement si z G A (où
l'on a noté 0 l'élément neutre du groupe commutatif C/A). L'équation^12) u = — u a 4 solutions
dans C/A, à savoir : 0, ex = tt(^), e2 = 7r(*f ) et e3 = ^(i^^i).
Si a G C, soit Sa = {a + aa;i -I- /?a>2, a,j3€ [0,1[}. On peut écrire tout clément z de C de
manière unique sous la forme z = uj + w, avec^13) u e Sa et w G A. On en déduit que n induit
une bijection de Sa sur C/A, et donc que Sa est un système de représentants de C/A dans C.
On note $a : (C/A) —» S0 la bijection réciproque, et donc sa(w) est le représentant de u dans Sa,
si u e C/A.
(n)La notation standard est p(z) ou p(z,L) ; c'est la fonction p de Weierstrass.
(12)Elle est équivalente à 2w = 0 dans C/A, ce qui se traduit, en choisissant û € C avec ir(Û) = w, par
2û 6 A, ou encore û € |A, et tout élément de ^A peut s'écrire de manière unique sous la forme u> ou
<f + u) ou <f + u ou ^^ + w, avec a; € A.
(13*On écrit z—a sous la forme xu)i+yu)2, avec #, y 6 R,etalorsw = [a;]a;i+[j/]w2,etw = a+{x}u>i+{y}u>2.
598
ANNEXE H. PROBLÈMES CORRIGÉS
On note fia = {cl+oluj\ +P1V2, a, (3 g]0,1[} l'intérieur de S0, et ja le bord de fia parcouru dans
le sens direct. C'est le composé des segments [a,a + o;i], [a+u>i,a+u>i +0J2], [cl+uj\ +uj2,cl+u)2]
et [a + ^2,a]. On remarquera que S0 C fi0U70. On note simplement^14) f£ f(z)dz l'intégrale
S[a,p\f(z)dz-
Une fonction / : C —> C qui est A-périodique peut être considérée comme une fonction
de C/A dans C. Si / est une fonction méromorphe sur C, A-périodique, on dit que les zéros
(resp. les pôles) de / dans C/A sont les Wj, pour i G I, avec multiplicités mj > 1, si les zéros
(resp. les pôles) de / dans S0 sont les sa(wi), pour i G I, et si la valuation de / en sa(ui) est m*
(resp. —mj), ce qui ne dépend pas du choix de a G C. Si tel est le cas, on note No(/) = ^2i€lmi
(resp. Noo(/) = ^2içimi) Ie nombre de zéros (resp. de pôles) de / dans C/A, comptés avec
multiplicité.
(i) Soit / une fonction méromorphe sur C non identiquement nul. Montrer que, si a G C, il
existe ra > 0 tel que / n'ait aucun zéro ni pôle dans D(a,r~) — {a}. En déduire que si K est un
compact de C, alors / n'a qu'un nombre fini de zéros et de pôles dans K.
(ii) Soit / une fonction A-périodique, non identiquement nulle, méromorphe sur C. Montrer
qu'il existe a G C tel que / n'ait ni zéro ni pôle sur le chemin ya.
(iii) Montrer que f^ j$ dz = 2t7r(N0(/) - 1M/)). En déduire que N0(/) = Noo(/).
(iv) Dans tout ce qui suit, F est la fonction de Weierstrass définie à la question (v) de la
partie I. Calculer No (F7), et montrer que F' est impaire. En déduire que les zéros de F' dans C/A
sont ei, e2 et 03, et que ce sont des zéros simples.
(v) Calculer Nqo(F - 6), si 6 G C. En déduire que F : (C/A) - {0} —> C est surjective, et que
F(a) = F(a') si et seulement si a' = ±a. (On fera attention au cas F(a) G {F(ei),F(e2),F(e3)}.)
(vi) En déduire que z *-* P(z) = (F(z),F'(z)) est une bijection de (C/A) — {0} sur l'ensemble
E(C) des solutions (X, Y) dans C2 de l'équation Y2 = 4X3 - g2X - gz.
(vii) Soient fi C C un ouvert contractile et / : fi —» C, holoinorphe et ne s'annulant pas sur fi.
Montrer qu'il existe g holomorphe sur fi telle que / = e9, et que g' = 4.
(viii) Si a, 6 G C, et si r > 0, soit fir(a,6) = {z G C, 3c e [a, 6], \z - c\ < r}. Montrer que
fir(a, 6) est un ouvert convexe.
(ix) Soit / une fonction A-périodique, non identiquement nulle, méromorphe sur C, et soient
a G C et a; G A tels que / n'ait ni zéro ni pôle sur [a, a -I- a;]. Montrer que, si r > 0 est assez
petit, / n'a ni zéro ni pôle dans fir(a,a -I- uj). En déduire que ^ /(^+w jffi dz G Z.
(x) Soit / une fonction A-périodique, non identiquement nulle, méromorphe sur C.
(a) Montrer que l'ensemble Xa des éléments de Sa tels que vz(f) ^ 0 est fini et que l'image
de X)z€Xa vz(f)z dans ^M ne dépend pas de a G C. On la note n(f).
(b) Soit a G C tel que / n'ait ni zéro ni pôle sur le chemin 7a. Montrer que
2îirxJa f(z) Ja+w1+w2 f(z) SiTrVa+wx f(z) yo+w2 /(*)
appartiennent à A. (On ne traitera que Ii ou I2.)
(c) En déduire que ir(f) = 0.
<14)Ça prend moins de place si a et (3 sont compliqués.
H.8. LOI D'ADDITION SUR UNE COURBE ELLIPTIQUE
599
(xi) Soit E(C) = E(C) U {oo}. On étend l'application z \-+ P(z) de la question (vi) en une
bijeetion de C/A sur E(C), en posant P(0) = oo, et on note i : E(C) —>• C/À la bijeetion
réciproque. On définit Qi 0 Q2, si Qi, Q2 G Ë(C) par Qi 0 Q2 = P(t(Qi) + t(Q2))- Montrer que
0 est une loi de groupe commutatif d'élément neutre 00 sur E(C), et que, si Qi,Q2,Q3 € E(C)
sont distincts, alors Qi 0 Q2 0 Q3 = 00 si et seulement si Qi,Q2,Q3 sont sur une même droite
complexe de C2. (On pourra s'intéresser aux zéros de la fonction G(z), déterminant des vecteurs
(F(*),F'(z),l), (F^F'O*!),!) et (F(z2),F'(z2),l).)
Corrigé
Partie I
(o) L'application (a, 6) 1-» ouji + bu>2 est un isomorphisme de R2 sur C et (0,6) •-► \awi + 6W2I est une
norme sur R2 ; elle est donc équivalente à la norme ||(a, 6)|| = sup(|a|, |6|) (on est en dimension finie) ; on
en déduit l'existence de C > 0 tel que \awi + 6w2| ^ Csup(|a|, |6|), quels que soient o, 6 € R. Finalement,
on a r(A) ^ C > 0.
(i) A est compact car c'est l'image du compact [0,1] x [0,1] par l'application (a,/?) 1-» awi + /?u>2> qui est
continue. On peut écrire z sous la forme axji + bu)2, avec a, 6 € R, et il suffit de poser u> = [a]u>i + [6]w2
et u = {a}u>i + {6}w2 pour obtenir une décomposition de z sous la forme z = u + u voulue. On en déduit
que, si / est A-périodique, on a /(C) = /(A), et comme A est compact, si / est de plus continue, cela
implique que / est bornée et atteint son maximum sur A.
(ii) Si F est A-périodique, holomorphe sur C, alors / = |F| est continue et A-périodique. D'après la
question (i), cela implique que |F| atteint son maximum, et d'après le th. de Liouville (th. V.3.11), cela
implique que F est constante.
(iii) D'après la question (o), on a Ew€A-{o} W ** C~fc£(n,m)ez*-{(o,o)} »uP(|m|.|»|)fc • 0r u * a 8N
couples {m,ri) vérifiant sup(|m|, \n\) = N, ce qui nous fournit la majoration
1 +°° 8N
E Of<CT*£sF«;8C-*C(*-l)<+oo, si fc > 2.
u;€A-{0} ' ' N=l
(iv) 0n a Iji^ - à* = <%»Vz)> et I" + A > M - W > ¥> si M > 2R et z e D(0,R). En particulier,
z + w ne s'annule pas sur D(0,R), et on a
■ 1 1 ■ 2|a;|R + R2 _ 8R 4R2
si z e D(0,R) et \w\ ^ 2R. On déduit la convergence normale de la première série sur D(0,R) de la
question (iii). Pour démontrer celle de la seconde, on remarque que |fo+^a I ^ i^r» si z G D(0,R) et
\w\ ^ 2R, et on conclut de la même manière.
(v) F(z) est la somme, sur D(0,R"") de la somme finie ^ + X]q;€A-{o},m<2ii ((ïqfcj* - £)> dont
chacun des termes est une fonction holomorphe en dehors de A, et de la série normalement convergente
I3w€A,|w|^2R ((z+w)2 - ijs) Qui est holomorphe sur D(0,R~) d'après le th. V.5.1. On en déduit l'holo-
morphie de F sur D(0,R~) - A et, ceci étant vrai pour tout R, l'holomorphie de F sur C - A.
(vi) La convergence de la série js + X}w€A-{o} ((«+L)a ~ **) étant uniforme sur tout compact de
C - A, on peut calculer la dérivée de F en dérivant la série terme à terme (th. V.5.1) ; on a donc
F'(-z) = Ew€a (ifâp- Maintenant, si a € A, on a F'{z + a) = £w6A {z+âlu>)* » et la serie étant
absolument convergente, elle peut se sommer dans l'ordre que l'on veut et on peut utiliser le fait quew •-» a+w
est une bijeetion de A pour en déduire que F'(z + a) = F'(z).
La parité de F résulte de ce que ((_zj.w)s —^s) = ((z-w)* ~ F^f) ' et w *"* _w est une éjection de A.
600
ANNEXE H. PROBLÈMES CORRIGÉS
Maintenant, si a; G A, la fonction F(z + w) - F(z) a une dérivée nulle et donc est constante sur C - A.
Notons c(lo) cette constante. On a c(-uj) = c(lu) car F est paire, et
c(u>i + u2) = F(z + u>i+ u>2) -F(z + u>i) + F(z + u>i) - F(z) = c(w2) + cfa).
En prenant u\ = uj et uj2 = -w, on en déduit que 2c(co) = 0, et donc que F est A-périodique,
(vii) La fonction G(z) est holomorphe sur C - (A - {0}), mais a un pôle en tous les éléments de A - {0}.
Le plus grand disque ouvert de centre 0 contenu dans C - (A - {0}) étant D(0,r(A)"") par définition
de r(A), la série de Taylor de G en 0 a pour rayon de convergence r(A) d'après le (i) de la rem. V.4.9
Maintenant, G(0) = 0 d'après la formule définissant F, et, d'après le th. V.5.1, on peut calculer G<n)(0)
comme la somme de la série des dérivées ; on obtient, si n ^ 1,
G(„,(0)= £ (zl££+^ = (_1)>+1)!<w
u;€A-{0}
Comme, d'après le (i) de la rem. V.4.9, on a G(z) = EStP^5 si \z\ < r(A), cela permet de
conclure.
(viii) La fonction G étant paire, on a G& = 0, si k est impair, et donc
F^z) = }- + SG4z2 + 5G6z4 + 0(z^ et F'(z) = -^+6G4z + 20G6z3 + O(z4)
z zx
F(*)3 = ^ + ^ + 15G6 + 0(*) et (F'(*))2 = l-^i-80G6 + O(*)
Z Z Z Z
On en déduit que H(z) se prolonge en une fonction holomorphe nulle en 0.
(ix) La fonction R(z) est A-périodique, holomorphe sur C - A et holomorphe en 0. Par A-périodicité,
elle est aussi holomorphe en tous les points de A, et donc est holomorphe sur C. Elle est donc constante,
d'après la question (ii), et comme elle vaut 0 en 0, elle est identiquement nulle.
Partie II.
(i) Soit k = va(f). Alors g(z) = (z - a)~kf(z) est holomorphe dans un voisinage de a et non nulle en a ; il
existe donc ra > 0 tel que g ne s'annule pas sur D(a, r~), et alors / n'a ni zéro ni pôle sur D(a, r~) - {a}.
Maintenant, si K est compact, on peut extraire un recouvrement fintf15) du recouvrement de K par les
D(a,r~), pour a G K; autrement dit, il existe un sous-ensemble fini A de K tel que K c UaeAD(a,r^).
Par construction de ra, l'ensemble des zéros et pôles de / sur K est alors inclus dans A, et donc est fini,
(ii) Soit B = {au;i + Pv2, a,/? G [-1,1]}. Comme B est compact, / n'a qu'un nombre fini de zéros et
de pôles dans B d'après la question (i). Si les zéros et pôles de / dans B sont les 0^1 + PiU2, Pour * e I
fini, il suffit de prendre a de la forme au>i + Pw2> où a G [-1,0] n'est pas de la forme a* ou a* - 1, et
P G [-1,0] n'est pas de la forme & ou Pi - 1, pour i G I.
(iii) Si w G r2a, le résidu de 4^ en w est vw(f)\ on déduit donc de la formule des résidus que
2^ /7a j$ dz = ]Cw€ft« vw(f)- Par ailleurs, comme / n'a ni zéro ni pôle sur Sa - f2a, cette dernière
somme est aussi égale à £w€S vw(f) = N0(/) - N^/).
Comme $$ est A-périodique, on a ££**, ^dz = /a°+Wl flgg? dz = - £»* fâ dz. On a
^nc xr* ï$dz+c::+U2 $$*=<>* ;a™ &$ *+r+W2 $$*=<>. on en déduit que
A„ 7$dz = °'et donc que N°tf ) = N~tf )•
(15*On peut aussi raisonner en termes de suites, en disant que, si l'ensemble Z des zéros et pôles de / dans
K est infini, et si (an)n€N est une suite d'éléments distincts de Z, alors on peut extraire de (an)n€N une
sous-suite ayant une limite a dans K, mais alors D(a,r~) contient une infinité de on, ce qui est contraire
à la définition de ra.
H.8. LOI D'ADDITION SUR UNE COURBE ELLIPTIQUE
601
(iv) F7 a un pôle d'ordre 3 en 0 et est holomorphe en dehors de A ; on a donc N00(F/) = 3. Par ailleurs,
F étant paire, F' est impaire et F'{z) = 0, si z = -z dans C/A. On en déduit que ei, e2 et e3 sont des
zéros de F' clans C/A. Comme No(F') = N00(F/) = 3, ce sont les seuls zéros de F' et ils sont simples,
(v) Si b G C, la fonction F(z) - b a un pôle double en 0 et est holomorphe en dehors de A. On a donc
Noo(F - b) = 2, et aussi N0(F - b) = 2, ce qui implique en particulier que l'ensemble des solutions de
l'équation F(z) = b dans (C/A) - {0} n'est pas vide. On en déduit la subjectivité de F : (C/A) - {0} -> C.
Maintenant, la fonction F étant paire, si a est une solution de F(z) = 6, alors -a aussi. Comme
N0(F - b) = 2, ce sont les seules solutions si a ^ -a, c'est-à-dire si a £ {ei,e2,e3}. On en déduit que, si
F(a) ^ {F(e!),F(e2),F(e3)}, et si F(a') = F(a), alors a1 = ±a.
Si a G {ei,e2,e3}, comme F7(a) = 0 d'après le (i), la fonction F(z) - F(à) a un zéro double en z = a,
et comme N0(F(^) - F(a)) = 2, ce zéro est l'unique zéro de F(z) - F(a) dans C/A; on en déduit encore
dans ce cas que F(a') = F(a) si et seulement si a' = ±a (et a = -a).
(vi) L'appartenance de P(z) à E(C) résulte de la question (ix) de la partie I. Si P(^i) = F(z2), on a en
particulier F(zi) = F(z2), et donc z\ = ±z2 d'après la question (v). Si zi = -z2, alors F'(z2) = -F'(zi),
et donc F(zi) = P(z2) et z\ ^ z2 impliquent F'{z\) = 0. Or ceci implique z\ G {ei,e2,e3}, et donc
z\ = -z\ et z\ = z2. On en déduit l'injectivité de z h-> P(z). Pour prouver la subjectivité, il suffit de
constater que si (a, b) G E(C), il existe z tel que F(z) = a, et alors F'(z) = ±6, ce qui fait que (a, b) = P(z)
ou (a,b) = P(-z).
(vii) cf. prop. VI.2.3.
(viii) f2r(a,6) est la réunion des D(c,r""), pour c G [a, a + a;], et donc est un ouvert en tant que réunion
d'ouverts. Si z\, z2 G f2r, il existe Ci,c2 G [a,a+v] tels que |^-Ci| < r, si i = 1,2. Maintenant, si t G [0,1],
alors tel + (1 - t)c2 G [a,a + u>] et \(tzi + (1 - t)z2) - (ta + (1 - t)c2)\ = \t(zi - cx) + (1 - t)(z2 - c2)\ <
r(t + (1 - t)) = r, ce qui prouve que tzi + (1 - t)z2 G f2r(a,6), et que f2r(a,6) est convexe,
(ix) f2i(a,a + w) est un ouvert borné contenant [a,a + u). Son adhérence K est un compact et donc ne
contient qu'un nombre fini de zéros et de pôles de /, d'après la question (i). Il suffit de prendre pour r
le minimum des distances de ces zéros et pôles au segment [a, a + w] pour être sûr que Qr(a,a + u>) ne
contient ni zéro ni pôle de /.
Un ouvert convexe étant contractile, il existe g holomorphe sur Qr(a>a + w) telle que e9 = /, et donc
g' = £. On a alors £+" %£dz = g(a + u>) - g(a), et donc exp( Jaa+W fâ dz) = /(a + u>)/f(a) = 1,
puisque / est A-périodique. On en déduit que f^*" j& dz G 2i7rZ.
(x) (a) Comme Sa est borné, l'ensemble des zéros et des pôles de / dans l'adhérence de Sa est fini ; il en
est donc a fortiori de même dans Sa. Par ailleurs, si on change a en 6, alors z h-> Sb(n(z)) est une bijection
de Sa sur Sb qui induit une bijection de Xa sur X6, et on a z - Sb(7r(z)) G A et vz(f) = v8b^z))(f). On
en déduit que
E v*(/)z - E v*wz = E v*Wz - «»(*(*)))6 A>
2€Xa z£Xb z€Xa
et donc que 7r(/) est bien indépendant de a.
0>) r++w7+W2 ZJ$ dz = JT+W1 (* + »*)l&$ dz = T+Wl(* + <*)$?<** puisque / est A-périodique.
On en déduit que Ii = ^ /a°+Wl <*>2j$ dz, et comme ^ /*~Wl j$ dzeZ d'après la question (ix), on
a Ii € Zo>2 C A. L'argument est le même pour I2.
(c) Il résulte du (b) que ^ J zf$ dz = Ii +12 € A. Par ailleurs, il résulte de la formule des résidus
*lue m /7a ZJ$ dz = £«€îî„ VM)w» et comme / n'a ni zéro ni pôle sur Sa - fta, on a £ues„ vu(f) u =
YlueQa vu(f)w ^ A. L'image 7r(/) de Z)u6Sa vu(f) u dans C/A est donc nulle.
602
ANNEXE H. PROBLÈMES CORRIGÉS
(xi) Par construction, Qi © Q2 = Q3 si et seulement si l(Qi) + ^2) = ^(Qs). Comme (C/A,+) est un
groupe commutatif d'élément neutre 0, et comme 1 est une bijection de Ê(C) sur C/A, cela implique que
(E(C),©) est un groupe commutatif d'élément neutre t"l(0) = 00.
Maintenant, Qi,Q2,Q3 G E(C) sont distincts et vérifient Qi © Q2 © Q3 = 00 si et seulement si
z\ = t(Qi), Z2 = i(Q,2) et 23 = t(Q.3) sont distincts, non nuls, et vérifient 21 + 22 + 23 = 0. En particulier,
z\ 7^ ±22, et donc F(2i) ^ F(22). Ceci implique que si on écrit G(^) sous la forme aF(^) + (3F'(z) +7,
alors (3 ^ 0 puisque (3 = F(22) - F(2i).
Comme F7 a un pôle d'ordre 3 en z = 0, et F a un pôle d'ordre 2, le pôle en z = 0 de /?F' + aF + 7 est
d'ordre 3 exactement. On a donc N^G) = 3, et on déduit de la question (iii) que G a 3 zéros dans C/A
comptés avec multiplicité.
Il est clair que z\ et Z2 sont deux zéros de G, et si z' est le troisième, alors n(G) = z\ + 22 + z1 - 3 • 0.
Il résulte alors du (c) de la question (x) que z\ + 22 + z1 = 0, et donc z1 = 23. On a donc prouvé que
G(z) = 0 si et seulement si z G {21,22,23}.
Par ailleurs aX + /?Y + 7 = 0 est l'équation de la droite passant par P(2i) = Qi et P(22) = Q2 ; on en
déduit que G(z) = 0 si et seulement si P(z) appartient à la droite (Qi,Q2). Ceci permet de conclure.
H.9. COEFFICIENTS DE FOURIER DES FONCTIONS ANALYTIQUES 603
H.9. Coefficients de Fourier des fonctions analytiques
On dit que / : R —» C est analytique si, pour tout a G R, il existe ô > 0 tel que / soit somme
de sa série de Taylor en a pour tout x é\a — ô, a + ô[. On se propose de démontrer qu'une fonction
périodique est analytique si et seulement si la suite de ses coefficients de Fourier (cn(/))nGz est
à décroissance exponentielle (i.c. il existe r > 1 tel que |rlnlcn(/)| —> 0 quand \n\ —» +co).
Question 1. (i) Montrer que, si F est holomorphe sur un ouvert Q contenant R, alors la
restriction de F à R est analytique.
(ii) Soit (an)n€z telle qu'il existe r < 1 et C > 0, avec \an\ ^ Cr'71', pour tout n G Z. Montrer
que la série ^neN^2*™* converge pour tout t G R et définit une fonction analytique sur R,
périodique de période 1.
Question 2. (i) Montrer que si / est analytique sur R, alors pour tout a G R, il existe un disque
ouvert Da de centre a et une fonction holomorphe Fa sur Da dont la restriction à R H Da est /.
(ii) Montrer que, si Da (1 Df, ^ 0, alors Fa et F& coïncident sur Da n D&. En déduire qu'il existe
un ouvert O de C contenant R, et une fonction holomorphe F sur Q dont la restriction à R est /.
(iii) Montrer qu'un ouvert O de C contenant R contient un ouvert rectangulaire de la forme
Q(ô) = {z, -ô < Re(s) < 1 + <5, \lm(z)\ < ô}.
(iv) On suppose / : R —> C analytique et périodique de période 1. Soit Q, un ouvert de C
contenant R sur lequel il existe une fonction holomorphe F dont la restriction à R est /, et soit
ô > 0 tel que Cl(ô) soit contenu dans Cl. Montrer que pour tout r G]e_27nJ, 1[, il existe C(r) > 0
tel que |c„(/)| < C(r)rN, pour tout n G Z.
(v) Conclure.
Corrigé
Question 1. (i) Il suffit de revenir à la définition d'une fonction holomorphe : si a G R, alors F est
somme de sa série de Taylor en a sur un petit disque de centre a, elle est donc a fortiori somme de sa
série de Taylor sur un segment de la forme ]a- S,a + S[.
(ii) La série 5Zn6N ane2t1t nz est normalement convergente dans la bande |Im(.z)| < S, si re2w<J < 1
(i.e. si ô < ^ log £). Elle définit donc une fonction holomorphe, périodique de période 1, sur cette bande
puisque chacun des termes de la série est holomorphe et périodique de période 1. Sa restriction à R est
donc analytique d'après le (i), ce qui permet de conclure.
Question 2. (i) Par hypothèse, il existe ô > 0 tel que f(t) = Y,nZ f n!(a) (* ~ a)"> Quel Que soit
t é\a — ô>a + Ô[. En particulier, la série X)n^ ^ n/°^n est ^e ravon ^e convergence > S et il suffit de
prendre Da = DM") et F0(z) = £Î3 ^^C* - a)n, si z G D0.
(ii) Si DanDft =£ 0, alors DanD{, est connexe (car convexe et donc connexe par arcs), et son intersection
avec R est un intervalle ouvert I non vide. Par ailleurs, Fa et F& coïncident sur I, et le théorème des zéros
isolés implique que F0 et F& coïncident sur D0 n D& tout entier.
Ceci permet de définir une fonction F sur l'ouvert Q = Uo€R,Da (qui contient R par construction), en
posant F(^) = Fa(z) si z G Da. Comme F0 et F^ coïncident sur D0nD(„ on voit que la définition de F(^)
ne dépend pas du choix de a G R tel que 2 6 Da. De plus, F est holomorphe sur Da pour tout a, et donc
est holomorphe sur Cl tout entier.
(iii) Comme [a, 6] est compact, que C — Q est fermé et d'intersection vide avec [a, 6], la distance d de
[a, 6] à C - Q est > 0. On peut alors prendre <5 = d/2.
604
ANNEXE H. PROBLÈMES CORRIGÉS
(iv) Comme f(z)e~2i*nz est holomorphe sur Q0 = {z, -S < Re(s) < 1 4- 5, |Im(^)| < S} qui est
contractile car convexe, l'intégrale de f(z)e~2ilTnzdz sur le rectangle de sommets 0,1,1 + ic.ic est nulle,
pour tout choix de ce]- S,S[. De plus, f(z)e~~2tlïnz étant périodique de période 1, les deux intégrales sur
les côtés verticaux se compensent, et comme l'intégrale sur [0,1] n'est autre que cn(/), on en déduit que
CnU) = e27mcJo1 /(* + ^)e"2i7rntdt, pour tout ce]-S,S[. En prenant c = ^^ si n ^ 0 et c = iajr si
n ^ 0, et en posant C(r) = supiG[0>1] max(|/(t + i^~)\> \f(t - i^r)|, on obtient la majoration voulue.
(v) L'énoncé cherché est la conjonction des (ii) de la question 1 et (iv) de la question 2.
H. 10. PROLONGEMENT ANALYTIQUE D'INTÉGRALES ET DE SÉRIES 605
H. 10. Prolongement analytique d'intégrales et de séries
Le but de ce devoir est d'illustrer la souplesse que procure la possibilité de déplacer le chemin
sur lequel on intègre, et de montrer comment combiner cette souplesse avec la formule de Poisson
pour prolonger analytiquemcnt certaines séries.
Si s € C, on note (f>s : R —► C la fonction définie par la formule (f>s(t) = ?ï5+rF> ^a
détermination du logarithme choisie étant la détermination principale (on rappelle qu'avec cette
détermination, |z*| ^ e^M^I^Re^ pour tous ^ c* et s G C).
Question 1. Dans cette question, s est réel (et > \ pour le (i), > § pour (ii)-(vi)).
(i) Calculer f+°°e-<1+t^us^. En déduire que j>s(0) = ^fo"**.
(ii) Montrer que (j>s est de classe ^2 et que (j>'$ est la transformée de Fouricr de û^[y ■
(iii) Montrer que <j>s et <f>'s sont à décroissance rapide (on rappelle que / est à décroissance
rapide si \xNf(x)\ —»• 0, pour tout N e N, quand |a;| —► +oo).
(iv) Trouver une relation linéaire à coefficients dans C[t] entre </>s, <p'$ et <p". En déduire que
tjj$(x) = j>s(^) est solution de l'équation différentielle x2v" + 2(1 — s)xv' — x2v = 0.
(v) Montrer que (j>s est de classe fé*30 sur R* et que toutes ses dérivées sont à décroissance
rapide. Existc-t-il s > § tel que <j>s soit de classe fé700 sur R?
(vi) Que peut-on attendre du comportement à l'infini de 0S, compte-tenu des (iii) et (iv) ? (On
demande juste un argument heuristique, pas une justification détaillée.)
Question 2. On note O l'ouvert obtenu en retirant au demi-plan Im(s) > — 1 la demi-droite
[t,t°°[; c'est un ouvert contractile car il est étoile par rapport à tout point du segment ] — i,i[.
On note encore <j>s : Q, —»• C la fonction z h-> T^rrpr-
(i) Montrer que (f>$ est holomorphe sur O.
(ii) Montrer que <f>s peut se prolonger en une fonction méromorphe sur le demi-plan Im(s) > — 1
si et seulement si s G Z.
(iii) Soit Un = {z, |Im(z)| < N, |Re(z)| < N}. Montrer que, si s e Un, si a e R+ - {1} et si
t e [-1,1], alors |(1+(ia1+f).)„| < CN(a), où CN(<*) = e*Nsup (j^^p, (a4 + 4)N/2).
(iv) Montrer que, si $ e Un et si t e R, alors | a+t±î+u)*)* I ^ é*N(t4 + 4)N/2, si t e R.
Question 3. Si 0 < oc < 1, on note 7a le chemin constitué de la demi-droite verticale
7la =]-l+ ioo, — 1 + ta], du segment j2,a = [—1 + m*, 1 + ioe] et de la demi-droite
verticale 73)0! = [1 -Ma, 1 + ioo[. Si £ < 0, soit
On note Ii,a(s,£) (resp. I2,a(s,£)> rcsP- l3,a(s,£)) l'intégrale sur jit0t (resp. 72,Q> resp. 73,a)-
(i) Montrer que s ■-► l2,a(s,0 est holomorphe sur C tout entier et |l2,a(s,£)l ^ 2C^(a)e2ira^,
pour tous £ < 0 et s e Un-
(ii) Montrer que s i-> li,ft(a,0 et s i-> l3,a(s,0 sont holomorphes sur C tout entier et qu'il
existe C'N(a) tel que |Ii,ft(a,OI ^ CnWc2*^» si * = !>3> Pour tous ^ -1 et s e Un- (On se
contentera de traiter Ii,Q(s>£) car les arguments sont les mêmes pour l3,a(*>O0
606
ANNEXE H. PROBLÈMES CORRIGÉS
(iii) Montrer que $ ■-► Fa(s,£) est holomorphe sur C tout entier et qu'il existe G'^a) tel que
|F«(*,0I < G'^(a)e2^a, pour tous £ < -1 et s e UN.
Question 4. (i) Soit / e L^R-,.). Montrer que f+°° \f(t)\dt -► 0 quand a -► +oo.
(ii) Montrer que Ii)(ï(s,£) -* 0 quand a -> +oo, puis que FQ(s,£) —> 0 quand a -*■ +oo.
(iii) En déduire, en termes du résidu de f1+*2)l en *» la valeur de FQ(fc,£), si k e Z. (On
s'intéressera à Fa(fc,£) — F/î(â:,£), si a < /?, et on discutera suivant les positions de a, (3 et 1.)
(iv) En déduire que Fa(A:,£) = 0, si k < 0, et calculer Fa(k,Ç), si a e]0,1[, pour k = 1,2.
Question 5. On suppose Re(s) > ^, ce qui fait que </>s e LX(R).
(i) Montrer que <f>3(—x) = <j>s(%), pour tout a; G R.
(ii) Si R > 1, soit 7a)R le chemin composé des segments [—R, R], [R, R -MR], [R + iR, 1 -MR],
[1 -MR, 1 + H» [1 + ta, -1 + ta], [-1 + ia, -1 + »R], [-1 + iR, -R + »R] et [-R + iR, -R]. Que
vaut l'intégrale de e~2tn^z(f>s(z)dz le long de ce chemin? En déduire que Fa(s,£) = <&»(£), pour
tout a e]0,1[.
(iii) Montrer qu'au voisinage de l'infini, &»(£) = 0(e~2na^), pour tout a e]0,1[. Ceci s'accorde-
t-il avec votre heuristique du (vi) de la question 1 ?
Question 6. (i) Montrer que £n6Z ^ = « fé=£ et £n€Z (TOj* = ? ïS^+27r'Ô^F'
(ii) Montrer que la série 2n2 F1/2(5» —») converge pour tout 5 G C, et que la somme F(s)
est une fonction holomorphe sur C tout entier.
(iii) Montrer que G (s) = X)nez (n2+D* convei*ge sur Re(s) > 5 et est holomorphe sur ce
demi-plan.
(iv) Montrer que G admet un prolongement méromorphe à C tout entier, holomorphe en
dehors de pôles simples aux — A; + 5, pour A; G N.
(v) Que vaut G(-fc), si k e N.
Question 7.
(i) Soit / : [0,1] —>• R* de classe ^°°, et soient a, 6 e R, a > 0. Montrer que la fonction
s l~¥ /o tas+bf(t)s dt se prolonge en une fonction méromorphe sur C tout entier, holomorphe en
dehors de pôles simples éventuels en les =^, avec k entier ^ 1. (On pourra utiliser la formule
de Taylor avec reste intégral à l'ordre n pour t ■-► f(t)s.)
(ii) Soit P un polynôme unitaire, de degré d ^ 2, à coefficients réels, ne s'annulant pas sur R.
Montrer, que f^£ p4w dt se prolonge en une fonction méromorphe sur C tout entier, holomorphe
en dehors de pôles simples potentiels aux ^, pour k eN.
(iii) Soient a (resp. A) le minimum des |Im(a)| (resp. le maximum des |Re(a)|), pour a
racine de P. Soient 0+ l'ouvert obtenu en retirant au demi-plan Re(s) > —a la bande fermée
{z, |Re(;z)| ^ A, Im(z) ^ a) et Q~ le symétrique de Q+ par rapport à l'axe réel. Montrer que
z ■-* pT^p se prolonge en une fonction holomorphe </>p)S sur 0+ et sur O-. (On pourra factoriser
P et se ramener à <f>s.)
(iv) Montrer que Gp(s) = Y^nez pAp" se prolonge en une fonction méromorphe sur C tout
entier, holomorphe en dehors de pôles simples potentiels aux ^, pour fceN.
H. 10. PROLONGEMENT ANALYTIQUE D'INTÉGRALES ET DE SÉRIES 607
Corrigé
Question 1. (i) Le changement de variable v = (l+t2)u fournit la formule /0+o° e_,t<1+'a>ii**i = (1+ffi)..
Il en résulte que 0.(0) = ^ /_+~ ( /o+°° e"**1-" Vf ) dt.
On peut alors utiliser Fubini pour les fonctions positives pour intervertir les deux intégrations, et
comme f*™e"u^t2^dt = e~u f*™e~ut2dt = \f\z~u (le changement de variablet = y/^v nous ramène
à l'intégrale de la gaussienne), on obtient finalement }s(0) = ^ f+°° e~uuB-i Ç = ^fgpil.
(ii) La fonction £ »-> (1 + t2)0s(t) étant sommable, le résultat suit du (ii) du th. IV.2.8.
(iii) La dérivée fc-ième de (f>3 est, comme le montre une récurrence immédiate, de la forme t »-> t^^+tt »
où Pfc est un polynôme de degré fc ; elle est donc sommable pour tout fc, ce qui permet d'utiliser le (i) du
th. IV.2.8, pour en déduire que xk<j)s —> 0 en l'infini, pour tout feeN. Ceci permet de conclure pour 0S.
le raisonnement pour <jt8 est identique : la dérivée fc-ième de t(f>s(t) est de la forme fj^{fa+k » où Qk est
un polynôme de degré fc + 1 ; elle est donc sommable pour tout fc.
(iv) On a (t2 + 1)#' + 2(s + 1)*# + 2s(f>s = 0. On en déduit que
( - ^ + W-aVa) + 2(* + i^H*^) + 2^ = °'
Le résultat s'en déduit par des calculs sans mystère.
(v) L'équation différentielle satisfaite par 0S montre, par récurrence, que 0S est de classe Sf * sur R*
et que <j>i est une combinaison linéaire de 0S et $>, à coefficients dans C[£]. Comme 0S et <^ sont à
décroissance rapide à l'infini, il en est de même de <f>ik\ pour tout fc.
Si <f>s est Sf°° sur R, elle appartient à l'espace de Schwartz, et donc sa transformée de Fourier inverse
aussi (cor. IV.3.17). Par ailleurs, comme <f>3 et <f>3 sont dans L1, la transformée de Fourier inverse de 0S
est <f>3 (prop. IV.3.25). Comme (f>3 n'est pas à décroissance rapide, on aboutit à une contradiction qui
prouve que <t>s n'est jamais Sf°° sur R.
(vi) Au voisinage de l'infini, l'équation différentielle satisfaite par 0S se rapproche de l'équation
différentielle v" = 4tt2v dont une base de solutions est constituée de e2lïX et e~~2irx. Parmi les solutions de
l'équation v" = 4n2v, seuls les multiples de e~2lTX (resp. e2nx) n'explosent pas en +oo (resp. -oo) ; on
peut donc s'attendre à ce que 0S ressemble à un multiple de e~2nx au voisinage de +oo et de e2nx au
voisinage de -oo.
En fait, on a ^jpr<i>s(x) = |x|s"^Ks_i(27r|a:|), où K„ est la fonction de Bessel de l'ex. IV.1.9 donnée
par la formule K„(y) = \ /0+ooc"^t+t"l>/2*l/ f, si v e C et y e RJ, ce qui permet d'utiliser le (ii) de
cet exercice pour en déduire un équivalent de 0S au voisinage de l'infini. La formule précédente résulte
du calcul ci-dessous, où l'on a utilisé successivement le (i), le th. de Fubini, le fait que la transformée de
Fourier de e~ut est y/j-eu n x , et le changement de variable u = n\x\w :
r(«) Jo u JR
jA [+°°e-u-u-Wus-idu
n*)Jo u
/,+0°c-2ir|«|(w+w-1)w»-è !*E
-w"-'f
608
ANNEXE H. PROBLÈMES CORRIGÉS
Question 2. (i) L'image de Cl par z »-► z2 +1 est incluse dans C - R_ et (f>s est la composée dez^ z2 + i
de fi dans C - R_ avec z h-> exp(slog2) de C - R_ dans C qui sont toutes les deux holomorphes. On
en déduit Pholomorphie de <t>3.
(ii) Si s G Z, la fonction z h-> /z^xy est méromorphe sur C tout entier (et même holomorphe si s < 0),
comme quotient de deux fonctions holomorphes sur C.
Par ailleurs, si a > 1 et si s tend vers 0, alors (ia + e)2 + 1 = 1 + e2 - a2 + 2iae tend vers un nombre
négatif avec une partie imaginaire positive si e > 0 et négative si e < 0. Il en résulte que les limites en
ia+0+ et ia+0" de log(22 + l) différent de 2in et donc que celles de ,zî\.xy diffèrent d'une multiplication
par e~~2i7rs, qui n'est pas égal à 1 si s $ Z. On ne peut donc prolonger par continuité <f>3 en aucun point de
la demi-droite [i,ioo[, et donc <f>3 ne se prolonge à aucun ouvert de Im(s) > -1 contenant strictement fi.
(iii) On a |1 + (ia + t)\2 = (1 - a2)2 + t4 + 2t2 + 2i2a2, et donc (1 - a2)2 < |1 + (ia + t)\2 < a4 + 4,
si |*| ^ 1. Il en résulte que | (i+(to+t)*)*
| <£ c*lIm«l sup (lïz^iEpy, (a4 + 4)R*(*)/2), et le résultat suit de
l'appartenance de s à Un-
(iv) On a |1 + (±1 + it)2\2 = t4 + 4, et donc \ilH±}+it)îy\ < ^^£(1)/*, et le résultat suit de
l'appartenance de 5 à Un-
Question 3. (i) Soit g(t, s) = ?l+7ia+i)iy de telle sorte que l2,a(s,£) = - /_i #(*> s) dt.
• Si t G [-1,1] est fixé, alors 5 »-► p(£, s) est holomorphe sur UN.
• \g(t, s)\ = |(1+(eJ+ftt)a)a| ^ CN(a)e27r*a, pour tous t G [-1,1] et s G UN, d'après le (iii) de la question 2.
Comme t h-> CN(a)e27r*a est sommable sur [-1,1], on est dans les conditions d'application du th. V.5.7,
ce qui montre que 5 h-> l2,<*(s,0 est holomorphe sur Un- Comme ceci est vrai pour tout N, elle est aussi
holomorphe sur UnenUn = C.
Enfin, |l2,a(5,0l ^ f-\ \9(s>t)\dt ^ 2C^(a)e2ir^a, ce qui permet de conclure.
(ii) Soit g(t, s) = ^^^y de telle sorte que Ii,a(s,£) = - J^00 g(t, s) dt.
• Si t G [a, +oo[ est fixé, alors 5 h-> g(t, s) est holomorphe sur Un-
• fo(M)| = l(2=S«Fî ^ Ç?$⣠< e*N(*4 +4)N/2e2^, pour tout « € [o,+oo[ et s € UN.
Comme f < 0, la fonction t *-+ ewN(t4 + 4)N/2e2w^ est sommable sur [a, +oo[, et on est donc dans les
conditions d'application du th. V.5.7, ce qui montre que s •-» Ii,a($>£) est holomorphe sur Un- Comme
ceci est vrai pour tout N, elle est aussi holomorphe sur UngnUn = C.
Enfin, |Ii,a(s,OI < /a+o°l0(M)l < e2^a/0+ooewN((* + a)4 + 4)N/2e2w^^, et comme on suppose
f ^ -1, on peut majorer l'intégrale par C'N(a) = /0+°°ewN((« + a)4 + 4)N/2e"2,rt dt, ce qui permet de
conclure.
(iii) Comme Fa(s,£) = Z)i=1Ii,a(«>£)> c'est une conséquence immédiate des (i) et (ii), et on peut
prendre C£(a) = 2CN(a) + 2C'N(a).
Question 4. (i) Si an est une suite tendant vers +oo, et si fn(t) = f(t)l[an,+oo[(t)> alors fn est majorée,
en valeur absolue par |/| et fn —> 0 en tout point de [0,+oo[. Il en résulte, d'après le th. de convergence
dominée, que f*°° f = /0+o° fn —> 0, pour toute suite tendant vers +oo. Ceci permet de conclure.
(ii) Ii,a(«iO est l'intégrale sur [a, +oo[ de la fonction sommable g(t) = fa^+apy ; il en résulte que
Ii,a(S)0 -» 0 quand a -» +oo.
Maintenant, Fa(s,^) = li,a(s,0 + l2,a(S)0 + l3,a(s,£)- Les arguments utilisés pour prouver que
Ii,a(s,£) -» 0 montrent que l3,a(«.0 -» 0- Enfin> |l2,a(s,OI < CN(a)e2^a, si s € UN, et quand a -» +oo,
on a CN(a) = ewN(a4 + 4)N/2. Comme (a4 + 4)N/2e27r*a -> 0 puisque £ < 0, cela permet de conclure.
(iii) Si a < /?, alors Fa(fc,f) - F/?(fc,£) est l'intégrale de f^^dz sur le rectangle de sommets
-1 + ia, 1 + «a, 1 + i@, -1 + i@. Comme f1+^\l dz est holomorphe sur le demi-plan Im(s) > -1 Prrvé
de i, la formule des résidus montre que Fa(fc,f) - F/?(*:,£) = 0, si a < /3 < 1 ou si 1 < a < fiy
H. 10. PROLONGEMENT ANALYTIQUE D'INTÉGRALES ET DE SÉRIES 609
et que Fa(fc,£) - Fp(k>Ç) = 2i7rRes((e1+^)l >ï), si a < 1 < /?. En particulier, a h-> Fa(fc,£) est
constant sur ]l,+oo[, et comme Fa(fc,£) -> 0 quand a -> +oo, on a Fa(fc,£) = 0 si a > 1 et
Fa(fc,0 = 2mRes((e1"^y)l,2), si a < 1.
(iv) Si k ^ 0, la fonction f1+^\l est holomorphe en i et son résidu est nul, et donc Fa(fc,£) = 0.
Si k = 1, la fonction f1+^,2)l a un pôle simple en 2 = i de résidu lim^s—t)%+**a* = lim e ^* * = ^e2n^.
OnadoncFa(l,0 = 7re27r^.
Si fc = 2, la fonction f1+^2)l a un pôle d'ordre 2 en z = i, et le résidu est le terme de degré 1 du
développement de Taylor de \z^ en z = i. Comme
e-2i*tz e2,r«(l-2t7r^-t) + ---) -1 2lrf/, ,. „. ,w
çnp = :4+4i(z-i)+... -t^1+(!-*"«<*-!)+• • • >•
on a Fa(2,0 = 2m • ^(i - 2iiïÇ)e2«t = (f - 7r2Oe2?r*.
Question 5. (i) Cela résulte du changement de variable u = —t et de la parité de (f>s.
(ii) Comme ia,R est un lacet inclus dans Cl qui est contractile, l'intégrale de e2n^z(f>s(z)dz le long de ce
chemin est nulle, et ce, pour tout R. Sur chacun des segments [R, R+iR], [R+iR, 1+tR], [-1+iR, -R+iR]
et [-R + iR, -R], on a \z2 +1| ^ R2 - 1 et \e2n*z\ ^ 1, et donc \e2lïtz<f>8(z)\ ^ (XT)ft"(«> • Par ailleurs, ces
quatre segments sont de longueur ^ R, et donc la somme des intégrales sur ces segments est, en valeur
absolue, majorée par ^eVnc"(a), et donc tend vers 0 quand R tend vers +00 puisque Re(s) > |. Comme
l'intégrale sur [-R,R] tend vers 0S(O> et comme la somme des intégrales sur les trois morceaux restants
tend vers -Fa(s,£)> cela permet de conclure.
(iii) C'est une conséquence immédiate du (iii) de la question 3.
Question 6. (i) La fonction j^ est sommable, ainsi que sa dérivée M+glxa ; on peut donc lui appliquer
la formule de Poisson ce qui nous donne, en utilisant la formule 0i(n) = 7re~~27r'nl, conséquence du (ii) de
la question 5 et du (iv) de la question 4 (pour n< 0), et de la parité de 0i (pour en déduire le cas n > 0) :
^ 1 t^ P~2" 1 4- P~2lï
De même,
E 07^2 = *»(o)+2 e Fi/2(2> -») = r+2 E (f+^K2™-
n€Z * ' n=l n=l
On conclut via la formule Ylt™onzn = (i-z)* obtenue en dérivant l'identité ^ = £Îïï*n-
(ii) D'après le (iii) de la question 3 (utilisé pour a = |), on a |F1/2(s,-n)| ^ C^(^)e"nny pour tous
n > 1 et s e Un- Il en résulte que la série Ylt™i ^1/2(5, —n) est normalement convergente sur Un, et
comme chacun des termes est holomorphe sur C tout entier ((iii) de la question 3), sa somme F(s) est,
d'après le th. V.5.1, holomorphe sur Un- On en déduit l'holomorphie de F sur UnenUn = C, ce que l'on
voulait démontrer.
(iii) Si Re(s) > <r, alors 177^+TT5"! ^ (na+i)« » et comme *a série X]nez (na+i)g est convergente si a > \,
il en résulte que la série X)n€Z (n*+i)« est normalement convergente sur le demi-plan Re(s) > <r, pour
tout a > \. Comme chaque fonction s h-> , ^l)s est holomorphe sur C, et qu'une série normalement
convergente de fonctions holomorphes est holomorphe (th. V.5.1), G est holomorphe sur le demi-plan
Re(s) > <t, pour tout a > |, et donc aussi sur la réunion de ces demi-plans, ce qui permet de conclure.
610
ANNEXE H. PROBLÈMES CORRIGÉS
(iv) Si Re(s) > 5, la fonction (f>s et sa dérivée t h-> (1+^l)a-n sont sommables sur R; on peut donc lui
appliquer la formule de Poisson, ce qui nous donne, en tenant compte de ce que0s(n) = 0s(-n),
+00
G(s) = 0,(0) + 2 J2 Fi/2(*, -n), si Re(s) > -.
n=l ^
Maintenant, la série dans le second membre aussi égale à<£s(0) + 2F(s). Comme F est holomorphe sur C
tout entier et G l'est sur le demi-plan Re(s) > 5, on en déduit que 0S(O) est holomorphe sur ce demi-plan,
et donc coïncide avec r[g) sur ce demi-plan puisque 0S(O) - p/*) est identiquement nulle sur
]|, +oo[. La fonction r/*v~* +2F(g) est alors méromorphe sur C, holomorphe en dehors de pôles simples
aux -k + 5, pour k G N, et est égale à G(s) sur le demi-plan Re(s) > \ ; c'est donc le prolongement
voulu.
(v) Si s = -fc, avec k G N, tous les termes de la série définissant G(s) sont nuls (pour <f>3(0) c'est dû à
la présence de pôles de T aux entiers négatifs, pour Fi/2(s, -n), cela fait l'objet du (iv) de la question 3)
et donc G(-fc) = 0, si k G N.
Question 7. (i) La dérivée fc-ième fStk(t) de t »-► f(t)s est de la forme t »-► f(t)s-hPk(s, /(t),..., /<*>(«)),
où Pfc est un polynôme. En particulier, fSik(Q) est de la forme Qik(5)/(0)S""A;, où Q& est un polynôme en
s. La formule de Taylor avec reste intégral nous donne
On en déduit que
j£,^W'«=tiS^i)+j[Ij[,'^+",'-*^(1-)"**
Maintenant, s »-► g(sytyu) = <as+6+n+1/s,n+i(^)(l - u)n est holomorphe sur Re(s) > -k±^tL, pour
tout (t,u) G [0,1] x [0,1], et est une fonction continue de (s,i,u), ce qui implique l'existence, pour tout
compact K de Re(s) > -6+%+1, d'une constante Ck telle que \g(syt,u)\ ^ Ck, si (s,t,u) G K x [0,1]2.
On peut donc utiliser le th. V.5.7 pour en déduire que s h-> J0 J0 <as+6+n+1/s,n+i(*^)(l - u)n dudt est
holomorphe sur le demi-plan Re(s) > -6+%"fl. Comme les autres termes sont méromorphes sur C tout
entier, avec des pôles simples aux ■=^, pour k G {1,..., n + 1}, on voit que s h-> f* tas+bf(t)s dt admet
un prolongement méromorphe au demi-plan Re(s) > -6+%+1, avec des pôles simples aux :z^, pour
k G {1,... ,n}. Comme ceci est vrai pour tout n G N, cela permet de conclure.
(ii) On découpe l'intégrale f*™ en trois morceaux : ] — 00, —1], [-1,1] et [l,+oo[. Sur ] - 00, -1]
(resp. [l,+oo[), on fait le changement de variable t = ^ (resp. t = £), et on tombe sur l'intégrale
Jq1 uds~2 (ttjP(_1/tt))J du (resp. f* uds"2 ^dp^/^y du) qui peut se traiter en utilisant le (i). Comme les
méthodes habituelles montrent que s h-> /_x pAp- dt est holomorphe sur C tout entier, cela permet de
conclure.
(iii) On écrit P sous la forme Y[fJ0(z - a,j - ibj)(z - a,j + ibj), avec bj > 0, pour tout j. On a alors
pJL.. = jjJ/J (672s0s(£=^-)), si z G R, et comme la formule définit une fonction holomorphe sur fi+ et
sur f2~, cela permet de conclure (en fait, il suffit d'enlever des demi-droites verticales partant des zéros
de P dans le demi-plan Im(z) > 0 (resp. Im(z) < 0)).
(iv) La série converge normalement sur tout demi-plan de Re(s) > <r, si a > 3, et donc Gp est
holomorphe sur Re(s) > 3. Par ailleurs, sur ce demi-plan, t h-> p4p- est sommable, ainsi que sa dérivée
t1-> pffffi, ce qui permet d'utiliser la formule de Poisson et d'obtenir Gp(s) = X]n6Z </>pAn)- La fonction
H. 10. PROLONGEMENT ANALYTIQUE D'INTÉGRALES ET DE SÉRIES 611
s "-> 0p,s(O) fait l'objet du (ii) ; elle admet un prolongement méromorphe à C, holomorphe en dehors de
pôles simples aux -^p, pour fceN.
La méthode du (ii) de la question 5 permet d'écrire 0p,s(O comme l'intégrale de e"2in^z(f>piS(z) sur le
chemin constitué de ]-B+ioo, -B+i/?], [-B+i/?,B+i/?] et [B+i/?,B+ioo[ (resp. de]-B-ioo,-B-i/?],
[-B - i(3, B - i(3) et [B - 0, B - ioo[), où B = A + 1 et f) e]0, a[, si £ < 0 (resp. si £ > 0). Ceci permet de
montrer, comme au (iii) de la question 3, que 5 ■-» 0p|S(f ) se prolonge en une fonction holomorphe sur C,
et qu'il existe une constante Cn telle que l'on ait |0p,s(OI ^ C^e"2n0^, pour tous 5 G Un et £ vérifiant
|£| ^ 1. On en déduit, comme au (ii) de la question 6, que 5 i-> £n€Z-{o> 4>piS(n) se prolonge en une
fonction holomorphe sur C, et donc que Gp se prolonge en une fonction méromorphe sur C, holomorphe
en dehors de pôles simples aux ^p, pour fceN.
612
ANNEXE H. PROBLÈMES CORRIGÉS
H.ll. La fonction 77 de Dedekind
L'objet de ce problème est d'établir les identités suivantes^16), dues à Euler et à Jacobi,
gi/24 JJ(1 _ qn) = J2(-l)mq(6m+1)2/24
n>l mGZ
Y^ qm2wm = J](l - q2n)(l + 92n-1«;)(l + q2n-lw~l)
mGZ n>l
Il s'agit d'identités formelles, mais si on pose q = e2l7rT, les deux membres convergent pour r
appartenant au demi-plan de Poincaré Jf = {z G C, îm(z) > 0}, et nous allons montrer que les
deux fonctions ainsi définies sur Jf? sont égales. Le chemin que nous allons suivre^17) pour arriver
au résultat va demander d'utiliser une bonne partie des techniques introduites dans le cours.
Si t G R, on note Çtt le demi-plan ouvert {z G C, Re(z) > i).
On note log : C* —► C la détermination du logarithme définie par — tt ^ Im(log^) < —n
(on rappelle que Im(logz) est aussi l'argument arg(z) de z). La fonction log est holoniorphe sur
C — R_, de dérivée \, et la dérivée de la fonction t h-> log(£ + i) sur R est donc t1-» ^.
Si a; G C* et si s G C, on pose zs = exp(slogz). On a \zs\ ^ e*|im(«)l|z|Re(«).
On note T la fonction T d'Euler ; c'est une fonction méromorphe sur C ne s'annulant nulle part,
holoniorphe en dehors de pôles simples en les —n avec lims_>_n(s-|-n)r(s) = ^f , pour n G N,
qui vérifie l'équation fonctionnelle T(s +1) = sT(s), et qui est donnée par T(s) = /0+o° e~Hs~l dt,
si s G ft0 (cf. th. VII.2.1).
On note £ la fonction zêta de Riemann ; c'est une fonction méromorphe sur C, holoniorphe en
dehors d'un pôle simple en s = 1, et qui est donnée par £(s) = X)nS ï^> s* s e ^1 (c^ tn- VII.3.4).
On a C(0) = ^ (ex. VII.3.6).
Question 1. Si $ G fii, on définit <j>s : R —► C par <f>s(t) = ,tKa.
(i) Vérifier que (f>3 G ^(R), est dérivable sur R et que <f/s = ji^^s-
(ii) Montrer que 0S est à décroissance rapide à l'infini.
(iii) Montrer que (j>s est solution de l'équation différentielle xy' + (2irx + 1 — s)y = 0.
(iv) En déduire que (f>s(x) = 0, si x ^ 0, et qu'il existe une constante c(s) telle que <f>s(x) =
c(s)e-27rxzs-1, si x > 0.
Question 2. Soit s G Oo-
(i) Montrer que /0+o° e~TXxs~1dx converge si r G fio, et que la fonction Gs ainsi définie est
holoniorphe (en r) sur Oo-
(ii) Que vaut Gs(r), si r G R+ ? En déduire que Gs(t) = ^, pour tout r G Oo-
(iii) Montrer que (1 - it)s = e_if s(£ -I- «)s, si £ G R.
(iv) Calculer la transformée de Fourier inverse de <j>s. En déduire que c(s) = e~TSVra--
Question 3. (i) Calculer <£s, si s est un entier ^ 2, par la méthode des résidus,
(ii) Que donne la méthode des résidus si s n'est pas entier ?
(16)Elles montrent qu'il se passe de drôles de choses quand on développe les produits.
(17)I1 existe des démonstrations combinatoires de cette identité : cf. Hardy & Wright, An introduction to
the theory of numbers, § 19.11.
H. 11. LA FONCTION rç DE DEDEKIND
613
Question 4. Soient Y0 = {{m,n) 6 Z2, m > 0, n ) 0}, Yi = {(m,n) e Z2, m ^ 0, n > 0},
et soit Y = Yo U Yi. (On remarquera que cette réunion est disjointe, et que Z2 — {(0,0)} est la
réunion disjointe de Y et de —Y = {-a;, w e Y}.) Soit r G Jf, et soit s G Ù2-
(i) Soit K un compact de ^2- Montrer qu'il existe C(K) > 0 et a(K) < —2 tels que, pour tous
s e K et (m,n) e Y, on ait l^^l ^ C(K)sup(|m|, |n|)°(K).
(ii) Montrer que la série S(m,n)eY (m+nr)* C0Ilvcrë°> ct ^l^firiit une fonction s ■-► E(t,s),
holomorphe sur Û2-
(iii) Montrer que Z)m€Z (m+nr)* = X^Si c(s)Ars-1e2"rn^r, si n ^ 1. (On s'intéressera à la
transformée de Fourier de 11-> /i(£) = <t+lnTy, en écrivant nr sous la forme a + i(3.)
(iv) En déduire que E(r, s) = £(s) + e~^s^r SfcS crs_i(A;)e2i7rA:T, où <7t(À:) désigne la somme
des puissances £-iômcs des diviseurs de k (i.c. 0"t(6) = 1 + 2* + 3* + 6*). (On commencera par
montrer que J2d\k K_1| ^ fcRe(s).)
(v) Montrer que s i-> E(r, 5) possède un prolongement méromorphe à C, holomorphe en dehors
d'un pôle simple en s = 1, et que E(r,0) = ^.
Question 5. Soit (p une fonction méromorphe sur un ouvert contenant la demi-droite réelle
[0, +oo[, holomorphe en dehors d'un pôle d'ordre k en z = 0.
(i) Montrer qu'il existe r > 0 et des an e C, tels que J2n>-k \an\fn < +00 et (p{z) =
Zî=-kanzn,si\z\^r.
(ii) Montrer que Ii(s) = /Qr <p(t)ts 1 dt converge si Re(s) > fc, possède un prolongement
méromorphe à C tout entier, holomorphe en dehors de pôles simples aux entiers ^ k, et que
lims_>n(5 — n)Ii(s) = a_n, si n ^ k. (On commencera par montrer que î\(s) = J2n^-k ^+ïT"-)
(iii) On suppose de plus que ip est à décroissance rapide en +00. Montrer que A(<p, s) =
/0+o° (p{t)ts~ldt converge si Re(s) > k, possède un prolongement méromorphe à C, holomorphe
en dehors de pôles simples aux entiers ^ k, et que lims_»n(s — n)A(<p, s) = a_n, si n ^ k.
Question 6. Si i = 0,1, soit fi(r, s) = £ (mJnr)» 5 on a E(r>s) = M7"'5) + /i(r> s)> si s e fi2-
(m,n)€Yt-
(i) Soit aeîîo tel que olt G O0- Montrer que (a(m+nT))., = a»(m+nr)*» si (m,n) e Y0.
(ii) Soit Ga(t) = (e«»-i)(l-e-«T»)- Montrer que /0(r,s) = ^y /0+o° G^)*5"1^, si s e 02-
(Utiliser la question 2 pour exprimer (a(m+nT\\.s •)
(iii) En déduire que s ■-> /o(r, s) possède un prolongement méromorphe à C tout entier,
holomorphe en dehors de pôles simples en s = 1 et s = 2.
(iv) Calculer les premiers termes du développement de Ga en 0. En déduire les formules^18)
lims_2(s - 2)/0(r,5) = ±, linw(s - l)/0(r,s) = ^ et /0(r,0) = é + îfe " i
Question 7. (i) Que deviennent Yo par (m, n) ■-> (—n, m) et Yi par (m, n) ■-> (n, —m) ? En
déduire que E(^r, 2A;) = r2A:E(r, 2fc), si fc est un entier ^ 2.
(18)La même méthode fournit la formule /i(r, s) = w^y/0 (e«t_i)(i-eoTt)<s~1^) avec a vérifiant
Re(ar) > 0 et Re(-a) > 0, ce qui permet de prouver que /i(r,s) possède aussi un prolongement
méromorphe à C, holomorphe en dehors de pôles simples en s = 2 (résidu =^) et s = 1 (résidu ^r1), et
de retrouver le (v) de la question 4, ainsi que les propriétés de C rappelées dans le préambule.
614
ANNEXE H. PROBLÈMES CORRIGÉS
(ii) Montrer que log _n|mr
■{
log r — log(—n + tot) si (m, n) G Yo,
log r - log(n - tut) - lit si (m, n) e Yi.
(iii) En déduire que, pour tout s G C, on a E(^,s) = rs(E(r,s) + (e_i,rs - l)/o(r,s)).
(On commencera par supposer s G Œ2O
(iv) Montrer que E(^±, 2) = r2E(r, 2) - iirr.
Question 8. On note F(r) la dérivée en s = 0 de s *-*■ E(r, s).
(i) Montrer que le produit e"""/12nnS(l ~~ e2mnT) converge si r G M', et que la fonction
r) : Jif —► C ainsi définie est holomorphe sur Jff et ne s'y annule pas.
(ii) Montrer qu'il existe une fonction g, holomorphe sur Jtf, vérifiant e9 = 77, et qu'il existe
a G Z tel que l'on ait g = h + a2iir, où h(r) = ^ + ]£iï2 log(! ~ e2innT), pour tout r G Jf? (on
notera log 77 la fonction h.)
(iii) Montrer qu'il existe C G C telle que logtj(t) = -F(r) + *|Ç + C, pour tout t €<#?.
(iv) En déduire que log77^) = ^logr + log77(7-) - f1 et que r)(=±) = y/jr)(T), pour tout
r G <^\ où y/j est la branche valant 1 en r = i.
(v) Montrer, en utilisant l'identité du (iii), que ^ + 2fcE(r>2) = °- En déduire que C(2) = ^.
Question 9. Si r G 3^% la série Y^m^-^)™^*"^ * converge, et la fonction r i-> H(r),
ainsi définie, est holomorphe sur J^ pour les raisons habituelles. Nous laissons au lecteur le soin
2
de se convaincre que l'on a aussi H(r) = \ X)n€Z x(n)e2tir'^' > où \ '■ (Z/12Z)* —> {±1} est le
caractère de Dirichlet défini par x(l) = x(—1) = 1 et x(5) = x(—5) = — 1, que l'on voit comme
une fonction de Z dans {±1}, périodique de période 12, nulle sur les entiers non premiers à 12
(i.e. divisibles par 2 ou 3).
(i) On rappelle que la transformée de Fourier de 11-* e~nt est x ■-► e_7rx . Calculer la trans-
2
formée de Fourier de t ■-► e~2t7rne-7r2i2", si y > 0 et a G Z. En déduire l'identité
«,^•7. » " »,^'Z
n€Z T * nGZ
(ii) Vérifier*19) que ^L ^=_5 x(a)e~2i,r^ = *(n), pour tout nGZ.
(iii) En déduire que H(^r) = yîH(r), pour tout r G M'. (Commencer par r G iR+.)
(iv) Montrer que J(r) = H(t)/t7(t) est une fonction holomorphe sur JF, vérifiant les équations
fonctionnelles^20) J(r + 1) = J(r) et J(^) = J(r), pour tout reJif.
(v) Montrer qu'il existe une unique fonction q *-*■ J(ç), holomorphe sur D(0,1~), telle que
J(r) = J(e2"""), pour tout reJ^. Que vaut J(0) ?
(vi) Soit X = {r = x + iy, \x\ < §, y > 3}. On note dX la frontière de l'ouvert X (constituée
des demi-droites verticales [^y^, ^ +ioo[ et [2J*, § +ioo[, et du segment horizontal [=^it H^D»
et X = X U dX l'adhérence de X. Montrer qu'il existe c > 0 telle que |J(r) - 1| < ce'2**, pour
tout r = a; -I- iy G X. En déduire que |J — 1| atteint son maximum sur X en un point de dX.
(19)C'est un cas particulier du lemme VII.4.3.
(20)Autrement dit, J est une forme modulaire de poids 0 (cf. § VII.6).
H.ll. LA FONCTION r\ DE DEDEKIND
615
(vii) Soit r e dX. Montrer qu'au moins un des 5 nombres t + 1, r — 1, -^r, ^r + 1, -^r — 1
appartient à X. En déduire que J est constante^21) puis que H = r).
Question 10. (i) Montrer que le produit Yln>i(l—q2n)(l-\-q2n~lw)(l-\-q2n~lw~l) converge
pour tout w e C*, si \q\ < 1, et que la fonction w i-> A(q, w), ainsi définie, est holomorphe
sur C*.
(ii) En déduire l'existence et l'unicité de fonctions q i-> am(q), pour m e Z, définies
sur D(0,1~), telles que A(q,w) = J2m€Z am(q)wm, pour tous w G C* et q G D(0,1~).
(iii) Montrer que k(q,q2w) = ç_1w-1A(ç,u;), pour tous w e C* et q e D(0,1~).
(iv) En déduire que am(q) = qm a0(q), pour tout m G Z.
(v) Calculer de deux manières A(e3i7rT,— e""*), si t 6 «#; en déduire la formule du
produit triple de Jacobi :
J2 qm2wm = JJ(1 - q2n)(l + q2n-lw)(l + q2n-lw~l).
raeZ n^l
(vi) La fonction thêta de Jacobi est définie, sur J^, par 0(r) = J2meze™m T- Montrer
<lue 0(T) = v(2rV)Kt/2)2> pour tout T G Jif?'
Corrigé
Question 1. (i) On a |0s(t)| ^ ewIlllM(l + t2)-RcW2, et donc (f>s(t) = 0(|i|-Rc<s>) au voisinage de ±00,
ce qui prouve que <f>s est sommable, la fonction (f>s étant continue sur R puisque t »-► log(£ + i) l'est.
Par ailleurs, t »-► log(t + i) étant dérivable de dérivée ^, cela implique que (f>s = exp(-slog(i + i)) est
dérivable de dérivée t »-► s-^ exp(slog(i + i)) = j^i<t>s^ ce que l'on voulait.
(ii) On déduit du (i) que <f>s est de classe Sf*, pour tout fc, et <f>s = (s)(-s - 1) • • • (-5 — k + l)(f>s+k
est sommable pour tout fc. Il résulte donc du (i) du th. IV.2.8 que (1 + a:2)/îJ/2|0s(a:)| tend vers 0 à l'infini
pour tout k e N, et donc que (j>s est à décroissance rapide à l'infini.
(iii) Notons y la transformée de Fourier de (f>s. Il résulte du (i) du th. IV.2.8 et du (ii) de la
question que la transformée de Fourier de (f>'s est 2iitxy, et du (ii) du th. IV.2.8 que celle de t h-> t<t>'3 est
x h-> ^(2iirxy)' = -xy' - y. Appliquer & à l'identité t(t>'3 + i(f>s + scf>s = 0 nous fournit donc la relation
-xy' - y - 2nxy + sy = 0, soit xy' + (2nx + 1 - s)y = 0, ce que l'on cherchait.
<21>Les fonctions E2k = E(r,2fc) = C(2fc) + (-l^ffj^i Ew>ia2fc-i(n)gw de la question 7 sont des
formes modulaires appelées séries d'Eisenstein; la fonction 77 est la fonction 77 de Dedekind\ sa
puissance 24-ième A = <zlln2*i(l " <Zn)24 est l'objet romantique de la théorie des formes modulaires;
Ramanujan lui a consacré de nombreux travaux. On peut démontrer, avec les mêmes méthodes, que
C(6)2E3 - C(4)3E2 = aA, avec a = 3^C(6)2C(4)2 + 2^C(4)3C(6), ou que C(8)E2 = C(4)2E8 [en
considérant A~~2(Ç(8)E2 - £(4)2E8)3], ou encore que E2k est un polynôme en E4 et E6.
La fonction rj apparaît dans des contextes assez variés. Par exemple, écrivons le nombre de solutions de
l'équation y2+y = x3-x2 dans Fp sous la forme p+ap, et formons le produit 1,111-a Ilp^u i-a p-*+pi-3«>
que l'on développe sous la forme J2n>iann~~s- Alors J2n^ianQn = v(T)2rl(^T)2 (Eichler, 1954). Ce
résultat a donné naissance à une conjecture célèbre (la conjecture de Taniyama-Weil) reliant courbes
elliptiques et formes modulaires, dont une solution partielle a permis à Wiles (1994) de démontrer le
th. de Fermât; le cas général a été établi par Breuil, Conrad, Diamond et Taylor (1999).
616
ANNEXE H. PROBLÈMES CORRIGÉS
(iv) L'équation différentielle ci-dessus peut se réécrire sous la forme ^- = -2n + ^, dont les solutions
sur R+ et R* sont de la forme c±e""27rx|a:|s"'1. Or on sait que (j>s est à décroissance rapide à l'infini, ce
qui implique que c" = 0. On en déduit le résultat.
Question 2. (i) Si a > 0, on a \e"TXxs"l\ < e"axx8"1, pour tous x G R+ et r G f2a> et comme
x »-► e~~axxs~~l est sommable sur R+ etn-» e~~TXxs~l est holomorphe sur f2a, pour tout x G R+, on
peut appliquer le th. V.5.7 pour en déduire que r »-► Gs(r) = f*°° e~TXxs~l dx est holomorphe sur Qa.
Comme ceci est vrai pour tout a > 0, Gs est holomorphe sur Ua>0fîa = ^o-
(ii) Si r G RJ, on obtient Gs(r) = J0+o° e'uu8"lr1"8^ = ^?, via le changement de variable x = ±.
Maintenant, r h-> ^^ est holomorphe sur f20> et donc Gs(r) - ^^ est une fonction holomorphe sur
l'ouvert connexe f20) nulle sur R+. Elle est donc identiquement nulle d'après le th. des zéros isolés, ce qui
permet de conclure.
(iii) On a Im(log(* + i)) G]0,tt[, si t G R, il s'ensuit que Im(log(i + i) - Ç) G] - §, § [c [-7r,7r[, et donc
que log(l - it) = log ^f* = log(t + i) - Ç- Ceci permet de conclure.
(iv) Comme 0S est à décroissance rapide et continue, elle est sommable, et il résulte de la formule
d'inversion de Fourier dans L1 (prop. IV.3.25), que &<bs = <t>s- Par ailleurs, on a
/+oo /»+oo
e2™tXï3{x) = C(S) / e*™txe-2™xs-l dXy
oo JO
et les (ii) et (iii) nous donnent &(f>s(t) = (2ffii-$)« = C{S%î)^S)<f>s(t)- On en déduit le résultat.
Question 3. (i) Si x > 0, on intègre la fonction gs(z) = \z^s le long du chemin 7r composé du
segment [-R, R] et du demi-cercle inférieur de centre 0 et de rayon R. La fonction g est méromorphe sur
C, holomorphe en dehors d'un pôle en z = —i, et le résidu res((/s, — i) en ce point est le terme de degré 5—1
dans le développement de Taylor de e~2ilTZX, à savoir jj^^mx)8-^-2™^^ = (-i)*-i!g£^e-2*x.
Quand R > 1, on a I(7u, -i) = -1, et donc J7r gs(z)dz = -2m{-i)8-^j^e-2«x = H)s^e"2™.
Quand R —> +oo, l'intégrale sur le segment tend vers (f>s(x), et sur le demi-cercle on a les majorations
|e-2i7r2x| ^ i et |, * | ^ ,R^1)a, et comme le demi-cercle est de longueur 7rR, l'intégrale sur le demi-
cercle est majorée, en module, par m!!\\s ; elle tend donc vers 0. Un passage à la limite nous donne donc
<f>s(x) = (-i)s^f7sye~~2nx> ce Qui est compatible avec les résultats de la question 2.
Si x ^ 0, on intègre gs(z) le long du chemin 7^ composé du segment [-R, R] et du demi-cercle supérieur
de centre 0 et de rayon R. La seule chose qui change avec le calcul précédent est que I(7r\ -i) = 0, et
donc que l'intégrale le long de ce chemin est nulle, ce qui nous donne <f>s(x) = 0.
(ii) Si 5 n'est pas un entier, la méthode des résidus permet, comme ci-dessus, de montrer que(f>s(x) = 0,
si x < 0, car gs est holomorphe dans un ouvert contenant 7^. Par contre, on ne peut pas calculer (f>s par
un calcul de résidu car gs n'est pas méromorphe dans un ouvert contenant tr (il y a une discontinuité le
long d'une demi-droite partant de -i et dépendant du choix<22) de la détermination de log).
(22>On peut choisir de couper la demi-droite verticale [-i, -ioo[, et d'intégrer sur un chemin composé du
segment [-R, R], d'un quart (presque) de cercle de centre0 et de rayon R, du segment [-iR+e, -i-e), d'un
demi-cercle de centre -i et de rayon e parcouru dans le sens trigonométrique, du segment [-i-e, -iR-e],
et d'un second quart (presque) de cercle de centre 0 et de rayon R (faire un dessin). L'intégrale de gs sur
ce chemin fermé est nulle car on peut le déformer sur un point en restant dans le complémentaire de la
demi-droite. Par ailleurs, quand R et e tendent vers +00 et 0, les intégrales sur les morceaux de cercles
tendent vers 0, l'intégrale sur [-R, R] tend vers <t>s(x), et les intégrales sur les segments verticaux tendent
vers Pintégale sur la demi-droite [-ioo, —i[ (il faut faire attention au fait que la valeur du logarithme
H.ll. LA FONCTION r\ DE DEDEKIND
617
Question 4. (i) Les normes \x + ry\ et sup(|a:|, \y\) sont équivalentes sur R2 ; il existe donc c> 0 tel que
\x + ry\ > csup(|a:|, \y\)y pour tout (*,</) G R2. On a donc | (^^1 ^ c-^^e^M-^l^^,^^^.
On en déduit le résultat avec a(K) = -infs6i<Re(s) (on a a(K) < -2 car l'inf est atteint en un point
du compact) et C(K) = sups6K c-^(s)eir\im(-s)\ (on a q^ < +00 car je sup est atteint en un point du
compact).
(ii) Si A; G N-{0}, il y a (2k+l)2-(2k-l)2 = 8k couples (m, ri) G Z2 vérifiant sup(|m|, |n|) = fc, et donc
4k dans Y. Si K est un compact de fî2, on a donc £(m>n)6Y | (m+nr)* I ^ £)£ 4fcC(K)A;a(K) < +oo car
l+a(K) < -1. La série est donc normalement convergente sur tout compact defÎ2, ce qui permet d'utiliser
le th. V.5.1 pour montrer que la somme est holomorphe sur f22> chacune des fonctions 5 h-> tm+nry > étant
holomorphe de manière évidente.
(iii) La fonction h est sommable et sa dérivée aussi. On peut donc utiliser la formule de Poisson
(th. IV.3.11) pour obtenir £m6Z h(m) = ££6Z h(£). On a h(x) = JR e~2iirtx ^+al+i0)n dt. Le changement
de variable t = au - (3 nous donne
h(x) = Pl-8e2i™xj>s(Px) = pl-se2i™xc(s)e-2"0x(Px)3-1 = c{s)x8~l e2i™TX.
On en déduit le résultat.
(iv) La formule s'obtient en transformant la somme X)nTi X]£fi en Ylt™\ X^d|fc> v*a *e changement
de variables d = n, k = Un. Il faut quand même vérifier qu'on a le droit de réordonner les termes
comme on veut, et pour cela il s'agit de vérifier que la série double est absolument convergente, i.e. que
ES £S^""le~27ran£ < +oo, si a = Re(s) > 2 et a = Im(r) > 0. Or on peut utiliser le changement
de variables ci-dessus dans cette série à termes positifs, et obtenir Ylt™i ^2d\kda~le~2nah> et comme k
a au plus k diviseurs, qui sont < fc, on peut majorer ceci par Ylt^i kae~2*ak) dont la somme est finie.
Ceci permet de conclure.
(v) 5 h-> X)£^ï a8-\{k)e2™kr est une série de fonctions holomorphes, qui converge normalement dans
tout demi-plan de la forme Re(s) < a, avec a ^ 1 (on a |<ts_i(à;)| < ka sur un tel demi-plan). On peut
donc utiliser le (ii) du th. V.5.1 pour en déduire l'holomorphie de X)*=i as-i(k)e2iirkT sur C. On conclut
en utilisant les propriétés des fonctions Ç et T rappelées dans le préambule (dont on déduit, en particulier,
que 5 h-> e_i^s^r- est holomorphe sur C, avec des zéros en 5 = -n, pour n G N).
Comme £ s'annule en 5 = 0, on a E(r,0) = Ç(0) = =±.
Question 5. (i) Soit Q un ouvert contenant [0, +oo[ sur lequel <p est holomorphe en dehors d'un pôle
en 0. On a donc <p(z) = Y,i=i ^r + u(z)> où u est holomorphe sur Çî. Soit ri = d(0, C - Q). Alors u est
somme de sa série de Taylor sur D(0, rf) (cf. (i) de la rem. V.4.9), qui converge donc absolument sur tout
disque fermé D(0,r), avec r < r\. Pour un tel r, on peut donc écrire <p(z) sous la forme Z)n>-*aw2n>
pour tout \z\ < r, et on a Yln>-k lan|rn < +°°.
(ii) On a «-»*(*) = Z:é-kant°+"-1. Or ££_,£ k^"1^ < E^ ^g^T < +0°> si
Re(s) > k, car Re(s + n) ^ 1, si n ^ -k et EÎT-fc K|rRc(s)+n < +00. On déduit du th. de Pubini
sur N x X que la série converge dans L^fO,?*]) (et donc que la somme est sommable), et que l'on peut
intervertir la somme et l'intégrale, ce qui nous donne Ii(s) = En^-fc °a+n "•
n'est pas la même sur les deux demi-droites qui apparaissent). On en déduit, en faisant le changement de
variable t = -i(l + u) sur les 2 demi-droites allant de -ioo à -i et de -i à -ioo,
/+00 1 ... r+00 z>-2jti
—t-^e-2intxdt = i(e-*?s - e^e-2™ / e~2ltxuu-8du = 2e-^ssin7rsr(l - s),* xl .
Une compaiaison avec la question 2 fait appaïaître la formule des compléments T(s)r(l - s) = ^f^.
618
ANNEXE H. PROBLÈMES CORRIGÉS
Soit N > k. On découpe la série en X)n=-fc "*£+„"* Qu^ est une fonction méromorphe sur C, avec des
pôles simples de résidu a_n en les n G Z vérifiant -N < n ^ fc, et X]n^N+i ^h^T" qu* conver6e
normalement sur D(0,N") car \S^L\ < rRc^|anrn|, si n > N + 1 et |*| < N. Il s'ensuit, d'après le th. V.5.1,
que £)n^N+i ag+nW définit une fonction holomorphe sur D(0, N""), et donc que Ii est méromorphe sur
D(0,N~~), holomorphe en dehors de pôles simples de résidu a_n en les n G Z vérifiant -N ^ n < k. Le
résultat cherché s'en déduit en écrivant C comme la réunion des D(0,N~), pour N G N.
(iii) On décompose A(<p, s) comme Ii(s) + I2(s), avec Ii(s) = JQr ^p{t)ts~ldt et I2(s) = Jr+0° ip{t)t*~ldt.
La fonction 5 h-> Ii(s) a été étudiée au (ii) ; il suffit donc d'étudier la fonction s h-> 12(5). Si <p est à
décroissance rapide, f*°° ip(t)ts~l converge pour tout 5 G C. Sur une bande verticale a < Re(s) < 6, on
peut majorer \ts~~l(p(t)\ par sup(ta>tb)\(p(t)\, qui est sommable sur [r,+oo[. On en déduit, en utilisant le
th. V.5.7, que s h-> 12(5) est holomorphe sur cette bande, et comme C est la réunion de ces bandes, cela
prouve que s h-> 12(5) est holomorphe sur C. Le résultat s'en déduit.
Question 6. (i) Les conditions Re(a) > 0 et Re(ar) > 0 se traduisent par 0 < arg(a) < n - arg(r). Par
ailleurs, on a 0 ^ arg(m + nr) < arg(r), si (m, n) G Y0, et donc 0 ^ arg(a) + arg(m + nr) < n ; on en
déduit que arg(a(m 4- nr)) = arg(a) + arg(m + nr), ce qui permet de conclure.
(ii) D'après la question 2, on a ^jpr = p^y J0+oc,c""taw*s"1d*, si a; G Y0. Il s'ensuit que /o(r,s) =
+OO +OO .a-1
Ei'-^^'i-r-'sj:
-tauf8-1 \ _ja-l V^ V^ p-«(nRc(a)+mRc(aT)) __
e
t°
a;6Y0 m=l n=0 V ±A± c '
qui est sommable, car à décroissance rapide à l'infini et 0(£a~~3) au voisinage de 0 (et a-3 > -1). On peut
donc intervertir somme et intégrale, et le même calcul que ci-dessus montre queX)w€Y0 e"tauJ = Ga(t),
ce qui permet de conclure.
(iii) La fonction Ga vérifie les conditions du (iii) de la question 5. On en déduit que T(s)a"sfo(rys)
admet un prolongement méromorphe à C, avec des pôles simples en les entiers ^ 2. Comme p^y est
holomorphe sur C, avec des zéros simples aux entiers négatifs, cela implique que /o(r, s) est holomorphe
en dehors de pôles simples en 5 = 1 et s = 2.
(iv) On a
11 1
G«(*) =
(ea* _ 1)(1 _ e-arz) ^2^2 (1 + ^ + a^i + ... )(1 _ ap + «M£ + ... )
1 1 T-l 1 T 1
+ ^ + 77^ + 7^-7+-
a2rz2 az 2r 12r 12 4
Maintenant, d'après le (ii), \ims->n(s-ri)r(s)a~sfo(T>s) est le coefficient de degré -n dans le
développement de Ga en série de laurent au voisinage de 0. On en déduit que a~2 lims^2(s-2)/o(T, s) = ^r, et donc
lims_>2(s-2)/o(r,s) = \. De même, a-1 lims^i(s-l)/0(r,s) = ^,et danclim,_»i(s-l)/0(T,») = 2JËi.
Enfin, comme lims_»0 a~ssT(s) = 1, on a /o(t,0) = 12V + n ~ 3*
Question 7. (i) (m, n) •-» (-n, m) induit une bijection de Y0 sur Yi et (m, n) ■-► (n, —m) induit une
bijection de Yi sur Yo-
Maintenant, E(^±,2k) = E(m,n)eY (™ + tT* = ^ £(m,n)eY Fïï+fej^- Lasérie etant absolument
convergente, on peut sommer les termes dans l'ordre que l'on veut, et comme (-n+mT)2k = {n-mr)2k,
on a E(=l, 2k) = £(m,n)€Yo {.n+mT)2k + E(m,»)gYI (n-mr)^- 0r Kn) ~ ("^ w)induit une byection
de Y0 sur Yi, ce qui fait que la première somme vaut £(m>n)€Yi (m+nT)ik » tandis Que ^a seconde vaut
H.ll. LA FONCTION rj DE DEDEKIND
619
X](m,n)GY0 (m+lr)2fe» puisque (myn) »-* (n,-m) induit une bijection de Yi sur Y0. On en déduit le
résultat.
(ii) On a 0 < arg(r) < n.
Si (ra,n) G Y0, alors 0 ^ arg(-n + mr) < 7r, et donc -n < arg(r) - arg(-n + mr) < 7r, ce qui fait
que arg(__n\mT) = arg(r) - arg(-n + mr). On en déduit le résultat dans ce cas.
Si (m, n) G Yi, on a 0 ^ arg(n - mr) < arg(r), et donc 0 < arg(n_TmT) = arg(r) - arg(n - mr) < n.
On en déduit que arg(__n|mr) = arg(n_^nr) - 7r, ce qui permet de conclure.
(iii) Commençons par supposer que Re(s) > 2, de telle sorte que toutes les séries considérées sont
absolument convergentes. Comme ci-dessus /, (^,s) = £<m,n)€Y, (r^fer?)*. Or {z^^Y = (-wl'mr)«,
si (ra,n) G Y0, et comme (ra,n) »-► (-n,ra) induit une bijection de Y0 sur Yi, on en déduit que
fo{=r>s) = rsfi(rys). De même, (__njmT)* = e"iïïS(n4)fl} si (m,n) G Yi, et comme (m,n) i-> (n, -m)
induit une bijection de Yi sur Y0, on en déduit que /i(^,s) = e""Z7rsrs/0(r,5). Le résultat s'en déduit
(si Re(s) > 2) via la formule E(^,a) = /o(^,s) + /i(tS*)-
Le cas général s'en déduit par unicité du prolongement analytique (les deux membres sont des fonctions
méromorphes sur C, qui coïncident dans le demi-plan Q2 ; leur différence est donc identiquement nulle).
(iv) En utilisant la formule lims_>2(s - 2)/0(t,s) = £, on obtient lims_>2(e"i7rs - l)/o(r,s) = -in^
ce qui permet d'obtenir la formule voulue par passage à la limite à partir du (iii).
Question 8. (i) On a | - e2innT\ ^ e"27rna, si Im(r) > a. Il en résulte que la série des -e2innT converge
normalement sur le demi-plan Im(r) > a, si a > 0, et donc que le produit Iln^l " e2iirnT) converge et
définit une fonction holomorphe sur ce demi-plan, d'après le th. V.5.4. De plus, comme aucun des termes
du produit ne s'annule, la fonction ainsi définie ne s'annule pas non plus. On conclut en écrivant J4?
comme la réunion des demi-plans Im(r) > a, pour a > 0.
(ii) Comme r\ est une fonction holomorphe qui ne s'annule pas sur l'ouvert contractile ffî, il existe </,
holomorphe sur Jf?, telle que e9 = rj. Par ailleurs, la série ^ + ZÎÎ2 l°g(l - e2innT) est normalement
convergente sur tout demi-plan Im(r) > a, et donc définit une fonction holomorphe h sur Jtf. Or les
exponentielles des sommes partielles de cette série ne sont autres que les produits partiels de rj ; un
passage à la limite montre donc que eh = rj. On en déduit que g — h est une fonction holomorphe sur *#*,
à valeurs dans 2inZ ; elle est donc constante (par connexité de l'image, ou par le th. de l'image ouverte).
Ceci permet de conclure.
(iii) Comme lims^0 ± rfe = 1, on a F(r) = C + £+~ a^(k)e2i^k\ où C = C'(0).
Par ailleurs, logrç = *$. + £+~ iog(i - e2innT) = ^ - £+~ J2ÎS \e2i™h\ On obtient le résultat
en transformant la somme X)n~ ^î^i en X^&^i X]d|&> vm *e changement de variables d = £y k = £n.
(iv) En dérivant par rapport à 5 l'identité E(^r,s) = ts(E(t,s) + (e~~ilTS - 1)/o(t,s)), et en évaluant
en 0, on obtient F(^-r) = (logr)E(r, 0) + F(r) -i7r/0(r, 0), ce qui peut se réécrire, en utilisant les formules
E(r,0) = ^ et /0(r) = ép + T2~\ des Questions 4.(v) et 6.(iv), F(^) + ^ = -\log+rF(r)-^ + f.
La première formule s'en déduit en utilisant le (iii) ; on obtient la seconde en prenant l'exponentielle des
deux membres.
(v) En dérivant l'identité du (iii), on obtient ^£2 = -F'(r) + ff. Par ailleurs, comme une série
convergente de fonctions holomorphes se dérive terme à terme, on aF'(r) = 2inJ2t™i ka-i(k)e2tnhT.
Or fc<r_i(fc) = J2d\k 3 = 0"i(&)> car d h-> | induit une bijection des diviseurs de k. Il s'ensuit que
F'O") = âi(E(r, 2) - C(2)), et donc que ^ + ^E(r, 2) = % + ^C(2).
Maintenant, si on dérive l'identité du (iv), on obtient la relation ^ ^lîfâ = if + l$ï)' ^n en déduit,
en utilisant le (iv) de la question 7, que la fonction h(r) = ^^ + sfe^r, 2) vérifie l'équation fonctionnelle
620
ANNEXE H. PROBLÈMES CORRIGÉS
h(-l/r) = T2h(r). Comme h est constante d'après ce qui précède, cela implique que h = 0, et donc que
il + 2fcC(2) = °- 0n en déduit le résultat.
Question 9. (i) Le changement de variable t = Jyu (ou ^es f°rmules pour les dilatations translations)
nous donne
t e-2i«txe-2i«$e-ngdt=rÛ f e-2i«fê(x+û)ue-„u*du= m.^+zf = /^-^(m+a)*
«/r, y y «/r, y y y y
La formule J2neze~2™^e~~nSi^~ = \r§J2neze~~ï^(12n+a) est donc juste la formule de Poisson pour
la fonction t *-+ e"2in^e"n2i^', qui appartient à *5^(R).
(ii) On a Y?a=-r> x(o)e^2in^ = 2(cos ^ - cos ^p), et le résultat suit de ce que
1 si n = 0 mod 12,
-1 si n = 6 mod 12, ( ^
7i7r bnn I nn bnn \^ si n = ±1 mod 12,
cos — = cos —— = < 0 sm = ±3 mod 12, et cos — = - cos —- = < \^
1 si n = ±2 mod 12, ^ 2
si n = ±5 mod 12.
2
-i
2
si n = ±4 mod 12,
(iii) On a H(ty) = £ En€zX(n)e^V = ^ En€z(ïl.5X(a)c-a<f«)c-'JWI, ce qui se réécrit,
en utilisant le (i) et la convergence absolue de la série, sous la forme ?q= X^=_5 x{p) Y,nez e~n 12y" •
Par ailleurs, x(12n + a) = x(a)> et l'application (a,n) »-► 12n + a est une bijection de {-5,... ,6} x Z
sur Z, ce qui permet de réécrire la dernière somme sous la forme 5^= Ylmez x{m)e^^ = TTpH^). On
a donc bien H( j) = y/y K(iy)> si y G R+.
Maintenant, la fonction r »-► H(^r) - v/TH(r) est holomorphe sur Jf?y et nulle sur iR+ d'après ce qui
précède. Elle est donc, d'après le th. des zéros isolés, identiquement nulle, ce qui permet de conclure.
(iv) Que J(^r) = J(t) résulte du (iii) et de la question 8.(iv). Par ailleurs, e"i7rr/127/(r) est
périodique de période 1 puisque tous les termes du produit le sont. Il en est de même de e~~i7rr/12H(r) =
è Dn6z("1)ne"i7r(0n+ll2> _1 car ^""ff1 = 3n2 + n est un entier pair, pour tout n G Z. Le quotient de
e""i7rr/12H(r) par e""i7rr/127/(r), qui n'est autre que J(r), est donc aussi périodique de période 1, ce qui
permet de conclure.
(v) On a J(r) = J(e2i7rT), où 3(q) est le quotient de £nGZ(-l)V3n2+n)/2, Qui est une fonction
holomorphe sur D(0,1"") (utiliser le th. V.5.1), par nn^i(l " #n)> Qu^ est une fonction holomorphe
ne s'annulant pas sur D(0,1"") (cf. th. V.5.4) ; c'est donc une fonction holomorphe sur D(0,1"~). On a
J(0) = 1, comme on le voit en posant q = 0 dans les série et produit ci-dessus.
(vi) Comme J(0) = 1, la fonction q »-► q"l(J(q) - 1) a une limite £ en q = 0. Ceci se traduit par le
fait que r h-> e~~2i7rT(J(r) - 1) tend vers £ quand Im(r) —> +oo. Il existe donc M > 0 tel que l'on ait
|J(r) - 1| < (|*| + l)e-27rI,,,<T\ si Im(r) > M. Comme la fonction continue r i-> e27rI,n(r)|J(r) - 1| est
bornée sur le compact X n {r, Im(r) ^ M}, cela prouve que e27rIlll^T)|J(r) - 1| est bornée sur X, et donc
qu'il existe c> 0 tel que |J(r) - 1| ^ ce~~27rIlll(r), pour tout r G X.
Supposons J - 1 non identiquement nulle sur X, et soit r0, avec |J(r0) - 1| > 0. On choisit alors M tel
que ce~~27rM < |J(r0) - 1| de telle sorte que |J(r) - 1| < |J(r0) - 1|, si Im(r) ^ M. Le maximum de |J - 1|
sur X est donc le même que sur le compact X n {r, Im(r) ^ M}, et le principe du maximum implique
qu'il est atteint sur le bord de ce compact. Comme il n'est pas atteint sur le segment [-^p + iM, § + iM],
car on a |J(r) - 1| < |J(r0) - 1| sur ce segment, cela prouve qu'il l'est en un point de dX.
H.ll. LA FONCTION r\ DE DEDEKIND
621
(vii) Si r est dans la demi-droite J-^, =y +ioo[, alors r +1 G X. De même, si r est dans la demi-droite
]2±i, § + ioo[, alors r - 1 G X. Si r = g + iy G [^, 2±i], alors =± = ^±f = a:7 + iy' vérifie t/' > J car
x2 + £ ^ § < 1, et \x'\ < jpj- ^ | ; il s'ensuit qu'au moins un des trois nombres ^r, y 4-lou ^ ~ 1
appartient à X.
Soit r0 G dX tel que |J(r0) - 1| réalise le maximum de |J — 1|. Comme J prend la même valeur en les
nombres r0 + 1, r0 - 1, ^, ^ + 1 et ^ - 1 qu'en r0, et qu'un de ces nombres appartient à X, on voit
que |J - 1| atteint son maximum dans l'ouvert X. D'après le principe du maximum, cela implique que
J — 1 est constante, et comme \\mT^ioo J(r) — 1 = 0, cela prouve que J — 1 est identiquement nulle sur
X, et donc aussi sur Jf, d'après le th. des zéros isolés. On en déduit les identités J = 1 et rj = H que l'on
cherchait à établir.
Question 10. (i) Si g G D(0,1") est fixé, la série J^n>1 \q2n\ + \q2n~lw\ + \q2n~lw-l\ est normalement
convergente sur tout compact de C*, et donc le produit définit une fonction holomorphe de w sur C*,
d'après le th. V.5.4.
(ii) L'existence et l'unicité des am(q) est un cas particulier du cor. VI.3.2, appliqué à z0 = 0, Ri = 0
et R2 = +oo.
(iii) Quand on remplace w par q2w, on perd le terme 1 + qw de Iln^i(l + q2n~~lw), et on gagne un
terme l + q^vj-1 dans Yln>i(l+q2n~lw~1)- On a donc A(qyq2w) = 1±^f^A(qyw) = g-1tn-1A(g>tii).
(iv) On a Em6zam(9)im = qwA(q,q2w) = Em6zam(9)92m+1^m+1. On en déduit la relation
cim(q) = q2m~~la,m-\(q), pour tout m G Z. En écrivant am(q) sous la forme qm2bm(q)> cette relation
devient bm(q) = 6m_i(ç), pour tout m G Z ; on en déduit que bm(q) = bo(q) = a>o(q) pour tout m G Z, ce
qui permet de conclure.
(v) On a A(e3i7rT,-ei7rr) = EL^iC1 " ei7r3nr)(l - ei,r<3f|-1>r)(l - ei7r(3n-2>T) = Uk>1(l - e™hT), et
donc A(e3i7rr,-ei7rr) = e""i7rr/127/(r), si r G J^. Par ailleurs, il résulte des (ii) et (iv) que l'on a aussi
A(e3i7rr,-ei7rr) = a0(e3i7rT)Em6z(-1)m^7r(3m2+m)/2) et donc A(e3i7rr,-ei7rr) = a0(e3i7rr)e-i7rT/12H(r),
si r G Jtf. Comme H = rj sur Jt?, d'après la question 9.(vii), cela montre que a0 = 1 ; la formule du
produit triple s'en déduit.
(vi) On utilise la formule du produit triple avec q = einT et w = 1, et on écrit 1 + q2n~l sous la forme
[(l_g4n-2)(1__ 4n})(1 2n}
v ' -, ce qui nous donne
((i-«2*-M(i-«2n))(i-<74n)
= (e-tWr/1277(r))2^_iW2477(T/2)j-l^-i7rT/67?(2r)j-l
On en déduit que
«M = ( TT(1 -«»>))( nil + «!-1)l' (e-<"T/1MT))r' >£f
622
ANNEXE H. PROBLÈMES CORRIGÉS
H. 12. Irrationalité de <(3)
Le but de ce devoir est de démontrer (Apéry, 1979) que £(3) = S£î F est un I10mD1*e irra-
tionnel^23). La démonstration proposée est adaptée d'une relecture de la démonstration d'Apéry
par Nesterenko. Elle fait appel aux fonctions holomorphes et, de manière cruciale, aux propriétés
de la fonction T. Nous aurons en particulier grand usage de la formule de Stirling (prop. VII.2.9).
Soit O le demi-plan {s e C, Re(s) > |}, soit g : Q —► C la fonction z h-> z logz - z, où log est la
détermination principale du logarithme, et soit e(z) = logr(z) — g(z) + \ log 2 — \ log27r. Alors
la formule de Stirling implique l'existence de Ci > 0 tel que \e(z)\ < ft, pour tout z e Q..
Question 1. Soit Qn(X) = ^x'+^'-'-pcTi) et **» = Qn- Soit dn = ppcm(l,2,... ,n).
(i) Montrer que les a*, définis par Qn = X)?=o X+ï' appartiennent à Z.
(ii) Soit X)?=o (xS)2 + x+ï ^a décomposition de R^ en éléments simples. Montrer que on e Z,
que dnpi G Z et que £?=o A = 0.
(iii) Soit Sn = £S(-Rn(*0)- Montrer que S„ = w„C(3) - J|, avec Un,vn e Z.
Question 2. Soit Fn(s) = (aSs)2!*^).
(i) Montrer que Fn est méromorphe sur O, holomorphe en dehors de pôles doubles aux
entiers ^ n + 1, et est à décroissance rapide sur toute droite verticale incluse dans O.
(ii) Montrer que (gjfj^) = ct + 0(1) au voisinage de s = k\ en déduire une expression
du résidu de Fn en s = k en termes de R„.
(iii) Vérifier que |g^j| < fl*, si Re(s) = \ + a, avec a G Z, ou si s e Q, et |Im(s)| ^ 1.
(iv) En déduire que |Fn(s)| < ifp- si 5 ^ Re(s) ^ n + 5, ou si s e O et Re(s) = 5+0, avec
a G Z, ou |Im(s)| ^ 1.
(v) Soit C e [^n+%\. Si N est un entier ^ n, on note Ii(N), I2(N), I3(N) et Li(N) les intégrales
de ^Fn(s)ds le long des segments [C+iN.C-tN], [C-iN,N+J-*N], [N+i-iN,N+±+iN] et
[N+i+iN, C+iN] respectivement. Calculer Y$=i lj(N) i en déduire que Sn = ^ j£±f™ Fn(s) ds.
Question 3. Soit c = ^. Si u > 1 et t e R, soit G(t,«) = rji+ji+ci^+^JF^2 + *w<)2-
Soient de plus ai = 1 — c, /?i = — itt m\ = 1, 0:2 = 1 + c, #2 = tt, m2 = —1, 0:3 = c, /% = tà,
m3 = 2, de telle sorte que G(t,u) = %$$£ II?=i r(<*i^2 + iMmi- On définit logG(£,«) par
logG(£,u) = log ^a+fott + Ei=i milog(r(aiU2 -I- fou)), et la formule de Stirling nous donne
logG(*,u) = g(t,u) - 21ogu + log27r + r(£,u) + e(i,ti),
où y, e et r sont données par p(£,u) = S?=i ™>i9(<XiU2 + Piu), e(t,u) = S?=i "^(«i^2 + Aw)
et r(£, u) = 5 S?=i mi l°g(ai + §)> avec mi = 1, m2 = -1 et m3 = -2.
(i) Calculer rffi"-7)^ et r^w5\+^ î en déduire, en utilisant la formule des compléments, que
Fn(cn + iy/nt) = G(t, y/n)2, si n ^ 1.
(ii) En déduire que Sn = & /+~ G(t, y/nfdb.
(23>La démonstration d'Apéry a suscité de nombreux travaux mais toutes les tentatives pour démontrer
que C(5) est irrationnel ont échoué.
H. 12. IRRATIONALITÉ DE <(3)
623
(iii) Vérifier que g{au2+f3u) = 2au2\ogu+(a\oga-a)u2 + 2Pu\ogu+(p\oga)u+!^+0(^)
au voisinage de +00, si a > 0 et /? G iR.
(iv) Vérifier que 5Zi=1 midi = ^2i=i miPi = ^2i=i ™>ifii log &i = 0 5 en déduire L'existence de
A G R tel que limu->+oo log G(t, u) — ou2 + 2 log u = A — ~ft2, où l'on a posé ô = X)i=i n*»05» 1°S ai
01 7 — 2 Z^i=i Qi •
(v) Vérifier que <5 = 21og(\/2 — 1) et 7 = 2\/2. En déduire, grâce à l'existence d'une majoration
de la forme u2e~6u2\G{t,u)\ < C (1 + |t|)|G(t, 1)|, pour tous u ^ 1 et t G R (cf. question 5), que
(>/2 - l)-4nn3/2Sn tend vers une limite non nulle B, quand n —► +00.
Question 4. (i) Soit a > e. Montrer, en utilisant le théorème des nombres premiers, que dn ^ an,
pour tout n assez grand. (On calculera vp(dn), si p est un nombre premier.)
(ii) Vérifier que (\/2 — l)4e3 < 1. En déduire que £(3) est irrationnel. (Considérer d3Sn.)
Question 5. Les quantités a^fa et m* sont celles introduites à la question 3. Si oc > 0 et
p G iR, on définit Ha>/Î : R -► R, par Ha>/3(v) = Re((2a + /3v)\og(a + fiv)). On note ht la
fonction u ■-> Re(y(<,u)).
(i) Vérifier que HJ^(O) = 0, et que H'^(v) = (<^ffff)a.
(ii) Montrer que I(w) = X)i=im* (2a?+w)2 cst ^ ^' Pour tout w ^ ®-
(iii) Si t; G]0,1], soit H(v) = v/ij(£). Vérifier que R(v) = X)f=i"iiHQi)/3f(t;) > en déduire que
H'» < 0.
(iv) Montrer que ht(u) — Ou2 < ht(l) — <5, pour tout u ^ 1.
(v) Montrer qu'il existe C2,C3 tels que Re(r(£,u)) ^ C2, pour tous u ^ 1 et t G R, et
Re(r(£, 1)) ^ - log(l + |i|) - C3, pour tout t G R.
(vi) En déduire l'existence de C, tel que |u2e_*u2G(£, u)\ < C (1 + |*|)|G(*, 1)|, pour tous u ^ 1
et t G R.
Corrigé
Question 1. (i) On a a, = lin*-.-, x...(x^7)?x^.(x+,) = i^H = ("l)""'^ I5*ïï =
(-l)n~*(nJ"') ("), ce qui prouve que a* G Z.
(") Er=opTHj* + x+7 = (Eiojft?)2 = EÏLopcSîî + £«# (x+<)5c+i) • Comme (x+t^x+j) =
J=ï(x+ï - x+î)» on en deduit que ai = a? G Z, et que ft = 2£jVi j^-. Comme |j - i| < n, on a
^ € Z, et donc dnpi G Z.
Enfin £"=0 A = 0 car R„ est de degré -2.
(iii) On a -Bfn(k) = Etn=o IfSf + v^j. On en déduit que
n +00 1 +00 1 n t 1 * 1 \
s.-EHE(rfô»)+A(E(ïTôî))-E(*«.(c(»)-EF)+A(cw-EF))-
i=0 fc=l v ' fc=l v ' i=0 k=l k=l
C(2) disparaît puisque £"=0A = 0, et on obtient S„ = w„C(3) - |£, avec un = 2£"=0ai G Z et
^_^ . .3 . ,2
^n = Er=o(2ai(K=i #) + dnPi{Y?k=i #))» où tous les termes sont entiers puisque k ^ i ^ n
implique fc | dn.
Question 2. (i) La première partie résulte de ce que les zéros doubles de Rn(s) en 1,2,..., n compensent
les pôles doubles de (^Fs) en ces points. La décroissance rapide sur une droite verticale vient de ce que
624
ANNEXE H. PROBLÈMES CORRIGÉS
R„ est bornée sur une telle droite car de degré ^ 0, et que I an(i\-fr) I ^ e|T|_2e-|Th ce qui fait que -.ff -
est à décroissance rapide sur une droite verticale.
(ii) La fonction s ■-► (^^j) est périodique de période 1 ; il suffit donc de vérifier le résultat en 0. Or
on a gfc = i YT^Tp = i + ♦ + -. et donc (iHHFi)2 = * + £ + -•
Maintenant, R»(«) = R»(fc) + {s- fc)R4(fc) + ■■■ et donc FB(s) = ^jgr + ^^ + 0(1) au voisinage
de s = k ; il s'ensuit que res(Fn, fc) = R4(fc).
(iii) | sin7TS| = l|C*+teir-irImW _ c^=-tair+irl.n(,)| = l^y^-^s) + e*I...(S) ) | ? si R^) = I + a
avec o € Z, et le dernier terme est ^ 1 par l'inégalité entre moyenne géométrique et moyenne arithmétique.
Si |Im(*)| > 1, on a |sin7rs| ^ i(cirlIm<*>l - e~^lm^) > \{e" - e"*) > 1.
(iv) Remarquons que dans tous les cas, on a s € fi, ce qui implique |f=|| ^ 1, si i 6 {1,2,...,n}.
Comme |s2Fn(s)| = |^nfii|2|f^i • • • i^f* on déduit la majoration voulue, si Re(s) = \ + a, avec a € Z,
ou si |Im(s)| ^ 1, du (iii). La majoration dans la bande \ ^ Re(s) < \ + n s'obtient alors en appliquant
le principe du maximum à s2Fn(s) dans le rectangle de sommets | -iT, n + \ — iT, n+ \ +iT et | +iT,
et en faisant tendre T vers +oo.
(v) La formule des résidus montre que £}=1 L,(N) = £&=n+i Rî»(*0 (= E*Li Rn(*0 car KW = 0 si
fc € {1,2,... ,n}). Il s'ensuit que ]T)4=1 ^'(N) ~* ~^n quand N —> +oo. Par ailleurs, quand N —► +oo,
. Ii(N) tend vers -£ /££ F»(a) *,
• |Ia(N)| < i|N + I - C| sups€(c_iN)N+i_iN, |Fn(s)| < £|N + | - C|£, et donc I2(N) -» 0,
• Pour la même raison, Lj(N) —» 0,
• |Ï3(N)| < ^r2Nsups6[N+^_iNN+i+iN]
|F»(«)I < ¥(nTÎF' et d°nc I3(N) -» 0.
Un passage à la limite nous donne donc -S„ = -^ Ic-ioo ^»(s) ^s» ce 91" Permet de conclure.
Question 3. (i) On a r(rn(^~a) = (-l)n(s - 1) • • • (s - n) et r{n^s) = s(s + 1) • • • (s + n), et comme
afe = r(s)r(i - .), on obtient Fm(.) = (i^^)2(T^Piy)2(r(s)r(i - s))2 = (Ç^{=s}r<.)»)a. Le
résultat s'en déduit en remplaçant s par en + iy/ïit.
(ii) On peut appliquer le 2.(v) à C = en € [|,n + |], et paramétrer la droite ]C - ioo,C + ioo[ par
s = cn + iy/nt, pour t € R ; on en déduit le résultat (en utilisant le (i) pour exprimer Fn(cn + iy/nt)).
(iii) Comme g(au2+(3u) = (au2+/?u)(-l+log(a«2)+log(l + iL)), le résultat s'obtient en développant
(au2 + pu)(- 1 + 21og« + log a + £ - ^ + 0(£)).
(iv) Les identités ]T)?=1 raja:* = J2i=i miPi = ° sont immédiates. Maintenant, on a £)J=1 miPi l°ëai =
it( - log(l - ^=) - log(l + ^) + 2 log ^), et comme (l - ^) (l + ^=) = ± = (^)2, la parenthèse est
nulle et donc ]T)?=1 mSi log a, = 0. Il s'ensuit que g(t, u) - Su2 —► X)i=i miél = ~7*2- ^n en déduit le
résultat avec A = log2n + \ Yh=i mi 1°S<*i puisque e(ctiU2 + Piu) -> 0, si i € {1,2,3}.
(v) On a ô = (1 - c) log(l - c) - (1 + c) log(l + c) + 2c log c = log(l - c) - log(l + c) d'après le calcul fait
au (iv), et comme j=% = j^t^ = (>/2— 1)2> on obtient la première formule. Pour la seconde, on constate
que j33 - 1^3 + \ = ylfî + 2\/2 = 4\/2, ce qui nous donne 7 = 2\/2.
Maintenant, w4e_2^2G(t,w)2 -> e2Ae_2'yt2, quand * -> +00. Comme
|W4e-2<Jw2G(<,«)2| ^ C2(l + |«|)2|G(t, 1)|2 = C2(l + ItlflF^c + iQl
qui est sommable puisque Fi est à décroissance rapide sur la droite verticale c + iR (cf. 2.(i)), on obtient
que u4(y/2 - 1)~4^ /+* G(t, m)2 dt - e2A /+~ e~^eàt (cette dernière intégrale vaut B' = e2Ay^)
en échangeant limite et intégrale (ce qui est licite d'après le th. de convergence dominée). Le résultat s'en
déduit, avec B = B'/2ne2A, en posant u = y/n, et en utilisant le (ii).
H. 12. IRRATIONALITÉ DE <(3)
625
Question 4. (i) Si p° | d„, c'est qu'il existe i e {!,...n} tel que pv \ i\ en particulier, pv ^ n. On en
déduit que vp(dn) = [£§J]. On a donc logdn = Ep^„ [g^] logp ^ (logn)|{p, p ^ n}|, et il résulte du
th. des nombres premiers que log dn ^ n log a pour tout n assez grand.
(ii) Ona^- 1)V = j^ = ^jjy = ï7^7= ^ jgû < 1. Si C(3) est rationnel, on peut
l'écrire sous la forme §, et alors d3Sn = d3u„Ç(3) - vn est un entier, si n ^ N, puisque d3 est divisible
par N. De plus, d3Sn est non nul pour n assez grand puisque Sn ~ Bn~3/2(\/2 - l)4n, et B =£ 0. Or on
peut choisir o > e tel que 6 = a3(\/2 - l)4 < 1, et on a \d^Sn\ ^ Bn~3/26n, pour tout n assez grand
d'après le (i), et donc d3Sn —> 0. Comme une suite d'entiers non nuls ne peut pas tendre vers 0, on
aboutit à une contradiction qui permet de conclure.
Question 5. (i) ii'at0(v) = Re(plog(a+Pv) + ^^L.+p), et donc H'ay0(O) = 0 car p 6 iR et a > 0. Enfin,
H» (v\ = Re(-P- - af32 \ = ffit <* - *£±£?U = ~2^4^2
a,M j {a + pv (a + Pv)2' P^a2-/?2v2 {a2 - P2v2)2 > (a2 - 02v2)2
(ii) On a l(w) = ^((3_^w)a - (3+ffi+w)a + nq^j»)- APrès réduction au même dénominateur, on
voit que I(w) a même signe que
(1 + w)2((\/2 - 1)(3 + 2v^ + wf + (-v^ - 1)(3 - 2y/2 + w)2) + 2(3 + 2^ + w)2(3 - 2n/2 + tu)2
= 2((1 + w)2(-tw2 + 2tw + 7) + (1 + 6w + w2)2) = 2(12w3 + 32tw2 + Uw + 8),
qui est > 0, pour tout w ^ 0.
(iii) On a g(t,u) = Yh=irriigfaiU2 + Piu) ; comme la dérivée de g est log, la dérivée de g(t>u) par
rapport à u est Y%=i irii(2ociU + Pi) log(ai«2 + /?««), et donc
3
H(v) = Re( Yl mÇoti + Piv) ( log^ + &v) - 2 logv)).
^3 ^3 „ Q _ n „. :l . ^ tj/ .x _ v-^3
Le terme en logv disparaît car £)j=1 miai = 5Zi=i m»A = 0» et il reste H(v) = X)i=i miHai,/?i(v)-
Comme pf = -i2, si i = 1,2,3, on obtient H'» = -8<Vl(2tV), et donc H"(v) ^ 0 d'après le (ii).
(iv) On a H'(0) = 0 d'après le (i), et H"(v) < 0 d'après le (iii) ; il s'ensuit que H'(v) ^ 0, si v €]0,1].
Comme H(0) = 2 £)3=1 miai log a» = 25, on a H(v) ^ 2<5, si v €]0,1], et donc h't{u) - 2ôu ^ 0, pour tout
u ^ 1. La fonction u ■-► /i*(w) - 5«2 est donc décroissante, ce qui permet de conclure.
(v) On a Re(r(t, u)) = ± log | |^)ï | - log \c + i £| ; en particulier, cela ne dépend que de x = ^ car
c'est déjà le cas pour \a + i^\ si a € {1 - c, 1 + c, c}, et comme cela tend vers -oo quand x —» +oo et est
continu sur R+, on en déduit l'existence de C2.
L'existence de C3 résulte de ce que 11-» log | }~^~^ | est bornée car 11-» }~^~|* l'est et ne s'approche
pas de zéro, et de ce que t ■-► - log \c + it\ + log(l + |t|) aussi puisque 11-» f±& l'est.
(vi) On a logl^'c^/^l = -<5«2 + fct(t») - Ml) + Re(r(*,«) - r(*. 1)) + Re(e(*,«) - e(«, 1)). Or,
• ht(u) - Su2 - ht(l) ^ -ô d'après le (iv),
• Re(r(«,w) - r{tt 1)) ^ C2 + C3 + log(l + \t\), d'après le (v),
• e(t,«) = Y%=imi£(ai + 0iu)> et comme la* + /?iw| ^ 1 - c, si w ^ 1, t € R et i = 1,2,3, on a
Re(e(t, u) - e(t, 1)) ^ 2( X)i=i lmi|)^> d'après la formule de Stirling rappelée en préambule.
On en déduit le résultat avec C = exp
(-<5 + C2 + C3 + S).
626
ANNEXE H. PROBLÈMES CORRIGÉS
H.13. Le critère de Borel
Soit / une fonction méromorphe sur D(0,r~), avec r > 1, holomorphe en 0. Soit Y£S)anZn
le développement de Taylor de / en 0. On se propose de prouver que si les an sont des entiers,
alors / est une fraction rationnelle (résultat dû à Borel, 1894). La démonstration comporte deux
parties : la partie I donne un critère purement algébrique pour qu'une série formelle soit une
fraction rationnelle ; l'autre, qui utilise les propriétés des fonctions liolomorphes, montre que l'on
est sous les conditions d'utilisation du critère de la partie I dans le cas qui nous intéresse.
Partie I
Soient K un corps et (an)nGN une suite d'éléments de K. On note F G K[[T]] la série formelle
^n€NanTn, et on se propose d'établir un critère permettant de décider si F est une fraction
rationnelle (ou plus exactement son développement de Taylor à l'origine).
Si N ^ 1 et n G N, soit An(ti) = (an,a>n+i> • • • > an+N-i) G KN, et soit An(u) le déterminant
de Hankel det (AN(n),..., AN(n + N - 1)) (donc AN(n) = det(an+i+J)o<i,j<N-i)-
(i) Soient Ci,...,CNGKetP = l + CiT H 1- cnTn. Montrer qu'il y a équivalence entre :
• il existe Q G K[T] tel que F = § ;
• il existe no G N tel que an+N + cian+N-i H 1- CNan = 0, pour tout n ^ no-
En déduire que si F est une fraction rationnelle, alors il existe M > 1 et mo G N tels que
Am(h) = 0, pour tout n^mo.
(ii) On suppose que Àn+i(îi) = 0 et An(ti + 1) ^ 0. Montrer que An(ti) ^ 0. (On pourra
prouver que An(ïi + N) appartient au sous-espace de KN engendré par An(h), ..., An(h + N — 1),
en considérant la matrice B = (cin+i+^o^ij^N dont les A^(n + i) sont des lignes et des colonnes
de sous-matrices.)
(iii) On suppose qu'il existe M ^ 1 et mo 6 N tels que Am(h) = 0, pour tout n ^ mo- Montrer
qu'il existe N,no G N, tels que An+i(h) = 0 et An(h) ^ 0, pour tout n ^ no-
(iv) Montrer que An (no + N) -I- c\ An (no + N - 1) H 1- cnAn^o) = 0 pour ci,..., cn G K
uniquement déterminés, et que l'on a An(h + N) + CiAN(n + N — 1) H 1- cnAn(h) = 0, pour
tout n ^ no. Comment ceci se traduit-il pour la suite (an)nGN?
(v) Montrer que F est une fraction rationnelle s'il existe M ^ 1 et iuq G N tels que Am(h) = 0,
pour tout n ^ mo-
Partie II
Soit / une fonction méromorphe sur D(0,r~), avec r > 1, holomorphe en 0. Soit X^S0^"
le développement de Taylor de / en 0.
(i) Soit R G]l,r[. Montrer que / n'a qu'un nombre fini de pôles ori,...,oy (répétés avec
multiplicité) dans D(0, R).
(ii) Montrer qu'il existe Ro > 0 et Co > 0 tels que \an\ ^ CoRo~n> pour tout n G N.
(iii) Soient ci,..., cd G C définis par 1 -I- CiX + • • • + cdXd = fl^=i(l - ^J1*)- Montrer qu'il
existe C > 0 et R > 1 tels que \an+d + cian+d-i H h Cdan\ ^ CR_n, pour tout n G N. [On
pourra s'intéresser à la fonction f(z) IljLiC1 — aJlz)\
(iv) En déduire qu'il existe N ^ 1 et no G N tels que |AN(a,n)| < 1, pour tout n ^ no- (On
pourra majorer les coordonnées de Bn(h-M) = kw{n+i+d)+c\ An(n+i+d—1)-\ \-CdA.ti(n+i)-)
(v) Montrer que / est une fonction rationnelle si les an sont des entiers.
H.13. LE CRITÈRE DE BOREL
627
Corrigé
Partie I
(i) On a (l+ciT+. • .+cNTN)F(T) = £n6N 6nTn, avec 6n+N = an+N+cian+N-i + • • -+cNan ; on voit
donc que (1 + c\T-\ |-cnTn)F(T) est un polynôme si et seulement si an+N +cian+N-i H \-c^an = 0
pour tout n assez grand, d'où l'équivalence des deux conditions de la question.
Maintenant, si F est une fraction rationnelle, on peut l'écrire sous la forme F = ^, avec P et Q
premiers entre eux. Comme F n'a pas de pôle en 0, on a P(0) ^ 0 et, quitte à diviser P et Q par P(0),
on peut supposer que P(0) = 1, et donc que P = 1 + cxT H h cNTN. D'après ce qui précède, il existe
donc n0 G N tel que an+N + Cian+N-i H h c^an = 0 pour tout n ^ n0. Mais alors An+i(îi + N) +
ciAn+i(îi + N - 1) H h cnAn+i(îi) = 0, pour tout n ^ n0, et donc An+i(îi) = 0 pour tout n^ n0
puisque AN+i(n + N) est une combinaison linéaire de AN+i(n + N - 1),..., AN+i(n). Ceci permet de
conclure avec M = N + 1 et ra0 = n0.
(ii) L'hypothèse AN(n + 1) ^ 0 équivaut à ce que AN(n + 1),..., AN(n + N) est une base de KN ; elle
implique que AN+i(n),..., AN+i(n + N - 1), qui sont les N premières lignes de la matrice B, sont
linéairement indépendants. Comme An+i(îi), ..., An+i(îi + N) forment une famille liée puisque An+i(îi) = 0,
on peut écrire la dernière ligne An+i(îi+N) de B sous la forme AnAn+i^H hAiAN+i(n + N-1). En
ignorant la dernière colonne, cela nous fournit la relation AN(n + N) = AnAn(ti) H h Ai AN(n + N - 1),
qui prouve que AN(n+N) est dans le sous-espace de KN engendré par AN(n),..., AN(n+N-1) ; cet espace
est donc KN puisqu'il contient la base AN(n+1),..., AN(n+N). Autrement dit, AN(n),..., AN(n+N-1)
est une famille génératrice de KN, et donc une base puisqu'elle a N éléments ; son déterminant AN(n) est
donc non nul, ce que l'on cherchait à prouver.
(iii) Soit N le plus grand entier tel qu'il existe n0 G N pour lequel An+i(îi) = 0 pour tout n ^ n0.
Alors il existe une infinité de n tels que AN(n) ^ 0, et une récurrence immédiate utilisant le (ii) montre
que l'on a An(îix) ^ 0 si n0 ^ n' ^ n et An(îi) ^ 0. Comme n peut être pris arbitrairement grand, on a
An(**) 7^ 0, pour tout n ^ n0, ce qui permet de conclure.
(iv) AN(n0),..., AN(n0+N-1) forment une base de KN puisque AN(n0) ^ 0. On en déduit l'existence
et l'unicité de Ci,...,cn- Maintenant, AN+i(n0),..., An+i(îIo + N) forment une famille liée puisque
An+i(^0) = 0, et comme An+i(îi0), ..., An+i(tio + N - 1) forment une famille libre, il existe Ai,..., An
tels que AN+1 (n0 + N) + Ai An+i (n0 + N - 1) H h An AN+i (n0) = 0. En ignorant la dernière coordonnée
de chaque AN+i(n0 + i), on obtient AN(n0 + N) + Ai An (no + N - 1) H h An An (no) = 0» et d°nc
Ai = ci,..., AN = cN. Maintenant, on obtient AN(n0+l+N)+ciAN(no+l+N-l)H hcNAN(n0+l) = 0,
en ignorant la première coordonnée. On peut recommencer le même raisonnement avec n0 + 1 au lieu
de n0 et une récurrence immédiate montre que AN(n + N) + CiAN(n + N - 1) H h CNAN(n) = 0 pour
tout n^riQ.
Ceci se traduit par la relation de récurrence an+N + cian+N-i H h c^an = 0, pour tout n ^ n0.
(v) D'après la question précédente, il existe N,n0 G N tels que an+N + Cian+N-i H h c^an = 0,
pour tout n ^ n0. Soit Q(T) = (1 + ClT + • • • + cNTN)F(T) = £
n€N &nTn. Alors bn — 0, si n ^ no + N,
puisque 6n+N = «n+N + Cian+N-i H h c^an ; ceci prouve que Q est un polynôme (de degré < n0 + N),
et donc que F = 1+ClTffi^j|.CwTN est une fraction rationnelle.
Partie II
(i) Si a G D(0,R), il existe ra > 0 tel que / ait au plus un pôle sur D(a,r^) : en effet, si a n'est pas un
pôle, la continuité de / implique qu'il existe ra > 0 tel que / n'ait pas de pôle sur D(a,r^) ; si a est un
pôle d'ordre k alors (z - a)kf est holomorphe en a et il existe ra > 0 tel que (z - a)hf n'ait pas de pôle
sur D(a,r^), et alors a est le seul pôle de / sur D(a,r^). Les D(a,r^) forment un recouvrement ouvert
628
ANNEXE H. PROBLÈMES CORRIGÉS
de D(0,R) et, D(0,R) étant compact, on peut en extraire un sous-recouvrement par des D(a,r~), avec
a G A fini. Le nombre de pôles de / sur D(0,R) est alors ^ |A| et comme chacun est d'ordre fini, cela
permet de conclure.
(ii) Comme / est holomorphe en 0, elle est holomorphe sur un disque D(0,Rf), avec Rx > 0.
Si 0 < Ro < Ri, on déduit des inégalités de Cauchy (rem. V.4.9 (iii)) que \an\ < C0Ron, avec
C0=supN=IJ/(2)|.
(iii) Soit g(z) = f(z)ï\*=l(l - ajlz) et soit Y,neNbnzn sa série de Taylor en 0; on a donc
6n+d = an+d + cian+rf_i H h c<ian. Par construction g est méromorphe sur D(0,r~~) et holomorphe
sur D(0,R) puisqu'on s'est débrouillé pour supprimer les pôles éventuels dansD(0,R) ; elle est donc
holomorphe dans un ouvert Cl contenant strictement D(0,R). On déduit donc des inégalités de Cauchy qu'il
existe C > 0 tel que \bn\ ^ C'R~"n, pour tout n G N. Ceci permet de conclure avec C = C'R~"d.
(iv) An(îi) est le déterminant de An(îi), ..., An(îi + N - 1) ; il ne change pas si on ajoute à AN(n + i)
une combinaison linéaire des AN(n + j), avec j < i. Il s'ensuit que AN(n) est aussi le déterminant de
AN(n),..., AN(n + d - 1), BN(n),..., BN(n + N - 1 - d). C'est donc la somme de N! termes dont chacun
est le produit de d termes qui sont des coordonnées des A^(n + j) et de N - d termes qui sont des
coordonnées des BN(n 4- 0-
Or les coordonnées de BN(n + i) sont 6n+i,..., 6n+i+N-i, où bn = an+rf + cian+d_i H h Cdan ; elles
sont donc plus petites, en module, que CR"~n d'après le (iii). Par ailleurs, les coordonnées de An(îi + j)
sont, d'après le (ii), plus petites que C0R^n""d""N+2, si 0 < j ^ d - 1. On en déduit la majoration
|AN(n)| ^ N!(C0Ro n""d_"N+2)d(CR-n)N-d, ce qui tend vers 0 quand n -+ +oo, si RN-dR# > 1. Comme
cette condition est satisfaite si N est assez grand, cela permet de conclure.
(v) Si les an sont des entiers, il en est de même des AN(n), et la majoration |AN(n)| < 1 pour n ^ no
entraîne que An(îi) = 0 si n ^ n0. On en déduit que / est rationnelle en utilisant le I.
H. 14. LE THÉORÈME DE MORDELL-WEIL
629
H. 14. Le théorème de Mordell-Weil
Dans tout ce problème^24), D est un entier impair sans facteur carré. Si S = {pi,... ,ps}, où
s est le cardinal de S, est l'ensemble des nombres premiers divisant D, alors 2 ^ S et D est le
produit des p*, pour 1 < i < s.
L'objet du problème est l'étude de l'ensemble C(Q) des solutions (x,y) G Q2 de l'équation
y2 = x3 — D2#, avec x > 0. Plus précisément, il s'agit de démontrer que l'on peut munir
C(Q) = C(Q) U {oo} d'une structure de groupe commutatif de type fini (cas particulier du
théorème de Mordell-Weiî). On note C l'ensemble des solutions dans R2 de l'équation
y2 = x3 - D2x, avec x> 0 ; on a donc C(Q) = C n Q2.
I
Dans cette partie, V est un groupe commutatif pour une loi notée +. L'élément neutre de Y
est noté 0 et l'opposé d'un élément x de Y est noté — x. Si n G Z et x G T, on note nx l'élément
de T évident (Ox = 0 et (n + l)x = nx + x si n G Z).
On dit que F est de type fini s'il existe r G N et x\y..., xr G Y tels que tout élément x de Y
puisse s'écrire sous la forme Yh=i nixù avec n* G Z, si 1 ^ « < r. On dit que Y est de type ,/ïra
modulo 2 s'il existe un sous-ensemble fini Z de T tel que tout clément x de Y puisse s'écrire sous
la forme z + 2y, avec 2 G Z et y G Y.
On appelle hauteur sur T une application /i : Y —> R+ telle qu'il existe M ^ 0 tel que, quels
que soient (x,y) G T2, on ait
\h(x + y) + h(x -y)- 2h(x) - 2h(y)\ < M.
On dit que h est admissible si, quel que soit B ^ 0, l'ensemble des éléments x de Y vérifiant
h(x) ^ B est un ensemble fini.
1. On note rt0rs l'ensemble des a; G T tels qu'il existe n G Z — {0} tel que nx = 0.
l.a. Montrer que rtors est un sous-groupe de Y.
l.b. Le groupe rt0rs est-il nécessairement fini?
2. Soit h une hauteur sur Y.
2.a. Montrer que, si a; G T, la suite de terme général 4~nh(2nx) tend vers une limite h(x)
quand n tend vers +co, et qu'il existe M' ^ 0 tel que \h(x) — h(x)\ < M', quel que soit a; G T.
2.b. Montrer que h vérifie l'identité :
h(x + y) + h(x — y) = 2h(x) + 2h(y) quels que soient rc, y G Y.
(24)I1 s'agit de l'épreuve de 6 heures du concours d'entrée 2003 à l'École Normale. La partie I donne un
critère permettant de montrer qu'un groupe commutatif est de type fini. La partie II munit C = Cu{oo}
d'une structure de groupe commutatif (on peut préférer utiliser les fonctions holomorphes, comme dans
le problème H.8, pour atteindre ce but). La partie III donne un certain nombre de formules relatives à
cette loi de groupe, et la partie IV est consacrée à la démonstration du théorème de Mordell-Weil. Ces
4 parties reposent sur des techniques différentes et peuvent se traiter de manière indépendante (pour la
partie III, on n'a besoin que de la définition de la loi d'addition donnée dans la question 6.b de la partie
II, et la partie IV utilise de manière intensive les formules de la partie III mais pas leur démonstration).
630
ANNEXE H. PROBLÈMES CORRIGÉS
2.c. Calculer h(nx) en fonction de h(x), si n G Z.
3. On suppose que l'on peut munir Y d'une hauteur admissible h.
3.a. Montrer que h est une hauteur admissible sur T.
3.b. Montrer que h(x) = 0 si et seulement si a; G Ttors-
3.c. Montrer que rt0rs est fini.
3.d. Montrer que, si x = z + 2y, alors h(y) ^ \{h(x) + h(z)).
3.e. Montrer que si Y est de type fini modulo 2, alors il est de type fini.
II
On rappelle que C est l'ensemble des solutions (x, y) G R2 de l'équation y2 = x3 — Y)2x avec
x > 0. (Il n'est probablement pas inutile de faire un dessin grossier de C.) Si (#o,2/o) € C, la
tangente à C en (a?o,2/o) est la droite d'équation 2yo(y — yo) = (3xq — D2)(x — xo).
Si (u,v) G R* x R, notons {u',v') le couple défini par u' = ^, v' = -g, et Ptt|t> et Qu/>w/ les
polynômes définis par
Fu,v(x) = z3 - V2x - (ux + v)2 et Qu/y (y) = (u'y + v')3 - D2(u'y + v') - y2.
On note DUyV la droite d'équation y = ux + v. On pourra utiliser sans démonstration les
équivalences (II) <=> (12) <£► (13), avec
(Il)(x,y)eDu>vnC
(12) a; > 0, P^z) =0ety = ux + v
(13) Qu'y (y) = 0 et x = u'y + v' > 0
et, si {x0,yo) G CnDV) les équivalences (Tl) <=> (T2) <=> (T3), avec
(Tl) DUtV est tangente à C en (#o,2/o)
(T2) PU)V a un zéro double en xq
(T3) Q^y a un zéro double en yo.
1. Soit n(w, v) le cardinal de l'intersection de C avec la droite Du>v d'équation y = ux + v.
l.a. Montrer que n{u^v) < 3.
l.b. Montrer que U = {{%v) G R* x R, n(u,v) = 3} est un ouvert de R2.
l.c. Montrer que, si n(u,v) ^ 2 et si DU)W n'est pas tangente à C, alors n{u,v) = 3.
l.d. Montrer que, si (a, 6) G R2, il n'existe qu'un nombre fini de points P de C tels que la
tangente à C en P passe par (a,b).
2. Si P = (x, y) G C, on pose x(P) = x et y(P) = y.
2.a. Montrer que, si t G R, il existe un unique point P(t) de C vérifiant y(Y(t)) = t, et que,
si on pose F(t) = x(P(t))t alors C est l'ensemble des couples (F(y),y), avec y G R.
2.b. Montrer que F(y) ^ D quel que soit y G R, que F est paire, que l'on a F(yi) = F(y2) si
et seulement si y\ = ±2/2, et que F est de classe <^>1 sur R.
2.c. Montrer que \y\~2^3F(y) tend vers 1 quand y tend vers +00 ou vers —00.
2.d. Soient a G R* et t G R - {0,a, -a}. Notons D(a,t) la droite joignant P(t) à P(a) et
H0(£) l'élément de R défini par
„mm_ / t-a ^r(tF(a)-aF(t)\3 tF(a) - aF(t)i
atRa{t)--\F(t)-F(a)J il t=l ) "D t=l J"
Montrer que l'on a les équivalences suivantes :
H. 14. LE THÉORÈME DE MORDELL-WEIL
631
(i) Ha(£) ^ {a,t} <& P(H0(£)) est le troisième point d'intersection de C et D(a,t) ;
(ii) H0(£) = a <&■ D(a,t) est la tangente à C en P(a) ;
(iii) Ra(t) = t <& D(a,t) est la tangente à C en P(t).
2.e. Calculer la limite de Ha(£) quand t tend vers +00. Que devient la droite D(a,£) ?
3. On déduit des questions 2.b et 2.c la convergence absolue de l'intégrale f*™ 3F(t$-Dz • ^n
note Q, la valeur de l'intégrale f*™ $?{$-& » ct on définit une fonction y ■-► L(y) par la formule
t t\ ry 2dt
3.a. Montrer que L induit une bijection de R sur ]0,0[.
3.b. Calculer L(y) + L(-y) si y e R.
4. Soient x\,..., #n, des nombres complexes distincts deux à deux.
4.a. Montrer que, si Q G C[X] est de degré ^ n — 1, alors
Q(x) = EQM(n^)-
4.b. Montrer que, si P(X) = n?=i(x - »i), alors £?=1 p^ry = 0 si A; G {0,... ,n - 2} (avec
la convention 0° = 1) ct calculer Ya=i P'(xi)'
5.
5.a. Soit I un intervalle ouvert de R, et soient t ■-> yi(t), 1■-► y2(t) ct 11-* yz(t) des fonctions
de classe ^f1 de I dans R telles que, quel que soit tel, les points Pj(£) = (xi(t),yi(t)) = P(yi(t)),
i e {1,2,3}, soient distincts deux à deux ct alignés. Montrer que la fonction
* -> G(t) = Um(t)) + L(y2(t)) + L(y3(t))
est constante sur I. (On introduira l'équation y = u{t)x + v(t) de la droite contenant les Pi(t) et
on commencera par vérifier que u et v sont de classe tf1 sur I.)
5.b. Montrer que, si Ha(t) est la quantité introduite à la question 2.d, alors pour tous a > 0
ct t> a, on a L(a) + L(t) + L(Ha(£)) = 20.
5.c. Montrer que, si y\, y2i2/3 «ont trois éléments de R, distincts deux à deux, tels que P{y\),
P(y2) ct P(y3) sont alignés, alors L(yi) + L(y2) + Hvs) G {0,2ft}.
5.d. Montrer que, si y\ ^y2, et si P(y2) est sur la tangente à C en P(yi), alors 2L(yi) + L(y2)
appartient à {Q,2fi}.
5.e. Montrer que, si y\, y2, y$ sont trois éléments de R, distincts deux à deux, tels que
L(2/i) + L(y2) + L(y3) e OZ, alors P(yi), P(y2) ct P(y3) sont alignés.
6. Soit G le groupe des nombres complexes de module 1 et soit E : C —► G l'application définie
par E(oo) = 1 et E(P(y)) = exp(^f L(y)) si y G R.
6.a. Montrer qu'il existe, sur C, une unique loi de groupe commutatif + telle que l'on ait
E(P+Q) = E(P)E(Q). Montrer de plus, que, si P+Q ^ 00, alors L(y(P+Q)) = L(y(P))+L(y(Q))
si L(y(P)) + L(y(Q)) < ft et L(y(P + Q)) = L(y(P)) + L(y(Q)) - Ù si L(y(P)) + L(y(Q)) > ft.
632
ANNEXE H. PROBLÈMES CORRIGÉS
6.b. Montrer que oo est l'élément neutre pour + et que, si Pi = (2:1,2/1), P2 = (3:2,3/2) et
P3 = (#3,2/3) sont trois éléments distincts de C, alors Pi + P2 + P3 = 00 si et seulement si Pl
P2 et P3 sont alignés.
6.c. Montrer que, si P G C, alors l'opposé —P de P pour la loi + est le symétrique de P par
rapport à l'axe des x.
6.d. Montrer que si P G C, l'équation 2Q,= P a toujours des solutions; combien en a-t-elle?
6.e. Montrer que, si 2/1 -h2/2 7^ 0, et si z\ tend vers y\ et 22 tend vers 2/2, alors 2/(P(zi) + P(^2))
tend vers y(P(yi) + P(2/2))- Que se passe-t-il si 2/1 + 2/2 = 0?
III
Dans les questions l.b, 2.b et 4, les formules que l'on cherche à établir vont par groupe ; dans
chaque groupe, on démontrera la formule qui n'est pas entre crochets, et on admettra les autres.
1. Soient Pi = (2:1,2/1) et P2 = (2:2,2/2) deux éléments de C, avec 2:1 ^ a?2, et P3 = (2:3,2/3) e C
défini par Pi + P2 + P3 = 00.
l.a. Montrer que 2:1,3:2,2:3 sont les racines du polynôme
P(x) = xz- D2a: - (2/1 + f* Z ^ (g ~ Xltf''
En déduire que l'on a
,xl + xix2 + xl -D2N2 , xl + xix2 + xl-D2,
X3 = (^ ■ * ) -3:1-2:2 et 2/3 = — ; (X3 - xi) + yv
v 2/1+2/2 y 2/1+2/2
(On commencera par supposer que Pi, P2 et P3 sont distincts.)
l.b. Établir les formules (la formule entre crochets sera admise sans démonstration) :
_/(a;i+D)2/2-(a:2 + D)2/n2
_fx1y2-x2yi\2^
X2 — X\
(XI+mx2+D)(„+D) = (('1+^-^+PH.y
\ Xo — X\ /
a:i3:2a;3 = ( — —— I
V Xi—X\ J
2. Soit P = (a:, y) e C, avec y ^ 0 et 2P = {x',yf).
2.a. Établir les formules :
, ,3a:2-D2 2 o ^ , 3a:2-D2. , .
* = ( 2y ) -22: et -y'= 2y (x'-x) + y.
2.b. Montrer que l'on a, x' = (x ^D ) . On admettra que, de même,
[x, + 0 = {^^y et x,_D__{^^y]
3. Montrer que C(Q) est un sous-groupe de C.
4. Soient Pi = (sci.j/i) et P2 = (3:2,2/2) deux éléments de C(Q), avec xi ^ 3:2, et soient
P3 = Pi + P2 = (3:3,2/3) et P4 = Pi - P2 = (3:4,2/4)- Établir les formules (la formule entre
crochets sera admise sans démonstration) :
(,3+D)(,4+D)=r^D^)-DY. u=(^r
H. 14. LE THÉORÈME DE MORDELL-WEIL
633
IV
IV. A
1. Si p est un nombre premier et a G Z — {0}, on définit l'entier vp(a) comme le plus grand entier
n tel que pn divise a (par exemple 48 = 3 • 24 et donc ^(48) = 4, V3(48) = 1 et vp(48) = 0 si
p ^ {2,3}). On a vp(ab) = vp(a) + vp(b), ce qui permet d'étendre vp à Q* grâce à la formule
vp(ab~1) = vp(a) — vp(b). Si a G Q*, alors vp(a) = 0 sauf pour un nombre fini de nombres
premiers p et, si a est positif, alors a = Y[ppvp^. Si v G Z, on note v son image dans Z/2Z.
l.a. Montrer que a G Q* est un carré si et seulement si a > 0 et vp(a) = 0 quel que soit le
nombre premier p.
l.b. Montrer que, si a, 6 G Q* vérifient vp(a) < vp(b), alors vp(a + 6) = vp(a).
2. Soit P = (#,3/) G C(Q), et soit c G {1,4,9,16,...} le plus petit carré (d'entier) tel que
a = ex G Z.
2.a. Montrer que, si vp(c) ^ 1, alors vp(c) ^ 2 et vp(a) G {0,1}.
2.b. Montrer que a(a — De) (a + De) est un carré.
2.c. Montrer que, si p ^ S U {2}, alors vp(a) et vp(a + De) sont des nombres pairs.
3. Soit ip : C(Q) -> (Z/2Z)2s+2 l'application qui envoie oo sur (0,..., 0) et P = (#, y) sur
(v2(x),vpi(x),...,Vpa(x),v2(x + D),vpi(rc + D),... ,vPs(x + D)).
3.a. Montrer que (p est un morphisme de groupes de C(Q) dans (Z/2Z)2s+2.
3.b. Montrer que, si P = (a;7, y7) G C(Q) est tel que a;7, a;7 — D et #7 + D sont des cai-rés dans Q,
et si Q G C est une solution de l'équation 2Q = P, alors Q G C(Q).
3.c. Caractériser le noyau de (p.
3.d. Montrer que C(Q) est de type fini modulo 2.
IV. B
On définit une fonction h : C(Q) —» R+ en envoyant oo sur 0 et P = (x, y) sur log(a + De) =
log(c(a; + D)), si c est le plus petit carré rendant a = ex entier.
1. Montrer que, quel que soit P G C(Q), on a
h(2P) ^ 4/i(P).
2. Soient Pi = (#1,3/1) et P2 = (#2>3/2) deux éléments de C(Q), avec a;i 7^ x2, et soient
P3 = Pi + P2 = (#3)2/3) et P4 = Pi — P2 = (#4,3/4). Soit ci (resp. C2) le plus petit carré
rendant ai = Ci#i (resp. a2 = c2x2) entier.
2.a. Montrer que, si d divise T = ai<i2 + D2CiC2, U = ai<i2 — D2CiC2 + D(aiC2 + a2Ci) et
V = aiC2 — a2Ci, alors d divise aussi 2ai(a2 + DC2) et 2a2(ai + Dci) ainsi que 4D2aiC2 et
4D2a2c2.
2.b. Montrer que, si p ^ S U {2}, alors p ne divise pas 4D2aiC2, 4D2a2C2 ou aia2 + D2ciC2 (on
commencera par montrer que p ne divise ni le p.g.c.d. de ai et Ci, ni celui de a2 et C2).
2.c. Montrer que, si p G S U {2}, alors p4 ne divise pas 4D2aiC2, 4D2a2Ci ou aia2 + D2ciC2-
2.d. Montrer que le p.g.c.d. de aia2 + D2ciC2, aia2 — D2ciC2 + D(aiC2 + a2Ci) et aiC2 — a2Ci
divise (2D)3.
634
ANNEXE H. PROBLÈMES CORRIGÉS
2.e. Montrer que, si X3X4 = f et (#3 + D)(#4 + D) = £, où d,d! et e sont des entiers, si C3
(resp. C4) est le plus petit carré rendant 03 = 03073 (resp. a± = C4X4) entier, et si
S = p.g.c.d.(d,d',e), alors ^ est entier et /i(P3) + h(P4) > logd' - logtf.
2.f. Montrer que, quels que soient (Pi,P2) € C(Q)2 avec Pi ± P2 ^ 00, on a
ft(Pi + p2) + MPi - p2) ^ 2(MPi) + MP2)) - log(32D3).
3. On suppose dorénavant que le groupe C(Q) est infini.
3.a. Montrer que les seules solutions de l'équation 2P = 00 sont P = 00 et P = (D,0).
3.b. Montrer que /i(2P) ^ 4/i(P) - 61og(2(2D)3) quel que soit P G C(Q).
3.c. Montrer qu'il existe A > 0 tel que, quels que soient (P, Q) G C(Q)2, on ait
h(P + Q) + h(P - Q) ^ 2(/i(P) + /i(Q)) - A.
3.d. Montrer que h est une hauteur sur C(Q).
3.e. Montrer que h est une hauteur admissible sur C(Q).
3.f. Montrer que C(Q)t0rs est un groupe fini et que C(Q) est de type fini.
Corrigé
I
l.a. Si nx = 0 et my = 0, alors nm(x - y) = mnx — nmy = 0.
l.b. Non : par exemple, si T = C*, alors rt0rs est l'ensemble des racines de l'unité d'ordre quelconque
et donc est infini.
2.a. Posons xn = 4~nh(2nx) et M0 = M + h(0). On a \h(2n+1x) + /i(0) - 4h(2nx)\ < M, et donc
\xn+i-xn\ ^ #gr. On a donc \xn+k-xn\ < J*ml ^ < X£~ pr = ^r quels que soient (n, k) G N2,
ce qui prouve que la suite xn est de Cauchy, et que sa limite h(x) vérifie \h(x) - x0\ ^ ^. Comme
xq = h(x), on peut prendre M' = ^.
2.b. |M2"g+y)) + h{2n{x-y)) _ 2M|^i _ 2M|M| ^ M et le résultat s'en déduit en passant à la limite.
2.c. Montrons par récurrence sur n ^ 0 que h{kx) = k2h{x), si 0 < k < n. En prenant x = y = 0, on
obtient 2/i(0) = 4/i(0) et donc h(0) = 0, et la propriété est vraie pour n = 0 et n = 1. Pour passer de n à
n +1, constatons que
h((n + l)x) = 2h{nx) + 2h{x) - h((n - l)x) = (2n2 + 2 - (n - lf)h(x) = (n + lfh{x).
La propriété est donc vraie pour tout n ^ 0. Par ailleurs, en prenant x = 0, y = a, on obtient
h(a) + h(-a) = 2h(a) et donc h(-a) = h(a) et la fonction h est paire. La fonction n •-» /i(n#) - n2/i(#)
est donc une fonction paire de n G Z s'annulant pour n G N ; elle est donc identiquement nulle.
3.a. On a h(x) ^ 0 par passage à la limite et c'est une hauteur en vertu de la question 2.b ; elle est
admissible car h(x) < B implique h(x) ^ B + M' d'après la question 2.a.
3.b. Si mx = 0, alors H(mx) = m2li{x) = 0 et H(x) = 0.
Réciproquement, si h(x) = 0, alors h(nx) = 0 quel que soit n G Z d'après la question 2.c, et comme
h est admissible, l'ensemble {nx, n G Z} est fini. Il existe donc ni ^ ni tels que n\x = nix, et donc
(ni - ri2)x = 0 et x G rt0rs-
3.c. C'est une conséquence immédiate de la question précédente et de l'admissibilité de h.
3.d. Comme H(x + z) ^ 0, on a 4%) = h(2y) = h(x - z) < 2h(x) + 2h(z).
3.e. Par hypothèse, il existe un ensemble fini Z tel que tout élément x de T puisse s'écrire sous la
forme x = z + 2y avec z G Z et y G T. Soit B = supz€Z/i(;z) et soit A = {a G T, ft(a) ^ 2B}. Alors A
H. 14. LE THÉORÈME DE MORDELL-WEIL
635
est un ensemble fini ; on note ai,..., ar ses éléments. Montrons par récurrence sur k que tout élément x
de T vérifiant h(x) ^ (2h + 1)B peut s'écrire sous la forme niai H h nrar. C'est vrai pour k = 0 par
construction. Si k G N et h(x) ^ (2*+1 + 1)B, on peut écrire x sous la forme x = z + 2y, avec z G Z et
y G T vérifie %) ^ |(/i(^) + /ï(a;)) ^ ±(B + (2*+1 + 1)B) = (2* + 1)B, ce qui permet d'utiliser l'hypothèse
de récurrence pour y, et on conclut en remarquant que z G Z c A.
II
l.a. DUiV n C est en bijection avec un sous-ensemble des racines de PUiV qui est de degré 3.
l.b. Soit (a, 6) G R* x R vérifiant n(a, 6) = 3. Alors le polynôme Pa>6 a trois zéros simples réels
0 < xi < x2 < x$ et, comme Pa>6 est < 0 au voisinage de -oo, on a Pa,6(0) < 0, PaA^t*2) > ° et
Pa,6(a2ta3) < 0. Par continuité, il existe un ouvert Ua>6 contenant (a, 6) tel que, si (u>v) G Ua>6, alors
Pu,t;(0) < 0, PuA^2") > ° et PuA*2^) < °> ce qui implique que Ptt|tl a un zéro entre 0 et ^i±asa,
un entre ^^ et ^±^ et un entre ^^- et +oo, et donc n{u,v) = 3. On a donc montré U D Ua,6, ce
qui permet de conclure.
l.c. Si n(u,v) > 2 et si DUtV n'est pas tangente à C, le polynôme PUiV a 3 racines réelles distinctes
dont deux sont > 0. Le coefficient constant de PUiV est -v2 et il y a priori deux cas :
v = 0 et alors le produit des deux racines non nulles de PUiV est -D2 qui est < 0, ce qui contredit
le fait que ces deux racines sont > 0 ; ce cas est donc exclus ;
v ^ 0 et le produit v2 des racines de PUiV est > 0, ce qui implique que la troisième racine de PUiV
est > 0 et n(u> v) = 3.
l.d. L'ensemble des points P = (x,y) appartenant à C tels que (a, b) appartienne à la tangente à C en
P est l'ensemble des couples (x,y) G R2 vérifiant y2 = x3 - D2x, x > 0 et 2y(b - y) = (3x2 - D2)(a - x).
En particulier, 2by = (Sx2 - D2)(a - x) + 2y2 = 2x3 + 3ax2 + 3D2z - D2a. Si b = 0, alors x est racine
d'un polynôme de degré 3 et comme y2 = x3 - Dx, pour chaque valeur de x, il y a au plus 2 valeurs de y,
ce qui nous fait au plus 6 couples (x>y) solutions. Si b ^ 0, en reportant la valeur de y dans l'équation
y2 = x3 - Dx> on voit que x est racine d'un polynôme de degré 6 et donc qu'il y a au plus 12 couples
(x,y) solutions.
2.a. Si t G R, la fonction x h-> x3 - D2x -12 est décroissante de 0 à ^ et croissante de ^ à +oo.
Comme elle est ^ 0 en x = 0 et x = D, elle ne s'annuUe pas sur ]0,D[ et comme elle tend vers +oo
en +oo, elle s'annuUe une et une seule fois sur [D, +oo[. Si on note F(t) le point où elle s'annule, alors
P(t) = (F(t),t) est l'unique point de C vérifiant y(P(t)) = t, ce qui permet de conlure.
2.b. La fonction x h-> x3 - D2x est croissante et de classe tf1 sur ]^, +oo[ ; c'est donc une bijection de
1*75' ~*~°°[SU11 " 375' ~*~°°[et son *nverse G est de classe tfl et vérifie G(0) = D ; comme on a F(t) = G(t2),
cela permet de conclure.
2.c. Si y G R, soit fy(x) = x3 - D2x - y2. Soit e > 0. Alors /y((l + e)\y\2'3) et /y((l - e)\y\2'3) sont
équivalents respectivement à ((1 +e)3 - l)y2 et ((1 -e)3 - l)y2 au voisinage de \y\ = +oo. En particulier,
si \y\ est suffisamment grand, alors /y((l + e)M2^3) et /y((l ~ e)M2^3) sont de signes opposés et on a
(1 - e)|y|2/3 ^ F(y) < (1 + e)\y\2l3. On en déduit le fait que |y| 2/3F(y) tend vers 1 quand |y| tend
vers +oo.
2.d. L'équation de la droite D(a,t) est x - F(a) = F(^^(a) (y _ a) que l'on peut réécrire sous la
forme x = F(*^(a)y + F(tt)j-»F(*>. Pour comprendre l'intersection de D(a,t) avec C, on peut utiliser
l'équivalence (II) & (13) et considérer le polynôme Qu>t;, avec u = F(*^(a) et v = F(°>j-^(') dont le
coefficient dominant est t*3 et le terme constant est v3 - D2v. Le produit des racines de QUiV est donc
-v ~P v, et comme QUiV a comme racines a et t par construction, sa troisième racine est - v ^ v = Ha(t).
636
ANNEXE H. PROBLÈMES CORRIGÉS
Les résultats à démontrer sont alors des conséquences immédiates de la question l.c. et de l'équivalence
(Tl) & (T3).
2.e. Comme F(i) ~ £2/3 au voisinage de +00, on a |(p(t)Ip(0\)3 qui tend vers 1 quand t tend vers +00
et Ha(<) tend vers -£(F(a)3 - D2F(a)) = -£ • o2 = -a et la droite D(*,a) devient verticale.
3.a. On a L'(y) = 3F/yyi_Di > 0, ce qui montre que L est une Injection croissante de R sur son image.
Comme limy^_oo L(y) = 0 et limy^+oo L(y) = Q, cela permet de conlure.
3.b. Comme F est paire, on a L(-y) = J~^ 3F(t)!_Da^ = /y+°° mt)*-D*dt> ce Qu[ fait Que
L(y) + L(-y) = /_+~ wçfepdt = il.
4.a. Les deux membres sont des polynômes de degré ^ n— 1, prenant les mêmes valeurs en x\y... ,xn ;
la différence est donc un polynôme de degré < n — 1 ayant n racines et donc est nulle.
4.b. Si on applique ce qui précède au polynôme X*, que l'on identifie les termes de degré n - 1 et que
l'on remarque que R^fa - Xj) = P'fai), on obtient £"=1 p^y =0sifc^n-2et £?=i p^y = 1 si
A; = n-l.
5'a- *W = Fto$-Wt)) et VW = ^W " W«% sont de classe *" car 2/1, 2/2 et F
le sont et F(t/i(t)) - F(y2(t)) ne s'annulle pas puisque 2/i(*) ^ t/2(*) sont > 0 (et donc yi(t) ^ ±y2{t)).
On a |G' = X)i=i 3a5/iD2» Par ailleurs, on a aussi
ÎViy'i = (*xl - °2)^ et V* = uxi + ^ + *>'•
On peut éliminer xj entre ces deux équations pour obtenir
(3s? - D2 - 2uyi)y'i = (3s? - D'Xu's, H-1/)
et
-3 3 -
2 ^ = U' U 3** " D* " 2^ + "' S 3** " °2 " 2^ '
De plus, si,S2,S3 sont les racines du polynôme P(s) = x3 — D2s — (ux + v)2 dont la dérivée est
3s2 - D2 - 2u(ux + v) et comme 2/z = uxi + v, on obtient \G' = u' YS=i p%j + v' Yh=\ pT^ry = 0
d'après la question précédente. La fonction G a donc une dérivée nulle sur I et est donc constante.
5.b. La formule donnant Ha(t) montre que la fonction Ha(t) est de classe <€1. La question précédente
montre alors que G(t) = L(a)+L(£)+L(Ha(£)) est constante sur tout intervalle I pour lequel Ha(t) £ {a, t)
quel que soit tel. Par ailleurs, l'ensemble des points où Ha(t) = a est fini (c'est l'intersection de la
tangente à C en P(a) avec C) et l'ensemble des points t tels que Ha(t) = t est aussi fini d'après la
question l.d. La réunion des intervalles I pour lequels on a Ha(t) £ {a,t} quel que soit tel recouvre
donc ]a, +oo[ à un nombre fini de points près, et comme G est constante sur chacun de ces intervalles
et continue sur ]a, +oo[, elle est constante sur ]a, +oo[. On a donc, d'après les questions 2.e et 3.b.,
G(t) = lim^+00 G(t) = L(a) + L(-a) + lim^+00 L(i) = 2Q.
5.c. Si parmi yu y2 et 2/3, deux sont > 0, la question précédente montre que L(t/i)+L(t/2)+L(t/3) = 2Q.
Si deux sont < 0, alors L(t/i) + L(y2) + L(t/3) = 3fî - (L(-yi) + L(-t/2) + L(-t/3)) = Cl. Le cas 2/1 = 0,
2/2 > 0, 2/3 < 0 est impossible car y\ =0 implique X\ = D et comme x2 et #3 sont > D, les points (#1,3/1),
(#2,2/2) et (#3>2/3) ne peuvent pas être alignés.
5.d. Posons a = y2. Comme il n'y a qu'un nombre fini de tangentes à C qui passent par P(a), il existe
un intervalle ouvert I contenant 2/1 tel que la droite D(a, t) ne soit pas tangente à C si t e I — {2/1}- Mais
alors Ha(£) est continue en t = 2/1 et L(a) + L(t) + L(Ha(£)) est à valeurs dans {Cl, 2Q} sur I - {2/1} ; elle
est donc constante sur I et à la limite, on obtient 2L(y\) + L(2/2) e {f2,2f2}.
5.e. D'après la question l.c, la droite joignant P(2/i) à P(y2) coupe C en un troisième point P(s)
ou est tangente à C en P(y\) (resp. en P(y2)) auquel cas on pose z = 2/1 (resp. 2 = y2). D'après les
H.14. LE THÉORÈME DE MORDELL-WEIL
637
questions 5.c. et 5.d., on a dans tous les cas L(yi) +L(y2) + L(z) G QZ et donc L(z) - L(t/3) G CtZ. Mais
comme L(z) - L(t/3) G] - f2,f2[, cela implique L(z) - L(t/3) = 0 et donc z = t/3 puisque L est injective.
6.a. D'après la question 3.a, E est une bijection de C sur G et on peut (et doit) définir + par la formule
P + Q = E-^ECPJECQ)). On doit alors avoir exp (2j*(L(y(P + Q)) - L(y(P)) - L(y(Q)))) = 1 et donc
L(y(P+Q))-L(y(P))-L(y(Q)) G ftZ. Le reste de la question résulte de ce que L(y(P))+L(y(Q)) G]0,2fî[
etL(y(P + Q))elO,ft[.
6.b. oo = E~1(l) est l'élément neutre de + par construction et Pi + P2 + P3 = 00 si et seulement si
L(t/i)+L(t/2)+L(t/3) G f2Z, c'est-à-dire si et seulement si Pi, P2 et P3 sont alignés d'après les questions 5.c
et 5.e.
6.c. Si P = (x,y) et -P = (x',y'), on a L(y) + L(t/') G QZ et comme L(y) et L(t/') appartiennent à
]0,f2[, cela implique L(t/') = Q - L(y) = L(-y) et donc y' = -y puisque L est injective.
6.d. Comme E induit un isomorphisme du groupe C sur G, l'ensemble des solutions de l'équation
2Q = P est en bijection avec celui de l'équation z2 = E(P) ; l'équation 2Q = P a donc toujours 2
solutions.
6.e. Si yi + 3/2 ^ 0, on a L(t/i) + L(t/2) 7^ ^ et, quitte à remplacer t/i par -y\ et t/2 par -t/2, on peut
supposer 0 < L(t/i) +L(t/2) < ft- Comme L est continue, il existe des intervalles ouverts Ii 3 y\ et I2 3 î/2
tels que l'on ait 0 < L(^i) + L(^2) < H si (zi,z2) G Ii x I2. La bijection réciproque L""1 :]0,f2[—> R étant
continue, la fonction (21,22) ■-> L""1^^) + L(^2)) = î/(P(^i) + PO&2)) est continue sur Ii x I2, ce qui
permet de conclure.
III
l.a. Commençons par supposer Pi, P2 et P3 distincts. La droite passant par Pi et P2 est la droite
d'équation y = y\ + %lZl\(% - x\). On en déduit le fait que #1, #2,23 sont les racines du polynôme
P(x) = x*- D*x - L + V*^-(x - x,))'.
v X2 — x\ /
La somme des racines de ce polynôme est alors (j^Z^) et comme
t/2 -3/1 _ vl-yj _ sj ~ p2a:2 - x\ + D2xi _ xl+xix2+x% -D2
0:2-0:1 (yi +y2)(x2-xi) " (yi + y2)(x2-xi) 2/1 + 2/2
on obtient #3 = (a|+a^^?""P ) - #i - X2. La formule pour t/3 s'en déduit en utilisant la formule
précédente et le fait que P3 est sur la droite d'équation y = yi + HZl\(% - %i)- Le cas où P3 G {Pi, P2}
se déduit du cas général par continuité (cf. question 6.e de la partie II).
l.b. x\ + D, X2 + D et xs + D sont les racines du polynôme P(x - D) dont le terme constant est
-(ë^(-D - «d + yi)2 = -(y^^)-_if^))\
2.a. Ces formules se déduisent de celles de la question l.a par continuité.
2.b. On a x' = (^^f - 2x = »*4-™2**+»4-»*v\ et comme y2 = a:3 - D2a:, on a aussi
9a:4 - 6D2a:2 + D4 - 8xy2 = x4 + 2D2a:2 + D4 = (x2 + D2)2.
3. Comme -P est le symétrique de P par rapport à l'axe des a:, C(Q) est stable par passage à l'opposé.
Soient P et Q appartenant à C(Q). Il s'agit de prouver que P + Q G C(Q). C'est trivial si P = 00 ou si
Q = 00 ou si P = -Q. Dans tous les autres cas, on y(P) + y(Q) ^ 0 et on peut utiliser les formules des
questions 2.a et 3.a pour conclure.
638
ANNEXE H. PROBLÈMES CORRIGÉS
4. D'après la question 2.b, on a
<„+D)te+D)(,.,+D)=((I1+D)g:i?+D)y')2
(«, + D)(ft + D)(«. + D) .(ÉEllÏÏÊl^lBÎSi)»
et (x3 + D)(*4 + D) est le carré de ^S^+^ Comme y2 = a* - D2xt = *,(*, + D)(Xi - D),
cela implique que (#3 + D)(x4 + D) est aussi le carré de
(xi + D)x2(x2 - D) - (x2 + D)si(si - D) _ xïx2 + 1D(xi +x2) - D2
(xi - a:2)2 #2 - xi
IV.A
l.a. Si 6 G Q* et si a = 62, alors a > 0 et vp(a) = 2vp(6) est divisible par 2. Réciproquement, si a > 0
et si vp(a) = 2np, alors a est le carré de IlPPnp 0e produit est un produit fini).
l.b. On a vp(ckb) = vp(a) + vp(d), vp(da) = vp(a) + vp(d) et vp(d(a + b)) = vp(a + b) + vp(d), ce
qui permet, en prenant pour d le produit des dénominateurs de a et 6, de se ramener au cas où a et
b sont entiers. On a alors a = pv^a^a' et b = pvpWpvp(b)-vpWf/ avec a' et &' premiers à p. Comme
vp(b) - vp(a) > 0, on a p qui divise pMW-M»)^ et comme a7 est premier à p, cela fait que p ne divise
pas c = a7 + pvp W-M<0&' et donc que a + b = pM«)c vérifie vp(a + b) = vp(a).
2.a. Comme c est un carré, vp(c) est pair et vp(c) ^ 1 implique vp(c) ^ 2. D'autre part, a n'est pas
divisible par p2 car sinon, (p~~2c)a serait entier, ce qui contredit la minimalité de c; donc vp(a) ^ 1 et
Vp(a)G{0,l}.
2.b. On a a(a - Dc)(a + De) = c3y2 et comme c est un carré, il en est de même de a(a - Dc)(a + De).
2.c. Soit p un nombre premier divisant a(a - Dc)(a + De) et pas 2D. Si p divise a et c, alors vp(a) = 1
et vp(c) ^ 2 d'après la question 2.a, et on a vp(a - De) = 1 et vp(a + De) = 1 (question l.b) et donc
vp(a(a - De)(a + De)) = 3 ce qui est impossible puisque a(a — De)(a + De) est un carré. Donc p ne divise
pas (a,c) et p divise un seul des trois nombres a, a — De et a + De et, comme le produit de ces trois
nombres est un carré, deux des nombres vp(a), vp(a — De) et vp(a + De) sont nuls et le troisième est pair.
3.a. Il s'agit de vérifier que l'on a <p(P + Q) = <p(P) + <p(Q) ou encore, comme <p(P) = -<p(P), que
cp(P + Q) + <p(P) + (p(Q) = 0. C'est trivial si P = 00 ou Q = 00 ; ça l'est aussi si P + Q = 0 car alors
x(P) = x(Q). Si Q i {P, -P}, la formule <p(P + Q) + <p(P) + <p(Q) = 0 résulte de la question 2.b de la
partie III et, si Q = P, on a 2<p(P) = 0 = <p(2P) d'après la question 3.b de la partie III.
3.b. Si Q = (x,y) G C vérifie 2Q = P, l'hypothèse selon laquelle x\ x1 - D et x1 + D sont des carrés
dans Q nous dit, d'après la question 3.b de la partie III, qu'il existe des rationnels a, 6, c tels que l'on ait
x2 + D2 x2 + 2Dx - D2 L x2 - 2Dx - D2
—^ = a, - = 0 et = c.
2y 2y 2y
On a alors 2a - b - c = -^, ce qui prouve que y est rationnel, et b - c = 2Ç2, ce qui prouve que x est
rationnel et donc Q G C(Q).
3.c. Si P = (x, y) e C(Q) est dans le noyau de <p, c'est que vp(x) et vp(x + D) sont pairs quels que soit
le nombre premier p. D'autre paît, comme x^D, onax>0eta: + D>0eta:eta: + D sont des carrés
dans Q d'après la question l.a. Comme x(x - D)(x + D) = y2 est un-carré, il en est de même de x - D.
D'après la question 6.d de la partie III, l'équation 2Q = P a au moins une solution Q = (xyy) dans C
et la question précédente montre que Q G C(Q) et P G 2C(Q). Réciproquement, si P = 2Q, P ^ 00 et
Q G C(Q), alors la question 3.b de la partie III montre que x et x + D sont des carrés dans Q et P est
dans le noyau de (p. On a donc Kertp = 2C(Q).
H. 14. LE THÉORÈME DE MORDELL-WEIL
639
3.d. Soit Z c C(Q) tel que (p induise une bijection de Z sur l'image de C(Q) dans (Z/2Z)2s+2. Alors
Z est fini (puisqu'il est en bijection avec un sous-ensemble d'un ensemble fini) et, si P 6 C(Q), il existe
R 6 Z tel que </>(P - R) = 0 ; il existe alors Q € C(Q) tel que P - R = 2Q et P = Z + 2Q, ce qui prouve
que C(Q) est de type fini modulo 2.
IV.B
1. Si 2P = oo, il n'y a rien à démontrer. Sinon, si 2P = «y')» on a x' + D = (a;2+2g/a;"D2)2 d'après
la question 3.b de la partie III. Ceci peut se réécrire sous la forme
x/ , D _ (g + 2Df - p2)2 = ("2 + 2Dac - D2c2)2
4(g. _ D2|) 4ca(a - Dc)(a + De) '
Alors c7 = 4ca(a - De) (a + De) est un carré puisque c en est un et a(a - De)(a + De) aussi d'après la
question 2.b de la partie IV.A. On a donc
h(2P) ^ log(cV + D)) = 21og((a + cD)2 - 2D2c2) ^ 41og(a + De) = 4/i(P).
2.a. Si d divise T, U et V, alors d divise aussi les quantités T + U + DV = 2Dai(a2 + DC2) et
T + U - DV = 2Da2(ai + Dci). Il divise donc aussi (ai + Dci)(T + U + DV) - 2DaiU = 4D3aidc2 et
(ai + Dci)(T + U + DV) - 2DaiU - 4D3ciV = 4D3a2c?. Par symétrie, il divise aussi 4D3aic|.
2.b. D'après la question 2.c de la partie IV.A, vp(a,i) est pair et d'après la question 2.a de la partie IV.A,
on a vp(a,i) ^ 1 si vp(ci) ^ 0 ; ceci implique que, si vp(ci) ^ 0, alors vp{ai) = 0 et donc que p ne divise
pas le p.g.c.d. de a* et c*.
Maintenant, comme p est premier à 4D3, il divise ai ou C2. S'il divise ai, alors il ne divise pas C\ et
donc il divise a2 et donc il ne divise pas pas c2 ni aia2 + D2cic2. De même, s'il divise c2, alors il ne divise
pas a2 et donc il divise c\ et pas ai et pas non plus aia2 + D2ciC2.
2.c. Supposons le contraire ; il y a plusieurs cas :
p divise C\ et C2 ; auquel cas, p2 ne divise ni ax ni a2 d'après la question 2.a. de la partie IV.A et
p3 ne divise ni aia2 ni aia2 - D2ciC2 puisque C1C2 est divisible par p4 ; ce cas est donc exclus ;
p divise c\ mais pas C2, auquel cas p2 ne divise pas ai et p5 ne divise pas 4D3aiC2 ; ce cas est donc
aussi exclus ainsi que le cas symétrique p divise C2 mais pas C\ ;
- p ne divise ni c\ ni C2 ; auquel cas p2 divise ai et a2 et aia2 + D2ciC2 n'est pas divisible par pb
puisque D2 n'est divisible que par p2 et axa2 est divisible par p4 ; ce cas est donc aussi exclus.
2.d. Il suffit de regrouper les résultats des 3 questions précédentes.
2.e. Soit C3 (resp. C4) le plus petit carré tel que C3X3 (resp. C4X4) soit entier. Soient n = C3C4, a = |,
b = y et c = |. Alors a, 6 et c sont premiers dans leur ensemble et ^ = ^ = C3XZC4X4 est entier
ainsi que ^ = ^ = 03(0:3 + 0)04(24 + D). Il existe q> r, s entiers tels que l'on ait qa + rb + se = 1, et
*Ç|£l = r = qn!L + rnk + $n est entier. Maintenant, un entier > 0 étant ^ 1, on a
fc(P3) + h(P4) =\og(cz(x3 + D)) + log(c4(a:4 + D))
= log(c3c4) + log — = log d' - log S + log —— ^ log d' - log S.
e e
2.f. D'après la question 5 de la partie III, on a
_rx\x2 - D2\2 _ /aia2 -D2ciC2\2
V Xi — X2 ' V aiC2 — a2Ci /
fe + D)(^ + D) =("^ + ^^ + ^)-^^)2
640
ANNEXE H. PROBLÈMES CORRIGÉS
On peut utiliser la question précédente avec d = {aia2 — D2ciC2)2, d' = (aia2 + D(oiC2 +a2Ci) - D2ciC2)2
et e = (aiC2 - a2Ci)2. La question 2.c. montre que le p.g.c.d. ô de d, d' et e divise (2D)3 ; on a donc
/i(P3) + h(P4) > 21og(oia2 + D(alc2 + a2Ci) - D2dc2) - log(2D)3.
Par ailleurs, on a
aia2 + D(aiC2 + a2Ci) - D2cic2 =(ai + Dci)(o2 + Dc2) - 2D2ciC2
=(«. + P»)(«+D»)('-(,1+1jg, + D)),
et comme x\ ^ D et a;2 ^ D, on obtient
aia2 + D(aic2 + a2Ci) - D2cic2 ^ -(ai + Dci)(a2 + Dc2),
et donc
*(P3) + /i(P4) ^ 21og(i(ai + Dci)(a2 + Dc2)) - log(2D)3 ^ 2(/i(Px) + h(P2)) - log(32D3).
3.a. Il suffit de regarder les formules de la question 2.a de la partie III.
3.b. Si P = 00 ou si P = (0,D), le résultat est évident. Sinon, choisisons Q ^ {P,-P,oo, (0,D)}. On
a, en utilisant deux fois la question 2.f., la première fois avec Pi = P + Q et P2 = P - Q,
h(2P) + h{2Q) > 2(h(P + Q) + h(P - Q)) - 21og(2(2D)3) ^ 4(/i(P) + h(Q)) - 61og(2(2D)3),
et on conclut en utilisant l'inégalité 4/i(Q) ^ h(2Q) de la question 1.
3.c. Si P = 00 ou Q = 00, on peut prendre A = 0. Si P = Q ou P = -Q, on peut prendre
A = 61og(2(2D)3) d'après la question précédente et si P ^ ±Q et (P,Q) G C(Q), on peut prendre
A = log(2(2D)3) d'après la question 2.f. Finalement, A = 61og(2(2D)3) marche dans tous les cas.
3.d. En utilisant la question précédente pour P + Q et P - Q, on en déduit la minoration
h(2P) + h{2Q) ^ 2(h(P + Q) + h(P - Q)) - A, et comme h(2P) ^ 4h(P) et h(2Q) ^ 4h(Q) d'après
la question 1, on obtient h(P + Q) + h(P - Q) < 2h(P) + 2h(Q) + f. Donc finalement, on a, quel que
soit(P,Q)GC(Q)2,
\h(P + Q) + h(P - Q) - 2h(P) - 2h{Q)\ ^ A.
3.e. Soit B > 0. Si h(P) ^ B, on a soit P = 00, soit il existe des entiers positifs a et c vérifiant
a + De < eB tel que P = (^>y). Comme l'ensemble de ces couples d'entiers est fini et que pour chaque
valeur de x> il y a au plus deux valeurs de y possibles, l'ensemble des P vérifiant h(P) ^ B est fini quel
que soit B > 0.
3.f. Le groupe C(Q) est de type fini modulo 2 d'après la question 3.d de la partie IV.A et possède
une hauteur admissible ; on peut donc utiliser les résultats de la question 3.e de la partie I.
INDEX
642
INDEX
Index terminologique
adèle, 331, 523, 535, 536, 549 551, 553
adhérence, 136
algébricité
élément, 90
extension, 92
algèbre, 20
unitaire, 20
anneau, 18
de Dedekind, 533
euclidien, 51
intègre, 18, 34
noethérien, 51
principal, 50
associativité, 17
bande de Moebius, 135, 151
base, 65
canonique, 65
de transcendance, 94
duale, 70
hilbertienne, 284 286, 289, 291, 293, 341,
342, 344, 589
orthonormale, 174, 293, 294, 482, 485 487,
491
bloc de Jordan, 112, 116
borélien, 303
boule
fermée, 131
ouverte, 131
bouteille de Klein, 135
caractéristique d'un corps, 88
caractère
cyclotomique, 527
de Dirichlet, 250, 415 417, 420, 421, 435,
444, 523, 527 529, 532, 540
de Hecke, 533 535
irréductible, 246, 466, 477
linéaire, 238, 249, 259, 334, 335, 338, 341,
344, 466, 469, 471, 540, 561
primitif, 416
représentation, 237 239, 241, 246, 261 263
table, 252, 474
de Teichmùller, 493
unitaire continu, 331, 544, 545, 547 549
catégorie, 26
centralisateur, 37
centre, 37, 465
chemin, 365
clôture
algébrique, 92
intégrale, 92
classe
de conjugaison, 37, 465, 472, 556, 557
d'équivalence, 27
formule des, 42
coefficient
dominant, 48
de Fourier, 286, 291, 340, 342, 344, 479, 480,
587, 603
de Mahler, 200, 294, 479 481, 483, 484, 486
multinomial, 503
d'un polynôme, 48
cofacteur, 82
commutativité, 17 19
compacité, 139,141,142,145,171, 188,196, 270,
272 274, 279, 287, 290, 291, 298, 320,
324, 331, 363 365, 368, 370, 371, 373,
382, 383, 387, 396, 402 404, 425, 482,
486, 537, 539, 542, 549
compacité locale, 145, 196, 305
complétion, 154, 192, 193, 279, 313, 356
complétude, 151, 193, 194, 199, 269 271, 279,
283, 287, 291, 297, 312, 316, 353, 356
complexifié, 125, 173, 179
conducteur, 416, 543, 545
congruence, 29
conjugaison, 37
complexe, 23, 177
dans un corps, 91
connexité, 148, 150, 284, 362 364, 380, 385, 387,
388, 393, 396
composante connexe, 148, 387
par arcs, 149
constante 7 d'Euler, 158, 403, 414, 429
continuité, 132
INDEX TERMINOLOGIQUE
643
uniforme, 133
contractile, 223, 379, 380, 382, 386, 395, 564
convergence
absolue, 159
en moyenne, 308, 314
en moyenne quadratique, 286, 312, 314
normale, 185, 270
simple, 165, 274, 314
simple p.p., 302, 314
uniforme, 166, 188, 272, 314
convolution, 322, 333, 348, 382, 593
coordonnée, 65
corps, 19
à un élément, 30, 98
algébriquement clos, 92
de décomposition, 96
fini, 39, 41, 54, 97, 228, 449, 465, 553, 561
des fractions, 19, 55, 123, 167
de rupture, 95
coupures de Dedekind, 192
courbe
de Peano, 186
elliptique, 39, 509 511, 513, 515, 516, 521,
522, 597
critère
de Cauchy, 14, 151, 159, 226, 403
de Cauchy uniforme, 167, 226
de Leibnitz, 164, 224
cycle, 43 46, 208, 237, 253 255, 267, 468, 569,
572
cylindre, 135, 151
décomposition
en cycles, 43, 208
de Dunford, 117
en éléments simples, 55, 211, 443, 499, 500,
622
d'Iwasawa, 178
polaire, 181
dénombrable, 14, 270, 281, 284, 299
non dénombrabilité de R, 15, 16, 140
dérivée, 50
n-ième, 50
divisée, 50
logarithmique, 404
déterminant
de Cauchy, 82
circulant, 82
endomorphisme, 74, 79, 110, 276
de Gram, 175, 228
de Hankel, 626
matrice, 18, 79 83, 85, 88, 102, 105, 107,
111, 115, 122, 215
de Vandermonde, 82, 84, 217
vecteurs, 72, 79, 83, 101, 113
degré
élément, 91
extension de corps, 89
partiel, 56
polynôme, 48
total, 56
transcendance, 94
demi-plan de Poincaré, 364, 380, 392, 423
densité, 136, 139, 153 155, 166, 171, 183, 188
190, 195, 201, 273, 274, 279 281, 284,
285, 289 292, 300, 301, 313, 315, 316,
320, 336, 339, 342, 343, 351, 353, 356,
394, 537, 538, 552
diagramme de Young, 469, 470
difféomorphisme, 319
dimension, 66
finie, 66
infinie, 66
discriminant, 107, 173, 509, 511, 523, 531
distance, 130
équivalence, 131
p-adique, 193
triviale, 132
ultramétrique, 131
distribution, 280, 315, 336, 347, 353, 406
distributivité, 17
diviseur
élémentaire, 121
de 0, 18
division euclidienne, 50
dodécaèdre, 573
dollar, 432
million de, 415, 507, 513
domaine fondamental, 36, 344, 345, 451
dual
espace de Banach, 282
espace vectoriel, 69, 70
644
INDEX
réseau, 343
endomorphisme, 110
diagonalisable, 111
trace, 111
ensemble triadique de Cantor, 186, 189
entier
algébrique, 59
de Gauss, 34, 51
équivalence
classe, 27
distances, 131
normes, 167, 169, 227, 270
quotient par une relation, 28
relation, 27
espace
caractéristique, 112
de Banach, 269 272, 279 283, 288, 290, 311,
315
de Hilbert, 283, 284, 288, 290, 312, 315, 353
métrique, 131
métrisable, 131
préhilbertien, 173
propre, 111
espace fonctionnel
^, % ou %, 272, 273, 284, 336, 479, 482
<gk ou ^°°, 279, 280, 480, 481
tf* ou «5°, 481, 483
.S?1 ou L1, 136, 307, 308, 310 313, 315 318,
320, 322, 335 337, 347, 349, 351, 352,
362, 405
.S?2 ou L2, 136, 286, 291, 292, 312, 313, 315,
348 354, 362
LP, 315
Schwartz S*, 345, 539 546
Sobolev H&, 279, 284, 353
espace vectoriel, 19
étoile, 379, 382, 386
exponentielle
complexe, 162
de matrice, 276, 550
extension
corps, 89
finie, 89
infinie, 89
scalaires, 126
facteur d'Euler, 410, 524, 528, 530, 533, 534, 552
famille
génératrice, 64
liée, 64, 627
libre, 64
orthonormale, 173
fermé, 129
de Zariski, 130
fonction
analytique, 359, 363, 485, 603
caractéristique, 7, 201, 298, 302, 303, 491,
539
centrale, 237, 245 247, 249, 262, 475, 477
continue, 132, 199
de carré sommable, 269, 280, 312, 313, 350,
351, 353, 362
holomorphe, 2, 274, 359 364, 368, 369, 371-
377, 380, 382, 385 388, 390 396, 400,
401, 403, 404, 406, 410, 411, 416, 419,
421, 423, 425, 426, 434, 436, 437, 439,
440, 444, 529, 530, 534, 544 547, 550,
562, 564, 566, 568, 612 622, 626, 628
lipschitzienne, 133
localement analytique, 486, 487
localement constante, 201,231,490,539,542,
552
méromorphe, 393, 394, 397, 400, 403, 410,
412 414, 422, 426, 434, 436, 437, 529,
534, 545, 546, 562, 598, 605, 606, 608,
610 613, 616, 618, 619, 622, 626
mesurable, 301, 302, 308, 313, 317, 319, 323,
327 329, 331, 373
polynomiale, 49, 56, 84, 86, 218
sommable, 307,308,311,315,322, 332,334-
336, 347, 348, 351 353, 373, 374, 389,
405, 435, 542 544, 546
symétrique élémentaire, 58
uniformément continue, 132, 143, 154, 183,
200, 226, 231, 482
fonction L, 2, 523, 524
Artin, 528, 529
automorphe, 550
Dirichlet, 401, 415, 416, 419, 431, 436, 528,
529, 534, 535
forme modulaire, 424, 530, 532
Hecke, 534, 535
INDEX TERMINOLOGIQUE
645
idèles, 547
fonction spéciale
de Bessel, 334, 532, 607
elliptique, 597
77 de Dedekind, 467, 532, 614, 619 621
T d'Euler, 331, 333, 358, 374, 397, 403, 404,
411, 415, 550, 559, 566, 612, 622
d'Hermite, 589
ip indicatrice d'Euler, 30, 32, 83, 431
M de Mertens, 446
\i de Moebius, 422, 446
r de Ramanujan, 422
9 de Jacobi, 425, 427, 532, 615
p de Weierstrass, 597
fonction zêta
de Dedekind, 534
de Hasse-Weil, 524, 526
de Riemann, 2, 399, 410, 411, 414, 415, 419,
426, 430, 431, 433, 436, 444 447, 612
p-adique, 489
forme
alternée, 71, 366
automorphe, 549, 551
bilinéaire, 71, 258, 260
différentielle, 366, 380
hermitienne, 181
de Jordan, 110, 112, 117, 241
linéaire, 32, 258,280,282,283,288 291,298,
315, 366
de Maass, 532, 533, 551, 552
modulaire, 3, 4, 234, 423 428, 467, 524, 530,
551, 552
mutilinéaire, 71
parabolique, 530
primitive, 530, 551
quadratique, 4
sesquilinéaire, 312
formule
£, 424, 428
sommatoire d'Abel, 164, 401, 402, 446
du binôme, 20, 118, 229, 231, 356
de Burnside, 249, 255, 256, 571, 576
de Cauchy, 199, 367,369,371, 374, 379,383,
387, 391
du changement de variable, 319
de Cramer, 101
des compléments, 396, 404, 559, 622
des équerres, 469, 470
d'Euler, 612
explicite, 437, 445
de réciprocité de Frobenius, 262, 264
de Gauss, 333, 404
fe-x*dx = v^r, 321, 397
de Grassmann, 69
d'inversion de Fourier, 250, 331, 351, 352,
458, 540, 541, 562 564, 595, 596
d'inversion de Moebius, 422
de Jacobi, 428, 612
de Liouville, 277
de Poisson, 345,449,457, 539, 541, 546, 564,
565, 595, 605, 609, 610, 620
du produit, 449, 536, 538
des résidus, 379,389,395 398,412,413,420,
425, 434, 437, 442, 558, 563, 565, 600,
601, 608, 612, 624
de Stirling, 333,358, 407, 408,436, 504, 622,
625
de Stokes, 380
de Taylor, 34, 50, 211, 273
C(2) = ^, 2, 291, 322, 340, 397, 593, 614
groupe
alterné, 18, 45, 46, 209, 233, 253 256, 265,
526, 531, 533, 555, 562, 569
cyclique, 39
distingué, 38
général linéaire GLn, 18, 23, 35, 36, 45, 62,
80, 84, 85, 103, 104, 107, 111, 115, 121
123, 128, 176, 178, 179, 182, 208, 214,
218, 229, 275 277, 449, 465, 471, 472,
474, 530, 549, 551, 552, 574, 579
le monstre, 233, 526
orthogonal O(n), 36, 177
p-groupe, 47, 465, 466
p-Sylow, 47
simple, 38, 233
spécial linéaire SLn, 18, 27, 80, 85,122,124,
177, 179, 215, 229, 449, 453, 459
spécial orthogonal SO(n), 177
spécial unitaire SU(n), 177
sporadique, 233
symétrique, 18, 43, 44, 46, 58, 71, 73, 79,
80, 88, 99, 103, 208, 209, 213, 236, 237,
646
INDEX
242, 249, 251, 253, 260, 265 267, 461,
465, 467 469, 503, 526, 531, 555 557,
560 562, 569, 574, 575, 578
symplectique, 36
unitaire U(n), 36, 177
homéomorphisme, 132
homothétie, 63, 110
icosaèdre, 573
idéal, 21, 33
maximal, 34, 35, 109
premier, 34, 109
principal, 50
idèle, 535, 538, 544, 548
image, 23
inégalité
de Cauchy, 369, 370, 628
de Cauchy-Schwarz, 173, 272, 288, 313, 591
de Hôlder, 315
de Minkowski, 315
triangulaire, 131, 136, 155, 169, 173, 536
ultramétrique, 193, 200, 356
indépendance algébrique, 94
indice d'un lacet par rapport à un point, 387,
396, 413, 434
intégrale
p-adique, 490
de Cauchy, 297
de Lebesgue, 297, 298, 304
de Riemann, 297, 298, 323
intérieur, 136
inversibilité, 17
irréductibilité
élément, 52
polynôme, 53, 114
isométrie, 175
jacobien, 319
matrice jacobienne, 319
lacet, 147, 365
laplacien, 182
limite
inférieure, 146
projective, 195, 356
simple, 165
supérieure, 146
uniforme, 166
linéaire
application, 22
combinaison, 64
forme, 69
logarithme complexe, 334, 360
détermination, 360, 372, 412, 566, 605, 612
détermination principale, 360, 361, 567
multivaluation, 360, 396, 616
loi de composition, 17
matrice, 74
antisymétrique, 79
autoadjointe, 180
par blocs, 87
carrée, 78
diagonale, 78
d'un endomorphisme, 78
de Gram, 175
d'une forme hermitienne, 181
hermitienne, 180
d'un morphisme, 77
nilpotente, 59, 79, 118
orthogonale, 177
de passage, 77
de permutation, 103
scalaire, 78
de Sylvester, 105
symétrique, 79
triangulaire, 78
unipotente, 79
unitaire, 177
de Vandermonde, 215
mesurabilité, 301
mesure
de Haar, 305, 404, 450, 451, 458, 490, 539
de Lebesgue, 304, 306
extérieure d'un ensemble, 299, 326
nulle (ensemble de), 299
sur Zp, 490
mineur d'une matrice, 83
module, 19, 112
de torsion, 114
de type fini, 113
engendré, 113
INDEX TERMINOLOGIQUE
647
morphisme, 22
automorphisme, 23
d'anneaux, 22
d'espaces vectoriels, 22
de corps, 22
de groupes, 22
de modules, 22
de Frobenius, 89, 528
isomorphisme, 22
élément neutre, 17 22, 24, 25, 35, 37, 38, 40, 47,
62, 63, 191, 192, 207
nilpotence, 20, 117, 204
nombre
algébrique, 15, 93, 300, 516, 525
de Bernoulli, 411
binomial, 11
de Carmichael, 42
complexe, 193
congruent, 507
duaux, 34
entier, 190
irrationnel, 13, 289, 300
de Liouville, 301
p-adique, 193
réel, 192
rationnel, 192, 299, 372, 411, 489, 507
transcendant, 15, 93, 300
nombre premier, 12, 429 431, 531
de Mersenne, 31, 429
infinité, 13, 32, 418, 419, 429, 431
presque, 432
régulier, 411
norme
équivalence, 169, 170, 198
de corps, 167
espace vectoriel, 168
opérateur, 168
p-adique, 193
spectrale, 170, 198
ultramétrique, 167, 292, 293, 295
noyau, 24
opérateur, 62
autoadjoint, 179
entrelacement, 240
hermitien, 179
moyenne, 241
norme d'un, 168
orbite, 36, 465
ordre
d'un élément, 40
d'un groupe, 46
orthogonalité, 173
caractère, 238, 246, 248, 416, 476, 478, 540,
544
espace, 70, 174
matrice, 177
projection, 173
symétrie, 176
orthonormalisation de Schmidt, 174, 285
ouvert, 129
base, 129
p-adique
entiers, 194
intégration, 490
nombres, 193, 196, 526, 536
norme, 155, 528, 535, 536
transformée de Fourier, 539 541
transformée de Mellin, 543, 544
partie finie de Hadamard, 406
partition
d'un ensemble, 27
d'un entier, 44, 467
permutation, 35, 43
signature, 45, 561
support, 43
plongement, 88
polynôme, 48
binomial, 11, 65, 200, 356, 501
caractéristique, 85, 86, 111
homogène, 57
interpolation de Lagrange, 50, 65, 211
de Legendre, 291
minimal, 90, 111
symétrique, 58
unitaire, 48
primitive, 385, 386, 395
produit scalaire, 172, 243, 246, 283, 291,312,338,
342, 344
produit tensoriel, 247, 257, 259, 260, 341, 482,
550
648
INDEX
projectif
droite, 35, 471
espace, 35
plan, 135, 509
projection, 63
naturelle, 25, 134, 313, 415, 543
orthogonale, 173
prolongement analytique, 363,399,400,404 406,
410, 417, 422, 425, 426, 524, 529, 530,
534, 545 547, 549, 550, 560, 568, 605,
606, 610, 611, 613, 618, 619
propre
espace, 63, 111
valeur, 63, 80, 111
vecteur, 63, 111
propriété universelle, 25, 26, 32, 33, 38, 125 128,
154, 168, 258
quaternions
corps des, 21
groupe des, 265
quotient
anneau, 29, 33, 34, 114, 192, 193
espace topologique, 135, 147, 338
espace vectoriel, 32, 311 313, 315, 338
groupe, 27, 38, 147, 338, 526, 531, 597
module, 113, 119
par une action de groupe, 36
par une relation d'équivalence, 28, 155, 191,
192, 475
racine
d'un polynôme, 49
primitive, 39
de l'unité, 39
rang
application linéaire, 68
famille de vecteurs, 76
matrice, 76
module, 121, 123
système linéaire, 101
rayon de convergence, 161
réduction
des endomorphismes, 110
modulo D, 29
relation d'équivalence, 27 29, 32, 33, 36, 38,135,
136, 155, 191, 193, 475
représentation, 235
automorphe, 550
duale, 240
fidèle, 235, 267
induite, 261, 262, 470, 471, 552
irréductible, 242 249, 253, 255, 256, 263
267, 466 468, 471, 472, 527, 529, 550,
557, 570 572, 575 578
isomorphisme, 241
de permutation, 239, 254, 267,471,475,527,
556, 557, 560, 561, 570 572, 575, 577,
578, 585
régulière, 239, 246, 249, 256, 261, 468, 470,
560, 561, 572, 577, 585
sous-représentation, 242
triviale, 238, 240, 468, 528, 561, 571, 578
réseau, 124, 343, 456
dual, 343
résultant, 105
rotation, 178
schéma, 109
série
à termes positifs, 156
absolument convergente, 159
alternée, 164
convergente, 156
de Dirichlet, 399 405, 409, 410, 415, 435,
444, 523
divergente, 156
d'Eisenstein, 425, 426, 515, 615
entière, 161,355 357,359,362,364,368,369
formelle, 241, 355, 356, 492, 553, 626
de Fourier, 284, 291, 331, 341, 346, 425, 530,
532
géométrique, 158
de Laurent, 392
de Riemann, 158
semi-convergente, 163
de Taylor, 357, 368, 369, 559, 565, 566
sommabilité
fonction, 307
série, 270
somme de Gauss, 416, 540, 547
somme directe, 25
de groupes, 26
de représentations, 238
INDEX TERMINOLOGIQUE
649
spectre, 111
anneau, 109
sphère de Riemann, 519, 521
stabilisateur, 36
suite
convergente, 138
de Cauchy, 151
extraite, 138
valeur d'adhérence, 140
supplémentaire, 26, 32, 62, 63, 68, 86, 109, 174,
244
surface de Riemann, 519, 521
symétrie, 45, 64
orthogonale, 176
symbole de Legendre, 398
système
de Cramer, 101
linéaire, 101
polynomial, 107
système de représentants, 28
table des caractères, 252, 253, 265 267, 557, 561
A4, A5, 253 256, 562, 569 572
GL2(Fg), 474, 574 577
GL3(F2), 579, 580, 582 585
S3, S4, S5, 265, 266, 556, 557, 560, 561
tableau de Young, 469, 470
tipi de Cantor, 189
topologie, 129, 167, 194
algébrique, 379, 526
discrète, 130, 135, 167, 525
espace topologique, 129
grossière, 130, 135
induite, 133
Krull, 525
produit, 134, 172, 544
produit restreint, 537, 538
quotient, 135
séparée, 135, 136, 139, 311, 312, 315
totalement discontinue, 148, 194
Zariski, 130, 135
tore, 135, 521
trace
endomorphisme, 86
matrice, 79
transcendance
élément, 90
base, 94
degré, 94
extension, 92
transformée d'Amice, 490 492, 495
transformée de Fourier, 331, 565, 612
adélique, 541
dans y, 345 347, 541, 547, 558, 563
dans L1, 335, 336, 347, 349, 352, 362, 558
dans L2, 349, 351, 352, 362, 590
distribution, 347
fonction en escalier, 350
fonction rationnelle, 396, 558
gaussienne, 395, 590, 593, 614
groupes finis, 250
p-adique, 539 541
transformée de Mellin
adélique, 544
p-adique, 543, 544
sur R, 405, 544
transposée
application linéaire, 70
matrice, 74
transposition, 44
transvection, 459
tribu, 303
borélienne, 303
truc, 21
engendré, 21
sous-truc, 21
type fini, 59
ultramétrique, 131, 151, 193, 194, 200, 201, 223,
292, 293, 295, 356, 479, 485
unipotence
élément, 20
unitarité
endomorphisme, 175
matrice, 177
valuation p-adique, 13
variété algébrique, 109
voisinage, 129
base, 130
wronskien, 276
650
INDEX
Énoncés mathématiques
abc (conjecture), 54
application ouverte, 376
Artin
conjecture d', 529, 530, 533, 551
théorème d', 264, 529
Bézout (théorème de), 12, 54, 536
Baie (problème de), 2
Baire (lemme de), 152, 153, 183, 189, 281, 282,
300, 480
Banach-Steinaus (théorème de), 280, 281
Banach-Tarski (paradoxe de), 302
Bateman-Horn (conjecture de), 430, 431
Beilinson (conjecture de), 2
Bessel-Parseval (identité de), 286
Birch et Swinnerton-Dyer (conjecture de), 507
Bloch-Kato (conjecture de), 2, 449
Borel-Cantelli (théorème de), 300, 327
Borel-Carathéodory (théorème de), 440
Borel-Lebesgue (théorème de), 140
Brauer (théorème de), 265, 471, 529
Burnside (formule de), 249, 255, 256, 470, 560,
561, 571, 576, 584
Cauchy (inégalité de), 369, 567, 628
Cauchy-Lipschitz (théorème de), 275
Cauchy-Riemann (relations de), 361
Cayley-Hamilton (théorème de), 86,111,116,579
choix (axiome du), 11, 14, 17, 23, 28, 59, 66, 68,
70, 89, 92, 100, 142, 283, 297, 302
classification des groupes finis simples, 233
Coates-Wiles (théorème de), 513, 514
conjecture principale, 490
continuité d'une intégrale dépendant d'un
paramètre, 331, 349, 350, 388
convergence dominée, 297, 308, 311, 313, 318,
319, 331 333, 340, 347, 352, 369, 383,
568
pour les séries, 161, 310, 347, 409, 445
convergence monotone, 308, 310, 318, 329
pour les séries, 157
dérivation sous le signe somme, 332, 333, 337
Deligne (conjecture de), 2
divergence de la série harmonique, 156, 208, 429,
588
Erdôs (problème d'), 432
Fatou (lemme de), 308
fermés emboités, 153, 154
Fermât
grand théorème de, 234, 411, 424, 525, 531,
574
nombres premiers de la forme An + 1, 53,
432, 524
non congruence de 1, 508
petit théorème de, 13, 32, 42
Fischer-Riesz (théorème de), 312
Fubini (sur N x X), 310, 451, 617
Fubini (théorème de), 297, 315, 316, 318, 347,
350, 374
Fubini pour les séries, 157, 160
Galois (problème inverse de), 526
Gauss (lemme de), 12, 52
graphe fermé, 282
Grassmann (formule de), 69
GRH (conjecture), 421
Hôlder (inégalité de), 315
Hahn-Banach (théorème de), 283
Hasse (théorème de), 511
Hasse-Weil (conjecture de), 524
Hecke (théorème de), 534
Heine (théorème de), 143
Hilbert
problèmes de, 517, 535
th. d'irréductiblité, 96
th. de la base, 60
th. des zéros, 109
holomorphie
fonction définie par une intégrale, 373, 374,
406, 414, 544, 608, 610, 616, 618
produit de fonctions holomorphes, 372, 404,
407, 409, 433, 545, 559, 566, 619 621
ÉNONCÉS MATHÉMATIQUES
651
série de fonctions holomorphes, 371,373,401,
403, 564, 565, 568, 599, 600, 609, 617,
618, 620
image ouverte, 281, 294
infini (axiome de 1'), 191
inversion locale pour les fonctions holomorphes,
375 377
Jordan (théorème de), 387
Kakeya (problème de), 300
Kronecker-Weber (théorème de), 527, 528, 534,
535, 549
Lagrange
l'ordre d'un sous-groupe divise celui du groupe,
41,46
théorème des 4 carrés, 426, 427, 515
Landau (théorème de), 400, 418, 444
Langlands (programme de), 401, 523, 524, 529,
531, 549, 552 554
limite centrale, 596
Lindelôf (hypothèse de), 447
Liouville (théorème de), 370, 567, 599
logarithme itéré (loi du), 446
médiane (identité de la), 173
Mahler (théorème de), 200, 479
Maschke (théorème de), 244
Mertens (conjecture de), 446
Minkowski
inégalité, 315
lemme, 457, 458, 498
moonshine, 234
Mordell (conjecture de), 518
Mordell-Weil (théorème de), 510, 629
Morera (théorème de), 386
moyenne (propriété de la), 102, 369
Nesterenko (critère de), 498, 504
nombres congruents (problème des), 507
nombres premiers, 429 431, 435, 443, 445, 504
Ostrowski (théorème d'), 536
Peano (axiomes de), 190
Picard (théorème de), 394
point fixe, 152, 153
principe du maximum, 102, 355, 364, 370, 439,
440, 566, 567, 620, 621, 624
progression arithmétique, 250,418,429,431,434,
445
projection sur un convexe fermé, 287
Pythagore (théorème de), 173
Ramanujan (conjecture de), 422
Ramanujan-Petersson (conjecture de), 423
réciprocité quadratique (loi de), 31, 397, 512,
523, 528
représentation conforme, 380
restes chinois, 31, 40, 124, 126, 128, 205, 207,
524, 538, 548
Riemann (hypothèse de), 30, 415, 422, 445 447,
490, 527
Riemann-Lebesgue (théorème de), 335, 564, 587
Riesz (théorème de), 171, 283, 288, 315
Rouché (théorème de), 397
Sato-Tate (conjecture de), 423
Schur (lemme de), 82, 244, 245
Schwarz (lemme de), 364
Serre (conjecture de), 515, 531
simplicité de An, 46
Stone-Weierstrass (théorème de), 273, 284
structure des groupes abéliens finis, 40, 252
structure des modules de torsion sur un anneau
principal, 110, 119
Sylow (théorème de), 47
Taniyama-Weil (conjecture de), 524
théorème fondamental
de l'algèbre, 193, 362, 364, 370, 396
de l'analyse, 184, 309, 380
de l'arithmétique, 12, 536
de la théorie de la mesure, 139, 307
de l'algèbre, 97
de l'algèbre linéaire, 76
les transvections engendrent SLn, 459
valeurs intermédiaires, 149
Wedderburn (théorème de), 41
Weil (conjectures de), 423, 524
zéros isolés, 362, 363, 393, 404, 414, 564, 565,
603, 616, 620, 621
652
INDEX
Index des noms propres
Allègre C, 28
Amice Y., 486
Apéry R., 300, 497, 622
Artin E., 264, 525, 529, 531, 535, see conjecture,
théorème, fonction L
Bézout E., 12
Bachet de Méziriac C.-G., 12, 427
Baire R., 1, 281, see énoncés mathémathiques
Baker A., 518
Banach S., 1, 183, 269, 281, 283, 302, see espace,
énoncés mathémathiques
Barnet-Lamb T., 423
Barsky D., 481
Beilinson A., 2, 554
Bernoulli J., 360
Besicovitch A., 300
Bhargava M., 513
Bhaskaracarya, 322
Birch B., 511
Bloch S., 2
Bombieri F., 447
Borcherds R., 234
Borel E., 139, 140, 300, 440, 626
Bourgain J., 432
Brauer R., 265, 529
Breuil C, 512, 524
Bugeaud Y., 519
Burnside W., 1
Cantor G., 9, 15, 192, 193
Carleson L., 292, 480
Carlson F., 363
Cauchy A., 1, 34, 46, 80, 82, 143, 281, 297, 331,
363, 427, 533, see critère, formule,
formule des résidus, inégalité, intégrale
Cayley A., 16
Chen J.R., 431
Chevalley C, 233, 535
Clozel L., 423
Coates J., 513
Conrad B., 512, 524
Deligne P., 2, 423, 524
Diamond F., 512, 524
Dirichlet G., 2, 143, 250, 399, 418, 431, see
caractère, fonction L, série
Drinfeld V., 516, 553, 554
Dwork B., 524
Elkies N., 513, 517
Erdôs P., 430, 432
Euler L., 2, 31, 357, 360, 363, 372, 410, 411,
429, 512, 517, 612, see constante d'Eu-
ler, facteur d'Euler, fonction T
Faltings G., 518, 522
de Fermât P., 42, 53, 234, 411, 424, 427, 431, 508,
524
Ferréol R., 135
Fibonacci L., 508
Fields (médaille), 234, 286, 301, 315, 423, 430,
432, 518, 522, 524, 553, 554
Fischer E., 269
Fischler S., 498
Fontaine J.-M., 9, 199
Fourier J., 331
Fréchet M., 1, 129
Friedlander J., 432
Frobenius F., 1, 82, 246, 262
Furtwângler P., 535
Galois E., 16
Gauss C.-F., 10, 31, 398, 512
Geraghty D., 423
Godement R., 3, 550
Goldfeld D., 512
Goldston D., 431
Goreski M., 554
Gowers T., 286, 432
Grassmann H., 16, 69
Green B., 432
Griess R., 234
Gross B., 513
Grothendieck A., 109, 135, 423, 524, 526, 553
Dedekind R., 15, 190, 192, 193, 534
Hadamard J., 2, 430
INDEX DES NOMS PROPRES
653
Hahn H., 1, 269, 283
Hamilton W., 21
Harris M., 423, 553
Hasse H., 511, 512, 535, see énoncés mathéma-
thiques, fonction zêta
HausdorffF., 129,401,447
Hecke E., 531, 534, 546, see caractère, fonction
L
Henniart G., 553
Hensel K., 193, 536
Hermite C, 301
Hilbert D., 1, 60, 96, 109, 269, 517, 535, see
espace, énoncés mathémathiques
Iwaniec H., 432, 447
Jacobi C, 427, 612, see fonction 0, formule
Jacquet H., 550
Jordan C, 110, 112, 267, 387, see bloc, forme,
énoncés mathémathiques
Kato K., 2
Katz N., 300
Khare C, 531
Kisin M., 531
Kolmogorov A., 292
Kolyvagin V., 513
Kottwitz R., 554
Kronecker L., 4, 40, 527, 535
Kummer E., 411, 533
Lafforgue L., 553
Lagrange J., 41, 355, 427, 515
Langlands R., 516, 529, 531, 533, 550, 551, 554
Laumon G., 554
Lebesgue H., 1, 140, 323, see intégrale, énoncés
mathémathiques
Leibnitz G., 164, 360
Lindemann F., 93, 301, 497
Lindenstrauss J., 288
Liouville J., 301, 370
Maass H., 532
MacPherson R., 554
Madhava, 164
Mahler K., 200, 479
Manin Y., 516
Matiyasevich Y., 518
Mazur B., 490
McKay J., 234
Mertens F., 446
Mignotte M., 519
Minkowski H., 458
Moebius A., 135, 422, see bande, fonction,
inversion
Monasse D., 5
Mordell L., 422, 510, 522
de Morgan A., 9
Nesterenko Y., 497, 622
Ngô B.C., 554
Odlysko A., 446
Oresme N., 156
Ostrowski A., 536
Peano G., 16, 186, 190
Picard E., 394
Plancherel M., 1, 351
Poincaré H., 1, 132, 368, 510
Poisson S., 331
Pôlya G., 363
Ramanujan S., 422
Ribet K., 515, 524
te Riele H., 446
Riemann B., 2,297,411,415,430, see conjecture,
fonction zêta, intégrale, énoncés
mathémathiques, sphère, surface
Riesz F., 1, 171, 269, 283, 288, 312, 315
Rivoal T., 300, 497
Roth K., 301, 432
Roubaud J., 535
Rutherford E., 234
Sato M., 423
Schur L, 1, 244, 470
Schwartz L., 315
Selberg A., 430
Serre J-P., 3, 4, 135, 515, 531
Shafarevich L, 513, 526
Shankar A., 513
Shelstad D., 554
Sheperd-Barron N., 423
Shimura G., 512, 515
Siegel C., 449, 518
654
INDEX
Siksek S., 519
Solovay R., 302
Steinhaus H., 1, 269
Steinitz E., 99
Stoll M., 519
Swinnerton-Dyer H., 511
Sylow L., 47
Takagi T., 535
Taniyama Y., 515, 524
Tao T., 300, 432
Tarski A., 302
Tate J., 199, 423, 513, 535, 550
Taylor R., 423, 512, 524, 553
Tchebychev P., 13
Tengely S., 519
Tunnell J., 508, 514, 531, 533
Tychonov A., 142
Tfeafriri L., 288
de la Vallée Poussin C, 2, 430, 431
Waldspurger J.-L., 516, 554
Wantzel P.-L., 93
Weber H., 535
Weierstrass K., 1, 183, 190, 368
Weil A., 4,135, 449,512, 515, 524, 535, see
énoncés mathémathiques, fonction zêta
Wiles A., 234, 424, 490, 512, 513, 524, 531, 574
Wintenberger J-P., 531
Yildirim C, 431
Zagier D., 98, 508, 513
Ziegler T., 432
Zudilin W., 300, 498
REPÈRES CHRONOLOGIQUES
655
Repères chronologiques
av. J.C.
th. de Pythagore, 173
définition de 7r, 162
duplication du cube (problème), 93
infinité de nombres premiers, 13
irrationalité de \/2, 13
quadrature du cercle (problème), 93
trissection de l'angle (problème), 93
1150, volume de la sphère, 322
1360, £ £ = +oo, 156
1624, énoncé du th. des 4 carrés, 427
1624, th. de Bézout, 12
1638, sommes de polygonaux (énoncé), 427
1640, petit th. de Fermât, 42
1640, tout nombre premier de la forme 4n+1 est
somme de deux carrés, 432
1644, problème de Bâle, 2
1682,l-i + i-i + ... = f,164
1712, dispute sur log-1, 360
1730, formule de Stirling, 333
1734, C(2) = £, 2
1737, £p6^± =+oo, 410
1737, factorisation de C en facteurs d'Euler, 410
1749, équation fonctionnelle de C (conj.), 411
1749, multivaluation du logarithme, 360
1750, formules de Cramer, 101
1770, dém. du th. des 4 carrés, 427
1783, loi de réciprocité quadratique (énoncé), 31
1799, C est algébriquement clos, 370
1801, loi de réciprocité quadratique (dém.), 31
1811, transformée de Fourier, 331
1815, det AB = (det A) (detB), 80
1815, formule d'inversion de Fourier, 331
1815, sommes de polygonaux (dém.), 427
1816, formule de Poisson, 345
1821, parution du cours de Cauchy à l'École
Polytechnique, 363
1823, intégrale de Cauchy, 297
1825, formule intégrale de Cauchy, 368
1829, forme effective du th. des 4 carrés, 427
1837, impossibilité de la duplication du cube et
de la trissection de l'angle, 93
1837, progression arithmétique (th.), 2, 418, 431
1843, quaternions, 21
1844, transcendance des nombres de Liouville,
301
1844, une fonction bornée, holomorphe sur C, est
constante, 370
1847, définition de C comme R[X]/(X2 + 1), 34
1851, représentation conforme (énoncé), 380
1852, th. de Fermât pour les nombres premiers
réguliers, 411
1853, th. de Kronecker-Weber (énoncé), 527
1854, continuité uniforme des fonctions continues
sur un segment, 143
1854, définition d'un groupe, 16
1854, intégrale de Riemann, 297
1858, équation fonctionnelle de C (dém.), 411
1858, hypothèse de Riemann, 2, 415
1858, th. de Cayley-Hamilton, 111
1862, dim(E + F) = dimE + dimF-dim(EnF),
69
1867, structure des groupes abéliens finis, 40
1870, début de la théorie des ensembles, 9
1872, coupures de Dedekind et R comme
complété de Q, 192
1872, théorèmes de Sylow, 47
1873, non dénombrabilité de R, 15
1873, transcendance de e, 301
1875, fonctions continues dérivables nulle part,
183, 368
1877, R et R2 ont le même cardinal, 15
1882, quadrature du cercle (impossibilité), 93
1882, transcendance de 7r, 301, 497
1885, densité des polynômes dans ^([0,1]), 274
1886, dém. du th. de Kronecker-Weber, 527
1888, présentation axiomatique des entiers, 190
1889, axiomes de Peano, 190
1890, A[X] noethérien, 60
1892, th. d'irréductibilité de Hilbert, 96
1893, zéros de Hilbert, 109
1894, compacité, 139
1894, rationalité de £an2n, 626
1896, th. des nombres premiers, 2, 430
1897, nombres p-adiques, 193
1897, orthonormalité des caractères, 246
656
INDEX
1899, décomposition d'une représentation en somme
d'irréductibles, 244
1900, conj. de Poincaré : r(E) < +oo, 510
1900, problèmes de Hilbert, 517, 535
1902, intégrale de Lebesgue, 297
1904, limites simples de fonctions continues, 281
1905, lemme de Schur, 244
1906, début de la topologie générale, 129
1906, définition des espaces métriques, 129
1906, naissance de l2, 269
1907, complétude de L2, 312
1907, isomorphisme entre L2 et ê2, 269
1910, clôture algébrique d'un corps, 99
1910, espaces Lp, 315
1910, transformée de Fourier dans L2, 351
1914, représentation conforme (dém.), 380
1916, conj. de Ramanujan-Petersson, 423
1917, multiplicativité de r, 422
1918, la boule unité n'est compacte qu'en
dimension finie, 171
1918, normes sur Q, 536
1919, ensembles de Besicovitch, problème de Ka-
keya, 300
1921, rationalité de £>„2n, 363
1922, r(E) < +oo (dém.), 510
1922, conj. de Mordell (énoncé), 522
1923, conj. d'Artin, 529
1924, loi du logarithme itéré, 446
1924, paradoxe de Banach-Tarski, 302
1926, fonctions L1 dont la série de Fourier diverge
en tout point, 292
1927, th. de Banach-Steinhaus, 280
1927, th. de Hahn-Banach, 283
1929, points entiers sur les courbes, 518
1929, th. de l'image ouverte, 281
1933, nombre de points d'une courbe elliptique
sur Fp, 511
1935, conj. de Hasse-Weil, 512
1935, un produit de compacts est compact, 142
1944, début de la théorie des distributions, 315
1945, Vol(SLn(R)/SLn(Z)) = C(2) • • • <(n), 449
1945, distributions : transformée de Fourier, 347
1948, dém. élémentaire du th. des nombres
premiers, 430
1948, th. de Stone-Weierstrass, 273
1949, conj. de Weil, 423, 524
1952, primalité de 2521 - 1 et 22281 - 1, 31
1954, groupes de Chevalley, 233
1955, a G Q =» {p/q, \a-p/q\ ^ g"2"*} fini,
301
1955, début des schémas, 109
1956, GAGA, 135
1956, conj. de Taniyama-Weil, 515, 524
1958, début de la révolution grothendieckienne,
135, 423
1958, fonctions continues sur Zp, 200, 479
1959, rationnalité de la fonction zêta, 524
1960, conj. de Birch et Swinnerton-Dyer, 3
1960, conj. de Sato-Tate, 423
1962, conj. de Bateman-Horn, 431
1964, fonction £ p-adique, 489
1964, fonctions loc. analytiques sur Zp, 486
1965, convergence p.p. de la série de Fourier d'une
fonction continue, 292
1966, mesurabilité de tout ensemble, 302
1966, pas de 2iir dans Cp, 199
1967, programme de Langlands, 529
1969, équations diophantiennes en 2 variables,
518
1970, solution (négative) du 10-ième problème de
Hilbert, 518
1971, une caractérisation de t2, 288
1973, conj. de Ramanujan-Petersson (dém.), 423
1973, fonctions <£k sur Zp, 481
1973, hypothèse de Riemann pour les variétés sur
les corps finis, 423
1973, prédiction de l'existence du monstre, 234
1975, infinité de presque premiers jumeaux, 431
1977, apparition du moonshine, 234
1977, conj. de Deligne, 2
1977, système RSA, 12
1977, th. de Coates-Wiles, 513
1978, infinité de n2 + 1 presque premiers, 432
1979, irrationalité de C(3), 300, 622
1979, th. de Waldspurger, 516
1981, contrexemple d'Enfio, 269
1982, construction du monstre, 234
1982, nombres complexes p-adiques, 9, 199
1983, caractérisation des nombres congruents, 508
1983, conj. de Mordell (dém.), 518, 522
1983, th. de Gross-Zagier, 513
1984, conj. de Serre, 515
REPÈRES CHRONOLOGIQUES
1984, zéros de la fonction Ç p-adique, 490
1985, conj. de Beilinson, 2
1985, conjecture abc, 55
1985, réfutation de la conj. de Mertens, 446
1987, lemme fondamental (énoncé), 554
1988, dém. de la conj. e de Serre, 515
1989, conj. de Bloch-Kato, 2
1989, th. de Kolyvagin, 513
1992, explication du moonshine, 234
1994, dém. du th. de Fermât, 234, 512, 524
1996, une caractérisation de £2, 286
1998, infinité de n2 + m4 premiers, 432
1999, conj. de Taniyama-Weil (dém.), 512, 524
1999, correspondance de Langlands locale, 553
1999, correspondance de Langlands pour les corps
de fonctions, 553
2000, irrationalité d'une infinité deC(2n+l), 300
2004, progressions arithmétiques de nombres
premiers, 432
2005, petits écarts entre nombres premiers, 431
2006, r(E) peut être ^ 28, 513
2006, progressions polynomiales de nombres
premiers, 432
2008, dém. de la conj. de Serre, 531
2008, lemme fondamental (dém.), 554
2008, primalité de 243112609 - 1, 429
2008, solutions de Y2 - Y = X5 - X, 519
2009, B^1 est principal, 51
2009, conj. de Sato-Tate (dém.), 423
2010, équations linéaires en nombres premiers,
432
2011, r(E) ^ 0,98 en moyenne, 513
Dans la même collection
Biologie
Bioinformatique. Génomique et post-génomique - F. Dardel et F. Képès - 250 pages - ISBN 2-7302-0927-1
Chimie
Chimie moléculaire des éléments de transition - F. Mathey et A. Sevin - 300 pages - ISBN 2-7302-0714-7
Les orbitales moléculaires dans les complexes - avec Exercices et Corrigés - Y. Jean
350 pages - ISBN 2-7302-1024-5
Chimie moléculaire, sol-gel et nanomatériaux - R. Corriu et Nguyen T.-A.
208 pages - ISBN 978-2-7302-1413-1
Introduction à la chimie quantique - P. Hiberty et Nguyen T.-A. - 320 pages - ISBN 978-2-7302-1485-8
Informatique
Introduction à la théorie des langages de programmation - G. Dowek, J.-J. Lévy
112 pages - ISBN 978-2-7302-1333-2
Les principes des langages de programmation - G. Dowek - 176 pages - ISBN 978-2-7302-1526-8
Les démonstrations et les algorithmes : introduction à la logique et la calculabilité - G. Dowek - 200 pages -
ISBN 978-2-7302-1569-5
Économie
Introduction à la microéconomie - N. Curien
110 pages - ISBN 2-7302-0722-8 - ISBN 978-2-7302-0722-5
Introduction à l'analyse macroéconomique - P.-A. Muet - 208 pages - ISBN 2-7302-1140-3
Économie de l'entreprise - J.-P. Ponssard, D. Scvy, H. Tanguy (2e édition)
316 pages - ISBN 978-2-7302-1244-1
Corporate Social Responsibility? From Compliance to Opportunity - P. Crifo, J.-P. Ponssard - 298 pages -
ISBN 978-2-7302-1568-8
Économie du climat. Pistes pour l'après-Kyoto - J.-P. Ponssard et O. Godard - 314 pages
ISBN 978-2-7302-1576-3
Mathématiques
Transversalité, Courants et Théorie de Morse. Un cours de topologie différentielle (exercices proposés par
François Labourie) - F. Laudenbach - 200 pages - ISBN 978-2-7302-1585-5
Groupes et représentations - D. Renard - 223 pages - ISBN 978-2-7302-1571-8
Milieux continus en transformations finies. Hyperélasticité, Rupture, Êlastoplasticité - C. Stolz - 278 pages -
ISBN 978-2-7302-1562-6
Éléments d'analyse et d'algèbre (et de théorie des nombres) - P. Colmez -488 pages-ISBN 978-2-7302-1563-3
Cours d'analyse - J.-M. Bony - 272 pages - ISBN 2-7302-0775-1
Calcul différentiel et intégral- F. Laudenbach - 220 pages - ISBN 2-7302-0724-4
Méthodes mathématiques pour les sciences physiques - J.-M. Bony - 217 pages - ISBN 2-7302-0723-6
Les théorèmes de Noether - Y. Kosmann-Schwarzbach, avec la collaboration de L. Meersseman
180 pages - ISBN 2-7302-1138-1 (2e édition)
Groupes et symétries. Groupes finis, groupes et algèbres de Lie, représentations - Y. Kosmann-Schwarzbach
222 pages - ISBN 978-2-7302-1257-1 (2e édition)
Algèbre corporelle - A. Chambert-Loir - 200 pages - ISBN 2-7302-1217-5
Calcul variationnel - J.-P. Bourguignon - 348 pages - ISBN 978-2-7302-1415-5
Aspects des systèmes dynamiques - XUPS 1994-1996 - N. Berline et C. Sabbah (Comité éditorial)
238 pages - ISBN 978-2-7302-1560-2
Aspects de la théorie du contrôle - XUPS 1999 - N. Berline et C. Sabbah (Comité éditorial)
208 pages - ISBN 978-2-7302-1530-5
Groupes finis - XUPS 2000 - N. Berline et C. Sabbah (Comité éditorial)
104 pages - ISBN 2-7302-0751-5
Pavages - XUPS 2001 - N. Berline et C. Sabbah (Comité éditorial) - 112 pages - ISBN 2-7302-0855-0
La fonction zêta - XUPS 2002 - N. Berline et C. Sabbah (Comité éditorial)
206 pages - ISBN 2-7302-1011-3
Distributions - XUPS 2003 - Dans le sillage de Laurent Schwartz - N. Berline et C. Sabbah
(Comité éditorial) - 106 pages - ISBN 2-7302-1095-4
Graphes- XUPS 2004 - N. Berline et C. Sabbah (Comité éditorial) - 84 pages - ISBN 2-7302-1182-9
Théorie algorithmique des nombres et équations diophantiennes - XUPS2005 - N. Berline, A. Plagne
et C. Sabbah (Comité éditorial) - 200 pages - ISBN 2-7302-1293-0
Théorie des jeux. Introduction à la théorie des jeux répétés - XUPS 2006 - N. Berline, A. Plagne
et C. Sabbah (Comité éditorial) - 152 pages - ISBN 978-2-7302-1366-0
Sur la dynamique des groupes de matrices et applications arithmétiques - XUPS2007 -
N. Berline, A Plagne et C. Sabbah (Comité éditorial) - 160 pages - ISBN 978-2-7302-1418-6
Géométrie tropicale - XUPS2008 - P. Harinck, A. Plagne et C. Sabbah (Comité éditorial)
128 pages - ISBN 978-2-7302-1529-9
Les représentations linéaires et le grand théorème de Fermât - XUPS2009 - P. Harinck, A. Plagne et
C. Sabbah (Comité éditorial) - 140 pages - ISBN 978-2-7302-1566-4
Facettes mathématiques de la mécanique des fluides - XUPS2010 - P. Harinck, A. Plagne et
C. Sabbah (Comité éditorial) - 118 pages - ISBN 978-2-7302-1578-7
Séminaires, équations aux dérivées partielles - Années 1971 à 1992
Séminaires, équations aux dérivées partielles - Années 1993 à 2001
Séminaires, équations aux dérivées partielles - Année 2000-2001 - 400 pages - ISBN 2-7302-0834-8
Séminaires, équations aux dérivées partielles - Année 2001-2002 - 364 pages - ISBN 2-7302-0930-1
Séminaires, équations aux dérivées partielles - Année 2002-2003 - 390 pages - ISBN 2-7302-1041-5
Séminaires, équations aux dérivées partielles - Année 2003-2004 - 404 pages - ISBN 2-7302-1183-7
Séminaires, équations aux dérivées partielles - Année 2004-2005 - 404 pages - ISBN 2-7302-1221-3
Séminaires, équations aux dérivées partielles - Année 2005-2006 - 366 pages - ISBN 2-7302-1335-X
Séminaires, équations aux dérivées partielles - Année 2006-2007 - 444 pages - ISBN 978-2-7302-1414-8
Séminaires, équations aux dérivées partielles - Année 2008-2009 - 308 pages - ISBN 978-2-7302-1567-1
Mathématiques appliquées
Une exploration des signaux en ondelettes - S. Mallat - 654 pages - ISBN 2-7302-0733-3
Promenade aléatoire - M. Benaïm et N. El Karoui - 316 pages - ISBN 2-7302-1168-3
Analyse numérique et optimisation - G. Allaire - 480 pages - ISBN 2-7302-1255-8
Systèmes hyperboliques de lois de conservation. Application à la dynamique des gaz - F. Dubois, B. Després
208 pages - ISBN 2-7302-1253-1
Commande et optimisation de systèmes dynamiques - F. Bonnans et P. Rouchon
286 pages - ISBN 2-7302-1251-5
Les outils stochastiques des marchés financiers. Une visite guidée de Einstein à Black-Scholes - N. El Karoui et
E. Gobet - 238 pages - ISBN 978-2-7302-1579-4
Simulation stochastique et méthodes de Monte-Carlo - C. Graham et D. Talay - 210 pages - ISBN 978-2-
7302-1582-4
Aléatoire. Introduction à la théorie et au calcul des probabilités - S. Méléard - 280 pages - ISBN 978-2-
7302-1575-6
Mécanique
Dynamique de l'atmosphère et de l'océan - P. Bougeault et R. Sadourny - 312 pages - ISBN 2-7302-0825-9
Introduction aux écoulements compressibles et aux fluides hétérogènes - A. Sellier
175 pages - ISBN 2-7302-0764-5
Mécanique des milieux continus - J. Salençon
Tome 1 - Concepts généraux - 376 pages - ISBN 978-2-7302-1245-8 (avec CD-Rom)
Tome 2 - Thermoélasticité - 344 pages - ISBN 978-2-7302-1419-3 (avec CD-Rom)
Tome 3 - Milieux curvilignes - 154 pages - ISBN 2-7302-0962-X
de l'Élasto-plasticitéau Calcula la rupture - J. Salençon
(accompagné d'un CD-Rom réalisé par J. Salençon) - 266 pages - ISBN 978-2-7302-0915-1
Viscoélasticitépour le calcul des structures - J. Salençon - 160 pages - ISBN 978-2-7302-1557-2
Fluides et Solides - E. de Langre - 130 pages - ISBN 978-2-7302-0833-8
Ondes acoustiques - A. Chaigne - 224 pages - ISBN 2-7302-0840-2
Stabilité des matériaux et des structures - C. Stolz - 206 pages - ISBN 2-7302-1076-8
Instabilités, Chaos et Turbulence - P. Manneville - 360 pages - ISBN 2-7302-0913-1
Vibrations des structures couplées avec le vent - P. Hémon - 144 pages - ISBN 2-7302-1332-5
Analyse des solides déformables par la méthode des éléments finis - M. Bonnet et A. Frangi
316 pages - 2-7302-1349-X
Dynamique et vibrations - E. de Langre et A. Chaigne - 152 pages - ISBN 978-2-7302-1521-3
Modélisation et calcul des milieux continus - P. Le Tallec - 560 pages - ISBN 978-2-7302-1494-0
Poutres et arcs élastiques. P. Ballard et A. Millard - 312 pages - ISBN 978-2-7302-1561-9
Hydrodynamique de l'environnement. O. Thual - 328 pages - ISBN 978-2-7302-1564-0
Microhydrodynamique et fluides complexes. D. Barthès-Biesei - 292 pages - ISBN 978-2-7302-1572-5
Physique
Physique des Tokamaks - Jean-Marcel Rax - 436 pages - ISBN 978-2-7302-1580-0
Semi-conducteurs : les bases de la théorie k.p - G. Fishman - 742 pages - ISBN 978-2-7302-1497-1
Énergie nucléaire - J.-L. Basdevant, J. Rich et M. Spiro - 340 pages - ISBN 2-7302-0901-8
Mécanique quantique - J.-L. Basdevant et J. Dalibard
(accompagné d'un CD-Rom de M. Joffre) 520 pages - ISBN 978-2-7302-0914-4
Problèmes quantiques - J.-L. Basdevant et J. Dalibard - 214 pages - ISBN 2-7302-1117-9
Principes de la cosmologie - J. Rich, adaptation française J.-L. Basdevant - 400 pages - ISBN 2-7302-0925-5
Introduction à la relativité - A. Rougé - 188 pages - ISBN 978-2-7302-0940-3
Relativité restreinte. La contribution d'Henri Poincaré - A. Rougé - 288 pages - ISBN 978-2-7302-1525-1
Introduction à la physique subatomique - A. Rougé - 448 pages - ISBN 2-7302-1231-0
Physique statistique et illustrations en physique du solide. - C. Hermann - 292 pages - ISBN 978-2-7302-1022-5
Bases physiques de la plasticité des solides - J.-C. Tolédano - 264 pages - ISBN 978-2-7302-1378-3
Physique des électrons dans les solides. Structure de bandes, Supraconductivité et Magnétisme. H. Alloul -
Tome 1 - 360 pages - ISBN 978-2-7302-1411-7
Physique des électrons dans les solides. Recueil d'exercices et de problèmes. H. Alloul
Tome 2 - 272 pages - ISBN 978-2-7302-1412-4
www.editions.polytechnique.fr
Achevé d'imprimer en septembre 2011. Dépôt légal : 3e trimestre 2011
ISBN 978 - 2 - 7302 - 1587 - 9. Imprimé en France
Mathématiques
f. ' '* Pierre
; Colmez
Pierre Colmez est directeur de recherches au CNRS ; il a enseigné à T'École Normale Supérieure
de 1990 à 1992, et à l'École Polytechnique de 1993 à 2010. C'est un arithméticien dont la
majorité des travaux concerne le monde p-adique.
Cet ouvrage est issu d'un cours en première année à l'École Polytechnique. Son format un peu
particulier en fait un bon compagnon pour la préparation des concours du taupin ambitieux
et de l'agrégatif, ou pour l'étudiant de L3 ou quiconque ayant atteint ce niveau et cherchant à
saisir le fonctionnement interne des mathématiques.
- Le long chapitre « Vocabulaire Mathématique », dont le but était d'offrir aux élèves des
autres filières le résumé d'un cours des meilleures classes de MP*, regroupe et précise, sous une
forme compacte, l'essentiel des notions de base vues en L1 et L2 ou pendant les classes
préparatoires (groupes, anneaux, corps, algèbre linéaire, matrices, topologie, compacité, connexité,
complétude, séries numériques, convergence de fonctions, espaces hermitiens...). Il comporte
plus d'une centaine d'exercices corrigés.
- Le cours qui suit offre une introduction à trois des théories à la racine des mathématiques : la
théorie des représentations des groupes finis, qui est à la fois une extension naturelle de
l'algèbre linéaire et une première approche de la transformée de Fourier, l'analyse fonctionnelle
classique (espaces de Banach et Hilbert, intégrale de Lebesgue, transformée de Fourier) et la
théorie des fonctions holomorphes. Il recouvre une bonne partie du cursus de L3 à l'Université.
- Les 13 problèmes corrigés combinent les théorèmes du cours pour démontrer de jolis résultats
comme l'irrationalité de Ç (3).
La principale originalité de l'ouvrage vient de l'accent mis sur l'aspect culturel et l'unité des ma-
.. thématiques. De nombreuses notes de bas de page proposent de petites excursions en dehors
de l'autoroute des mathématiques utiles. Sept appendices présentent des extraits de la
littérature mathématique classique, accessibles avec le contenu du cours, qui montrent comment les
théories de base se combinent pour la résolution de problèmes naturels profonds. L'un d'entre
eux est consacré au théorème des nombres premiers dont la démonstration a pris plus de 150
ans ; un autre est une introduction au programme de Langlands, qui occupe les arithméticiens
depuis plus de 40 ans, et dont une des retombées les plus spectaculaires est la démonstration
du théorème de Fermât. Entre les deux le lecteur pourra découvrir quelques aspects du monde
p-adique ou une formule indiquant des liens encore mystérieux entre les mondes réels et p-adiques,
ou encore un problème millénaire non encore résolu.
Illustration de couverture :
Messieurs Cauchy, Poisson, Fourier et Lagrange accompagnés de
*l_ " leurs formules et d'une (petite) partie de leurs descendances.
école ^Hpsèi
POLYTECHNIQUE X-—-""
ParisTech Diffusion "
ISBN 978-2-7302-1587-9
MPI
9M782730N215879M