/
Text
L. PONTRIAGUINE, V. BOL TIANSKI,
R. GAMKRÉLIDZÉ, E. MICHTCHENI(ü
Théorie
mathématique
des processus
optimaux
EDITIONS MIR . MOSCOU
Traduit du russe
par D jilali Embarek
Ha çppaHlfyacnoM JlablJe
@ Traduction française Editions j\1ir 1974
Introduction
Les processus physiques qui trouvent leurs applications en techni-
que sont en règle générale c 0 m man dés, i. e. peuvent être
réalisés de multiples façons au gré de l'homme. Dès lors il s'agira
donc de chercher la meilleure commande selon tel ou tel critère,
en d'autres termes la commande optimale du processus. Ce peut être
par exemple une commande en temps optimal, i.e. réaliser l'objectif
du processus dans le temps le plus court, ou avec la moindre dépense
d'énergie, etc. Mathématiquement formulés, les problèmes mention-
nés relèvent du cal cul des var i a t ion s à qui d'ailleurs
ils ont donné naissance. Les méthodes variationnelles traditionnelles
s'avèrent néanmoins inaptes à résoudre d'innombrables problèmes
importants pour les techniques actuelles. Les auteurs de cet ouvrage
apportent à nombre de ces problèmes variationnels d'un type non
classique des solutions qu'ils ont groupées sous un procédé mathé-
matique commun appelé p r i n c i p e d u m a x i m u m. Il
importe de souligner que toutes les conditions nécessaires et fonda-
mentales du calcul variationnel classique à dérivées ordinaires
découlent du principe du maximum (voir chapitre 5).
Nous allons examiner ici des processus commandés sUEceptibles
chacun d'être régis par un système d'équations différentielles
dx i f i ( ln 1 r )
---a;:-= X, e.., X, U, ..., U ,
i===1,2, .., n;
(1)
où Xl, . . ., x n sont des grandeurs caractérisant le processus,. i.e.
les coordonnées de phase déterminant l'état de l'objet commandé à
chaque instant t; u l , ..., ur - les paramètres de commande
déterminant la marche du processus et t - le temps. Pour que la
marche du processus commandé soit définie sur un certain intervalle
de temps t o t t i il suffit que sur ce même intervalle soient don
nés (en fonction du temps) les paramètres de commande Ul, ., ur:
u j = u j (t), j = 1, . . ., r.
(2)
6
INTRODUCTION
Alors pour des conditions initiales données
xi (t o ) == x, i 1, ..., n,
(3)
la solution du système (1) est univoque. Le problème variationnel,
lié au processus commandé (1), que nous avons à résoudre est le sui-
vant. Soit la fonctionnelle intégrale
ft
J = J 1° (xl,
to
n
..., X ,
u l , ..., ur) dt
(4)
où f'J (Xl, . . ., X n , U l , . . ., Ur) est une fonction donnée. Pour cha-
que commande (2) donnée sur un certain intervalle t o t t i
est définie d'une manière uni voque la marche du processus commandé,
et l'intégrale (4) prend une valeur déterminée. Supposons qu'il existe
des commandes (2) transférant l'objet commandé de l'état initial
donné (3) à l'état final imposé
Xi (t i ) == xL i ==: 1, ..., n.
On demande de trouver la commande
ai (t), j = 1, . . ., r (6)
qui transfère l'objet commandé de l'état (3) à l'état (5) de manière
à Ininimiser la fonctionnelle (4). Les instants t o et t i ne sont pas fixés,
on demande seulement qu'à l'instant initial t o l'objet se tro.uve dans
l'état (3) et à l'instant final t i dans l'état (5), et que la fonctionnelle
(4) soit minimale. (Le cas où t o et t i sont fixes est également inté-
ressant à voir; il se ramène sans peine aux problèmes mentionnés
dans cette introduction, voir 9 8.) Dans le cas particulier où la fonc-
t . f o ( 1 X n 111 U 'r ) . d ' t . 1 f t . Il
Ion x , . . ., , w, . . ., qUI e ermine a one lonne e
(4) est identiquement égale à l'unité, la fonctionnelle (4) est égale
à t i - t o et notre problème variationnel se transforme en problème
en temps optimal.
Dans les problèmes techniques où ils définissent, par exemple,
la position des gouvernails d'un engin, les paramètres de commande
u 1 , . . .., ur ne peuvent prendre des valeurs arbitraires: ils sont assu-
jettis à certaines contraintes. De par la construction même du méca-
nIsme décrit par le systèrrte (1) le paramètre u l ne peut, disons, pren-
dre que les valeurs satisfaisant à la condition
(5)
1 u 1 1 1.
(7)
Si, par exemple, les paralnètres Ul, u 2 représentent, dans un plan,
le3 COnp)3an.tes d'une grandeur vectorielle de module non supérieur
à l'un.ité et de sens arbitraire, ils sont alors assujettis à la condition
(U l )2 + (U 2 )2 1. (8)
INTRODUCTION
7
En règle générale, il faut considérer que le point (u l , . . ., ur)
doit appartenir à un ensemble U d'un espace muni des coordonnées
u l , ..., ur, le choix de l'ensemble U reflétant le caractère
de l'objet (1). L'ensemble U (ou « domaine de commande »)
théoriquement est considéré comme étant arbitraire, mais dans les
problèmes techniques un cas particulièrement important et re-
marquable est celui où U est fer m é (cf. inégalités (7), (8)). Cette
condition signifie que le gouvernail peut occuper ses positions extrê-
mes (les valeurs u l = + 1 dans l'inégalité (7) ou les points limites
du cercle (8)), qui peuvent en particulier réaliser la commande opti-
male. C'est précisément cette circonstance qui fait que le problème
variationnel considéré n'est pas classique puisque dans le calcul
variationnel classique les paramètres variables ne peuvent satisfaire
aux expressions (7) et (8).
Le caractère non classique de problème variationnel est le plus
évident dans le problème en temps optimal pour le système (1),
système dont les seconds membres sont des fonctions à coeffici'ents
t 1 . , . 1 n 1 r l '
constan s,ln e aIr e s en x , . . ., x , u , . . ., u et ensem-
ble U est un pol y è d r e con v e x e fer m é, un cube par exem-
pie, défini par les inégalités:
1 u j / 1, j = 1, . . ., r.
Il s'avère dans ce cas que la commande optimale (6) est réalisée
par le point (u l (t), . . ., ur (t)) qui se trouve à tour de rôle dans les
divers sommets du polyèdre U. Les règles qui régissent les sauts du
point commandé d'un sommet à un autre définissent précisément
la loi de commande optimale. Ce problème variationnellinéaire aux
multiples applications techniques se résout par les méthodes généra-
les exposées au chapitre 3. Les méthodes classiques sont totalement
impropres à sa résolution.
De ce qui précède sur les sauts du point commandé d'un sommet
à un autre du polyèdre U, il résulte que la classe des commandes
adnlissibles (2) ne peut être composée de fonctions continues. Nous
supposerons en général qu'elle est composée de fonctions continues par
morceaux. Les coordonnées de phase Xl, . . ., x n sont considérées
comme étant des fonctions du temps continues et dérivables par mor-
ceaux. Sous ces hypothèses, les conditions nécessaires d'optimalité
se formulent par le principe du maximum (voir chapitre 1) qui est
dénlontré dans le chapitre 2.
Si l'objet considéré. est un système mécanique, la partie
Xl, . . ., Xh des coordonnées de phase en décrit l'état géométrique,
tandis que l'autre partie Xk+l, . . ., X2k (2k = n) - la vitesse.
Dans certains problèlnes, le but du processus peut ne pas consister
à faire arriver l'objet en un point déterminé (x, . . ., x7) de l'espace
de p h a s e, mais à faire occuper au système mécanique une position
spa t i ale définie (x, . . ., x) avec des vi tesses arbi traires en
8
INTRODUCTION
fin de processus. Par conséquent ici est posé le problème variationnel
du transfert optimal de l'objet d'un point initial donné x, . . ., x
de l'espace de phase à un point arbitraire d'un plan de dimension k
défini par les équations
1 1 k h
X = Xi' ..., X = Xl .
Nous constatons que le problème optimal formulé au début évite tou-
te une série d'importantes questions. Aussi le 9 6 du chapitre 1 traite-
t-il du transfert optimal de l'objet d'une variété initiale quelconque
M 0 d l'espace de phase à une variété finale quelconque Mt, les di-
mensions des variétés Mo et Mi étant arbitraires (si, en particulier,
elles sont toutes deux nulles on est ramené au problème initial).
Il est clair que les paramètres de commande de l'objet de même
d'ailleurs que ses coordonnées de phase, de par la nature même du
problème posé, sont assujettis à certaines conditions. Si, par exemple,
on étudie le vol d'un avion dont Xl représente l'altitude au-dessus du
sol, alors doit être vérifiée l'inégalité Xl h > 0 où h désigne l'al-
titude minimale admissible de vol. L'inégalité Xl h ne découle ni
des propriétés du système d'équations (1), ni des inégalités auxquelles
sont soumis les paramètres de commande, elle est entièrement indé-
pendante. Le chapitre 6 traite" de la commande optimale d'un objet
dont le point représentatif de l'espace de phase est astreint à rester
constamment dans un domaine fermé G de cet espace de phase. On
suppose en outre que la frontière du domaine G est dérivable par mor-
ceaux. Sous ces conditions, ùne partie d'u mouvement de l'objet
se réalise à l'intérieur du domaine G conformément au principe ordi-
naire du maximum, l'autre partie sur la frontière du domaine G,
conformément au principe complexe du maximum. Le passage des
morceaux de trajectoires contenus à l'intérieur de G aux morceaux
de trajectoires portés par la frontière de G est régi par des règles origi-
,nales rappelant, et généralisant dans un certain sens, les lois de dif-
fraction de la lumière.
Jusqu'ici il n'a été question que de la commande optimale
transférant un objet dans un point donné ou dans une sous-variété
donnée de l'espace de phase. Le problème de commande optimale
peut néanmoins se transformer en un problème d' optimali té de l' ar-
rivée dans un point m 0 b i 1 e de l'espace de phase. Soit dans
l'espace de phase "un point mobile
Xi = Si (t), i = 1, . . ., n. (9)
On demande de faire coïncider dans un temps optimal l'objet (1)
avec le point mobile (9). Ce problème se ramène facilement au pro-
blème étudié. Il suffit pour cela d'introduire les nouvelles variables
_ Y i = X i - S i (t) , 7 - 1 n
- ,..., .
INTRODUCTION
9
Le système commandé (1) se transforme en un nouveau système,.
qui, cependant, n'est plus autonome; quant au but du processus
commandé, il consiste désormais à faire arriver le nouvel objet
(yI, . . ., yn) dans le point fixe (0, . . ., 0) de l'espace de phase.
Les résultats fondamentaux se transférant aisément aux processu
commandés non a u ton 0 mes (voir 9 7), le problème est résolu.
Nous avons supposé que le mouvement du point poursuivi (9)
était connu sur l'intervalle de temps considéré tout entier. Un
problème nouveau et d'une grande importance pratique se pose lors-
que le mouvement de l'objet poursuivi n'est pas connu d'avance,.
mais sur lequel on reçoit des informations au fur et à mesure que le
temps passe. Pour résoudre de tels problèmes, on doit posséder des-
données sur le comportement de cet objet. Un cas particulièrement
important est celui où l'objet poursuivi est commandé, i.e. son mou-
vement est régi p al" le système d'équations
dz i i ( ln 1 S ) . 1
= g z, ..., z , v, ..., v, == , ..., n.
(10)
Connaissant les perforlnances techniques de l'objet poursuivi, i.e.
le système d'équations (10), et sa position à chaque instant donné,.
il s'agit de déterminer au même instant une commande qui réalise
la poursuite en un temps optimal. Tel qu'il est posé, ce problème
est traité dans la théorie des jeux différentiels, théorie que nous
n'aborderons pas ici. Dans le chapitre 7 est résolu un autre problème
de poursuite. On y suppose qu'à l'instant initial, la position de l'ob-
jet poursuivi est connue, et que son comportement futur est décrit
probabilistiquement, à savoir son mouvement est considéré comme
étant un processus markovien. Sous ces hypothèses on cherche une-
commande, telle que la rencontre d'un petit voisinage de l'objet
(1) avec l'objet poursuivi soit la plus probable.
* * *
Le principe du maximum s'est pleinement justifié et a trouvé.
d'innombrables applications au cours des 7 années écoulées depuis la
première édition russe de cet ouvrage. Aussi convient-il d'ouvrir
dès maintenant une parenthèse sur sa nature, son origine et sa dé-
monstration. Prenons, pour fixer les idées, le problème de commande.
en temps optimal. Car c'est précisément pour ce problèn1e que-
Lev Pontriaguine formula l'hypothèse du principe du maximum.
Pour l'essentiel le problème est le suivant. Toute commande
admissible u l (t), . . ., ur (t), définie sur l'intervalle t o t t 1 t,
et tout vècteur constant 'i' de l'espace de phase sont associés d'une:-
manière déterminée à la fonction
H (t, U 1 , . . ., Ur)
10
INTRODUCTION
de la variable t, t o t t 1 , et des. paramètres de comn1ande admis-
:sibles. Il s'avère que si la commande étudiée est optimale, il existe
alors une valeur du vecteur "p =1= 0 telle que pour chaque valeur fixe
de t, t o t t i , la grandeur H qui est considérée comme une fonc-
tion des valeurs admissibles des paramètres de commande, atteigne
.son maximum pour u j == u j (t), j == 1, . . ., r. On constate donc que
lorsqu' on'utilise le principe du maximum, on ne doit pas comparer seu-
Jement des commandes proches l'une de l'autre. D'où sa distinction
des théorèmes classiques du calcul variationnel, d'où sa force, mais
aussi une certaine complexité de la démonstration.
La première démonstration du principe du maximum appliqué
aux systèmes commandés linéaires a été donnée par R. Gamkrélidzé
-qui a par ailleurs entièrement élaboré la théorie de ces systèmes.
L'idée est la suivante: supposons que ,la commande optimale étudiée
transfère le point Xo en Xi. Si, au lieu de la commande optimale, on
prend une commande admissible quelconque définie sur le précé-
.dent intervalle, cette dernière transférera le point Xo en un point
X (t l ). Compte tenu de la linéarité, l'ensemble de tous les points x (t f )
ainsi obtenus forme un corps convexe P. De l'optimalité de la com-
mande initiale, il résulte que le point Xi est situé sur la frontière de
,ce corps. Par conséquent, le corps P admet un plan d'appui en Xi'
le vecteur "p perpendiculaire à ce plan et dirigé vers l'extérieur du
-corps P n'étant autre que le vecteur utilisé dans la construction de
la fonction H.
Lorsque le système commandé est non linéaire, l'ensemble des
points X (t l ) obtenus à l'aide de toutes les commandes admissibles
possibles est non convexe et infini. Il n'est pas dans la nature du
principe du maximum d'utiliser, pour linéariser les problèmes, des
commandes différant légèrement de la commande optimale. Dans le
cas général non linéaire, le principe du maximum fut démontré
par V. Boltianski qui ensuite élabora les fondements de la théorie
non linéaire de la commande optimale. C'est précisément lui qui
a judicieusement choisi une classe de commandes dans le but de les
-comparer à la commande optimale en se servant des variations de
McShane, i.e. en étudiant les commandes admissibles distinctes de
l' op timale sur un nombre fini seulement de peti ts intervalles de temps,
mais distinctes arbitrairement sur chaque intervalle. Le problème
fut de la sorte linéarisé: l'ensemble des points X (t 1 ) correspondant
aux commandes indiquées, quoique non convexe, est proche d'un
.ensemble convexe de sorte qu'il fut possible de construire un plan
id' appui et un vecteur "p perpendiculaire à ce plan.
Leu Pontriaguine
CHAPITRE 1
Principe du
.
maXImum
9 1. Commandes admissibles
Nous étudierons le comportement d'un objet dont l'état est à
chaque instant caractérisé par n nombres réels Xl, x 2 , . . ., x n (par
exeulple les coordonnées et les vitesses). L'espace vectoriel X de la
variable vec torielle x == (xl, . . ., x n ) est l'espace de phase de l'objet
-considéré. Le comportement (mouvement) de l'objet consiste (du
point de vue mathématique) en une variation de Xl, . . ., x n en
fonction du temps. On suppose que le mouvement de l'objet est sus-
ceptible d'être c 0 m ID and é, i.e. l'objet est doté de «gouver-
nails }) dont la position conditionne le mouvement. Les positions des
-« gouvernails » sont données par les points u d'un domaine de comman-
de U qui peut bien être un ensemble quelconque d'un espace eucli-
,dien Er de dimension r; la donnée du point u == (u l , u 2 , . . ., ut) E
E U équivaut à la donnée du système de paramètres numériques Ul,
u 2 , . . ., ur. Dans les applications un cas est important, celui où
U est un domaine fer m é de l'espace Er. Le domaine de commande
U peut, en particulier, être un cube de l'espace de dimension r
1 ' 1 . bl 1 2 r
:engenc re par es varia es u , u , . . ., u :
1 u j 1 1, j == 1, 2, . . ., r,
(1)
ou un autre ensemble quelconque fermé et limité de cet espace de
dinlension r. D'un point de vue physique, il est clair pourquoi étu-
die-t-on (dans l'espace engendré par les variables Ul, u 2 , . . ., ur)
un dOluaine de commande fermé et limité U: les paramètres de com-
luande Ul, u 2 , . . ., ur peuvent représenter la quantité de combusti-
ble fourni à un moteur, la température, l'intensité du courant, la
tension, etc., qui ne peuvent prendre des valeurs arbitrairement
grandes. Par ailleurs, de par la construction technique du gouver-
nail de l'objet, les paramètres de commande u l , u 2 , . . ., u} peuvent
être liés entre eux par une ou plusieurs liaisons de la forme
<p (u l , u/', . . ., ur) == O. Dans ce cas, le domaine de commande U
-peut ôtra d'une forme géométrique plus ou moins complexe. Si, par
eXBJuple, les paramètres de comlllande Ul, u 2 sont par con'struction
de la forlu3 u l == cos <p, u 2 == sin <p, où <p est un angle arbitrairement
choisi, le domaine de commande sera ,la circonférence
(U 1 )2 + (u 2 ) 2 == 1.
(2)
12
PRINCIPE DU MAXIMUM
[Ch. 1
Dans la suite nous considérerons simplement le domaine de commande
U et ses points u E U et nous nous donnerons U sous la forme
d'un ensemble de l' esp ace engendré par les v ari ables u 1 , u 2 , . . ., ur
en prenant pour « point » u 'un système arbitraire de paramètres de
commande u == (u 1 , u 2 , . . ., ur) (voir (1) ou (2) par exemple) conte-
nu dans U.
Nous désignerons par commande toute fonction u == u (t) définie
sur un certain intervalle t o t t i et à valeurs dans le domaine de
commande U. U étant un ensemble de l'espace engendré par les para-
mètres de commande u 1 , u 2 , . . ., ur, chaque commande
u (t) == (u 1 (t), u 2 (t), . . ., ur(t))
est un. v e c t e u r f 0 n c t ion (défini sur l'intervalle t o :::;; t
t i ) à valeurs dans le domaine de commande U. Dans la suite, selon
la nature du problème à résoudre, nous imposerons diverses conditions
(continuité par morceaux, différentiabilité par morceaux, etc.) sur
la commande u (t). Nous désignerons par co m man des a d ID i s-
s i b 1 e s .les commandes satisfaisant à ces conditions. Dans ce cha-
pitre, nous appellerons admissibles des c 0 m man des que l-
con que s con t i nue spa r m 0 r c eau x (à valeurs dans
U), i.e. des commandes u == u (t) telles que chacune d'elles soi t con-
tinue pour toutes les valeurs de t considérées, à l'exception d'un nom-
bre fini où la fonction u (t) peut subir des discontinuités de première
espèce. Afin d'éviter toute confusion, observons que par définition
des discontinuités de première espèce, on suppose qu'au point 'r
de discontinuité existent les limites fin i e s
u ('t - 0) === lim u (t), u Cr + 0) === lim u (t).
t-+'T: t-+'T:
t< 'T: t>'T:
D'où il vient, en particulier, que toute commande u (t) est limitée
(même si le domaine U n'est pas limité).
La valeur de la commande continue par morceaux u (t) au point
de discontinuité ne joue aucun rôle dans la suite. Pour fixer les idées
il est néanmoins commode de supposer qu'en chaque point 't de dis-
continuité la valeur de la commande u (t) est égale à la 1 i ID i t e
à g a II che :
u ('t) == U ('t - 0)
(3)
et que chaque commande étudiée u (t) est continue aux extrémités
de l'intervalle t o t t i sur lequel elle est définie.
Ainsi donc" dans ce chapitre, nous conviendrons de désigner par
commande admissible toute fonction continue par morceaux u (t),
t o t t i , à valeurs dans le domaine de commande U, satisfaisant
à la condition (3) dans les points de discontinuité et continue aux
extrémités de l'intervalle t o t t i sur lequel elle est définie. Les
commandes continues par morceaux correspondent à l'hypothèse
2.]
ÉNONCÉ DU PROBLÈME FONDAMENTAL
13
de gouvernails « sans inertie» puisque les valeurs de la' fonction
u (t) peuvent (à l'instant de discontinuité) sauter instantanément
d'un point à un autre du domaine de commande. Cette classe de com-
mandes admissibles est apparemment la plus importante pour les
applications techniques de la théorie développée ici.
9 2. Enoncé du problème fondamental
Nous supposerons que la loi régissant le mouvement de l'objet
(ou l'action des « gouvernails » sur ce mouvement) s'écrit sous la
forme d'un système d'équations différentielles
dx i f i ( 1 2 n 1 r ) f i ( )
([t == x, x , · · ., x , u , ..., u == x, u ,
i == 1, 2, ..., n, (4)
ou sous la forme vectorielle
dx
(ft==f(x, u),
(5)
où f (x, u) est un vecteur de composantes
f1 (x, u), f2 (x, u), . . ., f n (x, u) .
Les fonctions fi sont définies quelles que soient les valeurs de la varia-
ble vectorielle x E X et les valeurs de u E U. Elles sont supposées
continues en Xl, x 2 , . . ., X n , U et continûment dérivables en Xl,
X 2 , . . ., x n . En d'autres termes les fonctions
f i ( 1 2 n ) t âfi (xl, x 2 , ..., xn, u).
X , X , ..., x , u e . ,
âx J
i, j == 1, 2, ..., n
sont définies et continues sur le produit direct X X U.
Observons que le système (4) est autonome, i.e. ses seconds
membres ne dépendent pas explicitement du temps t. Nous verrons
plus loin (7) le cas où les seconds membres sont fonctions du
temps.
Si est donnée une loi de commande, i.e. est fait choix d'une com-
mande admissible u = u (t), alors l'équation (5) s'écrit sous la forme
dx
lit == f (x, u (t», (6)
d'où (quelles que soient les conditions initiales x (t o ) = xo) est défi-
nie d'une manière univoque la loi du mouvement de l'objet x = x (t),
i.e. une sol ution de l'équation (6) définie sur un certain intervalle de
temps. Si, précisément, la commande u (t) est donnée sur un inter-
valle t o t t 1 et 8 1 , 8 2 , . . ., 8h. sont ses points de discontinuité
(de première espèce) tels que t o < 8 1 < 8 2 < . . . < 8h < t 1 , nous
étudierons l'équation (6) d'abord sur l'intervalle t o t 8 1 où
14
PRINCIPE DU J\IAXIIVIUM
[Ch. 1
son second membre est continu. Désignons par x (t) une solution
de cette équation avec la condition initiale x (t o ) == Xo. Si cette solu-
tion est définie sur l'intervalle t o t 8 i tout entier et prend en 8 1
la valeur x (8 i ), nous. pouvons alors étudier l'équation (6) sur l'in-
tervalle 8 i t 8 2 , 'en prenant pour valeur initiale x (8 i ). Dési-
gnons également cette solution par x (t). La solution x (t) ainsi cons-
truite est donc continue partout sur son intervalle de définition et,
en particulier, en le « point de conjugaison » 8 i . Si, maintenant, la
solution x (t) est définie sur l'intervalle t o t 8 2 tout entier et
prend en 8 2 la valeur x (8 2 ), nous pouvons alors étudier l'équation
(6) sur l'intervalle 8 2 t 8 3 , en prenant pour condition initiale
x (8 2 ), etc. La solution x (t) obtonue par cette procédure est par
conséquent continue et dérivable par morceaux; plus précisément,
la solution x (t) (là où elle est définie) est continûment dérivable en
tous les points sauf en 8 i , 8 2 , . . ., 8k. Nous dirons que x (t) est la
solution du système (4) (ou de l'équation (5)) associée à la conlnlande
u (t) avec la condition initiale x (t o ) == Xo. Cette solution peut ne pas
être définie sur l'intervalle t o t t i tout entier de définition de
la commande u (t) (elle peut s'éloigner à l'infini).
Nous dirons que la commande admissible. u (t), t o t ti't
transfère le point représentatif de la position. Xo à la position Xi si
la solution x (t) de l'équation (5) (ou ce qui revient au même (6)) lui
correspondant et vérifiant la condition initiale x (t o ) == Xo est définie
sur l'intervalle t o t t i tout entier et passe à l'instant t i par ]e
point Xi' i.e. satisfait également à la condition finale x (t 1 ) == .Ti'
Supposons maintenant qu'est donnée une autre fonction
fO (Xl, x 2 , . . ., x n , u) == 1 0 (x, u) définie et continue avec ses déri-
vées partiEÙles : , i = 1, 2, . . ., n, sur l'espace X X U tout
entier. Alors le problème fondamental (i.e. la recheJ;che des COlnman-
des optimales) peut se formuler de la manière suivante.
Etant donnés dans l'espace de phase X deux points Xo et Xi ; parmi
les commandes a!dmissibles, U == u (t) transférant le point représentatif
de Xo en Xi (si elles existent) trouver celle qui minimise la fonctionnelle
tl
J = \ 1° (x (t), u (t)) dt ;
-.-
to
(7)
x (t) désigne ici la solution de l'équation (5) avec la, condition ini-
tiale x (t o ) == Xo associée à la commande u (t) et t i l'instant où cette
solution passe par le point Xi.
Remarquons que (pour Xo et Xi fixés) les bornes t o et t 1 de l'ité-
grale (7) ne sont pas des nombres fixes, elles dépendent du choix de la
commande u (t) qui transfère le point représentatif de Xo en Xi (ces
bornes sont tirées des relations x (t o ) == Xo et x (t 1 ) == Xi). Nous ver-
2.]
ÉNONCÉ DU PROBLÈME FONDAMENTAL
15
rons plus loin ( 8) comment se résout ce problème lorsque les extré-
mités de l'intervalle d'intégration sont fixées.
La . commande u (t) qui donne la solution du problème énoncé
ci-dessus est appelée commande optimale correspondant au transfert,
de la position Xo à la position Xi' et la trajectoire correspondante
X (t) - trajectoire optimale. Ainsi donc' le problème fondamental
consiste à chercher les commandes optimales (et les trajectoires opti-
males correspondantes).
Un cas particulier important du problème optilIlal posé est celui
où
1 0 (x, u) == 1.
La fonctionnelle (7) s' écri t alors sous la forme:
J == t 1 - t o (8}
et l' optilIlali té de la cOInmande u (t) revient à minimiser le transfert
de Xo en Xl. Dans ce cas le problème s'énonce pro b 1 è m e d e
c 0 m man d e e n t e m p s 0 P t i mal.
Pour la formulation et la démonstration de la condition néces-
saire d'optimalité, il nous sera plus commode d'énoncer le problème
posé sous une autre forme. Plus exactement, ajoutons aux coordon-
nées de phase Xl, x 2 , . . ., x n régies par la loi (4) la coordonnée X Oj
dont les variations obéissent à la loi
dx O 1 0 ( 1 2 11, )
-cr;:-==- x, X, ..., x, u,
où 1° est la fonction qui a servi à définir la fonctionnelle J (voir
(7)). Autrement dit, nous considérerons le systèn1e d'équations diffé-
ron tielles
dx i _ f i ( 1.2 H 1
dt- X, x, ..., x, u, ...,
ur) = I i (X, U),
i == 0, 1, 2, . . ., n (9)
dont les deuxièlIles menlbres ne dépendent pas de xo. En introduisant
le vecteur
X - (X O X l 2 11 ) - ( ° )
- , , x, . . ., X - x, X
de l'espace vectoriel X de dimension n + 1, le système (9) s'écrit sous
la forme vectorielle:
dx
([t=f(x, u), (10)
où j' (x, u) est un vecteur de l'espace X de coordonnées fO (x, u), . . .
· · ., ln (X, u). Remarquons que le vecteur 1 (x, u) ne dépend pas
de la coordonnée XO du vecteur x.
Supposons maintenant que u (t) soit une commande admissible
transférant Xo en Xi' et X == x Ct) - la solution correspondante de
'16
PRINCIPE DU MAXIMUM
[Ch. 1
J'équation (5) avec la condition initiale x (t o ) = Xo. Désignons par
Xo le point (0, xo), i. e. le point de l'espace X de coordonnées 0,
x, . . ., xa où x, . . ., xa sont les coordonnées du point Xo dans
l'espace X. Il est alors évident que la solution de l'équation (10)
associée à la commande u (t) et vérifiant la condition initiale x (t o ) =
= Xo est définie sur l'intervalle t o t t 1 tout entier et s'écrit sous
la forme
t
X O = ) 1 0 (x (t), u (t» dt,
to
x=x(t).
En particulier, lorsque t = t i , nous avons
t1
X o = ) fO (x (t), u(t»)dt=J, X=Xh
to
i.e. la solution x (t) de l'équation (10) vérifiant la condition initiale
x (t o ) = X o passe] à l'instant t = t i par le point x = (J, Xi). En
d'autres termes, si l'on dé-
signe par II la droite qui,
dans le plan X, passe par
le point x == (0, Xi) et est
par allèle à l'axe Xo (cet te
droite II est constituée de
tous les points (, Xi) où
est un nombre arbitraire;
fige 1), nous pouvons dire
que la solution x (t) passe
à l'instant t = t 1 par le
point de coordonnée xO==J
situé sur la droite II. In-
versement, si u (t) est une
commande admissible telle
que la solution x (t) de l'équation (10) avec la condition initiale
x (t o ) == Xo = (0, xo) qui lui correspond passe à un certain instant t i
par le point Xi E II de coordonnée X O == J, alors la commande u (t)
transfère (dans l'espace X) le point représentatif de la position Xo
à la position Xi' la fonctionnelle (7) prenant la valeur J.
Nous pouvons par conséquent énoncer le problème optimal posé
plus haut sous la forme équivalente suivante.
Etant donnés dans un espace de phase X de dimension n + 1 le
point xo = (0, xo) et une droite II parallèle à l'axe X O et passant par
le point (0, Xi) ; parmi les commandes admissibles u == u (t) telles que
la solution x (t) de l'équation (10) avec la condition initiale x (t o ) ==
= xo associée à chacune d'elles coupe la droite fI, trouver celle qui
n
J
X{t)
FIG.1
2,]
ÉNONCÉ DU PROBLÈME FONDAMENTAL
17
nLllumise la coordonnée X O du point d'intersection avec la droite II.
C'est ce problème que nous allons résoudre. Nous conserverons
les mêmes termes de « commande optimale » et de « trajectoire opti-
nlale ».
Soulignons quelques propriétés simples des commandes et trajec-
toires optimales qui découlent immédiatement de l'énoncé du pro-
blème fondamental. Tout d'abord de l'autonomie du système (9)
il vient qu'une translation le long de l'axe t (fig. 2) ne modifie
r
----,
( ) --
u 1 t+I7".-- 1
..--' 1
," 1
( l ,
1 l ,
1 :' 1
1 l " 1
1 l " 1
t -h
o
t o
t
FIG.2
pas los propriétés des commandes. Autrement dit, si la commande
U (t), t o t t 1 , transfère le point représentatif de Xo en Xi et fait
prendre à la fonctionnelle (7) la valeur J, alors pour tout h réel la
conllnande u (t + h), t o - h t t i - h, transfère également le
point représentatif de la position Xo à la position Xi et fait prendre
à la fonctionnelle (7) la même valeur J. Ceci nous permet de déplacer
l'origine t o de l'intervalle t o t t 1 sur lequel est définie la com-
mande u (t) en un point quelconque de l'axe des temps.
Si de plus xo, Xi' . . ., Xk est un système fini de points de l'espace
de phase X et s'il existe une commande Ui (t) transférant le point
représentatif de Xi-l en Xi et faisant prendre à la fonctionnelle (7)
la valeur J, i = 1, . . ., k, il existe alors une commande u (t) trans-
férant le point représentatif de Xo en Xk et faisant prendre à la fonc-
tionnelle (7) la valour J 1 + J 2 + . . . + J k- En effet puisqu'il
est possible de déplacer les commandes le long de l'axe des temps,
nous pouvons considérer que les intervalles sur lesquels sont définies
les commandes Ui (t) sont contigus (fig. 3), i.e. la commande Ui (t)
est définie sur l'intervalle t i -i t t i où t o < t i < · .. < th.
Désignons par U (t) la commande définie sur l'intervalle t o t th
et coïncidant sur l'intervalle semi-ouvert t i -1 < t ti avec la com J
rnancle Ui (t), i.e. 1'« union » de toutes les commandes Ui (t). On vé
rifie imnlédiatement que la commande u (t) transfère le point repré-
sentatif de Xo en Xi et fait prendre à la fonctionnelle (7) la valeur J 1 +
+ J 2 + . . . + J k. Remarquons que cette opération d'« union »
de quelques commandes aurait été impossible dans la classe des com-
2--0133D
18
PRINCIPE DU MAXIMUl\I
[Ch. 1
mandes con t i nue s (car en les points t i , t 2 , . . ., tk-t la com-
mande u (t) construite peut subir des discontinuités de prenlière
espèce même si les commandes Ui (t) sont continues (fig. 3)).
lJ
1
1
ta
.t
FIG.3
De ce qui précède il découle aisément que toute portion de trajec-
toire optimale est également une trajectoire optimale (idem pour les
commandes optimales). Plus exactement, soit u (t), t o t tf,
.fa
.zj
--......
- - ..-----/---
J 2
.z/)
FIG.4
une commande optimale correspondant au transfert de la position
Xo à la position Xi' et x (t) la trajectoire optimale correspondante.
Si t o '"Co '"Ct t i , alors la commande u (t), '"Co t '"Ci' est la
commande optimale correspondant au transfert de la position X ('"Co)
à la position x ('"Ci), et x (t), '"Co t '"Ct, est la trajectoire optimale
correspondante (fig. 4). Désignons, en effet, par J t , J 2' J 3 les
valeurs de l'intégrale (7) prise respectivement sur les inter-
valles t o t '"Co, '"Co t '"Ct, '"C1 t tt. La commande u(t),
t o t t i , transférant le point représentatif de Xo en Xt fait prendre
à la fonctionnelle (7) la valeur J === Ji + J 2 + J 3. Si la commande
u (t), '"Co t '"Ct, n'était pas optimale, il existerait alors une com-
mande v (t) transférant le point représentatif de la position x ('"Co)
à la position x ('"Ct) et faisant prendre à la fonctionnelle (7) une valeur
J; < J 2 . On obtiendrait alors une commande qui transférerait le
3.]
LE IRINCJI-E DU MAXIMUl\1
19
point représentatif de la position Xo à la position X1 et ferait prendre
à la fonctionnelle (7) la valeur J 1 + J; + J 3 < J, ce qui contredit
l'optimalité de la commande u (t), t o t t 1 .
9 3. Le principe du maximum
Voyons maintenant la formulation du théorème résolvant le
problème posé plus haut. (La démonstration de ce théorème est don-
née dans le deuxième chapitre.) Pour le formuler nous allons, outre
le principal système d'équations (9):
dx i i
([t==1 (x, u), i ==0, 1, 2, ..., n, (11)
considérer un autre système d'équations par rapport aux variables
auxiliaires 'Po, 1P1, · · ., 1Pn :
n
d'Pi == _ l afa (x u) ,,1-\ 0 1
dt L.J ax'L 't'a, i == , ,. · ., n.
a=O
(12)
Si nous faisons choix d'une commande admissible u (t), t o <' t
< th et si x (t) est la trajectoire de phase correspondante du systèn1e
(11) avec la condition initiale x (t o ) = Xo, le système (12) s'écrit alors
sous la forme '
n
d'Pi == _ afa (x (t), u (t)) '11-\ 0 1
dt L.J ax i 't'a, i==, , .-., n.
a=O
(13)
Etant linéaire et homogène ce système admet, quelles que soient
les conditions initiales pour 'Pb une solution unique
'\j; = ('Po, 'P1' 'P2' · · ., 'Pn)
(définie sur l'intervalle t o <' t< t 1 tout entier sur lequel sont défi-
nies la commande u (t) et la trajectoire x (t». Tout comme la solution
x (t) du système (11), la solution du système (13) est composee des
fonctions continues 'Pi (t) admettant des dérivées partout continues-
en t sauf en un nombre fini de points (précisément, les points de dis-
continuité de la commande u (t». Toute solution du systÈme (13)
(quelles que soient les conditions initiales) sera appelée solution dll
système (12) correspondant à la commande choisie u (t) et à la trajec-
toire de phase x (t).
Nous allons maintenant grouper les systèmes (11) et (12) sous
une seule écriture. A cet effet considérons la fonction QJ{ des varia-
bles Xl, . . ., x n , 'tJJo, 'Pi' . . ., 1Pn, U l , . . ., Ur:
n
Q7t? ('\, X, U) == ('\l', f (X, u» == 'Pal a (X, u).
cx=O
2*
20
PRINCIPE DU MAXIMUM
[Ch. 1
On vérifie immédiatement que les systèmes (11) et (12) peuvent,
à l'aide de la fonction QJ£, prendre la forme du système hamiltonien
suivant:
dx i 8Q/O
-:ru == 81jJi '
d)i ()Q/O
dt - - ox i '
i==O, 1, ..., n.
(14)
(15)
i==O, 1, ..., n,
Ainsi, si l'on prend arbitrairement une commande admissible
(i.e. continue par morceaux) u (t), t o t t 1 , et la condition
initiale x (t o ) == xo, nous pouvons trouver la trajectoire x; (t) ==
= (X O (t), Xl (t), . .., x n (t)) correspondante (i.e. satisfaisant au
système (14)). Nous pouvons ensuite trouver les solutions
'i' (t) == (11' 0 (t), 'Pi (t), · · ., lPn (t))
du système (15) correspondant aux fonctions u (t) et x (t). Soulignons
une fois de plus que les vecteurs fonctions x (t) et 'i' (t) sont continus
et admettent des dérivées continues en t partout sauf en un nombre
fini de points.
Pour des valeurs fixes (constantes) de 'i' et x, la fonction QJt est
une fonction du paramètre u EU; soit
C?Jft ('i', x) == sup QJ£ ('i', x, u).
u6.U
Si la fonction continue OJ8 a t t e i n t son supremum en un point
du domaine U," alors C?J!t ('i', x) représente le maximum de la fonction
QJ8 pour'i' et x fixes. Aussi appellerons-nous p r i n c i p e d u m a-
x i m u m le théorème 1 qui va suivre (condition nécessaire d'opti-
malité) et qui s'exprime essentiellement par l'égalité (16).
Thé 0 r è fi e 1. Soit u (t), t o t t 1 , une commande admissi-
ble telle que la trajectoire correspondante x (t) (voir (14)), issue du point
Xo à l' intant t o pase à l' intant t 1 par un point de la droite II. Pour
que la commande u (t) et la trajectoire x (t) soient optimales il est néces-
saire qu'existe un vecteur fonction 'i' (t) == (tpo (t), 11'1 (t), · · ., 'Pn (t))
continu et non nul, correspondant aux fonctions u (t) et x (t), (voir
(15)) tel que:
1° quel que soit t, t o t t 1 , la fonction Olt ('i' (t), x (t), u) de la
variable u E U atteigne au point u = u (t) son maximum
Q!t? ('i' (t), x (t), u (t)) === (}Ji ('i' (t), x (t)) ; ( 16)
2° à l'instant final t 1 soient vérifiées les relations
11'0 (t l ) 0, 0ft ('i' (t 1 ), x (t 1 )) == O. (17)
Si par ailleurs les grandeurs 'i' (t), x (t) et u (t) satisfont aux systè-
mes (14), (15) et à la condition 1°, les fonctions 'Po (t) et D/fl ('\ (t), x (t))
de la variable t sont constantes, de sorte qu'on peut vérifier la relation
3.]
LE PRINCIPE DU MAXIMUM
21
(17) pas forcément à l'instant t i , mais à un instant quelconque t, t o
t t i . (La démonstration du théorème 1 fait l'objet du chapitre 2.)
Tirons maintenant du théorème 1 une condition nécessaire
8.nalogue pour la commande en temps optimal. A cet effet, posons
fO (x, u) == 1 dans le théorème 1. La fonction OJl s'écrit alors sous la
forme
n
cfÏ{? === 'lJo + L.: '\}'"f" (x, u).
'\'=1
En introduisant le vecteur 'IJ == ('lJi, 1P2' . . ., '\}'n) de dimension n et
la fonction
n
JI ('IJ, x, u) == h '\}'vi" (x, u),
'\'=1
nous pouvons écrire les équations (4) et (12) (à l'exception de l'équa-
tion (12) pour i == 0 qui, désormais, est inutile) sous la forme du
système hamiltonien
dx i aIl
-cft - a'lf'i ' i === 1, 2, ..., n,
d'Pi _ aIl 1
-cft - - âx i ' i == , 2, ..., n.
(18)
(19)
Pour des valeurs fixes de "-p et x, la fonction H est une fonction du
paramètre u; soit
M ( 'IJ, x) === su p H ('\)', x, u)
uEU
le supremum de la fonction H. De la reltion II ('IJ, x, u) ===
== QJt (1J', x, u) - 1P0 il vient:
M (1P, x) === dl ('t, x) - 'IJ 0 ,
et les conditions (16), (17) s'écrivent sous la forme
If (1p (t), x (t), u (t)) == ]Ji (1p (t), x (t)) == - "-Po o.
Nous obtenons par conséquent le théorème suivant.
Thé 0 r è m e 2. Soient u (t), t o t t i , une commande admis-
sible transférant le point représentatif de Xo à la position Xi et x (t)
la trajectoire correspondante (voir (18)), telle que x (t o ) == Xo et x (t 1 ) ==
== Xi. Pour que la commande u (t) et la trajectoire x (t) soient optimales
(au sens du temps optimal) il est nécessaire qu'existe un vecteur fonction
1P (t) == ('i (t), 1P2 (t), . . ., 1Pn (t)) continu et non nul correspondant
aux fonctions u (t) et x (t) (voir (19)) et tel que:
1 0 pour tous les t, t o t t 1 , la fonction H (1IJ (t), x (t), u)
de la variable u E U atteigne au point u == u (t) son maximum
H (1P (t), x (t), u (t) == M ("-p (t), x (t)) ; (20)
22
PRINCIPE DU MAXIMUM
[Ch. 1
2 0 à l'instant final t 1 soit satisfaite la relation
M (11' (t 1 ), x (t 1 )) ? o.
(21)
Si par ailleurs les grandeurs 11' (t), x (t), u (t) satisfont au système (18),
(19) et à la condition 1 0 , alors la fonction M (11' (t), x (t)) de la variable
t est constante, de sorte qu'on peut vérifier la relation (21) pas forcément
à l'instant t 1 mais à un instant quelconque t, t o t t 1 .
S 4. Discussion du principe du maximum *)
Le théorème 1 permet entre toutes les trajectoires issues du point
Xo et aboutissant en un point quelconque de la droite 11 et entre les
commandes qui leur correspondent de choisir des commandes et
trajectoires, en général isolées, satisfaisant à toutes les conditions
formulées. Nous avons en effet 2n + 3 relations (14), (15), (16)
entre 2n + 3 variables**) x'X, lPa, u, i.e. « un système complet de rela-
tions » pour déterminer toutes ces variables. Puisque la relation (16)
est finie (non différentielle), et que les équations différentielles sont
au nombre de 2n + 2 (en l'occurrence, les relations (14) et (15)),
le système d'équations (14), (15), (16) admet des solutions dépendant
en général de 2n + 2 paramètres (conditions initiales). Cependant,
l'un de ces paramètres n'est pas essentiel, car les fonctions 'l'a (t)
ne sont définies qu'à un facteur multiplicatif commun près (puisque
*) Ce paragraphe a pour but de prouver la «suffisance» du système de
relations, indiqué dans le théorème 1, pour résoudre le problème optimal posé.
Les raisonnements de ce paragraphe ne prétendent à aucune rigueur et ne sont
nulle part utilisés dans la suite.
**) Rappelons qu'« une» variable u peut se décomposer en plusieurs variables,
par exemple peut être un point d'un espace vectoriel de dimension r; dans ce
cas, on peut considérer aussi que la condition de maximum (16) comporte r
relations distinctes. Si, par exemple, le maximum est atteint en un point inté-
rieur au domaine de commande U (situé dans l'espace de dimension r engendré
par les variables ut, . . ., UT), pour que soit satisfaite la condition de maxi-
mum (16) il est nécessaire que s'annulent les r dérivées partielles:
i}<2l& (11' (t), x (t), u)
8uj
===0, j===1, ..., r;
u=u( t)
si le maximum est atteint sur une face de dimension r - 1 du domaine de com-
mande U, alors doit être satisfaite la condition d'appartenance du point u (t)
à cette face (ce qui nous donne une relation) et doivent s'annuler les dérivées
partielles de la fonction Qfe ('tJ' (t), x (t), u) dans toutes les directions de cette
face (ce qui nous donne encore r - 1 relations). Nous obtenons une situation
analogue sur les faces de moindre dimension (ou sur les parties courbées de la
frontière du domaine de commande U). Dans tous les cas, donc, si le domaine de
commande U est de dimension r, on pourra considérer que la condition de maxi-
mum (16) comporte r relations.
5.]
EXEMPLES. PROBLÈME DE SYNTHÈSE
23
la fonction QJt est homogène en 11'). Par ailleurs, un autre paramètre
annule la quantité
maxQ78 (11' (t o ), x (t o ), u)
uEU
à 1 ' instant t o .
Ainsi, l'ensemble des solutions du système (14), (15), (16) dépend
de 2n paramètres qu'il faut répartir de manière à faire passer la trajec-
toire x (t) par le point Xo pour une valeur don née. t == t o et
par un point de la droite fI pour une valeur que 1 con que
t 1 > io. Le nombre t 1 - t o est aussi un paramètre, de sorte que nous
disposons en tout de 2n + 1 paramètres essentiels. La condition de
passage de la trajectoire par le point Xo et un point de la droite fI
nous donne 2n + 1 relations. Par conséquent, il faut s'attendre
à l'existence de quelques trajectoires isolées joignant le point x 0
à la droite fI et vérifiant les conditions du théorème 1. Seules ces
trajectoires isolées peuvent être optimales (car les conditions du théo-
rème 1 sont n é ces s air e s à l'optimalité ).
Si, en particulier, les conditions du théorème 1 sont satisfaites
par une s e u 1 e trajectoire joignant le point Xo à un point de la
droite II, et si pour les raisons techniques qui ont conduit à poser le
problèlne optimal, il est «clair » que la trajectoire optimale doit exis-
ter, on peut à priori espérer que la trajectoire trouvée est précisément
optimale. Il ilnporte toutefois de souligner que mathématiquement
le problème de l'existence de la trajectoire optimale est à la fois très
important et très complexe. Dans le cas particulier de la commande
en temps optimal pour les systèmes linéaires (4), il est résolu dans le
chapitre 3.
9 5. Exemples. Problème de synthèse
Dans ce paragraphe nous allons voir comment appliquer le prin-
cipe du maximum à la résolution de quelques problèmes simples de
comlnande en temps optimal. L'examen de ces exemples nous per-
mettra d'aborder le problème de synthèse des commandes optimales
qui est une nouvelle et importante manière de poser le problème des
processus optimaux.
E x e m pIe 1.
S . t l " t . d 2 x" " d d , 1
01 equa Ion dt 2 = u, ou u est un parametre e comman e ree
assujetti à la condition 1 u 1 1. En coordonnées de phase Xl = X,
x 2 = : cette équation prend la forme du système suivant:
dx 1 _ 2
dl-x,
dx 2
dt = u.
(22)
24
PRINCIPE DU MAXIMUM
[Ch. 1
Considérons (pour le point représentatif dont le nlouvement est régi
par la loi (22)) le problème consistant à le faire arriver le plus rapide-
ment à l'origine des coordonnées (0, 0), le départ ayant lieu d'un
poin t ini ti al x o. En d' autres termes, no us allons étudier le pro blèlTIe
de commande en temps optimal lorsque la position finale est l' origi-
ne des coordonnées: Xi = (0, 0).
Dans notre cas la fonction H s'écrit
H == 'l't X2 + 'l'2U.
(23)
Pour les variables auxiliaires 'i't, 11'2 nous obtenons le système d' équa-
tions (voir (19), (23))
d1Pt _ 0 d'\P2 - _ '1101
dt -, ([t - 'Yb
d'où il vient 'i't = Ct, 11'2 = C 2 - Ci t (Ct et c 2 étant des constantes).
La relation (20) donne (compte tenu de (23) et de la condition
-1 u 1)
u (t) = sign 11'2 (t) = sign (c 2 - Ci t ).
(24)
De (24) il vient que chaque commande optimale u (t), t o t t i ,
est une fonction constante par morceaux, prenant les valeurs + 1 et
admettant au plus deux intervalles de constance (car la fonction
linéaire C 2 - Ctt change au plus une fois de signe sur l'intervalle
t o t t i ). Inversement, une telle fonction u (t) peut être tirée
de la relation (24) pour certaines valeurs de constantes Ci' c 2 .
Pour l'intervalle de temps sur lequel u == 1 nous avons (en vertu
du système (22))
t 2 1 ( (s2)2 )
x 2 = t + S2, Xl == 2 + s 2 t + SI == 2 (t + S2)2 + Sl_ 2
(SI, S2 étant les constantes d'intégration), d'où il vient
1
Xl =="2 (X2)2 + s,
(25)
où s = Sl - ;' (S2)2 est une constante. Par conséquent, la portion
de trajectoire de phase pour laquelle u == 1 est un arc de parabole
(25). La famille de paraboles (25) est représentée sur la fige 5, a.
De la même manière, pour l'intervalle de temps sur lequel
u == - 1, nous avons
x 2 == - t + S'2,
Xl = - t; + s'2t + S'l = - -} ( - t + s'2)2 + ( S'l + ; (S'2)2) ,
d'où
1
Xl == -2 (X2)2 + s'.
(26 )
5.]
EXEMPLES. PROBLÈME DE SYNTHÈSE
25
La fan1ille de paraboles (26) est représentée sur la fige 5, b. Les points
représentatifs parcourent les paraboles (25) de bas en haut ( car d2 =
= u = + 1) et les paraboles (26) de haut en bas (car dd2 = - 1 ) .
FIG.5
.x'
a)
1
"
.x'
b)
Nous avons déjà indiqué que toute commande optimale u (t)
est une fonction constante par morceaux égale à + 1 et admettant
au plus deux intervalles de constance. Si la commande u (t) est
égale à + 1, et ensui te à - 1, la trajectoire de phase est alors com-
posée de deux portions de paraboles contiguës (fig. 6, a), la deuxième
portion étant située sur la parabole (26) qui passe par l'origine des
coordonnées (car la trajectoire cherchée doi t finir à l'origine des coor-
données). Si, au contraire, u est d'abord égal à -1 et ensuite à + 1,
la trajectoire de phase est remplacée par une trajectoire qui lui est
symétrique par rapport au centre (fig. 6, b). Les valeurs correspon-
dantes du paramètre de commande u sont portées sur les arcs de para-
boles de la fige 6. Sur la fige 7 sont représentées toutes les familles de,
trajectoires de phase ainsi obtenues (AO est l'arc de parabole Xl =
26
PRINCIPE DU MAXIMUM
[Ch. 1
= ; (X 2 )2, situé dans le demi-plan inférieur; BO - l'arc de parabo-
le Xl = - (X 2 )2 situé dans le demi-plan supérieur). Le point repré-
sentatif se déplacera sur l'arc de parabole (26) qui passe par le point
initial Xo si ce point est situé au-dessus de la ligne AOB, et sur l'arc
.z2
XZ .k()
:.
:cI
.x'
.........
...............
....,
.......
......
/
/
/
'"
'"
a)
b)
FIG.6
de parabole (25) s'il est situé au-dessous de cette ligne. Autrement dit,
si la position initiale Xo est située a u - des sus de la ligne AOB,
le point représentatif doit se déplacer sous l'action de la commande
.x 2
FI G. 7
u = -1 tant qu'il n'arrivera pas sur l'arc AO; dès qu'il arrivera sur
cet arc la valeur de u changera et deviendra égale à + 1, et ce jusqu'à
l'origine des coordonnées. Si la position initiale Xo est si tuée a u -
des sou s de la ligne AOB, u devra être égal à + 1 jusqu'à l'ins-
5.]
EXEMPLES. PROBLÈME DE SYNTHÈSE
27
tant où le point représentatif arrivera sur l'arc BO; u changera
alors de valeur et deviendra égal à -1.
.A..insi, en vertu du théorème 2, seules les trajectoires décrites plus
haut peuvent être optimales, en outre, de la précédente étude il est
clair que chaque point de l'espace est le point de départ d'une s e u-
1 e trajectoire menant à l'origine des coordonnées et susceptible
d'être optimale (i.e.la donnée du point initial Xo définit d'une maniè-
re uni voque la trajectoire correspondante). Si nous étions sûrs que la
trajectoire optimale e x i s t ait toujours (i.e quel que soit le point
initial xo), nous dirions que toutes les trajectoires trouvées sont
optinlales. Dans le chapitre 3 nous formulerons le thé 0 r è m e
d' e x i s t e n c e pour les systèmes linéaires de commande en temps
optiulal, d'où il vient en particulier que dans l'exemple considéré,
quel que soit le point initial Xo, il existe une trajectoire optimale
(voir page 116). Par conséquent, les trajectoires trouvées (fig. 7)
sont optirnales;et il n'existe pas d'autres trajectoires optimales menant
à l'origine des coordonnées.
La solution du problème optimal de l'exemple précédent peut être
interprétée de la manière suivante. Désignons par v (Xl, x 2 ) =
== V (x) la fonction définie comme suit dans le plan Xl, x 2 :
( { + 1 au-dessous de la ligne AOB et sur l'arc AO,
v x) =
- 1 au-dessus de la ligne AOB et sur l'arc BO.
Alors, sur chaque trajectoire optimale, la valeur u (t) du paramètre
de commande (à un instant arbitraire t) est égale à v (x (t)), i.e. à
la valeur de la fonction v au point où à l'instant t se trouve le point
représentatif parcourant la trajectoire optimale:
u (t) == v (x (t)).
Ce qui signifie qu'en remplaçant dans le système (22) la quantité
u par la fonction v (x), nous obtenons le système
dx 1 2 }
--at == x ,
dx 2 1 2
at==v(x, x),
(27)
dont la solution (avec un état initial arbitraire xo) nous donne la tra-
jectoire de phase optimale qui mène à l'origine des coordonnées.
Autrelnent dit, le système (27) est un système d'équations différen-
tielles (avec un deuxième membre discon tinu) dont la résolution
donne les trajectoires optimales menant à l'origine des coordonnées.
28
PRINCIPE DU MAXIMUM
[Ch. 1
E X e m p 1 e 2.
Soit l'équation t + x = u, 1 u 1 :::;; 1. Cette équation est
équivalente au système
dl = x 2 , }
dx 2 (28)
- == - Xl - t- u
dt '
pour lequel, comme dans le premier exemple, nous allons résoudre le
problème consistant à arriver le plus vite à l'origine des coordonnées.
La fonction H est de la forme
H == 'l'1X 2 - 'l'2Xl + 'l'2U. (29)
1I
1
1
t
L
FIG. 8
Pour les variables auxiliaires '1'1' 'lP2 nous obtenons le système d' équa-
tions (voir (19), (29)
d: 1 = '\J2, }
dtp2
---a:t === - '1' 17
d'où '1'2 == A sin (t - elo), où A > 0 et elo des constantes. La relation
(20) donne (compte tenu de (29) et de la condition lu 1 1)
u == sign '1'2 == sign (A sin (t - elo)) == sign (sin (t - a o )). (30)
D'où il vient que la fonction u (t) se déduit par une elü-translation
(fig. 8) de la fonction sign (sin t) égale alternativement à + 1 et -1
sur des intervalles de longueur n.
Pour étudier les portions de trajectoires correspondant aux inter-
valles de temps sur lesquels u == 1 et u == -1, considérons le systè-
me auxiliaire
1 =X2, }
dx 2
- == - Xl
dt
(que l'on obtient du système (28) en posant u == 0). Ce système admet
une solution de la forme
(31)
Xl == - R cos (t + y), x 2 == R sin (t + 1'), (32)
5.]
EXEMPLES. PROBLÈME DE SYNTHÈSE
29
où R et y sont des constantes (R 0, 0 y < 2n). Les trajectoires
de phase sont donc des circonférences centrées en l'origine des
coordonnées:
(X 1 )2 + (X2)2 == R2 (33)
(fig. 9, a). De (32) on voit que le point représentatif se déplace sur
la circonférence (33) dans le sens des aiguilles d'une montre, unifor-
(£2
a)
x 2
x'
b)
x'
c)
FI G. 9
mément, à une vitesse linéaire de 2nR (un tour de circonférence en
un temps t == 2n). Observons, en particulier, qu'en un intervalle
de temps égal à n, le point représentatif décrit exactement la moi-
t i é de la circonférence (33) dans le sens des aiguilles d'une montre.
30
PRINCIPE DU MAXIIVIUM
[Ch. l
Pour u = lIe système (28) s'écrit
dx l _ 2 }
([t-x,
dx 2
-= -x l -L 1
dt 1 ,
(34)
ou encore
d(x l -1) _ 2 }
dt - x ,
dx 2 (35)
dt == - (xl-1).
Compte tenu des relations (31) et (33), nous constatons que les trajec-
toires de phase du système. (35) (ou, ce qui revient au même,
du système (34)) sont des circonférences
(Xl - 1)2 + (X2)2 = R2, (36)
i.e. des circonférences centrées au point 0 1 de coordonnées (1, 0).
En vertu de la loi (34) (i.e. de la loi (28) pour u = 1), le point repré-
sentatif parcourt ces circonférences dans le sens des aiguilles d'une
montre et décrit très exactement la moitié d'une circonférence
(fig. 9, b) en une période de temps égale à n.
D'une façon analogue, pour u = -1 le système (28) prend la
forme
d: t 1 = x 2 , }
dx 2
-= -xl-1
dt
et ses trajectoires de phase sont des circonférences
(Xl + 1)2 + (X 2 )2 = R2
(37)
centrées au point 0_ 1 de: coordonnées (-1, 0). Le point représen-
tatif se déplace Sllr ces circonférences dans le sens des aiguilles d'une
montre et parcourt très exactement la moitié de chacune d'elles en
un tem ps n (fig. 9, c).
Nous avons déjà mentionné que chaque commande optimale
u (t) est une fonction constante par morceaux déduite par une exo-
translation (fig. 8) de la fonction sign (sin t), qui est alternativen1ent
égale à +1 et -1 sur des intervalles de longueur n. Si la commande
optimale u (t) est de la forme représentée sur la fige 10, i.e. alternati-
vement égale à + 1 et -1 sur les intervalles (t o , ex), (ex, n + ex),
(n + ex, 2n + ex), . . . et finalement égale à + 1 sur un certain
intervalle de longueur < n, la trajectoire optimale correspondante
peut être construite de la manière suivante.
Pendant le dernier intervalle de temps (de longueur ), le point
représentatif se déplace sur une circonférence (36) (car u = 1 sur
5.]
EXEMPLES. PROBLÈME DE SYNTHÈSE
31
cet intervalle de temps), plus précisément, sur la circonférence qui
aasse par l'origine des coordonnées (car la trajectoire cherchée doit
pboutir à l'origine des coordonnées). Cette circonférence n'est autre
u
a)
FIG. 10
b)
.z2
oZl
x 2
: t
! t l
Zn+c
XZ
x'
.x'
FIG. 11
que la circonférence de rayon 1 centrée au point 0 1 (fig. 11, a).
En se déplaçant sur cette circonférence, le point représentatif arrive
à l'origine des coordonnées après avoir parcouru un arc intérieur à une
32
PRINCIPE DU MAXIMUM
[Ch. 1
demi-circonférence (car < n). Si donc nous désignons par MiO la
demi-circonférence inférieure, nous constatons que la dernière por-
tion de trajectoire de phase est un arc AO de la demi-circonférence
M 1 0.
Par ailleurs, le point représentatif est arrivé en A après s'être
déplacé pendant un intervalle de temps n sous l'action de la comman-
de u === -1 (voir fige 10), i.e. la portion précédente de trajectoire
de pllase est la demi-circonférence BA centrée en 0 -1, et ayant pour
extrémité le point A (fig. 11, b). Puisque l'arc BA est égal à une demi-
circonférence, le point B est symétrique du point A par rapport au
centre 0 -1, et, par conséquent, est si tué s ur la demi -circonférence
NiN 2 symétrique de la demi-circonférence 0 illJ 1 par rapport au cen-
tre 0_ 1 . D'une façon analogue, l'arc CB précédant l'arc BA et corres-
pondant à l'intervalle de temps de longueur n sur lequel u === 1,
est égal à une demi-circonférence centrée en 0 1 et par conséquent, le
point C est situé sur la demi-circonférence j\12M 3 , symétrique de la
demi-circonférence N 1 N 2 par rapport au centre 0 1 (fig. 11, c), etc.
Ainsi donc la trajectoire de phase correspondante est de la forme
représentée sur la fig. 11, c (la première portion de trajec toire de pha-
se sera plus petite qu'une demi-circonférence, pourvu que 0 < a -
- t o < n; voir fige 10).
La trajectoire de phase correspondant à la commande optimale
u (t) qui est égal à -1 (mais non à + 1) sur le dernier intervalle de
longueur , se déduit de la trajectoire représentée sur la fige 11,c par
une symétrie centrale (fig. 12). Pour une telle trajectoire' les points
de « jonction » des arcs de cercles seront si tués sur les demi-circonfé-
rences ON 1 , 1iM2' N 2 N 3 , · . ., symétriques (par rapport à l'origine
des coordonnées) des demi-ciconférences OMi, N 1 N 2' J.1I21V[p' . · ·
En groupant ces deux cas (flg. 11, c et 12) nous obtenons un tableau
général de l'allure des trajectoires de phase (fig. 13). Les valeurs cor-
respondantes du paramètre de commande u sont portées sur les arcs
des trajectoires de phase de la fige 13. Une inspection de la fige 13
nous montre que si le point initial Xo est situé a u - des sus de la
ligne. . . 1\13M21vfl0N1N2N3 . .., qui est constituée d'une infi-
nité de demi-circonférences de rayon 1, le point représentatif doit se
déplacer sous l'action de la commande u === -1. tant qu'il n'arrive
pas sur l'arc. . .jV[3M2MiO; à l'instant où il arrive sur cet arc u
change de valeur et reste égale à + 1 (le point représentatif se dépla-
çant alors sous la ligne . . .jV[3]J12J.Vf10N1N2N3 . . .) jusqu'au moment
où il arri ve sur l'arc () N iN 2 N 3. . . ; puis il se déplace de nouveau
au-dessus de la ligne... M3M2M10N1N2N3... sous l'ac-
tion de la commande u === -1 et ainsi 'de suite. La dernière portion
de trajectoire de phase (qui abouti t à l'origine des coordonnées) est
un arc de la demi-circonférence Mi O ou de la demi-circonférence N i O .
Le point représentatif se déplace exactement de la même manière
lorsque le point initial Xo est situé a u - des sou s de la ligne
ll=+/
FIG. 12
FIG. 13
39
.If
34
PRINCIPE DU MAXIMUM
[Ch. 1
. . . M 3M 2 M1 0N 1 N 2 N 3 · . · : au-dessus de cette ligne, le point repré-
sentatif se déplace sous l'action de la commande u = -1, au-des-
sous - sous l'action de la commande u = + 1.
"En vertu donc du théorème 2, seules les trajectoires mentionnées
peuvent être optimales, et de notre étude il ressort que chaque point
du plan de phase est le départ d'une s e u 1 e trajectoire menant
à l'origine des coordonnées et susceptible d'être optimale. Du théo-
rème d'existence qui est démontré dans le chapitre 3, il s'ensuit que
dans l'exemple considéré quel que soit le point initial Xo il existe
une trajectoire optimale (voir page 116). Par conséquent, les trajectoi-
res trouvées (fig. 13) sont optimales et il n'en existe pas d'autres
aboutissant à l'origine des coordonnées.
Comme dans le premier exemple, la solution du problème optimal
peut être interprétée de la manière suivante. Désignons par
v (Xl, x 2 ) = V (x) la fonGti<?n définie comme suit dans le plan Xl, x 2 :
+ 1 au-dessous de la ligne . . . M 3 M 2 M 1 0N 1 N 2 N 3.
et sur l'arc. . .M 3 M 2M10;
- 1 au-dessus de la ligne ...M 31112M10NtN2N3.
et sur l'arc. · .ON 1 N 2 N 3. . .
v (x) -
Alors, le long de chaque trajectoire optimale x (t) la commande opti-
male correspondante est de la forme
u (t) = v (x (t)).
Comme dans l'exemple précédent cela signifie qu'en remplaçant,
dans le système (28), u par la fonction v (x) nous obtenons le système
d:; =X2, }
dx 2 (38)
(ft= --xl+v (Xl, x 2 ),
dont la solution (pour un état initial Xo quelconque) nous donne la
trajectoire de phase optimale aboutissant à l'origine des coordonnées.
Autrement dit, le système (38) est un système d'équations différen-
tielles (avec des seconds membres discontinus) dont la résolution
donne les trajectoires optimales aboutissant à l'origine des coordon-
,
nees.
E x e m pIe 3.
Considérons maintenant le système à deux paramètres de com-
mande:
dx 1 }
_:=:: x 2 + u l ,
dt
dx 2
_= _Xl + U 2
dt '
(39)
5.1
EXEMPLES. PROBLÈME DE SYNTH:mSE
35
les grandeurs U l , u 2 étant assujetties aux condi tions 1 u l 1 1,
1 u 2 1 1. Comme dans les deux exemples précédents, étudions pour
ee système le problème consistant à arriver le plus vite à l'origine
des coordonnées. Ecrivons la fonction H
H == 'P1 (x 2 + Ul) + 'P2 ( - Xl + u 2 )
et le système auxiliaire
(40)
d"'1 }
dt == 'P2,
d"'2
([t= -'P1.
D'où il vient
'P1 == A sin (t + CG),
'P2 == A cos (t + CG),
où A et CG sont des constantes; A > 0, 0 CG < 21(. La relation
(20) nous donne maintenant (compte tenu de (40) et des conditions
\ u l \ 1, 1 u 2 \ 1)
u l = sign 'P1 = sign (A sin (t + CG)) == sign (sin (t + CG)),
u 2 = sign 'P2 = sign (A cos (t + CG)) == sign (cos (t + CG)).
Par conséquent, lorsque la commande est optimale chacun des
paramètres de commande u l , u 2 est une fonction constante par mor-
ceaux prenant les valeurs + 1 et -1. De l'étude du système (39)
nous concluons sans peine que les portions de trajectoires de phase
correspondant aux intervalles de temps sur lesquels u l == 1, u 2 == 1
sont des arcs de circonférences centrées au point 01.1 de coordonnées
(1, -1). Pour les autres valeurs de u l et u 2 on obtient le tableau sui-
vant:
(41)
Valeurs constantes des
paramètres de commande
sur un certain intervaIJe
de temps
Centre des circonférences qui sont Jes trajectoires
de phase correspondantes du système (39)
u 1 ==1, u 2 =1
u 1 = -1, u 2 =1
u 1 := -1, u 2 =-1
u 1 :=1, u 2 :=-1
Le point 01,1 de coordonnés (1, -1)
Le point 0-1,1 de coordonnee (1, 1)
Le point 0_1, -1 de coordonl!ees (-1, 1)
Le point 01, -1 de coordonnees (-1, -1)
Dans tous les cas, le mouvement a lieu sur les trajectoires de pha-
se (circonférences) correspondantes dans le sens des aiguilles d'une
Jnontre, uniformément, à la vitesse d'un tour en un. intervalle de
"
temps égal à 211:. En particulier, en un temps égal à ' le point repré-
sentatif parcourt un qua 1:' t d e c i r con f é r e n c e.
3*
36
PRINCIPE DU MAXIl\'IU M
[Ch. 1
De (41) il s'ensuit qu'à l'instant où l'argument t + a passe par
les points k (k est un entier quelconqu), l'un des paramètres de
commande u 1 , u 2 change de signe (car en chacun de ces points soit le
sinus soit le cosinus s'annule). En d'autres termes, aux instants où
t + a == k on assiste à un changement des valeurs des paramètres
de commande u 1 , u 2 , i.e. à un changement du c e n t r e d e 1 a
c i r con f é r e n c e sur laquelle se déplace le point représenta-
tif. Ce changement s'opère toutes les unités de temps, de sorte
que la trajectoire de phase est constituée de quarts de circonférences
centrées en 01. 1 ; 0 -1. 1 ; 0-1.-1 ; 01. -1. Seules la première et la der-
.z2 nière portions de trajectoire de pha-
se font exception: elles peuvent
en effet être pl us petites qu'un
quart de circonférence. ,
Par ailleurs, il est aisé de com-
prendre dans quel ordre s'opère ce
changement de centres. Si, lorsque
Z1 t croît, l'argument t + a prend
la valeur t + a == 2kJt (k étant un
nombre entier), les relations u 1 ==
== -1, u 2 == + 1 (voir (41))
sont satisfai tes imlnédiatement
a van t cet instant, i.e. le
mouvement a lieu sur un arc de
cen tre 0 -1. 1, et les relations u 1 ==
=== + 1, u 2 === -r-1 sont satisfaites
a p r è s cet instant, i.e. le mouvement a lieu sur un arc de centre
01. 1- Autrement dit, le centre 0-1. 1 est remplacé par le centre 01. 1.
De la même façon, le centre 01. 1 est remplacé par le centre 01,-1
(lorsque l'argument t + a prend la valeur 2kJt + .(voir (41)),
le centre 01. -1 par le centre 0 -1. -1 et le centre 0 -1. -1 par le centre
0_1. 1. L'ordre de changement de ces centres est représenté à la fige 14.
1Vlain tenan t, il nous est aisé d'imaginer le cOlnportemen t des
trajec toires de phase. A cet effet nous allons procéder à la construction
auxiliaire sui vante. Considérons la circonférence centrée en 0 -1. 1
et passant par l'origine des coordonnées, et désignons par OM 1 l'arc
de cette circonférence qui est si tué sous l'axe des abscisses (l'arc 0 f1
est de toute évidence égal à un quart de circonférence). Désignons
ensuite par M lM 2 l'arc égal à 0 M 1 et déduit de ce dernier par un
déplacement de longueur 0 Ml; construisons de la nlême nlanière
l'arc JVI 2 A1 3 et ainsi de suite (fig. 15). Remarquons que les abscisses
des points Ml' M 2' 1113. . . sont respectivement égales à 2,4,6, . . .
fl! -1
, .
0_ 11
. '
o
.
-I
1
.
Dl!
1
FIG. 14
5.]
EXEMPLES. PROBL'ÈIVIE DE SYNTHÈSE
37
Jn faisant tourner maintenant la ligne OlJ;f 1 M 2M 3. . . (qui est cons-
tituée de quarts de circonférence égaux) de ' n et 3; autour de
l'origine des coordonnées, nous obtenons les lignes ON i N 2 N 3. . .,
OP i P 2 P 3. . ., OQ1Q2Q3. . . représentées sur la fige 16.
Construisons maintenant la trajectoire de phase. Prenons une
cOilllnande optimale (de la forme (41) sur un intervalle fini de temps)
xz
Xl
FIG. 15
z
,x
0_/1
. )
FIG. 16
38
PRINCIPE DU MAXIMUM
[Ch. 1
.1;2
.x 2
0_1./
.
o
.xl
.x'
A
.
Ou
1
A
0,
0)
b)
A
x 2
O-t-t
.
;cf
d)
FIG. 17
et supposons pour fixer les idées que sur la der n i ère portion
de constance, qui est d'une longueur < ' les paramètres de com-
mande prennent les valeurs u l == + 1, u 2 == + 1. La portion corres-
pondante de trajectoire de phase (fig. 17, a) est un arc AO du quart
de circonférence Q10 (car cette portion est située sur la circonférence
centrée en 0 1 . 1 et s'achève à l'origine des coordonnées, quant à sa
longueur elle ne surpasse pas un quart de circonférence). En vertu de
ce qui a été dit plus haut, le centre 01. 1 est précédé par le centre
0-1. 1 (fig. 14), et par conséquent la portion de trajectoire de phase
précédant le point A est un quart de circonférence centrée en 0 -1. 1
(l'arc BA sur la fig. 17. b). Sur cette portion les paramètres de com-
5.]
EXEMPLES. PROBLME DE SYNTHÈSE
39
mande prennent les valeurs u l =-1, u 2 =+1. Etant donné que
le point A se trouvait sur l'arc Q10, le point B sera situé sur l'arc
déduit de Q10 par une rotation de :; autour du point 0 -1. 1, i.e.
sur l'arc fl;I lM 2.
L'antécédant du centre 0- 1 ,1 est le centre 0_ 1 , -1, par conséquent.
la portion de trajectoire de phase précédant le point B est un quart
de circonférence centrée en 0_1, -1 (i.e. l'arc CB sur la fige 17, c).
]es paramètres de commande prennent les valeurs u 1 = -1, u 2 =
::= -1. Puisque le point B se trouvait sur l'arc M 1 M 2 , le point C
sera situé sur l'arc déduit de M 1 M 2 par une rotation de :; autour du
point 0-1. -1' i.e. sur l'arc N 2 N 3 . En continuant de la sorte, on peut
entièrement tracer la trajectoire de phase. Sur la fige 17, d est repré-
sentée une trajectoire de phase constituée de trois arcs, qui sont des
quarts de circonférence et de deux arcs (le premier et le dernier)
inférieurs chacun à un quart de circonférence.
Si nous avions supposé que sur le dernier intervalle de constance,
les paramètres de commande prenaient au lieu des valeurs u 1 = +1
et u 2 = +1 les valeurs u 1 == -1 et u 2 == +1, ou les valeurs u 1 =
== -1, u 2 == - 1 ou, enfin, les valeurs u l === +1 et u 2 == -1, nous
aurions construit des trajectoires de phase analogues déduites par
. d Jt t 3Jt d 1 t .. , t ' 1
une rotation e"2' Jt e 2" e a raJectoire represen ee sur a
fige 17, d. Les quatre trajectoires de phase ainsi obtenues sont repré-
sentées sur la fige 18.
Analysant les valeurs des paramètres de commande sur certaines
portions des trajectoires de phase ainsi obtenues, nous arrivons
à la conclusion suivante. Les lignes OM 1 M 2 M 3 . .., ON 1 N 2 N 3 ...,
OP 1 P 2 P 3 . . ., OQ1Q2Q3. .. divisent le plan en quatre parties,
quatre « quadrants curvilignes », que nous désignerons par les chif-
fres romains l, II, III, IV (fig. 19). Sur les portions de trajectoires
de phase situées dans le « quadrant » 1, les paramètres de commande
prennent les valeurs u l == -1, u 2 == -1. Sous l'action de cette comman-
de le point représentatif atteint la ligne OM 1M 2M 3. . ., et à cet ins-
tant préci les valeurs des paramètres de commande changent pour
devenir égales à u 1 == -1, u 2 = +1. Sous l'action de cette commande
le point représentatif se déplace dans le « quadrant» IV, atteint la
ligne OQtQ2Q3. . . A cet instant précis les paramètres de commande
prennent les valeurs u 1 == + 1, u 2 == +1 et ainsi de suite. Résumons
ces résultats dans le tableau suivant:
dans le «quadrant» l et sur la ligne ON lN 2
dans le «quadrant» II et sur la ligne OP lP2
dans le «quadrant» III et sur la ligne OQ1Q2
dans le «quadrant» IV et sur la ligne OM 1 M 2 .
u 1 = -1, u 2 =-1
u 1 =+1, u 2 =-1
u 1 == +1, u 2 = +1
u 1 = -1, u 2 = +1
.x 2
.2:'
FIG. 18
x 2
JI
1
lI t =!
,
u 2 =-!
(j 1 = _ l,
(j2=-f
:c'
{ff=/,
{j2 = /
,,'=-1
1
,,2 = 1
JI[
11
FIG. 19
5.]
EXEMPLES. PROBLÈME DE SYNTHÈSE
41
En vertu donc du théorème 2, seules les trajectoires trouvées
peuvent être optimales; en outre, de cette étude il est évident que
chaque point de l'espace de phase est le départ d'une s e u 1 e trajec-
toire 'aboutissant à l'origine des coordonnées et susceptible d'être
optimale. Du théorème d'existence (qui est démontré dans le chapi-
tre 3) il s'ensuit que dans l'exemple considéré tout point Xo est le
départ d'une trajectoire optimale (voir page 116). Les trajectoires
trouvées sont par conséquent optimales et il n'en existe pas d'autres
aboutissant à l'origine des coordonnées.
Comme dans les deux exemples précédents, nous pouvons inter-
préter la solution du problème optimal de la manière suivante.
Construisons dans le plan Xl, X2 deux fonc tions VI (Xl, x 2 ) et v 2 (Xl, x 2 ):
f +1 à gauche de la ligne. · · Q3Q2Q1 0N 1 N 2 N 3 · · .
et sur l'arc . . . Q3Q2Q10,
1 -1 à droite de la ligne. . . Q3Q2Q10N1N2N3 . . .
l et sur l'arc . . · N 3 JV 2 N 1 0 ;
-t-1 au-dessous de la ligne. . . P3P2P10M1M2M3. . .
et sur l'arc . . .M 31V1 M 10,
-1 au-dessus de la ligne · · .P 3 P 2P 10M1JVI 2.113. . .
et sur l'arc · . · P 3 P 2 P 10.
Alors, le long de chaque trajectoire optimale x (t) == (Xl (t), x 2 (t)
la commande optimale correspondante u (t) == (u l (t), u 2 (t)) est de la
forme:
u l (t) == VI (Xl (t), x 2 (t)), u 2 (t) == v 2 (Xl (t), X2 (t)).
Ce qui veut dire qu'en remplaçant dans le système (39) les grandeurs
u 1 et u 2 par les fonctions VI (Xl, x 2 ) et v 2 (Xl, x 2 ) nous obtenons le
système
v L (Xl, x 2 )
v (Xl, x 2 )_
dx l == x 2 - VI ( Xl X2 ) }
dt l , ,
dx 2 ( 42)
_ === _ Xl _L v 2 ( Xl X2 )
dt l"
dont la solution (pour un état initial quelconque xo) nous donne la
trajectoire de phase optimale aboutissant à l'origine des coordonnées.
A utrelnent dit, le système (42) est un système d'équations différen-
tielles (à seconds membres discontinus) dont la résolution nous
donne les trajectoires optilnales aboutissant à l'origine des coordonées.
Problème de synthèse des commandes
optimales
Les exemples examinés plus haut montrent qu'il est naturel de
chercher la solution du problème des commandes optimales sous la
forme suivante. Nous résoudrons le problème optimal dans le cas
42
PRINCIPE DU MAXIMUM
[Ch. 1
général (voir (9)), en considérant tous les états initiaux Xo possibles
et en prenant à chaque fois pour état final l'origine des coordonnées
o de l'espace X. Alors (autant qu'on puisse en juger d'après les exem-
ples traités plus haut) il existe une fonction v (x) définie dans l'espace
de phase X et à valeurs dans le domaine des commandes U, telle que
l'équation
dx
dt == f (x, v (x»
(43)
(cf. (5» définit toutes les trajectoires optimales aboutissant à l'origine
des coordonnées. Autrement dit, il est naturel de chercher la comman-
de optimale non pas sous la forme u == u (t), mais sous la forme u =
== v (x), i.e. la commande optimale cherchée ne dépend à chaque
instant t que de la position occupée à ce même instant t par le point
représentatif. Ce qui est évident: si en effet nous nous trouvons déjà
au point x, le mouvement ultérieur (du point x en 0) doit être opti-
mal (car toute portion de trajectoire optimale est elle-même une tra-
jectoire optimale, voir page 18). La valeur de la commande optimale
u (t) à l'instant où le point représentatif occupe la position x dépend
donc uniquement de ce point x et non pas du point de départ du mou-
vement ni du temps qu'il a mis avant d'arriver en x. Les formules
(27), (38), (42) nous donnent précisément la solution des problèmes
optimaux examinés sous la forme d'une équation différentielle (43)
à second membre discontinu. (Si le domaine de commande U
est un espace de dimension r engendré par les variables u l , u 2 , . . ., ur,
la donnée de la seule fonction vectorielle v (x) équivaut à la donnée
de r fonctions scalaires u l == VI (x), . . ., Ur == V r (X); cf. formules
( 42) . )
La fonction v (x) qui donne l'équation des trajectoires optimales
sous la forme (43) sera désignée par fonction de synthèse et le problème
qui consiste à déterminer cette fonction (si elle existe ne fût-ce que
dans un voisinage suffisamment petit de l'origine des coordonnées)
par problème de synthèse des commandes optimales. Dans les exem-
ples traités plus haut les fonctions de synthèse étaient continues par
morceaux.
La connaissance de la fonction de synthèse permet de considérer
que le problème de l'arrivée optimale à l'origine des coordonnées,
est entièrement résolu mathématiquement. En effet, si l'objet techni-
que considéré sera équipé d'un instrument mesurant les états de
phase, et d'un mécanisme exécutif plaçant les gouvernails dans la
position u == v (x) où v (x) est la fonction de synthèse (supposée con-
nue), l'objet en question se déplacera optimalement. Si la fonction
v (x) est d'une forme compliquée, de toute évidence il serait plus
rationnel de faire appel à des calculateurs (universels ou spéciaux)
pour déterminer la position convenable des gouvernails u == v (x).
Le lecteur s'intéressant à ces problèmes pourra se référer à l'ample
6.]
PROBLÈME AUX EXTRÉMITÉS LIBRES
43
monographie de A. Feldbaum « Les calculateurs dans les systèmes
automatiques», Fizmatgiz, Moscou, 1959 (voir chapitre XIII) (en
russe) .
Dans le cas général, le problème de synthèse (i.e. l'existence de
la fonction de synthèse et sa détermination) n'est pas résolu. Dans
le cas particulier des systèmes linéaires et de la commande en temps
optimal, ce problème sera traité plus bas dans le chapitre trois.
6. Problème aux extrémités libres et conditions
de transversalité
Certaines notions géométriques nous seront indispensables en
vue de formuler et résoudre de futurs problèmes sur les commandes
optimales. Rappelons ici ces notions pour la commodité du lecteur.
Soi t f (x) == f (Xl, x 2 , . . ., x n ) une fonction scalaire réelle,
définie sur un domaine quelconque G d'un espace euclidien *) X
muni des coordonnées orthogonales Xl, x 2 , . . ., x n . Si la fonction f
admet dans le domaine G des dérivées partielles premières par rap-
port aux variables .x l , . . ., x n , alors en chaque point x du domaine
G est défini le vecteur
( ::1 ' ::2 '...' an )'
appelé gradient de la fonction f (x) et désigné par le symbole
grad f (x).
Nous désignerons par hypersurface de l'espace Xl' ensemble S
des points x == (Xl, . . ., x n ) satisfaisant à la relation
f (Xl, x 2 , . . ., X n ) == 0 ( 44)
et par équation de cette hypersurface "- la relation (44) . Nous suppo-
serons maintenant que le premier membre de l'équation (44) admet
des dérivées partielles continues. en Xl, x 2 , . . ., x n . Le point x E S
satisfaisant aux relations
al (x) _ al (x) _ _ al (x) _ 0
1X 1 - ax 2 -... - ax n -
(i.e. le point en lequel le vecteur grad f (x) est nul) est appelé point
singulier de l'hypersurface S. Les points de 1 'hypersurface S en les-
quels grad f (x) =1= 0 sont appelés points non singuliers. Une hyper-
surface définie par l'équation (44) à premier membre continûment
dérivable et ne renfermant pas de points sin gu-
*) L'espace X peut ne pas être euclidien, auquel cas le vecteur grad 1 (:1:)
introduit plus bas doit être considéré comme covariant.
44
PRINCIPE DU MAXIMUM
[Ch. 1
1 i ers, est appelée hypersurface continûment différentiable. Dans
la suite toutes les hypersurfaces seront supposées continûment diffé-
ren tiables.
Pour n = 2, l'équation (44) prend la forme
f (Xl, x 2 ) = 0
et la notion d 'hypersurface continûment différentiable se ramène
dans ce cas à la notion de ligne continûment différentiable (dans le
plan engendré par les variables Xl, X2). Pour n == 3, l'équation (44)
s'écrit sous la forme
f (Xl, x 2 , x 3 ) == 0
et la notion d 'hypersurface continûment différentiable se ramène
alors à la notion de surface continûment différentiable (dans l'espace
engendré par les variables Xl, x 2 , x 3 ).
Si l'équation (44) est 1 i n é air e, i.e. est de la fornle
a1xl + a2x2+ . . . + anx n +b == 0,
(45)
l'absence de points singuliers sign ifie que l'un an nloins des coeffi-
cients ai est non nul.
Dans ce cas, l'hypersurface définie par l'équation (45) est appelée
hyperplan.
Pour n = 2, l'hyperplan est une droite (dans le plan) et pour n == 3,
un plan (dans un espace tridimensionnel).
Soit Xo un point quelconque d'une hypersurface différentiable S..
définie par l'équation (44). Le vecteur grad f (xo) (ou tout vecteur
qui lui est colinéaire) est appelé vecteur normal (ou tout sinlplenlent
normale) à l'hypersurface S en Xo. Dans le cas d'un Il y p e r p 1 a n
(voir (45» les vecteurs normaux sont équivalents en tous les points..
i.e. il existe uns e u 1 vecteur normal
(ai' a 2 , . . ., an) ·
Tout hyperplan est univoquement défini par la donnée du vecteur
normal et par un point appartenant à cet hyperplan. Si S est une
hypersurfaco continûment différentiable définie par l'équation (44)
et Xo un de ses points, alors l'hyperplan passant par Xo et admettant
pour norrnale le vecteur grad f (xo) est appelé hyperplan tangent,
en Xo, à l'hypersurface S. Tout vecteur d'origine Xo contenu dans
1 'hyperplan tangent est appelé vecteur tangent à 1 'hypersurface S
en Xo. Autrement dit, un vecteur d'origine Xo est tangent à l'hyper-
surface S si, et seulement si, il est orthogonal au vecteur grad f (xo).
Soient maintenant
" i, S 2 , · · ., S k
6.]
PROBLÈME AUX EXTRÉMITÉS LIBRES
45
des hypersurfaces
X respectivement
continûment différentiables définies dans l'espace
par les équations
1 1 (Xl, X2, ..., X n) == 0,
12 (xl, X 2 , ..., X n) == 0,
(46)
.............
Ih (Xl, X 2 , ..., X n ) == o.
L'intersection M de ces hypersurfaces (i.e. l'ensemble des points
x E X satisfaisant simultanément à toutes les équations (46)) est
appelée variété continûment différentiable de dimension n - k
dans X, si est remplie la condition suivante: en chaque point X E M
les vecteurs
gr a d Il (x), gr a d 1 2 (x), . . ., gr ad 1 k (x) ( 4 7)
sont linéairement indépendants. Ainsi, par définition, une variété
de dinlension r dans X est donnée par un système de n - r équations.
En particlliier, une variété de dimension n - 1 est donnée par une
s e u 1 e équation. Par conséquent, les variétés de dimension n - 1
de l'espace X coïncident avec les hypersurfaces. Les variétés
unidimensionnelles sont aussi appelées lignes. Remarquons encore
que la condition d'indépendance des vecteurs (47) est équivalente
à la condition de maximalité du rang (i.e. égal à k) de la matrice
fonctionnelle
âf 1 (x) af 1 (x) a/ 1 (x)
ox I âx 2 âx n
af2 (x) af 2 (x) âf2 (x)
âx I ax 2 ax n (48)
. . . . . . . . . . . .
âl h (x) al h (x) Dlh (x)
âx 1 ax 2 âx n
Si les équations (46) définissant la variété M de dimension n - k
sont linéaires, cette variété est alors appelée plan de dimension
n - k de l'espace X. Ainsi, un plan de dimension n - k est l'inter-
section de k hyperplans dont les vecteurs normaux sont linéairement
indépendants. Les plans uni dimensionnels sont également appelés
lignes droites.
Soit lf une variété continûment différentiable de dimension
n - k définie dans l'espace X par les équations (46), et x un quel-
conque do ses points. Désignons par Li l'hyperplan tangent, en
X (i == 1, 2, . . ., k), à l'hypersurface Ii (Xl, x 2 , ..., x n ) == o.
L'intersection des hyperplans L1' L 2 , . . ., Ln est un plan de dimen-
sion n - k appelé plan tangent, en x, à la variété M. Un vecteur
ayant le point X pour origine est contenu dans le plan tangent (i.e.
46
PRINCIPE DU MAXIl\iUM
[Ch. 1
est un vecteur tangent en x à la variété M) si, et seulement si, il
est orthogonal à tous les vecteurs (47).
Soulignons enfin une circonstance simple dont nous aurons à
nous servir dans la sui te. Soit
Xi === cr i (), i === 1, . . ., n, ( 4 g)
l'équation paramétrique d'une ligne dans l'espace X ou, sous la for-
me vectorielle, x === cr (). Le vecteur tangent à cette ligne au point
=== o est de la forme:
( dcp! (o) dcp2 (o) d(pn (o) ) === dcp (o) (50)
d ' d ,. · · , d d.
Si la ligne (49) est entièrement contenue dans la variété continûment
différentiable M (d'une certaine dimension), le vecteur tangent (50)
à cette courbe est également tangent à la variété M au point cr (o).
Inversement, si est donné un vecteur tangent à la variété M au point
Xo E M, il existe dans la variété M une ligne passant par le point
Xo et admettant ce vecteur pour vecteur tangent. Autrement dit,
un vecteur ayant pour origine un point quelconque Xo E M est tan-
gent à la variété M si, et seulement si, il est tangent à une ligne con-
tenue dans M.
Formulons maintenant le problème de la commande optimale
aux extrémités libres. Soient S 0 et S 1 des variétés continûment diffé-
rentiables de dimensions ro et rl arbitraires (mais inférieures à n)
So
FIG. 20
de l'espace X. Soit à résoudre le problème: trouver la commande admis-
sible u (t) qui transfère le point représentatif d'une position Xo E S 0
(non donnée à l'avance) à une position Xl E S 1 et qui minimise la fonc-
tionnelle (7) (fig. 20). Nous appellerons ce problème le problème
optimal aux extrémités libres. Si les variétés S 0 et S 1 dégénèrent en des
points, le problème aux extrémités libres se transforme en le problème
aux extrémités fixes que nous avons traité précédemment.
Il est clair que si les points xo, Xi étaient connus, nous aurions
à résoudre le problème aux extrémités fixes. La commande u (t),
6.]
PROBLME AUX EXTRÉMITÉS LIBRES
47
optimale au sens du problème aux extrémités libres, est donc opti-
Inale au sens précédent, i.e. le principe du maximum (théorèmes 1,2)
reste en vigueur pour le problème aux extrémités libres.
Dans ce cas toutefois, il faut encore des relations qui permettraient
de déterminer la position des points Xo et Xi sur les variétés So et S1.
Ces relations sont formulées dans ce paragraphe sous le nom de con-
ditions de transversalité. Ces conditions nous donnent ro + ri rela-
tions dans lesquelles figurent les coordonnées des points extrémaux
Xo et Xi. Etant donné par ailleurs que le nombre des paramètres incon-
nus (en comparaison avec le problème aux extrémités fixes) a égale-
rnent augmenté de ro + ri (car la position du point Xo sur la variété
1..') 0 de dimension ro est caractérisée par ro paramètres, et la position
du point Xi E Si par ri paramètres), les conditions de transversalité
forment avec le principe du maximum un système «suffisant» de
relations pour la résolution du problème optimal aux extrémités
Ii bres .
Formulons maintenant les conditions de transversalité. Soient
Xo E 8 0 , Xi E 8 1 deux points quelconques, et To, T 1 des plans tan-
gents aux variétés So et S1 en ces points. Les plans T 0 et T 1 de dimen-
sions respectivement ro et r1 sont contenus dans l'espace X. Soit,
ensuite, u (t), x (t), t o t t i , une solution du problème optimal
aux extrémités fixes Xo et Xi. Soit, enfin"l' (t) le vecteur dont l' exis-
tence est affirmée dans le théorème 1. Nous dirons que le vecteur
'i' (t) satisfait à la condition de transversalité à l'extrémité droite
de la trajectoire x (t) (i.e. au point x (t i )), si le vecteur 1fJ (t i ) =
== (lfJi (t i ), 1fJ2 (t i ), · · ., lfJn (t i )) est orthogonal au plan T 1 . Autre-
filent dit, la condition de transversalité signifie que pour tout vecteur
e === (8 1 , 8 2 , .. ., 8 n ) contenu dans le (ou parallèle au) plan Ti est
vérifiée la relation (1fJ (t i ), 8) = O. On a la même condition de
transversalité dans l'extrémité g a u che de la trajectoire x (t) (il
suffit simplement d'y remplacer t i et Ti respectivement par t o et To).
IL est clair que la condition de transversali té à 1 ' extrémité droite de
la trajectoire x (t) contient ri relations indépendantes, puisque dans
la relation (1fJ (t 1 ), 8) = 0 il suffit de porter les ri vecteurs linéaire-
nIent indépendants 8 1 , 8 2 , . . ., 8r! contenus dans le plan T 1. La
condition de transversalité à l'extrémité gauche contient ro rela-
t ions indépendantes.
Les conditions de transversalité nous permettent désormais de
formuler la solution du problème aux extrémités libres.
Thé 0 r è ID e 3. Soientu (t), tot<ti' une commande admissible
transférant le point représentatif d'une certaine position Xo E S 0 dans
la position Xi E S 1, et x (t) la trajectoire correspondante (issue du point
Xo = (0, x o )). Pour que u (t) et x (t) soient solutions du problème optimal
aux extrémités libres, il est nécessaire qu'existe un vecteur fonction", (t)
continu et non nul, satisfaisant aux conditions du théorème 1 et, de
48
PRINCIPE DU MAXIMUM
[Çh. 1
plus, à la condition de transversalité aux deux extrémités de la trajectoire
x (t).
Il est évident que si l'une des variétés S 0' SI dégénère en un
point, la condition de transversali té dans l' extrémi té correspondan t(
de la trajectoire x (t) est remplacée par la condition de passage de la
trajectoire x (t) par ce point.
Dans le cas de la commande en temps optimal, dans la formula-
tion du théorème 3, la solution x (t) est remplacée par x (t) et la réfé-
rence au théorème 1 par la référence au théorème 2.
Voyons des exemples élémentaires de résolution de problèmes
aux extrémités libres.
E x e m pIe 1.
Considérons pour le point dont le mouvement est régi par la loi
(22) (avec la même contrainte 1 u 1 ::::;; 1), le problème de la plus
rapide arrivée sur l'axe x 2 en partant d'un état donné Xo. Dans ce
cas nous avons à resoudre un pro-
blème dont est libre l' extrémi té droi-
te : la variété S 0 dégénère en le poin 1
xo, quant au point Xl == 0 ce Il' est au-
.xl tre que la variété S 1. Le vecteur 8 ==
== (8 1 , 8 2 ) tangent à la variété SI (en
un quelconque de ses points) est de la
forme 8 == (0, 8 2 ) où 8 2 * 0 et par
conséquent la condition de transversa-
Ii té dans l'extrémité droite s'écrit
sous la forme 0.11'1 (t 1 ) + 8 2 .11'2 (t 1 ) == 0
d'où 11'2 (t 1 ) == O. La fonction '4'2 (t)
étant encore linéaire (voir page 24),
de la relation 11'2 (t 1 ) == 0 il résulte que 11'2 (t) garde son signe lorsque
t o ::::;; t < tt. Dans ce cas donc (voir (24)) toute commande optimale
u (t) est con s tan t e et égale à + 1 ou -1. Par conséquent,
ne peuvent être optimaux que des mouvements s'opérant le long des
paraboles (25) et (26) (sans commutations). Supposons d'abord que
l'état de phase initial Xo se trouve à d roi t e de la droite Xl == O.
D'après ce qui a été dit plus haut, par le point Xo ne passent que deux
trajectoires de phase qui sont susceptibles d'être optimales: la trajec-
toire (25) sur laquelle le mouvement a lieu de bas en haut et la trajec-
toire (26) sur laquelle le mouvement a lieu de haut en bas (fig. 21).
Si le point Xo est situé au-dessus de la ligne AO (voir fige 7), en se
déplaçant sur la parabole (25) le point représentatif n'arrivera pas
sur l'axe Xl == 0 (fig. 22, a) et seul peut être optimal le mouvement
qui a lieu sur la parabole (26). Si le point Xo est situé sur ou sous la
ligne AO, les deux mouvements (25) et (26) amènent le point repré-
sentatif sur l'axe Xl == 0 (fig. 22, b). Dans ce cas donc il existe
d eux trajectoires satisfaisant au principe du maxinlUln. Cepen-
.xZ
1
1
.zo
,
"
"
"
"
"-
.....
,
"
FIG. 21
6.]
PROBLÈME AUX EXTRÉMITÉS LIBRES
49
dant, il est aisé de voir que le temps mis pour aller de Xo à 1 '.axe Xl =
== 0 est différent selon la trajectoire. En effet, en construisant les
tangentes aux paraboles (25) et (26) en Xo, on constate aisément (voir
fige 23) que QOQ2> QOP2 == Q o P 1 > QoQl.
FIG. 22, a
.x 2
o
\
\
,
,
,
,
"
"
"
.......
.xl
A
---
FIG. 22, b
Or, comme pour u = + 1, le mouvement a lieu 'sur l'arc de parabole
en un temps égal à la différence des ordonnées (voir la deuxième
équation (22)), le temps mis pour parcourir l'arc X O Q2 est plu s
Ion g que celui mis pour parcourir l'arc xoQt. Par conséquent, dans
ce cas aussi, ne peut être optimal que le mouvement s'opérant sur
la trajectoire (26). Ainsi, dans le demi-plan droit ne peuvent être
optimaux que des mouvements s'opérant sur les paraboles (26),
i.e. les mouvements ayant lieu pour u == -1. De même, à gauche de
l'axe Xl == 0, ne peuvent être optimaux que les mouvements s'opé-
rant sur les paraboles (25), i.e. des mouvements ayant lieu pour
4 --0 1339
50
PRINCIPE DU MAXIMUl\'I
(Ch. 1
u = +1. Ceci nous donne la synthèse des commandes optilnales;
en posant
V (Xl, x 2 ) == { +1
-1
pour Xl < 0,
pour Xl > 0,
(£2
_ _ Ou
xl
\
\
,
"-
"-
"
A
FIG. 23
nous obtenons l'ensemble de toutes les trajectoires optimales
à partir du système
d: t 1 = x 2 , }
dx 2
-Jt == V (Xl, x 2 )
(cf. (27)). Les trajectoires de phase sont représentées sur la figure 24.
On pourrait d'ailleurs considérer que .les équations (51) sont
évidentes (d'un point de vue mécanique, par exen1ple).
E x e m p 1 e 2.
Considérons pour le point dont le mouvement est régi par la loi
(28) (avec la même contrainte 1 u 1 ::::;; 1) le problème de la plus rapi-
de arri vée sur la circonférence
(51)
(X 1 )2 + (X 2 )2 == R2
(52)
en partant d'un état initial Xo non situé sur cette circonférence. Dans
ce cas également nous avons à résoudre un problème à extrémité
droi te libre: la variété S 1 étant la circonférence (52) . Soit Xi ===
== (R cos ex, R sin ex) un point quelconque de la circonférence (52).
Cherchons la trajectoire optimale aboutissant en Xi et donnant la
.]
PROBLÈME AUX EXTRÉMITÉS LIBRES
51
solution du problème posé à extrémité droite libre. Pour 'i' (t f ),
i.e. le vecteur perpendiculaire en Xi (compte tenu des conditions de
transversali té) à la circonférence (52) nous devons prendre l'un des
.:c Z
X'
FI G. 24
deux vecteurs (- cos ex, - sin ex), (cos ex, sin et), dont le premier
est dirigé vers l'intérieur de la circonférence et le second, en sens
inverse. Etant donné que la trajectoire cherchée doit arriver en Xi
f(.x{t/),IJ{tJ)
.x'
FIG. 25
deI' e x t é rie u r de la circonférence (52), le vecteur vi tesse de
phase f (x (t f ), U (t f )) appliqué au point x (t i ) == Xi sera orienté
soit vers l'intérieur de la circonférence (52), soit dans le sens de la
tangente à cette circonférence en Xi (fig. 25). Puisque le produit sca-
laire
('1' (t l ), t (x (t f ), U (t f ))) == H (1p (t f ), X (t i ), U (t f )) (53)
4*
52
PRINCIPE DU MAXIMUM
[Ch. 1
doit être non négatif (voir théorème 2 et notamment la relation (21))
il importe donc de prendre pour '\}J (t 1 ) le vecteur (-cos a, - sin ex)
orienté radialement vers l'intérieur de la circonférence. (Si le vecteur
vitesse de phase f (x (tt), U (t 1 )) se trouve orienté suivant une tangen-
te à la circonférence, alors le produit scalaire (53) s'annulera et pour
'\}J (t 1 ) on pourra prendre un vecteur orienté aussi bien vers l'intérieur
que vers l'extérieur de la circonférence; convenons que dans
ce cas aussi le vecteur- '\}J (t 1 ) est orienté vers l'intérieur de la
circonférence.) Nous avons donc
'\}J (tt) = (- cos a, - sin a).
Si l'on revient maintenant au système d'équations (voir page 28)
d1Pi d1P2
dt = '1'2' d:t -== - 'li'1
on obtient en définitive
'P1 (t) = - cos (t - t 1 - a), 'P2 (t) = sin (t - t 1 - a), t o t :;;;;/1.
Compte tenu de (29) et de la condition 1 u 1 1, la relation (20)
nous donne:
u = sign 'P2 = sign (sin (t - t 1 - a)).
(5q)
Si l'angle a satisfait aux inégalités 0 a < n, alors sur l'inter-
valle t 1 - (n - a) tt1 la commande u (t) sera, compte tenu
de (54), égale à -1, et avant cela, alternativement égale à +1 et -1
u
t
FI G. 26
sur des intervalles de longueur n (fig. 26). Par conséquent, la derniè-
re portion de trajectoire de phase (qui se termine en Xi) est un arc
de circonférence centrée au point (-1, 0), cet arc étant intercepté
par l'angle au centre n - ai et les portions précédentes de trajectoi-
re sont des demi-circonférences alternativement centrées en (1, 0)
et (-1, 0). La trajectoire est représentée sur la fig. 27. Si l'angle ex
satisfait aux inégalités Je a < 2n, on obtient alors une trajectoire
symétrique par rapport au centre de celle représentée sur la fig. 27.
On voit aisément (voir fige 28) que pour 0 a < Je l'extrémité B
du dernier arc" BA de la trajectoire optimale considérée est située
sur la circonférence de rayon -1 centrée au point (-R, -1, 0).
Lorsque a varie entre 0 et Je, le point B décrit la demi-circonférence
N 2 N t , qui est située au-dessus de l'axe des abscisses., D'un autre
6.]
PROBL:ÈME AUX EXTR:ÉMIT:ÉS LIBRES
53
côté, la portion précédente CB de trajectoire optimale étant une
demi-circonférence centrée au point (1,0), son extrémité C est située
sur la demi-circonférence M2M3 symétrique de NiN 2 par rapport au
centre (1,0). En continuant de la sorte nous obtenons la trajectoire
Xf
FIG. 27
de phase toute entière (fig. 29). La trajectoire symétrique par rapport
au centre se construit d'une manière analogue. La disposition géné-
rale des trajectoires de phase est représentée sur la fige 30.
{ o.fLiR=OA,
80.., = 11., A ,
L8fl.,Q =L O-fAO
Xf
FIG. 28
La synthèse des commandes optimales est réalisée par la fonction
v (Xl, X 2 ) qui, de ce qui précède, se construit de la manière suivante.
A droite de la circonférence (52) on construit les demi-circonféren-
ces égales MtM2' M.2M3, . . . de rayon 1 sous l'axe des abscisses.
A gallche de la circonférence (52) on] construit également les demi-
circonférences N i N 2 , N 2 N 3 , . . . de rayon 1 au-dessus de l'axe des
N J
/1 2 M3
\ 1 Xl
, /
....-- C
FIG.29
FIG. 30
7,] LE PRINCIPE DU MAXIMUM POUR LES SYSTÈMES NON AUTONOMES 55
,
abscisses. La fonction v (Xl, x 2 ) se définit maintenant en dehors de
la circonférence (52): elle est égale à + 1 au-dessous de la ligne
... N 2 N 1 M i lVI 2 ... et à -1 au-dessus de la ligne .. .M 2 M i N 1 N 2 ...
Ainsi donc nous avons la synthèse des commandes optimales:
dx i 2
---;Il == X ,
dx 2
-= -X 1 + V ( X l
dt '
x 2 ). }
7. Le principe du maximum pour les systèmes
non autonomes
A. Considérons le même problème optimal que (l) et (7), mais
dans le cas où les fonctions fa dépendent explicitement du temps (le
domaine de commande U est supposé indépendant du temps). La
loi régissant le n10uvement de l'objet et la fonctionnelle dont on cher-
che le minimum s'écrivent alors
dx i .
dt==f(x, u, t), i== 1,2, ..., n; (55)
tf
J = \ /0 (x (t), u (t), t) dl, (56)
'"
to
t o est supposé connu, t i est le temps de passage par Xi que nous nous
proposons de trouver. Comme précédemment, introduisons la nouvel-
t
le coordonnée Xo = ) /0 (x (t), u (t), t) dt et énonçons le problème
to
sous la forme suivnte (cf. 2).
Etant donnés dans l'espace de phase X de dimension n + 1 un point,
Xo === (0, xo) et une droite II parallèle à l'axe X O et passant par le point
(0, Xi), parmi les commandes admissibles u == u (t) telles que la solu-
tion correspondante x (t) du système
dx i .
(ft==f1(X, u, t), i==O, 1, ..., n (57)
avec la condition initiale x (t o ) == Xo coupe la droite II, trouver celle qui
rninimise la coordonnée XO du point d'intersection avec la droite II.
En vue de résoudre ce problème nous allons introduire une incon-
Il ue auxili aire x n + l tlle que
dxn+1
dt == 1, xn+1 (t o ) == t o .
] l est évident que x n +1 == t. Désignons par X* l'espace engendré
par les variables Xl, X2, . . ., x n , x n + 1 . Le système (57) peut alors
56
PRINCIPE DU MAXIMUM
[Ch. 1
être écrit sous la forme autonome (i.e. ne
te ment du temps) suivante:
dx i .
- - I (x U xn+1 )
dt - " ,
dxn+l
dt === 1.
dépendant pas explici-
i = 0, 1, ..., n, }
Le problème est Inaintenant de chercher une trajectoire optimale
· . d 1 , X * 1 . ( 1 2 n ) " .
JOIgnant ans espace e pOInt xO' xO' . . ., xO' t o a un pOInt
de la droite Si qui passe par le point (x, xî, . . ., x, 0) et est paral-
lèle à l'axe x n +1 (puisque la valeur finale de la v ari able x n +1, i.e
l'instant où le point en mouvement arrive en Xi n'est pas préalable-
ment donnée). Nous sommes par conséquent amenés à résoudre un
problème optimal ordinaire à extrémité gauche fixe et extrémité
droite libre.
Ecrivons le principe du maximum et la condition de transversali-
té. Le système auxiliaire d'équations (12) est de la forme
n
d'l{?i _ _ a/a
dt - L.J ôxi 'Pa,
a=O
; -- 0 1
f/- , ,
. . ., n,
(58)
n
d'Pn+t _ _ ô/a 1101
dt - L.J ôt 'fa.
a=O
(59)
En vertu des théorèmes 1 et 3, il faut former la fonction
'Polo (X, u, Xn+1) + 'P1f 1 (X, u, Xn+1) + . . . + 'Pnl n (x, u, Xn+1) + 'P11+1 .1.
Désignons cette fonction par QJi* (et non par QJ£ comme dans le théo-
rème 1) et conservons la notation QJt pour la fonction
&e ('\l', X, t, u) == 'Polo (x, u, t) + 'P1f 1 (x, U, t) + .. . + 'Pnf n (x, u, t),
à l'aide de laquelle les équations (57), (58) s'écrivent sous la forme
du système hamiltonien
dx i ôQJ& d'Pi ôQJ&
dt == Ô'l{?i ' ---at===- ôx i ' i==O,1, ...,n.
De la même façon désignons !par Q/ft* ('\l', x, xn+1) (et non par dIt
comme dans le théorème 1) le maximum par rapport à u de la fonction
QJt* pour Xi et 'Pi fixes, et conservons la notation Glft ('\l', x, t) pour le
maximum (en u) de la fonction QJt ('\l', x, t, u) pour '\l', x, t fixes. En
vertu de la relation x n + 1 == t nous pouvons écrire que Q1f* === QJ£ +
+ 'Pn+i, dlt* == dt + 'Pn+i, et par conséquent la relation JJt* ==
== rYft* == 0 qui est satisfaite le long de la trajectoire optimale (voir
théorème 1) prend la forme
QJ8 (11' (t), x (t), t, u (t» == dIt ('i' (t), x (t), t) == - 'Pn+1 (t). (60)
7.] LE PRINCIPE DU MAXIMUM POUR LES SYSTÈMES NON AUTONOMES 57
]a condition de transversalité à l'extrémité droite de la trajectoire
indi que, enfin, que 1 a droite S 1 (qui est parallèle à l'axe x n +1) est
orthogonale au vecteur (1P1 (t 1 ), 1P2 (t 1 ), · · ., 'l'n+1 (t 1 )). Autrement
dit, 1Pn+1 (t i ) == o. En tenant compte des relations (60) et (59), nous
avons
t n
clt( '\jJ (t), x (t), t) = apx (x (t't u (t), t) 1PCG (t) dt.
t1 a=O
Nous obtenons donc le théorème suivant (principe du maximum
pour les systèmes non autonomes).
Thé 0 r è m e 4. Soit u (t), t o t t 1 , une commande admissible
telle que la trajectoire x (t) du système (57) qui lui correspond, en partant
du point Xo à l'instant t o , passe à l'instant t 1 par un point de la droite
II. Pour que la commande u (t) et la trajectoire x (t) soient optimales il
est nécessaire qu'existe un vecteur fonction"" (t) == (1Po (t), 1P1 (t), . . .
. . ., "'n (t)) continu et non nul, correspondant aux fonctions u (t) et
x (t) (voir (58)) et tel que:
1 0 quel que soit t, t o t t 1 , la fonction QJt ('i' (t), x (t), t, u)
de la variable u E U atteigne en le point u == u (t) son maximum
QJt ("1' (t), x (t), t, u (t)) == cY/t ('i' (t), x (t), t);
2° soient vérifiées les relations
"'0 (t) == const 0,
t n
cIt ('\jJ (t), x (t), t) =. a/CG (x (tt u (t), t) 1PCG (t) dt.
t1 a=O
(61)
(62)
Si, par ailleurs, les grandeurs "1' (t), x (t) et u (t) vérifient le système
(57), (58) et la condition 1 0 , alors la fonction "'0 (t) de la variable test
constante, et la fonction &ft ('i' (t), x (t), t) ne peut différer que d'une
constante de l'intégrale mentionnée dans la relation (62) si bien qu'il
suffit de vérifier la relation (62) à un instant quelconque t, t o t ii ;
au lieu de (62), par exemple, il suffit de vérifier les relations
'" 0 (t 1) 0, olt ("i' (t 1), X (t 1), t 1) == 0 . ( 6 3)
B. Si nous supposons ll1aintenant que le point Xi en lequel le
point Xo est transféré par la commande u (t) est en mouvement, i.e.
X1 == Xi (t), le théorème 4 se modifie légèrement. Plus exactement,
soit u (t), t o t i 1 , une commande admissible transférant le point
1 . ( ) " l ,. t t . dX1 1 ( 1 2 n )
.1;0 en e pOInt X1 t 1 a Instan t i e SOIt -;- == q , q, . . ., q
dt t=t1
l.ln vecteur tangent à la courbe Xi (t) à l'instant t i . Après l'introduction
de la variable auxiliaire x n + 1 == t il résulte que la variété S 1 ne sera
plus une droite parallèle àl'axe x n + 1 ,mais une courbe (x (8), x; (8),. . .
. . ., x (8), 8) où 8 est un paramètre. La tangente à cette courbe en
58
PRINCIPE DU MAXIMUM
[Ch. 1
le point 8 === t 1 est définie par le vecteur (ql, q2, . . ., qn, 1) et, par
conséquent, la condition de transversalité s'écrit sous la forme
n
1JJv (t 1 ) qV + 'Pn+1 (t 1 ).1 == o.
\'=1
D'où il vient en vertu de la relation (60)
n
al! ('1' (t 1 ) , X (t 1) , t 1) === - 'i' n + 1 (t 1) == 1p v (t 1) q \' .
\'=1
Enfin, la fonction dl! ('i' (t), x (t), t) étant, en vertu de (60) et (59),
une primitive pour
n
rJ/ a (X (t; U (t), t) '\Ja (t),
<x=o
nous avons:
n t n
,di! ('Ij1 (t), x (t), t) = '\Jv (tl) qV + \ L; iJ/ a (x (t u (t), t) '\Ja (t) dt. (64)
v=1 ii <x=o
Ceci n'est autre que la relation qui doit remplacer la deuxième
égalité (62) dans le théorème 4; les relations (63) prennent: donc la
forine
n
1p 0 (t 1) 0, &fI ('i' (t 1) , X (t 1) , t 1) === 'i' v (t 1) qV . ( 65 )
\'=1
Le reste du théorèlne 4 demeure en vigueur.
C. Considérons, enfin, le problèn1e optin1al non autonome aux
extrémités libres. Limitons-nous au cas d'une extrémité droite
libre. Soit S1 (t) une variété de dimension r, mobile et dépendant
différentiablement de t. Le problème consiste à chercher une comman-
de admissible u (t), t o t t 17 telle que le point dont le Inouvement
est régi par la loi (55) avec la condition initiale x (t o ) == Xo arrive à
un instant t 1 sur la variété S 1 (t 1 ) et telle que la fonctionnelle (56)
prenne sa valeur minimale.
. Précisons tout d'abord la notion de « variété mobile ». Soit dans
un espace de dimension n + 1 engendré par les variables Xl, x 2 , . . .
. . ., x n , t, une variété .S de dimension r + 1 définie par le systèIne
d'équations
f d Xl, x 2 , ..., x:' t) = 0, }
f 2 (Xl, x 2 , ..., X , t) == 0,
.... .......
fn-r (Xl, x 2 , ..., Xn, t) == O.
On suppose plus loin que les premiers membres de ces équations
admettent des dérivées premières continues en Xl, X 2 ,. . ., X n , t
(66)
ii 7.] LE PHINCIPE DU MAXIMUM POUR LES SYSTÈMES NON AUTONOMES 59
et que le rang de la matrice fonctionnelle ( ; ) soit égal à n - r
en chaque point de la variété S:. Considérons maintenant dans l'es-
pace X engendré par les variables Xl, x 2 , . . ., x n le système d' équa-
tions
f 1 (Xl, x 2 , ..., x n , t *) == 0,
f 2 (,Tl, x 2 , ..., X n, t *) === 0,
(67)
f n - r (Xl, X 2 , ..., X n, t *) == 0,
obtenu à partir du système (66) en particularisant t == t*. En vertu
des hypothèses faites, le système (67) définit dans l'espace X une
variété continûnlent différentiable de dimension r que nous désigne-
rons par S1 (t*). En modifiant t* nous obtenons toute une famille
de yariétés SI (t) dont la position et la forme varient (d'une manière
générale) en fonction de t. D'où la notion de « variété mobile S 1 (t) ».
Supposons que u (t) et x (t) sont les solutions cherchées, et dési-
gnons par T 1 le plan tangent, en x (t 1 ), à la variété S1 (t 1 ). L'ensemble
des vecteurs (ql, q2, . . ., qn, 0) tangents en le point (x (t 1 ), t 1 )
à la variété S étant de dimension r, et la variété S:: de dimension
supérieure à r, il existe des nOlnbres ql, . . ., qn tels que le vecteur
(ql, . . ., qn, 1) soit tangent à la variété S (en le point (x (t 1 ), t 1 )).
]es nombres ql, q2, . . ., qn nous permettront justement d'écrire
]es relations (64) et (65) auxquelles doit satisfaire le vecteur'i' (t).
]nfin, comme au 6, nous dirons que le vecteur 'i' (t) ==
:== (tpo (t), "'1 (t), . . ., "'n (t)) vérifie la condition de transvesalité
il l'extrémité droite t f , si le vecteur", (t 1 ) == ('iJ1 (t 1 ), 1.P2 (t 1 ), . . .
. . ., 1.Pn (t f )) est orthogonal au plan T 1 (i.e. au plan tangent en x (t 1 )
il la variété S 1 (t 1 )). Sous ces conditions formulons 1 'hypothèse sui-
vante (qui est une généralisation du' théorème 3 au cas non auto-
nome).
Thé 0 r è m e 3*. Pour que u (t) et x (t) soient solutions du pro-
blème optimal non autonome à extrémité droite libre, il est nécessaire
qu'existe un vecteur fonction 'i' (t) continu et non nul, satisfaisant aux
conditions du théorème 4 où les relations (62), (63) sont remplacées par
les relations (64), (65), et de plus à la condition de transversalité au
[>oint t 1 .
Cette assertion découle aisément du théorème 3 après introduc-
tion de la nouvelle variable xn+l == t (cf. démonstration du théorè-
rne 4). 0 bservons que si la variété S 1 est immobile, les relations (64),
(65) coïncident avec les relations (62), (63) car dans ce cas le vecteur
(0, 0, . . ., 0, 1) est tangent à la variété Si.
D. Déduisons lnaintenant du théorème 4 une condition nécessaire
analogue pour le problème en temps optimal. Autrement dit, consi-
60
PRINCIPE DU MAXIMUM
[Ch. t
dérons pour un point dont le mouvement est régi par la loi (55) le
problème consistant à le faire passer en un temps optimal d'un état
initial donné xo à un état donné Xi. En vue de résoudre ce problème
posons dans le théorème 4 fO (x, u, t) == 1. La fonction QJ£ s'écrit.
alors sous la forme
n
c27t ('i', x, t, u) = 'lIJ0 + 'lIJvf" (x, u, t).
)'=1
Introduisant le vecteur 'lIJ == ('lIJ1, 'lIJ2' . . ., 'lIJn) et la fonction
n
H ('lIJ, x, t, u) = 'lIJv!" (x, u, t),
'\'=1
nous pouvons écrire les équations (55) et (58) (à l'exception de l' équa-
tion (58) pour i == 0 qui est désormais inutile) sous la forme du systè-
me hamiltonien
dx i a}]
([t - a1.i '
d'Pi aIl
dt == - ax i '
i == 1, 2, ..., n.
(68)
(59)
i == 1, 2, ..., n,
Pour des valeurs fixes de 'lIJ, x, t la fonction JI est une fonction
du paramètre u; soit
lW ('lIJ, x, t) == sup H ('lIJ, x, u, t).
uEU
En vertu de la relation H ('lIJ, x, t, u) == Q/{ ('i', x, t, u) - 'lIJo
il vient
M (11', x, t) == dIt ('i', x, t) - 'lIJ0,
et les conditions (61), (62) prennent maintenant la forme
H ('lIJ (t), x (t), t, u (t)) == M ('lIJ (t), x (t), t) == G//t ('i' (t), x (t), t) - '" 0 ==
t n
= J iW (x (t1 u (t), t) '\Jv (t) dt - '\Jo >
ti ,,= 1
f n
:;;> ) a/v (x (t; u (t), t) '\Jv (t) dt.
ti ,,=1
Nous avons par conséquent le théorème suivant.
Thé 0 r è m e 5. Soit u (t), t o t t i , une commande admis-
sible transférant le point représentatif de la position Xo à la position
X1, et x (t) la trajectoire correspondante (voir (55) ou (68)), telle que
x (t o ) == Xo, X (i 1 ) == X1. Pour que la commande' u (t) et la trajectoire
x (t) soient optimales (au sens du temps optimal) il est nécessaire qu'exis-
8.]
PROBLÈMES À TEMPS FIXE
61
te un vecteur fonction'" (t) == ("'i (t), "'2 (t), . . ., "'n (t» non nul et
continu, correspondant aux fonctions u (t) et x (t) (voir (69) tel que:
1 0 quel que soit t, t o t t i la fonction H (", (t), x (t), t, u)
de la variable u E U atteigne au point u == u (t) son maximum
H ('1' (t), x (t), t, u (t» == M (", (t), x (t), t); (70)
2 0 soit vérifiée la relation
t n
M (1\1 (t), x (t), t) > J a/v (x (t't u (t), t) 1\1v (t) dt. (71)
t 1 \'= 1
Si par ailleurs les grandeurs", (t), x (t) et u (t) vérifient le système (68)
(69) et la condition 1 0 , la différence entre le premier et le second membres
de la relation (71) est constante, si bien qu'il suffit de vérifier la relation
(71) seulement à un" instant qùelconque' t, t o t t f ; au lieu de
(71) il suffit par exemple de vérifier la relation
M ('1' (t f ), x (t f ), t i ) > O.
(72)
E. Si le point Xf en lequel le point Xo est transféré par la comman-
de u (t) au lieu d'être immobile est libre, i.e. si Xi == Xf (t), le théorè-
me 5 se modifie légèrement. Plus exactement soit u (t), t o t t i ,
une commande admissible transférant le point représentatif de la
position Xo à la position Xi (t f ) à l'instant t f . Posons
dXi 1 ( 1 2 n )
- dt == q , q , ..., q ·
t=t1
Alors (cf. (64), (65» les relations (71), (72) s'écrivent
n t n
M (1\1 (t), x (t), t) > 1\1v (ti) qV + J a/v (x (t u (t), t) 1\1v (t) dt, (73)
\'=1 Li \'=1
n
M ('" (t 1 ), X (t f ), t i ) > 'l'v (t f ) qv. (74)
\'=1
Le reste du théorème 5 demeure en vigueur.
Le problème à extrémité droite libre se traite d'une manière ana-
logue (cf. pages 58-59).
9 8. Problèmes à temps fixe
A. Supposons nlaintenant que nous avons à résoudre le même
problème optimal que dans le 2 (ou dans le 7, i .e. les fonctions fa
dépendent du temps), sauf que le temps de départ (de la position xo)
t 0 et le temps d' arri vée t f en Xi son t pré a 1 a b 1 e men t
don nés, i.e. le temps t i - t o est fixe. La solution de ce problème
se déd ui t aisélnen t des précédentes.
62
PRINCIPE DU MAXIMUM
[Ch. 1
Comme dans le paragraphe précédent ajoutons au système d'équa-
tions
dx i i
dt==f (x,u,t), i==1, ...,n
(7,5)
l'équation
dxn+l == 1
dt
avec la condition initiale xn+l (t o ) == t o . Alors xn+l == t et nous som-
mes amenés à résoudre le problème optimal suivant.
Etant donnés deux points (xo, t o ) et (X1, t 1 ) dans l'espace de phase
de dimension n + 1 engendré par les variables Xl, . . ., x n , Xn+l
et le système d'équations
dx i _ f i ( n+1 ) 1
- x,u,X , i==, ...,n,
dxn+1 == 1
dt
régissant le mouvement du point représentatif; on demande de trouver
une commande u (t) transférant ce point de la position (xo, t o ) à l'instant
t o à la position (X1, t 1 ) et minimisant la fonctionnelle
if
J = J fO (x, u, x n +1) dt. (76)
to
Dans ce cas, l'instant t 1 d'arrivée en le point (x 1 , t 1 ) peut ne pas être
considéré comme fixe (car en vertu de la relation xn+l == t le point
représentatif ne peut arriver en (X1, t 1 ) qu'à l'instant t 1 ) de sorte qu'on
peut appliquer le théorème 1.
En vertu du théorème 1, pour résoudre ce problème nous deyons
introduire la variable x O , former la fonction
n
Q7t* ==' Q7C + 'Pn+1 === 'Pa/a (x, u, xn+1) + lPn+1
a=O
et étudier le système d'équations suivantes par rapport aux variables
auxiliaires:
d'Pi
dt
d1Pn+1
dt
f)Qf(} . 0 1 }
- f)x i ' l == , ,..., n,
8Qf(}
-fit · )
(77)
Les relations (16), (17) du théorème (1) s'écrivent ll1aintenant
QJt (11' (t), x (t), t, u (t)) + 'Pn+1 (t) == &1t ('i' (t), x (t), t) + 'Vn+1 (t),
'Po (t o ) 0, 0ft ('i' (t), x (t), t) + 'P n +1 (t) = 0,
8.1
PROBLÈMES À TEMPS FIXE
63
ou encore
QJt ('i' (t), x (t), t, u (t)) == QI!! ('i' (t), x (t), t), 'Po (t O ) 0, (78)
dit ('i' (t), x (t), t) + 'lPn+1 (t) == O. (79)
Si toutes les grandeurs 'Po (t), 'Pi (t), . . ., 'Pn (t) s'annulaient à un
instant t, on aurait QJ{; ('i' (t), x (t), t, u (t)) == 0, d'où 'Pn+1 (t) == 0
(voir (78), (79)), ce qui est impossible. Par conséquent "-P 0 (t), . . .
. . ., 1pn (t) est une solution non n u Il e dll système (77). Ce qui
permet de négliger la fonction 'Pn+i (t) et la relation (79). Nous obte-
nons de ce fait le théorème suivant.
Thé 0 r è m e 6. Soient u (t), t o t t 17 une commande admis-
sible transférant le point représentatif de la position Xo à la position
Xi et x (t) la trajectoire correspondante (voir (75)) telle que x (t o ) == Xo,.
X (t i ) == Xi (les instants t o et ti-sont fixes). Pour que u (t) soit solution
du problème optimal à temps fixe posé, il est nécessaire qu'existe un
vecteur fonction 'i' (t) == ('Po (t), 'Pi (t), . . ., 1Pn (t)) non nul et
continu correspondant aux fonctions u (t) et x (t) (voir (77)) tel que:
1° quel que soit t, t o t t i la fonction QJB ('i' (t), x (t), t, u)
de la variable u E U atteigne au point u == u (t) son ma.ximum
&t ('i' (t), x (t), t, u (t)) == Q;/t ('i' (t), x (t), t);
2° la fonction "-p 0 (t) soit non positive (ce qu'il suffit de vérifier à un
instant quelconque t de l'intervalle t o t t i puisque, d'après (77),.
"-Po == const).
Soulignons que ce théorème résout le problème à temps fixe dans
la même mesure què le théorème 1 résout le problème à temps non
fixe. La réduction du nombre de conditions (plus exactement, l'ab-
sence par rapport au théorème 1 de la condition &If ('i' (t i ), x (t i )) ==
=== 0) est compensée ici par le fait que le nombre de paramètres incon-
nus diminue d'un, car le temps t i de passage de la trajectoire par le
point Xi est désormais don n é.
B. Considérons maintenant le problème à temps fixe et à extré-
Irrités Xo et Xi libres. Désignons par S 0 et Si les variétés (dans l' espa-
ee engendré par Xl, . . ., x n ) dans lesquelles doivent être choisis.
les points extrêmes Xo et Xi. Nous sommes alors amenés à résoudre le
problème aux extrémités libres dans l'espace engendré par les va-
riables Xl, x 2 , . . ., X n , x n + l . Les extrémités (xo, t o ) et (Xi' t i ) de
la trajectoire cherchée doivent précisément se trouver respectivement
sur les variétés S 0 et S1, où Si est constituée des points de la forme
(x, ti), x E Sb i == 0, 1. Considérant les conditions de transver-
salité (théorème 3) pour les variétés S 0 ' Si et négligeant comme
précédemment la coordonnée xn+l, nous constatons que le théorème 3
reste valable (dans la même formulation) et donne la solution du
problème à extrémités libres lorsque le temps est fixé. Les théorènles
64
PRINCIPE DU MAXIMUM
[Ch. 1
1 et 3 s'appliquent par conséquent au problème à temps fixe, si dans
le théorèm9 1 on néglige la deuxième des relations (17).
Voyons en particulier le cas où (dans le problème à temps fixe)
l'extrémité droite est entièrement libre.
Autrement dit, considérons le problème: trouver une commande
admissible u (t), t o t t 1 , telle que la trajec toire correspondante
(voir (75)) partant de la position initiale Xo à l'instant t o minimise
la fonctionnelle (76); l'instant t 1 e'St fixé, le point x (t 1 ) peut être
quelconque. C'est un problème à extrémité droite libre où la variété
S t coïncide avec l'espace X tout entier, engendré par les variables
Xl, x 2 , . . ., x n . Par conséquent t 0 u t vecteur de cet espace est
tangent à la variété Sl et la condition de transversalité nous donne
"'1 (t 1 ) = '4'2 (t 1 ) = · · · = '-Pn (t 1 ) = O. D'où il résulte que '4'0 =1= 0,
et nous pouvons donc poser '4'0 == -1. Ainsi '4' (t 1 ) == (-1, . . ., 0)
et nous obtenons le théorème suivant.
Thé 0 r è fi e 7. Pour qu'une commande admissible u (t), t o
t t 1 , et la trajectoire correspondante x (t) (voir (75)) soient solutions
du problème optimal (75), (76) à extrémité gauche fixe Xo et extrémité
droite libre (t o et t 1 étant donnés), il est nécessaire qu'existe un vecteur
fonction", (t) == (11'0 (t), 11'1 (t), . . ., '4'n (t)) non nul et continu, cor-
respondant aux fonctions u (t) et x (t) (voir (77)) tel que:
1 0 quel que soit t, t o t t 1 , la fonction aJ8 ('" (t), x (t), t, u)
de la variable u E U atteigne au point u == u (t) son maximum
0Jt (", (t), x (t), t, u (t)) == &It (", (t), x (t), t);
2° '1' (t 1 ) = (-1,0, . . ., 0).
9 9. Lien entre le principe du maximum et la méthode
de programmation dynamique . '.
Dans ce paragraphe nous allons brièvement nous pencher sur le
lien existant entre le principe du maximum et la méthode de pro-
grammation dynamique de R. Bellman.
La méthode de programmation dynamique fut élaborée pour
les besoins de la commande optimale de processus d'un caractère
plus général que les processus décrits par les systèmes d'équations
différentielles. Aussi la méthode de programmation dynamique
revêt-elle un caractère plus universel que le principe du maximum.
Néanmoins, à la différence de ce dernier, cette méthode n'a pas été
démontrée avec la rigueur voulue dans les cas où l'on pourrait en
user comme un précieux instrument euristique.
Il est naturellement intéressant de savoir si la méthode de pro-
gralnmation dynamique s'applique au problème optimal formulé
dans le 2. La démonstration de la méthode de programmation dyna-
mique donnée par Bellman suppose qu'aux candi tions naturelles
du problème (voir notre théorème 1) s'ajoute une condition fonda-
9.]
MÉTHODE DE PROGRAMMATION DYNAMIQUE
65
rnentale: la dérivabilité de la fonction û) (x) définie plus loin. Cette
supposition ne découle pas de la position du problème, elle revêt
plutôt un caractère de restriction, restriction qui comme nous le
verrons plus bas n'est pas remplie même dans les cas les plus simples.
Cette supposition faite, la méthode de programmation dynamique
ramène à une équation aux dérivées partielles que nous appellerons
équation de Hellman. Cette équation (sous certaines conditions sup-
plémentaires) est. équivalente au système hamiltonien (14), (15)
et à la condition du maximum (16), (17).
Nous allons exposer ici la méthode de programmation dynamique
et montrer son lien avec le principe du maximum. Pour simplifier
les choses, considérons uniquement le problème en temps optimal.
Fixons un point Xi de l'espace X et soient u (t), t o t t 17 une
commande optimale transférant (d'après la loi (5)) le point repré-
sentatif d'une position Xo E X à la position Xi' et X (t) la trajectoire
optimale correspondante. Désignons par T (xo) le temps de passage
optimal t i - t o du point Xo au point Xi. (Le point Xi étant fixe, il ne
figure pas dans la désignation du temps de passage.) Par consé-
quent, la fonction T (xo) est définie sur l'ensemble Q de tous les
points de l'espace X d'où est possible un passage optimal en Xi.
La condition auxiliaire utilisée habituellement pour démontrer le prin-
cipe de programmation dynamique (condition que nous allons aussi
adopter) est que l'ensemble Q soit ouvert dans l'espace X et que la fonc-
tion T (x) admette des dérivées partielles continues par rapport aux coor-
données du point x.
Au lieu de la fonction T (x) on introduit généralement la fonction
ù) (x) = - T (x).
Puisque x (t), t o t th est une trajectoire optimale et toute
portion de trajectoire est elle-même une trajectoire optimale quel
que soit t, t o t t i , on a
ù) (x (t» = - T (xo) + t - t o .
Donc,
n
n
"" 8ro(x(t)) ta (x (t), u (t)) = "" 8ro (x (t)) dxa (t) _ dro (x (t)) -1 (80)
L.J ôx a L.J axa dt - dt -.
a=1 a=t
Soit maintenant un point quelconque v. du domaine de commande
U. Considérons un point représentatif' se déplaçant de la position
x (t) sous l'action d'une commande constante égale à v. Au bout
d'un intervalle de temps infiniment petit dt > 0, ce point occupera
la position x (t) + dx où le vecteur' dx = (dx 1 , . . ., dx n ) est tiré
des relations
dx i = fi (x (t), v) dt; i = 1, . . ., n.
(81)
5-01339
66
PRINCIPE DU MAXIMUM
[Ch. 1
Si maintenant du point x (t) + dx nous nous rendons d'une façon
optimale en Xi' il nous faudra un temps égal à T (x (t) + dx). Donc t
le temps global mis pour' aller optimalement du point x (t) au point
Xi est égal à T (x (t) + dx) + dt. Ce temps ne peut être infé-
rieur au temps de passage optimal T (x (t)), i.e. a lieu la relation
T (x (t) + dx) + dt T (x (t)), ou ce qui est équivalent
û) (x (t) + dx) - ù) (x (t)) dt.
En vertu de (81) on peut encore écrire
n
ôm (x (t)) f a ( X ( t ) V ) dt dt
.L.J ôxa ,. ,
a=l
ou bien
n
oro (x dt)) j'J' (x (t), v) 1, v EU.
(}x
a=l
Les relations (80) et (82) montrent que
(82)
n
sup ôm(x(t)) ja(x(t), v)==1,
vEU axa
a=1
de plus, la borne supérieure est atteinte pour v == u (t). Puisque par
chaque point x E Q passe une trajectoire optimale aboutissant au
point Xi' nous arrivons à la conclusion que la fonction ù) (x) vérifie
dans le domaine Q l'équation suivante, non classique, aux dérivées par-
tielles que nous appellerons équation de Bellman:
n
sup oro (x) fa (x, u) = 1; (83)
uEU dx a
a=l
de plus la borne supérieure est atteinte pour un certain u E U (précisé-
ment pour la valeur de la commande optimale au point x) et la fonction
û) (x) est non positive et ne s'annule qu'au point Xi.
Ceci n'est autre que le principe de la programmation dynamique
appliqué au problème considéré.
Nous allons maintenant montrer comment du principe de la
programmation dynamique se déduit le principe du maximum;
nous supposerons à cet effet que la fonction û) (x) est deux fois con-
tinûment dérivable. Par suite, la fonction
n
g (x, u) = o:x) fa (x, u)
cx=l
(84)
(voir (83)) admet des dérivées premières continues par rapport
à Xl, . . ., x n . Du principe de programmation dynamique il vient
9.]
MÉTHODE DE PROGRAMMATION DYNAMIQUE
67
aussitôt (voir (80) et (83)) que si u (t) est une commande optimale
transférant le point représentatif de Xo en Xi' et que X (t) soit la trajec-
toire correspondante, alors pour t, t o t t 1 , fixe, la fonction
g (x, u (t» de la variable X E X atteint son maximum (qui est égal
à 1) au point x = x (t): Il s'ensuit que
âg (x u (t» = 0, i = 1, ..., n, to k;;;,tl'
En dérivant (84), il vient
n
)l a 2 m (x ()) fa (x (t), u (t)) +
LJ ôxaôx1.
a=l
n
+ â(fJâJt)) . â/a (x ; u (t)) = 0, i = 1, ..., n; (85)
a=1
ces relationrs sont vérifiées le long de toute trajectoire optimale.
Nous avons plus loin
n
a 2 m (x ()) fa (x (t), u (t)) ==
LJ ôx a ax 1
(.(=1
n
== ( am (x .(t)) ) dxa (t) == ( am (x .(t») )
LJ axa ax 1 dt dt ax 1
a=1
et les relations (85) prennent la forme
n
( am (x (t)) ) = _ aja (x (t), u (t») . am (x (t))
dt axi LJ axi axa ' i == 1, ..., n.
a=1
Ainsi, le long de chaque trajectoire optimale les grandeurs
1101. ( t ) = am (x5 t » . 1
'fl ax 1 ' l == , ..., n
(6)
vérifient le système linéaire d'équations différentielles
n
d'i'i (t) == _ aja (x (t)., u (t» 1101 (t) 1
dt L.J ax 1 'fa, i = , ..., n.
a=1
(87)
Par ailleurs, l'équation de Bellman (83) s'écrit, en vertu de (80),
sous la forme
n n
Li 1pa(t)ja(x(t), u(t))=sup Li 1Pa(t)ja(x(t), u)==1. (88)
a=1 U(U a=1
5*
68
PRINCIPE DU MAXIMUM
[Ch. 1
Les relations (87) et (88) coïncident avec le principe du maximum,
quant à la relation (86), elle lie explicitement les grandeurs '\Pi (t)
à la fonction ro(x). Soulignons encore, ainsi qu'il résulte de (88),
que les mouvements optimaux peuvent toujours être réalisés de
telle sorte que le long des trajectoires optimales ait lieu l'égalité
H ('1' (t), x (t), u (t)) = 1. (89)
Rappelons que toutes ces conclusions n'ont de valeur que si la fonc-
tion ffi (x) est deux fois continûment dérivable. Sans cette condition
supplémentaire, la démonstration de la relation (89) n'a pas de sens.
Remarquons que dans tous les exemples traités dans le 5, la
fonction (ù (x) n'a d met pas d e d é r i v é e s pre m i ère s
aux points situés sur les lignes de commutation (ce que l'on établit
directement par des calculs). Etant donné que c h a que trajectoire
optimale passe pendant un certain intervalle de temps le long de la
ligne de commutation, la condition de dérivabilité de la fonction
(ù (x) n'est remplie sur aucune trajectoire. Et par conséquent même
dans les cas les plus simples, les conditions nécessaires à l'établis-
.sement de l'équation de Bellman ne sont pas remplies.
CHAPITRE 2
Démonstration du principe
du maximum
S 10. Commandes admissibles
Nous allons donner ici une définition exacte de la classe des com-
lnandes admissibles (cf. 9 1) et décrire les plus importantes de ces
classes. Le domaine de commande U sera représenté par un ensemble
arbitraire d'un espace vectoriel Er *) de dimension r.
Nous allons étudier ici non seulement des commandes continues
par morceaux, mais des commandes bien plus générales. Une com-
]nande u (t), t o t t 1 (i.e. une fonction u (t) à valeurs dans le
domaine de commande U) est mesurable si pour tout ensemble ou-
vert 0 c Er' l'ensemble des valeurs de t telles que u (t) E 0 est
mesurable (au sens de la mesure de Lebesgue) sur l'intervalle t o
t t 1 . La borne est comprise dans le sens habituel, i.e. une com-
mande u (t), t o t t b est bornée si l'ensemble des points u (t),
t o t t b admet dans l'espace Er une a d h é r e n c e c 0 m -
p a c t e.
Dans la suite nous supposerons qu'a été fait choix d'une classe
de commandes D; on appellera admissibles les commandes apparte-
nant à cette classe. Tout ce qu'on demande à la classe D, c'est qu' el-
le satisfasse aux trois conditions suivantes:
1) Les commandes u (t), t o t t 1 , de la classe D (i.e. les com-
mandes admissibles) sont mesurables et bornées.
2) Si u (t), t o < t t 1 , est une commande admissible, v up. point
arbitraire de l'ensemble U et. t'et t" deux nombres tels que t
t' t" t 1 , alors la commande U1 (t), t o t t 1 , définie par
la formule
( ) _ { V pour t' < t t",
Ut t - , "
u (t) pour t o t t et t < t t 1 ,
\
est aussi admissible.
3) Si l'intervalle t o t t 1 est partagé en un nombre fini
d'eintervalles partiels sur lesquels la commande u (t) est admissible,
*) Les raisonnements cités plus bas valent intégralement pour le cas où U
est un sous-ensemble quelconque d'un certain espace topologique de Hausdorff
à base dénombrable. Une légère modification de la démonstration permet de
lever la condition d'existence d'une base dénombrable. Dans le texte nous nous
limiterons toutefois au cas, le plus simpe et suffisant parfaitement aux applica-
tions, d'un sous-ensemble d'un espace vectoriel de dimension r.
70.
DÉMONSTRATION DU PRINCIPE DU MAXIMUM
(Ch. 2
alors cette commande est admissible sur l'intervalle t o t t 1 tout
entier. Une commande adqIissible sur un intervalle partiel est,admis-
sible aussi. Une commande déduite d'une commande adm.issible
U (t), t o t t 1 , par une translation du temps (i.e. la commande
Ut (t) = u (t - ex), t o + ex t t 1 + ex) est aussi admissible.
Comme classe de commandes admissibles 0 n peu t par exemple
prendre l'ensemble de toutes les commandes mes u rab 1 e s et
b 0 r née s. Cette classe de commandes admissibles contient, de
toute évidence, une autre classe quelconque de conlmandes admis-
sibles, aussi la désignerons-nous par le symbole Dmax.
On pourrait encore prendre l'ensemble de toutes les commandes
con t i nue spa r m 0 r c eau x dont il a été question dans
le chapitre 1. '
Enfin comme classe de commandes admissibles nous avons l'en-
semble des commandes con s tan tes par m 0 r c eau x (i.e.
des cQmmandes u (t), t o t t 1 , telles que l'intervalle to', t t 1
puisse être divisé en un nombre fini d'intervalles partiels sur chacun
desquels)a commande u (t) est constante). Cette classe de commandes
admissibles étant contenue dans une classe quelconque de commandes
admiss'ibles par suite des conditions 2) et 3), nous la désignerons
par le symbole D min .
Dans toute la suite de ce chapitre nous supposerons, sans le
spécifier, qu'a été fixée une fois pour toute une classe de commandes
admissibles que nous désignerons par le symbole D.
L'étude des commandes mesurables (et pas seulement des com-
mandes continues par morceaux) n'est pas dictée par le souci d'une
plus grande généralisation mathématique. En fait, dans le ,chapi-
tre 3, pour démontrer le très important thé 0 r è nl e d'e x i s-
t e n c e, nous serons forcés de faire appel aux commandes nlesu-
rables (bien que dans l'énoncé définitif du théorème ne figurent que
des commandes constantes par morceaux).
Soulignons quelques propriétés, importantes pour la suite, des
fonctions mesurables. Soit u (t) une fonction mesurable quelconque
définie sur l'intervalle a < t < b et à valeurs dans le domaine de
commande U: Nous dirons que le point e de l'intervalle a < t < b
est un point régulier pour la fonction u (t), si, quel que soit le voi-
sinage 0 c U du point u (8), est vérifiée la relation
1 - mes (u- 1 (0) nI) 1
lm = ,
mes 1..0 mes 1
OÙ u- 1 (0) désigne l'ensemble des points t de l'intervalle a < t < b
tels que u (t) E 0, l un intervalle quelconque contenant le point 8,
et mes la mesure lebesguienne d'un ensemble. Il est, éyident que
tou t P 0 i n t d e con t i nui t é de la fonction' il (t) est un
point .régulier de cette fonction (car si 1 'inter,alle l renfermant le
point e est suffisamment petit, alors le u- 1 (0)). Si donc la fonc-
10.]
COMMANDES ADMISSIBLES
71
t ion u (t) est continue par morceaux, alors tous les points de l'inter-
valle a < t < b, sauf un nombre fini d'entre eux, sont des points
réguliers pour la fonction u (t). Il s'avère *) que si u (t) est une fonc-
tion lnesurable quelconque, l'ensemble de tous les points réguliers
admet une mesure complète sur l'intervalle a < t < b, Ï.e. tous les
points presque de l'intervalle a < t < b sont des points réguliers pour
la fonction u (t).
Soit ensuite g (t, u) une fonction réelle continue du couple de
variables t E (a, b), u E U et u (t), a < t < b, une fonction mesu-
rable b 0 r née à valeurs dans U. Si 8 est un point régulier pour la
fonction u (t), on a alors
8+q8
I g ( t, u ( t)) dt = f, (q - p) g (e, u (e» + 0 (f,), ( 1 )
9+p£
où p et q sont des nombres réels arbitraires, B un infiniment petit
positif et 0 (8) un infiniment petit d'ordre supérieur par rapport
à 8, Ï.e. lim 0 (ë) ==.0; l'intégrale est prise au sens de Lebesgue.
£-0 ë
La relation (1) se déduit aisément de la définition du point régu-
lier. Soulignons que si la fonction g est de plus continue en le para-
mètre v appartenant à un ensemble c 0 m p a c t N (par exemple
à un ensemble borné fermé d'un espace vectoriel de dimension finie),
alors la formule (1) reste valable:
9+q8
J g (t, u (t), 'V) dt = f, (q - p) g (e, u (e), v) + 0 (f" v), v EN, (2)
8+p£
la quantité 0 (8, v) étant uni for m é m e'n't en v d'un ordre de
petitesse supérieur par rapport à B, Le. 0 (ë, v) tend uniformément en
ë
'V E lV vers 0 lorsque B -+ o. .
Faisons encore quelques remarques sùr les équations différen-
tielles à seconds membres mesurables **). Soit le système
dz i _ h i ( lm ) 1 2
dt - Z , ..., z , t, u, i == , ,..., m.
(3)
Les seconds membres des équations (3) sont continus en l' ensem-
ble des variables Zl, Z2, . . ., zm, t, u 'et- continûment dérivables par
*) Cette assertion découle aisément de ce que-presque tous les points d'un
ensemble mesurable arbitraire sont des points de densité (voir, par exemple,
F. Ris s et B. S e k e 1 f a 1 v i d i - Nad « Conférences sur l'analyse fonc-
tionnelle» (en russe), Moscou 1954, p. 21; 1. Nat ans 0 n « La théorie des
fonctions d'une variable réelle )} (en russe), Moscou 1957, p. 285.
**) Voir C. Car a the 0 d 0 l' Y « Vorlesungen über reelle Funktionen »,
Leipzig 1927, p. 665'; D. S'a n son e t «Equatiç>:Q. différentielles ordinaires )}
(en russe), Moscou 1954, p. 120.
72
DÉIV[ONSTRATION DU PRINCIPE DU MAXIMUM
[Ch. 2
rapport à Zl, Z2, . . ., zm. Soit u (t) une fonction mesurable bornée
quelconque, définie sur l'intervalle t o :::;; t :::;; t 1 et à valeurs dans
U. Nous allons considérer des fonctions a b sol ume n t con -
t i nue s Zl (t), . . ., zm (t) vérifiant presque partout sur une cer-
taine partie de l'intervalle t o t t 1 les relations
dz;/t) = hi (Zl (t), ..., zm (t), t, u (t)), i = 1, 2, ..., m.
Nous appellerons sol u t ion du système (3), cor r e s p 0 n -
dan t à la commande u (t), chacun des systèmes de fonctions
Zl (t), . . ., zm (t). Cette définition des solutions du système (3)
ne modifie pas (pour une commande u (t) donnée arbitrairement) les
princi paux théorèmes de la théorie des équations différentielles et
notamment le théorème d'existence et d'unicité des solutions. D'une
façon générale, la solution du système (3) n' est pas d é f i -
nie sur l'i n ter v a Il e t 0 u t e n t i e r t o t t 1 sur
lequel est donnée la commande u (t) (et, par conséquent, où sont
donnés les seconds membres du système (3)). Cependant, si le
système (3) est 1 i n é air e en Zl, . . ., zm, toute solution de ce
système est définie sur l'intervalle t o :::;; t t 1 t 0 u t e n t i e r
de définition de la commande u (t).
Lorsque les seconds membres du système (3) dépendent de
plus continûment d'un certain paramètre 11, alors ont lieu les
théorèmes ordinaires de dépendance continue des solutions par
rapport aux paramètres. En particulier, les solutions du système
(3) sont continues par rapport aux yaleurs initiales. Par ailleurs,
les « accroissements» des fonctions z pour une petite variation des
valeurs initiales satisfont à un s y s t è m e ordinaire d'é qua -
t ion s a u x var i a t ion s (cf. 12).
S 11. Formulation du principe du maximum
pour une classe quelconque de commandes admissibles
Comme dans ,le chapitre précédent nous allons considérer le
système d' équa tions différentielles
dx i f i ( l 2 n l r ) - f i ( ) 1 2 (4)
dt = x , x , ..., x , u , ..., u = x, u, i = , ,..., n,
ou, sous une forme vectorielle,
d:e
dt =1 (x, u).
(5)
Les fonctions
fi (Xl, x 2 , ..., x n , u) et
ôfi (xl, :e 2 , . . ., :en, u)
ôx;
11.]
FORMULATION DU PRINCIPE DU MAXIMUM
73
(i, j == 1, 2, ., n) sont supposées données et continues sur le pro-
duit direct X X U où U est l'adhérence de l'ensemble U dans l'es-
pace Er.
Comme dans le chapitre précédent introduisons la fonctionnelle-
in tégrale
i1
J = 1 JO (x (t), u (t» dt
to
(6)
où /0 satisfait aux mêmes conditions que les fonctions fi, i
== 1, 2, . . ., n. Posons le problème suivant: parmi toutes les com-
-ntandes admissibles u == u (t) transférant le point représentatif de la.
position Xo à la position Xi trouver celle qui minimise la fonctionnelle (6)
(t o et t i ne sont pas donnés à l'avance). Nous conserverons dans ce.
chapitre aussi les termes de « commande optimale» et de « trajec-
toire optimale ».
Textuellement, comme dans le chapitre 1, le problème optimal à
résoudre se formule de la manière équivalente suivante.
Etant donnés dans l'espace de phase de dimension n + 1, engendré
par les variables x O , Xl, . . ., x n , un point xo === (0, xo) et une droite
n parallèle à l'axe XO et passant par le point (0, xo). Parmi toutes les'
commandes admissibles u == u (t) telles que la solution correspondante
x (t) du systeme
dx i f i ( ln )
dt == x , ..., x , u ,
i === 0, 1, ..., n
(7}
avec la condition initiale x (t o ) === xo coupe la droite Il, trouver celle-
qui minimise la coordonnée X O du point d'intersection avec la droite n.
En vue de fprmuler le principe du maximum, introduisons comme-
dans le chapitre 1le système d'équations
n
d'Pi == _ a/a (x, u) I)hl'Y , i == 0 , l ' ... , n
dt Lj axi
a=O
(8)
pour les inconnues auxiliaires 'Po, 'Pi' . . ., 'Pn et la fonction
n
o7t ('1', x, u) == ('1', f (x, u)) = 'Pa fa (x, U),
a=O
qui permet d'écrire les équations (7) et (8) sous la forme du système-
hamiltonien
dx i aQfe
dt - a'Pi '
d'Pi aQfe
dt - - ax i '
i=O, 1, ..., n,
i = 0, 1, ..., n.
(9}
(10}
74
DÉMONSTRATION DU PRINCIPE DU MAXIMUM
[Ch. 2
En se donnant une commande arbitraire u (t), t o t t 17 de la
classe D (Le. admissible) et une condition initiale x (t o ) == Xo, on
peut trouver la trajectoire x (t) == (X O (t), Xl (t), . . ., x n (t)) cor-
respondante (i. e . satisfaisant au système (9)). Supposons qu'elle
soit définie sur l'intervalle t o t t 1 tout entier. En portant alors
les fonctions u (t) et x (t) dans les seconds membres du système
(10), nous obtenons un système linéaire en 1po, 1p1, . · ., 1pn dont les
-coefficients sont définis et continus sur l'intervalle t o t t i tout
entier . Nous dirons que toute solution
\)' (t) == (1po (t), 1pi (t), ... ., 1Pn (t))
de ce système (celle-ci est aussi définie sur l'intervalle t o t t1
tout entier) est une solution du système (10) correspondant aux fonc-
tions u (t) et x (t). Soulignons que les vecteurs fonctions x (t) et
11' (t) sont absolument continus (comme étant les solutions des systè-
mes d' équa ti ons différentielles).
Pour des valeurs fixes (constantes) de 'i' et x, la fonction QJt de-
vient une fonction du paramètre u EU; posons
ait (\)', x) = sup o7t (\)', x, u).
uEU
Une égalité vraie pre s que par t 0 u t sera représentée par
le signe (==). Autrement dit, si CPi (t) et CP2 (t) sont deux fonctions
de la variable t définies sur l'intervalle t o -< t -< t 1 , l'écriture
CPl (t) (==) CP2 (t)
signifiera que les fonctions coïncident presque partout.
Le but du présent chapitre est la démonstration du principe du
maximum (théorème 8) et des conditions de transversalité.
Thé 0 r è m e 8. Soit u (t), t o < t t 1 , une commande admis-
sible telle que la trajectoire correspondante x (t) (voir (9)) issue à l'ins-
tant t o du point xo, soit définie sur l'intervalle t o t t 1 tout en-
tier et passe à l'instant t 1 par un point de la droite II. Pour que soient
optimales la commande u (t) et la trajectoire x (t) il est nécessaire qu'e-
xiste un vecteur fonction non nul et absolument continu \)' (t) ==
== (11'0 (t), 11'1 (t), . · ., 1Pn (t)) correspondant aux fonctions u (t) et
x (t) (voir (10)) tel que
1 0 la fonction QJ8 (\)' (t), x (t), u) de la variable u E U atteigne son
maximum
QJ8 (\)' (t), x (t), u (t)) (==) oJIt (\)' (t), x (t)) (11)
au point u == u (t) presque partout sur l'intervalle t o t t 1 ;
2 0 à l'instant final t 1 aient lieu les relations
, ,
1po (t 1 ) -< 0, olt (\)' (t 1 ), x (tl)) == o. (12)
11.]
FORMULATION DU PRINCIPE DU MAXIMUM
75
k')i par ailleurs les grandeurs'i' (t), x (t) et u (t) satisfont au système
(9), (10) et à la condition 1°, alors les fonctions'lp.o (t) et cYlt ('i' (t), x (t))
de la variable t sont constantes de sorte qu'on peut vérifier les relations
.(12) pas forcément à l'instant t 1 , mais à un instant quelconque t de
l'intervalle t o t t 1 .
Le théorème 8 reprend presque textuellement le théorème 1 for-
Inulé au chapitre 1. La seule différence c'est que le théorème 8 est
valable pour t 0 u t e classe D de commandes admissibles tandis que
le théorème 1 n'est valable que pour la classe des commandes con-
tinues par morceaux. Par ailleurs, la condition de maxinium (11)
Il'est satisfaite que pre s que par t 0 u t, alors que dans le
théorème 1 elle est partout remplie (voir égalité (16), chapitre 1).
Il est aisé de comprendre que le théorème 1 découle du théorème 8.
i\.ppliquons en effet le théorème 8 au cas où la classe D coïncide avec
la classe des commandes continues par morceaux. Désignons par N
l'ensemble des points de l'intervalle t o t t 1 en lesquels est
-satisfaite la condition de maximum (11). Autrement dit, si t E N,
on a
6Je ('i' (t), x (t), u (t)) QJe ('1' (t), x (t), v) (13)
quel que soit v E U. L'ensemble N admettant sur l'intervalle t o
t t 1 une mesure complète, et la commande u (t) appartenant à D,
i.e. est continue aux extrémités de l'intervalle t o t t 1 et à
g a u che de tout point de discontinuité (voir en page 12 la con-
vention sur les valeurs aux points de discontinuité), il existe pour
"tout point 't' de l'intervalle t o t t1 une suite de points Ti, T2,
.. · ., 't'Tu · .. appartenant à N, convergeant vers T, telle que
lim u (Th) = u (T). En vertu de (13) nous avons
h-+ 00
QJt ('i' (Th), x (Th), u (Th)) QJ8 ('i' (Th), x (Th)' v), V E U.
.QJe étant une fonction continue en ses arguments 'i', x et u et les fonc-
iions 'i' (t) et x (t) étant continues, on a
lim cl7e ('1' ('th), x (Th), v) = QJ8 ('i' ('t), x ('t), v).
hoo
])'une façon analogue, on a
lim $t ('i' ('th), x ('th), u ('th)) = 6Je ('1' ('t), x (T), U (T)
hoo
(puisque lim u (Th) = u (T)). Comparant les trois dernières rela-
h-.. 00
tions, on a
QJ8 ('i' (T), x (T), U (1')) QI8 ('i' (1'), x ('t), v)
(quel que soit v EU), i.e4
QJ8 ('i' (1'), X (1'), U (T)) = al/t ('1' ('t), X (1')).
76
DÉMONSTRATION DU PRINCIPE DU MAXIMUM
[Ch. 2'
Donc, la condition de maximum est remplie en t 0 u t point 't de
l'intervalle t o t t 1 . Ce qui démontre le théorème 1 (à condition
que soit vrai le théorème 8).
Le théorème 8 sera démontré dans les quatre paragraphes suivants.
9 12. Système d'équations aux variations
et son système adjoint
Dans les démonstrations qui vont suivre nous rencontrerons sou-
vent un paramètre positif 8, que nous considérerons comme étant
un infiniment petit du premier ordre. Les grandeurs aussi bien vec-
torielles que scalaires, d'un ordre de petitesse su périeur (en 8) se-
ront désignées par le symbole 0 (8) (Le. lim 0(8) = 0). Pour dési-
BO 8
gner les grandeurs d'un ordre de petitesse supérieur par rapport à 8,
nous utiliserons 1 e m ê m e symbole 0 (8) (de sorte que par exem-
ple 0 (8) + 0 (8) = 0 (8)).
Soit u (t) une commande admissible quelconque définie sur l'in-
tervalle t o t t 1 et x (t) = (XO (t), Xl (t), . . ., x n (t)) = (X O (t)?
X (t)) - la solution correspondante du système (7) avec la condition
initiale x (t o ) = xo. Désignons par y (t) la solution correspondant à
la même commande u (t) et issue (au même instant t o ) d'un point.
voisin de Xo
Yo = xo + 80 + 0 (8)
(14)
où o est un vecteur constant (Le. ne dépendant pas du paramètre
8) de l'espace X. La solution y (t) est de la forme
y (t) = x (t) + 8ÔX (t) + 0 (8),
(15)
où ôx (t) = (ÔX O (t), Ôx 1 (t), . . ., ôx n (t)) est un vecteur ne dépen-
dant pas de 8, défini par le système suivant d'é qua t ion s a u x
variations:
n
d (1 Xi ) = aji (x (t), u (t» ôxa., i = 0, 1, ..., n, (16)
t axa
a=O
a vec la condition initiale
ôx (t o ) = o.
(Dans le deuxième membre de la relation (16) la sommation pourrait
s'opérer de 1 à n, car les fonctions fi (x, u) ne dépendent pas de xo.)
Rem a r que 1. Dans la formule (15) la grandeur 0 (8) dépend
certes aussi de t, i.e. est de la forme 0 (8, t). Elle possède cependant
uni for m é men t en t un ordre de petitesse supérieur par rap-
12.]
SYSTÈME D"ÉQUATIONS AUX VARIATIONS
77
port à 8, i.e. le rapport 0 (8, t) tend vers 0 uniformément en t E [t o , t 1 ]
8
lorsque 8 -+ O.
Rem a r que 2. Supposons que dans la formule (14) les gran-
.deurs So et 0 (8) dépen'dent continûment d'un paramètre v variant
dans un ensemble c 0 m p a c t N (i.e. sont de la forme So (v),
.() (e, v)) et, de plus, que la grandeur 0 (8, v) soit, uni for ID é -
nl e n t en v E N, d'un ordre de petitesse supérieur par rapport à 8
(Le. que le rapport 0 <:' 'V) tend uniformément en 'V ENvers 0 lorsque
-+ 0). La formule (15) reste alors vraie et de plus ôx (t) dépend dé-
sormais de v E N, quant à 0 (e) qui dépend aussi de v, i.e. est de la
forme 0 (8, t, v), elle possède uni for ID é men t en v E N et
t E [t o , t l ] un ordre de petitesse supérieur par rapport à 8 (Le.
() (e, t, 'V), -+ 0 uniformément en t et v lorsque 8 -+ 0).
8
Les équations (16) permettent d'associer à chaque vecteur So =
== ôx (t o ) une famille de vecteurs St = ôx (t) (pour t > t o ). Nous
conviendrons de dire que St = ÔX (t) est un vecteur 1 i é issu du
point x (t). Donc, chaque vecteur So, donné au point Xo définit un
champ de vecteurs {St} le long de la trajectoire x (t). Nous dirons
que les vecteurs de ce champ se déduisent du vecteur initial So par
une translation le long de la trajectoire x (t).
Désignons par X t l'espace vectoriel déduit de X par une transla-
tion de l'origine des coordonnées en le point x (t), Le. l'espace des
vecteurs liés issus du point x (t). Le vecteur St = ôx (t) est un élé-
nlent de l'espace Xt. Désignons ensuite par At, to la transformation
de l'espace X to dans l'espace Xt transportant tout vecteur So de
l'espace X t 0 en le vecteur St de l'espace X t, déd ui t de So par une
translation le long de la trajectoire x (t). Le système (16) étant li-
néaire et homogène, la transformation At. to est linéaire et non dé-
générée. Par ailleurs, il est évident qu'elle est homogène, i.e. qu'elle
envoie l'origine des coordonnées de l'espace X to dans l'origine des
coordonnées de l'espace X t.
Si au lieu de t o et t on considère des instants quelconques t'et
t" (pris dans l'intervalle sur lequel sont définies la commande u (t)
et la solution x (t)), nous définissons d'une façon analogue une trans-
formation non dégénérée, linéaire et homogène, A tIf, t' de l'espace
X t' dans l'espace X tIf. II est évident que ces transformations linéaires
jouissent de la propriété suivante (E étant la transformation iden-
tique) :
At" t' = E; Atm, t".A t ", t' = At,", t'.
(17)
Par définition des transformations At, to' les vecteurs At. to (So)
constituent une famille de vecteurs déduits de So par une translation
78
DÉMONSTRATION DU PRINCIPE DU MAXIMUl\'I
[Ch. 2-
le long de la trajectoire x (t), et vérifient donc le système (16) :
n
..:£ [ A ( )] i = " afi ex (t), u (t)) [ A ( )] a
dt t, to '00 L.J axa t, to '00 ,
a=O
i=O, 1, ..., n. (18)
Il est évident que la solution (15) peut s'écrire sous la forme:
y (t) - x (t) = gAt, to (60) + 0 (8) = At, to [y (t o ) - x (t o )] + 0 (g). (19)
Comparons maintenant les systèmes (16) et (8). Ces systèmes sont
linéaires et homogènes et les matrices qui leur sont associées sont
respectivement de la forme:
( afi (x (t), u (t)) )
axa '
' ( _ a/a (x (t) u (t)) ) .
ax'L
Autrement dit, ces matrices se déduisent l'une de l'autre par une
transposition négative, Le. les systèmes (16) et (8) sont adj 0 i n t s.
Remarquons que nous pouvons étudier les systèmes (8) et (16)
seulement dans le cas où a été fait choix d'une commande u (t)"
t o t t 1 , et de la trajectoire correspondante x (t) (Le. la solution
du système (7)), car les fonctions u (t) et x (t) figurent dans les
seconds membres des systèmes (8) et (16). Par suite de la linéarité.
des systèmes (8) et (16) les solutions de ces systèmes peuvent être
étudiées sur l'intervalle t o t t 1 tout entier, si la solution x (t)
est définie sur cet intervalle.
Les systèmes (8) et (16) étant adjoints, il en résulte que si'" (t) ===
== (11'0 (t), 11'1 (t), . · ., 'Pn (t)) est une solution quelconque du système-
(8) et ôx (t) == (ÔX O (t), ôx 1 (t), . . ., ôx n (t)) une solution quelcon-
que du système (16), alors le produit scalaire
n
('i'(t), ôx(t))= 'l'a(t)ôxa(t)
a=O
est constant sur l'intervalle t o t t 1 tout entier. En effet, nous
avons (presque partout sur l'intervalle t o t t 1 )
n n
'l'cd t ) ôx IX (t) = dW:e (t) ôx IX (t) +
a=O a=O
n n
+ 'l'a (t) dÔ: (t) = _ iJl (x ; u (t» '1'(3 (t) ô,xa; (t)-+
a=O a, (3=0
n
+ " '\l'a (t) a/a ex et), u (t» ôx (t) = O.
L.J ax
a, 6=0
12.]
SYSTÈME Dl ÉQUATIONS AUX VARIATIONS
79
Soit, en particulier, un vecteur quelconque 60. Par définition,
le vecteur fonction 6t == At. to (60) est alors solution du systèn1e (16)
(voir (18)). Donc est vrai le lemme suivant.
Lem m e 1. Si 'i' (t) est solution du système (8) et 60 un vecteur
quelconque, donné au point x (t o ), alors sur l'intervalle t O -<.t.::(.t 1
tout entier est vraie la relation
('i' (t), At. to (60)) = const.
Le lemme 1 permet de donner l'interprétation géométrique sui--
vante au système (8). Soit Lo un hyperplan quelconque de l'espace X
passant par le point xo (i.e. par l'origine des coordonnées de l'es-
pace ...cY to). La transformation linéaire At. to transporte 1 'hyperplan
Lo dans un certain hypplan Lt (passant par le P9int x (t)). De cette
façon donc est engendrée une famille d 'hyperplans {Lt}, dont nous
dirons qu'ils ont été obtenus par translation de l'hyperplan Lo le
long de la trajectoire x (t). L'équation de 1 'hyperplan Lt peut s' écri-
rü sous la forme: .
n
'Pa (t) x a = 0
a=O
(20)
OÙ x a , a = 0, 1, . . ., n sont des coordonnées courantes de l' es-
pace X t et '\{Ja (t) les coefficients de l'équation de cet hyperplan (le
terme libre a disparu car 1 'hyperplan Lt passe par l'origine des coor-
données de l'espace Xt). Nous voulons savoir quelles doivent être
les fonctions 'Pa (t) pour que l'équation (20) définisse pour diffé-
rentes valeurs du paramètre t une famille d 'hyperplans translatés
le long de la trajectoire x (t). Il s'avère que les fonctions 1Pa (t)
peu ven t être tirées du système (8), i. e. si 'i' (t) == ($0 (t), 'Pl (t), . . .
. . ., 'i'n (t)) est une solution quelconque du système (8), alors les hyper--
plans (20) se déduisent l'un de l'autre par une translation le long de la,
trajectoire X (t).
En effet, si les fonctions 'l'a (t), a == 0, 1, . . ., n, vérifient le.
système (8) et si le vecteur 60 est contenu dans 1 'hyperplan
n
,pa (t o ) x a == 0 (Le. le produit scalaire ('i' (t o ), 60) s'annule), alors.
a=O
quel que soit t, le produit scalaire ('1' (t), At, to (60)) s'annule, i.e.
tout vecteur 6t == At, to (60) déduit,de 60 par _une translatin le long
de la trajectoire x (t) est contenu darrs l'hyperplan correspondant
(20). Ceci étant vrai pour tout vecteur 60 contenu dans 1 'hyperplan
Tt
2j 'Pa (t o ) x a 0" on en conclut que les hyperplans (20) se dédui-
a=O
sent l'un, de l'autre par une translation l long de la trajectoire x (t)..
80
DÉMONSTRATION DU PRINCIPE DU MAXIMUl\I
[Ch. 2
9 13. Variations des commandes et des trajectoires
Soit u (t) une commande admissible définie sur l'intervalle
t o < t ti- Faisons choix d'instants Lt, L2, . . ., LS' L tels qu'ils
satisfassent aux inégalités t o < Li L2 . . . LS 't < t 1 et
qu'ils soient des points réguliers pour la commande u (t). Faisons
choix ensuite de nombres non négatifs arbitraires ôt i , _ . ., ôt s '
d'un nombre réel arbitraire (pas forcément non négatif) ôt et de
points Vi, V2, . . ., V s arbitraires (pas forcément distincts) du domai-
ne de commande U. Définissons maintenant comme suit les inter-
valles I l , 1 2 , . . ., Is dépendant de 8. Posons
{ ôt-(ôti +... +ôt s ), si 'ti= L;
Li = - (ôti + . . . + ôt s ), s Ti = Ts < T;
- (ôt i + . . . + ôt}), SI Li = 'ti+1 = . . . = 'tj < 't'j+1 (j < s)
et désignons par Ii l'intervalle
Li + 8li < t 'fi + 8 (li + ôti).
Si donc 'ti = Li+i = · · · = Lj, les intervalles Ii' I i + i , . . ., Ij
sont contigus et se succèdent de gauche à droite; si par contre
l'intervalle Ih n'est pas contigu à droite à l'intervalle suivant
(i.e. si 'th <'fh+i ou k = s), l'intervalle l h admet alors pour extrémité
droite le point Lh lorsque Lh <'f et le point L + 8ôt lorsque 'fh = L.
La longueur de Ii est égale à 8ôt i . Si ôt i = 0, l'intervalle Ii
correspondant est «vide», i.e. n'existe pas.
Pour 8 suffisamment petit, les intervalles It, . . ., 1 s sont
disjoints deux à deux et se situent tous sur l'intervalle principal t o
t < t i , à gauche du point 'f + 8ôt. En supposant que 8 remplit ces
conditions, nous définissons une commande u* (t) sur l'intervalle
t o t < 'f + 8Ôt comme suit:
{ u (t), si t n'appartient à aucun des ensembles
u* (t) = I t ,1 2 , ..., Is,
Vi' si t E Ii.
Nous dirons que la comnde u* (t) se (léduit par perturbation de la
commande u (t). Par suite de la convention sur les classes de com-
mandes admissibles ( 10), la commande u* (t) est admissible (pour
8 suffisamment petit).
Soit x = S (8), 0 8 80 l'équation paramétrique d'une ligne
continûment différentiable passant par le point Xo pour 8 = 0 et
admettant en ce point un vecteur tangent So ( = dO» ) .
Désignons par x (t), t o < t -<. tit la trajectoire correspondant
(voir. (7)) à la commande il (t) et issue du point xo; 'et par x* (t) la
13.]
VARIATIONS DES COMMANDES ET DES TRAJECTOIRES
81
trajectoire correspondant à la commande perturbée u* (t) et issue
du point S (e). (Le paramètre e est le même dans la commande
perturbée u* (t) et dans l'équation paramétrique de la ligne S (e).)
Puisque la commande u* (t) est bornée et diffère de u (t) seule-
Dlont d'un ensemble de mesure e (ôt 1 +. . . + ôt s ), il découle
aisément du théorème de la dépendance continue des solutions des
équations différentielles par rapport aux valeurs initiales que pour
c suffisamment petit la solution x* (t) est définie sur l'intervalle
to<t-<.'t + eôt tout entier sur lequel est considérée la commande
u * (t). Notre objectif immédiat est de déterminer la position du
point x* ('t + eôt). Nous allons notamment prouver qu'est vraie la
formule
x* ('t + e8t) == x ('t) + eA,;, to (So) + ex + 0 (E), (21)
oÙ x est un vecteur ne dépendant pas de E, défini par l'égalité
x == f(x ('t), U ('t)) ôt +
s
+ 2j A,;,,;. (f(x ('ti), Vi) -f(x ('ti), U ('ti))] ôt i . (22)
i=1 z
Prouvons les formules (21) et (22) par récurrence sur s. En appli-
quant, pour commencer, la relation (1) à la fonction vectorielle
g (t,u) == f (x (t), u) (qui de toute évidence est continue en ses
arguments) et en posant e == 't, P = 0, q = ôt, il vient:
1:+ëÔt
J f (x (t), u (t» dt = f,ôt.f (x (1:), u (1:» + 0 (f,),
1:
ou, puisque x (t) est une solution (absolument continue!) du systè-
nle (7),
x ('t + ëôt) = x ('t) + e[ (x ('t), u ('t)) ôt + 0 (ë). (23)
Si, ensuite, 'ts < 't, alors pour e suffisamment petit, l'intervalle
(t, 't + e8t) est situé à d roi t e du point 'ts, de sorte que sur cet
intervalle la commande u* (t) coïncide avec u (t) et donc
,;+ëÔ t
;x:* ('r + f,ôt) - x* ('r) = J f(x* (t), u* (t» dt =
1:
1:+ëÔt
= , f(x*(t), u(t»dt. (24}
...
1:
I)ar. ailleurs, on voit aisément (n vertu du théorème de la dépen-
d an ce continue par rapport aux valeurs initiales), que la solution
x* (t) tend uniformément (sÜr l'intervalle t o t 't + eôt tout
6-01339
82
DÉMONSTRATION DU PRINCIPE DU MAXIMUM
[Ch. 2
entier) vers x (t) lorsque 8 O. Donc f (x* (t), u (t)) == j- (x (t),
u (t)) + Si (t) où Si (t) tend uniformémen t (en t) vers 0 lorsque
80. D'où il vient:
-r+eôl ,;+eôt
i f(x* (t), u (t)) dt = i f(x (t), u (t)) dt + 0 (e) =
,; ,;
=== X ('t + eôt) - x ('t) + 0 (e) === ef(x ('t), u ('t)) ôt + 0 (ë)
(voir (23)). D'où, en comparant cette relation avec (24), (pour 'ts <
< 't)
x* (1' + e8t) === x* ('t) + ëf (x (1'), U ('t)) 8t + 0 (8). (25)
Trouvons enfin l'accroissement de la fonction x* (t) sur Ii.
Puisque sur cet intervalle
f(x* (t), u* (t)) ===f(x(t), Vi) + S2(t),
où S2 (t) tend uniformément vers 0 lorsque 8 O, alors sur Ii'
l'accroissement
x* ('t i + 8 ( l i + 8t i)) - x * ('t i + 8l i) === x* II.
l
de la fonction x* (t) prend la valeur suiva,nte
X*II.= \f(x*(t), u(t))dt===
l .J
I.
l
= J f(x (t), Vi) dt + 0 (e) = ef(x (1:i), Vi) ôti + 0 (e) (26)
I.
l
(rappelons que la longueur de 1 i est égale à ëôt i et que cet intervalle
se réduit au point 'ti lorsque e -+ 0).
Vérifions maintenant par récurrence les relations (21) et (22).
Pour s === 0 nous avons u* (t) === u (t). D'où (voir (14), (15), (19)):
x* (t) == x (t) + 8At, t o (so) + 0 (8).
En particulier,
x* ('t) - X ('t) === 8A,;, to (So) + 0 (8).
En vertu de (23) et (25) il vient:
x* ('t + 8ôt) - x ('t + 8ôt) === x* ('t) - X ('t) + 0 (ë) === 8A,;, to (£0) + 0 (8),
d'où (voir (23))
x* ('t + e8t) === x ('t + 8ôt) + eA,;, to (So) + 0 (e) ===
=== x ('t) + ef(x ('t), u ('t)) ôt + ëA,;, to (SO) + 0 (8),
et les formules (21) et (22) sont établies pour s == O.
13.]
VARIATIONS DES COMMANDES ET DES TRAJECTOIRES
83
Supposons maintenant que les formules (21), (22) sont démon-
trées pour le cas où le nombre des intervalles If, 1 2 , . . . est
i n f é rie u r à s et prouvons que ces formules sont vraies lorsque
les intervalles I l , 1 2 , . . ., l s sont au nombre de s. Désignons par
le un entier tel que
'tk+1 === 'tk+2 == · · · == 'tg et 't i < 'tg pour i k
(le cas k == 0 n'est pas exclu). Remplaçant le point 't par le point
1's, le nombre ôt par le nombre lk+1 et, enfin, le nombre s par le
nombre i n f é rie u r k, il vient de (21) et (22), en vertu de notre
hypothèse récurrente,
x* ('tg + ëlk+1) == x ('t s ) + ëf(x ('t s ), U ('t s )) lk+1 +
k
.tEA't t (Sa)+B Li A't 'te [f(X('ti)' vi)-f(x('ti)' U('ti))] ôt i + 0(8). (27)
s' 0 i=1 s' l
Ce qui n'est autre que la valeur prise par la fonction x* (t) à l' ex-
trémité gauche de l'intervalle 1 k+1. Etant donné ensuite que les
intervalles I h + 1 , . . ., l s sont contigus, en sommant la relation
(26) po1ir i == k + 1, . . ., s, nous obtenons l'accroissement de la
fonction x* (t) de l'extrémité gauche de Ik+1 à l'extrémité droite
de Is, Le. jusqu'au point 'ts + B (ls + ôt s ) :
s
x* ('t s + B (ls + ôt s )) - x* ('t s + Elk+1) == B Li f(x ('ti), Vi) ôt i -t- 0 (B).
i=k+1
En additionnant cette relation à la relation (27) il vient:
x* ('t s + B (ls + ôt s )) == x ('t s ) + BJ"(X ('t s ), U ('t s )) lk+1 +
s
+ BA,; , t o (Sa) + B f (x (1'i), Vi) ôt i +
s i=k+1
k
+ B Li A't , 't. [J"(x ('ti)' Vi) - f(x ('ti), U (1'i))] ôt i + 0 (B) ==
i=1 s l
== X ('t s ) -t- Ef (x (1's), U (1's)) (lk+1 + Ôt k + 1 + . . . + ôt s ) +
s
+ BA't , t (Sa) + B Li [J" (x ( 't i)' Vi) - f (x ('t s), U ('t s) )] ôt i +
s a i=k+l
k
+ B lj A,; , 't. [J" (x ( 't i ), Vi) - f (x ( 't i ), U ( 't i) )] ôt i + 0 (ë).
i= 1 s z
Puisque A';s.';t == E pour i == k + 1, . . ., s (voir (17)) la der-
nière expression peut s'écrire sous la forme:
x* ('t s + B (ls + ôt s )) ==
6*
:S4
DÉMONSTRATION DU PRINCIPE DU MAXIMUM
[Ch. 3
==X(LS) +8f(x (LS)' U(LS)) (lk+1+Ôt k + 1 + ... + ot s ) + 8.4"S' tO(O)+
S
+ 8 A" , ". [f (x (L i), Vi) - f (.'e (L i ), U (L i ) )] 8t i + 0 (8). ( 28)
i= 1 S l '
Si Lk+1 == LS == L, en vertu de la définition des nombres li nous
avons ls + ôt s == 8t, lk+1 + 8t h + 1 + .,., + 8t s == 8t, et dans ce
cas donc la relation (28) coïncide avec (21) et (22). Si LS < 't, alors
ls + ôt s == 0, lk+1 + 8t k + 1 + . . . + 8t s == 0, et la relation (28)
prend la forme:
x* ('t s ) == X (LS) + 8A,;s', t o (So) +
s
+ ë A" , ". [f(x (Li), Vi) -f"(x (Li), U ('ti))] 8t i + 0 (8). (29)
i= 1 s l
Puisque dans ce cas sur la portion d'intervalle LS < t L la com-
mande u* (t) se confond avec u (t), alors avec une précision d'une
grandeur, d'un ordre de petitesse supérieur par rapport à 8 (voir
12), les vecteurs x* (t) - x (t) pour 't s -< t 't se déduisent l'un
de l'autre par une translation le long de la trajectoire x ( t) (voir (19)) :
. x* (t) -. x (t) == .A t, "s (x * (L s) - x (L s)) + 0 (8) ( t 't s ) .
En appliquant donc à la formule (29) la transformation A", "s'
nous obtenons (voir la deuxieme relation (17)):
x* ('t) - X Cr) == 8A", to (So) +
s
+ ë A",.,;. lf(x (Li), Vi) - f(x (Li), U (Li))] 8t t + 0 (8).
i=l w l
En additionnant enfin la dernière expression et la relation (25)
nous obtenons dans ce cas aussi (i.e. pour LS < 't) les relations (21)
et (22), ce qui achève notre démonstration.
Rem a r que. En analysant la démonstratioÎ1 faite, nous cons-
tatons qu'elle repose sur la formule (1) et les équations aux varia-
tions (formules (14),. (15) et (l6)). Ausi, en tenant compte de la
formule (2) et de la remarque 2 de la page 77, nous aboutissons à la
conclusion suivante., Si toutes les grandeurs 8t 17 8t 2 , . . ., 8t s , 8t
dépendent continûment d'un èertain paramètre v variant dans l'en-
semble compact N, les formules (21) et (22) restent vraies, et, de
plus, la grandeur 0 (8) 'de la formule (21) (qui dépend évidemment de
v) est uni for m é men t e n v d'un ordre de petitesse supé-
rieur par rappo,rt à 8.
, 9 14. Lemmes fondamentaux
Si l'un quelconque des nombres 8t i est nul, on peut le négliger
avec les points correspondants Li et Vi dans la définition de la com-
mande perturbée u* (t) sans que cette dernière soit Inodifiée. Inverse-
14.]
LEMMES FONDAMENTAUX
85
Jnent, l'adjonction de nouveaux points 'ti' Vi pour lesquels 8t i
== 0 ne modifie pas la commande u* (t). S'il est question d'un nom-
bre fin i de commandes ur (t), . . ., u (t) obtenues par perturbation
d 'nne seule et même commande. u (t) pour le même 't, de ce qui pré-
cède nous pouvons considérer que dans la définition des commandes
a (t), . . ., u (t), tous les points 't i1 Vi son t ide n t i que s
et sont pris en quantité ide n t i que, mais que la seule distinc-
tion existant entre ces commandes est qu'elles ne possèdent pas
les mêmes 8t i et 8t. Dans la suite nous nous servirons, mais sans le
spécifier cbaque fois, de cette possibilité de 'considérer que tous les
points 'ti et Vi sont identiques (lorsqu'il sera question d'un nombre
fin i de différentes perturbations d'une même cOlnmande).
Le vecteur x (voir (22)) ne dépend pas de 8, mais dépend. essen-
tiellement du choix des points Li' Vi' L et des nombres 8t et 8t i
(i == 1, 2, . . ., s). Désignons l'ensemble des grandeurs Li' Vi' 't,
8t i, 8t par a :
a == {Tb Vi' T, 8t i1 8t},
et le vecteur (22) par Xa pour en indiquer la dépendance par rap..l
port à ces grandeurs.
Nous supposerons dans ce paragraphe que le point régulier 'L de
la commande u (t) est fi x é et que toutes les perturbations de cette
commande satisfont à la condition t o < 't1 't 2 'Ls
't < t 1 .
Soit le nombre fin i de grandeurs
a' == {'ti, Vi' 't, 8ti, 8t'},
a" == { 't i, Vi' 't, ôti, 8t"},
. . . . . . . . . . . . .
Nous pouvons considérer (voir plus haut) que tous les points 'Li et
Vi sont ide n t i que s pour toutes les grandeurs a', a", . . . (ce
qui est prévu par les notations). Définissons la combinaison linéai-
"1' , + "1" " f- d d ,,, " ff .. t
re l'v a l'v a - ... es gran eurs a, a , . .. a coe lClen s
non négatifs Â', Â", . . . au moyen de la formule *) -
'A 1 a 1 + Â" a" + . . . == {'Li' Vi' 't, Â/8ti + 'A" 8ti + . . ., Iv' 8t' + Â" 8t" + . . . }.
(La non-négati vi té des coefficients Â', Â", . . . est essentielle, sinon
les grandeurs ')../8ti + Îv "8t'[ + . . . pourraient être négatives, ce
qui est inadmissible.)
*) Notons que, d'une façon générale, l'adjonction de nouveaux points 't'i
et Vi pour lesquels ôti == 0 (grâce à quoi tous les points 't'i, Vi de la suite finie des
grandeurs a', a" ... deviennent les mêmes) peut se réaliser de plusieurs maniè-
res. Par suite, la combinaison linéaire Â' a' + Â"a" + . . . aussi est déter-
n1inée d'une manière non univoque. Cependant, on voit aisément que cette non-
unicité n'influe nullement sur les calculs ultérieurs.
86
DÉMONSTRATION DU PRINCIPE DU MAXIMUM
[Ch. 1
A près a voir fai t choix d'une certaine commande u (t), t o t
tt, et de la trajectoire x (t) correspondante, nous allons maintenant
considérer les vecteurs x == xa pour les divers symboles a ('t étant
fixé). Le lemme suivant est évident.
L e ID ID e 2. Si a == Îv' a' + };' a" + . . . (0 ù Îv' ? 0, Îv" ? 0, ...) ,
les vecteurs correspondants x sont liés par la même combinaison li-
néaire
Xa == Â' xa' -t Îv" xa" +. . . .
Ceci découle immédiatement de la 1 i n é a rit é des nombres
8t 1 , . . ., 8t s , 8t dans la formule (22).
Nous considérerons que x est un vecteur lié issu du point x('t),
i.e. est un élément de l'espace X'"C (voir 12). Si nous prenons tous
les symboles a ('t étant fixé), les vecteurs x == xa rempliront un
ensemble [(T: dans l'espace X '"C.
Prouvons maintenant que l'ensemble KT: est un cône convexe *) de
l'espace vectoriel X '"Ce
*) Un ensemble M d'un espace vectoriel X est appelé cône convexe de som-
met au point 0 si 1) il est un cône, Ï.e. avec tout point a distinct de 0, il con-
--+
tient le rayon oa tout entier, 2) il est convexe, Le. il contient le segment qui joint
deux quelconques de ses points. Remarquons que si le cône convexe M ne reffi-
plit pas l'espace vectoriel X tout entier qui le contient, il existe alors dans l'espace
X un hyperplan passant par le somffiet du cône 0 et tel que le cône M est entière-
ment contenu dans l'un des demi-espaces (fermé) défini par cet hyperplan. Un
point x E X est un point intérieur du cône convexe Mc X si l'un de ses voisina-
ges est entièrement contenu dans le cône M. L'ensemble de tous les points
intérieurs constitue l'intérieur du cône M eX.
Soient ensuite Mi et M 2 deux cônes convexes de l'espace X de sommet com-
mun o. Nous dirons que les cônes Mi et M 2 sont séparables dans X s'il existe un
hyperplan qui les sépare, i .e. un hyperplan tel que le cône Mt soit entièrement
situé dans l'un des demi-espaces (fermé) défini par cet hyperplan et le cône M 2
dans l'autre demi-espace. Pour que les cônes Mt et M 2 soient séparables, il est
nécessaire et suffisant que soit reffiplie l'une des deux conditions suivantes:
1) qu'il existe un hyperplan contenant les deux cônes Mt et M 2 ; 2) qu'il n'existe
pas de-point intérieur à la fois à Mt et à M 2 relativeffient à leurs plans portants.
Si donc les cônes Mt et M 2 (de sommet commun 0) ne sont pas séparables dans
X, l'enveloppe linéaire de leurs plans portants se confond avec l'espace X
tout entier et de plus, il existe un point a intérieur à chaque cône Mi et M 2 relati-
vement à leurs plans portants. Dans ce cas, on peut faire passer par le point
a un plan C orthogonal à la droite oa, coupant en a seuleffient le plan portant
du cône M 2 et tel que tous ses points suffisamment proches de a appartiennent
également au cône M17 et de plus l'enveloppe linéaire du plan C et du plan
portant du cône M 2 est confondue avec X. Autreffient dit, une boule de rayon
petit centrée en a coupe le plan C suivant une « aire complémentaire » au plan
portant le cône M 2 . Cette « aire complémentaire » est orthogonale à la droite oa,
est entièrement contenue dans le cône Mt et sa dimension est égale à la diffien-
sion de l'espace X diminuée de celle du cône M 2 .
14.]
LEMMES FONDAMENTAUX
87
En effet, si a' et a" sont deux points de l'espace X 'C' appartenant
à l'ensemble K 'C' i.e. s'il existe des symboles a', a" tels que
, A "A
a == LlX a " a == LlX a "
alors quels que soient Â' , Â" non négatifs nous avons, en vertu du
lemn1e 2:
'l' ' + 'l"" 'l'A -L'l"A A
IV a IV a ==IV LlX a ' 1 IV LlXa"==LlXO,,'a'+Â."a"),
i.e. le point Â' a' +. Â "a" appartient également à l'ensemble K 'C. Ce
qui signifie que Il. 'C est un cône convexe de l'espace X'C (ou, ce qui
est équivalent, un cône convexe de l'espace X admettant le point
x Ct) pour sommet).
Nous appellerons l'ensemble l{ 'C cône d'atteignabilité.
DéITIontrons maintenant deux lemmes qui nous permettront
d'appliquer les constructions exposées précédemment à l'étude des
processus optimaux.
I.J e m m e 3. Soient T (t o < T < tt) un point régulier de la com-
mande u (t), x (t) la trajectoire associée à la commande u (t) et issue
du })oint Xo, et A - une ligne issue du point x (T) et admettant en ce
point un rayon tangent L. Si le rayon L appartient à l'intérieur du
cône [('C (i.e. si tous les points du rayon L, à l'exception de son extré-
mité, sont des points intérieurs à l'ensemble K 'C)' il existe alors une
commande u* (t) telle que la trajectoire correspondante x* (t) issue du
mênLe point Xo passe par un point (distinct de x (L)) de la ligne A.
D é mon s t rat ion. Choisissons sur le rayon L un point
quelconque A distinct de x (L). Traçons à partir de A n vecteurs
et, e 2 , · · ., en de même longueur r, orthogonaux au rayon L et or-
thogonaux deux à deux. Posons ensuite fi == -eh i == 1,2, . . ., n;
nous supposerons que les vecteurs fi sont également issus du point A.
Nous considérons que la longueur commune r des vecteurs et, . . .
. . ., en, fi, . . ., j.n est tellement petite que les extrémités de tous
ces vecteurs appartiennent au cône K'C (ce qui est possible puisque A
est un point i n t é rie u r à ce cône). Désignons enfin par c le
vecteur admettant pour origine le point x (L) et pour extrémité le
point A. Comme les vecteurs
c, c + et, C + e 2 , . · ., c + en, C + ft, C + 1 2 , . . ., C + fn
(issus du poin t x (T)) a pp artiennen tau cône [( 'C' il existe des symbo-
les ao, at, ..., an, a;, ..., a tels que
i1x ao == c, i1x ai == c + eh ..., i1xan == C + en,
i1xa==C+fb ..., xa==c+fn.
88
DÉMONSTRATION DU PRINCIPE DU MAXIMUM
[Ch. 2
Définissons maintenant deux fonctions (de toute évidence continues
et non négatives) h + (p) et h- (p) de la variable réelle comme suit:
{ p pour p? 0, { 0 pour p ? 0,
h+ (p) === h- (p) ===
o pour p < 0; -p pour p < O.
Pour (pl)2 + (p2)2 + + (pn)21, la formule
a ::.:::: a (pl, ..., pn) ===
n n n
= ( 1 - 1 pi 1) ao + h+ (pi) ai + h- (pi) ai
i=l i=l i=l
défini t le symbole a (pl, . . ., pn) dépendant de n nOlnbres réels
pl, . . ., pn. (En effet, nous avons un nombre fin i de sym-
boles ao, ai,ai et de plus tous les coefficients h+ (pi), h- (pi) et
n
1 - .!. 1 pi 1 sont non négatifs, comme il 'est aisé de le voir.)
n i=l
Le vecteur x correspondant au symbole a === Œ (pl, . . ., pn) est,
en vertu du lemme 2 et des relations fi === - eb h+ (p) + h- (p) ===
=== 1 p 1, h+ (p) - h- (p) === p, de la forme suivante:
n
AXa = ( 1- ] 1 pi 1 ) c +
i=1
n n
+ h+(pi)(c+ei)+ h-(pi)(C+fi) =
i=1 i=1
n
=[1+ (-lpil+h+(pi)+h-(pi))JC+
i=l
TI n
+.! 'Y, [h+ (pi) - h- (pi)] ei === C +.!. I piei.
n... nk..J
i=1 i=1
Si donc le point (pl, . . ., pn) parcourt la boule unitaire
(pl)2 + . . . + (pn)2 1 (30)
dans l'espace numérique de dimension n, alors le vecteur xa (plus
exactement, son extrémité) parcourra une boule de din1ension n
dans l'es p ace X't, en l'occurrence la boule de ra y on ..!.- r centrée en A
11
et orthogonale au rayon L. Sous les mêmes conditions, l'extrémité
du vecteur BXa (tous les vecteurs sont issus du point x ('t), i.e. de
l'origine des coordonnées de l'espace X 't) parcourt une boule E£ de
S 14.]
LEMMES FONDAMENTAUX
89
dimension n, de rayon 8..!- , orthogonale au rayon L ; la boule Ee est
n
centrée au point Ae du rayon L, distant de 8d du point x ('t'), où d
est le module du vecteur c (fig. 31).
Puisque notre raisonnement ne porte que sur des symboles a
qui sont des combinaisons linéaires (à coefficients non négatifs) d'un
nombre fin i de symoles a o , ah .ai, i== .x(Z}
==1, 2, . . ., n, les pOInts 't'j, Vj, ] == 1,
2, . . ., s figurant dans la défini tion du
symbole a == a (pl, . . ., pn) sont identi-
ques pour tous ces symboles, i.e. ne
dépendent pas de pl, . . ., pn; le point
't est également fixé. Les nombres
8t h . . ., 8t s et 8t (qui ont servi à définir
la commande perturbée u* (t)) dépendent
continûment de pl, . . ., pn. Aussi écri-
rons-nous u (t) et 8t a pour souligner que
les grandeurs u* (t) et 8t dépendent de
pl,. . ., pn. Désignons par x (t) la tra-
jectoire ,x;* (t) issue du point Xo et asso-
ci ée à la commande u* (t), de sorte que
la relation (21) (dans laquelle So == 0,
car le point initial se confond avec Xo FIG.31
pour tous les 8) nous donne:
xci ('t -t- 88t a ) == X ('t) + 8Xa + 0 (8).
(31)
Notons quo la trajectoire x (t) dépend con t i n û men t des
paramètres pl,..., pn; d'une façon analogue, le non1bre 8t a
dépend con t i n û men t de pl, . . ., pn. Donc, le point
x ('t' + 88t a ) dépend con t i n û men t de pl, . . ., pn, et la
grandeur 0 (8) est uniformément en pl, . . ., pn d'un ordre de peti-
tesse supérieur par rapport à B (voir la remarque de la page 84).
Par conséq uen t, lorsque le point (pl, . . ., pn) décri t la boule (30),
le point (31) décrit (pour tout 8 fixe) un « disque » Fe (i.e. une ilnage
continue de la boule (30) ; le disque peut posséder des points cruno-
daux, etc.). Le disque Fe «coïncide » avec la boule Ee (voir (31)
avec une précision d'une grandeur d'un ordre supérieur de petitesse
par rapport à 8; plus exactement, les points du disque Fe sont dis-
tants des points correspondants de la boule Ee d'une longueur d'un
ordre supérieur de petitesse par rapport à 8 (uniformément pour tous
les points de la boule Ee). Le point d'intersection de cette boule
avec la ligne A (point qui existe pour des 8 suffisamment petits) est
séparé du point x ('t) et de la frontière de la boule Ee d'une grandeur
de l'ordre de 8. Donc, pour 8 suffisamment petit, le disque Fe cou-
90
DÉMONSTRATION DU PRINCIPE DU MAXIMUM
[Ch. 2
pela ligne A en un point *). (fig. 32). Choisissons un tel B. Comme
le disque FE tout entier est composé de points de la forme (31), éta-
blir l'intersection de F e avec la ligne A revient à dire qu'il existe
des pt, . . ., pn (contenus dans la boule (30)) tels que x (T + ë8t a ) E
E A. Autrement dit, en désignant par u* (t) et x* (t) les grandeurs
u (t) et x (t) correspondant aux valeurs choisies de pl, . . ., pn et
.:etc:) en supposant 't -t- e8t a == 't f , on a x*( t o ) ==
1 f
== Xo, x* ('t ) E A, et le lemme 3 est dé-
montré.
\
\
Fe
\
\
\
\
\
\
\L
FIG. 32
Lem m e 4. Si la commande u (t) et
la trajectoire correspondante x (t), t o
< t < t 1 , sont optimales, alors pour tout
point régulier 't (t o < 't < t 1 ) le rayon
L'C, issu du point x ('t) et orienté dans
le sens du demi-axe négatif x O , n' appar-
tient pas à l'intérieur du cône K'C (i.e. pas-
se soit à l'extérieur du cône soit par sa
frontière) .
D é mon s t rat ion. Supposons
que pour un certain 't le rayon L" appartient à l'intérieur du
cône 11.'C. Appliquons le lemme 3 en prenant pour ligne A (et pour
rayon L) le rayon L'C. Il existe alors une commande u*(t) telle que
la trajectoire correspondante x* (t) (issue du même point xo) passe
à un instant 't f > t o par un point situé sur le rayon L'(. Autrement
dit,
X('tf)==Xi('t), i==1,2, ..., n;
x ('t f ) < X O ('t).
Définissons sur l'intervalle t o t t 1 + ('t f - 't) la commande
u** (t) en posant
{ u* (t)
u** (t) ==
u (t - ('t f - 't)) pour 't f < t t 1 + ('t f - 't).
La trajectoire x** (t) associée à la commande u** (t) et issue du point
xo coïncide de toute évidence sur l'intervalle t o t 't f avec la
trajectoire x* (t) de sorte que, en particulier,
x* ('t f ) -== xi ('t), i == 1, 2, ..., n;
x ('t f ) < X O ('t).
*) L'existence d'un tel point d'intersection paraît « évidente »; la délnons-
tration rigoureuse se fait facilement par les méthodes élémentaires de la top 0 -
log i e (au moyen de la notion d'indice d'intersection; voir par exenlple
V. Bol t i ans k i «La théorie homotopique des applications continues et des
champs de vecteurs », Travaux de l'Institut Steklov, t. XLVII, 1955.
pour t o t 't f ,
(32)
9 15.]
DÉMONSTRATION DU PRINCIPE DU MAXIMUM
91
D'autre part sur l'intervalle L' t t 1 + (L' - T) la trajectoire
x** (t) prend la forme:
x** (t) == x (t - (T' - T)) + p,
(33)
où p est un vecteur constant
p == (x * (T') - XO (L), 0, 0, ..., 0).
(e qu'on obtient immédiatement en portant la solution (33) dans
l'équation (7) et en tenant compte du fait que les seconds membres
du système (7) ne dépendent pas de t et de XO ; le vecteur p est défini
à partir de la con di tion en vertu de laquelle la trajectoire x** (t) doi t
être continue au point de « jonction » T' de ses deux portions.) Pour
t == t 1 + (L' - L) nous obtenons:
x** (t 1 + (T' - T)) == X (t 1 ) + p.
Autrement dit, le point x** (t 1 + (-t' - T)) est situé sur la droite II,
définie dans le 11 (car le vecteur p est parallèle à l'axe XO) et,
de plus,
x* (t 1 + (T' - T)) == XO (t 1 ) + x* (L') - XO (T) < XO (t 1 )
(voir (32)). Or cela contredit l' optimalité de la trajectoire x (t) et de
la commande u (t). Donc l'hypothèse faite en début de démonstra-
tion conduit à une contradiction et le lemme 4 est entièrement dé-
D10ntré.
9 15. Démonstration du principe du maximum
Dans ce paragraphe nous supposerons que x (t), t o t t 1 , est
une trajectoire optimale (joignant le point Xo à un point de la droite
II, voir 11) et u (t) la commande optimale correspondante. Soit T
un point régulier quelconque de la commande u (t). D'après le lem-
n1e 4, le rayon L" n'appartient pas à l'intérieur du cône 1(" de sorte
que celui-ci ne remplit pas entièrement l'espace X. Aussi existe-t-il
un hyperplan d'appui au cône [(" en son sommet, i.e. un hyperplan
l' tel que le cône [(" tout entier est situé sur l'un des deux demi-
espaces fermés définis par l'hyperplan r. (L'hyperplan r jouissant
de cette propriété peut ne pas être unique; les raisonnements ulté-
rieurs sont valables pour un tel hyperplan quelconque.) L'équation
de l'hyperplan r (dans l'espace X ,,) peut s'écrire sous la forme
n
a(Xx a == 0 où xo, Xl, . . ., x n sont des coordonnées courantes.
a=ü
(olnn1e le produit de tous les coefficients aa par un même nombre
non nul ne n10difie pas l 'hyperplan r, nous pouvons considérer (en
ehangeant au besoin les signes de tous les nombres aa) que le cône
n
J( 'C est situé dans le demi-espace n é g a tif ( L aaxa ::(; 0 ). Autre-
a=O
92
DÉMONSTRATION DU PRINCIPE DU MAXIMUM
[Ch. 2
ment dit, pour tout vecteur L\x, défini par la formule (22), on a
(a, x) 0 (x E l( -c), (34)
où a désigne le vecteur (a o , ai, . . ., an) (car l'ensemble des vec-
teurs (22) n'est autre que le cône ]{-c). En posant dans la fornlule (22)
8t i == 8t 2 == . . . == t$ == 0, on a x == j" (x (L), u (rr))8t, et
d'après (34),
( a, j" (x (L), U (L)) 8 t) o.
Comme cette inégalité est valable quel que soit 8t (négatif ou posi-
tif), il vient
(a, f (x (L), U (L))) == 0,
i.e.
QJt (a, x (L), u (L)) == 0 (35)
(cette relation a lieu si le vecteur a satisfait à la condition (34)).
Désignons par
"" (t, a) == (1Po (t, a), 1P1 (t, a), . . ., 1Pn (t, a))
la solution du système d'équations (8) (correspondant à la commande
u (t) et à la trajectoire x (t) optilnales étudiées) vérifiant la condi-
tion ini tiale
"1' ('t, Ct) == a.
(36)
La solution"" (t, a) est définie sur l'intervalle t o t t i tout entier
puisque le système (8) est linéaire.
Lem m e 5. Si le vecteur a satisfait à la condition (34) alors en
tout point régulier de la commande u (t), contenu dans l'inter-
valle t o < t 't est vérifiée la relation
QJ8 ("" (t, a), x (t), u (t)) == &ft ("1' (t, a), x (t)).
Soit 'ti un point régulier de la commande u (t) contenu dans le SOl1S-
intervalle t o < t 't et Vi un point quelconque de l'espace U. Soit
le symbole a (voir 14) avec un seul point Li (i.e. s == 1) et où 8t h
8t sont respectivement égaux à 1 et 0 :
a == {Li' Vb 't, 1, O}"
Le vecteur x (voir (22)) correspondant à ce symbole a sera alors
égal à
x == A 't, L 1 [," (x ('t 1), V 1) - j" (x (L 1)' U (L 1) ) ] .
D'où il résulte en vertu des relations (34) et (36)
("1' ('t, a), AL, L 1 [j" (x ('t 1)' V 1) - f (x (L 1), u ( L 1 ) ) ] 0
15.]
DÉMONSTRATION DU PRINCIPE DU MAXIMUM
93
et, par conséquent, d'après le lemme 1 et la relation At'l,tl == E
(voir (17))
('i' ('"Ci' a), j" (x ('"Ci), Vi) - j" (x ('"Ci), U ('"Ci))) o.
(ette expression (de par la défini tion de la fonction QJC) peut s'écrire
sous la forme:
QJt ('i' ('"Ci' a), x ('"Ci), Vi) - QJg ('i' ('"Ci' a), x ('"Ci), U ('"Ci)) 0,
et cOll1me cette inégalité est valable pour tout point Vi EU, il vient:
cf)[ ( ('th a), x ('Li), u ('"Ci)) ==
== max QJt ('i' ('"Ci' a), x ('ti), Vi) == ait ('i' ('"Ch a), x ('"Ci)),
VtEU
et le lemme 5 est démontré.
La relation indiquée dans le lemme 5 est également valable pour
t === L (car '"C est un point régulier) :
QJ8 ('i' ('t, a), x ('t), U ('"C)) == aIIt ('i' ('"C, a), x ('"C)).
En vertu donc de (35) et (36) il vient l'assertion suivante.
Lem m e 6. Si le vecteur a satisfait à la condition (34), alors
dit ('i' ('"C, a) , x ('t)) === o.
Lem m e 7. Si une fonction absolument continue 'i' (t) vérifie
presque partout sur un intervalle 1 l'équation (8) et la relation
QJ8 ('i' (t), x (t), u (t)) == C?J!t ('i' (t), x (t)), (37)
alors la fonction alt ('i' (t), x (t)) est constante sur l'intervalle 1 tout
entier.
Ren1arquons tout d'abord que la fonction ait ('i' (t), x (t)) est
'semi-continue inférieurement sur l'intervalle J. Soit en effet t'un
point quelconque de cet intervalle et 8 un nombre positif. Par défi-
nition de la borne supérieure, il existe un point u' E U tel que
QJ8 ('i' (t'), x (t'), u ') c>./It ('i' (t'), x (t')) - .
Par ailleurs, la fonction QJ8 ('i' (t), x (t), u) étant continue en t pour
n === u' fixe, il existe un Ô > 0 tel que pour 1 t - t' 1 < Ô on ait
1 $t ('i' (t), x (t), u') - cW ('i' (t'), x (t / ), u ' ) 1 < .
-Donc, pour 1 t - t' 1 < ô, est vraie l'inégalité
-?lIt ('1' (t), x (t)) == su p cW ('i' (t), x (t), u)
uEU
, > QJ8 ('i' (t), x (t), u') > dit ('i' (t'), x (t')) - ë,
qui lllontre que la fonction a/lt ('i' (), x (t)) est semi-continue infé-
rieurement.
94
DÉMONSTRATION DU PRINCIPE DU MAXIMUM
[Ch. 2
Par ailleurs, la commande u (t) étant admissible, l'image de l'in-
tervalle 1 par l'application u admet dans l'espace Er une adhérence
compacte (voir 10), i.e. il existe dans Er un ensemble compact P
tel que u (t) E P lorsque tEl. Posons
m ( 'l', x) == max Q7{ ("', x, u).
uEP
Il est alors évident que
oJ!t ("" x) > m ("" x),
(38)
quels que soient x et 'i'. L'expression (37) signifie que presque par-
tout sur l'intervalle 1 a lieu l'égalité
m (", (t), x (t)) == Q/jt (", (t), x (t))
(car u (t) E P).
Ainsi donc &Il ('" (t), x (t)) est une fonction semi-continue infé-
rieurement, coïncidant presque partout sur l'intervalle 1 avec la
fonction m (", (t), x (t)) et liée avec elle par la relation (38). Il en
résulte que si la fonction m ('i' (t), x (t)) est continue, alors la fonction
C?l!t ('" (t), x (t)) cOl'ncide avec elle par t 0 u t sur l'intervalle 1 (et pour
cette raison est continue). Nous allons maintenant prouver que la
fonction m ('" (t), x (t)) et, par conséquent, la fonction Q/!{ ('" (t), x (t))
es t a b sol ume n t con t i il U e sur l' in ter v aIle 1.
L'intervalle 1 étant compact, il existe dans l'espace engendré
par les variables 1Po, 1P1, . . ., 1Pn, X O , Xl, . . ., x n un ensemble borné
et convexe Q tel que le point ('" (t), x (t)) appartienne à l'ensemble Q
lorsque tEl. Par conséquent, le triplet ('" (t), x (t), u (t)) appartient
à l'ensemble Q X P lorsque t E J. D'autre part, les dérivées partielles
de la fonction QJ8 (",. x.. u) par rapport à 1Pa, x a étant continues en les
variables "', x, u (voir les conditions imposées aux fonctions fi dans
le 11), elles sont bornées sur l'ensemble compact Q X P. Il s'en-
suit qu'il existe une constante K > 0 (ne dépendant pas de u) telle
que quels que soient ("', x) E Q, (",', x') E Q et u E P est vérifiée la
relation
1 QJt ("" x, u) - QJt (",', x', u) 1 Kd,
(39)
où d est le plus grand des nombres l1Pi -1Pi 1, 1 Xi - X'i 1, i ==
== 0, 1, . . ., n. Soient ("" x) et (",', x') deux points de l'ensemble Q
et u et ut des points de l'ensemble P tels que
m ("" x) == QJB ("', x, u), m ('i", x') == QJ£ (",', x', u ' ).
Les inégalités sont immédiates
0Jt ('i', x, u') 0Jt ("', x, u), JJl (",', x', u) QJt (",', x', u ' ),
et en vertu de (39)
-Kd OJ8 ("" x, u ' ) - OJ£ (",', x', u')
15.]
DÉMONSTRATION DU PRINCIPE DU MAXIMU1\I
95
0Je ('i', x, u) - Q}[ ('i", X', U') Kd.
.A.utrement dit,
1 m ('i', x) - m ('i", x') 1 Kd,
où d est le plus grand des nombres l'lI'i -'lI'i 1, 1 Xi - x'i 1, i =
== 0, 1, . . ., n. Il s'ensuit notamment:
1 m ('i' (t), x (t)) - m ('i' (t'), x (t')) 1 Kd, t, t' E l,
où d est le plus grand des nonlbres l'lI'i (t) -'lI'i (t') 1, 1 xi(t) - Xi (t') 1.
De cette inégalité, en vertu de la continuité absolue des fonctions
'\ (t) et x (t), nous concluons aisément que la fonction m ('i' (t), x (t))
est absolument continue.
Prouvons enfin que la fonction m ('i' (t), x (t)) admet presque
partout une dérivée nulle. Par suite de la continuité absolue de la
fonction m ('i' (t), x (t)) et par définition des fonctions x (t) et 'i' (t)
nous avons presque partout sur l'intervalle 1 : la fonction
m ('i' (t), x (t)) est dérivable et les fonctions x (t) et 'i' (t) vérifient
les relations (7) et (8), ou, ce qui revient au même, (9) et (10), et
de plus
m ('i' (t), x (t)) === Q)[ ('i' (t), x (t), u (t)).
Soit t == 't un point quelconque où a lieu ce qui vient d'être dit sur
]es fonctions m ('i'. (t), x (t)), x (t) et'i' (t), et soit t'un point quelcon-
que de l'intervalle 1 distinct du point 't. Alors
m ('i' (t'), x (t')) QJt ('i' (t'), x (t'), U ('t)),
et donc
ln ('l' (t'), x (t ' )) - m ('i' ('t), X ('t)) QJ£ ('i' (t'), x (t'), u ('t)) -
- QJt ('i' ('t), x ('t), U ('t)).
Nous allons maintenant supposer que t' tend vers 't à droite, i .e.
t' - 't et positif. On ne change donc pas le signe de la dernière
expression en la divisant par t' - 't:
m ('i' (t'), x (t')) -m ('i' Cr), x (1")) Q16' ('i' (t ' ), x (t ' ), U (1")) - Q16' ('i' (1"), x (1"), U (1"))
t' -'t -::? t' - 1" .
En passant aux limites pour t' - 't (t' > 't), il vient
d d
lIt m ('\1' (t), x (t)) It=-r>dT $8 ('i' (t), x (t), u ('t)) It=-r ==
n n
= aQ/& . dlpa (t) 1 + aQJe .
alpa at t=-r axa
a=O a=O
axat
al
j -0
t=T:
96
DÉMONSTRATION DU PRINCIPE DU MAXIMUM
[Ch. 2
(les dérivées sont calculées au point ,;,où ,; et, par conséquent u (,;),
sont fixes). D'une façon analogue, lorsque t' -+,;, t' <,;, nous
obtenons l'inégalité inverse
d
dt m ('i' (t), x (t» It=-r o.
Donc la fonction m ('i' (t), x (t)), tout comme la fonction
(lIt ('i' (t), x (t)) qui co ïnci de avec elle, est une fonction absol umen t
continue admettant presque partout une dérivée nulle. Il s'ensuit
donc que cette fonction est constante sur l'intervalle 1.
Démontrons la propriété suivante importante des cônes K'C-
Lem m e 8. Si ,; et ,;' sont des points réguliers de la commande
u (t) tels que t o < ,;' < ,; < t i , alors A'C'L' (l{L') C K'C où AL, 'C'
est une application de l'espace X L' sur X 1: définie au g 12.
En effet, le cône K 'C' est constitué par des vecteurs dont chacun
peut être représenté, en vertu de (22), sous forme d'une somme de
deux vecteurs:
1X = f(x (,;'), u (,;')) ôt,
s
2X= A'C',-r. [f{X(';i), vi)-f(x{';i), U(';i»)]ôt i .
i=1 z
Il suffit donc de montrer qu'ont lieu les inclusions
A-r, -r' (iX) E K1:, A-r, -r' (2X) E K".
D'après (17) nous avons:
(40)
s
AL, 'C' (2X) == A-r, Li [f-(X{';i), Vi)-j'(X{';i), U (';i)] ôth
i=1
et donc a lieu la deuxième des inclusions (40) (puisque ';1
. . . ,; s ,;' < ,;). Prouvons la première de ces inclusions.
Supposons que (pour un certain ôt) le vecteur A L,L' (1X) n' appar-
tienne pas au cône K 'C. Il existe alors un hyperplari les séparant,
i.e. il existe des nombres ao, ai, . . ., an tels que le cône K 1: soi t
n
situé dans le demi-espace négatif G:axa ,0, et le vecteur
a=O
A'C'1:' (1X) dans le demi-espace positif 0 u ver t, i.e.
(a, A'C,"')(1X))>0, (41)
où a est le vecteur de composantes (a o , ab . . ., an). Désignons par
'i' (t, a) la solution du système (8) vérifiant la condition initiale
'i' (';, a) = a. Etudions cette solution sur l'intervalle t o t ,;.
Puisque le cône K'C est situé dans le dei-espace négatif, i.e. est
remplie 'la condition (34), il résu}te alors des lemmes 5,7, et 6 que
&ft (", (t, a), x (t» = 0 pour t o t ,;. Puisque par ailleurs ,;'
15,]
DÉMONSTRATION DU PRINCIPE DU MAXIMUM
97
est un point régulier (qui est situé dans l'intervalle t o < t T),
il vient alors d'après le lemme 5
QJ£ ('i' (Tf, a), x (Tf), U (Tf)) == GIIt ('i' (Tf, a), x (-r f )) == 0,
l.e.
('i' (Tf, a), j" (x (T f ), u (-r f ) )) == O.
])' où il s'ensuit d'après le lemme 1 :
('i' (T, a), A-r, -r', ({(x (Tf), u (-r f ))) == 0,
or cette relation contredit l'inégalité (41); le lemme 8 est donc dé-
rnontré.
Soit maintenant T un point régulier quelconque de la commande
u (t), situé dans l'intervalle t o < t < t 1 . Posons K:) ==
==: A ii ,,; (1('L). L'application A t1 .'L étant linéaire, I(:) est un
cône convexe contenu dans l'espace X ii. Les cônes K) forment une
sui tee roi s san te: si -r f < T sont des points réguliers, alors
d'après le lemme 8 il vient (voir (17))
1( ') == Att, ,;' (K,;') == Att, -r (A-r, 'L' (I{ -r')) c Ail, -r (l( ,,) == K) ·
(:'est pourquoi l'union (par tous les points réguliers T de l'intervalle
t o < t < t 1 ) de tous les cônes I{) est de nouveau un cône convexe
(pas forcément fermé) contenu dans l'espace X tt (admettant l'ori-
gine des coordonnées pour sommet). Nous désignerons ce cône par
]( il et l'appellerons cône limite.
Lem m e 9. Si la commande u (t) et la trajectoire associée x (t),
t o t t 1 , sont optimales, alors le rayon Ltt issu du point x (t 1 ) et
orienté dans le sens du demi-axe négatif X O n'appartient pas à l'in-
térieur du cône K ti.
Supposons, en effet, que le rayon L ti appartienne à l'intérieur
du cône l{ ii. Choisissons un polyèdre convexe M, contenu entièrement
dans l( il et renfermant un point quelconque l E L tl à son intérieur.
1out sommet du po]yèdre M appartient au cône Ktp i.e. appartient
à un cône I(}), or comme les cônes K) forment une suite croissan-
te, il existe un point régulier -r tel que t 0 u s les sommets du poly-
èdre M appartiennent au cône l{). Le cône K:) contient donc le
polyèdre M tout entier et le point l est un point intérieur au cône
1(), ou, ce qui est équivalent, le rayon Ltt appartient à l'intérieur
du cône K). Le rayon A,1 ,; (L tt ) appartient alors à l'intérieur du
c.ône A, (K») = K" (car At";,\ est une application linéaire et
non dégénérée, donc, une application homéomorphe). Le rayon
.fl,1 " (Lit) se confond avec le rayon L" issu du point x (T) et orienté
dans le même sens que le demi-axe négatif x o . Ceci découle de ce que
les seconds membres du système d'équations aux variations (16)
7-01339
98
DÉMONSTRATION DU PRINCIPE DU MAXIMUM
[Ch. 2:
ne dépendent pas de xo, et, par conséquent, les vecteurs (-1, 0, . . ..
. . ., 0) issus des points de la courbe x (t) et égaux entre eux se dé':'
duisent l'un de l'autre par une translation le long de la trajectoi-
re x (t).
Ainsi le rayon L" appartient à l'intérieur du cône K", ce qui
contredit l'optimalité de la commande u (t) (voir le lemme 4).
Achevons maintenant la démonstration du théorème 8. Soient
II (t), t o t t b une commande optimale et x (t) la trajectoire
optimale associée. Le rayon Lt1 n'appartient pas alors à l'intérieur-
du cône limite If ti (lemme 9), et, par conséquent, il existe un hyper-
plan les séparant, i.e. des nombres Co, Ci' . . ., C n tels que le cône.
n
Kt! soit contenu entièrement dans le demi-espace L: crxXX Ot
(1=0
?1
et le rayon L ti dans le demi-espace L; cax a O. Autrement dit, le
a=O
vecteur (-1, 0, 0, . . ., 0) qui est orienté dans le même sens que
n
le rayon L ti est contenu dans le demi-espace fermé L; cax a O
a,=o
i.e. Co O.
Désignons par'i' (t) = (11'0 (t), 'lJJ1 (t), · . ., lPn (t» la solution dlt
système (8) vérifiant la condition initiale 'i' (t f ) = C où C est le.
vecteur de composantes (co, Ci, . . ., c n ). Le système (8) étant li-
néaire, la solution 'i' (t) est définie sur l'intervalle t o t if tout
entier. Montrons que le vecteur'i' (t) n'est autre que le vecteur dont
l'existence est affirmée par le théorème 8.
Remarquons tout d'abord que x (t) et'i' (t) vérifient les équations.
(7) et (8) ou, ce qui revient au même, (9) et (10). Montrons que la
relation (11) a lieu en tout point régulier de l'intervalle t o < t < t i .
Soit '( un point régulier de cet intervalle. Puisque le cône Il. in et par
conséquent le cône A tn: (If.;), est situé tout entier dans le demi-
n
espace négatif 'lJJa (t f ) x a 0, il vient (par une translation du
rx=O
point x (t l ) au point x Cr) le long ne la trajectoire x (t» que le cône
Ait1,-.;(Att," (11.-.;») = K" tout entier est situé dans le demi-espace
n
'l'a (,;) x a 0 (voir 12). Autrement dit, le vecteur a = 'i' (,;)
a=O '
satisfait à la condition (34). Il s'ensuit que l'assertion du lemme 5,
est valable pour la solution 'i' (t, a) de l'équation (8) vérifiant la
condi tion initiale", ('t, a) = a, or cette solution coïncide manifeste-
ment avec 'i' (t). En particulier (puisque '( est un point régulier),
QJt (", ('(), x ('(), u (-r) = &ft (l!' (1"), X ('t» = 0
(voir le lemme 6).
Ainsi donc est remplie la condition 1° du théorème 8. Il existe en
outre des points en lesquels 1a fonction cIIt ('i' (t), x (t» s'annule (i.e.
16.1
CONDITIONS DE TRANSVERSALITÉ
9S1
en chaque point régulier ,;) et par ailleurs 'Po (t 1 ) = Co O. Pour
vérifier donc la condition 2° du théorème 8 il suffit de démontrer la
dernière assertion de ce théorème sur la constance des fonctions
aIIt ("i' (t), x (t)) et 'Po (t) lorsque "i' (t), x (t), u (t) vérifient le systè-
me (9), (10) et lorsque est remplie la condition 1°. Ceci découle immé-
diatement du lemme 7 et du fait que les fonctions fa ne dépendent
pas de x O , de sorte que la première des équations (8) est de la forme
o = O. Le théorème 8 est donc entièrement démontré. Par la même
occasion, nous avons démontré le théorème 1 du chapitre 1.
S 16. Conditions de transversalité
Nous allons prouver ici le théorème 3 (valable pour une classe
quelconque D de commandes admissibles) que nous avons formulé
au chapitre 1.
Soient u (t), t o t tf, une commande admissible et x (t) la
trajectoire associée issue du point Xo = (0, xo). Soit par ailleurs S 0
une variété continûment différentiable (dans l'espace X) de dimen-
sion ro < n, passant par le point Xo, et T 0 le plan tangent en ce
point à la variété S o. Désignons par .!!7 0 le plan de dimension ro
contenu dans l'espace X et constitué de tous les points (0, x) où x E
E T o. Il est évident que le plan !T 0 passe par le point Xo. En faisant
subir au plan 3' 0 une translation le long de la trajectoire x (t) pour
l'amener au point x (,;), t o < ,; < t 1 , nous obtenons le plan
A 'C. to (Y 0) passant par le point x (,;). Si ,; est un point régulier de
la commande u (t), alors est également défini un cône 1{'C de sommet
au point x (,;). Désignons par QJC 'C l'enveloppe convexe de l'ensemble
A'C. to (Y 0) U K'C. Il est évident que l'ensemble 'C est un cône
convexe ayant son sommet au point x (,;). Ceci posé, démontrons un
lemme généralisant le lemme 3.
Lem ID e 10. Soient ,; (t o < ,; < t 1 ) un point régulier de la
commande u (t), t o t t b et x (t) la trajectoire associée issue du
point xo. Soit par ailleurs A une variété à bord de dimension n9n supé-
rieure à n et contenue dans X de telle sorte que le point x (,;) soit situé
sur ce bord. Désignons par M le demi-plan tangent en x (,;) à la variété
A. Si les cônes 6'JC 'C et M de sommet commun x (,;) ne sont pas séparables.,
il existe une commande u* (t) et un point x E S 0 tels que la trajectoire
x* (t) associée à u* (t) et issue du .point x = (0, x) passe par un poin
de la variété A non situé sur son bord. .
D é mon s t rat ion. Désignons par n la projection orthogo
nale de la variété Bo'sur le plan To. L'application n considérée non
pas sur la variété So tout entière" mais dans un certain voisinage du
point Xo est un homéomorphisme; donc est définie une application
réciproque n- 1 d'un certain voisinage du point Xo du plan To sur
7*
1.00
DÉMONSTRATION DU PRINCIPE DU MAXIMUM
[Ch. 2
un certain voisinage du point Xo de la variété S o. Si donc S est un
vecteur quelconque situé dans le plan T 0 et issu du point Xo, alors
pour un E > 0 suffisamment petit, est défini le point n- 1 (ES) E
E 8 0 , i.e. le vecteur S définit une 1 i g n e
x == n- 1 (e), Oe < eo,
située sur la variété S 0 et issue du point Xo. Le vecteur est tangent
à cette ligne en Xo, i.e.
n- l (e) == Xo + e + 0 (e).
D'où il s'ensuit que la ligne (0, n- 1 (e)) E X est issue du point
Xo == (0, xo) et admet en ce point un vecteur tangent S == (0, ):
(0, 1[-1 (eS)) == Xo + eS + 0 (e). (42)
Soit a === {'ti1 Vi' 't, ôt i , ôt} l'ensemble des grandeurs définis-
sant la perturbation de la commande u (t) (voir page 85). Désignons
par x, a (t) la trajectoire issue du point (0, 1[-1 (g)) (à l'instant t o )
associée à la commande perturbée u* (t) (le paramètre e est le même
dans (42) et dans la définition de la commande u* (t)). De (42) et
(21) il vient
x, a ('t + eôt) == X ('t) + e [A-r, to (S) + xa] + 0 (e), (43)
üù le vecteur Xa est défini par la formule (22).
Désignons par s + 1 la dimension de la variété A (et du demi-
plan M). Puisque les cônes 6Jî -r et M ne sont pas séparables, il existe
(voir la note de la page 86) un point a appartenant au demi-plan
M, mais non à son bord, et un plan C de dimension n - s > 0
passant par le point a, tels qu'une boule de rayon petit centrée en
a engendre, en coupant le plan C, une « aire complémentaire » au
demi-plan M. Cette « aire » est orthogonale à la droite passant par les
points x et) et a, et est entièrement contenue dans le cône % '(. Nous
désignerons par E cette « aire complémentaire » qui n'est autre
qu'une boule de dimension n - s. Soient e17 . . ., en -s des rayons
mutuellement orthogonaux de la boule E; posons I.i == -eh i ==
== 1, . . ., n - s. Nous supposerons que les vecteurs et, . . .
. . ., en-s' fl, . · ., fn-s ont pour origine le point a. Les extrémités
de ces vecteurs sont situées sur le cône 6% '( (car E c: r/C '(). Désignons
enfin par c le vecteur d'origine x ('t) et d'extrémité a. Puisque les
vecteurs c, c + ei, c + fi (i == 1, . . ., n - s) d'origine x ('t) appar-
tiennent au cône 6JC 1: et que celui-ci est formé de tous les vecteurs
A '(. t o (S) + a possibles où E T 0' L\x l1 E I{ 1:' il existe dans le
plan To des vecteurs o' i' · · ., n-s' , · · ., -s d'origine Xo
et des symboles ao, ai' · .., an-s,a, · · ., a-s tels qu'on ait
A-r, to (So) + xao = C, A't, to (i) + xai == c + ei,
A -r, to ( si) + x a == c + rh i == 1, ..., n - s.
1.
16.]
CONDITIONS DE TRANSVERSALITÉ
101
Sous la condition que
(pl)2 + (p2)2 + . . . + (pn-S)2< 1,
(44)
définissons le symbole a(pl, . . ., pn-s) de la même façon qu'à la
page 88, mais en sommant en i non pas de 1 à n, mais de 1 à n - s;
posons par ailleurs
n-s n-s
S (pt, ..., pn-.) = (1- 1 pi 1 ) So + h+ (pin; +
i=1 i=1
n-s
+ h-(pi)sj.
i=1
II vient alors (voir les calculs de la page 88):
n-s
A 1:, to (6 (pl, ..., pn-.» + LlXa(pl, . . ., pn-s) = c + pie;. (45)
i=1
Si donc le point (pl, . . ., pn-s) décrit la boule (44) dans l' esp ace
numérique de dimension n - s, alors l'extrémité du vecteur (45)
décrit dans l'espace X" une boule Et, déduite de la boule E par une
homothétie de centre a et de rapport 1 ln. Sous les mêmes condi tions,
l'extrémité du vecteur
ë [A", to (6 (pl, .. ., pn)) + Xa (pl, . . ., pn-s)]
décrit une boule E e de dimension n - s déduite de la boule Et par
une homothétie de centre x (,;) et de rapport ë.
Pour S == S (pl, . . ., pn-s) et a == a (pl, . . ., pn-s) la trajec-
toire xt, a (t) dépend continûment des paramètres pl, . . ., pn-s de
même d'ailleurs que ôta. C'est pourquoi le point x;, a (,; + ëôt a )
dépend continûment de pl, . . ., pn.-s. Donc, lorsque le point
(pl, . . ., pn--s) décrit la boule (44), le point x!, a (,; + ëôt a ) décrit,
lui, (pour ë quelconque fixe) un certain « disque » F e (image conti-
nue de la boule (44)), « coïncidant » avec la boule E e avec une pré-
cision d'un ordre de petitesse supérieur par rapport à ë. La boule
E e et le demi-plan M (ou, plus exactement, la dernière portion voi-
sine du point x (,;)) sont des chaînes (voir la note de la page 90)
respectivement de dimensions n - s et s + 1, l'indice d'intersec-
tion de ces chaînes étant égal à + 1 et la distance de toute chaîne
à l'extrémité de la suivante étant de l'ordre de ë. C'est pourquoi le
« disque» Fe (distant de Ee d'une grandeur d'un ordre de petitesse
supérieur par rapport à ë) et la variété A (tangente au demi-plan M)
possèdent pour ë suffisamment petit un indice d'intersection égal
à + 1, i.e. pour ë suffisamment petit le disque Fe coupe la variété A
en un point non situé sur le bord de cette variété. Autrement dit,
102
DÉMONSTRATION DU PRINCIPE DU MAXIMUM
[Ch. 2
il existe un B > 0 et des pl, . . ., pn-s tels que le point xt a ('t + eôt a )
appartienne à la variété A, mais n'est pas situé sur son bord. En dé-
signant donc par u* (t) et x* (t) les grandeurs u (t) et xt a (t) cor-
respondant aux valeurs choisies de ê, pl, . . ., pn-s, on constate
que la trajectoire x* (t) commence au point x* (t o ) = (0, rc- l (8£») =
= (0, x:) où x: === n- l (B;) E 8 ° et passe (à l'instant 'L" 'L +
+ eôt a ) par un point de la variété A, non situé Sllr le bord de celle-ci.
Le lemme 10 est donc démontré.
Soient maintenant 'u (t), t o t t 1 , une commande optimale
et x (t) la trajectoire optimale, donnant la solution du problème aux
extrémités libres posé dans le 6. Posons x (t o ) === xo, x (t i ) = X1 ;
définissons les points Xo et Xi de l'espace X en « rejetant », comme
précédemment, la coordonnée « nulle » des points xo, Xi' i.e. Xo =
= (0, XO), Xi === (X O (t 1 ), Xl). Désignons par Ti le plan tangent en Xi
à la variété 8 1 et par Ylle plan (de dimension ri) contenu dans l'es-
pace X constitué de tous les points de la forme (XO (t i ), x) où x E Tl.
Traçons en chaque point du plan !7 1 un rayon parallèle au demi-axe
pégatif xo, et désignons par Q l'ensemble des points de ces rayons.
'ensemble Q est un demi-plan de dimension ri + 1, dont les points
'frontières appartiennent au plan Y 1. Introduisons d'une façon ana-
logue les notations T ° et Y 0' et désignons par t1 1 ' enveloppe con-
vexe de l'ensemble A t1. to (.7"' 0) U If. t1. Donc, le cône 6% t de sommet
.x (t) est défini pour tout point régulier t === 't de la commande u (t)
ainsi que pour t === t 1 . Si t" > t', alors At" ,t' (6% t') C 67î tIf (voir
lemme 8).
Lem m e 11. Les cônes 6% ti et Q de sommet commun au point
x (t 1 ) sont séparables.
En effet, supposons que les cônes QJî tt et Q ne sont pas séparables.
Puisque 6%t1 est l'union des cônes Att. '( (&f''(), il existe un point
régulier 't de la commande u (t) tel que les cônes A t10 '( (6% ,,) et Q
ne soient pas séparables. Considérons ce point 'ta
Désignons par A ti la variété dont le bord est constitué de tous
les points (XO, x) EX, pour lesquels Xo Xo (t 1 ), x E 8 1 . Alors le
demi-plan tangent en X (t 1 ) à la variété Att. se confond avec Q. Etant
donné un point quelconque 11 E Att. désignons par y (t, 1]) la solu-
tion du système (7) vérifiant la condition initiale 1/ (t 1 , 11) === 11.
Nous allons considérer cette solution sur l'intervalle 'L t tt,
où 'L est le point régulier choisi plus haut de la commande u (t).
Lorsque le point 11 décrit la variété Ait, le point 11 ('t,11) décrit lui
aussi une variété A'( avec bord. On voit aisément que le demi-plan
tangent en X ('t) à la variété A" se confond avec A tt '( (Q).
Les cônes Ah." (6% ,,) et Q n'étant pas séparables, les cônes
At1 'C (A t1, " (,,» === 6%" et A 't (Q) ne le sont pas non plus. Or
puisque A -r (Q) est un demi-plan tangent à la variété A'(, il existe
16.1
CONDITIONS DE TRANSVERSALIT
103
donc, en vertu du lemme 10, une commande u* (t) telle que la tra-
jectoire x* (t) issue du point x: = (0, x), où xci E S 0 qui lui est
associée passe par un point !le la variété A,; non situé sur son bord.
Autrement dit, il existe un t' > t o et un point 1] E A ti non situé sur
le bord de la variété A ti tels que
x* (t ' ) = 1/ ('r, 1]). (46)
Définissons maintenant la commande u** (t) sur l'intervalle
iD t t 1 + (t ' - T) comme suit:
{ u* (t) pour t o t t ' ,
u** (t) = u (t _ (t' _ 't)) pour t' < t t 1 + (t' - 1:),
La trajectoire x** (t) associée à la commande u** (t) et issue du
point x; est de la forme (cf. (46)) :
( ) { x* (t) pour t o t t '
x** t = ,
1/ (t - (t ' - T), 1]) pour t ' t t f + (t ' - T).
En particulier, x** (t f + (t ' - T)) = 1/ (t f , 1]) = 1'). Or le point
1) appartient à la variété A ti , i.e. est de la forme 1] = (11 0 , 11) où
11 E 8 1 . Puisque, par ailleurs, le point 1] n'est pas situé sur le bord
de la variété Atp il s'ensuit que 11° < X O (t 1 ). La commande u** (t)
transfère donc le point représentatif de la position x à la position
11 E 8 1 , et en outre la fonctionnelle (6) prend une valeur 110 plu s
pet i t e que pour la commande u (t). Ce qui contredit l'optimalité
de la commande et de la trajectoire x (t). Le lemme 11 est donc dé-
montré. ' '
Il est maintenant aisé d'achever la démonstration du théorème 3.
Les cônes c?7C ti et Q étant séparables, il existe des nombres Co, Cf, . . .
· · ., C n tels que le cône.c?7C ti (et par conséquent K t1 c t1) soit situé
n
dans le demi-espace C(1.x a 0 (où xo, Xl, . . ., x n sont des coor-
a=O
données dans l'espace X ti)' et le cône Q dans le demi-espace
n
c(1.x a o.
'a=O
En particulier, le rayon Lt! (contenu dans le demi-plan Q) est
n
situé dans le demi-espace c(1.x a O. Les nombres Co, Cf' . . ., C n
a=O
jouissent donc de toutes les propriétés mentionnées dans le 9 15 et,
par conséquent, la solution"" (t) du système (8) vérifiant la condi-
tion initiale"" (t 1 ) = C (où c est le vecteur de composantes (co, Ci1 . . .
. . ., cn)) satisfait aux conditions du théorème 8 (ou du théorème 1).
lVIontrons que le vecteur"" (t) satisfait à la condition de transver-
salité aux deux extrémités de la trajectoire x (t). Le plan S 1 (con-
104
DÉMONSTRATION DU PRINCIPE DU MAXIMUM
[Ch. 2
n
tenu dans Q) est entièrement situé dans le demi-espace 2j cax a 0
a=O
.n
et, par conséquent, dans 1 'hyperplan cax a = 0, ou ce qui est
a=O
n
équivalent, dans l'hyperplan lPa (t l ) x a = O. Si maintenant
a=1
11 = (11 1 , · · ., l1 n ) est un vecteur quelconque tangent en x (t l )
à la variété St, i.e. un vecteur situé dans le plan Tt, alors le vecteur
1] = (0, 11) E X est situé dans le plan .!Y t, et par conséquent, dans
n
1 'hyperplan h lPa (tt) x a = O. En d'autres termes, ('\1' (tt), 1]) = o.
a=O
Or comme la coordonnée « nulle » du vecteur 1] est égale à zéro, la
n
dernière relation prend la forme 1P\' (tt) 'Y}" = O. Le vecteur fonc-
,,=1
tion'\l' (t) satisfait donc à la condition de transversalité à l' extré-
mité droite de la trajectoire x (t).
Par ailleurs, le plan Ah ,to (r 0) c 6%t1 est entièrement contenu
n
dans le demi-espace caXX 0 et, par conséquent, dans l'hyperplan
a=O
n
cax a = 0, ou, ce qui est équivalent, dans l'hyperplan
a=O
n
lPa (tt) x a = O. En d'autres termes, quel que soit le vecteur
a=O
sE 3 0 , le vecteur Atuto (s) est contenu dns l'hyperplan
n
lPa (tt) x a = 0, l.e.
a=O
('\1' (tt), At, to (£)) =0.
Il s'ensuit, en vertu du lemme 1, que ('\1' (t o ), S) = O. Or tout vecteur
S E y 0 est de la forme S = (0, £), où £ = (£1, . . ., £n) est un
vecteur contenu dans le plan T o. Donc la relation ('\1' (t o ), s) = 0
n
prend la forme 1P\' (t o ) £" = O. Le vecteur fonction '\1' (t) satisfait
'\'=0
donc à la condition de transversalité à l'extrémité gauche de la
trajectoire x (t).
Le théorème 3 est entièrement démontré et par la même occasion
tous les autres théorèmes du chapitre 1.
CHAPITRE 3
Problèmes linéaires en temps
optimal
9 17. Théorème du nombre de commutations
Les problèmes linéaires en temps optimal (i.e. des problèmes où
sont linéaires les équations régissant le mouvement de l'objet étu-
dié) sont importants pour les applications et illustrent bien les ré-
sultats généraux. Le présent chapitre est consacré à l'étude de telS'
problèmes. Nous ne nous contenterons pas seulement d'exposer des
faits découlant immédiatement des théorèmes démontrés plus haut,
nous déduirons de nouveaux résultats et nous démontrerons notam-
ment le théorème d'existence pour les problèmes linéaires en temps
optimal.
Précisons tout d'abord la p 0 s i t ion d u pro b 1 è me. N OTIS
allons étudier un objet dont le mouvement est gouverné par un
système linéaire d'équations différentielles
n r
d.Ii "" i ,, + b i
([t = LJ a"x LJ p uP ,
,,=1 p=1
Nous supposerons que le domaine de commande U est un polyèdre *)
borné, fermé et convexe, situé dans un espace vectoriel Er de di-
mension r, muni des coordonnées u l , . . ., ur. Le paramètre de com-
mande u == (u l , . . ., ur) est donc un point du polyèdre U.
Nous étudierons enfin uniquement le problème en temps opti-
mal, i.e. le problème consistant à minimiser le temps de transfert
ti
t l - t o = j' dt. Nous appellerons le problème optimal ainsi for-
to
mulé problème linéaire en temps optimal.
Le système (1) peut se représenter sous la forme vectorielle sui-
vante:
i == 1, 2, ..., n.
(1)
dx
([t== Ax+Bu,
(2)
*) Un polyèdre fermé convexe dans Er est l'intersection d'un nombre fini de-
semi-espaces fermés, Le. un ensemble de points dans Er vérifiant un système-
n
fini d'inégalités linéaires auh<i, i == 1,2, . . ., s. S'il est borné (et donc-
h=1
COffipact), ce polyèdre est une enveloppe convexe de ses sommets; il est évident
que le nombre de sommets est fini.
106
PROBLÈl\ŒES LINÉAIRES EN TEMPS OPTIMAL
[Ch. 3
où A : X -+ X et B: Er -+ X sont' des opérateurs linéaires représen-
tés (en coordonnées Xl, . . ., x n , et u l , . . ., ur) respecti vement par
les matrices (a}) et (bk).
Dans tous les théorèmes démontrés dans ce chapitre, nous sup-
poserons (sans le spécifier chaque fois) qu'est remplie la condition
de position commune suivante imposée aux coefficients de l'équa-
tion (2) et à la disposition du polyèdre U:
si west un vecteur orienté dans le sens de l'une des arêtes du polyè-
dre U, le vecteur Bw n'appartient à aucun véritable sous-espace de
l'espace X, invariant re,lativement à l'opérateur A, i.e. les vecteurs
Bw, ABw, ..., An-1Bw (3)
sont linéairement indépendants dans l'espace X.
Dans notre cas la fonction H (11', X, u) (voir théorème 2) est
de la forme
H = (1P, Ax) + (1P, Bu) == 2J 'lJ1axv + 2J '\J1buP (1.)
J.t, v J.t, P
et le système auxiliaire (voir formule (19) du chapitre 1):
n
d1l' . v
d/ == - L.I aj 'i'v,
v=1
j = 1, ..., n,
()u, sous la forme vectorielle,
= -A*1jJ,
(5)
où A * est l'opérateur adjoint de A, i.e. un opérateur représenté (dans
le même système de coordonnées) par la transposée de la matrice
(a}) du système (1).
Il est évident que la fonction H qui est considérée comme une
fonction de la variable u E U atteint son maximum en même temps
que la fonction (11', Bu). Désignons par P (11') le maximum de la fonc-
tion ('\f', Bu) qui est considérée comme une fonction de la variable
u E U. Du théorème 2 il vient (voir la formule (20) du chapitre 1)
que si u (t) est une commande optimale transférant le point repré-
sentatif de la position Xo à la position Xi' il existe une solution '\p(t)
,de l'équation (5) telle que
(11' (t), Bu (t» = P (11' (t»). (6)
Or, comme l'équation (5) ne contient pas les fonctions inconnues
x (t) et u (t), toutes les solutions de cette équation peuvent être
facilement déterminées, après quoi il est aisé de trouver toutes les
commandes u (t), solutions de l'équation (6) ; parmi ces commandes
figurent de toute évidence toutes les commandes optimales de l' équa-
tion (2). Voyons comment la condition (6) définit univoquement la
bommande u (t) en fonction de 11' (t).
. 17]
THÉORME DU NOMBRE DE COMMUTATIONS
107
Thé 0 r è m e 9. Pour toute solution non triviale'i' (t) de l'équa-
tion (5), la relation (6) définit d'une manière univoque *) une com-
nande u (t) constante par morceaux et dont les valeurs ne sont autres
que les sommets du polyèdre U.
D é mon s t rat ion. Puisque la fonction
('1' (t), Bu), (7)
q:ui est considérée comme une fonction du vecteur u est linéaire,
elle est soit constante, soit atteint son maximum uniquement sur
la frontière du polyèdre U. Ceci est également valable pour toute
face du polyèdre U. Don"c, la fonétion (7) atteint son maximum soit
.en un sommet seulement du polyèdre U, soit sur toute une face de
ce polyèdre **). Montrons qu'en vertu de la condition de position
commune, la dernière éventualité n'est possible que pour un nombre
fini de valeurs de t.
En effet, supposons qu'il existe sur l'intervalle t o t t f une
infinité de valeurs t en lesquelles la fonction (7) de la variable u E
E U atteint son maximum sur une face (de dimension positive) du
polyèdre U. Puisque U posséde un nombre fini de faces, nous pouvons
choisir un ensemble infini M de t pour lesquels la fonction (7) atteint
son maximum sur une face r (la même pour tous les t E ]VI) du polyè-
dre U. Par conséquent, quel que soit t E M, la fonction (7) de la
variable U est constante sur la face r. Soient Uo et Ui des vecteurs
ayant pour origine l'origine des coordonnées (de l'espace Er) et
pour extrémité une arête de la face r, de sorte que le vecteur w =
= Ut - Uo est orienté dans le même sens que cette arête. Pour t E M
nous avons (puisque la fonction (7) est constante sur la face r)
(, (t), Bw) = ('lf' (t), B (Ut - uo)) =
= ('i' (t), BUt) - ('1' (t), Bu 2 ) = O. (8)
Soient maintenant b l , b 2 , . . ., b n les coordonnées du vecteur
Bw (b l , b 2 , . . ., b n sont constantes puisque west une arête e n -
t i ère men t d é fin i e du polyèdre U). Alors,
( 1p (t), Bw) = b l 1Pt (t) + b 2 1P2 (t) + . . . + bn1Pn (t). (9)
Pllisque les fonctions 'tPi (t), 'i'2 (t), . . ., 'lf'n (t) constituent une solu-
tion'lJ' (t) de l'équation (5) à coefficients constants, elles sont a n a -
.1 Y t i que s, et par conséquent la fonction (9) est aussi analytique.
*) Comme dans le chapitre 1, nous supposons que les commandes considérées
sont semi-continues à gauche et continues aux extrémités de l'intervalle t o
t t1 (voir page 12). Sans cette condition le théorème 9 serait faux, Le. les
valeurs de la fonction U ,(t) "ne seraient pas univoquement définies aux points
.de discontinuité. Il est d:ailleurs clair que les valeurs de la fonction u (t) aux
points de discontinuité 1)e jouent aucun' rôle dans les problèmes étudiés.
**) Nous considérons' que le polyèdre est une face (impropre) de lui-même.
108
PROBLÈMES LINÉAIRES EN TEMPS OPTIMAL
[Ch. 3
Pour tout t E M (i.e. pour un ensemble infini de t) la fonction ana-
lytique ('1' (t), Bw) de la variable t s'annule (voir (8» et on a donc
sur l'intervalle t o t tt
('1' (t), Bw) = O. (10)
Une dérivation successive de cette relation par rapport à t donne
(puisque '1' (t) est solution de l'équation (5»
(A *'1' (t), Bw) == 0,
(A *2lJJ (t), Bw) == 0,
(A *n- 1 1lJ (t), Bw) == 0,
ou (puisque (x, Ay) == (A *x, y) est valable quels que soient les
vecteurs x, y)
('1' (t), ABw) == 0,
(1IJ (t), A 2 Bw) === 0,
(11 )
. . . . . . . . . .
(1IJ (t), An-lBw) == O.
Les vecteurs (3) constituant une base dans l'espace X en vertu de la
condition de position commune, les relations (10) et (11) signifient
que quel que soit t, t o t t l , le vecteur 1IJ (t) est orthogonal à
tous les vecteurs d'une certaine base et par conséquent est nul, ce
qui, toutefois, contredit la non-trivialité de la solution '1' (t).
Donc, pour tous les t à l'exception d'un nombre fini de valeurs,
t o t tt, la fonction (7) atteint (sur U) son maximum seulement
en un point, sommet du polyèdre U. Il s'ensuit en vertu de (6) que.
la fonction u (t) est définie d'une manière univoque (voir la note:
de la page 107).
En écartant les points où l'équation
('i' (t), Bu) == P ('i' (t» (12)
n'admet pas de solution univoque, nous divisons l'intervalle t o
t t l en un nombre fini de portions. Il est aisé de voir que la
fonction u (t) est constante sur chacune de ces portions. Soit en effet.
J une de ces portions (celle-ci peut être un intervalle ouvert, un
intervalle semi-ouvert ou un intervalle fermé). Soient et, e 2 , . . ., e q
les sommets du polyèdre U. Désignons par M i1 i == 1, 2, . . ., q,
l'ensemble de tous les points t E J tels que le point ei soit solution
de l'équation (12). Les ensembles Mt, M 2 , . . ., Mq sont donc dis-
joints deux à deux et leur somme est égale à J (certains de ces ensem-
bles peuvent être vides). Nous allons maintenant prouver que cha-
que ensemble Mi est ouvert sur J, d'où (compte tenu de la connexité
de J) il résultera que tous les ensembles Mi' à l'exceptiond'unseul
17.]
THÉORÈME DU NOMBRE DE COMMUTATIONS
109
:sont vides et la solution de l'équation (12) sera constante sur J.
(e qui achèvera la démonstration du théorème 9.
Soit donc t E J un point quelconque de l'ensemble ]VIi. On a
{1}J (t), Bei) = P ('1' (t)) et ('1' (t), Bej) < P ('1' (t)) pour i =1= j. Chaque
fonction ('1' (t), Bej), j = 1, 2, . . ., q, étant continue sur J, on a
en tout point de l'ensemble J suffisamment proche de t l'inégalité
{1}J (t), Bei) > ('1' (t), Bej) pour j =1= i. Autrement dit, tous les points
.de l'ensemble J suffisamment proches de t appartiennent à l' ensem-
])le J!;1 b i.e. l'ensemble Mi est ouvert sur J.
Le théorème 9 est démontré.
En vertu donc du théorème 9 toute commande optimale est une
-fonction constante par morceaux à valeurs en les sommets du polyè-
ire u. Nous appellerons également p 0 i n t d e c 0 m mut a -
t ion tout point de discontinuité d'une commande optimale. D'une
façon complète, si t'est un point de discontinuité d'une commande
üptimale u (t) et si u (t' - 0) = ei et u (t' + 0) = ej (où ei et ej
sont des sommets distincts du polyèdre U), nous dirons que pour
t = t' a lieu une c 0 m mut a t ion de la commande optimale
:a(t) du sommet ei au sommet ej.
Nous pouvons maintenant caractériser le théorème 9 de théo-
rème de la finitude du nombre de commutations. Il est bien entendu
que dans chaque cas concret le nombre de commutations dépend de
la valeur des coefficients du système (1), de la forme du polyèdre U
Bt du choix des points Xo, Xi. De ce point de vue, il est intéressant
.de comparer les e x e m pIe s 1 et 2 du 5. Dans l'exemple 1,
'quelle que soit la position initiale Xo, la commande optimale u (t)
possédait a u plu sun e commutation (i.e. admettait au plus
.deux intervalles de constante), tandis que dans l'exemple 2 le nom-
bre de commutations augmente infiniment lorsque le point xo s'éloi-
gne de l'origine des coordonnées (bien que le nombre de commuta-
tions soit fini pour chaque valeur f i x e de xo). A quoi tient cette
,différence entre les commandes optimales dans les deux exemples
'cités'? Le théorème 10 énoncé plus bas, dû dans sa forme initiale à
A. Feldbaum, montre que cette différence provient de ce que dans
l'exemple 1 la matrice du système possède des valeurs propres
ré e Il e s, tandis que dans l'exemple 2 ces valeurs sont co m ple-
x e s.
Dans le théorème 10 nous n'étudierons pas le cas général d'un
polyèdre convexe quelconque U, nous nous limiterons au cas suivant
très important dans les applications. Plus exactement, nous considé-
rerons que le polyèdre U est un parallélépipède défini dans l'espace
Er' engendré par les variables u l , u 2 , . . ., ur, par les inégalités
apuPBp, p= 1, 2, ..., r. (13)
Autrement dit, nous allons étudier le cas où chaque grandeur u P
figurant dans les équations (1) est un paramètre de commande dont
110
PROBLMES LINAIRES EN TEMPS OPTIMAL
[Ch. 3'
le domaine de variation ne dépend pas de la valeur des autres para-
mètres de commande, et est défini par l'inégalité (13). Nous suppo-
serons que la condition de position commune (page 106) est satis-
faite comme précédemment.
Thé 0 r è m e 10. Supposons que le domaine de commande U
est le parallélépipède (13) et que sont réelles les valeurs propres de la
matrice (aJ) constituée des coefficients de l'équation (1). Alors, pour-
toute solution non triviale '4' (t) de l'équation (5), la relation (6) définit
univoquement une commande u (t) = (u 1 (t), u 2 (t), . . ., ur (t»; il
s'avère de plus que chaque fonction u P (t), P = 1, . . ., r est constante
par morceaux, ne prend que les valeurs cx'p et p (voir (13» et admet au
plus n - 1 commutations (i.e. au plus n intervalles de constance) où
n est l'ordre du système (1).
D é mon s t rat ion. En coordonnées, la fonction (7) s'écrit.
sous la forme suivante (cf. (4» :
r n
('4' (t), Bu) = ( 2J '4'11 (t) bgu p ).
p=1 fJ,=1
Pour que cette fonction prenne sa valeur maximale, il est nécessaire
que chaque fonction
n
'4'11 (t) buP, P == 1, 2, ..., T, (t4)
J.L=1
prenne sa valeur maximale (car le domaine de variation de chaque-
grandeur Ul, . . ., ur ne dépend pas de la valeur des autres). D'où,
comme nous allons le montrer, il découle que u P ne prend que les
valeurs cx'p et p et admet au plus n - 1 commutations.
Il est évident que les relations
u 1 = ai pour i * p, cx,p u P p
définissent une arête du parallélépipède U. Le sens de cette arête
est défini par le vecteur
w = (0, 0, . . ., 1, . . ., 0),
où l'unité est en p-ème place. Le vecteur Bl/) s'écrit donc
Bw = (b, b, ..., b),
d'où
n
((t), Bw)= "'11.(t)b.
- J.L=1
(15)
Si cette fonction était identiquement nulle, alors, comme dans la
démonstration du théorème 9 (cf. (10), (11», '" (t) = 0, ce qui con-
17.]
THÉORBME DU NOMBRE DE COMMUTATIONS
11t
tredi t les conditions du théorème. Donc quel que soit p = 1, 2, . . .
. . ., r la fonction (15) n'est pas identiquement nulle et par consé-
quent comme toute fonction analytique ne s'annule qu'en un nombre
fini de points; quant à la fonction (14), elle est égale au produit d&
la fonction (15) par u p . Or, comme la fonction (14) doit atteindre-
son maximum, u P doit prendre la, valeur cx'p si la fonction (15) est
négative et la valeur p si la fonction (15) est positive. Autrement
dit, les points de commutation du paramètre de commande u P ne'
peuvent être que les zéros de la fonction (15). Le théorème 10 sera
donc entièrement démontré si nous prouvons que la fonction (15),
i.e. la combinaison linéaire non identiquement nulle des fonctions-
'Pl (t), '1'2 (t), . . ., 1Pn (t), admet au plus n - 1 racines réelles.
En vertu des théorèmes sur les équations linéaires à coefficients
constants, les fonctions 1Pl (t), 1P2 (t), . . ., 1Pn (t) qui constituent la
solution de l'équation (5) sont chacune de la forme:
f 1 (t) eÂ.l t + f 2 (t) e Â2t + . . . + lm (t) e'A.m t , ( 16}
où Â 1 , Â 2 , . . ., Âm sont des valeurs propres distinctes deux à deux
de la matrice A*, et fl (t), f2 (t), . . ., fm (t), des polynômes de
degré inférieur à la multiplicité de la valeur propre  i . La combi-
naison linéaire (15) des fonctions '1'1 (t), 'P2 (t), . . ., 1Pn (t) est donc
de la même forme (16). Tous les  1 ,  2 , . . ., Âm sont réels (car par
hypothèse toutes les valeurs propres de la matrice A et par consé-
quent de la matrice A * sont réelles). Si nous désignons par ri la
multiplicité de la valeur propre  i (de sorte que rl + r 2 + . . . +
-+ r m == n), alors le degré du polynôme fi (t) n'est pas supérieur-
à ri - 1 et d'après le lemme qui sera démontré plus bas le nombre-
de racines réelles de la fonction (16) n'est pas supérieur au nombre-
(ri - 1) + (r 2 - 1) + . . . + (rm - 1) + m - 1 ==
== ri + r 2 + . . . + r m - 1 = n - 1.
Ce qui achève la démonstration du théorème 10.
Lem m e. Soient  1 ,  2 , . . ., Âm des nombres réels non égaux
deux à deux, et Il (t), 12 (t), . . ., fm (t) des polynômes à coefficients:
réels de degrés respectivement k 1 , k 2 , . . ., km. A lors la fonction
fl (t) eÂ.l t + 12 (t) e'A.2 t + . . . + lm (t) e'A.mt (17}
admet au plus k 1 + k 2 + . . . + km + m - 1 racines réelles.
D é mon s t rat ion. Pour m = 1 le lemme est évident PUIS-
que la fonction f 1 (t) eÂ.l t admet les mêmes raçines que la fonction
fl (t) et possède donc au plus k 1 racins réelles.
Supposons que le lemme a été démontré pour le cas où la formu-
le (17) renferme un nombre de termes inférieur à m et démontrons-le-
pour le cas où la formule (17) renferme m termes. Supposons que le-
1.12
PROBLÈMES LINÉAIRES EN TEMPS OPTIMAL
[Ch. 3
lemme soit faux et que la fonction (17) admette au moins k 1 + k 2 + . . .
. . . + km + m racines réelles. En multipliant la fonction (17) par
e- Â ,n t (ce qui ne modifie pas ses racines), nous obtenons la fonction
Il (t) e(Ât-Âm)t + . . . + Im-1 (t) e(Â m -1-Â m )t + lm (t), (18)
qui admet également au moins k 1 + k 2 + . . . + km + m racines
réelles. Or l'intervalle compris entre deux racines réelles d'une fonc-
tion contient au moins une racine de la dérivée de cette fonction,
donc la (km + 1)-ème dérivée de la fonction (18) admet au moins
(k1 + · · . + k Tn + m) - (km + 1) == k1-/- . . . + k m - 1 + (m -1)
racines réelles. Il est par ailleurs aisé de voir que la (km + 1)-ème
dérivée de la fonction (18) est de la forme:
g 1 (t) e(Â1-Â m )t + g2 (t) e(Â2-Â m )t + . . . + gm-1 (t) e(Âm-1-Âm)t, (19)
les nombres  1 - Âm,  2 - .Âm, . . ., Âm -1 - Âm étant non égaux
deux à deux et le degré du polynôme gi (t) égal à k i comme précédeln-
ment. Par hypothèse la fonction (19) admet au plus kt + k 2 + . . .
. . . + k m - 1 + (m - 1) -1 racines réelles contrairement à ce qui a
été dit antérieurement. Cette contradiction achève le raisonnement
par récurrence.
Le lemme est donc démontré.
9 18. Théorèmes d'unicité
Résolvons l'équation (2) comme une équation non homogène
par la méthode de variation des constantes. A cet effet désignons par
CP1 (t), CP2 (t), · . ., CPn (t) (20)
le système fondamental de solutions de l'équation homogène
dx
dt == Ax,
satisfaisant aux conditions initiales cpj (t o ) == ô;, et par
'1'1 (t), '1'2 (t), . . ., 1P n (t)
le système fondamental de solutions .de l'équaion homogène (5)
satisfaisant aux conditions initiales 1P (t o ) == ô. Il est clair que
quel que soit t
('Pi (t), cr i (t)) == ô{, i, j == 1, 2, . . ., n.
(21)
En effet, cette relation est vérifiée, pour t = t o de par le choix
même des conditions initiales; par ailleurs
d ,. . .
dt ('lf' (t), CPi (t)) == ( - A *'lf'3 (t), CPi (t)) + ('lf'3 (t), ACPi (t)) == O.
18.]
THÉORÈMES D'UNICITE
113
Cherchons la solution générale de l'équation (2) sous la forme
n
x(t)== 2j <Pv(t)CV(t).
\'=1
En portant cette solution dans l'équation (2) nous obtenons
n
( t ) dev (t) == B ( t ) .
LJ <Pv dt U,
\'=1
en multipliant scalairement la dernière expression par 'l'j (t) et
compte tenu de (21), il vient
dCt(t) = (tl/ (t). Bu (t)).
Donc, pour une commande arbitraire u (t) et la condition initiale
x (t o ) === Xo === (x, x, . .., x), l'équation (2) admet une solution
de la forme:
n t
X (t) = fl!" (i) (x;i + J ('1''' ('t), Bu (1:)) d1:). (22)
\'= 1 to
Thé 0 r è m e 11. Soient Ui (t) et u 2 (t) deux commandes opti-
Inales définies respectivement sur les intervalles t o t t i et t o
t t 2 et transférant le point Xo en le même point Xi. A lors ces deux
commandes sont confondues (voir la note de la page 107), i.e. t i === t 2
et Ui (t) == U 2 (t) sur l'intervalle t o t t i .
Défi 0 n s t rat ion. Tout d'abord il est clair que t i === t 2
sinon, pour par exemple t i < t 2 , la commande u === U 2 (t) ne serait
pas optimale.
Puisque les deux trajectoires issues du point Xo et associées aux
commandes Ui (t) et U 2 (t) passent par le même point Xi à l'instant
t === t i , il vien t (en vertu de (22»
n tl
Xt = fl!" (tt) ( x;i + J ('l''' (t), Bud t )) dt ) =
v= 1 to
n ti
= fl!" (t) ( X;i + J ('l''' (t), BU2 (t)) dt ) 1
v= 1 to
d'où
n ti t1
fl!" (it) [J ('l''' (t), BUt (t)) dt- J ('l''' (t), BU2 (t)) dtJ = O.
v=1 to to
8-01339
114
PROBLÈMES LINÉAIRES EN TEMPS OPTIMAL
[Ch. 3
Les vecteurs CPi (t i ), . . ., CPn (t i ) étant linéairement indépendants,
il résulte de la dernière égalité
tl tl
5 (1jJi (t), BUt (t» dt = 5 (1jJi (t), BU2 (t» dt, i = 1, ..., n. (23)
to to .
La commande optimale U1 (t) est associée à un vecteur fonction
'1' (t) vérifiant la condition (6) et l'équation (5). Désignons par
'4'0 == ('4'10' · · ., '\j)no)
la valeur initiale de cette fonction (à l'instant t == t o ); la solution
'4' (t) peut alors s'écrire sous la forme
n
'll' (t) == '4'vo'll'v (t).
'\7=1
En multipliant l'expression (23) par '4'iO et en sommant en i, il vient
tl tl
5 (1jJ (t), BUt (t» dt = 5 (1jJ (t), BL0, (t» dt.
to to
(24)
Or, en vertu de la relation (6) et par définition de la grandeur P ('ll'),
nous avons (sur l'intervalle t o t t i )
('i' (t), BUt (t)) = P ('i' (t)) ('4' (t), BU 2 (t)),
donc de (24) il résulte ('ll' (t), BU1 (t)) == ('1' (t), BU 2 (t)). Les comman-
des U1 (t) et U 2 (t) vérifient la relation (6) avec la même fonction
'4' (t), donc (en vertu du théorème 9) Ui (t) == U 2 (t).
. Ce qui achève la démonstration du théorème 11.
Nous dirons qu'une commande U (t), t o t t 1 , est extrémale
si elle yérifie la condtion (6) où '1' (t) est ne solution non triviale
de l' équaion (5).
Pour trouver la commande 0 p t i mal e qui transfère le point
représentatif de Xo en Xi on peut d'abord chercher toutes les conlnlan-
des e x t r é mal e s transférant le point représentatif de Xo en ,1:>i
et ensuite choisir parmi elles celle (unique, en vertu du théorème 11)
qui réalise ce transfert en temps optimal. Une question se pose:
peut-il exister plusieurs commandes extrémales transférant le point
représentatif de Xo en Xi? En général, elles sont plusieurs à réaliser
ce transfert. Le théorème suivant mentionne un cas important d'uni-
cité des commandes extrémales.
Thé 0 r è m e 12. Supposons que l'origine des coordonnées de
l'espace Er est un point intérieur au polyèdre U, et soient Ui (t) et
u 2 (t) deux commandes extrémales définies respectivment sur les inter-
valles t o t t i et t o t t 2 et recalant le point Xo à l'origine
18.1
TI-IÉORÈMES D'UNICITE
, ,
115
des coordonnées' Xi = 0 de l'espace X. A lors ces commandes coïnci
dent, i.e. t i === t 2 et Ut (t) == U 2 (t) sur l'intervalle t o t t i .
D é mon s t rat ion. Désignons par Xi (t) et X 2 (t) les tra-
jectoires associées aux commandes Ui (t) t U 2 (t) et issues du point
a;o à l'instant t. En vertu des hypothèses du théorème nons avons
Xi (t i ) === X 2 (t 2 ) === 0 ou (en vertu de (22»
n tl
qJv (tt) ( X -+- ). (1jJv (t), BUt (t)) dt) = 0,
'\7=1 to
n t2
qJv (t 2 ) ( X + J (1jJv (t), BU2 (t)) dt) = O.
'\7= 1 to
D'où (en vertu de l'indépendance linéaire des vecteurs (20) quel qu
soit t) il résulte (i === 1, 2, . . ., n):
tl t2
- x = J (1jJi (t), Bud t )) dt = 1 (1jJi (t), BU2 (t)) dt. (25)
to to
Supposons pour fixer les idées que t i > t 2 et soit '1' (t) la solution de
l'équation (5) qui vérifie" sur l'intervalle t o t t i , la relation
('1' (t), BU1 (t» === P ('1' (t», ,
déterminant la fonction Ut (t). Comme dans la démonstration du
théorème 11 mettons la fonction '4' (t) sous la forme 'i' (t) =
n
:== 'l'vo'l''' (t). En multiplint l'epressio (25) par '4'io et en som-
,\,=1 ' '
Inant en i, il vient:
tl t2
J (1jJ (t), BUt (t)) dt = J (1jJ (t), B (t)) dt.
to to
(26)
Remarquons que toute solution '1' (t) de l'équation (5) vérifie
] , inégali té
'p ('1' (t» o.
(27)
]n effet, l'origine des coordonnées de l'espace Er étant un point
intérieur au corps convexe U, la fonction ('1' (t), Bu) en tant que
fonction de U est soit identiquement nulle soit peut prendre de
valeurs tant négatives que positives. .
En vertu de (27) et (26) nous avons les inégalités
t2 12
J (1jJ (t), BUt (t)) dt J (1jJ (t), BU2 (t)) dt.
to to
8*
116
PROBLÈMES LINÉAIRES EN TEMPS OPTIMAL
[Ch. 3
D'où, comme dans la démonstration du théorème 11, il vient:
Ui (t) == u 2 (t) sur l'intervalle t o t t 2 .
Et, compte tenu de (26),
t2
) ('IjJ (l), BUi (l)) dl = O.
fi
(28)
Par ailleurs, l'égalité P ('i' (t)) == 0 n'ayant lieu que si la fonction
('i' (t), Bu) est nulle sur le polyèdre U tout entier, i.e. ne pouvant
avoir lieu que pour un nombre fini de valeurs de t, il résulte néces-
sairement des expressions (27) et (28) que t f == t 2 .
Le théorème 12 est donc démontré.
Rem a r que. Jusqu'à maintenant nous n'avons utilisé que
la condition 1° du théorème:2 (i.e. la formule (20) du chapitre 1),
mais jamais la condition 2° (i.e. la relation (21) du chapitre 1). Il
est toutefois aisé de voir que lorsque les conditions du théorème 12
sont remplies, l'égalité (21) du chapitre 1 est immédiatement véri-
fiée. En effet, en vertu des relations (4), (6), (27) et de la relation
(20) du chapitre 1, nous avons
M ('i' (t f ), x (t i )) == H ('1' (t f ), x (t f ), u (tt)) =
== ('1' (t f ), Ax (t f )) + ('1' (t f ), Bu (t i )) =
= ('i' (t i ), AXt) + P ('i' (t f )) = P, ('1' (t f )) 0
(car Xi = 0).
9 19. Théorèmes d'existence
Thé 0 r è m e 13. Si pour le processus décrit par l'équation (2)
il existe au moins une commande transférant le point représentatif de
Xo en Xi' il existe alors une commande optimale transférant le point
représentatif de Xo en Xi. (Nous supposons comme toujours qu'est
remplie la condition de position commune.)
D é ID 0 n s t rat ion. Nous devons supposer qu'est donnée
une certaine classe D de com.mandes admissibles et que dans cette
classe il existe des commandes transférant le point représentatif de
Xo en Xi. Désignons par Dmax la plus grande classe de commandes,
i.e. l'ensemble de toutes les commandes mesurables (à valeurs dans
U), et par D min la plus petite classe de commandes, i.e. l'ensemble
de toutes les commandes constantes par morceaux (à valeurs dans
U). Nous avons donc Dmax-::::J D -::::J D m1n .
Prouvons tout d'abord que dans la classe Dmax il existe une
commande optimale transférant le point représentatif de Xo en Xi.
Désignons par l'ensemble des commandes de la classe Dmax
19.]
THÉORÈMES D'EXISTENCE
117
transférant le point représentatif de Xo en Xi. L'ensemble n'est pas
vide, car par hypothèse la classe D (et par conséquent Dmax) con-
tient des commandes transférant le point représentatif de Xo en Xi.
Chaque commande u (t) E est associée à un temps de transfert
(de Xo en Xi). Désignons par t* le minorant de tous les temps de trans-
fert et montrons qu'il existe une commande u* (t) transférant le
point Xo en Xi pendant le temps t*. Puisqu'il est possible de procéder
à une translation dans le temps (voir la condition 3 dans le 9 10),
nous pouvons nous limiter aux seules commandes définies sur les
intervalles de la forme 0 t t i .
Extrayons de l'ensemble' d une suite infinie de commandes
{Uh (t)} définies respectivement sur les intervalles 0 t tk
(k == 1, 2, . . .) telle que soit vérifiée l'égalité
lim th == t* .
hoo
Désignons par Xh (t) la trajectoire associée à la commande Uh (t)
et partant à l'instant t == 0 du point Xo; alors xh (th) == Xi- Nous
avons
n th
lim (q\, (t*) - cp" (th» (x + J (1jJ" (t), Budt» dt) = 0
hoo \'=1 0
(car le deuxième facteur figurant sous le signe de la somme est bor-
né, tandis que le premier tend vers 0); de la même façon
n th
cp" (t*) ( J (1jJ" (t), BUh (t» dt) = O.
\'=1 t*
D'où il résulte que
n t*
lim cp" (t*) ( xX + J (1jJ" (t), BUh (t» dt ) =
hoo \'=1 0
n th
= ! cp" (th) ( x + .\ (1jJ" (t), BUh (t» dt) = Xh (th) = Xi (29)
\'=-=1 0
(voir (22».
Considérons maintenant l'espace hilbertien L 2 de toutes les
fonctions mesurables de carré intégrable, définies sur l'intervalle
o t t*. La commande Uh (t) est un vecteur fonction, dont nous
désignerons la i-ème composante par ul (t). La fonction Uih (t) dé-
finie sur l'intervalle 0 t t* appartient à l'espace £2 (elle est
mesurable et bornée). L'ensemble de toutes les fonctions u1 (t),
k == 1, 2, . _ ., pour chaque i (== 1, 2, . _ ., r) fixe appartient de
118
PROBLÈMES LINÉAIRES EN TEMPS OPTIMAL
LCh. 3
toute évidence à une boule de l'espace £2; nous pouvons donc en
extraire une suite *) faiblement convergente. Nous considérerons
tout simplement que la suite
.. i
u (t), u (t), ..., Uh (t), ... (30)
converge elle-même faiblement vers une fonction u i (t), i = 1, 2, . . .
., r.
Prouvons maintenant que le vecteur fonction
u* (t) = (u l (t), u 2 (t), . . ., ur (t))
vérifie la condition u* (t) E U pour presque toutes les valeurs de t.
Prenons une face quelconque r de dimension r - 1 du polyèdre U
r
et soit £ (u) == LbfJu P une forme linéaire des variables u l , u 2 , . . .
p=o
. . ., ur telle que l'équation du plan contenant la face r soit de la
forme £ (u) == b, et que le polyèdre U soit situé dans le demi-espa-
ce L (u) b. Soit par ailleurs m l'ensemble de tous les points t de
l'intervalle [0, t*] pour lesquels £ (u* (t)) > b et v (t) la fonction
caractéristique de l'ensemble m. Cette fonction est mesurable et
bornée (i.e. appartient à l'ensemble £2) et nous avons donc en vertu
de la faible convergence de la suite (30)
t*
lim r v (t) [£ (u* (t)) - L (Uh (t))] dt == o.
h 00
Par ailleurs mes m == 0 puisque L (u* (t)) - L (Uh (t)) > 0 sur
l'ensemble m (car L (Uh (t) b). Donc, pour presque tous les t de
l'intervalle 0 t t*, le point u* (t) est situé dans le même demi-
espace L (u) b que le polyèdre U. Ce raisonnement étant valable
pour tout point de la face r du polyèdre U, on a u* (t) E U pour
presque tous les t.
Une variation de la fonction u* (t) sur un ensemble de mesure
zéro n'ayant pas d'effet sur la faible convergence de la suite (30)
vers les fonctions u i (t), i == 1, 2, . . ., r, nous pouvons, sans perdre
en généralité, considérer que u* (t) E U pour t 0 u s les t, 0 t
t*.
De la faible convergence de la suite (30) et en vertu de
(29) il vient:
n t*
qJv (t*) ( x + J ("'v (t), Bu* (t)) dt ) = Xi'
\'=1 0
*) Voir par exemple L. Lusternik et V. Sobolev «Eléments
d'analyse fonctionnelle )} (en russe), Moscou 1951, pp. 194-196.
19.1
THÉORÈMES D'EXISTENCE
119
Donc, u,* (t) est une commande optimale mesurable transférant
le point représentatif de Xo en Xi' i.e. la classe Dmax contient une
commande optimale. En vertu du théorème 2 (voir également le théo-
rème 8) l'équation (5) admet une solution non triviale (voir (6))
telle que presque partout sur l'intervalle 0 t ::::;; t* on ait
(11' (t), Bu* (t)) == P (11' (t)).
I)'après le théorème 9 on peut considérer (en la faisant varier
sur un ensemble de mesure zéro, ce qui ne nuit pas à son optimalité)
que la commande u* (t) est constante par morceaux. Elle appartient
donc à la classe D min et par conséquent à la classe D. La commande
u* (t) transfère le point représentatif de Xo en Xi plus rapidement
que toute autre commande de la classe Dmax et par conséquent de
la classe D.
La classe D renferme donc la commande optimale et le tlléorème
est démontré.
Rem a r que. Si la classe D des commandes admissibles coÏn-
eide avec la classe Dm ax de toutes les commandes mesurables, d'après
]a démonstration on peut formuler le théorème 13 sans la condi-
tion de position commune (cette condition n'est en effet exigée
qu'en raison de la référence au théorème 9).
Thé 0 r è m e 14. Supposons que l'opérateur A de l'équation (2)
est stable, i.e. les parties réelles de ses valeurs propres sont négatives,
et que l'origine des coordonnées de l'espace Er est un point intérieur au
polyèdre U. (La condition de position commune est supposée remplie
comme précédemment.) A lors pour tout point Xo E X il existe une com-
mande optimale recalant Xo à l'origine des coordonnées 0 EX.
D é mon s t rat ion. Montrons tout d'abord que l'origine des
coordonnées 0 E X admet un voisinage V tel que chaque point Xo E
E V peut être recalé en 0 par une commande. (Pour démontrer cette
assertion nous n'utiliserons pas la stabilité de l'opérateur A.)
Désignons par cD (t) la matrice ayant pour colonnes les compo-
santes des vecteurs CPi (t), . . ., CPn (t) (voir (20)), i.e. cD (t) ==
== (cp} (t)). Les vecteurs (20) formant un système fondamental de
sol utions de l' équa tion
dx
-==Ax
dt
et satisfaisant aux conditions cpj (0) == ôj (nous faisons t o == 0), on a
dcD (t)
rtt == AcD (t), cD (0) == E,
d'où
(D'(t) == e tA .
120
PROBLÈMES LINÉAIRES EN TEMPS OPTIMAL
[Ch. 3
Désignons par ailleurs par 'l'(t) la matrice dont les lignes sont les
composantes des vecteurs 'Pl (t), . . ., 'l'n (t), i.e. 1f (t) = ('l') (t»).
La relation (21) s'écrit maintenant 1f (t) <D (t) = E d'où
'l' (t) = e- tA .
En portant les expressions des matrices cD (t) et 1f (t) dans (22),
nous avons
t
x (t) = e tA ( Xo + ) e--rABu (,;) d,;) ,
o
où x (t) est la trajectoire associée à la commande u (t) et partant du
point Xo à l'instant t = O.
Choisissons maintenant dans U un vecteur v tel que le vecteur
-- v appartienne aussi à U et que le vecteur
b = Bv
(31)
n'appartienne à aucun sous-espace propre de l'espace
X invariant par rapport à l'opérateur A. Le vecteur v existe puisque
l'origine des coordonnées de l'espace Er est un point intérieur au
polyèdre Tf et puisque est remplie la condition de position comnlune.
Pour B positif suffisamment petit les opérateurs A et e-eA possèdent
des sous-es paces invariants qui se confondent *) et les vecteurs
*) En calcul matriciel cette assertion se démontre de la manière suivante.
Soit la matrice M == e -eA - E; celle-ci peut être représentée sous la forme
d'une série matricielle convergente
E E2 2 E3
M=-IT A +2T A -3T A3 +... (*)
D'où il résulte que toute matrice C représentée sous la forme d'unesériematri-
cielle entière convergente
C == aoE + atM + a2M 2 + a3M3 + . . ., . (**)
est transposable avec la matrice A. Les valeurs propres de la matrice M sont
de la forme e -et... - 1 où Â est une valeur propre de la matrice A. Il existe donc
un Eo > 0 tel que pour 0 < E < Eo les valeurs propres de la matrice AI sont
contenues dans le cercle unitaire. Il existe donc (voir L. P 0 n tri a gui n e
« Equations différentielles ordinaires », Editions Mir, Moscou, 1969
p. 338) une Inatrice C représentée par une série entière (* *) telle que
e C == M + E, Le. e C == e -eA, les valeurs propres de la matrice C étant supposées
arbitrairement proches de 0 (pour Eo suffisamment petit). Les matrices A et C
étant transposables, de la relation e C == e -eA il résulte eC+eA == E et toute"
les valeurs propres de la matrice C + EA sont donc de la forme 2kni. Puisque
par ailleurs elles sont proches de 0 (pour Eo petit), elles sont toutes nulles. Soit 8
une matrice telle que la matrice G == 8 (C + EA) 8- 1 soit de la forffie de Jor-
dan. En multipliant l'expression eC+eA == Epar 8 à gauche et par S-l à droite,
. 1 . t G E .
1 VIen e == , I.e.
E = E + G + G2 + G3 + . . .
(***)
19.1
THÉORÈMES D'EXISTENCE
121
e-eAb, e- 2eA b, ..., e-neAb
(32)
sont donc linéairement indépendants.
Soit par ailleurs la fonction cr (t, 't, s) de la variable t où 't et
sont des paramètres réels, égale par définition à sign S sur l'inter-
valle ('t, 't + s) et nulle en dehors de cet intervalle. Définissons
enfin la commande u == u (t, SI, . . ., Sn) des n paramètres réels
£1, . . ., n en posant
n
Sn) === v. cr (t, kë, Sk);
h=1
nous allons étudier cette commande pour des valeurs suffisamment
petites de ë > 0 et SI, . . ., Sn sur l'intervalle 0 t t 1 où i 1
est un nombre positif fixé. La trajectoire associée à la commande
u (t, SI, . . ., çn) et partant du point Xo à l'instant t == 0 aboutit
(à l'instant t == [1) au point
ti n
Xi = Xi (Xo, \ ..., n) = e t1A (xo + I e-tAb cr (t, k8, 1;k) dt ) (33)
o h=1
(voir (31)).
La somme fignrant dans l'intégrale (33) étant nulle pour SI -
== Sn == 0, il vient:
u (t, 1,
. . . ,
Xl (Xo, SI, ..., Sn) Ix=o; £l=...=£n=O ===0. (34)
Puisque, par ailleurs, (pour des valeurs suffisamment petites de
k et ë) le terlne de (33) qui dépend de £h est de la forme
he+ h
eltA ( Xo + J e - tAb dt ) ,
he
Les valeurs propres de la matrice G étant nulles, tous ses éléments diagonaux et
les éléments qui sont situés au-dessus de la diagonale principale sont nuls.
Donc tous les éléments situés directenlent sous la diagonale principale des
matrices G2, G3, G4, . . . sont également nuls. Il s'ensuit alors de (***) que les
éléments situés sous la diagonale principale de la matrice G sont nuls, i .e. G
est nulle (rappelons que G est de la forme de Jordan). C + EA étant aussi une
matrice nulle, on en déduit que C == - EA.
De (* *) il découle que la matrice A est représentée par une série convergente
A === -_..!. (aoE + atM + a2M2 + a 3 M3 + . . .). (****)
E
Tout sous-espace invariant de la matrice A est, en vertu de (*), un sous-
espace invariant de la matrice M. Inversement, tout sous-espace invariant de
la matrice M est, en vertu de (* * * *), un sous-espace invariant de la filatrice A.
Les matrices A et M (et par conséquent les matrices A et e -eA == M + E)
admettent donc les mêmes sous-espaces invariants (à condition que E soit suffi-
samment petit pour que la démonstration proposée soit valable).
122
PROBLÈMES LINÉAIRES EN TEMPS OPTIMAL
[Ch. 3
une dérivation de l'expression (33) nous donne:
: 1 == e t1A (e-heAb), k == 1, 2, ..., n.
u':, k=O
D'où il résulte que le j acobien
iJ (xl, xi, ..., xf) 1 (35)
d (G 1 , 2, ..., n) Sl=2=.. .=n=o
est égal à 1 e t1A 1 · où est le déterminant de la matrice composée
des coordonnées des vecteurs (32). Le déterminant de la matricE'
e t1A étant non nul de même d'ailleurs que pour des valeurs suffi-
samment petites de ë (car les vecteurs (32) sont linéairement indé--
pendants), le jacobien (35) est non nul.
Nous pouvons donc dans les schémas précédents choisir le para-
mètre E arbitrairement petit de n1anière que le jacobien (35) soit
non nul. Par ailleurs nous avons la relation (34) cl? où en. vertu dl!
théorème de la fonction in1plicite il résulte que l'équation
x 1 (x 0, 1, 2, ..., n) == 0
est résoluble en 1, 2, . . ., n pour toutes les valeurs de Xo appar-
tenant à un certain voisinage V de l'origine des coordonnées 0 E X.
En d'autres termes, pour tout point Xo E V il existe une commande u
constante par morceaux (en l'occurrence, la commando
u (t, 1, . . ., n), 0 t t 1 , les paramètres 1, . . ., n étant
dûment choisis) recalant le point Xo à l'origine des coordonnées
(dans le temps t1).
Soit à présent Xo un point quelconque de l'espace X. Faisons
déplacer le point représentatif d'abord de la position Xo sous l'effet
de la commande u (t) == O. Les parties réelles des valeurs propres de
l'opérateur A étant 'négatives, au bout d'un certain temps le point
représentatif arrivera au voisinage V, d'où, d'après ce que nous
.avons démontré, il pourra être recalé à l'origine des coordonnées.
En vertu donc du théorème 13 nous concluons à l'existence d'une
commande 0 p t i m 'a 1 e recalant le point Xo à l'origine des coordon-
nées.
Ie théorème est dOllC démontré.
e 0 roll air e. Supposons que l'origine des coordonnées de l'es-
pace Er est un point intérieur du polyèdre U. Désignons par T l'en-
semble de tous les points Xo E X susceptibles (sous l'effet d'une comman-
de dûment choisie) d'être recalés à l'origine des coordonnées 0 E X en
un temps n'excédant pas T (T étant un nombre positif quelconque).
A lors T est un ensemble convexe fermé possédant des points intérieurs
(i.e. est un corps convexe).
D é mon s t rat ion. Voyons la démonstration du théorème 14
où l'on posera t 1 == T. Nous obtenons alors un voisinage V de l'ori-
20.]
s YN'rHÈSE DE LA COMMANDE OPTIMALE
123
gine des coordonnées 0 E X tel que pour tout point Xo E V il existe
nne cOilllnande constante par morceaux recalant le point Xo à l'ori-
gine des coordonnées (pendant le temps T). Autrement dit, V c T
i.e. l'origine des coordonnées est un point i n t é rie u r à l'en-
semble T. Cet ensemble est fermé en vertu du théorème d'existence.
Il ne nous reste plus qu'à démontrer que l'ensemble T est con-
r S . t ( 1 2 71, ) t f 1 2 71 ) d
vexe. olen Xi == Xl' Xi' · · ., Xi e X2 == ,X 2 ' X 2 ' . . ., X 2 eux
points de l'ensemble T et Ut (t), U2 (t) des commandes recalant les
points .Ti et X2 à l'origine des coordonnées en un temps n'excédant
pas T. Nous supposerons que les deux commandes Ut (t) et U2 (t)
sont défin ies sur l'intervalle 0 t T tout entier et égales à zéro
(le l'instant où le point représentatif arrive à l'origine des coordon-
nées jusqu'à l'instant T. Les commandes Ut (t) et U2 (t) sont donc
des con1mandes définies sur l'intervalle 0 t T et recalant dans
]e ten1 ps T les points Xi et X2 à l'origine cles coordonnées, i. e. en
vertn de (22)
n T
\Pv (T) ( xr + ) ('\Jv (t), BUt (t)) dt ) = 0,
v=1 0
n T
\Pv(T) (Xi + J ('\JV(t), BU2 (t)) dt) = O.
v=1 0
Soient maintenant ai et a2 deux nombres posi tifs arbitraires tels
que ai + a2 == 1; posons Xo == aixi + a2x2, Uo (t) = aiui (t) +
+ a2112 (t). Le point Xo est alors situé sur le segment reliant Xt et X2
et le point Uo (t) sur le segment reliant Ui (t) et U2 (t) (quel que soit t,
o t T) de sorte que Uo (t) E U quel que soit t (puisque U est
un polyèdre con v e x e); la commande Uo (t) est donc une com-
Jnande admissible définie sur l'intervalle 0 t T. En multi-
pliant les expressions (36) et (37) respectivement par ai et a2 et en
<l.dditionnant nous obtenons:
(36)
(37)
n T
\Pv (T) (x + J ('\Jv (t), Buo (t) ) dt = O.
v= 1 0
La commande Uo (t) recale donc le point Xo à l'origine des coor-
données en un temps T, Le. Xo E T. Tout point du segment reliant
les points Xi et X2 appartient à l' ensemble T' cet ensemble est donc
convexe.
9 20. Synthèse de la commande optimale
Dans le chapitre 1 nous avons étudié sur des exemples concrets le
problème de synthèse des commandes optimales. Ce problème peut
être posé pour un processus commandé quelconque (voir formule (4),
124
PROBLÈMES LINÉAIRES EN TEMPS OPTIMAL
[Ch. :
2). Cependant, nous n'examinerons ici que les systèmes linéaires
de la forme (1) satisfaisant aux conditions du théorème 14 (quant à
la condition de stabilité de l'opérateur A, voir la remarque faito
en fin de ce paragraphe). Les théorèmes d'existence et d'unicitê
(théorèmes 14 et 12) étant valables pour ces systèmes, le problème dH
synthèse est en principe résolu. Nous allons exposer une méthodE
constructive de résolution de ce problème, une méthode nécessitant
toutefois de nombreux schémas dans chaque cas concret.
La synthèse d'une commande optimale du système linéaire (1) a
été réalisée antérieurement (par des méthodes foncièrement diffé-
rentes, i.e. sans l'utilisation du principe du maximum), mais dans
le cas d'un seul paramètre de commande (Le. pour r===1) par A. Feld-
baum pour des valeurs propres réelles de l'opérateur A et pa].
D. Buschaw dans le cas où n === 2 et où les valeurs propres de l' opéra-
teur A sont complexes. Le principe du maximum permet d'accéder
aux mêmes résultats avec de plus grandes facilités (voir les exemples
du 5). Plus loin nous montrerons comment à l'aide du principe du
maximum il est possible pour n === 2 de construire la synthèse des
systèmes linéaires à commande optimale dotée de d eux paramètres
de commande.
Dans ce paragraphe nous nous livrerons à des réflexions générales
sur le problème de synthèse des commandes optimales. Nous sup-
poserons remp]ies les conditions du théorème 14. Alors, pour tont.
point Xo E X il existe une et une seule comn1ande optimale u xo (t)
(constante par morceaux) recalant le point Xo à l'origine des coor-
données 0 E X. L'unicité est réalisée à une translation du temps
près et aux valeurs de la commande u xo (t) près en ses points de dis-
continuité. Comme à chaque instant nous somnles naturellement
intéressés par le comportement p 0 sté rie u r de la commande
optimale, il serait plus rationnel (contrairement aux conventions
admises dans la page 12 et la note de la page 107) de considérer qu'en
chacun de ses points t' de discontinuité la commande U xo (t) est
égale à U X () (t' + 0). Ceci étant, à tous les instants (sauf pour un
nombre fini où la valeur de la commande ne joue aucun rôle) est.
vérifiée la relation
u xo (t) === u xo (t + 0),
ce qui permet de lever la non-unicité de la commande u xo (t) à l'ins-
tant initial et aux points de discontinuité. La grandeur U xo (t o ) n'est
fonction donc que ou point Xo et non de l'origine arbitraire des tem ps
t o , et par conséquent:
v (xo) = u xo (t o ).
Soit x (t) la solution de l'équation (2) aSSOClee à la comm andp
U xo (t) et t o t t 1 l'intervalle de temps pendant lequel le point
représentatif est recalé de Xo à l'origine des cooroonnées. Or, quel
20.1
SYNTHÈSE DE LA COMMANDE OPTIMALE
12;)
que soit le point l' pris dans cet intervalle de temps, la commande
u xo (t) définie sur l'intervalle l' t t 1 recale 0 p t i mal e -
fi e n t le point représentatif de x (1') à l'origine des coordonnées
(sinon la commande ne serait pas optimale), donc
u Xo ('t) == v (x ('t)).
Par conséquent,
d
dt x (t) == Ax (t) + Bv (x (t)),
let nous voyons que la solution de l'équation
dx
dt==Ax+Bv(x)
vérifiant la condition initiale arbitraire x (t o ) == Xo est précisément la
loi qui régit le recalage optimal du point Xo à l'origine des coordonnées.
On dit que la fonction v (x) s y n thé t i s e la commande optimale
recalant le point Xo à l'origine des coordonnées (cf. 5). Le problè-
me de synthèse de la commande optimale (pour le système linéaire (2))
consiste précisément à chercher la fonction v (x).
Donnons une méthode de construction de la fonction v (i). Soit
1p (t) la solution (non triviale) de l'équation (5) qui en vertu du
théorème 2 est associée à la commande U xo (t). On a
d;t) = _ A *1\1 (t), (38)
et la fonction u xo (t) est tirée de l'équation
('P ( t ), B u xo (t)) === P ('1' (t)).
(39)
Soit par ailleurs x (t) la solution de l'équatio:o (2) associée à la com-
mande u == U xo (t), vérifiant la condition initiale
x (t o ) == Xo (40)
et la condition finale
x (t 1 ) == 0,
(41)
de sorte que
dx (t)
dt = Ax (t) + Bu xo (t).
La fonction v (x) satisfait alors à la condition
('1' (t o ), Bv (x (t o ))) == P (11' (t o )).
(42)
(43)
En vertu du théorème d'existence et d'unicité, il existe un et un seul
(à une translation du temps près) couple de fo'nctions u xo (t) et x (t)
définies snr l'intervalle t o t t i et vérifiant les conditions (38)
à (42). Ces conditions ne définissent pas d'une manière univoque les
nombres t o et t 1 en raison de la translation du temps, par contre
elles définissent leur différence t 1 t o . .
126
PROBLÈMES LINÉAIRES EN TEMPS OPTIMAL
[Ch. 3
On ne sait absolument pas comment chercher les fonctions u xo (t)
et x (t) vérifiant toutes les conditions (38) à (42), mais en revanche,
il est aisé de déterminer toutes les fonctions U xo (t) et x (t) vérifiant
seulement les conditions (38), (39), (41) et (42). Pour cela nous allons
procéder comme suit. Puisqu'une translation arbitraire du temps est
possible, fixons le nombre t 1 en posant t 1 == O. Soit à présent
X == (Xi, X2, . . ., "ln) vecteur quelconqu e non nul, et 'lJ? (t, X) la
solution de l'équation (38) vérifiant la condition initiale
1P (0, X) == X
et définie pour t O. Définissons par ailleurs la fonction u (t, X)
à partir des conditions
(1P (t, X), Bu (t, X)) == p (1P (t, X) ), t 0,
et la fonction x (t, X) vérifiant la condition initiale x (0, X) === 0 à
partir de l'équation
dx t' x) = Ax (t, X) + Bu (t, X).
De ce qui précède, la fonction v (x) sera définie de la relation
(1P (t, X), B v (x (t, X) )) == p (11' (t, X) ) . ( 44)
En vertu du théorème d'existence (théorème 14), le point x (t, X)
parcourt l'espace X t 0 u t e n t i e r lorsque t est négatif, le vecteur
X variant arbitrairement. La relation (44) définit donc la fonction
v (x) en un point arbitraire x de l'espace X.
Remarquons que la condition de stabilité de l'opérateur A n'a
été utilisée dans les raisonnements précédents qu'une seule fois,
précisément à la fin du paragraphe préc'édent, lorsqu'on a prouvé
qu'à partir d'un point quelconque de l'espace X il était possible de
s'approcher aussi près que l'on veut de l'origine des coordonnées.
Toutes les conclusions donc du présent paragraphe restent en vigueur
dans le cas où l'opérateur A n'est pas stable; cependant en choisis-
sant dûment la commande u (t), on peut à partir d'un point quelcon-
que Xo E X s'approcher aussi près que l'on veut de l'origine des coor-
données (voir exemple 1, 5). Si cette condition n'est pas relnpliü
non plus, la synthèse est encore possible, non pas pour l'espace X
tout entier, mais pour ùn' de ses domaines. Plus exactement dési-
gnons par YI' ensemble des points de l'espace X d'où on peut (sous
l'effet d'une commande dûment choisie) s'approcher aussi près que
l'on veut de l'origine des coordonnées. Il est alors possible de cons-
truire la fonction v (x) sur l'ensemble Y (en supposant que l'ori-
gine des coordonnées de " l'espace Er est un point i n t é rie Ù r au
polyèdre" U et qn' est rem plie la condition de position comm une),
i.e. la solution du problème de synthèse. Il n'est guère indispen-
sable de vérifier par avance si l'on peut aboutir à l'origine 'des coor-
21.]
EXEMPLES
127
données en partant d'un point arbitraire ou non: si on résout le
problème de synthèse comme indiqué plus haut (Le. en nous dépla-
çant de l'origine des coordonnées par des « mouvements à reculons »),
alors l'ensemble des points de 'espace X en lesquels nous pouvons
a bOll tir (en vertu des formules (38), (39), (41) et (42)) en partant de
l'origine des coordonnées ne sera autre que le domaine Y pour lequel
le problème de synthèse admet une solution.
L'ensemble ¥ est 0 u ver t, i.e. il contient tout point avec l'un
quelconque de ses voisinages. Soient en effet Xo E y et u (t), t o
t t 1 une commande optimale recalant le point Xo à l'origine
(les coordonnées. Soit par ailleurs un voisinage V de l'origine des
coordonnées tel qu'en partant d'un quelconque de ses points on puis-
se (sous l'effet d'une commande dûment choisie) aboutir à l'origine
des coordonnées. En vertu du théorème de la dépendance continue
des solutions des équations différentielles par rapport aux condi-
tions initiales il existe dans X un voisinage W du point Xo tel que
la trajectoire de phase associée à la commande u (t), t o t t 1 ,
en partant à l'instant t o d'un point quelconque Yo E W aboutisse
à l'instant t 1 à un point quelconque de l'ensemble V. Tout point
Uo E W peut donc par une commande dûment choisie être recalé à
l'origine des coordonnées, i.e. W E Y. L'ensemble Yest donc ouvert.
'Puisque par ailleurs en partant d'un point quelconque Xo E y on
peut au bout d'un temps fin i aboutir à l'origine des coordonnées,
alors (voi;r le corollaire du théorème 14) :
00
y = U LT,
T=1
i.e. }T est égal à l'union d'une suite croissante d'ensembles convexes
et donc est lui-même un ensemble con v e x e.
Ainsi, l'ensemble Y de tous les points de l'espace X d'où l'on peut
aboutir à l'origine des coordonnées est un ensemble convexe ouvert con-
tenu dans l'espace X. Le problème de la synthèse des commandes opti-
males admet une solution à l'intérieur de cet ensemble ¥.
S 21. Exemples
E x e m pie 1.
(Système du deuxième ordre avec deux paramètres de commande
et des valeurs propres complexes.)
Soit le système d'équations
dx 1 }
- == a 1 x 1 + alx2 + blUl -f- b 1 u 2
dt 1 2 1 2'
dx 2
- == a 2 x 1 -t- a 2 x 2 + b2Ul + b 2 u 2
dt 1 2 1 2
(45)
128
PROBLÈMES LINÉAIRES EN TEMPS OPTIMAL
[Ch. 3
où l'on suppose que les valeurs
i.e. (a - a;)2 + 4aa < 0, et
est définie par les inégalités
lu 1 1<':1,
de la matrice (a)) sont complexes.
que le domaine de commande U
1 u 2 1 1.
(46)
Si le rang de la matrice (b]) est inférieur à 2, alors les colonnes de
cette matrice sont proportionnelles, i.e. b === kb (i === 1, 2) et le
système (45) prend la forme
dx 1 1
Cil === ax1 + ax2 + b (U1-i- ku 2 ),
dx 2 J
_ - a 2 x 1 + a2x2 + b2 ( u 1 + kU2 )
dt - 1 2 1 ·
u l + ku 2 est une grandeur pouvant prendre des valeurs quelconques
assujetties à la condition
1 u 1 + ku 2 1 1 + 1 k 1.
Le système (45) est donc dans ce cas un système à uns e u l
paramètre de commande u === u 1 + ku 2 . Nous allons exclurre ce cas,
Î.e. nous supposerons que le déterminant de la atrice (bj) est
non nul.
Désignons par  + if-t où f-t =1= 0 les valeurs propres de la matri-
ces (aJ); on peut prendre f-t > O. Les raisonnements qui vont suivre
sont indépendants du signe de Â, toutefois pour fixer les idées nous
examinerons le cas où Â < O.
Par le changement linéaire des variables
y1 === SX1 + SX2 , }
y2 === SX1 + s; x 2
(47)
le système (45) se ramène à la forme
dy1 }
dt == Ây1-l--ty2 + CU1 + CU2,
dy2
dt === y1 + Â y 2 + c u 1 + c;u 2 ,
où les coefficients cj s'expriment de toute évidence en fonction des
éléments des matr;ices (b)) et (s)). La variable indépendante t (le
temps) n'étant pas affectée par le changement linéaire opéré et les
formules (47) étant homogènes, les trajectoires optimales du systè-
me (45) aboutissant à l'origine des coordonnées se transforment sous
l'effet de (47) en trajec toires optimales du systè,me ( 48) aboutissant
à l'origine des coordonnées. Par suite nous pou vons étudier uniquement
la synthèse des trajectoires optimales du système (48) en portant les
variables y1 et y2 sur les axes des coordonnées. Cette synthèse une
(48)
21.]
EXEMPLES
129
fois obtenue, nous pouvons au moyen de la transformation affine
(47) trouver la synthèse des commandes optimales du système (45).
Désignons par rt le plan engendré par les variables yI et y2.
Posons
CUI + CU2 == VI, }
c;u l + c;u 2 == v 2 .
Le système (48) s'écrit alors:
dyl }
dT == Âyl - fly2 + VI,
dt = lA-yl + 'A y 2 +v 2 .
(49)
(50)
De (49) il s'ensuit que pour toutes les valeurs u l et u 2 satisfaisant
aux inégalités (46) le point (VI, v 2 ) décrit dans le plan rt un p a -
r a Il é log r a m ID e, que nous désignerons par V (fig. 33), ayant
pour son1mets les points
( 1 + 1 2 + 2 )
Ci c 2 ' Ci c 2 '
( - c + c, -- c; + c; ),
( 1 1 2 2 )
C i -C 2 , C i -C 2 ,
( 1 1 2 2 )
-c! -c 2 , -C i -C 2 ·
Nous somn1es ainsi amenés à étudier le problème de synthèse des
comn1andes optimales du système (50) à condition que le point v ==
=== (VI, v 2 ) décrive dans le plan rt engendré par les variables yI, y2
un parallélogramme V centré en l'origine des coordonnées. Voyons
CH problème.
Le système (5)
s' écri t d ans le cas du processus
d1 }
dT == - Â'\jJ1 - fl'\jJ2,
d2 Il
dT == fl '\jJ 1 - I\i '\jJ2,
commandé (50)
d'où l'on tire immédiatement la solution générale
'\jJ1 == ce-'J..t cos (flt + ex),
'\jJ2 == ce-'J..t sin (flt + ex),
où c > 0 et ex sont les constantes d'intégration. Puisque nous n'étu-
d ions los coordonnées du vecteur 11' == (\Pb 'P2) qu'à un facteur positif
de proportionnalité près (car la fonction H est homogène en 'Pi),
nous pouvons négliger le facteur positif de proportionnalité ce- Àt et
considérer que le vecteur '\jJ est défini par les relations
'lPi == cos (flt + ex), 11'2 == sin (flt + ex).
In d'autres termes, le vecteur 'lp == (11'1' 11'2) est animé d'un mouve-
Inent de rotation uniforme (autour de l'origine des coordonnées) en
£1- 0 i 3 3 9
130
PROBLÈMES LINÉAIRES EN TEMPS OPTIMAL
[Ch. 3
sens inverse des aiguilles d'une montre à une vitesse angulaire Il
(rappelons que Il > 0).
Désignons maintenant les sommets du parallélogramme V par
et, e 2 , e3, e 4 ; la numération va en sens inverse des aiguilles d'une
!J2
!J'
Ca
FI G. 33
FI G. 34
montre. Traçons ensuite à partir de l'origine des coordonnées des
droites perpendiculaires aux côtés du parallélogramme V et dési-
gnons par ai, CX2, a3, CX4 les angles forInés par ces droites (fig. 34).
D ans le cas présen t la fonc-
tion If étant de la forn1e
H === . . . + 'PtVI + 'lP2V2 ===
== ... + (1}J, v)
(les points £le suspensjon dé-
signen t les term es ne renfer-
mant ni VI ni v 2 ), il s'ensllit
donc de la fige 3,) que si le
vecteur 'lp est sitl1é dans]' an-
gle ai (i === 1,2,3,4), la fOllC-
t ion JI a t t e i nt son Tn ax i nl n fil
au sommet v === el' v E V. Or,
le vecteur 'lp etant animé el 'un
mouvement de rotation uni-
forme de vjtesse angulaire l,
nous sommes donc conduit
à la conclusion suivante sur les commandes optimales. Pen-
dant un temps égal à ai le paramètre de comm ande v est égal à e i'
Il
ensuite v « saute» dans le sommet ei+i où il restera pendan l 111l
tem ps ai+1 (si i == 4, alors i + 1 == 1), de là il « saute » el ans le
f.t
sommet ei+2 et ainsi de suite. Le premier et le dernier intervallr
.
t'/I .
1 f
FI G. 35
21.]
EXEMPLES
131
de temps peuvent fort bien être inférieurs aux grandeurs respectives
ai , car le mouvement peut ne pas avoir commencé à un instant de
t
« cOlnmutation » et peut finir (Le. le point représentatif aboutit à
l'origine des coordonnées) avant que ne se produise une autre com-
ml1tation.
Désignons par ei le point (at, aÏ) E :Tt dont les coordonnées véri-
fient les relations
'i 1 2 1 }
I\ a i -Ilai == - Vi ,
1 +Â 2 2
flai ai == - Vi
1/2
(51 )
e'
3
!J'
où vt et vÏ sont les coordonnées
du sommet ei du parallélogram-
me V. Nous obtenons ainsi qua-
tre points e;, e, e, e, sommets
d'un parallélogramme V' (car les
relations (51) sont linéaires).
Les formnles (51) montrent que le
parallélogramme V' se déduit de
V par nne similitude (centrée à
l'origine des coordonnées) et
d'angle quelconque (fig. 36). D'après les formules (50) et (51) on
voit que lorsque le paramètre de commande V prend la valeur
ei, les variations des coordonnées yI et y2 sont régies par les
équations
,
el
FIG. 36
d 1
1t == Â (yI - al ) - Il (y2 - at ),
dy2 ( 1 1 ) ' 'i ( 2 )
dl == Il Y -- ai -}- 1\, y 2 - ai
En comparant le système (52) au système
d 1
1t == Âyl-lly2, }
d 2
1t == Ilyl + Ây 2 ,
nous constatons qne, graphiquement, ils se déduisent l'un de l'autre
par nne translation; pIns exactement, la position d'équilibre du
système (52)i n'est pas à l'origine des coordonnées (comme pour le
système (53), fige 37), mais au point ei.
Nous sommes donc amenés à l'affirmation suivante sur la struc-
ture des commandes optimales. Le point représentatif décrit pen-
dant un temps ai un arc de la trajectoire de phase du système (52) i,
Il
puis, pendant un temps ai+1 , une portion de trajectoire de phase
Il
du système (52)i+17 ensuite, intervient le système (52)i+2 et ainsi
pourv=ei. }
( 52)i
(53)
9*
132
PROBLÈMES LINÉAIRES EN TEMPS OPTIMAL
[Ch. 3
de suite (le premier et le dernier intervalles de temps pouvant être
inférieurs aux grandeurs correspondantes i ).
11 2
!II
FIG. 37
!l 2
e'
3
Cf............ A.,
\ ...... jJ
\
!Jf
AI
FIG. 38
A présent, il est aisé de construire dans le plan Jt les « lignes de
commutation » qui définissent la synthèse des commandes optimales.
Désignons par A iO (i == 1, 2, 3, 4) l'arc de la trajectoire de phase
du système (52)i aboutissant au point 0 et correspondant à l'inter-
valle de temps ai (fig. 38). Il est clair que le point représentatif
}.t
21.]
EXEMPLES
133
a c h è v e son mouvement optimal sur l'un des arcs AiO qu'il
peut ne pas parcourir entièrement mais seulement une portion X iO
(puisque le dernier intervalle de temps peqt être inférieur à :i ) .
(omme, par ailleurs, le point X i est un point, e « commutation »
{t qu'après cette commutation le mouvement du point représentatif
obéit au système (52)i, on en déduit qu'a van t l'instant de com-
]nutation le mouvement du point représentatif est gouverné par
AJ
z
!J
!JI
AI
FIG. 39
la loi (51)i-1. La portion précédente YiX i de trajectoire optimale
est un arc de la trajectoire du système (52)i-i qui aboutit au point
X i et correspond à l'intervalle de temps CX i - 1 . Lorsque le point Xi
11
décrit entièrement l'arc AiO, les arcs YiX i de la forme indiquée
remplissent le «quadrilatère curviligne» (fige 39) dont l'un des
« côtés» coïncide avec l'arc Ai-iO (car lorsque Xi === 0, l'arc YiX i
coïncide avec A i-10). Trois des sommets du quadrilatère curviligne
mentionné se trouvent donc en Ai, 0, A i - i ; désignons le quatrième
sommet par B i - l . L'arc Bi-iA i - i est alors le lieu géométrique des
points Yi' Le. des points de commutation {du système (52)i-2 au
système (52)i-l) situés sur les trajectoires optimales.
On conçoit aisément que l'arc Bi-iA i - i se déduit de l'arc AiO
Âa. 1
l-
par une similitude de centre ei -b de rapport e J.A. et d'angle CXi-1
(dans le sens des aiguilles d'une montre). En effet, en coordonnées
polaires (yI === P cos Cf), y2 === P sin Cf)) les solutions du système (53)
s'écrivent sous la forme:
p = ce"At, cp =!lt + cx,
où c > 0 et cx sont les constantes d'intégration. Si le mouvement
du point représentatif est régi par cette loi, alors au bout d'un
134
PROBLÈMES LINÉAIRES EN TEMPS OPTIMAL
[Ch. 3
temps 't, le rayon vecteur du point représentatif subira une simili-
tude de rapport eÎv't et d'angle Il't. Pour 't == ai-1 nous démontrons
I-t
notre assertion, à savÛ'ir: le vecteur ei-1X i se déduit du vecteur
ei-1Yi (fig. 40) par une similitu-
Â.a. 1
l-
de de rapport e J.t et d'angle
CXi-1 (la rotation ayant lieu en
sens inverse des aiguilles d'une
Inontre).
Donc la similitude de centre
'Aa- 1
l-
ei-l, de rapport e - et d'angle
!II CXi-1 (la rotation ayant lieu en
sens inverse des aiguilles d'une
montre) transforme l'arc OA i en
l'arc A i-1B i-1 sur lequel se
produit la «commutation» du
système (52)i-2 au système
(52)i-1 (fig. 41).
Avant la comw.utation au point Yi' le mouvement du point
représentatif était' régi par le système (52)i-2 pendant un temps
8z
/iP
/7
/1
/ 1
/ 1
/ \
1
1 \ r
1 3
AJ "
\ ........
!J2
e;
FI G. 40
/12
!JI
BI,
FIG. 41
Cti-2 (l'arc ZiYi sur la fige 42). Lorsque le point Yi décrit entièrement
I-t
l'arc A i - 1 B i - l , les arcs ZiYi de la forme mentionnée remplissent le
« quadrilatère curviligne » dont deux des côtés sont les arcs A i-1 B i-l
et A i-1B i-2. Désignons le quatrième sommet par C i-2. Comme
précédenlment, il s'avère que l'arc B i - 2 C i - 2 (i.e. le lieu géolnétrique
des points de commutation) se déduit de l'arc A i - 1 B i - l par une simi-
21.]
EXEIVIPLES
135
Âai-2
litude de centre ei-2, ùe rapport e - Il et d'angle Cli--2 (la rotation
ayant lien dans le sens des aigulles d'une montre).
]n poursuivant cette procédure, nous arrivons à construire quatre
lignes OAiBiCiD i . . . (i == 1,2,3,4) issues de l'origine des coor-
données et représentant le lien géométrique des points de commuta-
Îvai-1
tion (fig. 43). Une similitude de centre ei-b de rapport e-J! et
el' angle Cli-i (la rotation ayant lieu dans le sens des aiguilles
y2
!J'
C,
FI G w 42
d'une montre) transforme la ligne OAiBiC i . .. en la ligne
Ai-1Bi-1Ci-1Di-1 . .. (fig. 44). Ceci permet de tracer progressive-
nlent les lignes OA iB iC i . . ., si l'on connaît les premières portions
OAt, OA 2 , OA 3 , OA 4 (on a indiqué plus haut comlnent déterminer
ces prelnières portions). Il nous reste à souligner que le paramètre
de con11nanrle u prend la valeur ei à l'intérieur de 1'« angle » formé
par les lignes OAi+1Bi+iCi+1 . . . et OAiBiC i . . . et sur l'arc AiO.
C:e qui nous donne la synthèse des commandes optimales (fig. 45).
1/ allure des trajectoires optimales est représentée sur la fige 46.
Rappelons que les figures 37 à 46 traitent du cas où Â < 0,
Le. lorsque les parties réelles des valeurs propres de la matrice
(a;) sont négatives. Dans ce cas les arcs OA i, A i B i, B i C i, . . . se
sont allongés, quant à la synthèse des commandes optimales, elle
est réalisée sur le plan n tout entier. Lorsque  == 0, les dimensions
d es arcs ne sont pas modifiées (Le. OA i == B i C i == . . ., A i B i ==
== CiD i, . . .); la synthèse des commandes optimales est réalisée
con101e précérlernn1ent sur le plan n tout entier (voir l'exemple 3
FI G. 43
,
.e z
1/1
FIG. 44
!J'
!/2
v=e 2
v= el
!II
v=e a
v= et
y'
FIG. 46
138
PROBLÈMES LINÉA IRES EN TEMPS OPTIl\IAL
[Ch. 3
.Y
1
1
1
1
1
1
1
1
1
1
\
\
\
\
\
\
\
\
\
\
\
"
"
"
"
--
,.,---
,.,
/'
./
,/
,/
/
/
/
/
/
/
/
/
......-------
--
- "'"-
"'................
.........
.......
.......
"-
'"
,
'-
"
\
\
\
\
\
\
\
\
\
\
\
\
,
tg l
1
1
1
1
1
1
1
'"
"'-
"
...............
.......'--
'-...
---..-
/
/
/
/
/
/
/
/
./
./
./
..;
.,...
...-""""
---...-"'-
FIG. 47
du 5). Enfin, lorsque À == 0, les dimensions des arcs OA b B i C i, . . .,
et A iB i, CiD b . . . diminuent en raison géométrique; la synthèse
des commandes optimales n'est réalisée que dans une portion limitée
du plan Jt (fig. 47).
Nous venons de trai ter la synthèse des commandes optimales
dans le plan Jt engendré par les variables yI et y2. On passe au plan X
engendré par les variables de départ Xl et x 2 au moyen dos formu-
les (47). On constate dans ce cas que le tableau de la synthèse des
cOlnlnandes optimales se déforme affinen1ent.
f-21.]
EXEIVIPLES
139
E x e m pIe 2.
(Système du deuxième ordre à deux paramètres de commande
et des valeurs propres négatives.)
Soit le système (45) où l'on suppose que les valeurs propres de
la matrice (aj) sont réelles, négatives et distinctes. Nous admettrons
(omme précédemment que le domaine de commande U est défini
par les inégalités (46) et que le déterminant de la matrice (bj)
est non nul. Désignons les valeurs propres de la matrice (a;) par  i et
Î\,2, À 2 < À i < O. Un changement linéaire des variables (voir (47))
ramène le système (45) à la forme:
dlt i = Â,jyl + CUI + c u 2 , }
dy2
- == Â Y 2 + C2Ul + C"U2
dt 2 1 2'
ou
dlt I = Â,jyl + VI, }
dy2 _ À 2 + 2
di-- 2Y v
(voir (49)). Comme dans le premier exemple, le point v == (VI, v 2 )
décrit le parallélogramme V (voir fige 33) dans le plan Jt engendré
par les variables yI, y2.
Dans le cas d'un processus commandé (54), le système (5) prend
la forme:
(54)
d'Pt '1 }
di == - f\.,t1Pt,
d 'p 2 '1
Cft == - f\.,2'tP2,
et sa solution générale est:
'tPi == Ct e - Îv1t , 'tP2 == C2 e - J - 2t .
()n voit d'après l'allure des formules que si l'une des constantes
d'intégration Ci ou C2 est nulle, le vecteur 1P == (1Pl, 1P2) conserve
une orientation constante (qui est parallèle à l'un des axes de
coordonnées). Si les deux nombres Ci et C2 sont non nuls, alors le
vecteur 'tp est animé d'un n10uvement de rotation uniforme (lorsque
t croît ) entre l'axe des abscisses et cel ni des ordonnées, tout en res-
tant dans le même quadrant (car I : I = 1 : 1 e(Â!-Â2)t -+ 00,
lorsque t croît).
Supposons que la condition de position commune est. satisfaite
pour le syst.ème (45); elle esl donc satisfaite aussi pour le système
(54) qui se déduit du système (45) par une lransforn1ation linéaire.
140
PROBLÈMES LINÉAIRES EN TEMPS OPTIMAL
[Ch. 3
En d'autres termes, aucun des côtés du parallélogralnme n'est
parallèle à aucun des axes de coordonnées. Abaissons de l'origine
des coordonnées des droites l1 et l2 perpendiculaires aux côtés du
parallélogramme V (voir fige 34; ces droites ne sont pas confondues.
avec les axes de coordonnées en vertu de ce qui précède). Nous
constatons comme précédemment que si le vecteur 1P est contenu dans
l'angle ai (i == 1, 2, 3, 4), la fonction JI atteint son maximum
au point v == ei, v E V (voir fige 35).
Désignons maintenant par ei le point (al, a) E JI: de coordonnées:
1 1 1 2 1 2 55)
ai == - Â 1 Vi, ai == - Â 2 Vi, (
où vl et V sont les coordonnées du sommet ei du parallélogramlne V.
Nous obtenons alors quatre points e, e;, e;, e, qui sont les SOInlnets
d'un certain parallélogramme V'. Des formules (54) et (55) il résultp
que lorsque le paramètre de commande v prend la valeur eb les
variations des coordonnées yl et y2 obéissent aux équations
dyl  ( l 1 )
(ft== 1 Y -ai,
dy2 2 2
(ft == Â 2 (y - ai )
(pour v = ej). }
(56) i
Le graphique du système (56)i se déduit de celui du systèn1c
d:!t 1 = Â,tyl, } (57)
dy2 Â 2
(ft == 2Y
par une translation; la position d'équilibre du système (5G)i n'étant
plus à l'origine des coordonnées (comme pour le systènle (57),
fig. 48), mais au point ej.
En poursuivant notre étude, nous aboutissons à des résultats
totalement différents selon la disposition des droites l1 et l2 perpen-
diculaires aux côtés du parallélogramme V. Considérons les deux
cas suivants.
Premier cas. Les droites l1 et l2 sont situées dans des quadrants
différents (Le. l'une dans le premier et le troisième, l'autre dans
le second et le quatrième, fige 49). Numérotons les angles ai (défi-
nis par les droites l1 et l2) comme l'indique la fige 50, Le. e2 et el,
désignent respectivement les sommets supérieur et inférieur du
parallélogramme V, et e1 et e 3 les sommets droit et gauche (fig. 49).
Le caractère de variation des grandeurs 1P1 et 1P2 nous amène à faire
la conclusion suivante sur les commandes optimales. Toute comn1an-
de optimale soit ne renferme pas de points de commutation (Le. tout
au long du déplacement le paramètre v conserve sa valeur constante
qui coïncide avec l'un des sommets du parallélogramme V), soit
21.]
EXEMPLES
141
y2
!l'
FI G. 48
ne renferme qu'un seul point de commutation et alors avant la com-
mutation le paramètre v se confond avec l'un des sommets et ou e 3
et, après la commutation, avec l'un des sommets e2 ou e4.
1 l est désormais facile de construire dans le plan Jt les «lignes de
conlmutation» qui déterminent la synthèse des commandes opti-
!f3
Ct
/1\
/ \
/ JI \
cJ \
\
o
!Il
z,
JI'
z,
Y,
Z2
Z2
FIG. 49
FI G. 50
142
PROBLÈMES LINÉAIRES EN TEMPS OPTIMAL
[Ch. :
males. Désignons respectivement par AO et BO les trajectoires
des systèmes (56) 2 et (56)4 qui aboutissent à l'origine des coor-
données (fig. 51). Les lignes AO et BO sont symétriques par
rapport à O. Si le mouvement optirnaL
renferme une commutation (et une seulo
d'après ce qui précède), sa fin est gou"'
vernée par le système (56)2 ou (56)4'
Le. le point représentatif se déplacera
sur la ligne AO ou la ligne BO. Aupa-
ravant (Le. avant el' arriver sur la ligne
BOA), le point représentatif se sera dé-
!JI placé soit sous l'action du système (56) 1
soit sous l'action du sysLème (56)3. La
ligne BOA est donc une ligne de corn-
mutation, quant aux deux don1aines
qu'elle délimite sur le plan, ils sont rem-
plis par les trajectoires des systèmes
(56)1 et (56)3: le domaine de droite par
les trajectoires du système (56) 3' le do-
maine de gauche par les trajectoires du
système (56)1. Ceci nous donne la synthè-
se des commandes optimales (fig. 52).
Le passage des variables yI et y2 aux variables initiales Xl, x 2
a pour effet de dformer affinement le graphique des trajectoires
optimales.
Deuxième cas. Les droites l1 et l2 sont situées dans les mêmes
quadrants, par exemple dans le premier et le troisième. Numérotons
les angles ai (définis par les droites l1 et l2) comme l'indique la
fige 53; les sommets du parallélogramme V sont numérotés sur la
fige 54. Le caractère de variation des grandeurs 1Pl et 1P2 nous amène
à faire la conclusion suivante sur les commandes optimales. Si la
valeur initiale 1Po du vecteur 1P == (1P1, 1P2) est située à l'intérieur
du quatrième quadrant (ou sur ses côtés), le vecteur cr variera sans
quitter ce quadrant, i.e. il restera constammen,t dans l'angle a1.
Nous aurons don v == el (sans commut8.tion). Cette commande esL
associée à la trajèctoire du système (56)1 qui aboutit à l'origine
des coordonnées (fig. 55). D'une manière analogue, si la valeur
initiale 1Po du vecteur 11' est située à l'intérieur ou sur les côtés du
deuxième quadrant, nous aurons v == e 3 tout au long du déplace-
ment, Le. nous obtenons la trajectoire du système (56)3 qui aboutit
à l'origine des coordonnées (fig. 56). Toutes les autres trajectoires
optimales correspondent aux cas où le vecteur 11'0 est situé à l'inté-
rieur du premier ou du troisième quadrant. Discutons le cas où 'Po
est situé dans le premier quadrant (le cas du troisième quadrant
se déduit par une symétrie par rapport à l'origine des coordonnées).
Soit donc le vecteur 1Po situé à l'intérieur du premier quadrant,
B
g2
.,
(}j
-e'
1
-e'
A
FI G. 51
21.]
EXEIV[PLES
143
!l 2
!l'
FIG. 52
mais dans l'angle (Xl. Le vecteur", est animé d'un mouvement de
rotation uniforme en sens inverse des aiguilles d'une montre qui le
rapproche de l'axe des ordonnées. La commande optimale admet
donc deux commutations: d'abord v == el, ensuite v == e2 après la
première commutation et, enfin, iJ == e 3 après la seconde commuta-
l,
FI G. f)
144
PROBLÈMES LINÉAIRES EN TEMPS OPTIMAL
[Ch. 3
tion. Nous allons montrer que dans le cas des deux commutations
mentionnées, l'intervalle, de tmps pendant lequel le paramètre de
commande v prend la valeur e2 est d'une dur é e b i end é -
fin i e (indépendamment du choix des conditions initiales).
e3
.......
\ V.......-
\
l,
!l'
FIG. 54
En effet, désignons respectivement par k 1 et k 2 (k 1 < k 2 ) (voir
fige 53) les coefficients angulaires des droites II et l2. Le vecteur 1P
variant suivant la loi
'\Pi == cie-lt; '\P2 == C2 e - Â2t
(où C1 > 0 et C2 > 0 puisque 1P est situé dans le premier quadrant),
y2 y2
e' e'
.3 .2
0 !JI
C' . ,
.'2 e 1
0 !If
. , .,
e" CI
FIG. 55
FIG. 56
l'instant de commutation Ti du sommet el au sommet e2 (i.e. l'instant.
où le vecteur 'lp coupe la droite l1) se déduit de la relation
c2e-2'tl
=1£1.
C1e-1't1
S 21.]
EXEMPLES
145
D'une manière analogue, l'instant de commutation T2 du sommet e2
au sommet e 3 (Le. l'instant où le vecteur", coupe la droite l2) se
déduit de la relation
C 2 e - Â.2't2
== k 2 .
C1 e -Â. 1 't 2
Donc,
1 1 k1C1 1 1 k2C1
ti == '1 '1 n-, T2 == '1 1 -'1 2 n - C2 '
""1 -""2 C2 "" ""
et l'intervalle de temps [T1,T2] durant lequel le paramètre de com-
lllande v prend la valeur e2 est d'une longueur:
1 ( l k2c 1 1 ki Ci ) 1 l k2
'(2-'(1== 'A 'A n-- ll- == 'A 'A n - k ·
1 - 2 C2 C2 i - 2 1
Le nombre figurant dans le deuxième membre de l'expression (58.)
ne dépend ni de Ci ni de C2 (i.e. de la valeur initiale 1PO du vec-
teur '\p), désignons-le par T.
Ainsi lorsque le vecteur 1P varie dans le premier quadrant, les
trajectoires optimales sont de la forme suivante. Le paramètre de
comnlande v prend la valeur v == e1 durant un certain temps, puis
la valeur v == e2 durant le temps T et, enfin, la valeur v == e 3 jus-
qu'à la fin du mouvement.
Il est bien entendu que le nombre de commutations peut être
inférieur à deux. Si, par exemple, nous avions commencé à étudier
le mouvement du point représentatif à un moment où le paramètre
de commande v était égal à e2, alors pendant un intervalle de temps
non s u p é rie u r à T le paramètre v se serait trouvé au sommet
e2 et après commutation, au sommet e 3 . Le mouvement aurait pu
aboutir aussi à l'origine des coordonnées avant l'instant de commuta-
tion du sommet e2 au sommet e 3 . Autrement dit, si le paramètre
de commande v réalise moins de deux commutations, le temps qu'il
passera dans le sommet e2 n'est pas s u p é rie u r à T (la commuta-
t.ion peut s'opérer soit de e1 en e2 soit de e2 en e3).
A présent il est aisé de construire sur le plan nIes «lignes de
commutations» qui définissent la synthèse des commandes opti-
nlales. Traçons d'abord les trajectoires correspondant à d eux
commutations. Sur ces trajectoires, la phase finale du mouvement
correspond à la valeur du paramètre v == e 3 , i.e. le mouvement
a lieu sur l'arc AO de la trajectoire définie par le système (56)3
qui abou Li t à l'origine des coordonnées (fig. 56). A van t d' arri ver
sur la ligne AO le point représentatif s'est déplacé sous l'action du
système (56)2. La ligne AO est donc une ligne de commutation du
sommet e2 au sommet e 3 . Soit X un point quelconque de la ligne AO.
IJa portion de trajectoire optimale Y X antérieure au point X est
un arc de la trajectoire du système (56)2 qui correspond au temps T
(fig. 57). Les solutions du système (57) étant de la forme yI == C1eÎv1t.
(58)
10-01339
146
PROBLÈMES LINÉAIRES EN TEMPS OPTIMAL
[Ch. 3
y2 == C2eÂ2t, lorsque le point représentatif se déplacera sur la trajec-
toire de ce système durant le temps T, son abscisse sera multipliée
par e'A1T et son ordonnée par e'A2T. Le système (56)2 se déduisant
du système (57) par un déplacement de la position d'équilibre, les
points X se déduisent des points correspondants Y (fig. 57) par une
transformation affine L consistant à multiplier les abscisses par
2
Il
yZ
1 e'
e J e' e'
. .3 .3 .2
!l' 0 !JI
.,
e
8
A
A
FIG. 57
e'A1T et les ordonnées e'A2T dans un système de coordonnées admet.tant
pour origine le point e (voir 55)) et pour axes des droites parallèles
aux yI et y2. D'où l'on déduit que le lieu géométrique des points Y
est une ligne CB transformée affine de AO par L (fig. 58). En
traçant par ailleurs la ligne BO qui est un arc de la trajectoire
du système (56)2 aboutissant à l'origine des coordonnées et corres-
pondant à l'intervalle de temps T, nous constatons que la «bande»
AOBC est entièrement remplie par des portions de trajectoires du
système (56)2 partant de la ligne CB, aboutissant à la ligne AO
et correspondant à l'intervalle de temps T.
Le lieu géométrique des points Y en lesquels s'opère la comn1uta-
tion du sommet et au sommet e2 est donc la ligne CB . Avant d' arri-
ver en Y, le point représenta tif s'est déplacé sur la trajectoire el u
système (56)1. En définitive, nous obtenons des trajectoires corres-
pondant à d eux commutations (fig. 59). La trajectoire « extrê-
me » DEO de la figure 59 correspond à une commutation: le
21.]
EXEMPLES
147
point représentatif arrive à l'origine des coordonnées juste à l'instant
oÙ devrait avoir lieu la deuxième commutation (du sommet e2
au sommet e 3 ).
!l 2
e'
..3
,
e z
.
o
!JI
lJ
FIG. 59
Voyons à présent les trajectoires correspondant à une commuta-
tion de el en e2. La phase finale du mouvement se déroule alors
durant un intervalle de temps n'excédant pas T sur la trajectoire
!J2
,
1:3 e'
. .2
0 !Jf
. 1
el
FIG.60
el u système (56) 2 qui aboutit à l'origine des coord onnées, i. e. sur
une certaine portion ZO de la ligne BO (fig. 60). .LL\vant d'arriver en Z,
le mouvement du point représentatif est régi par le système (56)1.
10*
148
PROBLÈMES LINÉAIRES EN TEMPS OPTIMAL
[Ch. ;)
Lorsque le point Z parcourt l'arc BO tout entier, les trajectoires de
la forme mentionnée remplissent la « bande » DBOA / (fig. 61) où
A'O est la trajectoire du système (56)1 qui aboutit à l'origine des
coordonnées.
!l 2
!J
!J'
v= e 3
v- e
- 1
o
!l'
FI G. 61
FIG. 62
En groupant toutes les trajectoires optimales obtenues nous
constatons qu'elles remplissent le domaine situé à gauche de la
ligne AOA / (fig. 59, 61). Il est évident que la ligne A'O et la ligne
AO sont symétriques par rapport à l'origine des coordonnées.
A droite de la ligne AOA' les trajectoires se comportent d'une
manière symétrique et les commutations ont lieu de e 3 en e4, ensuite
de e4 en et. En définitive, la synthèse des commandes optimales
se réalise sur le plan tout entier (fig. 62). Les trajectoires optimales
sont représentées sur la fige 63.
21.]
EXEMPLES
149
Le passage des variables yI et y2 aux variables initiales Xl et x 2
a pour effet de déformer affinement les trajectoires optimales.
!J2
!JI
FIG. 63
E x e ID pIe 3.
(Cas où le polyèdre U est unidimensionnel et les valeurs propres
de la matrice (aj) sont réelles.)
Su pposons que r == 1 dans le système (1), i. e. le paramètre de
cornmande u est un nombre réel; supposons en outre que ce nombre
est assujetti à varier dans l'intervalle -1 u 1. Le polyèdre U
est donc l'intervalle [-1, 1] de l'axe numérique et le système (1)
s' écri t sous la forme
n
dx i . ·
(ft == LJ axv+ b'u, 1 u 11,
,,=1
i == 1, 2, ..., n.
(59)
Supposons, enfin, que les valeurs propres de la matrice (aj) sont
réelles. Alors, en vertu du théorème (10), la trajectoire optimale
150
PROBLÈMES LINÉAIRES EN TEl\IPS OPTIMAL
[Ch. 3
contient au plus n intervalles de constance sur lesquels on a alter-
nativement u == +1, u == -1.
En d'autres termes, sur chaque intervalle de constance le mouve-
ment du point représentatif est régi par l'un des deux systèmes
suivants:
n
dx i . i
- == a'Lx V -L b
dt Vi'
v=1
i == 1, 2, ..., n,
(60)+
n
dx i 2} . .
-== a'LxV-b
dt v '
v=1
i == 1, 2, ..., n.
(60)_
Désignons respectivement par lVI et M;, les trajectoires des
systèmes (60)+ et (60) _ qui aboutissent à l'origine des coordonnées.
/1+
n
-
/1-
n
FI G. 64
Ces trajectoires forment une ligne passant par l'origine des coordon-
nées et que nous désignerons par Mn (fig. 64). D'après le caractère
des commandes optimales il est clair que la phase finale du mouve-
11;
/1-
n
FIG. 65
ment optimal (qui s' àchève à l'origine des coordonnées) aura lien
sur la ligne lVI; ou sur j1f.
Considérons maintenant toutes les trajectoires du système (60)+
aboutissant sur la ligne lVI;. (fig. 65). Ces trajectoires remplissent
une certaine surface M-1 admettant pour bord la ligne 111n. D'une
façon analogue, les trajectoires du système (60) _ aboutissant sur
la ligne A1 remplissent une certaine surface lVI;;'_1 admettant pour
bord la ligne Mn. En groupant les surfaces AI-1 et M;;'-1 nous obte-
nons une surface que nous désignerons par AIn -1 (fig. 66). Il est clair
21.]
EXEMPLES
151
que les deux dernières phases de tout mouvement optimal se dérou-
leron t sur la surface Mn -1, car seules les trajectoires de cette surface
permettent d'aboutir à la ligne Mn sur laquelle a lieu la phase fina-
le du mouvement.
Par ailleurs, les trajectoires du système (60)+ qui aboutissent
sur la surface M-;;'-1 forment une variété tridimensionnelle M-2
admettant pour bord la surface M n-1. Les trajectoires du système
(60) _ qui aboutissent sur la surface M-1 engendrent une variété
FI G. 66
tridimensionnelle M-;;'-2 de bord M n-1. Les variétés M-2 et M-;;'-2
forment une variété tridimensionnelle M n - 2 où s'achèvent les trois
dernières phases de tout mouvement optimal.
En poursuivant cette procédure nous construisons les variétés
111n, J11 n-17 . . ., M 1 où Mi est de dimension n - i + 1. La variété
Mi+l est entièrement contenue dans la variété Mi qu'elle divise
en deux domaines Mt et Mi, le premier étant constitué de toutes
les trajectoires du système (60)+ aboutissant sur Mi+1 et le second
de toutes les trajectoires du système (60) _ aboutissant sur Mt+1.
La dernière variété 1\1 1 soit est confondue avec l'espace de phase X
tout entier, soit est un domaine de cet espace renfermant l'origine
des coordonnées. C'est à l'intérieur du domaine M 1 que se réalise
la synthèse des commandes optimales.
Cet te synthèse se réalise de la façon suivante: le paramètre de
COll1ll1ande u est égal à +1 dans tous les domaines Mi et à -1 dans
tous les domaines 111i. Le point représentatif est en mouvement dans
le domaine Mi: U == +1 s'il se trouve en Mt et u == -1 s'il se
trouve en 1\1 1 . Lorsqu'il arrive sur la variété M 2, il se produit une
comn1utation ot le reste du mouvement se déroule sur la variété M 2 .
La commutation suivante se produit lorsque le point représentatif
en se déplaçant sur M 2 arrive sur M3. Il continue de se déplace!"
sur J1I1 3 et ainsi de suite. La phase finale du mouvement qui s'achève
à l'origine des coordonnées se déroule sur la ligne Mn. Il se produit
152
PROBLÈl\iES LINÉAIRES EN TEMPS OPTIMAL
[Ch. 3
donc n - 1 commutations en tout. Il est bien entendu que pour
certaines positions de départ du point représentatif le nombre de
commutations peut être inférieur à n - 1 (il peut arriver par
exemple que le point Xo soit situé sur la variété M 2, ou sur AI 3 ,
etc. ).
L' exem pIe 1 du 5 est un cas particulier de la construction géné-
rale exposée ci-dessus.
E x e m pIe 4.
Soit à résoudre le problème suivant. Dans un espace euclidien
de dimension n est en mouvement un point commandé sous l'action
d'un « moteur» susceptible de lui communiquer une accélération
n'excédant pas l'unité en module et orientée arbitrairen1ent. Com-
ment faut-il commander le mouvement de ce point si l'on veut qu'en
partant d'une position initiale donnée avec une vitesse initiale
donnée il mette le moins de temps pour arriver à l'origine des coor-
données (avec une vitesse finale arbitraire)?
Pour résoudre ce problème désignons les coordonnées du point
en mouvement par Xl, x 2 , . . ., x n , les composantes de sa vitesse
par xn+l, . . ., x 2n et les composantes de son accélération par
u 1 , . . ., un. Prenons l'unité pour masse de ce point. Les équations
du mouvement du point s'écrivent alors sous la forme:
dx 1 - xn+l )
dt - ,
dx 2 - xn+2
dt - ,
. . . .
dx n -x 2n
dt ,
l (61)
dxn+1
-u l
dt - ,
dxn+2 -u 2
dt - ,
. . . . . .
dx2n n
dt == u . J
L'accélération u == (u l , . . ., un) n'excédant pas l'unité en module,
le domaine de commande U est défini par l'inégalité
(U 1 )2 + (U 2 )2 +. . . + (U n )2 1.
(62)
Puisque la position initiale et la vitesse initiale du point en mouve-
ment sont données, la position initiale Xo === (x, ..., xn) se trouve
ainsi définie dans l'espace de phase X engendré par les variables
21.]
EXEMPLES
153
l 2 n 2n L d . t . d ' ., l ,.. d
X , X , . . ., X , _ . ., x. a con lIon arrl vee en orIgIne es
coordonnées (avec une vitesse finale arbitraire) signifie qu'en fin
de mouvement doivent être vérifiées les relations
X l - X 2 - - X n - 0
- -...- -,
(63)
les grandeurs Xn+l, . . ., x 2n pouvant être arbitraires. Autrement
dit, le problème consiste à transférer en temps optimal un objet
commandé par les équations (61) et (62) du point initial Xo E X
en un point quelconque de la variété S 1 définie dans X par les équa-
tions (63). La variété S 1 est de toute évidence un plan de dimension n.
Dans ce cas, la fonction H s'écrit:
H == 1p1Xn+I-t- '\f2Xn+2 -1- . . . + 1pn x2n + 1pn+1 ul + . . . + 1p211. Un . (64)
Le système d'équations pour les variables auxiliaires 'tf'i s'écrit:
d'P1
dt == 0,
d'l'2
dt == 0,
d'l'11. == 0
dt '
dWn+1 _ _ 1h
dt - 't'b
d'l'n+2 == -1 h
dt Y2,
d'l'2n _ _ 1h
dt - 't'n-
Il s'ensuit que pendant toute la durée du mouvement optimal les
grandeurs 11'1' 11'2' · · ., 11'n restent constantes et donc les grandeurs
'lp11.+ 17 11'11.+ 2, . · ., 11'2n sont des fonctions linéaires en t.
Ecrivons maintenant la condition de transversalité à l'extrémité
droite de la trajectoire optimale. Pour que le vecteur 1P ==
== (11'1, · . ., 11'11.' 11'11.+1' · . ., 11'2n) soit orthogonal à la variété S 1 qui
est définie par les équations (63), il est nécessaire et suffisant que
soient vérifiées les conditions
11'n+1 = 11'n+2 = · · · == 1J'211. == O.
]a condition de transversalité à l'extrémité droite de la trajectoire
s'écrit donc:
11 J n+1 (t 1 ) == 'Pn+2 (t 1 ) == · - · == 1P211. (t 1 ) == 0,
(65)
OÙ t 1 est l'instant où le point représentatif arrive sur la variété S 1-
(om pte tenu de la linéarité des fonctions 11'n+ 1, 1Pn + 2, · . ., 11' 2n'
154
PROBLÈMES LINÉAIRES EN rrEMPS OPTIMAL
[Ch. 3
il vient de (65):
lPn+1 === a1 (t 1 - t), lPn+2 == a2 (t 1 - t), ...,
1JJ2 n == an (t t - t), ( (6)
où ab a2, . . ., an sont des constantes. Les grandeurs lPi étant défi-
nies à un facteur positif commun de proportionnalité près, nous pou-
vons supposer que le vecteur a == (ab a2, . . ., an) est égal au vec-
teur unitaire, Le.
(a1)2 + (a2)2 + . . . + (a n )2 == 1.
En portant (66) dans (64) il vient:
H ==... +(tt-t) (atul+a2u2+ ... + an un),
où les points de suspension désignent les termes ne dépendant pas
de u 1 , . . ., un. Puisque t 1 - t > 0 (car t 1 représente l'instant
fin a 1 du mouvement), la condition de maximUln de la fonction
H signifie que pendant toute la durée du mouvement la grandeur
alul + a2u2 + . . . -+ an un === (a, u)
doit être maximale, ce qui signifie, en vertu de (62), que u (t) == a,
i.e. les grandeurs u l , u 2 , . . ., un gardent des valeurs constantes
u i == ai, i == 1, . . ., n, pendant toute la durée du mouvement.
Ainsi, dans le cas considéré, l' optimalité du mouvement signifie
que l'accélération u est con s tan t e et égale à l'unité en
module. Ceci nous permet de définir d'une manière univoque l'accé-
lération cherchée (Le. de trouver le sens du vecteur accélération u).
En effet, dans l'espace euclidien considéré la trajectoire du mou ve-
ment du point représentatif est la parabole
.. . . t 2
X == X 'l. + X n+l t + U - l 1 n
o 0 2'. === , ..., ,
où u == (u l , ., un) est le vecteur constant de l'accélération de
module égal à l'unité, i.e. vérifiant la condition
(U 1 )2 + (U 2 )2 +. . . + (U n )2 == 1. (67)
Pour que cette trajectoire passe par l'origine des coordonnées, il
faut que soient vérifiées les conditions
. . . t 2
x+x+1.t+ut 2 ==0, i== 1, ..., n. (68)
Les relations (67) et (68) forment un système de n + 1 équations
en u 1 , u 2 , . . ., un, t où t ne prend que des valeurs positives. S'il
existe plusieurs solutions, nous devons prendre celle où t a 1 a
plu s pet i t e valeur positive (puisqu'il s'agit d'arriver en
temps optinlal à l'origine des coordonnées). De (68) il vient:
. 2 (xi + xn+it)
11 === _ 0 0 1 1 7 '1
Ut t 2 ' : == , · · ., " ·
(69)
22.]
SIMULATION
155
En portant cette valeur dans la relation (67), nous obtenons l' équa-
tion
n
4 (x + xl+it)2 - t 4 == 0
i=1
(70)
n
en t. Lorsque t == 0, on a 4 2j (X)2 > 0 (il est bien entendu que le
i=1
poin t (x, x, . . ., xB) n'est pas confondu avec l'origine des coor-
données, sinon la solution du problème optimal aurait été évidente:
f == 0). Lorsque t cx>, le premier membre de l'équation (70) est
négatif. Cette équation (70) admet donc au moins une racine positive.
Désignons par 't (xo) == 't (x, x, . . ., xa, xa+ 1 , . . ., xÔ n ) 1 a plu s
pet i t e racine positive de cette équation. Alors nous tirons de
(69) les valeurs cherchées des corn posan tes de 1 ' accélération
. 2 (xi -+ xn+i't (xo))
U === _ 0 0 .
('t (xO))2
Nous obtenons ainsi la synthèse des commandes optimales du problè-
lue posé. (La fonction 't (xo) et par conséquent les fonctions u i sont
eontinues par morceaux.)
22. Simulation des commandes linéaires en temps optimal
par des circuits à relais
Revenons au problème des commandes linéaires en temps opti-
Inal étudié au 17. En vertu du théorème (9), toute trajectoire extré-
Inale (voir page 114) qui part du point xo à l'instant t o est définie
par les valeurs initiales '\}J (t o ) de la solution '\}J (t) de l'équation (5).
Si précisément est donné un vecteur '\}Jo arbitraire et non nul, la solu-
tion 'p (t) de l'équation (5) vérifiant la condition initiale '\}J (t o ) == 11'0
est univoque. Par ailleurs, en vertu du théorème (9), la relation (6)
définit d'une manière univoque la commande extrémale u (t). Une
fois connue la commande extrémale u (t), nous déduisons de l' équa-
tion (2) la trajectoire x (t) qui lui est associée et qui part du point xo.
In définitive, la trajectoire extrémale x (t) est définie donc d'une
rnanière univoque par le choix de la valeur initiale 'Po. Si l'on arrive
à trouver une valeur initiale '\}Jo telle que la trajectoire x (t) pas s e
par l' 0 r i gin e des c 0 0 l'do n née s 0, alors la commande
u (t) et la trajectoire x (t) obtenues par la procédure indiquée pré-
cédeUlment seront optimales. En effet, la trajectoire x (t) ainsi
obtenue partira dans ce cas du point xo au point 0 imposé, d'où l'on
conclut à l'existence d'une commande optimale (théorème 13). Cette
commande optimale est unique (théorème 11) et obéit au principe
du n1aximum, Le. est extrémale (page 114). Or il n'existe qu'une
156
PROBLÈMES LINÉAIRES EN TEMPS OPTIMAL
[Ch. 3
commande extrémale recalant le point Xo à l'origine des coordonnées
(théorème 12). Donc, cette commande extrémale est précisément
la commande optimale.
Il importe de souligner que la d é ter min a t ion de la
trajectoire x (t) correspondant à la valeur initiale 'Po donne lieu à des
calculs assez laborieux. Il faut en effet résoudre l'équation (5),
trouver la fonction u (t) à l'aide de la formule (6), et, enfin, résoudre
l'équation (2), ce qui revient donc à résoudre plu sie u r s
systèmes d'équations différentielles en prenant chaque fois le résul-
tat obtenu pour conditions initiales (car la fonction u (t) en général
n'est pas constante, mais seulement constante par morceaux).
fo
.xo
!
Il' X'
-
u 2 :£2
-
- Ax+ Bu
. .
. .
. .
ur x n
-
-A*r
FI G. 67
FIG. 68
Si l'on suppose que la recherche de la trajectoire x (t) d'a près
la valeur initiale 'Po peut être effectuée par un a p par e i Il quel-
conque, il reste le pro b l è m e deI are che r che de la
valeur initiale 'Po pour laquelle la trajectoire x (t) passe par l' ori-
gine o.
Sans nous soucier du deuxième problème (le problème de la
recherche des conditions ini tiales 'Po) nous allons indiquer dans ce
paragraphe comment construire un simulateur permettant par la
connaissance de la valeur initiale 11'0 de déterminer la trajectoire
extrémale correspondante x (t). Ce simulateur est composé de deux
systèmes linéaires à équations (2) et (5) et d'un certain nombre
d'é 1 é men t spa r t 0 u t 0 uri e n don t le schéma et le
nombre de connexions sont déterminés par le polyèdre U et l' opéra-
teur B.
Voyons maintenant la description mathématique de ce simula-
teur. Soit un système linéaire dont les états de phase sont décrits
par les variables 'PI, . . ., lPn en vertu de la loi (5). Représentons
conventionnellement ce système comme l'indique la figure 67.
La donnée des valeurs initiales des grandeurs 11'1' . . ., 'Pn (i.e. la
donnée du vecteur '\}Jo) définit univoquement les variations ultérieu-
res des grandeurs 11'1' . . ., 'Pn dans le temps . Représentons le système
initial (qui est régi par l'équation (2)) comme l'indique la figure 68.
Pour que la variation (dans le temps) des grandeurs de sortie (i.e. des
22.]
SIMULATION
157
coordonnées de phase) Xl, . . ., x n , soit définie uni voquelnent il
faut que soient donnés l'état de phase initial Xo du système et la
variation (dans le temps) des grandeurs d'entrée u l , . . ., ur (i.e. des
paralnètres de cOlnmande). Le simulateur cherché est de la forme
représentée sur la fige 69; la «caisse» médiane située entre les
systètnes représentés sur les fige 67 et 68 contient un certain nombre
d'éléments par tout ou rien. Le reste du paragraphe est consacré
précisément à la description de la «caisse» médiane.
1'0
.zo
'--_________-.J
J ut. x,
J x 2
J u 2
1 Ax + Bu -
1 -
1 . .
. .
J . .
1 ur x n
1 -
- A *'1
I r-.--------,
1
2 1
J
1
1
n 1
FIG. 69
Distinguons tout d'abord les cas particuliers où le dispositif
de la « caisse » médiane est d'une conception très simple . Voyons,
pour COlnmencer, le cas où dans l'équation (2) ne figure qu'un seul
paramètre de commande u, variant dans les limites -1 u 1
(i.e. le cas où le polyèdre U est l'intervalle [-1, 1]). La matrice (bj)
se transforme en la colon n e (b l , b 2 , . . ., b n ) et la fonction (7)
s'écrit sous la forme
n
'Pa (t) bau.
a=l
:L'équation (6) admet donc la solution suivante:
n
U == sign ( ba\j)a (t)).
a=l
(71)
...i\.utrement dit, SI nous introduisons la grandeur auxiliaire
n
== i.' ba\fa, (72)
a=l
la solution de l'équation (6) sera définie par la formule
u == sign . (73)
Le passage des grandeurs 11'1' . . ., lPn à la grandeur définie par
la formule (72) est réalisé par un som mat e u r représenté
eonventionnellement sur la fige 70. La fige 71 représente un é 1 é -
158
PROBLÈMES LINÉAIRES EN TEMPS OPTIMAL
[Ch. 3
men t par t 0 U t 0 uri e n, i.e. un système dont la grandeur
de sortie et la grandeur d'entrée sont liées par la relation 11 == sign .
Groupons les systèmes représentés sur les fige 67, 68, 70 et 71
dans un schéma uni que (fig. 72). Il est clair que quel que soit le
vecteur initial '\}Jo, à la sortie du premier circuit (du schéma représenté
1
1
2
.
.
.
6: -lsl1J .
rn
FI G. 70
FIG. 71
sur la fig. 72) nous obtiendrons les grandeurs 'Pi (t), . . ., 1Pn (t)
qui sont solution de l'équation (5). Dans le circuit suivant (repré-
senté en pointillé) ces grandeurs se transforn1ent d'après les forn1u-
ro
.Io
-A*
1 r----------l
1
1
é; S : u
1 1
n 1 1
1
L_________.J
X'
x 2
Ax + Bu
x n
FI G. 72
les (72) et (73) de sorte qu'à la sortie nous obtenons la grandeur (71)
qui n'est autre que la solutic:l de l'équation (6). En d'autres termes,
à la sortie du deuxième circuit, nous obtenons la c 0 m man d e
e x t r é mal e u (t), et par conséquent les grandeurs de sortie
Xl (t), . . ., x n (t) du dernier circuit donneront la trajectoire opti-
male correspondante. Autrement dit, le schéma de la fige 72 réalise
le mouvement du système (2) de coordonnées de phase Xl, . . ., xrl sur
la trajectoire extrémale correspondante quelles que soient les valeurs
initiales 'Po et Xo. Si le schéma de la fig. 72 est adopté pour principe
d'un appareil (un simulateur, par exemple), il ne restera plus pour
l'utiliser qu'à déterminer la valeur initiale 'Po pour laquelle (la
valeur initiale Xo étant donnée) la trajectoire obtenue aboutit à l'ori-
gine des coordonnées.
Les raisonnements précédents se généralisent sans difficulté au
cas où le domaine de commande U est un cube r-dimensionnel, i.e.
S 22.]
SIMULATION
159
il est défini par les inégali tés
1 u i 1 1, i == 1, . . ., r.
Dans ce cas la fonction (7) s'écrit
(74)
r n
2.; L 1Pa(t)bBut3. (75)
(3=1 a= 1
Puisque, en vertu de (74), le domaine de variation de chaque para-
mètre de commande u 1 , . . ., ur ne dépend pas des valeurs prises
ro
r
f , Xf
rf2 2 U 2 x 2
-A *1' Ax + Bu
.
n r . ur
.
,zn
1 I
-
cfz t. 2
- -
. .
. .
. t,.r
n
-
FI G. 73
FIG. 74
par les autres paramètres de commande, pour que la fonction (75)
prenne sa valeur maximale, il est nécessaire que c h a c u n des
termes
n
'Pa (t) b u(3
a=l .
( == 1, . . ., r) qui la composent prenne sa valeur maximale. D'où
n
u(3 == sign ( 1}Ja (t) b B ).
a=1 '
Si nous introduisons les grandeurs auxiliaires
n
= bBtPa, == 1, ..., r,
a=1
(76)
la solution de l'équation (6) sera définie par les formules:
u B == sign B, == 1, . . ., . r.
Le passage des grandeurs 'Pi' · · ., 'Pn aux grandeurs £1, · · ., r
s'effectue au moyen du sommateur représenté conventionnellement
sur la fige 73. Il est clair de ce qui précède que dans le schén1a de la
fige 74 on obtiendra à la sortie des éléments par tout ou rien la
c 0 ID man d e e x t r é mal e u l (t), . . ., ur (t) et à la sortie
du dernier circuit la trajectoire extrémale correspondante x (t).
160
PROBLÈMES LINÉAIRES EN TEMPS OPTIMAL
[Ch. 3
Soulignons que dans ce schéma le nombre des éléments par tout ou
rien est égal au nombre des paramètres de commande.
Examinons enfin le cas général où le polyèdre U est arbitraire.
Soient
1, 2' · · ., v
(77)
des vecteurs non colinéaires, deux à deux, orientés dans le sens des
arêtes du polyèdre U (i.e. chacun des vecteurs (77) est parallèle
à au moins une arête du polyèdre U et chaque arête possède dans
m- l" ..I I I 1J!
(It t.: :.
: "I I I '12
....
.
. . .
. . !. : .
. 1J r.
n rI j- 1
FIG. 75 FIG. 76
le système (77) un vecteur qui lui est parallèle). Désignons par
w}, j, . . ., j les coordonnées du vecteur j. Posons
n r
j === ('\p, Bw j) === L: 1Pabawf?, j == 1, ..., y. (78)
a=lp=l p J
Les variables 1' . . ., £1' sont donc des formes linéaires (en général,
linéairement dépendantes) en 11'1' . . ., 1Pn. Le passage des variables
1Pi aux variables j est représenté sur la fige 75. Les variables j
sont déterminées par lPi sur lesquelles toutefois elles n'exercent pas
d'action en retour (ce qui est représenté sur la fige 75 par le séns des
flèches) .
Appliquons chaque grandeur j à son élément par tout ou rien,
et désignons par 111, . . ., l1v (fig. 76) les sorties de ces éléments:
11 j == si gn j, j == 1, . . ., y. (79)
Soient maintenant e1, . . ., e q les sommets du polyèdre U.
Considérons un sommet quelconque ei et soit j l'un des nombrei
1, 2, . . ., y. Si un vecteur admettant pour origine le sommet eS
est porté par une arête du polyèdre U partant de ce sommet, nouS
posons 8ij == +1 si ce vecteur est ég!ll à j et 8ij == -1 s'il est égal
à -j. Le symbole 8ij n'est pas déterminé si aucun des deux cas
ne se présen te.
Figeons un indice i (i == 1, 2, . . ., q) et examinons seulement
les indices j pour lesquels le symbole 8ij est déterminé. Les vecteurs
8ijj sont alors orientés dans le sens des arêtes de U partant du
sommet ei. Soit d'autre part 11' == ('tPi' 11'2' · . ., lPn) un vecteur
ar.bitraire non nul. Désignons par B*1P le vecteur de l'espace Er
{, 22.]
SIMULATION
161
n
dont la i-ème coordonnée est égale à b11'a' i = 1, . . ., r. Alors,
a=1
pour tout vecteur u de l'espace Er est vérifiée la relation
(B*11', u) = ('\}', Bu). . (80)
rrraçons dans l'espace Er l'hyperplan A passant par le point ei et
orthogonal au vecteur B*'\}J, que nous supposerons issu du sommet ei.
Pour que la grandeur ('\}J, Bu), prise comme fonction du point u E U,
atteigne son supremum seulement en un sommet ei il est nécessaire
(t suffisant (en vertu de (80) que le polyèdre U soit entièrement
eontenu dans le demi-espace défini par l'hyperplan A qui ne contient
pas le vecteur B*'\}J ; or pour ,cela il est nécessaire et suffisant que tout
vecteur issu du point ei et orienté dans le sens d'une arête du polyèdre
U forme un angle obtus avec le vecteùr B*11'. Autrement dit, pour
que l'équation
('l', Bu) = P (11')
(81)
adnlette une solution unique u = ei, il est nécessaire et suffisant
que tous les prod ui ts scalaires
(B*11', 8ijWj)
(correspondant aux indices j pour lesquels le symbole 8ij est défini)
soient négatifs ou, ce qui est équivalent, que soient vérifiées les
inégali tes
Bij ('lP, BWj) < O.
En vertu de (78), la dernière inégalité prend la forme
Bi/Ç,j < o. (82)
Donc pour que l'équation (81) admette une solution unique
a = eh il est nécessaire et suffisant que pour tous les j (pour lesquels
est défini le symbole Bij) soit vérifiée l'inégalité (82), ou, ce qui
revient au même, l'égalité
Bij1]j = -1
(83)
(voir (79).
Posons maintenant
i = li -1 + Bi/'lj, i = 1, 2, ..., q,
j
(84)
OÙ li désigne le nombre d'arêtes du polyèdre U partant du sommet ei,
la sommation s'opérant par rapport à toutes les valeurs de j pour
lesquels le symbole Bij est défini (de sorte que cette somme renferme
li termes). Le passage des grandeurs 'Y}j aux grandeurs i est repré-
senté sur la fige 77. La grandeur i prend la valeur -1 si tous les j
vérifient l'égalité (83), et une valeur p 0 s i t ive si pour l'un
au moins des indices j est vérifiée l' égali té Bij"1j = + 1. [L' égali té
11-01339
162
PROBLÈMES LINÉAIRES EN TEMPS OP'rIMAL
[Ch. 3:
Ei/Y)j === 0, OU, ce qui est équivalent, (11', BWj) === 0 (voir (78)) ne
peut être vérifiée en vertu du théorème 9 que pour un nombre fin i
de valeurs de t que nous négligerons.] Donc l'équation (81) adn1et
une solution unique u === ei si, et seulement si, Si < O. En appli-
quant les grandeurs 1' . · ., Sq aux éléments par tout ou rien et
en désignant les grandeurs de sortie par Xi' . . ., Xq (fig. 78), nous
constatons que l'équation (81) admet une solution unique u === ei
si, et seulement si, est vérifiée l'égalité Xi === -1. De ce qui précède
il est clair qu'à tout instant t (à l'exception d'un nOlnbre fini d'ins-
tants où l'une au moins des grandeurs j est nulle) l'une des gran-
deurs Xi prend la valeur -1, et les autres la valeur +1.
c
tt_lsl X t _
2 III 2.
. . .
'q IS' X r
X f
A. 2
u l
-
1], f
7j2 '2_
...
. .
. .
. .
1Jr C q
u 2
FIG. 77
FIG. 78
.. .
q.1 ;:
FIG. 79
Soient main tenant et, . . ., eI les coordonnées du somn1et e i
du polyèdre U. Posons
q
uP= (1-Xa.)e, p=1, ...,1'
cx=1
(85)
(fig. 79). De (85) il est clair que le point (u l , . . ., ur) est confondu
avec le sommet ei si Xi === -1 et les grandeurs restantes Xa sont
égales à +1. Autrement dit, si l'équation (81) admet une solution
unique, cette solution n'est autre que le point (u l , . . ., ur) obtenu
au moyen des formules (85).
Groupons maintenant les systèlnes représentés sur les fige 67,
68, 75-79. Nous obtenons ainsi le schéma de la fige 80. De ce qui
précède il est clair que quel que soit le vecteur initial 11'0' les fonctions
u l (t), . . ., ur (t) obtenues en sortie de l'avant-dernier circuit
forment la c 0 m man d e e x t l' é fi ale (puisqu'elles satisfont
à l'équation (6); à la sortie du circuit nous obtenons les grandeurs
Xl (t), . . ., x n (t) qui décrivent la trajectoire extrémale correspon-
dante.
Le schéma de la fige 80 réalise donc le mouvement du système (2)
sur la trajectoire extrémale (quelles que soient les valeurs initiales
11'0' x o ).
Il reste comme nous l'avons indiqué plus haut à trouver une
valeur initiale de 11' pour laquelle (la valeur initiale Xo étant donnée)
la trajectoire obtenue passe par l'origine des coordonnées. Cette
23.]
ÉQUATIONS À COEFFICIENTS VARIABLES
163
recherche peut être effectuée par l'une des deux méthodes suivantes:
soit l'on fixe une valeur initiale X o et à l'aide de quelques tests on
cherche la valeur initiale requise "'0' soit, après avoir inversé le
telnps, on trace un réseau suffisamment dense de trajectoires à
partir de l'origine des coordonnées (toutes ces trajectoires seront
optimales) et, en « retenant » ensuite tous les points de commutation
de l'espace de phase X, on construit la « surface de commutation >)
(i.e. on réalise la synthèse des commandes optimales).
10 Xo
cfl C, 'JI " x, u l Xl
2 c'z 1Jz C z Xz u 2 x 2
-A*f Ax + Bu
. . . . . .
. . . . . .
. . . . .
r . .
cfn . 7jJ' C q . ur
. . X q .zn
FI G. 80
Soulignons qu'il est possible de faire écouler le temps plus vite-
dans un simulateur que dans le système réel (par le choix des para-
:mètres dans le premier et le dernier circuits du schéma). Ceci permet
de tester avec le simulateur quelques trajectoires extrémales pendant
un court intervalle de temps et d'obtenir la commande optimal(}
cherchée pour le système de départ.
9 23. E(luations linéaires à coefficients variables
Les principaux résultats établis dans les paragraphes précédents
pour les équations linéaires homogènes à coefficients constants
(voir (1)) se transfèrent aux équations linéaires non homogènes à
coefficients variables. Dans ce paragraphe nous formulerons les-
théorèmes ainsi obtenus et _ indiquerons les modifications qu'il
eonviendra d'apporter dans les précédentes démonstrations.
Précisons tout d'abord la position du problème.
Nous allons étudier un objet dont le mouvement est décrit par le;
système linéaire d'équations différentielles:
n r
di = a(t)xv+ b(t)uP+fi (t), i=1,..., n. (86)
v=1 #)=1
]e domaine de commande U est comme précédemment un polyèdre
r-dimensionnel convexe et fermé de l'espace Er engendré par les
variables Ul, . . ., ur. Nous nous limiterons toujours au problème
11*
164
PROBLÈMES LINÉAIRES EN TEMPS OprrIMAL
[Ch. 3
€n temps optimal. Les fonctions a} (t), b (t) et fi(t) qui figurent
dans le système (86) seront supposées définies sur un certain inter-
valle a < t < b (pouvant être confondu avec la droite numérique)
et admettant sur cet intervalle un nombre suffisant de dérivées
continues. Nous supposerons, plus exactement, que les fonctions
a} (t) admettent n - 2 dérivées continues (mais pas moins d'une),
les fonctions bl (t) - n - 1 dérivées continues et les fonctions
fi (t) - une dérivée continue. (La remarque de la fin du présent
paragraphe montre que ces contraintes peuvent être moins strictes.)
Toutes les valeurs de la variable t seront supposées appartenant
à l'intervalle a < t < b ; en particulier, toute commande admissible
sera supposée donnée sur un intervalle con t e n u dans l'inter-
valle a < t < b.
Le système (86) p'ellt s'écrire sous la forme vectorielle suivante:
dx
CU=A(t)x+B(t)u+f(t); (87)
où A (t): X -+- X et B (t): Er-+- X sont des opérateurs linéaires
associés dans" les coordonnées Xl, . . ., x n et U l , . . ., Ur respective-
ment aux matrices (a}(t)) et (bl (t)), et f(t) un vecteur de composan-
tes fi (t).
Introduisons les opérateurs Bi (t), B 2 (t), . . ., Bn (t) en posant
Bdt) = B (t), B j (t) = - A (t) Bj-dt) + dBjitdt) , (88)
j = 2, ..., n.
Pour la détermination de ces opérateurs il est nécessaire que les
fonctions b (t) admettent n - 1 dérivées et les fonctions a} (t)
n - 2 dérivées.) Nous dirons qu'à l'instant t est remplie la condi-
lion de position commune si pour toute arête w du polyèdre U les
vecteurs
Bi (t) w, B 2 (t) w, . . ., Bn (t) w
(89)
sont linéairement indépendants dans l'espace X. Dans ce paragraphe
nous supposerons partout, qu'à tout instant t, a < t < b, est remplie
.la condition de position commune.
Observons que si les matrices (a}(t)) et (bl (t)) sont constantes,
i.e. si a) et b ne sont pas fonctions du temps, alors de (88) il résulte
que Bj = (_1)j-lA:1-1B et donc les vecteurs (89) coïncident, au
signe près, avec les vecteurs (3). La condition de position commune
formulée dans ce cas se confond donc avec celle introduite dans le
17.
23.]
ÉQUATIONS À CORFFICIENTS VARIABLES
165
La fonction H ('\p, X, t, u) (voir page 60 et théorème 5) est ici
de la forme:
H = (" A (t) x) -t- ('\p, B (t) u) + ('lJ, f (t)) == 'a(t)xV +
f.l,V
+ '\pb (t) u P + L: '\pff.l (t), (90)
f.l , P I-L
et le système auxiliaire (voir formule (69) du chapitre 1) s'écrit
sous la forme:
d'i'.i == _ '" a y ( t ) 1101 . 1 2
dt L.J J 't'v, ] == , ,..., n,
v
ou sous la forme vectorielle (cf. 5):
=-A*(t)1p. (91)
Il est évident que la fonction H, qui est considérée comme une
fonction de la variable u E U, atteint son maximum en même ten1ps
que la fonction (1\', B (t) u). Désignons par P (1\', t) le maximuln de
la fonction (1\', B (t) u) que nous considérons comme une fonction
de la variable u E U. Du théorème (5) il résulte (voir la formule (70)
du chapitre 1) que si u (t), t o t tf, est une commande optimale
transférant le point représentatif de Xo en Xi' alors l'équation (91)
admet une solution 1\' (t) non triviale telle que
('\jJ (t), B (t) u (t)) = P (1\' (t), t) (92)
quel que soit t pris dans l'intervalle t o t t 1 .
Nous dirons qu'une fonction donnée sur l'intervalle a < t < b
ou sur une partie de cet intervalle est constante par morceaux si
l'ensemble de tous les points de discontinuité de cette fonction ne
possède pas de points limites à l'intérieur de l'intervalle a < t < b
et si la fonction considérée est constante sur chacun des intervalles
déterminés par les points de discontinuité sur l'intervalle a < t < b.
(Observons que les points de discontinuité peuvent s'accumuler
à proximité des extrémités de l'intervalle a < t < b.)
r h é 0 r è m e 15. A toute solution non triviale", (t) de l'équation
(91) la relation (92) associe d'une façon univoque *) une fonction de
commande u (t); la fonction u (t) est constante par morceaux et n'admet
pour valeurs que les sommets du polyèdre U.
Ce théorème est celui de la « finitude du nombre de commuta-
tions» pour les équations linéaires à coefficients variables (car
toute commande u (t) est définie sur un certain i n ter y a Il e
t o t t 1 contenu tout entier dans l'intervalle a < t < b, et il
résulte du théorème 15 que le nombre de points de discontinuité
de la fonction u (t) est fini). Si les coefficients sont constants, le
théorème 15 est remplacé par le théorème 9.
*) Voir note de la page 107.
166
PROBLÈMES LINÉAIRES EN rrEl\iPS OP1.'IMAL
[Ch. :3
D é ID 0 n s t rat ion. Elle est analogue à celle du théorème
9. Indiquons seulenlent les modifications insignifiantes qu'il con-
vient d'apporter à la démonstration du théorème 9.
Supposons que l'ensemble des points où la commande u (t) n'est
pas univoquement définie par la relation (92) admette au moins
un point lilnite à l'i n t é rie u r de l'intervalle a < t < b.
Alors (voir formule (8) et le texte s'y rapportant) nous pouvons
trouver une arête w du polyèdre U et un ensenlble M, admettant
à l'intérieur de l'intervalle a<t<b un point linlite T, tels que
(11' (t), B (t) w) == 0
(93)
quel que soit t E M.
La formule (9) peut être remplacée par l'expression
((t), B (t) lU) == 1pv (t) b (t) u;p. (94)
'V, P
Les fonctions a} (t) admettant n - 2 dérivées continues, les fonctions
'P1 (t), . . ., 'Pn (t) qui sont solution de l'équation (91) en admettent
n - 1 ; par ailleurs, les fonctions b (t) admettent également n - 1
dérivées continues par hypothèse. Donc, la fonction (94) est n - 1
fois continûment dérivable.
Puisque T est un point limite de l'ensemble il!, nloyennant la
continuité de la fonction (94), il résulte de la relation (93) que
(11' (T), B ('t) w) == O.
Par ailleurs, étant donné que l'intervalle compris entre deux racines
d'une fonction dérivable renferme au moins une racine de sa dérivée,
il s'ensuit que la dérivée de la fonction (94) s'annule en une infinité
de points admettant 't pour point limite. Or, cette dérivée est de la
fornle :
d
dl ('p (t), B (t) w) == ( - A * (t) 11' (t), B (t) w) -1-
+ ( 1\1 (t), dit) w) = (1\1 (t), - A (t) B (t) w) +
--1- ( ) (t), dY) w) = (1p (t), B 2 (t) w)
(voir (88)). Sur l'ensemble infini de points admettant 't pour point
limi te on a donc
(11' (t), B 2 (t) w) == 0,
et, en vertu de la continuité,
(11' ('t), B 2 ('t) w) == O.
D'une façon analogue, l'intervalle compris entre deux racines quel-
conques de la fonction (, (t), B 2 (t) w) renferme au moins une racine
, 23.]
ÉQUATIONS À COEFFICIENTS VARIABLES
167
de sa dérivée; en reprenant les mêmes raisonnements on a
(1\J (-r). B3 (-r) lV) == 0 et ainsi de suite. Finalement, nous obtenons
les re lations
(1lJ ('t), Bi ('t) w) == 0, i == 1, 2, . . ., n
(95)
(cf. (10), (11)). 1\Ioyennant l'indépendance linéaire des vecteurs (89),
il s'ensuit de la relation (95) que 1lJ ('t) === 0 et donc la solution 11' (t)
de l'équation (91) est triviale. Cette contradiction montre que l'en-
semble des points en lesquels la commande u (t) n'est pas définie
d'une façon univoque par la relation (92), ne possède pas de points
limites à l'intérieur de l'intervalle a < t < b.
La suite de la démonstration ne diffère pas de celle du théorème 9.
1.18 théorème 15 est donc démontré.
\ovons nlaintenant les thé 0 r è mes d'e x i s t e n cee t
d'u nie i t é pour le système (86). Comme précédelllment (voir (20)),
considérons le système fondamental de solutions
CPt (t), · · ., CPn (t)
de l'équation homogène = A (t) x satisfaisant aux conditions
initiales cp) (t o ) == ôj, et le système fondamental de solutions
'\ 1 (t), . . ., '" n (t)
de l'équation (91) satisfaisant aux conditions initiales 1lJ{ (t o ) = ô{,
la relation (21) restant valable. Par ailleurs, la solution de l'équa-
tion (87) associée à une commande u (t), t o t t i , arbitrairement
choisie peut être cherchée sous la forme
n
x(t)=== 2' CPv(.t)c"(t)
'V=1
(voir page 113). En définitive, nous obtenons la forlnule suivante
(voir (22)) :
11 t
x (t) = 2: cp" (t) ( x + J ('p" (t), [B (t) u (t) + t (t)) dt) . (96)
\'= 1 to
Dorénavant, les théorèmes 11 et 12 se transposent textuellement
au cas étudié. Restent également valables les démonstrations de
ces théorèmes où les relations (22) sont remplacées par les relations
(96) HyeC toutes les modifications évidentes qui en découlent. Reste
enfin valable le théorème d'existence (voir théorème 13).
1" h é 0 r è nl e 16. Si, pour un processus gouverné par l'équa-
tion (87), il existe pour un t o donné au moins une commande u (t),
t o t t 1 , transférant le point représentatif de Xo en Xi' il existe alor
168
PROBL:ÈMES LINÉAIRES EN TEMPS OPTIMAL
[Ch. 3
une commande optimale (avec le même instant initial t o ) transférant
le point représentatif de Xo en Xi.
D é mon s t rat ion. Elle reprend textuellement celle du
théorème 13 (la référence à la formule (22) étant remplacée par celle
à la formule (96)). Soulignons néanmoins que la translation dans
le temps mentionnée à la page 117, ne peut plus être introduite ici
car l'équation (87) n'est pas autonome; de toute façon, cette transla-
tion dans le temps est inutile maintenant puisque ne sont considérées
que des commandes avec un instant initial to.
Rem a r que. Dans le présent paragraphe nous avons adnlis
que les fonctions a) (t), b1 (t) et fi (t) figurant dans le systèn18 (86)
étaient définies sur un certain intervalle a < t < b (peut-être lnêlne
sur la droite numérique toute entière) et admettaient respectiYelnent
(n - 2), (n - 1) et les premières dérivées continues. (De plus. nous
avons admis comme toujours qu'était satisfaite la condition de posi-
tion commune.) Il est aisé de comprendre alors que tous les résultats
obtenus restent valables si les fonctions aj (t), b1 (t) et fi (t) sont
continues et leurs dérivées (respectivement n - 2, n - 1 et les
premières) ne sont que con t i nue spa r ID 0 r c eau x. En
effet, repérons sur l'intervalle a < t < b tous les points en lesquels
l'une au moins des dérivées Inentionnées subit une disconti-
nuité. Ces points divisent l'intervalle a < t < b en parties sur
lesquelles les fonctions a} (t), bl (t), fi (t) admettent le nombre requis
de dérivées continues. Le théorème 15 s'appliquant à chacune de
ces parties prises séparément, il s'applique donc à l'intervalle
a < t < b tout entier. La formule (96) restant valable (ce qui est
évident), les théorèmes d'existence et d'unicité le restent égalolnent.
CHAPITRE 4
Problèmes divers
24. Cas d'une fonctionnelle définie par une intégrale impropre
Considérons le problème optimal suivant qui se ramène à l'étude
d'un intervalle infini d'intégration de la fonctionnelle J.
Etant donné un point Xo de l'espace de phase X, parmi les comman-
des admissibles u (t), t o t < + 00, pour lesquelles la trajectoire
x (t) correspondante du système
dx i f i ( ln ) 1 E U
dt === x,. · ., x , u, i == , ..., n, U
(1)
issue du point Xo est définie pour tous les t> t o et satisfait, lorsque
t -+ 00, aux conditions aux limites (données à l'avance), trouver celle
qui minimise et fasse converger l'intégrale
00
if = ) fO (x (t), u (t)) dt.
to
(2)
Les fonctions fi (x, u) sont assujetties à des conditions analogues
à celles indiquées dans les chapitres 1 et 2, i. e. elles sont supposées
continues en x et en u et continûment dérivables par rapport à
Xl, . . ., x n sur le produit direct X X U. Précisons n1aintenant ce
que nous entendrons par commandes « admissibles ». Nous dirons
qu'une fonction u (t), t o t < 00, à valeurs dans le domaine de
comrnande U est b 0 r née, si l'ensemble de tous les points u (t)
où t parcourt un intervalle fermé et fin i quelconque contenu dans
l'intervalle t o t < 00, admet une adhérence compacte dans l'espace
Er (qui contient le domaine de commande U). En adoptant cette
définition d'une comlnande bornée (et en n'étudiant que les con1man-
des définies sur des intervalles de la forme t o t < 00), nous con-
serverons la défini tion de la classe de commandes admissibles donnée
dans le S 10. En particulier, pour classes de commandes admissibles
on peut prendre la classe de toutes les commandes mesurables bor-
nées (au sens indiqué) définies sur des intervalles de la forn1e t o
t < 00, ou encore la classe de toutes les commandes bornées
continues par morceaux (une con1mande u (t) est continue par mor-
ceaux si elle admet un nombre fini de discontinuités de première
espèce sur tout intervalle fermé et fin i contenu dans l'intervalle
170
PROBLÈMES DIVERS
[Ch. 4
t o t < 00.) Une dernière remarque, enfin, au sujet des «condi-
tions limites à l'infini » mentionnées dans l'énoncé du problèlne.
Nous supposerons que ces conditions sont de la forine
lin1 xi (t) == x, (3)
t-oo
OÙ Xi === (x, x ., x 7 i) est un point donné de l'espace de phase X.
Si la trajectoire de phase x (t) associée à la con1mande admissible
u (t) et partant du point Xo vérifie les conditions (3), nous écrirons
.x (00) == Xi et nous dirons que la commande u (t), t o t < 00,
transfère le point représentatif de Xo en Xi.
La solution du problème optimal posé est fournie par le théorème 1
(ou le théorème 8) où l'on prendra évidemment soin de remplacer
l'intervalle t o tti par l'intervalle infini t o t < 00 et la
'condition de passage de la trajectoire par un point de la droite II
par les conditions limites à l'infini. En effet, tous les raisonnements
des 13 et 14 étaient tributaires du choix d'un point régulier T
tel que T < t i ; ces raisonnelnents se transposent intégralement au
-cas où t i == 00. Il en est de même pour la formulation et la démonstra-
tion des lemmes 5-8 du S 15. Toutefois, il n'est plus possible de cons-
truire le cône lilnite puisque le point t i (i.e. l' extrén1ité droite de
l'intervalle de temps) n'existe plus. On peut néann10ins modifier
légèrelnent la construction du cône limite de manière à pouvoir
l'appliquer dans le cas étudié. Désignons en effet par I() le cône
con vexe A :C,lto (I( 1;) . Ces cônes forment une sui te croiss an te :
1(') c K) pour T' < T (pour le prouver il suffit d'appliquer
à l'inclusion du lemme 8 la transformation A:c,\o et d'utiliser les
formules (17) du chapitre 2). C'est pourquoi l'union (par rapport
à tous les points réguliers T) de tous les cônes l(") est de nouveau
un cône convexe (il se peut, non fermé) de l'espace X t. Appelons-le
-cône ini ti al et désignons-le par l( to. Il est aisé de voir qu'on a 1 a
relation (pour le problème optimal des SS 2, 11)
A tj, to (l( 10) == Il: fi-
Le cône initial est donc absolument équivalent au cône lin1ite et l'on
peut achever la délnonstration du principe du maximun1 (S 15,
après le lemme 8) avec le côn e i nit i a 1 [{to, le len1n1e 9 et
'Sa démonstration restant en vigueur (on prendra certes soin de rem-
placer le rayon Ltt, les cônes Ktu l(i), et les transformations Att 1 ,'t
respectivement par Lto, [(t, K) et A't,to). Ensuite, on applique
sans peine les raisonnements du S 15, ce qui achève la démonstration
du théorème 8 (et du théorème 1) dans laquelle on a remplacé le
'cône limite par le cône i nit i a 1. Or, cette dénlonstration se
transpose intégralen1ent (sauf qu'il faut rOTIlplacer l'intervalle
25.]
PROCESSUS OPTIMAUX À PARAMÈTRES
171
t 0 t t i par l'intervalle t o t < 00) au problème optimal consi-
déré ('1) et (2). Notre assertion est donc démontrée.
Renlarquons que l'on aurait pu «transporter » les cônes 1(1:
non seulement au point x (t i ) ou au point x (t o ), lnais en un point
quelconque x (t) de la trajectoire considérée. La démonstration
exposée est de ce fait valable au cas également où l'intervalle d'inté-
gration est fornlé par toute la droite -00 < t < 00.
25. Processus optimaux à paramètres
Nous allons étudier dans ce paragraphe le problènle optimal
suivant. Etant donnés les fonctions /0, /1, . . ., /n des trois variables
x E X. u E U, w E W où X et U gardent leur sens précédent et W
est un espace vectoriel de dinlension m. Les fonctions 1 0 , /1, . . ., ln
et leurs dérivées partielles par rapport aux variables Xl, X 2 , . . ., x n
sont supposées définies et continues sur l'espace X X U X W tout
entier. Le mouvement d'un objet est gouverné par les équations
dx i .
dl == / (x, u, w), i = 1, 2, ..., n . ( 4 )
Deux points Xo et Xi sont donnés dans l'espace X. On demande de
choisir un point con s tan t W o E W (i.e. choisir avant le début
du lllouvement une valeur du paramètre w qui reste constante pen-
dant toute la durée de ce mouvement) et une conlmande admissible
u (t) tels que la trajectoire associée x (t) qui part à l'instant t o du
point Xo passe à l'instant t i par le point Xi et que l'intégrale
fi
J = J /0 (x (t), u (t), wo) dt
to
soit nlinimale. Si les fonctions u (t), x (t) et le point W o sont solution
du problème posé, nous dirons que les grandeurs u (t), x (t) et Wo
sont optimales (pour les points Xo et Xi donnés).
Nons supposerons que toutes les fonctions admissibles sont
e 0 n t i fi U e spa r ID 0 r c eau x, i.e. la classe D de commandes
adtnissibles soit est confondue avec l'ensemble de toutes les fonctions
continues par morceaux (à valeurs dans U), soit en est un sous-ensem-
ble vérifiant les conditions du 10.
Le problème que nous avons à étudier est un peu spécifique en
ce sens que nous nous limitons seulement aux commandes continues
par morceaux (et non pas à des commandes mesurables arbitraires).
Jn effet, alors que dans le problèlne optimal formulé au 11 toute
portion de trajectoire optimale était de nouveau une trajectoire
optirnale (car en « améliorant » une portion de trajectoire c'est
tout.e la trajectoire qu'on « améliore », cf. g 2), ici, dans le pro-
blèrne à paranlètres, la situation est tout autre. En effet, les valeurs
172
PROBLÈMES DIVERS
[Ch. 4:
optimales du paramètre w peuvent fort bien ne pas se confondre sur
la trajectoire toute entière et sur une portion de cette trajectoire,
i.e. si u (t) et Wo sont solution du problème optimal posé dans ce-
paragraphe, la commande u (t) étant en outre définie sur l'intervalle"
t o t t i , il se peut qu'il soit possible d' « améliorer » cette corn--
mande sur un intervalle moindre ID 0 yen n a n t une var i a --
t ion d u par a m è t r e Wo. De ce qui précède il résulte que
les raisonnements de la démonstration du lemme 4 sont i Il a p -.
pli cab 1 e s au problème optimal considéré. La démonstration
du théorème 8 (ou du théorème 1) peut cependant être appliquée
ici, à condition de considérer dans le lemme 9 que le point T coïncide
avec le point fin alti (ce qui rend superflu le lemme 4). Or, pour
ce faire, il faudra considérer que le point t 1 est un point r é g 11 1 i e r
de la commande u (t), i.e. en guise de commandes adnlissibles
il nous faudra prendre des commandes qui soient régulières à l'ex-
trémité droite de l'intervalle. Sous ces conditions la classe de com-
mandes admissibles qui s'impose le plus naturellement est la classe-
de commandes continues par morceaux (ou l'une quelconque de S€E,
sous-classes) .
On obtient la solution du problènle optimal posé en appliquant
le théorème suivant, analogue au théorème 1 (la fonction est définie-
n
comme précédemment QJl == 1Paf a ).
a=O
Thé 0 r è ID e 17. Etant données une commande adlnissi ble
u (t), t o t t 1 , et une valeur ZVo ,== (w 1 , . . ., w m ) du paramètre lO
telles que la trajectoire associée
x (t) == (X O (t), Xl (t), . . ., x n (t)) == (XO (t), x (t))
(i.e. la trajectoire du système (4) complémenté par l'équation correspon..
dant à i == 0) vérifie les conditions x (t o ) == Xo, XO (t o ) == 0, x (t 1 ) === Xi-
Pour que lès grandeurs u (t), x (t) et Wo soient solution du ]Jroblèlne
optimal posé, il est nécessaire qu'existe un vecteur fonction 'l' (t) ==:
== ('$0 (t), '$1 (t), . . ., 1\'71, (t)) continu et non nul tel que:
1 ° l(Js fonctions x (t), 'i' (t), u (t) et la valeur Wo vérifient le système
hamiltonien
dx i _ âQfO ('1' (t), x (t), u (t), wc) }
dt- â'Pi ' .
d'Pi _ aoc ('\1' (t), x (t), u (t), wo) l === 0, 1, ..., n ;
dt - âx i '
2° la fonction QJ£ ('i' (t), x (t), u, wo) de la variable u E U atteigne
au point u == u (t) son maximum
QI[ ('i' (t), x (t), u (t), w 0 ) === (}J!! ('i' (t), x (t), lV 0) *);
*) Voir page 20.
25.]
PROCESSUS OPTIMAUX À PARAMÈTRES
173
3° au point initial t o soient vérifiées les relations
'l' 0 (t 0 ) 0, Qlt ('1' (t 0), x (t 0), w 0 ) === 0;
4° aient lieu les égalités
n ti
J 'I\1a (t) a/a (x (:(t), wo) dt = 0, p = 1, ..., m. (5)
a=O to
Si par ailleurs les grandeurs"P (t), x (t), lVo et u (t) satisfont aux condi-
lions 1 ° et 2°, alors les fonctions "Po (t) et oit ("P (t), x (t), wo) de la
.variable t sont constantes, de sorte qu'on peut vérifier la condition 3°
pas forcément à l'instant t o , mais à un instant quelconque t, t o
t t 1 .
Ce théorème diffère du théorème 1 (ou du théorème 8) par la
condition 4° qui donne m relations complémentaires et permet de
résoudre le problème puisque ont été introduites m inconnues supplé-
mentaires lV I , w 2 , .. . ., w m (les coordonnées du point Wo dans l'espa-
,ce W) .
Indiquons maintenant les modifications qu'il convient d'apporter
à la démonstration du théorème 8 pour obtenir celle du théorème 17.
lvlodifions légèrement les constructions du 12.
Plus exactement, soit u (t) une commande admissible quelconque
,définie pour t o t, t 1 ; w une valeur arbitraire du paramètre et
x (t) === (XO (t), Xl (t), . . ., x n (t)) === (XO (t), x (t)) la solution du sys-
tème (4) correspondant à la commande u (t) et au paramètre w et
vérifiant la condition initiale x (t o ) === Xo. Désignons par y (t) la
.solution correspondant à la même commande u (t) et à la valeur
.IV + ëÔW du paramtre et partant (au même instant t o ) du point
llo === Xo + ëSo + 0 (ë)' où So E X est un vecteur constant (i.e. ne dépen-
.dant pas de ë) proche du point Xo. La solution y (t) est de la forme:
y (t) == x (t) + ëÔX (t) + 0 (ë),
.où ôx (t) == (ÔXO (t), ôx I (t), . . ., ôx n (t)) est un vecteur ne dé pen-
.dant pas de ë, déterminé à partir du système suivant d'équations
.aux variations:
n m
Ô i == ôfi (x (t), u (t), w) ex + ôfi (x (t), u (t), w) (3
d t x L..J ex uX LJ (3 u w ,
8x 8w
ex=O (3=1
i == 0, 1, . . ., n,
.avec la condition initiale ôx (t o ) == So. Contrairement au système (16)
du 12, ce système d' équ ations aux variations n' est pas h 0 m 0-
:g è ne.
Affectons maintenanL la transformation At to de l'indice supé-
lrieur ôw. Plus exactement, nous supposerons qe
A?to (So) == ÔX (t),
(6)
174
PROBLÈMES DIYERS
[Ch. 4
où ÔX (t) est une solution du systèn1e (6) satisfaisant à la condition
initiale ôx (t o ) === So. Comme dans le 12, nous supposerons que le
vecteur est contenu dans l'espace X t (dont l'origine de coordollnées
est le point x (t»). Comme le système d'équations aux variations est
désormais non homogène, la transformation linéaire A,o (o) est
également non homogène.
Enfin le lemme 1 qui clôture le 12 prend la forn1e suivante:
si '\1' (t) est une solution du système (8) du 11 et So un vecteur arbi-
traire défini au point x (t o ), alors sur l'intervalle t o t t 1 tout
entier on a:
('\1' (t), A1to (So)) == ('\1' (t o ), ;0) +
t n 1n
+ ) 'l\Ji (t) afi (x (t; (t), w) ôwt3 dt. (7)
10 i=O (3=1
Référons-nous ensuite an 9 13. Tous les points de continuité
de la commande u (t), Le. tous les points de l'intervalle t o t t 17
à l'exception d'un nombre fini de points de discontinuité, sont
des points réguliers pour cette commande. Prolongeons la cOlnmande
u (t) à droite de l'intervalle t o t t 1 en posant u (t) === U (t 1 - 0)
pour t > t 1 . La commande u (t) ainsi prolongée est continue all
point t 17 donc ce point est régulier. Ensuite, nous supposerons que
le point 'L qui figure dans la définition de la commande perturbée
(page 80) est confondu avec le point tf, Le. nous poserons
t o < 'L1 'L2 <. . . ::( 'Ls ::( 'L === t 1 "
Faisons, enfin, choix d'un vecteur ôw E W et désignons par
x* (t) (pour 8 suffisamment petit) la solution du système
dx i .
([t == 1 1 (x, u* (t), Wo + 8ÔW), i == 0, 1, ... n,
i.e. la trajectoire associée à la commande perturbée u* (t) et à la valeur-
W == Wo + 8ÔW du paramètre w. Nous supposerons enfin que la
ligne S (8) dégénère en xo, i.e. la solution x* (t) satisfait à la même
condi tion initiale
x* (t o ) === Xo,
que la solution x (t). Les formules (21) et (22) du chapitre 2 peuvent
maintenan t s'écrire
x* (t 1 + 8Ôt) === x (t 1 ) + 8dx + 0 (8),
où
d x == j" (x (t 1), u (t 1 ), ZOo) ôt + A to (0) +
+ A '(. [f (x ('Li), Vi, wo) - t" (x ('Li), II ('Li), iDo)] Ôti (8)
i=1 l
(car 60 == 0).
25.]
PROCESSUS OPTIMAUX À PARAMÈTRES
175
Voyons maintenant le 14. Introduisons le vecteur ôw dans le
synlbole a, i.e. supposons
a == {'tb Vi, ôt i , ôt, ôw}
(nous avons omis de désigner le point 't puisque le point 't == t 1
est à présent un point fixe). La combinaison linéaire des symboles a
se définit COlnme précédemment, sauf qu'il faut tenir compte du
dernier argument:
Â' {. . ., Ô lV'} + Â" {. . ., <S lV "} + . . . ==
== {. . ., Â' ô w' + Î\/' Ô w" + .. .} .
Ceci posé, les dénl0nstrations des lemmes 2 et 3 (pour 't == t 1 )
passent sans modification, tandis que le lemme 4 est tout simplen1ent
inutile (puisque 't == t 1 ). Nous obtenons ainsi le cône d' atteignabilité
((t1 pour lequel est valable le lemme 3.
Les raisonnements du 15 restent également en vigueur (on
prendra soin do rem placer 't par t 1 ), quant au cône limite il est inu-
tile puisque nous n'avons plus qu'un seul cône K tf construit précisé-
ment à l'extrémité x (t 1 ) de la trajectoire x (t) (par suite le lemme g,
n'est plus nécessaire car il se ramène tout simplement au lemme 3)..
Enfin, les raisonnements de la fin du 15 prouvent (pour ôw == 0)
les conditions 1 0, 2°, 3° et la fin du théorème 17.
Il nous reste à prouver qne le vecteur"i' (t) ainsi choisi vérifie la
condition 4°. Posons dans la formule (8) <St == ôt 1 == ôt 2 == . . ..
== ôt s == O. Il vient alors
x == A to (0).
De ce qui précède (voir formules (34), (36) du chap. 2) il résulte
('i' (t 1 ), x) O pour tout vecteur x de la forme (8) et donc (voir (7)
t1 n m
(1jJ (ti), A to (0)) = J 1Pi (t) dfi (x (t) u (t), wo)) ôw f3 dtO. (7*)
to i=O {3=1 w
Ces relations étant vraies quelles que soient les valeurs réelles des
paramètres ôw 13 , il vient
n t1
r '1h (t) a/a (x (t), u (t), wo) dt R 1 2
LJ J a awf) , p ==, . . ., m,
a=O to
et le théorème (17) est entièrement démontré.
Soulignons en conclusion que si le paramètre w peut varier non
pas sur l'espace W tout entier, mais seulement sur un domaine fermé
W 1 c W dont le bord est différentiable par morceaux, alors les
conditions (5) du théorème 17 sont remplacées par les relations
n l1
'" r 'Ih ( t ) a/a (x (t), u (t), wo) dtO
J a aw ,
a=O to
176
PROBLÈMES DIVERS
[Ch. 4.
où la dérivée figurant sous le signe somme est prise dans une direc-
tion quelconque du vecteur w d'origine Wo et contenu dans W t -
Autrement dit, toute courbe dérivable w (8) issue du point Wo pour
8 == 0 et contenue dans le domaine W 1 vérifie la relation
n t{
) 1Pa (t) a/a (x (t).ô (t), w (8» L=o dtO.
a=O ta
Cette assertion découle imlnédiatement de la relation (7*).
9 26. Application de la théorie des processus optimaux
à l'approximation des fonctions
Soit F (x, y) une fonction définie. et continue pour toutes les
valeurs réelles de ses arguments. Alors, quelles que soient les fonc-
tions x (t) et y (t) définies sur l'intervalle a t b, la grandeur
b
J = ) F (x (t), y (t)) dt (9)
a
peut servir de critère de comparaison des fonctions x (t) et y (t).
Si, par exemple, F (x, y) == (x - y)2 l'intégrale (9) prend la forme:
b
J=) (x(t)-y(t))2dt (9*)
a
let n'est autre que le carré de la distance de deux éléments x (t)
et y (t) de l'espace L 2 . (Ici et dans la suite de ce paragraphe toutes
les fonctions de la variable t seront définies sur un seul et même
intervalle a t b.)
Le présent paragraphe aura pour objet la résolution du problème
suivant. Etant donnés les fonctions F (x, y) et y (t), un nombre
entier n 0 et un nombre réel ex O. Parmi les fonctions x (t) n fois
.continûment dérivables, définies sur l'intervalle a t b, telles que
.les fonctions x(n) (t) soient lipchitziennes (dans le rapport ex), trouver
.celle qui minimise l'intégrale (9). C'est ce problème que nous appel-
lerons dans la suite pro b 1 è m e f 0 n dam e n t a 1.
Dans le cas particulier où F (x, y) == (x - y)2 (Le. la fonction-
nelle (9) est remplacée par (9*)) et ex est nul, le problème consiste
alors à chercher un polynôme x (t) de degré n défini sur l'intervalle
a t b et dont est minimale l'erreur quadratique par rapport
à une fonction donnée y (t), Ï.e. nous sommes raJnenés au problème
classique de la détermination des coefficients de Fourier lorsque la
fonction y (t) est développée en polynômes de Legendre. Le problème
fondamental généralise donc le problème classique.
Tout el' abord nous allons montrer que moyennant quelques
conditions naturelles imposées à la fonction F (x, y), le problème
S 26.]
APPLICATION À L'APPROXIMATION DES FONCTIONS
177
fondamental admet toujours (Le. quelle que soit la fonction y (t))
une solution et une seule si l'on considère la fonctionnelle (9*)
(quelle que soit y (t)).
On cherchera ensuite la fonction x (t), qui est solution du pro-
blèlne fondamental, en appliquant le principe du maximum. A titre
d'exemple sera résolu le «problème du profil d'une route ».
L'e x i s t e n cede la solution du problème fondamental (et
l'unicité de cette solution dans le cas particulier (9*)) fait l'objet
du théorème suivant.
Thé 0 r è m e 18. Supposons que la fonction F (x, y) est définie
et continue pour toutes les valeurs réelles des arguments x et y et que
lorsque y varie sur un intervalle fini quelconque, elle tend vers + 00
uniformément (en y) pour x + 00. Sous ces hypothèses, le problème
fondamental possède au moins une solution pour toute fonction con-
tinue y (t). Si, en particulier F (x, y) == (x - y)2, le problème fonda-
mental admet une solution et une seule pour toute fonction y (t).
Désignons par Q) l'ensemble de toutes les fonctions x (t) défi-
nies sur l'intervalle a t b, n fois continûment dérivables et
telles que la n-ième dérivée x<n) (t) satisfasse à la condition de
Lipchitz dans le rapport a. L'inclusion x E Q signifie alors que
la fonction x (t) est définie sur l'intervalle [a, b], possède sur cet
intervalle n dérivées continues et vérifie l'inégalité
1 x<n> (t f ) - x<n> (t") 1 a 1 t f - t" 1
quels que soient les points t f et tilde l'inte valle [a, bl. L'ensemble
Q) est de toute évidence contenu dan=, l'espace de Banach C[a,b]
de toutes les fonctions continues définies sur l'intervalle [a, b].
Lem m e f 0 n dam e n t a 1. L' ensemble Q) est un sous-
ensemble fermé, convexe, localement compact de l'espace C[a,b].
Tout ensemble borné, fermé, contenu dans Q) est compact.
Ce lemme est connu *). En effet, désignons par R l'ensemble
de toutes les fonctions x E Qn) vérifiant la condition "x lie R, et
par ) l'ensemble de toutes les fonctions de la forme xCi) (t) où x E R.
En vertu du théorème cité précédemment, les ensembles
R, H->' · · ., W) sont «compacts dans l'espace C[a,b]», i.e. les
adhérences de ces ensembles sont compactes. Si x est un point limite
arbitraire de l'ensemble R' il existe alors une suite Xi, X2, . . .
d'éléments de l'ensemble R convergeant en x. En passant, au besoin,
à une soussuite, nous pouvons considérer (en vertu de la compacité
de l'adhérence de l'ensemble ») que la sui te Xi), Xi) , . . . est
*) Voir théorème 3.5.1, page 127, de l'ouvrage de A. T i man n «La
théorie d'approximation des fonctions de la variable réelle » (en russe) Moscou,
Physmathguiz, 1960. '
12-01339
178
PROBLÈMES DIVERS
[Ch .
convergente (i == 1, 2, . . ., n). D'où il résulte, en vertu du théorème
sur l'intégration d'une suite uniformément convergente, que la
fonction x (t) admet des dérivées continues d'ordre i === 1, 2, . . ., n et
que x(i) est la limite de la suite xi), Xi), . . . En particulier, x(n) (t)
étant la limite de la suite xi n >, xn>, . . ., vérifie la condition de
Lipchitz dans le rapport a, et donc x E Qn). L'ensemble R est
donc fermé et par conséquent compact. La convexité de l'ensemble:
Qn) est évidente. Ce qui prouve le lemme fondamental.
D é mon s t rat ion dut h é 0 r è m e 18. Désignons par l
l'intervalle des valeurs de la fonction y (t) lorsque t E [a, bL La
fonction F (x, y) est bornée inférieurement quels que soient y E l
et x puisqu'elle tend uniformément en y vers +00 lorsque x + 00.
Il existe donc un nombre N non négatif tel que
F (x, y) - N quels que soient y E 1 et x. (10)
Choisissons dans [a, b] des points quelconques ao, ab . . ., an
distincts deux à deux et désignons par CPi (t) un polynôme de degré n.
égal à l'unité au point ai et nul en aj. Désignons ensuite par p un
nombre positif arbitrairement petit tel que le polynôme CPi (t) prenne
sur un intervalle Ii de longueur p et de centre ai (i == 0, 1, . . ., n)
des valeurs supérieures à 2/3 et les autres polynômes CPi (t), des valeurs
inférieures en module à 1/3n. Désignons, enfin, par A un nombre
positif tel que 1 CPi (t) 1 A pour t E [a, b], i == 0, 1, . . ., n.
Soit à présent x (t) une fonction quelconque appartenant à l'en-
semble Q) et Il x Il == max 1 x (t) 1 sa norme sur l'espace C[a,b]o
atb
Désignons par cP (t) le polynôme de degré n satisfaisant aux condi-
tions x(i) (a) == cp(i) (a), i == 0,1, . . ., n. Alors, la fonction Xi (t) ===
== x (t) - cP (t) satisfait aux conditions xii) (a) == 0, i === 0, 1, . . .
. . ., n. Nous avons par ailleurs
xi n > (t) == xn> (t) - xn) (a) ==
= [x(n> (t) - x<n> (a)] - [(pen> (t) - cp<n> (a)] = x<n> (t) - x<n> (a)
(car cp<n> (t) est une constante). La fonction x<n> (t) vérifiant, sur
l'intervalle [a, b], la condition de Lipchitz dans le rapport a, quel
que soit t E [a, b], on a:
1 xn) (t) 1 == 1 x<n) (t) - x<n> (a) Ia (t- a) a (b - a).
Développant la fonction Xi (t) en séries de Taylor, on a:
t-a , ( ) (t-a)2" ( ) +
Xi(t)==Xt(a)+ 1! Xi a + 21 Xi a...
+ (t-a)n-l <n-l) ( ) + (t-a)n x 1 <n> (8),
· · · ( _ 1) ' Xi a ,
n. n.
26.]
APPLICATION À L'APPROXIMATION DES FONCTIONS
179
où e est compris entre a et t. Puisque Xi (a) == x (a) == . . .
. . . == Xl(n-l) (a) == 0, on a, quel que soit t E [a, b],
l x ( l )I == 1 (t-a)n x(n) ( e )l (t-a)n a ( b-a ) a (b-a)n+l . ( 11 )
1 n! 1 n! n!
(b - a)n+l
D'où, Il Xi Il a , et, donc
n.
Il (p Il = II X- xiII >- /1 x II-II Xi/l >- /1 x 11- a (b-,;r+1 (12)
Faisons choix maintenant d'un indice i == 0, 1, . . ., n tel que
le nombro 1 <P (ai) 1 soit le plus grand des nombres 1 <P (ao) 1,
1 <P (al) 1, . . ., 1 cp (an) 1. En interpolant d'après la formule de
Lagrange, nous obtenons:
<P (t ) == <P (a 0 ) cp 0 (t ) + <P (a i) cp i ( t) + · · . + cp (an) cp n ( t) ,
el ' 0 ù 1 (P (t) 1 (n + 1) 1 <P (a i) 1 A pou r t E [a, b], i . e.
Il <P Il (n + 1) 1 <P (ai) 1 A. (13)
En composant les inégalités (12) et (13), nous avons:
Il cp I! 1 [ 1 Il (b-a)n+l J
1<p(ai)l> (n+1)A > (n+1)A _' x -a nI .
Sur l'intervalle Ii sont vérifiées les inégalités
2 1
(P i (t) > 3; (-P j (t) < 3n ' j =i= i,
donc sur cet intervalle nous avons
1 cp (t) 1 == 1 cp (ao) <Po (t) + <P (ai) <Pi (t) + · . . + c:p (an) <pn (t) 1 >
>- 1 cp (ai) <Pi (t) 1-1 (P (ao) (Po (t) + · . · + <P (ai-l) <Pi-1 (t) +
+ <P (ai+i) <Pi+1 (t) + · · · + (P (an) <Pn (t) 1> 1 <P (ai) 1 { 1 <Pi (t) 1-
- [ 1 (Po (t) 1 + · · · + 1 <Pi-1 (t) 1 + 1 (Pi+1 (t) 1 + · . · + 1 (Pn (t) 1 ]} >
> (n+\) A [II x II-a (b- n a(+1 J ( - n. 3 ) =
= 3(n1)A [II xII-a (b- n a t+1 J.
D'où il résulte que sur l' in terv alle Ii
1 X (t) 1 == 1 <P (t) + Xi (t) , >- 1 <P (t) )-1 Xi (t) 1 >-
1 [II 11 - (b-a)n+l ] _ (b-a)n+l
> 3(n+1)A . x a n! a n! (14)
(voir (11)). Donc, quelle que soit la fonction x E Q), il existe un
indice i == 0, 1, . . ., n tel que sur l'intervalle Ii soient vérifiées.
les inégalités (14).
12*
180
PROBLÈMES DIVERS
[Ch. 4
Soit à présent Jo la valeur prise par la fonctionnelle (9) lorsque
x (t) == O. Soit par ailleurs P un nombre positif tel que pour 1 xl>
> P, y E 1 l'on ait
F ( ) Jo+N (b-a)
x, y >
p
(ce nombre P existe en vertu des propriétés de la fonction F (x, y)
indiquées dans la formulation du théorème). Soit, enfin, R un
nombre positif tel que pour Il x Il > R le deuxième membre de la
relation (14) soit plus grand que P. Alors, quelle que soit la fonction
x E Qn) satisfaisant à la condition Il x Il > R, il existe un indice
i == 0, 1, . . ., n tel que sur l'intervalle Ii soit vérifiée l'inégalité
(14) et, par conséquent, soit satisfaite l'inégalité 1 x (t) 1 > P.
D'où il résulte que
F (x (t), y (t)) > J o+N (b-a) , tE Ii. (15)
p
Par ailleurs, en vertu de (10)
F (x (t), y (t)) - N pour t E [a, b]. (16)
L'intervalle Ii étant de longueur p, il vient des inégalités (15) et
(16)
b
5 JO+1V (b-a)
F(x(t),y(t))dt> p p+(-N)[(b-a)-p]>J o .
a
(17)
Donc, l'inégalité (17) est vérifiée quelle que soit la fonction x E Qn)
.satisfaisant à la condition Il x Il > R.
Désignons par R l'ensemble de toutes les fonctions x E Q)
vérifiant la condition /1 x Il R et soit J* le minorant de la fonc-
tionnelle (9) pour les fonctions x E R. Il est évident que J 0 J*
b
et par conséquent ) F (x (t), y (t» dt J* quelle que soit la fonc-
a
tion x E Qn): pour Il x Il > R cela découle de l'inégalité (17) et
pour Il x Il R de la définition du minorant. Pour achever la
démonstration de la première partie du théorème il ne nous reste
plus qu'à établir qu'il existe une fonction x E Ql) telle que la fonc-
tionnelle (9) prenne la valeur J*. Ceci découle aisément de la compa-
.cité de l'ensemble R (voir le lemme fondamental) et de la conti-
nuité de l'intégrale (9) considérée comme une fonction de x E Q).
La première partie du théorème (i.e. l'existence d'une solution)
est donc démontrée. Puisqu'en particulier la fonction F (x, y) ==
== (x - y)2 satisfait aux conditions énoncées dans le théorème (18),
le problème posé admet toujours une solution pour la fonctionnelle
(9*). Montrons que dans ce cas cette solution est unique. La fonction-
26.]
APPLICATION À L'APPROXIMATION DES FONCTIONS
181
nelle (9*) étant égale à d 2 où d = d (x, y) représente la distance
entre les fonctions x et y au sens de la métrique de l'espace L 2 , et
puisque les grandeurs d et d 2 atteignent leur minimum simultané-
ment, le problème se ramène à la recherche d'un élément x E Q)
tel que d (x, y) = min, i.e. du point x E Q) 1 e plu s pro che
de y. L'espace C[a,b] est de toute évidence contenu dans L 2 et en
outre les droites de l'espace C[a,b] sont également droites dans L 2 .
Donc, l'ensemble Q) qui est convexe (voir le lemme fondamental)
dans C[a,b] est un sous-ensemble convexe de l'espace L 2 . Or, dans
l'espace £2 (en raison de la stricte convexité de la boule unitaire)
un ensemble convexe ne peut contenir plus d'un point proche de y.
C'est pourquoi le problème fondamental n'admet qu'une seule solu-
tion.
Le théorème (18) est démontré.
Voyons maintenant comlnent che r che r la solution à
l'aide du principe du maximum. Soit x (t) une fonction arbitraire
de la classe Q). La fonction x(n) (t) existe alors sur l'intervalle
[a, b] et satisfait à la condition de Lipchitz dans le rapport ex et,
par conséquent est une fonction absolument continue. Il existe donc
presque partout une fonction mesurable u = x(n+l) (t) telle que
1 u (t) J ex en tous les points où la fonction u (t) est définie. En
désignant les fonctions x (t), x' (t), . . ., x(n) (t) respectivement par
1 2 n+l
X , X , . . ., x , nous avons
dx 1 )
dt == x 2 , 1
dx 2
-x 3
dt - ,
(18)
dx n _ 11,+1
dt - x , j
dxn+l
dt = u (t),
où 1 u (t) 1 ex. Ces relations sont vérifiées presque partout sur
l'intervalle [a, b] (les n premières relations sont même partout véri-
fiées). Il est aisé de voir qu'inversement, si les fonctions Xl, x 2 , . . .
. . ., xn+l vérifient presque partout sur l'intervalle [a, b] les rela-
tions (18), où u (t) est une fonction mesurable satisfaisant à la condi-
tion 1 u (t) 1 ex, alors la fonction x (t) = Xl (t) appartient à la
classe Qn). En effet, puisque la fonction xi+l (i = 1, 2, . . ., n)
est absolument continue et, par conséquent, continue, il résulte
de la relation d;; = Xi +1 , qui est vérifiée presque partout sur l'inter-
valle [a, b], que la fonction absolument continue xi est une intégrale
de la fonction con t i nue xi+l. La fonction xi admet donc
par t 0 u t sur l'intervalle [a, b] une dérivée continue égale à
182
PROBLÈMES DIVERS
[Ch. .
Xi+l (i == 1, 2, . . ., n). La fonction Xl (t) admet donc partout sur
l'intervalle [a, b] une n-ème dérivée absolument continue, égalB
à xi+l (t) et cette dérivée, en vertu des relations dXd+1 = u (t),
1 u (t) 1 <ex qui ont lieu presque partout, satisfait à la condition
.de Lipchitz dans le rapport ex, i.e. Xl E Qn).
Nous pouvons donc remplacer les fonctions de la classe Ql)
par les solutions (absolument continues) du système (18) à condition
.que 1 u (t) 1 ex. Le problème fondamental est donc équivalent
.au problème 0 p t i mal suivant: dans la classe des commandes
mesurables u (t) satisfaisant à la contrainte 1 u (t) 1 ex trouver celle
pour laquelle la solution du système (18) minimise l'intégrale
b
J = J F(xt, y(t))dt;
a
les valeurs extrémales xi (a) et xi (b), i == 1, 2, . . ., n + 1 sont
arbitraires. ,
L'intégrande étant une fonction dépendant explicitement de t
(en raison de la fonction don Il é e y (t)), introduisons la variable
auxiliaire xn+2 == t qui est une solution évidente de l'équation
différen tielle
dxn+2
== 1,
dt
avec la condition initiale xn+2 (a) == a. Le problème optimal posé
se formule alors comme suit.
Soient dans l'espace X engendré par les variables Xl, x 2 , . . .
. . ., Xn+l, Xn+2 une variété initiale S 0 d'équation xn+2 == a et une
variété finale S1 d'équation xn+2 == b (ces deux variétés étant cha-
cune de dimension n + 1). Dans la classe des commandes mesurables
u (t) vérifiant la contrainte 1 u (t) 1 ex trouver celle pour laquelle
la solution du système
dx 1 _ 2 '\
-x , 1
dx 2
- == x 3 ,
dt
dx n _ n+l
dt -X ,
(19)
dxn+l
dt
== u,
dxn+2
dt == 1 , J
26.J
APPLICATION A. L'APPROXIMATION DES FONCTIONS
183
issue à l'instant t o == a d'un point de la variété 8 0 et aboutissant (en
vertu de la dernière équation (19) à l'instant t 1 == b) sur la variété 8 1
minimise l'intégrale
tf
\ F (.1:1, Y (x n + 2 )) dl.
t
C'est ce problème (qui est équivalent à notre problème fonda-
mental) que nous allons résoudre, en lui appliquant les théorèmes
8 et 3. Les fonctions F (x, y) et y (t) seront supposées continûment
déri vables. La fonction QJt est ici de la forme:
QJe == 'l'oF (Xl, Y (x n + 2 )) + 1P1X2 + '\P2 X3 + . . .
. . · + 'lfnXn+1 + lPn+1U + lPn+2. (20)
Formons avec la fonction QJC un système d'équations différentielles
pour les variables auxiliaires lPi:
d'Po == 0 '\
dt ' 1
d'Pt == _ 8Qfe == _1101 8F (Xi, y (xn+2))
dt 8xl 'fO 8xl '
d'lp2 8Qfe
Cft == - 8x2 == -11'1' } (21)
d'P 3 8Qfe
([t== - 8x3 -== -11'2'
d'lf'n+l 8Qfe
- - ,\101
dt - - 8xn+1 - - rn
J
(l'ex pression a''P;t 2 n ' étant d ' aucune u tili té, nous ne l'écrirons pas).
Soit x (t) la solution du problème fondamental. En vertu de ce
qui précède, les fonctions
Xl (t) == x (t), x 2 (t) == x' (t), . . ., Xn+l (t) === X(n) (t), Xn+2 == t
sont solution du problème optimal énoncé plus haut (voir (19)).
Le système (21) (auquel on a ajouté une équation pour lPn+2) admet
donc une solution non nulle 11'0' 11'1, ..., lPn+1, lPn+2 satisfaisant aux
conditions des théorèmes 8 et 3. La condition de maximum de la
fonction QJ[ donne (presque partout sur l'intervalle [a, b]):
max '\IJ n +1 t(u) == lPn+1 (t) u (t),
-aua
i.e.
u (t) { == a sign lPn+1 (t), si
non définie, si
lPn+t (t) =1= 0,
lPn+1 (t) ==- O.
(22)
184
PROBLÈMES DIVERS
[Ch. 4
Ecrivons maintenant les conditions de transversalité (théorèn1e 3).
Les vecteurs orientés dans le sens des axes Xl, x 2 , . . ., xn+l étant
parallèles aux hyperplans S 0 et Si' les conditions de transversalité
s' écri vent:
'\p i ( a) == 0,
lPi (b) == 0,
i == 1, 2,
i == 1, 2,
. . .,
n + 1,
n + 1.
(23)
(24)
. . .,
De la première des équations (21) il résulte que 11'0 == const, et de
plus, 11'0 0 en vertu du théorème 8. Il est aisé de constater que
l'hypothèse 11'0 == 0 aboutit à une contradiction. En effet, si 11'0 == 0,
alors d1: = 0 (voir (21)) et, en vertu de (23), 1P1 = O. D'où il vient
que d1: = 0 (voir (21)) et, en vertu de (23), 1P2 = 0 et ainsi de suite.
Nous obtenons en définitive 11'0 == 11'1 == 11'2 == · · · == lPn+1 == o.
Comme la fonction QI{! est identiquement nulle sur une trajectoire
optimale (théorème 8), il s'ensuit en vertu de (20) que lPn+2 == o.
Or, ceci est en'contradiction avec le fait que la solution 11'0' 1P1, . . .
. . ., lPn+2 est une solution non n u Il e. Donc 11'0 < 0, et nous
pouvons considérer que 11'0 == -1 (puisque toutes les grandeurs lPt
sont définies à un facteur de proportionnalité positif et constant
près). Le système (21) prend à présent la forme (après la substitu-
tion xn+2 == t) :
d'Pi _ aF ,xl, y (t))
dt - a xl ,
d'lf'2
dt== -11'1'
d'lf'3
-cit == -11'2'
d1Pn+1 == _ '1h
dt 't'n,
d'où il vient, compte tenu de la condition de transversalité (23):
t
'Ih ( t ) == r aF (xl (t), y (t)) dt
't'1 J ax l '
a
t t
1P2 (t) = - J (J aF (Xla' y (t)) dt) dt,
a a
t t t
1P3 (t) = J [1 (J aF (Xla;' y (t)) dt) dtJ dt,
a a a
26.]
APPLICATION À L'APPROXIMATION DES FONCTIONS
185
et en général
t t
'l\Jk (t) = ( - WH J ... J aF (xl a' y (t» dt . . . dt (k quadratures),
a a
k = 1, 2, . . ., n + 1.
Du cours d'analyse on sait que
t t t
J ... J j(t)dt... dt= (k1)! J (t-S)k-Ij(£)d£,
a a a
'-y--'
k
donc 'Pk (t) peut s'écrire sous la forme:
t
'l\Jdt)= (k1)1 J (£_t)k-I aF(xl; Y(£» d£, (25)
a
k = 1, 2, . . ., n + 1.
Les conditions de transversalité (24) prennent maintenant la forn1e :
b
'P k ( b)= 1 r (_b)h-1 8F(xl(), Y()) d=O
(k-1)! J 8x 1 '
a
k = 1, 2, . . ., n + 1.
En multipliant cette expression par (k -1)! Ck-i et en sommant.
en k = 1, 2, . . ., n + 1, nous obtenons:
b
J [co + ct(£-b) + C2 (£ - b)2 + . .. + C n (£- b)n] aF (xl ; y (£» d£ = 0
a
quelles que soient les valeurs des constantes Co, Ci' . . ., C n . Le
polynôme Co + Ci ( - b) + . . . + C n ( - b)n étant un polynôme-
que 1 con que de degré non supérieur à n, nous pouvons grouper
les conditions de transversalité (24) sous une seule condition:
b
J p () aF (xl y <£» d£ = 0
a
pour tout polynôme P () de degré non supérieur à n.
186
PROBLÈMES DIVERS
[Ch. 4
Par ailleurs, en vertu de (25), la formule (22) peut encore s'écrire
( · ( r ( t t) n ôF (xl (), y ()) d t ) .
1 === ex slgn J - ôx l SI
U (t) a
1 l'expression figurant sous le symbole sign
est non nulle;
l non définie, si cette expression est nulle.
Autrement dit, presque partout sur l'intervalle [a, b] est vérifiée
l'une des relations
t
J (£ - tt 8F (xl ; Il (£)) d£ = 0,
a
t
u (t) = ex sign ( J (£ - tt 8F (xl ; Il (£)) d£ ) .
o
Enfin, des relations (19) il vient
d n + l
u (t) === dt n + l Xl (t)
(presque partout sur l'intervalle [a, b]). En conclusion donc si l'on
désigne de nouveau Xl (t) par X (t) on obtient la proposition suivante.
Thé 0 r è m e 19. Supposons que les fonctions F (x, y) et y (t)
possèdent des dérivées premières continues. Pour que la fonction x (t)
.soit solution du problème fondamental, il est nécessaire que presque
partout sur l'intervalle [a, b] soit vérifiée l'une des relations
t
J (£ _t)n 8F (x ( Il (£)) d£= 0,
a
t
x ntl (t) = ex sign ( J (£ - tt 8F (x ( Il (£)) d£)
a
Bt que de plus pour tout polynôme P (t) de degré non supérieur à n,
.soit vérifiée la condition
b
r P (t) ô F (x (t), y (t)) dt == O.
J âx
a
E X e m pIe (problème du profil d'une route). En considérant
la fonctionnelle (9*), pour n == 0, nous sommes conduits au problèn1e
:suivant. Etant donnés une fonction y (t) dérivable sur l'intervalle
[a, b] et un nombre ex ? 0, trouver une fonction x (t) vérifiant la con-
.dition de Lipchitz dans le rapport ex et minimisant l'intégrale (9*).
-s 20.]
APPLICATION À L'APPROXIMATION DES FONCTIONS
187
Ce problème peut être interprété de la manière suivante. On se pro-
pose de relier deux localités A et B par une route, le relief du terrain
étant donné (par la fonction y (t)), et d'après les conditions d'ex-
ploitation la pente ne doit pas être supérieure à a, i.e la coupe longi-
tudinale (ou profil) de la route est décrite par une fonction satisfaisant
à la condition de Lipchitz dans le rapport a. On pourra soit faire
épouser à la route le relief du terrain, soit exécuter des remblais,
soit, enfin, creuser une tranchée. Le profil de la route étant x (t),
supposons que l'intégrale (9*) désigne le coût des travaux de terras-
sement (exécution des remblais si x (t) > y (t) et creusement des
tranchées si x (t) < Y (t)). On demande de trouver ]e profil le plus
économique.
Ce problème admet une solution qui est unique (théorème 18).
Pour que la fonction x (t) soit la solution cherchée, il est nécessaire
(en vertu du théorème 19) que presque partout sur l'intervalle [a, b]
soit vérifiée l'une des relations
t
,"
j [x (G) - y (G)] dG == 0,
a
(26)
t
x' (t) =--' ex sign ( i [x (s) - y (s)] ds) ,
a
(27)
et de plus que soit remplie la condition
b
J [x (t) - Y (t)] dt = O.
a
(28)
Si sur un intervalle quelconque contenu à l'intérieur de [a, b]
est vérifiée la relation (26), alors x (t) == Y (t) sur cet intervalle,
i.e. la route doit suivre le relief du terrain. Si sur un in terv aIle
quelconque est vérifiée la relation (27), alors en tous les points de
cet intervalle x' (t) === + a, de sorte que la route est constituée d'un
ou de plusieurs tronçons de pente égale à a ou -a. Ainsi, la route
est constituée de tronçons épousant le relief du terrain et de tronçons
de pente lnaximale admise empruntant des remblais ou des tranchées.
Supposons, par exemple, que les localités A et B sont situées sur
un terrain plat traversé entre A et B par un ravin (que la route doit
enjanlber). Le profil du terrain suivant la ligne AB est représenté
sur la fige 81. Assimilons ce profil au graphique de la fonction y (t),
l'axe des abscisses à la droite AB et les abscisses des points A et B
respectivement à a et b. Nous supposerons que les parois du ravin
sont abruptes (de pente supérieur à a). Désignons, comme plus haut,
par x (t) la fonction dont le graphique représente le profil de la route.
Il est aisé de voir que x (t) 0 quel que soit t. En effet, si x (t ' ) > 0
188
PROBLÈMES DIVERS
[Ch. 4
alors, par suite de la continuité de la fonction x (t), on aura x (t) > 0
dans un certain voisinage du point t ' . Aussi, en déplaçant au besoin
t'
le point t f nous pouvons faire en sorte que x (t f ) > 0, J (x (t) -
a
A
B
FIG. 81
t'
- y (t)) dt =1= O. Si J (x (t) - Y (t)) dt > 0, alors, en vertu de (27),
a
x' (t) = +ex pour t t ' (fig. 82) et donc
b t' b
J (x(t) - y(t))dt= J (x(t)-y(t)) dt+ J (x(t)-y(t))dt>O,
a a t'
a
b
t
I/(t)
FIG. 82
t'
ce qui contredit la relation (28). Si au contraire J (x (t) - Y (t)) dt <
a
< 0, alors, en vertu de (27), x' (t) = -ex pour t t ' (fig. 83), or
cela signifie que x (t) > Y (t) pour a t t ' contrairenlent
t f
à l'inégalité ) (x (t) - y (t)) dt < O. Cette contradiction montre
a
que x (t) 0 quel que soit t.
Supposons maintenant qu'en un point t ' on a x (t ' ) < Y (t ' ).
i'
Si, en outre, J (x (t) - Y (t)) dt < 0, alors pour t > t f la route
a
accuse une pente de ex (i.e. x' (t) = -ex) tant qu'est satisfaite l'iné-
26.]
APPLICATION À L'APPROXIMATION DES FONCTIONS
189
t
galité J (x (t) - Y (t)) dt < O. Les graphiques des fonctions x (t)
a
et y (t) doivent nécessairement se couper pour t > t f , sinon x (t) <
< y (t) pour tous les t > t f (fig. 84), et donc
b t' b
J (x(t)-y(t))dt= J (x(t)-y(t))dt+ J (x(t)-y(t))dt<O,
a a t'
lJ
t
a
FIG. 83
tl .lJ: t
a
1 1
1 1
1 J
1 1
1 1
1
1
1
1
r
[
1
5
1
FI G. 84
contrairement à la relation (28). D'une façon analogue, si x (t f ) <
t'
< Y (t') et (x (t) - y (t)) dt > 0, alors pour t < t' la route
a
monte vers le point t f avec un angle a (i.e. Xf (t) = +a) et de plus,
les graphiques des fonctions x (t) et y (t) se coupent nécessairement
pour t < t f .
Cet exposé nous permet donc de chercher la fonction x (t) pour
les différents graphiques y (t). Des exemples sont traités sur les
fige 85 et 86. Le point t l et les valeurs x (t l ) de la fige 85 sont déter-
minés à partir des relations
ti b
J (x (t) - y (t)) dt = 0, J (x (t) - Y (t)) dt = 0,
a ti
190
PROBLÊl\iES DIVERS
[Ch. 4
tandis que les points t 1 et t 2 de la fig. 86 sont tirés des relations
tf b
J (x (t) - y (t)) dt = 0, J (x (t) - y ( t)) dt = O.
a t2
Il est bien en tend u que les exemples trai tés sont très sinl pIes.
Leur étude détaillée ne poursuivait qu'un seul objectif, celui de
a
o
t/
!J(t)
b
.:.-
FI G. 85
o
r
t l
j
!f(t )
FIG. 86
t 2
I
lJ
'J
montrer que les relations (26), (27) et (28) (et, dans le cas général,
les relations mentionnées dans le théorème (19)) étaient en général
« suffisantes » pour déterminer la fonction x (t).
27. Processus optimaux à retard *)
Le problème de commande en temps optimal se trouve conlpliqué
dans de nombreux cas par l'effet de retardement. Celui-ci peut incom-
ber à une perte de temps dans la transmission des signaux, ou ce qui
est plus fréquent, à des simplifications faites sur le déroulelnent du
processus lorsqu'on considère que le rôle des éléments intermédiaires
et amplificateurs du système commandé consiste à transmettre des
signaux avec retard.
Le mouvement de l'objet est décrit dans l'espace de phase X
engendré par les variables Xl, x 2 , . . ., x n , par le système d'équations
dx i (t) 1
dt == fi (Xl (t), . . ., x n (t), x (t - 8), . . .
. . . , X n (t --- e), u (t)), i == 1, . . . , n, 8 == co ns t > 0, ( 29)
ou, sous la fornle vectorielle,
d?) = f(x (t), x (t - S), u (t)).
(30)
*) Les résultats de ce paragraphe sont dus à G. Kharatichvili.
27.]
PROCESSUS OPTIMAUX. À RETARD
191
L'argUJ11ont retardé ne figure donc que dans les coordonnées de phase
et manque dans les comman des. Les fonctions fi (Xl, . . ., x n ,
yI, . . ., yn, u) sont supposées continues en l'ensemble de leurs
argulnents et continûment dérivables par rapport à Xl, . . ., x n ,
1 n A d . 1 f . f i a fi a fi d ' f .
Y , · . ., y. utren1ent It, es onctIons , fJ J . , sont e 1-
X' dyJ
nies et continues sur le produit direct X X X X U . Pour la classe
D de commandes admissibles nous prendrons la classe de toutes les
commandes con t i nue spa r m 0 r c eau x à valeurs dans U
(ou l'une de ses sous-classes) ; voir g 10. Comme précédemment, pour
fixer les idées, nous supposerons que les équations étudiées sont
continues à gauche dans les points de discontinuité
u (t) == u (t - 0).
Pour que la trajectoire x (t) de l'équation (30) soit définie d'une
manière univoque sur l'intervalle t o t t 1 , il est nécessaire de
donner non seulement la commande admissible u (t), t o t t 1 ,
mais aussi une fonction initiale cr (t) à valeurs dans X définie sur
l'intervalle t o - e <- t <- t o . La fonction initiale cp(t) sera supposée
continue sur l'intervalle t o - 8 t t o tout entier.
Nous dirons que la fonction x (t) définie et c 0 Il t i nue sur
l' i n ter val 1 e t o - 8 t t i t 0 u t e n t i e r est la tra-
jectoire de l'équation (30) associée à la commande admissible u (t) t
t o t th et à la fonction initiale cr (t), t o - 8 t t o , si cette
fonction x (t) est solution de l'équation (30) sur l'intervalle t o ::;;
t t 1 , et se confond avec la fonction cr (t) sur l'intervalle t o -
- 8 t t o .
For m u l 0 n s lnaintenant le problème optimal que nous nouS'
proposons de résoudre dans ce paragraphe. Ce faisant, nous énonce-
rons le problème à extrémité droite mobile (qui englobe, comme cas.
particulier, le problème à extrémité droite fixe).
S . t f . f o ( ln l n ) ' . f . 1
01 une onctIon x , . . ., x , y , . . ., y , u verl Iant es:
mêmes conditions que les fonctions fi, i == 1, . . ., n. Soient en outre.
une variété de dimension k continûment différentiable 8 1 EX,
o k n -1, et une fonction initiale cr (t). On demande de choisir
dans la classe des commandes admissibles une commande u (t),
t o t t 1 telle que la trajectoire x (t), t o - 8 t t i du systè-
me (29) associée à la commande choisie u (t) et à la fonction initiale
cr (t) satisfasse à la condition aux limites x (t 1 ) E 8 1 et minimise
l'intégrale
t1
\ jO(x(t), x(t-8), u(t))dt.
'"
to
Remarquons que les limites d'intégration ne sont pas fixes; ne sont
fixes que les conditions « aux }imites » cr (t) et 8 1 .
(31)
192
PROBLÈMES DIVERS
[Ch. i
Si 1° == 1, nous obtenons un problème en temps optimal pour les
.systèmes à retard.
Si la variété 8 1 est de dimension nulle, elle dégénère en un point
.et nous obtenons un problème optimal à extrémité droite fixe.
En vue de mieux formuler" et démontrer le résultat fondamental,
.énonçons notre problème optimal sous une autre forme équivalente.
Introduisons l'espace de phase X de dimension n + 1 engendré
par la variable x = (XO, . . ., x n ) = (XO, x) et désignons par 1
l'ensemble des points (XO, x) pour lesquels x E 8 1 (i.e. L est une variété
de dimension k + 1, produit direct de la variété S1 par l'axe XO).
Notre problème optimal est alors équivalent au problème suivant
(cf. page 16).
Le système d'équations gouvernant le mouvement du point
représentatif x (t) = (XO (t), . . ., x n (t)) est de la forme:
dx i (t) .
dt == / (x (t), x (t - e), u (t)), i === 0, 1, . _ ., n, (32)
ou, sous la forme vectorielle,
dœ (t)
dt === f (x (t), x (t - e), u (t)).
(33)
On demande de choisir une commande admissible u (t), t o t t 1
telle que la trajectoire x (t) = (XO (t), x (t)), t o t t 1 du systè-
me (32), associée à cette commande et à la fonction initiale <Ç (t) =
= (0, cr (t)), t o - 8 t t o satisfasse à la condition aux limites
x (t 1 ) E L et minilnise la coordonnée XO (t 1 ).
Toute commande admissible u (t) et la trajectoire associée x (t),
remplissant les conditions formulées, seront dites optimales.
En vue de resoudre le problème posé introduisons, comme précé-
.demment, le vecteur auxiliaire 'i' = ('1'0' . . ., 'l'n) et formons la
n
fonction scalaire QJÇ = Li 'l'a/a = ('i', Jj des variables '1'0' · · ., 'l'n,
(1,=0
1 n 1 n D ' . . JI ( ) 1 ·
.x , . . ., X , Y , . . ., y , u. eSlgnons par (}JJ{; 'i', x, y e maJorant
de QJt pour 'i', x, y fixés et pour u variant sur l'ensemble U.
Introduisons ensuite deux systèmes d'équations pour les variables
auxiliaires '1'0' '1'1' · · ., 'l'n:
dtPi (t)
dt
8Qff ('1' (t), x (t), x (t- 8), u (t))
8xi
a ('i' (t + 8), x (t + 8), x (t), u (t + 8))
agi
aWi (t)
dt
i === 0, 1, . . . , n ; ( 34 )
8Qfe ('1' (t), x (t), x (t-8), u (t»
ox i
i=O, 1, ...,n.
(35)
7.]
PROCESSUS OPTIMAUX A RETARD
193
Nous dirons que le système de fonctions 11'0 (t), lPi (t), · . ., lPn (t)
continues et dérivables par morceaux sur l'intervalle t o t t 1
correspond aux fonctions u (t), t o t 1 t, et x (t), t o - 8 t t 1 ,
s'il vérifie (34) sur l'intervalle t o t t i - 8 et (35) sur l'inter-
valle t i - 8 t t i .
Nous pouvons désormais formuler la condition Il é ces s air e
d'optimalité pour le problème posé (sous forme de principe du maxi-
mum).
Thé 0 r è m e 20. Soit u (t), t o t t i , une commande admis-
sible telle que la trajectoire correspondante x (t), t o - 8 t t i
du système (32) avec la fonction initiale <p (t), t o - 8 t t o , passe
à un instant t i > t o par un point de la variété L. Pour que la commande
u (t) et la trajectoire correspondante x (t) soient optimales, il est néces-
saire qu'existe un vecteur fonction'i' (t) == (11'0 (t), lPi (t), · · ., lPn (t»
non nul correspondant aux fonctions u (t) et x (t) et tel que:
1° pour tous les t, t o t t i , soit remplie la condition de maximum
éJ[ ('i' (t), x (t), x (t - 8), u (t» == Q/ft ('i' (t), x (t), x (t - 8»; (36)
2° à l'instant final t 1 soient satisfaites les relations
11'0 (t i ) 0, Q/lt ('i' (t i ), x (t i ), X (t i - 8» == 0 (37)
(observons qu'en vertu des équations (34) et (35) nous avons 11'0 ==
== const) ;
3° le vecteur (lPi (t i ), . . ., lPn (t i » soit orthogonal au plan tangent
au point x (t i ) === (Xl (t 1 ), . . ., x n (t i » à la variété S1.
Remarquons que l'application de ce théorème soulève des diffi-
cultés dues au fait que les fonctions inconnues Xl (t), . . ., x n (t),
'tp1 (t), . . ., 'tpn (t) interviennent dans le système (32) et (34) avec
un argument aussi bien retardé qu'avancé. Il est évident que pour
les systèmes linéaires cette difficulté n'existe pas.
Dans le cas d'un problème en temps optimal (fO == 1) au lieu de la
n
fonction cfJt on considère la fonction H == 2j lPa/ a des variables
a=l
'tpi' . . ., lPn, Xl, . . ., x n , yi, . . ., yn, u; désignons par M (11', x, y)
le majorant de cette fonction par rapport à u E U (11', x, y étant fi-
xés). En substituant la fonction H à la fonction OJ{; dans les équations
(34), (35) nous pouvons dans ce cas expliciter les fonctions lPi (t), . . .
. . ., 'tpn (t), t o t t 1 , correspondant aux fonctions u (t), t o t
t 1 , et à x (t), t o - 8 t t i . Ensuite, dans le cas de commandes
en temps op timal, on conserve la formulation du théorèn1e 20 sauf que
les fonctions QJt et ail sont remplacées par les fonctions JI et AI et la
condition 2° par la condition
Cl.,ft ('tp (t 1 ), x (t 1 ), x (t 1 - 8» > O.
1 3 -- 0 l 3 3 9
194
PROBLÈMES DIVERS
[Ch. 4-
Autrelnent dit, la condition d'optimalité découle du théorèn10 20,
tout comme le théorème 2 se déduit du théorème 1.
Lad é mon s t rat ion du théorème 20 se fait dans ses
traits généraux suivant le même schéma que celle du théorèn1e 1
(ou du théorème 8). Nous la ferons en prenant soin de noter en détail
les passages qu'il est nécessaire de modifier et en omettant los cons-
tructions qui ne diffèrent en rien de celles exposées dans le chapitre 2.
Soit x (t) la solution de l'équation (33) correspondant à la COln-
mande admissible u (t), t o t t 1 , et à la fonction initiale <p (t),
t o - 8 t t o . Appelons système d'équations aux variations pour
le système (32) le système linéaire suivant:
d (ôx i (t»
dt
n
( Ofi (x (t), x (t - 8), u (t)) ôx CL (t) +
L.J â x a
a=O
+ ofi (x (t), - 8), u (t» ÔxCL (t _ 8) ), i = 0, 1, ..., n. (38)
Nous allons considérer sur l'intervalle t o - 8 t t 1 ou sur une
partie de cet intervalle les solutions du système (38) qui correspon-.
dent à des fonctions initiales con t i nue spa r m 0 r c eau x ;
comme nous n'excluons pas l'éventualité d'une discontinuité de la
solution à l'instant initial t o , pour que le système (38) adn1ette une
solution univoque, il est nécessaire que soit donnée (outre la fonction
initiale) la valeur initiale de cette solution. Si donc 'f} (t) est une
fonction arbitraire continue par morceaux, définie sur l'intervalle
't - 8 t 't, où 't E [to, t 1 ] et S un vecteur quelconque de l'espace
X, nous appellerons solution du système (38) avec la fonction initiale
'f} (t) et la valeur initiale S une fonction ôx (t) == (ÔX O (t), . . .
. . ., ôx n (t)), 't - 8 t t 1 telle qu'elle coïncide avec 11 (t) sur
l' in terv aIle 't - 8 t 't, qu'elle soit con tin ue et vérifie le systè-
me (38) sur l'intervalle 't t t 1 et, en outre qu'elle vérifie la
relation ôx ('t) == s. Nous désignerons cette solution par le sYlnbole
At. 'L ('f), s), 't - 8 t t 1 .
Nous conviendrons (pour 't - 8 t t i ) de considérer que
At. 'L (1), s) est un vecteur 1 i é admettant pour origine le point
x (t). Ainsi, pour les éléments initiaux donnés S et 'f} (t), 't - 8
t 't, est défini le champ de vecteurs At. 't (11, S), 't - 8
t t 1 ; nous dirons que les vecteurs At. 't ('f), s) de ce champ se
déduisent l'un de l'autre par une translation le long de la trajectoire
x (t).
Indiquons les propriétés facilement démontrables de la transla-
tion dont nous aurons à nous servir dans la suite (cf. formules (17)..
chapitre 2).
1. Ato, to ('f), ) == s.
27.J
PROCESSUS OPTIMAUX À RETARD
195
II. Posons 1]1(t)==A t .'t(f), 6), 't1-8t'tb où to't't1t1;
alors
A t ,'t1(1]1, A't 1 ,'t(1], S))===A t ,'t(1], S), 171tt1.
III. At. 't (1'11]1 + 1'1"12, 1'1S1 + 1'262) ==
= 1'1 A t, 't (1]17 S1) + 1'2 A t, 't (1]2' S2)' 17- 8tt1'
où '\'1 et 1'2 sont des nombres réels arbitraires.
IV. Soit 1]1 (t) une fonction continue par morceaux définie sur
l'intervalle 't - 8 t 't (où 17 E [to, t 1 ]), M une constante et 6 un
vec teur al' bi tr aire . Supposons ensui te que les in terv aIle s 1 i sont
définis comme dans le 13 et soit 11 (t) une fonction définie sur l'in-
tervalle 17 - 8 t 17 comme suit:
{ 'f}(t)==e1)1 (t)+o(e) en tous les points de l'intervalle
17- 8t17 n'appartenant pas aux
intervalles Ii;
l 'f} (t) 1 êlI sur les intervalles Ii.
Alors,
At.'t(f), eS+o(e))==A t ,'t(e'f}1' e6)+0(8), 'ttt1.
Les propriétés 1 et II découlent directement de la définition du
symbole At. 't (1], S). La validité de la propriété III sur l'intervalle
t o t t o + 8 résulte du fait que sur cet intervalle le système (38)
est un système linéaire (non homogène) d'équations différentielles
o l'di n air e s. Sur les intervalles consécutifs de longueur 9
(jusqu'à t 1 ) la propriété III se démontre d'une façon analogue en uti-
lisant la propriété II. De la même manière s'établit la validité de la
propriété IV. .
Etudions maintenant les peI' tu r bat ion s des co ID man des
et des t l'a j e c toi l'es. Soit u (t), tot t 17 une commande
admissible et x (t) la trajectoire correspondante de l'équation (33)
avec la fonction initiale cr (t), t o - 8 t t o . Les points réguliers
de la commande u (t) seront tous les points où elle est con tin ue, i.e 0-
tous les points sauf un nombre fini d'entre eux appartenant à l'inter-
valle t o t t 1 . Nous conviendrons de prolonger toute commande
u (t), t o t < t 17 au-delà du point t 1 , en supposant u (t) = u (t f )
pour t > t 1 . Il est important de souligner que le point t 1 sera un'
point régulier de la commande u (t). Si 17 est un point arbitraire de
continuité de la commande u (t), quels que soient les nombres réels p
et q, on a:
't'+që
l [(x (t), x (t - 8), n (t)) dt =
T+pë
== e (q- p)f(x (1;), X (17- 8), U (T)) + 0 (8) (39)
(cf. formule (1), chap. 2).
13*
196
PROBLÈMES DIVERS
[Ch. 4
Soit maintenant u (t), t o t t b une commande adrnissible,
x (t) la trajectoire correspondante de l'équation (33) avec la fonction
initiale cr (t), t o - 8 t t o , et a le symbole définissant la pertur-
bation de la commande. Désignons par u* (t) la comlnande perturbée
et par x* (t) la trajectoire correspondante a v e c 1 a m ê m e fonc-
tioninitiale cr (t). (Notons que quel que soit BO, la trajectoire
x* (t) est une fonction con t i nue de t par définition des solu-
tions de l'équation (33).) Pour B suffisamment petit, la trajectoire
x* (t) est définie sur l'intervalle t o t t i tout entier (théorème
de la dépendance continue d'une solution par rapport aux paramè-
tres). Montrons que pour tout point 't de continuité de la commande
u (t) on a la formule suivante (cf. formules (21) et (22) du chap. 2) :
x* ('t + BÔt) == x ('t) + BX + 0 (B), (40)
où x est un vecteur ne dépendant pas de B, défini par la forillule :
x == 1 (x ('t), X ('t - 8), U (17)) ôt-t--
s
1
+ LI A'C, 'C. (0, f (x ('ti), X (Ti - 8), Vi)-
i=l l
- j. (x (17 i ) , X (17 i - 8), U (17 i ) )) ôt i . ( 41 )
On démontre les formules (40) et (41) de la même façon que les
formules (21) et (22) du chap. 2. Remarquons tout d'abord qlH
x ('t + BÔt) == x (17) + Bi (x ('t), x (17 -- 8), U ('t)) ôt -t- 0 (e), (42)
x* ('t + BÔt) == x* ('t) + BI (x ('t), x ('t - 8), U (17)) ôt + 0 (B)
(43)
(pour 't 8 < 17).
Ces formules s'établissent comme les formules (23) et (25) du chap. 2
(à la seule différence qu'il faudra se référer non plus à la formule t
du chapitre 2, mais à la formule (39)). Ensuite, la rnême démarche
qu'au chapitre 2 nous donne l'accroissement de la fonction x* (t)
sur l'intervalle [i:
x * 1 l i = ej. (x (17 i ) , X (17 i - 8), Vi) ôt i -t 0 (B) ( 44 )
(cf. formule (26), chapitre 2).
Vérifions par récurrence les relations (40) et (41). Ces formules
sont vraies (voir (42)) pour s == O. Supposons qu'elles sont démontrées
pour le cas où le nombre d'intervalles Ii' [2' . . . est inférieur à s
et montrons qu'elles sont vraies pour un nombre s d'intervalles Ii,
1 2 , . . ., [8. Désignons par k un entier tel que
Tk+i == 'tk+2 == . . . == 17 8 et 'ti < 't s pour i k
(le cas k == 0 n'est pas exclu). En remplaçant le point 't par le point
L's, le nombre ôt par le nOlnbre lk+i et, enfin, le nombre s par le
nombre inférieur k, il vient de (40) et (41):
x* (178 + Blk+i) = x (17 8 ) + ej.(x (Ts), X (178 - 8), U (17 8 )) l/{+l -1-
27.J
PROCESSUS OPTIMAUX À RETARD
197
k
+ 8 A -r , -r. (0, f' (x (T i ) , x (1' i - 8), Vi)-
i= 1 s l
- f (X (Li), X (17 i - 8), U (Li))) ôt i -f-- 0 (8). ( 45)
Ceci n'est autre que la valeur de la fonction x*(t) à l'extrémité gauche
de l'intervalle I k + 1 . Les intervalles I k + 1 , . . ., Is étant contigus, en
sommant (44) pour i == k + 1, . . ., s et en ajoutant l'expression
obtenue à l'expression (45), il vient:
x* (Ls + 8 (ls + ôt s )) == x (1's) + 8j'(X (Ls), X (LS- 8), U (Ls)) X
s
X (lh+1+ôt k + 1 +... -f-ôt s ) +8 AL ,L.(O, f'(x(Li), x(1'i-8), Vi))-
i= 1 s l
-f.(X(Li), X(1'i-8), U(1'i)))ôt i +o(e) (46)
(cf. la démonstration de la formule (28) au chap. 2, en prenant soin
de se référer non plus à la formule (17) du chap. 2, mais à la proprié-
té 1 de la translation, voir page 194). Si 1'k+l === 1's === 1', la relation_
(46) se confond avec (40), (41). Si, par contre, LS < L, alors
19 + ôt g == 0, Ih+1 + Ôtk+l + . . . + ôt s == 0,
et l'expression (46) prend la forme
s
x* (Ls) == X (Ls) -t-- 8 AL , L. (0, jO(x (Li), X (Li - 8), Vi)-
i=l S l
-fO ( X (Li), X (1' i - 8), u (Li))) Ô t i + 0 (8) ( l' S < 1'). ( 47)-
Désignons par 1) (t) la fonction x* (t) - x (t) étudiée sur l'intervalle
Ls - 8 t LS. Alors (puisque sur l'intervalle 1's t l' la
commande u* (t) se confond avec u (t)), la fonction x* (t) - x (t),
avec une précision de 0 (8), est sur l'intervalle LS - 8 t l' solu-
tion du système el' équations aux variations (38) avec la fonction
initiale 1] (t) et la condition initiale x* (1's)-x (1')s (rappelons que
les fonctions x (t) et x* (t) sont toutes deux continues). Autrement
dit, les vecteurs x* (t) - x (t) se déduisent l'un de l'autre avec une
précision de 0 (8) (sur l'intervalle LS - 8 t L) par la translation:
x* (t) - x (t) == At, LS (1], x* (1's) - X (Ts)) + 0 (e),
Ls-8tL. (48)
Partout, sauf sur un nombre fini d'intervalles Ii' la fonction 1] (t),
17 8 - 8 t Ls, est de la forme (en vertu de la récurrence) :
Il,
1] (t):=:; x* (t) - x (t) == 8 . At, Li (0, f(x (Li), X (1'i - 8), Vi) -
1=1
- f (x (17 i ) , x (1' i - 8), u ('t i ) )) Ôl i + 0 (ë).
198
PROBLÈMES DIVERS
[Ch. 4:
Aussi, en vertu de la propriété IV (page 195) pouvons-nous remplacer
la formule (48) par la formule:
x*(t)-x(t)==A t ,L s (1]b 1)+O(8), LstL, (49)
où
k
"If (t) == 8 At, L. (0, J' (x (L i), X (L i - 8), Vi)-
i=l l
-- j' (x (L i ) , X (rr 1 - 8), u ( rr i ) )) ôt i ,
s
S 1 == 8. AL, 't'. (0, J (x ( Li), X (Li - 8), Vi)-
i=l S l
-j' ( X (Li), X (Ti - 8), U (L d )) ôt i
(voir (47)). Compte tenu de la propriété III de la translation (voir
page 195), la formule (49) peut s'écrire:
k
x* (t) - x (t) == B LAt, L (1] l i), li») ôti +
i=1 S
s
+8 At, l' (0, Sii»)ôt i +O(8), Tstrr, (50)
i=k-I-l s
où
lli) (t) == At, 1'i (0, f(x (Ti), X (Li - 8), Vi)-
- j' (x (Ti)' X (Li - e), u ( Li) ) ), T s - 8 < t
Ts, i==1,...,k,
s i) == A t s' 1'i (0, j (x (L i ) , X ( Li - 8), Vi).-
-f'(x (Ti), X (Ti - 8), u (rri)))' i == 1, .. ., s.
Enfin, en vertu de la propriété II de la translation (page 195) il
vient:
At, 'ts (llii)Si») == At, 1'i (0, J'(x (Ti), X (Li - 8), Vi)--
- j' (x ( Li), X ( Li - 8), U (L i ) ) ) ,
i == 1, . . . , k,
et, cOlnpte tenu de la propriété l,
ii) == J' (x (Li)' X (Li - 8), Vi)-
-J'(x (Li)' X (Ti - 8), U (Ti)),
i == k + 1, . . ., s.
La formule (50) s'écrit donc sous la forme:
27.]
PROCESSUS OPTIMAUX À RETARD
199
s
X*(t)-X(t)=-=ë L At,Ti(O, t.(X(Li),(X(Li- 8 ), Vi)-
i= 1
-j. (X (Li), X (Li - 8), U (Ti))) 6ti + 0 (B), Ts t 't.
En particulier, pour t == 't,
s
X * (1') -- X (1') = B A T, Ti (0, j. (x ( l' i ) , X ( 17 i - 8), Vi)-
i=1
- j' (x (Li), X ( Li - 8), U (L i))) ôt i + 0 (B).
En ajoutant cette expression à l'expression (43), nous obtenons dans
ce cas aussi (i.e. pour LS < 't) les relations (40) et (41), ce qui achève
notre raisonnement par récurrence. Les formules (40) et (41) sont
donc entièrement prouvées.
Puisque t 1 est 'un point régulier de la commande u (t), les formu-
les (40) et (41) sont valables, en particulier, pour 17 == t i :
x* (fi + tôt) ==- x (t 1 ) + Bi1X + 0 (B), (51)
OÙ
x=J.(X(tl)' x(t 1 -8), u(t 1 ))ôt+
s
+ Att, 'te (0, j'(X (Li), X (Li - 8), Vi)-'
l=1 l
-j. ( X (Li), X (Li - 8), u (L i) )) ôt i . ( 52)
Désignons maintenant par I( l'ensemble de tous les vecteurs (52)
adnlettant pOlIr origine le point x (t 1 ). Comme au chapitre 2 (pages
8G à 90) on établit textuellement que fi. est un côn e con v e x e
'contenu dans l'espace X et que le lemme 3 est valable (pour 17 == t 1 ).
Est également valable le lemme 4 pour 't == t i , ce qui résulte directe-
nlen t el u lemme 3. Si donc la trajectoire x (t) est optimale, alors le
rayon Lt! n'est pas contenu à l'intérieur du cône l{. C'est pourquoi,
par le son1met x (t i ) du cône I( on peut faire passer un hyperplan r
tel que le cône I( soit situé dans l'un des deux demi-espaces fermés,
définis par r, et le rayon Ltt dans l'autre. (Le cône 1( remplace ici
le cône limite de la page 97.) Ceci permet comme au chapitre 2 de
détern1iner une solution non triviale "" (t) == ('i'o (t), lPi (t), . . .
. . ., '4 J n (t)) pour le système d'équations (34) et (35) telle que
1po == const 0, (53)
("" (t i ), i1x) 0 pour i1x E [{. (54)
Prouvons que 'i' (t) est la fonction cherchée (son existence est
el' ailleurs affirmée par le théorème 20). Soit 'ti un point régulier
quelconque, i.e. lIn point de continuité de la commande u (t), t o <
< Tl < t i . Exalninons le symbole a (voir 14) avec le seul point Li
200
PROBLÈMES DIVERS
[Ch. fi
(i.e. s == 1) et les nombres ôt 1 , ôt respectivement égaux à l'unité
et à zéro. Alors, le vecteur x (voir (52)) correspondant à ce SYll1bo-
1 ". t
e a, s ecrl :
x === A tl , 'rl (0, f (x (L 1), x (L1 - 8), Vt)-
- ja (X ( L t), X ( L t - 8), U ( L t) ) ) . ( 55 )
Posons
g (t) === At, 'r 1 (0, f (x ( L 1), X ('t 1 - e), v 1) - f (x ( L 1), X ('t 1 - e), U (T 1) ) ) ,
't1-ett1.
Alors, par définition, g (t) === (gO (t), gl (t), . . ., gn (t)) est la solu-
tion du système (38) correspondant à la fonction initiale identique-
ment nulle (sur l'intervalle 't1 - e t Ll) et à la valeur initiale
g (L 1) == f (x ('t 1), X (L 1 - e), V 1) - j" (x ('t 1), X (L 1 - 8), U (L 1) ) ·
(56)
De plus, en vertu de (55) et (54), il vient:
(1P (t 1 ), g (t 1 )) o.
(57)
Nous allons ll1aintenant prouver qu'est vraie l'égalité
('l' (Li), {J (Li)) === ('l' (t 1 ), {J (t 1 )).
En effet, il vient (compte tenu de (34), (35) et (38)):
(58)
11
(,\, (t l ), U(t l » - ('\' (TI), U (TI» = ) :e ('\' (t), U (t)) dt =
'rl
tl
= ) [( d?) , g (t) ) + ('\' (t), d?). )] dt =
'rI
n 11-8
= _ ) ( aQ16' ('" (t), x (t: (t - 8), u (t» ga (t) +
a=O 'rl
+ aç;e ('" (t+O), x (t+O), x (t), u (t+O)) ga (t) ) dt-
aya
n 11
_ r a Qte ('" (t), x (t), x (t - 0), u (t)) ga (t) dt -'ï
LJ J axa
a=O 11-8
n 11 n
+ ) ('l'a (t) a/a (x (t), :;;-8), u (t» gi (t) +
(X=O 'rI j=O
27.]
PROCESSUS OPTIMAUX A RETARD
201
n
+ '\jJa (t) a/a (x (t), x (t:--a), u (t» gi (t _ e) ) dt ==-
âyJ
j=O
n tl- e
= _ \ aQ16'(,\, (t+a), X(ta), x (t), u(t+a» ga(t)dt+
" ây
cx=O 'tl
n tl
-t- r OQfe ('1' (t), x (t), x (t-8), u (t)) gCX (t _ 8) dt ==
.LJ J âya
a=O 'tl
n tl- e
= _ \ aQ16' ('\' (t +a), x (; :a), x (t), u (t + a» ga (t) dt +
y
a=O 't1
n 11- e
+:S J aQ16'(,\,(t+a), X(;a), x (t), u(t+a» ga(t)dt=O
a=O 't't- e
(dans les calculs nous avons utilisé la définition de la fonction QJt
et le fait que fJ (t) == 0 sur l'intervalle LI - 8 < t < LI). L'égalité.
(58) est donc démontrée.
De (57) et (58) il vient:
('1' (L1)' g (L1)) 0,
d'où, compte tenu de (56) et de la définition de la fonction QJ{,
,{j8 ('" ('t 1), x (L 1 ), x ( 't 1 - 8), V 1) QJt ('" ('t 1) , x ('t 1), x ('t i - 8), U (L 1) ) ·
Cette inégalité étant vérifiée pour tous les points Vi E U, l'égalité (36)
(st valable pour t ==- L. Ainsi l'égalité (36) est démontrée pour tous.
les points de continuité de la commande u (t). Comme la fonction
u (t) est continue à gauche en ses points de discontinuité et que les fonc-
tions QJt et 011 sont continues par rapport à leurs arguments, la rela-
tion (36) est vérifiée en les points de discontinuité de la commande
II (t). La relation (36) est donc entièrement prouvée.
Par ailleurs, nous avons déjà démontré la première des relations
(37) (voir (53)). En faisant ôt 1 == e . . === ôt s == 0 dans la formule
(52), il vient:
x === je (x (t 1), X (t 1 - 8), u (t 1)) Ô t,
et donc, en vertu de (54),
QJt ('1' (t 1 ), x (t 1 ), X (t 1 - 8), U (t 1 )) ôt o.
(ette inégalité etant vérifiée quel que soit ôt (positif ou négatif),.
il vient:
0Jt ('1' (t 1 ), x (t 1 ), X (t 1 - 8), u (t 1 )) === 0,
et la deuxième relation (37) est établie (voir (36)).
202
PROBLÈMES DIVERS
[Ch. q
Nous avons donc établi le théorème 20 dans le cas où l'extrémité
droi te est f i xe. La condition de transversali té (condi tion 3°
du théorème 20) pour le problème à extrémité droite mobile s'établit
comme au chapitre 2 (avec les modifications qui s'imposent).
Ceci achève la démonstration du théorème 20.
28. DIl problème de poursuite *)
,
Supposons que dans un espace de phase X de dimension n sont
en mouvement deux points commandés, l'un étant appelé « point
poursuivant », l'autre « point poursuivi ». Le mouvement de chacun
de ces points est régi par son propre systè'me d'équations différentiel-
les avec son propre paramètre de commande. Le paramètre de com-
mande, le domaine de commande et la trajectoire du point poursui-
vant seront désignés respectivement par.; u, U et x (t), et ceux du
point poursuivi par v, V et y (t).
Soient u (t) et v (t) des commandes admissibles et x (t) et y (t)
les trajectoires correspondantes satisfaisant aux conditions initiales
x (0) == xo, y (0) == yo.
(59)
Si pour t 1 > 0 on a x (t 1 ) == y (t 1 ), nous dirons que le nombre t 1
représente l'instant de rencontre et l'égalité x (t 1 ) == Y (t 1 ) réalise la
rencontre. D'une manière générale, si les comlnandes u (t) et v (i)
sont arbitrairement choisies, la rencontre peut ne pas se produire
quel que soit t > O. Si toutefois la rencontre est réalisée, nous
dirons que u (t) est la commande poursuivante (pour la comman-
de v (t) donnée et les conditions initiales données Xo et Yo). Ceci
étant, pour xo, Yo et v (t) donnés et pour une commande u (t) choisie
il peut y avoir plusieurs rencontres. Le plus petit instant de rencontre
t 1 sera appelé temps de poursuite correspondant aux commandes u (t)
et v (t). Nous désignerons le temps de poursuite par T u,v. Dans la
suite, les conditions initiales (59) seront supposées fixées (de sorte
qu'elles n'interviennent pas dans la désignation du temps de pour-
suite).
NOLls supposerons encore que le point poursuivant jouit de la
propriété suivante: pour toute commande v (t) il existe (pour les
conditions initiales (59)) une comlnande poursuivante u (t).
Si est choisie la cOlnmande v (t) du point poursuivi, on peut poser
le problème de la recherche d'une commande poursuivante u (t)
telle que le temps de poursuite correspondant T u,v soit lninimal.
Nous supposerons que pour toute commande admissible v (t) i 1
e x i s t e une commande admissible u (t) réalisant le fi i n i fi U ln
*) Les résultats obtenus dans ce paragraphe sont dus à D. Kelendgéridzé.
28.]
UN PROBLÈME DE POURSUITE
203
du temps de poursuite. Désignons ce lllinimum par Tv:
Tv === min Tu, v.
u
Nons supposerons par ailleurs qu'il existe une comnlande admissible
v (t) réalisant le m a x i m II III de la grandeur T v, maximum
que nous désignerons par T:
T == max Tv === max (nlin Tu, v). (60)
v v u
Le problèllle consiste à trouver un couple de conlmandes adlllissi-
hIes Il (t) et v (t) tel que pour le temps de poursuite correspondant soit
vérifié3 l'égalité Tu, v == T. Ce coupl de commandes u (t) et v (t)
sera désigné par couple optilfLal de commandes et le couple correspon-
dant de trajectoires x (t) et y (t) (avec les conditions initiales (59))
par couple optimal de trajectoires.
Ainsi donc, la commande u (quel que soit la commande v (t))
,est choisie de manière à r a p pro che r au possible la rencontre
du point poursuivant avec le point poursuivi; quant à la commande v,
elle est choisie de manière à éloigner au maximum (dans le temps)
l'instant de rencontre. Ajoutons encore qu'en choisissant la comman-
de u (t) qui gouverne le mouvement du point poursuivant, nous sup-
poserons chaque fois que la commande v (t) du point poursuivi est
con nue à l'avance; en conséquence, pour définir la grandeur T
on prend d'a b 0 r d le minimum de toutes les commandes u (t)
pour uno commande fixe v (t), et e n sui t e le maximum de toutes
les conlmandes v (t).
Nous supposerons encore que le lllouvement du point poursuivant
est régi dans l'espace X par l'équation linéaire (sous forme vectoriel-
le) .
; =j(x, u) = Ax+Bu+c,
(61)
pour laquelle est satisfaite la condition de position commune et
dont le domaine de commande U est un polyèdre convexe borné et
fermé, contenu dans l'espace Er' engendré par la variable u ===
=== (Ul . . ., ur). Supposons que le mouvement du point poursuivi
est décrit par l'équation *) (sous forme vectorielle)
dy
di == g (y, v, t) (62)
*) On aurait pu sc lhniter, certes, au cas où le second membre de l'équation
(62) est autonome, i. e. il ne dépend pas explicitement du temps. Toutefois les
transfornlations opérées plus bas conduisent (même dans le cas autonome) à intro-
duire explicitement la variable t dans le deuxième membre de l'équation régis-
sant le 1110UVement du point poursuivi. Aussi le problème n'est pas plus simple
Jans le cas d'une équation (62) autonome.
204
PROBLÈMES DIVERS
[Ch.
et que son domaine de commande V est un ensemble contenu dans
l'espace de dimension s engendré par la variable v == (VI, . . ., VS).
Comme classe de commandes admissibles (tant pour u que pour v)
nous allons prendre l'ensemble de toutes les commandes continues
par morceaux. Les coordonnées de la fonction vectorielle g (y, v, t)
sont assujetties aux conditions habituelles (i.e. elles doivent être
continues en y, v et t et continûment dérivables par rapport aux
coordonnées yI, . . ., yn du point y).
En vue de résoudre le problème posé, introduisons deux vecteurs
a uxili aires
'P === ('Pt, . · ., 'Pn), X == (Xt, · . ., Xn)
et deux fonctions hamiltoniennes:
n
H 1 ('I', x, u)== 2 'Pafa(x, u)=== ('P, j(x, u),
a=1
n
H 2 (X, y, v) == Xa g a (y, v, t) == (X, g (y, v, t) ) ,
a=l
correspondant à l'objet poursuivant et à l'objet poursuivi. Utilisons
1es fonctions Hi et H 2 pour composer les deux systèmes suivants
d'équations différentielles en les variables auxiliaires 'Pi et Xi:
d'Pi DHt 2
---rIt == - Dxi ' i == 1, ,..., n,
dXi _ D JI 2 . 1 "
d ., l == , , ..., n.
t- - (.Iy
(63)
(G4)
Si les fonctions u (t), x (t), v (t) et y (t) sont données, en les portant
dans les deuxièmes membres du système (63), (64) nous obtenons des
systèlnes linéaires en 'Pi et Xi. Nous dirons que toute solution 1P (t)
et X (t) de ces systèmes correspond aux fonctions u (t), x (t), v (t)
et y (t) choisies.
Le théorème qui va suivre donne une condition n é ces s air e
d' optimali té el u problème étudié.
Thé 0 r è ID e 21. Soient u (t) et v (t) un couple optinlal de
commandes, x (t) et y (t) le couple optimal correspondant de trajectoires
(voir les équations (61) et (62» et T le temps de poursuite. Les systèmes
(63) et (64) admettent alors des solutions non triviales '\p (t) et X (t)
correspondant aux fonctions u (t), x (t), v (t) et y (t) telles que:
1 0 pour tous les t, 0 t T, soient satisfaites les conditions de
maximum
max Hi (11' (t), x (t), u) = Hi ('P (t), x (t), u (t», (G5)
uu
maxH 2 (x(t), y(t), v)==H 2 (X(t), y(t), v(t)); (of»)
vEV
28.]
UN PROBLÈME DE POURSUITE
205
2° à l'instant t == T soient satisfaites les conditions
Hi ('1' (T), x (T), u (T») H 2 (X (T), Y (T), v (T)), (67)
'1' (T) == X (T). (68)
D é ID 0 n s t rat ion. Soit Uo un point intérieur quelconque
du polyèdre U. Posons
fi == u - uo.
L'équation (61) s'écrit alors sous la forme
dx -
"dt == Ax + Bu + (Buo + c).
ln transportant donc l'origine des coordonnées de l'espace Er en uO,
nous ne faisons que modifier le terme libre c de l'équation (61);
toutefois, l'origine des coordonnées de l'espace Er sera maintenant
un point intérieur au polyèdre U. Nous supposerons que ce déplace-
ment (s'il était nécessaire) a été déjà fait dans l'équation (61) et donc
l'origine des coordonnées est un point intérieur au polyèdre U.
Désignons ensuite par XO (t) la solution de l'équation (61) corres-
pondant à la commande u == 0 (cette commande est admissible
puisque l'origine des coordonnées appartient au polyèdre U) et à la
condition initiale XO (0) == Xo (voir (59»). La solution XO (t) obéit
à l'équation
d.1:0(t) == Axo (t) -1- c,
dt
(69)
elle est donc une fonction analytique en t.
Soient Ui (t), Vi (t), 0 t t 17 un couple quelconque de comman-
des et Xi (t), Yi (t) les trajectoires correspondantes des équations (61)
et (62) satisfaisant aux condi tions ini tiales (59), i.e.
dXlt(t) = AXl (t) + Bu! (t) + c, (70)
dY1 (t)
dt == g (Yt (t), Vi (t), t), (71)
Xt(O)==xo, Yt(ü)==yo. (72)
Posons
- -
x (t) == X t (t) - X O (t), y (t) == Yi (t) - XO ( t) .
Alors, en vertu de (69), (70) et (71) il vient:
dY) = A x (t) + Budt),
dy (t) . - -
dt =-==g(y(t)+.rO(t), Vt(t), t)-AxO(t)-c== gi(y(t), Vt(t), t),
(73)
206
PROBLÈJ\IES DIYERS
[Ch. 4
OÙ g1 désigne la fonction
gi (y, V, t) == g (y + XO (t), v, t) - Axo (t) - c
(cf. note de la page 203). Les fonctions x (t), y (t) obéissent donc aux
équations différentielles
dx
at===Ax-1-Bu, (74)
dy
dt === g1 (y, V, t) (75)
(pour U === Uj (t), v == Vi (t)) et aux conditions initiales (voir (72))
x (0) === 0, y (0) === Yo - xo. (76)
Si, inversement, les fonctions x (t) et y (t) obéissent aux équations.
(74) et (75) et satisfont aux conditions initiales (76), les fonctions
Xi (t) et Yi (t) tirées des formules (73) vérifieront les équations (61)
et (62) et les conditions initiales (59). De (73) il est clair que chaque
instant de rencontre des trajectoires Xi et Yi est également un instant
de rencontre des trajectoires x et il et inversement (i.e. si Xi (t ' ) ==
== Yi (t f ), alors X (t ' ) == Y (t') et inversement). Dans le problèlne
initial de poursuite on peut donc remplacer les équations (61) et
(62) et les conditions initiales (59) par les équations (74) eL (75) et
les conditions initiales (76). Enfin, il est clair que si nous prouyons.
le théorème 21 pour le problème (74), (75) et (76) et si ensuite nous.
faisons le changement (73), nous obtenons ce mênle théorènle 21
pour le problème (61), (62) et (59). Nous pouvons donc procéder
à la démonstration du théorème 21 sur le problème (74), (75), (76)"
Autrement dit, il nous suffira de prouver le théorèn1e 21 (dans sa
première formulation, voir (61), (62), (59)) pour le cas où
c == 0, xo === 0
(77)
et, de plus, où l'origine des coordonnées de l'espace Er engendré par
les variables u 1 , . . ., ur est un point intérieur au polyèdre U"
Ceci posé, voyons maintenant la démonstration du théorènle 21.
Quel que soit t 1 > 0, désignons par tl l'ensemble de tous les
points de l'espace de phase X qu'on peut atteindre en un temps t1
en se déplaçant à partir de l'origine des coordonnées en vertu du
système (74) (sous l'effet d'une commande convenablement choisie)"
L'ensemble t1 est un ensemble convexe borné contenu dans l'espace
X et admettant des points intérieurs (voir page 122). Quel que soit
le point de l'ensemble t1 considéré on peut y accéder en un ten1pS
e x a c t e men t é gaI à t 1 (car avant le début du mouvement
on peut rester pendant un temps quelconque à l'origine des coordon-
nées, en faisant u == 0). Désignons pr Stl le bord du corps conve-
xe tl.
8.]
UN PROBLÈME DE POURSUITE
207
/Iontrons qu'on peut accéder en tout point i n t é rie u r
à l'ensemble tl (en partant de l'origine des coordonnées en vertu
du système (74)) en un temps i n f é rie u r à t 1 ; et inversement
si on accède à un point en un temps inférieur à t 1 , ce point est i n -
t é rie u r au corps tl. Soit, en effet, a un point quelconque inté-
rieur à l'ensemble ti. Soit par ailleurs '\fJ* (t) une solution de l'équa-
tion (5), chap. 3, telle que la commande u* (t) définie par l'équation
(6), chap. 3, transfère le point représentatif de l'origine des coor-
données en a. Désignons par t f l'instant où le point représentatif
arrive au point a sous l'effet de cette commande. Considérons la
Et!
FIG. 87
fonction '\fJ* (t), la commande u* (t) définie par cette fonction et la
trajectoire de phase correspondante x* (t) sur l'intervalle 0 t C
t", où t" > t f . Puisque x* (t f ) === a, le point x* (t") est contenu
à 1 ' intérieur du corps ti pour t " suffisamment proche de t'. Or la
trajectoire x* (t), 0 t t", est une trajectoire 0 p t i mal e
du système (74) (unique en vertu du théorème 12) menant de l'origine
des coordonnées au point x* (t") et comme x* (t") E ti donc t" t 1
et t f < ti. Supposons inversement qu'on peut accéder au point a en
un temps t f < t 1 sous l'effet d'une commande u* (t). Considérons
l'ensemble tt-t' des points auxquels on peut accéder (sous l'effet
d'une commande quelconque) en un temps inférieur ou égal à t 1 -
- t f ; l'origine des coordonnées se trouve à l' i n t é rie u r
de cet ensemble. Quel que soit le point de l' ensemble ti-t' d'où
l'on part, en se déplaçant sous l'effet de la commande u* (t) pendant
un temps t'on obtient un ensemble W contenant le point a (fig. 87)
Partant de l'origine des coordonnées, on peut accéder en tout point
de l'ensemble W en un temps t1 (en se déplaçant d'abord à l'inté-
rieur de l'ensemble tl-t' pendant un temps t 1 - t'et ensuite en
parcourant en t' la distance séparant l'ensemble tl-t' de l'ensem-
ble W), i.e. Wc tl. Le point a est donc un point i n t é rie u r
à l' ensemble ii.
208
PROBLÈMES DIVERS
[Ch. '*
Revenons rnaintenant aux commandes optimales u (t) et v (t) et aux
trajectoires optimales x (t) et y (t) mentionnées dans le théorème 21.
(on tiendra compte des simplifications (77) introduites) et prouvons
que le point x (T) est situé sur 1 e b 0 r d du corps T. Suppo-
sons en effet, que le point x (T) est un point intérieur à ce corps.
On peut donc accéder à ce point (en partant de l'origine des coor-
données sous l'effet du système (74)) en un tenlps t f < T. En pre-
nant donc un point t 1 tel que t f < t 1 < T, il vient que l'ensemble
tl (constitué des points auxquels on accède en un temps t 1 ) contient
le point x (T) et, par conséquent, une boule de rayon r centrée sur
le point x (T). l)our t 1 < t < T l'ensemble t contient égaleJnent
une boule de rayon r centrée sur le point x (T). Faisons choix mainte-
nant d'un nombre t (pris dans l'intervalle t 1 < t < T) arbitraire-
ment proche de T de manière que la distance qui sépare le point
y (T) === x (T) du point y (t) soi t inférieure à r. Alors, l' ensemble t
contient le point y (t) et de plus t < T. Ce qui veut dire que le point
poursui van t peu t accéder en y (t) à 1 ' instant t < T, i. e. (pour une
commande convenablelnent choisie v (t)) la rencontre peut se réaliser
il l'instant t < T. Or, cela contredi t la définition d LI non1bre T.
Donc, le point x (T) est situé sur le bord S T de l'ensemble T.
De ce qu'il précède il s'ensuit que u (t), 0 t T, est une COln-
mande en temps optimal transférant le point représentatif de l'ori-
gine des coordonnées en x (T) (en vertu du système (74)). En effet.
si cette commande n'était pas optimale, le point représentatif serait
transféré en x (T) en un temps inférieur à T et alors x (T) serait situé
à l' i n t é l' i e u r de l'ensenlble T' ce qui est faux. De ce qui
précède il résulte que la comn1ande u (t), 0 t t 1 (où t 1 < T)
est aussi une commande en temps optimal transférant le point repré-
sentatif (en vertu du système (74)) de l'origine des coordonnées eIl
x (t 1 ). Autrement dit, il est in1possible d'aboutir au point x (td
(0 < t 1 T) en un temps inférieur à t 1 , et donc le point x (t 1 ) est
situé sur le bord de l'ensemble tl.
Soit l'union de tous les ensembles t, t > O. Il est clair que
est un ouvert de l'espace X, contenant l'enseu1ble T et par suite
le point x (T) === Y (T). Il existe donc nn nOJnbre t* < T tel que
y (t) E pour t* < t T. Désignons par L (t) un nombre tel que
y (t) E S'tu> quel que soit t, t* t T. Il est aisé do voir que T(t)
est une fonction continue de t, définie sur l'intervalle t* t T.
u (t) et v (t) étant un couple 0 p t i mal de commandes et T le
temps de poursuite, il vient:
L (T) == T,
L (t) > t pour t < T.
(78)
(79)
Si en effet, l'inégalité L (t) t était vérifiée pour un certain t < T,
le point poursuivant accéderait au point y (t) ESt (t) C t en nn
28.]
UN PROBLÈME DE POURSU ITE
209
temps t, i.e. (sous l'effet de la commande v (t) choisie) la rencontre
aurait pu se réaliser en un temps t < T, ce qui contredit la défini-
tion du nombre T.
Le point y (t) étant situé sur le bord S 'tet) du corps convexe 'tet),
il est possible de faire passer par ce point un hyperplan d'appui au
corps 'tco. Cet hyperplan (ou l'un quelconque d'entre eux s'ils
sont plusieurs) sera désigné par d't(t). Soit e't<t) le vecteur unitaire
d'origine y (t), orthogonal à l'hyperplan d't<t) et orienté vers le
den1i-espace ne contenant pas l'ensemble 't<t). Le vecteur x - y (t)
admettant pour origine un point quelconque x E 't(t) étant orienté
vers le demi-espace contenant l' ensen1ble 't(t), le produit scalaire
(x - y (t), e'{;(t») O. En particulier de (79) il résulte que t c:
,= '{;(o et .
(x - y (t), e-r(t») 0, x E t.
(80)
Faisons choix maintenant d'un procédé de perturbation de la com-
mande v (t) (voir page 80). La trajectoire perturbée corrspondante
(avec la précédente condition initiale, voir (59)) est de la forme:
y* (t) == y (t) + 8Ôy (t) + 0 (€), a t T; (81)
le vecteur dy == ôy (T) se tirant de la formule (22), chapitre 2 où il
convient de poser L == T, ôt == a et de négliger la coordonnée XO
(puisque c'est l'espace de phase X qui est considéré et non pas X).
Soit maintenant 81, 8 2 , . . ., 8i, . .. une suite quelconque de
nombres positifs convergeant vers zéro. Désignons par yi (t) la
trajectoire (81) associée à 8 == 8i, et par vT (t) la commande corres-
pondante. Le temps d'e poursuite correspondant à la commande
vi (t) sera noté t i == T v. On a:
yt= (ti) E t., i = 1, 2, · · .
l
(82)
De l'optimalité du couple de commandes u (t), v (t) il vient:
i T, i == 1, 2, .
Par ailleurs, il est aisé de constater que
li ti = T.
i-+oo
(83)
(84)
Supposons en effet que la relation (84) n'est pas sa tisfai te. En passant,
au besoin, à une sous-suite nous pouvons supposer que lim t i existe
i-+oo
et est inférieure à T. Posons lim t i == t. Puisque lim 8i == 0, de (81)
i-+oo i-+oo
il s'ensuit:
lim yr (t i ) == Y (t).
i-+oo
14-01339
210
PROBLÈl\IES DIVERS
[Ch.
Par ailleurs, en passant à la limite dans (82) il vient:
lim yi (ti) E t.
i-oo
Donc, y (t) E t' où t < T, ce qui contredit la définition de T. La
relation (84) est donc satisfaite.
De (83) et (84) il résulte que les nombres L (t i ) sont définis pour i
suffisamment grand; nous supposerons (en négligeant au besoin les
premiers termes de la suite) que les nombres L (t i ) sont définis pour
tous les i == 1, 2, . .. De (78) et (84) on a, en vertu de la conti-
nuité de la fonction L (t),
lim't (ti) == T.
i-+ 00
(85)
Considérons maintenant les vecteurs
e't(t i ), i = 1, 2, ...
(86)
La sphère unitaire de l'espace X de dimension n étant compacte,
nous pouvons considérer (en passant au besoin à une sous-suite) que
les vecteurs (86) convergent pour i -+ ex:> vers un vecteur unitaire de
l'espace X. Soit maintenant x un point arbitraire i n t é rie u r
au corps T. Alors, x E t. pour i suffisamment grand et donc
l
(X-y(ti)' e't(t.»)O
l
(voir (80)). En passant à la limite pour i -+ ex:> (et compte tenu de la
relation y (T) == x (T) et de la relation (85)), on a
(x - x (T), e) O. (87)
Puisque la relation (87) est vérifiée pour tous les points x intérieurs
au corps T' elle l'est par conséquent pour tous les points x de ce
corps.
De (82) et en vertu de (80), il découle:
(yt (ti) - Y (ti), e't(t.»)O, i == 1, 2, . . ·
l
ou , compte tenu de (81),
(Eiôy(ti)+o(e)le=e., e't(t.»)O, i==1, 2, ...
z. z.
En divisant cette expression par Ei et en passant à la limite pour
i -+ ex:>, il vient ( en vertu de la relation lim o() == 0 )
e-+ 00 e
(ôy (T), e) 0,
ou encore,
(l1y, e) O.
(88)
9 28.J
UN PROBLÈME DE POURSUITE
211
Considérons enfin la fonction
cr i (t) == (X (t) - y (t), e 't( t i») .
Puisque x (t) E t, quel que soit t, de (80) il s'ensuit cri (t i ) O.
Par ailleurs, cri (T) == 0 puisque x (T) == Y (T). De plus, la fonction
cri (t) admet pour i suffisamment grand une dérivée continue sur
l'intervalle ti t T (les commandes u (t) et v (t) étant continues
par lnorceaux et la relation (84) étant vérifiée). Il existe donc un
i' t i < £i < T tel que cri (£i) 0, i.e.
(f(X(£i)' U(£i)-g(Y(£i), V(£i), £i), e't(t.))O.
z
En passant à la limite pour i -+ ex> il vient:
(w, e) 0,
(89)
où
w == g (y (T), v (T), T) - f (x (T), u (T». (90)
Désignons maintenant par d l'hyperplan de l'espace X passant
par le point x (T) et orthogonal au vecteur e. Nous considérerons
en outre que les vecteurs l1y et w sont issus du point x (T). Les rela-
tions (87), (88) et (89) montrent alors que le corps T tout entier et
les vecteurs l1y et w sont situés d'un même coté de l'hyperplan 11. Autre-
ment dit, si nous désignons par * l'enveloppe convexe du corps T
et du vecteur w, nous constatons que le corps * et le vecteur l1y
sont situés d'un même côté de l'hyperplan 11. Le corps * et le
vecteur - l1y sont donc situés dans deux demi-espaces fermés
dis t i net s définis par l'hyperplan 11. D'où nous concluons enfin
que le vecteur -l1y issu du point x (T) ne__passe pas par des points
intérieurs au corps * .
Considérons maintenant toutes les méthodes possibles de perturba-
tion de la commande v (t) en portant les vecteurs obtenus dy == ôy (T)
(voir (81) à partir du point x (T). Les extrémités de ces vecteurs
remplissent un certain ensemble K dans l'espace X, qui, on le cons-
tate aisément (voir pages 86-87), n'est autre qu'un cône convexe
de sommet au point x (T). Les extrémités des vecteurs -l1y remplis-
sent un cône convexe symétrique du cône K par rapport au point
.r (T), que nous désignerons par -K. De ce qui précède, il résulte
que le cône -K ne rencontre pas l'intérieur du corps convexe *.
Puisque en outre le corps * contient des points intérieurs (car le
corps T en renferme aussi), les corps * et -K sont séparables.
Autrement dit, il existe dans X un hyperplan 11 * tel que le corps
La* soit contenu dans l'un des demi-espaces fermés définis par l'hy-
perplan 11* et le cône -I( dans l'autre. Les ensembles convexes *
et K sont donc situés dans un même demi-espace fermé défini par
l'hyperplan d *. Désignons par e* le vecteur unitaire issu du point
.x (T), orthogonal à 1 'hyperplan * et orienté vers le demi-espace
14*
212
PROBLÈMES DIVERS
[Ch. '*
ne contenant pas les corps * et K. Le vecteur e* satisfait donc aux
relations (cf. (87), (88), (89)):
(x - x (T), e*) 0 pour x E T' (91)
(y, e*) 0 pour y E K, (92)
(w, e*) O. (93)
Désignons par 1P (t) la solution du système (63) vérifiant la condi-
tion initiale 1P (T) == e* et par X (t) la solution du système (64)
vérifiant la condition initiale X (T) == e*. Nous allons prouver
maintenant-que les fonctions 1P (t) et X (t) sont les fonctions cherchées
(i.e. elles vérifient les conditions du théorème 21). Remarquons tout
d'abord que la relation (68) est satisfaite en vertu du choix des con-
ditions initiales pour les fonctions 1P (t) et X (t). Quant à la relation
(67), elle découle immédiatement des expressions (90) et (93). Enfin
les relations (65) et (66) se démontrent, en utilisant les inégalités (91)
et (92)tout comme, dans le chapitre 2, la relation (11) a été délnontrée
à l'aide de l'inégalité (34) (bien entendu on prendra soin de procéder
aux modifications évidentes imposées par le fait que c'est l'espace X
et non plus l'espace X qui est considéré).
Ce qui achève la démonstration du théorème 21.
Le principe du
calcul des
CHAPITRE 5
maximum et le
variations
Dans ce chapitre, nous allons voir le lien qui existe entre la théo-
rie des processus optimaux et le calcul variationnel classique. Nous
démontrerons que le problème optimal résolu dans les chapitres 1
et 2 est une généralisation du problème de Lagrange dans le calcul
variationnel et qu'il lui est équivalent lorsque le domaine de com-
n1ande U est lln ensemble ouvert de l'espace vectoriel Er.
Nous montrerons ensuite que lorsque U est 0 u ver t, toutes
les conditions nécessaires dll calcul des variations (notamment le
critère de Weierstrass) découlent du principe du maximum. Cepen-
dant lorsque U est un ensemble fer m é de l'espace Er (qu'il ne
couvre pas entièrement), la condition de Weierstrass cesse d'être
valable, i.e. est f a u x le théorème selon lequel pour qu'une fonc-
tionnelle atteigne son minimum, il est nécessaire que soit remplie
la condition de Weierstrass. L'avantage du principe du maximum sur
les théorèmes classiques du calcul variationnel réside donc dans le
fait qu'il s'applique à un ensemble quelconque (qui peut être fermé)
U c Er- L'élargissement de la classe de domaines de commande
possibles U par rapport au cas classique des ensembles ouverts est
très important pour les applications techniques de la théorie. C'est
précisément le cas où l'ensemble U c: Er est fer m é qui présente
le plus d'intérêt dans les problèmes de commandes optimales et
notamment dans les problèmes d'applications. Ainsi, mêmes les
problèmes simples cités dans le 5 n'auraient pu être traités avec
les méthodes du calcul variationnel classique, étant donné que le
domaine de commande U est un ensemble fermé et les valeurs des
commandes optimales sont situées dans tous ces exemples sur 1 e
b 0 r d de U. Si, dans l'un quelconque de ces exemples, nous nous
limitons à l'étude d'un ensemble ouvert, en négligeant les points
frontières du domaine de commande U, alors les théorèmes classiques
nous donnent la réponse suivante: les commandes optimales n'exis-
tent pas. Ceci implique notamment que le paramètre de commande
doit prendre des valeurs situées sur 1 e b 0 r d de l'ensemble U,
mais cette condition ne suffit absolument pas pour résoudre le pro-
blèn1e puisqu'il faut savoir c 0 m men t doit varier ce paramètre
de commande sur le bord de U. Par exemple, dans le cas des problè-
mes linéaires, il importe de connaître le nombre de commutations,
214
CALCUL DES VARIATIONS
[Ch. 5
de quels sommets à quels somlnets du polyèdre U se réalisent ces
commutations, etc. La théorie classique est impuissante face à toutes
ces questions; par contre, nous avons vu sur des exemples que le
principe du maximum contenait suffisamment d'informations pour
résoudre les problèmes mentionnés.
Dans le g 29, nous déduirons du principe du maximum des con-
ditions nécessaires pour le problème fondamental du calcul des
variations.
Dans le 30, nous prouverons l'équivalence du problème de
Lagrange et du problème optimal du chapitre 2, et déduirons aussi
du principe du maximum le critère de Weierstrass lorsque le donlaine
de commande U est un ensemble ouvert de l'espace Er de dimension r.
Par souci de simplification, nous nous limiterons à l'étude des extre-
mums forts des problèmes variationnels.
9 29. Problème fondamental du calcul variationnel
Quoique le problème fondamental du calcul variationnel ne soit
qu'un cas particulier du problème de Lagrange étudié dans le para-
graphe suivant, il n'empêche qu'il fera l'objet d'un paragraphe
isolé puisque le lien existant entre le principe du maximum et les
conditions nécessaires dll calcul variationnel ressort le plus nette-
ment dans cet exemple simple.
Définitions
Soit dans l'espace Rn+l de dimension n -t- 1 engendré par les
variables réelles (t, Xl, . . ., x n ) === (t, x) une courbe x (t) définie
par les équations
xi == xi (t), i == 1, ..., n, t o <. t t 1. ( 1 )
Si les fonctions Xi (t), i === 1, . . ., n, sont absolument continues et
admettent des dérivées bornées, i.e. en tout point où la dérivée est
définie on a
1 dX;t(t) IM =const, i = 1, ..., n,
nous dirons que la courbe (1) est absolument continue. Désignons, par
ailleurs les points x (t o ) et x (t 1 ) respectivement par xo et X1; nous
dirons que la courbe (1) relie les points (t o , xo) et (t 1 , X1) ou encore
qu'elle satisfait aux conditions aux limites
x (t o ) === XOt x (t 1 ) === Xi. (2)
Appelons ô-voisinage de la courbe absolument continue (1) l'ensemble
de toutes les courbes absolument continues
X' (t) == ('t (t), ..., ;n (t)), t o t t i
29.]
PROBLÈME FONDAMENTAL
215
telles que
Ixi(t)_'.;;i(t)l<ô pour tott1' i===1, 2, ..., n.
Soit maintenant G un ensemble ouvert de l'espace R n +l et soit
la fonc tion réelle
f (t, Xl, . . .,
n 1
X , U , . . .,
un) == f (t, X, U)
définie, quel que soit le point (t, x) E G et quelles que soient les
valeurs réelles u l , . . ., Un. Nous supposerons en outre, que la fonc-
tion f est continue et continûment dérivable par rapport à tous ses
arguments.
Supposons que la courbe (1) est entièrenlent située dans le do-
maine G. Alors est définie l'intégrale
ti
J = J (x) = J f (t, x (t), dXdt) ) dt,
to
(3)
que nous considérerons COllIne une fonctionnelle du vecteur fonction
,-.J
x (t), t o t t i . Il est évident, que pour toute courbe x (t), t o
t t i appartenant au ô-voisinage de la courbe (1), est également
définie la fonctionnelle J (.Î) pourvu que Ô > 0 soit suffisamment
peti t.
Nous dirons que la courbe absolument continue (1) est une extré-
male (forte) de la fonctionnelle (3) s'il existe un ô > 0 tel que la
fonctionnelle (3) prenne son minimum (ou son maximum) pour x == x
sur l'ensemble de toutes les courbes x (t), t o t t i , si tuées dans
le ô-voisinage de la courbe (1) et satisfaisant aux mêmes conditions
aux limites (2). Nous n'étudierons dans la suite que le cas du m i -
n i m u m. On dira donc de la courbe (1) qu'elle est une extrémale
de la fonctionnelle (3) s'il existe un ô > 0 tel que J (x) J (x)
pour toute courbe absolument continue x (t), t o t t f , apparte-
nant au ô-voisinage de la courbe (1) et vérifiant les conditions aux
lilnites X (t o ) == Xo, x (t i ) == Xi.
Le problème fondamental du calcul des variations consiste à trouver
toutes les extrémales de la fonctionnelle donnée (3) pour les condi-
tions aux limites (fixes) données (2).
E qua t ion s d'E u 1 e r etc 0 n dit ion d e L e g end r e
Nous allons montrer que toute extrémale est une trajectoire
optimale pour un certain problème optimal. Soit le système
dx i i
(ft==u, i=-== 1, ..., n,
(4)
216
CALCUL DES VARIATIONS
[Ch. !)
et la fonctionnelle intégrale
f1
J=J(x, u)= J f(t,
to
1
X, ...,
11 1
X, u, ...,
Uli) dt ==
ti
= J f (t, x, u) dt, ( 5)
tu
où u == (u 1 , . . ., un) représente le paramètre de commande qui est
choisi dans la classe des vecteurs fonctions mesurables bornés. Lü
domaine de commande U se confond donc dans le cas considéré avee
l'espace En de dimension n engendré par les variables u 1 , . . ., un.
Vu qu'elles seront appliquées au calcul des variations, nous
allons définir les trajectoires optimales des problèmes (4) et (5) d'unü
façon différente que dans les chapitres 1 et 2. Plus exactement,
supposons que les limites d'intégration sont fixes dans (5). UnE
commande mesurable bornée u (t), t o t t 1 , et la trajectoire
x (t) absolument continue correspondante du système (4) avec les
conditions aux limites (2) seront dites optimales s'il existe un Ô > 0
tel que J (:;, T;) J (x, u), quelle que soit la commande ç; (t) pour
laquelle la trajectoire correspondante x (t) du système (4) satisfait
aux conditions aux limites (2) et se trouve dans le ô-voisinage de la:
courbe x (t). Autrement dit, dans la définition des commandes et des
trajectoires optimales nous allons comparer la trajectoire x (t) non
pas à t 0 u tes les autres trajectoires ;; (t), mais seulement aux
trajectoires qui sont situées dans le ô-voisinage de la courbe x (t).
Toute trajectoire, optimale au sens des chapitres 1 et 2, est optilllale
au sens adopté ici, mais d'une manière générale, la réciproque n'est
pas vraie. Par conséquent, les commandes et les trajectoires optinlales
son t plu s nom b r eus e s au sens défini ici qu'au sens défini
dans les chapitres 1 et 2.
Il est aisé de comprendre que le principe du maximum, en tant
que condition n é ces s air e d'optimalité, reste valable dans la
même forme pour les commandes et les trajectoires optimales au sens
défini ici. En effet, pour démontrer le principe du maximUlll nous
avons, au chapitre 2, comparé la trajectoire x (t) seulement aux tra-
jectoires de la forme
x* (t) = x (t) + 8ÔX (t) + 0 (8),
où 8 est un infiniment petit. Pour 8 suffisamment petit, la trajectoi-
re x* (t) est contenue dans le ô-voisinage de la courbe x (t) (quel que
soit ô) et tous les raisonnements du chapitre 2 passent donc san s
c han g e m e fi t pour les commandes et les trajectoires optinlales
au sens défini ici. -:
29.]
PROBLÈME FONDAMENTAL
217
Le problème optimal (4), (5) est un problème à extrémités et à
temps fixes (voir g 8). Il est évident que toute trajectoire optimale
du problème (4), (5) est une extrémale de l'intégrale (3) et inverse-
ment (il suffit, en vertu de (4), de remplacer dans (5) les grandeurs
u i (t) par les dérivées dX:?) ). Aussi, le principe du maximum qui
est une condition nécessaire d' optimalité est-il également une condi-
tion nécessaire pour que la courbe x (t) soit une extrémale de l'inté-
grale (3). Cette simple constatation nous permet d'appliquer le
principe du maximum à la résolution du problème variationnel (3).
Pour résoudre le problème optimal posé, nous devons, en vertu
du théorème 6, composer les équations pour les variables auxiliaires
inconnues '4'0' '4'1' · · ., '4'n et la fonction 0Jt qui, el' après (4), pren-
nent ici la forme suivante
0Je == 1Vof (t, x,
d'Po == 0
dt '
d;i = -1\Jo
u) + 1VfU l + . . . -!-1V n u n ,
i = 1, ..., n. }
(6)
af (t, x, u)
ax i
(7)
La condition de maximum du théorème 6 donne
n
c2It (1J' (t), x (t), t, u (t)) == lna ('Pof (t, x (t), u) -1- 1V ex (t) ua) ( 8 )
uEEn a=l
(presque partout sur l'intervalle t o t t f , cf. théorènle 8). Le
dOlnaine de cOlnmande U se confondant avec l'espace En tout entier
(pour la suite il est suffisant d'exiger que U soit un ensemble 0 u
ver t dans En), le point u == u (t) où la fonction QJt ('i' (t), x (t),
t, u) qui est considérée comme une fonction de la variable u E U
atteint son maximum, est un point s t a t ion n air e de cette
fonction. Il s'ensuit donc de (8) (pour presque tous les t, t o t t f ) :
a
au i Q1e (1J' (t), x (t), t, u (t)) ==
== 'Ih o af (t, x (t . ), u (t)) + 'Ih l . (t) == 0, 1 2
au?, i == , ,..., n.
D'où l'on déduit que 1Vo =1= 0, puisque dans le cas contraire '\}Ji (t) ==
== 0, i == 0, 1, . . ., n. Nous pouvons donc poser 11'0 == -1 puisque
'4'0 == const 0 (voir théorème 6) et que les grandeurs '4'0' 1V1, . . .
. . ., '4'n sont définies à un facteur commun positif de proportionna-
lité près. En faisant 'Po == -1 dans les égalités précédentes, nous
obtenons (presque partout sur l'intervalle t o t t f )
'Ih. (t) == al (t, x (t, u (t)) . 1
l au'/,' l == , ..., n.
(9)
218
CALCUL DES VARIATIONS
[Ch. 5
Par ailleurs, en faisant 'Po == -1 dans l'équation (7), et en intégrant,
nous obtenons
t
'l\Ji (t) = 'l\Ji (to) + J Of ('r, à' u ('r)) d'T:
io
i === 1, ..., n, t o t t 1. ( 10)
De (9) et (10) nous déduisons les équations d'Euler sous forme
intégrale (en remplaçant u i (t) par les dérivées d:it(t) , voir (4)):
( dx (t) ) t ( dx ('t) )
81 t,x(t), dt al 't, x ('t), dt .
àui (=) J àxi d'T:+Ji (to), L= 1, ..", n,
to
où le symbole (===) signifie, comme dans le chapitre 2, que les égalités
sont vérifiées pour presque tous les t, t o t t i . En dérivant par
rapport à t (à condition que la fonction f et l' extrénlale x (t) soient
deux fois continûment dérivables), nous obtenons les équations
d'Euler sous forme ordinaire
( dx (t) ) ( ( dx (t) ) )
al t, x(t), dt _ al t, x(t), dt _
dx i dt alti (-)0, (10a)
i:==:1,..., n.
Supposons maintenant que la fonction f (t, x, u) admet des
dérivées secondes partielles continues en u 1 , . . ., un. Alors 1
si la fonction
n
age ('i' (t), x (t), t, u) === f (t, x (t), u) + 'Pa (t) ua,
a=l
prise comme une fonction de la variable u atteint son maximum
au point u == uo, la forme quadratique
n
a 2 B
LJ '); B QI{ ('" (t), x (t), t, uo) £a£ ===
au a au
<x, f)=1
n
82 ta
f (t, x (t), Uo)
au a au f3
a, 13=1
est non positive (quels que soient £1, . . ., n). De la condition de
maximum (8) il vient, pour presque tous les t, t o t t 1 ,
2 ( dx (t) )
a f t, x (t), dt
2j a{3 O.
aua auf)
a, /3=1
29.]
PROBLÈME FONDAMENTAL
2'19
Cette condition, nécessaire pour que la courbe x (t) soit une extrémale
de l' in tégrale (3), est appelée condition de Legendre.
Variables canoniques
Soient, comine précédemment, u (t), x (t), t o t t i , une com-
lnande optilnale et la trajectoire optimale correspondante du problè-
nle (4), (5), et soit par ailleurs", (t) == (-1, '\}Ji (t), . . ., 'Pn (t)) ==
== (-1, 'lIJ (t)) la solution absolument continue non HuIle du systè-
lne (7) qui correspond à u (t) et x (t).
Posons
(? /1 (J, X , t) =--= su p QJ£ ("" x, t, u) == su p ( - j (t,
uEEn uEEn
n
:1', u) + 'Paua),
a=l
'" == (-1, 'lIJ), x et t étant fixés.
Supposons que l'équation
Q)[ ('i', x, t, u) == dit (tp, x, t)
(11)
adnlet une solution unique
u == u (" x, t), (12)
définie, continue et continûment dérivable par rapport à ses argu-
1110nts pour
to<t<tt, \Xi_Xi(t)\<<5,
\1Pi--'lIJi(t) 1<<5, i==1, ..., n,
(13)
où <5 un nombre positif suffisamment petit. Sous ces conditions, nous
dirons que les variables (Xl, . . ., x l1 ) == X, ('lIJt, . · ., 'Pn) == 'lIJ sont
les variables canoniques du problème optimal considéré et la fonction
n
If (" x, t) == - j (t, x, u ('P, x, t)) + 'Pa ua ('P, x, t),
a=1
jonction de Hamilton.
Puisque la commande optilnale u (t) satisfait presque partout
sur l'intervalle t o t tt à la condition de maximum (8) (rappe-
lons que 'Po == -1) et que u ('lIJ, x, t) est l'u n i que solution de
l'équation (11) (pour les conditions (13)), alors (presque partout sur
l'intervalle t o t tt) on a
dx (t)
u(t)=u('I'(t), x(t), t)= dt . (14)
On peut même affirmer que l'égalité (14) est vérifiée par t 0 u t
.sur l'intervalle t o t t i . En effet, puisque l'égalité (14) est
presque partout vérifiée, on a
t
x (t) =x (t o ) + J u (1\1 Cr), x ('r), 't) d't.
to
220
CALCUL DES VARIATIONS
[Ch. 5
Or l'intégrande est une fonction con t i nue en L (car la solu-
tion (12) est continue en ses arguments), la dérivée de cette intégrale
est donc par t 0 u t sur l'intervalle t o t t 1 égale à l'inté-
grande.
Il résulte de l'égalité (11) que les dérivées partielles de la fonction
QJt ('i', x, t, u) par rapport à u i , i = 1, . . ., n s'annulent pour
u === u ('l', x, t) (pourvu que soient satisfaites les conditions (13)):
_ af (t, x, u (11', x, t)) -+- '1101. == A . 1 (15)
oui 1 l , l === , ..., n.
Par sui te
aH (11', x, t) _.
a'Pi
n
.-!!.L. oua (\jJ, x, t) + u i (1\', x, t) +
au a ihp l
a=1
n
+ '11-1 alla ('P, x, t) == ai ( "101 x , t ) + _
1 LJ a a'IJi ,
a= 1
n
( ai ) aua i
+ 1\'a- oua OIPi =u (\)1, X, t);
a=1
n
a Il (11', x, t)
ax i
al
- ----
- ax i
. au a (11". x, t) +
LJ au a ax
a=1
n
+ '1101 au<X(tp,.x, t) == _+
LJ a ()x ax
<x=1
n
-!_ ( ,101 _ 3!..L ) au == _ ai {t, x, u 1P, x, t)) .
I.L.J ya iJua ax ax1,
a=1
Et, en vertu des (14) et (7), nous obtenons les équations canoniques
d'Euler-Hamilton:
dx i a Il
--rit - a\f-'i '
d'Pi _ aIl
dt - - ax i '
i == 1, ..., n,
i === 1, ..., n,
qui sur l'intervalle t o t t i sont vérifiées par les composantes
des vecteurs foI1ctions x (t) == (Xl (t), . . ., x n (t)) et '\}J (t) ==
= ('Pi (t), · · ., 'Pn (t)).
Supposons, enfin, que la fonction f (t, x, u) est d eux foi s
continûment dérivable par rapport aux variables u l , . . ., un et
que le déterminant
a 2
. . f (t, x (t), u ('p (t), x (t), t) )
au au J
(16)
30.]
PROBLÈME DE LAGRANGE
221
est non nul sur l'intervalle ta t tf- Ceci étant, le système
d'équations
rah _ af (t, x, u) - 0 . 1
'-Yi au i -, L === , ..., n,
(17)
Bst ullivoquement résoluble en u l , . . ., un, si xi et 1Pi diffèrent peu
do Xi (t) et 1Pi (t) et, en vertu de (15), cette solution se confond avec
la fonction (12). Donc, la définition que nous avons donnée des
coordonnées canoniques concorde avec la définition ordinaire de ces
coordonnées à l'aide du système (17) à condition que le détermi-
nant (16) soit non nul.
Rem a r q u c. Si l'on suppose que la fonction f (t, x, u) est
définie non pas pour toutes. les valeurs réelles des variables u l , . . .
. . ., un, lnais seulement pour u EUe En' où U est un ouvert de En'
alors (après des modificati9J!s évidentes dans la définition des extré-
males de l'intégrale (3)), tout ce que nous venons de dire reste vrai.
Il conviendra seulement dans le problème optimal (4), (5) de prendre
pour domaine de comnlande non plus l'espace En tout entier mais
son sous-ensemble ouvert U. Cette remarque vaut aussi pour le
paragraphe suivant.
9 30. Problème de Lagrange
Enoncé du problème
Soient k fonctions
jl(t, Xl, ..., xn, vI, ..., V l1 - h )===fi(t, x, v), i===1,..., k,
continues et continûment dérivables par rapport à tous leurs argu-
lnents pour (t, x) E G et pour des valeurs quelconques du vecteur
v === (VI, . . ., v r ), où r === n - k. Considérons le système sui vant
de k équations différentielles avec les fonctions inconnues Xl (t),
. . ., x n (t) :
dx i _ f i ( t .
dt '
= cpi (t, xl,
l 1\ . 0 dxk+l dx n ) ==
x , ..., X, dt ,. · ., dt -
11, dx l dx n ) 0 . 1
..., x, di' ..., di === , l== ,
. . ., k < n. (18)
Une courbe absolument continue x (t), ta t t l , contenue
entière nlen t dans le domaine G sera appelée admissib le si elle vérifie
les conditions aux limites (2) et si ses coordonnées vérifient le systè-
me (18). Par ailleurs, une courbe absolument continue x (t), ta
t t l , sera appelée extrémale de la fonctionnelle (3) pour les
conditions aux limites données (2) et le système donné (18) si x (t)
est une courbe admissible et s'il existe un B > 0 tel que J (x)
222
CALCUL DES VARIATIONS
[Ch. 5
J (X) pour toute courbe a d mis s i b 1 e x (t), t o t t f
contenue dans le ë-voisinage de la courbe x (t).
Le problème de Lagrange (à extrémités fixes) pour les conditions
aux limites (2) et le système (18) donnés consiste à chercher toutes
les extrémales d'une fonctionnelle de la forme (3).
1\'Iontrons que ce problème se ramène à un problème optimal.
Pour des besoins de symétrie posons
1° (t, x, v) == 1 (t, x, fI (t, x, v), . . ., fh (t, x, v), VI, . . ., vr), (19)
où la fonction 1 (t, x, u l , . . ., un) est celle définie dans le précédent
paragraphe.
Considérons le système d'ordre n
d;: =/i(t, x, v), i=1, ...,
dxh+j _ j
dt - v ,
j = 1,
k, }
n-k=r,
(20)
. . .,
où v == (VI, . . ., vr) désigne un vecteur de commande. Toute com-
mande mesurable bornée sera considérée comme admissible, i.e.
le domaine de commande sera l'espace Er de dimension r engendré
par les variables VI, . . ., v r .
On demande de trouver une commande admissible v (t) corres-
pondant à la trajectoire x (t) du système (20), satisfaisant aux condi-
tions aux limites (2) et minimisant l'intégrale
t1
J (x) = 1° (t, x (t), v (t)) dt.
to
Il est évident, que toute solution de ce problème optimal (à extré-
mités fixes) est une extrémale pour le problème de Lagrange considéré
et, inversement, une extrémale quelconque x (t) == (Xl (t), . . .
. . ., x n (t)), t o t t b du problème de Lagrange est une trajectoire
optimale correspondant à la commande optimale
1 r ( dxh+l (t) dx n (t) )
(V (t), ..., v (t)) == dt ,. · ., dt . (21)
Il est aisé de voir qu'inversement tout problème optimal à temps
fixe est un problème de Lagrange (à extrémités fixes) si la classe de
commandes admissibles est composée de commandes mesurables
bornées arbitraires et si le domaine de commande se confond avec
l'espace Er tout entier.
Règle des multiplicateurs de Lagrange
Soient v (t), t o t t f , une commande optimale et x (t) la
trajectoire correspondante du système (20) satisfaisant aux condi-
tions aux limites (2). Soit par ailleurs, 'i' (t) = ('Po (t), . . ., 'Pn (t))
30.1
PROBLÈME DE LAGRANGE
223
un vecteur fonction absolument continu et non nul correspondant
aux fonctions x (t) et v (t). La fonction Q7E ("l', x, t, v) est de la forme
k n-k
Q1C ('\l', x, t, v) == 'P% (t, x, v) + L 'Pai a + 'Pk -t- a va .
a=1 a=1
Par ailleurs nous avons en vertu de (19)
k
ajO al al afa
ax i == ax i + L.J au a ax i '
a=1
k
afo _ al + -.!L at "
avj - au h + j dua av j ,
a=1
i=1, ..., n,
(22)
j==1, ..., n-k.
(23)
"Le système d'équations pour les inconnues auxiliaires est donc de la
forme (voir théorème 6) :
d'i'o - 0
dt - ,
k
k
(24)
d: i = - ( :i + :a : ) o - : a.
a=1 a=1
De la condition de maximum (théorème 6) on a presque partout sur
l'intervalle t o t t f (voir (23)):
k
. QJt ('\1' (t), x (t), t, v (t))( == ) ( a f . + !.L af ) 'Po +
âvJ 8u h +3 L.J au a av
a=1
h
aja
+ ----:- 'Pa + 'Pk+ j == 0, j == 1, ..., n - k. ( 25 )
avJ
a=1
Introduisons les notations
dx i e.
. 1
dt == x , l == , ..., n,
( "' dx · )
c.-a-d. dt ==x ,
aj af af af
au i == a;i ' au h + j == ah+j ,
aji
i == 1, ..., k,
ôji
av j
(26)
ah+j
j==1, ..., n-k.
])e plus, pour i == 1, . . ., k, on a (voir (18))
acpi _ 1 k
. -UJ' j ,
fJx j
Ô(pi
a.;.h+j
afi
a;k+j
1jn-k.
1
(
t'
.:
k'
/'
(27)
224
CALCUL DES VARIATIONS
[Ch. 5
Mettons maintenant l'expression (24) sous la forme:
t k
'i'd t ) = 'i'dto) - f [ ::i 'i'o + :: ( : '\Jo + 'i'a ) ] d'L, i = 1, ..., n.
to cx=l ax
(28)
Les égalités (25) donnent (voir (26)) :
h
( al "al cx ( al ) ) .
'" k + j (t) ( == ) - . . "'0 + LJ . . 1Po -1- )a , ] ==: 1, . · ., n - k ·
ax k t J cx= 1 ax R + J axcx
Comparant les égalités obtenues aux dernières n - k égalités (28),
nous obtenons:
h
, f . 'i'o + fa. (4- 'Po + 'i'a ) ( = )
ax h + J cx=l axR+J axCX
t h
( ==) r [ a f . 'i'o + a fa . ( 'Po + 1Pcx ) ] dL-
J âxh+J axR+J axcx
to cx=l
-1Ph+j(t O )' j==1, ..., n-k. (29)
Introduisons enfin k fonctions  i (t), i == 1, . . ., k, mesurables,
bornées sur l'intervalle t o t t f :
.
 i (t) == al (t, x (!), x (t)) 1Po + '" i (t), i == 1, ..., k, ( 30)
ax i
et mettons les expressions (28) et (29) sous la forIne:
t R
'i'd l ) = - J ( ::i 'Po + Âa : ) d'L+'i'i (to), i= 1, .. " n, (31)
to cx= 1
k t R
al 1" a/ cx J ( al "ala )
· . 1POT LJ Âa, · . (==) a k+. 1Po+ LJ Âcx a k+j X
axk+J axR+J x J x
cx=l to a=l
X dL-"'k+j(t o ), j== 1, ..., n-k. (32)
, Nous allons rnaintenant formuler et démontrer la règle des multi-
plicateurs de Lagrange.
Supposons que la courbe absolument continue (1) est une extrémale
de l'intégrale (3) pour les conditions aux limites (2) et le système (18).
Il existe alors k fonctions  i (t), t o t t f , mesurables bornées, appe-
lées multiplicateurs de Lagrange et une constante '\po 0 telles que
la fonction
h
F (t, x (t), (t)) == -1Pof (t, x (t), (t)) + Âa, (t) <pa (t, x (t), (t))
cx=l
30.J
PROBLÈME DE LAGRANGE
225
satisfasse presque partout sur l'intervalle t o t t 1
. t .
aF (t, x (t), x (t)) _ J aF (L, x (L), X (L)) d + .
. - . L C l , i == 1,
ax i 8x 1
to
aux égalités:
. . ., n,
oÙ Ci sont des constantes.
D é mon s t rat ion. Définissons les multiplicateurs  i (t),
i == 1, ..., k, à l'aide des égalités (30), et prenons pour constante '\}Jo
1a coordonnée d'indice zéro du vecteur fonction 'i' (t). Alors pour
1. i k, les égalités (27), (30) et (31) donnent
h
u = -1/'0 f. + Âa a = -'Po a!. +Âi =
f)x ax cx=1 ax ax 1
t k
= 1/'i (t) = - ( :;i 'Po + Âa ;x ) dl: + 1/'i (to) =
to cx=1
t h t
== r ( - 'Po + Âa arp ) dL + 'Pi (t o ) == r a d,; + 'Pi (t o ).
J ax 1 ax J ax
ta cx=1 ta
])e (32), il vient pour j == 1, . . ., n - k
h
.uF = -'Po .a f _ Âa rpa (=)
âxh+j axh+j ax k + j
cx=1
t k
r ( ai )' acpCX )
( == ) - J ax k + j '\po + LJ Âa axh+j d,; + 1Pk+j (t o ) ==
ta a=1
t h
= ) ( - û:';+j 1/'0 + Âa a::j ) dl: + 1/'k+j (t o ) =
ta a= 1
t
) aF
== . d,; + 1Pk+j (t o ).
axh+J
ta
La règle des multiplicateurs de Lagrange est donc démontrée.
Inégalité de Weierstrass
Soit l == (lo, l1, . . ., lh) un vecteur quelconque de dimension
.
k + 1. Donnons-nous une fonction de Weierstrass notée (t, x, x, , l)
dépendant des arguments t, x === (Xl, . . ., x n ), ; == (l, . . ., ;n),
15-01339
226
CALCUL DES VARIATIONS
[Ch. ).
= (1, . . ., n) et l = (lo, ll, . . ., lh) par la fornlule
. .
é(t, x, x, £, l)==F(l, x,, l)-F(t, x, x, l)-
n ·
_ (£a _ ;a) al? (t, :'C, x, l) ,
a=1 axa
où
k
F (t, x, ;, l) == -10/ (t, x, ) -1- lacpa (t, x, ;),
a=1
les fonctions f (t, x, ;), Cpi == i - fi (t, X, h+l, ..., n), i ==
= 1, . . ., k é tant les lnêmes que précédemnlen t.
Désignons, pour plus de commodité, les dernières n - k coordon-
nées du vecteur par yI, . . ., yn-k, les k premières coordonnées
étant toujours désignées par I, . . ., k:
== (l, ..., k, YI, ..., yn-k), V == (VI, ..., v n - k ).
Calculons lnaintenant la fonction de Weierstrass dans le cas où
x == x (t) est une extrémale du problème de Lagrange pour les équa-
tions (18), ;; = d?) , l = Â (t) = (1\10' Â 1 (t), " . ", Âh (t» (voir (30)
et les k premières coordonnées du vecteur == (l, . . ., ', yl,
. . ., yn-k) obéissent aux équations
i-fi(t, x(t), VI, ..., yn-k) = i-fi(t, x(t), V)===o, i===1, ...,If.
(33)
Des conventions précédentes il résulte que le yecteur fonction
de dimension n - k
. .
v (t) === (VI (t), ..., V n- k (t)) === (X Il + l (t), ..., X n (t) )
est une comnlande optimale correspondant à une trajectoire x (t)
du système (20). On a (voir (18), (19), (33)):
F (t, x (t), ; (t), Â (t)) == - "'of (t, x (t), ; (t)) == -'Polo (t, x (t), v (t)),
F (t, x (t), , Â (t)) === -'Pof (t, x (t), ) +
k
+ Âa(t)(a-fa(t,x(t), Y)) === -'tpot(t,x(t),)== -'PofO(t,x(t), V).
a=1
Si i == 1, . . ., k, alors (voir (30))
a. ai
-;- F (t, x (t), x (t), Â (t)) === - 'Po --;- + Â i === '-Pi (t) ;
Dxi ox i
30.]
PROBLME DE LAGRANGE
227
si i == k -t- j, j = 1, . . ., n - k, alors (cf. (19), (23), (25)):
â ·
-;- F (t, x (t), x (t), Î (t)) =
âx i
h
= - '\jJo .a f . - ( '\jJa (t) + '\jJo) fa. =
âxk+J axa axh+J
0:.=1
h
= - '\Jo af - '\Ja af = - d% ("Ii' (t), x (t), t, v (t)) + '\jJk+j (t).
auJ auJ auJ
cx=l
Par suite:
.
o (t, x (t), x (t), £, Â (t)) == -- 'i'olo (t, x (t), V) + 'Polo (t, x (t), v (t))-
k
- (fa (t, X (t), V) - fo:. (t, x (t), v (t))) 'lPa-
cx=l
n-k
- (Va - va (t)) ( '\jJk+a (t) - a:a d% ("Ii' (t), X (t), t, V (t)) ) =
a=l
== @6 ('i' (t), x (t), t, V (t)) - &6' ('\)' (t), x (t), t, V) +
n-k
+ (Va - va (t)) aa &£ ("Ii' (t), X (t), t, V (t)). (34)
cx=l
Puisque x (t) est une extrémale, l'égalité (25) est satisfaito presque
partout sur l'intervalle t o t t 1 et il s'ensuit de la condition de
]naximum pour presque tous les t
.
G (t, x (t), x (t), , Â (t)) ? 0,
(35)
ee qui exprinlo la con dit ion n é ces s air e d e Wei e r-
s t ras s: si x (t) est une extrémale dans le problème de Lagrange con-
sidéré, il existe des fonctions  i (t), i = 1, . . ., k, mesurables bornées'
et une constante positive 'l}Jo telles que soit vérifiée l'inégalité (35) pour
presque tous les t quel que soit le vecteur £ satisfaisant aux conditions
(33) .
Si donc 10 domaine U de variations des variables Vi, . . ., v r
couvre l.espace Er tout entier (ou en est un sous-ensemble ollvert),
] a règle des multiplicateurs de Lagrange et le critère de Weierstrass
découlent du principe du maximum.
Nous avons examiné ici en détail le problème variationnel
à extrémités fixes. Pour le problème à extrémités ID 0 b i les
toutes les conclusions qui sont connues en calcul des variations se
(léduisent facilement en utilisant les conditions de transversalité-
15*
228
CALCUL DES VARIATIONS
[Ch. 5
(voir 6). Discutons maintenant le lien existant entre le principE
du maximum et le critère de Weierstrass lorsque l'ensemble [J
n ' est pas 0 u ver t. P os an t
V v (t) + v
et considérant que v est un infiniment petit, nous pouvons, en
appliquant la formule de Taylor, mettre l'expression (34) (en négli-
geant les infiniment petits d'ordre supérieur) sous la forme:
n
== _ â 2 QJ6> ("" (t), x (t), t, v (t)) vel v13. (3G)
2 âvelâvB
el, 13= 1
Ce qui rend tout à fait naturelle la condition de \i\Teierstrass Ù 0
dans les points intérieurs du domaine de valeurs possibles U (car
la fonction QJt doit, en vertu du théorème 8, atteindre son maximuITL
en v v (t) et, par suite, v (t) est un point stationnaire pour cette
fonction). Toutefois, dans les points frontières, où d'une façon géné-
rale les dérivées cessent d'être nulles (i.e. au voisinage de ces
uV
points le développement de la fonction &[('i' (t), x (t), t, v (t) + v)
renferme des membres de pre mie r ordre de petitesse par rap-
port à v), la non-négativité de la fonction ù (qui est du d eux i à--
m e ordre de petitesse) cesse d'être une condition nécessaire de maxi-
malité de la fonction QJ8. En d'autres termes, d'une façon générale,
la condition de Weierstrass ù 0 n'est plus valable dans les points
lrontières de l'ensemble U.
CI-IAPITRE 6
Processus optimaux avec
contraintes sur les coordonnées
de phase
Dans le problèlne optimal traité dans les chapitres 1-3, seul le
domaine U de variation du paralnètre de commande u était limité,
tandis que le point représentatif x n'était assujetti à aucune contrain-
te et, par conséquent, son domaine de variation coïncidait avee
l'espace de phase X tout entier.
Aussi n'est-il pas exclu que lorsque le point représentatif est
transféré optimalement (au sens du chapitre 1) du point initial Xo
à un point final Xi voisin, la trajectoire x (t) s'écarte d'abord forte-
ment des points Xo et Xi et aboutisse ensuite au point Xi. Or, souvent
en pratique, non seulement ce comportement du systèlne est indé-
sirable, mais il est intolérable.
En effet, dans nombre de cas la puissance des signaux permis de
commande est amplement suffisante pour transférer le système à un
état inadmissible du point de vue de la sécurité ou de la fiabilité
du fonctionnement (par exemple, échauffement excessif du moteur,
surcharge, etc.).
Force est donc de limiter, dans certains cas, aussi bien le donlaine
U de variation du paramètre de commande que le domaine de varia-
tion du point représentatif. En d'autres termes, il est pernlis de
choisir nniqnelnent des cOlnmandes optimales pour lesquelles les
trajectoires de phase correspondantes sont situées dans un don1aine
B donné et fixé par avance dans l'espace de phase X de dimension n.
Dans ce cas, le problème optimal consiste à choisir une conl1nande
optimale telle que la trajectoire correspondante soit entièrenlent
contenue dans le domaine B et satisfasse aux conditions aux limites
données tout en minimisant une fonctionnelle donnée.
Le systènle complet de conditions nécessaires que doivent vérifier
les commandes optimales et les trajectoires correspondantes de ce
problème optimal généralisé est donné par le théorème 25 (voir
page 275) qui est le résultat essentiel du présent chapitre.
Si le domaine B est un 0 u ver t de l'espace de phase X, alors
le problème optimal ici formulé est équivalent au problème optimal
des chapitres 1 et 2 et sa solution est donnée par le principe du maxi-
111um (puisque dans la démonstration du principe du maximum nous
n'avons utilisé qu'un voisinage arbitrairement petit de la trajectoire
optimale).
230 PROCESSUS AVEC CONTRAINTES SUR LES COORDONNÉES [Ch. 6
De nouvelles difficultés se présentent dans le cas, intéressant pour
les applications, o le domaine B est un fer m é (i.e. l'adhérence
d'un ouvert dans X) et où la trajectoire optimale étudiée est partielle-
ment ou entièrenlent située sur le bord du domaine B.
Dans la suite nous supposerons que B est un fermé de X et que
son bord est une hypersurface continûment différentiable ou conti-
nûment différentiable par morceaux dans X. Nous n'allons étudier
,que les trajectoires optimales susceptibles d'être di visées en un nonl-
bre fini de portions, dont chacune soit est entièrement située sur une
portion continûment différentiable du bord du domaine B, soit
appartient (à l'exception peut-être de ses extrémités) à un noyau
ouvert du domaine B.
Les portions de trajectoire optimale situées entièrement sur une
portion continûment différentiable du bord de B satisfont aux con-
ditions nécessaires luentionnées dans le théorème 22 qui est équiva-
lent au principe du maximum. L'énoncé et la délllonstration de ce
théorème, ainsi que certaines de ses généralisations font l'objet des
g 32-35 du présent chapitre.
Les portions de trajectoire optimale qui appartiennent (à l'excep-
tion peut-être de leurs extrémités) à un noyau ouvert de B, satisfont
au principe du lnaximum dans sa forme ordinaire (chapitre 1, 2).
Enfin, toute paire de portions contiguës d'une trajectoire opti-
male, si l'une est située dans un noyau ouvert de B et l'autre sur son
bord, ou si elles sont situées toutes les deux sur des portions conti-
nûment différontiables et distinctes du bord de B, satisfait à une
certaine condition de conjugaison que nous appellerons condition
de saut (théorème 24). La démonstration de cette condition et cer-
taines de ses applications font l'objet du g 36.
31. Position du problème
Définitions fondanlentales
COlnm9 cornmandes optimales il aurait été naturel de prendre
des vecteurs fonctions u (t) continus par morceaux et définis sur un
intervalle de temps t o ::s;;; t ::s;;; t i . Cependant, les délnonstrations des
théorèlnes énoncés dans ce chapitre sont valables si l'on admet de
plus que les c 0 fi man des u (t) son t con t i n Û ln e n t
d i f f é r e n t i a b les par fi 0 r c eau x.
D'autre part, le domaine U de variation de la cOlumande adlnis-
sible ne sera plus un sous-espace arbitraire de l'espace Er' mais un
ensenlble qui admettra la structure « régulière » définie plus bas au
voisinage de chacun de ses points frontières.
Aussi dans le présent chapitre allons-nous adopter la définition
sui vante de la classe de commandes adnlissibles (ce qui est large-
.: 3 1. ]
POSITION DU PROBLÈME
231
L11ent snffisant pour toutes les applications techniques des résultats
obtenu).
C01l11ne dOJnaiue de commandes U nous prendrons un ensemble
arbitraire de l'espace Er engendré par la variable U === (u l , . . ., u/)
pt ln uni au voisinage de chaclln de ses points frontières d'une structu-
re « régulière» au sens suivant.
Si Ut E U est un point frontière arbitraire de l'ensemble U, il
existe des fonctions scalaires continûment dérivables
qi (u), i = 1, . . ., s (s 1) (1)
telles que l'enselnble U soit donné au voisinage Uj par le système
d 'inéga]i tés
qt (u) 0, '. · ., qs (u) 0,
et au point Ut par les égalités
q 1 (Ut) === · · · === q s (Ut) === 0,
les vecteurs
aqt (u 1) := O' r (} d q ( u )
au b et t t,... ,
aqs (Ut) === grad qs (Ut)
Du
(2)
étant linéairelnent indépendants.
Ainsi donc, les faces de dimension (r - 1) du donlaine U, con-
tiguës au point Ut, sont définies par les équations:
qt (u) === 0, . . ., qs (u) === 0 (3)
et sont des hypersurfaces continûment différentiables de l'espace Er'
situées, en vertu de l'indépendance des vecteurs (2), au point Ut
dans le cas général. Le point Ut, lui, est situé sur 1'« arête » de dimen-
sion (r s) continûment différentiable du bord, définie comme
l'ensenlble des solutions du système (3) proches du point Ut.
Bien que les fonctions (1) ne soient pas définies univoquement par
les conditions énumérées, il est aisé de voir que les faces de l'ensemble
TJ quelle que soit leur dimension sont univoquement définies au
voisinage du point Ut (en particulier, l' « arête » de dimension (r - s)
(3) et par conséquent le nombre s).
Les principaux théorèmes de ce chapitre restent naturellement
invariants par rapport au choix des fonctions (1) pour le point
frontière Ut considéré. Cependant, ce choix influe considérablement
snI' certaines constructions dans la démonstration des théorèmes, d'où
une grande complication de l'exposé. Aussi, pour éviter cet arbi-
traire, allons-nous fixer pour chaque point frontière Ut E U un des
systènles possibles de fonctions (1) et dans la suite nous parlerons des
fonctions (1) pour le point Ut étant entendu que ces fonctions repré-
sentent le système en question.
On appellera classe de commandes admissibles l'ensemble de tous
les vecteurs fonctions u (t) === (u l (t), . . ., 11/ (t)) continus par
232 PROCESSUS AVEC CONTRAINTES SUR LES COORDONNÉES [Ch. 6
morceaux et continûment différentiables par morceaux (à discontinuité
du premier ordre) et définis sur un intervalle arbitraire t o t t f
(un pour chaque fonction) et à valeurs dans le domaine U. Si à
l'instant t' la commande subit une discontinuité alors l'enscJnble
U doit contenir les deux points u (t' - 0) et u (t' + 0).
Comme dans le chapitre 1, à l'instant de discontinuité, nous
prendrons la limite à g a u che pour la commande optinlale et
sa dérivée.
Soit dans l'espace de phase X de dinlension n engendré par la
variable x == (Xl, . . ., x n ) un fermé B de bord continûment diffé-
rentiable, défini au voisinage de son bord par l'inégalité
g (x) == g (Xl, . . ., x n ) 0,
où g (x) est une fonction scalaire définie et admettant des dérivées
partielles du deuxième ordre continues au voisinage de la froutière
g (x) == 0, le vecteur
Qg (x) ( âg âg )
QX === grad g (x) == âxl '...' QX n
étant non nul en tout point du bord.
Donc le bord du domaine B est une hypersurface de l'espace X
de courbure continue. Le cas, important pour les applications, où
le domaine B admet un bord continûment différentiable par lllorceaux't
est examiné plus bas (voir page 275).
Enoncé du problème
Soient les fonctions scalaires réelles fO (x, u), fi (x, u), i == 1,
., n, continues et continûment différentiables par rapport à
l'ensemble des coordonnées des vecteurs x et u, sur le produit
direct B* X U*::) B X U, où B* et U* sont des ouverts de X et
Er' contenant respectivement B et U.
Comme au chapitre 1, l'équation du lnouvement du point repré-
sentatif est de la forme
dx
dl == f (x, u),
(4)
où
f (x, u) == (f1 (x, u), . . ., fn (x, u)).
Soit le problème suivant. Etant donnés dans l'espace X deux
points Xo et Xi appartenant au fermé B, parmi toutes les cOlnmandes
admissibles transférant le point représentatif de Xo en Xi de telle
sorte que la trajectoire de phase correspondante x (t) soit entière-
ment contenue dans le fermé B, on demande de trouver celle notée
u (t), t o t t i , qui minilnise la fonctionnelle
il
) fO (x (t), u (t)) dt.
to
31.]
POSITION DU PROBLÈME
233
En vue d'énoncer notre problème optimal (cf. page 16) sous une-
autre forme (équivalente), introduisons l'espace X de dinlension
n + 1 engendré par la variable
X - ( ° 1 n ) _ ( ° )
- x, x , . . ., x - x, x ,
où
x == (Xl, . . ., X n ) EX.
'route fonction F (x) vectorielle Oll scalaire de la variable x E X
peut, de toute évidence, être considérée comme une fonction de l'ar-
gument x == (XO, x) EX, si l'on pose
F (x) == F (XO, x) == F (x) ;
nous utiliserons constamment cette circonstance dans la suite.
Comme dans le chapitre 1, introduisons le vecteur
j" (x, u) == f (x, u) == (1° (x, u), Il (x, u), . . ., III (x, u)) =
== (1° (x, u), f (x, u))
Reillarquons que la fonction j (x, u) ne dépend pas de la coordon-
née xo.
Désignons par G le produit direct du fermé B par l'axe xo. Le-
dOlllaine G tout comille le domaine B est défini au voisinage de son
bord par l'inégalité
g (x) == g (XO, x) == g (x) o.
Elle adillet un bord de dimension n continûment différentiable'
g (x) == 0
à courbure continue, le vecteur
âg (x) ( 8g âg âg )
âx == grad g (x) == iJxO ' âxl '...' âx n ==
= (0, :;1 ' ..., an ) = (0, grad g (x))
ne s'annulant en aucun point du bord du domaine G.
Soit dans l'espace X l'équation
dx
dt=!(x, u),
(5)
qUI résulte de l'équation (4) et la relation
dxO 0
([t==1 (x, u).
Ces notations introduites, énonçons notre problènle optinlal sous.
une forme équivalente. On demande de choisir une commande ad-
missible u (t), t o t t 1 , de telle sorte que l'extrémité x (t 1 ) de la
trajectoire correspondante x (t) de l'équation (5) qui satisfait à la
234
PROCESSUS AYEC CONTRAINTES SUR LES COORDONNÉES
lCh. ()
condition initiale
x (t O ) == (0, xo)
soit située sur une droite IIe X passant par le point (0, Xi) et parallè-
le à l'axe xo, et aussi que la trajectoire x (t), t o t t 1 , soit entière-
lnent contenue dans le ferlné G, la coordonnée XO (t 1 ) prenant sa
valeur nlinimale.
Dans la suite nous utiliserons de préférence la seconde fornlula-
tion du problènle.
Les cOlnmandes et les trajectoires satisfaisant à toutes ces condi-
tions seront appelées optimales.
Reillarques
Dans le chapitre 1, nous avons qualifié les cOllllllandes continues
par morceaux de « commandes sans inertie » puisque en cas de besoin
lIne telle commande peut instantanément sauter d'une valeur à une
autre. Cependant, dans de nombreux cas les « gouvernails » possè-
dent une certaine inertie et par conséquent parmi les fonctions
u l (t), . . ., ur (t) il Y en aura (peut-être même toutes) qui seront
continues avec leurs dérivées jusqu'à un certain ordre.
Les problèmes optimaux à commandes inertielles se ramènent
aisénlent au problème optimal énoncé plus haut. Soient, par exemple,
des cOllllnandes admissibles continues et continûment dérivables dont
les dérivées sont limitées en module par lIne même constante, disons
l'unité, et supposons que le domaine de comlnande U est un fermé
de bord continûment différentiable. Pour plus de simplicité, suppo-
sons que le domaine de variation du point représentatif x coïncide
avec l'espace X tout entier.
Prenons le paramètre u pour variable de phase et la dérivée
de u pour paramètre de comillande. L'équation du mouvelllent (4)
est alors remplacée dans l'espace de phase X de dimension Il par
le système:
dx
([t==t(x, u)
du
([t== v
,dans l'espace de phase X X Er de dimension n -1- r, où v == (VI,
. . ., ur) est une commande continue par morceaux (sans inertie) dont
le domaine de définition est un cube unitaire r-dimensionnel
1 Vi 1 1, i == 1, . . ., r,
le point représentatif (x, u) parcourant le produit direct X X U.
Soulignons encore que le principe du nlaximum est valable pour
les trajectoires optÎ111ales qui sont situées à l'i TI t é rie 11 r
. 32.J
TRAJECTOIRES OPTIMALES SITUÉES SUR LE BORD
235
d'u n n 0 y a u 0 u ver t de G à l'exception des extrémités qui
son t si tuées sur le bord de ce dOlllaine.
Supposons que les extrémités x (t o ) et x (t 1 ) de la trajectoire opti-
Inale (t), t o t t 1 , sont situées sur le bord g (x) == O. Alors, la
portion de trajectoire définie pour t o + 't t t 1 - 't, 'L > O
est entièrement contenue dans un noyau ouvert du domaine G et par
suite il existe une fonction 'PL (t), t o + 't t t 1 - 'ta satisfaisant
aux conditions du principe du maxilllum (théorème 1) sur la portion
; (t) correspondant à t o + 'L t t 1 - 'L. On peut considérer que
le vecteur 'PL (t o + 't) admet l'unité pour longueur.
Une boule unitaire de tout espace vectoriel de dilnension fini
étant co 111 pacte, on peut choisir une suite de nombres positifs 'Ll,
T 2' . . ., 'tb . . ., convergeant vers 0 telle que la suite des vecteurs
'1''(. (t o + 'Li), i == 1, 2, . . ., admette 'Po pour limite. Il est évident
l
que la fonction 'P (t), t o t t 1 , correspondant à la trajectoire
x (t) et satisfaisant à la condition initiale 'P (t o ) == 'Po entre t o et t 1 ,
est la liulite des fonctions,!,,,. (t), i==1, 2, ...; c'est donc la fonc-
l
tion cherchée.
32. Trajectoires optimales situées sur le bord
du domaine
Le théorèllle 22 qui est formulé dans ce paragraphe fournit un
systènle complet de conditions nécessaires que doit satisfaire toute
trajectoire optimale régulière située entièrement sur le bord continÜ-
lllent différentiable g (x) == 0 du domaine G.
La nécessité de se limiter aux trajectoires régulières qui seront
définies plus bas résulte non pas de l'insuffisance de la méthode de
démonstration du théorème 22, mais du fond du problèllle. En effet,
lorsqu'on déduit les conditions nécessaires auxquelles doit satisfaire
une trajectoire optimale, il faut comparer cette dernière aux autres
trajectoires optimales satisfaisant aux mêmes conditions aux limites,
i.e. inclure (au llloyen d'une méthode de variations dÜment choisie)
cotte trajectoire optimale dans une famille « suffisamment riche »
de trajectoires voisines contenues dans G. Il n'est guère difficile de
citer un exemple de trajectoire optimale située sur le bord de G
dont t 0 u t e variation déborde le domaine G et pour laquelle le
théorènle 22 ne soit pas vrai.
Ce t te circonstance exceptionnelle n'a pas lieu si la trajec toire
étudiée est régulière. Plus exacte;ment, on démontrera ici que par
des variations adéquates de la commande, toute trajectoire optimale
peut être incluse dans une famille suffisamment riche de trajectoires
si tuées clans le ferlué G.
236 PROCESSUS AVEC CONTRAINTES SUR LES COORDONNÉES [Ch. 6
Définitions fondamentales
Posons
n
1
p(x, u)== ag(x) ja(x, u)=
L.J axa
a=O
n
== ag (x) fa ( X, U ) === ( ag (x) ,j"(x, u) ) ,
L.J axa ax } ( G )
a=l
a p u) = ( ::0 ' : ' ..., ::n ) = ( 0, : ' ..., ::'1 ) ,
ap (x, u) _ ( .!L )
au -- au I '...' au r ·
Pour que la trajectoire x (t), t o t t 17 de l'équation (5) corres-
pondant à la commande u (t) soit entièrement située sur le bord
g (x) = 0, il est de toute évidence nécessaire et suffisant que soient
vérifiées les égali tés
g (x (t o )) = 0, P (x (t), u (t)) == 0, t o t t 1 ,
dont la première affirme que le point de départ de la trajeetoire
appartient au bord du domaine G, la seconde, que la vitesse de phase
du point représentatif qui se déplace sur la trajectoire est à tout
instant tangente au bord.
Un point x E X sera appelé régulier relativement au point Ut E [J
SI sont renlplies les conditions suivantes:
1) p (x, Ut) === 0;
2 ) ap (x, u1) =f= O.
au '
3) si Ut est un point frontière de l'ensemble U et qi (u), i ==
= 1, . . ., s, sont les fonctions (1) pour le poin t Ut, alors les vec t enrs
ap (x, Ut) aq! (Ut) aqs (Ut)
au au' . · ., Du,
(7)
sont linéairement indépendants.
Examinons le sens géométrique de la condition 3).
Tout d'abord, il est clair que la con di tion 2) peut être considérée
comme un cas particulier de la condition 3) en faisant dans cettE
dernière s === 0, lorsque U1 est un point intérieur à l'ensen1ble u.
Ce que d'ailleurs nous admettrons dans la sui te.
Les vecteurs (7) étant indépendants, il s'ensuit que 1'« arête » (3)
continûmeHt différentiable de dilnension r--s du bord de U est situéü
dans le cas général au point U1 avec une hypersurface de dilnension
r-1 définie au voisinage de ce point par l'équation p (x, u):=-= O. Doue
32.]
TRAJECTOIRES OPTIMALES SITUÉES SUR LE BORD
237
s r - 1; en d'autres termes, Ut ne peut être un sommet du bord
de U en lequel concourent r faces distinctes de dimension r - 1.
Soulignons encore le fait évident que la notion de régularité
du point x relativement à Ut ne dépend pas du choix des fonctions (1)
définies pour le point Ut.
Désignons par û) (x) l'ensemble des points U E U relativement
auxquels le point x est régulier. L'ensemble û) (x) c U peut bien
entendu être vide.
Nous dirons que la trajectoire x (t), to ttb de l'équation (5)
correspondant à la cOlnmande U (t) et entièrement située sur le bord
de G est régulière si U (t) E û) (x (t)) en chaque point t de continuité
de la cornmande u (t) et si
u (t - O).E û) (x (t)), U (t + 0) E û) (x (t)),
lorsque t est un point de discontinuité de la commande u (t).
Définissons pour les points x situés sur le bord de G et tels que
û) (x) =1= <p, la grandeur m ('l', x) au moyen de l'égalité
m ('l', x) == sup Jïli( 'l', x, u),
ltE(ù (x)
"
ou, COJllme auparavant,
n
OJC ('l', x, u) == 2i 'l'a fa (x, u) == ('1', f(x, u)).
a=O
Si le point x est lIn point régulier du bord g (x) == 0 relativement
.au point u E U, et si pour un certain vecteur", on a
QJ8 ('1', x, u) == m ("i', x),
alors, d'après la règle des multiplicateurs de Lagrange, il existe des
nombres réels À, "t, . . ., v s tels que
s
8QfO ('\l', x, u) == Â 8p (x, u) + v 8qa (u)
8u au..w ex ôu '
ex=1
(8)
où qi (u), i == 1, . . ., s, sont les fonctions (1) définies pour le point u,
et le vecteur a;: est défini par la formule
8Q1t ( 8Qfe 80J0 )
-au == 8u I '... , 8u T ·
Introduisons les notations suivantes:
8QJe ('\l', x, u) _ ( 8Q1t 80J0 8QJe ) _ ( 0 aQJO
8x - 8x O ' 8xI'...' ax n - , 8x I ' ...,
aQJe ('\(?, x, u) _ ( 80J0 8QJO 8QJO ) - f( )
8'\(? - a,po' a,p 1 ' ..., iJtpn - x, u ·
8QJO )
8x n ,
238
PROCESSUS A VEC CO'TRAINTES SUR LES COORDONNÉES
[Ch. ().
âQff ( 'th X U ) iJ I ') ( X U ) ,
Observons q ue les vecteurs - 't" , , ne de p endent
âu ' iJu
pas du choix des fonctions qi (u), i == 1, . . ., s. D'autre part, le
s
"1 âqa (u) 1 .. d ()Qff l
vecteur L.J Va âu est a prOjectIon u vecteur iJu sur un p an
a=l
tangen t à l'arête (3) de dimension r - s, sens qui est égalelnen t
invariant par rapport au choix des fonctions qi (u). Le facteur Î
de la formule (8) ne dépend donc pas du choix des fonctions qi (u).
Si u est un point intérieur à l'ensemble U, i.e. s == 0, alors il
résulte de (8) que les vecteurs o, , op x, u) sont colinéaires.
(jU u
Thé 0 r è fi e 22. Soit x (t), t o t t 1 , une trajectoire o]Jtima-
le régulière de l'équation (5) entièrement située sur le bord de G et cor-
respondant à une commande optimale u (t). Il existe alors un vecteur
jonction", (t) == ('Po (t), . . ., 'Pn (t)), to t t 1 , continu et une-
jonction scalaire À (t), t 0 t t 1 , continue par morceaux et conti-
nûment dérivable par morceaux tels que sur l'intervalle t o t i 1
soient vérifiées les égalités (9), (10), (11) et les conditions a), b), c)
suivantes:
dx == â QlfJ ('i', x, u) == J . ( )
dt â'i' - x, u ,
d1J' = _ f)&e ('\l', x, u) + Â ( t) âp (x, u)
dt 8x 8x '
8[('i'(t), x(t), u(t))==m('i' (t), x(t))==O,
(8)
(10)
(1 t)
où À (t) est définie à partir de la condition de nlaximum (11) comlne
un multiplicateur de Lagrange du vecteur op :' u) dans la formule (8) ;
a) la coordonnée 'Po (t) == const 0 ;
b) le vecteur '1' (t o ) est non nul et tangent en x (t o ) au bord g (;) ==
== 0;
c) en tous les points de dérivabilité de la jonction  (t) le vecteur
d ( t )
dt grad g (x (t))
soit est orienté vers l' intérieur du domaine G, soit est nul ( Le. d?) 0 ) .
Faisons quelques remarques importantes pour expliquer le sens
des conditions a), b)' et c).
Rem a r que 1. L'égalité 'Po (t) == const résulte de ce que le
second membre de l'équation (10) n'est pas fonction de la coor-
donnée x O .
Les équations (9), (10), (11) et la condition a) sont analogues au
principe du maximum. Les conditions b) et c), propres au cas étudié,
feront l'objet des remarques 4 et 5.
32.1
TRAJECTOIRES OPTIMALES SITUÉES SUR LE BORD
239
Rem a r que 2. De la condition de maximum il découle
immédiatement que l'intervalle t o t t 1 peut être subdivisé par
les points t o == 'to < 'tl < · . . < 'th < 'tk+l == t 1 de telle sorte que
sur l'intervalle Li t 'ti+l, i == 0, 1, .. ., k, soit vérifiée l' éga-
lité
".. S (i)
acïC ('\1' (t), x (t), u (t)) = À ( t ) ap (œ (t), u (t)) l "" v(i) ( t ) aqa (u (t)
au au -r-.LJ a au'
a=l
où q1i) , . . ., qi), S 0, sont les fonctions (1) définies pour le point.
U (Li + 0) et vi) (t), . . ., vi) (t) des fonctions arbitraires.
Cette égalité est équivalente sur l'intervalle considéré à un systè-
me de r équations linéaires en À, vii), . . ., v1 i ) (8 + 1 r) à coeffi-
cients continus par 1110rCeaux, continûment dérivables par morceaux
et à termes libres, dont la nlatrice est de rang 8 + 1. La fonction
À (t) peut donc sur l'intervalle t o t t 1 tout entier être mise
sous la forme
n
 (t) == ); )a (/) a CG (t) == ('i' (t), ft (t)). (12)
CG=o
où a (t) == (aO (t), . . ., an (t)) est un vecteur fonclion continu par
1110rceaux et continûment dérivable par morceaux.
Rem a r que 3. Jes équations (9), (10), (11) se transforment
en identité si 'i' (t) == 0, À == 0, t o t t 1 .
Nlontrons que si '" (t o ) =1= 0, alors", (t) =1= 0, t o t t 1 , et in-
versement, de 'i' (t o ) == 0, il résulte que '" (t) == 0, t o t t 1 .
En effet, en portant l'expression (12) dans l'équation (10), nous
obtenons une équation différentielle ordinaire, linéaire et homogène
en '\ (t) qui vérifie le théorème d'unicité, d'où notre assertion.
Rem a r que 4. Pour expliquer le sens de la condition b),
remarquons que le système (9), (10), (11) admet toujours, outre les
solutions u (t), x (t), 'i' (t) == 0 et À (t) == 0, encore une solution
tri viale qui est
u (t), x (t), '\ (t) == v gr ad g (x (t)), À (t) == v,
où v est un nombre arbi traire. Ce qu'on constate aussitôt après
substi tution.
Il est également aisé de vérifier que si
u (t), x (t), '" (t), À (t) (13)
est solution du système (9), (10), (11), alors
u (t), x (t), 'i' (t) + v grad g (x (t)), À (t) + v,
est solution où v est un nombre arbitraire.
En ajoutant donc aux fonctions", (t), À (t) figurant dans la solu-
tion (13) des menlbres de la forme v grad g (x (t)), v, nous pouvons
240
PROCESSUS AVEC CONTRAINTES sun LES COORDONNÉES
[ Ch . 6
toujours faire en sorte que la valeur initiale 'i' (t o ) + v grad g (x (t o ))
soit contenue par un plan tangent en x (t o ) au bord g (x) === o.
Si cette valeur initiale est nulle, alors la solution initiale est
triviale, puisqu'en vertu de la renlarque (3) on peut affirmer que
'i' (t) === -v grad g (x (t)), Â (t) == -v.
La non-trivialité des solutions du systènle (9), (10), (11) découle
donc de la condition b).
De ce qui précède, il s'ensuit que la condition b) est équivalente
à la condition de non-colinéarité des vecteurs '1' (t o ) et grad g (x (t o )).
Rem a r que 5. La condition c) résulte du fait que lorsqu'elle
varie, la trajectoire x (t) est comparée non seulenlenl aux trajectoires
voisines qui sont situées avec elle sur le bord g (;) === 0, mais aussi
à toutes les trajectoires proches contenues dans le donlaine fer-
mé G.
La démonstration du théorème 22 est donnée dans les deux para-
graphes qui suivent.
33. Démonstration du théorème 22
(constructions fondamentales)
Notations
Introduisons la notation
al _ ( aj'i )
au - auj , i === 0, 1, ..., n, j === 1, ..., r,
et considérons cette nlatrice comme un opérateur de l'espace .E r
engendré par les vecteurs Il === (u l , . . ., ur) dans l'espace .LY engendré
par les vecteurs x === (X O , Xl, . . ., x n ) et simultanément comme un
opérateur de l'espace engendré par les vecteurs '1' === (rtpo, · · ., 'Pn)
dans l'espace Er:
r r
ar al ( afo
u === --ex ua === ---a ua, ...,
vU au au
a=l a=1
r
'Ç1 a )
L.J aU'
au
a=l
n n
al (x, u) ,,1"1 === ( 'Ç1 a fa '1 h 'Ç1 a ta '1 h ) _ a éfO ('1', x, u)
au 't' L.J au l 'fa, .. ., L.J aur 'fa - au ·
a=O a=O
Soit A === (Âo, . . ., Â n ) un vecteur de X. Les matrices
A a p ':' u) = ( p} a p (œ., u) ) , i, j === 0, 1, ..., n,
x ax J
A a p x, u) = ( ÎI} a p (œ: U» ) , i === 0, 1, ..., n, j =-= 1, ..., r,
u au J
33.]
DÉMONSTRATION DU THÉORÈME 22
241
seront également considérées comme des opérateurs agissant sur les
vecteurs 'tJ', X, u comme suit:
n
A a p 1'11'1 = ap ( A 111'1 ) ===!!.l!... Â,a'lh
ax 'Y ôx ' 'Y ôx LJ 't'a,
a=O
)
n
A a p x === A ( a p X ) === A a P xa l
ax ax ' LJ axa ' f
<x=o
(14)
r
A ap u==A ( fJp U ) ===A .!Lua.
âu au ' L..l au<x J
a=l
Dans ce paragraphe x (t), t o t t 1 , est une trajectoire régulière
quelconque de l'équation (5), correspondant à la commande u (t)
et située sur le bord g (x) === 0 du domaine G. Dans le 34 nous
supposerons en outre que u (t) et x (t) sont optimales.
Con s t r u c t ion deI a f 0 net ion R (x, u, f-t)
Construisons maintenant la fonction scalaire R (x, u, p.) qui
jouera un rôle fondamental dans la démonstration du théorème 22.
Fixons 8 points Î1 i === 1, . . ., 8 (8)0), sur la trajectoire x (t)
tels qu'aucun d'entre eux ne soit confondu avec l'extrémité x (t 1 )
de la trajectoire x (t); les égalités i = x (t o ) et i = j étant
possibles pour i =1= j.
Désignons par Ni un vecteur non tangent en i au bord g (x) = 0
et orienté vers l'extérieur du domaine G; pour le reste le vecteur Ni
est arbitraire. Le domaine G étant défini au voisinage de son bord
par l'inégalité g (x) 0, on a
(grad g (i)' Ni) > O.
Soit O. un voisinage suffisamment petit du point i dans X,
z
tel que son adhérence ne contienne aucun point x (t 1 ); l'unique
condition supplémentaire à laquelle doit satisfaire le voisinage O.
z
est que pour i =1= x (t o ) son adhérence ne renferme pas non plus le
point x (t o ). La «petitesse » de ce voisinage implique que le produit
scalaire
( ag (x) )
ax ' Ni> C > 0
(15)
pour x E O., i === 1, . . ., s.
l
Désignons par ai (x) une fonction scalaire continue et dérivable,
satisfaisant aux conditions ai (x) === 1 dans un certain voisinage du
point i contenu dans O. ,ai (x) > 0 pour x E O., et ai (x) === 0
l l
si x E O..
l
16-01339
242
PROCESSUS AVEC COTRAINTES SUR LES COORDONNÉES
[Ch. t>
Soit la fonction scalaire
s
h (x, t) == g (x + f-t aa (x) 1a),
a=1
(16)
où f-t est un paramètre scalaire. La fonction h (x, f-t) dépend, de toute
évidence, du choix des éléments ai (x) et Ni qui ont participé à sa
construction.
Si f-t 0 est suffisamment petit et si le point x qui est situé à
proximité du bord du domaine G, vérifie l'équation
h (x, f-t) == 0,
alors x E G; si, en outre, x n'appartient pas à la réunion des voisina-
ges Oi ou si f-t = 0, alors x est situé sur le bord g (x) == O. Si x
n'appartient pas à la réunion des voisinages O., i == 1, . . ., S,
l
ou si f-t = 0, alors h (x, f-t) == g (x) == 0 et l'assertion est vraie.
Supposons que x E O.. Alors
l
s
h (x, /--t) = g ( x + /--t aa (x) Na) =
a=1
s
= g (x) + Il. ( ag ax (x) , (X) ",l ) + ( ) 0
r .L.J aa ..J... T a 0 t = .
a=1
Or pour f-t suffisamment petit, on a, en vertu de (15),
s
( 8g (x)
I-t ax'
aa (x) Na ) + 0 (/--t) > 0,
a=1
et, par conséquent, g (x) < o.
Dans la suite le paramètre f-t prendra des valeurs proches de zéro
de la forme ëÔf1, où ë a le même sens que dans le chapitre 2 et ô!-1
est un nombre non négatif. Dans la définition de la fonction
h (x, eÔf-t) figurent les points i' . . ., s, les fonctions a1 (x), . . .
. . ., as (x), les vecteurs 1'7 1 , . . ., Ts et le nOlnbre ôf1. Désignons
l'ensemble de ces grandeurs par le symbole
o = {i' ai (x), Ni' Ôf-t}.
(17)
Pour indiquer que la fonction h (x, ëÔf-t) dépend de ces grandeurs,
nous la désignerons dorénavant par hfJ (x, ëÔf-t). Soient Di et v 2 deux
symboles de la forme (17); écrivons-les sous la forme:
01 = {b ai (x), Ni, Ôf1}, i = 1, . . ., S1,
b 2 = {h ai (x), Ni' Ôf-t}, i = S1 + 1, · · ., S1 + S2.
33.J
DÉMONSTRATION DU THÉORÈl\IE 22
243
Le symbole v === {h ai (x), T h ô}, i == 1, . . .. Si -t- S2' sera appelé
somme des symboles Vi et V z et noté
v == Vi + v z .
Le produit du symbole V ={h ai (x), Th ô} par un nombre
arbitraire non n é g a tif  sera défini à l'aide de la formule
Ào =={h ai (x), N h ÀÔ},
i.e. les points h les fonctions ai (x) et les vecteurs -ri ne changent
pas tandis que le nombre ô est multiplié par Â.
Si donc v' et '6" sont deux symboles de la forme (17) et Â' et Â"
deux nombres arbitraires non négatifs, alors est défini le syn1bole
)}v' + À"v".
Définissons la fonction R (x, u, êÔ), qui dépend du choix du
symbole (17) , au moyen de l' égali té
n
R ( 5::. ) _ ah (x, ëÔp,) f a ( ) _ ( ah (x, ëÔl) f( )) (18)
x, Li, êu L - x, u - a ' x, u
axa x
CG=o
(Le. R (x, u, /OÔ!!) est la dérivée dh (x à /l)f1) en vertu de l'équation (5».
De (16) il vient, pour ô = 0,
( 8g (x). )
R (x, u, 0) == 8x ' J (x, u) == p (x, u).
(19)
Pour souligner que la fonction R (x, u, êÔ) dépend du choix
du symbole (17), nous la désignerons aussi par Rb:
8h b (x, êÔl) "
RfJ (x, u, /OÔ!!) = ( 8x ' f (x, u) ) · (20)
Supposons que les fonctions v (t) et 1/ (t), t o t t 1 , où v (t)
est une commande admissible et 1/ (t) une fonction continue (pas.
forcément contenue dans le domaine G), satisfassent pour certains B
üt ô au système
dU j " ( )
dt = !l, v , }
R (y, v, êÔ) === o.
(21)
Dans la suite, lorsqu'il sera question des solutions v (t) et 1/ (t)
de ce système, nous supposerons toujours que v (t) est une commande
admissible et '// (t) une fonction continue. 1
Si '1/ (t) est suffisamment proche de x (t) et si h (1/ (t o ), êÔ) == 0,.
alors 1/ (t) E G quel que soi t t puisque ,
d
di h (y (t), êÔ) = R (y (t), v (t), êÔL) == 0
16*-
244
PROCESSUS AVEC CON'rRAIN'rES SUR LES COORDONNÉES
[Ch. 6
-et par conséquent
h (1/ (t), ëÔ) == h (!I (t o ), ëÔ) === o.
La commande u (t) et la trajectoire x (t) vérifient le système (21)
pour ô = o.
Plus bas nous décrirons une méthode qui nous permet, par la
donnée d'un point initial de la forme
y (8) == c (8) + ëÔXa + 0 (ë), t o 8 t i , (22)
Ide construire une solution v (t), y (t), 8 t t i , du système (21)
de la forme
v (t) == u (t) + ëÔU (t) + 0 (ë),
Y (t) == x (t) + ëÔX (t) + 0 (ë),
(23)
(24)
où ôu (t) est une fonction continue par morceaux et continÎlment
dérivable par morceaux et ôx (t) une fonction continue. .
Comme no'us l'avons vu plus haut, si la valeur initiale (22) est
solution de l'équation h (y (8), ëÔl1) === 0, alors la trajectoire 1/ (t),
8 t t 1 , est contenue toute entière dans le fermé G. Les portions
de trajectoire qui n'appartiennent pas à la réunion des voisinages
Oi qui ont participé à la définition de la fonction h (11, ëÔl1) sont
situées sur le bord g (x) === 0; si, au contraire, 1/ (t) E O., alors 11 (t)
l
.appartient à un noyau ouvert du domaine G.
Il importe, en conclusion, de souligner que la formule (21) définit
non pas un, mais toute une famille de systèmes en fonction du choix
,des symboles b (voir (17)).
Rés 0 1 u t ion dus y s t è ID e (21) par 1 a d 0 Il née
d'u n e val e uri nit i ale dei a for n1 e (22)
Subdivisons l'intervalle t o t t i en intervalles partiels Li
t 'T i+ 1, i === 0, 1, . . ., k, de longueur suffisamment petite où
t o === LO < Li < · · · < Lh < Lk+l === tl-
Choisissons les points Li de telle sorte qu'ils con tiennen t tous les
points de discontinuité de la commande et de sa dérivée. La (< peti-
tesse )} des intervalles partiels est caractérisée par la condition de
validité de toutes les constructions décrites plus bas. Il découlera
immédiatement de la régularité de la trajectoire x (t) que le choix
des points de subdivision (qui bien sûr n'est pas unique) est possible.
Supposons que la solution v (t), 1/ (t) du système (21) qui peut se
représenter sous les formes (23), (24) et qui satisfait à la condition
initiale (22), a déjà été construite sur l'intervalle 8 t Li. Pro-
longeons cette solution jusqu'au point Li+1 incl us en conservant la
33.
DÉMONSTRATION DU THÉOREl\IE 22
245
eontinuité de la trajectoire '11 (t) et les propriétés exprimées par les
égali tés (23), (24).
Soient qi (u), i == 1, . . ., s (s 0), les fonctions (1) définies pour
le point u ("Ci + 0). De (19) et de la régularité de la trajectoire x (t),
il résulte que les vecteurs
aR (œ (Li)' u (Li +0), EÔl)
au
ôq1(U(Li+0))
ôu
. . . ,
aqs (u (Ti + 0))
au
sont linéairement indépendants. Les intervalles Ti t Ti+l étant
petits, les vecteurs
aR (œ (t), u (t), EÔJ.!)
au
aq! (u(t»
au
. . . ,
aqs(u(t))
ôu
sont aussi linéairement indépendants sur l'intervalle Li < t 'Li+l.
Supposons, par exemple,
ôR ôQl ôQs
au l âu l au l
::F O.
(25)
ôR aQ1 ôqs
ôu s + l ôu s + l au s + l
Au VOIsInage des valeurs 'fi' u (Ti + 0), x ('Li), ëÔ = 0, le-
système d'équations
R (y, V, EÔ) == 0'1 (v, t) = . . . = O's (v, t) = 0, (26)
où O'i (v, t) == qi (v) - qi (u (t», i == 1, . . ., s, admet donc une
solution univoque par rapport aux s+ 1 variables Vi, . . ., v S + 1 :
. . ( S+2 r ,fi.:. ) · 1 1 27 )
v7. === 117. y, v ,..., v , Eull, t, "t === , ..., s +, (
où l1 i , i == 1, . . ., s + 1, sont des fonctions continûment dérivables
par rapport à leurs arguments.
En remplaçant dans (27) V S + 2 , . . ., v r respectivement par
U S + 2 (t), . . ., ur (t), nous obtenons s + 1 fonctions t}i (y, ëÔt, t),
i = 1, . . ., s + 1. Définissons maintenant le vecteur fonction
v (1/, BÔ, t) au moyen de l'égalité
v (y, ëÔ, t}=== (t}1 (!/, ëôll, t), ..., t}S+l (y, ëa, t), u S + 2 (t), ..., ur (t»).
(28)
Portons, enfin, l'expression (28) de v dans l'équation
dy j " ( )
([t== y,v.
Si désormais on résout cette équation différentielle sur l'intervalle
Li t Li+l, mais avec les conditions initiales 1/ (Li), on obtient
le prolongement de la solution. y (t).
246
PROCESSUS AVEC CONTRAINTES SUR LES COORDONNÉES
[Ch. 6
Le prolongement de la comnlande v (t) sur l'intervalle 'Ti < t
'Ti+l est la fonction
v (t) == v (y (t), ëÔ Il, t), 'T i < t 'T i +b
(29)
.qui s'obtient en relnplaçant dans (28) 'u par le prolongelnent I!/ (t),
Li < t 'Ti+l.
Les propriétés exprimées par les égalités (23) et (24) sont immé-
diates pour les prolongements obtenus. L'admissibilité de la com-
mande (29) découle des égalités (26). En effet, quel que soit i == 1, . . .
. . ., s, on a
cr i (v (t), t) == q i (v (t)) - q i (u (t)) == 0,
1.e.
qi (v (t)) == qi (u (t)) 0, 'Ti < t <- 'Ti+1.
Rem a r que. La construction décrite plus haut définit la
solution du système (21) par la donnée de la condition initiale (22)
d'une manière non univoque puisque le choix des points de subdivi-
sion Li, i == 1, . . ., k de même d'ailleurs que celui des s + 1
variables Vi par rapport auxquelles est résolu le système (26) n'est
pas llnivoque.
Toutefois, il est aisé de voir qu'il est possible de lever cette non-
univocité en fixant pour une commande donnée u (t) et une trajectoire
régulière x (t), t o t t 1 aussi bien les points de subdivision Li
que les s + 1 variables (pour chaque intervalle 'Ti t Li+1) par
rapport auxquelles est résolu le système (26). Ensuite, la solution
v (t), y (t) du système (21) peut être construite par la méthode stan-
dard en se donnant la valeur initiale (22). Cette standardisation sera
supposée réalisée dans toutes les constructions de ce paragraphe qui
feront appel à la méthode exposée.
Equations aux variations pour
1 e s y s t è m e (21)
Supposons que v (t), y (t), e t t 1 , est une solutioll du systè-
me (21) construite d'après la méthode précédemment exposée et
satisfaisant à la condition initiale (22) . Nous allons prouver que ln
terlne principal de l'accroissement 1/ (t) - x (t) ou, ce qui est équiva-
lent, que le vecteur fonction ôx (t), e t t 17 est univoquement
défini par le terme principal du déplacement initial (i.e. par le vec-
teur ôXo) et vérifie une équation différentielle linéaire (voir équa-
tion (35)) avec la condition initiale ôXo.
Pour cela, démontrons tout d'abord qu'il existe un vecteur
fonction
A (t) == (ÂP (t), . . ., Îvn (t))
33.]
DÉMONSTRATION DU THÉORÈ:IYIE 22
247
continu par morceaux et continûment dérivable par morceaux,
défini sur l'intervalle t o t t 1 tout entier et dépendant unique-
ment de u (t) et x (t) (et ne dépendant pas, par conséquent, de la
forme de la fonction R) tel que le terme (en B) ôu (t) de la différence
v (t) - u (t) satisfasse sur l'intervalle e t t 1 à l'équation
[ ÔI (x u (t)) + A (t) ôp (x u (t» ] ôu (t) = O. (30)
Le fai t que j\ (t), t o t t f , ne dépend ni de v (t) ni de R sera im-
portant dans la suite.
En vue de démontrer l'existence de cette fonction, supposons
qu'elle a déjà été construite sur l'intervalle t o t 'th i? 0, et
définissons-la sur les intervalles 'Li < t 'Ti+1, les points 'Lh i =
== 1, . . ., k, étant choisis comme précédemment.
Supposons que le système (26) a été résolu sur l'intervalle Li <
< t Li+l par rapport, par exemple, aux s + 1 premières variables
1 s +1 Al h . 0 1 d ' f . ·
v, . . ., v . ors, pour caque ] == , ,..., n e Inlssons sur
ct intervalle s + 1 fonctions continues et continÎlment dérivables
J../ (t), l (t), == 1, . . ., s, comme solution du système linéaire
non h01110gène:
ôl j (x (t), u (t» _1_ J,./ (t) ôp (x (t), u (t») +
Ou/Y.. 1 8u a 1
s
-1- L l (t) Ôq/3ôa(t» = O. lX = 1, 2, ..., s + 1, (31)
13=1
OÙ q1 (u), . . ., qs (u) sont les fonctions (1) pour le point u (Li + 0).
(L'indice fX affectant les équations (31) parcourt s + 1 valeurs
correspondant aux numéros des variables va par rapport auxquelles
est résolu le système (26) sur l'intervalle 'Li < t 'Ti+1; ici a ==
== 1, . . ., s + 1.)
Le système (31) est résoluble puisque son déterminant coïncide
avec le déterminant (25) pour BÔ == o.
Le yecteur fonction (ÂP (t), . . ., 1-v n (t)), 'Ti < t 'Li+1, n'est
autre que le prolongement cherché.
L'indépendance de la fonction A (t) par rapport à la fonction R
résulte de l'indépendance par rapport à R de la matrice constituée
avec les coefficients et les ternles libres du système (31), j == 0,
'1, . . ., n.
Prouvons maintenant la formule (30) pour l'intervalle 'Li < t
'Ti+1, e 'Ti.
Sur cet intervalle la fonction (23) est de la forme
v (t) == u (t) + ëÔU (t) + 0 (ë),
où
ôu (t) === (ôu 1 (t), ..., ÔU S + 1 (t), 0, ..., 0),
(32)
248
PROCESSUS AVEC CONTRAINTES SUR LES COORDONNÉES
[ Ch. 6
puisque
V S + 2 (t) === U S + 2 (t), ..., V r (t) = u/ (t).
En multipliant donc l'égalité (31) par ôu a et en sommant les
expressions obtenues en a = 1, 2, . . ., s + 1, il vient
s+ 1. S
( +Âj.!.L+ Z ôql3 ) ôua=
Lj au a Oua Lj au a
a=1 (3=1
$
= ( afj -Lj ap + Z j ôQI3 ) ôu === O 0 1 (33)
ôu 1 au L.J (3 au ' i === , , ..., n.
(3=1
Définissons le vecteur fonction LB (t) au moyen des égalités
LB (t) === ( Z (t), ..., Z (t)), = 1, ..., s
et Inettons l' égali té (33) sous la forme
S
( ; +A (t) : + Lr3{t) aa q : ) ôu(t)=O. (34)
(3=1
En vertu de (26), la fonction v (t) = u (t) + eôu (t) + 0 (e)
vérifie les égalités (a = 1, . . ., s):
Ua (v (t), t) === Ua (u (t) + eôu (t) + 0 (8), t) ===
= Ga (U (t), t) + 8 ( aO' a , (v(t), t) , ÔU (t) ) + 0 (8) = O.
Or
Œ a (U (t), t) === qa (U (t)) -qa, (U (t)) = 0,
ô(Ja (u (t), t) _ aqa (u (t»
av - au
par sui te
( a q a (u (t» )
au ,ôu(t) = 0, a='l, ..., s,
,et l'expression (34) se ramène à l' égali té
( : +A (t) :: ) ôu(t)=O, 'ti<t'ti+1'
ce qui démontre l' égali té (30).
En portant les expressions (23) et (24) dans le système (21) et
en comparant les termes en B, il vient:
.!:- ( Ô ) = ôl (œ (t), u (t» ô + al (œ (t), u (t» ô
dt x aœ x au u,
ap (œ (t), u (t» Ô + ap (œ (t), u (t» Ô + ôR (œ (t), u (t), 0) Ô === °
aœ x au u aJ.t .
33.]
DÉMONSTRATION DU THÉORÈME 22
249
En multipliant ensuite la deuxième équation par A (t) et en l'ajou-
tant à la 'première, il vient, compte tenu de (30):
( ) == ( 8f(X(t), u(t)) 1 A , t) 8 P (X(t),U(t» )ô -L
dt uX ax T { 8x x j
+ A (t) aR (x (t u (t), 0) ôt-t. (35 )
Nous appellerons équation aux variations pour le système (21)
l'équation en ôx (t) linéaire et non homogène obtenue. Elle ne dépend
que du système (21) et par conséquent le terme principal de l'accrois-
sement Ô;K{ (t) de la trajectoire y (t) est univoquement défini par la
valeur initiale ôXe et par la valeur du paramètre ôl-1.
Par analogie avec le chapitre 2 (page 77), nous dirons que les
vecteurs ôx (t) se déduisent du vecteur ôx (8) == ôXe, donné au point
x (8), par une translation le long de la trajectoire x (t). Cette transla-
tion qui est dépendante du paramètre ôl1, nous la désignerons par
le synlbole
ôx (t) == Pt, e (ôl-1) ôxo.
Les, forn;lules suivantes sont immédiates:
Pt, e (61-1) ôx == Pt,,; (ôl-1) P,;, e (ôl-1) ôx, tLe, }
P f, e (yôp,) yôx == yP t, e (ôl-1) ôx, (36)
Pt, e (Ôp,i + Ôt2) ( ÔX 1 + ÔX2) === Pt, e (Ô111) ÔXi + Pt, e (Ô112) ÔX2-
Désignons par T (x (t)) le plan tangent en x (t) au bord fJ (x) == o.
Si x (t) n'appartient pas à la réunion des voisinages Oi qui ont
servi à définir le symbole (17), alors comme nous l'avons déjà men-
tionné.
g (x (t) + eôx (t) + 0 ( 8)) == 0,
d'où
( ag x(t)) , ôx (t) ) = 0,
l.e. ôx (t) E T (x (t)). Et, en particulier, on a toujours
ôx (t i ) E T (x (t i )).
(37)
Pour ô == 0, l'équation (35) se transforn1e en l'équation homo-
gène
(ôx) = ( ai (x ; u (t)) + A (t) ap (x ' U (t)) ) ôx. (38)
(onsidérons de plus son équation adjointe
. aa = _ ( ai (x ; u (t») + A (t) ap (x ' u (t)) ) 'i'- (39)
250
PROCESSUS AVEC CONTRAINTES SUR LES COORDONNÉES
[Ch. 6
Afin d'éviter toute confusion, écrivons les équations (38) et (39)
sous la forme de deux systèmes d'ordre (n + 1) par rapport aux
coordonnées
n n
. (ôxi) == ( afi + j} ) ôxa == ( ôfi + Âi ) ôxa
dt L..J che a ôxa L..J axa axa
a=O a=1
n
d\Pi '" ( Ôfa r  a ôp )
([t == - LI axi 1 ôx i 'Pa,
cx=o
i = 0, 1, ..., n.
Si ôx (t) et 'i' (t), t o t tj, sont des solutions continues arbi-
traires respecti veInent des équations (38) et (39), alors
('i' (t), ôx (t)) = const
(40)
(cf. page 78).
Désignons par
iP 0 (t),
. . .,
<Pn (t),
t o t th
.un système fondamental de solutions de l'équation (38) et par
,po (t), . . ., n (t), t o t t 1 ,
lIn système fondalnental adjoint de solutions de l'équation (39).
On a
(i(t), <p j(t))=ô}.
La solution ôx (t), 8 1 t 8 2 , t o 8 1 < 8 2 t f , de l'équation
non homogène (35) satisfaisant à la condition initiale
n
ôx (8 1 ) == CG (8 1 ) ôx cx (8 1 )
a=O
.se met alors sous la forme
ôx (t) == Pt, 81 (ô) ôx (8 1 ) ==
n t
= <ra(t)[ Ôx a (8 j ) + J (1i'a (1:), A (1:) : ) Ô ) d1: ] ·
a=O 81
(41)
Cal cul deI a d é r i y é e ôR (œ (t), II (t), 0)
at
Cette dérivée nous étant nécessaire sous sa fornle explicite nous
:allons la calculer imnlédiatenlent.
33.]
DÉMONSTRATION DU THÉORJ"tME 22
251
On a
s
h (x, p) == g (x -T- l aa (x) lf et) ==
a=1
s s
== g (XO + aa (x) N&, ..., X n -i- L CG a (x) N),
a=1 CG=l
DÙ Ni == (N, .... Nf). Posons
s
11i==Xi-t-t aa(x).L\T, i==O,..., n; 1]---=(11°, ..., 'YIn).
a=1
Il yien t
n
fJ ( ) â a
R (x, ll, f.t) = :'l a: B tf" (x, u) =
a, 13=0
n n s
= a: () fa (x, u) + f.t a: () aa;x(:) NffB (x, u) =
a=O a, 6=Oi=1
s
_ ( fJl( (11) f( ) ) + ( fJg (11) .... ) ( âa i (x) j . ( ) )
- 811' X, U t L.J fJ11' 1.1 l fJ X ' X, U ·
i=l
Par suite
n s
iJR (x, u, 0) == ( 8 2 g (11) ta (x, u) ai (x) Nf ) 1 +
ÔJl LJ fJa â(3 LJ =O
CG, (3=0 i=1
s
+ ( aga) ,Ni) ( aa) , f(x, u)) =
i=l
s n
( ) â2g (x) t a ( ) J\ T8 1
== L.J ai x âx a âx t3 X, U i-r
i=1 a, (3=0
s
r ( fJg(X) "?". ) ( fJai(X) j . ( X U )) ==
T L.J (Îx' l fJx' ,
i=1
s
= :t [ad x (t)) ( ag :(t)) , Ni) ] .
i=l
Donc
s
DR (x (t), II (t), 0) == [ a. ( X ( t )) ( âg (x (t)) :\-r ) ] ( 42 )
f) l L L.J dt l âx' .... i ·
1 i=1
252
PROCESSUS AVEC CO:NTRAINTES SUR LES COORDONNEES
[Chio 6
Il vient immédiatement de la définition de la somme des synlbo-
les ( 1 7)
fJ ôR b (œ, u,O) ôB b (œ, u, 0)
( R ( X u 0 )) - 1 + 2
fJL b1+b " - ôl-L at
(43)
Var i a t ion s deI a sol u t ion u (t), x (t)
Au chapitre 2, nous avons d'abord défini la classe de cOlllIllandes
perturbées, i.e. les variations de la commande initiale II (t), et
ensuite nous avons construit la trajectoire perturbée (voir 9 13) à partir
de la cOlll111ande donnée, de l' écart initial et du nombre réel ôt.
Désormais nous ne pouvons plus définir, indépendan11nent des
trajectoires perturbées, la classe de commandes perturbées puis à
l'aide de ces dernières construire les trajectoires perturbées, car en
général elles déborderont le fermé G (puisque la trajectoire x (t) est
située sur le bord de G). Dans ce cas, les commandes perturbées et les,
trajectoires perturbées correspondantes devront être construites simul-
tanément, pas à pas, pour qu'à chaque instant on ait la possibilité
d'éviter à la trajectoire perturbée de déborder le fermé G. CecI est.
possible en raison de la régularité de la trajectoire.
Nous parlerons donc dans les formlllations rigoureuses non plus
des variations des commandes ni même des variations des trajectoires
séparément, mais des variations de la solution u (t), x (t), t o t
t 1 , du système (21).
Nous allons ainsi construire une classe <1> de solutions perturbées-
u* (t), x* (t) du système (21), i.e. les variations de la solution
u (t), x (t), t o t t b du système (21) pour ô = O. Stricten1ent
parlant, tout élément (u* (t), x* (t)) de l'ensemble cD ne constituera
pas une seule solution du système (21), mais toute une fa1nille de
solutions, fonctions de l'infiniment petit ë. Néanmoins, pour plus de-
commodité, nous parlerons souvent de la solution perturbée (u* (t)t
x* (t)) E cD ainsi que des variations u* (t) de la commande Zl (J) 011
des variations x*(i) de la trajectoire x (t) qui constituent la solution
u* (t), x* (t) du système (21).
Observons ici que l'ensemble <1> sera constitué non pas des solu-
tions perturbées d'un système concret quelconque (21), mais des solu-
tions perturbées de tous les systèmes de la forme (21) dépendant dll
choix de la fonction R (i.e. du symbole (17)). Cependant, tout élé-
ment donné (u* (t), x* (t)) E cD constituera une famille de solutions
d'un mêm'e système de la forme (21).
Au chapitre 2 nous avons construit une commande perturbée
par la donnée de ses paramètres (voir définition du symhole a en
page 85). De la même façon nous allons construire chaque solutioI1_
perturbée u* (t), x* (t) du système (21) (plus exactement, une falnille
de solutions perturbées) en nous donnant les paramètres de cette solu-
tion. Aussi allons-nous en premier lieu définir les par a 111 è t r e s.
S 33.1
DÉMONSTRATION DU THÉORÈME 22
253
d'une solution perturbée et ensuite décrire une méthode de construc-
tion de cette solution.
Il est naturel de répartir ces paramètres en deux groupes: ceux
de la cOlnmande u* (t) et ceux de la trajectoire x* (t).
Les notations 'ti, . . ., 'tk; ôt i , · . ., ôt k ; Ii, · · ., l k; Vi, . . .
. . ., Uk; 't, ôt garderont le même sens que dans le 13. La commande
u (t) étant continue par morceaux, les points 'ti, . . ., 'tk sont ses
points de continuité. Dans toute la suite nous admettrons que le
point 't. coïncide avec l'extrémité t i de l'intervalle t o t t f (ce
qui est possible puisque la commande u (t) est continue au point ti).
D'autre part, pour Vi' . . ., Vk nous ne pourrons prendre que des
points du domaine de cOlllnlande U tels que pour un i = 1, . . ., k
quelconque, le point x de la trajectoire x (t) soit régulier relative-
Jl1ent au point Vi. L'ensemble des paramètres 'ti1 ôt i , Vi' ôt, qui a servi
à définir la commande perturbée u* (t) sera désigné par a, comme dans
le chapitre 2. Cependant, la commande perturbée u* (t) correspondant
au symbole a ne sera pas définie comme au chapitre 2 (voir page 80),
nlais d'une façon légèrement différente, plus exactement, nous la
construirons en même temps que la trajectoire perturbée correspon-
dante x* (t). Ceci s'explique par le fait que dans la définition de la
commande perturbée telle qu'elle a été faite dans le chapitre 2, la
trajectoire perturbée correspondante est susceptible de déborder le
domaine G sur les intervalles Ii.
Pour paramètres de la trajectoire perturbée x* (t) qu'il nous
faudra construire, nous prendrons les grandeurs figurant dans le
symbole v (17).
Passons maintenant à la construction de la solution u* (t), x* (t)
du système (21) définie par les symboles a, o. Cette solution sera
définie sur l'intervalle t o t t i + ëôt. Pour souligner qu'elle
dépend du choix des symboles a, v, nous désignerons au besoin les
Îonctions u* et x* respectivement par
u*-u* c. ( t )
- a, u ,
x* = x:, b (t).
(44)
(45)
Définissons la valeur initiale x* (t o ) de la trajectoire x* (t) au moyen
de la formule
x* (t o ) = X (t o ) + ëÔX o ,
(46)
où
s
ôXo= -ô"., aa; (x (t o )) Na
cx=l
(47)
De (46) il vient pour B suffisamment petit:
ai (x (t o » == ai (x* (t o », i = 1, . . ., s,
(48)
254
PROC ESSUS AVEC CONTHAITES SUR LES COORDONNÉES
[ Ch . ()
en outre (pour 8 suffisamment petit)
ai (x* (t o » == ai (x (t o » == 0 pour i =1= x (io),
ai (x* (t o » == ai (x (io» == 1 pour i == X (t o ).
De (47) et (48) il vient:
h (x* (t o ), 8Ô) == g (x (t o ) + 8ÔXo +
s
+ 8ôll a cx (x* (t o » 3"" cx) == g (x (t o » == O. (49)
cx=1
La méthode de construction de la trajectoire (45) montre aussitôt
que lorsque 8 -+ 0, la trajectoire x* (t) tend uniformément en t
vers x (t) sur l'intervalle t o t t 1 . On déduit donc de (49) que
x* (t) est entièrenlent contenue dans le fermé G (voir page 243).
Comme au chapitre 2 (cf. page 80), on se donne les interyalles Ii'
par les inégalités
'ti + 8li < t 'ti + 8 (li + Ôii).
En partant de la valeur initiale donnée (46), construisons 11laintenant
une solution de la forme (23), (24) du système (21) sur l'intervalle
t o t 171 + 811 (i.e. en partant du point initial t o pour aboutir
à l'extrémité gauche de l'intervalle Ii) à l'aide de la méthode décrite
dans les pages 244-246 et égalons les fonctions (44), (45) à cette solu-
tion sur l'intervalle t o t 'ti + 8l1. On a:
u * (t) == u (t) + 8Ô u (t) + 0 (8),
x* (t) == x (t) + 8ÔX (t) + 0 (8), t o t 171 + 8l1.
Pour t o t 171 + 811 la fonction ôx (t) est donc solution de
l'équation aux variations (35):
ôx (t) == Pt. t o (ô) ôx (t o ).
Nous allons maintenant prolonger la solution u* (t), x* (t) en
conservant la continuité de la fonction x* (t) sur l'interyalle 1 1
(en supposant qu'il n'est pas vide, i.e. ôt 1 =1= 0) de la manière sui-
vante.
Par hypothèse le point x (171) est régulier relativement à Vi.
Désignons par qi (v), . . ., qs (v), s 0, les fonctions (1) pour le
point Vi. On a alors (en désignant par Rb la fonction R, où I> est le
symbole qui a servi à définir la solution perturbée):
R (x ('L1)' Vi, 0) == q (Vi) == · · . == qs (Vi) == 0,
et le systènle
R (y, v, 8Ôf,t) == qt. (v) == . . . == qs (v) == 0 (50)
33.J
DÉMONSTRATION DU THÉORÈl\lE 22
255
est résoluble par rapport à certaines 8 + 1 coordonnées du vecteur v-
au voisinage des valeurs x ('r1)' Vi' ëÔ!l== 0, par rapport, par exemple,
aux (8 + 1) premières coordonnées:
vi == (}i (11, V S + 2 , ..., v r , ëÔt), i == 1, ..., 8 + 1, 1 s + 1 -<: r,
où les fonctions {fi, i == 1, . . ., 8 + 1, sont con tinûmen t dérivables
par rapport à leurs arguments. Il est évident que l'argument y des
fonctions {fi peut prendre la valeur x* ('r1) puisque pour ë -+ 0/
l'intervalle Ii dégénère au point 'r1 et
x * ('r 1 + ë ll) == x ('r 1 -j- ë l1) + ëÔ x ('r 1 + ë l1) + 0 (ë) -+ X ('r 1) ·
En portant les fonctions 8 i , i == 1, . . ., 8 + 1 dans la première
des équations du sysLèn1e (21), nous obtenons
=f(y, \'}1 (!l, z;s+2, ..., ur, e,Ôf.t), ..., ur) =
· ( ,,+ 2 }' Ô ) ( 51 )
==/1 y,v , ...,V,ëll.
Renlplaçons lllainLenalll dans le second menlbre les paramètres.
-;+2 l' 1 l , t . s+2 r d . t
V ,..., v par es coor( onnees respec Ives VI , . . ., V l II pOln Vl
et résolvons l'équation différentielle obtenue avec la condition ini-
tiale x* ('rl + ël1) sur l'intervalle Ii. La solution x* (t) n'est autre
que le prolongenlent de x* (t), t o t 'ri + ël1, sur l'intervalle I l .
Donnons-nous le prolongen1ent de la commande u* (t), t o t
'r1 -t- ël1, sur l'intervalle 1 1 par la formule:
u* (t) == ({fI (x* (t), V+2, ..., v, ëÔll), ...
. . ., t}S+l (x* (t), V+2, ..., vr, ëÔl-t), V+2, ..., vr), tE Ii"
L'admissibilité de la cOlnmande u* (t), t E I l et l'égalité
R (x* (t), u* (t), ëÔl-t) == 0, t E I l ,
sont évidentes. Par construction, u* (t) est une fonction continue
sur l'intervalle Ii el tend uniformément vers V1 pour ë -+ 0 sur / 1 -
Si 'ri == 'r 2 == . . . == 'rj < 'rj+1, nous faisons la même construction
sur les intervalles 1 2 , . . ., Ij (en remplaçant Vi respectivement
par V 2 , . . ., Vj) et nous obtenons ainsi la solution u* (t), x* (t) sur-
l'intervalle t o t 'rj.
Ensuite, nous prolongeons les fonctions u* (t), x* (t) sur l'inter-
valle 'rj t 'rj+l + ëlj+l (i.e. jusqu'à l'extrémité gauche de l'in-
tervalle I j + 1 ) en utilisant la construction exposée dans les pages 244-
246 (avec la valeur initiale x* ('rj» et ainsi de suite jusqu'au point t 1 .
Si donc ôt 0, la famille de solutions variées u* (t), x* (t),.
t o t t 1 + ëÔt, du système (21) est définie.
Supposons ôt > o. La solution u* (t), x* (t) a déjà été construite
sur l'intervalle t o t t 1 . Il est aisé de voir que le point x* (t 1 )
256
PROCESSUS AVEC COl'\TRAINTES SUR LES COORDONNÉES
[ Gh. H
est régulier relativement au point u* (t f ) = u* (t f - 0). En effet,
la première condition de régularité vient de ce que pour des valeurs
de t proches de t f on a:
R (x* (t), u* (t), 8Ôl1) = p (x* (t), u* (t)) = 0,
car pour ces valeurs de t le point x* (t) est Sitllé sur le bord
g (x* (t)) = 0
de G.
La deuxième et la troisième conditions de régularité découlent do
la régularité du point x (t l ) relativenlent à u (t f ) = u (t f - 0) et
des relations x* (t l ) -+ x (t l ), u* (t l ) -+ u (t f ) pour 8 -+ O.
La construction au moyen de laquelle nous avons défini la solu-
tion u* (t), x* (t) sur les intervalles Ii nous permet donc de prolonger
les fonctions u* (t), x* (t) continûment audelà de t l jusqu'au point
t l + EÔt.
Par la donnée des paramètres a, 0 nous avons donc construit un€,
famille de solutions perturbées du système (21). L'égalité (51) vaut
évidemment pour t l t t f + EÔt.
Soulignons que la trajectoire (45) n'est pas définie univoquement
par les paramètres a, o. Elle dépend en effet du choix des variables Vi,
par rapport auxquelles est résolu le système d'équations (50) dans la
construction de la solution perturbée sur les intervalles Ii. Le mênlO
arbitraire a lieu lorsque la solution est prolongée sur l'intervalln
t l t t l + EÔt pour ôt > O. On tourne aisélnent cet arbitraire
en fixant pour chaque point u (t) les variables Vi par rapport auxquel-
les est résolu le système (50) au voisinage des valeurs x (t), u (t),
8Ôl1 =0, où Ql, ..., Qs, sO, sont les fonctions (1) définies pour
le point u (t). (Si t est un point de discontinuité de la comnlando
u (t), les variables Vi par rapport auxquelles est résolu le systèm(
(50) peuvent être distinctes pour les points u (t - 0) et u (t + 0).)
Une fois ces conventions adoptées, la donnée des symboles a et v
définit univoquement la famille de trajectoires (48) puisque les tra-
jectoires de cette famille sont construites d'une manière univoque
sur les intervalles fermés contenus entre les intervalles Ii (voir note
page 246).
Con s t rue t ion des côn e s 1(* e t k*
Comme dans le chapitre 2, nous allons nous intéresser maintenant
à l'écart par rapport au point x (t f ) de l'extrémité de la trajectoire
perturbée (45).
Exactement comme au chapitre 2 (pages 81-84) on démontre
la formule
x* (t f + EÔt) == x (t f ) + EX* + 0 (8),
(52)
33]
DÉMONSTRATION DU THÉORÈME 22
257
où le vecteur x* ne dépend pas de E et est défini par la formule
x* == Pti' to (ôl-t) ôXo+f(x (t f ), u (t f )) ôt+
k
+ P ti , 't'a (ôl-t) [f(x(';a), va)-f(x('t a ), u('t a ))] ôta. (53)
a=1
Nous désignerons (au besoin) le vecteur x* par xa V pour montrer
qu'il dépend des symboles a et v.
De l' égali té (37), qui est valable pour des valeurs de t proches
de t f , il vient
x* E T (x (t f )).
(54)
Soient a', 0' et a", 0" deux paires dei symboles définissant la
variation des commandes et des trajectoires et Îv', Îv" deux nombres
non négatifs. Posons
a = Îv' a' + Îv"a", 0 = Îv'o' + Îv "b ".
Des propriétés de la translation (voir formule (36)), de la linéarité
de la fornlule (17) par rapport à ô et de la linéarité de la formule
(53) par rapport à ôXo, ôt, ôta il s'ensuit immédiatement:
A * Il'A * + '\flA *
uX a , f> = IV uX a " f>' l'v uX a ", v".
(55)
Cette formule montre que tous les vecteurs de la forme x, b
portés dans l'espace X à partir du point x (t l ) engendrent un côn e
con v e x e de sommet x (t l ) que nous désignerons par K*. De (54)
il résulte, en outre, que le cône K* est contenu dans le plan T (x (t f ))
tangent au bord g (x) = 0 en x (t f ).
Nous allons utiliser le cône K* pour démontrer la condition de
saut ( 36). Pour prouver le théorème 22 nous prendrons un autre
cône convexe k* contenu dans K*. Plus précisément, nous allons
considérer seulement les symboles 0 pour lesquels aucun point bi
ne coïncide avec le point initial x (t o ) de la trajectoire x (t). Il ré-
sulte alors de la formule (47) que ôXo = 0, i.e. la trajectoire perturbée
x* (t) débute au point x (t o ). Si 0' et 0" sont des symboles de la
forme mentionnée (i.e. ne contiennent pas le point x (t o ) parmi les
points i) et Îv', Îv" deux nombres non négatifs, alors Îv'o' + Îv "b "
est un symbole de la même forme. Aussi, en portant à partir de
x (t l ) des vecteurs de la forme x, f> où v est un symbole ne ren-
fermant pas le point x (t o ) parmi les points h obtenons-nous un cône
convexe noté k* de sommet au point x (t f ).
Puisque 1(;* c K* c T (x (t f )), les cônes k*, K* sont de dimen..
sion non supérieure à n. Aussi par intérieur de ces cônes nous dési-
gnerons l'ensemble des points intérieurs relativement au plan
T (x (t l )), et par rayons intérieurs, les rayons de sommet x (t l )
appartenant à ces cônes et renfermant leurs points intérieurs.
17-01339
258
PROCESSUS AVEC CONTRAINTES SUR LES COORDONNÉES
[CH. 6
9 34. Démonstration du théorème 22 (suite et fin)
Pour que toutes les constructions du précédent paragraphe soient
possibles, il suffit que la trajectoire x (t), t o t i 1 , qui est située
sur le bord du domaine G soit r é guI i ère.
Supposons Inaintenant que u (t) et x (t) sont de surcroît 0 p t i -
mal e s.
Désignons par L le rayon issu d'un point x (t 1 ) et orienlé dans
le sens du demi-axe négatif xo. Il est évident que LeT (x (t 1 )).
Lem m el. Le rayon Ln' est pas intérieur au cône l,*.
D é mon s t rat ion. Désignons par Jt la projection (ortho-
gonale, par exemple) de l'espace X sur le plan T (x (t 1 )). Supposons
que la trajectoire variée x* (t) correspond aux sYlnboles a et 6, où b
est un syn1bole ne contenant pas le point x (t o ) parmi les points i
(de sorte que la trajectoire x* (t) débute au point x (t o )). Puisque
x* (t 1 + 8ot) == x (t 1 ) + 8X* + 0 (E),
où x (t 1 ) E T (x (t 1 )), x* E T (x (t 1 )), il vient:
Jt (x* (t 1 + Bot)) == x (t 1 ) + BX* + 0 (8).
Donc, les termes principaux (linéaires en 8) des vecteurs
Jt (x* (t 1 + EOt)) - x (t 1 ) et x* (t 1 + Bot) - x (t 1 )
coïncident et remplissent ainsi dans T (x (t 1 )) le n1ên1e cône 1.*.
Supposons maintenant que le rayon L est intérieur au cône l\*.
Alors en vertu du lemme 3, chap. 2, il existe un 8 > 0 (que l'on peut
supposer arbitrairement petit) et des symboles a et fi tels qu'il
leur corresponde une trajectoire perturbée x* (t) débutant au point
x (t o ) et aboutissant en un point x* (tt + Eot) tel que Jt (x* (t 1 - Bot)
soit un point du rayon L distinct de x (t 1 ).
L'application Jt considérée sur le bord g (x) == 0 esl bijecti ve
au voisinage du point x (t 1 ). Si donc, 1J est un point du bord g (x)=== 0
suffisamment proche de x (t 1 ), alors il résulte de Jt (11)) E L que
Jt (!I) == 11. Puisque pour B suffisamment petit, le point x* (t 1 -t- Bot)
(qui appartient au bord g (x) == 0) est arbitrairement proche
du point x (t 1 ), il vient de la relation :Tt (x* (t 1 + Bot)) E L que
x* (t 1 + Bot) == :Jt (x* (t 1 + Bot)) et donc x* (t 1 + Bot) est un point
du rayon L non confondu avec x (t 1 ). Co qui contredit l'optin1alité
de la solution u (t), x (t).
Le lemme 1 est donc démontré.
Lem m e II. L'équation
d", = _ ( â f (x (t), u (t)) +- A ( t ) â p (x (t), u (t)) ) ,,1"1 ( 56 )
dt âx 1 âx '1'"
34.1
DÉMONSTRATION DU THÉORÈME 22 (SUITE ET FIN)
259
admet une solution continue
'i' (t) == (\Po (t), \}Ji (t), · · ., 'i'n (t)), t o t t i , (57)
telle qu'en chaque point de continuité de la commande optimale u (t)
soit remplie la condition de maximum
de plus
QJt ('1' (t), x (t), u (t)) == m ('1' (t), x (t)),
m ('i' (t i ), x (t i ») == 0
(58)
(59)
et soient satisfaites les conditions suivantes:
a) 1Po (t) == const 0 ;
b) le vecteur '\1' (t o ) n'est pas colinéaire au vecteur
grad g (x (t o ) ;
c) la fonction scalaire continûment dérivable par morceaux
À (t) == - ('\1' (t), A (t») est telle qu'en chacun de ses points de déri-
vabilité le vecteur
dÂ
dt grad g (x (t))
soit est dirigé vers l'intérieur du domaine G, soit s'annule.
D é mon s t rat ion. D'après le lemme 1, par le sommet
x (t 1 ) du cône 1(;* c T (x (t i ) il est possible de faire passer un plan r
de diInension n - 1 contenu dans T (x (t 1 )) et séparant le cône 1*
du rayon L. Soit X == (Xo, Xi' . . ., Xn) un vecteur situé sur le plan
T (x (t 1 )), orthogonal au plan r et orienté de telle sorte que le rayon
L est situé sur le demi-espace fermé défini par le plan r vers lequel
cst orienté le vecteur X et le cône k* dans l'autre demi-espace fermé.
.lAlors, Xo 0 et, pour tout vecteur x* E k*, on a:
(X, x*) o.
(60)
Le vecteur X étant en outre situé sur le plan T (x (t 1 )), les vecteurs
X et grad g (x (t 1 )) (61)
sont linéairement indépendants.
Définissons la fonction inconnue'i' (t) comme solution de l' équa-
tion (56) avec la valeur finale
'i' (t 1 ) == X.
(62)
On voit aisément que l'égalité (58) est satisfaite. En effet, sup-
posons qu'en un point de continuité 'r1 de la commande u (t) est
vérifiée l'inégalité
QJ£ ('i' (';1)' x ('r1)' u ('r1») < m ('i' ('r1)' x ('rt),
17*
260
PROCESSUS AUEC CONTRAINTES SUR LES COORDONN:Éb:S
CH. 6
i.e. il existe un point Vi E U relativement auquel le point x (Li)
est régulier tel que
QJt ("1' (L 1), x (17 1), V 1) > cfJt ("1' ( 17 1), x (L 1), U (L 1) ) . ( 63 )
Construisons une solution u* (t), x* (t), t o t t i , du systè-
me (21) en prenant pour symbole a le symbole {L1, V1, 8t 1 == 1, 8t==0}
et pour symbole b un symbole dans lequel s == 0 (i.e. où ne figurent
pas h ai (x) et Ni) et 8l-t == O. De (53) il vient alors
x * == Pt 1, 't 1 (0) (f (x (L 1), V 1) - f (x ( T 1) , u ( T 1) ) ) .
Et les formules (40), (63) donnent:
(X, x*) = ('\)' (t 1 ), Pti, 't1 (0) (j.(x (T1)' Vt) -{ (x (Tt), U (T1))) =
== ('\)' (L1)' t (x ( 17 1), Vt) -f(x (L1)' U ('"C1))) > 0,
ce qui contredit l'inégalité (60).
On délnontre l'égalité (59) et la condition a) de la mêlne manière
que les formules correspondantes (12) du chap. 2.
La condition b) découle de l'indépendance des vecteurs (61) et
de l'égalité (62) (cf. remarque 4 du théorème 22).
Prouvons enfin la condition c).
Supposons que u* (t), x* (t), t o t t 1 , est une solution du
système (21) correspondant à un symbole a vide (i.e. un synlbole
pour lequel k == 0 et 8t == 0) et à un symbole b ne contenant pas
le point x (t o ) parmi les points i. Il vient alors des formules (53)
et (41)
n ti
r a 8R
8x* = Pt!. to (ô) 0 = ô L qJa (t1) J ('I\J (t), A (t)) aï-ï dl.
a=O to
Les formules (62) et (60) donnent
n ii
(X, 8X*) = ô ('I\J (t1), <Pa (t 1 ) J (a (t), A (t)) : dt) =
a=O to
t1 t1
=ô J ('I\J(t), A (t)) : dtc= -ô J Â(t) : dt<O.
to to
En vertu de la relation Îv (t) == - ('i' (t), A (t)) et de la dualité £ln
système de fonctions ((P1, . . ., (Pn), (1, . . ., n) on a:
n
('i' (t 1 ), a (t 1 )) a (t) == 'i' (t).
a=O
34.]
DÉMONSTRATION DU THÉORME 22 (SUITE ET FIN)
261
En portant dans la dernière inégalité l'expression (42) de ::
et puisque ôl-t 0, il vient:
11 s
r d [ ( âg(X(t» )]
J Â (t) di LI a et (x (t)) âx ' Net dtO.
to et= 1
Une intégration par parties donne, compte tenu de ai (x 4(t O )) ==
== ai (x (t i )) === 0, i === 1, . . ., s:
ti S
5 aa(x(t» ( ag:tt» ,Na) dtO.
to et= 1
(64)
Puisque les points i peuvent être choisis arbitrairement sur la
trajectoire x (t) (pourvu qu'ils ne coïncident pas avec ses extrémités)
et puisque, par ailleurs, les voisinages Ob. sont arbitrairement
z.
petits, les fonctions ai (x (t)) sont non négatives et Ni des vecteurs
extérieurs (relativement au domaine G), il résulte de (64):
dÂ
dtO.
Cette inégalité exprime justement la condition c) car le domaine G
est défini au voisinage du bord par l'inégalité g (x) O. Donc,
grad g (x (t)) est une normale extérieure au bord g (x) == O.
En vue d'achever la d é mon s t rat ion dut h é 0 r è -
m e 22 il faut montrer premièrement que la fonction scalaire
À (t) == - ('i' (t), A (t)) vérifie l'expression
S
âQfe ('1' (t), œ (t), u (t)) ==  ( t ) âp (x (t), u (t)) + v ( t ) âqet (u (t)) ( 65)
GU âu LJ et au
et=1
et, deuxièmement, que
QJt ('i' (t), x (t), u (t - 0)) === m ('i' (t), x (t))
en les points de discontinuité de la commande u (t) et la constance
de la fonction QJfj (t) == QJf ('i' (t), x (t), u (t)) sur l'intervalle t o
t t i . Aux points de discontinuité de la commande nous pose-
rons par hypothèse
QJ£ (t) === QJt ('i' (t), x (t), u (t - 0)).
Remarquons pour les besoins de la démonstration de (65) que
les coordonnées du vecteur A (t) == (ÂP (t), . . ., Ân (t)) obéissent aux
262
PROCESSUS AVEC CONTRAINTES SUR LES COORDONNÉES
[CH. 6
, .
equatlons
s
al] (x (t), u (t)) _+ Â/ (t) ap (x (t), u (t)) , zj (t) aql3 tu (t)) = 0
âu a oua T L.J f3 âua '
(3=1
j == 0, 1, ..., n, a == 1, ..., s --t- 1.
En multipliant cette expression par '\jJj (t) et en sornmant les
expressions obtenues pour tous les j == 0, 1, . . ., n, nous obtenons
s + 1 égalités (a === 1, . . ., s + 1)
s
âQfe ('i' (t), x (t), u (t)) == Â ( t ) âp (x (t), u (t)) + v ( t ) âq(3 (u (t»
âu a âua LJ [3 âu a '
13=1
à partir desquelles la fonction  (t) est univoquement définie.
D'un autre côté,
QJ8 ('li' (t), x (t), u (t)) == m ('li' (t), x (t))
et d'après la règle des multiplicateurs de Lagrange
s
âQ/& ('i' (t), x (t), u (t)) == Â * ( t ) âp (x (t), u (t)) + " v* ( t ) âqa (u (t)) .
âu âu a âu'
a=1
par conséquent, 'A (t) == 'A* (t).
Démontrons maintenant l'égalité suivante
QJ8 ('i' (t), x (t), u (t)) == m ('i' (t), x (t))
(66)
aux points de discontinuité de la commande u (t).
Supposons qu'au point de discontinuité 17 de la commande u (t)
est vérifiée la relation
Q)[ (17) === QJt ('i' (17), x (17), U (17 - 0)) =1= m ('i' (17), x ('t)).
Il existe alors un point U1 E (ù (x (17)) tel que
QJ[ ('i' (17), x (17), U (17 - 0)) <QJ8 ('i' ('t), x (17), U1). (67)
De la condition U1 E (ù (x (17)) il résulte immédiatement (voir
page 236-237) qu'il existe une fonction continue u* (t) définie pour
les valeurs de t proches de 17 telle que u* (t) E (ù (x (t)), u* (17) == U1.
Etant donné que la fonction QJ8 ('i' (t), x (t), u* (t)) est continue en t
et que la commande u (t) est continue à gauche en 't, nous obtenons
de l'inégalité (67) pour tout point t.< 't suffisamment proche de T
QJi ('i' (t), x (t), u (t)) < QJ8 ('i' (t), x (t), u* (t)).
34.]
DÉMONSTRATION DU THÉORÈME 22 (SUITE ET FIN)
263
Pour les points t considérés nous obtenons donc l'inégalité
Olt ('1' (t), x (t), u (t)) <QJ£ ('1' (t), x (t), u* (t)) m ('i' (t), x (t)),
qui contredit l'égalité (58). L'égalité (66) est démontrée. D'une
façon analogue on démontre que
QJt; ('i' (t), x (t), u (t + 0)) === m ('1' (t), x (t»). (68)
La continuité de la fonction QJt (t) === m ('i' (t), x (t» résulte des
égalItés (66) et (68). Pour démontrer donc que la fonction QJt (t)
est constante sur l'intervalle t o t t 1 il nous reste à démontrer
qu'elle est constante sur tout intervalle où les fonctions'i' (t), x (t)
et u (t) sont simultanément dérivables.
On a (voir formules (9), (10»):
:t cf/C (t) = ( i , aa: ) + ( aa: ' dd ) + ( aa:C ' ) =
s
=== (( _!L ' ) -L ( !L ) (( ap "" a q a ) ) _
ax 'i'+Â 8x "f 1 ax 'i',f + Â au + L.J Va au ' dt -
a=1
s
= ( Â j t )+( Â ap )+( v aqa ) =
ax ' au' dt .L.J a au ' dt
a=1
s
d d
=== Â (t) dI P (x (t), u (t» + L.J Va (t) dI qa (u (t» ===
a=1
s
d
=== LJ Va (t) dI qa (u (t».
a=1
dqa(u (t))
l\1ontrons que dans les points t considérés on a === 0,
dt
a == 1, . . ., s, et, par conséquent,
s
dc2fe (t) === ( t ) dqa (u (t)) === 0
dt .L.J Va dt ·
a=1
Raisonnons par l'absurde; supposons par exemple qu'au
point 't:
dq1 (u ('t)) -1- 0
dt -r-.
(69)
Nous avons
q1 (u ('t)) === . . . === qs (u ('t») === 0,
où ql (u), . . ., qs (u) sont les fonctions (1) définies pour le point
U ('t). La fonction q1 (u (t» change donc de signe au point 't, ce qui
264
PROCESSUS AVEC CONTRAINTES SUR LES COORDONNÉES
[CH. 6
contredit l'admissibilité de la commande u (t) puisque au voisinage
du point u Ct) l'ensemble U est défini par les inégalités
q1 (u) 0, . . ., q s (u) 0 ;
il résulte de l'admissibilité de la commande u (t) que pour toutes
les valeurs de t suffisanlment proches de 't
q1 (u (t)) o.
Le théorème 22 est donc entièrement démontré.
35. Quelques généralisations
Dans ce paragraphe nous donnerons quelques généralisations
évidentes du théorème 22. Nous nous bornerons à la seule formula-
tion des résultats, leur démonstration ne différant que légèrement
de celle du théorème 22.
Dans la démonstration du théorème 22, la dépendance entre
les vecteurs x et u, dépendance exprimée par l'équation
P (x, u) == 0
a été essentielle. La forme de la fonction
p (x, u) = ( iJ) ,1 (x, u) )
n'a été utilisée que pour démontrer les conditions b) et c) du théorè-
me 22. Le théorème 23 suivant découle immédiatement d'une brève
analyse de la démonstration.
Soient m fonctions Pi (x, u), i == 1, . . ., m, continûment déri-
vables, ne dépendant pas de la coordonnée xo. Le point x régulier
relativement au point Uo E U et satisfaisant au système
Pi (x, uo) == · · · == Pm (X, uo) == 0,
est défini comme précédemment sauf que dans ce cas, au lieu de
l'indépendance des vecteurs (7), il faut exiger l'indépendance des
vecteurs
ap1 (x, uo)
au
, ... ,
aPm (, uo)
au
agi (uo)
au
, ...,
ag.q (uo)
au
Thé 0 r è m e 23. Soient u (t), t o t t 1 , une commande
optimale et x (t) une trajectoire optimale régulière correspondante de
l'équation (5), vérifiant sur l'intervalle t o t t 1 le système d'équa-
tions:
Pi (x (t), U (t)) == · . · == Pm (X (t), u (t)) == O. (70)
Il existe alors un vecteur fonction 'i' (t) == ('\jJo (t), . · ., '\jJn (t)),
t o ::::;; t t 1, continu et non nul tel que sur l'intervalle t o t t 1
35.]
QUELQUES GÉNÉRALISATIONS
265
les fonctions u (t), x (t) et '1' (t) satisfassent au système d'équations
dx _ f ( ) === aQfC ('\l', x, u)
dt - x, u - ô '\1' '
m
d"" === _ aQfC ('\l', x, u) + Â aPa (x, u)
dt ÔX LJ a ôx '
a=1
que soit remplie la condition de maximum
QJ£ ('1' (t), x (t), u (t)) === m ('1' (t), x (t)),
en outre
m ('1' (t), x (t)) == 0;
les fonctions  i (t), i == 1, . . ., m, t o t t i , continûment déri-
vables par morceaux sont définies à partir de la condition de maximum
com"e les multiplicateurs de Lagrange dans la formule
m s
aQfC ("", x, u) == Â ôPa (x, u) + v aqa(u) .
au LJ a au LJ a au '
a=1 a=1
et de plus,
11'0 == const o.
La solution du problème optimal dans laquelle les égalités (70)
sont remplacées par les inégalités
Pi (x, u) 0, . . ., Pm (X, u) 0
(71)
se ramène aisément au théorème formulé.
En effet, en introduisant m paramètres scalaires auxiliaires de
commande Vi' i == 1, . . ., m, tels que Vi 0 et en considérant au
lieu des inégalités (71) les égalités
Pi (x, u) + Vi == · . . == Pm (X, U) + V m == 0,
nous retrouvons les conditions du théorème 23.
So:ulignons enfin que le théorème 22 se généralise immédiatement
lorsque le domaine G est défini au voisinage de son bord par plusieurs,
par exemple par deux inégalités
gi (x) 0, g2 (x) 0,
la trajectoire op timale régulière étant si tuée sur une « arête» de
dimension n - 2 définie par les équations
gt (x) === g2 (x) == o.
Il est en outre naturel d'admettre que les hypersurfaces
g1 (x) == 0, g2 (x) === 0
266
PROCESSUS AVEC CONTRAINTES SUR LES COORDONNÉES
[CH. 6
. 8g j (X)
sont en général situées sur la trajectoire, l.e. les vecteurs 'j ,
(X
8g 2 P (x) sont linéairement indépendants.
8x
9 36. Condition de saut
Une trajectoire optimale contenue dans un fermé G, peut être
située partiellement sur un noyau ouvert de G, et partiellement SUl'
le bord de G. Le principe du maximum et le théorème 22 s'avèrent
insuffisants pour suivre une telle trajectoire d'une manière univoque.
En effet, le principe du maximum donne un systèn1e complet de
conditions nécessaires que vérifie toute portion de trajectoire opti-
male entièrement contenue dans un noyau ouvert de G et le théorèn1e
22 donne des conditions nécessaires que vérifient les portions entière-
ment contenues sur le bord de G. Il ne manque que la con d i -
t ion .d e con j u gai son que vérifie toute paire de portions
de trajectoire optimale contiguës, dont l'une est contenue dans un
noyau ouvert de G et l'autre sur le bord de G. Nous appellerons cette
condition, con dit ion des a u t pour le vecteur fonction
1J' (t), qui est susceptible de subir une discon tinui té lors du passage
d'une portion à l'autre (voir énoncé du théorème 24).
Démontrons tout d'abord un lemme simple dont nous aurons
à nous servir plus loin.
Lem m e. Soient x (t), t o t t 17 une trajectoire de l'équation
(5) située dans un fermé G et correspondant à une certaine comlnande
admissible, et x (t o ) l'unique point de cette trajectoire contenu sur le
bord g (x) == 0 de G. Si le vecteur ôx (t o ) n'est pas tangent à g (x) == 0
au point x (t o ) et s'il est dirigé vers l'intérieur du domaine G, alors
la trajectoire perturbée x* (t), t o t t 17 satisfaisant à la condition
initiale x* (t o ) == X (t o ) + ëÔX (t o ) est entièrement contenue dans un
noyau ouvert de G.
D é mon s t rat ion. Nous avons
x* (t) = x(t) + 8ÔX (t) + 0 (8), ( al! (:to» , ôx (t o ) ) = a,<O.
Pour des ë > 0 suffisamment petits, la grandeur
g (x* (t)) = g(x (t)) + 8 ( ag <:x(t)) , ôx (t) ) + 0 (8), to t <:. t 1
est donc négative. En effet, pour des valeurs de t > t o voisines de t o
cela résulte des inégalités
g (x (t)) <0, a <0.
.16.]
CONDITION DE SAUT
267
Pour des valeurs de t éloignées de t o , la grandeur 1 g (x (t)) 1 est plus
grande que
1 8 ( ô g : (t) ) , ôx (t) ) + 0 (8) 1 '
et de plus g (x (t)) < O.
Soient u (t), t o t t 17 une commande admissible et x (t) une
trajectoire correspondante (pas forcément optimale) de l'équation
(5) entièrement contenue dans le fermé G. Certaines portions de
trajectoire peuvent se situer sur le bord du donlaine G, d'autres
peuvent être contenues à l'intérieur du domaine, i.e. dans un noyau
ouvert du domaine G.
Nous appellerons point de jonction, le point x Ct) de la trajectoire
portée par le bord du domaine G si t o < T < t i et s'il existe un
(J > 0 LeI qu'au moins une portion de trajectoire x (t) soit contenue
dans un noyau ouvert de G pour T - cr < t < T ou pour T < t <
< T + (J. Pour fixer les idées, nous supposerons dans la suite que
la portion de trajectoire qui est contenue à l'intérieur du domaine G
correspond à T - (J < t < T. Nous appellerons T l'instant de jonc-
tion.
Nous allons considérer, sans le spécifier, des trajectoires admet-
tant un nombre fin i de points de jonction.
Nous dirons qu'une trajectoire x (t), t o t t 17 entièrement
contenue dans le fermé G, est régulière si l'une quelconque de ses
portions située sur le bord g (x) == 0 du domaine G est régulière.
Supposons que u (t), t o t t i , est une commande optimale
et x (t )une trajectoire optimale régulière correspondante de l' équa-
tion (5), entièrement contenue dans le domaine G. Soit x (T) un point
de jonction de la trajectoire x (t), t o t t i . Désignons par Ti <
< t < T2 le plus grand intervalle de temps t o t t i contenant
l'unique instant de jonction T. La portion de trajectoire correspon-
dant donc à l'intervalle Ti < t < T est contenue dans un noyau
ouvert de G; quant à la portion correspondant à T < t < T2, soit
elle est entièrement située sur le bord g (x) == 0, soit elle appartient
aussi à un noyau ouvert du domaine G et alors le point x (T) est
l'unique point de la portion x (t), Ti < t < T2, situé sur le bord
du domaine G.
La portion x (t), Ti t T, satisfait donc au principe du maxi-
mum (voir page 234). La fonction non nulle
'i'-(t)==(1Po(t), 1Pi(t), ..., 'Pn(t)), T1t<'t, (72)
correspondant à cette portion est continue et satisfait au système (15)
du chapitre 1. La portion de x (t), T t T2, satisfait soit aux
conditions du théorème 22 (si elle est située sur le bord g (x) == 0),
soit au principe du maximum (si elle est contenue à l'intérieur du
domaine G). La fonction non nulle correspondante
1J'+ (t) == ('Pt) (t), 'l't (t), ..., 1P (t)), T <: t T2, (73)
268
PROCESSUS AVEC CONTRAINTES SUR LES COORDONNÉES
[CH. 6
est continue et satisfait soit au système (10) et (11) et aux condi-
tions du théorème 22, soit au système (15) du chapitre 1.
Nous dirons que la condition de saut est satisfaite au point de
jonction x (-t) de la trajectoire optimale régulière x (t), t o t th
entièrement contenue dans le fermé G s'il existe une portion de tra-
jectoire x (t), 'tl t 't2, telle que 'tl < t < 't2 soit le plus grand
intervalle ouvert de t o t t 1 renfermant l'unique instant de
jonction 't, et si les fonctions (72) et (73) définies ci-dessus pour les
portions x (t), 'tl t 't, et x (t), 't t 't2, peuvent être choisies
de manière à satisfaire à l'une des deux conditions suivantes (qui,
comme il est aisé de le voir sont incompatibles):
'i'+ ('t) == 'i'- ('t) + l1 grad g (x ('t)), (74)
'i'- ('t) + l1 grad g (x ('t)) == 0, l1 =1= 0, (75)
où l1 est un nombre réel. Si la portion x (t), 't t 't2, est située
sur le bord g (x) == 0, alors la condition (74) est équivalente à la
condi tion
'i'+ ('t) == 'i'- ('t),
puisque la valeur initiale 'i' + ('t) de la fonction 'i' + (t), 't t 't 2,
peut varier d'un vecteur arbitraire de la forme grad g (x ('t)) (voir
remarque 4 du théorème 22).
Thé 0 r è m e 24 (condition de saut). Si une trajectoire optimale
régulière de l'équation (5) contenue dans le fermé G admet un nombre
fini de points de jonction, alors en chacun de ces points est vérifiée la
condition de saut.
D é mon s t rat ion. Soient u (t), t o t t 1 , une commande
optimale, x (t) une trajectoire optimale correspondante, x ('t) un
point de jonction et 'tl < t < 't2 l'intervalle maximal renfermant
l'unique instant de jonction L. Pour fixer les idées nous supposerons
que la portion x (t), 'tt < t < 't appartient à un noyau ouvert de G
et la portion x (t), 't t 't2 est située sur le bord g (x) == o.
Le point.x ('tl) peut se trouver aussi bien à l'intérieur du domaine
G que sur son bord. Nous supposerons pour commencer que ('t 1)
est situé à l'intérieur du domaine G. Dans ce cas il est évident que
'tl == t o -
Introduisons l'équation
ds
(ft== -f(s, v) (7G)
que nous résoudrons sur l'intervalle 0 t 't - 'tl + 868, où 68
est un nombre réel arbitraire. Il est évident que l'équation (76)
admet pour solution les fonctions
v (t) == u ('t - t), S (t) == X ('t - t), 0 t 't - 'tl + 868.
(77)
36.]
CONDITION DE SAUT
269
Désignons par A-r-'tb 0 un opérateur de translation le long de la
trajectoire (77) de l'équation (76) (voir page 78). Supposons par
ailleurs que L\; désigne le vecteur de déplacement (voir formule (22),
chap. 2) pour une trajectoire perturbée quelconque de l'équation (76).
Soi t, enfin, 8;0 un vecteur quelconque issu de x (L) qui, soit est
dirigé vers l'intérieur du domaine G (Le. Îl'est pas tangent au bord
de G), soit est nul. Sous ces conditions est défini un vecteur
ô = A,;_-r1, 0 (8;0) + L\;, (78)
que nous supposerons issu du point x (Li). L'ensemble des vecteurs
(78) engendre un cône convexe J( de sommet au point x (Li) ==
== ; (L - Li) (voir page 86). Désignons par K* le cône défini au
33 et étudions-le pour la trajectoire x (t), L t L2. Le point
x (L2) est le sommet du cône K*. Ce dernier est situé sur le plan
T (x (L2)) tangent au bord g (x) == 0 en x (L2) et est engendré par
les vecteurs de la forme
ô* = P-r2, -r (aIl) (8x ('t)) + L\x, b (79)
(voir formule (53») issus du point x (L2).
Il est important de souligner que la trajectoire perturbée ;* (t)
est entièrement contenue dans le fermé G pour ê suffisamment petit.
En effet, si 6;0 == 0 la portion initiale de trajectoire ;* (t) est
confondue avec la trajectoire; (t) et alors les points de la trajectoire
;* (t), pour t > 0, sont intérieurs au domaine G. Si, au contraire,
6So =1= 0, alors en vertu du choix du vecteur 6;0' notre assertion
découle du lemme (voir page 266).
La trajectoire x* (t) est aussi contenue dans le fermé G (voir
33).
Soit maintenant le produit direct
I( X K* c X X T (x (L2») (80)
des cônes Ii. et Il. *. Ce produit est aussi un cône convexe.
I?ésignons par QJC le cône convexe contenu dans K X K* et en-
gend'ré par toutes les paires possibles de vecteurs (78), (79) telles que
8;0 == 8x (L). (81)
Soit, par ailleurs, k le cône convexe défini au 14 et étudié
pour la trajectoire ; (t), 0 t L - Li et k*, celui défini au 33
pour la trajectoire x (t), L t L2. Il est évident que k c K,
k* c 1(*, d'où
QJC -:::::>k X x (L2)' QJC::Jx (Li) X k*. (82)
Désignons par L le rayon issu de x (L2) et orienté dans le sens du
demi-axe négatif xo. Montrons que le rayon x (Li) X L qui est con-
tenu dans le produit direct K X T (x (L2»' n'est pas un rayon
intérieur au cône QJC.
270
PROCESSUS AVEC CONTRAINTES SUR LES COORDONNÉES
[CH. ()
Supposons l'inverse. Alors, tout comme au 34, pour un B > 0
suffisamment petit, quelconque, on peut démontrer qu'il existe des
trajectoires perturbées
;* (t), 0 t 't - 'tl + eôf), x* (t), 't t 't2 -t- eôt, (83)
dont les déplacements initiaux satisfont à la condition (81) et telles
que le point
;* ('t - 'tl + eôf)), x* ('t2 + eôt) (84)
est situé sur le rayon x ('ti) X L et n'est pas confondu avec son
origine x ('ti) X x ('t2). Autrement dit,
;* ('t - 'tl + eôf)) == x ('ti),
x* ('t2 + eôt) == (x ('t2) + Â (-1, 0, . . ., 0), (85)
où Â > O.
Définissons une commande optimale ii (t), 'ti - eôf) t
't2 + eôt et une trajectoire correspondante x (t), 'ti - eôf)
t 't2 + eôt de l'équation (5) au moyen des formules:
,-
u (t) == v* ('t - t), x (t) == ;* ('t - t) pour 'tl - eôf) t 't,
u (t) == u* (t), x (t) == x* (t) pour 't t 't2 + BÔt
où ; * (t) et x * (t) sont les trajectoires pert ur bées (83), v* (t) et u * (t)
des commandes correspondantes. Il est évident que les fonctions
u (t), x (t), 'tl - BÔf) t 't2 + eôt, obéissent à l'équation (5).
La trajectoire x (t), 'ti - eô8 t 't2 + eôt, étant continue au
point 't en vertu de la condition (81), elle l'est sur l'intervalle
'tl - eôf) t < 't2 + eôt tout entier. De plus, d'après (85) il
vien t :
X ('ti - 8ô8) == x ('ti),
X ('t 2 -1- Bôt) == (X O ('t 2) - Â, Xl ('t 2), . . ., x n (-t 2», Â > O.
Or ces inégalités contredisent le fait que la portion x (t), 'ti t 't2,
de trajectoire optimale x (t), t o t t 17 est également optin1ale.
Ainsi donc le rayon x (t i ) X L n'est pas un rayon intérieur an
cône 6'JC. De l'inclusion (80) il résulte que la dimension du cône f!JC
vérifie l'inégalité dim 6'JC 2n + 1.
Il existe donc un plan d'appui de dimension 2n au cône 6'Jî dans
son somn1et x ('ti) X x ('t2) qui est situé sur le produit direct
X X T (x ('t2» et qui sépare le cône 6'JC du rayon x ('ti) X L. J)ési-
gnons par (X, X*) un vecteur issu du point x ('ti) X x (-t2)' orthogonal
à ce plan, contenu dans X X T (x ('t2») et orienté de telle sorte que
le rayon x ('ti) X L soit contenu dans le demi-espace fermé portant
le vecteur (X, X*) et le cône 6JC dans l'autre.
36.]
CONDITION DE SAUT
271
Nous avons:
X* == (xô, X!, ..., X) E T (x (L2))' (86)
((X, X*), (ô, ô*))==(x, ô)+(X*, ô*)<O, X<O, (87)
où les vecteurs ô, ô* sont définis par les formules (78) et (79) (avec
la condition (81)). D'un autre côté,
(X, x*) =1= 0
(88)
et les vecteurs "Iv, X* ne s'annulent donc pas simultanément.
Désignons par
(t), 0 t L - Lt,
(89)
la sol u Lion de 1 ' équation
__ al (s (t), v (t)) b
dt -- as '
satisfaisant à la condition aux limites
b (L - Lt) == "Iv,
où la fonction S (t) est définie par la formule (83) et v (t) est une
commande correspondante. Désignons par
'i'+ (t), L t L2, (90)
la solution de l'équation
d'l' == _ a f (œ ( t), u (t)) ta 1,
dt ax 't
avec la condition aux limites
'i' (L 2) == X * .
En vertu des inclusions (82), il vient, tout comme au chap. 2 et
a u 34:
( - (t), t" (s (t), v (t))) == Q1[ ( - (t), S (t), v (t)) == )
== dt(-b (t), s (t)) == 0, 0 t L - Lt, 1
QJe (1\J+ (t), x (t), u (t)) = m (1\J+ (t), x (t)) = 0, 1 (91)
L t L2. )
Outre la deuxième égalité (91), la fonction 'i'+ (t), L t L2, satisfait
à toutes les conditions du théorème 22 à l'exclusion, peut-être,
de la condition b) puisque l'égalité x* == 0 et, par conséquent,
l' égali té 'i' + (t) == 0 sont possibles.
Su pposons que
'i'- (t) == - (L - t), Lt t T.
(92)
272
PROCESSUS A VES CONTRAINTES SUR LES COORDONNÉES
[CH. 6
Il est alors évident que
d",- (t) _ _ â f (x (t), u (t)) ,,1'1_
dt - ✠'Y' "i'-('tt)=-X, 'tlt't,
Qï8 ('i' -, ( t) , x (t), u (t)) == ait (11' - (t), x (t)) == O.
De l'inégalité (88) il résulte qu'au moins une des deux fonctions
11'- (t), "i'+ (t) est non nulle. Dans la suite nous démontrerons que
précisément "i'- (t) =1= 0 et par conséquent, la fonction "i'- (t) satisfait
à toutes les conditions du principe du maximum.
Prouvons maintenant que soit
"i' + ('t) == "i' - (T) + !-t gr a d g (x (T)), "i' - (t) =1= 0,
soit
"i' - (T) + gr a d g (x (T)) == 0, =1= o.
Les conditions de saut seront démontrées par là même puisque
la fonction "i' - (t), T 1 t T, peut être prise pour fonction (72),
et la fonction "i'+ (t), T t T2, pour fonction (73) pourvu que
11'+ (t) =1= o.
Choisissons les trajectoires perturbées s* (t) et x* (t) de la ma-
nière suivante.
Posons
ôe == ôt == 0, v* (t) == v (t), ÔSo == -N,
où N est un vecteur arbitraire non tangent en x (T) au bord g (x) == 0
et dirigé vers l'extérieur du domaine G. Ces données définissent
d'une manière univoque la trajectoire perturbée s* (t). Pour définir
la trajectoire perturbée x* (t) nous admettrons que le symbole a est
vide et que le symbole b est réduit au seul point l == x (Ti) :
v== {t == X (Ti), al (x), N, ô == 1}.
D'où, en vertu de (47),
ÔX (T) == -N == 6so,
i.e. la condition (81) est satisfaite.
Pour les vecteurs définis par les formules (78) et (79) nous obte-
nons les expressions (voir (53) et la formule (22), chap. 2):
n
Ô == - AL-Li, 0 (N) == - CPCG ('t - Li) Na, (93)
a=O
n L2
ô* = a ('r2) ( - N + J (1I'a (t), A (t)) :: dt, (94)
CG=O L
où
n n
CG'-' CG
L1 CPCG (0) N == LJ CPCG (T) N * == T.
CG=O a=O
S 36.J
CONDITION DE SAUT
273
Ici <Po (t), . . ., <Pn (t), 0 t l' - 1'1, représente un système
fondan1ental de solutions de l'équation aux variations associée à
l'équation (76).
Désignons par "'0 (t), . . ., ",n (t) un système de fonctions conju-
guées de (j)o (t), . . ., <Pn (t). Nous avons
n
-(X, ô)== h (X, <pa (L-L1)N a )==
rJ.=o
n n
== (XB'i'/3 (1' - 1'1), <pa (1' - Li) Na) === L XaNa ((O), .i\T),
a, B=O a=O
a
où (0) == X a'" a (0) est la valeur ini tiale de la fonction (89).
n=O
De (92) il vient:
( X, ô) == ('" - (), 1\"T).
L' égali té (94) donne de même:
(95)
"C2
(x*, ô*)= -(1jJ+('r), iY)+ ) (1jJ+(t), A(t)) dt=
"C
'(2
= - (1jJ+ (-c), .LV) - ) Â, (t) : dt,
"C
où Â (t) == - (",+ (t), A (t». Compte tenu de (42), une intégration
par parties donne:
(x*, ô*) = -- (1jJ+ (-c), N) - [ Â, (t) ai (x (t)) ( f)g: (t)) , N) J 1: 2 +
12
+ ) ; adx (t)) ( f)g: (t)) , N) dt = - (1jJ+ (-c), N) +
"C
"C2
+ Â, (-c) ( f)g <:X(T)) , N) + ) ; ai (x (t)) ( f)g: (t)) , N) dt.
't'
En ajoutant cette expression à (95) et en tenant compte de (87),
nous obtenons
(x' ô) + (x*, ô*) = (1jJ- (-c) -1jJ+ (-c) + Â, (-c) ( f)g X(T)) , X) +
"C2
+ r a ( X ( t )) ( Dg (x (t)) :\r ) dt 0
J dt 1 f)x' ...L .
"C
(96)
18-013:3U
274
PROCESSUS AVEC CONTRAINTES SUR LES COORDONNÉES
[CH. 6
La quantité
1:'2
) ; ai (x (t)) ( Qg :(t)) , N) dt
1:'
peut être rendue arbitrairement petite pour T donné par le choix
du voisinage O1 qui a contribué à définir la fonction ai (x), tandis
que le premier terme de l'expression (96) ne dépend pas de ce voisi-
nage. Donc, tout vecteur T non tangent en x Ct) au bord g () et
dirigé vers l'extérieur de G obéit à l'inégalité
(",- (17) - "'+ (17) + Â (17) grad g (x (17)), l\T) 0, (97)
ce qui, puisque le vecteur T est arbitraire, est équivalent à l'égalité
"'+ (17) === 'i'- (17) + grad g (x (17). (98)
Le vecteur", - (17) =1= 0, puisque l' égali té '" - (17) === 0 et l' inéga-
lité (88) entraînent l'inégalité "'+ (17) =1= 0; d'autre part, nous obte-
nons de (98) l'expression
'" + (17) === gr a d g (x (17) =1= 0,
qui contredit, en vertu de la relation", ( 17 2) === x*, l'inclusion (86).
Lorsque "'+ (17) === 0, il vient
'i'- (17) + grad g (x (17») === 0, =1= o.
Le théorème (24) est donc démontré dans le cas où x (171) est
un point intérieur au domaine G.
Supposons maintenant que le point x (Li) est situé sur le bord
g (x) === O. Ce cas se ramène aisément à celui que nous venons de
considérer: il suffit pour cela de définir la fonction "'8 (t) sur l'inter-
valle e t L, où Li < e, et ensuite faire tendre le point e vers
Li; nous obtenons une famille de fonctions "'ë (t), e t L, pour
lesquelles existe la fonction limite cherchée "'- (t), Li t L.
Rem a r que 1. Si la portion de x (t), 17 < t < 17 2 , appartient
aussi à un noyau ouvert du domaine G, l'inégalité (97) est relnplacée
par l' inégali té
(",- (17) - ",+ (17), 1\1) 0,
d'oÙ. découle l'égalité
'i' + (17) === '" - (17) -1- gr a d g (x (17», O.
Rem a r que 2. Si la portion de x (t), 17 t 17 2 , est située
sur le bord g (x) == 0, le vecteur grad g (x (17» et le vecteur
je (x (17), U (17 + 0» sont orthogonaux et la condition de saut donne:
("'- (17), f (x (17), U (17 - 0») ==
=== (",- (17) + grad g (x (17», j. (x (17), U (17 -t- 0)) ==
=== ('i' - (17), f (x (17), U (17 + 0») == (?1ft (", - (17), X (17») == o.
37.] FOR:rvIULATION DU RÉSULTAT FONDAMENTAL. EXEMPLES 275
D'où il résulte que si le système d'équations par rapport à u
( '" - ('t), j. (x ('t), u)) == &ft == 0
admet la solution unIque
u ('t - 0) == u ('t + 0),
alors le vecteur
j. (x ('t), U ('t - 0)) == J. (x ('t), U ('t + 0))
est tangent en x ('t) au bord g (x) == 0; en d'autres termes, la tra-
jectoire optimale reste continûment dérivable au point de jonction
x ('t).
R e TI1 a r que 3. Pour une trajectoire optimale située sur un
bord con t i n û men t d i f f é r e n t i a b 1 e par morceaux du
domaine G (jusqu'ici nous avons considéré un domaine G de bord
continûment différentiable), les équations de chacune de ses portions,
entièrement située sur une portion continûment différentiable du
bord, ont été établies au 32. Lorsque cette trajectoire passe d'une
portion continûlnent différentiable du bord à une autre, alors sont
satisfaites des conditions de saut tout à fait identiques aux condi-
tions (74) et (75).
9 37. Formulation du résultat fondamental. Exemples
En composant les théorèmes 22, 24 et le principe du maximum,
nous obtenons le théorème suivant qui fournit un système complet
de conditions nécessaires que doit satisfaire toute trajectoire opti-
Inale régulière qui est solution du problème optimal du 9 31.
rr h é 0 r è ln e 25. Supposons qu'une trajectoire optimale de
l'équation (5) soit entièrement contenue dans un fermé G, qu'elle adlnette
un nombre fini de points de jonction et que chacune de ses portions située
sur le bord de G soit régulière. Sous ces conditions, toute portion de
trajectoire contenue dans un noyau ouvert de G (à l'exception peut-être
des extrémités de la trajectoire) satisfait au principe du maximum;
toute portion de cette trajectoire située sur le bord de G vérifie le théorème
22; en tout point de jonction est remplie la condition de saut (théorè-
me 24).
Ixelnple 1.
Les conditions de saut sont valables aussi pour le problème
optimal suivant.
Supposons que l'espace de phase X est divisé en deux parties,
notées X 1 et X 2' par 1 'hypersurface g (x) == O. Supposons que dans
la partie X 1 l'équation du mouvement du point représentatif est
= j (x, u),
18*
276
PROCESSUS A VEC CONTRAINTES SUR LES COORDONNÉES
[CH. 6
et dans la partie .LY 2
=12 (x, u).
On demande de choisir une cOlnmande admissible telle que le point
représentatif, en partant de Xi E X i aboutisse sur une droite TI c X
parallèle à l'axe XO et que soit minimale la coordonnée XO de l' extré.
mi té de la trajec toire.
Dans chaque partie .K i et X 2' les trajectoires du mouven1ent
satisferont au principe du maximlun et lors de la traversée de la
frontière g (x) == 0 sera remplie la condition de santo
En déduisant la condition de saut dans le cas considéré, le dépla-
cement initial de la trajectoire variée doit se trouver rigourenseInent
sur la frontière g (x) == O. C'est pourquoi il est impossible d'utiliser
le lemme de la page 266, et la démonstration du 36 ne passe que
si aucun des vecteurs f.i (x (1'), U (1' - 0)), /.2 (x (1'), U (1' -+- 0))
n'est tangent à l'hypersurface g (x) == 0 au point de jonction x (1').
E x e ID pIe 2.
Si l'on étudie un problème variationnel ordinaire, les conditions
connues de réfraction des extrémales découlent immédiatement des
conditions de saut. Ce que nous allons voir sur un problème varia-
tionnel simple.
Supposons que le plan engendré par les variables x ot y est partagé
en deux parties, notées Xi et X 2' par la ligne g (x, y) == 0 et soient
deux points (Xi' Yi) E Xi' (x 2 , Y2) E X 2 . On demande de relier ces
points par une ligne Y == Y (x) continue et contini'unent différen-
X2
tiable par morceaux qui minimise la fonctionnelle J F (x, y, y') dx,
Xi
OÙ (fi et f 2 sont des fonctions continûment dérivables)
F ( ') == { fi (x, y, y') pour (x, y) E Xi
x, y, y f 2 (x, y, y') pour (x, y) E X 2.
Posons
X2
XO = J F (x, y, yr) dx, Xl = x, x 2 = y,
Xi
,
u==y.
Le domaine de commande U est un ouvert de la droite nurnérique.
Le principe du maximum s'écrit (on dérnontre aisén1ent que
1Po =1= 0, et donc on peut prendre 1Po == -1):
dx O dx 1 dx 2
dt == F (x, y, y'), dl == 1, dt == II == y' ;
d,po _ d1Pi oF d1!'2 aF.
dt - 0, dl == iJx ' dt Dy'
QJB == - F (x, y, y') + 'Pi -1-'P2Y' == max == O.
37.] FORMULATION DU RÉSULTAT FONDAMENTAL. EXEMPLES 277
Les conditions Q)£ === max et QJ[ === 0 donnent respectivement:
aF F ap ,
...."" 2 - , ....""1 === - 8y ' Y ·
'Y - d!J' 'Y
De la condi tion de saut 11'+ === 11'- + f.1 grad g (x, y) il résulte:
t - iJf2 ( + ) ' === f _ aft (y - ) ' + IINI 8f2 === 8ft + 11N2
2 8!J' Y 1 8y' r' iJy' 8y' r ,
où (NI, N2) est le vecteur de la normale à la ligne g (x, y) === 0 au
point de réfraction de la trajectoire. Soit Y' l'inclinaison de la
tangente à g === 0 au point de réfraction. Nous avons:
8f2 8ft
---
iJy' 8y' 1
/ -f + aft ( - ) '_ 8f2 ( y+ ) ' === -¥',
2 1 8y' Y 8y'
d'où nous déduisons une formule connu (voir Gunter « Cours de
calcul variationnel ». 1'l.-L., 1941)
fi + :; (Y' - (y-)') = f2 + ; (Y' - (y+)').
E x e m p 1 e 3.
A titre d'illustration considérons le problème géométrique sui-
vant. Dans un espace euclidien X de dimension n, engendré par
la variable x === (Xl, . . ., Xn), on définit un fermé B par g (x) 0,
le bord
g (x) === 0
(99)
du fermé B étant une surface régulière continûment différentiable
à courbure continue, i.e. la fonction g (x) est deux fois continûment
différentiable et le vecteur grad g (x) ne s'annule en aucun point
de g (x) === O. On donne par ailleurs deux points Xo et Xi dans B et
on demande de trouver dans B une courbe C de longueur minimale
reliant les points Xo et Xi.
Nous allons montrer que du théorème 25 découle le résultat
géométrique évident suivant. Supposons que la courbe C de longueur
minimale est constituée de plusieurs portions tantôt contenues dans
un noyau ouvert de B (à l'exception peut-être des extrémités de
toute portion) tantôt sur le bord (99). Les portions contenues dans
un noyau ouvert de B sont alors des segments de droite et celles
situées sur le bord (99) sont des géodésiques sur la surface (99),
le vecteur de la principale normale à la courbe C étant dirigé vers
l'extérieur de B; enfin, la portion droite contenue dans un noyau
ouvert du domaine B est tangente à la surface (99) aux points de
jonction de deux portions contiguës. La courbe C ne possède donc
pas de points anguleux.
278
PROCESSUS AVEC CONTRAINTES SUR LES COORDONNÉES
[CH. 6
Pour les besoins de la démonstration considérons le problème
optimal suivant. Etant donné un système d'équations
dx i i
dt == u, i == 1, ..., n,
où le vecteur de commande u == (u l , . . ., un) est assujetti à la
condi tion
n
(u, u)== (Ui)21,
i=1.
i.e. le domaine de commande U est une boule unitaire, on demande
de trouver dans B une trajectoire qui relie en tenlps minimal le
point Xo au point Xi.
Soit x (t), t o t t b une telle trajectoire optilnale possédant
un nombre fini de portions tantôt contenues dans un noyau ouvert
de G, tantôt situées sur son bord. Désignons par u (t) la commande
optimale correspondante. Des conditions de maximum (théorènles 2
et 22), il vient immédiatement 1 u (t) 1 == 1 et le paramètre test
donc la Ion g u e u r d e l'a r c sur la ligne X (t). Il s'ensuit
que la ligne x (t) est solution du problème géolnétrique posé.
Prouvons maintenant les propriétés de la courbe C énoncées
ci-dessus. Le fait que les portions de courbe contenues dans un noyau
ouvert de B sont des segments de droite découle ilTImédiatement
du théorème 2.
Considérons maintenant la portion située entièrenl0nt sur le
bord du domaine B. Le domaine de comlnande U est défini par une
seule relation
q (u) == (u, u) - 1 O. (100)
D'autre part, la fonction p (x, u) (voir (6)) est de la forme
p (x, u) == (gr a d g (x), u). ( 101 )
Sur la portion de courbe x (t) considérée on a
p (x, u) == (grad g (x), u) == O. (102)
Le système d'équations par rapport aux variables (voir (10)) s'écrit
n
d'Pi == Â !.L == Â ô 2 g (x (t)) ua == Â ag (x (t)) ,
dt ôxi 8xi axa dt ôxi
a=l
i == 1, ..., n,
ou
d'f' d
di: == Â dt grad g (x (t)).
( 103)
On a
QJ8 == 'Po + ('P, u),
(104)
37.] FORMULA'rION DU RÉSULTAT FONDAMENTAL. EXEMPLES 279
et donc 'lpo =1= 0 (dans le cas contraire 'lIJ =1= 0 et le maximum de la
quantité ('lIJ, u) serait non nul, ce qui contredit la relation (11)).
Par suite, nous pouvons poser 'lIJo == -1 et la condition de maxi-
mlun (11) s'écrit:
('lIJ, u) == max == 1.
(105)
(106)
En vertu de (100),
grad q (u) == 2u,
et donc (voir (104), (8), (101), (106))
iJQJC f) p iJq
- ==-= '1h === Â - _L V - == Â g rad g ( x ) -'- 2vu.
iJu iJu iJu T
( 107)
En multipliant scalairement par u l'expression 1P == Â grad g (x) +
+ 2vu, nous obtenons, compte tenu de (105) et (102):
1 == ('lp, u) == À (u, grad g (x)) + 2v == 2v.
La formule (107) s' écri t donc
'lIJ == À grad g (x) + u,
d'où (voir (103))
; grad g (x (t)) + = O.
C .. . f . 1 d 2 .x(t) du(t) dÎv d ( ( ))
e qUI sIgnl le que e vecteur dt 2 === dt == - dt gra g x t
est colinéaire avec la normale à la surface (99), et la courbe x (t) est
donc une..géodésique sur la portion considérée, le vecteur de sa nor-
male principale d;t) étant dirigé vers l'extérieur du domaine B
(voir condition c) du théorème 22).
Enfin, de la condition de saut on déduit sans peine que la courbe
x (t) ne possède pas de points anguleux.
CHAPITI-,E 7
Un problème statistique
de commande optimale
Dans les chapitres précédents on a vu comment résoudre le problè-
me optimal consistant à transférer un objet con1mandé d'une posi-
tion donnée à une autre (ou sur une variété donnée). Ce problème
peut être interprété comme un problème consistant à faire atteindre
à un objet commandé un objet immobile en temps optimal.
En technique, cependant, on est conduit dans de non1breux cas
à poser un autre problème, celui de la poursuite d'un objet mobile
par un objet commandé. On peut faire les suppositions les plus diver-
ses quant au mouvement de l'objet poursuivi. On peut par exen1ple
supposer qu'il est con1mandé (cf. 28). Soit un objet x dont le mouve-
ment est régi par le système d'équations différentielles ordinaires
. . .
x == t (Xl, x 2 ,
n 1 2 r )
., X , U , U, . . ., U ,
i == 1, . . ., n,
et un objet y dont le mouvement est régi par le système
. . .
_ ( 1 2 n 1 2 S )
y - g y, y , . . ., y , v , V, . . ., v ,
i == 1, . . ., n,
où u i sont les paramètres de commande de x et Vi ceux de y, et x, y
des vecteurs d'un même espace de phase X.
On peut alors poser le problème suivant. Connaissant les perfor-
mances techniques de l'objet y (i.e. son système d'équations diffé-
rentielles) et sa position à chaque instant t, choisir la commande u
de l'objet x à chaque instant t telle que l'objet x atteigne l'objet y
en un temps optimal (ou, selon un autre critère d'optin1alité), la
commande de y - et ceci est très important - n'étant pas supposée
connue pendant les instants à droite de t.
Tel qu'il a été énoncé le problème de poursui te n'a encore pas
été résolu à notre connaissance.
Dans le présent chapitre nous nous proposons de résoudre un
problème de poursuite légèrement différent. Plus précisément, nous
supposons connue la loi pro b ab i 1 i s t i que du comportement
de l'objet poursuivi y, cette loi étant m a r k 0 vie n n e et décrite
par une équation du type Focker-Planck-Kolmogorov.
Pour résoudre ce problème nous ferons appel à quelques notions
et résultats de la théorie des probabilités. Dans les 38 et 40 nous
citerons ces résultats sans toutefois les démontrer entièrement, nous
bornant simplement à quelques éclaircissements.
38.]
NOTION DE PROCESSUS MARKOVIEN
281
38. Notion de processus markovien.
L'équation différentielle de Kolmogorov
Supposons qu'un point se déplace aléatoirement dans un espace
de phase R de dilnension n. La connaissance de sa position x à l'ins-
tant cr définit univoquement la pro b ab i 1 i t é, notée P (cr, x, 't, E)
qu'il soit contenu dans un sous-ensemble mesurable E de l'espace R
à un instant arbitraire 't > cr. Dans ce cas, le mouvement de ce
point aléatoire est appelé processus sans effet ultérieur ou processus
markovien. Le mouvement de ce point est entièrement caractérisé
par la fonction
p (cr, x, 't, y), (1)
égale à la densité de probabilité P (cr, X, 't, E) au point y. La fonc-
tion p (cr, x, 't, y) vérifie de toute évidence la relation suivante
\ p (cr, x, 1:, y) dy = 1 (2)
&i
(ici et dans la suite l'intégration s'opère sur l'espace R tout entier,
si le domaine d'intégration n'est pas spécifié à priori). L'autre exprps-
sion dont le sens est clair porte le nom d'identité de A1arkov
p (cr, x, 1:, y) = p (cr, x, s, z) p (s, z, 1:, y) dz. (3)
Un processus aléatoire est continu si pour de petits intervalles
de temps, les coordonnées du point aléatoire ne subissent des varia-
tions sensibles qu'à une faible probabilité. Nous exigerons d'un
processus markovien une continuité plus forte à savoir: quel que
soit ô > 0, on doit avoir
1 i m Ai \ p ( cr - !1 cr, X, cr, y) dy == O.
o-o Llcr J
1 y-x 1;>.6
(4)
Nous allons maintenant déduire une équation différentielle qui
(sous certaines conditions supplémentaires) est satisfaite par la
fonction p (cr, x, 't, y). Cette équation obtenue pour la prelnière fois
par I(olmogorov porte le nom d'équation de f(olmogorov.
Supposons que:
a) les dérivées partielles
8 p (cr, x, 't, y) 8 2 P (cr, x, 't, y)
8xi 8x i 8x j
i, j==1, ..., Il.
existent et sont continues quels que soient cr, X, 't > 0, y;
b) quel' que soit ô > 0, existent les limites
lim Ai r (yi-xi)p(cr-l1cr, x, cr, y)dy==
a-O Llcr J
ly-x/<6
==bi(a, x), i===1, 2, ..., n; (5)
282
UN PROBLÈME STATISTIQUE
[Ch. 7
lim 8. 1 (J \ (yi - xi)(yj - x j ) P (a - a, x, a, g) dg =
(J- 0 ·
/lJ- x /<6
=2a ij (cr, x), i, j=1, 2 ..., n, (6)
la convergence étant uniforme en x dans les expressions (5) et (6).
Prouvons que dans ces conditions la fonction p (cr, x, 't, y) de cr
et x obéit à l'équation différentielle du deuxième ordre de type paraboli-
que (équation de [(olmogorov)
n n
iJp + )l a ij (cr, x) + b i (cr, x) iJ p . == O. (7)
iJO' LJ iJx1, iJx J L.J iJx1,
i, j=l i=1
D é D1 0 n s t rat ion. En vertu de l'identité de Iarkov (3),
il vient:
p (a - a, x, T, y) = ) p (a - a, x, a, z) p (a, z, T, y) dz. (8)
Compte tenu de (8) et de
) p (a - a, x, a, z) dz = 1, (9)
nous obtenons:
p (cr - cr, x, 't, y) - P (cr, x, 't, y) =
= J p (a - a, x, a, z) p (a, z, T, y) dz -
- p (a, x, T, y) J p (a - a, x, a, z) dz =
= J [p (a, z, T, y) - p (a, x, T, y)] P (a - a, x, a, z) dz.
En décolnposant l'intégrale sur R en deux intégrales respectivement
sur les domaines 1 z - x 1 < ô et 1 z - x 1 ô, et en développant
la différence p (cr, z, 't, y) - P (cr, x, 't, y) suivant les puissances de
Zi _ Xi, nous obtenons
p (cr-8O', x, 't, y)- P (cr, x, 't, y)
80'
=--= 8. 1 (J ) [p (a, z, T, g) - p ( a, x, T, y)] p ( a - a, x, a, z) dz +
1 Z-x 1>6
n
+ âp ((J x: 1", y) A1(J \ (Zi_Xi) P (a-a, x, a, z) dz+
x1. ü ...
i=l 1 z-x 1<6
n
+ 1 f)2 p (cr, x, 't, y) 1 ) ( i i ) ( j j )
- - z -x z -x X
2 iJxiiJxj 8cr
i,j=1 IZ-x/<ô
38.]
NOTION DE PROCESSUS MARKOVIEN
283
n
x p (cr - !1cr, x, cr, z) dz +
1 ô 2 P (cr, X, T, y)
L.J _ 2 .. X
ÔX ôx J
i, j=1
x lcr J 0 [/Z_XI2] p(cr-cr, x, cr, z)dz, (10)
1 z-x 1<6
Dans l'expression (10) passons maintenant à la limite pour
cr O. En vertu de (4) le premier terme du second membre
admet une lilnite nulle; la limite du deuxième terme est égale
(voir (5)) à:
n
bi(cr, x) ap(cr, x: 1:, y) ;
ôx 1
i=1
le troisième terme, con1pte tenu de (6), est égal à la limite
n
a ij (cr, x) a 2 p (cr,. x, , y) .
ÔX1 ôxJ
i, j=l
Le dernier tern1e, enfin, tend vers 0 pour ô O. Comme le premier
melnbre de l'égalité (10) ne dépend pas de ô, la limite du second
1nelnbre est
n n
a ij ( cr, x) a 2 p (cr,. x, , y) + b i (cr, x) a p. .
. . ôx 1 ôxJ. ôx'L
1, J=1 1=1
D'où nous déduisons que le premier melnbre de l'égalité (10) admet
pour ô 0 une lin1ite égale à
âp (cr, x, 't, y)
ôcr
La fonction p (cr, X, 't, y) est donc solution de l'équation (7).
Il s'avère même que p (cr, X, 't, y) est une solution fondamentale
de l'équation (7). Ce qui veut dire que la solution u == u (cr, x) de
l'équation (7) satisfaisant à la condition initiale donnée à l'avance
u (cr, x) - F (x), ( 11 )
O'-'t
où F (x) est une fonction donnée de n variables Xl, x 2 , . . ., .1: n ,
s'exprilne par la formule
u (cr, x) = J P (cr, x, "t, y) F (y) dy. (12)
En effet en dérivant l'intégrale du second membre de (12) par rapport
à cr et x et en utilisant l'équation (7) nous obtenons
n n
au x) + aH (cr, x) a 2 u (cr, x) + bi (cr, x) au (cr,. x) = 0,
L! ôxi ôxj L! ôx'L
i, j=l i=l
284
UN PROBLÈME STATISTIQUE
[Ch. 7
expression qui montre que la fonction u (cr, x) est bien solution de
l'équation (7).
La formule (11) se démontre de la manière suivante. Déconlpo-
sons l'intégrale sur R figurant dans le second membre de l'égalité (12)
en deux intégrales que nous prendrons respectivement sur les régions.
1 y - x 1 < ô et 1 y - x 1 ô. Puisque pour 1 y - x 1 ô nous
avons évidemment
p(cr, x, 'r, Y)---70,
O''t
en vertu de la continuité du processus, il vient
lim r p(cr, x, L", y)F(y)dy==lim r p(cr, x, L", y)F(y)dy.
O'-'t J O'-'t J
1 x-y 1<6
En utilisant la relation (2) et le fait que la limite à gauche ne dépend
pas de ô, nous déduisons
lim r p (cr, x, L", y) F (y) dy == F (x),
0'- 't J
ce qu'il fallait démontrer.
Soulignons encore une im portan te propriété de la fonction
p (cr, x, L", y) qui nous sera utile pour la suite. Soit à résoudre l' équa-
tion parabolique non hon10gène
n n
B u . . 8 2 u . iJ u , 3
- + LJ a J (cr, x) . . -t-- LJ b ( cr, x) ---:- == p (cr, x), 1 ( '1 )
Ba .. {)x âxJ. {)x
, J=1 =1
la fonction cherchée devant satisfaire à une condition initiale nulle.
1 l s' avère que si p (cr, x, L", y) est une so lution fondamen tale de l' équa-
tion homogène correspondante, alors la solution cherchée est donnée
par la formule
't
u (cr, x, 1:) = - ) ds J p ( cr, x, s, y) p (s, y) d Y . ( 14 )
0'
Ce qu'on démontre immédiatement par une dérivation.
9 39. Formulation exacte du problème statistique
Dans ce chapi tre nous désignerons par Zl, . . ., zr les coordonnées
de phase du point commandé. Ainsi, dans l'espace R le mouvement
du point z est décrit par le système d'équations différentielles ordi-
naIres
.
i _ f i ( 1 2 n 1 r ) . 1 2 ( 15)
z - z , z, . . . , z , u , . . ., u , l == , ,..., n,
où Ul, u 2 , . . ., ur sont les paramètres de commande. Comn1e précé-
demment nous supposerons que les fonctions fl (z, u) sont continues
:HL]
FORMULA'rION EXACTE DU PROBLÈME STATISTIQUE
285
en toutes leurs variables et continûment dérivables par rapport
'" 1 2 n
a z , z , . . ., z .
Supposons que dans l'espace R le point représentatif Q se déplace
aléatoirelnent, rnais de telle sorte que son mouvement soit un proces-
sus lnarkovien satisfaisant aux condi tions de continuité forte. Nous
avons vu dans le paragraphe précédent que le processus était caracté-
risé probabilistiquement par la fonction p (cr, X, 't, y) que nous
appellerons densité de transfert du point aléatoire Q. La densité
de transfert est donc solution fondamentale de l'équation (7). Nous
snpposerons dans la suite que le mouvement du point aléatoire est
donné par la fonction p (cr, x, 't, y).
Quant aux coefficients de l'équation (7) nous supposerons que:
1) aU (cr, x) et b i (cr, x), i, j == 1, 2, . . ., n, sont définis, conti-
nns et bornés pour cr > 0 quel que soit x ER; ..
2) toutes les valeurs propres de la matrice Il a 1J (cr, x) Il pour
ces valeurs des argulnents sont bornées supérieurement et inférieure-
ruont par des constantes positives.
Supposons que dans l'espace R le point commandé z se déplace
avec l'un de sos voisinages z, par exelnple une boule ou un domaine,
linlité par une surface quelconque continûment dérivable et bornée,
variant continûment avec z. Si l'on donne la loi de commande du
point z, i.e. le paramètre de cornmande u comme une fonction u ==
== II (t) continue par lnorceaux, le système d'équations différentiel-
los (15) définit d'une manière univoque ]e mouvement continu du
point z dans l'espace R. Si donc sont données les positions initiales
du point commandé zet du point aléatoire Q, alors est univoquement
définie la probabilité de rencontre du point Q avec le voisinage z
sur un intervalle fini de temps cr t 't ou sur un intervalle infi-
ni cr t < 00, etc. Cette probabilité est donc une fonctionnelle
de u (t). Et il est tout naturel de poser le problème qui consiste
à choisir la commande u (t) de z qui maximise cette fonctionnelle.
En vue de formuler rigoureusement le problème, introduisons
la fonction h (t) non négative et non supérieure à l'unité, définie
pour 0 t < 00. Soit d'autre part 'i'u (cr, x, t) la probabilité que
le point aléatoire Q qui se trouve en x à l'instant cr rencontre pendant
l'inlervalle de ternps cr t 't le voisinage z du point commandé z
(on suppose évidelnment que la position initiale du point z, i.e.
z (cr), est donnée). On demande de choisir la commande u (t) du point
z qui lnaximise la fonctionnelle
00
J = , h ( s) :s ['Pu (cr, x, s)] ds. ( 16)
b
Ia fonction h (t) définit le problèllle optimal, SI par exemple
h (t) = { 1, cr t 't,
0, t > T,
286
UN PROBLÈME S':rATISTIQUE
[Ch. 7
alors
J = 'i'u (cr, X, 't),
i.e. la fonctionnelle (16) est tout simplement la probabilité de la
rencontre du voisinage z avec le point Q sur l'intervalle cr t 'r.
La comn1ande u (t) et la trajectoire correspondante z (t) du systè-
me (15) qui réalisent l'extrémum de la fonctionnelle (if)) seront
di tes optimales. La résolution du problème se ramène donc au calcul
de la fonctionnelle (16), puis à l'application du principe du nlaxÏ1nzan.
La fonctionnelle (16) dépend évidemment des dimensions et de
la forme du voisinage z du point commandé z. Nous verrons dans
le paragraphe suivant que pour la calculer il faut résoudre le problè-
me aux limites pour l'équation parabolique aux dérivées partiel-
les (7). En outre, nous ne nous intéresserons pas tant à l'existence
de la solution qu'à une formule efficace qui nous donnera, ne fût-ce
qu'approxin1ativement, cette solution. On verra que cette formule
peut être établie si seulement le voisinage z est pris pet i t.
Mais le problème qui se pose est justement celui qui consiste à
« recouvrir » le point aléatoire Q par lIn petit voisinage cOll1n1andé.
Ainsi donc, dans la suite, à partir du 41, nous considérerons
que le voisinage z est petit. Pour simplifier, nous supposerons que
z est une boule de dimension n de rayon E et de centre au point z.
Cependant, le lecteur attentif remarquera que nos raisonneJnents
et le résultat obtenu ne changent pratiquement pas si pour z on
prend un domaine arbitraire de « rayon» petit, délimité par une
surface continûment différentiable et variant contin1Îment avec z.
9 40. Calcul de la fonctionnelle J par résolution
du problème aux limites pour l'équation de I(olmogorov
Avant d'indiquer une approche de calcul de la fonctionnelle (1 G),
faisons encore lIne remarque sur les processus lllarkoviens. Choisissons
dans l'espace R un domaine r fixe délimité par une surfaee S
continûment différentiable de dimension n - 1. Désignons par
q (cr, X, 't, y) la densité de probabilité pour que le point aléatoire
de x à l'instant cr soit transféré en y à l'instant 't sans ponr cela
pénétrer dans le domaine r pendant l'intervalle de telnps cr t 't
tout entier.
Il s'avère que partout à l'extérieur du domaine r la fonction
q (cr, x, 't, y) obéit à la même équation (7) que la fonction
p (cr, x, 't, y) et aux conditions aux limites suivantes:
lim \ q(cr, X, 't, y)dy=lim \ p(Œ, x, 't, y)dy==l, (17)
11-1' J 0'-1' .J
R-r R-r
, q(a, x, 1:, y)dyO pour xxoES. (18)
R':"'r
40.]
CALCUL DE LA FONCTIONNELLE J
287
On trouvera la démonstration rigoureuse de ce que nous venons
d'avancer dans les ouvrages consacrés à la théorie des probabilités.
Nous ferons simplement quelques suggestions qui permettront au
lecteur de s'assurer de la validité des propositions énoncées.
La relation (17) est relativement évidente.
La relation (18) devient évidente si l'on considère que le mouve-
ment du point aléatoire Q est un mouvement brownien (ce modèle
généralise tout processus markovien). Si la particule Q se trouve
sur le bord d'un domaine imaginaire r d'un vase, la probabilité
pour qu'elle pénètre dans ce domaine pendant le temps cr t 't'
est égale à l'uni té. C'est ce qu'exprime la relation (18).
Il nous reste à vérifier que la fonction q (cr, X, 't, y) obéit partout
en dehors du domaine f à l'équation (7). Pour cela il suffit de réexa-
miner attentivement con1ment a été déduite l'équation (7) dans
le 38. Cette déduction reposait entièrement sur l'identité de
Nlarkov (3) qui évidemment est valable pour la fonction q (cr, x 't, y).
Outre l'identité (3) nous avons utilisé la relation (9). Ici
) q(cr-!1cr, x, cr, y)dy:f=.1. (19)
R-r
Or la condition de continuité forte (4) entraîne
) q (cr - !1cr, x, cr, y) dy = 1 + 0 (!1cr), (20)
R-r
ce qu'il fallai t montrer.
Jusqu'ici le domaine f était considéré fixe. Supposons à présent
que f n'est pas fixe, mais qu'il se déplace, i.e. nous avons un groupe
à un paramètre de domaines ft. Désignons par q (cr, x, 't, y) la
densité de probabilité que le point aléatoire Q, de x à l'instant cr
soit transféré en y à l'instant 't, sans rencontrer aucun domaine mobile
ft durant l'intervalle cr t 'ta Il est alors évident que la fonction
) q (cr, x, .., y) dy (21)
est solution de l'équation (7) el satisfait à la condition aux limites:
) q (cr, x, .., y) dy -+ 0 pour X -+ Xo E Sa. (22)
Jaintenant nous sommes en n1esure d'indiquer une n1éthode de
calcul de la fonctionnelle (16). Supposons que le domaine mobile rt
soit un voisinage du point commandé z (t). Désignons ce voisinage
par z<t) conformément au 9 39. Posons
'p (cr, x, ..) = 1 - ) q (cr, x, .., y) dy. (23)
L'équation (7) étant linéaire, la fonction 'lJJ (cr, x, 't) des variab]es cr
et x obéit à l'équation (7). D'autre part, de (17) et (22), il résulte
288
UN PROBLÈME STATISTIQUE
[Ch. 7
que la valeur initiale de cette fonction est nulle (pour cr == 't) et
sa valeur frontière est égale à l'unité sur le bord du voisinage z (0"),
soi t :
'lIJ ('t, X, 't) == 0, }
'i' (cr, X, 't) IsO" == 1.
De la définition il résulte immédiatement que la fonction
'l' (cr, X, 't) est la probabilité pour que le point aléatoire Q, qui
à l'instant cr se trouve en x, soit « recouvert » par le voisinage Z(t>
du point cOffilnandé z durant l'intervalle de temps cr t 'ta
Donc la fonction 'i' (cr, X, 't) définie par la formule (23) est confondue
avec la fonction "-Pu qui figure dans la fonctionnelle (16), si bien que
pour calculer la fonctionnelle (16) nous devons résoudre l'équation
(24)
n n
a) t- ij ( ) 82'1) + 2: b i ( ) thl) -- 0
-- y a cr, x cr, x --
8a . 8xi 8x j . 8xi
1, J=1 1=1
(25)
avec les conditions aux limites suivantes:
'lIJ (cr, X, 't) ---?- 0,
o-+'t
'tp(cr, x, 't)1 pour xxoESo.
(26)
(27)
Comme nous l'avons déjà mentionné, nous allons résoudre ce
problème pour le cas où le voisinage l du point commandé z est
une boule de rayon E. Nous verrons que dans ce cas la solution du
problème (25), (26), (27) est de la forme
1P (cr, X, 't) == 8 11 - 2 '¥ (cr, X, 't) + 0 (8 n - 2 ), (28)
et nous calculerons la fonctionnelle 8 n - 2 1[f (cr, X, 't) qui est le terlne
principal de la probabilité 'i' (cr, X, 't). Soulignons immédiatement
que la formule (28) n'est valable que pour n > 2. Jusqu'à la fin
du présent chapitre nous supposerons donc que l'espace de phase R
est de dimension n > 2.
41. Calcul de la fonctionnelle I dans le cas
où l'équation de Kolmogorov est à coefficients constants
Dans ce paragraphe nous allons calculer approxin1ativement la
probabilité 'i' (cr, X, 't) et par conséquent la fonctionnelle (16) dans
le cas particulier important où l'équation (25) est à coefficients
constants. Dans les calculs nous allons utiliser des éléments de théorie
des équations intégrales ainsi que la notion do potentiel de double
couche. Le lecteur pourra se référer à la théorie des équations diffé-
rentielles à dérivées partielles et notamment à l'ouvrage S. Sobolev
« Equations de la physique mathématique » (en russe). Les défini-
41.] CALCUL DE LA FONCTIONNELLE J DANS UN CAS PARTICULIER 289
tions et les théorèmes utilisés seront formulés au moment opportun.
Soit donc à résoudre l'équation
n n
+ aij a'I". + b i ô 'l'. == 0 (29)
ôa . ax ax3 .LJ ax
, 3=1 =1
(où a ij et b i sont des coefficients constants) pour les conditions
aux limites (26), (27) que nous écrirons dans la suite sous la forme
'1' (T, X, T) = 0, (30)
,p(a, x, T)ls(J==1; (31)
par St nous désignerons la boule de rayon B et de centre au point z (t).
Passons tout d'abord de ce problème à celui avec une condition
frontière donnée sur une sphère de rayon B et de centre à l'origine
des coordonnées. A ces fins, introduisons dans l'espace (z, t) les
nouvelles coordonnées:
z = + z (t), a t s,
(32)
de sorte que
x = + z (a), }
y = f) + z (s).
(33)
Ce changement de coordonnées transforme la sphère Sa en la sphère
S 8 définie par l'équation
(1)2 + (2)2 + . . . + (n)2 == B2.
Cf) (0', , 't) == '1' (0', + z (cr), 't).
(34)
(35)
Posons
Nous obtenons immédiatement l'équation différentielle relative-
ment à Cf) (0', , 1:)
n
ôcp ..
aa + L.J a 13
i, j=1
n
2ep . + [bi-z i ' (a)] Bep. ==0
ô1. ô3 .LJ ô1.
1=1
(36)
et les conditions
cp(T, , 't)=O,
cp (cr, , T) fs = 1.
e
(37)
(38)
Certaines constructions complémentaires sont nécessaires afin de
résoudre l'équation (36) avec les conditions (37) et (38).
Nous allons commencer par celle d'une solution spéciale de l'équa-
tion
n
8cpo + a ij 8 2 cpo = 0
acr .. ai aj
1, 3=1
(39)
19-01339
290
UN PROBL:E:ME STATISTIQUE
[Ch. 7
avec la condition initiale
({Jo ('t, , 't) = O.
(40)
Des coordonnées 1, . . ., n passons moyennant une transfor-
mation linéaire aux coordonnées 1 , . . ., n
tl tn tl "tn
':, , · · ., ':, '0 , · ..., '0 ,
(41)
en lesquelles l'équation (39) prend la forme:
Bq:>o -
aa + ({Jo == 0,
(42)
où est le laplacien. Sous l'effet de cette transformation la sphère
Se devient évidemment un ellipsoïde S e d'équation
} ( £1 )2 + . . . + Â,n ( n )2 = 82,
Î'}' . . ., Â,n
(43)
(44)
"
ou
sont les valeurs propres de la matrice (a ij ).
Démontrons tout d'abord la proposition suivante.
Lem m e 1. La solution s'éloignant à l'infini du problème
extérieur de Dirichlet pour l'équation
-; 8 2 ;
v = - 2 + ... + - 2 :=: 0 ( 45)
al an
avec la condition aux limites
v () 18 == 1
B
(46)
est sur l'ellipsoïde (43) de la forme
v(£) ==8 n - 2 CG _ +n(s, 8),
r n - 2 ()
a étant une constante positive univoquement définie par les dimensions
de l'ellipsoïde (43) ; r ( ) la distance du point 1 à l'origine des coordon-
!Zées; la fonction Jt ( , 8) satisfaisant aux inégalités suivantes pour
111 < 1 :
1 n (£, 8) 1 < NI 8n- , 1 â. n (, 8) < M 8n- , ( 48)
r n - 1 () 8 r n (6)
i==1, ..., n (M==const).
(47)
Pour démontrer ce lemme, il nous faut utiliser la notion de
potentiel de double couche. Rappelons sa définition et quelques unes
de ses propriétés.
41.] CALCUL DE LA FONCTIONNELLE J DANS UN CAS PARTICULIER 291
Soit S une surface fermée continûment différentiable contenue
dans un espace de dimension n et x = (Xl, . . ., x n ) un point non
situé sur S. Les coordonnées des points situés sur la surface S seront
toujours désignées par yI, . . ., yn. Posons
p (x, y) = V(x 1 - yl)2 + . . . + (X n _ yn)2. (49)
La fonction
- Î a ( p;'z )
n(x)= J l-t (y) dS,
s ôn
(50)
où : représente la dérivée suivant une normale extérieure à la
an
surface S, est appelée potentiel de double couche, engendré par la
surface S au point x, et la fonction l-t (y) sa densité. Les propriétés
suivantes du potentiel de double COllche se démontrent aisément:
1. Partout à l'extérieur de S la fonction n (x) est harmonique:
n (x) = o.
(51)
2. Le potentiel de double couche a un sens si on remplace x
par un point quelconque y de S. La valeur prise par la fonction
Je (x) sur la surface S sera désignée par n o (y).
3. La fonction n (x) admet une ,limite lorsque le point x tend
de l'extérieur vers un point quelconque de S. Si cette limite est dési-
gnée par ne (y), on a alors
ne (y) = -v (n) l-t (y) + no (y), V (n) = const > O. (52)
-+
4. Désignons par cr (n, p) l'angle formé par la normale extérieure'
à S en un point quelconque y et le rayon vecteur p reliant le point y.
au point x. Le potentiel de double couche peut alors être mis sous.
la forme
- r cos cr
Jt (x) = (n - 2) J l-t (y) pn-l dS.
s
Toutes ces propriétés se déduisent immédiatement de la défini-
tion du potentiel de double èouche., Le lecteur pourra lui-même,
les démontrer ou se référer alors à un quelconque ouvrage sur la'
théorie des équations différentielles à dérivées partielles, par exemule\
l'ouvrage déjà mentionné de S. Sobolev.
D é ID 0 n s t rat ion d u' 1 e m ID e 1. Nous allons chercher-
la solution de l'équation (45) avec la condition aux limites (46)
sous la forme suivante
- 'CG --
v (s) = E n - 2 _ +n ()
r n - 2 () ,
(53) ;
19 *
292
UN PROBLÈME STATISTIQUE
[Ch. 7
où a est une constante à déterminer, et n ( ) le potentiel de double
couche engendré par l'ellipsoïde (43) au point à densité à déterminer
1-1 (r}) (par tl_nous désigne rons les coordonnées des points situés sur
l'ellipsoïde S r;J. Puisque n () est, en vertu de la propriété 1, solu-
tion de l'équation (45) et que la fonction
1
r n - 2 ()
obéit également à l'équation (45) (ce qu'on vérifie aisément par
dérivation), la fonction v ( ), définie par la formule (53), obéit
à l'équation (45).
La condition aux limites (46) donne
- - B n - 2
ne('t'])==1-ex _ (54)
r n - 2 (11)
quel que soit fi E Se- Or, en vertu de la propriété 3 et en utilisant
la formule (52), il vient:
- - - B n - 2
- l' (n) 1-1 (11) + no ('t']) == 1 - ex - . ( 55 )
r n - 2 (11)
En
introduisant les notations:
- - 1 (n-2)coscp -
K ('f), 'f)t) = l' (n) pn-l (11, ti1) , 'f),
- 1 [ Bn-2 J
<D('t'])== ex -1
l' (n) - r n - 2 (11) ,
)
't']1 E Se,
(56)
J
nous obtenons une équation intégrale non homogène relativement
à la densité (fi ) :
( 'f) ) = \ K ( 'f) , 'f) t) ( 'f)t ) a s e + <I> ( 'f)) .
..
Se
(57)
L'équation (57) est l'équation intégrale de Fredholm du deuxième
genre. Pour de telles équations a lieu le
Thé 0 r è m e d e F r e d h 0 1 m. Pour que l'équation (57)
soit résoluble il est nécessaire et suffisant que son terme libre soit ortho-
gonal à toutes les fonctions propres de l'équation intégrale homogène
conjuguée
" ( 'f)) = K ( 'f) t> 'f)) ('f) t) a s e .
Se
(58)
Le lecteur trouvera également la démonstration de ce théorème
dans l'ouvrage déjà cité. On y démontre aussi que si le noyau
9 41.] CALCUL DE LA FONCTIONNELLE J DANS UN CAS PARTICULIER 293
K (''1 , 11 1) est défini par la formule (56), l'équation (58) possède
une seule fonction propre. Désignons-la par "0 (11 ) et supposons-la
connue.
La condition d' orthogonalité dont il est question dans l'énoncé
du théorème de Fredholm permet de calculer la constante a pour
laquelle l'équation (57) est résoluble relativement à fl (11 ).
En effet, écrivons la condition d' orthogonali té
1 J r gn-2 J --
() L a - - 1 "0 (11) dS e = o.
l' n _ r n - 2 (11)
se
D'où
J 'Vo (rJ) dS e
a==
S
e
(59)
gn-2 r "0 ( d S e
) r n - 2 (11)
Se
Dans cette formule la quantité a semble dépendre de E. Ce n'est
pourtant qu'une apparence, car si l'on désigne par S l'ellipsoïde
Âl ( 111 )2 + Â2 ( 112 )2 + . . . + À n (l1 n )2 == 1
(60)
déduit de l'ellipsoïde Se par une homothétie de rapport 1/E, nous
constatons sans peine que
). 'Vo ( 1')) d S
s
a==
r Vo (11) dS
J r n - 2 (11)
s
(61)
Le nombre a ne dépend donc pas de E, il est entièrement défini
par les valeurs propres de la matrice (a ii ). Dans la formule (61),
"0 (11) représente la fon cti on propre de l'équation intégrale (58)
composée pour la surface S.
La fonction v (s ) définie par la formule (53) (voir (47» pour la
valeur de a définie de (61) est donc solution du problème (45) et (46).
Les inégalités (48) peuvent être démontrées en étudiant plus en
détail les propriétés du potentiel de double couche n (s ) défini par
la formule (50) .
Nous utiliserons plus loin le lemme démontré. Pour l'instant
nous allons nous servir de .la constante a déterminée pendant la
démonstration du lemme. La constante a sera appelée dimension
294
UN PROBLÈME STATISTIQUE
[Ch. 7
de l'ellipsoïde (60); cette dimension. 9.épendra donc continûment
des valeurs propres de la matrice (a:J).
Voyons maintenant comment construire une solution spéciale
de l'équation (39) satisfaisant à la condition initiale (40).
Soit g (0-, , 't, 11 ) une solution fondamentale de l'équation de
la chaleur d'ordre n
a; a 2 v a 2 ü
acr + - 2 + ... + - 2 == O. (62)
as 1 as n
On sait que cette solution fondamentale est de la forme explicite
suivante:
1 { lïï-12 }
g ( 0-, s, 't, 1') == !!:- exp - 4 ('t _ cr) ·
[4n ('t - cr)] 2
(63)
Posons maintenant
<pci ( 0-, , 't) == ë n - 2 CG _ +
r n - 2 (s)
+ n (, ë) - j . g (0-, I, T, 1] ) [ ë n - 2 CG _ + n ( 1] , ë) ] d'YI ,
r n - 2 (1'}) ,
(64)
ou encore
cpci (cr, , T) == CPo (cr, , T) + ô CP: ( 0-, , -r),
(65)
où
CPo (cr, s, 't) == ë n - 2 CG _ - r g (cr, , -r, 11 ) ë n - 2 CG _ d1]. (66)
r n - 2 () J r n - 2 (11)
Il est évident que la fonction CP: (cr, ., 't) est solution de l'équation
(62) et qu'elle vérifie la condition initiale
cP (cr, s, T) = 0 pour cr == 'te (67)
Passons maintenant des coordonnées "[1, . . .t S n aux coordon-
, tl tn
nees '0 , · · ., '0 .
Supposons, ceci étant, que les fonctions
cp ci (cr, s, T), CP o (cr, s, T), ô cp (0-, s, -r), g (cr, s, T, 1')
se transforment respectivement en les fonctions
l cpci (cr, , T), CPo (cr, s, T), ôCP: (cr, s, 't), g (0-, s, 't', 'YI).
Dans la suite nous aurons besoin de la fonction {j)o (0-, , 't)
sous sa forme explicite. Pour cela nous devons savoir comment
exprimer en les coordonnées 1, . . ., n les fonctions r ( ) et
g (0-,1, 't, 1') . Ce qui est simple. En effet.. si l'on désigne par aij
41.] CALCUL DE LA FONCTIONNELLE J DANS UN CAS PARTICULIER 295
les éléments de la matrice inverse de (a ij ), de sorte que
n
aijajk == ô1.
j=1
On s'assure immédiatement que
(68)
n 1
r ( s) == ( L aijsisj) 2 ,
i, j=1
n ..!..
l 'Y) -1, == [ aij ('Y)i - Si) (l1 j - sj)] 2 .
i, j=1
Compte tenu de
(69)
d1] = V 1v 1 1v 2 . . . 1v nd1], (70)
la fonction q>o (cr, S, 't) s'écrit sous la forme explicite suivante:
<Po ( cr, S, 't) == ê n-2
a
n n-2
( aijij) 2
i, j=l
- J g (cr, S, 't, '1']) B»-2
aVÂl...Ân
n n-2
( aijll i ll j ) 2
i, j=1
d'rl ,
(71)
où
g (cr, s, 't, 1]) ==
1 { C aU (T]i- 1;i) (T]i-1;i)] }
1, .1=1
n exp -- 4 Ct-a) ·
[4n Ct-a)] 2
(72)
Nous venons ainsi de démontrer le
L e ID m e 2. La fonction cp = CPo (cr, s, 't) + ôcp: définie par
les jorlnules (65), (71), (72) est so lution de l'équation
n
a<:p +
ôa L.J
i. j=1
ô 2 *
a ij <:Po = 0
ai aj
(73)
et satisfait à la condition initiale nulle
cP ('t, S, 't) = o.
(74)
Il ilnporte de souligner que la fonction cp: (cr, s, 't) n'est pas
égale à l'unité sur la sphère S e. Cependant, nous ,verrons dans la
suite que dans un certain sens sa valeur frontière est très proche de
1'unité.
296
UN PROBLÈME STATISTIQUE
[Ch. 7
Nous avons maintenant réuni tous les éléments nécessaires pour
résoudre l'équation (36). Tout d'abord nous allons chercher une
solution spéciale satisfaisant à la condition initiale nulle. Nous
verrons que la valeur frontière de cette solution diffère très légère-
ment de l'unité. De là nous déduirons que cette solution spéciale
ne diffère que légèrement, d'une quantité d'un ordre supérieur de
petitesse par rapport à ê, de la solution exacte du problènle (36),
(37), (38). Ensuite, nous simplifierons la solution spéciale en élimi-
nant certains termes, ce faisant nous obtiendrons une solution appro-
chée du problème (36), (37), (38).
Mettons en œuvre le programme conç.u.
Nous allons chercher la solution spéciale de l'équation (36) qui
satisfait à la condition initiale nulle sous la forme
(1)* (a, s, 't)==cp(a, s, 't)+q>f(a, s, 't), (75)
où cp est la solution de l'équation (73) satisfaisant à la condition (74)
que nous venons' de construire, et q>: une fonction à déteruliner.
On vérifie immédiatement que la fonction q>i doit obéir à l'équation
parabolique non homogène suivante:
n
âcpf
+ aU
â cr L.J
i, j=l
n
ôcpf. + [bi _ Zi' (cr)] ôcp =
a âJ . âs 2
1=1
n
c= _ [bi _ Zi' (cr)] ôcpt (cr'.' T)
a2
(76)
i=l
et satisfaire à la condition initiale
cpi('t, s, 't)==0. (77)
Il apparaît inlpossible de résoudre le problème (76), (77) sur
l'espace R .tout entier en utilisant une formule identique à la formu-
le (14) du 9 38, car le second membre de l'équation (76) possède
pour S = 0 un pôle d'ordre n qui apparaît lors de la dérivation de
la fonction Je (, 8). Cependant, on peut tourner cette difficulté
puisque, ce qui nous intéresse, c'est l solution cpi (cr, s, 't) en
dehors de la boule limitée par la sphère S e. Pour cela nous allons
faire appel à la fonction q (a, x, s, y) définie dans le 9 40 et égale
à la densité de probabilité que le point àléatoire Q qui à l'instant cr
est en x, soit à l'instant s en y sans rencontrer pendant l'espace de
temps cr t s la boule Z(t> de rayon E et de centre au point
commandé z (t). Il est évident que la fonction
q* (cr, s, s, 'l1) == q (cr, s + z (cr), s, "1 + z (s)) = q (a, x, s, y) (78)
(voir formules (32), (33) est en dehors de la sphère S e une solution fonda-
mentale dé l'équation (36) et qu'elle satisfait à la condition aux linites
J q* (cr, , s,11) d11 !sES e = 0, (79)
41.] CALCUL DE LA FONCTIONNELLE J DANS UN CAS PARTICULIER 297
la solution du problème (76), (77) est donnée en dehors de la sphère S e
par la fonction
L n
cp!(cr, G, -r) = ) ds ) [q* (cr, G, s, YJ) (bi-.
a Re i=1
- Zi' (s)) a<pt i1'J' 't) J d'Il, (80)
où Re désigne le complémentaire relativement à R de la boule limitée
par la sphère S e. Il est évident que
cpt (cr, s, 1') IsES e === o.
Nous obtenons donc le
Lem ID e 3. La fonction
CD*(cr,, 't)===cpô(cr,, 't)+cpi(cr, £,1'), (81)
où cp;j (cr, s, 1') est définie par la formule (65) et cp (cr, s, 1') par la
formule (80), est une solution de l'équation (36) satisfaisant à la condi-
tion initiale nulle $ ('t, s, 1') = 0 et prenant les mêmes valeurs fron-
tières sur la sphère S e que la fonction cp (cr, , 1').
Nous allons maintenant prouver que la fonction $* (cr, s, 1')
approxime la solution du problème (36), (37), (38) en dehors d'une
boule de rayon ro (ro étant un nombre quelconque fini indépendant
de 8) .
Cette démonstration repose sur le lemme important concernant
la majoration des solutions de l'équation parabolique. Formulons.
ce lemme.
L e ln n1 e 4 (sur la majoration des solutions de l'équation parabo-
lique). Soit u (cr, s, 1') une solution de l'équation parabolique
n n
au ïj a 2 u au
7Jéi= - 2} a (cr, G) aGi aG j -.2} b i (cr, G) aGi - L (u), (82)
i, j=l 1=1
satisfaisant aux conditions
u ('t, s, 1') === 0, }
u (cr, G, -r) 1 ESe = W (cr, -r), (83)
où
( { const pour l' - cr 8,
W cr, 't)
Ô (8) pour l' - cr > 8
(8 (8) -+ 0 pour 8 -+ 0). On a alors
1 u (cr, S, 1') 1 < L\ (s, 8) + ô (8) X (cr, S, 1'),
(84)
(85)
298
UN PROBLÈME STATISTIQUE
[Ch. 7
où;j. (, 8) est une fonction positive d'ordre 0 (8 n - 2 ) pour tout 1 1 > ro,
et X (cr, , 't) une solution de l'équation (82), de valeur initiale nulle
pour cr = 't et égale à l'unité sur la sphère S e.
La démonstration du lemme est difficile et nécessite de laborieux
calculs. Elle fait appel à de nombreuses majorations des solutions
de l'équation de la chaleur
ôu [ ô2u ô 2 u ]
ôa = - ô1;i2 +... + ôn' = -l1u.
Commençons par ces majorations.
Soit
(86)
g (cr, s, 't, "1) ==
1
111- sl2
e - 4('(- 0)
n
(87)
[4rc ('r-a)] 2
une solution fondam entale de l'équati on (86). Posons comme précé-
demment r (s) = J f S12 + . . . + sn2 et introduisons les notations
suivantes:
0>1< (a, S, 1:)= r g(a, S, 1:, 1'])+-d1'],
J r (f))
(88)
't
Q Il (cr, S, 't) == r ds r g ( cr, , S,11) d f] .
J J rR(f))
(J
Pour que les intégrales des seconds membres des formules (88) et (89)
aient un sens nous devons bien sûr considérer que k < n.
Nous aurons besoin des trois inégalités Sllivantes faisant inter-
venir Wh (cr, S, 't) et Qh (cr, S, 't) sous réserve que le point S appar-
tienne à la sphère Se:
Ô (B)
Wh (cr, , 't) IES < R. pour T- cr> ë,
e B
C
Wk(cr,S,'t)\sES <- pour T-(jë,
. e BR.
C }ln B 1
Qh (cr, S, 't) I ES < R ·
u e B -2
Ici C désigne une constante ne dépendant pas de ë et Ô (8) -+ 0
pour 8 -+ O.
D é duc t ion des i n é gai i tés (90), (91). On voit sans
peine que
(Ok (cr, SI, ..., n,
(89)
(90)
(91)
(92)
't) == Wk (cr, r (S), 0, ..., 0, T)-==
('rIl-1.(»2+(112)2+.. .+(ll n )2 1
1 r e - 4('t-0) - dtl.
n J rk(fJ)
[4n('t-a)] 2
(93)
41.] CALCUL DE LA FONCTIONNELLE J DANS UN CAS PARTICULIER 299
Posons
ll i = r () Xi, 't - cr = r 2 () t.
De (93) on déduit alors
1
Wh (cr, £, 't) ==: h V (t),
r (s)
()Ù
(94)
(95)
(x 1 - 1 )2+{x 2 )2+. . . +x(n2) 1
V (t) = 1 n (' e - 4t - dx. (96)
J rh(X)
(4nt) 2
Il est évident que
V (t) -+ 1 lorsque t -+ O.
Soulignons pour la suite que lorsque t est grand, la fonction
admet l'asymptote suivante
V (t) = 0 ( t ) ·
En effet, SI nous opérons la transformation
2 VT yi = xi
dans
(96), nous obtenons
l( ) - [ ( yl_ V- ) 2 +{y2)2+. . .+(yn)2 ] 1
V (t) = - e - 2 t
. rh (y)
t
dy,
(97)
V (t)
(98)
(99)
où K est une constante, et par conséquent la relation (98). Ainsi
nous avons
1 ( 't'-cr )
Cùh (a, , T) < rh () V r 2 (6) ·
Mais par ailleurs il est aisé de voir que
V( 't;a )<6(8)
pour T-a> 8, }
V( 't;a ) <const pour T-a8,
( 1 00)
(101)
d'où résultent les inégalités (90) et (91). D'autre part, nous avons
toujours
( T) < const .
Wh cr, S,
rIt (;)
( 102)
300
UN PROBLÈME STATISTIQUE
[Ch. 7
D é duc t ion d e l'i n é gaI i t é (92). On voit aisénlent que
Qh (cr, SI, ..., k, 't) = Qh (cr, r (), 0, ..., 0, 't) ==
== J ' ds J 1 e -(1]1-r(W2;);:--. .+(1]n)2 1
n d.
rh (Y))
a
[411: (s - cr)] 2
En posant "1; === r (S) x;, s - cr === r 2 (S) t, nous obtenons
1
Qk (cr, {;, -r) = r k - 2 (£)
't-a
r 2 ( s)
J V (t) dt,
o
(103)
où V est la fonction définie par (96). En particulier,
1
Q (cr, S, 't) IES ==
£ f,k-2
't-a
E2
J V (t) dt.
o
. ( '104 )
En tenant compte de l'asymptote de la fonction V (t) pour t grand
(voir formule (98», il vient immédiatement
't' -- a
E2
J V(t)dt<Clluel pour k=2.
o
( '105 )
't'-a
E2
J V(t)dt<C pour k>2,
o
(10G)
ce qui entraîne l'inégalité (92). Nous avons pu constater que
cons t
Qh(cr, £, 't)< J . (107)
r -2 ()
ReIn a r que à pro p 0 s des i il é gai i tés (90), (91),
(92). Soit p* (0-, S, 't,11) une solution fondamentale de l'équation (82).
Définissons à partir de cette solution les fonctions Wh (cr, S, 't) et
QR. (cr, , 't) d'après les formules (88), (89) (en y remplaçant g par
la fonction p*). On constate que les inégalités (90), (91), (92) sont
également valables pour les fonctions Wh (0-, S, 't) et Qh (cr, S, 't)
définies ci-dessus. En effet, dans la théorie des équations paraboli-
ques on démontre que pour des contraintes sur les coefficients de
l'équation (82), limi tations que nous avons supposées renl plies au
39, toute solution fondamentale de l'équation (82) est n1ajorée
par une solution fondamentale d'une certaine équation de la chaleur,
41.] CALCUL DE LA FONCTIONNELLE'] DANS UN CAS PARTICULIER 301
l.e. a lieu 1 'inégalité
C -1' 11\-12
p* (cr, , 't, rt) < n e 't-cr
Ct - cr) 2
OÙ Y est une constante. Cette majoration permet de reprendre point
par point les calculs opérés dans la déduction des inégalités (90),
(91), (92).
Maintenant nous pouvons passer à la
D é mon s t rat ion d u 1 e m m e 4. Posons
W (cr, 't) = Wl (cr, 't) + W 2 (cr, 't),
(108)
où les fonctions Wl (cr, 't) et W 2 (cr, 't) sont définies ainsi
- ( { C pour 't - cr 8,
Wt cr, 't) ==
o pour 't - cr > 8 ;
- ( ) { o pour 't - cr 8,
W 2 cr, 't =
Ô (8) pour,; - cr > 8.
Désignons respectivement par ü (cr, , 't), al (cr, S, ,;), a 2 (cr, S, ,;),
les solutions de l'équation (82) satisfaisant aux conditions initiales
nulles et aux conditions limites W (cr, ,;), Wl (cr, 't), W 2 (cr, 't). Il est
évident que
(109)
(110)
ü (cr, , ,;) == Ut (cr, , 't) + u 2 (cr, , 't).
(111)
D'alltre part, en vertu du théorème du maximum des solutions des
équations paraboliques, la solution u (cr, S, 't) du problème (82),
(83) est majorée comme suit:
u (cr, , 't) a (cr, S, 't). (112)
Evaluons séparément les fonctions Ü 1 (cr, s,,;) et ü 2 (cr, s, 't).
On obtient immédiatement une majoration pour zï 2 à partir du
théorème du maximum des solutions de l'équation parabolique:
ü 2 (cr, s, 't) Ô (8) X (cr, S, 't). (113)
Pour majorer la fonction Ut il nous faut des raisonnements plus
fins. Majorons tout d'abord Üt pour 't - cr 8. Posons
gn-l
1'()=-=K rn-l() , (114)
()ù K == const > C. Nous allons chercher maintenant la solution
de l'équation (82) satisfaisant à des condi tions ini tiales égales à
(s) et à des conditions frontières sur la sphère S e' égales à K, sous
la forme
v (cr, , 't) == Y () + Do (cr, , 't). (115)
302
UN PROBLÈME STATISTIQUE
[Ch. 7
Nous obtenons alors immédiatement l'équation non homogène
n n
+. aij (cr, ) ô::j +. b i (cr, ) : =L [1'()J, (116)
1. 3=1 1.=1
que nous devons résoudre pour des conditions aux limites nulles.
Cette solution, nous le savons, est donnée en dehors de la sphère S e
par la formule
't
vo(cr, , ,;)= - J ds J q(cr, , s, 1')L[1'(1')Jd1'). (117)
a Re
Donc,
't
v(cr, s, ';)=1'()- J ds J q(cr,, s, 1') L [1'(1')J d1'). (118)
a Re
Il est évident que
Ü 1 (cr, , 1') V (cr, , T). (119)
Il ne nous reste donc qu'à ID ajorer la fonction v (cr, , 't) lorsque
1 1 > ro. Remarquons tout d'abord que
1 L [1' (£)] 1 < 8'1-1 [ rn1Œ) + r:!('Ç) J ' (120)
où A 1 et A 2 sont des constantes suffisamment grandes. Par ailleurs
ayant à l' espri t l'inégalité
q (cr, , 't, 11) p (cr, , 't, fi), (121)
la formule (118) entraîne
1:'
V (cr, , ,;):S; l' () + J ds J P (cr, , s, 1') 8"-1 r,,+1(f]) d1') +
a Re
't
+ .\ ds J P (cr, , S, 1') 8"-1 r nA (;) d1'). (122)
a Re
Désignons respectivement par Ii et 1 2 les intégrales du seco.nd mem-
bre de l'inégalité (122). Nous avons
"C
Ii < A 1 8 n - 2 - v Î ds \ P (cr, , s, 1') n- d1') <
J J r (t"))
Cf Re
"C
<A 1 8 n - 2 - v J û)n-v(cr, , s)ds. (123)
a
9 Id.] CALCUL DE LA FONCTIONNELLE J DANS UN CAS PARTICULIER 303
En utilisant l'inégalité (102), il vient immédiatement
't
l <AC 1 e n - 2 - v r ds
1 1 r n - v (£) J'
(J
( 124 )
où 0 < 'V < 1. Donc, pour -r - cr e on a
n-1-v
I<IVI E
1 r n - v (£) ,
( 125 )
i.e.
/1 = 0 (Sn-2)
pour J J > ro. D'une façon analogue
/2 == 0 (e n - 2 )
(126)
(127)
pour \ 1 > ro. La fonction v (cr, , 't) qui majore sur la sphère Se
la solution zl1 (cr, , 't) pour 1 1 > ro et pour 't - cr e est de
l'ordre de 0 (sn-2). Il s'ensuit que la solution U1 elle-même est de
l'ordre de 0 (e n - 2 ) pour 't - cr e et pour 1 1 > ro. En faisant.
légèrement varier la construction précédente, on vérifie facilement
que la même lnajoration a lieu pour U 1 (cr, £, -r) lorsque -r - cr > s.
Le lemme est dém,ontré.
Désormais nous pouvons démontrer que la fonction (1)* (cr, , 't)
qui fj.gure dans l'énoncé du lemme 3 approximise la solution du
problème (36), (37), (38) en dehors d'une sphère de rayon"quelconque
fini avec tlne précision de l'ordre de 0 (sn-2). En d'autres termes
a lieu le
Lem fi e 5. Soit cr (cr, , 't) une solution de l'équation (36)
satisfaisant aux conditions aux limites (37), (38), et (1)* (cr, , 't) la
solution de l'équation (36) définie dans le lemme 3. A lors pour tout r 0
indépendant de s, pour 1 G 1 ro, la solution (1)* (cr, , 't) appro-
ximise avec une précision de l'ordre de 0 (sn-2) la solution cr (cr, , 't):
cr (cr, , 't) - cD* (cr, G, 't) == 0 (sn-2).
(128)
D é mon s t rat ion. Soit
u (cr, G, 't) == cr (cr, G, 't) - cD* (cr, £, 't). (129)
La fonction u (cr, , -r) est solution de l'équation (36) et satisfait
à une condition initiale nulle. D'autre part on voit, d'après (80)
que les valeurs frontières de la fonction u (cr, G, 't) sur S e sont con-
fondues avec les valeurs frontières de la fonction cr (cr, , 't) -
- crci (cr, , 17). Majorons ces dernières. Pour cela, mettons la dif-
304
UN PROBLÈME STATISTIQUE
[Ch. 7
férence cP - cP SOUS la forme suivante
(P (a, , T) - CPÔ (a, G, T) ==
:=.:: { cp (a, , T) - [ 8 n - 2 CG _ + n (, 8) J } -
_ rn-2()
- r g (a, , T, 11) [ 8»-2 CG __ +;1 (1'] , 8) J d 1'] (130)
J r n - 2 (1'))
{voir formule (64». Le terme se trouvant entre accolades dans le
second membre de la formule (130) prend des valeurs frontières nulles.
Il reste donc à majorer les valeurs frontières du deuxième terme
sur la sphère S e (en coordonnées S I, . . ., 1 n sur l' elli psoïde S e).
Puisque le potentiel de double couche n ( , 8) vérifie (48), nous
avons de toute évidence:
r g (a, , T, 1'] ) r 8 n - 2 CG _ + n ( 1'] , 8) J d1'] l
J L r n - 2 (1')
A 1 8 n - 2 W n _2 (a, , T) + A 2 8 n - 1 W n _1 (a, , T), (131)
où A 1 et A 2 sont des constantes et W n - 2 et W n -1 des fonctions définies
par la formule (88) respectivement pour k == n - 2, k = n - 1.
En utilisant les inégalités (90) et (91) nous déduisons immédiatement
que les valeurs frontières du second terme de la formule (130) et,
par conséquent, les valeurs frontières w (a, -r) de la fonction u (a, , -r)
satisfont aux conditions du lemme 4. Ce qui nous permet de conclure,
en vertu du lemme (4) sur la majoration des solutions de l'équation
parabolique, que la relation (128) est vraie. Le lemme 5 est donc
démontré.
Il ne nous reste plus qu'à simplifier la solution approchée
<1>* (a, S, 't) en y éliminant les termes en 1 si> ro d'ordre 0 (8 n - 2 ).
Pour cela mettons la solution Q>* (a, , 't) sous une forme explicite.
En utilisant les formules (63), (64), (65), (75), (80), nous pouvons
écrire:
<D* (a, G, T) == CPo (a, , T) + ôcpû (a, , -r) +
L n
+ J ds J q* (a, , s, '1']) [bi-Z i ' (s)] X
(J RB i=l
X (CPo (s, 1'], T) + ÔcpÔ] d1']. (132)
af)
Il est clair que pour 1 1 > ro
ôcpù(a, G, T)=O(8)>-2). (133)
L'intégrale figurant dans le second membre de la formule (132)
est un peu plus difficile à simplifier. On peut d'abord éliminer le
41.] CALCUL DE LA FONCTIONNELLE J DANS UN CAS PARTICULIER 305
terme
n
/i = r ds r q* (cr, , s, 1) (bi-Zi' (s)] aÔ<p (5, '1], '1") d1). (134)
J J ôll i
a Re i=l
En effet,
n
I/d J ds J p*(cr, , s, 1) 1 bi-Z i ' (s) 1
a Re i=1
ô8<p (s, T), 't)
ôT)i
1 d1). (135)
Puisque, d'autre part,
a 1 < sn-IR (1) (136)
(voir (65), (66)), où R (11) en zéro possède un pôle d' ordre n, il
vient
n
1 /il < sn-i-v J ds J p* (cr, , s, 1) 1 bi-Z i ' (s) 1\ Ri (1) 1 d1),
a Re i=1
où Ri (11) possède en zéro un pôle d'ordre n - 'V (0 < 'V < 1).
Donc
Ii = 0 (8 n - 2 ). (137)
Il ne nous reste plus qu'à simplifier le membre
TI
/2== \ ds \ q*(a,, s, 1'])>'. [bi-zi'(s)]cpo(s, 1'], T)d'Y). (138)
J J Ôll
a Re i=l
lVlontrons que pour 1 1 > ro
n
/2 = J ds J p* (cr, , s, 1) [b i - zi' (s)] / i <Po (s, 1), ,;) d1) + 0 (sn-2).
C1 i-l 11
(139)
Nous avons:
n
/2 = J ds J p* (cr, , s, 1) [b i - zi' (s)] / i <Po (s, 1), ,;) d1) +
a i= 1 11
n
+ r ds \ [p*-q*] [bi-z i ' (S)]<Po(S, 1), ,;)d1)+
J .' ôll
C1 Re i=1
n
+ r ds r p*(cr,, s,1) [bi-zi'(s)]<Po(s, 1), ,;)d1). (140)
J J ôl1
aR-Re i=1
20-01339
306
UN PROBLÈME STATISTIQUE
[Ch. 7
Le dernier terme de la formule (140) est de toute évidence d'ordre
o (8 n - 2 ). Désignons le second terme par u (a, , 't). La fonction
u (a, , '1') admet pour a = '1' des valeurs initiales nulles et obéit
à l'équation (36) dans le domaine R e. Puisque
8(p < 8 n - 2 R (11), ('141)
811J
où R ('Y}) admet un pôle d'ordre n - 1, les valeurs frontières
de la fonction u (a, , 't) sont majorées comme suit:
1 u (a, £, '1') IESe < M 8 n - 2Q n_1 (a, £, 't) IESe. (142)
Compte tenu de (142) et (92) nous concluons que
1 u (a, £, 't) IlEse < Ô (8)
où Ô (8) -+ 0 pour 8 -+ O. Partout donc dans le domaine Re on a
1 u (a, , 't) 1 < Ô (8) cp (a, £, 't). (143)
Le lemme 5 et les inégalités (133), (137), (143) démontrent le
lemme suivant.
Lem m e 6. La fonction
<D (a, £ , 't) == (Po ( cr, £ , 't) +
n
+ r ds r p* (a, , s, 1]) [bi.-z i ' (8)] 8cpo (s, ' 't) d1], (144)
J J 81P
cr i=1
où CPo (a, £, '1') est définie par la formule (71), pour 1 £ 1 > ro (ro étant
un nombre positif arbitraire indépendant de 8) avec une précision de
l'ordre de 0 (8 n - 2 ) approximise la solution cp (a, , 't) de l'équation (36)
satisfaisant aux conditions aux limites (37) et (38).
Pour clôturer le présent paragraphe il ne nous reste plus qu'à
revenir aux anciennes coordonnées x et y d'après les forlnules (32)
et (33). Après avoir procédé aux changements nécessaires, nous
pouvons, en utilisant le lemme 6, formuler la proposition suivante.
Thé 0 r è ln e 26. Supposons que le mouvement du point com-
mandé z qui, à l'instant a se trouve en z (a), est décrit par le système
d'équations différentielles (15). S up posons par ailleurs que dans l'espace
R se déplace également un point aléatoire Q dont la densité de proba-
bilité de transfert, notée p (a, x, s, y) obéit à l'équation parabolique
à coefficients constants (29). Désignons par z la boule de rayon 8,
de centre z, se déplaçant en même temps que z. Désignons enfin par
11' (a, x, '1') la probabilité que le point aléatoire Q qui se trouve en x à
l'instant a soit « recouvert» par la boule z pendant l'intervalle de
temps a t 'te Sous ces conditions, la probabilité 'lJJ (a, x, '1') qui
42.] CALCUL DE LA FONCTIONNELLE J DANS LE CAS GÉNÉRAL 307
est une fonctionnelle sur u (t) s'écrit pour 1 x - z (a) 1 > r 0 où r 0 est
un nombre positif arbitraire sous la forme
1p(a, x, T)=ë n - 2 [1Po(a, x, T)+-1Pt(a, x, 't)]+o(gn-2)
( 145)
En vue d'écrire les fonctions 1PO (a, x, 't) et 'P1 (a, x, 't) sous une forme
explicite, introduisons les notations suivantes:
a) Î'.}' Î'}, . . ., Îv n sont les valeurs propres de Ja matrice (aU);
b) (aij) est la matrice inverse de la matrice (a 1J );
c) G (a, x, 't, 11)== g(a, x-z(a), T, 11)=
{ . au (1']i_xi+zi (cr)) (1']j-xj+z; (cr)) }
1=1
exp - 4 (,;-a) - ;
[4n ('t-a)] 2
t
d) (J., est une constante indépendante du système d'équations (15)
et définie par la formule (61).
A lors
1Po ( cr, x, T) ==
ex
n n-2
( :L aij(xi-zi(a))(xi-zi(a))] 2
i, j=1
- ) G (cr, X, .., 'Y)
ex -V ÂIÂ2 ... Ân
n d'Y],
[ :L au 11ir]j] 2
i, j=1
T
1P i (cr, X, 1") = ) ds ) p ( cr, X, S,
cr
n
y) (bi - Zi' (s)] 8"'0 (s, ' "t) dy.
ay'L
i=1
Le théorèmo 26 nous donne donc sous une forme explicite le
terme principal de la probabilité 1P (a, x, 't), et par conséquent le
terme principal de la fonctionnelle (16).
S 42. Calcul de la fonctionnelle J dans le cas général
Dans ce paragraphe la probabilité 1P (a, x, 't) et par conséquent
la fonctionnelle (16) seront évaluées pour le cas où les coefficients
de l'équation de Kolmogorov sont fonctions de a et de x. Nous
supposons que ces coefficients satisfont aux conditions formulées
dans le g 39. La marche est sensiblement la même que dans le para-
graphe précédent, aussi y renverrons-nous souvent le lecteur, nous
bornant simplement à expliquer en détail les nouvelles construc-
tions.
20*-
308
UN PROBLÈME STATISTIQUE
[Ch. 7
Soit donc à resoudre l'équation
n n
â11'1 .. ) â2'1h ,..,. alh
-L+ L.J aU (cr, x . . + L.I b 1 (cr, x)=O
âcr ax 1 ax3 âx1
i, j=1 i=i
avec les conditions
( 146)
11' (T, X, T) = 0, (147)
1P (cr, X, T) IXES(j == 1. (148)
Comme dans le 9 41, moyennant les changements (32), (33), (35),
ramenons cette équation à l'équation
fa
â acp + aï; (s + z (cr), a) acp. +
cr .. â1 âJ
1, .1=1
n
+ [bi (s+z (a), a) -zi' (a)] a = 0 (149)
i=l â1.
avec les conditions
cP (T, , T) = 0,
cP (cr, , T) 1 E S 8 == 1.
Mettons l'équation (149) sous la forme
(150)
(151)
n
'a a + " aH (a, z (a)) a 2 ep +
v L.J âi aj
i, j=1
n
+ [aii(cr, s+z(a))-aii(a, z(a))] a: i2 :si +
i, j=1
n
+ h (hi (a, s+ z (cr)) - Zi' (a)] aep. = O.
i=1 â1
Notre premier pas sera de construire une solution spéciale notée
<p (cr, , T) de l'équation
n
âcpo + aH (8, z (8») acpo. == 0
âcr LJ a1 âJ
i, j=1
( 152)
avec la condition initiale
cp (T, , T) == O.
(153)
Pour obtenir cette solution spéciale, nous allons comme au 9 41
passer, moyennant une transformation linéaire, des coordonnées
42.] CALCUL DE LA FONCTIONNELLE J DANS LE CAS GÉNÉRAL 309
1, S2, . . ., n aux coordonnées l , S 2, . . ., sn en lesquelles l' équa.:..
tion (152) s'écrit
â<po -
aa + <Po == o.
Cette transformation linéaire est désormais fonction du paramètre 8.
La sphère S e se transforme alors en l'ellipsoïde Se
Âl (8) ( S1) 2 + . . . - Ân (8) ( sn )2 == e 2 , (154)
').} (8), . . ., ')..} (8) étant les valeurs propres de la matrice
(a ij (8, z (8))). En reprenant point par point les raisonnements du
paragraphe précédent on démontre le lemme suivant.
Lem m e 1'. La solution s'éloignant à l'infini du problème
extérieur de Dirichlet pour l'équation
{)2(; {J2v === 0
-2 +...+ -2
â1 ân
avec la condition aux limites
v () IESe = 1,
où Se est l'ellipsoïde (154) est de la forme
v (s) == e n - 2 [a (82- + Jt (, ë).
r n - 2 ()
Cf., (8) désigne ici une constante positive dépendant continûment du
paramètre 8 et définie, univoquement par les dimensions de l'éllipsoïde
S e; r ( ) = V (1)2 + . . . + ( n )2, la fonction :Tt ( , B) et ses déri
vées satisfaisant aux inégalités (48).
La démonstration de ce lemme se passe de tout commentaire.
La constante Cf., (8) se calcule au moyen de la formule (61) si S
désigne l'ellipsoïde:
').} (8) ('r]1)2+ ... +Ân(8) (1']n)2 == 1.
Introduisons la fonction gS (cr, 1, 't, 11 ) d'après la formule (63) et
posons
<p e (cr,' 't) == e n - 2
a (8)
+ :Tt (S, ë)-
r n - 2 ()
- r gS (cr, s , T, 11 ) [ e n - 2 a (8)_ + Jt (1'] , e) ] d
J . r n - 2 (Y))
ou encore
ro *S - ( p S. 1 ôro*e
't'o 0 T "ro
310
UN PROBLÈME S1."A r rISTIQUE
[Ch. 7
'"
OU
cp (cr,, 't)= e n - 2 a (6) _ r g (cr, S , 't, 'Y) e'H! a(6) d'Y).
r n - 2 () J r n - 2 (11)
Il est évident que la fonction cp :e (cr,1, '1') est solution de l'équation
(152) et qu'elle satisfait à la condition initiale nulle
<p e ('t, , '1') = o.
Passons maintenant des coordonnées 1 , 1: 2 , . . ., n aux coor-
données 1, 2, . . ., n. Les fonctions cp :e (cr, , '1'), cp , ô <p e et ge
se transforment respectivement en cp:e (cr, , 't), cp, ôcp et ge.
Nous pouvons représenter la fonction <p (cr, , '1') sous une forme
explicite. Désignons comme précédemment par aij (8, z (8)) les
éléments de la matrice inverse de la matrice (aH (8, z (8))) :
n
aH (8, z (8)) ajh (8, z (8)) = Ô;t.
j=1
Alors
<p (cr,
t '1' ) == 811.-2 a (8) _
' [ J n-2
. aU (6, z (6)) ij """"2""
,J = 1
r e ( t ) 11.-2 CG (8) -V Âl (8) ... Ân (8) d
-- J g cr , , 't, 1) 8 n - 2 11 ,
[ . aU (6, Z (6)) 1 1i 1']i ] "2
, J =1.
(1,5:1)
ge (cr, , T,
1
11) = n X
[4n (,;-a)] 2
{ i, 1 aij (6, Z (6)) (1']i - i) (11] - j) }
X exp - 4 ('t-a) ·
( 156)
Considérons maintenant la fonction cp:a (cr, , '1'), i.e. la fonction
construite, en posant 8 = cr. La fonction <p:a (cr, , '1') n'obéit plus
à l'équation (152) puisque 8 = cr. Toutefois est évident le
Lem ID e 2'. La fonction cpcr (cr, , '1') = (P (cr, , 't) + ô<p:cr
où cp est définie par les formules (155), (156) est solution de l'équation
différentielle
8cp(J n 8 2 cp*cr 8
8a + aiJ(cr z(a)) 0 --[<p*81Ie=cr===O
LJ ' ai 8j 8e 0
i, j=1
et satisfait à la condition initiale nulle (p:cr ('t, , '1') = O.
42.] CALCUL DE LA FONCTIONNELLE J DANS LE CAS GÉNÉRAL 311
Conlme dans le paragraphe précédent, nous pouvons chercher
luaintenant la solution spéciale de l'équation (149) de valeur initiale
nulle sous la forme suivante:
cD*(cr,, T)==cP<J(cr,, T)+CP!(cr,, 't),
où (Pcr (cr, , 't) est la fonction que nous venons de construire, et
CP: lln8 fonc tion à dé terminer. En portant cI>* (cr, , 't) dans l' équa-
tion (149) et en tenant compte du lemme 2', nous obtenons l'équation
parabolique non homogène
n
a iJ CP (J : -!- a ij (cr, + z (cr)) a 2 cpr +
LJ ai 8j
i, j=1
n
+ [b i (a, + z (a» -- Zi' (a)] aq> =
i=1 ô£
{ n .. acp<J(cr,, 't)
= - [aij (cr, E+z (cr))-a 1J (cr, z (cr))] . +
" âi â3
i, j = 1
n âcp*cr (cr 't)
+ [b i (z (a), G+z(O'»-zi' (a)] 0 a: ' +
i=l
+ a [cpe (a, G, 't)J!e=u (157)
et la condition initiale
cp!(,;, G, ,;)==:0.
Le second membre de l'équation (157) admettant pour = 0
un pôle d'ordre n (et non pas n + 1), nous pouvons reprendre presque
point par point tous les raisonnements du paragraphe précédent
et dénl0ntrer des lemmes identiques aux lemnles 3, 5 et 6. Le lemme
correspondant au lemme 6 se formule désormais:
L e fi fi e 6'. La fonction
T
<D(O', G, 't)=cp(O', s. 't)+ .\ ds ) p(O', G+z(O'), s, YJ+
cr
n
{ ' . . . . â 2 m cr ( 8 'Y1 't )
+ z (S)) 2.J [ a 1) (S, 11 -f- z (S)) - a 1) (S, Z (S))] 'Y 0 .' .1 : +
ârJ â11'
i, j=l
n
+- [bi (s, YJ +- z (S» - Zi' (S)] a!jJ i'll' 1") +
i=l
+ a [cp (s, YJ, 't)] le=u } dYJ,
312
UN PROBLÈME STATISTIQUE
[Ch.7
où cpg (cr, S, T) est définie par la formule (155) pour 1 si> r 0 (r 0 étant
un nombre positif arbitraire indépendant de 8) avec une précision de
l'ordre 0 (e n - 2 ) approximise la solution cp (cr, s, T) de l'équation (149)
satisfaisant aux conditions aux limites (150) et (151).
En vue de formuler le résultat définitif nous devons de nouveau
passer aux coordonnées x et y au moyen des formules (32) et (33).
Alors le lemme 6' entraîne un théorème analogue au théorème 26
du paragraphe précédent. Nous laissons au lecteur le soin d'établir
au besoin les formules finales.
Bibliographie
Chapitre 1
1. R. BELLlVIAN: Dynamis Programming. Princeton lTniv. Press. N. J.,
1957.
2. R. BELLMAN, 1. GLICKSBERG, O. GROSS: Some Aspects of the
i\Iathématical Theory of Control Processes. Santa l\10nica, 1958.
3. V. BOLTI1\NSKI, R. GAMKRÉLIDZ£, L. PONTRIAGUINE: Con-
tribution à la théorie des processus optimaux (en russe). J ourn. « Doklady
Akad. nauk S.S.S.R. », 110, N 1 (1956), pp. 7-10.
4. V. BOLTIANSKI: Le principe du maxÎInum dans la théorie des proces-
sus optimaux (en russe). J ourn. « Doklady Akad. nauk S.S.S.R. », 119,
cM 6 (1958), pp. 1070-1073.
5. V. BOLTIANSKI, R. GAl\1KRÉLIDZÊ, L. PONT RIA GUI NE: Théorie
des processus optimaux. Principe du maximum (en russe). J ourn. (< Izvestia
Akad. nauk S.S.S.R. » série mathém., 24, cM 1 (1960), pp. 3-42.
6. V. BOLTIANSKI, R. GAMKRELIDZÉ, E. lVIICHTCHENKO, L.PON-
TRIAGUINE: Le principe du maximum dans la théorie des processus optimaux
(en russe). Premier congrès de l'IFAC. 1960.
7. R. GAMKRÉLIDZE: Contribution à la théorie générale des processus
optinlaux (en russe). Journ. « Doklady Akad. nauk S.S.S.R. », 123, M 2 (1958),
pp. 223-226.
8. N. KRASSOVSKI: Contribution à la régulation optimale (en russe).
Journ. « Automatica i téléméchanica », 18, cM 11 (1957), pp. 960-970.
9. L. PONT RIA GUI NE: Processus optimaux de régulation (en russe).
J ourn. « Uspekhi mathématitchesldkh nauk », 14, 1 (1959), pp. 3-20.
10. L. ROSONOBRE: Le principe du maximum de Pontriaguine dans la
théorie des systèmes optimaux (en russe). J ourn. « Automatica i téléméchanica »,
20, MM 10-12 ,(1959), pp. 1320-1334, 1441-1458, 1561-1578.
Chapitre 2
\Toir [4], [5], [7], [9].
Chapitre 3
Voir [2], [6], [9].
11. V. BOLTIANSKI: Simulation des systèmes linéaires à temps optimal
par des schémas par tout ou rien (en russe). J ourn. « Doklady Akad. nauk
S.S.S.R. », 139, M 2 (1961), pp. 19-22.
314
BIBLIOGRAPHIE
12. BUSHA W D. vV.: Ph. D. Thesis, Department of l\fath., Princeton
Univ., 1952.
13. R. GAMKR ÉLID zE : Contribution à la théorie des processus optimaux,
.appliquée aux systèmes linéaires (en russe). J ourn. « Doklady Akad. nank
S . S . S . R. », 116, cM 1 (1957), P p. 9-11.
14. R. GAMKRÉLIDZE: La théorie des processus optiffiaux, appliquée
aux systèmes linéaires (en russe). J ourn. « Izvéstia Akad. nauk S.S.S.U. »
série mathém., 22, .N' 4 (1958), pp. 449-474.
15. LA SALLE J. P. : The Time Optimal Control Problem Contributions to
the Theory of N onlinear Oseilations, Princeton, 1959.
16. A. FELDBAUlVI: Sur la synthèse des systèmes optimaux au moyen de
l'espace de phase (en russe). Journ. « Automatica i téléméchanica », 16, cM 2
(1955), pp. 129-149.
Chapitre 4
Voir [5].
17. V. BOLTIANSKI: Processus optimaux à paramètres (en russe). J ourn.
{< Doklady Akad. nauk Ouzb. S.S.R. », cM 10 (1959), pp. 9-13.
18. V. BOLTIANSKI: Application de la théorie des processus optimaux
.à l'approximation des fonctions (en russe). Travaux de l'Institut Stéklov, 60,
pp. 82-95.
19. G. KHARA TICI-IVILI: Le principe du maximum dans la théorie des
processus à retard (en russe). Journ. « Doldady Akad. nauk S.S.S.R. », 136,
M 1 (1961), pp. 39-42.
Chapitre 5
20. G. BLIS: Lectures on the Calculus of Variations, Chicago, 1946.
21. Mc SHANE, On Multipliers for Lagrange Pl'oblenl, Anler. Journal
Math., 61 (1936), pp. 809-819.
Cha pitre 6
22. R. G AlVI K R EL ID Z E: Processus optimaux en coordonnées de phase
bornées (en russe). Journ. « Doklady Akad. nauk S.S.S.R. », 125, N 3 (1959),
pp. 475-478.
23. R. GAl\IKRELIDZE: Processus optimaux en coordonnées de phase
bornées (en russe). J ourn. « Izvestia Akad. nauk S.S.S.R. », série mathémati-
que, 24, M 3 (1960), pp. 315-356.
24. A. LERNER: Sur la rapidité limite de fonctionnement des systèmes
de commande automatique (en russe). J ourn. « Automatica i téléméchanica »,
15, M 6 (1954), pp. 461-477.
25. E. ROZENl\IAN: Sur la rapidité limite de fonctionnement des systè-
mes d'asservissement à élément exécutif limité en puissance, en couple et en
vitesse (en russe). Journ. « Automatica i téléméchanica », 19, cM 7 (1958),
pp. 633-653.
BIBLIOGRAPHIE
315
Chapitre 7
26. A. KOLMOGOROV: Uber die analitischen l\fethoden in der Wahrsche-
inlichkeitsrechnung, Math. Ann., 104, (1931), pp. 415-458.
27. E. MICHTCHENKO, L. PONTRIAGUINE: Un problème statistique
de COffilnande optimale (en russe). J ourn. « Doklady Akad. nauk S.S.S.R. »,
128, M 5 (1959), pp. 890-892.
28. E. l\IICHTCHENKO, L. PONTRIAGUINE: Sur un problème statisti-
que de commande optimale (en russe). Journ. « Izvestia Akad. nauk S.S.S.R »,
série mathématique, 25 (1961), pp. 477-498.
29. A. I(OLMOGOROV, E. MICHTCHENKO, L. PONTRIAGUINE: Sur
un problènle probabilistique de commande optimale (en russe). J ourn. « Dokla-
dy Akad. nauk S.S.S.H. », 145, cM 5 (1962), pp. 993-995.
Table des matières
Introduction
. ..V.... ..........
CHAPITRE 1. PHINCIPE DU 1\1AXIMUl\I
1. Commandes admissibles .....
2. Enoncé du problème fondamental . . . . . . . . . . . .
3. Le principe du maximum . . .
4. Discussion du principe du nlaximum ... .
5. Exemples. Problème de synthèse . . . . . . . . . . . .
6. Problème aux extrénlités libres et conditions de transversa-
Ii té .........................
7. Le principe du maxinlum pour les systèmes non autonomes
8. Problèmes à temps fixe ................
9. Lien entre le principe du maximum et la méthode de program-
mation dynamique . . . . .. ......
CHAPITRE 2. D£l\/IONSTRATION DU PRINCIPE DU MAXIMUl\1
10. Commandes admissibles ...............
11. Formulation du principe du maxinlum pour une classe quel-
conque de commandes admissibles ...........
12. Systènle d'équations aux variations et son système adjoint
13. Variations des commandes et des trajectoires
14. Lemmes fondamentaux ..........
15. Démonstration du principe du maximum
16. Conditions de tl'ansversalité
CHAPITRE 3. PROBL:ÈMES LIN£AIRES EN TEl\/IPS OPTIMAL
17.
18.
19.
20.
21.
22.
23.
Théorème du nombre de commutations
Théorèmes d'unicité ......
Théorèmes d'existence . . . . . . . . . . . .
Synthèse de la commande optimale . . . . . . . . .
Exemples ......................
Simulation des commandes linéaires en temps optimal par des
circui ts à relais ...................
Equations linéaires à coefficients variables . . . . . . . .
CHAPITRE 4. PROBLÈMES DIVERS . . . . . . . . . . .
24. Cas d'une fonctionnelle définie par une intégrale impropre
25. Processus optimaux à paramètres ...........
26. Application de la théorie des processus optimaux à l'appro-
ximation des fonctions . . . . . . . . . .
27. Processus optimaux à retard . . . . . . . . .
28. Un problème de poursuite . . . . . . . .
5
1 '1
11
13
19
22
23
43
55
61
G4
69
69
72
76
80
84
91
99
105
105
112
116
123
127
155
163
169
169
171
176
190
202
TABLE DES MATIÈRES 317
CHAPITRE 5. LE PRINCIPE DU l\;IAXIlVIUlVI ET LE CALCUL DES
VARIATIONS ............. 213
9 29. Problème fondanlental du calcul variationnel ...... 214
9 30. Problème de Lagrange ................ 221
CH1\PITRE 6. PROCESSUS OPTIl\lAUX AVEC CONTRAINTES
LSUR LES COORDONNÉES DE PHASE ..... 229
g 31. Position du problème . . . . . . . . . . . . . . . .. 230
32. Trajectoires optimales situées sur le bord du domaine . .. 235
33. Démonstration du théorème 22 (constructions fondamentales) 240
34. Démonstration du théorème 22 (suite et fin) . . . . . .. 258
35. Quelques généralisations ............. 264
36. Condition de saut . . . . . . . . . . . . 266
9 37. Formulation du résultat fondamental. Exemples 275
CHAPITRE 7. UN PROBL:8ME STATISTIQUE DE COMMANDE
OP TI MAL E ................... 280
9 38. Notion de processus markovien. L'équation différentielle de
Kolmogorov .................... 281
39. Formulation exacte du problème statistique . . . . . .. 284
9 40. Calcul de la fonctionnelle J par résolution du problème
aux limites pour l'équation de I(olmogorov . . . . . .. 286
9 41. Calcul de la fonctionnelle J dans le cas où l'équation de
Kolmogorov est à coefficients constants ........ 288
9 42. Calcul de la fonctionnelle J dans le cas général 307
Bibliogra phie
..... .............. ... ...
313