Text
У. HUP Т Е Р СОВРЕМЕННЫЕ ОСНОВАНИЯ ОБЩЕЙ ТЕОРИИ СИСТЕМ Перевод Э. «Л. НАППЕЛЬБАУМА под редакцией С. В. ЕМЕЛЬЯНОВА ИЗДАТЕЛЬСТВО «НАУКА» ГЛАВНАЯ РЕДАКЦИЯ ФИЗИКО-МАТЕМАТИЧЕСКОЙ ЛИТЕРАТУРЫ МОСКВА 1971
6Ф.6.5 П.60 УДК 62-52 Современные основания общей теории систем, Порт ер У.» перев. с англ., изд-во «Наука», Главная редакция физико-математической литературы, М., 1971, 556 стр. Книга Портера убедительно доказывает адекватность и широкие возможности аппарата функционального анализа для решения задач общей теории систем, позволяющей с единой точки зрения рассматривать такие различные системы, как дифференциальные, импульсные, гибридные, а также системы с распределенными параметрами. Подробно излагаются основные понятия и результаты функционального анализа, наиболее пригодные для теории систем. Развитый аппарат позволяет с различных точек зрения исследовать вопросы структуры линейных систем. Последняя глава посвящена решению задач оптимального управления для ситуаций. в которых эти задачи могут быть сформулированы как задачи поиска вектора с минимальной нормой, принадлежащего заданной области гильбертова или банахова пространства. Илл. 67. Библ. 224 назв. William A. Porter The University of Michigan MODERN FOUNDATIONS OF SYSTEMS ENGINERING The Macmillan Company, New York Collier-Macmillan Limited, London
ОГЛАВЛЕНИЕ От редактора русского перевода................................... 5 Введение......................................................... 7 0.1. Задачи математического моделирования..................... 8 0.2. Подход теории функциональных пространств................ 12 Глава 1. Функциональные пространства............................ 14 1.1. Множества............................................... 14 1.2. Метрические пространства................................ 24 1.3. Линейные пространства................................... 42 1.4. Банаховы пространства................................... 58 1.5. Гильбертовы пространства................................ 75 1.6. Литература к главе 1.................................... 95 Глава 2. Преобразования......................................... 96 2.1. Функции................................................. 96 2.2 Линейные преобразования................................ 112 2.3. Однородные системы первого порядка..................... 141 2.4. Неоднородные системы первого порядка................... 162 2.5. Некоторые преобразования, связанные с линейными динамическими системами........................................... 181 2.6. Литература к главе 2..................................... 194 Глава 3. Структура линейных систем............................. 195 3.1. Линейные функционалы..................................... 195 3.2. Некоторые примеры использования линейных функционалов 214 3.3. Сопряженные и присоединенные преобразования.............. 235 3.4. Каноническое представление линейных систем............... 252 3.5. Различные режимы поведения стационарных систем .... 277 3.6. Некоторые задачи, связанные со структурой системы . . . 3.7. Литература к главе 3................................... 315 Глава 4. Геометрические методы решения задач оптимального управления..................................................... 316 4.1. Некоторые геометрические понятия....................... 321 4.2. Решение задачи 1 для случая преобразований единичного ранга 337 4.3. Решение задачи 1....................................... 363 4.4. Обобщение задачи о минимизации усилий.................. 391 4.5. Литература к главе 4................................... 413
Приложение 1. Метрические пространства..................... 415 Приложение 2. Разложение Фурье............................. 428 Приложение 3. Вычисление матриц перехода..................... 440 Приложение 4. Уравнения n-го порядка........................ 447 Приложение 5. Канонические формы............................ 469 Приложение 6. Дополнение к вопросу о единственности......... 488 Приложение 7. Обращение линейных преобразовании............. 500 Приложение 8. Задачи с подвижным концом..................... 508 Приложение 9. Системы с распределенными постоянными........ 519 Литература.................................................... 546
Среди разнообразных основных тенденций развития теории управления в настоящее время все большую популярность приобретает одна, связанная с попытками поставить и разрешить классические задачи теории в наиболее общем виде. Такая тенденция не является следствием малооправданного стремления к «наукообразию», а вызвана насущными потребностями сегодняшнего дня. Во-первых, сама задача управления стала пониматься более широко — появились работы по исследованию процессов управления в биологических, физиологических, экономических и организационных системах. А во-вторых, даже в привычной сфере применения классической теории, в задачах управления технологическими объектами появились новые задачи, требующие иного подхода к математическому моделированию. В то же время успе хи классической теории управления в слишком большой степени зависят от удачно выбранной исходной модели объекта (который всегда удавалось раньше описать системой обыкновенных или конечноразностных уравнений), обладающей целым рядом специальных свойств (грубость, управляемость наблюдаемость и т. п.), вытекающих из некоторых неявных предположений, навязанных спецификой довольно узкого класса традиционных объектов. Для многих новых задач эти рамки оказались узкими, а попытка их расширить привела к появлению нескольких вариантов новой теории (которую чаще всего называют общей теорией систем), обобщающих классическую, освобождающих ее от некоторых неявных допущений и открыто постулирующих те из них, которые не удается отбросить. Один из таких вариантов, или, вернее, первый шаг на пути его создания, и представлен в этой книге. Создавая свой вариант общей теории систем, Портер пошел по самому осторожному пути. В качестве основного языка теории он выбрал аппарат теории нормированных функциональных пространств, вполне естественный даже и для классических исследований. К тому же его эффективность в рамках теории управления уже была установлена несколькими исследованиями конкретного характера (теория систем с распределенными параметрами, статистическая динамика систем управления, функциональные методы теории оптимальных систем). Портер же попытался целиком переложить на этот язык два крупных раздела классической
6 ОТ РЕДАКТОРА РУССКОГО ПЕРЕВОДА теории управления: теорию линейных систем и теорию оптимального управления. Попытка эта не вполне увенчалась успехом. В теории линейных систем оказались рассмотренными в основном структурные вопросы, а в оптимальной теории — ситуации, в которых критерий качества может быть представлен в виде нормы соответствующего (банахова или гильбертова) пространства, а объект управления линеен. Однако изучение функционального анализа людьми, занимающимися управлением, полезно само по себе, а изучение предлагаемых Портером вопросов углубит понимание теории управления и у тех, кого пока еще не слишком заботят проблемы создания общей теории. (Сошлюсь хотя бы на то, что книга позволяет ясно почувствовать зависимость сложности решения задачи оптимизации от степени гладкости критерия качества.) Поэтому книгу можно всячески рекомендовать советскому читателю. С. В. Емельянов
ВВЕДЕНИЕ В этом введении не упоминается ни один из результатов, составляющих цель данной книги. Мы хотим сейчас лишь набросать общую картину, которая позволит читателю все время чувствовать перспективу дальнейшего развития событий. Обойдем мы и чреватые затруднениями попытки дать явное определение понятия «система». Вместо этого мы будем опираться на общепринятое или интуитивное представление о системе, которое заложено в индивидуальном опыте каждого из нас. Сама возможность такого подхода и составляет одну из граней общей теории систем, предопределяющих ее важность. Действительно, нам удается обнаружить идеи и методы теории систем в таких, на первый взгляд, совершенно несвязанных областях знания, как теория синтеза вычислительных машин, исследования человеческой нервной системы, вопросы управления ракетами, в различных социальных и биологических задачах. Для целей настоящей книги достаточно рассматривать систему как некоторый «черный ящик», у которого имеется набор доступных для наблюдения входов и выходов. Его поведение подчиняется некоторому физическому закону. Величины, характеризующие поведение системы, часто оказывается удобно разделять на следующие категории: (а) внешние (возмущающие) воздействия — внешние стимулы, оказывающие влияние на поведение системы; (б) выходные переменные (или реакции), описывающие те аспекты поведения системы, которые представляют интерес для исследования, и (в) вспомогательные переменные, которые нельзя отнести ни к первой, ни ко второй категориям. На схеме рис. 0.1 клеммы, на которые подаются внешние воздействия (так называемые входы), показаны стрелками, направленными к системе. Выходные сигналы системы показаны стрелками, направленными от нее. Вспомогательные переменные, если таковые имеются, скрыты внутри самого «ящика». Технические и научные аспекты исследования систем обычно охватывают широкий спектр вопросов, таких, как определение законов, предопределяющих поведение системы по наблюдениям происходящих в ней физических явлений; изучение математической модели, приближенно описывающей физическую систему; вопросы математического синтеза системы с заданными свой-
ствами; вопросы физической реализации результатов математического синтеза. Из только что перечисленных четырех групп задач в этой книге рассматриваются лишь те, которые связаны с проблемами анализа и синтеза при известной математической модели. С точки зрения теории «черного ящика» математическая модель должна позволить определять реакцию системы и (или) ее вспомогательных переменных на заданные внешние воздействия. А так как различным целям лучше соответствуют разные методы описания систем (т. е. различные типы математических моделей), то не удивительно, что существует и много разных подходов к общей теории систем. Займемся теперь выяснением возможных причин, заставляющих исследователя остановиться на том или ином подходе. 0.1. Задачи математического моделирования Одна из возможных целей математического моделирования связана с желанием разобраться с качественной точки зрения в свойствах и поведении систем вообще, и в этом случае нам необходимо такое описание, которое позволило бы получить принципиальную модель, охватывающую как можно более широкий класс реальных систем. Ясно, что в определенной степени каждый разумно выбранный метод описания позволяет расширить наши представления и наше понимание задач общей теории систем. Вторая задача математического моделирования состоит в количественном изучении определенного, ограниченного класса систем. В этом случае желательно «скроить» метод описания систем «по мерке» интересующего нас класса, даже за счет потери полной общности такого представления. Наконец, третья цель, с которой часто приходится сталкиваться, определяет выбор описания системы соображениями, связанными со стремлением воспользоваться некоторым конкретным методом анализа. Естественно, каждое конкретное описание системы в определенной степени удовлетворяет или не удовлетворяет каждой из этих целей.
Популярность большинства математических методов, используемых в теории систем на сегодня, можно объяснить их успехом в достижении одной из этих целей. В качестве иллюстрации справедливости этого утверждения рассмотрим два подхода, наиболее часто используемых при анализе систем с «сосредоточенными параметрами» (т. е. систвхМ, описываемых обыкновенными дифференциальными или интегральными уравнениями) *). Если рассматриваемые системы линейны и стационарны, то классический метод их исследования базируется на преобразованиях Лапласа или Фурье и описывает системы с помощью их передаточных функций. Такой метод описания идеально подходит для исследования линейных стационарных систем, заданных дифференциальными уравнениями, так как метод интегральных преобразований позволяет построить для этих уравнений аналог — алгебраические уравнения, после чего формулировка и решение многих задач анализа и синтеза упрощаются. Именно этим и объясняется огромный объем литературы по методам анализа и синтеза этого типа, опубликованной за последние 20 лет. Многие попытки распространить метод интегральных преобразований на более широкий класс систем не увенчались успехом, так как основная слабость этих методов связана с теми относительными трудностями, с которыми приходится сталкиваться при применении их к анализу нелинейных и нестационарных систем. Поэтому метод интегральных преобразований можно считать типичным примером аппарата, пригодного для исследования весьма ограниченного класса систем, но в то же время успешно решающего задачи, которые связаны с этим классом. Чрезвычайно модный сейчас в технических кругах метод параметров состояния позволяет описывать поведение систем во временной области. Такой подход теснее связан с физической природой системы и позволяет глубже проникнуть в ее суть, чем это удается сделать методом передаточных функций. Этот метод описания систем позволяет с единой точки зрения рассматривать как линейные, так и нелинейные, как стационарные, так и нестационарные системы, хотя решение нелинейных задач остается по-прежнему трудным. Этот подход создает к тому же естественные предпосылки для формулировки некоторых задач оптимизации. Слабость обоих подходов состоит в первую очередь в том, что описание системы в обоих случаях слишком тесно связано с конкретной физической природой ее поведения. А это затрудняет восприятие ее общих или абстрактных свойств. Этой фразой мы хотим сказать, что при обоих подходах основное внимание обращается на реакцию системы на определенное внешнее воздействие, а *) Точнее сказать, систем, вся совокупность переменпых которых (т. е. внешних воздействий, выходных величин и внутренних переменных) может быть представлена конечномерной векторной функцией времени. (Прим, ред.)
не на некоторый класс таких воздействий. Кроме того, многие физические системы в рамках одного из этих подходов описываются со значительным трудом. Примерами таких «трудных» систем могут служить системы с распределенными параметрами, термодинамические системы и многие другие. Рассмотрим теперь две конкретные задачи теории систем, которые будут положены в основу рассуждений всего введения. Пример 1. В качестве простого примера, часто встречающегося в механических и электрических системах, рассмотрим задачу, исследовавшуюся X. Д. Блоком*). На рис. 0.2 показана единичная Рис. 0.2. Механическая система. масса, подвешенная на стержне и испытывающая воздействие некоторой силы P(Z). Функция x(t) описывает смещение массы из ее первоначального равновесного состояния в момент времени t, а через & обозначено восстанавлива ющее усилие, развиваемое стержнем и действующее на массу. Если пренебречь трением, то движение системы описывается уравнением + = (1) Мы специально воспользовались здесь рукописным к тому у нас несколько причин. Предположим, что мы пытаемся определить $ экспериментально. Если положить, что восстанавливающая сила стержня обладает гистере- зисом, то диаграмма смещение — напряжение, показанная на рис. 0.3, представляет собой типичный результат определения $ при изменяющемся х. Если во время опыта увеличивать х от х0 до х^ затем уменьшать его до х2, вновь увеличивать до х3 и вновь уменьшить до х^ то соответствующая точка в плоскости (х, вычертит траекторию от Ро до Р19 от Рх до Р2, ..., от Р7 до Ро. Заметим, что значение силы f хотя и зависит от х, но не является функцией лишь х. В самом деле, если х равно, например, то, как показано на рис. 0.3, & может принимать по крайней мере четыре различных значения, а в действительности этих значений может быть много больше,— все зависит от характера последовательности событий, приведших к тому, что х стало равным Определить не поможет и рассмот ♦) Н. D. В 1 о с k, Periodic Solutions of Forced Systems Having Hysteria us, IRE PGGT, 423-31 (Dec. 1960).
рение dxldt, dPxIdt2 и т. п. Наконец, еще более ясно, что & нельзя рассматривать как функцию t, не меняющуюся при изменении программы нагрузки. Это позволяет заключить, что не есть функция одной или нескольких переменных и что уравнение (1), следовательно, не есть дифференциальное уравнение в принятом смысле этого слова. Но, с другой стороны, если функция x(t) задана на промежутке времени 0 t Т, то f можно рассматривать как функцию t на том же промежутке. В частности, если Рис. 0.3. Явление гистерезиса. x(t) задано для всех t 0, то на этой полуоси задано и f. Таким образом, & является некоторым отображением функции x(t) в Другую функцию [^(х)](/). Пример 2. В этом примере мы обратимся к изучению системы, схематически показанной на рис. 0.1, обозначив через хъ ..., хт входные воздействия, а через уъ ..., уп выходные величины. Вместо того чтобы рассматривать входные воздействия как некоторые функции времени или некоторые временные ряды, определим m таких классов допустимых входных воздействий Хь... ..., Хт, что каждый входной сигнал я. окажется членом одного из этих классов X., i = 1, 2, ..., т. Определение допустимости входного воздействия обычно базируется на физических или инженерно-конструкторских соображениях. Например, Хх может состоять из функций времени, определенных на промежутке b, и таких, что каждая из них обладает следующими общими свойствами: (а) все элементы Х\ ъ интегрируемы с квадратом, т. е. \x2(t)dt< оо; (б) все элементы а Ад должны быть непрерывны; (в) все элементы Хг не превосходят по абсолютному максимуму некоторой фиксированной постоянной;
(г) все элементы должны быть вида z(t) " sin (пл/), где п рационально. Аналогичным же образом обычно удается установить, что и выходные сигналы также должны быть элементами некоторых функциональных классов. В связи с этим саму систему можно рассматривать как некоторое отображение класса входных сигналов в множество классов выходных сигналов или некоторое соответствие между ними. Исследователя систем обычно интересует широкий круг вопросов, которые можно сжато сформулировать, воспользовавшись представлением системы, показанной па рис. 0.1. Например, задача оптимизации в типичном случае принимает следующий вид: при заданной цели работы системы и заданном критерии ее качества найти конкретное множество входных сигналов в пределах допустимых классов Xw, которые обеспечат не только выполнение поставленной цели, но и приведут к достижению максимального качества. 0.2. Подход теории функциональных пространств Два примера из § 0.1 типичны для задач, стоящих перед исследователями систем. Изучение этих примеров, а также других, с которыми мы столкнемся позже, показывает, что естественный метод представления большинства систем состоит в том, чтобы рассматривать их как некоторое соответствие между элементами классов входных и выходных сигналов. Такой подход, по необходимости, требует использования аппарата теории функциональных пространств (грубо говоря, множеств, элементами которых служат функции). В математике вопросы исследования и применения этого аппарата объединяют под названием «функциональный анализ». Хотя в этой книге функциональный подход к исследованию систем занимает главное место, это не исключает возможности использования методов, связанных с параметрами состояния или передаточными функциями и интегральными преобразованиями. Хотя функциональным анализом математики усиленно занимаются уже не менее пятнадцати лет, методы функционального анализа проникли в теорию систем практически после 1960 года. Быстрый рост популярности этого подхода к решению задач теории систем можно объяснить не только тем, что он позволяет формулировать эти задачи более широким (а следовательно, и менее приближенным по отношению к физическому прототипу) образом, но и тем, что использование языка функционального анализа позволяет яснее понять суть даже классических результатов. И хотя пока еще не ясно, почему это так, мы ограничимся здесь замечанием о том, что этот подход к решению задач теории систем позволяет освободиться от влияния конкретной природы каждой за
дачи. Другими словами, многие из результатов этого подхода сохраняют свой смысл для самых разных систем, будь они системами с распределенными параметрами, цифровыми, нелинейными или биологическими. Естественно, что результатам, полученным в абстрактной постановке, необходимо придать затем конкретную форму, сочетающуюся со смыслом решаемой физической задачи. Для того чтобы добиться целей, преследуемых в этой книге, эффективным образом, мы не можем не познакомить читателя с основными понятиями различных разделов функционального анализа. Поэтому первые параграфы этой книги представляют собой введение в разделы, позволяющие свободно обсуждать задачи теории систем на языке функционального анализа. В связи с тем. что мы рассматриваем систему как устройство, преобразующее пространство входных сигналов в пространства выходных величин, мы прежде всего возьмемся за изучение таких пространств. Именно этому и посвящена вся глава 1. А так как объем книги ограничен, то мы отбросили все попытки украсить этот материал пространными примерами из практики искусственных систем. В первых двух параграфах главы 2 мы познакомимся с элементарными свойствами отображений одного функционального пространства в другое. Затем мы переносим наше внимание с абстрактных вопросов на более конкретные и в оставшейся части этой главы рассматриваем свойства линейных динамических систем. Мы надеемся, что к концу главы 2 читатель почувствует, что он может довольно свободно формулировать задачи теории систем на языке функционального анализа. Остальная часть этой книги представляет собой некий сплав теории и ее применений. Обращаем специальное внимание читателя на то, что приложения к книге содержат дополнительный материал к ее основному тексту. В заключение нам хочется отметить, что многие идеи и методы этой книги впервые используются в теории систем. Для того чтобы обеспечить их усвоение, мы старались постоянно использовать геометрические и интуитивные представления. Например, нам потребуется определить такие понятия, как расстояние между двумя элементами функционального пространства, их величину (длину), угол между ними. При этом мы обязательно воспользуемся эквивалентными определениями для векторов обычного трехмерного пространства в качестве моделей, позволяющих представить себе образную картину для этих более абстрактных понятий. Очень часто полезно рисовать для каждого такого определения некоторую элементарную диаграмму. На этом мы заканчиваем наше введение, посвященное философии, целям и структуре настоящей книги. В последующих главах нам остается лишь облечь плотью столь торопливо набросанную схему.
ГЛАВА 1 ФУНКЦИОНАЛЬНЫЕ ПРОСТРАНСТВА Эта глава посвящена ряду математических вопросов, которые будут положены в основу остального материала книги. Такой подход, при котором математические основания теории изложены в одной главе, позволит нам собрать в одном месте большинство определений, терминов и понятий, которыми мы будем пользоваться в дальнейшем. А так как наши отправные посылки не слишком определенны (см. введение), то эта глава позволяет читателю к тому же «залатать дыры» там, где это окажется необходимым, обращаясь к дополнительной литературе. (В конце этой главы мы порекомендуем некоторые из книг по каждой из затронутых тем.) Каждый раз, когда в книге идет речь о подготовке математического аппарата, чрезвычайно важно установить прочные связи между математикой, с одной стороны, и физическими явлениями, стимулирующими ее развитие в данном направлении, — с другой. С этой целью читателю следует постоянно помнить о модели системы со многими входами и выходами, символически представленной на рис. 0.1. Во введении мы уже условились о том, что такую систему удобно рассматривать как объект, устанавливающий определенное соответствие между двумя функциональными пространствами — пространством входных и пространством выходных сигналов. Прежде чем приступить к исследованию таких соответствий, мы изучим в этой главе сами функциональные пространства. 1.1. Множества Теория множеств и операций над множествами является потенциально полезным аппаратом исследования в большинстве инженерных дисциплин с достаточно развитым математическим аппаратом. В связи с важностью теории множеств мы приведем здесь краткий перечень наиболее часто используемых теоретико-множественных обозначений. Изложение не будет строгим, так как мы предполагаем, что каждый читатель интуитивно знаком с понятием множества. В настоящем контексте мы будем представлять себе множество как некоторую совокупность, систему или собрание объектов и элементов, объединенных в единое целое в соответ-
ствия с некоторым правилом. Например, мы говорим о множестве всех целых положительных чисел, о множестве всех рациональных чисел на вещественной прямой, о множестве всех точек на комплексной плоскости. Если элементами множества являются другие множества, мы будем говорить о «классе» множеств вместо множества множеств. Однако мы не собираемся закреплять значения слов «элемент», «множество» и «класс» раз и навсегда. Например, мы можем рассматривать вещественную прямую не как множество вещественных чисел, а как некоторый объект, как элемент другого множества, и говорить тогда о множестве всех прямых на плоскости. Второе интуитивное понятие теории множеств — это понятие «принадлежности». Если х принадлежит множеству А (т. е. х — элемент множества Л, или х содержится в множестве Л), то мы будем обозначать это х ЕЕ Л. Кроме того, удобно пользоваться обозначением х Л в случае, когда элемент х не принадлежит множеству Л. На понятии принадлежности базируется и понятие эквивалентности множеств. Взаимосвязь между этими двумя понятиями устанавливается с помощью следующей аксиомы. Аксиома эквивалентности. Два множества А и В называются эквивалентными (или равными), А = В, тогда и только тогда, когда они состоят из одних и тех же элементов; другими словами, они эквивалентны тогда и только тогда, когда из х ЕЕ Л следует, что х ЕЕ В, и наоборот. Например, если Л — множество корней уравнения х2 — 6х + 8 = 0, а В = {2,4}, то Л = В. Если Л и В не равны, то мы пишем, что A В. Другим важным понятием является понятие подмножества. Определение А. Каковы бы ни были множества А и В, А называется подмножеством В (что записывается как А cz В) тогда и только тогда, когда из х ЕЕ Л следует, что х ЕЕ В. Обозначим через В множество всех футбольных команд Большой десятки, а через Л — все команды этих городов, играющие в первой лиге. Тогда Л с В. Одним из следствий приведенного выше определения является то, что утверждение Л cz В не исключает возможности Л = В, В порядке уточнения понятия подмножества мы станем называть множество Л собственным подмножеством множества В (A CZ В) тогда и только тогда, когда Л cz В и Л '=£= В. Если Л cz В (или Л CZ В), то можно утверждать, что В cz Л (или В Z) Л), и говорить, что В включает в себя множество Л. В дальнейшем нам удобно будет пользоваться символом логического следования (импликации) => . Пусть р и q — некоторые высказывания; тогда р => q означает, что из р следует q (т. е. если р истинно, то истинно и q). Точно так же символом о обозначается двусторонняя логическая импликация, или логическая
эквивалентность. Она обозначает, что высказывания, объединяемые этим символом, логически эквивалентны и что из любого из них следует второе. Этот символ обычно читают как «тогда и только тогда, когда» или «эквивалентно». Из приведенных выше аксиомы и определения вытекают следующие очевидные свойства операции включения: (1) AQA, каково бы ни было А; (2) A CZB и В А А = В; (3) А с В иВсСн>АсС. Интересно отметить, что свойства (1) и (2) можно объединить в едином утверждении: A = Это замечание указывает на удобный путь доказательства эквивалентности множеств. А именно один из способов доказательства эквивалентности множеств и состоит в том, чтобы не просто пересмотреть все их элементы, а доказать, что каждое из них является подмножеством другого. Для описания множества в дальнейшем мы станем пользоваться двумя естественными методами. Во-первых, мы можем просто перечислить все его элементы, заключив их в фигурные скобки. Так, А = {1, 4,7} означает, что А — это множество, элементами которого служат 1,4 и 7. Чаще же мы будем вводить множество, указывая свойство, позволяющее определить, принадлежит ли любой элемент этому множеству или нет. В этом случае мы станем пользоваться так называемым коллективизирующим обозначением: А = {х:р(х)}, где р(х) есть некоторое высказывание или уравнение, описывающее свойства всех элементов множества А. Это читается следующим образом: множество А состоит из всех элементов х, обладающих свойством р(х) *). Например, рассмотрим множество {1,2,3,4,5} - {х: х— целое число, удовлетворяющее неравенству 1 х 5}. Аксиома эквивалентности гарантирует единственность множества, определенного таким образом. Приведем еще один пример второго определения множества: { + 1, ±3, +5, ...} = {п: п — нечетное число}. Мы часто будем стараться сократить наши обозначения. Так, вместо последнего обозначения мы могли бы воспользоваться следующим: {п: п нечетно}. В дальнейшем мы всегда будем добиваться наибольшей краткости, не идущей вразрез с требованиями ясности и однозначности. *) Для которых р (х) истинно. (Прим, перев.)
Поскольку нам часто придется сталкиваться с этим, мы введем специальные обозначения для различных подмножеств вещественной прямой. Если а и b — два вещественных числа, а < Ь, то в качестве стандартных мы будем использовать следующие обозначения: [а, Ы = {%' а х Ъ}, (а, Ь] = {х\ а < х Ь}, [а, Ь) = { х: а х < Ь}, (а, Ь) = {х: а < х < Ъ}. Выписанные выше множества мы будем называть отрезком с началом в а и концом в Ь; промежутком, открытым в а и замкнутым в Ь; промежутком, замкнутым в а и открытым в Ь, и интервалом с концами в а и Ь, соответственно. Другим часто используемым множеством является пустое множество, обозначаемое символом 0 и определяемое условием 0 = = {х: х=^= х]. Но так как не существует такого х, которое удовлетворяло бы условию х =[= х, то ясно, что множество 0 не содержит элементов. Из аксиомы эквивалентности немедленно следует, что все пустые множества эквивалентны между собой. Кроме того, из определения А следует, что для любого множества И, Алгебраические операции над множествами. Представляется вполне естественным и даже нужным научиться строить новые множества из тех, которыми мы уже располагаем. Для того чтобы избежать определенных логических трудностей, мы во всех последующих утверждениях будем неявно предполагать, что все рассматриваемые там множества являются подмножествами некоторого всеобъемлющего множества, которое обозначается символом Й. В зависимости от ситуации мы будем менять нашу точку зрения на то, что мы подразумеваем под универсальным множеством Й. Например, говоря о множествах вещественных чисел, мы примем, что й — это /?, множество всех вещественных чисел. Изучая же множество комплексных чисел, мы будем считать, что й — это С, множество всех комплексных чисел. Иными словами, мы всегда будем предполагать, что такое универсальное множество й имеется в нашем распоряжении, и мы вольны выбирать его соответственно потребностям конкретной ситуации. Геометрическая интерпретация зачастую позволяет легче представить себе множества и операции над ними. С этой целью мы можем представить Й в виде прямоугольника на плоскости, а элементы й — точками, попавшими в этот прямоугольник. При такой интерпретации множества могут изображаться различными областями прямоугольника, а это в свою очередь позволяет строить диаграммы, позволяющие проиллюстрировать различные операции
над множествами или отношения между ними. Например, если Л и В — это два множества из £2, то диаграмма на рис. 1.1 описывает ситуацию, в которой А является подмножеством В (мы рассматриваем здесь множества как совокупность всех точек, принадлежащих области, ограниченной соответственной замкнутой кривой). Такие графические иллюстрации положений теории множеств часто называют диаграммами Венна. Впоследствии нам окажутся полезными следующие четыре простые теоретико-множественные операции. Первой из них является операция объединения, иллюстрируемая диаграммой на рис. 1.2. Определение Б. Каковы бы ни были множества А и В. объеди- Рис. 1.1 А содержится в~Я. пением А и В называется множество A(JB = {я: х ЕЕ А или х ЕЕ В}. Рис. 1.2. Объединение А и В. Таким образом, во время «объединения» множеств мы собираем в единое множество Л (J В все элементы, принадлежащие либо Л, либо В. Смысл этой операции следует из рис. 1.2, на котором множество A|J5 состоит из точек заштрихованной области. Теорема А. Каковы бы ни были множества А и В, A cz В тогда и только тогда, когда A (J В = В. Доказательство. Справедливость этой теоремы очевидна из диаграмм рис. 1.1 и 1.2. Однако нам кажется полезным привести и формальное доказательство. Пусть A U В=В. Если х^А, то х^А JZ? = ~ В и, следовательно, хеВ. Отсюда А ст В. Предположим теперь, что А се В. Если х е A (J В, то либо х е А, либо хСЕВ. Но если х^А, то хЕЕ В, так как А ст В. Отсюда A|J5 ст В. В то же время из определения Б сразу следует, что В ст A (J 5, и значит, A (J В =В. Очевидное следствие из теоремы А состоит в следующем: каково бы ни было множество А, А II А = = А и 0J А = А. Второй основной теоретико-множественной операцией является операция пересечения, результат которой обозначается через ЛП#. Пересечением двух множеств называется совокупность общих для них элементов.
Определение В. Каковы, бы ни были множества А и В, пересечением А и В называется множество А П В = {х: х А и хеВ}. Диаграмма на рис. 1.3, где элементы A Q В представлены точками заштрихованной области, мо- * жет служить иллюстрацией этого определения. Теорема В. Каковы бы ни были множества А и В, Асе В тогда и только тогда, когда A Q В = А. Диаграмма на рис. 1.3 не оставляет сомнений в справедливости этого утверждения. Формальное доказательство теоремы практически повторяет доказательство теоремы А, и мы предоставляем его читателю. Очевидными следствиями теоремы Б являются следующие утверждения, справедливые для произвольного множества А: во-первых, А Г) А = А и, во-вторых, 0 П А = 0. Определение Г. Каковы бы ни были множества А и В, разностью А и В называется множество А\В = {х: х £Е А и х В}. Смысл этого определения уточняется рис. 1.4. Заштрихованная область на этой диаграмме содержит точки множества А\В. Во время вычитания множеств из А отбрасываются лишь точки, принадлежащие А П В. Теорема В. Каковы бы ни были множества А и В, А СЕ В тогда и только тогда, когда А\В = 0. Доказательство. Если A cz В, то для всех х ЕЕ А х е В и, следовательно, А \ В = 0. Если же А \ В = 0, Рис. 1.4. Разность А и В. то не существует элемента х такого, что х (= А и х В. А это значит, что из х £= А следует, что хЕЕ В, а значит, A cz 5. Ясно, что для любого множества А :А \ А = 0 и 0\А = 0. Последней из этих простейших операций является операция дополнения. Дополнение множества А обозначается через А' и состоит из всех элементов, не принадлежащих множеству А. Поскольку мы рассматриваем только те элементы, которые образуют
20 Вл. i. фуййциойалЬнё1е пространства множество Я, то формально определить А' можно следующим образом. Определение Д. Дополнением А' произвольного множества А называется множество А' = {х\ х А). Диаграмма на рис. 1.5 (где А' заштриховано) иллюстрирует это определение. Четыре простейшие операции объединения, пересечения, вычитания и дополнения отнюдь не являются независимыми. Например, простое сравнение определений Д и Г сразу позволяет установить соотношение А' - Я \ А между дополнением и разностью. А отсюда сразу можно получить утверждения 0' = Я и Я' = 0. Поль зуясь этим же соотношением, нетрудно получить, что (Л')' = Я \ (Я \ А) = А. Изученные простейшие теоретико-множественные операции можно объединить в более сложные несколькими естественными способами. В нижеследующей теореме мы приведем семь полезных теоретико-множественных тождеств. Они используются настолько часто, что их целесообразно отметить специально. Теорема Г. Каковы бы ни были множества А, В и С, каждое из которых есть некоторое подмножество универсального множества Я, имеют место следующие равенства'. (1) A и (в и 0 = И и в) и с, (2) лп (В л С) = (Л п В) n С, (3) а и (В п С) = (л и в) л (Я U С), (4) WUQ = (л Л Л)им Л С), (5) (Л и ву = Л' л в’, (6) (Л л ву = Л' и в', (7) A cz В & В' Л'. Доказательства этих полезных тождеств мы оставляем читателю в качестве упражнений. Следует отметить, что некоторые из этих утверждений можно доказать, не прибегая к понятию «при-
надлежпости». Например, можно показать, что утверждение (6) следует из утверждения (5), если в последнем заменить А и В на А' и В', соответственно, и перейти к дополнениям обеих сторон равенства. Утверждения (1) и (2) легко обобщить на случай п множеств. Действительно, повторное применение указанных тождеств показывает, что множества (j A = и A U • • • U Л, i=l n Ai = А, П А2 П . • . п Ап i 1 можно образовать из объединений и пересечений, соответственно, взятых в произвольном порядке, и что это не приведет к неоднозначности. В некоторых случаях мы воспользуемся множеством индексов, состоящим из возможных индексов рассматриваемых множеств. Определение Е. Пусть I — некоторое множество индексов, и пусть каждому i ЕЕ I соответствует некоторое множество А.. Тогда объединением множеств А. называется множество U А{ = {х: найдется / СЕ 7 такое, что хЕ^А^}, is Г а пересечением множеств А. — множество П Ai = {х\ для всех i^I, xfEE. AJ. Если характер множества индексов I очевиден, то эти обозначения безопасно упростить и писать |J . А. и А.. Если же класс {A.: i е/} состоит из некоторой последовательности множеств, т. е. из Аь А2,..., то их объединение и пересечение мы будем обозначать символами [J £,х А. и П^А., соответственно. Для полноты отметим следующее обобщение предыдущей теоремы. (Равенства (3) и (4) следующей теоремы известны в литературе как теоремы Моргана.) Теорема Д. (1) а и ( П Вг) = П (А и В), ief г&1 (2) А п ( и Bt) = и М n Bi), iG-Г (3) (и А)' = A A'i, iE=I ief (4) ( П A) = U A'i. г&Г iel
При изучении различных соотношений между теоретико-множественными операциями можно обнаружить, что для доказательства одного и того же соотношения имеется несколько путей. При этом сообразительность и опыт доказывающего играют зачастую более важную роль, чем какие-либо формальные процедуры. В качестве иллюстрации рассмотрим теоретико-множественное тождество (A (J В) \ С — (А \ С) (J (В \ С). Из импликации х ЕЕ (A(JB)\C => xE(A'j^) и х С следует, что либо я ЕЕ А, либо х ЕЕ В и х С. Если хЕ А и х С, то х Е= (А \ С) и, следовательно, х ЕЕ (А\ C)|J(B \ С). Точно так же, если х е В, и х С, то ясно, что х£ (A \C’)U(B\Q. Отсюда (A(J£)\ \С С (А \ C)U(B\C). Для того же, чтобы доказать обратное отношение, предположим, что я Е: (А \ C)|JCS \ С). Тогда либо х (= (А \ С), либо х £Е (В \ С). Если х ЕЕ (А \ С), то zE А и С, а значит, х Е: A (J В, и так как х С, то х s (A (JB)\C и (А \ C)U(fi \ Q с (AJB) \ С и т. д. Второй и более простой способ доказательства использует теорему Г, а именно: AUB\C = (Аи#)ПС" = ПС") U С® U С") = = (А \C)U(B\C). Декартовы произведения. Рассматривая в дальнейшем системы со многими переменными, мы убедимся в полезности понятия декартова произведения множеств (или просто произведения множеств). Это понятие выросло из понятия декартовой системы координат, применяемой в аналитической геометрии. Читатель помнит, что двумерная декартова система координат определяется двумя прямыми на плоскости, расположенными под прямым углом относительно друг друга, причем за начало отсчета (нуль) на каждой прямой выбрана точка их пересечения. Положение любой точки z на плоскости определяется значениями ее двух ортогональных проекций на каждую из этих осей. Иными словами, z = (х, г/), где х — координата по первой оси, а у — по второй. Одно из важнейших геометрических свойств заключается в том, что если zt = (xx, z/j) и z2 = (х2, у2) — некоторые точки на плоскости, то Z1 = z2 4=> хг = х2 и уг = у2. Если перейти на более строгий язык, то множество {а, Ь} называется упорядоченной парой и обозначается через (а, Ь), если оно принадлежит некоторому классу, для которого справедлива следующая аксиома. Аксиома упорядоченных пар. Каковы бы ни были упорядоченные пары (а, Ь) и (с, d), (а, b) = (с, d) тогда и только тогда, когда а = с и Ъ = d. Предположим теперь, что Yr и У2 — два непустых множества. По аналогии с декартовым представлением комплексной плоскости введем следующие определения.
Определение Ж. Каковы бы ни были множества Yr и у2, декартовым произведением Yx X У2 будем называть множество У1 X У2 = {(У1, У2 ): У16 Л и у2<= У2). Другими словами, множество У! х Y2 представляет собой совокупность всех упорядоченных пар {(уп у2)}, таких, что уг е Е=У1, a y2(EiY2. Несмотря на произвольный характер множеств Y1 и У2 иногда оказывается полезным представлять себе Yr и У2 так же, как мы представляем себе декартову систему координат на плоскости. Определение произведения двух множеств естественно обобщается на случай п множеств. Например, если УА, У2,..., Уп — непустые множества, то их декартовым произведением Yr х У2Х... ... X Yn называется множество всевозможных упорядоченных п-ок (уц у2, ..., уп), таких, что у<^У{ при любом значении индекса i. Если все У$ являются копиями одного и того же множества У, то их произведение обозначается Уп. Например, через R1 можно обозначать R, прямую вещественных чисел, через R2 — вещественную плоскость, а через R3 — множество всех упорядоченных троек вещественных чисел, лежащее в основе классической аналитической геометрии трех измерений. В качестве второго примера вспомним о системе со многими переменными, схема которой изображена на рис. 0.1. Вводя в рассмотрение множества X = х ... X Хт и у == ух х ... ... X Уп» мы сразу убеждаемся в том, что эту систему можно считать устанавливающей соответствие между множествами X и У, а не между классами {%<} и {У^, что было бы сложней. После введения новых множеств не остается серьезных причин, по которым системы с несколькими переменными и с одной переменной нужно изучать порознь. Используя упорядоченные n-ки, мы часто называем yi z-й координатой п-ки, а У{ i-м координатным множеством.| Если 2 = (Ун •••, Уь •••» Уп) Er. YtX ... X Yn = Z, то у{ часто называют проекцией Ина множество Yt. Аналогично множество У{ можно назвать проекцией множества Z на его z-e координатное множество. Все элементарные теоретико-множественные операции легко обобщить на декартовы произведения множеств. В дальнейшем мы будем неявно предполагать, что новое универсальное множество имеет вид произведения координатных универсальных множеств. Нижеследующая теорема содержит три примера полезных теоретико-множественных тождеств относительно декартовых произведений.
Теорема Е. Каковы бы ни были множества А, В и С, (1) Л х (Z?UQ - (л X 5) и (Л X С), (2) А X (В П С) = (Л X В) П (Л X С), (3) Л X (В \ С) =- (Л X В) \ (Л X С). Доказательство (1). Если (х, у) €~Л %(B(JC), то х Л и i/G GE/?|JC. Тогда yEzB или у 6= С, так что (х,у)Е= ЛхВ или (х, у) ее €= Л х С. Поэтому (х, у) £ (Л X В) (J (Л х С) и Л х C#U0 <= с (Л X 5)и(Л X С). Если же (х, у) S (Л X В) ЩЛ X С), то (х, у) е л X В или (х, у)ЕА х С. Это значит, что х ё= А, а у В или у е С. Другими словами, у ЕЕ B\JC и (х, у) ЕЕ ЕЕ А X (В J С), так что (А х В) [J (А х С) £ А х (В (J С), откуда А х (#UQ = G4 х В)|J(А X С). Упражнения 1. Пусть Q — множество {1, 2}. На этом множестве можно построить четыре подмножества. Выпишите их. Сколько подмножеств содержится в множестве Q - {1, 2, и}? 2. Докажите теоремы Б и Г до конца. 3. Убедитесь в справедливости следующих теоретико-множественных тождеств: (а) (б) (в) A U (Л П В) = А = А П (Л U В), (Л и Л) \ С = (Л \ С) и (В \ с), Л \ (В и с) - (Л \ В) \ с. 4. Множество Л Д В = (А \ В) (J (В \ Л) называют разностью множеств А и В. Докажите, что (а) А А (В Д С) = (Л Д В) Д С (ассоциативность), (б) Л П (В А С) = Л П В Д Л р| С (дистрибутивность), (в) лив = лдвдлия, (г) Л Д В = Л Д Л п симметр ической 5. Докажите утверждения (2) и (3) теоремы Е. 6. Представьте цилиндр с радиусом основания г и высотой h в виде произведения множеств. 1.2. Метрические пространства В § 1.1 мы познакомились с основными понятиями и терминологией, необходимыми для эффективного изучения операций над абстрактными множествами. Хотя у всех этих понятий есть много интересных применений, понятие «множества» становится для нас особенно полезным лишь после того, как ему придается определенная структура. Множество, наделенное определенной структурой, т. е. множество с установленными соотношениями между
его элементами или операциями над ними, называют «пространством». Структуру же множества чаще всего можно отнести к числу геометрических либо алгебраических структур. В этом параграфе мы введем понятие расстояния, которое по своей природе является геометрическим. Расстояние между двумя точками х и у на вещественной прямой определяется числом \х — г/|. В двумерном пространстве расстояние между двумя упорядоченными парами zY = (xj9 yY) и z2 = (х2, у2) обычно определяется по формуле {(хх — х2)2 И (У1~ */г)2 }'/2- Не представляет труда обобщение понятия расстояния на случай трех или большего числа измерений. При изучении систем общего вида нам окажется необходимым ввести понятие расстояния, распространяющееся и на абстрактные множества. Элементы множеств и сами множества, которые будут интересовать нас больше всего,— это функции времени или временные последовательности. Введение расстояния в таких множествах не так очевидно, как в только что приведенных геометрических примерах. В качестве естественных кандидатов на формулу для расстояния между двумя функциями u^t) и u2(t) можно предложить следующие: ь max | (t) — и2 (0 |, \ | Hi (0 — и2 (0 | dt ^[а, Ь] а или [ 3 lwi Gk) u2(^k)]2"| • В системах же со многими переменными для определения расстояния между упорядоченными n-ками и = (un ..., ип) и v = (vl9 ... ..., vn) зачастую пользуются и такими сложными выражениями, как к Ъ 2/р П 2/ У [(2 5 I uj (0 "" V3 W |Р^) (2 2 (^i) *" I • L ;=1 a 1 j=k+l ' Сложность приведенных выражений подсказывает, нам, что, прежде чем пользоваться конкретными формулами, было бы неплохо разобраться в элементарных свойствах понятия расстояния. Метрическое пространство (понятие, которое будет определено позже) — это всего-навсего некоторое непустое множество, для которого определено (в соответствии с некоторыми правилами) понятие расстояния между его элементами. Если теперь исследовать понятие геометрического расстояния и попытаться сформулировать его основные свойства в специальной аксиоме, то мы,
по-видимому, довольно естественно придем к следующему определению. Определение А. Пусть X — некоторое непустое множество, Расстоянием или метрикой в X называется вещественная функция *) р пары элементов X такая, что если х, у, z (= X, то выполяются следующие три условия: (1) р(х, у) > 0, и р(х, у) = 0 <=> х = у (свойство тождественности), (2) р(х, у) = р(у, х) (симметричность), (3) р(я, у) р(я, z) + р(у, z) (неравенство треугольника). Число р(х, у) и есть то расстояние, которое нам понадобится, а три условия, выписанные в определении, известны под названием аксиом метрического пространства. Недолгое размышление позволяет признать, что эти аксиомы суммируют фундаментальные свойства, которых интуитивно ожидаешь от понятия расстояния. Определение Б. Метрическое пространство представляет собой совокупность двух математических объектов: некоторого непустого множества X и некоторой метрики р, определенной в X, Элементы X называют точками метрического пространства (X, р). Каждый раз, когда это не может привести к путанице, мы будем обозначать метрическое множество (X, р) тем же символом X, который используется и для обозначения множества точек, лежащих в его основе. Однако ни в коем случае нельзя забывать, что метрическое пространство — это не просто некоторое непустое множество, а непустое множество с определенной в нем метрикой. Определить метрику р в множестве X можно не единственным образом. На самом деле, часто оказывается, что на одном и том же непустом множестве можно задать несколько метрик. Использование различных метрик приводит к созданию различных метрических пространств. Очень важно полностью освоиться с аксиомами определения А. С этой целью рассмотрим несколько примеров метрических пространств, каждый раз обращая специальное внимание на то, насколько естественным здесь оказывается выполнение каждой из этих аксиом. Пример 1. Для любых точек х, у вещественной прямой R метрику можно задать по формуле р(*. у) = к - И ♦) Здесь автор допускает определенную логическую непоследовательность, пользуясь понятием функции, которое он определит лишь в главе 2. (Прим, перев,)
Легко проверить, что все три условия нашего определения здесь не нарушены: (1) р(*. у) = |* — у| = = у> (2) р (х, у) = | х — у | =| — (у — х) | = | у — х | = р(у, х), (3) Р (х, у) = I X — у I = | (х — Z) + (z — у) К | X — Z | + + |z —у| = pk. z) + p(z, у). Метрику |гг — у\ называют естественной метрикой в R, Если противное специально не оговорено, то множество R в качестве метрического пространства предполагается имеющим эту метрику. Пример 2. Если С — множество всех комплексных чисел z = а + /&, то одна из подходящих метрик может определяться по формуле р (*!> Z2) = {(zx - z2) (Zi - z2))*/. = |zx _ z2|. Эта метрика считается для С естественной, и читателю в качестве упражнения 3 предлагается самому убедиться в том, что для нее выполнены все три аксиомы определения А. Пример 3. Напомним, что Rn (или Сп) — это множество вещественных (или комплексных) упорядоченных n-ок х = ..., хп), у = (уп у2, ...» уп)‘ Множество Rn (или Сп) можно преобразовать в метрическое пространство, вводя метрику pk. у) = {S k< - yt I2/’- Очевидно, что первая и вторая аксиомы метрического пространства здесь выполняются. Доказать третью тоже несложно, но мы отложим это на некоторое время для того, чтобы привести более общее доказательство. Указанная метрика для Rn (или Сп) называется евклидовой, а пространство Rn (или Сп) с такой метрикой называется евклидовым пространством и обозначается через Еп. Для того чтобы лишний раз подчеркнуть сказанное выше, приведем пример, показывающий, что метрику можно вводить далеко не единственным образом. Читатель может убедиться в том, что следующие функции также могут быть метриками для множества Rn: п рак. у) = S ki -г/il. г=1 п Рзк. у) = S ^ki г = i=l
При исследовании физических систем мы часто будем проявлять гибкость в выборе метрики. Такая гибкость очень полезна, так как позволяет выбрать метрику, наиболее подходящую для данной конкретной ситуации или упрощающую некоторые детали исследования. Пример 4. Гильбертовым пространством 12 называется множество всех последовательностей вещественных чисел х = х2, ... ео ..., Xi, ...) таких, что 'ряды 2 l^il2 сходятся. Для этого прост-г=1 ранства расстояние определяется по формуле °° у, Р (*- у) = { S I xi - Ui I2} • г«1 Доказательство того, что определенная так функция является метрикой для 12, приведено в примере 4 в § 1.4. Прежде чем переходить к пятому примеру, рассмотрим множество A CZ В, где А — некоторое непустое ограниченное множество. Прилагательное ограниченное означает, что найдется такое Xq€~R, что для любого х S А :| х | х0. Но если множество А ограничено сверху числом х0 < оо, то у А должна быть верхняя грань (supremum или sup), т. е. число х ЕЕ R такое, что хЕЕА=$> => х^х, и при этом не существует другого числа, удовлетворяющего тому же условию и в то же время меньшего х. В этом и состоит формулировка «аксиомы полноты». Компактное изложение основных свойств множества действительных чисел можно найти, например, в главе 2 книги Тейлора [А82]. Аналогично, число у называется нижней гранью (infimum или inf) множества А, если у больше или равно произвольной миноранте множества А (минорантой называется любое число у0 такое, что х е А ==> х у0). Для того чтобы формализовать все эти определения, введем следующие обозначения. ОпределениеВ. Пусть А — некоторое ограниченное подмножество множества R, Тогда через inf (А) обозначается элемент х ЕЕ R, являющийся нижней гранью множества А, а через sup (А) обозначается его верхняя грань. У множества А может быть и наибольший элемент, обозначаемый через max (А), т. е. такой элемент этого множества, который больше или равен всем остальным элементам того же множества. Разницу между max (А) и sup (А) легче всего уяснить на примере множества [0,1), для которого sup А = 1, a max А не существует, так как число 1 не принадлежит множеству. На самом деле, если sup А Е А, то max А = sup А. Аналогично выглядит и разница между min А (минимальным элементом множества А) и нижней гранью inf А. Понятия верхней и нижней гранен оказываются
полезными и потому, что они всегда существуют, что несправедливо для максимума и минимума. Пример 5. Обозначим через С (а, Ъ) множество всех непрерывных вещественных функций, определенных на промежутке [а, Ь]. Естественной метрикой *) для этого множества считается функция рСг, у) = sup I х (/) — y(t) I, про которую говорят, что она однородна. Из определения ясно, что р(ж, я) > 0 и что р(я, у) == 0 (t) у (/) при всех t €= la, 6]. Более того, |x(Z) — z(0| = | [х (0 — y(t)] + Iy(0— z (011 < < | x(t) — y(t) | + | y(t) — z(0 |<sup|z(/) — у(0|4- sup| y(t) — — z(0 | = p(*. !/) + p(y, z). Переходя к верхней грани, в левой половине получим р(аг, z) < р(х, у) + р(у, z), что и доказывает справедливость в данном случае всех аксиом метрического пространства. Последний пример показывает, с какими метрическими пространствами мы будем в основном сталкиваться в последующих главах. Хотя элементы пространства С(а, Ь) кажутся гораздо сложнее элементов' пространства Еп, очень важно, что метрика вводится здесь так же просто и удовлетворяет тем же аксиомам, что и в Еп. Поскольку метрическое пространство во многих смыслах получено в результате обобщения абстрактных свойств Е2, то разумно ожидать, что большинство из понятий, связанных с расстоянием и определенных для Е2, удастся перенести и на более общий случай. Первыми из таких понятий, которые мы введем, пользуясь терминологией метрических пространств, будут понятия шара (шаровой окрестности), диаметра множества и расстояния между точкой и множеством. Определение Г. Пусть X — некоторое метрическое пространство, x^Ei X, иг — некоторое положительное вещественное число. Тогда подмножество Sr(xQ) = {х: хЕХ,и р(гг, я0) < г} называется открытым шаром радиуса г с центром в точке х0. ♦) Здесь функция 8 (t) = | х (Z) — у (/) | может достигать своего минимума в точках а или Ь. В этом случае,заменив max на sup, мы убедимся в том, что sup е (t) = sup 8 (/) + sup 8 (0 = sup 8 (0 [a, b] [a, b) (a, b] (a, b) п, следовательно, выбор конкретного типа промежутка здесь безразличен.
Точно так же замкнутым шаром с центром в точке х0 мы будем называть множество, отличающееся от Sr(x0) только тем, что в последнее добавлено множество точек, для которых р(гг0, х) = г. Рис. 1.6. Шаровые окрестности в пространствах Е1 и Е'2 Эти определения согласуются с более простым понятием окрестности. Для иллюстрации на рис. 1.6 показаны окрестности для Е1 и Е2. В качестве более сложного примера рассмотрим шаровые окрестности в пространстве С (а, Ь)(с естественной метрикой). Пусть Рис. 1.7. Шаровая о крестность в пространстве С (а, Ь). /о — функция, непрерывная на интервале (а, Ь). На рис. 1.7 изображен шар Sr(f0), т. е. открытая шаровая окрестность /0. Шар Sr(f0) состоит из всех функций fEEC (а, Ь), графики которых не выходят за пределы заштрихованной области с центром /0 и шириной 2г по вертикали. С понятием шаровой окрестности множества непосредственно связано понятие радиуса множества. Определение Д. Пусть А—некоторое множество в метрическом пространстве X. Верхняя грань расстояния р (ж, у) между всевозможными парами точек хиуЕА называется диаметром множества А и обозначается символом diam (А): diam (А) = sup {pta, х2): xv х2ЕЕ А}. Для A CZ R, очевидно, справедливо отношение diam(A) — = sup (А)— inf (А), т. е. diam (А) —это длина наименьшего промежутка, содержащего (А целиком. В пространстве R2 diam (А) равен диаметру наименьшего круга, содержащего А. В Я3 diam (А) в два раза больше радиуса наименьшего шара, содержа-
щего А. И вообще, в любом метрическом пространстве для шаровой окрестности А = 52(х0): diam (4) 2г. Подмножества метрических пространств с конечными диаметрами называют ограниченными. Например, ограничен замкнутый промежуток 0 х 1. То же самое справедливо и относительно квадрата или n-мерного куба. С другой стороны, полупрямая х 0, вещественная прямая или пространство Еп могут служить примерами неограниченных множеств. Определение. Е. Пусть X — некоторое метрическое пространство иАсХ.ах^ЕХ. Тогда расстоянием между точкой xQ и множеством А называется число р(х0; Л) = inf {р(х0, a): aS Л}. Расстояние р(х0; А) можно определить также как радиус наибольшей шаровой окрестности xQ, не пересекающейся с А. Интерпретация р(х0; 4) в пространствах Е1, Е2 и Е3 очевидна. Упражнения 1. Пусть X — некоторое множество. Для х, у £= X определим функцию р, такую что р (х, х) = 0, а р (х, у) = 1 для любых х =/= у. Докажите что X с такой метрикой является метрическим пространством. 2. Пусть X — некоторое метрическое пространство с метрикой р. Определим новую функцию р' (х, у) выражением . р(®.у) Р (*•-У) =Г+Р (*,,/)• Докажите, что р' может быть метрикой в X и что 0 р' < 1. 3. Доведите до конца доказательство в примере 3. Убедитесь в том, что функции ра и рз из примера 3 удовлетворяют аксимомам метрического пространства. 4. Пусть А — некоторое подмножество метрического пространства X. Убедитесь в том, что diam (4) >0 и что при х ЕЕ X: р (х; Л) < + °°* 5. Пусть ..., Хп — некоторый класс метрических пространств с метриками pt, ..., рп, соответственно. Покажите, что р = max {pj у,)} и р = ^7=1 Р< являются допустимыми метриками для пространства — произведения X = Хх X Ха X ... X Хп. 6. (а) Покажите, что если множества Л и В не пусты и Л С 5, то diam(A)^ diam (В). (о) Докажите неравенство diam (Л (J В) diam (Л) + diam {В). Сходимость в метрических пространствах. Ряды и их сходимость играют важную роль во многих областях анализа и во многих технических приложениях. Поэтому полезно исследовать эти понятия в их наиболее абстрактной форме. Прежде всего отметим, что последовательность вещественных чисел {^п} = {^1» Х2' •••» Хп> •••} называют сходящейся, если существует такое вещественное чис-
ло х (называемое пределом последовательности), что для произвольного заданного е 0 пайдется некоторое положительное целое число такое, что п п0 ==> | — х | < е. Это условие означает, что для достаточно больших п число хп должно оказаться достаточно близко к х. В этом случае часто пользуются обозначениями хп -+х, lim хп -- х или говорят, что хп стремится П-+ОО ИЛИ СХОДИТСЯ К X. Эти определения можно обобщить па случай произвольных метрических пространств. Определение Ж. Пусть {хп} — некоторая последовательность точек метрического пространства X. Если для каждого е 0 можно найти такое число nQ, что п р < < е, то говорят, что {хп} сходится к х. Большинство из основных свойств, связанных со сходимостью на вещественной прямой, переносятся и на произвольные метрические пространства. Для справочных целей мы сведем наиболее привычные примеры к следующей теореме. Теорема А. Пусть {хп} — некоторая последовательность точек метрического пространства X. (1) Если {хп} сходится, то всякая подпоследовательность {znfc} сходится к той же точке. (2) У последовательности {.гп} не может быть более одного предела. (3) Если {хп} сходится, то множество чисел {р(хп, 0)} для любого Q GE X ограничено. (4) Сходимость {zn} не зависит от конечного числа любых членов. Доказательство. Утверждение (1) очевидно, так как если p(zn, х) < е при п^>п0(е), то справедливо и р(яп/£, х) < е при > и0 (е). Для того чтобы доказать утверждение (2), предположим, что хп-+х и хп -+у. Воспользовавшись аксиомой метрического пространства, получим, что р(х, у)^р(х, хп) + + Р (^п, У) < 6 при достаточно больших п. А так как х и у фиксированы, а е — произвольное положительное число, то неравенство может быть верным, только если р(я, у) =0, т. е. если х = у. Утверждение (4) очевидно, а доказательство (3) мы оставляем читателю в качестве самостоятельного упражнения. Для того чтобы лучше разобраться в понятии сходимости, рассмотрим два примера. Пример 6. Пусть х* = {xj,..., х£}, k = 1, 2, ...,— члены сходящейся последовательности в Еп с обычной евклидовой метрикой. Если lim р (х, хк) = О,
Где х = (хх, ...» хп) — фиксированный элемент £п, то Lj-1 при к —>оо. Отсюда следует, что (х* — xj)2 ->0 при /=1,..., п и к ->оо, и, следовательно, сходимость в этом пространстве имеет покоординатный характер. Пример 7. Рассмотрим вопросы сходимости в пространстве С(а, Ь). Пусть некоторая последовательность {тп} элементов С(а,Ь) сходится к х. Это значит, что sup | х (t) — хп (t) | -> 0 при П->оо, t т. е. для каждого е^>0 найдется некоторое натуральное число п0 = п0(е) такое, что sup | x(t) — хп (01 < е для всех п п0(е). I Отсюда | x(t)— xn(t)\ < е при всех п > п0(е) и всех t G (а, Ь). Но из этого следует, что последовательность {xn(t)} сходится к функции x(t) равномерно. Справедливо и обратное: если xn(t) сходится к x(t) равномерно, то р(хп, х) —>0. Именно поэтому указанная метрика в С(а, Ь) называется равномерной. Определение 3. Точка xQ называется точкой сгущения (или предельной точкой) множества Л, если из точек этого множества, не совпадающих с xQ, можно построить бесконечную сходящуюся последовательность, пределом которой является х0. Смысл этого определения очевиден: оно утверждает, что точки множества А группируются около х0. Однако читатель не должен слишком быстро проходить мимо определений такого рода. Ведь приведенное определение не утверждает, что точка х0 принадлежит множеству А. Так, у последовательности {1, 1/2, 1/3, ...} вещественных чисел предельной точкой является число 0. Более того, 0 —это единственная предельная точка этой последовательности. У промежутка |0,1) число 0 является предельной точкой, принадлежащей этому множеству, а число 1, хотя и является предельной точкой, но ему не принадлежит. Более того, каждое вещественное число х, 0 < х < 1, также является предельной точкой этого множества. Определение И. Каждая точка множества А, не являющаяся точкой сгущения этого множества, называется изолированной. Для^множества {1, 1/2, 1/3, например, точка 0 является единственной предельной точкой множества. Все же остальные его точки считаются изолированными.
Из этих определений следуют две теоремы, используемые, правда, многими авторами в качестве определений точки сгущения и изолированной точки. Теорема Б. Для того чтобы точка xQ была точкой сгущения множества А, необходимо и достаточно, чтобы каждый открытый шар с центром в точке х0 содержал кроме х0, по крайне мере, еще одну точку множества А. Сделаем еще одну попытку уточнить это понятие. Пусть А — некоторое множество в метрическом пространстве X. Если х G= А и является предельной точкой А, то каждая шаровая окрестность х должна содержать, по крайней мере, еще одну точку А, т. е. по крайней мере одну точку множества А \ х. Другими словами, при любом х: $г(х)П(А \х) =f=0. Аналогичные рассуждения приводят к следующей теореме. Теорема В. Для того чтобы точка xQ была изолированной точкой множества А, необходимо и достаточно, чтобы нашлась такая шаровая окрестность Sr(xQ) этой точки, что Sr(x) П А = = Ю- Неподготовленного читателя разница между понятиями предела и предельной точки зачастую может поставить в тупик. На вещественной прямой, например, последовательность {1, 1, ... ..., 1,...} сходится к своему пределу 1. Однако точка 1 не является предельной, так как члены этой последовательности не отличаются от ее предела (а этого требует определение). Таким образом, у последовательности может быть предел и не быть предельных точек. Обратно, мы убедимся впоследствии, что множество точек, образующих последовательность, может иметь предельные точки, а сама последовательность сходиться при этом не будет. Взаимоотношения между этими понятиями устанавливаются в следующей теореме. Теорема Г. Если сходящаяся последовательность элементов некоторого метрического пространства содержит бесконечное число различных членов,то ее предел является и предварительной точкой множества элементов, составляющих эту последовательность. Доказательство. Пусть {хп} — некоторая сходящаяся последовательность с пределом х в метрическом пространстве X. Пусть х не есть предельная точка множества членов последовательности. Это предположение означает, что имеется некоторый открытый шар Sr(x) с центром в х, не содержащий других членов последовательности, кроме х. Однако х есть предел нашей последовательности, и потому все хп при п nQ должны принадлежать 5г(я), и, значит, все они должны совпадать с х. Но это означает, что последовательность содержит лишь конечное (не более nQ + 1) число различных членов, что противоречит условию теоремы. Мы уже выяснили, что предельные точки некоторого множества А не обязательно принадлежат самому этому множеству. Если
добавить к множеству Л все его предельные точки, то мы построим новое множество, которое называют замыканием множества А и обозначают через А. Определение К. Пусть А — некоторое подмножество заданного метрического пространства. Обозначим через А другое подмножество этого же пространства, которое назовем замыканием множества А. Тогда точка х0 принадлежит А, если либо %0(==А, либо существует последовательность точек х1? ••• ..., хп, принадлежащих множеству Л, и таких, что limzn = х0. п-*оо Например, если А — открытый шар единичного радиуса 4 = {z: p(z, 0) < 1}, то А — замкнутый шар того же радиуса: А = {z: p(z, 0) < 1}. Последнее определение можно было бы сформулировать еще и так: для того чтобы точка х0 не принадлежала А, необходимо и достаточно, чтобы существовала шаровая окрестность точки х0, не пересекающаяся с множеством А. Упражнения 7. (а) Воспользовавшись неравенством треугольника, докажите утверждение (3) теоремы А. (б) Покажите, что если {хп} и {уп} сходятся, и хп -► х, а уп -► у, то Р уп) — о (х, у). 8. Убедитесь в справедливости следующих теоретико-множественных тождеств: (a) (б) М<^М\ (в) Q = Q; (r)Q = Q; (д) Af\Af С (е) MQAcMHiV. Замкнутые и открытые множества. В математическом анализе большую роль играют также и понятия замкнутого и открытого множеств. Действительно, на эти понятия опираются теория меры, теория интегрирования и топология. В дальнейшем мы убедимся, что оба эти понятия тесно связаны между собой. Более того, многим утверждениям относительно открытых множеств соответствуют двойственные утверждения относительно замкнутых множеств, и наоборот. Определение Л (открытое множество). Произвольное подмножество G метрического пространства X называется открытым, если для каждой точки х из G существует некоторое положительное вещественное число г такое, что Sr (х) С G. Другими словами, каждый элемент открытого множества можно сделать центром некоторого открытого шара, состоящего исключительно из точек этого же множества. Грубо говоря, множество открыто, если каждая из его точек лежит «внутри» множества, а наше определение как раз и уточняет смысл понятия «внутри». На вещественной прямой множество, содержащее всего одну точку, не открыто, так как каждый открытый промежуток с'центром в этой точке содержит элементы,не принадлежащие этому множеству.
Точно так же нельзя считать открытым и подмножество [0,1) вещественной прямой, так как точка 0 из этого интервала обладает тем свойством, что всякий открытый промежуток с центром в этой точке содержит точки, не принадлежащие [0,1); точки, лежащие слева от 0, например. Если отбросить точку 0, то полученный в результате ограниченный интервал (0, 1) оказывается открытым. ТеоремаД. В любом метрическом пространстве X пустое множество 0 и все пространство X являются открытыми множествами. Доказательство. Для того чтобы доказать, что множество 0 открыто, нужно показать, что каждая точка из 0 может быть центром некоторого открытого шара, содержащегося в 0. Но так как 0 не содержит никаких точек, то последнее условие выполняется автоматически. Что же касается X, то, как мы помним, это — универсальное множество, и оно, очевидно, открыто, так как любая сфера, построенная около любой точки X, не может содержать точек, не принадлежащих X. Определение М (замкнутое множество). Произвольное подмножество F любого метрического пространства X называется замкнутым, если оно содержит все свои предельные точки. Грубо говоря, множество F замкнуто, если ни одна из его точек не приближается сколь угодно близко к точкам, лежащим за пределами F. Множество из единственной точки на вещественной прямой является замкнутым, так как у этого множества нет предельных точек, а следовательно, это множество содержит все свои предельные точки. Точно так же замкнуто и всякое множество, содержащее лишь конечное число точек. Промежуток [0,1), как подмножество на вещественной прямой, не замкнут, так как точка 1 является для него предельной и в то же время ему не принадлежит. Добавив недостающую точку 1, мы получим замкнутый промежуток [0,1]. Теорема Е. В любом метрическом пространстве Q пустое множество 0 и само пространство й замкнуты. Доказательство. Пустое множество не имеет предельных точек. Значит, оно содержит все свои предельные точки и, следовательно, замкнуто. Полное пространство Q содержит всевозможные точки, следовательно, оно автоматически содержит и предельные точки, а значит, оно замкнуто. Следующая теорема устанавливает связь между замкнутыми и открытыми множествами. Теорема Ж. Пусть X — произвольное метрическое пространство. Некоторое его подмножество F замкнуто <£=> его дополнение F' открыто. Доказательство. Предположим вначале, что F замкнуто, и покажем, что в этом случае F' открыто. Если F' = 0, то оно
открыто, и, значит, можно предположить, что F' не пусто. Пусть х есть некоторая точка из F'. Так как F замкнуто, то х не принадлежит F и не является его предельной точкой. Но если это так, то существует открытый то ар с центром в точке х\ Sr(x), который не пересекается с F. Другими словами, всегда найдется открытый шар Sr(x) с центром в точке .г, целиком содержащийся в F'. Но так как х — это любая точка F', то F' открыто. Предположим теперь, что F' открыто. Единственная возможность, при которой F оказывается незамкнутым, заключается в том, чтобы F' содержало предельные точки F. Но этого не может быть, так как если F' открыто, то каждая из точек этого множества является центром некоторой открытой сферы, не пересекающейся с F, и, значит, ни одна из них не может быть предельной точкой для F. Логическое построение этого доказательства весьма типично для теоретико-множественных доказательств. Теорема 3. Пусть X — некоторое метрическое пространство. Тогда (1) объединение любых открытых множеств из X открыто] (2) пересечение любого конечного числа открытых множеств из X открыто] (3) объединение любого конечного числа замкнутых множеств из X замкнуто] (4) пересечение любых замкнутых множеств из X замкнуто. В силу теоремы Ж два последних утверждения теоремы 3 следуют из утверждений (1) и (2). Доказательство же этих утверждений мы оставляем читателю. Примеры Ю1 = Д(а--^-, & + 0 = Д(п, оо), П (a, b + = (a, fe] п=1\ п < показывают, что пересечение счетного числа открытых множеств может быть замкнутым, открытым, либо ни тем, и ни другим. Аналогичное утверждение относительно объединения счетного числа замкнутых множеств можно получить, переходя к дополнениям. Что же касается понятия замыкания, то здесь имеются следующие связи. Пусть X — некоторое метрическое пространство, и Л — некоторое множество из X. Тогда (1) А замкнуто А = Л» (2) А — наименьшее замкнутое множество, содержащее Л; другими словами, А содержится в любом замкнутом множестве, содержащем и Л;
Рис. 1.8. Множество, его граница и его внутренность. (3) А совпадает с пересечением всех замкнутых множеств, содержащих А. Для моделей только что введенных понятий выберем в качестве универсального множества комплексную плоскость. На рис. 1.8 множество А ограничено сплошной линией там, где граничные точки принадлежат А. Множество А отличается от Л тем, что к последнему нужно добавить еще и все его предельные точки. Внутренность множества А состоит из точек множества Л, за исключением его граничных точек. Для уточнения последнего утверждения необходимо определить понятия внутренности множества и его границы. Это совсем нетрудно. Пусть X — произвольное метрическое пространство, содержащее множество Л. Элемент Л называется внутренней точкой Л, если он служит центром некоторого открытого шара, целиком содержащегося в Л. Определение Н. Внутренностью Л, т. е. 1п1(Л), называется множество всех внутренних точек этого множества. Другими словами, int (Л) = {х: х ЕЕ А и Sr(x) cz Л при некотором г}. Внутренность множества обладает следующими свойствами: (1) int (Л) — открытое подмножество Л, содержащее любое открытое подмножество Л (т. е. внутренность Л — это наибольшее из открытых подмножеств Л); (2) Л открыто 44 Л int (Л); (3) пН(Л) совпадает с объединением всех открытых подмножеств Л; (4) int (Л) = ЦЛ7)]'. Определение О. Точка х некоторого подмножества А метрического пространства X называется граничной точкой этого подмножества, если любая открытая сфера с центром в этой точке пересекается как с А, так и с А'. Множество всех граничных точек А называется его границей и обозначается bnd (Л). Другими словами, bnd (Л) = A Q (Л'). Из определения границы Л и свойства (4) внутренности множества сразу следует, что для произвольного множества Л А = int (Л) (J bnd (Л).
Упражнения 9. Пусть X — некоторое метрическое пространство. Покажите, что любые две различные точки X могут быть разделены открытыми сферами в следующем смысле: если хну — две различные точки X, то существуют две открытые сферы с центрами в х и у, такие, что они не пересекаются между собой. 10. Пусть X — некоторое метрическое пространство, и пусть {г} — подмножество X, содержащее лишь одну точку. Покажите, что его дополнение {х}' открыто. Покажите также, что А открыто всегда, когда А — конечное подмножество X. И. Пусть X — некоторое метрическое пространство, a Sr (х) — открытый шар в X радиусом г, с центром в точке х. Пусть А — некоторое подмножество X с диаметром, меньшим г, и пусть оно пересекается с Sr (х). Докажите, что A CI $г (х). 12. Опишите внутренность каждого из подмножеств вещественной прямой, перечисляемых ниже: множество целых чисел; множество рациональных чисел; множество иррациональных чисел; (0, 1); [0, 1]; [0, 1) U И» 2). Сделайте то же самое для следующих подмножеств комплексной плоскости: {z: | z | < 1}; {z: | z | < 1}: {z: Im (z) = 0}; {z: Re (z) рационально}. 13. Пусть А и В — два подмножества некоторого метрического пространства X. Докажите, что (a) int (Л) U int (В) С int (Л J В); (б) int (Л) П int (В) = int (Л П В). Приведите примеры двух подмножеств А п В вещественной прямой таких, что int (Л) (J int (В) =/= int (Л J В). 14. Пусть X — некоторое метрическое пространство. Обобщите результат задачи 9, доказав, что можно разделить любую точку и замкнутое множество, ее не содержащее, в том смысле, что если х — некоторая точка, a F — некоторое замкнутое множество, не содержащее г, то найдется пара непере-секающихся открытых множеств Gx и С2 таких, что х €= G\ и F CZ С2. 15. Пусть X — некоторое метрическое пространство, а Л — подмножество X. Пусть г — предельная точка Л. Покажите, что каждый открытый шар с центром в х содержит бесконечное число различных точек Л. Воспользуйтесь этим результатом для того, чтобы показать, что любое конечное подмножество X замкнуто. 16. Пусть X — некоторое метрическое пространство, а Л — его подмножество. Докажите, что (а) (Л)' = int (Л)'; (б) Л = {х: р (х; Л) = 0}. Полные пространства. В теории последовательностей вещественных чисел рассматривают последовательность {яп }, обладающую тем свойством, что для каждого е 0 всегда найдется целое число 7V0(e) такое, что для любых m, NQ выполняется неравенство | хт — хп | < е. Эту последовательность называют последовательностью Коши. Указанное свойство является не только необходимым, но и достаточным для сходимости в R (а также и в С). Однако в произвольном метрическом пространстве условия Коши может быть недостаточно для установления факта сходимости. Определение П данного параграфа позволяет выделить из всей совокупности те метрические пространства, для которых критерий Коши сохраняет свою силу. Но прежде всего формализуем понятие последовательности Коши.
Определение II. Последовательность {хп} элементов произвольного метрического пространства X называется последовательностью Коши, если для каждого е 0 существует такое целое 7V(e), что р(хт, хп) < е при любых т, п, N (е). Рассмотрим теперь произвольную сходящуюся последовательность {хп} с пределом х, где х и все хп принадлежат метрическому пространству X. По определению понятия сходимости для каждого е 0 существует такое число No, > что при п^ NQ: р(хп, х) < е/2. Отсюда, в силу неравенства треугольника в метрическом пространстве, р(хт, Хп) р(ят, х) 4- р(хп, х) < ъ при т, п^> Nq. Итог этим рассуждениям подводит следующая теорема. Теорема И. Пусть X — произвольное метрическое пространство, Если некоторая последовательность {zn}CZ X сходит.-сч к некоторому пределу х ЕЕ X, то это — последовательность Коши, К сожалению, обратная теорема неверна: последовательность Коши не обязательно должна сходиться. Оказывается, в некоторых метрических пространствах удается найти последовательности Коши, которые не сходятся ни к какому элементу этого же пространства. В качестве примера рассмотрим прежде всего пространство (0,Ц. Последовательность {1/п}, очевидно, является последовательностью Коши, однако точка 0 (к которой сходится эта последовательность в более широком пространстве) исходному пространству не принадлежит, и потому эта последовательность не сходится. Далее, пусть X — метрическое пространство, состоящее из всех рациональных чисел с метрикой р(хх, х2) = | хг — х2 I. В этом пространстве последовательность {хп}, где хп = (1 4- 1/п)п, является последовательностью Коши. Но в то же время она сколь угодно близко приближается к иррациональному числу е, которое не принадлежит X, Таким образом, эта последовательность в рассматриваемом пространстве не сходится. Трудности, с которыми мы сталкиваемся во всех таких примерах, связаны с тем, что понятие сходящейся последовательности зависит не только от характера самой последовательности, но и от структуры пространства, элементами которой она образована. Другими словами, нельзя говорить, что последовательность сходится сама по себе; нужно еще, чтобы она сходилась к некоторой точке рассматриваемого пространства. Если это пространство обладает такими свойствами, что теорема, обратная теореме И, справедлива, то мы для такого пространства используем понятие «полное». Определение Р. Если в некотором метрическом пространстве X любая последовательность Коши сходится к некоторому пределу {принадлежащему X), то пространство X называется полным.
В заключение этого параграфа мы рассмотрим пример, который позволит довольно хорошо разобраться в том, с помощью каких рассуждений можно установить полноту метрического пространства. Этот пример поможет также установить некоторые дополнительные факты, которые время от времени могут оказаться полезными. Мы хотим также обратить внимание читателя на приложение 1, примыкающее к материалу этого параграфа, а также заметить, что содержание каждого из имеющихся в этой книге приложений ничуть не менее важно, чем основной материал. Пример 8. Рассмотрим сначала пространство Сд(а, Ъ) вещественных непрерывных функций. Пусть {я:п} — некоторая последовательность Коши из Сп(а, Ь). Это значит, что для каждого е 0 найдется некоторое целое п0, такое что при r/i > и и > > Щ sup I хп (0 — хт (0 | < е. В частности, если зафиксировать t — /0, то числовая последовательность {^п(^о)}^-1 оказывается последовательностью Коши. Поскольку пространство R полно, то найдется такое вещественное х(/0), зависящее от £0, что I (U — х (t0) I 0 при П-+ОО. Аналогичные рассуждения для каждого t из промежутка (л, Ь) позволяют нам построить некоторую вещественную функцию х ~ = x(t). Остается только доказать, что х принадлежит CR и что в Cr хп > х. Но при 7П, п TIq I (0 ^ш(0 | < е при всех t из (а, Ъ). Полагая тп —> оо, получим, что 1^.(0— *(0| < е для каждого /, и, следовательно, sup |я„(0 — x(t) | е для п п0. Таким образом, мы показали, что для каждого е > 0 найдется такое целое г?0, что ||.г„ — хЦ С к, если т? >/г0, т. е. что последовательность {/„} сходится к .г в смысле метрики CR. Другими словами, вопрос о том, «сходится ли каждая последовательность Коши из Сц», мы свели к вопросу вида: «если некоторая последовательность из Cr сходится, то обязательно ли ее предел принадлежит Сд?», или к следующему: «если последовательность {хп} непрерывных функций равномерно сходится к некоторой функции х = x(t), то обязательно ли эта функция непрерывна?» Ответить на последний вопрос нетрудно. Так, с помощью не равенства треугольника мы можем для любых tQ из (я, Ь) и
произвольного п получить соотношение | x(t)— x(t0) I < I x(t)— xn(t0) I + I x„(t0)— xn(t) I + I xn(t) — x(t0) |. Поскольку мы рассматриваем случай равномерной сходимости, то первое и третье слагаемые в правой части можно сделать меньшими е за счет выбора достаточно большого п. Поэтому при достаточно большом и фиксированном п I ^0) | < 2е -|- | xn(t) ^n(^o)l* Но так как функции хп непрерывны, то найдется такое б О, что если | t — t0 | <6, то | x(t) — x(t0) | < Зе. Это значит, что x непрерывна в точке /0, а так как значение t0 произвольно, то функция х непрерывна на всем отрезке (а, Ь). Доказательство полноты пространства комплексных непрерывных функций получается из предыдущего, если заменить фразу «так как пространство R полно» на фразу «так как пространство С полно». Упражнения 17. Докажите, что любое замкнутое подмножество некоторого полного пространства также является полным пространством. 18. Докажите, что каждая последовательность Коши ограничена. Рекомендация: выберите некоторое е > 0 и некоторое N и покажите, что если г max {е, р (х, xN), ..., р (xN_r хп)}, то при всех п р (xn, xNj < г. 19. Пусть {iSn} — некоторая последовательность замкнутых шаров X такая, что 5n+i CL Sn для любых п. Докажите, что если X полно, а радиус Sn стремится к нулю при п —> оо, то пересечение Sn не пусто и состоит из единственной точки. 20. Докажите, что пространство Е4 полно. Рекомендация: используйте факт покоординатной сходимости в Е” и полноту пространства R. 21. Рассмотрите вопрос о точечной и равномерной сходимости последовательностей {хл} и {уп} в С (0, 1), где *n(*) = *n> *G[0, 1], t* + nt yn(t) = i е [0,1]. Постройте графики некоторых из этих функций. Какая из этих последовательностей является последовательностью Коши? 1.3. Линейные пространства В предыдущем параграфе мы показали, что незначительное обобщение понятия расстояния позволяет ввести метрику в целом ряде важных функциональных пространств, которые могут представить интерес и для инженера. В частности, если потребовать, чтобы расстояние удовлетворяло лишь определению А § 1.2, то, проявляя определенную сноровку при выборе метрик, мы сможем рассматривать пространства Я, С, Rn и С(а,Ь) как примеры более общего метрического пространства. В частности, каждая теорема,
справедливая для абстрактного метрического пространства, автоматически оказывается справедливой и для каждого из этих конкретных пространств. Совершенно ясно, однако, что понятие расстояния не исчерпывает всех структурных свойств конкретных пространств, перечисленных выше. Действительно, в каждом из этих пространств определена операция «сложения» его элементов, не зависящая от его метрики. В настоящем параграфе мы покажем, что в том случае, когда от понятия «вектор» не требуют слишком многого, каждое из этих конкретных пространств можно считать примером абстрактного линейного пространства, которое в свою очередь получается в результате абстрактного обобщения свойств обычного трехмерного евклидова пространства, хорошо знакомого читателю. В последующем нам придется пользоваться множествами вещественных или комплексных чисел, используя их элементы в качестве сомножителей при элементах исходных функциональных пространств. Буквы греческого алфавита (а, (3, у, ...) мы будем использовать для обозначения скалярных множителей, а буквы х, у, z, ..., как и раньше, — для обозначения элементов множества X. Более того, мы будем предполагать, что (а) имеется правило, позволяющее сопоставить каждой паре элементов хну пространства X некоторый третий элемент ZEE X, называемый суммой элементов а: и у и обозначаемый через х + у, и (б) имеется правило, позволяющее сопоставить кажому элементу j Е X и каждому скаляру а некоторый элемент и ЕЕ X, называемый произведением х на скаляр а и обозначаемый через ах. Определение А. Множество X называется линейным пространством*), если на X определены операции сложения и умножения на скаляр, удовлетворяющие следующим условиям: (1) х + у — у + х для любых х и у из X; (2) (х + У) + z = х -I- (у + z) для любых х, у и z из X; (3) существует некоторый элемент О Е X (называемый нулем) такой, что х + 0 = х для любого х ЕЕ X; (4) для любогохЕХ найдется такой элемент у ЕЕ X (элемент, противоположный х), что х 4- у = 0; (5) i*x = х для любого х Ez X; (6) а(Ря) = (аР)а; для любого х ЕЕ X и любых а и Р; (7) (а 4- Р)я = ах 4- P# для любого х Ez X и любых а и Р; (8) а(х + у) = ах 4- ау для любых х, у Е X и любого а. Линейное пространство называется вещественным или комплексным в зависимости от того, вещественны или комплексны скалярные коэффициенты. Преимущество использования термина *) В русской математической литературе линейные пространства также часто называют векторными. (Прим, ред.)
«скаляр» состоит в том, что позволяет нам одновременно рассматривать как вещественные, так и комплексные линейные пространства. Элементы линейного пространства называют векторами. Отметим, что всякое комплексное линейное пространство автоматически оказывается и вещественным линейным пространством. Аксиомы определения линейного пространства в неявном виде предполагают наличие еще четырех дополнительных свойств. Эти свойства, перечисленные в условиях .теоремы А, настолько тесно связаны с понятием линейности, что в дальнейшем мы будем рассматривать их как часть основного определения. Теорема А. Во всяком линейном пространстве X (1) пулевой элемент единствен-, (2) каждому элементу соответствует единственный противоположный-, (3) для каждого х & X справедливо равенство Ох — 0; (4) элемент у = (— l)z является противоположным по отношению к любому х ЕВ X. Доказательство. Поскольку эта теорема впервые предоставляет возможность использовать сформулированные выше аксиомы линейного пространства, мы докажем ее довольно подробно. Существование по крайней мере одного нулевого нуль-вектора (нулевого элемента пространства) гарантируется определением А(3). Предположим, что в пространстве R имеются два нуль-век-тора: 0х и 02. Полагая х = 0х и 0 = 02 в определении А (3), получим 01 + 02 = 0Р В то же время, полагая х = 02 и 0 = 0х, в силу того же определения имеем 02 + 0х = 02. Сравнение первого и второго соотношений с учетом аксиомы А (1) приводит к равенству 0х = 02, что и требовалось доказать. Существование по крайней мере одного противоположного элемента для каждого элемента линейного пространства гарантируется определением А(4). Предположим, что некоторому элементу х соответствуют два обратных элемента: уг и у2. Прибавляя элемент у2 к обеим сторонам равенства х + уг = 0 и используя определения А (2) и А (3), получим, что !/г + (* + У1) = (Уг + *) + У1 = 0 + {/! = у„ Уг + {х 4- У1) = у2 4- 0 = у2. Следовательно, yt ~ y2i что и требовалось доказать.
Рассмотрим, наконец, элемент Ох 4- 1х. Используя определения А(7) и А (5), находим Ох + Iх = (0 + 1)я = 1х = х, Ох 4- 1я = Ох 4- х. Отсюда х = Ох 4* х- Прибавляя к обеим частям этого равенства элемент у, обратный х, мы найдем, что о = X 4- у =(0х 4- *)+ У = Ох 4-(х 4- у) = Ох 4- 0 = Ох, откуда 0 = Ох. Пусть, наконец, у =(— 1)х. Тогда для суммы х 4- У имеем х 4- у = 1х 4“ (—1)я = (1—1)х = Ох = О, откуда следует, что у — элемент, противоположный х, что и требовалось доказать. Читатель, наверное, уже заметил, что в этой теореме мы использовали символ 0 в двух смыслах. Например, в выражении 0х=0 первый нуль означает нулевой элемент множества скаляров, а второй — нулевой элемент линейного пространства. К счастью, из контекста всегда ясно, в каком смысле мы используем этот символ в каждом из конкретных случаев. Доказав предыдущую теорему, мы можем теперь обозначать элемент, противоположный х, через — х. Существование противоположных элементов позволяет ввести операцию вычитания. По определению, разностью х — у двух элементов х и у называется сумма элемента х и элемента, противоположного у, т. е. —у. Это определение согласуется с тем, как вводится операция вычитания в арифметике. Рассмотрим теперь несколько конкретных пространств и посмотрим, удастся ли нам определить на них операции, подчиняющиеся аксиомам линейного пространства. Пример 1. Пространство R. Множество вещественных чисел является вещественным линейным пространством, в котором операции умножения на скаляр и сложения определены обычным для этого множества образом. Нулевым вектором в этом пространстве оказывается число нуль. Отметим, однако, что если допустить, что скаляры могут быть и комплексными, то множество R уже не будет линейным пространством. Таким образом, не каждое вещественное линейное пространство оказывается и комплексным линейным пространством. Пример 2. Отрезок [0,1]. Множество вещественных чисел 0 х 1 не есть линейное пространство, если сложение и умножение на скаляр определить естественным образом, так как всякое число х 1/2, будучи умноженным на 2, дает число, не принадлежащее отрезку [0,1].
Пример 3. Пространство С(а, Ь). Элементами этого множества служат функции x(t), непрерывные в промежутке а t Ъ. Определим в этом множестве операции сложения и умножения на скаляр обычным образом. Иными словами, если я, у ЕЕ С(а, Ь), то х + + У — это функция, значение которой в каждой точке t определяется как x(t) y(f): (х + y)(t) = x(t) X y(t). Аналогично определяется и операция умножения на скаляр: (*!/) (/) = Ху (/). Ясно, что х + у и Хх — непрерывные функции на промежутке и, следовательно, они принадлежат С (а, Ь). Нулевым элементом этого пространства является функция, значение которой равно 0 при каждом t [а, Ь]. Проверку всех аксиом определения А мы оставляем читателю. Пример Пусть Р — множество всех полиномов с вещественными коэффициентами, определенных на замкнутом промежутке [0,1]. Если линейные операции интерпретировать здесь обычным образом, т. е. как обычное сложение двух функций и умножение функции на вещественное число, то Р — это вещественное линейное пространство. Его нулевым элементом является нулевой полином. Пример 5. Пусть для каждого положительного целого числа п определено подмножество Рп множества Р, состоящее из полинома, тождественно равного нулю, и всех полиномов со степенью, меньшей п. По отношению к операциям, определенным на Р, пространства Рп являются вещественными линейными пространствами. Пример 6. Множество Rn всех вещественных n-ок является вещественным линейным пространством, если операции сложения и умножения на скаляр определить следующим образом. Пусть я, У & Rn, и пусть х = (хь х2. ..., хп) и у = (i/p у2,..., Уп)- Тогда X + у = (х-L + ух, Х2 + у2,..., Хп 4- у„), ах = (а^, ая2,..., ахп). Отметим, что при п = 3 операции векторного сложения и скалярного умножения в /?3, определенные в примере 6, совпадают (при условии, что мы отождествляем вектор (хх, х2, х3) с направленным отрезком прямой, соединяющим начало координат с точкой (хъ х2, х^) с обычными правилами «параллелограмма» и «подобия» элементарной математики. Теперь, после того как мы познакомились с понятием линейного пространства, а также с некоторыми конкретными примера
ми таких пространств, нам будет нетрудно обнаружить ряд дополнительных свойств пространств этого рода. Определение Б. Пусть М — некоторое непустое множество элементов линейного пространства X. Множество М называют линейным подпространством (многообразием) X, если М также является линейным пространством. Это определение эквивалентно условию, согласно которому все суммы, разности и произведения на скаляры элементов М оказываются также элементами этого множества. Поскольку —х = — (—1)#, то это в свою очередь эквивалентно условию, требующему, чтобы М было замкнуто относительно операций сложения и умножения на скаляр. По аналогии с определениями, введенными раньше, линейное подпространство М называется собственным линейным подпространством пространства X, если его элементы образуют собственное подмножество X. Нулевое пространство {0} и само пространство X всегда являются подпространствами X. Нетрудно видеть, что пересечение произвольной совокупности подпространств X является подпространством X. Возвращаясь к рассмотренным выше примерам, мы видим, что Рп — это подпространство Р для каждого положительного п и, более того, Р есть подпространство С[0, 1]. Легко выяснить, что в линейном пространстве R3 собственными подпространствами являются следующие: Ml = {(*!, 0 0)}, М2 = {(0, х2, 0)}, М3 = {(0, 0, я3)}, М4 = {(0, х2, я3)}, Мь = {(^, 0, я3)},ЛГв = {(л?!, х2, 0)}, где отличный от нуля член может принимать любое вещественное значение. Пусть имеется несколько элементов некоторого ли- нейного пространства X. Элемент у, удовлетворяющий условию У = ад + ... + также принадлежит X. Мы будем называть у линейной комбинацией векторов лгх,..., хт, а скаляры аь..., ат — коэффициентами этой линейной комбинации. Определение В. Пусть X — некоторое линейное пространство и пусть {^х,..., — некоторое непустое множество из X. Множество {а^, ..., £гп} называется линейно зависимым, если найдутся такие коэффициенты ах,..., ат, не равные все тождественно нулю, что арГх 4- ... + <%тхт = 0. Если множество {^р..., яш} не отвечает этому определению, то его называют линейно независимым. Перефразируя определение В, мы можем утверждать, что множество {т1? .г7П} линейно независимо, если равенство arxY + ...+ <хтхт 0 справедливо лишь в том случае, когда все = ос2 = ...= ат = 0.
Если линейная комбинация ал + ••• + ал = О (и, по крайней мере,одно из чисел аь..., aj не равно нулю), то совершенно очевидно, что ал + ... + ал + Ozj+1 + ...+ Оагт = О (и при этом по крайней мере одно из чисел аь ..., ат не обращается в нуль). Если, например, не равен нулю коэффициент afe, то Все эти свойства суммируются следующей леммой. Л е м м а А. Если некоторое подмножество {a^, ..., xk} линейно зависимо, то линейно зависимо и всякое более широкое множество {□?!, ..., хп}, п > к. Элементы хъ ..., хк линейно зависимы тогда, когда один из них может быть представлен в виде линейной комбинации остальных. Про множество векторов {хг, х2, ..., яп} говорят, что на него натянуто линейное пространство М или что оно определяет линейное пространство М, если каждый вектор из М может быть представлен в виде линейной комбинации векторов хх, ..., хк. Другими словами, в этом случае для каждого вектора у из М найдутся такие скаляры ап ..., afe, зависящие, вообще говоря, от у, что У = ал + ... + ahxk. А так как в линейном пространстве новые элементы можно определять, образуя линейные комбинации из уже существующих, фиксированных элементов, то идея пространства, натянутого на векторы, открывает один из эффективных путей построения подпространств. Для уточнения этой идеи мы введем следующее формальное определение. Определение Г. Обозначим через S = {^х, ..., хп} некоторое непустое множество линейного пространства X. Множество L(S) называется линейным подпространством, натянутым п на S, если ; х = 2 аЛ» aj произвольные скаляры^. То, что L(S) является линейным подпространством X, не вызывает сомнений. В действительности же L(S) — это такое подпространство X, которое должно содержаться в любом подпространстве X, содержащем S. Другими словами, L(S) — это наименьшее из линейных подпространств X, содержащих S. Подпространство L(S), очевидно, натянуто на S. Однако если мно
ж ест в о S линейно зависимо, то, как мы увидим, L(S) можно натянуть и на некоторое собственное подмножество S. Рассмотрим теперь два подпространства иМ2, М19 М2С1Х. Множество Ei= {z: У, х s мъ у G М2}. называется суммой множеств Мг и М2 (записывается: Е = Мг + 4- М2). Так как Мх и М2 являются подпространствами, то, очевидно, подпространством будет и множество Е. Обобщая эту идею, мы будем говорить, что Е представляет собой сумму множеств М (i = 1,..., п) (чт0 записывается как Е = если каждое х ZE Е можно представить в следующем виде: п ж=2жь i = l,...,n. i=l Для приложений наибольшее значение имеет прямая сумма подпространств. В этом случае необходимо добавить еще и требование единственности такого представления. Определение Д. Пусть X — некоторое линейное пространство, и пусть М.. i = 1, ..., п. — его линейные подпространства. Если каждый элемент х некоторого множества Е CZ X можно единственным образом представить в виде х = хх + х2 + ... 4- хп. х. (ЕЕ Af., i = 1, 2, ..., n, то про пространство Е говорят, что оно является прямой суммой подпространств, что символически записывается как Е = М± ф ф М2 ф ... ф Мп или. короче, как Е = ф.Мг] — Центральную роль в этом определении играют слова «единственным образом», поскольку однозначность такого представления, как мы увидим, требует, что подпространства М. не пересекались между собой. Теорема Б. Пусть некоторое линейное пространство X является суммой двух подпространств Мг и М2. так что X = Мх 4-4- М2. Тогда для того, чтобы X было прямой суммой этих подпространств. необходимо и достаточно, чтобы Мг Г] М2 = {0}. Доказательство. Предположим, что X - Мг ф М2 и что оба подпространства Мг и Af2 содержат один и тот же элемент и =/а0. Тогда для каждого элемента х (Е: X. который можно представить в виде X = у + z. у мъ z е м2. возможно и другое представление: х = (у — и) 4- + и)» У ~ и Мг. z 4- и ЕЕ М2. очевидно, отличное от первого. Таким образом, если и =/= 0, для
элементг1 х мы не можем гарантировать единственности представления, а следовательно, сумма М\ и М2 не может быть прямой. Предположим теперь, что каждый элемент х ЕЕ X представим в виде х == у + z, i/G М1? z М2 и что Q М2 = {0}. Для того чтобы выяснить вопрос о единственности выписанного выше представления, предположим, что существует еще и второе представление, т. е. что X = у 4- Z = У! + Zb у, У! <= Мг, Z, zx е м2. Вычитая тогда одно представление из другого, мы увидим, что у — = z1 — z, у — е М1Ч z1 — z М2, где вектор в правой части принадлежит подпространству а вектор в левой части —подпространству М2. Но так как единственным общим элементом этих подпространств является нулевой Мг А М2 = {0}, то обе стороны последнего равенства должны обращаться в нуль, и, следовательно, у = у± и z = z1? что и доказывает единственность представления. Условие X = Mt ф М2 часто выражают следующими словами: «для пространства X существует декомпозиция на подпространства Мг и М2». Несмотря на то, что подпространства М\ и М2 имеют общий нулевой элемент (этот элемент является общим вообще для всех линейных пространств), их считают непересекающимися. Условия декомпозиции линейного пространства на три или несколько подпространств рассматриваются в упражнении 7. Работая с линейными пространствами, читатель сталкивается с тремя различными, хотя и похожими операциями над множествами: декартовым произведением, объединением и суммой. Для иллюстрации различия между этими операциями рассмотрим подпространства М1 = {(я, 0)} и М2 = {(0, у)}. По определению Mi ф М2 = Я2, в то время как множество Мг (J М2 состоит лишь из тех точек Я2, которые принадлежат координатным осям Н2. Что же касается множества М1 X М2 - {х, 0, 0, у}, то оно, естественно, является некоторым подпространством 7?4. Для различения всех этих операций может оказаться полезным соотношение Мг ф М2 = ЦМХ и М2)- У пражнения 1. Пусть х, у и z — линейно независимые векторы. Справедливо ли утверждение, согласно которому линейно независимы и векторы х у, у z и z + х? 2. Каждое из следующих условий определяет некоторое подмножество вещественного линейного пространства R3 всевозможных точек х = (хх, х«,
х3) вещественных чисел: (a) хх — целое; (б) хх = 0 плп хч = 0; (в) xt + 2хг = -= 0; (г) X! + 2x2 = 1. Какие из этих подмножеств являются подпространствами Я3? 3. Каждое из нижеследующих условий определяет некоторое подмножество вещественного линейного пространства С [—1, 1] всевозможных непрерывных вещественных функций у = f (х), определенных на интервале [—j, 1]: (a) f дифференцируемы; (б) f — полиномы третьей степени; (в) / — четные функции в том смысле, что / (—х) = / (х) при всех х; (г) /—нечетные функции в том смысле, что / (—х) = —f (х) при всех х; (д) / (0) = 0; (е) f (0) = 1; (ж) / (х) > 0 при всех х. Какие из этих подмножеств являются подпространствами С I—1, 1]? 4. Покажите, что пространство С [—1, 1], введенное в предыдущем упражнении, является прямой суммой подпространств, определенных условиями (в) и (г). (Рекомендация: учтите, что / (х) = [/ (х) + / (—х)]/2 + [/ (х) — -/ (—х)/2.) 5. Пусть х, у, и и v — некоторые векторы из Я4, а М п N — подпространства Я4, натянутые на {х, у} и {и, г} соответственно. В каком из перечисленных ниже случаев Я4 = М ф N? (а) X = (1, 1, 00), и = (0, 1, 0, 1), у = (1, 0, 1, 0), v= (0, 0, 1, 1); (б) х = (_1, 1, 1, 0), и = (1, 0, 0, 0), у = (0, 1, -1, 1), р = (0, 0, 0, 1); (в) х = (1, 0, 0, 1), и = (1, 0, 1, 0), у = (0, 1, 1, 0), v = (0, 1, 0, 1). 6. Пусть X — множество, состоящее из шести векторов (1, 1, 0, 0), (1,0,1,0), (1,0, 0,1), (0,1,1,0), (0,1,0, 1), (0, 0,1,1) пространства Я4. Найдите два различных максимальных линейно независимых подмножества X. (Максимальным линейно независимым подмножеством множества X называется такое линейно независимое подмножество Y с X, которое становится линейно зависимым каждый раз, когда к У добавляется любой вектор из X, еще не принадлежащий У). 7. Пусть некоторое линейное пространство X представляет собой сумму подпространств Мъ ..., Мп (п > 2). Покажите, что X есть прямая сумма этих множеств тогда и только тогда, когда М{ не пересекаются (с точностью до нулевого элемента) с подпространством, натянутым на все остальные Mj. Последнее условие, очевидно, предполагает, что каждое Mi не пересекается с любым другим Мj. Однако обратное утверждение ложно. Это можно показать, убедившись в том, что в Я3 можно найти такие три подпространства Мх, Мг и Мз, что Q Мч = Мх Q Мз — Мч Г) Мз = {0}, но М, П (М2 + А7з) #= {()}. Размерность и базис. Среди шести первых примеров вещественных векторных пространств, приведенных в этом параграфе, пространство R3 является наиболее знакомым. А решение задач в пространстве R3 показало, что кроме уже введенных понятий оказываются полезными еще и некоторые другие. В этом разделе мы собираемся рассмотреть понятия системы координат и размерности. Возможность распространить эти крайне наглядные понятия на случай произвольного линейного пространства естественным и продуктивным образом кажется нам весьма обнадеживающей.
Преследуя эту цель, мы будем опираться на наши нынешние представления о линейной зависимости и о множестве векторов, на которое можно натянуть некоторое пространство. В двух леммах, следующих ниже, мы попытаемся в качестве первого шага уточнить содержание определения Г. Лемма Б. Пусть {хг, ..., хп, у} — элементы некоторого линейного пространства. Если вектор у принадлежит линейному многообразию L(xt, ..., zn), то Ь(хг,..., .хп) содержит и линейное многообразие Ь(хг, ..., хп, у). Включение у (= Цхъ ..., хп) предполагает, что у можно представить в виде линейной комбинации {ггх,..., хп}. Отсюда следует, что если z представимо в виде линейной комбинации {zx, ..., хп, у}, то оно представимо и в виде линейной комбинации {zx, ..., хп}. Ио это значит, что z ЕЕ Цх^ ..., z7l) и, следовательно, Ь(хъ ... хп) Z) Цхъ..., хп, у). Л е м м а В. Каждый элемент множества {xj}, линейно зависимый от совокупности остальных элементов множества, можно отбросить, не меняя при этом линейного многообразия, натянутого на множество. Доказательство. Пусть, например, вектор хг линейно зависит от векторов х2, х3, ... Тогда хг ЕЕ Цх2, х3, ...). В соответствии с леммой Б отсюда следует, что Е^х^, х2, ..., Хп} (_Цх2,..., Хп}. Но, с другой стороны, очевидно, что Е(х2,'... Хп) CZI •^'(^'1» •••» откуда следует, что //(Zj, х2, ..., хп) = Ь(х2,..., хп). Определение Е. Пусть множество {zx,..., zn} состоит из элементов некоторого линейного пространства X. Это множество называется базисом некоторого подпространства М, если Ь(*х, хп) = М и {zx, ..., хп} — линейно независимое множество. Каждый элемент х GE М может быть представлен в виде некоторой линейной комбинации zx, ..., хп, и это представление обычно называют разложением х по базису {zx, ..., хп}. Нетрудно видеть, что при принятых предположениях коэффициенты разложения по базису определяются для каждого х & М однозначно. Действительно, если бы мы могли написать для вектора х два разложения z = axzx + a2z2 + ... + anzn, * = Pl*l + ₽2*2 + ••• + ₽п*п,
то, вычитая одно из другого, мы получили бы, что О = («1 — Pi)^i + (а2 — Рг)^ + ... + (ап — Рп)яп« Но так как векторы ..., хп, по определению, линейно независимы, то отсюда следует, что ai = Pi, а2 ~ 02» ...» = Рп- Эти единственным образом определяемые числа ах, а2, ..., ап называются координатами вектора х по базису {хх}. Для того чтобы распространить эти понятия на произвольные непустые конечные или бесконечные множества векторов из X, мы должны условиться, что произвольное множество называется линейно независимым, если линейно независимо его любое непустое конечное подмножество. В противном случае оно называется линейно зависимым. После этого незначительного обобщения понятия линейной зависимости мы можем утверждать, что произвольное (и не обязательно даже счетное) линейно независимое подмножество {rra} некоторого линейного пространства X является базисом подпространства М, если каждый вектор этого подпространства единственным образом представляется в виде некоторой (конечной) линейной комбинации векторов {ха}. Можно показать, что у каждого векторного пространства имеется базис. Это — нетривиальный результат. Множество вещественных чисел можно рассматривать как линейное пространство, в котором существует такое подмножество вещественных чисел {жа}, что любое вещественное число х может быть представлено в виде х = 2VaXa’ где va — рациональные числа, а под знаком суммы находится лишь конечное число слагаемых, не обращающихся в нуль. Более того, хл должны быть линейно независимыми в том смысле, что любая конечная сумма Svarra, где все va рациональны, может обращаться в нуль тогда и только тогда, когда все va = 0. Но так как число возможных^произведений каждого фиксированного ха на рациональный множитель счетно, то число различных ха базиса обязательно должно быть несчетным (для R этот базис называют базисом Гамеля). Рассмотрим теперь линейное многообразие Ар, натянутое на совокупность векторов ха, где а =/= 0. Ясно, что таким образом мы получим несчетное число различных подпространств Ар пространства Л. В частности, мы уже доказали существование несчетного
множества различных подгрупп ♦) пространства R, каждая из которых содержит несчетное множество элементов! Один из важнейших результатов введения понятия базиса линейного пространства состоит в том, что после определения базиса линейные операции над элементами этого пространства, которые по началу были совершенно абстрактными, становятся обычными линейными операциями над скалярами, т. е. над координатами векторов по заданному базису. Для того чтобы проиллюстрировать эту мысль, выберем в пространстве X некоторый базис {^х, ..., хп}. Тогда, если х и у — произвольные элементы X, то х = ад + а2х2 + ... + апхп, У ~ •••Ч- Рп.З'п* В силу аксиом сложения для линейных пространств X + у = (at + Р1)^1 + (а2 4- 02)*2 4- ...4- (ап 4- ₽п)*п, а если 1 — произвольный скаляр, то кх = (Xajxx + (Ха2)а:2 + ...+ (2ап)хп. Если в некотором линейном пространстве X удается найти п линейно независимых векторов, и при этом любые (п + 1) векторов этого пространства линейно зависимы, то число п называют размерностью пространства X, а про само это пространство говорят, что оно n-мерно. Линейное пространство, в котором можно найти произвольно большое число линейно независимых векторов, мы станем называть бесконечномерным. ТеоремаВ. Если X — произвольное линейное пространство размерности п, то в нем существует некоторый базис, содержащий ровно п векторов. Более того, любые множества п линейно независимых векторов такого пространства являются для него базисом. Доказательство. Пусть ех, е2, еп -— некоторое множество п линейно независимых векторов заданного n-мерного линейного пространства X. Пусть х — произвольный вектор этого пространства. Тогда множество (п + 1) векторов {х, е2, е2, ...» еп} линейно зависимо. Другими словами, существует такая линейная комбинация aox + ... + апеп = О, в которой по крайней мере один из коэффициентов а0, ах, ..., ап ♦) G называется подгруппой Я, если О ЕЕ С и если х — у EG для любых х и у EG.
отличен от нуля. Нетрудно убедиться в том, что а0 не равен нулю. Действительно, если бы это было не так, то у нас получилось бы, что векторы е2, ...» еп линейно зависимы, что невозможно по условиям теоремы. Тогда обычным образом, т. е. разделив все это уравнение на а0 и перенеся все члены, кроме первого, в правую часть, мы убедимся в том, что х может быть представлен в виде некоторой линейной комбинации векторов е2, ...» еп. Но х — произвольный вектор пространства X. Поэтому векторы в!, е2, ..., еп образуют базис этого пространства. Следующая теорема завершает нынешнее направление рассуждений о свойствах конечно-мерных линейных пространств. Теорема Г. Пусть X — произвольное линейное пространство. Если в X имеется некоторый конечный базис Вг = {е<} = = {en из п элементов, то любой другой базис этого прост- ранства В2 = {Д} также конечен и содержит ровно п элементов. Доказательство. Доказать конечность В2 можно от противного и это нетрудно. Поэтому здесь мы займемся лишь более трудной задачей и покажем, что если В2 конечно и Вг =" {/,} = {А, /2, /т}, где т — некоторое положительное целое, то т и п равны. Поскольку пространство X натянуто на {е$}, то элемент Д может быть представлен в виде некоторой линейной комбинации е„ а множество : {Л» ^2» •••, ^п} линейно зависимо. Следовательно, один из векторов ei, например eio, является линейной комбинацией остальных элементов S^. Вычеркнем eio из и получим в результате этого новое множество S2 — {Д, ех, ..., е^-и е<о+1, ...» еп}. Пространство X по-прежнему можно натянуть на S2, а значит, множество S3 = {Д, Д, eif ..., eit+i, ..., еп} линейно зависимо. Но так как Д линейно независимы, то один из элементов е{ должен оказаться линейно зависящим от остальных элементов S3. Этот элемент мы можем снова отбросить и получить в результате новое множество, на которое натягивается X. Продолжая этот процесс далее, мы увидим, что нельзя выбросить последние ei раньше, чем будет исчерпан запас Д, так как в противном случае оставшиеся Д оказались бы линейными комбинациями тех, которые заменили е{ в Sk, а это противоречит предположению о линейной независимости Д. Таким образом, ясно, что п т, т. е. что п не может быть меньше т. Однако если и Д поменять ролями, то точно такими же рассуждениями можно показать, что п т, откуда и вытекает, что п = т. Из изложенного следует, что если в пространстве X существует конечный базис, то число векторов этого базиса совпадает с размерностью X. Что касается бесконечно-мерных пространств, то аналогичное утверждение содержится в следующей теореме.
ТеоремаД. Пусть X — некоторое линейное пространство. Если Вг = {е<} и В2 = {fj} — два произвольных базиса X, то Вг и В2 содержат одинаковое число элементов, т. е. между их элементами можно установить взаимно однозначное соответствие. В заключение этого параграфа мы попытаемся проиллюстрировать, хотя бы частично, факт огромного многообразия возможных линейных пространств. Эти примеры содержат исключительно полезные и часто используемые в технических и научных приложениях классы функций. Все эти классы имеют очень много общего, и именно эту общность мы и подчеркиваем в данной главе, переходя на более высокий уровень абстракции. Пример 7. Простейшим примером линейного пространства может служить Нп. Определения операций сложения и умножения на скаляр для этого пространства приведены в примере 6 этого параграфа. По определению 0 = (0,..., 0) и — х = (— ?i,..., — £п)« Нетрудно проверить и справедливость для этого пространства всех восьми аксиом линейного пространства. Размерность Вп равна п. Для того чтобы доказать это, положим ех = (1, 0, ..., 0), е2 =" (0, 1, 0, ..., 0), ..., еп = (0, 0, ..., 0, 1). Если х = (£п ..., £п), то ясно, что х — + ...+ £пеп. Таким образом, множество ei, ...,еп порождает все пространство Вп и в то же время линейно независимо, так как + ... + апеп = = (<%!, ..., ап) = 0 тогда и только тогда, когда все а равны нулю. Отсюда следует, что е1У ...» еп образуют базис в Rn. 1 Особенно привлекательный вид имеют линейные многообразия в пространстве R3. Пусть х± GE Rn. Одномерное многообразие Мх = является прямой, направленной вдоль xY. Точно так же, если хи х2 ЕЕ Rn и линейно независимы, то М2 = Цхх, х2) представляет собой плоскость, содержащую хг и х2. Читатель легко может убедиться в справедливости этих утверждений для пространства R3. Пример 8. Обозначим через Сп множество всевозможных п-ок х = (£п ..., £п) комплексных чисел. Нетрудно видеть, что Сп — комплексное n-мерное линейное пространство. Как и раньше, нетрудно убедиться в] том, что п векторов et = (1, 0, ..., 0),... ..., еп = (0,0,..., 1) образуют базис Сп. Элементы Rn принадлежат Сп. Однако Rn не есть подпространство Сп, так как если а комплексно, а х принадлежит Rn, то ах принадлежит Crt, но не обязательно принадлежит Rn (например, iet = (i, 0, ..., 0) не принадлежит Rn). Однако множество Сп можно рассматривать и как вещественное линейное пространство (с вещественными скалярами). Для такого пространства один из возможных базисов составляют векторы {е1ч ..., еп, ier, ... ien}, а значит, его размерность становится равной 2п, вместо прежней п. Но, как правило, Сп рассматривают как комплексное пространство,
Пример 9. Множество С(а, Ь) непрерывных функций, определенных на промежутке [а, Ы, является линейным пространством (см. пример 3 § 1.3). Пространство С(а, Ь) бесконечномерное. Пусть ^о(0 = = *П' п = Ясно, что все х0, хи хп при- надлежат С(а, Ь). Но это множество элементов линейно независимо, как бы велико ни было п, так как в соответствии с хорошо известным свойством полиномов выражение а0 + a±t + ...+ anfn обращается в нуль для всех t из некоторого промежутка а t b только в том случае, когда а0 = аг = ...= ап = 0. Это показывает, что С(а, Ь) не может быть конечномерным. В качестве подпространства С(а, Ь) мы можем рассматривать множество Рк всех полиномов относительно t со степенью не выше к. Это линейное многообразие, очевидно, натянуто на систему функций {1, t, £а, ..., £*}. Отсюда следует, что это множество образует базис Ph, и, значит, Ph является (к + 1)-мерным пространством. Другим базисом для линейного многообразия Рк может служить множество Pq ~ аоо> Pi “ аю Рк = Яко + akLt + ... + ahht\ где матрица (а,ц) невырождена (т. е. ни одно из не равно нулю). Для доказательства этого заметим, что невырожденность матрицы (ац) гарантирует возможность выразить Г через р0, ..., pk. Но это значит, что t* (= А(р0, •••» Рп)» откуда следует, что tk) cz с Цр°, ..., рк). Соотношение же Цр0, ..., pk)^L(tQ, t, ..., tk) очевидно. Поэтому оба линейных многообразия могут лишь совпадать. Пример 10. Пусть / — некоторая аналитическая функция комплексной переменной z, определенная в единичном круге |z| < 1. Класс всех таких функций образует комплексное линейное пространство, если / + g и а/ определить обычным образом. Это пространство, конечно, бесконечномерно. В качестве возможного подпространства упомянем о классе всех функций /, для которых /(0) = 0. Пример 11. Пусть функция x(t) является комплексной функцией вещественной переменной t и обладает тем свойством, что x(t), x'(t) и x"(t) определены и непрерывны на замкнутом промежутке [а, Ы. Множество всех таких функций образует линейное пространство по отношению к обычным операциям сложения и умножения на скаляр. Его часто обозначают через С3 (а, Ь). Оно бесконечномерно. В качестве его подмножества можно рассматривать = {х : £ GE С3(0, л) и x”(t) + x(t) - 0}. Размерность Пг равна двум. Одним из базисов подпространства Ях могут служить функции
{еЛ е“к}, а другим — функции {sin t, cos t). Интерес представляет и другое линейное многообразие Н2 = {#(0: #(0 ЕС2(0, л), х(0) = гг(л) = 0}. Оно бесконечномерно, поскольку содержит бесконечное линейно независимое множество {sin nt, п = 1, 2, 1.4. Банаховы пространства Для предыдущих параграфов мы отбирали материал, преследуя две цели. Во-первых, нам нужно было ввести понятия, определения и обозначения, необходимые для эффективного изучения вопросов, которые мы будем рассматривать в дальнейшем. А во-вторых, мы надеемся на то, что за это время читатель освоился с абстрактной точкой зрения, для которой главное — это сами понятия или операции, вне связи с их конкретными проявлениями. Конечно, теорию метрических и линейных пространств можно было бы изложить гораздо глубже, чем это сделано здесь. Однако, имея в виду те приложения, которым посвящена эта книга, мы по- прежнему станем придерживаться тактики постепенного прогресса. Для изучения теории систем первостепенную роль играет теория банаховых и гильбертовых пространств. Значение этих пространств становится по-настоящему понятным лишь тогда, когда мы переходим к исследованию линейных операторов или линейных функционалов, заданных на этих пространствах. В настоящем параграфе мы ограничимся лишь рассмотрением общих свойств этих пространств, а вопросы, связанные с более глубоким их анализом, а также с приложениями, отложим до последующих глав. Для успешного обобщения геометрических представлений на случай абстрактных пространств нам необходимо, среди прочего, не только измерять расстояния между элементами (что достигается введением метрики), но и измерять размеры или величины самих элементов. Введение соответствующего понятия приводит нас к рассмотрению теории нормированных линейных пространств, а точнее говоря, к теории банаховых пространств. Мы начнем со следующих определений. Определение А. Линейное пространство X называет- ся нормированным, если существует некоторое правило, ставящее в соответствие каждому элементу хЕХ некоторое вещественное число (которое называют нормой элемента х и обозначают через ЦгЦ). Это правило должно удовлетворять следующим условиям (аксиомам нормированного пространства): (1) || х || 0 и ||х|| — 0, тогда и только тогда, когда х — 0, (2) 11х + леи,+ Ы>
Неотрицательное вещественное число || х || можно рассматривать как длину элемента х. Правило, позволяющее определять ||х||, является некоторой вещественной функцией, определенной на элементах пространства. Поэтому иногда мы будем говорить о |х|| как о норме, заданной наХ. Вектор х, длина которого равна единице, называется нормированным. Нормировать можно каждый ненулевой вектор у (другими словами, всегда найдется такое число X, что, умножив у на это число, мы получим вектор единичной длины). В самом деле, решая уравнение ||Xi/|| = 1 относительно X, мы получим Поскольку в нормированном линейном пространстве для измерения расстояния между элементами и для измерения их длины нужно пользоваться одним и тем же масштабом, естественно определить на этом пространстве метрику с помощью соотношения. р(х, у) = Цх - J/||. Легко показать, что это определение расстояния удовлетворяет всем аксиомам метрического пространства. Проверку этого мы оставляем читателю в качестве упражнения. Если воспользоваться метрикой, порожденной нормой, то определение понятий предела и сходимости приобретает следующий вид: х = lim xno lim ||хп — х|| = 0. П-*СО П-*ОО В связи с этим сходимость в нормированном линейном пространстве получила название сходимости по норме. В дальнейшем мы всегда будем неявным образом предполагать, что в любом нормированном линейном пространстве используется метрика, порожденная нормой, если только специально не оговорено противное. Еще одно свойство нормы, вытекающее из аксиом нормированного пространства, заключается в следующем: Ы - hll<k - j/ll. Для того чтобы доказать это утверждение, заметим, что х = = (х — у) + У- Но в соответствии с определением А(2) отсюда || х || ^|1х — 1/|| + || у ||. Перенося второе слагаемое из правой части в левую, мы как раз и получим требуемое неравенство. Более сильное неравенство, вытекающее из предыдущего, можно получить, заметив, что IЛ - kl - М = 11(-1)(х -у)| = к - л.
что вместе с предыдущим результатом даст Ikll - ИИ КЬ-!/11- Определение Б. Банаховым пространством называет ся нормированное линейное пространство, полное относительно метрики р(х, у) = ||х — у\\, порожденной его нормой. Банаховым пространством В, очевидно, является линейное пространство, элементы которого х имеют длину ||х(|, удовлетворяющую ^нескольким простым геометрическим свойствам, как раз и сформулированным в аксиомах нормированного пространства. В метрике р(х, у) = ||х — уЦ все последовательности Коши сходятся^к соответствующим точкам пространства В. Поскольку каждое нормированное линейное пространство можно рассматривать как некоторое метрическое пространство, все понятия сходимости, предельной точки, открытого и замкнутого множеств, границы и внутренности, введенные в § 1.2, сохраняют свою силу и для нормированных линейных пространств. Рассмотрим теперь некоторое линейное пространство X, на котором определены две нормы Ц и || ||2. Мы будем говорить, что эти две нормы эквивалентны, если любая последовательность из X, сходящаяся по норме || |х, сходится по норме || ||2, и наоборот. Так как для определения предельных точек единственным понятием, которым нужно пользоваться, является понятие сходимости, то любое множество S, считающееся открытым (или замкнутым) в множестве X с нормой || ||п необходимо будет открытым (или замкнутым) и в пространстве X с эквивалентной нормой Ц |2. Справедливо и обратное утверждение. Т^е о р е м а А. Для того чтобы две нормы [ |х и || ||2, определенные на линейном пространстве X, были эквивалентны, необходимо и достаточно, чтобы существовали такие постоянные а, Ь > 0, что J^lli || ^Цг Ь | я|1» каково бы ни было х Ez X. Эта теорема служит прямым следствием утверждений, сделанных выше, и ее доказательство мы оставляем читателю. Читателю нетрудно догадаться также, что из теоремы А вытекает еще и неравенство (1/Ь)||х||2 || ^Ik ^(1/а) ||х||2, которое должно выпол- няться для любых х G= X. Отсюда следует симметричность определения эквивалентности. Прежде чем переходить к примерам в банаховых пространствах, мы сформулируем без доказательства одну теорему, выделяющую два особых свойства нормированных линейных пространств конечной размерности. Доказательство этой теоремы можно найти в любой из книг, цитируемых в конце этой главы.
ТеоремаБ. Каждое нормированное линейное пространство конечной размерности полно. Все нормы конечномерного пространства эквивалентны. Рассмотрим теперь несколько наиболее часто встречающихся банаховых пространств, в каждом из которых линейные операции (сложение и умножение на скаляр) определены либо покоординатно, либо поточечно, в зависимости от того, что кажется в каждом случае естественней. Обозначения, используемые в этих примерах, нужно рассматривать как стандартные для соответствующих пространств. I Пример}}.. Простейшими банаховыми пространствами являются пространства Я и С, пространства вещественных и комплексных чисел. Норма числа х в этом случае определяется соотношением ||ж|| = |ж|, где |я| — абсолютное значение х. Метрика, порождаемая такой нормой,согласуется стой, с которой мы познакомились в примерах 1 и 2 § 1. 2. Оба эти пространства по отношению к данной норме являются полными, и, значит, они оба банаховы. Подмножество [0,1] нормировано и полно, но не является линейным, а значит, и не может быть банаховым. |Пример 2. Как мы увидим в примере 3, линейные пространства Вп и Сп всевозможных n-ок х = (xv х2, ..., а^), образованных из вещественных или комплексных чисел, позволяют построить бесконечное множество различных банаховых пространств. Норма в этом пространстве может быть определена, например, следующим соотношением: и=(3|х,1>У'’. i—1 ' Метрика р(х, у) = |я — у|, порожденная этой нормой, согласует ся с той, которую мы рассматривали в примере 3 § 1.2. Веществен ные и комплексные евклидовы пространства, определенные таким образом,‘ в предыдущих параграфах обозначались через Е". И те и другие пространства полны, а следовательно, и банаховы. В данном и последующих примерах мы рассматриваем пространства, элементами которых являются n-ки скаляров, скалярные последовательности и скалярные функции. Сами же скаляры могут быть вещественными либо комплексными числами. В дальнейшем необходимо все время помнить, что мы допускаем обе эти возможности, если только специальным образом не оговорено обратное. Более того, мы не будем даже пользоваться специальными обозначениями для того, чтобы отделить вещественный случай от комплексного. Если же каждый из этих случаев требует особого подхода, то мы отметим это, указав, например, что речь идет о «комплексном пространстве».
Пример 3. Пусть р — некоторое вещественное число, такое что 1 р < оо. В качестве стандартного мы будем пользоваться обозначением 1р(п) для пространств, образованных из Rn и Сп путем введения нормы п / Иг11 = (31х<г)1Р-i=l 7 Так как евклидово пространство, очевидно, является специальным случаем 1р(п) при р = 2, то мы часто будем пользоваться для него обозначением 12(п) вместо принятого ранее обозначения Z?n. Нетрудно показать, что введенная выше норма действительно удовлетворяет аксиомам нормированного пространства. Неравенство треугольника ||х± + х2 ||^||^i|| + ||*2|| в этом случае оказывается эквивалентным неравенству Минковского (о котором речь пойдет дальше в этом параграфе) для конечных сумм, а именно: [21С. + п.гГ<[||Ы’Г+[21п,1’Г. Доказательство полноты /р(п) мы оставляем читателю. Пример 4. Рассмотрим теперь обобщение пространств 1р(п) на случай бесконечной размерности. Пусть р — по-прежнему некоторое вещественное число, такое, что 1 р оо. Обозначим через /р пространство всех бесконечных скалярных последовательностей таких, что 2°1_11 хп |Р <С 00, с нормой kl = (3 knl) • п=1 Пространства 1р действительно банаховы. Неравенство Минковского из примера 3 справедливо и для бесконечных сумм, а это значительно упрощает проверку того, что введенная выше норма удовлетворяет аксиомам нормированного пространства. Следующие два примера относятся к предельным случаям 1Р и Zp(n), возникающим при неограниченном увеличении р. Пример 5. Как и в примере 3, мы начнем с линейного пространства всевозможных скалярных n-ок х = (Ж|, х2, ..., хп). Однако норму теперь определим уже по-другому, а именно: Цг|| = max {|xL I, |ar2|, .... |xn|}. В результате мы получим банахово пространство, обычно обозна
чаемое через /«.(п). Такое обозначение объясняется тем, что max {| Xi |} = lim [2 I xt I”)>Р-р-*°° 4=i ' Для того чтобы выяснить, почему это так, рассмотрим вкратце случай п = 2. Итак, пусть х — (х,, х2) есть некоторая упорядоченная пара вещественных чисел. Без какой-либо потери общности мы можем предположить, что и 0. Если хх ~ xz, то lim ||х|| = lim (2х2)1/р = хг = ||.г ||«, р—>оо р—*оо а если ^<^£2» т0 lim ||х|| = lim (г?-f-X2)Vp= lim +1]*?) = р—>оо р-*оо р->оо L\ / -I / Г/Гт р 11/р = lhn[( — I +1 *2 = Хг = ||х||оо* р->оо L\ *2 / J Пример 6. Рассмотрим теперь, как и в примере 4, линейное пространство всех ограниченных скалярных последовательностей х = х2, •••' хп}- По аналогии с примером 5 определим в нем следующую норму: Ml = sup | хп |. п Полученное в результате банахово пространство мы будем обозначать через Zoo- Как и в примере 5, можно показать, что норма, введенная в Zoo, является пределом нормы для 1Р при р -> оо. Действительно, можно показать, что suPl^nl = Ит 1 l'm(|x1|p + . . . + | хп |р)1/р]. п п—*оо р-»оо Обозначим теперь через с множество всех сходящихся последовательностей. Легко показать, что с представляет собой замкнутое линейное подпространство Zoo и потому само является некоторым банаховым пространством. Другим банаховым пространством того же семейства может служить подмножество с, обозначаемое с0 и содержащее всевозможные сходящиеся последовательности с нулевым пределом. Элементами банаховых пространств в первых шести примерах были скалярные n-ки либо скалярные последовательности, а отличались они друг от друга нормами. В физических же приложениях пространства функций обычно столь же важны, как и пространства последовательностей. Банаховы функциональные
пространства бесконечно разнообразны, и в следующих трех примерах мы познакомимся с тремя наиболее важными их них. Пример 7. Пусть Т — произвольное непустое множество, а В(Т) — класс всевозможных вещественных или комплексных ограниченных функций х, определенных на Т. Если положить ||х|| = sup |х (01, гет то В(Т) становится нормированным линейным пространством. Заметим, что 1^ — это частный случайВ(Т), где Т есть множество всевозможных положительных целых чисел. В тех же случаях, когда Т принимает вид некоторого промежутка [a, i], мы будем писать вместо В(Т) В[а, Ь]. Доказательство полноты пространства В(Т) мы оставляем читателю в качестве самостоятельного упражнения. Пример 8. Пространство С(а, Ъ) непрерывных скалярных функций, определенных в промежутке [а, Ь], с нормой 11/11 = sup 1/(01 представляет собой замкнутое подпространство В[а, Ы и, следовательно, является банаховым пространством. (Замкнутость пространства С устанавливается теоремой, утверждающей, что предел любой равномерно сходящейся последовательности непрерывных функций является непрерывной функцией. Эта теорема рассматривается в примере 7 § 1. 2.). Полнота С(а, Ь) доказана в примере 8 § 1.2. Функциональные пространства. Обозначим через Сь(а, Ь) пространство непрерывных скалярных функций, определенных на промежутке [а, Ы, с нормой ь И = $ |х(0\dt. а Ясно, что последнее выражение определяет некоторую норму на соответствующем множестве, и, значит, пространство Сь(а, Ь) может считаться линейным и нормированным. Однако, в отличие от пространства С(а, Ь) из примера 8, пространство С£(а, Ь) не полно. Для того чтобы показать это наиболее простым образом, рассмотрим последовательность {а;п} из СЦО, 2), определенную следующим образом: х = о<«1. ' I 1, Легко показать, что эта последовательность является последовательностью Коши относительно интегральной нормы, введенной
выше, и сходится она к ступенчатой функции (О, 0<<<1, не принадлежащей 2). [Между прочим, приведенная последовательность не является последовательностью Коши в смысле равномерной нормы на С(0, 2).] Рассмотренный пример показывает, что для построения некоторого банахова пространства с интегральной нормой нам нужно начать с множества, которое по крайней мере достаточно широко для того, чтобы включать кусочно-непрерывные функции. К сожалению проблему полноты пространства не удается решить таким простым путем. Одна из возникающих при этом трудностей связана со свойствами интеграла Римана. Суть этой трудности состоит в том, что оказывается возможным построить на некотором промежутке последовательность {zn} скалярных функций, каждая из которых интегрируема по Риману, а их предел х недостаточно гладок для того, чтобы гарантировать существование от него интеграла Римана. Для того чтобы обойти это препятствие, была введена новая, более сильная форма интегрирования, а именно интеграл Лебега. Интеграл Лебега и интеграл Римана совпадают на классе функций, интегрируемых в смысле Римана. Поэтому для наших целей удобно рассматривать интегрирование по Лебегу как обобщение интегрирования по Риману. При интегрировании по Лебегу множеством меры нуль называется любая совокупность точек, занимающая на оси вещественных чисел область, длина которой равна нулю. Всякое множество, содержащее лишь счетное число точек, может служить примером множества меры нуль. Любая функция, равная нулю, всюду, кроме множества меры нуль, имеет интеграл Лебега, равный нулю. Одной из таких функций является функция Дирихле z, определенная на некотором промежутке [a, fe| следующим образом: z(0 — )1, если t рационально, |0, если t иррационально, £ ЕЕ [а, &]. Ее интеграл Лебега равен нулю. Ясно, что если две функции х и у отличаются друг от друга лишь на множестве меры нуль, то функция |х — у| будет отлична от нуля тоже лишь на множестве меры нуль, и, следовательно, ее интеграл Лебега должен быть равен нулю. Поэтому, если для введенной нормы мы собираемся сохранить свойство ||я — у|| = О О <=> х = у, то нем придется считать равными (или, строго говоря, эквивалентными) любые две функции, отличающиеся друг от друга лишь на множестве меры нуль.Это допущение не только приемлемо
с инженерной точки зрения, но и свидетельствует о хорошем математическом вкусе. Пример 9. Обозначим через Lp(a, Ь), 1 р оо, пространство скалярных функций, определенных и интегрируемых (в смысле Лебега) на промежутке [а, &], с нормой Г С о 11/р ||/|| = [$|/(0|pd*] • Lu Для 1 < р < оо справедливо неравенство Минковского ь ь , Ъ ,. гР 'll/Р гр 'll/р ГР « 11/Р fSi/o)+?(оМ <ы/(0|₽л] +[Jif(or^J , La La La откуда следует, что ||/ + g|| ^ ||/|| + ||g||- Справедливость других аксиом нормированного пространства очевидна, а мы уже знаем, что с помощью аппарата современной теории интегрирования можно показать, что £р(а, Ь) полно. Таким образом, пространство £р(а,Ь) является банаховым. Как и в примерах 5 и 6, можно найти интерпретацию и для предельного случая р ->оо. Легко показать, что для каждого конечного промежутка [а, Ы пространство /?(а, b)CZLp (а, Ь), 1^р<С < оо. Более того, если х GE В(а, &), то ||х||р —^supf | x(t) | при р -^оо. Если же пространство В(а, Ь) несколько видоизменить, исключив из него неинтегрируемые функции и добавив к нему функции, ограниченные всюду, за исключением множества меры нуль, и ввести на этом более широком пространстве норму ||я|| ess sup {|я(/)| : / €Е [а, Ы}, где существенной верхней гранью (ess sup) называется наименьшее из значений М, для которого \x(t)\^M лишь на множестве меры нуль, то вместо обозначения В(а, Ь) мы будем пользоваться символом b). Для того чтобы построить теорию пространств Lp на строгом фундаменте, совершенно необходимо разбираться в современных теориях меры и интеграла. Однако, к нашему счастью, основные свойства пространств Lp и основные результаты, их касающиеся, могут быть усвоены и использованы и без разбора всех этих тонкостей. В последующем мы станем по-прежнему рассматривать все встречающиеся нам интегралы, как будто бы они были римановыми. А читатель может чувствовать себя в полной безопасности, зная, что при подходящей интерпретации все эти результаты могут быть получены совершенно строго. Обсуждение. Если не считать нескольких разрозненных замечаний, то материал предыдущих параграфов совершенно не
мотивирован с точки зрения возможных технических приложений. Теперь же мы продвинулись уже настолько, что небольшое отступление, касающееся физических прототипов банаховых пространств из приведенных примеров, кажется нам весьма и весьма своевременным. Рассмотрим непрерывную систему с входной переменной и, выходной переменной х и импульсной характеристикой W. В любой момент времени t эти три функции связаны уравнением t X(t)=^W(t,s)u(s)ds, t>t0. (1) to Поскольку уравнение (1) описывает обычный двухполюсник, а также разнообразные механические системы (находящиеся в состоянии покоя в момент t — tQ), то мы оставляем на совести каждого читателя построение простейшей физической задачи, для которой это уравнение может служить моделью. Обозначим через tf некоторое время, tf Zo, а через т — интересующий нас интервал г = Uo, Z/L Более того, мы будем предполагать, что наибольший интерес представляет конечный момент tf. Переписав уравнение (1) для этого момента времени, мы получим соотношение ь х (tt) = \ W (tf, s) и (s) ds. (2) to Из множества широко распространенных физических ситуаций, отвечающих этому случаю, упомянем лишь две. Пусть функция и описывает расход горючего; точнее говоря, в момент времени t расход горючего равен | u(t) |. Ясно, что в этом случае суммарный расход горючего за время г в точности определяется выражением $| u(0|dt = || uh- В подобных случаях естественно рассматривать уравнение (2) как определяющее некоторое преобразование над элементами функционального пространства L^x). Второй, не менее распространенный класс проблем связан с задачей управления системой при ограниченных управляющих воздействиях. Например, в системе управления ракетой-носителем и может обозначать угловое отклонение оси реактивного двигателя от номинального направления. Попятно, что в этом случае величина и должна быть все время достаточно малой, а мерой и может служить М» = sup|u(0|. 1ST
В этом случае естественно предположить, что допустимые управляющие воздействия должны принадлежать пространству Loo (Г). Итак, мы убедились в том, что при исследовании непрерывных систем естественно возникает необходимость обращаться к функциональным пространствам Ьр(х). Аналогичные пространства последовательностей игракИт столь же важную роль при изучении поведения дискретных (или импульсных) систем. Рассмотрим, например, множество o' = {£0, ..., ^,..., tf} и множество входных величин X = {и: u(tk), состоящее из скалярных функ- ций дискретного аргумента (времени), определенных на о*. Если обозначить через Zp(cr) пространство X, на котором определена норма blip = tel u(M|p)1/P, ' а ' то дискретная двухполюсная система с входным сигналом х и выходным сигналом у, удовлетворяющая уравнению / *(М = 2W(tht}) (3) 5=0 является дискретным аналогом системы, описываемой уравнением (1). Для того чтобы сделать аналогию с непрерывным случаем более явной, заметим, что дискретное «топливо», доставляемое входной величиной, очевидно, измеряется числом 3l“(^)i = hli» о а его пиковые значения — числом max {| и(^)| } = ЦиЦоо. Таким образом, банаховы пространства /р(о*), Lp(r), 1 р оо, и С(а> Ь) оказываются естественным аппаратом исследования поведения динамических систем. И это впечатление по мере разворачивания материала этой книги будет только укрепляться. Неравенства для ^-пространств. Для использования аппарата теории банаховых пространств 1Р и Lp необходимо иметь хотя бы поверхностное знакомство с некоторыми стандартными неравенствами. Как и раньше, мы будем рассматривать вещественный и комплексный случаи одновременно. Теорема В. Если х, у S Lp(a, Ь), то х + у €= Lp(a, Ь), 1 р 00 • Если р > 1, то Lp(a, b) С b).
Доказательство. Пусть х и у — произвольные элементы Lp(a, b). Разобьем промежуток 1а, Ы в соответствии с отношением А - {/: 1x^)1 <1^)1}, В = [а, Ы \ А. Тогда для t Е= А I *(<) + у(0 |” < [| x(t) | + | y(t) Цр < 2” | y(t) | и, следовательно, ^|x(t) + y(z) |”dz<2Р $|р(0|рл<4-оо. Л А Аналогично можно показать, что интеграл | x(t) + ко- нечен и, следовательно, х + У G Lp(a, b). Для того, же, чтобы показать, что Lp(a, b) CZ ЛДа, Ь), произведем разбиение промежутка [а, Ы в соответствии с правилом С = {/: |х(0| < 1}, D = [a,b] \ С. Интеграл | x(t) | dt, очевидно, сходится, а сходимость (существо-с вание) интеграла | x(t) | dt следует из того факта, что |х(/)|р D |z(0! пРи t ЕЕ D и что х ЕЕ Lp (а, Ь). Предположим теперь, что р 1. Число д, удовлетворяющее соотношению 1/р + i/q = 1 (т. е. q = р/(р — 1)), называется показателем, сопряженным к р. Для доказательства следующей теоремы нам понадобится лемма, относящаяся к свойствам сопряженных показателей. Лемма А. Для произвольных неотрицательных г и s S R, г 0, 0, и произвольных сопряженных показателей р и q спра- ведливо неравенство (r)VP(s)V.<^ + ^_ . Доказательство. Рассмотрим функцию ф(х) -хЛ — ах, 0 < х < оо, при 0 < а < 1. Ее производная ф'(^) = а(^а“х — 1) положительна при 0 < х< 1 и отрицательна при х > 1. Поэтому максимум ф достигается строго в точке х =1. Из неравенства ф(х) ^ф,(1) = = 1 — а следует, что хЛ ах + (1 — а) при всех х 0. Пусть г и $ положительны. После подстановки х — r/s получаем
Умножая обе стороны неравенства на s и полагая, что а == 1/р, а1 — а = 1/у, мы получим, что Это неравенство подавно справедливо, когда одно из чисел г или s или оба они вместе обращаются в нуль. На этом доказательство леммы заканчивается. Следующая теорема устанавливает справедливость неравенств Гельдера для сумм и интегралов. Т е*о р е м а Г. Пусть р удовлетворяет неравенствам 1 <Zp < < оо, и пусть q = р/(р — 1). Тогда для произвольных элементов-х = ($!, ..., хп, ... ) е I? и у = (ух, ... уп, ...) GE lq справедливо-соотношение s I I < [21 1’Г • [21 ГТ=1 х 1 1 s !• Точно так же для произвольных х Lp(x) uyE Lq(x) справедливо соотношение $ I х (0 у (01 dt < [51 х (0 |p]1,p. I у (01’]v’ = |ММ Доказательство. Поскольку эта теорема становится сразу тривиальной, когда х или у оказываются нулевыми элементами, мы рассмотрим здесь лишь нетривиальный случай. Образуем для х ЕЕ £Ари?/Е Lq новые элементы а = х/|| х|| и Р = у! ||у||. Положив в предыдущей лемме s = | a(t) |р и г = | Р(£) |д, получим Отсюда следует интегрируемость произведения оф (а следовательно, и произведения ху). Проинтегрировав это выражение в промежутке т и замечая, что $|a(t)|pdt = l = $|p(f)|’df, t т мы получим $|a:(OP(0|d*<4r + T = 1-т Из этого неравенства и из определения а и Р немедленно следует неравенство Гельдера для интегралов. Неравенство Гельдера для сумм устанавливается точно таким же образом.
Теорема Д. Пусть х и у — произвольные элементы пространства 1Р (или Lp). Тогда при 1 р < оо I»+ v 1 = [s I 1’Г’ < [21 I’]+ [21 1"Г =111+1 я 1 или p + y|=[5l®(O + y(0l₽^]VP< <|$|г(/)|рл]1,р+[!;к(0|р^1/'’= kll + hll- Доказательство. Рассмотрим вначале Zp: к 4-dp = Sk 4- i/i l₽ = S(ki + !d-ki 4- Уг Нс i i < 21 ;ci I • I хг 4- У г I”’1 + 2I Уг I • I xi 4- Уг I”’1- i i Используя далее теорему Б для сумм (|хх 4 J/i|p'1» •••, l^n + + Уп1р~1, •••), играющих роль элементов lq, получим к 4- dr <(И 4- hll) к 4- 1/1Г’. Разделив последнее неравенство на |х 4- мы и получим требуемый результат. Аналогичным образом доказывается и та часть теоремы, которая относится к элементам Lp. Последняя теорема этого раздела приводится здесь без доказательства, лишь для возможных справок. Теорема Е (неравенство Йенсена). Если О < р < q, то г i Одно из следствий неравенства Йенсена состоит в том, что для О < р < q мы можем установить следующие включения: ZiCzZpCl/^C.Co^^CZZoo. Нетрудно построить примеры, показывающие, что каждое из этих включений является собственным. Некоторые потенциальные применения. В заключение этого параграфа рассмотрим несколько типовых задач теории систем, в которых использование банаховых пространств приносит ощутимую пользу. Воспользуемся уравнениями (1) и (3) в качестве моделей для системы с одним входом и одним выходом. Обозначим через Bt и В2 такие банаховы пространства, в которых рассматриваемая система каждому элементу и <ЕЕ Вг (входному сигналу)
ставит в соответствие некоторый выходной сигнал хЕЕ52-Это соответствие мы будем обозначать х = F(u). Располагая аппаратом теории банаховых пространств, мы можем сформулировать следующую простую задачу теории чувствительности. Обозначим через й и Z = F(u) некоторую эталонную совокупность входного и выходного сигналов, а через и — некоторую другую входную величину, мало отличающуюся от й. Другими словами, пусть и = й -j- би, где норма || би|| мала. Если входному сигналу и соответствует выходная величина х — X + бх [т. е. х = X + бх = F(fi + би)], то бх - F(fi + би) - F(u). (4) Пусть рассматриваемая система аддитивна, что справедливо для систем, описываемых уравнениями (1) или (3). Тогда F(fi + би) = = F(U) + F(6u) и уравнение (4) преобразуется к виду бх = F(6u). (5) Подходящей мерой чувствительности системы представляется отношение || бх|| /1| би|| при условии, что би =/= 0. Если же нас интересует «чувствительность» системы к вариациям входного сигнала в некоторой е-окрестности эталонного сигнала й, то более подходящей мерой чувствительности было бы число s^p.®:6“+0)- До сих пор все наши рассуждения не требовали уточнения характера пространств и В2- Если исследуемая система описывается уравнением (1) и Bt = Lp(a, b), a W(tf, t) ЕЕ Lq(a, б), то, используя неравенство Гельдера, мы можем установить справедливость следующей последовательности неравенств: ь ь бж| = | \ PF(f/,s)6u(s)ds|< ( |TF(tz,s)|-|6M(s)|ds< fo to / / 1/q / / \1/P S)\<ds) ( jj =(||W||Q)(||6u||p), (6) fo /о откуда сразу следует, что S ^|| J¥||g. (Позже мы увидим, что на самом деле это неравенство следует заменить равенством.) Точно так же для дискретной системы, описываемой уравнением (3), при BY = 1р(а) и W(tf, tr) ЕЕ lq (о) аналогичный результат выглядит следующим образом: I &х| с (31 w (tf, . (216u (tk) |”)1/p = (IIW ||Q) (II 6u ||p). (7) a a
Здесь важно отметить, что использование абстрактного понятия расстояния позволило одновременно охватить весь диапазон возможностей 1Р и Lp, 1 р < оо, избежав при этом необходимости вычислять сложные интегралы и суммы, связанные с изучением конкретных систем. Использование понятий нормы и окрестности позволило сосредоточить все наше внимание на самой сути задачи, а не на вычислительной специфике, с нею связанной. Наша вторая задача также относится к гипотетическим системам, описываемым уравнениями (2)или(3). Так же, как и в задаче теории чувствительности, мы обозначим соотношение между входным и ЕЕ В и выходным x(tf) ЕЕ R сигналами с помощью уравнения х — F(u). Пусть £ ЕЕ R — некоторая фиксированная точка. Мы сейчас попытаемся ответить на вопрос, существует ли такой сигнал ЕЕ Ви который одновременно удовлетворяет соотношению = £ и минимизирует критерий качества системы ||х||. Другими словами, мы хотим выяснить, имеется ли элемент с минимальной нормой в классе допустимых входных сигналов, который система связывает с выходным сигналом x(tj) = £. Судя по разнообразию возможных физических интерпретаций понятия нормы в пространстве входных сигналов (например, расход топлива, пиковая амплитуда, энергия и т. п.), эта задача может служить прототипом для одного чрезвычайно важного класса задач теории оптимизации (которая подробно изучается в главе 4). Для того чтобы решить поставленную задачу, мы вернемся прежде всего к доказательству леммы А. Отметим, что в соотношении (r)1/p (s)1^ < (г/р + s/q) равенство имеет место тогда и только тогда, когда г = s. Эта однозначность сохраняется на протяжении всего доказательства теоремы Г и приводит к тому, что для каждого х 6= 1Р равенство в первом соотношении в формулировке теоремы Г возможно в том и только в том случае, когда компоненты вектора у G= lq с точностью до некоторой постоянной к 0 определяются однозначно из условий | Xi |р - к\yi |«, i = 1, 2, ..., Л’> 0. Точно так же для каждого х ЕЕ. Lp знак равенства во втором соотношении в формулировке теоремы Г оказывается справедливым тогда и только тогда, когда функции у (= Lq удовлетворяют соотношению |х(0 |р = к I y(t)\q, Л>0, /ет. (8) Ясно, что до тех пор, пока 1/р + 1/q = 1, эти числа играют в приведенных соотношениях двойственную роль. Ограничимся теперь рассмотрением системы, описываемой уравнением (2), и предположим, что W(tfl s) ЕЕ LQ. Уравнение
8) утверждает, что входной сигнал с единичной нормой, максими-ирующий выходной сигнал, определяется по формуле и (Z) = sign [W (tf, /)1 -уц.?-— • IIй II Поэтому оптимальным управляющим воздействием является единственное скалярное кратное этого сигнала, удовлетворяющее конечному условию x(tf) — £. Для изучения систем со многими входами и выходами приходится прибегать к помощи декартовых произведений банаховых пространств. Для иллюстрации этого утверждения предположим, что {Bt: i 1, ..., п} есть некоторое множество банаховых пространств, а В - Bt х ... Вп — обычное декартово произведение пространств из этого множества. Конечно, хотелось бы, чтобы и само В в этом случае было банаховым пространством. Произведение В является линейным пространством относительно естественного определения опграций сложения и умножения на скаляр. Поэтому остается лишь решить вопрос об определении нормы на пространстве В и выяснить вопрос о полноте этого пространства. Обычно ни то, ни другое не представляет особого труда. Более того, существующая гибкость выбора нормы позволяет исследователю приспосабливать характер нормы к конкретным условиям рассматриваемой задачи. В качестве иллюстрации рассмотрим вектор х = (х^ ..., хп) ЕЕ 6= В. Обозначим через || норму, определенную на В^ Вектор, составленный из норм, ц (х) — (II^ilk, •••» ||*n||n) является, очевидно4 вполне определенным элементом Rn. Обозначим через | | любую норму, определенную на Rn. Тогда функция | |, определенная на В условием И = In (*)l, х 6= в, (9) может служить нормой для пространства /?. Например, если | | — это норма, принятая для 1р (п), то п i/p |х| = (s пигГ *</>< i 1 Упражнения 1. Пусть А и В — подмножества банахово го пространства X, Обозначим через А + В множество всех элементов х вида х = а + Ь, где а£ Л, а b е В. Покажите, что если А или В открыты, то открыто и Л -j- В. При-ведите пример двух замкнутых подмножеств А, В С В таких, что А + В не замкнуто. 2. Пользуясь примером 8 § 1.2 как моделью, докажите полноту пространства В (т) пз примера 7. Докажите полноту пространства Zp. 3. Пусть X — n-мерное пространство с базисом {q, ..., еп]. Для каждого iS X найдутся скаляры {оц (z), an (z)}, однозначно определяющие
разложение х по базису ..., еп}. Другими словами, эти скаляры удовлетворяют соотношению х = щ (х) е*. Пусть | | обозначает некоторую норму для Rn (или С71). Покажите, что функция I х | = | [аг (х), ..., ап (х)][, х е X, может служить нормой для X. Покажите, что в конечномерных пространствах сходимость по норме и по координатная сходимость эквивалентны. 4. Убедитесь в том, что функция | |, определенная в уравнении (9), является нормой для В. Для Bt = Lpi (a, b), i----- 1, ..., к, и В[ ~ i = к 4- 1, ..., и, выпишите эту норму подробно. 5. Проверьте следующие утверждения. (а) Пространство со замкнуто в с, а пространство с замкнуто в 1^. (б) Если рассматривать как подмножество то его замыканием служит с0. (Заметим, что это следует из факта замкнутости с0 в i^.) (в) Пространство 1Р плотно в Z^. (Множество Е в метрическом пространстве X называется плотным, если Е = X.) (г) Обозначим через М одномерное пространство с, натянутое на вектор (1/2, 2/3, 3/4, ...). Тогда с = с0 ф М. 6. Пусть некоторое банахово пространство В представляет собой прямую сумму линейных подпространств М и N, так что В = В ф N, Если z = х + у является единственным представлением вектора z из В в виде суммы двух векторов х и у из М и N соответственно, то новую норму на линейном пространстве В можно определить с помощью выражения || z||' = || х|Ц-+ IIУ ||- Докажите, что это действительно норма. Пусть В' — линейное пространство В, на котором определена эта новая норма; докажите, что пространство В' банахово при условии, что М и N замкнуты в В. 7. Пусть N — некоторое нормированное линейное пространство. Докажите, что U является банаховым пространством тогда и только тогда, когда множество {х\ ||х||<1} полно. 1.5. Гильбертовы пространства Банаховы пространства, изученные в параграфе 1.4, можно рассматривать как нечто большее, чем просто линейные пространства, для которых определено подходящее понятие длины вектора. Важным геометрическим понятием, которого нам пока недостает, является понятие скалярного (или внутреннего) произведения двух элементов. В этом параграфе мы познакомимся с абстрактным скалярным произведением и покажем, к каким важным выводам можно прийти, пользуясь этим понятием. Рассмотрим вещественное трехмерное евклидово пространство £3. Вектором, или элементом, Е3 служит упорядоченная тройка х = (хх, х2, х3) вещественных чисел, а норма в этом пространстве задается выражением k II = (l*il2 + hl2 + Нз!2)1'’. В элементарной векторной алгебре скалярное (внутреннее)
произведение х и другого вектора p=(j/i, Уг, Уз) определяется *) следующим образом: <х, у> = XjP! + х2у2 + ХзУз- В связи с этим норма в Е3 может быть выражена через скалярное произведение ЦхЦ2 = <х, х>. В пространстве Е3 определен еще и угол 0 между векторами х и у. Его значение можно найти из уравнения <х, У) -= ||х|| . ||у И cos 0. В частности, векторы х и у считаются ортогональными, если <х, у)=0, и коллинеарными, если <х, у> — + ||я|| • ||у|(. В комплексном пространстве Е3 скалярное произведение двух векторов х = = (xi, х2, х3) и у ~ (уп у2, уз) можно определить (см. пример 2 § 1.4) с помощью выражения <х, у> = хгух + х2у2 + х3у3, где черта над компонентами указывает на то, что берутся комплексно-сопряженные числа. Это понадобилось для того, чтобы обеспечить совпадение обычной нормы и нормы, задаваемой скалярным произведением <х, х) — ЦхЦ2. Так как <х, у> в комплексном пространстве уже не всегда вещественно, то очевидно, что в общем случае нам не удастся уже ввести понятие угла между х и у. Тем не менее условия <х, у> = 0 и <х, у> = = +Их1Н|у|| по-прежнему определяют ортогональность и коллинеарность векторов, соответственно, и эти понятия оказываются столь же полезными, как и в вещественном пространстве. Используя все эти идеи как некоторую стартовую площадку, сформулируем основное определение скалярного произведения в абстрактном линейном пространстве. Аксиомы скалярного произведения. Пусть X — некоторое комплексное линейное пространство. Правило, ставящее в соответствие каждой паре элементов х, у £ X некото *) В литературе не существует единого установившегося правила для обозначения скалярных произведений. В элементарных работах чаще всего пользуются обозначением z-y, а в более сложных — обозначением (х, у). Выбор обозначения] <z, у>, принятого в этой книге, диктуется материалом последующих глав, где сложность многих выражений заставляет использовать множество различных скобок, что могло бы привести к путанице в отсутствие специального символа для обозначения скалярного произведения.
рый скаляр (х, у}, называется скалярным произведением, если выполняются следующие условия: (1) у) = (у, х>, закон коммутативности; (2) (я, у + z) = <х, у) 4- <^г, z>, закон дистрибутивности; (3) <Хх, у> = X <х, j/>, каково бы ни было комплексное X; (4) <х, 0, где <х, х) = 04=>х = 0. Как и при определении линейного пространства, из аксиом (1), (2), (3) и (4) непосредственно вытекают некоторые дополнительные соотношения. С доказательства их мы и начнем. Рассмотрим три элемента х, yt и у2 пространства X. Используя сначала аксиому (1), затем аксиому (2) и, наконец, аксиому (3), построим следующую цепочку равенств: <У1 + У21 Я> = <Х, У! + у2> = <Я, У!> + <Я, у2> = <f/lt Ж> + <у2, X). В результате в дополнение к аксиоме (2) мы получим следующее соотношение: (2') <1/а4-!Л>, *> = <У1,я> + <Уг, Точно так же с помощью аксиом (1), (3) и (4), использованных именно в этом порядке, мы можем построить другую цепочку равенств: <ж, Ху> = <Ху, х} = X <у, х) = X (х, у), которая позволит нам получить следующее дополнение к аксиоме (3): (3') <ж, Ху> = Х<я, у>. Наконец, воспользовавшись аксиомой (2), мы найдем, что 0> = <ж, 0 + 0> = {х, 0) + <я» о>, откуда , 0> = 0 = (0,.г> для любого х€Е:Х. Определение А. Комплексное линейное пространство X называется предгильбертовым (или пространством со скалярным произведением)*), если на нем определена некоторая комплексная функция, удовлетворяющая аксиомам скалярного произведения. Наш опыт работы с пространством Е'Л позволяет надеяться, что в произвольном предгильбертовом пространстве скалярное произведение можно будет использовать для построения нормы. В частности, функция [{х, кажется вполне подходящим кандидатом для роли нормы. В данном случае интуиция нас не обманывает, и мы покажем, что так выбранная функция действительно *) Заметим, что при таком определении не исключается случай, когда пространство X вещественно.
удовлетворяет всем аксиомам нормы. Например, из равенства <ая, otz> = У"| а |а <я, я> = | а | У х) следует справедливость для этой нормы третьей аксиомы. Первая аксиома является простой переформулировкой аксиомы (4) скалярного произведения. Для ‘ доказательства второй аксиомы нам понадобится следующая теорема. Теорема А (неравенство Коши). Пусть х и у — некоторые элементы предгильбертова пространства X. Тогда Рис. 1.9. Скалярное произведение. Доказательство. Геометрическое подтверждение этого соотношения приведено на рис. 1.9. Начнем, с того, что выберем произвольные х и уЕ^Х и произвольный скаляр X. Тогда <х + Ху, х + Ху> = <х, х> + Х<х, у > + X <у, х> + + IM2 <У> У>>0. Предположим, далее, что ЦуЦ =£= 0 (в противном случае окончательный результат был бы очевидным), и выберем X так, чтобы л __ ~<М> Тогда предыдущее неравенство, справедливое для произвольного X, принимает вид /т „ч _ _ <.т, у) <у, а;> I <ж, у) |2 7 \У>уУ <у,у> +1<!/.г/>|2 что в свою очередь сводится к следующему: тч _ I <•*, У> I2 _ I У> I2 . I <ж, У> I2 о ’’ 7 <У,У> <У,У> <У,У> или в конце концов к следующему соотношению: *> <у, У) > | <х, у> |2 <4 Ц аг|.| у || > I <х, у >|. Теперь мы в состоянии завершить проверку того, что [(х, х)\ч действительно может служить нормой для X.
Теорема Б. Пусть X — некоторое предгильбертово пространство. Тогда ||гг|| = [<х, я)]1/’ является нормой, определенной на X. Более того, для произвольных х, у Е справедливо следующее правило параллелограмма: ||* + </1М к-!/||2 2 ||х|М- 2 II yf. (1) Правило параллелограмма легко доказать, выписав выражения в левой части равенства через скалярные произведения: || X + у II2 + II X — у II2 = (х + у, х + уУ + <х — у, X— уУ = <х, хУ + (х, уУ + <у, хУ + <*/, уУ + +<г, ху — <х, уУ — (у, хУ + <!/. УУ 2<х, х> + 2<у, уУ = 2|М12 + 2||У|Р. Теперь, после того как мы достаточно хорошо познакомились с понятием скалярного произведения, переход к понятию гильбертова пространства кажется вполне естественным. Определение Б (гильбертово пространство). Линейное пространство X называется гильбертовым, если оно является предгильбертовым пространством и полно отно сительно нормы, порождаемой своим скалярным произведением. Эквивалентное определение: гильбертовым называется любое банахово пространство, в котором норма порождена каким-нибудь скалярным произведением. Многие авторы включают в эти определения дополнительное требование бесконечномерности, сохраняя название евклидово пространство для любых конечномерных гильбертовых пространств. Однако для целей этой книги нам нет никакого смысла различать эти два случая. Рассмотрим теперь несколько конкретных примеров гильбертовых пространств. Мы немедленно убедимся в этом, что с большинством из них мы уже хорошо знакомы. Для того чтобы подчеркнуть, что гильбертово пространство как банахово пространство имеет вполне определенную норму, а как метрическое пространство — вполне определенную метрику, мы каждый раз будем выписывать норму и метрику, задаваемые введенным скалярным произведением. Пример 1. Пространство 12 (п). Если х = (хг, ..., хп) и у = = ( j/i,..., уп) — два вектора в пространстве 12 (и), то естественно следующее определение скалярного произведения: п <х, //> = S xiy-i- г=1
Обычные норма и метрика в 12 (п) определяются тогда соотношениями п®и=(2 i=l п 7> р (®. у) = II®+у11 = (S l®i - yd2) ’• Пример 2. Пространство /2. Для пространства 12 скалярное произведение векторов X -- (хп х2, хп, ...) и у—- (yt, у2, уп...) естественно определить следующим образом: оо <®. У> = 2 ХпУп- Выпишем также обычные норму и метрику для этого пространства II® 11 = к®,®»'7- (2 ki 12)л> i=l во 7 p(®,y) = ll®4-!/|| = (2 l®i-J/il2) • i=l Пример 3. Пространство L2 (а, Ь). Пусть х (t) и у (0 — две функции из пространства L2 (а, Ь). Тогда в качестве скалярного произведения в этом пространстве мы выберем функцию ь <®, У) = ^x(t)y(t)df. а Естественные норма и метрика в L2 (а, Ь) задаются соотношениями Ь 7 ||®||== 1<®,®)Г7, = |$|®(012л| \ а ь 7з р(х,у) = ||®-1/||= |$|ж(0 -</(Z)|2dz] . а Скалярные произведения, выбранные в этих примерах, казались естественными по отношению к функциональным пространствам, на которых они определялись. Однако эти определения скалярных произведений ни в коем случае не являются единственно
возможными. Для того чтобы проиллюстрировать широкий простор, существующий в выборе скалярных произведений, нам достаточно будет всего одного примера. Пример В пространстве L2 (а, Ь) зачастую удобно ввести скалярное произведение несколько более общего вида, чем рассмотренное в примере 3. Пусть р (0 — некоторая функция р (0 > 0, определенная на интервале (а, 6). Тогда вполне законным скалярным произведением может быть функционал ъ <Х,У) = н (0 МО#(0 dt- а В этом случае ь 7 а И р (*, у) = к - у II = и (О I * (О - у (0 Pd<]Л • а Пространство L2 (а, Ь) с определенным таким образом скалярным произведением мы будем обозначать через L2 (а, Ь; р). Каждому новому р (0 при этом будет соответствовать новое гильбертово пространство. Поскольку каждое гильбертово пространство является в то же время и банаховым, определения и различные свойства сходимости и других метрических свойств, содержащиеся в предыдущем параграфе, непосредственно переносятся на случай гильбертовых пространств. Отметим также, что при р = 2 неравенства Гельдера вырождаются в неравенство Коши — Шварца. Что же касается неравенства Минковского, то оно, естественно, сохраняет свое значение и для конкретных гильбертовых пространств. Нам представляется чрезвычайно важным в полной мере уяснить доказательство таких свойств, как неравенство Коши — Шварца, в абстрактной постановке. Для того чтобы подчерк-утьэту мысль, ознакомимся с конкретными формами, принимаемыми неравенством Коши — Шварца в каждом из четырех примеров гильбертовых пространств, рассмотренных ранее. В абстрактном виде: | <х, у > | ^ |х|| • ||у||. Конкретные его формы определяются следующим образом. 1. В пространстве 12 (п) с элементами х = (х^ ..., хп) и у = = (У1. •••, Уп) к*.</>1 = 13 ы8]л[3 ij/i г]А- i 1 1=1 i=l
2. В пространстве 12 с элементами х *= (xv хп) и у —'(уи ... ...» Уп, ) 1<я,у>1 = | S xiSi |< |S I®! i2]z|S I Vi l2]7 • г=1 г=1 г—1 3. В пространстве Ь2 («» Ь) с элементами х = х (t) и у — у (/)’ /£[а, Ь] ь ь ъ а а а 4. В пространстве Ь2 (а, Ъ\ р) с элементами х -- х (t) и у --= у (0, £<=[«, Ь] ъ <х> у> I = | $ и (О * (0 у (0 dt |’ < а ь 7 Ь 7 <[$p(O|x(0|4t] ’[$р(0 1Н0 I2 dt] ’. а а Таким образом, в любом гильбертовом пространстве гарантировано существование неравенств или равенств такого рода. Закон параллелограмма открывает еще одну интересную сторону взаимоотношений между банаховыми и гильбертовыми пространствами. В любом гильбертовом пространстве скалярное произведение можно выразить через норму с помощью следующего тождества: <х,у> = 4_fl® + ylFH*-y|l3 + ^ +W-ik-wll2}. (2) которое можно сразу проверить, представив выражение в правой части через скалярные произведения. Теорема В. Пусти В — некоторое комплексное банахово пространство, норма которого удовлетворяет закону параллелограмма \уравнение (2)1 и на котором определено с помощью уравнения (2) скалярное произведение. Тогда В является гильбертовым пространством. Доказательство теоремы В мы оставляем читателю в качестве самостоятельного упражнения. Эта теорема помогает уяснить, почему нельзя построить гильбертовы пространства из любых банаховых пространств и, в частности, из пространств 1Р и Lp при Р 4= 2. Ортонормальные множества. В начале этого параграфа мы спе циально подчеркивали сходство, существующее между банаховыми и гильбертовыми пространствами. Однако для многих технических
приложений различия, связанные с существованием скалярного произведения и понятия ортогональности, играют существенную роль. В следующих разделах мы займемся исследованием некоторых наиболее важных свойств, выделяющих гильбертовы пространства из общего класса банаховых пространств. Обозначим через {хх, ..., хп} некоторое множество элементов гильбертова пространства II. Матрица G (хп ..., хп), определенная следующим образом: <Tt, Xi)... <.ТЬ Хп) <х2, хх> . . . (х2, хп) (7 (хх,..., хп) — ^1) • • • называется матрицей Грама этого множества. Определитель этой матрицы, соответственно, называется определителем Грама и обозначается через Дп. Теорема Г. Множество элементов {хх, ..., хп} гильбертова пространства Н линейно зависимо тогда и только тогда, когда его определитель Грама обращается в нуль. Доказательство. Предположим, что множество {xp ...» хп} линейно зависимо. Тогда существует такой набор скаляров (из которых не все равны пулю), что aiXi + ... + апхп = 0. Вычисляя скалярные произведения каждой из сторон этого ра* венства с векторами хх, ..., хп, мы получим следующую систему уравнений: «1 <*ь *1> + ••• + *п> 0, 0&1 'I' ••• %п) ~~ Если рассматривать ah как неизвестные этой системы п линейных уравнений, то для существования некоторого нетривиального решения (ар ..., ап) необходимо, чтобы определитель Дп обращался в нуль. И наоборот, если Дп - 0, то у этой системы найдется некоторое нетривиальное решение (ар ..., ая). Переписав системы уравнений в виде п <^Xi,2 <*/9^ = 0, 4 = 1,...,п, ;=1 мы видим, что умножение i-ro уравнения на щ с последующим
сложением всех таких произведений приводит к равенству п п <2 «л. 2 «л)* = 12а^ | = °. откуда следует, что 2C=i оц^г = 0, что и доказывает линейную зависимость исследуемого множества. Следствие. Ранг матрицы, Грама равен размерности линейного многообразия (хх, хп). Если =/= 0, то не равен нулю и определитель Грама для любого подмножества {хх, ..., хп}. Доказательство, Поскольку из равенства Дп = 0 следует, что множество {хх, ..., хп} линейно независимо, то линейно независимым должно быть и любое подмножество {хх, ..., rrfc}, следовательно, определитель Грама этого подмножества также не обращается в нуль. Доказательство первой половины утверждения мы оставляем читателю. Определение В. Два элемента х и у произвольного гильбертова пространства Н называются ортогональными, если (х, у> = 0. Утверждение «х ортогонально у» часто символически записывают в виде х_[_у. Поскольку <х, у) = <у, х>, то справедливо соотношение х | у <=> у I х. Ясно также, что х | 0, каково бы ни было х, а равенство <х, х) = ЦхЦ2 показывает, что 0 — это единственный вектор пространства, ортогональный по отношению к самому себе. Более того, легко проверить справедливость теоремы Пифагора, принимающей в абстрактном пространстве следующий вид: I * + у II2 = || X (|2 + || у О2 & X 1 у. Определение Г. Пусть S — некоторое непустое подмножество гильбертова пространства Н. Множество S называется ортогональным, если для любой пары х, y€zS таких, что х=^у, х У- Если, кроме того, || х|| — 1 для каждого х Ez S, то множество S называется ортонормальным. Лемма А. Каждое ортонормальное множество линейно независимо. Если х ортогонально любому элементу множества {хх, ... ...,zn}, тох— ортогонально линейному многообразию L(xv ..., хп). Доказательство. В матрице Грама ортогонального множества от нуля отличны лишь элементы главной диагонали: || тх ]}2, ... ...,||znt Следовательно, Ап^И^1(|2,11д:2||2-----||2:п||2 =/=0, и потому, в силу теоремы Г, исследуемое множество линейно независимо. Если <х, х^ — 0, i — 1,..., п, то для каждого у ЕЕ L (хх, ..., хп) п У = 2 aiXi’ 1=1
и значит, п <Х, уУ = 3 <*, *<> = О, 1=1 что и завершает доказательство. В пространстве Еп утверждения леммы А становятся очевидными. Мы советуем читателю построить для себя картину (или по крайней мере мысленную картину), иллюстрирующую этот и каждый из последующих результатов. Переключим теперь наше внимание на задачу построения ортогональных множеств. Пусть X = {а?!, ..., xh} — произвольное конечное множество линейно независимых векторов, и пусть L (х^ ..., xk) — линейное многообразие, натянутое на множество X. Зададимся вопросом, нельзя ли всегда найти такое ортонормальное множество £’={е1, ..., еп}, которое могло бы служить для L базисом. Ответна этот вопрос оказывается положительным. С помощью одного метода, известного под названием процесса ортогонализации Грама-Шмидта, из любого множества линейно независимых векторов {^} можно построить множество взаимно ортогональных векторов {в{}. Этот процесс представляет самостоятельный интерес и сводится к следующему. Положим У1 = Xi и определим у2 с помощью формулы 2 <уъ yi> Другим словами, пусть у2 равняется х2 минус его проекция на Тогда <1/2> У1) — 0- Аналогичным образом определим и третий элемент у3 множества. Пусть у = х _ <х* 7, _ <х^ У3 3 <УЪ уг> У1 <У2, ?/2> т. е. пусть у3 равняется х3 минус его проекция на плоскость, образованная векторами yt и у2. Очевидно, что <Уз, У1> <Уз, У2> 0. Предположим теперь, что векторы у2, у]_г (j <; к) уже определены таким образом. Положим у; равным Xj минус его проекция на подпространство L (уу2, • Vj-i): V? <ЖГ Vi>
Ясно, что yj ортогонален к ух, уу_х). Кроме того, yj не может быть нулевым вектором, так как в противном случае xj оказался бы линейно зависящим от у^ у2, ...» уj-i, а следовательно, и от ух, Уг» •••» У/-2» </-1» что вытекает из определения у^г. Продолжая это рассуждение далее, мы в конце концов установим, что линейная зависимость Xj от ух, у2, ..., у j-x приводит к линейной зависимости Xj от хх, х2, ...» Xj_x, а это противрречит нашему исходному условию, согласно которому исходные векторы хх, х2, ..., xh линейно независимы. Таким образом, мы убедились в том, что описанный процесс позволяет построить множество из к ненулевых векторов, обладающих свойством взаимной ортогональности. Далее, векторы {yj} можно нормировать, получив в результате множество {ej}. Сам процесс построения свидетельствует о том, что каждый вектор можно представить в виде некоторой линейной комбинации Xj и, наоборот, каждый вектор Xj выражается в виде некоторой линейной комбинации eit В связи с этим, очевидно, L(Xj,x2, ..., xn)—L (ех, е2, ..., ek). Продолжая процесс далее таким же образом, мы придем в конце концов к следующей теореме. Теорема Д (Г рама — Шмидта). Если X = {xi} — некоторое конечное или счетное множество векторов гильбертова пространства Н, то существует такое ортогональное множество У = {^}, что L (X) = L(Y). Пример 5. Рассмотрим подмножество 5 = {еъ е2, ...» еп} пространства /2 (и), в котором ei — это n-ка с единицей на i-м месте и нулями на остальных местах. Очевидно, S в этом пространстве является ортонормальным множеством. Аналогично, если еп — это последовательность, n-й член которой равен 1, а все остальные — нулю, то множество {ех, е2, ..., еп} ортонормально в Z2. Пример 6. Пусть X — вещественное пространство Е\ Рассмотрим следующее множество векторов: хх = (ах, 0, 0), х2 = (аг» &2» 0) и х3 — (яз» &з, ^з)- Построим на его базе ортогональное множество, пользуясь процедурой Грама — Шмидта. Для этого прежде всего положим J/х Л = («1» 0, 0), Затем, по аналогии, положим и = г — <Хз’ ?/|> » — <Жз’ уз> и 3 <yi> yi> <У«» Уг> У* = («з, Ь„ с3) - (Д1, 0, 0) - (0, Ь2, 0) = (0, 0, с3). Другое ортогональное множество можно построить, если принять ух = х3. Для простоты анализа мы конкретизируем исходное
множество, приписав для начала численные значения его буквенным координатам. Итак, пусть хх = (1, 0, 0), х2 - (1, 4, 0), х3 - (1, 2, 2). Положим, далее, " ^3 — (1 > 2, 2), ^ = (1,4, 0) - 7Т<1+^_(1, 2, 2). Последнее уравнение приводит к следующему виду второго вектора: Уг (0, 2, - 2). Наконец, пусть ». = (I. 0. 0) - 4ТТ(0. 2, -2) - r-,;^(1, 2, 2), или f/з = 4-<8’ ~2- ~2)- Ортогональность этих векторов нетрудно установить непосредственно. Пример 7. Рассмотрим теперь множество S — {1/2, cos t, sin t, cos 2Z, sin 2t, ..., cos nt, sin nt, ..., }. Легко показать, что в вещественном пространстве L2 (—я, л; р), где р (t) = 1/л, множество S является ортонормальным. Напомним, что скалярное произведение в таком пространстве определяется выражением п 1 С <Х, у> = — у X (0 у (/) dt. Теория и применения ортонормальных множеств представляют собой одну из наиболее плодотворных областей прикладной математики, физики и техники. Именно к этой области относится и хорошо известная теория рядов и интегралов Фурье. В приложении 2 теория ортонормальных множеств развивается в этом направлении. Ортогональная декомпозиция. Пусть х — некоторый фиксированный элемент гильбертова пространства И. Обозначим временно через Мх пространство всех векторов, ортогональных фиксированному вектору х. Из леммы А следует, что Мх — обязательно некоторое векторное пространство. Мы утверждаем, что Мх еще и замкнуто. Для того чтобы убедиться в этом, предположим, что у — некоторая предельная точка множества Мх. Но тогда существует
последовательность упЕ=Мх, которая сходится к у. А так как <а-, у> = lim <.г, уп> = О, 71—>ОО то и у€ЕМх. Определение Д обобщает эти рассуждения. ОпределениеД. Пусть S — любое непустое множество векторов из Н. Мы говорим, что у ортогонально S, и записываем это y_\_S, если у ортогонально х, yj_x. каково бы ни было х из S. Множество всевозможных векторов, ортогональных S, обозначается через и называется ортогональным дополнением множества S. Отметим следующие факты, вытекающие из этого определения. Л е м м а Б. Если S и Т — два непустых подмножества Н, то (1) {О}1 -- II, ll ' {0}, (2) S П 51 = {0}, (3) S CZ Т => 51 Z) Г1, (4) S С S’*"*" [где определяется как (5) S1 — замкнутое линейное подпространство Н, (6) S11 является наименьшим замкнутым линейным подпространством Н, содержащим S. Доказательство. Доказательство утверждений (1) — (4) очевидно, и мы оставляем его читателю. Для того чтобы доказать утверждение (5), заметим, что из того, что у eS1, следует, что у GE Мх для каждого zES. Поэтому П{МХ}, xes т. е. S является пересечением замкнутых подпространств, а значит, и само — некоторое замкнутое подпространство. Рассмотрим теперь утверждение (6). В силу (5) 5“L1 = есть некоторое замкнутое линейное подпространство, которое в соответствии с утверждением (4) содержит S. Обозначим через М наименьшее замкнутое линейное подпространство Н, содержащее S. Тогда S11 Z) М. Попытаемся теперь выяснить, из каких же элементов состоит М. Так как М — некоторое линейное подпространство и содержит к тому же S, то оно, очевидно, должно содержать все конечные линейные комбинации элементов S. Из-за того, что М замкнуто, оно должно содержать и все пределы последовательностей, составленных из элементов того же вида. Но, с другой стороны, легко проверить, что это последнее множество является замкнутым линейным подпространством, содержащим S. Поэтому М — это множество всевозможных векторов х = lima:n, где хп — не-71-*ОО которая конечная линейная комбинация векторов из S.
Но отсюда следует, что если у 51, а х = lim хп — произ-71—*ОО вольный вектор из М, то (х, у) = lim < хп, у) =0, так что п-»оо у GE М1. В силу утверждения (3) М1 С 51, откуда и следует, что МЛ = S1' Таким образом, S и замкнутое подпространство, им порожденное, имеют одинаковое ортогональное дополнение. Собирая полученные факты воедино, мы сведем утверждение (6) к следующему. Лемма В. Если М — замкнутое линейное подпространство Н, то М11- = М. Доказать эту лемму можно непосредственно, но это заняло бы довольно много места и потребовало бы определенных усилий. В то же время гораздо более простое доказательство опирается на теорему Хана — Банаха, с которой мы познакомимся в § 3.2. В связи с этим мы предпочитаем отложить доказательство леммы В до изучения этой теоремы (упражнение 12 § 3.2). Прежде чем переходить к доказательству следующей теоремы, исследуем вкратце введенные выше понятия на примере трехмерного евклидова пространства Е3, Если отожествить вектор х = = (хх, х2, х3) из Е3 с направленным отрезком прямой, соединяющим начало координат с точкой (хх, х2, х3), то ясно, что (одномерным) подпространством, натянутым на вектор х, является вся эта прямая, заданная двумя своими точками. Аналогично (двумерное) подпространство Е3, натянутое на векторы х = (агх, х2, х3) и у = (ух, у2, i/з),— это плоскость, проведенная через три точки с координатами (0, 0, 0), (хь х2, х3) и (уь у2, у3). Более того, мы знаем, что каждый вектор из Е3 может быть представлен совокупностью своих координат вдоль осей х, у и z соответственно. И вообще говоря, мы можем осуществить аналогичную декомпозицию каждого вектора из Е3 относительно любых трех взаимно ортогональных векторов Е3. Точно так же мы можем выбрать любую плоскость L, проходящую через начало координат, а затем разложить любой вектор из Е3 в сумму векторов, один из которых принадлежит L, а другой — ортогонален L. Другими словами, Е3 = L ф L1. (Таким образом, мы видим, что по отношению к прямой сумме определяет то, что осталось в £3, а значит, используемое название «ортогональное дополнение» вполне оправдано.) Имея в виду тот факт, что наше абстрактное определение гильбертова пространства было рассчитано на то, чтобы впитать в себя все «существенные» свойства Е3, естественно ожидать, что если Н — некоторое гильбертово пространство, a L — его линейное подпространство, то пространство Н удастся представить в виде Н = L ф [Л. Поскольку при любых L L Q — {0}, то нам остается получить ответ на единственный вопрос: охватывает ли L ф все Н или нет? Очевидно, это то же самое, что спросить:
можно ли каждый вектор х из Н записать в виде х = у + z, где I/ £ a z Е Если не требовать, чтобы подпространство L было замкнутым, то можно построить примеры, дающие отрицательный ответ на этот вопрос. Что же касается замкнутых линейных подпространств, то для них справедлива следующая теорема. Теорема Е (о проекциях). Пусть L — некоторое замкнутое линейное подпространство И. Тогда каждый вектор х из Н однозначным образом может быть представлен в виде суммы х = у + z, где у ЕЕ L, a z ЕЕ А1 (вектор у называется проекцией х на L), Доказательство. Однозначность такого представления доказывается тривиальным образом. В самом деле, если я = I/ + z, у ЕЕ L, z ЕЕ ZA, х = у' + z', У' ЕЕ L, z' ЕЕ L\ .— два возможных представления х, то вектор у — yf = z — z' одновременно принадлежит и L, и L\ а в силу утверждения (2) леммы Б это значит, что у' — у = 0 = z' — z. Итак, как уже отмечалось выше, достаточно показать, что Н = L ф /А. Но если равенство М = L ф L1 справедливо, то L ЕЕ М и /А CZ М, откуда М^ЕЕ L и ЕЕ L\ так что М1 = = {0}. Следовательно, М^1- = Н, и нам остается только доказать, что множество М замкнуто (после чего мы сможем воспользоваться леммой В). Предположим, что х — некоторая предельная точка из М. Тогда найдется такая последовательность {хп} из М, что хп -> х. Но каждое хп можно представить в виде хп = уп + zn, где уп ЕЕ L, zn ЕЕ L-Е Так как %п %in || 2 ~ || (Уп Ут) (zn %т) || 2 “ = || Уп — Ут II2 -И II Z„ — Zm ||2 > || уп — ут ||а, то {Уп} — последовательность Коши в линейном пространстве L, И в силу замкнутости L уп~+ у ЕЕ L. Аналогично zn -> z ЕЕ Однако в этом случае из равенства kn - (у -г Z) II2 = Й уп - у II2 + II zn - Z ||2 следует, что х = lim хп = у + z, значит, х GE М, что и требова-п->оо лось доказать. Замечание 1. Теорема о проекциях, без сомнения, несет в себе информацию об одном из самых важных свойств гильбертовых пространств. Его значение мы по-настоящему почувствуем только впоследствии. Здесь же мы хотим лишь подчеркнуть, что правильно будет рассматривать гильбертово пространство как банахово
пространство с нормой, достаточно «хорошей» (т. е. порождаемой скалярным произведением) для того, чтобы обеспечить состоятельность и полноценность теоремы о проекциях. Замечание 2, Теорема о проекциях может быть положена в основу одного полезного метода доказательства эквивалентности двух замкнутых подпространств L и М. Предположим, что уже известно, что L CZ М. В этом случае L — М тогда и только тогда, когда из условий х & М и х | L следует, что х = 0. В частности, если S есть некоторое множество векторов из Н и если из условия <х, s> = 0 при любых s £= 5 следует, что х = 0, то замыкание линейного многообразия L (5), натянутого на 5, совпадает с ZT. Замечание 3. Пусть М — некоторое замкнутое линейное подпространство Н. Теорема о проекциях гарантирует существование для каждого х GE Н такого единственного вектора у GE М (проекции х на 7W), что х-уЕ М±. Мы рекомендуем читателю самому доказать, что у удовлетворяет соотношению IIх - у К Ях - т II, где т — произвольный элемент М. И наоборот, если у ЕМ удовлетворяет этому условию, то у = у'. Это значит, что проекцию х на М можно охарактеризовать как такой вектор из М, который ближе всего к х. Замечание 4. Обратим наше внимание еще раз на проблемы, сформулированные в обсуждении (см. стр. 66). Примем, что для непрерывной системы, описываемой уравнением (2), или дискретной системы, описываемой уравнением (3) из § 1.4, функции W (tf, t) или W (tf, tn) являются элементами гильбертовых пространств L2 (а, Ь) и 12 (а) соответственно. Обозначим через Н то из этих пространств, которое нам понадобится (в дальнейшем мы не будем делать различия между дискретным и непрерывным случаями). Тогда уравнения, описывающие наши системы, могут быть представлены в следующем виде: х = <u>, и>. (3) Рассмотрим теперь некоторый фиксированный элемент | ЕЕ R. Для системы, описываемой уравнением (3), найдем такой элемент G Я, что | = <1Р, и> (4) и одновременно его норма минимальна на множестве всех элементов, удовлетворяющих условию (4). Эта простая задача теории оптимального управления может быть решена практически сразу. Действительно, ее решение имеет вид и । = kw. (5)
где скаляр к определяется соотношением к = (6) Для того, чтобы убедиться в том, что это управляющее воздействие действительно оптимально, нам достаточно было бы в рассуждениях предыдущего параграфа положить р = 2. Другое доказательство сводится к следующему. Разложим Н в прямую сумму Н = L (w) ф М (w). Тогда для каждого и (= Н справедливо однозначное представление и = Ui + и2, где их (= L (ш), и2 | иг. Заметив теперь, что <U>, U> = <1Г, Uj + u2> = UY) + (a;, u2> = (w, ur) + 0 и что ||u|| = ||Will + IIu2||, получим Ы<14 Поэтому, если можно было бы найти такое и е L (и;), которое удовлетворяло бы условию (4), то это управляющее воздействие и было бы оптимальным и %. Уравнения (5) и (6), очевидно, определяют такое управляющее воздействие. Для большей ясности выпишем в развернутом виде решение этой задачи для непрерывной системы. Ее управляющее воздействие в момент времени t ЕЕ tf) должно определяться выражением МО = 5 [ '$ I (th S) I» ds]’1 w (tf, t). fo Решением же дискретного варианта этой задачи должно быть управляющее воздействие, удовлетворяющее в момент времени ЕЕ о уравнению udM = 5 [31W (tf, Ы I’]'1 W (tf, tj. (J Задача, сформулированная и решенная таким образом, является всего-навсего простейшим прототипом того, что обычно называют проблемой управления с минимальным расходом энергии. Использование термина «энергия» в сочетании с гильбертовыми пространствами является следствием того, что энергия,
выделяемая током i на сопротивлении Я, определяется по формуле ь R § i2 (t) dt = R (i, i). a В главе 4 мы увидим, что некоторые сложные примеры задач управления с минимальным расходом энергии могут исследоваться практически так же просто, как и в этом примере. Произведения гильбертовых пространств. Новые гильбертовы пространства можно построить по уже имеющимся, образуя декартовы произведения. Если {Н^ — некоторое конечное множество гильбертовых пространств, то множество Н =HlxH2 X... ... X Нп проставляет собой линейное пространство, для векторов которого обычным образом определены операции сложения и умножения на скаляр. Если х = х2, ,,,, хп) и у = (yt, у2, ... ..., Уп) — Два элемента Н, то скалярное произведение на Н можно определить с помощью выражения п у> = 2 <*>> У1><» (7) i=l где через <#., у.) обозначено скалярное произведение векторов х. и у. из пространства Н., Определенное таким образом скалярное произведение называют естественным. Проверка того, что естественное скалярное произведение удовлетворяет аксиомам скалярного произведения, не представляет никакого труда. Норма, порождаемая в Я, очевидно, принимает следующий вид: п 1=1 а неравенство Коши — Шварца преобразуется к виду Для того чтобы показать, что по отношению к естественному скалярному произведению пространство Н полно, заметим, что если {х', ..., х\ ...} есть некоторая последовательность Коши, то из соотношения п hm-zp||2= 2к1т-^Р112<е», n,p>N0, (8) 1—1
следует, что ||а£* — х?||. < е, i = 1, п, п, p>N0, и что составляющие последовательности также представляют собой последовательности Коши. Но так как составляющие пространства Н. полны, то последовательности {х?}, i = 1, ..., п, должны сходиться к пределам i = 1, ..., п. Цоэтому, переходя к пределу при р -> оо в уравнении (8), получим, что п Ь’п-2||а = ЗкГ-<М,<еа, m>N0, что справедливо при любом г, начиная с некоторого NQ (е). А это значит, что хп -> (.гп ..., 7П) 6Е Н. Предложенное определение скалярного произведения на декартовом произведении гильбертовых пространств ни в коем случае нельзя считать единственно возможным. В упражнениях мы познакомимся с несколькими другими возможными определениями, которые часто оказываются полезными для приложении. Упражнения 1. Пусть и {yj} — два произвольных конечных множества в гильбертовом пространстве Н. Докажите, что при произвольных скалярах {aj и {pj} справедливо уравнение <2^- 3 <хда>- i j ij Пусть H — конечномерное пространство с базисом {ej. Покажите, что скалярное произведение произвольных элементов х = и у = 2pjej из Н полностью определяется как скалярное соотношение <®, У> = 2 V в котором ktf = <q, еу>. 2. Обозначим через < , > скалярное произведение, определенное на некотором линейном пространство X. Покажите, что <х, у> = <х + у, х + уУ — <х — у, х — уУ, если X вещественно, и что У> — <х + у, х +'!/> — <х — у, х — уУ + + < [<*+ х + iy> — <х — iy, х — если X комплексно. Покажите, что если <я, хУ — 0 для х (= М, где М — некоторое линейное подпространство X, то для всех у GE М справедливо соотношение (х, уУ — О. 3. Докажите теорему В при условии, что В — это вещественное банахово пространство.
4. Пусть х, у, z и со — четыре элемента гильбертова пространства Н. Покажите, что ||X- z|H|y-w|) <k- !Z||-h-w|| + ||у- z || • || х — со ||, В каком случае выписанное неравенство переходит в равенство? 5. Пусть {яр ..., агп} — некоторое линейно независимое множество в Н. Определим в виде <яь л> . . . <xi, агп_1> х, Ч’п = ’ <хл, Х1> • . . <ТП, хп Покажите, что <i|'n, = 0, если к < п, и что <ipn, хп> Лп - определи- телю Грама этого множества. Покажите также, что <фЛ, фп> = АП_1АП. Наконец, установите, что функции XI е1"ИИ’ / = 2-"л’ образуют ортонормальное множество, на которое можно натянуть L (xv... • • • ♦ Xft). 6. Завершите доказательство леммы Б. 7. Пусть S — любое непустое множество Н. Покажите, что 1.6. Литератора к главе 1 Материал главы 1 охватывает широкий круг математических вопросов, а наше изложение, по необходимости, было ограниченным как по тематике, так и по глубине изложения. Поэтому мы обращаем внимание читателя на приложения 1 и 2, относящиеся к материалу этой главы, на которые мы время от времени ссылаемся в других главах книги. Кроме этих приложений, читатель может обратиться к множеству прекрасных учебников, относящихся к тем или иным затронутым здесь вопросам. Часть материала глав 1 и 2 наппсана под сильным влиянием великолепного учебника Симмонса [А.77]. Кроме того, по своему уровню и по выбору материал этой главы тесно связан с книгами Колмогорова и Фомина [А.49], Шилова [А.76] и Вулпха |А.93|. На аналогичном уровне написаны книги Фридмана [А.30], Гер цел я и Трэлли [А.32], Гильдебрандта [А.40] и Индрптца [А.44], но они освещают другие возможности применения. Несколько на более высоком уровне находятся полезные монографии Ахиезера и Глазмана [А.2], Дьедоппе [А.21], Данфорда и Шварца [А.22, А.23], Люстерника и Соболева [А.56], Рисса и Секефальви-Надя [А.72], Тейлора [А.83] и Хилле и Филлипса [А.41]. В качестве дополнительной литературы по более широким вопросам, примыкающим к материалу §§1.1 и 1.2, можно рекомендовать вводные книги Андерсопа и Холла [А.4], Арнольда [А.6], Бартла [А.9] и Курнатовского (А.54]. По вопросу о линейных пространствах дополнительно следует прочесть книги Халмоша [А.35], Мирского [А.62], Неринга [А.64] и Столла [А.81]. О банаховых и гильбертовых пространствах можно прочесть не только в общих монографиях, цитированных выше, но и в книгах Банаха [А.8], Халмоша [А.36], Лорха [А.57] и Натансона [А.63]. Если же читатель захочет полнее ознакомиться с теорией интеграла Лебега, то ему следует обратиться к книгам Халмоша [А.37], Хартмана и Минусинского [А.39], Колмогорова И Фомина [А.50], Натансона [А.63], Рудина [А.73] и Уильямсона [А.94].
ГЛАВА 2 ПРЕОБРАЗОВАН И Я 2.1. Функции Понятие функции лежит в основе всего анализа. В своей наиболее привычной форме — это некоторое правило, связывающее элементы одного множества вещественных чисел с элементами другого. Например, формула у = х3 описывает функцию или функциональное соотношение. На самом же деле мы понимаем это равенство как некоторое правило, утверждающее, что с каждым вещественным числом х мы связываем другое вещественное число, а именно э?. Этот процесс или эту формулу (возведения в третью степень), определяющие характер такой связи, мы и называем функцией. Конечно, описать функцию с помощью простого явного алгебраического выражения удается лишь в очень незначительном числе случаев. Некоторые из функций, не описываемых такими формулами, встречаются настолько часто, что для них построены высокоточные таблицы и придуманы специальные стандартные названия, например sin х или 1g х. В главе 1 мы пользовались понятием функции, не затрудняя себя строгим определением. Ведь когда речь идет о временных последовательностях или функциях времени, часто удается обойтись одними интуитивными представлениями. Однако для того, чтобы рассматривать систему как некоторую функцию, нам понадобится совершенно строгое определение. Определение, которым мы будем пользоваться, представляет собой лишь незначительное обобщение классического определения, очерченного в первом абзаце этой главы. Определение А. Пусть X и Y — произвольные непустые множества. Соответствие f, связывающее с каждым элементом х, принадлежащим некоторому подмножеству Dj множества X, некоторый элемент у EY, называется функцией, отображающей X в Y. Подмножество D f CZ X, на котором эта функция определена, называется областью определения функции. Подмножество Rf CZ.Y, состоящее из точек, соответствующих некоторым х G= Df, называется областью значений этой функции. Например, оценки участникам соревнования по гимнастике можно рассматривать как некоторую функцию, связывающую оп-
ределенное вещественное число с выступлением каждого участника. Здесь X может обозначать множество людей, занимающихся гимнастикой, Df — множество гимнастов, участующих в данном соревновании, Y — множество вещественных целых чисел 0 п 100, a Rf — множество всех выставленных оценок. В качестве второго примера предположим, что X — это множество всех квадратов на плоскости, а У — это множество расположенных на той же плоскости окружностей. Мы можем определить функцию у ~ / (х), потребовав, чтобы правило / связывало с каждым квадратом х (Е: X окружность у Е: У, в него вписанную. В этом случае Df = X к Rf = Y. В определении А фигурируют три математических объекта: два непустых множества и правило, связывающее каждый элемент некоторого подмножества X с единственным, однозначно определенным элементом у&У. Символическая запись /:Х->У задает функцию с правилом /, областью определения Df CZ X и областью значений Rf CZ У. Такое обозначение оказывается полезным, поскольку оно выделяет все существенные составляющие понятия функции, как сложного математического объекта, и подчеркивает, что центральную роль здесь играет правило /. Если из конкретного контекста ясно, каковы множества X и У, или если нет никакой необходимости в явном виде указывать, что это за множество, то обычно запись /: X -> У сокращают и пользуются лишь символом /. При этом говорят тоже только об / (не упоминая множества X и У). В других случаях удобней пользоваться обозначением х -> f (х). Элемент у множества У, связанный функцией / с элементом х е Df, называется образом точки х. Если J/ЕУ и у = f (х), то элемент х называют прообразом точки у. У каждого элемента х ЕЕ Df должен быть единственный образ у ~ У. В то же время у каждого у е У может быть и несколько прообразов. Естественным обобщением понятия образа элемента является понятие образа множества элементов. Определение Б. Пусть задана некоторая функция f: X-> У. Для каждого подмножества А из Df подмножество В = {у ЕЕ У : / (х) для некоторого х из А} называется образом А, определяемым функцией f. Мы записываем это в виде R = f (А), чтобы показать, что В — это образ множества А. Функцию часто называют отображением, преобразованием или оператором. Все эти термины кажутся оправданными в том смысле, что функцию можно считать переводящей некоторую точку х €= Df в точку / (х) ЕЕ У. Аналогичным же образом можно считать, что подмножество A CZ Df переводится в подмножество В CZ Rf с помощью отображения / (А) = В. Для графического представления этих идей зачастую полезна диаграмма, показанная на рис. 2.1.
Нам удалось успешно определить понятие функции, не прибегая к графическим представлениям. Но так как кривые и графики являются частью нашего интуитивного наследия, то интересно было бы посмотреть, какое место занимают они в рамках развиваемой абстрактной схемы. Определение В. Пусть f: X Y. Подмножество Gf = = {(#, У): У €= f (х), х ЕЕ Df} множества X X Y называется графиком f. Рис. 2.1. Функция как преобразование/ Определение В часто полезно рассматривать как исходное определение функции. Предложение «функцией называется некоторое множество упорядоченных пар, в котором нет двух различных пар с одинаковыми первыми координатами», очевидно, проще определения А и в то же время содержит ровно столько же информации. С этой новой точки зрения функция и ее график неразличимы. Все эти понятия иллюстрируются рис. 2.2. Заметим, что если X и Y — множества, a Gf — некоторое заданное подмножество X X Y, то Gf может служить графиком некоторой функции /: X -> Y только в том случае, если, каково бы ни было х ЕЕ Df, в подмножестве Gf найдется один и только один элемент вида (х, у). Или если говорить более вольно, Gf может служить графиком некоторой функции /: X —> Y только в том случае, если для каждого xEDj «вертикальная» прямая, проходящая через х, пересекает Gf лишь в одной точке. Две функции / и g называются совпадающими, если их области определения одинаковы и для каждого х из этой общей области определения / (х) = g (х). В терминах их графиков функции / и g совпадают тогда и только тогда, когда эквивалентны множества Gf и Gg. Функция /: X -> Y, у которой Df X, называется
отображением X в У. Этим мы хотим подчеркнуть, что / (X) cz ст У. Если же на самом деле / (X) = У, то / называют отображением X на У *). В обоих случаях множество У называют множеством (или пространством, если это соответствует действительности) возможных значений, а множество / (х) — просто областью значений. Таким образом, для накрытия (так еще называют сюръективное отображение) множество возможных значений и область значений совпадают. Рис. 2.2. Функция как множество упорядоченных пар. Определение!1. Функция f: X -> У называется взаимнооднозначной, если из равенства f (х) / (х') следует, что х = х', каковы бы ни были х и х' из Df. Таким образом, функция /: X -> У взаимно однозначна, если для каждого yEzlij найдется только одно х ЕЕ D f такое, что / (я) = У- Если функция f: X -+Y одновременно является накрытием и взаимно однозначной **), то для нее можно определить обратное отображение /-1: У —X, связывающее с каждым у из У тот единственный элемент х из Df, для которого / (х) = у (существование и единственность такого х гарантируются взаимной однозначностью / и тем, что / (х) у). Другими словами, f~l (у) -- х- Ясно, что описанная процедура определяет функцию отображающую У в X, в соответствии с определением А. Если же в качестве основного принять определение «функции» через подмножество упорядоченных пар, то У”1 — это просто-напросто множество таких упорядоченных пар (у, х) 6= У X X, *) Такое отображение называют еще сюръективным. {Прим. редЕ **) Такое отображение иногда называют еще биективным или наложением. {Прим, ред.)
для которых (х, у) ЕЕ С геометрической точки зрения функция /: У -> X есть обратная в том и только в том случае, когда для каждого у из У «горизонтальная» прямая (в X X У), проходящая через у, пересекает Gf только в одной точке. Уравнение х ~ У"1 (у) получается в результате решения уравнения у = / (х) относительно х точно таким же образом, каким выражение х ~ = In у является результатом решения уравнения у = ех относительно х. Определение Д. Пусть / — некоторая взаимно однозначная функция с областью определения Df CZ X и областью значений Rf = У. Если Gg = {(у, х) ЕЕ Y X X: (х, у) ЕЕ Gf}, то g — взаимно однозначная функция с областью определения У и областью определения Rg = DfEL X. Эта функция g называется обратной по отношению к функции / и обозначается через У"1. Новичкам часто трудно не запутаться в разнице между функцией и ее значениями. С этой точки зрения о функции лучше всего думать как об отображении или графике. Значением функции в точке х CZ Df служат элемент у = у (х) CZ Rf. Так, говоря о пространстве С (а, Ь), мы можем утверждать, что х ЕЕ С (а, Ь), если ее значения в точке /ЕЕ [а, Ы задаются, например, уравнением х (/) = t2. Однако во многих случаях единственная возможность определить функцию состоит в том, чтобы выписать все ее значения {У (х)} по мере того, как х пробегает область определения Df. Функция У: X -> У называется постоянной, если имеется такая фиксированная точка I/ ЕЕ У, что У (х) = у, каково бы ни было х ЕЕ Df. Функция У: X -> У называется тождественной (на X) и обозначается через I (или 1Х), если f (х) = х, каково бы ни было хе х. Композиция функций. Рассмотрим две функции t -> х и х -> у, значения которых задаются следующими формулами: х (/) = 2л/ — 5, /Е [0, tf], у (/) = sin х, х ЕЕ [ — оо, сю]. Из этих двух функций можно построить их композицию, т. е. образовать третью функцию t -> у вида у (/) = sin (2л/ — 5), /ЕЕ [0, /у]. Этот простой пример композиции двух функций должен подготовить нас к обсуждению более общего случая. Определение Е. Пусть ft X -> У и g: У -> Z суть функции, для которых Df = XuDg = Y. Композицией функций fug называется отображение, связывающее с каждым элементом хЕ X элемент z = g [f (х)] ^Z, Эта новая функция обозначается через h = gf - X Z.
Другими словами, в композиции функций элемент х е X отображается с помощью / в некоторый элемент f (х) е У, а этот, уже в свою очередь, отображается в z = g [f (я)] G= Z. Функция h: X -> Z является, таким образом, композицией функций /: Х->У и g:Y Z для каждого хЕ X и h{x) = g [f (х)], как это и показано на рис. 2.3. Заметим, что два отображения, фигурирующие здесь, не вполне произвольны, поскольку множество У, содержащее область значений первой функции, должно быть одновременно и областью определения второй. И вообще говоря, произведение (композиция) двух отображений имеет смысл только тогда, когда область значений первого из них содержится в области определения второго (или если предполагается, что первая функция сужена таким образом, что ее областью определения считается лишь множество A CZ Df, для которого справедливо соотношение / (4) = Rf Г| Г| D б). В композиции gf мы всегда будем считать первым отображением функцию /, а вторым — g. Понятие композиции двух функций можно распространить на случай любого конечного числа функций. В любом случае область значений каждой функции, участвующей в композиции, должна содержаться в области определения последующей функции. Как отмечалось выше, для функций, которые являются взаимно однозначными и накрытием, можно определить обратные. Обращаясь к случаю сложных функций (результатов композиции), мы можем следующим образом перефразировать определение Д. Пусть функции /: X -> У и g'.Y-+X заданы. Функция / называется обратной по отношению к g, а функция g — по отношению к /, если g [f (z)l х и f [g (у)] ---= у, каковы бы ни были х Е- Df --- Rg и у ЕЕ Dg =- Rf. В этом случае функции / и g называют взаимно обратными и говорят, что они обратимы. Пусть i: X X и j :Y -> У — тождественные функции, определенные на Df и Dg соответственно. Тогда утверждение «/: X -> У и g: У->Х— взаимно обратные функции» эквивалентно следующему: «g/ = i и fg = j»t
Докажем теперь, что все эти предложения действительно эквивалентны утверждению, что обе функции / и g взаимно однозначны и являются накрытиями. Предположим, что эти предложения верны и что / (jq) = / (х2) для некоторых хг и х2 €= Df. Тогда хг = g [f (jq)] = g [f (x2)] = x2, и, следовательно, / — взаимно однозначная функция. Для того чтобы показать, что f — это накрытие, предположим, что у G Rf- Тогда g (у) EF Df и / I# (*/)1 = У- Поэтому, если положить х — g (у), то у = / (х), и, следовательно, / — это накрытие. Обе эти функции можно затем поменять ролями, так как определения обратных функций симметричны по отношению к ним. Поэтому функция g: Rf-+ Df также взаимно однозначна и является накрытием. Выше мы доказали необходимость взаимной однозначности и сюръективности (в противном случае нам удастся определить У"1 лишь на Rf) функции /: X -> Y для того, чтобы у нее существовала обратная. Нетрудно показать, что это условие является и достаточным. Более того, можно показать, что функция g: Y X определяется единственным образом. Пример 1. Пусть X = {j:0 а У = R, т. е. совпа- дает с пространством вещественных чисел. Определим / с помощью соотношения / (х) = х2 для любых х(Е:Х. В этом случае ясно, что эквивалентным определением было бы / = {(я, у): у = х2 и х ЕЕ X}. (Так задается график / в соответствии с определением Г.) Ясно, что областью значений / (х) этой функции является замкнутый промежуток 0 у 4. Более того, функция / определяет взаимно однозначное отображение X на / (X) и, следовательно, имеет обратную функцию У'1. Нетрудно видеть, что функция У"1 определена на промежутке 0 у 4 и связывает каждое у с положительным значением своего квадратного корня. Точно такое же соответствие х -> х2 задает функцию, определенную на х = {х\ — со значениями из Y = R. Однако теперь g (X) представляет собой промежуток 0 у 1, а область значений обратного отображения g'1 является собственным подмножеством X. Формула х Ух, очевидно, не задает функции, определенной на промежутке — 1 х 1. Пример 2. «Функцией Дирихле» называется отображение У пространства R в /?, удовлетворяющее условию: . __ [1, если х рационально, I \х) — |0, если х иррационально. Пример 3. Для каждого х из [0, 1] уравнение ех (У) = f (х) определяет функцию ех, отображающую С (0, 1) в пространство комплексных чисел (функцию ех часто называют «значением в точке х»).
Если Е — некоторое подмножество метрического пространства X, то уравнение р (х; Е) = inf {р (х, у): у G Е} задает вещественную функцию х-+р(х,Е), определенную на X. Пример 4. В системах, использующих цифровые элементы, важную роль играют операции «квантования по времени» и «экстраполяции». Напомним, что через В (т) мы обозначаем класс ограниченных скалярных функций, определенных на т (см. пример 7 из § 1.4). Пусть а = {^: к — 1, ..., и}, где tk < — некоторое упорядоченное подмножество [а, Ы. Тогда, если х ~ = В (a, b), a Y = В (о), то операцию «квантования по времени» можно описать некоторой функцией, отображающей X в Y и определенной для каждого х е= X условием (Sx) (/R) - х (^), t* <= а. (1) Аналогичным образом, экстраполяция нулевого порядка (или запоминание) — это преобразование С из Y в X, определенное условием (Су) (0 = у (tk), t G Un, Zk+1l, tk e a, (2) для каждого у EE Y. Пример 5. Преобразование Т: С (0, 1) -> С (0, 1) можно определить, потребовав, чтобы образом / из С (0, 1) при действии Т была функция, значение которой в точке / ЕЕ [0, 1] равняется (s) ds. Другими словами, Tf — это элемент пространства о С (0, 1), определенный условием t (T/)(0 = $/(s)ds, О Точно так же / -> (dldt)f — это преобразование пространства Сп (0, 1) функций с п непрерывными производными в пространство Сп-Х (0, 1). Теория интеграла Лебега как раз и занимается расширением области определения отображения <р, первоначально задававшегося интегралом Римана на пространстве С (0, 1): i q>(/) = $/Wdz’ о на более широкий класс функций. Этот более широкий класс Lx (0, 1) включает, например, функцию Дирихле, о которой мы уже говорили выше. Пример 6. Обозначим через W (/, s) квадратную матрицу n-го порядка, каждый элемент которой Wa (t, s) принадлежит
пространству В (т X т) (иными словами, (/, s) определены и ограничены для любых t, sGEt). Пусть для начала т = [а, 61, X = LPi (а, b) X ... X LPn (а, 6). Многомерная система с входным сигналом х = (хъ ..., rrn) ЕХ и выходным сигналом у = (у и •••» Уп) S X описывается уравнением t y(t) = (Fx)(t) = \W(t, s)x(s)ds, t(=[a, 6], (3) a и может быть отождествлена с функцией F: X -> X. В любой фиксированный момент времени f Е т значение у (/') выходного сигнала системы принадлежит Rn и соотношение tr у (f) = Тх = § W (f, s) х (s) ds (4) а определяет новое отображение Т: х -> Rn. Получить дискретные аналоги уравнений (3) и (4) нетрудно. Полагая] т = о и X = lPx (о) X ... X 1Рп (о), мы получим функцию F = X -> X, значение которой в момент tk СЕ о определяется по формуле к (Fx) (t^) = 2 W Gic» 0)^(0)» (5) j=0 а отображение T:x-+Rn задается следующим уравнением: к = (6) j=0 где точка ЕЕ а считается фиксированной. Предложенные два способа описания многомерных систем являются основополагающими, и к этому примеру мы еще будем неоднократно возвращаться в дальнейшем по мере изложения материала нашей книги. У пр ажнения 1. Пусть функция /: А -> В задана, и пусть X и Y — некоторые подмножества А. Докажите, что (а) / (х и У) = f (X) и f (У); (б) / (х п У) с f (X) n f (У); (в)) если функция /: А В взаимно однозначна, то / (X П У) = / (X) Q 2. Пусть / определяется уравнением / (х) = х2 — 1. Постройте график этой функции, а также ее области определения и значений для множества А = {х: | х | < 1}. Является ли функция / взаимно однозначной?
3. Обозначим через А множество положительных вещественных чисел. Для каждого a ЕЕ А обозначим через fa: R —> А функцию, заданную соответствием fa (х) = ах, X G Я, а через ga: А R — функцию, заданную соответствием йа (*) = logax, X А. Докажите, что для каждого а е А функции fa: R -> А и ga: А -> R взаимно обратны. 4. Пусть функция /: [—1, 1 ] -> R задается соответствием f (х) = = arcsin х, х ЕЕ [—1, 11» и пусть функция g: R -► [—1, 1] определяется равенством g (х) = sin х, х е R- Докажите, что эти две функции не взаимно обратны. 5. Напомним, что два отображения /: X -* У и g: X —* У считаются совпадающими (что записывается как / = g), если для каждого х из X справедливо / (х) = g (х). Пусть /, g и h — три отображения некоторого непустого множества X в самого себя. Покажите, что композиция (произведение) преобразований удовлетворяет свойству ассоциативности в том смысле, что / (^) = (/*) ь- 6. Пусть X — некоторое непустое множество, и пусть f и g — взаимно однозначные отображения X на себя. Покажите, что fg взаимно однозначное отображение X на себя и что (fk)"1 = g"*1/'1- 7. Предположим, что начальные состояния двух цепей, схемы которых показаны на рис. 2.4, задаются условиями q (0) = д0 и i (0) = io, где q — заряд на емкости. Опишите соотношения —» ез и ез -* е4 в виде функций. Если е2 ЕЕ С (0, оо), то что можно сказать об областях значений этих функций? Если две цепи связаны между собой так, что ез = е3, то описывается ли новая цепь функцией ei —► е3, получающейся в результате композиции двух исходных функций? Изменится ли ответ, если принять, что i0 = 0, 7о = 0? Какое неявное допущение с точки зрения физики содержится в понятии композиции функций? 8. Пусть о = Кк’» к = 1, 2, ...}, и пусть 1Г (о) — банахово пространство {х = (х (^), ..., х (^.),...); 2а х № I < °°}- В системе, рассматривающейся в этой задаче (рис. 2.5), импульсный элемент С, осуществляющий операцию Рис. 2.5. «квантование по времени», и «экстраполятор» S (см. пример 4) соединены друг с другом через первую из цепей упражнения 7. Можно ли такую систему описать композицией соответствующих функций? Какова область значений полученной сложной функции?
9. Пусть / — некоторое отображение множества X в множество У. Для каждого подмножества Е множества У обозначим через f~l (Е) подмножество X, определенное условием Г1 (Е) - {х е X: f (х) е Е}. Пусть А и В — подмножества У. Докажите следующие утверждения: (а) Г1М\В) = Г1(Л)\Г1(В); (б) Г1 (А П В) = ГЦА)‘ П Г1 (В); (в) Г1 (A U В) = ГЦА) U Г1 (В). Множество /-1 (Е) называется прообразом Е для отображения /. Обратите внимание на то, что соответствие Е -* /-1 (Е) всегда является вполне определенной функцией, отображающей пространство подмножеств У в пространство подмножеств X. Эта ситуация совершенно непохожа на ту, с которой связаны наши первые попытки использования символа Z"1 для обозначения обратной (в точке) функции, которая в общем случае может и не существовать. Однако если для / существует обратная функция, то для любого множества Е GZ У множество /-1 (Е) является образом Е в силу Z"1, независимо от того, в каком смысле мы понимаем символ /"х. 10. Пусть X и У — два непустых множества, и пусть / отображает X в У. Если А и В — подмножества X и У соответственно, то покажите, что (a) ft"1 (В) С2 В и /Г1 (В) = В выполняются для всех В тогда и только тогда, когда / — накрытие; (б) A О Z”1/ (Л) и Л = f"1/ (Л) справедливы для всякихтогда и только тогда, когда / взаимнооднозначно; (в) f (А! П А2) = f (AП f (Л2) справедливо для любых Аг и Л2 тогда и только тогда, когда / взаимно однозначно. И. Пусть через S обозначена операция съема данных из примера 4. Пусть S определена на пространстве С (0, 1), ах принадлежит области значений S. Из чего состоит множество 5”1 (х)? Непрерывные функции. С понятием «непрерывности» мы впервые сталкиваемся уже в классическом анализе. Рассматривая условие или условия, которым должна удовлетворять функция для того, чтобы ее можно было назвать непрерывной в точке гг0, мы приходим к необходимости строго сформулировать следующее утверждение: функция / непрерывна в точке гг0, если / (х) мало отличается от / (гг0), как только х оказывается достаточно близко к х0. Но что такое «мало отличается» и что такое «достаточно близко»? Оказалось, что вместо того, чтобы устанавливать какой-то эталон степени близости, гораздо удобнее потребовать, чтобы, какой бы степень близости / (х) и / (xQ) мы ни выбрали, ее все равно можно было бы добиться, выбрав х достаточно близким к гг0. В строгой формулировке функция /: R —> R называется непрерывной в точке XqEER, если, каково бы ни было е>0, всегда найдется такое S > 0, что, как только \х — гг0| < д, справедливым оказывается и неравенство |/ (х) — / (х0) | < е. Для теории систем наибольший интерес представляют функции, отображающие одно метрическое пространство в другое. Нижеследующее определение является естественным обобщением обыч-
\ ного определения непрерывности на случай, когда функция задана и принимает значения в соответствующих метрических пространствах *). ОпределениеЖ. Пусть XuY — метрические пространства с метриками pj и р2, соответственно, и пусть / отображает X в Y. Тогда функция / называется непрерывной в некоторой точке х0 из X, если выполняется одно из следующих эквивалентных условий: Для каждого е > 0 существует такое б > 0,чторг (х, xQ) < < 6р2 (/(*),/W) < е- с (2) Для каждого открытого шара о£ (/ (гг0)) с центром в точке f (х0) найдется некоторый открытый шар (rr0) с центром в точке х$ такой, что f (5g (r0)) cz Sz (f (#0)). Первое из этих условий является очевидным обобщением нашего исходного определения, в то время как второе оказывается более удобным для доказательства некоторых теорем. Мы предлагаем читателю самому убедиться в эквивалентности условий (1) И (2). Теорема А. Пусть XuY — метрические пространства, и пусть f: X -+Y. Функция / непрерывна в точке xQ€= X тогда и только тогда, когда / (хп) —>/ (х0) при хп —>х0. Доказательство. Предположим сначала, что функция / непрерывна в точке xQ и что {хп} — такая последовательность элементов X, что хп —>-гг0. Нужно показать, что / (хп) -+f (х0). Обозначим через Sz (f(xQ)) некоторый открытый шар с центром в точке / (х0). Поскольку функция / непрерывна, то существует такая открытая сфера 5g (rr0) с центром в точке гг0, что / (5g (х0)) с: cz Se (f (xQ)). Но хп ->я0, и, значит, все хп, начиная с некоторого N, п^ N, попадают внутрь 5g (xQ). А поскольку / (5g (х0)) <zz 5£ (/ (х0)), то все / (хп) при п > N оказываются внутри 5£ (/ (*о))- Это и доказывает, что / (хп) ->/(я0). Для доказательства необходимости предположим, что функция / не непрерывна в точке х0. Тогда найдется такой открытый шар 5е (/ (х0)), что образ любой открытой окрестности с центром в х0, полученный отображением /, не будет содержаться в ней. Рассмотрим последовательность открытых шаров S± (х0), 51/, (х0),... ..., S1/n (х0), .... Построим такую последовательность {хп}, что Хп (Е. 51/п (дг0) и / (хп) €£ Sz (f (х0)). Ясно, что хп сходится к а / (хп) не сходится к / (гг0). А это значит, что если / не непрерывна, то из хп ->х не следует, что / (хп) -+f (хп). Отображение одного метрического пространства X в другое называется непрерывным на X, если оно непрерывно в каждой *) Отметим, что наиболее общее понятие непрерывности функции формулируется в терминах топологического, а не метрического пространства. (Прим, ред.)
точке X. Точно так же, если X и Y — метрические пространства и /: X то / непрерывна на X тогда и только тогда, когда хп -+х =Ф / (хп) —>/ (я), каково бы ни было х ЕЕ X. Таким образом, непрерывное отображение одного метрического пространства в другое — это такое отображение, которое сохраняет свойства сходимости. Другим понятием, очень полезны^ для прикладных задач, является понятие равномерной сходимости. Читатель мог заметить, что в определении непрерывности функции в точке х() мы требовали, чтобы при любом 8 > 0 всегда можно было найти такое б > 0, что (ц (хр х0) < б => р2 I/ (х), / (х0)| < е0. Совершенно ясно, что б зависит от е. Не менее ясно, что в общем случае б должно зависеть и от дг0. Если же функция /: X ->У непрерывна на пространстве X, и если для каждого е мы можем найти такое б, которое одновременно удовлетворяет всем условиям во всех точках пространства (и в этом смысле не зависит от х0), то функцию / называют равномерно непрерывной. Строгая формулировка понятия равномерной непрерывности выглядит следующим образом. Определение 3. Если X и Y — метрические пространства с метриками рх и р2 соответственно, то отображение f: X ->У, Dt = X, называется равномерно непрерывным, если для каждого е > 0 всегда найдется такое б > 0, что рх (х, х) < < 6 «=> р2 (/ (х), / (#')) < е, каковы бы ни были х, х' ЕЕ X. Очевидно, всякое равномерно непрерывное отображение является непрерывным. Вещественная функция /, определенная на всей оси вещественных чисел R с помощью уравнения / (х) = = 2х, равномерно непрерывна. Но уже функция g, определенная на R соотношением g(x) = х2, непрерывна, но не равномерно непрерывна. Один важный тип равномерно непрерывного отображения, который часто встречается на практике, получил название изометрии. Определенней. Если X и Y — метрические пространства с метриками и р2 соответственно, то отображение X в Y называется изометрией (или изометрическим отображением), если рх (х, х') = р2 (/ (х), f (х')), каковы бы ни были х, х' ЕЕ Df. Если такое отображение существует для случая Df = X и Rf = Y, то мы говорим, что X изометрично Y. Совершенно ясно, что изометрия является взаимно однозначным отображением. Если X изометрично Y, то точки этих пространств могут быть приведены во взаимно однозначное соответствие таким образом, что расстояние между парами соответствующих точек одинаково как в одном, так и в другом пространствах. На самом деле, мы часто рассматриваем изометрические пространства как идентичные.
Например *), пусть {еп },?Li — некоторый ортонормальный базис (сепарабельного) гильбертова пространства Н. Равенство Парсеваля^показывает, что преобразование, ставящее в соответствие каждому х из Н последовательность его коэффициентов Фурье {уп}, является изометрией Н в 12. Пример 7. 11усть X — некоторое банахово пространство, и пусть /: X —> R определяется уравнением / U) = И- Воспользовавшись неравенством (см. § 1.4) I/ (*) - / (*n)l = I (М - к ID I < к - *4 найдем, что норма должна быть непрерывной функцией. Например, —> X || Хп || —► || X ||. На самом деле норма даже равномерно непрерывна. Пример 8. Пусть X — некоторое банахово пространство. Рассмотрим две последовательности хп ->1И уп -+у. Из соотношений II (хп + Уп) — (* + у)|| = II (Хп — х) + (уп — г/)|| < < ||*п — *1 + D'/п — У|| мы непосредственно найдем, что *п + Уп + У- Следовательно, операция сложения непрерывна. Пример 9. Пусть у — некоторый фиксированный вектор в гильбертовом пространстве Н. Отображение х -> (гг, уУ непрерывно. Пример 10. Функция точечной оценки eto (х) = х (Q (см. пример 3) является непрерывным отображением метрического пространства С (0, 1) в метрическое пространство С комплексных чисел. Заметим, что если {хп} — последовательность из С (0, 1), сходящаяся к ж, то при п —> оо sup |хп(/) — я(/)| —>0. В частности, | Хп (U Х (^о) | а это значит, что efo (х^ -+eto (х). Аналогичным образом читатель может убедиться в том, что функция, отображающая хЕЕС (0, 1) в функцию y(t) = § x(s)ds, является непрерывным отображением С (0,1) в С1 (0,1). С другой *) См. приложение 2.
стороны, функция Дирихле в каждой своей точке не^вляетсй непрерывной. / Определение К. Пусть функция / отображает метрическое пространство X в метрическое пространство р. Про функцию / говорят, что она удовлетворяет условию Липшица, на множестве S CZ Df, если существует такой вещественный скаляр О < М < ос, что Р2 U (*), / (!/)) < Мр! (х, у), каковы бы ни были х, у Ez S. Если М < 1, то отображение / называют сжимающим. Если / удовлетворяет условию Липшица на некотором множестве S, то мы называем функцию / липшицевой, а вещественный скаляр М — постоянной Липшица для /. Точная верхняя грань постоянных Липшица для / называется нормой Липшица для этой функции и обозначается через |/|s- Если вид множества и без того ясен, то индекс 5 можно отбросить. Итак, в соответствии со строгим определением |/|s = sup (р2 (/ (х,), / (х2))/р (хр х2): хп х2 S 5). В этом случае, когда X и Y — банаховы пространства, это выражение можно преобразовать к виду |/|s = sup {||f (xj — / (x2)|lIllx, — x2||: xlt x2 e 5}. Функция, отображающая одно банахово пространство X в другое Y, называется ограниченной на множестве S, если существует такая постоянная с > 0, что и (х)!|<с||х|1. каково бы ни было х е S. Теорема Б. Пусть S — линейное подпространство банахова пространства X. Если / — некоторая липшицева функция, определенная на S и принимающая значения из банахова пространства Y, то (1) из / (0) = О следует, что / на S ограничена; (2) / на S равномерно непрерывна. Утверждения этой теоремы очевидны из соотношения в/ (х) -/(y)|<|/|s • II X - у||. И в самом деле, утверждение (1) получается отсюда сразу, если положить у = 0, а утверждение (2) является прямым следствием определения 3 при 6 = e////s. Однако если не учитывать утверждения теоремы Б, то понятия непрерывности, ограниченности и липшицевости в остальном независимы. В качестве иллюстрации этого рассмотрим функцию
j- Ц —> Д. где / (х) = ах + Ь, а =f= 0, Ь 0. Функция / удовлетворяет условию Липшица и |//= |а|, но она не ограничена в окрестности х = 0. Точно так же функция х ->х2, определенная на В, непрерывна, но она не является ни равномерно непрерывной, ни липшццевой, ни ограниченной. Наконец, функция, определенная на 1П = [0,1] с помощью соответствия х ->х2, равномерно непрерывна, но не удовлетворяет условию Липшица. Упражнения 12. Пусть / — некоторое отображение метрического пространства X в метрическое пространство У. Докажите эквивалентность следующих утверждений: (а) / непрерывно; (б) У-1 (G) открыто в X, если только множество G открыто в У; (в) /-1 (F) замкнуто в X, если только множество F замкнуто в У; (г) для каждого подмножества ЕС У / (£) = / (£). (Здесь, как обычно, чертой сверху обозначена операция замыкания множеств в X или У.) 13. Пусть X и У — метрические пространства, а / — некоторое отображение X в У. Если У — постоянная функция, то покажите, что У непрерывна. Используйте этот пример для того, чтобы показать, что непрерывное отображение не обязательно должно обладать свойством, согласно которому образ каждого открытого множества должен быть открытым. 14. Рассмотрим систему с входным сигналом и и выходным сигналом х описываемую (в момент времени выражением xi (h) = \ W (Zi,T) и (т) dx. t Предполагая, что\ W2 (/j, т)с/т<оо, рассмотрим эту систему как некоторую •’о функцию, определенную на L2 (0, t) и принимающую вещественные значения. Покажите, что эта функция непрерывна. Если xQ — некоторая фиксированная точка в произвольном гильбертовом пространстве Я, то непрерывна ли функция У (х) = <х, х0>, х ЕЕ Я? Является ли опа равномерно непрерывной? 15. Определите, какая из перечисленных ниже функций равномерно непрерывна па открытом единичном промежутке (О, 1): 1/(1 — х); sin х; sin (1/х); х'!*, хя. А какая из них равномерно непрерывна на открытом промежутке (О, ее)? 16. Пусть У и g — функции, отображающие метрическое пространство X в себя, причем Df = X. Пусть f и g непрерывны на X. Покажите, что, каковы оы ни были произвольные скаляры а и 0, функции аУ + 0$ и fg непрерывны. Докажите также непрерывность на X полиномиальной функции h (х) = /п (х) + (х) + . . . + ai/ (х) + аох, хе X 17. Покажите, что функция f: 12 -* Л, определенная нах= (хп х2,...)С Е ° помощью правила /(«)=2 (где суммирование S' распространяется па все индексы, для которых |х,(^ 1), непрерывна, но не ограничена на любом шаре с радиусом, большим 1.
18. Пусть функции /, g и h описывают схемы о граничите л я/о дно пол у-периодного выпрямителя и двухполупериодного выпрямителя/характеристики которых показаны на рис. 2.6. Если каждая из этих фу нкшш определена на С (0, й), то каковы соответствующие области возможных значении? Какая из этих функций непрерывна, равномерно непрерывна, удовлетворяет условиям Липшица? На каких подмножествах каждая из этих функций взаимно однозначна? Опишите множества /-1 (z), g~* (z) и Л”1 (z), если z выбрано подходящим образом. 19. Повторите упражнение 18 для функций F и G (рис. 2.7), приближенно описывающих явление гистерезиса, и для более реалистичной модели & из § 0.1. Линия задержки Рис. 2.8. 20. Во многих реальных системах при передаче сигналов происходит запаздывание во времени. Опишите звено чистого запаздывания (рис. 2.8) (время запаздывания равно т) как некоторую функцию, определенную на (0, ti). 2.2. Линейные преобразования В этом параграфе мы сосредоточим наше внимание на одном специальном классе функций, определенных на линейных пространствах. Что же касается того, что свойства и представления линейных преобразований (так называются эти функции) играют
важную^роль почти на всех стадиях анализа, то это станет ясно по мере\1акопления новых фактов. Теория линейных преобразований мЬжет быть развита на самых различных уровнях, каждый из которых характеризуется своей степенью глубины, общности и требует своей математической подготовки. Наше изложение будет достаточно абстрактным для того, чтобы мы могли с пользой употреблять понятия, определенные в главе 1, и в то же время достаточно конкретным для того, чтобы его легко было связать с конкретными физическими задачами. Линейные преобразования обычно обозначают заглавными буквами. Значение некоторого преобразования А в точке х (или, как обычно говорят, результат преобразования А вектора х) обозначают через А (х) или Ах. Определение А. Пусть X и Y — два линейных пространства с общим множеством скаляров, и пусть А: X -+Y есть некоторая функция, определенная на X и принимающая значения из Y. Функция А называется линейным преобразованием X eY, если она обладает следующими свойствами: (1) A (xt + х2) = Axl + Ах2 для любых xt. х2 е= X. (2) А (ах) = аАх для любых х ЕЕ X и а. В соответствии с этим определением мы называем линейным преобразованием такую функцию, которая отображает одно линейное пространство в другое и обладает свойствами аддитивности (1) и однородности (2). Линейное преобразование некоторого линейного пространства X в себя (Y = X) называется (линейным) оператором, определенным на X. Если же Y — это множество скаляров, то А называют линейным функционалом, определенным на X. Пусть А — некоторое линейное преобразование X в У. Выясним, что может следовать из справедливости гипотезы аддитивности (1). Прежде всего, мы видим, что А (0) - А (0 + 0) - А (0) + А (0), и, следовательно, А отображает нулевой вектор своей области определения в нулевой вектор своей области значений. Аналогичным же образом для любого х ЕЕ X 0 - А (0) - А (х — х) - А (х) + А (—х), откуда следует, что А (—х) = — А (х). Так как А (пх) = А (х + х + ... + х) == А (х) + А (х) + ... + А (х). то легко видеть, что А (пх) = пАх. если только п — положительное и целое число. Так как А (— пх) = А (п (—х)) nA (—х) = — пЛ (х),
то последнее утверждение справедливо и для отрицательных целых чисел. Далее, из A (х)=А [п (1/п)х] = 1пА (1/и) ху следует, что Л[(1/п)х] = (1/п)Лх, и, наконец, если r=mln—любое рациональное число, то / А (гх) = а(п-^- xj = nA х^ = гА^х). Возникает естественный вопрос: а не получается ли так, что любая аддитивная функция, определенная на линейном пространстве, автоматически оказывается и линейной? Недолгое размышление показывает, что если X комплексно, а относительно А предполагается, что оно лишь аддитивно, то этого еще недостаточно для того, чтобы утверждать, что А линейно. Действительно, функция преобразующая вектор из одномерного комплексного линейного пространства С в комплексно-сопряженный, обладает свойством аддитивности и тем не менее не является линейным преобразованием. Отрицательным может быть ответ и в том случае, когда X вещественно, но причина этому гораздо более тонкая. В настоящее время мы ограничимся лишь утверждением, что даже в простейшем из вещественных линейных пространств — в R — имеется много аддитивных функций, не являющихся линейными преобразованиями. Заинтересовавшийся читатель найдет необходимые ссылки и краткий анализ причин этого в книге Боаса [А.И, стр. 108]. В том случае, когда А определено лишь на некотором подпространстве X, мы, как обычно, обозначим через DA область определения А. Обратим внимание читателя на то, что определение А требует, чтобы DA всегда было некоторым линейным подпространством линейного пространства X. Область значений А обозначим через НА и определим условием RA -- {у: у ~ Ах, tEDa}. Символом Na обозначается нуль-подпространство (или ядро) преобразования А: Ал = {х\ х ЕЕ Da, Ах — 0}. Легко видеть, что NА — это некоторое линейное подпространство X. Теорема А. Пусть /1 — некоторое линейное преобразование с областью определения DA CZ X и областью значений RA CZ Y (где X uY—линейные пространства). Тогда RA—линейное подпространство Y. Доказательство. Пусть у19 у2 GE RA, и пусть а — некоторый скаляр. Нам нужно доказать, что ух + Уг и «Ух принадлежат Ra. Но так как ух ЕЕ 7?л, то должен существовать такой вектор Ti GE DЛ, что Axv = z/р Точно так же должен существовать и вектор х2 СЕ Т)А такой, что Ах2 Уг- Однако преобразование А
ЛйнейноХи, следовательно, А + х2) = Ахг + Ллг2 = уг + J/г, a A (axj) ^аЛ^ = az/p так как хх + хг СЕ DA и €= DA, и т. д. В § 2.1\мы познакомились с понятием непрерывности, и это понятие, очевидно, без всяких изменений можно перенести на нынешнюю ситуацию. Однако мы с самого начала хотим подчеркнуть, что 'непрерывность преобразования Л: X -+Y — это непрерывность по норме. Другими словами, мы считаем преобразование Л непрерывным в точке zE Л, если || Ахп — Ах|| —► 0 каждый раз, когда {#п} — некоторая последовательность из X такая, что ||л:п — х[| ->0, в отличие от общего случая, где непрерывность определяется сначала «в точке», а затем уже для всего пространства «в целом». Следующая теорема показывает, что для установления непрерывности линейного преобразования «в целом» достаточно выяснить его непрерывность в произвольной единственной точке. Т е о р с м а Г>. Если Л — линейное (или просто аддитивное) преобразование X в Y и если Л непрерывно в некоторой точке xQ G= X, то А непрерывно и в любой точке х ЕЕ X. Доказательство. Если хп—>х, то хп — х + х0 и, следовательно, Л (хп — х + £0) -> AXq. Однако из-за аддитивности Л имеем Л (хп — х + я0) = Ахп — Ах + Лх0, и, значит, из хп ->х следует, что Ахп —>Лх. Второе замечание, касающееся понятия непрерывности, состоит в том, что любое аддитивное отображение Л некоторого вещественного банахова пространства X в любое банахово пространство Y однородно, если оно непрерывно. Действительно, вспомним, что аддитивная функция, определенная на линейном пространстве, была однородной, если коэффициент г рационален. Если же г — это некоторое заданное иррациональное число, а {гп} — последовательность рациональных чисел, сходящаяся к г, то гпх — гх|| = ||XT|| • | гп — г | —> О и в силу непрерывности Л: гпАх = - Л (гпх) ->Л (гх). Однако так как гпАх, очевидно, сходится к г Ах, то Л (гх) = г Ах, и, значит, Л однородно при любых вещественных г. Напомним определение ограниченного преобразования. Определение Б. Пусть А — некоторое преобразование определенное на X и принимающее значение из Y, где X и Y — банаховы пространства. Преобразование А называется ограниченным, если найдется такая константа М, что || Лх|| Л/ЦхЦ, каково бы ни было х ЕЕ: X. Читателю нужно не забывать, что || Ах | — это норма в пространстве Y, в то время как ||х|| — это норма в пространстве X. Для большей ясности в связи с этим иногда полезно будет пользоваться в такой ситуации нижними индексами. Так, вместо только что выписанного неравенства мы могли бы написать, что
Если А — некоторое линейное ограниченное преобразование, то, как легко видеть, из ограниченности любого множества X' CZ X следует и ограниченность множества-образа А (X')' = Yf CI Y. Мы только что убедились в том, что каждая непрерывная аддитив-ная функция является и линейным оператором (у. е. обладает и свойством однородности). Следующая теорема проливает дополнительный свет на взаимосвязь между различными свойствами линейных преобразований. Теорема В. Пусть X и Y — банаховы пространства, а Л — преобразование X в Y. Тогда /I ограничено в том и только в том случае, если А непрерывно. Достаточность. Пусть А: X —> У, и пусть А не ограничено. Тогда существует такая последовательность {хп}, что для каждого п ||Лх„||>п||хп||. Построим далее новую последовательность, положив хп — = хп / п|| хп ||. Ясно, что х’п ->0, поскольку || х'п || = 1/п. Но, с другой стороны, II ^хп II = I А II хп 11^ | = Л||д. || * II А.Хп || ^> 1, и, следовательно, ||Ахп|| не сходится к ||А0|| при п ->оо. Поэтому А не может быть непрерывным в начале координат, что противоречит условию теоремы. Необходимость. Пусть преобразование А аддитивно и ограничено. Тогда || Ах|| < М\\х||. Если хп -+х, то || Ахп — Ах\\ = = || А (хп — x)j| Af||xn — х ||, и, следовательно, Ахп ->Ах, что и завершает доказательство нашей теоремы. Следующая теорема подводит итог всему тому, что мы пока узнали. Т е о р е м а Г. Пусть X и Y — банаховы пространства, и пусть А: X -+Y. Тогда, если А линейно, то следующие условия для А эквивалентны между собой: (1) А непрерывно', (2) А непрерывно в начале координат*, (3) существует вещественное число М > 0 такое, что || Ах || Л/||х||, каково бы ни было х S X; (4) если (0) = {х: ||х|| 1}, то его образ А (0)] является ограниченным множеством в У. Па самом деле, при доказательстве этой теоремы не приходится пользоваться свойством полноты пространств X и У; вполне достаточно, чтобы они были нормированы и линейны. В § 2.1 мы ввели понятие нормы Липшица, распространяющейся на произвольную функцию, отображающую одно метрическое простран
ство в другое. Для линейных преобразований это определение нормы Липшица превращается в следующее. Определение В. Пусть X и Y — нормированные линейные пространства, и пусть А — некоторое ограниченное линейное преобразование X в Y. Наименьшее число М. для которого неравенство ||4х||, М ||х||х справедливо при всех х^Х. называется нормой А и обозначается через |] А |. В соответствии с этим определением вещественное число || А || таково, что ll-kllx, каково бы ни было х 6Е X. Более того, для каждого е > 0 найдется такое х'. что ||Лх'II, > (II4 1 - 8)||х'||х. Нетрудно показать, что приведенное определение эквивалентно следующему: М11 = sup {Ц (x)J„: hllx < !}• Если же X не есть ядро преобразования, то из-за однородности А предыдущее определение сводится к следующему: Mil = sup {М (*)k kllx = i}- С помощью теоремы Б мы найдем, что множество всех оценок для А сверху эквивалентно множеству радиусов всех замкнутых сфер с центрами в начале координат, содержащих А(8г (0)). Это позволяет получить еще одно новое определение нормы А: ||4 || = inf {К: К > 0 и ||4 (х)|| К ||х||х для всех х}. Из последнего определения сразу следует, что М (х)1„ <МНх||х> каково бы ни было х GE X. Все эти замечания доказывают эквивалентность следующих формул: || 41|= sup || Аг ||, ||х||^1 М||=«ир ММ, II» 11=1 Выше мы пользовались нижними индексами при символах норм для того, чтобы подчеркнуть зависимость определения || А Ц от определения || ||х и || |(, (как известно, на каждом линейном пространстве можно определить много различных норм). И в точности так же, как изменение нормы приводит и к изменению
характера пространства X или У, так и выбор новой нормы Цх|| порождает новую норму оператора А. В следующем параграфе мы убедимся в том, что функция || А || удовлетворяет аксиомам нормированного пространства, а значит, наша терминология является оправданной. Прежде чем идти дальше, приведем примеры некоторых линейных преобразований. Пример 1. Легко убедиться в том, что функция Т (см. пример 5 §2.1) t (Тх) (t) = х (s) ds, а t Ъ, а определяет непрерывный линейный оператор в С (а, Ь). Аналогичным же образом преобразование ь ф (я) = (/) dt, а отображающее Lx (а, Ь) в 7?, ограничено и линейно. Ядро ф бесконечномерно. Например, если 6 л, а а — л, то условию ф (х) = 0 удовлетворяет бесконечное множество {х\ х (/) — = sin nt, cos nt, n = 1, 2, ...} линейно независимых функций. Пример 2. Функционал точечной оценки et9 (х) = х (t0) (см. примеры 3 и 10 § 2.1) является непрерывным комплексным линейным функционалом, определенным на С (0, 1). Новым здесь является лишь утверждение о его линейности, которое вытекает из того, что Z(, (ах + Ру) = (ах + Ру) (t0) = ах (t0) + Рг/ (<#)• Непрерывными линейными функционалами были и функции, рассматриваемые в примерах 4, 6 и 9 § 2.1. Пример 3. Стационарная линейная система с одним входом и одним выходом в пространстве преобразований Лапласа описывается соотношением У ($) = II (s) X ($), где II ($) — передаточная функция системы, X ($) — преобразование Лапласа входного сигнала, а У ($) — преобразование Лапласа выходного сигнала системы. При доказательстве линейности операции «умножения на II ($)» легко подметить те же этапы, что и при доказательстве справедливости принципа суперпозиции для линейных систем. Пример 4. Пусть X — пространство всех вещественных чисел, определенных на промежутке 0 t < оо и таких, что функция х (/) интегрируема и lim |х (/) | < Ае*', где а < оо. Функция t-*oo L, заданная соотношением со (Z/)(.s) = $e-’'/(OdZ, о
представляет собой линейное преобразование, отображающее X в пространство комплексных функций комплексной переменной. Следующие три примера теспо связаны с задачами теории систем различных типов. Поэтому мы рассмотрим эти типовые задачи довольно подробно. Пример 5. Вся техническая литература может служить убедительным свидетельством того, насколько важны линейные преобразования в конечномерных пространствах. Так, в механике многомерные соотношения между нагрузками и напряжениями могут быть описаны (по крайней мере в приращениях) с помощью линейных преобразований в Еп. При проектировании систем управления и навигации сигналы различных датчиков и измерительных приборов, описывающие движение тела в некоторой системе координат, связанной с этими датчиками, необходимо преобразовать так, чтобы они определяли движение в обычной системе координат. И такое преобразование координат, как правило, является линейным. На самом деле, список различных возможных применений теории линейных преобразований настолько внушителен, что теория матриц в большинстве технических дисциплин играет не менее важную роль, чем основы математического анализа. В настоящем примере мы считаем, что X = Y = Нп, и рассматриваем преобразование А, описываемое вещественной матрицей Га*у] размерности (п х п), преобразующей вектор х = = (£1» •••> tn) в вектору = (т]1т 1];) по правилу п ni=Saijih i = (1) >=1 Поскольку кх = ..., Цп), то из уравнения (1) и очевидного равенства п п 2 «{AS/ = ^ (3 следует, что Лкх — кЛх. Столь же просто убедиться и в том, что преобразование А аддитивно. Таким образом, А — линейное преобразование. Так как Нп конечномерно, то мы сразу устанавливаем, что преобразование А непрерывно. В § 1.4 мы видели, что на Нп можно определить множество различных норм. В частности, для х = (£х, £п) нормой может служить функция 15.1’]V’,
Где р — произвольное число, 1 р < оо. Для того чтобы показать на примере, что норма А действительно зависит от выбора норм в областях определения и значений, мы порознь рассмотрим три различных случая. Для простоты мы будем во всех этих случаях предполагать, что в области определения и в области значений выбираемые нормы одинаковы. Случай!: (п) -> (п), Цж]! = &|. Число || А в явном виде вычисляется по формуле п |A|i = “ах 3 J i=l Другими словами, норма преобразования А при условии, что этот оператор действует в 1Х (п), равняется максимальной из норм в 1г (п) вектор-столбцов матрицы [а^]. Случай 2: 12 (п) -> 12 (п), ||а:||2 = [У"=11 |2]7«. Норма ||А||2, порожденная нормами 12 (п), определяется выражением II ||г = ^шах> где Хтах — наибольшее собственное значение матрицы В = А*А. Более подробно о собственных числах мы поговорим в следующей главе. Случай 3: (n) -+1оо(п). В этом случае норма вектора х из Rn определяется по формуле ||хЦ» = max Норма А, порожденная такой нормой (мы обозначим ее через ||4||оо), определяется выражением п ЦЛЦоо = max 2 |аиI• i j=l Таким образом, если рассматривать А как оператор в 1^ (п), то норма Л равняется максимальной в 1Х (п) из норм среди всех вектор-строк матрицы [aiyl. Результат, относящийся к случаю 3, можно получить без каких-либо трудностей. Попутно мы познакомимся при этом с одним конструктивным приемом, который оказывается часто полезным при вычислении нормы ограниченного оператора. Для начала напомним, что ||Л||оо= sup IIAxjoo-II Пусть преобразование Л характеризуется матрицей [<х<у] и у = = Ах, где x = (^lt |п), а у = (т]1. •••> Пп)- Пусть координаты
i - 1, п, вычисляются по формуле (1), тогда п j=l Но так как ||у||оо = maxf{|ni|). т0 «« сразу находим, что Mxk = hk =max|t]iKmax 2l«ul • 11}I-’ 1 j=i Однако если ЦхЦ» = 1, то ясно, что 1< 1, каково бы ни было /. Учитывая этот факт в предыдущем неравенстве, мы видим, что || Л Ц» = sup ||Лх||<тах 2 |<*м | • Нх11оо=1 j=l Предположим теперь, что J I достигает своего максимума при i = к, и построим вектор с координатами О, если akj = О, Lj£2_L ? ссли а 0, / = 1, 2, . . ., п. Ясно, что ||s°||oo = 1 и что, более того, Sa/cj£j= 2 lawl-;=1 ;=1 Поэтому вектор х° обращает полученное неравенство в равенство п п ||Лж°||ов = 2 lawl = max 2 |а;;|, ;=1 1 j=l что и завершает наши вычисления. Пример 6. В § 1.4 мы обращали внимание читателя на системы, цепи и механизмы, преобразующие входной сигнал х в выходной сигнал у в соответствии с правилом 1 y(s) = ^k(s, 0<ssg:l. о В этом случае при t = 0 система находится в состоянии покоя [*/ (0) = 0]. Через к (.9, t) обозначена импульсная характеристика
(или функция Грина) этой системы. Если х £=. С (О, 1), а к (5, t) — функция, непрерывная на квадрате 0^5, t 1, то, как нетрудно видеть, функция у, определенная при 0 1 этим выражением, также непрерывна. Если мы обозначим это преобразование символом у = Тх, то Т будет отображать С (0, 1) в себя. Легко убедиться в том, что оператор Т линеен в С (0, 1), так как из равенств 1 i IT (л + '-2)1 (•’) - $ * (•’. 0 1'1 (/) + '-2 (/)] <и = $ к (S, I) л (0 dt + о о 1 + t)x2(t)dt = (T.ri)(s) + (Г.г2)(>-) = (7’х1 + Тхг) (s) О следует, что Т (xt + х2) = Тхк -|- Тх2> Кроме того, для любого скаляра а Т (ах) = аТх. При вычислении нормы Т мы предположим, что в пространствах входных и выходных сигналов используется обычная норма я|] = supo^t^j |х(1)|. Тогда из неравенства 11 1 | § k(s, t)x (t) dt I | &(.<?, t) I • I x (t) I dt ^sup I x (t) I § I k(s, t) | dt 0 * 0 z 0 мы сразу можем найти i i [|7\r||= sup I k(s, t) x (t) dt \ <|x| sup t)\dt. OC8<1 I Q I o^s^l 0 Отсюда следует, что i || T|| sup | k(s, t)\dt. oCsCi о В действительности же можно показать [А.56, стр. 83], что 1 ЦТ||= sup J|к(s, t)\dt. OCS^l Q Между примером 6 и случаем 3 предыдущего примера есть определенное сходство, которое станет яснее, если переформулировать задачу, рассмотренную в примере 5, пользуясь несколько отличной терминологией. Действительно, будем рассматривать векторы х = (51, ...» 5п) пространства (п) как функции, ото-
бражающие множество {1, 2, ..., п} в R. Норма вектора (функции) х — это равномерная норма. Матрицу [ац] теперь естественно рассматривать как некоторую вещественную функцию, определенную на «прямоугольнике» 1 i, / п. Тогда значение оператора определяется интегралом произведения [а^]х, и мы показали уже, что норма этого оператора равняется максимуму Zj-норм вектор-столбцов [аи]. Точно так же функцию к (s, t) можно рассматривать как матрицу с бесконечным (счетным) числом столбцов и строк, а векторы С (0, 1) — как последовательности (xt) с бесконечным числом чле" Рис. 2.9. Механическая система. нов. При этом Z-й координатой xt должно служить значение функции х (t) в точке t. В этом смысле пример 6 можно рассматривать как обобщение случая 3 из примера 5. Во всех этих эвристических замечаниях мы не стремились к особой строгости. Здесь, однако, полезно будет сказать, что этим двум примерам, а также и многим другим, с которыми нам придется еще встретиться, можно придать необходимую строгость, если воспользоваться методами современной теории интегриро вания и рассматривать встречавшиеся выше операторы как частные случаи одного абстрактного оператора. Мы советуем читателю самому попытаться продумать другие аналогии между непрерывными и дискретными явлениями, с которыми мы уже столкнулись или столкнемся в будущем. Пример 7. Рассмотрим простую систему с пружиной и демпфером, схематически изображенную на рис. 2.9. Она описывается уравнениями МхЫ (0 + /хО) (0 + кх (0 - у (0, t0 < t, *(1) (/0) =- xj, (t„) xt В этом примере мы займемся исследованием функции х -> у, определенной этими уравнениями *). Для несколько большей общности мы будем рассматривать преобразование у = Lx, заданное уравнениями у (0 = ап (0 х(п) (0 + . • • + «1 (О Х(1) (/) + а0 (/) X (0, (^о) —1 » • • • > x(t0) = хо. ♦) Здесь через обозначена к-я производная х по времени t, причем х(о)(0 полагается равным х (0.
При изучении преобразования L мы будем пользоваться функциональным пространством Сп (а, &), которое образуется всевозможными функциями, определенными на промежутке [а, Ы, непрерывными и п раз дифференцируемыми на этом промежутке, с нормой п ||х||= 2 sup I xw (t) |. 1=0 f Нетрудно видеть, что для Сп (а, Ь) справедливы все аксиомы нормированного пространства. Например, если х, у G= Сп (а, &), то, каково бы ни было / = 0, 1, ..., п, | (I) + У0) (О I < I (01 + 1 у(}) (0 j < sup I хО) (О I + sup | у0) (О I и, следовательно, sup (t) + (0| sup (J)| + sup \ у(Я (Z) [. Суммируя по индексу / обе стороны приведенного соотношения, мы получим неравенство треугольника. Более того, можно показать, что пространство Сп (а, Ь) банахово. То, что оператор L определен и линеен на пространстве Сп(а, &), не вызывает никаких сомнений. Ядро L состоит из всех решений дифференциального уравнения n-го порядка Lx = 0. Обычная теорема существования (см. теорему А из приложения 4) утверждает, что у этого уравнения ровно п линейно независимых решений хг, ..., хп (которые иногда называют собственными движениями системы). Отсюда можно заключить, что ядро L представляет собой линейное многообразие L (xt1 ..., хп). Для того чтобы доказать, что оператор L ограничен, введем обозначение dk = sup | (t) |, к = 0. 1, ..., и, и а = шах {«!, ..., ап}. Тогда, если у = Lx, то п п 1<М0|-1*да(0К /с=о /с=о а 2 I х^ (<) | ^ а 2 SUP I(0 I — ® IIх к=0 к=0 и, следовательно, [| ?/|| — sup | у (t) ] <21|х||. Поскольку =/= 0, то отображение L не взаимно однозначно, а потому и не обратимо. Однако область определения L можно сузить таким образом, чтобы L стало взаимно однозначным. Пусть X — банахово пространство следующего вида: X — {х: х Сп (а, &), х (а) = х(1) (а) = ... = х(п-1) (а) — 0}.
Тогда в силу второй теоремы существования решений дифференциальных уравнений (см. теорему Г из приложения 4) существует всего одно значение х С X для каждого у G С (а, Ь) такое, что I/ == Lx. Другими словами, в этом случае CZ С (а, Ь) и для каждого у G С (а, Ь) в X найдется всего один прообраз. Учитывая соотношение Ск (a, b) С С (а, Ь) и определение L, мы видим, что = С (а, Ь). А это значит, что оператор L обратим, если его область определения ограничена пространством X. Оператор, обратный L, помогает установить связь между материалом этого примера и материалом примера 6. Рассмотрим частный случай. Пусть у (0 = (Lx) (t) = (0. Интегрируя дважды и меняя порядок интегрирования, мы получим 1 и t x(t) = ^du^y (s) ds = — О У (s) ds. 0 a a Введем обозначение f (* ~ 0 ft(LS) = { 0 t тогда ъ x(t) = y(s)ds, a и у преобразуется в х оператором того же типа, что и рассматривавшийся в примере 6. * Пространство линейных преобразований *). Обозначим через X и Y два линейных пространства, а через L (X, У) — множество всевозможных линейных преобразований X в У. Как мы видели в примере 1, с каждым линейным преобразованием A: Rn ->Rn можно связать некоторую матрицу [ам1. Аналогичным образом в примере 2 каждое ядро к (.$, /), непрерывное по обоим своим переменным в квадрате а Ь, можно связать с некоторым линейным оператором Т: С (0, 1) -> С (0, 1). Наше множество L (X, У), по определению, содержит все эти операторы. В L (X, У) можно ввести линейные операции. Пусть X и У — два линейных пространства с одинаковыми скалярами. Пусть А и В — это два преобразования из множества L (X, У). ♦) Звездочкой помечены разделы, чтение которых не обязательно для того, чтобы понять остальной материал главы 2. При желании читатель может пропустить этот материал.
Определим их сумму Т = А В следующим образом: Тх -= (А + В)х — Ах + Вх, х ЕЕ X. Определим также операцию умножения на скаляр Т = кА с помощью следующего соотношения: Тх - (ХЛ)х = кАх. Легко доказать, что введение этих определений преобразует множество L (X, Y) в некоторое линейное пространство. Нулевое преобразование (т. е. нулевой элемент этого линейного пространства) 0 определяется условием 0 (х) 0, а преобразование — Т условием (— Т) (х) = — Т (х). Другими словами, мы доказали сейчас следующую теорему. Теорема Д. Пусть X и Y -— два линейных пространства с одинаковыми полями скаляров. Тогда множество всех линейных преобразований X в Y само является линейным пространством по отношению к только что определенным операциям сложения и умножения на скаляр. Введенное ранее определение композиции двух функций справедливо, в частности, и для линейных преобразований. Так, если Л Е А (У, Z), а В Е А (X, У), то произведение АВ есть преобразование X в Z, удовлетворяющее условию (АВ)х - А (Вх), хЕЕХ. Нетрудно убедиться в том, что АВ также линейно и, значит, принадлежит L(X, Z). В частности, если X = У = Z, то, как мы установили только что, при А и Be^L (X, X): АВ ЕЕ L (X, X). Легко видеть, что это произведение обладает свойствами ассоциативности А (ВС) = (АВ) С. Более того, так определенное умножение связано со сложением через дистрибутивные законы Л (В + С) = АВ + АС и (А + В) С = АС + ВС, а с умножением на скаляр с помощью соотношения а (АВ) - (аА) В = А (аВ). Доказательство всех этих фактов не составляет никакого труда. В качестве иллюстрации приведем простую цепочку выкладок,
доказывающих один из законов дистрибутивности: |(Л + В) С] (х) = (А + В) (С (х)) - = А (С (х) + В (С (х)) = (АС) (х) + (ВС) (х) = (АС + ВС) (х). Обращаем особое внимание читателя на то, что в принятых предположениях свойство коммутативности (АВ ~ ВА), вообще говоря, отсутствует. Например, матрицы размерности (п ?< п), каждая из которых отображает Вп в /?'\ не коммутативны. Рассмотрим еще один пример. Выберем X С (а, 1>) и введем два оператора: 1 у (s) = (Ar) (х) = stx (t) dt о и z (s) = (Вх) (s) — sx (s). Тогда i t ABx = st-tx (t) dt = t2x (t) dt, о 0 1 t В Ax = s^stx (t) dt = s2 § tx (t) dt, о о и, следовательно, AB =/= BA. До сих пор мы говорили только об одном конкретном элементе L (X, X), а именно о нулевом преобразовании 0. Второе, почти тривиальное преобразование — это тождественное преобразование /, определяемое условием I (х) = х. Заметим, что Z =/= 0 <=> О X =^= {0} и что Al = IA = 4, каково бы ни было А е L (X, X). Если а — любой скаляр, то умножение на скаляр а можно рассматривать как линейное преобразование а/, так как (al) (х) = al (х) = ах. В теореме Ж мы покажем, что если преобразование А(=еЬ (Х,Х) невырождено, то существует и линейно А"1, и, следовательно, A~l^L(X, X). Определение Г. Линейное пространство X называется алгеброй, если в нем определена операция, ставящая в соответствие каждой упорядоченной паре (х, у) элементов X некоторый третий элемент X, обозначаемый через ху и называемый произведением х на у, и если эта операция удовлетворяет следующим
аксиомам: (1) (ху) Z = X (yz), (2) х (у + z) = ху + xz, (3) (х + у) Z = XZ + yz, (4) (а*) (РУ) = (аР) (ху). Во всех этих аксиомах нужно считать, что х, у и z — это произвольные элементы X. а а и 0 — произвольные скаляры. Ал-гебру называют вещественной или комплексной в зависимости от того, комплексно или вещественно поле скаляров. Если в алгебре X существует такой элемент i, что ix = xi — = х, каково бы ни было х е= X, то i называют единицей алгебры, и этот элемент обязательно единствен. Если ху = ух, какова бы ни была пара (т, у), то соответствующая алгебра называется коммутативной. Если Хо — это некоторое подмножество алгебры X, такое, что каждый раз, когда (х, у) принадлежат Хо, туда же попадают и х + У, ах и ху где а — некоторый скаляр, то XQ называют подалгеброй алгебры X. Другими словами, подалгеброй называется подпространство, которое само по себе является алгеброй. Из этих определений и заме’ лий, предшествовавших определению алгебры, следует, что множество L (X, X) — алгебра. Более того, в этой алгебре есть единица, а именно оператор 7, определенный условием 1х = х. В общем случае алгебра L (X, X) не коммутативна. * Нормированные пространства линейных преобразовании. Итак, мы установили, что множество L (X, У) всевозможных линейных преобразований, отображающих линейное пространство X в линейное пространство У, само является некоторым линейным пространством. Пусть пространства X и У банаховы. Тогда для всех ограниченных преобразований из L (X, У) мы уже определили понятие нормы оператора. Это двоякое употребление термина «норма» подсказывает нам, что существует возможность построения на базе подмножества всех ограниченных преобразований из L (X, У) некоторого нормированного линейного пространства. Но для этого нужно проверить выполнимость некоторых дополнительных условий. Обозначим через 0 (X, У) множество всевозможных непрерывных (и, следовательно, ограниченных) линейных преобразований нормированного линейного пространства X в нормированное линейное пространство У. Если A GE 0 (X, У), то функция || А || (см. определение Б) удовлетворяет всем акиомам нормированного пространства. В самом деле, предполагая, что X =/= {0}, мы получим: (1) 1|А|] = sup||X||=1 ||Лх|| > 0 (что очевидно); если || А |( = 0, то Ц Ах|| = 0, каково бы пи было х, для которого ||а:|| = 1. Но в
силу однородности А отсюда следует, чть Ах = 0, каково бы ив было х вообще, и, значит, А = 0. (2) ЦМ|| = sup||M = i ||ХАх|| = | М supi,,!-! ||Ах) = |Х|.|Л (3) ||А + В\\ = supn,!!»! ||(Л + В)х|< sup,х। = 11| Ах\\ + + sup|,j,i ||Вх|| = IIЛII + ||ВЦ. Таким образом, мы частично доказали следующую теорему. Теорема Б. Если X и Y — нормированные линейные пространства, то множество 0 (X, Y) всевозможных непрерывных линейных преобразований X в Y само по себе представляет нормированное линейное пространство по отношению к поточечным линейным операциям и норме, порожденной X и Y. Более того, если пространство Y банахово, то банахово и пространство 0 {X, Y). Доказательство. Мы уже показали, что 0 (X, Y) — нормированное линейное пространство, и нам остается только доказать, что если пространство Y полное, то полно и 0 (X, У). Другими словами, нам нужно показать, что если {Ап} — некоторая последовательность Коши из 0 (X, У), то она сходится к некоторому преобразованию из 0 (X, У). Итак, пусть {Ап} — некоторая последовательность Коши из 0 (X, У). Если х есть произвольный вектор из X, то из того, что ЦАт((х) -Ап (х) || = || (Ат — Ап) (х)1С||Лт-ЛпЦ.Цх||, еле-дует, что последовательность {Ап (х)} представляет собой последовательность Коши в У. А так как пространство У полное, то найдется некоторый вектор из У (мы обозначим его через А (х)) такой, что Ап (х) -> А (х). Но это и определяет отображение А из X в У. Является ли это отображение линейным? Поскольку А (хг + + х2) = lim Ап (xt 4- х2) = lim Ап (хг) + lim Ап (х2) и А (ах) = -lim Ап (ах) = a lim Ап (х) — аА (х), то ответ на этот вопрос, очевидно, должен быть положительным. В завершение доказательства нам остается только показать, что А непрерывно и что Ап ->Л по норме, определенной на 0 (х, у). Замечая, что нормы членов последовательности Коши в нормированном линейном пространстве должны образовывать ограниченное множество чисел, мы получим, что || 4 (х)|| =Ц lim Ап (х)|| = lim||An (х)||< sup (|| АпЦ-||х||) = = (sup || 4n||)||х||, откуда следует, что А ограничено, а следовательно, и непрерывно. Остается только доказать, что || Ап — А|| ->0. Зададимся некоторым е > 0 и обозначим через п0 некоторое положительное целое число такое, что т, n^nQ=S> || Ат — Ап|| < е. Существование такого числа гарантируется свойствами произвольной
последовательности Коши в нормированном пространстве. Если ||х|| < 1 и т, п> п0, то II лт (х) - Ап (х)|| = II (Ат - Лп) (х)|| < II Ат - Ап||-||х|| < ^п|| < Е* Теперь мы воспользуемся одним классическим приемом, сводящимся к тому, что т фиксируется, а п устремляется к бесконечности, в результате чего || А т (х) — Лп (х) || -►-|| А т (х) — А (х)||, откуда и следует, что || Ат — А (х)|| е для любых т nQ и всех х, для которых ||х|| 1. Это непосредственно и доказывает что || А т — Л || е для всех т п0, что и требовалось доказать. Как и раньше, мы можем распространить все эти результаты на случай, когда областью определения преобразования и областью его значений служит одно и то же нормированное линейное пространство. Мы будем называть непрерывное линейное преобразование X в себя просто ограниченным линейным оператором в X и будем обозначать нормированное пространство ограниченных линейных операторов в X через 0 (X) (а не через несколько более сложное 0 (X, X)). Теорема Е показывает, что 0 (X) — банахово пространство, если только X — банахово пространство. Пусть А и В — два оператора из 0 (X). Выше мы определили их композиции АВ и В А. Покажем теперь, что цлвцсрнвц. Это утверждение легко доказывается следующими соотношениями: || АВх|| = || А(Вх) || < |( А || • || Вх || < || 4 || • || 51| • ||х ||. В предыдущих параграфах мы показали, что в любом банаховом пространстве операции сложения и умножения на скаляр совместно непрерывны. Если 0 (X) — банахово пространство, то можно заключить (используя неравенство, приведенное выше), что совместно непрерывна и операция умножения преобразований. Другими словами, если Ап и Вп ->В, то АпВп -+АВ. Это вытекает непосредственно из следующих соотношений: |Л„ВП - АВ|| = ||АП (Вп -В) + (Ап - А) ВЦ <||4П|.||ВП — ВЦ +||АП - АЦ.ЦВЦ. Если пространство X нетривиально (X =1= {0}), то тождественное преобразование I является единицей для 0 (х) и Ц/Ц = sup {||/ (х)||: ||х|| < 1} = sup {||х||: ||х|| < 1} = 1. Если Т — некоторое преобразование, определенное на X, принимающее значения из У и являющееся взаимно однозначным
накрытием, то Т называется невырожденным (несингулярным) или обратимым. Если Т к тому же и линейно, то преобразование, ему обратное, обладает еще и следующими дополнительными свойствами. Теорема Ж. Пусть Т — некоторое линейное преобразование с Dt = X и RT = Y, где X и Y — нормированные линейные пространства. Тогда: (1) Г'1 существует и ограничено в том и только том случае, когда найдется такая постоянная т > 0, что т || х|| || 7\г||, ка- ково бы ни было X ЕЕ X*, (2) если утверждение (1) справедливо, то ||71“1||^ 1/ттг; (3) если Т"1 существует, то оно линейно. Доказательство. Для того чтобы доказать утверждение (2), предположим, что уг, y2EEY. Тогда уг = Тхх и у2~ Тх2, где хг = = Т-^ух и х2 = Но так как (уг + у2) = Т + х2), то мы получим, что 71-1 (j/i + у2) = + #2 = Т~гУ1 4- Т~ху2. Точно так же равенство tyi = Ткхг предполагает, что = = ^Т~1у1, так что преобразование Т”1 аддитивно и однородно. Для того чтобы доказать утверждение (1), заметим, что для m > О при условии, что ти||х|| || Гх||, Тх = 0=$>х = 0, и,следовательно, Т взаимно однозначно. Более того, если 71-1 существует, то у = Тх эквивалентно х — Т~гу. Поэтому тпЦ дг|| (| Тх^ => || у || => ||7’“1г/(| 1/т| у ||, каково бы ни было у из Нт, служащей областью определения преобразования Т^1. А отсюда уже в силу теоремы В следует, что преобразование Т”1 непрерывно. Обратно, если Т~г существует и ограничено, то для всех у = = Тх ЕЕ Rt справедливы соотношения k II = ГЛ/II < IIТЛЬШ = ГЛ-11 ^11.. так что условия теоремы выполняются, и m = Другими словами, если Т линейно, ограничено снизу (т. е. 771IIxll II Тх\\) и Rt Y, то Г"1 существует и принадлежит Р (У, X). Для дальнейшего обсуждения этого вопроса мы отсылаем читателя к приложению 7. Выяснить возможность обратимости преобразования, как правило, совсем не просто. Однако следующая теорема дает нам одновременно и критерий существования ограниченного обратного преобразования, и вычислительный метод, позволяющий аппроксимировать это обратное преобразование. Теорема 3. Если X — некоторое банахово пространство и Г Е Р (X), причем ||Т||^ а<1, то преобразование, обратное (I — Т), ограничено и удовлетворяет условию ||(Z-T)-lKTLr.
Более того, ряд оо (Г — Т)"1 = 2 тп п=0 в Р (X) равномерно сходится к левой части этого равенства. Доказать эту теорему нетрудно, и мы предоставляем читателю возможность сделать это самому. В упражнениях 7—10 к § 2.5 мы убедимся, что она даст нам полезный метод изучения систем с обратной связью. * Проекции. В этом разделе мы лишь вкратце остановимся на двух линейных преобразованиях специального вида. Эти преобразования заслуживают особого внимания потому, что они тесно связаны с изучением структуры линейных пространств и, кроме того, знакомство с ними обогатит наше понимание этой структуры. Первое из этих преобразований называется проекцией. С понятием проекции мы в неявном виде уже познакомились в § 1.3 в связи с изучением прямых сумм линейных многообразий, и мы начнем сейчас как раз с этого. Напомним, что линейные подпространства {Мг, ..., Мп} разлагают линейное пространство X в некоторую прямую сумму X = М ф ... ф Мп, если каждый хЕЕ X можно единственным образом представить в виде х = хх 4- ... + хп, где М^. Это разложение может быть использовано для того, чтобы определить функции Pj, удовлетворяющие условиям Р^х = Xi, i = 1, ..., и, каково бы ни было х ЕЕ X. Эти операторы, очевидно, линейны и удовлетворяют соотношениям ЛР;. = о, Р? = РЪ f = Z = px + ... +Pn. Область значений каждого из операторов Р| — это соответствующее подпространство М}. Ядром оператора Р| служит подпространство X Q (Другими словами, NP. = Мх ф ... ф Л/^ф Ф ^{+i© Мп.) Определение Д. Линейный оператор Р в X называется проекцией если Р2 = Р. Если область значений Р равна М, то Р называется проекцией X на М. Легко показать, что если Р — проекция, то X - RP ф Np.
В самом деле, поскольку каждый элемент х X может быть пред ставлен в виде х = Рх + (I - Р)х и Рх S Rp, то нам нужно показать лишь, что (Z — Р)х е Np и что Rp П Np — 0- Следующая последовательность равенств р I(Z - Р) (*)] = (Р (Z — Р)1 (я) = (р - рэ) (я) = (Р - Р) (*) = = 0 (х) =0 доказывает, что (Z — Р) (х) принадлежит #Р, а значит, NP и RP позволяют натянуть на себя все X. Для того чтобы убедиться в том, что Хр и RP не пересекаются, нам нужно только заметить, что если Р (х), принадлежащий RP, принадлежит и NP, то Р (Р (х)) = = 0 и, следовательно, Р (х) = Р2 (х) = Р (Р (х)) = 0. Это доказывает, что X = RP © NP, и, следовательно, Р — действительно проекция х на RP. Аналогичным же образом можно определить и проекцию Q пространства X на NP. Ясно, что Q = I — Р, так как если Р — некоторая проекция на X, то уравнение Q2 = (Z - Р)2 = (I - Р) (Z -’Р) = Z- P- P+P2 = Z- P = (? показывает, что и Q — проекция, а мы знаем, что Р есть проекция на Яр, когда I — Р — проекция на NP. Сделаем еще одно дополнительное замечание. Если М\ — некоторое заданное линейное подпространство X, то существует, вообще говоря, множество подпространств М2 таких, что X = Мг © М2. Поэтому наверняка должна существовать проекция Р на М2, но эта проекция не определена однозначно до тех пор, пока не выбрано подпространство М2. (Читатель легко может убедиться в этом на частном примере R2.) До сих пор мы ничего не говорили о непрерывности. Рассмотрим проекцию Р в банаховом пространстве X. Если Р непрерывно, то ядро ДОр, будучи ядром непрерывного линейного преобразования, должно быть замкнуто (см. упражнение 1). Но так как область значений Р представляет собой одновременно и ядро Z — Р и это второе преобразование также непрерывно, то замкнутым должно быть и RP. Справедливость этого взаимно обратимого утверждения доказывается в следующей теореме. Теорема И. Каждая непрерывная проекция Р, действующая в банаховом пространстве X, определяет два замкнутых линейных подпространства RP и NP таких, что RP ф NP = X. И обратно, каждая пара линейных замкнутых подпространств М и N таких, что М ф N = X, определяет некоторую проекцию Р, для которой RP = М и NP = N.
В общем случае неверно было бы утверждать, что у каждого замкнутого линейного подпространства М банахова пространства X имеется непрерывная проекция, принимающая значения из М. Трудность здесь заключается в том, что для М может не найтись замкнутого линейного многообразия АГ, дополнительного по отношению к М. Кроме того, может оказаться, что М ф N не замкнуты, хотя М и N замкнуты (см. замечание 1 из § 3.2). В том случае, когда пространство X гильбертово, задач, связанных с декомпозицией X, не возникает. В самом деле, вспомним, что в соответствии с теоремой Г из § 1.5 у каждого замкнутого линейного подпространства М имеется некоторое замкнутое дополнение, а именно 7И1, такое, что X = М ф М-L. Для гильбертовых пространств мы безо всякой неоднозначности можем ввести понятие ортогональной проекции. Определение Е. Пусть Н — гильбертово пространство. Линейный оператор Р называется ортогональной проекцией в Н, если Р есть проекция, a Rp | ЛГр. Если М — некоторое замкнутое подпространство Н, то проекция Р с Rp = М и Np = = называется ортогональной проекцией Н на М. Ортогональные проекции играют важную роль в изучении общей структуры линейных операторов. Сейчас же мы не будем исследовать свойств этих проекций дальше, хотя и поговорим об этом в упражнениях. * Изоморфные и конгруэнтные пространства. Для того чтобы оправдать необходимость введения следующего определения, рассмотрим вкратце один пример линейного пространства X. Пусть векторы из X — это упорядоченные пары (£, ц) вещественных чисел. Сложение и умножение на скаляр определены в X следующими правилами:! (£1- П1) + (1г, Пг) = 011 + *12, Е’ + 5г). X (g, л) = (Ц, Ц), где X вещественно. Недолгие размышления показывают, что в этом случае все аксиомы определения А из § 1.3 удовлетворяются, и, следовательно, X — действительно линейное пространство. Но так как раньше мы уже сталкивались с пространством R х R = = R2, то естественно задать вопрос, а не «эквивалентны» ли пространства X и 7?2? Специалист по теории множеств немедленно воскликнул бы: «Ну, очевидно же!» Однако остальные из нас не могут не чувствовать некоторого скептицизма. Оба эти пространства линейны, и нам интуитивно кажется, что для эквивалентности пространств необходима и «эквивалентность» определения операций сложения и умножения на скаляр, а в данном случае этого нет. Поэтому мы говорим, что эти пространства различны. Но насколько различны? Безусловно, не настолько, насколько
различны, скажем, (' (0, 1) и В самом деле, X и Вг отличаются друг от друга лишь совершенно тривиальным аспектом. Так, если определить отображение Т : X -► Н2 с помощью следующего условия: т (£, Т]) = (Т), 5), мы сразу увидим, что Т линейно, взаимно однозначно и накрывает Я2. Более того, любое «утверждение теории линейных пространств», справедливое в Я2, с помощью Т переводится в некоторое истинное утверждение относительно X. Например, сразу можно утверждать, что X двумерно и что его базис может состоять из векторов Г-1 (0, 1) = (1,0) и Г-1 (1,0) = (0, 1). Короче говоря, линейное пространство X можно получить из линейного пространства Я2 с помощью простого переименования его точек. Естественно, что такое изменение считается совершенно тривиальным, особенно если учесть, что при изучении линейных пространств мы, в конце концов, вообще не интересуемся конкретным характером их векторов. С другой стороны, если для получения X из Я2 приходится менять больше, чем просто «язык», то это отразится на структуре Я2 как линейного пространства, и такое изменение уже нельзя считать тривиальным. Предыдущие рассуждения показывают, что нам следует считать два линейных пространства X и Y «эквивалентными», если у них идентичны структуры. А так как все наши определения и свойства линейного пространства берут свое начало из определений операций сложения и умножения на скаляр, то это возможно тогда и только тогда, когда найдется некоторое взаимно однозначное отображение Т пространства X на У, которое сохраняет сложение Т + х2) = Тхх + Тх2. С формальной точки зрения это приводит к следующему определению. Определение Ж. Два линейных пространства X и Y (с одинаковым полем скаляров) называются изоморфными, если существует некоторое взаимно однозначное линейное преобразование, отображающее X на У. Такое преобразование называется изоморф измом. С точки зрения этого определения пространства X и Я2, рассматривавшиеся выше, изоморфны с изоморфизмом Т, преобразующим (5, ц) в (ц, ^). Первоначальная путаница возникла из-за того, что тождественное преобразование I, отображающее пару (5» ц)» как элемент X, в (£, т|), как элемент Я2, хотя и взаимно однозначно, биективно и однородно, но не является аддитивным: I ((51, Т]1) + (5г, Пг)) = 1((Л1 + Пг, + 5г)) = = 011 + 51 + 5г) = Oil, 51) + 012, 5г).
в то время как * ((£ь П1)) + ((5г, П2)) П1) + (5г» Пг)- Преобразуя приведенное выше определение, мы утверждаем, что для изоморфных пространств с изоморфизмом Т, Dt = X, Rt = У, существует Г-1. А вследствие линейности Т и Т-1 отображение Т сохраняет свойства векторного сложения и умножения на скаляр, т. е. если и х2 соответствуют уг и у2, то у\ + у2 соответствует Х\ + х2, а аух соответствует а^. Кроме того, если X изоморфно У, а У изоморфно Z, то X изоморфно Z. В качестве упражнений мы предлагаем читателю самому убедиться в правильности следующих предложений: (1) Если X и Y изоморфны и конечномерны, то dim X = dim У. (2) Если dim X = dim У < оо, то X и У изоморфны. (3) Если X и У изоморфны с изоморфизмом Т, а М — некоторое линейное многообразие в X, то Т (М) — линейное многообразие в У. Более того, каждое линейное многообразие N из У имеет вид N = Т (Af), где М — некоторое единственное линейное многообразие из X. Теперь, после того как мы договорились считать идентичными любые два изоморфных линейных пространства, естественно встает вопрос об «эквивалентности» метрических пространств. Вспоминая, что метрическое пространство — это просто множество X с определенной в нем метрикой р, и поступая аналогично тому, как мы поступали с линейными пространствами, мы убедимся в том, что изоморфизмами «метрических пространств» должны быть изометрии (см. определение; II из § 2.1). Точнее говоря, мы называем метрические пространства {X, рх} и {У, р2} изометрическими, если существует некоторое (необходимо) взаимно однозначное отображение Т пространства X в пространство У такое, что Р1 (*1. х2) = р2 (Тх2, Тх2), каковы бы ни были xl9 х2 ЕЕ X. Ясно, что если пространства X и У изометричны, то изометрия Т переводит любое метрическое свойство пространства X в аналогичное свойство пространства У, и обратно. Чтобы привести лишь один пример (но типичный), покажем, что У полно, если полно X. Доказательство этого утверждения несложно. Если {уп} — некоторая последовательность Коши, то из-за взаимной однозначности и сюръективности Т существует единственная последовательность {хп} из X, для которой Тхп = уп. Но так как Т — изометрия, то последовательность {.тп} в пространстве X — это последовательность Коши. Поэтому хп —> х из X, и равенство р2 (Уп, Тх) = Pi (хн, х) показывает, что уи Тх Е Y.
Мы советуем читателю самому показать, что изометрия сохраняет свойства замкнутости или открытости и другие метриче-ческие свойства *). Рассмотрим теперь пару банаховых пространств X и Y. В каком случае их можно считать эквивалентными? Поскольку каждое из них еще и линейное пространство, то нам нужно, чтобы X и Y были изоморфными в качестве таковых. Кроме того, каждое из них еще и метрическое пространство. Поэтому нужно, чтобы X и Y были и изометрическими, но так как метрическая структура банахова пространства но вполне независима от его структуры как линейного пространства (условия ||Хх|| -- |Х|*||х|| и ||х + ||У|| связывают между собой, например, понятия расстояния, умножения на скаляр и сложения), то нам нужно потребовать, чтобы X и Y были изометричны относительно того же отображения, которое устанавливает и их изоморфность. Другими словами, мы условимся считать банаховы пространства X и Y идентичными, если существует некоторый изометрический изоморфизм Г, отображающий X на К, или, более подробно, взаимно однозначное линейное отображение X па У, для которого II *i — т2|| --- || Tty — 7X211. каковы бы ни были хг и х2 ЕЕ X. Беглый обзор определений банахова пространства показывает, что такое отображение Т действительно сохраняет структуру банаховых пространств X и У, и наше интуитивное представление об эквивалентности банаховых пространств находит свое отображение в понятии изометрического изоморфизма **). Наконец, рассмотрим случай двух гильбертовых пространств X и У. Естественно, что мы не решились бы отождествлять между собой пространства X и У, если бы они не считались идентичными в качестве банаховых пространств (т. е. не были бы изометрически изоморфными). Но в то же время тождество <*. у> == 1/4 {||х + у|Р - II* - г/ll2 + II* иГ - II* - г/П показывает, что любое линейное отображение, сохраняющее норму, автоматически сохраняет и скалярное произведение. А так как вся внутренняя структура гильбертова пространства определяется его скалярным произведением, то становится ясным, в чем состоит «изоморфизм гильбертовых пространств». Два гильбертовых пространства X и У со скалярными произведениями <,>х и <,>2 могут считаться идентичными, если существует такое *) Замкнутость и открытость — это, вообще говоря, топологические свойства. (Прим, ред.) ••) Два изометрически изоморфных банаховых пространства обычно называют конгрувнтными.
взаимно однозначное отображение Т пространства X на У, для которого х2\ = \ Тхц Тх2х/2, хг, х2 ЕЕ X, или (хотя с первого взгляда это условие и кажется более слабым) klk = II Мг- Короче говоря, гильбертовы пространства X и У эквивалентны, если они изометрически изоморфны. Подводя итоги, мы можем сказать, что если обобщить понятие изоморфности так, чтобы оно обозначало идентичность структур, то изоморфизмом метрических пространств является изометрия, изоморфизмом линейных пространств — несингулярное (сюръективное) линейное преобразование, а изоморфизмом банаховых (гильбертовых) пространств — несингулярное (сюръективное) линейное преобразование, обладающее одновременно свойствами изометрии. Перейдем теперь к некоторым примерам использования понятий этого параграфа. Дополнительные примеры можно найти среди упражнений. Пример 8. Напомним, что два вещественных (или комплексных) полинома р (t) а0 Ч art + ... 4- и q (t) — — Ро + Pi^ 4' ••• 4- Pn-U71"1 называются равными в том и только в том случае, когда i — 0, 1, ..., п — 1. Таким образом, преобразование 7, отображающее р в n-ку вещественных (комплексных) чисел (а0, ах, ..., an-i), вполне определено и является взаимно однозначным отображением пространства вещественных (комплексных) полиномов (п — 1)-й степени в линейное пространство Нп (Сп) вещественных (комплексных) n-ок. Преобразование Т линейно и сюръективно, так что пространство Рп вещественных (комплексных) полиномов степени не выше (п — 1)-й изоморфно Rn (Сп). Пример 9. Пусть Н — некоторое сепарабельное гильбертово пространство, и пусть — некоторая ортонормальная по- следовательность в П (см. приложение 2). Мы уже видели, что каждое х из II может быть представлено в виде оо •Г ~ 71—-1 где ап = <х, еп> и I ап |2 = ||*||2- Более того, если у = = ^^=1 Pn^n—это другой вектор из II, то для того, чтобы х=у, необходимо и достаточно (в силу линейной независимости е,) равенство ал -- 0n, п =-= 1, 2, ... Таким образом, х из 11 однозначно определяет вектор (ап а2» ...) из /2, и нетрудно убедиться
в том, что это соответствие линейно и взаимно однозначно. В то же время, если (alt a2, ...) — произвольный вектор из /2» то РЯД ai^i сходится в Н (так как последовательность усеченных сумм есть последовательность Коши). Таким образом, мы можем заключить, что пространство Н изоморфно /2. Равенство Парсеваля Sn | <х, еп) | 2 =- ||х||2 показывает к тому же, что это соответствие еще и изометрическое. Поэтому каждое сепарабельное гильбертово пространство изометрически изоморфно (конгруэнтно) пространству /2- Упражнения 1. Докажите, что ядро каждого линейного преобразования замкнуто. 2. Приведите примеры неограниченных операторов с замкнутыми и незамкнутыми ядрами. Указание. Постройте какое-нибудь декартово произведение замкнутых (незамкнутых) линейных пространств. Определите линейное преобразование на произведении. 3. Рассмотрите линейное пространство R2. Убедитесь, что каждый из операторов, выписанных ниже, является линейным и накрывает R2. (а) 7\ [(gj, £2)1 = (a£i’l а^)» где а — некоторое вещественное число. Результат воздействия 7\ заключается в умножении каждого вектора из R2 на скаляр а. (б) — (?2, £i)- Т2 отражает R2 относительно диагонали хх - х2. (в) Т3 [(^, |2)1 " (L 0). Т3 проектирует R2 на ОСЬ Хр (г) Т4 Kli, £2)] = (0, g2). Т4 проектирует R2 на ось х2. Покажите, что этим операторам соответствуют следующие матрицы: 'а 0 1 .0 aj ’ (а) '0 Г 1 oj ’ (б) 4 0 го о 0 0 J ’ 0 1 (В) (Г) 4. Пусть N — произвольное нормированное линейное пространство. Покажите, что всякое линейное преобразование некоторого конечномерного пространства X в N непрерывно. Указание. Выберем в X некоторый базис е2, ..., еп}. Произвольный вектор х из X может быть однозначно записан в виде Х — а1А + а2е2 + ••• + Отсюда мы найдем, что А (х) = avA (ei) + а2Л (е2) + ... + ап4 (еп). Воспользуйтесь тем фактом, что сходимость в X обязательно должна быть покоординатной. 5. Пусть N — некоторое конечномерное линейное пространство размерностью п > 0, и пусть {q, е2, ..., еп} — один из базисов этого пространства. Каждый вектор из N можно однозначно представить в виде х = + а2е2 + ... + апеп. Если Т — это взаимно однозначное линейное преобразование W на (п), задаваемое условием Т (х) = (ах, а2, ..., с^), то в силу результата упражнения 4 преобразование Т~1 непрерывно. Докажите, что непрерывно и преобразование Т.
Указание. Если Т не] непрерывно, то для некоторого е > 0 найдется такая последовательность {уп} из N, что уп -> 0, а ЦТ (уп)|| > е. Обозначим через хп вектор уп ЦТ (i/n) ||. Ясно, что zn -> 0 и что ЦТ (zn) || = 1. Подмножество, состоящее из всех векторов единичной нормы, компактно (см. приложение 1), и у последовательности {Т (zn)} найдется подпоследовательность, сходящаяся к некоторому вектору единичной нормы. Теперь остается лишь воспользоваться непрерывностью преобразования Т“1. 6. Обозначим в этом упражнении через Н некоторое гильбертово пространство, в котором заданы замкнутые подпространства {Afj}, служащие областями значений соответствующих ортогональных проекций Докажите следующие утверждения: (а) Произведение PiP2 является проекцией тогда и только тогда, когда РХР2 = Р2Рг. Областью значений проекции Р±Р2 служит замкнутое подпространство Мх П ^2* (б) Два подпространства Мх и М2 ортогональны тогда и только тогда, когда РХР2 = Р2РХ = 0. (в) Любая конечная сумма Р = Рг + ... 4-Рп является проекцией в том и только в том случае, когда PtPj = 0, i =/= /, т. е. когда подпространства {М^. i = 1, ..., п} попарно ортогональны. Область значений проекции Р — это подпространство М ~ Мх ф ... ф Мп. (г) Разность Р = PY — Р2 двух проекций может быть проекцией в том и только в том случае, когда М2 CZ Мх. Область значений проекции Р представляет собой ф М2. 7. Линейное преобразование Т линейного пространства на другое линейное пространство Y является изоморфизмом тогда и только тогда, когда удовлетворяется одно из следующих эквивалентных условий: (а) Ядро NT преобразования Т состоит из одного 0. (б) Существует линейное преобразование Т пространства Y на X такое, что Т' Т п ТТ' являются тождественными операторами в X и Y соответственно. (в) Т (5) является базисом У, если только S = — это некоторый базис в X. Докажите это. 8. Напомним, что каждая функция f (z), аналитическая в круге | z | < 1, может быть разложена в ряд Тейлора оо /(г)=2«пл 1ч<1. о Этот ряд равномерно сходится в каждом из замкнутых кругов | z | R <1. Обозначим через Н2 множество всех тех аналитических функций / (z), для которых их коэффициенты Тейлора квадратично-суммируемы: оо 21»пР<~. о Докажите, что (а) Н2 — линейное пространство; оо (б) </,g> = 2апьп (/=2a«zn’ f=^ibn^n)> о (в) преобразование, отображающее / (z) = anzn из Яа в последовательность (а0, аь ...), является изометрическим изоморфизмом, отображающим Н2 в 12. В частности, Н2 — это (сепарабельное) гильбертово пространство. (г) Постройте в Н2 некоторое полное ортонормальное множество.
9. Пусть [л, — некоторый замкнутый промежуток, а р (/) — произ- вольное положительная функция, определенная на [я, Ь]. Тогда £2 (а» и) изометрически изоморфно Ь2 (0, 1). Докажите это. показав сначала, что / -* //ц — это изометрический изоморфизм, отображающий Ь2 (а, Ь; р) на Lz(a, b). Затем покажите, что отображение Т, где (Т/) ($) = У (а 4- (Ь - я) «*?), О < s < 1, также является изометрическим изоморфизмом, отооражающим L2 (а, Ь) па L2 (0, 1). 10. Система, символически показанная на рис. 2.10, я, осуществляет скалярнозначное умножение одного сигнала, зависящего от времени, на другой и описывается уравнениями . ( а (О и (0. * > 1 I 0, t < to. Какие условия нужно наложить на множитель а (/) для того, чтобы систему можно было рассматривать как некоторый оператор в L2 (т) или I (т) (в предположении, что /0 ЕЕ т)? Линеен ли этот оператор? Определите липшицеву норму этого оператора, если а (/) — t/V\ + /2,( t ЕЕ т, а пространство входных и выходных сигналов есть В (— оо, сю) (см. пример 7 из § 1.4). Рис. 2.10. Три физические системы. И. На рис. 2.10, б показана схема стандартного ЯС-контура с переменной емкостью С (t) = 1 + Z2, t ЕЕ [0, &]. При каких условиях эту систему можно рассматривать как линейный оператор в С (0, Ъ) или Ь2 (0, &), если выходным сигналом здесь считается напряжение на активном сопротивлении, входным — напряжение источника питания и если начальный заряд на емкости q (t0) полагается равным д°? 12. Система, показанная на рис. 2.10, в — это простая линия задержки • Другими словами, здесь х (t) = и (t — т). Для функционального пространства ограниченных синусоид, определенных на (— ею, оо), исследуйте линейность этой системы п определите норму оператора, ее описывающего. 2.3. Однородные системы первого порядка В § 2.2 мы обратили особое внимание на преобразования, определенные в примерах 6 и 7. Это внимание вполне заслужено, поскольку эти два примера охватывают характеристики широкого класса систем. В оставшейся части этой главы мы отложим на время изучение общих свойств функций и пространств и сосредоточим внимание на изучении двух специфических классов систем, входящих в общий класс, очерченный в этих двух примерах.
Дифференциальные уравнения представляют собой классическое средство математического описания таких физических устройств, как электрические цепи, механизмы и систем]»! вообще. Это, безусловно, известно читателю. В более поздний период появление цифровых вычислительных машин в качестве активных элементов привело к широкому употреблению конечноразностных уравнений для целей математического моделирования. В связи с этим совершенно ясно, что материал *нескольких разделов, следующих ниже, представляет интерес и сам по себе. Переходя к изучению этого материала на настоящей стадии знакомства с общей теорией систем, мы получим также и двоякую возможность: с одной стороны, укрепить наше понимание теории преобразований и функциональных пространств, а с другой стороны, построить большое число физических примеров, к которым мы сможем обращаться в последующем. В дифференциальном исчислении производная функции / GE С [а, Ы определяется как предел при h —>0 отношения + М + *е|«,Ц. Этот предел называется, соответственно, правой, производной/ в точке t, если h > 0, и левой производной, если h < 0. Если же эти два предела равны, то мы говорим, что у / есть производная в точке L В последующем для обозначения производной / в точке t мы на равных правах будем использовать символы / (0, (df/dt) (0 и (d/dt) / (0. При исчислении конечных разностей мы рассматриваем непосредственно частное и не устремляем h к нулю. В этом случае мы определяем разностный оператор, обозначаемый через Дл, с помощью соотношения А„/(0 = + , t, t + /»Е [а, Ь]. (1) Нетрудно показать, что оператор линеен. Приведем четыре важных свойства этого оператора: = cbhf (0, (2) Ah[/(t)+ g(01 = Ah/(Z) + Ahg(i), (3) А,. [/ (0 g (01 = [A/J (Ok(0 + f(t + h)-[&hg (01. (4) f (0 ~l g(O\/(Q-/(')\g(') hL*(0 J g(t)g(t + h) • [) В приложениях, относящихся к динамическим системам, дей-ствующим непрерывно, т. е. к системам, в которых независимая
переменная t непрерывна, сигналы и реакции на них описываются функциями времени. В системах же, действующих дискретно (импульсных или цифровых), сигналы описываются временными последовательностями либо принимают значения лишь в дискретные моменты времени. Определение разностного оператора на временных рядах очевидно. Пусть т — некоторый вещественный временной интервал, содержащий подмножество а ={*о> Ь» •••> •••} такое, что > О* Если функция / (/) определена на т, то / определено и на o', и образом / (о) является множество точек {/(£&)}. Это множество представляет собой временной ряд / = (/ (/0), / Gi)» •••♦ / (fy)» •••)• Разностный оператор можно определить на этой последовательности. В самом деле, положим hk — — tk, тогда - v1 (6) После такой модификации определения разностного оператора мы можем распространить все приведенные выше формулы и на случай временных последовательностей. В оставшейся части этого параграфа мы будем заниматься теорией систем, описываемых дифференциальными или конечноразностными уравнениями первого порядка следующего вида: = (0 + ---«1п(0хп(0, : : : t е т dx (t) = ап1 (0 xL (t) + . . . + апп (t) хп (0 в непрерывном случае и А*У1 GO = an (М Уг (*/с) + • • • + Яш G/c) Уп (М> ЬкУп (М = «м У1 (tk) + . . . + ann (tk) yntk в дискретном случае. Здесь мы пользуемся терминами «дискретный случай» и «непрерывный случай» для того, чтобы определить характер независимой переменной, действующей в системе, а не для того, чтобы ограничить каким-либо образом непрерывность коэффициентов axj и функций Xj. Системы, описываемые уравнениями первого порядка такого типа, называются нормальными. В упражнениях к этой главе и в приложении 4 показывается, что к нормальному виду с помощью стандартной и легко выполнимой замены переменных можно привести дифференциальные и конечноразностные уравнения гораздо более общего типа. Поэтому результаты, полученные при
изучении нормальных систем, можно непосредственно перенести на более широкий класс систем. В последующем независимую переменную, какова бы ни была ее физическая сущность, мы станем называть «временем» и обозначать через t или tk. В общем случае коэффициенты ац могут быть функциями времени. В этом случае нормальная система называется нестационарной (или с переменными параметрами). Если же оказывается, что коэффициенты а^ от времени не зависят, то нормальную систему называют стационарной (или системой с постоянными параметрами). При построении теории систем нормального вида существенную пользу приносит введение векторно-матричных обозначений. Помимо обычных векторно-матричных операций в Rn нам потребуется ввести производную от матрицы, конечную разность матриц, интеграл матрицы и т. п. Эти определения имеют совершенно естественный вид. Пусть А = [ai7l — некоторая нестационарная матрица. Тогда, по определению, т- = (MJ. Аналогичным образом вводятся определения интеграла и суммы матриц: t i A (s) ds = aij (s) ds] , о о n n 2 (^к)= [ 2 av (mJ • fc=l R=1 Дифференциальное и конечноразностное матричные исчисления совершенно аналогичны соответствующим исчислениям для вещественных функций, хотя здесь и имеется несколько важных отличий. Из только что приведенных определений следует, что если А (0 и В (t) — две квадратные матрицы, зависящие от непрерывного времени, а С (tk) и D (tk) — квадратные матрицы, зависящие от дискретного времени, то Г л । А? /Л] (О । dB (t) ~dt + В = "ST" + "dF" ’ Д/с [С (М + D (ffc)] = A/jC (tk) + &kD (tk), А(ДВ)(0= + 8 Ait \C (t„) D (Ml = (AkC (Ml D (tk) 4- C (Mi) [A.D (Mb (8)
Но так как умножение матриц в общем случае не коммутативно, здесь становится важным порядок сомножителей. Например, если у матрицы A (t) есть обратная A"1 (t), то 47=°=4 <Л-1Л) = А +Л-1 м Чг и, значит, = - А'1 (0 А-1 (0. (9) Точно так же, если матрица С (t^) не вырождена ни при ни при ^Лг+1» то о = д^ дне чм с’(М1 - [Д^с-1 (Ml с со + C4W и, следовательно, дкс-1 со = с-1 (^0 [ д,с (Ml с-1 (М. (10) Эти формулы аналогичны формуле [dx~l!dt) = — ж-2 (dxldt) элементарного анализа, но не могут быть упрощены до этого вида, если только матрица А не коммутирует, скажем, с матрицей dAldt. Теоремы существования и единственности для дифференциальных систем. Рассмотрим сначала системы, поведение которых в момент времени G г ::= [а, Ы описывается дифференциальным уравнением ^- = A(t)y(0; y{t0)=l, 0toer. (11) Здесь у = (ух, ..., yn), g = (gp ..., gn), а через А = [ai7] обозначена квадратная матрица n-го порядка. Нам необходимо ввести дополнительные предположения относительно свойств элементов aij матрицы А, и для начала мы предположим, что ai;- GE С (т) — классу функций, непрерывных на т. В этом случае мы будем называть матрицу А непрерывной. Интегрируя обе части уравнения (И), мы можем представить его в эквивалентной форме: t y(t)=l + \A(s)y(s)ds, t(=r. (12) G Всякий вектор, удовлетворяющий любому из этих уравнений, называется решением уравнения (или траекторией системы). Значение решения в точке ГЕ г при условии, что у (tQ) = £, мы будем обозначать через у (t, £, t0), ТеоремаЛ. Пусть матрица А непрерывна на т. Тогда для каждых tQ, t ЕЕ т и ||£|| < оо существует единственное решение уравнения (И).
< Доказательство, Для того чтобы упростить выкладки, договоримся обозначать через |( || любую норму, определенную на Яп, а через ||А (£)] — соответствующую норму матрицы A (t), рассматриваемой как некоторое отображение на Rn (см. пример 5 из § 2.2) Пространство X считаем произведением {С (т)]п. Познакомимся теперь с одним методом, часто используемым для доказательства теорем существования и единственности,— со знаменитым и фундаментальным методом последовательных приближений, принадлежащим Пикару. Для этого рассмотрим последовательность (векторных) функций, индуктивно определенных следующим образом: Уо(0 = В, Моет, t J/1 (0 - В 14 Л (*)y»(s)ds, to : ; аз) f Уп+1 (0 = В + $ л (s) уп (s) ds, п = 0, 1, 2, . . ., to где мы воздержались (временно) от использования развернутого обозначения у (f; £, t0). Нижние индексы в уравнениях (13) указывают на различные этапы индуктивного процесса вычисления (а не на различные компоненты вектора). Такое двойное использование индексов практикуется на протяжении всего этого параграфа, если не возникает опасность их смешения. Нам надо показать, что последовательность векторных функций {yj} равномерно сходится к некоторой функции у (£) при всех t €= т. Если это удастся, то нам придется доказать, что функция У (0 удовлетворяет уравнению (12), а затем уже — что функция у (t) является единственным решением этого уравнения. Легко показать, что каждая из итераций Пикара уп представляет собой некоторый элемент пространства X, которое в качестве произведения конечного числа банаховых пространств само является банаховым. Поэтому, если бы мы могли показать, что итерации Пикара образуют последовательность Коши, то полнота пространства X гарантировала бы нам, что уа^уЕЕХ. Из интегральных рекуррентных соотношений (13) мы находим t УппЩ — M0 = ^(s)|y„(s)- yn-i(s)\ds, п>1. (14) to Введем для удобства обозначение Т siipT||/l (т)|| и определим Дп+i (0 = || Уп+i (О Уп (О II-
Тогда, вычисляя норму обеих сторон равенства (14) и используя легко проверяемое соотношение t t |$4(s)y (s)ds[<$||4(s)|| • ||j/(s)||ds, t0 1q мы найдем, что t Д» (Z)< A $ Дк_! (s) ds. to Однако для к = 1 из уравнения (13) следует, что t Го С помощью несложного процесса дедукции мы найдем из уравнения (14) Дпн (0 = I Упп (0 - Уп (/) И< и(* ~ fo)r' « = 0,1,2,... (15) Располагая теперь этим неравенством, мы можем показать, что последовательность {уп} является последовательностью Коши по отношению к выбранной норме. Доказательство этого факта выглядит следующим образом: р—1 Уп+р (О Уп (О = 2 [.Уп+i+i (0 Уп+j (0L 2=0 что позволяет самому читателю убедиться в справедливости для t х следующих неравенств: р—1 р—1 п+У+1 Ц</п+р (О Уп (0 || S ^n+;+i (0 2 НИ I /^| 1 2=0 2=0 ' ~ ' ||^||[Л«-/о)]п+1 у1 [Л(е—*>)]' <-Н11^(*-'’)Г+1рХп1Т^ /М ----(iT+iji---Д /! (п + 1)| — ехР 1-1 (« - i0)l- (16) Таким образом, мы доказали сходимость рассматриваемой последовательности на любом конечном интервале, а это позволяет заключить, что уп (0 -^у (0 при п —>оо. Остается лишь показать, что у (0 единственно и, конечно, что у удовлетворяет уравнениям (11) или (12).
Предположим, что, на самом деле, уравнению (11) удовлетворяет некоторая функция z, т. е. что = A (t) z (t), z(t0) = i, r0, zer. Вычислим разность между z (0 и (п + 1)-й итерацией последовательности Коши, рассматривавшейся выше: t t Z (0 — Уп+1 (О =$4 (S) [z (s) — yn (s)] ds = §4 (s) [z (s) — yn+1 (s)] ds+ to t0 t + § 4 (s) [i/n+i (S) — yn(s)]ds, zer. Тогда используя соотношения, полученные ранее, мы видим, что IIZ (0 — Уп+1 (01|< $ || A(S) | • || z (s) — yn+l (s) || ds + J (t —t0) Дп+а. to Теперь нам понадобится результат следующей леммы. Лемма А. Если функция у G С (tQ, tf) и f ЕЕ Lx (f0, tf) удовлетворяют неравенству t | У (t) I < м [1 4- k $ IУ (О I • I/ (О I dt], t е= [f0, tf], to то справедливо и неравенство | у (Z) | < Af exp {fcdf 51/(01^}- *>*о- I, Пусть в рассматриваемом случае М(0|1 = 1/(01, И(0-Уп+1(011 = 1уЮ|. M = ±=A(tf-t0)AMi(t). а Тогда в силу только что сформулированной леммы IIZ (О — Уп+1 (0II < A (tf — t0) Дп+2 exp {J || A (s) |]ds}. (17) to
Но так как Дп+2 ->0 при и ->оо, a {yn+1 (t)} сходится, то на основании неравенства (17) уп равномерно сходится к z. Заметим, что, по определению, z — это произвольное решение уравнения (И). Но последовательность {уп}, будучи последовательностью Коши, сходится всегда к единственному пределу. Поэтому z — это единственное решение уравнения (И), и итерации Пикара сходятся к этому решению. В предыдущих рассуждениях мы упустили из виду два факта, про которые легко забыть, но которые необходимо выяснить, прежде чем двигаться дальше. Прежде всего, поскольку решение у €Е X непрерывно, уравнение (12) можно продифференцировать и получить из него уравнение (11), откуда следует, что dx/dt также принадлежат X. И вообще говоря, гладкость dxldt определяется гладкостью матрицы А. Кроме того, нам необходимо доказать лемму А, что совсем несложно. Доказательство леммы. Умножим обе стороны первого неравенства на /(0 |: t |У (01 • (/(01<ЛГ |/(0|[1+Л$ |у(01 • I/(О|Л]. to St \у (t) f (0 I Л. Тогда предыдущее не-to равенство цожно интерпретировать следующим образом: у(0<л/|/(0| [1 +М01. или Интегрируя обе части, находим t In (1 +kv(t))<kM$ |/(0 |Л. to откуда t t l+A:$|/(0y(O|^<exp[fcAf$|/(t)|d/]. to Но в силу исходной гипотезы t to что в сочетании с предыдущим дает t \y(t)\<Mexp \кМ $|/(01 di.
Приведенный результат является всего лишь одним из обширного числа фактов, относящихся к проблеме существования решений задачи Коши (задачи с заданными начальными условиями). Действительно, предположения теоремы А гораздо сильнее того, что требуется, и в качестве примера типичных обобщений мы сформулируем еще две теоремы без доказательств. Теорема Б. Пусть А — матрица, норма которой |р4|| 6= (т). Тогда уравнению (И) удовлетворяет некоторая единственная абсолютно непрерывная*) векторная функция у такая, что у (t0) = £. Замечание 1. В теореме Б предполагается использование интеграла Лебега, а об уравнении (И) считается, что оно удовлетворяется на т почти всюду. Читатель с элементарными познаниями теории меры легко видоизменит предыдущее доказательство так, чтобы получить этот более общий результат. Важно специально отметить, что даже при нынешних довольно слабых условиях, наложенных в теореме Б на вид матрицы А, единственное решение у уравнения (11) по-прежнему остается элементом пространства X. Для того чтобы указать на другую возможность обобщения, обозначим через р — (рх, ..., pR.) Л-мерный вектор параметров. Пусть А (/, р) есть некоторая функция t и р, определенная на (к + 1)-мерном пространстве т х v, где v — некоторая открытая шаровая окрестность вектора р0. Т е о р е ма В. Если функция A (t, р) непрерывна по р и удовлетворяет условиям теоремы Б по t на т х v, то уравнение (t; t,, t0, н) = А (*, н) У (*; £, <0. и). у (*0; *0> и) = t, н) е т х и, имеет единственное решение, непрерывное по всем параметрам рх, ..., pfc и t для любого tQ S т и р GE U. В частности, параметрами р могут быть начальные условия, задаваемые в точке t0. Поэтому решение у (£; £, t0) должно быть непрерывным и по £. В самом деле, если {ик} есть некоторая последовательность параметров из U и ик —то решения уравнения (11) У (<; £, t0, uk) -+у (t; £, to, и). Мы показали, что для каждого £ Ez Rn существует единственное решение уравнения (И). Обозначим через х множество всех таких решений и займемся исследованием его свойств. Ясно, что множество к представляет собой линейное пространство. (Читатель в качестве упражнения может доказать, что если yv у2 ЕЕ х, т. е. *) Грубо говоря, это функция, представимая неопределенным интегралом некоторой функции из
являются решениями этого уравнения, а ах и а2 — произвольные скаляры, то вектор atyY + &2У2 Еп.) . •• г. Теорема Г. П одпространство х является п-мерным. Доказательство. Для того чтобы доказать n-мерность подпространства х, необходимо построить какое-нибудь множество линейно независимых векторов z/x, уп такое, что каждый вектор J/i Е х и любой г/ 6= х можно представить в виде линейной комбинации {yt}. Обозначим через {tj множество п линейно независимых постоянных векторов из пространства Rn. Тогда в соответствии с теоремой существования для любого /0Et найдется п однозначно определенных решений {уг Zo)} уравнения (И) таких, что z/i (Zo) = Доказательство того, что эти решения образуют базис подпространства х, мы начнем с того, что покажем, что векторы {у^ (/; /0)} образуют линейно независимое множе- ство в 7?п при каждом t ЕЕ т. Если бы это было не так, то необходимо нашлось бы п скаляров {cj, среди которых есть и ненулевые, таких, что по крайней мере при одном t ЕЕ: т п У (/ ) = 2 СгУг ’ Si’ *о) = 0. г=1 Однако определенная таким образом функция у является решением уравнения (И). Если у (f) = 0, то у (/) — 0 при всех t Е_- т, так как нулевой вектор удовлетворяет уравнению (И) и нулевым начальным условиям в точке f, а решение уравнения (И) при каждом начальном условии должно быть единственным. Но отсюда следует, что п п У (^о) = 2 Ci^i (^0’ Si? *о) = 2 CiSi = 0, i=l i=l а это противоречит предположению о нелинейной независимости векторов Следовательно, множество {jZi (^; Si» М} линейно независимо при любых Е т. Если же у (/; £, /) есть произвольное решение уравнения (11), определенное на т, то поскольку натягивают на себя все пространство возможных начальных условий, существуют (единственные) постоянные c-t такие, что п ? = S <&• i=l Но функция 11 У (0 ~~ 2 ^i^i Sb ^о) г=1
является решением уравнения (11) на т и принимает в точке t0 значение £, а значит, в силу единственности решений задачи Коши оно должно быть равно у (t; £, t0): п У ^о) = 2 с1Уь Go! Сь ^о)« г=1 Таким образом, каждое решение у уравнения (И) представимо в виде (единственной) линейной комбинации {^}, и, значит, множество {у{ (t)} образует базис пространства х. Фундаментальные матрицы решений. Матрица Ф(0, каждый из п столбцов которой образует один из векторов некоторого базиса {z/i (t\ f0)} пространства х, называется фундаменталь- ной матрицей решений уравнения (И). Матрицу Ф (t) можно называть также фундаментальной матрицей ядра х. Простая проверка легко показывает, что Ф (0 А (0 Ф (0, Ф (f0) = Z при всех t е т. (18) Так выглядит матричное дифференциальное уравнение, соответствующее уравнению (И), определенному на т. Здесь через Z обозначена матрица, образованная векторами начальных условий играющих здесь роль столбцов. Если соответствуют обычному координатному базису в Rn, то Z = /. В теории систем фундаментальные матрицы играют важную роль. Для последующих ссылок мы отметим сейчас некоторые из их основных свойств. Теорема Д. Обозначим через |Ф (0| определитель фундаментальной матрицы Ф (0 решений уравнения (11). Тогда п -*-|ф(0| = [3 а«(0]|Ф(0| г=1 или, в интегральной форме, t п | Ф (<) | = | ф (<0) ехр 2 аи («)ds} • U 1=1 «п [С величиной 2ji=1 аи (0 в теории матриц сталкиваются очень часто, и поэтому для нее ввели специальное название. Ее называют следом матрицы А (0 и обозначают через tr (А).] Доказательство. Доказательство, которое мы предлагаем построить читателю, базируется на двух следующих фактах: (1) d \ Ф (0 | /dt представляет собой сумму определителей, образованных в результате замены элементов одной строки | Ф (01 на их производные.
(2) Столбцы Ф (0 представляют собой решения уравнения (11). Доказательство состоит в упрощении определителей, полученных на первом этапе, с помощью (2). Следствие. Для того чтобы матрица Ф (0 была фундаментальной матрицей решений уравнения (11), необходимо и достаточно, чтобы (1) Ф (t) = A (t) Ф (0 при всех t GF. т; (2) | Ф (0 | =/= 0 при всех t е т. И необходимость, и достаточность выписанных здесь условий (1) и (2) непосредственно вытекают из определения и теоремы Д. Матрица, вектор-столбцы которой являются линейно независимыми элементами пространства [С (т)]п, может иметь определитель, тождественно равный нулю на промежутке т. Например, это справедливо для матрицы t t2 В(/)= о о на любом вещественном интервале т. Смысл сформулированного следствия как раз и состоит в том, что равенство определителя нулю невозможно, если эти векторы представляют собой решения уравнения (И). Теорема Е. Если Ф (0 — некоторая фундаментальная матрица решений уравнения (11), а Н — произвольная невырожденная матрица, то Ф (0Я есть новая фундаментальная матрица решений уравнения (11). Более того, каждая фундаментальная матрица решений уравнения (И) может быть представлена в виде такого произведения с некоторой невырожденной матрицей Н. Доказательство, Если Ф (0 — некоторая фундаментальная матрица решений уравнения (11), а Я — произвольная постоянная невырожденная матрица, то [ф (О Я1 = ф (0 н = а (0 ф (0 н = а (0 [ф (Z) Я], t е т, и, следовательно, матрица Ф (0Я есть решение матричного уравнения (11). Но так как |(Ф (0 Я] | = |Ф (0|.|Я| ^0, то матрица Ф (0 Я и должна быть фундаментальной. Обратно, если Фх (0 и Ф2 (0 — две фундаментальные матрицы, то теорема утверждает, что существует некоторая постоянная невырожденная матрица Я такая, что Ф2 (0 = Фх (0 Я. Для того чтобы показать это, положим Ф'1 (0 Ф2 (0 = Т (0. Тогда Ф2 (0 = фг (0 (0. Дифференцирование этого равенства дает Фа(0 = Фх(0У(О+ФхТ(0.
Это уравнение, используя (11), можно переписать в виде А (0 Ф2 (0 =- Ф, (/) 4 (0 4 А (0 Ф, (0 т (0. Но так как Ф2 (0 = 4^ (0 Тх (0, то ФД0 Т(0 = О, а это значит, что 4* (0 - 0, и, следовательно, Т (0 = II — const. К тому же, поскольку Фх (0 и Ф2 (/) невырождены, то невырожденной должна быть и матрица II. Замечание 2. Если потребовать только, чтобы Ф2 (0 была некоторой матрицей решений, то Я может оказаться и вырожденной. Отметим еще, что если Ф (0 есть некоторая фундаментальная матрица решений уравнения (И), а Я — некоторая постоянная невырожденная матрица, то матрица ЯФ (0, вообще говоря, не является фундаментальной матрицей этого уравнения. Наконец, две различные однородные системы не могут иметь одинаковых фундаментальных матриц, поскольку из уравнения (И) следует, что А (0 = Ф (0 Ф"1 (0. Таким образом, Ф (0 однозначно определяет А (0, хотя обратное и неверно. Выше нам было удобно избегать развернутых обозначений Ф (0 Z, t0) для фундаментальной матрицы, удовлетворяющей начальному условию Ф (0; Z, t0) Z. В этом разделе мы обратим особое внимание на свойства фундаментальной матрицы, соответствующей координатному базису в пространстве начальных состояний. Определение А. Обозначим через Ф (0 t0) фундаментальную матрицу решений уравнения (И), удовлетворяющую условию Ф (0, 0) = I. Эту матрицу мы будем называть матрицей перехода для системы (И). Термин «матрица перехода» объясняется тем, что у (0 £, 0) = Ф(0 t0)^ ter. (19) Таким образом, матрица Ф (0 t0) отображает начальные условия У (0) — £ в текущее состояние системы у (0 £, t0) для каждого t €= т. Кроме того, легко видеть, что если Фх (0 — фундаментальная матрица, удовлетворяющая условию Фх (0) — Я, то Фх (0 = Ф (/, t0) И. (20) Замечание 3. Важное значение имеют два следующих свойства матриц перехода: Ф (0, 0) Ф (0, 0) = Ф (0, 0), 0, 0, 0 е т, (21) Ф (0, 0)-1 - Ф (0, 0). Доказательство справедливости этих утверждений мы оставляем читателю.
Замечание 4. Уравнение (19) можно интерпретировать двумя способами, каждый из которых может оказаться полезным. Во-первых, его можно считать характеризующим линейное преобразование Ф: Rn ->х, где (Ф£) (/) = у {t\ £, Zo), по мере того как t пробегает т, а во-вторых, его можно рассматривать как параметризованное множество {Ф (Z, £0): преобразований, оп- ределенных на Rn. Пример. В качестве иллюстрации к предшествующему материалу рассмотрим линейную однородную систему •< xf (t) -= A (t) х (О, где А (0 — матрица *) 4(0 = -2 - ef ' .е~‘ 1 . Непосредственной подстановкой читатель может убедиться в том, что этому уравнению удовлетворяют два вектора: г e^cost 1 г — e^sin Г| = I sin < J ’ = L е* cos t J ‘ А так как фх (0) = col [1, 0] и ф2 (0) = col [0, 1] **), то мы приходим к выводу, что матрица Ф (£), вектор-столбцами которой служат фх и ф2, удовлетворяет условиям Ф(0 - А (О Ф (О, Ф(0) - 1. Если матрица А постоянна, то Ф (Z, tQ) можно найти, подставляя в выражение для Ф (Z) разность t—t0 вместо t. В нашем случае матрица А непостоянна, и нам придется пойти на дополнительные хитрости. Опираясь на тождество Ф (f, tn) Ф 0) — Ф (t, 0), мы найдем, что Ф (/, /0) = Ф (Z, 0) Ф”1 (/0, 0). Нетрудно убедиться в том, что если re2t cos t Ф(г,О) = t . , ' ' I sin t — e^sinT e* cost. то г e~2t cos t е~* sin t e-'cost *) Пример заимствован из работы [А.95], стр. 343. **) Так автор обозначает вёктор-столбцы с координатами 1 и 0 или 0 и 1 соответственно. (Прим, ред.)
Отсюда непосредственным вычислением найдем, что Ф(Мо) = 'ё* cos t е* sin t — е** sin t "I г е~*° cos t0 e* cosfj * I — e”2f°sinf0 e_/osin Zo cos tQ re(-2/-2Zo)COS (t — Zo) Le(r2fo)sin (t — tQ) — e<2*-'o)sin (t — f0)"l £<*-*•) cos (t — e0) J Упражнения 1. Обозначим через f (t) функцию Л”1 [/ (/) — f (t — Л)]. Покажите, что уравнения (4) и (5) сохраняют свою силу после замены Д^ на V^. 2. Пусть Eh — оператор сдвига: Eh f (t) = f (t + h). Покажите, что Д/i = h~' (Eh - I), Vh = h-i (I - Eh) и Ah = Vh. 3. Определяя по индукции целые степени Дл и Eh (например, Д£ / (t) = Ah [A”-1 / (()]). покажите, что Д£ = h~3 (E3h — 3E% + 3Eh — I). 4. Пользуясь обозначением (jj) = nV [(fc — n)l fc|], покажите, что если п — некоторое положительное целое, то Д^(0 = Л-п 2 Q(-l)n-^y(t). Указание. Воспользуйтесь формулой бинома Ньютона. 5. Пусть f (t) = с1, где с — некоторое положительное вещественное число. Воспользуйтесь результатом упражнения 4 для того, чтобы показать, что Д£с« = Ъгпс1 Отметьте, что эта сумма представляет собой развернутое выражение для (<Л — 1)п и что, следовательно, предыдущий результат можно переписать в виде t t 6. Проверьте, что | А (з) у (s) ds | < || A (s) || • || у (s) ||. 6 о Указание. Воспользуйтесь нормами из уравнения (4) для доказательства частного случая, а также фактом эквивалентности всех норм, определенных на конечномерных пространствах. 7. Завершите доказательство теоремы Д и ее следствия. Убедитесь в справедливости замечания 2. 8. Рассмотрим матричное дифференциальное уравнение Х = L2 У Х = АХ.
Покажите, что = col (—to\ <0^) и х2 = col (е3^ f°^), е3^ <0Ь являются решениями этого дифференциального уравнения. Покажите также, что Ф (/, Ч = е-0-М e3(f-fe)“ е-(*-М e3(f-fe) есть фундаментальная матрица решений этого уравнения. Теоремы существования и единственности траекторий дискретной нормальной системы. Интересно отметить, что все результаты предыдущего раздела, без каких-либо исключений, находят себе эквивалент в теории дискретных нормальных систем. В этом разделе мы строго сформулируем и докажем наиболее важные из этих параллельных утверждений. В начале этой главы мы уже говорили о том, что разностный оператор Д можно определить как оператор, действующий на функцию / (f), tfEiX, либо как оператор, действующий на временной ряд / (tk), tk€E<j. Для большей ясности в этом разделе мы будем говорить лишь о разностных операторах в пространствах временных последовательностей. Линейная нормальная дискретная система описывается уравнением Д/с У (h) — A (tk) у (tk); у0 (t0) — £, tk е tf» (22) представляющим собой, по сути дела, некоторое рекуррентное соотношение. Действительно, если вспомнить определение оператора Дк, то станет ясно, что уравнение (22) можно переписать в другом виде: У (^♦i) 1-^ 4~ hkA (Ml У (М» У (М — (23) В результате мы получили рекуррентную формулу для вычисления последовательности {у (М), Л = О, 1,... На самом деле многие авторы даже предпочитают это второе выражение в качестве основной формы описания дискретной линейной системы. Наше исследование таких систем мы начнем с доказательства следующей теоремы. Теорема Ж. Пусть A (tk) — квадратная матрица порядка п, определенная для = {£0> М •••» М •••}• Тогда существует единственная последовательность вектор-столбцов {У (М}> удовлетворяющая уравнению (22). Доказательство. Определим векторы у (tk) следующим образом. Пусть V («•) =>о-
Тогда, поскольку у (/к+1) = [Z + hkA (/k)l у (/k), то последовательность У1 = У (*х) = I/ + h0A (t0)]y0, У2 = И + М = IZ + htA (rj] [Z + h0A («о)]уо определяет решение, удовлетворяющее условиям теоремы. Для .доказательству единстренности предположим, что условиям теоремы удовлетворяет и последовательность {zfc}. Но тогда zo ~ Уо» Z1 = [Z + М (1о)]Уо = У1, 2П= . . . = Уп» и, значит, эти последовательности идентичны, а решение уравнения единственно. Читатель, без сомнения, согласится, что приведенное доказательство много проще доказательства аналогичной теоремы для дифференциального уравнения. Замечание 5. Если A (tk, р,) — некоторая последовательность • квадратных матриц, каждая из которых непрерывна относительно вектора р = (р1? ..., рй) при любом то решение у (tk, Уо» ^о» И) уравнения (22) непрерывно относительно р. В самом деле, для каждого tk: у (tk; у0, /0, р) есть конечное произведение матриц, каждая из которых непрерывна по р и, следовательно, может дифференцироваться по р по стандартным правилам дифференцирования матриц. Теорема 3. Пространство н решений уравнения (22) п-мерно. Если матрицы {[/ + hkA (/fc)J: tk^a} невырождены, то любой базис {фД из к порождает векторы {ф; (^)}, линейно независимые при всех tk GE о. Доказательство. Мы уже убедились в том, что уравнение (22) имеет для каждого начального условия у (t0) = £° в точности одно решение, каково бы ни было £° е Rn- Выберем в качестве базисного множества единственные решения ф1 (tk), ..., фп (tk), удовлетворяющие начальным условиям ф^ (t0) = е\ где {ej} — координатный базис пространства Rn. В соответствии с результатом теоремы Ж базис {ф; (^)} вполне определен. Предположим теперь, что при некотором tk GE o' векторы, составляющие это мно-- жествр^ линейно зависимы. Другими словами, пусть найдется такой набор скаляров ..., ап), среди которых не все равны нулю, что • «1Ф1 («») + ... + апфп (h) = 0- (24) Но так как все удовлетворяют уравнению (22), то Ф^и) = (Z + Ak-M (tk_i)} ф/(«к-1), / = 1.....
и после подстановки этого выражения в уравнение (24) Мы получим п п 2 17 + Лк-хЛ (/к-х)] <р' (tk-х) = |7 + Лк-хЛ (Гк-х)1 2 Л-i) = 0. j=l J=1 Из условий теоремы следует, что матрица [I + hkA (/fc-x)l невырождена. Поэтому п п 2 a-itf (М = о=» 2 (Z*-1) = °- >=1 }=1 Повторяя этот процесс по индукции, мы придем в конце концов к тому, что п п 2 а,ф>(г0) = 2 «Л = °-j=l j=l Однако это невозможно, так как векторы ej линейно" независимы. Это противоречие доказывает линейную независимость ф*7 (ffc) при всех tk (Е о*. Для того чтобы показать, что любое решение z (tk) уравнения (22) есть некоторая линейная комбинация {ф;}, заметим, что при любом tk решение z (tk) есть вектор принадлежащий Rn. А так как ф' (fk), ..., фп (tk) представляют собой п линейно независимых векторов из Rn, то они образуют базис Rn, и, следовательно, существуют скаляры ах, ..., ап такие, что п 2 («к) = 2 ai4>} (tk)-;=i Все входящие в это равенство последовательности удовлетворяют уравнению (22). Поэтому п z (^/с) = + Л/с-14 (£fc-i)l 2 (^-1) = [/ “И Л/с-14 (£fc_1)] 2 CLj(f* (tf/f-1), Z=1 и, следовательно, n 2 (^/c-1) = 2 (^-1)’ ;=i По индукции нетрудно доказать, что во все предшествующие или
последующие моменты tk о 71 z(/R) = 2 а/И(М Для любого tk ЕЕ о, (25) ;=1 что и требовалось доказать. Замечание 6. На первый взгляд кажется, что для условия невырожденности матрицы [I + hkA (fk)] при всех tk ЕЕ о* нет параллелей в теории нормальных непрерывных систем. Однако в теореме 3 из § 2.2 показано, что если hk^A (^)|| < 1, то [I 4-+ hkA (£jf)l невырождена. При малых hk это условие автоматически выполняется. В некотором нестрогом смысле в непрерывном случае роль h играет дифференциал dt. Условия теоремы А как раз и гарантируют тот факт, что ||4 (0||Л — бесконечно малая величина, и, значит, автоматически удовлетворяют гипотезе невырожденности матрицы [Z + </ф4|||. Мы упомянули здесь об этом в основном для того, чтобы освежить память читателя. В качестве конкретного примера уравнения (25) предположим, что Ф (tk, t0) есть матрица, /-м столбцом которой служит вектор ф* (t0)ej. Тогда, если z (t0) = z°, то z (tk) = Ф (tk, t0) z\ (26) и матрица Ф (ffc, tQ) удовлетворяет матричному конечноразностному уравнению Q = Л (tk) Ф (^, tQ), Ф (tQ, t0) = I. (27) Свойства матрицы Ф (tk, t0). Без всякого сомнения, читатель интуитивно предполагает, что матричная последовательность Ф (tk, t0) и матричные функции Ф (tk, tj) должны играть в теории дискретных нормальных систем такую же роль, как и матрица перехода в теории непрерывных нормальных систем. В этом разделе мы попытаемся выяснить, до какой же степени это правильно. Отметим, что с помощью простого сдвига независимой переменной наши предыдущие рассуждения показали бы, что последовательность {Ф (tk, tj)} при любом является решением уравнения А/сФ (tk, = A (tk) Ф (tk, t}y, Ф (t}, tj) = 1, tjG a. (28) В частности, отсюда следует, что Ф (0+i> tj) = (Z + hjA (£>)] Ф (tj, tj) — [Z + h/А (fj)l, tj <T. (29) Отсюда нетрудно получить полугрупповое свойство: Ф (h, tj) ®(t}, k) = Ф (tk, ti), tk, tj, ti e or. (30) В частности, ф (tk, tj) = Ф"1 (tj, tk), tk tj e T. (31)
Любая матрица Ф (tk), образованная линейно независимыми решениями уравнения (22), называется фундаментальной матрицей решений этого уравнения. В частности, матрицей перехода системы мы будем называть матрицу Ф (tk, i0). Замечание 7. Если матрица [I + ^А (^)] вырождена при каком-то то Ф (^, t0) вырождена при tk > и уравнение (31) справедливо лишь при tk, tj < Если любой из аргументов уравнения (30) превышает то это уравнение верно лишь при Так же как и в непрерывном случае, можно показать, что любую фундаментальную матрицу решений уравнения Ф (tk) можно представить в виде Ф (tk) — Ф (^, Q Я, где матрица Н невырождена. Итог всем этим утверждениям подводится в следующей теореме. Теорема И. Пусть A (tk) — некоторая квадратная матрица порядка п, определенная на о*, и пусть матрица [7 + + hkA (£fc)] невырождена на о*. Тогда матрица Ф (ffc, Q, удовлетворяющая уравнению (28), является единственной, невырожденной и удовлетворяет уравнениям (29) — (31). Единственное решение у (tk, £,£0) уравнения (22), удовлетворяющее условию У ^о) = может быть представлено в виде у (tk; £, tQ) = = ф (tK, t0) I. Упражнения 9. Рассмотрите дифференциальное уравнение второго порядка ^(0+p(')^-(0 + 9(0x(t) = 0- (а) Воспользуйтесь заменой переменных уг (t) = х (t) и у2 (t) = (dx/dt) (t) для того, чтобы свести уравнение (а) к эквивалентному виду 0 1 1 [уНО! dt Lzmoj L—<?(*) — р(о г LmoJ * u Рассмотрите проблему задания начальных условий при этом преобразовании. 10. Распространите результат упражнения 9 на случай уравнения dnx (t) dxn~x (t) —^ + an(t)-^rr' + ...+«n(fl*(0=0. (в) Пользуясь результатами данного раздела, докажите, что пространство решений уравнения (в) представляет собой n-мерное линейное многообразие. 11. Пусть у удовлетворяет скалярному уравнению у (^+1) — — а (tk) у (tk) =0, где a (tk) > 0. Покажите, что у (tk) = exp [u (^)j, где и удовлетворяет уравнению и (^+i) — и (tk) = In [а (/*)]• 12. Сведите уравнение в конечных разностях Л^х(1 ) + «1 ('/.) Дн «к) + «г «к) ® 0к) = 0
к эквивалентной нормальной форме с помощью метода, аналогичного использованному в упражнении 9. 13. Нарисуйте символическую схему вычислительного устройства, моделирующего дифференциальную систему Л (t) = А (0 х (0, х (Го) == £. Объясните, как с помощью этой модели можно вычислить матрицу Ф (t, t0). Конкретизируйте все это для системы, описанной уравнением (б) из упражнения 9. Постройте аналогичную схему на линиях задержки для уравнения (22). 14. Рассмотрим систему 91 (0 = 9i (0. 9i (0) = 0. У1(0 = —У1(0, у2(0)=1. Покажите, что итерации Пикара сходятся к вектору решения (sin Г, cos t). 15. В этой задаче необходимо обобщить теорему А на один класс нелинейных уравнений. Пусть (г0, £) — некоторый фиксированный элемент пространства Я71*1, а /: Я71*1 —» Яп — некоторая векторная функция, удовлетворяющая условию Липшица и ограниченная в некоторой окрестности S: $ = {(*, у): к-Го К а, *ея, уеяп}. Если || f (S) | < Af, то покажите, что система дифференциальных уравнений 9 (0 = f (Г, У (О)» У (Го) =5, t е т, имеет на интервале т = {г: 11 — Го I < « = min {«» Ъ/М}} единственное решение. Указание. Видоизмените метод Пикара для этой ситуации. 16. Как следствие упражнения 10 докажите, что /-я итерация Пикара yj принадлежит окрестности решения у, определяемой следующим соотношением: |y(O-yi(OI<yff^ е“к. <ег. А (/ + 1)1 где К — липшицева норма / на множестве S. 17. Динамическая система называется устойчивой, если для каждого б > 0 найдется такое е > 0, что Ц х (t0) || < б «=> | х (0 || < 8 для любых t > tQ, и асимптотически устойчивой, если она устойчива и если х (/) —• 0 при t -♦ оо. Покажите, что уравнение (И) описывает устойчивую систему тогда и только тогда, когда норма |Ф (t, tQ) || при t Ro» °°1 ограничена, и соответствует асимптотически устойчивой системе в том и только в том случае, когда, кроме того, Ц Ф (Г, Го) II 0 ПРИ г -* оо. 2.4. Неоднородные системы первого порядка Однородные системы, изучавшиеся в § 2.3, играют важную роль на протяжении всей книги. В этом же параграфе мы доводим выбранный план изучения до своего претворения, переключившись на исследование возмущенных, или неоднородных, систем. Здесь так же, как и в § 2.3, на равных правах мы будем рассматривать как непрерывный, так и дискретный варианты задачи.
Итак, рассмотрим возмущенную (или неоднородную) дифференциальную систему, описываемую уравнением t (0 = А (О X (0 + / (0, х (tQ) - g, t, tQ е т. (1) Предполагается, что матрица А обладает теми же свойствами, что и в § 2.3. Как нетрудно видеть, уравнение (1) отличается от уравнения (И) из § 2.3 только наличием члена (/— п)-мерного вектор-столбца возмущающих воздействий, определенных на т. Решение уравнения (1), если таковое существует, мы будем обозначать через xf £, t0). Сам факт существования и единственности xf (/; £, t0) можно установить в качестве одного из следствий теорем А и Б из § 2.3. Введем для этого расширенную матрицу где через F (t) обозначена квадратная диагональная матрица порядка п с компонентами / (t) по главной диагонали. Обозначим, далее, через z (t) = col \z± (0, ..., z2n (0] 2п-мерный вектор-столбец, который служит решением однородной дифференциальной системы i (0 = A (t)z (0, z (f0) = z°, t е т. (3) При выполнении весьма слабых условий, сформулированных в предыдущем параграфе, решение этого уравнения z существует и единственно при произвольном z°. Пусть z° = col (£, 1, ..., 1). Тогда, если z (t) разбить на два n-мерных вектор-столбца zL (t) и 2ц (0: z (t) = (zi (t), zn (0), то из уравнений (2) и (3) получим (0 = А (0 zt (0 + F (0 zn (0, Zl (t0) = g, (4) zn(0 = 0, zn(Q =col(l,... ,1), (5) причем эти уравнения определены на т. Решение уравнения (5) очевидно; zn(0 = col(l, ..., 1) для Подставив этот результат в уравнение (4) и воспользовавшись определением матрицы F (0, мы найдем, то F (t)zn (0 = / (0. Но это значит, что Zj (0 удовлетворяет уравнению (1), а отсюда следует, что все результаты относительно существования и единственности решений уравнения (11) из § 2.3 можно очевидным образом перенести на решения уравнения (1). В соответствии со сказанным можно сформулировать следующую теорему.
Теорема А. Пусть A (J) — квадратная матрица п-го порядка, a f (t) — п-мерный вектор-столбец, и пусть $ И(0^<оо ||/ (01|dt < оо. Тогда существует единствен- ный вектор Xj (t; g, t0) такой, что xf (f0; g, t0) = g, a Xf (t; g, t0) удовлетворяет уравнению (11) при всех tE^x. Если A(t)*) непрерывным образом зависит от некоторого параметра р (возможно, векторного), то при каждом t ЕЕ Трешение xf (t; g, t0) также непрерывно по р. Замечание 1. Если (т) — обычное пространство интегрируемых на х функций, то из того, что ||/ (£)|| ЕЕ Ьг (т), следует, что каждая из Д (t) ЕЕ Lr (т), i — 1, 2, ..., п. В связи с этим условия теоремы А можно было бы эквивалентным образом перефразировать, потребовав, чтобы норма|| А (£)|| была ограничена на т, а / (0 е Щ (Т)Г. После того, как мы установили, что Xf (/; g, t0) существует, попытаемся определить общий вид этого решения. На это время мы договоримся считать, что матрица A (t) и вектор / (t) непрерывны на т. Читатель, владеющий аппаратом современной теории интегрирования, без всякого труда может изменить последующие утверждения и прийти в результате к более общим выводам* Воспользуемся хорошо известным методом вариации параметров (Лагранжа) и попытаемся получить решение в виде xf (0 t0) = Ф (t, t0)y (t; f). Здесь x (t), у (t) и Ф (t, t0) предпо- лагаются непрерывными и дифференцируемыми функциями, причем их первые производные тоже считаются непрерывными; Ф (t, tQ) представляет собой матрицу перехода для уравнения (1) при условии, что / (t) = 0. Заметим с самого начала, что для того чтобы решение xf удовлетворяло начальным условиям, необходимо, чтобы у (tQ, /) = g. Итак, подставив предполагаемое выражение для X; в уравнение (1), получим ф (t, t0) у (t,f) + Ф (t, t0) у (0 /) = А (0 Ф (t, t0) у (0 /) + + ф (t, t0) y(f,f) = А (0 Ф (0 t0) у (0 /) + / (0. Отсюда Ф (t, t0) у (f, f) = / (0, t e x. Но так как матрица Ф (t, t0) невырождена при всех iG т, то у (t; /) = Ф'1 (t, t0) / (0, t S x, *) Или / (z). (Прим, ped.)
или, после интегрирования этого уравнения с учетом того, что y(t0, n = to А так как xf (t; £, t0) — Ф (t, t0) у (<; /), то мы нашли, таким образом, решение уравнения (4) в виде xt (<; Z, t0) = Ф (МоК + J Ф (t, t0) Ф’1 (••?, «о) f (®) ds, Мо, s (= т. (6) to Используя этот результат и свойства матрицы перехода, мы можем сформулировать теперь следующую теорему. Теорема Б. Если уравнение (1) удовлетворяет условиям теоремы А, а матрица Ф (£, £0) есть матрица перехода соответствующего однородного уравнения, то решение уравнения (1) можно представить в виде одной из следующих эквивалентных форм: t Xf {t- t0) = Ф (t, + Ф (t, t0) J Ф-1 (s, t0) f (s) ds = to t =Ф (t, t0) £4- J Ф (/, s) /(s) ds = to t =Ф (?, и £ + Ф 0, tQ) f Ф Go. s) / (s) ds, s, t, tQ e T. to На этом этапе уместно сделать несколько замечаний относительно содержания теоремы Б. Совершенно ясно, что Xf (t; g, Jo) представляет собой суперпозицию двух членов. Первый из них, Ф (*> ^о)£> описывает решение уравнения (1) при условии, что / (t) равно нулю на всем т, а £ произвольно. Второй описывает решение уравнения (1) при условии, что £ = 0, а / (£) £= [Z/X (т)]п, и в остальном произвольно. Эти два слагаемых часто называют свободным и вынужденным движениями неоднородной системы. Рассмотрим теперь поведение системы, у которой входной сигнал / (t) имеет следующий вид: /ю = о, о, т<*<т + Ат, т + Ат^ t.
В соответствии со свойствами матрицы перехода мы получим следующую последовательность равенств: Ф(Мо) J Ф Go. s)/(s) ds = Г = Ф(г,т)Ф(т, f0) [ j Ф (10,х)Ф (г, s)f(s) ds] = = Ф(«,т)[ J ф(т,«)/(«)(й]. (7) т Введем обозначение r-t-Дт Л= j Ф(Т,«)/(5)Ж. (8) Тогда суммарная реакция системы примет следующий вид: G. &> ^о) — | Ф(М.К, 0<«<т, (9) Ф(Мо)£ + Ф(М)Л. T<t, где Дт предполагается малым, а т + Дт = t. Решение (9) уравнения (1) можно представить в другом эквивалентном виде: (Ф(М.К. 0<i<T, ®' (<; С’<о) = { Ф (*ЛИС + Ф Go. т) А], т < t. (10) Из этих соотношений следует, что реакция системы на начальное условие £ и импульсноподобный входной сигнал / (t) мало отличаются друг от друга. Действительно, в уравнении (9) входное воздействие /т играет как бы роль второго начального условия, которое добавляется в момент времени т, не нарушая влияния первого. В уравнении же (10) реакция системы представлена в виде решения однородного уравнения с начальным условием £ при t < т и £ + Ф (f0, т)/т при t > т. Рассмотрим теперь поведение неоднородной векторной конечноразностной системы М (М = A (tjy + / Gk), у Go) = 0, е от. (11) Здесь, как и в уравнении (2), можно ввести расширенную квадратную матрицу A (tK) порядка 2п и преобразовать уравнение (И) в однородное. После этого мы сумеем воспользоваться условиями теоремы 3 из § 2.3 о существовании и единственности решения однородного уравнения и показать, что^ уравнение (11) имеет един-
i.l. ЙЁОДЙОРОДЙЬГЕ СИСТЕМЫ ЙЕРЙОЁО ПОРЯДКА ственное решение. На этом этапе мы оставляем все детали доказательства на совести читателя, а сами попытаемся найти решение все тем же методом вариации параметров. Как и раньше, через Ф (^, £0) мы будем обозначать матрицу перехода однородного аналога уравнения (И). Для удобства предположим, что матрица Ф Gk» ^о) на & невырождена. Обозначим через у (^) некоторое решение уравнения (И) и попытаемся определить такую векторную последовательность и (/к), что У (^к) = Ф Gk» *о) 1(' Gk> ^о)* Применив оператор Afc к обеим частям этого равенства, получим &кУ (^к) = 1^кФ Gk» и Gk» ^о) 4” Ф Gk+1> ^о) t^ku Gk> ^о)5 = = A (tk) Ф t.) + Ф Gk+1, t0) [Aku (^, f0)L С учетом уравнения (11) отсюда находим Л Gk) Ф (tk, tQ) и (tk, tQ) -г / (tk) = A (tk) Ф (tk, t0) + 4" Ф (^к+1» ^о) (^к» ^о)1» и, следовательно, / Gk) = Ф Gk+1» ^о) (^к» *о)1- Если предположить, что ни одна из матриц [Z + hkA (^)l невырождена, то у матрицы перехода всегда найдется обратная, и, следовательно, Afcu (tk, t0) = Ф 1 Gk+i> t0) f (tk), u (^k+1) = u (^k) 4“ ЬкФ 1 (£fc+i, t0) / (tk) = = u (tk) + АкФ Go» ^k+i) / Gk)* Выписывая эти соотношения подробно и используя условие у (£0) = 0» получим и (М = о, u (tx) = Л0Ф (f0, tr) f (£0), и (*а) = Л0Ф (tQ, / (t0) + ЛХФ (t0, / (^), к к—1 и (^к) = S ^<-1Ф Go» ^i) / (^i-1) = 2 ^>Ф Go» ^’+1) / (0)« i=0 j =0 Этот результат приводит к следующей теореме. Теорема В. Пусть A (tk) — квадратная матрица п-го порядка, и пусть матрицы [I + hkA (^)l определены и невырождены
на множестве ст = {f0, tv ..., tn}. Тогда конечноразностное уравнение &1сУ (М = А (^к) У (^) + / (^к), У (^о) — 0, h <= o', имеет единственное решение — векторную последовательность вида к—1 У (*к) = Ф Gk, М 2 Go» ^+1) / G/)» ^к£= °* (12) ;=0 Замечание 2. Прежде всего заметим, что решение (12) можно представить в другом виде: У Gk+1) = + ЛЛЛ Gk)I У Gk) + W Gk) — ~ Ф Gk+1» ^к) У Gk) 4" ^к/ (^к) ~ = Ф Gk+1, ^к) l£/Gk) 4“ Н (^к) / (^к)], Н (tk) = Л/j Ф (^к, ^к+1)- Последнее выражение часто используют в качестве эквивалентного определения дискретной динамической системы. Далее, воспользовавшись полугрупповым свойством (30) из § 2.3, мы увидим, что утверждение теоремы В этого параграфа можно переписать в виде к—1 y(tk)= 2 МФл.'м)/ (Ъ)- (13) j=0 При доказательстве теоремы В мы опирались на предположение о невырожденности матрицы Ф (tk, t0) на а, и это предположение играло существенную роль. Проверка справедливости этого предположения, а также доказательство следующего следствия могут быть получены довольно неизящным, но простым способом, использующим уравнение (11) как простое итерационное соотношение. Следствие. Векторное конечноразностное уравнение &ky (tk) -= A (tk) у (^) + / (tk), у (t0) = 5, (14) определенное на О', имеет единственное решение у, задаваемое на о* формулой к—1 У< h *о) = Ф (*к, *о) £ 4“ З^Л^к» ^)/(0)» (15) >=i Если матрица Ф (tK, tQ) действительно невырождена, то мы можем переписать уравнение (15) иначе, вынеся за скобку общий множитель Ф (tfc, t0).
Пример 1. Рассмотрим электронную цепь и ее линейный эквивалент, показанные на рис. 2.11. Предположим, что в момент б) Рис. 2.11. Схемы: а) триггер; б) эквивалентная линейная модель. £0 = 0 все емкости разряжены. Тогда рассматриваемую систему можно описать уравнением Г ii (О'] г — а — 1 Г Xl — dJ L z2(t) ' е ~ I ^>0, L i2(t)j L — с где а = (Я0Н Rp) (7?х + Т?2) СХД, 6 = R, (Ro + Rp) (\&, с = R^R0 + ЯР)С2Д, d = (R.R.'+^R^ R.RJ С2Д, е = Ro (7?! + Я2) Сх\, f = Тго^АД, А = RqR1R2 + RqR\Rp + RqRzRp + Вводя обозначения = - 4- (а + d Н- /(я - d)a + 46с), = - 4- (а + d - /(а - d)« + 46с), мы можем записать матрицу перехода в виде г ФН(М) Фц(М) 1 Ф(М)Ч. Ф41М Фа2(«, s) J ’
где Фп (М) = (Хх - X,)-11 - (а + Х2) + (а + XJ , Ф21 (*, *) = (Хх - X,)"1 {Ь~1 (а + Хх) (а + Ха)’[ех <*-*> - Ф12 (М) = (Хх - ХзГЧ- Ь (^) - ех’('-*)]}, Ф22 (*• 5) = (Хх - ХзГМ(а + *1) e*'(t~6) - (а + ех’('-8)]. Пример 2. Рассмотрим поведение системы общего вида из трех масс, которая в ньютоновой механике описывается системой дифференциальных уравнений второго порядка *) “ тЛ1 '«12 '«13 ' 'Z1 ' /11 L /12 /13 11 ^21 ^23 a-2 + /21 /22 /23 i*2 + _тз1 гпзз. _ ^3 _ , /31 . /32 Ли /33 _ &12 ??- 1— w H w X1 ’/1(0 + i ^22 ^32 ^23 ^33 _ 1 <N CO J = /2(0 L/s(0 Мы будем предполагать, что все массы тп^, все коэффициенты трения и все коэффициенты упругости не зависят от t. Прежде всего перепишем эти уравнения в матрично-векторной форме: МЛ (0 + Ft (0 -4- Кх (0 = / (0, (16) где М = [wul, F = [/и] и К = [fcij] Воспользовавшись процедурой, намеченной в упражнениях 9 и 10 § 2.3, мы можем привести уравнение (16) к нормальному виду. Для этого мы будем рассматривать в качестве координат не только положения масс, но и их скорости. Итак, пусть щ = и и = = (ух, у2, у3). Тогда уравнение (16) можно заменить на систему. 0 = и (0 + It (0 - Iv (0 + Ох (0 = 0, Mv (0 + Ft (t) + 0у (0 + Кх (0 = / (0, t е т. Вновь воспользовавшись преимуществами векторно-матричных обозначений, получим Г 0:Z 1 Г у(0 1 Г—/:0 I Г У (t)~] Г 0 1 [ "м\ F J L X (0 J + [ б Т К J I. х (0 J = [ f (0 J • (17) Будем считать матрицу LM\F J *) Этот пример заимствован из § 9.2 книги Хафмана (R. L. Half та п, Dynamics, v. II, Addison-Wesley Reading, Mass).
невырожденной. Очевидно, что это так, если невырождена матрица М, Читатель легко может убедиться в том, что О I I Г1 Г — M'lF ! М~1 ___I_ _ __________I_____ L I | ° (18) Умножая уравнение (17) на эту матрицу, мы получим z(t) = Az (/) + Ви (/), (19) где и = (0, /), z = (и, х), В — матрица из уравнения (18), а А имеет следующий вид: (20) Так простым и очевидным способом нам удалось свести общую систему дифференциальных уравнений второго порядка к нормальному уравнению первого порядка. В качестве конкретного Положение равновесия Рис. 2.12. Система с массами, пружинами и амортизатором. примера рассмотрим систему, показанную на рис. 2.12. Эта система двух масс удовлетворяет следующим уравнениям движения: ' т1 0 1 Г £г (/)' 0 т2 £2 (/) где / (Z) отображает действие внешних сил, направленных вправо. В своей эквивалентной нормальной форме эти соотношения
После окончательного приведения к стандартной форме мы Рис. 2.13. Позиционная следящая система второго порядка. получим уравнение (19), в котором матрица А имеет вид Г / -/ 2к — к " mi mi ГП1 7721 А = (-1) 1 m2 / m2 — к Ш2 2k ТП2 (21) -1 0 0 0 _ 0 -1 0 0 Пример 3. Рассмотрим теперь позиционную следящую систему, схема которой показана на рис. 2.13. Пусть поведение
этойЛсистемы характеризуется следующими физическими парамет-рамй — постоянной двигателя, fel — постоянной вращающего усилия, Ац — коэффициентом передачи, к2 — постоянной потенциометра, А'— коэффициентом усиления усилителя, J — моментом инерции (приведенным к валу), R — сопротивлением обмотки, / — коэффициентом вязкого трения (приведенного к валу). При фиксированном ir и нулевых начальных условиях (при t = t0) поведение этой системы описывается уравнениями et (t) = А к, 1ег (t) - 0Р (01 = Hi (t) + лд (t), T (t) = J0O (t) + /9o (t), 0p (0 “ *300 (0* Вводя обозначения Акъкзк^ k2 (fR . 7 \ T Ak2ki a° ~ —TR~ ' a' = Тп[-Ъ +кф k=~!R' мы можем привести эти уравнения к следующему виду: 0 (0 -F аД (0 + аД (0 = Л0. (0, 0О М = 0О (/0) = 0. Последнее уравнение с помощью замены переменных (t) = 0О (t) и (0 = 0о (0 можно представить в нормальной векторно-матричной форме: -Х2 (0. ’ 0 1 _ — ао Г^х(01 . ГО -aj [мо. к Матрица перехода для этой системы имеет вид Ф12 (0 ^о) Ф22 (^» ^о) Ф (/, t0) = ’фи Ф21 ^о) где Фи (*. to) = CiC-'X'-'») sin [<о (/ — t0) — , Ф12 (t, t0) = sin [co (t — f0) 4-, Ф21 (t, t0) = cse-bi'-'»> sin co (t — Zo), Фм t0) = sin [co (t —t0) + i|?a] + /(«1-6)2 + (02 . \ .-(О с1 = —й—- С*=И -------------й-----> 4'1= tgi — , С., = , СО = </0 — Ь2, 115, = f <т-1 со а — b ап у си , О = — . •’со 2
Замечание. Читатель, без сомнения, уже заметил, что ни один из рассмотренных примеров не приводит к конечноразностным уравнениям. Это, естественно, не должно означать, что в природе редко встречаются физические системы дискретного характера. Наобдрот, имеются многочисленные примеры дискретных динамических систем, описывающих явления, дискретные по самой своей природе. Именно так обстоит дело с цифровыми вычислительными машинами и цифровыми системами управления. В других системах непрерывные физические явления приобретают дискретную форму при квантовании по величине или по времени. Например, в радиолокационной станции слежения импульсного типа информация о расстоянии до цели снимается дискретно, с частотой повторения импульсов. С помощью дискретизации мы могли бы свести к конечно-разностному виду и каждое из уравнений трех предыдущих примеров. А так как импульсные системы с точки зрения приложений образуют важный класс систем, то мы специально остановимся на основных связях между дискретными, импульсными и непрерывными системами. Импульсные системы. При математическом моделировании физических систем часто оказывается необходимым несколько обобщить уравнения (1) и (14). Точнее говоря, может возникнуть ситуация, при которой поведение линейной динамической системы удобнее описывать уравнениями следующего вида *)з dtx (t) = A (t) х (t) + В (t) и (f), х (/0) = 5, t S v, у (t) = C (t) x (t) + D (t) и (0, t e v. (22) Здесь вектор и = (un ..., um) описывает независимые входные воздействия, влияющие на поведение системы; вектор у=(у1,... ..., Уп) — независимые наблюдаемые выходные величины, а вектор х = fo, ..., хг) — некоторое минимальное множество внутренних переменных (не обязательно единственное), которых достаточно для описания динамики системы. Размерности матриц 4, В, Си Д, естественно, таковы, чтобы выписанные уравнения имели смысл. Сходство между непрерывными и дискретными системами позволяет надеяться, что с помощью разумного выбора обозначений нам удастся практически одинаковым образом описывать поведение как одних, так и других. В уравнениях (22) мы сделали первый шаг в этом направлении. Поскольку множество а дискретно, то функцию х, определенную на а, можно без каких-либо разночтений обозначить через х (Z), t а. Точно так же никаких ♦) Примеры систем, требующих использования математических моделей такого более общего вида, приведены в приложении 4.
сомнении не возникает и при использовании обозначения I Д,лг (0 = h? [х (Zk+1) — X (/*)], t = e a, вместо символа (th), которым мы пользовались ранее. Поэтому, если v = т, то под символом dt мы будем понимать дифференцирование, а если v = О’, то будем считать, что он обозначает разностный оператор dt = &t. Таким образом, про систему, описываемую уравнениями (22), нельзя сказать, дискретна она или непрерывна, до тех пор, пока не определено v. Но как только мы ука-жем, что представляет собой область V, так система, описанная уравнениями (22), станет вполне определенной. На рис. 2.14 приведена схема системы, описанной уравнениями (22), построенная с точки зрения концепции черного ящика. По u(t) D(t) u(t)\ \ J yW c(t) ___________J Рис. 2.14. Типичная многомерная система. очевидным причинам мы называем матрицу D матрицей передачи, а матрицы В и С — матрицами входных и выходных ограничений соответственно. Если в рассматриваемой системе имеются один вход и один выход, то матрица В представляет собой некоторый вектор-столбец, а матрицы С и D — вектор-строки. В общем случае мы будем называть систему, описываемую уравнениями (22), многомерной, а в том случае, когда у нее всего один вход и один выход,— одномерной. Покончив со всеми предварительными замечаниями, перейдем непосредственно к изучению импульсных систем. Нашей целью будет не просто показать, что непрерывная система с импульсным элементом (осуществляющим квантование сигнала по времени) может быть представлена в виде дискретной системы, а скорее установить роль импульсных систем в качестве двусторонних связей между системами с непрерывным и дискретным временем. Для начала предположим, что дискретное множество о представляет собой некоторое подмножество промежутка т. Обозначим через X класс всевозможных функций, определенных во всех точках т, а через Y — класс всевозможных временных рядов, определенных на о. Тогда, если о С т, а через S обозначена операция квантования по времени или дискретного съема сигнала,
то S — это линейное преобразование 5:Х->У, определенное следующим соотношением: I (Sf) (t) = f (tjc), EzS, 0, С физической точки зрения это преобразование описывает поведение дискретно срабатывающего ключа при условии, что ключ замыкает контакты мгновенно в моменты времени i Е а. Операция экстраполяции нулевого порядка, с которой мы познакомились в примере 4 из § 2.1, также полезна для изучения импульсных Рис. 2.15. Системы с эквивалентными соотношениями вход — выход. систем, и мы будем считать, что она описывается линейным преобразованием С, отображающим Y в X условием (Су) (0 = у (0), t е [*/, ^+1), где t ЕЕ т, a ЕЕ (J. Для того чтобы конкретизировать стоящие перед нами задачи, рассмотрим две системы, схематически представленные на рис. 2.15. Непрерывная и дискретная системы считаются эквивалентными, если они осуществляют идентичные преобразования входных сигналов, поступающих на клеммы Л, в выходные величины, снимаемые с клемм В. Совершенно ясно, что импульсный элемент можно включить справа от клеммы Л, а выходной импульсный элемент заменить на цепочку последовательно соединенных импульсного элемента и экстраполятора первого порядка, и что при этом эквивалентность двух систем не будет нарушена. Для того чтобы аналитически сформулировать понятие эквивалентности дискретных и непрерывных систем, предположим, что
дискретная динамическая система описывается уравнениями: j (£/с) = A х (t^) + В (£k) и (^), I (23 I У (М = С (М i (М + D (h)lb (M> ffc S <5, а непрерывная динамическая система — уравнениями ± (0 = A (Z) х (t) + В (0 й (/), t G т, (24) y(t) - С (t) х (t) + D (t) й (t), где^через й (t) мы обозначили функцию (Си) (/). Решим теперь нашу^задачу, естественным образом распадающуюся на две части. Задача 1. Можно ли для каждой непрерывной системы, описываемой уравнениями (24), построить такую дискретную систему, описываемую уравнениями типа (23), для которой значения у и у на о совпадают, какова бы ни была функция и, определенная на а? Поскольку функция и = 0 является допустимым входным воздействием, то из условия у (t) = у (t) при t е а мы сразу получим, что при t €= о: С (t) х (Z) должно равняться С (£) х (/). Чтобы обеспечить это равенство, достаточно выбрать С (£) = (5С')(0 и показать, что при этом обеспечивается равенство х (/) = (5х) (£). Для этой цели удобно воспользоваться соотношениями И-1 х (0 = ф (t, t0) X» 4- ф (t, t0) 2 Л,Ф (t, t^) в (tj) и (t}), t e 5, (25) t x (t) = Ф (t, ta) a:0 -f- Ф (t, to) $ Ф (t0, s) В (s) a (s) ds, t£=x. to Эквивалентность x (t) и f (/) на а при и = 0 и всевозможных х° и Zo требует выполнения условия Ф (th tk) = Ф (tj, 4), tj, tk (= a. Но Ф (tk, t0) = П jZj (/ + hkA (Zk)], что в свою очередь определяет матричную последовательность {Л (tk)}. Приравнивая значения вынужденной реакции систем в моменты времени tOi ..., /к,... и полагая й (t) = и (tk) при t G Um ^+iL нетрудно показать, что выходные величины систем совпадают на а тогда и только тогда, когда #/С4 1 hkB(tk)= 5 Ф (tk+1, s) В (s) ds, к = 0,1, 2,... *к
Таким образом, для непрерывной системы, описываемой уравнениями (24), эквивалентная дискретная система однозначн ) определяется соотношениями C(tk)=C(tk), В jc) = D к (26) I <|с+1 &(М= $ Ф(^+1, ’) В (s)ds]. *к Задача, обратная задаче 1, может быть сформулирована следующим образом. Задача 2. Можно ли для каждой дискретной системы, описываемой уравнениями (23), определить такую непрерывную систему, которая была бы ей эквивалентна в том смысле, что при каждом и (t), определенном на о, выходные величины обеих систем совпадали бы на а? Эта задача значительно сложнее первой. Из уравнений (23) и (24) ясно, что для того, чтобы найти такие матрицы А и В, которые обеспечивали бы равенство суммарной реакции х непрерывной системы на а значениям £ (^), достаточно выбрать произвольные матрицы С и D, принимающие на о значения С (^) и D (tk). Лемма. Пусть задана некоторая дискретная линейная система с матрицей перехода Ф (tj, tk). Предположим, что Г (t) представляет собой некоторую невырожденную дифференцируемую матрицу, для которой |Г(0Г(0-Ч<т(0€=Мт), Г (tk) = Ф (tk, Zo), А = 0, 1, 2, ... Определим Ф (t, s) как произведение Г (t) Г-1 (s), и пусть А (<) — = Г (<) Г (О-1. Тогда матрица Ф (t, t0) является матрицей перехода для дифференциальной системы i (t) = A (t) х (f) Ф (0, h) = Ф (О, tk), j, А = 0, 1, 2, ... Доказательство. Пусть матрица Г (t) удовлетворяет условиям леммы, и пусть Ф (t, з) = Г (О Г (s)'1.
Тогда ф = Г (0 Г-1 (0 = Г (0 Г-1 (0 Г (0 Г-1 (0 = I = Г (0 Г-1 (ОФ (*, S). Более того, Ф (/, t) = г (г)Г-1 (о = I. Таким образом, матрица Ф (t, s) служит матрицей перехода рассматриваемой системы, и, значит, наша лемма доказана. С самого начала мы отмечали, что выбор матрицы Г (0 неоднозначен. Существует много способов построения ее, но мы расскажем здесь лишь об одном. Если задано конечноразностное уравнение (th) = = А (^) $ (£к) или, что то же, матрица перехода дискретной системы Ф /0) = П1~о U + Л^Л то матрицу перехода непрерывной системы можно сконструировать в соответствии с уравнением Ф (t, t9) = (Z + (t - tk) A («*)] Ф (tk, t0), t e Очевидно, что Ф (t, t0) является непрерывной функцией t на всем т и удовлетворяет условию Ф (^, /0) = Ф (^, £0), каковы бы ни были €= а. Более того, Ф (t, и = A (tk) Ф («ь f0) == A (tk) u + (t- tk) A t0), а это последнее равенство описывает нестационарную систему с матрицей коэффициентов а (0 = A (tk) И + (t + tk) А (го]-1, t е [г*, t e a. К сожалению, такая матрица А (0 не непрерывна (хотя лемма и не требует непрерывности матрицы Л, справедливость этого свойства была бы желательной), поскольку, переходя в полученном выражении к пределу справа и слева от мы получили бы, что Л G /с) — Л (tic) Ф (^, £fc+i), VA (it) = A (tm). Тем не менее это не может помешать нам использовать найденную матрицу Ф (t, s) и, пользуясь равенством матриц С и Z), найти такую матрицу В (0, которая обеспечит эквивалентность систем. Упражнения 1. Рассмотрим линейную динамическую систему, описываемую уравнением (22). Обозначим через Н зависящую от времени матрицу, определяющую преобразования в канале пассивной обратной связи: и (0 = Н (t) ytf) + v (0, t е v.
Предполагая, что ЦП (0 Н (t) ||< 1, igo, приведите уравнения замкнутой таким образом системы к стандартному виду (22). 2. Повторите упражнение 1 для системы с активной обратной Связью и (0 = Z (0 + v (0, t €= v,’ atZ (t) = Н (t) + у (0, t е v. I Указание. Здесь вместо х нужно рассматривать пару (я, z). 3. Обозначим через х п £ два возможных набора внутренних переменных некоторой линейной динамической системы. Поскольку взаимосвязь х -> у между внешними переменными не может измениться из-за выбора той или иной математической модели (внутренних переменных), то и та и другая система уравнений будут иметь следующий вид: dtx (t) = A (/) х (0 + В (0 и (0, t е V, У (0 = С (0 х (Z) + D (0 и (0, t е v, dt A(t) = a (z) f (0 + в (/) и (z), t е v, У (t) = С (0 f (0 + D (t) и (0, t е V. Предположим, что К — это такая матрица, для которой существуют одно- временно К (0, К1 (0 и К (0 при всех fgZ), и что векторы внутренних переменных связаны между собой соотношением f (t) = К'1 (0 х (0. Покажите, что в этом случае для непрерывной системы выполняются соотношения Ф (/, 0 = К"' (t) Ф (Z, 0 К (0, A (0 = К'1 (0 А (0 К (0 - К'1 (0 К (0, В (0 = К'1 (0 В (0, С (0 = С (0 К (0, каковы бы ни были t. s £ т, п что эти соотношения сохраняют свою силу и для дискретных систем, если X”1 (0 заменить на X"1 (Zfc+1), а К (t) на 4. Электромеханическая система типичного громкоговорителя описывается следующими дифференциальными уравнениями: di (I) dx (/) V Hi (t) +U = m + kx (/) — Ui (t) =0, где через v, x и i обозначены приложенное напряжение, механическое смещение и ток в обмотке катушки, соответственно. Приведите эту систему уравнений к неоднородной системе первого порядка. Предполагая, что R/L = 6, a U*!mL = 10, постройте решение уравнений как функцию остальных параметров. Пользуясь этим результатом, постройте зависимость х и i от v.
2.5. 1^>Е0БРА30ВАНИЯ, СВЯЗАННЫЕ С ЛИНЕЙНЫМИ СИСТЕМАМИ 181 2.5. Некоторые преобразования, связанные с линейными динамическими системами В §§ 2.3 и 2.4 мы выяснили некоторые важные свойства линейных динамических систем. В данном параграфе мы найдем для них новую интерпретацию с точки зрения теории линейных преобразований. Рассмотрим уравнения (22) еще один раз. Как и раньше, обозначим через Ф (/, s), t, s ЕЕ v, матрицу перехода для этой системы. В системе с дискретным временем множество а упорядочено (т. е. tj^ <Z tj), в связи с чем можно определить новую функцию [Z], где [£] = шах {ft: t^t}. Другими словами, U] = й тогда и только тогда, когда t 6= ^+1]. Пользуясь этой функцией и уравнением (15), мы, очевидно, можем представить реакцию дискретной системы и -> х с помощью следующего соотношения: [П-1 хи (t; I, м = ф (t, М Е + 2 V, *м)в (h) и (Ч), t е б,- (1) ;=0 или, в невырожденном случае, [П-i Хи (Ч I, Ч) = Ф (t, t0) | + ф (t, t0) 2 (to, tjn) В (tj) и (tj), (2) >=0 где t пробегает все а. Аналогичные соотношения можно выписать и для системы с непрерывным временем: t =Ф(Мо)£ + Ф(*> t0)^(t0,s)B(s)u(s)ds, (3) 6) где t пробегает т. И в том и в другом случае взаимосвязь между входным и выходным сигналами и -> у определяется дополнительным соотношением У (t) = с (0 xu(t; I, <0) + D (t) и (0, t S v. Для простоты мы будем предполагать, что D = 0, а С = I, ос-тавляя незначительные модификации последующих утверждений, необходимые для получения более общего результата, на совести самих читателей.
Уравнения (2) и (3) можно рассмотреть с той точки зрения, которую мы приняли при изложении материала § 2.2. Для этого обозначим через I (о) векторное пространство всевозможных вещественных функций, определенных на о. Обозначим еще через Um (о) декартово произведение т пространств I (о): Um (а) = I (<*) X I (о) X ... X I (о) (т раз). Рассмотрим сначала вынужденную реакцию системы, описываемой уравнением (2). Для каждого и из Um (о) теорема В из § 2.4 гарантирует существование единственного вектора хи (/; О, /0), определенного на о и удовлетворяющего уравнению (2). Определим на Um (о) некоторое линейное преобразование, потребовав, чтобы образ и совпадал с этим х: [П-i (Fu)(t) = xu(t-,O,to) = 2 w (t’tfiultj), (4) 7=1 где W (t, tj) = hi Ф (t, t^) В (tj). Здесь через (Fu) (t) обозначен образ элемента и е Um (о) в момент времени i £ а. Совершенно ясно, что F вполне определено и что область значений F принадлежит пространству Um (о). Если принять, что о конечно, то пространство Um (о) будет конечномерным, а преобразование F — ограниченным по отношению к любой норме, заданной на Um (о). Наконец, понятно, что F описывает вынужденное движение рассматриваемой дискретной системы в том смысле, что и функция F, и сама система преобразуют внешнее воздействие и в одинаковые выходные величины х. Все эти соображения объединены в следующей теореме. Теорема А. Вынужденное движение каждой линейной динамической системы с дискретным временем можно представить как некоторое (ограниченное, если о конечно) линейное преобразование F одного банахова пространства в другое. При решении многих задач управления нас интересуют значения выходной величины системы лишь в какие-то конкретные моменты времени. В этом случае система преобразует элементы пространства Um (<з) входных воздействий в некоторый n-мерный вектор с вещественными координатами, определяющий выходной сигнал системы в какой-то момент времени £ О'. А это побуждает нас рассматривать систему как некоторое линейное преобразование в Rn, т. е. как некоторое отображение Fa, заданное условием FqU — (Fu) (41) >
где момент времени ta фиксирован и принадлежит о. Ясно, что параметр ta определяет целое семейство отображений {Fo}. Обратно, эти отображения позволяют вычислять значения выходных величин на любом подмножестве Е CZ а и, в частности, в своей совокупности определяют и само F. Из всего этого вытекает справедливость следующего утверждения. Следствие. Вынужденное движение каждой линейной динамической системы с дискретным временен можно описать семейством {Fa\ ta ЕЕ о} ограниченных линейных преобразований Fa, каждое из которых определено на Um (о) и принимает значения из Rn. Исходное множество о, на котором определены входные воздействия, является для этого семейства множеством индексов. Преобразование Fa преобразует входную функцию в целом в значения ta — импульсов выходных величин. Возвратимся теперь к уравнению (3). Вспомним для начала, что матрица Ф (t, s) предполагается непрерывной на квадрате т X т, а матрица W (t, s) = Ф (t, s) В (s) — ограниченной на т X т, если только на т ограничена матрица В ($). Займемся изучением вынужденных движений системы, описываемой таким уравнением. Обозначим через £р(т) (1 р оо) обычное банахово пространство функций с интегрируемой (по Лебегу) р-й степенью на промежутке т = к0, ^]. Через Um (т) мы обозначим декартово произведение Um (т) = Lr (т) X ... X Ьг(х) (т раз). Определим на Um (т) преобразование F, потребовав, чтобы образ х каждого элемента и е Um (т) определялся соотношением t (Fu) (t) = zu(f;0, tQ) = (t,s)u(s) ds. (5) to Таким образом, мы снова обозначаем через (Fu) (t) значение образа элемента и е= Um (х) в момент времени Е т. Но так как х непрерывно, а каждая функция, непрерывная на т, ограничена, то нетрудно проверить, что х ЕЕ 1С (т)]п CZ Un (т), где через С (т) мы обозначили обычное банахово пространство функций, непрерывных на т. Итак, F представляет собой линейное преобразование, определенное на Um (х) и принимающее значения из С* (х) = С (х) X ... X С (т), и, в частности, является линейным отображением в Un(t). Более того, воспользовавшись одним методом, с которым мы познакомимся позже в этом же параграфе, мы смогли бы показать, что если т конечно, то F, рассматриваемое как некоторое отображение пространства Um (х) (с подходящей
нормой) в пространство Сп(т) или ип (т), с любой подходящей нормой, определенной в них, ограничено. Все эти результаты сведены в следующую теорему. Теорема Б. Вынужденные движения любой непрерывной линейной динамической системы можно описать некоторым {ограниченным при конечном т) линейным преобразованием F, отображающим одно банахово пространство в другое. Пусть нас интересуют лишь значения выходных величин системы в конкретные моменты времени (в этом случае система преобразует элементы пространства входных воздействий в п-мер-ные векторы с вещественными координатами, определяющие состояние выходной величины системы в момент времени ta (ЕЕ т). Тогда систему можно рассматривать как некоторое линейное преобразование в 7?п, т. е. как отображение Fa, определенное условием =.(Fu) (U, где ta принадлежит т и фиксировано. Ясно, что при таком подходе F определяет целое семейство отображений {Fa}. И обратно, значение этих отображений позволяет выяснить значения выходных величин на любом подмножестве Е СЕ т и, в частности, определить само F. В связи с этим справедливо следующее утверждение. Следствие. Вынужденное движение любой линейной динамической системы с непрерывным временем можно описать некоторым семейством {Fa: ta G т} ограниченных линейных преобразований Fa, каждое из которых определено на Um (т) и принимает значения из Rn. Основное множество т, на котором определены входные сигналы, служит для этого семейства множеством индексов. Отображение Fa преобразует весь входной сигнал системы в целом в значение выходного сигнала в момент времени ta. Замечание 1. В главе 1 и в первых двух параграфах этой главы мы старались донести до сознания читателей мысль, согласно которой системы любых типов следует рассматривать как отображения одного функционального пространства в другое и что разбивать системы на различные классы по их физическим признакам не только не обязательно, но часто и вредно. Материал этого параграфа лишний раз подтверждает эти мысли. Действительно, изучение уравнений (1), (2) и (3), а также теорем А и Б и их следствий доказывает, что линейные динамические системы с непрерывным или дискретным временем отличаются друг от друга только такой второстепенной технической деталью, как выбор базового функционального пространства. Замечание 2. Выше мы всюду предполагали, что множество т ограничено, а множество о конечно. Вводить эти ограничения не
2.5. ПРЕОБРАЗОВАНИЯ, СВЯЗАННЫЕ С ЛИНЕЙНЫМИ СИСТЕМАМИ 185 обязательно, они не связаны с существом дела. Однако на данном этапе они позволяют обойтись без понятия устойчивости. Замечание 3. В явном виде мы исследовали лишь вынужденные режимы работы системы. Тем не менее режим свободного движения также можно рассматривать как линейное преобразование Ф: Rn -> Un (0), определенное для каждого £ ЕЕ Rn соотношением (Ф£) (0 = ф (t, t0) I, t e V. (6) Иными словами, свободный режим работы системы можно описать с помощью параметризованного семейства {Фа: iaE v} линейных операторов в Rn, определенных условием Ф<Л = Ф Q £, ta е v. В этих рамках нетрудно найти модель и для реакции системы. Определим расширенное пространство входных воздействий V (как для непрерывного, так и для дискретного случаев) следующим образом: V = RnxUm (v). Тогда элементы V имеют вид и = (£, и), а преобразование 5, определенное на V, задается условием (Sv) (t) = [5 (L и)] (t) = Ф (t, tQ) I + (Fu) (t), t G= v, и, очевидно, линейно, вполне определено и ограничено, если только ограничено F. Другим возможным описанием суммарного движения системы может служить параметризованное семейство {Sa; ta (= v}, где Sav = Sa (£, и) = Ф (ta, i0) £ + (Fu) (ta), ta e v. Гибридные системы. К теоремам А и Б мы подошли в результате непосредственного наблюдения за поведением систем, описываемых линейными дифференциальными или конечноразностными уравнениями первого порядка. Однако сформулированные в них выводы сохраняют свою ценность и для гораздо более широкого класса динамических систем. В этом разделе мы займемся исследованием системы, составленной из нескольких взаимосвяз-ных непрерывных и дискретных подсистем (см. рис. 2.16). Всякое такое объединение подсистем с дискретным и непрерывным временем, связанных между собой линейными устройствами связи (импульсными элементами или экстраполяторами), мы будем называть гибридной системой. На рис. 2.16 символом и = (иъ ..., иг) обозначен некоторый элемент декартова произведения U = [I (а)]г, а через v = (у1?... ..., и3) — элемент декартова произведения V = [Ах (т)Р. Вектор х = (х1ч ..., хс) принадлежит произведению X = [Z (<т)]с, а вектор
у = (z/1? ..., yd) — произведению Y = [Z/X (x)]d. Режимы свобод* них движений двух подсистем рассматриваются как преобразования Фх: Rc -> X и Ф2: Rd -> У, определенные аналогично тому, как это делалось в уравнении (6). Точно так же функции F и G определены уравнениями, аналогичными уравнениям (4) и (5) Рис. 2.16. Гибридная система. соответственно. Учитывая операцию экстраполяции первого порядка С: X -> У, мы предположим, что поведение системы в целом описывается следующими уравнениями: Ге]—1 х (s) = Ф1 («, t0) + 2 («♦ 0«) Bi (Ч)и (h)’ se3> (7) j=0 t у (0 = Фг (4, t0) уо + $ Ф,(tf Р) В2 (Р) [у (Р) + (Сх) (Р)] dp, tex, (8) to или, что то же; х (s) = (Фр:0) (s) + («). S е а, (9) У (О = (Ф2«/°) (0 + {Gv) (4) + (GCx) (4), tG т. (10) Если обозначить через г° = (х°, у°) (= Rn = Rc X Rd суммарный вектор начальных условий, то из уравнений (9) и (10) можно получить, что режим свободных движений системы описывается следующими соотношениями: х (s) = (Ф|Х°) (s), s£ а, (И) у (/) = (ссФр*) (<) + (Ф2у°) (0, t е т.
Стремясь к большей компактности, определим на т матрицу ф8 to) с помощью соотношения Ф3(/,/0) = $Фа(«,Р)Ва(Р)СФ1(Р,/0)йр, /ЕТ. (12) to Тогда, если 0 (г; tQ) — матрица следующего вида: (Di (s, tn) О в<г;‘">= [ф.(М.) ф.«.<•)] r = (s-‘)eoXT’ <13> то режим свободных движений системы, описывавшейся уравнениями (11), можно представить в виде линейного преобразования 0: Rn-*-X'<Y, где (0z°) (г) = 0 (г; t0) z°, г = (s, /) Е о X т. (14) Аналогичным образом можно описать и вынужденный режим движения гибридной системы. Для этого в уравнениях положим z° = 0 и найдем х (s) = (Fu) (s), а, у (t) = (GCFu) (t) + (Gv) (0, t e t. Изменив уравнение (12) так, чтобы оно приняло вид i ф3(м>) = $ фа(«,Р)5а(Р)ф1 (Р.м а₽, /ет, t}e ч мы можем показать, что И-1 (GCFu) (t) = Л;Ф3 (t, tj+1) (tj) U (tj), H Пользуясь матрицами Wi (s, tj) = hj(&i (s, tj+j) (tj), s, tj s о W2 (t, p) = Ф2 (t, p) B2 (p), t, p e= W3 (t, tj) = A/D3 (t, tj^) Bi (tj), (t, tj) EE (9) и (10) (15) (16) (17) (18) а, уравнения (15) и (16) можно переписать в более компактном виде: [8]-1 x(s)= 2 1^1(«,Ми(0)> (19) [П-1 t 2 ^(t.^u^-h Jir2(Z,p)y(3)d3, t^x. (20) J=O to
Эти соотношения показывают, что гибридную систему, схема которой изображена на рис. 2.16, можно описывать точно так же, как и непрерывные или дискретные системы. Ее режим вынужденных движений можно представить себе как некоторое преобразование Т, отображающее элементы (u, v) банахова пространства U X V в элементы (х, у) е= X X Y: [Т (и, i?)I (г) = [я ($), у (J)], г = (s, t) е о X т, (21) в соответствии с уравнениями (19) и (20) по мере того, как г = = (s, t) пробегает прямоугольник (а X т). Так как режим свободных движений уже был описан преобразованием 0 [см. уравнение (14)], то суммарную реакцию системы можно отождествить с преобразованием (0, Т): Rn X U X X У, где [(0, Т)] (z°, и, 0] (г) = (02°) (г) + [Т (и, р)] (г), г Ео X т. (22) Выбирая фиксированные точки ra - а X т, мы можем построить параметризованное семейство преобразований из Rn X U X V в Rn. Непрерывность в многомерных системах. Мы уже видели, что произведение двух банаховых пространств, с определенными на них нормами, также является банаховым пространством. Например, можно принять, что |(i*, у)|| = max {||4 М|}, ||(М, р)|| = (Мр + «№, !</><«>. Из этих примеров ясно (а на самом деле это верно для любой нормы, определенной на декартовом произведении), что последовательность (un, ип) из U X V сходится к (u, v) G U X V по норме, определенной на U X У, тогда и только тогда, когда ип -> и и vn -> v в U и У, соответственно. Этот же факт можно выразить и другими словами, сказав, что два вектора (и, и) и (u', v') мало отличаются друг от друга в пространстве U X У в том и только в том случае, когда и мало отличается от и' в t7, a v мало отличаатся от v в У. Рассмотрим теперь преобразование, определенное уравнением (20). Поскольку х = Fu, а у = G (и -|- Сх) = Gv + GCFu, то ясно, что преобразование Т линейно. Например, вектор X (u, v) = = (Хи, Хи) отображается с помощью Т в вектор со следующими компонентами: F (X, u) - XFU - Кх, G (Хи) + GCF (Хи) = ХСи J KGCFu = Ху, откуда следует, что ТХ (U, V) = КТ (U, и).
При этом мы воспользовались тем фактом, что преобразования р. и х, С: X -> V и G: V -> Y линейны. Если, кроме того, эти преобразования еще и ограничены, то ограничено и преобразование Т. В самом деле, если (un, vn) ЕЕ U X V сходится к (u, v) G G U X V, то ип -> и, Уп У и в силу непрерывности F\ С и G Fun -> Fu, G (vn + CFun) -> G (p + CFu), откуда т (un, Vn) -+ T (u, v). Таким образом, ясно, что ограниченность преобразования, описывающего гибридную систему, является следствием ограниченности преобразований, представляющих каждую ее подсистему. А это побуждает нас заняться выяснением вопроса, при каких же условиях эти преобразования ограничены. (Этот вывод можно обобщить на случай разомкнутой системы из сколь угодно большого конечного числа подсистем. Однако случай замкнутой системы из нескольких подсистем требует дополнительного исследования. Трудности этого исследования можно почувствовать, взявшись за решение упражнений 7 и 11 этого параграфа.) Напомним, что две нормы || || и || ||', определенные на некотором пространстве X, считаются эквивалентными в том случае, когда существуют такие постоянные 0 а (3, что а |х| |х|' 0||я|| для всех х е X. Предположим теперь, что || и || ц — это две эквивалентные нормы, определенные на некотором пространстве X, а | | и | |' — две эквивалентные нормы, определенные на другом пространстве У. Если А есть некоторое линейное отображение X в У, то ||Ля|| ЛфЦ для всех х ЕЕ X, тогда и только тогда, когда при любых х Е X Другими словами, ограниченное линейное преобразование одного банахова пространства в другое остается ограниченным, если в этих пространствах ввести эквивалентные нормы. В частности, если X = Хх X ... X Xn, a Y = х ... ... хУт — декартовы произведения пространств, то для того, чтобы доказать ограниченность некоторого линейного преобразования А, переводящего X в У, достаточно выбрать любую подходящую пару норм. Это соображение приводит к дополнительному
упрощению вычислений, необходимых для того, чтобы доказать ограниченность преобразования сложной системы. Обозначим через Ах = у = (у1, ..., ут) е= Y образ вектора х = (хх, ... ..., хп) из X. Тогда преобразование А ограничено, если max {UloDC-M [ max {hill}]-i<i<n Другими словами, линейное преобразование А: X -> Y ограничено тогда (и только тогда), когда ограничено каждое из преобразований Ар X -> Yj (j = 1, 2, ..., тп), где Ajx = у,. Рассмотрим теперь преобразование G (см. схему на рис. 2.16). Для v = (р1? ..., рв) ЕЕ V j-я компонента вектора Gv ЕЕ Y определяется по формуле t 8 (Gjv) (0 = $ 2 ^V’k) , ₽) (₽) dp, 1 < i < d, to K=1 где через (t, (3) обозначен элемент на пересечении /-го столбца и А-й строки матрицы W2 (*, |3). Преобразование G ограничено, если ограничено каждое из Gji V -> Yj, что в свою очередь следует из неравенств t | $И^’к)(г,Р)1МР) dp| to где в левой части неравенства — норма в пространстве Yj, а через обозначена норма принятая в Дальнейшее продвижение невозможно, если не конкретизировать пространства входных воздействий V, что в свою очередь требует привлечения физических соображений. Например, нам может понадобиться изучить поведение непрерывной системы G, на которую действуют входные сигналы v с максимальной дифференцируемостью или минимальной интегрируемостью. В первом случае мы будем считать, что V — это С1 X ...X С1, а во втором, что это х ... X Lv Но, что еще хуже (если мы стремимся к максимальной общности), иногда встречаются ситуации, в которых приходится рассматривать входные воздействия и = (р1? ..., ив), для компонент которых нельзя найти однородных требований, в результате чего V может представлять собой декартово произведение С, С1, ..., Сп, а также различных пространств Lp. Наконец, физическими соображениями диктуется и выбор норм (а следовательно, и пространств Yj), по которым будет оцениваться вектор выходных величин у = Gv.
Проиллюстрируем наш метод на одном конкретном примере* Пусть Fx = F2 = ... = F8 = Lp (tQ, b), где p фиксировано (1 p <" оо). Тогда можно установить достаточные условия, которым должны отвечать функции И1;Л)(г, 0) и матрицы W2(t, 0), для того, чтобы гарантировать ограниченность преобразования G. Это, конечно, будет зависеть и от выбора норм для пространств Yj. Учитывая, что ик €= Lp (/0, Ь), мы потребуем от PF^’r)(Z, 0), чтобы они принадлежали пространству LQ(Z0, 0) при каждом так как это гарантирует интегрируемость произведения (Z, 0) ик (0). (Здесь i/p+ 1/q = 1, как обычно; при р = оо, q = 1, и наоборот.) Введем еще более сильное предположение: примем, что И?’” (t, s)^Mjk, т. е. что все эти функции ограничены на прямоугольнике k0, b] X По, Ь]. Тогда с помощью неравенства Гельдера мы установим, что t t I $ (t, P) vk (P) dp I < $ MJk I vk (p) I dp < to to b <$^IMP)|dp<34bll. 0 где , если l^£<^oo, I M если q = oo, a IPfcll — норма в Zp(/0, 6). Таким образом, норма функции t $ W2'к) (t, 0) (0) d0 в пространстве не превосходит М|| vk j|, где о М = max {М Подводя итог, мы можем сказать, что если элементы матрицы W2 ограничены, то G —- это ограниченное линейное преобразование, отображающее V = Lp (£0, b) X ... X Lp (£0, Ь) в пространство Zoo(*o, b) X ... х £оо(*о, Ь). Упражнения 1. Обладает ли матрица 0 (г, г0) из уравнения (13) обычными полугруп-повымп свойствами и свойствами обращения, полученными для матриц 2. Проверьте формулу для (GCFu) (е), приведенную в уравнении (17). 3. Пусть А (/, р) — некоторая переменная матрица, непрерывным образом зависящая от параметра р. Пусть р — это номинальное значение р, а соотношение A (t, р) = A (t, ji) + dp// (t) описывает функциональное поведение 4 в окрестности {dp: || dp [| < /с}, где к мало. Найдите общий вид
возмущений в преобразованиях Ф, Фд, F и Fa в окрестности JT для системы * (/) = л (/, р) х (/) + в (о и (/), t е т. Выясните, являются ли нормы ЛФ, 6Фа, 6F и dFe, как функции, определенные на соответствующем гильбертовом пространстве, подходящими и содержательными мерами чувствительности системы к вариациям ц в частном случае, когда А и Н — диагональные матрицы. 4. Обозначим через и В2 множества функций, определенных для некоторых множеств моментов времени v. Обозначим через / отображение Вх в В2, а через — произвольную точку v. Пусть значения функции у = fu при t > tf полностью определяются числом У (?) = (/“) («') и значениями функции и при t > t', каково бы ни было и е Bv Тогда ото-бражение / мы будем называть причинным. Докажите причинность поведения линейной динамической системы dtx (0 = А (0 х (0 + В (0 и (0, t е v, (23) у(0= С (t) х(0 + D (t) и (0 как для непрерывного, так и для дискретного случаев, где если v = а, и dt = d/dt, если v = т. Причинна ли гибридная система, рассматривавшаяся в этом параграфе? 5. Отображение f из упражнения 4 мы будем называть физически реализуемым, если для всякого 6 v значение у (О = (/“) («') не зависит от того, какие значения принимает и при t > f. Выясните вопрос о физической реализуемости отображения (23). Является ли физически реализуемой гибридная система, рассматривавшаяся в этом параграфе? Если нет, то при каких условиях она станет физически реализуемой? 6. Вернемся еще раз к линейной динамической системе, описывающейся уравнением (3). Пусть т — это промежуток ^, ес], и пусть преобразование Fb определяется соотношением tb Fbau = С Ф (tb, s) В (а) и (0 ds. *а Покажите, что суммарная реакция системы удовлетворяет уравнению х (tc) - Ф М * (ta) = Ф (tc, t ь) Fba и + Fcbu при каждом th ЕЕ т. В остальных упражнениях мы рассматриваем одноконтурную систему, схема которой показана на рис. 2.17. На этой схеме приведены следующие преобразования: F: Вх -♦ В2, описывающие внутреннюю реакцию фиксированного объекта управления; G: Bi -♦ Вх и L: В2 Вх, описывающие поведение компенсаторов, и К: В2 —* В2 и J: В2 -► В3, описывающие выходные ограничения. Символы Вх, В2 и В3 обозначают банаховы пространства. Для описания поведения системы в целом нам понадобятся следующие переменные: и — входной сигнал системы, х — полезный выходной сигнал системы, — наблюдаемый выходной, сигнал системы, ез — внутренняя координата
(состояние) системы, e2 — входной сигнал объекта управления, g и ц — внешние возмущения, действующие на систему. 7. Пусть М = LJ. и пусть преобразования (I + MFG) и (Z + FGM) обратимы. Покажите, что et = (Z + MFGV1 [u + g - e3 = (I + FGM)-1 \FG (u + g) + ц]. Пусть задача выбора компенсаторов М = LJ и G состоит в том, чтобы в отсутствие помех (g = 1] = 0) сохранить между входным сигналом и полезным выходным сигналом соотношение, характеризующее объект управления (е3 = Fu). Покажите тогда, что G = (I — MF)-1. (24) 8. Пусть все рассматриваемые преобразования линейны и ограничены. Покажите, что если \\FGM |, || МF Ц и ||Filf || меньше 1, то из того, что (а) следует (б) (в) (г) (д) Указание. Воспользуйтесь теоремой Е из § 2.2 для того, чтобы установить обратимость преобразований, а затем освободитесь от знаменателей. Заметим, что если ограниченные операторы грубо определять как операторы устойчивых систем, то эти результаты напоминают хорошо известные достаточные условия устойчивости. (Дальнейшие соображения в этом направлении можно найти в работах (Б.105, Б.106, Б.123].) 9. Постройте метод синтеза, позволяющий реализовать выражение (24) для преобразования G, основанный § 2.2). 10. В отсутствие внешних возмущений система описывается уравнениями ё3 = Fu и ёг = и — Мё3. Пусть g = т] = 0, и пусть характеристики объекта изменились: F -♦ F + 6F. Покажите, что с точностью до приращений первого порядка возмущения де3 и значений ё3 и ёи соответственно, удовлетворяют уравнениям б*! = [Z — MF] {-МЪРи + g - MnJ, бс3 = [Z - FM\ \bFu + F (I - MF)~4 + Tj. И. Предположим, что преобразование F обратимо, и пусть М* = XF*1 где 0 < X < 1. Что можно сказать о возможности снижения чувствительности системы с помощью обратной связи? (Какая взаимосвязь существует между снижением чувствительности и коэффициентом усиления G?) G = (I - MF)~\ (I + FGM)"1 = (Z - FM), (I + MFG)'1 = (I - MF). (I + FGM)~lFG = F. I - M (I + FGM)~'FG — I — MF. Рис. 2.17. Одноконтурная система. на разложении Неймана (теорема Е из
2.6 Литература к главе 2 В §§ 2.1 и 2.2 мы продолжали заниматься теми же вопросами, что и в главе 1. Поэтому книги, которые мы предлагали как литературу к главе 1 в целом, способствуют пониманию содержания и этих двух параграфов. Но так как в главе 2 одним из основных математических методов служит теория матриц и определителей, то мы добавим к предыдущему списку еще книги Айткена [А.1], Айерса [А.7], Кука [А.17], Гоффмана и Кунце [А.42] и Перлиса [А .66]*). Дополнительные примеры и результаты из теории интегральных уравнений можно найти в книгах Трикоми*{А.87] и Вольтерра [А.92]. Теории дифференциальных и конечноразностных уравнений посвящено множество отличных книг. Этим же вопросам посвящены и специальные главы нескольких справочных пособий общего характера. Мы можем порекомендовать специализированные монографии Веллмана [А.10], Коддингтона [А.15], Каплана [А.4G] и [А.47], Миллера [А.61], Понтрягина [А.68] и Шпигеля [А.80]. На несколько более высоком уровне написаны книги Коддингтона и Левинсона [А.16] и Лефшеца [А.55]. Богата и литература об уравнениях в конечных разностях. В первую очередь здесь можно порекомендовать книги Гольдберга [А.34], Миллера [А.59] и Ричардсона [А.70]. Читателю следует также прочесть приложения 3 и 4, развивающие материал §§ 2.3 и 2.4. Среди многих книг, посвященных приложениям или излагающим другой подход к решению аналогичной задачи, наиболее близки к теме §§ 2.3 и 2.4 работы Ту [А.86] и Задэ и Дезоера [А.95]. Более классичны монографии Брауна [А.13], Горовитца [А.43], Джури [А.45], Куо [А.53], Пешона [А.67], Ту [А.85] и Цыпкина [А.89]. В остальных главах мы будем заниматься в основном линейными системами. Однако следует заметить, что многие задачи теории нелинейных систем можно рассматривать как естественное обобщение материала главы 2. В частности, работы Сандберга [Б.105—Б.109], Зеймса [Б.123], [Б.124], Минти [Б.84—Б.86], Браудера [Б.15—Б.17] и Зарантонелло [Б.125], [Б.126] образуют внушительную теорию нелинейных систем (сошлемся еще на работы Анселоне [А.5], Кронина [А.18], Красносельского [А.51], [А.52], Саати и Брауна [А.74] и Вайнберга [А.91]). *) Па русском языке можно порекомендовать еще книги Ф. Р. Гантмахера «Теории матриц», 1967, «Наука» и Р. Боллмана «Введение в теорию матриц», 1969, «Наука».
ГЛАВА 3 СТРУКТУРА ЛИНЕЙНЫХ СИСТЕМ Глава 2 показала нам со всей очевидностью, что между неведением линейных динамических систем и свойствами линейных преобразований в банаховых пространствах существует тесная и глубокая связь. На примерах § 2.5 мы смогли убедиться в том, что некоторые типичные системы могут описываться ограниченными линейными преобразованиями, отображающими одно декартово произведение пространств Lp или 1Р в другое. Эта информация не может не радовать, так как теперь мы уверены в том, что наши усилия, затраченные на изучение абстрактных понятий главы 1, не напрасны и уже приносят свои плоды, позволяя по-новому подойти к задаче математического моделирования систем. Однако если бы задача специалиста по общей теории систем состояла лишь в математическом моделировании изучаемых им систем, то это техническое достижение, безусловно, было бы слишком поверхностным. В действительности дело обстоит совсем не так. Как правило, чаще всего оказывается, что математическое моделирование системы — это всего лишь первый шаг, ведущий к изучению более глубоких задач теории чувствительности, оптимального управления, устойчивости, синтеза или фильтрации. В оставшейся части этой книги мы будем преследовать именно эти цели. По мере того, как от ответа на вопрос: «А что такое линейные динамические системы?» мы переходим к решению более интересной задачи, связанной с выяснением того, как можно использовать этот ответ, мы естественным образом приходим к необходимости исследования структурных свойств линейных преобразований. В §§ 2.1 и) 2.2 мы накопили уже немало сведений по этому вопросу. Данная глава продолжает развивать эту тему и доводит до частичного завершения изучение тех понятий, которые жизненно необходимы для решения наших основных задач. 3.1. Линейные функционалы За исключением тождественного преобразования и нулевого преобразования, линейный функционал представляет собой наипростейшее из всех возможных линейных преобразований. А поэтому изучать его структурные свойства проще, чем свойства
линейных преобразований более общего вида. В этом параграфе мы изучим линейные функционалы достаточно подробно. Впрочем, не следует думать, что мы делаем это исключительно для того, чтобы «размяться» перед исследованием более общих преобразований. Изучение линейных преобразований полезно и само по себе, а теория линейных функционалов окажется весьма полезным аппаратом для целого ряда последующих применений. Определение А. Линейным функционалом *) называется линейное преобразование, отображающее область определения X (некоторое нормированное линейное пространство) в пространства К^скаляров, связанных с X. feglMbi уже выяснили, что пространства К (т. е. R или С) представляют собой одномерные банаховы пространства. Поэтому каждый функционал является некоторым элементом пространства L (X, К) линейных преобразований X в К. Если линейный функционал / к тому же и ограничен, то / ЕЕ р (X, К) — пространству* всех ограниченных линейных преобразований X в К.\ Пространства L (X, К) и р (X, К) в современном анализе играют столь значительную роль, что стало обычной практикой вводить для них специальные обозначения. К сожалению, пока не удалось еще договориться об общепринятых обозначениях для этих пространств. Однако часто пользуются символами X' для обозначения L (X, К) и X* для обозначения Р (X, X), и именно их мы и примем для оставшейся части этой книги. Таким образом X* представляет собой (полное нормированное) линейное подпространство Xх, состоящее из всевозможных ограниченных линейных функционалов, определенных на X. По причинам, которые станут очевидными позже, пространство X* называется сопряженным или двойственным по отношению к пространству X. Элементы / ЕЕ X* называются вещественными или комплексными в зависимости от характера используемого множества скаляров. Поскольку множество скаляров образует банахово пространство, все свойства линейных преобразований, установленные ранее, распространяются и на функционалы. Для конкретности мы приведем резюме этих свойств для пространства X*. Свойства линейных функционалов. (1) / (х, 4- х2) =7/ (хг) + / (х2), хп хг S X; (2) У/ (ах) = a f (х) для всех х е X и для любых скаляров а; (3) / (хп) -► / (х) при хп -> х, хп е X; (4) |/ (х) | М Ы для всех х S Х^и некоторого М[^ 0; (5) |/|= sup |/(х)| = sup |/(х)|. ____________м-1 IMK1 *) Термин «функционал» берет свое начало в теории интегральных уравнений, где’он использовался для того, чтобы иметь возможность различать функцип]в’элементарном’смысле этого слова, т. е. определенные на некотором множестве чисел, от функций (или функционалов), определенных на множестве функций.
Подчеркнем, в частности, что X* представляет собой банахово пространство независимо от того, является ли X банаховым или нет. Для того чтобы убедиться в том, насколько часто нам приходится сталкиваться с линейными функционалами, рассмотрим следующие примеры. Пример 1. Обозначим через х = (^1? хъ х3) элемент евклидова пространства Е3. Тогда любая линейная комбинация /0 (х) --= = o^Xi + &211 * * * * * * * Х2 + «э^з представляет собой некоторый линейный функционал. Но так как определяет скалярное произ- ведение вектора xQ = (ах, а2, аз) и вектора х, то функцию /0 (х) можно представить как {х, х0). Изменяя вектор х0, мы можем построить целое семейство функционалов, определенных на 7?8, вида /а (х) = (х, ха). В соответствии с неравенством Шварца i i и, следовательно, функционал /0 ограничен и имеет норму l/oll^(Sl«ila),/*. г Нетрудно видеть, что приведенная выше оценка сверху на самом деле является точной, т. е. в ней знак неравенства следует заменить на знак равенства. Пример 2. Пусть X = Ь2 (0, 1), и пусть / (х) = ^х Этот функционал ставит в соответствие каждому х е X некоторое вещественное число (его среднее значение). Поскольку в соответствии с неравенством Шварца 11 1 V» | / (х) | = | § х (t) dt | § | х (t) | dt [ § | x (t) |2dZ] oo, 0 ‘ о о то ясно, что функционал f (x) ограничен, и его норма не больше единицы. Воспользовавшись определением <х, у) = я У мы сможем записать / (х) в виде <#, 1>. В общем случае скаляр- ное произведение fn (х) = (х, h), где h ЕЕ Ь2 (0, 1), представляет собой некоторый линейный функционал, определенный на Ь2 (0, 1). Пример 3. Пусть X = С (а, 6), и пусть tQ — произвольная фиксированная точка из промежутка [а, &]. Соотношение f (х) = х (/0) определяет один из элементов X*, как это показано в примере 10 из § 2.1. Функционал того же типа, но более общего вида
определяется соотношением ь /(* *) = \x(s)dg ($), а где g есть произвольная функция ограниченной вариации, определенная на промежутке [а, Ы, а интеграл понимается в смысле Стильтьеса. Если читатель незнаком с‘ интегралами Стильтьеса, то ему полезно знать, что в том случае, когда функция g имеет непрерывную переменную g', последний интеграл можно переписать в виде ъ / (г) = j X (s) g' (s) ds, a где этот интеграл является уже интегралом Римана. Пример 4. Пусть X = Z2, и пусть а = {ап} есть некоторый элемент Za. Определим / с помощью соотношения оо /(*) S= <х,а> = 2 г=1 где х = {£п}. Неравенство Шварца показывает, что выписанный выше ряд сходится, а / принадлежит X* и имеет норму, не превосходящую (2i | а, I2)1/’. В примерах 1, 2 и 4 нам удалось представить линейные функционалы в виде некоторых скалярных произведений. Более того, каждый функционал типа скалярного произведения полностью характеризуется всего лишь одним вектором. Действительно, функционал /о определяется вектором х0, a fh — вектором А*). Эти два свойства функционалов распространяются на ситуацию гораздо более общего вида. Однако для начала мы сосредоточим наше внимание на гильбертовых пространствах. Пусть у — некоторый фиксированный вектор гильбертова пространства Н. Рассмотрим функционал /у, определенный на Н с помощью скалярного произведения: fy(x) = {х, у). Легко видеть, что функционал fy линеен, так как + ^2) = (^1 4" ^2» УУ = УУ 4" ^2» УУ = /у (^1) + /у и /„(ах) = <ах, у) = а<х, у> = а/„ (х). Более того, используя неравенство I /у (х) I = I х, V I <Н-М« *) Для того чтобы доказать это, достаточно заметить, что если Л, k G Я, а / (х) = <х, А> = <z, /с>, то <z, h — ку = 0, каково бы ни было х 6 Я. Выбирая х = h — /с, мы получим || h — к ||2 = 0 =4- h = к.
мы убедимся в том, что функционал непрерывен и, следовательно, е Я*. Отсюда следует также, что ||/J ||г/||. Мы можем даже показать, что ||/J| = ||у||. Действительно, если у = 0, то справедливость этого утверждения очевидна. Поэтому предположим, что у 0, и выберем х0 = у/||у||. Но тогда |/v(^o)l = -L7^LL=hll. а так как |хо|| = 1, то мы и доказали это утверждение. Мы показали попутно еще и то, что каждое значение у из Н определяет некоторый функционал из Я*. Соотношение ||/J| = = ||у|| показывает, что соответствие у -> fy определяет взаимно однозначное отображение Я в Я*, сохраняющее норму. Следующая теорема показывает, что это отбражение является к тому же еще и накрытием. Теорема А. ПустьН — некоторое гильбертово пространство, и пусть / — произвольный функционал из Н*. Тогда в пространстве Я найдется такой единственный вектор и, что / (*) = <*. U>, каково бы ни было х из Н. Более того, ||/|| = ||и||. Доказательство. Рассмотрим прежде всего ядро Nf функционала /. Если Nf = Н, то / (я) = 0 при всех ЕЕ Я, а так как / (х) = (х, 0> = 0, каково бы ни было я ЕЕ Я, то вектор и = О выполняет требуемую функцию характеризации функционала /. Как мы уже убедились ранее, Nf представляет собой некоторое замкнутое подпространство Я, и поэтому мы для удобства можем представить Я в виде прямой суммы Я = Nf ф Nf~, что всегда возможно в силу утверждений теоремы о проекциях. Тогда произвольное значение х ЕЕ Я, х Nf допускает представление х = z + w, z е Я/*, w е Nt, z =/= 0. Но / (х) = / (z) + / (w) = f (z) = a 0. Определим теперь хг как z/a; в результате находим / (zj = 1. Пусть у £ Я — совершенно произвольный элемент пространства Я, причем / (у) = |3. Тогда о = / (у) - 0/ (*1) = Цу - ₽^1), так что у — (3^ = и\ ЕЕ Nf, или У = pXj + Шр Таким образом, каждое у является суммой некоторого вектора, принадлежащего Nf, и другого вектора, принадлежащего одномерному пространству, натянутому на хг. Отметим при этом, что
Xi | wv Следовательно, <у, *i> = РЫ2’ а так как 0 = / (у), то имеем где и = ^/И2. Вспомним теперь, что у вполне произвольно. Это позволяет заключить, что / и функционал fu идентичны. Однако мы уже ранее видели, что \\fv\\ =||и|| и что если fu = fr, то и = г. Следовательно, вектор и является единственным вектором из Я, удовлетворяющим условию / = /и. Кроме того, ||/|| = ||и||, что и требовалось формулировкой теоремы. Только что доказанная теорема содержит исключительно важную информацию о структуре абстрактного гильбертова пространства. Например, мы знаем теперь, что функционалы из примеров 1, 2 и 4 исчерпывают все возможности ограниченных линейных функционалов, определенных на соответствующих пространствах. И вообще говоря, совокупность отображений у>, где у ЕЕ Н и фиксировано, в точности совпадает с множеством всевозможных линейных функционалов, определенных на любом гильбертовом пространстве Н. Другое важное следствие этой теоремы относится к структуре пространства Н*. Напомним, что если В — некоторое нормированное линейное пространство, то множество jB* всевозможных ограниченных линейных функционалов, определенных на Я, всегда является банаховым пространством. В самом общем случае о структурных свойствах В* мы вряд ли можем сказать нечто большее. Но дело обстоит много проще, когда пространство В оказывается еще и гильбертовым, Н. В этом случае мы можем утверждать, что отображение у fv сопряженно-линейно, т. е. /l/t+1/i = /1/1 “Ь /у«> /°ч/ = *fy- Оба эти соотношения непосредственно вытекают из определений. Например, равенства fay (х) = <х, ау> = а О, У> = afv (х) доказывают сопряженную однородность отображения у fу. Определим теперь на Я* X Я* функцию (,), потребовав, чтобы (fx, fy) - <У, *>• Так как каждое / СЕ Я* имеет вид /и при некотором и СЕ Я и так как вектор и, удовлетворяющий этому условию в Я, единствен,
такое определение функции (,) непротиворечиво, и, следовательно, мы действительно определили на Н* X Н* некоторую комплексную функцию. Мы утверждаем еще, что функция (,) на самом деле определяет скалярное произведение в Я*. Однако прежде чем доказать это, заметим, что в соответствии с выводами теоремы А норма ограниченного линейного функционала fv совпадает с нормой его характеристического вектора у из Я, т. е. что II/JI = и где ||/vll — операторная норма функционала. Но отсюда следует, что скалярная норма fy совпадает с операторной нормой этого функционала, и, значит, пространство Я* с определенным на нем скалярным произведением (,) полно и, следовательно, представляет собой гильбертово пространство. Осталось лишь доказать, что функция (,) удовлетворяет всем аксиомам скалярного произведения. Но, в самом деле, (/х. + /х.. fv) = <У- xi + х»> = <У- ж1> + <У, = (/х„ fy) + (/х.. /у), (а/х. fv) = (/jx. fv) = <У’ ат> а <У< х> = «(/х. /у). (/х, fy) = <У, х> = ,У> (/у. /х). (/х> /х)= х = о=^ fr = о. Итог всем этим результатам подводится в следствии, сформулированном ниже. Следствие. Если Я — некоторое гильбертово пространство, то гильбертовым является и сопряженное пространство Н*. Скалярное произведение в Н* определяется по формуле (fx> fv) = <У> х>> и норма fy, определяемая этим скалярным произведением, совпадает с прежним выражением нормы этого функционала как нормы линейного преобразования, определенного на Я. Это следствие можно было бы сформулировать еще и по-другому. Обозначим через Н() гильбертово пространство, построенное следующим образом. Векторы Яо обязательно должны принадлежать Я. Сумма двух векторов х и у из Яо совпадает с суммой векторов х и у в Я. Однако, произведение вектора х на скаляр Л в Яо определяется не так, как в Я, а как соответствующее произведение х на X в Я. По-другому определено в Яо и скалярное произведение <,>0: У>о = <*Л *>•
В этом случае сформулированное выше следствие утверждает, что сопряженное к Н пространство Я* изометрически изоморфно гильбертову пространству Яо*). Поэтому мы можем отождествить Но и Я*. Наконец, совершенно ясно, что те же самые рассуждения в равной степени применимы и к гильбертову пространству HQи приведут к доказательству изометрической изоморфности HQ и Н. так как пространства Н и Яо образованы в точности теми же самыми векторами с теми же самыми алгебраическими операциями и отличаются лишь определением скалярного произведения, в котором нужно сделать перестановку порядка переменных, то пространства Н и По обычно не различают между собой. Если договориться об этом, то мы сможем утверждать, что каждое гильбертово пространство Н является самосопряженным, т. е. Я* = Н. Перейдем теперь к исследованию содержания всех этих утверждений на примере некоторых конкретных гильбертовых пространств. Пример 5. В пространстве 12 (п) n-мерных векторов скалярное произведение двух векторов х = (£п ..., gn) и у = (Л1., •••» Лп)» а, следовательно, и наиболее общий ограниченный линейный функционал /, определяется выражением / (х) = <х, у> = Более того, П/ll2 = Последний результат можно доказать непосредственно. Векторы — 1, где = (0, 0,..., 0,1, 0, ...,0), образуют в 12 (п) базис. Поэтому, если х = (gx, ..., %п) £= h (и), то х = ^7=1 Пусть теперь / — некоторый линейный функционал, определенный в 12 (п), и пусть /(^) = т]р Тогда /(*) = / = S lit fa) = ЗВгп» = y>, i i i где У = fai....Пп)- Пример 6. Точно таким же образом, как и для пространства 12 (п), можно показать, что наиболее общий ограниченный *) Заметим, что пространство Яо является зеркальным отображением Н и что, по аналогии с ситуацией на комплексной плоскости, пространство Яо заслуживало бы названия пространства, сопряженного Я. Поэтому наше следствие можно интерпретировать как утверждение того, что пространство, сопряженное (в смысле двойственности банаховых пространств) Я, совпадает с (геометрически) сопряженным пространством Яо. Заметим еще, что если гильбертово пространство Я вещественно, то между Я и Яо нет никакой разницы.
линейный функционал в /2 имеет вид оо / (х) = <х, у) = 2 {“1 причем оо ll/ll2 = kF-i=l Пример 7. В пространстве L2 (0, 1) наиболее общий ограниченный линейный функционал имеет вид 1 /(*) = §x(t)y(t) dt, о а его норма 1 ll/lla = JI</(*) |2Л. о Пространства, сопряженные некоторым конкретным банаховым пространством. Возможность представления линейного функционала в виде скалярного произведения гарантирована лишь для гильбертовых пространств. Однако часто весьма привычную форму принимают линейные функционалы, определенные и на других конкретных пространствах. Наш следующий пример как раз и посвящен подробному исследованию линейных функционалов, определенных на одном конкретном банаховом пространстве. Пример 8. Каждый ограниченный линейный функционал /, определенный на пространстве с0, имеет вид 00 /(®)=ЗЬтц, * = i=l где оо (пьП2,..-)е/х и ||/||=2hol- 4=1 Доказательство. Если (тц, ц2, •••) G llt то для каждого х = = (£1» •••) из cQ справедливо условие sup I Ы = 1И1 < °°» и, следовательно, П 71 ОО i«l i=l i=l
Отсюда вытекает, что оо оо 122 I’M, i=l i=l и, значит, функция /, определенная на с0 выражением / (*) = 2 х = (Si, Sa,...) е с0, 1=1 ограничена и имеет норму Кроме того, ясно, что функция / линейна. Для того чтобы показать, что норма / в действительности равна 2Г£=1|т1г|, достаточно убедиться в том что для каждого 8 > 0 найдется такой вектор х = (^, £2, ..«)из с0 с ||лг|| 1, что|/ (х) |^> > J’ili | r]i j — 8. Но так как | rji | < оо, то существует такое целое число п0, что оо 2 I’M <8- i=n0 Обозначим через х = (£х, £2, •••) вектор, координаты которого определены следующим образом: £< = MJ л • А О -• , если ть^О, . Т]. ’ I» > ’ 0, в противном случае. »^о» Ясно, что х ЕЕ с0 и оо и» оо / (*) = 2 Sint = 2 I m I > 2 I ’ll I -8-i=l i=l i=l Остается лишь доказать, что если / — ограниченный линейный функционал в с0, то в всегда найдется такой вектор (гц, ц2, ...), что f(x) = Fspii, каково бы НИ было X = (£х, £2, •••) со- ДЛЯ ЭТОГО положим rji = / (^i), где Xi и определяется следующим условием: xL - (о, 0, 1, 0, ...),
в соответствии с которым все его координаты, за исключением i-й, равны 0. Если у вектора х = (Еп £2, •••» 5п» 0, ...) лишь конечное число ненулевых координат, то ясно, что / (х) = У&Лр Зафиксируем теперь целое число п и определим вектор х = = (hi» Ь, ...) с помощью условий li = ' h( I 0, в если 0, i = 1, 2, .. . , п, противном случае. Мы найдем тогда, что П п г=1 г=1 Но так как число п произвольно, то можно заключить, что 00 и> следовательно, (тц, Т)2» •••) €= 1\- Наконец, если вектор х = (£п £2, ...)€= с0 и задан, то положим яп = (11» 5г» • ••, U» 0» 0» •••)» ГДО п = 1, 2, ... Ясно, что хп с0. Но если задаться еще и е^> 0, то всегда найдется такое п0, что | 5i| <С е ПРИ г > я0, и следовательно, k—M = suP|£iKe i>n каждый раз, когда п п0. Другими словами, в пространстве с0 хп -+х. Пользуясь непрерывностью /, можно утверждать, что /(*n) Но, с другой стороны, f (хп) = j'"=i Si-Hi и, как П 00 легко видеть, при п -► оо: У, £<т]4 —> У, Поэтому г=>1 г=1 оо f (*) = S г=1 что и требовалось доказать. Пример 8 характерен для ситуации, существующей во многих знакомых банаховых пространствах. Подытожим полученный результат для наиболее интересных с точки зрения потенциальных приложений банаховых пространств. Теорема Б. Пусть 1 < оо, и пусть Up + 1/g = 1. Тогда, если f — некоторый линейный функционал, определенный на пространстве Lp(t), то существует единственный элемент
у е Eq (т), такой, что f (*) = fv (х) = J х (0 У (0 т причем норма функционала f равна норме у, как элемента пространства Lq (т): Этот результат подтверждает целесообразность называть Lq пространством, сопряженным пространству Lp. Точнее говоря, сформулированная только что теорема утверждает, что отображение f -+fу является линейной изометрией между Lp и Lq. Аналогичный результат для пространств, составленных из последовательностей, сформулирован в теореме В. Теорема В. Пусть 1 < р оо и Ир + Hq = 1. Если / — некоторый линейный функционал, определенный на пространстве 1Р, то существует такой единственный элемент y€Elq, что оо f(x)=fu(x) = 3 Мк» fc=i гдех = (&, ...) и и = (т]п r]h, ...), причем ||/u|| = || и||, = = &il Замечание 1. Если р = q = 2, то наши результаты справедливы для гильбертовых пространств Ь2 (т) и 12. так как l2 (п) Q /г» то теорема В справедлива также и для пространства 12 (п). В этом случае функционал имеет вид / (х) = Приведенные теоремы сохраняют свою справедливость и в том случае, когда р = 1. В этой ситуации уравнение 1/р + 1/q = 1 подсказывает, что Lx = и = Zoo- Эти предположения, действительно, оказываются верными. Так, каждый ограниченный линейный функционал /, определенный на LY (т), имеет норму /(*) =tv (х) = p(W) dt, где уе£оо(т) И 1/1 = 11^1100 = ess sup |p(t)|. Аналогично норма ограниченного линейного функционала в 1г определяется по формуле 00 / (*) = fy (X) = 2 X U, ...)<= /1,
где У = (Пп Пг» ••• и принадлежит /оо» причем |/| = kl» = sup | Till, i (Доказательство того, что Гг = практически повторяет рассуждения примера 8). Таким образом, теоремы Б и В оказываются истинными для значений р, лежащих в пределах 1 < оо. Но что удивитель- но (а часто и очень неприятно), так это то, что обе эти теоремы несправедливы для случая р = ос. Тот факт, что каждый вектор у = (т]1? т]п, ...) из /оо определяет некоторый линейный функционал в /х, норма которого совпадает с || у||оо, приводит к неравенству ОО 00 13 IBil) (sup и. D-i=l i=l Если теперь зафиксировать z = (gx, ..., ...) в /х, а вектору у позволить меняться в /оо» то отображение, преобразующее у в число является некоторым ограниченным линейным функционалом в /оо. Другими словами, ZxCZ /оо- Однако это включение в данном случае оказывается собственным, т. е. в недостаточно векторов для того, чтобы охарактеризовать все ограниченные линейные функционалы, определенные на /оо- Аналогично обстоит дело и с пространством (т), для которого Lx 6= L^. Представляется полезным отметить, что такая патология не наблюдается в конечномерном случае. Другими словами, 1Х (и) двойственно /оо (и), и, следовательно, соотношение [1Р (и)] * = = lq (и) справедливо при 1 р сю. Причина этого состоит в том, что /оо (ц) конечномерно, или, что эквивалентно, все линейные функционалы в /оо (и) ограничены. Наконец, заметим еще, что если 1 < р оо, то 1 < q оо, и теорема Д (соответственно, Е), примененная к пространству Lq (соответственно, /q), показывает, что Lp (соответственно, 1Р) двойственно к Lq (lq). В чисто символическом виде: Lp = Lp и /р = = /р, если только 1 <С Р <С 00• Предыдущее замечание показывает также, что [1Р (п)] ** = 1р (п) при 1 р оо. Таким образом, при 1 < р оо пространства lp (n), lp и L9 рефлексивны (см. § 3.3). Для читателя с более полной подготовкой утверждения двух последних форм могут быть сформулированы следующим, более общим образом.
Теорема Г. Пусть 1 р оо, и пусть Ир + Hq = 1. Тогда, если / — некоторый ограниченный линейный функционал, определенный на банаховом пространстве Lp (т, р,) всевозможных измеримых функций, определенных на т и таких, что |/(£)|р, р интегрируемо на этом промежутке, то существует такой единственный элемент у (Е~ Lq (т, р). что f(x)=fy (х) = причем ЛА,1 = Ы, = |• Пространство BV. Прежде чем переходить к следующему примеру, мы остановимся вкратце на изучении свойств одного важного банахова пространства — пространства функций ограниченной вариации. Обозначим через {^, ^п-х} некоторое под- множество точек промежутка [а, Ь]. где а = tQ ... < tn = Ь. а через v — соответствующее этому подмножеству разбиение [а, 6]. Тогда для каждой функции /, определенной на [я, &], можно найти число п—1 l/k= 3l/('i+i)-/(Mi-i=0 Если через Q обозначить множество всевозможных разбиений про- ” межутка [а, 6], то вариация функции на этом промежутке определяется следующим соотношением: var (/) = sup | / |v. [a,b] vEQ Если varta>bj (/) оо, то про функцию / говорят, что она имеет ограниченную вариацию. Сейчас у пас нет ни времени, ни желания исследовать этот класс функций сколько-нибудь подробно. Однако мы перечислим здесь некоторые из важнейших свойств этих функций. Во-первых, заметим, что если функция / неубывающая (т. е. / (/J / (/2) при^1 < f2l, то var[a,b] (/)=/(&)—/ (а). Аналогично, если / — невозрастающая функция, то уаг[а>ь] (/) -- /(«)—/ (Ь). Во-вторых, если функция / дифференцируема на промежутке [а, Ь]. то ь var(/) = j|/' [а.Ь] а
и если / — ступенчатая функция (т. е. / постоянна всюду, за исключением конечного числа точек, где она претерпевает скачок), то [а.Ь] где суммирование происходит по всем точкам разрыва /0. Очевидно, вариация постоянной функции равна нулю, а соотношения var (а/) = | ос | var (/), [а.Ь] [а.Ь] var(/ + g)<var (/) 4- var(g) [а.Ь] [а.Ь] [а.Ь] справедливы для любых скаляров а и произвольных функций / и g ограниченной вариации. Другими словами, пространство BV 1а, Ы всевозможных функций ограниченной вариации, определенных на промежутке [а, 6], представляет собой линейное пространство. Более того, если не принимать во внимание того факта, что равенство нулю var[a, ь] / означает постоянство функции /, то «вариационный оператор» удовлетворяет на ВV [а, 61 всем аксиомам нормированного пространства. Этот незначительный изъян можно исправить, потребовав, например, чтобы каждая функция / 6= BV [а, 6] удовлетворяла еще и условию / (f) = 0 для некоторого фиксированного f ЕЕ [а, 6]. К эквивалентному результату можно прийти, если считать эквивалентными в BV [а, 61 две любые функции, отличающиеся друг от друга лишь на постоянную. В этом смысле любая постоянная функция оказалась бы эквивалентной тождественному нулю и пространство BV [а, 6] стало бы нормированным линейным пространством, состоящим из классов эквивалентности. Пространство LY (а, Ъ) можно погрузить в пространство BV[а, 61. Делается это следующим образом. Каждой функции /' ЕЕ (а, Ь) ставится в соответствие функция /, где t a Это правило, очевидно, определяет некоторое линейное преобразование (а, Ь) в BV [а, 61. Можно показать, что такое преобразование сохраняет норму. Другими словами, можно показать, что var (/) =||Г [|х, [а.Ь] Однако неверно было бы утверждать, что каждую функцию / ЕЕ BV [а, 6] можно построить таким образом.
Для того чтобы показать существование другого подмножества BV [а, Ь], воспользуется знакомой (хотя и чисто формально) дельта-функцией Дирака *). Обозначим через 6 (t — th) обобщенную функцию, определенную следующими условиями: 6 (t — t^) = 0, t =/= tk ЕЕ [а, 6], ^+е j 5(t — tk)dt = 1, e>0. 'k-' Обозначим, далее, через о = {tk} такое подмножество (а, Ь), для которого th <С tk+19 а через а = (ах, а2, ...) — некоторый вектор из Zx. Обозначим через ga функцию г Тогда функция ga (Z), определенная выражением / ga (0 = J ga (s)ds, а представляет собой ступенчатую функцию с разрывами в точках множества o’, претерпевающую в этих точках скачкообразное приращение Ь {ai}. Более того, вариация ga определяется по следующей формуле: var(ga) = ||<х|| = 2l«i I-[a.b] i В связи с этим становится ясным, что пространство (a, b) и линейные пространства обобщенных функций аналогичного типа естественно считать собственными подпространствами BV [а, 6]. Теорема Д. Каждый линейный функционал f в пространстве С (0, 1) можно представить интегралом Стилътьеса 1 /(х) = ^x(t)dg(t), хе С(0,1), о где g (t) — некоторая функция ограниченной вариации на [0, 1], причем || / Ц равна полной вариации g на этом промежутке. ♦) Эту дельта-функцию можно строго определить лишь в рамках теории обобщенных функций. Заинтересовавшийся читатель может обратиться к нескольким прекрасным руководствам ([А.29], [А.75] или [А.95], например).
Из приведенных примеров совершенно ясно, что рассматривавшиеся там функционалы, определенные на банаховых пространствах, весьма похожи на функционалы в гильбертовых пространствах. В приведенных примерах каждый функционал /п, определенный на X, образуется в результате выбора некоторого элемента из какого-то вспомогательного пространства U и операции fu (х) = (я, м>, где символ <,> обозначает операцию того же типа, что и скалярное произведение, которая каждый раз, естественно, принимает вид, подходящий к конкретному рассматриваемому случаю и типу пространства X. Пространства X* и U находятся во взаимно однозначном соответствии, т. е. для всякого и G U найдется свой соответствующий функционал /и = из X*, и наоборот. Более того, поскольку \\fu (х)|| ||н||, то у соответствующих и и /и — одинаковые нормы. Если переименовать все и, использовав для этого соответствующие /и, в результате чего / (х) окажется равным (я, />, то исчезнет необходимость и в явном упоминании вспомогательного пространства U. В этом случае пространство X*, будучи пространством операторов, должно состоять из элементов вида (,/>. Однако в последующем зачастую проще представлять себе X* как пространство, образованное элементами / и обладающее операцией (,>. Обсуждение. Исследуем взаимосвязь между X и X* более подробно. Мы знаем, что если / есть некоторый фиксированный вектор из X*, то отображение х -+f (х) линейно: / («Л + а2я2) = ad (*i) + «г/ (дг2). Более того, оно ограничено: II/ (*) II < ИЛ-И для всех е х. Предположим теперь, что Д и /2 являются элементами пространства X*, a Oj и а2- некоторые скаляры. Напомним, что если рассматривать X* как пространство линейных преобразований, определенных на X и принимающих значения в поле скаляров, то в нем автоматически определяются естественные алгебраические операции. Так, по определению, через ахД + «2/2 мы обозначили линейный функционал, определенный на X, и преобразующий вектор х из X в о^Д (х) + а^Д (я): (а1Д + а2/г) (*) = (х) + а<>/2 (х). Мы знаем, кроме того, что этот функционал также ограничен, а следовательно, представляет собой элемент X*. Задумавшись на секунду, мы сразу поймем, что если в этом последнем уравнении фиксировать х и менять Д принадлежащие X*, то отображение / ->/ (х) будет тоже линейным.
Это заключение можно сформулировать более конкретным образом. Мы договорились уже обозначать через <х, /> вещественные (или комплексные) скаляры / (х). Тогда <,> представляет собой некоторую функцию, определенную на X х X* и принимающую значения из поля скаляров. Эта функция билинейна: (ВД + а2а:2, /> = Ox /> + а2<х2, />. <х, aJi 4- О2/2> = ах < х, А > + а2 (х, f2~> и обладает свойствами скалярного произведения, о чем мы уже упоминали выше. В последующем мы будем свободно заменять обозначение / (х) на <х, />. Тот факт, что символ <,> приобретает новый смысл, если пространство X гильбертово (а сама функция — новые свойства, например, <х, у> = \У, я>), не вызывает никаких затруднений, если мы не будем забывать о контексте, в котором он используется. В то же время такое обозначение чрезвычайно удобно по многим причинам. Например, исходное определение X* как пррстранства ограниченных линейных функционалов, определенных на X, наводит на мысль, что пространство X в некотором смысле более фундаментально, чем пространство X*. Однако в каждом конкретном примере банахова пространства, который мы рассматривали до сих пор, пространство X* оказалось таким же фундаментальным банаховым пространством, как и X. Действительно, пространство Lq ничуть не менее важно, чем пространство Lp, и пространство Zoo заслуживает изучения ничуть не в меньшей степени, чем пространство 1Х. Обозначение <х, /> ставит векторы пространств X и X* в равные права, и по одной этой причине оно заслуживало бы предпочтения перед обозначением / (я). Однако за использование символа (я, /> говорит не только это. Рассмотрим утверждение, согласно которому каждое / из X* есть некоторый ограниченный линейный функционал, определенный на X. В наших новых обозначениях утверждение об ограниченности функционала / имеет вид | (я, /> I ||/|| • каково бы ни было х Gz X. Это соотношение, безусловно, напоминает неравенство Коши — Шварца, полученное для гильбертовых пространств. Однако это неравенство справедливо для каждого / из X*, так что, фиксируя х из X, мы получим, что | \Х, /> | ^ ||яЦ • (|/||, каково бы ни было / ЕЕ X*. Таким образом, каждое х из X задает с помощью операции <х,> некоторый ограниченный линейный функционал, определенный на X*. В символической форме записи это означает, что X CZ X**,
Таблица 3.1 X X* Вид функционала Норма Функционала 4(п) ^2 j. МО, 1) £р(0, 1) (1 < р < оо) МО, 1) 1р (1<РО) h ' £(0, 1) Z2(n) ^2 £2(0, 1) ь9(0,1) ^(0,1) 1я loo {j : j (t) ограничена на [0,1]} п <*. />=2$л 1 00 <х, />=2м< 1 1 <ж,/> = ^z(t)/(0rff 0 1 <*,/> — 0 1 <z, /> = \x(t)f (t)dt 0 00 <*, />=3^i 1 00 <®, />=S^i 1 1 <*,/> =5® (')<*/(*) 0 il/l = (Shii2),;’ 1 0 /с W’ и/|=()|/(01’л; 0 ||/|| = esssup|/(t)| 0«<l 1 ц/11 = зир|^| i 11/11= vary) [«. b] 3.1. ЛИНЕЙНЫЕ ФУНКЦИОНАЛЫ
где X** — (по определению) банахово пространство, сопряженное к X*. Это утверждение мы