обложк
титу
I - Аналитическая геометри
2 - Линии на плоскост
3 - Вектор
4 - Поверхности и линии в пространств
II - Алгебр
6 - Системы линейных уравнени
7 - Комплексные числ
8 - Алгебраические уравнени
9 - Линейные пространств
10 - Линейные преобразования øлинейные операторы
11 - Квадратичные  форм
12 - Групп
III - Математическией анали
14 - Производные и дифференциал
15 - Приложения производно
16 - Неопределенный интегра
17 - Определенный интегра
18 - Дифференциальное исчисление функций нескольких переменны
19 - Двойной интегра
20 - Тройной интегра
21 - Криволинейные интеграл
22 - Интегралы по поверхност
23 - Числовые ряд
24 - Функциональные ряд
IV - Дифференциальные уравнени
26 - Дифференциальные уравнения второго порядк
27 - Дифференциальные уравнения высших порядков и системы дифференциальных уравнени
28 - Дифференциальные уравнения с частными производным
29 - Элементы векторного и тензорного анализ
V - Численные метод
31 - Интерполирование функци
32 - Приближенное вычисление определенных интеграло
33 - Приближенное решение дифференциальных уравнени
VI - Теория вероятностей и математическая обработка результатов измерени
35 - Случайные величины, их распределения и числовые характеристик
36 - Элементы математической статистики и математической обработки результатов измерени
Некоторые математические знаки и даты их возникновени
Биографический словар
Предметный указател
Содержани
Text
                    А.А. Гусак Г. M. Гусак
СПРАВОЧНИК
ПО ВЫСШЕЙ
МАТЕМАТИКЕ

A. A. Гусак Г. M. Гусак СПРАВОЧНИК ПО ВЫСШЕЙ МАТЕМАТИКЕ МИНСК «НАВУКА I ТЭХН1КА» 1991
ББК 22.11я2 Г 96 УДК 51(035.5) Редактор д-р физ.-мат. наук П. И. Монастырный Рецензенты: д-р физ.-мат. наук М. Д. Мартыненко, канд. физ.-мат. наук А. А. Дадаян Гусак А. А., Гусак Г. М. Г 96 Справочник по высшей математике: Справ.— Мн.: Навука i тэхн!ка, 1991.—480 с. ISBN 5-343-00702-3. Справочник содержит теоретические сведения по многим разделам математики: аналитической геометрии, алгебре, математическому анализу, дифференциальным уравнениям, численным методам, теории вероятностей и ее приложениям. Включает примеры применения теории к решению задач, иллюстрации, соответствующие исторические сведения. Рассчитан на инженерно-технических работников и других лиц, исполь- зующих математические методы в своей научной и практической деятель- ности, а также на студентов и аспирантов высших учебных заведений. Г »М2(Н0000-145_9) ББК 22.11я2 М316(03)—91 ISBN 5-343-00702-3 © А. А. Гусак, Г. М. Гусак, 1991
АНАЛИТИЧЕСКАЯ ГЕОМЕТРИЯ
Глава 1 КООРДИНАТЫ НА ПРЯМОЙ, НА ПЛОСКОСТИ, В ПРОСТРАНСТВЕ 1.1. Координаты на прямой На прямой зафиксируем одно из двух определяемых ею направлений и назовем его положительным, другое — отрицательным. Прямую, на которой указано положительное направление, называют осью. Отрезок, ограниченный точками А и В, называют направленным отрезком или вектором, если указано, какая из данных точек является началом, какая — концом. Направленный отрезок с началом в точке А и концом в точке В обозначают АВ. Величиной направленного отрезка АВ некоторой оси называют его длину, взятую со знаком плюс, когда направление этого отрезка совпадает с поло- жительным направлением данной оси, и со знаком минус, когда оно совпадает с отрицательным направлением оси. Величину направленного отрезка АВ обо- значают АВ. Координатной осью называют прямую, на которой зафиксированы начало отсчета, положительное направление и выбран масштаб для измерения длин. Координатой точки М координатной оси (рис. 1.1) называют величину ОМ направленного отрезка ОМ, где О — начало координат. Если обозначить коор- динату точки М через х, то по определению х=ОМ. Запись М (х) означает, что точка М имеет координату х. Если даны две точки Mi (х,) и Л42(х2), то величина направленного отрезка М,М2 вычисляется по формуле А4 |М2 = Х2 —Х|, (1.1) а расстояние между ними — по формуле p(M,,M2) = |M,Af2| = |x2-xl|. (1.2) Простым отношением трех различных точек М,, Ms, М, лежащих на одной прямой и взятых в указанном порядке, называют число где MiM и ММ2 — величины направленных отрезков М,М и ММ2. Если точка М принадлежит отрезку М,М2, простое отношение положительно (/>0), так как числитель и знаменатель в последней формуле одного знака. В этом случае говорят, что точка М делит отрезок М,М2 внутренним образом. Если точка М лежит вне отрезка MiM2, то /<0 (числитель и знаменатель в формуле имеют противоположные знаки); точка М делит отрезок М,М2 внешним образом. Если точки А41 и М совпадают, то / = 0. « » « » OEM х Рис. 1.1 4
Пусть Mi (xt), Л12(хг), Л4(х) —точки координатной оси Ох, тогда I MiM х — Xi ММ2 хг — х откуда Эта формула определяет координату точки М, делящей направленный отрезок М1М2 в данном отношении I. Если точка М совпадает с серединой отрезка М1М2, то координата определяется формулой Х1 +*2 х 2 ' Пример 1.1. Даны две точки Л11(4), A42( —3). Найти ленного отрезка М1М2 и расстояние между точками. В данном случае х,=4, х2= — 3; по формулам (1.1) М,М2 = -3-4= -7, р(М1,Л42) = 1-3-41 =7. / = 1, поэтому ее (1.6) величину направ- и (1.2) находим 1.2. Координаты на плоскости Прямоугольными декартовыми координатами точки М называют числа, определяемые формулами х = ОЛ4х, у = ОМу, где ОМ„ — величина отрезка ОМХ оси Ох, ОМУ — величина направленного отрезка ОМ;, оси Оу (рис. 1.2). Полярная система координат на плоскости определяется точкой О. (полюс), исходящим из нее лучом ОР (полярная ось), масштабным отрезком е и на- правлением отсчета углов (рис. 1.3). Полярными координатами точки М, не совпадающей с полюсом, называют расстояние р=|ОЛ4| (полярный радиус) от точки М до полюса О и величину угла <р (полярный угол) между полярной осью ОР и лучом ОМ. Для полюса считают р = 0 (<р не определен). Полярный угол имеет бесконечное множество значений, главным значением его называют значение, удовлетворяющее условию 0^ <р<2л. При соответствующем выборе прямоугольной декартовой и полярной систем координат (рис. 1.4) связь между декартовыми координатами х и у точки М и ее полярными координатами р и ф выражается формулами 5
Р= Ф*2 + у\ cos <р= Х , sin <р= У . (1.8) V* + у -фг + у2 Пример 1.2. Найти прямоугольные декартовы координаты точек Л (2, л/4), В (4, л/4) в системе, для которой полюс совпадает с началом коор- динат, полярная ось — с положительной полуосью Ох. Применяя формулы (1.7), находим координаты точки А: x = 2cos -j- =2 = д/2, у = 2sin = 2 —= -\/2, А (д/2, л/2). Аналогично находим координаты точки В: х — 2^/2, у = 2^]2. 1.3. Расстояние между двумя точками на плоскости В прямоугольной декартовой системе координат расстояние между двумя точками М। (х,, yt), М2(х2, уг) определяется формулой р(Л41, М2) = VTx2 —Х|)2+ (у2 — уА2 (1-9) В частном случае, когда одна из точек, например Mi, совпадает с началом координат, формула (1.9) принимает вид р(О, М2) = д/х2 + г/2 • (1-Ю) Пример 1.3. Вычислить расстояние между точками Л1| (6,—3),Л42(9,—7) и расстояние от точки М2 до начала координат. По формулам (1.9) и (1.10) получаем р(Л4,, ЛЬ) = V(9-6)2+ ((-7) - (-3))2 =5, р(О, ЛЬ) = д/92+(-7)2 = \Тзб. Пример 1.4. Вычислить периметр треугольника с вершинами в точках Д(— 1, -3), В(2, -3), С(2, 1). По формуле (1.9) находим а = р(В, С) = д/(2-2)2+ (I — ( —3))а = 4, b = p(A, С) =V(2-(-l))2+(l-(-3))2 = 5, с = р(А, В) =л/(2-(-ТУГТГ-3-(-3)Т = 3. Следовательно, P = a-j-bA-c= 12. 1.4. Деление отрезка в данном отношении Отношением, в котором точка М, лежащая на прямой, проходящей через точки М। и М2, делит отрезок М|М2, называют число /, определяемое формулой (1.3). Если даны точки М।(х,, у\), М2(х2,у2), то координаты точки М(х,у), делящей отрезок М|М2 в отношении /, определяются формулами (Н1) Когда точка М является серединой отрезка М,М2, то ее координаты вычисляют по формулам х= (Xi-|-х2)/2, у= (t/i +у2) /2. (1-12) Пример 1.5. Даны две точки Mi (— 1, — 2), Л42(3, 4). На прямой Л1|Л42 найти точку М, которая в три раза ближе к Alt, чем к Л42, и находится вне отрезка М|М2. Найти середину этого отрезка. 6
Искомая точка М делит отрезок М|М2 в отношении 1= —1/3. По формулам (1.11), считая в них Xi = — 1, t/i = — 2, х2 = 3, t/2 = 4, находим — 1 + ( — 1/3)3 1 + (—1/3) — 2+ ( —1/3)4 1 + (-1/3) = —5; М(-3, -5). С помощью формул (1.12) находим точку Л^(1, 1) — середину отрезка Л4|Л42. Пример 1.6. Найти координаты точки пересечения медиан треугольника с вершинами в точках А (хь </,), S(x2,i/2), С(х3,у3). Пусть S(x,y) — точка пересечения медиан АК, BL, СМ треугольника АВС (рис. 1.5, а). Так как точка L — середина отрезка АС, то она имеет координаты xL = (xi +х3)/2, у l= (у>А~Уз)/2. Отрезок BL точкой S делится в отношении /=2/1=2. Считая точку В первой, точку L второй, по формулам (1.11) находим _ х2 + 2(х,+хз)/2 _ Xi+хг + хз у2 + 2(у, + Уз)/2 _ yi+yz + уз Х 1+2 3 ’ У 1+2 3 Следовательно, координаты точки" пересечения медиан треугольника по координатам его вершин определяются формулами х= (xi+*г + хз)/3, у= (yt +//г + //з)/3. (1-13) 1.5. Центр тяжести системы масс Дана система масс mi, m2, ... , т„, помещенных соответственно в точках М|(Х|,1/|), Л12(х2, у2), ... ,Мп(х„,уп) некоторой плоскости. Формулы, выражающие координаты центра тяжести этой системы масс, имеют вид х= Хут.' +x2m2H------]-х„т„ __ yimt + у2т2-\----}-у„т„ mi+m2^-------\-тп ’ У mi+m2H--------------[-т„ или п п У Xktnk У Уьтк У, тк У ntk k=\ А=1 где знаком £ обозначена сумма однотипных слагаемых.
Пример 1.7. В вершинах А (л,, yi), В (х2, у2), С(х2, уз) треугольника АВС сосредоточены равные массы т. Найти центр тяжести этой материальной системы. Формулы (1.14) при п = 3 принимают вид _ Х|/И1 + х2т2 + х3т3 _ t/im, + у2т2 + Узт3 Х М1+т2 + шз 'У mi + ms + ms Используя условие mi = т2 = тз = т, получаем х_ xtm + x2m + x3m _ zn(xi +*г + хз) _ xt + х2 + х3 mF т -\-т Зт 3 yim + y2m + y3m = mjyi+Уг + Уз) _ У>+Уз + Уз У т + т + т Зт 3 ' Замечание. Из последнего примера, и формул (1.13) следует, что центр тяжести данной системы находится в точке пересечения медиан треугольника. 1.6. Площадь треугольника Каковы бы ни были три точки Л(Х|,У1), В(х2, у2), С(х3,у3), площадь S треугольника АВС вычисляется по формуле ±S= Ц- [(*2—Х1) (Уз-УА — (Хз — Xi) (у2 — у,)]. (1.15) Правая часть формулы равна +S в том случае, когда кратчайший поворот отрезка АВ к отрезку АС положителен (рис. 1.5, а), и —5, когда указанный поворот отрицателен (рис. 1.5, б). В формуле (1.15) берут знак плюс, когда выражение в квадратных скобках положительно, и минус, когда оно отрицательно. Пример 1.8. Даны две точки А (3, 5), В(6, — 2). На оси Оу найти такую точку С, чтобы площадь треугольника АВС равнялась 15 квадратным единицам. Пусть С(0, у) — искомая точка (х=0, так как точка лежит на оси Оу). В формулу (1.15) подставим значения S = 15, Xi=3, yi=5, Х2 = 6, у2= — 2, Хз = 0, уз = у и найдем у. ± 15= -±- [(6-3) (у—5) - (0-3) (-2-5)] = Ц- [3(у—5) -21], ±15=-i-(Зу —36), ±30 = 3y-36, yi = 2, у2 = 22. Итак, условию задачи удовлетворяют координаты точек С, (0,2), Сг(0, 22). 1.7. Уравнение линии в декартовых координатах Уравнением линии относительно фиксированной системы координат называют такое уравнение с двумя переменными, которому удовлетворяют коор- динаты любой точки этой линии и не удовлетворяют координаты ни одной точки, не лежащей на данной линии. Уравнение линии в декартовых координатах в общем виде записывается так: F(x, у) =0, где F(x, у) — функция переменных х и у. Пример 1.9. Составить уравнение множества точек, равноудаленных от двух данных точек Af,(—4, 3) и Л42(2, 5). Пусть М(х,у) —произвольная точка данного геометрического места. По условию |Л4|Л4| = |Л42Л1|. По формуле (1.9) получаем 8
IМ1М | = л/(х + 4)2+(у-3)2, IM2M | = V(i — 2)2+(y — 5)2. Подставляя эти выражения в равенство |Л4]Л1| ~ lAbAll, нахсдии уравнение данного множества точек: V(*+4)r+ (у —З)2 = VU —2)2+ (У -5р . Упростим это уравнение. Возведем в квадрат обе части уравнения и раскроем скобки в подкоренных выражениях: х2 + 8х + 16 + у2 —6у + 9 = х2 —4х + 4+у2 — 10у + 25. Произведя преобразования, получим Зх+у—1=0. Это уравнение прямой линии. Пример 1.10. Составить уравнение окружности радиуса R с центром в точке С (а, Ь). ' Пусть М(х,у) —произвольная точка данной окружности. По определению окружности (как множества точек, равноудаленных от данной точки) для любой ее точки имеем |AfC|=/?. Выражая расстояние между точками М и С по формуле |Л4С| = -\/(х — а)2 + (у—Ь)2 и подставляя его в левую часть данного равенства, получим уравнение д/(х—а)2 + (у—Ь^=К, которое можно запи- сать так: (x-a)2+(y-b)2 = R2. (1.16) Уравнение (1.16) является уравнением окружности радиуса R с центром в точке С(а, б). Если точка С совпадает с началом координат, то уравнение (1.16) прини- мает вид x2-\-y2 — R2- (1.17) Замечание. Если точка W (х, у) лежит внутри круга радиуса R с центром в начале координат, то ее координаты удовлетворяют неравенству х2+у2</?2; если вне указанного круга, то неравенству х2 + у2> R2. Пример 1.11. Точка М движется так, что в любой момент времени ее расстояние до точки А (4,0) вдвое больше расстояния до точки 5(1,0). Найти уравнение траектории движения точки М. Текущие координаты точки М в прямоугольной декартовой системе координат обозначим через х, у. По условию |Л4Л| =2|Л4В|. Выразим длины отрезков МА и МВ через координаты соответствующих точек с помощью формулы (1.9): ! МА | = V(x —4)2 + г/2, |МВ| = д/(х—>)2 + у2 • Подставляя эти выражения в равенство |ЛЫ|=2|Л4В|, получаем уравнение траектории движения точки М: д/~(х — 4)2 + у2 =2 -\/(х — I)2 + У2 • Упростим это уравнение, для чего возведем в квадрат обе части и приведем подобные члены (х-4)2+у2 = 4((х- 1)2-(-у2), х2 — 8х+16 + у2 = 4(х2 — 2х+ 1+у2), 12 = 3х2+3у2, х2 + у2 = 4. Итак, траекторией движения точки М является окружность радиуса R = 2 с центром в начале координат. 1.8. Пересечение линий Координаты точек пересечения двух линий, заданных уравнениями F(x, у)—0, Ф(х, у)=0, находят из системы этих уравнений 5(х, у)=0, Ф(х,у)=0. (1.18) Число действительных решений равно числу точек пересечения. Если система (1.18) не имеет действительных решений, то данные линии не пересекаются. Пример 1.12. Найти точки пересечения линий х2 + у2 = 10, х+у —4 = 0. Из последнего уравнения выражаем у= —х + 4 и подставляем в первое 9
уравнение: х2+( —х + 4)2= 10, 2х2 — 8х 4-6 = 0, х2 — 4х 4-3 = 0, откуда х, = 1, х2 = 3. Подставим эти значения в уравнение у—— х + 4 и найдем у\ =3, уг = 1. Следовательно, получены две точки пересечения Л4(1,3), N (3, 1). Пример 1.13. Найти точки пересечения двух окружностей, заданных уравнениями (х — 5)2+ (у — 6)2 = 25, (х-|-2)2 4- (у — 6)2 = 32. Раскрывая скобки и приводя подобные члены, получаем систему уравнений х2 + у2- 10х- 121/4- 36 = 0, x2 + j/2 + 4x— 121/4-8 = 0. Вычитая второе уравнение из первого, получаем —14х-|-28 = 0, откуда х = 2. Второе уравнение системы при х = 2 сводится к квадратному относительно у. у2—121/4-20 = 0. Решив его, найдем yi = 2, 1/2=10. Следовательно, данные окружности пересекаются в точках Л4>(2, 2), Мг(2, 10). 1.9. Уравнение линии в полярных координатах Уравнение линии на плоскости в полярных координатах в общем виде можно записать так: А(р, <р) =0, где F(p, <р) —функция переменных р и ф (р, ф—полярные координаты). Если это уравнение разрешимо относительно р, то его можно представить в виде р = р(ф). Пример 1.14. Составить уравнение прямой, перпендикулярной полярной оси и отсекающей от нее отрезок, длина которого равна а. Обозначим буквой А точку пересечения данной прямой с полярной осью ОР (рис. 1.6). Пусть М (р, ф) — произвольная точка данной прямой. Из прямоуголь- ного треугольника ОАМ находим, что р cos ф = а. Полученное уравнение является искомым; ему удовлетворяют координаты любой точки данной прямой и не удовлетворяют координаты ни одной точки, не принадлежащей этой прямой. Пример 1.15. Составить уравнение окружности радиуса а, касающейся полярной оси в полюсе, центр которой расположен выше полярной оси (рис. 1.7). Пусть М (р, ф) — произвольная точка окружности, ОА — диаметр окруж- ности, равный 2а. Так как в треугольнике ОАМ угол при вершине М прямой, угол при вершине О равен л/2 —ф, то 2а cos (л/2 —ф) =р, или р = 2а sin ф. Это искомое уравнение данной окружности. 10
1.10. Параметрические уравнения линии Уравнения вида x = y = tp(t) (1.19) называют параметрическими уравнениями линии, если при изменении t в не- котором промежутке формулы (1.19) дают координаты любой точки данной линии и только таких точек. Если линия задана уравнением р = р(<р) в полярных координатах, то ее параметрические уравнения можно записать так: х = р (<р) cos <р, £/=р (<p) sin ср. (1.20) В уравнениях (1.20) роль параметра играет полярный угол <р. Пример 1.16. Составить параметрические уравнения окружности радиуса R с центром в начале координат. Пусть М (х, у) произвольная точка данной окружности, t — величина угла, образуемого отрезком ОМ и осью абсцисс, Р и Q — основания перпендикуляров, опущенных из точки М на координатные оси (рис. 1.8). Так как по определению х—ОР, y = OQ и OP=R cos /, OQ — R sin t, то x = R cos t, y = R sin t. Следовательно, параметрические уравнения данной окружности имеют вид x=R cos t, y=R sin t, где 0<i<2it. Исключив из этих уравнений параметр I (для чего возведем в квадрат оба равенства и почленно сложим), получим уравнение x2-\-y2 = R2 (см. уравнение (1-17)). Пример 1.17. Составить параметрические уравнения циклоиды. Циклои- дой называют линию, являющуюся траекторией фиксированной точки окружности радиуса R, катящейся по прямой. Указанную прямую примек за ось Ох декартовой прямоугольной системы координат (рис. 1.9). Предположим, что фиксированная точка при начальном положении окружности находилась в начале координат, а после того как окруж- ность повернулась на угол /, заняла положение М. Поскольку х=ОР = ОК — РК, y=MP~CK—CN и OR = MK = Rt, РК = = MN—R sin t, CK = R, CN = Rcost, то x = Rt — R sin t, y — R — R cos t, или x = R(t — sin t), y = R(l —cos /). (1-21) Уравнения (1.21) называются параметрическими уравнениями циклоиды. 11
1.11. Преобразования декартовых прямоугольных координат на плоскости Одна и та же точка имеет различные координаты в разных системах декартовых координат. Существует связь между координатами точки в разных системах координат. Параллельный перенос. Пусть даны две системы декартовых прямоугольных координат с общим масштабным отрезком: Оху (старая) и О,ХУ (новая), соответствующие оси которых параллельны (рис. 1.10). Положительные полуоси имеют одинаковые направления, начало новой системы находится в точке Oi(a, b), старые координаты которой х = а, у — Ь (новые координаты ее равны нулю). Относительно таких систем говорят, что одна получена из другой путем парал- лельного переноса. Старые координаты х, у точки М через ее новые координаты X, У и старые координаты а, Ь нового начала О, выражаются формулами х=Л + а, y=Y+b, (1.22) откуда Х = х — а, Y—y — b. (1.23) Поворот координатных осей. Новая система Ох'у' получена путем поворота старой на угол а вокруг точки О (рис. 1.11). Старые декартовы прямоугольные координаты х, у точки М через ее новые координаты х', у' выражаются формулами х = х' cos а — у' sin а, (1 -24) У = х' sin а + у' cos а. Чтобы выразить х', у' через х, у, необходимо разрешить систему (1.24) относительно х', у'. Можно сделать проще: считать систему Ох'у' старой, тогда переход к новой системе Оху совершается поворотом на угол (— а), поэтому в формулах (1.24) достаточно поменять местами х и х', у и у', записать ( — а) вместо а. В общем случае, когда даны две системы Оху и О'х'у' (рис. 1.12), вводя промежуточную систему О'х"у" и при- меняя последовательно формулы (1.22) и (1.24), получаем 12
x = x' cos а — у' sin а + а, (1.25) у = х' sin а + у' c°s a + b. Замечание. Система координат Оху, в которой кратчайший поворот положительной полуоси Ох до совпадения с положительной полуосью Оу совер- шается против часовой стрелки, называется правой; если указанный поворот совершается по часовой стрелке, система называется левой. Формулы (1.25) остаются прежними, если обе системы координат являются левыми. Если одна система правая, другая левая, то в формулах (1.25) изменится знак перед у', так как в случае простейшего преобразования координат разноименцрх систем формулы имеют вид х = х', у=—у'. 1.12. Прямоугольные декартовы координаты в пространстве Прямоугольная декартова система координат в пространстве опреде- ляется заданием масштаба (отрезка для измерения длин) и трех пересекающихся в одной точке взаимно перпендикулярных осей, занумерованных в определенном порядке. Точка пересечения осей называется началом координат, сами оси — коорди- натными осями, первая из них — осью абсцисс, вторая — осью ординат, третья — осью аппликат. Обозначим начало координат буквой О; координатные оси будем обозначать соответственно через Ох, Оу, Ог (рис. 1.13). Пусть М — произвольная точка пространства; проведем через нее три плоскости, перпендикулярные координатным осям, и точки пересечения с осями оиозначим соответственно через Мх, Му, Мг. Прямоугольными декартовыми координатами точки М называются числа, определяемые формулами х = ОМх, у=ОМу, г = ОМг, где ОМХ, ОМУ, ОМХ — величины направленных отрезков ОМХ, ОМ,,, ОМг соот- ветствующих координатных осей. Число х называется первой координатой или абсциссой, число у — второй координатой или ординатой, число г — третьей координатой или аппликатой точки М. Координатные плоскости Оху, Oxz, Oyz делят все точки пространства, не принадлежащие этим плоскостям, на восемь частей, называемых октантами. 13
Т а б л и ц а 1.1 Координата Октант 1 11 III IV V VI VII VIII X + — — + + + У + + — — + + — — Z + + + + — — — — Начиная с I октанта, в котором все координаты положительны, пронумеруем октанты I, II, III, IV верхнего полупространства (z> 0) против часовой стрелки (для наблюдателя со стороны положительной оси Oz). В нижнем полупро- странстве (z<0) проведем соответствующую нумерацию октантов V, VI, VII, VIII так, чтобы V находился под I, VI — под II, VII — под III, VIII — под IV. Знаки координат точек в различных октантах приведены в табл. 1.1. Очевидно, знаки координат однозначно определяют октант пространства. 1.13. Расстояние между двумя точками в пространстве Если М। (*i, yt, Z,), Мг(хг, у2, Z2) —две любые точки пространства, то расстояние между ними определяется формулой р(Л4|, М2) = V(*2 —Х|)2+ (4/2 —J/i)2 + (г2 —Zip . (1.26) В частном случае, когда точка М। совпадает с началом координат (х, =yt =zi =0), то формула (1.26) принимает вид р (О, М2) = лЙ+И+(1-27) Пример 1.18. Вычислить расстояние между точками Л4|(1, —2,2) и Л42(3, —1,4), а также расстояние от точки М2 до начала координат. По формулам (1.26) и (1.27) соответственно получаем , р (м,, М2) = V (з — 1)2 + (— 1 — (’" = з, р(О, Мг) = л/32+ (- 1) 2 + 42 = л/26 . Замечание. Формулы (1.26) и (1.27) упрощаются, когда точки М, и Л12 лежат в плоскости, параллельной одной из координатных плоскостей, или в самой этой плоскости. В этом случае получаем формулы (1.9) и (1.10). 1.14. Цилиндрические и сферические координаты В плоскости П фиксируем точку О и исходящий из нее луч ОР (рис. 1.14). Через точку О проведем прямую, перпендикулярную плоскости II, и укажем на ней положительное направление; полученную ось обозначим Oz. Выберем масштаб для измерения длин. Пусть М — произвольная точка про- странства, N — ее проекция на плоскость П, Mz — проекция на ось Oz. Обозначим через р и <р полярные координаты точки N в плоскости II относительно полюса О и полярной оси ОР. Цилиндрическими координатами точки М называются числа р, <р, z, где р, <р — полярные координаты точки V(p^0, 0<<р<2л), z=OM, — величина направленного отрезка ОМг оси Oz. Запись Л4(р, q., z) обозначает, что точка М имеет цилиндрические координаты р, <р, г. Наименование «цилиндри- ческие координаты» объясняется тем, что координатная поверхность p--=const (т. е. множество точек, имеющих одну и ту же первую координату р) является цилиндром (на рис. 1.14 он изображен штрихами). 14
Если выбрать систему прямоугольных декартовых координат так, как пока- зано на рис. 1.14, то декартовы координаты х, у, z точки М будут связаны с ее цилиндрическими координатами р, <р, г формулами x = pcosq>, у — р sin ф, z=z. (1.28) Сферические координаты вводят следующим образом. Выберем масштаб для измерения длин отрезков, фиксируем плоскость II с точкой О и полуосью Ох, ось Oz, перпендикулярную плоскости 11 (рис. 1.15). Пусть М—произвольная точка пространства (отличная от О), N—проекция ее на плоскость II, г — расстояние точки М до начала координат, 0 — угол, образуемый отрезком ОМ с осью Ог, ф—угол, на который нужно повернуть ось Ох против часовой стрелки (если смотреть со стороны положительного направления оси Oz), чтобы она совпала с лучом ОМ; 0 называется широтой, <р — долготой. Сферическими координатами точки М называются три числа г, 0, ф, опреде- ленные выше. Если точка М имеет сферические координаты г, 0, ф, то пишут М(г, 0, <(>). Наименование «сферические координаты» связано с тем, что координатная поверхность г = const (т. е. множество точек, имеющих одну и ту же коор- динату г) является сферой (на рис. 1.15 одна из таких сфер изображена штрихами); фиксировав другое значение г, получим другую сферу. Для того чтобы соответствие между точками пространства и тройками сферических координат г, 0, ф было взаимно однозначным, обычно считают, что г, 0, ф изменяются в следующих границах: 0^г< + °°. О^О^л, 0^ф<2л. Если выбрать оси прямоугольной декартовой системы координат так, как указано на рис. 1.15, то декартовы координаты х, у, г точки М связаны с ее сферическими координатами г, 0, ф формулами х = гзт0сО5ф, y = r sin 0 sin ф, z = rcosO. (1.29)
Глава 2 ЛИНИИ НА плоскости Алгебраической линией (кривой) n-го порядка называют линию, определяемую алгебраическим уравнением п-й степени относительно декартовых координат. Линии первого порядка определяются уравнением Ax4-Bt/ + C = 0 (A2 + S2#=0), а линии второго порядка — уравнением Ах2А~Вху + Cy2-\-Dx + + Ey+F = 0 (A2 + B2 + C2^0). Линии первого порядка — прямые. К линиям второго порядка относятся окружность, эллипс, гипербола, парабола. 2.1. Прямая на плоскости Прямую линию на плоскости относительно системы декартовых прямо- угольных координат можно задать различными способами. Прямая однозначно определяется углом, образуемым ею с осью Ох, и величиной направленного отрезка, отсекаемого на осн Оу, координатами двух точек и т. п. Различные виды уравнения прямой на плоскости. Прямая, параллельная оси Оу прямоугольной декартовой системы координат (рис. 2.1), пересекающая ось Ох в точке А (а, 0), имеет уравнение х=а. (2.1) Угловым коэффициентом прямой называют тангенс угла а наклона ее к по- ложительной полуоси Ох прямоугольной декартовой системы координат A: = tga (О^аСл). Угловой коэффициент прямой через координаты ее двух различных точек Mi (х।, t/i), Л1г(х2, yi) определяется формулой Рис. 2.1 16
(2.2)’ x2 —Xi Уравнение прямой с угловым коэффициентом имеет вид y = kx-\-b, (2.3) где k — угловой коэффициент, Ь = ОВ — величина направленного отрезка ОВ, отсекаемого на оси Оу (рис. 2.2). Уравнение прямой, имеющей угловой коэффициент k и проходящей через данную точку Л4о(х», уо), записывается так: У — yo = k(x — х0). (2.4) Уравнение прямой, проходящей через две данные точки М। (xi, yi), Mi(x2, Уч): У — У> x — xt ----— = -----— (x2#=xi, У2 + У1). (2.5) Уч — У1 Х2— Х1 Параметрические уравнения прямой, проходящей через эти точки: Х = Х1 + (х2 — Xt)t, у = У\ + (Уч — yi)t, (2.6) где t принимает все действительные значения. Уравнением прямой в отрезках называют уравнение х/а + у/Ь=\, (2.7) где а = ОА, Ь = ОВ — величины направленных отрезков, отсекаемых соот- ветственно на оси Ох и оси Оу. Общим уравнением прямой называют уравнение Ах + Ву-\-С = О, (2.8) в котором А и В одновременно в нуль не обращаются, т. е. Л2 + В2+=0. Пример 2.1. Составить параметрические уравнения сторон треугольника, вершины которого находятся в точках А (2, 3), В (4, 7), С (6, 9). Составим сначала уравнения прямых, на которых лежат стороны АВ, ВС и АС соответственно. Используя уравнение (2.5), получаем у — 3 х — 2 у —3 х — 2 у —3 х —2 7-3 - 4-2 ’ —4 2 ’ ~2 1 ; у — 3 х— 2 у — 3 х—2 у — 3 х — 2 9 — 3 = 6 — 2 ’ ~6 = 4 ’ 3 = ~2 ' Обозначим буквой t равные отношения, получим параметрические уравнения этих прямых: х = 2 + /, у = 3 + 2/ (АВ); х = 4 + /, у = 7 + /(ВС); х = 2 + 2/, у = 3 + 3/ (ЛС). Введя ограничения на изменение параметра t, получим уравнения соот- ветствующих сторон треугольника АВ, ВС, AC: x = 2-\-t, у = 3 + 2/(0^/^ 1); х = 4 + /, у = 7-Н (0</< 1); х = 2 + 2/, у = 3 + 3/ (0<1). Пример 2.2. Найти величины отрезков, отсекаемых на осях координат прямой, заданной уравнением 7х — Зу — 21=0. Разделив это уравнение почленно на 21, получим х/3 —у/7—1=0, или х/3 + у/(-7) = 1. Сравнивая полученное уравнение с уравнением (2.7), заключаем, что а = 3, Ь=—7. 17
Угол между двумя прямыми. Условия параллельности и перпендикуляр- ности двух прямых. Тангенс угла между двумя прямыми (рис. 2.3) y — kixA-bi, y — k2x-{-b2 (2.9) вычисляется по формуле k2~~k\ tg4,= -r+MT- (2.Ю) Необходимое и достаточное условие параллельности прямых, заданных урав- нениями вида (2.9), выражается равенством ki = k2, а условие их перпенди- кулярности — равенством Й1=- —. к2 Если прямые заданы общими уравнениями A ix + Bit/ + Ci =0, Д 2х + В21/ + С2 = 0, то тангенс угла между ними определяется формулой , _ AiB2 — Д2В, g4>~ Д,Д2 + В,В2 ' (2.11) (2.12) (2.13) (214) Необходимое и достаточное условие параллельности прямых, заданных уравнениями (2.12) и (2.13), выражается равенством И |/Д2 = В|/Я2, (2.15) ИЛИ Д 1 = 442, Bi = lB?, (2.16) а условие их перпендикулярности — равенством — А\/В। = В2/А2, или Д|Д2 + В|В2 = 0. (2.17) Отметим, что прямые Дх + Ву + С = 0, Вх — Ay-j-C = O перпендикулярны в силу условия (2.17). Пример 2.3. Найти угол между прямыми, заданными уравнениями 5х + 3(/+15 = 0, х + 41/ —7 = 0. Применяем формулу (2.14). Так как в данном случае Д,=5. Bi=3, Д2=1, В2 = 4, то 5-4-1-3 . 5-i+3-4- =1’ Ф = 45' tg <р= Замечание. При другой нумерации прямых (Д|=1, Bi = 4, Д2 = 5, В2 = 3) полу- чаем tg <р' = — !,<₽' = 135°. Очевидно, (р + <р' = = 180°. Пример 2.4. Составить уравнение пря- мой, проходящей через точку М(4, —5) и па- раллельной прямой Зх + 4у+12 = 0. Искомое уравнение имеет вид Зх + 4у + + С = 0, где С пока не определено. Вид урав- нения следует из условия (2.16) при (=1 (считаем соответствующие коэффициенты рав- ными). Чтобы найти значение С, необходимо подставить координаты точки М в искомое 18
уравнение (точка М лежит на прямой, поэтому ее координаты должны удовлет- ворять уравнению этой прямой). Подставляя координаты х=4, у = — 5 в уравнение Зх + 4у+С = 0, получаем 3-4-|-4-( — 5) + С = 0, откуда С = 8. Таким образом, уравнение прямой имеет вид Зх + 4у + 8 = 0. Пример 2.5. Составить уравнение прямой, проходящей через точку Af( —3, 2) и перпендикулярной прямой 4х + 5у —7 = 0. Искомое уравнение имеет вид 5х — 4у+С = 0. Действительно, для прямых выполнено условие (2.17): 4-5 + 5-(—4) =0. Точка М( — 3, 2) лежит на прямой 5х— 4у + С = 0, поэтому ее координаты должны удовлетворять этому уравнению: 5(—3) —4-2 + С = 0. Отсюда находим, что С = 23. Итак, уравнение прямой принимает вид 5х — 4у + 23 = 0. Пример 2.6. Вершины треугольника находятся в точках Л(3,4), В( — 2, 1), С(—3, —5). Составить уравнение прямой, на которой лежит высота, опущенная из вершины В на сторону АС. Найдем сначала угловой коэффициент прямой, проходящей через точки Л и С. Считая точку Л первой, точку С второй, т. е. полагая xi=3, у, = 4, х2=—3, у2= — 5, по формуле (2.2) получаем А, = (—5 —4)/( — 3 —3) =3/2. Прямая, на которой лежит высота, опущенная из точки В на сторону АС, будет перпендикулярна прямой, проходящей через точки Л и С. Угловой коэф- фициент этой прямой обозначим через /г2. Используя условие перпендикулярности двух прямых, заданное формулой (2.11), находим fe2= —1/fei, k2= — 2/3. Составим уравнение прямой, проходящей через точку В( —2, 1) и имеющей заданный угловой коэффициент k2. Подставляя значения х0= —2, у0= 1, k = —2/3 в уравнение (2.4), получаем у — 1 = (— 2/3) (х— (— 2)), 3(у—1)+2(х + 2) =0, 2х + 31/+1=0. Расстояние от точки до прямой. Уравнения биссектрис углов между двумя прямыми. Расстояние от точки Л1о(хо, уо) до прямой Лх + Ву + С = 0 вычисляют по формуле j I Лхо + Bi/о + С| Уравнения биссектрис углов между прямыми Л|Х + В11/ + С| =0, А2х + В2у + + С2=0 имеют вид Л|х + В,1/ + С|__A2x-j-B2yA~C2 фХ+в2, -л/а22+в22 Пример 2.7. Найти расстояние от точки УИо(—7, 4) до прямой, заданной уравнением 4х — Зу—15 = 0. Воспользуемся формулой (2.18). Так как в данном случае х0=—7, у0 = 4, Л=4, В= — 3, С= —15, то = |4.(-7)-3-4-15| _ л/4Ч(-3)2 Пример 2.8. Дан треугольнике вершинами Р(2, — 1), Q(6, —4),/?(10, 3). Найти длину высоты, опущенной из точки R. Задача сводится к вычислению расстояния от точки R до прямой PQ. Запишем уравнение этой прямой. На основании уравнения (2.5) имеем у-\- 1 х—2 ~++ । = , или Зх + 4у —2 = 0. Расстояние точки R (10,3) до этой пря- мой вычислим по формуле (2.18) 13-10 + 4-3-21 . U — -----_____~— = О. Следовательно, длина высоты равна 8. Замечание. Эту задачу можно решить и другими способами. Например, длину искомой высоты можно вычислить, зная площадь треугольника PQR 19
и длину основания PQ. Эта же длина равна расстоянию между двумя точками R и М (М — основание высоты, опущенной из точки R на PQ). В свою очередь координаты точки М находятся в результате решения системы уравнений стороны PQ и высоты RM. Пример 2.9. Составить уравнения биссектрис углов, образованных пря- мыми Зх— 4i/— 7 = 0, 8x + 6i/—1=0. В соответствии с формулой (2.19) получаем Зх —41/ —7 _ 8x + 6i/—1 л/32+(-4)2 “ * ' Преобразуя эти уравнения, находим _± . 2№_4„_7)_±№+6„_1ь Отсюда получаем уравнения биссектрис 2х+14у+13 = 0, 14х — 2у —15 = 0. Задачи, относящиеся к прямым. Рассмотрим примеры решения задач, в условиях которых даны уравнения прямых. Пример 2.10. Даны уравнения двух сторон параллелограмма x+2i/ + 2 = 0 и х А-у— 4 = 0 и уравнение одной из диагоналей х — 2 = 0. Найти координаты вершин параллелограмма. Решая систему уравнений хА-2у + 2 = 0, х-\-у — 4 = 0, находим точку ,4(10, —6) —одну из вершин параллелограмма. Две другие вершины найдем как точки пересечения данной диагонали со сторонами, т. е. определим их координаты из систем уравнений х + 2// + 2 = 0, х—2 = 0; хА-у — 4 = 0, х — 2 = 0. Это будут точки В(2, 2) и 0(2, —2). Середина диагонали BD находится в точке S(2, 0). Так как диагонали параллелограмма в точке пересечения делятся пополам, то четвертая вершина С(х, у) может быть найдена как конец отрезка АС по известному концу А и середине S: (х+10)/2 = 2, (у+ ( — 6) )/2 = 0. Отсюда получаем х=—6, у = 6, т. е. точку С( — 6, 6) —четвертую вершину параллелограмма ABCD. Пример 2.11. Составить уравнение линии, расстояние каждой точки которой до точки А (2, 0) относится к ее расстоянию до прямой 5х + 8 = 0 как 5:4. Пусть М(х, у) —произвольная точка данной линии, N—основание перпен- дикуляра, проведенного через точку М к прямой 5х + 8 = 0, или х=—8/5. Расстояния точки М до точки 4 и до прямой х= —8/5 определяются соответ- ственно формулами |Л14| =V(x — 2)2 + //2, |Af/V| = |х—( —8/5) | = |х + 8/5| (по- следнее равенство следует также из формулы (2.18)). По условию задачи уЦх — 2)2 + у2: |х + 8/5| =5:4, откуда 4у(х — 2)2 + i/2 = 5|x + 8/5|. Преобразуем это уравнение: 16(х2 —4х + 4 + у2) =25(х2+ (16/5)х + 64/25), 16х2 — 64х + 64+ 16i/2 = 25x2 + 80x + 64, 9х2 — 1 бу2 + 144х = 0. Выделим полные квадраты в левой части полученного уравнения: 9(x2+16x + 64) — 16i/2 —9-64 = 0, 9 (х + 8)2 - 16у2 = 9-64. Последнее уравнение примет вид 9Х2—16К2 = 9-64, или +/64—+/36 = 1, если перейти к новым координатам Х=х + 8, Y=y. Полученное уравнение определяет гиперболу с полуосями а = 8, 6=6 (см. уравнение (2.25)). 2.2. Окружность Каноническим уравнением окружности радиуса R с центром в точке С(а,Ь) называют уравнение (х-а)2+(г/-6)2 = Я2. (2.20) 20
Когда центр окружности находится в начале координат, уравнение прини- мает ВИД X2 + j/2=/?2. Если уравнение второй степени, не содержащее члена с произведением координат и имеющее равные коэффициенты при х2 и у2, т. е. уравнение Ax2 + Ay2 + Dx+Ey + f = 0, определяет некоторую линию, то эта линия — окружность. Пример 2.12. Найти координаты центра и радиус окружности, опре- деляемой уравнением 4х2 + 41/2 —8х+12у —3 = 0. Разделив обе части уравнения на 4 и выделив полные квадраты, получим Q Q Q Q (х2_2х+1)+ ^ + 2.^-у+Л. -1--------------------— =о, или (х—1 )2+(</ + 3/2)2 = 4. Сравнивая полученное уравнение с уравнением (2.20), заключаем, что а=1, 6=—3/2, Р = 2. Пример 2.13. Какое множество точек плоскости определяет уравнение х2 + у2 — 4х + 1 Оу + 29 = 0? Так как это уравнение сводится к уравнению (х —2)2+(у + 5)2 = 0, кото- рому удовлетворяют лишь координаты х = 2, у——5, то оно определяет един- ственную точку С(2, —5). 2.3. Эллипс Эллипсом называют геометрическое место точек плоскости, для каждой из которых сумма расстояний до двух данных точек (фокусов) той же плоскости есть постоянная величина. Каноническое уравнение эллипса x2/a2+f/2/62= 1, (2.21) где а = ОА— большая, Ь = ОВ—малая полуоси (рис. 2.4). Координаты фокусов эллипса, определяемого уравнением (2.21): Х| = — с, У\ =0; х2 = с, 4/2 = 0, т. е. F, ( — с, 0), А2(с, 0), где с = Л/а2-Л2 (2.22) Эксцентриситетом эллипса е называют отношение фокусного расстояния 2с к длине большой оси 2a: е = с/а, е =-^1 — (Ь/а)2. (2.23) Фокальными радиусами точки М эллипса называются отрезки прямых, соединяющих эту точку с фокусами F'\ и F?. Их длины и и г2 можно вычислить по формулам Г|=а + ех, r2=a —ех. Директрисами эллипса (2.21) называют прямые, определяемые уравнениями х= —а/е, х = а/е. Пример 2.14. Какую линию определяет уравнение Зх2+4у2=12? Разделим это уравнение почленно на 12: х2/4 +1/2/3 = 1. Сравнивая полученное урав- нение с уравнением (2.21), заключаем, что оно определяет эллипс с полуосями a = 2, 6= л/3. Найдем фокусы этого эллипса. Из формулы (2.22) следует, что с2 = а2 — Ь2; поскольку в данном случае а2 = 4, 62 = 3, с2 = 4 —3=1, с=1. Следовательно, фокусы эллипса нахо- дятся в точках Л ( — 1,0), /^(1,0). (2.24) 21
Пример 2.15. В прямоугольной декартовой системе координат построить линию, определяемую уравнением у=(—2/3)д/9 —х2. Преобразуем это уравнение, возводя в квадрат обе его части: f/2=^- (9-х2), 9-х2 х2 , у2 4 Последнее уравнение определяет эллипс с полуосями а —3. Ь = 2. Если решить это уравнение относительно у, получим о _____ 9 _____ У=— V9 —X2, у =----g-V9 —X2. В условии задачи дано второе из этих уравнений. Оно определяет не весь эллипс, а только ту его часть, для точек которой у^О, т. е. половину эллипса, расположенную ниже оси Ох. Пример 2.16. Записать каноническое уравнение эллипса, проходящего через точки Л4(3, 2), ЛЦЗд/3/2, д/2). Каноническое уравнение эллипса имеет вид х2/а2 + </2/62= I. Так как точки М и N лежат на эллипсе, то их координаты удовлетворяют уравнению эллипса: З2 22 (Зл/372)2 (у/2)2 = а2 Ь2 ' а2 Ь2 Решая полученную систему уравнений, находим, что а2=18, 52 = 8. Таким образом, получено каноническое уравнение эллипса х2/18 + </2/8= 1. 2.4. Гипербола Гиперболой называется геометрическое место точек плоскости, для каждой из которых модуль разности расстояний до двух данных точек (фокусов) той же плоскости есть величина постоянная. Каноническое уравнение гиперболы х2/а2-у2/Ь2=\, (2.25) где а = ОА — действительная, Ь = ОВ — мнимая полуоси (рис. 2.5). Координаты фокусов гиперболы (2.25): xi = —с, t/,=0, х2 = с, </2 = 0, т. е. Ft(—c, 0), F2(c, 0), где (2.26) Эксцентриситетом гиперболы (2.25) назы- вается отношение фокусного расстояния 2с к длине действительной оси 2а: г=с!а. (2.27) Асимптотами гиперболы называют прямые, определяемые уравнениями 6 Ь У~~х' У=~—х. (2.28) Директрисами гиперболы называются пря- мые, определяемые уравнениями х=—а/е, х = а/е. (2.29) 22
Гипербола с равными полуосями (Ь — а) называется равносторонней, ее каноническое уравнение имеет вид х2 —г/2 = а2. (2.30) Фокальные радиусы точки правой ветви гиперболы вычисляются по формулам Г|=ех4-о, г2 — гх — а; (2.31) фокальные радиусы точки левой ветви — по формулам fi= — ех — а, г2=—ех + а. (2.32) Пример 2.17. Какую линию определяет уравнение 9х2 — 4</2 = 36? Разделив обе части уравнения на 36, получим х2/4—у2/9=1. Сравнивая это уравнение с уравнением (2.25), заключаем, что оно определяет гиперболу с действительной полуосью а = 2 и мнимой полуосью 6 = 3. Пример 2.18. Найти полуоси, координаты фокусов и эксцентриситет гиперболы, заданной уравнением 5х2 —4у2 = 20. Вычислить длины фокальных радиусов точки Л4(— 4, л'15). Разделив обе части уравнения на 20, получим х2/4— z/2/5=l. Сравнивая это уравнение с уравнением (2.25), заключаем, что а2 —4, Ь2 = 5, т. е. а = 2, 6=\'5. Из формулы (2.26) следует, что c2 — a2-\-b2, с2 = 9, с = 3, Fj( — 3, 0), F2(3, 0). По формуле (2.27) находим е = с/а = 3/2. Поскольку точка М лежит на левой ветви гиперболы, то при вычислении г, и г2 необходимо пользоваться формулами (2.32) г, = (— 3/2) ( —4) —2 = 4, г2= (— 3/2) (—4)+2 = 8. Отметим, что г2 — г, =8 —4 = 4 = 2а. Пример 2.19. Записать уравнения асимптот и директрис гиперболы 4х2 —9</2 = 36. Приводя уравнение гиперболы к каноническому виду (2.25), заключаем, что а2 = 9, 62 = 4, т. е. а = 3, 6 = 2. В соответствии с (2.28) записываем уравнения асимптот i/=(2/3)x, у= — (2/3)х. По формуле (2.26) находим с = -\/9 + 4 = = уТЗ, а по формуле (2.27) —эксцентриситет е=\/Тз/3. Согласно (2.29), по- лучаем уравнения директрис х=—9/у13, х = 9/-у!3 2.5. Парабола Параболой называется геометрическое место точек плоскости, равно- удаленных от данной точки (фокуса) и данной прямой (директрисы), лежащих в 1 ой же плоскости. Уравнение параболы, симметричной относительно оси Ох и проходящей через начало координат (рис. 2.6), имеет вид у2 = 2рх, (2.33) уравнение ее директрисы х=—р/2. (2.34) Парабола, определяемая уравнением (2.33), имеет фокус F(p/2, 0), фо- кальный радиус ее точки Л4(х, у) вычисляется по формуле г = х + р/2. (2.35) Парабола, симметричная относительно оси Оу и проходящая через начало координат (рис. 2.7), определяется уравнением x2 = 2qy. (2.36) Фокус этой параболы находится в точке F(0, q/2), уравнение ее директрисы имеет вид у=— q/2. Фокальный радиус ее точки Л4(х, у) выражается формулой r = t/ + <7/2. 23
Замечание. Каждое из уравнений у2=—2рх, x2=—2qy определяет параболу. Пример 2.20. Найт» координаты фокуса и уравнение директрисы пара- болы у2 = 8х. Вычислить расстояние точки М(2, 4) до фокуса. Сравнивая уравнение у2 = 8х с уравнением (2.33), находим, что 2р = 8, откуда р = 4, р/2 = 2. В соответствии с формулой (2.34) получаем уравнение х= — 2 директрисы параболы, фокус параболы находится в точке F(2, 0). Точка М(2, 4) лежит на параболе, так как ее координаты удовлетворяют уравнению у2 = 8х. По формуле (2.35) находим фокальный радиус точки М:г = 2 + 2 = 4. Пример 2.21. Найти координаты фокуса и уравнение директрисы пара- болы х2=4у. Вычислить расстояние точки М(6, 9) до фокуса. Сравнивая уравнение х2 = 4</ с уравнением (2.36), получаем 2</ = 4, откуда q = 2, <7/2=1. Следовательно, фокус параболы находится в точке F(0, 1), уравнение директрисы имеет вид у= — 1, а фокальный радиус точки Л4:г = = 9+1 = 10. Пример 2.22. Составить уравнение параболы, симметричной относительно оси Ох и проходящей через точки Л4(5, 4), N( 15, —6). Так как парабола симметрична относительно оси Ох, то в ее уравнение у входит только во второй степени. Уравнение этой параболы имеет вид у2 = 2рх-\-с, где р и с — некоторые постоянные. Найдем рис, использовав условия задачи. Поскольку точки М я N лежат на параболе, то их координаты должны удовлетворять ее уравнению 42 = 2р-5 + с, (—6)2 = 2р-15 + с. Из уравнений 16= Юр+ с, 36 = 30р + с находим р — 1, с = 6. Таким образом, данная парабола определяется уравнением </2 = 2% + 6. 2.6. Полярное уравнение эллипса, гиперболы, параболы Пусть у — дуга эллипса, гиперболы или параболы (рис. 2.8). Проведем через фокус F прямую, перпендикулярную директрисе Л, точку их пересечения обозначим через А, проекцию точки Л4 на эту прямую — буквой N. В точке F проведем перпендикуляр к прямой AN (оси линии у), обозначим буквой Р точку ее пересечения с дугой у, а длину отрезка FP—буквой р, т. е. \FP\=p, и назовем ее фокальным параметром линии у. Пусть р и <р — полярные координаты точки М в системе координат с полюсом в точке F и полярной осью FN, тогда 24
(2.37) Уравнение (2.37) называется полярным уравнением эллипса, гиперболы, параболы (это уравнение определяет одну из двух ветвей гиперболы). Отметим, что для параболы фокальный параметр совпадает с параметром р, входящим в уравнение (2.33), для эллипса и гипер- болы, заданных соответственно уравнениями (2.21) и (2.25), он выражается формулой Q р = Ь2/а. (2.38) Пример 2.23. Какую линию определяет уравнение 8 16 р= ——з — в полярных координатах? Разделим на 5 числитель и знаменатель правой части уравнения: р=_______>6/5______ -д 1 — (3/5) cos <р Сравнивая полученное уравнение с уравнением (2.37) и учитывая формулу (2.38), получаем р = й2/а=16/5, е = с/а = 3/5, откуда а = 5, Ь=4, с = 3. Поскольку 0< <е< 1, то данное уравнение определяет эллипс с полу- осями а = 5, 5 = 4. д Пример 2.24. Какую линию определяет уравнение 9 р= -j'L.'s’cos <р В ПОЛЯРНЫХ координатах.' Рис. 2.8 Разделив числитель и знаменатель правой части на 4, приведем это уравне- ние к виду (2.37): _________9/4 4 Р 1 — (5/4) cos <р Следовательно, р = Ь2/а = 9/4, е — с/а = 5/4> 1. Данное уравнение определяет гиперболу с полуосями а —4, Ь = 3. 2.7. Некоторые другие виды уравнений линий второго порядка Уравнение у = ах2-\-Ьх-]-с приводится к BHfly%2=2?y и определяет параболу с осью, параллельной оси Oi Y. Уравнение х = Ay2ByС приводится к виду Y2 = 2pX и определяет пара- болу с осью, параллельной оси OiX. Равносторонняя гипербола имеет уравнение (2.30), а в системе координат, осями которой являются ее асимптоты, определяется уравнением ХУ=С(С=#0). (2.39) Уравнение 5= (ad — bc^=0,c^=0) приводится к виду (2.39) и определяет гиперболу. Параметрические уравнения эллипса х2/а2-\-у2/Ь2=1 имеют вид x = acos t, y = b sin t. Параметрические уравнения гиперболы х2/а2 — y2/b2 =1: x = a(t+(\/4t)), y = b(t—(\/4t)), 25
а также x = a ch t, y = b sh /, где ch t, sh t — гиперболические функции аргумента t (см. п. 13.11). Параметрические уравнения параболы х2=2qy можно записать так: x = t, y = t2/2q. Уравнение у2 = 2рх+(е2—1)х2 (2.40) определяет эллипс при 0<е<1, гиперболу при е> 1, параболу при е = 1. В случае 0<е<1 это уравнение принимает вид y2 = 2px — qx2, где p — b2/a, q = b2/a2, а в случае е> 1 y2 = 2px+qx2, где р и q имеют те же выражения. Уравнение (2.40) называют уравнением эллипса, гиперболы, параболы, отнесенных к вершине; начало декартовой прямоугольной системы координат находится в вершине линии — точке ее пересечения с координатной осью (рис. 2.9). Эллипс, гиперболу, параболу называют коническими сечениями. В сечении конуса плоскостью, не проходящей через его вершину (рис. 2.10), получаются эти линии, а именно эллипс (сечение одной полости конуса плоскостью, не перпен- дикулярной его оси и не параллельной образующей), парабола (сечение плос- костью, параллельной его образующей), гипербола (сечение плоскостью обеих полостей конуса). Пример 2.25. Построить линию, определяемую уравнением Зу=х2 — — 6х+15. Преобразуя это уравнение, получаем у= (1/3) ((х2 — 6х-|-9) +6), у — = (1/3)(х-3)2 + 2, I/ —2= (1/3) (х —З)2. Перейдем к новым координатам по формулам Х = х — 3, Y=у — 2. В новых координатах уравнение принимает вид У=(1/3)Х2, или Х2 = ЗУ; оно определяет параболу. Строим системы координат Оху и О|ХУ, последнюю с началом в точке Oi (3, 2), и саму параболу — в новой системе координат по ее каноническому уравнению (рис. 2.11). 2x4-12 Пример 2.26. Построить линию, определяемую уравнением 1/=------—т— . 26
Преобразуем данное уравнение: у(х + 3) — 2х — 12 = 0, у(х-]-3) — 2х —6 —6= =0, i/(x4-3)-2(x+3)-6=0, (х+3) (у-2) =6. Переходя к новым координатам по формулам Х=х-|-3, Y = y — 2, получаем уравнение XY = 6, определяющее гиперболу. Строим линию в системе координат О|ХУ (рис. 2.12), начало которой находится в точке О,( —3, 2). Пример 2.27. Какую линию определяет уравнение хуА-х — 2у — 14 = 0? Преобразуем это уравнение: (ху А~х) — (2у А~2)— 12 = 0, x(i/4-l)—2(у + + 1) - 12 = 0, (у+ 1) (х-2) - 12 = 0, (х —2) (</+!) = 12. Переходя к новым координатам по формулам Х = х — 2, Y = yA~ 1, получаем уравнение XY= 12, которое определяет гиперболу. 2.8. Упрощение уравнения второй степени, не содержащего члена с произведением координат Рассмотрим уравнение второй степени относительно прямоугольных декартовых координат, не содержащее члена с произведением ху: Ax2 + Cy2+Dx + Ey + F = 0. (2.41) Перейдем к новой системе координат О,ХУ, полученной из исходной путем параллельного переноса (см. рис. 1.10) начала в точку О, (а, Ь), при котором старые координаты (х, у) точки М выражаются через ее новые координаты (X, У) формулами (1.22). Уравнение (2.41) путем выделения полных квадратов может быть приве- дено к одному из следующих канонических уравнений: X2/a2+Y2/b2=\, (2.42) Х2/а2+У2/&2 = 0, (2.43) X2/a2+Y2/b2=-\ (2.44) в случае АС>0 (линии эллиптического типа); X2/d2 — Y2/b2 =1, —X2/a2+Y2/b2=l, (2.45) X2/a2—Y2/b2 = 0 (2.46) в случае АС<0 (линии гиперболического типа); У2 = 2рХ, (2.47) У2 = &2, (2.48) 27
r2=o, У2=—ft2 (2.49) (2.50) в случае 4C = 0, Л = 0 (линии параболического типа). Если С = 0, Л=#0, то уравнение (2.41) приводится к виду X2 = 2qY, если Е=/=0, и к одному из уравнений Х2 = а2, Х2=—а2. Х2 = 0, когда Е = 0. Уравнение (2.42) определяет эллипс, уравнения (2.45) — гиперболы (с действительной осью О\Х или Oi У), уравнение (2.47) —параболу (с осью 0,%), уравнения (2.46) — пару пересекающихся прямых ЬХ — аУ = 0, й% + аУ = 0, урав- нение (2.48) —пару параллельных прямых Y — b, Y=—b, уравнение (2.49) — пару совпавших прямых У = 0, У=0, уравнению (2.43) удовлетворяют коорди- наты единственной точки Х = 0, У = 0, уравнениям (2.44) и (2.50) не удовлетво- ряют координаты ни одной точки. Пример 2.28. Построить линию, определяемую уравнением 9х2—16t/2 — — 36х —32у — 124 = 0. Преобразуем это уравнение: 9(х2 —4% + 4) — 16(у2 + 2у + 1) —36+ 16— 124 = = 0, 9(х — 2)2—16(r/+I)2—144 = 0, (х —2)2/16—(|/+1)2/9=1. Перейдя к новым координатам по формулам Х = х — 2, У = у+1, получим уравнение №/16—У2/9=1, определяющее гиперболу с полуосями а = 4, Ь = 3 (рис. 2.13). Центр гиперболы находится в точке, для которой Х = 0, У = 0, откуда х = 2, у= — \. Получена точка 0,(2, —1), в которой находится начало новой системы координат. Пример 2.29. Построить линию, определяемую уравнением 9х2 + 161/2 + + 36х — 64у— 44=0. Выделяя полные квадраты в левой части уравнения, получаем 9(х2 + 4х + 4) + 16 (г/2 — 4у + 4) — 36 — 64 — 44 = 0, 9 (х + 2)2+ 16(1/ — 2)2 = 144, (х + 2)2/16+ (у-2)2/9= 1. Переходя к новым координатам по формулам Х = % + 2, Y = y — 2, последнему уравнению придадим вид №/16+У2/9=1. Это уравнение определяет эллипс с полуосями а = 4, Ь=3 (рис. 2.14). Центр эллипса находится в точке, для которой Х = 0, У = 0, или % +2 = 0, у — 2 = 0, откуда х= — 2, у = 2, т. е. в точке О, (— 2, 2). 28
2.9. Упрощение общего уравнения второй степени Общее уравнение второй степени относительно прямоугольных декар- товых координат х и у Ax'2 + 2Bxy-{-Cy'2 + Dx + Ey-\-F = Q (2.51) при повороте координатных осей на угол а, для которого ctg 2а= (Л —С)/2В, (2.52) преобразуется в уравнение Л|Х,2 + С\у’2-\~ D\x'Е\у'F=0, являющееся уравнением вида (2.41). Формулы преобразования координат имеют вид х = х’ cos а — у' sin a, у = х' sin а+у' cos a, (2.53) причем sina = ±V(l— cos2a)/2. cos a = ±VU + cos 2a)/2, (2.54) cos 2a =-----С1Ц 2a , (2.55) +ctg22a где ctg 2a определяется формулой (2.52). Уравнение (2.51) определяет или пустое множество, или точку, или пару прямых (пересекающихся, параллельных, совпавших), или одну из линий (окружность, эллипс, гиперболу, параболу). Пару прямых называют распадающей- ся линией второго порядка. Пример 2.30. Построить линию, определяемую уравнением 5х2 —6xi/ + + 5у2 — 24х + 8у + 24 = 0. Это частный случай уравнения (2.51), для которого Л=5, 2В=—6, С = 5, D=—24, Е — 8, F = 24. По формуле (2.52) имеем ctg2a=(5 — 5)/( — 6) =0. Возьмем 2а = л/2, т. е. а = л/4, тогда sin a = cos а=-\/2/2. Формулы (2.53) принимают вид х= (д/2/2) (х' —/), у=Ь/2/2)(х' + у'). (I) Подставляя эти выражения в исходное уравнение, получаем (5/2)(х'-у')2-(&/2)(х'-у’)(х' + у') + (5/2)(х'+у')2- - 12^2 (х' - у') + 4 /2’ (х' + у') + 24 = 0, (5/2) (х'2-2х’у'+у’2)— 3(х,2 — у'2) + (5/2) (х'2 + 2х'у'+ у'2) - -\2-^2(х'-у') +4<2(х'+у') +24 = 0, 2х'2 + 8у'2 - 8д/2х' + 16 72/ + 24 = 0, х'2 + 4/2 - 4 д/2х' + 8^2у' +12 = 0. Преобразуем левую часть последнего уравнения, выделив в ней полные квадраты: (х'2-4 -/2х' + 8) +4 (/2 + 2 ^2у' + 2) — 8 — 8+ 12 = 0, (х'~2д/2)2 + + 4(/ + 72)2 = 4. Переходя к новым координатам по формулам X — x' — 2^[2, Y = y' + ^2, (11) последнее уравнение записываем так: № + 4У2 = 4, или №/4+ У2/1 = 1. (Ш) 29
Каноническое уравнение (III) определяет эллипс с полуосями а = 2, Ь=1. Построим этот эллипс относительно новой системы декартовых прямоугольных координат O\XY. Угол наклона оси OtX к оси Ох уже известен (а = 45°), осталось определить старые координаты точки О,. В системе О,ХУ эта точка (центр эллипса) имеет координаты X =0, У = 0. По формулам (II) имеем х'— 2 ^/2 = 0, у' -\-^2 = 0, откуда х’ = 2^2, у' =—д/2. С помощью формул (I) находим координаты точки О, в старой системе координат Оху: х= = (з/2/2)(2 ^2-(-д/2)) =3, y=(V2/2)(2V2-y/2) = l, 0,(3, I). Строим новую систему координат OtXY и сам эллипс по его каноническому уравнению (III) (рис. 2.15). Пример 2.31. Построить линию, определяемую уравнением Зх2 + 4ху— — 4х — 8у = 0. В данном случае 4 = 3, 2В = 4, С = 0. По формуле (2.52) находим ctg2a = = (3 — 0)/4 = 3/4. В формулы (2.53) входят since и cos а. Найдем их значения с помощью формул (2.54) и (2.55), в которых знак можно выбрать по своему усмотрению. Выбрав везде знак плюс, получим cos 2<х = 3/4 л/14- (3/4)2 1—3/5 _ 1 2 -у5 3 , sin а — о 2 ' 2 cos a = —- , tg a = -y'5 Формулы (2.53) принимают вид x=(1/V5)(2x'-<7'), у=(\/^)(х' + 2у'). (IV) Подставим эти выражения в исходное уравнение и преобразуем его: -Е- (2х' — у')2+ (2х' — у') (х' + 2у')-(2х' — у')-(х' + 2у') =0, 00 у5 V5 3 4 16 12 — (4х'2 — 4х'у' + у'2)+ — (2х'2 + 4х'у' — х'у' — 2у'2)------— х'--— у’ = 0, 5 5 /5 д/5 4 . ,г ,1 16 , 12 4х — у------------ х-----— у =0, д/5 V5 12 , , 36 16 , 36 4 , ~5~ ’ 30
Перейдем к новым координатам по формулам Х = х' — 2/V5, Г = / + 6/у/5. (V) Последнее уравнение в новых координатах примет вид 4Х2-У2=-4, или -Х71 + Гг/4 = 1. Это каноническое уравнение определяет гиперболу с полуосями а=1, Ь = 2, причем действительной осью будет ось О, Y. Построим гиперболу в новой системе координат OiXY. Найдем сначала старые координаты точки О>, в которой нахо- дится центр гиперболы. Для этой точки Л = 0, У = 0. По формулам (V) получаем х' = 2/д/5, У'——6/^/5. С помощью формул (IV) находим х = =-U(-V +=2, У =-!=-( ---5^-1 =—2, 0,(2.—2). Через точку V5 ' д/5 д/5 ' V5V д/5 <5' О| проводим ось О\Х, для которой tga = l/2, и ось О, У, перпендикулярную оси О\Х. В системе координат OtXY строим гиперболу по ее каноническому уравнению (рис. 2.16). Пример 2.32. Построить линию, определяемую уравнением х2—2ху + + у2 + 4х — 9>у + 7 = 0. Поскольку Д = 1, 2В=—2, С=1, то по формуле (2.52) ctg2a=(l— — 1)/( — 2)=0, 2а = л/2, а = л/4. Формулы (2.53) принимают вид х= (д/2/2) (х'~у'), у=(д/2/2)(х' + /). (VI) Подставим эти выражения в исходное уравнение и преобразуем его: (1/2) (х'-/)2-(х'-/)(х' + /) + (1/2) (х' + у')2 + 2^2(х'-у')- -4л/2(х' + </')+7 = 0, 2у'2-2 V2x'-6y/2y' + 7 = 0, (у' —3 д/2/2)2 —v'2(x' +1/д/2) =0. Перейдем к новым координатам по формулам 31
В новых координатах последнее уравнение принимает вид У2-л/2А- = 0, или y2 = V2X. Это уравнение определяет параболу. Вершина параболы находится в точке, для которой Х = 0, Y=0. Найдем старые координаты этой точки. По формулам (VII) находим х'= —1/у/2, у' = 3/^2. С помощью формул (VI) получаем Строим систему координат OiXY и параболу по ее каноническому уравнению (рис. 2.17). 2.10. Некоторые алгебраические линии высших порядков Декартов лист — линия, определяемая в прямоугольной декартовой системе координат алгебраическим уравнением x3 + i/3 — 3axy = 0 (a = const=/=0). В полярных координатах уравнение принимает вид За cos <р sin и> р=-----з—г—з— • COS’<p4-Sin ф Декартов лист можно задать и параметрическими уравнениями x = 3a//(l +/3), y = 3at2/(\ +<3). Линия эта изображена на рис. 2.18. Циссоида. Рассмотрим окружность с диаметром ОА = 2а и касательную к ней в точке А (рис. 2.19). Из точки О проведем луч ОВ, точку его пересечения с окружностью обозначим буквой С. На этом луче отложим отрезок I ОА4| = = I ВС|. Проведя другой луч и выполнив аналогичное построение, получим точку Afi. Таким способом можно построить сколько угодно точек. Множество точек М, Mi,... называют циссоидой. Построив достаточное число указанных точек и соединив их плавной линией, получим циссоиду (см. рис. 2.19). Уравнение циссоиды в декартовых прямоугольных координатах имеет вид 32
в полярных координатах р = 2а sin2<p/cos <р. Параметрические уравнения циссоиды 2а _ 2а Х~ /2+1 ’ У~ Н'2 + 1) ’ или x = 2asin2<p, у = 2а sin3<p/cos <р, где <р — полярный, угол. Строфоида. Рассмотрим точку А и прямую А, не проходящую через данную точку (рис. 2.20). Обозначим буквой С точку пересечения перпендикуляра к прямой А, проведенной в точке А, а длину отрезка АС — а, т. е. \АС\=а. Вокруг точки А вращается луч, на котором откладываются отрезки BMi и ВМ2 от точки В пересечения с данной прямой так, что | BMt | = | ВМ2| = I ВС|. Каждому положению луча соответствует пара точек Afi, М2, построенных ука- занным способом. Множество пар точек Afi, М2 называют строфоидой. Точки Mi и М2 при этом называют сопряженными. Построив достаточное число точек и соединив их плавной линией, получим строфоиду (см. рис. 2.20). Название «строфоида» происходит от греческого слова атросрт]— поворот. Уравнение строфоиды в полярных координатах р=а(1 ±sin <p)/cos <р, в декартовых координатах , (х — а)2х , ч / х у~=—7\--------• или у= + х — а)~\----------. 3 2а —х 3 ' ' \ 2а —х Параметрические уравнения строфоиды х = а(1 ±sin <р), у = а(\ + sin <р) sin <p/cos <р. Версьера. Рассмотрим окружность с диаметром |ОС| =а и отрезок ВМ, построенный так, что | ОВ|: I ВО = | ОС| : | ВМ[ (рис. 2.21). Множество точек М называют версьерой. В прямоугольных декартовых координатах уравнение версьеры имеет вид у = а3/(х2 + а2). Параметрические уравнения версьеры x = t, у = а2/ (/2 + а2), где роль параметра играет первая координата. 33
Рассматриваемую линию называют также «локоном Аньези» в честь первой в Европе женщины, получившей известность благодаря заслугам на поприще математики. Лемниската Бернулли — множество всех точек плоскости, для каждой из которых произведение расстояний до двух данных точек той же плоскости есть постоянная величина, равная квадрату половины расстояния между данными точками. В декартовых прямоугольных координатах лемниската Бернулли (рис. 2.22) имеет уравнение (х2+у2)2 = 2а2(х2-у2), в полярных р2 — 2а2 cos 2<р. При другом выборе системы координат (рис. 2.23) эта линия определяется соответственно уравнениями (№ + у2)2 = 4а2ху, р2 = 2а2 sin 2<р. Название линии происходит от греческого слова Xppviaxo£ — повязка, бант. Линия названа по имени ученого, открывшего ее. Уравнение лемнискаты впервые встречается в статье Я. Бернулли, опубликованной в 1694 г. в журнале «Acta eru<lгогит» («Труды ученых»). Овал Кассини — множество всех точек плоскости, для каждой из которых произведение расстояний до двух данных точек той же плоскости есть постоян- ная величина. Уравнения овала Кассини в декартовых координатах (x2-j-y2) —2а2(х2—у2) = Ь4 — а4, 34
в полярных р = <Л cos 2<р±т/cos22<р ((64/а4) — 1) Вид овала Кассини зависит от соотношения между постоянными а и Ь. В случае 6> а овал имеет форму замкнутой линии, симметричной относительно осей координат (рис. 2.24). При Ь = а получаем лемнискату Бернулли. В случае 6<а овал состоит из двух замкнутых линий. Рис. 2.25 Овалы Кассини названы в честь французского ученого, впервые рассмот- ревшего их. Жан Доминик Кассини (1625—1712) открыл эти линии при попытке определить орбиту Земли. Конхоида. В плоскости фиксируем прямую LL\ и точку О, отстоящую от этой прямой на расстоянии \ОЕ\=а (рис. 2.25, а). Проведем луч ОК, пересе- кающий прямую LLi в точке К. На луче от точки К, по обе стороны от нее, отложены два отрезка КМ и КМ, таких, что | КМ| = | КМ< | =/, где I — заданное число. Вращая луч вокруг точки О (от 0 до 180°) и проводя аналогичные построения (при одном и том же значении /), получим линию, описываемую точками М и Л4|, которую называют конхоидой. Точку О при этом называют полюсом конхоиды, а прямую LL: — ее базисом. Линия эта состоит из двух ветвей: одну ветвь описывает точка М, другую — точка Л1,. Уравнение конхоиды в полярных координатах р= (a/sin q>) +/, знак плюс — для верхней ветви, минус — для нижней. Форма конхоиды зависит от соотношения между параметрами / и а. При 1 = а и /> а линия имеет вид, изображенный соответственно на рис. 2.25, б, в. В прямоугольных декартовых координатах конхоида имеет уравнение (х2 + у2) (у— а)2 — 12у2 = 0. Линию эту называют конхоидой Никомеда, по имени древнегреческого геометра, впервые открывшего ее. Улитка Паскаля. Рассмотрим окружность радиуса г с центром в точке С (рис. 2.26). Выберем на данной окружности точку О. Представим себе, что вокруг точки О вращается луч ОМ. В каждом его положении от точки N пересечения луча и окружности откладываем отрезок \NM\=l, где / — задан- ное положительное число. При повороте луча от 0 до 180° получим множество точек М. При дальнейшем повороте луча от 180 до 360°, откладывая отрезок длины I по направлению луча, мы фактически будем откладывать его в сторону, противоположную прежней, т. е. |Л0И|| =/, и получим точки 44,. Множество точек М и М\ называют улиткой Паскаля. Уравнения улитки Паскаля: р = 2г cos <р±/, (x2 + V2 — 2гх)2 — 12(х2+у2) =0. 35
Форма улитки Паскаля зависит от соотношения между параметрами г и /: /<2г (рис. 2.26), / = 2г (рис. 2.27), /> 2г (рис. 2.28). Линия названа в честь Этьена Паскаля — французского математика-лю- бителя, отца знаменитого Блеза Паскаля. Кардиода — линия, описываемая точкой М окружности радиуса г, катящейся Рис. 2.26 по окружности с таким же радиусом (рис. 2.29). Параметрические уравнения кардиоды x = 2r cos t — г cos 2/, y = 2r sin t — r sin 2/, в полярных координатах p = 2r (1 —cos <p), в декартовых координатах (x2 + y2 + 2rx)2 = 4r2(x2 + </2)- Уравнение р = 2г (I-|-cos <р) также определяет кардиоду в полярной системе координат с полюсом в той же точке и противоположно направленной полярной осью. Каппа — линия, представляющая собой множество точек касания касатель- ных, проведенных из данной точки к окружности заданного радиуса, центр которой перемещается по фиксированной прямой, проходящей через эту точку (рис. 2.30). Линия эта напоминает греческую букву х (каппа), откуда и происходит ее название. 36
Параметрические уравнения каппы х = а cos2<p/sin ср, у = а cos <р, в полярных координатах р=а ctg <р, в декартовых координатах (x2+{/2)V = a2x2. Роза — линия, заданная полярным уравнением р = а sin k<p или уравнением p = acos/E<p, где а и k — положительные числа. Роза целиком расположена в круге радиуса а (р^а), так как |sin Л<р| 1. Роза состоит из конгруэнтных лепестков, симметричных относительно наибольших радиусов, каждый из которых равен а. Количество этих лепестков зависит от числа k. Если k — целое число, то роза состоит из k лепестков при нечетном k и из 1k лепестков при четном k (рис. 2.31,а,б). Если k — рациональное число, причем k = m/n (п> 1), то роза состоит из т лепестков в случае, когда тип — нечетные числа, или из 2т лепестков, если одно из чисел будет четным. При этом в отличие от предыду- щего случая каждый следующий лепесток будет частично покрывать преды- дущий (рис. 2.31,в—е). Если число k является иррациональным, то роза состоит из бесконечного множества лепестков, частично накладывающихся друг на друга. Четырехлепестковой розой (см. рис. 2.31,6) называют линию, определяемую полярным уравнением р = а sin 2<р. В декартовых координатах линия имеет уравнение (х2+у2)3 — 4а2х2у2 = 0. Четырехлепестковая роза образуется множеством оснований перпендикуля- ров, опущенных из вершины О прямого угла на отрезок постоянной длины, концы которого скользят по двум взаимно перпендикулярным прямым, пере- секающимся в точке О. 37
Трехлепестковой розой (см. рис. 2.31, а) называют линию, определяемую уравнением р = а sin Зср. В декартовых координатах линия имеет уравнение (х2+у2)2 = а(?>х2у-у2). Астроида. Прямоугольник, две стороны которого лежат на двух взаимно перпендикулярных прямых, деформируется так, что его диагональ сохраняет постоянную длину а. Множество точек — оснований перпендикуляров, опущен- ных из вершины прямоугольника на его диагональ, называют астроидой (рис. 2.32, а). Астроида имеет параметрические уравнения x = acos3/, у = а sin3/. Исключив из этих уравнений параметр /, получим уравнение астроиды в прямоугольных координатах: х2/3 + 4(2/3 = а2/3 Освобождаясь от дробных показателей, находим (х2 + у2 — а2)3 + 27х2у2а2 = 0. Астроиду можно рассматривать как траекторию точки окружности радиуса г (рис. 2.32,6), катящейся по внутренней стороне другой окружности, радиус R которой в четыре раза больше г (R = 4r). Параметрические уравнения астроиды в этом случае 3 п / , 1 п 3/ Х= __ R cos — + — R cos — , 3 D . I 13/ y= — «sin —--------_«sln — . Гипоциклоида—плоская линия, описанная фиксированной точкой окруж- ности радиуса г, катящейся без скольжения по другой неподвижной окруж- ности радиуса R внутри ее (рис. 2.33, где М — вычерчивающая точка, А — ее исходное положение, t — угол поворота окружности, AM — дуга линии). 38
Параметрические уравнения гипоциклоиды х= (R— mR) cos mt-\-mR cos (/ — mt), z/= (R — mR) sin mt — mR sin (/ — mt), где m = r/R. Форма кривой зависит от значения т. Если m = p/q (р и q — взаимно простые числа), тогда М после q полных оборотов окружности возвра- щается в исходное положение и гипоциклоида — замкнутая линия, состоящая из q ветвей с q точками возврата при т<1/2 (рис. 2.34); при т> 1/2 вместо q точек возврата линия имеет q других точек (рис. 2.35). При т=1/2 линия вы- рождается в диаметр неподвижной окруж- ности, при т= 1/4 является астроидой (см. рис. 2.32). При иррациональном т число ветвей бесконечно, точка М в исходное положение не возвращается. Обобщением гипоциклоиды является ги- потрохоида. Гипотрохоида — плоская линия — тра- ектория точки, жестко связанной с окружностью радиуса г, катящейся без скольжения по другой неподвижной окруж- ности радиуса R внутри ее, причем вы- черчивающая точка М находится на рас- стоянии h от центра окружности радиуса г. При Л > г кривая называется удли- ненной гипоциклоидой (рис. 2.36, т = = 1/4), при h<Zr — укороченной (рис. 2.37, щ=1/4). Параметрические уравне- Рис. 2.33 ния гипотрохоиды х= {R — mR)cos mt-)-h cos (t — mt), y= (R — mR)sinmt — fisin(t — mt), где m=r/R. При R = 2r линия является эллипсом, при h = R-)-r — розой (см. рис. 2.31). Эпициклоида — плоская линия — траектория фиксированной точки окруж- ности радиуса г, катящейся без скольжения по другой неподвижной окруж- ности радиуса R вне ее (рис. 2.38, где М — вычерчивающая точка, А — ее исход- ное положение, t — угол поворота окружности, AM — дуга кривой). Параметрические уравнения эпициклоиды х = (RA-mR)cos mt — mR cos (1 + mt), y—(R-\-mR)bmmt — mRsm(t-\-mt), 39
где m — r/R. Форма кривой зависит от значения т (рис. 2.39, а; т = 1/3, рис. 2.39, б; щ = 2/3). Если m=p/q (р и q—взаимно простые числа), точка М после q полных оборотов окружности возвращается в исходное положение и эпициклоида — замкнутая линия, состоящая из q ветвей с q точками возврата. При т=1 кривая является кардиодой (см. рис. 2.29). При иррациональном т число ветвей бесконечно, точка М в исходное положение не возвращается. Обобщением эпициклоиды является эпитрохоида. Эпитрохоида — плоская кривая — траектория точки, жестко связанной с производящей окружностью радиуса г, катящейся без скольжения по другой 40
неподвижной окружности радиуса R вне ее, причем вычерчивающая точка М находится на расстоянии h от центра производящей окружности. При h > г линия называется удлиненной эпициклоидой (рис. 2.40, а; т=1/4), при h<r — укороченной эпициклоидой (рис. 2.40,6; т=1/4). Параметрические уравнения эпитрохоиды х= (P-f-m/?)cos mt — h cos (/-|-mt), У — (/?+zn/?)sin mt — h sin (t-R mt), где m=r/R. При r = R линия является улиткой Паскаля (см. рис. 2.27, 2.28), при Л = /? + / — розой (см. рис. 2.31). 2.11. Некоторые трансцендентные линии Трансцендентной называется линия, уравнение которой в прямоуголь- ных декартовых координатах не является алгебраическим. Простейшими приме- рами трансцендентных линий могут служить графики функций у = ах, t/ = lgx, у = sin х и других тригонометрических функций. Спираль Архимеда — траектория точки М, равномерно движущейся по пря- мой, которая равномерно вращается вокруг фиксированной точки О (рис. 2.41). Уравнение спирали Архимеда в полярных координатах р = а<р, в декартовых координатах у/х2+у'2=а arctg(i//x). Циклоида — траектория фиксированной точки окружности, которая без скольжения катится по прямой (см. пример 1.17, уравнения (1.21)). Рассмотрим траекторию точки, жестко связанной с окружностью, катящейся по прямой, но находящуюся не на самой окружности, а на расстоянии d от ее цен- 41
М ц>-»- + 0 42
тра. При d<R вычерчивающая точка находится внутри окружности, ее траек- торию называют укороченной циклоидой (рис. 2.42, а). Если d > R, то вычерчи- вающая точка находится вне окружности; ее траекторию называют удлиненной циклоидой (рис. 2.42, б). Эти линии определяются параметрическими уравнениями x—Rt — d sin t, y^R—d cos t. Алгебраическая спираль — линия, определяемая алгебраическим уравнением /(р, <р)=0 относительно полярных координат. К алгебраическим спиралям отно- Рис. 2.50 сится спираль Архимеда, так как ее уравнение р=а<р является алгебраическим уравнением первой степени относительно р и <р, Другими простейшими алгебра- ическими спиралями являются линии, определяемые уравнениями: р=а/<р (гиперболическая спираль, рис. 2.43); р= (а/<р)-+-Z, где ?>0 (конхоида гиперболической спирали, рис. 2.44); р=аф' (спираль Галилея, рис. 2.45); р’=а’<р (спираль Ферма, рис. 2.46); Р=“л/ф+Л где />0 (параболическая спираль, рис. 2.47); P=a/V<p (жезл, рис. 2.48). Логарифмическая спираль (рис. 2.49) линия, определяемая уравнением p-a’ (а > 0, I). Логарифмическая спираль пересекает полярные радиусы всех своих точек под одним и тем же углом. На этом свойстве основано ее применение в технике. Так, в различных режущих инструментах и машинах вращающиеся ножи имеют 43
профиль, очерченный по дуге логарифмической спирали. В силу этого угол реза- ния остается постоянным. Логарифмическая спираль применяется в теории меха- низмов при проектировании зубчатых колес с переменным передаточным числом (т. е. отношением их угловых скоростей). В природе некоторые раковины очерчены по логарифмической спирали (рис. 2.50, а). Семечки подсолнуха расположены по дугам, близким к дугам логарифмической спирали (рис. 2.50, б). Логарифмическая спираль впервые упоминается в письме Декарта к Мер- сенну от 12 сентября 1638 г. (опубликовано в 1657 г.). Независимо от Декарта логарифмическая спираль была открыта Торричелли, который выполнил ее спрям- ление и квадратуру. Название «логарифмическая спираль» для данной линии предложил Лопиталь, автор первого печатного учебника по дифференциальному исчислению. Квадратриса. Дан отрезок AD длины 2а, середина которого находится в точке О (рис. 2.51, а). Отрезок ОА равномерно вращается вокруг точки О с угло- вой скоростью ы = л/2Г, а прямая КС, перпендикулярная AD, одновременно начинает равномерно двигаться от точки А к точке D со скоростью v—a/T, оста- ваясь параллельной исходному направлению. Точка Л1 пересечения вращаю- щегося отрезка и движущейся прямой описывает линию, которую называют квадратр^сой. Уравнения квадратрисы в декартовых координатах у = х ctg(nx/2a), в полярных координатах р = а(л— 2ф)/л cos <р. Линия имеет бесконечное множество точек пересечения с осью ординат, так ctg(nx/2a)=0 при х= ±а, х=±3а, х=+5а, ... Квадратриса изображена 44
на рис. 2.51,6, а на рис. 2.51, а указана та часть линии, которая соответствует значениям аргумента х: —а^х^а. Название линии дал Лейбниц. Квадратрису впервые открыл Гиппий из Эллиды (древнегреческий софист, живший в V в. до н. э.) в поисках решения задачи о трисекции угла. К задаче о квадратуре круга эту линию применил древнегреческий геометр Динострат IV в. до н. э. В связи с этим линию называют квадратрисой Динострата. Трактриса — линия, у которой длина касательной является постоянной величиной. Под длиной касательной понимают длину отрезка МТ, касательной между точкой касания М и точкой Т пересечения с осью Ох (рис. 2.52). Трактриса имеет параметрические уравнения х = а In tg(//2) +а cos t, у = а sin t; ее уравнение в прямоугольных декартовых координатах х= ± (а 1п( (а + д/а^у5)/!/) + д/а2 —г/2). Трактриса применяется в одной из частей механизма карусельного токар- ного станка (рис. 2.53). Линия вертикального профиля антифрикционной пяты этого механизма обладает тем свойством, что длина ее касательной постоянна. Трактриса сыграла выдающуюся роль в истории математики в связи с открытием Н. И. Лобачевским новой геометрии и последующим развитием учения о неевклидовых геометриях. Геометрия Лобачевского реализуется на псевдосфере, полученной вращением трактрисы вокруг ее асимптоты. Трактриса была открыта в XVII в. Ее название происходит от латинского слова trade — тащу, влеку. Цепная линия — кривая, форму которой принимает под действием силы тяжести нить с закрепленными концами (рис. 2.54). В прямоугольных декарто- вых координатах цепная линия имеет уравнение у= (а/2) Длина дуги цепной линии от ее вершины до заданной точки равна проекции ординаты этой точки на касательную, проведенную в этой точке (рис. 2.55, s = MN). Проекция ординаты произвольной точки цепной линии на нормаль в этой точке является величиной постоянной, равной параметру а цепной линии (a = ML). Свойства цепной линии применяются в строительстве и технике. Они исполь- зуются в расчетах, связанных с провисанием нитей-проводов, тросов и т. д. В строи- тельной технике применяется также линия свода, определяемая уравнением у = е(ех/а + е~‘/а). Вопрос о форме линии провисания впервые рассмотрел Галилей (1638). Он полагал, что линия провисания является параболой. Против этого позже возражал Гюйгенс. Окончательное теоретическое решение вопроса о форме ли- нии провисания дали Лейбниц, Гюйгенс, Я. Бернулли.
Глава 3 ВЕКТОРЫ Понятие вектора возникло как математическая абстракция объектов, характеризующихся величиной и направлением, например таких, как перемещение, скорость и т. п. Термин «вектор» ввел У. Гамильтон (около 1845 г.), обозначения: а —Ж. Арган (1806), АВ — А. Мёбиус, г — Коши (1853), а — О. Хевисайд (1891) 3.1. Основные понятия Вектором называется направленный отрезок. Если начало вектора находится в точке А, конец — в точке В, то вектор обозначается символом АВ или АВ. Начало вектора называют также точкой его приложения. Вектор иногда обозначается одной строчной буквой жир- С О ного шрифта а, Ь и т. д., или такой же * ж буквой светлого шрифта с черточкой на- верху а, Ь и т. д. К L N И Модулем вектора а называется его • * *----* ---- длина, он обозначается через I а| или Рис. 3.1 просто а. Модуль вектора — скалярная неотрицательная величина. Нуль-вектором (или нулевым вектором) называется вектор, начало и конец которого совпадают. Нуль-вектор обозначается символом 0. Его модуль равен нулю, а направление не определено. Единичным вектором называется вектор, длина которого равна единице. Векторы, лежащие на параллельных прямых или на одной прямой, называ- ются коллинеарными (рис. 3.1, векторы CD и MN , KL и MN , CD и KL). Коллинеарные векторы, имеющие одинаковые направления и равные дли- ны, называются равными (рис. 3.2, a, BC = AD). Так как векторы АВ и CD имеют противоположные направления, то AB#=CD, хотя | АВ I =|CD|. Отметим, что OMi #=ОМг, где М| и М?— две различные точки окружности радиуса R с центром в точке О (рис. 3.2, б), поскольку векторы ОМ, и ОМа имеют разные направления. Векторы, противоположно направленные и имеющие равные длины, назы- пВАпЮоТ^иТТ.ИВ0П0Л0ЖН5ми (вект°РЬ1 АВ и CD на рис. 3.2, а). Вектор, противо- положный вектору а, обозначается через —а. Векторы, лежащие в параллельных плоскостях (или в одной плоскости), называются компланарными. Вектор, точка приложения которого может быть выбрана произвольно, называется свободным. 46
3.2. Линейные операции над векторами Линейными операциями над векторами называют сложение, вычита- ние, умножение вектора на число. Суммой векторов а и Ь называется третий вектор с, начало которого совпа- дает с началом вектора а, а конец — с концом вектора Ь при условии, что вектор b отложен из конца вектора а. Вектор с получается по правилу треугольника (рис. 3.3, а) или параллелограмма (рис. 3.3, б). Аналогично определяется сумма трех и более векторов. Суммой п векторов ai, аг, ... , а„ называется вектор, начало которого совпадает с началом первого вектора а,, конец — с концом последнего ап при условии, что каждый последую- щий вектор at+i отложен из конца предыдущего at (k = 1, 2, ... , п— 1). Указан- ный способ построения суммы называется правилом замыкающей. Сумма векторов обладает свойством переместительности (коммутативности, рис. 3.4): a+b=b+a и свойством сочетательности (ассоциативности) (а + b) Н-с = а+ (Ь+с). Сумма трех некомпланарных векторов а, Ь, с наряду с правилом замыкающей получается и по правилу параллелепипеда: сумма а+Ы-с равна вектору OD, где OD — диагональ параллелепипеда, построенного на векторах ОА=а, ОВ=Ь, ОС=с, отложенных из одной точки (рис. 3.5). Из определения суммы следует, что а-|-0 = а, а+( —а)=0. Разностью а — b двух векторов а и b называется такой вектор d, который в сумме с вектором Ь дает вектор а: а — b=d, если b-|-d = a. Чтобы получить разность а—b двух векторов а и Ь, необходимо отложить их из одной точки и соединить конец второго вектора с концом первого (рис. 3.6, а). Разность а —b равна сумме двух векторов а и (—Ь), где (—Ь) —вектор, противоположный вектору b (рис. 3.6, б), т. е. а —Ь=а-|- ( —Ь). 47
Векторы — диагонали параллелограмма ОАСВ (рис. 3.6, в), построенного на векторах ОА = а, ОВ=Ь, являются соответственно суммой и разностью этих векторов. Произведением вектора а на число а называется вектор Ь = аа, удовлетворяющий условиям: 1) |Ь| = |а| |а|; 2) b и а одинаково направлены при а > 0; 3) Ь и а имеют противоположные направления при а<0 (рис. 3.7). а -За Рис. 3.7 Очевидно, Ь = 0, если а = 0 или а = 0. Произведение вектора на число обладает следующими свойствами: а(ра) = (а0)а, a(a + b) =<xa-|-ab, (а + Р)а = аа + Ра; а(а, Ч-аг-р • • • + а») =ctai Ч-аагЧ- • • • 4-®а„; (<xi + <Х2 + • • • + ап) а = а,а + <Х2а+ • • • + Необходимое и достаточное условие коллинеарности векторов а и b выра- жается равенством Ь = аа. (3.1) 48
3.3. Проекция вектора на ось В пространстве заданы вектор АВ и ось ция точки А на ось и, В, — проекция точки В, т. опущенных из данных точек на эту ось. Проекцией вектора на ось и называется величина направленного отрезка (вектора) AiBi оси и. Проекция вектора АВ на ось и обозначается через приАВ, т. е. А,В| = = приАВ, вычисляется по формуле пр«АВ = I АВ I cos <р, (3.2) где <р — угол между вектором АВ и осью и. Из равенства (3.2) следует, что если а = Ь, то npua = npub, и (рис. 3.8). Пусть А: — проек- е. основания перпендикуляров, (3.3) т. е. равные векторы имеют равные проекции (на одну и ту же ось). Проекция вектора на ось обладает следующими свойствами: пр„ (a + b) =npua + npub, (3.4) пр„(аа) = априа, (3.5) npo(ai -J-azH- • • • “Fan) =npuai -j-npuaz-J- • * • -|-npuan. (3.6) Если ai,az, ... , a„ — произвольная конечная система векторов; ai, az, ... , — произвольная система действительных чисел, то вектор а = aiai -|-<x2az-)“••• И-апа,г называется линейной комбинацией векторов этой системы. Из равенств (3.4) — (3.6) следует, что np„(aiai +a2az+ • • +anan) = — ainpoai -|-агпр^аг-|- • • • -|-ccnnpMan. (3.7) 3.4. Декартовы прямоугольные координаты вектора в пространстве. Длина вектора. Направляющие косинусы вектора Рассмотрим в пространстве декартову прямоугольную систему коор- динат. Радиусом-вектором точки М называется вектор г = ОМ, точка приложе- ния которого совпадает с началом координат, а конец находится в точке М (рис. 3.9). Декартовыми прямоугольными координатами X, Y, Z вектора г называются его проекции на координатные оси Х = пр2г, У = пр;,г, Z = np2r. (3.8) Каждая из записей г = (X, Y, Z), г(Х, Г, Z), г= (X, Y, Z) (3.9) означает, что вектор г имеет координаты X, Y, Z. Если х, у, г— декартовы прямоугольные координаты точки М, то Х = х, Y=y, Z = z, т. е. координаты радиуса-вектора ОМ равны координатам точки М. 49
Введем в рассмотрение единичные векторы 1, j, к координатных осей (их называют ортами) и векторы OA=Xi, OB = Zj, OC = Zk, где А, В, С — вершины прямоугольного параллелепипеда, для которого ОМ является диагональю (А, В, С—проекции точки М на координатные оси; ОА = Х, OB=Y, OC = Z—проек- ции вектора на координатные оси). По опре- делению суммы ОМ=ОА 4-OB-f-OC, поэтому r = Xi+rj + Zk. (3.10) Формула (3.10) выражает разложение век- тора г по базисным векторам i, j, к. Век- торы, стоящие в правой части формулы (3.10), называются составляющими или ком- понентами вектора г. На основании теоремы о квадрате диа- гонали прямоугольного параллелепипеда по- лучаем формулу, выражающую тора (3.9) или (3.10) через его длину век- координаты: I г | =Vx2+y2 + Z2. (3.11) Из равенства (3.3) следует, что равные векторы имеют равные координаты, поэтому координаты вектора не зависят от точки его приложения. Координатами любого вектора называются его проекции на координатные оси. Направляющими косинусами вектора называются косинусы углов <х,0,у, образуемых им с координатными осями. Принимая во внимание формулу (3.2), для вектора (3.9) получаем Z=|r|cosa, У = |г|cos 0, Z=|r|cosy. (3.12) Из равенств (3.11) и (3.12) следуют формулы для направляющих косинусов вектора г: X Y Z cos а = — , cos 6 = —======-, cos у = — _ „ .—— , Vx2+r2+z2 +Z2 s/x2+y2+z2 (3.13) откуда cos2a + cos20 + cos2y = 1. Из формул (3.12) следует, что координаты единичного вектора равны его направляющим косинусам; т. е. e=(cosa, cos 0, cosy). Пример 3.1. Дан вектор а= (2, — 1,— 2). Найти его длину и единич- ный вектор а0 направления вектора а. _______________ По формуле (3.11) находим длину вектора |а| = V22+ (— 1)2+( — 2)2 = 3, 2 а по формулам (3.13) —его направляющие косинусы cosa= -у-, cos 0 = 1 а 2 /2 1 = , cos0=—— , а„=( -3-, т)- 50
3.5. Переход от векторных соотношений к координатным Если даны векторы (т. е. известны их координаты) и указаны опреде- ленные соотношения между ними, то они равносильны аналогичным числовым соотношениям между координатами. Координаты произведения вектора на число. Пусть дан вектор а = (Aj, У,, Zi) и число а#=0. Координаты А2, Y2, Z2 вектора Ь = аа: А2=аАь У2= ah, Z2 = aZ,. (3.14) Отметим, что равенства (3.14) выражают необходимое и достаточное условие коллинеарности двух векторов: a=(Aj, У।, Zi), Ь=(Х2, У2, Z2). Если ни одно из чисел Л1, У1, Z\ не равно нулю, то эти равенства можно записать так: X2/X\ = Y2/Y\=Z2/Z\. Векторы коллинеарны тогда и только тогда, когда пропорциональны их одно- именные координаты. Координаты суммы (разности) двух векторов. Пусть даны два вектора а = = (Xi, У|, Zi), b = (Х2, У2, Z2), тогда X, Y, Z — координаты вектора суммы а-(-Ь: A = Xi4~X2, У=У14"Е2, Z = Z\-\-Z2\ Х' = Х,-Х2, У' = У,-У2, Z' = Z,-Z2, где X', Y', Z' — координаты разности a — b. Координаты вектора, заданного двумя точками. Начало вектора MiM2 нахо- дится в точке Л4| (xi, i/i, 21), конец — в точке М2(х2, у2, г2). Выражения для его координат X, Y, Z через координаты точек A4i и Л12: Х=х2 — Х\, Y=y2~y\, Z = z2 — 2i. (3.15) Координаты линейной комбинации векторов. Заданы п векторов а< = = (А,, У|, Zi), а2= (Х2, Y2, Z2), ... , а„= (А„, Y„, Z„) и их линейная комбинация а = aiai 4~<х2а24- • • • 4-сх^а,,. Координаты X, Y, Z вектора а определяются формулами А = aiXi 4-а2Х24" • * • + ctnXn, У = <Х1У|-|-сс2К2-|- * • • ccnYn, Z = at 1 Zi -|-cc2Z24~ * * * 4~ctnZn. Деление отрезка в данном отношении. Даны две точки в пространстве Л41 (xi, i/i, г,), М2(х2, у2, г2). Координаты точки Л4, делящей отрезок М|М2 в отно- шении /: Х14_^2 4- tyz ____ Z\~Yiz2 х~ 1+/ ’ у~ 14-/ ’ г~ 14-/ ' В частности, координаты середины отрезка определяются формулами Преобразование декартовых прямоугольных координат при параллельном переносе. Рас- смотрим две декартовы прямоугольные системы 51
координат с одним и тем же масштабным отрезком и одинаковыми направлениями одноименных координатных осей (рис. 3.10). Начало новой системы находится в точке 01 (а, Ь, с). Пусть М — произвольная точка пространства, х, у, г — ее коор- динаты в старой системе, X, Y, Z — в новой, тогда х = Х-|-а, y=Y-\-b, z = Z-{-c, или Х — х— a, Y=у— b, Z = z — с. (.3.17) Пример 3.2. Даны две точки Л(3, — 4, 7), Д(5, — 6, 8). Найти коорди- наты вектора АВ и координаты точки Е — середины отрезка АВ. По формулам (3.15) и (3.16) соответственно получаем Х = 5-3 = 2, Г=—6—(—4) = —2, Z = 8 —7=1, АВ= (2, -2, 1); х=(5 + 3)/2 = 4, у= (-6+ ( —4))/2 = -5, z= (8+ 7)/2 = 7,5, £(4; -5; 7,5). Пример 3.3. Даны четыре точки А(5, 6, —8), В(8, 10, —3), С(1, —2, 4), 0(7,6, 14). Коллинеарны ли векторы АВ и CD? Так как АВ=(8 —5, 10 — 6, —3—(-8)) = (3, 4, 5), CD=(7—1, 6—(—2), 14 — 4) =(6,8, 10) и CD = 2AB, т. е. выполнено равенство (3.1), то векторы АВ и CD коллинеарны. 3.6. Скалярное произведение двух векторов Скалярным произведением двух векторов а и Ь называется число, рав- ное произведению их длин на косинус угла между ними. Если обозначить скаляр- ное произведение через ab, то fl ab= |а| IЫ cos <р. (3.18) Так как [bfcos <р = праЬ и |a|cos <р = прьа (рис. У' \ । 3.11), то равенство (3.18) можно представить в У' в двух других видах: ] \ ab = |а|праЬ, аЬ=|Ь|прьа. ц । \ Понятие скалярного произведения возникло в Q * I---------------механике. Если вектор а изображает силу, точка °? А приложения которой перемещается из начала в Рис. 3.11 конец вектора Ь, то работа w указанной силы определяется равенством w = |а| |b|cos <р. Скалярным квадратом вектора а называется скалярное произведение вектора а на себя: а2 = аа=|а| jа)cos 0 = Iа)2, т. е. скалярный квадрат вектора равен квадрату его длины. Векторы а и b перпендикулярны тогда и только тогда, когда ab = O. (3.19) Скалярное произведение обладает свойствами: 1) переместительности (коммутативности) ab = Ьа, 2) сочетательности (ассоциативности) относительного числового множителя (aa)b = a(ab), 3) распределительности (дистрибутивности) относительно суммы векторов а(Ы-с) =ab + ac. Скалярное произведение двух векторов a=(Xi, Ki.Z,), b=(X2, y2,Z2) (3.20) 52
ныражается формулой аЬ = Х1Х2+Г|У2+7172, (3.21) т. е. скалярное произведение двух векторов равно сумме произведений одноимен- ных координат. Замечание. Если Ь = а, то формула (3.21) принимает вид aa=Xi + -|-y? + Z?. Поскольку аа = а2=|а|2, то |а| = л/Х? + Ef + Zf. Косинус угла между векторами (3.20) определяется формулой XtX2+YlY2 + ZlZ2 cos <р= —. — - . (3.22) л/хГ+уГ+zT л/хГ+Л+21 Необходимое и достаточное условие перпендикулярности двух векторов (3.20) выражается равенством XiX2+YiY2 + ZiZ2 = 0, (3.23) оно следует из формул (3.19) и (3.21). Если ось и образует с координатными осями углы а, 3, у соответственна, то проекция вектора s= (X, Y, Z) на эту ось определяется равенством npus = X cos а4- Y cos p + Z cos у. Пример 3.4. Даны два вектора а= (8, —7, —2), b= (7, — 11, 8). Найти угол между ними. По формуле (3.22) получаем cos Ф =8-7 + (— 7) (— 11) + (— 2) 8= д/82+(-7)2+(-2)2 л/75+(-И)5 + 82 Пример 3.5. Доказать, что векторы а=(2, — 4, 6), Ь= (3,3,1) перпен- дикулярны. По формуле (3.21) находим: ab = 2-3+ (— 4) • 3 + 6-1 = 0. Так как выполнено условие (3.19), то векторы а и b перпендикулярны. 3.7. Правые и левые тройки векторов. Правые и левые системы координат Три некомпланарных вектора ОА = а, ОВ=Ь, ОС = с, взятых в указан- ном порядке (а — первый вектор, b — второй, с — третий) и приложенных в одной точке (рис. 3.12, а, б), называют тройкой векторов а, Ь, с. Будем смотреть с конца 53
вектора с на плоскость, определяемую векторами а и Ь. Если кратчайший поворот от вектора а к вектору b совершается против часовой стрелки, то тройка векто- ров а, Ь, с называется правой'5 (рис. 3.12, а), если указанный поворот совершается по часовой стрелке, тройка а, Ь, с называется левой (рис. 3.12, б). Две тройки, обе правые или обе левые, называются тройками одной ориен- тации; если одна тройка является правой, а другая — левой, то они называются тройками различной ориентации. При круговой перестановке векторов (первый заменяется вторым, второй — третьим, третий — первым, рис. 3.12, в) ориентация тройки не меняется (см. рис. 3.12, а, б). Если поменять местами два вектора, то ориентация тройки меняется, напри- мер если а, Ь, с — правая тройка, то тройка Ь, а, с (тех же векторов, взятых в по- рядке Ь, а, с) будет левой. Прямоугольная декартова система координат называется правой, если трой- ка базисных векторов i, j, к правая; если эта тройка левая, то система координат называется левой. 3.8. Векторное произведение двух векторов Векторным произведением вектора а на вектор b называется третий вектор, обозначаемый символом [а, Ь] и удовлетворяющий условиям 1) I [a, b] I = |а| Ы sin ср, где <р — угол между векторами а и Ь; 2) вектор [а, Ь] перпендикулярен каждому из векторов а и Ь; 3) тройка векторов а, Ь, [а, Ь] имеет ту же ориентацию, что и i, j, k. Для векторного произведения применяют и другие обозначения, например аХЬ. Замечание. Если пользоваться только правыми системами координат, то условие 3) можно заменить другим — тройка а, Ь, [а, Ь] является правой. Понятие векторного произведения возникло в механике. Если вектор b изобра- жает силу, приложенную в точке М, а = ОМ, то [а, Ь] выражает момент силы b относительно точки О. Из условия 1) следует, что модуль векторного произведения [а, Ь] равен площади S параллелограмма, построенного на векторах а и b (рис. 3.13), т. е. поэтому I [a, b] I =S, [a, b] = Se, (3.24) где е — единичный вектор направления вектора [а, Ь]. Равенство [а, Ь] = 0 . выражает необходимое и достаточное условие коллинеарности двух векторов а и Ь; в частности, для любого вектора а [а, а] =0. Векторное произведение двух векторов обладает свойствами: 1) антиперестановочности множителей [а, Ь] = — [Ь, а]; 2) сочетательности относительно скалярного множителя [(<ха), Ь) =а[а,Ь], [а, (₽Ь)) =р[а, Ь]; 3) распределительности относительно сложения '5 В случае правой тройки а, Ь, с векторы а, Ь, с располагаются так, как большой, указательный и средний пальцы правой руки; если тройка а, Ь, с является левой, то векторы а, Ь, с располагаются так, как указанные пальцы левой руки. 54
[(a + b), с] = [а, с] + [b, c], [a, (b+c)J = [a, b] + [a, c]. Векторное произведение [a, b] двух векторов a=(X,, Г,,/.), b=(X2, K2,Z2) (3.25) выражается формулой zJ'+IJ ,зда Эту формулу можно представить через символический определитель третьего порядка [а. Ь] = i j k Х1 К। Z, X2 y2 z2 (3.27) Замечание. Составим матрицу из координат векторов а и b Г Х> У, L Х2 Y2 Z, Z2 Координаты векторного произведения [а, Ь] равны минорам второго порядка этой матрицы, полученным путем поочередного вычеркивания первого, второго и третьего столбцов, причем второй минор нужно взять со знаком минус. Площадь параллелограмма, построенного на векторах (3.25), вычисляется по формуле которая следует из (3.11) и (3.24). Площадь треугольника АВС определяется формулой S =-i-1 [АВ, AC] I. (3.29) Формула (3.29) следует из (3.24), так как площадь треугольника АВС состав- ляет половину площади параллелограмма, построенного на векторах АВ и АС. Пример 3.6. Даны два вектора а= (5, 3, — 4), Ь=(6, 7, —8). Найти координаты векторного произведения [а, Ь]. По формуле (3.27) получаем | i j k I [a, b] = 15 3 -41 = |6 7 — 8] 7 :8р-|б =8P+ |б 7 | k = 4>+16j + 17k, [a, b] = (4, 16, 17). Пример 3.7. Вершины треугольника находятся в точках А (1, 1, 3), В(3, —1,6), С(5, 1, —3). Вычислить его площадь. С помощью формул (3.15) находим координаты векторов АВ и АС:АВ = = (2, —2,3), АС= (4, 0, —6). Так как 55
'-ЧП J | ,| 5- | } = (12.24.S). TO S= -1- | [AB, ACJI = -L д/122 + 242 + 82= -±- -д/42(32 + 62 + 22 ) = = -l-4-7=14. 3.9. Смешанное произведение трех векторов Пусть даны три вектора а, Ь, с. Вектор а умножим векторно на Ь, векторное произведение [а, Ь] умножим скалярно на с, в результате получаем число, которое называют векторно-скалярным произведением или смешанным произведением [а, Ь] с трех векторов а, Ь, с. Смешанное произведение [а, Ь]с трех некомпланарных векторов равно объему параллелепипеда, построенного на векторах ОА = а, ОВ=Ь, ОС = с (рис. 3.14), взятому со знаком плюс, если тройка (а, Ь, с) —правая, со знаком минус, когда эта тройка — левая: r=mod([a, bjc). (3.30) Векторы а, Ь, с компланарны тогда и только тогда, когда их смешанное произведение равно нулю, т. е. [а, Ь] с = 0. (3.31) Смешанное произведение [а, Ь] с и а[Ь, с] обоз- начают через abc: abc= [а, Ь] с = а[Ь, с]. Если поменять местами два вектора, то смешанное произведение изменит лишь знак. Для трех векторов а, Ь, с: abc = bca = cab= —bac= —cba= —acb. Смешанное произведение трех векторов а= (X,, У,, Zi), Ь= (Х2, Г2, Z2), с= (Х3, Г3, Z3) (3.32) определяется формулой X( Г| Zi abc = X2 y2 z2 (3.33) X3 Y3 Z3 Из формул (3.30) и (3.33) следует, что объем параллелепипеда, построен- ного на векторах (3.32), вычисляется по формуле X, Ki Zi V = mod X2 y2 Z2 (3.34) X3 Y3 Z3 Объем треугольной пирамиды с вершинами в точках Mi (xi, yi, zi), M2 (x2, {/г, z2), M3(x3, y3, z3), M4(x4,y4,z4) определяется формулой V = mod о X2 — Xi Хз —X| х< —Х| У2—У1 Уз —У' У4—У1 z2 — Z| z3 — Z1 Z4 — Z| (3.35) 56
Необходимое и достаточное условие компланарности трех векторов (3.32) выражается равенством X, У, Zi Х2 У2 z2 Хз Уз 2.3 (3.36) которое следует из равенств (3.31), (3.33). Пример 3.8. Найти объем параллелепипеда, построенного на векторах а=(1,3, 1), Ь=(2, 1,3), с= (3, 1,2). По формуле (3.34) получаем 1 2 3 V = mod 3 1 1 1 3 =mod 2 1 2 3 О -5 — 8 = 13. О Пример 3.9. Доказать, с= (5, —7,9) компланарны. Так как что векторы а=(1,—2, 3), Ь = (4, — 5, 6), 1 — 2 3 4-5 6 5-7 9 1 —2 О 3 О 3 3 -6 -6 = 0, т. е. выполнено условие (3.36), то данные векторы компланарны. Пример 3.10. Вычислить объем треугольной пирамиды, вершины которой находятся в точках М।(6, 1,4), Л12(1, —3,7), Af3(7, 1,3), ЛЬ(2, —2, —5). В соответствии с формулой (3.35) находим „ j 1 V = mod -т- 6 1—6 —3—1 7—4 2-6 -2-1 -5-4 7-6 1-1 3-4 = mod -т- 6 -5 —4 3 -4 -3 -9 1 0 -1 23 3 3.10. Линейная зависимость векторов Векторы а,, а2, ... , ал называются линейно зависимыми, если суще- ствуют действительные числа а>, а2, ... , а«, из которых по меньшей мере одно отлично от нуля, такие, что aiai+ а2а2++ “ла„ = 0. (3.37) В противном случае (т. е. когда таких чисел не существует) векторы назы- ваются линейно независимыми; другими словами, векторы линейно независимы, если равенство (3.37) выполняется лишь при «1 =сх2= ••• = ал = 0. (3.38) Если один из векторов, например а,, является нулевым, то система аь а2, ... , ал окажется линейно зависимой, так как равенство (3.37) будет вы- полнено при ai = l, <х2 = <хз= = ал = 0. Если часть векторов ai,a2,...,as ли- нейно зависима, то и вся система а,, а2, ... , а„ линейно зависима, поскольку из равенства a,aiЧ-агагН-...+ а»а4 = 0 следует равенство (3.37), в котором <х*+1 = а4 + 2 =... = ап = 0. Теорема 3.1. Векторы а,, а2, ... , а„(п > 1) линейно зависимы тогда 57
и только тогда, когда по меньшей мере один из них является линейной комбина- цией остальных. Теорема 3.2. Два вектора а и b линейно зависимы тогда и только тогда, когда они коллинеарны. Теорема 3.3. Если ei и е2 — два неколлинеарных вектора некоторой плоскости, то любой третий вектор а той же плоскости можно единственным обра- зом разложить по ним, т. е. представить в виде а. = хе\-\-уег. Теорема 3.4. Три вектора а, Ь, с линейно зависимы тогда и только тогда, когда они компланарны. Теорема 3.5. Если векторы еь е2, ез некомпланарны, то любой вектор а можно единственным образом разложить по ним, т. е. a=xei +уе2 + ге3. Теорема 3.6. Всякие четыре вектора линейно зависимы. Любая упорядоченная система трех линейно независимых (т. е. некомпла- нарных) векторов а, Ь, с называется базисом. Согласно теореме 3.5, всякий вектор d можно разложить по базису, т. е. представить в виде d = xa+t/b + zc. (3.39) Числа х, у, г называют координатами вектора d в базисе а, Ь, с. Пример 3.11. Образуют ли базис векторы а=(8,2,3), b = (4,6, 10), с=(3, — 2, 1)? Так как 8 2 3 — 1 8 3 abc= 4 6 10 = -26 26 10 3 — 2 1 0 0 1 -26 26 0 26 т. е. смешанное произведение векторов отлично от нуля, то векторы некомпланарны. Значит, они линейно независимы и образуют базис. Пример 3.12. Даны векторы а = (1, 1, — 1), b = (2, — 1,3), с = (1, — 2, 1), d= (12, —9, 11). Доказать, что векторы а, Ь, с образуют базис и найти коорди- наты вектора d в этом базисе. Поскольку abc = 1 1-1 2-1 3 1 —2 1 О 0-1 5 2 3 2-1 1 2 — 1 = 9#=0, то векторы а, Ь, с линейно независимы (некомпланарны) и образуют базис. Вектор d можно представить в виде d =ха +j/b + гс (см. формулу (3.39)). Это равенство равносильно следующим равенствам: 12 = x + 2i/ + z, — 9 = х—у — 2z, 11 = — x + 3y + z, так как равные векторы имеют равные координаты и координаты линейной коор- динации векторов равны соответствующим линейным комбинациям одноименных координат (см. п. 3.5). Решив полученную систему уравнений, найдем х = 2, у = = 3, г = 4. Итак, d = 2a-f-3b + 4c, вектор d в данном базисе имеет координаты х = 2, у = 3, г = 4. 58
3.11. Аффинные координаты Фиксируем некоторую точку О заданной плоскости и выберем два неколлинеарных вектора е,, ег, назовем эту точку началом координат, векторы еь е2 — базисными. От точки О отложим векторы OEi=e, и ОЕг = е2, проведем прямые, которым принадлежат векторы OEi и ОЕг, фиксируем на них положитель- ные направления, совпадающие с направлениями ОЕ\ и О£г соответственно, получим две координатные оси Ох и Оу (рис. 3.15). Будем говорить, что построена общая декартова или аффинная система коор- динат (О; ei, е2). Пусть а — любой вектор данной плоскости, отложим из точки О вектор ОА = а, тогда по теореме 3.3 ai=xei + i/e2. (3.40) Числа х и у формулы (3.40) называются общими декартовыми или аффинными координа- тами вектора а в системе (О; ei, е2), они называ- ются также аффинными координатами точки А в той же системе, т. е. а= (х, у), А(х,у). Так как OAi=xei, OA2 = f/e2, то х и у—величины направленных отрезков ОА| и ОА2 координатных осей, |х| — длина отрезка ОА\, измеренная с помощью масштабного отрезка ОЕ\, lyl — длина отрезка ОАг, измеренная с помощью масштабного отрезка ОЕ2. Другими словами, аффинными координатами точки А (и вектора а = ОА) называются числа х и у, определяемые формулами х = ОА|, у = ОА2, где ОА|, ОА2 — величины направленных отрезков OAi и ОА2 координатных осей (Л, — проекция точки А на ось Ох, взятая параллельно оси Оу, А2 — проекция точки А на ось Оу, взятая параллельно оси Ох; длины отрезков на каждой оси измеряются с помощью своего масштабного отрезка). Аналогично вводится аффинная система координат в пространстве. Фикси- руем начало координат — точку О, базис — три некомпланарных вектора ei, С2, ез, отложим из точки О векторы OEi =ei, ОЕ2 = е2, ОЕз = ез, координатные оси Ох, Оу, Oz. Если а — любой вектор, то, отложив из точки О вектор ОА = а, по теореме 3.5 получим a=xe! + i/e2 + ze3. (3.41) Общими декартовыми или аффинными координатами вектора а (и точки А) называются числа х, у, г в разложении (3.41). Пусть А, — проекция точки А на ось Ох, взятая параллельно координатной плоскости Оуг (определяемой векторами ег, ез), т. е. точка пересечения оси Ох и плоскости, проходящей через точку А и параллельной плоскости Оуг; А2 — проекция точки А на ось Оу, взятая параллельно плоскости Охг; Аэ — проекция точки А на ось Ог, взятая параллельно плоскости Оху, тогда OAi=xei, ОАг = =уе2, ОА3 = ге3. Следовательно, х, у, г — проекции вектора ОА на координатные оси, т. е. величины направленных отрезков ОА|, ОАг, ОАз, длины отрезков на каждой коор- динатной оси измеряются с помощью своего масштабного отрезка (е, — на оси Ох, е2 — на Оу, е3 — на Ог). В частном случае, когда векторы ei, е2, е3 попарно перпендикулярны и имеют равные длины |в|| = |е2| = |е3| = 1, их называют ортами и обозначают через i, j, к, система координат называется прямоугольной. Термин «орт» ввел О. Хевисайд (1892), обозначения ei,e2, е3— Г. Грассман (1844), i, j, к — У. Гамильтон (1853).
Глава 4 ПОВЕРХНОСТИ И ЛИНИИ В ПРОСТРАНСТВЕ 4.1. Уравнение поверхности. Уравнения линии в пространстве Уравнением поверхности в фиксированной системе координат называется такое уравнение с тремя переменными, которому удовлетворяют координаты любой точки данной поверхности и только они. Из этого определения вытекает способ решения следующей простой задачи: выяснить, лежит ли данная точка на поверхности, определяемой заданным уравнением. Для решения задачи необходимо подставить ее координаты в данное уравнение, если получается числовое равенство, то точка лежит на поверхности, в противном случае точка поверхности не принадлежит. Всякое уравнение с тремя переменными х, у, г можно записать так: f(x,j/,z)=0, (4.1) где F (х, у, г) — функция переменных х, у, г. Из определения прямоугольных декартовых координат точки в пространстве (см. п. 1.12) следует, что координатные плоскости Oyz, Oxz, Оху определяются соответственно уравнениями: х = 0, у = 0, z = 0 (х — 0 — уравнение плоскости Oyz и т. д.). Линию в пространстве можно рассматривать как пересечение двух поверх- ностей, поэтому она определяется двумя уравнениями. Пусть / — линия, по которой пересекаются поверхности, определяемые уравнениями F(x, у, z)=0 и Ф(х, у, z)=0, т. е. множество общих точек этих поверхностей, тогда коорди- наты любой точки линии / одновременно удовлетворяют обоим уравнениям: F(x, у, z)=0, Ф(х, у, z)=0. (4.2) Пример 4.1. Составить уравнение сферы радиуса R с центром в точке С(а, Ь, с). Исходя из определения сферы как множества точек пространства, равно- удаленных от данной точки (центра), для произвольной ее точки М(х,у,г) получаем р(С, M)=R. Так как р(С, М) = V(х—а)2+(</ — *) 2 + (z —с)2, то V(х —а)2+ ({/ —й)2+ (z—с)2 = R, ИЛИ (x-a)2+(y-b)2+(z-c)2 = R2. (4.3) Для точки У, не лежащей на данной сфере, равенотво р(С, N) =R не будет выполнено, поэтому ее координаты не удовлетворяют уравнению (4.3). Следо- вательно, уравнение (4.3) является уравнением сферы радиуса R с центром в точке С (а, Ь, с). В частном случае, когда центр сферы находится в начале координат (а = 6 = с = 0), уравнение (4.3) принимает вид х2 + У2 + z2 = R2. (4.4) Уравнение (4.4) называется каноническим уравнением сферы. 60
Пример 4.2. Уравнения x2 + y2 + z2 = 25, z = 0 определяют окружность радиуса R = 5, лежащую в плоскости Оху. Действи- тельно, первое уравнение определяет сферу радиуса /? = 5 с центром в начале координат, второе уравнение — координатную плоскость Оху. Пример 4.3. Ось Ох прямоугольной декартовой системы координат в прост- ранстве определяется уравнениями у = 0, 2 = 0. Действительно, уравнение у — 0 определяет координатную плоскость Oxz, а уравнение z = 0— координатную плоскость Оху. Ось Ох является линией пересечения координатных плоскостей Oxz и Оху (см. рис. 1.13). Отметим, что ось Оу имеет уравнения х = 0, 2 = 0, а ось Ог— уравнения х = 0, у = 0. Поверхность, определяемая алгебраическим уравнением n-й степени относи- тельно декартовых координат, называется поверхностью n-го порядка. Сфера — поверхность второго порядка, так как ее уравнение (см. (4.3) и (4.4)) является уравнением второй степени относительно декартовых координат. 4.2. Параметрические уравнения линии и поверхности Параметрическими уравнениями линии в пространстве называются уравнения вида x = <pi(/), г/ = Ч>2(0, 2=фз(0, (4.5) где <pi(0, ф2(0, ч>з(О—функции некоторой переменной t (параметра), если при каждом значении t из конечного или бесконечного промежутка они дают координаты всех точек данной линии « только таких точек. Параметрические уравнения часто применяются в механике для описания траектории движущейся точки, роль параметра t в таких случаях играет время. Параметрическими уравнениями поверхности называются уравнения вида x=fi(u,v), y = f2(u,v), z — f3(u,v), (4.6) где fi(u, v), f2(u, v), f3(u, v) — функции двух переменных и и v (параметров), если при любых значениях и и v (меняющихся в некоторой области) они дают координаты всех точек данной поверхности и только таких точек. Правые части уравнений (4.6) содержат два параметра, а уравнения (4.5) — только один параметр. Пример 4.4. Составить параметрические уравнения винтовой линии. Винтовой называется линия, описываемая точкой, равномерно движущейся по образующей кругового цилиндра, который при этом вращается вокруг своей оси с постоянной угловой скоростью. Выберем ось вращения цилиндра в качестве оси Ог декартовой прямо- угольной системы координат в пространстве (рис. 4.1). Обозначим через v постоянную скорость прямолинейного движения точки вдоль образующей, w — скорость вращательного движения, R — радиус цилиндра. Пусть в началь- ный момент точка находилась на оси Ох (совпадала с точкой Д), а в момент времени / — в положении М. Обозначим буквой W проекцию точки М на плоскость Оху, буквой Р — проекцию точки N на ось Ох, буквой Q — проекцию точки N на ось Оу. Обозначая через <р угол между ОР и ON, получаем x=OP = R cos q>, у = OQ = R sin <p, z = NM = vt. Поскольку (р = <о/, то x = /?cosa>/, y = R sin wt, z = vt. (4.7) Уравнения (4.7) являются параметрическими уравнениями винтовой линии. Пример 4.5. Составить параметрические уравнения сферы радиуса R. Введем в рассмотрение систему декартовых прямоугольных координат с .началом в центре сферы и систему сферических координат с началом в той же 61
точке (рис. 4.2). Пусть Л1— произвольная точка сферы, N — ее проекция на плоскость Оху. Обозначим угол, образуемый вектором ОМ с осью Oz, через и (широта); угол, образуемый вектором ON с осью Ох, через v (долгота). Принимая во внимание определение декартовых координат (или связь между декартовыми и сферическими координатами, см. 1.13, формулы (1.29)), получаем параметрические уравнения сферы x=R sin и cos v, у —К sin и sin v, z = R cos и, (4.8) где О^и^л, 0^а<2л. Исключив из этих уравнений параметры и и v (для чего нужно возвести в квадрат обе части каждого уравнения и почленно сложить), получим уравнение сферы (4.4). 4.3. Различные виды уравнения плоскости Плоскость в пространстве можно задать различными способами (точкой и вектором, перпендикуляром плоскости, тремя точками и т. д), в зависимости от этого рассматривают различные виды ее уравнения. Уравнение плоскости, проходящей через данную точку и перпендикулярной данному вектору. Ненулевой вектор п, перпендикулярный плоскости, называют ее нормальным вектором. Если дана точка Мо(хо, Уо, ?о) и нормальный вектор п= (Л, В, С) плоскости, то ее уравнение имеет вид Л(х — хо)+В(г/ — у0)+С(г — zo)=O. (4.9) В этом уравнении коэффициенты А, В, С являются координатами нормального вектора. Равенство (4.9) выражает необходимое и достаточное условие перпенди- кулярности двух векторов: п=(Л,В, С), М0М= (х — х0, у — Уо, z — Zo), где М(х, у, г) —любая точка плоскости (рис. 4.3). 62
Общее уравнение плоскости. Уравнение первой степени- относительно декар- товых координат Ах -|- By С z D = О, где А, В, С одновременно в нуль не обращаются, т. е. л2+в2+с2*о, (4-10) (4.Н) определяет плоскость в пространстве. Уравнение (4.10) называется общим уравнением плоскости. Отметим частные случаи этого уравнения. Если D = 0, то уравнение (4.10) принимает вид АхА-ВуА- Сг = 0 и определяет плоскость, проходящую через начало координат (рис. 4.4, а; координаты х = у = г = 0 удовлетворяют данному уравне- нию) . Если 0 = 0, то уравнение (4.10) принимает вид AxA-ByA~D = 0 и определяет плоскость, параллельную оси Oz (рис. 4.4, б); нормальный вектор п = = (Л, В, 0) перпендикулярен оси Ог, ибо С=0. Если С = 0, D = 0, то уравнение (4.10) принимает вид АхА-Ву = 0 и определяет плоскость, проходящую через ось Ог (рис. 4.4, в; плоскость параллельна оси Ог и проходит через начало координат; в этом случае А2 А~ В2 =£0 в силу условия (4.11)). Если С = 0, В = 0, то уравнение (4.10) принимает вид Лх + О = 0, или х = а (а= — D/A) и определяет плоскость, параллельную плоскости Oyz или перпендикулярную оси Ох (рис. 4.4, г; нормальный вектор п=(Л,0,0) перпендикулярен плоскости Oyz). Если С = 0, S = 0, 0 = 0, то уравнение (4.10) принимает вид Лх = 0, или х = 0 (так как Л у= 0) и определяет координатную плоскость Oyz. 63
Замечание. Если в уравнении (4.10) свободный член равен нулю (D = 0), то плоскость проходит через начало координат; если коэффициент при одной из текущих координат равен нулю, то плоскость параллельна соответствующей координатной оси (например, если В = 0, то плоскость парал- лельна оси Оу); если в нуль обращаются свободный член и один из коэффи- циентов при текущей координате, то плоскость проходит через соответствующую ось (если 0=0 и С = 0, то плоскость проходит через ось Oz); если равны нулю два коэффициента при текущих координатах, то плоскость параллельна соответствующей координатной плоскости (когда Л=0, В = 0, плоскость парал- лельна плоскости Оху); если обращаются в нуль свободный член и два коэффици- ента при текущих координатах, то плоскость совпадает с соответствующей координатной плоскостью (когда D=0, Л=0, 0 = 0, плоскость совпадает с плоскостью Охг). Уравнение плоскости в отрезках, отсекаемых на осях координат. Если все коэффициенты уравнения (4.10) и его свободный член отличны от нуля, то уравнение можно привести к виду x/a + y/b+z/c=l, (4.12) где а=—D/А, Ь=—D/В, с=—D/С. Числа а, b и с означают величины направленных отрезков, отсекаемых на осях координат. Этим объясняется название данного вида уравнения плоскости. Нормальное уравнение плоскости. Уравнение х cos а -)-у cos р + г cos у — р = 0, (4 13) где а, р, -у — углы, образованные нормальным вектором плоскости с коорди- натными осями Ох, Оу, Ог соответственно, р — длина перпендикуляра, опущен- ного из . начала координат на плоскость, называется нормальным (или нормированным) уравнением плоскости. Чтобы привести общее уравнение плоскости к виду (4.13), необходимо умножить его на нормирующий множитель __________1_________ и ±V»2+s2+c2 ’ где знак выбирается противоположным знаку D. После умножения уравнения (4.10) на число р получаем нормированное уравнение плоскости Ах-)- By-)- Сг-)-Р _q ±лМ2+в2+с2 ~ ' Уравнение плоскости, проходящей через три точки. Если даны три точки Mi (xi, yt, Zi), Мг(х2, у2, Zi), Мз(х3, уз, гз), не лежащие на одной прямой, то уравнение плоскости, проходящей через эти точки, имеет вид х—xi y—yi Xi—Xi yi—yi X3 — X1 Уз — yi Z — Z| Zi — Z| Z3 — Zi = 0. (4.14) Равенство (4.14) выражает необходимое и достаточное условие (см. (3.36)) компланарности трех векторов М,М=(х— xi, у— у\, г — г>), М,М2=(х2— Xi, yi — yi,Zi — zi), М|М3(хз — xlt уз — yi, гз — Zi), где M(x,y,z)—любая точка данной плоскости (рис. 4.5). Уравнение плоскости, проходящей через, две точки и параллельной данному вектору. Если задан вектор a=(ai,a2, аз) и две точки Mi (хь yi, z\), М 2 (х2, уз, Zi), причем векторы а и М|М2 неколлинеарны (рис. 4.6), то уравнение плоскости, проходящей через эту точку параллельно вектору а, имеет вид х — xi y — yi Z — Zi Х2 — Х1 У2 — У1 Zi— Zi Q,\ U2 a3 =0. (4.15) 64
Равенство (4.15) выражает необходимое и достаточное условие компланар- ности трех векторов М>М = (х—хь y—yi, z — zt)t MiM2= (х2—хь у2—yt, z2—zi), a= (a,, a2, a3), где M(x, y, z) — любая точка данной плоскости. Уравнение плоскости, проходящей через данную точку и параллельной двум неколлинеарным векторам. Если даны два неколлинеарных вектора (рис. 4.7) а= (а,, а2, аз), b= (bi, b2, Ь3) и точка Mi(xj, yi,zi), то уравнение плоскости, проходящей через данную точку параллельно векторам а и Ь, имеет вид X —X| y — yi О| о2 bi b2 Z — Zl а3 Ь3 (4-16) Равенство (4.16) выражает необходимое и достаточное условие компланар- ности трех векторов: а, Ь, М,М, где М — произвольная точка данной плоскости. Параметрические уравнения плоскости. Если даны два неколлннеарных вектора а= (ai, а2, a3), b= (bi, b2, Ь3) и точка Mi (Xi, yt, zi), то параметрические уравнения плоскости, проходящей через эту точку параллельно данным векторам, имеют вид x=xi + uai + o6i, у — у^иаг+иЬг, z=zt+ ua3-(-vb3. (4.17) Уравнения (4.17) следуют из равенства М,М=иа-|-оЬ, где М(х, у, z)— любая точка плоскости (равенство MiM=ua-|-ub означает, что любой вектор М|М можно разложить по векторам а и Ь). Пример 4.6. Записать уравнение плоскости, проходящей через точку Мо(2, —3,4) и имеющей нормальный вектор п = (5, 6, — 7). Так как в данном случае х0 = 2, уо= — 3, z0 = 4, А=5, В =6, С——7, то уравнение (4.9) принимает вид 5(х—2)+6(у + 3) —7(z —4) =0, или 5х4-6у—7z + 36=0. Пример 4.7. Составить уравнение плоскости, проходящей через точку М|(1, —3,2) параллельно векторам а=(5, —4,8), Ь=(6, —1,7). Данные векторы неколлинеарны, так как их координаты не пропорциональны- В соответствии с уравнением (4.16) получаем 65
— 20(х — 1) + 13({/ + 3) + 19(г — 2) =0, 20х-I3i/— 19z —21 =0. Пример 4.8. Найти величины отрезков, отсекаемых на осях координат плоскостью Зх—4t/+5z—60=0. Разделив обе части уравнения на 60 и преобразовав его, получим х у z х и г 20 ~ТГ + ТГ = 1’ или 10 +-Лб +'12’==1' Сравнивая последнее уравнение с уравнением а = 20, Ь= —15, с =12. Таковы величины отрезков, соответственно на осях Ох, Оу, Oz. Пример 4.9. Составить уравнение плоскости, точки 51,(9, —11, 5), Af2(7, 4, —2), 513(—7, 13, —3). (4.12), заключаем, что отсекаемых плоскостью проходящей через три В соответствии с уравнением (4.14) получаем х—9 {/+11 г —5 х —9 {/+11 г —5 7-9 4+11 -2-5 =0, —2 15 -7 7 — 9 13+11 — 3 — 5 —16 24 — 8 х —9 {/+11 z —5 х —9 {/ + 11 г —5 = 8 —2 15 -7 =0, —2 15 —7 -2 3 -1 —2 3 -1 з ~7, |-<«+">| -22 |+ь-5>|+ = 0, 6(х —9) + 12({/+11)+24(z —5) =0, (х-9) + 2(t/ +11) + 4(z-5) =0, х + 2у + 4г — 7 = 0. 4.4. Различные виды уравнений прямой в пространстве Прямую в пространстве можно задать различными способами (точкой и вектором, параллельным ей; двумя точками и т.п.), в связи с чем рассматривают различные виды ее уравнений. Векторно-параметрическое уравнение прямой. Направляющим вектором прямой называется любой ненулевой вектор, параллельный ей. Если даны точка Л4о(хо, Уо, Zo) и направляющий вектор а= (а,, а2, а3) прямой (рис. 4.8), то г = Го + а/, (4.18) где г = ОМ — радиус-вектор Мо(хо, Уо, Zo), / — переменная точки М(х, у, z), го = ОМо — радиус-вектор точки величина (параметр). Уравнение (4.18) называ- ется векторно-параметрическим уравнением пря- мой, проходящей через точку Л4о и имеющей направляющий вектор а. Равенство (4.18) следует из определения суммы векторов и необходимого и достаточного условия коллинеарности двух векторов. Параметрические уравнения прямой. Перехо- дя от векторного соотношения (4.18) к коорди- натным, получаем x = xo + ait, y = y0 + a2t, z = z0 + a3t. (4.19) Эти уравнения называются параметрическими уравнениями прямой, проходящей через точку Mo(xo,yo,Zo) и имеющей направляющий вектор а= (а,, аг, а3). 66
Канонические уравнения прямой. Выражая параметр t из уравнений (4.19) и приравнивая полученные выражения, находим, что х — ха = У~Уо = г —г0 А| Аг A3 Уравнения (4.20) называются каноническими уравнениями прямой, прохо- дящей через точку Л1о(хо, уо, г0) и имеющей направляющий вектор а= (аь а2, Яз). Уравнения прямой, проходящей через две точки. Если даны две точки Л1| (xi, yt, zt), Л11(х2, У2, z«), то в качестве ее направляющего вектора можно взять вектор М,Мг = (х2— Xi, У2 — у>, z2 — Zi), поэтому уравнения (4.20) примут вид х~х' = У-У' = (4 21) Х2 —Х| У2 — yi z2 —Z1 Пример 4.10. Записать параметрические и канонические уравнения пря- мой, проходящей через точку Л4о(7, —9,8) параллельно вектору а=(4, 3, —2). Так как в данном случае Хо = 7, уо=—9, Zo = 8, а, =4, а2 = 3, аз=—2, параметрические уравнения (4.19) принимают вид х = 7 + 4/, У= — 9+31, z = 8 —21, а канонические уравнения (4.20) запишутся так: х — 7 t/-|-9 z —8 ~4 3 ^2~' Прим ер 4.11. Составить уравнения прямой, проходящей через точки Л41 (6, —5,4), Л12(8, —7,9). Привести эти уравнения к параметрическому виду. Поскольку xi=6, У\ = — 5, zi = 4, х2 = 8, </2= — 7, z2 = 9, то уравнения (4.21) примут вид х — 6 t/H-5 z —4 .. х — 6 у + 5 z —4 “8^+Г — -7 + 5 — ’ ИЛИ ~ ~—2 ~5~ ’ Обозначая равные отношения буквой 1, получаем параметрические уравнения данной прямой: х = 6 + 21, у-——5 — 21, z = 4 + 51. 4.5. Задачи, относящиеся к плоскостям Взаимное расположение двух плоскостей. Даны две плоскости 4lx+BIJ/+C1z + D,=0, (4.22) А 2х+ В2У + C2z + D2 = 0. (4-23) Необходимое и достаточное условие параллельности этих плоскостей выражается равенствами Al = A. = (4.24) л, В, С. ’ а их совпадения — равенствами Al = Al = Al = Al (4 25) л, В, Cl £>, • Другими словами, плоскости параллельны тогда и только тогда, когда пропорциональны их коэффициенты при текущих координатах; например, плоскости x + 2t/ — 3z —1=0, Зх + 61/— 9z + 7 = 0 параллельны. Плоскости 67
совпадают тогда и только тогда, когда пропорциональна коэффициенты при текущих координатах и свободные члены; например, плоскости 2х—3y-|-z—4 = 0, 4х—6y-f-2z—8=0 совпадают. . Если условие (4.24) не выполняется, то плоскости (4.22) и (4.23) пересекаются. Угол между двумя плоскостями. Косинус угла между плоскостями (4.22) и (4.23) определяется формулой cos <f> = — -—-— ——. (4.26) т/л-'+в’+с? Необходимое и достаточное условие перпендикулярности плоскостей (4.22) и (4.23) выражается равенством AiA2 + B,B2 + C,C2=0. (4.27) Расстояние от точки до плоскости. Расстояние от точки Afo(xo, уо, z<>) до плоскости Ax-t-By + Cz-}-D = 0 вычисляется по формуле d Mxo + flyo + Czo+OI (4 28) л/Л2+В2+С4 Пример 4.12. Составить уравнение плоскости, проходящей через точку Л40(2, 3, —5) и параллельной плоскости х—2y + 4z— 1=0. Это уравнение будем искать в виде х — 2y-|-4z 4-0 = 0, где О — неизвестный свободный член (в формуле (4.24) полагаем отношение равным единице). Так как плоскость проходит через точку Мо, то ее координаты должны удовлетво- рять последнему уравнению: 2 — 2-34-4-( —5)4~О = 0, 2—6-204-0=0, 0 = 24. Следовательно, х—2y4-4z-|-24=0— искомое уравнение. Пример 4.13. Найти угол между двумя плоскостями Их — 8у — 7z4-6 = 0; 4х— 10</-|-z—5=0. Косинус угла найдем по формуле (4.26), подставив в нее значения Л1 = 11, В| = — 8, С,= — 7, Л2 = 4, В2= — 10, С2=1: cos ф 11.44-(-8)(-10)4-(-7)-1 = 444-80-7 л/Ч84-(—8)24-(— 7)2д/424- (—10)24-12 V234VH7 Пример 4.14. Вычислить расстояние от точки Af0(4,3,6) до плоскости 2х—у—2z—8=0. Подставив в формулу (4.28) значения х0 = 4, у0=3, z0=6, 4 = 2, В= — 1, С=—2, О = —8, получим 12-4-3-2-6-81 |-15| “= ---- — = ----5-- = 5. т/24 4-(-1)2-|-(-2)2 3 Пример 4.15. Найти расстояние между параллельными плоскостями х-|-2у—2z—1=0, х-|-2у — 2z4-5 = 0. Это расстояние равно расстоянию любой точки одной плоскости до другой. Выберем на первой плоскости произвольную точку. Приняв, например, что Уо=1, Zo = l, из уравнения х-)-2у—2z —1=0 найдем х0=1. По формуле (4.28) находим расстояние от точки Af0(l, 1, 1) до плоскости х-|-2у—2z-|-5=0: d= 114-2-24-51 = 6 =2 т/124-224-(—2)2 3 68
4.6. Задачи, относящиеся к прямым в пространстве Угол между двумя прямыми — угол между направляющими векторами этих прямых. Косинус угла между двумя прямыми x=xi+ait, y=yi + a2t, z=zi+ait; (4-29) x=x2-f-bif, y=y2+b2t, z = z2 + b3t (4.30) определяется формулой cos ф = • (4-31) lallbl . ^+а1 + аШ + Ы+Ы Равенство a,6i+а2/>24-азйз = 0 выражает необходимое и достаточное условие перпендикулярности прямых (4.29), (4.30). Необходимое и достаточное условие параллельности этих прямых выражается равенствами bi = aai, b2 = aa2, Ьз = ааз, или . b\/a\=b2/a2 = b3/a3. (4-32) Взаимное расположение двух прямых в пространстве. Для исследования взаимного расположения прямых (4.29) и (4.30) рассматривается смешанное произведение трех векторов а= (а,, а2, ав), b= (bi, bi, Ьз), М,М2 = (х2—х\, y2—yi, z2—zt). Если abM|M2^0, т. е. О1 а2 а3 ь. Ь2 6з х2 — Х| У1-У1 Z2 — Zl =54=0, (4.33) то прямые являются скрещивающимися. Неравенство (4.33) означает, что векторы а, Ь, М|М2 некомпланарны. Прямые (4.29) и (4.30) лежат в одной плоскости тогда и только тогда, когда аЬМ1М2=0, т.е. ai а2 аз b, b2 Ьз = 0. Х2 — Х1 у2 — у, z2 — z. (4.34) Эти прямые пересекаются, если первые две строки определителя не пропор- циональны, т.е. не выполнено условие (4.32). Прямые параллельны, когда Рис. 4.10 69
первые две строки определителя пропорциональны. Прямые совпадают, если пропорциональны все строки определителя (4.34). Замечание. Чтобы найти точку пересечения прямых (4.29) и (4.30), необходимо решить систему их уравнений; при этом целесообразно параметры обозначить различными буквами (так как одна и та же точка пересечения прямых получается, как правило, при различных значениях параметра в урав- нениях данных прямых). Расстояние от точки до прямой. Расстояние от точки Л1о(*о, Уо, £о) до прямой (4.29) вычисляется по формуле ._ I [(Г1—го), а] I .. где го и г,—радиусы-векторы точек Мо и Afi, а — направляющий вектор прямой (рис. 4.9). Расстояние между двумя прямыми. Кратчайшее расстояние между двумя прямыми (4.29) и (4.30) определяется формулой I (г2 — г,)аЫ I [a, b] I (4.36) где Г1, Гз — радиусы-векторы точек М\, Мг\ а, Ь — направляющие векторы данных прямых (рис. 4.10). Пример 4.16. Найти угол между двумя прямыми х=3 + 2/, z/ = 44-7/, z=-54 8/; x = 24-8/, у = 6- 11/, z=—8-7/. Первая прямая имеет направляющий вектор а= (2,7,8), вторая — Ь=(8, — И, —7). По формуле (4.31) находим 2.8+7-(-11)+8-(-7) _ -117________1 V224-754-8s л/82+(-Н)2+(-7)2 7Й7л/234 у/2 ' Следовательно, <р= 135°. Пример 4.17. Доказать, что прямые х = 74-5/, у— — 5 — 7/, z=—2 —3/ и х = /, y = t, z ——34-2/ пересекаются. Найти точку их пересечения. Рассмотрим векторы М1М2= (0 —7, 0—(— 5), — 3—(— 2)) = (—7, 5, — 1), а= (5, —7, —3), Ь=(1, 1,2) и их смешанное произведение abMiM2 = 5 —7 1 1 — 7 5 -3 2 — 1 5-12 -13 1 0 0 7 12 13 Поскольку смешанное произведение трех векторов равно нулю, то векторы компланарны; значит, данные прямые лежат в одной плоскости. Так как направляющие векторы а и Ь этих прямых неколлинеарны (их координаты не пропорциональны), то прямые пересекаются. Чтобы найти точку пересечения, приравняем выражения для координат, предварительно обозначив параметр буквой s в уравнениях второй прямой: 74-5/ = s, — 5 — 7t=s, —2 —3/=—34-2s. Из первых двух уравнений следует, что 7-|-5/= — 5 — 7/, откуда /= — 1; следо- вательно, s = 2. При этих значениях /из третье уравнение обращается в тождество. Подставляя значение /= — 1 в уравнения первой прямой (или s=2 в уравнения второй прямой x = s, y = s, z=—34-2s), находим x = 2, у—2, z=l. Итак, Л! (2, 2, 1) — точка пересечения данных прямых. Пример 4.18. Найти расстояние от точки Л40(2, — 3, 5) до прямой: ^=54-2/, у=—4 —/, z = 6 —2/. Найдем сначала векторное произведение, входящее в формулу (4.35): г,— го = МоМ| = (5 — 2, —4—( —3), 6 —5) = (3, —1, 1), а= (2, —1, —2), 70
[(Г|-Го), а] = -1 1113 11 13-1 -1 —2 | ’ | 2 -2 | ’ | 2 -1 — (3, 8, -1). По формуле (4.35) получаем d= л/зЧ82+(-1)2 -\/22+(— 1 )24-(— 2)2 /74 3 4.7. Задачи на прямую и плоскость Прямая как линия пересечения двух плоскостей. Рассмотрим две плоскости, заданные общими уравнениями (4.22) и (4.23). Если условие (4.24) не выполнено (т. е. коэффициенты А>, Bi, С, не пропорциональны коэффициен- там As, Bs, Cs), то плоскости пересекаются по прямой, определяемой уравнениями A iX-f-Вiy + CiZ *4“ Di = 0, AsX-|-Вгу-|- CsZ-|-Ds—0. (4.37) Эти уравнения приводятся к параметрическому виду х = хо + В, Ci I Bs Cs | t,y = yo — IЛ, c, | As Cs t, Z = Zo + A, B, As Bs t. (4.38) Данная прямая имеет направляющий вектор a=[n,,n2l = qB2 С, ] _ I A, C, Cs I I As Cs I M, Bl Г I As Bs (4.39) где П| = (Л1, Bi, Ci), п2=(Л2, Bs, Cs) — нормальные векторы данных плоскостей. Точка Мо(хо, уо, zr>) на прямой может быть выбрана произвольно; для этого необходимо в системе (4.37) зафиксировать значение одной переменной (например, z = z0), из полученной системы уравнений найти значения двух других переменных (х=Хо, у=у0). Пучок плоскостей — множество всех плоскостей, проходящих через одну и ту же прямую. Уравнение пучка плоскостей, проходящих через прямую (4.37), имеет вид а(Л1Х-|-В|//4"С|г-|-В1) -|-р (Л2х + Bsy-\~ Csz~j~Ds) — О, где аир — любые действительные числа, причем хотя бы одно из них отлично от нуля. Это уравнение можно привести к виду >lix4-S|i/4-Ciz4-D + %(42x-|-B2i/+C2z4-£>2)=0, (4.40) где Х = р/а, а=#0. Уравнение (4.40) определяет все плоскости пучка, за исключением той, которой соответствует а = 0, т.е. за исключением плоскости Л2% + Bsy-\- Csz + О2 = 0. Угол между прямой и плоскостью. Синус угла между прямой x = Xo + ait, y=yo + dst, z = Zo + ast (4.41) и плоскостью Ax + By+Cz + D = 0 (4.42) определяется формулой I Aai + Ва2 + Саз | sin <р = — ---- —. (4.43) д/Л2 + В2+ С* у/а2 + а2 + аз 71
Взаимное расположение прямой и плоскости. Прямая (4.41) и плоскость (4.42) пересекаются, если Aui -|- В02Сиз =5^ 0; (4.44) перпендикулярны, когда Л В С /44Е\ ----=------=------; (4.45) а\ параллельны, если AU] -|-Ви? -р Сиз = 0, 02 U3 Axo~\-Byo~^Czo^D^=0‘, (4.46) совпадают, когда Aui -j-Ви? 4“ Сиз= 0, Ахо4~ Byo4~ Czo4~ D—0. (4.47) Координаты точки пересечения прямой (4.41) и плоскости (4.42) находятся из системы их уравнений. Неравенство (4.44) означает, что нормальный вектор п= (4, В, С) плоскости (4.42) и направляющий вектор а=(а|,аг, аз) прямой (4.41) не перпендику- лярны, т. е. прямая и плоскость не параллельны. Равенства (4.45) означают, что векторы п и а коллинеарны, т. е. прямая (4.41) и плоскость (4.42) перпендикулярны. Соотношения (4.46) показывают, что векторы п и а перпендикулярны, т. е. прямая и плоскость параллельны, но точка Мо(хо, Уо, го) прямой (4.41) не принадлежит плоскости (4.42). Равенства (4.47) означают, что векторы п и а перпендикулярны и точка Мо (%о, уо, г0) прямой принадлежит плоскости (прямая лежит в плоскости) . Пример 4.19. Уравнения прямой x-f-2y+4z — 7=0, 2х+у—z — 5 = 0 при- вести к параметрическому виду. Поскольку в этих уравнениях коэффициенты при текущих координатах непропорциональны, то плоскости, определяемые данными уравнениями, пере- секаются. Данные уравнения определяют прямую. Выберем на прямой точку. Полагая в этих уравнениях, например, го = 2, получаем x+2i/= — 1, 2x + i/=7, откуда %о = 5, уо = — 3. На прямой зафиксирована точка Л+(5, —3, 2). По формуле (4.39) найдем направляющий вектор прямой. Так как П| = (1, 2, 4), п2 = (2, 1, — 1), то г 1 /I2 41 11 4 I I 1 2 |\ . . . .. а=[п1,п2]=^|1 _1|,- |2 -J-lg j |) =(-6,9, -3). Параметрические уравнения (4.38) данной прямой принимают вид х = 5 —61, у= —3 + 91, z = 2 —31. Замечание. В качестве направляющего вектора можно взять 1 -д-а= ( — 2, 3, — 1), тогда х = 5 —21, у — — 3 + 31, z = 2 —1. Пример 4.20. Найти угол между прямой х— — 3 — t, y = 5 — t, z= — 4+21 и плоскостью 2х — 4i/ + 2z — 9 = 0 Применяя формулу (4.43) для случая а, = — 1, а2= —1, а3=2, А =2, В=—4, С = 2, находим sin <р =______-- = _Л_ = 1 , <^30°. л/22+(-4)2 + 22 V(- 1)2+ (-1)2 + 22 ^24 2 Пример 4.21. Найти проекцию точки Л4(1,—2,4) на плоскость 5х —3i/+6z + 35 = 0. Этой проекцией является точка пересечения перпендикуляра к плоскости, 72
проходящей через точку М. Для прямой, перпендикулярной плоскости, направ- ляющим вектором будет п=(5, — 3,6). Параметрические уравнения прямой, перпендикулярной плоскости и проходящей через точку М, примут вид х = 1 +5/, у= — 2—3t, г = 4+6/. Подставляя эти выражения в уравнение плоскости, находим: 5(1+5/)—3( — 2-3/)+6(4 + 6/)+35 = 0, 70/+70 = 0, /=-1. При этом значении / из уравнений прямой получаем: х=1—5=—4, (/=—2 + 3=1, 2 = 4 —6=—2. Следовательно, точка А( — 4, 1, —2) —искомая проекция. Пример 4.22. Вершины пирамиды находятся в точках 4,(4,6,5), Д2(6,9,4), А3(2, 10, 10), А4(7,5,9). Найти: 1) длину ребра AiA2; 2) угол между ребрами A,A2 и A|A3; 3) площадь грани А1А2Аз; 4) объем пирамиды А|А2АзА4; 5) уравнение плоскости A|A2A3; 6) уравнения прямой AtA3; 7) угол между ребром -4i+ и гранью AiAzA3; 8) уравнения высоты, опущенной из вершины Д4 на грань А|А2Аз. Найдем сначала координаты векторов AiA2, А,Аз, AiA4 и координаты векторного произведения [AiA2, А1А3]. По формуле (3.15) получаем А,А2=(6 — 4, 9 — 6, 4 — 5) = (2, 3, - 1); A,A3= (2 —4, 10-6, 10-5) = (-2, 4, 5); А,А4=(7 — 4,5-6, 9 —5) = (3, —1,4). С помощью формулы (3.26) находим | I -г 4 I) -<>’ -’ |4> 1. Длина ребра A,A2 равна расстоянию между точками А, и Д2, которое вычислим по формуле (1.26): Р(Д1,А2)=л/(6-4)2+(9-6)2+ (4 —5)2 =V14«3,74. Тот же результат можно получить, найдя модуль вектора А|А2 по формуле (3.11). 2. Угол между ребрами AiA2 и А|А3 равен углу <р между векторами А,А2 = а, А1А3 = Ь. В соответствии с формулой (3.22) получаем ab_____________2(-2) +3-4- 1 -5____________ 3 _ 1 l||b| V22 + 32+ (- 1 )2 д/(-2)5 + 42 + 52 Зд/70 ^70 ' cos <р«0,1195, ф«83°ЗГ. 3. Площадь грани А|А2Аз равна площади треугольника A|A2A3, которую вычислим по формуле (3.29), использовав формулу (3.11) для модуля вектора и координаты вектора [А,А2, А|Аз]: S= 4-1 [А(А2, А.Аз] I = 4"л/192+(— 8)2+ 142 =^~ , S* 12,46. 4. Объем пирамиды А|А2АзА4 найдем по формуле (3.35): „ 1 V= -г-mod о 6-4 2-4 7-4 9-6 10-6 5-6 4-5 10-5 9-5 = -г— mod о 3 4 -1 121 6 -«т- 2 — 2 3 5 4 5. Уравнение плоскости А,А3А3 как плоскости, проходящей через три точки (см. (4.14)), принимает вид х — 4 6-4 У —6 9-6 2 — 5 4-5 = 0, х —4 2 У —6 3 2-5 — 1 = 0, 2-4 10-6 10-5 — 2 4 5 73
19(х —4) —8(t/ —6) + 14(z —5) =0, 19х — Ъу+ 14г — 98 = 0. (1) 6. Уравнения прямой AtAt как прямой, проходящей через две точки (см. (4.21)), запишутся так: х— 4 у — 6 г— 5 х— 4 у —6 г —5 7 — 4 = 5-6 = 9—5 ’ “’3 — -1 ~ 4 ’ или х=4+3/, у = 6 — /, г = 5 + 4/. (11) 7. Угол между ребром AtAt и гранью Л|Л2Лз равен углу <₽ между плоскос- стью (I) и прямой (II). По формуле (4.43) находим 119-3 —8-(—1) + 14-41 121 sin <р= — — --- _ — —-------, x/TW ( -8)2 + 147 х/32+(-1)2 + 42 л/621 д/26 sin <р яг 0,9522, <р«72°13'. 8. Уравнения высоты, опущенной из вершины At на грань А1А3А3, можно записать как уравнения прямой, проходящей через точку At и перпендикулярной плоскости (I), имеющей нормальный вектор п= (19, — 8, 14), который для этой прямой будет направляющим вектором. Уравнения (4.19) в данном случае принимают вид х = 7+ 19/, у = 5 — 8/, 2 = 9+14/. 4.8. Цилиндрические поверхности. Поверхности вращения Цилиндрической называется поверхность, описываемая прямой (обра- зующей), движущейся вдоль некоторой линии (направляющей) и остающейся параллельной исходному направлению (рис. 4.11). Уравнение цилиндрической поверхности, образующие которой параллельны оси Ог, имеет вид F(x, у} =0. (4.48) Особенность уравнения (4.48) состоит в том, что оно не содержит переменной г. Если уравнение F(y, z)=0 определяет некоторую поверхность, то ею является цилиндрическая поверхность с образующей, параллельной оси Ох. Если уравнение F(x,z)=0 определяет некоторую поверхность, то ею является цилиндрическая поверхность с образующей, параллельной оси Оу. Поверхность, образованная вращением линии / 74
вокруг оси Ог (рис. 4.12), определяется уравнением х^ЧШчМ (4.50) Поверхность, образованная вращением линии x=fi[y], z = f2(y) вокруг оси Оу, имеет уравнение x2-j-г2 — f2(y) + f%(y). Поверхность, образованная вращением линии p==qpi(jc;, z = ip2(x) вокруг оси Ох, определяется уравнением г/2 + z2 = (х) ср2 (х)- Поверхностью вращения второго порядка называется поверхность, полу- ченная вращением линии второго порядка вокруг ее оси. Эллипсоидом вращения называется поверхность, полученная вращением эллипса вокруг опной из его осей. Уравнение эллипсоида вращения, полученного вращением эллипса у2/Ь2 -\-г2 ] с2 = 1, х = 0 вокруг оси Ог, имеет вид х2/62 + + y2/*2 + z2/c2=l. Однополостным гиперболоидом вращения называется поверхность, полученная вращением гиперболы вокруг ее мнимой оси. Однополостный гиперболоид вращения, полученный вращением гиперболы у21b2 — г2/с2 — 1, х=0 вокруг оси Ог, имеет уравнение ^2/62+i/762-z7c2=i. Двуполостным гиперболоидом вращения называется поверхность, получен- ная вращением гиперболы вокруг ее действительной оси. Двуполостный гиперболоид, полученный вращением гиперболы z2/c2—у21Ь2=\, х=0 вокруг оси Ог, определяется уравнением х21Ь2^у21Ь2-г21с2=-\. Параболоидом вращения называется поверхность, полученная вращением параболы вокруг ее оси. Уравнение параболоида вращения, полученного вращением параболы i/2 = 2pz, х = 0 вокруг оси Ог, имеет уравнение Пример 4.23. Составить уравнение поверхности, полученной вращением линии х2/а2 —z2/c2 = 0, у = 0 вокруг оси Ог. Данные уравнения определяют пару пересекающихся прямых в плоскости Охг, проходящих через начало координат (являющихся пересечением плос- костей x/a — z/c — Q, х/а-\-г/с — 0 с плоскостью Oxz). Приведем эти уравнения к виду (4.49): х= ± (а/с)г, у=О. В соответствии с уравнением (4.50) получаем Последнее уравнение является уравнением конуса вращения, получающегося при вращении указанных прямых вокруг оси Ог. 4.9. Поверхности второго порядка Поверхностью второго порядка называется поверхность, определяемая алгебраическим уравнением второй степени относительно текущих координат х, у, г. Канонические уравнения поверхностей второго порядка: х2/а2-\-у2/Ь2-\-г2/с2 — 1 (эллипсоид, рис. 4.13); (4.51) х2/а2 + {/2/62 —z2/c2= 1 (однополостный гиперболоид, рис. 4.14); (4.52) 75
х2/а2 + у2/62 —z2/c2 = — 1 (двуполостный гиперболоид, рис. 4.15); (4.53) x2/a2 + (/2/ft2-z2/c2 = 0 (конус, рис. 4.16); (4.54) x2/a2 + z/2/62 = 2z (эллиптический параболоид, рис. 4.17); (4.55) х2/а2 —y2/Z>2 = 2z (гиперболический параболоид, рис. 4.18); (4.56) x2/a2 + {/2/62=l (эллиптический цилиндр, рис. 4.19); (4.57) х2/а2-У7б2=1 (гиперболический цилиндр, рис. 4.20); (.4.58) x2 = 2W (параболический цилиндр, рис. 4.21); (4.59) х2/а2 —iy2/ft2 = 0 (пара пересекающихся плоскостей); (4.60) х2/а2=1 (пара параллельных плоскостей); (4.61) х2 = 0 (пара совпадающих плоскостей); (4.62) Рис. 4.14 Рис. 4.15 76
77
Замечание 1. Уравнение (4.51) при a=b=c—R принимает вид x2 + t/2 + z2 = /?2 (4.63) и определяет сферу радиуса R с центром в начале координат. Общее уравнение второй степени относительно х, у, г может быть приведено к одному из уравнений (4.51) — (4.63) или к одному из следующих уравнений: x2/a2 + i/7ft2 + z2/c2=-l; (4.64) x7a2 + j/7&2 + z7c2 = 0; (4.65) x2/a2 + (/2/62= — 1; (4.66) x2/a2 + {/2/fe2 = O; (4.67) x2/a2= —1. (4.68) Уравнениям (4.64), (4.66) и (4.68) не удовлетворяют координаты ни одной точки пространства; уравнению (4.65) удовлетворяют координаты единст- венной точки 0(0,0,0); уравнению (4.67) удовлетворяют координаты точек, лежащих на прямой х=0, 1/ = 0. Замечание 2. Если уравнение 4х2 + Л</2 + Лг2 + Вх + С^ + Ог + Е = 0 (4.69) (т. е. уравнение, у которого коэффициенты при квадратах координат равны между собой, а коэффициенты при произведениях координат равны нулю) определяет некоторую поверхность, то этой поверхностью является сфера. Уравнение (4.69) в этом случае может быть приведено к виду (x-a)2+(t/-5)2+(z-c)2 = /c. (4.70) Уравнение (4.70) является уравнением сферы радиуса R с центром в точке С (а. Л. с). Прямые, целиком лежащие на некоторой поверхности, называются прямо- линейными образующими данной поверхности. Однополостный гиперболоид (4.52) имеет два семейства прямолинейных образующих: OfH'O ’(07)4'0)- Гиперболический параболоид (4.56) также имеет два семейства прямо- линейных образующих: “OfO “OfO ’(f + fO ’Of) — Пример 4.24. Определить вид и параметры поверхности второго порядка, заданной уравнением 3x24-4i/24-6z2 — 6х-|- 16у — 36z 4-49 = 0. Преобразуем это уравнение, выделив в левой части полные квадраты: 3(х2 — 2x4-1) 4-4(у24-4г/4-4) 4-6(г2 — 6z4-9) — 3— 16-54 4-49 = 0, 3(x-1)24-4(i/4-2)24-6(z-3)2 = 24. Введем новые координаты по формулам (3.17): Х=х-1, Г = {/4-2, Z = z —3, (I) 78
тогда уравнение примет вид 3X2 + 4r2 + 6Z2 = 24, или Х2/8+K2/6 + Z2/4 = 1. Полученное уравнение определяет эллипсоид (см. (4.51)), для которого а = 2-\/2, Ь — с = 2. Центр эллипсоида находится в точке О|(1, —2,3); в новой системе координат центром является точка с координатами Л = 0, У=0, Z = 0. Из этих равенств и формул (I) находим х=1, у=—2, z = 3, т. е. координаты точки О|. Пример 4.25. Определить вид и параметры поверхности 2х2 + 3«/2— 6г2 — — 8x + 6y+l2z— 1=0. Преобразуем это уравнение: 2(х2-4х + 4)+3(г/2 + 21/+1)-6(г2-2г+1)-8-3 + 6-1=0, 2(х —2)2 + 3(i/+1 )2 —6(z—1 )2 = 6. Переходя к новым координатам по .формулам Л=х — 2, Y—y-f-1, Z = z—1, получаем 2Z2 + 3y2-6Z2 = 6, или Х2/3+У2/2 —Z2/l = 1. Это уравнение определяет однополостный гиперболоид (см. (4.52)), для которого а = -\/3, Ь = ^/2, с=1, с центром в точке Oi(2, —1, 1). Пример 4.26. Доказать, что уравнение г=ху определяет гиперболический параболоид. Введем новые координаты по формулам х = Х—У, y = X~i~Y, z = Z, тогда уравнение примет вид г=(Х-У)(Х+У), Z = X2—Y2. Полученное уравнение является уравнением вида (4.56), для которого 2а2=1, 2б2=1; оно определяет гиперболический параболоид. Пример 4.27. Доказать, что уравнение х2 = уг определяет конус. Переходя к новым координатам по формулам х = Х, y = Z—Y, z = Z+Y, получаем Л2= (Z-У) (Z+У), X2 = Z2-Y2, или X2 + Y2-Z2 = 0. Полученное уравнение является уравнением вида (4.54), для которого a = b = c= I, оно определяет конус. 4.10. Некоторые другие поверхности В плоскости Oxz (у = 0) задана линия Л своими параметрическими уравнениями x = f(u), z = <p(u), (4.71) не пересекающая ось Ог. Рассмотрим поверхность, полученную вращением этой линии вокруг оси Ог. Параметрические уравнения рассматриваемой поверхности вращения имеют вид x = /(u) cos v, y = f(u) sin v, z = <p(u). (4.72) Top — поверхность, полученная вращением окружности вокруг оси, лежащей в плоскости данной окружности и не пересекающей ее. Эта поверхность напоминает спасательный круг, камеру автомобильной шины (рис. 4.22). Рассмотрим тор, полученный вращением вокруг оси Oz окружности, заданной параметрическими уравнениями x = a~t-b cos и, у = 0, z = b sin и (b<a). Эта окружность лежит в плоскости Oxz (у = 0) и определяется уравнениями вида (4.71), .где Ци) —а + Ь cos и, <p(u)=ftsinu. 79
В соответствии с (4.72) получаем параметрические уравнении тора х— (a-\-b cos u) cos v, у= (a-{-b cos и) sin v, г — b sin и. (4.73) Катеноид — поверхность, полученная вращением цепной линии вокруг ее оси (рис. 4.23). Рассмотрим катеноид, полученный вращением вокруг оси Ог цепной линии, заданной параметрическими уравнениями x=ach(u/a), у = 0, г = и. Эта линия расположена в плоскости Охг (у = 0). Она определена уравнениями вида (4.71), где f (и) =а ch (и/a), <р(и)=и. В соответствии с (4.72) находят параметрические уравнения катеноида x=ach(u/a) cos v, у=а ch(u/a) sin v, г —и. Исключая из этих уравнений параметры и, v, получаем ^+^=(а/2)(ег/‘1 + е-^). (4.74) Катеноид является единственной минимальной поверхностью среди поверх- ностей вращения. Минимальные поверхности возникли при решении следующей задачи: среди всех поверхностей, проходящих через данную замкнутую пространственную линию, найти ту, которая имеет минимальную площадь поверхности, ограниченной данной линией. Отсюда происходит и название такой поверхности. Бельгийский физик Плато предложил простой эксперимен- тальный способ получения минимальных поверхностей посредством мыльных пленок, натянутых на проволочный каркас. Катеноид обладает следующим свойством. Рассмотрим две окружности, полученные пересечением катеноида (4.74) соответственно плоскостями z =—с, г = с. Любая поверхность, края которой совпадают с этими окружностями, имеет площадь большую, чем часть катеноида, расположенная между указан- ными окружностями. Мыльная пленка, соединяющая данные окружности под действием сил внутреннего натяжения, принимает форму катеноида. Геликоид — поверхность, описанная прямой, которая вращается с постоянной угловой скоростью вокруг неподвижной оси, пересекает ось под постоянным углом а и одновременно перемещается поступательно с постоянной скоростью вдоль этой оси. При а = 90° геликоид называют прямым (рис. 4.24, а), при а=#=90° геликоид называют косым (рис. 4.24,6). Рассмотрим прямой геликоид, описанный прямой, перпендикулярной оси Ог (см. рис. 4.24). Пусть М (х, у, г)—произвольная точка поверхности, Р— ее проекция на плоскость Oxy, Q, L — проекции точки Р соответственно на оси Ох, Оу. Обозначим через и расстояние точки М до оси Ог (IMAM = IОР\ =и), а через и —угол, образуемый отрезком ОР с осью Ох. Параметрические уравнения геликоида имеют вид 80
x=u cos v, у = и sin v, z — av, где a — некоторая постоянная. Наглядное представление о положении отдельных прямых (лучей) при v = const дают ступени винтовой лестницы. Представление о геликоиде можно составить, например, наблюдая движенце винта вертолета при его вертикальном взлете. Отметим, что первоначально Рис. 4.24 Рис. 4.25 вертолеты называли геликоптерами, винтокрылыми. Первый эскиз геликоида был нарисован еще Леонардо да Винчи Разнообразные геликоиды широко применяются на практике. Это объясня- ется следующим: геликоид образован сложением двух самых распространенных видов равномерного движения — прямолинейного и вращательного. Вследствие этого геликоид можно применить там, где необходимо перейти от одного из указанных видов движения к другому, что имеет место практически в любой машине. Псевдосфера — поверхность, полученная вращением трактрисы вокруг ее асимптоты (рис. 4.25). Рассмотрим псевдосферу, полученную вращением вокруг оси Ог трактрисы х = а sin и, у = 0, г = а(1п tg(u/2) +cos и). Эта трактриса лежит в плоскости Охг (у = 0), ось Ог служит ее асимптотой. Линия задана параметрическими уравнениями вида (4.71), где f(u)=a sin и, <p(u) =a(lntg(u/2) + cos и). В соответствии с (4.72) получены параметрические уравнения псевдосферы х=а sin и cos v, у=и sin и sin v, z = a(ln tg(u/2) + cos u). Важность псевдосферы состоит в том, что на ней частично реализуется плоская неевклидова геометрия Лобачевского. Этот удивительный факт установил итальянский математик Эудженио Бельтрами в 1868 г., уже после смерти Н. И. Лобачевского.
АЛГЕБРА
Глава 5 МАТРИЦЫ И ОПРЕДЕЛИТЕЛИ 5.1. Матрицы. Основные определения Матрицей называется система т-п чисел, расположенных в прямо- угольной таблице из т строк и п столбцов. Числа этой таблицы называются элементами матрицы. Обозначения матрицы: ' ан (3|2 . . Gin /flu G12 • d\n \ d\i G|2 • d | n ^21 <*22 • • d2n , G21 a22 - d2n I i G2I Й22 • • d2n . dm 1 С1т2 • • dmn . \O,„| dm2 . • dmn/ dm 1 dm2 • • dmn Элементы a,i, а<2, ... , ain составляют г-ю строку (» = 1, 2..т), элементы ait, a-2k, ... , amk составляют k-й столбец (k= 1,2, ... , п); ац, — элемент, принадле- жащий <-й строке и k-му столбцу матрицы, числа i, k называют индексами эле- мента. Матрицу, имеющую т строк и п столбцов, называют матрицей размеров тХп (читается т на п). Употребляются и более краткие обозначения матрицы размеров тХп: [Щй] таг (Пц) тп, ||Яд||*пл* Матрицу обозначают также одной заглавной буквой, например Если необходимо отметить, что матрица А имеет т строк и п столбцов, т. е. необходимо указать ее размеры, то пишут А тХ„ или Ат„. Две матрицы Аип=(О;*)т„, Вм= (Ьц,)ря называются равными, если р = т, ц = п и a.ik = btk (i = 1, 2, ... , щ; k= 1, 2, ... , n); другими словами, если они одина- ковых размеров и их соответствующие элементы равны. Матрица, состоящая из одной строки, называется строчной матрицей, или матрицей-строкой. Строчная матрица имеет вид (а, а2 ... а„]. Матрица 02 , . а,„. имеющая один столбец, называется столбцовой матрицей, или матрицей- столбцом. Матрица, все элементы которой равны нулю, называется нулевой. Нулевую матрицу обозначают буквой О: 83
о о ... о 0= о о ... о to 0 ... QJ Квадратной называется матрица, у которой число строк равно числу столб- цов (m = n), т. е. матрица вида ан а,2 ... а<п 021 022 ... О2п ОЛ1 О„2 ••• Опп Порядком квадратной матрицы называется число ее строк. Будем говорить, что элементы ап, агг, ... , о„„ квадратной матрицы образуют ее главную диагональ, а элементы а,„, a2„_i, ,o„i — вторую диагональ. Квадратная матрица называется симметрической, если а,* = оь, т. е. равны ее элементы, симметричные относительно главной диагонали. Диагональной называется квадратная матрица, у которой все элементы, не принадлежащие главной диагонали, равны нулю, т. е. матрица diag(aH, а22, ... , а„„) = ап О О ... О ’ 022 ••• О О ... Опп - Скалярной называется диагональная матрица, у которой о„ = с (c = const) при ( = 1,2,... , п. Единичной называется диагональная матрица, у которой все элементы главной диагонали равны единице. Единичную матрицу обозначают буквой Е: ’ 1 0 ... О ' Е= О 1 ... О .0 0 ... 1 - Треугольной называется квадратная матрица, все элементы которой, расположенные по одну сторону от главной диагонали, равны нулю. Различают соответственно верхнюю и нижнюю треугольные матрицы: "а,. Д12 0|3 • . а]п - On 0 0 . . 0 0 О22 Й23 • • 0-2П 021 022 0 .. . 0 0 0 азз • а3п 031 032 033 - . 0 . о 0 0 . • @пп . . 0л 1 0«2 0л3 • • 0ЛЛ _ Матрица произвольных размеров вида ан Ц|2 а,з .. 0), . . а,„- 0 О22 о2з .. а2г . о2п А = 0 0 033 Озг . Озп (5.1) 0 0 0 .. а„ . а,п 0 0 0 .. . 0 . .. о . где а„=/=0 ((= 1, 2, ... , г), называется квазитреугольной (ступенчатой или тра- пециевидной) . 84
Матрица Ат, полученная из данной матрицы А заменой каждой ее строки столбцом с тем же номером, называется транспонированной относительно А. Если А — матрица размеров тХп, то Дт имеет размеры п\т: ап а,2 ... а,„ й|| 021 ••• Ami д = Ог] O22 ... O2n , Дт= Д12 fl22 ••• flm2 . Om| Om2 ••• Omn . .А|л fl2rt • • • fl/nn . r i 8-i Например, если Д = _Г 1 3 4 ] дт= 3 6 ‘ L 8 6 7 J ’ L 4 7 J Элементарными преобразованиями матрицы называют следующие преобра- зования: 1) умножение строки (или столбца) матрицы на число, отличное от нуля; 2) прибавление к элементам строки (столбца) соответственных эле- ментов другой строки (столбца), умноженных на любое число; 3) перестановка местами двух строк (столбцов). Термин <матрица> был введен Д. Сильвестром в 1851 г. 5.2. Линейные действия над матрицами Линейными действиями над матрицами называются сложение и вычи- тание матриц, умножение матрицы на число. Сложение и вычитание определя- ются только для матриц одинаковых размеров. Суммой двух матриц Д = (а«)т„, В=(5,*)т„ называется такая матрица С= (сц)тп, что Cik = a.ik + btk (<=1,2.т\ k — \ ,2, ... , п), (5.2) т. е. матрица, элементы которой равны суммам соответствующих элементов матриц слагаемых. Сумма двух матриц А и В обозначается А + В. Разностью двух матриц Д=(а,4)т„, В=(Ь^)„„ называется матрица D = = (du,)mn, для которой dik = aik — Ьц, (i= 1, 2, ... , m; 1, 2.n). (5.3) Произведением матрицы Д=(а,»)т„ на число а (или числа а на матрицу Д) называется матрица В = а(Ьи,)для которой Ьц — аац (i= 1, 2,... , т; /г = 1, 2,..., п), (5.4) т. е. матрица, полученная из данной умножением всех ее элементов на число а. Произведение матрицы А на число а обозначается Аа (или аД). Матрицу ( — 1)Д называют матрицей, противоположной матрице Д, и обозна- чают — А. Замечание. Разность А — В двух матриц можно определить так: Д-В=Д+(-В). (5.5) Линейные действия над матрицами обладают следующими свойствами: 1) Д + В=В + Д; 2) (ДД-В)+С = ДД-(В + С); 3) ДД-О=Д; 4) ДД-(-Д)=О; 5) 1-Д = Д; 6) а(М) = («₽)Д;-7) а(Д +В) =аД Д- аВ; 8) (аД- ₽)А = <хД Д- ₽Д, где Д, В, С — матрицы одних и тех же размеров; О — нулевая, матрица; ( —Д) матрица, противоположная матрице Д; а, 0 — любые действитель- ные числа. Пример 5.1. Найти сумму и разность двух матриц ' 1 3 8 2 д = 2 5 , B = 6 3 .6 4 . . 1 5. 85
В соответствии с формулами (5.2) и (5.3) получаем л + в= П 1+8 3+2 2+6 5+3 .6+1 4 + 5 ример 5.2. 1-8 2-6 6—1 9 8 7 5 8 9 Л-В = 5.3. Произведение матриц. Многочлены от матриц Произведение определяется для квадратных матриц одного и того же порядка, а также для прямоугольных матриц, у которых число столбцов мат- рицы множимого равно числу строк матрицы множителя. Произведением матрицы Лт„= (ajt.)m„ на матрицу Bni=(bn,)„i называется такая матрица Cm/=(c,»)ml, для которой п Clh — О1|5|« + й12б2*+ +П/п&п4= X a‘iblh' (5.6) /=1 т. е. элемент Си матрицы Ст1 равен сумме произведений элементов i-й строки матрицы А на соответствующие элементы k-ro столбца матрицы B„i. Матрица Ст/ имеет т строк (как и матрица 4) и / столбцов (как и матрица В„(). Произ- ведение матрицы А на матрицу В обозначается АВ. Замечание. Из того, что матрицу А можно умножить на В, не следует, что матрицу В можно умножать на А. В общем случае ЛВу=ВЛ. Если АВ — ВА, то матрицы Л и В называются перестановочными или коммутативными. При умножении матриц единичная матрица Е играет роль единицы, а нуле- вая матрица О — роль нуля, так как АЕ=ЕА=А, АО = ОА =0. Умножение матриц обладает следующими свойствами. Если имеют смысл соответствующие действия, то выполняются равенства: 1) (ЛВ)С=Л(ВС); 2) а(ЛВ) = («Л)В; 3) (Л + В)С = ЛС + ВС; 4) С(Л+ В) =СЛ+ СВ, где а — любое действительное число. Отметим, что (ЛВ)'=В'Л', где штрихом обозначена матрица, транспони- рованная данной. Целой положительной степенью Л* (k> 1) квадратной матрицы Л назы- вается произведение k матриц, каждая из которых равна Л, т. е. Л‘=Л ХЛ X... X А. k раз Матрица Л‘ имеет тот же порядок, что и матрица Л. Нулевой степенью квадрат- ной матрицы Л(Л=#0) называется единичная матрица того же порядка, что и Л, т. е. AQ — E. Первой степенью Л1 матрицы Л называется сама матрица Л, т. е. Л'=Л. Многочленом (или полиномом) степени k (k—целое неотрицатель- ное число) от квадратной матрицы Л называется выражение вида а&Л+ я* -1 Л* 1 + ...+<12Л2 + <2|4 + где a, (i = 0, 1,2, ... , k)—любые числа, причем а4#=0. Обозначим многочлен 86
от матрицы А через P(A), тогда по определению Р (А) — UhAkQu — iA* *+... + о2А2+о1А +ОоА°, или P(A)=aMHafe-i4‘-l + ... + a242 + a14 + ao£. (5.7) Из определения следует, что многочлен от матрицы можно получить, если в обычный многочлен Р(х) = aftxk + at_|Xfe" 1 -b--- + aix + ao вместо х подставить квадратную матрицу (и учесть, что А°=Е). Пусть дан многочлен Р(х). Если Р(А) является нулевой матрицей, т.е. Р(А) — О, то матрица А называется корнем многочлена Р(х), а многочлен Р(х) — аннулирующим многочленом для матрицы А. Пример 5.3. Найти произведения АВ и ВА матриц Обе матрицы являются квадратными матрицами одного и того же порядка (второго), поэтому можно получить произведения АВ и ВА. Применяя формулу (5.6) для случая т — п = 2, п = 1 = 2, получаем Г 1 21 Г -5 71 Г 1 ( —5)+2( —6) 1-7 + 2-81 =Г -17 231 . L3 41’1—6 8 J — L 3( —5)-Ь4( — 6) 3-7 + 4-81 L -39 53J ’ Г -5 71 Г 1 21 Г (-5)1+7-3. (-5)2 + 7-41 =Г 16 181 L -6 eJ "1з 4 J ~ L ( —6) 1+8-3 (-6)2 + 8-4j L 18 20J Отметим, что АВ=/=ВА, т.е. результат умножения зависит от порядка мно- жител ей. Пример 5.4. Даны две матрицы Найти произведение АВ. Можно ли получить произведение ВА? Число столбцов матрицы А равно числу строк матрицы В (ширина матрицы А равна высоте матрицы В), поэтому произведение АВ определено. Умножая строку матрицы А на столбец матрицы В, по формуле (5.6) получаем 3-4+ 1 -5 + 2-6+ (-4)8 АВ= 6-4 + 5-5 + 7-6+(-8)8 3(-1) + 1(-2)+2(-3) + (-4)(-7) 6(-1)+5(-2)+7(-3) + (-8)(-7) 9.4 + 0-5+ 1 -6+ (-2)8 ' 12 + 5+12-32 9(-1)+0(-2) + 1(-3) + (-2)(-7) — 3 — 2 — 6 + 28 I [—3 17 = 24 + 25 + 42 — 64 36 + 0 + 6- 16 — 6-10-21+56 = 27 19 — 9 + 0—3+14 26 2 Произведение ВА не определено, так как число столбцов матрицы В не равно числу строк матрицы А. Пример 5.5. Найти многочлен Р(А), если Р(х)=х2—Зх + 5 и А = Г 1 -11 L 2 -31 ' В соответствии с определением многочлена от матрицы (см. формулу (5.7)) получаем Р(А) = А2 — ЗА + 5Е или Р(А)—-Г 1 L 2 87
1 "‘Н1 2 -3j L 2 — 1 21 Г — 4 7 J L 5.4. Определители и их свойства Определителем квадратной матрицы второго порядка Л = Oil 021 012 022 называется число, равное 0^022 — 012021 и обозначаемое символом Oil 0|2 021 022 т. е. Он 021 О|2 022 = О||П22 — 012021. (5-8) Числа оц, Oi2, Ог,, 022 называются элементами определителя матрицы второго порядка. Каждый элемент определителя обозначен буквой о с двумя индексами; первый (1) обозначает номер строки, второй (2)—номер столбца, на пересе- чении которых находится соответствующий элемент (например, элемент 021 принадлежит второй строке и первому столбцу определителя). Определитель матрицы называют также детерминантом. Для определителя матрицы употребляются следующие обозначения: |Л|, det Л, det (а,*), А. Определителем квадратной матрицы третьего порядка а. 012 Я|3 А = 021 022 023 O31 О32 Пзз называют число 011 О|2 013 021 022 023 031 Оз2 Озз о 11 ОггОзз + а 12O23O31 + Ог । ОзгО, з — — а|3а220з1 — O12O21O33 — ОгзОзгОп. (5.9) Заметим, что каждое слагаемое алгебраической суммы в правой части этой формулы представляет собой произведение элементов определителя, взя- тых по одному и только по одному из каждой строки и каждого столбца. Этому произведению приписывается соответствующий знак. Чтобы запомнить, какие произведения следует брать со знаком плюс, какие со знаком минус, полезно правило, схематически изображенное на рис. 5.1. Минором какого-либо элемента определителя называется определитель, Рис. 5.1 88
полученный из данного вычеркиванием той строки и того столбца, которым принадлежит данный элемент. Минор элемента а» обозначим Ми,. Алгебраическим дополнением элемента а,* определителя называется его минор, взятый со знаком ( — 1)'+‘. Алгебраическое дополнение элемента oit будем обозначать через A,s. В соответствии с определением А,*= (—I)‘+*Af,». Определители матриц второго и третьего порядка короче называют опре- делителями второго и третьего порядка. Свойства определителей: 1) определитель не изменится при замене всех его строк соответствующими столбцами; 2) при перестановке двух соседних строк (столбцов) определитель меняет лишь знак; 3) определитель с двумя одинаковыми строками (столбцами) равен нулю; 4) множитель, общий для элементов некоторой строки (столбца), можно вынести за знак определителя; 5) определитель равен нулю, если все элементы некоторой строки (столбца) равны нулю; 6) определитель не изменится, если к элементам некоторой строки (столбца) прибавить соответственные элементы другой строки (столбца), предварительно умножив их на один и тот же множитель; 7) определитель равен сумме произведений элементов любой строки (столб- ца) на их алгебраические дополнения._ Например, det А = ацА||-|-а12А|2 + а1.зА|з, т. е. аи Oi2 о,3 __„ | 022 023 | | 021 023 I . I а21 «22 | . /сщч 021 022 023 —вН —O|2 I +013 (5.10) | 032 Озз | | 0з1 Озз [ | Оз| 032 | Оз| 032 Озз Эта формула выражает разложение определителя третьего порядка по элемен- там первой строки. По аналогии с формулой (5.10) вводятся определители четвертого порядка: Он 0|2 ... 01л п Я21 022 ... а2п — £ ( —1)1 + *аиЛ1|*, (5.11) ............. fc=l Ont Оя2 Опп ИЛИ п detA = £ auAit, * = i где А и — алгебраическое дополнение элемента он, п=4; определители пятого порядка и т. д. Теорема 5.1 (теорема замещения). Суммы произведений произвольных чисел bi, Ьг,...,Ь„ соответственно на алгебраические дополнения элементов некоторого столбца (строки) матрицы порядка п равны определителю матрицы, которая получается из данной заменой элементов этого столбца (строки) числами Ь\, Ь?...Ь„. Теорема 5.2 (теорема аннулирования). Сумма произведений элементов одного из столбцов (строк) матрицы на соответствующие алгебраические допол- нения элементов другого столбца (строки) равна нулю. Теорема 5.3. Определитель произведения двух квадратных матриц А и В одного порядка равен произведению определителей перемножаемых матриц: det (А В) = det A-det В. Название «детерминант:» ввел Гаусс. Современное изложение теории опре- делителей дал Коши. Обозначение определителя в виде квадратной таблицы чисел с двумя вертикальными чертами ввел Кэли в 1841 г. 89
к: Пример 5.7. Вычислить определитель Д = В соответствии с формулой (5.8) получаем Д = 7-8— 6-1=50. I4273 3273 Пример 5.8. Вычислить определитель 4274 3274 Умножая первую строку на — 1 и прибавляя ко второй, находим I 4273 | 4274 3273 I _ | 4273 3274 | ~ | 1 3273 I I =4273 — 3273 = 1000. Пример 5.9. Вычислить определитель третьего порядка Д = 1 2 3 2 6 5 — 4 -1 -8 тремя способами: 1) по определению; 2) по формуле (5.10); 3) преобразованием его с помощью свойств. 1) Д=Ь6(-8)+2(-1)3+2-5(-4)- (-4)6-3 —2-2( — 8)-1-5(-1) = = 15. 2)4-'|s -в| -4 |з ®| х ( —8) = 15. 3) Умножая первую строку на (—2) и прибавляя ко второй, затем умножая первую строку на (—3) и прибавляя к третьей, получаем Д = 1 2 —4 0 2 7 0-1 4 Разлагая этот определитель по элементам первого столбца, находим 4- 1-1 II Пример 5.10. Вычислить определитель матрицы Г 1 1 1 1 8 3 . * . , т. е. det Л= 1 2 4 1 - Применяя формулу (5.11), получаем 1 8 3 det А = 2 1 2 2 4 1 1111 2 18 3 3 2 12 4 2 4 1 2 8 3 2 1 3 2 1 8 312 + 322 — 321 4 4 1 4 2 1 4 2 4 Вычисляя определители третьего порядка, находим det ,4=27 — 50+(— 5) — — ( — 12) = —16. Замечание. Этот определитель можно вычислить путем его преобразо- ваний па основании свойств: 90
1111 2 18 3 3 2 12 4 2 4 1 10 0 0 2-161 3 -1 -2 -1 4—2 0—3 -1 6 1 -1 —2 -1 — 2 0 -3 -1 6 1 О -8 —2 О -12 -5 = (-1) -8 — 12 —2 — 5 = -16. 5.5. Обратная матрица Матрицей, обратной квадратной матрице матрица А~', удовлетворяющая равенствам АА~'=А~'А—Е, А, называется квадратная (5.12) где Е — единичная матрица. Квадратная матрица называется невырожденной или неособенной, если ее определитель отличен от нуля. Если определитель матрицы равен нулю, то матрица называется вырожденной или особенной. Всякая невырожденная квадратная матрица "Оц О|2 • • О| п А = 021 022 . • О2л Ол| Оп2 • . О пл (5.13) имеет единственную обратную матрицу ’ ^4ii Я21 ••• “ А~ '=_____!___ Я,2 Агг ... Ап? det Я.................... .Л in А 2п ... Апл J (5.14) где Ат — алгебраическое дополнение элемента а,* матрицы А. Отметим, что алгебраические дополнения элементов каждой строки матрицы А в формуле (5.14) записаны в столбец с тем же номером. В случаях п—2 и п = 3 формулы (5.13) и (5.14) принимают соответствен- но вид я = Он 021 О|21 022 J , А~ 1 Г 4)1 /412 ^21 1 ^22 J det А [ О| 1 012 013 .' 411 421 Я31 я= 021 022 023 , А~ I 4(2 422 Я 32 031 аз2 ОзЗ А । з Ац Язз (5.15) (5.16) Теорема 5.4. Произвольную невырожденную матрицу А с помощью элементарных преобразований можно привести к единичной матрице Е: А-+Е. (5.17) Т е о р е м а 5.5. Если к единичной матрице порядка п применить те же элементарные преобразования только над строками и в том же порядке, с помощью которых невырожденная квадратная матрица А порядка п приво- дится к единичной, то полученная при этом матрица будет обратной матрице А. Эта теорема дает способ нахождения матрицы, обратной данной, с помощью 91
элементарных преобразований. При этом удобно записывать матрицы Л и £ рядом, отделяя их вертикальной чертой (рассматривать расширенную матрицу (Л | £)), и одновременно производить элементарные преобразования над строками матриц Л и £. В результате преобразования строк матрица (Л|£) преобра- зуется в матрицу (£|Л”’): (Л|£) — (£|Л~'). (5.18) Этот метод вычисления обратной матрицы называют методом Жордана. Замечание 1. Теорема 5.5. верна применительно к элементарным преобразованиям над столбцами. Когда преобразования проводятся над столб- цами, то матрицу £ располагают под матрицей Л, рассматривают расширенную Г А 1 матрицу -р- , тогда (5.19) Замечание 2. Если в соотношении (5.18) на место единичной матрицы справа от вертикальной черты поставить матрицу В, то в результате соответст- вующих преобразований получим матрицу А~'В: [Л|В][£|Л-‘В]. (5.20) Замечание 3. Если в соотношении (5.19) на место единичной матрицы под горизонтальной чертой поставить матрицу В, то в результате соответствую- щих преобразований получим матрицу ВЛ-1: Г Л 1 Г £ L В J "*1 ВЛ'1 Обратная матрица используется при решении матричных уравнений вида АХ=В, YA = B, (5.22) где Л, В — невырожденные квадратные матрицы одного и того же порядка. Эти уравнения имеют соответственно решения Х=Л~'В, У=ВЛ“'. (5.23) Матрицы А~'В и ВЛ-1 можно найти с помощью элементарных преобразо- ваний в соответствии с соотношениями (5.20) и (5.21). Пример 5.11. Найти матрицу, обратную матрице (5.21) A Так как det Л = 2, т. е. det Л=#=0, то матрица Л имеет обратную. Поскольку Лц=3, Л,2=—2, Л2) = —5, Л22 = 4, то по второй из формул (5.15) находим л-'=-!-Г 3 ~5 2 I —2 4 1,5 -1 — 2,5 2 П p и м e.p 5.12. Найти матрицу, обратную матрице 2 7 15 1 3 6 Л = 3 10 20 Вычислим определитель данной матрицы: 2 7 15 3 10 20 — (2—3) = 1. 1 3 6 0 1 3 1 3 6 о 1 2 92
Так как det А #=0, то матрица А имеет обратную матрицу. Найдем алгебраи- ческие дополнения элементов матрицы А: Ч М“-лМ.е M.S tl-’- Л2, = _ |б 201 =~2' Ли= | 15 201 =-5> Л23=~ । 15 б| =3’ Лз,= |з io| =1> Лз2=_ I? io! =’’ Лзз= |? з| =-1' По второй из формул (5.16) находим 10 — 2 1 10 -5 1 -3 3 —1 0-2 1 ' 10 -5 1 — 3 3—1 Пример 5.13. С помощью элементарных преобразований найти матрицу А~', обратную матрице 111- 1 2 2 2 2 1 Вторая матрица получена из первой в результате следующих элементарных преобразований: элементы первой строки умножены на ( — 1) к сложены с эле- ментами второй строки, элементы первой строки умножены на (— 2) и сложены с элементами третьей строки. Умножив последнюю строку второй матрицы на (— 1), получим третью матрицу (матрица А приведена к верхней треугольной форме). Умножая третью строку на ( — 1) и прибавляя ее ко второй, а затем к первой строке, получаем четвертую матрицу. Умножая ее вторую строку на (— 1) и прибавляя к первой строке, получаем пятую матрицу: слева от черты — еди- ничная матрица, справа — матрица А~‘, обратная исходной матрице А. Замечание. Элементарные преобразования производятся в два этапа: 1) матрица А преобразуется к верхней треугольной форме с единичными диагональными элементами (путем преобразования строк «сверху вниз»); 2) по- лученная матрица преобразуется к единичной (путем преобразования строк «снизу вверх»). 93
Пример 5.14. Даны две матрицы А = 3 2 . 1 1 2 1 2 3 В = 6 6 8 2 1 4 Найти матрицу X, удовлетворяющую уравнению Это уравнение разрешимо, так как det Л#=0, его решение Х = А~'В (см. пер- вую из формул (5.23)). Матрицу А~'В найдем с помощью элементарных пре- ” " Составляем АХ —В. образований в соответствии с соотношением (5.20). преобразуем ее, приводя матрицу А к единичной: матрицу MISJ, 2 — 3 -5 3 —4 — 8 -5 8 -10 -18 2 3 5 -1 4 3 I 2 3 4 -8 3 2 -8 2 ; 8 4 18 — 13 8 8 — 18 8 - 4 - 2 4 6 -13 Отсюда следует, что -1 О А~'В = Х = -1 О -1 1 3 2 2 2 3 6 6 8 4 О О 2 — 2 5 О О О О О 5 О О 2 1 О 3 2 2 О 4 3 2 3 2 8 4 4 3 О О 2 О О О О 5 2 — 1 О О О О о 1 2 О О 1 2 Называя шагом переход от одной пояснения к вы- и третью строки матрицы к другой, дадим полненным преобразованиям. I шаг — поменяли местами первую (чтобы оц = 1). II шаг — первую строку умножили на —2 и прибавили ко второй; первую строку умножили на —3 и прибавили к третьей. III шаг — третью строку умножили на —1 и прибавили ко второй. IV шаг — вторую строку умножили на 1/2. V шаг — вторую строку умножили на 5 и прибавили к третьей. VI шаг — третью строку умножили на 1/2. VII шаг — третью строку умножили на —3 и прибавили к первой; третью строку умножили на —2 и прибавили ко второй. VIII шаг — вторую строку умножили на —2 и прибавили к первой. 5.6. Ранг матрицы Рассмотрим матрицу размеров тХл Оц ai2 ... ащ Д = 021 022 ... О2л , Urn I О/п2 ••• Отл - 94
Выберем в ней произвольно s различных строк и s различных столбцов, при- чем 1 <s^min(m, п), где min(m,n)—меньшее из чисел тип. Элементы, стоящие на пересечении выбранных строк и столбцов, образуют матрицу по- рядка s. Определитель этой матрицы называется минором порядка s матрицы А. Например, если дана матрица [“7—3 16 5] 2 —6 3 8 О', 4 —5 9 I 2 i -1 то, взяв первую и третью строку, третий и пятый столбец, получим матрицу второго порядка и ее определитель Г 1 5] , | 1 5 | = —43. I 9 2 J ' I 9 2 | Этот определитель является минором второго порядка для исходной матрицы. Аналогично можно получить другие миноры второго порядка, а также миноры третьего порядка. Некоторые из миноров могут оказаться равными нулю. Рангом матрицы называется наибольший из порядков ее миноров, отлич- ных от нуля. Ранг матрицы А обозначают одним из символов: rA, rang А, г. Если все миноры матрицы равны нулю, то ранг ее считается равным нулю. Из определения ранга матрицы получаем следующие утверждения. 1. Ранг матрицы выражается целым числом, заключенным между 0 и меньшим из чисел т, п, т. е. 0^ rtC min (m, п). 2. Ранг матрицы равен нулю тогда и только тогда, когда матрица нулевая. 3. Для квадратной матрицы n-го порядка г = п тогда и только тогда, когда матрица невырожденная. При нахождении ранга матрицы можно пользоваться свойствами миноров. Если все миноры порядка k данной матрицы равны нулю, то все миноры бо- лее высокого порядка также равны нулю. Таким образом, если среди миноров порядка k данной матрицы есть отличные от нуля, а все миноры порядка ^-|-1 равны нулю или не существуют, то r = k. Отметим некоторые очевидные свойства ранга матрицы. 1. Ранг матрицы, полученной из данной транспонированием, равен рангу исходной матрицы. 2. Ранг матрицы не изменится, если вычеркнуть или приписать нулевую строку (т. е. строку, все элементы которой равны нулю) или нулевой столбец. При элементарных преобразованиях ранг матрицы не меняется. С помощью элементарных преобразований матрицу можно привести к квазитреугольной форме. Ранг квазитреугольной матрицы (5.1) равен г, поскольку ее минор с главной диагональю ац,аи,>... ,а„ равен произведению аиа22...а,г#=0, а все миноры более высокого порядка равны нулю (как содержащие нулевые строки). Пример 5.15. Найти ранг матрицы 2 5 0 0 А= 3700. 0 0 0 0 Среди миноров второго порядка этой матрицы имеется один, отличный от нуля: 2 3 5 7 = -1=^0. Все миноры третьего порядка равны нулю. Следовательно, ранг данной матрицы равен двум (г = 2). Пример 5.16. Найти ранг матрицы 1 2 1 8 А = -1 -1 3 4 6 5 1 1 . — 1 95
Применяя элементарные квазитреугольной форме: преобразования, приводим данную матрицу к 1 1 -1 — 1 ' •1 1 -1 -1 ‘ 1 1 — 1 -1 ’ 1 2 3 4 0 1 4 5 0 1 4 5 8 7 6 5 —► 0 —1 14 13 —► 0 0 18 18 .-1 — 1 1 1 .0 0 0 0 . . 0 0 0 0 . (Вторая матрица получена из первой путем поочередного умножения пер- вой строки на (—1), (—8), 1 и прибавления ко второй, третьей и четвертой строкам; третья матрица получена из второй путем прибавления второй строки к третьей.) Ранг последней матрицы равен трем, так как имеется отличный от нуля минор третьего порядка этой матрицы 11 -1 О 1 4 0 0 18 = 1 • 1 • 18= 18=#=0, а определитель самой матрицы (определитель четвертого порядка) равен ну- лю (как содержащий нулевую строку). Следовательно, ранг исходной матри- цы равен трем (г = 3).
Глава 6 СИСТЕМЫ ЛИНЕЙНЫХ УРАВНЕНИЙ 6.1. Линейные системы. Основные определения Системой уравнений называют множество уравнений с п неизвест- ными (п ^2), для которых требуется найти значения неизвестных, удовлет- воряющих одновременно всем уравнениям системы. Системой т линейных уравнений с п неизвестными Х|,Хг,... ,хп или линейной системой, называется система вида Ди Х| + а|2Хг + ...-\-а\пхп = Ь\, #21 X} 4- (122х2 4" ••• 4” (12пХп = />2, (6-1) От[Х\ 4'ат2*г4- ••• 4“ ^тпХп — Ь т-> где аи,, Ь,— числа. Числа a,* (z= 1,2,... , m; k = 1, 2,... , п) называются коэф- фициентами, 6,(i — 1,2, ... , т) —свободными членами. Коэффициенты обозна- чены буквой а с двумя индексами i и k: первый (/) указывает номер уравне- ния, второй (k) — номер неизвестной, к которой относится данный коэффи- циент. Число уравнений т может быть больше, равно или меньше числа неизвестных п. Линейная система называется неоднородной, если среди свободных членов имеются отличные от нуля. Если все свободные члены равны нулю, то линей- ная система называется однородной. Однородная линейная система имеет вид On x,-|-ai2X2 + ... + ainx„ = 0, Ц21 Х| -|- а >2 Х2 + •• • -Е а2пХп = 0, (6.2) а ml Х| -|- ат2Х2-{- ... -|- dmnXn —~ О- Решением линейной системы (6.1) называется упорядоченная совокупность п чисел СI, Z-2, •.. , Сл, (6.3) подстановка которых вместо xit х2, ... , х„ соответственно (xi=ci, х2 = с2, ... ... , х„ = с„) обращает в тождество каждое из уравнений этой системы. Система, имеющая хотя бы одно решение, называется совместной, а си- стема, не имеющая ни одного решения, — несовместной. Отметим, что одно- родная система всегда совместна, так как она имеет нулевое решение: х,=0, х2 = 0, ... , х„ = 0. Совместная система, имеющая единственное решение, называется опреде- ленной. Совместная система называется неопределенной, если она имеет более одного решения. Две системы называются эквивалентными или равносильными, если любое решение одной из них является также решением другой и обратно, т. е. если они имеют одно и то же множество решений. Любые две несовместные си- стемы считаются эквивалентными. Элементарными преобразованиями линейной системы называются следу- 97
ющие преобразования: 1) умножение уравнения системы на число, отличное от нуля; 2) прибавление к одному уравнению другого уравнения, умноженного на любое число; 3) перестановка местами двух уравнений системы. При элементарных преобразованиях линейной системы получают систему, равносильную данной. Выражение «решить линейную систему» означает выяснить, совместна она или несовместна; в случае совместности — найти все ее решения. 6.2. Матричная запись линейной системы Линейную систему (6.1) можно записать в матричном виде. Матрица (6.4) Clm 1 &т2 ••• @тп . составленная из коэффициентов линейных уравнений системы (6.1), называет- ся основной матрицей системы (или матрицей системы). Матрица А— 021 П22 ••• bi (6.5) полученная из основной присоединением столбца свободных членов, называ- ется расширенной матрицей системы (6.1). Рассмотрим столбцовые матрицы, составленные из неизвестных и свобод- ных членов: (6.6) Поскольку матрица А согласована с матрицей X (число столбцов матрицы А равно числу строк матрицы X), то можно найти произведение Ц| । xi А~а>^х2А~... Оц Х| -f~a22x2 + ... + Я2пхп А'агп2х2 “1“ - 4“ втпхп Элементами этой столбцовой матрицы являются левые части уравнений систе- мы (6.1), поэтому на основании определения равенства матриц АХ = В. (6.7) Таким образом, система линейных уравнений (6.1) записана в виде одного матричного уравнения (6.7), где А, X, В определяются формулами (6.4) и (6.6); эта запись системы называется матричной. Каждой линейной системе (6.1) соответствует единственная пара матриц А, В и обратно: каждой паре матриц — единственная линейная система. Система (6.1) может быть записана и в таком виде 98
Если (с,, Ci, ... , c„) — решение системы (6.1), то матрица (6.9) называется вектор-решением этой системы. Матрица (6.9) удовлетворяет уравнению (6.7). Пример 6.1. Представить в матричной форме линейную систему уравнений 2xi +3х2 = 8, 5xi+ х2 = 7. В данном случае формулы (6.4) и (6.6) запишутся так: поэтому уравнение (6.7) принимает вид Эта система имеет вектор-решение С = Замечание. В соответствии с формулой (6.8) данная система пред- ставима в виде 6.3. Невырожденные линейные системы Определителем системы п линейных уравнений с п неизвестными Х|, х2,... , х„ Oi 1X1 + 012X2 +... + О|*х^ +... + ai„x„ = di, О21Х1 + 022X2 +... + a2*x* +... + 02пХп = 62, (6.10) OniXi + опгХ2 +... + o„ftXft +... +a„„x„ = bn называется определитель матрицы из коэффициентов уравнений этой системы: Он 012 • • Ojn д= <*21 022 • • O2t . - О2л (6.11) a„i Ол2 • • опп Обозначим через А* определитель, полученный заменой в определителе А столбца из коэффициентов при неизвестной х4 столбцом свободных членов системы (6.10): 99
<211 <212 ... Ь\ ... <2|„ <221 <222 bs ... asn <2„1 <2/i2 bn ... <2nn (6.12) где k = 1, 2, ... , n. Линейная система (6.10) называется невырожденной, если ее определи- тель отличен от нуля (Д=/=0). Теорема 6.1. Невырожденная линейная система (6.10) имеет един- ственное решение Х!=Д|/Д, Х2 = Д2/Д, .... х„ = Д„/Д, (6.13) где Д и Д* (k= 1, 2, ... , п) определены соответственно формулами (6.11) и (6.12). Эта теорема называется теоремой Крамера, а формулы (6.13)—форму- лами Крамера. Следствие из теоремы Крамера. Если однородная линейная система <2| |%1 +<2,2X2 + ... + <2|„Х„ = 0, <22|Х1 +<222X2+ • • • +<22«Xrt=O, <2п1 X । + <2л2Х2 + • • • + <2„„Х„ — 0 имеет ненулевое решение, то ее определитель Д равен нулю. Систему (6.10) п линейных уравнений с п неизвестными можно записать в матричном виде АХ = В, (6.14) где Если система является невырожденной, т.е. det>4=#0, то она имеет един- ственное решение Х = А~'В, (6.16) где А~' — матрица, обратная матрице А, а В определяется третьей из формул (6.15). Пример 6.2. Решить систему уравнений Х1+ х2 —4х3=1, Xi + 2х2-Зхз = 5, Эх, —2х2 + 4хз = 4. Составим определитель системы Д и определители Д*(й = 1, 2, 3): д= Дг = 1 1 3 1 — 4 2 -3 — 2 4 1 1 -4 1 5 -3 3 4 4 д> = , Дз = 1 1 — 4 5 2—3 4—2 4 1 1 1 1 2 5 3-2 4 100
Определитель системы Д = 21#=0, т. е. данная система является невыро- жденной, поэтому применимы теорема 6.1 и формулы (6.13). Вычислим опре- делители Д1, Д2, Дз; пользуемся формулами (6.13), полагая в них п = 3. Так как Д1=42, Д2 = 63, Д$ = 21, то до со 21 Х|=Д|/Д= =2, х2 = Д2/Д = -хт- =3, хз = Дз/Д= -кт 1 Z 1 ~ X Пример 6.3. Решить систему уравнений 4xi — Зх2 + 2х3 = 9, 2xi + 5х2 — Зх3 = 4, 5xi + 6х2 — 2х3 = 18. в матричном виде (6.14), где 2 -3 — 2 Данную систему запишем 4 2- 5 -3 5 6 Вычисляем определитель матрицы А, находим det А = -3 5 6 Xl Х2 Хз матрицу А~': = 39’Л~ - «Г -13 6 -18 -39 9 4 18 16 26 А = Х = В = 4 2 5 2 — 3 — 2 8 По формуле (6.16) получаем решение системы т. е. Х|=2, х2 = 3, х3 = 5. 6.4. Произвольные линейные системы Рассмотрим линейную систему (6.1), ее основную матрицу А и рас- ширенную А, определяемую формулой (6.5). Теорема 6.2 (Кронекера—Капелли). Для совместности системы (6.1 необходимо и достаточно, чтобы ранг ее матрицы был равен рангу расии ренной матрицы. Теорема 6.3. Если ранг матрицы совместной системы равен числу неизвестных, то система имеет единственное решение. Теорема 6.4. Если ранг матрицы совместной системы меньше числа неизвестных, то множество ее решений является бесконечным. Базисным минором матрицы называется отличный от нуля ее минор, по- рядок которого равен рангу этой матрицы. Базисными неизвестными совмест- ной системы, ранг матрицы которой равен г, назовем г неизвестных, коэффи- циенты при которых образуют базисный минор. Остальные неизвестные на- зовем свободными. Из теорем 6.2—6.4 следует, что решение системы линейных уравнений можно проводить следующим образом. 101
1. Находят ранг г матрицы А системы и ранг г расширенной матрицы А. Если г=#=г, то система несовместна. 2. Если г = г, то выделяют базисный минор и базисные неизвестные. Исходную систему уравнений заменяют эквивалентной ей системой, состоящей из тех г уравнений, в которые вошли элементы базисного минора. Отметим, что в случае, когда число базисных неизвестных равно числу неизвестных системы, система имеет единственное решение, которое можно найти по формулам Крамера. Если число базисных неизвестных меньше числа всех неизвестных, то из соответствующей системы находят выражения базис- ных неизвестных через свободные, используя, например, формулы Крамера. Придавая свободным неизвестным произвольные значения, получают беско- нечное множество решений исходной системы. Пример 6.4. Решить систему уравнений х, — Зхг + 2х3 = 1, 2х,+ х2 —4*з = 5, Поскольку 5*1 —8хг + 2хз = 8. то система совместна. В матрице А минор | % । | отличен от нуля, ему со- ответствует система уравнений Х|—3*2=1—2*з, 2*,+*2 = 54-4*з, в которой *i,*2 — базисные неизвестные, *з — свободная неизвестная. Решая эту систе- му по формулам Крамера, находим х1=(10*з+16)/7, *г= (8*з+ 3)/7, где х3 может принимать любые действительные значения. 6.5. Метод Гаусса Пусть дана система (6.1) т линейных алгебраических уравнений с п неизвестными хь х2, ... , х„. Метод последовательного исключения неизвестных, или метод Гаусса, при- меняемый для решения системы (6.1), состоит в следующем. Предполагая, что ац#=0 (это всегда можно сделать сменой нумерации уравнений), умножая первое уравнение системы (6.1) на —а2|/ац и прибав- ляя ко второму, получаем уравнение, в котором коэффициент при х, обра- щается в нуль. Умножая первое уравнение на — а31/ац и прибавляя к треть- ему, получаем уравнение, также не содержащее члена с х,. Аналогичным путем преобразуем все остальные уравнения, в результате чего придем к системе, эквивалентной исходной системе уравнений: 102
Of |X| -|- Л12 X2~l~ • • + П|„ХЛ = bl , a22X2+ ’ ‘ ' -f-O'2r!Xn = b'2, a'32X2-i------------l-a'3„x„=b'3, (6.17) am2%2+ ’ ‘ ‘ где a-t(i = 2, 3,..., m; k = 2,3,..., n) — некоторые новые коэффициенты. Полагая а22=^=0 и оставляя неизменными первые два уравнения системы (6.17), преобразуем ее так, чтобы в каждом из остальных уравнений коэффи- циент при х2 обратился в нуль. Продолжая этот процесс, систему (6.17) можно привести к одной из следующих систем: Cl |Xi + <r|2*2 И- С13X3 + • • • -\-CinX„ = di, C22X2 + С23Х3+ • • • ~i~c2nxn = d2, (6.18) с33х3-{- • • • C3nXn — d3, СппХп = d„, где с,,=#0 (»= 1, 2, ... , п), Си — некоторые коэффициенты, di — свободные члены; С| 1*1 + С12X2 4" • • 4-С1Л + • • • + CinXn—di, С22Х2+ • • • 4“^2йХ*4' • • • -}-C2nXn = d2, (6.19) CkkXk + • • • + CknXn =dk. где k<n; Ci 1X1 + Cl2X24* ’'' 4~ Cinxn — di, C22X2 4~ • • * 4" CsnXn = d2, (6.20) 0 Хц — dkt где Система (6.18) имеет единственное решение, значение хл находится из последнего уравнения, хп_, — из предпоследнего, х, — из первого. Система (6.19) имеет бесконечное множество решений. Из последнего уравнения можно выразить одно из неизвестных (например, хк) через осталь- ные п — k неизвестных (xt + i, х4+2,... . х„), входящих в это уравнение. Из пред- последнего уравнения можно выразить х^_, через эти неизвестные и т. д. В полученных формулах, выражающих xi,x2...........xft_|,xt через x* + i,х* + 2, ... ... , х„, последние неизвестные могут принимать любые значения. Система (6.20) несовместна, так как никакие значения неизвестных не могут удовлетворять ее последнему уравнению. Итак, метод последовательного исключения неизвестных применим к ль бой системе линейных уравнений. Решая систему этим методом, преобразован)! совершают не над уравнениями, а над матрицами, составленными из коэф фициентов при неизвестных и свободных членах. Пример 6.5. Решить систему уравнений Xi — 2х2 —Зхз —х4 = 2, Х| 4” х2 4" 6x3 4- Зх4 = — 3, 2х। 4” Зхг 4“ 5хз 4~ 2х4 = 1, х24-Хз4-х4 = 3, 5х24-7хз4-4х4 = 5. 103
Составляем матрицу и преобразуем ее: 1 — 2 -3 -1 2 1 16 3-3 2 3 5 2 1 0 1113 0 5 7 4 5 1 — 2 -3 -1 2 0 3 9 4 -5 0 7 11 4-3 0 1113 0 ' 5 7 4 5 1 —2 -3 -1 О О О О 1 1 1 О 2-1 О 4—3 О 6 1 -3-1 2 1 1 3 2 —1 —10 0-1 -4 О 4 16 1 —2 -3 —1 2 0 111 3 0 0 2 —1 —10 0 0 0 -1 —4 0 0 0 0 О Последней матрице соответствует совместная система четырех уравнений с четырьмя неизвестными: х, — 2х2 — Зх3 — х4 = 2, Хг + Хз+Х4 = 3, 2х3 — х4 = —10, — х4 = —4. Решая эту систему, находим х4 = 4, 2хз =— 10 + х4 =— 10 + 4 = —6, х3 = = —3, хг —3— х3— х4 = 3—(— 3)—4 = 2, Х| = 2х2 + Зхз+ х4 + 2 = 2• 2 + 3(— 3) + + 4 + 2=1. Следовательно, исходная система имеет решение xi = l, Хг = 2, х3=—3, х4 = 4. Пример 6.6. Решить систему уравнений Х| + х2 + Хз + х4 = 4, 2xi —хг + Зхз —2х4=2, Зх । + 2х2 + 4х3 — 6х4 = 3, 4xi + Зх2 + 5х3 — 5х4 = 6. 104
Записывая соответствующую матрицу и совершая преобразования, получаем г 1 1 1 1 4 1 1 1 1 1 4 2 -I 3 — 2 2 —► ' 0 -3 1 —4 -6 —► 3 2 4 — 6 3 0 — 1 1 -9 — 9 4 3 5 — 5 6 - 0 -1 1 -9 -10 1 1 1 1 4 1 1 1 1 4 ' 0 — 1 1 — 9 9 —> 0 -1 1 — 9 -9 0 - 1 1 — 9 — 10 0 0 0 0 — 1. 0 -3 1 — 4 -6 . . 0 0 - 2 23 21 Третья матрица получена из предыдущей переменой местами последних трех строк. Последней матрице соответствует система уравнений Х| 4-Х2-|-ХзН_Х4=4, — Х2 + Х3 — 9хч= —9, О х4 = — 1, — 2х3 + 23х4 = 21. Эта система несовместна, так как никакие значения неизвестных не мо гут удовлетворить ее третьем Следовательно, исходная Пример 6.7. Решить i Преобразуя матрицу, п г 1 1-1 1 2-1 3—4 4 1 1—2 5 2 0 -1 у уравнению, система также несовместна, шстему уравнений Xi + x2 —Хз + х4 = 2, 2xi — Х2 + 3хз — 4х4 =0, 4х|+х2 + хз —2х4=4, 5х, + 2х2 —х4 = 6. 1учаем 2 г 1 1-1 1 0 — 0-3 5-6 4 0—35—6 6 J 0 —3 5-6 2-] — 4 — 4 — 4- Таким образом, данная носительно четырех неизвесп 1 0 1 — 3 -1 1 5 -6 2 — 4 0 0 0 0 0 0 0 0 0 0 - система сводится к системе двух уравнений от- Х| 4" -С2 — Хз +х< = 2, — Зх2 + 5х3 — 6х4 = — 4, общее решение которой определяется формулами 2 2 4 5 Х| ~ — -у *з + х4, хг= —I—уХз — 2x4, где х3, х4 могут принимать любые действительные значения. 105
Пример 6.8. Решить систему уравнений Х\ —х2 + 7х3— 2x4 = 2, 2xi — 3%2 + 8х3 — 4х< = 1, 4х 1 -|- 2хг 19х3 4“ х4 = 8, 6xi — 5хг+ 11х3— Зх4 = —3. Составляем матрицу и преобразуем ее: 1 2 — 1 — 3 7 8 — 2 — 4 2 п 1 Г 1 — 1 7 0 —1 —6 — 2 0 2 -3 4 2 19 1 8 0 6—9 9 0 6 -5 11 -3 -3 - 0 1 —31 9 -15 1 - 1 7 — 2 2 Г 1 —1 7 — 2 2 ’ 0 - 1 -6 0 -3 0-1 -6 0 -3 0 0 -45 9 - 18 0 0 — 45 9 - -18 0 0 -37 9 -18 • - 0 0 8 0 0 J Последняя матрица получена в результате сложения третьей, умноженной на (— 1), и четвертой строк. Этой матрице соответствует система уравнений х, —х2 + 7х3 —2х4 = 2, — х2 — бхз = — 3, — 45х3 + 9х4 = — 18, 8х3 = О, имеющая решение х3 = 0, х4=—2, х2 = 3, х, = 1.
Глава 7 КОМПЛЕКСНЫЕ ЧИСЛА 7.1. Упорядоченные пары действительных чисел и операции над ними Пару (а, 6) действительных чисел а и b называют упорядоченной, если указано, какое из них считается первым, какое — вторым. Примеры упо- рядоченных пар: (0,1); (2,3); (3,2). Отметим, что последние две пары раз- личны, хотя и образованы одними и теми же числами. Каждую упорядоченную пару чисел обозначим одной буквой, введем по- нятие равенства двух пар, определим действия над ними. Рассмотрим две упорядоченные пары а= (a, b), Р=(с, d). (7.1) Эти пары называют равными, если а = с, b=d, т. е. ((а, 6) = (с, d)) -о (а = с, b = d). (7.2) Суммой двух пар (7.1) называют упорядоченную пару а + Р=(а, 6) + (с, d) = (a + c, b + d), (7.3) а их произведением — упорядоченную пару aP=(a, b) (с, d) = (ac — bd, bc-\-ad). (7.4) Из соотношения (7.3) видно, что пара 0=(0, 0) (7.5) обладает тем свойством, что сложение ее с любой другой упорядоченной парой не меняет исходной пары: (а, Ь) + (0, 0) = (а, Ь). Пара (7.5) играет роль нуля при сложении упорядоченных пар; назовем ее нуль-парой. Разностью a — 0 двух упорядоченных пар (7.1) называют такую упоря- доченную пару г= (х, у), что z + 0^=a. Вычитание упорядоченных пар (7.1) определяется следующим образом: a —р=(а, 6) —(с, d) = (a—c, b — d). (7.6) Частным а/0, где 0#= 0, двух упорядоченных пар (7.1) называют такую упорядоченную пару z=(x, у), что z0 = a. Если а=#0, т. е. c2 + d2#=0, то частное а/0 двух упорядоченных пар (7.1) определяется формулой “ _ ( ac + bd bc — ad\ /7 7А “Г V c2 + d2 ’ c2 + d2/ ' Из этой формулы следует, что если а = р, т. е. а = с, b = d, то 107
Значит, роль единицы при делении двух упорядоченных пар выполняет упо- рядоченная пара 1 = (1, 0). (7.8) Рассмотрим упорядоченные пары а= (а, 0), b =(6,0). (7.9) Арифметические действия над упорядоченными парами вида (7.9) про- изводятся так, как и над действительными числами. Действительные числа отождествляются с парами вида (7.9). 7.2. Понятие комплексного числа. Арифметическая форма комплексного числа Комплексным числом называют упорядоченную пару (а, 6) действи- тельных чисел а и 6. Рассмотрим упорядоченную пару i=(0, 1). (7.10) Применяя формулу (7.4), получаем i2=i-i=(0, 1) (0, 1) = (0— 1, 0 + 0) = = (—1, 0). Поскольку ( — 1, 0) = — 1(см. формулу (7.9)), то i2=-l, i = V^T. (7.11) Упорядоченную пару (7.10), удовлетворяющую соотношению (7.11), на- зывают мнимой единицей. С помощью мнимой единицы можно выразить лю- бое комплексное число а= (а, 6), т.е. упорядоченную пару действительных чисел. В самом деле, так как Ы=(Ь, 0) (0, 1) = (0, 6), то (а, 6) = (а, 0) + + (0, 6) =a + 6i, т. е. (а, b)=a-f-bi. (7.12) Поскольку (а, 6) = a + 6i, (а, 6) = (0, 6) + (а, 0)=6! + а, то a + bi = bi-f-a. Значит, в правой части формулы (7.12) можно менять местами слагаемые. Выражение а + 61 называют алгебраической формой комплексного числа. Число а называют действительной частью, число 6 — мнимой частью комплек- сного числа а+ 61. Обозначая комплексное число a + 6i одной буквой а, запи- сывают a = Rea, 6 = Ima, где Re — начальные буквы латинского слова realis (действительный), Im — начальные буквы латинского слова imaginarius (мни- мый). Кроме этих обозначений, употребляют и другие, например: a = R(a), 6 = /(а), где а = а + 61. Отметим частные случаи формулы (7.12). Если 6=0, то (а, 0)=а — дей- ствительное число; если а = 0, то (0, 6)=6i. (7.13) Число Ы называют чисто мнимым числом или просто мнимым. Два комплексных числа а + Ы, c-\-di называют равными, когда а = с, b=d: (a+bi = c + di) о (а = с, b=d). Комплексное число равно нулю, когда равны нулю его действительная и мнимая части: (a + 6i = 0) о (а = 0, 6=0). Если дано комплексное число a=a + 6i, то число а — Ы, отличающееся от а только знаком при мнимой части, называют числом, сопряженным числу а, и обозначают а. Числом, сопряженным а, будет, очевидно, число а, по- этому говорят о паре сопряженных чисел. Действительные числа, и только они, сопряжены сами себе. Обозначение i для мнимой единицы (i = V— 1) ввел Эйлер в 1777 г. 108
7.3. Геометрическое изображение комплексных чисел На плоскости выберем систему прямоугольных декартовых координат (рис. 7.1). Комплексному числу (а, Ь) —а-\-Ы сопоставим точку М(а, Ь) этой плоскости с координатами (а, Ь). Если Ь = 0, то получим действительное число (а, 0)=а, которое изображается точкой на оси Ох. Вследствие этого ось Ох называют действительной осью (точками оси абсцисс изображаются действи- тельные числа). Если а = 0, то получаем чисто мнимое число Ы, которое изображается точкой а (О, Ь), лежа- щей на оси у. По этой причине ось ординат назы- вают мнимой осью (точками этой оси изображаются чисто мнимые числа). Отметим, что мнимая единица i изображается точкой (0, 1), расположенной на по- ложительной полуоси ординат и отстоящей от нача- ла координат на расстояние, равное единице. Число ( — 0 изображается на оси ординат точкой (0, —1), симметричной точке (0, 1). Любое комплексное число а= (а, Ь), где а=#=0, 6=#=0, изображается точкой, не лежащей на осях координат. Обратно, любой точке М (а, Ь) плоскости соответствует комплексное число (а,Ь)=а-\-Ы. Таким образом, между множеством комплексных чисел и множе- ством точек плоскости установлено взаимно однозначное соответствие. Плоскость, точки которой отождествлены с комплексными числами, называют комплексной плоскостью. Рассматривают также комплексную переменную г = х-}-1у, ^где х, у Деи- ствительные переменные, i — мнимая единица. Значения этой переменной комплексные числа, изображаемые точками комплексной плоскости. Вследствие этого комплексную плоскость называют также плоскостью комплексной пе- ременной. 7.4. Действия над комплексными числами Из определения комплексного числа (как упорядоченной пары дей- ствительных чисел) и определения арифметических действий над упорядочен- ными парами (см. формулы (7.3), (7.4), (7.6), (7.7)) следует, что (а + bi) + (с + di) = (а + с) + (b +d)i, (7.14) (а-)-Ы) —'(c + di) = (а —с) + (b — d)i, (7.15) (а + Ы) (c+di) = (ac — bd) + (bc-\-ad)i, (7.16) (c2 + d2^0). (7.17) c + dt c +d" c -)-d Формула (7.14) определяет правило сложения двух комплексных чисел: чтобы сложить два комплексных числа, необходимо сложить отдельно их дей- ствительные и мнимые части. Формула (7.15) означает, что при вычитании одного комплексного числа из другого необходимо вычесть отдельно их действительные и мнимые части. ; Отметим, что сумма и произведение двух комплексно-сопряженных чисел а = а-)-Ы, а. = а — Ы являются действительными числами: а-)- а = 2а, аа = а2 -)-Ь2. Арифметические действия над комплексными числами подчиняются тем же законам, что и действия над действительными числами. Если a = a-f-bi, fi = c-)-di, y = e + ji — любые комплексные числа, то верны следующие равенства: 1) а + р = ₽ + а; 2) (<х + ₽) +у = <х+ (Р + у); 3) ар = ра; 4) (ар)у = а(Ру); 5) (<х + Р)у = <ху + Ру. Полагая а — 1, 6 = 0 в формуле (7.17), получаем 109
= + (7J8) Формулой (7.18) определяется число 0 обратное комплексному числу 0 = = c-\-di (0#=О, т. е. с2 + <72¥=0). Натуральные степени мнимой единицы i принимают лишь четыре значе- ния: — 1, — i, 1, i, определяемые формулами i4*=l, Z<*+I=z; (4*+2=_1> Z4*+3=_Zj (7.19) где k = 0, 1, 2, ... При возведении комплексного числа а = а-{-Ы в степень п(п — натуральное число) пользуются формулой бинома Ньютона: (a+bi)"=a"-^-na"~l (Ы) + а-2 (602 + + л (п - 1 И” - 2) о-3 (6f} 3 + + (bi} П (7.20) В правой части этого равенства заменяют степени мнимой единицы по фор- мулам (7.19) и приводят подобные члены, в результате получают некоторое комплексное число c + di. Квадратным корнем из комплексного числа называют комплексное число, квадрат которого равен данному комплексному числу: ^a-\-bi — u-{-iv, если (и +iv)2 = а + Ы. (7.21) Числа и и v определяются из равенств и2=(а + Л/Ит+^)/2, y2=(-a+Va2 + ft2)/2, (7.22) причем и и v будут действительными, так как при любых а и Ь выражения а + д/а2 + 62 и — а4-д/а2 + 62 являются положительными. Знаки и и и выбирают так, чтобы выполнялось равенство 2uv = b. Извлечение квадратного корня из комплексного числа а + Ы всегда возможно и дает два значения Ui+iv\, Ui + iv2, различающихся лишь знаком. Пример 7.1. Даны два комплексных числа 5 + < и 2 + 3i. Найти их сумму, разность, произведение и частное. В соответствии с формулами (7.14) — (7.17) получаем (5 + 0 + (2 + 31) = (5 + 2) + (l+3)Z = 7 + 4i, (5 +<) - (2 + 3Z) = (5-2) + (1 -3)1 = 3-21, (5 +1) (2 + 31) = 10 + 151 + 2i + 3i2 = 7+17i, 5 + t _ (5 + 0(2-30 10- 151 + 21-3i2 13- 13i 2 + 3i (2 + 30(2 — 30 - 4 —9i2 - 13 ~ L Пример 7.2. Возвести в указанные степени данные комплексные числа: (3 + 402, (1 +21)я, (2 + 04- Применяя формулы (7.19) и (7.20) при п = 2, п = 3, п=4, получаем (3 + 40 2 = 32 + 2- 12i'+ (4i)2 = 9 + 24i'+16i2=—7 + 24i, (1 +2z)3 = 1 +&’+ 12i2 + 8i3 = 1 +61— 12 — 81= — 11 — 2Z, (2 + i)4 = 24+ 4-23i’ +6-412 + 4 • 2i3 + i4= 16 + 321 —24 —8i + 1 = — 7 + 241. Пример 7.3. Извлечь корень квадратный из числа a = 9 + 40i. Обозначим -\/9 +40i = и + io. Поскольку в данном случае а = 9, 6 = 40, то формулы (7.22) примут вид и2= (9+ у/92 + 402)/2= (9 + 41) /2 = 25; 110
и2= (-9 + л/97+402)/2= (-9 + 41)/2= 16. Так как u2 = 25, o2=16, то zz,=—5, u2 = 5, Vi = —4, vi = 4. Получено два значения корня: zzi+ r>iz'= —5 —4z и U2-f-V2i=5-f-4i. Пример 7.4. Найти значение выражения z3 — 2z2 + 5z при z=l— i. Поскольку (1 —z)2= 1 —2z' + z2 = 1 —2z—1 = —2z, (1 —z)3= (1 —z)2(l —z) = = -2t(l-«) = -2z + 2z2 = — 2 — 2z, to z3-2z2 + 5z=-2 — 2z-2(-2z)+5(l- — z)=3 —3z. Пример 7.5. Показать, что комплексное число z=l— z является корнем уравнения z3 + 2z2— 6z + 8 = 0. Так как z2 = (1 — z)2 = — 2z, z3= (1 —z)3= —2 —2z, to z3 + 2z2 —6z + 8 = = —2 —2z' + 2( —2z) —6(1 —z)+8 = 0, t. e. (1 —z) — корень уравнения. 7.5. Модуль и аргумент комплексного числа. Тригонометрическая форма комплексного числа Комплексное число а. = а-\-Ы, заданное в алгебраической форме, можно представить и в другом виде. Изобразим число а точкой М(а, Ь) комплексной плоскости. Рассмотрим радиус-вектор этой точки (рис. 7.2). Модулем комплексно- го числа а = а + Ы называют длину г радиуса-вектора ОМ точки М(а, Ь), изобра- жающей данное число. Модуль комплексного числа а обозначают символом | а |. Следовательно, по определению г=|ОМ|, г=|а|, |<х| >0. (7.23) Так как |ОМ| = -у/а2 + 62 (см. рис. 7.2), то [ос| = -\/а2 + &2, |а + М| = д/а2 + &2, г= д/а2 + 62, (7.24) т. е. модуль комплексного числа равен арифметическому значению корня квадрат- ного из суммы квадратов его действительной и мнимой частей. Если 6 = 0, т. е. число а является действительным, причем а = а, то формула (7.24) принимает вид |а | = у/а^. Аргументом комплексного числа а = а-\-Ы называют величину угла ф наклона радиуса-вектора г = ОМ точки М(а, Ь) к положительной полуоси Ох. Аргумент комплексного числа а обозначают символом Arg а. Угол <р может принимать любые действительные значения. Аргумент комплексного числа а имеет бес- конечное множество значений, отличающихся одно от другого на число, кратное 2л. Аргумент не определен лишь для числа 0, модуль которого равен нулю. Среди значений аргумента комплексного числа а#=0 существует одно и только одно, заключенное между —лил, включая последнее значение. Его называют главным значением и обозначают arg а. Итак, аргумент комплексного числа удовлетворяет соотношениям Arg a = arg а + 2л6 (6 = 0, ± 1, ±2, ... ), — nCarga^n. С помощью модуля и аргумента комплексное число <х = а-\-Ы можно пред ставить в другой форме. Поскольку a = rcosq>, 6=rsin<p, то a + Ы = r(cos <f> + z sin <p) (r^0), где r= -y]d2 + b‘2, cos <p = a/-\/a2 + &2, sin <p = 6/-yP+62.. Ill
Выражение, стоящее в правой части формулы (7.26), называют тригонометри- ческой формой комплексного числа. Отметим особенности тригонометрической формы: 1) первый множитель—неотрицательное число, rJsrO; 2) записаны косинус и синус одного и того же аргумента; 3) мнимая единица умножена на sin <р. Два комплексных числа, заданных в тригонометрической форме, равны тогда и только тогда, когда их модули равны, а аргументы отличаются на величину, кратную 2л. Следовательно, если Г| (cos <р। +» sin <pi) =f2(cos Ф2 + 1 sin <рг), (7.28) то г, =<2, <f>2 = 4>i +2Ал (£ = 0, ± 1, ±2, ... ); (7.29) и наоборот, из равенств (7.29) следуют формулы (7.28). Если комплексное число а = а-\-Ы задано в три- гонометрической форме a = r(cos <p + r sin <р), то комплексно-сопряженное число а —а — Ы записыва- ется в форме a = r(cos( — <p) + i sin(—<р)); поэтому |<х| = I а|, arg а= —arg а (рис. 7.3). Пример 7.6. Комплексное число а = 2 л/2/(1 — I) записать в алгебраи- ческой и тригонометрической форме. Умножая числитель и знаменатель данной дроби на число, сопряженное знаменателю, получаем 2 v'2 _ 2V2(l+i) 1-/ (1 _1)(1+(-) 2л/2(1+<) 1-<2 2д/2 + /2< = ^+.^ Это— алгебраическая форма данного числа: а= -\/2 + <-\/2- Применяя формулы (7.27), находим г = д/(д/2)2 + (д/2)2 =2, sin q = b/r = = д/2/ 2, cos<p = a/r= л/2/2, откуда главное значение <р = л/4. Следовательно, тригонометрическая форма данного числа имеет вид a = 2(cos(n/4) +« sin(n/4)). 7.6. Действия над комплексными числами, заданными в тригонометрической форме Произведение двух комплексных чисел Zi = r(cos <p + r sin <p), Z2 = p(cos ф + i sin ф), (7.30) где r= |zi I, <p = Arg 2i, p = I z21, ф = Arg z2 находится по формуле 2122 = rp(cos (<₽ + ф) +» sin (срН-Тр) ) - (7-31) Из этой формулы следует, что IZ1Z2I = IZ| 11г21, ф + Ф = Arg(z,z2), т. е. модуль произведения равен произведению модулей множителей, а сумма аргументов множителей является аргументом их произведения. Если 22=#0, т. е. р=#0, то (cos(cp — ф) +< sin(cp — ф)), (7.32) 22 Р откуда I21/22I =|Z||/Iz2|, ф— ф = Arg(z 1/22). 112
Эти формулы означают, что модуль частного равен модулю делимого, деленному на модуль делителя, а разность аргументов делимого и делителя является аргументом частного двух комплексных чисел. Если z = r(cos ф + t sin <р) и г=/=0, то z~' = l/z=r_| (cos( — <p) +< sin(— <р)), (7.33) откуда |z~‘| = lz|_1, arg z~1 = — arg z, т. e. модуль комплексного числа z_|, обратного числу z, равен обратной вели- чине модуля числа г, а его главное значение аргумента отличается от главного значения аргумента г лишь знаком. Если п — натуральное число и z = г (cos q> + z sin <р), то z"= (г (cos <р +1 sin <р) )" = r" (cos п<р-Н sin nq>), (7.34) откуда lz"\ = \zl", ^ = Argz'1. Формула (7.34) называется формулой Муавра. При г=1 она принимает вид (cos фr.sin ф)" = со5 Иф+г sin пф. Корнем п-й степени из комплексного числа z называется такое комплексное число а, что а" = г. Извлечение корня п-й степени из комплексного числа z = r (cos ф-Н sin ф) всегда возможно и дает п различных значений: а0= cos — +i sin —) '• “i = cos СР~*~2Л +' sin ’ \ n nJ \ n n / a2= ^cosJP±±L+l-sin^±±L) q„_,= V7(cos ^±2-<n-1-hL +zsin ф+2("-121), (7.35) \ n П/ ---------r-=----г ф + 2/m , . . ф + 2£л\--------„с. y/r(cos ф + г sin ф). = Vr( cos —-------------------------H sm —-1 , (7.36) \ n n / где k = 0, 1, 2,... , n — 1. Из формул видно, что все п значений корня п-й степени из комплексного числа z расположены на окружности радиуса '\J\z\ с центром в точке нуль и делят эту окружность на п равных частей. Отметим, что корень п-й степени из действительного числа также имеет п различных значений. Среди этих значений действительных будет два, одно или ни одного в зависимости от знака а и четности п. Корень п-й степени из нуля имеет только одно значение, равное нулю (\/0 = 0). Корни п-й степени из единицы .определяются формулой 4/l=cos--------Н sin-------, (7.37) п п где k = 0, 1, 2, ... , п— 1. ' Пример 7.7. Найти значения квадратного корня из числа z = i. Представим сначала это число; в тригонометрической форме: i = cos(n/2) + + i sin (л/2). В соответствии с формулой (7.36) имеем r I л ... л л/2 + 26л . . . л/2 + 2/гл , _ . v1 = Д/ COS — +< sin -у- =cos ——£-------hl Sin-----2---, й = 0, 1. Следовател ьно, ____„„< л I л -J2 , . л/2 5л , . . 5л “°-cos _ +t sin — = +(-у-. a>=cos — H-i sin = — <х0. 113
Пример 7.8. Найти все значения корня 6-й степени из числа —64. Представим данное число в тригонометрической форме: —64 = 64(созл-р -pi sin л). Формула (7.36) принимает вид cos л+б2*я +i sin ” + 2fejt) , * = 0, 1, ... , 5. Замечая, что ^64 = 2 и придавая k указанные значения, находим шесть искомых значений: ао = 2( cos —pi sin \ 6 а2 аз а4 а5 значения изображаются л ... COS -£--pl Sin 5л , . . COS —7--pl Sin 6 7л .. cos —j--pi sin 6 ,/ Зл , . . 4 cos ——pi sin 11л . . COS —7--pl Sin - 6 — 2», вершинами правильного шестиугольника, Эти вписанного в окружность радиуса /? = 2 (рис. 7.4). Пример 7.9. Решить уравнение г3 —2 у/2/(1—i) =0. Так как 2 у2/( 1 — I) =2(cos(л/4) +» sin (л/4)), то z= ^2 (cos (л/4) -pi sin (л/4)) . Применяя формулу (7.36), получаем д /о Л । • • л is/ (л/4)+2£л . . (л/4)-р2йл\ Л/ 2 cos — +i sin -у = V2I cos ——у-----------Pi sin ' ' у----\ , k = 0, 1,2. Полагая в этой формуле k = 0, k=l, k = 2, находим з/х/ л । • л\ злт/ (л/4)+2л . . (л/4)-р2л\ 2о= д/2^ cos — +l sin -у) , 2| = V2( cos - - ------pi sin ---3-----J = Зг</ Зл .. Зл\ 3/~/ 17л , . . 17л\ = V2(^cos— -Pl sin—, 22= V2^cos-yy -pisin-yy-) .
Глава 8 АЛГЕБРАИЧЕСКИЕ УРАВНЕНИЯ 8.1. Алгебраические многочлены Алгебраическим многочленом степени п называется сумма целых не- отрицательных степеней переменной х, взятых с некоторыми числовыми коэф- фициентами, т. е. выражение вида aox" + aix"- 1 Н-t-an-tx + a„, ао=/=О. Для сокращенной записи многочленов употребляют обозначения f(x), <f(x), g(x) и т- п- Два многочлена f(x) и g(x) считают равными и пишут f(x)=g(x) в том и только в том случае, когда равны их коэффициенты при одинаковых степенях х. Теорема 8.1. Для любых двух многочленов j(х) и <р(х) можно найти такие многочлены q(x) и г(х), что f(x)=<f(x)q(x)+r(x), (8.1) причем степень г(х) меньше степени <р(х) или же г(х)=0. Многочлены q(x) и г(х) определяются однозначно. Многочлен q(x) называется частным от деления f(x) на <р(х), а г(х) — остатком от этого деления. Замечание. Формулу (8.1) можно записать так: 4ёг=9(х) + ^г (ф(х)*0)- Если остаток от деления f(x) на <р(х) равен нулю, то многочлен <р(х) называется делителем многочлена Дх); в этом случае говорят, что f (х) делится на ф(х) (или нацело делится на <р(х)). Многочлен <р(х) тогда и только тогда является делителем многочлена Дх), когда существует многочлен ф(х), удовлетворяющий равенству Дх) =<р(х)ф(х). Многочлен Л(х) называется общим делителем для многочленов Д1) и g(x), если он является делителем каждого их этих многочленов. -Два многочлена называются взаимно простыми, если они не имеют других общих делителей, кроме многочленов нулевой степени (т. е. постоянных). Наибольшим общим делителем отличных от нуля многочленов f(x) и g(x) называется общий делитель d(x), который делится на любой другой общий делитель этих многочленов. Наибольший общий делитель многочленов Дх) и g(x) обозначается так: (Дх),£(х)). Наибольший общий делитель многочленов Дх) и g(x) можно найти с по- мощью алгоритма Евклида. Если f(x) =g(x)ql(x) +ri(x), g(x)=n (x)q2(x) + r2(x), Г1 (x) = r2 (x)q3 (x)4-r3(x), rt_2(x) = rt-i(x)qt(x) 4-гДх), r-t-i(x) =r*(x)<7t + i(x), (8.2) то г*(х) = (Дх),й(х)). 115
Замечание. Наибольший общий делитель многочленов определен с точностью до постоянного множителя: если d(x) — наибольший общий делитель многочленов f(x) и g(x), то cd(x), где с — любое число, отличное от нуля, также является их наибольшим общим делителем. Пример 8.1. Найти частное q(x) и остаток г(х) при делении многочлена f(x) = х4 — х2 — 2 на многочлен <р(х) =х3 —2х2 + х —2. Выразить f(x) через. <р(х) и г(х). Выполняя деление, находим _ х4 — х2 — 2 I х3 —2хг + х —2 ±х4 + 2х3±х2 + 2х I х + 2 2х3 —2х2 + 2х —2 + 2х3 + 4х2 ± 2х Т 4 2х2 + 2 Итак, </(х)=х + 2, г(х)=2х2 + 2, х4 —х2 —2= (х3 —2х2 + х —2) (х + 2) + + 2х2 + 2. Пример 8.2. Найти общий наибольший делитель двух многочленов f(x) =х4 + 2х2 — 3 и <р(х) =х3 —х2 + 2х —2. Произведя деление f(x) на <р(х), получим первое из равенств (8.2): х4 + 2х2 —3= (х3 —х2 + 2х —2) (х—1) + (х2—1), так как </i(x)=x—1 и л (х) = = х2—1. Разделив <р(х) на л(х), найдем второе из указанных равенств: х3 — — х2 + 2х —2= (х2—1) (х—1)+3х —3, поскольку q2(x)=x—l и г2(х)=3х —3. Остаток Г|(х) нацело делится на остаток г2(х): х2—1 = (Зх — 3) X х(-^-х+ -у-) ’ = 4“x+ “У' Следовательно, г2(х) =3х — 3 = 3(х—1) и является общим наибольшим делителем данных многочленов. В соответствии с замечанием общим наибольшим делителем будет также </(х)=х—1. 8.2. Корни многочлена. Теорема Безу Значением многочлена f(x) = аохл +aix"“1-|-\-ап-}х + а„ (8.3) при х = с называется число f(c) =aocn + aicn~'+ +а„-,с+а„. Число с называется корнем многочлена f(x) или корнем уравнения /(х)=0, если [(c) =0, т. е. aoc" + aic"~'-\-ha„_lc+a„ = 0. Теорема 8.2 (Безу). Остаток г от деления многочлена f(x) на линейный многочлен х — с равен значению [(c) многочлена f(x) при х—с, т. е. r=f(c). (8.4) Следствие. Число с тогда и только тогда будет корнем многочлена f(x), когда f(x) делится на х—с. Если многочлен f(x) задан формулой (8.3) и f (х) = (х — c)q(x) +г, q(x) =Ьох"~' +&|Х',“2 + б2х"-3Ч----------i-b„-2x+b„-i, то коэффициенты многочлена q(x) определяются формулами fto = ao, bk = cbt-1 +aii, й = 1, 2, ... , n — 1, (8-5) а остаток г-—по формуле r = cbn_ i 116
Коэффициенты частного и остаток вычисляют по следующей схеме: <3о <21 <32 <3з On— I <2« 60 cb<,-|“Qi = b। — Ь? cb?-(-a3 — b3 ... cbn—2-{-an— i — bn— i cbn— iН_Пп = г Эту схему, называемую схемой Горнера, используют также для вычисления значений многочлена, поскольку f(c)=r (см. формулу (8.4)).. Если с — корень многочлена f(x), т. е. Цс) =0, то многочлен Цх) делится на х — с. Может оказаться, что Цх) делится и на более высокие степени х— с. Пусть существует такое натуральное число k, что f(x) нацело делится на (х —с)‘, но уже не делится на (х —с)4+1. В этом случае Цх) = (х — с)‘<р(х), причем число с не является корнем многочлена ср(х). Число k называется кратностью корня с многочлена Цх), а число с — й-кратцым корнем этого много- члена. Если k=\, то говорят, что число с—простой корень многочлена Цх). Теорема 8.3. Всякий многочлен, степень которого не меньше единицы, имеет хотя бы один корень (действительный или комплексный). Эту теорему раньше называли «основной теоремой высшей алгебры». Следствие 1. Всякий многочлен п-й степени единственным образом, с точностью до порядка сомножителей, разлагается в произведение п линейных множителей: если <Х|, аг, ... , а„ — корни многочлена (8.3), то Цх) =а0(х — cti) (х— а2) ... (х — а„). (8.6) Следствие 2. Всякий многочлен f(х) степени п^1 имеет п корней, считая равные и комплексные. Следствие 3. Если многочлены Цх) и <р(х), степени которых не пре- вышают п, имеют равные значения более чем при п различных значениях переменной, то Цх) = <р (х). Если многочлен Цх) =x’' + alx"~l +а2Хп~2+ —|-а„_ ,х-|-а„, (8.7) для которого ао=1, имеет корни а,, а2, ... , <хп, то его коэффициенты выражаются формулами Виета: а> — — (ai + а2-|- • • • + ап); а2 = а|а2 + <Х1«з + * * * Н- aiart -|-а2аз • 4~ссл — iа„; а3= — (а|а2аз + а|а2а4+ • • • +a„_2a„_ian; .......................................................... (8.8) a„_i= (~ I)"-1 (а,а2 ... a„-i + ai<x2 а„_2а„+ • • • +а2аз ... а„); а„= ( — l)"a,a2 ... а„. Эти формулы означают следующее: в правой части k-ro равенства (А = 1, 2, ... , п) находится сумма всевозможных произведений по k корней, взятая со знаком плюс или минус в зависимости от четности или нечетности k. Последняя из формул (8.8) свидетельствует о том, что корни многочлена (8.7) являются делителями его свободного члена. Формулы Виета дают возможность найти многочлен по корням. Теорема 8.4. Если комплексное число а является корнем многочлена с действительными коэффициентами, то его корнем будет также и сопряженное число а. Следствие 1. Многочлен Цх) в этом случае делится на квадратный трехчлен <р(х) = (х — а) (х — а) = х2 + рх + </ с действительными коэффициентами р= — (а + а), р = аа. „ Следствие 2. Комплексные корни всякого многочлена с действитель- ными коэффициентами попарно сопряжены. Следствие 3. Многочлен нечетной степени с действительными коэффи- циентами имеет хотя бы один действительный корень. Если же действительных корней больше одного, то их будет нечетное число -(так как комплексные корни попарно сопряжены). 117
Следствие 4. Всякий многочлен с действительными коэффициентами можно представить, причем единственным способом (с точностью до порядка множителей), в виде произведения его старшего коэффициента и нескольких многочленов с действительными коэффициентами, линейных вида х — с, соот- ветствующих его действительным корням, и квадратных вида x2-[-px-\-q, соот- ветствующих парам его сопряженных комплексных корней. Пример 8.3. Разделить многочлен f (х) =х5 —2х3 + 2х2 —Зх + 5 на х—1. Коэффициенты многочлена: а0=1, ai=0, а^=—2, а3=2, о4=—3, а3 = 5. Коэффициенты частного q(x) = b3x*b{X3-\-bix2-\-b3x-)-bi и остаток г находим по схеме Горнера, считая с= 1: с 1 О — 2 2 -3 5 1 1 1-1+0=1 Ы-2= — 1 1-( — 1)+2=1 1 • 1 —3= —2 1 • ( —2)+5=3 Следовательно, частное q(x) = х4+х3 — х2 + х — 2, а остаток г = 3. Пример 8.4. Вычислить значение многочлена f(x) = 2х5 — 4х4 + 5х3 — — 26х2—17х + 9 при х = 3. По схеме Горнера находим: с 2 —4 5 -26 — 17 9 3 2 3-2 —4 = 2 3-2 + 5=11 3-11—26 = 7 3-7 — 17 = 4 3-4 + 9 = 21 Итак, г = 21; поскольку/(с) = г, то f(3)=2\. Пример 8.5. Показать, что число х = 4 является корнем многочлена Их) = Зх4 - 2х3 - 47х2 + ЗОх - 8. С помощью схемы Горнера покажем, что г=/(4)=0: с 3 —2 -47 30 -8 4 3 4-3 — 2=10 4• 10 —47= — 7 4( — 7)+30 = 2 4-2-8 = 0 Так как г = 0, то [(4) =0, х = 4 — корень многочлена. Пример 8.6. Найти многочлен третьей степени, корни которого он = 1, а2 = —2, <хз = 3. Воспользуемся формулами Виета. При п=3 многочлен (8.7) и формулы (8.8) принимают соответственно вид /(х) =х3 + а|Х2 + а2х + а3, Qi = — (ai + <х2 + аз), а2 = а|а2 + <Х1<хз + а2аз, а3=—aic^as. Подставляя в последние три формулы значения корней, получаем а,= = -(1-2 + 3) = -2, a2= 1 • ( —2) + 1-3+( —2)3= —5, а3= - 1 (-2)3 = 6. Следовательно, /(х) =х3 —2х2 —5х + 6. Пример 8.7. Найти многочлен четвертой степени, имеющий корни <Х|= — 1, а2 = 2, <х3 = 4, а4 = 5. При п — 4 многочлен (8.7) и формулы (8.8) запишутся так: f (х) =x4 + aix3 + a2x2 + a3x + a4, а> = — (а । + аг + ссз + сс4), ц2 = <Х|0с2 + <Х|аз + <Х|<х4 + <х2аз + агсс4 + а3сс4, а3= — (а1а2аз + <Х|<Х2а4 + а|аза4 + а2аз<Х4), а4 = а|<Х2<хза4. По этим формулам находим а, = — 10, аг = 27, а3=—2, а4=—40. Итак, f(x) = = х4 — 1 Ох3 + 27 х2 — 2х — 40. 118
8.3. Квадратные уравнения Алгебраическим уравнением n-й степени с одной переменной х назы- вается уравнение вида aoxn + alx"~i --)-a„-ix+a„ = 0, (8.9) где а0, а..— заданные числа, называемые коэффициентами. Корнем алгебраического уравнения (8.9) называется такое значение пере- менной х==с, при котором оно обращается в тождество, т. е. а^с"+ • • • • • * +ап-|С + оя = 0. Выражение <решить уравнение» означает найти все его корни. Квадратным называется уравнение вида ax2-f-bx-f-c = 0 (а#=0). (8.10) Корий уравнения (8.10) вычисляются по формуле Выражен ие D = b!—4ac называется дискриминантом квадратного уравнения (8.10). Если а, Ь, с — действительные числа, то квадратное уравнение (8.10) при D> 0 имеет два различных действительных корня, при D=0 — два равных действительных корня, при D<0 — два комплексно-сопряженных корня. Отметим, что коэффициенты квадратного уравнения (8.10) могут быть и комплексными числами. Его корни также вычисляются по формулам (8.11). В этом случае дискриминант будет комплексным числом. Уравнение (8.10) можно привести к виду х2 + px-f-q = O. (8.12) Корни этого уравнения вычисляются по формуле (8.13) которая является частным случаем формулы (8.11). Пример 8.8. Решить уравнение х2— 4х-|-13 = 0. По формуле (8.13) получаем Х],2 = 2± д/4 —13 = 2± д/ —9. Это уравнение имеет корни xi=24-3i, х2 = 2 — 31, где / = д/— 1 . Пример 8.9. Решить уравнение х2—(4-|-6i)x— 5+10i = 0 с комплексными коэффициентами. По формуле (8.13) находим Х|, 2= (2 + 31) ± д/(24- 3»)2 — ( — 5+ 101) = = (24-31) ±д/4+ 12i + 9i2 + 5- 10/ = (24-31) =Е = (24-31) ± (1 +1); xt=3 + 4-4i, х2= 14-2/. 8.4. Кубические уравнения Кубическим называется уравнение х3 4- ах2 4- Ьх+ с = 0. (8.14) Это уравнение с помощью формулы x = z— а/3 можно привести к виду z34-pz4-? = 0. (8.15) Корни кубического уравнения (8.15) вычисляются по формуле z = u-\-v, где 119
или Все три корня уравнения (8.15) определяются следующими формулами: Z|b=u!-|-oi, z2 = uie + oie2, z3 = «ie2 + nie, (8.18) где ul—любое из трех значений и, определяемых первой из формул (8.16), vi — то из трех значений v, которое соответствует Ui на основании равенства Зиг>+р = 0, (8.19) — кубические корни из единицы. Дискриминантом уравнения (8.15) называется выражение -4р3-27<?2 = - 108(-f- + . Уравнение (8.15) при D<zO имеет один действительный и два комплексно- сопряженных корня: при 0=0 — три действительных корня, причем два равных; при D> 0 — три различных действительных корня. Замечание. Третий случай (D> 0) называется неприводимым. В этом случае все корни уравнения (8.15) с действительными коэффициентами являются действительными, однако для нахождения их по формуле (8.17) следует извлекать кубические корни из комплексных чисел. Формула (8.17) называется формулой Кардано. Правило, соответствующее этой формуле, впервые опубликовано в книге итальянского ученого Д. Кардано «Великое искусство или о правилах алгебры» (1545). Это правило решения кубического уравнения было получено ранее (1535) другим итальянским математиком Н. Тартальей. Пример 8.10. Решить уравнение z3— 6z + 9 = 0. Это уравнение вида (8.15), для которого р=—6, р = 9. Составим выражение <?2 , Р3 = 92 (-6)3 _ 81 49 4 27 4 3 З3 4 ° 4 ' По формулам (8.16) находим и и v: Следовательно, «, = —1, vi = —2, равенство (8.19) выполняется. По фор- мулам (8.18) с учетом формул (8.20) находим 2| = U1 4-О|= —3, z2 =u,e + v,e2= ( - 1) (-+ (-2)(-----------------J----[2^ = 120
2 । 3 л/З . Z3 = «|82 4-0,8 = ~2------I- Замечание. Корни zj и z3 можно найти и другим способом. Так как z,= —3— корень уравнения, то многочлен z3 — 6z + 9 делится на (z-4-З). Про- изведя это деление, получим z3 — 6z-|-9 = (z-f-3) (z2 — 3z + 3). Данное уравнение примет вид (z + 3) (z2 —3z + 3) =0, откуда z4-3 = 0, z2 —3z-|-3 = 0. Последнее уравнение имеет корни 3 , л/3 . з т/З . г2— 2 + 2 2з~ 2 2 ' Пример 8.11. Решить уравнение х3 — 5х24-8х —6 = 0. Разложим на множители многочлен в левой части уравнения: х3— 5х2 + 4-8х —6 = х3 —Зх2 —2х24-6х4-2х —6 = х2(х —3) -2х(х-3) 4-2(х-3) = (х-3) X Х(х2 —2x4-2). Данное уравнение примет вид (х —3) (х2 —2х-|-2) =0 и распа- дается на два уравнения: х—3 = 0, х2 — 2х4-2 = 0, которые имеют корни xi = 3, Х2= 1 44 Х3 = 1 — 8.5. Уравнения четвертой степени Алгебраическое уравнение четвертой степени х4 4- ах3 4- Ьх2 4- сх 4- d = 0 с помощью подстановки x = z — а/4 можно привести к уравнению z44-pz24-<7z4-r = O, (8.21) в котором коэффициент при z3 равен нулю. Это уравнение можно записать так: (z24-p/2 4-a)2— (2az2 — qz + (а2 + pa —r +р2/4)) =0, (8.22) где a — вспомогательный параметр. Значение параметра выберем так, чтобы вычитаемый многочлен был полным квадратом. В этом случае многочлен имеет два равных корня, так как его дискриминант равен нулю, т. е. q2— 4-2a(a24-pa — r-^-p2/4)=0. (8.23) Уравнение (8.22) принимает вид (/ + -f- +ao)2 -2a0(z- -£-) =0, (8.24) где a» — отличный от нуля корень уравнения (8.23). Уравнение (8.24) распадается на два квадратных уравнения: г2 — 4- ( —к—F «о 4----= 0’ \ 2 2д/ао2 (8.25) z2 4- -\j2a0z -)- f -Н ао--= 0- \ 2 2-уао2 Корни этих уравнений будут корнями уравнения (8.21). Пример 8.12. Решить уравнение z4 — 5z2-f-4 = 0. Это уравнение вида (8.21), для которого р=—5, р = 0, г = 4. Уравнение (8.23) в данном случае сводится к квадратному уравнению относительно пара- 121
метра а:а2 —5а —4 + 25/4 = 0, или а2 —5а+ 9/4 = 0, которое имеет корни а, =9/2, аг=1/2. При а0=1/2 уравнения (8.25) запишутся так: г2 —г —2 = 0, z2 + z —2 = 0. Первое из них имеет корни z1 = —1, гг = 2, а второе — zi = l, Z2=—2. Эти числа являются и корнями исходного уравнения. Пример 8.13. Решить уравнение х4 + 4х3 + 7х2— 4х— 8 = 0. Разложим на множители многочлен в левой части уравнения: х4+4х3 + 7х2 — 4х—8 = = (х4 —х2) + (4х3 —4х) + (8х2 —8) = х2(х2 — 1) +4х(х2— 1) +8(х2-1) = (х2— 1 > X X (х2 + 4х + 8). Следовательно, уравнение примет вид (х2—1) (х2 + 4х + 8) =0, откуда х2— 1 =0, х2 + 4х + 8 = 0; х, = — 1, х2= 1, х3= —2 + 27, х4 = — 2 — 21. 8.6. Решение алгебраических уравнений способом разложения многочлена на множители Если ai,a2.....a„ — корни многочлена f(x) =aox" + aix"_'+...+ + a„_ix + a„, то уравнение (8.9) можно записать так: а0(х —а,) (х —аг) ... (х—а„)=0. Если а и а — сопряженные комплексные корни, то (х —а)(х —а) = = х2 + рх + (?, где р и q— действительные числа (р = —(а + а), <? = аа). Предположим, что левая часть уравнения (8.9) разложена на множители вида х — с и х2 + рх+р. Приравнивая нулю каждый множитель, получаем урав- нения, каждое из которых является линейным или квадратным. Корни этих уравнений будут корнями уравнения (8.9). Пример 8.14. Решить уравнение х3 — 5х2 + 8х —6=0. Разложим на множители многочлен в левой части уравнения: х3 —5х2 + 8х —6 = х3 —Зх2 —2х2 + 6х + 2х —6 = х2(х — 3) — 2х(х-3) + + 2(х — 3) = (х —3) (х2 —2х + 2). Данное уравнение принимает вид (х —3) (х2 —2х + 2) =0 и распадается на два уравнения: х —3 = 0, х2 —2х + 2 = 0, которые имеют корни Xi=3, х2= 1 — i, Хз= 1 +«. Пример 8.15. Решить уравнение х4 — 5х3+5х2 + 5х —6 = 0. Так как х4 —5х3 + 5х2 + 5х —6 = х4—5х3+5х2 + 5х—5—1 = (х4—1) + ( —5х3 + + 5х2) + (5х —5) = (х2—1) (х2+1) —5х2(х—1) + 5(х - 1) = (х2—1)(х2+1) — — 5(х—1)(х2— 1) = (х2 — 1)(х2+1— 5(х— 1)) = (х2— 1)(х2-5х + 6), то (х2 — — 1) (х2 —5х + 6) =0, откуда х2 —1=0, х2 — 5х + 6 = 0, Xi = — 1, х2 = 1, х3 = 2, х4 = 3. Пример 8.16. Решить уравнение х4 + 4х3 + 7х2 — 4х—8=0. Поскольку х4 + 4х3 + 7х2 —4х —8 = х4 + 4х3 + 8х2 —х2 —4х —8 = (х4 — х2) + + (4х3 —4х) + (8х2 —8) = х2[х2-1)+4х(х2-1)+8(х2—1) = (х2—1)(х2 + 4х + + 8), то (х2 — 1) (х2 + 4х + 8) =0, х2 — 1 =0, х2+4х + 8 = 0, xi = — 1, х2 = 1, х3 = = — 2 + 2i, ,х4 = — 2 — 21. Пример 8.17. Решить уравнение х5 —х4 —81х + 81 =0. Так как х5—х4 — -81х + 81=х4(х—1)—81(х-1)= (х— 1) (х4 — 81) = (х—1) (х2 —9) (х2+9), то (х — 1) (х2 —9) (х2 + 9) =0, откуда х — 1 =0, х2 —9 = 0, х2 + 9 = 0; Xi = 1, х2= — 3, х3 = 3; х4=—3i, x5 = 3i. Замечание. Алгебраические уравнения п-й степени (п^5) в общем случае в радикалах не решаются, т. е. не существует формул, которые давали бы возможность вычислить корни уравнения по его коэффициентам. Это впервые доказал норвежский математик Н. X. Абель. Однако имеются частные виды уравнений любой степени, разрешимые в радикалах (например, х" = а). Вопрос о том, каково необходимое и достаточное условие для того, чтобы алгебраи- ческое уравнение решалось в радикалах, исследовал французский математик Э. Галуа. 122
8.7. Разложение дробной рациональной функции в сумму элементарных дробей Целой рациональной функцией называют алгебраический многочлен. Дробной рациональной функцией или рациональной дробью называется отношение двух многочленов: о (м = = 00^ + 01^""'+---+Ол~1Х4-Оп ,8 26) Qm(x) ЬоХ" Ь\Х" 1 4“ ... 4" Ьп— lX-f- bm Если m> n, то рациональная дробь называется правильной. Элементарными дробями называются рациональные дроби вида А Вх -|- С (х-с)я ' (x2+px+q)" ' где п, т — натуральные числа; с, р, q, А, В, С — действительные числа; (р2/4) — — q<zO (корни трехчлена x2 + px + q являются комплексными). Всякую правильную рациональную дробь можно разложить в сумму эле- ментарных дробей на основании следующей теоремы. Теорема 8.5. Если дана правильная рациональная дробь (8.26) и Q(x) = (x—ct)n' ... (х— d)n'(x2+pix + pi)m' ... (x2 + psx + <7s)ms, где ci(i—1,2,..., г) — попарно различные действительные корни многочлена Q(x) кратности nr, х2 + р4х + <7*= (х —аЦ (х —а*), где а» и а* (й = 1,2, ... , s) — попарно различные при разных k корни многочлена (?(х) крайности mt, то существуют действительные числа A"(j = I, 2.г; п=1,2....щ), ВТ, СТ (k = 1,2, ... , s; m=l,2.mk) такие, что Р{х) _ Д| Д2 Д"1 Q(x) х — с\ + (х —cj2 (х—Ci)"1 Bjx+C; В\х+С\ В™'х + С?' + -- + + - + -т^т—+- X +Р1Х + Р1 (х2 + р,х + р1)2 (x2 + pix + <?i) В'х+С‘ Bfx + C2 ДГ-х + СГ’ x2 + psx+ps (х2 + psx + qs)2 " (x2 + psx + qs)m' Отметим, что каждому действительному корню с кратности / соответствует сумма I элементарных дробей вида Д/(х—с)": Д| . Дг . . Ai х — с (х —с)2 (х—-с)1 ’ а каждой паре комплексно-сопряженных корней а и а (таких, что (х —а) (х —а) =х2 + рх + р) кратности m — сумма элементарных дробей вида (Bx + C)/(x2 + px + q)-. B]X-\-Ci В?Х-\-С2 . . BmX-[-Cm x2 + px + q (x2+px + q)2 (x24-px + <7)m 123
Пример 8.18. Разложить в сумму элементарных дробей рациональную дробь (7х2 — х + 1) / (х3 + 1). Так как х3 + 1 = (х + 1) (х2 — х + 1), то искомое разложение имеет вид 7х2—х+1 _ 7х2- х+1 _ А Вх+С х34-1 ~ (х+1) (х2 —х+1) х + 1 X2 —х+1 где коэффициенты А, В, С пока не определены. Приводя к общему знаменателю правую часть и сравнивая коэффициенты при одинаковых степенях х, получаем 7х2 —х+1 _ (Д + В)х2+ (В + С —4)х + Л + С х3 +1 “ х3 +1 7х2 —х+1 = (Л + В)х2+ (В + С — Л)х+ (Л+С), Л + В = 7, В + С — Л= —1, Л + С=1. Из этой системы уравнений находим Л=3, В = 4, С=—2. Следовательно, 7х2 —х+1 _ 3 4х —2 х3+1 ~ *+1 + х2 —х+1 Пример 8.19. Разложить в сумму элементарных дробей рациональную дробь (х2 + х+1)/(х3 — Зх + 2). Разлагая знаменатель на множители, получаем х3— Зх + 2=х3—х — 2х — — 2 = х(х2—1) — 2(х—1) = (х—1) (х(х+1) — 2) = (х—1) (х2—1) + (х—1) = (х — -1)2(х + 2). Данную рациональную дробь представим в виде суммы элементарных дробей х2 + %+1 _В_ __С__ х2 —Зх + 2 х + 2 х—1 (х-1)2 ' ’ откуда х2 + х+1=Л(х-1)2 + В(х-1)(х + 2)+С(х-Н2)( (II) или х2 + х+1 = (Л + В)х2+(В + С —2Л)х+(Л—2В + 2С). Сравнивая коэффициенты при одинаковых степенях, получаем уравнения Л + В = 1, В + С —2Л = 1, Л —2В + 2С=1, из которых находим Л = 1/3, В = 2/3, С=1. Следовательно, разложение (I) примет вид х2 + х+1 12 1 Х3-Зх + 2 3(х+2) ' 3(х—1) + (х-1)2' Замечание. Коэффициенты Л, В, С разложения (I) можно получить и другим способом. Полагая в тождестве (II) х=1, получаем 3 = С-3, С=1. Положив в этом тождестве х=—2, получим 3 = Л( — З)2, откуда Л = 1/3. Ана- логично при х = 0 находим 1 =Л — 2В + 2С, В = 2/3.
Г л а в a 9 ЛИНЕЙНЫЕ ПРОСТРАНСТВА 9.1. Линейное пространство. Подпространство Линейным действительным пространством или векторным действитель- ным пространством называется множество V элементов х, у, z, ... , для которых определены операции сложения элементов и умножения элемента на действи- тельное число, удовлетворяющие следующим аксиомам: I. х4-у=у 4-х, II. (х-|-у)4- + z=x-|- (y-f-z), III. Существует нулевой элемент 0 такой, что х4-0 = х, IV. Для каждого xelz существует противоположный элемент —х такой, что х4~( — х)=0, V. 1-х = х, VI. <z((Jx) = (а(5)х, VII. а(х4-у) =ах4-ау, VIII. (а-Ь 4-₽)х = ах4-0х. Эти аксиомы выполняются соответственно для всех х, у, zel', а,[1ек. Элементы действительного линейного пространства называются векторами. Замечание. Аналогично определяется комплексное линейное простран- ство: вместо множества R действительных чисел рассматривается множество С комплексных чисел. Из определения линейного пространства вытекают следующие утвержде- ния. 1. В линейном пространстве имеется единственный нулевой элемент. 2. Для любого элемента х линейного пространства существует единственный элемент —х. 3. Для элемента —х противоположным будет элемент х. 4. Для любого элемента х произведение 0х = 0, где 0 — нуль, 0 — нулевой элемент. 5. Для любого элемента х ( —1)х=—х, где ( — х) —элемент, противо- положный х. 6. Для любого числа а произведение а0 = 0, где 0 — нулевой элемент. 7. Если ах = 0 и а=/=0, то х = 0. 8. Если ах = 0 и х=#=0, то а = 0. Равенство ах = 0 выполняется тогда и только тогда, когда а = 0 или х = 0. Замечание. Сумму х-р(—у) обозначают х—у и называют разностью элементов х и у. Примеры линейных пространств. 1. Множество V3 всех свободных векторов a(ai,a2, аз), для которых опре- делены сложение и умножение вектора на число так, как в п. 3.2, является линейным пространством. Отметим, что роль нулевого элемента здесь играет нуль-вектор; для любого вектора а противоположным является —а. Аксиомы I —VIII выполняются, о чем свидетельствуют формулы п. 3.2. 2. Множество всех матриц размеров тХп, для которых определены сло- жение матриц и умножение матрицы на число соответственно формулами (5.2), (5.4). Роль нулевого элемента здесь играет нулевая матрица; для матрицы противоположной является матрица (—а^)„п. Аксиомы I — V1III вы- полняются (см. п. 5.2, свойства 1—8 линейных операций над матрицами). 3. Множество {Р„(х)| всех алгебраических многочленов степени, не пре- вышающей натурального числа п, для которых операции сложения многочле- нов и умножения многочлена на действительное число определены обычными правилами. Нулевой элемент — многочлен, все коэффициенты которого равны нулю; для многочлена Р„(х) = aox"4-aix',_ 1 4- • • • + arl_lx-)-a„ противоположным будет —Р,(х) = —аох"—a,*"-1 — • • • —a„-ix — а„. 125
Замечание. Множество всех многочленов степени, точно равной на- туральному числу п, не является линейным пространством, так как сумма двух таких многочленов может оказаться многочленом степени ниже п (т. е. не при- надлежать рассматриваемому множеству). 4. Множество Ап, элементами которого являются упорядоченные совокуп- ности п действительных чисел (х,, х2, ... , х„). Каждый элемент этого множества будем обозначать одним символом, например х, у, ... , и писать х=(х,,х2, ... ... ,хл), у= (i/i, 1/2.Уп),... Действительные числа xi,x2.х„ называют ко- ординатами элемента х. Линейные операции над элементами А„ определяются формулами х + у= ((xi +t/i), (Х2 + 1/2).(х„4-1/„)), ах= (ахь ах2...ах„). Отметим, что элемент 0= (0,0, ... , 0) является нулевым, элемент —х = = ( — Xi, —х2,... , —хп) —противоположным элементу x=(xi,x2, ... ,х„). 5. Множество С[а, 6] всех функций х=х(/), определенных и непрерывных на отрезке [а,/>]. Операции сложения этих функций и умножения функции на число определяются обычными правилами. Нулевым элементом является функ- ция х(1)з0 для всех /е [а, 6]. Элементом, противоположным элементу х(/), будет — x(t). Множество IVczV называется подпространством линейного пространства К, если выполняются следующие условия: 1. В множестве W определены те же операции, что и в множестве V. 2. Если х, ye W, то х + уе W. 3. Если хе IV, то axelV. Очевидно, всякое подпространство IV линейного пространства V явля- ется линейным пространством, т. е. в IV выполняются аксиомы I — VIII. Прежде всего, в IV имеется нулевой элемент 0: если хе IV, то 0x = 0e IV. Для любого элемента хе IV имеется противоположный элемент —х: если хе IV, то (— 1)х = = - хе IV. Отметим, что нулевой элемент 0 линейного пространства V образует под- пространство этого пространства, которое называют нулевым подпространством. Само линейное пространство V можно рассматривать как подпространство этого пространства. Эти подпространства называют тривиальными, а все другие, если они имеются, — нетривиальными. Приведем примеры нетривиальных под- пространств. 1. Множество V2 всех свободных векторов a(ai,a2), параллель- ных некоторой плоскости, для которых обычным образом определены опера- ции сложения векторов и умножения вектора на число, представляет подпрост- ранство линейного пространства V3. 2. Множество Vi всех свободных векторов а (а,), параллельных некоторой прямой, также является подпространством ли- нейного пространства V3. 3. Множество (Рп_,(х)) всех алгебраических мно- гочленов степени, не превышающей натурального числа п — 1, является под- пространством линейного пространства { Рп(х) ). 9.2. Линейная зависимость и линейная независимость векторов линейного пространства Рассмотрим векторы (элементы) Х|, х2..хп линейного пространства. Вектор у= <xiXi + tz2x2+ • • • -)-а„х„, где си, а2,..., «„ — некоторые числа, назы- вается линейной комбинацией векторов х>, х2,... , х„, а числа ai, а2,..., ая— коэффициентами этой линейной комбинации. Если все числа a,- (i = 1,2, ... , п) равны нулю, то линейная комбинация называется тривиальной. Если хотя бы одно из чисел а, отлично от нуля, линейная комбинация называется нетривиальной. Система векторов xi,x2..х„ (9.1) называется линейно зависимой, если существуют числа ai.az..а.п, (9.2) не все равные нулю, такие, что a,Xi + а2х2-|---|-а„х„=0. (9.3) 126
Если таких чисел не существует, т. е. равенство (9.3) выполняется только в случае <xi = а2 = • • • =ал — 0, (9.4) то система векторов (9.1) называется линейно независимой. Другими словами, векторы (9.1) называются линейно зависимыми, если существует их нетривиальная линейная комбинация, равная нуль-вектору, и линейно независимыми, если только их тривиальная линейная комбинация явля- ется нуль-вектором. Из определения линейной зависимости и линейной независимости векторов вытекают следующие утверждения. 1. Всякая система векторов, содержащая нуль-вектор, является линейно зависимой. 2. Если k(k<.n) векторов системы (9.1) линейно зависимы, то и вся сис- тема линейно зависима. 3. Если из системы линейно независимых векторов Xi, х2, ... , х„ отбросить г(г<.п) векторов, то оставшиеся векторы образуют также линейно незави- симую систему. 4. Если среди векторов системы (9.1) имеются такие векторы xj и хт, что Х4 = Хх„, где А. — некоторое число, то система (9.1) линейно зависима. Теорема 9.1. Векторы хь х2........х„ линейно зависимы тогда и только тогда, когда хотя бы один из них является линейной комбинацией всех остальных. Эта теорема выражает необходимое и достаточное условие линейной за- висимости п векторов Xi, х2, ... , х„. Два вектора линейного пространства называются коллинеарными, если они линейно зависимы, и неколлинеарными, если они линейно независимы. Три век- тора линейного пространства называются компланарными, если они линейно зависимы, и некомпланарными, если они линейно независимы. Введенные по- нятия коллинеарности и компланарности векторов линейного пространства совпадают с известными из аналитической геометрии понятиями коллинеарности и компланарности обычных векторов. 9.3. Размерность и базис линейного пространства. Изоморфизм линейных пространств Число п называется размерностью линейного пространства У, если выполняются следующие условия: 1) в V существует п линейно независимых векторов; 2) любая система « + 1 векторов из У линейно зависима. Размер- ность линейного пространства V обозначают dim У (от французского слова dimension — размерность). Если пространство состоит из одного нулевого эле- мента, то его размерность считают равной нулю. Размерность линейного про- странства — это наибольшее возможное количество линейно независимых эле- ментов в нем. Понятие размерности согласуется с наглядным представлением о ней; так, пространство Уз всех свободных векторов является трехмерным (dim Уз = 3), пространство У2— двумерным, пространство У:—одномерным. Базисом n-мерного линейного пространства V„ называется любая упоря- доченная система п линейно независимых векторов этого пространства. При- ведем примеры базисов некоторых линейных пространств. Базис пространства Уз образует любая тройка некомпланарных векторов, так как эти векторы ли- нейно независимы (см. теорему 3.4), и любая четверка векторов линейно зави- сима (см. теорему 3.6). Базис пространства Уг образуют два любых некол- линеарных вектора, поскольку они линейно независимы (см. теорему 3.2), и любой вектор плоскости, определяемой этими двумя векторами, можно разложить по ним (см. теоремуЗ.З). Базисом линейного пространства У> является любой ненулевой вектор, коллинеарный данной прямой. Линейное пространство, в котором имеется базис, состоящий из конечного числа векторов, называется конечномерным. Примерами конечномерных прост- ранств являются пространства Vt, У2, Уз, Ап. 127
Линейное пространство Ап является n-мерным, а его базис образует система векторов е, = (1,0, ... , 0), е2= (0, 1, 0, ... , 0), е„ = (0, 0, ... , 0, 1). Линейное пространство называется бесконечномерным, если при любом на- туральном числе т в нем найдется т линейно независимых векторов. При- мером бесконечномерного пространства может служить линейное пространство С[а, ft] всех функций x = x(t), определенных и непрерывных на отрезке [а, 6]. Два линейных пространства И и U называются изоморфными, когда между их элементами можно установить взаимно однозначное соответствие такое, что если Х1++у,, х2-<-<-у2, где хь x2el'’, yi,y2et/, то (xi +х2)**(У1 + уг), axi-way,, где а — действительное число. Теорема 9.2. Два линейных пространства изоморфны тогда и только тогда, когда они имеют одинаковую размерность. В частности, пространство V3 (всех свободных векторов) и пространство Аз (всех упорядоченных троек действительных чисел) изоморфны. Отметим также, что каждое конечномерное линейное пространство размерности п изоморфно линейному пространству Л„. 9.4. Координаты вектора линейного пространства Теорема 8.3. Если ei, е2,..., еп— базис линейного п-мерного про- странства Vn, то любой вектор х этого пространства линейно выражается через базисные векторы ei, е2,... , е„, т. е. x = atei+а2е2-|----(-але„. (9.5) Коэффициенты а,, а2, ... , ап этого разложения определяются однозначно. Выражение (9.5) называется разложением вектора х по базису еье2..е„. Координатами вектора х в базисе ei, е2, ... , е„ называются коэффициенты ои, а2, ... , <хп в разложении этого вектора по данному базису, т. е. в формуле (9.5). Если вектор х в некотором базисе имеет координаты ои, а2, ... , то пишут х= (оы, а2...а«), или х(си, а2..аД. Операции над векторами сводятся к операциям над их координатами на основании следующих свойств. 1. Вектор является нулевым вектором линейного пространства тогда и только тогда, когда все его координаты в любом базисе равны нулю. 2. Координаты суммы двух векторов в некотором базисе равны сумме со- ответствующих координат данных векторов в том же базисе. 3. Координаты произведения вектора на число равны произведению со- ответствующих координат на это число (в одном и том же базисе). 4. Два вектора равны тогда и только тогда, когда равны их соответствую- щие координаты в одном и том же базисе. 5. Вектор у является линейной комбинацией векторов xi,x2,... ,х„ тогда и только тогда, когда каждая координата вектора у является такой же линейной комбинацией соответствующих координат этих векторов в одном и том же базисе. Пример 9.1. Пусть Л4— четырехмерное линейное пространство с бази- сом ei,e2, ез, е4. Найти координаты векторов ез и х = 3е,—5ез + 7е4 в этом базисе. Представим каждый из векторов ез и х в виде (9.5). Так как ез = 0е| + + 0е2-|-1ез + 0е4, то вектор ез имеет координаты (0, 0, 1, 0). Поскольку х = = 3е> +0е2 — 5ез + 7е4, то вектор х имеет координаты (3, 0, —5, 7). Пример 9.2. В некотором базисе даны векторы х(1, 2, —2, —1, 3), у (4, —3, —2, 1, —1). Найти координаты вектора 5х —Зу. Так как 5х=(5, 10, —10, —5, 15), —Зу = (—12, 9, 6, —3, 3), то вектор 5х — Зу = 5х+ ( — Зу) имеет координаты ( — 7, 19, —4, —8, 18). 128
9.5. Ранг системы векторов линейного пространства Рассмотрим систему т векторов ai = (ai 1, 021, ••• , 1) a2=(ai2, Я22......а„2) (9.6) Вт = (О|т. «2т, , Опт) линейного «-мерного пространства, координаты которых заданы в одном и том же базисе. Системе векторов (9.6) поставим в соответствие матрицу Дц Д12 ••• d\m А= Д21 а22 ••• &2т (9.7) _ @nl Дд2 ••• Clnm . в k-м столбце которой записаны координаты вектора а*(£=1,2.....т). Мат- рицу (9.7) называют матрицей системы векторов (9.6) в данном базисе, а ранг этой матрицы — рангом системы векторов а,, а2,... , ат. Обратно, если дана матрица (9.7), то ей можно поставить в соответствие систему (9.6) т векторов линейного «-мерного пространства. Согласно свойству 5 п. 9.4, будем говорить, что столбцы матрицы (9.7) линейно зависимы, если векторы (9.6) линейно зависимы и обратно. Теорема 9.4. Для того чтобы m векторов п-мерного линейного простран- ства были линейно независимы, необходимо и достаточно, чтобы ранг матрицы этой системы был равен т. Следствие 1. Система п векторов п-мерного линейного пространства линейно независима тогда и только тогда, когда матрица этой системы векторов является невырожденной. Следствие 2. Если ранг матрицы системы m векторов линейного простран- ства равен г, то максимальное число линейно независимых векторов этой системы равно г. Пример 9.3. Найти максимальное число линейно независимых векторов в системе а> (1, 1, —1, —1), а2(1, 2, 3, 4), аз(8, 7, 6, 5), а4(— 1, —1, 1, 1). Матрица данной системы векторов имеет вид ’ 1 1-1 -II ! 2 3 4 А~ 8 7 6 5 ' .-1 -1 1 1. Так как ранг этой матрицы равен 3 (см. пример 5.16), то максимальное число линейно независимых векторов этой системы равно 3. Теорема 9.5. Максимальное число линейно независимых строк всякой матрицы равно максимальному числу ее линейно независимых столбцов, т. е. равно рангу этой матрицы. 9.6. Преобразование координат вектора при изменении базиса В линейном «-мерном пространстве Vn фиксируем два базиса ei, е2,... ,е„, (9.8) е(, е$,... ,е;. (9.9) Матрицей перехода от базиса (9.8) к базису (9.9) называется матрица системы 129
векторов (9.9) в базисе (9.8). Каждый вектор системы (9.9) можно разложить по базису (9.8). Пусть (9.10) е' =/це| +/2162+ ... + 6пел, 63 = ^1261 -(-/2262+ ... Н“^п2в«, еп = Л«С1 Н-/2Лег+ ... -|-/ллел, тогда матрица перехода от базиса (9.8) к базису (9.9) имеет вид -tlt Л2 ... t In Т= 61 <22 ... Gn (9.11) 1п2 ... inn Матрица перехода от одного базиса к другому невырожденная (так как базисные векторы линейно независимы). Всякую невырожденную матрицу п-го порядка можно рассматривать как матрицу перехода от одного базиса п-мерного линейного пространства к другому базису этого пространства. Очевидно, матри- ца Т~', обратная матрице (9.11), является матрицей перехода от базиса (9.9) к базису (9.8). Теорема 9.6. Если хь х2....хп — координаты вектора х в базисе ei, е2,... ... ел; xj, Хз.х' —координаты того же вектора в базисе е(, е'2,..., е', го где Х=ТХ', (9.12) (9.13) Т — матрица, определяемая формулой (9.11). Замечание. Теорема 9.6 выражает старые координаты Х1,Хг,... ,хя вектора х через его новые координаты. Чтобы получить формулы, выражающие новые координаты через старые, умножим слева равенство (9.12) на матрицу Г-1, обратную матрице Т, получим Т~ 1Х— Т~1ТХ', Т~'Х = Х' или Х’=1 'X. Пример 9.4. В пространстве V2 рассмотрим базис ei=i, e2=j, где i, j — орты, и базис e(=i', e2=j', где i', j' — орты, причем 1' образует с i угол <р (рис. 9.1). В данном случае i' = i cos q> + j sin ср, j' =—i sin <p + j cos <p. Матрица пере- хода от базиса i, j к базису i', j' имеет вид [cos <р sin ср — sin ср cos <р Если вектор а имеет координаты х, у'в базисе i, j; х', у' — в базисе i', j', то x=x'cos ср — c/'sin ср, c/ = x'sin <p-f-t/'cos ср. 9.7. Евклидово пространство Определение евклидова пространства. В линейном действительном пространстве V, кроме операций сложения векторов и умножения вектора на действительное число, введем еще одну операцию, которую назовем скалярным умножением векторов. Каждой упорядоченной паре векторов х, yeV поставим в соответствие действительное число, которое назовем их скалярным произведе- но
нием и обозначим (х, у). Потребуем, чтобы для любых х, у.ге/ и любого числа aeR выполнялись следующие аксиомы: I. (х, у) = (у, х), II. (х + у, z) — = (х, z)-|-(у, z), III. (ах, у) = а(х, у), IV. (х, х)>0 для всех х=#=0, (х, х)=0 для х = 0 Очевидно, скалярное произведение равно нулю, если хотя бы один из векто- ров нулевой: (0, у) = (Ох, у) =0(х, у) =0. Скалярное произведение (х, х) вектора х на себя называется скалярным квадратом этого вектора и обозначается х5, т. е. (х, х)=х2. (9.14) Евклидовым пространством называется линейное действительное пространст- во, в котором задана операция скалярного умножения векторов, удовлетворяющая аксиомам I — IV. Если n-мерное линейное пространство является евклидовым, то будем называть его евклидовым n-мерным пространством, а базис этого линейного пространства — базисом евклидова пространства. Примеры евклидовых пространств. 1. В линейном пространстве V3 скалярное произведение двух векторов а и b определим так, как в п. 3.6; аксиомы I — IV для него будут выполнены (см. свойства скалярного произведения и определение скалярного квадрата вектора). Следовательно, линейное пространство V3 всех свободных векторов с обычным определением скалярного произведения является евклидовым пространством. 2. Рассмотрим n-мерное линейное пространство А,, упорядоченных совокуп- ностей п действительных чисел. Скалярное произведение двух его элементов х= (xi, %2, ... , х„), у= (yi, t)2,... , уп) по аналогии с формулой (3.21) определим соотношением (X, у) =Х1у1+ХгУ2 + -+ХпУп- (9.15) Легко видеть, что все аксиомы I — IV скалярного произведения при этом выполняются. Таким образом, рассматриваемое линейное пространство со ска- лярным произведением (9.15) является евклидовым пространством, его обозна- чают Е„. 3. В бесконечномерном линейном пространстве С [а, 6] всех функций, непре- рывных на отрезке [a, ft], скалярное произведение двух его функций x(t), y(t) определим формулой ь (х,у)=\ x(t)y(t)dt. (9.16) а Непосредственной проверкой можно убедиться в том, что аксиомы I — IV ска- ь лярного произведения будут выполнены, в частности (х, х) = J x2(t)dt>0 при а х(1)=/=0, (х, х)=0 при x(/)s0. Следовательно, линейное пространство С [a, ft] с указанным определением скалярного произведения любых двух его элементов является евклидовым пространством. Норма вектора евклидова пространства. Нормой вектора евклидова про- странства называется арифметическое значение корня из скалярного квадрата этого вектора. Норму вектора х обозначим ||х||, тогда по определению 1|Х|| =V(x, X) =т/х7. (9.17) Норма вектора обладает следующими свойствами: 1) ||х|| =0 тогда и только тогда, когда х = 0; 2) ||ах|| = |а| • ||х||, где а — действительное число; 3) |(х,у)|<||х||-||у||; 4) ||х + у|К||х|| + ||у||. Неравенством Коши — Буняковского называют неравенство I (х, у) | < ||х|| • ||у||, (9.18) а неравенством треугольника — неравенство Цх + у11 «S 1|Х||+ ||у||. (9.19) 131
Запишем норму и неравенства (9.18), (9.19) для векторов (элементов) каж- дого из рассмотренных выше евклидовых пространств. В евклидовом пространстве У3 с обычным определением скалярного произ- ведения норма вектора совпадает с его длиной, т. е. ||а|| = |а|; это следует из формул а2=|а|2 и (9.17). Неравенства (9.18) и (9.19) принимают соответ- ственно вид | (а, Ь) | |а| • |Ь|, |а + Ь| |а| + |Ь|. Отметим, что неравенство I (a, b) | < |а| |Ь| следует из формулы (3.18). Неравенство Ia-J-b] < |а| 4* |Ь| следует из определений суммы векторов jh длины вектора; оно имеет простой геометрический смысл (в треугольнике сумма длин двух сторон больше длины третьей стороны). В евклидовом пространстве С[а, Ь] норма элемента x(t) определяется формулой 1|Х(О11 = д/ 5 x2(t)dt, а неравенства (9.18) и (9.19) принимают вид * /1 /"5-------- 5 j x2(t)dt~yl j y2(t)dt, a * a ’. a $ (x(t)+y(t))2dt^-^ j x2(t)dt+~\J j y2(t)dt. В евклидовом пространстве En co скалярным произведением (9.15) норма элемента х= (х,, х2,... , х„) определяется формулой IIXII = ^x'f + xl+...+x2„. а неравенства (9.18) и (9.19) принимают вид I Xiy, + х2у2 + „. +х„уп\^х21+х22 + ...+х2п^у21+у22 + ...+у2, л/(Х1 +1/1 ) 2 + (^г +j/2)2 + -.. + (Xn+j/л)2 < Vх? + х2 + --- +хл + Vl/l +1/2 + ---+1/2- Угол между двумя векторами евклидова пространства. Углом между двумя векторами хну евклидова пространства называется угол <р, для которого C0S<P= 11ХЫУ11 (0^<Р<2л). (9.20) Отметим, что в пространстве V3 всех свободных векторов введенное понятие угла совпадает с понятием yrJia, рассматриваемого в векторной алгебре. Два вектора евклидова пространства называются ортогональными, если их скалярное произведение равно нулю. Очевидно, нулевой вектор ортогонален любому другому вектору. В пространстве Уз ортогональность векторов означает их перпендикулярность. Из определений следует, что ненулевые векторы х и у ортогональны тогда и только тогда, когда cos ip = 0. Равенство I (X, у) I = ||х||. ||у|| (9.21) выполняется тогда и только тогда, когда х и у коллинеарны (у = ах). Дру- гими словами, в формуле (9.18) равенство достигается лишь в случае кол- линеарности векторов хну. 132
Ортонормированный базис. Система векторов a[,a2,... , а„ называется орто- гональной, если эти векторы попарно ортогональны, т. е. (а,, а*)=0 при i^i=k. Теорема 9.7. Ортогональная система ненулевых векторов линейно независима. Вектор а называется нормированным или единичным, если ||а|| = 1. Если а — ненулевой вектор, то каждый из векторов яо____ я°_____________Z— 1 Hall ’ 2 ||а|| (9.22) будет нормированным. Нахождение для данного вектора нормированного вектора по формулам (9.22) называется нормированием данного вектора, а множитель ц= 1/± || а || — нормирующим множителем. Система векторов ei.ea,... ,еп называется ортонормированной, если она ортогональна и каждый вектор является нормированным, т. е. О, при i=t=k, 4, при i = k, (е<,еЛ) = | (9.23) где г, k = 1,2, ... , п. Базис n-мерного евклидова пространства называется ортонормированным, если базисные векторы образуют ортонормированную систему. Теорема 9.8. Во всяком евклидовом п-мерном пространстве (п^2) существует ортонормированный базис. Выражение скалярного произведения через координаты векторов в орто- нормированном базисе. Пусть в n-мерном евклидовом пространстве фиксиро- ван ортонормированный базис ei,e2,... ,ел и даны векторы этого пространства х=Х|е1+х2е2 + ...+хлел, y=i/,ei +t/2e2 + ... + </„e„. (9.24) Скалярное произведение этих векторов выражается формулой (х, у) =xiyi+x2y2 + ... +х„уп. (9.25) Отсюда следует, что || х || =л/(»-х) =-7*?+*г + -+4 9.8. Унитарное пространство Комплексное линейное пространство U называется унитарным прост- ранством, если каждой паре векторов х,уе(/ поставлено в соответствие комплексное число, обозначаемое (х, у) и называемое скалярным произведе- нием векторов х и у, причем выполняются следующие аксиомы: I. (х, у) — = (у,х), II. (х + у, г) = (х, z) + (у, г), III. (ах, у) = а(х, у), IV. (х,х)>0, если х^=0 для всех х, у,zeU и всех аеС(С — множество комплексных чисел). Замечание. Черта означает комплексную сопряженность: (у, х) — комплексное число, сопряженное комплексному числу (х, у). Из аксиом скалярного произведения в унитарном пространстве вытекают следующие свойства: 1) (х, у-j-z) = (х, у) + (х, z) для любых x,y,ze(7; 2) (х, ау) =а(х, у) для любых х.уеЬ' и любого аеС; 3) (0, х) = (х, 0) =0 для любого хе 77; kt kt 4) ( X а‘х" X Р^/) = X X а/Р/(хь 1/у). <=1 /=1 /=1 /=1 Примером унитарного пространства является множество Сл упорядоченных систем п комплексных чисел x=(ai,a2......a„), y=(p,,p2....р„).... для которых скалярное произведение определено формулой 133
(х, у) =aiPi +а2₽2 + ... + алрл, где (J* — комплексное число, сопряженное числу 0* (k= 1,2,... , п). Унитарным преобразованием комплексного линейного пространства назы- вается линейное преобразование, сохраняющее положительно определенную эрмитову форму xtxi-\-x2X2-\-...+х„х„, где xi, х2,... , х„— координаты вектора пространства. В ортонормированном базисе относительно эрмитова произведения, задаваемого этой формой, унитарное преобразование записывается унитарной матрицей. Унитарной матрицей называется квадратная невырожденная матрица А, удовлетворяющая условию А~'=АТ, где Д_| — обратная матрица, Ат — транспонированная и комплексно-сопряженная матрица. Определитель унитарной матрицы по модулю равен единице. Все характеристические корни унитарной матрицы по модулю равны единице. Всякая (действительная) ортогональная матрица есть в то же время унитарная матрица.
Глава 10 ЛИНЕЙНЫЕ ПРЕОБРАЗОВАНИЯ (ЛИНЕЙНЫЕ ОПЕРАТОРЫ) 10.1. Линейное преобразование и его матрица Если указано правило f, по которому каждому вектору х линейного пространства V ставится в соответствие единственный вектор у этого простран- ства, то будем говорить, что в нем задано преобразование (отображение, опе- ратор) f или задано преобразование пространства V в себя, и писать Говорят также, что преобразование f переводит вектор х в вектор у, и пишут у=/(х). Вектор у называют образом вектора х, а х—прообразом вектора у. Преобразование, при котором каждый вектор имеет единственный прообраз, называется взаимно однозначным (или биективным). Преобразование f линейного пространства V называется линейным пре- образованием (линейным оператором), если для любых векторов этого простран- ства Х|,х2,х и любого действительного числа Л выполняются условия 1) Hx>+X2)=f(*l)+f(X2); 2) /(Лх)=А/(х). (Если рассматривается комплексное пространство, то X — любое комплексное число.) Из этих условий следует, что f(ax1+₽x2)=af(x1)+pf(x2), (10.1) где а, 0— любые числа (действительные или комплексные). Обратно, из ра- венства (10.1) следуют условия 1) и 2). Итак, линейное преобразование (ли- нейный оператор) определяется равенством (10.1). Отметим, что линейное преобразование переводит нулевой вектор в нулевой, так как, согласно условию 2), f (0) = f(Ox) =0/'(х) =0. Простейшим примером линейного преобразования является тождественное преобразование или преобразование f(x)=x, т. е. преобразование, которое каж- дому вектору линейного пространства ставит в соответствие тот же вектор. Линейное преобразование будет вполне определено, если заданы образы ба- зисных векторов рассматриваемого пространства. Пусть f — линейное преобразование «-мерного линейного пространства, переводящее базисные векторы е,, е2,... , еп последних векторов разложим по базису: е( =Oi i*i +021*2 + ... +а„|*л, е2 =fli2ei +022*2 + ••• +<1п2*л. е'=01,1*1 +а2п*2 +... +аПл*п- Матрица Он 012 ... а;, д__ O21 а22 ... а2я оЯ1 а„2 ... Опл в векторы е;,е2,... ,*'. Каждый из 135
в которой k-й столбец состоит из координат вектора e£(fc = l,2....п), назы- вается матрицей линейного преобразования f в базисе ei,e2,... , еп; ранг г мат- рицы А называется рангом преобразования f, а число (п—г) —дефектом этого преобразования. Итак, каждому линейному преобразованию п-мерного линейного пространства соответствует матрица порядка п в данном базисе; и наоборот, каждой матрице порядка п соответствует линейное преобразование п-мерного пространства. Отметим, что матрица тождественного преобразования в любом базисе будет единичной; обратно, любой единичной матрице n-го порядка соответствует тождественное преобразование линейного п-мерного пространства. Пример 10.1. В пространстве Vi всех свободных векторов на плоскости определим преобразование поворота всех векторов вокруг начала координат на угол ф. Каждому вектору х (рис. 10.1) этой плоскости ставим в соответствие вектор y=f(x), полученный вращением вектора х на один и тот же угол <р. Это преобразование является линейным, поскольку условия 1) и 2), определяющие линейное преобразование, будут выполнены. Найдем матрицу этого линейного преобразования в базисе i, j (рис. 10.2, a, б). Так как f(l)=OA + OB = = i cos <р +j sin tp, f (j) =OC + OD= — i sin ф + j cos ф, то __Г cos ф — sin ф L sin ф cos ф 10.2. Линейное преобразование в координатах Рассмотрим линейное преобразование f п-мерного линейного простран- ства, заданное в некотором базисе е,, е2.е„ матрицей Qll Д12 ... fljn 021 fl22 ••• О’ПП (Ю.2) Координаты вектора х и его образа y=f(x) известны: х=Х1в| +х2е2 + ...+х„е„, {(х)=ухе\+у^ + --+у^. (10.3) Зависимость между координатами векторов х и у выражается формулами i/i = ai ,xi + ai2x2 +... +ainXn, yi=anXi +а22х2 -(-... +a2nXn, (10.4) y„—anlx: +an2Xi + -+annX„. 136
Формулы (10.4) можно записать в матричном виде У=АХ, (10.5) где А определяется формулой (10.2), а X и У—формулами Если переменные у\, уг,... , у„ связаны с переменными jei,jc2.хп форму- лами (10.4), то будем говорить, что задано линейное однородное преобразо- вание переменных с матрицей А, переводящее переменные xt, х2,..., ха в перемен- ные У1,уг, ... ,Уп. Оно обладает теми же свойствами, что и линейное преобразова- ние n-мерного линейного пространства. Линейное однородное преобразование переменных (10.4) или (10.5) называется невырожденным, если det Л=/=0. Замечание. При рассмотрении линейных преобразований (линейных опе- раторов) пользуются и другими обозначениями. Если у=)(х), где f — линейное преобразование (линейный оператор) с матрицей А в некотором базисе, то пишут у=Лх. Условия 1) и 2), определяющие линейное преобразование, можно записать в виде A (xi + х2) =Лх| + Лх2, Л (Хх) =Мх. 10.3. Зависимость между матрицами одного и того же преобразования в различных базисах. Подобные матрицы В n-мерном линейном пространстве фиксируем два базиса: ei, е2,... , е„ и е(, е2..ei; первый из них назовем старым, второй — новым. Предположим, что известно преобразование, переводящее старый базис в новый. Теорема 10.1. Если ei, е2.......e„,u ef, е2, —два базиса линейного пространства, А—матрица линейного преобразования в старом базисе, еь е2...е„, то матрица В этого преобразования в новом базисе е', е2.ei имеет вид В — Т~'АТ. (10.6) где Т — матрица перехода от старого базиса к новому. Следствие. Если линейное преобразование имеет невырожденную матрицу в некотором базисе, то матрица этого преобразования будет невырож- денной в любом другом базисе. Матрица В называется подобной матрице Л, если существует невырож- денная квадратная матрица С, удовлетворяющая равенству В = С~'АС. Две квадратные матрицы Л и В порядка п тогда и только тогда являются матрицами одного и того же линейного преобразования пространства У„ в соот- ветствующих базисах, когда матрица В подобна матрице Л. Пример 10.2. В базисе е,, е2 преобразование f имеет матрицу 4 1 2 J ' 8 5 Л = Найти матрицу преобразования f в базисе Так как e(=2ei+e2, e2=6ei-|-4е2. 2 6] г->=_кГ 4 -6] =г 2 -з1 1 4J ’ 2 L -1 2J L —0,5 1J ’ то по формуле (10.6) получаем 2 -0,5 -3] Г 8 41 Г 2 1J L 5 2-1’11 В = 6] [ 1 21 Г2 6 ] Г 4 14 1 4.1 L 1 0 J ’ L 1 4 J [2 б]' 137
10.4. Характеристическое уравнение линейного преобразования Теорема 10.2. Если линейное преобразование f в базисе е,, е2, ... , е„ имеет матрицу Айв базисе е(, е2.е'п — матрицу В, то det(4 — X£)=det(B — ХЕ), (10.7) где Л — любое действительное число, Е — единичная матрица п-го порядка. Отметим, что det (А—Х£) является многочленом степени п относительно X и называется характеристическим многочленом матрицы А или характеристи- ческим многочленом линейного преобразования f. Замечание. Равенство (10.7) означает, что характеристический много- член линейного преобразования остается неизменным при переходе к новому базису; матрица линейного преобразования меняется. Характеристическим уравнением линейного преобразования называется уравнение det(/4 —Х£)=0, (10.8) где А — матрица этого преобразования в некотором базисе. Очевидно, харак- теристическое уравнение не зависит от выбора базиса. Уравнение (10.8) называют также характеристическим уравнением матрицы А, а корни уравне- ния — характеристическими числами линейного преобразования f или характе- ристическими числами матрицы А. Если линейное преобразование f в некотором базисе ei, е2,... , ел имеет квадратную матрицу n-го порядка А= (а,л), то характеристическое уравнение (10.8) запишется так: ац — X ai2 ... ain а2| а22 — X ... а2л (10.9) ani ал2 ... олл X Левая часть равенства (10.9) является характеристическим многочленом матрицы А; обозначим его £Л(Х), тогда характеристическое уравнение (10.9) примет вид £Л(Х) =0. Пример 10.3. Найти характеристический многочлен и характеристи- ческие числа матрицы 4-1 -2 2 1' — 2 1-1 1 В соответствии с определением характеристического многочлена получаем РЛ(Х) = 4—X —1 —2 2 1-Х —2 1 -1 1-Х Рл(X) = (4 — X) (1 — X)2 + 4 + 2 + 2 (1 — X) + 2 (1 — X) — 2(4 — X) = — X3 + 6Х2 — -11Х + 6. Приравнивая этот многочлен нулю, находим характеристическое уравнение — Х3+6Х2—11Х + 6=0 или X3 —6Х2+1IX —6 = 0. Разлагая левую часть этого уравнения на множители X3 —6Х2+1IX —6 = Х3 —X2 —5Х2 + 5Х+6Х —6 = Х2(Х — — 1) — 5Х(Х— 1) +6(Х— 1) = (X— 1) (X2 — 5Х + 6), приводим данное уравнение к виду (X—1) (X2 —5Х+6) =0, откуда Xi = 1, Х2 = 2, Х3 = 3. Эти корни — харак- теристические числа данной матрицы. !38
10.5. Собственные векторы линейного преобразования Ненулевой вектор х линейного пространства называется собственным вектором линейного преобразования f этого пространства, если существует число k такое, что Дх)=Лх, (10.10) причем k — действительное число для действительного линейного пространства и комплексное число в случае комплексного пространства. Число k называется собственным значением вектора х относительно преобразования f. Равенство (10.10) можно записать в матричном виде АХ = кх, (10.11) где А — матрица преобразования f в некотором базисе, X — матрица-столбец из координат собственного вектора х в том же базисе. Ненулевая матрица- столбец X, удовлетворяющая уравнению (10.11), называется собственным вектором-столбцом матрицы А с собственным значением к. Собственные векторы и собственные значения обладают следующими свой- ствами. 1. Собственный вектор линейного преобразования имеет единственное собственное значение k. 2. Если х — собственный вектор линейного преобразования / с собственным числом k и Л — любое, отличное от нуля число, то >.х — также собственный вектор преобразования f с собственным значением k. 3. Если х и у — линейно независимые собственные векторы линейного пре- образования f с одним и тем же собственным значением k, то х + у — также собственный вектор этого преобразования с собственным значением k. 4. Если х и у—собственные векторы линейного преобразования f с собст- венными числами к и т, причем k=£m, то х и у линейно независимы. Следствие. Если х>, х2,... ,хя— линейно независимые собственные векторы линейного преобразования f с одним и тем же собственным значением k, то любая нетривиальная линейная комбинация этих векторов является собствен- ным вектором этого преобразования с собственным значением k. Теорема 10.3. В комплексном линейном пространстве все корни характе- ристического уравнения и только они являются собственными значениями линей- ного преобразования. Координаты собственного вектора x=(x,,x2.....хп) находятся из системы уравнений (a, j — к)Xi 4~ oi2x2 4-... 4~ ainXn — 0, a^iXi 4” (022 — к) x-г 4“ 4* а2«хп = 0, (10.12) а„ 1 Xi 4"а „2X2 4- 4-(а«-' — 0. Эта система имеет ненулевое решение тогда и только тогда, когда ее опреде- литель равен нулю (см. следствие из теоремы Крамера), т.е. Oil — к <212 П| п О21 <122— к ... в2п О„1 Оп2 Они к (10.13) Это означает, что число k является корнем характеристического уравнения. Замечания. 1. Уравнение (10.13) является алгебраическим уравнением n-й степени относительно k. Такое уравнение имеет ровно п корней, считая равные и комплексные. Среди корней этого уравнения может не оказаться действи- тельных. 139
2. Собственными значениями линейного преобразования действительного пространства являются только действительные корни характеристического уравнения. Собственные значения линейного преобразования называются также собственными значениями матрицы этого преобразования. Собственное значение называется m-кратным, если оно является /n-кратным корнем характеристи- ческого уравнения. Теорема 10.4. Корни характеристического уравнения действительной симметрической матрицы являются действительными числами. Следствие. Действительная симметрическая матрица имеет только действительные собственные векторы. Система (10.12) для определения координат собственного вектора в этом случае имеет только действительные решения, так как ац и k — действительные числа. Теорема 10.5. Собственные векторы действительной симметрической матрицы, соответствующие различным собственным значениям, ортогональны. Пример 10.4. Найти действительные собственные значения и собствен- ные векторы линейного преобразования с матрицей — 5 7 —4 9 0 5 Составляем характеристическое уравнение матрицы А 4-Х — 5 7 1 -4-Х 9 = 0 или X3 —5Х2+17Х—13=0. — 4 0 5—X Разложим на множители многочлен в левой части уравнения: X3 — 5Х2 + + 17Х- 13 = Х3 —X2-4Х2 + 4Х+ 131— 13 = Х2(Х- 1) - 4Х(Х -1) + 13(Х—1) = = (X—1) (X2 —4Х+13). Уравнение принимает вид (X—1) (X2 —4Х+13) =0, откуда Xi = l, Х2 = 2 —3/, Хз=2 + 3г. Следовательно, линейное преобразование с данной матрицей имеет только одно действительное собственное значение Х=1. Для отыскания соответствующего собственного вектора используем систему уравнений (10.12), которая принимает вид (4 —X)xi — 5х2 + 7хз = 0, Xi — (4 + Х)х2 + 9хз = 0, — 4xi + (5 —Х)х3 = 0 Зх, — 5х2 + 7х3 = 0, и *1— 5х2+9х3 = 0, — 4xi +4хз = 0 при Х=1. Решая полученную систему, находим Х|=х3, х2—2*з. Полагая х3=1, получаем собственный вектор х= (1, 2, 1). Замечание. Собственный вектор линейного преобразования определяется с точностью до произвольного множителя (см. свойство 2 собственного вектора). 10.6. Приведение матрицы линейного преобразования к диагональному виду Теорема 10.6. Матрица линейного преобразования имеет диаго- нальный вид ап 0 ... 0 0 а22 ... 0 (10.14) . 0 0 ... а„п - 140
тогда и только тогда, когда каждый базисный вектор является собственным вектором этого преобразования. Матрица А называется приводимой к диагональному виду, если существует невырожденная матрица Т такая, что матрица Т~'АТ = В является диагональ- ной. Следовательно, если матрица А приводима к диагональному виду, то О В = О ... О' Л2 ... о о о ... л„. где Л,, %2, ... , Л„— характеристические числа матрицы А. Теорема 10.7. Матрица А линейного преобразования f п-мерного линейного пространства приводима к диагональному виду тогда и только тогда, когда существует базис этого пространства, состоящий из собственных векторов данного преобразования. Если все собственные числа матрицы А попарно различны, то матрица приводится к диагональному виду. 10.7. Действия над линейными преобразованиями Произведение преобразований. Рассмотрим преобразование f, перево- дящее вектор х в вектор у, т. е. y=f(x). К вектору у применим преобразование g, переводящее вектор у в вектор г, т. е. z=g(y). Так как у = ((х), то'имеем преобразование z = g(/(x)), переводящее вектор х в вектор z, причем вектор z получен в результате последовательного применения преобразований fug. Преоб- разование, заключающееся в последовательном применении преобразований fug, называется произведением преобразования f на преобразование g или компози- цией этих преобразований и обозначается g°f (или просто gf); отметим, что справа записывается первое преобразование. Таким образом, g°f(x)=g(f(x)). (10.15) Произведение линейных преобразований является линейным преобразованием. Теорема 10.8. Если в некотором базисе линейные преобразования fug имеют соответственно матрицы А и В, то их произведение gf в том же базисе имеет матрицу ВА. Сумма преобразований. Суммой преобразований fug некоторого простран- ства называется преобразование h такое, что для любого вектора х этого про- странства /г(х)=/(х)+й(х). (10.16) Сумму преобразований fag будем обозначать f+g- Очевидно, f + g = g + f- Теорема 10.9. Если линейные преобразования f и g в некотором базисе имеют соответственно матрицы А и В, то преобразование fAge том же базисе имеет матрицу А А-В. Пример 10.5. Даны два линейных преобразования x'l = 1Х\ + 4*3, х'{=Х2 — бх'з, х2 = 4хг — 9х3, х'{ = Зх( + 7хз, Хз = ЗХ|+х2, Хз=Х14-Х2—Хз. Средствами матричного исчисления найти преобразование, выражающее Х[', х'{, х'з через xi, х2, х3. Первое преобразование задано матрицей А, второе — матрицей В, где 7 0 4 Го 1 —6 А = 0 4—9 3 1 0. Св II 3 0 7 1 1 -1 . 141
Искомое преобразование в соответствии с Умножив матрицу В на матрицу А, получим теоремой 10.8 имеет матрицу В А 0 1 -6 7 0 4 -18 - -2 — 9 3 0 7 0 4 —9 = 42 7 12 11 — 1 3 1 0 4 3 — 5 Следовательно, искомое преобразование определяется формулами х" =— 18х,— — 2х2 —9х3, х2 = 42х, + 7х2+ 12х3, х" = 4х, 4-3x2 — 5х3. 10.8. Невырожденные линейные преобразования. Преобразование, обратное данному Линейное преобразование называется невырожденным, если его матрица является невырожденной; в противном случае линейное преобразо- вание называется вырожденным. Теорема 10.10. Линейное преобразование является невырожденным тогда и только тогда, когда оно взаимно однозначно. Следствие. Линейное невырожденное преобразование ненулевой вектор переводит в ненулевой; обратное также верно: если линейное преобразование ненулевой вектор переводит в ненулевой, то оно будет невырожденным. Теорема 10.11. Произведение двух линейных невырожденных преобра- зований есть невырожденное линейное преобразование. Преобразование (р назы- вается обратным преобразованию f, если для любого вектора х f<p(x)=<rf(x)=x. (10.17) т. е. произведение этих преобразований является тождественным преобразованием. Из определения следует, что если <р—преобразование, обратное преобразова- нию f, то f — преобразование, обратное <р. Преобразования f и <р, удовлетворяющие условию (10.17), называют взаимно обратными. Линейное преобразование имеет обратное преобразование тогда и только тогда, когда оно является невырожденным. Для любого невырожденного линейного преобразования с матрицей А в не- котором базисе существует единственное обратное преобразование с матрицей А~' в том же базисе. Пример 10.6. Найти линейное преобразование, обратное преобразо- ванию i/i =2X1—Хз, 1/2= — Эх, 4-х2-|-Хз, 1/з = 2х|—х2. Это преобразование имеет матрицу А, определитель которой отличен от нуля, поэтому для него существует обратное преобразование с матрицей А~'. Так как А = 2 0-1 — 3 1 1 2—1 0 . л-’ = '111 2 2 1 1 2 2 то обратное преобразование выражается формулами xt—yi+yz+ys, x2 = 2i/i4- + 2//2-ТУз, Хз = {/|+21/2 + 21/з. 10.9. Ортогональные матрицы Матрица ' All «12 • flirt А = <221 «22 • . «2д «п! «л2 • «ля (10.18) называется ортогональной, если соответствующая ей система векторов 142
ai (а 11, 02i, ..., a„i), 82(012, 022, , о„г),..., a„(oi„, аг„, .... o„n) (10.19) является ортонормированной. Векторы (10.19) будут ортонормированными (см. п. 9.7), если п I <*»> k= I для любых i, j (j, /= 1, 2, , п). Примеры ортогональных матриц: cos a —sin а! Г 0,8 — 0,61 Г 1 0] sin а cosaj ’ [ —0,6 — 0,8J ’ |_ 0 1J Отметим, что единичная матрица любого порядка является ортогональной. Теорема 10.12. Необходимое и достаточное условие ортогональности матрицы А выражается равенством АТА=Е, (10.21) где Ат — матрица, полученная из матрицы А транспонированием, Е — единич- ная матрица того же порядка, что и А. Следствие 1. Модуль определителя ортогональной матрицы равен единице. Следствие 2. Ортогональная матрица является невырожденной матри- цей. Следствие 3. Произведение двух ортогональных матриц есть ортого- нальная матрица. Следствие 4. Равенство АТ = А~1 выражает необходимое и достаточное условие ортогональности матрицы А. Следствие 5. Матрица, полученная транспонированием ортогональной матрицы, является ортогональной. Следствие 6. Матрица, обратная ортогональной матрице, является ортогональной. Замечания. 1. Из условия det А = ± 1 не следует, что А — ортогональ- [2 31 । 2 , для которой det Л = 1, не явля- ется ортогональной, так как А'А^=Е. 2. Сумма ортогональных матриц не является ортогональной матрицей. 3. Необходимое и достаточное условие ортогональности матрицы А можно выразить равенством ААГ = Е. Теорема 10.13. Матрица перехода от одного ортонормированного базиса к другому является ортогональной. 10.10. Ортогональные преобразования Линейное преобразование евклидова пространства называется орто- гональным, если в некотором ортонормированном базисе его матрица ортого- нальна. Теорема 10.14. Линейное преобразование евклидова пространства явля- ется ортогональным тогда и только тогда, когда оно ортонормированный базис переводит в ортонормированный. Теорема 10.15. Ортогональное преобразование не меняет скалярного произведения векторов. Следствие 1. При ортогональном преобразовании f остается неиз- менной норма вектора, т. е. ||х|| =||/(х) ||. Следствие 2. При ортогональном преобразовании f остается неизмен- ным угол между векторами, т. е. 143
(X. У) = (f(x) J(У)) 11*11 • llyll llf(x) || • ||f (у) II ' Ортогональные преобразования обладают следующими свойствами. 1. Ортогональное преобразование является невырожденным. 2. Для любого ортогонального преобразования существует обратное преоб- разование, являющееся ортогональным. 3. Если ортогональное преобразование имеет матрицу А, то обратное ему преобразование имеет матрицу Ат. 4. Произведение двух ортогональных преобразований является ортогональ- ным преобразованием.
Глава 11 КВАДРАТИЧНЫЕ ФОРМЫ 11.1. Квадратичная форма и ее матрица Квадратичной формой f(xi,x2,...,х„) п действительных переменных х,, Х2,..., х„ называется сумма вида f (xi, х2, ..., х„) =at>xi +<112X1X2+ ...-4-ai„Xixn+ + a2ix2x, +а22Х2 +... + а2пХ2х„+ (11 • 1) + а„ ix„x । + а„2Х„х2 4-... + а„„х2п, ИЛИ л л f(xi,x2, ... , х„) = £ £ ai/XiXj, (11.2) <=1/=1 где а,, — некоторые числа, называемые коэффициентами. Не ограничивая общно- сти, можно считать, что aii=aii. Квадратичная форма называется действительной или комплексной в зави- симости от того, являются ли ее коэффициенты соответственно действительными или комплексными числами. Будем рассматривать действительные квадратич- ные формы. Матрицей квадратичной формы называется матрица, составленная из ее коэффициентов. Квадратичной форме (11.1) соответствует единственная симмет- рическая матрица ’flu 012 ... О|Л 4= 012 а22 ... а2„ (11.3) _ ^1п ^2л &пп И наоборот, всякой симметрической матрице (11.3) соответствует единственная квадратичная форма с точностью до обозначения переменных. Рангом квадратичной формы называют ранг ее матрицы. Квадратичная форма п переменных называется невырожденной, если ее матрица невырож- денная, т. е. г~п, и вырожденной, если г<п. Квадратичную форму (11.1) п переменных x,,x2......х„ можно записать в матричном виде. Действительно, если X — матрица-столбец из переменных %,, х2,..., хп, Хт — матрица, полученная транспонированием матрицы X, т. е. мат- рица-строка из тех же переменных, то f (xi, х2, ... , х„)—ХтАХ, (11.4) где Л определяется формулой (11.3). Пример 11.1. Записать матрицу квадратичной формы f(xi,x2,x3) = =Xi —6xix2 —8Х1Хз + 7х2 4-4х2х3 — 5%з и найти ее ранг. В данном случае = 1, fli2 = n2i =—3, О|3=аз1 =—4, о22 = 7, о23 = <132 = 2, а33=—5, поэтому 1 -3 —4 А = —3 7 2 -4 2 —5 145
Вычислим определитель этой матрицы 1 -3 -4 det А = = —35 + 24 + 24—112 + 45 — 4=—58. Так как де1Л=/=0, то ранг матрицы равен трем (г = 3). Эта квадратичная форма является невырожденной, поскольку г = п. 11.2. Преобразование квадратичной формы при линейном однородном преобразовании переменных Рассмотрим квадратичную форму (11.1). Перейдем к новым перемен- ным i/i, </2.уп по формулам Х| — ЬиУ\ + 6,21/2 + ... + 6,л1/п, Хг = 62,1/1 + 622I/2 + ... +6гл1/п, ' (11.5) Хп — bniyi -^-ЬП2У2~^- • + ЬппУп, или в матричном виде X = BY, (11.6) где х. bit bi2 ... 6,„1 Г1/, Х = 5.2 В= ^2| &22 ?2п у=У2 (Ц7| Хп Ьп\ Ьп2 ... Ьпп Уп В квадратичной форме (11.1) вместо х,, Х2,...,хп подставим их выражения через t/i, У2, ... , Уп, определяемые формулами (11.5), получим квадратичную форму 4>(l/l, 1/2, ... , Уп ) п переменных с некоторой матрицей С. В этом случае говорят, что квадратичная форма f(X\,X2,.... , хп) переводится в квадратичную форму yi, ..., уп) линейным однородным преобразованием (11.5). Линейное однородное преобразование (11.6) называется невырожденным, если detZj=/=O. Две квадратичные формы называются конгруэнтными, если существует невырожденное линейное однородное преобразование, переводящее одну форму в другую. Если f(xh хг, ... , х„) и tp(yt, у2, ... , у„) конгруэнтны, то будем писать f(x\,x2...х„) ~<p(t/,, 1/2, ... ,Уп). Свойства конгруэнтности квадратичных форм. 1. f(xt, х2, ... , х„) ~/(х,, х2.х„). 2. Если f(x,. Х2,... ,х„) ~<p(t/,, 1/2, ... , Уп), (f>{yi, У2, ... , Уп) ~Ф(г,, z2.г„), то f(xi, х2, ... , х„) ~ф(г,, z2,.z„). Теорема 11.1. Квадратичная форма f(x\,xi, ... ,хп) с матрицей А линей- ным однородным преобразованием X=BY переводится в квадратичную форму ц>(у\, у2, ... , уп) с матрицей С = ВТАВ. Следствие 1. Определители матриц конгруэнтных невырожденных действительных квадратичных форм имеют одинаковые знаки. Следствие 2. Конгруэнтные квадратичные формы имеют одинаковые ранги. 146
11.3. Приведение действительной квадратичной формы к нормальному виду Квадратичная форма f(xit хз, . , х„) называется канонической, если она не содержит произведений различных переменных, т. е. / (х,, х2.х„) = £ а«х? (11.8) «•= I Каноническая квадратичная форма называется нормальной (или имеет нормальный вид), если |а„| = 1 («=1,2...г), т.е. отличные от нуля коэффи- циенты при квадратах переменных равны +1 или —1. Например, квадратичная форма f(xi, хг, хз, х«) = 6х? + 4хз— 3x1, для которой ап =6, а22 = 0, азз = 4, аз4=—3, имеет канонический вид; квадратичная форма f (xi, х2, хз, х<) =xf— — хз + хч является нормальной, так как ац = 1, а22 = 0, азз= — 1, а«=1. Теорема 11.2. Любая квадратичная форма некоторым невырожденным линейным преобразованием может быть приведена к каноническому виду ф(</|.</2, ... , у«) =Ьиу^ + Ьгзуз + ... -\-Ь„пу2п, где yt, уг, ... , у„ — новые переменные. Некоторые из коэффициентов Ьи могут оказаться равными нулю; число отличных от нуля коэффициентов в этой формуле равно рангу г матрицы квадратичной формы <р. Теорема 11.3. Любую действительную квадратичную форму линейным невырожденным преобразованием можно привести к нормальному виду ф(?1, z2, ... , г„) =г? + гг + ... + z*_i — zl —... —г’. Число входящих сюда квадратов равно рангу формы. 11.4. Закон инерции квадратичных форм Закон инерции квадратичных форм выражает Теорема 11.4. Число положительных и число отрицательных квадратов в нормальном виде, к которому приводится данная действительная квадратич- ная форма невырожденным действительным линейным преобразованием, не зави- сит от выбора преобразования. Число положительных квадратов в нормальной форме, к которой приво- дится данная действительная квадратичная форма, называют положительным индексом инерции этой формы, число отрицательных квадратов — отрицатель- ным индексом инерции, разность между положительным и отрицательным индексами инерции — сигнатурой формы /. Если известен ранг формы, то зада- ние любого из трех указанных выше чисел определяет два других. Т е о р е м а 11.5. Две действительные квадратичные формы от п переменных тогда и только тогда конгруэнтны, когда они имеют одинаковые ранги и оди- наковые сигнатуры. 11.5. Знакоопределенные квадратичные формы Действительная квадратичная форма f (xi, х2, , х„) называется поло- жительно-определенной, если она приводится к нормальному виду, состоящему из п положительных квадратов: f(xi, х2, ... , хл) ~<p(z/i, уз, ... , уд, где Ч>(Уь 1/2, ... , уд =у1+У2 + -.-+Уп, (11.9) т. е. если ранг и положительный индекс инерции равны числу неизвестных. Систему значений Х|,хг,... ,хл назовем нулевой, если х\ =х2=... =х„=0, и ненулевой, если хотя бы одно из них отлично от нуля. Теорема 11.6. Действительная квадратичная форма f(xl,x?,...,xd является положительно-определенной тогда и только тогда, когда она прини- 147
мает положительные значения при любой ненулевой системе значений пере- менных xi, хг,... , х„. Пусть дана квадратичная форма f(xi,X2,...,x„) с матрицей Л = (а,,). Главными минорами квадратичной формы f называются миноры ан ai2 • ан О|2 • • О|л ап, I Он О|2 I fl2l 022 - . ащ a2i О22 • • О2п | О2| 022 | 0*1 а*2 . аы аЯ| Ол2 • • Одд т. е. миноры порядка 1,2....п матрицы А, расположенные в левом верхнем углу; последний из них совпадает с определителем матрицы. Теорема 11.7. Квадратичная форма f (xi, х2, ... , xn) с действительной матрицей является положительно-определенной тогда и только тогда, когда все ее главные миноры положительны. Действительная квадратичная форма называется отрицательно-определенной, если она является невырожденной и приводится к нормальному виду, содержащему только отрицательные квадраты всех переменных; эту форму можно привести к виду Ч>(У1,У2..Уп) =— У2\—1/2 — ...—//». (11.10) Теорема 11.8. Квадратичная форма является отрицательно-определен- ной тогда и только тогда, когда ее главные миноры четного порядка положи- тельны, а нечетного — отрицательны. Положительно-определенные и отрицательно-определенные квадратичные формы называются знакоопределенными квадратичными формами. Вырожденные квадратичные формы, нормальный вид которых состоит из квадратов одного знака, называют полуопределенными. Неопределенными называются квадратичные формы, нормальный вид которых содержит как положительные, так и отрицательные квадраты переменных. Пример 11.2. Доказать, что квадратичная форма /(х,,Х2, хз) = =6х? + 5х2 +7хз — 4xix2-|-4xiX3 положительно-определенная. Запишем матрицу А этой квадратичной формы и определитель матрицы А: 6—22' 6—2 2 А = — 2 5 0 , det Л = — 2 5 0 2 0 7 2 0 7 6 ~2 I _ Так как главные миноры матрицы 011 = 6, — 2 5 = 26 и det А = 162, т. е. все положительны, то данная квадратичная форма является положительно- определенной. 11.6. Приведение квадратичной формы к каноническому виду ортогональным преобразованием переменных Теорема 11.9. Если существует ортогональное преобразование с матрицей С, приводящее действительную квадратичную форму f = f(xi, х2, ... , х„) к каноническому виду Ч>(У1, У2, ... ,Уп)=^У2 + *-2У2 + ---+КУп, (11.11) то Xi, Х2,... — характеристические числа матрицы А квадратичной формы f. Теорема 11.10. Для любой действительной квадратичной формы суще- ствует ортогональное преобразование, приводящее ее к каноническому виду. Теорема 11.11. Для любой действительной симметрической матрицы А существует такая ортогональная матрица Т, что 1 1АТ — диагональная матрица. 148
Следствие. Любая действительная симметрическая матрица может быть приведена к диагональному виду. Теорема 11.12. Если линейное преобразование действительного линей- ного пространства имеет действительную симметрическую матрицу в некотором ортонормированном базисе, то существует ортонормированный базис, состоящий из собственных векторов этого преобразования. Из этих теорем следует правило нахождения ортогонального преобразо- вания, приводящего квадратичную форму п переменных к каноническому виду. Это правило состоит в следующем: 1) записать матрицу данной квадратичной формы, найти ее собственные значения и п попарно ортогональных собственных векторов, пронормировать их; 2) составить матрицу из ортонормированных собственных вектор-столбцов; 3) записать искомое ортогональное преобразование с помощью последней матрицы. Пример 11.3. Найти ортогональное преобразование, приводящее к кано- ническому виду квадратичную форму двух переменных xi,x2, f(xt, x2)=5xi +4д/6х1Х2 +7X2- Поскольку в данном случае ац=5, ац=ац=2^/б, а22 = 7, то матрица А этой квадратичной формы и ее характеристическое уравнение det(4 — ХЕ)=0 запишутся так: 5 2^6 5-Х 2д/б 4= г- , ГТ =0. 2д/б 7 2 л/6 7 —X Характеристическое уравнение (5 —X) (7 —X)—24=0, или X2 —12Х+11 =0j имеет корни Xi = l, Ха = 11, которые являются собственными значениями матрицы А. Найдем собственные векторы, соответствующие полученным собственным значениям. Координаты (s, t) этих векторов определяются из системы уравнений (10.12), которая в данном случае имеет вид (5 —X)s-|-2 д/б/ = 0, 2 д/бэ-Н7-Х)/=0. При Х] = 1, Ха= 11 имеем две системы 4з+2д/б/=0, —6s4-2-V6/=0, 2^6s + 6t=0, 2->/6s-4Z=0. Из этих систем находим собственные векторы и= (— (д/б/2)1, t), v= ((д/б/З)/, t), где Z=/=0. Положив /, = —2. t2=3, получим и=(д/б, —2), ц=(д/б, 3). Норми- ровав эти векторы, запишем их координаты в столбцы, составим матрицу В: С помощью матрицы В записываем искомое ортогональное преобразование *i= -U (-А/1 + т/2уг), -м 5 Х2 = -L (-V2J/.+V3//2). -у5 Это преобразование приводит данную квадратичную форму к каноническому виду <f(y\,y2)=y*+llyl- US
11.7. Упрощение уравнений фигур второго порядка на плоскости Фигурой второго порядка на плоскости называется множество точек этой плоскости, декартовы координаты которых удовлетворяют уравнению второй степени aiix2+2ai2xy+a22y2 + aI3x+a23y+a33 — 0, (П-12) где ан, Oi2, а22 одновременно в нуль не обращаются. Отметим, что это множество, в частности, может состоять из единственной точки или оказаться пустым. Первые три члена левой части уравнения (11.12) образуют квадратичную форму двух переменных х\=х, хг—у. f(x, у)—ацх2+2а{2ху + а22у2 (11.13) с симметрической матрицей Л = Г а“ а'2]. * (11.14) L «21 <122 J По. теореме 11.10 эту квадратичную форму ортогональным преобразованием можно привести к каноническому виду Л«</')=Х1х'2 + Х2</'2 (11.15) с матрицей С=ГХ| °1 (11.16) L о ’ где Х|, Хг — характеристические числа матрицы А, т. е. корни характеристиче- ского уравнения матрицы А: <1| I — К «12 <212 <122 — А = 0. (П-17) При этом ортогональном преобразовании уравнение (11.12) примет вид Xix' +А.2«/'2 + <1|зх' А-а'2зу'А~а'зз—®- (11.18) Это уравнение можно привести к каноническому виду путем выделения в левой части полных квадратов. Фигуру второго порядка, определяемую уравнением (11.12), называют центральной, если det А 0, и нецентральной, когда 8е1Л = 0. Отметим, что при ортогональном преобразовании переменных определитель матрицы квадратичной формы не меняется, т. е. detC = det4. Так как detC = = Х|Лг (см. (11.16)), то deM = M,2. (11.19) Пусть уравнение (11.18) определяет центральную фигуру, т. е. det Л =/-0. Здесь возможны два случая: 1) А,Д2> 0 (числа М и Л2 одного знака), фигура называется фигурой эллиптического типа; 2) Х|Х2<0 (числа X, и Х2 имеют разные знаки), фигура называется фигурой гиперболического типа. Если ХДг^О, то уравнение (11.18), выделив в его левой части полные квадраты, можно привести к виду к] (%' —/iip + M/ —Л2)2 = <7 или Х1Х24-Л2У2 = <7, (11.20) где Х=х'-Л|, Г=/-/г2. (11.21) 150
Формулы (11.21) выражают зависимость между координатами (х', у1) и (х, у) при параллельном переносе координатных осей в точку О|(й|,Л2). В случае Xil2> О уравнение (11.20) приводится к одному из канонических видов Х2/а2+У2/62= 1, (11.22) Л7а2+У2/й2=-1, (11.23) Х2/а2+У2/й2=0 (11.24) в зависимости от знаков М и q: 1) k\q> 0, 2) A.i<7<0, 3) q = 0. Уравнение (11.22) определяет эллипс, уравнению (11.23) не удовлетворяют координаты ни одной точки плоскости, уравнению (11.24) удовлетворяют коор- динаты одной точки (Х=0, У=0). В случае ЛД2<0 уравнение (11.20) приводится к одному из канонических видов X2/a2—Y2/b2=i, (11.25) X2/a2-Y2/b2=-l, (11.26) Х2/а2- Y2/b2 = 0 (11.27) в зависимости от знаков 1| и ?: 1) kiq> 0, 2) Xi<7<0, 3) <7 = 0. Уравнение (11.25) определяет гиперболу с действительной осью О\Х, урав- нение (11.26) — гиперболу с действительной осью O>Y, уравнение (11.27) — пару пересекающихся прямых, так как оно распадается на два уравнения — - 4- =0, + 4- =0, или Г= ±х, У= - -±Х. a b а b а а Обратимся к нецентральным фигурам, т. е. к случаю, когда det Л=0. В силу (11.19) из равенства det А = 0 следует, что Х,Л2 = 0. Последнее равенство означает, что одно из чисел XiX2 равно нулю (оба числа М, Л2 в нуль обратиться не могут, так как это означало бы, что квадратичная форма (11.15) является вырожденной, чего быть не может, поскольку а,, Ц-а^+а^^О). Если а23^0, то уравнение (11.18) можно привести к виду ki(x' — /ii)2~t-a23y'A-‘} = 0 и записать так: Ki(x' — hi)2=—a23(y' — h2). (11.28) Осуществим параллельный перенос репера (О<, е,, е2) на вектор ОО< = —hiet 4-й2е2, получим новую систему координат OiXY, причем X и Y определяются формулами (11.21). Уравнение (11.28) приведем к виду X2=2pY. Уравнение (11.29) определяет параболу с осью OtY. Если в уравнении (11.18) 0^ = 0 (и Z2 = 0), то, выделив полный квадрат, его можно записать так: (11.29) X1(x/-fti)2 + <? = 0. (11.30) Осуществив параллельный перенос репера (Oi.e^ej) на вектор ОО1=/геь т. е. выполнив преобразование Х = х'—hi, Y—y’, получим новую систему коор- динат O\XY, в которой уравнение (11.30) принимает один из видов: Х2 = а2, Х2=-а2, Х2=0 (11.31) в зависимости от соотношения знаков чисел X, и <?:Xi<7<0, Х,<7> 0, q = 0. Первое из уравнений (11.31) определяет пару параллельных прямых Х = а, X— —а, второму уравнению не удовлетворяют координаты ни одной точки плоскости, третье уравнение определяет пару совпавших прямых Х=0, Л = 0. Операция перехода от уравнения (11.12) к уравнению (11.18) называется 151
отнесением фигуры к главным осям. Новые оси координат параллельны осям симметрии фигуры. Главными направлениями фигуры, заданной уравнением (11.12), называют направления ортогональных собственных векторов матрицы квадра- тичной формы, соответствующей этому уравнению. Из теорем п. 11.6 следует, что существует декартова прямоугольная система координат, в которой уравнение (11.12) принимает канонический вид. Чтобы выбрать эту систему координат, необходимо сделать следующее. 1. Найти ортогональное преобразование, приводящее к каноническому виду квадратичную форму, соответствующую данному уравнению. 2. С помощью этого преобразования определить главные направления фигуры, т. е. векторы е{, е2 — ортонормированные собственные векторы матрицы указанной квадратичной формы. 3. Найти уравнение фигуры в репере (О, е{,е2). 4. Выделить полные квадраты в полученном уравнении. 5. Совершить параллельный перенос системы (О, е{, е2) на соответствующий вектор OOi и составить каноническое уравнение фигуры в репере (О,, е{, е2). Пример 11.4. Какую линию на плоскости определяет уравнение 5х2 + +4 -\/6х(/+71/2 = 22? С помощью теории квадратичных форм приведем это уравнение к кано- ническому виду. Левая часть уравнения — квадратичная форма f(x,i/)—5x24- +4 ^6ху+7 у2, которая с точностью до обозначений переменных (xi=x, х2=у, у\—х', у2=у'\ (см. п. 11.6, пример 11.3) приведена к каноническому виду <р(х', у') = х'2 + Ну'2 посредством ортогонального преобразования х = = —^-(л/3х'+W). У=-7=~ (-л/2х'+л/3/)- у5 V5 Это преобразование данное уравнение переводит в уравнение б(-|- ( V3x'+ у/2/)2} + -Ц/L ( V3x'+ л/2</') (- л/2х'+ у/3/) + + 4- (- у/2х' + у/3и')2 = 22, или х/2+11/2 = 22. о Полученное уравнение определяет эллипс с полуосями а= у/22, Ь = у/2. 11.8. Упрощение уравнений фигур второго порядка в пространстве Фигурой второго порядка в пространстве называется множество точек пространства, декартовы координаты которых удовлетворяют уравнению a, ix2 + а22у2 + a33z2 + 2а12ху + 2а ।Зхг + 2а23уг+a1+а24у+a34z+а44=0, (11.32) где а1| + а22 + азз + а22 + а1з4"а2з=^=0- Сумма первых шести членов левой части уравнения (11.32) представляет собой квадратичную форму трех переменных, х, у, г: f(x, у, z) =aiix2 + a22y2 + a33z2 + 2al2xy + 2ai3xz + 2a23yz (11.33) с симметрической матрицей Он О|2 013 А = а,2 022 023 013 023 033 (11.34) Фигура второго порядка называется центральной, если det4=/=O, и не- центральной, если det .4=0. 152
С помощью ортогонального преобразования квадратичную форму (41.33) можно привести к каноническому виду <р(х', у', г') =11х/2-|-12</'2+^зг/ , где 11, 1г, 1з— корни характеристического уравнения det(4 —1£)=0. Матрица квадратичной формы <р=<р(х', у', г') принимает вид ‘11 0 0 с= 0 12 0 (11.35) 0 0 13 Указанное ортогональное преобразование приводит уравнение (11.32) к виду Мх'2 + W'2 + l3z'2 + а^х7 + +«з4г' + “44 = °- (11 -36) Центральные фигуры. Если det4#=0, то det С = МЫ.з¥=0, так как det 4 = = det С. Выделяя полные квадраты в левой части уравнения (11.36), можно привести его к виду X1№t4-A,2r2d-X3Z2==H. (11.37) где Х = х' —й|, Y = y' — hi, Z = z' — h3. Поскольку Х|А,2^з¥=0, то ни одно из чисел не равно нулю, все эти числа могут иметь один знак (А.|Л2Л.з>- 0) или только два из них одного знака. 1. Если все числа 1|, 12, 1з одного знака, то уравнение (11.37) можно привести к одному из следующих канонических видов: X2/a2+Y2/b2 + Z2/c2 = l, (11.38) X2/a2+Y2/b2 + Z2/c2 = -l, (11.39) X2/a2+Y2/b2+Z2/c2=0 (11.40) в зависимости от 1| и p:lip> 0, 1|Ц<0, ц = 0. Уравнение (11.38) определяет эллипсоид, уравнению (11.39) не удовлетво- ряют координаты ни одной точки пространства, уравнению (11.40) удовлетво- ряют координаты единственной точки (Х=0, У=0, Z = 0). 2. Пусть знак одного из этих чисел противоположен знаку двух других: предположим, что 1112> 0. Уравнение (11.37) можно привести к одному из канонических видов X2/a2+Y2/b2-Z2/c2 = l, (11.41) X2/a2+Y2/b2-Z2/c2=-l, (11.42) X2/a2+Y2/b2-Z2/c2=0 (11.43) в зависимости от М и ц:1|Ц> 0, 1|Ц<0, р = 0. Уравнения (11.41) — (11.43) определяют соответственно однополостный гиперболоид, Двуполостный гиперболоид и конус второго порядка. Нецентральные фигуры. Если det 4 = 0, или Х|Л2А.з = 0, то одно или два из этих чисел равны нулю. 1. Пусть 13 = 0, аз4#;0, тогда уравнение (11.36) приводится к виду liX2 + l2r2 + pZ = 0. (11.44) Если 111г> 0 и А,. ц<0, то имеем X2/a2+Y2/b2 = 2Z; (11.45) в случае 1,1г <0, li|i<0 получаем X2/a2—Y2/b2 = 2Z. (11.46) Уравнения (11.45) и (11.46) определяют соответственно эллиптический и гипер- болический параболоиды. 153
2. Пусть 1з = 0 и аз4 = 0, тогда имеем уравнение Х(Х2 + Х2У24-т = 0,. (11-47) которое приводится к одному из следующих канонических видов: Х2/а2+У2/&2=1, Х2/а2+У2/й2=-1, Х2/а2-У2/62=1, Х2/а2-У2/62=-1, Х2/а2-У7б2 = 0. (11.48) (11.49) (11.50) (11.51) (11.52) Уравнение (11.48) определяет эллиптический цилиндр, каждое из уравнений (11.51), (11.50)—гиперболический цилиндр, уравнение (11.52)—пару пере- секающихся плоскостей; уравнению (11.49) не удовлетворяют координаты ни одной точки. 3. Если Хг=Х3 = 0 и а'24=/=0, то уравнение (11.36) приводится к виду Х,Х2 + + |1У = 0 или Х2 = 2рУ (11.53) и определяет параболический цилиндр. 4. Если Х2 = Хз=0 и <224 = 0, то имеем уравнение XiX2 + v=0, которое при- водится к одному из канонических видов Х2 = а2, Х2=—а2, Х2 = 0. (11.54) Первое из уравнений (11.54) определяет пару параллельных плоскостей (Х = а, Х=—а), третье уравнение—пару совпавших плоскостей; второму уравнению не удовлетворяют координаты ни одной точки пространства. Пример 11.5. Какую поверхность определяет уравнение 6x2 + 5i/2 + 7z2 — — 4ху 4- 4xz = 18? Это уравнение вида (11.32), для которого ац = 6, а22 = 5, азз = 7, a,2=—2, <213 = 2, а2з = 0, <2|4 = а2ч = аз4 = 0, 044= —18. Левая часть данного уравнения является квадратичной формой f(x, у, z) =6х2+5</2 + 7г2 — 4ху+4хг трех пере- менных х, у, z (х=Х(, у=х2, г=хз). Составим матрицу А этой квадратичной формы и характеристическое уравнение матрицы А: — 2 2Т 5 О О 7- 6 — 2 2 А = 6-Х — 2 2 —2 5—X О 2 0 7 —X = 0. Характеристическое уравнение (6—X) (5 —X) (7 —X) —4(5 —X) —4(7 —X) =0, или X3—18Х2 + 99Х—162 = 0 имеет корни X, = 3, Х2=6, Хз=9 (так как X3 — — 18Х2 + 99Х— 162 = Х3 — ЗХ2— 15Х2 + 45Х + 54Х— 162 = Х2(Х — 3) — 15Х(Х — 3) -I + 54(Х —3) = (Х-3) (X2-15Х + 54)). Следовательно, квадратичную форму f(x,y,z) можно привести к виду <р(Х, Y, Z) =ЗХ2+6У2 + 972. В новых координатах X, У, Z данное уравнение имеет вид 3X2 + 6y2 + 9Z2= 18, или х7б+У2/з+г2/2=1, оно определяет эллипсоид с полуосями <2 = -^6, Ь= -^3, с— л/2.
Глава 12 ГРУППЫ 12.1. Понятие группы. Основные определения Группой называется множество G элементов а, Ь, с, ... , для которых определена операция (сложения или умножения), которая каждой упорядоченной паре (а, Ь) элементов G ставит в соответствие единственный элемент с — а°Ь данного множества, причем операция обладает следующими свойствами: 1) операция ассоциативна, т. е. для любых a,b,c<sG ao(boc) = (а°Ь)°с; (12.1) 2) в G существует нейтральный элемент е такой, что для любого элемента аеб а°е = е°а = а; (12.2) 3) для каждого элемента аеб существует обратный ему элемент а~‘ такой, что а°а~' = е, а~'<>а = е. (12.3) Если, кроме того, для любых а.беб выполняется условие a°b = b°a, (12.4) то группа называется коммутативной или абелевой группой. В любой группе нейтральный элемент определен однозначно; для каждого элемента существут единственный обратный элемент. Группа, состоящая из конечного числа элементов, называется конечной. Число элементов группы называют ее порядком. Группа, не являющаяся конечной, называется бесконечной. Группа называется аддитивной или группой по сложению, когда групповая операция, ставящая в соответствие упорядоченной паре элементов (а, 6) элемент с = а«Ь, является сложением. В этом случае символ операции ° заменяется знаком +; с = а + Ь, нейтральный элемент называют нулем и обозначают сим- волом 0; a-f-0 = 0 + a = a. Элемент, обратный к элементу а, называют проти- воположным и обозначают — а:а+( — а) = (— а)+а = 0. Группа называется мультипликативной или группой по умножению, когда групповая операция, ставящая в соответствие упорядоченной паре (а, 6) элемент с = а°Ь, является умножением. В данном случае произведение а°Ь обозначается а-b или ab; нейтральный элемент называется единицей и обозначается символом 1: а-1 = 1 -а —а. Произведение п элементов, равных а, называют п-й степенью элемента а и обозначают а". Отрицательные степени элемента а можно определить или как элементы группы G, обратные положительным степеням этого элемента, или как произведения соответствующего числа множителей, равных элементу а-1. Эти определения совпадают, так как верно равенство (а") _| = (а-')" (п>0). В любой группе G для степеней каждого элемента а при любых показателях т и п (положительных, отрицательных или нулевых) выполняются равенства а"а’" = а'”а" = а" + ’", (а")= а'"". 155
Если операция в группе называется сложением, то вместо степеней элемента а говорят о кратных этого элемента и пишут па. В каждой мультипликативной группе однозначно разрешимы уравнения ах = Ь, уа = Ь, первое из них имеет решение х=а~'Ь, второе — у = Ьа. Если группа является коммутативной, то эти уравнения не различаются, они имеют одинаковые решения х = у = а~1Ь. 12.2. Примеры групп 1. Множество всех целых чисел с операцией сложения образует адди- тивную группу. Действительно, сумма а + b двух целых чисел а и b также является целым числом. В этом случае говорят, что множество целых чисел замкнуто относительно операции сложения. Сложение целых чисел коммутативно: (а + Ь) + + с = а+ (& + с). В данном множестве имеется нейтральный элемент, т. е. число О такое, что а + 0=а при любом целом числе а. Для каждого элемента целого числа а существует обратный элемент (противоположное число), т. е. такое число —а, что а+( — а)=0. Рассматриваемая группа является коммутативной, так как а-\-Ь = Ь-\-а. Замечание 1. Множество всех целых чисел не образует группу по умножению, так как обратные для целых чисел (отличных от —1 и 1) не явля- ются целыми числами. Например, для числа 2 обратное число 2-1 не принад- лежит множеству целых чисел. 2. Множество всех действительных чисел, отличных от нуля, с операцией умножения образует мультипликативную группу. Эта группа является комму- тативной, так как ab = ba. Замечание 2. Множество всех действительных чисел не образует группу по умножению, поскольку для числа 0 нет обратного. 3. Множество всех векторов трехмерного пространства образует группу по сложению. Эта группа является коммутативной (а + 6 = 6 + а). 4. Множество матриц размеров mXn образует коммутативную группу по сложению (A -j-B — B-f-A).Для матрицы Л обратным элементом является матрица (—Л); нейтральный элемент — нулевая матрица О. 5. Множество всех невырожденных квадратных матриц порядка п образует мультипликативную группу. Эта группа, которую называют полной линейной группой, не является коммутативной (в общем случае АВ=£ВА). Замечание 3. Множество всех квадратных матриц порядка п не обра- зует группу по умножению, так как для некоторых его элементов нет обратных (вырожденная матрица не имеет обратной). 6. Множество всех невырожденных линейных преобразований линейного пространства образует мультипликативную группу. 7. Множество, состоящее только из двух чисел +1, —1, образует группу по умножению. Действительно, каждое из произведений ( + 1)( —1) = —1, (-|-1)Х Х( + 1) = + 1, ( — 1)( — 1) = + 1 принадлежит данному множеству. Умножение ассоциативно. Существует единица — число +1, которое удовлетворяет условию ( — 1) (+ 1) = — 1, (+1)(+1) = Л-1. Для каждого элемента существует обрат- ный: каждое их этих двух чисел совпадает со своим обратным. Замечание 4. Множество, состоящее из двух чисел +1, — 1, не образует группу по сложению, так как сумма (+!) + (— 1) = О, а число 0 не принадлежит данному множеству. (В таком случае говорят, что данное множество не является замкнутым относительно операции сложения). 8. Множество, состоящее из одного элемента 0, образует аддитивную группу. Действительно, 0 + 0 = 0, сумма принадлежит данному множеству. Свойства операции сложения очевидны. 9. Множество, состоящее из одного элемента 1, образует мультипликативную группу. Группа, образованная одним элементом, называется единичной. 156
12.3. Подгруппа Подгруппой группы G называется подмножество Н ее элементов, образующее группу относительно операции, определенной в G. Чтобы убедиться в том, что подмножество Н группы G является ее подгруппой, необходимо проверить, что: 1) произведение (сумма) любых двух элементов а,Ь^Н принад- лежит /7; 2) для любого элемента а^Н обратный элемент принадлежит Н. Этого будет достаточно, так как ассоциативный закон выполняется для любых трех элементов G, в том числе и для элементов Н, а нейтральный элемент е (1 или 0) будет принадлежать Н (как произведение аа~' или сумма а+(—а))- Примеры подгрупп некоторых групп. I. Множество всех действительных чисел является аддитивной группой. Подгруппами аддитивной группы всех действительных чисел являются, в частности, следующие: 1) аддитивная группа рациональных чисел; 2) адди- тивная группа целых чисел; 3) аддитивная группа целых чисел, кратных числу k, например аддитивная группа четных чисел. Группа целых чисел является подгруппой группы рациональных чисел. Замечание 1. Множество нечетных чисел не образует группу по сло- жению, так как сумма двух нечетных чисел является четным числом (и не при- надлежит данному множеству). П. Мультипликативная группа всех действительных чисел, отличных от нуля, имеет, в частности, следующие подгруппы: 1) мультипликативную группу поло- жительных действительных чисел; 2) мультипликативную группу рациональных чисел, отличных от нуля; 3) множество, состоящее из двух чисел +1, —1 с операцией умножения. Замечание 2. Мультипликативная группа положительных действитель- ных чисел не является подгруппой аддитивной группы всех действительных чисел, так как групповые операции в рассматриваемых множествах — разные (соответственно умножение, сложение). Ш. Мультипликативная группа невырожденных матриц порядка п имеет, в частности, подгруппы: 1) группу ортогональных матриц; 2) группу диагональных матриц; 3) группу матриц с положительным определителем; 4) группу матриц с определителем, равным единице (эта группа называется унимодулярной). Пересечение двух подгрупп группы G является подгруппой в G. Например, в аддитивной группе целых чисел пересечение подгруппы четных чисел и подгруппы чисел, кратных трем, будет подгруппой чисел, кратных шести. Каждая группа является своей подгруппой. Далее, каждая группа имеет единичную подгруппу, состоящую из одного нейтрального элемента (единицы или нуля). Эти две подгруппы называются несобственными (или тривиальными) подгруппами. Остальные подгруппы называются собственными (или истинными) подгруппами. В любой группе все подгруппы каждой группы являются в то же время подгруппами исходной группы. Например, аддитивная группа целых чисел является подгруппой аддитивной группы рациональных чисел, которая в свою очередь есть подгруппа аддитивной группы всех действительных чисел; аддитив- ная группа целых чисел — подгруппа аддитивной группы всех действительных чисел. 12.4. Группы преобразований. Симметрическая группа n-й степени Преобразованием множества X называется взаимно однозначное ото- бражение этого множества на себя. Преобразование множества X обозначим буквой Р. Определение преобразования Р множества X означает следующее: любому элементу хеХ ставится в соответствие единственный элемент х' = Рх того же множества; х' называют образом элемента х, а х—прообразом х'. Каждый элемент /е.? имеет единственный прообраз хе/. Умножением преобразований называется последовательное их выполнение. Произведение двух преобразований Р, Q обозначается QP (справа записано то преобразование, которое выполняется пер вы иг; по определению (QP)x=Q(Px)). 157
Очевидно, произведение двух преобразований данного множества является пре- образованием этого множества. Отметим, что в общем случае умножение не является коммутативным, т. е. QPy=PQ. Можно показать, что произведение преобразований подчиняется ассоциативному закону. Роль единицы при умно- жении преобразований выполняет тождественное преобразование Е, ставящее в соответствие каждому элементу множества его самого. Для каждого пре- образования Р существует обратное преобразование Р~', которое каждому элементу х'еХ ставит в соответствие его единственный прообраз хеХ, причем РР~' = Р~'Р = Е. Следовательно, множество преобразований Р данного мно- жества X образует группу. Если множество X конечно и состоит из п элементов, то всевозможные взаимно однозначные отображения этого множества на себя называются под- становками. Подстановку из п элементов можно обозначить’так: / 1 2 3 п 4 \ ai а2 аз а„/ где а,, а2, ... , ап—те же числа 1,2, 3, ... , л, обозначающие данные элементы и записанные в другом порядке. Примеры подстановок при п = 5: / 1 2 3 4 5 X /12 3 4 5 4 \ 3 1 5 2 4 / \ 1 2 3 4 5 / /12 3 4 54 /2 14534 3 4 5 2 1 J 4 3 2 1 5 ) Первая подстановка означает такое взаимно однозначное отображение множества (1, 2, 3, 4, 5) на себя, при котором 1 переходит в 3, 2 — в 1 и т. д. Вторая под- становка называется тождественной, каждый элемент соответствует сам себе. Равенство двух других подстановок показывает, что расположение столбцов в записи подстановки не играет роли. Подстановки, отличающиеся только по- рядком следования столбцов, не считаются различными. Умножением подстановок называют последовательное их выполнение (сначала правого сомножителя, затем левого). Умножение подстановок ассоциативно, но не коммутативно. Например, если /12344 /12344 \ 2 4 1 3 / ’ У\2 3 4 1 / ’ то Единицей при умножении подстановок из п элементов служит тождественная подстановка /1 2 3 ... п 4 \ 1 2 3 ... п ) ’ Каждая подстановка из и элементов имеет обратную: Чтобы получить подстановку, обратную данной, необходимо поменять местами строки. Множество подстановок из п элементов относительно введенной операции умножения образует группу. Группа подстановок из п элементов называется симметрической группой п-й степени и обозначается S„. Число подстановок из п элементов равно п!, поэтому группа S„ имеет порядок nl. Рассмотрим группу подстановок из трех элементов а, Ь, с. Поскольку из трех 158
элементов можно составить шесть различных перестановок abc, acb, bac, bca, cab, cba, то и число различных подстановок для них равно шести (/г = 3, 3! = 1 - 2 - 3 — б). Обозначим эти подстановки следующим образом: fab \ а b с). ма ь с„), Рз=(а ь с\ с ) \ а с b ) \ с Ь а / а b с \ Ь а с ) Р5 ah b cv Pt=( ° b chv bca/ \ c a b / Отметим, что P\—тождественная подстановка; для каждой подстановки существует обратная: Pf' = Pi, Pf' = Pi, Р>'=Р>, РГ' = Р^, Pi' = Ps> Pt' = Pt>- Группа 5з (симметрическая группа подстановок из 3 элементов) некоммута- тивна, поскольку, например, Р^Р^ = Р2, Р^Рк = Р3, т. е. Р^Рз =/= Р$Р4. Таблица 12.1 Р, Pi Р‘2 Рл р, Рб р„ р. Р: Р> Рл Ра Ря р. Pt р> р. р. р. Р3 Ра р, Ра Р, р, Ръ р4 Рг Рл Ра Рь р» р, Рл Ра Рь р„ р, Рг Ра р<л р. Рь р„ Ра р4 р> Pl р> Группу можно представить следующей таблицей умножения, в которой слева стоят левые множители Л, сверху — правые Р„ а на пересечении соот- ветствующих строки и столбца — их произведение. Таблицы такого рода называют таблицами Кэли (табл. 12.1). 12.5. Группа вращений правильного многоугольника. Циклические группы. Группа симметрий правильного треугольника Пусть дан правильный н-угольник А>А2 ... А„ с центром в точке О (рис. 12.1, п = 6). Рассмотрим всевозможные повороты плоскости вокруг точки О, при которых этот правильный n-угольник совмещается сам с собой. Таких поворотов будет п:а»— поворот на угол <ро = О (тождественное преобразование); ai — поворот на угол <р|=2л/п, а2— поворот на угол <р2= (2л/п)2,... , । — поворот на угол <pn-1 = (2л/п) (п—1). Под ум- ножением поворотов будем понимать последо- вательное их выполнение: akoai — aii + i, причем акз.п = ак при любом k (k = 0, 1, 2, .... п), в част- ности а„ = ап. Умножение поворотов является ассоциативным (и коммутативным). Множество указанных поворотов правильного многоуголь- ника образует группу по умножению, роль еди- ницы играет тождественное преобразование — поворот ан. Для каждого элемента ак сущест- вует обратный элемент ак 1 = a„_|.(fe = 0, 1, 2, ... ... , п — 1), так как а*оа„_* = а„ = ап, т. е. аь°а„.. k = aH, где а0—единичный элемент. 159
Рис. 12.2 Положим ai=a, тогда а2 = в2, аз = а3,, an-1 =ап-а„ — а" = ао. В этом случае говорят, что группа образована степенями одного из своих элементов (или что она порождается одним их своих элементов); таким элементом здесь является элемент a = ai. Группы, образованные степенями одного из своих элементов, называются циклическими. Таким образом, группа вращений пра- вильного n-угольника является циклической группой порядка п, эта группа обозначается С„. Отметим, что аддитивная груп- па целых чисел также будет циклической, она порождается одним из своих элементов — чи- слом 1: 2=1 + 1, 3= (1 + 1) + 1 и т. д. Эта группа является бесконечной циклической груп- пой, ее обозначают С Пусть дан правильный треугольник АВС с центром в точке О (рис. 12.2). Рассмотрим все симметрии данной фигуры, т. е. те преоб- разования плоскости, при которых этот тре- угольник переходит в себя (или самосовмеща- ется). К ним относятся: три поворота ф<>, фь фг плоскости вокруг точки О соответственно на углы 0, 2л/3, 4л/3 (частный случай рассмот- ренных выше вращений правильного л-угольни- ка при п = 3); три осевых симметрии <р3, ф4, <р5, определяемых соответственно осями симметрии /, т, п, проходящими через вершину правильного треугольника и середину его противоположной стороны (см. рис. 12.2). Будем характеризовать каждое самосовмещение ф подстановкой на мно- жестве вершин А, В, С правильного треугольника /Л В С \ \ а, а2 аз / где а,, аг, а3 — те же буквы А, В, С, взятые в некотором порядке. Принятое нами соответствие между самосовмещениями треугольника и подстановками множества его вершин дает / А В С\ / А В С\ j А В С \ <₽0=(. А В С)' В С А )' Ч’2=(ч С А В)' / А В С\ / А В С \ ( А В С\ Ч”=( А С В)' С В А)' ф5=( В А С)' Множество самосовмещений фо, фь фг, фз, ф4, фз образует группу относи- тельно умножения (последовательного выполнения двух самосовмещений). Роль единицы играет тождественное преобразование, каждый элемент данного мно- жества имеет обратный. Эта группа называется группой симметрий треугольника. 12.6. Изоморфизм групп Группы G, и G2 называются изоморфным, если между их элементами можно установить взаимно однозначное соответствие, сохраняющее групповую операцию, т. е. такое, что если лс1т i/ieGi, х2, у^СС и xi<->-x2, yi <-> у<2, то Xt°yt -и- Х2оу2. Симметрическая группа Sa трех элементов а, Ь, с и групп i симметрий правильного треугольника с вершинами А, В, С изоморфны. Эти группы от- личаются только обозначениями элементов и названиями соответствующих преобразований. Циклическая группа порядка п изоморфна группе вращений правильного n-угольника; бесконечная циклическая группа изоморфна адди- тивной группе целых чисел. Если f—изоморфное отображение группы Gi на G2, то )(ei)=e2, где ei, е2 — единичные элементы групп Gi и G2 соответственно, и для любого XieGi, /(хГ')= (/(xi))-'. 160
12.7. Разложение группы по подгруппе Пусть дана группа G и некоторая ее подгруппа Н. Фиксировав любой элемент хеб, рассмотрим множество элементов x°h, где h — любой элемент Н. Это множество х°Н называется левым смежным классом группы G по подгруппе Н, порожденным элементом х. Два любых смежных класса группы G по подгруппе Н или совпадают, или не имеют ни одного общего элемента. Вся группа G распадается на непересекающиеся левые смежные классы по подгруппе Н. Это разложение называется левосторонним разложением группы G по подгруппе И. Очевидно, одним из левых смежных классов этого разложения будет сама подгруппа Н, этот смежный класс порождается эле- ментом е (или любым элементом he,H, поскольку — Аналогично вводится понятие правого смежного класса группы G по под- группе Н, порожденного элементом х; это множество Н°х, т. е. множество всех элементов вида й°х, где х—фиксированный элемент G, h — любой элемент из Н. Аналогичным образом получается правостороннее разложение группы G по подгруппе Н. Если группа G абелева, то оба ее разложения по любой подгруппе (левостороннее и правостороннее) совпадают. В этом случае гово- рят просто о разложении группы по подгруппе. Приведем пример такого разложения. Пусть G — аддитивная группа целых чисел и Н — ее подгруппа, состо- ящая из всех чисел, кратных k. Разобьем группу G на классы, относя к одному классу все те числа, которые при делении на k дают одинаковые остатки. Разложение данной группы G по указанной подгруппе И состоит из k раз- личных смежных классов, порождаемых соответственно числами 0, 1, 2, ... ... , k—1. В классе, порождаемом числом I, где собраны все те числа, которые при делении на число k дают остаток /. Полученное разложение группы целых чисел по подгруппе чисел, кратных k, при k = 3 можно представить следующим образом: Н ... —9 -6-3036 9 ... 1+Н ... — 8 —5 -2 1 4 7 10 ... 2 + Н ... —7 — 4 -1 2 5 8 И ... Замечание. В некоммутативной группе левостороннее и правосторон- нее разложения могут оказаться различными. Обратимся к симметрической группе S3(cm. п. 12.4). Из таблицы Кэли для этой группы видно, что множество элементов Pt, Р? образует подгруппу, обозначим ее В= {Pi, Р?}. Левосторон- нее разложение группы S3 по подгруппе В состоит из классов В, Р3В = PtB = = (Р4, Р5), Р3В = РьВ= {Р3, Ре, ), а правостороннее — из классов В, ВРе — = ВР4=(Р4, Р6), ВР5 = ВР3 = (Рз, Ръ}, т. е. эти разложения различны. Отметим, что левостороннее и правостороннее разложения этой группы по ее подгруппе третьего порядка А= (Pi, Рз, Ре} совпадают; каждое из них состоит из двух классов: А = { Pi, Р$, Ре,), АР-2=Р?А = { Р2, Рз, Р4}. Теорема 12.1 (Лагранжа). Порядок подгруппы конечной группы явля- ется делителем порядка группы. Следствие 1. Порядок любого элемента конечной группы является делителем порядка группы. Следствие 2. Всякая конечная группа, порядок которой есть простое число, является циклической. 12.8. Нормальный делитель Подгруппа Н группы G называется нормальным делителем этой группы (или инвариантной подгруппой), если левосторонние и правосторонние разложения этой группы по указанной подгруппе совпадают. Из определения следует, что любая подгруппа коммутативной группы является в ней нормальным делителем. Далее, в любой группе G сама группа 161
и ее единичная подгруппа будут нормальными делителями: разложение группы G по самой этой группе состоит из одного элемента G, разложения группы G по единичной подгруппе совпадают с разложением группы на отдельные элементы. Приведем примеры нормальных делителей в некоммутативных группах. 1. В симметрической группе 5з(см. п. 12.4) подгруппа H—{Pt, Р$, Pt,} является нормальным делителем, так как левостороннее и правостороннее раз- ложения совпадают, они состоят из двух классов: H={Pi, Р$, Pt,), НР2 = = Р2Н={Р2, Р3, Р<]. 2. В мультипликативной группе невырожденных квадратных матриц по- рядка п подгруппа матриц с определителем, равным единице, будет нормальным делителем. Действительно, левый и правый смежные классы по этой подгруппе, порождаемые матрицей М, совпадают с классом всех матриц, определитель которых равен определителю матрицы М (как известно, определитель произ- ведения двух матриц равен произведению определителей этих матриц). Можно дать и другие определения нормального делителя, равносильные исходному. Приведем одно из них. Подгруппа Н группы G называется нормальным делителем этой группы, если х°Н = Н<>х для любого хеб, т. е. для любого хеб и элемента heli существуют hi, h2^H такие, что х°/г = й|°х, h°x = x°h2. 12.9. Классы сопряженных элементов Элементы а и Ь группы G называют сопряженными, если в G су- ществует хотя бы один такой элемент х, что Ь = х~'ах. (12.5) В этом случае говорят, что элемент b получается из элемента а трансформи- рованием с помощью элемента х. Из равенства (12.5) находим a = x6x-'= (х~‘) 'йх ', т. е. элемент а при этом получается из элемента b трансформированием эле- мента х_|. Теорема 12.2. Подгруппа Н группы G тогда и только тогда будет нормальным делителем в G, если вместе с любым своим элементом h она содержит все элементы, сопряженные с ним в G. Замечание. Нормальный делитель называют также инвариантной подгруппой. Из теоремы 12.2 следует происхождение этого названия. Если Н — нормальный делитель группы G, то трансформирование любого элемента подгруппы Н с помощью элемента группы G дает снова элемент подгруппы Н (подгруппа Н остается неизменяемой по отношению к операции трансфор- мирования элементов Н). Теорема 12.3. Пересечение двух нормальных делителей группы явля- ется нормальным делителем этой группы. 12.10. Фактор-группа Фактор-группой группы G по нормальному делителю // называется группа всех смежных классов этой группы G по подгруппе Н. Таким образом, с группой G можно связать некоторый набор новых групп — ее фактор-групп по различным нормальным делителям. Отметим, что фактор-группа абелевой группы является абелевой, фактор- группа циклической группы.— циклической группой. Примеры фактор групп. 1. Пусть G - аддитивная группа целых чисел, Н—подгруппа чисел, делящихся на 3. Найдем фактор-группу G///. Групповой операцией в данном случ’аё является сложение. Число смежных классов равно трем (см. пример в п. 12.7): множество чисел, делящихся на 3, два множества чисел, дающих при делении на 3 соответственно остатки 1 и 2. 162
Обозначим эти смежные классы [0], [1], [2]. В этом множестве введем опера- цию сложения следующим образом: сложив соответствующие числа в квад- ратных скобках, определим, какой остаток при делении на 3 дает их сумма, и будем считать суммой смежных классов тот, которому принадлежит полу- ченный остаток. Таблица умножения для фактор-группы имеет вид [01 + [0] = = [1] + [2J = [2] + [1] = (0J, [0J + [1] = [1] + [0J = [2] + [2] = [1], |oj + [2] = — [21 + [0] = [ 1 j + [ 1 ] = [2]. Отсюда видно, что фактор-группа абелева. Кро- ме того, все смежные классы порождаются классом [1], они совпадают со степенями этого класса: |1|, [1] + [1) = [2], [1] + [1] + [1] = [0]. Поскольку фактор-группа порождена одним элементом, то она циклическая. 2. Пусть G — аддитивная группа целых чисел, Н—подгруппа целых чисел, кратных натуральному числу k. Фактор-группой G/Н является конечная группа порядка k, состоящая из классов [0], [I], [2], ..., [Л—1]. Эта фактор- группа циклическая, как и сама группа G. 3. Пусть G — мультипликативная группа всех невырожденных матриц порядка п, Н — подгруппа матриц с определителем, равным единице. Фактор- группа G/Н изоморфна мультипликативной группе отличных от нуля действи- тельных чисел. 12.11. Гомоморфизм групп Если G и G’ — труппы и /: G G' — такое отображение, при ко- тором для любых элементов л, у группы G /<лу) /(*)/(//). . (12.6) то j называется гомоморфным отображением или гомоморфизмом группы G в группу G'. Отметим, что в определении гомоморфизма имеется в виду, что каждый элемент группы G поставлен в соответствие хотя бы одному элементу группы G', но разным элементам из G может соответствовать один и тот же элемент из G'. Другими словами, отображение группы G в группу G' не пред- полагается взаимно однозначным, как в случае изоморфизма. Очевидно, каждая группа гомоморфна себе самой, так как можно поло- жить f(x)—x для всех хеО. Далее, каждая группа гомоморфна единичной Iруппе (состоящей нз одного нейтрального элемента е). Примером гомоморф- ного отображения групп может служить циклическая группа Се шестого порядка с элементами <*, а, а’. а\ а}. <Г, которая гомоморфна циклической группе С_> второго порядка с элементами Е, А: f(е) =f(a’) - f(a’) f(a) = f (a3) =f (a5) =A. Равенство (12.6) означает, что образ произведения двух элементов равен произведению образов этих элементов (которые, впрочем, могут называться по-разному в группах G и G'), поэтому говорят, что гомоморфизм «сохраняет групповую операцию». Гомоморфизм групп сохраняет не только групповую операцию, но также нейтральный и обратный элементы: если f — гомоморфное отображение группы G в группу G', то Це)=е', где е, е'— нейтральные эле- менты групп G и G' соответственно. Теорема 12.4. Каждая группа гомоморфна любой своей фактор-группе. Обратно, если группа G гомоморфна группе G', то G' изоморфна фактор- группе группы G по некоторому нормальному делителю Н. 12.12. Представления групп С точки зрения алгебры изоморфные группы не считаются различ- ными. О группе, изоморфной некоторой подгруппе группы подстановок, говорят, что она представлена подстановками. Теорема 12.5. (Кэли). Каждая конечная группа изоморфна некоторой группе подстановок (т. е. всякую конечную группу можно представить под- становками). 163
Следовательно, при описании любой конечной группы можно воспользо- ваться преимуществами группы подстановок. Для теории и приложений наиболее интересны линейные представления конечных групп. Говоря о линейном представлении конечной группы G, пред- полагают, что дано векторное пространство V„, в котором действуют линейные невырожденные преобразования. Эти преобразования образуют группу G', которой гомоморфна исходная группа G; при этом говорят, что группа G' представляет-группу G. Гомоморфное отображение Г группы G в группу G' невырожденных линейных преобразований л-мерного векторного пространства Vn называется линейным представлением группы G. Следовательно, если Г — линейное представление группы G группой G', то кажному элементу aeG поставлено в соответствие невырожденное линей- ное преобразование Ца)еС' пространства V„ так, что для любых a, b^G справедливо соотношение Г(аЬ) =Г(а)Г(Ь). Как известно, при этом Г(е)=£, где е, Е — нейтральные элементы групп G, G' соответственно, и Г(а~') = = (Г(а))_| для любого neG. Пространство V„, в котором действуют преобразования из группы G', называется пространством представления группы G. Размерность пространства V„ называют размерностью (или степенью) рассматриваемого представления. Вместо линейных преобразований часто рассматривают соответствующие им матрицы.
Ill МАТЕМАТИЧЕСКИЙ АНАЛИЗ
Глава 13 ФУНКЦИИ И ПРЕДЕЛЫ 13.1. Понятие функции. Основные определения Рассмотрим множество X элементов х и множество Y элементов у. Если каждому элементу хеХ по определенному правилу f поставлен в соот- ветствие единственный элемент ye У, то говорят, что на множестве X задана функция y — f(x) со значениями в множестве У. Элементы хеХ называются значениями аргумента, а элементы уе.У—значениями функции. Множество X называется областью определения функции, множество всех значений функции — областью значений этой функции. Замечание. Функцию, заданную на множестве X со значениями в множестве У, называют также отображением множества X в множество У. Если множество У является множеством значений функции, то рассматривае- мую функцию называют отображением множества X на множество У. Функцию, заданную на множестве X, называют также оператором, заданным на множестве X, и обозначают символом f. В случае, когда X и У — числовые множества, соответствующие функции называют числовыми функциями. Если рассматриваются действительные числа, то функции называют действительными (вещественными) функциями одной действительной (вещественной) переменной. Употребляются следующие обозначения функции: y = f(x), y — F(x), у = Ф(х), у = ц>(х), у = у(х) и т.п. Значение, которое функция y = f(x) при- нимает при х = а, обозначается через f(a). Функция и аргумент могут обо (начаться также другими буквами, напри- мер s = u = f(v), r = r(f), x = xt/) и т. д. К простейшим областям определения функции относятся отрезок, интервал, полуинтервалы или совокупность указанных промежутков. Например, для фун- кции у— — областью определения является отрезок [ — 3,3], а областью ее значений отрезок [ — 3,0]; для функции у = хя область определения и область значений совпадают с ингервалом (— оо, +<»)• Графиком функции у — f(х) напивается множество точек плоскости, коор- динаты которых удовлетворяют данной функциональной зависимости, т. е. точек М(х, ](х)). Например, графиком функции у— — -у/16 — х5 является полуокруж- ность радиуса /? = 4 с центром в начале координат, расположенная ниже оси Ох. К традиционным основным способам задания функции относятся: анали- тический (с помощью одной или нескольких формул); графический (с помощью графика); табличный (с помощью таблицы значений). Функция, заданная формулой </=/(х), (13.1) правая часть которой не содержит у, называется явной функцией. Функция у—у(х), определяемая уравнениями Е(х, у)=0, (13.2) называется функцией, заданной неявно, или неявной функцией. Отметим, что одно уравнение вида (13.2) может определять несколько функций. Например, уравнение х'2у2— /? =0 определяет две функции yi = — fiM = —д/Л7—х2, У2 = Ых) =л/)?г —х2. 166
Обратимся к функции (13.1). Каждому хеХ по определенному закону ставится в соответствие единственное значение 1/еК. С другой стороны, каж- дому уе У соответствует одно или несколько значений хеХ В случае, когда каждому i/еУ по некоторому закону <р соответствует только одно значение хеХ, получаем функцию X=<f(y), (13.3) заданную на множестве У со значениями в множестве X. Функцию (13.3) называют обратной функцией по отношению к функции (13.1). Функции (13.1) и (13.3) в этом случае называются взаимно обратными. Для взаимно обрат- ных функций выполняются тождества: хеХ; цеУ. Примеры взаимно обратных функций: у = У, x = loga</; у = 2х — 3, х = (у + 3) /2. Если придерживаться стандартных обозначений (у — функция, х — аргу- мент), то обратную функцию (13.3) следует писать в виде у=<р(х). Напри- мер, можно говорить, что функции у=У, y = log3x взаимно обратные. Функцию, обратную к функции y = f(x), удобно обозначать символом x=t~\y)- Если y = f(u), u = <p(x)—функции своих аргументов, причем область оп- ределения функции f содержит область значений <р, то каждому х из области определения функции <р соответствует у такое, что y=f(u), где u=<j>(x). Эта функция, определяемая соответствием у=Кч> (*)). называется функцией от функции или сложной функцией. (Применяются также и другие названия: композиция функций <р и f, суперпозиция функций <р и /.) Например, если у = и3, u = cosx, то у= (cos x)3=cos3 х. Рассматривают также функции, являющиеся композициями более чем двух функций. Так, функция tt> = sin lg(l +х2) представляет собой композицию следующих функций: = sin и, u = lgu, v=l+z, z=x2. Функция y=f(x) называется четной, если для любых х и —х из области ее определения выполняется равенство /(— х)=/(х). Функция у = <р(х) назы- вается нечетной, если для любых х и —х из области ее определения выпол- няется равенство <р( —х) = —<р(х). Например, у=х2, y=cosx — четные фун- кции, у=х3, y = sin х — нечетные функции. Функция y=f(x) называется периодической, если существует число Т=Х=О такое, что при всех х и х+Г из области ее определения выполняется равенство f(x+T)=f(x). Число Т в этом случае называется периодом функции. Всякая периодическая функция имеет бесконечное множество периодов. Говоря о пе- риоде функции y = f (х) (f(x) const), обычно имеют в виду наименьший по- ложительный период: так, периодом функции y=sinx является число 2л, периодом функции y = tgx— число л. Функция y=f(x) называется ограниченной на множестве X, если суще- ствует такое число С > 0, что для всех хеХ выполняется неравенство (х) I С. Тригонометрические и обратные тригонометрические функции, функции y=x“(a = const), у = ах(а> 0, а#=1), y = logax(a > О, а=#1) называются ос- новными элементарными функциями. Элементарными функциями называются все функции, которые можно получить из основных элементарных функций с помощью алгебраических действий и образования сложных функций. Например, функции y=lgcosx, y = x3 + sin х, y = 2’8Sln*+COSjr H т. д. являются элементарными. Термин «функция» впервые появился в 1673 г. в одной из работ Лейбница. Под функциями Лейбниц понимал некоторые отрезки прямых. И. Бернулли дал определение функции как аналитического выражения, состоящего из пе- ременной и постоянных величин (1718), он же применял обозначение <рх (без скобок). Обозначение f(x) впервые предложил Эйлер в 1734 г. 167
13.2. Предел последовательности Числовой последовательностью (или последовательностью) называется функция х„ = ф(л), п=1, 2, 3, .... определенная на множестве натуральных чисел. Каждое значение х„(п = = 1, 2, 3,...) называется элементом последовательности, а число л — его номером. Числовую последовательность с элементом х„ обозначают либо хп, п = = 1,2, 3, ... , либо (л,, х2,... , х„, ...), либо (хп). Примеры числовых последрвательностей: 1) (с) = (с, с, с, ...); 21 ( ' -Т-Т- 31 <«»»>-<->• I. 1,...). Числовая последовательность всегда содержит бесконечное множество элементов; среди них могут быть равные (см. примеры 1) и 3)). Число а называется пределом последовательности (х„), если для любого числа е > 0 найдется такое натуральное число N, что при всех п> N выпол- няется неравенство |хл— а|<е. Предел последовательности (х„) обозначают lim х„=а; х„-+а при л-*-оо п-*-» (читается: х„ стремится к а, когда п стремится к бесконечности). Последовательность, имеющая предел, называется сходящейся. Последо- вательность, у которой нет предела, называется расходящейся. Интервал (а —е, а + е) называется е-окрестностью точки а и обозначается О(а, е). Определение предела имеет следующий геометрический смысл: число а является пределом последовательности (хл), если в любой его е-окрестности содержатся почти все члены (хл), или вне этой окрестности находится лишь конечное число членов данной последовательности. Из определения предела последовательности следует, что предел постоян- ной равен этой постоянной lim c=c(c=const), поскольку в данном случае оо хл = с, а = с, |х„ — а|=0<е для любого е>0. Из определения следует также, что последовательность может иметь только один предел. Последовательность (х„) называется ограниченной сверху (снизу), если существует такое число А, что хл^А (соответственно хл ^А) для всех номеров л. Последовательность (х„), ограниченная сверху и снизу, называется просто ограниченной. Очевидно, последовательность (хл) ограничена тогда и только тогда, когда существует такое число С > 0, что |х„| для всех номеров п. Например, последовательности (1/л), (1/л2), (сов(лл/2)) ограничены, последовательность (л2) ограничена снизу, но не ограничена сверху, последо- вательность (п cos лп) не является ограниченной ни сверху, ни снизу. Теорема 13.1. Если последовательность имеет предел, то она ограничена. Число а называется верхней гранью последовательности (хл), если: 1) х„^а при всех п; 2) для любого е > 0 существует такой номер N, что х«> >а —е. Верхняя грань последовательности (хл) обозначается sup(x„) или sup х„. Аналогично определяется нижняя грань последовательности (хл) и обозна- чается inf (х„) или inf х„. _ / п—1 \ . . ,/ л—1 \ „ В качестве примеров отметим, что sup!—-—j =1, infl—-—j =0, inf(n2) = l, sup(n2) = oo. Последовательность (x„) называется монотонно возрастающей (монотонно убывающей), если хл^хл+1 (соответственно хп >хл+,) при всех л. Монотонно возрастающие и монотонно убывающие последовательности называются просто монотонными. Теорема 13.2. Всякая ограниченная сверху (снизу) монотонно возрас- 168
тающая (монотонно убывающая) последовательность (х„) имеет предел, при- чем lim x„ = sup(x„) (соответственно lim x„ = inf(xn)). Если последовательности (а„) и (Ьп) имеют пределы, то пределы их суммы, разности, произведения, частного существуют и находятся по формулам lim (а„ + &„) = lim а„+ lim b„, (13.4) п—>ао п—+оо п-*-<зо lim (а„ — bn) = lim ап— lim Ьп, (13.5) П—►оо д—>-<ю п-*-оо lim (anb„) = lim ап lim ba, (13.6) П—►ас л—*-оо п—>оо . . lim ап lim(-^-) = - (Ишб.^О). (13.7) rt-*-oo\ Dn / lim On /!-»-<» n~*-oo Пример 13.1. Последовательность (8-j-l/n) сходится и имеет предел а = 8. Действительно, каково бы ни было число е > О, найдется такое натураль- ное число #, что |х„ —а| = | (8+1/п) —8| = 1/п<е, 1/п<е для п > #; нера- венство (1/п) Се будет выполнено для всех n>N, если #> 1/е, т. е. в ка- честве # можно взять большее из двух последовательных натуральных чисел, между которыми заключено число 1/е. Например, если в|=0,1, то #| = 10; если 62 = 0,01, то #2=100 и т/д. Замечание. Одновременно показано, что последовательность (1/п) имеет пределом нуль, т. е. lim—=0. (13.8) л—► оо П Пример 13.2. Последовательность (cosnn) является расходящейся. В самом деле, каково бы ни было число а, вне его е-окрестности, напри- мер при 0<е<1, заведомо лежит бесконечное множество элементов данной последовательности (хотя среди них и много равных между собой); это озна- чает, что а не является ее пределом. П а и . |. 2п2 —Зп + 5 Пример 13.3. Найти lim---------s----------. r « 6n2+4n —9 Разделив числитель и знаменатель дроби на п2 и применив формулы (13.4) — (13.8), получим 2п2-Зп + 5 .. 2-3/п+5/п2 Д» (2 — З/п + 5/n2) j "-»» 6n2 + 4n—9 «-»“ 6 + 4/n—9/n2 lim (6-f-4/n — 9/n2) 3 n—► OO 13.3. Предел функции Постоянная b называется пределом функции y=f(x) при х->-а (или в точке а), если для любого числа е>0 существует такое число б > 0, что при всех х, удовлетворяющих условию 0< |х—а| <6, выполняется неравенство Щх) -5| <е. Предел функции f(x) при х, стремящемся к а, обозначают: limf(x)=6; f(x)-*b при х-»-а. х-ь-а 169
Рассматривают также односторонние пределы функции: предел слева lim f(x)=bi (х стремится к а, оставаясь меньше а; х<а) и предел справа х-*-а—О lim f(x)=b2 (х стремится к а, оставаясь больше а; х>а). Если односторон- х—О ние пределы равны: lim f(x)= lim f(x)=b, то предел функции f(x) в точке х->а — 0 х-»-й-|-0 а существует и равен b: limf(x)=Z>. Если односторонние пределы различны х~+а или хотя бы один из них не существует, то не существует и предел функции в соответствующей точке. Если с—постоянная величина, то lim с = с. х~*-а Если функции f(x) и <р(х) имеют пределы при х->-а, то lim (f(x)±<p(x))= lim/(x)± lim <p(x), x-*-a x-*a x-*-a (13.9) lim (f(x)«p(x))= lim f(x) lim <p(x), (13.10) f,,4 limf(x) lim -Ц4- = ( lim <p(x) #=0). x-a <p(x) lim<p(x) z-a x— (13.11) Из (13.10) следует, что lim (cf(x)) =с lim f(x) (c=const), lim (f (x))m= (lim f(x))m, x-*-a x->e lim x"=ara, где m — натуральное число. (13.12) (13.13) (13.14) Если л) lim f(x) существует, то x-*a lim 5У/(x) =5/lim f(x). (13.15) x-*d x-*a Число А называется пределом функции y=f(x) при x, стремящемся к — оо или + оо, если для любого числа е > 0 можно указать положительное число N, такое, что при всех значениях х, удовлетворяющих условию |х| > jV, выполнялось неравенство |f(x)— Л|<е. Пример 13.4. Найти lim (2х2 —5х-|-4). Применяя формулы (13.9), (13.12), (13.14), получаем lim (2х2-5х+4)= lim (2х2)— lim (5х) + lim 4=2-32—5-34-4 = 7. х-*-3 х-*3 х-*3 х-»-3 П IO С U я 1- бх2—9x4-7 Пример 13.5. Найти lim-------5------. Е н *-2 Зх2—8x4-5 С помощью формулы (13.11) и формул, указанных в примере 13.4, находим бх2-9x4-4 Jjm (6х2 —9x4-4) _ 6.22_9.2 + 4 Зх2 —8x4-6 lim (Зх2—8x4-6) 3-22-8-24-6 х->2 — х3 -4- х% — 1 Пример 13.6. Найти lim —-——-=-----------. 2-1 х4—2х34-2х2—1 170
При х=1 числитель и знаменатель дроби равны нулю, имеем неопреде- ленность вида -у-. Чтобы раскрыть ее, предварительно преобразуем данную дробь, разложив многочлены на множители: х4—x’-f-x2—1 х3(х— 1) + (х— 1)(х-Н) х4 —2х34-2х2—1 “ (х2 — 1)(х24-1) — 2х2(х— 1) ~ _ (х—1) (х34-х4-1)________ х3+х+1 " (х-1)((х+1) (х2+1)—2х2) ~ X3—х2+х+1 Переходя к пределу, получаем .. х4 — х3 + х2— 1 х3+х+1 3 X4 —2х3 + 2х2— 1 х3 —х2 + х+1 2 16 — х2 Пример 13.7. Найти lim —. --. ~4 V5+*-3 При х=4 числитель и знаменатель дроби обращаются в нуль, имеем не- 0 „ „ определенность вида Чтобы раскрыть эту неопределенность, предваритель- но преобразуем дробь: 16-х2 (16—х2)(-у/5+^+3) (16-х2) (у/54-х-(-3) _ д/54-х-З “ (д/54-х—3)(V5+x4-3) “ “ _ <4-x>«+x)(<S+7+3> _ _ (i+4)(i/5T7+31 5-f-x —9 Переходя к пределу с использованием формулы (13.15), находим lim х-»-4 16-х2 у/54-х-З lim (х4-4) (л/54-х-|-3) = -8-6= —48. Х-»-4 13.4. Бесконечно малые функции и их свойства Функция а = а(х) называется бесконечно малой при х->а (или при х->оо), если ее предел равен нулю: lima(x)=0 (lima(x)=0). х-*-а х->оо Например, Функция а(х) = (х—5)2 есть бесконечно малая при х->5, так как lim а(х)= lim (х—5)2 = 0; функция а(х) = 1/х является бесконечно малой х-»-5 х-»-5 при х —оо, поскольку lim а(х) = lim-----=0. х->-оо х->оо X Принимая во внимание определение предела функции, определение беско- нечно малой функции можно сформулировать следующим образом. Функция а = а(х) называется бесконечно малой при х->а, если, задав любое число е > 0, можно указать такое число б > 0, что для всех х, удовлетво- ряющих условию 0<|х—а|<б, выполняется неравенство |а(х)|<е. Свойства бесконечно малых выражаются следующими теоремами. Теорема 13.3. Если функция у=у(х) имеет предел b при х-»-а, то у(х)=Ь + а(х), у=Ь\а, (13.16) 171
где а = а(х)—бесконечно малая при х-»-а. Обратное также верно: если вы- полнено равенство (13.16), то lim у (х) =6. х-*а Теорема 13.4. Алгебраическая сумма конечного числа бесконечно ма- лых функций при х->- а есть бесконечно малая функция при х->- а. Теорема 13.5. Произведение бесконечно малой на ограниченную фун- кцию есть бесконечно малая функция. Следствие 1. Произведение двух бесконечно малых функций есть бес- конечно малая функция. Следствие 2. Произведение бесконечно малой функции на постоян- ную есть бесконечно малая функция. 13.5. Сравнение бесконечно малых функций Бесконечно малые а(х) и р(х) при х-*а называются величинами одного порядка, если их отношение имеет конечный предел, отличный от нуля, т. е. lim -777^7- = с, или lim -^-7-7— = —— (сч^О). х^а 0(х) х^а а(х) С ' ’ В этом случае пишут: а(х)=О(Р(х)) при х-»-а (читается: а(х) есть О большое от р(х) при х->-а). Например, a(x)=sinx и р(х)=3х при х-<-0 являются бесконечно малыми одного порядка, так как lim a(x)/p(x) = 1/3, sinx=O(3x) при х->0. Если предел отношения а(х)/Р(х) при х->-а равен нулю (с = 0), то величина а(х) называется бесконечно малой высшего порядка по сравнению с 0(х) (величина Р(х)—бесконечно малая низшего порядка по сравнению с а(х)). В данном случае применяется обозначение <х(х) =о(Р(х)) при х-»-а (читается: а(х) есть о малое от р(х) при х->а]. Например, x1 2 * = o(sinx) при х —> О, поскольку lim х-<-0 sin х lim х lim —Д— =0-1 =0. х-.о х—о sm Функция р(х) называется бесконечно малой k-ro порядка относительно функции а(х), если р(х) и (а(х))4 — бесконечно малые одного порядка, т. е. lim =zC (с=#0)- (а(х))‘ Например, если а(х)=х, Р(х)=х4, то при х-*0 р(х) — бесконечно малая четвертого порядка относительно бесконечно малой <х(х) (но бесконечно малая второго порядка по сравнению с у(х)=х2). Две бесконечно малые функции а(х) (или равносильными) бесконечно малыми ния равен единице, т. е. и р(х) называются эквивалентными при х-»-а, если предел их отноше- 1- «(*) । нт т- = 1, или **» р(х) Ит#> =1. х-а а (х) Эквивалентность бесконечно малых а(х) и р(х) обозначается символом а(х)~Р(х) при х-*а. Из формул (13.17) и (13.22) (см. п. 13.8) следует, что при х->0 x~sinx~tgx, 1п(14-х)~х. Теорема 13.6. Бесконечно малые функции а(х) и Р(х) эквивалентны тогда и только тогда, когда их разность есть бесконечно малая высшего порядка по сравнению с каждой из них. 172
Теорема 13.7. Если а(х)~а,(х), 0(х)~0,(х) при х->-а и существует .. аДх) .. а(х) Inn - ; , то существует lim , причем. х^а 0i(x) х~а 0(х) lim а(х) 0(х) lim х-*-а <Х1 (х) Pl W Следствие. Если <xi(x)~0(x), а2(х)~0(х) при х—-а, то аДх)~ ~а2(х) при ха. При нахождении предела отношения двух бесконечно малых функций каж- дую из них (или только одну) можно заменить другой бесконечно малой, ей экви- валентной: если а(х) ~а,(х), 0(х) ~0, (х), то 1™ х->а 0(Х) = lim <xi(x) 0(Х) = lim х->а а(х) 01 (х) = lim х->а «|(х) 01 (X) Замечание. Если отношение а(х)/0(х) двух бесконечно малых функ- ций при х-*-а не имеет предела и не стремится к бесконечности, то бесконечно малые функции а(х) и 0(х) несравнимы между собой. Например, несравнимы при х->0 бесконечно малые функции а (х) =х sin (1/х), 0(х)=х, так как а(х) х sin (1/х) 1 --7 -г = ----—------— = SIH --- 0 X X X и sin (1/х) не имеет предела при х->0. Пример 13.8. Доказать, что функции а(х) =6х2/(1 —х) и 0(х)=х2 при х-»-0 являются бесконечно малыми одного порядка. Найдем предел отношения двух данных функций: г 6х2 .. 1 lim —т----------=6 lim -------------=6. г->-0 х2 (1 — х) х—о 1 —х Поскольку полученный предел отличен от нуля, то данные функции являются бесконечно малыми одного порядка. Пример 13.9. Доказать, что порядок функции а(х) =х5/(2 + х2) выше, чем порядок функции 0(х)=х4 при х->-0. Так как lim —;—-—т— = lim ——г =0, х-,0 х4(2+х2) х+о 24-х2 то функция а(х) =х5/(2+х2) есть бесконечно малая высшего порядка, чем функция 0(х)=х4. Пример 13.10. Найти lim S*n——. х—з х2 — 5х-|-6 При х->-3 функции х — 3, sin(x — 3) являются эквивалентными бесконечно малыми. Поскольку при замене бесконечно малой функции sin(x —3) эквивалент- ной ей функцией х—3 предел отношения не изменится, то ,. sin(x —3) sin(x —3) hm „-----— — lim -г-.——4т- x—3 x2 —5x-(-6 x->3 (x —3)(x—2) .. x —3 .. 1 = llm --5Г = llm---<T = х^з (x—3)(x —2) x->3 x — 2 e , 0111 Л —I— A A Пример 13.11. Наити hm----------5-- H K x-o 2x—x3 Так как (sin x4-x2 — x4) ~sin x, (2x —x3)~2x при x-»-0, to lim x->0 sin x-|-x2— x4 2x —x3 = lim x-*0 sin x ~2x~ 1 ,. sin X = -7— lim------- 2 x—n x 1 2 ’ 173
13.6. Бесконечно большие функции Функция y=f(x) называется бесконечно большой при х->-а, если для любого положительного числа /V можно найти такое число 6 > 0, что при всех значениях х, удовлетворяющих условию 0<|х—а| <6, выполняется неравенство \f(x)| > N. Бесконечно большая функция не имеет предела при х->-а, но иногда условно говорят, что ее предел равен бесконечности, и пишут: limf(x) = oo, или /(*)-> х-*а ~>-оо, при х->-а. Если f(x} стремится к бесконечности при х-*а, принимая только положи- тельные или только отрицательные значения, то соответственно пишут: lim f (х) = + °°, Um f(x) — — оо. х-*а х-*а Если функция f (х) стремится к бесконечности при х->-оо, то пишут lim f (х) = х-> оо 2= ОО . Примером бесконечно большой функции является функция f(x) = l/x при х->-0. В самом деле, при любом 7V > 0 неравенство 11/х| > W будет выполнено, если |х| = |х—0| < 1/W=6. Эта функция принимает положительные значения при х>0( lim f(х) = + оо) и отрицательные — при х<0 ( lim f(x) = — х->- + 0 х—-0 — оо). Функция f(x) = 1/(х—2)2— бесконечно большая при х->-2. Действительно, при любом Л^>0 неравенство 1/(х —2)2> N будет выполнено, если (х —2)2< <l/N или |х—2| <l/ViV=6. Данная функция принимает только положитель- ные значения. Если функция а = а(х) стремится к нулю при х-»-а (или х-»-оо) и не обра- щается в нуль, то функция у(х) = 1/а(х) стремится к бесконечности. 13.7. Основные теоремы о пределах функций Теорема 13.8. Функция у=у(х) не может иметь более одного пре- дела при х-^-а. Теорема 13.9. Пусть функция y=f(x) определена в некотором проме- жутке, содержащем точку а. Если при х-*-а функция y=f(x) имеет положитель- ный (отрицательный) предел, то найдется 6-окрестность точки а такая, что для всех хеО(а,6) функция положительна (отрицательна). Эта теорема называется теоремой о сохранении знака функции, имеющей предел. Теорема 13.10. Если функции и(х), о(х) определены в некоторой 6- окрестности точки а, для всех хе0(а,6), х#=а выполняется неравенство и(х) < <и(х) и функции имеют пределы при х-»-а, то lim u(x)^ lim w(x). х-»-а x-*a Замечание. Теорему 13.10 кратко можно сформулировать так: в нера- венстве, обе части которого имеют пределы, можно перейти к пределу, присоеди- нив знак равенства. Например, 7 +х2 >7—х2, х=/=0; lim (7-f-x2) = lim (7 — — х2)=7. Теорема 13.11. Пусть три функции и — и(х),у = у(х), v = v(x) опреде- лены в некотором промежутке, содержащем точку а. Если для любого х из этого промежутка выполняются неравенства и(х)С <{/(х)<ц(х) и функции и=и(х), о = о(х) имеют одинаковые пределы при х->-а, то функция у = у(х) имеет тот же предел при х-*а. 174
13.8. Некоторые важные пределы Если угол а выражен в радианах, то .. sin а , tgа , lim------=1, lim —— = 1. (13.17) а-0 а а—О а Числом е называется предел limf 14——) —е или lim (1+<х) |'/°=е. (13.18) *->со\ X / а—►О При нахожденйи многих пределов применяются следующие пределы: lim = logae, (13.19) х->о х lim =lna, (13.20) x-*-0 X lim —1 =a. (13.21) x-o x Частными случаями формул (13.19) и (13.20) являются соответственно формулы: lim (13.22) х-^0 X lim—-----L = i. (13.23) Х-.0 х При нахождении пределов вида lim (<р(х))*(<>=С необходимо иметь в виду х-+а е пределы 1ш1<р(х)=Л, 1ппф(х)=В, то х-.а х-.а ф(х) = оо, то С находится с помощью формул ( 0, если 0<Л<1, I + оо, если Л> 1, 4-ос, если 0<Л<1, О, если Л > 1; = оо, то, положив q> (х) = 1 4- а (х), где а (х) -» —>0 при х->а, получим , , , , .. , , , . r J lim а(х)i|>(x) lim [<р(х) — 1Ji|>(х) С= lim {[1 4-а(х)] '/“<') =ex-*a х-*а Пример 13.12. Найти lim^ 1-----------. При х-^оо выражение (1 — (б/х))->1, получаем неопределенность вида 1“ . Чтобы раскрыть ее, введем новую переменную по формуле ( —6/х)=а, откуда х=—b/a.\ a-*-0, когда х->оо. Переходя к пределу с использованием формул (13.13) и (13.18), находим limf 1- —Y= lim (l-|-a)-6/“= lim [(1+a)l/a] ~‘ = x-.oo\ X / a-. 0 a-*0 следующее: 1) если существуют конечны С=Лв; 2) если lim <р(х) =Л =#= 1 и lim x-*a x-.a lim Лх = X-> -J- oo lim A’—t — co I 3) если lim<p(x) = l, lim ф(х) x-^a x-^a 175
= [ lim (1+ <z) l/“]-* = <»-*; lim ( 1-— a—*-0 x—*• оо \ X / В частности, при Ь—— 2 получаем lim ( 14---1 =e2, при 6=3 имеем X-*-oo\ x / lim ( 1--1Л=е-з x^oo\ x ) n 1- ( 3x—-2V Пример 13.13. Наити lim I -j . . I x-*- oo \ Зх + 4/ Разделив числитель и знаменатель на Зх и воспользовавшись результатом примера 13.12, получим 1 - (2/3)/х\ * 1 + (4/3)/х/ = Нт ( 1 _ -2/LY ; lim f l + -^-Y=e-2/3:e4/3 = e-2. х-оо\ X / X—оо\ X / П, „ 1 j ! ° ,. sin 7х ример 13.14. Наити hm ----------. х-»0 X Преобразуя эту дробь и применяя первую из формул (13.17), находим .. sin 7х 7sin 7х _ sin 7х _ , _ hm -------= hm — =7 hm —= =7-1 =7. х->о х х-*о 7х х_^о 7х Пример 13.15. Найти lim * * ~f~2y—1_ у-0 У Преобразуя данную функцию, вводя новую переменную х—2у и применяя формулу (13.21), находим ,™ _ „т , (1+2,>''--1 _ у-0 У (/-о 21/ = 2lim<l±.^'/2-J =2. ‘ х—о х 2 Пример 13.16. Найти lim . у-+0 У Преобразуя эту функцию, вводя новую переменную х = 5у и применяя форму- лу (13.22), получаем lim ln<1+5^ = lim 5 >П(1+5^ = у-0 У «—О оу .. In (1 +х) , _ = 5 hm —-—I—— =5-1 =5. x^O X еу/3 — 1 Пример 13.17. Найти lim-----------. у^о У После соответствующих преобразований по формуле (13.23) находим еУ/3 _ 1 еи/3 — 1 Нт ------5- = lim о = 1/->0 У у-*0 оу/3 1 ех-1 1 , 1 = “V 11П1 --Z-- = “О- • 1 = Т- ' о х—► О X и о 176
13.9. Непрерывность функции Функция y=f(x), определенная на интервале (а, 6), называется непре- рывной в точке хое(а,й), если lim f (х) =f (х0) (13.24) Х-+Хо (т. е. предел функции равен ее значению при предельном значении аргумента). Согласно определению предела функции, условие (13.24) равносильно сле- дующему: для любого числа в > 0 существует такое число 6 > О, что при всех х, удовлетворяющих условию 0< |х — а| <6, вы- полняется неравенство lf(x) — f(xo) I <е. Если х»е (а, Ь) и хе(а, Ь), то разность Дх = х—Хо называется приращением аргумента в точке х0, а разность &y=f (х) — f (х0), или Ду= =f(xo+Дх) — f (хо), —приращением функции в той же точке (рис. 13.1); Ду— функция Дх. Необходимое и достаточное условие непре- рывности функции y = f(x) в точке х0 выража- ется равенством lim Ду = 0, или lim [/(хо + Дх) — f(x0)] =0. Дх—о Дх—о (13.25) Итак, функция непрерывна в точке, если бесконечно малому приращению аргумента в этой точке соответствует бесконечно малое приращение функции. Замечание. Поскольку хо= lim х, то формулу (13.24) можно перепи- X—Хо сать так: lim f(x) =f( lim x), т. e. для непрерывной функции символы предела X—Хо X—Хо и функции перестановочны. Теорема 13.12. Если функции f(x) и <р(х) непрерывны в точке х0, то также непрерывны в этой точке их сумма f(x) +q>(x), разность f (х) —<р(х), про- изведение Цх)<р(х), а также частное f(x)/q>(x) при условии, что <р(х)=#=О. Следствие 1. Целая рациональная функция Р„(х) =ao-j-aix+a2X2 + +... + апх" непрерывна при всех х. Следствие 2. Дробная рациональная функция ц (%) = — ao + aix + °2-y2 +-..+ОпХ" Qm (х) -|- Ь lX~(- ЬгХ2 •• • И” ЬтХП непрерывна при всех х, для которых знаменатель не обращается в нуль. Теорема 13.13. Если функция «р(х) непрерывна в точке хо, а функция f (у) непрерывна в точке уо = ф(хо), то сложная функция F(x) =f [<p(x)J непре- рывна в точке хо. Функция называется непрерывной на интервале, если она непрерывна в каж- дой точке этого интервала. Если функция определена при х=а и при этом lim f(x)—f(a), то гово- х—а + 0 рят, что f (х) в точке а непрерывна справа. Аналогично, если lim f(x)=f(b), х—*-0 то говорят, что в точке b эта функция непрерывна слева. Функция называется непрерывной на отрезке [а, 6], если она непрерывна в каждой его точке (в точке а — непрерывна справа, в точке b — непрерывна слева). Отметим, что основные элементарные функции непрерывны в соответствую- щей области определения. Функции, непрерывные на отрезке, обладают рядом важных свойств, которые выражаются следующими теоремами. 177
Теорема 13.14. Функция, непрерывная на отрезке 1а, Ь], достигает в нем своего наименьшего значения m и наибольшего значения М, т. е. существуют такие точки xt, х2 этого отрезка, что f(xi) = m, f(x2)=M. Эта теорема имеет простой геометрический смысл (рис. 13.2). Замечание. Функция, непрерывная на интервале, этим свойством не обладает. Напри- мер, функция у—6х2 на интервале (0, 1) не до- стигает значений т = 0 и М = 6, так как эти значения функция принимает в точках х=0 и х—1, а последние данному интервалу не при- надлежат. Теорема 13.15. Если функция y=f(x) непрерывна на отрезке [а, 6] и на его концах принимает неравные значения f(a)=A, f(b) = B, А=£ В, то каково бы ни было число С, за-, ключенное между А и В, найдется точка се= е[а, Ь] такая, что f(c) = C. Геометрический смысл теоремы иллюстриру- ется на рис. 13.3, а, б. Всякая прямая у—С, где АсСсВ (или А> С~> В), пересекает гра- фик функции y=f(x). Следствие. Если функция непрерывна на отрезке и на его концах прини- мает значения разных знаков, то на этом отрезке найдется хотя бы одна точка, в которой функция обращается в нуль. Это частный случай теоремы: ЛВ<0, С=0; геометрический смысл: график непрерывной функции у=/(х), соединяющий точки Р(а, f(a)), Q(b, f(b)), для которых f(a)f(b)<0, пересекает Ьсь Ох (рис. 13.4, а, б). Отметим, что сумма конечного числа функций, непрерывных на некотором отрезке, непрерывна на этом отрезке. 178
13.10. Точки разрыва функции Рассмотрим функцию y=f(x), определенную на интервале (а, Ь), кроме, быть может, точки хое (а, Ь). Значение аргумента х0 называется точкой разрыва данной функции, если при х=х0 функция определена, но не является непрерывной или не определена при этом значении х. Если хо — точка разрыва f(x) и существу- ют конечные пределы Цхо — 0) = lim f(x), Х-*Х0 —О f(xo + O) — lim f(x), f(xo — 0) #=f(xo + O), to x—►.to 0 она называется точкой разрыва первого рода. Величина /(хо + О) — Цхо — 0) называется скачком функции f(x) в точке х0. Если хо — точка разрыва и f(x0 — 0) = = f(Xo + O), то хо называется точкой устра- Рис. 13.5 нимого разрыва. Если хотя бы один из односторонних пределов /(хо— 0), f(xo-)-O) не суще- ствует или является бесконечным, то х0 называется точкой разрыва второго рода. Пример 13.18. Функция /(х) = —х/|х| в точке хо=О имеет разрыв первого рода. Действительно, f(x) = 1 при х<0 и f(x) = — 1 при х=0, в точке хо=0 функ- ция не определена; lim f(x) = l, lim f(x) = — 1. Скачок функции в точке х-.—О х-<-+0 х0 = 0 равен —2 (рис. 13.5). Пример 13.19. Для функции f(x) = (sin х)/х значение аргумента х0 —0 является точкой устранимого разрыва. В самом деле, при хо = О данная функция не определена, но имеет равные односторонние пределы: lim (sinx)/x=l, lim (sinx)/x=l. - 0 x— -f- 0 График функции изображен на рис. 13.6. Пример 13.20. Функция f(x) = l/x в точке х0 = 0 имеет разрыв второго рода, так как lim 1/х= — оо, lim 1/х=-|-оо. х-»—о х->-+0 179
Пример 13.21. Для функции f(x) =3|/ж значение хо = О является точкой разрыва второго рода, так как lim f(x) = -|-oo. Второй односторонний предел х—> + О конечен: lim f(x)~0 (рис. 13.7). х-* —О 13.11. Показательная функция. Гиперболические функции Показательной (или экспоненциальной) называется функция у—ах(а > > 0, а=/=1). Пусть а = е (см. формулу 13.18), в этом случае показательная (экс- поненциальная) функция обозначается у = е*=ехр х. Показательную функцию с другим основанием можно привести к показатель- ной функции с основанием е. Действительно, по определению логарифма а = = е'"“, поэтому ах = (е1п“)х — еЬх, где k = lna. Гиперболическим синусом называется функция, определяемая формулой shx= , (13.26) гиперболическим косинусом — функция 180
Гиперболический тангенс и гиперболический котангенс определяются соот- ветственно формулами th х= sh х ch х ,, ch х cth x = —;— sh x e* — e * ex + e~‘ ’ ex + e-‘ ex—e~‘ (13.28) (13.29) Функции, определяемые формулами (13.26) — (13.29), называют гиперболи- ческими. Гиперболические функции имеют вполне определенные значения при всех значениях х, кроме функции у = cth х, которая в точке х=0 обращается в беско- нечность. Отметим, что sh 0 = 0, ch 0=1, как и для обычных синуса и косинуса. Гиперболические функции не обладают важнейшим свойством тригономет- рических функций — свойством периодичности. Кроме того, множество значений каждой гиперболической функции существенно отличается от множества значе- ний соответствующей тригонометрической функции. Функция y=shx принимает все действительные значения, т. е. множество ее значений совпадает с бесконеч- ным интервалом (—оо, -|-оо); i/ = ch х — значения, не меньшие единицы (1< <chx< + oo); значения функции </ = th х по модулю не превышают единицы ( — Icthxcl); значения у=cth х по модулю больше единицы (cthx>l при х>0, cth х < — 1 при х<0). Графики гиперболических функций представлены на рис. 13.8 и 13.9, а, б. Прямые у= +1, у= — 1 являются асимптотами графиков функций z/ = th х, i;=cthx. Кроме того, ось Оу служит асимптотой графика функции </=cthx.
Глава 14 ПРОИЗВОДНЫЕ И ДИФФЕРЕНЦИАЛЫ 14.1. Понятие производной, ее геометрический и физический смысл Касательной к линии / в точке Af0 называется прямая МоТ — предель- ное положение (рис. 14.1) секущей А4ОЛ4, когда точка М стремится к Мо вдоль данной линии (т. е. угол у стремится к нулю) произвольным образом. Производной функции y = f(x) в точке хо называется предел отношения приращения этой функции к приращению аргумента, когда последнее стремится к нулю. Производную функции y=f(x) в точке Xg обозначают символом Г (*о) (чита- ется: «эф штрих от хо») или у'(хо). Следовательно, по определению Г(х0)= Нт , или — цт (14.1) Дх—О Дх дх—о Дх ,, , , dy txy • .. Дх Употребляются и другие обозначения: —-р- = lim , х= lim ——.если dx дх—о Дх д/-о Д< *=/(<)• Термин «производная» (а также «вторая производная») ввел Ж. Лагранж (1797), он же предложил обозначения у', f'(х), f"(х) (1770, 1779). Обозначение iy/dx впервые встречается у Лейбница (1675). Геометрический смысл производной. Производная функции y=f(x) при х = =х0 равна угловому коэффициенту касательной к графику данной функции в точке Мо(хо, f(x0)), т. е. f'(x0)=tga, (14.2) где а — угол наклона касательной к оси Ох прямоугольной декартовой системы координат (рис. 14.2). Уравнение касательной к линии y—f(x) в точке А4о(хо, уо) принимает вид У—Уо=['(хв)(х—хо). (14.3) Нормалью к кривой в некоторой ее точке называется перпендикуляр к каса- тельной в той же точке. Если f'(xo)=/=O, то уравнение нормали к линии y=f(x) 182
в точке Мо(хо,уо) запишется так: У-|/о= - - (хо—Хо). (14.4) Физический смысл производной. Если x=f(t)—закон прямолинейного в момент времени /. движения точки, то x'=f (/) — скорость этого движе Быстрота протекания физических, химических и других процессов выражается с помощью произ- водной. Если отношение \у/\х при х->-хо имеет предел справа (или слева), то он называется производной справа (соответственно производной слева)". Такие пределы называются односторонними производными. Односторонние производные функции f(x) в точке Хо обозначаются соответственно символами f'_ (х<>) Г+(*о): ' Г- (х0) - lim f(xo + Ax)—f(xo) -------т----------производная слева; 1._ f(xo + Ax)—f(xo) I + (хо) = д 1 im_о---——!---------производная справа. Очевидно, функция f(x), определенная в некоторой окрестности точки х0, имеет производную f'(x<>) тогда и только тогда, когда односторонние производ- ные f'-(xt>), f+(x0) существуют и равны между собой, причем (х0) =f'+(xo) = =f'(x0). Если для некоторого значения х выполняется одно из условий Л{/ , ,. Д{/ lim -Т-2-= + оо, lim -2-= — оо, Дх-*0 Дх Дх-*-0 Дх. то говорят, что в точке х существует бесконечная производная, равная соответ- ственно + оо, — оо. Геометрическое истолкование производной как углового коэффициента касательной к графику распространяется и на этот случай: касательная в данном случае параллельна оси Оу (рис. 14.3, а — Ь). Функция, имеющая производную в Данной точке, называется дифференци- руемой в этой точке. Функция, имеющая производную в каждой точке данного промежутка, называется дифференцируемой в этом промежутке. Если промежу- ток является замкнутым, то на концах его имеются в виду односторонние произ- водные. Операция нахождения производной называется дифференцированием. Зависимость между непрерывностью и дифференцируемостью функции выра- жается следующей теоремой. Теорема 14.1. Если функция у=f(х) дифференцируема в данной точке, то она и непрерывна~6 ней. 183
Замечание. Обратное утверждение не всегда верно. Например, функ- ция у = |х— II непрерывна в точке х = 1, но не является дифференцируемой в ней. Пример 14.1. Записать уравнение касательной к линии f(x)=x — — 4х + 7 в точке х = 3. . Так как f'(x) = 2х-4, х0 = 3, f'(xQ) = 2, yo=f (х0) =f (3) = 4i, то> в соот- ветствии с уравнением (14.3) получаем у — 4 = 2(х—3), или 2х — у — 2 — О. Пример 14.2. В какой точке касательная к линии f(x)=x Их 5 параллельна прямой 2х —2</4-3 = 0. 2 Данная прямая имеет угловой коэффициент k— 1. Поскольку j (х) —Зх 11, то в силу равенства (14.2) имеем Зх2— 11 = 1, или Зх2 = 12, откуда х, = 2, х2=2. Находим y1=f(x1)=f(-2)=9, j/2=f(x2) =f(2) = +19. Следовательно, полу- чили две точки:ЛЬ ( — 2, 9), Л4г(2, — 19). Пример 14.3. Записать уравнение нормали к линии f(х) =х24-5х — 7 Так как /'(х) =2x4-5, х0=—4, f'(x«) =Г( — 4) = — 3, J/o=f(xo) =f(—4) = = — 11, то уравнение (14.4) принимает вид j/4~ 11 = — 1/ —3(х4-4), или х — — Зу—29 = 0. 14.2. Основные правила дифференцирования Производная алгебраической суммы функций выражается следующей теоремой. Теорема 14.2. Производная суммы (разности) двух дифференцируемых функций равна сумме (разности) производных этих функций: (u±o)' = u'± v'. (14.5) Следствие. Производная конечной алгебраической суммы дифферен- цируемых функций равна такой же алгебраической сумме производных слага- емых. Например, (u-v-\-w)' — и’ — v' -\-w’. Производную произведения функций определяет Теорема 14.3. Производная произведения двух дифференцируемых функций равна произведению первой функции на производную второй плюс произведение второй функции на производную первой, т. е. (uv)' = u'v + uv'. (14.6) • Следствие 1, Постоянный множитель можно выносить за знак производ- ной (cv)'-cv' (c=const). Следствие 2. Производная произведения нескольких дифференциру- емых функций равна сумме произведений производной каждой из них на все остальные. Например, (uvw)'= u'vw-f-uv'w-i-uvw'. Производная частного двух функций выражается следующей теоремой. Теорема 14.4. Производная частного двух дифференцируемых функций определяется формулой (и \ ' и'и —uv' —(Ц^О). (14.7) Производную сложной функции выражает Теорема 14.5. Если у = ((и) и « = <р(х)—дифференцируемые функции своих аргументов, то производная сложной функции y=f(<f>(x)) существует и равна произведению производной этой функции по промежуточному аргументу на производную промежуточного аргумента по независимой переменной, т. е. у'х—уМ, dy _ dy du dx du dx (14.8) 184
Производная обратной функции. Если y=f(x) и х=<р(у) — взаимно обратные дифференцируемые функции и у£#=0, то 4=^г- (14.9) 14.3. Основные формулы дифференцирования Производные степенных и тригонометрических функций выражаются следующими формулами: (x^^)' = ax’^-,, х', = 1< (т/х)' = 1 , (-Ц 2 ух \ х / х (sin х)' = cos х, (cos х)' — — sin х, (tg*)'=----. (ctgx)' =-------Д—• cos2x sin'x Если u = u(x) —дифференцируемая функция, то (иа)' = аи°~1и', (14.10) (sin «)' = cos и-и', (cos u)'= — sin u-u', (14.11) (tgU)'=.^—, (ctgU)'=-_^_. (14.12) cos и sin и Пример 14.4. Найти производную функции y=^Ji —х5. Считая 1— х2 — и и применяя формулу (14.10), получаем </=(1-х2)1/2, 2 2-^1—? д/1—х2 Пример 14.5. Найти производную функции y=sin+cos Применяя формулы (14.11), находим , X / X V X / х\' y=cos— Ы.) = 1 X 1.x " Тcos “з 6'sin-6~- Пример 14.6. Найти производную функции y = ctg23x. Так как y = v2, где n = ctgu, и = 3х, то формулу (14.8) применяем дважды. На основании формулы (14.10) и второй из формул (14.12) получаем У' = ~ 2ctg Зх -1- - (Зх)' = - 6ct-^ — . sm Зх sin Зх Пример 14.7. Найти производную функции у= l/tg22x. Так как y—\/w, w = v'2, o = tgu, u = 2x, то y'z = y'w-w't,-v'u-u'x. Применяя формулу (14.10) и первую из формул (14.12), находим , 1 о* „ 1 4 1 4cos 2х tg42x cos22x tg32x cos 2х sin32x Производные показательных и логарифмических функций выражаются 185
формулами (ах)' = ах1па, (ех)'=ех, (logox)'=-^logae=—J—, (lnx)'= (х>0), (In |х|)'=-j-(х^=0). Если и — и(х) —дифференцируемая функция, то (а“)' = а“ In a-и', (е“)' = е“и', (14.13) СП“)'=4- (14Л4) Пример 14.8. Найти производную функции y=esln Зх Применяя вторую из формул (14.13), находим / = esin 3x(sin 3x)' = esin3xcos 3x(3x)' = 3esin 3xcos 3x. Пример 14.9. Найти производную функции i/ = ln(l+x2). На основании второй из формул (14.14) получаем (1+х2)' 2х У 1+х2 1+х2 Пример 14.10. Найти производную функции i/ = ln -0г2 + 4х+5 . Так как У= -£-1п(х24-4х + 5), то '= (*2 + 4х + 5)' = х + 2 У 2(х2 + 4х4-5) х2 + 4х + 5 Производные обратных тригонометрических функций находят по формулам , w 1 , W 1 (arcsin х) —-------, (arccos х) =---------, (arctgx)' = -y-j!—j-, (arcctgx)' =-. Если u = u(x) —дифференцируемая функция от x, то (arcsin u)'=-------, (arccos u)' =--------, (14.15) (arctg u)'= — “ , (arcctg «)' =—r . (14.16) l+u2 1 + u Пример 14.10. Найти производную функции у = arcsin -\/1 — Зх+ +arccos ->/1— 2х. Применяя формулы (14.15), находим (л/1-Зх )' (Vl-2x)' -3 1 У = —------------------=-------------—— — д/1-(1-Зх) -VI - (1—2х) 2д/1 —Зх д/Зх _ -2 1 =3 1 2д/1 — 2х -\/2х 2д/3х —9х2 ~^Чх — \хг 186 •
Пример 14.11. Найти производную функции y = arctg 1— х 1+х ' С помощью первой из формул (14.16) и формулы (14.7) получаем ________1_______( 1-х\' _ (1+х)2 1 + ((1-х)/(1+х))Л 1+х/ (1 +х)2+ (1 - х)2 / - 1 (1 + х) - 1 (1 -X) \ = — 2 = _ 1 \ (1+х)2 / 2 + 2х2 1 +х2 Производные гиперболических функций находят по формулам (sh x)' = ch х, (ch x)' = sh x, (thx)'=—(cthx)' =-------Jj-. ctrx sh x Если u = u(x) —дифференцируемая функция, то (sh u)' = ch u-u', (ch u)' = sh u-u', (14.17) (th «)'=-£-, (cth «)'=--£-. (14.18) ch и sh и Пример 14.12. Найти производную функции у = sh 2х + ch Зх. Применяя формулы (14.17), находим y' = ch 2x(2x)' + sh 3x(3x)' = 2ch 2х-(- +3sh Зх. Пример 14.13. Найти производную функции y = th-|—|-cth-^-. В соответствии с формулами (14.18) получаем = (х/5)' _ (х/7)' = 1____________1 ch2(x/5) sh2(x/7) 5ch2(x/5) 7sh2(x/7) Производные неявных функций и функций, заданных параметрически. Произ- водная функции у —и". Если дифференцируемая функция у = у(х) задана урав- нением Ё(х, у)=0, то производная у' = у'(х) этой неявной функции может быть найдена из уравнения F', — 0, где F = F(x, у) рассматривается как сложная функ- ция переменной х. Если функция у=у(х) задана параметрически: х = х(/), y = y(t) (а</<0), (14.19) ..где х(/), y(t) —дифференцируемые функции и х'(/)=#0, то ее производная у'и определяется формулой y'^tf/x't. (14.20) Производная степенно-показательной функции и", где и, v—дифферен- цируемые функции от х, находится с помощью предварительного логарифмиро- вания, которое приводит к формуле (u’)'=u^v'lnu+-^. (14.21) Пример 14.15. Найти производную функции, заданной уравнением у sin x = cos(x — у). Это уравнение определяет у = у(х) —функцию от х. Подставляя функцию у=у(х) в данное уравнение, получаем тождество y(x)sin x = cos(x—у(х)). Дифференцируем это тождество и из полученного уравнения находим у'=у'(х): у' sinx+ycosx = — sin(x—у) (1 —у'), y'sin х+у cosx= — sin(x—у) +/ sin(x—у). 187
. . , . ,, . . . . , у cos x + sin (x —y) i/cosx+sin(x —«/)=</ (sm (x-j/J-smx), y'= sin (x_y) _~sin ~ • Пример 14.16. Найти производную функции, заданной уравнениями x=t — sin t, j/=l—cos/. Эта функция задана параметрически (см. (14.19)). Так как х(=1—cos/, , . . , , y't sin / i/i = sin/, то по формуле (14.20) получаем у'х= . Пример 14.17. Найти производную функции y = xs,nx. Логарифмируя это равенство по основанию е, получаем In i/ = sin х In х. Дифференцируя, находим у’/y=cos х In x + sin х- (1/х), откуда y'=y(cos х In х+ + sin х- (1/х)), (/' = xsln x(cos х In x + sin x/x). Пример 14.18. Найти производную функции у = хх. Это также функция вида у=и°, где и = х, и = х. По формуле (14.21) полу- чаем у' =х*(1п х +1)• Производные высших порядков. Производной второго порядка, или второй производной, функции y = f(x) называется производная от ее производной у' = =('(х) (которую называют первой производной). Обозначения второй производной: y"=(y'Y, f"W = (f'MY, dx dx Механический смысл второй производной. Еслих=/(/)— закон прямолинейного движения точки, то x" = f"(t) — ускорение этого движения в момент времени /. Аналогично определяются и обозначаются производные третьего, четвер- того и более высоких порядков: /"=(//")'= (Г W)'. У,v =(/")',- , УМ =(</"“')' Производная n-го порядка обозначается и так: dxn Если функция задана параметрически: х=х(/), y=y(t), то ее вторая про- изводная определяется формулой = (14.22) dx2 х Пример 14.19. Найти вторую производную функции у=х3 In х. Так как и'= (х3)' In x-f-x3(ln х)' = 3х2 in х+х3(1/х) = 3х2 In х+х2, то у" = = 6х In х + 3х2(1/х) + 2х, у" = §х In х + 5х. Пример 14.20. Найти вторую производную функции, заданной парамет- рически: х=/ — sin/, У=1—cos/. Поскольку х' = 1 —cos /, у' = sin /, x" = sin /, у" = cos /, то по формуле (14.22) d2y (1 — cos /)cos / — sin t sin t cos/—1 1 получаем — (1—cos/)3 (1—cos/)3 (1—cos/)2 Пример 14.21. Найти f'"(l) для функции f(x) = x4 — 5x3 + 6x2 — 7x + 9. Так как f (x) = 4x3- 15x2+ 12x-7, f"(x) = 12x2-30x+ 12, to f"'(x)=24x — — 30. Следовательно, /'"(!) = — 6. 14.4. Дифференциал функции Понятие дифференциала. Применение дифференциала в приближенных вычислениях. Рассмотрим функцию y=f(x), определенную в некотором про- межутке (а,Ь), и ее приращение &y — f(х + Дх)—f(x) в точке Хо, где Хо, (хо + +Дх) е (а, Ь). 188
Если приращение функции представимо в виде Д1/ = ЛДх+о(Дх), (14.23) где А — постоянная, о(Дх) — бесконечно малая высшего порядка по сравнению с Дх, то слагаемое ЛДх называют дифференциалом функции f(x) в точке х0 и обозначают dy или df(x0) :dy = ЛДх; функцию y = f(x) в этом случае называют дифференцируемой в точке х0. Если приращение функции y = f(x) представимо формулой (14.23), то A = f'(x0): следовательно, dy = f'(x(1)Ax. Так как </х = Дх, (14.24) т. е. дифференциал независимой переменной равен приращению этой переменной, то dy = f' (xo)dx, dy=y'xdx, (14.25) откуда f' (хо) = dy/dx, т. e. производная равна отношению дифференциала функции к дифференциалу независимой переменной. Формулу (14.23) можно записать так: Ay = dy-\-o(Ax). (14.26) Дифференциал функции называют также главной линейной частью ее приращения. Теорема 14.6. Бесконечно малое приращение функции эквивалентно ее дифференциалу при всех значениях независимой переменной, для которых производная функции конечна и отлична от нуля. Из равенства (14.26) при достаточно малых Дх получаем byaidy, или f (хо + Дх) — f (х) «/'(х0)Дх, (14.27) откуда f(xo +Дх) як/(х0)+/'(х0)Дх. (14.28) Формулы (14.27) и (14.28) применяются в приближенных вычислениях. Пример 14.22. Вычислить значение, дифференциала функции f(x)=x4 — — 5х2 + 7, когда аргумент х меняется от х = 2 до х = 2, 1. Найдем сначала выражение для дифференциала данной функции по фор- муле (14.25): dy= (xi — 5x„ + 7)'dx= (4х„— 1Охо)</х. Так как ^х=Дх=х,—х0 = = 2, 1—2 = 0, 1, х0 = 2, то dy=(4-23— 10-2)0,1 = 1,2. Пример 14.23. Вычислить приближенно значение функции f(x) =^/1 + 7х2 при х= 1,1. Значение аргумента х=х0 + Дх представим в виде х=1+0,1, где х0= = 1, Дх=0,1. При х0= 1 легко вычисляются значения функции и ее производной Эти значения входят в формулу д/1 + 7(1,1) д/1 + 7 • 12 + ~з----0,1, 3 V(l+7-12)2 полученную из формулы (14.28). Следовательно, f (1, 1) =2-|-7/60®2,117. Геометрический смысл дифференциала. Дифференциал функции равен приращению ординаты касательной к графику функции в со- ответствующей точке, когда аргумент получает приращение Дх (рис. 14.4). Отметим, что dy<ky (рис. 14.4, а) или dy> Ау (рис. 14.4,6); если функция равна постоянной, то dy = Ay = 0. Физический смысл дифференциала. Рассмотрим прямоли- нейное движение точки по закону s=f(t), где s — длина пути, t — время, f(t) — дифференцируемая функция; тогда ds = f'(t)dt = v(t)dt, где v(t) —скорость дви- жения. Следовательно, дифференциал пути равен приращению пути, получен- ному в предположении, что, начиная с данного момента t, точка движется равномерно, сохраняя приобретенную скорость. 189
Свойства дифференциала. Дифференциал функции обладает свойствами, аналогичными свойствам производной. 1. Дифференциал постоянной равен нулю: 2. Дифференциал суммы дифференцируемых функций равен сумме дифферен- циалов слагаемых: d(u + и) = du + du. (14.30) Следствие. Если две дифференцируемые функции отличаются постоян- ным слагаемым, то их дифференциалы равны d[u-[-c)—du (c = const). (1431) 3. Дифференциал произведения двух дифференцируемых функций ранен произведению первой функции на дифференциал второй плюс прои (ведение второй на дифференциал первой: d(uu) =udv+ udu. (14.32) Следствие. Постоянный множитель можно выносить за вник диф- ференциала d(cu}=cdu (c = const). (14.33) 4. Дифференциал частного и/v (г.’^#=0) двух дифференцируемых функций и — и(х) и ц = ц(л) определяется формулой ") = vdu~udv . (14.34) \ и / и2 5. Свойство независимости вида дифференциала от выбора независимой переменной (инвариантность формы дифференциала): дифференциал функции равен произведению производной на дифференциал аргумента независимо от того, является ли этот аргумент независимой переменной или функцией другой независимой переменной. Осн овные дифференци алы: 1. dxa = ax'1~'dx. II. d (ax) =a" In adx. III. dx rf(ln|je| ) = -у-, IV. J (sin x) =cos xdx. V. d (cos x) = — sin xdx, VI. d(tg x) =dx/co&2x, 190
VII. d(ctg x) = — dx/sin2x, VIII. d(arcsin x) = dx/-\/l —x2, IX. d(arccos x) = — dx/^j\ — x2, X. d(arctg x) = dx/(\ +x2), XI. d(arcctgx) = — dx/(l+x2), XII. d(sh x) =ch xdx, XIII. d(ch x) =sh xdx, XIV. d(th x) = dx/ch2x, XV. d(cth x) = — dx/sh2x, XVI. df(u)=f'(u)du. Дифференциалы высших порядков. Если х — независимая переменная и y=f(x)—дифференцируемая функция, то dx=f'(x)dx, т. е. дифференциал функции есть функция, зависящая от двух аргументов х и dx. Этот дифферен- циал будем называть также дифференциалом первого порядка (или первым дифференциалом). Считая dx постоянной, получаем, что df(x) —функция одной переменной. Предположим, что функция y=f(x) имеет не только первую произ- водную, но и п последовательных производных y" = f"(x), y'" = f"'(x), ..., у<п> = =f(rl)(x). Дифференциал от дифференциала функции y—f(x) называется вторым диф- ференциалом или дифференциалом второго порядка этой функции и обозна- чается d2y.d2y = d(dy), причем d2y = f"(x)dx2. (14.35) Дифференциалом n-го порядка называется дифференциал от дифференциала (п — 1)-го порядка: d"y = d(d"~'y): dny = f'",(x)dxn. (14.36) Замечание. Формулы (14.35) и (14.36) при n> 1 справедливы, когда х является независимой переменной. 14.5. Основные теоремы дифференциального исчисления Теорема 14.6 (Лагранжа). Если функция f(x) непрерывна на отрезке [а, 6] и дифференцируема в интервале (а, Ь), то существует такая точка с^. (а, Ь), что f(b)—f(a)=f'(c)(b — a) (а<с<Ь). Следствие 1. Если производная функции равна нулю в каждой точке некоторого промежутка, то функция есть тождественная постоянная в этом промежутке. Следствие 2. Если две функции имеют равные производные в некотором промежутке, то они отличаются в этом промежутке лишь постоянным слагаемым. Корнем (или нулем) функции y = f(x) называется такое значение х = х0 ее аргумента, при котором эта функция обращается в нуль. Геометрически корень функции означает абсциссу точки, в которой график функции пере- секает ось Ох или касается ее. Т е о р е м а 14.7 (Ролля). Между двумя различными корнями дифференци- руемой функции содержится по меньшей мере один корень ее производной. Замечание 1. Теорема имеет простую геометрическую интерпретацию: между значе- ниями а и b имеется по меньшей мере одно значение с такое, что в точке С(с, f(c)) гра- фика функции, касательная к графику парал- лельна оси Ох (рис. 14.5). Замечание 2. Теорему можно сформу- лировать в более общем виде. Если y = f(x) — функция, дифференцируемая на отрезке [a, Z>] 191
и f(a)=f(b), то между а и Ь найдется точка с, в которой производная равна нулю, т. е. У (с) =0. Теорема 14.8 (Коши). Если y = f(x) и y=<f(x) —две функции, непре- рывные на отрезке [а, &] и дифференцируемые в интервале (а, Ь), причем <р'(х)#=0 для любого х<^(а,Ь), то между а и Ь найдется такая точка с, что f(b)-f(a) ['(с) <р(й) — <р(а) <р'(с) 14.6. Формула Тейлора Формула f(x)=f(a) + -Ш- (х—а) + (х--а)2+...+ (х-а)" + + /("+1)7Де1(Га)) (*-а)"+1 (14.37) называется формулой Тейлора с остаточным членом в форме Лагранжа: /?,(*) = ^+1)(Е)- (U-38) (Л “Г" V • Если а=0, то формула принимает вид /<«> _т + £gL,+ ^+.+ (14.39) где О<0<1, и называется формулой Маклорена. Формулу (14.37) можно записать в виде f(x)=f(a) + - а) + ...+ J^L (х-аГ + оЦх-а)"), (14.40) где о((х— а)") —бесконечно малая порядка выше n-го по сравнению с х — а; эта форма остаточного члена была указана Пеано. Замечание. Если в формулах (14.37) и (14.40) перенести в левые части f(a) и обозначить х — а = Ах, тогда 2! П1 (П -|- 1) ’ А/(а) = /'(а)Ах+ -l-f"(a)Ax2 + ...+ -l-f(',)(a)Ax" + o(Ax"). f Если в этих формулах Ах заменить на dx и принять во внимание формулы (14.35), (14.36), то получим соответственно Af(a) =df(a) + 4- <О(а) +.•+ d"+1 f{В), Af(a)=df(a) + -l-d7(a)+...+ -l-d7(a)+O(Ax"). Следовательно, если предположить, что Ах—>-0, то по этим формулам из бесконечно малого приращения функции Af(a) можно выделить не только его главный член — первый дифференциал, но и члены более высоких порядков малости, совпадающие (с точностью до факториалов в знаменателях) с после- довательными дифференциалами d2f(a), d3f(a), ..., dnf (a). 192
14.7. Формула Тейлора для некоторых функций Формула (14.39) для функции f(x)=ex принимает вид 1 + тг + 4 +-+^- + Trwе" (О<0<*’• (,441) Отметим, что при любом х остаточный член формулы (14.41) стремится к нулю при неограниченном возрастании п, т. е. lim R„(x) = lim i i'i" = °- n —► oo n~► oo (М-1-1)! Разложение функции /'(x)=sinx по формуле (14.39): X3 , Xs x7 , , Xn . П.Л , sln x = x~ -ЗГ + "бГ - 7Г +-+ ^TSln — + + -етж»"(в'+тЯ;-)- <14-42' Остаточный член « = 7^Т)Т Sin ( 6х + (П+21)Л) формулы (14.42) также стремится к нулю при п-^-оо. Формула (14.39) для функции f(x)=cosx имеет вид . X1 , X4 X6 , , х" пл , cosx=i__ + _ __+... + г_с05—+ + т5тгЧ’'+-Ч!22-)- "4-43> Каково бы ни было х, остаточный член формулы (14.43) стремится к нулю При П-+ОО. Для функции f(x) = (а + х)п, где а — действительное число, п — натураль- ное число, получаем (а + х)"= а" + па"~'х + а"~2х2 + , п(п— 1)(л — 2) „ , . , , п(п—1)...2 . ... ... + —1-----------— а 3х3 + ...Н---jyj—ах" '+х". (14.44) о! у IT 11! Это равенство называется формулой бинома Ньютона. 14.8. Приближенные формулы Если в формуле (14.39) отбросить остаточный член, то получится приближенная формула f{x) + ^Lx4...+ (14.45) заменяющая данную функцию многочленом п-й степени. Качество этой формулы оценивается двояко: указываются границы погрешности Rn(x) с помощью вы- ражения (14.38) для остаточного члена либо порядок малости этой погреш- ности при х->0 /?„(х) =о(х"). 13. Зак. 1699 193
В случае функции f(x) =е“ получаем приближенную формулу е^1 + тт + 4 + зг+-+-5- (14-46) Поскольку /?„(х) =ев'х"+'/(n + 1)!, то, например, при х> 0 погрешность оценивается неравенствами 0<К„(х)< (п+1)! (14.47) В частности, при х= 1 получаем exil-j—— + ——0</?„(х)< 3 < (п+1)! ' Если взять п = 8 и произвести вычисления с пятью десятичными знаками, то получим е = 2,71827. Здесь верны первые четыре знака, так как ошибка не превосходит 3/9! или 0,00001. Взяв f(x)=sinx и положив в равенстве (14.42) n = 2m, получим прибли- женную формулу X3 X5 sinx«x_ —+ । j т— 1^2т— I (2m- 1)! (14.48) остаточный член которой /?2т(х) = sin (0х+ (2т + 1)л/2) (2m+ 1)! х2т+ 1 х2т+1 = (— 1) mcos Ох оценивается соотношением 1Я2т(х)К |х|2т+1 (2ш+1)! ' Для функции /(x)=cosx аналогично получаем у2 „4 у2т cosx~l-- + ^--... + (-ir —. (14.49) Погрешность приближенной формулы (14.49) выражается остаточным членом *-+>« = (-l)m+lcos Ox и оценивается неравенством |х|2т + 2 |/?2т+|(х)|< (2т + 2)! • Например, для формулы созхя: х2 х* 1 ——погрешность 1Я5(х)|< , |х|6 _ X6 = 6! — 720 ' Пример 14.24. Вычислить е0,75 с точностью до 0,001. Применяем формулу (14.46), полагая в ней х = 0,75 = 3/4. Поскольку х< 1 и е<3, то из формулы (14.47) следует, что е9х 3 194
W’ или з Требование |/?л(х) I <0,001 будет выполнено, если —- ("т (п + 1) !> 3000. Это неравенство выполняется при п = 6 (тогда (га1)! = 7! = 5040). Значит, для вычисления е0,75 с заданной точностью в формуле (14.46) нужно 075 , , 3 , 1 З2 , 1 З3 , 1 З4 , 1 v взять шесть слагаемых: е°'75ж 1+ — + __+—. — + — — + — X + 0,7500 + 0,2813 + 0,0703 + 0,0132 + 0,0019 ж 2,1167, е"75 ж 2,117.
Глава 15 ПРИЛОЖЕНИЯ ПРОИЗВОДНОЙ 15.1. Правило Лопиталя — Бернулли При исследовании функций может появиться необходимость нахожде- ния предела дроби Цх) /ср(х), числитель и знаменатель которой при х-»-а стремятся к нулю или к бесконечности. Нахождение Таких пределов называют раскрытием неопределенностей соответствующего вида. Основой его является правило Лопи- таля — Бернулли, выражаемое следующей теоремой. Теорема 15.1. Если функции Цх) и ср(х) дифференцируемы в окрестности точки х = а, обращаются в нуль в этой точке и существует предел отношения f'(x)/<p'(x) при х->-а, тогда существует предел отношения самих функций, равный пределу отношения производных lim х^а <Р(Х) Замечание 1. Теорема верна <р(х) не определены в точке х = а, но Замечание 2. Теорема верна и в случае а=оо, т. е. когда limf(x)=0, limq>(x)=0. X—*-оо Х--*-оо Замечание 3. Если f'(а) = 0, <р'(а) = 0, функции /'(х), ср'(х) дифферен- цируемы в окрестности точки х=а и существует предел отношения f" (х) /гр" (х) при х->-а, то (15.1) х^а ф (х) и в том случае, когда функции Цх) и limf(x)=0, lim <р(х) =0. lim-^ = lim х^а ф'(х) х—а ф"(х) Другими словами, правило Лопиталя — Бернулли ствующих условий можно применять несколько раз. Правило Лопиталя — Бернулли применимо и при ОО ностеи вида ——, поскольку ее можно привести к 0 -g-, представив рассматриваемую дробь так: (15.2) при выполнении соответ- раскрытии неопределен- неопределенности вида 1(х) =__________ ________ <р(х) <р(х) Цх) г- - 0 ОО С помощью тождественных преобразовании к основному виду — или ------------ можно свести неопределенности других видов, таких, какО- оо, оо — оо, 1 0°, оо°. Неопределенность вида 0-оо, т. е. произведение /(х)ср(х), где /'(х)->-0, , , 0 оо <р(х)-»-оо при х->-а, приводится к виду — или -----по формулам О оо Цх)<р(х)==Цх): —I— а затем применяется правило Лопиталя — Бернулли. 196
Аналогично раскрывается неопределенность вида оо — оо, т. е. находится предел lim (/(х)—<р(х)) при условии, что limf(x) = oo, lim <р(х) = оо. С по- мощью преобразования f(x)—q>(x) = l —------------е. ч —т—- \ <р(х) f(x)/ )(х)<р(х) х->а х-*-а х-*а эта неопре- 0 деленность сводится к неопределенности вида —. Раскрыть неопределенность вида 1” — значит найти предел lim (f(x))<₽(’) х-+а при условии, что limf(x) = l, lim <р(х) = оо. х-*а х-*-а Раскрыть неопределенности вида 0°, оо° — значит найти предел lim (/(х))^' х-*-а при соответствующем условии: 1) lim f(x) =0, limcp(x)=0; 2) limf(x) = oo, x-*-a x-*-a x-*-a lim tp(x) =0. X-*a CO Неопределенности 1 ,0°, oo° раскрываются способом, в котором исполь- зуется тождество (/(x))'pW = e<p(') |п/(дг). При раскрытии этих неопределенностей данное выражение предварительно логарифмируют и находят предел его логарифма. Правило, выражаемое теоремой 15.1, сформулировано швейцарским мате- матиком И. Бернулли (1667—1748) и опубликовано в 1696 г. в первом печатном учебнике анализа бесконечно малых, написанном французским математиком Г. Лопиталем (1661 —1704). 0х__е~х Пример 15.1. Найти lim—;—-г-—:—. *-о In (1+х) При х = 0 числитель и знаменатель дроби обращаются в нуль, имеем неопре- деленность вида -5-. Чтобы раскрыть ее, применяем правило Лопиталя — Бер- нулли: lim “i—л \ = ,im 1 //Tj_ \ = 2- x-o ln(l+x) x-o 1/(1 +x) n xx " i- cosx — cos 7x Пример 15.2. Наити lim--------------—. x-»0 cos X — cos 3x Для раскрытия этой неопределенности вида — правило Лопиталя — Бер- нулли необходимо применить дважды: ,. cosx—cos 7х lim---------— х-хО cos х—cos Зх = lim х-»-0 — sinx+3sin3x —cosx+9cos3x -1+49 ^т+т=6- Пример 15.3. Здесь имеем неопределенность вида оо — со. Преобразуем данную разность 1___1 _ е*— 1 —х х е*—1 х(е*— 1) 0 При х = 0 в правой части этого равенства имеем неопределенность вида —— Применяя дважды правило Лопиталя — Бернулли, находим: ( 1 1 \ ,. ех—1—х ,. е*-1 lim (-------—-1 = lim —------= lim---———— = х->о\ х е — \/ х-»-о хе?—х х->о хе -\-е — 1 гс е* 1 о хех + е' + ех 2 197
хп Пример 15.4. Найти lim —, где п—натуральное число. х-<- + оо е“ Применяя правило Лопиталя — Бернулли п раз, получаем .. х" пх"~‘ lim — == lim -----------= х—► + оо е“ х-> + оо ех п(п — 1)х"~2 п(п—1)...2-1 _ = hm —5 ----------------=...= lim —1---------т------=0. х->- + оо ег х— + оо ег Следовательно, при неограниченном возрастании аргумента степенная функ- ция растет медленнее показательной функции. Пример 15.5. Найти lim xl'Z|n<e*~l). При х = 0 получаем неопределенность вида 0°. Обозначим у—х^1п(е'~ *> и прологарифмируем это равенство по основанию е: , 1 1пх 1п у=-------------1п х —---------. 1п(е'—1) 1п(е*-1) ОО В правой части этого равенства при х = 0 имеем неопределенность вида-------- Применяя дважды правило Лопиталя — Бернулли, находим 00 .. . .. 1пх .. 1/х .. е‘— 1 lim In у= lim----------= lim--------------= lim------------ x^o x->o In (ex — 1) x->o 1) x--o xe г = lim---------= 1. x->o e’‘+xex Следовательно, limlny=l, limy=e’=e, lim x|/|n(e*-1)=e. x-xO x-»0 x-fO 15.2. Признаки постоянства, возрастания и убывания функции Необходимое и достаточное условие постоянства функции y=f(x) вы- ражается равенством у' = 0, т. е. у' = 0о у=с. (15.3) Функция y = f(x) называется возрастающей в промежутке (а, 6), если для любых двух значений xi и х2е (а, Ь) из неравенства х,<х2 следует нера- венство f(xi) <f(xs) (рис. 15.1,а). Функция y = f(x) называется убывающей в некотором промежутке, если 198
для любых двух значений, принадлежащих этому промежутку, из неравенства х><х2 следует неравенство f(xi)> f(x2) (рис. 15.1,6). Достаточное условие возрастания (убывания) функции выражается сле- дующей теоремой. Теорема 15.2. Если в данном промежутке производная функции поло- жительна, то функция возрастает в этом промежутке; если производная отри- цательна, то функция убывает в соответствующем промежутке. Замечание. Теорема имеет простой геометрический смысл. Если в не- котором промежутке касательная к графику функции y=f(x) образует с осью Ох острый угол a(tga>0), то функция возрастает в этом промежутке (рис. 15.1, а). Если касательная к графику образует с осью Ох тупой угол a(tg а<0), то функция убывает (рис. 15.1,6). Пример 15.6. Найти промежутки возрастания и убывания функции f (х) = = х3 —6х2 + 9х —2. Находим производную функции и разлагаем на множители соответствующий квадратный трехчлен: f'(x) = 3х2 — 12х + 9 = 3(х2 —4х + 3), f' (х) = 3(х—1) (х—3). Если х< 1 и х> 3, то f'(x)> 0; функция возрастает в интервалах (— оо, 1), (3, +оо). Если 1<х<3, то f'(x)<zO; функция убывает в интервале (1,3). 15.3. Экстремум функции Рассмотрим функцию у = f(х), областью определения которой явля- ется промежуток (а, Ь). Если можно указать такую 6-окрестность точки х>, принадлежащую про- межутку (а, Ь), что для всех xs0(xi,6), x=/=xi, выполняется неравенство f(xi)>f(x), (15.4) то yi=ft(xi) называют максимумом функции y = f(x) (рис. 15.2). Максимум функции y = f(x) обозначим через гпах/^х). Если молено указать такую 6-окрестность точки х2, принадлежащую про- межутку (а, 6), что для всех хеО(х2, 6), х=/=х2, выполняется неравенство f(x2)<f(x), (15.5) то </2 = f(x2) называют минимумом функции y = f(x) (см. рис. 15.2). Минимум функции y=f(x) обозначим через minf(x). Другими словами, максимумом (минимумом) функции y=f(x) называют такое ее значение, которое больше (меньше) всех других значений, принимаемых в точках, достаточно близких к данной и отличных от нее. Замечание 1. Максимум функции, определяемый неравенством (15.4), называется строгим максимумом; нестрогий максимум определяется неравенством f(X^f(x). Замечание 2. Максимум и минимум функции имеют локальный характер (это наибольшее и наименьшее значения функции в достаточно малой окрестности соответствующей точки); отдельные минимумы некоторой функции могут ока-
заться больше максимумов той же функции (рис. 15.3). Вследствие этого мак- симум (минимум) функции называют локальным максимумом (локальным ми- нимумом) в отличие от абсолютного максимума (минимума) — наибольшего (наименьшего) значения в области определения функции. Максимум и минимум функции называются экстремумом. Латинское extremum означает «крайнее» значение. Значение аргумента, при котором достигается экстремум, называется точкой экстремума. Необходимое условие экстремума выражается следующей теоремой. Теорема 15.3. В точке экстремума дифференцируемой функции производ- ная ее равна нулю. Теорема имеет простой геометрический смысл: касательная к графику дифференцируемой функции в соответствующей точке параллельна оси Ох (см. рис. 15.2). Замечание 3. Если f'(x0) =0, то отсюда еще не следует, что х0 — точка экстремума. Например, для функции f(x)—x3 f'(x)=3x2, f'(0) = 0, но Хо = О не является точкой экстремума, так как f(x)>0 при х> 0 и f(x) <0 при х<0 (неравенство (15.4) или (15.5) здесь не выполняется). Замечание 4. Функция может достигать экстремума также в точке, в которой производная не существует. Например, функция у= — |х+41 не имеет производной в точке х=—4, но достигает в ней максимума: z/=0 при х=—4, а для всякой другой точки у<0 (рис. 15.4, а). Функция у— — (1 — х2/3)3/2 не имеет конечной производной в точке х = 0, поскольку у’ = (1 — х2/3) |/2х“1/3 при х=0 обращается в бесконечность, но в этой точке функция имеет минимум: f (0) = — 1, f(x)> — 1 при х=/=0 (рис. 15.4, б). Говорят, что функция у = f (х) меняет знак при переходе через точку х=х0, если f(xt)F(хг) <0 для любых х, и х2 из некоторой окрестности этой точки, удовлетворяющих неравенствам Х|<хо<х2; знак меняется с плюса на минус, если f(xi)>0, a f(x2)<0; знак меняется с минуса на плюс, если f(xi)<0, /(х2)>0. Формулируя теоремы 15.4 и 15.5, будем предполагать, что функция y=f(x) дифференцируема в некоторой окрестности точки хо. Т е о р е м а 15.4. Если при х = хо производная функции y==f(x) равна нулю и меняет знак при переходе через эти значения, то Хо является точкой экстре- мума, причем: 1) х0— точка максимума, если знак меняется с плюса на минус; 2) хо — точка минимума, если знак меняется с минуса на плюс. Теорема имеет следующий геометрический смысл: если в точке Afo(xo, f (х0)) графика дифференцируемой функции касательная параллельна оси Ох, в точках слева от Мо образует тупой угол с осью Ох, в точках справа — острый, то хо — точка минимума (рис. 15.5, а); если в точках слева от Мо касательная образует с осью Ох острый угол, а в точках справа — тупой, то Хо — точка максимума (рис. 15.5,6). Замечание. Теорема верна и в случае, если х0 — точка непрерывности функции fix), производная в ней не существует и меняет знак при переходе через эту точку. Достаточное условие экстремума можно выразить также с помощью вто- рой производной. Теорема 15.5. Если в точке х=х0 первая производная функции y=f(x) равна нулю, а вторая производная отлична от нуля, то х0 является точкой 200
экстремума, причем: 1) х0— точка минимума, если f"(xo)>O; 2) х0 — точка максимума, если f"(x0) <0. Теорема 15.6. Пусть в точке х0 первые п производные равны нулю, а (п+ 1)-я отлична от нуля и непрерывна в этой точке, тогда: I) если (л+ 1) — четное число, то х0— точка экстремума: точка максимума при /(л+1’(хо) <0 и точка минимума при f(n+l)(xo)> 0; 2) если (п+1) —нечетное число, то х0 не является точкой экстремума. Пример 15.7. Найти экстремумы функции f(х) =х4— 10х24- 15. Поскольку f'(x) = 4х3 — 20х = 4х(х2 — 5), то точками, для которых f'(x)=O, являются xi= — у/5, х2 = 0, хз=-^5. Исследуем знак второй производной f"(x) = = 12х2 — 20 в этих точках: f"(— -75) = 12-5—20> 0, /(л/б) = 12-5 —20> 0, f (0) = — 20<0. Следовательно, х, = —д/5, х2 =-75 —точки минимума, х2 = 0— точка мак- симума; min f (х) =f( — V5) =f (зД) =25— 10-5+ 15= — 10, max f(x) —f(0) — 15. Пример 15.8. Вычислить значения экстремумов функции f(x)=x5 — — 5х4 -f- 5х3 + 9. Первая производная f'(x) = 5х4 — 20х3+ 15х2 = 5х2(х2 — 4x4-3) обращается в нуль при xi=0, х2= 1, Хз = 3. Вторая производная f"(x) =20х3 — 60х2 + 30х в этих точках принимает соответственно значения f"(0)=0, f"(l) = —10<0, Г(3) =90> 0. Следовательно, х2=1 — точка максимума, хз=3 — точка минимума, причем max f(x) = f(l) = 10, min f (x) —f (3) = - 18. Чтобы исследовать точку xi=0, обратимся к третьей производной f"'(x) =60х2— 120x4-30. Поскольку f'"(0) = = 30=#=0, п-|-1=3, то xt=O не является точкой экстремума. Пример 15.9. Найти точки экстремума функции f(x) =х44-4х34~6х24- 4-4x4-3. Первая производная f'(x) = 4х34- 12х24- 12х4-4=4(х34-Зх24-Зх-|- 1) равна нулю в единственной точке х= — 1. Находим выражения последующих производ- ных и их значения в критической точке х= — 1: f"(x) = 12х24-24х-|- 12, f"( — 1) =0, /'"(х) =24x 4-24, Г'(—1)=0, fv(x)=24. Поскольку /!V( —1)>0 и л-|-1=4 (четное число), то х —— 1—точка минимума, причем min f(x) =f(—1)=2. 15.4. Направления выпуклости, точки перегиба График функции y = f(x) называется выпуклым вниз (вогнутым вверх) в данном промежутке, если он целиком расположен выше касательной в его произвольной точке (рис. 15.6, а). График функции у = /(х) называется выпуклым вверх (вогнутым вниз) в данном промежутке, если он целиком расположен ниже касательной в его про- извольной точке (рис. 15.6,6). Теорема 15.7. Если вторая производная функции y=f(x) в данном промежутке положительна, то график ее является выпуклым вниз в этом проме- жутке; если f"(x)<0, то график функции является выпуклым вверх в соответ- ствующем промежутке. 201
Точкой перегиба графика функции y=f(x) называется такая его точка Л1о (рис. 15.7), в которой выпуклость меняется на вогнутость (по отношению к одному и тому же направлению: вверх или вниз). Теорема 15.8. Если вторая производная функции y = f(x) при х=х0 обращается в нуль и меняет знак при переходе через х0, то Мо(хо, f(xu)) — точка перегиба графика этой функции. Пример 15.10. Найти интервалы выпуклости и точки перегиба графика функции f (х) = х3 — 6х2 + 9х + 1. Поскольку вторая производная /"(х) =6х—12 = 6(х —2) обращается в нуль при х = 2 и меняет знак при переходе через это значение, то х=2 — абсцисса точки перегиба, ордината этой точки y = f(2) =3, т. е. М(2, 3) —точка перегиба. Так как f" (х) <0 при х<2 и f"(x)>0 при х> 2, то график функции является выпуклым вверх в интервале ( —оо,2) и выпуклым вниз в интервале (2, +оо) 15.5. Асимптоты Асимптотой линии называется прямая, к которой неограниченно при- ближается данная линия, когда ее точка неограниченно удаляется от начала координат. По виду уравнений относительно выбранной декартовой системы координат различают асимптоты вертикальные (параллельные оси Оу) и наклонные (пересе- кающие ось Оу). Прямая х = а называется вертикальной асимптотой графика функции y = f(x), если хотя бы одно из предельных значений lim f(x), lim f(x) x-^a — Q x-~a+0 является бесконечным. Например, прямая х—-2 является вертикальной асимптотой графика функции г/ = 8/(х —2), так как lim 8/(х —2) = х—2-0 = —оо, lim 8/(х — 2) = + оо. х-2 + 0 Предположим, что функция y = f(x) опре- делена при сколь угодно больших (по модулю) значениях аргумента; для определенности будем рассматривать положительные значения аргу- мента. Прямая y = kx+b (15.6) называется наклонной асимптотой графика функции у — f(х), если эта функция предста- вима в виде f(x)=kx+b + a(x), (15.7) где lim <х(х)=0. X-*- + ОО 202
График функции y = f(x) имеет при х-»--|-оо наклонную асимптоту (15.6) тогда и только тогда, когда существуют два конечных предела: lim ~k, lim (f(x) — kx)=b. (15.8) X x—*-f-oo Пример 15.11. Найти асимптоты графика функции f(x) = . Прямая х=1 является вертикальной асимптотой (рис. 15.8), так как -I- х* 2 lim f(x) = оо. Поскольку f (х) = ——— =х4-2Н----------и lim 2/ (х — 1) = 0, то х-l X— 1 X— 1 график функции имеет и наклонную асимптоту у—x-j-2. 15.6. Исследование функций и построение их графиков Под исследованием функций понимают изучение их изменения в зави- симости от изменения аргумента. На основании исследования функции строят ее график, предварительно изображая характерные точки. Исследование функций и построение их графиков можно проводить по сле- дующей схеме. 1. Найти область определения функции, ее точки разрыва. 2. Изучить изменение функции при стремлении аргумента к концам про- межутков области определения. 3. Найти точки экстремумов, промежутки возрастания и убывания функции. 4. Вычислить значения экстремумов, построить соответствующие точки. 5. Определить промежутки выпуклости и вогнутости графика, найти точки перегиба. 6. Найти точки пересечения графика с координатными осями. 7. Найти асимптоты графика функции. Порядок исследования иногда целесообразно выбирать исходя из конкретных особенностей данной функции. Если рассматриваемая функция четная или нечетная, то ее достаточно исследовать при положительных значениях аргумента из области ее определения и принять во внимание, что график четной функции симметричен относительно оси ординат, а график нечетной — относительно начала координат. Отметим также, что графики взаимно обратных функций симметричны отно- сительно прямой, на которой лежит биссектриса первого координатного угла. х* -|- 1 Пример 15.12. Исследовать функцию f(x)——т-— и построить ее гра- фик. Х~1 1. Функция не определена лишь при х= —1 и х=1. Следовательно, область определения состоит из трех интервалов: (—оо,—1), (—1,1), (1,-(-оо), два из которых являются бесконечными. 2. При стремлении аргумента к концам промежутков области определения соответственно получаем lim lim lim lim — — оо, lim lim 3. Находим производные данной функции: f' (х) = ~~4х f" (х) = 4(3* + 1) (х2— 1)2 ' 1 { ’ (х2-1)3 203
Поскольку f'(x)> 0 при x<Z — 1 и —1<х<0, то функция возрастает в интервалах (— оо, — 1) и ( — 1,0). Так как f'(x) <0 при 0<х< 1 и х> 1, то функция убывает в интервалах (0, 1) и (1, 4-оо). Поскольку f'(x)=O при хо = О и f"(xo) =f"(0) <0, то Хо = О —точка мак- симума. Других критических точек нет, ибо f'(x) не определена только при х=— 1 и х = 1, но в этих точках не определена и сама функция. 4. Вычисляем значение максимума функции max f (х) =f (0) = — 1. 5. Поскольку f"(x)> 0 при х< — 1 их>1, то график функции является выпуклым вниз в интервалах (—оо,—1) и (1, + оо). Так как f" (х) <0 при — 1<х<1, то график функции является выпуклым вверх в интервале (— 1, 1). Точек перегиба график данной функции не имеет, ибо вторая производная в нуль ни- где не обращается и не определена в тех же точках, в которых не определена и сама функция. 6. График функции не пересекает ось Ох, так как уравнение (х2+1)/(х2—1) =0 не имеет действительных корней. Если х = 0 (уравнение оси Оу), то у= — 1, в точке В(0, —1) график пересекает ось Оу. 7. Из п. 2 следует, что график функции име- ет две вертикальные асимптоты х=—1 и х=1 у=\. Последнее вытекает также из того, что и горизонтальную асимптоту х2+1 . . 2 Заметив еще, что f(x)>0 при х< —1 и х> 1, f(x)<0 при — 1<х<1, строим график функции (рис. 15.9). 15.7. Задачи на наибольшие и наименьшие значения Наибольшим значением (абсолютным максимумом) функции y—f(x) на отрезке [а, 6] называют такое ее значение, которое больше всех других значений, принимаемых функцией на данном отрезке. Чтобы найти наибольшее значение функции на отрезке, необходимо вычислить значения максимумов на этом отрезке, значения функции на концах отрезка, а также во всех точках отрезка, в которых производная не определена; из полученных чисел выбрать самое большое. Аналогично определяется и разыскивается наименьшее значение функции (абсолютный минимум). В математике, физике, химии, технических и других науках, а также в повсед- невной жизни часто встречаются задачи на отыскание наибольших и наимень- ших значений некоторых функций. Общая схема решения таких задач состоит в следующем. Сначала устанав- ливается зависимость рассматриваемой величины у от некоторой независимой переменной величины х (обозначения, разумеется, могут быть другими). Из усло- вия задачи определяется промежуток, в котором может изменяться аргумент функции. Функция y = f(x) исследуется с помощью теории, рассмотренной в предыдущих главах. Пример 15.13. Найти наименьшее значение суммы двух положительных чисел, произведение которых постоянно и равно а. Обозначим искомые числа через х и у. По условию ху — а, где а> 0, поэтому у=а/х. Сумма этих чисел s = x + i/, s(x)=x4-a/x является функцией перемен- ной х; в соответствии с условием х> 0. Находим производные функции s(x): s'(x) = 1 — a/x2, s"(x) =2a/x3. Приравнивая нулю первую производную, получаем уравнение 1—а/х2 = 0, 204
из которого находим критические точки х, = — -у/a, х2=у/а; первое значение не принадлежит области изменения аргумента данной функции. Поскольку s"(y/a)>0, то х = у[а — точка минимума, причем min s(x) = = s(y/a) = 2 у/a. Пример 15.14. Найти наибольшее и наименьшее значения функции f(x) =х3— 12х + 7 на отрезке [0,3]. Найдем сначала экстремумы данной функции: f'(x) = 3х2 —12, /"(х)=6х, /'(х)=0, Зх2—12 = 0, Х| = —2, Х2 = 2. Точка Х|=—2 не принадлежит данному отрезку. Так как /"(2)> 0, то х = 2—точка минимума, при- чем min /(х) —f (2) = —9. Находим значения функции на концах отрезка: /(0) =7, /(3) = —2. Сравнивая эти три числа, заключаем, что на- ибольшее значение данной функции на задан- ном отрезке равно 7, а наименьшее —9. Пример 15.15. Прямоугольник вписан в эллипс с осями 2a и 2Ь. Каковы должны быть стороны прямоугольника, чтобы его пло- щадь была наибольшей? Рассмотрим прямоугольник ABCD, вписанный в данный эллипс (рис. 15.10), с основанием 2a и высотой 2v. Площадь прямоугольника определяется формулой s=2u-2v = 4uv, где v = (b/a) у] а2— и2 (получено из уравнения эллипса). Сле- довательно, х = (46/а) и -у/а2 — и?— функция переменной и. Так как s' = = (46/a) (a2 —2u2)/у/a2 —u2, то s' = 0 при u = a/y/2. Поскольку s'> 0 при u<a/y/2 и s'<0 при u>a/y/2, то u = a/y/2 — точка максимума функции s=s(u). Если и = а/у/2, то v = (Ь/а) у/a2 —и2 = 6/у/2. Следовательно, площадь прямоугольника будет наибольшей, когда его стороны равны 2а/у/2, 26/у/2 (тогда площадь равна 2аЬ). 15.8. Дифференциал длины дуги кривой Пусть на отрезке [а, Ь] задана дифференцируемая функция y = f(x), графиком которой является дуга АВ (рис. 15.11). Отрезок [а, 6] разобьем на п частей точками Х|, х2,... , х„_|. Этим точкам будут соответствовать точки Mi, Л42, ... , М„-1 дуги АВ. Соединим их отрезками прямых. Ломаную AM 1М2 ...М„-iB называют вписанной в дугу АВ. Периметр этой ломаной обозначим через 1п, т. е. /„= £ \Mk-iMA (Мо = А, М„ = В). k= 1 205
Длиной дуги называется предел периметра вписанной в нее ломаной, когда число звеньев Mk~ 1Л4* неограниченно возрастает, а длина наибольшего из них стремится к нулю: п 1= lim У |Af*_uW*|, ’-° *=1 где % — длина наибольшего звена. Будем отсчитывать длину дуги от некоторой ее точки, например от точки Д; пусть в точке М(х, у) длина дуги AM равна /, а в точке М' (х-|-Дх, уА-Ау) длина дуги AM' равна /Д-Д/, где Д/ — длина дуги ММ' (рис. 15.12). Очевидно, / = /(х), бесконечно малая дуга линии и стягивающая ее хорда эквивалентны: AM' lim ----- м-^.м I ММ' | Дифференциал длины дуги выражается формулой , .. Д/ = 1, ,1т —,-„ = 1 • Лл*° 7Д*+Ду плоской кривой, заданной уравнением у = [(х), dl=^dx2A-dy2 Эта формула имеет простой геометрический смысл: она выражает теорему Пифа- гора для бесконечно малого треугольника MTN (рис. 15.12, dl = MT, Al —ММ'). Дифференциал дуги пространственной кривой выражается формулой dl= -^dx2 А~ dy‘ A- dz1. 15.9. Кривизна плоской кривой Рассмотрим плоскую линию, определяемую уравнением y — f(x). Проведем касательную к этой линии в ее точке Мо(хо, уо); обозначим через а угол, образованный касательной с осью Ох (рис. 15.13). Пусть касательная в точке М образует с осью Ох угол а-|-Да. Угол Да между касательными в указанных точках называют углом смеж- ности. Можно сказать, что при переходе из точки Мо в точку М данной линии касательная к ней повернулась на угол Да, которому будем приписывать соответствующий знак в зависимости от направления поворота. Средней кривизной дуги МоМ данной линии называется абсолютное значение отношения угла смежности Да к длине Д/ дуги МоМ: feci,_|4r|’ Кривизной линии в данной точке Мо назы- вается предел средней кривизны дуги МоМ при М -> Мо: k = lim |~~L k= lim |^-| . (15.9) Отметин, что для прямой k = 0, а для окружности радиуса R кривизна k=l/R. Кривизна линии, заданной уравнением у = =f(x), в точке Мо(хо, Уо) вычисляется по формулам ь_________.................. ь \У"А (1 + (У'(хо))2)3/2 ’ (1+^)3/2 ' (15.10) 206
Если линия задана параметрическими уравнениями x = x(t), y = y(t), то с учетом (14.20) и (14.22) формула (15.10) принимает вид = \Х'У"~Х"У'\ (151i) (х'2 + </')3/2 Кривизна линии, заданной уравнением р = р(<р) в полярных координатах, вычисляется по формуле Пример 15.16. Найти кривизну косинусоиды y = cos х в точке Мо(О, 1). Поскольку у'——sin х, у" =—cos х, кривизна косинусоиды в ее произволь- ной точке определяется формулой , _ I — cos х| (1 4-sin2x)3/2 При х=0 получаем k= 1 /(1 +0)3/2 = 1. 15.10. Окружность кривизны. Центр и радиус кривизны. Эволюта и эвольвента Радиусом кривизны данной линии в данной ее точке называется величина R, обратная кривизне k этой линии в рассматриваемой точке: п 1. „ (1+<4)3/2 R~^' R~ (15.13) На нормали к кривой в точке Л4 отложим отрезок MC = R в сторону вогнутости кривой (рис. 15.14). Точка С называется центром кривизны данной линии в точке Л1. Окружность радиуса R с центром в точке С называется окружностью кривизны этой линии в точке Л1. Очевидно, в данной точке М кривизна кривой и кривизна окружности равны между собой. Координаты центра кривизны определяются формулами Х = х- Y = y + _<L±£±. (15.14) у" У" Если кривая задана параметрическими уравнениями х = х(1), y = y(t), то формулы (15.14) с учетом равенств (14.20) и (14.22) примут вид Х==х_ у= Х'(Х'2 + У'1. (15.15) х'у" — х"у' х'у" — х"у' Множество всех центров кривизны данной линии называется ее эволютой. По отношению к своей эволюте исходная линия называется эвольвентой (или разверткой). Если линия задана уравнением y = f(x), то уравнения (15.14) можно рассматривать как параметрические уравнения ее эволюты (с па- раметром х). В случае параметрического задания кривой уравнения (15.15) являются параметрическими уравнениями эволюты (входящие в правые ча- сти этих уравнений величины зависят от па- раметра t). 207
15.11. Переменная векторная величина. Вектор-функция скалярного аргумента Рассмотрим точку М(х, у, г), движущуюся по некоторой линии у в про- странстве (рис. 15.15). Радиус-вектор г = ОМ точки М будет иметь определенное направление и длину в фиксированный момент времени t. С течением времени направление и длина вектора ОМ будут изменяться. Таким образом, здесь имеем дело с перемен- zl ным вектором ОМ или с переменной векторной величиной \ г = г(/), (15.16) \чМ зависящей от времени t. Равенство (15.16) назы- Р „ вается векторным уравнением движения точки М. / ' Координаты переменного вектора ОМ = г(/) = q/ = {x(t), y(t), z(t)) являются также переменными величинами (скалярными), зависящими от вре- ' мени t. x=x(t), y = y(t), z=z(t). (15.17) Рис. 15.15 Уравнения (15.17) являются параметрическими уравнениями рассматриваемой линии у. Переменная векторная величина и называется вектор-функцией (или вектор- ной функцией) скалярного аргумента /, если каждому значению где Т — некоторое множество действительных чисел, соответствует определенный вектор и(/о); в этом случае пишут u = u(Z). Если u = u(Z), то и проекции их, uv, иг переменного вектора и на оси декар- товой системы координат будут (скалярными) функциями аргумента /: их = их(1), u^u^t), u2 = u2(t). Пример вектор-функции скалярного аргумента дает рассмотренный выше случай радиуса-вектора г = г(/) точки, движущейся по некоторой линии в про- странстве. Годографом переменной векторной величины называется геометрическое место концов векторов всех ее отдельных значений при условии, что они отложены из одной точки. Годографом постоянного вектора является точка (конец вектора). Годограф вектор-функции u = u(Z) представляет собой неко- торую линию. Если вектор сохраняет постоянную длину, то его годограф — линия, лежащая на сфере. Годографом радиуса-вектора г = ОМ движущейся точки М является траектория этой точки. Пусть а — некоторый вектор (постоянный) и г = г(/) — вектор-функция, определенная в некоторой окрестности точки /о, кроме, быть может, самой точки to. Вектор а называется пределом вектор-функции г = г(1) при t-f-to, если для любого е> 0 существует такое 6 = 6(е)>0, что |г(/)—а| <е для всех Z, удов- летворяющих неравенству |/—/о! <6, (рис. 15.16). вектор-функции: limr(/)=a,' (15.18) г(/)->-а при Очевидно, равенство (15.18) эквивалентно равенству lim |г(/)—а| =0. (15.19) Если г (/) = {*(/), y(t), z (Z) | и а— (а,, а,, аз), то ра- венство (15.18) выполняется тогда и только тогда, когда lim х(/) =Oi, limy(/)=a2, Iim2(/)=a3. I—/„ 1^1 Если вектор-функции гД/) и г2(Д определены в некоторой окрестности точки to и существуют пределы lim гД/)=а, lim г2(/)=Ь, I -► /л I *!., 208
lim г, (Z) lim r2(Z) = a - b, [ lim r, (Z), lim Г2(Z) ] = [a, b), t —► 11) /—>/11 /—»/,I скалярная функция f(t) имеет предел при Z-»-Zo, то существуют также пределы lim (г, (Z) 4-г2(/) ) =а + Ь, /-♦/в lim (f(i)i-i(t)) = lim f(t) lim г 1 (/), lim г, (Z)r2(Z) = a-b, t */., lim [1-1 (Z), r2(Z)] = [a, b]. Вектор-функция r = r(Z), определенная в точке t0 и некоторой ее окрест- ности, называется непрерывной в этой точке, если lim r(Z) =r(Zo). Из эквивалентности условий (15.18) и (15.19) следует, что вектор-функция r(Z) = (х(/),</(/), г(/)) непрерывна в точке /о тогда и только тогда, когда непре- рывны в ней функции x(Z), </(/), z(Z). 15.12. Дифференцирование вектор-функций Предел отношения приращения вектор-функции к приращению аргу- мента, когда последнее стремится к нулю, называется производной вектор-функции u = u (ц) в точке v: ,, , d.u и(и + Ац) — u(v) и (ц) =--- = lim —5—I------—— . dv u--o ' Ап Необходимым и достаточным условием существования производной вектор- функции u(u) = {x(d), y(v). г(и)) (15.20) в некоторой точке является дифференцируемость функций х(е), </(п), г(и) в этой точке; причем в данном случае и'(ц) = {х'(к), y'(v), z'(v)). Правила дифференцирования вектор-функции аналогичны правилам обыч- ного дифференциального исчисления. Если u, = u, (ц), u2 = u2(n) —дифференци- руемые вектор-функции скалярного аргумента v, с —постоянный вектор, f(v) — дифференцируемая скалярная функция, k — постоянная скалярная величина, w — скалярный аргумент, связанный с v формулой ш = и>(ц), где ш(п) — дифференцируемая функция, то эти правила дифференцирования выражаются следующими формулами: . de d(u,±u2) __ du, du2 dv ’ dv dv dv d(/u,) df du, 3) d(ku}) du, 3a) —-z------= k —— , 36) dv dv d(fc) df dv dv d(u,u2) _ du2 dv Ul dv c. d[ub u2] 5) "dv - du, dv 4a) dv Ju 1 dv 6) rfU1 _ dU| dv dw dw dv 209
ли Мо Ц.(У<-ЛУ) u W о Рис. 15.17 Геометрический смысл производной и'(о) #=0: производная вектрр-функции в данной точке есть вектор, направленный по касательной к годографу данной вектор-функции в соответствующей точке (рис. 15.17). Отметим, что при другом значении v получим новое значение и((о), т. е. про- ,, изводная вектор-функции также Является век- 4 4 тор-функцией. Вектор-функция, имеющая про- / Р изводную, называется дифференцируемой. / Дифференциалом вектор-функции u = u(u) / Мs' Mi/av называется произведение ее производной на диф- ференциал аргумента du. = и' (t>) dv, где dv = &v; отсюда и' — du/dv. Пусть r=r(/),r = x(/)i + i/(/)j + z(/)k — векторное уравнение движения точки М в про- странстве. Приращению Д/ времени t соответ- ствует приращение Дг = Л4оЛ4 вектор-функции г = г(/). Отношение Дг/Д1 называется вектором средней скорости, этот вектор направлен по прямой МоМ. Предел указанного отношения при Д/—>0 называется вектором скорости в мо- мент to (или вектором мгновенной скорости), обозначим его через v, т. е. v = r' (0-4г- (15.21) dt мгновенной скорости (или вектор скорости) движу- щейся точки направлен по касательной к ее траектории. Вектор г'(1) характери- зует направление и быстроту движения точки. Если для вектор-функции г = г (7) в качестве параметра t выбрать длину дуги s, отсчитываемой от некоторой точки Мо, то производная вектор-функции будет равна единичному вектору, направленному по касательной. Обозначив этот вектор через т, получим 4^=?, Й = 1. (15.22) ds Второй производной вектор-функции и = и(ц) называется производная от ее производной u'(v): u"(y) = (u'(ti))'. Для функции (15.20) имеем u"(v) = {x"(v),y"(v),z"(v)], если существуют вторые производные функций л(о), y(v), z(v). Аналогично определяются производные более высокого порядка для вектор- функции u = u(o). 15.13. Уравнения касательной к пространственной линии. Кривизна пространственной линии Рассмотрим пространственную линию у (рис. 15.18), заданную векторно- параметрическим уравнением r = r(/), г(/) =x(/)i + i/(/)j + z(/)k (15.23) или параметрическими уравнениями x=x(t), y=y(t), z = z(t}, (15.24) где х(0, y(t), z(t)—дифференцируемые функции переменной t. Зафиксируем 210
значение /о параметра t, ему соответствует точка Л4о(хо, уо, z0), где xo = x(to), yo—y(to)\zo=z(to). Уравнения касательной к пространственной линии (15.24) в точке Л4о(хо, уо, zo) имеют вид X — Хо у—Уо Z- x'(to) у'W z'( Нормальной плоскостью к пространственной называется плоскость, проходящая через точку М и перпендикулярная касательной к данной кривой в той же точке. Нормальная плоскость к линии (15.24) в точке Mo(xo,yo,zo) имеет уравнение х' (to) (х — хо) 4-у' (to) (у—уо) + + z'(to)(z-zo)=0. (15.26) Если s длина дуги, то единичный вектор касательной т к линии у определяется форму- лой (15.22). Придав аргументу t приращение Л/, получим точку М линии у и соответствующий вектор касательной т-(-Лт. Степень изогнутости кривой можно характеризовать скоростью поворота вектора т. Кривизной k линии у в точке Л4о называется модуль производной вектор- функции т = т(з) в данной точке, т. е. k= |-£-|. (15.27) I “s I Это определение равносильно определению кривизны плоской кривой. Кривизна линии, заданной уравнениями (15.24), выражается формулой Кривизну линии можно выразить в координатах. Поскольку г(/) = = (х(t),y(t), z(t)}, r'(t) = (x'(t),y'(t),z'(t)}, r"(t)={x"(t),y"(t),z"(t)}, то Отметим, что формула (15.11) является частным случаем формулы (15.30). Пример 15.17. Записать уравнения касательной, уравнение нормальной плоскости и вычислить кривизну линии r(/) = 2sin2/i-(-2cos2/j + sin2/l< в точке, для которой /о = л/4. Перейдем к параметрическим уравнениям данной линии x = 2sin2/, </ = 2cos2/, z = sin2/. (I) Найдем координаты точки Мо(хо, уо, z0): xo = x(h,) =2sin2 (л/4) =2(^2/2)2= 1, yo = y(to) = 2cos2 (л/4) =1, zo — z(to) — sin2(л/4) = 1; M,(l, 1, 1). Найдем производные функций (I) и их значения при /0 = л/4: х’ = 2-2sin t cos/ = 2sin2/, у' =—2sin2/, z' = 2cos2Z; (II) x' (to) =2sin2(n/4)=2,y' (to)= — 2sin2(n/4) = —2, z' (to) =0. 211
В соответствии с равенствами (15.25) получаем уравнения касательной к дан- ной линии (х—1)/2= (у—1)/( —2) = (г—1)/0, или (х—1)/2= (</—1)/( —2), г-1=0. Подставляя соответствующие значения в формулу (15.26), находим урав- нение нормальной плоскости: 1 (х—1) — 1 (у—1) + 0(z—1)=0, или х — </ = 0. Для вычисления кривизны линии в точке Mo (1, 1,1) нужны значения вторых производных функций (I) при /о = л/4. Так как x" = 4cos2/, у" = —4cos2Z, z"=—4sin2/, х"(/о)=О, у" =0, z"(t0)=4, то по формуле (15.30) находим _ V(( —2) (-4) -0-0)2+ (2(-4)-0-0)2+(2-0-'0(-2))5 у/128~ _ 1 — (22+ (-2)Ч 02)3/2 ~ 83/2 ~ 2 '
Глава 16 НЕОПРЕДЕЛЕННЫЙ ИНТЕГРАЛ 16.1. Неопределенный интеграл и его свойства. Таблица основных неопределенных интегралов Функция F(x), определенная в промежутке (а, &), называется перво- образной данной функции f(x) в этом промежутке, если для любого значения хе(а,/>) выполняется равенство F'(x)=f(x). (16.1) Например, функция F(x)=x5— первообразная функции f(x) = 5х4 в проме- жутке (—оо,4-оо), поскольку (х5)' = 5х4 для всех х; функция Е(х)=1пх— первообразная функции f(x)=l/x в промежутке (0, +°o), так как (In х)' = = 1/х; функция F(x) =arccos х — первообразная функции f(x) = — 1/V1 —х в интервале ( — 1, 1), ибо (arccos х)'= — 1/у/1 ~х2. Если F(x) —первообразная функции f(x), то Ф(х)=Е(х)-|-С, *(16.2) где С — произвольная постоянная, также является ее первообразной. Выражение (16.2), в котором функция F(x) удовлетворяет условию (16.1), определяет множество всех первообразных данной функции f(x) в заданном промежутке (а, Ь). Неопределенным интегралом от данной функции f(x) называется множе- ство всех ее первообразных: $ f(x)dx=F(x)+C, (16.3) где F'(x)=f(x). Знак J называется знаком неопределенного интеграла, функция f(x) —подынтегральной функцией, выражение f(x)dx— подынтегральным вы- ражением. Операция нахождения первообразной данной функции называется интег- рированием. Неопределенный интеграл обладает следующими основными свойствами. 1. Производная неопределенного интеграла равна подынтегральной функ- ции; дифференциал неопределенного интеграла равен подынтегральному выражению: (5 f(x)dx) ’=f(x), (16.4) d\f (x)dx=f(x)dx. (16.5) 2. Неопределенный интеграл от дифференциала некоторой функции равен сумме этой функции и произвольной постоянной: $ dtp(x) = <р(х) +С. (16.6) 3. Постоянный множитель можно выносить за знак неопределенного интеграла: 5 kf(x)dx=k\f(x)dx (£=const, А#=0). (16.7) 4. Если функции fi (х) и fi(x) имеют первообразные, то функция fi (х) +Мх) также имеет первообразную, причем 213
S (fi(x) +f2(x))dx= \ fr (x)dx+ $ f2(x)dx. (16.8) Таблицу простейших неопределенных интегралов нетрудно получить, вос- пользовавшись тем, что интегрирование является операцией, обратной дифферен- цированию. Будем исходить из формулы (16.6), которую запишем следующим образом: если dF(x) =f (x)dx, то J f (x)dx — F(x) + C. Например, поскольку d(sin x) — cos xdx, to J cos xdx = sin x + C. Применяя аналогичное рассуждение к каждой из формул основных диф- ференциалов (см. п. 14.4), получаем следующие простейшие неопределенные интегралы: 1. \ 1-dx=\dx — x + C, 3. dx = \ — = ln|xl+C, J X J X 4- ^aXdx= 1K7+C (a>0)’ 5. J exdx = e* C, 6. S cos xdx—sin x + C, 7. $ sin xdx= —cos x + C, 8. dx cos2x = tgx + C, 9. dx sin2x = —ctgx + C, dx - =arcsin x-\-C= — arccos * + Ci, -y 1 —* dx T—— =arctgx+C=— arcctgx + Ci, 12. $ sh xdx=ch x + C, 13. S ch x = sh x + C, 14. 5—§-=thx + C, ctrx . $—=-cthx + C. slrx Отметим, что все указанные формулы справедливы в тех промежутках, в которых определены соответствующие функции. Например, формула 3 спра- ведлива для любого промежутка, не содержащего точку х = 0; формула 10 — для интервала (—1, 1) и т. п. Замечание. В таблице основных интегралов вместо х везде можно записать и = и(х), где и(х) —любая дифференцируемая функция независимой переменной х: $ du = u + C, j =1п| и\ +С и т. д. При использовании формул этой таблицы для преобразования подынтег- рального выражения к виду f(x)dx=g(u)du применяются простейшие преоб- разования дифференциалов: 1) dx = d(x+b), где 6=const, 2) dx= — d(ax), 214
а#=0, 3) dx—(l/a)d(ax + b), а=/=0, 4) xdx= (l/2)d(x2 + d), 5) sinxdx = = d(— cosx), 6) cos xdx = d(sin x), 7) q>' (x)dx = d<p(x). Например, f . _ . f . , 1 . 1 f . - ,,c , cos 5x \ sin5xdx=\ sin5x-=-a(5x) = —=-\ sin5xa(5x) =-=--|-c-, J J । D О J О ( xdx f 2 1 f d(x2+l) 1 । / 2,|\ I (j -------V5 x2+l - 2 ln^+»+C- К наиболее важным методам интегрирования относятся следующие: 1) не- посредственное интегрирование; 2) метод замены переменной; 3) метод интегри- рования по частям. 16.2. Непосредственное интегрирование Непосредственное интегрирование основано на свойстве 4 неопреде- ленного интеграла. Если функции fi(x), /г(х).fn(x) имеют первообразные в некотором промежутке, то функция f (х) = f> (х) +1г(х) +|з(х) + ... + МХ) также имеет первообразную в том же промежутке, причем $ (fl (х) +fi(x) + ...+f„(x))dx= \ ft(x)dx+ S f2(x)dx+.„+ j f„(x)dx, (16.9) т. e. неопределенный интеграл от алгебраической суммы конечного числа функ- ций равен такой же алгебраической сумме неопределенных интегралов от сла- гаемых, . Пример 16.1. Найти неопределенный интеграл ) (х3 — 6х2 + 4х— 5)dx. Пользуясь свойствами неопределенного интеграла, формулой (16.9) и первыми двумя формулами простейших неопределенных интегралов, находим J (х3 — 6х2+4х — 5)dx= $ x3dx-»$ 6x2dx+ $ 4xdx— $ 5dx = = J x3dx — 6$ x2dx + 4^ xdx — 5$ dx= -6^—|-4-^----5xH~C = 4 о 2 X4 = -----2x3 + 2x2-5x + C. Замечание. Постоянное слагаемое не записано при нахождении каждого интеграла алгебраической суммы, а лишь один раз, так как сумма произвольных постоянных величин есть величина постоянная. Пример 16.2. Найти интеграл $ 1 dx. Преобразуя подынтегральную функцию и пользуясь первыми тремя форму- лами неопределенных интегралов, получаем s(i+4-)’‘"-s(i+4+v+-?-)‘"-S‘"+3Sjf+ +з) -$+s -S л+з) 4г +з1 s XX л х—2+1 г-2 3 1 =х + 31n | х | 3 — l -— -|- С = х + 31n | х |-— ——g—|-С. — х +1 — 2 х 2х Пример 16.3. Найти неопределенный интеграл J !—|- —---dx. 215
С помощью формул 2 и 3 простейших интегралов = —2) получаем , 1 (при а=------- и а = + ----l/2 — х 2) dx = ln|x|+2V*+—+с. \ х ух х / \ х / х Пример 16.4. Найти интеграл tg2xdx. Преобразуя подынтегральную функцию и пользуясь формулами интегралов 1 и 8, находим f , 2 . f sin2x . f 1—cos2x , f \ tg xdx = \---- dx = \--------dx - \ cos2x cos x J dx cos2x — J dx = tgx—x+C. Пример 16.5. Найти интеграл —cos2xdx— cos x sin2 x Преобразуя подынтегральную функцию и пользуясь формулами 9, 8, получаем [ cos2xdx f (cos2x—sin2x)dx f dx f dx k x „ J-----2---— = J-------5 -------= J ~r-5----J------Г" = — ctg x — tg x + C. cos xsin2x cos2x sin2x 2 sm2x 2 COS2X Пример 16.6. Найти интеграл $ cos2(x/2)dx. Поскольку cos2(x/2) = (1/2) (1 4-cosx), то j cos2(x/2)dx= (1 -j-cos x)dx = 1 f . , 1 r J 1 1 = dx-j——J cos xdx— ~2~x-|—g- sin x-|-C. г x2dx Пример 16.7. Найти интеграл ) —j—p- x 1 Преобразуя подынтегральную функцию, с помощью формул 1 и 11 простей- ших интегралов, находим x2dx х2+1 f (х +1) — 1 , ( , [ dx , '. „ \ -Т 1--------dx=^ dx-} =х — arctgx + C. 2 X -f-1 X + 1 16.3. Метод подстановки Интегрирование путем введения новой переменной (метод подстановки) основано на формуле ) f(x)dx= J f(<p(/) )<f'(t)dt, (16.10) где x = ip(/) —дифференцируемая функция переменной I. „ f x3dx Пример 16.8. Наити интеграл \,__________. 1/1— х8 Введем новую переменную t по формуле х4 = /, откуда 4x3dx = dl, x3dx = = _2— rfz, Xs = (х2)2=/2. Переходя к новой переменной и используя формулу 10 простейших интегра- лов, получаем x3dx 1/1 _1_ 4 —- - = —— arcsin 1 + С. 1/1^ 4 216
Возвращаясь к переменной х, находим f x3dx 1 4 , п \ —— = —— arcsin х +С. J V)—? 4 Замечание. Результат можно проверить дифференцированием. Так как 7 1 . Д ' 1 1 , 4х3 х3 —г- arcsin х' I = —---— —- (х ) =-------, а- = , —, \ 4 /4 ^/1 _ (ЛЛ)2 4 х8 то на основании формулы (16.4) заключаем, что пример решен верно. Пример 16.9. Найти интеграл . д/“ —X2 В случае, когда подынтегральное выражение содержит у/а2— х7, целесообразно применить тригонометрическую подстановку х=а sin t или х=а cos t. Положим х = а sin t, тогда dx = a cos tdt, поэтому r x3dx _с a3 sin3 i-a cos tdt _r a3 sin3 t-a cos tdt _ -yja^ — x2 у/a2 —a2 sin21 a cos * = a3 J sin3 tdt = a‘ J sin21 sin tdt= — a3 J (1 — cos2 /)d(cos t) = г i = a3 $ (cos2t — l)d(cos /) =---г------a3 cos Г + С. О Заметив, -что sin t = x/a, cos t= t/1 — sin2 t = -^l—x2/a2 = ~yl(a2— x2)/a , получим Пример 16.10. Найти интеграл \-----------. л/^+a Применим так называемую подстановку Эйлера д/х2 a = / — х, где t — новая переменная. Переписав это равенство в виде t = x-\- \/х2 + а и взяв диффе- ренциалы от его обеих частей, получим dx _ dt V*2 + “ 1 откуда J —~— = J =ln|/| +C = ln|x+ д/F+al +c. -yx + a. ‘ Итак, $—, =ln|x+ y/x^+al +C. (16.11) \x2 + a 16.4. Метод интегрирования по частям Если u = «(x), v = v(x) — дифференцируемые функции от х, то из фор- мулы для дифференциала произведения двух функций d(uv) =udv + vdu полу- чается формула интегрирования по частям j udv = uv— j vdu. (16.12) 217
Эта формула применяется в случае, когда подынтегральная функция пред- ставляет собой произведение алгебраической и трансцендентной функций. В качестве и обычно выбирается функция, которая упрощается дифференциро- ванием, в качестве dv — оставшаяся часть подынтегрального выражения, содер- жащая dx, из которой можно определить v путем интегрирования. В некоторых случаях для сведения данного интеграла к одной из формул простейших интегралов формула (16.12) применяется несколько раз. Иногда искомый интеграл определяется из алгебраического уравнения, получающегося с помощью интегрирования по частям. Пример 16.11. Найти интеграл jx-3xdx. Полагаем х — и, ydx—dv, откуда dx = du, ц = Зх/1п 3 (по формуле 4 про- стейших интегралов). Подставляя эти выражения в формулу (16.12), получаем г 3х t У . хУ У \х-3dx = x------\-------dx=---------------- +С. 3 1пЗ 3 In 3 In 3 (1пЗ)2 Замечание. Результат можно проверить дифференцированием: / х-Зх 3х +CV_ 3х , х-Зх(1п 3) 3х In 3 _ \ In 3 (1пЗ)2 ' / -1пЗ+ (In 3) (1пЗ)2 *' Пример 16.12. Найти интеграл J arctg xdx. Полагая u = arctg х, dv = dx, находим du = dx/ (1 +х2), v = x. По формуле (16.12) получаем [ . , . ( xdx 1 г d(x2+l) J arctg xdx = x arctg x- } ——5- =x arctg x- — \-------j—— 1 I л & Л [ 1 — x arctg х--|-ln(x2 + 1) +С. Пример 16.13. Найти интеграл $х2 sin xdx. Полагая и = х2, dn = sin xdx = d( — cos х), получаем du = 2xdx, v—— cosx. Следовательно, J x2 sin xdx=x2( —cos x) — J (— cos x)2xdx= —x2 cos x+2 J x cos xdx. (I) Полученный интеграл снова находится интегрированием по частям. Его можно найти и не вводя явно функции и и v: \х cos xdx= Jxd(sin x)=xsinx— J sin xdx = x sin x+cos x + Ci. Подставляя это выражение для интеграла в формулу (I), находим J х2 sin xdx= —х2 cos x + 2 J х cos xdx= — x2 cos x + 2(x sin x+cos x+Ci) = = —x2 cos x +2(x sin x + cos x) +C (C = 2Ci). Пример 16.14. Найти интеграл J (arccos x)2dx. Полагая u= (arccos x)2, dx = dv, получаем v = x, du = —2arccos xdx/ д/1 — x2. По формуле (16.12) имеем j (arccos x) 2dx = x(arccos x)2 + 2 $ x arccos xdx/ i/l —x2. Этот интеграл также находим методом интегрирования по частям: u = arccosx, dv = xdx/ д/1 —х2, du=—dx/ +1 —х2, v=—д/1 — х2 , x arccos x , к------------г -\/I— x6 — — dx= — -JI — x* arccos x— \ _ - dx— ------\/l — x2 arccos x—x+ Ci. 218
Следовательно, J (arccos x)2dx=x(arccos x)2—2 -\/l — arccos x—2x-|-C. Пример 16.15. Найти интеграл cos pxdx. Полагая u = eax, dv — cos flxdx, находим du=aeax, v= (1/p) sinpx; следо- вательно, 1 r 1 cos fixdx = eax —— sin f5x — \ —- sin px a.eaxdx, P J P (I) sin pxdx. t e" cos pxdx = eax sin px---- P P Интеграл в правой части равенства (I) также находим методом интегриро- вания по частям: sin pxdx — еах d (— cos 6х) =----е°-х cos fix + cos рх • ae^dx = J Р р J Р = еах cos рх-|—еах cos pxdx. (II) р р J Подставив выражение (II) в равенство (I), получим J еах cos Рх = еах sin рх-cos cos = = -i- sin рх-е" cos рх-—J еах cos pxdx. Перенося интеграл в левую часть, получаем уравнение е" cos pxdx=---еах sin рх+ —е" cos рх, Р ₽ из которого находим j елх cos pxdx= —т-!—^«“'(a cos Px+P sin px) -|-C. a +p Пример 16.16. Найти интеграл adx. Положим u = Vx2-)-a, dx = dv, отсюда —X^X =du, v = x. По формуле -\/x2 + a (16.12) получаем -\/x2+ a dx — x -^x2-|-a — x — X-X . -Jx2 + a Преобразуем интеграл в правой части $ --$1- = $ -^-2±^Ьа dx= $ (x2 + a) dx-a\ - -fX- + “ -\/x2-|-a y'x2-|-a -\/x2-|-a = j dx-a\ . Чх + a- Следовательно, 219
откуда 2 \ д/х2 + a dx = х д/х2 + а + а —* — , л/х2 + а dx = Л'х2 + а Так как последний интеграл определяется формулой (16.11), то j -у/х2 + а <7х = (х д/х2 + а + а In |х + д/х2 + а |) + С. (16.13) Пример 16.17. Найти интеграл J-^а2 — х2 dx. Применяя метод интегрирования по частям, получаем 2 dx Поскольку 2 2 а —х dx х „ = arcsin---, а то 'а2—х2 dx=х д/а2—х2 1а2—х2 dx-\-a2 arcsin , а откуда 'а2 — х2 dx = у/а2 —х2 arcsin С. (16.14) Замечание. Этот интеграл можно найти с помощью подстановки х = а sin t. 16.5. Интегрирование рациональных дробей с квадратным трехчленом в знаменателе Интеграл вида 11 = \ dx/(рх2qx +г) путем дополнения квадратного трехчлена до полного квадрата по формуле рх*+ qx-\-r = p( (х + &)2±а2) сводится к одному из двух интегралов: du 1 , и , „ ;=----------arctg------h С, +а2 а & а (16.15) где u=x + fe. Интеграл du 1,1 и — а и2-а2 ~ ~2а~ “й+а (16.16) тх-\-п —5---------dx px2 + gx + r (16.17) 220
сводится к интегралу (16.15) или (16.16) и интегралу f udu 1 , , , , „ ) —j-----=-x-lnl^ + al+C. (16.18 и +a 2 При нахождении неопределенного интеграла от рациональной функции с квадратным трехчленом в знаменателе, т. е. jP/vj__ ^«(*) ___ а„хп-f-an—ixn 1 + ...+агх2+ oix+ ао Р?(х) ах2 -j-bx-j-c сначала производят деление; в результате получают R(x) = Qm(x) + + (kx-\-Г) / (ах2-\-bx-\-c), где Qm(x)—многочлен, степень которого ниже сте- пени многочлена Р„(х). Первообразная от многочлена Qn(x) находится непосредственно, а от остатка (kx + l)/(ax2 + tx + c) —как интеграл вида (16.17). г (j X Пример 16.18. Найти интеграл ) —5------------. х | 4х 12 Дополняя квадратный трехчлен до полного квадрата и интегрируя на основании формулы (16.16) для случая, когда и=х-(-2, а=4, находим ( dx _ f dx f dx _ 3 x2 + 4x — 12 — J (x2 + 4x + 4)—4—12 (x + 2)2 — 16 — _г d(x + 2) _ _1_ I (x + 2)—4 I J (x + 2)2-42 2-4 I (x+2) +4 p -T'-ferp- r dx Пример 16.19. Найти интеграл \ —=--------. x —6x + 34 Выделяя полный квадрат и применяя формулу (16.15) для случая, когда и=х — 3, а = 5, находим f dx (• dx г dx _ ' x2-6x + 34 “J (x2-6x4-9) -9 + 34 ~J (x - 3)2 + 25 “ f d(x — 3) 1 i ( x —3\ . ( (x+8)dx Пример 16.20. Наити j —j—— - . K r J x2+4x+20 Преобразуя подынтегральное выражение, получаем f * + 8 dx- 1 t 2* + 16 <2x + 4)+-1j-rfx = J x2 + 4x + 20 2 J x2 + 4x + 20 2 J x2 + 4x + 20 If (2x + 4)dx , я( dx_____ 1 ( (x2 + 4x + 20)'dx | X2_|_4X_|_2O + 5 x2 + 4x + 20 2 J x2 + 4x + 20 +6$ тгйтст = 4-1п^+4х+20) +6- 4-arctg +c= = _l-ln(x2 + 4x + 20) + -|-arctg-^^- +C. 221
П U • ( x4 + 5x3 —3x2 + 7x + 3 Пример 16.21. Наити \;-------------------dx. x 4- 1 „ x44-5x3-3x24-7x4-3 2 , - . . 2x4-7 Так как --—----r——I---——= x2 + 5x —44----5-7-7-, to x24-1 x24-1 x4 -|“ 5x3 — 3x2 -j-7x-|-3 , x 5 2 t I 1 / 2 1 <, 1 •? 1 /-* ---—----5———— dx = 4- -5- x2 — 4x 4- In (x2 4- 1) 4- 7 arctg x 4- C. x2 4- 1 3 2 16.6. Интегрирование рациональных функций Рассмотрим неопределенные интегралы вида \R(x)dx, где /? (х)— правильная рациональная дробь, т. е. Р„(х) ao4-aix4-a2X24-...4-a„._1x',-'4-a„x'! i\ IX J ~~ ™ Л — ——I Г1 ГП I • Qm(x) bo-^-biX-^bsX 4" 4~bm~ lXm -f-bmX”1 Нахождение указанных интегралов основано на разложении рациональной дроби в сумму элементарных дробей, т. е. дробей вида А Вх + С (х-a)" ’ (x2+px+q)f где а, р — натуральные числа; а, р, q, А, В, С — действительные числа; р2/4 —д<0 (корни трехчлена являются комплексными). Это разложение определяется теоремой 8.5 (см. п. 8.7). г 7х2 Пример 16.22. Найти )---------5 dx.. Так как 7х2 —х4-1 х34-1 4х —2 X2 — х +1 (см. пример 8.18), то = 3 1п|х4-11 4-2 Inlx2—Х-l-11 4-С. Пример 16.23. Найти —Х. У— dx. J х3-Зх-|-2 Поскольку х2+х4-1 = 1 , 2 1 х3 —3x4-2 3(х4-2) "Г 3(х— 1) ’’’ (х-1)2 (см. пример 8.19), то х2 + *4-1 rfx= Jf d(x + 2) 2 г of (х— 1) г d(x— 1) х3 —3x4-2 3 2 x-l-2 "Г 3 2 x—1 ‘1’2 (x—I)2 1 2 1 = -2- ln|x4-2| 4- ln|x-II-----------Ц- 4-C = tj О X — 1 = -A-lnl (x + 2) (x-l)2|-—-У— +C. 0 x — 1 Пример 16.24. Найти интеграл \ —;------.-=----5-------. и J x5-x4 + 2x3-2x2+x- 1 Разлагая знаменатель на множители, получаем х5—х4 + 2х3—2х2+х—1 = =х4(х- 1) +2х2(х- 1) + (х- 1) = (х- 1) (х4 + 2х2+ 1) = (х- 1) (х2+1)2. В дан- 222
ном случае разложение в сумму элементарных дробей должно иметь вид ______1__________________ А Вх + С Рх+Е (х — 1) (х2 + 1)2_х — 1 х2 + 1 (х2 + 1)2 1 =Л (х2+ 1 )2+ (Вх + С) (х- 1) (х2+ 1) + (Dx + E)(x- 1). Полагая в этом тождестве х=1, находим 1=Л-4, т. е. Л = 1/4. Придавая х соответственно значения х = 0, х= — 1, х=1 — -у/ — 1 , получаем уравнения 1=Л —С —£; 1 =4Л+4В —4C + 2D — 2£; 1 = (£< + £) (j- 1), или \ = -D — Di + + Ei — E, т. е. 1 = —£> — £+ (E — D)i, откуда 1 = —D — E, E — D=0. Решив полученные уравнения, найдем В =— 1/4, С= — 1/4, 0 = — 1/2, £= — 1/2. Таким образом, f dx J х5 — х4 + 2х3 — 2х2 + х + 1 ' _ 1 с d(x— 1) 4~ (х—1) 1 f xdx 1 “TJ (х2+1)2 Г 1 ----4-arctg х — 4(х— 1) х+1 4(х2+1) 2(х2+1)2 1 г xdx 1 7”' х2+1 4~ с dx 1 1---5----= —г~ 1п х — J (х2+1)2 4 1 f d(х2+ I)______1_ г 4 J (х2+1)2 2 ' j dx 11 - 4- ln(x2+l) - о dx (x2+l)2 “ = _L- ln|x— 11 — _1_ ln (x2+ 1) _ arctg X+ 4~ .Д-, 1 , 1 __ arctg X- — ---4 arctg xH-------------HC. 2 B 4(x2+l) 1 +cos 2t dt = о ,, f dx , , Замечание. Интеграл 1 —--------------- найден с помощью подстановки x=tg t. J (x^+l)2 Так как dx = d//cos21, то r dx г d//cos21 r 2 ,j, f J(x2+1)2 J (tg2/+l)2 ~ JC°S М J' 1 , , 1 . 1 i ,1 = ~2~ t+ ~ S‘n 2Z= ~2~ arctg X+ ~2~ 2 2 sin t cos t = 2 Sln t cos21 = 2 tg t cos21 = 2x cos t 16.7. Интегрирование простейших иррациональных функций л . г dx Неопределенный интеграл \-- — выделением полного квад- у/Ах2 + Вх+С рата в подкоренном выражении и введением новой переменной и=х + Ь в зависи- мости от знака А приводится к одному из интегралов: 223
—, „ “ „ = arcsin ——(-С, (16.19) =ln|o+V^+«l+С. (16.20) д/u + a Неопределенный интеграл j-\/1Ах'г+ Вх + Cdx в зависимости от знака А приводится к одному из интегралов: д/иг+<х du = д/ц2 + а -|---1п |и + д/й^+а! + С, (16.21) J 2 2 J -у/а2 — и2 du = д/a2 — и2 4—arcsin —|-С (16.22) (см. формулы (16.13) и (16.14)). ,, и f ax-t-b Неопределенный интеграл \— — dx приводится к интегралам J дМх2 + Вх+С вида ^(Нх}Х ==^^-=|п|/(х)1+с' <16-23) I\л f I\л / \^dx = J (f(x))~''2df(x) = +с = 2 y/fTx) +С. (16.24) д//(х) I/2 Интеграл вида где R — рациональная функция и pi<?i, ... , рь, qk — целые числа, с помощью подстановки где п — наименьшее общее кратное чисел q\, qi, ... , qi,, приводится к интегралу от рациональной функции. Интеграл от дифференциального бинома /= \x"‘(a + bx")”dx, (16.27) где /п, п, р — рациональные числа; а, b — постоянные, отличные от нуля, сводится к интегралу от рациональной функции в трех случаях: 1) когда р — целое число, — разложением на слагаемые по формуле бинома Ньютона при р> 0; подстановкой x = tN, где N — общий знаменатель дробей тип; 2) когда (т+1)/л — целое число, —подстановкой a + bx" = ts, где s — знаменатель дроби р; 3) когда (т-\-Г)/п-\~ Р— целое число, —подстановкой ах '’ + & = /'. Пример 16.25. Найти 5 — д -----------. д'Зх2 + 6х + 4 Так как Зх2 + 6х + 4 = 3 (х2 + 2х + 1) — 34-4 = 3(х4- 1)2 + 1 = 3((х + 1)2+1 /3), то, положив х4-1 = и, по формуле (16.20) получим dx д/3? + 6х 4- 4 1 С d(*4-l) д/3 J д/(х+1)2+1/3 —InI (х4-1) 4- у/(-’сН_ *)1/31+ С. 224
Пример 16.26. Найти j-\/x24-6x4- 13dx. Поскольку х2 + 6%+ 13= (х24-6х4-9) +4= (х + 3)2 + 4, то, полагая и=х-)-3, по формуле (16.21) находим $ V? + 6x+13 dx= V(x+3)2 + 4 + Ini (х + 3) + д/(^ + 3)2 + 4| +С = = ^х2 + 6х+13 +2 1п|х + 3+ д/х2 + 6х + 131 +С. Пример 16.27. Найти — 33 —— dx. 3 л/5 + 8х-4х2 Поскольку (5 + 8х —4х2)' = 8 —8х= —8(х—1), 9 —4х= —4х 4-4 4-5 = = -4(х—1)4-5, 54-8х-4х2=-4((х2-2х4-1)-1) + 5 = - 4(х - 1)2-|-9 = = 4(9/4—(х—I)2), то на основании формул (16.19) и (16.24) получаем ( 9~4х dx = ( ~4(х-1)4-5 dx = г -4(x-l)dx + 3 д/5-|-8х-4х2 3 д/54-8х- 4х2 3 V5 + 8x —4х2 . с_____5dx_______ 1 с — 8(х — l)dx г d(x — 1)_______ 3 -V5 + 8x-4x2 ~ 2 3 V54-8x-^P~ 3 2 д/9/4—(х—I)2 “ = -\/5 + 8х — 4х2 4—arcsin -^—5——-|-С. Z О f dx Пример 16.28. Найти интеграл \----------, 3 (х- 1) V^2 Перейдем к новой переменной t по формуле х—1 = 1//, откуда dx=—dt/t , х2-2=(14-2/-/2)//2. Следовательно, dx (х—1) л/х2-2 dt V14-2/—/5 d(t-\) л/(л/2)2-(/-1)2 . /— 1 = — arcsin —— л/2 Возвращаясь к переменной х, находим dx (х—1) = arcsin V2(x-2) 2(x-l) Пример 16.29. Найти —- —:— . л/^ + З 4- V(x+3) Это интеграл вида (16.25), причем а=1, 6 = 3, с = 0, d=l, pi/<?i = l/2, P2/</2 = 2/3, п = 6. Подстановка (16.26) принимает вид х-|-3 = /6. Отсюда следует, что х = /6 —3, dx = 6t5dt, V(x4-3) =(х4-3)1/2=(/6)|/2 = /3, V(x + 3p=/4, / = = (х-|-3)|/6, /2= (х-|-3)|/3. Таким образом, _______dx______ Vх+3 4- V(x+з)2 ( 6/5d/ г t5dt c t2dt i Z3 + z< -4 Z3(1+/) ~ ) ]+/ 225
= 6-j----6/H-6 In | 1 +/| +C = 3(x + 3)1/3-6(x + 3)l/6 + + 6 ln| 1 + (x-f-3),/6| -f-C. Пример 16.30. Найти + V* № Переписав интеграл в виде Jx-2/3(l + х'/3) l/2dx и сравнив с интегралом (16.27), заключаем, что т= — 2/3, п=1/3, р=1/2. Так как (m+l)/n = = (— 2/3 + 1) / (1 /3) = 1 есть целое число, то имеем второй случай интегрируемости дифференциального бинома. Подстановка а-\- bx" = ts в данном случае примет вид (1 + х'/3) = Г2, откуда х|/3=/2—1, (1 /3)x~2/3dx = 2tdt, x~2/3dx = 6tdt. Под- ставив эти выражения в интеграл, получим $x~2/3(l+xl/3),/2dx= j (1+х|/3) 1/2x~2/3dx= \t2dt = = 6-^-.+ C = 2 (1 +x,/3)3/2 + C. 16.8. Интегрирование некоторых тригонометрических выражений Неопределенные интегралы вида J sin ах sin bxdx, $ cos ах cos bxdx, $ sin ax cos bxdx (16.28) с помощью тригонометрических формул sin a sin 0= -i- (cos(a —0) —cos(a + 0)), cos a cos 0= -i- (cos(a —0) + cos (a+0)), sin a cos 0= -i- (sin (a — 0) -)- sin (a + 0)) приводятся к интегралам с . , sin fcr , _ ( . . , cos kx \ cos kxdx—---------|-C; I sin kxdx=----?-----|-C. J k J я Неопределенные интегралы вида Im,n= $ sin"1 x cos" xdx, где m и n — нату- ральные числа, находятся с помощью тригонометрических формул sin х = = (1 — cos 2х) /2, cos2 х= (1 +cos 2х) /2, sin х cos х= (sin 2х) /2, если тип четные. Если хотя бы одно из чисел тип — нечетное, то от нечетной степени отделяется множитель и вводится новая переменная. В частности, если n=2k + 1, то /m.n=Jsin”’ х cos2‘+'xdx= jsinmxcos2‘ х cos xdx = = jsinmx(l — sin2 x)‘d(sin x) = \um (I —u2)kdu. Последний интеграл находится непосредственно (как интеграл от алгебраи- ческого многочлена). Неопределенный интеграл J/?(sin х, cos x)dx, где R(sin х, cos х) — рациональ- ная функция от sin х и cos х, путем введения новой переменной по формуле tg^-=/ (16.29) 226
приводится к интегралу 2/ +£)^-+(,>Л. где Rt(t) —рациональная функция переменной /. Пример 16.31. Найти интеграл $ sin 14х sin 6xdx. Это первый из интегралов типа (16.28), в данном случае а=14, 6 = 6. Применяя первую из приведенных выше тригонометрических формул, пре- образуем подынтегральную функцию и интегрируем: ' j sin 14х sin 6xdx — -i-j (cos 8x —cos 20x)dx = = -4- cos 8xdx----cos 20xdx = —Дг- sin 8x---------4— sin 20x + C. 2 J 2 1 16 40 Пример 16.32. Найти интеграл $cos Юх cos 7xdx. Преобразуя подынтегральное выражение, находим cos lOxcos 7xdx = —(cos Зх + cos 17x)dx = j 2 j If „ . , 1 f , _ , sin 3x , sin 17x , _ = -h-\ cos 3xdx+ \ cos 17xdx =----------1------------|-C. 2 J 2 J 6 34 Пример 16.33. Найти j sin6 x cos5 xdx. Поскольку одна из степеней является/нечетной (п = 5), то интеграл можно найти следующим образом: J sin6 х cos5 xdx = J sin6 х cos4 x cos xdx= j sin6 x (1 — sin2 x) 2d(sin x) = = sin6 x(l — 2 sin2 x + sin4 x)d(sin x) = J (sin6 x— 2 sin6 x + sin10 x)d(sin x) = sin7 x 2 sin9 x , sin" x , n ~ 7 9 1 П n 1C u . ( 5 — sin x+3 cosx . Пример 16.34. Наити \ :--------dx. J 3 + sinx — 3 cos x Преобразуя подынтегральное выражение, получаем г 5 — sin x + 3 cosx дх_ f 8—(3 + sin х —3'cos х) ' 34-sin x —3 cos x- — J 3 + sinx —3cosx = 8$-^ . d\---------\dx. J 3 + sin x — 3 cos x J Чтобы* найти первый интеграл, применим подстановку (16.29): f_______dx_____= г_______ 2/(1+<2)________dt= с dt J З + sinx-3 cos х J 3-|_ 2//(1 +12)+3(Z2—1)/(1+/2) 7 312 + / -5(т-5пт) ‘"-|"|'|-'"|3'+11+с-|"|з1Жтг|+с" Следовательно, ( 5-sin x + 3 cosx I tg(x/2) | ' 3+sinx —3 cosx |3tg(x/2) + l j
Глава 17 ОПРЕДЕЛЕННЫЙ ИНТЕГРАЛ 17.1. Определенный интеграл, его геометрический смысл и свойства Понятие определенного интеграла. Пусть дана функция y = f(x), определенная на отрезке [а, Ь], где а<6. Отрезок [а, Ь] точками а=х0< <Xi <x?<Z ... <х„-i< х„ = b разобьем на п элементарных отрезков [a, Xi ], [xi,xz|,..., [x„_|, 6], длины которых обозначим через Axt, т. е. Дхк = хк — xk~ i (k= 1, 2, ... , п, х0 = а, хп — Ь). В каждом из элементарных отрезков i, х*] выберем произвольно одну точку значение функции в этой точке f(£k) умножим на длину отрезка Дх*, получим произведение Ц£к)Лхк. Составим сумму всех таких произведений «„= £ Ш»)Дх*. (17.1) h= I Сумма (17.1) называется интегральной суммой для функции у = f(х) на отрезке [а, &]. Обозначим через к длину наибольшего из элементарных отрезков [х*_,, Xs] (k= 1, 2...п), т. е. Х = тах Дхк (k= 1, 2, ... , п). Число 5 называется пределом интегральной суммы (17.1), если для любого числа е> 0 можно указать такое число б> 0, что при выполняется нера- венство |S„ — S|<e независимо от выбора точек на отрезках х*]. Определенным интегралом от функции y = f(x) на отрезке [а, 6] называется конечный предел ее интегральной суммы, когда число элементарных отрезков неограниченно возрастает, а длина наибольшего из них стремится к нулю. Опре- ь деленный интеграл обозначается символом J f(x)dx (читается: определенный а интеграл от а до b); f(x) называется подынтегральной функцией, х — переменной интегрирования, а — нижним, b — верхним пределами интегрирования. Следовательно, по определению Ь п J f(x)dx = lim У /(^)Дх». (17.2) а ^0 * = 1 Из определения следует, что величина определенного интеграла не зависит от обозначения переменной интегрирования, т. е. ь ь ъ $ f(x)dx= $ Н0^ = -.== $ f(u)du. (17.3) а а а Функция, для которой существует предел (17.1), называется интегрируемой на отрезке [а, &]. Очевидно, если функция f(x) интегрируема на отрезке [а, 6], то она и огра- ничена на этом отрезке. Обратное утверждение неверно: существуют ограниченные функции, не являющиеся интегрируемыми. К ним относится функция Дирихле, равная единице в рациональных точках и нулю — в иррациональных. На лк5бом отрезке [а, Ь] эта функция ограничена, но не является интегрируемой на не