Text
                    ИНТЕРПОЛИРОВАНИЕ
И СПОСОБ
НАИМЕНЬШИХ
КВАДРАТОВ

БИБЛИОТЕЧКА ФИЗИК О-М АТЕМАТИЧЕСКОЙ ШКОЛЫ МАТЕМАТИКА Г. И. ДРИНФЕЛЬД / ИНТЕРПОЛИРОВАНИЕ И СПОСОБ НАИМЕНЬШИХ КВАДРАТОВ у КИЕВ ГОЛОВНОЕ ИЗДАТЕЛЬСТВО ИЗДАТЕЛЬСКОГО ОБЪЕДИНЕНИЯ «ВИЩА ШКОЛА» 1984
22.19 Д74 УДК 512.5 Интерполирование и способ наименьших квадратов. Дринфельд Г. И.—К.: Вища шк. Головное изд-во, 1984.—103 с.— (Б-чка физ.-мат. школы. Математика). В книге изложены начальные сведения об интерпо- лировании: линейном, полиномиальном, тригонометри- ческом. Рассмотрен метод наименьших квадратов и применение его к решению задач полиномиального ин- терполирования. Описаны операции над векторами, свойства операций, процесс ортогонализации векторов* Все понятия и приемы вычисления иллюстрируются примерами, даны задачи для самостоятельного решения. Рассчитана на» учащихся физико-математических и средних общеобразовательных школ. Она может быть использована учителями математики при проведении фа- культативных занятий и внеклассной работы. Ил. 19. Редакционная коллегиям член-корреспондент АН УССР А, В. Скороход (отв. редактор, профессор Л. A. J£a- лужнин, профессор Н. И, Кованцов, доцент В. И. Коба, доцент Н. Я. Лященко, доцент Ю. М. Рыжов, профес- сор М. И. Ядренко (зам. отв. редактора), кандидат педагогических наук Л. В. Кованцова Рецензенты: кандидат физико-математических наук П. М, Моклячук (Киевский государственный уни- верситет), учитель-методист Р. П. Ушаков 4сРеДняя школа № 173 г. Киева) Редакция литературы по математике и физике Зав. редакцией Е. Л. Корженевич 1702050000—184 Д №211(04)—84 138 84 © Издательское объединение «Вища школа», 1984
ГЛАВА I ВЕКТОРЫ, ОРТОНОРМИРОВАНИЕ § I. Неравенство Коши — Буняковского1. Исследуем функцию у = ах2 + 26х + с, а > О, и построим ее график. Поскольку у == — ((ах + Ь)2 + (ас — Ь2)), то: 1) при ас — Ь2^0 у^О любого действительного значения х, а равенство у = 0 справедливо только тогда, когда ас — Ь2 = О, х = — — ; а 2) если ас — Z?2 < О, то у == 0 при х = ~ (— b ± , -«г «о ’ \ л —Ь~ "1/" ас — Ь2 . ±УЬ2 — ас), у<0 при условии ------------—-— < х < ‘ —Ь + У ас — b2 . п <-----!—l---- и у>0 при всех остальных значениях х\ 3) всегда при х = — у = -^(ас — Ь2); • 4) при | х | -> оо Z/->oo. Графики этой функции при а >0 изображены на рис. 1. Сформулируем в ы в о д ы,. которые будут использованы в дальнейшем. Рис. 1 1 Буняковский В. Я. (1804—1889) — русский математик, академик. Коши О. Л. (1789—1857)—французский математик, академик. 3
1. Для действительных значений аргумента квадратный трехчлен ах2 + 2Ьх + с с положительным старшим коэф- фициентом не принимает отрицательных значений тогда и только тогда, когда ас — Ь2^0. 2. Квадратный трехчлен ах2 + 2Ьх + с с положитель- ным старшим коэффициентом при —оо<^<+°° не имеет наибольшего значения, а наименьшего значения до- ft стигает при х = —- . Теорема. Для любых действительных ait b{ (4 = 1, 2, ...) справедливо неравенство Коши — Буняковского £b‘,. (1) ' * 4=1 ' 4=1 Это одно из важнейших неравенств в математике. Для его доказательства рассмотрим функцию п п п п У= У (ха{ + bt)2 = х2 а* + 2х 2 а Д- + £ Ь2{ 4=1 4=1 4=1 4=1 • при —ОО < Х< 4-00. Поскольку 0, то, используя вывод 1, имеем п п п (Sa’.HM-tS W>0, 4=1 4=1 4=1 что равносильно (1). Приведем еще одно элементарное доказательство нера- венства (1). С этой целью установим тождество п п . п ( I flf) ( S — (S «А? s S (aebs — asbr)2, (2) 4=1 4=1. 4=1 rj=s называемое тождеством Лагранжа1. Имеем п п п п . ( М ( S *’) - (S a{b{)2 = S + S - 4=1 4=1 1=1 4=1 ri=s — S «X — 2 S' arbrasbs-— S (arbs — asbr)2. 4=1 r^s r*s n n Здесь Jj* означает S arbr S asbs- Если приведенное r=l s=r-|-l вычисление окажется затруднительным, то рекомендуем выполнить его для п = 3 без применения знака S. х Лагранж Ж. Л, (1736—1813) — французский математик. 4
Тождество (2) справедливо для действительных и не- действительных ah Ь^ Если а{, действительны, то из (2) следует: 1) неравенство Коши — Буняковского; 2) для того п п п чтобы имело место равенство (SW = (M(S &?), Г = 1 1=1 1=1 необходимо и достаточно выполнение условий arbs — asbr = О (г, s = 1, 2, .. . , п). Достаточность следует непосредственно ..из (1). ‘ Замечание. С помощью элементов векторной алгебры легко видеть, что при п = 3 неравенство (1) следует из неравенства | cos а | < L Действительно, будем считать (alt а2, а3), (Ь12 Ь2, Ь3) соответственно ——> проекциями векторов и и v на оси прямоугольных координат. Тогда aibl= и • v= 1я| | v |cos(u, v). £a’=|u|2, J] 6*=|T|a. i=i i=i Следовательно, неравенство Коши — Буняковского справедливо, оно означает, что модуль скалярного произведения двух векторов не больше произведения длин этих векторов. § 2. Арифметическое я-мерное пространство. Определение. А рифметическим п-мерным про- странством называется множество всех упорядочен- ных систем п действительных чисел (alf а2, ... , ап). (1) Упорядоченность означает, что, меняя местами даже два не равных между собой числа в (1), получаем другую систему. Например, если аг #= а2, то (au а2, ... , ап) и (а2, alf ... , ап) различны. Иными словами, равенство (аъ а2, ... , ап) = (blt b2, ... , Ьп) возможно тогда и только тогда, когда аг = Ьъ а2 = Ь2, ... , ап = Ьп. Каждая упорядоченная система (1) называется точкой пространства, а числа а1У а2, ... , ап — коорди- натами этой точки. Например, при п = 2 имеем двойки чисел (an аа). Точку (an a2) можно рассматривать как точку плоскости, декар- товы координаты которой аг, а2 (рис. 2). Таким образом, двумерное арифметическое пространство можно рассматри- вать как плоскость. Точно так же трехмерное арифмети- ческое. пространство можно рассматривать как обычное геометрическое пространство (рис. 3). 5
Рис. 2 § 3. Евклидово л-мерное пространство. Определение. Арифметическое п-мерное пространство называется метризованным, если каждым двум его точкам А (ах, а2, ... , ап) и В (bt, b2, ... , Ьп) ставится в соответствие число р(Л, В), обладающее свойствами: 1) р (Л, В)>=0, р(Л, В) = О тогда и только тогда, когда А = В; 2) р(Л, В) = р(В, Л) (симметричность)' 3) для любых трех точек А, В, С справедливо нера- венство р(Л, С)«Р(Л, В) +,р(В, С). (1) - Указанные свойства называются аксиомами метрики, а р(Л, В) — расстоянием между точками Л и В. - В евклидовой плоскости длина отрезка — это расстояние между его концами. Действительно, длина отрезка очевидно удовлетворяет аксиомам 1) и 2), а также удовлетворяет аксиоме 3), так как длина любой стороны треугольника не больше суммы длин двух других его сторон (рис. 4). По аналогии, неравенство (1) всегда называют неравен- ством треугольника. В евклидовой плоскости длину отрезка, соединяющего точки Л(аь а2) и В(ЬХ, Ь2), где (ах, а2) и (Ьь Ь2) — пря» 6
моугольные декартовые координаты точек (рис. 5), можно вычислить по формуле Р(А В) = т-«Г)2 + (Ьа-аг)2, а в трехмерном евклидовом пространстве — по формуле Р (Л, В) = ]/(&! - + (д2 - atf + (Ь3 - а3у. В n-мерном арифметическом пространстве положим по опре* делению р(Л, В) = - й1)а + (Ь2 - «2)2 + •••+(&„- а„)2 = = \/ ^(Ь{-а{У (2) и покажем, что удовлетворяются все три аксиомы метрики. Выполнимость аксиом 1) и 2) очевидна. Проверим акси- ому 3). Пусть А (а1( ... , ап), В (blf ..., Ьп) и С (сХ1 ... , cj— три произвольные точки n-мерного пространства. Тогда Р2 (Л, В) = S (b{ -at)2, Р2 (Л, С) = £ -^)2. Р2(В, С)= S(^-^)2. Обозначим - Ь{ — а{ = а{, с{ — а{ = ylt с{ —bt = р,. Поскольку у{ = az + Р/, то надо доказать, что JL _ Д, / /~ п / п ‘=1 ‘=1 \ Г Г=1 r / Имеем S (»z+ M2 == S«?+ S P? +2 S аД. f=l . 1=1 i=t 1=1 На основании неравенства Коши —Буняковского п / п / ’~И s₽?. Поэтому т
откуда Определение. Арифметическое п-мерное пространство^ метризованное . по формуле (2), называется п-м ер ным евклидовым пространством. § 4. Векторы в л-мерном арифметическом простран- стве. Сложение векторов, умножение вектора на число. Упорядоченную систему п чисел (аь я2, • • • » а„) будем называть вектором и обозначать а(а^ а2, ... , ап), при- нимая, по определению, что равенство а(аг, аг, ... , ап) = b(&1; Ь3, ... , Ьп) эквивалентно систему равенств = blt a2~b2i ..., ап = 6Л; суммой а + b векторов а(аи а2, ... , ап) и b (bt, Ь2, .., bn) ~>• является вектор + Ьи а3 + Ь2, ..., ап + Ьп). Произведением вектора а (а13 а2, ..., а^ на число —► (скаляр) X называется вектор Ка (kalt ha2, ..., han). Вектор 0(0, 0, ... , 0) будем называть нулевым. Из приведенных определений и свойств действительных чисел следуют такие основные свойства сложения векторов и умножения вектора на число: 1) а + b = b 4- а (переместительный закон); 2) (а + Ь) +~о = а + (Ь +~с) (сочетательный закон); 3) а + 0 = а (закон поглощения нулевого вектора); —> —> 4) А. (ра) = (Ар) а (сочетательный закон); 5) - (А -Ь р) а = Аа + (первый распределительный за- кон); 6) А (а + Ь) = Аа + АЬ (второй распределительный закон); 8
7) Оа = %0 = 0 (закон поглощения нуля и нулевого вектора). Заметим, что из указанных законов действий с векто- рами сумму любого числа векторов можно записывать без скобок, произвольно переставлять и группировать слагаемые. Все свойства легко проверить. Например, %(а +Т) = X («1 + bt, а2 + Ь2, ... , ап + Ьп) = «= (X («1 + t>i), % (а2 + Ь2),... , X (ап + &„")) == = + Л.&!, %а2 + М>2, ... , Кап + = — (Каи Ка2, ... , lan) + (Mlt М2, .... = = Ка -f~ КЬ. Вектор (—1) (аъ а2, ... , ап) = (—аъ —а2,..., —ап) будем называть противоположным вектору a(alt а2, ... , ап) —► и обозначать —а. По определению имеем а + (—«) = («!, а2, ... , ап) + (—а1г — а2, ..., —ап) =- = (0, ... , 0) - 0. Полагая a -J- (—Ь) = а — Ь, будем иметь "а —Т (ах — Ьъ...,ап — Ьп). § 5. Длина вектора (в евклидовом пространстве). Угол между векторами. Точки 0(0, 0, ... , 0) и A (alf а2, ... , ап) будем называть соответственно началом и концом вектора О А = а(аъ «2, ... , ап). Естественно поэтому следующее определение: длиной —> вектора а (а1? а2, . .. , а^ называется число | а | = Vа* + а2 + • • • + а2п = а*. 9
Теорема 1. Для любых двух векторов а и Ь спра- ееоливы неравенства |а| —|T|<|a±£j</e| + А- J —> —> —> —> Действительно, неравенство |a + 6|«i|a|4-|&| — это не- равенство треугольника для трех точек А(ах, а2, ... , ап), B(±blt ±ba,... , ±bn), С («1 ± blt а2 + b2, ... , ап + bn), так как р(Д, В) = S (а{ + bt)2 = | <Г+Т|, р(Л, C) = ]/ib2t = \b\, . р(В, С) = Hal- Неравенство lai — |b| <g |a + b| следует из неравенства - ' ► " > - "► |a±d|<i|a| + |& |. Действительно, Ia\ = ] (a + T) + iT| < fa ±.T| + |T|, ]cT| — |П < |a"± —► Определение. Косинусом угла b) между двумя ненулевыми векторами а и b называется число хх 2 а Ь C0S(a, = (1) |а||/>| Такое определение допустимо, поскольку по неравенству Коши — Буняковского п - / п /"~п 1/ S «?]/ S i—“1 ’ Js=l * I——1 и тогда S ЯА. -1 г<1. |a|| I 10
Определяя угол из равенства (1), будем полагать, что О < (а, Ь) < л. —► —► Теорема 2. Угол (а, Ь) равен 0 или л тогда и только тогда, когда Т = хХ (2) Действительно, если справедливо равенство (2), то |t| = |ka(Kalt Kait ..., Xan)| = = ]/g(W= IM|a|, ' S afti = S at (kat) = X 2 a® = A | a |s. f=l x=l i=l Следовательно, . . "Л XI a Is . cos (a, b) = =>——- = ± 1. I a I • I A. 11 a | Если же (a, b) = 0 или (a, b) — л, то n f n / |£О,М = Й6| = |/ S»,’y s»,’. Но знак равенства в неравенстве Коши — Буняковского можно получить лишь при условии, когда bt — Xai или, —> —> что то же самое, b = Ха. Теорема 3. Угол (а, Ь) равен тогда и только тогда, когда п S«A = o. (3) Эта теорема следует из определения (1). Векторы а и b назовем коллинеарными («лежащими на —> —>• одной линии»), если угол (а, Ь) равен 0 или л, и орто~ гональными («перпендикулярными»), если (а, Ь) равен -у. 11
Таким образом, условие (2) является необходимым и до- статочным для коллинеарности, а условие (3) — для орто- —► —> тональности двух векторов а и Ь. § 6. Скалярное произведение двух векторов. Определение. Скалярным произведением век —► — торов a(alt а2, ... , ап) и b (Ьи Ь2, ... , Ьп) называется число а1Ь14- а2Ь2 + • • • + апЬп. —► —► Мы будем пользоваться обозначением (а, Ь) или —► —► а - Ь, т. е. (а, Ь) = а • b = S аД. (1) Основные свойства скалярного произве- дения: . —► —► —► —► 1) (а9 Ь) = (Ь, а) (переместительный закон); —► —>• —>• —► —► —► —► , 2) (а, (Ь 4- с)) = (а, Ь) + (а, о) (распределительный закон); X1 1 > ► > —► 3) A (a, b) = (ka, b) = (а, КЬ) (сочетательный закон); 4) скалярное произведение двух ненулевых векторов равно произведению их абсолютных величин на косинус угла между ними: (а, Ь) = |а| | b|'cos (а, &). (2) Свойство 1) следует из (1); свойства 2) и 3) легко про- дерите Например, А (а, Ь) = К У, atbt = £ (Ааг)&; = (Аа, Ь), i=i t=i Формула (2) следует из(1) и определения cos (а, Ь). Из 1) — 3) получаем <(Аа + рЬ), (ас 4-Р^)> = (Аа, (ас 4-Р^)> 4~ <рД (ас 4- 4-Рс!)) = <Аа, ас)4~(Аа, fid) 4- <рД ас) 4- 4- (р& 4* Р^) — Аа(а, с) 4- Ар (а, d) 4* ра(Ь, с) 4- 4- рР(й, с!), 12
т. е. суммы векторов скалярно перемножаются как мно- гочлены. Теорему 3 предыдущего параграфа можно сформулиро- —>• —> * вать следующим образом: векторы а и b ортогональны тогда и только тогда, когда их скалярное произведение равно нулю. Замечание. Скалярное произведение (а, а) равно квадрату дли- —> —> —> —> ны вектора а, т. е. (а, а) = | а I1. § 7. Линейная зависимость векторов. —► Определение. Ненулевые векторы аДвн, Я12, ••• , «2(^21» ^22» --;» а2п)> ••• , аЛап> аГ2> • • • > ат) назы‘ ваются линейно зависимыми, если существуют чис- ла • • • » среди которых хоть одно отлично г от нуля А,2=/=0), такие, что 4“ ^2^2 + * * • 4“ ^гаг = 0, (1) и линейно независимыми, если равенство (1) воз- можно только при условии = Х2 = • • • = — 0. Пример 1. Покажем, что векторы Ml, 0, ... , 0), МО, 1, 0, ... , 0), ... , ^(0, 0, ... , 0, 1) (2) — линейно независимы. Действительно, если бы эти векторы были линейно зависимы, то было бы 7=i1T1 + iX+ + S (3) 1=1 7(хп х2.....у = о"(о, о,..., о), = Х2 == • • • == A//j = 0 и мы пришли бы к противоречию с неравенством (3). Совокупность векторов (2) называется декартовым бази- сом /г-мерного евклидова пространства. Декартовым базисом эта совокупность векторов называется потому, что 13
т. ё. векторы попарно перпендикулярны, и любой вектор —> и («1» и2, ... , ип) можно представить в виде « = «1^1 *"Ь «2^2 “Ь ’ * * “Ь что легко проверить. Заметим еще, что ы = 1, т. е. е19 е2, ... , еп — единичные векторы. Пример 2. Векторы ^(1, —2, 3), иа (2, 1, —1)» (4, —3, 5) линейно зависимы, так как 2их + и2 — и3 = 0 (0, 0, 0). Вопрос о линейной зависимости векторов сводится к исследованию системы уравнений первой етепени. Действительно, по определению, векторы ak(ak{t а^, , а^), £«1, 2, •«. , г, линейно зависимы тогда и только тогда, когда вектор + ^ааа + * • •+ нулевой, причем не все скаляры равны кулю. Но это условие равносильно условиям ^1аи + А,ааа1 + • • • + %гаг1 = 0, + А-аааа + • • • + Чаг2 =* (4) ^ialn + ^»а2п + • • • + Хгагп = 0. Следовательно, для того чтобы векторы ak (ak^ ak2, ..., akn), k = 1, 2, ... , г, были линейно зависимыми,- необходимо и достаточно, чтобы система уравнений (4) а неизвестными %а, .,« , Кг имела г решение, удовлетворяющее требованию J] V =# 0. 8=1 Исходя из теории определителей, легко доказать тео- рему, которую приводим для п = 31 для того чтобы три вектора а1 (allt а12> а2 (а21> а22> агз)> °3 (а31> fl32> а3з) были линейно зависимыми. необходимо и достаточно, чтобы выполнялось условие «и «12 а13 «21 «22 «23 = 0* «31 «32 «33 14
§ 8. Процесс Сонина — Шмидта. Русский математик Н. Я. Сонин1 и немецкий математик. Э. Шмидт2 незави- симо друг от друга решили важную задачу, которую сфор- мулируем следующим образом: Пусть заданные векторы аъ а2, ... , ат линейно не- зависимы, требуется найти векторы blf b2, ... , bm, удов- летворяющие условиям: 1) Ьц Ь2, ... , Ьт должны линейно выражаться через ^2> • • • > Ul, £ == + а212 + ... + fe2 = Pi#! + ₽2а2 4-... 4- Pmam, где а{, pz — числа (скаляры); 2) bi, Ь2, ... , bm должны быть линейно независимыми; 3) Ьъ bit ... , bm должны быть орпгонормированными, tn. е. ~bs> = 0, г =# s, (Ьп ~ЬГ) = |М2 = 1. Рассмотрим решение задачи по Сонину — Шмидту. По- ложим К I ах| и заметим, что <ТЛ> = £> = 1- \Д11 1011х I «1 Р ——>- —>- — Затем рассмотрим вектор с8 = at — Поскольку * 7*" » векторы alt а2, а значит, и векторы а2, Ьг линейно неза- висимы, то вектор с2 ненулевой и линейно выражается через —>- аг, а2, х Сонин Н. Я. (1849—1915)—русский математик, академик. 2 Шмидт Э, (1876—1959) — немецкий математик, академик. 15
Кроме того, <с2, &!> = (а2, by)— (a2i Ь1)(ЬЪ by) = 0. Теперь положим — °2 и2 — -> Таким образом, нашли два вектора Ьъ b2 (читатель может самостоятельно проверить их линейную независи- мость), удовлетворяющие всем условиям задачи. Теперь положим Т3=~а3 — <а3, b2)b2 — (a3,'bl)bl. Этот вектор ненулевой и линейно выражается через b19 b2f а3 и тем самым через а2, а3 (почему?). Кроме того, <с3, К) = <Х, К) ~ <Х> Т2) <Т2, — (X, <^1» Х> = = (а3, by) (а3> b2) • 0 (#3, -1=0. Точно так же проверяется равенство <с3, b2) = 0. Положим 7? — —— °з — < I Сз I Векторы 6Х, Ь2, Ь3 удовлетворяют всем условиям задачи. Далее полагаем МК —b2)b2 — (а^ Ьг)Ьу, —> |С4 | И т. д. —> Замечание 1. Уже отмечалось, что с2» сз> —ненулевые век —>- —>• горы. Это дает возможность делить их на | с21, | с3 |, ... . Замечание 2. На каждом шаге решения задачи обращалось вни- мание, что alt a2t ... можно линейно выразить через blt 62, ♦ *. • Пример/ Применим процесс Сонина — Шмидта к векторам (2, 1, 2), 0^(1, 2, 1), а^(1, 1, 2). Полагаем, что К= -=г- = ~bi I «11 £ J_ 2\ 3’3' 3}' 16
Затем С2 = аЧ -- (а2> ^1)Ь1 — а2 0 » 2, 1) I — * 1 + — \ О О 1 4 1 3’3’ с £.№(2,1,2 3 / 1 \ 3 3 3 4 ^2 — ^2 1 • \ 3/2/ ' Далее находим ' с3 = Оз—(«3. С)К —<оз- К) *1 = «з (1, 1. 2) — 1 -» / 1 4 1 \ 7 ->/_2 J_ _2 — 3 /2 Ьг 3 /2 ’ 3 /2 ’ - 3 /2 / 3 Ч3 ’ 3 ’ 3 (-4'°' 4} = с3 b3 ~ Рекомендуем проверить самостоятельно, что совокупность векторов -т> —> —> ^2> ортонормированная. Заметим еще, что -> 1 -> -> 1 -> 2 -> -> 1 -> 2 — 7/2 -> Z>i = —. alf b2 — у- а2 j alt b3 = у 2 a3 a2 + y-- alt a± = 3b^ a2 = /2К + 2 bti = 1 1 7 -y^bi+ 6 ^+3/261- § 9. Геометрические истолкования. Мы могли бы, шаг за шагом, показать, что приведенные в предыдущих пара- графах определения, теоремы и формулы при п = 2 и п = 3 аналогичны тем определениям, теоремам, правилам, кото- рые знакомы читателю из школьных курсов элементарной математики и физики. Ограничимся здесь случаем п = 2 и наиболее важными фактами. 1. Пусть имеем вектор а(аи а2). Возьмем в плоскости декартову систему координат и найдем точку М с коор- динатами (аъ а2). Соединим начало координат с этой точ- кой М, снабдим отрезок ОМ стрелкой (рис. 6) и, таким образом, получим геометрическое представление о векторе^ 17
2. Рассмотрим векторы а(аи а2), 6(&1, 62). Тогда а 4- b = с (ctt 4- blt аг 4- Ь2), а — b — в (ах — Ьи а2 — &2). Из рис. 7 видно, что введенное нами правило сложения это не что иное, как известное правило параллелограмма. 3. Рассмотрим скалярное произведение (а, Ь) = а1Ь1 4- а2Ь2. Имеем (рис. 8) (а, Т) = |7| р| • -4- + ~£~ • 4Л = \|а| 161 |а | | b |/ = | а 11 b | (cosa cos р 4- sin a sin 0) = | а 11 b | cos (Р — а). Мы получили известное правило вычисления работы. 4. Попытаемвя понять геометрический смысл процесса Сонина — Шмидта (рис. 9). Построение вектора ЬА — —> = естественно и понятно. Построение вектора с2 тоже I «11 естественно и мы получаем: &2 = ^2» I ^2 I = М ^2 |> 1 = I ^2 1> = -> > I «2 I ^2 — 4“ &&]_• Рис. 9 18
Чтобы найти а, умножим скалярно последнее равенство на и, так как <с2, Ьг) — 0, получим 0 = (а2, bi) + a(blt bi) = (a2, Ь±) + а, а = — (а2, Ь^, с2 = а2 (а2, bi)bi. Когда сделаны два первых шага по методу Сонина—Шмидта, нетрудно сделать третий и последующие шаги аналогично и без рисунков. § 10. Геометрический смысл линейного уравнения. Выясним геометрический смысл уравнения первой степени Ах 4- By 4- С = 0, (1) где А, В, С — числа. Будем считать х и у декартовыми координатами точки. Выражение Ах 4- By имеет вид ска- лярного произведения'. Поэтому рассмотрим векторы г (х, у), п(А, В) и запишем уравнение (1) в виде (п, Ъ + С = 0. (2) Пусть N (х0, уй) — точка, координаты которой удовлетво- ряют уравнению (1). Введем вектор г0(х0, у0). Тогда (я, г0) 4- С = 0. Найдя из последнего равенства С и подставив его значение в (2), получим уравнение (п, (7-пО> = 0, (3) равносильное уравнению (1). Уравнение (3) легко истолко- вать (рис. 10): при изменении хну, связанных уравнением 19
(1), следовательно, при изменении вектора г (%, у) соответ- ствующая точка /И — конец вектора г— перемещается так, что вектор г — г0 остается перпендикулярным к фиксиро- ванному направлению п. Поскольку вектор (его конец) rQ фиксирован, то конец вектора г (точка М (%, //)) переме- щается по прямой, проходящей через точку N (х0, г/0), перпен- дикулярно к п. Итак, уравнение (1) геометрически (в декартовых ко- ординатах) на плоскости представляет собой прямую, перпендикулярную к вектору п(4, В) и проходящую через точку (х0, z/0), абсциссу х0 которой можно задать, а орди- нату yQ найти из равенства Ах0 + Ву0 + С = 0. Уравнение (1) называется линейным, а п — нормаль- ным вектором прямой. Если уравнение (1) определяет прямую, то для ее построения необходимо найти две точки. Теперь рассмотрим уравнение Ах By Cz -f- D = 0, (4) которое также называем линейным. Введем в рассмотрение векторы г(х, у, г), п(Л, В, С), г0(х0, у0, г0), где х0, у0, г0 удовлетворяют единственному условию Ах0 + 4- Ву0 + Сг0 4-0 = 0. Уравнение (4) можно заменить рав- носильным ему векторным уравнением <п, = 0, (5) которое по виду ничем не отличается от уравнения (3). Однако в этом случае имеем трехмерное пространство, в нем: фиксированную точку N (ха, у0, г0) — вектор г0; У фиксированное направление — вектор и; переменные векто- ——У- —у- —>- —>- ры г, г — г0. Вектор г—г0 всегда остается перпендику- лярным к /г, а так как один из его концов фиксирован, то этот вектор находится в плоскости, проходящей через точку Af(x0, Уо< 2о) перпендикулярно к п (рис. 11). Итак, уравнение (4)' определяет плоскость в трехмерном пространстве, если х, у, z считать декартовыми координа- 20
тами точки. Эта плоскость перпендикулярна к вектору который называется нормальным вектором плоскости, и про- ходит через точку N (х0, yQ, г0), две координаты которой можно задать, а третью координату найти из уравнения Axq + ByQ + CzQ 4- О == 0. Обратив внимание на однотипность уравнений (1), (4)» и на одинаковость перехода к уравнениям (3), (5), не от- личающимся по виду, запишем уравнение А-*! + А2х2 + • • • + Апхп + С = 0 (6) в виде (Т, [г — Го)> = О, где г (х^, х2, . • • > -^n)> (^1» ^2» • • • » ^п)> (*^i> ^2> • • • * х°п) — векторы и Агх[ + А2х% + • • • + Апх*п + С = 0. По- этому справедливо следующее определение: совокупность точек п-мерного евклидова пространства, координаты которых удовлетворяют линейному уравнению (6), назы- вается гиперплоскостью. § 11. Решение задачи на отыскание минимума. Выясним геометрический смысл следующей задачи. Пусть в трехмерном евклидовом пространстве даны —> два неколлинеарных вектора и2 и третий вектор vr —> —> не выражающийся линейно через и2, т. е. не компла- нарный с ними: . (1> где bv b2 — числа. Требуется найти коэффициенты аъ а2 такие, чтобы величина (w, w), где v — ia^ + а2п2) стала минимальной, и вычислить Выяснить геометрический смысл задачи не трудно. В са- —>• — мом деле, если векторы иъ и2 не коллинеарны, то они определяют плоскость р (рис. 12), в которой, ввиду формулы (1), вектор v не лежит. Вектор «=£?!«! + а2ы2 при min(ay, ®>. ‘ 1М/ш i Ху Рис. 12 21
любых аи а2 лежит в плоскости р, вектор w соединяет концы векторов v, и (заданную точку М пространства и некоторую точку N плоскости р) и (ш, ш) является * >• квадратом его длины. Требуется подобрать вектор’ и так, чтобы длина MN был минимальной. Иными словами: рас- сматриваются отклонения точки М пространства от различ- ных точек плоскости р, требуется найти на р такую точку N, для которой расстояние /ИЛГбыло бы минимальным. Геометрически искомая точка N является проекцией точки М на плоскость р. Чтобы найти Л/, надо построить -> проекцию вектора v на плоскость р. Для этого заменим пару векторов и2 ортонормированной парой векторов v2i расположенных в той же плоскости р, спроектируем v на направлении векторов v2 и полученные векторы- —> —> проекции сложим. Замена и19 и2 на v2 всегда возможна (процесс Сонина — Шмидта). Решим данную задачу аналитически (с помощью вычи- слений). Положим (и19 иг) = (и2 и2) = 1, и2) = 0 (2) и вычислим (w, w). На основании свойств скалярного про- изведения получим (w, w)=(v—ахиг—а2и2 v — a1ul—а2и2) = = <v,' V) + аг <7^, + а2 (и2, и2) — — 2а1<и, «1) — 2a2<v, и2) -f- 2ata2 (ult и2>. Тогда, используя равенства (2) и вводя обозначения «1 = (v, щ), а2 = (v, ^), (3) имеем (w, w) = (v, v) + а* + а2 — 20^ — Яа2а2, (ар, ш) = <7, о> + (Я1 — ах)2 + (а2 — а2)2 — (а, + а2). Отсюда ясно, что значение <ш, w) станет минимальным, если положим —> —> —> —> « а1 = а2 = а2 — (V, и2) (4) 22
и только в этом случае. Кроме того, min |ш|2 = Ш1п(ш, w) = (V, V) — (а2 + а2) = = р|2 — (.(V, й^))2 —«йГ, йф)2. Заметим также, что - «1 = ЙЙ cos (у, «J = | v| • 1 • cos(v, И1), (w, ^>=<v, »i> —ai<«i, «i> —a±<«i, «2> = <у» «i> — — а1 = 0, (w, u2) — 0 и поэтому аг — это величина проекции вектора v на направ- ление вектора ut и точно также а2— величина проекции ЁГ на м2, вектор w перпендикулярен к плоскости векторов —> —> их, и8- Мы получили: 1. Если в трехмерном евклидовом пространстве векторы «й м2 образуют ортонормированную пару, а вектор v удов- летворяет условию —>• —> —>• + м2, то величина (w9w) = (v— а1и1— а2и2, v— a1u1— a2u2) принимает минимальное значение тогда и только тогда, когда аг = (и, иг)9 а2 = (и, и2). Кроме того, min(uy, w)=(v, v) — «и, —«и, w2»2- —> 2. Задача отыскания шт(ш, w) с геометрической точки зрения означает отыскание проекции точки М (конца век- тора и), не лежащей в плоскости р ортонормированной пары векторов и19 и2, на плоскость р. Найденное решение —> —> —> означает, что проектируем v на направления и19 и2 и полу- ченные векторы складываем. Конец вектора-суммы и есть —> —>- искомая проекция точки М. Наконец, min (о/, w)—это квадрат расстояния точки М от своей проекции на пло- —> —> скость векторов ult и3. 23
Обобщим полученные результаты. Теорема, Пусть дана ортонормированная последова- —> —> тельность (линейно независимых) векторов ut, и2, ... , ит (т<п)' в п-мерном евклидовом пространстве Еп и еектор и, не выражающийся линейно через щ, и2, ... , ит. Пусть w = V — + а2и2 н----h а^ит), (5) где а1г ... , ат — числа. Для того чтобы величина (w, —> —> w) = |i£>|2 приняла наименьшее значение, необходимо и до- статочно положить а± = (v, щ), а2 = (v, и2\ ... , am = (v, ~ит). (6) Кроме того, min (w, w) = (7, 7) — {«7, ~и^У +-----h (<v, М)2}. (7) Доказательство. Имеем (w, w) — (v — ащ{, V— Л ад)== i=i z=i = <.V, а) + S az <«z. «/> — 2 2 а, ("и, ~и{) + 1=1 i~ I + 2 J] aras (ur, ~us) = (v, ~v) + £ a{ — 2 £ = (r<s) „ 1=1 1=1 x tn tn > = <V, V) + X (at — az)2 — S a®, a{ = ( v, u{). i=\ t=l Следовательно, —> —> ) > m y y min(u>, w) = {v, v)— S((f» M(-»2 z=i —>- —> и достигается при at- = = (v, ut). Кроме того, (w, ur) = (v-— S ur) =(v, ur) — ar=0. г=1 Исходя из геометрических соображений, сформулируем теорему следующим образом: расстояние между концом вектора v в п-мерном евклидовом пространстве Еп и точ- ками т-мерного подпространства пространства Еп — 24
концами векторов а1и1 + а2и2 + • • • + атит, где последо- вательность векторов ult u2, ... , ит ортонормирована, становится минимальным для той точки подпростран- ства, которая находится как конец вектора, являющегося суммой векторов-проекций о на направления векторов ии и2, . • • j ат. Замечание. Слова «линейно независимых», заключенные в скобки в условии теоремы, можно опустить. В самом деле, пусть векторы —> —> ult и2, . . . , ит взаимно ортогональны и пусть ^iui + A2w2 + . . . + Ктит — 0. (8) Умножив последнее равенство на ult получим (Mi, и1) + ^2 (м2> Mi) + • • • + ^т <ит, — 0. Отсюда —► —> Zzj иjу == 0. ——► - >* Но (ulf = | и± |2 =И= 0, поэтому — 0. Точно так же можно пока- зать, что К2 = ... = Zm = 0. Итак, равенство (8) возможно только при условии = Х2 =...= Кщ = 0. Следовательно, векторы ult. и2, . .. , ит линейно независимы. Упражнения 1. Докажите, что угол а между двумя плоскостями А^х + В}У + C1Z -(-* Dy ='0, А2х + В2у + C2z + D2 = 0 (1) определяется формулой (2) Кл;+л;+4/«;+в;+«; - 2. Докажите, что для того чтобы плоскости (1) были перпендику- лярными (параллельными), необходимо и достаточно выполнение усло- вия AiA2 + В±В2 + СгС2 = 0 (4^ ~ F"1 = ^) • Чем объяснить, что хДз ^2 ь2/ в приведенных условиях и в формуле (2) отсутствуют Dlt D2? 3. Сформулируйте две еадачи, подобные задачам 1 и 2 для двух прямых на плоскости. 4. Докажите, что система уравнений (сколько их ?) x — Xq у —у о = Z — Zq I т п. 25
определяет прямую в пространстве. Каков смысл каждого ив урав- нений системы? 5. Докажите, что квадрат площади параллелограма, построенного —► —> на векторах a (alt а2, а3), b Ь2, Ь3) как на сторонах, равен (агЬ2 — — a2^i)2 + («1^з — °з^1)2 + (й2^з — о3&2)2- Укажите Геометрический смысл тождества Лагранжа. 6. Пусть (щ, ~uk) = J 7= + ... + а~ит. Докажите, что сц — (и, щ), 1=1, 2, ... , т. 7. Назовем векторным произведением векторов а (а19 а2, а3), —> —> ^(bi, Ь2, Ь3) вектор с (а2Ь3 —а3Ь2, а3Ьг — а^, а1Ь2’—а2Ь1). Докажи- те, что этот вектор перпендикулярен к плоскости .перемножаемых —► векторов и что длина вектора с численно равна площади параллело- —> — грама, построенного на векторах а, Ь. Векторное произведение обоз- —► —>• —> —>- —>- начают двумя способами: а X Ь, [а, д]. Докажите, что [а, 6] = —> —> = - [*, а]. —>- 8, Примените процесс Сонина — Шмидта к векторам а (аи О, 0), —>• —>- £(&i, 62, 0), с (clt с2, с3). Объясните результат геометрически и обоб- щите его на четырехмерное пространство. 9. Даны три вектора: i (1, 0, 0), /*(0, 1, 0), & (0, 0, 1). Вычислите —> —>- —> —> —> —> i X /, / X k , k х i.' 10. Векторно-скалярным или смешанным произведением трех век- —> —> —> торов а, Ь, св трехмерном пространстве называется произведение ~а • (Ь Х~с) = (а, Тх~с). Докажите о точностью до знака, что (a, b X с) равно объему парал- —>- —> —> лелепипеда, построенного на векторах а, Ь9 с как на ребрах. —> 11. (a, b X с) = 0. Что можно сказать о расположении векторов —> —>• -а9 Ь, с ? 12. Пусть с = а — Ь. Вычислите (с, с) и выясните геометрический смысл полученного результата. —> 13. Примените процесс Сонина — Шмидта к векторам а (1, —1, 2), b (—1, 2, ~1), с(—1» 7, 4). Укажите геометрический смысл резуль- тата. 14. Векторы at bt с взаимно'перпендикулярны и образуют с ося- ми координат соответственно углы аь а2 а3; 0Ь ра р3; у2, у3. Докажите, что: cos2ax + cos2aa + eos2a3 == 1, cos2^ + cos2p2 + cos2pg = 1, 126
cos2 Yi + cos2y2 + COS2 Уз == 1; cosotjCosPi + cosa2cosp2 + cosa3cosp3 == 0, cosoCiCosy! + cosa2cosy2 + cosa3cosY3 = 0, cos Pi cos 7i + cos p2 cus y2 + cos p3 cos y3 = 0. 15. Произведение a x (b X c) = [a, [6, cj] называется векторно- —> векторным или двойным векторным произведением. Вычислите а X —► —> —>- —► —► X (b X с), если даны векторы а (1, 0, 0), b (0, 1, 0) с (0, 0, 1). ГЛАВА h ПОСЛЕДОВАТЕЛЬНОСТИ ОРТОНОРМИРОВАННЫЕ НА КОНЕЧНОМ МНОЖЕСТВЕ § 1. Общие замечания. В предыдущей главе (см. § 4} рассматривались векторы а(аг, а2, . . . , ап). Для них были определен. действия сложения и умножения на число и от- мечены свойства этих действий. Заметим, что возможны —>- множества объектов, отличных от а(аъ а2, ... , ап), для которых таким же образом определяются действия сложения и умножения на число, причем сохраняются основные свой- ства этих действий, перечисленные в гл. I, § 4. Рассмотрим пример. Пусть' дана совокупность Е всех четных функций с общей областью определения —1 с х с < 1. Слова «сумма»,'«умножение на число» будем понимать в том смысле, что, если значениям функций ср (х), ф(х) в точке х = а соответствуют значения ср (а), ф(а), то зна- чению ср (х) + ф (х) соответствует значение ср (а) + ф (а),, а значением функции аср (х) является яср (а). Поскольку чет- ность означает, что Е состоит из функций, удовлетворяй^ щих условию /(х) = /(—х), то четными будут и функции ср(х) + ф(х), аср(х). Следова- тельно, применяя действия сложения и умножения на числа к четным функциям из £, получим функции из того же Е. Очевидно, имеют место свойства: В + + 2) (/ (х) + ф (х)) + 1|5 (х) = / (х) + (ф (х) 4-(х)); 3) A(f W + ф W) = V W + И (х), l(k + и) f (х) = Kf (х) + и/ (х); 4) ХИ/(х)=Х(ИЦх)) = И(Х/(х)), которые аналогичны свойствам, рассмотренном в гл. I, § 4 27
В главе I было введено определение скалярного произ- ведения двух векторов, указаны свойства скалярного произ- ведения, а затем установлены некоторые результаты. При этом не использовалось непосредственно определение скаляр- ного произведения, а лишь свойства этого произведения. Отсюда следует: если для некоторых величин введены по- нятия сложения, умножения на число и понятие ска- лярного произведения так, что сохраняются свойства этих действий, установленные для векторов, то можно авто- матически распространить на рассмотренные величины те понятия, рассуждения и результаты, которые были приведены в главе I. Пример 1. Рассмотрим множество всех бесконечных числовых последовательностей {пх, а2, . . . , ап, . . .}, обладающих свойством: п для каждой последовательности существует lim V а2.. (Тогда для каждых двух последовательностей a — {a^, ... ап, . . b = ... п bn, . ...} существует lim У а^. Это следует из неравенства Ко- z==1 <ши — Буняковского и теории пределов). Если принять, что а + b = {ах 4- blt а2 + Ь2, .. . , ап + Ьп, . . Ха = {Zalt Ха2, .. . , Хап, .. п (a, b) — lim V aibi, п^°° i=i . то установленные для векторов в п-мерном пространстве свойства сложения, умножения на скаляр и скалярного произведения сохранятся. Например, Х(а, b) = X lim afc = lim А у a^=lim £ = П-+-оо П-+оо = lim У (Xai) bi = (Ха, b), п-ж i=l но чтобы можно было обобщить и понятие о длине вектора, мы пред- п положили существование предела lim V а2, который и будем считать п->оо .=1 1 квадратом длины. -ч Пример 2. Рассмотрим множество всех непрерывных на отрезке [а, 6] функций. Свойство непрерывности функции f (х) при х = а можно опреде- лить равенством lim / (х) = f (а). х-+а 28
Поэтому, если определить сложение двух функций и умножение на число, как это было сделано в начале параграфа для четных функций, то снова будут выполняться все свойства сложения и умножения на число. Напомним, что функция непрерывна на интервале (отрезке), если она непрерывна в каждой точке интервала (отрезка).. Каждой непрерывной функции f (х) соответствует некоторое чис- ь ло — ее определенный интеграл J f (х) dx (или площадь фигуры, огра- а ниченной кривой у = f (х) и прямыми х= а, х — Ь, у — 0, при уело, вии, что площадь, соответствующая участку кривой, лежащей под осью Ох, взята со знаком минус). Эти интегралы (площади) обладают следующими свойствами: ь ь ь J (/ (х) + ф (х)) dx-= J f (х) dx+ J qf(x)dx, (1) a a a ft b J cf (x) dx — c J f (x) dx, c — число. (2) a a Определим скалярное произведение формулой ь (f (x), ф (X)) = J f (x) <p (x) dx. (3) a Тогда, используя свойства (1), (2), легко доказать, что: 1) </ (х), ф (*)> = < ф(х), f W); 2) (f (X), ф(х)+ф(х)) = (/(х), Ф(х)) + </(х), ф(х)>; 3) МГ(х), ф(х))=(Щх), Ф(х)) = (£(х), Хф (х)>. Например, ь (f (х), ф (X) + ф (X)) = р (х) (ф (х) + ф (х)) dx = а b Ь У / (х) Ф (х) dx + J f (х) ф (х) dx = (f (х), Ф (х)) + (/ (х), ф (х)>. а а Заметим также, что: ь 4) <g (х), g (X)) = J g2 (x) dx > 0; 5) (g (x), g (x)) = 0 (x) = 0. § 2. Ортонормированные последовательности функций, заданных на конечном числовом множестве. Определение. Если для последовательности (конечной или бесконечной) функций /2(х), ... с общей об- 29
ластью определения введено скалярное произведение, то последовательност ь называется о ртоно р ми ров ан- ной при выполнении условий (Д(х), AW) = O» r#=s (ортогональность), (4) </>(х), [ц (х)> == 1 (нормированность). (5) Нормой функции называется l|f,(*)ll = K</,(x). что аналогично длине вектора. Полезно заметить, что если условие (5) не выполнено, то, положив Фг = II /г « II ’ получим <4>г (х), <рг (х)> = <^н £ [J Ц, Ц £ = ||/r (х) н X Х II /г W II L Таким образом, нормирование по формуле (6) дает возмож ность весьма просто, не нарушая ортогональности, заменить ненормированную- последовательность нормированной. Нас, главным образом, будут интересовать последова- тельности функций, заданных на некотором конечном мно- жестве значений аргумента. Это связано с тем, что на прак- тике очень часто встречаются функции, заданные графически, и ряд значений функции находим по графику, или функции значения которых находим с помощью непосредственных измерений. Иногда функция задана так, что в принципе можно вычислить (или измерить) значения функции для любого значения аргумента, но в этом нет необходимости или это чрезмерно сложно (а то и дорого), и поэтому на- ходим только несколько значений функции. Возьмем последовательность <Р1(Д, ф2(х), ... , <рт (х) ... функций, заданных на конечном множестве {лД"=1 значений аргумента, т. е. пусть задана такая таблица: <Р1 (Х1), ф, (х2), ... , фх (х„), Ч>2(*1). ...» ф2(х„), 30
Поскольку каждую строку этой таблицы можно рассматри- вать как вектор в п-мерном евклидовом пространстве, то естественно определить обычным способом сумму срг (%) + + <Ps (*), произведение Хфг (х) и ввести скалярное произведе- ние по формуле <фг (х), Фе (х)> = S фг (х<) фз (xz), 1=1 а норму — по формуле II Фг (X) || = К<фг(х), ф,(х)). Тогда условие ортонормированности выразится формулой " (0, r=£s, L <Рг (X,) Фз (х<) = г=1 (1, г = S. Пример 1. Пусть Ф1 (х) = -+=-, Фа (х) =—Z—/х2 — 1? дА при /14 /266 \ 7 ) х = 0, 1, 2, 3. Покажем, что имеет место ортонормированность. Имеем <’«. Т, т - »«+(> (1 - ’/) + 2 (< -- + 4- 3 /9 — I? . з\\ = _ 7 . 7 — 18 + 56 — 72+ 189- 162 =0 7 }) /П . /266 ~ 7 ’ <Ф1(х). ф1(х)> = Т (0 -0+1 • 1+2-2 + 3.3) = 1, , 49 I 121 64 81\ , <ф2<х), ф2 W> = 266^° • °+ 49 +49+49) = L Таким образом, ортонормированность имеет место. Пример 2. Пусть фх (х) = cos х, ф2 (х) = sin х при х = 0, /2 Л -ГТ 2 ’ ’ Имеем <Ф1(х), ф2(х))= ’ .0 + 0.1+/—.0, /2 \ /2/ <Ф1 (х), Ф1 W) = <ф« (х), ф2 (х)> = 1. § 3. Две ортонормированные последовательности три- гонометрических функций. 1. Рассмотрим последовательность функций 1, cosx, sinx, cos2x, sin2x.....cosmx, sinmx, ... (1) 31
на множестве^, .....2^н=Т]и докажем что <1, cosrx) = (l, sinrx> —0. (2) Проще всего это сделать на основании формулы Эйлера1 и ее следствия: cos а +1 sin а = е{а, e2in = 1 (i2 = —1). (3) Действительно, на основании формул (3) получаем <1, cos гх) 4-/(1, sinrx) = (1 4- cos2/;4-"i nr + + COS2TT1 ПГ + • • • + C0S 2^1 nr) + l’ (Sin '2TTT nr + + Sin2^nnr+ ••• +Sin2^Tinr) = = 1 4~ e' 2n+* * 4- e 2n+1 "r 4- ... 4* e 2”+( = 4rc-p2 J ПГ 1— pl 2л 1 -c 1 -- c - - l_/2MTnr i-e£^nT Тем самым равенства (2) доказаны. Их можно также доказать, используя известные формулы тригонометрии. В самом деле, 2sin 2ЯП ЯГ(1 + COS2TT1 ПГ + C0S ЛГ + • • • + । — 2 । 4п \ о . 2 . + COS2T+1 ПГ + C0S 2МЙ ПГ) = 2sm 2^ ПГ + +sin 2ЯП nr + (sin 2TTi лг “sin 2^Т1лг) + . ( . 8 .4 \ , , ( . 4п + {sin2^nr-sm^+inr}+ +18Шет1лг- . 4л — 4 \ . 4/г + 2 . 4п — 2 \ - Sln 2^+1 Я/7 + lSin 2TTI пг - S,n 2^+1 = = sin б-Д—г + sin 0 , пг 4- sin 2пг = 2/i4-i 1 2л 4-1 1 1 Эйлер Л. П. (1707—1783)—великий математик, академик Пе* • тербургской академии цаук. Доказательство формулы Эйлера можно найти во многих учеб- никах по курсу высшей математики, а также в книге: Д р и н- фельд Г. И. Квадратура круга и трансцендентность числа л. К.з Вища школа. Головное изд-во, 1976. 84 с. 32
о . 2n — 1 = 2 Sin nr • cos 2^7]nr = 0. Следовательно, <1, cosrx) = 0. Аналогично доказывается второе из равенств (2). Используя равенства (2), получаем (cosrx, cossx) = (sinrx, sinsx) = 0, (cosrx, sinsx) = 0. (4) 2k Действительно, обозначая = x*> 2n 2n (cosrx, COSSX) = COSrXtCOSSXt = j cos(r+s)x/ + /=0 . /=0 2n' +4 Sc°s(r—s)xt = 4<1> c°s(r+s)-’0+ t=0 + 4<!> cos (r — s)x) = 0. Аналогично доказываются и остальные из равенств (4). На- конец, найдем (1, 1 > = 2п-j- 1, (cosmx, cosmx) = =<sinmx, smmx) =—. (5) Действительно, первое из равенств (5) очевидно (множе- ство состоит из 2п + 1 чисел). Второе и третье следуют из равенств (2), так как (cosmx, cosmx) == (1, cos2mx)=<^l, y+~cos2mxy> = = \l> •2/+2'<1' cos2mx> =(1, 1> = —c Равенства (2), (4), (5) означают, что на множестве |о, > 4jt 4/iJT ) 2^ j, ... , gn'qri J последовательность V2n + Г ’ V^2n:+~1COSX’ )/<2n+“lsinX........... VC0S/7lX’ V2^п Sin тХ> • • • — ортонормирована. 2 4-664 33
2. Точно так же доказывается ортонормированность по- следовательности cos х, sin х, j/* ~ cos 2х, ... , |/"-^-cosmx, — sinтх, ... (2л 4л 2л п ] на множестве , ... , — п ~ 2п \. { п п п ) §4. Примеры применения процесса Сонина — Шмидта. Изложенный в гл. I, § 8, процесс Сонина — Шмидта вполне применим к последовательности функций на множестве {хх, х2, ... , х„}, поскольку в § 8 мы пользовались только свой- ствами скалярного произведения. Для рассматриваемой после- довательности функций необходимо только ввести скалярное произведение так, чтобы сохранились нужные свойства. Это было сделано в § 2, положив <фг(х), <Ps(x)) = S <Pr(xz)q>s (xt). <=1 Итак, не будем здесь излагать метод Сонина — Шмидта, а перейдем к рассмотрению примеров. Пример 1. Найти три многочлена ф0 (х), Ф1 (х), Ф2 (х) степеней соответственно 0, 1, 2 так, чтобы они образовали ортонормированную систему на множестве {0, 1, 2, 3}. Для решения задачи достаточно применить процесс ортонормиро- вания Сонина — Шмидта к простейшим многочленам 1, х, х2. Получим: ° фо (Х) = /<тт> = /1 + 14-1 + 1 = 0,5: 2) и± (х) = х — <^х, Фо (х) = х — 1,5, . Фх (х) = ___? J(х — 1,5); /2,25 + 0,25+ 0,25 + 2,25 /5 3) «2(х)=х»-/х\1^.5\2=(х-1>5)-/х2, 0>х * i - - (<«’ *> - <+ I» -1 = «*- 3«+ + 1. у2___ Зх -J- 1 1 ф2 (X) = -т— , • - = 1 (х2 — Зх + 1). /1+ 1 + 1 + 1 2' Приведенный пример должен был напомнить процесс Сонина — Шмидта и дать некоторое представление об объеме вычислений. На- значение следующего примера другое. 34
Пример 2. Найти три многочлена степеней 0, 1,2, которые обра- вуют ортонормированную систему на множестве {1, 2}. Применим метод Сонина — Шмидта к многочленам 1, х, х2. Имеем: 11w = гтТТ = / I \ 1 3 2)“>W= —= 3 * 2 г_[ з\ Г 4 + 4 3) U2(x) = x2-/^, -V2[x- й>- гг'’-20+8^НМН(1+4,_‘1_ — Зх + 2. Но и2 (х) уже нельзя нормировать, так как (и2 (х), и2 (х)) = 0 ибо и2 (1) = и2 (2) = 0. Это не случайно, поскольку фактически применили —>• > процесс Сонина — Шмидта к векторам а (I, 1), 6(1, 2), с(1, 4), среди которых только два первых линейно независимы (больше и не могло быть, так как пространство двумерное). И в самом деле с = 3 b — 2 а. Процесс Сонина — Шмидта должен был прерваться, ведь он пред- полагает линейно независимыми данные векторы. § 5. Коэффициенты Эйлера — Фурье1, свойство миниму- ма. Повторим то, что было изложено в гл. 1, § И, но для случая, когда векторы порождены функциями, заданными на некотором конечном множестве. Пусть последовательность (%), <р2 (х), ... , (рт (х) орто- нормирована на множестве {х^ х2, ... , хп}, т^п. Коэф- фициентами Эйлера — Фурье функции /(х), заданной на том же множестве, назовем числа п «»• = </w, («*)• (]) k— 1 Частично роль этих коэффициентов выясняется утвержде- нием: 1 Фурье Ж. (1768—1830) — французский математик. 2* 35
Теорема 1. Пусть на множестве {х1э х2, ... , хп} справедливо равенство f (х) — ^41Ф1 (х) + Д2ф2 W Н~ ” •'4'пФ'п (*•)• (2) Тогда Л = </(х), фг(х)> = ar, г = 1, 2, ...» т. Действительно, имеем </(х), фг(х)> = Д1(ф1(х), фг(*)) + “Ь 2 (4*2 (•*)> 4PrW)4" ~Ь Ат (фт (х), фг (X)). Поскольку (О, r=H=s, <фв(х), фг(х)) = . \ 1 » —— о, то </(*), фг(х)) = Дг. Особо важна следующая теорема. Теорема 2 (свойство минимума коэффици- ентов Эйлера — Фурье). Пусть последовательность <Р1(х), ф2(х), • • • » ф™(*) ортонормирована на множестве {Xi, х2, • • • » Величина = — Л,ф,(х), f(x) — S Лфг(х)) = г=1 г=1 = 2 лгФг(х)]2 О) " 1=1 г=\ принимает минимальное значение тогда и только тогда, когда Л =аг = </(%), фг(х)>. Действительно, « = /(*)) + £ Л?(фг(х), фг(х)> — Г=1 — 2 £ Л</(х), фг(х)) + 2 ДгД5(фг(х), ф8(х)). г=1 r=#s Поскольку <фг(х), ф,(х)>= 1, (фг(х) Фз(х)) = 0, г#=8; </W, фг(х))=аг, то = (/(X), /(X)) + S А2е - 2 2 Ага, = Г=1 г«=1 36 f
т т — ZW> + S Mr — «г)2 — S “?• r—I r=l Очевидно, Rm будет минимальным тогда и только тогда, когда выполняется условие т s (Л-аг)2 = 0, Г=1 эквивалентное условиям — аг, г = 1, 2, ... , т. Теорема доказана. Замечание 1. Минимальное значение И?т равно т п P2m=<f(x, /(х)>-£ рХ{- Г=1 1=1 т п -S (£ /М)ФГЦ-))2- (4) Г=1 1=1 Замечание 2. Очевидно, при любых Ar > 0. Следовательно, и pj, > 0. Поэтому т п S а?<</(х)Л(х)>=2 Г=1 1=1 Это неравенство Бесселя1. Замечание 3. Выражение (3) (пренебрегая отсутствием множителя -Ц естественно назвать квадратом среднего квадратического от» п / клонения величины А(х) + Л2<р2 (х) + •• • + Ащ^т (х) от f (х) на множестве {хь х2, .. . , хл}. Поэтому теорему 2 можно сформулиро- вать и так: среднее квадратическое отклонение линейной комбина» т ции 4гфг (х) от f (х), в случае когда последовательность ср1(х), Г=1 <р2(х), ... ортонор миров ана на множестве {хь х2, ... , хп}, мини- мально тогда и только тогда, когда в качестве коэффициентов Аг взяты коэффициенты Эйлера — Фурье. Слова «среднее квадратичес- кое отклонение» можно заменить словами «средняя квадратическая погрешность». Замечание 4. Вообще то, средним квадратическим отклонением ве- личины и (х) от о (х) на {хр х2, . . . , хп} называют число о =1 / 1 [V (Х{) - и (х,.)р . 1 Бессель Ф. В. (1784—1846) — немецкий математик и астроном. 37
Тогда, совершенно очевидно, о содержится между наименьшей и наи- большей из величин | v —и (xz)|, чем и оправдывается слово «сред- нее» . Замечание 5. П. Л. Чебышев 1 доказал одно важное неравенство в теории вероятностей. Арифметическая трактовка этого неравенства такова: пусть о — среднее квадратическое чисел Дь Д2, . . . , Дт, т. е. g _,/~Д1 + А2+---+дД У т т Тогда число k величин Д., больших о/, меньше чем Предположим, что первые k величин Az больше о/. Тогда имеем -1 /~Д? + • • • + Д% о2/2 4- _ У т V т ~~ = О/ ]/ - • (5) г т Значит, О2 > а2/2 A k < ™ т /2 Например, величин Дг«, больших Зо, всегда меньше ~. Если учесть, что неравенства (5) получены с «запасом», то можно быть вполне уверенным, что величин Д^ больших Зо, меньше 10%. Все сказанное убеждает в том, что^ среднее квадрати- ческое может служить одной из важных характеристик приближений (измерений). Следует отметить, что задача о минимизации величины R2m получила геометрическую трактовку (см. гл. I, § 11). § 6. Тригонометрическое интерполирование по способу наименьших квадратов. Рассмотрим частный случай изло- женной выше (см. § .5, теорема 2) задачи, -поскольку она широко применяется на практике. Пусть заданы значения функции f (х) для значений ар- гумента = 2л. Требуется найти коэф- фициенты Ло Bi так, чтобы приближенная формула / (%) « (Лх cosx + В± sin х) + (Л2 cos 2х + В2 sin 2х) + + ••• + (Ат cosmx + Вт sinтх) (I) 1 Чебышев П. Л. (1821—1894) — академик, основатель Петер- бургской математической школы. 38
была наилучшей в том смысле, что минимальным является среднее квадратическое отклонение левой части формулы {9тг Дтт Отт I —, — /г]. Поскольку на рассматриваемом множестве последова- тельность функций j/^cosx, ^-^-sinx, ^/"-^-cos2x, sin 2х, ... • * ’ ’ cos mx’ ]/" л" s’n mx ортонормирована (см. § 3), то квадрат среднего квадрати- ческого отклонения п т ХПГг/2лг\ VI (а । d • 2лА12 1И W -1 cos - + в'я" 1=1 Л=1 будет минимальным, если Д Y и Bi ]/ у бу ут коэф- фициентами Эйлера— Фурье функции /(х) относительно функций (2), т. е. если п л if п V £ (2лА T Г 2 2лг AlV У = ЮTcos-’ 1=1 п п if п V £ /2лА т /”2" . 2л/ BlV Т = Vsin- 1=1 или, что то же самое, п А 2 г (2л1\ 2лг Ai = — 7 , f\ — cos — , п 4-1 1 \ п I п 1=1 п d 2 VI £ /2лА . 2лг /оч В/ = — 7 , / — sin — . (3) п 4-1' \ п / п v 7 i=i Приближенной формулой (1) с коэффициентами (3) мож- но пользоваться при вычислении значений, принимаемых Функцией f(x) для значений х, отличных от (I — 1, 2, ...» п), но содержащихся на отрезке |0, 2л]. Формулу (I) назовем интерполирующей по способу наименьших 39
квадратов, а значения аргумента —------узлами интерпо- лирования. Точность приближения характеризуется средним квадра- тическим отклонением, равным (см. § 5, равенство (4)) п п 1=1 1=1 Замечание 1. Совершенно так же можно рассмотреть случай за- . . . . L 2я 4л 4яи ) Дания функции / (х) на множестве 40, —:—? , . . . , х—— ? ( 2п + 1 1 2п + 1 2n + 1J и функций V 2п+Г/2’ ' 2л + 1 C0S V 2n+lSinX’ “• ••• /2ЯПсозтх> /4-, ортонормированность-которых доказана ранее (см. §3). Замечание 2. Тригонометрическое интерполирование по способу наименьших квадратов в случае неравностоящих узлов практически не приводит к столь простым (в записи) формулам, как формулы (3), хотя вычисления по формулам (3) тоже громоздки (если не пользо- ваться электронными вычислительными машинами). Формулы (3) рекомендуем запомнить. ь §7. Обобщения. Под символом как указыва- а лось в § 1, можно понимать площадь фигуры,ограничен- ной отрезком [a, bj оси аб- сцисс, прямыми х = а, х = b и кривой у = f (х), но припи- сывать знак минус той ча- сти площади, которая на- ходится под осью абсцисс. Так, для фигуры, изображенной на рис. 13, получим ь J f (х) dx = S± — S2 + S3 — S4 + S6. Кривая у = f(x) предполагается непрерывной. На практике часто применяют следующие свойства оп- ределенного интеграла:, b . b ь J (/ (*) + ф V)) dx = J f № dx + J ф W dx> (О а а а 40
b b § (cf (x)) dx = c J f (x) dx, c — постоянная, a a которые легко доказываются в интегральном исчислении, а геометрически достаточно очевидны. Введем обозначение ъ (/(*), Ф (*)> = 5 Р W f (х) ф (х) dx, а где р (х) — положительная функция, называемая весом. На Основании свойств (1) имеем <f(x), ф(х)> =(ф(х), f (х)), </(х), ф(х) 4-ф(х)> = </(х), ф(х)> + (/(х), ф(х)>, b(f(x), ф(х)> = (Х/(х), ф(х)> = (/(х), %ф(х)>. Это означает, что </(х), ф(х)) обладает известными нам свойствами скалярного произведения. Назовем </(х), ф(х)> скалярным произведением функций f (х) и ф (х) с весом р (х). Заметим также, что </(х), /(х))^=0, </(х), f(x)} = 0** **/(х) = 0. Число 6 1 v<f(x), /(х)> = {J р (х) /2 (х) dx}2 а назовем нормой функции f(x) и обозначим ||/(х)||. По- скольку легко можно доказать неравенство Коши — Буня- ковского b b ь IJ р (х) f (х) ф (х) dx |2< У р (х) Р (х) dx + J р (х) ф2 (х) dx, а а а то, аналогично доказательству для случая пространства Ев- клида (см. гл. I, § 3), можно доказать неравенство тре- угольника ||/(X) + ф(х)|| < ||/(х)|| + ||ф(х)||. Последовательность функций Фг(х), ф2(х), ... , ф„(х)... заданных на отрезке [а, &], назовем орпгонормированной относительно веса р(х), р(х) > 0, на [а, 6], если <фг(х),ф$(Х)> = [1 f = s 41
Возможность применения процесса Сонина — Шмидта очевидна. Ортонормирование последовательности 1, х, х2, ... , в зависимости от выбора a, Ь, /?(х), приводит к тем или иным классическим многочленам. Приведем примеры (ортогональ- ность сохранена). 1. Полиномы Чебышева: а = —1, b = 1, р(х) = 1 То(х)=1, 7\ (х) = х, Т2(х) = 2х2 — 1, Т3 (х) =4х3 — Зх, Т4(х) = 8х4 —8х2+ 1, Полиномы Чебышева играют большую роль в некото- рых раздеддх математики и ее приложений, они обладают многими важными свойствами. Приведем некоторые из них: а) Тп (х) = cos (п arccosx); б) Tk (х) = 2хТ^ (х) - Tk~2 (х), k = 2, 3, ... ; в) -ДуД =Т0 (х)+Л (х) t+T2 (х) /2+ ... +Тк[х)Х Xtk+ •••• 2. Полиномы Лежандра1: а — —1, b—1, р(х) = I Х0(х) = 1, Хх (х) = х, Х2(х) = |(Зх2-1), Х3 (х) = у (5х® — Зх), Упражнения 1. Пусть на {xlf х2, ... , хп} функции <р (х), ф(х) ортогональны. Докажите, что хотя бы при одном i ф (xz), ф (xL-) имеют разные знаки. 2. Пусть функции 1, <Pi(x), Ф2 (х), . .. , фт (х) — ортогональны на {хп х2, .. . , хп} и непрерывны на отрезке, содержащем хь х2, . . . . .. , хп. Докажите, что для каждой функции фг (х) найдутся среди 1 Лежандр А. М. (1752—1833) — французский математик? 4:
заданных значений аргумента два соседних значения х., х^ таких, что фг (х cpr <0- Сделайте рисунок. 3. Пусть p(x)J>0 на множестве {хх, х2, , хп) и фг (х), <р2 (х), . . . , фт (х) заданы на этом множестве. Проверьте, можно ли определить скалярное произведение формулой п <фг (X), <Ps (х)) = S Р (х{) Фе (xt) <ps (Х{), (1). 1=1 сохранив нужные свойства скалярного произведения (функцию р (х) называют весом). 4. Назовем ф^ (х), ф^ (х) ортонормированиями на {xj ", относи- тельно веса р (х), р(х)>0, на {х^}", если при определении (1), упражнение 3. Сформулируйте определение коэф- - « минимума, получите фициентов Эйлера — Фурье, докажите свойства неравенство Бесселя. 5. о L 1 1 ц На множестве < 0, » -у t — г заданы V. О о 2 ) функции 1, sin лх, Выполните ортонормирование. cos лх. Выполните ортонормирование. 6. Найдите коэффициенты Эйлера — Фурье L 1 1 1 1 sin лх, заданной на множестве <0, —» ——г, для алгебраических о о 2 ) «о» а1» а2 функции многочленов ф0 (х), Ф1 (х), ф2 (х) степеней 0, 1,2, ортонормированных на этом множестве. Вычислите среднее квадратическое отклонение sin лх от аоФо (х) + Я1Ф1 (X) + а2ф2 (х). 7. Докажите, что полином Чебышева Тп (х) имеет п различных действительных корней л Зл 5л 2п — 1 2n 2n 2n 2n 8. Найдите Тъ (x), Te(x), T, (x). 9. На одном рисунке постройте графики То (х), 7\(х), Т2(х), Т8(х). Обратите внимание на расположение точек пересечения этих графиков с осью абсцисс. 10. На одном рисунке постройте графики полиномов Лежандра Х0(х), Х^х), Ха (х),.Х3 (х). 11. Докажите второе из равенств (2), § 3. 12. Докажите ортонормированность последовательности, указанной в конце § 3. 43
13. Воспользовавшись интегралом ь J р (x)(kf (х) + <р (х))2 dx, а докажите неравенство Коши — Буняковского: | У Р (х) / (х) <р (х) dx I < р (х) /2(х) </х| 2 |J р (х) <р2(х) dx] 2 , а а а ГЛАВА III ЭЛЕМЕНТЫ ГАРМОНИЧЕСКОГО АНАЛИЗА И ТРИГОНОМЕТРИЧЕСКОЕ ИНТЕРПОЛИРОВАНИЕ § 1. Гармоники, амплитуда, частота, начальная фаза* Выражения •Д cosx +sinx, *42cos2x + B2sin2x, Akcoskx + + Bk sin kx, ... *- называются соответственно гармониками 1,2, ... , &-го, ... порядков, или короче, первой, второй, ... , &-й гармониками. В приложениях удобнее записывать гармоники в другой форме, а именно: Ak cos kx + Bk sin kx = Rk sin (kx + Ф&). (1) Равенство (1) легко получить. Для этого определим фл из уравнений Ak • Bk ' у:-:— = SIH фь —. = COS ф. + VaI + bI (что возможно, так как выполняется условие sin2 ф& + + cos2 ф* = 1) и обозначим Тогда Ak cos kx + Bk sin kx = Rk (sin ф^ cos kx + cos ф^ sin kx) = = /?*5ш(Ь; + фД Выясним смысл величин Rk, k, ф^. Для этого прежде всего сравним график й-й гармоники со стандартной синусоидой.' Синусоида у = sinx хорошо известна (рис. 14, а). На от- резке [0, 2л] она пересекает ось абсцисс в точках 0, л, 2л; ее минимальная ордината равна —1, максимальная 4-1, появляются они по одному разу. Так как sin(x + 2n)^ — sinx, то вне отрезка [0, 2л] график получаем сдвигом 44
а д Рис. 14 показанной на рисунке кривой на 2л, 4л, ... , пл вправо и влево от начала. График функции у = Rk sin kx пересекает ось абсцисс на отрезке [0, 2л] в точках х = 0, ~ , ... л, М— л, ••• к k k ... , — = 2л, максимальная и минимальная ординаты по- являются по k раз, т. е. в k раз чаще, чем у стандартной синусоиды. Максимальная ордината теперь равна Rk, мини- мальная — Rk. График функции у = Rk sin kx на отрезке [О, 2л] имеет вид, указанный на рис. 14, б, С помощью сдвига можно получить график вне отрезка [0, 2л]. Наконец, чтобы построить график &-й гармоники у = = Rk sin (kx + (jpfc) достаточно сдвинуть кривую у = Rk sin kx вдоль оси Ох на q^ влево, если q^ > 0, или вправо, если ЧЧ<0. Если интерпретировать х как время, у — как отклоне- ние точки, движущейся вдоль Ох, от начала координат, то из рис. 14, а, б видим, что точка движется колеба- тельно— она отклоняется то вправо (на 1, на Rk), то влево (на —1, на —Rk) от положения, занятого в некоторый начальный момент. Если двигаясь по закону у = sin х точка за время 2л дважды возвращается в начальное положение (совершает одно колебание), то, двигаясь по закону у = — sin kx, точка за то же время 2л совершит k колебаний. Наконец, движение по закону у = 7?^sin (kx 4- q^) означает: наибольшее удаление от исходного положения Rk, число колебаний (частота) k, начало движения сдвинуто во вре- мени на q?fc (назад или вперед). Вполне естественна обще- принятая терминология: Rk — амплитуда, k — частота, q^— начальная фаза. С большой точностью описанное движение можно наблюдать, следя за маятником настенных часов или за движением груза, подвешенного на пружине к балке. § 2. Понятие о гармоническом анализе функций (ряд Фурье). Многие вопросы математики, электротехники, 45
механики и других прикладных наук приводят к следую- щей задаче: представить заданную периодическую, с пе- риодом 2л, функцию f(x) в виде f (х) = у + Hi cos х 4- Вг sin х) + (Л2 cos 2% + В2 sin 2х) + + •. • + (Ak cos kx + &k sin kx) + •. •, 0 < x < 2л, (1) m. e. требуется представить f (x) в виде суммы гармоник. Если число слагаемых в правой части (1) конечно, т. е. / W = у + (Al cos X + В{ sin х) +-F + (Ап cos nx + Bn sin nx), (2) mo f (x) — тригонометрический многочлен п-го порядка- Если число слагаемых в правой части (1) не конечно, Го говорят, что функция /(х) разложена в тригонометри- ческий ряд, а равенство (2) становится приближенным (тем более точным, чем больше п). В равенстве (2) коэффициенты Ak, Bk могут быть вы- числены по формулам Эйлера—Фурье 2л 2л Ло = J f(x)dx\ Ak = У f (х) cos kx dx, о о ! с” (3) Вк = — \ f (х) sin kxdx о (формула для Ао получается из формулы для Ак при k — 0. Для этого мы и писали в (2) не Ао, а . Для доказательства формул (3) достаточно воспользо- ваться элементарными равенствами 2л 2л 2л j 1 . dx = 2л, f cos£xdx=^ sin£xdx = 0, (4) обо 2л У cos fexsin mxdx= 0, о 2л f . , (0, k^= m, I cos kx cos tnx dx — < я £ _ m (5) 0 2л f . , . , (o, k^=m, I sin kxsm mxdx = { ’ h _ ' J JL, K> —— IIL. 0 46
Действительно, первую из формул (3) получим из равен- ства (2) на основании (4); остальные формулы (3) получим на основании (5), предварительно умножив (2) на cos kx (на sin&x). Формулы (4) легко получить, если читатель знаком с элементами интегрального исчисления. В против- ном случае следует обратиться к рис. 13 и вспомнить ъ (гл. П, § 7) связь интеграла J F(x)dx с площадью фигуры а (если F (х) = 1, то имеем прямоугольник). Формулы (5) — это следствия формул (4), так как, например, cos2 kx = ~ (1 + cos 2kx), cos kx cos mx = == у (cos (k + tn) k + cos (k — tri) x). Формулы (3) называются формулами Эйлера — Фурье- За редким исключением, если возможно разложение функ- ции f(x) в тригонометрический ряд, то обязательно коэф- фициентами ряда являются коэффициенты Эйлера—Фурье, вычисляемые по формулам (3). Тогда говорят, что функция разложена в ряд Фурье. Класс функций, которые можно разложить в ряд Фурье, очень широк. Достаточно, например, чтобы /(х) была непре- рывной. С точки зрения механики' разложение функции /(х), О < х с 2л, в тригонометрический ряд истолковывается так: х—время, /(х) — путь прямолинейно движущейся точки, пройденный за время х, разложение в ряд — представление о движении как о результате наложения (сложения) ко- лебаний. Приведем два примера, опустив Пример 1. Рассмотрим функцию, график которой изображен на рис. Это периодическая функция, сов- падающая с функцией у — х2 на от- резке [—л, л]. Разложение в ряд Фурье можно записать следующим ' образом: у2 __ л2 /cos х cos 2х j cos Зх ~ 3 I2 "~22” + ~32~ —л < X < л. Отсутствие синусов объясняется четностью функции (симметричностью графика относительно оси ординат). вычисления , У> • Рис. 15 C0S7ZX 47
Написанное разложение является основанием для приближенного равенства * л2 л / cos 2х , cos Зх\ х2 у — 4 l^cos х-------+ —у- j V) и более точных (это равенство дает грубое приближение). Пример 2. । । 2 sinx = — л 4 /cos 2х r cos 4х ( f cos 2тх "л \ Г- + ~Т5~~ 4m2 — 1 Замечание. Формулы (4), (5) означают, что последовательность функций 11 1 . 1,1., -—= -7Z.C0SX, -7= Sin X, . . . » —7=. COS л?Х, —= sin kx, . > . /2л /л /л Ул /л ортонормирована на отрезке [0, 2л], а числа 2л 2Л 2л 1 С 1 С 1 с --— I f (х\ dr I f (x) cos kx dx, I f (x) sin kx dx, /2л J ' W ' /л J /л J 0,0 0 k = 1, 2, ..,, являются коэффициентами Эйлера—Фурье. Тригонометрический многочлен (и ряд) мы получим в виде 2л 2л • (-р= f f (х) abA -7L7 + ( А=- f f W Cos x “7= cos x + \/2л J / /2л ‘ \/л J ) /л о 0 2Л 2л + (I f (x) sin x dx'j sin x + • • • + (—~ C f (x) cos kx dx\ x \У л J /Ул \У л J / о о 2Л X cos kx + | --= ( f (x) sin kx —Lr sin kx + • • • . • /л .) Yn 0 Но это и есть правая часть формул (1), (2), в которых At, В[ вычис- лены по формулам (3). Формулы (3) определяют, строго говоря, коэффициенты Эйлера— Фурье функции-А= / (х). Поэтому для разложения (1) с коэффициен- У л тами (3) выражение для среднего квадратического отклонения и нера- венство Бесселя имеют вид 2л 2 п рп=4 j/2(х)£/х-(т+Е(л-+5-))’ 0 т=1 п 2it т+£(4+^)<-Ц/2(хИх. т=1 Q 48
^Доказательство отличается от приведенного в гл. II, § 5, только тем, что знак меняется на J . < о § 3. О колебании струны. Задача о колебании струны— это одна из задач, решение которой привело к возникновению теории рядов Фурье (а также созданию гармонического анализа). .Рассмотрим эту задачу, не приводя доказательств и вычислений. Дадим только некоторое представление р возможности и характере применений гармонического анализа. ' Струной называется тонкая и свободно изгибающаяся нить, закрепленная в точках х = 0, х = л оси Ох, находя- щаяся в равновесии под действием сильного натяжения, д состоянии равновесия расположенная на оси Ох. Если В начальный момент времени (/ == 0) оттянуть струну и со- общить каждой ее точке некоторую скорость ф(х), то струна прийдет в движение. Предположим, что струна движется только в одной плоскости и точки струны дви- жутся перпендикулярно к Ох (внешняя сила пусть отсут- ствует). Ясно, что струна будет колебаться. Таким образом, имеем свободные (отсутствие внешней силы) поперечные (в одной плоскости) колебания. Точка струны, которая при равновесии находилась на оси Ох на расстоянии х от на- чала координат в момент I, будет отклонена от Ох на ве- личину и (/, х). Задача заключается в нахождении и изу- чении и (I, х). Сведения о форме оттянутой (при t = 0) струны и на- чальных скоростях составляют так называемые начальные /Условия: «(0, х) = ф (х), и' (0, х)=ф(х) (1) (штрих означает производную по времени /). То, что струна закреплена, дает так называемые граничные условия: и (t, 0) — 0, и (I, л) = 0. Сила натяжения и плотность струны влияют на то, чтс и (/, х) зависит еще от некоторой, постоянной относительно х, t величины, называемой параметром. Для простоты будем считать этот параметр равным единице. С помощью основ- ных законов механики можно составить уравнение, содер- жащее производные от u(t, х),— так называемое диффе- ренциальное уравнение. Решение этого уравнения с учетом начальных и граничных условий следующее: 49
uit, X} = 2(Л cos kt + Bk sin kt) sin kx, (2) где л л = -| j <p (y) sin kу dy, Bk = Д J ip («/) sin ky dy. (3) 0 0 Перепишем (2) в виде 00 и (t, х) = S (Rk sin kx) sin (kt 4- <pA), (4) &=1 где Rk sin kx — амплитуды,, ф/г — фазы. Формулу (4) можно истолковать так- отклонение (ко- лебание) струны и (t, х) является суммой отклонений ((Rk sin kx) sin (kt 4- фЛ))-гармоник. Первая из этих гармоник (у нее наибольшая амплитуда T^sinx и наименьшая час- тота &=1) определяет основной тон струны, остальные гармоники определяют обертоны. Так как числа Rk убы- вают достаточно быстро, то влияние обертонов особо ощу- щается только при малых k, остальные обертоны создают тембр звука. Дальнейший анализ решения (4), объясняющий почему музыкант прижимает струны пальцами, опускаем. § 4. Практический гармонический анализ. В приложе- ниях теории рядов Фурье часто приходится вычислять коэф- фициенты Эйлера—Фурье: 2тс 2 Л Ао = ~ § f (х) dx, Ak = ~ J f (х) cos kx dx, о о 2 тс Bk = J f (х) sin kx dx. о (1) Выполнить точно это вычисление удается очень редко. Дело в том, что чаще всего встречаются такие случаи: 1) f(x) слишком сложна; 2) f(x) задана графически (гра- фик f(x) изображает прибор, например осцилограф); 3) f(x) задана таблично (для некоторых значений аргумента х зна- чения f(x) найдены из наблюдений, с помощью измерений). Все указанные случаи приводят к одной и той же за- даче: приближенно вычислить коэффициенты Эйлера—Фурье. Это и есть задача практического гармонического анализа. 50
Уточним ее? Прежде всего будем полагать, что на отрезке (О, 2л] заданы значения аргумента х19 х2, ... , хп и соот- ветствующие значения функции f (хг), /(х2), ..., f(xn) (они вычисляются в случае 1), снимаются с графика в слу- чае 2), находятся с помощью измерений в случае 3)). Существует много формул и правил приближенного вычисления интегралов (1) (геометрически — площадей фи- гур)— простых и сложных, менее точных и очень точных. Чем же следует руководствоваться в выборе формулы или правила приближенного вычисления коэффициентов Эйлера—Фурье? Естественно принять следующий общий принцип: заменяя выражение некоторой величины приближенным выражением, последнее выбирают так, чтобы оно сохранило характерные свойства точной величины. Воспользуемся этим принципом. Интегралы (площади), как известно, обладают свойством линейности- ft ft ft J (F (x) -f- Ф (x)) dx = j F (x) dx + J Ф (x) dx, a a a b b J cF(x)dx — c J F (x) dx. a a Следовательно, надо сохранить это свойство, когда вычис- ь ляем интеграл j F (х) dx по значениям Е(хх), F(x2), ... а F (хп) функции F(х). Свойством линейности обладает также и сумма вида (*i) + «2^ (х2) + +anF (х„). Следовательно, надо искать приближенную формулу вида ft П § F(x)dx ~ £ a,-F (xt). a Z=1 Для коэффициентов (1) Эйлера—Фурье это означает л. =. 1 1=1 п п ~ л (xi) cos kxt> X sin kXi' />=1 1=1 51
Но коэффициенты Эйлера—Фурье обладают еще свойство^ минимума. Следуя принятому принципу, нужно взять для Ао, Alf Л2, ... , Amt Ви В2, , Вт те значения, при которых величина j S (f(Xi) — (ло+ S (Acos/?xz +BfeSin/exj))2 (3> t=l /г=1 : принимает минимальное значение. Задачу минимизации вы- ражения (3) мы. решаем для таких наборов значений xit, для которых функции 1, coskx, sinkx (k = 1, 2, , т) образуют ортонормированную систему. Если это так, то,- как известно (см. гл. II, § 5), выражение (2) принимает, минимальное значение, когда в качестве Ло, Ak> Bk (k = • = 1, 2, ... , tn) берем коэффициенты Эйлера—Фурье функ- ции f(x) на множестве х2, ...» хп} значений аргумента.? Функции 1, cosZjx, sin^x ортонормированы на мно-] 2л 4л 4пл 1 (2л 4л жествах ] 0, „——. , , ... , . L т — , — , ... ( 2/2 -|- 1 2/2 -|- 1 2/2 -|- 1J ( /2 /2 . 2л ) J (см. гл. II, § 3), если их соответственно ум-1 ножить на у gjj-p , У ~ . г-г £/2л\ г/4л\ Р/2л \ Пусть заданы значения / I — I, f I — I, .. . , f I • п I функции /(х). Тогда коэффициенты Эйлера—Фурье функции {2л ~п ’ 4л I . 1Л2~ < ! — , .. .| системы функции у — coskx, у — sin^x будут! иметь вид п п 1=1 1=1 j и поэтому окончательно получим, что выражение (3) мини- j мально, когда J л 2 Wf 1=1 л 2^1Р/2лА 2л? 1 D 2 V е/2л2Л . 2л/, ... nl^-JC0Sv^ Вк== й2Дт sm~*’ (4) i=i i=i 52
а так как полученные выражения имеют вид (2), то'все требования к выбору приближенных значений коэффициен- тов Эйлера—Фурье будут выполнены, если вычислим их по формулам (4), впервые указанным Бесселем. Легко выяснить геометрический смысл этих формул. Обозначим = xit f (х) cos kx = <Р (*), xz+1 — Xi = ~ = \x{. Тогда Ak запишется в виде n = (5> z=l Произведение <p (xz) Дх/ гео- метрически означает пло- щадь прямоугольника с ос- нованием Дх£. и высотой cp(xz). Таким образом, фор- мула (5) означает, что за- менена площадь фигуры, ограниченной линиями х = 0, х = 2л, у = 0, у — <р (х), сум- мой плоТцадей прямоугольников (рис. 16). В интегральном исчислении приближенная формула вида ъ п \ F(x)dx ~ '^,F (х{) а Г=1 является простейшей и называется формулой прямоуголь- ников. Замечание 1. Для простоты предполагаем, что имеем дело с от* резком [0, 2л]. Простые преобразования а + Ь п х — а о Х 2 х — 2л ----- , х± = 2л —------ (6) 1 Ь — а 1 Ь — а 1 ' переводят отрезок [а, Ь] в отрезки [0, 2л], [—л, л]. Замечание 2. До широкого распространения ЭВМ прямое приме- нение формул (4) было весьма нежелательным вследствие большого объема громоздких вычислений. По этойпричийе математиками и инже- нерами были разработаны приемы, облегчающие (в значительной мере автоматизирующие) вычисления. Создавались также приборы (гармони- ческие анализаторы), выполняющие гармонический анализ. Много при- емов практического гармонического анализа рассмотрено в книге Сереб- ренникова М. Г. Гармонический анализ (М., 1948). Вычисления по формулам (4) для ЭВМ не представляются слож- ными — программа проста и затрата машинного времени не велика. 53
§ 5. Тригонометрическое интерполирование. Задача три- гонометрического интерполирования формулируется следую- щим образом. Пусть известны значения функции /(х) в 2n + 1 точках х0, *хь х2, ...» х2п, требуется найти тригонометрический многочлен п-го порядка Тп (х) = Ао + (Лх cos х + Вг sin х) 4- • •• + (Ап cos пх + + Bnsinnx), (1) удовлетворяющий условиям тп (Xi) = f(Xi), i =0, 1...2n. (2) Предполагаем, что никакие два заданных значения xit Xj Tie отличаются на число, кратное 2л: %. — х/#=т’2л. (3) В самом деле, если условие (3) не выполнено, то (ввиду перио- дичности косинуса и синуса) Тп (xz) = Тп (X/), и тогда два из условий (2) или совпадают, если /(xz) = /(х/), или проти- воречат друг другу, если f(xi)^f(xi). Нам же надо иметь точно 2п + 1 различных и непротиворечивых условий, так как определению подлежат ровно 2п + 1 коэффициентов многочлена Тп (х). Если условий меньше чем 2п + 1, то часть коэффициентов останутся неопределенными. Если условий больше чем 2п + 1, то, записав подробно условия Tn(xi) = получим для определения 2п + 1 величин Ло, Alt Bv ... , Ап, Вп уравнения f (х.) = Ло + (Ах cos xl + Br sin xj + • • • + (Аг cos rcxz + + Bnsinnxf), (4) которые могут оказаться несовместимыми (противоречивыми), поскольку уравнений больше, -чем неизвестных. Графически условия (2) означают: графики функции f (х) и многочлена Тп(х) совпадают в точках с заданными абс- циссами х0, xlf ... , х2п. Абсциссы х0, хх, ,.. , х2п называются узлами интер- поляции, Тп (х) — интерполяционным многочленом, при- ближенное равенство f(x)^Tn(x) (точное в узлах) называется интерполяционной фор милой* 54
Условия (2), записанные в виде (4), представляют собой систему уравнений первой степени с неизвестными Ло, А1Р В19 ... , Ап, Вп. Решение этой системы не совсем простое. Пусть п = 1. Найдем коэффициенты Ло, Alt Вг много- члена 7\ (х) = Ло 4- Л1 cos х 4- Br sin х (4) из уравнений f (х0) = Ао + At cos х0 + Вг sin х0, f (хх) = Ао + At cos xt + Br sin xlt (5) f (*2) = 4 + Ai cos x2 4- Bt sin x2. Вычтем первое из уравнений (5) поочередно из равенства (4) и оставшихся двух уравнений (5) и воспользуемся форму- лами разности косинусов и синусов. Получим Л W - / (*о) = 2 sin (—Asin cos > / (Xi) — f (хо) = 2 sin (—A sin 4- cos , f (хг) ~ f (*o) = 2 sin Др (-A sin x-^ + Bi cos MP). Если из последних двух равенств найдем Al9 Вг и подста- вим их значения в первое равенство, то получим Л(*) = /М . Хо — Xi . Хп — X» sin ——1 sin—2—* + f(xl) . X —Xn . X—Ха . X — Хп . X — X, sin —5—^ sin —х—* sin —X— sin —• -------------1— + f )--f------i— . X, — Xn . Xi — X9 I \ x — x x9 — Xi sin - 2- -° sin -1- —2 sin 2-2 --° sin . 2 y~1 (6> Проверка; положив в последнем равенстве х = х0^ xi, х2, соответственно получим (я0) = f (лг0), (xj = f (Xj), Тг (х2) = / (х2). По аналогии можно написать общую формулу . X —х0 . *—• V-i sinsin---------- . xi ~ xi— 1 X 2 i,,Sln 2 /J . XZ— Xq Z7sln 65
sinlZ^±l...sin£^ ----------------------— f (x). . xi •'"i'4-l . xi x2n sin----2-- • • sin-2— (7) Выполнение условий Tn(xk) = f (хк), k=Q, 1, 2п, легко проверяется. Приведенная формула не единственная (по форме). Так> имеем следующую формулу: п-}~1 , ! уч (cos х ~ cos xi) • • • (cos х — cos ' п W (COS X- — COS Xi) ... (cos xt— COS X^[) 1=1 * X (cosx~c°sxi+l) •• (cosx-cosx,,+1) (COSX(-—COSX^j) ... (COSX;— cos Xn-|-1) ' ' l' ' S Очевидно, f(xt) =Tn(xl), i = 1, 2, .. . , n + 1. В правой части формулы имеем тригонометрический многочлен .n-rd ^порядка, так как cos2 х = у (1 4- cos 2х), cos3 х = (cos Зх + 3 cos х), (9) Этот многочлен является четной функцией. Формула /(x)«Ti(x) ? применяется, если /(х) — четная функция. | Если /(х) — нечетная функция, то в формуле (8) умно^ sin х ’ жим стоящее под знаком суммы t-e слагаемое на -у—-1 J Sin X/\ и получим многочлен (п + 1)-го порядка: ! М-i Т2 __ V Sin X (COSX —COSXj) ... (COS X —cos П (X) — 2-1 Sjn x • (COS x — cos e (cos x. __ cos xz—1) (cos X — cos Xf+1) . . (cos X — cos xn+i) (cos xi — cos xl+l) ... (cosx— COS xn+1) ' (10), 56
так как 1 . п sin х cos х = -J sin 2x, sin x cos2 x = 4- sin 3x 4- 4- sin x. (H> 4 4 ’ Наконец, имеем также n+l <гЗ/ ч V (sin х —sin Xi) ... (sin x —sin x ^) Tn (x) = 7,y:--------;--г------—------7-1---г x K (sin X£ — Sin xj ... (sinxf — Sin X-—J) 1=1 (sinx-sinxz+1) ... (sin X - Sin xn+1) X (sinxz —sinxz+1) ... (Sinxz — sinxn+1) ' Формулы (7), (8), (10), (12) легко запоминаются, и характе- ризуются общностью — на узлы не накладываются никакие ограничения. Недостатком этих формул является то, что они не имеют вида Тп (х) — А0 + Ai cos х + sin x + • • • + An cos nx + + Bn sin nx = Ao + Ri sin (x + (pj + R2 sin (2x + <p2) + • • * ••• + Rnsin(nx + (pn), (13) удобного для приложений.’ Если узлы интерполирования выбраны так, что на мно- жестве этих узлов функции 1, cos х, sin х, ... , cos nx* sinnx взаимно ортогональны, то получить формулу вида (13) несложно. Пусть узлами будут xlt х2, ... , x2rt+i. Тогда, поскольку существование интерполяционного многочлена установлено (хотя бы формулой (7)), то найти его коэффи- циенты можно следующим образом: 2п+1 (Тп(х), COSkx) = (f(x), COS kx) = S f(Xi)^kXif i=l кроме того, из равенства (13) имеем <Тп (х), cos kx) = Ak (cos kx, cos kx). Следовательно, ^4 __ (f (x)# cos kx) k (cos&x, cos^x) * Аналогично получим d ___ (/ (x), sin^x) k (sin kxt sin kx) * 57
В частности, если хь = ——7, k = 0, 1, ... , 2п, то (см. гл. II, § 3) (cos 0 • х, cos 0 • х) = 2п + 1, (cos kx, cos kx) = —у— , (sin kx, sin kx) = —y— > k = 1, 2, ... , tn. В рассматриваемом частном случае л 1 V cl 2лй \ . 2 VI cl 2nl \ 2л/ , — 2n+~l 2d к2л+"1/’ Ак ~ 2п+ 1 2j ^\2«+ 1/ G°S2п+“1^’ 4=0 >:=о 2п , х (14) о 2 V4 г I 2л1 \ . 2л; , Вк ~ 2п 4- 1 2_l f\2n + 1/ SU1 2п + 1 k' *==0 Упражнения 1. Воспользовавшись равенством (6), § 2, докажите, что л2 1 1 1 1 / __ — I-----L _i_ ---L -L ... _L 41R-1 4 ... 12 1 22 З2 42^ 4 "Затем найдите л с точностью до 0,01. 2. Докажите, что “2 - 1 + 1 4- 1 4- 4. 1 4. б--1 + у2+з*+ ^ = 1 + 1 + 1+... +......1_ +... 8 ‘ З2 52 ^(2/г+1)2^ ^Воспользовавшись последним равенством, вычислите л. 3. Воспользовавшись равенством (8), § 2, докажите, что 1 = 1 + 1+... + . 2 3 ‘15 ‘ ‘4ш2 —1 Это же равенство проверьте, исходя из того, что 1 1 ( 1 1 \ 4£2_ 1 - 2 \2& — 1 2k + 1/ 4. Найдите амплитуду и начальную фазу гармоник cos х + V"3 sin х, КЗ cos х + sin х. 5. Разбив отрезок [0, 2л] на 12 равных частей, примените фор- 2л мулу прямоугольников к вычислению j cos2 х dx. Сравните с точным о ответом, приведенным в § 2, формула 5 (при k = tn = 1).
6. На одном чертеже постройте графики функций j-[2 д 2 х2, —-4 cos х, -----4cos х + cos 2х, О о 4 -л- — 4 cos х + cos 2х-— cos Зх, 0 < х < 2л. и У 7. Воспользовавшись формулами Эйлера elx + e~lx eix — e~~ix cos х =--------- , sin х =---ft---- 2 2f и формулой для (а-\-Ь)п, докажите равенства (9), (11), § 5, найдите общие выражения для cosn х. sinn х. 8. Пусть xk = , k = 0, 1, 2. 3, 4. Составьте интерполяцион- ные многочлены по формулам (13), (14) и (17), §5. Проверьте, совпа- дают ли, в конечном счете, результаты. 9. Положив xk = ~ , k = 0, 1, 2, 3, составьте формулу тригоно- метрического интерполирования для функции f (х) — х. На одном* чертеже постройте графики функции f (х) и найденного тригонометри- ческого многочлена. ГЛАВА IV ИНТЕРПОЛИРОВАНИЕ И СПОСОБ НАИМЕНЬШИХ КВАДРАТОВ § 1. Вспомогательные сведения. I. Программа по математике средней общеобразователь- ной школы содержит понятие производной, напомним его. Производной функции f (%) при х = а называется предел отношения приращения функции f(x) в точке а к прираще- нию h аргумента, когда это последнее стремится к нулю: Если предел не существует, то говорят, что функция не имеет производной при х= а. Производная |Л|-*0 п сама есть функция аргумента х и называется производной (без добавления слов «при х = а»). 59»
Из свойств пределов легко* вывести свойства производ- ной. Приведем только два свойства: (/(х) 4- <Р (х))' = f (х) + ф' (X), (с/(х))' = с/'(х), где с — постоянная. Легко доказать формулу ((х — а)*)' = k (х — а)*-4. ‘Рассмотрим случай, когда k = 3 (формула верна и для дробных показателей, но мы ограничимся только целыми). Имеем ((х_а)*)' = lim + = = lim 3 (x - a)8 + 3 (x - -7) h* + = IhHO = lim (3 (x — a)2 -f- 3h (x — a) -j- ft2) = 3 (x — a)2. Производная от /' (x) называется второй производной и обозначается /"(х), третья производная f"'(x) или /(3>(х)— это производная от /" (х) и *т. д. II. Число а наз вается корнем многочлена Р (х) == аохп 4- Hjx"-1 4-----1- ап^х2 4- an^ix + ап> (О если Р (а) = 0. Теорема 1. Для того чтобы а было корнем много- члена (1), необходимо и достаточно, чтобы многочлен делился без остатка на х — а. Доказательство. Достаточность. Если Р(х) де- лится без остатка на х — а, то Р (х) = Рг (х) (х — а), где Рх(х)— частное (многочлен). Ясно, что Р(а) = 0. Необходимость. Пусть Р(а) =0, т. е. aoa« 4- ^а!1-14---4- 4- ап = 0. (2) Вычитая (2) из (1), получаем <Р (х) = а0 (хп — а") 4- аг (хп-1 — а"’1) 4-h (х — а). Так как разность целых степеней двух чисел делится на разность первых степеней этих чисел, то каждое слагаемое в правой части последнего равенства делится ня х— а, и потому Р(х) делится на х — а. 60
Теорема 2. Для того чтобы многочлен (1) имел п различных корней аъ а2, . . . , ап, необходимо и доста- точно, чтобы имело место разложение на множители Р(х) = aQ(x — ajfpc — а2) ... (х — ап). Доказательство. Достаточность очевидна. Необходимость. Если аъ а2, ... , ап корни многочлена, то по теореме 1 он должен делиться без остатка на (х—aj, (х— а2), , (х — ап). Следовательно, он должен делиться без остатка и на произведение (х — aja — а2) ... (х — ап), (3) являющееся многочленом той же степени п. Поэтому, по- делив Р(х) на произведение (3), обязательно получим посто- янное частное. Значит, Р(х) = К (х—а^ (х — а2) ••• Если бы мы выполнили умножение, то коэффициентом при хп было бы Д, но в (1) коэффициент при хп равен aQ. Отсюда К = aQ. Теорема 3, Любой многочлен Р (х) = а0 + агх + а2х2 + - • можно расположить по степеням х — а, т. е. предста- вить в виде Р(х) = Ло + At(x — о) + А2(х — а)2 Н- при любом а. В самом деле, Р (*) = «о + «1 ((* — л) + а) + я2 ((* — а) + а)2 Н = (а0 + ага + а2а2 4 ) + (х — a) (ar + 2аа2 4 ) + + (х — а)2 (а2 + Заа3 4-) = Ао + А^х — а) + + Л2(х—а)24-----, Теорема 4 (Ролля)1. Если функция /(х) обладает свойствами: 1) f(a)~f(b)\ 2) для каждого значения х, а < х < b, f (х) — непрерывна; 3) в каждой точке интер- вала а< х_< b существует производная fr (х), то по меньшей мере в одной точке с интервала ff (с) = 0. Строгое аналитическое доказательство теоремы привести можем. Геометрически теорема кажется очевидной, она 1 Ролль М. (1652—1719) — французский математик. 61
означает существование на графике функции f (х) хотя бы одной точки, в которой касательная к графику параллельна оси абсцисс. Рекомендуем читателю самостоятельно сделать рисунок, начав его с учета условия 1). Замечание. Геометрическое доказательство нельзя считать стро- гим хотя бы уже потому, что изображаем кривые, обладающие свой- ством: при движении точки касания вдоль кривой угол наклона каса- тельной к оси абсцисс изменяется непрерывно. Это означает непре- рывность производной, а эта непрерывность не предполагается. § 2. Тейлорово разложение многочлена и общая фор- мула Тейлора. Для некоторой функции значение функции и ряда ее производных могут быть заданы, найдены экспе- риментально или вычислены при к — а. Например, для точки, движущейся прямолинейно, в момент времени х = а могут быть заданы путь S (а), пройденный за время а, скорость S' (а) и ускорение S" (а). В том случае, когда известно, что функция Р(х) явля- ется многочленом /?-й степени и заданы при х= а значение функции и ее производные до n-го порядка включительно, то многочлен Р(х) может быть найден при любом х. Теорема. Если Р(х) многочлен п-й степени, то * Р (х) = Р (а) + Р’ (а) (х — а) + (х — а)2 + I Р'" (а) / \3 I I (а) / \п + —~(х — а)3^--------1----12(х —а)п. (1) Доказательство. Запишем Р(х) в виде Р (х) = Ао + А, (х — а) + А2 (х — а)2 4-ф Ап (х — а)п, (2) что всегда возможно, и последовательно найдем Р' (х) = Аг 4- 2А2 (х — а) 4- ЗА3 (х — а)2 4~ • • • А-пАп (х — а)"-1, Р"(х)= 2Л2 4-3 • 2Л3(х —а) 4-••• •+п(п—1)Л„(х — а)п 2, О’ Р(п} (х) = п\ Ап Положив в формулах (2) и (3) х = а, получим А0 = Р(а), A^P'ia), А2 = ^, Ап = Р-^. (4) Из (2) и (4) следует формула (1), которую называют фор* мулой Тейлора1 для многочлена. 1 Тейлор Б, (1685—1731) — английский математик. 62
Теперь предположим, что f(x) не многочлен, но из- вестно, что на некотором интервале, содержащем х = а, f(x) имеет производные до (п + 1)-го порядка включительно и пусть заданы /(«), f (а), Г (а), .... (5) По формуле (1) можем построить многочлен Р (х) п-й степени, принимающий, вместе со своими производными, при х = а те же значения (5), т. е. P(a)=f (а), Р' (а) = /' (а), .... Р<п> (а) = /(п> (а). Тогда получим р (X) = / (а) + Г (а) (х-а) + ^(х-ау + ..- + (6) Естественно положить /(*) = Р(х) + Rn(x) = f (a) -h f’(a)(x — a) + ’ • + +^(x-a)n + Rn(x). (7) Эта формула называется формулой Тейлора, в ней Rn(x) является остаточным членом. Ясно, что Rn(x) — это погрешность приближенной формулы f(x)^;f (а) -Ь /' (а) (х — а) + (х — а)2+--- -+^(х-ау. (8) Пока не найден остаточный член или же оценка для него формула (7) окончательного вида не имеет, а приме- нение формулы (8) может привести к большой погрешности. В курсе дифференциального исчисления для Rn(x) ука- заны различные по форме выражения. Самым простым и чаще всего применяемым является остаточный член в форме Лагранжа Rn(x) = (Х(7-Н)Г a<t<x (или х < t < а). Поскольку значение t неизвестно, то остается неизвест- ным и точное значение выражения для Rn(x), Чаще всего Достаточным является очевидная оценка 63
I Rn (X) | < l • max I /(''+’) (x) — _ „ . , * Л «ПС Например, пусть f(x) = sinx,-----4 < x < -j . Последовательными производными функции sin x являются cosx, —sin %, —cosx, sinx, cosx, .... (9) Поэтому max | (sin | c 1. Положим a=0, тогда для 7?n(x) будем иметь оценку I Rn (x) I < 4п+1 (Z2 + . Если возьмем n = 3, то I R3 (x) I < 4-4 e 24 < gg . Подставив значейия производных (9) при х = 0 в (8), получим х3 sin X х — о! / ' Н {погрешность меньше Ы. Замечание 1. Приближенное представление f (х) с помощью много- члена имеет важное значение в теории и приложениях. Замечание 2. Хотя класс функций, имеющих производные, не очень узок, требование существования производных надо считать жестким. § 3. Интерполяционная формула Лагранжа. Предполо- жим известными «+Д значений функции /(х) при п + 1 различных значениях аргумента. Такое предположение осу- ществляется весьма часто: в определенные моменты време- ни с большой точностью фиксируются расстояния прямо- линейно движущейся точки от некоторого начала; измеря- ется длина стержня при различных температурах; прибор вычерчивает график некоторой функции, а с помощью этого графика находятся значения функции; функция задана слож- ной формулой, и потому вычисляются только ее значения для ряда значений аргумента. Требуется по данным значениям /(«1). Ж). ••• . Ж).7(«м-i) найти приближенное выражение для f (х) в виде многочлена. 64
Определение, Многочлен Р(х) не выше п-й степени, '.обладающий свойством Р(«1) = /Ы, Р(а2) = /(а2), ••• , Р(«п+1) =/(an+i), (1) г называется интерполяционным многочленом для /(х), а формула /(х)~Р(х), (2) используемая для приближенного нахождения значений f (х) при значениях аргумента, содержащихся между наименьшим и наибольшим из а19 а2, ... , an+i, назы- вается интерполяционной формулой. Геометрически условия (1) означают, что графики мно- гочлена Р (х) и функции f (х) заведомо имеют не менее чем п + 1 общих точек. Требование, чтобы многочлен Р(х) был не выше /г-й степени, естественно — если взять многочлен более высо- кой степени, то он будет содержать более чем п + 1 коэф- фициентов, для нахождения которых имеется только п + I условий (1), и нельзя ожидать, что коэффициенты опреде- лятся однозначно. Если потребовать, чтобы степень мно- гочлена была меньше и, то число условий (1) будет боль- ше числа искомых коэффициентов и, как правило, уравне- ния для определения неизвестных окажутся несовместными. s Ита^ надо найти многочлен Р(х) - Л0 + Л1х+ ••• + Апхп, (3) удовлетворяющий условиям (1). Эти условия подробно за- писываются следующим образом: ^0 + + ^2^1 + • • • + Апа" = f (<2i), ^0 + ЛЯ2 + ^2^2 + ‘ ‘ ~ f (я2), (4) Ао + + • • • + = f (ап+\) и представляют собой систему п + 1 уравнений первой сте- пени с п + 1 неизвестными Ло, Alt ... , Ап. Докажем, что если существует решение системы (4), то только одно. Это означает, что интерполяционный много- член, если он существует, может быть записан в различ- ных формах, но, будучи приведен к виду (3), всегда будет одним и тем же. Х/2 3 4» ,64 65
Пусть система уравнений (4) имеет два решения: 1) Ло, Лр . , Лп; 2) Во, Вр ... , Вп. Тогда будут тождества- ми равенства (4) и равенства Во + B±a± + В2а% + • • • + ВпС^ == f (tfj), Bq + Bra2 + B2a2 + • • • + Bna2 = f (a2), Bq + B^^ + B2cfit+i Bnan-^\ — f (ап+\), Вычитая эти равенства из соответствующих равенств (4), по- лучим (Ло — Bq) + (Лх — В±) at + (Л2 — В2) а} + • • • ••• +(Лп-Вп)а? = 0, i = 1, 2, ... , n+ 1. Это означает, что многочлен n-й степени (Ло — Bq) + (Лх — Вг) х + • • • + (Лп — Вп) хп имеет n + 1 (больше п) различных корней, что невозмож- но. Мы пришли к противоречию. Значит, больше одного решения система (4) иметь не может. Ниже найдем многочлен Р (х) и тем самым вопрос о су- ществовании' решения системы (4) будет решен положи- тельно. Итак, требуется найти многочлен Р(х), удовлетворя- ющий условиям (1), не решая систему уравнений (4). ^Рассмотрим частный случай, когда P(a1) = /(ai), Р(й2) = 0, .... Р(й„+1)^=0. (9) На основании теоремы 2, $ 1, имеем Р (х) =а0(х — а2)(х — й3) .. . (х — ап+1). Найдем аа. Для этого воспользуемся первым из условий (9), получим 1 f (at) = а0 (flj — й2)(й! — й3) ... (й! — й„+1), . v . . z . f (^"1) • 0 (01 —а2)(а1 —а«) • • • («1 — о„+1) ' v 7 Окончательно, многочлен л-й степени Р (И = (х-а^-а8)--.(х-ап+1) 1 («I — a2)(oi — оз) • •. (01 —ап+1) ' I " 66
удовлетворяет условиям Л («i) = f (fli), Pi («О = 0 при t =#= 1. Аналогично находим многочлен n-й степени Ра(*) = (x — a1)(x — a3)...(x — an+i) («а — «1)(оа — «з) ••• (а» — а„+1) ' '°2'’ удовлетворяющий условиям Ра(Я1) =0, Р2(а2) = /(а2), P2(az) =0 при i=#2. Затем находим Ра (х), ... , Pn+i (х). Тогда р (х) = Рг(х) + Р2(х) + ••• + Рп+1 (х) является многочленом не выше n-й степени, удовлетворя- ющим всем условиям (1). Найденный многочлен р(} — а2>(* — °*) * ’ ’ (Х~ ап+1> W ~(Я1-а2)(Я1-Яз) (х — а^х — а9) , ._________ + («2 ~ 01)(я2 — «з) • • • («2 — a„+i) ('~°"+1> ГЫ+ (10) (х — а^х — а2) ... (х — ап) f( . (ап+1 -^)(^+1 -а2) ... (%+1-а„)М п+1) называется интерполяционным многочленом Лагранжа, а формула f (%) ~ Р(х) —интерполяционной формулой Лагранжа, Если предположить существование у f (%) производных до (n + 1 )-го порядка' включительно, то можно найти выра- жение для погрешности интерполяционной формулы. Ниже (см. §4) мы найдем это выражение при п— 1. Пример 1. Пусть f (—1) — 6, f (0) = —2, f (1) = 4, f (2) = 12. Имеем + (Xt~Ti .X((.lij • 4 + ~ ’ 12 = ~2*3 + 7*2 + * - 2. Пример 2. Пусть f (—1) =2, f (0) = 1, f (1) = 4, f (2) = 11. Имеем f (H ~ x(x- l)(x-2) (x+ l)(x—l)(x —2) t U ~ (-D • (-2) • (-3) h 1 • (-D • (-2) г/а 3* 67
। (x ~Ь 0 * (x 2) (x+ 1) x(x 1) ] ] _ 2x2 i x j_ i + 2 - 1 . (—1) 4+ ЗГТЛ 11 -^+*+'- Как видим, степень интерполяционного многочлена может быть меньше п (в данном случае и = 3). § 4. Линейное интерполирование. Пусть заданы только два значения xlf х2 аргумента и соответственные значения функции /(%). Интерполяционный многочлен будет тогда многочленом первой степени, его графиком будет прямая, проходящая через точки (хь flx-J), (х2, /(х2)). Отсюда название — линейное интерполирование. К линейному интерполированию прибегают довольно часто. Существуют таблицы численных значений многих функ- ций (например, таблицы логарифмов, таблицы значений три- гонометрических функций). В этих таблицах последователь- ные значения аргумента отличаются на некоторую величину h. Например, в таблицах десятичных логарифмов даны ло. гарифмы целых чисел, Л= 1. В таблицах тригонометричес- ких величин Н= 30' 1= (или h = . Между тем, иногда необходимо вычислить значение функции для зна- чения аргумента, содержащегося между двумя рядом стоя- щими аргументами. Скажем, надо найти sin32°42', а в таб- лицах есть синусы углов 32°30' и 32°45'. В подобной ситуации можно успешно применять линей- ное интерполирование. Допустим, что некоторый стержень вмонтирован в ус- тановке так, что экспериментатору доступны только концы- этого стержня. Измерив величины некоторой физической характеристи- ки, например температуры на концах стержня, эксперимен- татор в качестве первого приближения для нахождения значения характеристики в некоторой недоступной точке стержня вынужден воспользоваться линейным интерполи- рованием. При этом возникает вопрос о величине погрешности с которой находится значение функции по линейной интер поляционной формуле. В самом деле, если в таблицах даны логарифмы с точностью до 0,0001, то было бы бессмыс- ленным вычислять логарифм с помощью интерполяционной формулы, дающей результат с точностью до 0,01. 68
Докажем, что погрешность линейной интерполяционной формулы для f(x) допускает, оценку | погр.| < шах | f" (х)|. (1) Пусть многочлен ?х (х) = К + Lx удовлетворяет условиям интерполирования (-*1) = f (Л'1)> Pi Йг) — f (х2) и пусть х— любое, но фиксированное, значение аргумента такое, что хг < ~х < х2. При х = х, вообще говоря, f (х) ==&?х(х), и поэтому f (х) = ?х (х) + погр. Погрешность будем записывать в виде погр. = N (х — хх)(х — х2), причем число У еще не определено, но если х окажется равным хх или х2, то погрешность будет равна нулю. Рассмотрим функцию Ф (х) = f (X) — ?! (х) — N (х — хх)(х — х2). Ясно, что Ф (хх) = 0, Ф (х) = ,0, ф (х2) = 0. По теореме Ролля, получаем ф' (ci) = 0, х1<с1< х; ф' (с2) = 0, х < с2 < х2. Снова применяя теорему Ролля, получим ф" (с) = 0, сх < с < с2 => хх < с < х2. Но Ф"(х) = /"(х)-2УУ, так как х' == 1, х" = (1)' = 0. Значит, 0 = Ф" (с) =/" (с) — 2N, N = , хх < с < х2. Итак погр. = (х — хх)(х — х2). 69
Отсюда | погр.| с у max | /" (х)| max (х — Xi)(xa — *)• Так как (.Г — Хх)(Х2 — Х) = —Х* + (х2 +Х1)Х-Х1Х2 = то max (х — xi)(x2 — х) = ** ~~ Х1- . Окончательно I погр. | < ~ max | f (х)|. Рассмотрим два важных частных случая. 1. f(x) = sinx, 0 «%!, х2 , х2 — хх = (=15'). Так как (sin х)" = —sin х, то получим |погр.| < g . (720р < 8 #518400 < 0,00001. Таким образом, о помощью линейной интерполяционной формулы можно вычислять (о точностью до 0,00001) зна- чения синусов углов, содержащихся между углами, которые отличаются на 15'. Это обычно вполне достаточная точ- ность. Очевидно, такой же результат будем иметь для cosx. Мы предполагали, что xlt х2^^0, по той причине, что • /я ] >sinx = cos 1-2—xl, и поэтому в таблицах даются значения тригонометрических функций лишь для углов, содержащих- ся между 0 и 45°. 2. f(x) = lgx, х1; х2 > ЮО, х2 — %!=!. В этом случае из (1) получим (так как (1g х)" = —1g е, где е — 2,71 ;..) |погр.| < вЧоог • fe2’8 < °>00001« 70
Запишем теперь формулу линейного интерполирования и приведем ее к виду, удобному для пользования. Общая формула (10) предыдущего параграфа при п=,2 будет иметь вид И*) + /(*»)• ^1 Л2 Л2 "1 Отсюда f (х) ~ If-----Х') + *г) f (х ) + Л-----£1 f (х2), 1 V 7 — (*2 — *1) ' V 17 *Х2 — Xi ' V 27’ f (*) « f (*,) + (X - xj. Л2 Л1 Это и есть формула линейного интерполирования, имеющая простой геометрический смысл (рис. 17) и удобная для вы- числений. § 5. Интерполяционная формула Ньютона. Рассмотрен- ная в § 3 формула Лагранжа пригодна для любого набора узлов интерполирования, но имеет два существенных недо- статка. Первый из них заключается в том, что формула громоздка — каждое слагаемое формулы является многочле- ном n-й степени. Второй недостаток заключается в следу- ющем. Случается, что’сначала задается, допустим, т узлов и вычисляется интерполяционный многочлен Лагранжа. Затем по какой-то причине добавляются дополнительные узлы интерполирования (потому, например, что полученная интерполяционная формула оказалась недостаточно точной). Приходится тогда все вычисления выполнять снова—ни одно из слагаемых формулы Лагранжа не сохраняется. Ньютон1 нашел такую форму для интерполяционного многочлена, которая лишена указанных недостатков фор- мулы Лагранжа, но эта форма проста лишь в том случае, когда заданные значения аргумента образуют арифметичес- кую прогрессию. Чтобы написать формулу Ньютона, введем понятие о так называемых конечных разностях функции. Пусть даны значения аргумента а, а + А, а + 2 А, 'а + + ЗА, ... и соответствующие значения функции. Выпишем значения аргумента и функции двумя колонками. Затем 1 Ньютон И. (1643—1727) — английский физик, механик, астро- ном и математик., 71
каждое число второй колонки, начиная с первого, вычтем из последующего числа. Получим первые разности функции и первую из них обозначим через Д/ (tz). Найденные раз- ности записываем в третьей колонке. Аналогично по первым разностям составляем вторые. Первую из вторых разностей обозначаем символом А2/(а). Подобно составляем третьи разности и т. д. Интерполяционная формула Ньютона име- ет вид f (X) « Р(х) = f(a) + + (х~а)(х~а~/>) х X Л2/(a) + а}(х~а ~^(х~a~2h}(а)+ .... Доказательство весьма элементарно и приводить его не будем. Пример 1. Использовав данные примера 1, § 3, написать формулу Ньютона. Имеем х f (х) А/ А2/ А8/ —1 6 —8 14 ‘ — 12 0—262 1 4 8 2 12 Откуда 7(х)^6 + ^-(~8) + -(Х^1)Х - 14 + + -V-* ft ~ 9.. (—12) = — 2 + х + 7х« — 2х3. Пример 2. Использовав данные примера 2, § 3, написать формулу Ньютона. Имеем х f(x) А/ .А8/ А8/ —1 2—14 0 0 13 4 1 4 7 2 11 Откуда 2+^ •(-!)+ ft+2t>X-4= 1 + х + 2х». Замечание. Формула линейного интерполирования в конечной ее форме представляет собой формулу Ньютона при хх = a, х2 = а+ h. 72
В предыдущих параграфах были рассмотрены две воз- можности: 1) даны f(a), f'(a), f" (а), ; 2) даны fpq), /(х2), /(х3), .... Существуют интерполяционные формулы и для «сме- шанного» случая, когда даны, например, /(Xi); f(x2), f (х2), Такой случай встречается редко, поэтому его рассмат- ривать не будем. В последующих параграфах рассмотрим очень важный для практики случай, когда даны п + 1 зна- чений функции, а мы хотим выразить приближенно нашу функцию в виде многочлена не степени и, а степени /и, причем обязательно m<n. § 6. Избыточные системы линейных уравнений, реше- ние по способу наименьших квадратов. Непосредственное измерение или вычисление величин xlt х2, ... , хт во мно- гих случаях затруднительно или даже невозможно, а до- пускающими непосредственные измерения оказываются не- которые выражения (функции), содержащие величины х19 X 2> • • • > Хт, Простейшим случаем, к которому сводятся многие дру- гие, является тот, когда в процессе измерения получаем результаты вида #1%! + Ьгх2 + • • • “p/jX/n = Л1> ад + Ь2х2 + ••• + l^Xm = h2l (1) ttnXi + bnX2 • • • + InXm — hn> т. e. для определения m -неизвестных xn x2, ;.. , xm име- ем систему n линейных уравнений. Число уравнений обычно больше числа неизвестных, так как экспериментатор, даже измеряя одну величину, не может ограничиться одним измерением. Дело в том, что отдельные измерения неиз- бежно содержат случайные ошибки и лишь на основании некоторой совокупности измерений экспериментатбр может сделать более или менее обоснованные выводы. Например, если измеряя некоторую величину п раз, экспериментатор получит в результате величины а2, ... , ап, то пола- гается, что достаточно близким к истинному значению ве- личины является среднее арифметическое: 4~ с/2 • • • Н~ (2) л * ' 73-
Во многих случаях (но не всегда), что доказано в тео- рии вероятностей и проверено на практике, гипотеза о дос- таточной близости величины (2) к истинному значению измеряемой величины верна. Система (1), в которой число уравнений больше числа неизвестных, называется избыточной. Она противоречива, несовместна. Это означает, что нельзя найти такие значения неизвестных, которые точно удовлетворяют всем уравнени- ям системы. Следует иметь в виду, что ’ коэффициенты уравнений, и прежде всего свободные члены, обычно не точны, и поэтому даже точное решение системы (1), если бы оно существовало, не давало бы точных значений ин- тересующих нас величин. Можно выбрать из (1) часть уравнений (т уравнений), решить их точно, но тогда, почти наверняка, подстановка найденных решений в оставшиеся п — т уравнений приве- дет к совершенно несуразному результату. Какие приближенные значения х2, ... , хт надо считать наилучшими? По-видимому такие, чтобы одновре- менно, более или менее точно, удовлетворялись все уравне- ния системы (1). Еще в начале XIX в. Лежандр предложил следующий принцип: Из всех возможных значений неизвестных х2, • • • ... , хт надо взять те, для которых сумма квадратов ошибок — отклонений левых частей уравнений от пра- вых— является наименьшей. Таким образом, требуется найти значения xlt х2, ... ... , хт, при которых величина (a^Y + ЬгХ2 + • • • + l^Xm fti)2 + (^2^1 4“ ^2^2 + * * * + + l^Xtn — h2)2 + • • • 4" + bnx2 + • • • + lnXm — hn)2 имеет наименьшее значение (минимум). Принцип Лежандра называется принципом наименьших квадратов, а решение системы (1) на основании этого принципа называется решением по способу наименьших квадратов. Естественно возникает вопрос обоснования принципа наименьших квадратов. Теоретически доказано и практически проверено, что в большинстве случаев прин- ципу наименьших квадратов можно (и нужно) следовать. Однако считать его универсально пригодным нельзя. Вопрос обоснования принципа наименьших квадратов по существу относится к теории вероятностей. Здесь рассмот- 74
рим только геометрический смысл принципа наименьших квадратов. Пусть Йана система уравнений + Ьгу + сг2 = d19 а2х + Ь2у + с22 = d2, (2) апх + bny + cnz = dn с тремя неизвестными. Кроме того, предположим, что вы- полнены условия а% + b] + с2 = 1, i = 1, 2, ... , n. (3) Как известно (см. гл. I, § 10), каждое линейное уравнение (2) является уравнением плоскости. В аналитической геомет- рии весьма просто доказывается, что числа | а[х + biy 4- + Ci2 — di\ при условиях (3) равны расстояниям точки с декартовыми координатами (х, у, г) от плоскостей (2). Следовательно, отыскать значения х, 7/, г из системы (1) при условиях (3) по способу наименьших квадратов означа- ет найти точку, для которой минимально среднее квадра- тическое расстояние ее от заданных плоскостей (2). Теперь докажем основное утверждение для т = 3 (для т > 3 рассуждения не сложнее). Теорема. Для того чтобы приближенное решение х, у, z избыточной системы уравнений агх + Ьгу + сг2 = а2х + b2y + c2z = h2, (4) апх + bny + сп2 = hn было наилучшим в смысле принципа наименьших квадра- тов, необходимо и достаточно, чтобы х, у, г было ре- шением системы трех уравнений S а?х + £ а^у + S ам = J] atht, i=i i=i i=i i=i . V atbix + S biCiZ = bihi, (5> f=l i=l Z=1 i i= 1 S CiOiX + S dbty + S $2 = S Cihi. 1=1 1=1 1=1 i=l 4*
Система (5). называется нормальной системой уравне- ний, соответствующей избыточной системе (4). Надо доказать, что величина R = (агх 4- Ьгу + Cjz — hi)2 + (а2х 4- b2y +с2г— — h2)2 + • • + (апх + bny + cnz — hn)2 (6) принимает наименьшее значение при тех и только тех х, у, г, которые образуют решение системы (5). Легко понять, что наибольшего значения R иметь не может, так как эта величина бесконечно возрастает, например, при х-> оо. Существование минимума R не вызывает сомнений, так как Требуется только найти те значения х, у, z аргументов, при которых R достигает минимума. Записав, что ^min = (#1* + — Л])2: + * * * 4" 4~ + Ьпу + Сп2 — hn)2, (7) рассмотрим функцию аргумента t: Ф (/) = («i (х + t) 4- bry 4- crz — hi)2 4" (a2 (* + 0 + + ^2У + c2% — h2)2 4- (^3 (* + ^) + b3y 4- c3z — h3)2 + .... Эта функция, согласно равенству (7), должна иметь мини- мум при t = 0. Однако легко подсчитать, что Ф (/) = t2 S а? 4- 2/ S at (aix 4- biy 4- — hi) + 1=1 г=1л + s' (ai* + bty + CiZ — hi)2, 1=1 т. e. это квадратный трехчлен относительно t. Как уже было установлено (см. гл. I, § 1), квадратный трехчлен, at2 4- %bt 4- с, а > 0, имеет минимум при t = — ~ . В дан- ном случае квадратный трехчлен имеет минимум при t — 0. Значит, п b = S ai (а{х + Ыу + CiZ — hi) = 0, i=l а это первое из уравнений (5). Второе из этих уравнений получим, рассмотрев ‘Ф (0 == (а-1% 4- (у Н- 0 + ci^ — bi)2 4- • • • + (УпХ 4* + Ьп (у 4-1) 4- cnz — hn)*. Аналогично находим и третье из уравнений (5). 76
Доказав теорему, заметим, что нормальную систему (5) можно составить по избыточной системе (4) следующим об- разом: умножая уравнения (4) соответственно на коэффи- циенты при х и складывая, получаем первое уравнение нормальной системы (5); умножая на коэффициенты при у и складывая, получаем второе уравнение системы (5) и т. д. Пример 1. Решить систему уравнений 2* + у=1, х — 2у = 2, Зх 2у = 3. Умножая уравнения соответственно один раз на 2, 1, 3, а вто- рой— на 1, —2» 2 и складывая* результаты, получаем нормальную систему 14x-f-бу =13, 6х + 9у = 3, решением которой является х = 1,1; у = —0,4, Пример 2. Решить систему уравнений х—— у = 1, 2х + у = 2, * + Зу=1. Нормальная система 6х + 4у = 6, ( 4х + Пу = 4 имеет решение х — 1, у = 0, которое • является точным решением ис- ходной системы. Значит, данная система совместна, а это означает, что одно из уравнений является следствием остальных (если умножить первое уравнение на — 5/3, второе на 4/3 и сложить результаты, то получится третье уравнение). Пример 3. Решить систему х — у — 1,, 2х + у = 2, 2х + у = 3. Здесь третье уравнение явно противоречит второму, но вполне может быть, что, измеряя величину и = 2х + у, получим два резко отличных результата, но нет оснований предпочесть один результат другому. Нормальная система 9х + 3у = 11, Зх + Зу = 4 имеет решение х = 7/6, у = 1/6. Подстановка в заданную систему по- казывает, что решение является точным для системы уравнений 11
Х — У= 1, 2х + у = 2,5 (2,5 это среднее арифметическое чисел 2 и 3). В общем виде, если перейти от системы уравнений ax~\-by = h, Ах + By = Я, Ах + By = К к нормальной системе, получим (а2 2А2) х 2ЛВ) у = ah Л( Н -|- /С), (ab + 2АВ) х + (b2 + 2В) у = bh + В (Н + К). Решение этой системы 2Bh — Ь(Н + К) аЩ + К) — 2Ah Х~ 2(аВ — АЬ) ’ У~~ 2(аВ — АЬ) является точным решением системы уравнений ах + by — h, Ах + Ву= —j— . Полученный результат можно обобщить (см. упражнение 9 в конце главы). § 7. Решение нормальной системы. В примерах преды- дущего параграфа рассматривались системы с двумя неиз- вестными и коэффициенты при неизвестных были неболь- шими целыми числами. В практических задачах число неизвестных в основном больше двух, а коэффициенты записываются с помощью нескольких значущих цифр. Для решенйя таких систем достаточно воспользоваться методом подстановки (это заметил еще Гаусс). Надо лишь удачно ввести обозначения и подметить некоторое простое правило. Так, рассмотрим систему двух уравнений аи + bv + cw + •• • = а, < п Au + Bv + Cw + • • • = р. Разделив обе части первого из уравнений на а, получим , Ь . С f Ct /п\ П— v 4— 4- ... = — , (2) 1 а 1 а 1 а ' ' Из этого и второго из уравнений (1) исключим и, ддя чего умножим уравнение (2) на Л и результат вычтем из второго уравнения системы: /о' , /г» . 1О аЛ\ В — — и 4- С---------® + ••• — Р"----------. \ a J \ а / \ а 1 78
Умножив обе части полученного уравнения на а и разде- лив на Ва — ЬА, находим , аС — с А , Ва — аА V + ^MW+ ••• Та им образом, систему (1) заменяем эквивалентной систе- мой , Ь , с а. й J--[)J---W _L ... — — 1 а 1 а а • , аС — сА , ва-аА W V + ^bAW+ -• ' Чтобы автоматизировать процесс перехода от системы (1) к системе (3), достаточно запомнить правило составления общего знаменателя по двум первым столбцам коэффициен- тов системы уравнений (1) и заметить, что числители по- лучаем по тому же правилу, если, по очереди, заменить второй столбец коэффициентов последующими столбцами. Вернемся теперь к рассмотрению системы уравнений + bry + crz = Ai, а2х + b2y + c2z = A2, ................................. (4) anx + bny + cnz = hn и соответствующей нормальной системы уравнений п п п п S а*х + S aAv + S atCiZ = S aiht, i=i t=i i=i i=i S biaix + £ b2y + S btciz = S b{hi, f=l :=1 14=1 1=1 (0) s aatx + S Cibiy + S C*{z = S Cihi. 1=1 z=l f=l 1=1 Очевидно, коэффициенты системы (5) получаем как ска- лярное произведение столбцов коэффициентов системы (4), воспользовавшись при этом известными обозначениями. Воспользуемся обозначением Гаусса S a.Pi = [аР] f=l 79
и запишем систему (5) в таком виде: [аа] х + [ab] у + [ас] г = [ah], __ [to] х + [bb]y + [ЭД г = [ЬЛ], (6) [са] х + [ci] у + [сс] z = [ch]. Разделим первое уравнение на [аа] и исключим х из осталь- ных двух уравнений. Воспользовавшись правилом, получен- ным выше. (см. систему (3)), найдем г I [aftl [аа] [аа] [аа] ’ ([aa][ii] — [ai]2) у + ([aa][bc] — [ab][ac]) г = = [aa][bh] — [ab][ah], (7) ([aa][te] — [ai|[ac]) у + ([aa](cc] — [ас]2) z = = [aa][ci] — [ai][ac]. Если введем обозначения laa][bb] — [ab]2 = ]iil], [aa][te] — [ai][ac] = [tel], .... то систему (7) перепишем в виде х I [а&1 п I [ас] — "Г [аа] у "* [aa] [aa] ’ [ЬЫ]у+ [bcl]z = [bhl], (8) [tel] у + [ccl] z = [сЛ1]. Разделив второе уравнение на [bb 1] и исключив у из треть- его уравнения, получим [oft] . [ас] _ [aft] [аа] у [аа] [аа] ’ - » I у [bi>i] [Mi] ’ _= [СЛ2] [сс2] ’ О) где [сс2] = [ccl][tel] — [tel]2, [ch2] = [tol][cftl] — [tel][tol]. Нормальная система, приведенная к виду (9), называет- ся элиминационной (элиминирование — исключение). Из нее последовательно находим х, у9 г. Замечание 1. Можно воспользоваться тем, что таблицы коэффи- циентов нормальной системы (6) и промежуточной, состоящей из двух последних уравнений (8), симметричны относительно диагонали табли- цы. Опытный вычислитель выписывает каждый раз только таблицы коэффициентов и лишь элиминационную систему» 80
Замечание 2. Если иметь в виду только решение нормальной системы, то вовсе не обязательно приводить ее к виду (9). Иногда удобнейг например, преобразовать нормальную систему к виду Z-]---- = Х-]----= •••, У = •••, т. е. исключать неизвестные можно в любом порядке. Строго придер- живаться схемы Гаусса следует при решении нескольких систем урав- нений, если при этом используется ЭВМ. Замечание 3. Пусть х, у, 2 — решение нормальной системы. Вве- дем обозначения _ . 81 = а±х + b±y + cxz — ел = апх + Ьпу + cnz — hn для погрешностей — отклонений левых частей уравнений от правых— при подстановке решения нормальной системы в исходную. Точность решения исходной системы естественно характеризовать величиной п [ее] = £ (а,х + b(y + ей — hy. i=\ Достаточно простые вычисления приводят к следующей формуле Гаусса: [ее] - [ 1 ~ [661] • (10) Рекомендуем читателю сопоставить формулу Гаусса с элимина- ционной системой (9). § 8. Параболическое интерполирование по способу наименьших квадратов. Формулы П. Л. Чебышева. Гра- фики многочленов У = 4“ 4“ + • • • 4- называются параболическими кривыми или точнее парабо- лами т-й степени. При т = 2 имее^м известную параболу. Формы парабол, в зависимости от подбора коэффициен- тов Ло, А19 ... , Aт, весьма разнообразны. Поэтому, имея значения./^), /(х2), ...» некоторой функции Дх), естественно воспользоваться приближенной формулой вида /(х) « Рт(х) ==А0 + Atx + Л2ха Н-----+ Атхт. (1) Естественно найти коэффициенты Ло, А19 .. ., Ат так, чтобы выполнялись равенства Лп(х0 = Ж), i = 1, 2, ... , п+ 1. (2) 81
Случай т—п уже рассматривался в главе III, где для интерполяционного многочлена Рп(х) были приведены фор- мулы Лагранжа и Ньютона. Теперь рассмотрим случай, когда т<п. Этот случай особо важен, поскольку число значений функции f (х), вычисляемых или измеряемых, луч- ше иметь большим (информация о функции тем надежней, чем она полней), а интерполирующий многочлен должен, по возможности, иметь не слишком высокую степень. Запишем условия (2) в виде Ло 4~ 4~ ^2^1 + • • • + Ат%Т = f (*1), Ло + + Я2Х2 + • ’ • + АтХ^ f (^2), (3) Ао + + А2Хп+1 + • ’ • + AmXn~l-l = f (Х/г+О- Для определения коэффициентов Ло, А19 Л2, ... имеем избыточную систему линейных уравнений, поэтому можно говорить лишь о приближенном ее решении. К системе линейных уравнений (3) применим принцип наименьших квадратов, т. е. коэффициенты Ло, А19 Л2, ... будем искать такими, чтобы величина S (f (Xi) - (Ло + AlXi + А2х- + • • • + АтхТ)У (4) г=1 приняла свое минимальное значение. Для решения этой за- дачи можно применить схему Гаусса, изложенную в пре- дыдущем параграфе, но возможен и другой подход. До- пустим, что даны многочлены ф0(х), Ф1(х), ф2(х), ... сте- пеней соответственно 0, 1, 2, ... , образующие ортонорми- рованную систему на множестве {xf, х2, ... , хп+1ф Сгруп- пировав соответственно слагаемые в многочлене Рт(х) или подставив вместо 1, х, х2, ... их выражения через ф0(х), фз (х), ф2(х), ...» запишем Рт(х) в виде Рт (х) = В0ф0 (х) + В^ (х) + В2ф2 (х) Н---+ Вт^т (*), а условие минимизации выражения (4) станет условием ми- нимизации выражения </ (х) - Pm (X), f (х) - Рт (*)> = «4-1 т = (5) 1=1 г=0 Такая задача была рассмотрена в гл. II, § 5, и сейчас воспользуемся указанным там решением. 62
Как было показано, выражение (5) принимает минималь- ное значение, когда коэффициенты Вг являются коэффициен- тами Эйлера — Фурье, т. е. В г ( (х), tr (*) > = S / (*<) tr (Xl) • (6) Таким образом, формула интерполирования имеет вид f (х) як Рт (х) = (f (х), to (х)> to (*) + + (/(х), tlW>ttW4----------tm(x)>tm(x). (7) Кроме того, минимальным значением величины (5), т. е. квадратом среднего квадратического отклонения /(х) от Рт(х), будет (см. гл. II) Pm = </ (х), f (х)> - S (</rn (Л), Ifr (х)))2. (8) i=0 Если имеем не ортонормированную систему многочленов to (х), ti (х), ... , tm (х), а ортогональную <р0 (х), фх (х), .. . , <рт (х), то равенства (7) и (8) будут иметь другой вид. В самом деле, нормируя, получим Далее Br=*/f (х), ^=\ - \ /<фг(х). фг(х))/ =\г, V (фг (х)< Фг (*)> Поэтому равенство (7) перепишем в виде + О: W + - + t w> <*> а равенство (8) — в виде т p^=</W, <8'> £=1 Замечание 1. Обычно на практике приходится сначала искать интерполяционный многочлен невысокой степени. Если требуется уве- личить степень многочлена, то дописывают одно или больше слагае- мых в формулах (7), (8) или в формулах (7') и (8')» 83
Замечание 2. Если не указана ортонормированная или только ортогональная система, то (см. гл. II, § 4) строим такую последова- тельность методом Сонина — Шмидта, используя последовательность 1, х, х2, ... . При этом многочлены находим последовательно один за другим. Например, для построения Р3 (х) (пг — 3) заканчиваем процесс СонинаШмидта, как только получаем ср0 (х), срх (х), ср2 (х), ср3 (х). Замечание 3. Произвести ортогонализацию последовательности 1, х, х2, . . . не сложно, но иногда утомительно (см., например, гл. II, § 4, пример 1). Для выявления основной идеи П. Л. Чебышева и по- лучения некоторого удобного способа построения ортого- нальных многочленов воспользуемся схемой Гаусса, изло- женной в предыдущем параграфе. Для удобства положим, что а=\, di = 1; b = х, bi = х£; c=x2, с£=х*\ Л0=Х, Л1 = У, л2 = г, /(х/)=й, и примем т = 2. Тогда найдем многочлен Р(х) = аХ+ bY + cZ, удовлетворяющий условиям а^Х b^Y -р CjZ =р hlt а2Х b2Y 4~ с2Z — h2, апХ + bnY + CnZ = hn. Эта система аналогична системе (4) предыдущего парагра- фа и поэтому, применяя принцип наименьших квадратов, мы можем сразу написать элиминационную систему урав- нений: (9) \ । у । l££] 2 — [аа[ *" [па] [аа] ’ У I 7 ________ [Ml] [bb\\ “ [Ж] ’ У___[ch2] П. Л. Чебышев, никогда не забывавший о практике, конеч- но не мог не заметить большое неудобство системы (9). Эта система предполагает обязательно, что каждое ее урав- нение выписывается полностью, так как решать систему надо с конца. Составление коэффициентов системы (9) достаточно сложное, требует использования сразу всех b£i .... Если бы мы были уверены, что не придется уве- 84
личивать степень интерполяционного многочлена, то отме* ченные недостатки системы (9) нас бы не беспокоили. Однако на практике естественно сначала искать интерпо- ляционный многочлен невысокой степени, затем, в случае необходимости, увеличить степень на единицу и т. д. В случае увеличения степени многочлена всю систему (9) надо составлять заново. Вот этого, следуя П. Л. Чебыше- ву, мы хотим избежать. Уравнения (9) определяют неизвестные X, У, Z как линейные функции правых частей этих уравнений. Значит, если обозначим правые части уравнений (9) соответственно через Aq, Х2» найдем X, У, Z и полученные значения подставим в Р(х), то получим Р (х) = /<о<Ро (4 + {х) + K2<p2 (х), (10) где ф0 (х), фх (х), ф2 (х) требуется определить. Умножив соответственно уравнения (9) на ф0 (х), Ф1(х), Ф2 (х) и сложив результаты, получим в правой части мно- гочлен (10). Следовательно, Хф0 (х) + У Фо (х) + фх (x)'j + Z ф0 (х) + + [ЙТ]<Р1(Х) + Ф2 (*)) = ? (4 Но Р(х) = аХ + bY + cZ. Так как X, Y, Z могут определяться только однозначно, то Фо (х) = а = 1, §)<Ро(*) + ф1(х) =Ь = х, (11) £) '₽« & + {£]Ф1 w + Фа (х) = с = 4 откуда и найдем ф0(х), Ф1(х), ф2(х). Они, очевидно, будут многочленами степени 0, 1, 2. 'Итак, если написать только первое уравнение систе- мы (И), то найдем ср0(х) и многочлен <12) Написав первых два уравнения (11), найдем <p0(x)> TiW и - Р1 (х) = Х0(р0 (х) + /<1Ф1 (х) = Фо (X) + Lj-j Ф1 (X). (13) 85
Используя все три уравнения (11), получим Рг (х) = КоФо (х) + Л1Ф1 (х) 4- /<аф2 (х) = + <14) Равенства (11) и (12) — (14) называются формулами Чебышева. Следовательно, имея первых два столбца элиминацион- ной системы и столбец правых ее частей, можем написать первые два уравнения (II), а имея три столбца элимина- ционной системы и столбец свободных членов, можем на- писать три уравнения (11). Пример. Пусть даны значения аргумента: 0, 1, 2, 3 и соответ- ствующие значения функции: 1, —1, 3, 4. Требуется найти интерполя- ционные многочлены первой и второй степени. Положив р (х) = X • 1 + Yx + Zx*. получим для определения X, Yt Z избыточную систему уравнений Х= 1, X+Y + Z = — 1, X + 2F + 4Z=3, X + ЗУ + 9Z = 4. Ей соответствует нормальная система 4Х + 6У + 14Z = 7, 6Х+14У+36Z= 17f ' (15) 14Х + 36 У + 98Z = 47. Используя нормальную систему (15), запишем х + 4^ + -. = т* (,6) Второе равенство получаем в результате исключения X из второго уравнения (15). Это уже дает возможность *найти <Ро(х) = 1, •у • 1 + я>1 (х) = X. Ф1 (х) = х — 1.5, (17) d / \ 7 , 26 . , 13 1 Pi (х) — 4 + 20 (х 1,5) — 10 х 5-. 86
Если понадобится повышение степени многочлена, то дополняем ра- венства (16): и составляем уравнение для нахождения ср2 (х): Отсюда, ф2 (х) = х2 — Зх + 1, м=4+§(х -ь5)+4 (*2 -з*+’>= 3 . 19 , 11 = 7*2-2б* + 2б- (18) Замечание 1. В данном случае умышленно взяты те же значения аргумента, что и в гл. II, § 4, пример 1. Найденные многочлены те же самые, что и в упомянутом примере (только обозначения изменены). Замечание 2. П. Л. Чебышев получил формулы вида (12) — (14), пользуясь так называемыми непрерывными дробями. § 9. Эмпирические линии регрессии. В статистических исследованиях часто возникает следующий вопрос: наблю- дения (измерения) дают и пар (Х1, У1), (хг, t/2).(хп, Уп) значений величин х, у. Эти величины могут быть случай- ными, но связаны они между собой некоторой зависимостью. Например, количество ягнят у связано с количеством овце- маток х, хотя строгой зависимости между х и у нет. На- личие случайных факторов видно уже из того, что у одного и того же чабана на сотню овцематок каждый год прихо- дится разное количество ягнят. Простейшее предположение заключается в том, что y=kx + b. (1) График уравнения (1) называется линией регрессии. 87
Для определения коэффициентов k, b имеем избыточную систему уравнений yi = kxi + b, i — 1, 2, ... , п, которую решаем по способу наименьших квадратов с при. менением ортогональных многочленов. Легко проверить, что ортогональны многочлены 1/ х—Мх, где Мх = *1 + х*+ ••• +Хп. (2) Действительно, <1, Х—Мх> = S (Xi — /’>) = £ Xi—nMx = 0. z=i z=i Для применения^формулы (7'), § 8, находим- <1, О = л, (у, 1> = S У1=пМу, . f=i (X — Мх, X — Мх> = 2 (Xi — Мх)2 = пох, где (х/ - Мх)* (3) п п, (у, X — Мх) = У1 (Xi — Мх) = S {Xi — Mx) (yi — My), так как n n S Mytxi — MJ^My'Z (Xl — Mx) = 0. t=l r=l По формуле (7'), § 8, имеем пМу п S (Xi-Mx)(y!-My) 1 4 ^2 (х Мх), у-Му = ---- -----{х _ Мху (4) 88
Величины Мх, Му называются выборочными средними^ величина — выборочной дисперсией', угловой коэффи- циент £ (х{ — Мх) (yi — Му)' называется выборочным коэффициентом регрессии, пря- мая (4) — эмпирической линией регрессии. Обратим внимание на то, что прямая (4) проходит через точку (Л4Х, Му). Конечно, предположение (1) не единственно возможное. Можно, например, ввести квадратичную (параболическую) регрессию у = ах2 + Ьх + о. Если точки (хп yr), (х2, z/2)» • • • , (*п, Уп) расположены достаточно близко к эмпирической линии регрессии, то можно полагать, что предположение (1) оправдано. § 10. О приближенном решении нормальной системы. Способ Гаусса решения нормальной системы уравнения применяется широко. Он используется при решении любой системы п уравнений первой степени с п неизвестными. С помощью этого способа получаем формулы П. Л. Чебы- шева и приходим к уравнения^ для нахождения многочле- нов ортогональных на данной конечном множестве значе- ний аргумента. Наконец, получаем полезную формулу Га- усса (см. § 6, формула (10)). Следует заметить, однако,, что способ Гаусса не использует важную особенность таб- лицы (матрицы) коэффициентов нормальной системы урав- нений.— ее симметричность. Эта симметричность упрощает решение нормальной системы, особенно при решении систе- мы с помощью определителей. Если число уравнений велико, то вычисления и с помощью определителей очень сложны. В том случае, когда коэффициенты [аа], [bb], ... , на- ходящиеся в таблице коэффициентов нормальной системы на диагонали, больше остальных коэффициентов, а это бывает очень часто, удобен такой приближенный способ решения нормальной системы. В качестве, первого .приближенного решения нормальной системы берется то, которое получаем, если в левых частях уравнений оставить только члены, стоящие по диагонали. 89
Имеем v [ahl 1J 1 [aaj ’ ]bb] ’ Подставив эти значения в первое уравнение системы, нахо- дим его погрешность \аа] xr + [ab] + • • • — [ah] = аь и полагаем ai х2 = *1 — 2 1 [сш] Подставив во второе уравнение системы х2, ylf zlt ... t находим а2 = [Ьа] х2 + [W>] у! + [be] zt +---[bh]. Затем полагаем а2 Дойдя таким путем до второго приближения последнего из неизвестных, повторяем весь процесс, исходя уже из при- ближенного решения х2, у2, z2, .. • • В случае необходи- мости процесс повторяем. Пример. Решить систему уравнений 27х + бу = 88, 6x+15y + z = 70, (1) у + 54z = 107. Находим первое приближенное решение нормальной системы: 88 Q 70 107 о Х1“27~3, 1/1 ~ 15 ~ 5’ ZJ~5T~2- Далее «!= 27 • 3+ 6 • 5 — 88 = 23, Х2 = 3-8ж2’15: а2 = 6 • 2,15+ 15-5 + 2 — 70= 19,9,- 199 У2 = 5--3,67; ю а3 = 3,67 + 54-2— 107 = 4,67 г2 = 2 — 1,914. 2 54 Итак, х8 = 2,15, у2 = 3,67, z2 = 1,914. 90
Теперь процесс повторяем = 27 . 2,15 + 6.3,67 — 88 = —7,93. 7 QQ х8 = 2,15 + ^ = 2.446. Легко проверить, что у3 = 3,561, z3 = 1,915. Точное решение системы (1) следующее: х = 2.470, у = 3,551, z= 1,916. §11. Об избыточной системе уравнении не первой степени. Было бы ошибкой полагать, что всегда можно измерить значения линейных функций искомых величин, которые непосредственно не допускают измерения. Поэтому возникает вопрос о приближенном решении избыточной системы п уравнений не первой степени с т неизвестными (n>m). Прежде всего попытаемся найти какое-нибудь приближенное решение/ Его можно подобрать, исходя из «физических» соображений, путем нескольких попыток. Возьмем некоторый набор ... приближенных зна- чений неизвестных. Обозначим поправки к ним через h2, .... Если эти поправки относительно малы, то для них тоже приближенно можно получить избыточную систе- му линейных уравнений, и эту последнюю уже можно ре- шать по способу наименьших квадратов. После этого исхо- дим уже из значений 4“ ^1, а2 + ^2» • • • для неизвестных и повторяем процедуру и т. д. Покажем это на примерах. Пример 1. Найти приближенное решение избыточной системы уравнений х2 + у2 = 4,5, х3 — ху = 5,7, х2 — Зу2 + х = 3,8. В качестве первого приближения берем х=2, у = 1, поскольку х, у входят в уравнения далеко неравноправно и мало вероятно, что они приблизительно равны, а из второго и третьего уравнений можно сделать вывод, что х > у. ' Теперь положим х = 2 4- Л. у = 1 4~ 6, тогда (2+ /г)2 +(1 + 6)2 = 4,5, (2 4-ft)® — (2 + Я) (1 + *) = 5.7, (2 + й)3 — 3 (1 + ky + (1 + ft) = 3,8. 91
Раскрыв скобки и отбросив слагаемые, содержащие h и k в степени, выше первой (h, k предполагаем малыми), находим 4/i + 2k = —0.5. ll/i— 2k = —0,3, 5/i — 6k = 0,8. Это избыточная система уравнений первой степени. Составим нормаль- ную систему 162/1 — 446 =—1,3, —44/1 + 44/г = —5,2. Отсюда П = —0,06, /г = —0J8. Таким образом, новые значения для х и у соответственно равны 1,94 и 0,82. При подстановке первого приближения в заданные уравнения на- ходим погрешности —0,5, 0,3, 0,8. Сумма квадратов погрешностей равна 0,98 « 1. Подстановка второго приближения в заданные уравнения дает по- грешности 0,16, 0,16, 0,2, сумма квадратов которых равна 0,09^0,1. Пример 2. Найти решение системы уравнений V* + v + Vy = 3.8. /2Г^ + т<^ = 3.1, х2 — у2 = 3,9, исходя из приближения х = 5, у = 3 (цель задачи показать элемен- тарный способ сведения данной системы к системе уравнений первой степени). Пусть а величина малая по сравнению с единицей, тогда 7.Г+-. ^((. + if - (т)' - (если читатель не Знаком с этой формулой, то можно проверить, взяв л = 2, п = 3)5 Отбрасывая слагаемые, содержащие — в степени, большей 1, получим Предполагая малыми h и k, положим в заданных уравнениях х = = 5 +Л, у = 3 + k, тогда + (Л + ^) + /3+й = 3.8, /1 + (2* — Л) + Iх (3 + й)2 = 3.1, (5 + /1)а — (3 + й)2 = 3,9. 92
Переписав эти уравнения в виде 2 1 + Ц-^+ ГЗ- ]/1 + -j- = 3.8, /1 + (2£ - й) + ^9 • |Л + ^ = 3,1, 52 + 10ft — З2 — 6k = 3,9 и воспользовавшись приближенным равенством (1), находим 2(|+Чг‘)+/3(1+4)-ад 1 + 2-^ + ^9(1 + ^)=3.1, ЮЛ — 6& = —12,1. Это система уравнений первой степени. Пользуясь одной формулой дифференциального исчис- ления (формулой Тейлора для функций нескольких пере- менных), практически всегда можно свести задачу решения избыточной системы уравнений не первой степени к реше- нию системы уравнений первой степени. § 12. Общие замечания относительно эмпирических формул. Формулы, основанные на. данных, полученных в результате проведения опытов, называются эмпирическими. Но это не означает, что только на основе опыта опреде- ляется эмпирическая формула. Вид формулы может под- сказать теория, аналогия или просто интуиция, но формула содержйт некоторые параметры (коэффициенты, показатели), нахождение которых основано на результатах опытов. Само собою разумеется, что любая эмпирическая формула под- лежит проверке, которая может привести к уточнению этой формулы, к ограничению области ее применения или пол- ной ее отмене. В данной работе речь может идти лишь о составлении эмпирических формул на основании число- вых значений одной величины (аргумента) и числовых зна- чений другой величины (функции), предполагаемой одно- значно зависящей от первой. Как правило, и те и другие числовые значения являются приближенными, поэтому из каких бы соображений мы не выбрали б вид формулы й значения входящих в шее параметров, ожидать нахождение точной формулы не приходится. Если обеспечена удовлет- ворительная точность вычислений, это обстоятельство не должно смущать. Ведь мы же пользуемся формулами, 93
содержащими число л, логарифмы, косинусы, ... , хотя л, логарифмы, . .. точно вычислить невозможно. Следовательно, эмпирические формулы всегда будут приближенными. Нам уже известны способы нахождения некоторых приближенных формул в основном полиномиаль- ного типа: тригонометрические и алгебраические многочле- ны. Однако этого не достаточно. Вот простейший пример. При известных условиях объем газа и давление связаны формулой V = — заменить эту формулу полиномиальной нет возможности. Следующий пример показ вает, что интер- поляционная формула (1) для некоторого интервала изменений аргумента может быть достаточно точной и вполне пригодной для приближенного вычисления значений функции, однако эта формула может дать совершенно искаженное представление об истинной функции /(х). Действительно, имеют место равенства 1 *2 . cosx = 1 — у + ••? э -2~ 1 , е 2 =1-т+- и ряд других. Была бы допущена грубая ошибка, если бы х2 мы характеризовали некоторые явления функцией е 2 в то время, когда функция 1 — -% фактически появилась как приближение cosx. Между тем физическое чутье и внимательное рассмот- рение полученных числовых данных может подсказать, что вообще не следует искать приближение вида (1). Не трудно понять, что составление эмпирических формул это дело не простое и очень ответственное. Заметим, что если число измерений (наблюдений) не очень мало (больше пяти), то следует найти в декартовой системе координат точки, соответствующие результатам изме- рений (наблюдений). Часто расположение точёк подсказы- вает возможный вид эмпирической формулы. § 13. Примеры нахождения эмпирических формул. I. Если значения аргумента образуют точно, или почти 94
точно, арифметическую прогрессию, а соответствующие зна- чения функции образуют почти геометрическую прогрессию^, то искомую зависимость между аргументом и функцией следует искать в виде у = аЬх+с, а > 0. . (1} Поскольку а = rn°Sma9 аЬх+с = т.{Ьх+с)}°*та, то в качестве основания а выберем любое положительное число (обычна берем основание 10, что удобно, если понадобится пользо- ваться логарифмическими таблицами, или основание нату- ральных логарифмов е « 2,71828 ...). Итак, пусть даны значения аргумента х19 х2, , хп и соответствующие зна- чения функции /Сч), ...» /(хп), которые будем предполагать положительными, и пусть f(x) = 10&*+с. (2) Прологарифмировав равенство (2) и. воспользовавшись данными значениями х.и f(x), получим избыточную систе- му уравнений » bxi + с = 1g f (xt), f = 1, 2, ... , п, (3) которую решаем по способу наименьших квадратов. Замечание 1. Мы не пишем f (х) = А • 10Ьх+с, так как А можно считать положительным (в противном случае вмес- то f (х) возьмем — f (х)) и тогда Л=1018Л,. / (х) = 10b*+(c+lg А> Замечание 2. Если среди значений f (х) есть часть отрицатель- ных, то зависимость (2) заменим зависимостью вида f (X) + k = 10,6*+с, где k не меньше наибольшего из модулей отрицательных f (х/). Пример 1. Пусть значения аргумента равны 0,1, 0,2, 0,3, 0,4, а значения функции соответственно 2,5, 5,1, 9,8, 20,0. Значения аргумента образуют арифметическую прогрессию, а значения функции «почти геометрическую»—каждое значение функции почти вдвое боль- ше предшествующего. Найдем формулу вида у=\0ах+ь. Имеем ax + b = Igy, . 0,1а + b = 1g 2,5 = 0,398, 0,2а 4-& = 1g 5,1 = 0,707, 0,За+ & = 1g 9,8 = 0,991, 0,4а + 6 = lg 20= 1,301 95
и составляем нормальную систему 0,3а + b = 0,999 (« 1), а + 46 = 3,397 (^3,4), Отсюда а — 3, 6 = 0,1 и f (х) ~ 1О3х^"0,1. Замечание. Само собою а разумеется, что четырех точек (измере- ний) мало для обоснованных ‘выводов. Пример носит чисто иллюстра- тивный характер. Пример 2. Пусть значения аргумента равны 0,5, —0,3, —0,1, 0,1, 0,3, а значения функции соответственно 1,8, 3,1, 6,5, 16,4, 49,1. Здесь значения аргумента снова образуют арифметическую прогрес- сию, а значения функции возрастают быстро: Найдем формулу вида Имеем ах2 + Ьх + с = 1g у, 0,25а — 0,56 + с = 1g 1,8 = 0,255, 0,09а — 0,36 + с =i 1g 3,1 = 0,491, 0,01а — 0,16 + с = 1g 6,5 = 0,812, 0,01а + 0,16 + с = 1g 16,4 = 1,215, 0,09а + 0,36 + с = 1g 49,1 = 1,691. Нормальная система: 0,079а — 0,1256 + 0,45с = 0,284, —0,125а+ 0,456 — 0,5с = 0,273, 0,450а — 0,5006 + 5с = 4,464. Отсюда а = 0,763; 6 = 1,783; с = 1,02 и f = е0,763х24-1,783x4-1,020 II. На рис. 18 изображены кривые, характерной осо- бенностью которых является убывание в одну сторону и 96
возрастание в другую^ с замедлением, в результате чего точки кривой как бы стремятся расположиться на двух взаимно перпендику- х лярных прямых (асимпто- Рис. 19 тах). На рис. 19 изображена кривая (ось Оу не показана) уравнение которой имеет вид _ 1 У “* (х — а)2 + 6 • Эта кривая имеет одну асимптоту и один максимум. Если значения аргумента не скучены и их не слишком мало, то иногда можно заметить, что заданные точки рас- полагаются, примерно,' на кривых указанных видов. Таким образом появляются эмпирические формулы вида _ 1 _ 1 У — ах + b \ У ах2 fa с • Рассмотрим один пример. Пример. Значения аргумента равны 1, 2, 3, 4, 5, а соответст- вующие значения функции 0,30, 0,20, 0,13, 0,11, 0,08. Найдем фор- мулу вида - 1 ах + Ъ ' Имеем . , 1 ах + b = —, У а-|_& = 3,10, 2а + £ =4,90, За+ 6 = 7,15, 4а +6 = 8,85, 5а4- 6 = 11,15. Составляем нормальную систему 55а + 156= 125,50, 15а + ЬЬ = 35,15 и находим, что а = 2,005, b = 1,001. Полагаем а =2, 6=1, тогда _ 1 У ~ 2х 4- Г Не трудно догадаться, что возможно появление формулы вида ₽ = ойГГ₽ + т‘ 97
которую заменяем следующей: ° г и = Т+~ь + с- Соответствующую кривую получаем параллельным сдвигом кривой </ =---; вверх или вниз на I у I. v ах + 3 Если при увеличении значений х точки графика разме- щаются приблизительно на прямой у = а, параллельной Ох, то полагаем у = а и приходим к известному по существу случаю У ~ а = ах + р ’ ах + [3 = —!— , 1 у — а 1 о 1 ах, + р —------, 1,1 1/1 — а» ах2 + [3 = ----, Уч — а ’ Полагая, что о . (/ = —гт + с, J х + h ‘ ’ получим ху + by — сх — Ьс — а — 0. Отсюда, обозначая Ьс 4- а = аъ получим аг + сх — by — ху, Я1 + схг — Ьух = Х^!, О1 + СХа — Ьу2 = х2у2, Найдя из соответствующей нормальной системы b, с, alt найдем и а. III. Кривые вида у = (х —«!)“> (а2 —х)Ч если известны аг, а2 и не известны at, a2, находим сле- дующим образом. Логарифмирование приведет к уравнению aj lg (х — aj + a2 lg (а2 — х) = 1g 68
линейному относительно искомых alt <х2. Значит получим систему уравнений «1 'g (Xf — ах) + а2 1g (а2 — Xt) = 1g yt, i = 1, 2, ... , m, и сможем применить способ наименьших-квадратов. Упражнения 1. Найдите многочлен третьей степени, корни которого равны 1, — 1, 2. 2. С помощью теоремы Ролля докажите, что многочлен хп — ап (п — целое) имеет- не более двух действительных корней. 3. Не вычисляя производных f' (х), /" (х), ••• , найдите Г (а), Г (а)> («), ...» если f (х) = х5 + 7Х4 + 6х3 + 4х2 + 5. 4. Пусть f (х) многочлен m-й степени и известны значения f (Xj) f(x2), ...» f (xn), n > tn. Докажите, что интерполяционный много член Лагранжа Р (х) будет многочленом m-й степени. Более того, Р(х)=/(х). 5. Пусть f (a), f (a+h)t f (а + 2/i), . . . — значения многочлена m-й степени. Докажите, что конечные разности Дг/ (а) равны нулю при г > tn. 6. Докажите, что f(a + h) = f(a) + bf (а), f (а + 2h) = f (а) + 2Д/ (а) + Д2/ (а), f (а + 3h) = f (а) + ЗД/ (а) + ЗД2/ (а) + Д3/ (а). На основании этих формул проверьте интерполяционную формулу Ньютона. 7. Составьте формулу линейного интерполирования для Ух. Ис- ходя из равенств У? = 2,_У§ = 3, найдите с помощью линейного интерполирования У7, У 6 и проверьте, что результаты верны е точностью до 0,1. 8. Пусть Проверьте, что решение системы уравнений ах + by = с, Ах+Ву^С можно записать в виде или, что то же самое. р_ Q |ц с I А С I а Ъ I Л- В Ня «I- (1> (2) X с b С В а b А В У 99
Пусть дана избыточная система X — у = 1, 2х + у = 2, —х + Зу = —1, Зх + 4у = 2. Сгруппируйте эти уравнения парами (6 пар!) и найдите для каждой пары уравнений _ Pi Р2 по формуле (1). Проверьте, что решение нормальной системы для х совпадает со значением дроби PiQi PyQz + - - - + РeQe 9. Пусть дана система уравнений ах + by + cz — h, ах + ру + yz = k9 Ах + By + Cz = Zlf Ax -f- By -j- Cz == Zg, Ax -J- By -f- Cz = Z3. Докажите, отыскивая минимум выражения (ax + by + cz— h*-\-----^(Ax + By + Cz — l3)\ , что'решение по способу наименьших квадратов будет точным реше* нием системы уравнений ах + by + cz = Л, -ах + Ру + У? = k, Ах+Ву + Сг = /-1-+ /g + 1з. О
ОГЛАВЛЕНИЕ Глава I. Векторы, ортонормирование § 1. Неравенство Коши — Буняковского.................................3 § 2. Арифметическое я-мерное пространство............................5 § 3. Евклидово я-мерное пространство.................................6 § 4. Векторы в я-мерном арифметическом пространстве. Сло- жение векторов, умножение вектора на число....................8 § 5. Длина вектора (в евклидовом пространстве). Угол между векторами.................................................... 9 § 6. Скалярное произведение двух векторов.12 § 7. Линейная зависимость векторов ....13 § 8. Процесс Сонина — Шмидта ................15 § 9. Геометрические истолкования....................................17 § 10. Геометрический смысл линейного уравнения.................... 19 § 11. Решение задачи на отыскание минимума..........................21 Упражнения...........................................................25 Глава II. Последовательности ортонормированные на конечном множестве § 1 Общие замечания.................................... . 27 § 2. Ортонормированные последовательности функций заданных на конечном числовом множестве..............................29 § 3. Две ортонормированные последовательности тригонометри- ческих функций..............................................31 § 4. Примеры применения процесса Сонина — Шмидта .... 34 § 5. Коэффициенты Эйлера — Фурье, свойстве) минимума ... 35 § 6. Тригонометрическое интерполирование по способу наимень- ших квадратов ............................... ........ 38 § 7. Обобщения............................................ 40 Упражнения..................................................42 Глава III. Элементы гармонического анализа и тригонометри- ческое интерполирование § 1. Гармоники, амплитуда, частота, начальная фаза.........44 § 2. Понятие о гармоническом анализе функций (ряд Фурье) . . 45 §s3. О колебании струны ...................................49 § 4. Практический гармонический анализ ....................50 § 5. Тригонометрическое интерполирование...................54 Упражнения .................................................58 Глава IV. Интерполироваие и способ наименьших квадратов § 1. Вспомогательные сведения..............................59 § 2. Тейлорово разложение многочлена и общая формула Тейлора 62 § 3. Интерполяционная формула Лагранжа.....................64 § 4. Линейное интерполирование ........................• . 68 101
§ 5. Интерполяционная формула Ньютона........................71 § 6. Избыточные системы линейных уравнений, решение по спо- собу наименьших квадратов..............................73 § 7. Решение нормальной системы........................78 § 8. Параболическое интерполирование по способу наименьших квадратов. Формула П. Л. Чебышева.......................81 § 9. Эмпирические линии регрессии...................... . 87 § 10. О приближенном решении нормальной системы.........89 § 11. Об избыточной системе уравнений на первой степени . . 91 § 12. Общие замечания относительно эмпирических формул . . 93 § 13. Примеры нахождения эмпирических формул..................94 Упражнения....................................................99
БИБЛИОТЕЧКА ФИЗИКО-МАТЕМАТИЧЕСКОЙ ШКОЛЫ МАТЕМАТИКА Гершон Ихелевич Дринфельд ИНТЕРПОЛИРОВАНИЕ И СПОСОБ НАИМЕНЬШИХ КВАДРАТОВ Редактор Л. П. Онищенко Литредактор Л. 77. Никитина Художественный редактор Е. В. Чурий Технический редактор А. И, Омоховская Корректор Ф, И. Слободская Информ, бланк № 8215 Сдано в набор 28.03.84. Подп. в печать 06.08.84. БФ 30316 Формат 84X108/32, Бумага типогр. Я«3 Лит. гарн. Вы*, печ. 5*46 усл. печ. л. 5,77 уел. кр.-отт. 4,58 уч.-изд. л. Ти- раж 6000 8X3. Изд. № 6365. Зак. 4-664. Цена 15 коп. Головное издательство издательского объединения «Вища школа», 252054, Кнез«54, ул. Гоголевская, 7 Отпечатано с матриц книжной фабрики им. М. В. Фрунзе, 310057, Харьков-57, ул. Донец-Захаржевского, 6/8 в харьковской типографии Яв 16, р. Харьков* ул. Универ- ситетская, 16. Зак. 1335.