Text
                    российская экономическая
академия имени г.в. плеханова
Н.П. Тихомиров, £.Ю. Дорохина
ЗК0Н0МЕ1?Ш
Допущено Министерством образования Российской Федерации
в качестве учебника для студентов высших
учебных заведений, обучающихся по специальности
«Математические методы в экономике»
Издательство
«ЭКЗАМЕН»
МОСКВА
2003


УДК 51-77:336(075.8) ББК 65.26в6 Т46 Тихомиров Н.П., Дорохина Е.Ю. Т46 Эконометрика: Учебник / Н.П.Тихомиров, Е.Ю.Дорохина — М.: Издательство «Экзамен», 2003. — 512 с. Подготовлено при содействии Национального Фонда Подготовки Кадров. ISBN 5-94692-438-9 В рамках учебной дисциплины «Эконометрика» рассмотрены про- блемы построения эконометрических моделей, методы оценки пара- метров линейных эконометрических моделей, методы оценки коэф- фициентов моделей с нестандартными ошибками, построение моделей в условиях мультиколлинеарности независимых переменных, линей- ные модели временных рядов, модели финансовой эконометрики, сис- темы взаимозависимых моделей, а также модели с переменной струк- турой и со специфическими переменными. Отдельная глава посвящена использованию эконометрических мо- делей в прогнозировании социально-экономических процессов. Каждая глава содержит вопросы и упражнения, способствующие лучшему пониманию изучаемых проблем. Для студентов экономико-математических и аналитических фа- культетов экономических и технических вузов, аспирантов, препода- вателей и научных работников, специалистов аналитических служб предприятий и организаций. УДК 51-77:336(075.8) ББК 65.26в6 ISBN 5-94692-438-9 © Тихомиров Н.П., Дорохина Е.Ю., 2003 © Российская Экономическая Академия им. Г.В. Плеханова, 2003 © «Издательство «ЭКЗАМЕН», 2003
Оглавление ВВЕДЕНИЕ 8 ГЛАВА 1. ПРОБЛЕМЫ ПОСТРОЕНИЯ ЭКОНОМЕТРИЧЕСКИХ МОДЕЛЕЙ 10 1.1. Основные этапы построения эконометрической модели 10 1.2. Особенности обоснования формы эконометрической модели 15 1.3. Методы отбора факторов 24 1.4. Характеристики и критерии качества эконометрических моделей 32 1.5. Качество оценок параметров эконометрических моделей 46 Вопросы к главе I 52 Упражнения к главе I 53 ГЛАВА П. МЕТОДЫ ОЦЕНКИ ПАРАМЕТРОВ ЛИНЕЙНЫХ ЭКОНОМЕТРИЧЕСКИХ МОДЕЛЕЙ 57 2.1. Метод наименьших квадратов 57 2.7.7. Процедура оценки параметров по методу наименьшшс квадратов 57 2.2.2. Свойства оценок МНК 60 2.2. Особенности проверки качества оценок МНК 70 2.7.7. Свойства фактической ошибки эконометрической модели 70 2.2.2. Тестирование свойств фактической ошибки эконометрической модели 73 2.2.3. Оценка дисперсии истинной ошибки модели 78 2.2.4. Особенности проверки обратимости матрицы ХОС 79 2.3. Оценка последствий неправильного выбора состава независимых переменных модели 83 2.4. Оценивание параметров эконометрической модели с учетом ограничений 87 2.5. Метод максимального правдоподобия (ММП) 91 2.5.7. Предпосылки метода максимального правдоподобия 91 2.5.2. Процедура получения оценок максимального правдоподобия 96 Вопросы к главе II 100 Упражнения к главе П 100 ГЛАВА Ш. МЕТОДЫ ОЦЕНКИ КОЭФФИЦИЕНТОВ ЭКОНОМЕТРИЧЕСКИХ МОДЕЛЕЙ С НЕСТАНДАРТНЫМИ ОШИБКАМИ 110 3.1. Обобщенные методы оценивания параметров эконометрических моделей 112 3
3.LL Обобщенный метод наименьших квадратов (ОМНК) .112 3.L2. Обобщенный метод максимального правдоподобия 115 3.2. Применение обобщенных методов оценивания параметров эконометрических моделей на практике _______« 117 3.2.1, Эконометрические модели с коррелирующими ошибками 117 3.2.2, Эконометрические модели с гетероскедастичным ошибками 125 3.3. Метод инструментальных переменных 129 Вопросы к главе Ш 136 Упражнения к главе Ш , 136 ГЛАВА IV, ПОСТРОЕНИЕ МОДЕЛЕЙ В УСЛОВИЯХ МУЛЬТИКОЛЛИНЕАРНОСТИ НЕЗАВИСИМЫХ ПЕРЕМЕННЫХ 144 4.1. Рекурентные методы оценки параметров эконометрических моделей 145 4.2. Метод главных компонент 149 4.3. Методы оценки коэффициентов моделей с лаговыми независимыми переменными 160 Вопросы к главе fv 167 Упражнения к главе IV 167 ГЛАВА V. МЕТОДЫ ОЦЕНКИ КОЭФФИЦИЕНТОВ МОДЕЛЕЙ С ЛАГОВЫМИ ЗАВИСИМЫй\Ш ПЕРЕМЕННЫМИ 170 5.1. Проблемы построения моделей с лаговыми зависимыми переменными 170 5.2. Основные подходы к оценке коэффициентов эконометрической модели, содержащей лаговые зависимые переменные 176 5.3. Особенности использования инструментальных переменных в оценках параметров моделей 181 Вопросы к главе V 182 Упражнения к главе V 182 ГЛАВА VL ЛИНЕЙНЫЕ МОДЕЛИ ВРЕМЕННЫХ РЯДОВ 184 6.1. Стационарные временные ряды 184 6.1.1, Параметрические тесты стационарности 187 6.1.2, Непараметрические тесты стационарности 193 6.1.3, Преобразование нестационарных временных рядов в стационарные 199 6.1. Модели авторегрессии 201 6.3. Модели скользящего среднего ^208 6.4. Модели авторегрессии-скользящего среднего 211 6.5. Идентификация моделей авторегрессии-скользящего среднего _213 6.6. Модели временных рядов с сезонными колебаниями. 222
6.7. Переход от стационарных моделей к нестационарным 226 Вопросы к главе VI 230 Упражнения к главе VI 230 ГЛАВА VII. МОДЕЛИ ФИНАНСОВОЙ ЭКОНОМЕТРИКИ 235 7.1. Объекты исследования финансовой эконометрики 235 7.2. Гипотезы финансовой эконометрики 244 7.3. Тестирование финансовых процессов 250 7.4. Модели ГСБ-1. Броуновское движение 261 7.5. Модели финансовых процессов с изменяющейся вариацией (ГСБ-2 и ГСБ-3) 268 7.5.7. Модели процессов со скачками вариации 271 7.5,2. Модели процессов с зависимой вариацией 274 7.6. Методы оценки параметров моделей с изменяющейся вариацией 283 7.7. Модели временных рядов финансовых показателей с нелинейными структурами 288 Приложения к главе VII (к разделу 7.3) 292 1. Оценки параметров распределения отношения SR 292 2. Параметры распределения выборочной дисперсии 294 3. Оценка параметров распределений функциональных зависимостей случайных величин 295 Вопросы к главе УП 298 Упражнения к главе VII 299 ГЛАВА VIIL СИСТЕМЫ ВЗАИМОЗАВИСИМЫХ ЭКОНОМЕТРИЧЕСКИХ МОДЕЛЕЙ 302 8.1. Особенности систем взаимозависимых моделей 302 8.2. Формы представления систем взаимозависимых эконометрических моделей 307 8.3. Косвенный метод оценки коэффициентов структурной формы систем взаимозависимых эконометрических моделей 318 8.4. Оценивание параметров структурной формы на основе двухшагового МНК с использованием инструментальных переменных 330 8.5. Оценки параметров системы взаимозависимых эконометрических моделей с использованием трехшагового МНК 341 Вопросы к главе VHI 345 Упражнения к главе VIII 345 ГЛАВА К. ЭКОНОМЕТРИЧЕСКИЕ МОДЕЛИ С ПЕРЕМЕННОЙ СТРУКТУРОЙ 348 9.1. Причины изменчивости структуры модели 348 9.2. Тестирование изменчивости структуры эконометрической модели 351 5
9.3. Эконометрические модели с переключениями 363 9.4. Эконометрические модели с эволюционно меняющимися коэффициентами 368 Вопросы к главе IX 371 Упражнения к главе IX 371 ГЛАВА X. ЭКОНОМЕТРИЧЕСКИЕ МОДЕЛИ СО СПЕЦИФИЧЕСКИМИ ПЕРЕМЕННЫМИ 374 10.1. Эконометрические модели с ошибками в переменных 374 10.2. Модели с фиктивными независимыми переменными 382 10.3. Модели с дискретными зависимыми переменными 387 103.1. Модели бинарного выбора 389 10.3.2. Модели мноэюественного выбора 403 10.3.3. Модели счетных данных 416 10.4. Модели с ограниченными зависимыми переменными 422 10.4.1. Модели усеченных выборок 422 10.4.2. Модели цензурированных выборок 427 10.4.3. Модели случайно усеченных выборок (selection-model) 431 10.5. Методы оценки параметров моделей с дискретными и ограниченными зависимыми переменными 434 10.5.1. Метод максимального правдоподобия 435 10.5.2. Метод максимального счета (MSCORE) 440 Вопросы к главе X 442 Упражнения к главе X 443 ГЛАВА XI. МЕТОДЫ ОЦЕНКИ ПАРАМЕТРОВ НЕЛИНЕЙНЫХ ЭКОНОМЕТРИЧЕСКИХ МОДЕЛЕЙ 450 11.1. Особенности оценки параметров нелинейных моделей 450 11.2. Метод прямого поиска 457 11.3. Методы, основанные на линейной аппроксимации модели 459 11.4. Методы, предполагающие линеаризацию целевой функции 462 11.5. Качественные характеристики оценок параметров нелинейных эконометрических моделей _466 Вопросы к главе XI . 467 Упражнения к главе XI 468 ГЛАВА ХП. ИСПОЛЬЗОВАНИЕ ЭКОНОМЕТРИЧЕСКИХ МОДЕЛЕЙ В ПРОГНОЗИРОВАНИИ СОЦИАЛЬНО- ЭКОНОМИЧЕСКИХ ПРОЦЕССОВ 470 12.1. Особенности эконометрического прогнозирования 470 12.2. Методы оценки дисперсии прогноза при детерминированном прогнозном фоне 479 12.3. Методы оценки дисперсии прогноза при случайном прогнозном фоне 483
12.4. Прогнозирование на основе моделей временных рядов 486 Вопросы к главе ХП 493 Упражнения к главе XII 494 КРАТКИЙ СЛОВАРЬ ТЕРМИНОВ ■ 497 ПРИЛОЖЕНИЕ 1. Функция стандартного нормального распределения 502 ПРИЛОЖЕНИЕ 2. Двусторонние квантили распределения Стьюдента 504 ПРИЛОЖЕНИЕ 3. Таблица критерия Дарбина-Уотсона для а= 0,05 505 ПРИЛОЖЕНИЕ 4. Таблица критерия Фишера для а = 0,05 507 ПРИЛОЖЕНИЕ 5. Квантили распределения x^(v) 508 СПИСОК ЛИТЕРАТУРЫ 509
ВВЕДЕНИЕ Термин эконометрия (эконометрика) введен в научную литературу в 1930 году норвежским статистиком Рагнаром Фришем для обозначения нового направления научных исследований, возникшего из необходимо- сти научно-обоснованного подтверждения и доказательства концепций и вьшодов экономической теории результатами количественного анализа рассматриваемых процессов. Основная задача эконометрики состоит в построении моделей специфического типа (эконометрических моделей), описывающих взаимообусловленное развитие социально-экономических процессов на основе информации, отражающей распределение их уров- ней во времени или (и) в пространстве однородных объектов. Эти модели используются в анализе и прогнозировании общих закономерностей и конкретных количественных характеристик рассматриваемых процессов, определении управляюыщх воздействий. Вследствие этого в самом широ- ком толковании эконометрию можно рассматривать как объединение ря- да дисциплин — экономической теории (включая микро- и макроэконо- мику, социальную сферу), социально-экономической статистики и теории измерения общественных процессов, математической статистики и мето- дов экономико-математического моделирования. Каждая из перечисленных вьппе дисциплин играет свою роль в эконо- метрическом исследовании. Экономическая теория занимается вопросами разработки концепций относительно законов развития исследуемых про- цессов с учетом их взаимосвязей; социально-экономическая статистика и теория измерений — выражением количественных и качественных со- стояний этих процессов (как правило, в последовательные периоды (мо- менты) времени) в виде набора логически непротиворечивых и содержа- тельных показателей; методы экономико-математического моделирова- ния — разработкой моделей взаимосвязей между рассматриваемыми процессами, адекватно отражающими экономические концепции в рам- ках выбранной системы показателей; математическая статистика — соб- ственно построением самих моделей (т.е. оценкой их параметров), про- верками гипотез относительно их адекватности тенденциям процессов, значимости взаимосвязей между ними, оценками неопределенности в по- лученных результатах, вызванной систематическими и случайными ошибками и т.п. Обычно предполагается, что систематические ошибки в результатах возникают вследствие использования концепции относительно взаимо- связей исследуемых процессов неадекватной тенденции их развития, на- 8
линия систематических ошибок измерений их уровней, неправильно вы- бранной спецификации модели и ряда других причин объективного и субъективного характера. Причинами существования случайной ошибки модели, как правило, являются случайные ошибки измерения процессов, невозможность учета в модели влияний, воздействий, незначимых с точки зрения экономиче- ской теории факторов и другие подобные причины. При эконометрическом исследовании имеют место две стороны про- блемы обеспечения высокого качества его результатов — качественная и количественная. Качественная заключается в установлении соответствия между построенной эконометрической моделью и лежащей в ее основе концепции, а количественная — в точности аппроксимации (подгонки) имевшихся количественных и качественных характеристик рассматри- ваемых процессов данными модельных расчетов. В конкретных научных исследованиях «концептуальные» и собствен- но «вычислительные», прикладные аспекты эконометрии нередко отде- ляются друг от друга. В каждом из них имеют место свои проблемы, не- решенные задачи. Основная задача «вычислительной» эконометрии — собственно построение адекватной тенденциям рассматриваемых процес- сов эконометрической модели. Исследованию проблем построения таких моделей в данной работе и будет уделено основное внимание.
ГЛАВА! Проблемы построения эконометрических моделей 1.1. ОСНОВНЫЕ ЭТАПЫ ПОСТРОЕНИЯ ЭКОНОМЕТРИЧЕСКОЙ МОДЕЛИ Построение эконометрической модели — центральная проблема лю- бого эконометрического исследования, поскольку ее «качество» опреде- ляет достоверность и обоснованность результатов анализа тенденций раз- вития, прогнозов рассматриваемых социально-экономических процессов, а также вытекающих из них вьшодов, в том числе и по вопросам разра- ботки необходимых управленческих мероприятий. В эконометрических исследованиях обычно предполагается, что зако- номерности моделируемого процесса складываются под влиянием других явлений, факторов. Обобщенную форму эконометрической модели, опи- сывающей закономерности развития такого процесса, обозначенного пе- ременной у, в зависимости от уровней, воздействующих на него внешних явлений, факторов jc/, / = 1, 2,..., п, можно представить следующим урав- нением: Уг'Косхд+ег, (1.1) где Ла, Xt) — функционал, выражающий вид и структуру взаимосвязей между уровнями переменных у^ ахц в моменты времени ^=1, 2,..., Г (или на интервалах (г, f+1)); Xt = (jci/, JC2r»..., Хпд — вектор значений независимых переменных (факторов) в момент г; а= (аь, «i,..., о^) — вектор парамет- ров модели; параметр oCi вьфажает степень влияния фактора xi на пере- менную у на всем рассматриваемом интервале (1, Т)\ Oq — постоянная модели; Et — случайная ошибка модели в момент г, в отношении свойств и характеристик которой, как это будет показано далее, обычно выдвига- ются некоторые дополнительные предположения. В некоторых эконометрических исследованиях значения зависимой переменной у, и факторов Хц, /=1, 2,..., Г; /=1, 2,..., п отражают распреде- ление их уровней на совокупности однородных объектов. В этом случае индекс г выражает порядковый номер объекта (территории, предприятия 10
и т.п.), а модель (1.1) — распределение переменной у на совокупности однородных объектов под влиянием факторов, характеризующих их спе- цифические свойства. Факторы х/, /=1, 2,..., п называют независимыми, подчеркивая их неза- висимость от переменной у в смысле отсутствия обратного влияния у на х/. В связи с этим факторы xi часто именуют экзогенными (внешними) переменными, а переменную у — эндогенной (внутренней) переменной модели. Здесь термин «внутренний» подчеркивает то обстоятельство, что функционал / (а, Xt) играет основную роль при определении расчетных л значений зависимой переменной у^, после того как с использованием то- го или иного метода будут найдены количественные значения оценок а/ параметров модели а;, /=0, 1,..., п;а = (оо, ^i,..., an) — вектор оценок па- раметров модели. Термин «внешний» отражает тот факт, что значения переменных jc,, определяются вне модели (задаются только в качестве исходных данных). Эконометрика допускает различные предположения относительно «статистического» содержания внешних переменных хц, в то время как переменная д' согласно (1.1) всегда рассматривается как случайная вели- чина. Можно указать на три основные варианта статистической интерпрета- ции независимых переменных. Достаточно часто их значения интерпре- тируются как детерминированные величины. В этом случае при ошибке модели, обладающей свойствами «белого шума»\ наблюдаемые значения yt можно рассматривать как условное распределение переменной у при заданных значениях л:/,, / = 1, 2,..., n;t= 1, 2,..., Г. Математическим ожида- нием такого распределения является функционал Да, jc). Иными словами, в этом случае можно записать: у^ =M[y\xit,X2t,....Xnt] = f(a,Xt). Согласно другой интерпретации независимых переменных Xi их значе- ния хи рассматриваются как случайные величины. Например, предполага- ется, что измеренное значение Xjt характеризует /-е свойство г-го объекта, случайным образом извлеченного из генеральной совокупности однород- ных объектов. В этом случае значение Т характеризует объем выборки и для каждого / предполагается, что значения xit имеют многомерную плот- ность распределения gtixn, л:^,..., хп) и для каждого t условные распределе- ния yt при заданных хцу /=1, 2,..., п; являются независимыми между собой. ^ Т. е. ошибка обладает нулевым математическим ожиданием М[£^]=0, ее диспер- сия постоянна на всех участках рассматриваемого периода времени, а разновремен- ные значения £, и £;_,, j= 1,2,...; независимы. 11
Согласно третьей интерпретации переменных Х( предполагается, что значения хи определены с ошибкой (ошибка измерения), т.е. их можно представить в следующем виде: где xif — истинное значение фактора jc/ в момент г; щ — ошибка, допу- щенная при измерении. В отношении свойств этой ошибки выдвигаются определенные пред- положения. В отношении исходных значений yt также может быть вы- двинуто предположение, что они содержат ошибку измерения. Использование той или иной интерпретации значений независимых переменных эконометрических моделей, как правило, не вносит прин- ципиальные изменения в процедуры их построения, в методы оценки их параметров, но часто сказывается на свойствах полученных резуль- татов. Выражение (1.1) определяет лишь обпщй вид эконометрической моде- ли. В конкретных эконометрических исследованиях могут использоваться специальные типы моделей, каждый из которых имеет свои характерные особенности. Эти типы обычно можно классифицировать на основе двух признаков. Во-первых, по виду экзогенных факторов хс, во-вторых, по свойствам ошибки модели £^. В частности, в моделях регрессии классического типа обычно исполь- зуются факторы, независимые между собой и с ошибкой модели, в пред- положении, что ошибка модели имеет свойства «белого шума» — про- цесса с нулевым математическим ожиданием, постоянной конечной дис- персией и нулевой корреляцией между ее разновременными значениями (рядами et и £^_i, St и £;_2 и т.д., г = 1, 2,..., Т). Это означает, что в ряду ошибки Et отсутствуют автокорреляционные связи. Ряд ошибки может характеризоваться свойствами непостоянства дис- персии на различных участках интервала г = 1, 2,..., Г; наличием автокор- реляционных связей между соседними значениями £^ и £^_i и т.д. Наконец, ошибка может характеризоваться корреляционными связями с экзоген- ными переменными хц, как это имеет место, например, в системах эконо- метрических моделей, а также обладать другими специфическими свой- ствами. В моделях с лаговыми независимыми переменными в качестве факто- ров используются разновременные значения хотя бы одной из перемен- ных JC, т.е. значения jc^, д:/,ы, ^/.г-г»— • Аналогично в моделях с лаговыми зависимыми переменными в качестве экзогенных факторов рассматрива- ются значения переменной у в прошедшие моменты времени, т.е. значе- ния з/ььД'г-г,... • 12
в моделях с главными компонентами факторы формируются как ли- нейные комбинации первоначально выбранных экзогенных переменных, т.е. фактор 1ц -Y^^ij '^jt »гдеЬу — коэффициенты. j Специальные типы эконометрических моделей временных рядов (ста- ционарных и нестационарных), получившие широкое применение в ис- следованиях динамики финансовых показателей и ряда других явлений, описывают процессы, тенденции которых предопределены их внутрен- ними закономерностями. В таких моделях в качестве факторов обычно используются либо прошлые значения независимой переменной yt-u д;;_2,..., либо значения ошибки £j«i, £^_2,..., либо те и другие совместно. К особым типам моделей относятся и системы взаимозависимых эко- нометрических уравнений, характеризующихся следующими особенно- стями. Во-первых, как это следует из названия, такие модели состоят из нескольких уравнений типа (1.1), в каждом из которых используется своя зависимая переменная у it. Во-вторых, зависимая переменная, например /- го уравнения, выступает уже в качестве независимого фактора в других уравнениях системы. Присутствие таких переменных в системе уравне- ний делает их взаимозависимыми между собой, что, в свою очередь, пре- допределяет наличие у таких систем особых свойств. Модели могут различаться и по характеру связей факторов с перемен- ной у. По этому признаку их разделяют на линейные и нелинейные. Эконометрические модели могут различаться и по свойствам своих параметров (модели с постоянной и переменной структурой), и по целому ряду других признаков. Характерная особенность эконометрического исследования заключа- ется в том, что зачастую априорно наиболее подходящий для рассматри- ваемого процесса тип модели определить не представляется возможным. Но при этом, как правило, на основе содержательного анализа рассматри- ваемого явления обычно удается выделить приемлемые альтернативные варианты модели и сформировать их исходные предпосылки. По резуль- татам этапов эконометрического исследования эти варианты уточняются и среди них выбирается тот, который в большей степени соответствует рассматриваемому процессу, явлению. В общем случае процедуру построения эконометрической модели можно разделить на несколько взаимосвязанных между собой этапов. Основные среди них имеют следующее содержание. !• Анализ специфических свойств рассматриваемых явлений и процессов и обоснование класса моделей, наиболее подходящих для их описания (идентификация модели). Отметим, что в общем случае целями этого этапа являются: 13
1.1. Выбор рационального состава включаемых в модель пере- менных и определение количественных характеристик, отражающих их уровни в прошлые периоды времени (на однородных объектах не- которой совокупности — территориях, предприятиях и т.п.). 1.2. Обоснование типа и формы модели, выражаемой математиче- ским уравнением (системой уравнений), связывающим включенные в модель переменные. 2. Оценка параметров выбранного варианта модели на основании исходных данных, выражающих уровни показателей (переменных) в различные моменты времени или на совокупности однородных объ- ектов. 3. Проверка качества построенной модели и обоснование вывода о целесообразности ее использования в ходе дальнейшего эконометри- ческого исследования. 4. При выводе о нецелесообразности использования построенной эконометрической модели в дальнейших исследованиях следует вер- нуться к первому (или какому-либо другому этапу) и попытаться по- строить более качественную модификацию модели (другой вариант модели). Выделенные этапы построения моделей достаточно условны. Состав используемых на них процедур, приемов и методов, их очередность зави- сят от типа разрабатываемой эконометрической модели, особенностей исследуемых процессов, свойств исходных данных и т.п. Отметим при этом, что совокупности методов содержательного анали- за и методов количественного анализа используются, дополняя друг дру- га, но с разными «удельными весами», на всех этапах построения моде- лей. Несомненно, центральное место в эконометрическом исследовании занимает этап оценки параметров модели. По его результатам конкрети- зируется ее уравнение, полученные оценки параметров которого играют ведущую роль и при проверке качества модели и при обосновании на- правлений ее дальнейшей модификации. Основную нагрузку на этапе оценки параметров модели несут методы теории вероятностей и матема- тической статистики, имеющие определенные специфические особенно- сти в зависимости от типа рассматриваемой модели. В первой главе изложены основные, достаточно общие для всех типов моделей, подходы к решению проблем, возникающих на различных эта- пах их построения, на примере наиболее широко используемого на прак- тике класса линейных моделей, выражаемых единственным уравнением, аддитивно связывающим рассматриваемый процесс (зависимую пере- менную) с рядом определяющих закономерности его развития внешних факторов (независимых переменных). При этом мы не будем вьщвигать 14
никаких предварительных предпосылок относительно других возможных «внутренних» свойств этого процесса, поскольку при рассмотрении об- щих вопросов их роль не столь существенна. 1.2. ОСОБЕННОСТИ ОБОСНОВАНИЯ ФОРМЫ ЭКОНОМЕТРИЧЕСКОЙ МОДЕЛИ Основные подходы к решению проблем первого этапа исследования в значительной степени базируются на методах содержательного анализа закономерностей рассматриваемых процессов, подкрепляемых по мере необходимости методами общей и математической статистики. Дело в том, что в практических исследованиях на предварительном этапе вид функционала эконометрической модели (1.1) и точный состав включенных в нее факторов могут быть априорно не известны. Часто имеются несколько альтернативных их вариантов, среди которых необхо- димо выбрать наиболее «приемлемый». «Приемлемость» может отражать как требования экономической теории, так и необходимые ограничения по точности аппроксимации функционалом Да, д:,) исходного ряда зави- симой переменной >'/, г = 1, 2,..., Г. В этой связи прежде чем подойти к решению задач первого этапа, не- обходимо сформировать хотя бы предварительные исходные предпосыл- ки относительно конкретного состава независимых переменных х/, вида функционала, связывающего их с зависимой переменной у. Исследова- тель может использовать различного рода «теоретические гипотезы» эко- номического и математического содержания в отношении вида функцио- нала, свойств процессов yj, хи и f/. Состав переменных д^* и форма функционала/могут отражать либо экономическую концепцию, лежащую в основе взаимосвязи мехзду за- висимой и независимыми переменными, либо эмпирические (т.е. вы- явленные в ходе конкретных исследований) взаимосвязи мезццу ними. Исходными данными, необходимыми для построения эконометриче- ской модели, являются известные наборы (массивы) значений зависи- мой переменной у и независимых факторов jc/. Могут использоваться два принципиально различных типа исходных информационных масси- вов — статический и динамический. Статический массив представляет собой значения результирующей (зависимой, объясняемой и т.п.) пере- менной у и влияющих на нее факторов (независимых, объясняющих пе- ременных) JC,, имевших место у объектов однородной совокупности в определенный период времени. Пример таких объектов — однотипные промышленные предприятия (заводы одной отраслевой направленно- 15
сти). в качестве у в практических исследованиях часто рассматриваются показатели производительности труда, объемов выпускаемой продук- ции и некоторые другие. В качестве дг/ — влияющие на уровень этих по- казателей факторы — объемы используемых фондов, численность и квалификация рабочей силы и т.п. Приведем другой пример статической информации, характерной для социальных исследований. В качестве у рассматриваются показатели заболеваемости (смертности) населения в регионах страны. Их уровень в каждом из регионов определяют значения независимых факторов, от- ражающих достигнутый материальный уровень жизни, климатические условия, состояние окружающей среды и т.п. В этом случае необходи- мая для построения эконометрической модели информация собирается по совокупности регионов страны за фиксированный промежуток вре- мени (год). В общем случае будем считать, что необходимая для построения эконометрической модели базового типа (1.1) статическая информация выражается следующими массивами взаимосоответствующих наборов данных: >'i ^^ -^1 -^1 ••• ^а ••• -^л!' Zi _^^ ^L>_f?y__J.L* f^_jji_J^f-d yN ^^ ^N ^N ••• ^iN ••• -^nN» где yj — уровень зависимой переменной на у-м объекте совокупности; Xij — уровень фактора /-го фактора нау-м объекте совокупности; / = 1, 2,...,п;у=1,2,...,М В общем случае эконометрическая модель, использующая динамиче- скую информацию, связывает значения некоторой зависимой переменной yt в моменты времени t со значениями независимых переменных (факто- ров) Xit, рассматриваемых в те же моменты времени (или в предшествую- щиe)^ ^=1,2,..., Т. Такая информация может отражать, например, уровни производительности труда на одном из заводов и определяющих их зна- чения факторов в последовательные периоды времени. Исходная информация для построения эконометрических моделей может быть и смешанного типа. Например, она выражает уровни интере- сующих переменных по группе заводов за ряд лет. Несложно заметить, что принципиального различия между статиче- ским, динамическим и смешанным массивами не существует. Индекс Г, в ^ В этом случае значения факторов будут обозначаться как х/, t-u Xi^ ,_2,. 16
частности, может обозначать единицу совокупности (объект), так что на- бор уь У2,..-, Ут может рассматриваться как выборка из Т заводов (регио- нов) и наоборот, индекс7=1, 2,..., ^V может обозначать время. Это же отно- сится и к независимым переменным xij и хц. Вследствие этого в дальней- шем при изложении материала (если это не оговорено специально) для определенности будем использовать динамические индексы. При формировании исходной информации для эконометрической мо- дели чрезвычайно важная проблема — выбор показателей, адекватных сущности исследуемых явлений. И здесь следует обратить внимание на определенную подмену понятий, которая обычно происходит на первом этапе построения модели при переходе от содерэюательного анализа яв- лений к формированию отраэюающих их уровни количественных харак- теристик (показателей). В ходе содержательного анализа явление часто рассматривается на качественном уровне. Специалисты оперируют достаточно обобщенными понятиями, например, заболеваемость, уровень медицинского обслужи- вания, качество и уровень жизни, климат, качество рабочей силы и т.п. Часто эконометрическая модель строится именно для выражения зако- номерности, существующей между явлениями. Однако при построении модели используется исходная информация, наборы показателей, кото- рые выраж:ают эти явления, их свойства, тенденции в виде количест- венных характеристик. Поэтому желательно, чтобы такое «выражение» было в некотором смысле как можно более «точным». Для традиционных направлений исследований проблема обоснования состава показателей обычно считается решенной. Например, в исследова- ниях производительности труда, макроэкономическом анализе обычно рассматриваются уже устоявшиеся наборы показателей. Значения по- следних публикуются в статистических сборниках, научных отчетах и т.п. Их примером являются выработка на одного работающего как пока- затель, выражающий явление «производительность труда», объемы ВВП (показатель результативности экономики), объем основных фондов (по- казатель уровня материальной обеспеченности производственного про- цесса, экономики) и т.д. Вместе с тем в ряде областей эконометрических исследований такие системы показателей не могут быть сформированы столь однозначно. Часто одно и то же явление может быть выражено альтернативными ва- риантами показателей. Например, общий показатель заболеваемости в ре- гионе за год может быть выражен суммарным числом заболеваний насе- ления в течение этого периода времени. С другой стороны, в качестве ме- ры заболеваемости может выступать и показатель, выраженный в виде суммарного количества дней продолжптппт ппптн ^^ппр?ней. 17
Однако в обоих этих случаях не учитывается степень тяжести болезни. Попытка такого учета приводит к необходимости расчета средневзве- шенного показателя заболеваемости. Но здесь сразу возникает проблема обоснования адекватных «весов». Тяжесть болезни может определяться, например, по степени ее опасности, рассчитываемой как доля обуслов- ленных ею смертных случаев в общем их количестве; на основании субъ- ективного показателя «дискомфортности» состояния больного и т.п. Аналогичные проблемы должны быть решены при обосновании пока- зателей климата. Для этих целей обычно используются средняя темпера- тура воздуха, влажность, число солнечных дней в году и т.п., а также по- строенные на их основе некоторые комплексные характеристики. В отсутствие объективных данных в эконометрических исследованиях допускается замена одного показателя другим, косвенно отражающим то же явление. Например, среднедушевой доход как показатель материаль- ного уровня жизни может быть заменен на среднегодовой товарооборот на одного жителя региона и т.п. Неправильный выбор показателя, представляющего рассматриваемое явление в модели, может существенно повлиять на ее качество, В этой связи к проблеме обоснования состава показателей (переменных) эконо- метрической модели на практике следует относиться с предельным вниманием. Предположим, что общее число независимых факторов, которые целе- сообразно включить в модель, равно л, / = 1, 2,..., л, и на основе измерен- ных значений всех переменных в моменты времени г = 1, 2,..., Г был сформирован массив исходных данных, который будет рассматриваться в качестве информационной основы при построении эконометрической мо- дели. Данный массив образован вектором-столбцом значений зависимой пе- ременной з' = (уь у2» — » Ут)'^ и матрицей значений независимых перемен- ных Х = размерностью Тхп таким образом, что каждому элементу у, вектора j^ со- ответствует строка матрицы X, Рассматривая проблему выбора конкретного вида функционала Дб? Xt) из выражения (1.1) заметим, что в практике эконометрических исследо- ы ■^2 ^■^7 ДС21 . ^22 • Х2Т . •• ^пЛ ■■ Х„2 •• ^пТJ ' ()' означает операцию транспонирования. 18
ваний используется достаточно широкий круг функциональных зависи- мостей между переменными. Приведем некоторые, наиболее часто ис- пользуемые, их виды: 1) линейная Уг^Оо +^1 Хи ^..ЛОп Хга + ^, (1.2) 2) правая полулогарифмическая Уг^а^ +^1 \x\xx, л-^лоп 1шсп/ +£^, (1.3) 3) степенная 4) гиперболическая yt= ao'hai/xu+..^+cXn/xnt+ et, (1.5) 5) логарифмическая гиперболическая lnyt=ao+ai/ хи-^^лоп/ Xnt+St, (1.6) 6) обратная линейная (функция Торнквиста) 1/у/= ao+ai/xu-^..ло^/хга ^St. (1.7) 7) функция с постоянной эластичностью замены >'r=k^i7+-+^n^n/'r ^-^г' (1-8) где X^^p—также параметры функции. 8) экспоненциальная функция у^ =ao+ori-^A-^ir л-,,лау^'еРп^г^ +£^, (1.9) где Д,..., Д — также параметры функции. На практике могут встретиться и комбинации рассмотренных выше зависимостей. Например, У^ =^0 +«1 IXxt +^2 \nX2t +^3^^' +... + f; И Т.П. Большинство функций Д с? JCr) с помощью определенного набора пре- образований могут быть приведены к линейной форме (1.2). Например, еслид^ и JC, связаны зависимостью ^'--l/x/ (выражение (1.5)), то введя пе- ременные м/=1/х/, получим выражение (1.2) с точностью до преобразова- ния исходных факторов. В практических исследованиях часто, используя преобразование М|=1пх/ и z=lny, степенную модель (1.4), преобразуют к линейному виду, связывающему логарифмы переменных j; и JC/. Однако заметим, что в дан- 19
ном случае с точки зрения математики такое преобразование не совсем корректно из-за «аддитивности» ошибки в выражении (1.4). Поэтому зна- чения коэффициентов линейной относительно логарифмов переменных модели нельзя в общем случае полагать равными соответствующим зна- чениям степенного аналога. На примере линейной эконометрической модели покажем еще одну возможную форму представления моделей такого типа — моделей, в ко- торых отсутствует свободный коэффищ1ент {%. В общем случае такая мо- дель представляется в следующем виде: о о о о yt =(Х\ xif¥a2 X2t + ,..af, xnt-^e^. (1.10) о о Найдем взаимосвязи между переменными yt и у^.хи и хц и опреде- лим, чему равен коэффищ1ент аь- Для этого просуммируем по индексу г правую и левую части модели (1.2). Получим t t t t Поскольку Z^ = 0, что отражает свойство равенства нулю математиче- ского ожидания опшбки {ЩеЛ = Z^r/1=0), то разделив правые и левые части этого выражения на Г, получим откуда следует, что ao=y-ai^i-...-flr„^w. (1.11) где у — среднее значение переменной у,» jc,— среднее значение /-го фактора, f= 1,2,..., Г; /= 1,2,..., п. Вычтем аь из уравнения (1.2). Получим для всех t yt -y = ^\{xit -^О+.-.+^Л^п/ -^n)+^r • (1-12) Из (1.12) непосредственно вытекает, что yt^'yt-y* Xit =Xit-xi. (1.13) Операция (1.13) определяет так называемые центрированные пере- менные и называется операцией центрирования. Для центрированных пе- ременных справедливы следующие очевидные соотношения: Еу, =0,2^/^=0. (1.14) 20
Использование центрированных переменных иногда значительно уп- рощает процедуры получения некоторых результатов, делает более на- глядной их интерпретацию. о о Исходная информация для такой модели (вектор у и матрица X ) по- лучается вычитанием из каждого элемента каждого столбца соответст- вующего среднего (по столбцу) значения. Как было отмечено выше, конкретный вид функциональной зависимо- сти Д^:? ^t) может выражать какую-либо содержательную концепцию, от- ражающую предполагаемый характер взаимосвязей между процессами у/ их/г,/= 1,2,.,,, п, В основе использования степенной функции (1.4), например, обычно лежит концептуальное допущение о постоянстве частной эластичности выпуска у по каждому ресурсу (фактору) х/. Напомним, что частная эла- стичность в точке t показывает, на сколько процентов изменится зависи- мая переменная д'^ при изменении фактора ;с,/ на 1% при условии постоян- ства значений остальных факторов в этой точке. Частная эластичность определяется следующим выражением: Э,=^.^. (1.15) Подставим вместо У( в правую часть выражения (1.15) функцию aQX^^ ...х^р . Учитывая, что ^-^ = а,- • Uq • х^^ ...xf^^'^ .• • ^щ"» получим dXij 3u = CXi, (1.16) Таким образом, коэффициент модели (1.4) cxt сразу определяет значе- ние эластичности >^ по фактору л:/ навеем интервале (1,7). Удобство экономической интерпретации параметров модели (1.4), от- носительная простота ее записи и послужили причиной ее широкого ис- пользования, особенно в макроэкономических исследованиях. Особую известность получили различные модификации двухфактор- ной функции Кобба-Дугласа которые обычно применяются в макроэкономических исследованиях при анализе взаимосвязи между объемом полученного валового внутреннего продукта (у) и используемыми ресурсами (xi — основные фонды и Х2 — затраты живого труда). Между собой эти модификации, в основном, раз- личаются ограничениями, накладываемыми на значения коэффициентов Oi и 0^2, а также способом выражения и содержательной интерпретацией 21
коэффициента Oq. Например, «классический» вариант функции (1.17) предполагает, что значения а\ и (Х2 удовлетворяют следующим офани- чениям: а\-\-сх2=\\ а^ СХ2>0. В других вариантах этой функции дополнительно вводят сомножитель е^, выражающий влияние на валовый продукт временного фактора, ха- рактеризующего научно-технический прогресс и т.п. Функция (1.8) обычно используется в предположении о постоянстве эластичности замещения одного фактора другим. Например, если речь идет о замене фактора «тpyд»(L) фактором «капитал» (А^, то значение ко- эффициента эластичности замещения показывает, на сколько процентов изменится капиталовооруженность (K/L) при изменении предельной нор- мы замещения труда капиталом (Nkl =-dK IdL) на 1% при условии, что зависимая переменная не изменится. Значения всех других факторов при этом предполагаются также неизменными. В общем случае эластичность замещения /-го фактора7-м определяется выражением: ^ji = ^ dNji Xj/Xi^ ' dxj I Xi Nji (1.18) Предельная норма замещения i-го фактора у-м Nji показывает количе- ство у-го фактора, которое требуется для замены одной единицы /-го фак- тора при сохранении постоянных уровня зависимой переменной и значе- ний остальных независимых переменных. Проводя расчеты по формуле (1.18) для функции (1.8), получим, что для всех / иу и для всех значений Г=1,2,..., Т эластичность замещения прироста одного фактора соответствующим изменением другого является постоянной: Э,у=-^. (1.19) ^ 1 + р Во многих практических исследованиях столь строгие теоретические концепции, предварительные допущения о содержательных сторонах взаимодействия между явлениями отступают на второй план. Для них главное — построение уравнения, достаточно точно выражающего взаи- мосвязи, адекватные тенденциям изменений переменных у и jc/, / = 1, 2,...,л; на временном интервале (1,7). Более того, часто именно «удачная» форма уравнения эконометрической модели кладется в основу разрабатываемой теоретической концепции, которая затем находит свое применение в последующем анализе. Очевидно, что наиболее «подходя- щая» форма обеспечивает наилучшее приближение теоретических (рас- л четных) значений у^ =У(а,дг,) к действительным значениям у,. 22
Обычно выбор такой формы осуществляется на основе графического анализа тенденций развития соответствующих процессов. Например, если переменная у и переменная jc, изменялись во времени согласно графикам, представленным на рис. 1.1, то логично предположить, что Для графиков, представленных на рис. 1.2, характерна логарифмиче- ская зависимость д'/ --Inx//. В этих и во многих других случаях, как правило, в качестве функции j{a, Xt), выражающей взаимосвязи между включенными в модель незави- симыми переменными jc/, /=1, 2,..., п, выбирается либо линейная форма (1.2), либо степенная (1.4). Заметим, что значение частной эластичности у по фактору JC|, рассчитанное на основе выражения (1.15) для функции (1.2) равно: (1.20) и, таким образом, этот показатель изменяется во времени в соответствии с изменениями значений переменных у и jc/. Рис. 1.1 у к А^' Рис. 1.2 23
Аналогично можно показать, что предельная норма замещения фак- торов i и 7 для функции (1.17) также является переменной величиной N2U=-^'^, (1.21) И ее значение также зависит от соотношения уровней рассматриваемых факторов в каждый момент времени. 1.3. МЕТОДЫ ОТБОРА ФАКТОРОВ «Оптимальный» состав факторов, включаемых в эконометрическую модель, одно из основных условий ее «хорошего» качества, понимаемо- го и как соответствие формы модели теоретической концепции, выра- жающей содержание взаимосвязей между рассматриваемыми перемен- ными, и как точность предсказания на рассматриваемом интервале вре- мени г=1, 2,..., Т наблюдаемых значений переменной yt уравнением Проблема выбора «оптимальных» факторов обычно решается на основе содержательного и количественного (статистического) анали- за тенденций рассматриваемых процессов. На этапе содерэюательного анализа решается вопрос о целесообраз- ности включения в модель тех или иных факторов, исходя из «здравого» смысла. В макроэкономических исследованиях состав факторов, как пра- вило, определяется на основании допущений экономической теории. Пример — двухфакторные производственные функции типа Кобба- Дугласа, постоянной эластичности замены, которые строятся в предпо- ложении, что объем выпуска (производства) экономической системы в основном зависит от размеров используемых основных фондов и количе- ства затраченного труда. Далее, как это было отмечено в разделе 1.2, про- изводственная функция типа Кобба-Дугласа учитывает предположение о постоянной эластичности выпуска по каждому из факторов, а функция постоянной эластичности замены — свойство постоянства замещения из- менения одного из этих факторов изменением другого. На этапе содерэюательного анализа обычно решается проблема ус- тановления самого факта наличия взаимосвязей меэюду явлениями. Од- нако, как было отмечено в разделе 1.2, каждое из явлений может быть выражено разными факторами и даже их комбинациями. Поэтому в ряде исследований на основании содержательного анализа однозначно состав независимых переменных модели определить практически невозможно. Могут существовать их альтернативные наборы. Например, для исследо- 24
вания закономерностей динамики производительности труда на заводе могут быть отобраны, исходя из содержательной целесообразности, сле- дующие факторы: объем основных фондов, электровооруженность труда, фондовооруженность труда, численность рабочей силы, ее квалификация. При этом квалификация как явление может выражаться разными показа- телями, например, средним уровнем образования работников, их усред- ненным квалификационным разрядом и т.п. Кроме того, можно ожидать, что показатели электровооруженности, фондовооруженности труда, объ- ема основных фондов характеризуют одно и то же явление — уровень материально-технической оснащенности производственного процесса. Таким образом, некоторые из рассматриваемых в таком исследовании по- казателей, выражающих количественные характеристики независимых переменных, относятся к сходным явлениям. Аналогично, в исследованиях заболеваемости населения каждая из определяющих это явление причин может быть количественно отображе- на разными факторами. Например, уровень жизни — среднедушевым до- ходом, обеспеченностью жильем, розничным товарооборотом в расчете на одного жителя и т.п.; климатические условия — среднегодовой темпе- ратурой, числом солнечных дней в году, влажностью и рядом других по- казателей; качество окружающей среды — среднегодовыми объемами выбросов и сбросов загрязняющих веществ, среднегодовыми уровнями их концентрации в воздухе, воде и почве и т.д., уровень медицинского обслуживания — количеством медицинских работников в расчете на од- ного жителя; числом койкомест в лечебных заведениях на одного жителя и другими показателями. Несложно заметить, что факторы, выражающие одну и ту же причи- ну, могут быть тесно взаимосвязаны между собой. Так, уровень рознич- ного товарооборота в основном зависит от среднедушевого дохода; концентрация загрязняющих веществ — от объемов их выбросов; на- блюдается взаимосвязь между обеспеченностью населения медицин- ским персоналом и койко-местами в лечебных учреждениях и т.д. Вследствие этого одновременное включение таких факторов в модель вряд ли целесообразно, поскольку таким образом одна и та же причина будет учтена дважды. В результате в общем случае на этапе обоснования эконометриче- ской модели исследователи могут столкнуться с проблемой выбора наи- более предпочтительного состава независимых факторов среди ряда альтернативных вариантов, Моэ/сно выделить два основных подхода к решению этой проблемы. Первый предполагает априорное (до построения модели) исследова- ние характера и силы взаимосвязей мезкду рассматриваемыми пере- 25
менными, по результатам которого в модель включаются факторы, наиболее значимые по своему «непосредственному)^ влиянию на за- висимую переменную yt. И, наоборот, из модели исключаются факто- ры, которые, либо малозначимы с точки зрения силы своего влияния на переменную >^/, либо их сильное влияние на нее можно трактовать как индуцированное взаимосвязями с другими экзогенными пере- менными. Второй подход к отбору независимых факторов — можно назвать апостериорным — предполагает первоначально включить в модель все отобранные на этапе содержательного анализа факторы. Уточне- ние их состава в этом случае производится на основе анализа харак- теристик качества построенной модели, одной из групп которых яв- ляются и показатели, выражающие силу влияния каждого из факто- ров на зависимую переменную >^/. Рассмотрим особенности процедуры отбора факторов на основе ис- пользования каждого из этих подходов подробнее. В основе «априорного» подхода леэюат следующие предполоэюения, 1. Сильное влияние фактора на зависимую переменную должно под- тверэ/сдаться и определенными количественными характеристиками, важ:нейшей является их парный линейный коэффициент корреляции, вы- борочное значение которого рассчитывается на основании имеющейся информации по формуле: Т ^ ^ где у , xi — средние значения соответствующих переменных, г, о^и Сх^ — их среднеквадратические отклонения. Логика использования коэффициента парной корреляции при отборе значимых факторов на практике состоит в следующем. Если значение \гух\ достаточно велико, т.е. Iry^^l > А» где р\ — некоторый эмпирический ру- беж (на практике /7i=0,5-0,6), то можно говорить о наличии существенной линейной связи между переменными у и JC/ или о достаточно сильном влиянии Х( на у. Чем больше абсолютное значение Гух-у тем сильнее это влияние (положительное или отрицательное, в зависимости от знака г). Значение Гу^. должно рассчитываться с учетом формы преобразования ynxi в модели. Например, сслиу-^Ух^ то и коэффициент корреляции оп- ределяется между >^ и щ = 1/х, и т.п. 26
2. Если два и более факторов выраэюают одно и то лее явление (см, рассмотренные выше примеры), то, как правило, меэюду ними также должна существовать достаточно сильная взаимосвязь. На это моэюет указать выборочное значение их парного коэффициента корреляции ' ^ <^Xi^Xj На практике взаимосвязь между факторами признается существенной, если \гх^\ > f>i, где pi « 0,8-0,9. В таких ситуациях один из этих факторов целесообразно исключить из модели, чтобы одна и та же причина не учи- тывалась дважды. Однако повторим: такое исключение следует проводить только в тех случаях, когда факторы выражают одно и то же явление. Отметим, что приведенные рубежные значения (в первом случае — 0,5-0,6; во втором — 0,8-0,9) достаточно условны. В каждом конкретном случае они устанавливаются индивидуально. При их выборе существен- ную роль играет интуиция исследователя. Обычно считается: если для фактора JC/ ryx^ < 0,5, то при большом числе других достаточно значимых факторов, информацией, которую содержит в себе фактор jc, относитель- но изменчивости переменной у, можно пренебречь. Иногда же, наоборот, если состав факторов не слишком широк и фактор х/ выражает сущест- венное с точки зрения теории явление, то исследователь, стремясь не по- терять информацию о закономерностях изменчивости переменной у, мо- жет оставить его в модели и при меньшем значении выборочного коэф- фициента корреляции {Гух. ~ 0,3 -J- 0,4). При таком отборе, основанном на эмпирике и интуиции, обычно не принимается во внимание точность оценки выборочных коэффициентов корреляции, которая растет с увеличением выборки, т.е. значения Т. При фиксированном значении Т точность оценок всех коэффициентов при- мерно одинакова. Логика такого отбора в большей степени ориентирова- на на содержательную сторону проблемы учета взаимосвязей между пе- ременными модели. Значительно услож:няет проблему отбора факторов явление лоэюной корреляции, которое характеризуется достаточно высокими по абсо- лютной величине значениями коэффициентов парной корреляции у про- цессов, с содерэк:ательной точки зрения меэюду собой никак не связан- ных. Иными словами, большие значения парных коэффициентов корреля- ции могут иметь место и в тех случаях, когда тенденции рассматри- ваемых процессов совпали случайно, при отсутствии меэюду ними логи- чески обоснованной взаимосвязи, 11
Примерами ложных корреляций являются совпадающие тенденции роста потребительских расходов в постоянных ценах и роста потреби- тельских цен, роста выпуска продукции и потребления алкоголя и т.п. Ложная корреляция может помешать при построении «правильной» модели по двум причинам. Во-первых, в модель случайно могут быть введены незначимые с содержательной точки зрения факторы, характери- зующиеся значимыми величинами \Гух^\. Во-вторых, из модели могут быть исключены значимые с точки зрения влияния на у факторы, в отношении которых ошибочно признана гипотеза о том, что они выражают то же яв- ление, что и другой фактор (факторы), уже включенный в эту модель. Среди основных причин включения в модель переменных с ложной корреляцией часто называют ненадежность информации, используемой при определении значений факторов в различные моменты времени, трудности формализации факторов, имеющих качественный характер, неустойчивость тенденций изменения рассматриваемых переменных, не- правильную форму взаимосвязи между ними и т.п. Основной путь, придерэюиваясъ которого можно избеэюать ошибок, связанных с понятием «ложной корреляции», связан с проведением каче- ственного анализа проблемы, направленного на обоснование адекватного ей содероюания и формы модели. При этом моэк^но предлоэк:ить и неко- торые общие рекомендации, которых целесообразно придерживаться, следуя этим путем: 1, Число факторов, включаемых в модель, не долж:но быть слишком велико. Их увеличение мож:ет свести к минимуму ее практическую цен- ность, так как в этом случае модель начинает отраж:ать не закономер- ность развития на фоне случайности, а саму случайность, 2. Простота модели в значительной степени гарантирует ее адек- ватность, поскольку более слож:ные зависимости часто априорно труд- ноуловимы на ограниченном временном интервале, но в то ж:е время они допускают аппроксимацию достаточно простыми функциями. Иными словами, слож:ная модель мож:ет в большей степени выраж:ать второ- степенные взаимосвязи меж:ду переменными в ущерб основным. При апостериорном подходе уточнение состава факторов эконометри- ческой модели осуществляется на основе анализа значений ряда качест- венных характеристик уже построенного ее варианта. Одну из групп та- ких характеристик, наиболее важных при отборе факторов, образуют зна- чения критерия Стьюдента, рассчитываемые для коэффициентов при ка- ждом из факторов модели. С помощью этого критерия проверяется гипо- теза о значимости влияния фактора на зависимую переменную;^. Окончательное решение о целесообразности оставления фактора или его удаления из модели принимается на основе анализа всего комплекса 28
ее характеристик качества с учетом содержательной стороны проблемы взаимосвязей между зависимой и независимыми переменными. Вопросы их расчета и логика принятия такого решения будут изложены в разделе 1.4. Критерий Стьюдента лишь указывает на те факторы, которые с точки зрения статистики являются возможными (целесообразными) кандидата- ми на удаление. Ответ на вопрос о целесообразности включения в число факторов- кандидатов на удаление каждой из независимых переменных jc/, i = 1, 2,..., n, при апостериорном подходе решается уже после того, как оценены значения коэффициентов модели и определены некоторые дополнитель- ные характеристики точности полученных оценок. Вопросы определения этих характеристик рассмотрены в главе П. Будем считать, что с помощью какого-либо из методов, рассмотрен- ных в главе П, например метода наименьших квадратов, найдены числен- ные значения оценок параметров oq, ai,..., л„ линейной эконометрической модели (1.2)^ Как будет показано в главе П, эти оценки являются выбо- рочными (определенными по наблюдаемой выборке исходных данных). Согласно этому они рассматриваются как случайные величины, распре- деленные «приблизительно» по нормальному закону с соответствующи- ми математическими ожиданиями и дисперсиями (среднеквадратически- ми отклонениями). Методы оценивания параметров позволяют опреде- лить и значения дисперсий полученных оценок о(а/). Логика использования критерия Стьюдента при выявлении факторов- кандидатов на удаление из уже построенного варианта модели основыва- ется на следующих его свойствах. Напомним, что случайная величина г, определенная согласно выражению распределена по закону Стьюдента с к степенями свободы, к — объем выборки; г — выборочное среднее некоторой случайной величины z; I — ее математическое ожидание (среднее по генеральной совокупности); <j(2) — среднеквадратическое отклонение выборочного среднего. Таким образом, с помощью критерия Стьюдента может быть провере- на гипотеза о равенстве найденного выборочного среднего предполагае- мому значению математического ожидания. На практике обычно эта ги- потеза принимается, если оказывается, что для расчетного значения кри- ^ Определение значений оценок параметров эконометрической модели осуществ- ляется на основе исходной информации, вьфажаемой вектором у и матрицей X, сфор- мированными из наблюдаемых значений Зависимой и независимых переменных. 29
терия Стьюдента выполняется следующее соотношение г<г*( к), где т*( к) — табличное значение критерия Стьюдента, соответствующее довери- тельной вероятности р* и числу степеней свободы к^. При определении значимости (незначимости) /-го фактора принима- ются во внимание следующие обстоятельства. Оценка соответствующего ему коэффициента а/, полученная с использованием выбранного метода оценивания параметров, приравнивается к выборочному среднему ? . Для незначимого фактора логично предположить, что истинное значение oj равно нулю, т.е. математическое ожидание оценки равно нулю А/[а/]=0. С учетом этого расчетное значение критерия Стьюдента при проверке гипотезы о значимости /-го фактора определяется по следующей формуле: (1.25) где toll — абсолютное значение оценки коэффициента Oi в модели, харак- теризующее степень влияния /-го фактора на результирующий показа- тель; o(ai) — среднеквадратическая ошибка оценки этого коэффициента, определяемая на этапе его расчета (см. главу II). Если имеет место соотношение Ti<T*, (1.26) то влияние фактора jc/ на переме1шую у можно признать незначимым (не- достаточно значимым), где т* — табличное значение критерия Стьюдента. Если же Ti>T*, то логичен вывод, что значение Д/ может рассматривать- ся как отличная от нуля оценка /-го коэффициента модели. Таким образом, влияние факторах/ на переменную>^ целесообразно признать значимым. Если фактор JC/ признается незначимым, его «целесообразно» удалить из модели. Эта операция приводит к уменьшению общего количества не- зависимых переменных в модели. Таким образом, для практики можно предлоэюитъ следующую по- этапную процедуру построения окончательного варианта модели на ос- нове апостериорного подхода: 1. В исходный вариант модели включаются все факторы, отобранные в ходе содерэк:ательного анализа проблемы. Для этого варианта рассчи- тываются значения оценок коэффициентов модели, их среднеквадрати- ческие ошибки и значения критериев Стьюдента (выраэ/сение (L25)). ^ Вероятность/?* в данном случае определяет границы области принятия гипотезы; р* - вероятность того, что при т<т*( к) гипотеза оказьшается верной, т.е. \ -р* - веро- ятность ошибки. ^ Принятие решения о «целесообразности» удаления незначимого фактора осно- вьгаается на анализе и ряда других критериев. 30
2. Из модели удаляют незначимый фактор, характеризующийся наи- меньшим значением Ti (при условии, что ^ <r*j, и таким образом форми- руют новый вариант модели с уменьшенным на один числом факторов. Заметим, что в модели моэюет быть несколько незначимых факторов. Однако все их одновременно удалять не следует. Возможно, что незна- чимость большинства из них обусловлена влиянием «наихудшего» из не- значимых факторов и на следующем шаге расчетов эти факторы ока- жутся значимыми. 3. Процесс отбора факторов моэ/сно считать законченным, когда остающиеся в модели факторы являются значимыми, если полученный вариант модели удовлетворяет и другим критериям ее качества, то процесс построения модели моэ/сно считать завершенным в целом. В противном случае целесообразно попытаться сформировать другой альтернативный вариант модели, отличающийся от предыдущего либо со- ставом факторов, либо формой их взаимосвязи с зависимой переменной д;. Каждый из этих подходов имеет свои преимущества и недостатки. «Априорный» путь отбора факторов не обладает достаточной обосно- ванностью. Он в большей степени использует «прямые» количественные индикаторы «силы» взаимосвязей между рассматриваемыми величинами и не принимает во внимание в полной мере особенности комплексного влия- ния независимых факторов на переменную yt, т.е. своеобразные эффекты «эмерджентности» такого влияния. Этот эффект выражается в том, что со- вокупное воздействие нескольких факторов на переменную yt может значи- тельно отличаться от суммы воздействий каждого из них именно в силу наличия внутренних взаимосвязей между независимыми переменными. Вместе с тем использование априорного подхода часто позволяет уточнить некоторые предварительные альтернативные варианты наборов независимых факторов, проверить исходные предпосылки модели отно- сительно правильности выбора формы взаимосвязей между ними. «Апостериорный» подход к отбору факторов, на первый взгляд, пред- почтительнее как раз из-за того, что целесообразность включения каждо- го из факторов в эконометрическую модель определяется на основании всего комплекса взаимосвязей между вошедшими в модель переменными. Однако когда общее количество факторов достаточно велико, нет ника- ких гарантий, что множество несущественных, а то и ложных взаимосвя- зей между ними не будет превалировать над основными. В результате может оказаться, что в числе первых кандидатов на исключение будут «названы» наиболее важные, значимые с точки зрения влияния на пере- менную д^/ факторы. Поэтому в слоэюных случаях, т.е. при наличии боль- шого числа отобранных для включения в модель на этапе содерэюатель- ного анализа факторов, специалисты рекомендуют сочетать при фор- 31
мировании их «оптимального» состава оба подхода — априорный и апо- стериорный. Согласно этим рекомендациям с помощью методов «априорного» от- бора, используя при этом и содерэюательный анализ, формируются аль- тернативные варианты включаемых в модель наборов факторов. Далее с помощью методов «апостериорного» отбора эти наборы уточняются, и соответствующие им варианты моделей сопоставляются по ряду ха- рактеристик их качества. Предполагается, что лучший из вариантов мо- дели содержит и «оптимальный» набор факторов. В результате процедура отбора факторов в эконометрическую модель превращается в перебор некоторого множества их приемлемых сочета- ний, сформированных на базе «априорного» подхода. Перебирая различные варианты составов независимых факторов, рас- сматривая возможные виды их взаимосвязей с зависимой переменной, исследователь формирует и разные варианты (модификации) экономет- рической модели для описания рассматриваемых процессов. В этом слу- чае возникает проблема выбора «оптимального» или наиболее <фацио- нального» среди них. Обычно эта проблема решается на основе аналити- ческого сопоставления статистических характеристик качества построен- ных вариантов, рассчитываемых уже при известных значениях оценок их параметров. Особенности формирования основных из этих характеристик и прин- ципы их использования при определении лучшего варианта модели рас- смотрены в разделе 1.4. 1.4. ХАРАКТЕРИСТИКИ И КРИТЕРИИ КАЧЕСТВА ЭКОНОМЕТРИЧЕСКИХ МОДЕЛЕЙ Выявление лучшего варианта эконометрической модели обычно осуществляется сравнением соответствующих им качественных ха- рактеристик, которые можно рассчитать на основе исходной стати- стической информации, содержащейся в векторе у^ матрице ЛГ, и но- вой расчетной информации, появляющейся после построении кащ(о- го из вариантов модели. Логика в решении этого вопроса достаточно простая: лучшему варианту модели в общем случае должны соответство- вать и лучшие значения характеристик его качества. Основным условием высокого «качества» модели является обоснован- ность «математической формы функционала Да, jc,) как по составу вклю- ченных в него независимых переменных, так и по виду их взаимосвязей с зависимой переменной yt, в совокупности определяющих причины ее из- 32
менчивости. В этой связи новая информация, появившаяся после по- строения функционала Да, ДС/), позволяет установить, насколько удалось реализовать это условие на практике. Отметим основные подходы к оценке «качества» эконометрических моделей. Ведущая роль при определении характеристик качества эконометри- ческой модели принадлежит ряду ее «выборочной» ошибки е,, Г =1, 2,..., Г, который формируется с использованием найденных оценок ее пара- метров как ег=Уг-Уг^ (1-27) л где у^ — расчетное значение переменной у в момент г, определенное в л общем случае как у^ -fidy Xt) после подстановки в функцию Да, л:,) зна- чений оценок параметров oq, ai,..., a„ и известных значений независимых переменных X/,, /=1, 2,..., л, г=1, 2,..., Г. Например, для линейной модели л (1.2) значения у^ определяются на основании следующего выражения: л >'/=^ + а1%+-.- + «л-^д1/- (1-28) Для каждого набора оценок параметров оо, а\, «2,.-. того или иного ва- рианта модели, описывающей рассматриваемый процесс, рассчитывается «свой» ряд ошибки et, г=1, 2,..., Г, который можно интерпретировать как ряд оценок ее истинных, но неизвестных значений 6} (см. (1.1)). На первый взгляд, соответствие модели свойствам процесса и точ- ность его аппроксимации — малоразличимые между собой понятия. Вместе с тем в га основе лежат различные представления о мерах адекватности модели и процесса. С использованием методов построе- ния многочленов, например проходящих через заданные точки (задача интерполяции), можно подобрать такое уравнение Да, Xt), что его зна- чения в точках Г=1, 2,..., Г в точности совпадут с наблюдаемыми значе- ниями зависимой переменной yt. Все значения ошибок в этом слз^ае бу- дут равны нулю е{=0,1=1,2,..., Т. Однако это уравнение практически ни- когда не будет выражать общую тенденцию развития переменной yt, сформировавшуюся под влиянием независимых факторов jc,, /=1, 2,..., п', ни в промежутках между их зафиксированными в моменты г=1, 2,..., Т значениями, ни тем более в прошедшие и будущие периоды времени (см. рис. 1.3). Уравнение/(а, лг/) в этом слзд1ае будет выражать тенден- цию интерполирующего многочлена, а не реального процесса д^г- 2 Эконометрика 33
кривая, соответствующая функ- ционалу, описывающему об- щую тенденцию переменной >», измеренные значения переменной >», кривая, соответствующая интерпо- лирующему функционалу/ (fl, х,) Рис. 1.3. Различие между интерполирующим и описывающим общую тенденцию переменной >>, вариантами функционала/(а, д:^) Выражая уравнением/(а, Xt) общие закономерности процесса>^„ практи- чески невозможно добиться совпадения его значений и наблюдаемых уров- ней зависимой переменной yt в я-мерной точке Xt вследствие того, что, как было отмечено ранее, этот функционал не учитывает второстепенные при- чины изменчивости переменной >^, исходная информация не точно отражает рассматриваемые явления и т.п. Однако если вид функционала До, jc,) в це- лом соответствует общим закономерностям изменчивости переменной у, на интервале /=(1,7), то можно надеяться, что это соответствие имело место и в прошлом (т.е. при t<0), и на интервалах (t, г+1) и, что более важно, сохра- нится и в будущем (при t>T+l). Это является «определенной гарантией» то- го, что использование функционала До, Xt) в решении задач управления и прогнозирования процесса >'^ не приведет к серьезным ошибкам. Вместе с тем очевидно, что среди нескольких различных вариантов функционала Да, дг^), примерно одинаково отражающих общие тенденции процесса yt, более предпочтительным является тот из них, который обес- печивает и лучшую аппроксимацию (в математическом понимании этого термина) ряда yt, В общем случае «качество» эконометрической модели оценивается по двум группам характеристик, хотя, как это будет показано далее, пред- полагаемая группировка не вполне однозначна, поскольку, во-первых, ха- рактеристики каэк:дой из групп часто имеют двойное назначение, а, во- вторых, многие из них взаимосвязаны друг с другом. В первую из групп 34
включим показатели, критерии, выражающие «степень» соответствия построенной модели основным закономерностям описываемого ею про- цесса. Во вторую — показатели и критерии, в большей степени оцени- вающие точность ее аппроксимации наблюдаемых значений процесса yj. К критериям первой группы может быть отнесен и критерий Стьюден- та, используемый для оценки значимости влияния каждого из факторов xi, /=1, 2,..., п, на зависимую переменную д^, (см. раздел 1.3). Соответствие эконометрической модели описываемому ею процессу;;; в значительной степени может быть установлено на основе анализа свойств рассчитанного ряда ошибки е,, Г=1, 2,..., 7^. Если вариант модели «верно» отражает основные тенденции процесса yt, можно ожидать, что значения ошибки в определенной степени случайны, их свойства близки к свойствам процесса «белого шума». Если же тенденция, закономерно- сти процесса yt учитываются моделью не в полной мере (в модель не включены какие-либо существенные с содержательной точки зрения фак- торы, выбрана форма функционала Дд, д:,), не адекватная характеру взаи- мосвязей между рассматриваемыми переменными и т.п.), то в ряду ошиб- ки обычно появляется некоторая закономерность, свидетельствующая об утрате свойства ее «случайности». Заметим, что «неслучайный» характер фактической ошибки модели Ct может быть предопределен и неверно вы- бранным методом оценки параметров модели. Забегая вперед, отметим, что среди методов оценки параметров ли- нейных эконометрических моделей наибольшее распространение полу- чили метод максимального правдоподобия, метод наименьших квадратов и метод моментов. Каждый из них используется при вполне определен- ных исходных предпосылках относительно свойств ошибки модели б^. Например, классические варианты этих методов используются в предпо- ложении, что ошибки совпадают со свойствами процесса «белого шума» (нулевое среднее, конечная дисперсия, отсутствие автокорреляционных связей). При этом «метод максимального правдоподобия» предполагает известным закон распределения ошибки. Чаще всего используется пред- положение о «нормальности» ее распределения. В этой связи построенная с использованием метода максимального правдоподобия модель будет считаться адекватной рассматриваемому процессу, если свойства факти- ческой ошибки Ct, определенной согласно выражению (1.27), будут не слишком сильно отличаться от предполагаемых свойсть сшибки £} («бе- лого шума» с нормальным распределением). Для некоторых классов эконометрических моделей (например, моделей времен- ных рядов, моделей финансовой эконометрики) при выявлении соответствия модели и процесса основную роль играет также степень совпадения теоретических свойств мо- дели со свойствами описываемого ею процесса (см. главы VI и VH). 35
Метод наименьших квадратов не выдвигает столь жестких требований к закону распределения ошибки. Согласно ему оценки параметров моде- лей определяются исходя из критерия минимума суммы квадратов ошиб- ки. В такой ситуации модель, построенная с использованием данного ме- тода, будет считаться адекватной рассматриваемым процессам, если ее ошибка по своим свойствам идентична «белому шуму». Если в отношении ошибки эконометрической модели €t выдвигаются предположения, что ее свойства отличны от свойств «белого шума», то для оценки параметров модели обычно используются так называемые обобщенные модификации данных методов. Отличие ошибки модели от «белого шума» может вьфажаться, напри- мер, непостоянством ее дисперсии на различных участках интервала t=ly 2,..., Г; наличием взаимосвязи между ее соседними значениями, вы- ражаемыми, например, уравнением следующего вида St =y5£j_i+$, где ^t — новая ошибка, по своим свойствам близкая к процессу «белого шу- ма» и т.п. Однако на практике для моделей многих типов такие свойства ошибки модели априорно предвидеть обычно не представляется возможным. Их можно установить, только анализируя свойства фактической ошибки е„ полученной для моделей, оценки коэффициентов которых определены с использованием тех или иных методов оценивания. Таким образом, наличие или отсутствие свойства «случайности» в ряду выборочной ошибки модели е^ t =7, 2,..., Г, в определенной мере ука- зывает на «соответствие» или «несоответствие» модели описываемо- му ею процессу yt. В том случае когда ошибка модели «неслучайна», мо- э/сет быть рекомендовано уточнить рассматриваемый вариант модели, выбрать более подходящий для данной ситуации метод оценки ее пара- метров. Как отмечено выше, «неслучайность» ошибки может иметь различ- ный характер. Наиболее часто она выражается наличием автокорреля- ционной связи между соседними ее значениями, тенденциями, характе- ризующими изменения их квадратов, т.е. тенденциями в ряду ei^, Г = 1, 2,..., Г и других ее производных. Для выявления «неслучайности» в ряду ошибки модели обычно используют специфические тесты, мно- гие из которых будут рассмотрены в последующих главах учебника применительно к моделям соответств)^щих типов. Здесь же в качестве примера опишем особенности использования для этих целей достаточно универсального теста (критерия) Дарбина-Уотсона. Он наиболее широ- ко применяется в эконометрических исследованиях вследствие своей простоты, хотя и не обладает существенной эффективностью (достовер- ностью). Тест Дарбина-Уотсона обычно используется для установления 36
факта наличия автокорреляционной зависимости первого порядка в ря- ду ошибки £г, т.е. между соседними ее значениями, Et и £^+ь г=1, 2,..., Г. Обычно соседние значения ошибки связаны более сильной зависимо- стью, чем значения St и 6^+2, St и £^+з и т.д. Вследствие этого отсутствие автокорреляционной связи между рядами значений выборочной ошибки et и Ct-u ^ = 1, 2,..., Г-1, позволяет с большой степенью уверенности ут- верждать, что в ряду истинной ошибки модели St отсутствуют вообще какие-либо автокорреляционные взаимосвязи. Значение критерия Дарбина-Уотсона рассчитывается по следующей формуле: ^=-^^Цг-1 . (1.29) Ъ} t=\ Раскрывая квадрат в числителе выражения (1.29), получим: d^-^ ^. ^2(l-ri). (1.30) r=l где гх — коэффициент автокоррелящш первого порядка ош11бки ^^, т.е. корреляции между рядами ^^ h^z+i. Из выражения (1.30) непосредственно вытекает, что 0<d ^4. (1.31) Значение d=0 соответствует случаю, когда между рядами Ct и ^,+i су- ществует строгая положительная линейная зависимость, т.е. ri=+l, и зна- чение d=A соответствует строгой отрицательной связи, ri =-1. Если ряды Ct и ^/+1 независимы, то ri =0 и rf=2. Точки d=0; 2; 4 и определяют границы критерия Дарбина-Уотсона, в пределах которых гипотеза о наличии автокорреляции первого порядка в последовательности ошибок либо принимается (в областях близких к О или 4), либо отвергается (в области d=2), либо решение по данному кри- терию остается неопределенным (в промежутках между отмеченными областями). Иными словами, на отрезке [0,4] выделяются четыре проме- жуточные точки таким образом, что 0<d\<d2^^3^^- Если расчетное значение критерия Дарбина-Уотсона находится на отрезках [О, dj, [^4»4], то гипотеза о наличии автокорреляции первого порядка в ряду ошибок модели принимается; если расчетное значение d находится в интервале №» ^з]» — то отвергается. Значения d, приходящиеся на полуинтервалы 37
[di, di] и [^3, ^4], не позволяют сделать однозначного суждения по данной гипотезе. В последнем случае необходим более глубокий анализ зависи- мостей между значениями ошибьси е^, Г=1,2,.-, Т. Другую группу критериев, в большей степени направленных на выяв- ление степени точности аппроксимации функционалом f(a, Xt) наблю- даемых значений зависимой переменной у^ образуют широко используе- мые в статистике и эконометрике коэффициент мноэюественной кор- реляции R, коэффициент детерминации Д критерий Фишера F. Общепринятой в статистике мерой точности «аппроксимации» являет- ся дисперсия (в нашем случае дисперсия модели). Ее значение на практи- ке обычно определяется на основании следующей формулы: . \2 Т f л" yt-yt г2_М Т-п-\ (1.32) где у^ =f(a, Xt) — рассчитанные на основании уравнения модели fia, Xt) значения зависимой переменной, Т— количество измерений, «+1 — чис- ло параметров модели. Однако значение дисперсии не отражает многих существенных аспек- тов качества модели. Кроме того, оно не очень пригодно для целей со- держательного анализа. Неслоэюно заметить, что величина ошибки тесно связана с уровнем за- висимой переменной у, и в этой связи она имеет «абсолютное» содерэюа- ние. В то лее время «точность» в большей степени относительна. Поэто- му меньшее значение дисперсии еще не свидетельствует о более высоком «качестве» модели, ее аппроксимируюгцих возмоэюностях. Большая диспер- сия моэюет выраэк:ать лишь более высокие уровни зависимой переменной, а не ухудшение точности ее аппроксимации построенной моделью. «Относительность» ошибки также може!' рассматриваться в двух аспек- тах. Во-первых, по отношению к уровню переменной у, а во-вторых, — к некоторому уже установленному «эталону» точности. Как раз эти аспекты в большей степени и учитывают указанные критерии и коэффициенты. Коэффициент множественной корреляции показывает степень при- ближения расчетных (по построенной модели) значений зависимой пере- л менной у^ =fia, хд к действительным ее значениям yt. Величина коэффи- циента множественной корреляции меняется в пределах от нуля до еди- ницы (0< R<1). Значения Л, близкие к нулю, свидетельствуют о том, что л расчетные значения у^ плохо аппроксимируют значения yt. Если R бли- 38
зок к единице, это означает, что модель хорошо аппроксимирует исход- ный ряд значений>^„ /=1, 2,..., Г. Значения коэффициента детерминации также находятся на отрезке [0,1], 0<£><1. Его конкретная величина показывает долю изменчивости перемен- ной д;, объясняемую включенными в модель факторами jc/, /=1, 2,..., п. На- пример, если £>=0,81, это означает, что включенные в модель независимые переменные объясняют 81% изменчивости переменной yt, а остальная ее изменчивость объясняется неучтенными в модели причинами. Значения коэффициентов множественной корреляции и детерминации рассчитываются на основании следующего выражения^ yt-yt d=r'^^^ т f z ~\2 hyt-~y) = 1- r=iv -\2 Пу'-~у) /=1 (1.33) Обоснование целесообразности использования коэффициента детер- минации при определении качества построенной эконометрической мо- дели заключается в следующем. «Удачная» модель должна «объяснять» значительную долю изменчивости зависимой переменной yt. Количест- венной мерой этой изменчивости в статистике принято считать показа- тель, рассчитываемый на основании следующей формулы: -\2 г=1 (1.34) Заметим, что разница у^ - у представляет собой отклонение значения yt от среднего уровня этой переменной, а общая изменчивость, таким об- разом, выражается в виде суммы квадратов всех таких отклонений. После построения модели и определения на ее основании <фасчетных» значений л у^, каждое из таких отклонений можно представить в виде суммы двух составляющих yt-y^ л yt-yt \ J у ГУ (1.35) Данные показатели корректно рассчитываются лишь в случае ошибки, в ряду ко- торой отсутствуют автокорреляционные связи. Если же такие связи имеют место, то, вообще говоря, их расчетные значения, определяемые по приведенным ниже форму- лам, содержат ошибку, величина которой зависит от силы этой связи. 39
Первое из слагаемых правой части выражения (1.35) представляет со- л бой расчетное значение ошибки модели в момент г, т.е. yt -yf = ^/• Вто- рое слагаемое выражает отклонение этого расчетного значения от средне- го уровня переменной 3^/. С учетом (1.35) выражение (1.34) можно запи- сать в следующем виде: Г _ 2 ^ ^ t=\ /=1 л yt-yt \ J у г у + 2Z yt-yt У Г У t=\ t=\ \ УгУ У(-У (1.36) + 2Ze,| Как будет показано во II главе, ошибка е, обладает рядом свойств f т т используя которые можно доказать, Ze,=0, Z«'-^„=0, 1 = 1,2,...n Vi=l что последняя сумма в правой части выражения (1.36) равна нулю. Отсю- да вытекает, что общая изменчивость переменной у^ также может быть представлена в виде двух составляющих Т - -2 ^( А У ХГл lL(yt-y) =I\yt-yt\ +Z /=1 /=lV J t=\ Y УгУ (1.37) При этом первая из них \2 -р г=1 (1.38) Т Г л /=1V выражает сумму квадратов ошибки модели, т.е. часть изменчивости пе- ременной yt, не объясненную построенной моделью, а второе слагаемое Хк/"^ — часть изменчивости переменной yt, которую построенная модель объяснила. Разделив левую и правую части выражения (1.36) на Х(^^ ~^) » "^" лучим 1 = л Y Т и _ Уг-Уг\ ЦУгУ Т _2 ^ - 2 Hiyt-y) ЩУг-у) г=1 t=\ 40
Из последнего выражения непосредственно следует (1.33), т.е. Л2 Т Г Z о = л^=1 t=\ л yt-yt /=1 Таким образом, если модель абсолютно точно соответствует исходно- л му ряду зависимой переменной ух, т.е. расчетные значения у^- jia, xi) равны3^, для всех Г = 1, 2,..., Г, то D=R=l, В тех случаях, когда модель не может ни в какой мере объяснить из- менчивость переменной д',, имеем R=D=0. При линейной форме зависимо- сти Ла, Xt) это происходит, например, в тех случаях, когда значения yt равномерно распределяются вокруг линии параллельной оси X (см. рис. л _ 1.4 (а, б)), что влечет за собой равенство у^ =у ,t=l,2,...,T. Из изложенного выше следует, что высокие значения переменных D и R ассоциируются с хорошей степенью аппроксимации построенной эко- л нометрической моделью у^ =Ла, Xj) исходного (заданного) ряда значений зависимой переменной >^„ ^=1, 2,..., Г, а низкие значения — с плохой ап- проксимацией. Вместе с тем, причины плохой аппроксимации могут быть разные. В одних случаях это происходит из-за неверного выбора объяс- няющих (независимых) переменных, в других — из-за неправильно по- добранной формы уравнения модели. фактические значения у фактические значения у У ^ У ^ расчетные значения;/ -^х а) б) Рис. 1.4(а,б). Примеры распределения переменной д^^ при которых линейная л (эконометрическая модель) у^ =ао+ aiXit имеет нулевые коэффициенты детерминации и корреляции. Например, если для переменной yt, фактические значения которой обозначены прерывистой линией на рис. 1.4(a) в качестве эконометриче- 41
ской модели использовать уравнение эллипса yj =±^a-bx^ . а для пере- менной yt на рис. 1.4(6) — уравнение синусоиды yt = oq -^ aiS\na2Xt, то точность описания рассматриваемых процессов была бы значительно выше и характеристики D и Л были бы близкими к единице. Критерий Фишера (F-критерий) также используется для определения надежности всей модели путем сопоставления меры ее ошибки с величи- ной меры рассеяния переменной у^ относительно у . Величина этого кри- терия определяется по формуле Е л Угу\ 1^ F= ^^^^^-^ = -lL.LzI^, (1.39) Г г л ^ 2 1-/?2 ЕЬг-Уг| /(Г-п-1) /=1V J Целесообразность использования критерия Фишера можно обосно- вать, заменив в выражении (1.39) показатель R^ на его модификацию — скорректированный квадрат коэффициента множественной детерминации А R^, рассчитываемый с учетом замены суммы квадратов ошибки и измен- л чивости переменной yt на соответствующие дисперсии. Значение R^ рассчитывается согласно следующей формуле: л 11\У1'Уг f{T-n-l)) 0(у) т; 2 , , Z(yt'y) /(T^-i) (1.40) При этом D(e) = Ёр'/ "^z /(Г-л-1) представляет собой дисперсию ошибки et (см. (1.32)), где Г-w-l — число степеней свободы, учитывае- мое при ее определении (Г- число измерений, л+1 — количество связан- ных параметров-коэффициентов модели); 0(уУ^(у^-у] /(7-1)- дис- t=i Персия переменной;;^, Г-1 — число степеней свободы при одном связан- ном параметре у. На основании (1.33) и (1.40) взаимосвязь между квадратами коэффи- л циентов множественной корреляции R^ и R^ можно представить в виде следующего соотношения: 42
R'=l-(l-R').-L-L.. (1.41) T-n-l л Скорректированный коэффициент R^ как мера качества построенной модели имеет определенные преимущества по сравнению с его предшест- венником — коэффициентом R . В частности, из выражения (1.40) вытека- ет, что включение в модель независимых факторов, малозначащих с точки зрения объяснения изменчивости переменной у^, может вести к уменьше- л нию значения R^ (см. числитель дробной части (1.40)). В то же время по- казатель R не чувствителен к изменению количества таких переменных. Критерий Фишера может рассматриваться и в качестве «меры» обос- нованности включения в эконометрическую модель всей совокупности независимых переменных. В этом случае его можно отнести и к критери- ям первой группы, характеризующим степень соответствия построенной модели исследуемому процессу >'^ Критерий Фишера в такой ситуации рассматривается как своего рода тест при проверке гипотезы, что ни один из независимых факторов не иг- рает никакой роли в объяснении изменчивости переменной yt или, что то же самое, все коэффициенты при независимых факторах модели равны нулю (^1=0, а2=0, ..., Пп =0) (см. раздел (2.2)). В соответствии с этим отно- шение В выражении (1.39) представляет собой среднюю долю объяс- ненной изменчивости переменной yt, приходящуюся на один независи- мый фактор, а (\-R^)/(T-n-\) — среднюю долю необъясненной изменчи- вости переменной >^„ в расчете на одну степень свободы. При слабом влиянии независимых факторов на переменную з^/ (т.е. при (Я/ ->0, /=1,2,..., п) значение /?^, как и величина критерия F, стремится к нулю, и, наоборот, с увеличением Л^ численное значение F также возрас- тает. Заметим, что показатель F является случайной величиной, пред- ставляющей собой отношение двух дисперсий. Эта величина распределе- на по закону Фишера спи Т-п-1 степенями свободы (F(«, T-n-l)). Вследствие этого на практике проверка значимости коэффициентов мо- дели с использованием критерия Фишера состоит в сопоставлении его расчетного значения, определенного для построенного варианта модели по формуле (1.34), с табличным значением F*(w, T-n-l), соответствую- щим заданному уровню доверительной вероятности р* (вероятности ошибки первого рода 1-/?*) и известным степеням свободы пи Т-п-1. Если оказывается, что F<F.(n, Т-п-1), то гипотезу о незначимости совокупного влияния независимых факторов на переменную у, целесообразно принять (вероятность ее осуществления 43
равна/7*). В противном случае роль факторов в объяснении изменчивости переменной д', следует признать существенной. С ростом F эта роль при- знается все более значимой. Критерий Фишера можно использовать и при сравнении качества (точности описания исходного процесса у^ двух различных альтернатив- ных вариантов модели. В данном случае его величина рассчитывается по формуле F=- Т I Г=1 с yt-yt Л2 1 /(Г-П1-1) у f Z л yt-y} >2 (1.42) V /(Г-П2-1) J где у[ =/(аъ х/), yf yt^f\(ib х^) — расчетные значения переменной у, полученные на основе первого и второго вариантов моделей соответст- венно, различающиеся, быть может, формой зависимости/и количеством факторов jc; п\ и /i2 — количества факторов в первом и втором вариантах соответственно. Критерий (1.42) является двухсторонним. Особенности его использо- вания состоят в следующем. Если выполняется соотношение 1 F*(v2,Vi) <F^F*(vpV2), (1.43) то рассматриваемые альтернативные варианты модели признаются равно- значными с точки зрения точности описания процесса у,. Если F<- 1 (1.44) F*(V2,Vi) то выбор следует сделать в пользу первого варианта модели, а если F>F*(vi,V2). (1.45) то — в пользу второго. Р*{^ъ Уг) — табличное значение критерия Фишера, выбранное для за- данного уровня доверительной вероятности /?♦ и числе степеней свободы Ц=Г-П1-1 и ^2=Г-П2-1. В заключении данного раздела еще раз обратим внимание на опреде- ленные содержательные и количественные взаимосвязи между критерия- 44
ми и показателями качества эконометрическои модели различных групп. Например, появление автокорреляционных взаимосвязей у значений ошибки, вообще говоря, делает приведенные выше выражения критериев Фишера, коэффициента детерминации, множественных коэффициентов корреляции и т.п. некорректными. Это обусловлено тем, что используе- т мая при расчете их значений сумма квадратов ошибки ^е] не может /«1 рассматриваться как «мера точности аппроксимации» заданного ряда значений д'г» поскольку не учитывает, например, автокорреляционные свя- зи между разновременными ошибками et и £/+!, /—1, 2,.... Критерии Стьюдента и Фишера, коэффициенты детерминации и мно- жественной корреляции, отнесенные к разным группам, часто используют- ся совместно при обосновании выбора варианта эконометрическои модели. Это связано с тем, что каждый из включенных в модель факторов, как пра- вило, объясняет некоторую долю изменчивости зависимой переменной yt, пусть даже и небольшую. Вследствие этого, когда независимых факторов не слишком много и между ними не наблюдается сильных взаимосвязей, исключение из их состава даже малозначимого с точки зрения критерия Стьюдента фактора объективно уменьшает количество информации, объ- ясняющей изменчивость yt. Это, в свою очередь, влечет за собой уменьше- ние значений характеристик D, R и F. Может возникнуть такая ситуация, когда, удалив на очередном шаге незначимый фактор, исследователь полу- чает менее удачный по этим показателям вариант модели. Если нет других альтернативных ее вариантов, то возникает проблема выбора между «нена- дежным» вариантом модели со значимыми факторами и более надежным вариантом, у которого некоторые из независимых переменных незначимы. На практике обычно выбор делается в пользу более «удачной» модели, по- скольку более точное описание процесса д^^ в эконометрике является и бо- лее предпочтительным по сравнению с решением задачи установления пе- речня значимых по степени влияния на переменную;^, факторов. Таким образом, этапы формирования модели (обоснование формы функционала, состава независимых переменных) и оценки ее качест- ва в значительной степени взаимосвязаны менеду собой. Для них, как правило, нельзя установить жесткую очередность. Часто информа- ция, полученная на «более поздних этапах», заставляет пересматри- вать итоги предыдущих. Важную роль на всех этих этапах играет со- ^ В таком случае в качестве «меры точности аппроксимации» следовало бы ис- т пользовать выражение ^ef -^-l^cowieftef+i), где cov(e„ г,+,) - значение ковариации ошибок Ct и £t+i. 45
держательная сторона проблемы. Не подкрепленные результатами содержательного анализа и основанные только на «хороших» коли- чественных критериях варианты эконометрических моделей часто являются с практической точки зрения бесполезными, бессодержа- тельными «аппроксимациями». Вместе с тем качество модели в значительной степени зависит от того, насколько «удачны» оценки коэффициентов модели а,, г=0,1,... «• Они игра- ют, пожалуй, основную роль при обосновании ее «качества», поскольку на основе их значений непосредственно определяется одна из важнейших со- ставляющих модели, характеризующих ее качество, — выборочная ошибка. Основные подходы к обоснованию «качества» оценок параметров эко- нометрической модели рассмотрены в следующем параграфе учебника. 1.5. КАЧЕСТВО ОЦЕНОК ПАРАМЕТРОВ ЭКОНОМЕТРИЧЕСКИХ МОДЕЛЕЙ Эконометрическая модель считается построенной, когда определены зна- чения оценок ее параметров. Исходными данными при этом являются на- блюдаемые значения (измеренные уровни) зависимого показателя (перемен- ной) yt и независимых факторов х^, Г=1,2,..., Г; /=1,2,..., п. Таким образом, найденные количественные характеристики oq, ai,..., л„ можно рассматри- вать как оценки истинных значений параметров модели о^, бГь..., Оп, в общем случае зависящие от исходных данных и применяемого метода оценивания. Эти оценки являются случайными величинами. Их случайный характер можно интерпретировать следующим образом. Значения построенного л функционала До, xi)=yj, определенные при известном наборе оценок oq, ^1,..., Gn, можно рассматривать как оценки, аппроксимирующие наблюдаемые значения зависимой переменной >^f. Качество этой аппроксимации, а следова- тельно, и качество параметров oq, ai,..., Un увязывается со свойствами и ха- л рактеристиками случайной ошибки er^t-yt • Таким образом, каждой выбо- рочной последовательности ошибки et, f=l,2,..., Г; ставится в соответствие «свой» набор параметров и наоборот. Это и позволяет говорить о каждом из таких наборов как о выборке из некоторого множества наборов оценок пара- метров (%, Oi,..., On, соответствующей определенному методу оценивания. «Истинным» значениям параметров Oq, аи.,., Оп должен соответство- вать и «истинный» ряд ошибки модели £^, определенный как et=yt-fioixd. (1.46) Поскольку вектор истинных значений параметров А^(аь» о^и,.., an) неизвестен, то рассчитать значения St, г=1,2,..., Г на основании выраже- 46
ния (1.46) на практике не представляется возможным. Однако при из- вестных оценках коэффициентов oq, а\,..., а„ можно определить «оцен- ку» ошибки £, в качестве которой в данном случае выступают значения «фактической» ошибки е{=уг-Я^9 -^г)» ^1,2,.-, Т, полученные из выраже- ния (1.46) при подстановке в функционал / оценок параметров. Ряд ошибки Ct при этом также рассматривается как «выборочная ошибка». Полученную любым методом оценку щ коэффициента эконометриче- ской модели cXi можно рассматривать как выборочную случайную вели- чину, представленную в виде суммы ее истинного значения oCt и случай- ной ошибки Да,, /=0,1,..., п, ai = ai-\-Aai. (1.47) Из выражения (1.47) непосредственно вытекает, что о качестве оценки Л/ в этом случае можно судить по свойствам ее ошибки А(3/. При этом, хотя истинное значение Oi неизвестно, однако, как это будет показано далее, некоторые характеристики ошибки Да, и ее свойства обычно удается определить в процессе получения оценки а,. В такой ситуации хорошее качество оценок параметров модели, полу- ченных с использованием того или иного метода (о котором можно су- дить на основании характеристик качества их ошибок), является одним из важнейших условий построения «удачной» эконометрической модели. Напомним, что другим таким условием является правильное отображение основных закономерностей рассматриваемых процессов с учетом взаимо- связей между ними. Рассмотрим основные подходы к определению уров- ня качества оценок параметров эконометрических моделей подробнее. Теория статистического оценивания определяет качество оценок по свойствам несмещенности, эффективности, асимптотической не- смещенности и асимптотической эффективности, состоятельности и некоторым другим. Напомним, что оценка является несмещенной, если истинное значение параметра молено рассматривать как ее математи- ческое оэ/сидание или, иначе, математическое оэюидание ошибки оценки Aai долж:но быть равно нулю: M[ai\ = cXi,M[Aai\ = 0. (1.48) Оценка рассматривается как эффективная, если она характеризуется наименьшей дисперсией (дисперсия ошибки оценки минимальна) среди всех других аналогичных оценок, полученных различными методами, способами. а2(Дд,.) = ст2(а,.) = тт(а?(а,.)), (1.49) j ^ («/) — дисперсия оценки, полученной с использованием у-го метода оценивания. 47
Часто свойство несмещенности выполняется лишь с некоторой сте- пенью «приблизительности» при достаточно больших объемах выбороч- ных данных (при большом числе измерений Д в пределе при Т—>оо, В этом случае говорят^ что оценки являются асимптотически несмещенными. Иногда асимптотическая несмещенность рассматривается в «вероят- ностном» смысле, т.е. предполагается, что для произвольно малых по- лоэюительных чисел ^ и Т], в общем случае зависящих от Г, существует такой объем исходных данных То, что для всех Т>То имеет место сле- дующее неравенство: Р{\аР — (4<^]>\ — 7] или lim Р\ {|аР>-а,|<^} = 1, (1.50) где Р{*} — вероятность события, заключенного в фигурные скобки. Вы- ражение (1.50) означает, что предел по вероятности последовательности а/ есть а,. Оценки, обладающие таким свойством, называют состоя- тельными. Свойство состоятельности в литературе обычно выраэюа- ют символом plim(a/^) = а;. (1.51) Обратим внимание на определенные различия, связанные с использо- ванием в эконометрическом анализе свойств несмещенности, с одной стороны, и асимптотической несмещенности, состоятельности — с другой. В эконометрических исследованиях значение Т всегда конечно, и часто не очень велико из-за отсутствия необходимой информации. При конечных объемах выборки эюелательно выполнение для рассматривае- мых характеристик свойств несмещенности и эффективности. Однако в ряде случаев доказать наличие у них таких свойств не представляется возмоэк:ным, но моэюно показать, что они обладают свойствами асим- птотической несмещенности, эффективности и состоятельности. На- личие таких асимптотических свойств у оценок параметров моделей обычно в эконометрике является свидетельством более высокого их ка- чества по сравнению с другими альтернативными вариантами таких ха- рактеристик, которые этими свойствами не обладают. Кроме того, «асимптотические» свойства могут рассматриваться как преимущество «при прочих равных условиях» в том смысле, что из двух оценок более предпочтительной является та из них, которая полу- чена на основе большей по объему выборки (если по эффективности эти оценки не различимы) . ' При этом увеличение объема выборки не должно нарушать ее однородность в том смысле, что закономерности рассматриваемых процессов являются теми же как на «меньшей» выборке, так и на «большей». 48
Однако в этом случае следует проявлять определенную ocmopootc- ность. Дело в том, что при конечных объемах выборки интуитивно предполагается: чем больше значение Г, тем блиэюе полученная оценка параметра к его истинному значению и тем меньше ее ошибка. Но уве- личение объема выборки ведет к уменьшению величины смещения только в том случае, если закономерности рассматриваемых процессов на «старом» и «добавленном» временных интервалах полностью идентич- ны (однородная выборка) м, таким образом, построенные на соответст- вующей этим интервалам информации модели будут малоразличимы. В эконометрике часто приходится сталкиваться с такой ситуацией, ко- гда на отдельных временных участках закономерности процессов различа- ются. Это может быть вызвано, например, начавшимся воздействием на за- висимую переменную д', нового фактора, изменением характера взаимосвя- зей между рассматриваемыми переменными в связи с изменением их мас- штабов (действие диалектического закона перехода «количества» в «каче- ство») и по другим причинам. В этом случае увеличение числа измерений не ведет к автоматическому «росту качества» оценок параметров модели. Важнейшими характеристиками, которые учитываются при изу- чении свойств асимптотической несмещенности и состоятельности, являются асимптотическое математическое ожидание и асимптоти- ческая дисперсия. Асимптотическое математическое ожидание параметра а, определяет- ся как предел последовательности оценок его математических ожиданий, рассматриваемых при неограниченно возрастающем объеме исходных данных, т.е. количестве измерений Г: ju(ai)= lim М 7->оо ^'], (1.52) где af^ — оценка параметра, полученная при Г измерениях. Асимптотическая дисперсия определяется как предел следующей ве- личины: 1 9 а5уа-^Ц) = - lim м{л/г[//Ц)-а/]} , (1.53) где Oi — истинное значение этого параметра. Выражение (1.53) сформировано с учетом того, что оценки а/^, полу- ченные на основе различных методов, могут иметь в пределе при Г—>оо одинаковую нулевую дисперсию. Например, дисперсия выборочного среднего равна <т^Г, а выборочной медианы — тгст /2Ти при Т-^0 эти ве- личины неразличимы. Вместе с тем дисперсия случайной величины л/г Ос равна <J^, а у показателя -Jt т дисперсия равна JtG^ll, где с^ — 49
дисперсия генеральной совокупности, а Зс и т — ее выборочное среднее и выборочная медиана. Из сопоставления этих значений видно, что выбо- рочное среднее более «качественная» (асимптотически эффективная) оценка, чем медиана. Таким образом, выражение (1.53) является более наглядным при сравнении эффективности различных оценок параметров при увеличении Г. Точно так же рассмотренные свойства для конечных и бесконечных выборок распространяются и на совокупность оценок параметров, представимых в виде вектора-строки а=(ао» ^ь-., «л)'- Заметим, что в этом случае вместо дисперсии мы имеем дело с ковариационной мат- рицей этого вектора Cov(a), определяемой следующим выражением: Соу(А) = М[Да,Лл'] = cov(q,ao) cov(ao,^l) ^1 co\(aQ,an) cov(ai,a^) ,(1.54) cov(a„,ai) cov(a„,a2) ... ^^ где Ла' — вектор-строка ошибок параметров, Аа'=(Аао, A^i,..., Дп^ ), cov(a„ aj) — ковариация параметров ai и а/, асимптотическое математиче- ское ожидание вектора оценок параметров определяется согласно сле- дующему выражению: //(а)= lim (а^^М = T-4ooV / г'^^К J о J lim мГа[^^1 Г-400 lim М \.Т-^ И"]] (1.55) а асимптотическая ковариационная матрица этих оценок — согласно вы- ражению: asyCov(a)=-limM|[>/r.(//(a)-a)]{>/f4M«)-fl^)]T (1-56) Если оценка каждого из компонент вектора а состоятельна (в смысле выражения (1.50)), то состоятельным является и весь вектор. Тогда можно записать plim(a^^^)=a: 50
Достаточным условием состоятельности оценки параметра моде- ли является стремление к нулю величины математического ожида- ния и дисперсии ее ошибки (смещения) при возрастании объема вы- борки. Это условие следует из неравенства Чебышева, в свою очередь вытекающего из следующих соотношений: ^2(7) ^' ' ^ f (1.57) lim {|//(а/)-а,|<^}->1. 7->оо Заметим, что !//(«/) — а;1 = М(1Ал/^1), где 1Аа/^1 — абсолютная величи- на ошибки оценки а/^^ в предположении, что Г—>«>. Таким образом, если lim М[AaJ->0 и <j ^ ^ ^0, т.е. оценка являет- ся асимптотически несмещенной, то из (1.57) непосредственно вытекает, что, начиная с некоторого значения Го для всех Т>То можно найти малое значение ^, удовлетворяющее (1.57). Из этого следует, что plim(a/^)=6i^, и такая оценка является и состоятельной. Обратное утверэ/сдение, вообще говоря, неверно, т.е. состоятельные оценки не всегда являются асимптотически несмещенными. Однако при вы- полнении некоторых дополни?пельных условий установлено, что состоя- тельные оценки обладают и свойствами асимптотической несмещенно- сти. В частности, если оценка л,- несмещенная при конечном объеме выбор- ки и состоятельная, то она обладает и свойством асимптотической не- смещенности. Такой эюе вывод справедлив, когда известно, что существует асимптотическое математическое оэюидание состоятельной оценки и пре- дел ее дисперсии СГ(а! ) при Т--^ооравен нулю, т.е. lim а^ (а- ) = О. Состоятельность является «более удобным» при анализе свойст- вом, чем асимптотическая несмещенность, поскольку оно часто ав- томатически сохраняется при преобразованиях рассматриваемых переменных и некоторых операциях с ними. В частности, если J{a) — некоторая функция параметра а, то рИт(/((я))=/(рИт(а)). Например, plim(ab=(pVim(a))\ Аналогичные свойства имеют место и при векторно-матричных вы- числениях. Так, для произведения матриц, обратной матрицы справедли- выми являются следующие соотношения: plim(A-J?) = (plimA)- (plimB); plim(A"^) = (plimA)"\ 51
Различные методы определения значений параметров эконометриче- ских моделей могут приводить к их оценкам, различающимся по своим количественным характеристикам. При этом ухудшение свойств оцен- ки иногда обусловливается тем, что исходные предпосылки применения того или иного метода не соответствуют свойствам рассматриваемо- го процесса. Часто «необоснованность» предпосылок обусловлена тем обстоятель- ством, что в ходе анализа построенной модели не принимается во внима- ние «содержательная интерпретация» используемых данных. В связи с этим заметим, что обычно предположение о детерминированном характе- ре независимых переменных дс/, позволяет говорить о свойствах несме- щенности и эффективности оценок параметров эконометрических моде- лей на конечных выборках (т.е. рассматривать проблемы наличия или от- сутствия этих свойств у найденных оценок). В том случае, если независимые переменные имеют случайный харак- тер или при получении оценок параметров модели использовались так на- зываемые «инструментальные» переменные — их заменители, то свойст- ва полученных оценок уже имеют асимптотический характер. Иными словами, несмещенность и эффективность (если они имеют место) прояв- ляются только на больших выборках. В этой связи наиболее «популярными» методами оценки параметров линейных эконометрических моделей являются метод максимального правдоподобия и метод наименьших квадратов. Их «популярность» объ- ясняется относительной простотой вычислений и высоким качеством по- лучаемых оценок в смысле выполнения требований относительно их не- смещенности, эффективности и состоятельности. ВОПРОСЫ к ГЛАВЕ I 1. Охарактеризуйте составные части эконометрической модели. 2. По каким признакам можно классифицировать эконометрические модели? 3. Перечислите этапы построения эконометрических моделей. 4. На основании каких исходных данных могут быть построены эко- нометрические модели? 5. Перечислите наиболее распространенные типы функциональных за- висимостей. 6. Что показывает частный коэффициент эластичности? 7. Охарактеризуйте производственные функции Кобба-Дугласа и с по- стоянной эластичностью замещения. 8. Что такое «предельная норма замещения»? 52
9. Охарактеризуйте «априорный» и «апостериорный» подходы к отбо- ру факторов? 10. Что такое «ложная корреляция»? 11. Какие гипотезы проверяются с помощью критерия Стьюдента? 12. Какие гипотезы проверяются с помощью критерия Дарбина- Уотсона? 13. Что показывают коэффициенты множественной корреляции и де- терминации? 14. Какие гипотезы проверяются с помощью критерия Фишера? 15. Что такое «асимтотическая несмещенность» и «асимптотическая состоятельность»? 16. Как определяются «асимтотическое математическое ожидание» и «асимптотическая дисперсия»? УПРАЖНЕНИЯ К ГЛАВЕ I Задание 1.1 Торговое предприятие имеет сеть, состоящую из 12 магазинов, ин- формация о деятельности которых представлена в таблице 1.1. Таблица 1.1 Номер ма- газина 1 2 3 4 5 6 7 8 9 10 11 [ 12 Годовой товарооборот, млн. руб. 19,76 38,09 40,95 41,08 56,29 68,51 75,01 89,05 91,13 91,26 99,84 108,55 Торговая площадь, тыс. м^ 0,24 0,31 0,55 0,48 0,78 0,98 0,94 1,21 1,29 1,12 1,29 1,49 Среднее число посе- тителей в день, тыс. чел. 1 8,25 10,24 9,31 11,01 8,54 7,51 12,36 10,81 9,89 13,72 12,27 13,92 Требуется построить диаграммы рассеяния годового товарооборота (у) в зависимости от торговой площади (jci) и среднего числа посетителей в день (х2) и определить форму связи между результирующим показателем (у) и каждым из факторов (jci и .хг). 53
Задание 1.2 На основании информации, приведенной в табл. 1.1, построено двух- факторное уравнение годового товарооборота в зависимости от торговой площади магазина (xi) и среднего числа посетителей в день (хг), которое выглядит следующим образом: у^ =-10,8153+61,6583jci^ +2,2748д:2^. Требуется: 1. Дать экономическую интерпретацию коэффициентов уравнений регрессии. 2. На основании данных табл. 1.1 рассчитать эмпирические коэффици- енты эластичности годового товарооборота от торговой площади и от среднего числа посетителей. 3. На основании уравнений регрессии оценить частные коэффициенты эластичности годового товарооборота от торговой площади и от среднего числа посетителей. Задание 1.3 На основании информации, представленной в табл. 1.2, построена производственная функция Кобба-Дугласа где уг — валовый национальный продукт в Г-м году (млрд. руб.), хи — накопление в t-u году (млрд. руб.), X2t — среднегодовая численность за- нятых в Г-м году (млн. чел.). Таблица 1.2 Период 1 2 3 4 5 6 7 8 9 10 внп, млрд. руб. 337,7 354,0 363,3 385,7 405,6 426,3 438,3 462,2 486,7 523,4 Накопление, млрд. руб. 650 710 773 836 900 968 1040 1113 1190 1270 Среднегодовая численность занятых, млн. чел. | 89,1 90,5 91,9 93,0 94,1 95,3 96,1 96,6 97,5 98,2 54
Требуется: 1. Определить предельные эффективности факторов и предельные нормы их замещения в каждой точке базисного периода. 2. Построить графики изоквант для 1 и 10 периодов. Задание 1.4 На основании информации за 1970—1990 гг. для РСФСР определены парные коэффициенты корреляции у (среднедушевого потребления рыбы, кг) и следующих факторов: jci (среднедушевого потребления мяса, кг), хг (среднедушевого потребления молока, л), хз (среднедушевого потребле- ния растительного масла, кг), JC4 (среднедушевого потребления яиц, шт.), хъ (среднедушевого потребления сахара, кг), Хб (среднедушевого потреб- ления хлеба, кг), х-] (среднедушевого потребления картофеля, кг), х<^ (среднедушевого потребления овощей, кг), х^ (базисного индекса реаль- ных доходов населения, за единицу принят уровень 1970 г.), и jcio (сред- недушевого потребления алкоголя, л). Построена матрица парных коэф- фициентов корреляции факторов. Соответствующая информация приво- дится в табл. 1.3. Таблица 1.3 Ll Хх ^2 хъ Ха •^? Ц У Xl х$ ДСу L£io_ ^1 0,84 1,00 0,59 0,93 0,97 0,83 -0,98 0,84 -0,84 0,85 0,97 0,04 ^2 0,43 0,59 1,00 0,47 0,48 0,13 -0,53 0,43 -0,21 0,42 0,52 -0,36 хз 0,83 0,93 0,47 1,00 0,07 0,92 -0,97 0,83 -0,91 0,95 0,99 -0,11 Коэфс Х4 0,85 0,97 0,48 0,07 1,00 0,91 -0,98 0,85 -0,88 0,89 0,98 0,13 )ициенты парной ^5 0,87 0,83 0,13 0,92 0,91 1,00 -0,87 0,87 -0,78 0,86 0,91 0,20 хв -0,82 -0,98 -0,53 -0,97 -0,98 -0,87 1,00 -0,82 0,88 -0,92 -0,98 -0,10 корреляции XI -0,69 -0,84 -0,21 -0,90 -0,88 -0,78 0,88 -0.69 1,00 -0,88 -0,91 -0,03 ^8 0,70 0,85 0,42 0,95 0,90 0,86 -0,92 0,70 0,88 1,00 0,93 0,10 Х9 0,85 0,97 0,52 0,99 0,98 0,90 -0,98 0,85 -0,91 0,93 1,00 0,07 ^10 1 0 Д9 1 0,04 1 0,36 -0,11 0,13 0,20 -0,10 0,19 -0,03 0,10 0,07 1,00 1 Требуется отобрать факторы в модель путем пошагового наращивания их числа. Указание. В качестве порогового значения парного коэффициента корреляции результирующего показателя и каждого из факторов взять 0,6 (/?! =0,6), а порогового значения парного коэффициента корреляции факторов — 0,9 (р 2 = 0,9). 55
Задание 1.5 В 2001 г. европейское мясное лобби размышляет на тему, стоит ли оказать давление на правительства стран — членов ЕС, чтобы новые слу- чаи заболевания губчатой энцефалопатией и болезнью Кройцфельда- Якоба не становились достоянием гласности. Безусловно, такое давление будет стоить недешево, и поэтому необходимо предварительно оценить полезность подобных действий. Оценивается зависимость yt (доли вегета- рианцев среди населения г-й страны ЕС) от хи (числа ставших известны- ми случаев инфицирования коров губчатой энцефалопатией) и X2t (числа ставших известными случаев заболевания людей болезнью Кройцфельда- Якоба). Исследование проводится для Г=15 стран. Результаты оценивания по МНК (в скобках даны стандартные откло- нения оценок коэффициентов): yt = 0,21 -н 0,0030д:1г + 0,0092^2, + ^f. (0,045) (0,0016) (0,0050) Требуется: 1. Проверить статистическую значимость коэффициентов уравнения при с»=0,05, 2. Определить, является ли константа значимо меньше 0,31. 3. Проверить совместную статистическую значимость переменных Xi и Х2, если сумма квадратов ошибок составляет 0,(Ю84, а дисперсия наблю- даемой переменной у — 0,0011. Задание 1.6 Для классической линейной однофакторной модели нормальной рег- рессии требуется проверить гипотезу Но:ао =aooAai=aio при уровне зна- чимости 61^0,05. 1. Предлагается следующий способ тестирования. С помощью оценок 1 1 oq иа\ отдельно проверить гипотезы Но : ао=сХоо и Но : а\-а\о при уровне значимости (Х=0,05, Если отклоняется хотя бы одна из гипотез Но или Яо^, то отклоняется и гипотеза Но. Что можно сказать об уровне значимо- сти такого способа тестирования? 2. Предлагается такой же способ тестирования, как и в п. 1. Но гипоте- за Яо отклоняется только тогда, когда одновременно отклоняются и гипо- теза Но, и гипотеза Яо^. Что можно сказать об уровне значимости такого способа тестирования? 56
ГЛАВА II Методы оценки параметров линейных эконометрических моделей 2.1. МЕТОД НАИМЕНЬШИХ КВАДРАТОВ 2.1.1. Процедура оценки параметров по методу наименьших квадратов Метод наименьших квадратов (МНК) один из наиболее разработан- ных и распространенных вследствие своей относительной простоты и эффективности методов оценки параметров линейных эконометриче- ских моделей. Он не предъявляет жестких требований к закону распре- деления ошибок моделей. Вследствие этого оценки коэффициентов мо- делей, полученные на основе МНК, не зависят от фактического (или предполагаемого) закона распределения. Хотя обычно закон распреде- ления ошибки, если его знание необходимо для проверки качества мо- дели, свойств ее параметров и т.п., предполагается нормальным. При этом в «классическом» варианте МНК, как это будет показано далее, в отношении свойств ошибки модели St выдвигаются следующие предпо- ложения: • ошибка имеет нулевое математическое ожидание, M[£'J=0; • ее дисперсия конечна и постоянна, 0'/=const; • автокорреляционные связи в ряду ошибки отсутствуют, т.е. А=А=—=0' где Pi — коэффициент автокорреляции рядов Et и £^_/, /=1,2,...; • ряд значений ошибки статистически не связан с рядами значений не- зависимых переменных модели. Рассмотренные предположения определяют ошибку модели как про- цесс «белого шума» с ковариационной матрицей ее вектора ошибки, имеющей следующий вид: Со\(€)=^0'/-Е. 57
Рассмотрим общую схему процедуры оценки параметров линейной эконометрической модели на основе МНК более подробно. Такая модель в общем виде была представлена уравнением (1.2): yt= аь+а1д:1,+...+о^„,+ €t. Исходными данными при оценке параметров <%, ai,..., сСп являются измеренные (наблюдаемые) значения зависимой переменной, которые можно представить в виде вектора-столбца У = У1 Ут) Наблюдаемые значения независимых переменных объединим в мат- рицу следующего вида: Х = ^1 1 •^11 42 ^21 ■^22 1 хи Х2Т (2.1) Свое название МНК получил исходя из смыслового содержания кри- терия, которому должны удовлетворять полученные на его основе оценки параметров эконометрической модели: сумма квадратов значений фактической ошибки модели должна быть минимальной. Иными словами, найденные с помощью МНК оценки ао, Л;,..., л^, обес- печивают минимум следующей квадратичной формы на мноэюестве всех других комбинаций значений таких оценок: (2.2) где et — значение фактической ошибки модели в момент г=1,2,..., Г, полу- ченное после подстановки в выражение (1.2) вместо неизвестных истин- ных значений параметров аь, осъ..., оСп их оценок оо, <3i,..., an. Оптимальные по данному критерию значения оценок в этом случае могут быть найдены решением следующей системы так называемых «нормальных» уравнений, вытекающей из условия равенства нулю част- ных производных функции s\aQ, бГь..., а^ по своим параметрам в точке минимума: 58
_f_ = 0 = 2-5^(>',-ao-aiA:ir dai у -«n-^n/)(-i); -_ = 0 = 2-^(у,-ао-а1%-...-а„д:„,)(-д:„,); t Hyt t = T % ^nt = 00 = 00 ... + o„ Z4+•••+''" •Z^/ ( ■Xn,+.. • + ^A2 nt • -^Ir' (2.3) В системе (2.3) неизвестными являются оценки параметров oq, а\,.,., an, а ее известные коэффициенты сформированы на основе исходных данных и представлены в виде следующих сумм: ^yt, ^yt'^it^ ^^it'^jt^ t t t ij=l,2y,.., n. Решения, получаемые на основе развернутой формы системы (2.3), достаточно громоздки, и поэтому в дальнейшем в математических выкладках общего характера будем использовать векторно-матричную форму представления ее составляющих. Векторно-матричная форма записи линейной эконометрической моде- ли (1.2) имеет следующий вид: у=Хс^е, (2.4) где у — вектор-столбец, состоящий из Т компонент; X — матрица разме- ра Тх(п+1) (если в модели присутствует «свободный» коэффициент cxq); о^(схо, аи..., ОпУ- вектор-столбец параметров, состоящий из «+1-й ком- поненты; €— вектор-стобец ошибки модели, состоящий, как и вектор j;, из г компонент. Соответственно векторно-матричный вариант модели, в котором вме- сто неизвестных истинных коэффициентов а и ошибок е используются их оценки, т.е. вектора аие, запишем в следующем виде: у=Ха+е, (2.5) где а=(ао» ^ь-, cin)\ ^^ь ^2»-..» ^тУ — вектора значений оценок коэффи- циентов линейной эконометрической модели и значений ее фактической ошибки соответственно. 59
Сумму квадратов значений ошибки / можем представить в виде ска- лярного произведения вектора-строки е' на вектор-столбец е. Проводя несложные преобразования с учетом правил произведения векторов и матриц, получим следующий результат: /=(£', e)^{y-X^dHy^X'd)^y'y-a'Xy-y'Xa-^'XXa^ ^'y-la'XyWXXa. (2.6) При проведении преобразований учитывалось правило транспониро- вания векторно-матричного произведения (z-W)'=(W-zO- Условие (2.3) в векторной форме записи приобретает следующий вид: ЭЛЭа=0. (2.7) Заметим, что в выражении (2.7) операция дифференцирования осуще- ствляется по вектору. С учетом выражения (2.6) уравнение (2.7) приводится к следующему виду: Ъ8^1да^(у'у-2а'Ху^'ХХа)1Ъа=^2Хул-1ХХа=й или ХХа^ху Откуда следует, что «оптимальный» вектор оценок параметров а оп- ределяется на основе следующего векторно-матричного выражения: а^(ХХ)'^Ху. (2.8) Все переменные в правой части выражения (2.8) являются известными — это исходные данные, сведенные в матрицу X и вектор j^. 2Л.2. Свойства оценок МНК Рассмотрим основные условия, при которых оценки коэффициентов линейной эконометрической модели, во-первых, могут быть в принципе найдены, а, во-вторых, их «качество» будет «достаточно высоким», что является определенным свидетельством и достаточного качества постро- енной модели. Как было отмечено в разделе 1.5, «качество» оценок, их свойства тес- но связаны со «статистической» трактовкой исходных данных и, в пер- вую очередь, независимых переменных. В разделе 1.1 было отмечено, что независимые переменные могут представлять собой детерминированные величины, результаты выборки (стохастические переменные), а также могут быть измерены с ошибкой. В данном разделе рассмотрены первые две интерпретации. Модели с ошибками в значениях независимых переменных рассмотрены в разделе 10.1. 60
Рассмотрим сначала случай, когда измеренные (наблюдаемые) значе- ния независимых факторов трактуются как детерминированные (неслу- чайные) величины. Детерминированные независимые переменные В этом случае матрица X представляет собой матрицу, состоящую из констант, и элементы матриц {XX) и {ХХ)"^ также рассматриваются как константы. Прежде всего заметим, что выражение (2.3) и аналогичное ему выра- жение (2.7) представляют собой систему (п+1) уравнений с (п+1) неиз- вестными. Вследствие этого решение, т,е, вектор а, на основе выраэ/се- ния (2.8) теоретически можно получить почти всегда, кроме тех случа- ев, когда матрица XX является выроэ/сденной и, следовательно, обрат- ная ей матрица (ХХ)~^ не существует. Вырожденная матрица XX будет иметь место в том случае, если хотя бы один из столбцов матрицы А^ представим в виде линейной комбинации нескольких других ее столбцов. От свойства вырожденности матрицы XX следует отличать ее плохую обратимость. Это свойство может быть обусловлено существованием поч- ти линейной зависимости между столбцами матрицы X, В этом случае оп- ределитель матрицы XX близок к нулю и при расчете элементов обратной ей матрицы могут возникнуть проблемы вычислительного характера, когда неизбежные в расчетах на ЭВМ ошибки округления будут значительно ис- кажать конечный результат. Это, в свою очередь, может повлечь сущест- венные искажения оценок параметров модели, т.е. элементов вектора а. Другое достаточно естественное ограничение для получения решения состоит в том, что количество измерений факторов Т должно быть больше их числа п+1 (Т>п-^1), В противном случае получить однозначную оценку параметров модели невозмоэ/сно, так как количество неизвест- ных в системе (2.3) превысит число ее уравнений. Наряду с отмеченными трудностями «вычислительного характера» проблема получения «хороших» оценок параметров эконометрических моделей усложняется еще из-за ряда обстоятельств. Дело в том, что найденные с помощью выражения (2.8) оценки а,, /=0,1,..., п являются случайными величинами. Их можно представить как сумму истинного значения Oi и некоторой случайной ошибки Ад/ (см. выражение (1.47)). at = ai + Аа(. Для доказательства справедливости этого утверждения подставим в вы- ражение (2.8) вместо вектора j? его выражение ЛГ-оч-б; где а— вектор ис- тинных значений параметров а;, /=0,1,..., п. После подстановки получим: 61
a={XX)-^'X{X-a-^-e)=QCX)~^XX-a+iXX)~^X'e=^a\{XX)'^X e. (2.9) где {XXy^X -&:^isa — вектор ошибки оценок параметров щ. При случайном характере оценок коэффициентов модели щ, /=0,1,..., п\ их «высокое качество» подтверждается наличием у них свойств несме- щенности и эффективности. Рассмотрим сначала условие несмещенности этих оценок. Оно означа- ет, что математическое ожидание оценки л/, /=0,1,..., п\ равно истинному значению параметра о^, т.е. M{ai\=cCi. При условии, что матрица {XX) обратима, возьмем математическое ожидание от правой и левой частей выражения (2.9). Получим M[a\=a¥imXXr^^^el (2.10) Из выражения (2.10) непосредственно вытекает, что для того, чтобы значения щ, /=0,1,..., п\ полученные из выражения (2.8), были несмещен- ными оценками параметров эконометрической модели cCi необходимо вы- полнение следующего условия: М(А"А)"^А'.£] = 0. (2.11) Поскольку матрица X является ненулевой, то для выполнения условия (2.11) необходимо, чтобы а)М^]=0; (2.12) б) факторы JC/, и ошибка Et были независимыми между собой, /=0,1,..., п. В этом случае математическое ожидание произведения (ХХ)~^Х-€ можно представить как произведение математических ожиданий двух ве- личин (постоянной матрицы (ХХу^Х на случайный вектор ошибки £; т.е. М[(ХХУ^Х'€] = М[(ХХ)-^Х]-Ще1 откуда следует, что при справедливо- сти (2.12) условие (2.11) выполняется. Оценка л/ параметра модели Oi считается эффективной, если ее дис- персия является минимальной среди дисперсий всех других возможных оценок данного параметра. Дисперсии оценок а,, /=0,1,..., щ можно найти как диагональные элемен- ты их ковариационной матрицы. Напомним, что ковариационная матрица вектора оценок а (в общем случае) определяется следующим выражением: Cov(a) = Л \ (7q covioQai) ... cowioQa^) 2 cov(aiao) ^i ••• соу^ща^) [^cowianOQ) cowia^ai) ... a^ (2.13) 62
где o^=D{ai) — дисперсия i-й оценки; cov(a/, aj) — ковариация оценок i- го иу-го параметров. Ковариационная матрица вектора оценок а может быть представлена как математическое ожидание произведения вектора-столбца ошибки на ее вектор-строку, т.е. Соу(а)=А/[ДлДд']. С учетом (2.9) получим: Соу(а)=М[(ХХ)-^Х её XiXX Т\ (2.14) Поскольку матрица X образована постоянными величинами, то выра- жение (2.14) можно переписать в следующем виде: QQ^{d)^{XX)-^X 'Ще'ё\ XiXXy^^XXf^X •Cov(f) XiXX)'^, (2.15) где Cov(f) является ковариационной матрицей вектора «идеальной» ошибки модели, определяемой следующим выражением: Cov(£) = G^ C0V(fi£2) ••• COV(fi£^)^ С0У(£2^,) G^ ... С0У(£2^£) (2.16) \^COV(f^£,) C0V(£'^£2) ••• ^^ где, напомним, cov(£;, e^ определяются как ковариация рядов ошибки £j и С учетом выражения (2.15) несложно увидеть, что оь^, <Ji^,..., Gn — дисперсии оценок а,, /=0,1,..., п будут минимальными в том случае, если ковариационная матрица вектора ошибки £Cov(f) имеет следующий вид: tAee\^GlE, (2.17) где g} — дисперсия истинной ошибки модели, Е — единичная матрица. В этом случае выражение ковариационной матрицы оценок а значи- тельно упрощается: Cov(a)=(jrX)"^A' <:ov(£) XiXX )"^= ^{XX)-^X'g}-EX{XX)'^^g}'{XX)'\ (2.18) Таким образом, если M[ee]=G/'E, то оценки коэффициентов ли- нейного эконометрического уравнения являются эффективными. На практике дисперсии и ковариации оценок а/, /=0, 1,..., л; могут быть оценены как элементы матрицы Ge\XXy\ в которой значение диспер- сии ошибки может быть оценено на основе фактических («выбороч- ных») значений ошибки е,, согласно следующей формуле (см. выраже- ние (1.32)): т а|=-^^. (2.19) Т-л-1 63
Таким образом, из полученных в данном разделе результатов вы- текает, что использование метода наименьших квадратов позволяет получить несмещенные и эффективные оценки параметров линейной эконометрической модели при детерминированных значениях неза- висимых переменных в случае конечной выборки, если выполняют- ся следующие положения: 1. Математическое оэюидание значений ошибки модели для всех мо- ментов времени tравно нулю, т.е. для t=l,2,...,T M[£t]=0, Щё\=0. (2.20) 2. Значение дисперсии ошибки является постоянной величиной для всех моментов t=l,2,...,T cr/=const. (2.21) 3. Значения ошибки, взятые в различные моменты времени, независи- мы меэюду собой, т.е. ковариация ошибок St, St+s, где s-1,2,... равна 0. cov(£^,£^+,) = 0. (2.22) 4. Значения независимых факторов модели и ошибки, рассматривае- мые в одни и те же моменты времени, являются независимыми, т.е. их ковариации равны нулю. cov(x/M £^+.) = О, (2.23) для /=1, 2, ... , А1. 5. Матрица (ХОС) является невыроэюденной. На практике это означа- ет, что факторы хц, i=l, 2, ..., п независимы меэюду собой в том смысле, что их выборочные парные коэффициенты корреляции не превосходят некоторого порога р \nj\<p, (2.24) где Kij — выборочный коэффициент корреляции между факторами jc/ и Xj, i^j. При выполнении условий (2.20)-(2.23) оценки МНК можно считать несмещенными и эффективными. В дальнейшем свойства ошибки эконо- метрической модели, определенные условиями (2.20)-(2.23), иногда бу- дем называть «стандартными», а ошибку, обладающую этими свойства- ми, — «стандартной» ошибкой. При вырожденной матрице iXX) формально МНК вообще не позво- ляет определить значения этих оценок, поскольку определитель этой мат- рицы становится равным нулю и сформировать обратную матрицу {ХХ)'^ без каких-либо дополнительных «ухищрений» не представляется воз- можным. Покажем также, что оценки параметров эконометрической модели, полученные с использованием МНК при детерминированных независимых 64
переменных и справедливости условий (2.12) и (2,17), являются асим- птотически несмещенными и состоятельными. Напомним, что эти свойства в эконометрике рассматриваются как «желательные» в том смысле, что при прочих равных условиях оценки параметров эконометрической модели, полученные при большем объеме выборки исходных данных из однородной их совокупности, характери- зуются меньшим смещением по сравнению с оценками, полученными на основе выборок меньшего объема. Предположим, что при Т—>оо соблюдается условие однородности ис- ходных данных и для матрицы (ХХ) существует следующий предел: lim ^(X'X) = Q, (2.25) Т^ооТ где Q — положительно определенная матрица. Заметим также, что с учетом (2.25) выражение (2.9) можно предста- вить в следующем виде: (1 л-1 (Х'Х)] -l-Z'-fl. (2.26) «Предел по вероятности» вектора оценок а с учетом (2.25) может быть записан следующим образом: plima = a+e""^-plim[-A''e|. (2.27) Поскольку Х — матрица с детерминированными компонентами, то при выполнении условий (2.12) и (2.17) получим следующие выражения, определяющие математическое ожидание и дисперсию вектора 1 V' w=—X € соответственно: Т M[w] = M т = -Х'М[е] = 0, (2.28) 1 „, „, „ „ 1 <Tf ^ Л Соу(и')=м[н',и'']=-;?'м[е,£']л:--=-^ f—1 {:ii^) Из выражения (2.29) непосредственно следует, что при Г->оо диспер- сии оценок параметров стремятся к нулю, поскольку 2 lim Cov(h') = lim -^ • б = О. (2.30) 3 Эконометрика 65
Иными словами, оценки параметров эконометрической модели оказались асимптотически несмещенными, а следовательно, и состоятельными^ т.е. [т ) и с учетом (2.22) имеем: plinui=ci9i2'^0=a (2.31) Можно также показать, что при Г—>«> и конечных по абсолютной ве- личине элементах матрицы Х закон распределения вектора -=АГ'£ яв- ляется асимптотически нормальным с нулевым математическим ожида- нием и ковариационной матрицей c?^Q, Это свойство записывается сле- дующим образом: -^Х'е-^И{0,с1О). (2.32) С учетом выражения (2.32) закон распределения вектора у1т•{а-а) = \ -= ЛГ'-£ = б"^- -= pr'-f также является асим- птотически нормальным (см. выражение (1.56)): ОГ^ .il^r.e-^N{Q-^ '0,Q'^{(jlQ)'Qr^]-^N{Qjl QT^], (2.33) .-1 ,..„.. _„„„ ^-i ( 1 где Q ((TeQ)Q — ковариационная матрица вектора g"' -= ДГ'• г. Из выражения (2.33) следует, что вектор оценок параметров а имеет асимптотически нормальное распределение с математическим ожиданием а и ковариационной матрицей —^ • б , т.е. a-^N cc^Q-' (2.34) Напомним, что на практике при конечных значениях Г ковариацион- ная матрица этого вектора формируется с использованием следующих Ъ^ замен: ^— = (Х'Х)~^ и <т^ =— (см. выражение (2.18)). Т Г-п-1 ^ Напомним, что асимптотическая несмещенность оценок является достаточным условием их состоятельности. 66
Заметим также, что выражение (2.34) является теоретическим обосно- ванием возможности использования критерия Стьюдента при определе- нии значимости влияния независимых факторов на зависимую перемен- ную модели >^ (см. выражение (1.25)). Стохастические независимые переменные В эконометрических исследованиях в качестве значений независимых переменных часто приходится использовать исходные данные, которые нельзя интерпретировать как детерминированные величины, поскольку сами они являются результатами, например, выборочных обследований. Примерами таких переменных являются среднедушевой доход, средне- душевое потребление и т.п. Их значения определяются по некоторой вы- борке индивидуумов из генеральной совокупности жителей. Аналогично такая ситуация может иметь место, когда в качестве ис- ходных данных модели используется информация, характеризующая слу- чайно выбранные элементы генеральной совокупности. Например, из со- вокупности мелких предприятий розничной торговли формируется вы- борка и характеристики отобранных предприятий (доход, заработная пла- та, объем реализации и т.п.) рассматриваются как значения независимых переменных модели. В этих случаях значения независимых переменных можно интерпре- тировать как случайные величины, подчиняющиеся определенному зако- ну распределения (имеется в виду многомерное распределение совокуп- ности этих величин). Тогда вектор оценок параметров эконометрической модели, опреде- ленный на основе МНК (см. выражение (2.9)), можно интерпретировать как условную оценку, полученную при стохастической матрице наблю- даемых значений независимых факторов X, С учетом такой трактовки выражение (2.9) может быть представлено в следующем виде: M[a\X]=ai-(X'X)-^X'M[eX]. (2.35) Безусловная оценка вектора параметров модели может быть определе- на как математическое ожидание условных оценок по всем возможным вариантам матрицы X. Этот результат обычно записывается следующим образом: * М[а]=МАа\Х\=а+М^(ХХ)'^Х'-М(ёХ)1 (2.36) где Мх — математическое ожидание по всем наборам переменных хц. Из выражения (2.36) вытекает, что при «стохастических» независи- мых переменных оценки параметров эконометрической модели, получен- ные на основе МНК, могут обладать только свойствами асимптотиче- 3* 67
ской несмещенности и эффективности. Иначе говоря, при конечных объ- емах выборки свойства несмещенности и эффективности для этих оце- нок не гарантированы. Существование асимптотических свойств определяется тем обстоя- тельством, что при увеличении числа исходных данных, выбираемых из однородной совокупности, выборочное среднее должно стремиться к средней по генеральной совокупности, а дисперсия выборочного средне- го — к нулю. С учетом вида выражения (2.36) асимптотическая несмещенность оце- нок МНК означает, что lim М (a-d)=MA(X'Xy^Xm€\X)]-^0. (2.37) Для выполнения условия (2.37) необходимо, чтобы ошибка модели €t и значения элементов xit матрицы X, /=0, 1,..., п\ ^=1, 2,..., Т обладали при Т-^оо определенными свойствами, аналогичными (2.12) и (2.17). Из (2.36) непосредственно следует, что вьфажение (2.37) будет иметь место, если М[ёХ]=М[€]=0, Мл{А'.М(^ I Л)]=0, (2.38) а также справедливым является предположение (2.25) относительно су- ществования предела матрицы —(Х'Х) при Г-^*». Выражение (2.38) означает, что каждый столбец матрицы X, представ- ляющий собой вектор значений стохастической переменной jc/=[jc/i,..., хсгУу и вектор ошибки е независимы между собой, и, кроме того, матема- тическое ожидание опшбки модели равно нулю при всех вариантах выбо- рочных данных. Асимптотическая матрица ковариаций вектора оценок параметров эконометрической модели со стохастическими независимыми перемен- ными согласно выражению (1.56) может быть определена следующим об- разом: asy. var(a) = -?- lim М [Vf • (а - а) • >Уг • (д - аУ], (2.39) поскольку М[а\Х]=а. Несложно заметить, что если справедливо следующее условие: lim ^М [(£• ^')I л:] = (т| • £ , (2.40) Г->ооГ и выполняются условия (2.38) и (2.25), то выражение (2.39) может быть представлено в следующем виде (см. также (2.18)): 68
asy.var(a) = - Пт^^а^ ■M(X'X)-^]= =lcr| 1ипГ1(л:з:)- T Г->оо[Г 1 = -.(716. (2.41) где матрица Q определена выражением (2.25). Обобщая полученные результаты, отметим, что оценки коэффициен- тов эконометрической модели со стохастическими независимыми пере- менными, полученные на основе МНК, являются асимптотически состоя- тельными и эффективными, если выполняются следующие условия: lim М[€\Х] = М[€] = 0; lim М[(е€')\Х] = а^'Е\ lim Г-»оо Т = 0; (2.42) 1 lim ^(X'-Xy^=Q. Заметим, что условия (2.42) являются «предельными» аналогами предположений (2.20)-(2.24), имевших место в случае конечной выборки. Таким образом, выраэ/сение (2.8), являющееся результатом МНК, по- зволяет получить значения оценок коэффициентов линейной экономет- рической модели «хорошего качества» и при детерминированных, и при стохастических значениях независимых переменных, если выполняются определенные предпосылки относительно соответствующих свойств ошибки этой модели и наблюдаемых исходных данных. Однако априорно проверить справедливость этих предпосылок, как правило, не представляется возможным. Обычно это моэюно сделать, лишь получив информацию о фактической ошибке модели, после того как она была построена. Фактическая ошибка модели Ct в данном случае может быть рассмотрена как оценка ее истинной ошибки Sf. Тогда сов- падение свойств фактической ошибки с предполоэк:ениями, выдвигаемы- ми относительно свойств истинной ошибки, моэюет являться доста- точно «веской гарантией» обоснованности использования «классическо- го» МНК в качестве метода оценки параметров модели. Для определения свойств фактической ошибки е, могут быть исполь- зованы специальные тесты и процедуры, рассмотренные, как в разделе (1.4) (см. тест Дарбина-Уотсона), так и в следующем параграфе данной главы. 69
2.2. ОСОБЕННОСТИ ПРОВЕРКИ КАЧЕСТВА ОЦЕНОК МНК Проверка условий, выполнение которых свидетельствует о «высоком» качестве полученных оценок параметров эконометрической модели (а следовательно, в значительной степени и самой модели), на практике обычно осуществляется с использованием ряда процедур и критериев, на основе исходной и новой, полученной после построения модели, инфор- мации. К исходной информации относятся наблюдаемые (измеренные) значения зависимой и независимых переменных yt и Хц соответственно. А Новую информацию составляют значения у,, найденные оценки пара- метров ai, соответствующие им фактические значения ошибки е,, а такэюе ковариационные матрицы оценок и ошибок (в последнем случае, возмоэюно, только дисперсии), i=0, 7,..., п; t=l, 2,..., Г. Иными словами, значение Т при проверке предполагается конечным. При этом следует иметь в виду, что новая информация обычно рас- сматривается как некоторая оценка (заменитель) истинных (но неизвест- ных) значений соответствующих характеристик. В этой связи совпадение свойств оценок с предполагаемыми теорией априорными свойствами со- ответствующих характеристик (часто, но не всегда) является определен- ной гарантией качества модели (оценок ее параметров). Особенно важ- ную роль в определении качества модели играют значения ее фактиче- ской ошибки Ct, /=1, 2,..., Г; соответствующие полученным оценкам ее па- раметров. 2.2.1. Свойства фактической ошибки эконометрической модели В данном разделе рассматриваются некоторые подходы к проверке наличия стандартных свойств (2.20)-(2.23) у «истинной» ошибки эконо- метрической модели Et на основе анализа соответствующих свойств фак- тической ошибки Ct. В этой связи сразу следует отметить, что наличие у ошибки е, каж- дого из этих свойств не всегда является доказательством присутствия соответствующего свойства и у ошибки £,. Иными словами, наличие оп- ределенных свойств у ошибки Ct не является необходимым условием существования этих свойств и у истинной ошибки £•,. Дело в том, что некоторые свойства фактической ошибки Ct являются своего рода огра- ничениями на ее значения, которые вытекают из критерия МНК как ме- тода оценки параметров модели, т.е. выполняются практически всегда. В то же время свойства «истинной» ошибки определены теоретиче- скими предпосылками, положенными в основу этой модели. Поэтому вывод о правомочности использования МНК на основе существования 70
таких «априорных» свойств фактической ошибки модели не может счи- таться обоснованным. Вместе с тем, если фактическая ошибка Ct не обладает некоторым свойством, то можно говорить, что теоретические предпосылки эконо- метрической модели не подтверждены полученными эмпирическими данными и «качество» ее уравнения не достаточно высоко. К «априорным» свойствам фактической ошибки е^, которые вьшолня- ются при использовании МНК всегда, относятся свойства (2.20) и (2.23). Приведем доказательства этого утверждения. 1. Сумма значений фактической ошибки равна нулю. 1ег=0. (2.43) t Условие (2.43) является аналогом свойства (2.20), поскольку Y,^t Р^^' t сматривается как оценка математического ожидания фактической ошибки. Использование МНК обеспечивает выполнение условия (2.43) автома- тически. В самом деле, дифференцируя сумму квадратов ошибки et s'^ (см. выражение (2.31)) по параметру oq , получим т—= -2Х(Уг-^о-«1^1/---«п^лг) = 0. Из этого выражения автоматически вытекает, что t t 2. Произведение транспонированной матрицы ЛГ^на вектор фак- тической ошибки е равно нулевому вектору. Xfc=0. (2.44) Условие (2.44) является аналогом условия (2.23), поскольку произве- дение каждой строки матрицыХ^на вектор ^представляет собой скаляр- ное произведение вектора значений соответствующих факторов хи на век- тор ошибки. S(%-^)-^r Z%'^^ ^'Z^ Z%*^r \'^ll ' J ' rwy rp rp rjn Тогда векторно-матричное выражение (2.44) можно представить в ви- де следующей системы скалярных произведений: 2;JC/r^/=0, / = 0,1,...,л, (2.45) где;сог=1 дляг=1,2,..., Г. 71
Для доказательства справедливости вьфажения (2.44) представим век- тор ошибки е в виде разности фактических и расчетных значений незави- симой переменной yt л Получим Из (2.44) и (2.45) автоматически следует, что Z(%-^/) = 0. (2.46) t Еще раз отметим, что выполнение условий (2,45) и (2.46) не моэ/сет считаться доказательством отсутствия корреляционных взаимосвязей между значениями независимых переменных Хц и «истинной» ошибкой St. В данном случае эти условия сами следствие результатов применения МНК для оценки коэффициентов эконометрической модели, т,е, они как бы выполняются автоматически. Для некоторых классов эконометриче- ских моделей, как это будет показано в главах V и VHI, уже априорно, т.е. до построения модели, можно доказать существование ковариационной связи между некоторыми независимыми переменными и истинной ошиб- кой модели £(. Выполнение условия (2.45) в таком случае не является свидетельством корректности применения «классического» МНК для оценки ее параметров. 3. Из условий (2.43) и (2.45) также вытекает, что сумма произведений отклонений расчетных значений независимых переменных от ее среднего значения и расчетных значений ошибки равна нулю. Е^г-(>^-Уг) = 0. (2.47) t Раскрывая скобки в выражении (2.47), непосредственно получим л А t t t t t t t Выражение (2.47) включает в себя также и следующее условие: 1уг^г=0, (2.48) t означающее, что сумма произведений расчетных значений зависимой пе- л ременной у ^ и ошибки Ct равна нулю. 72
Здесь еще раз подчеркнем, что условия (2.43)-(2.48) для фактической ошибки Ct эконометрической модели автоматически вытекают из ме- тода оценки ее параметров — МНК, и поэтому га непосредственно нельзя переносить на условия (2,20)-(2.23), характеризующие свойства истинной ошибки б^. Вместе с тем, условия (2.21) и (2.22) для фактической ошибки Ct не являются «априорными». Они выполняются лишь в том случае, если ис- ходные предпосылки МНК оказались справедливыми для данной модели, что является свидетельством обоснованного выбора формы ее уравне- ния, состава учтенных факторов и т.п. 2.1.2. Тестирование свойств фактической ошибки эконометрической модели На практике справедливость предпосылок (2.21) и (2.22) моэюно под- твердить или опровергнуть только путем анализа свойств фактической ошибки Ct после оценки ее значений. В таком случае фактическая ошибка рассматривается как оценка истинной ошибки и выполнение для нее этих предпосылок может рассматриваться в качестве доказательства их обос- нованности, следовательно и достаточно высокого качества оценок пара- метров эконометрической модели. Заметим, что условие (2.21) Се = const нельзя интерпретировать как постоянство значений |£^1 для /=1, 2,..., Т. Оно лишь означает, что диспер- сия истинной ошибки £t является постоянной величиной на любом из от- резков рассматриваемого временного интервала (1,7). В этой связи про- верка условия (2.21) может быть идентична проверке гипотезы о постоян- стве дисперсии фактической ошибки Ct на различных отрезках интервала (1,7). Такая проверка обычно проводится с использованием соответст- вующих тестов. 1. Тестирование условия постоянства дисперсии ошибки модели. Проверку гипотезы Ое-const (выраоюение (2.21)) моэюно провести с использованием расчетных значений ошибки Cj на основе, например, дву- стороннего критерия Фишера. Общая схема реализации процедуры та- кой проверки состоит в следующем. Интервал (1,7) разбивается на три интервала (1,70, (Г1+1, Г2), (Г2+1, 7). При этом первый и третий интерва- лы обычно выбираются одинаковой длины. В моделях со статической информацией соответственно на три группы разбивается исходная сово- купность объектов, которые в данном случае должны быть расположены в порядке возрастания (или убывания) результирующей переменной у/. Для данных, соответствующих первому и третьем интервалам, строятся 73
эконометрические модели, аналогичные исходному варианту. Для каждой из них определяются последовательности ошибки et — ей ^2»-.., ^т^ и ^гг+ь ^71+2, —» ^7-соответственно. Для первого и третьего интервалов на основании известных значений ошибки рассчитываются дисперсии г=1 Т г=Г2+1 где п — число параметров модели. Отношение а^^ I Си сопоставляется с граничными значениями двух- стороннего критерия Фишера F* и F с заданным уровнем доверительной вероятности/?♦ и числом степеней свободы ^1=Г-(л+1) и V2=7'-72-('i+l)- Если оказывается, что вьшолняется соотношение F*<aie^lau<.F\ (2.49) то гипотеза о постоянстве дисперсии на интервале (1,7) принимается. В противном случае — эта гипотеза отвергается. Напомним, что F*=1/F\ Уг, Vi). В целом, надежность проверки гипотезы (2.21) по рассмотренной про- цедуре зависит от правильности выбора числа измерений на каждом из интервалов. С одной стороны, уменьшение их длины приводит к потере точности в оценках C7i/ и с^^^, с другой — ее увеличение может сделать данные оценки статистически неразличимыми, поскольку колебания квадратов ошибок будут уравновешиваться на расширенных интервалах, и значения их дисперсий с ростом Г сблизятся. Если количество измерений Т достаточно велико, то для проверки ги- потезы о постоянстве дисперсии моэк:ет быть использован критерий Бартлетта, В этом случае интервал (1,7) разбивается на к участков. По данным каждого из них формируется собственный вариант эконометри- ческой модели, по форме (т.е. по используемым переменным и характеру их взаимосвязей) тождественный вариантам других участков. Для каждо- го варианта определяется значение дисперсии ошибки Oi^, (^^,..., <Jk. Ги- потеза постоянства дисперсии предполагает, что c7i^=(^^=...=0!k^=(^. Если эта гипотеза верна, то усредненная оценка дисперсий р;- ^, /=1,2,..., к, рас- считываемая как 74
^ -Zw/Z'^- (2.50) «=1 j=l распределена как выборочная дисперсия, т.е. по нормальному закону со средним значением <^ и Г степенями свободы, где Т = ^_п,, Щ — количе- ство измерении на i-м участке. Бартлетг показал, что величина 1 ^ . <^} с,=1 0-2 ^ = -т1«<1пзТ' (2-51) где 1*1 1 с = 1+Т7Г-|Т^ 1Г~ (2.52) «•=1 распределена примерно по закону степенями свободы. Для частного случая, когда количество измерений на всех участках равны, т.е. п\=П2=...=Пк Л = -к- Г -2 1 ^ 0^1 * /=1 ; (2.53) гдес=1+[(А:+1)/3/:-Аг,]. Таким образом, проверка гипотезы о постоянстве дисперсии эконо- метрической модели на интервале (1,7) состоит в сопоставлении расчет- ного значения 2^, определяемого по формуле (2.51) или (2.53), с таблич- ным значением этого критерия ;j^*, взятым при заданной доверительной вероятности р* и к-1 степенях свободы. Если оказывается, что ^-^j^*, то гипотеза о постоянстве дисперсии принимается, если Л>^;^*, то рас- сматриваемую гипотезу следует отвергнуть. 2. Тестирование автокорреляционной зависимости ошибки. Проверка выполнимости условия (2.22), свидетельствующего об от- сутствии автокорреляционных взаимосвязей в ряду «истинной» ошибки модели Et, на практике осуществляется тестированием ряда значений фактической ошибки Ct. При этом предполагается, как и в случае тестирования условия (2.21), что свойства фактической ошибки в значительной степени соответствуют свойствам ее теоретического аналога. В данном случае имеется в виду характер автокорреляционных взаимосвязей между значениями ошибок в моменты времени г и г-1, Г и г-2 и т.д. 75
Обычно у случайного процесса (если отсутствуют сезонные эффекты) наиболее существенны взаимосвязи между соседними значениями. Это выражается в том, что абсолютное значение его первого коэффициента автокорреляции превосходит аналогичные значения его коэффициентов автокорреляции более высоких порядков. Вследствие этого проверка вы- полнимости условия (2.22) часто рассматривается как проверка гипотезы о значимости именно первого коэффициента автокорреляции фактиче- ской ошибки. Один из таких тестов (по критерию Дарбина-Уотсона) был рассмотрен в разделе (1.4). Этот тест не отличается значительной досто- верностью. Область существования его значений содержит достаточно обширную зону неопределенности. В случае попадания расчетного зна- чения критерия Дарбина-Уотсона в эту зону нельзя сделать однозначный, статистически обоснованный вывод о наличии или отсутствии автокор- реляционной связи у рассматриваемого процесса. Вместе с тем математи- ческая статистика разработала большое количество значительно более мощных тестов, которые могут быть использованы в этих целях. Многие из них рассмотрены в главах VI и VII при тестировании свойств времен- ных рядов. В данном разделе рассмотрены проблемы тестирования наличия или отсутствия автокорреляционных связей путем проверки гипотезы о значимости непосредственно расчетного значения первого коэффи- циента автокорреляции фактической ошибки £,. На первый взгляд, это — наиболее очевидный и прямой путь при проверке гипотезы о нали- чии автокорреляционной связи в ряду ошибки е^ Однако на этом пути исследователю приходится сталкиваться с достаточно сложными про- блемами. Дело в том, что закон распределения выборочного коэффи- циента корреляции по форме достаточно сложен и зависит от абсо- лютного значения г^ и числа измерений Г. При 1Н-> О плотность рас- пределения Д г) симметрична, но с ростом абсолютного значения этого коэффициента она становится резко асимметричной, особенно при не- больших значениях Г. Вследствие этого традиционные тесты проверки значимости параметров, использующие предположение о «нормально- сти» закона распределения их ошибок, в данной ситуации следует применять с определенной осторожностью, особенно в малых по объ- ему выборках. ^ HanoNfHHM, что первый выборочный коэффициент автокорреляции ошибки рас- считывается по следующей формуле: 76
На практике проверку значимости выборочного коэффициента авто- корреляции ошибки гх можно провести двумя способами. Во-первых, можно пренебречь погрешностями, обусловленными отличием закона распределения выборочного коэффициента автокорреляции от нормаль- ного, тем более что при ri—>0 они не столь значительны. Тогда процедура проверки значимости этого коэффициента сводится к сопоставлению рас- четного значения его критерия Стьюдента |Г1 I ^г=-Г" (2.54) ^1 с его табличным значением т* (р*, Г-2), взятым при заданном уровне доверительной вероятности р* и известном числе степеней свободы Г-2. В выражении (2.54) ст^ характеризует среднеквадратическую ошибку выборочного коэффициента корреляции, величину которой приблизительно можно определить на основании следующего выра- жения: Если окажется, что Тг йг*, то первый коэффициент автокорреляции временного ряда фактической ошибки б, можно принять равным нулю, и в этом случае ее автокорреляционные взаимосвязи можно считать стати- стически несущественными. Второй способ оценки значимости коэффициента Гх с точки зрения ма- тематической статистики более строгий. При его проведении вместо вы- борочной оценки коэффициента автокорреляции г\ используется его пре- образование zi = Arthri = ^ In^^. (2.56) 2 l"~'i Фишер показал, что величина zi распределена приблизительно по нормальному закону с нулевым средним практически при любых значе- ниях Г1<1 даже при не слишком большой выборке. Вследствие этого рас- четное значение критерия Стьюдента, используемое при проверке гипо- тезы о независимости рядов et и et+u может быть определено по формуле г^ =-^, где (Tz — среднеквадратическая ошибка переменной zi. В практи- ческих расчетах ее можно заменить оценкой, полученной из выражения (2.55). 77
2.2.3. Оценка дисперсии истинной ошибки модели На практике вместо дисперсии истинной ошибки Ge, значение кото- рой не известно, используется ее оценка, рассчитываемая на основе фактических значений ошибки е, согласно следующей формуле (см. (1.32), (2.19)): ^ Т-П-] Обоснованность такой замены можно подтвердить, показав, что 1 1 M[(Je ]=(7е , Т.е. математическое ожидание дисперсии фактической ошиб- ки, определенной на основании известных оценок МНК параметров эко- нометрической модели, равно дисперсии ее «истинной» ошибки. Заметим, что векторы значений фактической и «истинной» ошибки связаны следующим соотношением: е=у -Ха=Х а^б-Х [{XXy^-X-iX- да-£)]= ^б-Х{ХХ)-^'Х'&^[Ет-Х(ХХ)-^'Х\е^С'е. (2.57) где Ет — единичная матрица размера ТхТ и С=Е'г-Х(ХХУ^'Х — сим- метрическая полуопределенная идемпотентная матрица, обладающая со- гласно ее определению следующим свойством^ G''=G, к=2, 3,.... (2.58) Из (2.57) следует, что расчетные значения фактической ошибки е, ли- нейной эконометрической модели могут быть выражены в виде линейных комбинаций неизвестных значений истинной ошибки ^. В этом случае сумму квадратов значений фактической ошибки можно представить в следующем виде: £ е^ =(e'e)=eGVe=^Ga (2.59) t=i При выводе выражения (2.59) учтено, что G — симметрическая идем- потентная матрица. Найдем математическое ожидание левой и правой частей выражения (2.59). M[e'e]=M[^G€]= Т Т i=\ j=l = Е^7Г^кп = ^|-^'*(<^)' (2.60) t=l ^С^=[Ет^Х'{ХХ)-^Х]^=Ег-'^<ХХ)-^Х+Х^ХХ)-^ХХ^ХХ)-^Х=Ет-Х{^ 78
т где tr(G)=]^gy7 — ^-^ВД матрицы G, представляющий собой сумму ее диагональных элементов (сумму элементов главной диагонали); М[б/ ]=0'£ — дисперсия «истинной» ошибки модели. При вьшоде выражения (2.60) также учтено, что М[£^-^]=0, если t^j в силу независимости разновременных значений ошибки £^. След матрицы G может быть определен с учетом свойств этой харак- теристики. В связи с этим напомним, что: а) след арифметической суммы матриц равен сумме следов каждой из них tr(G)= И{Ет)- \х[Х(ХХ)-^Х]\ (2.61) б) следы произведений матриц АВ и ВА равны между собой, естест- венно, при условии, что оба произведения АВ и В А матриц An В сущест- вуют. Тогда, учитывая, что матрица Л'ЛГ имеет размер (ai+1)x(az+1), получим \х[Х'{ХХГ^Х]^\х[{ХХГ^'ХХНгЕп^у, (2.62) где £л+1 — единичная матрица размера (л+1)х(л+1). Поскольку в силу формы единичных матриц справедливы равенства ivEj^Tn trEn+i= я+1, то из выражения (2.60) вытекает, что несмещенная оценка дисперсии истинной ошибки модели <j/ определяется на основа- нии следующего выражения: (7^ = -^ И М[ае^] = tj/. (2.63) r-/j-l 2.2А Особенности проверки обратимости матрицы ХОС Как было отмечено ранее, при наличии достаточно сильной корреля- ции меэюду двумя или несколькими переменными Хи /=7,2,..., w, могут воз- никнуть трудности, связанные с обращением матрицы XX, следствием которых являются ошибки при определении оценок коэффициентов эко- нометрической модели. Последствия мультиколлинеарности могут быть разные. Во-первых, падает точность оценивания, что проявляется в росте дис- персий ошибок коэффициентов модели, возникновении сильной зависи- мости между ними. Во-вторых, может быть неправильно определена значимость незави- симых переменных. Иными словами, ошибки, появляющиеся при обра- 79
щении плохо обусловленной матрицы XX приводят к тому, что искажа- ется оценка степени влияния независимых факторов на зависимую пере- менную у. Вследствие этого некоторые значимые факторы на этапе их отбора сверху могут быть исключены из модели, а незначимые, наоборот, оставлены. В-третьих, оценки коэффициентов становятся крайне чувствительны- ми к изменениям исходных данных эконометрической модели. Малейшие изменения значений переменных ух и хц или их количества вызывают значительные сдвиги в оценках коэффициентов оо, Ль—, ^л- В результате этого иногда меняется содержательный смысл модели. Это свидетельст- вует о ее ненадежности, неадекватности рассматриваемому реальному процессу. Информация о плохой обусловленности матрицы XX моэюет содер- эюаться в матрице выборочных коэффициентов парной корреляции пе- ременных Xi, /=7,2,..., л. Значения, близкие по абсолютной величине к единице у коэффициентов некоторой даже незначительной по количеству группы переменных, уже указывают на возможные трудности, связанные с обращением матрицы XX, Вместе с тем, плохая обусловленность мат- рицы XX может иметь место и при относительно небольших значениях парных коэффициентов корреляции (|г |« 0,8) у группы, содержащей дос- таточно большее число переменных. Для выявления сильной мультиколлинеарности между независимыми переменными д:,, /=1,2,..., п, обуславливающей плохую обратимость мат- рицы XX, можно использовать специальные тесты. Простейший из них связан с использованием понятия чувствительно- сти оценок коэффициентов эконометрической модели к незначительно- му изменению состава исходных данных. Тестирование в этом случае со- стоит в сопоставлении оценок коэффициентов первоначального варианта модели со значениями коэффициентов модели, построенной на меньшем количестве данных, т.е. при удалении из вектора у и матрицы X несколь- ких элементов и строк соответственно с одинаковыми индексами. Если некоторые из коэффициентов изменились достаточно сильно, то это свидетельствует о плохой обратимости матрицы XX, вызванной зна- чительной мультиколлинеарностью между независимыми факторами мо- дели. На наличие мультиколлинеарности указывают и высокие значения мноэюественных коэффициентов детерминации, вычисляемых меэюду объясняющими переменными на основе значений их парных коэффициен- тов корреляции, объединенных в соответствующую матрицу. Напом- ним, что множественный коэффициент детерминации D/ определяет уро- вень линейной связи переменной Х/ с набором оставшихся переменных 80
хи Xz,..., Xi.\, Хм,..., Xn. Его значение может быть определено на основе следующего выражения: Di = R^ = \w\lWii, (2.64) где I WI — определитель матрицы W; W„ — алгебраическое дополнение матрицы W к элементу с индексами н, Я, — коэффициент множественной корреляции между переменной д:, и оставшимся набором переменных. W = 1 'Si 12 1 13 М 'иг 'иЗ In In 1 (2.65) Матрица W симметрична, поскольку г/,=гу/, на ее главной диагонали стоят единицы, поскольку Гц =1 и при п переменных она имеет размер ПУЛ, /=1,2,..., п. Значимость коэффициента детерминации определяется на основании критерия Фишера, величина которого рассчитывается согласно следую- щей формуле: ' (1-/?')/(Г-п) (2.66) Если некоторые из показателей F/, /=1,2,..., п будут весьма значитель- ными, т.е. существенно превосходить порог статистической значимости показателя D/, равный табличному значению критерия Фишера F* (Г--1, Т-п, р*), то существуют серьезные основания полагать, что между переменными Хи л:2,.-., Хп существует сильная корреляционная зависимость. В заключение данного раздела отметим следующее. В тех случаях, когда проведенные тесты подтвердили выполнимость условий (2.21)- (2.24), процедуру построения линейной эконометрической модели можно считать завершенной. Однако если хотя бы один из тестов показал отрицательный результат, нельзя утверэюдать, что постро- енная эконометрическая модель характеризуется высоким качест- вом. В таком случае необходимо разобраться с причинами невыполне- ния условий (2.21)^(2.24). Они могут не выполняться из-за неправиль- ного выбора формы модели, неверного состава независимых факто- ров. В этом случае необходимо вернуться к этапу содерэ/сательного анализа проблемы построения модели и еще раз проверить обоснован- ность использования выбранной функциональной зависимости, соста- ва входящих в нее переменных, корректность измерения га количест- венных значений и т.п. 81
в разделе 2.3 будет, например, показано, что смещенность оценок па- раметров эконометрической модели может быть обусловлена невключе- нием в модель ряда значимых факторов. На рис. 2.1 изображены последствия неправильного выбора линейной формы функционала yt^oo+^iXt эконометрической модели вместо квадра- тичной функции У( =6o+6i ХгЛ-Ьгх^, Несложно заметить, что при линейной форме зависимости между зна- чениями ошибки существует определенная закономерность, т.е. ошибку нельзя будет считать случайной. Она проявляется хотя бы в том, что зна- чения ошибки линейной модели на каждом из рассмотренных интерва- лов имеют одинаковый знак. Ошибка квадратичной зависимости имеет «более случайный» характер. квадратическая зависимость линейная зависимость ошибка модели О X Рис. 2.1. Последствия для фактической ошибки неправильно выбранной формы функционала модели Вместе с тем причинами невыполнения условий (2.21)-(2.24) могут быть и специфические свойства рассматриваемых процессов, выражаемых переменными у, и Xj,, /=1,2,..., /i; ^1, 2,..., Г. В таком случае выход следует искать в использовании более подходящего метода оценки параметров эконометрической модели, более полно учитывающего свойства отобра- жаемых ею процессов. Как правило, такой поиск предполагает определен- ную модификацию рассмотренного в данной главе «классического» МНК. Такие модификации, соответствующие различным типам эконометри- ческих моделей, описывающих социально-экономические процессы со специфическими видами взаимосвязей, вызывающих нарушение «кано- нических» условий МНК (2.21)-(2.24) рассмотрены в последующих гла- вах данного учебника. 82
2.3. ОЦЕНКА ПОСЛЕДСТВИЙ НЕПРАВИЛЬНОГО ВЫБОРА СОСТАВА НЕЗАВИСИМЫХ ПЕРЕМЕННЫХ МОДЕЛИ В данном разделе рассмотрим особенности влияния на качество пара- метров эконометрической модели ошибок, допущенных на этапе содер- жательного анализа при выборе состава независимых переменных (фак- торов). В разделе 2.2.3 отмечено, что при обосновании модели могут иметь место ошибки двух видов: выбрана неправильная форма функцио- нала f( а, Xt) и неверно определен состав ее независимых переменных. Та- кие ошибки называют ошибками спецификации модели — ошибка специ- фикации формы уравнения модели и ошибка спецификации матрицы X. Ошибка спецификации первого вида часто приводит к появлению авто- корреляционных взаимосвязей во временном ряду фактической ошибки модели Ct. Это в определенной степени свидетельство того, что и ее «ис- тинная» ошибка St не обладает свойствами процесса «белого шума», по- скольку в такой ситуации следует ожидать невыполнение стандартных условий (2.21) и (2.22). Ошибка спецификации матрицы Хмоэюет быть обусловлена разными причинами. Во-первых, в модель могут быть не включены некоторые «существенные» факторы, во-вторых, включены несущественные фак- торы. Возмоэ/сна такэ/се комбинация этих причин. Рассмотрим последст- вия, к которым приводят различные варианты ошибки спецификации матрицы X. Предположим, что вместо «истинной» эконометрической модели с матрицей значений независимых факторов X у^Ха^е (2.67) л была сформирована модель с матрицей X , отличной отЛГ, y^Xfib^, (2.68) где fi— вектор коэффициентов модели (2.68). Для модели (2.68) на основе МНК были найдены оценки параметров согласно известному вьфажению Ь = (Х'Х)~^-Х'у, (2.69) где b — вектор оценки параметров модели Д Подставив в (2.69) вместо вектора д^ правую часть из выражения (2.67), получим 83
* = (Х'ХУ^ • Х'Ха+(Х'ху^. Х'е. (2.70) Из этого результата непосредственно вытекает, что, если столбцы л матрицы X и ошибка модели (2.67) независимы, то M[b]=Ga (2.71) л л ^- л где G = (X^Xy Х'Х — матрица, столбцами которой являются оценки коэффициентов моделей следующего вида: л л % =8ю+ Si\ x\t-^... + 8ik Xkt + Q)it, (2.72) л где X it —значение f-го фактора матрицы X в момент г; /=1,2,...,п; xjt — л значение у-го фактора матрицы X в момент t; 7=1,2,...,Л. При этом пик л — количества независимых факторов в матрицах X и X соответствен- но. Из выражения (2.71) вытекают следующие результаты: А 1. Предположим, что матрица X отличается от матрицы X только отсутствием последних г столбцов. Иными словами, модель (2.68) отли- чается от модели (2.67) тем, что в нее не вошли переменные х к+и > х л *+2./,-. х„„ где л-/?=г — т.е. X =[дсь х г х *], Д:=[*1. Хг,..., Хь Хм д:„], где Xi =[х,1 ,.". Jf/r]'- В этом случае матрица G будет иметь следующий вид: G = О О 1 О О V iln Skn (2.73) 1 8kjc+l Заметим, что матрица G размера кхп будет образована объединением единичной матрицы Et размера кхк и матрицы G, размера кхг, элемен- тами которой являются коэффициенты моделей типа (2.72), в которых в качестве зависимых переменных выступают не включенные в матрицу л л X факторы Хк+и xii+2,..., х„. С учетом вида матрицы X очевидно, что G=[E,Gr], (2.74) где л л , л Eii=(X'xr^-x'x. 84
Подставив матрицу G из вьфажения (2.74) в выражение (2.71), полу- чим соотношение, связывающее математические ожидания параметров модели (2.68) с «истинными» параметрами модели (2.67) M[bj] ^цл-gj^M • zm + ... +&n • (Хп, ; = 1, 2,..., к. (2.75) Таким образом, оценка у-го коэффициента модели (2.68) оказывается смещенной по отношению к истинному значению у-го коэффициента мо- дели (2.67), у=1, 2,...,*, и величина этого смещения определяется следую- щим выражением: q - M[bj] = gj^M • cCk^x + ... + gjn • (Xn- (2.76) Заметим, что коэффициенты g,>„ m=/:+l,..., n; зависят от ковариаций, включенных в модель (2.68) первых к независимых факторов и невклю- ченных в нее последних г независимых факторов модели (2.67), посколь- ку gj^m = Z-^7> '^пи ' гдеУ=1,2,...,/:, т=/:+1,..., п, t В самом деле, если в качестве независимых факторов моделей (2.67) и о (2.68) использовать центрированные переменные со значениями xu-Ji (см. выражение (1.13)), то gj,^ = ^(лу^ - Jy) • {x^t -х^) = t = ^XjfXf^f -Т -Xj -Хщ представляет собой числитель ковариаций факторов t Xj и Хт- Смещение оценок коэффициентов (2.70) можно интерпретировать также как перераспределение силы воздействия невключенных факторов на оставшуюся их совокупность. л 2. Предположим, что матрица X образована присоединением дополни- тельных г столбцов-значений переменных jCyv,7=1, 2,..., г, корреляционно не связанных с переменной у, (не оказывающих влияние на зависимую пере- менную). Для облегчения выкладок будем считать, что все переменные л рассматриваемых моделей центрированы. В таком случае матрицу X , в которой отсутствует единичный столбец, можно представить в следующем виде: А о о о где А X — матрица размера Тхг, образованная значениями переменных о xjt. Тогда согласно выражениям (2.69) и (2.74) получим 85
b=[bu &2.- bn, Ьл+Ь..-, Ьп+гУ= /oo oo^ fOl X' X X'dX о о о о 1 ' X' X' ■y+f{E) = X' X Х'КХ о о о о дХ'Х dJC'-6X vA^V X-a+f{e)G-a+f{e), (2.77) Л Л где f{e) = {X''Xy^'X''e. Рассмотрим математическое ожидание вектора Ь. Поскольку факторы л:у, значения которых образуют присоединенную матрицу АЛ!^, пере- о о о менная у и ошибка £ независимы, то М[Х'у]-М[Ьп^\,.,,, &л+г]=[0,...,0], т.е. вектор оценок коэффициентов при присоединенных факторах являет- ся нулевым. Из этого результата вытекает, что математическое ожидание произве- дения матриц АЛ^' и Z также образует нулевую матрицу соответст- вующего размера. Таким образом, о о с учетом (2.78) матрицу G из выражения (2.77) можно представить в следующем виде: G = X' X \ -1 О ^x''^x г X' X О о (2.79) где Еп — единичная матрица размера яхл, и нулем обозначена матрица размера г/п, состоящая из нулевых элементов. Полученные результаты свидетельствуют, что оценки коэффициен- тов эконометрической модели с добавленными несущественными фак- торами являются несмещенными оценками коэффициентов «истинной» модели. При этом математические ожидания оценок коэффициентов при добавленных факторах равны нулю. Кроме того, присоединенные факто- ры и основные факторы модели попарно независимы. 86
Полученные результаты позволяют посмотреть на проблему отбора факторов для эконометрической модели под другим углом зрения. Несу- щественные факторы должны характеризоваться слабыми (незначитель- ными) корреляционными взаимосвязями с основными независимыми пе- ременными. На это может указать значение коэффициента множествен- ной детерминации между фактором дс, и остальным набором переменных. Если его значение, рассчитанное для /-го фактора согласно выражению (2.54) является незначимым по критерию Фишера (выражение (2.66)), то есть все основания полагать, что этот фактор несущественный. Однако при этом необходимо быть уверенным, что все остальные факторы спо- собны объяснить изменчивость переменной д^, в достаточно полной мере. 2.4. ОЦЕНИВАНИЕ ПАРАМЕТРОВ ЭКОНОМЕТРИЧЕСКОЙ МОДЕЛИ С УЧЕТОМ ОГРАНИЧЕНИЙ При нахождении оценок параметров линейной эконометрической модели с использованием МНК предполагалось, что их значения не свя- заны никакими ограничениями. Вместе с тем, исходные предпосылки, лежащие в основе некоторых моделей, описывающих реальные соци- ально-экономические процессы, предполагают, что значения их пара- метров не могут быть произвольными. Как это будет показано в сле- дующих разделах, часто «содержательными» являются модели только с положительными значениями параметров. Такая ситуация характерна, например, для моделей, описывающих зависимость выпуска продукции от капиталовложений. При их построении предполагается, что влияние капиталовложений любого предыдущего периода на выпуск продукции в текущем периоде может быть только положительным. В этом случае при оценке параметров должны приниматься во внимание естественные ограничения типа а/>0. (2.80) В ряде моделей в качестве исходных допущений выдвигаются оп- ределенные соотношения между значениями параметров. Так, в клас- сическом варианте производственной функции Кобба-Дугласа (1.17) условие постоянной отдачи от факторов требует, чтобы сумма коэф- фициентов при них равнялась единице, т.е. ai+a2=l, при сохранении условия (2.80) для каждого из них. Ограничения в виде соотношений между значениями параметров называют линейными. В общем слу- чае они могут быть представлены в векторно-матричной форме запи- си Ra=r. (2.81) 87
где г — известный вектор-столбец, состоящий из к элементов, /:ог+1; R — известная матрица порядка кх( я+1). Ее элементы формируются с учетом конкретного вида линейных взаимосвязей между параметрами модели. Например, если в модели предполагается, что (Х2=аз и аг-^сс^-^! 0^=2, то вектор г и матрица R имеют следующий вид: г = R = 1 -1 1 1 В общем случае постановка задачи оценки коэффициентов экономет- рической модели с учетом ограничений с критерием минимума суммы квадратов ошибки формулируется следующим образом: найти параметры а/, /=0, 1,..., п, минимизирующие квадратическую функцию следующего вида: mm Y,et={y-X-a)\y-Xa) (2.82) при ограничениях Oi* < at < Ok\ (2.83) R a^r, (2.84) где oCi* и cXi — соответственно нижняя и верхняя границы области суще- ствования значений параметра а/. Заметим, что в постановке (2.82)-(2.84) оценки параметров модели обычно определяются в ходе решения задачи оптимизации (минимиза- ции) квадратической целевой функции при линейных ограничениях с ис- пользованием вычислительных процедур итеративного характера. Мето- ды решения таких задач рассмотрены в главе XI. Вместе с тем, если принимается во внимание только одно ограниче- ние, выраженное соотношением (2.84), то оценки параметров экономет- рической модели могут быть получены в аналитической форме. Рассмот- рим процедуру получения такого решения с использованием МНК. Требуется определить вектор оценок параметров л = (йд,..., 5„) мо- дели з^ = Х • а-\- е, минимизирующий квадратическую функцию з^^^у-Х-аПу-Х-а) (2.85) при ограничении (2.84) с использованием исходных данных, представ- ленных в виде вектора-столбца наблюдаемых (известных) значений зави- симой переменной у и матрицы наблюдаемых значений независимых факторов X. Здесь а означает вектор оценок параметров модели с огра- ничениями. 88
Аналитическое решение данной задачи может быть получено с ис- пользованием метода множителей Лагранжа. Функция Лагранжа в этом случае записывается в следующем виде: (p = {y-X'a)\y-X'a)-fi\Ra-r), (2.86) где // — вектор множителей Лагранжа, образованный к элементами {к — количество ограничений). Условие минимума функции ^по аргументу а имеет традиционный вид ^ = 0 = -2Xy^-2{X'X)a-R'n (2.87) да или 2{X'X)a=2Xy-R'^, (2.88) Умножив правую и левую части выражения (2.88) слева на R'{X'X)~^, получим 2Ra=-2R{X'Xy^Xy-R{X'X)-^R'H, (2.89) Заметим, что {Х'Х)~^Х' - а, где а — оценка МНК, полученная без учета ограничений. Принимая также во внимание, что Ra=r, векторы мно- жителей Лагранжа/д определим на основе следующего выражения: /I = 2[R(rxy^RT\r—Ral (2.90) Подставив (2.90) в (2.87), получим a=a-\-(X'X)-^R\R(X'X)-^RT4r-Ra), (2.91) где а, напоминаем, — вектор параметров той же модели, но рассматри- ваемой без ограничений. Заметим, что в выражении (2.91) все матрицы и вектора известны, и, таким образом, вектор оценок коэффициентов модели с ограничениями а определяется непосредственно. Определим традиционным образом вектор ошибки модели с ограни- чениями: е=у-Х а . (2.92) Добавив и вычтя в правой части выражения (2.92) слагаемое Ха, полу- чим выражение, связьшающее ошибки обоих вариантов моделей в сле- дующем виде: ё = у'-Ха-Х(а-а) = е'-Х{а-а), (2.93) Из выражения (2.93) непосредственно следует, что сумма квадра- тов ошибки модели с ограничениями определяется следующим обра- зом: 89
(ё'ё) = (е'-Х(а-а)У(е-'Х{а"а))={е'е) + (а'-а)ХУС(а-а), (2.94) При выводе выражения (2.94) учтено, что Х'е=€'Х=0 в силу свойства ошибки (2.44). BeicTop ошибок оценок параметров а найдем, подставив в (2.91) вме- сто вектора а выражение (ХХ)~^Х\Х-о^ё), где а vi. е— векторы парамет- ров и ошибки истинной модели. В результате получим а=а-¥Р{Х'Х)-^Х'-е, (2.95) где Р — матрица, определенная следующим выражением: Р = £ - (X'X)-^R\R{XX)-^RVR' (2.96) Таким образом, ^=а-а = Р{Х'Х)-^Х''е (2.97) является вектором ошибок оценок параметров линейной эконометриче- ской модели с учетом наложенных на них ограничений в виде равенств (типа (2.84)). Поскольку М[Р{Х'Х)'^Хе]=Р(ХХ)~^Х'М[ё[^, то при отсугствии кор- реляционных взаимосвязей между переменными Хц и ошибкой Et полу- ченные оценки а являются несмещенными, т.е. мт-^а. (2.98) Их ковариационная матрица определяется следующим выражением: Соу {а) = М[{а-а\а-а)'] = М[Р{Х'ХТ^Х''ее''XiX'Xy^'P']^ = (7^Р(Х'ХУ^Р\ (2.99) С учетом вида матрицы Р (см. (2.96)) также несложно доказать спра- ведливость следующего равенства^ Pirxr^'P'^Pirxr'. (2.1(Ю) В результате ковариационная матрица оценок параметров линейной эконометрической модели с учетом наложенных на нее ограничений в виде равенств (R-a=r) определяется следующим выражением: Со\(а) = а^ •PiX'XyK (2.101) В практических исследованиях, как и ранее, дисперсия «идеальной» модели а/ заменяется ее оценкой а^, рассчитанной с использованием фактических значений ошибки ё согласно известной формуле ^ Это делается подстановкой данного вьфажения в (2.99) и непосредственного пе- ремножения матриц с учетом правила их транспонирования. 90
т ^=-^ На основании выражения (2.94) несложно оценить та1сже «потери» в точности аппроксимации известных значений зависимой переменной yt, г=1,2,...,7'; при использовании эконометрической модели с ограничениями на параметры вместо модели без таких ограничений. Подставляя в (2.94) вместо разности оценок а-а ее выражение из формулы (2.91), после очевидных упрощений получим {e'e)-{e'e) = {r-Ray[R\X'X)-^R'r4r-Ra). (2.102) Левая часть выражения (2.102) представляет собой разницу между суммами квадратов ошибок моделей с ограничениями на параметры и без ограничений. 2.5, МЕТОД МАКСИМАЛЬНОГО ПРАВДОПОДОБИЯ (ММП) 2.5.1. Предпосылки метода максимального правдоподобия Достаточно широкое распространение при оценке параметров моде- лей получил и метод максимального правдоподобия, базирующийся на критерии (принципе), согласно которому оптимальные оценки парамет- ров обеспечивают максимум так называемой «функции правдоподо- бия». Эта функция может быть интерпретирована как условная плот- ность совместного распределения (р{оАу, х) л+1-го неизвестного пара- метра модели (%, а\,.., сСп при заданных исходных значениях зависимой переменной yt и независимых факторов хц, /=1,..., п\ г=1,.... Г, с учетом того, что эти переменные взаимосвязаны между собой эконометриче- ской моделью с функционалом j{a, х) в общем случае. Оптимальные оценки «о*, а\ ,..., а„* параметров этого функционала характеризуются в такой ситуации максимальной вероятностью, равной значению функ- ционала правдоподобия в точке (л+1)-мерного пространства оценок с координатами Оо*, а\ ,..,, Un . Такие оценки и называют оценками макси- мального правдоподобия. При их нахождении обычно учитывается, что каждому набору значе- ний оценок параметров соответствуют свои собственные ряды расчетных л значений зависимой переменной у^ и фактической ошибки модели е,, это позволяет сформировать функцию правдоподобия на основе плотности 91
совместного распределения значений ошибки модели Et в моменты /=1,2,..., Г, и оценки максимального правдоподобия находить, максими- зируя эту функцию. В целом, в основе ММПлеж:ат следующие рассуждения. 1. Выбранная модель адекватна процессу изменения (распределению) зависимой переменной уг в том смысле, что ее форма и состав факторов «правильно» выраэюают причинно-следственные связи, определяющие его закономерности. Таким образом, истинная ошибка €t является «абсолют- но» случайной переменной. Ее закон распределения выралсает закон рас- А пределения значений yt относительно расчетных значений у,, рассматри- ваемых при известных значениях параметров Оо, cxj,..,, а„, как выборочные л математические ожидания Af [yj = у^ = Oq + aiXif +... -f ДГ^д^^^. Отклоне- ние значения yt от его математического оэ/сидания объясняется влиянием на этот процесс каких-либо случайных воздействий, которые невозмоэюно учесть в рамках данной модели и т.п. 2. Закон распределения значений уг известен. Чаще всего выдвигается естественное предполоэ/сение о его нормальном характере. Плотность условного совместного распределения значений yt при известных значени- ях независимых факторов х^ определяется следующим выраэюением: А А Л 2 2 (piyt Xt)--N(y^,(Ty^), где Су^ — дисперсия значения yt, определяемая от- л носительно его математического ожплдания у^. Для совокупности случайных величин yt, /=1, 2,..., Г этот закон можно выразить путем задания их совместной плотности распределения, в об- щем случае имеющей следующий вид: (р(У1 ...,Ут /X) = N(M\yl Пу\ (2.103) где М\у] — вектор математических ожиданий наблюдаемых значений Уь-» Ут* Ц^ — ковариационная матрица значений у„ определяемая сле- дующим выражением: ч= al СО\(У1,У2) ... С0\(У1,Ут) л С0У(У2,У1) (^2 ... С0У(у2,Уг) С0\(Ут,У1) С0\(Ут,У2) л ^2 (2.104) 92
л где значения а} и cov(y^, у,+/) следует интерпретировать как дисперсии и ковариации случайных переменных у/ и у^ и у/+/ соответственно\ В «классическом» варианте ММП в отношении зависимой переменной У/ выдвигается предположение о независимости распределений значений у^ рассматриваемых в разные моменты времени г=1, 2,..., Г, и о постоян- стве их разновременных дисперсий относительно математических ожи- А даний у,. В этом случае матрица £2у имеет следующий вид: a^^G^'E = (j^' (\ 0 ^0 0 . 1 . 0 . .. 0^ .. 0 • 1> (2.105) где (7^ — постоянная дисперсия переменных уь..., ут\ Е — единичная матрица ТхТ, 3. Функция плотности закона распределения ошибки St эквивалентна функции плотности закона распределения переменной yt, т.е. (p(et)=(p (yj), и в общем случае <p(€t)-N(0, £2el Данное предположение вытекает из того факта, что производные оши- бок по соответствующим значениям у, равны 1, т.е. —^ = 1, а производ- ные ошибок по разновременным значениям yt-j равны нулю, у=1,2,..., т.е. ^ Дисперсия переменной у, в точке t может рассматриваться как характеристика, построенная на множестве выборочных оценок математических ожиданий M\yi\ при соответствующих вариантах оценок их параметров, т.е. как ^ г ._ .2 /т2 -'•=1 Z (у, -Мг[у,]Г R-\ л где R - количество возможных вариантов оценок параметров и М^>',]= у, - выбороч- ное математическое ожидание переменной у, в г-м варианте. Аналогичным образом могут быть проинтерпретированы и определены и ковариации значений у, и у,+\, t=\, 2,...T,j=l,2 Г-1 L(y,-MrWy(.yt+j-Mrlyt+j]) cov(y,. yt+j ) = I^ -— . 93
—'— = о. Это непосредственно устанавливается прямым дифференциро- de, ванием —- выражения>',=6»b+^iJCij+...+Q;,jc„,+£j в предположении, что £) и yj независимы при i^j. Напомним, что плотность закона совместного распределения значений yt (условного распределения) взаимосвязана с плотностью закона совместного распределения ошибки 6^, t=l, 2,..., Т следующим образом: (р(у/Х)=(р(€У \д€/ду\, (2.106) где I де/ ду I - якобиан перехода от переменной €ку, рассчитываемый как абсолютное значение следующего определителя: д€/ду = 3^1 ^ 3^2 э^ ^ ■ дет Эуг двг В соответствии с тем, что —- = 1, а —- = О, i^j, получаем, что ddby-X оу^ ^yj и (f(ylX)^(p{e). Из этого факта вытекает, что соответствующие плотности распределе- ния ошибки е имеют следующий вид: ^(^1,..., ет) = N (О, Де), Др А- (2.107) С учетом (2.107) условия независимости разновременных переменных yt и постоянства их дисперсий переходят в соответствующие условия для разновременных значений ошибки St и тогда вместо выражения (2.105) можно записать i^=i2^C7/-£. (2.108) Выражение (2.108) с учетом свойства М[£]=0 определяет истинную ошибку модели £} как процесс «белого шума», т.е. как стационарный процесс с постоянным (нулевым) математическим ожиданием (М^]=^г-Л^,]=0), по- 94
стоянной, независящей от времени дисперсией {а^ =^т ) и нулевыми ковариационными (корреляционными) связями между ее разновремен- ными значениями St uSt^uSt и 6j_2 и т.д. В основе метода максимального правдоподобия лежит исходное пред- положение о том, что «лучшим» оценкам оо > ^i >•••> ^п «истинных» зна- чений параметров эконометрической модели Oq, аи..,, сСп должен соответ- ствовать наиболее вероятный набор «фактических» значений ошибки е\ , ^2 ..-> ^г . рассматриваемых как «своего рода оценки» ее истинных значе- ний ей ^2»-.., £т и поэтому удовлетворяющих вышеприведенным предпо- ложениям. Таким образом, максимум произведения/7(ei)/7(e2)-.../7(e7') соответ- ствует наиболее вероятному сочетанию значений £"„ г=1, 2,..., Г, обес- печиваемому «наилучшими» оценками параметров модели. При этом имеется в виду, что для произвольного набора значений фактической ошибки е\, ^2,..., ет произведение вероятностей p{ei)p{e2)',.*'р{ет ) в данном случае выражает вероятность совместного распределения их значений, соответствующих определенному набору оценок параметров оо» Ль..., а„. С учетом этого решение задачи оценки параметров линейной эконо- метрической модели типа (1.2) может быть получено в результате макси- мизации целевой функции следующего вида: т =П /=1 ^2лa^ ехр L(fi,...,£7-) = P(fi) 1 р{ет) = 2сг {y,-aQ-a^x^,-...-a^x^y (2.109) по неювестным параметрам ci), а\ ,..., а„ н (Tg при заданных массивах ис- ходных данных, выражаемых вектором известных значений зависимой пе- ременной у, и матрицей значений независимых факторов X размера Тх(п+1). У = Уг УУт. ,х = 1 ДГц Х2\ ... JC„i 1 Хх2 Х22 ... Х„2 1 Ху1 Xjp ... ыи (2.110) в которой столбец, состоящий из единиц, соответствует коэффициенту модели аь. 95
2.5.2. Процедура получения оценок максимального правдоподобия Целевая функция типа (2.109) называется функцией максималь- ного правдоподобия. Несложно заметить, что оптимальные значения оценок параметров Оо , ai ,.-, ^л и дисперсии фактической ошибки о^^, соответствующие ее максимуму, должны обеспечивать и максимум ее ло- гарифма. Иными словами, при определении значений этих оценок можно т решать задачу максимизации InL(£i ,..€j.) = ^\nр{е^) = l{e^...€j) ,Ъ таком случае в условиях независимости разновременных ошибок Et и £j_, 7- т ^ ^'^^ 2 2 ^ V т г=1 X (2.111) Не принимая во внимание первое постоянное слагаемое в правой час- ти выражения (2.111), заметим, что оптимальные значения Oq , а\ ,..., а„ и (У^ в этом случае могут быть найдены путем решения следующей систе- мы из W+2-X дифференциальных уравнений в частных производных по этим параметрам: dl 1 ^ ^^- = ^rY[Xif(yt-ao-aiXif-...-anX^j)] = 0; / = 1,2,...,п; (2.112) ^^/ о-; г=1 dl 1 ^ 1 ^ Для получения более компактной векторно-матричной формы записи решения системы (2.112) представим линейную эконометрическую мо- дель в векторно-матричной форме: у=Хаь£. (2.113) где вектор у и матрица X определены выражением (2.110) и вектор ошибки € имеет такой же вид, как и вектор у; вектор параметров На основании (2.113) вектор ошибки можно представить в следующем виде: €=У'Ха^ (2.114) 96
и последнее слагаемое в выражении (2.111) записать как скалярное про- изведение вектора ошибки строки на ее столбец. С учетом этого выраже- ние (2.111) приобретает следующий вид: \nL = l = ~ln(27r)~lnaj- {y-X-ai-iy-X-a). (2.115) Дифференцируя выражение (2.115) по неизвестному вектору парамет- ров or и по неизвестной дисперсии ошибки сг/, получим следующую век- торно-матричную форму записи системы (2.112): ЪИЪа^Хг^-Х' у^Х''Х'а)^^\ ^ (2.116) Э//Эс7^=-Дг-ь-^(у-Х-^)'(у-Х-бГ) = 0. 2с7^' г<у\ -2^ Поскольку (Jf^, из первого уравнения системы (2.116) непосредст- венно получаем вектор оценок ММП коэффициентов линейной эконо- метрической модели в следующем виде: а^^{ХХТ^-Х'у, (2.117) а из второго — оценку ММП дисперсии ошибки эконометрической модели: al^\{y-Xa1\y-Xa)^\Y.^], (2.118) Заметим, что выраэюение (2.117) .ничем не отличается от своего аналога (2.8), полученного с использованием МНК сг оценка дисперсии ошибки модели, полученная на основании выраэюения (2.118), является смещенной. Вследствие этого на практике используют несмещенную оценку дисперсии, определяемую следующим образом : Известно, что оценки параметров, полученные с использованием ММП, обладают свойством состоятельности^: plim(a)=a, ^ Доказательство справедливости выражения (2.119) приведено в разделе 2.3. ' Состоятельность в данном сл)Д1ае характеризует определенное свойство функции правдоподобия, связанное с увеличением ряда наблюдений переменных модели при условии однородности выборки. Оно состоит в том, что с ростом Т максимальное зна- чение этой функции (т.е. в точке оптимума) все более значительно превосходит ее значения в точках с другими неоптимальными значениями ее параметров. 4 Эконометрика 97
plim(a^=cr/, имеют асимптотически нормальное распределение и асимптотически эффективны, а где - символ асимптотического приближения, в данном случае закона распределения вектора-столбца оценок к закону нормального распреде- ления с параметрами — их математическими ожиданиями {ссОеУ и кова- риационной матрицей Г^{оцо})\ обратной так называемой информаци- онной матрице этих параметров. Заметим, что состоятельность оценок ММП следует из совпадения с оценками МНК, которые, как было показано в разделе 2.1.2, являются со- стоятельными. Асимптотические свойства оценок ММП также определя- ются стремлением к нулю их дисперсий с ростом числа измерений, что следует из свойств элементов матрицы Г^{(х,с^\ Напомним, что /(z) — информационная матрица случайного вектора z, — определяется следующим образом: /(z)= -М\д^11Ъ Z Э z1, (2.120) где матрица d^lldzdz имеет следующий вид: d^llbidz^ dzl dzxbzk dzibzk ЪН ЬН Эг^Эг! bzkZ2 bz} (2.121) ■к ) И В нашем случае k-nVl и z\=a^..., Zk- i=On, Zk =<Уе • Выполнив двойное дифференцирование выражения (2.116) по вектору «и Се, получим ^11дод<Те^Хе1сТе\ -М[Э^Эаесг/]=0. Последнее равенство выполняется в силу предполагаемой независи- мости значений факторов хц (столбцов матрицы X) и ошибки е, являю- щейся «белым шумом». 98
Э'//(Э(т/)'=772а/-£^^/(т/;-М[Э'//(Эст/)^]=Шо'/, поскольку М[ёё[=Т- ст/. Таким образом, информационная матрица вектора {а, (Те У определя- ется следующим выражением: „г 1 (Х'Х) О \ 2а: (2.122) £ J а ковариационная матрица этого вектора имеет следующий вид: /-1 ( а^ _2 а\(Х'ку^ О о ^ т J (2.123) где <Tg (Х'Х) — представляет собой ковариационную матрицу вектора оценок параметров ос а lai • дисперсию дисперсии модели (Те , Из выражения (2.123) вытекает, что ковариационная матрица вектора оценок параметров линейной эконометрической модели (1.2) имеет сле- дующий вид: Cov(a)=fT/.(А'А0~^=Д,=С7/ (Г'Х)-\ (2.124) В выражении (2.124) учтено, что на практике оценка дисперсии ис- тинной ошибки <j/ может быть заменена ее оценкой (т/, определенной согласно выражению (2.119) с использованием «фактических» значений ошибки et. Из выражения (2.124) непосредственно следует, что дисперсии оценок параметров линейных эконометрических моделей <^^, c^i^, ..., c^„^, оп- ределенных по ММП, являются диагональными элементами матрицы ае^-(ХХу\ Напомним, что среднеквадратические ошибки этих парамет- ров {(Tah используются при определении значимости факторов модели (см. выражение (1.25)). Таким образом, из результатов раздела 2.5 вытекает, что при предположении о нормальном законе распределения ошибки эко- нометрической модели и ее свойствах, определенных выражения- ми (2.20)-(2.24), оценки ее коэффициентов, полученные с исполь- зованием методов максимального правдоподобия и наименьших квадратов, совпадают. Аналогичное совпадение отмечается и у кова- риационных матриц этих оценок. Несложно показать, что в этих усло- 4* 99
ВИЯХ у МНК и ММП совпадают также оценки параметров эконометри- ческих моделей, полученные при ограничениях на их значения (см. выражение (2.91)). Если же ошибки модели распределены по другому закону (напри- мер, Коши с тяжелыми хвостами, Стьюдента и т.п.), то вообще гово- ря, выражения для оценки коэффициентов, полученные на основе ММП, будут отличаться от их аналогов, полученных с использовани- ем МНК. ВОПРОСЫ к ГЛАВЕ II 1. Каковы предпосылки «классического» метода наименьших квадра- тов (МНК)? 2. В чем суть МНК? 3. Приведите формулы расчета оценок коэффициентов линейной мо- дели по МНК? 4. Какими свойствами обладают МНК-оценки классической линейной эконометрической модели? 5. Перечислите свойства фактической ошибки эконометрической модели. 6. Каким образом тестируется условие постоянства дисперсии ошибки модели? 7. Каким образом проверяется наличие автокорреляции ошибок модели? 8. Как оценивается дисперсия истинной ошибки модели? 9. Каковы последствия мультиколинераности факторов? 10. Как проверяется обратимость матрицы А'Х? 11. Каковы последствия неправильного выбора состава независимых переменных модели? 12. Каковы особенности оценивания параметров с учетом наложенных ограничений? 13. Перечислите предпосылки метода максимального правдоподобия (ММП). 14. Опишите процедуру получения оценок параметров эконометриче- ской модели с помощью ММП. 15. Какими свойствами обладают ММП-оценки параметров? 16. Каким образом оценивается дисперсия истинной ошибки модели? УПРАЖНЕНИЯ К ГЛАВЕ II Задание 2.1 Для 13 клиентов спортивного отдела магазина зафиксирована сумма покупки Xt (в у. е.) и время разговора с продавцом yt (в мин.). Данные представлены в табл. 2.1. 1(Ю
Таблица 2.1 Г ь 40 14 50 14 60 17 80 19 100 17 ПО 20 120 24 130 22 150 25 160 24 180 18 200 20 310 1 26 1 Требуется: 1. Оценить с помощью МНК параметры линейного регрессионного уравнения, предположив, что переменная «длительность разговора с про- давцом» объясняется переменной «величина покупки». 2. Оценить с помощью МНК параметры линейного регрессионного уравнения, предположив, что переменная «величина покупки» объясняет- ся переменной «длительность разговора с продавцом». 3. Нарисовать диаграмму рассеяния величин (xt, yt) и обе линии регрес- сии. Объяснить, почему, если поменять экзогенную и эндогенную пере- менные местами, как правило, получаются различные уравнения регрессии. Задание 2.2 Имеется классическое линейное однофакторное уравнение регрессии, параметры которого оценены обычным МНК, л y = aQ+aiX, Требуется: 1. Доказать, что сумма остатков равна нулю: т г=1 л 2. Доказать, что У = у, среднее значение наблюдаемой зависимой пе- ременной равно среднему значению ее оценок, рассчитанных по уравне- нию регрессии. 3. Доказать, что 4. Доказать, что 5. Доказать, что /=1 Т л г=1 2 _ 2 , /2 101
6. Показать, что ^ [•^ix,-xXy,-y)f т.е. коэффициент детерминации равен квадрату коэффициента корреля- ции между переменными дс/ nyt. 7. Показать, что г 8. Показать, что Задание 2.3 Имеется линейное однородное однофакторное уравнение регрессии yt=axt-¥€f (/=1,..., 7). Требуется: 1. Вывести формулу МНК для расчета определения оценки а регрес- сионного параметра а. 2. Покажите, что оценка а, полученная МНК, является несмещенной оценкой параметра сх. 3. Определите дисперсию оценки а. Задание 2.4 Исследуется зависимость затрат на рекламу у от годового оборота jc в некоторой отрасли. Для этого собрана информация по 7=20 случайно выбранным предприятиям этой отрасли о годовом обороте Х/ и соответ- ствующих расходах на рекламу у/ (в млн. руб.). Из выборки получены следующие данные: jc = 17,3 ; у = 1,2 ; ^Д^У/ = 944,3; ^xf = 9250; ^у^ = 127,2. Предполагается, что зависимость у, от дс, описывается сле- дующим уравнением: у/ =0Ь'^а\ Xf¥€t (/=1,..., 20). Требуется: 1. Оценить параметры оь и OTi с помощью МНК. 2. Оценить дисперсию <j/ «истинной» ошибки £^. 3. Оценить дисперсии оценок оо и ai и их ковариацию. Задание 2.5 Для данных задания 2.3 устшювлено, что «истинная» ошибка распре- делена нормально. 102
Требуется: 1. Определить 95%-е доверительные интервалы для параметров рег- рессии схо и а\. 2. Проверить, можно ли утверждать, что с вероятностью 95% Оое Ко лахе К и где Kqh Ki — доверительные интервалы соответственно пара- метров Оои а\, построенные в п. 1. 3. Определить 95%-й доверительный интервал для дисперсии «истин- ной» ошибки Sf. Задание 2.6 Для анализа зависимости целевой переменной у от объясняющей переменной х получена выборка, состоящая из Г=50 наблюдений, и определены следующие показатели: л = 50,68; у = 100,44; 2] Jc^}'^ =290463; ^ уf'=539411. В основу исследования положена классическая линейная однофакторная модель нормальной регрессии yt =аь+ ai xt +et (r=l,..., 50). Требуется проверить следующие гипотезы: 1. Hq^\ ах >а\о =1 при уровне значимости б1?=0,05. 2. Яо^: Оо <аьо =50 при уровне значимости б1?=0,05. 3. Hq: g^>g^ =25 при уровне значимости б1?=0,05. Задание 2.8 Имеется нелинейное однофакторное уравнение регрессии а Требуется: 1. С помощью МНК оценить параметр регрессии а. 2. Рассмотреть линейное однофакторное уравнение >^г=^^/+^/» где y'r^Xlyt и а^-Иос, и установить, какое соотношение существует между случайными ошибками 61 и ^/. 3. С помощью МНК рассчитать оценку а ^ параметра регрессии а^ и сравнить ее с оценкой из п. 1. 4. На основе трех пар наблюдений (jc^ yt) — (4; 2,5); (2; 5); (10; 1;25) — показать, что оценки из пп. 1 и 3 в общем случае не совпадают. Задание 2.9 Имеется выборка, состоящая из Г=6 пар наблюдений (д:„ yt): (2,0; 0,0); (2,5; 0,5); (3,0; 1,0); (4,0; 1,0); (4,5; 0,5) и (5,0; 0,0), которая характеризует особый случай представления данных. Требуется: 1. Нарисовать диаграмму рассеяния и выяснить, о каком особом слу- чае идет речь. 103
2. Построить регрессионное уравнение для этого случая и прокоммен- тировать его. 3. Рассчитать коэффициент детерминации и проинтерпретировать его. 4. Определить, что изменится, если принять, что первые три и послед- ние три пары значений относятся к разным генеральным совокупностям. Задание 2.10 Рассмотрим линейную однофакторную регрессионную модель, в ко- торой экзогенные переменные принимают только два значения О и 1, т.е. являются индикаторами. Требуется: 1. Определить общий вид уравнения регрессии. 2. Для 30-летних коммерсантов с высшим образованием объяснить уро- вень месячного дохода с помощью переменной «пол», если для 6 случайно выбранных женщин месячные доходы составляют 3750, 3910, 4230, 3890, 4090, 4130, а для 6 случайно выбранных мужчин — 4850, 3950, 4210, 5580, 5170 и 4740. Построить соответствующее уравнение регрессии. Задание 2.11 Имеется линейная классическая нормальная модель множественной регрессии Требуется: 1. Рассмотреть функцию плотности распределения вектора «истин- ной» ошибки г и показать, что из того, что вектор f имеет нормальное Г- мерное распределение, следует, что отдельные ошибки £t (^= 1,2,...,7) яв- ляются независимыми друг от друга и нормально распределенными с па- раметрами М[£^=0 и £>[£^]=<j/. 2. Определить, как распределен вектор эндогенных переменных у, и какова функция плотности распределения этой переменной. 3. Показать, что вектор оценок а, полученный обычным МНК, являет- ся оценкой максимального правдоподобия для ос 4. Определить, как распределен вектор оценок а, и какова функция плотности распределения этого случайного вектора. Задание 2.12 Имеется классическая линейная модель множественной регрессии, за- писанная в отклонениях у* = аххи + ... + oCnKnt + ^* (^ = 1...., 7), т т где у* = Уг-У; 4 =%-^/ О' = ь •••' f^y^ y = ^yt' ^- =Z-^/>' ^*~ ^'^^' хастическая ошибка. 104
Требуется: 1. Показать, что форма этой модели эквивалентна форме классиче- ской линейной модели множественной регрессии 2. Определить вектор оценок параметров а =(ai ,..., д„ У. 3. Построить ковариационную матрицу вектора оценок а . Задание 2.13 Имеется классическая линейная модель множественной peq)eccHH, за- писанная в отклонениях У* = ССхХи + ... + OnXrit + ^* (^ = 1, ..., Т). Требуется: 1. Показать, что для значений Що) =( а\,..., а„ У выполняется следующее соотношение: a(o)=(A"j^)-'A*'-/. 2. Показать, что значение может быть определено по следующей формуле: «о=У-«(0)*^ где ^ = (Ji,...,^„). Задание 2.14 Экзогенные переменные линейного уравнения множественной регрес- сии претерпевают следующие преобразования: , х^ — ,...Ял "" » где ci/€/?, C2i ^Ю, /=1,..., п. Требуется: 1. Показать, что МНК-оценки параметров регрессии аф{=(а\^,.„, а/У после таких преобразований определяются по следующим формулам: аф{ = С • а(0), ^21 ••• ^ где С = О ... С2п, 2. Показать, как изменятся МНК-оценки fl(0)=(<3i,..., а„)', если от исход- ных экзогенных переменных перейти к стандартизованным переменным. 3. Показать, что для ковариационной матрицы вектора оценок Що^ вы- полняется следующее соотношение: 105
Cov(a(0)0 = C^ • Cov(a(0)). 4. Показать, что в результате такого линейного преобразования не ме- няется оценка дисперсии ошибки. Задание 2.15 Изменение спроса на некоторое благо (у) у домашних хозяйств опре- деленной структуры можно объяснить с помощью цены этого блага (х\) и дохода домохозяйства (х2). Соответствующая информация представлена в табл. 2.2. Таблица 2.2 к 31,4 4,1 1050 30,4 4,2 1010 32,1 4,0 1070 31,0 4,6 1060 30,5 4,0 1000 29,8 5,0 1040 31,1 3,9 1030 31,7 4,4 1080 30,7 4,5 1050 29,7 1 4,8 1020 1 Требуется: 1. Оценить с помощью МНК параметры линейного двухфакторного уравнения У/ = йь+ aiXu+a2X2-^ St и интерпретировать оценки. 2. Оценить дисперсию ошибки а/. 3. Рассчитать оценку математического ожидания упри jci=5,5 и JC2=980. Задание 2.16 Изменение спроса на некоторое благо (у) у домашних хозяйств опре- деленной структуры можно объяснить с помощью цены этого блага (х\) и дохода домохозяйства (хг). Соответствующая информация представлена в табл. 2.2. (см. задачу 2.15). Требуется: 1. Построить однофакторные уравнения спроса д^ от цены (jcO и от до- хода (хг). Оценить с помощью МНК параметры этих уравнений. 2. Сравнить оценки параметров из п. 1 с соответствующими оценками из задачи 2.15 п. I. Кроме того, определить с помощью каждого из уравнений регрессии прогнозные значения математического ожидания целевой пере- менной у при ^1=5,5 и дс2=980. Сравнить эти значения с прогнозным значе- нием из решения задачи 2.15 п.З. Какое прогнозное значение предпочесть? Задание 2.17 На основании данных из задания 2.15 построено двухфакторное урав- нение регрессии. Установлено, что ошибки St этого уравнения имеют нормальное распределение. 106
Требуется: 1. Определить одномерные 95%-е доверительные интервалы для пара- метров регрессии аь, 0С\ и Oi, 2. Определить 95%-й доверительный интервал дисперсии ошибки а]. Задание 2.18 На основании данных из задания 2.15 построено двухфакторное урав- нение регрессии. Установлено, что ошибки St этого уравнения имеют нормальное распределение. Требуется: 1. Для уровня значимости а=0,01 проверить гипотезы //00:^=^=12,0; Яю: ai=aio=-l,5;H2o: С1Г2=йГ2о=0,01. 2. Для уровня значимости а=0,01 проверить гипотезу Яо:с7/=оь^=0,01. Задание 2.19 На основании данных из задания 2.15 с помощью МНК построено двухфакторное уравнение регрессии. Установлено, что ошибки £j этого уравнения имеют нормальное распределение. Ранее было проведено исследование, которое дало для параметров регрессии следующие оценки: аьо=13,311; aio=-l,4896 и С1Г2о=0,022998. Требуется при уровне значимости а=0,025 проверить гипотезу, что структура модели не изменилась. Задание 2.20 Для линейного уравнения множественной регрессии определен коэф- фициент детерминации D. Требуется: 1. Показать, что для D выполняется следующее: * * * у У 2. Показать, что для D также выполняется соотношение п D = _/=1 i<k Т 1=1 107
где m^4 = Y^i^i, --^/X-^it, -x^),l<i,k< n. Задание 2.21 Для линейного уравнения множественной регрессии определен коэф- фициент детерминации D, Требуется: 1. Показать, что D равен квадрату коэффициента корреляции пары значений {у,,%). 2. Показать, что D не меняется, если переменные j^ и JCi,..., Хп претерпе- вают линейные преобразования. Задание 2.22 Для уравнения линейной множественной регрессии определены кор- реляционный вектор г, корреляционная матрица Q и коэффициент детер- минации D. Требуется: 1. Показать, что г=а:у:у^^-'Гу\ где S = (ъ^Т о \1/2 2. Показать, что 3. Показать, что D = r'Q-r' Задание 2.23 В табл. 2.3 представлена информация о 7=10 значениях двух объяс- няющих переменных х\, Х2 и целевой функции у. Таблица 2.3 к/ ^2/ Ш 10,3 2,5 24,8 18,5 8,6 48,3 16,3 3,7 37,0 22,5 6,5 51,8 10,5 7,8 29,1 16,8 9,1 43,0 14,0 1,9 30,1 19,1 2,7 41,0 13,0 3,0 29,1 18,0 1 5,2 40,1 1 108
Требуется: 1. Оценить с помощью МНК параметры линейного двухфакторного уравнения регрессии 2. Рассчитать значение коэффициента детерминации D и интерпрети- ровать его. 3. Определить корреляционный вектор г и корреляционную матрицу Q. 4. Проверить для этого примера равенство D-r 'Q'^r. л 5. Определить скорректированный коэффициент детерминации R^ и сравнить его со значением обычного коэффициента детерминации D. Задание 2.24 В табл. 2.4 представлена информация о Г=10 парах наблюдений объ- ясняющей переменной х и целевой переменной з^. Таблица 2.4 г к 15,8 18,3 8,4 10,1 14,5 16,9 8,6 11,4 11,8 14,9 19,5 19,9 21,4 22,8 4,7 7,8 9,8 10,3 Ш 1 166 1 Требуется: 1. С помощью МНК оценить параметры линейного однофакторного уравнения регрессии yt=cxQ+aiXf^et (/=1,..., 7). 2. Проверить при уровне значимости а?=0,025 гипотезу, что ао=2а\, 3. Определить оценки параметров уравнения с учетом априорной ин- формации, что ао=2а\. 4. Построить точечные прогнозы целевой переменной при л:=30,0 по уравнениям, оцененным без учета и с учетом априорной информации. Задание 2.25 Имеется априорная информация о гомогенности линейного однофак- торного уравнения регрессии: у, =ab+ciriXj+^,(/=l,..., 7) т.е. ао=0. Требуется: 1. Оценить параметры уравнения с учетом априорной информации и сравнить полученные оценки с решением задачи 2.3 п.1. 2. Определить ковариационную матрицу вектора оценок параметров. 109
ГЛАВА III Методы оценки коэффициентов эконометрических моделей с нестандартными ошибками в данной главе рассматриваются основные подходы к оценке ко- эффициентов эконометрических моделей, свойства которых отличают- ся от «стандартов», определенных в главе II условиями (2.21)-(2.23). Иными словами, у «нестандартной» ошибки ее ковариационная мат- рица может быть отлична от диагональной матрицы Соу(е)ФС7/-Еу что является следствием существования корреляционных взаимосвязей между ее разновременными значениями на интервале (1,7), дисперсия ошибки может не обладать свойством постоянства, tJfVconst (гетеро- скедастичность ошибки) или ошибка £ может быть связана с одной или несколькими независимыми переменными эконометрической мо- дели JC,. Первый случай (наличия автокорреляционных взаимосвязей в ряду ошибки £^, /=1,2,..., Т) формально может быть выражен следующим усло- вием: Cov(£)=i2= сг/ 2; £аЕ, где Д— ковариационная матрица ошибок модели; i7- (3.1) матрица коэффи- циентов автокорреляции модели, отличная от единичной; (T/=const. В общем случае матрица 27 может быть представлена в следующем виде: Х = 1 А Р2 А 1 А Р2 А 1 •• А--1 • Рт-2 ■■ Рт-г Рт-\ Рт-2 Рт-Ъ 1 (3.2) где, напомним, р^^ — коэффициент автокорреляции рядов ошибки St и St-k^ к'ТО порядка, значение которого рассчитывается для А:=1,2,... по формуле: ПО
г 2-r ^t^t-k Pk - — (3.3) Z 4. /=t+l Bo втором случае ковариационная матрица ошибки имеет следующий вид: Cov(e) = i2 = <^1 О \ <^г = сг: fl/^i о О l/ylj ^г; о о (3.4) где формально G\^Gi Ф,„ФОт, т.е. дисперсия ошибки не постоянна, а сг/ — постоянный множитель, Л, — переменные коэффициенты, г=1,2,..., Г. Выражение (3.4) характеризует свойство ошибки, известное в экономет- рике как гетероскедастичность остатков. Иными словами, ряд ошибки ха- рактеризуется нестационарностью второго порядка, т.е. непостоянством второго центрального, а значит, и начального моментов на интервале (1,7), в то время как первый момент — математическое ожидание ошибки — принимает на этом интервале постоянное значение, равное нухио. В эконометрических исследованиях теоретически возможна ситуация, когда оба рассмотренных случая встречаются одновременно, т.е. когда в ряду ошибки имеются автокорреляционные зависимости и ее дисперсия непостоянна. Третий случай характеризуется нарушением условия (2.23), что озна- чает отличие от нуля ковариации хотя бы одной независимой переменной Xi и ошибки модели е или, что то же самое, отличие от нуля их парного коэффициента корреляции, cov(jc//, £^) Ф О, Рх^^е^^О- Нарушение условий (2.21) и (2,22) приводит к тому, что оценки ко- эффициентов эконометрических моделей, полученные на основе «класси- ческих» методов МНК и ММП, теряют некоторые свои «качества», Преоюде всего это относится к свойству эффективности оценок, полу- ченных при ограниченных объемах выборки. Нарушение условия (2.23), как это следует из выражения (2.10), при- водит к потере оценками коэффициентов модели свойства несмещенно- сти. Заметим, что если условия (2.21>-(2.23) не выполняются при Г-»<», то оценки коэффициентов не обладают свойствами асимптотической эф- фективности и несмещенности (состоятельности). 111
Такая ситуация, в свою очередь, заставляет эконометриков искать определенные подходы, приемы получения «качественных» оценок па- раметров эконометрических моделей и при свойствах их ошибок от- личных от тех, которые были определены стандартными условиями (2.21Н2.23). Данные подходы и приемы обычно базируются на так называемых обобщенных методах оценивания — обобщенном МНК (ОМНК) и обоб- щенном ММП (ОММП), на использовании при получении оценок пара- метров моделей так называемых «инструментальных переменных». Рас- смотрим особенности этих подходов подробнее. 3.1. ОБОБЩЕННЫЕ МЕТОДЫ ОЦЕНИВАНИЯ ПАРАМЕТРОВ ЭКОНОМЕТРИЧЕСКИХ МОДЕЛЕЙ 3.1.1. Обобщенный метод наименьших квадратов (ОМНК) Рассмотрим основные последствия нарушения условия (2.21) для оце- нок параметров эконометрической модели, полученных с использованием «классических» методов оценивания, например, МНК. Как было показано в разделе 2.1, применение обычного МНК для оп- ределения коэффициентов эконометрической модели при условии Q^Ge Е в ЭТОМ случае приводит к следующим результатам (см. вьфаже- ния(2.9)и(2.15)): • оценка вектора параметров модели является случайной величиной, которую можно представить в следующем виде: а^а^{ХХ)-'Х-е. (3.5) • ковариационная матрица этих оценок определяется следующим вы- ражением: Соу(а)ЦГJ^"^^'i2f(rj?0"^=o-/(rX)-^r2Х(ГХ)-^;^аЛГ:Ч0"^. (3.6) Из выражений (3.5) и (3.6), в частности, вытекает, что вектор а являет- ся несмещенной оценкой вектора истинных значений параметров эконо- метрических моделей дг и в случае конечных объемов выборки детерми- нированных исходных данных (Г — конечно) и асимптотически несме- щенной оценкой при стохастических исходных данных, поскольку в этих случаях при соблюдении условия М\£ I л:]=0 имеем М[а]=Мд[М[а I дс]]=а (см. выражение (2.36)). Однако из (3.6) также следует, что при конечных объемах выборки оценки, найденные с использованием обычного МНК, являются неэффек- тивными. При этом отметим, что неравенство (3.6) обусловлено не только 112
различиями матриц (Х'Х)-^Х'1Х(.Х'Х) и (Х'К)-\ но и тем обстоятельст- вом, что используемая на практике оценка дисперсии модели сг/ ' ' Т-п-\ может быть смещенной в силу существующих зависимостей в ряду ошибки (между разновременными значениями ошибки). Вместе с тем можно показать, что при Г—><» оценки обычного МНК и в этих условиях при выполнении некоторых предположений являются со- стоятельными и асимптотически эффективными. Для этого перепишем выражение (3.6) в следующем виде: Cov(a) = -^ Т 2 /^vv^'■^ (Ti (ХХ ^Х'Ж^ [^ -1 (3.7) Из (3.7), в частности, вытекает, что элементы матрицы Cov(a)—>0, и вектор а является состоятельной оценкой вектора а при Г-^оо, если в ( х'хЛ ( X 'тх \ этом случае матрицы , являются конечными и положи- \ Т ) \ Т ) тельно определенными. Можно показать, что эти предположения выполняются, если а) наименьший характеристический корень матрицы (Х'Л!) неограни- ченно возрастает при Г-^*», что влечет за собой выполнение условия: plim(rZ)-^=0; б) наибольший характеристический корень матрицы Пограничен по величине для всех Г. В частности, в случае гетероскедастичной ошибки последнее условие означает, что в выражении (3.4) элементы матрицы Z— 1Д — ограниче- ны сверху, т.е. параметры Х[ ограничены снизу. Для получения эффективных оценок параметров эконометрических моделей при нарушении условия (2.18), т.е. когда Соу(а)9ьсг/(Л^''ЛГ)~\ в общем случае может быть использован обобщенный метод наименьших квадратов, разработанный А. Эйткеном. Математическое обоснование ОМНК базируется на свойстве положи- тельно определенной^ ковариационной матрицы Д допускающей пред- ставление в виде произведения двух матриц: ^ Напомним, что положительно определенная матрица невырождена, имеет поло- жительный определитель и положительные главные миноры. Положительная опреде- ленность матрицы Q вьп'екает из ее симметричности. 113
Л=ягя< (3.8) где матрица тс— невырожденная. Из (3.8) непосредственно вытекает, что 1 к^ШтсТ^^Е, (3.9) и Для доказательства равенства (3.9) достаточно левую и правую часть выражения (3.8) умножить слева на л^ и справа на (Л^)~^ Равенство (3.10) непосредственно вытекает из свойств обращения произведения матриц. Предположим, что матрица я* известна. Умножим матрично-векторное уравнение исходной эконометрической модели д^АГдя-^ слева на матрицу П^ и получим j;*=Xwi+£^, (3.11) где у*^п^у\ Х^п^Х\ е^^п^е. (3.12) Покажем, что ковариационная матрица вектора е* равна Е, Для этого запишем: Cov(^)=M^, е:\^Щк^е^е:л^'\^п^ап^'^Е. (3.13) Из (3.13) непосредственно вытекает, что (Т^ =1. Применяя к модели (3.11) обычный метод наименьших квадратов, по- лучим вектор оценки а из следующего выражения: aMx:x.T^x:y.MXiJ^^X)-^x:a^y. (з.м) Несложно показать, что оценки коэффициентов а, полученные на ос- новании выражения (3.14), обладают свойствами несмещенности при ко- нечном Г в случае детерминированных, а также и состоятельностью и асимптотической несмещенностью при Г—><» — в случае стохастических исходных данных. Доказательство этих свойств при условии независимо- сти значений столбцов матрицы X и £ в первом случае и асимптотиче- ских свойствах этих переменных (см. выражение (2.38)) — во втором приведены в разделе 2.1. В частности, вектор а является несмещенной оценкой ОМНК вектора (Ху если M[£v IX»] = 0. С учетом (3.12) это условие эквивалентно выраже- нию Щк^е\ л^Х*\ = О, которое выполняется при конечной матрице тс^ и исходном предположении МНК М[€^ IX*] = О о независимости факторов и ошибки эконометрической модели. 114
ства имеют место, если матрица plim Ковариационная матрица оценок параметров, полученных на основа- нии (3.14), определяется следующим выражением: \ Соу(а)=(Х/Х.Т^=(ХП-%-^=ае\хТ%-\ (3.15) Последний результат получен, принимая во внимание свойство ошибЬси е* (3.13) и представления матрицы 12в виде ст/-27(постоянный множитель CTf выносится за скобки). С учетом этого очевидного ре- зультата выражение (3.14) может быть также представлено в следую- щем виде: a=(Xi;%-^xi:y (3.16) Аналогично, как и в разделе 2.1 (см. выражения (2.39)-(2.41)), доказы- ваются свойства асимптотической несмещенности и состоятельности оценок ОМНК. В частности, из вьфажения (3.15) вытекает, что эти свой- является ограниченной положительно определенной матрицей. В этом случае из (3.15) следует, что В заключение данного раздела заметим, что матрица Д определенная выражением (3.4) для гетероскедастичной ошибки эконометрической мо- дели, также является положительно определенной, следовательно, допус- кает представление (3.8). Из этого факта вытекает, что выражения (3.14) и (3.16) могут быть использованы для оценки коэффициентов этой модели и при гетероскедастичных ошибках с учетом замены ковариационной матрицы этих ошибок вида (3.1) на (3.4). Аналогичным образом и кова- риационная матрица оценок параметров модели при ковариационной матрице ее ошибок, определенной выражением (3.4), находится из выра- жения (3.15). ЗЛ.2. Обобщенный метод максимального правдоподобия В обобщенном ММП предполагается, что ошибка модели подчиняется нормальному закону распределения с ковариационной матрицей Д опре- деленной выражением либо (3.1), либо (3.4), т.е. (p(e)-N(P, £2^, В этом случае плотность нормального закона распределения значений ошибки £^, г=1,2,... Т\ можно представить в следующем виде: т -Ml (IK€)^{2k) 2|д| ''^ехр -\\щ'^ (3.17) 115
Используя матрицу i^ выражение (3.17) можно записать и так т 1-1/2 (р{е) = (1п) 2(c7iC72...(T7^)|2'^| ехр И)--'' , (?.18) где в зависимости от предполагаемых свойств ошибки матрица 2^ опре- делена либо выражением (3.1), либо (3.4). При этом и в том и в д1^угом случае предполагается, что Oi =^^=...=^7-. Заметим, что при независимых ошибках е^ ^2»-.., Вт т (р{е)^{1к) -тп^-тп ехр 2<7f /=1 что совпадает с функцией максимального правдоподобия, определенной выражением (2.109). Логарифм выражения (3.18), являющийся логарифмом функции прав- доподобия для взаимозависимых или гетероскедастичных ошибок ^i,..., Ет с учетом представления их вектора в виде б=у-Х-а, записывается сле- дующим образом: / = ~1п(2л:)-11п|Д|-1(у-Х.а)'Л^-Ч}^-Х.а) = = -|ь(2л:)-|1п(т|-^1п|Х^|-1(3^-Л:.а)'27Ч^--ДГ-ЛГ). (3.19) Дифференцируя выражение (3.19) по вектору параметров or и диспер- сии ошибки <т/ и приравнивая нулю частные производные, получим Ы/до1=—^-\--^{у-Х'а)'1:ё^ {у-ХаГ1ёЛу-Ха)^0. (3.20) 2ст| 2а^ Из выражения (3.20) непосредственно получим выражения для оценок параметров модели и ее дисперсии в следующем виде: a^{X'Ze~'yr'x:is'''y\ а1^^{у-Х'аУ£ё\у-^'(х) (3.21) Заметим, что с учетом равенства Q^cfle первое выражение из (3.21) можно записать в следующем виде: a^QC-ae'^ytXa^^^y, (3.22) Из сопоставления выражений (3.16) и (3.21), (3.14) и (3.22) непо- средственно вытекает, что при «нормально» распределенных ошибках 116
эконометрической модели при утрате их свойств независимости и го- москедастичности обобщенные МНК и ММП определяют оценки ко- эффициентов этой модели по одним и тем же выражениям. При этом, как и в разделе 2.5, можно показать, что оценки ОММП обладают свойствами асимптотической несмещенности, состоятельности и эф- фективности. Основные проблемы, связанные с применением обобщенного МНК для оценки коэффициентов эконометрической модели, состоят в том, что априорно матрицы 12 и Хявляются неизвестными, поскольку определить численные значения их элементов можно только после того, как получе- ны оценки коэффициентов модели оо» ^ь- «п- Разрешить это противоре- чие можно на основе ряда подходов, которые будут рассмотрены в после- дующих параграфах данной главы. 3.2. ПРИМЕНЕНИЕ ОБОБЩЕННЫХ МЕТОДОВ ОЦЕНИВАНИЯ ПАРАМЕТРОВ ЭКОНОМЕТРИЧЕСКИХ МОДЕЛЕЙ НА ПРАКТИКЕ 3.2.1. Эконометрические модели с коррелирующими ошибками Причины появления корреляционной зависимости меж:ду разновре- менными значениями ошибки эконометрической модели, вызывающие отличие вида их ковариационной матрицы от диагональной, могут быть разными. Часто невыполнение условия Cov(e)'=(j£ Е связывается с не очень удачным выбором функционала модели Да; х). Поясним сказанное на примере, представленном на рис. 3.1. Фактические данные, отражающие зависимость переменной у как линейной функции от переменной х на интервале (1, Хг), помечены «°». На интервале (1, Xi) эти данные отражает линейная зависимость y=ao^-\-ai^x, а на интервале (Хи Хг) — зависимость у-ао'л-а\ х, где а^Фа^, При этом ошибки на «своих» интервалах для данных моделей равны нулю. На обобщенном интервале (1, Хг) совокупность исходных данных аппроксимируются моделью у-а^л-а\ х с ошибкой на интервале (1, A^i) равной £^ и на интервале (Х\, Jf^) — ^- При этом, если интервалы равны, то ^=-£^. Несложно показать, что значения ошибки et на интер- вале (1, X-i) связаны зависимостью £{='Гех-\, где г -^1 с увеличением дли- ны интервала (1, ^^2). 117
о 1 у= а^ + ахх у= До + <^\х ^у=а^ л-ахх Хп Рис. 3.1. Иллюстрация причины возникновения корреляции между ошибками эконометрической модели Причиной появления ошибки явилось не вполне обоснованное пред- положение о том, что данные на интервалах (1, А^О и (А^ь X-i^ описываются одной и той же моделью. Аналогично автокорреляция в ряду ошибки может возникнуть, если для описания характера взаимодействия меэюду переменными у и х вме- сто квадратической зависимости использовать линейную (рис. 2.1). В этом случае расчетные значения функции у=а^-\-а\х на интервале (1, Х\) будут превышать фактические уровни переменной у, а на интервале {Хи Xi), наоборот, будет иметь место обратная ситуация, когда фактические значения зависимой переменой будут превосходить ее расчетные значе- ния. На практическом примере несложно убедиться, что коэффициент ав- токорреляции первого порядка для ошибки линейной модели в этом слу- чае также будет значимым, т.е. ее ковариационная матрица — отличной от диагональной. Часто появление зависимости меэюду ошибками вызывается невклю- чением в модель какой-либо объясняющей переменной^ особенно если ее последовательные значения были зависимы меэк:ду собой, В такой си- туации ошибка частично вберет в себя информацию — необъясненную изменчивость, обусловленную невключением в состав модели объясняю- 118
щей переменной, в том числе и свойство зависимости последовательных ее значений. Однако, как это было отмечено в разделе 3.1, даже если какие-либо подозрения относительно наличия автокорреляции между ошибками су- ществуют априорно, то вид ковариационной матрицы ошибки и количе- ственные характеристики ее элементов с более или менее приемлемой точностью априорно предсказать практически невозможно. Вследствие этого обобщенные МНК и ММП для оценки значений коэффициентов эконометрической модели в прямом виде не могут быть реализованы. В таком случае исследователи обычно применяют некоторые приемы, по- зволяющие получить более или менее удовлетворительную оценку кова- риационной матрицы ошибки, ее некоторое приближение, которое можно было бы использовать в обобщенных методах оценивания. Некоторые из таких приемов будут рассмотрены в данном разделе на примере МНК. Можно выделить два основных практических подхода к оценке недиа- гональной ковариационной матрицы ошибок эконометрической модели, отраэюающей существование корреляционной зависимости меэ/сду ее значениями. Первый из них не требует использования предварительной информации относительно характера взаимосвязей меэ/сду ее последо- вательными значениями Ей £t+]» i>t+2f' • Согласно этому подходу матрица Cov(e), рассматриваемая как оценка ковариационной матрицы истинной ошибки модели Cov(£), находится эмпирически путем последовательного приближения по результатам этапов расчетов по построению промежу- точных вариантов эконометрических моделей. Первый этап полностью соответствует процедуре построения эконо- метрической модели, рассмотренной в главах 1 и 2. Согласно ему, на ос- новании исходных данных — вектора у и матрицы X — формируется уравнение эконометрической модели, затем с помощью МНК оценивают- ся ее коэффициенты, определяется вектор фактической ошибки е, значе- ния которого проверяются, например, с помощью критерия Дарбина- Уотсона на наличие автокорреляции. В том случае если факт корреляции установлен, то на основе эмпириче- ского ряда ошибки Си ^г»-.., ^т оцениваются элементы ее ковариационной или корреляционной матрицы на основе следующих общих выражений: Т-к covC^»^,e^^i) = X ^/ • ^t-i-k '(Т-к-1); г, =£2^1^; (3.23) к = 12 119
На практике обычно бывает достаточно оценить два-три выборочных коэффициента корреляции, поскольку взаимосвязь между значениями ошибки с увеличением сдвига к резко ослабевает и значения коэффици- ентов Г4, Г5,... становятся практически неотличимыми от нуля. На втором этапе определенную таким образом либо ковариационную матрицу фактической ошибки Д, либо ее корреляционную матрицу i^ используют для оценки коэффициентов той же эконометрической модели с помощью обобщенного МНК (выражения (3.11), (3.13)). Далее вычис- ляется новый ряд фактической ошибки, происходит его проверка на на- личие автокорреляции и, в случае подтверждения этой гипотезы, опреде- ляются новые матрицы Ое или 2^. Затем с помощью обобщенного МНК строится третий вариант эконометрической модели и т.д. Процедура построения модели завершается, если критерий Дарбина- Уотсона не подтверждает наличие автокорреляции в ряду фактической ошибки очередного варианта эконометрической модели. На практике для получения варианта модели с некоррелированной ошибкой часто доста- точно провести одну итерацию. Вследствие этого такой подход получил название «двухшагового МНК». Подтверждением эффективности такого подхода является уменьшение дисперсий коэффициентов эконометрической модели каждого следующе- го варианта по сравнению с предьщущим, обычно наблюдаемое на прак- тике. Напомним, что значения этих дисперсий рассчитываются как диа- гональные элементы матриц, определяемых выражениями (2.18) и (3.15). Явление уменьшения дисперсий коэффициентов последовательных вариантов эконометрической модели может быть обнаружено на основе использования критерия Фишера для сумм элементов ковариационных матриц оценок коэффициентов модели двух последовательных ее вариан- тов. Дело в том, что сумма элементов матрицы Cov(a), рассчитываемой согласно выражениям (2.18) для МНК и (3.15) для обобщенного МНК, выражает дисперсию суммы оценок коэффициентов модели. В этом слу- чае, если выполняется условие ^>F*(r-n-l, Т-п-1 /7*), (3.24) где Sm^ — сумма элементов ковариационной матрицы оценок Cov(a) на т- м шаге расчетов; F*(T-n-l, Т- дг-1, р*) — табличное значение критерия Фишера для числа степеней свободы Vi=V2=T- п-1 и уровне доверитель- ной вероятности /?♦, то гипотезу о том, что дисперсия суммы оценок ко- эффициентов модели уменьшилась на т-м шаге расчетов по сравнению с т-1, следует считать подтвержденной. 120
Заметим, что на практике вместо суммы элементов ковариационной матрицы оценок коэффициентов модели при определении их эффектив- ности можно использовать фактическую дисперсию модели. Например, для МНК Соу{а)=(7^ {ХХУ^. Поскольку матрица XX постоянна, то отли- чия дисперсий коэффициентов полностью определяются значением а^. При сопоставлении дисперсий оценок коэффициентов, полученных с помощью обобщенного МНК, подобную замену теоретически нельзя ис- пользовать, поскольку в формировании их ковариационной матрицы принимает участие корреляционная матрица ошибок (Cov(a)=c7/<A^x х2"^Л)~^). Однако если допустить, что на т-ы шаге расчетов значения ко- эффициентов корреляции изменились не слишком значительно по срав- нению m-1-M шагом, то данной некорректностью можно пренебречь. Другая группа подходов к построению эконометрических моделей с эффективными оценками коэффициентов при невыполнении условия Со\(€)=<Т-Е основана на использовании априорной информации относи- тельно возможного вида ковариационной матрицы ошибок. Эта инфор- мация может вытекать из анализа закономерностей измерения перемен- ных модели, характера их взаимосвязей, формы самой модели и т.п. Достаточно часто, предвидя появление ошибки спецификации модели (например, исходя из некоторого несоответствия ее уравнения эмпириче- скому графику входящих в нее переменных), исследователи заранее предполагают, что значения ошибки связаны между собой автокорреля- ционной зависимостью первого порядка б^=А^м+^/, (3.25) где pi _ коэффициент автокорреляции ошибки St первого порядка; ^, — ошибка модели (3.25) с нулевым средним и конечной дисперсией (т/, ко- торая неизвестна. В отношении ошибки ^^ обычно предполагают выполнение следую- щих свойств на интервале (1,7): 0"/= const; Cov(^ = c7/^; (3.26) Несложно показать, что при выполнении условия (3.25) ковариационная матрица ошибки эконометрической модели будет иметь следующий вид: (3.27) Со\(£) = П = (Те I^cr^ ' 1 А кА А 1 рГ р1 . А рГ . .. рГ] р(-' ■■ 1 > 121
Чтобы показать справедливость выражения (3.27), последовательно определим ковариации ряда Et с рядами St-u £t-i и т.д. Для этого сначала умножим левую и правую части выражения (3.25) на 6^_i, полученный ре- зультат просуммируем по г и далее разделим на Т-2, В итоге с учетом не- зависимости переменных €t-\ и ^, получим — л '=2 Г-2 • = А- Г-2 7-2 .С0У(е,,£,_,)=у(7,СГ£ (3.28) Проведем аналогичную операцию, умножив левую и правую части выражения (3.25) на £,_2. Получим 2^2 cov(j^, е,-г)=Р1 cov(^, £,-i)=A <Уё (3.29) и т.д. cov(^, е,.к)=р[а, Таким образом, при выполнении условия (3.25) корреляционная мат- рица истинной ошибки эконометрической модели оказывается опреде- ленной следующим выражением: Е = 1 кРГ А 1 Pt А рГ rJ-^ \ 1 (3.30) в котором величина рь однако, остается неизвестной. Вместе с тем очевидно, что «хорошая» оценка г\ коэффициента корреляции р\ должна обеспечивать получение эффективных оценок коэффициентов эконометрической модели оо» ^ь-.. ^л- Если предполо- жить, что: а) как и ранее, эффективные оценки характеризуются ми- нимальным значением суммы элементов ковариационной матрицы Соу(д); б) эта сумма (дисперсия) является непрерывной выпуклой функцией по гь минимум которой соответствует «хорошей» оценке коэффициента ри то теоретически эту оценку, как и эффективные оценки ло» «ь--- ^л» можно определить с помощью несложной итера- тивной процедуры, в основе которой лежит обобщенный МНК. Ее суть состоит в следующем. Задается начальное значение п^ и на его основе (согласно выражению (3.27)) определяется Cov°(£). Далее с использо- ванием обобщенного МНК (выражение (3.16)) определяются оценки ^0°, fli^,... an и их ковариационная матрица Cov°(a) (выражение (3.15)). 122
На втором шаге определяется значение ri^=ri^+Ar, где Аг — выбран- ный прирост оценки коэффициента автокорреляции, а затем повторяется последовательность расчетов первого шага. Если г\ не являлось искомым оптимальным значением коэффициента автокорреляции, то при правильно выбранном знаке Аг сумма элементов Cov^(a) будет меньше соответствующей характеристики матрицы CovV). Однако изложенная процедура практически не применяется. Причины этого — неизвестный характер зависимости суммы элементов ковариаци- онной матрицы Cov(a) от значений п (эта характеристика вообще может быть не слишком чувствительна к изменениям п); неизбежные ошибки округления, которые приводят к смещению находимых оценок коэффи- циентов оо^у «1°,... а„°; большой объем вычислений по каждому этапу про- цедуры. Все это делает ее трудно реализуемой даже на современных ком- пьютерных системах. В эконометрике обычно для получения эффективных оценок коэффи- циентов модели с коррелирующими остатками в предполоэюении о спра- ведливости зависимости (3,25) используются несколько другие подходы, предполагающие необходимость преобразования уравнения самой моде- ли. Рассмотрим эти подходы более подробно. Представим эконометрическую модель с учетом условия (3.25) в виде следующей системы уравнений: yt=ao+aiXu+„^anXnt+£t; ^A^-1+^r. (3.31) Поскольку St.\=yt.\-(Xo-aiXij^i-.,-anXn,t-u то систему (3.31) можно вы- разить единым уравнением У/=Р1Ум+(1-А)^+^1 -^1/ - А^Л,м+...+^ Xnt - p\CXnXnj-i-^(^t • (3.32) Критерием при определении неизвестных параметров выражения (3.31) является минимум суммы квадратов <^f Обозначим произведения коэффициентов (l-/7i)ab, р\а\,..., piOn как ^, Д,... Д. Тогда вместо выражения (3.32) можно записать >^г = /?1Ум+Д)+^1 хи- fi\ xi,r- i+...+а;, Xnt- finXn^t-1+4 (3.33) где >б()=(1-А)^, Д =А^ь-.., Д. =А^ • (334) Из выражения (3.33) непосредственно вытекает: поскольку обычный МНК в общем случае не гарантирует выполнения условия (3.34), для оценки коэффициентов этой модели должен быть применен МНК, учиты- вающий эти нелинейные соотношения. Вместе с тем, МНК, учитываю- 123
щий ограничения на параметры, да еще нелинейного вида, достаточно трудоемок с вычислительной точки зрения. Вследствие этого на практике в таких ситуациях более широкое при- менение нашел так называемый двухшаговый метод наименьших квадра- тов, предложенный Дарбином (двухшаговый МНК Дарбина). Его суть со- стоит в следующем. На первом шаге, применяя обыкновенный МНК для оценки коэффициентов модели (3.33), определяют гх — оценку коэффи- циента при yt-i. Далее формируются новые зависимая и независимые пе- ременные Ur=yt -''iVr-b ^it=Xit-riXij^i, /=1,2,..., л; г=1,2,..., Г-1, зависимость между которыми выражается линейной эконометрической моделью сле- дующего вида: Мг=^?о+ aivu +..,-¥anVnf^Wt. (3.35) где коэффициенты Ьо» «ь...» ^п являются оценками соответствующих ко- эффициентов модели fii, аи,.., Оп, щ — фактическая ошибка модели. Эти оценки определяются с помощью обычного МНК на втором шаге расчетов. Метод Дарбина легко распространяется на ситуации, характеризую- щиеся наличием автокорреляционной зависимости между значениями ошибки более высокого порядка. Например, для автокорреляции второго порядка модель, связывающая текущие значения ошибки с двумя преды- дущими, представляется в следующем виде: ^Л^-1+;1^-2+^г, (3.36) где л п ji — коэффициенты модели автокорреляции, отражающие харак- тер зависимости текущего значения ошибки St от ее предшествующих значений £j.i и £j_2- Оценки этих коэффициентов ci и С2 определяются на основании значений выборочных коэффициентов автокорреляции гх и гг — первого и второго порядка соответственно. В этом случае по аналогии с вьфажением (3.32) можно записать yt =cyyt.i+C2yt- 2-^aiXu+.,^anXntHi'Ci-C2)^krCiaiXu-\-...- -c\anKn.t-\ - C2axXx,t-i -...-<:2ЛЛr-2+w^ (3.37) Применение двухшагового метода Дарбина к оценке коэффициентов модели (3.37) позволяет с помощью обыкновенного МНК на первом шаге определить оценки коэффициентов сх и С2 при переменных yt^x и yt-i этой модели. Далее, как и в предыдущем случае, формируются новые пере- менные UFyrC^yt-x-CTyt-i. yit=XirCiXu-\-^2Xi,t-2y ^=1,2,..., п; ^1,2,..., Г-1, и на втором шаге оценки коэффициентов исходной модели и oq, ai,... an нахо- дятся опять же с помощью обыкновенного МНК, как и коэффициенты модели (3.35). 124
Отметим, что автокорреляционная зависимость ошибок с порядком более двух практически не встречается. В большинстве слз^аев порядок автокорреляции равен единице. Заметим также, что корректность построенной модели в данном слу- чае может быть определена на основе критерия Дарбина-Уотсона, рас- считываемого для остатков модели (3.35). 3.2.2. Эконометрические модели с гетероскедастичными ошибками Причиной непостоянства дисперсии (гетероскедастичность ошибки) эконометрической модели часто является ее зависимость от масштаба рассматриваемых явлений, В эконометрическую модель ошибка входит как аддитивная переменная (слагаемое), В то сисе время часто она имеет относительный характер и определяется по отношению к измеренному уровню рассматриваемых факторов. Вследствие этого, если на интерва- ле (J, 7) переменная у увеличивается в 5 и более раз, то можно ожидать, что даже при правильно выбранной форме зависимости этой переменной от объясняющих факторов ошибка модели увеличится примерно во столько же раз. Гипотеза о гетероскедастичности ошибки модели обычно проверяется с использованием теста, рассмотренного в разделе 2.2.1. В случае ее под- тверждения для оценки коэффициентов эконометрической модели может быть применена процедура последовательных этапов расчетов, как и в случае автокорреляции между ошибками модели. Для этого на первом этапе по результатам применения обыкновенного МНК должны быть сформированы оценки oi^, с^^,..., а/ матрицы Cov(^) (выражение 3.4). Сделать это на основе значений фактической ошибки ей ^2, •.., ^т для ка- ждой точки /=1,2,..., Г невозможно, вследствие чего в данном случае при- ходится привлекать на помощь некоторые дополнительные гипотезы от- носительно характера изменения дисперсии ошибки, например, гипотезу о линейном законе ее изменения. При таком предположении оценки дисперсий <Ji^,..., (т/ могут быть определены следующим образом. Для двух непересекающихся интерва- лов (1, ГО и (Гг, Т) по значениям рядов фактической ошибки ви ..., ет^ и ет2, ..., ^г могут быть получены оценки дисперсий сТк и (Jm ^ которые со- относятся к моментам t=k и /=т, являющимися серединами этих рядов. Далее на основе этих двух значений строится линейная зависимость а (г), аппроксимирующая изменение дисперсии на интервале (1, 7), каждое из значений которой aj^ будет представлять собой оценку соответствующего элемента диагональной матрицы Л (выражение (3.4)). Эта матрица затем 125
должна использоваться на втором этапе вычислений оценок коэффициен- тов следующего варианта эконометрической модели с помощью обоб- щенного МНК. Справедливость выдвинутой гипотезы о гетероскедастичности ошиб- ки подтверждается (или отвергается) сопоставлением дисперсий сумм оценок коэффициентов модели, рассчитанных для оценок обычного и обобщенного МНК. Эти суммы определяются на основе элементов соот- ветствующих ковариационных матриц оценок, определенных согласно выражениям (2.27) и (3.15) соответственно. Подобная процедура может быть реализована для любых приемлемых (правдоподобных) вариантов закономерностей изменения дисперсий ошибок, например, для квадратичной, логарифмической и т.п. зависимо- стей. Необходимо отметить, что для каждого из этих вариантов интервал (1,7) должен быть разделен на такое число участков, которое обеспечи- вает определение количества оценок дисперсий на них, достаточного для построения соответствующей зависимости. Явление гетероскедастичности ошибки такэ/се моэюет быть вы- звано ошибками спецификации модели. Например, если линейная эконометрическая модель была выбрана вместо модели следующего вида: Zl = ^q +flj ilL+...+^ + ... + д^ ^^£^, (3.38) TO дисперсия ошибки линейной модели в момент t оказывается пропор- циональной квадрату переменной хи, т.е. где <j — некоторая неизвестная константа. Если равенство (3.39) справедливо, то очевидно, что ковариационная матрица ошибки Cov(f) определяется следующим выражением: ^х1 О О ^ Д = С7' ■^/1 х1 уО О ... 4у (3.40) Из сопоставления выражений (3.4) и (3.40) вытекает, что Л=Ш,Л (3.41) Тогда матрица к^, обеспечивающая равенство Jt^'7C^=Z~^ (см. выра- жение (3.9)), имеет следующий вид: 126
;г-^ = 0^ О хп ... О (3.42) О О ... х,т) Таким образом, с помощью операции умножения слева на матрицу тс^ п^у^п^Ха^пЫ (3.43) исходная линейная модель и преобразуется к виду (3.38). Из вьфажений (3.38)-(3.43) вытекает, что при справедливости условия (3.39) для описания процесса >^, можно использовать: а) либо эконометри- ческую модель линейного вида и оценку ее коэффициентов производить с помощью обобщенного МНК; б) либо эконометрическую модель, опре- деленную вьфажением (3.38), и оценки ее коэффициентов получать с по- мощью обыкновенного МНК. Как частный случай моделей (3.38) можно рассматривать так назы- ваемые взвешенные эконометрические модели, хотя причины появления «весовых параметров» в них обусловлены другими соображениями. Взвешивание исходных данных эконометрической модели (т.е. эле- ментов вектора J и матрицы X) часто осуществляется с целью дифферен- циации влияния информации, относящейся к разным периодам времени, на получаемые с помощью МНК значения ее коэффициентов. Очевидно, что при принятии решений в условиях быстро развиваю- щихся социально-экономических явлений информация более поздних временных периодов является более важной, существенной, чем инфор- мация ранних периодов. Этот факт целесообразно учитывать и в разра- ботках моделей развития таких явлений с целью более объективного ото- бражения изменений во взаимосвязях между рассматриваемыми в них переменными, происходящими со временем. В экономике такие измене- ния обусловлены, например, технологическими сдвигами, изменениями цен на ресурсы, покупательной способностью населения, потребитель- скими предпочтениями, внешними событиями (войнами, природными ка- таклизмами и т.п.), изменениями в законодательстве и рядом других объ- ективных и субъективных причин. Вместе с тем, зачастую даже по чисто вычислительным причинам без устаревшей информации порой бывает затруднительно построить эконо- метрическую модель (например, из-за недостатка объема исходных дан- ных). Кроме того, новые взаимосвязи обычно образуются на фоне старых. Они закономерный итог эволюции отношений в социально- экономической, технической и других сферах общественной жизни. Вследствие этого информация более ранних периодов также может пред- 127
ставлять определенную ценность с точки зрения адекватного отображе- ния рассматриваемых явлений и процессов. Эти причины в совокупности выдвигают проблему сопоставительного представления в эконометрической модели разновременной информации, которая обычно решается взвешиванием исходных данных, относящихся к различным моментам периода (1, 7). Весовые коэффициенты в таком случае выражают степень важности, ценности разновременной исходной информации, полноты ее учета при формировании модели. Взвешенная эконометрическая модель для момента времени /=1,2,..., Г выражена в виде следующего уравнения: ytPt= cxopt-¥a\ ptXx&.^^OnPtXn&^b (3.44) где pt — весовой коэффициент, учитывающий степень полноты исходной информации момента г, необходимой при построении эконометрической модели, описывающей рассматриваемые процессы в интервале (1, Г), ^, — ошибка модели. С учетом (3.44) сумма квадратов ошибки модели определяется сле- дующим выражением: т т т ^^ = Ъ^} = ZP}iyt -^0 -(^\x\t -•••-^/2-^nr)^ = Z^r^r^ » (3.45) t=\ t=\ t=\ где qf^p^ — весовой коэффициент, отражающий важность значения ошибки невзвешенной модели в момент t при определении ее коэффици- ентов; et=y(-(Xo-a\X\f-.,-oCnKnt — истинная ошибка невзвешенной модели. Применяя известную процедуру метода наименьших квадратов для оценки коэффициентов модели, записанной в матричной форме Qy^QXa^l (3.46) получим следующее выражение вектора оценок коэффициентов этой мо- дели: XlQy^XIQXa. a^irQXy'rQy. (3.47) где Q — диагональная матрица, образованная весовыми коэффициентами е= и 0 .0 0 q, . 0 . 0^ .. 0 •• 4tj (3.48) 128
Отождествляя матрицу Q с матрицей iT"^ (см. (3.4) и (3.40)), получим, что выражение (3.47) абсолютно идентично выражению (3.14), опреде- ляющему оценки коэффициентов эконометрической модели на основе обобщенного МНК. Из выражения (3.48) вытекает, что веса qt являются функцией време- ни, характеризующей «память» модели. Интуитивно понятно, что при бо- лее быстрых изменениях условий развития процессов yt, jc,r, /=1,2,..- , п, значения ^„ относящиеся к началу интервала (1,7), должны быть значи- тельно меньше, чем значения, относящиеся к его концу. Иными словами qt, как функция времени в этом случае должна затухать быстрее при дви- жении времени в прошлое. Выбор функции qt в практических исследованиях обычно осуществля- ется на основе субъективных суждений относительно ценности исходной информации, относящейся к разным моментам времени. Обычно значе- ния этой функции нормируют таким образом, чтобы в сумме они состав- ляли единицу, т.е. i^,=l. (3.49) «=1 В таком случае в качестве весовой функции удобно использовать чле- ны убывающей в прошлое геометрической прогрессии. Например, q. = qJ-'^\ (3.50) q,= 'l<l-yf-'. где константы qowy выбираются из условий 0<Цо, J<1 и нормировки (3.49). В заключение заметим, что использование таких «весов» в общем слу- чае ведет к потере свойства эффективности у оценок параметров модели. 3.3. МЕТОД ИНСТРУМЕНТАЛЬНЫХ ПЕРЕМЕННЫХ Для получения несмещенных (по крайней мере, состоятельных) оценок параметров эконометрических моделей в ситуациях, когда имеют место (теоретически допускаются) корреляционные взаимосвязи меэюду неза- висимыми переменными Xit и ошибкой £*„ теория рекомендует подходы и методы, основанные на использовании инструментальных переменных. Напомним, что в тех случаях, когда некоторые столбцы матрицы зна- чений независимых переменных X и вектор-столбец ошибки е взаимо- связаны между собой, математическое ожидание второго слагаемого в правой части выражения (2.9) отлично от нуля, М[(ХХ)~ Х'ё\^, и, сле- довательно, например, оценки МНК параметров модели, определяемые 5 Эконометрика 129
согласно известному выражению a^iX'X) ^Х-у, оказываются смещенны- ми, поскольку М[а-а]= М1(ГХ)-^ Хё^чЮ. (3.51) Заметим, что появление смещения у оценок МНК всех параметров мо- делей вызывает присутствие только одной независимой переменной, на- пример, JC|, связанной с ошибкой €, В этом случае непосредственно вид- но, что произведение Хе^ф,..., О, с/. О,...,О/, где константа т ci = ^xit Sj фО стоит на месте, соответствующем /-й переменной, и, та- t=\ КИМ образом, имеем (ХХ)~^'е= cc{sQi,Sxi,...,Snd' = ccSi, где Sji —у-й элемент /-Г0 столбца Si матрицы {ХХ)~^. Из полученного результата вытекает, что в соответствии с выражением (2.9) имеем а-т- crSi. Из чего следует, что смещенными оказываются все оценки коэффициентов модели. В эконометрике обычно исследуются асимптотические свойства оце- нок параметров моделей. В этом случае, если в пределе при Т-^оо сущест- вует зависимость между столбцами матрицы ЛГ и ошибкой модели е, т.е. plim(-A:'£Uo, (3.52) то оценки МНК параметров эконометрической модели являются несо- стоятельными (а следовательно, и асимптотически смещенными). Это непосредственно вытекает из того факта, что второе слагаемое в правой части выражения plim((a) = plim((a)+plim —Х'Х \ plim — X'f отлично от нуля, поскольку из начальных условий (предположений) ко. (2.42) вытекает, что plinJ —Х'Х Использование инструментальных переменных теоретически позво- ляет устранить отрицательные последствия взаимосвязей независимых переменных и ошибки модели е, проявляющиеся в несостоятельности оценок МНК параметров линейных эконометрических моделей. Формально, без излишней строгости, выражение для вектора оценок МНК параметров эконометрической модели с использованием инстру- ментальных переменных может быть получено следующим образом. Предположим, что существуют так называемые «инструментальные» переменные z/, число которых в общем случае совпадает с числом незави- симых факторов модели jt/, /=1,2,..., п\ и при /=1,2,..., Г, каждая из кото- 130
рых характеризуется нулевыми корреляционными взаимосвязями с ошибкой эконометрической модели е. При заданном Т матрица значений инструментальных переменных Z имеет такой же размер, как матрица X. Умножим слева векторно-матричное уравнение на матрицу j=A'-ан-£ на матрицу Z\ Получим Гу=ГХа¥Г а (3.53) С учетом того, что Af[Z'f]=0, умножая выражение (3.53) слева на {Z'Xy^, непосредственно имеем а,^{ГХ)-'Гу, (3.54) где а^ — вектор оценок параметров эконометрической модели, получен- ный с использованием инструментальных переменных. Результат (3.54) можно получить и традиционным путем. Для этого обозначим >^*=Z>'; АГ*=2'АГ; £*=2'г. В этом случае выражение (3.53) имеет традиционный для эконометрической модели вид: у^=Х*а¥е*, (3.55) Используя для модели (3.55) традиционный для МНК критерий мини- мума суммы квадратов ошибки 5*^=(e*',£^)=(^Z-Z'-£)=(Z> — ГХ а)\Гу — ГХ 6r)->min (3.56) и приравнивая вектор производных показателя s? по вектору параметров 2 а к нулю, = О, непосредственно получим следующее выражение для да вектора оценок этих параметров: а, ^{XZ ГХ)-^ XZTy. (3.57) Далее, принимая во внимание, что произведения матриц XZ и ZX равны между собой, т.е. XZ-ZX, выражение (3.57) несложно привести к виду (3.54). a^^{XZrX)-^XZZ''y^{XZr\XZr^XZZ''y^ ^iXZy^r-y^irxy^ry. Покажем также, что при наличии у матрица Z размерностью 7У(/2+1) в пределе при Г—><» следующих свойств: = 0; (3.58) = Zz:.; (3.59) = Zz^» (3.60) 131 plim|—Z'.f <Т J plim -Z' T plim|iz'
где матрицы Zza^ и Szz существуют и не вырождены, оценки пара- метров эконометрической модели, определенные выражением (3.54), яв- ляются состоятельными. Для этого, как и при выводе выражения (2.9), подставим вместо векто- ра j; в формулу (3,54) у=Х-о^€. Получим а,=а¥(ГХу^Га (3.61) В пределе при Т->оо имеем pWma^ =a+p\vJ^Z'x] plimf-Z fUa+S zV^ = ^- (З-^^) Обратим внимание на некоторые свойства оценок параметров, полу- ченных с использованием инструментальных переменных на основе вы- ражения (3.54). В частности, отметим, что в общем случае эти оценки являются неэф- фективными. В самом деле, вид ковариационной матрицы ошибки €*=Z'e модели (3.53) свидетельствует о наличии в ее ряду автокорреляционных зависимостей даже в том случае, когда эти зависимости отсутствовали у ошибки а Coy(e*)=Mle*\e^]=M[Z''e^Z)= а] {Z'Zy (3.63) В этом случае ковариационная матрица оценок а^ параметров модели (3.53) имеет следующий вид: Cov(a,)=M[(a, -d){a, -ot)']= M[{rX)-'reeZ{rX)-^]= ^G}{j:X)-^Z''Z{rX)-\ (3.64) где дисперсия ошибки Ge на практике может быть оценена на основании следующего выражения: ^^^^iy-X-a,)\y-X.a,-) ^3.65) Т -п-\ В пределе при Г-^оо с учетом предположений (3.59) и (3.60) можно определить асимптотическую ковариационную матрицу оценок а^ на ос- новании следующего выражения: asy.var(a^) = -рИт[Г(а^ -а){а^ -а)'] = -plim[r(ZC%:)-'Z £г'2(Л:2)-'] = Г 17 = -plim ^Z'X plim ^Ге eZ plim -Z2 T v-l T (3.66) " j,^£ 2^ Z'X 2шЛ 27. 2^ ZX • 132
Для получения эффективных оценок на базе инструментальных пе- ременных можно использовать обобщенные МНК. Для ковариационной матрицы ошибок модели, определенной вьфажением (3.63), оценки ко- эффициентов, полученные с использованием этого метода, определяют- ся на основании следующего выражения, вытекающего из формулы (3.57): a,MX:Z{rzr^rX)-^XZ{rzr'-y^(XP, ХУ^ХР.'у, (3.67) где Л = Z(Z'Z)-^ Несложно показать, что ковариационная матрица оценок обобщенного МНК для инструментальных переменных имеет следующий вид: Соу(а,.о)=стЛ^Л Х)-\ (3.68) где на практике дисперсия ошибки сг^ определяется следующим выраже- нием: ^2 = iy-X-a,,ny-X-a,,o) ^3.69) Т-п-\ Вектор оценок а^о, полученный на основании формулы (3.67) является асимптотически несмещенным. Это следует из выражения: где «^o=a+(^^^z^] [j^'^z^^ 1,„^ „. (\ „*,Yl„*,VVl ^ (3.70) ^{Х'Р,Х)^\-ХЧ — Z'Z\ l—Z'X т ) [т 1.„^ . (I „*,Yi„,^VVi j:iXT,e) = ]^-X2^ -Z'Z , Т J jZ'el Переходя в выражении (3.70) к пределу при Г—>«>, с учетом свойств (3.58)-(3.60) получим plima,.o=aH-(ZA:'zZ"^z'zIz';t)'^Zz';tI"^z'zO=a: (3.71) Однако заметим, что на практике обобщенный МНК для оценки пара- метров моделей с инструментальными переменными применяется не час- то. Это связано с тем, что дисперсии оценок их параметров, полученных на основе выражения (3.41), при удачном подборе инструментальных пе- ременных увеличиваются не столь значительно, и такую потерю эффек- тивности во внимание можно не принимать. 133
в самом деле, если инструментальные переменные ц характеризуются достаточно сильной корреляционной связью (коэффициент парной кор- реляции Pz^—>1) с соответствующими независимыми переменными л:,, то при одинаковых масштабах этих переменных произведения матриц Z'Z и Z'X будут приблизительно равными между собой и в этом случае, как это следует из выражения (3.64), Cov(fl>c7/(Z'X)"^-c7/(A"A:)-\ (3.72) И, наоборот, если переменные ц и х/ слабо взаимосвязаны между собой, то диагональные элементы матрицы {Z'X)~^ в силу того что оп- ределитель \Z'X\ уменьшается, возрастают существенно. В этом слу- чае при использовании выражения (3.54) за несмещенность .оценок приходится платить падением их эффективности. Этот вывод доста- точно очевиден при рассмотрении однофакторной модели yt^ccQ-^cCxXt+Ety при оценке параметров которой используется инстру- ментальная переменная Zt- Несложно видеть, что оценка коэффициента а\ в этом случае согласно выражению (3.54) определяется по следующей формуле: -lz=^ t а выборочная дисперсия этой оценки по формуле: D{ax^) = (j]Y,z}lQ:Zt'X,)^, (3.73) t t где дисперсия ст/ определена выражением типа (3.65) при л=1. Из выражения (3.73) непосредственно видно, что при слабой зависи- мости между переменными Xj и Zt его знаменатель уменьшается (в пределе до нуля), и выборочная дисперсия параметра а^ может стать как угодно большой. Вследствие этого на практике инструментальные переменные zi стремятся выбирать согласно следующему правилу: переменные zi должны иметь сильные корреляционные связи с соответствующими переменными xi и быть независимыми по отношению к ошибке модели е. Выполнение этого правила в эконометрических исследованиях реаль- ных процессов, для которых характерной чертой является корреляцион- ная связь между независимыми факторами и ошибкой, достигается с по- мощью некоторых специальных приемов, формирования инструменталь- ных переменных. Эти приемы будут рассмотрены в соответствующих разделах данного учебника (см. главы V и Vni). 134
в заключении данного раздела рассмотрим некоторые особенности формирования матрицы инструментальных переменных Z. Очевидно, что общее число таких переменных должно быть равно количеству независи- мых факторов в модели. При этом, если какая-либо из переменных х, ока- зывается не связанной с ошибкой £; то она сама может выступать в каче- стве «инструментальной» переменной. В результате матрицу X можно представить в следующем виде: где подматрица Xi объясняет переменные, независимые по отношению к ошибке модели е, а подматрица Х2 — зависимые. В этом случае матрица Z имеет следующий вид: Z=[X,Z2l где Zi — подматрица инструментальных переменных, замещающих неза- висимые факторы, образующие матрицу ^2. -1 ^ Заметим также, что выражение ZiJfZ) Z'X^P^= X , используемое в формуле (3.67), может рассматриваться как матрица расчетных значений факторов jc/„ полученных как оценки зависимых переменных при исполь- зовании в качестве независимых факторов инструментальных перемен- ных Zi, /=1,2,..., п, В самом деле, выражение (Z'Z)~^Z'jc/ определяет оценки коэффициентов следующей модели: Xit = Poi + Д/ • Z\t + ... + Pni • Znt + w//, (3.74) и, TaicHM образом, (Z'Z)~^Z'X=^, где В — матрица оценок коэффициентов моделей типа (3.74) для /=1,2,... п\ имеющая следующий вид: Б = Тогда матрица Z'B- X представляет собой матрицу расчетных значе- ний независимых факторов исходной модели, полученных в результате их выражения эконометрическими моделями типа (3.74) в зависимости от выбранных значений инструментальных переменных. Отметим также, что если значения инструментальных переменных и независимых факторов исходной модели равны между собой, т.е. Z =ЛГ, тогда X ^XiX'Xy^ ХХ=Х. 135 '^00 к ^Кп *10 • Ьп ■ Ьи ■ ■■ ц •• ь„, ■■ *«л>
с учетом этого равенства получим, что при частичной замене исход- ных факторов на инструментальные переменные матрица Z будет иметь следующий вид: z= a:i Xi где X 2 =Z{rZ)^ ХХг и Z=№ Z2]. ВОПРОСЫ к ГЛАВЕ III 1. Как выглядит ковариационная матрица ошибок модели при наличии автокорреляционных связей в ряду ошибки еР. 2. Как выглядит ковариационная матрица ошибок модели при наличии гетероскедастичности ошибок? 3. Каковы последствия автокорреляции и гетероскедастичности оши- бок? 4. В чем суть обобщенного МНК (ОМНК)? 5. Как определяется ковариационная матрица ОМНК-оценок парамет- ров? 6. Каковы предпосылки обобщенного метода максимального правдо- подобия? 7. В чем суть двухшагового МНК Дарбина? 8. В чем суть взвешенного МНК? 9. В чем суть метода инструментальных переменных? УПРАЖНЕНИЯ К ГЛАВЕ III Задание 3.1 Для обобщенной линейной регрессионной модели Уг =ctb+ axXt^St fr=l,...,r; имеется Г=10 пар наблюдений, которые представлены в табл. 3.1. Таблица 3.1 ^t 1 Уг 8 6,8 10 6,9 12 7,3 16 7,4 20 8,6 20 8,0 24 8,8 28 8,0 30 9,9 36 1 10,3 1 Требуется: 1. Определить оценки обобщенного МНК для параметров модели, ис- ходя из того, что имеется «чисто» гетероскедастичная модель с извест- ными дисперсиями ошибки. Они coci авляют 0,04;езлр5,0<л:,<15,0; 136
0,16; если 15,0<jc,<25,0; 1,00, если 25,0<X;<40,0. 2. Оценить параметры модели классическим МНК. Определить ошиб- ку, которая возникает из-за неправильной спецификации модели. 3. Определить для описанной в п.1 ситуации ковариационную матрицу оценок параметров, полученных обобщенным МНК. 4. Определить ковариационную матрицу оценок параметров, получен- ных классическим МНК. Задание 3.2 Имеется «чисто» гетероскедастичная модель линейной однофакторной регрессии. Дисперсии ошибок St (г=1,...,7) обозначим сгД Требуется: 1. Показать, что оценки обобщенного МНК для параметров регрессии Оои ai рассчитываются следующим образом: 2. Определить ковариационную матрицу вектора оценок, полученного обобщенным МНК. 3. Показать, что в частном случае «чистой» гомоскедастичности век- тор оценок, полученный обобщенным МНК, совпадает с вектором оце- нок, полученным классическим МНК. Задание 3.3 Имеется «чисто» гетероскедастичная модель линейной однофакторной регрессии Уг =аь+ axXt^Et Сг=1,...,Д дисперсия ошибки которой а^ = G^Xt. Требуется: 1. Определить для этой модели ковариационную матрицу ошибок, а также матрицу Г, с помощью которой модель может быть преобразована в классическую. 2. Перейти к преобразованной модели и определить на ее основе оцен- ки параметров регрессии Оои а\. 3. Определить оценку параметра (^ для данной модели. 137
Задание 3.4 Имеется линейное однофакторное уравнение регрессии yt =ао+ aiXt+Et (t=U...J), а также 10 пар наблюдений переменных (jC/, yi), которые представлены в табл. 3.2. ^f Ul^ 2,0 4,0 2,4 5,2 11,0 4,5 8,0 4,2 5,6 4,8 6,2 8,0 4,5 7,2 9,8 12,6 Таблица 3.2 8,6 8,5 3,8 1 4,2 1 Требуется: 1. Определить линию регрессии с помощью гетероскедастичной моде- ли из задания 3.3. 2. Определить линию регрессии на основе классической модели. 3. Изобразить обе линии регрессии и фактические данные на диаграм- ме рассеяния и сравнить их друг с другом. Задание 3.5 Рассмотрим частный случай гетероскедастичной модели однофактор- ной регрессии yt =6tb+ aiXt-\-£t (г=1,...,Д 2 2 ДЛЯ которого выполняется условие а^ = л:, (t=l,...,T). Имеются следую- щие фактические данные: Xt 1 .У/ 1 1 2 2 3 2 4 3 5 1 4 1 Требуется: 1. Определить вектор оценок параметров регрессии а с помощью клас- сического МНК. 2. Определить вектор оценок параметров регрессии а^ с помощью обобщенного МНК. 3. Определить потерю эффективности, которая возникает из-за приме- нения классического МНК вместо обобщенного. 4. Определить оценку ковариационной матрицы вектора оценок л Cov(a) и сравнить ее с Cov(a). Задание З.б Рассмотрим «чисто» гетероскедастичную однофакторную регрессион- ную модель Ct=ao-^aiyt-^et а=^1,...,Д 138
где с — потребление домохозяйства определенной структуры, у — доход этого домохозяйства. Ошибки попарно не коррелированы, дисперсия ошибки при доходе от 50 до 100 единиц в 2 раза больше, чем при доходе до 50 единиц. Имеется следующая выборка объемом 9 наблюдений: yt Lir 30 30 35 30 35 35 45 35 50 40 60 50 70 70 90 80 160 1 120 1 Требуется: 1. Определить ковариационную матрицу ошибки для этой модели. 2. Оценить параметры уравнения с помощью обобщенного МНК. 3. Оценить параметры уравнения при измененном условии: дисперсии ошибки должны быть пропорциональны квадрату дохода. Сравнить ре- зультат с соответствующим результатом в п. 2. Задание 3.7 Объем потребления домохозяйств объясняется с помощью однородно- го уравнения: У и =^i4^ +«24г^ +^Л (^= Ь ..., Т\ j=h ..., и (3.2) (1) (2) где ур — потребление; л:/ ^ — заработная плата; х/ — дивиденды домо- хозяйства j в период г. Для ошибки этого уравнения выполняются пред- посылки классической регрессионной модели. Параметры регрессии а\ и а2 должны оцениваться на основе эмпирических данных, но для каждого периода нет данных об индивидуальном потреблении ур а есть только со- вокупное потребление всех kt домохозяйств, т.е. Zyjt • У=1 Требуется: 1. Вывести модифицированное уравнение, которое позволяет оценить вектор параметров модели а. 2. Показать, что это уравнение является моделью с чистой гетероске- дастичнортью, в которой ковариационная матрица ошибки известная с точностью до а. 3. Определить оценки параметров а[ и «2- Задание 3.8 Объем потребления домохозяйств объясняется с помощью трехфак- торного уравнения: yjt =ai-\- агХг + азУУ,-, + а^ц + Sjt (t = О,..., Г; ; = 1,..., к), (3.4) 139
где yjt — потребление домохозяйства j в период г, Xt — индекс цен в период г; vv,7 — число членов и Zjt — доход домохозяйства j в период Г. Для ошибки этого уравнения выполняются предпосылки классиче- ской регрессионной модели. Параметры регрессии аи о^, ссъ и а^^ должны оцениваться на основе эмпирических данных, но отдельные данные известны только для 0-го периода, а для всех последующих периодов, к сожалению, известны только средние объемы потребле- ния, среднее число членов домохозяйств и средние доходы всех до- мохозяйств, т.е. _ \ к __ 1 ^ 1 ^ ^ у=1 ^ у=1 ^ у=1 требуется: 1. Вывести модифицированное уравнение, которое позволяет оценить вектор параметров модели а на основе всех имеющихся данных. 2. Построить ковариационную матрицу ошибки модифицированного уравнения. 3. Определить вектор оценок параметров (Х. Задание 3.9 Для линейного однофакторного уравнения регрессии yt =6ib+ aiXt+St (г=1,...,Г) имеется 7=20 пар наблюдений целевой переменной у и экзогенной пере- менной JC, которые представлены в табл. 3.3. Таблица 3.3 ^г yt ^t Li- 5,5 4,5 3,0 5,5 8,5 10,0 6,1 5,2 20,1 18,5 22,2 18,5 24,5 20,0 20.1 18,0 17,0 18,5 8,0 8,0 22,0 25,0 12,0 9,8 19,0 8,5 14,0 12,0 16,0 13,0 19,5 14,8 5,0 7,4 18,0 15,2 13,4 1 15,6 15,1 12,0 1 Будем исходить из нормального распределения ошибки и отсутствия автокорреляции. Имеется подозрение на гетероскедастичность. Требуется: 1. Проанализировать следующий способ проверки на гетероскеда- стичность: с помощью критерия Фишера проверяется нулевая гипотеза о гомоскедастичности для Г1=5, для Г2=10 и для Гз=15 наблюдений при уровне значимости 0^=0,05, и если хотя бы один из этих тестов отклонит нулевую гипотезу, то имеется гетероскедастичность. 140
2. Для уровня значимости Of=0fi5 проверить гипотезу, что дисперсии ошибки для первых и последних 10 пар наблюдений различны. Задание ЗЛО Имеется обобщенная регрессионная модель Ct=ao+aiyt-\-£t (t=h...Jh где с — потребление домохозяйства определенной структуры, у — доход этого домохозяйства. Имеется выборка из задачи 3.6. Рассматриваемые домохозяйства разбиваются на две группы: с доходом до 50 единиц и с доходом от 50 до 100 единиц. Требуется с учетом предположения о нормальном распределении ошибки проверить при уровне значимости сМ),05 нулевую гипотезу, что дисперсия ошибки во второй группе домохозяйств в два раза больше, чем в первой. Задание 3.11 Имеется линейное уравнение множественной регрессии yt =бль+ aixit +...+6^x„, + £t (г=1,...,Д для ошибок которого выполняются предпосылки авторегрессии первого порядка, параметр р известен. Для оценивания параметров (%, (ЗГь..., Оп предлагается провести следующее преобразование: из г-го уравнения вы- честь r-1-e уравнение, умноженное на р, t=l,...,T, т.е. осуществить пере- ход к обобщенным первым разностям. Требуется: 1. Определить матрицу преобразований Тр, с помощью которой осу- ществляется переход к модифицированному уравнению. 2. Определить «оптимальные» оценки параметров модифицированно- го уравнения и показать, как от них можно перейти к оценкам параметров исходного уравнения. 3. Определить «оптимальные» оценки параметров исходного уравне- ния и сравнить их с оценками из п. 3. Задание 3.12 Для линейного однофакторного уравнения регрессии yt=ao-^ aiXf¥et (t=l„..J) имеется Г=12 пар наблюдений целевой переменной у и экзогенной пере- менной X, которые представлены в табл. 3.4. Таблица 3.4 X, \ У1 5,0 5,0 2,5 4,8 1,8 зл 6,8 8,2 9,0 8,6 3,8 5.5 6,5 6,5 9,0 11,1 1,0 2,1 3,5 4,5 7.1 8,9 10 1 11,8 1 141
Для ошибки уравнения St вьшолняются предпосылки авторегрессии первого порядка с известными значениями /^=-0,4 и ст/ =1. Требуется: 1. Оценить параметры уравнения Oq и а\ с помощью обобщенного МНК. 2. Оценить параметры уравнения а^и а\С помощью модифицирован- ного уравнения из задачи 3.10. 3. Определить ошибки, которые возникают при использовании клас- сического МНК и оценивания из п. 2 по сравнению с «оптимальными» оценками из п. 1. Задание 3.13 Для линейного однофакторного уравнения регрессии yt =С1Ь+ aiXf^Et (t=l,...J) имеется Г=18 пар наблюдений целевой переменной у и экзогенной пере- менной JC, которые представлены в табл. 3.5. Таблица 3.5 X, yt Xt Ljl- 0,10 0,019 0,55 0,314 0,15 0,019 0,60 0,365 0,20 0,027 0,65 0,396 0,25 0,051 0,70 0,482 0,30 0,093 0,75 0,569 0,35 0,136 0,80 0,627 0,40 0,171 0,85 0,710 0,45 0,198 0,90 9.835 0,50 1 0,267 0,95 0,913 Для ошибки уравнения St вьшолняются предпосылки авторегрессии первого порядка. Требуется: 1. Определить оценку г параметра авторегрессии ошибки. 2. Определить с использованием полученной в п. 1 оценки параметра авторегрессии первый вектор оценок параметров а^и ai. 3. Рассчитать с использованием полученного в п.2 результата новую оценку / и определить с ее помощью новый вектор оценок обоих пара- метров регрессии. 4. Определить следующую оценку г' и сравнить оценки г, / и /' друг с другом. Задание 3.14 Для линейного однофакторного уравнения регрессии yt =ао+ aiXt+St (t=h...J) имеется Г=18 пар наблюдений целевой переменной у и экзогенной пере- менной Jc, которые представлены в табл. 3.5 (см. задание 3.12). 142
Требуется: 1. Проверить при уровне значимости а?=0,10 гипотезу об отсутствии автокорреляции первого порядка у ошибок St. 2. Проверить при уровне значимости «^=0,05 гипотезу о наличии нега- тивной автокорреляции ошибок линейного регрессионного уравнения с тремя экзогенными переменными, если для 20 наблюдений получены следующие остатки: 0,8; -1,2; 0,0; -0,6; 1,1; 0,9; 0,2; 0,4; -0,6; 0,1; -0,7; 1,4; 1,0; 1,5; -0,8; 0,2; -1,4; 0,3; 0,8; -1. 143
ГЛАВА IV Построение моделей в условиях мультиколлинеарности независимых неременных в данной главе рассмотрены некоторые приемы и методы оценки ко- эффициентов эконометрической модели в условиях сильной корреляци- онной зависимости (мультиколлинеарности) между объясняющими пере- менными. Как было отмечено в разделе 2.1, существование сильной линейной за- висимости меэюду переменными, входящими в правую часть экономет- рической модели и характеризующимися близостью значений коэффици- ентов парной корреляции ряда столбцов матрицы X к единице, вызывает целый ряд проблем при оценке коэффициентов этой модели. Во-первых, это явление делает матрицу XX плохо обусловленной (ее детерминант становится близким, а в пределе равным нулю), и в этом случае МНК и ММП как методы оценки коэффициентов модели не могут быть использованы^ Во-вторых, плохая обусловленность матрицы XX своим следствием, как правило, имеет ухудшение точности оценок ко- эффициентов модели, рост их дисперсий. В-третьих, оценки коэффици- ентов модели становятся чрезвычайно чувствительными к незначитель- ным изменениям исходных данных (значений элементов вектора у и мат- рицы X), а такэюе к ошибкам округлений числовых данных расчетов, не- избеэюным при обращении матрицы XX. Иными словами, незначитель- ные изменения в исходных данных или округления результатов проме- эюуточных расчетов вызывают резкие скачки в значениях оценок. Это говорит о неустойчивости оценок параметров моделей по отношению к исходным данным, о низкой обоснованности построенного варианта эконометрической модели, о ее неадекватности описываемому ею про- цессу. Вместе с тем, на практике решать проблему мультиколлинеарности путем исключения части взаимосвязанных между собой независимых пе- ременных часто бывает нецелесообразно, поскольку, например, их взаи- ^ См. условие (2.24). 144
мосвязь может отражать явление ложной корреляции, а не вытекать из содержания отображаемых ими явлений. При этом каждая из этих пере- менных может быть чрезвычайно важна для выражения закономерностей развития независимой переменной. Невозможность использования «классических» подходов при по- строении эконометрических моделей в условиях плохой обратимости матрицы (Х'Х) обусловливает необходимость применения при оценке их параметров специальных процедур и методов, которые позволяют снизить отрицательное влияние высокой корреляции между объяс- няющими переменными на точность и достоверность получаемых оце- нок. 4.1. РЕКУРЕНТНЫЕ МЕТОДЫ ОЦЕНКИ ПАРАМЕТРОВ ЭКОНОМЕТРИЧЕС1СИХ МОДЕЛЕЙ Использование рекурентных методов при оценке параметров эконо- метрических моделей позволяет избеэюать обращения матрицы XX и^ тем самым, появления ошибок в результатах этой операции, обуслов- ленных высокой корреляцией ряда ее столбцов и строк. Обращение мат- рицы в этом случае заменяется последовательностью более простых вы- числительных процедур, которые на каждом шаге расчетов определяют обратную матрицу (Ar,+i%+i)~\ t=^T\, Ti+l,..., Г, Т\>п-\-\, где Xt+\ - матрица, образованная r+1-ми строками ма-хрицы X, на основе предварительно оцененной матрицы {XlXi)' и r+1-й строки матрицы X, которую обозна- чим как Х^^.1. В этом случае и МНК сводится к итеративной процедуре, на каждом шаге которой уточняются оценки коэффициентов модели для исходных данных интервала (1, Г+1) с учетом оценок, полученных для интервала (1, Г), и новой информации, содержащейся в г+1-м элементе >^,+i вектора д; и строке г+1-й строке матрицы АГ. Рассмотрим рекурентные методы оценивания параметров эконометри- ческих моделей более детально. Предположим, что существуют оценки коэффициентов экономет- рической модели, полученные для первых t элементов вектора у и строк матрицы X. Обозначим эти оценки как вектор at=(ao, а/,..., л« ^)^, г>л+1. Заметим, что эти оценки с учетом результирующего выражения МНК Uf^iXlXtT^Xlyt можно представить в виде произведения двух сомножите- лей - матрицы Ft~^=(X/XtT^ и вектора gnXlyt, где Xt - матрица значений факторов, образованная по первым t строкам матрицы X Hyt- вектор, об- разованный по первым элементам t вектора д^. 145
Имея в виду правило умножения матрицы на вектор-столбец, вектор gt+\ можно представить в следующем виде: g/+i=gr+^h (4.1) где Agt - корректирующая поправка к вектору g,, образованная произве- дением транспонированной r+1-й строки матрицы X (г+1-го столбца мат- рицы Х О на r+1-й элемент вектора д^: ^г^^г^\'Уг^\- (4.2) Для матрицы F,+i=(Z^+i'Zf+i) также с учетом операции умножения мат- риц по правилу строка на столбец можно записать F,^i=F,+AF,^b (4.3) где bJFt - корректирующая поправка к матрице F„ полученная путем умножения транспонированной r+1-й строки матрицы X (г+1-го столбца матрицы X) на саму себя, т.е. на Г+1-й столбец матрицы X. AF, = X;^,-X,^,. (4.4) Заметим, что операция (4.3) не дает возможности непосредственно по- лучить матрицу Ft+C^, обратную матрице F,+i. Для ее определения вос- пользуемся леммой об обращении матриц, которая может быть представ- лена в виде следующего выражения: F-} =F,-i -Рг'х;^1(1 + Хш F,-' Щ^О-'Щ^х РГ' ■ (4.5) Поскольку выражение (1 + X^^.i Ff^ • X^+i) является скаляром (как ре- зультат умножения строки Х^^^ на столбец Ff^ • Х[^х), то матрица Ft+\^^ на основании выражения (4.5) определяется как разность двух матриц f,^{-'^f^'-isf;\ (4.6) где AF^"^ =F^"^ •^/+i(l + ^r+i '^Г^ '^WO'^^t+x '^Г^ — поправка к мат- рице Fr\ полученная лишь с помощью процедур умножения матриц и векторов по правилу «строка на столбец». Для доказательства справедливости выражения (4.5) умножим матри- цу Ft+\ (выражение (4.3)) с учетом (4.4) слева на Ft+\~^ и справа на FГ^ Получим: F,-' =F-5 +F-| •Г;+,Х,+, F,-'. (4.7) Далее умножим выражение (4.7) справа на вектор-столбец X'^+i и вы- несем сомножитель F^;j;jX^'+i. Получим: РГ'-Х;^1 =F-iJ,V,(l + X,^lFr»X,Vi). , (4.8) 146
Выражение (4.8), в свою очередь, умножим справа на векторы Xf^i Fj'^. В результате получим Конечный результат леммы (4.5) получим путем подстановки в (4.9) вместо матрицы ^^+} • ^г+г'^r+i • ^Г^ ее эквивалента Fr^-^r+i'^ из выра- жения (4.7). Используем лемму (4.5) для определения уточненного вектора оценок at+\ коэффициентов линейной эконометрической модели. Для этого обо- значим через Rt+i следующий сомножитель-вектор: Л,^, = F,-' • Х,%1 (1 + Х,+, • f г' • ^;+1 у' ■ (4.10) с учетом (4.10) вместо (4.5) можем записать F-l=Fr'-«,+,X,+,Fr>. (4.11) Сопоставляя выражения (4.11) и (4.7), непосредственно имеем «ш-Рш-^tM- (4.12) Поскольку вектор a^+i может быть определен как = K\'g.^K\'Kry^.^^ (4.13) то с учетом (4.11) после подстановки (4.12) в (4.13) получим «г+1 =«г +^r+l(>'r+l -^ж -«г) (4.14) или at+i=at+Aat. (4.15) л Заметим, что выражение yt+i~^t+\'^t -^(+^ представляет собой ошибку модели в момент г+1, полученную для модели, построенной по t л точкам. Иными словами, в данном случае значение et+i характеризует л как бы ошибку прогноза, поскольку произведение Х^+х-а^ = у^^^ рас- сматривается как прогнозное значение величины у в момент г+1, полу- ченное на основе модели, построенной с использованием информации за период (1, О» и прогнозного фона, определенного значениями факторов xi,..., Хп для момента Г+1, а значение j^^+i - фактическое значение перемен- ной у в момент г+1. 147
Таким образом, выражения (4.14) и (4.15) определяют оценку вектора ttt+i параметров эконометрической модели, построенной по данным пе- риода (1, г+1), как сумму оценок этого же вектора, но построенного по данным периода (1, О» т.е. а,, и корректирующего слагаемого, определен- ного как произведение корректирующего множителя Rt+i на ошибку про- л гноза et+\. Вектор а^ можно интерпретировать как априорную информа- цию, а вектор Аа, из вьфажения (4.15) как поправку, полученную на ос- нове апостериорньис данных. Вследствие этого рассмотренная рекуррент- ная процедура отражает байесовский подход к получению оценок коэф- фициентов эконометрической модели. Из излоэюенного материала непосредственно вытекает, что для реа- лизации рекуррентной процедуры оценок параметров линейной эконо- метрической модели в условиях мультиколлинеарности независимых пе- ременных в периоде (1,Т) необходимо в качестве исходной информации иметь «хорошо обусловленную» матрицу Ft, к которой неслоэюно приме- нить операцию обращения. Ее можно получить, если линейная зависи- мость между факторами jc/, /=1,2,..., w в период (1,0 будет значительно слабее, чем в период (1,7). Если же подобные взаимосвязи между факторами не ослабевают с уменьшением временного интервала, то для решения проблемы получе- ния оценок коэффициентов линейной эконометрической модели с помо- щью рекурентной процедуры может быть использовано некоторое при- ближение матрицы Ff Например, матрицу Ft можно заменить матрицей Ф, следующего вида: 0f^{Ft +E'd)={XtX-¥E'd), (4.16) где d - некоторый скаляр, добавляемый к диагональным элементам мат- рицы Ft =XlXt с целью облегчения операции получения обратной матри- цы Fr^ В этом случае вектор коэффициентов at определяется из выражения ар(^г%+£-^'%>, (4.17) которое называют гребневым МНК, а полученные на его основе оценки коэффициентов модели - гребневыми оценками. Недостатком гребневых оценок является их смещенность, которая увеличивается с ростом уровня константы d. Однако это смещение для интервала (1, г) можно свести к минимуму путем подбора минимально достаточного значения d. Кроме того, в ходе рекурентного метода оцени- вания для моментов времени г+1, Г+2,...,Г величина смещения также уменьшается. 148
Если это необходимо, то рекуррентные методы могут применяться и в рамках обобщенного МНК или взвешенной эконометрической модели. Для этого процедуру рекурентного оценивания необходимо применить к преобразованным исходным данным. 4.2. МЕТОД ГЛАВНЫХ КОМПОНЕНТ Метод главных компонент — одно из самых эффективных вычис- лительных средств, позволяющих оценить коэффициенты экономет- рической модели при плохой обусловленности матрицы (ХХ), вызван- ной сильной корреляционной зависимостью меэюду некоторыми объ- ясняющими переменными. Однако, как это будет показано далее в этом разделе, использование данного метода обычно ведет к потере части информации, содерэюащейся в матрице X, что, в свою очередь, является причиной того, что построенная на его основе модель мо- эюет не вполне адекватно отраэ/сать закономерности рассматривае- мых явлений. Вместе с тем, вычислительные преимущества метода главных компо- нент достаточно очевидны, что обусловливает его популярность в эконо- метрических исследованиях самого широкого круга процессов, особенно в ситуациях, когда число независимых переменных достаточно велико и даже не слишком значительные корреляции между ними делают матрицу Х'Х плохо обусловленной. Основная идея метода главных компонент состоит в замене объяс- няющих переменных jc/, /=1,2,..., п на новые переменные z/, 7=1,2,.-., к\ к<п, которые, с одной стороны, свободны от недостатков, вызванных корреля- ционной зависимостью, а с другой — содержат в себе максимально воз- можную долю информации «старых» переменных JC/. Обычно метод глав- ных компонент работает с центрированными переменными (см. раздел 1.1, выражение (1.13)). С учетом этого эконометрическая модель с цен- трированными переменными определяется вьфажением (1.10), в котором свободный коэффициент Оо отсутствует, т.е. о о о о где, напоминаем, центрированные переменные определяются как о о yt -У^У'у ^it~ ^it ~^i И ИХ математические ожидания равны нулю, т.е. М(у) = М(л°.) = 0,/=1,2,...,п. 149
Таким образом, матрица X' X определяется следующим выражением Z(-^l/ -^iK-^lr -^2) Z(-^2/ -^2) ••• Z(^2r -^)Um -^n) t t t Z(-^lr -^l)(^n/ -^J Z(^2r -^2)(^nr -\) ••• Z(-^nr -^l)^ ^':^ = V / (4.19) Выражение X(% -^i) является мерой изменчивости переменной jc/ t относительно ее среднего значения на интервале (1,7). Аналогично выра- жение X(-^/f ~^/)(-^гг ~^г) определяет взаимную изменчивость перемен- t ных Xi и л:^ на рассматриваемом интервале. Несложно заметить: если раз- делить эти изменчивости на Г-1, то получим дисперсию переменной л:, и ковариацию переменных Xi и Хг соответственно. Таким образом, сумма о о диагональных элементов матрицы X'X в данном случае содержит в себе всю информацию относительно изменчивости включенных в исходную о о модель переменных Xt. Эта сумма называется следом матрицы X'X и о о обычно обозначается как tr(X'X). Главные компоненты (новые переменные Zji) формируются как ли- о нейные комбинации «старых центрированных переменных» xi^ с уче- том введения для них двух следующих принципиальных ограничений. 1. Полная совокупность главных компонент должна содержать в себе всю изменчивость переменных jc,> i=lД,..., п, 2. Главные компоненты должны быть ортогональны между собой, т.е. для любой пары компоненту и г, j^ должно выполняться соот- ношение Zzy.-z,, =0. (4.20) г Запишем линейное представление главных компонент через центри- рованные переменные х^^ в следующем виде: о о о 2уг =^yi ^\t-^^j2^2t^-"-^^jn^nt ]=1,2,'''Л'Л<п, (4.21) о Заметим, что поскольку М(л:^) = 0, то M(zj) = О для всех7=1,2,..., к. С учетом этого выражение (4.20) можно интерпретировать в том смысле, что взаимная изменчивость переменных Zj и Zr равна нулю. 150
в матричной форме выражение (4.21) запишем следующим обра- зом: zi=i:*i, (4.22) где Zi=(zib..., 1\тУ - вектор-столбец значений zu первой компоненты в мо- менты г; b\=(biu..,, binY - вектор-столбец коэффициентов линейной зави- симости, выражающей связь первой компоненты со значени51ми центри- о рованных переменных в моменты Г=1,2,...,Г; X - матрица центрирован- о ных переменных, xif , /=1,2,..., п , в которой столбец, состоящий из еди- ниц, отсутствует. С учетом выражения (4.22) сумма квадратов элементов zu, т.е. J^zf^ , t характеризующая изменчивость первой главной компоненты, выражается следующим образом: Z4 =(zlzi) = b{X'Xb,. (4.23) t Определим неизвестный вектор коэффициентов bi таким образом, чтобы первая главная компонента вобрала в себя максимальную долю о о изменчивости, содержащейся в матрице ЛГ'Х , но при условии, что сами значения коэффициентов не будут влиять на эту характеристику. Это можно сделать введя нормирующее ограничение на элементы вектора Ьи которое выражается следующим соотношением (bi', b i)=bn^+bn^+...+biM. (4.24) Очевидно, что при выполнении условия (4.24) уровень изменчивости о о (z\\ Z\) не сможет превзойти изменчивость всей матрицы X' X . Задача максимизации квадратичной формы (4.23) при условии (4.24) может быть решена на основе метода множителей Лагранжа, согласно ко- торому искомое решение, т.е. вектор Ьи является значением аргумента, максимизирующим следующий функционал: ф,=Ь1'Х'ХЬ1-м,(Ь,%-11 (4.25) где JU\ — множитель Лагранжа. Исходя из условия оптимума ^^ /бЬ/=0, дифференцируя правую часть (4.25) по вектору 6i с учетом очевидного условия ф^/оЬ, =0, получим (X'X)b,=Mibi. (4.26) 151
Из равенства (4.26) следует, что /Л\ - максимальное собственное число о о (перронов корень) положительно определенной матрицы {X'X), а fci - соответствующий ему собственный вектор, координаты которого должны удовлетворять соотношению (4.24). Аналогичным образом значения второй главной компоненты в момен- ты г=1,2,..., Т определим как линейную комбинацию независимых пере- о менных хц , /=1,2,..., п, что может быть выражено равенством: Z2=^*2» (4.27) гдег2=(г2ь Z22,-.., 11тУ\ Ьг^Фги ^?22,-.., ЬгпУ- Неизвестные коэффициенты-компоненты вектора Ъг определим из (4.27) с учетом трех отмеченных выше условий. Компонента zi должна о о вобрать в себя максимальную долю изменчивости матрицы X'X , остав- шейся после компоненты Zi, векторы z\ и zi должны быть ортогональны друг другу, а координаты вектора bi должны быть нормированы согласно соотношению типа (4.24). Сочетание этих условий соответствует постановке задачи максимиза- ции квадратичной формы Ь2Х'ХЬ2'-^шдо^ (4.28) при ограничениях Ъ1=и (4.29) (fc/,*i)=0. (4.30) При этом отметим, что вид функционала (4.28) вытекает из определе- ния изменчивости компоненты zi как скалярного произведения (z2^ о о Z2)=b2 X'X Ь2у выражение (4.29) является аналогом условия (4.24), а ра- венство (4.30) является следствием условия ортогональности компонент Zl и Z2. в самом деле, условие ортогональности z\ и Z2 можно представить с учетом свойства (4.26) в следующем виде: 0=(Z2', Zl)=b2'X'Xb, =JUl(b2\ ftl). (4.31) Из (4.31) непосредственно следует ограничение (4.30). Оптимизационная задача (4.28>-(4.30) также решается с помощью ме- тода множителей Лагранжа как задача безусловной максимизации сле- дующей квадратичной формы: 152
фг^г' X' X b2-^i2{b2'b2-\)-Vi(b2%-^\ (4.32) где //2 и //i - множители Лагранжа. Условие максимума (4.32) приводит к следующему выражению: £?^/*2=2i'i: *2-2//2*2-/7i*i=0. (4.33) Несложно показать, что множитель //1=0. Для этого умножим равенст- во (4.33) слева на Ь\, В результате 26/i'i: b2-2/i2(bi'b2)-Tji(bi%)=0. (4.34) Поскольку bi'X'X=X'X bi=juibu ФЛ *2)=0 и (*/, *i)=l, то из условия (4.34) непосредственно следует, что 7ji= 0. В этом случае выражение (4.33) можно представить в виде аналогич- ном (4.26): X'Xb2=M2b2- (4.35) Из (4.35) следует, что множитель Лагранжа //2 является вторым по о о величине собственным корнем матрицы (X'X) и положительным чис- лом (поскольку у положительно определенной матрицы все собствен- ные числа положительные). Этому собственному числу соответствует собственный вектор ^2. координаты которого удовлетворяют условию (4.29). Продолжение процесса формирования главных компонент как линей- о ных комбинаций независимых переменных х^^ приводит к следующему результату. Коэффициенты этих линейных комбинаций являются норми- о о рованными собственными векторами Ьи 62»..-, Ьп матрицы X'X , которым соответствуют собственные числа /^ ь /^2v) /^ л> удовлетворяющие соот- ношению jUi>jU2>M3^-"^Mn' (4.36) Объединим векторы-столбцы Ь/, /=1,2,..., п в матрицу следующего ви- да: B=(bub2,...,b,), (4.37) Тогда матрица значений главных компонент Z, в общем случае имею- щая размер пхТ, определяется согласно следующему выражению: Z=XB, (4.38) 153
матрица Z'Z (аналог матрицы Х'ЛГ) с учетом свойств ортогональности компонент и нормированности векторов i„ /=1,2,..., п имеет следующий вид: ^//j О ... 0^ О //2 ... О Z'Z=B'X'XB^ 10 о ...//J (4.39) Заметим, что Х//, =trZ'Z, т.е. является следом матрицы Z'Z и опре- /=1 деляет общую изменчивость главных компонент. Можно формально по- казать, что tr(Z'Z)=triX'XX (4.40) о т.е. изменчивость переменных хц , /=1,2,..., п равна изменчивости глав- ных компонент Z/,7=1,2,..., к. При доказательстве равенства (4.40) будем использовать два ре- зультата теории матриц. Первый из них относится к свойствам матри- цы В. Из условий типа (4.26), (4.29) и (4.30), определяющих свойства нормированности векторов i„ /=1,2,..., л; и их ортогональности, следу- ет, что В'В=Е. (4.41) Таким образом, В'=В~^, и для таких матриц справедливым является следующее равенство: ВВ'=Е, (4.42) Из последнего результата вытекают определенные свойства следов матриц, которые могут быть сформулированы следующим образом: для произвольной матрицы А имеет место равенсгво следов матриц А'А и АА\ т.е. triA'A)=triAA'). (4.43) Как частный случай равенства (4.43) можно рассматривать следующий результат: скалярное произведение вектора-строки х' на вектор-столбец х равно следу матрицы, полученной путем умножения вектора-столбца х на вектор-строку У. Иными словами, (x'x) = txl=tr(xx'), (4.44) где Xi — координаты вектора х. 154
с учетом свойств (4.42) и (4.44) имеем к Таким образом, отношение JUj^UMi можно интерпретировать как 1=1 вклад (долю) компоненты Zj в общую изменчивость независимых факто- о ров Xi, /=1,2,..., п. Иными словами, справедливым является следующее равенство: Znr^ = l. (4.46) /=1 Условие (4.46) является ключевым при решении вопроса о том, сколько главных компонент целесообразно включить в эконометрическую модель. о о Как уже было отмечено выше, в том случае, когда матрица (X'X ) являет- ся плохо обусловленной, но ее определитель отличен от нуля, | ^' i^ | ?Ю, теоретически общее число главных компонент совпадает с числом объяс- няющих переменных п. Однако информативная ценность главных компо- нент различна. Компоненты с большими номерами, как правило, опреде- о ляют лишь незначительную долю общей изменчивости переменных х^ и их обычно не включают в эконометрическую модель. Решение о том, на какой компоненте целесообразно остановиться может быть принято на ос- нове анализа кумулятивной переменной /(//^), определяемой как '(Mr) = Z^- (4-47) Если I(jir) определяет достаточную долю изменчивости переменных о xi и эта доля для компоненты с номером г+1 рассматривается как от- носительно небольшая (на практике - менее процента от общей измен- чивости), то компоненты с номерами г+1, г+2,...,/: в модель обычно не включают (см. рис. 4.1), ограничиваясь первыми г номерами из них. 155
На рис. 4.1 изображен вариант изменения кумулятивной изменчивости главных компонент. Из графика непосредственно видно, что первые че- тыре компоненты определяют около 95% общей изменчивости перемен- о ных xi , так что доля 5-й и последующих компонент явно незначительна. В этом случае в модель целесообразно включить лишь первые четыре компоненты. |о о I о о X'X 1= о, матрица Х'Х имеет ранг г<п, у нас имеется лишь г отличных от нуля собственных чисел, которым соответ- ствуют г главных компонент, определяющих суммарную изменчивость о переменных jc/, /=1,2,..., п. Тогда число включаемых в модель компонент не превосходит числа г. В исследованиях реальных процессов число главных компонент обычно существенно меньше количества независи- мых переменных. Рис. 4.1. График изменения кумулятивной изменчивости главных компонент 156
На рис. 4.1 изображен вариант изменения кумулятивной изменчивости главных компонент. Из графика непосредственно видно, что первые че- тыре компоненты определяют около 95% общей изменчивости перемен- о ных xi, так что доля 5-й и последующих компонент явно незначительна. В этом случае в модель целесообразно включить лишь первые четыре компоненты. |о о I о о X'X 1= о, матрица X'X имеет ранг г<п, у нас имеется лишь г отличных от нуля собственных чисел, которым соответ- ствуют г главных компонент, определяющих суммарную изменчивость о переменных xi, /=1,2,..., п. Тогда число включаемых в модель компонент не превосходит числа г. В исследованиях реальных процессов число главных компонент обычно существенно меньше количества независи- мых переменных. Отобрав существенные главные компоненты можно приступить к построению эконометрической модели, в которой они выступают в ка- честве независимых переменных, опосредованно отображая влияние о факторов Xi , /=1,2,..., п на характер изменения зависимой о переменной у. Представим такую модель в линейном виде о yt=riZit+-" + rkZkt+^t^ (4.48) где ;!,..., д; <^t - ошибка модели в момент t. Вследствие ортогональности новых независимых переменных zu Ziy..., Zk при использовании МНК для определения неизвестных коэффициентов Yj, j=l, 2,..., к модели (4.48) вычислительных проблем не возникает. Заме- тим, что ковариационная матрица оценок с, коэффициентов модели у^ на практике имеет следующий вид: Г//1 О ... О о ° \2 (4.49) T(yt-ytf где (J^^ = рассматривается как оценка дисперсии ошибки ^/ Т-к о л модели (4.48) и у^ - расчетные значения центрированной переменной 157
yj , ^=1,2,..., Т. Таким образом, дисперсия оценки j-ro коэффициента мо- дели и взаимные ковариации этих оценок определяются следующими вы- ражениями: c/(cj)=au^ jUj^(Ju'bjX X' X Т% (4.50) cov(c,, с,)=0; ;, /=1,2,...,/:;y^t/. Следует однако заметить, что использование моделей с главными компонентами в социально-экономических исследованиях порождает ряд проблем содерэюательного характера. Дело в том, что каж:дая из ком- поненту будучи линейной комбинацией изначально отобранных в модель факторов, в общем случае не допускает четкого содержательного тол- кования, поскольку эти факторы часто имеют различную природу и, возмоэ/сно, разные единицы измерения. В такой ситуации дать удовле- творительное содерэюательное (экономическое) обоснование закономер- ностям изменения переменной уt в зависимости от изменения компонент, природа которых не поддается четкому объяснению, довольно затруд- нительно. Содержание компонент достаточно сложно установить и в ситуациях, когда факторы jc, имеют сходное содержание (например, в экономических исследованиях все факторы часто удается представить в стоимостном ви- де). Однако и в этом случае компонентам, которые являются различными вариантами экономически не определенных линейных комбинаций пусть и объективных стоимостных характеристик, дать убедительное содержа- тельное обоснование обычно не представляется возможным. С содерэюательной точки зрения более обоснованным представля- ется другой подход, согласно которому после построения модели с главными компонентами, осуществляется переход к модели с изначаль- но отобранными факторами. Это несложно сделать путем подстановки в выражение (4.48) уже сформированных линейных комбинаций (выра- жение (4.21)). Проделав несложные преобразования, получим: о о о )», =CiZi,+... + qzt,+M, =Ci(i>ii%+...+^„^:„,) + ... о о -О +q(6nX„+... + i>i„x„,) + M,=(cj6,i+02*12+... + ^Ьц)д:1,+ (4-51) о Л о Л о ■\г... + {суЬ^„+С2Ь2п+- + сф,^)х„,+ и,=ауХ^,+... + а„х^,+и,, Л Л где ai,...,a„ - коэффициенты, которые можно рассматривать как «оцен- ки оценок» коэффициентов исходной модели (4.18). 158
Однако, если количество включенных в модель компонент к меньше числа изначальных факторов п (к < п), имеется в виду случай, когда мат- о о рица {X'X) имеет ранг w, то уравнение (4.51) не соответствует исходно- л му варианту эконометрической модели (4.18), т.е. а^ Ф ai, i = 1, 2, ..., п и et =^ Щ. Отличия этих уравнений обусловлены потерями информации вследствие невключения в модель нескольких «малозначимых» компо- нент. Формальное соответствие этих показателей достигается только в том случае, когда в модель включают все п компонент. Вместе с тем за- метим, что увеличивать число главных компонент за счет «малозначи- мых» также нецелесообразно, поскольку если собственное число матри- о о цы X'X близко к нулю, при его определении в ходе решения характери- стического уравнения |(i'i:b//B|=o (4.52) возникают ошибки округления. Они опять же способствуют тому, что модель, построенная с использованием процедуры (4.51) не будет соот- ветствовать истинной модели процесса. Заметим, что рассмотренный подход неприемлем и в ситуации, ко- о гда две или несколько изначальных переменных jc^ связаны строгой о о о о линейной зависимостью (например, jcj^ =а^-\-а\ X2t ), т.е. матрица X'X имеет ранг г< а2. В этом случае можно показать, что коэффициенты при зависимых переменных, полученные из модели с главными компонен- тами, оказываются пропорциональны угловому параметру этой зависи- мости а\ и не имеют отношения к истинным их взаимосвязям с пере- о менной У{ . Таким образом, при использовании главных компонент обычно прихо- дится выбирать «меньшее из несколькга зол», пороэюденных проблемами с вычислениями, проблемами с содерэюательной интерпретацией компо- нент, проблемами с потерей точности при построении модели. Частич- ный компромисс при решении этих проблем возможен, когда компоненты строятся на основе неполного набора исходнььх факторов, между кото- рыми существует сильная зависимость, а остальные факторы включаются в модель без преобразования. Например, если исходные переменные xi,..., Xfn связаны между собой и с переменными X;;,+i,..., дс„ относительно слабой корреляционной зависимостью, а между последними эта зависимость яв- ляется достаточно сильной, что служит причиной плохой обусловленно- о о сти матрицы А!^' ЛГ, то главные компоненты целесообразно формировать 159
только на основе переменных с индексами /=т+1,..., п. Этот прием оказы- вается особенно полезным, когда переменные jc^+i,.-, Хп являются одно- родными по своему содержанию. В таких ситуациях иногда удается при- дать им вполне конкретный смысл. В заключении данного раздела заметим, что при разномасштабных ис- ходных факторах различной природы рекомендуется главные компонен- ты строить на основе их нормированных безразмерных величин. Их по- лучают путем следующего преобразования: ;,^^^iLZlL^ (4.53) где <Тд^. — среднеквадратическое отклонение переменной х/, /=1, 2,..., п. В этом случае удается избежать влияния масштаба переменных Xi на оценки параметров моделей и легко оценивается истинное влияние каж- дой из них и на главные компоненты, и на зависимую переменную yt. 4.3. МЕТОДЫ ОЦЕНКИ КОЭФФИЦИЕНТОВ МОДЕЛЕЙ С ЛАГОВЫМИ НЕЗАВИСИМЫМИ ПЕРЕМЕННЫМИ Эконометрические модели с лаговыми независимыми переменными учитывают влияние на переменную yt уровней объясняющих факторов, относящихся к прошедшим моментам времени t-1, t-2y,.. . Необходи- мость их включения в модель обычно объясняется некоторым запазды- ванием влияния причины (независимых факторов) на следствие (зависи- мую переменную). Достаточно широкое применение подобного рода мо- дели нашли в исследованиях влияния инвестиций (как независимых фак- торов) на выпуск продукции, прибыль и другие результаты хозяйствен- ной деятельности. Аналогичное явление наблюдается в исследованиях взаимосвязи расходов на рекламу в прошлые периоды с уровнем продаж текущего периода. Для всех подобного рода процессов характерным яв- ляется то обстоятельство, что уровень объясняемой переменной yt опре- деляется не только одновременными значениями объясняющих факторов jc,7, /=1,2,..., А2, но он также зависит и от значений ряда из этих факторов , относящихся к прошлым периодам, т.е. от значений хц_\, jc,,/_2,.-. . Общий вид линейной эконометрической модели с лаговыми незави- симыми переменными может быть представлен следующим уравнением: Jr = Го + (Хо^и + a^xx^t-\ + ... -^сс^и-г + + Рохь + Дл-2,;_1 + ... + PpK2,t-p + (4.54) + Ф^пг + AXn,t-\ + ... + UXn,t-s + £t. 160
где Oi, /=0,1,..., г - коэффициенты, связывающие уровень переменной х\, взятый в момент г-/, с зависимой переменной yt\ J3j, у=0,1,..., р - коэффи- циенты, связывающие уровень переменной хг, взятый в момент t-j, с за- висимой переменной д'^ и т.д.; 6^- как и ранее, ошибка модели в момент г; ^0 - постоянная модели. Частным случаем выражения (4.54) является уравнение с одной лаго- вой объясняющей переменной: yt=aoXt+ aixt-i + ... + cXnXt-n + £^, (4.55) где Xt-i - значение независимой переменной х в момент t-i, /=0,1,..., п\ cCi, /=0,1,..., п - коэффициент модели при переменной х,_^, /=0,1,..., п. Из вы- ражения (4.55), в частности, вытекает, что все рассматриваемые перемен- ные модели центрированы. На примере уравнения (4.55) в данном разделе без ограничения общности будут рассмотрены особенности оценки ко- эффициентов этого класса эконометрических моделей. Матрица значений независимых факторов для такой модели образова- на сдвинутыми на один период последовательностями значений перемен- ной Xt и имеет следующий вид: Х = Хх Х^ Х_х ... JC_(„_i) Х2 Х^ Xq ... ^_(„_2) (4.56) \Xj Хгр_х Xj_x ... Хр^^ Поскольку соседние столбцы матрицы в данном X случае выраэюа- ют одно и то эюе явление с некоторым запаздыванием, то моэюно оэюидатъ наличия сильной корреляционной зависимости меэюду ними, следствием которой, в свою очередь, является плохая обусловленность матрицы (Х'Х). Разрешить возникающую из-за этого проблему обрати- мости матрицы (Х^Х) и получить оценки коэффициентов модели теоре- тически можно и с использованием рекуррентных методов оценивания, и с помощью метода главных компонент. Однако каждый из этих мето- дов имеет определенные недостатки, обусловливающие появление оши- бок в оценках параметров модели из-за округлений в расчетах, потерь информации и т.п., что может привести к искажению существующих за- кономерностей в развитии рассматриваемых процессов. Вследствие этого проблемы построения моделей с лаговыми объяс- няющими переменными часто решают преобразованием этих переменных в новые относительно независимые факторы. При этом обычно предпо- ложений о строгой ортогональности новых факторов не выдвигается. Обозначим новые независимые факторы, как и главные компоненты, через z/,y=l,2,..., к. Как правило, их количество к меньше размера сдвига 6 Эконометрика 161
n, k< л, хотя это ограничение и не принципиально. Пусть уровень у-го фактора в момент t выражается линейной комбинацией лаговых перемен- ных Xt-i'. Zjt = bjoxt + bjiXt-i + ... + bjnKt-n- (4.57) При этом коэффициенты Ay/, 7=1,2,..., к; /=0,1,..., л; выбираются таким образом, что корреляционная взаимосвязь между факторами Zj и Zn j'^r, была не слишком значительной. С использованием новых переменных z/, у=1,2,.-, к\ сформируем новый вариант эконометрической модели }'г=?1^1/+... + TiZkt^Su (4.58) где 3|f,y=l,2,..., к -коэффициенты нового варианта модели. Поскольку факторы Zj являются линейными преобразованиями исход- ных лаговых переменных Xt-i, то уравнение (4.58) должно адекватно ото- бражать закономерности изменения переменной yt в зависимости от значе- ний Xt-i, /=0,1,..., п. Вследствие этого теоретически ошибка модели (4.58) должна быть равна ошибке модели (4.55). Предполагая отсутствие сильной корреляции между факторами Zj для оценки коэффициентов 21 ,..., yk модели (4.58), можно использовать обыкновенный МНК, который определяет вектор их оценок c=(ci,..., q)' на основе известного выражения с={Г1 Т^Гу. (4.59) При известных оценках ci,..., q путем подстановки правой части вы- ражения (4.57) в (4.58) легко получить искомую модель, связывающую значения yt со значениями лаговых переменных Xj-i. Сделав такую под- становку, получим Ух = CxibxoXt + bxxXt-\ + ... -^bxrtXt-n) + + C2{b'2QXt + bixXt-X + ... + binKt-p) + (4.60) + Ckibj^t + bkxXt-X + ... + b2nXt-n + St. Несложно заметить, что оценки коэффициентов искомой модели (4.55) оо, Ль..., <2„ определяются на основе следующих соотношений: Оо = CxbxQ + CibiQ + ... +Q^?jk0; ах = cxbxx + СгЬгх + ... + сфкъ (4.61) cin = cxbxn + СгЬы + ... + сфы- В векторно-матричной форме система (4.61) может быть представлена в следующем виде: а=Вс\ aFbfi, (4.62) (bxo ^20 •••ho\ где B = 162 [,b[n bin ••• bjcnj
Рассмотренный подход позволяет определить и качественные характе- ристики оценок оо, ^1,..., an, т.е. их дисперсии и ковариации, образующие соответствующую ковариационную матрицу. Эта задача соответствует задаче определения ковариационной матрицы вектора, получаемого в результате произведения скалярной матрицы на слу- чайный вектор с при известной ковариационной матрице последнего (см. (4.62)). Поскольку элементы матрицы В являются скалярами, т.е. их диспер- сии и взаимные ковариации равны нулю, а ковариационная матрица оценок коэффициентов с,, 7=0,1,..., п определяется аналогично вьфажению (2.18) Cov(c)=0'/(Z'Z)"\ то элементы ковариационной матрицы оценок а, находятся согласно правилу расчета дисперсий и ковариации случайных величин, умно- женных на скаляр, т.е. (^{dx)-d^(9'{х), cov{dxfy)=d'f-QOv{x, у), где d и/- скаляры, а JC и у - случайные величины с известными дисперсиями и ко- вариациями. В векторно-матричной форме выражение, определяющее ковариаци- онную матрицу Со\(а) в целом, представляется в следующем виде: Cov(a)=cr/j?(Z'Z)"^^, (4.63) ^ ^ л ^ 1 0 0 где (r{aj)=<j£ bj(Z'Zy b/\ cov(a/, ar)=(J£ bjiZ'Z)' 6/ и на практике Ge =сг^ . Для реализации рассмотренного подхода на практике остаются не- решенными две проблемы: а) нахоэ/сдения величины максимального лага п; б) определения элементов матрицы Д т,е, коэффициентов, выра- жающих переменные Zj через переменные Xi, /=0,7,..., n;j=l,2,..., к. Величина максимального лага п может быть определена двумя допол- няющими друг друга способами. Во-первых, значение лага п может быть приблизительно оценено на основании анализа значимости коэффициен- тов парной корреляции переменных >^, и х,_^, /=0,1,... . Последний значи- мый коэффициент в этой последовательности будет приблизительно со- ответствовать величине максимального лага. Оценка значимости парного коэффициента корреляции может быть произведена на основе критерия Стьюдента (см. выражение (1.25)). Согласно второму пути рациональное значение максимального лага мо- жет быть оценено пугем сопоставления критериев качества вариантов моде- ли, отличающихся количеством лаговых переменных (см. раздел (2.2)). На практике обычно на основе анализа значимости парных коэффици- ентов корреляции определяется приблизительное значение максимально- го лага, которое затем уточняется по результатам анализа критериев каче- ства вариантов модели с лагами, равными и близкими по значению к этой величине. 6* 163
При выбранном значении максимального лага п определение значений bji для линейных преобразований переменных jc/ в переменные z/, проис- ходит с учетом предварительных предположений, гипотез о характере изменения коэффициентов cCi при лаговых переменных л:^_/, /=0,1,..., «. Эти гипотезы обычно выражаются в виде задаваемой формы функциональной зависимости, связывающей значения Д/. Правильно сделанное предполо- жение относительно этой формы обычно значительно снижает уровень мультиколлинеарности новых переменных z/, 7=1,2,..., к\ и упрощает про- блему оценки параметров bji и с, за счет сокращения их количества, по- скольку к<п. В эконометрических исследованиях достаточно часто используются предположения о возможности аппроксимации коэффициентов oci много- членами, аргументами в которых выступает величина временного сдвига (текущего лага) переменной Xt-i. Например, согласно предположению Ширли Алмон, функция, описы- вающая изменение коэффициентов а;, в соответствии с теоремой Вейер- штрасса может быть аппроксимирована с достаточной точностью на всем отрезке О-п многочленом г-й степени, так что Oi =ДО=^о+ dri+d2'i\...-\-dr • i, (4.64) где Jo» d\,d2,...,dr - неизвестные коэффициенты многочлена. Будем предполагать, что степень г обеспечивает достаточно точную аппроксимацию зависимости значений а, как функций от сдвига /. Рас- смотрим следующий пример, иллюстрирующий «вычислительную техни- ку» такого подхода. Пусть при величине лага «=5, степень многочлена г=2. Для этих значений получим, что оценки соответствующих коэффи- циентов определяются по следующим формулам: ao=AO)=do; ai=/(l)=Jo+Ji+^2; а2=/(2)=^о+2^1+4^2; (4.65) a3=K3)=do+3di'^9d2; Л4=Д4)=^о+4^1+16d2, аз=/(5)=^о+5^1+25д(2. Подставив правые части из выражения (4.65) вместо соответствующих коэффициентов в уравнение модели (4.55), получим yt= do(Xt + Xt-i + Xt.2 + Xt-3 + Xt^ + Xt-s) + + di(xt-i + 2xt-2 + 3jCr_3 + 4xt^ + 5xt-5) + (4.66) +d2(xt-\ + 4xt-2 + 9xt-3 + 16л:,_4 + 25jc/_5) + et. Из сопоставления выражений (4.66) и (4.60) вытекает, что 164
Zlt = Xt + JCm + Xt.2 + Xt-3 + Xt-4 + Xt-5 => 6i=(lЛДДДД); Z2t = ^/-1 + 2гь2 + Зл^г-з + 4л^г-4 + 5^:^-5 => *2 =(0Д ,2,3,4,5); (4.67) Z3r = Xt-i + 4jc,_2 + 9дсг-з + 16jCr-4 + 25x^_5 => *3=(0,1,4,9,16,25); r= /:-l=2; ci= Jo; C2= di; сз= ^2. Из рассмотренного примера непосредственно видно, что в методе Ширли Алмон значения элементов векторов Ьи Ъг и 6з, являющихся ко- эффициентами в линейных преобразованиях переменных Xi в переменные Z/, /=0,1,..., п\ j=l,2,..., к, подбираются таким образом, что при сильной корреляционной связи между факторами х/ зависимость между новыми переменными Zj существенно ослабнет. Вследствие этого оценки сь С2,..., Ск коэффициентов у[, л,,.., % модели (4.58) могут быть определены с по- мощью обыкновенного МНК без каких-либо проблем. Далее на основе выражений (4.61) и (4.63) находятся для данной модели оценки коэффи- циентов исходной модели (4.55) оо, ль..., as, их дисперсии и ковариации. Еще раз отметим, что на практике «оптимальная» величина неизвест- ной степени г многочлена (4.64), может быть определена путем построе- ния вариантов модели (4.60) с различными значениями степени г и выбо- ра в качестве окончательного решения варианта с лучшими качественны- ми характеристиками. Суть другого подхода, развивающего идеи метода Ширли Алмон со- стоит в том, что вместо точного значения сдвига в выражении (4.64) ис- пользуются неизвестные значения функции Дм,), где м, - некоторая точка интервала (О, г), «близкая» к точке j. При реализации такого подхода зна- чения uq, щ,,.,, Ur выбираются произвольным способом. Здесь самое глав- ное, чтобы интервал (мо, Ur) включал в себя точки О, 1, ..., п. Неизвестные значения Дму), 7=0,1,..., г можно определить на основе имеющейся исход- ной информации с помощью подхода, предложенного Ширли Алмон. Обозначим для точек /=0,1,..., п коэффициент при Дмо) в выражении (4.67) как boi, при/(м1) - как Ьц и т.д., при/(М;.) - как 6„. Тогда значения ДО=Ль /=0,1,..., п будут определены следующим выражением: Ki)=boi 'Ящ)^Ьи 'Ящ)^:.лЬг1 'Aur\ (4.68) где {i-iix){i-U2)...(i-Uf.) (mq -wi)(wo -М2)---("о -"г) ' Ь, = JiziflXiziflMiziO. и ^.д. (4.69) (Ml-Mo)(Mi-M2)...("!-Mr) Более общий (и более точный) способ определения значений оце- нок щ коэффициентов модели (4.55) с лаговой независимой перемен- 165
ной с использованием подхода Ширли Алмон заключается в том, что зависимость J{i)=ai аппроксимируется интерполяционной формулой Лагранжа. Согласно этой формуле в произвольной точке и^, находя- щейся внутри интервала (uq, Ur), значение многочлена Дм) степени г однозначно определяется по известным его значениям J{uq), Д мО,..., fiur) в r+1-й точках этого интервала мо» wi,..., Ur согласно следующему выражению: f(u )= /(wo) + (mq -WiKmq -M2)...(mo -"r) ■ ("'-"o)(«'-«2)-(«'-«.) ^(„^)^ (470) (wi-Wo)(wi-M2)...(wi-M^) /Ю- Если в качестве «^рассматривать значения м, равные 0,1,..., «, находя- щиеся в интервале (мо, щ), то при известных точках мо, wi,..., м^ и значени- ях функций Дмо), Лwi)v»^Mr) в этих точках с помощью вьфажения (4.67) несложно определить оценки ао=ДО), ai=/(l),..., я„ =/(«) коэффициентов модели (4.55) с лаговой независимой переменной. Подставив (4.68) вместо коэффициента л/, /=0,1,..., п в модель (4.55), получим yt = [boo • Д"о)+^10 • Д"1) +...+^ю • Д"г)] • ^/ + + [box • Дмо) + feu • ДмО +...+6г1 -Дм,)] • х,_1 + + [Ьоп 'Я^М^^Ьхп • ДмО -Н...+ Ьт • ДМг)] (4.71) Перепишем модель (4.71), выделив коэффициенты / (м,), у=0,1,..., г. Получим >'/ = ДЦ)) • [^00 • ^Г + ^01 • -^/-1 +.-.+ Ьоп • Xt-n\ + + Д"1) • [^^10 -Xf^bn- Xt.i +...+ bin ' Xt-n] + (4.72) Из (4.72) непосредственно вытекает, что новые факторы Zjt, у=1,2,..Д определяются как линейные комбинации лаговых переменных дс/_„ /=0,1,..., п. В частности, Zu = boo- Xt-\- boi ' Xt-\ +...+ bon ' Xt-n^ Zlt -bxo'Xt-^bxx- Xt-\ +...+ Ъхп ' Xt-n\ (4.73) Zkt = */0 • ^r + br\ • Xt-\ +...+fern • Xt-n\ fc = r+l. 166
Неизвестные коэффициенты fiuo)=cu Л"1)=С2,..., Л^г)=сь к=г+1; не- сложно определить как оценки коэффициентов эконометрической модели (4.58) с помощью обыкновенного МНК. Заметим также: если в интерполяционной формуле Лагранжа (4.70) вы- брать мо=0, «1=1,..., то выражение (4.70) окажется тождественным вьфаже- нию (4.64). Это свойство может быть использовано для упрощения расчетов при реализации интерполяционной формулы Лагранжа на практике. На ос- нове более простого вьфажения (4.64) путем подбора вариантов может быть определено оптимальное значение степени г этого многочлена, которая за- тем используется в более точной, но и более громоздкой формуле Лагранжа. Подход Ширли Алмон легко распространяется и на модели с несколь- кими лаговыми независимыми переменными. В этом случае аппроксими- рующие формулы (4.64) и (4.70) применяются для описания функцио- нальной зависимости коэффициентов при лаговых составляющих каждой из переменных раздельно и затем для каждой из них формируются свои новые факторы как линейные комбинации этих составляющих. ВОПРОСЫ к ГЛАВЕ IV 1. Опишите процедуру оценки параметров экономерической модели с помощью рекуррентных методов. 2. В чем метода главных компонент? 3. Каковы проблемы использования моделей с главными компонентами? 4. В чем суть метода Ширли Алмон? УПРАЖНЕНИЯ К ГЛАВЕ IV Задание 4.1 Для линейного двухфакторного уравнения регрессии yt =ао-\- aixu + агх^ +^ (г=1,...,Г) имеется следующая таблица данных: ^1/ хъ 1 yt 10 10 26 20 21 44 30 28 29 40 42 90 50 1 49 101 1 Требуется: 1. Определить коэффициент корреляции гп и матрицу (X* 'Х*у\ 2. Провести следующее преобразование факторов: ыи = jci^ и U2t= хи - -X2t И определить коэффициент корреляции гщи)у также матрицу (U V У . 3. Показать, что с точки зрения прогнозирования исходное и преобра- зованное уравнения эквивалентны, т.е. для каждой пары значений экзо- 167
генных переменных (хю, Х2о) дают одинаковые точечные и интервальные прогнозы математического ожидания. Задание 4.2 Имеется линейное двухфакторное уравнение регрессии yt =^+ аххи + агхь +6; (^=1,...,Д Требуется: 1. Рассмотреть в общем виде трендовое выравнивание как метод уст- ранения коллинеарности. 2. Показать, что при трендовом выравнивании оценки параметров рег- рессии остаются неизменными. Задание 4.3 Для линейного трехфакторного уравнения регрессии yt =оь+ ах xxt + агхъ + аъ дсзг +^ (г=1,...,Д имеются следующие данные: хи Хъ Xzt 1 ^ 10,3 20,8 4,1 40,0 14,6 28,0 20,3 80,0 11,4 23,0 9,8 55,0 17,1 30,5 8,1 58,0 106 1 21,7 17,7 70,0 1 Требуется: 1. Определить корреляционную матрицу R и содержащийся в этих данных размер коллинеарности как det(/f). 2. Рассчитать размер коллинеарности, в случае если из уравнения вы- водится переменная хъ 3. Учесть дополнительную внешнюю информацию, что a\=l,5a2ii оп- ределить размер коллинеарности в этом случае. 4. Построить точечный прогноз математического ожидания целевой переменной уо для значений экзогенных переменных (хю, JC20, л:зо)'=(8,0; 16,0; 6,0У а) при использовании исходного уравнения; б) при отбрасывании из уравнения экзогенной переменной Х2\ в) при использовании внешней информации из п.З. Задание 4.4 Для линейного трехфакторного уравнения регрессии yt =ао+ ах xxt + агхъ + a^x^t +£^ (г=1,...,Г) имеются данные из задания 4.3. 168
Требуется: 1. Определить гребневые оценки параметров для гребневой констан- ты, равной 0,5 и 0,8. 2. Построить точечный прогноз математического ожидания целевой переменной уо для значений экзогенных переменных (д^ю, X2o, ^зо)'=(8,0; 16,0; 6,0У по обоим оцененным уравнениям. Задание 4.5 Для линейного трехфакторного уравнения регрессии yt =Qb+ (Xixu + a2X2t + a3X3t ^St (t=h...J) имеются данные из задания 4.3. Требуется: 1. Оценить уравнение с помощью метода главных компонент, если известно, что первые две главные компоненты учитывают 98,97% изменчивости матрицы факторов и формируются следующим обра- зом: 1^0,126867 0,563290 ^ Z=X'b = X-\ 0,233389 0,783052 [о,964071 -0,263691^ 2. Построить точечный прогноз математического ожидания целевой переменной уо для значений экзогенных переменных (хю, хго. ^зоУ=(8,0; 16,0; 6,0У. Задание 4.6 Для линейного уравнения с лаговыми независимыми переменными yt =GoXt + ai xt.i + агх,.2 +... +^ Г^=1,...,Г) имеются следующие данные (см. табл. 4.1). Таблица 4.1 Хх Ух Хг \ Ъ 10 — 22 22 18 _ 25 23 18 — 27 24 16 — 27 26 18 — 30 27 20 18 28 28 24 20 32 30 24 21 32 31 20 22 30 31 ~~1\ 1 23 - 1 - 1 Требуется: 1. Оценить параметры уравнения с помощью метода Ш. Алмон, если максимальный лаг равен 5, а порядок аппроксимирующего многочлена - 3. 2. Построить ретроспективный точечный прогноз целевой перемен- ной у,. 169
ГЛАВА V Методы оценки коэффициентов моделей с лаговыми зависимыми переменными 5.1. ПРОБЛЕМЫ ПОСТРОЕНИЯ МОДЕЛЕЙ С ЛАГОВЫМИ ЗАВИСИМЫМИ ПЕРЕМЕННЫМИ Общий вид линейной эконометрической модели с лаговыми зависи- мыми переменными может быть выражен следующим уравнением: Уг = аь + aixu + ... + о^ш + j3\yt-\ + Ду/-2 + ... + /bt-k + ^, (5.1) где аь,..., Опу Д,..., Д - коэффищ1енты модели; хи,.., х„, >'г_,,у=0,1,..., к - пе- ременные модели, St - ошибка. Из выражения (5.1) непосредственно вы- текает, что в состав независимых (объясняющих) переменных входят за- паздывающие по отношению к текущему периоду t значения зависимой переменной у, т.е. y,_i, у,_2,..., yt-k- Необходимость их включения в правую часть модели часто определяется специфическими свойствами исследуе- мого процесса, например, его инерционностью. Это свойство достаточно характерно для процессов миграции, динамики спроса, финансовых пока- зателей, выпуска продукции. Так, уровень миграции из региона / в регион j в году t в определенной степени зависит от аналогичного показателя прошлых лет, т.е. г-1, г-2,..., поскольку ранее переехавшее в региону на- селение передает в регион / информацию об условиях жизни на новом месте. При положительной информации следует ожидать роста миграции, при отрицательной - уменьшения. Однако в том и в другом случае при- рост потока мигрантов зависит от уровня информированности населения региона / об условиях жизни в регионе у, который в свою очередь связан с количеством ранее переехавших. Аналогично, уровень спроса на какой-либо товар в период t в опреде- ленной степени зависит от числа лиц, купивших его в прошлые периоды. Они распространяют ршформацию о потребительских свойствах товара, объем которой находится в прямой зависимости от числа продаж в про- шлом. В такой ситуации при положительной информации можно ожидать роста спроса, при отрицательной - его снижения. 170
Примерно такие же взаимосвязи между соседними временными значениями зависимой переменной имеют место и среди финансовых показателей - стоимости курсов акций, контрактов и т.п., текущий уровень которых находится в зависимости от предшествующих его значений. В исследованиях закономерностей динамики выпуска продукции включение в правую часть эконометрической модели лаговой зависимой переменной целесообразно в ситуациях, когда продукция прошлого пе- риода хотя бы частично используется в производственном цикле текуще- го периода. Появление лаговых значений зависимой переменной в правой час- ти эконометрической модели часто значительно ослоэюняет про- блему получения несмещенных и эффективных оценок ее парамет- ров. Это моэюет произойти из-за воздействия целого ряда обстоя- тельств. Во-первых, наличие нескольких лаговых переменных у,.;, у/_2,... зачас- тую имеет своим следствием плохо обусловленную матрицу XX по при- чине достаточно сильной автокорреляционной зависимости меэюду со- ответствующими ее столбцами. Этот факт, как и в моделях с лаговыми независимыми переменными, ведет к потере качества модели вследствие ухудшения точности оценок ее параметров, снижению их эффективности и устойчивости к незначительным колебаниям исходной информации, ошибкам округления. Во-вторых, для подобного рода моделей характерной чертой являет- ся существование сильной корреляционной зависимости меэюду перемен- ными yt-i, yt-ъ ••• W ошибкой St, что, в свою очередь, ведет к появлению смещения в оценках их параметров при использовании МНК в силу нару- шения условия (2.23). В-третьих, временной ряд ошибки модели £t часто характеризуется наличием автокорреляционной связи, вследствие чего оценки параметров модели, полученные непосредственно на основе МНК, являются неэф- фективными. Проблемы оценки параметров модели (5.1), обусловленные плохой обратимостью матрицы {Х'Х), могут быть решены рассмотренными в главе IV способами, поэтому в данном разделе им уделять особое внима- ние не будем. Рассмотрим подробнее причины появления двух других проблем. Для этого обратимся к модели с лаговыми независимыми переменными, рас- смотренной Койком. Эта модель имеет в большей степени теоретическое значение, поскольку в ней используется достаточно жесткое предположе- ние о соотношении коэффициентов при лаговых переменных и не огово- 171
рено их количество. Модель Койка представим в виде следующего урав- нения: у, = аы^, + аххг-х + OiXt-i + ... + Et. (5.2) Предположим, что коэффициенты уравнения (5.2) одного знака и их сумма конечна. Тогда выражение (5.2) можно переписать в более ком- пактной форме, используя для этой цели оператор сдвига D, С его помо- щью одноименные переменные, рассматриваемые в разные периоды вре- мени, приводятся к одному периоду. Например, DjCr=jC/_i, d\, =л:,_2, D~ Xt- i=Xt и т.д. С учетом оговоренных условий выражением (5.2) может быть представлено в следующем виде: yt = л(^ + Л^ + nD^ + '-)xt + St, (5.3) где а - общий множитель коэффициентов модели (5.2), выбранный таким образом, чтобы сумма коэффициентов }[ равнялась единице, т.е. £г/=1. (5.4) /=о Койк рассмотрел случай, когда веса л находятся в зависимости, соот- ветствующей убывающей геометрической прогрессии. В этом случае все их можно выразить с помощью одного показателя согласно следующему выражению: r,=a-J3W,0<fi<l, (5.5) В этом случае выражение (5.3) преобразуется в уравнение следующего вида: где^—= 1 + уаО + /?2£)2 + Используя свойства оператора сдвига D, выражение (5.6) можно пере- писать в следующем виде: у, = а(1 - fi)xt + J3 у,_1 +е,- /Je^.i. (5.7) С одной стороны, выражение (5.7) вьп^лядит намного проще исходного уравнения (5.2). Оно содержит всего два неизвестных коэффициента а и Д С другой стороны, при их оценке отчетливо проявляются две послед- ние из трех рассмотренных вьипе проблем. Ошибка модели Ur=£f-je€t-i коррелирует с лаговой переменной y,_i, по- скольку yt-\ и St-i корреляционно взаимосвязаны. 172
Легко также показать, что ошибка модели щ имеет нулевой коэффи- циент автокорреляции первого порядка даже в том случае, если процессы St и et-\ независимы. В самом деле, математическое ожидание ошибки ui=erfiet.\ равно нулю A/[w/]=M^]-/^^-i]fO, а дисперсия определяется следующим вьфажением: = (Ufi^)M[e,^Ml-^fyc7e\ (5.8) поскольку Л/[ад_1]=0 в силу независимости значений ошибок St и € t-u /=1,2,.... Ковариация ошибок w, и M/_i определяется согласно следующему вы- ражению: cov(w,, Ut.i)=M[€,-/k,.u St-x -ya^-2]=M^-i]'=-M^ (5.9) что опять же вытекает из независимости значений ошибок £^, £^_i и £^_2. Таким образом, коэффициент автокорреляции первого порядка ошиб- ки Ut оказьшается отличным от нуля: а ковариационная матрица ошибки щ определяется следующим выраже- нием: (х+р^ -J3 О О ... о ^ СоНщ) = с7Ц -Р \^Р^-Р0 ... О I (5.11) [о 0 0 ...-р\+р^) к модели типа (5.7) приводятся, например, так называемые модели ожиданий, в которых текущее значение зависимой переменной yt связы- вается не с реальным уровнем независимого фактора jc„ а с его ожидае- мым значением Xt. Такое предположение может быть использовано, на- пример, в моделях миграции, когда в качестве фактора Xt рассматривается соотношение между условиями проживания в регионах / и j в году t. То- гда поток мигрантов из /-го в j-м регион может быть связан с ожидаемым изменением этих условий. Их количественные характеристики в реально- сти на практике измерить не представляется возможным. Вследствие это- го модель целесообразно построить с учетом предполагаемых принципов формирования этих ожиданий. В качестве одного из них часто рассмат- ривается принцип адаптивности ожидания, который формально может быть записан в следующем виде: ^/*-^м=Г(^/-^м)' 0<у<1. (5.12) 173
Выражение (5.12) отражает тот факт, что ожидаемое изменение фак/ тора рассматривается как некоторая часть от изменений его реальной ве- личины по сравнению с ожиданиями предыдущего периода. Это дает возможность использовать в эконометрической модели наблюдаемую ре- альную переменную jc, вместо гипотетической Xt. Таким образом, если исходное уравнение модели было сформировано в виде уравнения yt=f(z)-^cvcU+€,, (5.13) где через Дг) выражены все остальные независимые факторы, то с учетом (5.12) его можно переписать как >',=/(г)+-^д:,+^,, (5.14) где JC, представляет собой уже реально измеряемую переменную. Второе слагаемое в правой части модели (5.14) было получено путем преобразования соотношения (5.12), результатом которого является вы- ражение ожидаемого уровня переменной jc, через ее реальное значение л:,. Для этого сгруппируем все ожидаемые переменные в левой части, а ре- альные - в правой. Получим (l-(\-r)D)x;=rx,, (5.15) где D - уже известный оператор сдвига, а J3=l-y: Подставив правую часть выражения (5.15) вместо переменной Xt в уравнение (5.13), получим модель в форме (5.14). Умножим левую и правую части модели (5.14) на (1-J3D) и перегруп- пируем вновь получившееся уравнение, выделив в левой части зависи- мую переменную yt. В результате получим следующее выражение исход- ной эконометрической модели (5.13) с ожиданиями: y, = (l-^)-J{z)-^a(l^/i)x,-^/iy,., + £,-j38r.i. (5.16) Несложно заметить, что модель (5.16) по своим свойствам аналогична выражению (5.7). Для нее характерными чертами тоже являются наличие корреляционной зависимости между значениями ошибки Ut=£rfi£t-\ и Ut-\-€t-\-/i8t-2 и переменной правой части >',_i и ошибкой w„ что осложняет проблему оценки ее коэффициентов. Заметим также, что если функция j{z) содержит временные переменные, то с учетом действия оператора D в 174
выражении (5.16) необходимо использовать их сдвинутые назад на один период значения. Вместе с тем, не все модели с лаговыми зависимыми переменными обладают этими неудобными с точки зрения оценки их параметров свой- ствами. Например, они отсутствуют в моделях частичной корректировки, связывающей оптимальное значение зависимой переменной yt с уровня- ми определяющих ее факторов х/^, /=1,2,..., л. y*=%+aiX^j-\-... + a^x^^+£^. (5.17) В качестве такой переменной У( может выступать объем производства какого-либо товара, который зависит, с одной стороны, от внутрипроиз- водственных факторов (финансовых, материальных, трудовых ресурсов и т.п.), а с другой — от уровня рыночного спроса на этот товар. При изме- нении, например, спроса предприятие не в состоянии быстро скорректи- ровать производственную программу. В результате текущий уровень производства >^/ будет отличаться от оптимального д'^. Это различие мож- но отобразить с помощью корректирующей функции следующего вида: yt'yo-^ = r(/t-yt-i) + ^t^ (5.18) где а- корректирующий множитель, (К;<1; ^, - случайная ошибка. Из выражения (5.18) непосредственно следует, что у:=-У,+—У,-1+—- (5.19) У У а Подставив (5.19) в (5.17), получим следующий вид эконометрической модели с лаговой зависимой переменной: у,=а^у+ a^rxi, +... + а„ух„,+(1- r)y,_i +е,+ ^[. (5.20) где^;=^. Выражение (5.20) очень похоже на модель (5.7), отражающую схему Койка, и на модель адаптивных ожиданий (5.16). Однако в связи с тем, что ошибка uf=-e(\-^\ в (5.20) имеет достаточно простой вид (она равна сумме двух независимых одновременных ошибок и, очевидно, обладает «оптимальными» для МНК свойствами (2.20)-(2.24)), априорно нет ос- нований предполагать, что при определении параметров этой модели мо- гут встретиться сложности, вызванные автокорреляцией ошибки или смещенностью оценок. Разнообразие типов взаимосвязей между значениями ошибки и незави- симыми факторами в моделях с лаговыми зависимыми переменными не по- зволяет сформировать единый метод оценки их параметров. В следующих 175
разделах будут рассмотрены наиболее часто используемые подходы к полу- чению таких оценок, учитьшающие специфику рассматриваемых моделей. 5.2. ОСНОВНЫЕ ПОДХОДЫ К ОЦЕНКЕ КОЭФФИЦИЕНТОВ ЭКОНОМЕТРИЧЕСКОЙ МОДЕЛИ, СОДЕРЖАЩЕЙ ЛАГОВЫЕ ЗАВИСИМЫЕ ПЕРЕМЕННЫЕ Из материала предыдущего раздела вытекает, что эконометрические модели, содержащие в правой части лаговые зависимые переменные, не- однородны по своим свойствам. В основном это обусловлено появлением специфических свойств у ошибки модели, выражаемых через особенно- сти ее автокорреляционной функции и корреляционных взаимосвязей с независимыми (лаговыми) переменными. В литературе, посвященной проблемам эконометрического моделирования, выделяют три основных варианта возможных свойств этой ошибки. Вариант 1. Ошибка модели St по своим свойствам является стацио- нарным процессом второго порядка с нулевым математическим оэюида- нием, постоянной дисперсией и нулевыми автокорреляциями всех поряд- ков. Это означает, что ее ковариационная матрица удовлетворяет со- отношению Cov{e)=(JeE. Как следует из раздела 2.1, это предположение позволяет использовать для оценки параметров модели (5.1) обыкновенный МНК, если только не возникает сложностей с обращением матрицы (JCX) и возможным появ- лением смещения у получаемых оценок из-за наличия корреляционных взаимосвязей между некоторыми независимыми факторами - лаговыми переменными и ошибкой. Эти взаимосвязи могут быть обусловлены тем, что переменная yt может иметь сильную автокорреляционную зависи- мость (может быть даже только первого порядка). В результате этого столбцы матрицы (Х'Х), сформированные рядами yt-\ и ^,_2, yt-i и yt-ъ и т.д., будут характеризоваться сильной корреляционной взаимозависимо- стью, следствием которой является плохая ее обратимость. Этот негатив- ный эффект часто проявляется, когда число лаговых переменных не меньше двух. При этом обратимость матрицы (JCX) ухудшается с ростом числа таких переменных. Смещенность оценок может иметь место даже при единственной лаго- вой переменной yt-\. Причем в малых выборках, т.е. при небольшом ко- личестве измерений Г, она усиливается. Дело в том, что поскольку корре- ляция между зависимой переменной yt и ошибкой Et достаточно значи- тельная, то в условиях сильной автокорреляционной зависимости между рядами yt и yt-\ будет наблюдаться и значительная взаимосвязь между ря- дами >^,_i и £}, т.е. Соу(у/_ь ^)^. 176
Вместе с тем, оценки коэффициентов модели (5.1), получаемые с помощью обыкновенного МНК, являются эффективными в силу вы- полнения условия Соу(€)=(7^Е. Поэтому на практике все же рекомен- дуется при их получении использовать именно этот метод (или его мо- дификации, позволяющие смягчить проблему плохой обратимости матрицы (ХХ)'^), мирясь со смещением оценок параметров, тем более что с ростом числа измерений величина смещения обычно стремится к нулю. Вариант 2. Ошибка модели является аддитивной функцией текущего и предшествующего значений «белого шума» как это имеет место в вы- раэюениях (5,7) и (5.16). Представим такую функцию, как и в разделе 5.1, в следующем виде: u^St-PSt-u (5.21) где Р - априорно неизвестный коэффициент, 0<уй<1, Et - значение слу- чайного процесса типа «белого шума» с нулевым средним, конечной дис- персией и нулевыми коэффициентами автокорреляции, начиная с перво- го. В разделе 5.1 было отмечено, что в этом случае ковариационная мат- рица ошибки модели щ отлична от диагональной, т.е. Cov(i/)?t<j^ Е. Ее вид определен выражением (5.11). Вследствие этого применение обыкновен- ного метода наименьших квадратов при определении параметров такой модели ведет к получению неэффективных оценок. Вторая проблема, которая также имеет место в этом случае, за- ключается в том, что обыкновенный МНК дает смещенные оценки параметров модели в силу наличия корреляционной взаимосвязи ме- жду переменной yt-\, входящей в правую часть модели, и одновре- менной составляющей ошибки еt-\. Напомним, что вследствие такой зависимости математическое ожидание ошибки вектора а, опреде- ляемой выражением ha^iX'Xy^X'u, не равно нулю, а является функ- цией от ковариации столбца ,Vr-b входящего в матрицу X, и столбца £,_1, поскольку в силу отмеченной зависимости Coy{yt-u £ г-О'^О (см. раздел 3.3). Величина смещения оценки параметров оказывается тесно связанной с составом и количеством независимых переменных, входящих в правую часть эконометрической модели. Результаты эконометрических исследо- ваний этой проблемы подтверждают, что присутствие в модели несколь- ких лаговых зависимых переменных, т.е. yt-\, Уг-2^ yt-^— усиливает смеще- ние оценок ее параметров и, наоборот, присутствие независимых пере- менных x\t, хгь'*' способствует уменьшению абсолютных величин смеще- ний оценок. 177
в общем случае проблема смещения оценок оказывается сложнее^ чем проблема потери этими оценками свойства эффективности. Для ее реше- ния обычно рекомендуется использовать подход, связанный с заменой в матрице X столбцов значений факторов, вызывающих смещение, на столбцы значений так называемых инструментальных переменных (см. раздел 3.3). Инструментальная переменная Zr, замещающая в эконометрической модели фактор, коррелирующий с ошибкой, должна обладать следующи- ми двумя свойствами. Во-первых, она должна иметь сильную корреляци- онную связь с заменяемым ею фактором, и, во-вторых, быть слабо свя- занной с ошибкой модели щ. Для моделей типа (5.7) и (5.16), например, необходимо найти инструментальную переменную, замещающую лаго- вый фактор yt-u т.е. переменную Zt-u обладающую двумя отмеченными свойствами. Проблемы использования инструментальных переменных при оценке коэффициентов эконометрических моделей рассмотрены в разделе 3.3, а также в главе VIII. Проблема получения эффективных оценок коэффициентов моделей с лаговыми зависимыми переменными типа (5.7) и (5.16) при известном значении коэффициента Д а следовательно, и корреляционной матрице вектора ошибки м^, определенной, исходя из выражения (5.11), как д = 1 fi О l + yff^ 1 о О о о fi 1+/?^ 1-h/?^ 1 l+fi^ р 1-ьД2 (5.22) могла бы быть решена с использованием обобщенного МНК. Однако на практике значения Д а следовательно, и значение Я = Р1 = -Р , характеризующее коэффициент автокорреляции ошибки 1+Д2 щ, является неизвестным. Очевидно, что для модели (5.7) и (5.16) оно удовлетворяет соотношению -1/2<Д<0. В этом случае для оценки параметров этих моделей можно предло- жить один из подходов, связанных с использованием двухшагового МНК, которые были рассмотрены в главе Ш. 178
Вариант 3. Значение ошибки модели в момент t оказывается связан- ным со значением в момент t-L Иными словами, ряд ошибки модели Et удовлетворяет следующему соотношению: Sr^pst-x+^t. (5.23) где |/7|<1и^,~М0, стЛ Этот вариант не вытекает из рассмотренных в главе V моделей. Одна- ко он достаточно часто встречается в практических исследованиях (см. раздел 3.1). Проблемы оценки параметров моделей с лаговыми зависимыми пере- менными при условии (5.23) возникают вследствие совместного действия двух причин - наличия корреляционной связи между независимым фак- тором yt-\ и ошибкой щ и автокорреляционной зависимостью самой ошибки. Как показано в разделе 3.1 (см. выражение (3.27)), корреляционная матрица вектора ошибки при выполнении условия (5.23) определяется следующим вьфажением: 2^ = л 2 Т-\ \ 1 р р' ... р^ ^ Р 1 р .../-^ J-\ jr-2 Jr-3 1 Даже при известном значении коэффициента автокорреляции р с по- мощью процедур, основанных на использовании обобщенного МНК, можно было бы получить достаточно качественные (эффективные) оцен- ки параметров эконометрической модели (см. раздел 3.2). Однако приме- нение этого метода напрямую приводит к получению смещенных оценок. Наоборот, использование, например, инструментальных переменных (речь идет о замене независимого фактора >',_i на инструментальную пе- ременную Zr-i) , как это было показано выше в этом разделе, могло бы уменьшить или вообще устранить смещение в оценках параметров моде- ли. Но полученные с их помощью оценки не будут эффективными. В слоэюившихся условиях для получения несмещенных и эффективных оценок параметров эконометрической модели с лаговыми зависимыми переменными в качестве универсального подхода рекомендуется доста- точно громоздкая трехэтапная процедура, которая сочетает в себе подходы, связанные с использованием и инструментальных переменных, и обобщенного МНК, Не снижая общности, рассмотрим особенности ее применения на примере достаточно простой модели с одной лаговой пе- ременной yt-\ и независимым фактором х,. Она может быть записана в следующем виде: 179
у, = ао + ai3'/-i + а2Х, + е,; e, = pe,.i + 4t; (5.24) lpl<l;$~yV(0,cT/). 1. На первом шаге этой процедуры с использованием вместо jr-i инст- рументальной переменной Zt можно получить несмещенные оценки ко- эффициентов уравнения (5.24) на основе следующего выражения: a=(Z'X)-^Z'y, где матрицы ZuXимеют следующий вид: (5.25) Z = 1 Zl Х2 Л 1 Zf^i Xj- Х = 1 Уо Ух 1 Ут_^ Xj- Zt-i - значения инструментальной переменной, замещающей лаговую пе- ременную ^'м, /=1,2,... Т. 2. На втором шаге процедуры определяются экспериментальные зна- чения остатков модели (5.24) е, = у,-ао- aiy,-i - oix,. (5.26) На основании ряда е„ /=1,2,... Г можно получить оценку коэффициента автокорреляции ошибки первого порядка р\. Для ее расчета рекомендует- ся использовать формулу, учитывающую поправку на смещение оценки: Г-1 5]^,e,+i/r-i (5.27) г = -£^ г 7=1 3 3. На основании значений г формулируют корреляционную матрицу остатков модели (5.24), которая в данном случае будет иметь следующий вид: 2 2;= г г ^Т-\ ^Т-2 ^Т-Ъ Т-2 1 Вектор оценок коэффициентов модели (5.24) в этом случае определя- ется на основании обобщенного метода наименьших квадратов a^iX'IJ-^-^X'I-^y, (5.28) где матрицах имеет тот же вид, что и в выражении (5.25). 180
Изложенная процедура позволяет получить состоятельные оценки па- раметров модели с лаговыми зависимыми переменными в правой части. Однако нельзя утверждать, что они будут «абсолютно» эффективными, поскольку при формировании матрицы Z использовалась оценка г истин- ного значения первого коэффициента автокорреляции остатков р, кото- рая, в свою очередь, определялась на основе оценок значений ошибки St, т.е. ряда ^^ 5.3. ОСОБЕННОСТИ ИСПОЛЬЗОВАНИЯ ИНСТРУМЕНТАЛЬНЫХ ПЕРЕМЕННЫХ В ОЦЕНКАХ ПАРАМЕТРОВ МОДЕЛЕЙ В научных публикациях можно встретить рекомендации выбирать в л качестве значений переменной (обозначим их как у^_^) расчетные значе- ния переменной у, полученные путем аппроксимации ее исходного ряда на основе использования какой-либо другой эконометрической модели. Иными словами, если имеется возможность построить модель типа yf-m)+^t. (5.29) то в качестве значений инструментальной переменной следует использо- л вать ряд y^_j =/-i(z), где z - набор факторов, входящих в данную альтер- нативную модель, ^t - ошибка этой модели. Здесь следует предостеречь от одной достаточно типичной ошибки, которая часто встречается при выборе состава факторов z. Дело в том. что в некоторых литературных источниках высказываются предложения включать в состав факторов z независимые факторы xi, /=1,2,..., исполь- зуемые в основной модели. Этого делать не следует по той причине, что л полученный ряд y^_j может иметь сильную корреляционную взаимо- связь с теми же переменными jc/, что повлечет плохую обусловленность матрицы {Х'Х) и связанные с ней ошибки в оценках коэффициентов ос- новной модели. На наш взгляд, в отсутствие переменных z вместо модели (5.29) можно использовать временные зависимости yr^J{t\ аппроксимирующие тенден- цию изменения переменной}//. В некоторых исследованиях также удается отыскать инструменталь- ную переменную (обозначим ее как со^, выражающую то же явление и вследствие этого имеющую ту же тенденцию, что и переменная yt, и ис- пользовать ряд C0t-\ вместо ряда yt-\ в исходной модели. Так, если пере- 181
менная yt выражает среднедушевой доход, то в качестве переменной (Ц может быть использован показатель товарооборота на одного жителя и т.п. ВОПРОСЫ к ГЛАВЕ V 1. Какие проблемы возникают при построении моделей с лаговыми переменными? 2. Что представляет собой модель Койка? 3. Перечислите основные подходы к оценке коэффициентов экономет- рической модели, содержащей лаговые зависимые переменные? 4. Каковы особенности использования инструментальных переменных в оценках параметров моделей? УПРАЖНЕНИЯ К ГЛАВЕ V Задание 5.1 Имеется модель с лаговыми эндогенными переменными. Требуется: 1. Представить модель в общем виде в матричной форме записи у=ХО^€ И пояснить специфику матрицы X. 2. Выяснить, какими свойствами должен обладать вектор оценок па- раметров а а = (Х'ХУ^ • Гу. Исходить из гомоскедастичности и отсутствия автокорреляции оши- бок. 3. Дать 3 модели с лаговыми переменными, объясняющие потребление домашних хозяйств. В качестве экзогенной переменной использовать до- ход. Задание 5.2 Имеется модель Койка yt = a+fl^l-Mxt+ ^r-i + Дг-2 + ...) + ^г (О< Г< 1) как частный случай модели с распределенными лагами. Требуется: 1. Показать, что это уравнение является моделью с лаговыми эндоген- ными переменными. 2. Показать распределение лагов для ;^,5 и ;^,8. 3. Определить средний лаг. 182
Задание 5.3 Имеется следующая модель с распределенными лагами: j=0 где£^ 40, О^). Требуется: 1. Определить коэффициенты реакции yt на Xt-j.i для первых трех пе- риодов. 2. Определить веса отдельных Xt-j.i дляу=0,...,2 в распределении лагов. 3. Преобразовать модель в уравнение с конечным числом переменных. Задание 5.4 Связь между ВНП и денежной массой исследуется с помощью сле- дующей модели: yt = c+amt + j3yt-\-^et. Установлено, что St не коррелированы и гомоскедастичны. Получены оценки а=0,3 и 6=0,7. Требуется: 1. Представить исходную модель в виде геометрической модели с рас- пределенными лагами. 2. Определить реакцию дохода в году Го+3, если денежная масса в году Го увеличилась на 1 единицу. 183
ГЛАВА VI Линейные модели временных рядов 6.1. СТАЦИОНАРНЫЕ BPEMEIfflblE РЯДЫ Широкий круг социально-экономических, технических и естественно- научных процессов часто представляется набором последовательных зна- чений показателя уь У2^»'", yh—y Уъ зафиксированных в равноотстоящие друг от друга моменты времени г=1,2,... Г, так что интервал (г, Г+1) явля- ется постоянным. Этот набор значений yt, ^1,2,... обычно называется временным рядом (временной серией). Такой ряд представляет собой дискретный временной процесс. Изменения значений yt во времени в реальной жизни обычно происхо- дят под воздействием каких-либо причин, факторов. Однако в силу их многочисленности, сложности измерения, неразработанности теоретиче- ских предположений относительно взаимосвязей с переменной у и т.п. обосновать и построить «подходящую» для описания процесса;;,, /=1,2,... многофакторную эконометрическую модель классического типа не всегда представляется возможным. В результате в отношении ряда yt часто вы- двигается предположение, что совокупное влияние этих факторов фор- мирует как бы внутренние закономерности в развитии процесса >»,, что да- ет возможность применить для его описания эконометрическую модель из специфического класса моделей временных рядов. Модели временных рядов активно применяются в исследованиях ди- намики значительного числа реальных процессов различной природы. Они часто используются в исследованиях динамики пассажиропотоков, складских запасов, спроса на различные виды продукции, миграционных процессов в человеческом и биологических сообществах, в радиотехнике, анализе химических процессов, моделировании природных событий: ди- намики числа солнечных пятен, природных катастроф и многих других процессов. Самое широкое применение модели временных рядов нашли в иссле- дованиях финансовых рынков, в анализе динамики финансовых показате- лей, прогнозировании цен на различные товары, курсов акций, соотноше- ний курсов валют и т.п. 184
Пожалуй, общим для всех моделей временных рядов является предпо- ложение о том, что текущее значение процесса yt в значительной степени предопределено его предысторией, т.е. величина показателя у, генериру- ется значениями yt-u yt-i^-" согласно характерным для этого временного ряда закономерностям. Математически это допущение может быть выра- жено след)аощим общим уравнением: yt'='f^yt-\^yt-2^ ...) + ^г' (6.1) где, как и ранее, St представляет собой ошибку модели в момент г. Функция/как раз и выражает характер взаимосвязей, сложившихся в рассматриваемом временном рядуд^/, Г=1,2,... . При удачном подборе этой функции правая «детерминированная» часть выражения (6.1) бу- дет в некотором смысле «близка» к реальным значениям этого ряда. Как и ранее, «степень близости» обычно устанавливается по характе- ристикам и свойствам ряда ошибки St, г=1,2,... Здесь имеется в виду прежде всего минимальная дисперсия, соответствие «белому шуму» и т.п. Для широкого круга процессов функция / имеет линейный вид. На- пример, yt = a\yt-\ + ... + ariyt-n + £f Вопросы построения линейных моде- лей временных рядов и анализа их основных свойств и будут рассмотре- ны в данной главе. Линейные модели временных рядов применяются, как правило, для описания стационарных процессов. При этом обычно имеются в виду стационарные процессы второго порядка. Напомним, что стационарный процесс /1-го порядка характеризуется постоянными значениями всех своих моментов порядка п и ниже на всех временных отрезках, входя- щих в интервал /==1,2,..., Т. У строго стационарных процессов постоян- ными являются моменты всех порядков. Таким образом, для любых двух интервалов времени (Гь Гг) и (Гз, Т^) для стационарного процесса второго порядка yt должны выполняться условия, характеризующие ра- венство на рассматриваемых интервалах математических ожиданий, дисперсий и однопорядковых коэффициентов автокорреляций иссле- дуемого процесса. На практике это означает, что для соответствующих оценок перечисленных показателей должны иметь место следующие со- отношения: т. ,. т. = У2\ (6.2) = D2(y); (6.3) 185 Vi = 1 -I f=T, I- t=r, ^ (yt- b' yt 2-Tx -y)\ -n = I /=Гз Та = I- Г=Гз yt _ T^- iyt- 'A- -h -y)' -h
' ,Тт, (Тг -Тх -/)• D(y) ,5i (7^4 -7-3 -О• ^(У) ' ' 1 = 1.2...., где У1 и У2 - оценки математических ожиданий; D\(y) и ОгСу) - оценки дисперсий; г/ и г, - оценки коэффициентов автокорреляции /-го порядка процесса}^/ на 1-ми на 2-м интервалах соответственно; у - среднее зна- чение процесса (оценка математического ожидания) на интервале (1,7); D{y) - оценка дисперсии процесса на интервале (1,7). Заметим, что на практике равенства (6.2)-(6.4) рассматриваются в статистическом смысле. Иными словами, например, равенство у^ = У2 может в точности не выполняться. Однако гипотеза о постоянстве ма- тематического ожидания процесса yt может быть принята, если значе- ния У1 и У2 удовлетворяют соответствующему статистическому кри- терию. Для проверки соответствия реального временного рядад^,, г=1,2,... ста- ционарному процессу, т.е. для проверки вьшолнимости условий (6.2)- (6.4), обычно используются соответствующие тесты. При этом в некоторых случаях при проверке одного и того же условия возникает необходимость применять несколько тестов, если по результатам одного теста нельзя вывести суждение о безусловной истинности или ложности выдвинутой гипотезы. Все множество таких тестов разделяется на три основные группы: непараметрические, полупараметрические и параметри- ческие тесты. Непараметрические тесты не выдвигают заранее каких-либо сведе- ний о законе распределения тестируемого временного ряда, его пара- метрах. Они исследуют взаимосвязи мелсду порядками следования обра- зующих его значений, выявляют наличие или отсутствие закономерно- стей в продолэюителъности и (или) чередовании их серий, образованных, например, последовательностями единиц совокупности с одинаковыми знаками, сменой знаков у этих единиц и т.п. Полупараметрические тесты обычно используют относительно сла- бые предполоэюения о характере распределения значений временного ря- да. Они, например, относятся к общим свойствам функции распределе- ния приростов значений ряда — симметричности, располоэюения кван- тилей. Оценки параметров распределения в таких тестах определяются по порядковым статистикам: среднее — по медиане, среднеквадратиче- ское отклонение - по размаху (абсолютной разнице между наибольшим и наименьшим значениями ряда) и т.п. 186
Параметрические тесты применяются при относительно строгих предполоэюениях относительно законов распределения временного ряда, его параметров. Они, как правило, оценивают меру близости меэюду эмпирическими характеристиками распределения временного ряда и их теоретическими аналогами. На основании величины этой меры дела- ется вывод о целесообразности принятия или отвержения гипотезы о соответствии свойств рассматриваемого ряда стационарному про- цессу. Рассмотрим некоторые достаточно часто используемые на практике тесты на стационарность более подробно. 6.1.1. Параметрические тесты стационарности Из определения стационарного процесса второго порядка, формализо- ванного с помощью выражений (6.2)-(6.4), непосредственно вытекает, что очевидными параметрическими критериями при проверке реального процесса на стационарность являются критерии Стьюдента и Фишера. Они могут быть использованы для проверки гипотез о постоянстве на рассматриваемом интервале ^=1,2,..., Г математического ожидания, коэф- фициентов автокорреляции и дисперсии. Эти критерии применяются в предположении о нормальном законе распределения как значений вре- менного ряда yt, так и его выборочных параметров, что является спра- ведливым для многих реальных процессов. Тестирование математического омсидания Общий тест процедуры проверки гипотезы о постоянстве математиче- ского ожидания может быть организован следующим образом. Интервал времени (1,7) (и, соответственно, временной ряд>;„ r=l,2,...J) разбивается на две части, не обязательно одинаковые по количеству содержащихся в них значенийу„ с количеством наблюдений Т\ (Г=1,2,..., Т\) и Г2(^Г1+1,..., 7), T2=T-Ti, Для каждой из частей определяются оценки yi и s\ , У2 ^ S2 - выбо- рочных математического ожидания и дисперсии переменной ;;, соответст- венно. Далее рассчитывается значение критерия Стьюдента по формуле г = -р=—fL=, (6.5) если предполагается, что значения дисперсий на этих участках не равны между собой, т.е. а\^ Ф Gi, и по формуле 187
l^J^^^, (6.6) если Oi^ = 02^ = o^. Если оказывается справедливым неравенство r<r*(;7*,v), (6.7) где р* - заданный уровень доверительной вероятности (р*=0,95; 0,97...); v=Ti+T2-2 - число степеней свободы; T*(p*,v) - 1фитическое значение критерия Стьюдента, соответствующее значениям р* и v, то гипотезу о постоянстве математического ожидания процесса yt целесообразно при- нять. Вероятность ошибки такого решения при этом составляет 1-р*, В противном случае, т.е. при t>T*(p*,v), эта гипотеза отвергается. В принципе для большей достоверности вывода о постоянстве мате- матического ожидания временного рядад^^, ^1,2,...,Г интервал наблюде- ний может быть разделен на несколько частей (если количество наблюде- ний достаточно велико). В этом случае проверяется гипотеза о равенстве оценок средних значений ряда, рассчитанных на этих частях. Для этих целей часто используется критерий Фишера. Его расчетное значение в данном тесте определяется как отношение взвешенной суммы квадратов отклонений этих оценок от средней временного ряда в целом к средней дисперсии временного ряда: 1 А^ ,_ ,,2 "LTjiyj-yy '^"•i /=i F= Ц , (6.8) где n - число частей разбиения интервала (1,7); 7) - число измерений пе- ременной д^, нау-й части; 7=1,2,.-., п; у - среднее значение временного ря- да в целом; J^(n) - средняя дисперсия, значение которой рассчитывается на основании следующей формулы: sHn)=~t(Tj-l)-jJ, где J? - дисперсия, рассчитанная нау-й части интервала (1,Т), Если оказывается справедливым соотношение F<F(p*,v/i,v/2), (6.9) где F(p*,VuV2) - табличное значение критерия Фишера для уровня дове- рительной вероятности р* и числе степеней свободы Vi=n-\, У2=Г1+Г2+...+Г„-л, то гипотеза о постоянстве математического ожидания 188
временного ряда на всем интервале (1,1) принимается с вероятностью/?♦. В противном случае она отвергается. Тестирование дисперсии Проверка гипотезы о постоянстве дисперсии временного ряда >'„ t^\,2,„.,T ъ случае разбиения исходного интервала на две части обычно осуществляется с использованием двухстороннего критерия Фишера. Обязательным условием при этом также является нормальный закон рас- пределения значений 3^/. Расчетное значение критерия Фишера определяется по следующей формуле: F=^, (6.10) где ^1 и ^2 - оценки дисперсии ряда на первой и второй частях соответст- венно с числом измерений Т\ и 72. Если для заданного уровня доверительной вероятности/?♦ оказывается, что значение F удовлетворяет неравенству ^^.Vi.V2^ <F<^il£l,vi,V2 \ (6.11) J ТО гипотеза о постоянстве дисперсии временного ряда может быть приня- 9 9 9 та, т.е. предположение о том, что s\ =S2 =а является обоснованным с ве- роятностью/7*. В выражении (6.11) значения F| —^^VpVj и F —^^VpVj явля- ются табличными (левосторонним и правосторонним) значениями крите- рия Фишера, соответствующими вероятности ошибки второго рода —— с числом степеней свободы v^ =Ti-l и v^ =Г2-1. Заметим, что эти значения удовлетворяют следующему соотношению: f(^,v.,v,] = 1/f[1^.v,.v; (6.12) Вследствие этого на практике обычно проверяется только соотноше- ние F <F\ .Vi,V2 У (6.13) 189
при условии, что ^-i^ > зг. При средних (40<Г<100) и больших (7>100) объемах временного ряда вместо критерия Фишера для проверки гипотезы о постоянстве его дис- персии рекомендуется использовать стандартизованное нормальное рас- пределение. В первом случае, т.е. при средних выборках, принимается во внимание, что закону M0,1) подчиняется случайная величина, опреде- ляемая как llniL+l(i/v,-i/v2) I si ^ Ф= , ^ =—. (6.14) 7l/2(l/vi+l/v2) Во втором случае (при больших выборках) расчетное значение стан- дартизованной слз^айной величины оценивается следующим образом: 0 = (si-'S2)^sf/27^+5^/272 . (6.15) В обоих случаях, если оказывается справедливым соотношение |Ф|<Ф(р*), (6.16) где Ф(р*) - табличное значение стандартизованного нормального закона, соответствуюш^его доверительной вероятности /?♦, то гипотеза о постоян- стве дисперсии принимается. При разбиении временного ряда;/,, г= 1,2,...,Г на несколько частей («>2) для проверки гипотезы о постоянстве дисперсий может быть использован критерий Кокрена, основанный на распределении Фишера. Он обычно применяется в предположении, что объемы этих частей равны между со- бой, т.е. 7i=72=... =7„-N, Расчетное значение этого критерия определяется по следующей формуле: K = si^/(sf+,.. + s^i), (6.17) где ^тах = niax(5?); / = 1, 2,..., п. J Табличное значение критерия Кокрена, соответствующее заданной доверительной вероятности и числам степеней свободы Vi=n и ^2=2^-1» определяется на основании табличного значения F-критерия следующим образом: K(p,,v^,V2) = ^ ,", ^. (6.18) (n-l) + F|l-i—^,Vi,V2 у 190
- таб- ) ( 1-Р* где р* - уровень доверительной вероятности, F\ 1 »^1»^2 V п личное значение критерия Фишера, выбранное для уровня доверительной вероятности 1 и числа степеней свободы V\^N-\ и V2=(ji -!)• V\, п Если оказывается справедливым соотношение K<K(p.,n,Vil (6.19) то гипотеза о постоянстве дисперсии временного ряда>^„ г=1,2,..., Т при- нимается с вероятностью р*. Здесь следует отметить, что более мощным по сравнению с критерием Кокрена, но и одновременно более чувствительным по отношению к от- клонениям от нормального вида закона распределения значений времен- ного ряда yt, /=1,2,...,Г, является критерий Бартлетта. Этот критерий обычно используется при проверке гипотезы о постоянстве дисперсии нормально распределенного ряда при разбиении на интервале (1,7) на число частей, превьппающее два. Критерий Бартлетта основан на использовании распределения Пирсо- на - 2^^. Согласно этому критерию случайная величина Л, рассчитанная на основе следующего выражения: Я = —Iv.ln^, (6.20) ^ /=1 S 2 распределена примерно по закону ;]^ с п-1 степенями свободы. В выра- жении (6.20) Si, /=1,2,..., п - оценка дисперсии на i-м интервале; п s^ = Z V/5? / Х^/ — средняя дисперсия на п интервалах; v;=r,-l - число степеней свободы на /-м интервале. Величина с рассчитывается согласно следующей формуле: ,. 1 ^ 1 1 с = 1+——-2 3(n-l)Sv,. J^^ При больших значениях v;, с«1. Для частного случая, когда Vi=V2=...=Vn=v и, таким образом, п X;v,=r-/i, /=1 Д = —AZV- С «,=1 (6.21) гдес=1+[(/г+1)ШИ. 191
Если оказывается, что расчетное значение Я не превышает таблично- го значения ^(p*,v), где р* - уровень доверительной вероятности и v=n-\ - число степеней свободы, то гипотеза о равенстве дисперсий 2 2 2 ^1 =5'2 -,..-(! на рассматриваемых частях временного интервала (1,Г), т.е. гипотеза о постоянстве дисперсии временного ряда у„ Г=1,2,..., Т принимается. В противном случае, когда ^х (Р*» " ~1)» эта гипотеза отвергается. Тестирование коэффициентов автокорреляции Теоретически для проверки гипотезы о постоянстве коэффициентов автокорреляции (автоковариации) могут использоваться те же проце- дуры (критерии), что и для проверки аналогичных гипотез для средних (автокорреляция) и дисперсии (автоковариация). Вместе с тем, к ре- зультатам такой проверки следует относиться с определенной осто- рожностью, особенно при использовании критерия Стьюдента. Это обусловлено тем, что дисперсии выборочных коэффициентов автокор- реляции определяются с достаточно большой погрешностью, которая увеличивается с ростом значений самого коэффициента автокорреля- ции. Рост погрешности вызван прежде всего усиливающимися в этой ситуации несимметричностью закона распределения выборочного ко- эффициента автокорреляции и его расхождением с нормальным рас- пределением. Увеличивает погрешность и возрастающая с увеличени- ем значений выборочных коэффициентов автокорреляции ковариаци- онная связь между ними. В частности, Бартлетт показал, что между парами выборочных коэффициентов автокорреляции существует дос- таточно сильная статистическая связь. Ее величина при больших за- держках приблизительно может быть оценена на основании следую- щего выражения: 1 ^^j cov(r^, г^+„) ~ -- X ri г,.+„ . (6.22) где Ki - значений /-го выборочного коэффициента автокорреляции. Наличие такой связи может вносить существенные смещения в оценки значений как самих коэффициентов автокорреляции, так и в их диспер- сии. В общем случае, величина дисперсии коэффициента автокорреляции может быть оценена с использованием формулы Бартлетта: 0(гк) = ^ Ziri" +П^кГ1-к -4г,г^г,_, +2;iV,2), (6.23) 192
где индекс j зависит от длины ряда Г. Его величина определяется требо- ванием статистической достоверности используемых в выражении (6.23) значений коэффициентов автокорреляции, в первую очередь, зна- чений Kj +k. Для реальных временных рядов автокорреляционная функция часто имеет вполне определенный вид. Коэффи1(|иёнть1 автокорреляции могут быть равны нулю после некоторой задержки, т.е. г/=0, i>k, затухать по экспоненте, rjir=rl^. В последнем случае, например, дисперсия первого ко- эффициента автокорреляции может быть определена приблизительно по следующей формуле: D(ri) = l(l-r2). (6.24) Отметим также, что при небольших значениях коэффициента автокор- реляции его распределение является приблизительно нормальным. Его дисперсия в этом случае может быть приблизительно оценена по сле- дующей формуле: ^(r,,)^Ul'^2J:A,k>q, (6.25) где индексы к принадлежат приближающимся к нулю коэффициентам ав- токорреляции после некоторой задержки q. В практических расчетах для этой цели рекомендуется использовать упрощенную формулу дисперсии коэффициентов, имеющую следующий вид: D(rj,)^j. (6.26) Заметим, что выражения (6.25) и (6.26) могут быть применены при оп- ределении значимости (отличности от нуля) коэффициентов автокорре- ляции с использованием критерия Стьюдента. Его значение рассчитыва- ется на основании следующей формулы: гМ. бЛ.2. Непараметрические тесты стационарности Параметрические критерии проверки стационарности достаточно не- удобны в практических исследованиях и весьма ограниченны в примене- нии из-за своих достаточно строгих предположений относительно нор- 7 Эконометрика 193
мальности закона распределения временного ряда yt, /=1,2,... . Они тре- буют значительных вычислений. Вместе с тем, реальные временные рядц?! могут быть распределены по закону, отличающемуся от нормального, и, как это будет показано далее, условие нормальности распределения ряда У( не является обязательным при построении эконометрических моделей, описывающих такие ряды. Вследствие этого на практике при проверке свойств стащюнарности процессов часто используются непараметрические критерии, которые не имеют подобных ограничений по закону распределения временного ряда ytj да и не столь сложны по своим вычислениям. Тест Манна-Уитни (тестированиематематического ожидания) В частности, вместо критерия Стьюдента может быть использован не- параметрический критерий Манна-Уитни (критерий м*). Он чуть слабее критерия Стьюдента в случае временных рядов с нормальным распреде- лением, однако имеет неоспоримые преимущества по сравнению с пара- метрическими критериями в случае, если распределение временного ряда отличается от нормального. Критерий м* применяется для проверки идентичности распределений двух совокупностей (в нашем случае, временных последовательностей одного временного ряда yt, определенных на разных временных частях интервала г=1,..., 7). Предположим, что первая совокупность образована Т\ последователь- ными значениями yt, а вторая - Тг его последовательными значениями, и эти последовательности не пересекаются. Все значения этих совокупностей объединяются в один ряд, в котором они располагаются в порядке возрастания с первого по (Г1+Г2)-й вне за- висимости от принадлежности к той или иной последовательности. Вме- сте с тем в этой единой последовательности символом у^ отметим эле- менты первой последовательности, а символом у^ - второй. В результате формируется структурный временной ряд, состоящий из T\-k-T2 элементов, в котором символы у^ (Т\ элементов) и символы у^ {Тг элементов) оказы- ваются перемешанными между собой. Для сформированного таким образом временного ряда возможно Сг^ ^ различных структур, под которыми понимаются последовательно- сти с различающимися порядками следования элементов из первой и вто- рой совокупностей. Иными словами, структуры, у которых изменились места элементов одной и той же совокупности, различными не считаются. Логика теста состоит в следующем. Если ряд стационарный, то по- следовательности у^ и у^ практически не отличаются одна от другой и 194
их элементы перемешаны между собой. При этом появление каждой из возможных структур имеет равную вероятность. Если же ряд отличает- ся от стационарного, то общая последовательность будет разделена на более или менее однородные массивы, состоящие в основном из единиц той или иной совокупности. Например, элементы совокупностей будут скапливаться на разных концах общей последовательности. Такие структуры в случае, например, увеличивающегося (или уменьшающего- ся) нестационарного временного ряда будут иметь большую вероят- ность появления. Соответствующий тест Манна-Уитни осуществляет проверку гипоте- зы о стационарности временного ряда>'^ на основе расчета статистики м* (значения критерия), представляющей собой число случаев, когда эле- менты из совокупности у^ предшествуют элементам совокупности у^. Иными словами, значение м* равно количеству элементов изу\ предше- ствующих наименьшему по величине элементу из у^, плюс количество элементов из д^\ предшествующих следующему за ним элементу из у^у включая и ранее уже учтенные элементы первой совокупности и т.д., по- ка не будет включено в сумму количество элементов из у , предшест- вующих последнему элементу изу^. На практике значение и* рассчитывается либо через сумму рангов элементов первой совокупности, либо через сумму рангов элементов второй совокупности, с которыми оно связано следующими соотноше- ниями: „.=R,.Ziffi±I). (6.27) „•=Т,Г2-Мк±1>_Я2, (6.28) где Л] и /?2 - суммы рангов элементов первой и второй совокупностей соответственно, определяемых по их общей последовательности. Для средних больших последовательностей (Т>50\ 100) случайная ве- личина и* распределена по нормальному закону с математическим ожи- данием M[M*] = ^l-ii (6.29) и дисперсией * TwWiiZill). (6.30) 12 Таким образом, случайная величина z, определяемая как 7» 195
и —-——±— z = Лг—^.|z| = и —- ±1 — (6.31) tT(M*) ' ' (7(W*) является нормированной величиной с нулевым q)eAHHM и единичной дисперсией, распределенной по стандартизованному нормальному зако- ну. г-Л^(0,1). В формуле (6.31) поправка 1/2 вводится для обеспечения непрерывно- сти величины Z. Она прибавляется, если z<0, и вычитается, при z>0. Таким образом, если обе совокупности идентичны, и их элементы бу- дут перемешаны между собой, то можно ожидать, что значения м* будут находиться недалеко от своего среднего уровня (соответственно, z - око- ло нуля). Гипотеза о стационарности процесса д'^, ^1,2,..., Т в этом случае может быть принята с доверительной вероятностью /?», если будет выпол- нено следующее неравенство Xi^Z<X2, (6.32) где х\ и Х2 определяются из следующего равенства: p{xi ^ Z ^ ДС2) = р* = ](p(x)dx, 1 -^ где ^д;) = -7=гв 2 . л/2л' В частности, при /7*=0,95 расчетное значение z должно находиться в следующем интервале: -1,96^Z^1.96. Тест Сидокела-Тьюки Вместо параметрического критерия Фишера (F-критерия) для провер- ки гипотезы о постоянстве дисперсии временного ряда yt на интервале /=1,2,...,Г может быть использован непараметрический критерий Сидже- ла-Тьюки, который также основан на сопоставлении рангов элементов двух совокупностей из рассматриваемого интервала. Тест проверки этой гипотезы состоит в следующем. Исходный вре- менной ряд yt, /=1,2,..„Г центрируется, т.е. определяются значения о у^ = у^ -у, где у - среднее значение рядад^^ Далее интервал (1,7) разде- ляется на две части (желательно равные), так что на первой из них распо- лагаются элементы первой центрированной совокупности >^\ а на второй 196
- элементы второй совокупности - у". Далее элементы из двух центриро- ванных совокупностей у ^\у объединяются в одной таблице с запомина- нием «своей совокупности» согласно следующему правилу ранжирова- ния. Ранг 1 приписывается наименьшему отрицательному значению, ко- торое располагается на первом месте вверху таблицы. Ранг 2 приписыва- ется наибольшему положительному значению, которое располагается на последнем месте внизу таблицы. Ранг 3 приписывается значению, сле- дующему за наименьшим, которое располагается на втором месте вверху таблицы. Ранг 4 - значению, следующему за наибольшим, которое распо- лагается в таблице на втором месте снизу. Ранг 5 приписывается третьему по порядку наименьшему значению. Оно располагается в таблице на третьем месте сверху. Ранг 6 приписывается третьему по порядку наи- большему значению, которое располагается на третьем месте таблицы снизу и т.д. Таким образом, в таблице номера рангов увеличиваются от краев к центру согласно следующей закономерности: нечетные номера (отрица- тельных элементов) - сверху к центру; четные (положительных элемен- тов) - снизу к центру. Рассчитанная на основе этих рангов случайная величина w* оказыва- ется приблизительно распределенной по нормальному закону с матема- тическим ожиданием, оцениваемым как M[v.*]=^,-Ii:^i|Zi±l) (6.33) И дисперсией D,„-,.IWiOj^. ,6.34) где R\ - сумма рангов элементов первой совокупности у', Г1+Г2 - количе- ство элементов в первой и второй совокупности соответственно. Из выражений (6.33) и (6.34) непосредственно следует, что нормиро- ванная случайная величина z, определяемая как ^ Г1(Г1+Г2+1)^1 г= '. ^ ^. (6.35) Г2(Г1+Г2+1) |7'1Г2(Г1Н i 12 распределена по нормальному стандартизованному закону с нулевым средним и единичной дисперсией. Здесь также поправка 1/2 вводится для обеспечения непрерывности г. Она добавляется при z<0, и вычитается приг>0. 197
Гипотеза о равенстве дисперсий рассмотренных совокупностей при- нимается, если для Z удовлетворяется соотношение (6.32). Сериальные критерии стационарности Для проверки гипотезы о стационарном характере процесса (имеется в виду стационарность второго порядка) могут быть использованы дос- таточно универсальные относительно закона распределения значений рядад',, г=1,2,..., Г непараметрические тесты, основанные на анализе за- кономерностей серий этих значений (сериальные критерии). Необходи- мым условием их применения является достаточно большой объем вре- менного ряда, что позволяет с определенной обоснованностью считать обнаруженные закономерности устойчивыми (характерными для данно- го ряда). При этом серией называют последовательность значений, предшествующая или следующая за некоторым значением, характерный признак которого отличается от признака элементов, входящих в серию. В качестве такого признака часто рассматривается расположение эле- мента последовательности относительно ее медианы. В этом случае се- рии с положительным знаком образуют элементы по уровню выше ме- дианы, и серии с отрицательным знаком - элементы, чей уровень не превосходит медианы. Здесь следует иметь в виду, что один элемент - это тоже серия. Примером сериального критерия является критерий Вальда- Вольфовитца, основанный на подсчете общего числа серий. Среднее зна- чение числа серий определяется согласно следующему выражению: а его дисперсия - согласно формуле 2ЛГ,А^,[2Л^,Л^,-(Л^,^Л^,)]^ (6.37) (A^l+yV2)^(^l+^2-l) где Л^1 - количество элементов с положительным знаком; Л^2 - количество элементов с отрицательным знаком; ЫхЛ-Ыг-Т - количество элементов во временном ряду; Л^^ - число серий. При большом объеме временного ряда Г нормированная переменная z, определяемая как Л^,-М[Л^,]±1 |л^^-М[Л^,]|-1 z = ^, Ы = -, (6.38) a{N,-) I I (7(/V,) распределена по стандартизованному нормальному закону М0,1)- 198
в этом случае для провджи гипотезы о стационарности используется двухсторонний критерий (6.32). 6.1.3. Преобразование нестационарных временных рядов в стационарные Реальные процессы свойством стационарности второго порядка могуг и не обладать. Однако с помощью достаточно несложных преобразований часто удается привести наблюдаемый ряд к стационарному процессу. Примерами таких преобразований являются: а) взятие конечных разностей Xt^^Уt = Уt-Уt-ъ (6.39) Ау/ - первая разность. Это преобразование целесообразно использо- вать, когда закон изменения у, близок к линейному. Zt^^Xt- V V = Xt- Xt-i = Уг - 2уы + Уг-2. (6.40) Ах/ - вторая разность. Преобразование применяется, когда закон изме- нения У/ близок к квадратической зависимости и т.д.; б) логарифмирование цепных индексов х^ = 1п-^ = In yt -In y^_i. (6.41) yt-\ Применяется при экспоненциальном росте;;,, t =1,2,..., Г; в) расчет темпов прироста ;c,=A:i>:-L=J:i-i, (6.42) а также некоторые другие. Заметим, что преобразование (6.41) предоставляет исследователю не- сколько большие «удобства» в формировании исходной информации по сравнению с другими. Это связано с тем, что оно позволяет достаточно просто изменять временные серии исходных данных в связи, например, с укрупнением временных интервалов. В самом деле, предположим, что возникла необходимость проанализировать временные ряды серии удво- енного временного интервала (t-l, г+1), т.е., например, уи Узу Д'з»-., yt-u yt +1,... . Для такой серии преобразование (6.41) приводит к следующему временному ряду: ^ж.2 = ta^^ = In y^+i -In y,_i = yt-\ = In y^+i - In y^ + In y^ - In y^_i = jc^ + Xt^x» (6.43) где Xt^i^ 2 — преобразованное значение показателя на удвоенном интервале. 199
Его величина представляет собой простую арифметическую сумму преобразованных значений показателей исходных интервалов, объедине- ние которых привело к новой серии. В то же время для преобразования (6.42) в этом случае получим более сложное выражение, определяющее для значения нового временного ря- да: yt-i yt-i _^ ^(yM-yt)'yt yt-yt-i = Xf+ Xf+i'(Xf +i)= Xf-\-x^+i + Xt • Xf+i. (6.44) Для превращения исходного нестационарного ряда в стационарный могут быть использованы и другие преобразования. Например, Xt=lnyt, Уг Xf = и т.д. в каждом конкретном случае, выбирая преобразование, yt-i необходимо исходить из примерной формы временного графика зависи- мости yt. «Удачное» преобразование должно обеспечивать приблизитель- ное выполнение условия jCr=y(y/)«const. В условиях постоянства математического ожидания и дисперсии осо- бенности конкретного стационарного процесса второго порядка полно- стью определяются характером его автокорреляционной функции, имеющей вид зависимости значений коэффициентов автокорреляции от сдвига. Иными словами, автокорреляционная функция является дискрет- ной и представляет собой последовательность значений коэффициентов автокорреляции го, п,..., rt_i,..., поставленных в зависимость от сдвига i, где го=1, -1<г/<1, /=1,2,.... Аналогично можно сформировать автоковариационную функцию ста- ционарного процесса >»„ представив ее в виде последовательности коэффи- циентов автоковариаций ;б> Л»—, Tf»—, поставленных в зависимость от сдви- га /. Напомним, что между соответствующими значениями этих функций существует однозначная взаимосвязь }f =ri -ст/, /=0,1,... , т.е. у^^Су, Автокорреляционную функцию можно представить как проекцию диагональных элементов автокорреляционной матрицы на ось сдвигов (см. рис. 6.1). Все множество стационарных процессов второго порядка в общем случае в зависимости от особенностей их автокорреляционных функций разбивается на несколько однородных групп, для каждой из которых можно подобрать и построить адекватную модель. В общем случае можно выделить три группы таких моделей — модели авторегрессии (autoregressive), модели скользящего среднего (moving 200
average) и смешанные модели авторегрессии-скользящего среднего (autoregressive- moving average). Го ri Г2 Гз Г4 Г5 Го 1 0,9 0,6 0,3 -0,2 0,1 г_1 0,9 1 0,9 0,6 0,3 -0,2 г_2 0,6 0,9 1 0,9 0,6 О,: г_з 0,3 0,6 0,9 1 0,9 0,1 г_4 -0,2 0,3 0,6 0,9 1 0,9 Г.5 0,1 -0,2 0,3 0,6 0,9 1 Рис. 6.1. Проекция диагональных элементов автокорреляционной матрицы на ось сдвигов Вопросы их построения рассмотрены в последующих разделах данной главы. 6.2. МОДЕЛИ АВТОРЕГРЕССИИ Использование моделей авторегрессии при моделировании закономер- ностей реального стационарного процесса второго порядка, допускаю- щего представление в виде дискретного временного ряда его значений, основано на предпололсении о том, что текущее значение такого про- цесса моэюет быть выраэ/сено в виде линейной комбинации некоторого количества предыдущих его значений и случайной ошибки, обладающей свойствами «белого шума». Общий вид модели авторегрессии к-то порядка — АР(к) может быть выражен следующим уравнением: yt = CXiyt-i + ^2У/-2 + ... + CXkyt-k + £t, (6.45) где>'/,>^/_/, /=1,2,..., к - значения переменной з^ в соответствующие момен- ты времени; к - порядок модели; аи..., оСк - коэффищ1енты модели; Et - случайная ошибка с нулевым математическим ожиданием, конечной дис- персией и единичной автокорреляционной матрицей, свидетельствующей об отсутствии автокорреляционной связи между рядами ошибки £^, £}_i,..., St^,..., т.е. £^-МО, (j/), Cov(f)=cr/•£. 201
Построение модели АР(к) типа (6.45), адекватной реальному времен- ному ряду уt, Г=1,2,..., Г, предполагает решение двух взаимосвязанных за- дач: определения рационального порядка модели (величины к) и оценки значений ее коэффициентов. Рассмотрим сначала общие подходы к оцен- ке параметров модели типа (6.45). Без ограничения общности будем предполагать, что математическое ожидание ряда yt равно нулю, т.е. Ad\yt ]=0. В противном случае вместо переменной yj в вьфажении (6.45) можно рассмотреть центрированную о о переменную у^., у^-Уг-у^ где у - оценка Л/[у/ ]. Легко видеть, что ^[^,1 = 0. Из выражения (6.45) непосредственно следует, что параметры модели ^1,..., а^ могут быть выражены через коэффициенты автокорреляции. Чтобы показать это, умножим выражение (6.36) под знаком математиче- ского ожидания на переменную >;,_/, /=1,2,..., к. Получим ЩУг' yt-i] = ^lM[yr-b Уы] + ... + OCMyt-k. yt-A + ЩУг-Ь £tl (6.46) где M\yt-b yt-j\ - математическое ожидание произведения двух центриро- ванных переменных yt-i, yt-p представляющих собой их ковариацию ^, на практике оцениваемую по формуле т т Туы'Ум Е>'г\Уг-(/-У) M[y,_,.,y,_;] = -^2ZZ = izb( , (6.47) где r=i-j, / >;. В результате для /=1,2,..., к вместо (6.46) можно записать ;f=ciri;f_i + ... + ^%-i. (6.48) Выражение (6.48) получено в предположении, что M\yt-h ^1=^ ^Р^ '^' так как St - случайная величина со свойствами «белого шума», не имею- щая корреляционной связи с предшествующими моменту t значениями рассматриваемого процесса yt. Разделив левую и правую части выраже- ния (6.48) на дисперсию процесса ;;/ a^-zzy^^ получим следующее выраже- ние: pi = aiA-i + ... + отА. (6.49) которое связывает коэффициенты автокорреляции процесса yt и коэф- фициенты модели АР(/:). Подставив в (6.49) вместо истинных значений коэффициентов авто- корреляции Pi процесса>>/ их выборочные оценки п, гг,..., последователь- но для /=1,2,..., к, получим следующую систему линейных уравнений: 202
ri=ai-ha2ri -\-... + akKk.u ri = ахгх + «2 + ... + ал-2; (6.50) Гк = fli'-Jt-i + агГк-г + ... + a^ в которой известными являются оценки коэффициентов автокорреляции г\, Г1,>.., rk, а неизвестными - оценки коэффициентов модели АР(/:) а\ , ^2,..., «it. Систему (6.50) называют уравнениями Юла-Уокера, а полученные на ее основе значения йь a2v-, «it - оценками коэффициентов модели авто- регрессии АР(к) Юла-Уокера. Напомним, что эти оценки могут быть по- лучены, например, с использованием определителей, либо на основе век- торно-матричной формы записи системы (6.50). На основе определителей оценки Юла-Уокера получают в следующем виде: (6.51) где Д - определитель системы (6.41). Д = 1 п П-1 п 1 i-k-z гг ■ г\ ■ Гк-Ъ ■ ■■ '■*-! ■• '-к-2 1 (6.52) Д/ - определитель, получаемый из определителя Д путем замены его /-го столбца на столбец, состоящий из коэффициентов автокорреляции, обра- зующих левую часть системы (6.50) - п, Г2,..., J"k- В векторно-матричной форме записи систему (6.50) можно переписать в следующем виде: r = Ra, (6.53) где г - вектор-столбец известных оценок коэффициентов автокорреляции с первого по к-и включительно, r=(ri, Г2,..., пУ; а - вектор-столбец неиз- вестных оценок параметров модели, a=(ai, (22,..., сг^У; R - матрица, состав- ленная из оценок коэффициентов автокорреляции, определитель которой выражен формулой (6.52). Непосредственно из выражения (6.53) вытекает, что неизвестные оценки коэффициентов модели авторегрессии определяются как а =R-^r. (6.54) Теоретически оценки Юла-Уокера должны обладать свойствами не- смещенности и эффективности. Однако, на практике, в моделях авторег- рессии большого порядка, эти свойства могут не подтверждаться. Осо- 203
бенно это относится к свойству несмещенности. Как и в моделях с лото- выми зависимыми переменными, смещенность в оценках коэффициентов моделей авторегрессии может быть обусловлена существующей зависи- мостью между сдвинутыми рядами рассматриваемой переменной j;,_i,>^,_2 и ошибкой £f. Этой возможной зависимостью при построении системы уравнений Юла-Уокера обычно пренебрегают, полагая Et «белым шу- мом». Неэффективность оценок может быть вызвана плохой обусловленно- стью матрицы R, что, как правило, является свидетельством зависимости уже между рядами д^г-ьД'г-г,.... Вместе с тем при небольших порядках модели (к =1,2,3) оценки Юла- Уокера обычно являются достаточно «хорошими». В крайнем случае их можно рассматривать как первое приближение к «оптимальным» оцен- кам, которые могут быть получены путем уточнения оценок Юла-Уокера на основе использования более мощных методов оценивания, например, нелинейных. Качество оценок Юла-Уокера может быть проверено путем исследо- вания свойств ряда ошибки £^, /=1,2,..., Г. Если ее свойства близки к ха- рактеристикам «белого шума», то оценки Юла-Уокера можно считать «достаточно хорошими». Об этом, в частности, может свидетельствовать критерий Дарбина-Уотсона, значение которого должно лежать примерно в интервале от 1 до 3 (см. раздел 1.4). Для этих целей могут использоваться и другие мощные критерии, на- пример, Бартлетта, Тейла. Обоснование целесообразности применения моделей авторегрессии Целесообразность использования моделей авторегрессии в анализе за- кономерностей временного ряда обычно устанавливается на основе со- 2 поставления двух дисперсии - дисперсии исходного процесса Су и дис- персии ошибки модели ст/. Для того чтобы выявить взаимосвязь между двумя этими характеристиками положим, что в формуле (6.48) /=0. Тогда это выражение можно переписать в следующем виде: » = Л1Л + «221 + ... + акП + сгД (6.55) где %-Оу, yi - /-Й коэффициент автоковариации. Последнее слагаемое в правой части выражения (6.55) получено путем замены в выражении (6.46) в произведении Mly^rSt] переменной yt на ее модель (6.45). Поскольку ряды yt-h»-»yyt-^ и § являются независимыми, то это произведение оказывается равным ст/. Далее, поскольку Л^рс^, то выразив все ;f, /=1,2,..., к через % и перенеся слагаемые с ;б в левую часть, из выражения (6.55) полу1шм 204
2 Го -CTJ =- ^ . (6.56) Подставив в (6.56) вместо pi значения оценок коэффициентов автокор- реляции Г/ и вместо параметров модели Oi их оценки а/, /=1,2,..., к, найдем величину соотношение между дисперсией процесса а,^ и дисперсией ошибки, описывающей этот модели авторегрессии «белого шума» сг^ . aj/aj^ . (6.57) Модель авторегрессии считается «достаточно хорошей», если Су^хт/, т.е. когда дисперсия ошибки модели много меньше дисперсии процесса. В этом случае использование модели при описании процесса у, позволяет значительно снизить его неопределенность, вьфажаемую через дисперсию с^;^. Однако следует отметить, что в моделях временных рядов нельзя ожидать значительного уменьшения дисперсии ошибки (7^ по сравнению с дисперсией процесса (L , как это имело место в моделях «классической» эконометрики, где отношение (^ /Се нередко превосхо- дит несколько десятков. Чтобы показать это, рассмотрим свойства наиболее часто используе- мых в практике финансовых исследований моделей авторегрессии перво- го и второго порядков. Модели АР(1) и АР(2) Модель авторегрессии первого порядка АР(1) записывается в сле- дующем виде: Уг=^1Ум + ^. (6.58) Легко видеть, что система Юла-Уокера в этом случае сводится к од- ному уравнению, непосредственно определяющему оценку ai коэффици- ента а\ fli=ri. (6.59) Из выражения (6.57) вытекает, что (Т^/а|=—Ц-. (6.60) Поскольку IГ11 <1, то из (6.60) следует, что, например, при ri=0,9 сг/ » « 0,2 • а,^. Это означает, что использование расчетных значений процесса л у„ определяемых по формуле у^ =«i)'r-i» вместо среднего значения вре- менного ряда у позволит повысить точность предсказания его значений 205
в пять раз (если в качестве меры точности рассматривать показатель дис- персии). В этом случае соотношение между среднеквадратическими ошибками oj, и сг^ составит примерно 2,3. Из выражения (6.60) легко так- же видеть, что с ростом абсолютного значения гх точность описания про- цесса yt моделью авторегрессии первого порядка увеличивается, а с его снижением — падает. Модель авторегрессии второго порядка — АР(2) представляется в ви- де следующего уравнения: yt = aiyt.i + a^yt-i + et- (6.61) Система уравнений Юла-Уокера в этом случае состоит из двух урав- нений Г2 = «in + ^2. (6.62) Выразив ai и ^2 через коэффициенты автокорреляции с использовани- ем, например, метода определителей (6.51), получим \ (6.63) Из выражения (6.57) непосредственно вытекает, что в этом случае со- отношение между дисперсиями исходного процесса yt и ошибкой модели Et определяется следующим выражением: \-r1a1-r2a2 (7J/a^= . (6.64) На практике и в случае АР(2) соотношение между сТу^ и (т/ обычно не превосходит 5:1. В этом смысле следует отметить, что по сравнению с эконометрическими моделями, где это соотношение достигает 50 к 1 и даже 1СЮ к 1, модели авторегрессии, на первый взгляд, не обладают высо- кой точностью описания рассматриваемых процессов. Однако не следует забывать, что в «классической» эконометрике зависимая переменная у, не обладает свойством стационарности и она характеризуется гораздо боль- шей изменчивостью (и, как следствие, дисперсией) по сравнению со ста- ционарным временным рядом. Поэтому адекватные рассматриваемому процессу многофакторные эконометрические модели могут значительно уменьшить остаточную изменчивость (дисперсию ошибки) по сравнению с исходной (дисперсией процесса), но при этом изменчивость ошибки может оставаться относительно большой. 206
Модели же авторегрессии, как и другие модели стационарных времен- нь4х рядов, как бы «уточняют» исходный процесс yt, обладающий свойст- вом стационарности, и не отличающийся значительной изменчивостью. Вследствие этого у этих моделей имеется лишь незначительный резерв для уменьшения исходной дисперсии Оу по сравнению с многофакторными эконометрическими моделями, описывающими нестационарные процессы. Автокорреляционная функция моделей авторегрессии По аналогии с реальными стационарными процессами, автокорреля- ционные функции могут быть сформированы и для их теоретических аналогов - моделей авторегрессии. Заметим, что значения коэффициентов автокорреляции модели к-то порядка связаны между собой соотношением (6.49). Несложно заметить, что для модели авторегрессии первого поряд- ка это соотношение приводит к следующей зависимости между коэффи- циентами автокорреляции: А = а'. (6.65) В самом деле, из выражения (6.58)) для /=2 имеем рг-0С\Р\ и, учитывая, ЧТО 0С\=ри получим /?2=А » аналогично, для /=3 имеем Ръ-(Х\Р2-р\ и т.д. Если учесть, что |/7i | <1, то нетрудно заметить, что модули значений ко- эффициентов автокорреляции модели АР(1) авторегрессии уменьшаются по экспоненте с ростом сдвига /. Можно показать, что поскольку модель авторегрессии второго поряд- ка является стационарным процессом, то ее автокорреляционная функция представляет собой либо затухающую экспоненту, либо затухающую си- нусоиду. В первом случае абсолютные значения коэффициентов автокор- реляции Pi с ростом / уменьшаются согласно следующей зависимости: \p^^d\pxt (6.66) где d - положительный коэффициент экспоненциальной зависимости, от- личный от единицы, d^\. Заметим, что для модели АР(1) этот коэффициент равен единице (см. выражение (6.65)). Во втором случае значения коэффициентов р[ аппроксимируются функцией следующего вида: /7/ =(sign^^)'^'sin(2^-// + F)/sinF, (6.67) где/и F - параметры синусоиды (частота и фаза соответственно), рассчи- тьшаемые на основе значений коэффициентов модели. В частности, d = ,Pa^; cos2;rf=\ai\/2^-a2 ; tgF=-^tg2л■/; sign(ai) = +1, если 1 'г Мл ai > о и sign(ai) = -1, если ai < 0. 207
6.3. МОДЕЛИ СКОЛЬЗЯЩЕГО СРЕДНЕГО В моделях скользящего среднего текугцее значение стационарндго случайного процесса второго порядка yt представляется в виде линейной комбинации текущего и прошедших значений ошибки е^ Et-u £t-2,... , по своим свойствам соответствующей «белому шуму». Такое представле- ние может быть выражено следующим уравнением (модель скользящего среднего порядка т - СС(т)): Уг = ^ - Д ^-1 - М-2 ... - fimSt-m, (6.68) где Д, Д,..., Дп - параметры модели. В соответствии с определением «белого шума» ошибка £^ характери- зуется следующими свойствами: М[^]=0, D(^)=<j/=const, y,=M[f„f,_,] = H' '' = ^' (6.69) [О, I Ф 0. Вследствие этого и автокорреляционная функция «белого шума» име- ет очень простую форму pf^^l^ /=0; pf^, /^. (6.70) С учетом свойств ошибки Et несложно построить автокорреляцион- ную функцию модели СС(т), определяемой выражением (6.68). Ее коэф- фициент ковариации /-го порядка определяется следующим образом: Ух = ЩУь Уг-)\ = М[(6} - Д 6^_1 - Дб^_2 ... - PmSt-n) X X {Bt-i - Д ^-/-1 - fiiSt-l ... - fim^-i-.m)l (6.71) При /=0 выражение (6.71) представляет собой дисперсию процесса уг, которая в силу свойства (6.69) выражается через коэффициенты модели CC(w) Д, f=l, 2,..., т; и дисперсию ошибки а/ следующим образом: 26 = ст/ = (1 + ДЧ ... + ^W. (6.72) Для /=1 из (6.72) получим, что первый коэффициент ковариации опре- деляется выражением л = (-Д + ДА + -+А.1Дп)о-/. (6.73) Для произвольного / имеем ;.. J^^^i -^Pl^M -^-'^Pm-iPm)(^h / = 1,2,...,m; ^^^^^ ' [ 0, i>m Из соотношения (6.74) вытекает, что автокорреляционная функция модели СС{т) становится равной нулю после задержки т (обрывается на задержке т). 208
с учетом выражений (6.72) и (6.74) несложно также заметить, что ко- эффициенты автокорреляции модели скользящего среднего т-го порядка - СС(т) определяются через ее параметры Д /=1, 2,..., /w; следующим об- разом: Л= 1 = 1,2,...,т; 1^Р^^..ЛР1 (6.75) О, / > т. Система из т уравнений (6.75), сформированных для /=1,2,..., т мо- жет служить основой для получения оценок Ь\, 62»-.. , Ьт неизвестных параметров модели СС(/и) - Д, Д,... , Д,. Для этого необходимо подста- вить в каждое ее уравнение вместо значений коэффициентов автокорре- ляции /?!,..., Рт рассматриваемого процесса у, их рассчитанные оценки Г1,..., Гщ, Однако в отличие от уравнений Юла-Уокера эта система нелинейная и ее решение требует использования специальных итеративных процедур расчетов за исключением наиболее простой модели СС(1). Она представ- ляется следующим выражением: yt^St-PiEt-x. (6.76) Из (6.72) следует, что дисперсии процесса а} и ошибки этой модели 2 Се связаны следующим соотношением: ог/ = (1+Д')с7Л (6.77) а ее единственный отличный от нуля первый коэффициент автокорреля- ции выражается через коэффициент модели как Л=^. (6.78, Из соотношения (6.78) несложно получить квадратическое уравнение относительно оценки Ь\ неизвестного параметра Д bi46i/ri + l=0, (6.79) где г\ - оценка коэффициента автокорреляции первого порядка процесса Уь Т.е. рх. В свою очередь, из (6.79) следует, что существуют два решения этого уравнения, связанные между собой следующим соотношением: feu-*i.2=l» bu = l/*u- (6.80) Условию стационарности процесса у, удовлетворяет только решение Ь, по абсолютной величине меньшее единицы. Оно может быть получено из следующего выражения: 209
при условии, что _-l/n±V(l/n)2-4 ^1 = , (0.В1) (llrxf - 4 > о => Iril < 0,5. (6.82) Из (6.82) следует, что модели скользящего среднего первого порядка могут применяться только для описания процессов с автокорреляционной функцией, обрывающейся после первой задержки и коэффициентом ав- токорреляции, по абсолютной величине не превьиыающем 0,5. Из соот- ношения (6.82) также вытекает, что данные модели способны лишь не- значительно уточнить рассматриваемый процесс у„ поскольку согласно (6.77) максимальное соотношение между его дисперсией и дисперсией ошибки не превосходит 1,25 фае< 1,25, (6.83) т.е. относительный выигрыш в точности не превосходит 25% для диспер- сий (чуть более 11% для среднеквадратических ошибок). В заключении этого раздела приведем основные результаты для моде- ли скользящего среднего второго порядка - СС(2). Ее уравнение в общем виде записывается следующим образом: >^, = £^-Д^_1-М-2. (6.84) Из (6.72) непосредственно вытекает, что дисперсии процесса а^ и ошибки Се^ связаны следующим соотношением: o^' = (1+A4^V/, (6.85) а ее автокорреляционная функция определяют значения коэффициентов автокорреляции, связанные с параметрами модели следующими соотно- шениями: _-А(1-А). Рг = 'J"" ^, : (6.86) из которых могут быть найдены оценки коэффициентов модели Ь\ и Ьг при известных оценках коэффициентов автокорреляции процесса у/ - г\ и Гг. 210
6Л. МОДЕЛИ АВТОРЕГРЕССИИ-СКОЛЬЗЯЩЕГО СРЕДНЕГО Общий вид модели авторегрессии-скользящего среднего - АРСС(к, т) определяется следующим уравнением: yt = ОС\Уг-\ + ... + ОкУг-к + ^ " Д ^-1 " Д^-2 ••. - /LSt-m. (6.87) где ciTi,..., ось Д,... 1 Рт - коэффициенты модели; к - порядок авторегрес- сии; т - порядок скользящего среднего. Заметим, что модель (6.87) может быть преобразована либо в модель авторегрессии АР(/:) yt = ^13^^-1 + - + ССкУг-к + $, (6.88) где ошибка ^, удовлетворяет свойствам процесса скользящего среднего порядка т\ ^t- £t- P\£t-\- Д^-2 .. - Pm^t-m'^ либо в модель скользящего среднего - СС(/и) путем выражения переменных yt-i через линейные комбинации ошибок. З', = ai(£J_i - PSt-l - ... - Pm£t-mr.\) + OC2{et-2 - Д £^-3 " ... " PmSt-m-l) + + ... + akiSt^ - piSt-k-X - ... - PmSt-k-m) + (6.89) + et- /iiSt-i - PiEt-i... - Дп^-^1 и дальнейшего приведения подобных членов после рас1фытия скобок. Для этих модификаций модели (6.87) рассмотрим свойства ее авто- корреляционной функции и возможные подходы к оценке ее параметров. Заметим, что при сдвигах, превышающих по своей величине порядок скользящего среднего /w, т.е. при />/и, коэффициенты автоковариации мо- дели АРСС(/:, /и), определяемой выражением (6.87), не зависят от ошибок модели. В самом деле, Yi = ЩУь yt-i\ = M[(aiyt-i + ... + акУг-^ + ^ - Д6^_i - Д^-2 -... - Pnet-m) • (a^yt-i +... + Okyt^^ + St-i - Д £^_/ - (6.90) -Д^_М...-Дп^-/-т)]. Если />w, то в силу свойств «белого шума» все математические ожи- дания произведений ошибок St-j и et.i-pj< т, оказываются равными нулю, т.е. М[%; St.i.j] =0, /=w+l, w+2,...; у=1, 2,..., т. В этом случае, т.е. при i>m, значения коэффициентов автоковариации модели АРСС(^, т) удовлетворяют свойствам этих коэффициентов, ха- рактерным для модели авторегрессии к-то порядка АР(^): Yi'=^cc\Yt-\ + airi-2'^'"-^cCkn-i. />m+l. (6.91) Из выражения (6.91) непосредственно вытекает, что неизвестные зна- чения коэффициентов бГь..., ajt в этом случае могут быть оценены из мо- дификации системы уравнений Юла-Уокера, имеющей в данном случае следующий вид: 211
^m+2 = ^l''m+l + ^2fm + — + ^kf"m-k\ (6.92) >"m+k = С1\Гт+к-1 + СЦГщ+к-г + ... + ^jk^'m» где, напоминаем, r,= г_; и го =1. С использованием найденных из системы (6.92) значений оценок ко- эффициентов ^1,..., Uk на основании вьфажения (6.88) сформируем про- цесс скользящего среднего т-го порядка - СС{т) Уг - a\yt-\ - ... - ciuyt-k = Ut = et- biCt-i - Ьгвг-г ... - bmCt^, (6.93) где щ - фактическая ошибка, являющаяся оценкой ошибки ^,. Значения ошибки Ut получают путем подстановки в выражение (6.88) вместо неиз- вестных параметров бГь..., сХк их оценок <Я1,..., ak, определенных из систе- мы (6.92). et - фактическая ошибка, значение которой используется вме- сто истинной ошибки £t при оценке коэффициентов скользящего средне- го. Для определения оценок &i,... , b^ коэффициентов скользящего сред- него применяются нелинейные методы оценивания, предполагающие ре- шение системы нелинейных уравнений типа (6.75). Рассмотрим наиболее «популярную» модификацию моделей авторег- рессии-скользящего среднего АРСС(1,1). Эта широко используемая в практике эконометрических исследований модель может быть выражена следующей формулой: Уг = СС\Уг-\ "^St- PiSt-b (6.94) Для определения дисперсии этой модели умножим под знаком мате- матического ожидания левую и правую части выражения (6.94) на yt, В результате получим 26 = Щуь уЛ = 0CiM\yt-\. yt] + Щуь еА - ДМУг, ^-i] = = QTi л + ст/ - ДМ[у„ St-il (6.95) При выводе выражения (6.95) учтено, что Л/[у„ еЛ = M[a\yt^\ + £i - - Piet-uSt] = Се в силу свойств процесса «белого шума» £j. Далее, умножив под знаком математического ожидания левую и пра- вую части выражения (6.94) на £^_i, получим ЩУь et-\] = осхМ\уг-ъ ^-i] - Дст/ = (ciri ~ PxW, (6.96) поскольку M\yt-u £t-\\ = M[cC\yt-i + ^-i - Д^-2, ^-i] = сг/. Аналогично, первый коэффициент автоковариащш процесса yt полу- чим, умножив под знаком математического ож^щания левую и правую части уравнения (6.94) на>^/_1. С учетом того, что y,_i = a\yt-2 + ^-1 - Д^-2» и в силу свойств «белого шума» St, получим, что Л = «1;б-До-Л (6.97) 212
Из выражений (6.95)-(6.97) непосредственно вытекает, что дисперсия cj;^ процесса з^г» описываемого моделью АРСС(1,1), его первый коэффици- ент автоковариации л и дисперсия ошибки £t оказываются связанными следующими соотношениями: ^ (6.98) (1-М)(а.-Д) , ^'" 1-af ^' а коэффициенты автоковариации более высоких порядков (как следует из выражений (6.91) и (6.92)) - соотношениями вида: r^^ai^u i^2, (6.99) Из соотношения (6.98) несложно получить вьфажение, определяющее значение первого коэффициента автокорреляции процесса АРСС(1,1) Л=П/Г. = "-"'^'""'-/''. (6.100) Значения коэффициентов автокорреляции более высоких порядков связаны соотношением аналогичным (6.99) pi = aiPi-u i ^ 2. Таким образом, значения коэффициентов автокорреляции модели АРСС(1,1) подчиняется экспоненциальному закону Pi=S'a^-\ (6.101) где^=^^-^^^^^^^^-^^\ l-2aiA+yff2 6.5. ИДЕНТИФИКАЦИЯ МОДЕЛЕЙ АВТОРЕГРЕССИИ-СКОЛЬЗЯЩЕГО СРЕДНЕГО Из рассмотренного в данной главе материала вытекает, что произ- вольный реальный стационарный процесс второго порядка может быть выражен разными вариантами моделей временных рядов. Чтобы пока- зать это, запишем, например, модель АР(1) в более компактном виде с использованием оператора сдвига назад 5. Его воздействие на любую переменную, зависящую от времени, определяется следующими соот- ношениями: Вуг = yt-b В\ = у,_2,..., fiVr = yt-i,.... (6.102) С учетом (6.102) модель АР(1) можно представить в следующей форме записи: 213
yt =^1Уг-1+^г =>0-«^i^)>'r =^r =>>'/ =7^—^- (6.103) \\-CC\D) Поскольку I ciril<l, TO является суммой бесконечно убываю- (\-cc\B) щей геометрической npoq)eccHH i = \+ахВ+а}в'^+.... (6.104) С учетом (6.104) модель (6.103) запишем в следующем виде: з;, = (1 + С1Г1В+а1^ + ...)£^ = £^-Д£^_1-М.2-..., (6.105) где в данном случае а\ =-Д , a\-=^Pi,..,. Из выражения (6.105) следует, что модель авторегрессии первого порядка оказывается эквивалентной модели скользящего среднего бесконечного порядка. Аналогичным образом можно показать и об- ратное соотношение между порядками этих моделей. Так, для модели СС(1) имеем Уг =£t -Px£t-i =(\-РхВ)е, => е, = ^' . (6.106) Поскольку |Д|<1(из условия стационарности процесса у,), то из вы- ражения (6.106) получим у,(1+Дв + Д^ + ...) = ^; yt = -fiiyt-i - Д V2 -... + 6^; (6.107) yt = (Xiyt-i + a^yt-i + ... + £t. где в данном случае ai=-fii, С1Г2=^Д^,... - коэффициенты модели авторег- рессии бесконечного порядка. В общем случае модель авторегрессии к-го порядка оказывается экви- валентной модели скользящего среднего т-го порядка yt =^iyt-i -^'"^kyt-k +^r =(l-aiB-aiB'^ -...а,,В^)у^ =£^ => yt =- Z Й —^(Х-РхВ-ргВ^ -..._^^^m) ^ \-ахВ-а2В^-,..-а^В'' где многочлен w-й степени 1 - ДБ - ДВ^ - ... - рщВГ 1 результат деления единицы на многочлен k'Yi степени. 214
Из рассмотренных соотношений вытекает ваэюный вывод: на прак- тике MODtcHO подобрать модель с минимальным числом параметров, ко- торая описывает временной ряд yt, являющийся стационарным процес- сом второго порядка, не «хуэюе», чем другие варианты моделей с боль- шим числом параметров. Обычно понятие «не хуэюе» связывается с ми- нимальной дисперсией модели и отсутствием автокорреляции в ряду ее ошибки. Практическая ценность этого вьшода состоит в следующем. При по- строении моделей временных рядов нужно стремиться к минимизации числа их параметров, а следовательно, и порядка самой модели. Дело в том, что параметры таких моделей оцениваются на основе коэффициен- тов автокорреляции исходного процесса д'/. С увеличением порядка моде- ли для определения значений ее параметров необходимо использовать в качестве исходных данных и большее число выборочных коэффициентов автокорреляции (с большими номерами). Точность их оценки с ростом сдвига падает, да и их абсолютные значения либо стремятся к нулю, либо попадают в область повьппенной неопределенности. Из-за этого снижает- ся надежность оценок коэффициентов моделей временных рядов высоких порядков, как и качество самих моделей. Все это и заставляет экономет- риков искать для описания реальных процессов модели временных рядов с минимальным числом параметров. Процесс выбора модели, в наилучшей степени соответствующей рас- сматриваемому реальному процессу, называется идентификацией моде- ли, В нашем случае идентификация состоит в определении общего вида модели из класса моделей АРСС(/:, т), характеризующейся наименьшим числом параметров (минимальным порядком) по сравнению с другими возможными вариантами, без потерь в точности описания исходного процесса. Вообще говоря, идентификация - это достаточно грубая процедура (последовательность процедур), целью которой является определение не- которой области приемлемых значений характеристик порядка кит мо- дели АРСС (к, т\ которая в ходе дальнейших исследований должна быть сведена к конкретным их величинам. Обычно в этой части идентификация сопровождается процедурами оценки параметров альтернативных вариантов моделей и выбора наи- лучшего из них на основе использования критериев качества. Таким образом, в общем случае формирование модели, в наилучшей степени подходящей для описания реального процесса, как бы состоит из трех пересекающихся и дополняющих друг друга этапов - идентифи- кации, оценивания и диагностики (согласования модели с исходными данными с целью выявления ее недостатков и последующего улучшения). 215
Общая идея идентификации модели АРСС(к, т) состоит в том, что свойства реального процесса и свойства наилучшей модели в некоторой степени должны быть близки друг к другу. Эта близость, как это было показано ранее, практически целиком оп- ределяется на основе сопоставления поведения их автокорреляционных функций: теоретической - для модели и эмпирической - для реального процесса, выборочные коэффициенты автокорреляции которого оценены на основе наблюдаемых данных. Поскольку выборочные коэффициенты автокорреляции могут характеризоваться достаточно большими ошибка- ми и, кроме того, сильными корреляционными взаимосвязями между со- бой (см. выражения (6.22)-<6.24)), то на практике точного сходства между «теоретической» и «эмпирической» автокорреляционными функциями ожидать не следует, особенно при больших сдвигах. Например, вследст- вие статистической взаимосвязи между коэффициентами автокорреляции процесса относительно значимые уровни выборочных коэффициентов ав- токорреляции (всплески) могут иметь место и в областях сдвигов, где их теоретические аналоги близки к нулю. Поэтому при сопоставлении тео- ретических и выборочных автокорреляционых функций обычно учиты- вают лишь их главные свойства. Именно их совпадение позволяет значи- тельно сузить круг приемлемых для описания реального процесса вари- антов модели. Окончательный выбор в пользу одной из них обычно дела- ется по результатам этапов оценивания и диагностики моделей. Отметим наиболее характерные свойства автокорреляционных функ- ций типовых моделей APCC(ifc, /w), рассмотренных в данной главе. Как следует из выражения (6.65), автокорреляционная функция моде- ли авторегрессии первого порядка - АР(1) спадает строго по экспоненте (точнее, этот вывод справедлив для абсолютных значений коэффициен- тов автокорреляции). Плавный характер уменьшения коэффициентов ав- токорреляции характерен и для моделей авторегрессии более высоких порядков. В одном случае спад происходит либо чуть быстрее, чем строго по экспоненте, либо чуть медленнее, а в другом - по закономерности, со- ответствующей затухающей синусоиде. Чрезвычайно важная информация о порядке модели авторегрессии со- держится в так называемой частной автокорреляционной функции. Для процесса, описываемого моделью АР(Л), ее значениями являются последние значения коэффициентов моделей авторегрессии порядков, не превосходящих к, т.е. моделей с порядками /=1,2,..., /:-1, к. Обозначим значения частной автокорреляционной функции модели АР(к) через Лкь Тогда для модели АР(к) значение л*^! равно р\ и на практике определя- ется как оценка коэффициента ai модели АР(1) по формуле 216
^k\ = n' (6.109) значение 7Г/^2 Т" (c^- вьфажение (6.63)) - как коэффициент cxz ^'Р\ модели АР(2). На практике значение TCki, таким образом, определяется по формуле ^ki = 1 ri ll ri г\ гг г\ 1 гг^х l-rj2 (6.110) и оценка любого коэффициента Kj^i определяется как оценка коэффици- ента oCi модели АР(0 по формуле Ttn: = 11 1 h-1 11 1 h-i 1 1 П-2 Г\ 1 '/-2 '2 • 1 • 1-3 • '2 • 1 • П-г ■ ■■ 1-2 •• 1-3 .. Г1 •• 1-2 .. /;_з • г, 1-11 1-2 1 1 1-11 1-2 1 1 = ^,/ = 2,3, ...ДД+1,... .(6.111) А Можно показать, что для модели АР(к) значения частной автокорре- ляционной функции являются значимыми (отличными от нуля) до за- держки к включительно, т.е. л^/ >0, i<k и равными нулю при сдвигах, превышающих порядок модели, т.е. л^/ =0, i>k. На практике этот резуль- тат следует понимать в «статистическом смысле», поскольку оценки значений коэффициентов частной автокорреляционной функции опре- деляются на основании выборочных значений коэффициентов автокор- реляции и поэтому сами являются случайными величинами, характери- зующимися определенной ошибкой. Для оценок коэффициентов част- ной автокорреляционной функции, порядок которых превышает поря- док модели, дисперсия ошибки приблизительно может быть оценена по следующей формуле: (72(л:^^)«1/Г, где i>k'y Т- объем динамического ряда показателя з^,. (6.112) 217
Таким образом, поведение частной автокорреляционной функции мо- делей авторегрессии аналогично поведению автокорреляционных функ- ций моделей скользящего среднего. Для модели АР(/:) ее частная автокор- реляционная функция «обрывается» после задержки к, как это имело бы место у автокорреляционной функции модели СС{к). Это свойство част- ной автокорреляционной функции удобно использовать при идентифика- ции моделей авторегрессии. Если значения такой функции, рассчитанной для реального процесса, обрываются (становятся нулевыми), начиная со сдвига /:+1, это указывает на то, что модель авторегрессии it-ro порядка соответствует свойствам рассматриваемого процесса. Как вытекает из выражения (6.75) теоретическая автокорреляционная функция модели СС(т) обрывается после задержки т. Поэтому, если ав- токорреляционная функция реального процесса обладает аналогичными свойствами, это указывает на то, что для его описания целесообразно ис- пользовать модель скользящего среднего соответствующего порядка. Иными словами, если у процесса yt оказался значимым только первый коэффициент автокорреляции г\ и при этом, в соответствии с выражением (6.82) Г1<0,5, то данный факт указывает на целесообразность выбора для его описания модели СС(1). Если «обрыв» имеет место после второго сдвига - то модель СС(2) и т.д. Точно так же как и для моделей авторегрессии частные автокорреля- ционные функции могут быть построены и для моделей скользящего среднего любых порядков. Для оценки их коэффициентов используются выражения (6.109)-(6.111). При этом с учетом того, что для модели СС(1) первый коэффициент автокорреляции р\ и параметр модели Д связаны соотношением Р\=^Р\ (1+Д^) (см. (6.78)), то для /=2, 3,... с уче- том того, что fh-Ръ-"-^^ можно показать, что значения частных коэф- фициентов автокорреляции этой модели определяются по следующей формуле: вм =-р{{\'р^)1{\'Р^^'^^^). (6.113) Из (6.113) непосредственно вытекает, что т<Рх\ (6.114) откуда следует, что частная автокорреляционная функция модели СС(1) (т.е. абсолютные значения ее частных коэффициентов автокорреляции) затухает по закону, близкому к экспоненциальному. Иными словами, ее поведение похоже на автокорреляционную функцию модели АР(1). Можно показать, что аналогичное соответствие свойств характерно для частной автокорреляционной функции модели СС(2) и автокорреля- ционной функции модели АР(2). Они представляют собой либо плавно 218
спадающие с ростом сдвига зависимости экспоненциального типа, либо затухающие синусоиды. Такое соответствие автокорреляционных и част- ных автокорреляционных функций характерно и для моделей авторегрес- сии, и скользящего среднего более высоких порядков. Для моделей АРСС(Л, т) поведение автокорреляционной функции по- сле задержки т похоже на поведение автокорреляционной функции мо- дели АР(к). Однако на практике обычно используется модель АРСС(1,1), т.е. только первого порядка. Как было показано выше, в 6.4 (см. выраже- ния (6.103)-(6.108)), это связано с тем, что составляющая модели, отно- сящаяся к авторегрессии первого порядка поглощает все процессы сколь- зящего среднего более высоких порядков, и, наоборот, составляющая скользящего среднего первого порядка поглощает процессы авторегрес- сии высоких порядков. Вследствие этого и поведение автокорреляцион- ной и частной автокорреляционной функций модели АРСС(1,1) характе- ризуется как бы комбинацией свойств этих функций, имевших место для моделей АР(1) и СС(1). Иными словами, составляющая АР(1) способствует тому, что автокор- реляционная функция модели АРСС(1,1) (абсолютные значения коэффи- циентов автокорреляции) затухает экспоненциально, но после первой за- держки (первого сдвига). Это непосредственно вытекает из выражений (6.77) и (6.79). В свою очередь, составляющая СС(1) определяет законо- мерности поведения частной автокорреляционной функции модели АРСС(1,1), которая также затухает примерно экспоненциально в соответ- ствии с выражением (6.113) и (6.114). Рассмотренные подходы к идентификации основаны на сопостав- лении свойств выборочных автокорреляционных и частных автокорре- ляционных функций реального стационарного процесса и предпола- гаемой для его описания модели. На практике идеальное совпадение свойств этих функций встречается не часто, поскольку и реальные процессы обычно не слишком точно соответствуют своим теоретиче- ским аналогам-моделям, и оценки их коэффициентов автокорреляции характеризуются наличием ошибок. Вследствие этого процедура идентификации слуэюит для обоснования выбора некоторой пробной модели из общей группы моделей типа АРСС(к, т), которая является как бы начальной точкой на пути построения «оптимального» тео- ретического аналога (модели) рассматриваемого процесса на основе использования более точных процедур диагностики и методов оценки параметров модели. Обычно с помощью процедур диагностики исследуют свойства фак- тической ошибки модели е^ которую часто называют остаточной ошибкой. При этом целесообразно руководствоваться следующей логи- 219
кои анализа временного ряда е^ значения которого определяется как раз- ность между фактическими и расчетными значениями процесса в момент л л и т.е. е^^у^-у^, где у^ - значения процесса, рассчитываемые по соот- ветствующей модели. Для «удачной» модели можно ожидать, что ряд ошибки ^/, г=1,2,..., Г по своим свойствам будет достаточно близок к «белому шуму» — слу- чайному процессу, характеризующемуся полным отсутствием каких- либо закономерностей в своих значениях, за исключением известного закона их распределения, обычно предполагаемого нормальным. Для нашего случая это означает, что математическое ожидание фактической ошибки должно быть равно нулю (A/Iej=0), ее дисперсия постоянна на любом участке ее измерения {а^ =const) и между рядами et, ^г-ь ^/--2» — отсутствует автокорреляционная зависимость, т.е. первый и последую- щие выборочные коэффициенты автокорреляции ряда et , ^1,2,..., Т близки к нулю. В более общем случае условие отсутствия закономерностей в ряду е„ ^=1,2,..., Г, распространяется и на третий, и на четвертый моменты ошиб- ки et, что, например, означает равенство нулю любого третьего момента ошибки типа М^г» ^м» ^г-у]> и У ^1» постоянство ее четвертого момента (A/[e/]=const) — отсутствие автокорреляционной связи между значения- ми квадратов ошибки, рассматриваемых в различные моменты времени и т.п. Иными словами, фактическая ошибка модели et должна быть «на- столько случайна», что ее невозможно было бы уточнить никакой другой моделью. Кроме того, как это было показано выше, желательно, чтобы диспер- сия ошибки ае была существенно меньше дисперсии процесса yt -Оу , Ge«Gy . в этом случае модель, описывающая процесс yt, как бы снимает значительную часть неопределенности в его изменчивости, что позволяет с большей обоснованностью предсказывать его значения. Наличие каких-либо закономерностей в ряду ошибки et указывает, что построенная модель неадекватна рассматриваемому процессу yt^ Причи- нами неадекватности могут быть ошибки в оценках параметров либо так называемая, неопределенность модели. Примерами такой неопределенно- сти является использование модели АР(1) вместо адекватной процессу модели АРСС(1,1). В этом случае ошибка модели АР(1) et-yt- cixyt-x ха- рактеризуется свойствами модели СС(1). На это укажет отличный от нуля ее первый коэффициент автокорреляции. Отметим, что и неверно определенные значехшя параметров модели приводят к появлению «неслучайности» в ряду фактической ощибки б,. 220
Вследствие этого на практике однозначно указать какой-либо путь уточ- нения модели на основе анализа свойств ошибки ^„ отличных от свойств «белого шума», обычно не представляется возможным. В такой ситуации можно сначала рекомендовать уточнить значения параметров модели пу- тем использования более эффективных процедур их оценки, а затем, если это окажется необходимым - доопределить модель. Для этой цели могут быть использованы и другие более точные ме- тоды оценивания (например, нелинейные), в которых найденные оценки (по методу Юла-Уокера, например, и другие) используются как началь- ные приближения к «оптимальным» значениям параметров модели APCC(ifc, т). Из приведенных выше рассуждений вытекает, что диагностика модели сводится к исследованию свойств ее ошибки с целью выявления степени соответствия ее свойств свойствам «белого шума». Такие исследования в случае модели стационарных процессов второго порядка обычно сводятся к проверке значимости коэффициентов автокорреляции фактической ошибки в/. На практике можно ожидать, что вследствие сложного характера рас- пределения ошибок выборочных коэффициентов автокорреляции их зна- чения, особенно при малых сдвигах, могут находиться в некоторой зоне неопределенности, когда затруднительно однозначно сделать вывод от- носительно значимости или незначимости каждого из них. В заключении данного раздела напомним, что для проверки гипотезы о соответствии свойств ошибки модели свойствам белого шума могут ис- пользоваться процедуры проверки гипотез о постоянстве и равенстве ну- лю ее математического ожидания, постоянстве дисперсии, равенстве ну- лю ее коэффициентов автокорреляции. В последнем случае применимы критерии Дарбина-Уотсона (для первого коэффициента автокорреляции), критерий Стьюдента, расчетное значение которого для выборочного ко- эффициента автокорреляции к-то порядка определяется согласно сле- дующей формуле: г(гО = -^, (6.115) где с(гк )-среднеквадратическая ошибка выборочного коэффициента ав- токорреляции гь для оценки которой могут быть использованы выраже- ния (6.25) (при q=0) и (6.26). Для этих же целей во многих случаях предпочтительнее использовать так называемый совокупный критерий согласия (критерий Бокса-Пирса), с помощью которого оценивается значимость некоторой последователь- 221
ности выборочных коэффициентов автокорреляции, начиная с первого. Для любого процесса APCC(ifc, т) его расчетное значение определяется по следующей формуле: Q=TJ:ri. (6.116) Случайная величина Q распределена приблизительно по закону Пир- сона ^{q-k-m). Таким образом, если оказывается, что выполняется сле- дующее соотношения для первых q коэффициентов автокорреляции {q>k+m)\ Q<Z^(p*.y\ (6.117) где v=q-k-m, то с вероятностью/?* гипотеза об отсутствии в ряду ошибки автокорреляционных зависимостей может быть принята. 6.6. МОДЕЛИ ВРЕМЕННЫХ РЯДОВ С СЕЗОННЫМИ КОЛЕБАНИЯМИ Характерной особенностью некоторых социально-экономических процессов, представленных временными рядами, является ярко выражен- ная периодичность. Например, интенсивность транспортных поездок (особенно на длинные расстояния) резко возрастает в летние месяцы и снижается в межсезонные периоды. Интенсивность посещений зрелищ- ных мероприятий значительно выше в зимний период, когда большинст- во населения находится дома, и падает в летнее время, когда люди, как правило, находятся в отпусках. Сезонная периодичность характерна и для курсов валют. В РФ спрос на валюту (и соответственно ее цена) обычно растет к концу года, когда подходят сроки платежей, и снижается в летний период, когда деловая активность падает. Сезонные колебания часто сочетаются с более общей тенденцией процесса, характеризующейся, например, ростом среднегодовых (сред- неквартальных и т.п.) его значений. В такой ситуации иногда рекомен- дуется общую модель процесса представить в виде трех составляю- щих: «тренда», выраэюающего общую тенденцию; «сезонной компо- ненты», описывающей сезонные колебания вокруг этого тренда, и «случайной компоненты», традиционно выражающей свойства ошиб- ки. Однако такой подход к формированию общей модели, как правило, не является экономичным в том смысле, что эта модель молсет со- дерэюать слишком много параметров, которые оцениваются с большой ошибкой. Особенно это относится к параметрам трендовых моделей, 222
ошибки оценок которых обусловлены значительными отклонениями ре- альных данных от трендов именно из-за наличия сезонных эффектов. Вследствие этого такая модель может не обладать достаточной точно- стью. Кроме того, наличие тренда во временном ряду может быть вы- звано какими-либо систематическими эффектами. Например, ежегод- ный рост туристических поездок - увеличением доходов населения. В данном случае в модели может появиться систематическая ошибка, обу- словленная недостаточной точностью аппроксимации временным трен- дом тенденции роста дохода. Большое число параметров характерно и для моделей, описывающих «собственно» сезонные колебания. Обычно такая модель представляется в виде набора синусоид и косинусоид [S/2] Уг^Го-^ Х[Г1усо8(2я'уГ/5) + ;^2у-созСал-уг/^)], (6.118) где jd, jij и jij - коэффициенты модели; s - общий период колебания, \l/2s- для четных 5; [1/2(^-1)- для нечетных .у; индексы у и t определяют фазу колебательного процесса. При построении моделей временных рядов типа APCC(it, т) - авто- регрессии-скользящего среднего - одним из критериев их качества (пусть и неформальным) является минимум параметров. Как было отмечено выше, меньшее число параметров модели способствует повышению ее устойчивости, часто ведет к уменьшению ошибки прогноза. В этой связи достаточно плодотворной оказалась идея уменьшения числа параметров модели временных рядов, описывающих процессы с сезонными колеба- ниями, путем учета при их построении взаимосвязей не только между соседними значениями процесса, но и меэк:ду его значениями, разделен- ными периодом колебания. Кроме того, реализация этой идеи показала возможность рассмотрения моделей временных рядов с сезонными коле- баниями как специфической подгруппы моделей АРСС(/:, т). Модели данной подгруппы называют также мультипликативными моделями вре- менных рядов. Рассмотрим подробнее общую идею их построения на содержатель- ном уровне. Если временной ряд характеризуется сезонной составляющей с периодом S, то в таком ряду обычно выделяют два различных типа взаимосвязей между переменными - текущую и сезонную. Текущая взаимосвязь, как и ранее, характерна для соседних значений временного рядад^, nyt-u yt-2*—y сезонная - для значений, разделенных периодом ко- 223
лебаний yt и д/,_^. Например, если временной ряд выражает ежемесячные значения какого-либо процесса, а сезонная его составляющая имеет пери- од колебания 12, то .у= 12. В таком случае разность уг-yt-s^ может быть оп- ределена следующим выражением: yt-yt-s = '^syt = (l-Bs)'yt. (6.119) где В^ - оператор сдвига на s периодов, т.е. ff уг ^t-s- Предположим, что разность (6.119) стащюнарный процесс, который может быть описан моделью, относящейся к классу моделей АРСС(/:, т), например, моделью АР(1): V.}^,= ciri'V,yM + £^.., (6.120) где Et^s - ошибка такой модели, а\ - ее коэффициент. Переписывая модель (6.120) с учетом операторов сдвига В и В^, полу- чим ее выражение в виде произведения двух операторов (мультиплика- тивная связь) (l-a,'B)(l-B')y, = er,. (6.121) В развернутом виде вьфажение (6.121) связывает текущее значение процесса д'г с его предшествующим значением д'г-! и значениями прошлого периода д',., и ;;,_j_i: yt = ^1 Vi + yt-s - cciyt-s-i + et,s. (6.122) Идентификация мультипликативной модели в данном случае осущест- вляется на основании анализа автокорреляционной функции процесса (l-B^)yt. В случае модели (6.122) коэффициенты автокорреляции разно- стей yr-yt-s ДОЛЖНЫ обладать свойствами автокорреляционной функции модели АР(1). Аналогично, если разность (6.119) может быть представлена в виде модели скользящего среднего первого порядка, связывающего прирост V^^ с приростом «белого шума» при том же периоде колебаний У,>;, = (1-Д^В^)б^, (6.123) где Д*^ - коэффициент модели, а соседние разности Vy^ и Vy,_i связаны той же моделью, но с коэффициентом Д, то мультипликативная модель записывается в следующем виде: VW,y, = a-B). (1 -BV = (1 - ДВ) • (1 - Д'^) ^. (6.124) В развернутой форме выражение (6.124) имеет следующий вид: yt-yt-\ -yt-s-^yt-s-i = ^-Д • £t-\ -Pi '€t.s-^fii'fi\'' £t-s-i. (6.125) Идентификация модели типа (6.124) базируется на свойствах функции автокорреляции процесса (l-B)(l-ff)yt. Заметим, что у него ненулевыми являются коэффициенты автокорреляции, соответствующие только за- 224
держкам 1, 11, 12 и 13. Значения данных коэффициентов несложно опре- делить на основе соответствующих ковариаций : c^' = (i+A').(i+(AOV/; covi=-A.(l + (AOV/; соУ11=Д.ДЧ'; (6.126) covi2 = -A^(1+AV/; covi3=AAV/. Таким образом, идентификация моделей временных рядов с сезонны- ми колебаниями в общем случае предполагает анализ корреляционных взаимосвязей двух типов: между соседними значениями процесса и меж- ду значениями, разделенными предполагаемым периодом колебаний. При этом речь может идти и о процессе, подвергнутом предварительному преобразованию (см. выражения (6.39)-(6.42)). В общем случае при наличии сезонных колебаний процесс yt, как правило, характеризуется высокими значениями коэффициентов авто- корреляции даже при больших задержках. Преобразование процесса с целью исключения тренда (например, путем перехода к конечным раз- ностям) обычно ведет к тому, что у преобразованного процесса значи- тельно выделяются по величине автокорреляции, кратные периоду ко- лебания. Это как раз и указывает на присутствие сезонной составляю- щей. Процедуры оценки коэффициентов моделей временных рядов с сезон- ными колебаниями базируются на тех же причинах, что и процедуры оценки моделей временных рядов общего типа. В их основе лежит крите- рий минимизации суммы квадратов ошибки. Однако получить аналити- ческие выражения для оценок их коэффициентов (типа решений Юла- Уокера и т.п.) в общем случае достаточно сложно. Вследствие этого на практике обычно используют методы нелинейного оценивания парамет- ров таких моделей, базирующиеся на итеративных процедурах последо- вательного приближения оценок к их оптимальному значению (см. главу XI). Заметим при этом, что приблизительные (начальные) оценки пара- метров моделей могут быть оценены отдельно для процесса образованно- го соседними значениями и для процесса, образованного его значениями, разделенными периодом колебаний в соответствии с известными проце- дурами оценки моделей типа АРСС(к, т). В целом, построение модели временного ряда с сезонными коле- баниями осуществляется по традиционной схеме, которая состоит из следующих этапов: ^ Вывод соотношений (6.126) предоставляем читателю. 8 Эконометрика ZZj
1. На основании анализа исходного процесса (исследования свойств стационарности, вида автокорреляционной функции) выво- дится суждение о наличие трендовой составляющей. 2. В случае необходимости с помощью подходящего преобразова- ния тренд исключается из рассматриваемого временного ряда. 3. Для оставшейся стационарной составляющей по виду ее авто- корреляционной функции подбирается «подходящий» вариант моде- ли. 4. На основании значений соответствующих выборочных коэффи- циентов автокорреляции определяют предварительные начальные оценки параметров моделей. Применяя более сложные процедуры оценивания, эти оценки затем уточняют. 5. Определяется ряд ошибок модели, на основании анализа свойств которого выбранный вариант модели либо уточняется (улучшается), либо принимается в качестве окончательного реше- ния. 6.7. ПЕРЕХОД ОТ СТАЦИОНАРНЫХ МОДЕЛЕЙ К НЕСТАЦИОНАРНЫМ В тех случаях, когда модель авторегрессии и скользящего среднего применялась для описания процесса, приведенного к стационарному, на- пример, с помощью одного из преобразований (6.39)-(6.42), процесс по- строения модели нельзя считать завершенным. Для его окончания необ- ходимо продолжить процесс построения модели изначального процесса, выполнив обратные преобразования, перейдя от преобразованных значе- ний Xt к исходным значениям yt. Рассмотрим особенности обратных пре- образований для выражений (6.39)-(6.42) более подробно. Предположим, что для приведения исходного временного ряда yt к стационарному процессу Xt использовалось преобразование (6.39), а сам процесс Xt соответствует модели авторегрессии-скользящего среднего (6.87), частным случаем которой являются модели авторегрессии (6.45) и скользящего среднего (6.68). Запишем преобразование (6.39) и модель (6.87) для ряда Xt с помощью оператора сдвига В (см. (6.102)). Получим соответственно х, = а-В)у,; (6.127) (1 - а(В, к))х, = (1 - ДВ, т))е„ (6.128) где а[В,к) =\-ахВ-аг^-...- (а^ (6.129) 226
ДВ,т) = 1 - ДВ - ДВ" -... HfiT (6.130) многочлены степеней kwm соответственно от оператора сдвига, исполь- зуемые для получения эквивалентной записи модели (6.87). Подставляя (6.127) в (6.128), получим уравнение для модели динамики исходного временного ряда;;/, Г=1,2,..., Тъ следующем виде: (1 - а{ВЛ)){\ -В)з^, = (1 - ДВ,т))б^. (6.131) Заметим, что преобразование (6.127) не затрагивает ошибку £^. Рассмотрим описанную процедуру на примере модели АРСС(1,1). Пусть xt^aixt-i + £;-Дб^-ь (6.132) xt = yt-yt-u что эквивалентно записи (1-а15)х/ = (1-ДБ)б^; (6.133) Xt = {\-B)y,. Объединяя эти два уравнения в одно, получим модель относительно исходного временного рядад^, в следующем виде: {\-а,В\\-В)у, = {\-13,В)ег (1 - (1 + а,)В + «Лг = (1 - ДВ)^; (6.134) У/ = (1 + ax)yt.\ - axyt-i + £^ - Д£i-i. Заметим, что преобразование (6.40) с помощью оператора В записы- вается в следующем виде: z, = (l-B)V (6.135) В этом случае для произвольной модели АРСС(/:, ni) получим (1 - а(В,Ш1 - 5')у, = (1 - Д (В,т))^. (6.136) В частности, для модели АРСС(1,1), построенной для ряда Z/, выраже- ние (6.101) для исходного процесса >;/ приобретает следующий вид: (\-а,В)(\-ВЬг^(\-^В)ег\ (1-(2+а1)В + (1+2а,)В^-сгЛ/ = (1-Д^)^; (6.137) у, = (2 + ax)yt-\ - (1 + 2ciri)y,_2 + аху^.ъ + ^ - Д^г-ь В случае приведения исходного рядад^,, /=1, 2,..., Г к стационарному с использованием J-й разности его результирующая модель определяется следующим выражением: (1 - а(В, Ш1 - В)'у, = (1 - ДВ, т))е,, (6.138) 8- 227
в том случае, когда для приведения ряда а\, г=1, 2,..., Г к стацио- нарному процессу Xi использовалось преобразование (6.41), отправ- ное выражение для модели исходного ряда будет иметь следующий вид: (l-oiB,k))xt = (l-fiiB,m))e,; (1 - о(В, fc))(l - В)1п>', = (1 - fliB,m))e,. (6.139) В частности, для модели АРСС (1,1) на основании выражения (6.139) получим следующий вариант модели процессауг. <=1,2,..., Г: (l-af,B)(l-fi)Vr = (l-Afi)^; \пу, - (1 +ai)lny,.i + ailny,.2 = d - ДВ)^; (6.140) щ Л-1 yt = >'/-! ^.М^^ . f,-AfM yt-2. где ошибка £j и коэффициенты «i, Д соответствуют модели ряда .,=1п-^' yt-\ В случае если для приведения исходного временного ряда к ста- ционарному процессу использовалось преобразование (6.42), то окон- чательный вариант модели процесса >>, будет иметь следующий вид: (У-а{В,к))-^—A(ik) = (l-/9(S,m))e,, (6.141) yt-\ где А(к) = \-а{к) = 1- i^i - коэффициент, полученный в результате ум- (=1 ножения многочлена {\-о^В,к)) на единицу. В частности, если стационарный процесс х, описывается моделью АРСС(1,1), то на основании выражения (6.141) получим (l-flr(B.fc))^^-(l-ai) = (l-/5iB)£,; yt-\ yt-\ yt-2 >' -ai^^-(l-aO = et-fiie,_i; (6.142) у2 у, = (l-ai)y,.i +ai -^-^+y,-i •{.£, -p\et-{). yt-2 228
в практических исследованиях при проведении обратных преобразо- ваний моделей вместо параметров а; и Д в соответствующие выражения для моделей исходного временного ряда>^, необходимо подставить значе- ния их оценок Л/ и йу, полученные для моделей преобразованного стацио- нарного процесса д:,. Таким образом, из выражений (6.134), (6.137), (6.140) и (6.142) выте- кает, что использование для преобразования исходного временного ряда yt в стационарный процесс jc^ /=1,2,..., Г, оператора разности не ведет к изменению вида модели, описывающей процесс yt. Она, как и модель АРСС, описывающая стационарный процесс Xt, является линейной по форме. В случае преобразования нестационарного временного ряда yt в ста- ционарный Xt с помощью выражений (6.41) и (6.42), модель нестационар- ного процесса становится нелинейной по форме. В заключении данного раздела обратим также внимание на необхо- димость анализа свойств и оценки основных характеристик ошибки ис- ходной, т.е. восстановленной модели. Это должно быть сделано, в том числе и для обоснования оценки качества самой модели. Для некоторых преобразований их значения дисперсии фактической ошибки можно оп- ределить, исходя из соответствующих значений дисперсии среднеквад- ратической ошибки преобразованной модели, используя свойства дис- персий линейных, логарифмических и других зависимостей, соответст- вующих сделанному преобразованию. В этой связи заметим, что ряд л значений фактической ошибки модели е^ -yf-yt определяется в этом случае после формирования основного уравнения модели и расчета на л его основе значений у^. Далее свойства фактической ошибки могут быть определены с использованием специальных тестов (см. раздел 2.2). Дисперсию модели исходного ряда можно определить и методом пря- мого счета как D{yt)-^ —, 7-n-l по известным значениям временного ряда yt и предсказанным восстанов- л ленной моделью значениям у^,п- количество параметров модели. В следующей главе будут рассмотрены модели временных рядов фи- нансовых показателей, предпосылки которых приводят к еще более яр- ким формам нелинейностей по сравнению с рассмотренными в данном разделе. 229
ВОПРОСЫ к ГЛАВЕ VI 1. Что такое «стационарный процесс»? 2. Какие параметрические тесты применяются для проверки постоян- ства математического ожидания? 3. Какие параметрические тесты применяются для проверки постоян- ства дисперсии? 4. Какие непараметрические тесты применяются для проверки посто- янства математического ожидания? 5. Какие непараметрические тесты применяются для проверки посто- янства дисперсии? 6. Каким образом нестационарный ряд можно преобразовать в стацио- нарный? 7. Что собой представляют модели авторегрессии? 8. Каким образом оцениваются параметры модели авторегрессии? 9. Что собой представляют модели скользящего среднего? 10. Каким образом оцениваются параметры модели скользящего сред- него? 11. Что собой представляют модели авторегрессии-скользящего сред- него? 12. Как проводится идентификация моделей авторегрессии- скользящего среднего? 13. Каким образом учитываются сезонные колебания в моделях вре- менных рядов: 14. Как осуществляется обратное преобразование стационарного ряда в нестационарный? УПРАЖНЕНИЯ К ГЛАВЕ VI Задание 6.1 В табл. 6.1 приводятся данные о размерах запасов компании А. Таблица 6.1 1 № 1 2 3 4 5 6 7 8 Наблюдение 235 320 115 355 190 320 275 205 № 21 22 23 24 25 26 27 28 Наблюдение 255 285 250 300 225 285 250 225 № 41 42 43 44 45 46 47 48 Наблюдение | 240 275 225 285 250 310 220 320 230
Окончание таблицы 6.1 1 № 1 ^ 9 10 И 12 13 14 15 16 17 18 19 20 Наблюдение 205 295 240 355 175 285 200 290 220 400 275 185 370 № 28 29 30 31 32 33 34 35 36 37 38 39 40 Наблюдение 225 125 295 250 355 280 370 250 290 225 270 180 270 № 48 49 50 51 52 53 54 55 56 57 58 59 60 Наблюдение | 320 215 260 190 295 275 205 265 245 170 175 270 225 1 Требуется: 1. Провести тестирование ряда на постоянство математического ожидания и дисперсии с помощью параметрических тестов на осно- ве: а) критерия Стьюдента; б) критерия Фишера; в) критерия Кокрена; г) критерия Бартлетга. 2. Провести тестирование ряда на постоянство математического ожидания и дисперсии с помощью следующих непараметрических тес- тов: а) Манна-Уитни; б) Вальда-Вольфовитца; в) Сиджела-Тьюки. Задание 6.2 Имеется процесс скользящего среднего третьего порядка (СС(3)) Требуется: 1. Рассчитать коэффищ1енты ковариащ1и д. 2. Определить автокоррелящюнную функцию для этого процесса. 3. Построить график автокорреляционной функции для процесса У/= 1 + 6^ + 0,8 • £м-0,5 • £i_2-0,3 • ^^3. 231
Задание 6.3 Имеется процесс авторегрессии-скользящего среднего порядка (2.1) yt^ax' yt-\ + Oi • Ух-1-^ • £t-i' Требуется: 1. Записать автокорреляционную функцию в терминах а^ ainjSi. 2. Рассчитать ее для следующих значений параметров: С1Г1=0,6; ^2=0,3; Д =0,9; ^1=0,6; 02=0,3; Д =-0,9; ^1=0,6; о^=-0,3; Д =М),9. Задание 6.4 Имеются процессы авторегрессии первого и второго порядка. Требуется определить для них частные автокорреляционные функции. Задание 6.5 В табл. 6.3 приводятся данные о средних транспортных индексах в летний период 1999 г. Таблица 6.3 Период 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 1 19 Средний индекс 222,34 222,24 222,17 218,88 220,05 219,61 216,40 217,33 219,69 219,32 218,25 220,30 222,54 223,56 223,07 225,36 227,60 226,82 229,69 Период 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 Средний индекс 229,30 228,96 229,99 233,05 235,00 236,17 238,31 241,14 241,48 246,74 248,73 248,83 248,78 249,61 249,90 246,45 247,57 247,76 247,81 Период 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 Средний индекс 250,68 251,80 251,07 248,05 249,76 251,66 253,41 252,04 248,78 247,76 249,27 247,95 251,41 254,67 258,62 259,25 261,49 232
Требуется проверить на адекватность интегрированную модель сколь- зящего среднего (О, 1,1)- Задание 6.6 В табл. 6.5 приводятся данные процесса контроля качества. Таблица 6.5 No 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 Значение 60,0 81,0 72,0 78,0 61,5 78,0 57,0 84,0 72,0 67,5 99,0 25,5 93,0 75,0 57,0 N2 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 Значение 88,5 76,5 82,5 72,0 76,5 75,0 78,0 66,0 97,5 60,0 97,5 61,5 96,0 79,5 72,0 № 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 Значение 79,5 64,5 99,0 72,0 78,0 63,0 66,0 84,0 66,0 87 61,5 81,0 76,5 84,0 57,0 № 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 Значение 84,0 73,5 78,0 49,5 78,0 88,5 51,0 85,5 58,5 90,0 60,0 78,0 66,0 97,5 64,5 № 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 Значение 72,0 66,0 73,5 66,0 73,5 103,5 60,0 81,0 87,0 73,5 90,0 78,0 87,0 99,0 72,0 1 Требуется: 1. Проверить на адекватность модель АРСС (1,0,1). 2. Проверить на адекватность интегрированную модель АРСС (1,1,1). Задание 6.7 В табл. 6.8 приводятся недельные оценки запасов компании. Требуется: 1. Построить график данных. Таблица 6.8 1 Месяц Январь Февраль День 6 13 20 27 3 10 Запас 267 267 268 264 263 260 Месяц Июль Август День 7 14 21 28 4 11 Запас 1 258 259 268 276 285 288 233
1 Месяц Март Апрель Май Июнь День 17 24 2 10 17 24 31 7 14 21 28 5 12 19 26 2 9 16 23 30 Запас 256 256 252 245 243 240 238 241 244 254 262 261 265 261 261 257 268 270 266 259 Окончан:* Месяц Сентябрь Октябрь Ноябрь Декабрь День 18 25 1 8 15 22 29 6 13 20 27 3 10 17 24 1 8 15 22 29 е таблицы 6.8 Запас 1 295 1 297 292 299 294 284 277 279 287 276 273 270 264 261 268 270 276 274 284 304 1 2. Рассчитать коэффициенты автокорреляций, частных автокорреля- ций и использовать эту информацию для разработки адекватной прогноз- ной модели. 3. В случае нестационарности данных порекомендовать их корректи- ровку. 4. Построить интегрированную модель АРСС и провести тестирование ее адекватности. 234
ГЛАВА VII Модели финансовой эконометрики 7.1. ОБЪЕКТЫ ИССЛЕДОВАНИЯ ФИНАНСОВОЙ ЭКОНОМЕТРИКИ Временные ряды специфических (финансовых) показателей являются объектом исследования одного из самых «древних» направлений эконо- метрики - финансовой эконометрики, истоки которой лежат в XVI веке. Именно в те годы стали формироваться финансовые рынки и биржи - ис- точники исходной информации для теоретических и прикладных иссле- дований в этой сфере. К финансовым показателям обычно относят курсы акций, облигаций и других ценных бумаг, цены на ресурсы, курсы валют и стоимостные характеристики других товаров, сделок, реализуемых и заключаемых на этих рынках и биржах. Финансовый рынок является комплексным, многоплановым понятием. Теоретически его можно рассматривать как механизм реализации всевоз- можных активов по ценам, устанавливающимся на основе соотношения складывающегося на них спроса и их предложения. Часто финансовый рынок подразделяют на рынок ценных бумаг (акции, облигации, произ- водные ценные бумаги, типа форвардных, фьючерсных контрактов, оп- ционы и т.п.) и на рынок внебиржевых ресурсов (банковские услуги, зай- мы, кредиты и т.д.). По видам и составу сделок, их количеству, числу участников, значи- мости для экономики страны рынок ценных бумаг занимает ведущее по- ложение. Участниками этого рынка могут быть любые коммерческие ор- ганизации и частные лица практически без каких-либо ограничений по формам и видам деятельности. Ценная бумага является особой формой существования капитала, при которой ее владелец обладает не самим капиталом, а правами на него. Ценная бумага может передаваться другому лицу, обращаться на рынке как товар, приносить доход в виде дивидендов на отражаемый ею капи- тал. По своей форме ценные бумаги выступают в качестве документов, свидетельствующих об инвестировании капитала. 235
в частности, акция представляет собой долевую ценную бумагу, которая выпускается в целях привлечения капитала, необходимого для осуществления какой-либо предпринимательской деятельности (производства, торговли и т.п.). Она закрепляет за ее держателем (в зависимости от вида акции) право на получение части прибыли ак- ционерной компании в виде дивидендов, на участие в управлении и на часть имущества, остающегося после его ликвидации. Вместе с тем, размер дивидендов не всегда увязан с размером получаемой прибыли. Для обыкновенных акций он устанавливается на основании решения собрания акционеров. Для привилегированных - определя- ется уставом акционерной компании как фиксированная величина. Таким образом, выплата дивидендов по обыкновенным акциям не га- рантируется. Облигация является ценной бумагой, удостоверяющей отношения займа между ее владельцем (кредитором) и лицом, ее выпустившим (за- емщиком). Она, как правило, включает в себя обязательства заемщика по истечении определенного срока вернуть кредитору оговоренную на титу- ле облигации сумму и выплачивать фиксированный доход (процент от ее номинальной стоимости). Производные ценные бумаги обычно определяют права на сохранение определенных условий торговой сделки в будущем в связи с возможны- ми изменениями рыночных цен. Эти бумаги как бы страхуют их владель- ца от возможных чрезмерных потерь с связи с неустойчивой рыночной конъюнктурой. Наиболее распространенными из них являются фьючерс- ные контракты и опционы. Фьючерс представляет собой соглашение о покупке или продаже оп- ределенного количества данных товаров по согласованной цене к опреде- ленной фьючерсной дате. Опционы - контракты между двумя сторонами - предоставляют право покупателю (опционы покупателя) или продавцу (опцион продавца) ку- пить или продать соответственно определенное количество товара (цен- ных бумаг) по согласованной цене на определенный момент времени в будущем, но не налагают на них обязательство исполнять условия заклю- ченного контракта. Например, опцион на покупку золота по 300$ за ун- цию через 6 месяцев устанавливает право для покупателя приобрести оп- ределенное соглашением количество золота по этой цене. Если на момент совершения сделки цена за унцию золота превысит данный рубеж, то по- купателю окажется выгодным купить оговоренный объем. Если же цена на золото к этому времени упадет до более низкой отметки, то покупа- тель вправе не пользоваться опционом и приобрести необходимое ему количество товара непосредственно на рынке. Таким образом, опцион 236
покупателя устанавливает как бы верхний предел цены на интересующий его вид товара. Соответственно, опцион продавца устанавливает нижний предел цены на реализуемый им товар. В течение периода между сроками подписания и реализации опционов они сами могут стать объектами торговых сделок. Иными словами, оп- ционы продаются и покупаются на рынке, как и другие финансовые акти- вы. При этом естественно, что опцион покупателя ликвиден, если уровень оговоренной в нем цены ожидается ниже уровня рыночной, а опцион продавца ликвиден, когда уровень его цены выше ожидаемой рыночной цены на данный вид товара. Таким образом, очевидно, что на текущую стоимость опционов влияет целый ряд факторов - оговоренная в нем цена сделки, ожидаемый уровень рыночной цены (ее примерный закон распре- деления вероятностей), период времени, остающийся до реализации оп- циона (чем меньше его величина, тем больше вероятность правильного определения рыночной цены на товар) и т.п. В любом случае можно ска- зать, что цены на опцион подчиняются следующим ограничениям: цена опциона покупателя удовлетворяет соотношению О, если R > 5; [/?^У<5, если^?<5, а цена опциона продавца - соотношению О, если S>R\ [5^У</?, если5</?, где S - рыночная цена на товар, а Л - цена, оговоренная в опционе; У - цена опциона в интервале времени между моментами его заключения и реализации. На финансовых рынках различают «европейские» и «американ- ские» опционы (заметим, что эти термины не имеют географического содержания). Европейский опцион может быть использован только в день, оговоренный контрактом. Американский опцион может быть реализован в любой день с момента заключения контракта до его окончания. Финансовые рынки как бы подразделяются на две категории - пер- вичные и вторичные. На первичном рынке ценные бумаги приобретаются их первыми владельцами - инвесторами. На этом рынке осуществляется эмиссия (выпуск) ценных бумаг, устанавливается их первоначальная це- на, оговариваются права инвесторов и т.п. Поскольку каждая ценная бу- мага характеризует определенное направление вложения капитала, то можно сказать, что основной функцией первичного рынка ценных бумаг 237
является формирование первоначальной межотраслевой структуры вло- жения капитала путем «производства» специфического товара - ценных бумаг, и его первоначального распределения между владельца- ми=инвесторами. Здесь предполагается, что побудительным мотивом для такой сделки является возможность получения инвесторами прибыли на вложенный капитал. На вторичном рынке ценных бумаг осуществляется процесс их обра- щения путем перепродажи новым владельцам. Активными участниками этого рынка становятся спекулянты, стремящиеся получить доход за счет разницы цен на моменты покупки и продажи ценных бумаг (курсовой разницы). Обращение ценных бумаг осуществляется практически непре- рывно. Цены на них складываются под влиянием соотношения спроса и предложения, размеры которых в свою очередь формируются под воздей- ствием множества субъективных и объективных факторов. Важнейшим из них является опять же размер ожидаемой прибыли (дивидендов) на средства, вложенные в ценные бумаги. Экономическое значение вторичного рьшка ценных бумаг состоит в перераспределении первоначально сформированной первичным рынком структуры инвестиций. Вторичный рынок не влияет на общий объем ин- вестиций, но он обеспечивает их перераспределение из предприятий (от- раслей), исчерпавших возможности получения высокой прибыли, в пред- приятия (отрасли) с реальной перспективой эффективного экономическо- го роста. Кроме того, важнейшей функцией вторичного рынка является обеспе- чение возможности превращения ценных бумаг в наличные деньги, что предоставляет их держателям экономическую свободу в выборе форм и способов использования накопленного капитала. Для управления торговлей различными видами товаров и активов сформированы специальные организации, называемые биржами. Наибо- лее крупные из них расположены в Нью-Йорке, Чикаго, Лондоне, Ам- стердаме, Гонконге, Монреале, Париже, Токио и ряде других центров ми- ровой торговли. Биржа представляет собой бесприбыльную организацию, деятельность которой финансируется за счет членских взносов и оплаты за предоставляемые услуги, информацию. Обобщающей характеристикой любой сделки (купли-продажи) на бирже является цена (акции, единицы товара, контракта и т.п.). Финансо- вая эконометрика как раз и исследует закономерности, складывающиеся во временных рядах таких цен при определенных допущениях, позво- ляющих приблизить теоретические и прикладные предпосылки ее моде- лей к реалиям исходной информации. Основные из этих допущений свя- заны с правилами фиксации цены. Цены на реализуемые активы и товары 238
устанавливаются по результатам сделок и могут меняться по несколько раз за день работы биржи. В целях упрощения анализа, снижения неопре- деленности в исходных данных и, самое главное, для удовлетворения ос- новного допущения моделей временных рядов о равенстве интервалов между моментами фиксащш их значений эти цены в финансовой эконо- метрике фиксируются на определенный момент работы биржи. Как пра- вило, в качестве такого момента рассматривается время ее закрытия. Вместе с тем теоретически и практически вместо моментных значений цены возможно использовать и усредненные за некоторый период време- ни цены по результатам свершившихся сделок, которые тогда должны фиксироваться на момент времени, характеризующий середину периода усреднения. На основании этих данных можно сформировать временные ряды цен с любым промежутком времени между их значениями, т.е. с дневным, недельным, месячным и т.д. интервалом. Вместе с тем и в этом случае необходимо ввести некоторые допущения. Поскольку в выходные дни биржи не работают, то в реальных времен- ных рядах финансовых показателей (в дневных сериях) имеют место про- белы, относящиеся к субботам и воскресеньям. С целью соблюдения ус- ловия равенства временных интервалов между моментами фиксации со- седних рассматриваемых значений зависимой переменной ее уровни в выходные дни можно установить по показателям, имевшим место в пят- ницу и понедельник. Это несложно сделать путем их «усреднения». Либо для субботы принять уровень показателя пятницы, а для воскресенья - понедельника и т.п. Аналогичным образом решается проблема заполнения недельных про- белов, если такие возникают из-за перерывов в работе финансовых рын- ков в праздничные периоды (обычно на Рождество). Многие финансовые рынки функционируют в течение длительного периода времени (несколько лет, а некоторые и столетиями), и поэтому финансовая статистика сформировала достаточно длинные временные серии цен по целому ряду товаров, по соотношениям валют (цен на золо- то, нефть, на акции крупных компаний и т.п.). Таким образом, в финансовой эконометрике не возникает особых про- блем с формированием исходных данных в отношении зависимой пере- менной (цены), необходимых для построения описывающей закономер- ности ее изменения модели. Однако увязать эти изменения с вполне кон- кретными факторами, которые однозначно количественно могли бы быть выражены, практически невозможно. Более того, часто на финансовых рынках даже установить эти факторы чрезвычайно сложно. Многие из них неформализуемы, имеют разовый характер (смена правительства, на- 239
чало военных действий обычно вызывают значительные колебания в уровне финансовых показателей). На финансовые показатели также влияют «слухи», т.е. неподтвер- жденная информация, которая также не поддается количественному вы- ражению.^ В результате этого модели финансовой эконометрики обычно не используют независимые переменные. Их «правая» часть формирует- ся на основе других предпосылок, важнейшей из которых является предположение о том, что текущие значения рассматриваемого фи- нансового показателя в значительной степени предопределены его предыдущими значениями. Иными словами, закономерности его из- менения зависят от «характера», «свойств» наблюдаемой временной серии. При этом и выбор показателя для формирования временного ряда, от- ражающего финансовый процесс, в немалой степени определяет общий вид и свойства описывающей его эконометрической модели. Базовым финансовым показателем, как это уже было отмечено, является цена. Вместе с тем, часто она служит лишь отправной характеристикой для формирования более «подходящих» для моделирования временного ряда производных от нее показателей, динамика которых в некотором смысле обладает более ярко выраженными, более устойчивыми, теоретически на- гляднее объяснимыми закономерностями. Рассмотрим некоторые из этих производных показателей более подробно. Достаточно часто финансовая эконометрика оперирует показате- лями «дохода». Обозначим через Yt установленную на момент t цену то- вара, акции и любого другого продукта, реализуемого на бирже, и пред- положим, что за период (Г-1, t) его владелец не получит дивидендов. Темп прироста цены за интервал (г-1, t), рассчитываемый как ^ Приведем типичный пример результатов анализа факторов, повлиявших на изменение цен на ряд товаров, реализуемых на крупнейших финансовых рынках мира (Элина Шкурупий. Китайцы обрушили серебряный рынок. Известия, 29 февраля 2000 г., № 38. С. 12): «Цены на серебро начали падать после сообщения о резком увеличении биржевых запасов наличного металла на складах СОМЕХ. Также на понижение сыграли слухи о возможном поступлении в продажу боль- шой партии китайского серебра и о скором возобновлении работ на серебряных рудниках компании Penoles, крупнейшего мексиканского производителя этого металла... После заявления министра нефти Саудовской Аравии о том, что его страна поста- рается не допустить увеличения нефтедобычи и после окончания срока действия ны- нешних квот, мировые цены на нефть в очередной раз пошли вверх...» Благоприятный метеопрогноз для большей части зерносеящих регионов США привел к падению цен на пшеницу, кукурузу и сою-бобы и т.п. 240
Rt~-U (7.1) в научной литературе получил название «простого чистого дохода» (simple net return). Темп роста цены, определяемый как Qt=^ = l^Rt, (7.2) называется «простым валовым доходом» (simple gross return). Легко видеть, что валовый доход за к периодов от момента t-k до t, обозначенный через бХ^)=1+/гД), рассчитьшается как произведение од- нопериодных доходов е,да=1-ьл,(л)=^-^-...-^=(1+л,-,.,)х x(i+r,.^^2)-..--(i+/?r)=er-it+rer-it+2-..-Gr. (7.3) в свою очередь, чистый доход за к периодов определяется как вало- вый доход за этот интервал времени минус единица, т.е. ^г(^) = Т^ l = Qt(k)-\. (7.4) Ч-к+1 Существуют по крайней мере две причины, по которым финансо- вая эконометрика часто отдает предпочтение временным рядам дохо- дов по сравнению с рядами цен. Во-первых, есть основание предпола- гать, что для инвесторов финансовые рынки представляются доста- точно совершенными механизмами в том смысле, что уровень цен на них не зависит от размера инвестиций. В такой ситуации привлека- тельность вложений капитала не зависит от вида товара и вследствие этого определяется величиной дохода, а не уровнем его цены. Во-вторых, свойства временных рядов доходов, как правило, предпочтительнее с точки зрения статистики. Им, например, в боль- шей мере присуща стационарность, чем рядам цен. Однако взаимосвязи между однопериодными доходами и доходом за объединенный период, выраженные произведением (7.3), также не очень удобны с точки зрения статистического анализа. В частности, усреднен- ный за к периодов доход в этом случае рассчитывается как среднегеомет- рическое значение. Вместе с тем математическая статистика и эконометрика в большей степени оперирует среднеарифметическими показателями. Такую воз- можность представляет использование логарифмов доходов, которые на- зывают «непрерывно составными доходами» (continuously compounded 241
returns). Обозначим логарифмический доход в момент t через qt=ln(l+Rt)=ln Qt, Легко видеть, что между его уровнем qt и исходными ценами существует достаточно простая взаимосвязь, выражаемая, сле- дующим соотношением Y ^г=1п—^ = у,-у,_1, (7.5) где;;^ = 1пУ^. Преимущества показателя qt перед Qt становятся очевидными при рассмотрении логарифмического дохода за к периодов ^Д)=1п(1+ЛД))=1п[(1+Л,^^1).(1+/?,_,,2)-...(1+Лг)]^ =^/-*+1+^г-*+2+.-+^г. (7.6) Из выражения (7.6) вытекает, что логарифмический доход за к перио- дов является арифметической суммой однопериодных логарифмических доходов. Однако и логарифмические доходы имеют свои недостатки. Они не- удобны при анализе финансовых «портфелей», представляюищх собой взвешенную (в долях) сумму различных активов (акщш, инвестшщй и т.п.). Если /-я позиция такого портфеля имеет вес (долю) (Oi, тогда чистый доход от портфеля определяется как взвешенная сумма доходов различ- ных активов Rt=j:(OiRit. а Л) в то же время логарифмические доходы не представляют такой воз- можности для расчета логарифмического дохода портфеля, поскольку ло- гарифмирование правой части выражения (7.7) невозможно. Между простыми и логарифмическими доходами существуют не только функциональные взаимосвязи типа (7.5), но и взаимосвязи между законами их распределений^ В частности, статистические исследования реальных временных рядов цен также показали, что для логарифмических доходов достаточно правдоподобным является предположение о «нор- мальности» их распределения в каждый момент времени г, т.е. %-N(M,a,\ (7.8) где // и а/ - математическое ожидание и дисперсия распределения. * В соответствии с обьгшыми для эконометрики предположениями значения У,, ^„ Rh Qt'y ^= 1,2,... рассматриваются как реализации соответствующих случайных процес- сов, и для каждого момента времени эти значения рассматриваются как случайные величины. 242
Это, в свою очередь, значительно упрощает процедуры анализа зако- номерностей распределения простых доходов, которые в этом случае имеют логарифмически нормальное распределение с параметрами //+ ^1 (7.9) (7.10) В свою очередь, при условии «нормальности» закона распределения простого дохода с математическим ожиданием т и дисперсией а/ из (7.9) и (7.10) следует, что соответствующие показатели для логарифмиче- ского дохода определяются следующими выражениями М[д^] = М = ^^- т + 1 (7.11) 1 + СТ2=1П| 1 + ^ 2 .1\ т + 1 (7.12) Кроме предположения о «нормальности» распределения логарифмиче- ских доходов, финансовая эконометрика часто использует допущение, что многие переменные, являющиеся производными от основных финансовых показателей, оказываются распределенными по законам, относящимся к семейству распределений, называемому «классом стабильных распределе- ний». Более того, нормальное распределение также относится к этому классу. Характерная особенность класса стабильных распределений состо- ит в том, что сумма случайных величин, распределенных по какому-либо стабильному распределению, также распределена по этому же закону. Стабильные распределения, как правило, отличаются от нормального более медленным приближением к оси ординат их плотностей распреде- лений. Иными словами, на их «хвостах» накапливается вероятность более значительная, чем на «хвостах» нормальных распределений с теми же па- раметрами. Примером класса стабильных распределений является подкласс рас- пределений Коши. Функция плотности вероятностей для этого подкласса определяется формулой г \ п Уу2^^х-ЪУ (7.13) где Э - математическое ожидание; у - среднеквадратическое отклонение. 243
При Э =0 и у=1 выражение (7.13) определяет стандартизованное рас- пределение Коши. Установить, что случайная величина х, распределена, например, по га- уссову, а не по нормальному закону достаточно просто. На это указьшает значение эксцесса (коэффициента эксцесса), которое свидетельствует о мере <фазмытости» распределения по оси ординат. Напомним, что на практике эксцесс рассчитывается согласно следующему выражению: К=-^'^^ , (7.14) где JU - математическое ожидание и 05с - среднеквадратическое отклоне- ние величины Xf. Известно, что у «нормального» распределения случайной величины /ifs3. Большая <фазмытость распределения Коши приводит и к большему значению эксцесса, т.е. для распределения Коши с теми же параметрами, что и нормальное, эксцесс больше, чем 3 (К>3), Вследствие этого коэффициент эксцесса, как и другие моменты высо- ких порядков, достаточно часто применяются при обосновании и по- строении относительно широкого класса моделей финансовой экономет- рики. Модели финансовой эконометрики, описывающие динамические ряды финансовых показателей, разделяются на несколько классов в зави- симости от тех свойств, которые присущи рассматриваемым процессам. В частности, рассмотренный в главе VI комплекс моделей авторегрессии- скользящего среднего (АРСС(*, т)) нашел широкое применение в иссле- дованиях финансовых временных рядов, обладающих свойствами, харак- терными для стационарных процессов 2-го порядка. Вследствие этого, материал главы VI без каких-либо ограничений может быть использован и в сфере финансового анализа. Однако многие реальные финансовые процессы обладают другими, отличными от «слабой» стационарности свойствами. В их отношении финансовая теория выдвигает соответственно и специфические для них предположения, гипотезы, которые легли в основу классов моделей фи- нансовой эконометрики, отличных от моделей АРСС. Некоторые из этих гипотез рассматриваются в следующем разделе. 7.2. ГИПОТЕЗЫ ФИНАНСОВОЙ ЭКОНОМЕТРИКИ Различные классы моделей финансовой эконометрики базируются на тех или иных предположениях относительно корреляционных взаимосвязей, ха- 244
рактерных для наблюдаемого временного ряда определенного финансового показателя, в качестве которого могут выступать непосредственно цены, доходы (чистые, валовые, логарифмические), а таклсе их приросты, ошибки моделей и некоторые другие характеристики. Примером этих характери- стик могут являться также и функциональные преобразования финансовых показателей, например, линейные и степенные функции от них. Значительная часть таких взаимосвязей может быть определена общим выражением, означающим отсутствие автоковариационных свя- зей меэ/сду временными рядами, образованными различными функцио- нальными преобразованиями рассматриваемого финансового показате- ля, следующего вида: Cov(/(zr), g(Zt-d)=0, Л=1, 2,.... (7.15) В выражении (7.15) в качестве аргумента z функций/и g выступает одна из перечисленных выше характеристик финансового показателя (це- на, какая-либо из ее производных, функция от цены или ее производной и т.п.), рассматриваемая в моменты t и t-k соответственно. Выраэ/сение (7.15) часто называют ортогональным условием. Различ- ные сочетания входящих в него функций соответствуют вполне опреде- ленным предпосылкам относительно характера взаимосвязей во времен- ном ряду финансового показателя (исходные гипотезы), которые и кла- дутся в основу описывающей этот ряд модели. Рассмотрим некоторые из наиболее известных предпосылок более подробно. Одна из самых «старых» гипотез относительно взаимосвязей во временном ряду цен, лежащая в основе так называемой «мартин- гальной модели» (martingale model)\ предполагает отсутствие авто- корреляционных взаимосвязей между приростом цен при любых сдвигах. Случайный процесс У„ г=1,2,..., характеризующий динамику цены в этом случае удовлетворяет следующему условию: Л/[У,^11П,Ум,...]=К„ (7.16) которое эквивалентно соответствующему условию для приростов цен М[У,+1-Г,1 F„ Гм,...]=0. (7.17) Выражения (7.16) и (7.17) свидетельствуют о том, что условное мате- матическое ожидание цены в момент f+1 при известных ее значениях в периоды времени г, г-1, г-2,... равно ее значению в момент г, которое , в свою очередь, предопределено предшествующей динамикой этой цены ^ Ее основные положения вьп'екают из результатов работы Liber de Ludo Aleae (The Book of Games of Chance), опубликованной в 1565 г. итальянским математиком Джироламо Кардано. 245
или, что эквивалентно, условное математическое ожидание прироста це- ны за интервал (г, Rl) при известной ее предыстории равно нулю и, та- ким образом, прирост цены не зависит от предшествующих уровней цен. Последнее допущение также означает, что любые (по величине лага) не- пересекающиеся во времени приросты цен некоррелированы между со- бой, что предопределяет невозможность их предсказания с помощью ли- нейных моделей временных рядов, рассмотренных в главе VI. Таким об- разом, «лучший прогноз» цены на дату Г+1- это ее уровень на дату г. Условия (7.16) и (7.17) удовлетворяют предпосылкам так назы- ваемого «эффективного рынка», одна из важнейших среди которых свидетельствует о том, что текущая цена полностью предопределена информацией, содержащейся в ценах предыдущих периодов и не су- ществует никакой другой информации, поступившей в период (^, /+1), эксклюзивное владение которой позволяет участникам торговых сделок извлечь дополнительную прибыль. Следовательно, условное математическое ожидание прироста цены на ее предшествующие значения не может быть ни положительным, ни отрицательным, а «обязано» быть равным нулю, и изменения цены являются абсолют- но случайными и непредсказуемыми. С точки зрения «ортогонального» условия (7.15) предпосылки мар- тингалъной модели означают, что функция f является линейной с аргу- ментом, выраэюающим прирост цен в текущем периоде, а функция g моэюет быть любой по отношению к этому аргументу, рассматривае- мому в предшествующие периоды. Кроме линейной функции прироста в качестве g моэюет рассматриваться, например, любая степенная функция от этого аргумента, т.е. g(Ayt-k), g{Ayt-k),..., к=1,2,... . Достаточно широкий класс моделей финансовой эконометрики бази- руется на предполоэюении о том, что приросты цен эквивалентны слу- чайному процессу по своим свойствам близкому к «белому шуму». Это предполоэюением отраэюает сущность так называемой «гипотезы слу- чайного блуэюдания» (ГСБ). В научной литературе описаны три версии этой гипотезы, которые отличаются друг от друга содержанием, вклады- ваемым в понятие «белого шума». Согласно первой версии этой гипотезы - ГСБ-1, разработанной еще в начале XX века\ — случайные приросты финансового пока- ^ l.Bachelier I., 1900; «Theory of Speculation» in Cootner,P.(ed). The Random Char- acter of Stock Market Prices, pp. 17-78, Massachusetts Institute of Technology Press, Cam- brige, MA, 1964, Reprint. 2.Einstein, A. 1905. «Uber die von der molekular-kinetischen Theorie der Warme ge- forderte Bewegung von der in ruhenden Flussigkeiten suspendierten Teilchen», Annalen der Physik, 17; 549—560. 246
зателя (цены) и любые их функциональные преобразования незави- симы и удовлетворяют условию стационарности или, иначе, имеют идентичные условные распределения на уровни цен в прошедшие моменты времени. Таким образом, ГСБ-1 утвер^кдает, что динамика приростов цены по своим свойствам соответствует процессу «стро- гого белого шума». Как правило, закон распределения приростов пред- полагается нормальным N-(0, (Г)у в специальных случаях - стабиль- ным . С точки зрения выражения (7.15) это означает, что в качестве Д^/) и g(Zt-k) могут рассматриваться как линейные, так и степенные функции от приростов Z (например, квадраты и более высокие степени). Вместе с тем результаты анализа динамики многих финансовых пока- зателей, зафиксированных на мировых рынках, свидетельствуют, что продекларованное ГСБ-1 предположение об идентичности закона распре- деления их приростов часто не подтверждается, особенно на продолжи- тельных (свьпые года) периодах наблюдения. В значительной степени это относится к параметрам их закона распределения (обычно к дисперсии), хотя вид этого закона может и не изменяться. Например, дисперсия не удовлетворяет условию гомоскедастичности и меняется во времени. Процесс с независимыми, но неодинаково распределенными (имеются в виду условные распределения на уровни цены в прошлом) прираще- ниями, вообще говоря, не относится к разряду процессов «белого шума», поскольку в да1Шом случае он не является стационарным (точнее, не удовлетворяет условиям стационарности 2-го порядка). Вместе с тем от- каз от идентичности закона распределения приростов является ло- гичным развитием ГСБ-1, «смягчающим» ее достаточно строгие ог- раничения в отношении свойств приростов цены. Предположение о независимости приростов цены и неидентично- сти их условных распределений выражает сущность второй версии ГСБ - ГСБ-2. В частном случае ГСб-2 допускает случайные измере- ния значений рассматриваемого ряда. Таким образом, ГСБ-2, как ГСБ-1, предполагает, что как сами приросты, так и любые их функции независимы межцу собой. С точ- ки зрения (7.15), это означает, что функции Д^/) и g(zt-k) также не ог- раничены по форме. Они могут быть как линейными, так и степен- ными. ГСБ-2 была обоснована уже во второй половине XX века . * ГСБ-1 с распределениями приростов, отличными от нормального, рассмотрена в работе Fama,E.F.(1965) «The behaviour of stock market prices», Journal of Business, 38, pp.34—105. ^ Granger,C.W.J. and O. Morgenstem (1970). Predictability of Stock market Prices (Heath, Lexington, Massachusetts). 247
Снятие условия полной независимости процесса приращений цен приводит к третьей версии ГСБ - ГСБ-3, согласно которой автокор- реляционные связи меяоду приростами отсутствуют, однако автокор- реляция межцу их степенями может иметь место. Например, Co\(zt X g{Zt-k))i^, ДЛЯ некоторых сдвигов кФО. Таким образом, с точки зрения выражения (7.15), функции Д^г) и g{Zt-k) являются по форме линейными от приростов Z. Формально, если при этом cr/=const, то такой процесс остается ста- ционарным. Его свойства эквивалентны свойствам «слабого белого шу- ма» - стационарного процесса с независимыми значениями. Такой про- цесс можно рассматривать как частный случай стационарного процесса второго порядка с нулевыми автокорреляциями. Один из вариантов модели, соответствующей любой из рассмотрен- ных версий ГСБ, может быть записан в следующем виде: У, = т+Км + ^, (7.18) где т - ожидаемое постоянное изменение цены в период (г-1, г), Г=1, 2,...; St- случайный прирост цены в интервале (Г-1, t\ свойства которого удовлетворяют одной из версий ГСБ. С целью сохранения преемственно- сти в терминологии по-прежнему Bt будем называть ошибкой. Обычно при всех версиях ГСБ предполагается, что £t-N(0, О"/), либо она распре- делена по стабильному закону с нулевым средним. Для ГСБ-1 c7/=const, для ГСБ-2 g}^g}, что означает изменчивость дисперсии во времени, но в то же время ряды е^^ St-x, Вг-г,— являются статистически независимыми. При ГСБ-3 в отношении ст/ могут быть выдвинуты различные предположения. Рассмотрим некоторые общие закономерности динамики цены, выте- кающие из выражения (7.18). Подставляя в (7.18) последовательно значения /=1,2,... получим сле- дующую последовательность значений цен: У1 = m + Уо + ^; Уг-т-Ъ ч-Уо + ^ + ^Г» (7.19) Ут-т'Т-\- Уо + ^ + ^1 +...+^г-1. В силу независимости ошибок £Ь> ^ь £2»-.. и равенства нулю их матема- тического ожидания из последовательности (7.19) непосредственно выте- кает, что при тФО условное математическое ожидание цены в момент Т ' В более общем случае m=mf и т, =f{a, z) - детерминированная составляющая процесса изменения цены, вьфаженная уравнением с коэффициентами а и аргумента- ми, заданными вектором z. 248
на ее значение УЬ» зафиксированное в момент t=0, является линейной функцией от времени M[Yt\ Yo]=Yo+m-T, (7.20) Аналогично в силу независимости ошибок £^, г=1, 2,...; несложно пока- зать, что условная дисперсия цены Ут на ее значение Yq определяется как сумма квадратов ошибки €, D(Yj\Yo)=M[Y,-M(Y,\ Уо)]'=М[^o+f 1+... fr-if= zV* • (7.21) r=0 Для ГСБ-1, в частности, из выражения (7.21) вытекает, что в силу ра- венства М[^^]=Л/[^1^]=...=<т/, условная дисперсия D(Yi\Yo) с ростом t так- же растет во времени согласно линейному закону D(Yt\ Yo)=ae^'T. (7.22) В случае ГСБ-2 правая часть выражения (7.22) примет вид Y.^t' • г=0 Из выражений (7.20) - (7.22), в частности, вытекает, что при //=0 ус- ловное математическое ожидание M[Yt I Yq] =const, а условная дисперсия, как и в общем случае, увеличивается согласно линейной зависимости. Неограниченность роста условной дисперсии (7.21) в общем случае противоречит очевидному условию неотрицательности цены в любой момент времени, т.е. У/>0, ^=1, 2,... С целью избежания этого противоре- чия там, где оно может иметь место, модели финансовой эконометрики «работают» или с логарифмами цены у^1пКг, или с логарифмами доходов в этих случаях аналогами модели (7.18) являются следующие вьфа- жения соответственно: 3'/ = // + Ум + ^; (7.23) ^, = // + ^м + ^, (7.24) где показатели // и б^ имеют то же статистическое содержание, что и по- казатели mnet в модели (7.18), т.е. являются математическим ожиданием и ошибкой соответственно. Знание специфических свойств процесса изменения финансового пока- зателя позволяет подобрать (построить) адекватную его закономерно- стям математическую модель, которая более точно описывает исход- ный ряд У/> а следователыю, и обладает лучшими предсказательными способностями в отношении его будущих значений Yt+j, У/+2,... по сравне- нию с другими вариантами моделей. 249
Выявление этих свойств прежде всего предполагает умение соотно- сить свойства рассматриваемого процесса с какой-либо из версий ГСБ. Решение этой непростой проблемы обычно осуществляется с помощью спещ1альных тестов, которым подвергается исходный ряд цен У^, t=0, 1,... или какие-либо его производные характеристики (доходы, логарифмы цен, их приросты и т.п.). 7.3. ТЕСТИРОВАНИЕ ФИНАНСОВЫХ ПРОЦЕССОВ Для выявления соответствия свойств реального финансового процесса какой-либо из версий гипотезы случайного блуждания, каждая из кото- рых в свою очередь характеризуется специфической формой ортогональ- ного условия (7.15), обычно применяются специальные тесты. Поскольку финансовые процессы являются временными рядами, то в целом группи- ровка таких тестов аналогична группировке, рассмотренной в главе VI. Иными словами, все множество тестов разделяется на три группы: пара- метрические, полупараметрические и непараметрические. Более того, многие из рассмотренных в главе VI тестов могут быть использованы и в анализе финансовых процессов, разумеется, с учетом их особенностей. Основными из них являются большая продолжительность временного ря- да, что позволяет использовать асимптотические оценки; не обязательно нормальное распределение приростов (ошибки), что сужает возможности применения параметрических тестов. Как и для временных рядов в целом, при тестировании финансовых процессов достаточно широкое распространение получили непарамет- рические тесты, основанные на анализе закономерностей формирова- ния серий последовательных значений финансовых показателей с оди- наковым знаком и частот смены знаков у этих серий. Вместе с тем, в отличие от тестов временных рядов, рассмотренных в главе VI, кото- рые были ориентированы на выявление свойств случайности, стацио- нарности, непараметрические тесты финансовых процессов нацелены на проверку более жесткого ортогонального условия (7.15), предпола- гающего отсутствие во временном ряду финансового показателя или в ряду его функциональных преобразований автокорреляционных свя- зей. Один из базовых непараметрических тестов, разработанный еще в 1937 г. Коулсом и Джонсом^ для проверки ГСБ-1, анализирует законо- мерности формирования возрастающих и убывающих по величине после- ^ Cowles , А., Jones, Н. «Some А Posteriori Probabilities in Stok Market Action». Econometrica, 5,1937.pp.280—294. 250
довательных значении временного ряда и смены направления этих изме- нений. Данный тест не достаточно сильный. Более того, он в основном ориентирован на выявление автокорреляционных связей во временном ряду самого финансового показателя и, вследствие этого, даже в большей степени подходит для проверки других версий ГСБ - ГСБ-2 и ГСБ-3. Вместе с тем его идеи оказались достаточно плодотворными и на их ос- нове было развито целое направление тестирования ГСБ-1. Дадим описание этого теста на примере модификации модели (7.23), оперирующей с логарифмами цен yt--yt-\ + et\ (7.25) где yt=AnYt\ Yt - уровень цены актива в момент г, и математическое ожида- ние его прироста равно нулю, //=0. Тогда ошибку модели (7.25) можно представить как разность последовательных значений показателя у et = yt-yt-\ = ^yf (7.26) Значения Et являются случайными величинами с нулевым математиче- ским ожиданием. Они могут быть как положительными, так и отрица- тельными (включим в последнее множество и нулевые значения ошибки). Обозначим через /^ случайную переменную, принимающую только зна- чения О или 1 при следующих условиях: /.={'' ''^'' (7.27) Тест Коулса-Джонса основан на сопоставлении числа пар значений £^, 6^+1 с одинаковыми (положительными или отрицательными) знаками с количеством смен знаков во временном ряду Et. С этой целью с использо- ванием соседних значений It и /,+i сформируем величину At согласно сле- дующему выражению: ^F/r-/M+(l-/r)(l-/r^i). (7.28) Несложно убедиться, что на каждой паре /, и /,+i At принимает значе- ние либо О (если It и /j+i имеют разные значения), либо 1 (если значения It и //+1 совпадают). Тогда для любой последовательности 6^, г=0,1,2,..., Г, число Ns, рассчитанное как Л^, = еЧ (7.29) представляет собой количество пар значений ошибки St и б^+ь имеющих одинаковый знак, а число Nr, определяемое как Nr=T-Ns- (7.30) количество смен знаков у ошибки. 251
Если ГСБ справедлива, то при //=0 и дополнительном предположении о симметричности распределения ошибки, числа Ns и Nr должны быть приблизительно равными, а следовательно, и их отношение N N 5/? = ill. = -ili_ (7.31) Nr T-N, будет достаточно близким к единице. При достаточно больших значениях Т этот вывод является следствием теоремы Чебышева, вытекающим из пред- ставления (7.31) в виде отношения частот t^N^T и 7Cr=NtlT, ;^1-л^ кото- рые при Т—>оо определяют вероятности последовательностей £} и £}+i с оди- наковым знаком и смены знаков у этих значений ошибки соответственно SR^J1^ = ML'^J^^U1 = ,, (7.32) Л^^ N^/T \-7ts 1/2 РГ где символ « -> « означает сходимость в вероятностном смысле случай- ной величины SR к ее математическому ожиданию, в данном случае рав- ному единице. Заметим, что Ns является случайной переменной, сформированной как сумма Т случайных величин At, распределенных по закону Бернулли на множестве 1 и 0. Закон распределения At с ростом Т приближается к нормальному. Причем, поскольку для ошибки, определенной по формуле (7.26), имеем/7(£^>0)=р(б^<0)= 1/2, то из выражения (7.28) непосредственно вытекает, что p{At = 1) = (1/2)^ + (1-1/2)^ = 1/2; p{At = 0) = 1/2. (7.33) Из этого факта следует, что математическое ожидание величин Ns и Nr равно M[N,] = M[Nr] = 7t,'T = 7tr-T^-T, (7.34) а их дисперсия - D(Л^,) = Z)(Л^,) = л:,.л:,T = iг. (7.35) 4 Можно показать, (см. приложение 3 к главе УП), что в этом случае с увеличением Т закон распределения отношения SR=Ns/Nr также является нормальным с математическим ожиданием, стремящимся к единице, и дисперсией отношения D(Ns/Nr), асимптотически приближающейся к следующей величине: D(N, /Nr) = D{K, / л:,) -^ ^. (7.36) 252
Таким образом, проверка ГСБ с использованием теста Коулса-Джонса при небольших значениях Т состоит в установлении факта принадлежно- сти расчетного значения Ns IN г следующему интервалу: 1-г*(р*,Г-1)~<Л^,/Л^, <1 + г*(р*,7-1)~» (7.37) л/г л/г где г* (р*, Т-\) - табличное значение критерия Стьюдента, соответст- вующее уровню доверительной вероятности р* и числу степеней свобо- ды Г-1. При Г-^оо для этих же целей целесообразно использовать стандарти- зованное нормальное распределение, согласно которому ГСБ принимает- ся, если выполняется следующее соотношение: ...'^•'^f'>^.... (7.38) где пределы хх и Х2 находятся из равенства 1 ^ P*=\ll^(p(x)dx- (p(x) = -j=e 2 (см. выражение (6.32)). Если соотношение (7.37) выполняется, то временной ряд^^, удовлетво- ряет ГСБ с вероятностью/7* . Рассмотренный тест может быть усовершенствован и на более общий вариант модели (7.23), который, напомним, записывается в следующем виде: Уг = // + Ум + ^; где fjM\ St - значение случайной ошибки, распределенной по нормаль- ному закону, et -N(0, а/). В этом случае, поскольку //;tO, то случайная величина /„ определенная согласно выражению, аналогичному (J21\ имеет другое соотношение вероятностей: fl, Ay, > О, с вероятностью лг, ^ [о, Ау, < О, с вероятностью \-7С, где Дуг=Уг->'г-1=//+^. Очевидно, если //>0, то л>1/2, а при //<0, ж 1/2. В любом из этих случаев из выражения (7.28) вытекает, что вероят- ность щ оказывается равной Лi = л^ + (l--;^^ (7.40) 253
а вероятность Пг определяется следующей величиной: л-,= 1-я;. = 2л(1-л)1 (7.41) Тогда очевидно, что соотношение этих двух вероятностей окажется больше единицы 5/? = ^ = 5i±(lz^>,. (7.42) Математическое ожидание случайной переменной Ns, как и в преды- дущем случае, определяется согласно распределению Бернулли, т.е. M\Nsi-^s Т. Однако при определении дисперсии этой случайной величи- ны следует учитывать, что в каждой паре переменные At и At^\ зависимы между собой. В этом случае значение определяется следующим выраже- нием D{Ns) = Г- ;г,. (1 - ^.) + 2Г- cov(A„ A,^i), (7.43) где ковариация двух последовательных случайных величин At и At+\ рассчитывается согласно следующей формуле (см. приложение 1 к главе Vn): cov(A„ At^x) = л^ + (1 - ;^^ - л;Л (7.44) Коулс и Джонс показали, что случайная переменная SR из выражения (7.42) при больших значениях Г распределена приблизительно по нор- мальному закону с математическим ожиданием и дисперсией, определяе- мыми следующими выражениями соответственно (см. приложение 3 к главе VII): N. М SR = - T-N, . у ^-^s Га-л:,)^ Заметим, что в тех случаях, когда в модели (7.38) постоянная состав- ляющая прироста равна нулю, т.е. //=0, параметры распределения случай- ной величины SR, определенные выражением (7.45), равны 1 и 4/Г соот- ветственно (см. выражение (7.36)). С учетом выражения (7.45) тест Коулса-Джонса для проверки ГСБ со- стоит в следующем. Для модели (7.23) на основании временного ряда значений д',, /=1,2,...,Г, представляющих собой логарифм цены актива У„ т.е. yr=lnYt, определяются: а) постоянная составляющая прироста // и б) временной ряд ошибки £^. Заметим, что ju является средним приростом значений у„ т.е. 254
Z(yt+i-yt) М = -^ ^Zzizil (7.46) 7-1 r-1 В предположении, что ряд ошибки €t распределен по нормальному за- кону с нулевым средним и дисперсией ст/=о^, т.е. б^~МО,сг/) можно оце- нить вероятность события It =1, т.е. значение я; согласно следующему выражению: л: = р(€, > 0) = Ца^'/Мёх = Ф(м/(Т), (7.47) где Дх) - плотность стандартизованного нормального распределения и Ф(///о)- табличное значение интеграла вероятностей. Подставив найденное значение л* в выражение (7.45) непосредственно получим теоретические значения параметров распределения отношения SR, Если его расчетная (эмпирическая) величина, определяемая как T-N, , где Ns = 2А/ и At определено выражением (7.28), и /, - выраже- нием (7.27), удовлетворяет соотношению ^' -г(а,Г-1).(Т(5/?)<- ^' ^ ^' 1-;г, r-iV, 1-;г, (7.48) +T(p.J-l)'(T(SR\ то ГСБ принимается с вероятностью/?♦, где 7(р*, Г-1)- табличное значе- ние критерия Стьюдента, соответствующее доверительной вероятности/?♦ и числу степеней свободы Г-1 ; o(SR) определяется как корень из диспер- сии D(SR), в свою очередь, рассчитанной согласно (7.45). В научной литературе описано целое семейство тестов ГСБ, основан- ных на прямых методах выявления корреляционных связей при различных лагах, как в самих временных последовательностях, так и во временных рядах функциональных преобразований их значений. Такие тесты, напри- мер, предполагают оценку значимости коэффициентов автокорреляции временных последовательностей логарифмов цен ур1пК/, ошибок £; в мо- делях типа (7.23) и других в предположении, что случайная величина, представляющая собой коэффициент автокорреляции /-го порядка, /=1, 2,... к, при больших значениях Т распределена по стандартизованному закону нормального распределения, т.е. г/ ~N О,— , где D(ri) (см. главу VI, выражения (6.25), (6.26)...). Тогда переменная V^r^ распределена по стан- дартизованному нормальному закону с нулевым средним и единичной дисперсией л/Гг,- - N(OX). В этом случае тест заключается в проверке зна- 255
чимости первых к коэффициентов автокорреляции. Если в ходе тестирова- ния подтверждается их незначимость, то ГСБ принимается. Для этих же целей может быть использован совокупный критерий со- гласия Бокса-Пирса (см. выражение (6.116), глава VI). Напомним, что случайная величина Qk, рассчитываемая как Qk-TJ:r^ , (7.49) при больших Т распределена по закону J^{k). В соответствии с этим ги- потеза об отсутствии автокорреляции в рассматриваемом временном ряду принимается, если выполняется следующее соотношение Qk<;^ip*.kl (7.50) Заметим, что при небольших значениях Т величину критерия Qk ре- комендуется определять согласно следующей формуле: (2;t=r(r + 2)i^. (7.51) Учет некоторых других свойств временного ряда финансового показа- теля, соответствующих ГСБ, наряду с отсутствием автокорреляционных связей позволило сконструировать несколько более эффективные тесты проверки ГСБ по сравнению с «чисто автокорреляционными» тестами. Одним из основных среди этих свойств является линейная зависимость условной дисперсии временного ряда от времени (см. выражение (7.22)). Как уже отмечалось, это свойство в большей степени характерно для ГСБ-1. Однако и в случае других версий ГСБ характерно, что дисперсия суммы значений временного ряда равна сумме дисперсий каждого из них (см. выражение (7.21)). В такой ситуации можно ожидать, что в условиях справедливости пред- положений ГСБ дисперсия суммы двух последовательных значений вре- менно ряда qt и qt-\ будет приблизительно равна удвоенной дисперсии значения qt (см. выражение (7.5)). Напомним, что поскольку Y qt = l^TT" = 1^^t "^^^М' то qt + qt.x = 1пУ, - 1пУ,_2 = Уг - Уг-г- (7.52) Обозначим сумму qt+qt-i как qt (2), т.е. qt (2)=qt+qt-b и составим отношение дисперсий значений qt (2) и удвоенной дисперсии значе- ний исходного ряда qt, ^=l, 2,..., Г; которое обозначим как VR (2). По- лучим 256
VR(2) = ^^^^^ = ^^^Il1E1z11 = 2D(,,) 2D(„) ^^^^^ _^2D(q,) + 2cov(q,,q,_0 ^^ ^ ^^ 2D(q,) ^' где г\ - пд)вый коэффициент автокорреляции ряда ^,. В случае справедливости ГСБ можно ожидать, что поскольку г\—>0, то отношение дисперсий будет близко к единице, т.е. V7?(2)—>1. При этом, если во временном ряду qt имеет место положительная авто- корреляционная связь, то VR(2)>1, С точки зрения выражений (7.21) и (7.22) это означает, что условная дисперсия суммы двух последова- тельных значений временного ряда qt будет нарастать быстрее, чем по линейному закону. При отрицательной автокорреляции (ri<0) VR (2)<1, т.е. рост дисперсии этой суммы будет медленнее линейного закона. Для построения теста, проверяющего ГСБ на основании отношения дисперсий V7?(2), необходимо знать закон распределения этой случайной величины. Интуитивно на основании выражения (7.52) можно ожидать, что закон распределения V7?(2) совпадает с распределением случайной переменной 2ri, которое, как было отмечено в главе VI, при ri—>0 при- близительно нормальное с математическим ожиданием, равным нулю, и удвоенной дисперсией. Напомним, что дисперсия случайной переменной П (D(ri)) приблизительно равна 1/Г. В нашем случае можно ожидать, что ее величина составит 2/Г, т.е. D(2r\)=2/T. Иными словами, случайная ве- личина v7^(V7?(2)-l) оказывается распределенной согласно нормальному закону М0,2): Vf(V/?(2)-l)~ ЛГ(0,2), а величина Vr(V/?(2)-l) ^ ^^^^^^ V2 распределена по стандартизованному нормальному закону. Для более строгого доказательства этого интуитивно предполагаемого результата рассмотрим процесс, определенный выражением (7.23), в мо- менты времени Г=0,1,2,...,2Г. Оценки параметров математического ожида- ния постоянного прироста // и дисперсии D{y)-Cf^ определим согласно следующим выражениям: 2Т 9 Эконометрика М[//] = Д = ^Х(>'г-3'м) = ^(3'2Г-)'о); (7-54) ОТ от ^f ~l(yt-y.-i -Д)' =:^1^': (7.55) ^^ Г=1 ^^ t=\ т т ^2 =^1.(У.-У.-1 -2Д)' =7l(^2r +^2м)'- (7.56) 257 Т^г Ти
Заметим, что оценка дисперсии а^ - Oi получена на основании чет- ных значений рядау,, т.е. для двойного периода времени между наблюде- ниями (t, t+2). За такой период постоянная составляющая прироста равна 2/4 а ошибка равна сумме ошибок интервалов {t, Н-1) и (f+1, t+1) , т.е. (£2,+£2/+l). Оценки а\' и (^ дисперсии а^ являются случайными величинами, подчиненными нормальному закону распределения (см. приложение 2 к главе УП). При этом ( 2аМ (Г\ -Ща1,-::1-\; (7.57) ai-m ^' 27- 2Г ■Л^ а^ —1 У' 2Т J (7.58) Таким образом, из выражений (7.57) и (7.58) следует, что дисперсия оценки Gi оказывается в два раза больше, чем дисперсия оценки G\, Здесь учтено, что при оценке а\ число степеней свободы равно 2Г, а при оценке Oi число степеней свободы равно Г. Заметим, что в соответствии с (7.52), отношение Gi 1о\ представляет собой случайную величину VR (2), определенную выражением (7.53). Это следует из того, что D{yf¥yt^\)^Gi, а D(yt)=Oi^, Иными словами. V/?(2)=c^W. (7.59) Используем формулу Тейлора для оценки сначала математического ожидания отношения VR (2). Получим (см. выражение (7.199) приложе- ния 3 к главе VII) Ad[VR(2)]=L am Далее согласно этой же формуле найдем дисперсию переменной (V/?(2H) = (T^-(Tf ^^2 которая, как показано в этом же приложении, оп- '1 ределяется выражением D[W?(2)-1]= 27 (7.61) где, напоминаем, в данном случае 2Т - количество степеней свободы процесса >;г»^=0,1,2,...,2Г . Таким образом, в случае справедливости ГСБ отношение V7?(2) при Т-^оо распределено приблизительно по нормальному закону, т.е. 258
(VRi2)-l)~N\0,—^ , откуда в свою очередь следует, что нормированная по среднеквадратическому отклонению случайная величина z распреде- лена согласно стандартизированному нормальному закону ^Щ^У^^МШ). (7.62) V2 Результат (7.62) совпадает с рассмотренным выше интуитивным пред- положением. Из выражения (7.62) непосредственно вытекает, что справедливость ГСБ может быть подтверждена или отвергнута на основании сопоставле- yf2r(VR(2)-\) ния расчетного значения z = 7= с пределами интегрирования V2 стандартизованной плотности нормального распределения при заданной доверительной вероятности/?♦ и значении Г+1 - числе измерений времен- ного ряда}^,, /=0,1,2,..., Т. Иными словами, ГСБ принимается, если удовлетворяется соотноше- ние xi<z<X2, (7.63) гдех1 идс2 находятся из выражения p(xi <z< Х2)=р*= Д (p(x)dx, ИЛ1=-;С2, 1 ^ х-Мт)', (р(х)=-==е 2 . л/2л- В частности, при/7*=0,95 ГСБ справедлива, если интервал (7.63) имеет следующие пределы: xi =-1,96, ^2=1,96. Рассмотренный тест несложно преобразовать для случая 2-го, 3-го и т.д. коэффициентов автокорреляции приростов ряда у/ и, следовательно, отношений V7?(3), УЛ(4),.... В частности, отношение V7? (3), на основании которого может быть проверена гипотеза о равенстве нулю 2-го коэффициента авто- корреляции ряда приростов процесса у„ формируется следующим об- разом: 0-2 VRi3)=^, (7.64) 9« 259
где, в свою очередь, числитель g^ определяется следующим выражением: о\ =:^£(Узг -Уъг^ъ -3//)^ . (7.65) Остальные характеристики, т.е. // и Oi , определены как и раньше вы- ражениями (7.54) и (7.55) соответственно. Как и в случае V7f(2) можно показать, что случайная величина л^(^/?(3)-1) распределена при Г -><» по нормальному закону с пара- метрами (0,4). В общем случае случайная величина yfnf(yR(n)-l) имеет также асимптотически нормальное распределение N(0,2(n-l)), Гипотеза о спра- ведливости ГСБ в данном случае подтверждается с вероятностью ;?♦, если расчетное значение VR(n) удовлетворяет соотношению (7.63) при случай- ной величине z, определяемой следующим выражением: Z = . —. (7.66) Таким образом, рассмотренные тесты позволяют проверить справедли- вость основной предпосылки всех версий ГСБ - отсутствие автокорреля- щюнных связей в ряду приростов финансового показателя у,, ^=1,2,..., Г; yr=\nYt, Однако подтверждение этого предположения еще не указывает на конкретную версию ГСБ. Напомним, что различные версии ГСБ отличают- ся друг от друга либо наличием определенных закономерностей в рядах фушщиональных преобразований этих приростов (ошибок), либо особыми свойствами дисперсии ошибки (гетероскедастичность). В частности, на- помним, что ГСБ-1 и ГСБ-2 предполагают полное отсутствие коррелящ!- онных связей между временными рядами квадратов значений ошибки (а также их третьих, четвертых степеней и т.п.). ГСБ-2 допускает некоррели- рованные изменения дисперсии этого процесса в рассматриваемом интер- вале, а ГСБ-3 допускает существование коррелящ10нных взаимосвязей во временных рядах значений ошибки, возведенных во вторую, третью и т.д. степени, различных комбинащш рядов, полученных в виде произведений разновременных значений ошибки, т.е. типа e^-St^ и £j£j_y и т.п. Таким образом, при справедливости ГСБ-1 дополнительно к условиям типа co\(£t, etj)=0, /=1,2,... должны выполняться условия, свидетельст- вующие об отсутствии автокоррелящюнных связей в рядах квадратов ошибки, ее произведений четвертого порядка и т.д., что эквивалентно следующим соотношениям: М[€?, eli ] = О, М[£^, e^^j, €t, £,.,. ] = О, (7.67) где sMyr-yt-i-Ml 260
При нарушениях условия (7.67) рассматриваемый процесс удовлетво- ряет условиям ГСБ-3. В этом случае для проверки соответствия свойств рассматриваемого процесса предпосылкам ГСБ-1 или ГСБ-3 тестированию должны быть подвергнуты также временные ряды квадратов ошибки и их разновре- менных произведений. При этом могут использоваться те же самые тес- ты, которые были рассмотрены в разделе 7.3. Справедливость предпосылок ГСБ-2 обычно устанавливается пугем проверки условия постоянства дисперсии приростов в ряду рассматри- ваемого финансового показателя. Если условие M[et^] = const (7.68) на интервале /=1,2,..., Т не выполняется, процесс удовлетворяет предпо- сылкам ГСБ-2. В случае выполнения этого условия рассматриваемый процесс удовлетворяет условиям ГСБ-1 (разумеется, при выполнении также условия (7.67)). Для проверки условия (7.68) можно использовать тесты, основанные на критериях Фишера, Кокрена, Сиджела-Тьюки и другие, описанные в главе VI. Заметим, что рассмотренные в данном разделе тесты обычно ис- пользуются в исследованиях свойств временных рядов финансовых показателей с глубиной интервала наблюдений, не превышающей 1-2 года. В последнее время в научной литературе вырос интерес к ис- следованиям свойств временных рядов со значительно более обшир- ной предысторией, охватывающей 10-летний и более продолжитель- ные периоды. На таких интервалах в целом трудно ожидать выпол- нения предпосылок ГСБ-1. Однако и их нарушение можно обнару- жить, лишь сопоставляя свойства процессов на различных достаточ- но больших временных промежутках, поскольку в период из 100-500 наблюдений такие процессы часто обладают свойствами строгого «белого шума». Проверка таких свойств (соответствие предпосылкам ГСБ-1 на отно- сительно коротких временных интервалах и соответствие ГСБ-2 или ГСБ- 3 на длинных интервалах) осуществляется с использованием специально- го класса тестов (тесты сверхдлинных временных серий), рассмотрение которых выходит за рамки данного раздела. 7.4. МОДЕЛИ ГСБ.1. БРОУНОВСКОЕ ДВИЖЕНИЕ Одной из достаточно широко известных моделей финансовой эконо- метрики, описывающих процессы с непрерывным временем, удовлетво- ряющие предпосылкам ГСБ-1, является модель, получившая в научной 261
литературе название «Броуновского движения». Ее формирование осуще- ствляется следующим образом. Предположим, что временной ряд логарифмов цены актива yt=\nYt в моменты г=0,1,2,... может быть представлен в виде дискретного про- цесса >'г = Ум + ^, (7.69) где случайный прирост St принимает в каждый момент времени t одно из двух значений: ^с вероятностью лги -^с вероятностью 7t-\-w. [^ с вероятностью к, \-^ с вероятностью к'-{\-к). Закономерности изменения значений yt при фиксированном уо будут определяться, таким образом, тенденциями, характерными для частичных к сумм ошибок Y^Ex ,к- 2,3,.. .,az. r=i При 3^0=0 обозначим такую сумму как y*(0 = Zf,. (7.71) Предположим, что на интервале (О, Т) временной промежуток (Г, Г+1) стремится к нулю, (Г, г+1)=А-»0 и, таким образом, л—>оо, поскольку nh=T, В такой ситуации y]f^i) переходит в процесс с непрерывным временем. Для того чтобы процесс у\^ (t) удовлетворял предпосылкам ГСБ-1, необ- ходимо, чтобы его математическое ожидание и дисперсия соответствова- ли выражениям (7.20) и (7.22). Таким образом, имеем: МЬп(Т)]=м^ (7.72) D\y,(T)] = <^''Z (7.73) где в нашем случае ^^ =0"/. Представим процесс у^ (О как сумму двух процессов, подчиненных за- кону Бернулли, yk(t)=y\(t)-^y^'k(t\ где у\ (г) и y^k (О определены как Х^г» t=\ но для y\(t) значение ошибки в момент t определено в следующем виде: Г^ с вероятностью тг, [О с вероятностью лг =(1-яг). а для y^k (О - в виде: Го с вероятностью я", [-^ с вероятностью Я"' = (1-Л'). 262
Несложно заметить, что в этом случае математическое ожидание про- цесса yj^t) равно сумме математических ожиданий процессов y^iii) и y^j^i). С учетом (7.72) имеем 1^п{Т)]М{уХТ)]^ЩУп\т^пфп7^{-^п{к^^^ (1.14) Дисперсию суммы процессов y^iJit) и y^iJit) определим с учетом корре- ляционной связи между ними следующим образом: DЫt)]=D\y,\t)-^Уk\t)]=D\yk\t)]-^D\y^^^^^^^ (7.75) В силу условия ;f-¥^=l можно показать, что ковариация процессов У^к (О и у^к (О определяется следующим выражением^ cow(yk\tl yk\t))=^k^tf^-^=k^if^\ (7.76) С учетом того, что согласно закону Бернулли D[yk(t)]=D[yi^(t)]=k7rnf^^ в соответствии с (7.75) получим : 0(уп(Т))=4;гп!^\ (7.77) При произвольных фиксированных значениях ^и я'и неограниченном росте п получим, что на ограниченном интервале (О, Т) математическое ожидание и дисперсия процесса Уп(Т) в соответствии с (7.74) и (7.77) мо- гут быть неограниченно большими. Требования ограниченности матема- тического ожидания и дисперсии процесса Уп(Т) при конечном верхнем пределе Т обусловливает необходимость выполнения следующих соот- ношений для значений ^и ;г: п(л:-л:0^ = ^(л:-л:0^ = /Я'; (7.78) 4пял-?^ =-4л7Г?^ = а^Т. (7.79) h Решая эти уравнения совместно относительно неизвестных ^ и тг при условии А—>0, получим: 2 (1.мЩЛ-о(^)., (7.80) V "^ 2 где Owh] - бесконечно малая величина, зависящая от ' Выражение (7.76) может быть получено с учетом того, что при /=1 cov(>','(l).yi'(l)) = М(^- М{^Н-^- Л/(-а)] = (^я^(-|-я'(-а) = -^ W. 263
Таким образом, процесс ук(0 удовлетворяет ГСБ-1 при условии, что с приближением интервала (г, г+1) к нулю вероятности тги лf стремятся к 1/2 сверху и снизу. Можно также показать, что при п—>оо распределение у(Т) является нормальным с математическим ожиданием //Г и дисперсией с^Г, y(T)-N(juT, б^Т) (в соответствии с инте^альной теоремой Лапласа) и для него характерны следующие свойства: а) для любых ti и t2 (0<ti <t2 ^Т) y(t2 - ti) - N(p(t2 - ri), o^. (Г2 - ^i)) (7.81) б) для любых tu t2, h и Г4 (0<ri <Г2<Гз< и ^Т) cov[(y(t2) - y(h))(y{t4) - y(h))] = 0. (7.82) Равенство (7.82) означает, что приращения процесса y(t) в непересе- кающихся интервалах независимы между собой. В соответствии с (7.81) несложно получить выражения для условных математических ожиданий и дисперсий процесса y(t), аналогичные выра- жениям (7.20) и (7.22): M\y(t) I y(to)>y(to)-^M(t4o); (7.83) Db(t)\y(to)]=cl^(t-to). (7.84) Из (7.82) вытекает, что ковариация значений процесса y(t), взятых в различные моменты времени ti и Гг, t2>tu равна дисперсии этого процесса в момент ti COW(y(tiXy(t2))=COV(y(tily(t2)-y(ti)'^y(ti))= = cov();(ri),);(r2)-3^(ri)))+cov(>;(ri),3;(ri)=D(y(ri))=o2(ri), (7.85) поскольку co\(y(ti\y(t2}-y(ti)))=0. Несложно заметить, что выражения (7.81)-(7.85) удовлетворяют пред- посылкам ГСБ-1. Процесс у(г), обладающий свойствами (7.81)-(7.85), называют арифме- тическим броуновским движением. В общем случае его выражение имеет следующий вид: y(t)=Mt+a'B(tX ^ (7.86) где B(t) называют стандартным броуновским движением, для которого M[B(t)]=Oy D[5(r)]=l. Таким образом, условные математическое ожидание и дисперсия процесса B(t) в момент Т в соответствии с (7.83) и (7.84) оп- ределяются следующими значениями: М[В(Т)\Вт = 0; D[B{T)\B(0)] = Г. (7.87) 264
Процесса броуновского движения, определенный выражением (7.86), характеризуется рядом особенностей. Рассмотрим некоторые из них бо- лее подробно. Дисперсия стандартного броуновского движения не зависит от уровня финансового показателя y(t\ По существу процесс B(t) определяет слу- чайные изменения отношения Ау/у. В то же время выражение (7.86) опи- сывает процесс изменения абсолютных значений финансового показателя во времени с учетом возможной его тенденции jut и сл)^айных отклоне- ний от нее, определяемой компонентой cBit), При этом величина а как раз и характеризует среднеквадратическое отклонение финансового пока- зателя от его уровня у(0. Рассмотрим изменения случайного показателя, закономерности кото- рого определяются выражением (7.86), за бесконечно малый интервал времени dt. На основании (7.86) можно записать: dy(t)=fjdt-hodB(t). (7.88) В выражении (7.88) компонент fidt характеризует ожидаемое измене- ние значения >/ за интервал dt, а компонент GdB(t) - случайное изменение. Однако дифференциал dB(t) случайного процесса B{t) нуждается в опре- деленном математическом обосновании, поскольку его содержание отли- чается от содержания аналогичного понятия, используемого в классиче- ской математике. Заметим, что поскольку дифференциал dB{t) представляет собой при- рост случайной величины с определенным законом распределения (Л^(0,1)) за бесконечно малый временной интервал, то он сам является случайной величиной. Его первые два момента определяются с учетом независимости значений переменной B{t) в разные моменты времени и выражения (7.87) следующим образом: M[dB(t)\ = lim M[B{t + h)- B(t)] = 0 . (7.89) D[dB(t)]= lim M[(B(t + h)-B(t)f] = h. (7.90) co\[dB{t\dB(t)] = lim M[(B(t + h)'-B(t)f] = h. (7.91) В силу независимости dB{i) и dt-h также имеем M[dB{t){h)] = lim M[{B{t + Л)- B{t)\/i] = О. (7.92) Таким образом, случайная переменная dB{t) распределена по нормаль- ному закону с нулевым математическим ожиданием и дисперсией, и ко- вариацией, равными dt. 265
в научной литературе случайную величину dB(t) называют стохасти- ческим дифференциалом. Заметим, что модель арифметического броуновского двиэк:ения, оп- ределенная выраэюением (7.86), на практике немолсет быть использова- на при описании динамики непосредственно уровней цен на финансовые активы Yt, t=l,2,.,., поскольку цены не могут принимать отрицательные значения, в то время как выраэк:ение (7,86) в общем случае не гарантиру- ет выполнения этого естественного ограничения из-за возмоэюного dB(t)<0. Кроме того, непосредственное использование цен в модели (7.86) не- целесообразно и с содерэк:ательной точки зрения. Заметим, что пока- затель [Л в этом выраэюении представляет собой ожплдаемый абсо- лютный доход на единицу времени вне зависимости от уровня у. Если вместо у использовать цену актива Y^e^, то в соответствии с выра- эюением (7.86) окаэ/сется, что доход не связан с уровнем его цены. На практике от уровня цены не зависит ставка дохода, т.е. отношение прироста цен к базовой цене. Чтобы учесть это практическое условие, модель изменения цен должна определять абсолютный доход, являю- щийся функцией от цены актива, со ставкой дохода, не зависящей от этого показателя. Модель (7.86) относительно преобразования У= е^ определяет про- цесс геометрического броуновского движения, который также назы- вают Ито-процессом или Ито-стохастическим дифференциальным уравнением. Конструктивно арифметическое броуновское движение преобразо- вать в процесс геометрического броуновского движения можно, пред- положив, что модель (7.86) описывает процесс изменения ставки доход- ности dY{t)IY{t), которая не зависит от цены финансового актива Y{i). В этом случае получим следующее уравнение относительно прироста це- ны dY{t)\ dY = mdt + (7B(t); Y(t) dY(t) = m'Y(t)dt-^(T'Y(t)B(t), (7.93) где m - математическое ожидание процесса dY(t)/Y(t). Выражение (7.93) можно полу^шть и формальным путем, воспользо- вавшись результатом леммы Ито. Ито доказал, что если z(t) стохастиче- ский процесс арифметического броуновского движения, то его любое функциональное преобразование Дг,0 удовлетворяет следующему сто- хастическому дифференциальному уравнению: 266
Подставляя в нашем случае в (7.94) вместо Дг,0 е^^^ =Y(t) непосредст- венно получим dY(t) = ^dyitHi^^idyit)f = ey^'Uym^ey^'\dy(t)f = = Yit)(Mdt + adB(t))+-Y{t){<j^dt) = =1.4-^ Y(t)dt + a • nt)dB(t) = mY(t)dt + a • Y(t)dB(t), (7.95) 1 2 « « где m = ju+—a - математическое ожидание случайной величины —JinK(r), Y(t) =e^'^ иy(r) ~Л^(//, o^) (cm. вьфажение (7.9)). При выводе соотношения (7.95) учтено, что при dt-^0 в соответствии с (7.89)47.95) при dt=h имеем {dy(t)f=(ji-dt+a-dB(t)f= =jU^(dt)h(/{dB(t)f-\-2jU(KdB(t))(dt)=c^dt, (7.96) Из выражения (7.95) вытекает, что математическое ожидание и сред- неквадратическое отклонение процесса геометрического броуновского движения в момент t пропорционально уровню цены актива Y(t). Анало- гично в этом случае можно сказать, что относительное изменение цены актива dY(t)/Y(i) имеет характер арифметического броуновского движе- ния, соответствующего ГСБ-1. Заметим, что процессы арифметического и геометрического броунов- ских движений содержат только по два неизвестных параметра (// и cf) и 1 2 (mud) соответственно. При этом т = /1Л—а . Их значения несложно оценить на основании известных значений дискретного временного ряда цены актива yM^Yt (см. выражения (7.46), (7.54), (7.55) для этого процес- са). Предположим, что непрерывный интервал (0,7) разбит на Л^ участков, каждый из которых имеет длину А. Значения у измерены в точках nh, где M=0,1,...,N. Тогда для оценки параметров броуновского движения на практике можно использовать следующие выражения: М = 47ЪупН-Уп) = ^^Чг^' (7.97) 267
^^ =Т7Ц l'(yn+i-з'п->")'; (7.98) При этом полученные оценки являются асимптотически несмещенны- ми и эффективными, подчиняющимися нормальному закону распределе- ния с дисперсиями, определяемыми следующими выражениями : D(M)=^\ am N D((T^ = ^. (7.100) Из последнего выражения, в частности, вытекает, что, если на фикси- рованном интервале времени увеличить количество измерений, т.е. при фиксированном T^N-K расстояние между интервалами А устремить к ну- лю, тогда N-^oo, и в соответствии с (7.100) получим D{a ) = > О. N 7.5. МОДЕЛИ ФИНАНСОВЫХ ПРОЦЕССОВ С ИЗМЕНЯЮЩЕЙСЯ ВАРИАЦИЕЙ (ГСБ-2ИГСБ-3) В последние два десятилетия в финансовой эконометрике бурно развивается направление, связанное с разработкой моделей процессов изменения цен, характерной чертой которых является изменяющаяся дисперсия (вариация), безусловная или условная. Различные варианты изменения дисперсии предусмотрены ГСБ-2 и ГСБ-3. Такие модели получили название моделей изменяющейся вариации {models of changing volatility). Изменения в вариации как раз характерны для ря- дов финансовых показателей, в которых автокорреляция в ряду значе- ний У(г) отсутствует, но отклонения этих значений от математического ожидания характеризуются ярко выраженными аномалиями (наблю- даются резкие изменения в отклонениях - случай ГСБ-2), либо имеет место корреляционная зависимость между их квадратами, т.е. между значениями Y^ и У^-Л /=1,2,...(ГСБ-3), квадратами ошибок (У,-А/[У^)^ и(Уж-М>^г^|])'. Причины изменения вариации у финансовых показателей могут быть разными. Иногда, например^ неординарные и непредвиденные по- Вьфажения (7.97)-(7.100) можно получить, например, используя метод макси- мального правдоподобия для оценки параметров модели (7.25). 268
литические события за небольшой промежуток времени вызывают рез- кие изменения (скачки) цен. По истечении некоторого периода времени, если такое событие не имело каких-либо существенных последствий для экономики, финансовые рынки успокаиваются и цены на них приходят в равновесие. Цены обычно изменяются при резких колебаниях предложения. По- ступления на рынок больших объемов товаров, валюты, пакетов ак- ций мож:ет вызвать падение цен на них м, наоборот, временное уменьшение этих объемов обычно влечет и временный рост цен. По- добные события случаются нечасто, и сопровождающие их изменения цен также достаточно редки, и в самих этих изменениях не прослежи- вается наличие каких-либо внутренне присущих им закономерностей (ГСБ-2). Резкие изменения в отклонениях цен У, от их математического ожи- дания часто объясняют реакцией рынка на такое их поведение, В част- ности, отмечается, что за значительными изменениями цен активов в одну сторону следует не менее значительное их движ:ение в другую сто- рону, В то ж:е время малые изменения цен, как правило, сопровождаются такими ж:е малыми противополож:ными их изменениями, В результате в тенденциях развития финансовых показателей отмечаются как отно- сительно спокойные периоды, так и периоды с резко выраж:енной неста- бильностью в колебаниях их значений. Чередование таких периодов час- то пытаются объяснить закономерностями, существующими в рядах квадратов цен, т,е, меж:ду значениями Yf и Yt^, i=l,2,„,, а, следова- тельно, и меж:ду вариацией (условной дисперсией) в эти моменты време- ни (ГСБ-3), Тот и другой характеры изменения цен влияют на условия финансо- вых сделок, поскольку с ростом вариации цен, например, увеличивается и риск экономических потерь у прямых их участников, посредников. Уве- личение риска, обычно влечет за собой и рост разного рода премиальных, страховых взносов с целью компенсации возможных потерь. Вследствие этого определение характера отклонений цен от заложенной в них тен- денции на различных временных отрезках является такой же важной про- блемой финансовой эконометрики, как и определение самой тенденции. Общий подход к построению моделей с изменяющейся вариацией предполагает, что значение финансового показателя Yt в момент t может быть определено следующим уравнением: i'r = //(0 + vrw„ (7.101) где //(г) - в общем случае условное или безусловное математическое ожи- дание процесса Yt, Напомним, что безусловное математическое ожидание 269
(//(0= //) может быть определено, например, как среднее значение этого ряда за наблюдаемый период (// = —Х^/ » случай стационарных проиес- Т J сов). Условное математическое ожидание определяется, например, из уравнения авторегрессии, связывающего текущие значения цены У, с ее к прошедшими значениями У^ = aq + Z ^/' ^t-i + ^/ > и в этом случае /=1 щ~ N(0,1) - стандартизованная случайная переменная, свойства которой предполагаются соответствующими свойствам «белого шума» или даже «строгого белого шyмa»^ Vt — процесс, образованный положительной случайной переменной, рав- ной условному стандартному отклонению, так что D{Yt\vt)=Vt. Различные типы моделей с изменяющейся вариацией отличаются друг от друга в основном способами представления переменной V/. При этом, если м, — «строгий белый шум», то любые по величине сдвига ковариа- ции процессов v, и щ, v} и мД v/ ^\щ^ равны нулю. В данном разделе без ограничения общности будем предполагать, что //(0=// и процессы v/ и мД А:= 1,2,3,4; являются независимыми. Очевидно, что значение // в таком случае представляет собой безусловное матема- тическое ожидание процесса Y{, М[Кг] = // + МЫ • М\иЬ = JU, (7.102) а его дисперсия равна M[v/^]: D[yj=M[i^/-//]'=M[vr«r]'=M[vj'-Mw^=M[v^, (7.103) что означает ее равенство математическому ожиданию второго начально- го момента переменной v,. Рассмотрим принципы формирования различных типов моделей, соот- ветствующих выражению (7.101). * Напомним, что процесс «строгого белого шума» предполагает независимость между моментами переменных м, и м,_/ любых порядков, т.е. Л/[мДм*,_/]=0, к = 1,2.... В нашем случае достаточно, чтобы это условие вьшолнялось для к<А. Отметим также, что существуют классы моделей с изменяющейся вариацией, которые используют менее строгие предположения в отношении переменной щ . В частности, некоторые из них допускают ненулевые автокорреляционные связи между квадратами Ut" и и,.,' (случай «белого шума») или даже между значениями щ и W/_/ (случай стационарного процесса). 270
7.5Л. Модели процессов со скачками вариации Для описания процессов с редкими скачками вариации, вызванными в (основном экстраординарными событиями, обычно используются модели, в которых дополнительно к выраэк:ению (7.101) вводится ограничение на вероятность такого скачка в произвольный момент времени t. Обычно предполагается, что /7(Mvr]=Af[v^+i])=a; где а->1. Иногда количество скачков за определенный период времени (например, за год) предполага- ется постоянньпл. Примером такого типа моделей является модель с марковской вариа- цией. Она формируется на основе следующих предпосылок. Предположим, что переменная V/ может принимать только два значе- ния Oi и 02, каждое с вероятностью 1/2, ^=1,2,... . И в каждый момент времени t существует вероятность (1-а\ что текущее значение этой пе- ременной может поменяться на альтернативное, т.е. вероятность того, что а\ изменится на с^ и наоборот равна (1-0^, где а- величина, близкая к 1, бк1. Обозначим x, = Yt-M = VtU„ (7.104) где, как и ранее, процессы Vt и щ независимы, и Ut — «строгий белый шум», Иг ~iV(0,l). Несложно показать, что процесс Xt обладает нулевой автокорреляци- онной функцией, начиная с первого коэффициента, т.е. по своим свойст- вам он близок к «белому шуму». В самом деле, в силу независимости процессов Ut и м,^, / =1,2,... имеем соу[л:„ xt.i\ = M[xt, xt-i] = M[vr, Vm] • М[Щ] • M[ut-i\ = 0. (7.105) Вообще говоря, значения дисперсии этого процесса на различных временных отрезках могут различаться между собой. Вместе с тем, заме- тим, что в общем случае значение безусловной дисперсии процесса Xt определяется следующим выражением: Dix,) = M[xf] = M[vf]^^((T^-^(Th- (7.106) Выражение (7.106) можно получить, отталкиваясь от понятия ус- ловной дисперсии случайной величины Xt при известных значениях Vb V/_2,... (D(jcjvr_i, Vr_2,...))> величина которой определяется следую- щим образом: D(Xt\Vt-U Vr-2v..) = D(Xt\Vt-l) = = avVi + (1 - a)((7i^ ^G^- vVi). (7.107) 271
Выражение (7.107) получено с учетом того, что если в момент г-1 слу- чайная переменная v,_i была равна Oi, тоp(vt=0'i)=cx, a/?(v, =02)=l-a и на- оборот, если vm была равна 02, p(vi=02)=cXy a/7(v,=(Ti)=l-a. На основании этого (7.107) можно переписать в следующем виде: ^UJv,.0 = H>^^-"^^i''-^=^^' (7.108^ Из выражения (7.108), в частности, вытекает, что условные дисперсии рассматриваемого процесса л:^ различаются между собой. С учетом того, 4to/7(vm=^i)=/?(vm=^)=1/2 из (7.108) непосредственно следует выражение (7.106): D(xt) = -D(Xf\Vf.i=aO+-D(x,\v^_i=a2) = = --(ао-1^+(1-а)о-2)+--(аа2+(l-a)(Ti^ = ~(cTf+о-|). Важной характеристикой, которая позволяет идентифицировать про- цессы, соответствующие модели (7.101) с редкими скачками вариации, является автокорреляционная функция процесса л:Д В общем случае зна- чение /-Г0 коэффициента автокорреляции Д<л-,^) определяется следующим образом: ^ _coy(xf,xli) ^M[xf,xli]-(M(xf)f ^ ^^^^^ D{xf) M[xf]-(M{xf))^ где M(xf) = ^(al +(тЪ = D{x,). Четвертые моменты переменной х„ входящие в выражение (7.109), с учетом (7.103) получим для i=l следующим образом: M{x},xU] = aM[vfvU\vt=v,_^]+{\-a)M[v}vU\v,*Vt_^] = = - aicT^ + <т|)+(1 - a)<Tf • <т|; (7.110) M[xf] = M[vf]-M[ut] = ^(a^ +<7^). (7.111) При выводе выражения (7.111) учтено, что 1) коэффищ1ент эксцесса случайной переменной и„ распределенной по нормальному закону, равен 3. При этом его величина для переменной и, рассчитывается согласно следующему выражению: 272
/,(")=J^, (7.112) поскольку Mf~^V(0,l), то из (7.112) непосредственно следует, что М[м/ ]=3; 2) значение Af[v/] определяется с учетом равновероятных событий vpoi и Vt=02 как A^[vf] = {(^f+^2). (7.113) Подставляя все известные моменты случайной величины xi^ в выраже- ние (7.109), после несложных преобразований получим: AUb=-r-^#^^4—Г(2«-1)- (7114) При получении второго коэффициента автокорреляции процесса xj^ - Piixt) необходимо анализировать различные варианты последовательно- стей Vf, vm» V/_2 с учетом того, что переменная v^ может принимать толь- ко значения а\ и с^. Опуская достаточно громоздкие выражения, приве- дем окончательное выражение этого показателя Далее также можно показать, что значение j-ro коэффициента авто- корреляции процесса х^ определяется общей формулой Pii^h= , ^i:""'^', 4 (^-^)^' (7.116) ((7{^-(T|)^+4((jf+a^) Из выражений (7.114)-(7.11б) непосредственно следует, что при бг—>1 для коэффициентов автокорреляции любого порядка процесса Xt спра- ведливо следующее соотношение: 0,2>/7i>/>2>...>A>---0- (7.117) Из выражений (7.114) и (7.115) непосредственно следует, что ^_1 + /72(^,Ъ/Аи') 2 Значения Oi ис^ могут быть определены, например, из уравнений (7.106), (7.110) или (7.111) при рассчитанных для ряда Xt значениях Щх}\ Щxt^^^Щx},xJ\ Как это было показано в главе VI (см. раздел (6.5)), выражение (7.116) позволяет считать процесс х} адекватным АРСС(1,1) с малыми, но мед- ленно спадающими значениями коэффициентов автокорреляции. 273
7.5.2. Модели процессов с зависимой вариацией Привязка изменений вариации цен к экстраординарным событиям не выглядит достаточно реалистично хотя бы по той причине, что та- кого рода события возникают достаточно редко, и они не в полной мере объясняют весь спектр этих изменений. Многие менее значи- тельные события, какая-либо информация также воздействуют на цены, изменяя их пусть и на незначительную величину. Вместе с тем, подобная информация поступает на рынок практически непре- рывно, и в результате ее наложение может вызвать и достаточно сильные колебания в уровнях цен даэюе в течение одного дня. Это по- зволяет считать условную вариацию процесса Yt случайной величи- ной, значения которой в моменты t=l,2,.,. зависят от некоторых других переменных, отраэ/сающих слоэк:ившуюся на рынке текущую ситуацию, В таком случае процесс v^, отражающий стандартные отклонения в уровне цен, может обладать более широким спектром закономерностей по сравнению с рассмотренными выше. В научной литературе выдвинут це- лый ряд гипотез в отношении переменной v^. Основными из них являются следующие две, отражающие ГСБ-3, ^=1,2,... Первая гипотеза предполага- ет, что значения v, представляют собой условное стандартное отклоне- ние, являющееся детерминированной функцией от прошлых значений цен: у^Л^м, i^r-2,...). (7.118) В качестве примера такой функции может рассматриваться следующее выражение: vt =AYt-i) = (оо + flid^M -М)У^^ (7.119) где коэффициенты аоиах являются положительными. Вторая гипотеза предполагает независимость условного стандарт- ного отклонения от уровня цен, но допускает, что переменная Vt моэюет быть представлена функцией типа уравнения авторегрессии- скользящего среднего vf<Kvm, v,_2,..., 7гХ (7.120) ставящей ее уровень в момент t в зависимость от ее значений в прошед- шие периоды времени и случайной составляющей 77^ Случайную состав- ляющую Tit будем отличать от ошибки €и присутствовавшей в моделях цены, хотя их статистические свойства идентичны, rjrN(P, ajj), ei=Y(-fi(tX et-N{0,ch В отношении переменной щ будем придерживаться предположения о том, что это — процесс «строгого белого шума» и щ-ЩО, 1), 274
Выражения (7.118) и (7.120) предполагают, что во временных рядах квадратов отклонений цен от их среднего уровня существуют корреляци- онные взаимосвязи. Модели с такого рода взаимосвязями получили на- звание Л/?СЯ-моделей (Autoregressive Conditionally Heteroskedastic ntodels). Общий вид Л/?СЯ-модели, построенной на основе выражения (7.119), может быть представлен следующим уравнением: (к 1^/2 К,-//= ао+1аДУ,_,-//)Ч и,. (7.121) Для к=1 в соответствии с выражением (7.119) получим Yt -/^ = к +^i(Yt-i -Mff^ "г. (7.122) Все коэффициенты а о, а i,..., ak в выражениях (7.121) и (7.122) явля- ются неотрицательными^ Из выражения (7.122), в частности, следует , что условная диспер- сия цены в момент t D(Yt\Yt-\) при известном значении У,_1 определяет- ся как 0(Г,1Ум) = оь + ai(Y,., -fif, (7.123) Таким образом, согласно (7.123) большие отклонения цен от матема- тического ожидания в день t влекут за собой увеличение дисперсии в це- нах следующего периода и, наоборот, уменьшение отклонений влечет за собой снижение величины этой дисперсии. 2 2 Из выражения (7.123) также вытекает, что переменные v, и Щ-\ не яв- ляются статистически независимыми. Это следует из того, что Vj^=D(F, \yt\) зависит от (У,_1-//)^ -Vt-\'Ut-\. ^ Заметим, что примером такого рода модели может быть и модель авторегресси- онного типа с меняющимся условным математическим ожиданием: В этом случае условная вариация значения у, определяется следующим выражением: 1^ЫУг-д = И_1[(у, - аь - ос\Уг-&\ = Ще{\ где Л/,_1 - математическое ожидание, определяемое в момент г-1, т.е. на основе ин- формации, относящейся к этому моменту. Далее, в предположении, что квадраты ошибок связаны моделью авторегрессии к- го порядка получим: где щ - коэффициенты модели, i=0, 1,..., А:; Vt - ошибка. Если значения коэффициентов а,, i>0, равны нулю, то рассматриваемая модель имеет постоянную условную дисперсию ошибки. Если aittO и а, =0, i>l, то ^ может быть определена вьфажением аналогачным (7.119), т е. Как 275
Из вьфажений (7.121) и (7.122) непосредственно вытекает, что свойст- ва автокорреляционных функций процесса {Yr/J)^ в первом случае долж- ны соответствовать процессу АР(А:), а во втором - удовлетворять сле- дующему соотношению Pi{st)=^u где St=(Yt -fif. Представление стандартного отклонения V/ в виде функции типа (7.120) основано на том, что отклонение цены актива за ^й день торговли от ее среднего уровня может быть представлено в виде суммы приростов цен в ходе торговых сделок, имевших место в этот день Yt'M = t^' (7.124) В выражении (7.124) переменные cOit и Nt являются случайными. При- чем coit означает изменение цены в ходе f-й сделки в течение г-го дня, а Л^, выражает общее количество таких сделок. Предположим, что cott независимы и одинаково распределены по нор- мальному закону с нулевым математическим ожиданием и дисперси- QUcrJ', cotrN(Oy aj) и также независимы от переменной Nt. Тогда при фиксированном числе сделок условное стандартизованное отклонение может быть определено как Vt =(tJ ^Щ . В предположении, что цены не влияют на переменную v, можно запи- сать^ Y,-u I ^ -^-^ = -г=1.Щ. (7.125) 1^ Поскольку 2, ^it у как сумма одинаково распределенных по нормаль- 1=1 ному закону случайных величин, также имеет нормальное распределение, причем Zfi^r ~ N(Oy v^\ то очевидно, что переменная щ распределена по стандартизованному нормальному закону, щ -N{0, 1). Из построения пе- ременной Mf, ^=1,2,... также вытекает, что распределение ее значений явля- ется одинаковым для всех v^ и переменные щ, щ^ являются статистиче- ски независимыми между собой и с переменными v, и Vf_, для всех сдви- гов i и 7*. Иными словами, процесс w, можно считать по крайней мере «белым шумом». ^ Процесс, определенный выражением (7.120) в предположении, что переменная V, не зависит от уровня цен У^ Уг-i,... в литературе иногда называют процессом- произведением («/?го^исг-ргосем»). 276
Отметим основные свойства процессов v, и уД В частности, заметим, что если щ является «белым шумом», то процесс ui=Yt-ju также является «белым шумом» в силу условия (7.105). Однако значения Si={Yt-^^=xr могут коррелировать между собой в случае коррелированности значений переменной v, и v,_/, /=1,2,.... Это непосредственно следует из определе- ния ковариации и математического ожидания произведения переменных v^ и St соответственно M[st. st^] = Af[vr' • vVj . Щи^ • mVj = Af[vr' • vVj (7.126) cov[^„j,.i] = M[suSt,i] - M[sh = cov[v,^ • vVj. (7.127) При выводе этих выражений учтено, что M[s^] = M[v^] (см. (7.103)). Из выражения (7.127) непосредственно вытекает, что АМ = A<vr') • [D{y^)ID{sdl (7.128) В частности, при положительной автокорреляции процесса условной вариации v, можно показать, что коэффициенты автокорреляции процес- сов Vf^ и 5, удовлетворяют следующему соотношению: 0<A(^r)/A(vr^^j. (7.129) Соотношение (7.129) непосредственно вытекает из того, что 0[v^=A/[v/]-(M[v^)'; D[sh = mh - {M[sAf = a:. • M[v/] - {M[vhf (7.130) и АГм=3, если щ -N(Oy 1). В свою очередь, при получении выражения (7.130) учтено, что Mlsi"] = mYt-M)'] = Mv/] • М[«Л = Ки • M[vr'], (7.131) где Ки - коэффициент эксцесса процесса щ определяется как _ Mjuf] _.,,.4,. ^и = T—r = M[Uf ]; (М[иП)2 Для оценки параметров процесса v, можно использовать также и ха- рактеристики неотрицательного процесса абсолютных отклонений цен от своего среднего уровня zf! i'r/^l=U,| . Для этого процесса при v, >0 по- лучим M[z,] = M[v, ■ \и,\] = dM[v,], (7.132) где д = м|и,|]=7277 = 0,798. 277
Очевидно, что МиЛ=М[у,'] и DU^=M(fc])'=M[vr']-a'(M[vJ)l Из определения Zt процесса также вытекает следующая взаимосвязь между его ковариациями и ковариациями процесса v,: covto,z,-/)=M[zr,Zr-/]-Ma^=9^cov(v„v,_). (7.133) Из выражения (7.133) непосредственно следует, что коэффициенты автокорреляции процессов Zt и v, связаны следующим соотношением: P^iZt) = Э' • A<v/) • [D(vd/D(zr)l (7.134) Далее, выражая дисперсии через второй начальный момент и матема- тическое ожидание, увидим, что D(vt)<D(Zt) - Из этого факта вытекает следующее соотношение для коэффициентов автокорреляции процессов Z, и V,: 0<Afe)/A<Vr)<al (7.135) Результаты (7.129) и (7.135) являются достаточно общими в пределах исходного ограничения V/>0, Г=1,2,... . Однако на практике выполнение этого ограничения гарантировано не при всех типах распределения v,. Например, при нормальном распределении VrN(M[vt]y (jj^) всегда сущест- вует вероятность того, что некоторые значения v, могут быть отрицатель- ными. Таким образом, функция плотности распределения v^ должна быть определена только на положительной полуоси. Такую функцию плотно- сти имеет, в частности, переменная, логарифм которой распределен по нормальному закону. Предположим, что ln(yt)~N(a, J3 ), /3>0, В этом случае функция плот- ности переменной v^ имеет следующий вид: (p{v) = [{2K)"^P\-^e 2 . (7.136) Тогда в соответствии с выражениями (7.9) и (7.10) получим, что Л/[vJ = е 2 и поскольку Inv, = kXnvt, то для всех начальных моментов переменной v, имеем M[vf] = e 2 . (7.137) С учетом (7.137), выражая дисперсию через второй начальный момент и математическое ожидание, получим, что ' D{v,) = M[v^ - (Af[vJ)2; D(z,) = M[vr] - d\Mlv,]f. 278
D{v,) = e^^P\eP" -1). D(y}) = e'''^'P\e'P" -1), D{z,) = e'^"^P\efi' -ЭЪ , 0{з,) = е^^^Р\ъе^Р' -1). (7.138) Далее, принимая во внимание, что для щ-М(0, 1) Э^=2/я; вместо усло- вий (7.129) и (7.133) получим следующие соотношения для коэффициен- тов автокорреляции процессов St и v^^, Zt и v,: A(^r)/A(v?) = (H^' -1)/(зИ^' -l) = A(>ff). (7.139) Piizt)/Pi(v,) = 2(e^^ -1)/(лё^' -2) = B(J3), (7.140) Из (7.139), в частности, вытекает, что A(J3) монотонно увеличивается с ростом fioT значения у4(0)=0, до значения ^(оо)=1/3. Аналогично ведет се- бя и B(fi): 5(0)=0,5(оо)=2/я: Из выражений (7.139) и (7.140) также следует, что коэффициенты ав- токорреляции Pi (st) и Pi (Vt\ Pi (zt) и Piivt) должны быть одного знака, по- скольку A(fi) и B(J3) являются неотрицательными числами. При этом мно- гочисленные исследования реальных процессов показывают, что в случае стационарных процессов значения Pi{Sf) и Pi{zt) для первых десяти сдви- гов являются положительными. Из этого эмпирического факта следует, что коэффициенты Pi{vt ) и Pi{vt) также являются положительными. В том случае, если процесс In(vr) представлен моделью авторегрессии первого порядка: ln(v,) - а= ai{ln(vM - а)} + т;,, (7.141) где а- математическое ожидание процесса ln(v/), ln(vt)~N(a, 0'У, 7jt-N(0, а,^) - ошибка модели, являющаяся процессом «белого шума», (Tf^^Dijfyil-ai^); ai=pi(]n(vt)}- коэффициент модели, то можно показать, что коэффициенты автокорреляции процесса In(vj) и коэффициенты ав- токорреляции процесса v, связаны следующим соотношением: p.(v,) = {e^''^'^^^'^-l}/H' -1}. (7.142) Для процесса v^, чтобы получить соответствующие выражения для ко- эффициентов автокорреляции достаточно в правой части (7.142) /i заме- нить на 4)5 ^ Далее, поскольку коэффициенты автокорреляции модели (7.141) рав- ны ах (Pi{ln(yt))=ai), то соответствующие коэффициенты процессов Sj и Zt на основании (7.139) и (7.140) будут определяться следующими выраже- ниями: Pi(S,) = A(/J).{(И^'^!' -1)/(H^'^i -1) (7.143) 279
Pi{Zt) = B{P){{eP^^^ -l)/(e^' -1). (7.144) Выражения (7.143) и (7.144) показывают, что эти коэффициенты с увеличением сдвига монотонно уменьшаются с некоторого значения, меньшего 1, до нуля. Дальнейшее направление разработок моделей с изменяющейся зави- симой вариацией связывается с подбором более удачной модели для опи- сания динамики переменной V/ в тех случаях, когда количество парамет- ров в авторегрессионных версиях достаточно велико. Напомним, что ав- торегрессионные версии моделей этой переменной могут быть представ- лены, например, следующими выражениями: V;^ = оо + axSt-\ +...+ akSt-^\ (7.145) Inv, = оо + ailn(vr-i) +...+ ak\n{yt-k) + /7r. Коэффициенты этих и других возможных вариантов моделей такого ти- па определяются на основе коэффициентов автокорреляции процессов St и Zf, /=1,2,..., значения которых являются неотрицательными, но достаточно небольшими и стремятся к нулю с увеличением сдвига. Как отмечалось в главе VI, при к>1 относительные погрешности эмпирических коэффициен- тов автокорреляции могут быть достаточно большими, что повлечет за со- бой и ошибки коэффициентов модели. В результате построенная модель не будет достаточно точно воспроизводить поведение процесса. Избежать влияния погрешностей в оценках коэффициентов автокор- реляции процессов St и Zt на точность представления переменной V/ при больших сдвигах можно на основе использования при ее описании вместо авторегрессионных моделей (АР(/:)) моделей более общего класса - авто- регрессии-скользящего среднего (APCC(fe, т)) с гораздо меньшим числом параметров. В частности, в главе VI было показано, что добавление к мо- дели авторегрессии первого порядка модели скользящего среднего перво- го порядка позволяет сформировать модель, по своим свойствам эквива- лентную модели авторегрессии достаточно высокого порядка. Такой под- ход, в частности, предполагает, что вместо модели (7.145) для описания процесса уД может быть использована, например, модель следующего вида: V,' = оо + ai(y,_i -//)' + feivVi, (7.146) связывающая текущее значение условной дисперсии с ее предшествую- щим значением и предшествующим квадратом ошибки {e't-x-iXt-x-fJ) ), определяемой по отклонению цены актива в момент г-1 от ее математи- ческого ожидания. 280
Модели типа (7.146) в научной литературе получили название GARCH моделей (Generalized Autoregressive Conditionally Heteroskedastic models). Общий вид СЛ/?СЯ-модели порядка (к, г) может быть определен сле- дующим выражением: vf =ao + Z^i(Y,_i -/i)2 + tbjvlj . (7.147) Коэффициенты модели (7.147) в общем случае должны быть неотри- цательными, чтобы гарантировать выполнение естественного условия v,^>0. Это ограничение не совсем удобно обеспечивать при оценке пара- метров модели (7.147) традиционными методами. Кроме того, в GARCH- моделях условная дисперсия зависит лишь от размера отклонения цены от ее математического ожидания, а не от ее знака. Вместе с тем эмпири- ческие данные (реальные временные ряды цен) свидетельствуют, что их вариация и доходность часто имеют отрицательную корреляцию. Иными словами, с ростом цен активов, обеспечивающим увеличение их доходно- сти, условная вариация ряда Yt уменьшается, и, наоборот, с уменьшением цен и соответственно снижением доходности — вариация растет. В ре- зультате периоды высокой вариации обычно совпадают с периодами спа- дов на финансовых рынках, а периоды низкой вариации с периодами рос- та активности на них. Такие закономерности учитываются, например, мо- дификацией GA/гСЯ-модели, уравнение которой в общем виде может быть представлено следующим выражением: \nЦvf) = a,+j:aУ^-^~^^-^K _ '■=^ '-' (7.148) Согласно модели (7.148) условная дисперсия в момент t является асимметричной функцией от положительных и отрицательных значе- ний ошибки St^i^Yt-r/it-i, /=1,2,..., где ///_/ - условное математическое ожидание в момент t-i. Иными словами, положительные и отрица- тельные значения ошибки £•,_/ оказывают различное влияние на зави- симую переменную. Кроме того, использование в модели логарифма дисперсии позволяет не беспокоиться о знаках коэффициентов данной модели. Дальнейшее развитие А/?СЯ-модели связывается с предположени- ем о существовании зависимости значений yt от их условной вариа- ции. Класс этих моделей, названный ARCH-M моделями, отражает мнение, что на финансовых рынках покупатели как бы «требуют» 281
компенсации за рискованные вложения. В результате «плата за риск» рассматривается как возрастающая функция от условной вариации цены акции. Простейший вариант ARCH-M модели, отражающий данное предпо- ложение, может быть представлен в следующем виде: yt-^Mt-^^t, (7.149) где условное математическое ожидание цены актива fli=^t-ilyt\^ в свою очередь, ставится в зависимость от условной вариации опшбки согласно следующему выражению: //, = >5+ЭуЛЭ>0 (7.150) и vj^ является ЛЛСЯ-процессом: Vr^=ao + Z^/^M» (7.151) В более общем случае условная вариация ошибки может быть пред- ставлена в виде СА/?СН-процесса: vf = ао + Za,f,l/ + tbjvlj , (7.152) /=l 7=1 где, напомним, Sr^f-jUt. Тестирование моделей типа ARCH и GARCH обычно сводится к про- верке существования характерных для них эффектов. Для этих целей, как правило, используется так называемый критерий 77?^, где Т - объем вы- борки и Л^ - коэффициент детерминации соответствующей модели для квадрата ошибок (например, типа (7.145) и (7.146)). Этот показатель рас- пределен по закону j^ с числом степеней свободы равным количеству используемых в модели лаговых переменных £j_, и Vr_/. Если расчетное значение ТР^>;^*{р*, v\ где р* - заданный уровень доверительной вероят- ности и V- число степеней свободы, то гипотеза о присутствии ARCH или САЛСЯ-эффектов принимается, в противном случае она отвергается. Здесь следует отметить, что наличие эффекта в данном случае связывает- ся со значимостью коэффициентов щ и &/, /=1,2,..., Jfc; 7=1,2,..., п; модели, описывающей взаимосвязи между квадратами ошибки. Если Т¥г>Х'^*-» V), то коэффициенты принимаются значимыми, т.е. отличными от нуля (по крайней мере, некоторые из них), и в этом случае допускается нали- чие эффекта типа ARCH или GARCH (условная дисперсия меняется со- гласно соответствующей закономерности). В противном случае, т.е. когда TR!'<j^*(P*, v), следует принять гипотезу о равенстве нулю всех коэффи- циентов при лаговых значениях квадрата ошибки, и в этом случае дис- персия должна рассматриваться как постоянная величина. 282
7.6. МЕТОДЫ ОЦЕНКИ ПАРАМЕТРОВ МОДЕЛЕЙ С ИЗМЕНЯЮЩЕЙСЯ ВАРИАЦИЕЙ В общем случае определение параметров оценок моделей с изменяю- щейся вариацией является более сложной проблемой, чем оценка парамет- ров моделей с постоянной вариацией. Дело в том, что эффекты, обуслов- ленные взаимосвязями между квадратами ошибок, приводят к тому, что соотношения между параметрами модели и исходными данными становят- ся нелинейными и гораздо более сложными, чем в случае традиционных линейных эконометрических моделей. В такой ситуации в аналитическом виде получить решение становится невозможным, и поэтому обычно при- ходится прибегать к численным методам определения оценок, основанным на итеративных процедурах последовательного приближения. Вместе с тем общий подход для формирования уравнений, связываю- щих значения параметров моделей с изменяющейся вариацией с исход- ными данными, использует те же принципы, что и в случае моделей с по- стоянной вариацией. Он также обычно базируется на принципах макси- мального правдоподобия и минимума суммы квадратов ошибки. Например, функция максимального правдоподобия для модели с из- меняющейся вариацией в общем случае может быть записана в следую- щем виде: |2 1 2 Д>'м^0'^1»*--'^Л'^1'---'^г'---) = П"7==^ 1 ] yt-Mt (7.153) при ограничениях, определяющих: а) особенности взаимосвязи между значениями процесса у/ и его условным математических ожиданием. На- пример, Mt^ro-^Hrtyt-i^ (7.154) /=1 б) особенности взаимосвязи между условными вариациями. Например, в случае ОАЛСЯ-модели - это: ^f = ао + Z^/^r-/ + tbjvlj , (7.155) /=l 7=1 где, в свою очередь, значение ошибки St является разностью между фак- тическим значением процесса в момент t -yt и его условным математи- ческим ожиданием //^ St^yt-JUt. (7.156) 283
в результате логарифм выражения (7.153), определяемый как -Iln(2;r)-isin(v,)-^l[^-^^j (7.157) является функцией как параметров модели (7.154), которые в (7.157) скрыты под обозначением //,, так и параметров yt, являющихся исходны- ми данными, как это было и раньше в случае линейных моделей с посто- янной вариацией. Но, кроме этого, его значение в нашем случае также за- висит от параметров ai и iy, определяющих взаимосвязи между условны- ми вариациями, /=1,2,..., it;7=1,2,..., г. В результате система уравнений, на основе которой должны быть оп- ределены «оптимальные» значения параметров модели с изменяющейся вариацией, должна быть определена на основании дифференцирования правой части выражения (7.157) по параметрам векторов ^^(^6...., ?й)» л=(ао»-.., cik) и &=(6i,..., йг) и приравнивания к нулю соответствующих про- изводных: ainZ^jfcO; ainZ^a=0; (7.158) Э1п/уЭ*=0. При этом получение самих дифференциалов осложняется наличи- ем взаимосвязей между разновременными значениями Vt и £„ что, в свою очередь, значительно усложняет форму уравнений системы (7.158). В результате ее решения, т.е. оптимальные оценки парамет- ров векторов у, а н b могут быть, как это отмечалось выше, опреде- лены лишь с помощью достаточно сложных численных методов ре- шения. Вместе с тем для некоторых типов представленных здесь моделей ме- тоды оценки их параметров могут быть несколько упрощены на основе учета специфических свойств, описываемых ими процессов. Рассмотрим основные подходы к оценке параметров моделей с изме- няющейся вариацией на примере моделей (7.122) и (7.141). В том случае, когда условная вариация Vt представляется как функция прошедших значений цен F^, /=1,2,..., исходная информация для получе- ния оценок соответствующих моделей может быть сформирована, напри- мер, в виде ряда значений St-i=(Yt^-^^)^, где условное математическое ожидание ^^ определяется на основании модели, описывающей динами- ку цен, т.е. временного ряда Yt, г=1,2,..., Г. В моделях типа (7.120) непосредственно сформировать значе1шя V/, /=1,2,... не представляется возможным. Вследствие этого параметры соот- 284
ветствующих моделей могут быть получены опосредованно, например, с использованием значений процессов St и Zr. Обозначим, как и в разделе 7.5, St=(Yr-M)^* Тогда выражение (7.123) можно переписать в следующем виде: M[st\ 5м]=^+ aist.u (7.159) где M[st\st-\] означает условное математическое ожидание переменной St при известном значении St-i. Напомним, что для уравнения авторегрессии первого порядка дс^ = оо + + a\Xt-i-^€t условное математическое ожидание Af[jCrlcM]=^+fliJCr-i опреде- ляется точно так же, как и для переменной St, Эквивалентность выраже- ния (7.128) и ассоциированного с ним уравнения авторегрессии первого порядка позволяет непосредственно установить некоторые свойства про- цесса (7.123), которые могут быть использованы при получении прибли- зительных оценок параметров аоиа\.В частности, при условии, что дис- персия переменной существует, в соответствии с выражением (6.58) име- ем ai = ri(5;), (7.160) где гх (st)- первый коэффициент автокорреляции ряда St. Переходя к безусловному математическому ожиданию переменной St, на основе выражения (7.159) получим M[St] =00 + Cli\f[St], откуда непосредственно вытекает, что параметр oq находится из соотно- шения ao = M[st](l-ail (7.161) гдеА/[5,] = ^5:(К,-//)^ Заметим, что аналогичные рассуждения справедливы и в отношении более общей модели (7.121). Ее коэффициенты приблизительно могут быть оценены на основании системы Юла-Уокера (см. выражение (6.50)) для ряда St, а коэффициент oq найден из соотношения: ao = Af[^r][l-(ai + fl2+...+ ^ifc)]. (7.162) Найденные оценки далее могут быть уточнены на основе использова- ния ММП. Заметим, что в общем случае оценке подлежат следующие па- раметры: //, а&, «1,..., 01. Функция правдоподобия в предположении, что ошибка распределена по нормальному закону, может быть представлена в следующем виде: 285
т кМ= П /(>; I А-ь«»/^). (7.163) t=k+i л где а=(ао> ^ь-., cik) - вектор оценок параметров; ju - оценка матема- тического ожидания; /(y,IVi,a,;^) = /(y,/v,) = {V2^.vJ \ 1 ^11 (7.164) И/М={1^Ь1^2,...,КМ}. Натуральный логарифм функции (7.163) равен lnL^(a,//) = -^(r-it)ln(2^)- ilnv,-^S(r,-//)2/v,^ (7.165) Максимизируя выражение (7.165) по параметрам //, oq» ^ь-.., fljk при условии, что 1=1 ползшим систему нелинейных уравнений, выражающих эти параметры через значения процесса У,. Далее, решая эти уравнения, найдем искомые л значения //, оо, ль..., а^. В моделях типа (7.120) сформировать значения ряда v^, г=1,2,..., Г, не- обходимые для оценки коэффициентов моделей с изменяющейся зависи- мой вариацией, непосредственно не представляется возможным. В такой ситуации иногда удается решить эту проблему, используя данные рядов St и Z/. Рассмотрим особенности оценки параметров уравнения типа (7.120) на примере модели (7.141). Заметим, что эта модель имеет три неизвест- ные параметра: ос, Р - параметры закона распределения переменной ln(v/), а\ - параметр уравнения (7.141). Для нахождения этих параметров отметим основные соотношения, связывающие моменты процессов v^, Zt и St. Для начала заметим, что в соответствии с выражением (7.132) мы име- ем M[zr] = Э •/д,, где/А, = M[vJ, 3 = 72^-=0,798. Далее Af[5j=Af[vr^]Af[Mr^]=Af[v/^]=o;;^+/A,^, где aj^ - дисперсия процесса V/. Используя значения исходного ряда данных цен У„ найдем оценки первых моментов для рядов Zt и St на основании следующих выражений: 286
^ r=l ^ t=\ ^ -lr=l С учетом найденных значений несложно определить оценки матема- тического ожидания и дисперсии процесса v^ л ^ My=z/d, (7^=J-(z/d)^, (7.166) Для определения оценок параметров распределения случайной пере- менной Invr а и >5 используем известные выражения для математического ожидания и второго начального момента переменной v, (см.(7Л37)): M[Vf] = e 2 ^ Af[vf ] = е^^'*'^^ . С учетом этого дисперсию fi^ пере- менной Inv, получим на основании следующего выражения: л /3^ =ln[M[v,^]/M^[vJ = ln{(//^+(T?)///2}. (7.167) Подставляя в (7.167) вместо моментов /д,, ст^^ их оценки из (7.166), по- лучим следующую формулу для определения дисперсии fi^ через пара- метры распределения процессов Zt и 5,: л fi^=ln[d^s/z^]. (7.168) Аналогично, учитывая, что ar = ln(M^[v,]/-y/M[v,^], получим формулу для определения значения его оценки в следующем виде: a = ln{z^/(д^^|J)}. (7.169) Для определения параметра модели ai (7.141) можно воспользоваться следующей процедурой сформированной с учетом известного выражения для параметра процесса АР(1): /7Д1п ) = «(. Отсюда с использованием, например, выражения (7.144) получим: Pi(z,) = B(fi){(e^^'^ -1)/(е^' -1)}; Pk(z,) = B(^{(e'fi'^ -1)/(е^' -1)). Обозначим через %= о^ следующее выражение: Г1 = '^Р1МС:±^г \ В{р) 1р^. (7.170) 287
Тогда при известных значениях pi (zt) и J3 значение оценки параметра ai может быть найдено путем минимизации следующей квадратической функции: Г .^2 /=1 л ,-i Ti (7.171) Выражение (7.171) представляет собой сумму квадратов отклонений отношений а\/){ от единицы. Заметим, что, вообще говоря, значение Л1=Л» ^ И является функцией от piizd- Однако определение значения щ только по одному значению коэффициента автокорреляции процесса Zt может привести к значительной ошибке. Использование для этих целей ряда таких коэффициентов способствует ее уменьшению. Последующая процедура действий по восстановлению процесса Vt со- л л стоит В следующем. На основании найденных значений ai и а с помо- щью модели (7.141) восстанавливается ряд натуральных логарифмов пе- ременной V/ - ln(v,). При этом при определении Invi в качестве значения переменной vi может быть использовано среднеквадратическое отклоне- ние V = vJ , где S - дисперсия переменной У^. Далее по ряду In(v^) путем потенцирования находится переменная v,. Найденная оценка коэффициента ai может быть уточнена путем ре- шения систем нелинейных уравнений, вытекающих из ММП, в котором она обычно используется в качестве начального приближения. Предложенный метод оценки параметров авторегрессионных уравне- ний относительно In(Vf) несложно модифицировать и на модели более вы- соких порядков. 7.7. МОДЕЛИ ВРЕМЕННЫХ РЯДОВ ФИНАНСОВЫХ ПОКАЗАТЕЛЕЙ С НЕЛИНЕЙНЫМИ СТРУКТУРАМИ Обобщая изложенный в главе VII материал, отметим, что в предыду- щих разделах рассмотрены модели с линейной структурой условного ма- тематического ожидания, в которых этот показатель был выражен в виде линейных функций, соответствующих процессам АР(/:), СС(т), АРСС(/:, т). Дальнейшее развитие аппарата моделирования временных рядов фи- нансовых показателей связывается с построением моделей с нелинейны- ми структурами («нелинейных моделей») как для математического ожи- дания, так и для дисперсии. 288
в общем случае можно предполагать, что класс моделей с нелиней- ными структурами должен быть значительно шире по своему составу, чем класс «линейных» моделей. Вследствие этого в данном разделе рас- сматриваются принципы построения лишь некоторых групп «нелиней- ных» моделей, которые были разработаны специалистами в области фи- нансовой эконометрики в последнее десятилетие. Основная идея одного из подходов к построению нелинейных моделей временных рядов финансовых показателей заключается в представлении ряда цен Yt в виде нелинейной функции, аргументами которой являются текущее и предшествующие значения стандартизованной случайной пере- менной et, свойства которой соответствуют «белому шуму», St -N(0, 1), У,=М,б^.ь£^-2...). (7.172) При этом обычно в вьфажении (7.162) используется функция Д.), об- разованная суммой двух функций, одна из которых выражает условное математическое ожидание переменной Yt на прошлые значения ошибки, а другая - условную дисперсию: Yt = g(et, St-u et-2...) + efhiet, St-u f^-2...), (7.173) где функции g(.) и A(.) могут быть как линейными, так и нелинейными. На основании (7.173) несложно заметить, что условное математиче- ское ожидание У, определяется как M[Yt\et-i, ^_2,..]=<^(^-ь^-2,-..) в силу свойств переменной St (Af[6^]=0, М[£^, £^-i]=0, /=1,2,...), а условная диспер- сия D(rM-b£i-2,...) = Л/[Уг-^(£^-ь^-2,...)]^ = М[£^^]М[/г^(^_1,б^_2,...) = к\е^.и ^_2,...)- Далее отметим, что и все условные центральные моменты более высоких порядков переменной Yj определяются как М[У, -g(.)] = Выражение (7.173) можно рассматривать как результат разложения функции (7.172) в ряд Тейлора в точке бг=0 при заданных значениях 6^_i, et-2.... Yt =/(0,fpfM'^r-2 .•.) + /l(0,fr»^r-b^r-2 '•')'^t + ^ 'f ,2 eff2(0,€t,£t.i.£t-2'")' (7.174) Пренебрегая в выражении (7.174) слагаемыми, содержащими St, к>1, получим, что g(£^_i, £^_2,...)=Л0, £^_i, 6^_2,...), Л(^-Ь £^-2v..)=/l(0,£^-l , £^-2,...). Из вида уравнения (7.173) также следует, что все множество нели- нейных моделей финансовых показателей может быть разделено на две группы: модели с нелинейным условным математическим ожи- данием и модели с нелинейной условной дисперсией. 10 Эконометрика /оУ
Примером модели с нелинейным условным математическим ожидани- ем является следующее уравнение: y, = £^ + ai£^M, (7.175) в котором g(.)=ai Et-x и А(.)=1. Из выражения (7.175) непосредственно видно, что условное математи- ческое ожидание M[l^M-i]=^i^-i^ является функцией от квадрата преды- дущей ошибки, а условная дисперсия равна единице M[^^l6^_i]=l. Напротив, модель типа ARCH первого порядка, предложенная Энглом в 1982 г., характеризуется нелинейной условной дисперсией. Ее уравне- ние имеет следующий вид: Y,=e,4bxeU . (7.176) В данном случае условное, как и безусловное, математическое ожида- ние равно нулю, g(.)=0, и функция /г(.) определяется выражением i ^i^M ' так что условная дисперсия D{Yt\et-\,et-2, ...)=i?i6^r-i также зависит от квадрата предыдущего значения ошибки. Таким образом, вообще говоря, модели с изменяющейся зависимой вариацией можно рассматривать как модели с нелинейной условной дис- персией. Модели с нелинейными условными математическими ожиданиями и модели с нелинейными условными дисперсиями описывают временные ряды финансовых показателей, имеющие принципиально различные свой- ства. Они определяются в основном отличиями их третьего и четвер- того моментов. Так, процессы, соответствующие моделям (7.175) и (7.176), имеют ну- левые автокорреляционные функции. В самом деле, в случае (7.175) пер- вая автоковариация определяется следующим выражением: M[Yt-^i. Км -//,_i] =М[^, ^-i] = 0. Для процесса, соответствующего модели (7.176) имеем тот же резуль- тат: М[У„Ум] = Л^[^г^м А^м '^b^eU =0. Вместе с тем можно показать, что начальные моменты порядков, на- чиная с третьего, у моделей с нелинейными условными математическими ожиданиями отличны от нуля, т.е. М[У,,У,_/,К/_/...]9Ю. Например, для третьего момента модели (7.175) имеем 290
Вместе с тем такие моменты для модели с нелинейной условной дис- персией равны нулю, В частности, для модели (7.176) имеем M[Y,J,_iY,_j] = M ^rV^l^r-l '^t-i'\h^t'i-\ '^t-j\^\^t-j-\ = 0 в силу независимости случайных переменных et-\,et-i-\A-j-\' Однако некоторые четные моменты процессов, адекватных моделям с нелинейной условной дисперсией, начиная с четвертого, при равенстве пар индексов становятся отличными от нуля. В самом деле, для модели (7.175) при /=0,7=^=1 имеем М[У,,У,_,-,У,_;,Г,_,]=М[УЛу^1]=&'М[6^,,£^,.ь6^г-2]^. Подобные свойства моментов позволяют предложить достаточно уни- версальные тесты для определения соответствия реального процесса той или другой группе нелинейных моделей. Подобные тесты, например, мо- гут быть основаны на проверке значимости нормированного третьего мо- мента временного ряда У, при />/>0. Такой момент определяется сле- дующим выражением: ^(^ J) = М[У„У,_,-,У,_у] т- Л/[У,^]^'^ 1 т -/(=1 -,!-,-; 3/2 (7.177) При ^i, у)=0, что соответствует процессам с нелинейной дисперсией, расчетное значение -JT^i, j) распределено приблизительно по нормаль- ному закону с нулевым средним и дисперсией, определенной следующим выражением: 1 ^ пЗ (7.178) С учетом выражений (7.177) и (7.178) реальный процесс можно счи- тать соответствующим модели с нелинейной условной дисперсией, если выполняется следующее соотношение^: Напомним, что пределы [-1,96; 1,96] соответствуют доверительной вероятности р*=0,95 для стандартизованной случайной величины. 10* 291
-1,96 <-^^< 1,96. (7.179) (J Для моделей с нелинейными условными математическими ожидания- ми в общем случае можно предложить несколько вариантов формирова- ния функции g{et-u ^-2, •..). Во-первых, можно выразить эту функцию в виде полинома от стан- дартизованной случайной переменной St-i -- M0,1), /=1,2,.... /=1 /=1 j>i + ZZ Z ^ijk '^t-i'^t-j '^t-k +••• • (7.180) i=lj>ik>j В случае bij -c^k =0 имеем модель с линейным условным математиче- ским ожиданием. Во-вторых, функцию ^(б^_1, £^_2,...) можно выразить в виде нелинейной модели авторегрессионного вида + 1114->'г-Г>^г-уП-^. (7.181) i=\j^k>j В-третьих, возможно функцию g представить смешанным уравнением типа авторегрессии-скользящего среднего ** х~^ g (П-1'<РМ'"-) = Х'^/^М + '"' (7.182) i=\ j>i /=1 j=\ Для моделей каждого типа могут быть подобраны соответствующие методы оценки их параметров. ПРИЛОЖЕНИЯ К ГЛАВЕ УП (К РАЗДЕЛУ 7.3) 1. Оценки параметров распределения отношения SR Заметим, что ковариация случайных величин А„ A,+i может быть оп- ределена на основе следующего выражения: 292
соу(Д,Д,^) = Х(^-М[Л])х (7.183) где Л/, А/+/ - /-е иу-е состояние переменной Л в моменты Г и г+1 соответ- ственно; M[At]=M[At+\]=7rs - математические ожидания переменных Л, и Л,+1, согласно распределению Бернулли равные вероятности л"^; p(At) и /7(Л/+/) - вероятности /-го и j-ro состояния переменных At и A,+i соответ- ственно. В нашем случае переменные At и Л/+1 принимают только два значения О или 1 в зависимости от комбинаций соответствующих значений опреде- ляющих их переменных It, /,+i и It+2 (см. выражения (7.27) и (7.28)). Пере- числим эти комбинации: (At =1пА,+1=1)=>СЮ0и111(комбинации значений //, It+\ ,/г+2); (At =0nA,+i=0)^101u010; (Л, =OnA,+i=l):^011ulOO; (Л=1пЛ,+1=0)^001и110. На основании комбинаций /„ Z^+i, It+2 несложно определить вероятно- сти соответствующих пар значений случайных величин At и Л^+ь ;7(Л =1пА,^1=1)=р(Л =1>/7(Л,^1=1)=/7ХООО)+/7Х111); p(At =0). /7(Л,^,=0)==рХ101)+/7X010); p(At =0)- p(At+i=l)=pi(Ol 1)+/7X100); p(At =1)/7(Л,^1=0)=рХ001)+;7Х110), где/?Х-) - вероятность комбинации переменных It, It+\, It+i- На основании (7.39) имеем pj(000Ml-7t)^', рХ111)=^; рХ101)= /?Х011)=/7Х110)=л^(1-л); рХ010)=рХ100)=;7Х001)=л(1-;^1 После подстановки найденных значений переменных в вьфажение (7.183) оно приобретает следующий вид: соу(Л,А+1)=(1-;г,)^.(л^+(1-;0^)-л-,-(1-л-,)-2-[л^(1-;^+л(1-;Й^]+ W[^(l-^-^^(l--7t)^M^-;rs)\7^Hl-;t)^]-^i^^ После раскрытия скобок и определенных сокращений получим: COV(AtAt+l)=^H l-^^-lTTs+^s^-y^TTs- K-AKs' Л^. Добавим в правую часть этого выражения п^-к^ и приведем подоб- ные члены. В результате получим: cov(Ar^/+i)=-^+( 1-я) ^Д2л'Х л^-1)- K-ATCs-miX-'Tt), Учитывая, что л^ имеем 2л'Х л^+( 1-;^^-1 )=4 л-/л( 1-;^, откуда следует, что 293
cov(AH/+i)=^^+(l-;i^W, (7.184) a соответственно дисперсия случайной величины Ns равна (см. выраже- ние (7.43)) D(Ns)=T\7rs(\-7rs)+2(7^Hl-7rf-A (7.185) 2. Параметры распределения выборочной дисперсии Для случайной величины X, распределенной по нормальному закону с математическим ожиданием М[Х] и дисперсией qi:^» выборочная диспер- сия определяется следующим выражением: -ч2 /=0 П-1 ",=1 (7.186) При этом случайная величина пГ 1 1=0' Xi -X * V <^.г У (7.187) распределена по закону Пирсона (j^) с п степенями свободы. Сравнивая выражения (7.186) и (7.187) получим, что 2 2 4) 5^=0-^-^ (7.188) 2 2 '' И ^[^jf ]=о^ , поскольку M[;if(„f]=«. Таким образом, распределение выборочной дисперсии совпадает с 2 2 распределением ^(п) > скорректированным на значение сТх In. Дисперсия выборочной дисперсии Sx определяется как D{sI)-^M[sI-ctI]^ ={(7lfM п2 Чп) -1 2а (7.189) поскольку при больших значениях п можно допустить, что -12 2 М Х(п) -1 л Это, в свою очередь, следует из того, что {х -n)/^j2n - Л^(0,1), т.е. 2 ^i2 D(;^(,/) = M[2(n)-n]^=2n. 294
3. Оценка параметров распределений функциональных зависимостей случайных величин Предположим, что между переменными у и хи ^2»-., Хп существует функциональная связь У=Ях\ (7.190) где вектор jc=(xi, хг,..., JCn) является случайным с известным (нормаль- ным) законом распределения x-N{M[x\, Cov[jc]), и параметры M[jc]=(Jci,jC2'-»^Ai) ^ Cov[jc] (ковариационная матрица компонент век- тора л:) определены на основании временных рядов jc/r, /=1,2,.-., п\ Г=1,2,... Т. Очевидно, что в этом случае и переменная у является случайной вели- чиной. Ее закон распределения является асимптотически нормальным, а его параметры могут быть определены на основании разложения функции j{x) в ряд Тейлора в окрестности точки М[х\. Ограничиваясь первым по- рядком разложения Тейлора, получим: 3' = /(-^ь^>..-»^л) = /(^1'^"-"^/2) + ^a/(]ci,JC2,...,^J . -. (7.191) /=0 dxi (Xi-Xi), где /(jci,AC2,...,Jc„) - значение функцииДдг) в точке jc = (jci,jc2,...,a:;,) и Э/(^1Д2"-"^п) Эл:^- - значение производной в этой точке. В силу того, что M[xi - AcJ = О, получим: M[y] = M[f(xi,X2,...,Xn)]. Дисперсию переменной ^^ определим следующим образом: 0[у] = М[у-М[у]У' =М i^u,--,) (7.192) (7.193) Из выражения (7.193) вытекает, что в точке дг = [jc^, Зс2»• • •»^п 1 диспер- сия переменной у может быть определена в предположении о независи- df(x) мости производных dxi го выражения: D(y) = и приростов (xi -jCj) на основании следующе- (7.194) 295 м "Э/(Зс)1 •Cov(J)- М "Э/(х)Т . 3jC' J
где М dfix) Эдс,- мт,...,м^^^ - математическое ожидание производной в точке [Зс^ Д2'-»^л]» Cov(jc)- ковариационная матрица компонент вектора х. В том случае, когда компоненты вектора х независимы между собой, вьфажение (7.194) приобретает следующий вид: •D(Xi), (7.195) /)(>') = 1М Э/(?) dxi Используем выражения (7.194) и (7.195) для оценок параметров рас- пределений некоторых комплексных (сложных) переменных, рассмот- ренных в разделе 7.3. Дисперсия случайной величины SR, представляющая собой отношение ^ (выражение (7.31)) на основании выражения (7.195) SR = .''^ Nr T-N, оценивается следующим образом: D(SR) = \m Э/ д{М,) 'N,> (7.196) где Dff определена вьфажением(7.185),^5Л. Поскольку b{SR) Т 1 ЭЛ^. (jr-N.f Г(1-л-,)2 (7.197) то, подставляя правые части выражений (7.185) и (7.197) в выражение (7.196), получим: D{SR)= [я:,(1-;г,)] + 1(я:^ +(1-/г)^ -ж^) (7.198) Выражение (7.198) в точности соответствует выражению (7.45). На основании выражения (7.194) определим также параметры отно- шения двух дисперсий (Тх^ и (^, которое представляет собой отношение VRiXy^^OilOx (см. выражения (7.56)-(7.58)). Из выражений (7.56), (7.57) и (7.192) непосредственно следует, что (7.199) М[Щ2)] = ^^^ = 1. М\а\\ 296
Дисперсию этого отношения найдем как дисперсию функции 2 _ 2 f(y) = ^^^^ = VR(2)-l, ^1 (7.200) Такое преобразование целесообразно, поскольку случайные величи- ны, стоящие в числителе выражения (7.200) и его знаменателе, являются независимыми между собой. Это следует из того факта, что эффектив- ная оценка вх параметра в асимптотически некоррелирована с разно- стью вг-вх, где 02 - другая оценка этого параметра. Этот результат вы- текает из следующего рассуждения. Если условие независимости в[ и разности 02-0\ не выполняется, то можно найти линейную комбинацию оценок 01 и вг-0\* которая будет более эффективной оценкой параметра ^по сравнению с 0\у что противоречит исходной информации об эффек- тивности оценки 0\. В нашем случае Oi^ является эффективной оценкой дисперсии с^^. То- гда для нее можно записать при Г—>«> следующее равенство: Откуда непосредственно следует, что D(a2^W)=D{a2^hD((7A (7.201) 1 1 Подставляя в выражение (7.201) оценки D(<Ti ) и D(<^ ) (см. выраже- ния (7.189),(7.57) и (7.58)), получим: лг^2 ^2. 4^' 2а^ 2сг^ 27 2Т 27 (7.202) Далее, дисперсию функции Ду), определенную выражением (7.200) с учетом независимости его числителя и знаменателя согласно формуле (7.195), представим в следующем виде: D(f(y)) = M Э/ diaj-af) ■D{(xl-a1)+M Э/ Ьа} ■Diaf). С учетом того, что М Э/ d«Tt-<^:)} =м '1 J = —,а М = 0 в силу равенства нулю математического ожидания числителя выражения (7.200) и, принимая во внимание результат (7.202), получим 297
1 20-^ 2 -V ^ = —. (7.203) /j4 IT IT Этот результат совпадает с утверждением (7.61). ВОПРОСЫ к ГЛАВЕ VII 1. Назовите объекты изучения финансовой эконометрики. 2. Что собой представляют первичный и вторичный финансовые рын- ки? 3. Каковы особенности сбора, обработки и анализа исходной инфор- мации? 4. Назовите источники исходной информации. 5. Назовите причины, вызьшающие необходимость преобразования финансовых показателей. 6. Каким образом проводится преобразование финансовых показате- лей? 7. Назовите законы распределения финансовых показателей. 8. Охарактеризуйте гипотезы финансовой эконометрики (гипотезы случайного блуждания): ГСБ-1, ГСБ-2, ГСБ-3. 9. Каким образом проводится тестирование гипотез финансовой эко- нометрики? 10. Что собой представляет броуновское движение? 11. Охарактеризуйте методы оценки параметров броуновского движе- ния. 12. Что такое «арифметическое» и «геометрическое» броуновское движение? 13. Что собой представляет стохастический дифференциал? 14. Дайте характеристику ИТО-процесса и его основных свойств? 15. Каким образом проводится тесттфование процессов с изменяю- щейся вариацией? 16. Перечислите типы моделей с изменяющейся вариацией и способы ее формализованного представления. 17. Методы оценки параметров моделей с изменяющейся вариаци- ей. 18. Что собой представляют модели с нелинейными математическим ожиданием и дисперсией? 19. Как проводится тестирование нелинейных финансовых процес- сов? 298
УПРАЖНЕНИЯ К ГЛАВЕ VII Задание 7.1 В табл. 7.1 представлена информация о курсе акций Ростелекома за период со 2 июня по 19 октября 1999 г. Таблица 7.1 № 1 2 3 4 Ь 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 1 22 Y(t) 82,90 82,90 87,45 87,45 87,39 93,25 87,95 94,20 94,20 91,00 91,00 94,78 93,85 91,98 90,49 90,49 86,50 86,50 83,90 92,55 79,00 83,20 № 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 ПО 83,20 79,70 79,70 79,40 71,50 •66,99 61,50 61,50 63,70 63,70 67,15 68,35 67,50 70,10 70,10 73,00 73,00 74,15 81,80 79,50 74,60 74,60 № 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 Y(t) 75,90 75,90 78,98 79,80 75,80 74,00 74,00 74,80 74,80 76,30 72,65 69,57 68,70 68,70 68,95 68,95 66,50 63,86 59,20 59,35 59,35 57,50 № 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 Y(t) 57,50 62,20 63,81 65,00 64,50 64,50 64,90 64,90 66,24 67.17 66,53 70,75 70,75 70,42 70,42 70,49 69,20 69,00 68.00 68,00 68,00 68,00 № 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 Y(t) 1 69,00 68,45 67,36 64,56 64,56 65,00 65,00 64,33 65,03 67,10 67,17 67,17 67,90 67,90 72,10 72,69 72,69 72,29 72,29 71,43 71,43 70,81 Требуется проверить ГСБ-1 (гипотезу случайного блуждания) с помо- щью теста Коула-Джонса. Задание 7.2 В табл. 7.2 представлена информация о курсе акций «Аэрофлота» (в USD) за период с 16 мая по 31 октября 1999 г. 299
Таблица 7.2 1 Пе- риод 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 1 24 Курс 1,74743 1,74743 1,74586 1,74586 1,74586 1,73391 1,71066 1,68767 1,68767 1,68767 1,68643 1,66069 1,76961 1,77793 1,78085 1,79986 1,79986 1,79986 1,79922 1,79922 1,79922 1,79200 1,79200 1,77238 Пери- од 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 Курс 1,72750 1,72750 1,71873 1,71873 1,70875 1,70736 1,66320 1,67393 1,67590 1,67744 1,67865 1,68037 1,68037 1,70231 1,70533 1,70533 1,70764 1,74827 1,75833 1,78198 1,81418 1,81872 1,81883 1,82585 Пе- риод 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 Курс 1,8059 1,81322 1,78395 1,72273 1,76221 1,82840 1,76005 1,72860 1,69081 1,56266 1,61779 1,64890 1,68623 1,72028 1,66088 1,64763 1,61718 1,62044 1,61402 1,63402 1,66084 1,76046 1,57818 1,59254 Пе- риод 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 Курс 1,67983 1,67365 1,68067 1,67281 1,68959 1,78445 1,78483 1,73256 1,64623 1,59628 1,64257 1,62110 1,64022 1,66683 1,61148 1,57825 1,45163 1,43571 1,39625 1,54607 1,56413 1,56434 1,56734 1,61169 Пери- од 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 Курс 1,62192 1,66921 1,65418 1,63893 1,58376 1,57432 1,56988 1,56157 1,54331 1,50830 1,57977 1,58464 1,54148 1,57437 1,64615 1,64261 1,64593 1,62085 1,62687 1,69528 1,70047 1,73319 1,78416 1,85672 Требуется: 1. Построить и проверить на адекватность модель ARCH(l). 2. Построить и проверить на адеьсватность модель ARCH(2). Задание 7.3 В табл. 7.3 представлена динамика курса акций корпорации «Омега». Требуется: 1. Построить модель GARCH (1,1). 2. Проверить ее адекватность с помощью критерия Люнга-Бокса (LB). 300
Таблица 7.3 1 Пе- риод 1 2 3 4 5 6 7 _ А _ Курс 532 539 548 546 564 571 570 566 Пе- риод 9 10 11 12 13 14 15 16 Курс 548 537 548 544 534 542 521 509 Пе- риод 17 18 19 20 21 22 23 24 Курс ЫЗ 507 510 526 543 547 547 541 Пе- риод 25 26 27 28 29 30 31 32 Курс 547 568 578 578 581 633 600 601 Пери- од 33 34 35 36 37 38 39 40 Курс 630 634 667 680 696 675 650 604 Пери- од 41 42 43 44 45 46 47 48 Курс 560 630 650 620 603 613 640 680 Задание 7.4 В табл. 7.4 представлена динамика «премии за риск» (разницы между доходностью акций корпорации «Гамма» и безрисковой доходностью). Требуется: 1. Оценить параметры модели E-GARCH (1, 1) и проверить ее качест- во. 2. Оценить параметры модели GARCH-M и проверить ее качество. Таблица 7.4 Пери- од 1 2 3 4 5 6 7 8 9 L 10 Премия, % 6,6 6,6 6,5 6,6 6,7 6,5 6,4 6,4 3,5 4 Пери- од 11 12 13 14 15 16 17 18 19 20 Пре- мия, % 4,5 5 5,5 5,1 3,5 5,5 6,1 6,2 6,3 6,3 Пери- од 21 22 23 24 25 26 27 28 29 30 Пре- мия, % 6,4 6,2 6,2 6,1 6,1 6,2 6 6 6,1 5,9 Период 31 32 33 34 35 36 37 38 39 40 Пре- мия, % 5,9 6 6,1 5,9 6 6 5,9 5,9 5,7 5,5 Пери- од 41 42 43 44 45 46 47 48 49 50 Премия, % 5,5 5,9 5,9 5,7 5,7 5,8 5,8 5,7 5,7 5J 301
ГЛАВА VIII Системы взаимозависимых эконометрических моделей 8.1. ОСОБЕННОСТИ СИСТЕМ ВЗАИМОЗАВИСИМЫХ МОДЕЛЕЙ При формировании и построении эконометрических моделей в преды- дущих разделах предполагалось, что между независимыми переменными хи,..., Xnt и зависимой переменной yt в каждый момент времени сущест- вует только односторонняя прямая связь: JC/ —>у, /=1, 2,..., п. В такой си- туации зависимая переменная yt не оказывала никакого влияния на пере- менные, входившие в правую часть модели. Это не означает, что переменные х^, /=1, 2,..., «, характеризовались как абсолютно независимые. Однако предопределяющие их значения причи- ны, факторы не находились под воздействием явления, отражаемого пе- ременной jV/. Таким образом, в тенденциях развития переменных х^ и yt просматри- валась как бы строгая очередность. Сначала в момент (период) t возника- ли явления, выражаемые независимыми в модели переменными х^, а за- тем под их влиянием формировалось явление, которое выражалось пере- менной yt. В реальной эюизни многие экономические и социальные явления разви- ваются, воздействуя друг на друга одновременно, так что в единичный период времени, обозначаемый индексом t, невозмоэюно установить, ка- кое из этих явлений первично, а какое вторично. В качестве типичного примера такой взаимосвязи обычно называют соотношение между спро- сом и предложением, характеризующееся в единичном интервале време- ни взаимным влиянием друг на друга цены и объема производства (по- требления) товара при участии некоторого количества других факторов, которые можно считать независимыми. Простейший (и достаточно ус- ловный) вариант эконометрической модели, описывающей динамику 302
этих переменных на равновесном рынке, можно представить в виде сле- дующей системы, состоящей из двух уравнений: р^Д)+да+д>л+^2/, (8.1) где Л - средняя цена за единицу товара, зафиксированная на рынке в пе- риод г; Qt - объем производства (предложения) в период t; It - средний уровень дохода потребителя в период t\ Oq, а\ и уб(), Д, у^ - коэффициен- ты первого и второго уравнений соответственно; Su и £ь- ошибки перво- го и второго уравнений соответственно. Первое уравнение системы (8.1) показывает, что объем производства товара в период t зависит от сложившейся на него на рынке цены. Во втором уравнении уже уровень цены на товар ставится в зависимость от объема его предложения и дохода потребителей, величина которого в этой системе предполагается известной. Таким образом, переменная /, в системе (8.1) является единственной чисто независимой переменной, а переменные Р, и Qt являются взаимозависимыми, т.е. в одном уравне- нии одна переменная рассматривается как зависимая, а другая - высту- пает в качестве независимой. Во втором уравнении они меняются мес- тами. Вообще говоря, «одновременность влияния» различных переменных друг на друга в большинстве случаев можно рассматривать как одно из допущений модели, целесообразность введения которого вызывается, на- пример, укрупнением временного интервала Г. В реальности вряд ли можно обнаружить рынок, на котором равновесные цены и объемы това- ров формировались бы одновременно. Обычно эти показатели изменяют- ся в ходе работы рынка на основе попеременной корректировки одного из них с учетом известного значения другого. Производитель, реагируя на рыночные цены, выпускает определенное количество товара (продавец закупает товар у оптовика). С учетом нового объема предложения и по- купательской способности населения на рынке формируется новая цена (корректируется цена на товар). Такая очередность во взаимовлиянии предложения товара и его цены относительно непродолжительный пери- од времени соответствует несколько другой модификации системы эко- нометрических уравнений, имеющей следующий вид: /^рД+да+д/г+^з/, (8.2) в которой взаимосвязи между взаимозависимыми переменными выража- ются следующей последовательностью: Pt~\->Qt-^Pt-^ Qt+\- 303
в системе (8.2) одновременные взаимосвязи между переменными Л и Qt отсутствуют. Однако если периоды будут укрупнены (например, дневные в недельные, месячные в квартальные и т.п.), то в рамках укруп- ненного периода уже возникают одновременные взаимосвязи между пе- ременными Pt и Qt. Использование в данной ситуации в качестве объяс- няющей переменной значения P,_i становится нецелесообразным, по- скольку реакции покупателя и продавца проявляются уже в рамках одно- го и того же периода. В этом случае взаимосвязи между переменными Р, и Qt уже определяются системой (8.1). При этом, например, Р, может рассматриваться как средняя цена за этот укрупненный период, а б/ - как объем продаж (предложения). Разумеется, что при определении длины укрупненного периода большое значение имеет вид товара. Для товаров повседневного спроса уже неделю можно рассматривать в качестве тако- го периода, а для некоторых средств производства и годовой продолжи- тельности может быть недостаточно. В отношении ошибок системы (8.1) €и и е^ выдвинем традиционные предположения об отсутствии в ряду каждой из них явлений гетероскеда- стичности и автокорреляции: Af[%] = 0,cov(flpfi^_,) = 0,/ = l,2,...,D(%) = c7j; \ (8.3) М[^1г] = 0,соу(^2Р^2.м) = 0'^* = 1'2,...,О(^2/) = ^4- в целях упрощения предварительных рассуждений предположим так- же, что временные ряды ошибок ей и e2t статистически независимы, т.е. cov(fi,, e2t)=0. Посмотрим, сохраняется ли для системы (8.1) условие (2.23), выпол- нение которого позволяет получить несмещенные оценки коэффициентов модели csq, аи /Зо, fiiy fiz с использованием МНК. Подставим во второе уравнение системы (8.1) значение Qt, выражен- ное через Pt. Получим Рр/5Ь+Д(аь+с1ГгЛ+^1г)+М+^2^А+Д-^+^гД-Л+А-/г+Д-^1/+^2^ откуда следует, что 1-Дц 1-Д-Ц 1-А-^1 где /q = ^-^—^-=-——; У1 = —^-^— - коэффициенты новой модели и Uf = ■— новая случайная ошибка, являющаяся линейной ком- 304
бинацией независимых ошибок £и и £2г- В силу условия (8.3) несложно убедиться, что M[mJ=0; D(M,)=const; со\(щ,Щ-д=0, / = 1,2,... . Из выражения (8.4) следует, что в общем случае на зависимую пере- менную Pt воздействует случайная ошибка м„ в которую входит ошибка первого уравнения ей- Таким образом, переменные PfU £и нельзя считать независимыми и M[£i,(P,-M[PJ)] = M[fi,,wJ = YI7^-^J ''^- (8.5) Иными словами, входящие в первое уравнение независимая перемен- ная и ошибка оказываются коррелированными, а следовательно, и прямое использование МНК для получения оценок коэффициентов этого уравне- ния даст смещенные результаты. При этом из выражения (8.5) следует, что это смещение не может быть устранено увеличением объема выбор- ки, поскольку (Г = const при всех значениях Т. Напомним, что величину смещения оценок оо и ах, согласно выражению (2.9), можно оценить как [(X'Xr'X'e^i где Х = О Р, \ ^ ^Tj Оценки со смещением, не устраняемым увеличением объема выборки, называют несостоятельными. Если такие оценки получены с использо- ванием МНК, ^о часто употребляется термин «несостоятельный МНК». Аналогично можно показать, что во втором уравнении системы (8.1) переменная Qt связана с ошибкой €2t и применением обычного МНК и в этом случае ведет к смещенным оценкам параметров Д), J3i Заметим далее, что, вообще говоря, уравнения системы (8.1) могли бы быть рассмотрены и по отдельности. Однако это не будет озна- чать, что взаимосвязи меэюду переменными, входящими в их правые час- ти, и соответствующими ошибками исчезли. Эти взаимосвязи сущест- вуют вне зависимости от того, объединяются ли данные уравнения в систему. Они предопределены характером взаимоотношений в экономи- ке меэюду рассматриваемыми процессами, а не самим объединением их в систему. Просто в системе взаимосвязи меэюду независимыми перемен- 305
ными и ошибкой становятся непосредственно очевидными, поскольку они могут получить количественную оценку. Таким образом, системы взаимозависимых эконометрических мо- делей выражают через структурную форму взаимосвязей меэкцу яв- лениями их новое содержание, характеризующееся взаимным влия- нием друг на друга некоторых зависимых и независимых перемен- ных. В этой связи следует заметить, что можно строить отдельную модель этой системы для отдельно взятой зависимой переменной, но при этом следует иметь в виду, что если она, в свою очередь, в то же время влияет на какую-либо из независимых переменных, то исполь- зование МНК для получения оценок коэффициентов этой модели да- ет смещенные результаты. Здесь следует отметить, что корреляционные взаимосвязи между эн- догенными переменными и ошибками появляются и в том случае, когда некоторые из уравнений системы (8.1) имеют характер тождества. Рас- смотрим, например, упрощенную модель агрегированного спроса в зави- симости от величины дохода при балансовом ограничении на величину дохода: It=Q+Z,, (8.6) где Ct - потребительские расходы в период Г, определяющие величину спроса; It - размер дохода в период Г, Z/ - чистые инвестиции в период г; St - ошибка модели, удовлетворяющая свойствам типа (8.3); )3и а- ко- эффициенты модели. Заметим, что во втором уравнении системы (8.6) отсутствует ошибка, и коэффициенты при объясняющих переменных строго предопределены балансовым соотношением. Они равны едини- це. Подставив первое уравнение из (8.6) во второе, получим 7,=^+-^+-^. (8.7) \-а \-а \-а Таким образом, коэффициент ковариации между переменными Л и б^ в силу условий (8.3) оказывается отличным от нуля: М[£,.(/,-М[/^)] = -1-.М[£,2];^о,гдеМ[/^ = -А.+^ Вместе с тем следует отметить, что существует класс систем взаимо- зависимых эконометрических моделей, в которых эндогенные перемен- ные и ошибки можно считать статистически независимыми. Это — так 306
называемые <фекурсивные системы». Простейшим их примером можно сиитать систему (8.2). В результате подстановки первого уравнения из (8.2) во второе полу- чим Pf=(Mfii •^)+Д-^1 -Лч+у^-Л+Д -eit-^Sit. (8.8) Из выражения (8.8) вытекает, что цена товара Р, в период Г, опреде- ляемая вторым уравнением, зависит от ошибки первого уравнения. Одна- ко поскольку при определении коэффициентов первого уравнения из (8.2) используется не значение Л, а значение P,_i, которое не связано с ошиб- кой St, то использование МНК не приводит к смещению оценок коэффи- циентов Oqw а\. С учетом этого факта коэффициенты каждой из эконометрических моделей, входящих в рекурсивную систему, могут быть оценены с ис- пользованием обычного МНК и полученные их оценки не будут сме- щенными. Рассмотрим проблемы построения систем взаимозависимых эконо- метрических моделей более подробно, в том числе и с формальных пози- ций. 8.2. ФОРМЫ ПРЕДСТАВЛЕНИЯ СИСТЕМ ВЗАИМОЗАВИСИМЫХ ЭКОНОМЕТРИЧЕСКИХ МОДЕЛЕЙ Собрав по разные стороны знака равенства переменные уи и Xjt и ошибки Eiu /=1, 2,..., m;j=l, 2,..., п; представим общий вариант системы взаимозависимых уравнений в следующем виде: где Oik и fiij - коэффициенты /-го уравнения при переменных >'jt^ и дсу, со- ответственно; к, /=1, 2,..., /и;7=0, 1,..., п\ ^о=0. Взаимозависимые переменные уь У2у—* Ут обычно называют эндоген- ными, подчеркивая тем самым, что га расчетные значения определяют- ся на основании модели (8.9), Переменные дс/,..., Хп называются экзоген- ными. Их значения задаются только в качестве исходных данных и в системе (8.9) они не рассчитываются. ^ Ошибка St формируется позже, чем значение P/_i, поэтому связь между этими переменными отсутствует. 307
Для ошибок системы (8.9) будем считать справедливыми предположе- ния типа (8.3), т.е. М[€и]=0; cov(6;y, ^и-к)=^'^ ^1» 2,...; D{en)^(jl. Но при этом ошибки отдельных уравнений могут быть взаимозависимыми, что выражается соотношением COW(€i,€j) = 1 ^ ^ t=l ■^0, (8.10) которое может быть справедливым для некоторых / и j . Кроме того, в системе (8.9) предполагается, что экзогенные перемен- ные дсу,7=1,2,..., п; и ошибки уравнений £;, /=1, 2,..., т; независимы. Исходными данными при построении модели (8.9) являются зафикси- рованные в моменты времени /=1,2....,Г значения эндогенных перемен- ных д',/ и экзогенных переменных jc,7, /=1, 2,..., w;y=l, 2,..., п. Для произвольного момента t система (8.9) может быть записана в следующей векторно-матричной форме: А y,-^Bxr=et, (8.11) гдед^г=[У1г»>^2г»-..,>'тг]' - вектор-столбец наблюдаемых (исходных) значений эндогенных переменных в момент г; Xi=[l, JCir,.-, XntY - вектор-столбец на- блюдаемых (исходных) значений эндогенных переменных в момент г; £r=[^\h •••» ^tY - вектор-столбец значений ошибок уравнений в момент г; А, В - матрицы коэффициентов atk и Ь^ модели при переменных >'/, и Xjt соответственно. Матрица А имеет размерность тхт, а матрица В - тх(п+1). А = Ч, • <««! • •• ^тт) ,в = ^До <ДпО Д, • Д™. • ■• Д„^ г'тп J (8.12) Развернутую и векторно-матричную формы (8,9) и (8.11) системы эконометрических уравнений называют структурной формой модели, В отличие от нее моэюно сформировать так называемую «приведенную» форму модели, в которой значения переменных у и выраэюаются только через экзогенные переменные Xjt, Векторно-матричное уравнение приве- денной формы записывается в следующем виде: yt=Cxt+Ut, (8.13) где С - матрица коэффициентов приведенной формы размера тх(п+1)\ «F[wirv., UntY - вектор-столбец ошибок приведенной формы. 308
Таким образом, уравнения, входящие в приведенную систему (8.13), по своему виду похожи на традиционные эконометрические модели с од- ной зависимой переменной у^ и независимыми факторами хи, X2r,..., Xnt- Развернутая форма приведенной системы (8.13) может быть представлена в следующем виде: ymt = ГтО +Гт1% +••• +Г/гш^лг + "тг- Вообще говоря, приведенная форма системы эконометрических урав- нений типа (8.13) может быть сформирована только при условии невы- рожденности матрицы А, В самом деле, из условия равенства столбцов уt в системах (8.11) и (8.13) непосредственно вытекает, что показатели при- веденной формы выражаются через показатели структурной формы сле- дующим образом: C^A-^B,Ur=A-^ et. (8.15) Поскольку экзогенные переменные Xjt, j=l, 2,..., n; и ошибки eit, /=1, 2,..., m; статистически независимы, то оценки коэффициентов приведен- ной формы, полученные с использованием МНК, являются несмещенны- ми, несмотря на достаточно сложную структуру ошибок щ. Из выраже- ния (8.15) следует, что ошибки uia являются линейными комбинациями ошибок ett, к, /=1, 2,..., /и. Для них справедливо следующее соотношение: Ukt= схку£и+схктеъ+..лаы-£гш, (8.16) где коэффициенты aki являются элементами к-и строки матрицы А"^. Из выраэюений (8J4) и (8.16) непосредственно такэюе следует, что любая эндогенная переменная yja, к =7, 2,..., т; статистически взаимо- связана с ошибками всех моделей системы (8.1), поскольку ошибки uia яв- ляются линейными комбинациями ошибок £ц. Точно так же, как и для системы (8.1), можно доказать, что и в общем случае системы (8.9) и ее векторно-матричного аналога (8.11), ее харак- терной чертой является наличие статистических взаимосвязей между эн- догенными переменными y^t* входящими в правую часть /-го уравнения этой системы, и его ошибкой е^. Для переменной у2г» например, это не- сложно сделать, подставив во второе уравнение системы вместо перемен- ной уи определяющее ее первое уравнение системы. В результате полу- чим следующее выражение: У2Г =/()'3,.-.)'тМ%.-.^«)+^^^^^. (8-17) 1-^21 «12 309
свидетельствующее о том, что переменная у2г и ошибка ви взаимосвяза- ны друг с другом. В выражении (8.17)У(узг,--, Упи, хц,,.., Хпд представляет собой новую линейную форму, отражающую зависимость переменной y2t от всех дру- гих факторов, входящих в модель, после подстановки первого уравнения системы во второе и приведения подобных членов. Аналогичным образом, подставляя во второе уравнение системы (8.9) третье, четвертое и т.д. т-с уравнение, увидим, что переменная y2t взаи- мосвязана с ошибками £зг» fijrv, £mt и ее вхождение в правую часть этих уравнений в качестве независимого фактора в случае использования МНК влечет за собой смещение оценок их параметров. Точно так же можно показать наличие взаимосвязей и между дру- гими эндогенными переменными, рассматриваемыми в уравнениях системы (8.9) в качестве независимых факторов, и ошибками этих уравнений. При сопоставлении структурной и приведенной форм системы (8.11) следует иметь в виду, что при заданном составе эндогенных и экзоген- ных переменных приведенная форма является единственной, определен- ной матричным уравнением (8.13). В то лее время структурная форма вытекает из содерэюательных предпосылок, леэюащих в основе модели, отраэюающих эмпирический опыт, интуицию исследователя, то или иное направление экономической теории. Вследствие этого даэюе при из- вестном составе эндогенных и экзогенных переменных в общем случае моэюет существовать мноэюество структурных форм, каэюдая из кото- рых определяется специфическими соотношениями включенных перемен- ных, в свою очередь отраэюающими определенные варианты содерэюа- тельных предпосылок системы (8.9). Можно показать, что некоторые из этих форм взаимосвязаны между собой. Предположим, что существует невырожденная матрица F размера тУт. Умножим выражение (8.11) слева на эту матрицу. В результате имеем FAyt+FBxi=Fet. (8.18) Обозначив F'A=Ai, FB=Bi, F€t=€t\ получим новую структурную форму Лууг^ВуХг^е!^ В частности, приведенная форма (8.13) получена при условии, что F =y4~^ Преобразуем новую структурную форму (8.18) в приведенную. Для этого умножим это выражение слева на матрицу (Р-А)'^. В результате получим следующее выражение: {F'Ar'-{F'Ayyt-^{F'AT'-F^B'X^{F'Ar'-F'et, (8.19) 310
которое с учетом правила умножения обратных матриц ((F-A) ^ =А ^-F"^) преобразуется к уже известной системе (8.13). Выражения (8.18) и (8.19) формально доказывают единственность приведенной формы и множественность структурных форм для заданного состава эндогенных и экзогенных переменных. Заметим, что структурная форма системы взаимозависимых экономет- рических моделей (8.11) может быть представлена и в более компактной форме записи Dzt=€t, (8.20) где вектор Zt размера (т+л) объединяет векторы ^, и jc,, а матрица D раз- мера тх( т-\-п) объединяет матрицы А и В. г,=[1'У = [АВ1 (8.21) где [А В] - матрица, образованная построчным присоединением матрицы В к матрице А. Таким образом, она содержит т строк и m+n+l столбец. Кроме того, заметим, что и структурная форма (8.11) и приведенная фор- ма (8.9) сформированы дпя каждого из текущих индексов t. В общем ви- де, развернув каждую из переменных по индексу t, структурную форму (8.11) можно представить в следующем виде: AY+BX=I, (8.22) где ¥иХпредставляют собой матрицы размера Тхт и Тх( и+1) соответ- ственно: У = Уп У21 У12 Угг Ут\ Утг , х = 1 U jcir Хп2 (8.23) УУХГ Утг ••■ УтТ J а матрица .Г размера Тхт объединяет ряды ошибок е^^, {=1, 2,..., т; 1=1, 2 Т ( 2* = ^11 ^21 ^т\ \ (8.24) в ряде литературных источников можно встретить чуть более при- вычное развернутое представление системы (8.11), в котором элементы 311
матрицАиВ сформированы в виде векторов, состоящих из w и тх(п+1) компонент соответственно. Тогда общий вид этой системы определяется следующим выражением: Y Ai+XBi=€, (8.25) где Y- блочно-диагональная матрица размера (Г- тх т ) вида У = О о (8.26) ■ту X - блочно-диагональная матрица размера {тТх{п+\)т) вида X. х = ^3 о (8.27) "■mj и матрицы Y viX определены выражением (8.23); A\W.B\ — векторы ко- эффициентов при эндогенных и экзогенных переменных: л = f""l «12 «l™ «21 «2« ««1 У^т) ;«.= ГДо^ д> Ри ^20 А. А„ р.. кРпт) (8.28) е- вектор ошибки, состоящий из 7\ /и компонент: 312
е = (8.29) Га \ Выражения (8.22) и (8.25) представляют собой альтернативные формы записи общего вида системы (8.11), в которых фигурирует весь состав эндогенных и экзогенных переменных. Вместе с тем, как это было видно из рассмотренных выше примеров, в конкретных системах взаимосвязи между отдельными переменными могут либо отсутство- вать, либо быть определены заранее. Например, в системе (8.1) в пер- вом уравнении не присутствует экзогенная переменная /,. В системе (8.6) уже известны коэффициенты балансового соотношения при эндо- генной переменной Q и экзогенной переменной Z,. Они оба равны единице. В этих случаях на соответствующих местах в матрицах А иВ (выражение (8.25)) должны стоять либо нули (при отсутствии в урав- нении соответствующей переменной), либо известные значения коэф- фициентов. Между коэффициентами структурной формы могут иметь место и бо- лее сложные взаимосвязи (например, в виде алгебраических соотноше- ний, типа равенств), вытекающие из предпосылок экономической теории. Так, известная функция Кобба-Дугласа yt =ciq- х^^ • jc2" часто рассматри- вается с учетом условия ^1+^2=1. Эти ограничения, как это будет показа- но далее, играют существенную роль при оценке коэффициентов систем взаимозависимых эконометрических моделей. Рассмотрим некоторые примеры систем взаимозависимых экономет- рических моделей, которые использовались в исследованиях реальных процессов, и соответствующие им структурные и приведенные формы. Пример 8.1. Для исследования динамики цен и потребления электроэнергии, фор- мирования на основе выявленных закономерностей рациональной поли- тики в сфере электроснабжения в США была использована следующая система из двух взаимозависимых уравнений, по содержанию эндогенных переменных похожая на систему (8.1): 313
где Oik и fij - коэффициенты системы (8.30), помеченные «штрихом», чтобы выделить отличие их знаков от соответствующих коэффициентов структурной формы; 3^1=1пУ1 и 1^1 - среднегодовое количество электроэнергии в расчете на одного потребителя; У2 =1пУ2 И Уг- цена за единицу потребляемой электроэнергии; jci=lnXi иХх- годовой доход в расчете на одного человека; Х2=1т\Х2 и А^2 - средняя цена за потребляемый жилищным комплексом газ; ;сз=1пЛз иХз- количество теплых дней в году; jC4=lnA4 и Jl4- средняя температура июля; jC5=lnA!5 hXs- процент населения, проживающего в сельской местно- сти; ;Сб=1пА!биХв- средний размер домохозяйства; x^=]nX^ и Jf/- стоимость рабочей силы (заработная плата); X8=lnA"8 иХ^- процент энергии, произведенной акционерными комму- нальными предприятиями; jC9=lnX9 и А^9- расход топлива на один киловатт-час электроэнергии; jcio=lnA^io и ^10 - отношение количества промышленных предприятий, продающих электроэнергию, к количеству аналогичных территориальных компаний; д:11=1пА"11 иХц- временной фактор. Исходные данные для модели (8.18) имеют пространственно-временную структуру. Они отражают уровни рассматриваемых процессов по 48 штатам за 9 лет. При этом отметим, что время являлось одним из факторов модели, аккумулирующим аспекты потребления электроэнергии, связанные с науч- но-техническим прогрессом. Таким образом, индекс t в системе (8.18) соот- ветствует порядковому номеру набора, /=1,2,..., Г; Г= 48x9. Первое уравнение определяет зависимость количества потребляемой электроэнергии от цены и показателей, отражающих особенности потре- бительского рынка в регионах в соответствующий год. 314
А = В = О Во втором уравнении уже цена за электроэнергию ставится в зависи- мость от объемов ее производства (при условии, что производство равно потреблению) и ряда других факторов, влияющих на цену. Структурная форма системы (8.30) в соответствии с выражениями (8.9), (8.11), (8.12) характеризуется следующими векторами и матрицами: ' 1 ^12V ^^21 1 J' ^Ао Ai Аб о ^=-^/; Д =-Д,'; *,/=1,2;7=о,1,2,...Д 1. Отметим, что в матрице В в первой и второй строках нулевые элемен- ты стоят на местах факторов, которые отсутствуют в соответствующем уравнении системы (8.30). Приведенная форма системы (8.30) может быть представлена следую- щей системой уравнений: У2г=По'^П1Х1&"--^Пл\Хи,&иъ, (8.31) которая, в свою очередь, в векторно-матричной форме выражается урав- нением (8.13) с матрицей С следующего вида: Л, л, о, Л С = \ /10 Гц ... /1,11 /20 /21 ••• /2.1lj Заметим, что в выражении (8.31) на коэффициенты jij, /=1,2,...; 7=0,1,...,11; не накладывается никаких ограничений. В частности, не тре- буется равенства нулю тех коэффициентов, которые были равны нулю в структурной форме. Пример 8.2. Для анализа закономерностей и пропорций государственных расходов и федеральных субсидий в США была использована следующая система из двух взаимозависимых уравнений: Уи = А'о +^12>'2Г -^/^П^и "^P'n^lt +^1Г ; Ун = Рго -^^2\Уи -^Ргъ^ъг +^2г» (8.32) где Уи - государственные расходы, производимые на местном уровне в штате t\ yit - уровень федеральных субсидий в г-м штате; х^ - доход г-го штата; xit - численность населения, проживающая в Г-м штате; х-ц - чис- ленность учащихся в школах 1-й и 2-й ступеней в г-м штате. 315
в данном случае индекс t характеризует номер штата и исходная ин- формация имеет пространственный характер. Она была собрана за один год. Однако эта информация может иметь и пространственно-временной характер, как в предыдущем примере. Первое уравнение описывает распределение государственных расхо- дов по административным территор1Иям, в зависимости от уровня феде- ральных субсидий, дохода самих территорий и численности проживаю- щего населения. Во втором уравнении уже федеральные субсидии территориям рас- сматриваются как зависимая переменная, на уровень которой влияют го- сударственные расходы и численность учащихся в школах 1-й и 2-й сту- пеней, являющихся основными «потребителями» этих субсидий. Целесообразность формирования такой системы связана с тем, что фе- деральные субсидии и правительственные расходы зачастую направляются на одни и те же программы, как бы «конкурируя» друг с другом. Увеличе- ние одной переменной обычно влечет за собой снижение уровня другой. Матрицы структурной формы модели (8.32) имеют следующий вид: л=1 ' «1^ ,0,, \ )■ Ур^ о о AbJ' ccik=aik;Ра^Щ;к, /=1,2;;=1,2,3. Приведенная форма модели (8.32) может быть представлена следую- щей системой уравнений: Уи = Гю +Гп% +rnX2t +Г\зхз, +щ,; Уь = Гго + Гг\Хи +722^21 +Г23^зг +«2t. (8-33) где коэффициенты % в общем случае не являются тождественными нуля- ми, 1=1,2; У=1,2,3. Пример 8.3. Примером системы взаимозависимых эконометрических моделей, включающей в себя балансовые соотношения, является так называемая модель Людеке, разработанная для описания макроэкономических про- цессов на уровне государства. Она может быть представлена в следую- щем виде: Уи =fiio+ «14У4Г + ^1Уи-1 + £и < yit = «^0 + <^'^Ум + Pll^t + %■' .g 34) УЪ1 = ^0 + ^УАг + РъъУЪ4-\ + %; 316
где уи- уровень потребления в году t; Уи-\=хи', угг- инвестиции; узг- им- порт, >'з.г-1=^з/; Ум- национальный доход; хгх- доход от предприниматель- ской деятельности в прошедшем периоде, т.е. в г-1; jC4r- государственные расходы плюс государственные чистые инвестиции в основной капитал плюс изменения в товарных запасах плюс субсидии минус косвенные на- логи; JC5/- экспорт. Первое уравнение системы (8.34) описывает динамику потребления с учетом авторегрессионной связи этого процесса и в зависимости от про- изведенного в государстве дохода; второе - динамику инвестиций как функцию от национального дохода и дохода, полученного в прошлом го- ду в результате предпринимательской деятельности; третье - динамику импорта с учетом авторегрессионной связи этого процесса и в зависимо- сти от национального дохода и последнее уравнение представляет собой балансовое соотношение, характеризующее распределение национально- го дохода на основные составляющие. Система (8.34) содержит четыре эндогенные переменные и пять экзо- генных, в число которых входят две запаздывающие эндогенные пере- менные у\^1-\ (потребление прошлого года) и y^t-x (импорт прошлого года) и одна запаздывающая чисто экзогенная переменная хг (доход от пред- принимательской деятельности прошлого года), которая однако рассмат- ривается как незапаздывающая, поскольку переменная Х2х в модели отсут- ствует. Взаимозависимый характер модели (8.34) придает вхождение в правые части первых трех уравнений переменной, вьфажающей национальный доход, которая, в свою очередь, представлена балансовым соотношением. В результате переменная y/^t оказывается статистически взаимосвязанной с ошибками уравнений е\и Вц и £зг> что является причиной несостоятель- ности МНК (смещенности оценок коэффициентов первых трех уравнений системы в случае использования этого метода). Структурная форма модели (8.34) характеризуется следующими век- торами и матрицами: гдех1г=у1,м;хзг=уз.г-1; \ 0 0 ^14^ ( Р\ О О 1 ^34 I \РъО 1-1 -11 1 J IAo А = Ai 0 0 0 0 Ргг 0 0 0 0 Ргг 0 0 0 0 -1 0] 0 0 -ij 317
Заметим, что приведенная форма системы (8.34) должна определяться уравнениями, в правых частях которых нет незапаздывающих эндоген- ных переменных, а запаздывающие рассматриваются как незапаздываю- щие экзогенные переменные. С учетом этого замечания данная форма может быть представлена в следующем виде: У и =Г\о-^Гп^и -^rn^it +Пз^зг +Г14-^4г +П5-^5г +"1/; Ун =Г20 +Г21-^1Г +Г22^2г +Г23-^ЗГ +^24-^4/ + Г25-^5г +«2г ; >'ЗГ =Г30+Г31% +Г32^2Г +ГЗЗ-^ЗГ +Гз4-^4/ +Гз5-^5г +^3t'^ (8-35) У4/ = Г40 +Г41-^1Г +Г42^2Г +Г43-^ЗГ +Г44-^4г + ^45-^5/ +"4г • Обратим внимание на то, что при отсутствии автокорреляции во вре- менных рядах ошибок Uit (см. условие (8.3)) запаздьшающие эндогенные переменные yi^ t-\ и ошибки щ являются статистически независимыми и эти переменные можно рассматривать в приведенной форме как экзоген- ные. Рассмотренные примеры свидетельствуют о том, что матрицы А и В, образующие структурную форму системы взаимозависимых эконометри- ческих моделей, часто содержат некоторое количество известных (предо- пределенных) элементов. В то же время матрица С из приведенной фор- мы содержит только неизвестные элементы. Их количество соответствует числу экзогенных переменных модели. Приведенная форма системы взаимозависимых эконометрических мо- делей играет важную роль в решении проблемы получения несмещенных оценок коэффициентов структурной формы этой системы. Эта проблема более подробно рассматривается в следующих разделах этой главы. 8.3. КОСВЕННЬШ МЕТОД ОЦЕНКИ КОЭФФИЦИЕНТОВ СТРУКТУРНОЙ ФОРМЫ СИСТЕМ ВЗАИМОЗАВИСИМЫХ ЭКОНОМЕТРИЧЕСКИХ МОДЕЛЕЙ В разделе 8.2 было показано, что использование МНК приводит к смещению оценок коэффициентов только структурной формы модели. В силу статистической независимости экзогенных переменных и ошибок структурной и приведенной форм оценки коэффициентов приведенной формы, полученные с использованием МНК, являются несмещенными (часто имеется в виду свойство их состоятельности). При этом ничто не мешает с помощью этого метода определить оценки коэффициентов каж- дого уравнения приведенной формы отдельно от других. 318
Это замечание наводит на мысль использовать для оценки коэффици- ентов структурной формы алгебраическое матричное уравнение (8.15) или его аналог, который может быть представлен в следующем виде: С ^А-^ В ^АС+В =0, (8.36) где О обозначает матрицу соответствующего размера с нулевыми элемен- тами. В вьфажении (8.36) в качестве неизвестных рассматриваются элементы матриц структурной формы А и В, в то время как элементы матрицы приве- денной формы С являются известными. Их можно определить путем исполь- зования МНК для оценки коэффициентов приведенной формы (8.13), (8.14) при известных значениях эндогенных и экзогенных переменных. Такой под- ход получил название косвенного метода оценки коэффициентов структур- ной формы системы взаимозависимых эконометрических моделей. Теоретически косвенный метод представляется вполне приемлемым. Оценки коэффициентов матрицы С в силу независимости экзогенных пе- ременных и ошибок соответствующих приведенных уравнений являются несмещенными и эффективными. Однако, к сожалению, как свидетельствуют результаты практических исследований, оценки коэффициентов структурной формы, полученные путем решения системы уравнений типа (8.36), свойство несмещенности, как правило, теряют. От оценок приведенной формы к оценкам структур- ной формы передается свойство состоятельности. Кроме того, использова- ние соотношений типа (8.36) для получения оценок коэффициентов струк- турной формы в общем случае вообще представляется неприемлемым. В самом деле, заметим, что система (8.36) содержит тх(п-\-1) уравнений (по числу элементов, содержащихся в матрице 0), а неизвестных коэффициен- тов в общем случае в ней w^+/w(n+l), в том числе т^коэффициентов со- держит матрица/i, а т(л+1) коэффициентов - матрица В. Вследствие этого система (8.36) в общем случае не имеет единственного решения. Вместе с тем часто в конкретных исследованиях (см. примеры раздела 8.2) на коэффициенты матрицы А и В накладывают дополнительные ап- риорные ограничения, вытекающие, например, из теоретических предпо- сылок, эмпирических результатов, интуитивных предположений. При достаточном количестве таких ограничений число неизвестных парамет- ров в матрицах А и В может быть снижено до уровня, обеспечивающего разрешимость системы (8.36). В общем случае ограничения на структурные параметры моделей сис- темы (8.36) подразделяются на исключающие и линейно однородные. 319
При исключающих ограничениях коэффициент при отсутствующей в уравнении переменной приравнивается к нулю. При линейно однородных ограничениях значения некоторых коэффициентов приравниваются к конкретному числу, вытекающему из условий соотношений, в которые входят соответствующие им переменные. Так, в примере 8.3 в первых трех строках в матрице В использованы только исключающие ограниче- ния. В четвертой строке матриц А и В использованы как исключающие, так и линейно однородные ограничения, соответствующие четвертому (балансовому) уравнению системы (8.34). Рассмотрим условия, определяющие возможности использования вы- ражения (8.36) для оценки коэффициентов структурной формы системы (8.11), более подробно для отдельного входящего в эту систему уравне- ния. Для этого представим вьфажение (8.36) с использованием матрицы D=[AB] в следующем виде: С ^ [АВ] ы+и = Z) G = 0, (8.37) D=[AB] - матрица размера wx(w+n+l), образованная присоединением столбцов матрицы В к матрице А; ( С ^ G- - матрица размера (m+n+l)x(n+l), образованная присоеди- \^п+\) пением строк квадратной единичной матрицы Еп^\ размера (/г+1) к мат- рице С; G = ы Г20 ГтО 1 Гп ■ Гц ■ 7ml ■ 1 • Гы ■■ Yin Утп 0 О 1 (8.38) D G = [AB] Легко видеть, что выражение (8.37) является другим вариантом записи уравнения (8.36): \ = А'С + В'Еп+1 =АС + В=0, в котором матрица D образована неизвестными коэффициентами струк- турной формы, а матрица G - известными коэффициентами приведенной формы и единичными элементами матрицы Е„+\, 320
Рассмотрим произведение первой строки матрицы D на матрицу G, ре- зультатом которого является система однородных линейных уравнений, определяющая значения коэффициентов первой модели системы (8.11). Это произведение может быть представлено в следующем виде: / 1 = ^1 0 = 0, (8.39) где d\ - вектор-строка, составленная из коэффициентов первого уравне- ния системы (8.11), и О в правой части означает нулевой вектор-строку соответствующего размера. В развернутом виде с учетом (8.9) и (8.14) систему (8.39) можно запи- сать следующим образом: f[U:£lLtfL2>L^-22j:i-iti^lm:£m2Jl^2^9l (8.40) где Uij - неизвестные оценки соответствующих коэффициентов матрицы А\ b\j- неизвестные оценки коэффициентов первого столбца матрицы В; Cij - известные оценки коэффициентов приведенной формы системы (эле- ментов матрицы С); /=l,2,...,m;7=l,2,...,n. Заметим, что система (8.40) выражает несколько другую запись урав- нения (8.39), которая в векторно-матричной форме записывается как f С ^ [d{=0\ Система (8.40) в общем случае включает в себя п+1 однородное урав- нение и содержит m+n+l неизвестное (оценки коэффициентов ац и Д^, /=1, 2,..., m ;j=0, 1,..., n). Вместе с тем для однозначного определения этих оценок необходимо, чтобы количество неизвестных среди них было рав- но рангу матрицы G за вычетом единицы. Если обозначить количество известных коэффициентов в строке d i как Wi, а неизвестных - как W2, Wi+W2=m+w+l, а ранг матрицы G - как p(G), то это условие может быть представлено в следующем виде: W2 =/w+n+l-wi=p(G)-l. (8.41) Выражение (8.41) известно как условие идентифицируемости системы (8.11) или ее некоторой модификации. Напомним, что при выполнении условия (8.41) значения неизвестных коэффициентов системы (8.39) ац и Ду, /=1, 2,..., т;7=0, 1,..., п; определя- 11 Эконометрика 321
ются с точностью до множителя. Конкретные их значения можно полу- чить, выбрав «подходящее» значение одного из коэффициентов заранее, а остальные в ходе решения системы (8.40) с использованием соответст- вующего метода (метода Гаусса, Крамера и т.п.). В нашем случае, как правило, единственное решение системы (8.39) можно получить, прирав- няв к единице коэффициент ац. Это естественное ограничение вытекает из формы записи первого уравнения системы (8.11) (см. примеры 8.1- 8.3). Для других уравнений необходимо приравнивать к единице коэффициенты схц, /=2,..., т. При этом следует иметь в виду, что это естественное ограничение ац=1 не должно учитываться в соотношении (8.41), т.е. не должно входить в число wi. При относительно небольшом числе неизвестных параметров в первой строке матрицы D (эта относительность определяется соотношением W2<p(G)-l), система (8.39) становится переидентифицированной (сверх- идентифируемой). Получение единственного решения в этом случае воз- можно, если, например, существуют ограничения на коэффициенты при- веденной формы системы эконометрических моделей, уменьшающие ранг матрицы G. С этой же целью можно попытаться использовать при- веденную форму с меньшим числом экзогенных переменных, если это не расходится с предпосылками, лежащими в основе системы моделей. При условии W2>p(G)-l система (8.39) является недоиндентифицируемой и без дополнительных ограничений на параметры структурной формы одно- значно оценить их значения с помощью приведенной формы невозможно. Заметим, что при решении системы (8.40) могут возникнуть опреде- ленные проблемы с учетом ограничений на параметры структурной фор- мы. В основном это относится к линейно однородным ограничениям. В самом деле, если речь идет только об исключающих ограничениях, то их легко учесть, приравнивая к нулю соответствующие коэффициенты Оцс и fiij. Для системы (8.40) это коэффициенты аии/3[], i=l, 2,..., /п; j= О, 1,..., п; являющиеся элементами первой строки матрицы D. Так, например, система (8.40) для первой модели из системы (8.30) с учетом исключающих ограничений на коэффициенты Ьп,.„, Ьщ приоб- ретает следующий вид: ац Cjo +^12 •С20 +^0 =0i «11 -^16 +«12 -^26 +*1б =0; (8.42) ^il'S^l.^]?LS3lJl^l «11-^ll+«12-^2,11 =0- 322
Однако если для этой модели имели бы место какие-либо линейно од- нородные ограничения на параметры структурной формы типа Д1=Д2+Дб» ^12+^1=0 и т.п., то для их учста при определении коэффици- ентов структурной формы требуется некоторая модификация систем (8.37), (8.39) и (8.42). Рассмотрим альтернативный путь решения задачи оценки коэф- фициентов структурной формы системы взаимозависимых эконо- метрических моделей с учетом различного типа ограничений на ее параметры с использованием приведенной формы сначала для при- мера системы (8.30). Этот путь основан на модификации матрицы G путем ее преобразования в матрицу G\ при сохранении для этой матрицы условия (8.37) (и соответственно (8.39)). Для этого заме- тим, что, например, исключающее ограничение на параметр J3n первого уравнения системы (8.30) может быть представлено в сле- дующем виде: ^0^ О о о о о|=о, о 1 о о (8.43) где 1 стоит на месте, обеспечивающем в результате умножения вектора di на вектор ограничений выполнение условия Ьп=0. Обозначим вектор-столбец в выражении (8.43) как g^\ Число его ком- понент равно числу элементов вектора rfi. Аналогичный вектор для пере- менной Дв обозначим как ^8'(он содержит единицу на месте, соответст- вующем элементу Д») для переменной Дд-^в'»— Расширим матрицу G модели (8.30) за счет присоединения к ней век- торов, отражающих исключающие ограничения, g^', g8^..., g\\. В резуль- тате получим матрицу G\ следующего вида: 323
Gi=[Gg'T...g'n] = ^10 ^20 1 0 0 0 •• ^\,n •• ^2,11 .. 0 0 .. 0 0 0 ... 1 0 0 ... 0^ ... 0 0 0 1 ... 0 ... (8.44) ^00 1 0 0 ly где единицы в присоединенной части стоят на местах, обеспечивающих в результате произведения вектора rfi на векторы g?'»-, gn выполнение ус- ловий Д7=0, Д8=0,..., А.11=0. В силу условия (8.43), выполняемого для исключающих ограничений на параметры Д?»—» А.п, для элементов матрищл Gi имеет место такое же соотношение, как (8.39) для матрищл G: rfrGi = 0. (8.45) Однако заметим, что при этом, во-первых, матрица G\ расширена по сравнению с матрицей G на 5 столбцов (по числу введенных ограниче- ний) и ее ранг соответственно увеличился и, во-вторых, вектор-строка d \ записывается без исключающих ограничений. Ее элементы представля- ются в общей, а не в количественной форме записи. Заметим, что на коэффициенты первой модели системы (8.30) могли быть наложены и ограничения других видов. Рассмотрим особенности их формализованного представления в матрице G\. Так, для линейного од- нородного ограничения Д1=Д2+Дб соответствующий ему вектор пред- ставляется в следующем виде: ' o^ о о о о о о 1 -1 -1 о о I 0J «^12 = 324
где значения +1 и -1 стоят на местах соответствующих коэффициентов. С участием вектора rfi это ограничение также записывается в виде произведения векторов dygn^O, Для его учета при оценке коэффициен- тов структурной формы необходимо расширить матрицу G также на век- тор g^'. Некоторые сложности вызывает векторное представление неоднород- ных ограничений, содержащих в правой части вместо нуля значимое чис- ло. Примером такого ограничения является ^i2+>fti=3. Однородный вари- ант записи этого ограничения предполагает использование коэффициента а\и который для получения решения затем нормализуется, т.е. выбирает- ся равным l(flrii=l). В этом случае отмеченное ограничение приобретает вид ai2+Ai-36irii=0, и в векторной форме записи оно представляется сле- дующим образом: 1 О 1Г1з=| 1 О I oj Заметим, что векторы-ограничения достаточно просто формируют- ся только для линейных ограничений на параметры. В случае нели- нейных ограничений задача их учета при получении оценок парамет- ров значительно осложняется. Для ее решения требуются специальные методы. Таким образом, в случае линейных ограничений на параметры струк- турной формы модели в результате присоединения выражающих их век- торов к матрице G формируется матрица G\ размера (w+n+l)x(n+l+r), где г - количество учитываемых ограничений. Тогда по аналогии с условием существования однозначного решения системы (8.39) для матрицы G (см. выражение (8.41)), условие существования единственного решения сис- темы (8.45) для матрицы G\ можно представить в следующем виде: p(Gi)=w+n, (8.46) т.е. ранг матрицы Gi должен быть на единицу меньше, чем число элемен- тов в строке du где, напомним, т+л+1 - общее количество параметров модели структурной формы (количество элементов в соответствующей строке матрицы Z)), в нашем случае, в первой. 325
Из условия (8.46) непосредственно вытекает, что, если в матрице G отсутствуют линейно зависимые столбцы, то количество столбцов- ограничений, присоединенных к матрице G при формировании матрицы Gi в случае единственного решения системы (8.45), должно удовлетво- рять равенству г=т-1. Иными словами, количество априорных ограниче- ний должно быть равно числу взаимозависимых переменных в системе, уменьшенному на единицу. При наличии в матрице Gi линейно зависимых столбцов в случае сверхидентифицируемости системы моделей количество вводимых огра- ничений должно превышать число w-1, r>m-l. Объединяя эти два ре- зультата в один, получим, что ненулевое решение системы (8.45) сущест- вует при выполнении условия r>m-l, (8.47) которое означает, что число априорных ограничений должно быть не меньше количества эндогенных переменных в системе взаимозависимых эконометрических моделей за вычетом единицы. Рассмотрим вопросы идентифицируемости систем моделей на при- мерах 8.1-8.3. В примере 8.1 первое структурное уравнение системы (8.30) содержит в общем случае 9 неизвестных параметров (два при эндогенных переменных, включая у\, шесть при эндогенных и один свободный коэффициент). Всего система содержит одиннадцать экзо- генных переменных (двенадцать параметров приведенной формы). Та- ким образом, матрица G, сформированная для этой системы имеет размерность 14x12 и ее ранг равен 12 (см. выражение (8.38)). Матрица G\ может быть образована присоединением к матрице G пяти исклю- чающих ограничений на параметры /?i7v, Дль ^^ размерность будет равна 14x17. Имея девять неизвестных параметров, системы уравнений (8.39) и (8.45), которые могут быть использованы для оценки коэффициентов структурной формы первого уравнения модели (8.30), являются сверхоп- ределенными. Они содержат по четыре «лишних» уравнения, поскольку условие единственности решения системы (8.39) выполняется, если ранг матрицы G равен 8, а число присоединенных ограничений в матрице G\ равно 1. В данном случае единственное решение этих систем может быть по- лучено в результате наложения дополнительных ограничений на пара- метры приведенной формы модели (8.30). В частности, из пяти последних соотношений системы (8.42) вытекает, что такими ограничениями явля- ются следующие равенства: 326
Уп _ 72% Г\1 Уп Угм Ут Ую У20 1 0 0 0 Уи У21 0 1 0 0 Уп У22 0 0 1 0 Пз У23 0 0 0 1 являющиеся следствием очевидного условия Гп Гц '" Гш ' Для примера 8.2 матрица G приведенной формы модели имеет сле- дующий вид: G = Ее размерность равна 6x4, ранг матрищ>1 равен 4. Количество неизвестных параметров в первом уравнении структурной формы системы (8.32) равно 5. Имеется ограничение на коэффшщент Дз» Дз=0. Таюш образом, для первого уравнения системы (8.32) выполняются условия идентифшщруемости, поскольку ранг матрищл G-/XG) равен 4. Аналогичный вывод следует из того, что число ограничений на его парамет- ры равно количеству эндогенных переменных за вычетом единищ»!, 2-1=1. Значения параметров До» (^п, Д ь Дг однозначно определяются из системы dvG=0. при условии fli 1=1. Вместе с тем второе уравнение системы (8.32) является сверхидентифи- Щ1руемым. При определении значений его параметров следует учитывать ограничения на коэффищ1енты fin и fiz2 (fii\=fi22=0). В этом случае на осно- вании матрищл G можно сформировать матрицу Ga (индекс 2 в данном случае обозначает номер модели-строки, для которой формируется соот- ветствующая матрица ограничений). Матрица G2 имеет следующий вид: Go = Ую У20 1 0 0 0 Уп У21 0 1 0 0 Уп У22 0 0 1 0 Уп У23 0 0 0 1 0 0 0 1 0 0 0^ 0 0 0 1 0; 327
Число учитываемых ограничений (дополнительных столбцов в матри- це Сг) превышает число эндогенных переменных на единицу. Следова- тельно, для идентифицируемости второго уравнения системы (8.32) необ- ходимо вводить дополнительное ограничение на параметры структурной формы модели. Вид этих ограничений может быть получен исходя из анализа результатов произведения вектора d 2=(^2ь ^22> До» О, О, Дз) на матрицу С. Несложно заметить, что это произведение представляется в следующем виде: «^1^0+ ^22210 +До = 0; О?21И2+^22?^2 = 0; ^21713 +^222^3+ Дз = 0; Из полученной системы непосредственно следует, что ограничения на параметры приведенной формы имеют вид, аналогичный (8.48) Y\\ Гп ' Заметим также, что при решении системы drG =0 единственное реше- ние при условии вьшолнимости указанных ограничений на параметры приведенной формы следует получать с учетом нормировки на коэффи- циент а22у приравнивая его к единице, т.е. 022 =1. Для примера 8.3 матрица G приведенной формы модели имеет сле- дующий вид: >10 Гп Гп У\ъ Гы Г\5^ G = Г40 Г41 П2 ПЪ Г44 Us 1 0 0 0 0 0 0 1 0 0 0 0 0 0 1 0 0 0 0 0 0 1 0 0 0 0 0 0 1 0 0 0 0 0 0 1 Ее размерность составляет 10x6, ранг равен 6. Количество неизвестных параметров в первой модели структурной формы системы (8.34) равно 4. Следовательно, эта модель является сверхидентифицируемой. Аналогично можно показать, что сверхиденти- фируемыми являются и другие две модели системы. 328
Четвертое уравнение системы (8.34) по своему содержанию является ограничением. Его необходимо учитывать при формировании матриц Gi, G2 и G3 в случае ее использования при идентификации первых трех моде- лей. Данное ограничение записывается вектором-столбцом следующего вида: -1 1 1 О О О О -1 -К Таким образом, например, для первого уравнения системы (8.34) мат- рица Gi примет следующий вид: g = G, =G ^0 1 0 .0 0 0 1 0 0 0 ... 0 1 0 0 0 ... ... 0 1 0 0 0 ... ... 0 1 0 0 -г ... -1 1 ... 1 ... 0 ... 0 ... 0 ... 0 ... -1 ... -1, где первый присоединенный столбец определяет ограничение а\2=0, вто- рой - С1Г1з=0, третий Дг =0,..., предпоследний - Дз =0 и последний - огра- ничение, выражаемое четвертым уравнением системы (8.34). Рассмотренный в данном разделе материал свидетельствует, что оценки параметров структурной формы системы взаимозависимых эко- нометрических моделей с использованием приведенной формы этой сис- темы могут быть однозначно определены только в случае идентифици- руемости калсдого из ее уравнений. При этом, поскольку оценки пара- 329
метров приведенной формы являются несмещенными, моогно оэюидать, что и оценки параметров структурной формы будут обладать этим свойством. На практике оценкам структурной формы передается свой- ство состоятельности. Вместе с тем условие идентифицируемости каэюдой из моделей, входящих в систему, выполняется при наличии впол- не определенного количества ограничений, накладываемых на ее пара- метры. Это следует из того факта, что в общем случае число уравне- ний, на основе которых определяются значения этих параметров, мень- ше их количества. При этом заметим, что для идентифицируемости всей системы моделей необходимо, чтобы число ограничений в каэюдой из та было одно и то же. Естественно, что столь эюесткие требования на количество ограничений на практике удовлетворяются далеко не часто. Вследствие этого рассмотренный косвенный метод при оценке параметров структурной формы системы взаимозависимых экономет- рических моделей нельзя считать универсальным, В следующем разделе будут рассмотрены более общие подходы к ре- шению проблемы получения таких оценок, которые не имеют столь же- стких ограничений по своему применению. 8.4. ОЦЕНИВАНИЕ ПАРАМЕТРОВ СТРУКТУРНОЙ ФОРМЫ НА ОСНОВЕ ДВУХШАГОВОГО МНК С ИСПОЛЬЗОВАНИЕМ ИНСТРУМЕНТАЛЬНЫХ ПЕРЕМЕННЫХ Двухшаговый МНК является одним из наиболее «популярных» мето- дов оценки параметров моделей структурной формы. Причем обычно он используется в случае изолированного рассмотрения каждой из моделей системы. Рассмотрим особенности применения этого метода на примере первого уравнения структурной формы (8.9), которое представим в целях сокращения обозначений в следующем виде: y\t=0^2f^'. .+^Wmr+>ft+A^l/+.. .+>6Un/+flr. (8.49) В матричной форме записи модель (8.49) для /=1,2,...,Г может быть за- писана следующим образом: yi=Yvai-^XvJ3i+€u (8.50) где j^i - вектор значений зависимой в модели (8.49) переменной уи, Г=1,2,...,Г; Fi - матрица значений эндогенных переменных системы моделей, входящих в модель (8.49) в качестве независимых перемен- ных, 330
У1 = Ун У22 .Утг Ут\ Ут1 \ УтГ) Х\ - матрица значений экзогенных факторов первого уравнения системы, являющихся чисто независимыми переменными. Она формируется с уче- том параметра убЬ традиционным способом на основе значений экзоген- ных факторов, входящих в первое уравнение; ax^^a-i,..., о^) - вектор- столбец коэффициентов при эндогенных переменных у[ , /=2,..., т\ ySi=(>6()\—,A/) - вектор-столбец коэффициентов при экзогенных пере- менных Ху, 7=0,..., /21. Как и ранее, предполагается, что эндогенные переменные у[ взаимо- связаны с ошибкой 6/, а переменные jc, - нет. Вследствие наличия взаимо- связи независимых переменных и ошибки применение обычного МНК для определения параметров модели (8.50) дает смещенные оценки. Основная идея использования двухшагового МНК для оценки ко- эффициентов модели (8.50) состоит в следующем. 1. На первом шаге конструируются новые значения зависимых А Л переменных у,^ таким образом, чтобы ряды у^ и у.^ были в некото- л ром смысле близки друг другу, но ряды у.^ и ошибку Ei можно было бы считать независимыми, i=2,..., т. л 2. На втором шаге значения у.^ используются вместо значений уи при оценке коэффициентов модели (8.50) также с помощью обычного МНК. Иными словами, в этом случае матрицу Fi при оценке коэффици- л ентов предлагается заменить на матрицу Fj , которая имеет следующий вид: Ух- Угх л Угг Л \Утт Ут\ л Утг Л УтТ При этом в литературных источниках при определении значений у,,, '=2,..., т, обычно рекомендуется использовать соответствующие уравне- 331
ния приведенной формы системы. В соответствии с этим данные значе- ния определяются как расчетные значения зависимых переменных «клас- сических» эконометрических моделей для моментов времени ^=1,2,...,Г y/F;fo+?fr^ir+.. '-^rtk-xia-^^it (8.51) при M^sO (в соответствии с традиционным свойством ошибки М[щ]=0), так что л У it = ^Ю + с/1 • ^1/ +...+с if, • Xfa, (8.52) где, в свою очередь, оценки Cij коэффициентов ^ находятся опять же с помощью обычного МНК на основании известного вьфажения с,=(Г-^"^-ГТь (8.53) где Ci=(Cio ,..., сцс)\ У|=СУ|Ь..., У(т)\ X - матрица значений независимых пе- ременных, входящих в приведенную форму системы эконометрических уравнений. Ее размер равен Тх(к+1Х где к - общее число независимых переменных системы. В то же время в каждом из этой системы структур- ных уравнений количество переменных, рассматриваемых как независи- мые, может быть меньше, чем к. Таким образом, п< к. Заметим, что в ка- честве независимых переменных могут рассматриваться как чисто экзо- генные факторы, так и эндогенные запаздывающие переменные, чьи зна- чения У1ФГ не могут быть связаны с ошибкой Ец (из-за разницы во време- ни), где г- величина запаздывания (см. пример 8.3). л Несложно заметить, что переменные у,-^ являются некоторым вариан- том инструментальных переменных, рассмотренных в разделе 3.3. Вслед- ствие этого многие проблемы оценивания параметров эконометрических моделей с использованием инструментальных переменных практически «автоматически» переносятся и на оценки коэффициентов структурной формы систем таких моделей. В частности, теория свидетельствует, что при выполнении обычных предположений относительно независимости факторов и ошибки, гетероскедастичности и некоррелированности ошиб- ки в пределе при Г-^«>, и ряда других (см. главу 3), найденные с помо- щью подобной процедуры оценки коэффициентов, входящих в систему структурных уравнений (эконометрических моделей), являются состоя- тельными. Свойство состоятельности с точки зрения практики можно толковать как уменьшение смещения оценок с ростом числа наблюдений (длины рядов исходных данных). Более того, в этих условиях оценки имеют асимптотически нормальное распределение, что позволяет исполь- 332
зовать при анализе качества построенных моделей параметрические кри- терии Стьюдента и Фишера. Вместе с тем, в реальных эконометрических исследованиях, как прави- ло, длина ряда исходных данных ограничена (т.е. зафиксирована конкрет- ным значением Т). В такой ситуации уместен вопрос, начиная с какого ко- личества наблюдений можно считать, что смещения оценок стали незначи- тельными и их можно не принимать во внимание в дальнейшем анализе. Ответа на этот вопрос теория не дает. Более того, результаты практи- ческих исследований часто свидетельствуют, что при относительно ко- ротких временных рядах исходных данных смещенность оценок, полу- ченных с помощью двухшагового МНК, может быть достаточно сущест- венной, по крайней мере, сопоставимой со смещенностью оценок, полу- ченных на основе обычного МНК. Вместе с тем свойство состоятельности оценок двухшагового МНК многими специалистами рассматривается как очевидное преимущество этого метода по сравнению с одношаговым МНК, и поэтому именно про- цедуры двухшагового МНК обычно рекомендуются для построения структурных форм систем взаимозависимых эконометрических моделей в исследованиях реальных процессов. Рассмотрим проблемы получения оценок коэффициентов уравнений структурной формы системы эконометрических моделей более подробно на примере модели (8.49). Первый шаг. На основании выражения Y^^XiX'-XT^-X^Yu (8.54) определяется матрица расчетных значений эндогенных переменных л л Ун Ут^ Выражение (8.54) учитывает, что уравнение (8.52), на основании кото- л рого рассчитываются значение переменной уц , в векторно-матричной форме принимает следующий вид: Л Л Л л где У1 =(у,1,...,у/г)' - вектор-столбец матрицы Fj , Ci^{CiQ, qi,..., Ctkf - вектор-столбец коэффициентов уравнения (8.52). В результате для /=2,..., л л т на основе значений у^^ формируется матрица Fj . 333
Второй шаг. Заметим, что матрица значений независимых переменных структурной формы модели (8.49) может быть представлена в виде объединения мат- риц Fi и Хи т.е. [Yi Х\]у а вектор коэффициентов - в виде объединения векторов Oi и Д, т.е. На втором шаге матрица Fi заменяется на матрицу У^ . Таким обра- зом, оценки коэффициентов модели (8.49) согласно МНК определяются на основании следующего выражения: «1 'ij = {[¥^Х^У[¥^Х^]Г'[¥^Х^У'У^, (8.55) где 3^1 - вектор-столбец наблюдаемых значений переменной j^i, состоящей л из Г компонент; [Yi Xi]- матрица значений «независимых» переменных модели (8.49) размера Тх(т-^п), Матрица [У] Х^У равна матрице Г ^Л .^0 с учетом правил умножения матриц блочного типа окончательный вид выражения (8.55) может быть записан следующим образом: «1 м; Y{Y, Y,X, X{Xij (^ л УуУх ^\'У\) (8.56) Каждое расчетное значение эндогенной переменной на основании вы- ражений (8.51) ' и (8.52) можно представить в следующем виде л У и - у it ~^it' г^де Uit - значение ошибки f-ro уравнения приведенной фор- мы в момент г, /=2,..., т. С использованием значений иц сформируем мат- рицу IJ\ размера 7><(/w-l). Поскольку ошибки и^ по предположению по своим свойствам близки к процессу «белого шума» (обычное предполо- л жение МНК), то можно ожидать, что временные ряды yi^ и м/„ как и ря- ды Xjt и Uit, будут статистически независимыми. С учетом этого матрица U\ удовлетворяет следующему равенству: 334
Y{-Ui=0=Xi'Ui. (8.57) Л Используя очевидные равенства Fj =Yi-Ui и X/-Ui=^Ui'-X\ и пред- л ставление матрицы У^ в форме (8.54), выражение (8.56) можно перепи- сать в следующем виде: Г^\ ( кЬи Y{X'(X''X)-''X% Y,X, ^¥,Х-(Х''Х)-'-Х''у,^ (8.58) XX х;х, в выражении (8.58) учтено, что в соответствии с (8.57) y/Fi =(yi-f/i)Fi =^YaiX^X)-'-XYu а y/Xi=(y/-J7/)Xi=r/X,. С учетом матрицы Ui выражение (8.50) можно записать в следующем виде: yi=Y^ .ai + Xyfi,H€i-^Uyb,X (8.59) В целях упрощения записи обозначим матрицу [ Fi Xi] через Z\, вектор (ль biY - через rfi. С учетом новых обозначений выражение (8.56) можно представить в традиционном виде: Ji=(Z/.Zi)-^.Z/.3^i и ошибку этого вектора согласно выражениям (2.9), (8.50) и (8.59) как Mi=(Z/.Zi)-^.Z/.(£i+(/i.fei). (8.60) Из условия (8.57) следует, что Zi-Ui =0. В силу этого выражение (8.60) приводится к следующему виду: Arfi = (Zi'.Zi)-^.Z/.fi. Таким образом, из вьфажения (8.60) следует, что вопросы определе- ния факта смещения и его величины у оценок коэффициентов структур- ной формы каждого уравнения системы взаимозависимых эконометриче- ских моделей сводятся к исследованию свойств произведения Z{.fi = Yye, Х[еу (8.61) В случае независимости (или отсутствия корреляции в пределе) у эк- зогенных переменных jc,7, 7=0,..., jfc; и ошибки ей можно ожидать, что Af[Arfi]=0 и оценки вектора rfi, полученные из выражения (8.56), окажутся несмещенными (состоятельными). В самом деле, независимость л:у„7=0,..., 335
п\ п <К входящих в структурную форму, и ошибки £\t непосредственно влечет за собой равенство М[Х\е\}=0, В случае состоятельности в качестве исходной предпосылки рассмат- ривается равенство lim ^^r^i = 0. Далее, поскольку матрица расчетных значений эндогенных переменных л Fj выражается через полную матрицу значений всех экзогенных перемен- ных X и матрицу оценок коэффициентов приведенной формы с,у, /=2,..., т\ у=0,..., к, которую обозначим через С, согласно следующему выражению: Yx^XC, (8.62) л то произведение Y^ -е\ можно представить в следующем виде: yj -ex = С Х- ех. (8.63) Заметим при этом, что из независимости переменных x„+i,..., Xk и ошиб- ки Ех также должно следовать, что Af[CA'£i]=CM[A'£i]=0. Однако этот теоретический вывод опровергается результатами практических исследо- ваний, которые свидетельствуют, что переход от фактических значений уц л К ИХ расчетным значениям - инструментальным переменным yi^ путем определения их значений с помощью вьфажения (8.52), не устраняет сме- щения в условиях малых выборок (при небольшом количестве измерений). Вместе с тем свойство состоятельности оценок коэффициентов структур- ной формы системы взаимозависимых эконометрических моделей при со- стоятельности оценок коэффициентов ее приведенной формы сохраняется. На основании выражения (8.61) может быть получена оценка ковариа- ционной матрицы параметров соответствующего уравнения структурной формы системы эконометрических моделей. Напомним, что в соответст- вии с выражением (2.14) для первого уравнения эта матрица при отсутст- вии в ряду £i автокорреляционных связей и наличии свойства гомоскеда- стичности имеет следующий вид: Cov(rf)=M[(Z/.Zi)-^.Zi'.fi -ex'-Zv (Zi'.Zi)-^]=ct/. (Z/-Zi)-^ = / л л л А -<у1 Y{-Y, Y{X, л X{Yx X{-Xi) (8.64) 336
л Выражая значения элементов матрицы Y^ через значения экзогенных и эндогенных переменных структурной формы системы (см. выражение (8.58)), Co\(d) можно также представить в следующем виде: Cov(rf) = a^ (8.65) Дисперсия ошибки (Те оценивается согласно выражению (2.19) сле- дующим образом: <7e^=(yi-Yrai-Xrbiy'(yi-Yrai-Xi'bi)/(T-m-n), (8.66) Матрица Co\(d), определенная на основании выражений (8.64) и (8.65) является состоятельной оценкой ковариационной матрицы параметров структурной формы системы взаимозависимых эконометрических моде- лей, в том смысле, что при достаточно большом количестве измерений Т вероятность значительного отклонения ее элементов от истинных значе- ний стремится к нулю. В заключении данного раздела приведем варианты уравнений отдель- ных моделей системы взаимозависимых моделей (8.34) (пример 8.3), по- лученные с использованием обычного и двухшагового МНК. Уравнения получены для ФРГ с использованием исходных данных за период 1960-1977 гг. Уравнение 1. (1 МНК) >;i,= 23,10 + 0,31 :И4г + 0,51;;!,. 1 + fir; (2 MHK);;i,= 22,81 + 0,30 >;4r + 0,53 >^i,,. i + Su- Уравнение 2. (1 MHK);;2r = 10,72 + 0,0004 >;4r + 0,79 X2j. i + £2м (2 МНК) >^2/= -16,84 - 0,1392 >;4r + 1,43 X2j. i + Sit- Уравнение 3. (1 МНК)>;зг= - 29,72 + 0,17>;4r + 0,63 >;з,/-1 + ^зг; (2 МНК) >;зг= - 22,27 + 0,13 >^4/+ 0,7173.M + ^зг. Представленные варианты уравнений свидетельствуют о различии (порой значительном, как в случае второй модели, описывающей дина- мику инвестиций) между значениями коэффициентов отдельных моделей системы (8.34), полученных на основе обычного и двухшагового МНК. При этом, вообще говоря, при использованном для построения этих мо- делей количестве измерений (Г=18) нельзя сказать, что результаты, полу- ченные на основе двухшагового МНК лучше, чем аналогичные результа- ты, основанные на обычном МНК. 337
Первые и третьи пары уравнений свидетельствует о наличии различий в оценках их коэффициентов. Если ориентироваться на «теорию», двух- шагового МНК, то данные результаты можно интерпретировать как эа4- пирическое доказательство того, что этот метод действительно «коррек- тирует» соответствующие оценки, полученные на основе обычного МНК. Однако остается вопрос: в какой степени смещение оценок устранено? Достаточно ли для этого всего 18 измерений, когда теория утверждает, что его «полное» устранение имеет место при Г—><»? Вторая пара уравнений вообще свидетельствует о принципиальных различиях результатов, полученных с использованием обычного и двух- шагового МНК. На это указывают изменения знаков коэффициентов при однотипных переменных. В частности, двухшаговый МНК дает основа- ние считать, что с увеличением национального дохода происходит более значительное изменение структуры инвестиций в сторону увеличения до- ли частного капитала по сравнению с результатами обычного МНК. Уве- личение национального дохода ведет даже к снижению капитальных вложений в экономику. Иными словами, результаты, полученные на ос- нове двухшагового МНК, заставляют переосмыслить экономические предпосылки модели (8.34). Укаэюем еще на один вычислительный аспект, который моэюет вос- препятствовать получению «хороших» оценок коэффициентов струк- турной формы системы эконометрических моделей с использованием двухшагового МНК и инструментальных переменных, значения которых определяются на основе приведенной формы. Обратим внимание на то, что согласно выражениям (8.52) и (8.54) значения инструментальных л л переменных yi^, образующие соответствующие столбцы матрицы Fj , определяются как линейные комбинации одного и того эюе множ:ества переменных Хц, j=l,2,..., к, значения которых являются элементами мат- рицы Х2. В такой ситуации, во-первых, при совпадении тенденций хотя бы у двух эндогенных переменных yit и угь значения которых образуют соот- ветствующие столбцы матрицы Yj, возникает угроза линейной зависи- л мости аналогичных столбцов матрицы Y^ . Такая угроза особенно реаль- на, если число независимых переменных Xj невелико. Во-вторых, если ко- личество экзогенных переменных в каком-либо уравнении системы при- блиэ/сается к общему числу таких переменных во всей системе и, таким образом, матрицы Х\ и Xi совпадают почти или полностью, то можно л ожидать, что зависимыми окажутся столбцы матриц У^ иХ\. 338
Вследствие этого матрица f А Л I ^X{Yi X{Xi) из выражения (8.56) окажется плохо обратимой, что повлечет за собой снижение точности оценок коэффициентов структурной формы рассмат- риваемого уравнения системы эконометрических моделей. На наш взгляд, избеэ/сать подобных трудностей моэ/сно путем фор- л мирования значений инструментальных переменных yif не на основе приведенной формы системы эконометрических моделей, а другими аль- тернативными путями, способами. В самом деле, нашей целью является л формирование ряда у if (в случае первого уравнения системы i=2,,.., т), тенденции которого совпадают с тенденциями соответствующей экзо- генной переменной уц, но при этом случайные флюктуации ряда у и, взаи- мосвязанные с ошибкой Sit, не долэюны учитываться. Этого следует добиваться без использования уравнений приведенной л формы. Например, инструментальные переменные у^^ можно сформиро- вать как линейные комбинации каких-либо факторов, не включенных в систему взаимозависимых эконометрических моделей, в частности, как функции времени. Иными словами, в этом случае для получения их зна- чений следовало бы вместо уравнений (8.52) использовать зависимости типа: л Уи = /ю +fn^t +-+firWrt; (8-67) у it =8io+8nf+8nt^+-+8irt'- (8-68) Заслуживает внимания предложение использовать для этой же цели зависимости авторегрессионного типа Уи=ПУи-1^-,Уц-г)> (8.69) построить которые можно, предварительно приведя исходный ряд уц к стационарному и после построения подходящей модели авторегрессии для стационарного процесса выполнив обратное преобразование (см. гла- ву VI). При таких способах построения инструментальных переменных будут обеспечены все условия реализации двухшагового МНК: ошибка ви не 339
будет связана с эндогенными переменными yi^ и столбцы матрицы Fj окажутся менее зависимыми между собой и со столбцами матрицы Xi. Существуют и другие подходы к формированию инструментальных переменных, реализация которых позволяет получить невырожденную матрицу значений факторов структурной формы уравнений, входящих в систему эконометрических моделей. Например, инструментальные пере- менные предлагается формировать на основе метода главных компонент, которые, в свою очередь, определяются на основании переменных, обра- зующих матрицу ЛГг. Хотя и в этом случае угроза необратимости матрицы остается. Следует иметь в виду, что разговор о преимуществах и недостатках одного метода оценивания коэффициентов структурной формы эконо- метрических моделей по сравнению с другим можно вести, лишь опира- ясь на статистику результатов использования этих методов при вполне определенных свойствах исследуемых процессов. На практике трудно подобрать достаточное количество реальных процессов, обладающих схожими свойствами, с тем, чтобы по результатам построенных для них моделей получить обоснованные выводы об эффективности каждого из методов. Вследствие этого для обоснования их эффективности часто ис- пользуются результаты статистических экспериментов на основе метода Монте-Карло. Этот метод позволяет сформировать множество реализа- ций процесса, удовлетворяющего тем или иным статистическим свойст- вам (в нашем случае к ним относятся закон распределения ошибки, ее корреляция с переменными из правой части уравнений системы, корреля- ция ошибок различных уравнений и т.п.). Затем для таких реализаций с использованием того или иного метода строятся соответствующие моде- ли, свойства оценок которых затем сопоставляются и между собой, и с предположениями, положенными в основу метода Монте-Карло. Подобные эксперименты, проведенные в достаточном количестве, да- ют информацию об эффективности каждого из методов на основе сопос- тавления частот «положительных» и «отрицательных» результатов их ис- пользования при построении моделей. Конечно, такая информация не га- рантирует эффективность использования метода в решении конкретной практической задачи. Но вместе с тем общие выводы по результатам та- ких экспериментов представляются достаточно аргументироваными. Результаты таких экспериментов свидетельствуют, что обычный МНК в случае конечных выборок дает большую величину смещения в оценках коэффициентов структурной формы отдельной эконометрической модели по сравнению с другими методами (двухшаговым МНК, ММП и некото- 340
рыми другими). При этом с ростом объема выборки величина смещения и у обычного МНК также уменьшается. Отметим также, что в условиях мультиколлинеарности переменных правой части модели смещения оце- нок, полученных с помощью обычного МНК и других методов, являются сопоставимыми по величине. В целом же у всех методов наблюдается от- рицательная реакция смещения на эффект мультиколлинеарности дан- ных, в том смысле, что с ростом степени мультиколлинеарности смеще- ние оценок увеличивается. Однако у обычного МНК это увеличение про- исходит намного медленнее, чем у других методов. Вместе с тем результаты некоторых экспериментов также свидетель- ствуют, что обычный МНК по сравнению с альтернативными методами дает оценки, характеризующиеся меньшей дисперсией. Возможно, что этот эффект объясняется в ряде случаев коррелированностью ошибок различных моделей системы, которая при использовании двухшагового МНК и алгебраического метода, основанного на построении приведенной формы системы, ведет к увеличению дисперсии оценок коэффициентов структурной формы моделей. В таких случаях, когда имеет место (предполагается) корреляция меж- ду ошибками различных моделей, входящих в систему, предполагается, рекомендуется использовать трехшаговый МНК. 8.5. ОЦЕНКИ ПАРАМЕТРОВ СИСТЕМЫ ВЗАИМОЗАВИСИМЫХ ЭКОНОМЕТРИЧЕСКИХ МОДЕЛЕЙ С ИСПОЛЬЗОВАНИЕМ ТРЕХШАГОВОГО МНК Как было отмечено в предыдущем разделе, наличие корреляционных связей меэк:ду ошибками различных эконометрических моделей, входящг4Х во взаимозависимую систему, ведет к потере свойства эффективности оценок их коэффициентов, В такой ситуации теория рекомендует для получения этих оценок вместо двухшагового использовать трехшаговый МНК, который включает в себя дополнительный этап, связанный с при- менением обобщенного МНК при известной ковариационной матрице ошибок различных моделей, В результате трехшаговый МНК применя- ется как метод оценивания коэффициентов структурной формы всей системы моделей, а не отдельных ее уравнений. Дадим достаточно схематичное изложение трехшагового МНК в об- щем виде. Представим /-е структурное уравнение системы в виде, аналогичном (8.50), /=1,2,..., т: 341
yi=Yrac¥Xrpi^eF-ZrSi+ei, (8.70) где, как и в разделе 8.4, 2/=[УД'/] - матрица, сформированная на основе исходных значений эндогенных и экзогенных переменных /-й модели; 5F{(XiPi\' - вектор параметров /-й модели; d - вектор ошибки /-й модели. Умножим левую и правую части выражения (8.70) слева на транспо- нированную матрицу значений всех экзогенных переменных Х\ В ре- зультате получим модель следующего вида: r-yi^r-ZcSc^X-ei, (8.71) В выражении (8.71) вектор Х'-^/рассматривается как вектор значений новой зависимой переменной, матрица X'Zi - как матрица значений но- вых независимых факторов, а вектор X'-Ci - как вектор значений новой ошибки. При этом ковариационная матрица этой ошибки определяется согласно следующему выражению: Cov($)= М5 ,51=M^'-f rf r^=oi7' Х'Х, {"ini) где (Гц - постоянная дисперсия ошибки /-го уравнения системы. Поскольку а^'-Х'-ХФОи-Е, т.е. ковариационная матрица ошибки имеет вид, отличный от единичной матрицы, умноженной на постоянную дис- персию, то для получения эффективных оценок коэффициентов модели (8.71) необходимо использовать обобщенный МНК. Оценка rf/ вектора ко- эффициентов Si в этом случае определяется согласно следующему выра- жению: di =[ZrXi rXTj-^r-ZiT^' Zf'Xir-Xy^r-yi. (8.73) С учетом представления матрицы Z/ в виде [У/ XJ и выражения (8.54) формула (8.73) тождественна выражению (8.58). Применим преобразование (8.71) ко всей системе взаимозависимых уравнений, представленной в форме записи, аналогичной выражению (8.25). В результате получим следующую систему: Х';У2 X' Z, о л:' Zi ^^^,^ <Т2 О X' Z mj \<^mj Х'-е^ (8.74) Ковариационная матрица вектора ошибки системы (8.74) будет иметь следующий вид: Го-11 .У'А'- ахг-Х'Х ...а^^-Х'-Х\ Cov(^)= о-ггЛ-'-Л- а-п-Х'-Х ...о^щ-'Х.'-хУ (8.75) (^т\'Х'-Х (^т2'Х''Х ••■<^тт'Х''Х. 342
где символом Ojy обозначена ковариация ошибок /-го и j-ro уравнений системы. Иными словами, С7у =Cov(#,,^P = M[^;-^^] = ll4-^;, • (8-76) ' t Если из значений (^у сформировать матрицу X размера /nxm, то выра- жение (8.75) можно представить как кронеккерово произведение матриц ZuX'X. Cov(5 )= I® Х'Х = Д (8.77) где 0 - символ кронеккерова произведения. Согласно свойству кронеккерова произведения, Д"'=2^'®(ГЛ0"'. (8.78) С учетом (8.78) оценку вектора коэффициентов всей системы взаимо- зависимых эконометрических моделей получим с использованием обоб- щенного МНК в следующем виде: fdA fZ'rX о ^ d = \^mj О fx:z, о VYz.'-A- КО"' о X' Z^ о z'„-x о ^ Z' X (Х'- (8.79) а- У1 .^'■yJ Таким образом, рассмотренная процедура оценки коэффициентов структурной формы всей системы взаимозависимых эконометрических моделей состоит из трех последовательных этапов, определяющих со- держание трехшагового МНК. Этап1. На этом этапе с использованием обычного МНК на основании приве- л денной формы определяются расчетные значения переменных yj^ , рас- сматриваемых в качестве независимых эндогенных переменных в каждом из уравнений системы,7=1,2,..., т\)Фи где / - индекс уравнения системы. Этап 2. Как и в двухшаговом МНК, на этом этапе с использованием значений л yji определяются оценки коэффициентов структурной формы каждого из уравнений системы. Для этой цели используется выражение (8.73). 343
Кроме того, на этом шаге определяются векторы ошибок каждого из уравнений системы wp(w/i,..., Щт)\ с использованием которых рассчиты- ваются на основании формулы (8.76) оценки дисперсии каждого из урав- нений Gii' И ИХ взаимные ковариации q, и в соответствии с выражением (8.75) формируется ковариационная матрица /2 Этап 3. С помощью обобщенного МНК (выражение (8.79)) определяются «окончательные» оценки коэффициентов структурной формы всей систе- мы взаимозависимых эконометрических моделей, которые теоретически при наличии корреляции между ошибками различных уравнений являют- ся «более эффективными» по сравнению с аналогичными оценками двухшагового МНК. Если ошибки уравнений системы не коррелируют между собой, т.е. о;у=0, 1Ф], то трехшаговый МНК не имеет преимуществ перед двухшаго- вым. При применении трехшагового МНК необходимо соблюдать неко- торые дополнительные правила, что делает его процедуру менее универ- сальной по сравнению с двухшаговой. Они состоят в следующем: 1. Процедура выполняется только для идентифицируемых и сверх- идентифицируемых уравнений системы. Тождества и неидентифицируе- мые уравнения в ней не участвуют. 2. Процедуру желательно выполнять для групп идентифицируемых и неидентифицируемых уравнений раздельно. При этом, если в соответст- вующую группу входит только одно сверхидентифицируемое уравнение, то трехшаговая процедура для него превращается в двухшаговую. Наряду с рассмотренными в данном разделе методами существуют и некоторые другие, позволяющие получить «приемлемые по качеству» оценки коэффициентов структурной формы системы взаимозависимых эконометрических моделей. Так, эти оценки для отдельных моделей можно найти с помощью метода наименьшего дисперсионного отношения, в свою очередь базирующегося на методе максимального правдоподобия с огра- ниченной информацией, использующего, кроме обычных предположений о нормальности распределения и независимости ошибок структурного урав- нения, также дополнительное предположение о ранге матрицы значений независимых переменных приведенной формы. Оценить коэффициенты структурной формы всей системы эконометрических моделей можно и на основе метода максимального правдоподобия с полной информацией. Однако перечисленные методы гораздо более трудоемки по сравне- нию с двухшаговым и трехшаговым МНК , и, что самое главное, они не дают никаких преимуществ перед последними с точки зрения качества 344
полученных оценок. Вследствие этого в большинстве эконометрических исследований, проводимых на основе систем взаимозависимых уравне- ний, для оценки их коэффициентов рекомендуется использовать именно двухшаговый и трехшаговый МНК. ВОПРОСЫ к ГЛАВЕ VIII 1. Перечислите основные предпосылки систем взаимозависимых пе- ременных. 2. Чем обусловлена смещенность оценок коэффициентов уравнений, полученных с использованием МНК? 3. Что представляют собой структурная и приведенная формы модели? 4. Как проводится оценивание коэффициентов с использованием огра- ничений на структурные параметры? 5. Что представляют собой порядковое и ранговое условия идентифи- цируемости уравнений структурной формы? 6. Что представляют собой рекурсивные системы моделей? 7. В чем состоит суть двухшагового и трехшагового МНК, используе- мых для оценки коэффициентов системы взаимозависимых уравнений? УПРАЖНЕНИЯ К ГЛАВЕ VIII Задание 8.1 Имеется следующая модель: Pr = M + ^ir; (8.1) W/ = A-A + A-^r + ^2r; (8.2) lt = Wt + bt- qu (8.3) где pt - логарифм цены; w, - логарифм почасовой оплаты, /, - логарифм себестоимости; qt - логарифм объема производства и Ь^ - логарифм коли- чества рабочих часов в неделю в период t. Требуется: 1. Представить модель в матричной форме записи. 2. Определить ранговые условия идентифицируемости уравнений для Задание 8.2 Имеется следующая макроэкономическая модель: С,= л1^; + Д + ^и; (8.4) //=;41^г + Д>-1^м+А + ^2г; (8.5) y, = C, + /, + G„ (8.6) 345
где Ct - потребление; //- инвестиции, Gt - государственные расходы; У, - валовой национальный продукт в период Г. Требуется: 1. Определить типы уравнений и типы переменных, входящих в мо- дель (8.4И8.6). 2. Представить структурные уравнения в матричной форме. 3. Построить соответствующую приведенную форму. 4. Определить метод оценки параметров приведенной формы. 5. Проверить идентифицируемость уравнений структурной формы мо- дели. Задание 8.3. Имеется следующая система взаимозависимых уравнений: П\Уи + ПтУь + fi[\xu + fii3X3t = £\t\ П\Уи + Угг + йзУзг + fiziXb + fiiAXAt = £ъ\ П\Уи + П^УЬ + yst + fiilXb + fii3X3t + fil4X4t = ^3/. Требуется: 1. Проверить идентифицируемость уравнений системы. 2. Выяснить идентифицируемость, если на параметры наложены сле- дующие ограничения: a)Ai=0; б) П1=0' Задание 8.4 Имеется следующая макроэкономическая модель: Ct = ai + azYt+a3rt + ви; Y.^Q + It-^Gt. Требуется описать процедуру оценивания уравнений по двухшаговому МНК. Задание 8.5 Имеется следующая макроэкономическая модель: Сг = ai + аь • У, + €и; /г = Д+А.У, + £2/; у, = С, + Л + С,. 346
Требуется: 1. Написать модель в матричном виде и найти соответствующую про- гнозную форму. 2. Определить число ограничений, наложенных на коэффициенты приведенной формы. 3. Показать, что при заданных значениях коэффициентов приведенной формы можно однозначно определить коэффициенты структурной фор- мы. 347
ГЛАВАIX Эконометрические модели с переменной структурой 9.1. ПРИЧИНЫ ИЗМЕНЧИВОСТИ СТРУКТУРЫ МОДЕЛИ В предыдущих разделах учебника рассматривались эконометрические модели, значения коэффициентов которых предполагались постоянными на всем рассматриваемом временном интервале ^=1,2,..., Т, Для моделей, построенных на основе статической информации, это предположение оз- начает неизменность значений их коэффициентов на всей ранжированной совокупности объектов. Данное предположение означает также равенство в статистическом смысле значений оценок коэффициентов модели, полученных на различ- ных массивах исходной информации. Иными словами, оценки коэффици- ентов линейной модели (1.2) оо, «ь-.., ^п» определенные, например, по ис- ходным данным соответствующим первым Т\ измерениям, не будут су- щественно отличаться от оценок, полученных на основе последующих Т-Т\ измерений рассматриваемых переменных. В этом смысле оценки ко- эффициентов модели, полученные на основе всей информации, т.е. по Г измерениям переменных, можно рассматривать как усредненные значе- ния оценок, полученные по всем возможным подмножествам этих изме- рений. Эконометрические модели с постоянными значениями своих коэффи- циентов на рассматриваемом мноэк:естве исходных данных часто назы- вают эконометрическими моделями с постоянной структурой. Они от- ражают предположение о неизменности (постоянстве) характера взаимо- связей, сложившихся между рассматриваемой совокупностью независи- мых переменных X/, /=1, 2,..., w и зависимой переменной д^. Эти взаимосвя- зи не подвержены влиянию ни изменений масштабов этих переменных, ни времени, ни каких-либо других, внешних по отношению к рассматри- ваемой модели условий, факторов. Вследствие этого количественные ха- рактеристики оценок коэффициентов модели с постоянной структурой оо, 348
д[1,..., Un одинаково точно отражают взаимосвязи между значением неза- висимой переменной з'^ и соответствующими ему значениями факторов Хц, /=1, 2,..., п; во все периоды (моменты) времени t=l, 2,..., Г, с поправкой на случайную ошибку £^. Это обстоятельство, в свою очередь, учитывается и при построении модели в виде условия «равноправия» всех элементов вектора у и строк матрицы X при определении значений ее коэффициен- тов . Вместе с тем результаты анализа развития многих реальных соци- ально-экономических процессов свидетельствуют, что со временем, вследствие изменения условий, под влиянием вновь появившихся неформа- лизуемых факторов, характер взаимосвязей меэюду ними меняется. Ино- гда подобные изменения связываются с законом перехода количества в качество, проявляющимся в том, что, например, с ростом масштабов явлений модифицируются взаимосвязи между ними. Во всех этих случаях взаимосвязи меэюду количественными характеристиками процессов и яв- лений, относящимися к различным частям временного периода, могут соответствовать и разным модификациям эконометрической модели, отличающимся значениями их коэффициентов, В такой ситуации модель с постоянной структурой, построенная на основе информации для всего периода, моэюет оказаться недостаточно точной и малопригодной для объяснения закономерностей рассматриваемых процессов, В связи с этим возникает вопрос о возможности учета изменений зна- чений коэффициентов в рамках одной эконометрической модели. В от- личие от моделей с постоянной структурой эконометрические модели с меняющимися значениями коэффициентов называют моделями с переменной структурой. Специалисты отмечают, что эконометрические модели с переменной структурой могут оказаться достаточно эффективными при изучении ди- намики уровня жизни, спроса населения и других социальных процессов при достаточно быстрых изменениях доходов, движении цен, инфляции, появлении новых товаров на рынке, исследованиях динамики структуры и темпов роста экономики в связи с научно-техническим прогрессом, рынка ценных бумаг, а также ряда других процессов в условиях переход- ной экономики. Модели с постоянной структурой в таких условиях в ^ Здесь термин <фавноправие» взят в кавычки с учетом того, что в моделях иногда используются весовые коэффициенты, определяющие различия в важности информа- ции, содержащейся в разных строках матрицы Л" и элементах j;,, при определении зна- чений коэффициентов (см. раздел 3.2). Однако этот вариант модели предполагает возможность изменения коэффициентов во времени. 349
лучшем случае отобразят некоторые «усредненные» за весь рассматри- ваемый период взаимосвязи между процессами, которые, по всей види- мости, окажутся несоответствующими их закономерностям на его по- следней стадии. Вследствие этого использование таких моделей в реше- нии плановых и прогнозных задач может привести к существенным ошибкам, избежать которых было бы возможным, опираясь на модели с переменной структурой. Изменчивость структуры эконометрической модели моэюет быть вызвана таклсе и некоторыми «техническими» причинами, связанными с особенностью ее построения на этапах выбора состава входящих в нее переменных, форм зависимостей меэюду ними и т.п. В таких случа- ях модели с переменной структурой за счет использования меняющихся оценок их коэффициентов, адаптированных к изменениям рассматри- ваемых процессов, способны уменьшить ошибки спецификации по срав- нению с моделями с постоянной структурой. В общем случае моэюно выделить следующие причины, вызванные неточной спецификацией эконометрической модели, которые обусловливают преимущества ис- пользования переменной ее структуры по сравнению с постоянной. Это: • невключение по разным причинам в уравнение модели существенных факторов (из-за слабости ее содерэюательного обоснования, отсутст- вия исходных данных и т.д.); • использование в качестве исходных данных значений процессов, не совсем точно выраэюающих рассматриваемые явления; • неправильно выбранная функциональная форма модели; • использование слоэюных по своей внутренней структуре перемен- ных, являющихся комбинациями некоторых других факторов. На практике установить закономерности изменчивости каждого из ко- эффициентов эконометрической модели априорно, как правило, не пред- ставляется возможным. Вследствие этого построение модели с перемен- ной структурой рассматривается как одно из направлений совершенство- вания модели с постоянной структурой, позволяющее обеспечить более точную аппроксимацию исследуемых процессов и, возможно, дать более обоснованное содержательное объяснение закономерностей их развития. Таким образом, построению эконометрической модели с переменной структурой обычно предшествуют этапы построения соответствующей ей модели с постоянной структурой и проверки целесообразности ее даль- нейшей модификации. Такая проверка может быть осуществлена с ис- пользованием специальных тестов, направленных на выявление законо- 350
мерностей в изменениях оценок коэффициентов эконометрической моде- ли. Вместе с тем здесь следует иметь в виду, что эти закономерности мо- гут достаточно существенно различаться по своему характеру. Например, изменения коэффициентов модели могут быть скачкооб- разными. В этом случае предполагается, что на последовательных интер- валах времени (1, ГО, (Т\, Гг),..., (Г^ 7) переменная у^ связана с независи- мыми факторами хи,..., Хщ линейными зависимостями, различающимися между собой по величине коэффициентов. Причем изменения их значе- ний происходят скачком в точках пересечения (или пограничных точках) рассматриваемых интервалов. Эконометрические модели с таким характером изменения коэффици- ентов часто называют моделями с переключениями. Они обычно исполь- зуются с целью аппроксимации сложных (может быть, неизвестных) за- висимостей >^=/(jci,..., Хп) последовательностью линейных функций путем их сшивания в определенных точках. Такую последовательность линей- ных аппроксимирующих эконометрических моделей называют сплайн- функцией. Изменения коэффициентов могут иметь и эволюционный характер, обусловленный, например, постоянными, но не слишком сильными пере- менами во внешней по отношению к рассматриваемым в модели процес- сам среде. В таком случае часто значения коэффициентов «привязывают- ся» к каким-либо внешним по отношению к модели факторам, отражаю- щим эволюцию силы влияния независимой переменной jc,^ на зависимую переменную д^/ в разные моменты времени /=1, 2,..., Г; /=1, 2,..., л. В литературе рассматриваются и более сложные закономерности в из- менениях коэффициентов эконометрических моделей, например, отве- чающие рассмотренным в главе УП гипотезам их случайного блуждания, соответствующие тому или иному классу случайных процессов. Установить сам факт существования изменчивости коэффициентов эконометрической модели и, может быть, ее характер возможно на основе специальных тестов-критериев, наиболее распространенные из которых рассматриваются в следующем параграфе. 9.2. ТЕСТИРОВАНИЕ ИЗМЕНЧИВОСТИ СТРУКТУРЫ ЭКОНОМЕТРИЧЕСКОЙ МОДЕЛИ Основная идея тестирования изменчивости коэффициентов эконо- метрической модели, имеющей систематический характер, состоит в проверке свойства случайности кумулятивной суммы ее ошибок при уве- 351
личении объема выборки (длины временного ряда) рассматриваемых пе- ременных. В этом случае предполагается, что оценки коэффициентов ли- нейной эконометрической модели, полученные по первым наблюдениям, в случае постоянства ее структуры, являются «достаточно хорошим» приближением для аналогичных оценок, полученных по следующим Т-к наблюдениям, в том смысле, что прогнозные значения ошибок^ л л л ek+\,ek+2,'--,ef , определенных на основании «предшествующих» оце- нок коэффициентов, по своим свойствам не отличаются от значений ана- логичных ошибок ek+u ^к+2^—у ^ъ определенных с использованием оценок коэффициентов, рассчитанных по всему объему выборки. Иными слова- ми, если структура модели является постоянной, то прогнозные значения л л л ошибок ek-\-\,ek+2,--',ej также должны быть независимыми с нулевым математическим ожиданием (Af[^it+/]=0,y=l,2,.-.) и конечной дисперсией. В этом случае можно ожидать, что их накопленная сумма ST-k = Z ^л+j (9.1) 7=1 окажется близкой к нулю, а сумма их квадратов (или их дисперсия, сред- неквадратическое отклонение) .2 "" ■ -4=/i" ^т-к =Z^^+y ' ^Н = ^ г ; (У{e) = ^lD{e) (9.2) по своей величине не будут значительно отличаться от аналогичных по- казателей, рассчитанных по первым к наблюдениям. В данной ситуации целесообразно рассматривать именно кумулятив- ную сумму прогнозных ошибок (сумму ее квадратов и т.д.), так как имен- но эти характеристики являются достаточно чувствительными к возмож- ным изменениям коэффициентов модели, поскольку они обладают спо- собностью накапливать систематическую составляющую ошибки, обу- словленную этими изменениями. Если даже с ростом объема выборки рассматриваемые свойства про- гнозных ошибок не подтверждаются (их кумулятивная сумма, сумма квадратов и т.п. увеличиваются), то данный факт может служить свиде- тельством систематической изменчивости коэффициентов эконометриче- ской модели. ^ Рассматриваются фактически значения ошибки. 352
На практике вместо самих прогнозных значений ошибки е^ , /=fc+l, ik+2,..., Г, обычно рассматривают их стандартизованные значения vv„ оценен- ные с использованием рекуррентной процедуры (4.1)-(4.14)^ (см. раздел 4.1). w,={y,-x,'a,.^)l4l + x\'F,,^-x, , (9.3) где, напоминаем, Ft-\={X\_yXt-\y^\ Xt-\ - матрица первых Г-1 значений не- зависимых переменных размера (t-\)x{n+\)\ Xt- ^я строка значений неза- висимых переменных в полной матрице Х\ at-\ - вектор оценок ai+I коэф- фициентов эконометрической модели, определенных по наблюдениям t-\. Таким образом, числитель в выражении (9.3) представляет собой про- гноз ошибки модели в момент г, коэффициенты которой определены по предшествующим t-\ наблюдениям, т.е. прогноз ошибки на одно наблю- дение вперед: л et=yt-Xt'a^.i, (9.4) а знаменатель этого выражения представляет собой стандартизующий эту ошибку коэффициент. Можно показать, что при постоянной структуре модели значения vv„ /=Л+1,..., Г независимы и одинаково распределены по нормальному зако- ну с нулевым средним и конечной дисперсией с^, ЛГ~(0, <^). В этом случае сумма их (г-п-1) значений, обозначаемая как W^ определяемая следую- щим образом: W.^iXIa)' t^^ (9-5) t=n+2 r = k-¥ l,it + 2,...,r представляет собой сумму (r-n-1) независимых случайных величин, рас- пределенных по стандартизованному нормальному закону ЛГ(0,1), где (T^^Z^f/T-n-l (9.6) t=\ - оценка дисперсии модели. С учетом этого несложно показать, что Wr также распределено по нор- мальному закону со следующими характеристиками: ' Согласно процедуре (4.1)-(4.14) вектор оценок коэффициентов модели по t из- мерениям определяется на основании следующей последовательности расчетов: ar=a,.i+kr(yrXt'at-i)\kt=Ft.i'Xtil+x\'F,_i'Xt); Fr^Ff_i-krx'rFt.i; t=k+lM2,...J. 12 Эконометрика 353
cow(Wr. ^5) = min(r, s)-n-l, (9:7) r,j = it + l,/: + 2 T. Напоминаем, что я+1 — количество параметров модели. С учетом (9.7) можно сформировать доверительные интервалы для по- следовательности случайных кумулятивных величин Wr. Поскольку каж- дая из них для г>п+1 имеет среднеквадратическое отклонение cr(Wr) = 4r-n-\, то вся их совокупность в случае модели с постоянной структурой должна находиться в секторе, заключенном между кривыми -T^^r-n-l и T*^jr-n-\, где г* - табличная константа, определяемая для стандартизованного нормального закона величиной доверительной вероятности/7*. Напомним, что для/7*=0,95, z* =1,96 (см. рис. 9.1). Рис.9.1. Доверительный интервал для кумулятивной суммы стандартизованных ошибок модели Таким образом, для любого г для эконометрической модели с посто- янной структурой с п независимыми переменными имеет место следую- щее вероятностное условие, определяющее гранищ>1 нахождения кумуля- тивной суммы W^: р(-1,96• л1г-п-1 <W,< 1,96• Vr-n-1) = 0,95 . (9.8) Выход значений W^ r=Jfc+l, fc+2,..., Г за границы, определенные в вы- ражении (9.8), является свидетельством того, что оценки коэффициентов эконометрической модели при увеличении количества исходной инфор- мации характеризуются систематическими изменениями. Наряду с критерием кумулятивной суммы ошибок (прогнозных оши- бок) для выявления факта систематической изменчивости коэффициен- 354
тов модели может использоваться также критерий кумулятивной суммы квадратов ошибок. При этом последний критерий позволяет установить также и факт случайных изменений оценок параметров. Расчетное зна- чение этого критерия представляет собой следующее отношение: \t=n+2 J \t=n+2 J г = л + 2,л + 3,...,Г. = s^/s^\ (9.9) При этом можно показать, что величины s^ и S'^ связаны следующим рекуррентным соотношением, которое можно использовать при расчете числителя отношения (9.9): s^=sU+^f' (9.10) В самом деле, поскольку оценки коэффициентов модели, определен- ные по г-1 и г измерениям, удовлетворяют равенству: Or = Or-i + Fr^Xr-iyr - x'r-ar-i), 1 1 то связь между соответствующими значениями д>-1 и Sr может быть представлена в следующем виде: 5г^=(Уг-Хг'агУ'(уг'Хг-аг)=(уг-Хг- аг.\У-(уг-Хг' ar.iHar-ar.iy-Fr''^iar-ar-i)= =Sr-i^-k-(yr-Xr'ar-ihx\'FrXr'(yr-Xr'ar.\f, Далее, выражая в последнем слагаемом правой части этого равенства матрицу Fr через матрицу Fr-\ (см. выражение (4.5)): Fr = Fr-\-Fr-yXr(l-x'r-Fr-l-Xr) 'XrFr-Ъ после несложных преобразований с учетом (9.3) непосредственно полу- чаем равенство (9.10). Из (9.10) непосредственно вытекает, что значение показателя Л'г из (9.9) определяется следующим соотношением: 0<л',<1. (9.11) При этом для моделей с постоянной структурой можно показать, что случайная величина Жг имеет бета-распределение со средним зна- чением М[^,] = ^Р^ (9.12) и ее доверительный интервал при заданном уровне доверительной вероятности р* находится между прямыми, определяемыми уравне- ниями 12- 355
-со+(г-л-1)/(Г-п-1), со+(г-п-1)/(Г-.п-1), (9.13) где Со - константа, зависящая от уровня доверительной вероятности р*\ Таким образом, нахождение показателя itr при г=л+2, л+3,..., Г-1 в границах, определенных выражением (9.13), является свидетельством по- стоянства структуры эконометрической модели. В противном случае можно угверждать, что оценки ее параметров с ростом объема выборки меняются. При этом изменения могут иметь как систематический, так и случайный характер. Заметим здесь, что в отличие от нормированных ошибок VV/, именно их квадраты (w^^) чувствительны к случайным изме- нениям оценок параметров. При большом числе измерений Т (объеме выборки исходных данных) для проверки гипотезы о постоянстве структуры эконометрической моде- ли можно использовать так называемый критерий гомогенности остатков, который является «мерой» равномерности распределения квадрата ошиб- ки на отдельных участках рассматриваемого интервала времени (1,7). Значительный разброс этого показателя свидетельствует об изменчи- вости оценок коэффициентов модели. Расчетное значение этого критерия формируется следующим образом. На интервале (1,7) по имеющимся исходным данным строится экономет- рическая модель и определяется сумма квадратов значений ее фактиче- ской ошибки 5 (1,7). Далее рассматриваемый интервал разбивается на к частей (желательно равных для целей упрощения выкладок) (1, ГО, (Ji+l, Тг)....., (7i_i, 7). На каждом из этих подынтервалов для построенной эко- нометрической модели рассчитывается соответствующая сумма квадра- тов ошибок Sj ,7=1,..., Jk. Известно, что значения s (1,7) и Sj ,7=1. .» к связаны между собой со- гласно формуле представления общей дисперсии в виде суммы межгруп- повой и внутригрупповой дисперсий. При этом отношение среднего квадрата отклонений между группами к среднему квадрату внутригруп- повых отклонений в случае постоянства структуры эконометрической модели распределено по закону Фишера с (it-l)(n+l) и [r-it(n+l)] степе- нями свободы. Таким образом, для проверки гипотезы о постоянстве структуры мо- дели на основе критерия гомогенности остатков необходимо рассчитать следующее дисперсионное отношение: ^ Ее значение определяется с использованием теории статистик Колмогорова- Смирнова. 356
f^IztHHH _Jil_ (9.14) (ifc-l)-(n + l) * 2 и сравнить его с табличным значением критерия Фишера F*(Vb v*)), вы- бранным по заданному уровню доверительной вероятности р* и числах степеней свободы Vi=(Jl:-l)(n+l) и И2=[Г-*(л+1)]. Гипотеза о постоянстве структуры эконометрической модели может быть принята с вероятностью р*, если будет выполнено следующее соот- ношение: F<F»(Vi, V/2). В противном случае структура модели может рассматриваться как пе- ременная. Несложно заметить, что критерий гомогенности остатков в большей степени подходит для выявления случайных изменений в оценках пара- метров эконометрической модели, поскольку его величина непосредст- венно не указывает на наличие каких-либо тенденций в изменениях ошибки на отдельных частях интервала (1,7). В некоторых случаях изменение структуры эконометрической модели может иметь вид скачкообразного переключения значений оценок ее па- раметров с одного реэюима на другой (скачкообразной смены значений оценок). Скачок в значениях оценок параметров обычно привязывается к какому-либо моменту времени Т\, находящемуся на интервале (1,7)- Для статической совокупности исходных данных такой скачок может быть привязан к некоторому рубежному значению какой-либо из переменных (например, зависимой переменной д^г). В случае одного скачка эконометрическая модель, описывающая рас- сматриваемые процессы, как бы подразделяется на две модификации. Первая из них <фаботает» на интервале (1, Т\\ а вторая - на интервале (Г1+1, 7). Таким образом, критерии скачка в данном случае должны дос- таточно четко указывать на наличие или отсутствие момента Гь до кото- рого целесообразно ( в случае его наличия) использовать первую моди- фикацию модели: Уг ^cc^o^^tccf^^it^e\^\ r = l,2.....ri; (9.15) 1=1 а после него - ее вторую модификацию: 357
з^г =^o^^+Z^P4+^P» г = Г1+1,2,...,Г; (9.16) При ЭТОМ обычно предполагается, что ошибки St и St распределены 2 2 ПО нормальному закону с нулевым средним и дисперсиями Oi и с^ соот- ветственно, et^^^-N(0, <У\'\ £^^^-N{0, (Ji) и некоррелированы, Coy{db=a^'E, /=1,2. В случае необнаружения (отсутствия) такого момента критерий дол- жен указывать на целесообразность использования единой эконометриче- ской модели на всем рассматриваемом интервале (1,7) >^г=^о+£^/-^//+^г' r = U,...,7^; (9.17) что эквивалентно равенству всех аналогичных коэффициентов в выраже- ниях (9.15)-(9.17), o^^^^=cxf^\ /=0,1,..., л, и равенству дисперсий (}^G\^Gi, При наличии нескольких скачков в параметрах эконометрической модели, например, в точках Гь Г2,..., Tjt для описания рассматривае- мых процессов необходимо использовать и соответствующее количе- ство ее модификаций (по одной в каждой части интервала (1, Г)). Возможность построения модификации модели на каждой из частей интервала (1,7) непосредственно указывает, что его продолжитель- ность (объем выборки исходной информации) должна быть доста- точно велика. Рассмотрим основные идеи формирования критериев скачка в оценках параметров эконометрической модели, не привязываясь к конкретному моменту времени Т\, Предположим, что на интервале (1, ГО, где Т\ произвольный момент, была построена эконометрическая модель (9.15), т.е. были оценены ее коэффициенты и определены па- раметры распределения фактической ошибки е,. Затем массив исход- ной информации был увеличен на Го наблюдений. В связи с этим воз- никает вопрос: соответствует ли построенная модель вновь появив- шимся исходным данным или нет? В предельном случае Го=1, и тогда при отрицательном ответе на поставленный вопрос момент времени Т\Л-\ можно рассматривать как момент скачка ( переключения модели с одного режима на другой). Для интервала (1,70 на основании МНК получим выражение вектора оценок коэффициентов модели (9.15) как многомерной случайной вели- чины в следующем виде: a,={X\^X{)'■X\^y,=a^^^XyX^t■Xye,=ax■^щ, (9.18) 358
где индекс (1) относится к значениям переменных, определенных на ин- тервале (1, Т\) и ui=(X\-Xiy^-X\-e\ - вектор ошибки оценок параметров модели (9.15) а\. Предположим, что на следующих Го наблюдениях целесообразно ис- пользовать м< ель (9.16) с оценками, выражаемыми вектором Oz и ошиб- кой €2. Определим ошибку прогнозов известных значений >^^, /=Г1+1,..., Ti+ro, зафиксированных на втором интервале, полученных с использованием модели (9.15) первого интервала. Вектор этих ошибок может быть пред- ставлен в следующем виде: w=y2 -Х2 •а^=Х2 02 -Х2 ах +^2 -^2(^1 -^1)"^ 'Х[ е^. (9.19) л Вектор W состоит из tQ компонент, и его математическое ожидание равно M[w] = w = X2'a2-X2-ai=X2' (^2 -ai). (9.20) В предположении о независимости ошибок е\ и ei моделей (9.15) и л (9.16) ковариационная матрица вектора w будет иметь следующий вид: Co\(w) = Coy(€2)+Cov[X2 (X{Xiy^'X{ '€i] = = ai'E + X2(X{Xir^'X{'Co\(€i)'Xi(X{Xir^'X2 = ^a^'E+al'X2'iX{-Xiy^X2. (9.21) Заметим, что в случае, когда дисперсии ошибок <Ji^ и ^2^ совпадают, выражение (9.21) имеет следующий вид: Coy(w) = (T^(E-\-X2'(X{'Xiy^X2). (9.22) В случае, когда Го=1, т.е. прогноз делается только на один шаг, матри- ца значений независимых факторов Х2 трансформируется в вектор- л строку, а ковариационная матрица Co\(w) преобразуется в дисперсию прогнозного значения yj^i. Выражение для оценки этой дисперсии при- мет следующий вид: В случае отсутствия скачка в оценках параметров эконометрической модели в точке Ti+l имеем ai=a^. Тогда из (9.20) непосредственно выте- 359
кает, что М[ w ]=0, а конкретное значение Wt-j+i, оцененное по левой части формулы (9.19), можно рассматривать как оценку случайной величины л WTi+i, дисперсия которой определена выражением (9.22). В этом случае отношение F = — ^^ (9.24) распределено по закону Фишера со степенями свободы Vi=l и V2=Ti-n-l, Таким образом, гипотезу о наличии скачка в оценках параметров эконометрической модели в точке Ti+l следует отклонить с вероятно- стью р*, если F<F*(Vu Vi)- Вместе с тем очевидно, что вывод о наличии скачка в оценках параметров модели по одному значению зависимой переменной и строке матрицы значений независимых факторов не яв- ляется достоверным. Критерий (9.24) может скорее предупредить о возможности такого скачка в какой-либо точке, а его проявление должно быть подтверждено критериями, использующими информа- цию, соответствующую некоторой последовательности точек, обра- зующих следующий за Ti временной интервал. Такие критерии можно разделить на две группы. Критерии первой группы не требуют по- строения следующей (очередной) модификации эконометрической мо- дели на дополнительном временном интервале, критерии второй груп- пы предполагают необходимость построения дополнительной моди- фикации этой модели. Критерии первой группы развивают изложенную вьппе идею форми- рования критерия скачка на случай нескольких точек, следующих за <фу- бежной» точкой Т\. Рассмотрим основной подход к их формированию бо- лее подробно, но без использования громоздких выкладок. Предположим, что за последней точкой Ti интервала, на котором «рг- ботает» первая модификация эконометрической модели, определенная выражением (9.15) следует to точек. Согласно выражению (9.19) опреде- лим на каждой из них компоненты вектора w как w, = yt-X2'aut = Ti-\-l,...,Ti-\-to. (9.25) На основании найденных значений W/ с использованием ковариацион- ной матрицы Cov(h'), определенной выражением (9.22), сформируем квадратическую форму следующего вида: A(w) = w''Co\~\wyw. (9.26) 360
в отсутствие скачка в оценках параметров эконометрической модели эта квадратическая форма будет распределена по центральному закону 2^(Го) (вследствие свойства M[w]=0), а в случае такого скачка - по нецен- тральному ;^(to). Далее заметим, что в отношении выборочной дисперсии 2 7 j^ (у) 2 справедливо следующее соотношение s =а •— , где s - выбороч- V пая дисперсия; а - дисперсия генеральной совокупности; z(^) " случай- ная величина, распределенная по закону Пирсона с числом степеней сво- боды к Кроме того, отношение двух выборочных дисперсий из одной ге- неральной совокупности распределено по закону Фишера с ц и V2 степе- 2 2 Z\ I Vl нями свободы, Т.е. F(Vi,V2)= s\ I Sz = -^—-. В этом случае, полагая, что первая выборочная дисперсия модели определена на основании значений н", на интервале {Т\+\, to), а вторая - на основании фактических значений ошибки модели на интервале (1, ГО, с учетом соотношения (9.22) можем записать: —Z^do) —■w'[Coy(w)]-^w -z\T,-n-l) .2^1-"-^ Ti-n-l fj2 Ti-n-l a^ s (l,7i)- (9.27) w'[E + X2iX{Xi)-^X'2r^w Л. hi- где J (1,7\) = 2 ^t ~ сумма квадратов фактических значений ошибки мо- t=\ дели на интервале (1, Т{)\ с^ - математическое ожидание дисперсии ошибки модели. Таким образом, отношение взвешенных сумм квадратов значений ошибки модели на интервале (Г1+1, Го) - прогнозной ошибки и на интервале (1, Т\) - фактической ошибки распределено по закону Фи- шера со степенями свободы V\-t^ и v-^Tx-n-X, Далее, как и в случае един- ственной дополнительной к интервалу (1, Т\) точке, гипотеза об отсутст- вии скачка в оценках параметров эконометрической модели на интервале 361
(Г1+1, Го) принимается с вероятностью р*, если выполняется соотношение F<F*(Vu ^2),где Vi=ro,V2=ri-n-l. К критериям второй группы относится известный критерий Чоу. Со- гласно ему на интервалах (1, ГО, (Г1+1, to) строятся первая и вторая мо- дификации эконометрической модели, а на объединенном интервале (1, Го) - обобщающая (единая для двух интервалов) модель. Для каждого из вариантов модели определяются векторы ошибок ^, ^ ие- соответст- венно. Расчетное значение критерия Чоу определяется по следующей форму- ле: (9.28) При этом значения критерия Чоу распределены по закону Фишера с /2-1 и Ti+t(r-2n-2 степенями свободы. Поэтому гипотеза об отсутствии скачка в оценках параметров эконометрической модели в точке Ti+l при- нимается с вероятностью р», если выполняется соотношение F<F*(n-l, Г1+ t(r-2n-2). Если Го недостаточно велико для оценки параметров второй модифи- кации эконометрической модели на участке (Ti+l, to), то расчетное значе- ние критерия Чоу определяется только с учетом ошибок первой модифи- кации согласно следующему выражению: F=-l^L__tzi Ty-!tzi, (9.29) ^0 t=l (г')+(сЪ'(еЪ <=1 t=T,+l n-1 Ti+tQ-2n-2 n-l m В данном случае значение F распределено по закону Фишера с Го и Т\-п-1 степенями свободы. На практике обычно точка скачка Ti+l является неизвестной. Однако, сопоставляя графики процессов д',, хи, /=1,..., л; иногда удается приблизи- тельно установить область ее нахождения на оси времени. В этом случае 362
для определения точного местонахождения скачка рекомендуется опре- делить расчетное значение используемого критерия в каждой точке этой области. Наилучшему решению соответствует максимальное значение критерия. Для этих же целей может быть использован критерий логарифма от- ношений максимальных правдоподобий, рассчитываемый по следующей формуле: Я7^=1п[ДЯо)/ДЯ1)], (9.30) где ДЯо) - функция максимального правдоподобия, определенная на объединенном интервале (1, Го) для обобщенной эконометрической моде- ли; ДЯО - функция максимального правдоподобия, определенная в предположении, что на интервале (1, Ti) <фаботает» первая модификация этой модели, а на интервале (Ti+l, to) - вторая. Можно показать, что на практике значение Я^^ рассчитывается соглас- но следующей формуле: Ят] = -7^1 Ino-f +~Го Ino-f --ГIna^ = ln(o-f^ • a^V(j^), (9.31) где Oi и 02 - среднеквадратические отклонения первой и второй модифи- каций эконометрической модели, а а- обобщенной модели в целом. Точке скачка оценок параметров эконометрической модели соответст- вует максимальное значение А^^ среди всех аналогичных значений, рас- считанных для рассматриваемой области его возможного местонахожде- ния. 9.3. ЭКОНОМЕТРИЧЕСКИЕ МОДЕЛИ С ПЕРЕКЛЮЧЕНИЯМИ Эконометрические модели линейного типа с переключениями, т.е. со скачкообразными изменениями коэффициентов в точках ^ь /2v tn-i временного интервала (1, Т) в зависимости от их модификаций называют также линейными, сплайн-моделями или кусочно- линейной регрессией. Они обычно используются для аппроксимации на отдельных временных интервалах сложных нелинейных зависимостей линейными уравнениями, построенными как эконометрические модели независимо друг от друга на каждом из участков (сегментов) рассматри- ваемого временного интервала (1,7) (Гу_1, г^),7=1,2,..., п, Го=1, t„=T, 363
Заметим при этом, что для этих же целей могут быть использованы также эконометрические модели с переключениями полиномиального ви- да. Основное различие меэюду линейной сплайн-моделью и кусочно- линейной регрессией состоит в разных способах использования точек пе- ресечения интервалов tj, 7=7,2,..., п-7. При построении сплайн-модели предполагается, что в этих точках модели двух соседних периодов как бы пересекаются. Такие точки называют в этом случае узлами, В кусоч- но-линейных моделях такое пересечение моделей не предполагается. В результате расчетные значения у^, и у^ , определенные в точке tj на основании моделей j-1-го интервала и j-го интервала соответственно могут не совпасть. Иными словами, в момент tj наблюдается скачкооб- л разное изменение значения у^ (см. рис. 9.2). В этом случае граничные точки //,7=1,2,..., г-1 могут принадлежать и только одному из сегментов, например предыдущему, т.е. соседние сег- менты могут и не иметь общих точек. При построении и сплайн-модели, и кусочно-линейной регрессии обыч- но используют одно из двух основных предположений относительно мо- мента скачка параметров. Во-первых, его можно привязать к изменени- ям значения какой-либо из управляющих переменных Zt» полагая, напри- мер, что при Zt^ работает вариант модели с одними значениями пара- метров, а при Zt^ - с другими. Ух / 0>1 Рис. 9.2. Типы скачкообразного сдвига параметров линейной эконометрической модели: а) сплайн-модель; б) кусочно-линейная модель При этом иногда даже не требуется, чтобы эта управляющая перемен- ная входила в состав объясняющих факторов модели, т.е. она рассматри- 364
вается как внешняя переменная, объясняющая режим работы системы (развития процесса), описываемой такого типа моделью. При таком пред- положении обычно возникает проблема не только поиска подходящей пе- ременной, объясняющей скачки параметров модели, но и определения ее «критических» уровней, соответствующих этим скачкам. В некоторых эконометрических исследованиях в качестве такой переменной могут быть использованы процент банковского кредита, уровень налога, размер таможенной пошлины и другие редко меняющиеся экономические пара- метры, определяющие <фежим» хозяйственной деятельности. Согласно второму предполоэюению скачок в параметрах модели при- вязывают непосредственно к моменту времени tj. Здесь имеется в виду, что даже если реэюим развития исследуемого процесса зависит от ка- кой-либо из объясняющих переменных, то и ее изменения привязаны ко времени и временной фактор, таким образом, Mooicem выступать в каче- стве косвенной объясняющей переменной. Далее, без ограничения общности будем рассматривать время t в каче- стве такой переменной, объясняющей скачкообразное изменение пара- метров эконометрической модели в отдельных точках (1,7). Таким образом, кусочно-линейную регрессию на интервале (1, Т) можно представить в виде следующей системы линейных эконометриче- ских моделей: уР> =а^> ^а?^х^^ +...+a^^)4f ^e4'\t = t,,t, ^l,...j,; (9.32) где Oi^ - коэффициенты линейной эконометрической модели, <фаботаю- щей» на 7-м сегменте; е^^ - ошибка модели j-ro сегмента; у1^^, хц ^ - ис- ходные значения зависимой и независимой переменных, соответственно, вJ-M временном сегменте;у=1,2,..., г, /=0,1,...,п. Заметим, что модель типа (9.32) включает в себя также и случай, когда некоторые из объясняющих переменных на каких-либо сегментах отсут- ствуют. Предположим, что нау-м сегменте переменная Xi отсутствует. То- гда при формировании исходных данных вектор-столбец ее значений JC/^ должен быть приравнен к нулю. Если точки Гь Г2,..., tr-i известны\ то построение моделей (9.32) не представляет особых сложностей. В зависимости от их особенностей (ти- ^ Эти точки могут бьпъ определены с использованием какого-либо из рассмотрен- ных в разделе 9.2 тестов. 365
па) для оценки их коэффициентов могут быть использованы рассмотрен- ные в предыдущих разделах методы (обычно МНК). В тех ситуациях, когда сами точки скачков параметров не известны, но известно их количество г, при построении модели кусочно-линейной рег- рессии (9.32) можно использовать специальные методы оценки ее коэф- фициентов а^^\у=1, 2,..., г, /=0, 1,..., п, позволяющие одновременно фик- сировать и оптимальные местонахождения скачков, соответствующие значениям времени tj. Эти методы достаточно сложны и относятся к клас- су методов оптимального программирования. Одним из наиболее эффективных среди этих методов является метод динамического программирования, который в сочетании, например, с МНК позволяет найти оптимальное разбиение исходного временного ин- тервала (1,7) на оптимальное число сегментов и оценить на каждом из них коэффициенты линейной эконометрической модели, «наилучшим об- разом» описывающей рассматриваемый процесс yt в зависимости от зна- чений независимых факторов х^. Задача построения системы уравнений (9.32) в этом случае может быть сформулирована следующим образом. При заданном общем виде линейной эконометрической модели (1.2) на интервале (1,7) найти после- довательность точек Гь..., tr-i и оценить на временных периодах (сегмен- тах) между ними специфические для каждого из них значения ее коэффи- циентов. Одним из «наиболее подходящих» для метода динамического про- граммирования критериев решения такой задачи является минимум об- щей для интервала (1,7) суммы квадратов ошибок всех моделей из систе- мы (9.32), которая может быть определена согласно следующему выра- жению: S (г,Г)=Х^Ь (9.33) ;=1 где sj= Z(fr)^ - сумма квадратов ошибки модели у-го интервала, 7=1, 2,..., г. Метод динамического программирования последовательно рассматри- вает дерево всевозможных решений, отбрасывая при этом заведомо бес- перспективные варианты и сужая тем самым области месторасположения оптимальных точек скачка tpj=l, 2,..., г. Этот метод обычно используется при аддитивных целевых функциях (в нашем случае (9.32)). Другой его 366
важной особенностью является отсутствие «последействия». Для нашего случая это означает, что оптимальное решение на j-u интервале (т.е. ме- сторасположение точки tj) не зависит от месторасположений предшест- вующих точек tu ^2>—»0-ь при которых оно определяется. Решение задачи динамического программирования обычно базируется на принципе относительности Р. Беллмана. Применительно к нашей зада- че он формулируется следующим образом. Пусть определено т первых сегментов из общего их количества г, т<г. Тогда для получения опти- мального (минимального) значения критерия (9.33) необходимо, чтобы и разбиение оставшейся части временного интервала на сегменты бьшо оп- тимальным. Из принципа Р. Беллмана вытекает основное функциональное соотно- шение для данной задачи: 8опт(^7')= min \sl^(U^) + sl^(t^,T)\, (9.34) где s^^iUtf^) - сумма квадратов ошибки оптимального разбиения на т сегментов на интервале (1, tm)', SonxC^m»^) ~ сумма квадратов ошибки при вариантах разбиения на оставшиеся г-т дегментов интервала (г^, 7). Соотношение (9.34) по существу позволяет сократить количество пе- реборов разбиений исходного интервала (1, 7) на заданное число сегмен- тов г, отбрасывая заведомо неверные решения. Заметим, что при решении этой задачи для определения s обычно ис- пользуется МНК. В результате при выборе точек должно учитываться очевидное ограничение на количество точек в каждом из сегментов. Формально оно имеет следующий вид: 7}>п+1, где 7} - количество точек в у-м сегменте, а «+1 - количество параметров модели. На практике это ог- раничение может быть усилено: 7}>/:<л+1), где к>1 - некоторый множи- тель, регламентирующий соотношение между объемом выборки и числом параметров модели нау-м сегменте. Система линейных сплайн-моделей также может быть определена общим выражением (9.32). Однако, при построении каждого из ее урав- нений (определении коэффициентов) должно быть учтено ограничение, вытекающее из природы сплайнов. Это ограничение требует, чтобы л расчетные значения у^^, определенные с помощью уравнения сплайна нау-1-м сегменте, совпадали со значениями, определенными на основе уравнения сплайна j-ro сегмента. Формально это ограничение (систему 367
ограничений для всех соседних пар сегментов) можно представить в следующем виде: .г+^^-ч+...+^гч = = ^^^>+а,%+... + аУЧ (9.35) у = 2,...,г-1. При ограничениях типа (9.35) процедура построения эконометриче- ских моделей со скачками параметров значительно усложняется. При из- вестном расположении точек скачка на временном интервале (1,7) оцен- ки их коэффициентов могут быть получены, например, в ходе решения задачи минимизации целевой функции типа (9.33): при г-1-м ограниче- нии на приросты параметров моделей следующего вида: (A^Ur.) = 0, (9.36) 7=1, 2,..., г-1. где Aci^^=(ao^^-ao^~^\ai^^-ai^~^\..., aj^^-aj^'^^) - вектор-строка ненулевых приростов параметров модели при переходе от У-1-го сегменту к у-му; Xt. =(1, л:^., ..., XntY - вектор значений независимых факторов в точке tj ин- тервала (1,7). Для решения подобной задачи обычно используются методы оптими- зации квадратичной целевой функции при ограничениях на параметры, задаваемые в виде равенств. 9.4. ЭКОНОМЕТРИЧЕСКИЕ МОДЕЛИ С ЭВОЛЮЦИОННО МЕНЯЮЩИМИСЯ КОЭФФИЦИЕНТАМИ Модель с эволюционными изменениями коэффициентов в общем слу- чае имеет следующий вид: yt = ^(0 + aiityxu +...+ anityxnt + St, (9.37) где ai{t), /=0,..., n - оценки коэффициентов модели, меняющиеся во вре- мени под влиянием каких-либо факторов, условий. Иными словами, предполагается, что значения оценок коэффициента а,, рассматриваемые в различные моменты времени, например, г и г+1, могут различаться между собой, т.е. а/(Г)^<Г+1). В общем случае выражение (9.37) можно интерпретировать как мо- дель (а1+1)Г коэффициентами, поскольку в каждый момент ^=l,2,..., Т значение ai{t) представляет собой как бы оценку «самостоятельного» ко- эффициента. Очевидно, что тогда определить весь набор значений а,<0, 368
/=0,..., w, /=1,2,..., Тнз, основании Г независимых уравнений типа (9.37) не представляется возможным. Обойти это ограничение возможно путем учета некоторых предвари- тельных предположений относительно закономерностей изменения ко- эффициентов модели (9.37). В качестве такого предположения может быть рассмотрена гипотеза об определенном характере зависимости ко- эффициента Oiit) от некоторого набора факторов zi,..., Zh времени t и т.п. При этом обычно эти факторы являются внешними по отношению к мо- дели переменными. Предположим, например, что коэффициентов а;<0, /=0,..., п, являются линейными функциями от одного внешнего фактора z и ошибки аппроксимации uu, происхождение которой будет пояснено ниже: «;<0 = Дт) + Дгг, + м/г, (9.38) где До и fix - неизвестные коэффициенты такой зависимости; Zt - извест- ные значения фактора zв моменты времени /=1, 2,..., Г. Подставим выражение (9.38) в модель (9.37). В результате получим: УрДю+Д)1-г,+(До+Д rZr) .Х1Г+.. .+(До+Д.гг/)-д:т+ +6j+wo/+^ir-wu+.. --^Xnt-Unf (9.39) Несложно заметить, что модель (9.39) отличается от модели (9.37) до- полнительными слагаемыми, появившимися в правой ее части: j3orZh п fiivZt'Xu',...; PnvZt'Xnt и ошибкой ^г =£•; + Z% •"//' где Xi^\, г=1,2,... Обо- /=о значив Zt как jc„+i,^ Zt-xu как jc„+2,r,..., Zt'Xnt как Х2п+\,и получим традиционное вьфажение линейной эконометрической модели: Уг^оо+аухи-^.. лап-Хп&сХп^уХп^1^&.. .+6ir2n+r^2n+i./+4 (9.40) где коэффициенты моделей (9.40) и (9.39) связаны следующими соотно- шениями: <% = Дю, ^1 = До,...»^ = До, ССп+\ = Дь"-, OCln+l = Дь Несложно заметить, что для модели (9.40) матрица значений факторов X имеет следующий вид: (\ ххх л:„1 .^11-Zi Хп\'^\\ хА ... . (9.41) у\ Хур ... ^лГ X\T'Zt ... ^nT'ZTj При известных значениях факторов JCi^,..., Хпи Zt, элементы этой матри- цы определяются однозначно. В этом случае оценки коэффициентов мо- дели (9.40) могут быть найдены с использованием рассмотренных в гла- 369
вах 2-4 методов с учетом свойств ошибки этой модели, например, с по- мощью обычного МНК при вполне естественном предположении о неза- висимости ошибок €t, uo/,..M M/i/между собой и со значениями независимых факторов Xit. Обратим также внимание на эффект роста дисперсии ошиб- ки при переходе от модели (9.37) к модели (9.39). Дисперсия последней модели при независимых ошибках определяется согласно следующему выражению: ^'=^i + Z(Z4)<. (9.42) 2 ^2 где <т - дисперсия ошибки /-го уравнения (9.38), Z ^Ог = ^ • "' t=i Основной проблемой при оценке коэффициентов модели (9.40) явля- ется обоснование зависимостей, описывающих закономерности изменчи- вости коэффициентов а/(г), /=0,..., п. Дело в том, что априорно, используя только информацию, выраженную значениями переменных yt, JCi,,..., jc„, и, может быть z/,»7=l»2,...,*; определить вид этих зависимостей не представ- ляется возможным. Это связано с тем, что тенденции, закономерности изменчивости оценок коэффициентов ai{t) могут быть выявлены только после вычислительных экспериментов. На практике решение этой про- блемы достигается путем последовательного перебора различных воз- можных вариантов этих зависимостей, по возможности используя для их сокращения так называемый динамический подход. Его суть состоит в следующем. Интервал /=(1,7) разбивают на ряд частей, возможно пересекающих- ся. На каждой из них определяются оценки коэффициентов эконометри- ческой модели классического типа, т.е. эти оценки предполагаются по- стоянными для каждой из рассматриваемых частей интервала. Таким об- разом формируются ряды этих оценок ао(1); «i(l); ... a,j(l); ао(2); ai(2); ... а^(2); ^^^^^ Оо(к)\ ai(k)\ ... a„(fc). где а/(/) - значение оценки /-го коэффициента нау-й части интервала /=(1, П Анализируя тенденции изменения рядов аф, можно попытаться уста- новить варианты возможных изменений рассматриваемых коэффициен- тов и обосновать наиболее подходящие для их описания зависимости. 370
Далее, сравнивая характеристики качества построенных эконометриче- ских моделей (дисперсии, коэффициенты детерминации, множественной корреляции), соответствующие этим вариантам, можно определить наи- более приемлемую среди них. В некоторых случаях варианты зависимостей ajif) могут быть сформи- рованы на основе предварительно выдвигаемых гипотез. Например, гипо- тезу о стабилизации коэффициента Д/ во времени можно отобразить в ви- де следующего уравнения: a,{t)=b^+bn/t, (9.44) где t - выражает переменную, влияющую на величину коэффициента а,. Обозначив, z=l/t, получим, что при таком предположении матрица значений исходных факторов X определена выражением (9.41). Несложно заметить, что при известных зависимостях переменных ко- эффициентов Giiz, t) эконометрической модели, задача их оценивания в отсутствие каких-либо эффектов, вызванных плохой обратимостью мат- рицы (Х^'Х), гетероскедастичностью или автокорреляционной зависимо- стью ошибки модели и т.п., может осложняться лишь из-за уменьшения числа степеней свободы, обусловленного ростом количества независимых переменных. ВОПРОСЫ к ГЛАВЕ IX 1. Охарактеризуйте причины изменчивости структуры модели и спо- собы ее отображения в уравнении регрессии. 2. Каковы критерии постоянства и изменчивости структуры? 3. Какие специальные приемы используются для обнаружения измен- чивости структуры модели и закономерностей этого процесса с использо- ванием статической и динамической информации? 4. Перечислите типы моделей с переменной структурой. 5. Что собой представляют модели с переключениями? 6. Охарактеризуйте модели с эволюционирующими коэффициентами. 7. В чем состоят особенности оценки коэффициентов моделей с пере- менной структурой? УПРАЖНЕНИЯ К ГЛАВЕ IX Задание 9.1 Компания А, крупный производитель спортивных автомобилей, заин- тересована оценить следующую производственную функцию за период 1980-1999 гг.: yt=ao-^avXt+et, (9.1) 371
гдед', - логарифм среднего выпуска автомобилей в неделю (в тыс. $); Xt - логарифм среднего количества рабочих часов в неделю. В 1992 г. компания произвела инвестиции в новую производственную технологию. Есть предположение, что это приведет к изменению свобод- ного члена в уравнении (9.1). Требуется: 1. Модифицировать модель (9.1) а) с помощью введения фиктивной переменной; б) с помощью представления ее в виде двух уравнений без фиктивной переменной. 2. Рассчитать вектор оценок параметров модели с фиктивной пере- менной, если ^ 5,200 0,820 -0,700'i {ХХГ^ = 0,820 0,442 -0,130 1^-0,700 -0,130 0,096 ху = г 250^ 125 2000 Определить ожидаемые оценки параметров для двух уравнений без фиктивной переменной. Задание 9.2 Для объяснения переменной «заработная плата» была предложена следующая модель: у, = Q& + avxu + az-X2t + £t, (9.2) где yt - логарифм совокупной заработной платы; хи - количество лет обу- чения; X2t - ОПЫТ работы; £l--(0, о^). Выборка составлена таким образом, что номера от 1 до 100 соответст- вуют женщинам, а со 101 по 300 - мужчинам. Требуется: 1. Предложить два способа представления нулевой гипотезы, что зара- ботная плата мужчины для данного уровня образования и опыта работы выше, чем у женщины с такими же характеристиками. 2. Проверить гипотезу, что коэффициенты уравнений типа (9.2), по- строенных отдельно для подвыборок мужчин и женщин, совпадают. Из- вестно, что в модели для женщин сумма квадратов остатков равна 0,13, а для мужчин — 0,33. Оценка МНК по всей выборке дает сумму квадратов остатков 0,6. 372
3. Предложить способ тестирования гипотезы, что заработная плата зависит от размера фирмы, причем от размеров фирмы линейно зависит коэффициент аи: «if=Ao+AiZr. 4. Показать эквивалентность МНК-оценок коэффициентов ai и Oz в модели fl; для 1 Ti\ [0; для Г1+1,...,Г и в модели, построенной отдельно для двух подвыборок r=l,...,ri; г=Г1+1,...,Г. Задание 9.3 Имеется линейная однофакторная регрессионная модель yt^oo-^au-xt, (9.3) в которой неизвестные параметры меняются в случайном порядке an=ai+eif, / = 0,1; где cCi - нестохастическая величина и ,9 fO; t Ф г; Требуется показать, что эту модель можно интерпретировать как ли- нейную регрессионную модель с гетероскедастичным остаточным членом. Задание 9.4 На основании квартальных данных с 1993 по 1997 г. с помощью МНК было получено следующее уравнение регрессии: yt = 1,14 - 0,01 \\хи - 5,478-Х2г + 0,0432.;сзг. Регрессионная сумма квадратов равна 112,44, а сумма квадратов ос- татков - 22,78. Требуется: 1. Проверить гипотезу о наличии сезонности, если при добавлении в уравнение трех фиктивных переменных, соответствующих трем первым кварталам года, регрессионная сумма увеличилась до 120,75. 2. Проверить гипотезу о наличие структурного изменения между вто- рым и третьим кварталами 1995 года, если при раздельном проведении двух регрессий на основании данных с первого квартала 1993 г. по 2-й квартал 1995 г. и с 3-го квартала 1995 г. по 4-й квартал 1997 г. были по- лучены суммы квадратов остатков соответственно 11,44 и 2,75. 373
ГЛАВА X Эконометрические модели со специфическими переменными в эконометрических исследованиях иногда приходится учитывать взаимосвязи не только между количественными характеристиками рас- сматриваемых явлений, объектов, но и принимать во внимание различия в их качестве. Качество, например, может быть выражено статусом объ- екта, его принадлежностью к какой-либо группе, наличием или отсутст- вием у него определенных свойств, стохастическим (вероятностным) характером их проявления и т.п. В этих и некоторых других случаях ка- чество может быть выражено специфическими показателями, в частно- сти, порядковыми числами, вероятностями, дихотомическими перемен- ными (О или 1) и т.д. При этом такие показатели могут выражать уровни как зависимых, так и независимых переменных эконометрической мо- дели. К специфическим переменным могут быть отнесены и переменные, значения которых измерены с ошибками. В частности, ошибка может возникать из-за использования выборочных средних вместо средних по генеральной совокупности (при измерении спроса, дохода и т.п.), данных экстраполяции вместо измеренных значений, наконец, при использовании неточного инструментария измерения и в целом ряде других случаев. Включение в эконометрическую модель специфических переменных часто ведет не только к изменению ее вида, содержания, но и может соз- дать определенные проблемы при получении оценок ее параметров. В данной главе будут рассмотрены особенности построения эконометриче- ских моделей, содержащих некоторые виды таких специфических пере- менных. 10.1. ЭКОНОМЕТРИЧЕСКИЕ МОДЕЛИ С ОШИБКАМИ В ПЕРЕМЕННЫХ В общем случае следует разделять три ситуации, связанные с ошибками переменных эконометрической модели: ошибки имеют ме- сто у зависимой переменной, у независимых переменных и у тех и 374
других вместе взятых. Рассмотрим возможные последствия этих оши- бок с точки зрения проблемы получения «качественных» оценок пара- метров модели. /. Ошибки измерения зависимой переменной у Представим нелинейную эконометрическую модель в векторно- матричной форме записи у=Ха^е, где, как и ранее, X - матрица значений независимых факторов размера 7><(/1+1), а- вектор коэффициентов модели, состоящий из л+1 компонен- ты, а f - вектор ошибки модели, обладаюищй «классическими» свойства- ми, Со\(ё)=6^'Еу ошибки и факторы независимы. В отношении вектора у будем предполагать, что его компоненты, яв- ляющиеся истинными значениями переменной >^ в моменты ^=1,2,...,Г; из- мерены с ошибкой Uf и данные измерений представлены в виде следую- щих сумм: у^=3^^+и^, j = j + ii, (10.1) где у^ - измеренное значение зависимой переменной в момент Г, а м^ - ошибка, допущенная при измерении этого значения. Соответственно у характеризует вектор измеренных значений зависимой переменной, а и - вектор их ошибок. С учетом (10.1) эконометрическую модель можно представить в сле- дующем виде: у=Х-а¥(е^и). (10.2) Дальнейшие выводы зависят от свойств ошибки и. Логично предпо- ложить, что вектор и и столбцы матрицы X (значения факторов модели) независимы, и что математическое ожидание ошибки и равно нулю: Л/[|/]=0, и в ряду Ut отсутствует автокорреляция. В этом случае очевидно, что привнесение ошибки измерения зависимой переменной ведет лишь к увеличению дисперсии модели, поскольку она при независимости оши- бок €t и Ut определяется следующим выражением: 0^=ct/+cTu^ (10.3) Наличие у ошибки щ каких-либо свойств, отличающих ее от «белого шума» или характеризующихся ее статистическими взаимосвязями со значениями параметров JC//, приводит к тому, что аналогичные свойства появляются и у суммарной ошибки модели (10.2). В этом случае при 375
оценке ее параметров необходимо использовать соответствующие методы (обобщенный МНК, метод инструментальных переменных). Если математическое ожидание ошибки и отлично от нуля (случай систематической ошибки измерений), то очевидно, что использование, например, МНК при оценке параметров модели (10.2) приведет к сме- щенным оценкам, поскольку в этом случае математическое ожидание вектора ошибок оценок параметров {Х-Х)~^-Х{е^и) будет отлично от ну- ля, так как В силу M[w]9t0. Однако если величина сме- щения ошибки и известна, то корректировкой исходных данных зависи- мой переменной yt на ее величину несложно перейти к исходным услови- о о о ям задачи, когда М[м] = 0, м = м-М[м], где и - скорректированная ошибка зависимой переменной. 2. Ошибки измерения независимых переменных xi, i=ly2,..., п Предположим, что истинные значения независимых переменных рав- ны Xit, а их измеренные значения равны .т.,, и связь между ними опреде- лена следующим выражением: где v,7 - случайная ошибка измерения /-й переменной в момент Г, /=1,2,..., п\ ^=l,2,..., Т. В отношении этой ошибки будем предполагать, что ее математическое ожидание равно нулю, дисперсия (постоянная по времени) равна <т^., для каждого i во временном ряду ошибки Vu отсутствуют автокорреляцион- ные связи и ошибки измерения различных параметров независимы между собой, т.е. cov(v/, Vy)=0. Соответствующие матрицы значений независимых переменных в этом случае связаны следующим образом: je = A:+V, (10.5) где Я иХ- матрицы измеренных и истинных значений независимых пе- ременных соответственно, а V- матрица ошибок измерения. В этом случае при использовании данных измерений независимых пе- ременных эконометрическая модель может быть представлена в следую- щем виде: y^X-oKe-Vd), (10.6) где f-V-flr представляет собой вектор ошибки такой модели. Оценивая коэффициенты модели (10.6) с помощью МНК, получим 376
(10.7) (10.8) где a - вектор оценок коэффициентов модели (х. Из выражения (10.7) непосредственно следует, что свойства оценок а определяются вторым слагаемым его правой части. При этом несложно убедиться, что, в частности, оценки а являются асимптотически сме- щенными (а значит и смещенными при конечном объеме выборки Т) и несостоятельными. Заметим, что при ограниченной выборке, т.е. значение Т конечно, ма- тематическое ожидание разности векторов параметров модели и их оце- нок определяется следующим выражением: Даже при условии независимости истинных значений факторов хц и ошибки St, второе слагаемое правой части этого выражения отлично от нуля. Чтобы показать это, выразим одну из матриц X' из (10.8), с учетом ее вида (10.5). С учетом независимости jc и б; jc и V и нулевых математи- ческих ожиданий ошибок f и V, получим M[a-a]=M[ix1cr')(x +vY-€-M[x'xr\x +vyv а]= M[X'X''V'Va]4tO, (10.9) поскольку математическое ожидание произведения матриц VV не равно нулю. В частности, при отмеченных выше свойствах ошибки V несложно по- казать, что /т2 MiyV] = Vl о ^■лУ где дисперсия ошибки измерения i-ro фактора может быть определена следующим выражением Г-1 377
а нулевой элемент на главной диагонали характеризует нулевую диспер- сию единичного столбца матрицы X . Для модели с центрированными переменными в случае одной незави- симой переменной несложно показать, что величина смещения определя- ется следующим вьфажением: Co\[(€-vai)\k]=M[(€-vaiyix +v)]=^av M[v'v]=-avay^, (10.11) о о где X, X — векторы центрированных измеренных и истинных значений независимой переменной соответственно; v — вектор ошибки измерения независимой переменной; o^j^ — дисперсия этой ошибки, ai - параметр модели, которая в данном случае имеет следующий вид: о о у^ =ai'Xt+€f, Наличие или отсутствие свойства состоятельности у оценок а (в предположении, что существует предел по вероятности вторых моментов измеренных значений переменных х,-, т.е. рИт[1/Т(Х'Х )]^ и предел по вероятности вторых моментов ошибки измерений рИт[1/Г(КУ)]9Ю) за- висит от равенства (или неравенства) нулю предела plim[l/r- X' (a-V-o^], где, напомним, обозначение plim характеризует предел по вероятности при Т-^оо (см. раздел 1.5). Несложно заметить, что это выражение преоб- разуется к следующему виду: plim[l/r-(X') (6-Vci)]= рИт(1/Т(Г•ё)У-р1Ы1/Т(X''V)]a При предположении об асимптотической независимости (т.е. при Г-^оо) ошибки е, измеренных значешш факторов и ошибок их измерения получим plim[l/r- (X' • V)]=plim[l/r(jr-V)]+ рИт[1/Г- (Г-V)]= plim[l/r- (Г-V)]. Откуда следует, что асимптотическое смещение оценок параметров эконометрической модели с ошибками измерений независимых перемен- ных определяется следующей формулой: plim[a -£^=-plim [1/Г- {Х1( Т^]- plim[l/r- (V-V)]a (10.10) Очевидно, что правая часть этого выражения не равна нулю, посколь- ку пределы plim [1/Г- (Х'Х )"^] и рИт[1/Г- (VV)], по определению сущест- вуют и второй из них представляет собой асимптотическую ковариаци- онную матрицу ошибок измерений. Поскольку оценка а — смещенная для конечных значений Г и несо- стоятельная, то очевидно, что она и асимптотически смещенная. 378
3. Ошибки измерения зависимой переменной у и независимых пере- менных, Xj, 1=1,2, ..•, п Несложно заметить, что при наличии ошибок измерения у зависимой и независимых переменных эконометрическая модель может быть пред- ставлена в следующем виде: y^X-oHehu-V-oi), (10.12) где € - вектор ошибки истинной модели; и - вектор ошибки измерений зависимой переменной, V - матрица ошибок измерений независимых пе- ременных. Даже при вполне естественных предположениях о взаимной незави- симости ошибок £; II и V, истинных значений переменных xi и этих оши- бок, используя примененные в двух других случаях подходы, можно по- казать, что: а) дисперсия такой модели увеличивается по сравнению с моделью, исходные данные которой измерены без ошибок; б) использование обычного МНК дает смещенные оценки ее парамет- ров. В частности, заметим, что дисперсия модели (10.12) при этих предпо- ложениях определяется следующим выражением: c^=M[(^fм-V- d)'iehu-V- ci)]=M[(^- еЩи-иМcl V- V- а)]= =стЛс7Ла^^ (10.13) а величины смещения при конечном Г и при Г—>«> определены выраже- ниями (10.9) и (10.10) соответственно. Как следует из полученных выше результатов, наибольшие трудно- сти при построении эконометрических моделей с ошибками в исходной информации на основе обычного МНК возникают в случае наличия ошибок измерений у независимых переменных. Они связаны с необхо- димостью устранения смещения в получаемых оценках. Основным ме- тодом, который получил достаточно убедительное теоретическое обос- нование и широкое распространение в практике эконометрических ис- следований в таких случаях является «метод инструментальных пере- менных». Как следует из результатов раздела, сформировав матрицу Z значений инструментальных переменных, некоррелированных как с ошибкой «ис- тинной» модели е, так и с ошибками измерения независимых переменных V, но имеющих ненулевую корреляцию с измеренными переменными JC/, состоятельные оценки параметров моделей (10.6) и (10.12) получим со- гласно следующему вьфажению: 379
ar = (z'.J?)-i.z'.j. (10.14) Напомним, что этот результат в данном случае следует из представле- ния, например, модели (Ю.б) с инструментальными переменными в сле- дующем виде: Z'y^Z' X ^a^rie-Vci), (10.15) где слагаемоеZ'(e-Vod характеризует вектор ошибки этой модели. Несложно показать, что вектор ошибок оценок параметров модели (10.15) определяется следующим выражением:. Aa = (Z'-^).[Z'(f-Va)]. (10.16) При оговоренных свойствах инструментальных переменных несложно увидеть, что математическое ожидание ошибки АЯ равно нулю, т.е. М[ М ]=0, а ковариационная матрица ошибок определяется выражением: Соу(М) = Л/[М,М'] = M[(Z'-^)-^Z'.(£-V.a)(£'-a'V')Z.(Z^)-4. (10.17) В условиях независимости ошибок ей Vвыражение (10.17) приобре- тает следующий вид: CoYiMMZ'Xf-r [Coy(e)'^M(VadV)lZ(Zllr^. (10.18) где M(Vao(-V) является ковариационной матрицей вектора Va, т.е. M(Vcfc('V)=Coy(Voi). При условии отсутствия корреляционных связей у ошибок £1 и v/r и не- зависимости ошибок измерения уц, vjt, ii^j несложно увидеть, что выраже- ние (10.18) приобретает следующий вид: Соу(£)+М(УчУ(^Г)=а/£+а;;^^г=((т/ +о^^)£, (10.19) где ai^ - взвешенная по параметрам а дисперсия независимых перемен- ных, определяемая в условиях независимости ошибок vu и у/, следующим выражением: ^v'=:r^*2:i(^iv,r)^ (10.20) Г-п-1 ^ I В этом случае ковариационная матрица оценок параметров модели (10.15) будет иметь следующий вид: Coy{u)^{(Tl+G^)'{ZXy^{r'Z)'{X''ZrK (10.21) На практике при известных оценках параметров 8 сомножитель (т/+о;,^=о^ может быть определен на основе следующего выражения: 380
^^ ^(TJ +(т2 =_L_.(y, -XsY'iyt -^ Ю . (10.22) Асимптотическая несмещенность и состоятельность оценок а, полу- ченных с использованием инструментальных переменных z на основании выражения (10.14), вытекает из предполагаемой их независимости в пре- деле при Т-^оо с ошибками £ и V, и конечных перекрестных предельных моментов с измеренными значениями переменных xt, т.е. Jt^^, а также не- зависимости и отсутствии автокорреляции у ошибок г и V. Иными слова- ми, матрица Z и ошибки ей V должны обладать следующими предель- ными свойствами: рНт[(1/Г.(г^)]=(т/; plim[(l/r. (r.V)]=o^^ plim[(l/r.(^£yV)]=0; plim[(l/r. (Z'.£)]=0; plim[(l/r- (rVd)]^\ (10.23) plim[(l/r(Z'-J?)]=l2j? ''O; plim[(l/r (Z'- Z)]=Z^9^. С учетом (10.23) для выражения (10.16) несложно показать, что plim[ М ]=plim[ Ла -0^=0, а ковариационная матрица оценок М в преде- ле определяется следующим выражением: Cov(M) = lplim[r.(Z';er'x ^^^^^ xZ'(e-V-or)-(e'-a'-V')-Z-(ZOe)-'] Учитывая, что plmljZ'ie-V-ayie'-a'V)! | = р1"п[7 = (0-|+<r2).plmJ—Z2 =o-2plim(Z7), получим следующее выражение для асимптотической матрицы автокор- реляций ошибок вектора а: Cov(M) = -<T2.3:^Iz2:ix> (10.25) которое на практике заменяется выражением (10.21). В разделе 3,3 отмечено, что основным недостатком использования инструментальных переменных при оценке параметров эконометриче- ских моделей является увеличение дисперсий этих оценок. Их дисперсии 381
увеличиваются пропорционально сниэюению силы статистической взаи- мосвязи факторов Xi и соответствующих инструментальных перемен- ных Zi- При высокой корреляции между этими переменными сниэ/сение эффективности не столь значительно. Напомним, что увеличение дисперсии оценок при слабой коррели- рованности переменных ц и jc,-, как и ранее, объясняется уменьшением диагональных элементов матриц (Z'X) и (AT'Z), а следовательно, и рос- том соответствующих показателей их обратных матриц, что ведет к росту диагональных элементов в матрице Cov(a) (см. выражение (10.21)). Таким образом, при выборе инструментальных переменных долэ/сно соблюдаться следующее правило: переменные ц должны коррелировать с измеренными значениями факторов Зс,-, но быть статистически не связанными с ошибками их измерения V/. Ранее в разделе 8.4 было показано, что такими свойствами обладают «сглаженные» значения переменных Зс,-, т.е. Зс,, определенные на основе аппроксимирующих функций Зс,- =^iv/. О» ^/ =^0> где Wi - набор новых переменных, определяющих тенденции развития фактора х/, а Г - фактор времени. В отсутствие таких «сглаженных переменных» удовлетворительные результаты можно получить,.используя в качестве инструментальных значений переменных ц ранги соответствующих переменных Зс,, т.е. числа типа 1,2,3,..., характеризующие порядковые номера уровней этих переменных в их ранжированном ряду. Иными словами, 1 при- сваивается значению Цт» если переменная х.^ принимает наименьшее значение в ряду переменных xi при г=1,2,....,Г; значение Zjit=2, если значение хц^ является наименьшим среди всех оставшихся значений переменных и т.д. 10.2. МОДЕЛИ С ФИКТИВНЫМИ НЕЗАВИСИМЫМИ ПЕРЕМЕННЫМИ Фиктивные переменные вводятся в эконометрическую модель обычно с целью учета воздействия качественных аспектов на закономерности развития рассматриваемых процессов. К таким аспектам, например, от- носится различие в условиях развития процессов, предопределивших раз- ницу их уровней в разные периоды времени при сохранении их общих тенденций (см. рис. 10.1). 382
На рис. ЮЛ показано, что в период (О, ГО для развития процесса была характерна тенденция (1), а в период (Г1+1, Гг) - тенденция (2) (например, до дефолта и после дефолта, если дефолт не повлиял на характер самой тенденции). При этом динамические характеристики этих тенденций (темпы роста, первая производная) совпадают. Рис ЮЛ. Пример различий в условиях развития процесса Если не принимать во внимание отмеченные различия и попытаться построить единую, обобщенную модель для периода (О, Гг), то, очевидно, что ее уравнение будет соответствовать пунктирной линии, проходящей между сплошными линиями, характеризующими реальные тенденции процесса в рассматриваемых периодах. Из рис. (10.1), в частности, также вытекает, что если эконометрическая модель строится только на основе информации первого периода, то ее уравнение будет иметь следующий вид: Уг=ао&Ясс.х)-\-е^, (10.26) а, если только по информации второго периода, то У{=а^+Яа,х)+е^, (10.27) Отличаются эти выражения, если не принимать во внимание возмож- ные различия в их ошибках, только величиной свободного коэффициента, т.е. Оо. Если ввести фиктивную переменную ль/, /=1,2, со следующими свой- ствами: 383
•^01 ■^02 - [1, В первый период; О, во второй период; {О, в первый период; 1, во второй период; то выражения (10.26) и (10.27) могут быть объединены в рамках одной модели следующего вида: Уг^схоу ^01+^2-^02+/(а; x)-\-et. (10.28) Матрица исходных данных для такой модели будет иметь следующий вид: 1 О л: = 1 о о 1 о 1 (10.29) 10 и Xit - матрица значений основных независимых переменных модели, /=1,2,..., п; Г=1,2,....,Г2. Очевидно, что в этом случае условное математическое ожидание пе- ременной;; будет иметь следующий вид: М\у\ xi=l, JC2^, Хи]=аы+Ло^ х) для Г=1,2,..., Tf, и М\у\ xi^, Х2=1, Хи]=ао2+Л(Х, jc) для г= Ti+l,..., Т^ Заметим, что для рассматриваемого случая может быть предложена и другая модификация модели (10.28), например, с одной фиктивной пере- менной (пусть хо2), но содержащая свободный член. Ее вид определен следующим уравнением: yt=ao +схотХо2+Л(Х, Jc)+£^, (10.30) и матрица исходных данных для такой модели примет следующий вид: (I 0] х = 1 о 1 о 1 1 1 1 (10.31) 384
Вместе с тем несложно увидеть, что введение свободного члена в мо- дели (10.28) невозможно, поскольку следствием этого является появление единичного столбца в матрице (10.29), что влечет за собой ее необрати- мость, поскольку единичный столбец представляет собой линейную ком- бинацию столбцов значений фиктивных переменных. Модели типа (10.28) и (10.30) легко могут быть сформированы и на случай большего числа групп фиктивных переменных. Они могут вы- ражать определенные временные периоды (например, с целью учета сезонности), статус объекта и т.п. В частности, в рассматриваемой в первой главе модели заболеваемости такие переменные могут выра- жать время года (весна, лето, осень зима), половозрастную группу на- селения (взрослые и дети, мужчины и женщины). В этом случае вво- дятся две группы переменных - временная и половозрастная (всего во- семь). Обозначим эти переменные как ^ь зг, 5*3, s^\ qi, ^2» ^з» Ял- При этом {1, если наблюдения относятся к / - му времени года, / = 1,2,3,4; О, в остальных случаях; [1, если наблюдения относятся ку-й половозрасной группе, j = 1,2,3,4; [О, в остальных случаях. Тогда эконометрическая модель типа (10.28), описывающая заболе- ваемость в регионе в зависимости от условий жизнедеятельности, време- ни года и половозрастной группы индивидуума, может быть представле- на в следующем виде: yt =^01 ••^1 +^02 '^2 +^03 ••^3 +У^02 'Я2 +>^03 Яз + + У^04-^4+£^/-^.г+^г» (10-32) 1=1 где Xit - факторы жизнедеятельности. Оставление свободного члена в модели заболеваемости, как и в моде- ли (10.30), приведет к уменьшению числа ее фиктивных переменных. В этом случае выражение (10.32) преобразуется к виду: У( =^0 +^02 •'^2 +^03 '^3 +^04 ••^4 +>^01 'Я\ + Ро2 'Я2 +)^03 Яз + + >^04 -^4+1^/ '^it +^/ ' (10.33) /=1 При этом для первого временного сезона и первой половозрастной группы получим ao=cxoi'^fioi. Модели типа (10.32) и (10.33) корректны, если все группы населения одинаково реагируют на изменение условий жизнедеятельности и, кроме 13 Эконометрика 385
того, заболеваемость характеризуется параллельными сдвигами со сме- ной времени года. В этой связи модели типа (10.28), (10.30) могут быть интерпретирова- ны как сплайн-функции, у которых зависимая переменная у одинаково и «монотонно» реагирует на изменения «количественных» независимых переменных jc/ на всех рассматриваемых временных интервалах и скачко- образно меняется при смене интервала. Вместе с тем фиктивные переменные могут быть применены при по- строении сплайн-функций любой модификации. Рассмотрим следующий пример. Пусть зависимая переменная у характеризует уровень дохода, а единственная переменная х - возраст индивидуума. Предполагается, что в различных возрастных группах доход определя- ется специфическими формами зависимости следующего вида: у = л&Ча1°-д^,дс<20; у^а^^ах 'хЛ^<х<30; (10.34) у = аь^ + а\ -дс, дс>30. Введем фиктивные переменные d\ и d^ такие что rfi=l, если дс>20, и ^2=1, если дг>30. Тогда три уравнения из выражения (10.34) могут быть объединены в одно, следующего вида: y^a^-\-a\^X'\-o^^dx\-a\'dYX-¥a^'d2'^a\-drx^e, (10.35) Заметим, что коэффициенты наклона на рассматриваемых участках согласно выражению (10.35) определяются следующим образом: а\, если X < 20, ахл-ах, если 20 < х < 30; (10.36) ос\Л-а\Л-а\, если х > 30. а свободные члены должны удовлетворять условию равенства функции у соответствующих участков х=20 и л:=30. Исходя из этого получим (бй^ль^)+(аЛбГ1^>30=(б1Ь^+б4&Чоь^^:^Л«Аа1^)-30. (10.37) Выражение (10.37) определяет систему линейных ограничений на ко- эффициенты модели (10.34) следующего вида: аьЧаЛ20=0 => (2&^=-20-аЛ аь^+бГ1^-30=0 => ao^=>-30ai\ (10.38) Подставляя ограничения (10.38) в (10.35), получим рассматриваемую модель дохода как сплайн-функцию в следующем виде: y=ab^+ai°jc+ab^rfi(jc-20)+ai^d2(Jc-30)+£; (10.39) 386
где, напомним, rfi и ^2 - фиктивные переменные, принимающие значения 1 на втором и третьем возрастных интервалах соответственно, и О - в противном случае. В «фиктивной» форме может быть выражена и зависимая переменная. Такая ситуация имеет место, например, при проведении социологических опросов, когда их результат может быть представлен двумя ответами «да», «нет» (1 или 0) (предполагаемая покупка автомобиля, дачи; желание иметь ребенка в семье и т.п.), а влияющие на этот результат факторы вы- ражаются в произвольной форме (количественные характеристики - уро- вень дохода, жилая площадь и т.п., качественные характеристики - уро- л вень образования и т.д.). Тогда расчетные значения у , определенные по модели при различных комбинациях значений независимых переменных дс/, можно интерпретировать как оценку условий вероятности события у при фиксированных значениях X/, /=1,2,..., я. 10.3. МОДЕЛИ С ДИСКРЕТНЫМИ ЗАВИСИМЫМИ ПЕРЕМЕННЫМИ Как следует из рассмотренного в предыдущих разделах материала, в эконометрических исследованиях обычно предполагается, что результи- рующий показатель у^ является количественной величиной, которая в принципе может принимать любые значения на множестве действитель- ных чисел. Однако в экономических и социальных исследованиях часто приходится сталкиваться с разного рода ограничениями на значения за- висимой переменной. В частности, зависимая переменная может прини- мать только целочисленные значения: О, 1,2,... Примерами таких зависи- мых переменных являются: 1а. Семейное положение, которое выражается следующими катего- риями (и соответствующими целыми числами): - холост (1); - женат (2); - вдовец (3); - разведен (4). 16. Альтернативные товары, между которыми выбирает покупатель, и которые представляются следующими числами: -марка А(1); - марка Б(2); - марка В(3); .3* 387
- марка Г(4); - прочие марки(5). Очевидно, что в обоих случаях числа служат только для разграниче- ния понятий. Расстояние между двумя числами не имеет никакого значе- ния. 2а« Оценки, полученные на экзамене: - отлично(5); - хорошо(4); - удовлетворительно(3); - неудовлетворительно(2). 26. Классы гостиниц: -пятьзвезд(1); - четыре звезды(2); - три звезды(З); - две звезды(4) и т.д. В случаях 2а и 26 (в отличие от 1а и 16) понятия естественным обра- зом упорядочены, и характеризующие их числа отражают этот порядок. Но различия между 1 и 2 понятиями не обязательно столь же сильные, как между 2 и 3 и т.д. 3. Число предприятий, обанкротившихся в текущем году (0,1,2,..). Так называемые счетные данные (count data). При представлении значений зависимой переменной в целочисленном виде эконометрическая модель, связывающая эти значения с соответст- вующим набором независимых факторов, имеет специфическое содержа- ние. Обычно такая модель определяет вероятность осуществления собы- тия, заключающегося в том, что при известных уровнях независимых факторов зависимая переменная примет конкретное значение j из задан- ного набора значений7=0,1,2,.... Содержательное уравнение такой модели выглядит следующим образом: Вероятность(событие7 произойдет)= =Вероятность(У=/)=Д параметры, факторы). (10.40) Модели с дискретными зависимыми переменными могут быть клас- сифицированы в зависимости от: а) типа переменных; б) выбранного закона распределения. В свою очередь, внутри выделенных групп может быть развернута бо- лее подробная классификация в зависимости от более детальных свойств классификационных признаков. Эти детальные группировки будут рас- смотрены по ходу дальнейшего изложения материала. 388
в научной литературе в зависимости от типа переменных модели с дискретными зависимыми переменными разделяются на модели выбора среди конечного числа альтернативных вариантов (примеры 1а,1б,2а,2б) и модели счетных данных (пример 3). В зависимости от числа вариантов, среди которых осуществляется вы- бор, различают модели бинарного выбора и модели множественного вы- бора. В отличие от моделей множественного выбора в моделях бинарного выбора результирующий показатель может принимать только два значе- ния: О и 1. К моделям множественного выбора относятся модели с неупорядо- ченными (примеры 1а, 16) и упорядоченными (примеры 2а, 26) альтерна- тивными вариантами. Рассмотрим особенности формализованного представления экономет- рических моделей с различными видами дискретных зависимых перемен- ных более подробно. lOJ.l. Модели бинарного выбора Модели бинарного выбора широко используются в экономических и сощ1альных исследованиях, особенно в экономике труда, при проведении анализа на микроуровне. Покажем их спещ1фические свойства на примере модели трудовой активности населения, исходные предпосылки которой состоят в следующем. Индивидуум в определенный период времени может работать или искать работу (у=1) или не делать этого (у=0). Предположим, что состояние <фаботать» или «не работать» определяется набором факто- ров (возраст, семейное положение, образование, опыт работы и т.д.), и со- ответствующие вероятности можно представить в следующем виде: Р(у=1)=Р(Ых); Р(у^)=1^Р(Ых1 (10.41) Вектор коэффищ1ентов а отражает влияние факторов, например, ха- рактеризующих положение индивидуума в обществе, на рассматривае- мую вероятность. Одной из основных проблем при построении моделей бинарного выбо- ра является обоснование функционала F(a^x). Например, предположим, как и в случае «классических» эконометрических моделей, что вероятно- сти соответствующих событий могут быть представлены в виде линейной функщш от значений рассматриваемых факторов: F(fl^x)=fl^jc=ab+aiJCi+...+ayrn, (10.42) где Q&, дгь.... On - параметры модели; д^ь..., jc„ - значения независимых факторов. 389
Тогда, приняв у^ М[у^1г J=F(flfX/), соответствующую эконометриче- скую модель можно представить в следующем виде: yt =A4\yt \х t]+(yt -Mbt \х t])=o(x t +f г. (10.43) л где M\yt\x J= y^ - условное математическое ожидание переменной yt при условии, что вектор независимых переменных равен jc ^ Линейная форма модели представляет определенное удобство для рас- крытия содержания входящих в нее слагаемых. Прежде всего заметим, что между их значениями выполняются следующие соотношения (см. табл. 10.1). Таблица 10.1 yt 1 0 Р(ур...)=>!, a'xt akt £t \-otki(c вероятностью otXj) -(X^Xt(c вероятностью l-(X^Xt) Из табл. 10.1. следует, что ошибки £^ модели (10.43) имеют следующие характеристики: М[£^]=Ых,(1-Ыхд+ (l-afjc,)( -c^jc,)=0; 0[8^\хг\=Ых^1-Ых^+(1-Ыхд(-Ыхд ^= =dxt(l-dxt)(l-dx,-^dx,)=^x^l-^xt). (10.44) где D[€t\xt\ - условная дисперсия ошибки St при условии, что вектор неза- висимых переменных равен х ^ Рассмотрим в качестве критерия выбора оценок параметров модели (10.43) минимум суммы дисперсий ее ошибок £j: t=\ r=l /=1 +'^(l-^(/x,)(-(/x,f =Y,a\(\-a\) = '^D[e,\x,]-^min, (10.45) r=l t=\ r=l Используя MHK для оценки параметров модели (10.43) при критерии (10.45), получим следующую систему «нормальных» уравнений, относи- тельно неизвестных оценок ао, ai,..., ani л 2 -ч да да п t 390
Выполнив дифференцирование с учетом попарной независимости ко- эффициентов между собой и со значениями факторов х^, /=1,2,.-Т, эту систему можно представить в следующем виде: t t «ol-^лг +--- + «lZ^l/ '^nt +--- + 2л„Х^лГ =1-^- nf в свою очередь, последняя система может быть представлена в век- торно-матричном виде следующим образом: ( 2Т Z^U I^m ], ^ f Т ^ t I Г^о 1 I ^ nt \t t t или в компактной форме записи как Ха=г, ^ 27 1д:1, ^1 v^/iy V/ J (10.46) где матрица Z = I^U 214 V t t t t 2E4 (10.47) и вектор-столбец z = T,2^xi(,,,.,2^x^ Из выражения (10.47) непосредственно вытекает, что неизвестные оценки параметров бинарной модели линейного типа могут быть получе- ны на основании следующего выражения: a=r^-Z, (10.47) Однако линейная интерпретация (10.42) закона распределения вероят- ностей достаточно «неудобна» по своим <оконометрическим следстви- ям». Во-первых, заметим, что из выражения (10.44) вытекает, что ошибка е гетероскедастична, поскольку дисперсия ошибки зависит от вектора х. В 391
таких условиях оценки параметров or модели (10.43), полученные на ос- нове выражения (10.48), являются неэффективными. Для получения эф- фективных оценок ее параметров, необходимо использовать обобщенный МНК. Во-вторых, любой метод оценки параметров линейных моделей би- нарного выбора не дает Гарантий, что результат произведения dx может принимать значения только на интервале [О, 1]. С учетом выражения (10.44) несложно заметить, что при отрицательных значениях этого про- изведения и значениях больше единицы будет иметь место и другой аб- сурдный результат — отрицательная дисперсия остатков. Это обстоя- тельство существенно ограничивает область применения линейной моде- ли бинарного выбора. На практике она используется только для предва- рительной обработки данных и для сопоставления с результатами, полу- ченными более тонкими методами. Из приведенных рассуждений вытекает, что модель бинарного выбора должна удовлетворять двум условиям: lim /'(У = 1) = 1 lim Р(У = 1) = 0, (10.49) где fl^jc—>4оо - область значений д:, при которых Р(у=1)=1, а dx > сю - об- ласть значений JC, при которых Р(у=1)=0. При этом между значениями составных частей регрессионного урав- нения должно выполняться следующее соответствие (см. табл. 10.2). Таблица 10.2 1 •*'' 1 1 1 0 Пу t =..:) = у t До*,) 1-F(a4,) £t 1 l-f(ai,) 41-F(ai,)) 1 Условиям (10.49) отвечает, например, функция F{dx\ близкая к зако- ну нормального распределения, график которой представлен на рис. 10.2. Ее использование позволяет снять рассмотренные выше ограничения мо- делей бинарного выбора. Модели с функционалом, обладающим свойст- вом «нормального закона», в литературе получили название probit- моделей: P(Y = 1) = l^(p(u)du = Ф(ах). (10.50) 392
где Ф(.) - функция стандартного нормального распределения, зависящая от зкачений факторов jc и параметров а; (f^u}- функция плотности рас- пределения стандартной нормальной переменной и. В предположении о независимости и гомоскедастичности ошибок St функцию (f(u) можем записать в следующем виде: 1 f 1(у,-(/х,)Ь,-а'х,)^ (р((/х,)= .— -ехр жа >н^ ( л/гя-ст -ехр ^Y- г\ (10.51) (/ в вьфажении (10.51) является неизвестным параметром, который дол- жен быть оценен, как и вектор параметров а. ^ ]F(a'x) 0,75 0,25 РисЛОЛ. График функции закона распределения, близкого к нормальному Из выражения (10.51) вытекает, что между значениями независимой переменной у, и (f{olxi) выполняется следующее соотношение (см. табл. 10.3). Таблица 10.3 JL dJoCx^i _1 g^ ( 1 (-Or^X,)^(-Qr^JC,)^ 1 .ехрГ-1<1^:^4=^^ 393
Не менее широко в моделях бинарного выбора используется и логи- стическое распределение: Р(У = 1) = - \ + е Ых = Л(а'х). (10.52) где Л(.) представляет собой интегральную функцию логистического рас- пределения. Модели, построенные на его основе, называются togir-моделями. Не- сложно заметить, что в данном случае между составными частями регрес- сионного уравнения выполняется следующее соотношение (см. табл. 10.4). Таблица 10.4 1 -^' 1 1 0 P(yr=.^>yt ^Ых 1+г^' 1 1+е^*' £t 1 1 1 + ^«''' 1 l + e^''^ Вопрос о том, какое из вышеназванных распределений более подходит для практических исследований, остается открытым. На участке а^хе[-1,2; 1,2] оба они ведут себя практически одинаково. Однако вне этого участка, т,е, на хвостах распределения, значения функционалов Ф(а^х) и Л(а^х) имеют некоторые отличия. В частности, логистическое распределение имеет более «тяжелый хвост», чем нормальное. Практи- ка показывает, что при отсутствии существенного преобладания одной альтернативы над другой, а также для выборок с небольшим разбросом переменных, выводы, полученные на основе probit- и logit-моделей, как правило, совпадают. В общем случае из выражения (10.41) для модели бинарного выбора вытекает, что условное математическое ожидание зависимой переменной при заданном наборе факторов может быть определено следующим вы- ражением: Af\yt\xt]=0[l-F(dxd]+hF(c(xt)=F(dxt). (10.53) Одно из направлений использования результата (10.53) в анализе рас- сматриваемых явлений связано с оценками так называемого маржиналь- ного эффекта факторов, входящих в модель. Марэюинальный эффект фактора Хи, i=l,2,...,n; t=l,2,..,T показывает изменение функции F(a^t) (характеризующей вероятность того, что у=1) при изменении фактора Xit на единицу. 394
Маржинальные эффекты факторов Xt для модели бинарного выбора оцениваются на основе следующего выражения: ЬМ\Уг\хЛ1ЪхМЬ F{dxt)l д{Ыхд]а=Яс(хгУа, (10.54) где Д.) - плотность безусловного распределения, соответствующая инте- гральному распределению F(.), и дифференщфование осуществляется по вектору Xt. В частности, для нормального распределения маржинальный эффект рассчитывается по формуле dM\yt\xtybxf-(t^dxty о; (10.55) где ^.) - плотность стандартного нормального распределения. Для логистического распределения производная функщ1и этого закона по факторам Xt функция Дofjc,) имеет следующий вид: ЭЛ[^х,]/Эх^^^' /(1+ e'^^'f ^K{dxt)[\-K{dxt)l (10.56) Соответственно в tog/r-модели маржинальные эффекты определяются как ЪМ\уг\хгУЪхг^А{ЫхгУ[\-А.{с(хд\сс (10.57) Из выраэюений (10.54)-(10.57) вытекает, что величина марлсинально- го эффекта для probit- и logit-моделей зависит от значений независимых факторов X. В связи с этим полезно будет определить так называемый «средний маржинальный эффект» в области существования значений не- зависимых факторов. На практике возможны два подхода к его оценке. Первый основан на усреднении значений независимых факторов, т.е. сначала рассчитывают- ся выборочные средние всех факторов xi, /=1,2,..., п, а затем для оценки среднего эффекта определяется До^х)-о: В соответствии со вторым под- ходом маржинальные эффекты оцениваются для каждого наблюдения, за- тем по полученным оценкам этих индивидуальных маржинальных эф- фектов определяется его среднее значение. Поскольку функция (10.51) у рассматриваемых моделей непрерывна, то в соответствии с теоремой Слуцкого^ на больших выборках оба подхо- да будут давать один и тот же набор средних маржинальных эффектов. Но это неверно для малых выборок. Практика показывает, что в этом случае лучшие результаты дает второй подход, основанный на усредне- нии индивидуальных маржинальных эффектов. ^ Пусть каждая из последовательностей [х^] сходится по вероятности к константе: plim7_>oo х]^ =Ciy /=1,...,я, и пусть функция g непрерывна в точке (ci,..., cj. Тогда plimr_>oo 395
Заметим, что q>eAHHii маржинальный эффект бинарной независимой переменной (например, с) можно определить как следующую разность: Р[у=1\х*, с=1]-Р[у=1|]с«, с=0], где JF* - вектор выборочных средних значений остальных независимых переменных х. Обратим внимание на то, что результаты моделей бинарного выбора могут иметь разнообразное содержание. В частности, их можно проин- терпретировать в терминах выгоды или ущерба. Рассмотрим такую ин- терпретащоо на примере модели крупной покупки. Исходными данными (наблюдаемыми переменными) в этом случае являются сведения о покуп- ке (1 - покупка сделана. О-в противном случае) и факторы, характери- зующие субъекта, потребителя (доход, пол, возраст и т.д.). Далее предпо- лагается, что покупка имеет место, если она приносит выгоду потребите- лю, и покупка отсутствует, если такой выгоды нет, и даже возможен «ущерб» (например, покупка бесполезна). Ненаблюдаемую (латентную) выгоду, получаемую г-м потребителем от покупки, будем моделировать как переменную yt, определяемую сле- дующим выражением: у;=Аг'-х,+б^, (10.58) где а% в данном случае называется индексной фушщией (index fimktion); et - ошибка модели, в отношении которой делается предположение, что она имеет стандартное нормальное распределение с нулевым математи- ческим ожиданием и единичной дисперсией. Вероятность получения г-м потребителем выгоды от покупки может быть определена следующим образом: Р(у;>0)=Р(а ''Xt+€t>0)=P(€i>-a 'xt). (10.59) Если распределение симметрично (каковыми являются нормальное и логистическое), то выражение (10.59), можно представить в следующем виде: Р(у;>0)=Р(е<а ''Xt)=F(a 'хд. (10.60) В качестве примера модели типа (10.58)-( 10.60) рассмотрим модель мигращш, разработанную Нейкостином и Циммером (Nakosteen, Zimmer, 1980). В ее основе лежит предположение о том, что индивидуум прини- мает решение о переезде, если это приносит ему определенную выгоду, которая оценивается на основе сопоставления доходов в настоящем и «новом» месте его проживания, затрат на переезд. Доход ур*, который индивидуум может получить в данной местности настоящего проживания за год, определяется как 396
Ур -ахрЛ-бр, (10.61) где а - вектор значений параметров; Хр - вектор независимых перемен- ных, характеризующих индивидуума, например, возраст, образование, опыт работы, и т.д.; Ер - ошибка модели. Если индивидуум переезжает на новое место, то его доход ущ будет определяться согласно следующему выражению: Ут^Р'хп&ет, (10.62) где Р - вектор значений параметров; Хщ - вектор независимых перемен- ных, состав которых может как совпадать, так и не совпадать с составом компонент вектора Хр (включать, например, возможность получения бо- лее престижной должности); е^ - ошибка модели. Переезд связан с определенными затратами С, которые могут быть связаны линейной зависимостью со статусом индивидуума (предприни- матель, наемный работник, семейный или несемейный и т.д.): С*= /z+M, (10.63) где Z - вектор независимых переменных, характеризующих статус индивидуума; и - ошибка модели. С учетом вышеперечисленного выгода от переезда может быть пред- ставлена в следующем виде: М*=Ут- Ур' C'^fi'xm -а'хр -УгЧбт -^- u)^S'w^6. (10.64) где W - вектор независимых переменных, характеризующих индивидуу- ма, условия его жизнедеятельности в местах его жительства и т.п., кото- рые влияют на уровень доходов и затраты на переезд; е^е^ -Вр- и - ошиб- ка модели. В целом, вероятность переезда P(N=l) определяется следующим обра- зом: P(N'>0)=P{S'w'^e>0)=P{e>-S'w\ (10.65) Выражение (10.65) полностью соответствует выражению (10.59). Альтернативную интерпретацию данных об индивидуальных пред- почтениях дает модель случайной полезности (random utility model). Со- гласно этой интерпретации латентные (ненаблюдаемые) переменные предыдущей задачи, т.е. Ут и Ур, представляют собой полезности для ин- дивидуума двух выборов (переезэ/сать или не переезжать). В другом примере латентные переменные могут характеризовать полезность арен- ды дома и полезность владения домом. Статистика индивидуальных вы- боров, т.е. значения уг=1 и уг=0, дают возможность оценить, какая из аль- 397
тернатив имеет большую полезность при соответствующих наборах фак- торов, но при этом величина полезности остается неопределенной. Обо- значим полезность аренды дома через If, а полезность владения домом - через f/. Наблюдаемый индикатор yt равняется 1, если и равняет- ся О, если If <г/. Общая постановка модели случайной полезности выглядит следую- щим образом: lf=a'aX+ea, if^a'bX^Eb. (10.66) где % и flfe - различающиеся между собой векторы параметров модели; индексы а и Ь характеризуют варианты выбора. Тогда вероятность выбора варианта а (наблюдаемая переменная у принимает значение 1) определяется по следующей формуле: = Р\!<(Ха -ОьУх-^Еа -q;>01jc]= Р[дг x+f >0U:]. (10.67) На практике по известным значениям наблюдаемой переменной yt оценивается вектор с^(Ха-(Хь- Рассмотренные выше модели использовали так называемые индивиду- альные данные. Каждое наблюдение содержало набор значений [у^, xj, характеризующих реальный выбор отдельного индивидуума и соответст- вующий вектор независимых факторов. Вместе с тем часто при построе- нии моделей бинарного выбора используются групповые данные, кото- рые выражают результаты подсчетов или пропорций. Обозначим через kt количество индивидуумов, имеющих одинаковые значения характери- зующих их признаков (т.е. одинаковый вектор jc,). Индекс t в этом случае выражает различные векторы признаков Xt и соответствующие количества индивидуумов kt, обладающих ими. Пусть наблюдаемая зависимая пере- менная Л^, выражает долю индивидуумов, у которых yf=^\, в общем числе индивидуумов kt. С учетом этого информация для фиксированного ин- декса t выглядит как [kt, Nt, Xt], t=l,.,., Т. Для сгруппированных таким об- разом данных представим зависимость доли Nt от факторов-признаков, характеризующих индивидуумов г-й группы, в следующем виде: Nf=F(a'xt)-^et=;rfhet, М^]=0; D[€t]=7rt(l-^t)/kt, (1().68) где в качестве функции F(ofxt) обычно используются функции законов нормального и логистического распределений; щ - оценка доли N,; €t - ошибка модели. 398
в заключении раздела, посвященного рассмотрению моделей бинар- ного выбора, объясним происхождение терминов logit и ргоЫи Из выра- жения (10.68) следует, что дисперсия ошибки е гетероскедастична. По- скольку функция F(dxt) предполагается нелинейной, то для оценки па- раметров следовало бы применить нелинейный МНК с весами, однако можно предложить менее громоздкий подход к решению данной задачи. Для этого обозначим через F(Nt) значение интегральной функции закона распределения в точке Nt. Тогда можно показать, что обратное значение этой функции F'^iNt) допускает следующее представление^ или r\Nt)=Zi^a%'^Ut, (10.69) где Лл^У- значение функции плотности, соответствующей интегральной функции закона распределения F(.), в точке щ: uf^ejj{ni) - ошибка, обла- дающая следующими характеристиками: М[и,]=0; Если F{olxt) является логистической функцией, т.е. TCt =exp(flr'xr)/[l+ ехр(а'х,)], то несложно показать, что ¥-\щ )=1п[л} 1{\-щ)\^а%. (10.71) Функция типа (10.71) в научной литературе получила название logit-щ, В связи с этим модели бинарного выбора, в основе которых лежит логи- стическое распределение, обычно называют togft-модели. Для нормального распределения обратная функция Ф~^{щ) называется нормитоМ'Щ, Функция Ф'^л^) может принимать отрицательные значе- ния, обычно не превышающие -5. Чтобы избежать работы с отрицатель- * Функция F^\Nt) в окрестности точки Лi может бьпъ аппроксимирована с помо- щью ряда Тейлора: но Г\щ )=а^х„ а й¥'^{щ) ^ 1 ^ 1 dTCi dF{7Ut) / dJCt f{K^) Следовательно, 399
ными числами к значению функции на практике добавляется число 5. Функция {нормит-щ +5) получила название ргоЫг-щ, Поэтому модели бинарного выбора, основанные на нормальном распределении, назьшают- ся probit'Mon,Qjm. Двумерные и многомерные ргоЬИ-модели РгоЫимодели могут быть могут быть использованы для определения вероятностей слоэюных событий, выраэ/саемых в виде комбинаций неко- торых наборов простых событий, каэ/сдое из которых имеет два аль- тернативных варианта, например, переезд (непереезд) на новое место эюительства и аренда (покупка) эюилья ит.п,В этом случае данные веро- ятности могут быть определены как вероятности выбора в рамках много- мерных альтернативных вариантов. Для каждого индивидуума Г (г=1,2,...,7) модель, определяющая вероят- ности двух событий, может быть представлена в виде следующей системы: yu=ofiXit +еи, если >'if1, то уи>0, если з^1=0, то yi*<0; Уъ-01-^21 +£2h если У2г=1, то уь>0, если у2=0, то У2*^0, (10.72) Латентные переменные уи и y2t модели (10.72) могут интерпретиро- ваться в терминах выгоды, получаемой в зависимости от принятого ре- шения соответственно в первом и во втором случаях; JCi^ и X2t - векторы значений независимых факторов, соответствующих сделанному выбору; ви и £2t - ошибки соответственно первого и второго уравнений; р - коэф- фициент ковариации ошибок Si и €2. Закон совместного распределения ошибок модели fi и 6*2 в общем слу- чае характеризуется следующими параметрами: М[е,]=М[е2]=0; D[ei]=D[e2M\ Cov[fi, £2]=р. Согласно модели (10.72) возможны следующие комбинации решений: У1=У2 = 0\ 3^1 = 1,^2 = 0; 3^1 =0,3^2=1; 3^1=3^2=1. (10.73) ^ Допущение равенства дисперсий единице - не слишком сильное. Если дисперсия ошибки € принимает вместо 1 значение с^, то это равносильно умножению всех ко- эффициентов а на а Знак произведения оА при этом не изменится. Соответственно не изменится и соотношение между латентной переменной у* и наблюдаемой пере- менной у. 400
Наблюдаемые комбинации образуют массив зависимых переменных модели (10.72). В системе (10.72) допускается, что события являются зависимыми ме- жду собой, что означает существование ненулевой ковариационной связи между ошибками ei и £2- Например, возможность приобретения жилья на новом месте может способствовать принятию решения о переезде или, наоборот, переезд обусловливает необходимость аренды жилья. Для определения функции закона распределения введем следующие обозначения: qif=2yii-l и ^2г=2у2г-1^- Тогда qjr=l, еслид;уг=1, и ^уг=-1, если У]г=0, для у =1,2. Введем также в рассмотрение следующие переменные: Zjt=apCjtH Wjf= qjtZjtJ=l, 2 и Pt*=qif qit'p- Вероятность того, что зависимые переменные Y\ и Уг системы (10.72) для конкретного индивидуума принимают соответственно значения 3^1, и У2ь при, например, нормальном виде закона их совместного распределе- ния рассчитывается как Р(У\^У1ь 1'2=У2г)=Ф2(^1г, W2U Pt*\ (10.74) где Ф2(.) - функция нормального закона совместного распределения слу- чайных переменных У\ и Уг, имеющая следующий вид: Ф2(wi^,W2t.Pt*) = П'П'<Р2(«1'«2»Pt*)duidu2 , (10.75) где Ml и М2 - переменные интегрирования, и плотность этого распределе- ния имеет следующий вид: 2л:(1-/?2)1/2 Для определения маржинальных эффектов в модели (10.72) введем в рассмотрение вектор jc,, являющийся объединением векторов jc^ и дс2/, и вектор коэффициентов }^, такие что ai'xit=}\'xt. Вектор )\ составлен из элементов вектора коэффициентов Oi и нулей, стоящих на позициях, ко- ^ Индекс 2 используется для обозначения двумерного нормального распределения с плотностью (р2 и интегральной функцией Ф2. Во всех остальных случаях индекс 2 показывает, что данная переменная находится во втором уравнении модели (10.57). Как и раньше, (f(.) и Ф(.) обозначают одномерные стандартные нормальные плотности и интегральные функции. Xf =[X\t, X2t] . 401
торые соответствуют переменным второго уравнения. Аналогичным об- разом введем вектор коэффициентов )i: o^xir='Yi^t- Тогда вероятность то- го, что значения у\ и уг одновременно будут равны единице определяется следующим выражением: /^(^1=1, >'2=1)=Ф2[ЯЧ, YlXb РЛ (10.77). Маржинальные эффекты независимых факторов Xt для P(yi=l, У2=1) могут быть определены согласно следующему вьфажению: ^ = 8и-Г1+82,-Г2> 00.78) Г J Шл. — П где g,i =^(и;„)Ф W2,-p,*Wu Для получения ga индексы 1 и 2 в выражении (10.78) нужно поменять местами\ Математические ожидания зависимых переменных у^, у=1,2 для кон- кретных наборов независимых переменных дс/ в соответствии с выраже- нием (10.50) определяются как Л/[у;1х,]=Ф(2<.х,),у=1,2. (10.79) Для модели (10.72) можно также определить условные математиче- ские ожидания переменных уи и у2г- Например, математическое ожидание зависимой переменной первого уравнения при условии, что У2=1> определяется согласно формуле услов- ной вероятности следующим образом: Л/[У11У2=1, JCr]=/'[yi=lly2=l, Xj= =Р[у1=1,у2=Ш,]//>[у2=1ад= =Ф2(Я'хг, Yl'^bРг*)1Ф{п'^хд. (10.80) Аналогично определяется математическое ожидание зависимой пере- менной второго уравнения при условии, что yi=l. Маржинальные эффекты факторов jc, для функции типа (10.80) рассчи- тываются как ЪМ\ух\у2=1,хЛ1Ъхг^ =[1/Ф(?1Ч)][ gtv7i^{ 8гг-Ф2<(1^П''Х)1 Ф{Г1'Х,))П1 (10.81) Аналогичным образом могут быть построены модели с тремя и более зависимыми переменными с учетом того, что функционал Ф должен вы- ражать их совместное распределение. ^ См. раздел 10.5. 402
Многомерные модели бинарного выбора с цензурированием Бывают ситуации, когда наблюдаемые переменные в двумерной ргоЫг-модели цензурируют одна другую. Например, при оценке возмож- ности кредитования Бойз (Boyes et al., 1989) анализировал данные по сле- дующему правилу: У1=1, если индивидуум t не получает кредит, 3^1=0 в противном слу- чае; У2=1, если индивидуум t просит кредит, >'i=0 в противном случае. Для конкретного индивидуума переменная ух не наблюдаема, пока у2 не принимает значение 1. Таким образом, возможны следующие наборы значений зависимых переменных: У2 = 0; У1 = о,у2 = 1; У1=У2=1. (10.82) (Сравните с (10.73)). Вероятности событий, определенных вьфажениями (10.82), согласно (10.75) оцениваются следующим образом: Р(у2=0)=1-^(а/'Х2); Р(У1=0,У2=^)=Ф2(-а1'Хъ (Х1'Хъ-р)\ P(yi=h У2=1)=Ф2(а1-Х2, а{'Хъ р\ (10.83) где Ф(.) - функция закона нормального распределения, а функция Ф 2(.) определена выражением (10.75). 10.3.2. Модели множественного выбора От многомерных рг<9Ь/г-моделей отличаются модели множествен- ного выбора. Многомерные probit-модели предполагают принятие нескольких решений, каждое из которых заключается в выборе одно- го из двух альтернативных вариантов, В моделях мноэюественного выбора нуэюно принять одно решение, но выбрать меэюду тремя и более вариантами. Часто рассматриваются два возмоэюных типа альтернатив: упорядоченные и неупорядоченные. Например, выбор средств, чтобы добраться до работы (на машине, на метро, на автобу- се и т.д.) - выбор среди неупорядоченных вариантов. Выбор ценных бумаг, исходя из их рейтинга, - выбор среди упорядоченных вариан- тов. Рассмотрим сначала модели с неупорядоченными альтернативными вариантами. 403
в них предполагается, что наблюдаемое значение выбора г-м инди- видуумом 7-го варианта iyf^j) связывается со значениями факторов, со- путствующих его выбору, эконометрическим уравнением следующего вида: yr^Vf,a'z^)-^etj, (10.84) где ;; - функщи, отражающая характер влияния факторов на выбор г-м индивидуумому-го варианта; Btj - ошибка модели; а- вектор параметров модели; Ztj - вектор независимых переменных-значений факторов, влияющих на выбор г-го индивидуума, которые могут характеризовать самого индивидуума, альтернативный вариант, либо и то и другое одно- временно. Например, при выборе торгового центра для покупки набора товаров вектор Zf/может иметь следующую структуру: Ztj4Kj.RtpDd, (10.85) где Kj - количество магазинов в j-m торговом центре; Rtj - расстояние от дома г-го индивидуума до j-ro торгового центра; Dt - доход г-го индиви- дуума. Заметим, что ошибки etj (г=1,2,...,Г) модели (10.84) определяются как £li=l-7Xflf',Zri), ^=2-;ХАг'»гд),..., €u=J-r](a'xul На основании модели (10.84) могут быть оценены вероятности выбора г-м индивидуумом каждого из альтернативных вариантов, т.е. Р(уг=1), Р();р2),..., P(yf=J), Для этого должны быть известны: 1) функция 7](a'^tj)\ 2) закон распределения ошибок €tj. Предположим, что функция rj(^a'ztj) имеет линейный вид: rKol^Zti)=a'^Ztj=-avz^^'^ + c^-Zr/'^ +...+a;,-z/''\ (10.86) где Ztj^ - /-Я компонента вектора Z// (/=1,...,/2). Соответственно ошибки £jy (^=1,2,...,7) модели (10.84) примут следую- щий вид: £ji=l-a'-Z/i, £;2=2-a'-Z/2,..., eu^-a'z^ Предположим, что ошибки Stj независимы и распределены по нор- мальному закону, тогда вероятность выбора t-u индивидуумом j-vo вари- анта определяется следующим образом: |_J^^(Pj(ui,,..,Uj)dui...duj_iduj^i,..duj . (10.87) где Ml,..., uj - переменные интегрирования, a плотность совместного рас- пределения ошибок (pj (.) определяется как 404
1 J U-olztj?- 1 '^ On • ^y(flrz,i,...,flrz„) = J pe ^*=^ ^ . (10.88) (2;r)2((T,^l+... + (7,^)2 В выражении (10.88) Сц = D(6j;). Из-за сложности вычисления многомерных интегралов в выражении (10.87) модели, основанные на нормальном распределении ошибок (probit'MOAQjm), не нашли широкого применения в исследованиях множе- ственного выбора. Определение вероятностей выбора Р(уг=1), Р(уг=2),..., P(yr=J) сущест- венно упрощается, если предположить, что ошибки Stj независимы и рас- пределены по закону Вейбулла, т.е. F{e^j) = ехр(-е~^<'). Тогда их совместная плотность распределения может быть представ- лена в следующем виде: 9J(fn-.-%) = (-1)-^ Й(-^"^^ )ехр(-е"^^). (10.89) На основании выражения (10.89) получим, что вероятность выбора г-м индивидуумом 7-го варианта определяется как JJ! ^/ ("1 • • • •'"/ )''"1 • • • '^«y-l^My+l ■■■duj = '^ J . (10.90) = -е ^«'ПехрС-е-^'*) *=1 С учетом того, что величина ошибки е^ зависит от величины -Ы-Ztj, и Z, Р(У1 = У) = 1 в этом случае окончательно имеем: М /^«•.Пехр(.«'^''^) ^.^ Р{У,^П = - —J = / ' • (10.91) Выражение (10.91) лежит в основе ^^й-моделей множественного вы- бора. 405
Заметим, что при способе формирования независимых факторов, соот- ветствующем выражению (10.85), вероятность выбора t-u индивидуумом 7-го варианта будет зависеть от тех факторов, которые отражают характе- ристики только варианта j (число магазинов в j-u торговом центре) либо совместные характеристики варианта j и индивидуума t (например, рас- стояние от дома индивидуума до торгового центра является их совмест- ной характеристикой). Это можно показать следующим образом. Представим вектор Ztj в сле- дующем виде: Ztj =[Хф wj, где вектор Xtj образован факторами, отражающи- ми характеристики варианта j и совместные характеристики варианта j и индивидуума Г, а вектор Wt - факторами, отражающими исключительно ха- рактеристики индивидуума t (например, доход). Вектор параметров а так- же представим как совокупность двух векторов о^[о^, убЦ, где (Х^ - вектор коэффициентов, соответствующих независимым переменным Хф а yff- век- тор коэффициентов, соответствующих независимым переменным Wj. Введя такое представление в модель (10.88), получим следующее выражение, оп- ределяющее вероятность выбора t-м индивидуумом у-го варианта: ^^t = J) = "7 = ~j = ~j .(10.92) ;=1 ;=1 7=1 Из выражения (10.92) непосредственно следует, что независимые пе- ременные Wt, которые характеризуют индивидуума (но не характеризуют альтернативный вариант), действительно не будут влиять на распределе- ние вероятностей выбора. Для учета влияния признаков индивидуумов в модели (10.91) необхо- димо сформировать несколько другую структуру векторов Ztp отличаю- щуюся от структуры, определенной выражением (10.85). Векторы Ztj должны выглядеть следующим образом: Z,i =(x,pWpO,...0,); (y-2)xL z,2=(^,2'0,...0,H',,0,...0,); L (/-3)xL 7 Z.lx q"Qw\ (10.93) (y-2)xL z,y=(x,y,0,...0,), (y-l)xL 406
где L - число компонент в векторе Wt. В рассмотренном выше примере, когда индивидуум с доходом Д вы- бирает один из трех торговых центров в соответствии с выражением (10.93) вектора Zry примут следующий вид: Zr2=(A:2,/?r2,0,A); (10.94) Zr3=(^3,/?/3,0,0). где Kj- число магазинов ву-м торговом центре, Щ - расстояние от дома г- го индивидуума до^'-го торгового центра. Таким образом, вероятность выбора ^м индивидуумом j-ro альтерна- тивного варианта ставится в зависимость и от характеристик варианта и от характеристик индивидуумов. Однако на практике обычно формиру- ются модели, содержащие только какой-либо один набор однородных факторов. Logit'Modenb, учитывающая влияние на вероятность выбора t-M индивидуумом j-го альтернативного варианта факторов Хф вклю- чающих характеристики варианта] и совместные характеристики ва- рианта j и индивидуума t, называются условной logit-моделью. Заме- тим, что в условной to^/r-модели наряду с ранее отмеченными свойст- вами независимости ошибок и их распределения по закону Вейбулла также предполагается, что ошибки гомоскедастичны. Для условной /о^й-модели вероятности Р(уг=/)у 7=1,...,/ также могут быть определены на основе выражения (10.92). Маржинальные эффекты непрерывных независимых переменных х могут быть получены путем дифференцирования вероятностей по факторам jc: ЭР; —^ = [/>;.(J-P^)].a*, (10.95) где d=l, если 7=Д:, и ^/=0 - в противном случае. (Для избежания путаницы в обозначениях индексы наблюдений здесь опущены.) При практическом использовании условной logit-модели часто выясня- ется, что предполоэк:ение о независимости ошибок Stj не соответствует действительности. Например, при выборе одного из трех торговых цен- тров может оказаться, что количество магазинов в первом из них вдвое больше, чем во втором (Kx^lKi), но и расстояние до него вдвое больше, чем до второго (Ка=2Ка)» Ошибки ^i и 6^ в этом случае определяются как €ti=]nl-ai2K2-a22Ra\ еа^Хга^-ахКг-агКа- (10.96) 407
Из выражения (10.96) следует, что ошибки являются зависимыми: £ii=-2(ln2-£^2). (10.97) Зависимость ошибок влечет за собой потерю эффективности оценок параметров а условной to^/r-модели, полученных при использовании «традиционных» методов оценивания. Вместе с тем, если рассмотреть несколько другую процедуру выбора Г- м индивидуумом альтернативных вариантов, то неэффективность оценок модели можно устранить. В частности, это можно сделать, сформировав последовательную процедуру выбора, на каждом шаге которой выбирает- ся одно из двух возможных решений. Такая процедура может быть опи- сана многомерной ргоди-мод^лью, которая может быть представлена в следующем виде: ytj=(X'-Xj^etj (ytj=l, если индивидуум t выбрал варианту; ytj=0 - в противном случае); [^1, ^2,..., ^уЬМО, 23. (10.98) гдеху- вектор независимых переменных, характеризующих у-й вариант, а - вектор параметров модели; Sj- ошибка модели, распределенная по нор- мальному закону с нулевым средним и ковариационной матрицей X (в общем случае неизвестной). Рассмотрим следующий пример, отражающий особенности примене- ния данного подхода. Предположим, что изучается выбор одного из трех видов транспорта для поездки на работу (автомобиль, автобус, метро). Введем три бинарные переменные, соответствующие каждому средству передвижения: yi=l, если выбран автомобиль, yi=0 для всех остальных видов транспорта; У2=1, если выбран автобус, у2=0 для всех остальных видов транспорта; уз=1> если выбрано метро, уз=0 для всех остальных ви- дов транспорта. Требуется оценить следующий набор вероятностей: /'(>'1=1);/'(}'2=1)иР(уз=1). Выбор одного из трех альтернативных вариантов можно описать в ви- де «дерева» последовательных решений, в узлах которого происходит бинарный выбор (см. рис 10.3). Рис 103. Последовательность выбора одной из трех альтернатив 408
в каждом узле, используя бинарные модели, можно оценить условную вероятность выбора соответствующего варианта. Безусловная вероят- ность его выбора вычисляется по формуле умножения вероятностей. Так, например, безусловная вероятность выбора метро как способа добраться до работы определяется следующим выражением: Р(уз=1)=Р(у2=0, У1=0)=Р(У2=0УР(У2=0\У1=0), (10.99) Вероятность Р(у2=0) оценивается с использованием бинарной probit- модели (10.50), вероятность Р{у2^\у\=0) -на основе выражения (10.74). Гнездовые logit-Modenu (nested logit-models) Как было отменено, в условной logit-модели ошибки обычно предпола- гаются гомоскедастичными. Для практики это предполоэюение часто является слишком строгим. Например, в случае выбора одного из трех торговых центров при условии, что количество магазинов в первом из них вдвое больше, чем во втором {К\=2К2), а расстояние до первого вдвое больше, чем до второго (Rt\=2Rf2), дисперсии ошибок е\ и 82 эконометри- ческой модели, связывающей данные выбора первого и второго торгового центра с влияющими на этот выбор факторами (см. выражение (10.96)), определяются следующим образом: Y,(\Til-ai'2K2-a2'2Rt2)^' D(eO = — 7-2 J:(-ay2K2-'a2'2R,2)^ 7-2 (10.100) h ]{ln2-aiK2-a2Rt2r D(e2) = ^ TZi ' ^^^-^^^^ где 7- число наблюдений. Если a\K2-^arRt2 "^ 1п2, то D(€i)^D(e2), т.е. ошибки ^ гетероскедастич- ны. Один из способов ослабить предполоэюение о гомоскедастичности ошибок в условной logit'Moдeлu связан с изменением процедуры выбора альтернативных вариантов. В этом случае варианты разделяются на непересекающиеся группы таким образом, что внутри группы дисперсии ошибок Stj уравнения (10.84) являются одинаковыми, а дисперсии ошибок разных групп меэк:ду собой различаются. 409
Предположим, что / вариантов могут быть разбиты на L групп, и общий набор вариантов представляется как [1,...,/|=[(111,...,Л11),..., (1IL,..., /LIL)], где7*1/ -у вариант в группе /, Л - номер последнего варианта в группе /. Ис- пользуется следующая логика выбора окончательного решения. Сначала выбирается одна из L групп, затем осуществляется выбор варианта в рам- ках группы. Этот процесс имеет древовидную структуру, которая для двух групп и 5 вариантов может выглядеть следующим образом: Выбор Fpynnai 1 1 2 1 Группа2 1 2 2 2 3 2 Пусть Xju - вектор независимых переменных, влияющих на выбор ва- рианта внутри группы, а Z/ - вектор независимых переменных, влияющих на выбор группы. Если бы для описания процедуры выбора использовалась условная tog/r-модель (10.92), то предполагалось бы, что выбор вариантау и выбор группы / не зависят друг от друга. При условии независимости выбора группы и варианта внутри группы вероятность выбора конкретного варианта определялась бы следующим выражением: ^[вариант у, группа /] = Рщ • Р/ = —~ ^jU ,/Z/ У=1 i,/z, (10.102) /=i где a и у- векторы параметров. Для гнездовой logit-мoдQmi безусловную вероятность выбора j-ro ва- рианта и 1-й группы можно представить как произведение условной веро- ятности выбора у-го варианта при условии, что была выбрана /-я группа, и безусловной вероятности выбора 1-й группы. Заметим, что поскольку внутри группы ошибки гомоскедастичны, то условную вероятность выбора у-го варианта при условии выбора 1-й груп- пы, можно определить с использованием выражения (10.92) как (10.103) ^^=7 410
Специфика гнездовой logit-модели, ее отличие от условной logit- модели, состоит в подходе к определению вероятности выбора l-u груп- пы. Для того чтобы раскрыть эту специфику, введем переменную //, ха- рактеризующую «ценность» 1-й группы: Jl . /;=1п£е ^^ (10.104) М В гнездовой tog/r-модели «ценность» 1-й группы рассматривается как дополнительный фактор, влияющий на выбор этой группы, т.е. вероят- ность выбора 1-й группы определяется следующим образом: yzi+TiIi Pl=1 , (10.105) /zi+TiIi Z 1=1 где Т/- параметр, который и отличает гнездовую to^/r-модель от условной logit-модеяи, В последней он принимает значение 1. Поэтому вероятность выбора 1-й группы в условной tog/r-модели определяется как Pl=-j^ , (10.106) Уч I /=1 В гнездовой togir-модели значение параметра Г/ оценивается вместе с параметрами у- В целом, оценивание безусловной вероятности выбора j-то варианта внутри 1-й группы в рамках гнездовой модели осуществляется следую- щим образом: 1. Вектор параметров дг оценивается с использованием условной logit- модели типа (10.92), описывающей выбору-го варианта в зависимости от факторов JC/1/. После оценки параметров а по формуле (10.103) определя- ется ценность 1-й группы, т.е. //. 2. Вектор параметров уи параметр Г/ также оцениваются с использова- нием условной tog/r-модели типа (10.92), которая описывает выбор 1-й группы в зависимости от факторов z/и //. 3. По формулам (10.103), (10.105) оцениваются вероятности Pj\i и Р/. Безусловная вероятность выбора у-го варианта внутри 1-й группы опреде- ляется как произведение Р/у и Р/. 411
Качество оценок, получаемых на основе гнездовой logit-MOjiemi, во многом определяется правильностью построения дерева альтернативных вариантов. Отметим, что на практике достаточно трудно оценить, соот- ветствует ли выбранная структура такого дерева исходным условиям мо- дели, состоящих в постулировании определенных допущений относи- тельно дисперсий ошибок (постоянство дисперсий ошибок внутри груп- пы и различие дисперсий в разных группах). Как это было показано ранее, модификации logit-Modeneu могут фор- мироваться в зависимости от состава учитываемых в них факторов. В частности, мультиномиальная logU^мoдeль в отличие от рассмотрен- ных выше модификаций учитывает, что на выбор индивидуума t влияют только его характеристики. Примером мультиномиальной togiV-модели является модель выбора сферы деятельности (Schmidt and Strauss, 1975). Допустим, что имеется информация: а) относительно возможной сферы деятельности человека: (0) - «прислуга», (1) - «синий воротничок», (2) - <фемесленник», (3) - «белый воротничок», (4) - <фуководитель»; б) отно- сительно характеристик индивидуума (факторов): образование, опыт ра- боты в данной области, пол. Предположим, что значения зависимой переменной yt и независимых факторов Wty связаны следующим образом: yp^-wr+fj;, (10.107) где yt наблюдаемые значения зависимой переменной (т.е. О, 1,...,У); Wt - вектор факторов, содержащий характеристики индивидуума t\ о^ - вектор параметров, характеризующих влияние факторов Wt на выбор конкретно- го варианта у, Stj- ошибка модели. Предположим также, что ошибки Stj, 7=1,...Д независимы и распреде- лены по закону Вейбулла, т.е. F(€fj) = ехр(-е ^). Тогда вероятность выбора /-м индивидуумом у-го варианта может быть представлена в следующем виде (см. выражения (10.89)- (10.91)): P(Y,=j)= У . (10.108) Заметим, что в приведенном примере рассматривается нулевая аль- тернатива. Это позволяет сократить объем вычислений, поскольку на практике о^ не оценивают, а принимают равным нулевому вектору. То- гда согласно выражению (10.108) вероятности выбора г-м индивидуу- 412
MOM варианта 7,7=0,1,..., /-1; определяются согласно следующим фор- мулам: P(Yt=j)-^—J . ; = 1,2,..../; P(Y, =0) = —-^ . (10.109) Из выражений (10.109) следует, что логарифм отношения вероятно- стей выбора у-й и 0-го варианта равен NayH',, (10.100) а логарифм отношения вероятностей выборау-го и ik-ro вариантов - = w;(ay-ajt). (10.111) Заметим что, если предположение о независимости ошибок е^ не вы- полняется, то соотношения между вероятностями нуждаются в опреде- ленной корректировке. Модели с упорядоченными альтернативными вариантами Варианты в моделях множественного выбора могут быть естествен- ным образом упорядочены. Примерами упорядоченных вариантов явля- ются: 1. Рейтинги ценных бумаг. 2. Результаты дегустации. 3. Опросы общественного вшения. 4. Уровни сложности работ. 5. Типы страховых полисов, выбираемых потребителем (отсутствие такового, частичное покрытие, полное покрытие). 6. Степени занятости (безработный, занят часть дня, занят полный день). Во всех этих случаях значения зависимой переменной обычно выра- жают отношения предпочтения среди альтернатившлх вариантов. Такие отношения могут быть выражены рангами, имеющими вид упорядочен- ных наборов чисел: 0,1,2,... При этом наиболее предпочтительному вари- анту может соответствовать как нуль (в этом случае рейтинги вариантов с ростом их ранга уменьшаются), так и последнее число в этой последова- 413
тельности J (в этом случае рейтинги альтернатив уменьшаются вместе с уменьшением их ранга). Для анализа определения предпочтительности выбора среди упорядо- ченных альтернативных вариантов и оценки влияния на этот выбор раз- личных факторов широко применяются порядковые logit- и probit- модели, В таких моделях вероятности предпочтения так же, как и в бино- миальной probit-MO^ejm (10.58), определяются с использованием уравне- ния латентной регрессии: y/=a'xr+£i. (10.112) где у, - ненаблюдаемая переменная, которая по-прежнему представляет собой выгоду (полезность) выбора j-ro варианта для г-го индивидуума, например, дивиденды от покупки акций с j-u рейтингом; а - вектор па- раметров; Xt - вектор независимых переменных, влияющих на выбор Г-го индивидуума; £j - ошибка модели. Если значение переменной yt удовлетворяет условию yt <0, то предпо- лагается, что индивидуум с характеристиками JC/, выбирает нулевой аль- тернативный вариант. Аналогично, если выполняется условие 0<у <jUu то выбирает первый вариант и т.д. Эту логику выбора можно представить в виде следующей системы: если yt <0, то уг=0\ если 0<у*<Цъ то у,=1; если 11\<у1<^1ъ то уг=2; если /ij-\<yt, то уг=7. (10.113) где //у (/=1,2,...,/-1) - неизвестные параметры, которые подлежат оценке, как и параметры a(jA оцениваются теми же методами). Границы //i,..., /iy_i можно интерпретировать как один из вариантов цензурирования. Предположим, что ошибки Et нормально распределены, е-ЩО,\\, С учетом этого набор вероятностей появления у-й наблюдаемой переменной (/-го ответа) определяется следующими выражениями: Р(у^)=ф(-а'д:,); Р(у, =l)=0(//i-flr'.jc,)-0(-flr'jc,); P(yt =2)= Ф(М'2га'х;у-Ф{М1-а'х^\ (10.114) Р(Уг=Л=1-Ф(^1:-1-а''Х,у где Ф(.) - функция закона стандартного нормального распределения. 414
Из выражений (10.114) следует, что эти вероятности P(yt =7), у=0,...,/ будут положительными, если выполняется следующее условие: 0<//1<//2<... <//7-1. (10,115) На рис. 10.4 показано распределение вероятностей выбора конкретных альтернатив. Рассмотрим особенности определения маржинальных эффектов факто- ров Xt, которые будут характеризовать изменение вероятности выбора у-го альтернативного варианта при изменении одного из независимых факторов на 1 единицу. Допустим, имеется три варианта (этот случай предполагает только один параметр положения //). В соответствии с выражением (10.114) вероятности выбора каждого из вариантов определяются как />(урО)=Ф(-дг'л:,); Р(у^2)=1-Ф(//-£уЧ) (10.116) 0-4 ТЯ^) 0.3 + 0.2 + 0.1 + с(х, fi\-dxt tir-dxt Цу-Ыхг ег Рис. 10.4. Вероятности в упорядоченной probit-модели Тогда маржинальные эффекты факторов определяются согласно сле- дующему выражению: ЭР[уг=0]/Эд:г=-^ог'-х,)- о; 3P[yr=l]/3jcF[^-or'-jCr)-9</^a'jCr)]a; ЭР[ур2]/агр^<Д-а'д:,)а: (10.117) где ^.) - функция плотности распределения стандартной нормальной пе- ременной. 415
На рис. 10.4 сплошной линией изображено распределение yt в зависи- мости от ошибки £j. Рисунок характеризует маржинальный эффект при >ъеличении одного из факторов хц (/=1,2,.••» п) при неизменных а и ju. Этот эффект эквивалентен смещению графика распределения вправо, что показано пунктирной линией. 0.4 т 0.3 + 0.2 + 0.14- Рис. 10.5. Влияние изменения х^на оцененные вероятности Согласно первому выражению в (10.117) изменение вероятности вы- бора 0-го варианта зависит от коэффициента при факторе JC/. Если коэф- фициент Oi положителен (для данного набора jc^), то вероятность P[yt=Ol должна снизиться (производная dP{yt=0]/dxit имеет знак, противополо^ ный знаку Oi), Соответственно, если коэффициент cXi отрицателен, то ве- роятность P[yi=0] должна повыситься. Согласно третьему выражению в (10.117) направление изменения ве- роятности Р\уг=2] при увеличении фактора jc/, также определяется знаком коэффициента а;: но в данном случае при положительном а; вероятность увеличивается, при отрицательном а;- уменьшается. Заметим, что согласно второму выражению в (10.117) изменение веро- ятности Р\уг=1] зависит не только от знака oj, но и от знака, который бу- дет иметь разность двух плотностей [<p(rOf-Xt}-(p(ju-of'Xt)]. Если эти знаки совпадают, то вероятность Р[ур1] увеличивается с увеличением Хи, если не совпадают, то она уменьшается. 10.3.3. Модели счетных данных В практических исследованиях достаточно часто приходится сталки- ваться с зависимыми переменными, которые представляют собой резул%* 416
таты подсчетов. Примерами таких переменных являются число выданных за год патентов, количество выпускников вузов, число аварий на судах и т.д. Эконометрическая модель в этом случае связывает количество про- изошедших событий (у) с факторами, характеризующими условия, сопро- вождавшие эти события. Дискретный характер зависимой переменной дает основание предпо- лагать, что линейные модели, связывающие число событий с уровнями сопровоэюдающих их факторов, будут не совсем адекватны реальным л данным из-за того, что расчетные значения у^ могут принимать лю- бые, не обязательно целые значения, В таких ситуациях более приемле- мыми являются модели другого типа, в частности, модель регрессии Пуассона, Зависимость числа событий yt, произошедших за фиксированный вре- менной интервал (г, Г+1) (день, неделя, месяц), от значений влияющих на это число факторов согласно этой модели представляется следующим об- разом: yt ^gO'jfr+fr =^./г, (10.118) где а- вектор параметров уравнения; х,- вектор независимых переменных, характеризующих условия появления событий; St - ошибка уравнения; >?J=e^'^ (10.119) Предполагается, что число событий yt распределено по закону Пуассо- на с параметром >^. С учетом этого вероятность осуществления каждого числа событий yt может быть определена согласно следующему выражению: е ч af' /'(П =>•«) = Г-. >-, =0,1,2.... . (10.120) Заметим, что в соответствии с (10.118) при нулевом математическом ожидании ошибки условное математическое ожидание числа событий для заданного набора значений факторов х, определяется как М{у\х,] = Х,=е'^'''. (10.121) Согласно модели Пуассона условное математическое ожидание и ус- ловная дисперсия при заданных значениях факторов jc, равны между собой: М[у\Х(] = Щ.у\х,] = Х. (10.122) •4 Эконометрика 417
с учетом (10.121) маржинальный эффект факторов может быть оценен следующим образом: dM\y]xt]/dxr-At'a (10.123) Рассмотрим особенности формирования модели Пуассона для случа- ев цензурирования и усечения исходных значений зависимой перемен- ной д^^. Цензурированной выборке отвечает следующий пример. Предпо- ложим, что модель описывает количество событий, характеризующих частоту посещения врача респондентами в прошлом году. Варианты ответов: О, 1, 2, 3 и более. Всем ответам, имеющим значение более 2, присваивается значение 3. Цензурированные выборки обычно получа- ют путем объединения ряда значений с низкой вероятностью появле- ния в одно. Согласно закону Пуассона для цензурированной выборки вероятности того, результирующий показатель yt принимает конкретное значение (/=0,1,2...), определяются как Pt = P^yt = 7) = т-^, если yt = 0,1,2; Р{у^Ъ) = 1-Р();^3)=1-[Р(урО)+Р(ур1)+Р(ур2)]. (10.125) Усеченные наборы значений зависимой переменной yt характеризу- ют ситуацию, когда одно или группа значений выражают специфиче- ское содержание (отличное от того, которое выраэк:ено другими зна- чениями). Например, задан вопрос: «Сколько раз вы посещали курорты в прошедшем году?» Ответ «О» может обозначать отсутствие денег, времени или принципиальное нежелание проводить время таким обра- зом. Ненулевые значения ответов говорят о желании проводить время таким образом. В таком случае эконометрическая модель может отра- жать зависимость частоты посещений курорта от факторов жизнедея- тельности индивидуума с учетом элиминирования его неприятия курор- та как места отдыха. Если модель формируется для оценки вероятностей принятия пере- менной yt только положительных значений (т.е. ее нулевые значения усе- каются), то согласно (10.120) вьфажения, определяющие эти вероятности имеют следующий вид: Р, =-%. = -f ::^,еслиу,= 1,2,..., (10.126) где показатель At определен в соответствии с выражением (10.119). 418
Отрицательная биномиальная модель Как уже отмечалось, в пуассоновской модели предполагается, что математическое оэюидание и дисперсия числа событий yt равны друг другу. Это свойство существенно ограничивает ее применение, посколь- ку реальные процессы им не обладают. Вследствие этого в эконометриче- ских исследованиях обычно рассматриваются некоторые модификации пуассоновской модели, в которых свойство (10.122) не выполняется. На- пример, в условное математическое ожидание (выражение (10.119)) вво- дится ненаблюдаемое воздействие, которое предполагается случайным: //^=;i^.M^=e^*r+^r, (10.127) где /Ji - условное (по воздействию щ) математическое ожидание перемен- ной yt\ Ut= е^. Согласно выражению (10.127) распределение yt, обусловленное факторами х , и ошибкой щ, остается пуассоновским. Его плотность, определяемая набором вероятностей Piyi^jbct, щ), имеет следующий вид: /(у, \х,.и,) = ^ '^ . (10.128) Из выражения (10.128) следует, что вероятность числа событий yr=j при условии JC,, появляется случайной величиной, зависящей от ошибки щ, е-^'''t -Я/' М\Р{уг^^1, Ио)]= —=^г1х,). в этом случае функция плотности «обычного» пуассоновского закона имеет вид математического ожидания функции (10.128): f^yt '^г) = Г'"'^''^'^^"^^'^'^К)^^г> (10.129) где g(M/) - функция плотности распределения ошибки щ. Вид функции g(Mj) определяет и характер распределения j^^lr,. В теории с целью упрощения математических выкладок в качестве %{ц^ обычно рассматривают гамма-распределение, т.е. i(}^г)~,■e-^■^^^■4-'■ (10130) с учетом (10.130) вьфажение математического ожидания функции плотности примет следующий вид: 419
Г(у,+1)Г(в) ' ' " Заметим, что выражение (10.131) является одной из форм пред- ставления плотности отрицательного биномиального распределения. Это распределение имеет условное математическое ожидание по дг„ равное Лэ и условную дисперсию -Яг(1+(1/^Л,). Таким образом, действительно снимается главное ограничение пуассоновской модели - условие равенства математического ожидания и дисперсии числа событий. Модель преодоления препятствий (hurdle-model) Данные модели предназначены для описания процессов, нулевые уров- ни (значения) которых выражают принципиально другое содеро/сание, по сравнению с пололсительными, которые, как и в рассмотренных ранее моделях, являются целочисленными. Напомним, что в примере с частотой посещения курортов нулевой ответ означал нежелание проводить время на курорте ни при каких условиях. Модель преодоления препятствий, предложенная Мюллеэйем (Mullaey, 1986), предполагает, что вероятность нулевого значения процесса не зависит от факторов, влияющих на вероятности осталь- ных значений. Вероятности же ненулевых значений подчинены пуас- соновскому закону. С учетом этого модель преодоления препятствий может быть представлена, например, в виде следующей системы уравнений: Р[У/=0] = е-^; P[y,=y>^^"""^^'"'''^'^',j=l,2,... (10.132) 420
Из первого уравнения системы (10.132) следует, что в данном вариан- те этой модели для оценки вероятности P(yf=0) используется показатель- ный закон распределения. Параметры модели 0, Xt определяются на основе исходных данных, представленных набором значений yt (у^У, 7=0,1,2,...) и факторов Xt. При этом учитывается условие нормировки вероятностей Р\уг=]\, т.е. У Несложно заметить, что математическое ожидание зависимой пере- менной yt модели (10.132) определяется следующим образом: М[у, ] = е-^ хОч-^^"^ Кх^, (10.133) где (1-е~^)/(1-е~'^) - сомножитель, применяемый для нормировки ве- роятностей. Мюллеэй (Mullaey, 1986), Хейлброн (Heilbron, 1989), Ламберт (Lambert, 1992) рассмотрели модификацию модели преодоления пре- пятствий (10.132), в котором нулевые результаты могут появляться в двух режимах. В первом режиме результирующий показатель - все- гда 0. Во втором режиме работает обычный пуассоновский процесс, который может принимать как нулевые, так и ненулевые значения. Например, значение yt может характеризовать количество бракован- ных изделий, выпускаемых за определенный промежуток времени. Если производственный процесс контролируется, то количество бра- кованных деталей равно 0. Если не контролируется, то предполагает- ся, что количество бракованных изделий распределено по закону Пу- ассона и может принимать как нулевые, так и любые целочисленные значения. Таким образом, вероятности нулевого и ненулевого коли- чества бракованных изделий могут быть определены согласно сле- дующей схеме: р\у^ = 0] = Р[режим 1] + P\yt = 01режим 2] • Р[режим 2]; Р\у^ =у] =: />[у, =71режим 2] • Р[режим 2],; = 1,2,.... (10.134) Пусть Z - индикатор режима 1 (z=0) или 2 (z=l). С учетом этого рас- ширенная модель преодоления препятствий по аналогии с выражением (10.132) может быть представлена в виде следующей системы: P[Zr=0]=F(A/)» е -^■М J P[yt'-J\Zt=n = ^7-^, (10.135) 421 у!
где F(y'wt) - функция, определяющая вероятность первого режима, в ка- честве которой часто используют функции законов нормального или ло- гистического распределения (см. соответственно выражения (10.50) и (10.52)); Wt- независимые переменные, влияющие на вероятность второго режима; у- вектор параметров. 10.4. МОДЕЛИ С ОГРАНИЧЕННЫМИ ЗАВИСИМЫМИ ПЕРЕМЕННЫМИ В практике социально-экономических исследований на микроуровне достаточно часто возникают ситуации, когда зависимая переменная явля- ется количественной и непрерывной, т.е. удовлетворяет предпосылкам классической модели, но выборка подвергается усечению или цензуриро- ванию. Усечение имеет место, когда данные выбираются из некоторого боль- шего по объему подмножества данных (наблюдений), например, в иссле- довании доходов рассматриваются семьи с доходами ниже или выше оп- ределенного уровня (скажем, черты бедности). Вместо усечения выборок может применяться также их цензурирова- ние. В частности, в исследованиях доходов рассматривается вся выборка, но принимается, что у семей с доходами выше или ниже определенного уровня доходы находятся на этом же уровне. Следствием цензурирования и усечения выборок является искажение значений выборочных парамет- ров распределений, в частности, их математических ожиданий и диспер- сий. Соответственно выводы, полученные на основании усеченных и цен- зурированных выборок, следует очень осторожно распространять на генеральную совокупность. 10.4.1. Модели усеченных выборок Предположим, усеченное распределение является частью неусеченно- го распределения, которая находится выше или ниже определенного по- рогового значения. Плотность непрерывной случайной переменной z, усеченной вьипе уровня Ь, определяется согласно следующему выражению: /(zlz<b) = -^^. (10.136) P{z<b) 422
Выражение (10.136) вытекает из формулы условной вероятности. В самом деле, условная вероятность того, что случайная величина z примет некоторое значение при условии, что z< b, определяется следующим об- разом: \^ f(z\z>b)dz = l^ f(z.z>b)dz/j^ f(z>b)dz. (10.137) Продифференцировав левую и правую части вьфажения (10.137) по z, получим (10.136). Во многих практических исследованиях предполагается, что случай- ная величина z распределена по нормальному закону. В этом случае веро- ятность того, что z>b определяется согласно следующему выражению: P(z>b) = l-Ф\^^^] = \-Ф(P), (10.138) где //НО"- соответственно математическое ожидание и стандартное от- клонение случайной величины z; fi=(b-fi)/o\ Ф(.) - значение стандартной нормальной интегральной фушщии распределения в соответствующей точке. Тогда согласно выражению (10.136), функщм плотности усеченного нормального распределения определяется как: f(z\z>b)= ^^^^^ =i^^ ^-^ а \ а (10.139) где ^.) - стандартная нормальная функция распределения. На рис. 10.6 представлены графики функций плотностей усеченно- го стандартного нормального распределения с //=0 и о^=1 для 6=-0,5; 0; 0,5. Из графиков, представленных на этом рисунке следует, что усече- ние как бы «поднимает» функцию плотности на оставшемся после усечения участке над графиком этой функции «неусеченного» распре- деления. В дальнейшем случайную переменную с усеченным распределением будем называть усеченной случайной переменной. Заметим, что математическое ожидание и дисперсия усеченной случайной переменной определяются согласно следующим выраже- ниям: 423
M[z\z>b] = j^^(z\z>b)dz. (10.140) D[z\z>b] = j^(z-M[z\z>b]j^f(z\z>b)dz. (10.141) Проведя интегрирование в выражениях (10.140)-(10.141) с учетом то- го, что функция плотности Дг, z>b) определена вьфажением (10.139), по- лучим, что математическое ожидание и дисперсия усеченной случайной переменной z соответственно равны: M[z\npu усечении]=//+о= Дуб!). (10.142) D[zlnpH усечении]=о-^[1-^уб!)]. (10.143) где^(Ь~м)/<т, ЯФ=ЧФ1[\-Ф(М, если t>b; ^Ф^<1ф1Фф, если z<b; (10.144) (10.145) (10.146) Плотность Рис 10.6. Зависимости плотностей усеченного нормального распределения от степени усечения Функцию ^Р) называют обратным отношением Миллса или функцией отказов (Aazarrf-function), Ъ - степенью усечения. Заметим, что дф^\ при любом значении Д Из вьфажения (10.142) следует, что математическое ожидание усечен- ной стандартной нормальной переменной является функцией от степени усечения (см. рис. 10.7). 424
Рассмотрим некоторые результаты, приведенные на рис. 10.7. В част- ности, математическое ожидание стандартной нормальной величины при усечении z^ равно 0,79, а при усечении zSb равно -0,79. Несложно также убедиться, что вероятность того, что х меньше Ь, яв- ляется возрастающей функцией от Ь. С возрастанием этой вероятности увеличивается количество нерассматриваемых элементов совокупности, а следовательно, возрастает и математическое ожидание усеченной слу- чайной переменной. Рис. 10.7. Графики зависимости математических ожиданий стандартной нормальной величины от степени усечения На рис. 10.8 приведена функция, отражающая взаимосвязь между ма- тематическим ожиданием M[z\z>b] и вероятностью P[z>b] для стандарт- ного нормального распределения. 3 M[z\z>b] P[z>b]=Oz^b^>+oo +00 P[z<b]=\=>b-^>-^ о 0.5 1 Рис. 10.8. Условное среднее как функция степени усечения 425
Предположим, что зависимость некоторой случайной переменной ух, от значений влияющих на нее факторов, можно представить следующим образом: yt^d'Xt+St. (10.147) где JC, - вектор независимых переменных, влияющих на переменную уг\ а- вектор параметров; St - ошибка модели, в отношении которой предполага- ется, что она распределена по стандартному нормальному закону с нуле- вым математическим ожиданием и постоянной дисперсией, St ~^V[0, ст^]. Переменная yt, описанная выражением (10.148), распределена по нор- мальному закону с математическим ожиданием fj^a'xt и дисперсией ст^. Рассмотрим распределение зависимой переменной j, при условии, что наблюдаемые значения ух превышают некоторый порог Ь, Согласно вы- ражению (10.142) получим, что условное математическое ожидание у/для модели (10.148) является нелинейной функщ1ей от jc, и а; и определяется как М/з',1.,>^7 = а'-.,-ьсг.-М^1^4^. (10.148) \-Ф[(Ь-ах^)/а] Перепишем выражение (10.149) с использованием функции отказов >1(Д) (см. выражение (10.144)): Щуг I Ух >b]=a''Xt +аЩ\ (10.149) гдеД=(Ь-а'х,)/с7. С учетом вида выражения (10.150) оценим величину маржинального эффекта факторов дс, для случая усеченной выборки: Б = а^+сг-—-•—-== a+c7(Af-y?^ Я,)—-= дх^ ар^ oXf G = а(1-Я?+ДЧ) = «(1-^(А))- (10.150) Поскольку для каждого набора факторов Xt выполняется соотношение 0<<5(Д)<1, то из выражения (10.151) вытекает, что для любого JC|7(/=1,2,..., п\ /=1,2,...,7) маржинальный эффект меньше соответствующего коэффи- циента о;. Заметим, что в силу специфики выражения (10.150) ошибка Et модели (10.146), построенной для усеченной выборки, имеет математическое ожидание о=Л(Д). Дисперсия ошибки £Jb этом случае определяется сле- дующим образом: Д^ ■З'г >Ь]=а'[1-^Д)]. (10.151) 426
где (/-дисперсия ошибки модели (10.148), построенной на неусеченной выборке; S,fit)=A(fid[Mj3thj3t]\ ЖА)=9<А)/[1-^(А)]; Д =(Ь -Ы-х^/а Таким образом, из выражений (10.150) и (10.152) вытекает, что оценки параметров модели (10.148), определенные на основании усеченной вы- борки зависимой переменной (yt>b или yt<bX являются смещенными и не- состоятельными по сравнению с оценками, которые могли бы быть полу- чены по полной выборке. 10.4.2. Модели цензурированных выборок Напомним, что в случае цензурирования зависимой переменной у, вместо ее значений выше (или ниже) определенного уровня рассматрива- ется сам этот уровень. Например, если спрос на билеты существенно превышает предложе- ние, то за уровень спроса принимается количество проданных билетов (цензурирование сверху). В этом случае распределение случайной вели- чины может быть представлено в виде сочетания дискретного и непре- рывного распределений (см. рис. 10.9). Спрос на места Проданные билеты Рис, 10.9. Распределение, цензурированное «сверху» Подходы к исследованию цензурированных и усеченных выборок очень похожи. Также обычно предполагают, что случайная переменная у имеет нормальное распределение. 427
Покажем, как изменятся математическое ожидание и дисперсия случайной переменной у^ если выборка ее значений цензурируется снизу. Введем в рассмотрение новую случайную переменную д' такую, что еслид' <Ьу1оу=Ь\ если у*>Ъ^ то >^*, (10.152) где b - точка цензурирования. Если>'*~^|//,а^], то математическое ожидание и дисперсия цензуриро- ванной случайной величины у соответственно равны^ М[у]=ф.Ь+(1-ф).(/^о:Я); (10.153) О[у]=^(1-Ф>[(1-<5)+0в-Я)^Ф], (10.154) где Ф[( й-//)/с^=ФОб!)=Р(у*^ 6)=Ф; (10.155) Л^^(1-Ф); (10.156) ^Я^-ЯД (10.157) ^ Доказательство: Используя (10.142), вьфажение математического ожидания цензурированной пе- ременной запишем в следующем виде: Ь4[у\^Р{у:=Ь)уЩу\ y=bV?{y>b)yM[^y>b\^?{y<. Ь)хЫ- Р(у*>Ь)хМ[у*\у*>Ь]=Ф1и-(1- Используя известную формулу представления дисперсии случайной величины 0[у]=Щусловягя дисперсия]+ Ь[условное среднее] с учетом выражений (10.142)- (10.143), имеем АЯусловное среднее]=ФО[у1 у=Ь]+(1-Ф)^[у1 >^>Ы=ФаК1-Ф)-^[у*1 у*>Ь]= (1- Ф).о2(1-^; О[условное среднее]=Ф {b-'^f[y] ] Ч( 1-Ф)- {М[у\ y>bhM\y]} ^= =Ф{/м1)М1^)(/^<уЯ)}Ч(1-Ф){(/^^А)-ФМ1-Ф)(/я-а^Я)}^= Сделав замену 6-/^ (тДприведем в этом выражении подобные составляющие. В результате получим: Дусловноесреднее]={Ф(1-Ф)^1-Ф)Ф^)а^-(>3-Я)^=Ф(1-Ф)а^(Д-Я)1 Из последнего выражения непосредственно следует, что дисперсия Dly] может быть представлена в следующем виде: £)|>]=(Т^(1-Ф)[(1-|$)+0»-Д)2.ф]. При Ь=0 вьфажение математического ожидания переменной у имеет следующий вид: Л/[у1Ь = 0] = Ф-^(// + (7а),где Я=^^^^^\ а Ф(///{7) Если цензурирование проводится сверху, необходимо только заменить Ф на 1-Ф и переопределить Л, как в выражении 10.144. 428
Цензурированная модель ((оВк-модель) Для описания зависимости цензурированной переменной уг от влияю- щих на нее факторов обычно используется так называемая и>ЬИ'Модель. ГоЬ/г-модель исходит из того, что цензурированная переменная У( опи- сывается следующим выражением: yf^d'X&et. (10.158) где yt - наблюдаемые значения зависимой переменной (например, либо фактические расходы на отдых за границей, либо 0); лг, - вектор незави- симых переменных, влияющих на зависимую переменную >^ а - вектор параметров; £} - опшбка модели. Далее юЫг-мололь предполагает, что цензурированным значениям yt (т.е. уг=0; Ь=0 - точка цензурирования) соответствует неположительное произведение o(xt (dxt<0); а нецензурированным значениям у^- положи- тельное (ofxi>0). Из выражения (10.159) следует, что условное математическое ожида- ние переменной д', по факторам JC/определяется как Af[yJ=^.jc,. (10.159) Математическое ожидание yt с з^етом цензурирования (т.е. Afly/***"]) для точки цензурирования £?=0 определяются следуюпщм образом (см. выражение (10.154)): М/уГ^^г7 = <р[^]г«'^г<^Ч^ (10.160) где ^ Ф{Ых,/а) В соответствии с выражением (10.159) мгфжинальные эффекты факто- ров Xt для математического ожидания переменной yt (без учета цензури- рования) определяются как Шл1^ = а. (10.162) дх, В соответствии с выражением (10.161) м^)жинальные эффекты факто- ров Xt для математического ожидания переменной yt с учетом цензуриро- вания могут быть представлены в следующем виде: тУГ}^ = а.ф(^]. (10.163) 429
Заметим, что Гс>й/^-модель предполагает, что изменение факторов jc, приводит к тому, что вероятность P(yt>0) и математическое ожидание M(yt\y^) обязательно меняются в одинаковом направлении. Действи- тельно, согласно выражению (10.156) вероятность того, что у;>0 опреде- ляется как P(yi>0)=P(d'Xt >0)=Ф(а'х^ /о). (10.164) Соответственно маржинальный эффект факторов д:, для вероятности P(yi>0) может быть представлен в следующем виде: dP(yi>0)/dxr=(iKa'xtya (10.165) Если коэффициент cXi положителен, то согласно выражениям (10.164) и (10.166) с увеличением фактора JC/, (/=1,2,..., п; Г=1,2,..., Т) увеличивается как математическое ожидание М(у^у^>0), так и вероятность Р(у/>0), и, на- оборот, при отрицательном л; с ростом фактора хц эти показатели умень- шаются. Вместе с тем заметим, что эффект одновременного увеличения мате- матического ожидания и вероятности при увеличении некоторого незави- симого фактора JC/ на практике может и не иметь место. В частности, как показали Фин и Шмидт (Fin and Schmidt, 1984), независимая переменная Xi, увеличивающая вероятность нецензурированного наблюдения (Р(у,>0)), не всегда увеличивает и математическое ожидание переменной (M(yt\yt>0)y В качестве примера они приводят потери от пожаров в здани- ях. Вероятность возникновения пожара в старом здании выше, следова- тельно dP(yt>0)/dxit>0 (xit - возраст г-го здания), но так как старое здание стоит дешевле, то и пожар в нем приносит меньше убытков, т.е. dM(yt\yt>0)/dxit<0, Таким образом, в данной задаче предполагается, что ко- эффициент Oi при факторе «возраст здания» имеет разные знаки в функ- циях вероятности и математического ожидания. В рамках Гс^Ь/г-модели это учесть невозможно. Для описания процессов, в рамках которых предположение об одинаковом характере маржинального эффекта математического ожидания и вероятности не выполняется, была предложена более общая модель, являющаяся сочетанием одномерной ргоб/г-модели и усеченной регрессии (для нецензурированных значений зависимой переменной). На основе probit-модсли определяется вероятность нецензурированно- го (или цензурированного) наблюдения при данном наборе факторов jc^ P\Уt>0]=Ф(/x,У,Zt=h Р[у^]=1-ф(/л:,); zt =0, (10.166) 430
где Ф{fx^ - интегральная функция закона нормального распределения, определяющая вероятность нецензурированного наблюдения; у~ вектор параметров модели, Zt - переменная-индикатор, принимающая значение 1 для нецензурированного наблюдения и значение О - для цензурированно- го. Далее на основе модели усеченной регрессии определяется математи- ческое ожидание нецензурированного наблюдения. В соответствии с вы- ражением (10.150) математическое ожидание нецензурированной пере- менной может быть представлено в следующем виде: М\у, \z, =\\=dxt н-о^Л. (10.167) Заметим, что если у=^а1о, то модель (10.167)-(10.168) сводится к tobit- модели. ЮАЗ. Модели случайно усеченных выборок (selection-model) Предположим, что переменные у \^z имеют двумерное распределение с коэффициентом корреляции /7. Найдем распределение у по случайной выборке (у, z) условии, что уровень переменной z превышает определен- ное значение (z>b). Интуиция подсказывает, что если у }\z положительно коррелированы, то усечение z должно подвинуть распределение >^ вправо. Нахождение распределения д' связано с определением, во-первых, вида функции плотности случайно усеченного распределения переменных у и Z, и, во-вторых, математического ожидания и дисперсии случайно усе- ченной переменной у при условии, что y\iz подчинены закону двумерно- го нормального распределения. Усеченная совместная плотность у ^ z согласно выражению (10.136) при любом распределении этих переменных определяется следующим выражением: /(>',^1>Ь) = -^^. (10.168) P(z > Ь) Если y\iz распределены согласно двумерному нормальному закону с математическими ожиданиями //у и //^ и стандартными отклонениями с у и О" г, а коэффициент их парной корреляции равен р, то в соответствии с выражениями (10.142)-(10.143) условные математическое ожидание и дисперсия 3^ при усече1ши z определяются следующим образом: Af[ylz>b]=/^+/>c7, •КРд\ (10.169) D[ylz>b]=c7/.[lV-^y9,)], (10.170) 431
где Рг<Ь-^1у)1<^г^ (10.171) Ж>0г)=<2КА)/[1^О&г)]; (10.172) ^А)=^А){ЖАЬА]. (10.173) Заметим, что при усечении сверху, т.е. z<b, математическое ожидание и дисперсия переменной у также определяется согласно вьфажениям (10.169) и (10.170) при КРг)^(ЦРг)1 Ф(А). Из выражения (10.169) следует, что при усечении «снизу» условное математическое ожидание у смещается в направлении корреляции пере- менных у vi. Zy если усечение проводится «сверху», то - в направлении противоположном корреляции. Случайное усечение уменьшает диспер- сию, т. к. diPz) и /^ принадлежат интервалу (0,1). Рассмотрим два примера, иллюстрируюидих случайное усечение. Предположим, что любая женщина выходит на работу только в том случае, если ее потенциальный доход будет превышать некоторый крити- ческий уровень (для каждой женщины свой). Допустим, переменная Zt представляет собой разность между потенциальным и критическим дохо- дом, и зависимость между переменной Zt и влияющими на нее факторами jc/^^ можно представить следующим образом: Zr^ol'Xt^^^+4^\ (10.174) где Xt^^ - вектор независимых факторов, влияющих на разность доходов (например, возраст, образование, количество детей и т.д.); а- вектор па- раметров модели; е^^"^ - ошибка модели. Для всех женщин, у которых Zr>0, требуется определить желательное количество рабочих часов yt. Предположим, что зависимость между пе- ременной yt и влияющими на нее факторами jc/^^ также можно описать линейной эконометрической моделью: ^'FyffWV^^'^, (10.175) где jc/ ^ - вектор независимых факторов, влияющих на желательное коли- чество рабочих часов (например, семейный статус, количество детей и т.д.); fi- вектор параметров модели; f/^^ - ошибка модели. Заметим, что векторы л:/^^ и jc/^^ могут как совпадать, так и отличаться друг от друга. При формировании модели (10.175) возникает проблема усечения, по- скольку данные о часах работы имеются только для работающих женщин, т.е. число часов - случайно усеченная переменная. 432
в разделе 10.3.1 рассматривалась модель миграции, в которой пере- менные, влияющие на принятие решения о смене места жительства, были представлены эконометрическими моделями в зависимости от набора со- ответствующих факторов. В целом модель содержала три уравнения: чистая прибыль от переезда - Л^^ -y-Wt +м^; (10.176) доходы при переезде -yj^ =a'xf +б^^; (10.177) доходы при «непереезде» - у Г =Р'хГ -^еГ, (10.178) р т где Wt, Xf HXt - векторы независимых переменных, влияющих соответст- венно на чистую прибыль от переезда, и доходы в случае переезда и «не- переезда»; Уу аи fi- векторы параметров; щ, е/'иеГ- ошибки модели. Предположим, что совокупность мигрантов формируется из числа лиц, желающих переехать, для которых чистая прибыль от переезда по- ложительна. Чистая прибыль от переезда Zt определяется согласно выра- жению (10.176) как z*=fwt+ut. (10.179) Для совокупности мигрантов формируется уравнение, связьшающее величину их дохода на новом месте yt с некоторым набором факторов jc,, характеризующих, например, опыт работы, пол, образование и т. д: yt=0('Xf^€t, (10.180) где а- вектор параметров; St - вектор ошибки. Переменная д'г является случайно усеченной, так как информация о до- ходе мигранта может быть получена, когда переезд индивидуума на но- вое место жительства уже осуществился, и индивидуум приступил к ра- боте. Поскольку доход на новом месте и чистая прибыль от переезда взаи- мосвязаны, ошибки Et и Uj моделей (10.179) и (10.180) взаимозависимы. Предположим, что они распределены согласно двумерному нормальному закону с нулевыми математическими ожиданиями и коэффициентом кор- реляции р. В этом случае в соответствии с выражениями (10.169)- (10.170) получим: M\yt I yt наблюдаемый доход]=М|>^ \zt*>0]=M\yt I Ut>-y^Wt\= =a'-Xt-^M[et I Ut>-y^Wt\=a''Xt-^p-CeXtФи>сс'-Хг +агдЛ(Д), (10.181) где Д ^^y-wt l(Ju и XiPu>(f{y'Wt /cTj/0(/wr /crj. Выражение (10.181) показывает, что условное математическое ожида- ние выборочной совокупности доходов мигрантов при условии Z/>0 нахо- дится в непосредственной и опосредованной зависимости от факторов х,. 433
Непосредственная зависимость выражается слагаемым а'дгг, а опосредо- ванная, характеризующая влияние факторов Xt на вероятность того, что переменная Zt положительна, определяется слагаемым/>0'£>?ХА). На практике значение переменной Zt не наблюдается, она является ла- тентной. Наблюдаемая переменная z принимает значение 1 (событие про- изошло) или О-в противном случае. В наших примерах: женщина рабо- тает или нет, индивидуум мигрирует или нет. С учетом этого представим модель (10.179)-(10.180) в виде совокупности двух следующих моделей: 1. Модели селекции, определяющие выборку мигрантов Zt =r'-^t+"t'> Zi=l, если г,*>0; Zr=0, если Zt<0; Р(г,=1)=Ф(уЧ); (10.182) (10.183) (10.184) (10.185) P(zt=0)=l^(r'wtl (10.186) 2. Модели дохода мигранта yt=a'-x,+e,, (10.187) yt представляет собой значение дохода индивидуума, фактически сме- нившего место жительства, случайную выборку мигрантов, лиц фактиче- ски сменивших место жительства, для которого Zr =1. В соответствии с введенным предположением о зависимости между ошибками StH Ut моделей (10.179) и (10.180) закон их совместного рас- пределения характеризуется следующими свойствами: (м„£^)~М0,0,1,а^/7). (10.188) Согласно выражению (10.169) условное математическое ожидание у, npHZr=l определяется согласно выражению: М[у, \zt=l]=a''Xf¥/>(Te'Mr'wt). (10.189) 10.5. МЕТОДЫ ОЦЕНКИ ПАРАМЕТРОВ МОДЕЛЕЙ С ДИСКРЕТНЫМИ И ОГРАНИЧЕННЫМИ ЗАВИСИМЫМИ ПЕРЕМЕННЫМИ Для оценивания параметров моделей с дискретными и ограниченными зависимыми переменными обычно применяется метод максимального правдоподобия. Однако для оценивания моделей бинарного выбора ис- 434
пользуется так называемый «метод максимального счета». Рассмотрим особенности этих методов более подробно. 10.5Л. Метод максимального правдоподобия Из-за специфических свойств моделей с дискретными и ограниченны- ми зависимыми переменными, метод максимального правдоподобия име- ет некоторые особенности. Покажем их на примере моделей бинарного выбора. Предположим, что наблюдения у^ уг,.--, Ут независимы. Поскольку з', может принимать только значения Он 1, то функция правдоподобия для бинарной модели имеет следующий вид: 1 = Цу^.У2....Ут)= Ш^-Па'х,)У Uf(ax,). (10.190) Представим выражение (10.190) в несколько другой форме: L = flF[(a'x,)]yf [l-F(a'x,)]^-y^, (10.191) r=i где переменная yt принимает значение О или 1. Логарифм выражения (10.191) имеет следующий вид: / = lnL = £(y^lnF(ax,)-H(l-y^)ln[l-F(flri,]}\ (10.192) r=l Необходимыми условиями максимизации функции правдоподобия яв- ляются равенства нулю всех частных производных ее логарифма по па- раметрам а; т.е. г=1 y^f^Mi-y.y -А . .., . Jfr=0. (10.193) F, ^'' (l-F,)' nQft=A^Xt) и Fr=F(o(xt\ т.е. функции/, и Ft имеют аргумент ofxt. Подходы к решению системы (10.193), т.е. к получению оценок коэф- фициентов о; зависят от формы функционалов Дд^д:) и F{dx). При этом заметим, что если F{clx^ нелинейны, то уравнения в (10.193) также нели- нейны. Для их решения (т.е. для получения оценок параметров d) исполь- зуются итеративные методы, описанные в XI главе. В частности, для to^/r-модели логарифм правдоподобия выглядит сле- дующим образом: * Если распределения являются симметричными, как, например, нормальное и ло- гистическое, то 1- F{dx) = Firdx). 435
dxt M 1 + e" ' \-ln a необходимыми условиями его максимизации являются: .«^'^ yt- l + e'^'t х,=0. (10.194) (10.195) Для нормального распределения логарифм функции максимального правдоподобия может быть записан в следующем виде: Z = lnL= 21п[1-Ф(вг'ж,)]+5:1пФ(а'*1)- (10.196) в этом случае необходимые условия максимизации функции правдо- подобия могут быть представлены в виде системы: (10.197) где (Pt=- 1 ■■ехр\- l(y,-</x,/(y,-t/x,) (10.198) (10.199) Ф, =|^'^и)^м. Рассмотрим особенности применения метода максимального правдо- подобия для оценки двумерной ргоЬк-моделя типа (10.72). Как было от- мечено выше, вероятность того, что зависимые переменные Yi и Уг систе- мы (10.72) для конкретного индивидуума принимают соответственно значения y,i и уа, рассчитывается как P(Yi=y,u 12=Уй)=Ф2(и',1, wa,Pt*), где Wff= q,fZtf; г^а'рсф]=\,2; Pt*=4ty Чару qn=2yn-l;qa=2yt2-l. (10.203) Логарифм функции правдоподобия будет иметь следующий вид: l = lnL=2^]nФ2iw,l,W,2,Pt*), 436 (10.200) (10.201) (10.202) (10.204)
где 02(wir.W2r»AO = f^n!?>2(wi.W2»A*)^wi^M2 » (10.205) а плотность этого распределения имеет следующий вид: Первые проюводные логарифма правдоподобия по параметрам щ, /=1,2; и р определяются как dlnL/daj = U^^^^^^^^\x,jJ = 1,2; (10.207) Эыидр = 1^^^^^^^^^^У1Г±^, (10.208) где 8л=<Р(^п)Щ w,2-p,*w,i = f{(2y,i-l)a{x,i]x [ f^ J ^^Ф (2у<2 -1)о4*<2 -A* (^Уп -l)-g[jfti (10209) И индексы 1 и 2 в 9/1 перевернуты для получения да- Оценки максимального правдоподобия получаются путем одновре- менного приравнивания трех производных (по аи Ok^p) нулю. Модель Пуассона, являющаяся базовой моделью счетных данных (см. выражение (10.118)), представляет собой нелинейную регрессию. Лога- рифм функции правдоподобия для модели Пуассона имеет следующий вид: Z = lnL=iM,+y,a'x,-ln(y,!)] = t=\ = Ъ-е"^'' +У/ (Х" X, -1п(у,!)]. (10.210) г=1 Необходимые условия его максимизации можно записать следующим образом: Э/п£/Эа = £Гу, -е^'^ )х,=0. (10.211) 437
Рассмотрим особенности выражений для оценки параметров усечен- ной регрессии (10.148). В соответствии с выражением (10.139) плотность распределения усе- ченной случайной переменной;;,определяется как (10.212) Логарифм функции правдоподобия является суммой логарифмов этих плотностей, т.е. т 1п1 = 1 = --[1п(2ж) + 1па^}—K-Y,(yt-<x'xt)'^- 2ст^Т=1 .^^1п(1-ф(±:Щ. г=1 (10.213) После некоторых преобразований выражения, на основании кото- рых определяются оценки параметров, модели примут следующий вид: да да' r=iv а т Г г=1 1 ^(у.-а'х,)^ ^^'^1^0; 20-^ la"^ IG^ (10.214) где Д ^{Ь -а'-хг)1аи Л =<Р(Д)/[1-Ф(Д)]. Рассмотрим оценивание параметров гоЫг-модели (10.159). Логарифм функции правдоподобия для цензурированной регрессии может быть представлен следующим образом: yt>0 1п(2ж) + 1па^ -v-^—^-^ 2 (т^ + ^/п|1-Ф С ^' \ (10.215) Первая часть выражения (10.215) соответствует классической рег- рессионной модели для нецснзурированпых наблюдений, а вторая часть - вероятностям для цензурированных наблюдений. Это - не- 438
стандартное выражение логарифма правдоподобия, так оно получено на основе сочетания дискретного и непрерывного условных распреде- лений. Необходилоле условия максимизации функции правдоподобия будут иметь следующий вид: да Ы Уг>0 V о' J у,=о^ ( . /.. ^/ а \ ^<^ У(>0 (Уг-oucJ = Z\-^^'' 7 -hZ^4^=0>(10-216) 2ст^ la"^ АЧ_, У(>0 2СГ где Д =(Ь -а'хд/(7и Л =^)/[1-Ф(Д)]. Асимптотическая ковариационная матрица оценок^ параметров моде- лей с дискретными и ограниченными зависимыми переменными, полу- ченных с помощью метода максимального правдоподобия, может быть определена двумя способами: 1) как обратная матрица к матрице математического ожидания вторых производных логарифма правдоподобия (взятой с противоположным зна- ком): AsyCov(a)= (-М(д^1/да 'да)Т\ (10.208) где AsyD(a) - асимптотическая ковариационная матрица оценок макси- мального правдоподобия. Заметим, что матрица вторых производных логарифма правдоподобия используется в итеративных расчетах при получении оценок параметров. 2) как оценка Берндта, Хола, Хола и Хаусмана (БХХХ-оценка): AsyCov(a) = /? = I g? • JC,. jc;, (10.209) г где gt = yt -At для logit-MOflfiJiu Hgt = At для probit-модсли (At определено в выражении (10.193)). БХХХ-оценка применяется при тестировании гипотез о коэффициен- тах моделей с дискретными и ограниченными зависимыми переменны- ми. ^ При некоторых условиях регулярности последовательность случайных векторов 'Jfia-f -а) сходится по распределению к нормально распределенному случайному вектору с нулевым средним и матрицей ковариаций IT^id). Вследствие этого матрица 1Г\с(^ называется асимптотической ковариационной матрицей оценки максимального правдоподобия а. 439
10.5.2. Метод максимального счета (MSCORE) Рассмотрим особенности метода максимального счета, применяемого наряду с методом максимального правдоподобия для оценки параметров модели бинарного выбора. Этот метод использует критерий, представляющий собой максимум числа совпадений реальных и расчетных ответов, который можно пред- ставить в следующем виде: M2iXaSfl(a) = ^J:[zt-(l-2fi)sga(ax,)]\ (10.210) Параметр J3- это установленный квантиль; sgn(ofxt) - знак числа д^х,; Zi=2yt -1 (zt =-1, если yt=0\ zi=l, если Уг=^). Если Д=1, метод максимально- го счета выбирает оценку параметров а таким образом, чтобы максими- зировать число раз, когда о^х^ имеет тот же знак, что и Zt- Метод по своей сути является полупараметрическим, поскольку он использует не параметры распределений, а их заменители. Оценки параметров Л/ (/=1,2,..., п) определяются путем перебора воз- можных их сочетаний при заданном уровне точности (например, 0,0001) с учетом ограничения ^af = 1. Так как метод максимального счета не предполагает вычисление функции правдоподобия, то невозможно определить и информационную матрицу для определения стандартных ошибок оценок. Чтобы получить представление об изменчивости оценок, обычно используется метод са- монастройки (bootstapping). Он заключается в следующем. После вы- числения набора оценок коэффициентов ат из выборки делается К слу- чайных подвыборок, содержащих по г наблюдений. Для каждой к-и под- выборок метод максимального счета дает свои оценки а^к). Тогда сред- неквадратические отклонения можно оценить следующим образом: М80(а)=^^:[а^(к)-атНаг(к)-атГ. (10.211) ^ к=1 Отметим еще раз, что элементы матрицы MSD не являются ковариа- циями соответствующих оценок, они лишь характеризуют их взаимную изменчивость. ^ См.: Мански (Manski, 1975,1985, 1986) и Мански и Томпсон (Manski and Tompson, 1986) 440
Преимущество полупараметрических методов оценки параметров состоит в том, что при их использовании не возникают ошибки, свя- занные с неправильным выбором закона распределения погрешностей модели. С другой стороны, нет никаких гарантий, что полученные на их основе оценки будут лучше, чем «параметрические». Существен- ным недостатком полупараметрических методов является то, что они требуют очень большого количества вычислений для получения оце- нок параметров. Это выдвигает определенные ограничения в отноше- нии максимального количества параметров модели и объема исходной информации. Сейчас метод максимального счета не используется для оценки более чем 15 коэффициентов на основе 1500-2000 наблюде- ний. Еще один недостаток этого подхода обусловлен невозможностью параллельного получения вместе с оценками параметров дополнитель- ной информации, относящейся к характеристикам качества модели, точности оценок и т.п. Для содержательного анализа влияния факто- ров на зависимую переменную очень важны маржинальные эффекты, а на основе полупараметрических методов оценить их также не пред- ставляется возможным. Как развитие метода максимального счета можно рассматривать пред- ложенный его авторами метод вторичного анализа результатов. Этот ме- тод позволяет получить оценки математического ожидания переменной yt, в зависимости от величин влияющих на нее факторов. Рассмотрим основные положения этого метода. Пусть Fc/iZt>M\yt\o(xr=Zt\ (10.212) представляет собой гладкую функцию «отклика» yt на дг^. Основываясь на векторе параметров оценок параметров а (полученном с помощью метода максимального счета), авторы предлагают построить FJiZt) с помощью так называемого кете1'МСтода, Для вектора оценок параметров а и известных значений независимых переменных л:Д/=1,..., Т) определим следующие значения: Zr=a% (10.213) (10.214) Для проювольного значения z , принадлежащего области допустимых значений произведения а'х, можно определить следующий набор весов (кете1-функщ1и) w,(t=l,..., Т): wiz') = m.z*-z,)KXs)l (10.215) 441
rt = (z-Zt)/(Asl (10.216) где K(n) = P(n)[l-P(n)] (10.217) и Р(П) = [1 + ехр(-с • п)Т\ (10.218) Константа с = (л'/л/3)"^ «0^5 используется для стандартизации логи- стического распределения, которое применяется в Л^т^/-функции; Л - параметр сглаживания. Значения Я должны быть достаточно велики, что- бы функция F(z ) была гладкой, использование маленьких, близких к ну- лю значений Я усиливает большую колебания функции. Хорошей теоре- тической основы для выбора Я не существует, за исключением некоторых предположений, которые можно сделать на основе описательной стати- стики. Функция F(z ) (в выражении (2.212)) определяется следующим обра- зом: F(z*)-^ . (10.219) r=l где наблюдаемые значения >^^, г=1,..., Г. Расчетные значения функции F(z) при заданном наборе факторов Xt обычно интерпретируются как математическое ожидание зависимой пе- ременной yt (MyJ). ВОПРОСЫ к ГЛАВЕ X 1. Каковы последствия ошибок измерений зависимой переменной? 2. Каковы последствия ошибок измерений независимых переменных? 3. Каковы последствия ошибок измерений и зависимой, и независи- мых переменных? 4. Охарактеризуйте модели с фиктивными независимыми переменны- ми. 5. Дайте классификацию моделей с дискретными зависимыми пере- менными. 6. В чем состоит суть моделей бинарного выбора? 7. Какие законы распределений наиболее часто используются в моде- лях бинарного выбора? 8. В чем состоят недостатки линейной модели вероятности? 442
9. Охарактеризуйте модель бинарного выбора, исходящую из группо- вых данных? 10. Что собой представляет многомерная ргоЬи-модсяъ! 11. Что собой представляют модели множественного выбора? 12. Какие типы моделей используются для описания выбора среди не- упорядоченных альтернатив? 13. Каким образом моделируется выбор среди упорядоченных альтер- натив? 14. Какие законы распределений используются в моделях счетных данных? 15. Охарактеризуйте последствия построения эконометрической моде- ли на основе усеченной выборки? 16. Как изменяются математическое ожидание и дисперсия зависимой переменной, если при оценки параметров модели используется цензури- рованная выборка? 17. Охарактеризуйте модели случайно усеченных выборок. 18. Каковы особенности применения метода максимального правдо- подобия для оценки параметров моделей с дискретными зависимыми пе- ременными? 19. Как выглядят необходимые условия максимизации логарифма функции правдоподобия для моделей усеченных и цензурированных вы- борок? 20. Что собой представляет метод максимального счета? 21. В чем суть кете1'Мегтодз,1 УПРАЖНЕНИЯ К ГЛАВЕ X Задание 10.1 Logit-модель была применена к выборке, в которой у=1, если ко- личество занятых в фирме выросло (у=0 - в противном случае), jci - доход фирмы, в млн. $; д:2=1, если фирма относится к области высоких технологий (л:2=0 - в противном случае). Получена следую- щая модель: Z = 0,40 -Н 0,20 • jci + 0,10 • ДС2 • Требуется определить оценку вероятности роста занятости для высокотехнологичной фирмы А с доходом в 5 млн. $ и для фирмы Б, не относящейся к сфере высоких технологий и имеющей доход 7 млн. $. 443
Задание 10^ Имеется выборка, состоящая из S28 наблюдений, в которой у=1, если заработная плата работника ниже 5$ в час (у=0 - в противном случае). Предполагается, что уровень заработной платы зависит от следующих факторов: х\ - образование, лет; Х2 - пол (1-женский, О - мужской); дсз- опыт работы, лет. В табл. 10.1 приведены коэффшщенты, полученные при оценке линейной регрессии у от jci, дг2 и хз с помощью МНК, и при оценке Logit-модели с помощью нелинейного МНК. Таблица ЮЛ 1 1 XI Х2 L ,й.-. Коэффициенты линейной регрессии 0,94 -0,05 0,15 -0,01 Logit-модели 5,87 -0,56 1,26 -0,06 Выборочные средние 1 1 13.09 0,46 17,66 1 Требуется: 1. Определить на основе Logit-модели оценку вероятности для мужчи- ны и для женщины, имеющих 12 лет образования и 15 лет опыта работы, оказаться низкооплачиваемыми работниками. 2. Определить на основе Logit-модели изменение оценки вероятности быть низко оплачиваемым работником для мужчины с характеристиками из п. 1, если он проучится на один год больше. 3. Ответить на вопросы пп. 1-2 с использованием линейной регресси- онной модели. Задание 10.3 Имеется выборка, состоящая из 528 наблюдений, в которой у=1, если работник состоит в профсоюзе (у=0 - в противном случае). Предполага- ется, что членство в профсоюзе зависит от следуюпщх факторов: хх - об- разование, лет; Х2 - пол (1-женский, О - мужской); хз - опыт работы, лет; ха- опыт работы в квадрате. Выборочные средние равны у = 0,18; Ji =13,09; ]Р2=0'46; ]?з =17,66; JP4 =459,45. На основе выборочных данных была получена следующая Probit- модель: у = F(-0,900-0,015jci -0,599^2 +0,029;сз -СОООЗлд). 444
Требуется определить, насколько снижается вероятность быть членом профсоюза в расчете на год дополнительного образования. Задание 10.4 Имеется набор данных, состоящий из 6 наблюдений. ^^ О О О 1 1 1 JC -1 -2 О 1 11 Требуется: 1. Оценить линейную модель вероятности с помощью МНК. Рассчи- тать Л^. 2. Использовать оцененную модель для разделения индивидуумов на 2 группы. Рассчитать количество случаев правильного отнесения к соот- ветствующей группе, применяя следующее правило классификации: л группа I Су=1), если у > 1/ 2; л группаП(у=0), если у<^\12. Сопоставьте долю правильного попадания и коэффициент детерминации. Задание 10.5 Среди 48 респондентов был проведен опрос о среднемесячных затратах на табачные изделия. Полученные результаты представлены в табл. 10.2. Таблица 10.2 1 700 0 200 1 0 0 800 400 300 450 0 900 500 500 0 400 800 500 450 300 100 0 0 0 0 0 600 0 0 800 400 0 0 500 300 600 0 200 0 0 300 0 0 0 150 400 1 0 0 1200 1 Требуется: 1. Определить по цензурированным данным МНК-оценку параметра Tobit-модели y*=OH-€t, где St -N(0, <}\ и д'/ = у^ , еслиyt>^, yt =0, если 2. Определить по усеченным на уровне О данным МНКюценку пара- метра Tobit-модели. Задание 10.6^ В 1973 году в г. Трое (штат Мичиган) проводился референдум по во- просу о введении местного школьного налога. В ходе опроса выявлялись определенные характеристики участников референдума (см. табл. 10.3). ' Pindyck R, Rubinfeld D. Econometric models and economic forecasts, 1997. C. 331-333. 445
Таблица 10.3 Название ха- рактеристики 1 PUB1 PUB2 PUB3 PUB4 PUB5 PRIV SCHOOL YESVM Значение| 1 2 Один ребенок посещает государственную школу Двое детей посещают государственную школу Трое детей посещают государственную школу Четверо детей посещают государственную школу Пятеро и более детей посещают государст- венную школу В семье есть дети (один или более), посе- щающие частную школу Респондент работает учителем (в государст- венной или частной школе) Респондент проголосовал «за» на референ- думе по вопросу 0 введении местного «школьного» налога 0 1 3 в противном случае 1 В противном случае 1 В противном случае 1 В противном случае 1 В противном случае 1 В противном 1 случае | В противном случае 1 В противном случае 1 Кроме того, ¥ЕАК8=количество лет, прожитых в Трое; LogINC = на- туральный логарифм годового дохода домашнего хозяйства, $; РТСОМ=натуральный логарифм суммы годовых платежей по налогу на имущество, $. Информация о 95 респондентах представлена в табл. 10.4 Таблица 10.4 Хо 1 1 2 3 4 5 6 7 8 9 1 11 PUB1&2 2 0 0 1 0 0 1 0 0 1 1 PUB3&4 3 1 1 0 1 1 0 0 1 0 0 PUB5 4 0 0 0 0 0 0 0 0 0 0 PRIV 5 0 0 0 0 0 0 0 0 0 0 YEARS 6 10 8 4 13 3 5 4 5 10 3 SCHOOL 7 1 0 0 0 1 0 0 0 0 0 LogINC 8 09.770 10.021 10.021 09.4335 10.021 10.463 10.021 10.021 10.222 10.021 PTCON 9 7.0475 7.0475 7.0475 6.3969 7.2792 7.0475 7.0475 7.2793 7.0475 7.0475 YESVM 10 1 0 1 0 0 1 0 0 1 0 1 446
Продолжение таблицы 10.4 [№_ 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 |46^ PUB1&2 1 1 0 0 0 0 1 1 1 0 0 0 0 1 0 1 1 1 1 0 1 0 0 1 0 1 1 0 1 1 1 1 0 1 0 PUB3&4 0 0 1 1 1 1 0 0 0 1 0 1 1 0 0 0 0 0 0 1 0 1 0 0 1 0 0 1 0 0 0 0 1 0 1 PUB5 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 PRIV 0 0 0 0 0 0 0 0 1 0 0 0 0 0 1 0 0 0 1 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 YhARS 30 1 3 3 42 5 10 4 4 И 5 35 3 16 7 5 11 3 2 2 2 2 4 2 3 3 2 10 2 2 3 3 3 6 2 SCHOOL 0 0 0 0 0 1 0 0 0 1 0 0 0 0 0 1 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 Log INC 09.770 09.770 10.021 10.820 09.770 10.222 10.021 10.222 10.222 10.463 10.222 09.770 10.463 10.021 10.463 09.770 09.770 09.770 10.222 10.021 09.4335 08.294 10.463 10.021 10.222 10.222 10.222 10.021 10.222 10.021 10.820 10.021 10.021 10.021 10.021 PTCON 6.3969 6.7452 7.0475 6.7452 6.7452 7.0475 7.0475 7.0475 6.7452 7.0475 7.0475 6.7452 7.2793 6.7452 7.0475 6.7452 7.0475 6.7452 7.0475 6.7452 6.7452 7.0475 7.0475 7.0475 7.2793 7.0475 7.4955 7.0475 7.0475 7.0475 7.4955 7.0475 7.0475 6.7452 7.0475 YESVM 0 1 1 1 1 1 1 1 0 1 1 1 1 1 1 1 1 0 1 0 0 \ 1 1 0 1 0 1 1 0 1 1 1 0 1 1 0 0 1 1 1 1 447
Продолжение таблицы 10.4 № 47 48 49 ЬО Ы ы ьз Ь4 ьь Ь6 57 Ь8 Ь9 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 1 81 PUB1&2 1 0 0 0 0 1 1 0 1 1 1 1 1 1 1 0 1 1 0 0 1 1 0 0 0 1 0 0 1 0 1 0 1 0 1 PUB3&4 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 1 0 0 1 1 0 1 0 1 0 1 0 PUB5 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 PRIV 0 1 0 0 0 0 0 1 0 0 0 0 0 0 0 1 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 YHARS 26 18 4 6 12 49 6 18 5 6 20 1 3 5 2 5 18 20 14 3 17 20 3 2 5 35 10 8 12 7 3 25 5 4 2 SCHOOL 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 Log INC 09.770 10.222 09.7700 10.021 10.021 09.4335 10.463 09.770 10.021 09.7700 09.4335 09.770 10.021 10.463 10.021 10.820 09.4335 09.770 08.9227 09.4335 09.4335 10.021 10.021 10.021 10.222 09.770 10.021 09.770 09.770 10.222 10.463 10.222 09.770 10.222 10.021 PTCON 6.7452 7.4955 6.7452 7.0475 6.7452 6.7452 7.2793 7.0475 7.0475 5.9915 7.0475 6.3969 6.7452 7.0475 7.0475 7.2793 6.7452 5.9915 6.3969 7.4955 6.7452 7.0475 7.0475 7.0475 7.0475 7.0475 7.2793 7.0475 7.0475 6.7452 6.7452 6.7452 6.7452 7.0475 7.2793 YESVM 0 0 ' 1 0 0 1 1 1 1 1 0 1 1 1 0 1 1 0 1 1 0 1 0 1 0 0 1 0 1 0 1 1 1 1 1 0 1 1 0 1 1 0 1 1 1 448
Окончание таблицы 10.4 J^o 82 83 84 85 86 87 88 89 90 91 92 93 94 95 PUB1&2 0 1 1 0 1 0 0 0 0 1 0 0 0 0 PUB3&4 1 0 0 0 0 0 0 1 0 0 1 0 0 1 PUB5 0 0 0 0 0 1 0 0 0 0 0 1 0 0 PRIV 0 0 0 1 1 0 0 0 0 0 0 0 0 0 YHARS 5 3 2 6 3 12 3 3 3 3 3 5 35 3 SCHOOL 0 0 0 0 0 0 0 0 0 0 1 0 1 0 Log INC 10.463 09.770 10.820 08.9227 09.770 09.4335 09.7700 10.021 10.021 10.222 10.021 10.021 08.9227 10.463 PTCON 6.7452 7.0475 7.4955 5.9915 7.0475 6.3969 6.7452 7.0475 6.7452 7.2793 7.0475 7.0475 5.9915 7.4955 YESVM 1 0 1 0 1 1 1 1 1 1 1 1 1 1 0 1 Требуется: 1. Оценить параметры следующей модели: Prob(YESVM=l)=F(PUBli&2, PUB3&4, PUB5, PRIV, YEARS, SCHOOL, LogINC, PTCON) с использованием МНК, Probit- и Logit-процедур. 2. Рассчитать на основе модели, оцененной с помощью МНК, прогноз вероятности для каждого из респондентов проголосовать «за» введение местного школьного налога. Определить, для скольких случаев прогноз- ное значение выходит за рамки интервала от О до 1. 15 Эконометрика 449
ГЛАВА XI Методы оценки параметров нелинейных эконометрических моделей 11.1. ОСОБЕННОСТИ ОЦЕНКИ ПАРАМЕТРОВ НЕЛИНЕЙНЫХ МОДЕЛЕЙ Нелинейная модель, а точнее нелинеаризуемая форма основного урав- нения эконометрической модели, создает существенные трудности при оценке значений ее параметров. Кроме того, некоторые проблемы в этом случае возникают и при определении характеристик качества построен- ных вариантов модели, включая и показатели точности найденных значе- ний их параметров. В основном появление этих (и некоторых других) проблем обусловлено невозможностью получения решения задачи оце- нивания параметров в аналитическом виде, как это имело место в случае линейных эконометрических моделей. Поясним происхождение этих проблем на примере двухфакторной не- линейной модели следующего вида: Уг= "'''"'' ^е,. (11.1) Попытаемся использовать при определении оценок оо, а\, аг ее пара- метров аь, ссъ ссг метод наименьших квадратов при условии, что значения переменных 3^/, хц и JC2/, Г=1, 2,..., Т известны. Сумма квадратов ненаблю- даемых значений ошибки Ct, /=1, 2,..., Г; в данном случае может быть представлена в следующем виде: b}-2i '"'' wi:—^^- ai-2) 450
в соответствии с выбранным критерием искомые значения оценок оо» аи аг должны удовлетворять условию минимума функции 5^, что приво- дит к появлению трех уравнении: -— = О, —— = О и -— = О. Учиты- Э^о 9^1 оа2 вая, что S^ определено выражением (11.2), представим эти уравнения в виде следующей системы (аналога системы нормальных уравнений): «1 -2- ъ—^1 '^ Г~^' ayl ""^ --i^liZZ^^O; (11.3) ,=1 (02 -^it-^ao) t=i^2-^2t + ^0 a, Z ^иУг^гг -a2.£ 4-^2, Несложно заметить, что уравнения системы (11.3) являются нелиней- ными относительно неизвестных значений оо, а\ и аг. При этом нелиней- ность в данном случае усугубляется необходимостью суммирования сложных функций, выраженных отношениями и квадратами зависимой и независимой переменных модели. Решение системы (11.3) можно полу- чить, только используя достаточно сложные итеративные процедуры на- хождения ее корней. При этом следует заметить, что для другой формы эконометрической зависимости, отличной от выражения (11.1) будет по- лучена и другая, отличная от вида (11.3) система нелинейных уравнений. Для ее решения, возможно, придется применять и другую процедуру оце- нивания, учитывающую специфические особенности формы ее уравне- ний. Процедура решения таких систем еще более усложняется, если в левой части эконометрической модели стоит не просто переменная yt, а некото- рая ее функция g(y„ Р), зависящая от некоторого набора параметров Д, Д,..., Д. Примером такой функции является степенная ^(у/, Р)=Ро еР^'^* . В этом случае заметим, что сумма квадратов ошибки эконометрической модели g(yt,fi)=Ma,x)-^e, (11.4) при произвольно выбранных значениях оценок ее параметров bk, к=ОЛ-Л ajj=0yl'- может быть представлена в следующем виде: 52(a,ft,x) = I(g(y,,*)-/,(a,jc))2 , (11.5) t 15- 451
где/^а, x)=fi(ao, сс\„„, jci/,..., Xnt )- нелинейный относительно коэффици- ентов 0^ и возможно независимых переменных функционал, у=0,1,..., /=1,2,..., п; St - ошибка модели; а=(ао, аь—); Ь=(6о» ^^ь—) - векторы оценок параметров модели (11.4); х - вектор значений независимых переменных, соответствующих значению д^^ В этом случае система нормальных уравнений, решениями которой являются «оптимальные» по МНК оценки, должна включать в себя и уравнения типа: Э52 ЪЬь = 0, Л = 0,1,... . Аналогичные проблемы возникают и при получении оценок парамет- ров нелинейных эконометрических моделей с использованием метода максимального правдоподобия. Заметим, что при использовании этого метода предполагаются известными тип закона распределения опшбки модели Ct и, возможно, некоторые его параметры (как правило, математи- ческое ожидание равное нулю). Как это было отмечено в главе П, обычно на практике закон распреде- ления ошибки предполагается нормальным. В этом случае при обычном для нелинейных моделей предположении относительно независимости разновременных значений опшбки функция плотности наблюдаемой за- висимой переменной yt в момент времени t может быть представлена в следующем виде: (p(yt)^ d€f Эу, .(2я(7^ )-1/^е-('(У''^>-^'(''''^^^<^'^К (11.6) где вьфажение де. Эу, = J(y„fi) = Mvt'P) by. =л (11.7) является якобианом преобразования; <Р'=ае - дисперсия ошибки модели (11.4). Как было отмечено в разделе 2.5, оптимальные оценки а параметров а модели (11.4) должны обеспечивать максимум логарифма функции прав- доподобия, который в данном случае имеет следующий вид: В модели (11.4) в общем случае значение независимой переменной х, не обяза- тельно должно соответствовать моменту t. 452
--^I.lg(y,^fi)-Ma^^)]^ ■ (11.8) Уравнения максимального правдоподобия относительно неизвестных оценок параметров модели (11.4) и ее дисперсии о^ в данном случае име- ют следующий вид: dfi ^J, ainL ЭУ, ^ Z-.-^%^ = 0; dfi) «т') V ' Э/? _ 1 у- У,(Д.Д^)_о. да ((тЪ Г ' Эа 3lnL Г 1^-2/4 (11.9) Анализируя вид уравнений системы (11.9), можно сделать два вывода. Во-первых, система уравнений максимального правдоподобия нели- нейной эконометрической модели, содержащей в левой части нелиней- ную функцию зависимой переменной g(yt, fi), отлична от соответствую- щей системы уравнений максимального правдоподобия модели, в новой части которой находятся просто значения зависимой переменной yt. Это отличие обусловлено необходимостью учета якобиана в первом уравне- нии системы (И.9). В этом несложно убедиться, рассмотрев систему нормальных уравне- ний для критерия минимума выражения (11.S). Она в общем случае будет иметь следующий вид: Э5 2 dfi =j:(8(yt^fi)-ft((x.x)) f^yt^fi)] ^. 3g(y„/?) = I^r^^^^^^=0; dfi ) Г ' ^P в TOM случае, когда в левой части нелинейной эконометрической мо- дели стоят наблюдаемые непреобразованные значения yt, т.е. giyt, ^=Уг, то очевидно, что первые группы уравнений в системах (11.9) и (11.10) от- сутствуют, а вторые — совпадают с учетом того, что £} =уг -fJLcc, х). Второй вывод свидетельствует о том, что выражение для оценки дис- персии нелинейной эконометрической модели при любой ее левой части совпадает с аналогичным выражением (2.118), полученным для линейно- го его варианта. Как непосредственно вытекает из последнего уравнения 453
системы (11.9), оценка дисперсии нелинейной модели определяется сле- дующим выражением: ^^ =~i:(8(yt^b)^ft(^^x))^ =~i:e} , (11.11) ^ t ^ t где et - оценка ошибки б^, полученная при оптимальных оценках парамет- ров модели О/, Ъь fc=0,l,...7=0,1,.... Сопоставим методы максимального правдоподобия и МНК. Заметим, что в методе максимального правдоподобия важное значение имеет вы- бор обоснованного (правильного) закона распределения ошибки эконо- метрической модели. Несоответствие исходной гипотезы относительно типа ее закона распределения и реалий может значительно снизить каче- ство оценок параметров нелинейной эконометрической модели, получен- ных с использованием ММП. В этой связи МНК использует менее стро- гие исходные предпосылки относительно распределения ошибки модели Et, и многие из желательных свойств оценок (состоятельность, эффектив- ность и несмещенность), полученные с использованием этого метода, как правило, сохраняются (хотя бы приблизительно) и для нелинейных моде- лей при любом законе распределения ошибки. Вместе с тем, как было показа1Ю ранее, и в случае МНК возникает проблема решения нелинейных (нормальных) уравнений, относительно неизвестных значений параметров модели. Эта проблема усложняется при более сложном характере ошибки е (наличии автокорреляционных связей, гетероскедастичности). Кроме того, численные итеративные про- цедуры получения решений часто не являются универсальными. Их не- обходимо корректировать с учетом вида нормальных уравнений, в свою очередь, зависящего (см. выражение (11.3)) от предполагаемой формы эконометрического уравнения/Ха;дс). В этой связи на практике^ по-видимому, проще определять искомые значения оценок параметров нелинейных эконометрических моделей, ис- пользуя достаточно общие для всех la возмоэюных вариантов подходы, основанные на использовании итеративных процедур поиска минимума непосредственно рассматриваемой целевой функции, выраэюенной в виде суммы квадратов ошибки 5". В дальнейшем, в целях упрощения изложения без ограничения общно- сти будем полагать, что левая часть нелинейной эконометрической моде- ли содержит только непреобразованпые значения ;;^ т.е. g(yt, P)i=yu Для произвольного 0-го) варианта эконометрической модели, харак- теризующегося заданной формой основного функционала fl^d, jc), с из- 454
вестными значениями его параметров, представленными вектором а^=(ао\ а/,..., aj)y сумма 1свадратов его ошибки с учетом выражения (11.4) может быть представлена в следующем виде: S^iaJ) = Zel=I,(yt-ft(aJ.x))^ , (11.12) t t где ejt - значение ошибки в момент времени и соответствующее выбран- ному у-му набору ее параметров, рассматриваемому как оценка «теорети- ческой» ошибки Ef. В некоторых исследованиях вместо выражения (11.12) предпочти- тельнее рассматривать взвешенную сумму квадратов ошибки, определяе- мую следующим образом: 52(аЛ=1^г-4=2:^г-(Уг-//(«^^))^ = / t = i:pIiy,-f,(aJ,x))^, (11.13) t где pt - весовой коэффициент, учитывающий значимость информации в момент г для оценки коэффициентов модели (см. выражения (3.44), (3.45) раздел 3.2); qt=pt - весовой коэффициент, учитывающий значимость квадрата невзвешенной ошибки модели. В некоторых случаях значения коэффициентов qt и pt могут отражать характер гетероскедастичности ошибки рассматриваемой модели (раздел 3.2). В качестве оптимальных оценок параметров аь, схи*-., сСп модели (11.4) в соответствии с критерием минимума суммы наименьишх квадратов ошибки должны быть выбраны значения оо, ^i,..., а„, обеспечивающие минимум выражения (11.12) (или (11.13)) по всему множеству наборов таких значений, т.е. a = {aQ,ax,,..,an)<^vmnS'^{aJ)' (11.14) J В дальнейшем, без ограничения общности, рассмотрим особенности построения нелинейных эконометрических моделей с использованием выражения (11.12). При решении задачи минимизации выражения (11,12) на практике не- обходимо учитывать ряд обстоятельств. Во-первых, априорно (т.е. до проведения каких-либо расчетов) функция S^((^) не молсет быть представлена в аналитической форме записи (например, как многочлен некоторой степени по своим аргу- ментам). 455
Во-вторых, моэюно предположить, что эта функция является непре- рывной по этим аргументам. В-третьих, в некоторой области существования минимума она мо- эюет рассматриваться как выпуклая функция от своих аргументов, В общем случае может допускаться несколько таких непересекающихся об- ластей, на каждой из которых эта функция достигает локального мини- мума. При таких, достаточно естественных, условиях задача оценива- ния параметров нелинейной эконометрической модели является за- дачей минимизации нелинейного функционала (11.12) в пространстве параметров а/ при известных значениях зависимой и независимых пе- ременных ух и Хц соответственно, t=l, 2,..., Т; i=0,l,..., п. Для реше- ния такой задачи в предполоэюении о детерминированности исход- ных данных могут быть использованы хорошо известные методы, в основе которых лежат итеративные процедуры поиска минимума нелинейной функции, В общем случае их моэюно разделить на две большие группы: методы без производных и методы с производными, К первой группе относится, например, метод прямого поиска, ко второй - метод Гаусса-Зайделя, градиентные методы, метод Маку- ардта. В основе приведенной классификации методов леж:ит достаточно простой признак. Если для реализации метода не требуется рассчиты- вать значения производных каких-либо функций, то этот метод отно- сится к группе методов без производных, В противном случае, т,е, когда при реализации метода расчет производных необходим, то он относит- ся к группе методов с производными. При этом заметим, что производные обычно используются при фор- мировании итеращюнной процедуры поиска минимума функции суммы квадратов ошибки модели по своим аргументам oq, «i,..., а„, основанной на линейной аппроксимации либо формы (функционала) эконометриче- ской модели, либо самой целевой функции, т.е. суммы квадратов ошибки. Вследствие этого методы с производными, в свою очередь, обычно раз- деляются на две подгруппы. Первую из них составляют методы, предпо- лагающие линеаризацию уравнения модели, а вторую - методы, предпо- лагающие линеаризацию целевой функции. К первой группе, например, относится метод Гаусса-Зайделя, ко второй - градиентные методы, метод Макуардта. Рассмотрим особенности некоторых из перечисленных методов более подробно. 456
11.2. МЕТОД ПРЯМОГО ПОИСКА Использование метода прямого поиска при нелинейном оценивании имеет определенные как преимущества, так и недостатки по сравнению с другими методами. Его преимущества обусловлены достаточно неслож- ной логической схемой расчетов и их относительной простотой. Его не- достатком является небольшая скорость расчетов, что требует для полу- чения результатов относительно много времени, особенно когда количе- ство оцениваемых параметров модели велико. Однако этот недостаток становится не слишком существенным при использовании компьютеров с высоким быстродействием. Процесс получения оценок параметров эконометрической модели со- гласно методу прямого поиска реализуется на основе определенного ал- горитма, логика которого состоит в следующем. На первом этапе выбираются начальные оценки параметров экономет- рической модели ai^\ /=0,1,...,п; и их приращения Аа,. Для заданных зна- чений параметров рассчитывается значение суммы квадратов ошибок 5о^=5^(а^^^). Затем каждое исходное значение аР заменяется на следую- щий его вариант а,^^^= а,^% Aai, (11.15) Для /=0,1,...,Az; последовательно рассчитываются значения 5о^(л/^^). Ее- ли при этом 5о (ai )<So , то значение а/ принимается в качестве нового значения приближения к исходной оценке /-го параметра модели, в про- тивном случае, т.е. когда 5о^(а/^^)>5о^, то в качестве такого приближения выбирается значение <з/ -а/ -Ал/. Если оказывается, что и в том и в дру- гом случае сумма квадратов ошибки увеличивается, то в качестве оценки параметра Oi эконометрической модели используется исходное значение Таким образом, на первом шаге метода прямого поиска определяется направление движения к вектору «оптимальных» оценок а параметров модели по каждой координате. Значения приближений af^^ на втором ша- ге уже определяются по одной из двух формул а/^^=а/^^±Аа/, и если S2{ai^^)<S\', то движение в выбранном направлении продолжается, в про- тивном случае, т.е. когда Зг^х", в качестве оценки /-го параметра модели выбирается значение а/^\ Заметим, что Si" представляет в данном случае сумму квадратов ошибки модели, определенную согласно выражению (11.12) при векторе оценок ее параметров а/ \ Процесс определения «оптимальных» оценок параметров эконометри- ческой модели составляет определенное количество шагов до тех пор, 457
пока изменения значений отдельных параметров в любол^ направлении (уменьшения или увеличения) не будут приводить к росту полученного на предыдущем этапе значения суммы квадратов ошибки 5/. Здесь j ин- декс характеризует номер предпоследнего этапа расчетов. Однако при этом следует иметь в виду, что найденное таким образом решение, пред- ставляющее собой вектор оценок j-ro шага расчетов еще нельзя рассмат- ривать в качестве окончательного, т.е. оптимального варианта искомых оценок. Данный вывод — следствие двух обстоятельств. Во-первых, точность оценки, определяемой по положению точки оптимума, зависит от длины шага расчетов Аа^. С одной стороны, если длину шага выбрать достаточно небольшой, то, очевидно, что искомые оценки будут определяться с большей точностью (однако и в этом случае исследователь не застрахо- ван от ошибки приближения). С другой стороны, при небольшой длине шага значительно увеличивается время расчетов. Выход из создавшегося положения на практике обычно видят в ис- пользовании в расчетах шагов разной длины. Сначала, применяя большие шаги, ищут приблизительную область существования оптимальных оце- нок параметров, центром которой выбирается решение, полученное на^'-м этапе а'. Затем длина шага существенно уменьшается и это решение с по- мощью той же процедуры уточняется. На практике можно использовать процедуры расчетов с нескольки- ми вариантами длин шагов, уменьшающимися в порядке их следова- ния. При этом длину последнего шага теоретически можно выбирать бесконечно малой. На практике, естественно, ограничиваются некото- рой конечной величиной шага, и решение о прекращении дальнейших уточняющих положение оптимума шагов принимается, если значение суммы квадратов ошибки изменяется в пределах заданного интервала точности. Иными словами, если для у+1-го шага (уточняющего) вы- полняется условие 15,—5/+1^1<г?, где zfeO - величина, определяющая точность расчетов, то процедура расчетов прекращается и в качестве решения выбирается полученный на у-м (или на у+1-м) шаге вектор оценок 0^(0^"*"^). Во-вторых, описанная выше процедура может привести к локальному минимуму 5^. Иными словами, функция 5^(а; д:) может иметь несколько минимумов по своим параметрам, каждый из которых находится в опре- деленной области их значений. При этом априорно, вообще говоря, коли- чество локальных минимумов у суммы квадратов ошибки установить не представляется возможным. 458
Исследователя естественно интересует положение «глобального» минимума, в качестве которого может быть рассмотрен наименьший из некоторого набора локальных. В такой ситуации необходимо попы- таться определить все возможные локальные минимумы в некоторой допустимой достаточно широкой области существования оценок па- раметров эконометрической модели и выбрать среди них наименьший по величине. Эта область может быть ограничена, исходя из некото- рых содержательных предпосылок относительно их предельных (ми- нимальных и максимальных) допустимых значений параметров моде- ли. Данная задача решается с помощью того же метода прямого поиска путем задания различных вариантов начальных значений параметров tP, находящихся на разных участках допустимой области их существования. При этом может сложиться ситуация, когда при всех вариантах началь- ных значений получают одно и то же решение. Это является определен- ной гарантией существования одного минимума в рассматриваемой об- ласти. В противном случае, когда разные начальные значения параметров а приводят к различным минимумам функции S {а,х), из них необходи- мо выбрать наименьший и в качестве решения задачи оценки параметров эконометрической модели - выбрать соответствующие ему значения па- раметров oq, a\,...j а„. Несложно заметить, что допустимая область существования оценок параметров эконометрической модели может быть определена в виде системы неравенств следующего вида: ai*<ai<ai\ (11.16) где Oi* и Oi - нижняя и верхняя границы соответственно допустимой об- ласти существования значений параметра бк; модели. 11.3. МЕТОДЫ, ОСНОВАННЫЕ НА ЛИНЕЙНОЙ АППРОКСИМАЦИИ МОДЕЛИ В основе этой группы методов леэюит идея представления нелинейно- го функционала эконометрической модели f[a, х) в произвольной точке ct^^ в виде линейной аппроксимирующей функции, например, ряда Тейлора, Это даст возмоэюность определить в некотором смысле оптимальные приросты оценок параметров Aaj , минимизирующие функцию суммы квадратов ошибки S^ (выраэюение (1L7)) в окрестности точки d . При этом, поскольку ряд Тейлора не является точной аппроксимацией функ- 459
ционала модели До; д:), то новые значения оценок ее параметров, опреде- ляемые по очевидной формуле а/^^=а/°^Дд/^\ i=0,!,..,«, могут не сов- пасть с наилучшими оценками. В таком случае необходимо аппроксими- ровать модель в точке а ^^^ и определить новые приросты параметров Дд/^^ и соответствующие им оценки аР'^ и т.д. Таким образом, формируется итеративная процедура последовательного приближения к искомым «оп- тимальным» оценкам а/, которым соответствует локальный оптимум суммы квадратов ошибки в некоторой области существования значений параметров модели. Нахождение оценок параметров модели, соответствующих гло- бальному минимуму, может быть осуществлено с использованием такого же подхода, как и в методе прямого поиска, т.е. путем перебо- ра различающихся вариантов исходных оценок параметров а/^\ вы- бираемых из различных участков допустимой области их существо- вания. В практике оценивания параметров нелинейных эконометрических моделей наибольшее распространение получил метод, известный в науч- ной литературе как метод Гаусса-Зайделя. Для него характерны следую- щие этапы расчетов. 1. Нелинейный функционал До; х) в момент времени г и в точке оце- нок параметров tP в соответствии с аппроксимирующей функцией Тейло- ра представляется в следующем виде: /г(а,х) = Л^+[^1 •(^0-^8) + ...+f-^l -(^„-«0), (11.17) о к^^п) о где ^= /г(а°, х) - значение функционала в начальной точке оценок пара- - расчетное значение производной э^,^ о метров а°=(ао° , ах »..., О; 1 ^ функционала модели по параметру о; в точке аД На практике значения этих производных определяются на основе ча- стных разностей: А. /О /,(flg.af.....af + tfe,P.a,P^i.-.ag.x)-/,(ag.....flg.jr)^ ^^^^^^ где doi - малое приращение оценки параметра ai . 460
Таким образом, значения функции^ и ее производных -^ ' ке значений параметров al^ являются известными. Подставим выражение (11.17) в формулу (11.12). Получим В ТОЧ- t t b,-/,'°'-i[|-] -Ч" (11.19) где Да/ ^=а/ -а/ , at ^ - оценка параметра О/ на первом шаге расче- тов. 2. Расчетные значения оценок а/^\ /=0,1,...,л можно получить, прирав- няв нулю первые производные функции 5^ по приростам Да/. В результате получим систему уравнений, аналогичных нормальным уравнениям клас- сического метода наименьших квадратов: /=1 Ьа (1) Ч f—1 = 0; (11.20) Обозначив yfjfsgl^, сформируем вектор-столбец g^Hgi^^-ngE^Y с Г компонентами. Из производных дующего вида: —^ сформируем матрицу Xq сле- ^0 = ^1 (11.21) размера 7V:(/i+l). Из приростов Да/'^ сформируем вектор-столбец Дв^'ЦДоо^'^..., Несложно заметить, что с учетом этих обозначений систему (11.20) можно представить в следующем виде: iX'oXoy^^'^^a'og^). (11.22) 461
Из (11.22), в свою очередь, вытекает, что оценки приростов парамет- ров /Sa^^^ на первом шаге расчетов находятся из векторно-матричного вы- ражения, имеющего характерный вид: Даа)=(Л'^.^оГ'-?ог°- (И-23) 3. Определив на основе полученных приростов Да/^\ f=0,l,...,Ai оценки параметров эконометрической модели а,^=а/°+Аа/\ проделаем ту же процедуру расчетов для получения новых приближений этих оценок. Заметим, что различные модификации метода Гаусса-Зайделя допускают расчет новых значений оценок на основе следующего вы- ражения: a!''^=a!^-'hh!^^'Aa!^\ (11.24) где А/^^ - так называемый «ускоряющий» множитель, вводимый для со- кращения числа шагов при поиске минимума функции 5^ по параметрам эконометрической модели. Его значение выбирается с учетом величины угла наклона функции 5^ в точке а/. В области минимума функции 5"(а/) длину шага уменьшают, чтобы получить «наилучшую» оценку параметров. 11.4. МЕТОДЫ, ПРЕДПОЛАГАЮЩИЕ ЛИНЕАРИЗАЦИЮ ЦЕЛЕВОЙ ФУНКЦИИ В основе методов оценки параметров эконометрической модели, предполагающих линеаризацию целевой функции, т.е, суммы квадра- тов ошибки модели S^(a, х) по переменным ао, а],„,,а„, леэюат свой- ства ее градиента VS , согласно которым направление этого векто- ра в произвольной многомерной точке пространства параметров С1оу ajy...,aj указывает направление наибольшего роста функции S^(a, х) в этой точке. Соответственно противоположный вектор указывает на направление наиболыиего уменьшения (наискорейшего спуска). Направление наискорейшего спуска в некоторой точке простран- ства параметров не обязательно указывает на точку оптимума функ- ции S^. Однако двигаясь в этом направлении, можно попасть в сле- дующую точку, в которой направление движения уточняется. А в ре- зультате последовательность точек должна привести к искомому ре- шению. 462
Градиент целевой функции 5^(а, jc) в произвольно выбранной исход- ной (нулевой) точке пространства параметров оо^, ai^,..., an может быть определен на основе ее разложения в ряд Тейлора первого порядка: (=1 l^^Jo •(a,•-a^'). (11.25) - значение суммы квадратов ошибки модели в точке про- странства ее параметров а ; Ъа-^] первая производная функции ^(ц. X) по параметру а/ в точке а^; <3/ - а^ - прирост /-го параметра. Координаты вектора -V5^(a^, jc), сформированного на основании со- ставляющих правой части выражения (11.25) как -V52(aO,x) = H^ 2^ Ъа, о; *п- ЫЛ Ъа\ Ida.-...- {ъзЛ V^^ny Л^п, (11.26) определяют направление наискорейшего спуска (направление оптималь- ного движения к точке минимума 5^(а, д:) по оценкам параметров эконо- метрической модели). Прямое использование выражения (11.26) при определении «опти- мальных» оценок оо, Ль..., Лп» минимизирующих сумму квадратов ошибок модели, лежит в основе метода наискорейшего спуска. Согласно этому методу оптимальные оценки находятся на основе итеративной процедуры расчетов последовательности таких оценок а^, а\..., d, в которой каждая следующая оценка лежит на направлении наискорейшего спуска, опреде- ленного в предыдущей точке. Направление движения, например из начальной точю! а°, указывает единичный вектор, определяемый следующим выражением: £(«")= -У5^(а°.лг) да, 2\ ба1 О J Эа. г^" (11.27) Э5^ да, 'о Л .+ - да. п /О Например, если для модели с двумя параметрами оо и а\ градиент функции S^{aQ, а\^) равен V5V)=3ribo^-2t5bi°, то соответствующий единичный вектор определяется как 463
E(a^.af) = -VS^ia^) 7b2+-4=tbi |-V52(aO)| Vi3 ° Vl3 , 0) и соответственно пропорции приростов значений параметров Доо Да/^^ должны быть равны -3/^flЗ и 2/л^. На практике оценку а/^\ /=0,1,...,л согласно методу наискорейшего спуска определяют с помощью выражения, аналогичного (11.19) a,-^WW^-Aa,^\ (11.28) где А/^^ - множитель, оптимизирующий размер прироста параметра нау-м шаге расчетов. Некоторые недостатки метода наискорейшего спуска обусловлены зависимостью направления движения от формы поверхности о (а). По- скольку направление «наискорейшего спуска» в каждой точке про- странства параметров а указывает не на место расположения минимума суммы квадратов ошибки, а лишь на направление ее наибольшего убы- вания в этой точке, то в случае «неправильных» (существенно отли- чающихся от «шарообразных») форм поверхности S\a) метод наиско- рейшего спуска «выбирает» достаточно продолжительный маршрут движения к оптимуму. Для ускорения этого движения Макуардт предложил комбинирован- ный (компромиссный) метод оценки параметров эконометрической моде- ли, объединяющий идеи методов Гаусса-Зайделя и наискорейшего спус- ка. В его основе лежат два следующих замечания. Во-первых, вектор приростов параметров на j-м шаге расчетов по методу наискорейшего спуска можно представить в следующем виде: (i)_hJ-(-VS^(a<J-'^)), Ai'J' = -VS^(a<J-'>\ hJ -V5 W^-»>f (11.29) Во-вторых, заметим, что производные функции 5 (а ) по своим ар гументам оо'\ л/~\-., cij вой части вьфажения (11.22): 'dS^(a) J 1 ^J 1 ^J ^ равны компонентам вектора (Xj^i'-gf ^) из пра- Эо,- -1 '=1 да, = -4^-^^(11.30) у-1 464
(11.32) Где zF ^^- i-^ компонента вектора A^i'g'"^ полученная нау-м шаге расче- тов. Обозначим этот вектор через т!'^. С учетом (11.29) вектор приростов параметров нау-м шаге расчетов находится как 1 hJ где —— =; г - константа. ^j |-у2.52(аО-1))| Сопоставим вьфажения (11.22) и (11.31). Получим Макуардт объединил оба выражения из (11.32) в одно: (X;j_^yX(j_^^-^Z(J>'E)-Ai(J^=z'-\ (11.33) где Е - единичная матрица, и предложил выбирать множитель Я^\ ре- гулирующий длину прироста параметров на j-m шаге расчетов, исходя из свойств функции S\a^ ~^^). Логика такого выбора определяется сле- дующими соображениями. Если матрица (X[j_iyX(^j_i>^) плохо обу- словлена, где, напомним, матрица X в данном случае определена вы- ражением (11.20), то Я^^ должно быть выбрано достаточно большим и в этом случае приросты параметров в большей степени соответствуют их оценкам, полученным по методу наискорейшего спуска. При хоро- шей обусловленности матрицы iX[j_iyX(^j_i^), свидетельствующей о быстрой сходимости метода Гаусса-Зайделя, значение Я^^ выбирается относительно небольшим. Промежуточные значения характеризу- ют направление движения к минимуму, полученное как комбинация направлений, определенных с помощью методов Гаусса-Зайделя и на- искорейшего спуска. В окрестности минимума метод Макуардта, как и другие методы, уменьшает длину прироста параметров. Методы, основанные на линеаризации суммы квадратов ошибки эко- нометрической модели, так же как и другие итеративные методы поиска оптимальных оценок ее параметров, могут привести к решению, соответ- 465
ствующеА1у локальному оптимуму. Для определения глобального мини^ мума необходимо, как и в случае других методов, решить задачу оценки с использованием разных вариантов исходных точек а^, соответствующих разным участкам допустимой области существования искомых значений параметров. 11.5. КАЧЕСТВЕННЫЕ ХАРАКТЕРИСТИКИ ОЦЕНОК ПАРАМЕТРОВ НЕЛИНЕЙНЫХ ЭКОНОМЕТРИЧЕСКИХ МОДЕЛЕЙ Помимо определения точечных значений оценок параметров нели- нейных эконометрических моделей в эконометрических исследованиях большое внимание уделяется и поиску их интервальных характеристик, по величине которых можно судить о качестве построенного варианта эконометрической модели. Напомним, что совокупность интервальных характеристик параметров линейных эконометрических моделей можно определить на основе элементов ковариационной матрицы их оценок, определенных для независимых и гомоскедастичных ошибок выраже- нием (2.18) Cov(a)= Се\Х''ХТ\ где Х- матрица значений независимых параметров. Для нелинейной эконометрической модели в аналитическом виде получить аналог выражению (2.18) не представляется возможным. Од- нако можно определить некоторое приближение ковариационной мат- рицы оптимальных оценок параметров модели в области минимума суммы квадратов ошибки. Для этого разложим нелинейный функцио- нал модели в окрестности точки оптимума параметров а* в ряд Тейло- ра. В результате в соответствии с выражениями (11.19)-(11.23) полу- чим y = f*(a,x)'X^ а^ + Х* a+Tj^ (11.34) где/* - вектор расчетных значений функционала До; х) в точке парамет- ров а*, принадлежащей окрестности оптимума; X»- матрица производных dft /да,-, определенная согласно выражению (11.21) в точке а*, ^ - ошибка разложения. Перепишем выражение (11.34) в следующем виде: 466
g = X* a+Ti, (11.35) где вектор g определяется согласно вьфажению: g = y-Ma,x)-^X^'a^. (11.36) Несложно заметить, что все компоненты вектора g в точке а* известны. Из этого вытекает, что в окрестности оптимума нелинейная эконометри- ческая модель может быть представлена в линейной форме записи (11.35). В соответствии с этим, согласно выражению (2.18), ковариационная матрица оптимальных оценок параметров модели а может быть пред- ставлена в следующем приближенном виде: CoY(a) = (7^(X'^X*rK (11.37) Приближенный характер матрицы Cov(a) обусловлен использовани- ем аппроксимирующего приближения Тейлора для нелинейной модели и соответствующей ему точки а* из окрестности оптимума (а также мат- рицы А^*). В этом случае, так же как и в случае выражения (2.34), мож- но показать, что найденные оценки а при Т-^оо являются приблизитель- но состоятельными, а их распределение является асимптотически нор- мальным а ( ^2 Л (11.38) где Q = plim\^^\, (11.39) ВОПРОСЫ к ГЛАВЕ XI 1. Каковы причины нелинеаризуемости моделей? 2. По каким признакам классифицируются методы оценки параметров нелинейных моделей? 3. Охарактеризуйте методы с производными и методы без производ- ных? 4. Опишите процедуру прямого поиска. 5. В чем состоит суть методов Гаусса? 6. Опишите градиентные методы оценки параметров нелинейной мо- дели и особенности представления целевой функции. 467
УПРАЖНЕНИЯ К ГЛАВЕ XI Задание 11.1 Имеется нелинейное однофакторное уравнение регрессии Требуется разложить функцию Ддс) в ряд Тейлора второго порядка в точке ль=0 и определить, чему равен предел разложения в ряд л-го поряд- ка при п->«»? Задание 11.2 Имеется нелинейное однофакторное уравнение регрессии Требуется записать систему нормальных уравнений для определения оценок параметров (%, а\ и (Xi. Задание 11.3 Имеется нелинейное уравнение регрессии Требуется записать «псевдолинейную» модель. Задание 11.4 Имеется нелинейная однофакторная регрессионная модель у^ ^a^t +f^, где et'-iO, (f\ Требуется; 1. Вывести рекурсивные формулы для алгоритма Ньютона- Рафсона. 2. Показать, что выполняется следующее равенство: M[d25/da2] = 2£[d/Upa)/da]2=2z(a/z(a), r=l где S - сумма квадратов остатков. Задание 11.5 Имеется нелинейное однофакторное уравнение регрессии где £1-М0, о^). 468
Требуется показать, что оценка 5 параметра а по методу максимума правдоподобия совпадает с оценкой а, определенной с использованием нелинейного МНК в модели где £j-(0, {^). Задание 11.6 Имеется нелинейное уравнение регрессии У/= ал- £1, где Et распределена по закону Коши с функцией плотности Дг)=1/л(1+г^). Требуется построить алгоритм метода максимального правдоподобия Ньютона-Рафсона. Задание 11.7 В результате оценивания по методу наименьших квадратов получается следующая линейная регрессионная модель: Уг=4дг1г+0,5д^2/+^, с ковариационной матрицей Cov(a) (ОА -ОД t-ОД 0,2 Требуется: 1. Рассчитать значение статистики Вальда для следующих нулевых гипотез: а)Яо: ауа2=1; 6)Wo:ln(ai)+ln((%)=0. Проанализировать взаимоотношения между двумя гипотезами и соот- ветствующими тестами. 2. Написать псевдолинейную модель для оценки приведенной в усло- вии модели в предположении, что верна гипотеза а) из п. 1. Описать, как можно вычислить значение критической статистики в тесте множителей Лагранжа применительно к полученному результату. 3. Вычислить значение статистики в тесте отношения правдоподобия для модели с ограничением, если сумма квадратов остатков в модели без ограничения равна 500, в модели с ограничением - 510, а величина вы- борки Г=40. 469
ГЛАВА XII Использование эконометрических моделей в прогнозировании социально-экономических процессов 12.1. ОСОБЕННОСТИ ЭКОНОМЕТРИЧЕСКОГО ПРОГНОЗИРОВАНИЯ Прогнозирование одна из основных сфер практического применения эконометрических моделей. Эконометрические прогнозные исследова- ния, начало которым было положено в конце 20-х годов XX столетия \ уже через два-три десятилетия сформировались в самостоятельное на- правление в экономической науке. Круг прогнозируемых процессов по- стоянно расширялся. В настоящее время эконометрические прогнозы разрабатываются практически для всех процессов, характеризующих раз- витие общества как на микро-, так и на мезо-, и макроуровнях его органи- зации. Самое широкое применение эконометрические модели находят в разработках прогнозов спроса и предложения, научно-технического про- гресса, финансов и цен, уровня жизни, производительности труда, вало- вого продукта, миграции, занятости и многих других явлений. Термин «эконометрическое прогнозирование» обычно означает про- цедуру получения на основе эконометрических моделей некоторых ха- рактеристик зависимого процесса у (совокупности зависимых процес- сов), относящихся к следующим за моментом Т (последней точкой пе- риода наблюдения) моментам Г+7, Т+2,.., . Для «типовой» эконометри- ческой модели, состоящей из единственного уравнения, к числу важней- ших таких характеристик относятся непосредственно прогнозные значе- л л ния зависимой переменной у^+р Ут-^г »••• (точечные прогнозы) и показа- тели их точности - обычно дисперсии прогнозов а (утч-О» cr(yr+i)»-.., дове- ^ Попытки разработки прогнозов финансовых показателей на основе простейших типов моделей финансовой эконометрики предпринимались фактически с момента формирования финансовых рынков. 470
рительные интервалы, в которых с заданной вероятностью будут нахо- диться «истинные» значения рассматриваемого процесса >^7+ь Ут-^г,— (ин- тервальные прогнозы). В этой связи следует отметить, что развитие эконометрических про- гнозных исследований в значительной степени было обусловлено именно относительной простотой процедур разработки прогнозов, ясностью и определенностью использования их результатов в практике управления общественным развитием. В самом деле, для построенной на интервале времени (1,7) эконометрической модели с известными оценками коэффи- циентов ao,ai,... yHia,x)+e, (12.1) л л процедура определения точечных прогнозов yj^i, Ут^г^— сводится к подставлению в уравнение (12.1) соответствующих прогнозным момен- там Г+1, Г+2,... значений независимых переменных xi, /=1, 2,..., п\ и фак- тической ошибки ^7+1, ^г+2>-. • Заметим, что для «типовой» линейной мо- дели Уг = ао+агдс1г+...+а„-л:„^ +г^ л для получения точечного прогноза yj^\ в ее уравнение необходимо под- ставить значения независимых переменных jc,; 7+1, «=1» 2,..., п, выражаю- щих их уровни в этот же момент Г+1. В некоторых исследованиях, когда момент Г+1 относится к «будущему», эти уровни могут быть точно не из- вестными. Они могут определяться по результатам других прогнозных разработок, отражать какие-либо гипотезы, выдвигаемые в отношении характера развития независимых переменных. Если ошибка модели удов- летворяет стандартным для нее предположениям (равенство нулю мате- матического ожидания, отсутствие автокорреляционных связей и т.д.), то точечный прогноз в этом случае определяется как оценка математическо- го ожидания значения у в точке Г+1 в предположении, что оценки коэф- фициентов а, и уровни факторов xi^ r+i независимы, /=1,2,..., п\ л л л я л '=^ '=^ (12.2) п 1=1 Такие прогнозы, полученные с использованием различных (предпо- лагаемых) вариантов значений независимых переменных в будущие 471
моменты времени, часто называют «условными», «вариантными», под- л черкивая тот факт, что значения у-^^^ рассчитываются в зависимости от предполагаемых вариантов значений дг/, т+и ^'=1, 2,..., п; т.е. «условий» прогноза. Однако, например, для модели авторегрессии первого порядка про- л гнозное значение у^^^ при тех же предположениях определяется как без- условное в некотором смысле математическое ожидание: л Ут+1 =^1'^[Ут]'^^[^т+\^ = ^\Уту (12.3) л поскольку значение j^r было известно. Аналогично и прогноз у^^+г опре- деляется как «безусловный» л л Ут+2 =^1 •Л/[>'г+1]+Л^[^г+2] = «1 'Ут+v (12.4) л так как значение независимого фактора у j^j однозначно (с точностью до ошибки) определено выражением (12.3). Таким образом, все прогнозные значения д^г+т» ^^=1,2...., получаемые на основе авторегрессии можно рассматривать как «безусловные» прогнозы. Легко заметить, что для модели с лаговыми зависимыми переменными следующего вида: ;;, = ao+ayXij.3-^arX2j-4 +^ (12.5) л л л безусловными прогнозами являются только значения у^^^, yj_^_2» Ут+з» поскольку необходимые для их получения значения независимых пере- л менных Xi^ 7-2» ^/, г-ь ^1, г» ^=1» 2; известны. Точечные прогнозы у 7+4» л у^^З'-- следует рассматривать уже как «условные», если значения jc/, т+ъ Xi^ r+2v.- ТОЧНО не известны. Различие между условным и безусловным прогнозом для «типовой» эконометрической модели можно проиллюстрировать также следующим рисунком (см. рис. 12.1). Оценочный период! -^к- Безусловный прогноз! Условный прогноз > Ex post forecast period Ex ente forecast period Рис. 12.1. Типы Прогнозов 472
Рисунок 12.1 иллюстрирует следующую ситуацию. Оценки коэффици- ентов модели были получены с использованием исходной информации, относящейся к интервалу (0,7). Текущий момент времени определен точ- кой Гь В период от Г до Ti значения независимых факторов модели из- вестны точно, а после момента Ti они определяются, исходя из некоторых л гипотез, предположений. В этом случае расчетные значения у7+1» л л Ут+2'—' Ут рассматриваются как безусловные прогнозы, а значения л л Ут+1' Ут+2'— "" ^^^ условные. Значения независимых факторов, используемых при определении про- л л гнозных значений зависимой переменной у-р^^, yj^2 '••• образуют так на- зываемый «прогнозный фон», характеризующий совокупность исходных данных, необходимых для получения прогнозов. В общем случае отме- тим, что прогнозный фон может иметь как экзогенную, так и эндогенную природу. В первом варианте значения прогнозного фона определяются вне модели (например, значения независимых факторов в прогнозный пе- риод Xij+fi ^1,2,... , /=1, 2,..., л; в случае получения прогноза на основе «типовой» эконометрической модели). Во втором варианте количественные характеристики прогнозного фона определяются в рамках самой эконометрической модели (напри- мер, прогноз на основе модели авторегрессии (12.4), в которой значе- ние прогнозного фона у^.^^ определено с помощью этой же модели (12.3)). При разработке прогнозов важную роль играет процедура их верифи- кации. Ее особенности подробно рассмотрены в специальной литературе, посвященной проблемам прогнозирования. Здесь отметим, что верифика- ция предполагает обоснование достоверности прогноза, оценки его точ- ности, качества. Одним из важнейших этапов верификации является вы- явление (или невыявление) систематической ошибки при формализован- ном описании (экстраполяции) тенденций развития исследуемого процес- са. Такая ошибка может быть порождена, например, неправильно вы- бранной формой основного функционала эконометрической модели Да, jc), ошибками при выборе состава входящих в нее факторов, погрешно- стями в оценках коэффициентов модели. Появление систематической ошибки в общем случае может быть вызвано и неверным подбором «про- гнозного фона». 473
Наличие такой систематической ошибки обычно приводит к тому, что л л прогнозные значения у^^^, у^^2»—» определенные на основе экономет- рической модели, будут существенно (и односторонне) отличаться от ре- альной тенденции развития рассматриваемого процесса. В этой связи отметим, что разработка безусловных прогнозов на ин- тервале (Г, Ту) - ех post forecast period - при известном прогнозном фоне может рассматриваться как один из приемов верификации прогнозов на будущий прогнозный период - ех ente forecast period. Отсутствие «систе- матических» расхождений между реальными значениями рассматривае- мого процесса 3^7+1,3^7+2»-. и полученными с помощью эконометрической л л модели Ут^\, Ут+2^— является определенной гарантией «высокого ка- чества» используемой модели. Отметим, что «систематические» расхож- л дения на практике между значениями д'г+г и Ут+т^ zs=l,2.... ; характери- л зуются совпадением знаков у разностей д^7+/-у j+r ^ ростом их величины с увеличением периода упреждения, т.е. индекса г. Вместе с тем следует иметь в виду, что «высокое качество» про- гнозной эконометрической модели не является достаточной гарантией обоснованности эконометрических прогнозов, особенно в отдаленной перспективе. Дело в том, что в будущем тенденции развития рассмат- риваемых процессов, структура и сила взаимосвязей меэюду ними могут существенно изменяться. Эти изменения могут носить эволюционный характер, накапливаясь постепенно, например, вследствие роста мас- штабов явлений. Они могут происходить и скачкообразно вслед за фи- нансовыми кризисами, революционными преобразованиями в обществе и т.п. При этом «удачная» для периода (1,Т) эконометрическая модель, как правило, не смолсет учесть такие изменения, поскольку она по- строена на основе информации, отраэюающей иной характер взаимо- связей меэк:ду рассматриваемыми явлениями, имевший место в про- шлом. В некоторых случаях обоснованность и достоверность эконометриче- ских прогнозов могут быть повышены путем либо корректировки самих результатов формальной экстраполяции, т.е. «предварительных» про- л л гнозных значений уj^j, yj^2 '•••» полученных непосредственно с исполь- зованием построенной эконометрической модели, либо предварительной (до прогноза) корректировки самой модели, исходя из некоторых допол- 474
нительных сведений, предположений. Зачастую такие корректировки осуществляются на основе экспертной информации. В отношении этого американский экономист П.Самуэльсон заметил: «... почти все экономет- рики, за редким исключением, корректируют параметры моделей с по- мощью неформальных методов, считая, что это улучшает результат» ^ Обосновывая необходимость уточнения «формальных» эконометриче- ских прогнозов, другой американский экономист М. Уитмент пишет: «Использование эконометрических моделей позволяет опереться на кри- терии точных ДИСЩ1ПЛИН и получить внутренне согласованные прогнозы. Однако сьфые результаты модельных расчетов, так же как и их осново- полагающие предпосылки, должны быть подвергнуты тщательному экс- пертному анализу»^. В такой ситуащ1и при эконометрическом прогнозировании уместным яв- ляется вопрос о максимально возможной глубине прогнозного периода. Од- нозначного ответа на него дать невозможно. Очевидно, что чем более инер- щюнным является рассматриваемый процесс, чем устойчивее его взаимосвя- зи, чем стабильнее ситуация в обществе, экономике, тем больше может быть и прогнозный период. В некоторых научных публикациях можно встретить рекомендации определять глубину эконометрического прогноза как 1/3 или 1/2 от величины оценочного периода, т.е. как 1/3 Г, 1/2Г. Обзор эконометрических прогнозных исследований свидетельству- ет, что многофакторные эконометрические модели, как правило, ис- пользуются при разработке так называемых краткосрочных, и в крайнем случае, среднесрочных прогнозов. Для многих реальных соци- ально-экономических процессов (спрос, производительность труда, выпуск продукции и т.п.) такие прогнозы разрабатываются на 5-10 временных точек (кварталов, лет - в зависимости от длины интервала (Г, R1)). Эти рекомендации не относятся к прогнозам финансовых показате- лей, которые разрабатываются на основе моделей финансовой эконо- метрики. «Финансовые» прогнозы являются, как правило, краткосроч- ными (на один, два шага вперед), в то время как модели финансовой эконометрики формируются на основе достаточно длинных временных рядов исходных данных. Это связано с тем, что практически всегда имеется возмоэюность получить «свежую» информацию о текущем ^ Brooklings model: Perspective and Recent Developments/ Ed. G. Fromm, L. R. Klein, Chicago, 1975. " Whitman M. Economics throw perspectives// Business economics, 1983, Jan., P. 20- 24. 475
уровне рассматриваемого процесса (данные с финансовых рынков ста- новятся доступными без задержки), и на ее основе скорректировать построенную модель. Достаточно очевидны и выводы, следствия, которые могут быть полу- чены из эконометрических прогнозов, например в сфере управления. В этой связи заметим, что эконометрические прогнозы разрабатываются для оценки будущих состояний рассматриваемого процесса в зависимо- сти от олсидаемых уровней влияющих на него факторов. При этом, в общем случае факторы можно разделить на три группы: управляемые, неуправляемые и частично управляемые. Если прогноз разрабатывается на основе неуправляемых факторов (погодные условия, состояние мировой экономики и т.п.), то и сам про- цесс является неуправляемым. Прогнозы таких процессов часто называют поисковыми (исследовательскими). В этом случае система управления имеет возможность только приспособиться к его тенденциям прогнози- руемого процесса, учесть их при обосновании управляющих мер для со- ответствующего объекта. Если факторы являются управляемыми, то система управления может сознательно выбирать, формировать их уровни, определяя тем самым наиболее рациональную, «оптимальную» для объекта тенденцию разви- тия процесса в прогнозном периоде. Такие прогнозы обычно называют нормативными. При частично управляемых факторах возможности регулирования развития процесса в прогнозный период являются ограниченными. На- пример, из-за того, что в моделях присутствуют факторы обеих групп. Часто эти ограничения обусловлены имеющимися ресурсами (финансо- выми, трудовыми, сырьевыми и т.п.). В случае управляемых и частично управляемых факторов заметим, что эконометрические модели предоставляют исследователю фактически всю информацию относительно границ управления (диапазонов изменения факторов), эффективности их использования в управлении. При этом по- казатель эффективности в некоторой степени может быть определен на основании значений коэффициентов эластичности переменной у по фак- торам дс/(в части определения реакции д^ на изменения jc,). Другие составляющие эффективности (стоимость затрат на реали- зацию управления, результаты, выгоды, к которым оно приводит) вы- являются на основе экономического анализа рассматриваемой пробле- мы. В связи с проблемой управления также заметим, что эконометриче- ские модели достаточно часто используются в разработках так на- 476
зываемых «прогнозов-предупреждений». Результаты таких прогнозов являются нежелательными для объекта, и реакция системы управле- ния в этом случае состоит в определении мер, способных внести не- обходимые коррективы в тенденции развития процесса yt в рассмат- риваемый период. Эти меры в данном случае выражаются в виде необ- ходимых приростов независимых управляемых факторов. Одной из важнейших характеристик качества прогноза является вели- чина его доверительного интервала. Очевидно, что при прочих равных условиях чем уже этот интервал, тем более обоснованным представляется и сам прогноз, и мероприятия по управлению рассматриваемым процес- сом. В общем случае можно указать на два взаимодополняющих подхода к оценке доверительного интервала прогноза - эвристический и формаль- ный. По своей сути эвристический подход предполагает расчет размера доверительного интервала как разницы между двумя возможными «экс- тремальньи^и» значениями прогнозов переменной у, полученными при подстановке в уравнение эконометрической модели определяющих их «экстремальных» значений факторов. Часто такие значения и соответст- вующие им прогнозы называют «пессимистическим» и «оптимистиче- ским»: у ^j„ = /(а, Хощ.) , У песс = /(^' ^пссс ) » ГДе ДСсгг и ДГпесс - ОПТИМИСТИ- ческие и пессимистические значения независимых факторов. Тогда ши- рина доверительного интервала прогноза определяется как разность д^опг- Упесс- Заметим, что рассчитанный таким образом «эвристический» довери- тельный интервал в большей степени характеризует возможный разброс прогнозируемого значения процесса в зависимости от разброса прогноз- ного фона, в свою очередь вызванного неопределенностью оценок его значений в перспективе. Формальный подход к оценке ширины доверительного интервала про- гноза предполагает расчет этой характеристики с использованием мето- дов математической статистики. Для этого необходимо оценить диспер- сию опшбки прогноза. В общем случае ошибка эконометрического прогноза может быть оп- ределена как разность между фактическим значением рассматриваемого показателя ут^,^. в некоторый момент времени T+Jt в будущем, которое, во- л обще говоря, неизвестно, и его значением yj^^}^, Л=1,2,...; л 477
При этом предполагается, что ошибка прогноза обладает следующими двумя свойствами: л 1) несмещенности, т.е. М[Л}^7'+л] = ^[>'г+л "Уг+л!"^» ^'^^ означает, л что прогноз yJ_^,f^ является несмещенной оценкой истинного значения Ут+ь 2) эффективности, т.е. дисперсия ошибки (T\Ayj.^J = M[£j.^^f = = ст^(ут^^]является минимальной среди дисперсий всех других возможных прогнозов, построенных с использованием данного эконометрического уравнения. л Далее, в предположении, что ошибка прогноза y^^j^ распределена со- гласно нормальному закону ^(0, <^(€т+к))у доверительный интервал для истинного значения прогноза может быть определен согласно следующе- му известному выражению: л А Л Л Ут+к-^^'^^Ут+к^^Ут+к ^Ут+к'^'^*'^(Ут+к^* (12.7) где ^ - табличная константа, полученная для стандартизованного нор- мального распределения N(0,1) при заданном уровне доверительной ве- роятности/?♦. Напомним, например, для/7*=0,95 г*=1,96. Таким образом, при определении ширины доверительного интервала эконометрического прогноза с использованием формального подхода ос- новной проблемой является оценка дисперсии рассчитанного прогнозно- л ГО значения у ^^^ рассматриваемого процесса. В общем случае такая оценка может быть получена, основываясь на информации, характеризующей степень неопределенности как в инстру- ментарии прогнозирования (модели), так и в исходных данных - про- гнозном фоне. Эта неопределенность обычно выражается характеристи- ками соответствующих ошибок. Так, неопределенность модели определя- ется ошибками ее параметров, характеристики которых заданы в виде их ковариационной матрицы - Cov(a)). В отношении прогнозного фона на практике обычно рассматривают два возможных варианта его неопределенности. Согласно первому из них прогнозный фон рассматривается как набор детерминированных показа- телей, т.е. предполагается, что значения независимых переменных опре- делены точно с нулевой ошибкой. Такая ситуация возможна при разра- ботке некоторых безусловных прогнозов, например, на основе моделей с 478
лаговыми зависимыми переменными (см. выражение (12.5)). Однако в большинстве случаев прогнозный фон нельзя считать детерминирован- ным. В самом деле, для моделей авторегрессии (выражения (12.3) и (12.4)), в частности, детерминированный эндогенный прогнозный фон имеет место только при разработке прогноза на момент Г+1. Значение л л Ут+\» используемое в расчете следующего прогнозного значения yj^2» уже определено на основании выражения (12.3) с ошибкой. Аналогично нет никаких гарантий, что и при экзогенном прогнозном фоне значения факторов Xij+k^ /=1,2,..., п\ /:=1,2,..., относящиеся к буду- щим моментам времени, определены абсолютно точно. Обычно эти зна- чения также получают в ходе каких-либо прогнозных исследований (на- пример, с использованием методов экспертного прогнозирования). В та- ких случаях обычно оцениваются и соответствующие характеристики ошибки их прогнозов. Прогнозный фон с известной ошибкой называют случайным. Рассмот- рим особенности методов оценки дисперсий прогнозных значений зави- симой переменной при детерминированном и случайном прогнозном фо- не более подробно. 12.2. МЕТОДЫ ОЦЕНКИ ДИСПЕРСИИ ПРОГНОЗА ПРИ ДЕТЕРМИНИРОВАННОМ ПРОГНОЗНОМ ФОНЕ Рассмотрим, не прибегая к излишней математической строгости, сна- л чала общий подход к оценке дисперсии прогноза у-р^^ • ^^^ ограничения л л общности предположим, что прогнозы yj-^j, У'р^2 »••• получены с исполь- зованием линейной эконометрической модели, ошибка которой характе- ризуется отсутствием автокорреляционных связей. В соответствии с процедурой разработки эконометрического прогноза, рассматриваемое прогнозное значение зависимой переменной у, напри- мер в момент времени Г+1, можно представить как случайную величину, определяемую по линейной модели типа (1.2) с учетом того факта, что ее параметры являются случайными величинами, а значения независимых факторов Х|, 7-+!, /=1,2,..., п; - детерминированные величины: Ут = ^ + (Xyxij+i +...+ On-Xnj^i + €т+и (12.8) где а;, f=0,l,..., п - коэффициенты эконометрической модели, рассматри- ваемые как случайные величины; £7+1 - случайная ошибка модели в мо- 479
мент Г+1. Представим коэффициенты модели а;в виде суммы их соответ- ствующих оценок, являющихся математическими ожиданиями, и ошибок а; = а/ + Аа/, (12.9) где математическое ожидание щ определено согласно используемому методу, например МНК (см. выражение (2.8)), а характеристики ошибок Аа/ определены как элементы вектора Аа=(Х'ХУ^Х'-е (см. выражение (2.9)). Подставим выражение (12.9) в (12.8). В результате получим л Ут+1 = Ут+1-^^Ут+\' (12.10) где показатель Ут+1 =^o+^i-^ij+i+--- + «n-^nj+i (12.11) представляет собой математическое ожидание прогноза, а показатель Аут+1 = А^о + Aai • дс^ j+j +... + Ал„ • x^j+i + ej+i (12.12) характеризует ошибку прогноза. Ее дисперсия может быть определена согласно классическому выра- жению С7^ (Ут-\-\) = ^[Ут+\ " Ут+11^ ~ ^[^Ут+1^^ в предположении о неза- висимости ошибки модели вт+х и ошибок коэффициентов модели Аа/, /=0,1,..., л; следующим образом: М[Аут+1 f = М[Aoq + Aai • дс^j+i +... + Аа„ • x^j^i + fy'+l 1^ = где ст/ - оценка дисперсии ошибки модели oi-cri J <^3 " дисперсия оценки а,, а соу(а;, а,) - ковариация оценок параметров а, и о,. Их значе- ния определены как элементы ковариационной матрицы с^(Х'Х)~ ; •^o.r+i =1 (см- выражение (2.18)). Еще раз отметим, что выражение (12.13) получено в предположении о независимости ошибки модели ^jvi в момент Г+1 и ошибок коэффициен- тов Ад/, которые согласно выражению (2.9) являются линейными функ- циями выборочных ошибок модели £j, г=1, 2,..., Г. Выражение (12.13) может быть представлено в матричной форме за- писи следующим образом: 480
= (Т^<х'т^у(Х'-ХГ^'Хт^^+1), (12.14) где jcr+/=(l, jci^7+i,..., Xn,T+\) - вектор-строка детерминированных уровней прогнозного фона, представляющего собой набор значений независимых факторов в моменты Г+1. Приведем также несколько более строгое доказательство выражения л (12.14). Для этого запишем расчетное значение прогноза y^-^i в вектор- ной форме: А , Ут+\ =^7+1«- (12.15) Аналогично представим истинное значение прогноза >'7+i Ут+1 =^г+1 «+^7+1' (12.16) где а - вектор-столбец значений параметров модели; 6:7+1 - значение ошибки истинного прогноза. С учетом представленных выражений ошибку прогноза согласно (12.6) выразим в следующем виде: л Аут+\=^т+1- Ут+1 =ST+\+XT+i'(X-XT+i'-a= =eT+i'^XT^i''a-XT+i4X'-X)-'' Г-у, (12.17) Подставляя в (12.17) вместо вектора наблюдаемых значений зависи- мой переменной 3^ его выражение j=XaH-^ получим Аут+1=€т+\-^хт+1''а-хт+1-(Х''Х)~^-Х''(Х'а¥€)= =€т+1-^хт+\-а-хт+1'-сх-хт+\'<Х'-ХУ^' X' е= ^ет+х-хт^х'^Х'-Х)-^- X е. (12.18) л с учетом (12.18) дисперсия ошибки прогноза y^^j определяется сле- дующим выражением: (^( ^7+1 )=MA/r+i] = МЛ+1]-2- хт^{'{Х'Х)-'' X^ej^veV ^хт^{\Х-Х)-^' Х'Щеё\Х\Х'Х)-^^хт^х. (12.19) При справедливости предположений о независимости ошибки бт+i и вектора ошибок модели е, гомоскедастичности и отсутствии автокорре- ляционных связей у вектора ошибки модели ^ имеем М\_её\^а^Е, 16 Эконометрика 481
в этом случае с учетом того, что ^£^74-1]=^/ легко показать, что вы- ражение (12.19) преобразуется в выражение (12.14) с учетом замены а} на а}. Заметим, что выражение (12.19) определяет все случаи, отражающие возможные свойства ошибки эконометрической модели. В частности, ко- гда у этой ошибки имеются автокорреляционные связи, например первого порядка, т.е. ef^pet-\ +Vr, v^ ~iV(0, a^\ Со1ч{у)-а^Е выражение (12.19) приобретает следующий вид: ^Хт^{-{Х'Х)-^^Х' Cov(£).X.(r-;f)'^-JCr+b (12.20) где вектор-столбец /?=[/?, (}, /7^,..., //^Y; Cov(f) = а]. ( л 2 Т-ЛЛ р 1р... /-2 1/-^ р'-' 1 где /7- коэффициент автокорреляции первого порядка. Заметим также, что для такой модели математическое ожидание про- л гноза yj^^ =М[ут^1] имеет следующий вид: Af[y7'+i]= М[хт+\'а^ет^1\= М[хт+\''0^рет-^Ут]=хт+\'а¥р€т. (12.21) Выражая ошибку модели в момент Г £7 через ее оценку ет ет=ет-хт'а (12.22) и подставляя выражение (12.22) в (12.21) с учетом замены коэффициента р на его выборочное значение г и вектора а на вектор а на практике по- лучим У7+1 ='" 3'7+(JCr+i - ХтУа. (12.23) Несложно показать, что в этом случае расчетное значение прогноза в момент r+it будет определяться следующим выражением: Ут+к =хт^к-а+ i^-ет. (12.24) При наличии у ошибки модели только свойства гетероскедастичности выражение (12.19) приобретает следующий вид: (/(у^^^ )=ae^^XT^i4X'X)''' rCowieyXiXXy'-XT^u (12.25) 482
где Cov{e) = at о\ о а ст, - дисперсия ошибки модели в момент г. Gj^ 12.3. МЕТОДЫ ОЦЕНКИ ДИСПЕРСИИ ПРОГНОЗА ПРИ СЛУЧАЙНОМ ПРОГНОЗНОМ ФОНЕ При случайном прогнозном фоне обычно предполагается, что значе- ния независимых факторов в будущие моменты времени Т+к являются случайными величинами, которые моэюно представить в виде суммы их математических оэюиданий и случайных ошибок \т+к = ^i,T+k -^^ij+k''' = 0,1,...,л. (12.26) При этом дисперсии и ковариации ошибок Ах/,г+ь ^jj+i в общем слу- чае предполагаются известными, и математические ожидания ошибок A/[Ax,,7+i]=0; /,7=1,...,л; (Г(хо)=М[Ахо]=0 в силу тождества jcqsI. Тогда, например, для момента Г+1 истинное значение прогноза опре- деляется следующим выражением: = (ao+Aao) + (ai+Afli)Ui7'+l+Axij+i) + ...+ Нап +AaJU;,j+i -^Ax^j+i)-^€t^i • (12.27) Далее обычно выдвигается вполне реалистическое предположение о независимости ошибок оценок параметров модели Да, и соответст- вующего прогнозного фона Ax/,7+i- Их независимость, в частности, яв- ляется следствием того, что параметры модели и прогнозный фон обычно определяются в ходе разных, не связанных между собой ис- следований. После раскрытия скобок в выражении (12.27) несложно заметить, что л расчетное прогнозное значение у^^^ (математическое ожидание процес- са) определяется выражением (12.11), а его ошибка Ayr+i - выражением следующего вида: п п п ^Ут+\ = Z^/ '^ij+i + Z^t -^/,7+1 + Z^/ '^i,T+i +^7+1' (12.28) 1=0 /=0 /=0 483
гдедсо,г+1=1, Axo.r+i^. Дисперсия такой ошибки определяется на основании известного вы- ражения c^(AyT+i)-M[AyT^if с учетом некоторых дополнительных пред- положений, касающихся свойств ошибки модели. В случае ее гомоскеда- стичности и отсутствия автокорреляционных связей, т.е. при (T/=const, Cov(€)=a/j5, имеет место и независимость ошибок коэффициентов моде- ли Да/ и ошибки £74-1. Независимость ошибки прогнозного фона и ошибки вт+х практически очевидна. В этом случае, возводя в квадрат правую часть выражения (12.28) и беря математическое ожидание от полученного выражения после не- сложных вычислений, получим + 21 ^^"^(^iJ+u^jJ-^O'^i'^j-^ (12.29) /,;=0,...,п + 2 cov(a,-, ар • cow(Xij+^, Xjj+i )'^сге. /,У=0,...,л где cow(Xij+u Xjj+i) - ковариация случайных /-го и j-ro значений прогноз- ного фона; при /=/, cov(a/, а/)=с^(а(); соу(л:/,г+ь Xjj+i)^(^{Xij^\)\ cov(a/, ay)=cov(ay, ад и cov(x/,7'+b Xjj+i)=cov(Xjj+u ^/,r+i); xqj^i=0\ O^(xo,r+i)=0; cov(Xioj^h л:;т+1)=0,7=1,...,л. При выводе выражения (12.29) также учтено, что математические ожидания сомножителей типа Да/Дх/т'+гАх/.т'+гАа/, АХ|',7+гАа/Да/Ах/,7+ь AarAxjj+yAaj-Axij+i равны нулю в силу введенных предположений о ра- венстве нулю математических ожиданий рассматриваемых ошибок и не- зависимости ошибок Да,, Ах/,7+ь7=1»-—л. А Для получения выражения, определяющего дисперсию прогноза yj'+i при случайном прогнозном фоне и свойствах ошибки модели, отличных от «белого шума», представим выражение (12.28) в векторной форме за- писи: А>'7+1=УС7+1'*Аа+Дх7+1'-а+Ддг7'+1'-Дл+£7'+1- (12.30) Далее, как и в разделе 12.2, выразим векторы оценок коэффициентов модели и их ошибки в векторно-матричной форме записи а^(Х'-ХУ^Х''Уу Аа=(Х''ХУ^Х''€, где е- вектор истинной ошибки модели, X - матрица на- блюдаемых значений независимых факторов, у - вектор наблюдаемых значений зависимой переменной на интервале (1,7). Получим 484
+Д]Сг+/-(Г.Л0"^-Г£+б:г+1. (12.31) Дисперсию ошибки прогноза с учетом оговоренных выше предполо- жений о независимости и свойствах ошибок Да,, UXjj^u V=0»-.., п\ опреде- лим как математическое ожидание от квадрата этой ошибки +/.Л: .(Г-ЛО-'-ЛЯДхг.ь AxV^i] iX'Xy'' Х'у +М[Л.1]+ + л:г+/-(ГЛО"^- Х'М[ет^уе], (12.32) В предположении, что М[е^]=(7^Е и независимости ошибок ег+\ и £}, /=1,..., Г имеем 1) МАхг+/-(^'-^"^- ГМ[^^]-^(^'--Ю"^-Ал:7+1]= =ст/- Л/[Ддг7+/(ЛГ'-Д0"^-A^r+i]= X ^^^^^«'^Р'со^(Д^|.г+1'Д^;.г+1)' 2)M^m^]=0. В этом случае несложно показать, что выражение (12.32) приобретает следующий вид: сг( y-p^i )=XT+\''Cov(a)-XT+iWCow{Ax)a-^ + Af[Ax:r+/-Cov(a)- Axr+il+cr/, (12.33) где Соу(Ддс) - ковариационная матрица вектора ошибок прогнозного фо- на; М[^т+\''Со\(аУ Ax7'+i]= Xcov(a,-,aj)-co\(Axij+i, Ахуj+i). Несложно заметить, что выражения (12.29) и (12.33) эквивалентны. При наличии у ошибки модели только свойства гетероскедастичности последнее слагаемое в правой части выражения (12.32) обращается в нуль, а ковариационная матрица ошибки имеет следующий вид: М[€'е'] = При наличии автокорреляционных связей у ошибки модели вектор М[€т+у^ имеет специфический вид, определяемый характером этих свя- зей. 485 V.' .0 <г1 0^ ^h
12.4. ПРОГНОЗИРОВАНИЕ НА ОСНОВЕ МОДЕЛЕЙ ВРЕМЕННЫХ РЯДОВ Рассмотрим особенности разработки прогнозов стационарного про- цесса - временного ряда, описываемого обобщенной моделью авторег- рессии-скользящего среднего порядка (к,т) (выражение (6.87)): о о о y,=0!ry,-l+- + Oeky,-k + ^t-fil-^t-\---fim£l-m> о где у J в общем случае представляет собой центрированную переменную с математическим ожиданием //. Таким образом, данную модель можно переписать в несколько изме- ненном виде: Уг-//=^г(3'/-1-//)+..>сгг(}^г-^-//)+бг-Д-^гч-...-Дг^г-/п (12.34) и после очевидных упрощений - в следующем виде: >;F(l-^i-...^it>//+^i7M+...^ryr-^+^A-^M-...-Ar^r-^. (12.35) Предположим, что оценки математического ожидания ошибок и оце- нок коэффициентов модели были получены на основе временного рядад^ь Оценка точечных прогнозов Из выражения (12.35) следует, что прогнозное значение показателя yiil), т.е. на один шаг вперед, может быть определено как условное мате- матическое ожидание переменной ут при известном прогнозном фоне, определенном предшествующими значениями ут, ут-\ и «эмпирическими» (фактическими) ошибками вт, ^г-ь— • У7<1) = М\ут+11 Ут, Ут-и еъ ет-и .••] (12.36) при известных значениях оценок коэффициентов о;, Д, i=ly.,.,k,j=l,...ym. Подставляя вместо переменных >;,_„ ошибок £t-r и коэффициентов а;, J3j соответствующие значения и оценки, на основе выражения (12.35) получим Ут{\) = (1-а1 -...-а^)у + ауут +^2 'Ут-\ -^"' + ^к'Ут-к+\ " -bi ej -...-b^ '^т-т+\ у (12.37) где y = Y,ytfT' " оценка математического ожидания процесса у,, г Заметим, что в выражении (12.37) отсутствует ошибка ^г+ь поскольку ее математическое ожидание равно нулю, как и всех ошибок будущих моментов времени, Л/[^7'+„]=0, л=1,2,.... 486
Таким образом, прогноз на два шага вперед уже рассчитывается как Ут(2) = (1-а1 -'.,.-а1,)у + а1'Ут(1)+а2Ут +... + а;^ 'Ут-к+2 " -bi е-г -'--Ь^ -^т-т+г^ (12.38) а прогнозное значение на / шагов вперед, где 1>т вообще формируется без учета значений ошибок модели УА1)^тУтн] = а-а,-...-а,)ху^ +а,Уг(1'1)-^... + а,Уг(1-к) Несложно видеть, что, например, для моделей авторегрессии AP(ifc) выражение (12.39) определяет прогнозное значение для периода упреж- дения любой глубины. В частности, для модели АР(1) при прогнозирова- нии уже на один шаг вперед получим Ута) = (1-аО'У+ауУт, (12.40) В свою очередь, ошибка модели скользящего среднего первого поряд- ка СС(1) учитывается только в прогнозе на один шаг вперед Ута) = У-Ьгет. (12.41) Все следующие прогнозы па основе этой модели рассчитываются по одной и той же формуле: Ут-(0 = 7,1 = 2,3,... (12.42) Для АРСС(1,1) математическое ожидание прогноза на 1 шаг вперед представляется в следующем виде: У7'(1) = а-Д1)У+Л1Уг-^-^г» (12.43) а на последующие моменты времени уже в виде У7^(0 = (1-Л1).у+а1У7.(/-1), 1 = 2,3,... (12.44) Из изложенного материала вытекает, что разработка прогнозов ста- щюнарных процессов, описываемых моделями временных рядов типа АРСС(к, т) для любого периода упреждения / основана на достаточно не- сложной итеративной процедуре расчета последовательных прогнозных значений>'7<1),>'7{2),...,>'7{0 по построенному варианту модели. Проблемы оценки дисперсий прогнозов Вместе с тем оценка дисперсий таких прогнозов представляет собой достаточно сложную проблему, корректное решение которой в аналити- ческом виде еще не получено. Раскроем суть этой проблемы с учетом ре- зультатов, полученных в разделах 12.2 и 12.3. В соответствии с ними, дисперсия прогноза на I точек вперед с использованием модели АРСС(/:, 487
т) должна быть определена как математическое ожидание квадрата ошибки прогноза: (Т^{ут^1) = М[Аут(1)]^ =М[ут^1 -Ут(1)]^ = = M{[l-(ai+Afli)-...-(a^+Aa;t)].y + (ai+Afli)(>'7'(/-l)) + ... -(Ь^+АЬ^)-€т^1^^]-[(1-а1-..,-а1,)'У + а1Ут{1-1)-^... + a^};7^(/-^)-bi.f7^_M-...-fe^.£7^.;_^]}2, (12.45) где символ Дх означает ошибку переменной jc. В случае детерминирован- ных величин (дисперсия равна нулю) их ошибка должна быть принята равной нулю. Так, например, дисперсия прогноза процесса, разрабатываемого на один шаг вперед с помощью модели АРСС(1,1) в этом случае должна оп- ределяться на основе следующего выражения: ^^ (>'г+1) = ^[Ут+\ - Ут (0]^ = = M{[l-(ai+Aai))'y + (ai+Aai)yT- -(bi -^Abi)'€T]- [(Х-аО'у-^ауУт -b^ f J}^ = = M{-Aai y + Afli Ут-Ьх Ej -АЬ^ ^rl^, (12.46) Дисперсия прогноза на два шага вперед в этом случае будет иметь следующий вид: ^^(Уг+2) = Л^[>'Г+2-)'г(0]^ = M{[l-(ai+Aai))y+ +(ai + Afli) • (Уг (1) + ^Ут (1)) -Ф\+Щ)' €т+\ ] - -[(}-аО'У+ах'(ут(т}^ = = М{-Аа| y + Afli •утО)-^^\ Ayj-W + A^l АугО)"" -Ьх-бт+х-Щет+х]', (12.47) В выражениях (12.46) и (12.47) учтено, что ошибка показателей утИ у равна нулю, а также, что математическое ожидание ошибки £7+1 равно нулю. Теоретически при известных дисперсиях оценок коэффициентов мо- делей АРСС(к, т), их взаимных ковариаций, а также дисперсий преды- дущих прогнозных значений>^7{'-^)» г=1,2,... и дисперсий ошибки ее по- мощью выражения (12.45) оценку дисперсии прогноза (Т(уг+д определить не слишком сложно, хотя ее математическое выражение и будет выгля- деть достаточно громоздко. Однако следует иметь в виду, что если с по- мощью рассмотренных в главе VI методов дисперсии (и ковариаций) про- 488
гнозов ут+i-r ошибки е, определить возможно, то дисперсии коэффициен- тов модели оценить можно лишь приблизительно и то, используя доста- точно сложные методы. Это вызвано тем, что оценки моделей APCC(it, т) определяются либо на основе выборочных значений коэффициентов ав- токорреляции рассматриваемых процессов (уравнения Юла-Уокера, не- линейные методы оценки коэффициентов скользящего среднего), либо с использованием нелинейных методов оценивания. В первом случае дисперсии оценок ставятся в зависимость от показа- телей точности выборочных коэффициентов автокорреляции, которые к тому же сами определяются лишь приблизительно (см. главу VI). Так, на- пример, если для модели АР(1) дисперсию параметра аи равного п, мож- но (с известной погрешностью) приблизительно считать равной 1/Г, (^(а\) = o^(ri) = 1/Г, где ri - первый выборочный коэффициент автокор- реляции рассматриваемого процесса, то уже для модели АРСС(1,1) этот коэффициент равен а\=^Г21г\ и даже при известных дисперсиях оценок ко- эффициентов автокорреляции г\ и гг показатель o^(ai) оценить достаточ- но сложно. При этом с увеличением размерности модели АРСС(р,^) про- блема оценки дисперсий ее коэффициентов, а тем более их ковариаций, значительно осложняется. Нелинейные методы оценки параметров модели также в явном виде не позволяют определить их показатели точности. Оценки дисперсий прогнозов при детерминированных параметрах моделей В этой связи в научной литературе обычно рассматриваются методы оценки дисперсий прогнозов процессов, представленных в виде времен- ных рядов, не учитывающих ошибки оценок коэффициентов, описываю- щих их моделей. Таким образом, эти методы учитывают специфику мо- делей с детерминированными параметрами. Очевидно, что эти методы не в полной мере адекватны условиям поставленной задачи. Однако они ха- рактеризуются определенной математической строгостью и при неболь- ших ошибках (дисперсиях) коэффициентов моделей позволяют получить относительно точные оценки дисперсий прогнозов, а следовательно, и их доверительных интервалов. Эти методы можно рассматривать как следствие более общих результа- тов теории прогнозирования, полученных Г. Валдом, Н.Винером, А. Кол- могоровым, П. Уиттлом. В их основе лежит идея представления прогнозно- го значения рассматриваемого процесса, описываемого моделями типа APCC(ik, m), в виде условного математического ожидания, зависящего от 489
известных в моменты Г, Г-1,... его значений в прошлом, и ошибки, выра- жаемой текущим и предшествующими значениями «белого шума». В целях избежания излишней громоздкости рассмотрим эти методы на примере наиболее простых вариантов моделей временных рядов первого порядка. Модель АР(1) В соответствии с выражением (12.34) представим модель АР(1) в виде следующего уравнения: которое для наших целей более удобно представить в следующем виде: у, = (1 - аО • // + avyt-i + ^, (12.48) Из выражения (12.48) вытекает, что прогноз на один шаг вперед, т.е. на момент Г+1, является случайной величиной, определяемой следующим вьфажением: Уг+1 = (1 - CTi) • // + ауут+ St^i. (12.49) Математическое ожидание этого прогноза имеет следующий вид: Ут(1) = М[ут^^\ут] = а-щ)у+ауУт. (12.50) Ошибка такого прогноза определяется как АугО) = Ут+1 -Л/[yj'+i I З'г] = = (ai-ai)-(//-y) + (^i-ai)-y7'+^7+i=(^i-^i)-)'r+^+i- (12.51) При определении дисперсии прогноза различие между параметром а\ и его оценкой ai во внимание не принимается. В результате имеем Ау7<1) = ет.и <^(ут^х) = сг/. (12.52) Для момента Г+2 прогноз определяется по следующей схеме: УТл-2 = (1 - ^l)-// + ССУУТ^Х + £7+2 = =(1 - ai)//+ ау[{\ - ai)//+ ауут+ £t+i] + £т+2. (12.53) Из выражения (12.53) следует, что математическое ожидание этого прогноза имеет следующий вид: Ута2)^М[ут^2^Ут] = {\-а1)'ул-а1-ут, а ошибка ^утО) равна Ау7<2) = £т+2 + ССх -бт+ь (12.54) В свою очередь, с учетом независимости £74.2 и fr+i из выражения (12.54) следует, что дисперсия прогноза на момент Г+2 оценивается со- гласно следующему выражению: 490
a^(yT^2) = <re4l+aib. (12.55) Продолжая схему прогнозирования, определенную выражениями (12.48)-( 12.55) несложно видеть, что прогноз на / шагов вперед на основе модели АР(1) представляется в следующем виде: утм = (1 - cei'yju + агут + {Et^i + агетм-\+-+ «/"'fr+i). (12.56) Его математическое ожидание определяется вьфажением УЛ1) = М[Ут.1\Ут^ = (Х-а')-у+а[-у^, (12.57) а ошибка и ее дисперсия - соответственно вьфажениями ДуКО = етм + avSTM-x +•••+ ос\-£т*\, (12.58) <^Ьт^!) = (1 + ai' + а,' +...+ a,'"-'Vo-,l (12.59) Из выражений (12.57), в частности, вытекает, что так как I aj <1, то с ростом / математическое ожидание прогноза стремится к математическо- му ожиданию стационарного процесса а предел дисперсии прогноза определяется следующим выражением 2 ^^(3^7+/)^-^. (12.60) 1-^1 Модель СС(1) На момент Г+1 на основе модели СС(1) получим следующее прогнозное значение рассматриваемой переменной У' Ут^\=1И+ет^1-руеъ (12.61) Поскольку математическое ожидание ошибки 67+1 равно нулю, а ее значение в момент времени Т известно, то математическое ожидание та- кого прогноза равно Ут(Х) = М[Ут-\-Л-У ~^^\^т' (12.62) где ет - оценка ошибки модели в момент Т. Из (12.61) и (12.62) вытекает, что с точностью до замены параметра Д на его оценку Ь\ ошибка такого прогноза равна бт+ь Ау7<1) =Уг+1 -МО = ^г+ь (12.63) а его дисперсия - <j/ 491
c^(ym) = oh (12.64) Прогаоз на два шага по модели СС(1) определяется выражением yT^i^lLi-^er^-i-pver^h (12.65) Его математическое ожидание равно у - Ут(2) = М[уг^2]^ M[fi] = у. (12.66) Ошибка такого прогноза равна А>^7<2) = ут^г - У7<2) = ег^г - РуВг^и {П.Ы) а ее дисперсия определяется следующим вьфажением: (^(ут^г) = М[{ег^2 - Pi-er^xf] = (1 + b.'-yd (12.68) Несложно заметить, что выражение (12.68) определяет величину дис- персии ошибки прогноза, полученного с использованием модели СС(1), на любое количество шагов вперед, поскольку сама ошибка представля- ется в следующем виде: ^y^{t) = ут^1-ут{1) = er^i - PySr^i-x, I = 2,3,... (12.69) Модель АРСС(1,1) Модель АРСС(1,1), являющуюся комбинацией рассмотренных выше моделей АР(1) и СС(1), представим в следующем виде: Несложно заметить, что прогнозное значение переменной ут^\ опреде- ляется следующим выражением: ут^х = (1 - ai)//+ ауут-^ег^х-руег. (12.70) Математическое ожидание такого прогноза с учетом равенства нулю математического ожидания ошибки бт^-х и известного значения ошибки £г = ^г равно A/[yr+i] = yrO) = (l-ai)y+«r}'7-*r^r- (12.71) Дисперсию такого прогноза оценим на основании следующего вьфа- жения: М[ут^х - уО)]^ = М[ет^{[^ = (т|. (12.72) При его выводе учтено, что А/[^1] = а,М[//] = у,Л/[Д] = Ь1. 492
Прогнозируя на момент Г+2, получим следующие выражения, опреде- ляющие прогнозное значение рассматриваемой переменной и его матема- тическое ожидание соответственно: Уг+2 = (1 - ^1^>//+ ах^^ут-^ ег^1 + (ori -yffi)-6?r+i - aypyer, (12.73) Ут{1)--{\-а'^)у + а1ут''ауЬует. (12.74) Из вьфажений (12.73) и (12.74) вытекает, что оценка дисперсии про- гноза на два шага вперед с использованием модели АРСС(1,1) может быть представлена в следующем виде: О^СУг+2) = Л/[уг+2 - yjO)f = М[^7+2 + {ах - 6i)-£7'+l]^= = a/-[l + (ai-&,)']. (12.75) Продолжая последовательно процедуру прогнозирования на момент Г+/, получим следующие выражения прогнозного значения случайной ве- личины и ее математического ожидания: ут^1 = (1 - а/)-// + ax-er^i + {ах - >ffi)-£7+/-i + -н ai-(ciri -Р\Уегм-2 +...+ cir/"^-(Qri - Д)-£^+/- сг/"^-^; (12.76) ут{1) = (1 - а/)-// + а/-);г- ^iW (12.77) Соответственно из выражений (12.76) и (12.77) вытекает, что оценка дисперсии этой ошибки (дисперсии прогноза) может быть определена следующим образом: О^СУг+/) = М\ут^1 - yjiOf = = аЛ[(1 + {ах - bxf + ахЧах - bxf +...+ ах^'^^'^Чах - ^i)']. (12.78) Несложно показать, что /—>«> оценка дисперсии прогноза ут+i стремит- ся к следующему пределу: a^yr./)^<T|.b^^LAl^. (12.79) /->оо 1 - ах По аналогичной схеме в предположении о детерминированном харак- тере показателей моделей могут быть получены выражения, определяю- щие оценки дисперсий прогнозов моделей временных рядов и других мо- дификаций, включая модели финансовой эконометрики. ВОПРОСЫ к ГЛАВЕ XII 1. Что представляет собой «верификации прогноза»? 2. Как оценивается точность прогноза? 3. Что представляет собой «доверительный интервал прогноза»? 493
4. Охарактеризуйте методы оценки доверительного интервала прогно- за в моделях с детерминированными и случайными параметрами. 5, Охарактеризуйте особенности прогнозирования на основе моделей временных рядов. УПРАЖНЕНИЯ К ГЛАВЕ XII Задание 12.1 На основании выборки из 20 наблюдений оценено следующее уравне- ние зависимости затрат на рекламу у от годового оборота х в определен- ной отрасли (см. задание 2.4): у =-1,6042+0,1621-д:. Известно, что ошибка уравнения распределена нормально с нулевым математическим ожиданием и постоянной дисперсией. Требуется: 1. Определить 95%-й прогнозный интервал математического ожида- ния целевой переменной уо при лсо=30. 2. Определить 95%-е прогнозные интервалы математического ожи- дания целевой переменной при значениях объясняющей переменной 10, 15, 20, 25. Отобразить все прогнозные интервалы и линию регрессии на графике. Прокомментировать результат. Проверить правильность ут- верждения: «С доверительной вероятностью 95% все перечисленные прогнозные значения математического ожидания лежат в данном интер- вале. 3. Оценить 95%-й прогнозный интервал для отдельного значения це- левой переменной при лсо=30 и сравнить его с прогнозным интервалом в п. 1. Задание 12.2 На основании выборки из 10 наблюдений оценено следующее уравне- ние зависимости спроса на некоторое благо у домохозяйств определенной структуры (у) от цены этого блага (х\) и дохода домохозяйства (х2) (см. задание 2.15): y = 13,271-l,4937-;ci+0,023118-JC2. Известно, что ошибка уравнения распределена нормально с нулевым математическим ожиданием и постоянной дисперсией. 494
Требуется: 1. Рассчитать 95%-й прогнозный интервал математического ожидания целевой переменной уо для значений объясняющих переменных (5,5; 1100) и (6,0; 1150). 2. Определить 95%-й прогнозный интервал для отдельного значения целевой переменной при таких же, как в п. 1, значениях объясняющих переменных. Задание 12.3 Имеется информация о средних транспортных индексах в летний пе- риод 1999 г. (см. табл. 6.3). Требуется на основе интегрированной модели АРСС (0,1,1), оценен- ной в задании 6.5, построить точечный прогноз исследуемого показателя на 3 периода вперед. Задание 12.4 Имеются данные процесса контроля качества (см. табл. 6.5). Требуется на основании интегрированной модели АРСС (1,1,1), оце- ненной в задании 6.6 п. 2, построить точечный прогноз исследуемого по- казателя на 3 периода вперед. Задание 12.5 Имеется следующая модель GARCH(1,1): = 0,000193+0,49645 e^.i 4-0,547980-у2_^ +д^. Требуется построить точечный прогноз условной дисперсии на 3 пе- риода вперед, если последнее ее расчетное значение для базисного пе- риода равно 0,7619, а остаток составляет 0,0707. Задание 12.6 На основании информации, приведенной в табл. 12.1, оценены коэф- фициенты структурной формы системы взаимозависимых уравнений С, =41,4245+0,6216-У,+в,; Требуется: 1. Оценить коэффициенты прогнозной формы. 2. Рассчитать точечный прогноз валового национального продукта и потребления, если объем инвестиций равен 164,50. 495
3. Построить 95%-й совместный прогнозный интервал для эндогенных переменных. 4. Определить 95%-е прогнозные интервалы для отдельно взятых эн- догенных переменных. Таблица 12.1 Период 1 2 3 4 5 6 7 Период 8 9 10 11 12 13 14 15 16 17 18 Потребление, С, 226,37 239,93 252,99 260,37 273,34 292,11 300,62 Потребление, 303,63 317,39 342,41 367,55 386,80 402,24 412,48 413,79 425,93 441,68 445,50 Валовый национальный продукт. У, 308,599 327,563 344,420 352,998 378,819 401,523 411,201 Инвестиции, /, 95,12 101,29 104,04 102,85 112,39 118,77 120,35 Окончание таблицы 12.1 Валовый национальный продукт, Yt 406,023 442,000 477,637 533,110 562,388 583,098 609,915 611,528 600,410 628,388 643,152 Инвестиции, /, 112,61 116,60 129,28 143,03 154,18 161,12 161,64 140,35 133,98 143,25 151,46 496
краткий словарь терминов adjusted /?^- скорректированный коэффициент детерминации autocorrelation function (ACF)- автокорреляционная функция autoregressive conditional heteroscedasicity (ARCH) - авторегрессионная модель с условной гетероскедастичностью autoregressive model (AR) - авторегрессионная модель autoregressive integrated moving average model (AREMA) - интегриро- ванная модель авторегрессии-скользящего среднего best linear unbiesed estimator (BLUE) -лучшая (эффективная) оценка в классе линейных несмещенных оценок binary variable - бинарная переменная, которая может принимать значе- ния О и 1 Box-Jenkins model (ARIMA) - модель Бокса и Дженкинса, интегриро- ванная модель авторегрессии-скользящего среднего censored model - модель, основанная на цензурированной выборке, зави- симые переменные ограничиваются некоторым пороговым значением classical normal regression (CNR) - классическая регрессионная модель, ошибки которой имеют совместное нормальное распределение classical regression (CR) - классическая регрессионная модель coefficient of determination (/^-squared) - коэффициент детерминации conditional distribution - условное распределение confidence interval - доверительный интервал consistent estimator - состоятельная оценка convergence in distribution - конвергенция по распределению correlation - корреляция correlation coefficient - коэффициент корреляции count data - счетные данные covariance - ковариация cross-section data - поперечные данные, показатели, характеризующие разные объекты в фиксированный момент времени 497
density function - функция плотности dependent variable - зависимая переменная distributed lags model - модель распределенных лагов distribution - распределение dununy variable - фиктивная переменная duration model - модель «времени жизни» efficient estimator - эффективная оценка endogenous variable - эндогенная переменная, переменная, определяемая внутри модели estimator - оценивание exogenous variable - экзогенная, внешняя по отношению к модели пере- менная explanatory variables - объясняющие переменные exponential smoothing - экспоненциальное сглаживание fitted value - прогнозное значение generalized autoregressive conditonal heteroscedasticity model (GARCH) - обобщенная авторегрессионная условно гетероскастичная модель generalized least squres (GLS) estimation - обобщенный метод наимень- ших квадратов goodness-of-fit- качество приближения моделью данных hazard rate - интенсивность отказов heteroscedasticity- гетероскедастичность, непостоянство дисперсии homoscedasticity - гомоскедастичность, постоянство дисперсии idempotent matrix - идемпотентная матрица independent variable - независимая переменная index function - индексная функция indirect least squares - косвенный метод наименьших квадратов information matrix- информационная матрица instrumental variable (ГУ)- инструментальная переменная intersept - свободный член joint distributoin - совместное распределение kernel estimator - метод оценивания непараметрической регрессии lag operator - оператор сдвига 498
lagged variable - запаздывающая переменная latent variable - сьфытая, ненаблюдаемая переменная law of large numbers - закон больших чисел likelihood function - функция правдоподобия linear probability model - линейная модель вероятности linear regression model - линейная регрессионная модель logit model - /og/r-модель, нелинейная модель бинарной зависимой пере- менной, основанная на логистическом распределении ошибки loglikelihood function - логарифм функции правдоподобия marginal distribution - маржинальное распределение, распределение од- ной или нескольких компонент случайного вектора maximum likelihood (ML) - метод максимального правдоподобия maximum likelihood estimate - оценка максимального правдоподобия maximum likelihood estimator - оценивание с помощью метода макси- мального правдоподобия maximum score estimator (MSCORE) - оценивание по методу макси- мального счета mean - математическое ожидание mean absolute deviation - среднее абсолютное отклонение mean absolute percentage error - среднее относительное отклонение mean squared error - среднеквадратическая ошибка model for binary choice - модель бинарного выбора model for multiple choice - модель множественного выбора model speciflcation - спецификация модели moving average - скользящее среднее moving average (MA) model - модель скользящего среднего multicollinearity - мультиколлинеарность multiple regression model - модель множественной регрессии normal (Gaussian) distribution - нормальное (гауссовское) распределение OLS-estimator - оценивание с помощью метода наименьших квадратов ommited variables - пропущенная (невключенная в модель) независимая переменная ordired data - упорядоченные данные 499
ordinary least squares (OLS) method - метод наименьших квадратов panel data - сочетание временного и поперечного ряда, т.е. сово1супность показателей, относящихся к разным объектам, за определенный период времени partial autocorrelation function (PACF) - частная автокорреляционная функция partial correlation coefficient- частный коэффициент корреляции probit model - ргоб/г-модель, нелинейная модель бинарной зависимой переменной, основанная на нормальном распределении ошибки qualitative variable - качественная переменная random utility model - модель случайной полезности random walk - случайное блуждание ranking variable - ординальная, порядковая, ранговая, переменная reduced form of the model - приведенная или прогнозная форма моде- ли residuals - остатки restricted regression - регрессия с ограничениями на параметры sample - выборка sample mean (variance, covariance, moment etc.) ~ выборочное среднее (дисперсия, ковариация, момент и т.д.) seemingly unrelated regression (SUR) - система внешне несвязанных уравнений selection model - модель, основанная на случайно усеченной выборке serial correlation - корреляция между показателями, относящимися к разным моментам времени significance level - уровень значимости simultaneous equations - одновременные уравнения slope - коэффициент наклона standart deviation - стандартное отклонение (квадратный корень из дис- персии) stationary time series - стационарный временной ряд strictly stationary process - строго стационарный процесс, стационарный в узком смысле процесс time-series data - временной ряд 5(Ю
truncated model - модель, построенная для усеченной выборки, т.е. та- кой, из которой исключены некоторые наблюдения two-stage least squares (2SLS) - двухшаговый метод наименьших квадра- тов unbiased estimator - несмещенная оценка unrestricted regression - модель без ограничений на параметры variance - дисперсия variance (covariance) matrix- ковариационная матрица weighted least squares - взвешенный метод наименьших квадратов white noise - «белый шум», процесс с независимыми одинаково распре- деленными значениями с нулевыми средними
ПРИЛОЖЕНИЕ 1 ФУНКЦИЯ СТАНДАРТНОГО НОРМАЛЬНОГО РАСПРЕДЕЛЕНИЯ Ф(г) = Jl^ ■Jbt' z 0,0 0.1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1.0 \л 1,2 1,3 1,4 1,5 1,6 1,7 1,8 1,9 2,0 2,1 2,2 2,3 1 2,4 0 0,5000 0,5398 0,5793 0,6179 0,6554 0,6915 0.7257 0,7580 0,7881 0,8159 0,8413 0,8643 0,8849 0,9032 0,9192 0,9332 0,9452 0,9554 0,9641 0,9713 0,9772 0,9821 0,9861 0,9893 0,9918 0,01 0,5040 0,5438 0,5832 0,6217 0,6591 0,6950 0,7291 0,7611 0,7910 0,8186 0,8438 0,8665 0,8869 0,9049 0,9207 0,9345 0,9463 0,9564 0,9649 0,9719 0,9778 0.9826 0,9864 0,9896 0,9920 0,02 0,5080 0.5478 0,5871 0,6255 0,6628 0,6985 0,7324 0,7642 0,7939 0,8212 0,8461 0,8686 0,8888 0,9066 0,9222 0,9357 0,9474 0.9573 0.9656 0,9723 0,9783 0,9830 0,9868 0,9898 0,9922 0,03 0,5120 0,5517 0,5910 0,6293 0,6664 0,7019 0,7357 0,7673 0,7967 0,8238 0,8485 0,8708 0,9707 0,9082 0,9236 09370 0,9484 0,582 0,9664 0,9732 0,9783 0,9830 0,9868 0,9898 0,9922 0,04 0,5160 0,5557 0,6948 0,6331 0,6700 0,7054 0,7389 0,7704 0,7995 0,8264 0,8508 0,8729 0,8925 0,9099 0,9251 0,9382 0,9495 0,9591 0,9671 0,9738 0,9793 0,9838 0,9875 0,9904 0,9927 0,05 0,5199 05596 0.5987 0,6368 0,6736 0,7088 0,7422 0,7734 0,8023 0,8289 0,8531 0,8749 0,8944 0,9115 0,9265 0,9394 0,9505 0,9599 0,9678 0,9744 0,9798 0,9842 0,9878 0,9906 0,9929 0,06 0,5239 0.5636 0.6026 0.6406 0,6772 0,7123 0,7464 0,7764 0,8051 0,8315 0,8554 0,8770 0,8962 0,9131 0,9279 0,9406 0,9515 0,9608 0,9686 0,9750 0,9803 0,9846 0,9881 0,9909 0,9931 0,07 0,5279 0,5675 0,6064 0,6443 0,6808 0,7167 0,7486 0,7794 0,8078 0,8340 0,8577 0,8790 0,8980 0,9147 0,9292 0,9418 0,9525 0,9616 0,9693 0,9756 0,9808 0,9850 0,9884 0,9911 0,9932 0.08 0,5319 0,5714 0,6301 0,6480 0,6844 0,7190 0,7517 0,7823 0,8106 0,8365 0,8599 0,8810 0,8997 0,9162 0,9306 0,9429 0,9535 0,9625 0,9699 0,9761 0,9812 0,9854 0,9887 0,9913 0,9934 0,09 0,5359 1 0,5753 1 0,6141 0,6517 0,6879 0,7224 0,7549 0,7852 0,8133 0,8389 0,8621 0,8830 0,9015 0,9177 0,9319 0,9441 0,9545 0,9633 0,9706 0,9767 0,9817 0,9857 0,9890 0,9916 0,9936 1 502
Окончание приложения 1 Z 2,5 2,6 2,7 2.8 2,9 1 3,0 0 0,9938 0,9953 0,9965 0,9974 0,9981 0,9987 0,01 0,9940 0,9955 0,9966 0,9975 0,9982 0,9987 0,02 0,9941 0,9956 0,9967 0,9976 0,9982 0,9987 0,03 0,9941 0,9956 0,9967 0,9976 0,9982 0,9987 0,04 0,9945 0,9959 0,9969 0,9977 0,9984 0,9988 0,05 0.9946 0.9960 0.9970 0,9978 0,9984 0.9989 0,06 0,9948 0,9961 0,9971 0,9979 0,9985 0.9989 0.07 0,9949 0,9962 0,9972 0,9980 0,9985 0,9989 0,08 0.9951 0.9963 0,9973 0.9980 0.9986 0.9990 0.09 0.9952 0.9964 0,9974 0.9981 0,9986 1 0.9990 1 503
ПРИЛОЖЕНИЕ 2 ДВУСТОРОШШЕ КВАНТИЛИ РАСПРЕДЕЛЕНИЯ СТЬЮДЕНТА Число степеней 1 свободы 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 ■ 25 30 40 50 100 200 оо а 1 0,1 6,314 2,920 2,353 2,132 2,015 1,943 1,895 1,860 1,833 1,812 1,796 1,782 1,771 1,761 1,753 1,746 1,740 1,734 1,729 1,725 1,708 1,697 1,684 1,676 1,660 1,652 1,645 0,05 12,706 4,303 3,182 2,776 2,571 2,447 2,365 2,306 2,262 2,228 2,201 2,179 2,160 2,145 2,131 2,120 2,110 2,101 2,093 2,086 2,060 2,042 2,021 2,009 1,984 1,972 1,960 0,01 1 63,657 9,925 5,841 4,604 4,032 3,707 3,449 3,355 3,250 3,169 3,106 3,055 3,012 2,977 2,947 2,921 2,898 2,878 2,861 2,845 2,878 2,750 2,704 2,678 2,626 2,601 2,576 504
ПРИЛОЖЕНИЕ 3 ТАБЛИЦА КРИТЕРИЯ ДАРБИНА-УОТСОНА ДЛЯ (»= 0,05 т 6 7 8 9 10 И 12 13 14 1Ь 16 17 18 19 20 21 22 23 24 25 30 40 50 60 70 80 90 100 150 [200 я=1 ^1 0,610 0,700 0,763 0,824 0,879 0,927 0,971 1,010 1,045 1,077 1,106 1,133 1,158 1,180 1,201 1,221 1,239 1,257 1,273 1,288 1,352 1,442 1,503 1,549 1,583 1,611 1,635 1,654 1,720 1,758 d2 1,400 1,356 1,332 1,320 1,320 1,324 1,331 1,340 1,350 1,361 1,371 1,381 1,391 1,401 1,411 1,420 1,429 1,437 1,446 1,454 1,489 1,544 1,585 1,616 1,641 1,662 1,679 1,694 1,746 1,778 AI=2 d, 0,467 0,559 0,624 0,697 0,758 0,812 0,861 0,905 0,946 0,982 1,015 1,046 1,074 1,100 1,125 1,147 1,168 1,188 1,206 1,284 1,391 1,452 1,514 1,554 1,586 1,612 1,634 1,706 1,748 di — 1,896 \J11 1,699 1,641 1,604 1,579 1,562 1,551 1,543 1,539 1,536 1,535 1,536 1,537 1,538 1,541 1,543 1,546 1,550 1,567 1,600 1,628 1,652 1,672 1,688 1,703 1,715 1,760 1,789 л=3 dx — - 0,368 0,455 0,525 0,595 0,658 0,715 0,767 0,814 0,857 0,897 0,933 0,967 0,998 1,026 1,053 1,078 1,101 1,123 1,214 1,338 1,421 1,480 1,525 1,560 1,589 1,613 1,693 1,736 d2 — - 2,287 2,128 2,016 1,928 1,864 1,816 1,779 1,750 1,728 1,710 1,696 1,685 1,676 1,669 1,664 1,660 1,656 1,654 1,650 1,659 1,674 1,689 1,703 1,715 1,726 1,736 1,774 1,799 /1=4 dx — — - 0,296 0,376 0,444 0,512 0,574 0,632 0,685 0,734 0,779 0,820 0,859 0,894 0,927 0,958 0,986 1,013 1,038 1,143 1,285 1,378 1,444 1,494 1,534 1,568 1,592 1,679 J/728^ di - — 2,588 2,814 2,283 2,177 2,094 2,030 1,977 1,935 1,900 1,872 1,848 1,828 1,812 1,797 1,785 1,775 1,767 1,739 1,721 1,721 1,727 1,735 1,743 1,751 1,758 1,789 1,810_ ~^s 1 ^1 1 ^2 1 — - — — 0,243 0,316 0,379 0,445 0,505 0,562 0,615 0,664 0,710 0,752 0,792 0,824 0,863 0,895 0,925 0,953 1,071 1,230 1,335 1,408 1,464 1,507 1,542 1,571 1,665 J/718 _ - 1 — - 1 2,822 2,645 2,506 2,390 2,296 2,220 2,157 2,104 2,060 2,023 1,991 1,964 1,940 1,920 1,902 1,886 1,633 1,786 1,771 1,767 1,768 1,772 1,776 1,780 1 802 1,820 505
12 6 7 8 9 10 11 12 13 14 lb 16 17 18 19 20 21 22 23 24 25 30 40 50 60 70 80 90 100 150 1 200 n=\ dx — — _ — — 0,203 0,268 0,328 0,389 0,447 0,502 0,554 0,603 0,649 0,692 0,732 0,769 0,804 0,837 0,868 0,998 1,175 1,219 1,372 1,433 1,480 1,518 1,550 1,651 1,707 d2 — — — — _ 3,005 2,832 2,692 2,572 2,472 2,388 2,318 2,257 2,206 2,162 2,124 2,090 2,061 2,035 2,012 1,931 1,854 1,822 1,808 1,802 1,801 1,801 1,803 1.817 1,831 я=2 d\ — — _ — _ _ 0,171 0,230 0,286 0,343 0,398 0,451 0,502 0,549 0,595 0,637 0,677 0,715 0,751 0,784 0,926 1,120 1,246 1,335 1,401 1,428 1,494 1,528 1,637 1,697 d2 — _ — — _ — 3,149 2,985 2,848 2,727 2,624 2,537 2,461 2,396 2,339 2,290 2,246 2,208 2,174 2,144 2,034 1,924 1,875 1,850 1,837 1,831 1,827 1,826 1,832 1,841 /1= dx _ _ — — _ _ — 0,147 0,200 0,251 0,304 0,356 0,407 0,456 0,502 0,547 0,588 0,628 0,666 0,702 0,854 1,064 1,201 1,298 1,369 1,425 1,469 1,506 1,622 1,686 3 d2 — — — — __ _ -_ 3,266 3,111 2,979 2,860 2,757 2,667 2,589 2,521 2,460 2,407 2,360 2,318 2,280 2,141 1,997 1,930 1,894 1,873 1,861 1,854 1,850 1,847 1,852 Окончаниеi /1= ^1 — — — — _ _ — — 0,127 0,175 0,222 0,272 0,321 0,369 0,416 0,461 0,504 0,545 0,584 0,621 0,782 1,008 1,156 1,260 1,337 1,397 1,445 1,484 1,608 1,675 4 di _ — _ — — _ _ — 3,360 3,216 3,090 2,975 2,873 2,783 2,704 2,633 2,571 2,514 2,464 2,419 2,251 2,072 1,986 1,939 1,910 1,893 1,881 1,874 1,862 1,863 приложения 3 л=5 1 dx — — — — _ _ — — — 0,111 0,155 0,198 0,244 0,290 0,336 0,380 0,424 0,465 0,506 0,544 0,712 0,945 1,110 1,222 1,305 1,369 1,420 1,462 1,594 1,665 di 1 _ _ — — _ — — — — 3,438 3,304 3,184 3,073 2,974 2,885 2,806 2,734 2,670 2,613 2,560 2,363 2,149 2,044 1,984 1,948 1,925 1,909 1,898 1,877 1,874 506
ПРИЛОЖЕНИЕ 4 ТАБЛИЦА КРИТЕРИЯ ФИШЕРА ДЛЯ а = 0,05 |V2 \ 1 2 3 4 Ь 6 7 8 9 10 И 12 13 14 15 16 17 18 19 20 25 30 40 50 60 70 80 90 100 200 оо 1 162 18,5 10,1 7,71 6,61 5,99 5,59 5,32 5,12 4,96 4,84 4,75 4,67 4,60 4,54 4,49 4,45 4,41 4,38 4,35 4,24 4,17 4,08 4,03 4,00 3,98 3,96 3,95 3,94 3,92 3,84 2 200 19,0 9,55 6,94 5,79 5,14 4,74 4,46 4,26 4,10 3,98 3,89 3,81 3,74 3,68 3,63 3,59 3,55 3,52 3,49 3,39 3.32 3,23 3,18 3,15 3,13 3,11 3,10 3,09 3,04 3,00 3 216 19,2 9,28 6,59 5,41 4,76 4,35 4,07 3,86 3,71 3,59 3,49 3,41 3.34 3,29 3,24 3,20 3,16 3,13 3,10 2,99 2,92 2,84 2,79 2,76 2,74 2,72 2,71 2,70 2,65 2,60 4 225 19,2 9,12 6,39 Ь,19 4,53 4,12 3,84 3,63 3,48 3,36 3,26 3,18 3,11 3,06 3,01 2,96 2,93 2,90 2,87 2,76 2,69 2,61 2,56 2,53 2,50 2,49 2,47 2,46 2,42 2,37 5 230 19,3 9,01 6,26 5,05 4,39 3,97 3,69 3,48 3.33 3.20 3.11 3.03 2.96 2,90 2,85 2,81 2,77 2,74 2,71 2.60 2.53 2.45 2.40 2.37 2.35 2.33 2.32 2.31 2.26 2.21 6 234 19,3 8,94 6.16 4,95 4,26 3,87 3,58 3,37 3,22 3,09 3,00 2,92 2,85 2,79 2,74 2,70 2,66 2,63 2,60 2,49 2,42 2,34 2,29 2,25 2,23 2,21 2,20 2,19 2,14 2,10 7 237 19,4 8,89 6,09 4,88 4,21 3,79 3,50 3,29 3.14 3.01 2,91 2,83 2,76 2,71 2,66 2,61 2,58 2,54 2,51 2,40 2,33 2,25 2,20 2,17 2,14 2,13 2,11 2,10 2,06 2,01 8 239 19,4 8,85 6,04 4,82 4,15 3,73 3,44 3.23 3,07 2,95 2,85 2,77 2,70 2,64 2,59 2,55 2,51 2,48 2,45 2.34 2.27 2.18 2.13 2.10 2.07 2.06 2.04 2.03 1,98 1,94 9 241 19,4 8,81 6,00 4.77 4.10 3.69 3.39 3,18 3.02 2,90 2,80 2,71 2,65 2,59 2,54 2,49 2,46 2.42 2,39 2.38 2,21 2,12 2,07 2,04 2,02 2,00 1,99 1,97 1,93 1,88 10 1 242 19,4 8,79 5,96 4,74 4,06 3,64 3.35 3,14 2,98 2,85 2,75 2,67 2,60 2,54 2,49 2,45 2,41 2,38 2,35 2,24 2,16 2,08 2,03 1.99 1.97 1,95 1,94 1,93 1,88 1,83 Vi - число степеней свободы числителя, v-> - число степеней свободы знаменателя. 507
ПРИЛОЖЕНИЕ 5 КВАНТИЛИ РАСПРЕДЕЛЕНИЯ X (v) \ 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 18 20 24 30 40 60 80 100 1 120 0,005 0,0000 39 0.0100 0,0717 0.207 0,412 0,676 0,989 1.34 1.73 2.16 0,60 3,07 3.57 4.07 4,60 5,14 6.26 7.43 9.89 13.79 20,71 35.53 51,17 67.33 83.85 0,010 0,0001 6 0,0201 0,115 0,297 0,554 0,872 1.24 1.65 2.09 2,56 3.05 3,57 4.11 4.66 5.23 5.81 7.01 8,26 10,86 14,95 22,16 37.48 53.54 70.06 86.92 0,025 0.0009 8 0.0506 0.216 0.484 0.831 1.24 1.69 2.18 2.70 3.25 3.82 4.40 5.01 5.63 6.26 6.91 8.23 9.59 12,40 16,79 24,43 40,48 57,15 74,22 91,58 0,050 0,0039 0,1026 0,352 0.711 1.15 1.64 2.17 2,73 3.33 3,94 4.57 5.23 5.89 6.57 7.26 7.96 9,39 10.85 13,85 18,49 26,51 43,19 60,39 77,93 95,70 0.100 0,0158 0,2107 0,584 1,064 1,61 2,20 2,83 3,49 4.17 4.87 5.58 6.30 7.04 7.79 8.55 9.31 10.86 12.44 15.66 20.60 29.05 46.46 64.28 82.36 100.62 0.900 2,71 4.61 6.25 7.78 9.24 10.64 12.02 13.36 14.68 15.99 17,28 18.55 19.81 21,06 22,31 23,54 25,99 28,41 33,20 40,26 51,81 74,40 96,58 118,50 140,2 0,950 3,84 5,99 7,81 9,49 11,07 12.59 14.07 15.51 16.92 18,31 19.68 21.03 22.36 23.68 25.00 26.30 2887 31.41 36.42 43.77 55.76 79.08 101.88 124,34 146,57 0,975 5,02 7.38 9.35 11.14 12.83 14.45 16.01 17,53 19.02 20.48 21.92 23.34 24.74 26.12 27.49 28.85 31.53 34.17 39.36 46.98 59,34 83,30 106,6 129,6 152,2 0.990 6.63 9.21 11,34 13.28 15.09 16.81 18.48 20.09 21.67 23.21 24.73 26.22 27.69 29.14 30.58 32.00 34.81 37,57 42.98 50.89 63.69 88.38 112,3 135,8 159.0 0.995 1 7.88 10.60 12.84 14.86 16.75 18.55 20.28 21.96 23.59 25,19 26.76 28.30 29,82 31,32 32,80 34,27 37,16 40,00 45,56 63,67 66.77 91.95 116.3 140,2 163.6 S08
список ЛИТЕРАТУРЫ Айвазян С.А., Мхитарян B.C. Прикладная статистика и основы эко- нометрики: Учебник для вузов. М.: ЮНИТИ, 1998. Бокс Дж., Дженкинс Г. Анализ временных рядов. Прогноз и управле- ние/Пер. с англ./ - М.: Мир, 1974. Грубер Й. Эконометрия 1: Введение во множественную регрессию и эконометрию. 4.1,2,3. Б.м.: Б.и., 1993. Джонстон Дж. Эконометрические методы. М.: Статистика, 1980. Доугерти К. Введение в эконометрику. М.: ИНФРА - М., 1997. Дрейпер Н., Смит Г. Прикладной регрессионный анализ: В 2-х кн. М.: Финансы и статистика, 1987-1988. Кейн Э. Экономическая статистика и эконометрика. М.: Статистика, 1977. Магнус Я.Р., Катышев П.К., Пересецкий А.А. Эконометрика: Началь- ный курс. М.: Дело, 2000. Ферстер Э., Ренц Б. Методы регрессионного и корреляционного ана- лиза: Руководство для экономистов. М.: Финансы и статистика, 1983. Уотшем Т. Дж, Паррамоу К. Количественные методы в финансах. М.: ЮНИТИ, 1999. Bemdt E.R. The practice of econometrics. Classic and contemporary. Adisson-Wesley Publishing Company. Reading-Massachusetts-Menlo Parc-Califomia, 1990. Cambell J.Y. and other. The Econometric of Financial Markets. Princeton. Univercity. New Jersey, 1997. Econometric models and economic forecasts/Robert S. Pindyck, Daniel L. Rubinfeld. McGraw-Hill, Inc. 1999. Goldberger A. A Course in Econometrics. Cambridge, MA: Harvard Uni- versity Press, 1990. Green W.H. Econometric Analysis, 3rd edition. Prentice-Hall, 1997. Hamilton J. D. Time eries Analysis. Princeton University Press, 1994. 509
• Johnston J., DiNardo J. Econometric methods. International Editions. 1997. • Kennedy P. A Guide to Econometrics. 4th edition, Blakwell Publishers, 1998. • Magnus J.R. and Neudecker H. (1999). Matrix Differential Calculus with Applications in Statistics and Econometrics, Revised Edition, N. Y., Wiley. • Verbeek M. A Guide to Modem Econometrics. Wiley, 2000. 510
Учебник Тихомиров Николай Петрович Дорохина Елена Юрьевна ЭКОНОМЕТРИКА Издательство «ЭКЗАМЕН» ИД №05518 от 01.08.01 Гигиенический сертификат № 77.99.02.953.Д.000494.01.01 от 31.01.2001 г. Научный редактор Н,П, Тихомиров Технический редактор КЯ.Богданова Корректор Г.М. Левина Компьютерный дизайн И.Р. Захаркина Компьютерная верстка И, Ю, Комракова 107066, Москва, ул. Александра Лукьянова д. 4, стр. 1. www.examen.biz E-mail: по общим вопросам: info@examen.biz; по вопросам реализации: sale@examen.biz тел./факс 263-96-60. Подписано в печать с диапозитивов 24.01.2003 Формат 60x90/16. Гарнитура «Тайме» Бумага офсетная. Уч.-изд. л. 23,85 Усл. печ. л. 32,0. Тираж 5 000 экз. Заказ № 474 Общероссийский классификатор продукции ОК 005-93,том 2; 953005 — книги, брошюры, литература учебная Отпечатано с готовых диапозитивов заказчика во ФГУП ИПК «Ульяновский Дом Печати» 432980, г. Ульяновск, ул. Гончаоова, 14 ISBN 5-94692-438-9 9Ч7 8 5 9 4 6 "9 2 4 3 8 2 II По вопросам реализации обращаться по тел.: 263-96-60.