Text
                    шшг
ОШНЙг
IЁяшшт
ШШшШтк
■-, ■• ' • ' .


А. И. Гуляев ВРЕМЕННЫЕ РЯДЫ В ДИНАМИЧЕСКИХ БАШ ДАННЫХ Москва «Радио и связь» 1989
УДК 681.3.016 Гуляев А. И. Временные ряды в динамических базах данных. — М.: Радио и связь, 1989.— 128 с.: ил.— ISBN 5-256-00338-0. Рассмотрен новый подход к созданию и использованию баз данных (БД) в системах обработки информации, основанных на отображении временных ря¬ дов. Анализируются состояние и тенденции развития информационного обеспече¬ ния в системах обработки данных. Рассматриваются проблемы применения БД для приложений, характеризующихся непосредственным использованием времен* ного фактора. На основе анализа отображения временного фактора предлага¬ ется подход к динамическому структурированию данных в БД, основанный на хранении не самих информационных объектов, а тенденции их следования во времени. Излагаются теоретические и прикладные (алгоритмические, програм¬ мные, лингвистические) аспекты разработки и функционирования динамических баз данных (ДБД). Рассматриваются технологические особенности создания и использования ДБД, включая операции концентрации, дублирования и вос¬ становления информации. Анализируются возможные методы создания ДБД, в качестве базового метода принята сплайн-аппроксимация. Вводится понятие прогнозируемых БД, предлагается их создание на осно¬ ве ДБД, анализируется достоверность представления информации и ошибки, возникающие при использовании прогнозируемых БД. Приводятся предпосылки применения ДБД в автоматизированных системах переработки информации и управления. Рассматриваются статистические воп¬ росы динамического отображения временных рядов. Для научных работников и специалистов, занятых созданием и использова^ нием систем автоматизированной обработки данных. Табл. 30, Ил. 26, Библиогр. 57 назв. Рецензент д-р техн. наук. проф. Д. А. Поспелов Редакция литературы по информатике Научное издание ГУЛЯЕВ АЛЕКСАНДР ИВАНОВИЧ Временные ряды в динамических базах данных Заведующий редакцией Ю. Г. Ивашов. Редактоп В. И. Ченцова. Обложка худож¬ ника Н. А. Пату р о. Художественный редактор А. В. П р о ц е н к о. Технический редактор А. Н. Золотарева. Корректор Н. Л. Жукова. ИБ № 2002 Сдано в набор 11.11.88 Подписано в печать 14.09.89 Т-16347 Формат 60X90 1/16 Бумага типогр. № 2 Гарнитура литературная Печать высокая Уел. печ. л. 8,0 Усл.кр.-отт. 8,38 Уч. изд. л. 9,09 Тираж 9200 Зак. №1156 Цена 1 р. 20 к. Издательство «Радио и связь». 101000 Москва, Почтамт, а/я 693 Набрано и отпечатано в типографии издательства «Радио и связь» 101000 Москва, Почтамт, а/я 693 Тираж изготовлен в типографии издательства «Радио и связь» 101000 Москва, ул. Кирова, 40 2404090000-166 046(01)-89 ISBN 5-256-00338-0 © Гуляев А. И., 198S
«Ценность теории заключается не столько в совокупности устанавли¬ ваемых ею законов, сколько в объ¬ единяющей их структуре». Дж. Вейценбаум ПРЕДИСЛОВИЕ В связи с расширением сферы применения вычислительной техники все большее значение приобретают вопросы хранения и использования данных в автоматизированных системах перера¬ ботки информации и управления (АСПИУ). В частности, про¬ должают развиваться следящие системы реального времени, при¬ званные регистрировать и обрабатывать данные о состоянии или местонахождении динамических объектов, например системы сле¬ жения за космическими объектами. Все большую актуальность приобретает информационное обеспечение в автоматизированных системах научных исследований, организационного управления, управления технологическими процессами и других, характеризу¬ ющиеся непосредственным учетом временного фактора. Важной особенностью таких систем является отображение данных как функций времени, а также необходимость последующего хранения информации, представленной временными рядами. Следует отме¬ тить, что аппарат временных рядов хорошо разработан в стати¬ стике, однако технологические аспекты хранения и обработки ин¬ формации, характеризующейся динамикой значений, в АСПИУ развиты недостаточно. Монография посвящена вопросам теории динамического ото¬ бражения временных рядов, разработке, исследованию и реали¬ зации динамических структур объектов фактографических баз данных (БД), решению прикладных задач динамических баз данных (ДБД) и их применению в АСПИУ. Из-за ограниченного объема книги некоторые разделы содер¬ жат лишь основные положения по обсуждаемой теме. Например, вопросы, касающиеся основ проектирования БД и управления ими, даны конспективно, поскольку им посвящена обширная ли¬ тература. Сжато обсуждается временная логика, алгебра дина¬ мически отображенных данных. з
ВВЕДЕНИЕ Одним из наиболее эффективных решений развивающейся вы¬ числительной индустрии в вопросах хранения и использования информации явилось развитие и реализация концепции интегриро¬ ванной базы данных (БД) АСПИУ. Разработаны и находят при¬ менение различные модели данных — реляционная, иерархиче¬ ская, сетевая — и методы доступа к ним. Получили развитие сис¬ темы управления базами данных (СУБД), обслуживающие эти модели. В частности, можно отметить такие известные в нашей стране СУБД, как ОКА, БАНК, СИОД, ИНЕС, СЕДАН, ПАЛЬ¬ МА IMS, 1DMS, SYSTEM 2000, TOTAL и другие. Вместе с тем в сфере создания и тем более эксплуатации современных БД имеется ряд проблем, которые не нашли еще должного решения. К таким проблемам, учитывая указанные направления развития АСПИУ, следует отнести: хранение и использование временных рядов; обеспечение адекватности хранимых данных отображае¬ мым объектам и отношениям (особенно для оперативных систем); актуализацию и корректировку информации в БД при прогрес¬ сирующем усложнении функций администратора БД; обеспечение эффективного хранения и использования значительных объемов информации; повышение скорости обработки данных и сложности задач, решаемых на основе БД, и др. Указанные проблемы носят противоречивый характер, и их приемлемое решение на основе разработанных методов реализации БД представляется весьма затруднительным. Неудачные попытки взаимосвязанного решения этих проблем привели в ряде случаев к негативным оценкам при¬ менения СУБД как у нас в стране, так и за рубежом [11, 27] и даже к появлению мнения у некоторых специалистов о принци¬ пиальной ошибочности использования БД в АСПИУ [33]. Существующие принципы создания фактографических БД, а также наметившиеся пути их совершенствования [35, 47] харак¬ теризуются сбором, хранением и использованием информации, за¬ фиксированной в определенные моменты (дискреты) времени. Та¬ кой подход к разработке и применению БД является, по сути, статическим, поскольку основан на моментном отображении состо¬ яния объектов и их отношений в прошедшие дискреты времени, а основным предметом исследования являются взаимосвязи меж¬ ду записями различных типов и их элементами [35]. Временной
фактор, представляющий собой основную информацию, в таких БД игнорируется, предполагается по умолчанию [15, 30, 35], за¬ дается таблично (относительно редко) или с помощью специаль¬ ных механизмов. Вместе с тем объекты и отношения, входящие в АСПИУ, обладают в большинстве случаев выраженными дина¬ мическими свойствами и в этой связи наиболее эффективно ото¬ бражаются временными рядами. В таких условиях статический подход к БД, как правило, не может соответствовать требованиям современных и будущих АСПИУ ни по сути, ни по необходимому уровню адекватности отображающей информации реальным объ* ектам и отношениям, что может служить причиной трудностей и недостоверного функционирования АСПИУ. Выход из создавше¬ гося положения состоит, на наш взгляд, в использовании наряду со статическим динамического отображения (ДО) объектов и их отношений в динамических БД (ДБД). Создание и использование ДБД позволяет: естественным образом отобразить временной фактор; обеспечить в любой момент времени адекватность хранимой информации отображаемым реальным объектам и отношениям, в том числе на основе прогнозирования ее изменений; осуществлять автоматическую корректировку информации, хранимой в БД, в соответствии с происшедшими изменениями; обеспечить естественное сочетание хранения и обработки дис¬ кретной и непрерывной информации; расширить возможности использования БД в АСПИУ, включая выдачу необходимой информации для периодов времени в прош¬ лом, настоящем и сравнительно недалеком будущем; уменьшить объемы хранимой информации по сравнению с объемом информации, предусмотренным статическим подходом к БД.
Глава 1 ИНФОРМАЦИОННОЕ ОБЕСПЕЧЕНИЕ СИСТЕМ ОБРАБОТКИ ДАННЫХ. ВРЕМЕННОЙ ФАКТОР В ОТОБРАЖЕНИИ РЕАЛЬНОСТИ 1.1. ИНТЕГРИРОВАННЫЕ БАЗЫ ДАННЫХ: СОСТОЯНИЕ И ПЕРСПЕКТИВЫ Концепция баз данных. Развитие информационного обеспе¬ чения (ИО) АСПИУ привело к выработке принципа единой ин¬ формационной базы, представляющего собой приложение систем¬ ного подхода к обработке данных. Основными предпосылками к его применению явились необходимость повышения эффективности использования данных, уменьшения зависимости программ от данных, а также унификация технологического процесса создания и эксплуатации АСПИУ. Объективно предопределенным подхо¬ дом к реализации информационной базы оказалась концепция базы данных (БД). Основные требования, предъявляемые к соз¬ даваемым БД: целесообразное удовлетворение информационных потребнос¬ тей пользователей и систем обработки данных; неизбыточность данных, хранимых в БД; обеспечение независимости данных от использующих их про¬ грамм; возможность совместного ведения и использования всех хра¬ нимых данных; адаптивность отображающей информации к изменениям реаль¬ ных объектов и отношений между ними; повышение технологичности обработки информации в АСПИУ. Положительным в концепции БД является [15, 47]: устранение возможности взаимной противоречивости данных; упрощение проблемы готовности данных к использованию и обмена информа¬ цией между системами; возможность обеспечения защиты данных. Подход к обработке данных на основе БД во многих отноше¬ ниях отличен от ранее используемого «позадачного» подхода. Ба¬ за данных содержит не только рационально интегрированные дан¬ ные, но и набор активно используемых атрибутов, характеризую¬ 6
щих эти данные, — метаданные. Наличие таких атрибутов позво¬ ляет различным пользователям получать одинаковое представле¬ ние о типах и характеристиках элементов БД и совместно исполь¬ зовать их, что позволяет повысить эффективность и многонаправ- ленность использования хранимой информации в АСПИУ. Указанные достоинства концепции БД привели к широкому развитию работ по их созданию и применению как у нас в стра^ не, так и за рубежом. В частности, в США разработка БД обще¬ го назначения является одним из направлений деятельности в области обработки данных. В 1984 г. не менее 75 % американ¬ ских компаний, в том числе мелкие и средние, пользовались в своей деятельности банками данных, а к началу 90-х годов ни од¬ на из организаций не сможет работать без использования банков данных. Количество применяемых СУБД удваивается в мире каждые три года. Кроме того, из семи основных исследователь¬ ских программ создания вычислительных систем 5-го поколения две непосредственно связаны с БД ![54']. В отечественной практике к настоящему времени практически не осталось АСПИУ (кроме небольших), где бы не использовались частично или в качестве основного звена вычислительной системы те или иные СУБД. Не¬ редко в системах организационного управления применяют две и более СУБД, такие, как ОКА, ИНЕС, УНИБАД. Структура банка данных. Использование БД в АСПИУ пред¬ полагает разработку и применение наряду с БД соответствующих программных, технических, технологических и лингвистических средств [10, 34], называемых в совокупности банком данных. В состав программных средств, как правило, входят СУБД и система управления запросами, нередко совмещаемая с СУБД. Главный компонент в реализации концепции Б Д-СУБД — это набор программных модулей, обращение к которым осуществля¬ ется на базовом языке, предназначенный для создания, ведения, использования БД на уровне полей и записей [10, 49]. Система управления запросами предназначена для управления обработкой запросов, в развитых АСПИУ также для обеспечения диалогового режима с удаленных терминалов. Технические средства — это устройства, начиная от обычного комплекса технических средств АСПИУ и кончая специализиро¬ ванными ЭВМ (мини-, мегамини-, микроЭВМ) БД с соответству¬ ющим периферийным оборудованием. Технологические средства, предназначенные для обеспечения создания и функционирования БД, ориентированы на выделение специальной службы администрирования БД. Для администрато¬ ра БД и его службы разрабатывается комплекс программных средств СУБД и соответствующих инструктивно-технологических документов для выполнения операций: организации, пополнения и корректировки БД; ведения БД, их копий и системного журна¬ ла; восстановления БД; организации взаимодействия с приложе¬ ниями в АСПИУ; совершенствования БД. Лингвистические средства включают язык описания данных 7
(ЯОД), язык манипулирования данными (ЯМД) и язык ^запро¬ сов, нередко совмещаемый с ЯМД. Для описания логической и фи¬ зической структур БД предназначен ЯОД. Для вызова соответ¬ ствующих модулей СУБД с целью обращения к требуемым дан¬ ным в терминах логической структуры БД служит ЯМД. Язык запросов предназначен для обращения внешних пользователей к системе управления запросами. Проектирование БД. Методология проектирования БД осно вана на абстрагировании данных. При этом процесс проектиро¬ вания осуществляется путем многократного синтеза и анализа сформированных к данному моменту абстрактных моделей дан¬ ных [46, 50]. На каждой стадии процесса выделяются наиболее существенные атрибуты и их структура в описании данных, после чего происходит переход к следующей стадии. В традиционной технологии проектирования БД используются, в основном, два метода — «от решаемых задач» и «от предметной области» (рис. 1.1, а и б). В последнее время в силу объективных обстоя¬ тельств и некоторых преимуществ все большее распространение среди разработчиков ИО АСПИУ получает технология проекти¬ рования «от предметной области» [5, 29]. Структурный анализ данных. При анализе структуры данных, обрабатываемых в АСПИУ, необходимо обратить внимание на два аспекта, которые можно условно назвать «внешним» и «внут¬ ренним». «Внешний» аспект включает организацию данных в виде струк¬ тур (моделей), наиболее пригодных к применению этих данных по какому-либо основанию (эффективности использования, времени доступа, занимаемой памяти и др.), путем создания конструкций из элементов данных и установления правил композиции-деком¬ позиции этих конструкций. Наибольшее распространение получи¬ ли иерархическая, сетевая и реляционная модели данных. Модель данных, определяемая их распределением по уровням памяти, взаимным расположением записей и выбранным форматом запи¬ сей, является главным фактором для большинства элементов БД, а также средств, которые предназначены для ее создания, веде¬ ния и использования, в частности СУБД. Выбор конкретной мо¬ дели данных обусловливается определенным набором критериев: простотой, наглядностью данных, возможностью доступа к ним,, объемно-временными характеристиками хранения (доступа). В настоящее время у нас в стране и за рубежом находят при¬ менение в БД следующие модели данных (и соответственно СУБД, обслуживающие их) [10] 1: 1 Следует отметить, что базовой моделью является реляционная модель дан¬ ных, так как она в наибольшей степени соответствует формально-структурному представлению суждения, являющегося элементарной формой мыслительного процесса (см., например, Формальная логика / И. Я. Чупахин, А. М. Плотни¬ ков, К. А. Сергеев и др.; Под ред. И. Я. Чупахина, И. И. Бродского. — Л.: ЛГУ, 1977. — 357 с.). Учитывая это, всякое отображение есть не что иное, как фик¬ сация объектов предметной области и их отношений, и, следовательно, прочие- модели данных являются производными от реляционной. 8
с ^ Is Н с* I Ч h «§| I \ I д ^ 4 <b ^ ^1 45 ^ I'l Чз ^S p £ 05 | 4> <§ 4j ** £ §l <*Э C5 J S lS I# ^Чз P II II *5 ^ D* ^ S' 5e ^ ^> >■ ^3 ££ ^ ^ ^ S5 ^ I51 ^ ^ *•«§ 05 ip IP § 1 «§ I b* 5 % I 1 4 I 1§ I II 4* 4 4 | I 4. ^ ^ N «5$ 4j I Чз g ij & 1 1 <1 &?* 3§? р §'53 S «> р и t* -^* ■ V* I л II р <al in 4 s * ч 4 §tl nl <b 0з P - | Ni pp ^ ^ 5 ^ '"Si £<§= ti§i ^ ч 5 1:1 Й-'S1 PP £§§1 ^45 к § ч> с\з V: 1 i CV3 5* * 1 СЬч Р Чз 51 ^ § gl § =3 1« 11 Ч> ^ <Р § 51 II ий <§ 5 II 43 < §>S 1 1 Чз 1 I 44 Оз S: ->► ->■ I 5=4 * ^ * |1 1 Ч’^З | 1’1 !*- g ^3 II § 4 s § S § I1 1 11 р £ ^ §15 §Р Ц *: * ^ ^ 03 11 5S ^ <Ь ^ 5 1 S4^ 1 Чз 05Г <3 §%. Рис. 1.1. Традиционная технология проектирования БД: а) «от решаемых задач» б) «от предметной области»
Преимущество (положительный фактор) Недостаток о а га £5Н п r g m ** а ы о ОнЛ S о ийю с о9? о О ^ _ S И к os g Д S к £ §g*s .3||S н о о к О- 5 vo о; £ й ч °- со S sS £ I £ § I QJ 1 CD вз га СО CD Ч о VO и к я VO CD S sS ^ s а S Л CD СО 1« S ° СО Д . Н _ S о Ч CD О С И СО S CD CD С R W о л 5 н о и ч с: >* Д СО [D, ,дСй о О н OS О m ^ O S й я s § а л Л % >, 2 s ч a s «* я CD g § O'•& «ё^Э-е- ш ° ® 5 ^ н Д m д « >> <D Ч Д CD vS cd д ° с« * н X Я со S а н °« * Д ^ « £ i о СО * CD С VO S О Л Су Ч Н CD L к VO к - £ н К о S « Д ^ О 5 й СП о 83я| г, S J3 Ь С н S д о S Д R ч «до R а ° ° CD £ CD Е-1 О - О S CD X = С I-с ё до со Ч О Н о Д 2 О о К О CD Д Д 2 5 ® Д Е- S Я Е- " О к <и о О о 2- Э CD и 5 X л ^ >,«€ д о ^ о о О К S Ч С) s s оС>о я со S о о д га ч СО е- д CD д д о д о д 9 *=* <<• а 1 & X 5S 3 ч 5. g >. S 5 4 о I К й с § в ►Q о ^ 0-> я к й S £ »s о к S 5 * S н о о ч 4 х 5 3 н а ч Я СО ► <-а Д cd со CD о « ‘ О в с CD® о с « Ч cd о 5 CQ о о н з (Т) н S ^ н я д a s со s — ' н я 2 VO н и со О S О к СО 5! со CD 5 СО СО a S со Р д СО CD 2 S Л S д CD о VO я Ю и о О ° О о; О й D н Л О 2 Д 2 2 Д СО ,££ СО О С ЧРЗ S 2 52 I * Я Pi о д S ь О vo 2 о со CQ О ' Ч «О * « Д S д Й-l 1-н W m и ру д>зРЗ «WO а Д CD со О, S Е-1 Д CD S С СО со >> Ч * (D Я sS CD СО Д m о х Я Я д CD С 8* 8-1 со со CD д я Д X s a &я а; СО 4 га 5 о S ро s а о о со д tt tQ m>5 go <D g « °n SIX CD §1 « О CD Я Я <d a 4 S CO JO 4 ^ 5 f-1 ^ Д CO Ни CO S on н <u ►— Д ^ ч § § о я H S " VO vO О CD CD X H Я S g ° S X ^ CD 9 gn я s £ И D b & § s* i;* §| ^§-1 <D 4 Д О CD 2 g co 5 4 S>i Д ST s X CD S £ CO 4 Д s Д g Я § 8 CO CD h я tt fQ U X s a X R Я ^d s Д я 4 со О Svo o « g Й a 55 « & о X Д О CD s д a д к VO CD CD О О га я н ID о н £ <D S - CD <D ' S s - я s g CD Я i-1 д о S a н я £ ч g 2 S'S § CO 03 (D CO X Л s CO 5j o X _ Я 'P Д Д >> Д s Д co * CD CD 4 4 o с о ч 1 I Й я * 2 о со Я н ч я 2 я s д 4 S н S 2 3 О С 5 со Д Д cd CD 2 S га S ^ О О CD a CD S >> s д д b со Д « co >■» § 2 CD Pf- CD Д S Д t-1 д n О CD Д CO _ CD *S CD S 4 CD >> О CD S О S S Д О 2 s 4 о X vo о : * & s о H CO CD s Co q t- c[\o ^1 Д I H R Д H <D CJ a x 0 я 1 g I a g 3 Ч Я о н >> ч ; ч s cd/о ; U £HS д ч S о д д га CD >» f-1 д >> CD a ^ 2 о о й cd га >» Д д S О о ч д Я CD о Д t=( Д СО О Д CD Ч <D CD ч д S Й°К 5ай д га д 2 (D О Д 2 О д 2 д JD О д 2 о д со CD >> га Е- Н д 2 >>« CD О н га о а> 2 Я я !Г» CD Д д ' X ^ CD О) <D <D Я д д со га о д о О е* ю >> и »s д Д д ч со СО 2 Я д ОС =о ч со § д Ч о Я * S н С Я О ° X < и|й CD &Я S д Я CD * g Я СО О Ч CD Е- R VO 2 ч , о О (D ; н cd со ; осп: i х Я я я Я ^ 10
реляционная (ПАЛЬМА, MORIS, RDMS, IS/1, SUFORM, РЕЛБАЗ, SYSTEM-R, TRAMP, ZETA, SQL/DS, Mac AIMS, INGRES, DB2, QMF, DXT [55]); иерархическая (OKA, IMS [15], MARK-IV, ИНЭС, SYSTEM 2000); сетевая (БАНК-ОС, СИОД-ОС, СЕДАН, НАБОБ, КАМА, TOTAL, DMS 6700, SOCRATE, SIBAS, КОМПАС); смешанная (ИНЕС, СИНБАД-2, IDMS, DBOMP, СИЗИФ). Реляционная модель состоит из однотипных совокупностей эле¬ ментов множеств, находящихся в определенных отношениях. Иерархическая модель является совокупностью данных, в кото¬ рой каждая запись может быть связана не более чем с одной записью более высокого уровня и может иметь несколько подчи¬ ненных записей. Сетевая модель является совокупностью данных, в которой каждая запись может быть связана с произвольным количеством других записей, находящихся на любых уровнях иерархии. Смешанная модель представляет собой различные со¬ четания перечисленных выше моделей. Анализ моделей данных, применяемых в ИО АСПИУ, приведен в табл. 1.1 (следует заме¬ тить, что существуют предложения по использованию обобщенных моделей данных, включающих выше перечисленные модели [24]). В БД, основанных на иерархической и сетевой моделях дан¬ ных, особенно существенными оказались потери в тех случаях, когда логическая структура данных не соответствовала в должной степени потребностям АСПИУ. Учесть эти потребности при проек¬ тировании БД, как правило, непросто, а удовлетворение их носит противоречивый характер, поэтому структурирование БД зависит пока от искусства проектировщика (автоматизированное проекти¬ рование БД с оптимизацией структуры находится на начальных этапах разработки [43, 44, 50]). Нередко конкретное воплощение БД оказывается неудовлетворительным для АСПИУ [3, 27]. Кро¬ ме того, реорганизация хранимых файлов таких БД требует из¬ менения всех индексов в файлах, указывающих на реорганизуе¬ мый файл, с тем, чтобы они содержали скорректированные адреса хранимых записей. Это может стать серьезной проблемой [15, 47]. Важными практическими требованиями к организации БД в АСПИУ, выработанными на основе опыта их использования, яв¬ ляются обеспечение достоверности данных, соответствие одному уровню обновления и быстрая обработка непредсказуемых запро¬ сов [30]. Под «внутренним» аспектом следует понимать принятую в рас¬ сматриваемой АСПИУ степень детализации информации, включая способ отображения фактов (суждений), т. е. выделение соответ¬ ствующего набора элементов данных. Например, возможным ва¬ риантом является обработка и хранение данных в виде показа¬ телей, отношений, информационных строк, документов. Для слу¬ чаев, требующих глобального формализованного аппарата по опи¬ санию данных и процессов их обработки, предложен, например, подход, ориентированный на представление данных в виде отобра¬ 11
жающих элементов (ОЭ). Отображающий элемент — наимень¬ шая логически неделимая единица данных: ОЭ = <$ь Л s2, где 51, 52 — обозначения первого и второго объектов; г—отноше¬ ние; t—момент времени1. В настоящее время предпочтение отдается подходу, предпола¬ гающему организацию данных по показателям. Анализируя объек¬ ты БД (табл. 1.2), можно заметить, что на их основе трудно обес¬ печить в комплексе соответствие наиболее важных свойств БД современным требованиям АСПИУ. Так, ОЭ при их универсаль¬ ности и защищенности от хранения взаимно противоречивой ин~ Таблица 1.2 Сравнительная оценка объектов БД, используемых для отображения предметной области Объект БД Свойство Документ Строка Показа¬ тель Отно¬ шение оэ Универсальность _ + + 4- 4- Наглядность (естествен¬ ++ + + + + —— ность) представления Использование в АСПИУ — + + 4- -г 4- Наличие временного пара¬ — — — — 4-ь • метра Оперативность доступа + + + — — Простота реализации + + + + — Обеспеченность проверки — + + + + + на адекватность Удобство и оперативность — + — актуализации Независимость программ — -L + от данных Примечание. Сравнительная оценка свойств проводится в интервале от «++» (высокая оценка, развито в большой степени) до « » (низкая оценка, не развито). формации сложны в реализации и эксплуатации. При отображении реальности в виде показателей часто отсутствует временной фак¬ тор, а использование отношений не обеспечивает зачастую требуе¬ мой оперативности доступа, и т. д. Перспективы развития БД. Оценивая перспективы развития и совершенствования БД (СУБД), можно выделить направления, по которым предполагается получить наиболее существенные ре¬ зультаты. Пользовательский аспект — привлечение конечных пользова¬ телей к проектированию и использованию БД: создание систем с языками очень высокого уровня (например, запрос с обучением [41]). Прообразами таких языков могут служить APL, NOMAD, ADF/DMS, DB QUERY, STAIRS {29] и др. Предпосылками к раз¬ витию этого направления служит необходимость быстрого созда¬ 1 Зайцев Н. Г. Общесистемное математическое обеспечение ЭВМ третьего* поколения для обработки данных. — М.: Статистика, 1980. — 226 с. 12
ния приложений (традиционный цикл разработки затяжной и не¬ гибкий) в условиях частых, существенных и быстрых изменений, нечетких требований и пр. Содержательный аспект — использование распределенных БД [21], создание интеллигентных БД [8, 37, 42]. Развитие распре¬ деленных БД обусловлено индустриализацией процессов обработ¬ ки данных, развитием информатики на основе интеграции вычи¬ слительных ресурсов |[45]. Создание интеллигентных БД качествен¬ но изменит взаимодействие человека с ЭВМ на основе реализации идей искусственного интеллекта ![19, 37]. Информационно-логический аспект — дальнейшее развитие ре¬ ляционных БД (21, 30], разработка эффективных средств управле¬ ния неоднородными БД [24], совершенствование архитектуры СУБД (16], использование методов моделирования при проектиро¬ вании БД [43]. Совершенствование архитектуры СУБД предпола¬ гает, например, в целях освобождения от логических противоре¬ чий данных и переноса акцента с прикладного программирования на спецификацию концептуальных схем использовать трехуровне¬ вые взаимосвязанные БД, причем управление каждой БД (внеш¬ ней, «информационной» и внутренней) должен обеспечивать соот¬ ветствующий процессор. Другой подход — развитие средств интег¬ рации неоднородных БД (24]. Технологический аспект — упрощение проектирования и исполь¬ зования БД для автоматизации проектирования БД [44], созда¬ ния СУБД, интегрированных с пакетами прикладных программ [29], перевода значительной части функций СУБД с программно* го обеспечения на аппаратурную реализацию (46]. 1.2. ОСНОВНЫЕ ПРОБЛЕМЫ РАЗРАБОТКИ И ПРИМЕНЕНИЯ БАЗ ДАННЫХ Тенденции развития АСПИУ на основе БД оцениваются спе¬ циалистами довольно противоречиво: широкое применение (15] — бесперспективность (11, 27, 33]. Такие оценки обусловлены мно¬ жеством факторов: областью и массовостью применения, потреби¬ тельскими свойствами СУБД (в первую очередь, надежностью и сложностью), квалифицированным обучением эксплуатационных служб, качеством сопроводительной технологической документации и т. д. Усложнение существующих и появление новых задач управ¬ ления и обработки данных, расширение объемов информации с требованием сокращения времени доступа к ней, появление новых направлений информационного взаимодействия АСПИУ приводят к проблемам оперативной актуализации данных, непосредственно¬ го учета временного фактора, сочетания дискретных и непрерыв¬ ных данных, к расширению объема и функциональных возмож¬ ностей БД и, как следствие, к трудностям при их проектировании, организации, ведении, использовании [6, 8, 33, 52]. Для систем с Непосредственным использованием временного фактора можно отметить следующие проблемы: 13
хранение и использование в АСПИУ временных рядов; оперативное определение и проектирование пользователями целесообразных структур данных в соответствии с целями БД АСПИУ; обеспечение адекватности хранимых данных отображаемым объектам и отношениям предметной области (особенно для опера¬ тивных систем); формирование БД и ее оперативная актуализация при нарас¬ тающем усложнении функций службы администратора БД; обеспечение эффективного хранения и использования значи- тельных объемов информации [9, 56]; повышение скорости обработки данных и сложности задач, решаемых на основе БД; обеспечение единства (или совместимости) средств представ¬ ления данных и процедур их обработки [24] с учетом того обстоя¬ тельства, что универсальность определений типов данных делает СУБД сложными в освоении и малоэффективными в работе; организация взаимодействия прикладных программ и СУБД. К одной из проблем существующего подхода к БД следует от¬ нести также недооценку факторов ценности и старения информа¬ ции, поскольку хранение данных, принципиально значимых и соот¬ ветствующих последним временным периодам, как правило, ни в чем не отличается от хранения данных малополезных и со зпачи: тельным (для условий системы) сроком давности. Априорное ре¬ шение этих вопросов службой администрирования БД фактически не осуществляется. Вместе с тем в настоящее время получены ре¬ зультаты, позволяющие определить количественную меру ценнос¬ ти информации и оценку процесса ее старения [23], что обуслов¬ ливает в определенной степени формализацию подхода к хране¬ нию данных в БД с этой точки зрения. Особой, одной из наиболее актуальных разрабатываемых про¬ блем БД является их использование для представления знаний и работы с ними в исследованиях по искусственному интеллекту (ИИ). Это объясняется тем, что, во-первых, сама проблема ИИ является важным направлением современной науки [42], а во- вторых, по оценкам ряда ведущих ученых [19], грядущий этап развития самих АСПИУ будет основываться на использовании идей и приемов ИИ [41]. Идеи ИИ уже оказали определенное влияние на проблематику БД: многие механизмы, которые при¬ сутствуют в СУБД, являются, по существу, механизмами ИИ [42]. Начались разработки интеллигентных БД [37, 48]. Для них важ¬ ными задачами являются: отображение закономерностей в пред¬ метной области, на основе которых могут быть спрогнозированы потенциально возможные ее состояния; автоматизированное фор¬ мирование, пополнение и модификация БД; выдача достоверной и определенным образом сконцентрированной информации на пе¬ риоды времени в прошлом, настоящем и будущем. Нетрудно заметить, что большинство перечисленных проблем в той или иной степени связано с временным фактором. В некото- 14
рых приложениях их одновременное решение при существующих подходах к созданию и использованию БД принципиально невоз¬ можно. В частности, можно указать на всегда имеющее место за¬ паздывание внесения изменений в БД от реального изменения, что нередко приводит к трудностям и недостоверному финкциониро- ванию АСПИУ. Трудноразрешимой проблемой БД является также отображение данных с продвижением во времени, восстановление их на произвольный прошедший момент времени и т. д. Вместе с тем наметившиеся направления совершенствования БД (см.' 1.1) не решают указанных проблем. Это позволяет сделать вывод о том, что наряду с расширением применения БД в АСПИУ на¬ растают трудности, связанные с их использованием. Некоторые из указанных проблем БД могут быть решены, на наш взгляд, изме¬ нением подхода к организации данных в АСПИУ. 1.3. ДИНАМИЧНОСТЬ СИСТЕМ. ИСПОЛЬЗОВАНИЕ ВРЕМЕННЫХ РЯДОВ В ОТОБРАЖЕНИИ РЕАЛЬНОСТИ Большинство реальных систем, в том числе АСПИУ, являют¬ ся динамическими. Зачастую в прагматическое понятие динамич¬ ности вкладывается неодинаковый смысл: с акцентом на оператив¬ ность происходящих в системе изменений (временной аспект), на подверженность ее каким-либо изменениям в принципе (эволю¬ ционный аспект), на соотнесение текущего состояния системы с ретроспективным или перспективным (сравнительный аспект) и др. Естественно, в зависимости от этого устанавливаются принци¬ пы и формы отображения динамической системы в целях управ¬ ления ею либо отслеживания ее траектории. Рассмотрим общее понятие динамичности систем на основе составляющего его суть временного фактора, чтобы определить условия наиболее полного и целесообразного отображения реальности. Воспользуемся для этого классичес¬ ким аппаратом формализации сложных систем. Некоторая динамическая систе¬ ма 1 с «последействием» Sp, т. е. система, функционирование которой зависит от ее состояния в прошедшем времени, представляет собой объект с конечной памятью длины р: SP = {X, Y, А, /, о, а?}, где X = X[ti-p, ti] —конечное множество входных сигналов, включающее в себя подмножество {х11} управляющих входных сигналов, посредством которых обес¬ печивается управление системой Sp(Tp=[ti-p, ^—временной отрезок «после¬ действия», р — конечное вещественное число); У — конечное множество выходных сигналов; А — конечное множество состояний системы Sp\ f — функ¬ ция выходов; б — функция переходов; ан — начальное состояние системы (анеА). Кроме того, может быть определен дискретный интервал времени Л/ = ^+1—ti (такт), по прошествии которого в момент осуществляется новое измерение (фиксация) характеристик Sp, изменяемых во времени. При 1 Здесь и далее рассматривается динамическая система Sp дискретного ти¬ па, широко применяемая в практике управления благодаря удобному описанию основных свойств реальных систем. 15
этом система Sp воспринимает входные сигналы А/, выдает выходные сигналы У/, определенные функцией выходов /, и переходит в новое состояние ai, опре¬ деляемое функцией переходов б (следует отметить, что в каждый момент вре¬ мени по прошествии очередного такта At, который может изменяться, система Sp находится в одном из состояний, входящих в А). В случае синхронизации (равенства) дискретных интервалов между смежными фиксированными момен¬ тами времени At=Tp/p. Множество X состоит из двух подмножеств: * = {*“} и {**}. где {хи}, как было указано выше, подмножество управляющих входных сигналов, г. е. изменяемых по решению пользователя либо в зависимости от установлен¬ ных им принципов; {хк} — подмножество неуправляемых входных сигналов, генерируемых средой, в которой существует динамическая система Spt но не принадлежащих самой системе и не поддающихся управлению. При этом, если [хи] — пустое подмножество, динамическая система Sp является неуправляемой. В противном случае система является управляемой (при {хтс} = 0 Sp система является абсолютно управляемой). Очевидно, что функционирование системы Sp зависит как от субъективных факторов, так и от воздействий внешней среды, описываемых подмножеством {хп}. Функция выходов f является отображением декартова произведения сос¬ тояний А и входных сигналов Aj7/_P, t{\} на временном отрезке «после¬ действия» Тр на множество выходных сигналов (рис. 1.2). В свою очередь, Входные сигналы X (на отрезке Тр) X(thp) X(t;-P+I) ^ Xftj) аг Состояние А Выходные сигналы Y *п - Рис. 1.2. Представление функции выходов f системы Sp отображение, описывающее следующее состояние системы Sp, также является отображением декартова произведения текущего состояния а(осеА) и входных сигналов X[ti-P, ti], i^>p, на временном отрезке «последействия» на множество состояний А (рис. 1.3). Учитывая, что с точки зрения управления системой Sp наиболее важным обстоятельством является достижение необходимых значений выходных сигна¬ лов, рассмотрим функцию выходов: r; = f(a"; X[t'-P, *,]). где Yi—множество выходных сигналов системы Sp в момент ti\ ан — начальное состояние системы Sp в момент ^_р, анеА; ti = ti-p + Tp. По существу для каждого ti значения выходных сигналов Sp в момент U зависят только от значений входных сигналов на временном отрезке «последействия» Тр— [ti-P, t{\. Для эффективного управления сложной динамической системой (большинство 16
Входные сигналы К (на отрезке Гр) Xfc-p) Xfr-p*,) ^ Xftg) Текущее *2 состояние а : (л€А) «л Состояние А системы Sp рис. 1.3. Представление функции переходов б системы Sp относится к классу систем Sp с «последействием») необходимо хранить и ис¬ пользовать для выработки управляющих сигналов значения входных и выход¬ ных сигналов и соответствующих им временных моментов на всем отрезке «последействия». Аналогично при этих же условиях могут быть получены наиболее точные оценки развития неуправляемой динамической системы Sp. Итак, для информационного обеспечения АСПИУ, разрабатываемой для управления системой Sp, требуется обеспечить фиксацию и упорядоченное по времени хранение в некоторый момент ti конечного множества данных D, ха¬ рактеризующих множества X[ti-P, ti] и У на временном отрезке «последейст¬ вия» Тр. В процессе продвижения Sp во времени в момент tf/+1 должен осу¬ ществляться сдвиг всех элементов множества D с удалением значений, соот¬ ветствующих моменту ti-p, и дозаписью в D значений входных и выходных сиг¬ налов, соответствующих моменту ti+\. Выведем из определения системы Sp отмеченные выше прагматические понятия динамичности. Для динамической системы Sp существует возможность уплотнения временного отрезка «последействия» Тр за счет уменьшения интер¬ вала At между смежными моментами измерения (фиксации) элементов мно¬ жеств, характеризующих систему Sp, до некоторого отрезка что значения входных сигналов для всех р моментов, входящих в Tq становятся не разли¬ чимыми по допустимой погрешности их измерения (фиксации) едии (т. е. на интервале Tq система Sp может условно считаться статичной: {хн} = const, !**} = const, т. е. X[ti-P, ti] не влияет на значение У/, и как аргументом функ¬ ции f им можно пренебречь). При этом чем меньше интервал тем дина¬ мичнее (во временном аспекте) система Sp. Определим некоторую величину Ас= 2 (xilwt — xjlw})2> i-i-p гАе Xi^X[ti-p, ti]; Xj^X[ti-p, t{\\ |co*|>0; |co/j>0 — соответственно веса в*одных сигналов Xi и Xj (позволяющие различать входные сигналы по степени их влияния на функционирование системы с «последейст¬ вием»). При этом чем больше значение Dx, тем система Sp динамичней по вход¬ ному сигналу х (в эволюционном аспекте). Наконец, для системы Sp может существовать необходимость отображения аргументов функции f за пределами Тр в определенные моменты времени, называемые фиксированными точками. ^—1156 17
Сравнение текущего состояния а* (а^А) системы Sp в момент /,■ с состоянием, в некоторой фиксированной точке также будет характеризовать ее динамич¬ ность (в сравнительном аспекте). Анализ динамической системы Sp с точки зрения ее рацио¬ нального отображения в БД позволяет сделать следующие выво¬ ды: 1. Для целенаправленного (или оптимального) управления динамической системой Sp существует необходимость фиксации значений ее выходных У, входных X[А-РА] сигналов и соответ* ствующих им моментов на временном отрезке «последействия» Тр, а также в фиксированных точках. 2. Если Ти — отрезок времени, необходимый для выработки управляющих входных сигналов {хи} к моменту ti, то имеют мес¬ то следующие зависимости: при Тр<Ти следует увеличить продолжительность временного интервала At либо уменьшить Ти настолько, чтобы неравенство приняло вид М<Т“< Тр, (1.1) в противном случае управление системой Sp осуществляется с за¬ паздыванием либо производится сбор избыточных данных; управ¬ ление системой Sp при условии соблюдения неравенства (1.1) мо¬ жет быть определено как неоперативное; при Ти<сМ управление может быть определено как оператив¬ ное (такой вариант управления является, по-видимому, основным для динамических систем Sp, поскольку в противном случае управ¬ ляющие воздействия будут вырабатываться без учета последних по времени данных о ее функционировании, и как следствие систе¬ ма может «рыскать»). 3. В зависимости от допустимой погрешности изменения вдик в динамической системе Sp может быть определен целесообразный интервал At>Tfi, по истечении которого имеет смысл измерить (зафиксировать) значения входных и выходных сигналов. Другим, основанием к установлению интервала At является, как было по¬ казано выше, Ти. Если при установлении интервала At следовать не прагмати¬ ческим принципам, обусловленным свойствами системы Sp, а ис¬ ходить из теоретических оснований (что особенно важно для тех¬ нических АСПИУ реального времени), то для этого необходимо воспользоваться известной теоремой Котельникова из статистики случайных процессов. В соответствии с этой теоремой A где F™ax—наивысшая частота в спектре функции /, обусловлен¬ ной множеством входных сигналов X. При этом сокращение ин¬ тервала At между смежными моментами фиксации необходимых характеристик Sp по сравнению с F™ax /2 допустимо, но бесполезно с точки зрения фиксируемого процесса. Увеличение же интервала 18
Дt сверх значения F™*x/2 ограничено допустимым значением по¬ грешности отображения е0. Очевидно, что наиболее удобной формой отображения харак¬ теристик динамической системы Sp является временной ряд Dn-{q{ti)}, i—\71T, где ti — временной момент, ti^Tp\ q(ti)—информационный объ¬ ект (данные), зафиксированный в момент ti\ п — количество чле* нов ряда. Это связано, во-первых, с естественностью представления вре¬ мени, а во-вторых, с формализованным заданием положения мно¬ жества измеренных (зафиксированных) данных в последователь¬ ности. Более того, при аналитическом рассмотрении временных рядов можно прийти к выводу, что отображение реальности по¬ средством Dn= {q(ti)} является достаточно общей и универсаль¬ ной формой фиксации данных о необходимых объектах и их отно¬ шениях в любой предметной области (такой вывод позволителен и с точки зрения логики, поскольку временные ряды Dn отвечают требованиям по отображению последовательности суждений, ко¬ торые представляют собой фундаментальные информационно¬ логические совокупности). С точки зрения практической любой вид данных может быть определен временным рядом Dn, а те или иные информационные объекты могут представлять собой част¬ ные случаи временного ряда (например, временной ряд, состоящий из одного начального элемента: п = 1). В общем случае отображение временного ряда Dn в виде дан¬ ных представляет собой множество п упорядоченных по возраста¬ нию времени пар <q(ti), ti>, ti^Tp, i=l,n. При этом значение q может быть как количественным, так и качественным. (Например, если фиксируется высота полета самолета, то может иметь место следующий временной ряд: <1000 м, 09 ч 22 мин 13 с>; <1243 м, 09 ч 22 мин 14 с>; <2013 м, 09 ч 22 мин 17 с>; <3000 м, 09 ч 22 мин 22 с>; <3505 м, 09 ч 22 мин 29 с>. Подобным образом по временному ряду можно регистрировать ход химической реак¬ ции по цвету раствора: <светло-желтый, 09 ч 00 мин>; ^темно- желтый, 11 ч 30 мин>; <зелеиый, 14 ч 00 мин>; Светло-корич¬ невый, 15 ч 00 мин>. В дальнейшем будем рассматривать времен¬ ные ряды, у которых значение q имеет количественную меру (от¬ метим также, что для временного ряда Dn существенно то, в каких единицах z измеряется значение q). Параметр t во временном ряду Dn может быть как дискрет¬ ным, так и непрерывным, входящим в порождающую его функ¬ цию в качестве аргумента (при этом t характеризуется однона¬ правленностью, прогрессивным возрастанием, в большинстве слу¬ чаев отрезком его изменения [/н, tK\ а также единицей измерения 9- Ограничимся исходя из практических соображений рассмот¬ рением одномерных временных рядов Dn = {q (ti)}, iK\ 2* 19
представляющих собой дискретную последовательность п из¬ мерений, производимых через определенные (не обязательно рав¬ ные) промежутки времени At на соответствующем временном от¬ резке [/н, /к]. Среди традиционных методов использования временных рядов на практике можно отметить: управление процессом, порождающим временной ряд; описание характерных особенностей порождающего процесса на основе исследования временного ряда; предсказание будущего на основе знаний прошлого, предста¬ вленного временным рядом; выяснение механизма процесса, порождающего временной ряд. Рассматриваемый в монографии подход к отображению времен¬ ных рядов Dn= {q{ti)} в БД предусматривает их использование в АСПИУ по всем вышеуказанным направлениям. Глава 2 ДИНАМИЧЕСКОЕ ОТОБРАЖЕНИЕ ПРОЦЕССОВ ФУНКЦИОНИРОВАНИЯ СЛОЖНЫХ СИСТЕМ В БАЗАХ ДАННЫХ 2.1. ОТОБРАЖЕНИЕ ВРЕМЕННОГО ФАКТОРА В СИСТЕМАХ ОБРАБОТКИ ДАННЫХ. ПРЕДПОСЫЛКИ ПЕРЕХОДА К ДИНАМИЧЕСКИ ОТОБРАЖЕННЫМ ДАННЫМ1 Можно различать два вида временного фактора, используе¬ мого (или фиксируемого) при отображении реальности в БД: вре¬ мя-момент и время-период. При этом с точки зрения физического смысла время-момент ti, i=\,n, рассматривается (рис. 2.1, а) идеально как «миг» без протяженности, реально как отрезок вре¬ мени, малый относительно всего рассматриваемого временного периода либо не содержащий на своем протяжении изменений объектов системы или связей между ними. Кроме времени-момента ti как данного с временной размерностью в АСПИУ нашли при¬ менение данные, зафиксированные на этот дискретный момент времени — «значение на момент ti» q(ti) =q(t)dt (рис. 2.1, а). Время-период Г/, /=/,/, в свою очередь, характеризуется на¬ чалом и концом tK.f а также протяженностью т/ (рис. 2.1,6); 1 Настоящий раздел справедлив для метрических абсолютной и относи¬ тельной временных шкал; размытая временная шкала, используемая в системах ИИ, здесь не рассматривается (см., например, Литвинцева Л. В., Поспелов Д. А. Время в роботах и диалоговых системах // Вопросы кибернетики. Проблемы искусственного интеллекта: Сб. статей. — М.: АН СССР, 1980. — Вып. 61. — С. 61—70). 20
Рис. 2.1. Использование временного фактора в отображении реальности: а) вре¬ мя-момент; б) время-период в течение времени-периода совершаются какие-либо действия, происходят изменения в реальной системе. Аналогично U, кроме Tj в АСПИУ используются данные с невременной размерностью, соответствующие временному периоду 7;—«значение за период 7/» *) q(Tj) = (i)dt (рис. 2.1,6). '/ В качестве операций с данными ti и q(ti) (табл. 2.1) естествен¬ ным представляется использование обычных алгебраических опе¬ раций. Однако в ряде случаев необходимо применение и более сложных операций, имеющих процедурный характер, а также опе¬ раций, представляющих собой совокупность нескольких операций. Таблица 2.1 Возможные операции с данными в АСПИУ Вид данных Операции и (временные) ti±t2, U/t2* ti/n *, tp * Операции сравнения (>, >, =, Ф) q(t,)±q(t2), q(ti)/n* q(U) q(t\)lq(t2)*, q(ti)n* (невременные) q(ti)Th ti Операции сравнения (>, >, =, Ф) * В большинстве случаев данные, соответствующие времени-моменту, для указанных °пераций используются в качестве данных, характеризующих временной период, прошед- ший от некоторой точки отсчета (п — некоторое действительное положительное число). ** Операция t представляет собой поиск на заданном временном отрезке мо- Мента, которому соответствует значение q. 21
Для времени-момента ti при отображении данных в БД допус¬ тимы операции сложения, деления (включая действия с конста¬ нтой) и сравнения. Соответственно, для значения в момент q(ti) допустимы все операции, свойственные моменту tiy а также такие операции, как нахождение суммы на временном отрезке Г/ по зна¬ чению в некоторый временной момент, поиск на заданном вре¬ менном отрезке момента, значение в который соответствует неко¬ торому заданному числу q (включая поиск максимального и ми¬ нимального значения) и др. Для времени-периода (отрезка) Г/ (табл. 2.2) осуществимы все операции, свойственные моменту с той разницей, что опера¬ ции сравнения осуществляются для временного отрезка т/. Кроме того, возможно использование теоретико-множественных операций Таблица 2.2 Возможные операции с данными в АСПИУ Вид данных Операции Ti (временные) ТХ±Т2, TJT2 ) Tj/riy Tjn Включая _ , > операции Операции сравнения для т/(>, =, j с ^ ^ / 0, ti С Т}, ^ у* ч р~ \ 1, ti G Tj, е I]) tl Теоретико-множественные (U, П» ^) Я(Т,) (невременные) q(Tl)±q(T2)y q(Tf)/n q(T{)lq(T2), q(T\)/T2 q(Tj)n, q(Tx)T2 Операции сравнения (>, >, = , Ф) tK q*\ (ti £ Tj)-+q(ti) dq(Tf) dt t — ti Теоретико-множественные (П, U, c=) Включая операции с q(tн), q(t*) * Операция tH, tK^zz^q представляет собой поиск временного отрезка, содержащего момент, которому соответствует значение q. (таких, как объединение, пересечение, и др.), а также операций проверки вхождения в Tj заданного временного момента, выбор¬ ки некоторого временного момента. Аналогично для значения за период q(Tj) используются все операции, свойственные периоду 71/, а также такие операции, как нахождение производной, выбор¬ ка значения q(t{) в некоторый момент определение границ вре¬ менного отрезка, включающего некоторое значение q(ti), которое 22
•совпадает с некоторым произвольно заданным значением q, и др. Анализируя приведенные таблицы, можно заметить, что и с практической, и с теоретической точки зрения время-момент ха¬ рактеризуется определенными условностями по сравнению с вре¬ менем-периодом Tj и, кроме того, обладает меньшими операцион¬ ными возможностями. Существующие принципы создания и функционирования БД, а также их развитие [35] характеризуются сбором, хранением и использованием информации, зафиксированной в прошедшие мо¬ менты (дискреты) времени, т. е. носят статический характер. Ста¬ тический подход к отображению данных основан на использовании временного фактора в виде времени-момента, в связи с чем БД пред¬ ставляет собой совокупность последовательностей информацион¬ ных объектов (например, показателей, отношений, ОЭ), индиви¬ дуализированных по прошедшим моментам времени, причем в большинстве случаев без их фиксации. Отображаемые данные, -естественно, имеют недостатки, свойственные этому виду времен¬ ного фактора. Это, в свою очередь, приводит к трудностям отобра¬ жения и использования информации в БД и неудобствам их эксплуатации вплоть до выполнения службой администрирования БД функций запоминания временного фактора, характеризующего хранимые данные, и обеспечения их выборки по необходимому времени-моменту. В то же время большинство объектов и отно¬ шений, свойственных АСПИУ и отображаемых в БД, имеют дина¬ мический характер (см. 1.3), требуют непосредственного учета временного фактора и повышения оперативности при актуализа¬ ции хранимых данных (особенно для систем управления реально¬ го времени). Кроме того, многие процессы в различных приложе¬ ниях являются непрерывными во времени, однако информация о них отображается также множествами дискретных информацион¬ ных объектов, т. е. временными рядами {q{ti)}y /=1,п. Нетрудно заключить, что статический подход по существу не мо¬ жет решить в комплексе перечисленные проблемы ИО АСПИУ. Еще одним важным моментом при отображении данных яв¬ ляется отмеченный выше факт, что внесение изменений в БД про¬ исходит всегда с временной задержкой относительно момента ре¬ ального изменения. Естественно, что данные, отображающие опе¬ ративно изменяющуюся обстановку и используемые для принятия решений или выработки управляющих воздействий, за период за¬ держки и в последующем стареют. В результате управление может осуществляться менее эффективно, порой с ошибками. Одним из основных методов компенсации старения данных в АСПИУ явля¬ ется [23] метод экстраполяции значений информации на основе Ретроспективных данных об отображаемом процессе. Очевидно, что статическое отображение данных в БД само по себе (т. е. без применения каких-либо прогнозирующих средств) не обеспечива¬ ет возможности компенсации старения данных, а в случае приме¬ нения соответствующих программ прогнозирования является не¬ 23
технологичным и может не отвечать требованиям оперативности для конкретных АСПИУ. Выход состоит, на наш взгляд, в использовании наряду со ста¬ тическим динамического отображения в БД объектов и отноше¬ ний предметной области, т. е. применении фактора время-пери¬ од Тj и отображении в БД АСПИУ, где это необходимо, тенден¬ ции следования событий и фактов с необходимой степенью точ¬ ности (с возможностью генерирования данных для требуемых моментов времени в прошедшем, настоящем и будущем). Кроме всего прочего, одной из предпосылок перехода к дина¬ мическому отображению информации в БД является то обстоя¬ тельство, что при статическом подходе точность информации, пред¬ ставляемой в АСПИУ (особенно на верхних иерархических уров¬ нях), как правило, ниже точности этой информации, предназна¬ ченной для последующего хранения. Действительно, если рас¬ сматривать вероятности возникновения погрешностей на этапах сбора, фиксации, передачи и обработки данных в АСПИУ, ока¬ жется, что используемая информация в большинстве случаев от¬ личается от ее фактических значений. Следовательно, хранение в БД абсолютно точных значений дискретных данных является, по сути, необязательным. К подобному выводу приводит также необ¬ ходимость учета фактора ценности данных, хранимых в БД. Ду¬ мается, что реальный взгляд на точность представления и цен¬ ность используемых данных (особенно в системах организацион¬ ного управления) еще не выработан, хотя, безусловно, должен использоваться инженерный подход к их установлению. 2.2. ДИНАМИЧЕСКОЕ СТРУКТУРИРОВАНИЕ ИНФОРМАЦИОННЫХ ОБЪЕКТОВ В БАЗАХ ДАННЫХ Суть динамического структурирования информационных объ¬ ектов, составляющих временной ряд, состоит в переходе для соот¬ ветствующих случаев от статического отображения данных к хра¬ нению тенденции следования (рис. 2.2) событий и фактов, про¬ исшедших на некотором временном отрезке [/н, /к], в виде специ¬ альных генерирующих функций (ГФ) Q*=U fj(Dn, t), j где e—максимальная фактическая погрешность отображения ГФ: е = max | [q{t{)- Q'S(D„, </)]М*,) I < £0 (| со (/г) |>0 — вес погрешности аппроксимации в момент tif позво¬ ляющий, например, учитывать относительную погрешность отобра¬ жения; во — допустимая (нормативная) погрешность аппроксима¬ ции, причем для относительной погрешности 0<во<1, для абсо¬ лютной в0>0); 5 — вид используемой ГФ, s=l,S; Dn — множест¬ во (временной ряд) п информационных объектов q{ti); t — времен ной момент (^н</</к). 24
В общем случае Q* пред¬ ставляет собой кусочно-не¬ прерывную функцию, состо¬ ящую из совокупности М подфункций fh упорядочен¬ ных по времени: Q*=U //» / j = 1, Л1. Конкретное выра¬ жение подфункции f} зави¬ сит от 5 и в общем случае включает временной фак¬ тор t и коэффициенты при нем ku k2, km, обуслов¬ ленные временным ря¬ дом Dn- Таким образом, динамическое отображение информации сво¬ дится к хранению не самих информационных объектов, индиви¬ дуализированных по временным дискретам на отрезке [/н, /к], а коэффициентов k\ (Dn) ,k2{Dn), ...,km(Dn) ,т<п, входящих в ГФ. При таком подходе осуществляется сжатие данных в БД (коэф¬ фициент сжатия ксж = п/т), а информация на любой момент вре¬ мени получается непосредственной подстановкой зна¬ чения IU в ГФ, т. е. вычислением (генерацией) по Q" с ошибкой в, не превышающей наперед заданного во. Получение данных воз¬ можно для текущего и будущих моментов времени пос¬ редством экстраполяции на основе ГФ без использования исходно¬ го временного ряда дискретных данных {q{ti)} и дополнительных прогнозирующих средств. Следует отметить, что ГФ Qzs (Dn,t) могут иметь в качестве аргумента не только временной параметр t, но и пространственный параметр г. Подобный вариант ГФ может быть использован в тех случаях, когда в описании данных принципиальное значение име¬ ет пространственный аспект отображения. (В качестве примеров можно указать, в частности, отображение данных о профиле ка¬ кой-либо поверхности, например небесного тела, данных об изме¬ рениях в пространстве определенных физических величин, напри¬ мер проводимости, концентрации вещества, и т. д.). Для определения ГФ (оценивания параметров временных ря¬ дов) могут использоваться такие методы, как сплайн-аппроксима- Ция, метод последовательных разностей, итеративный подход, и Др. Наиболее приемлемым из них является сплайн-аппроксимация [40]. Корректировка ГФ может производиться автоматически при Поступлении новой дискретной информации и только в том случае, если эта информация не соответствует по точности процессу, ото¬ бражаемому ГФ. Подробно вопросы создания, хранения, актуали¬ зации и использования ГФ в динамических БД (ДБД) обсужда¬ ется в последующих главах монографии. 25; Рис. 2.2. Динамическое отображение данных из {<7 (/*)}> г=1,/г, в виде гене¬ рирующей функции Q J;* = (J fj(Dnjt) /
Важным вопросом динамического отображения временных рядов в ДБД двляется установление допустимой погрешности е0 отображения данных в виде ГФ. Естественно она может быть и нулевой (е0 = 0), при этом соответственно воз¬ растает количество подфункций //, составляющих ГФ, и, как следствие, снижа¬ ется коэффициент сжатия данных /гсж в ДБД. В общем случае допустимая нормативная погрешность отображения е0, необходимая для установления е, для той или иной ГФ определяется как в0 = min (елин, встаР, s^11, втех11), где вдин — погрешность, обусловленная динамичностью системы Sp; естар — погрешность, обусловленная фактором старения данных; ецен — погрешность, обусловленная фактором ценности информации (при учете затрат, направлен- ных на достижение требуемой точности); етехы—погрешность, обусловленная деформацией данных на соответствующих технологических этапах (сбор, фик¬ сация, передача, обработка). Как было показано в 1.3, для динамических систем существует зависимость между погрешностью отображения данных едип, дли¬ ной р конечной памяти системы Sp и дискретным интервалом времени At повторного измерения аргументов /. Если значение At для системы Sp регла¬ ментировано, то на его основе однозначно определяется значение един. Другой стороной вопроса, обусловливающей установление точности отобра¬ жения информации в БД, является фактор ее старения. Рассмотрим следующую модель [23] для определения естаР. Пусть на основании некоторого числа q(t1{) = <аь а2, ccz, ..., az>, где az— z-й разряд числа q(tK), z=l,Z; Z — количество разрядов числа q{tK), зафиксированного в момент /к, вычисляется некоторое новое число q(tK-\-l) = <|3i, р2, •••, Pz>, соответствующее моменту (tK + l). При этом каждый разряд числа q(tl'-\-l) может с некоторой вероят¬ ностью совпадать с соответствующим разрядом числа q(tK-\-l) = <у\, у2, •••> Yz>, представляющего собой точное значение числа, характеризующего отображае¬ мый процесс, в момент (tK + l). Старение результата измерения будет прояв¬ ляться в том, что с увеличением I вероятность совпадения соответствующих разрядов чисел q(tK + l) и q(tK+l) от старших разрядов к младшим будет уменьшаться. Таким образом, процесс экстраполяции, т. е. получения числа q(tK + l) на основе числа q(tK-\-l), связан с ошибкой: предсказанное значение q(tv + l) складывается из точного значения q(tK+l) и ошибки, зависящей от периода времени задержки /: q(t« + l) = q(t« + l) + b(l). Выберем в качестве критерия оценки качества экстраполяции средний квад¬ рат ошибки прогноза V(l) = [q(tK + l)-q(t«+l)Y, .имеющий, как показывают экспериментальные исследования, гауссовское рас¬ пределение вероятностей и дисперсию (естаР)2(/). Тогда в качестве характерис¬ тики старения данных может быть принята вероятность pz(l) сохранения до¬ стоверности z-ro разряда числа к моменту /к + /. Сохранение достоверности z-ro разряда, а следовательно, и всех разрядов, расположенных левее, при образовании числа q(t1{-\-l) произойдет при условии, что ошибка прогноза про¬ цесса в момент tK + l окажется локализованной в области Aqz=N~(z~l), являю¬ 26
щейся ценой z-го разряда (где N — основание принятой системы счисления для фиксации чисел; z=\,Z). Вероятность этого события при гауссовском распре¬ делении ошибки фиксируемых данных и определит (путем подстановки соот¬ ветствующих параметров в формулу для плотности вероятностей гауссовского распределения) вероятность р2(1) [23]: Таким образом, {pz(l)} представляет собой семейство из Z кривых, начинаю¬ щихся при 1=0 в одной точке pz(0) = 1 (рис. 2.3 [23]). Оценки р2{1) обладают следующими свойствами: монотонно убывают, всякая задержка может только уменьшить достоверность измерительной информации; расположены так, что кривые с большим индексом z расположены ниже кривых с меньшим z, а это означает, что младшие разряды числа стареют быстрее старших [1]. Особое значение для определения естар, естественно, имеет зависимость (естаР)2(/)—нарастание дисперсии ошибки прогноза с продолжительностью времени задержки: чем медленнее растет (естар)2(/) и чем меньших значений она достигает, тем медленнее стареет результат измерения. На графике сред¬ ней квадратической ошибки прогноза (естар)2(/) (рис. 2.4 [23]) можно зафик¬ сировать последовательность периодов Тi, Г2, ..., Т2, Tz, отсчитываемых от одной начальной точки, по прошествии которых происходит потеря достоверно¬ сти очередного z-ro разряда числа. Очевидно, что последовательность {Тг} за¬ висит от свойств измеряемого (отображаемого) процесса, способа прогнозиро¬ вания и характеристик измерительного прибора. Если известно минимальное значение периода времени At между двумя последовательными измерениями процесса (см. 1.3), определение целесообразной погрешности отображения гстаР осуществляется в соответствии с минимальным периодом Т* из после¬ довательности {Tz}, которые превышают At: Приведем для пояснения пример из [22]. При измерении и отображении на¬ грузки генератора мощностью 200 мВт — случайного процесса с временем кор- Д qz!2 2 (sCTaP)2 (/) Тг* = т1п{Тж}-+Тг>М, z=]tZ. Pzd) Tf Tx AtTz*=Tj I I Рис. 2.3. Вероятности старения раз¬ рядов числа во времени (кривые с большим индексом z расположены ниже) Рис. 2.4. Зависимость средней ква¬ дратической ошибки прогноза естар (/) от времени задержки I (с уче¬ том характеристик измерительного прибора Aq и N) 27
Унфорпация о штрафе Рис. 2.5. Схема системы управления Sp реляции около 10 мин — 7-й двоичный разряд имеет «срок жизни» (при поро¬ ге достоверности 0,9) всего 0,4 с. Практически это означает, что, если за ука¬ занное время результат измерения не был использован для выработки управ¬ ляющего воздействия, нет необходимости измерять и хранить результат с та¬ кой точностью отображения. Таким образом, целесообразная погрешность отображения естаР при задан¬ ном значении At определяется как sCTaP = A qN**~\ где Aq — цена младшего разряда числа; N—основание системы счисления: г*—разряд числа, сохраняющий достоверность при заданном At (At — мини¬ мальный период времени, по прошествии которого осуществляется новое изме¬ рение результата). Для решения вопроса о погрешности отображения в зависимости от цен¬ ности информации для АСПИУ рассмотрим динамическую систему управления Sp (рис. 2.5). В состав системы входит блок оценки результата, где вычисляет¬ ся величина штрафа о согласно определенной функции Т штрафа О — — F;)], где У;—предполагаемое значение выходного сигнала Sp в момент выданное, советующим блоком при выборе управляющих сигналов {х f__j} в предшествую¬ щий момент ^_i(Y;^2, 2—множество возможных значений выхода системы Sp)\ v — коэффициент ошибки прогноза; У/ — реальное значение выходного сигнала системы в момент U, У*е2. Обычно требуется, чтобы Ч^О для любой пары (У*, У/), т. е. любая ошиб¬ ка должна штрафоваться. Предположим, что первоначально управляющие ре¬ шения вырабатывались в отсутствие советующего блока в условиях неопреде¬ ленности, оцениваемой энтропией Я,-, и имели сумму потерь — риск R(Hi). С вводом советующего блока, передающего информацию U в блок управляю¬ щих воздействий для выработки управляющих сигналов {*“}, величина ошиб¬ ки и соответственно штрафа Ч^-м в момент ti+\ уменьшилась. Будем считать, что количество информации, содержащейся в каждом сообщении, для блока 28
управляющих воздействий известно. Использование советующей информации приводит к меньшей неопределенности и потерям. Разность потерь bRt = R (#;) — R {Hi — /1) характеризует пользу, принесенную советующей информацией. Такой подход может быть использован при определении ценности некото¬ рой информации It. Подсчитывая назначенные штрафы и усредняя их, прихо¬ дим к вычислению условного математического ожидания функции х¥ двух случайных аргументов У,-, У» при оценке У* Гг)/?У1=2>(^, Yi)P{Yt) ri для случая, когда 2 дискретно. Отсюда допустимая погрешность информации h определяется в зависимости от назначенной либо существующей функции штрафа Ч^, а если говорить упрощенно, от значимой разности Yi—У/, т. е. от ошибки, штрафом за которую для системы Sp можно пренебречь. Наконец, погрешность етехы, обусловленная деформацией данных на техно¬ логических этапах переработки информации, может быть определена как веро¬ ятность сложного события, состоящего в том, что хотя бы на одном из этапов переработки информации произойдет ее искажение1: L етехн = 1 _ jj (1 _ 1=1 где бi — вероятность погрешности обработки данных па t-м этапе от их сбора до запоминания в БД (i=l,L); L — общее количество этапов переработки ин¬ формации. Соответствующие значения 6; для различных видов АСПИУ обуслов¬ лены применяемыми техническими средствами либо могут быть установлены в процессе их эксплуатации. Полученные результаты создают объективные предпосылки к переходу на хранение в БД динамически отображенных данных, а динамическое структу¬ рирование объектов БД, применяемое наряду со статическим, позволяет улуч¬ шить характеристики отображения предметных областей в АСПИУ. 2.3. РАЗРАБОТКА И ПРИМЕНЕНИЕ БАЗ ДАННЫХ ПРИ ДИНАМИЧЕСКОМ ОТОБРАЖЕНИИ ВРЕМЕННЫХ РЯДОВ Использование принципов динамического отображения ин¬ формации в АСПИУ обеспечивает более рациональное (по «внут¬ реннему» аспекту) структурирование данных (см. 1.2) для таких объектов БД, как показатели, ОЭ и отношения, содержащих ко¬ личественный атрибут. В отличие от традиционных подходов Д5] (см. рис. 1.1), это достигается введением в технологию разработки БД этапов установления обоснованных допустимых погрешностей 0тображения данных и проектирования динамической информа- 1 Поскольку информация в процессе переработки передается последователь- и° с одного этапа на другой независимо от появления либо отсутствия погреш- °сти на предшествующем этапе, естественно допустить независимость событий а этапах переработки информации. 29
Рис. 2.6. Предполагаемая последовательность разработки БД с введением эта¬ па проектирования динамических структур объектов БД ционной модели (рис. 2.6). Применение такого подхода позволяет, на наш взгляд, в определенных случаях устранить недостатки, присущие отображению предметной области для различных объек¬ тов БД (см. табл. 1.2), а также обеспечить решение существующих проблем информационного обеспечения АСПИУ. Динамическое структурирование объектов БД, применяемое наряду со статиче¬ ским, позволяет улучшить характеристики отображения предмет¬ ной области, в частности обеспечить удобство и оперативность актуализации данных в БД, ввести временной фактор в отображе¬ ние предметной области, упростить реализацию БД и повысить оперативность /доступа к данным, представленным в виде отобра¬ жающих элементов. Кроме того, используемые в БД информа¬ ционные объекты становятся приспособленными для представления временных рядов, поскольку отображение временного фактора осуществляется естественным образом, а с прикладной точки зре¬ ния обеспечивается более простая формализация процессов проек¬ тирования структур данных БД (благодаря их унификации), а также повышается эффективность хранения информации в АСПИУ (благодаря улучшению объемно-временных характеристик). Проведем логическое структурирование динамически отобра¬ женных данных на примере иерархической модели, учитывая ее наглядность, используя в качестве объектов БД показатели. (Б действительности ДБД может быть ориентирована на любые мо¬ дели данных и использование не только показателей, но и отно¬ шений, ОЭ и др.) 30
Год поль¬ Под зователя показателя с - вид ГР л) - общее количество дискретов в fj tj-начальный дискрет е0 - допусти мал погреш¬ ность аппроксимации *7 £j -максимальная фак¬ тическая погрешность fj в}-количество смеж¬ ных особых точек Hi Dp чш чШ чШ чСРр) Код объекта Иод объекта (процесса) 1 (процесса) 2 ti I 9f h | Чг h | Чз I I I I £ I I I I I Чм "Т 1 I I Рис. 2.7. Фрагмент логической структуры динамической базы данных (иерархи- ческа я модель) Логическая структура ДБД в случае выбора иерархической модели данных представляет совокупность трехуровневых струк¬ тур типа дерева (рис. 2.7). На первом уровне расположены коды показателей и при необходимости соответствующие им коды поль¬ зователя, обеспечивающие защиту хранимой информации от не¬ санкционированного доступа. Второй уровень представлен кодами объектов (процессов), информация о которых подлежит отображе¬ нию в БД1. На третьем уровне представлены совокупности дан¬ ных о ГФ с учетом обусловленных единиц измерения времени 8 и количественного атрибута х. В общем виде ГФ заданы кусочно¬ непрерывно подфункциями fj, у = 1, Му вида 5 на временном интер¬ вале jYH, tK\: n'j — общее количество дискретов, охваченных /-й подфункцией; е0—аппроксимации на интервале [tf, tlj], /=1,М; е/ — максимальная фактическая погрешность отображения;. V7— количество особых точек. Кроме того, представлены соответствую¬ щие данные в дискретном виде: данные последних периодов (см. приложение 1; например, для систем организационного управ¬ ления— смена, сутки, неделя, месяц, квартал) и особые точки. Таким образом, сочетание статического и динамического ото¬ бражения данных в ДБД обеспечивается использованием наряду 1 В некоторых приложениях целесообразнее объявить коды объектов кор¬ имыми. 31
с ГФ данных, представленных в дискретном виде: данных на по¬ следние моменты (фиксированные точки) ti=tK и особых точек. Особые точки предназначены для отображения случайных выбро¬ сов, т. е. не соответствующих закономерности изменения данных, представленной соответствующей ГФ в пределах заданной норма¬ тивной погрешности е0, а также (при наличии нескольких смежных по моментам времени особых точек) для актуализации ГФ путем образования новой подфункции, соответствующей изменившейся тенденции процесса. В этом случае иногда может оказаться ло- гичной организация хранения данных в виде со особых точек, ха¬ рактеризующих временные моменты на отрезке «последействия» Тр (см. 1.3) динамической системы Sp\ а данные за более поздние периоды хранить в виде ГФ. Данные последних периодов (фикси¬ рованные точки) хранятся в дискретном представлении, если это необходимо, для анализа функционирования системы и выдачи информации без погрешностей по запросу (см. в 1.3: динамичность системы в сравнительном аспекте). Анализируя логическую структуру объектов БД (рис. 2.7), вы¬ делим следующие присущие ей достоинства: естественное сочетание статически отображенных объектов БД с динамически отображенными объектами, что позволяет разра¬ ботать структуру ДБД логически последовательную и эффектив¬ ную и средства управления ею (включая использование сущест¬ вующих СУБД); способность адаптации БД к изменениям предметной области благодаря введению множества особых точек, что позволяет фор¬ мализовать процесс актуализации БД и, как следствие, автома¬ тизировать его; обеспечение требуемой точности отображения дискретных дан¬ ных с привлечением минимальной памяти (в том числе без потери данных о случайных выбросах); возможность оперативного прямого вычисления (интерполяции, экстраполяции) дискретных данных на моменты времени в прош¬ лом, настоящем и сравнительно недалеком будущем; наличие данных о точках разрыва (/'] для каждой подфунк¬ ции /у) как характеристиках моментов изменения тенденций в предметной области, что позволяет проследить закономерности процесса на каждом отрезке времени; наличие данных для точного оперативного контроля и анализа развития процессов в предметной области (данных о последних точках соответствующих временных периодов, количестве особых точек, и др.)- 32
Глава 3 АЛГЕБРА ДИНАМИЧЕСКИ ОТОБРАЖЕННЫХ ДАННЫХ. ГЕНЕРИРУЮЩИЕ ФУНКЦИИ 3.1. АЛГЕБРА ДИНАМИЧЕСКИ ОТОБРАЖЕННЫХ ДАННЫХ Введем необходимые понятия. Временным множеством V назо¬ вем конечное множество отрезков времени Т/, j=lfM (ПTj = 0). i Множество коэффициентов генерирующей функции Ft явля¬ ется множеством подфункций //, существующих в соответствую¬ щие отрезки времени Tj. Если fj^Fti то говорят, что fj существует в отрезке времени Tj. Множество динамически отображенных данных (ДО-данных) Q является таким подмножеством декартова произведения мно¬ жеств V и Ft) что пара (Г/, f/)e;Q, если fj^Ft, /=1,Л1. На множе¬ стве Q может быть определена алгебра Т с множеством заданных алгебраических операций Q: r=<Q, 2>. Необходимость введения алгебры ДО-данных Т (ДО-алгебра) обусловлена новым подходом к отображению данных и использо¬ ванием ДО-данных в НО АСПИУ, что требует разработки специ¬ ального аппарата формализации, обеспечивающего эффективное описание и применение ДО-данных. Природа множества Q такова, что если D — исходный времен¬ ной ряд, который фиксируется в некоторой предметной области, то Ft = и fj(D, t), t = [t\~tK\. i= 1 Множество Q является генератором для получения элемента Q(ti) некоторого множества D, соответствующего определенному моменту ti (/,-g{/h, /к]), такого, что элемент d(ti) исходного вре¬ менного ряда D, соответствующий этому же временному моменту, отличается от сгенерированного из Q на величину, меньшую на¬ перед заданного е0: I qtfi) — d(tt) i /ш(^) <s0, (3.1) tu — отношение соответст- вия; со(^)>0— вес погрешности аппроксимации в момент ti (поз¬ воляющий, как указано ранее, различать данные по степени их влияния на функционирование системы либо, например, учиты- вать не только абсолютную, но и относительную погрешность аппроксимации). В процессе развития D во времени (при t>tK) соответствующее изменение Q осуществляется в том случае, если Происходит нарушение условия (3.1); при этом возможно расши- В 1156 33
рение (РхМ)-мерного множества коэффициентов Ft генерирую щей функции, которая состоит из М подфункций /у вида 5, опре деленных Р коэффициентами, до размера (Рх[М+1]). Введем следующие обозначения: Dn = {q (ti)}y , tK]y i=\yn—временной ряд n инормацион- ных объектов q(ti), например показателей, зафиксированных в моменты ti из [Ь\ /к], где tHy tK — начало и конец временного от¬ резка соответственно; At — интервал времени, через который производится измере¬ ние (фиксация) следующего (i+l)-ro элемента временного ряда Dn. q (^ч-i) — q {U-F А/); QEs>l(Dnу t)—специальная прогнозирующая или (при / = 0) генерирующая функция (Qj (Dn, ^)), определенная на временном отрезке [tHy tK] с прогнозирующей способностью до момента /К-Н: состоящая из совокупности упорядоченных по времени подфунк¬ ций /у, таких, что Qy 1 (Dn, 0 = U//> гДе s — ВИД используемой ГФ / (5=1,5); /— временной отрезок упреждения (допустимый шаг прогноза); е — максимальная фактическая погрешность ГФ (е<8о): в= шах | {q (*,) - q (^)}/<*> (tt) | , t" < tt < tK + l\ го — допустимая (нормативная) погрешность аппроксимации гене¬ рирующей (прогнозирующей) функции Qyz (Dny t)\ |со(//) | >0 — вес погрешности аппроксимации в момент t-t\ q(ti) =$*•1 (DПу t) — элемент (член) временного ряда, образуемый генерирующей или прогнозирующей функцией Qes>1 (Dny t) на момент tiy причем при tH<ti<s£tK это значение вещественной функции, определенной с ошибкой, меньшей г, по отношению к q{t{) на дискретном мно¬ жестве точек из ]YH, tK]; tK<ti-<tK + l — прогнозируемая оценка тренда Qyl (.Dn, t) на момент tr, М — количество подфункций /у, входящих в состав ГФ Qesl (Dn, t) (включающих в себя временной фактор t и коэффициенты при нем kj(Dn, t), обусловленные временным рядом Dn); т — количество хранимых коэффициентов kj(Dn) ГФ (т<л); ксж — коэффициент сжатия данных при отображении посред¬ ством ГФ: &сж = /г/т, &сж>1; a(ti) —независимый импульс, являющийся реализацией на момент ti случайных величин с фиксированным распределением (обычно гауссовское с нулевым математическим ожиданием и дисперсией в2 ); ц — параметр, определяющий среднее значение (уровень) ста¬ ционарного процесса. С учетом введенных обозначений определим множество Q операций ДО-алгебры, в которое кроме обычных алгебраических и теоретико-множественных операций (см. табл. 2.1, 2.2) входят следующие операции: 34
у (ti) —вычисление элемента q(ti) временного ряда с помощью ГФ Q*s1 №п' + S(tHt, ф —вычисление суммы последовательных элементов ~q(tf ) временного ряда с помощью ГФ Q*-1 (Dn, t) на отрезке [/", fib t"<tt<tK, < *к + /, Р= 1, л'; RVr Ф —вычисление разности элементов q(t*), ^It) врёмеи- ного ряда с помощью ГФ Qcs>1 (Dn, t) (вычисление прироста по амплитуде); Т{ф ф —вычисление темпа роста значений элементов вре¬ менного ряда, представленного ГФ Q‘s 1 (Dn, t), по элементам qifih ?(**)’• T(t"i, ti) —вычисление удельного темпа роста временного ряда, представленного ГФ Qes’1 (Dn, t), на отрезке [ф *£]; С (tty tty) —вычисление среднего значения последовательных элементов q (t9 ) временного ряда на отрезке [tty t)]9 р = 1, п'\ I(tty tty —вычисление протяженности временного отрезка между моментами tty tty SI (tty tty tty tty —вычисление суммы временных отрезков 1Ф Ф пь DI (tty tty tty tty —вычисление кратности «вложения» времен¬ ного отрезка [tty tty в отрезок [^, (сравнение отрезков); UI(tty tty, С) —вычисление длины временного отрезка как произведения длины исходного отрезка [tty tty на константу С; t(tty tty, tty —вычисление логической функции X условия вхож¬ дения (Л=1) либо невхождения (Х = 0) момента t9 в отрезок [tty п ^{tty tty —выборка некоторого момента tp из временного от¬ резка [tty tty; у {tty ttyy tty —вычисление элемента q{t9) временного ряда при условии вхождения момента t9 в отрезок [tty tty (^=1); при невхождении t9 в [tty tty X — 0; ^ (tty tty, qty —вычисление логической функции условия совпа¬ дения (Х=1) либо несовпадения (Х = 0) некоторого числа q9 с одним из значений временного ряда на отрезке [tty tty\ ^{tty qty —вычисление момента tty к которому сумма после¬ довательных элементов временного ряда из ГФ Q=*1 (£>„, t), начи- Ная с q(tu. ), превысит значение q9,
n(ti) —вычисление производной ГФ Q*-1 (Dn, t) в точке МА(Р}у tf) —вычисление максимального элемента временного ряда с помощью ГФ Qy 1 (Dn, 0 на отрезке [Д1, /?]; Ш(*", —вычисление минимального элемента временного ряда с помощью ГФ Qy 1 (Dn, /) на отрезке [£"., £*]. Кроме того, возможно введение и других операций над ДО- данными исходя из соответствующих приложений. 3.2. ГЕНЕРИРУЮЩИЕ ФУНКЦИИ И МЕТОДЫ ИХ ОБРАЗОВАНИЯ Возможными методами аппроксимации временного ряда по его заданным значениям (оценивания параметров временного ря¬ да) являются: выбор по значению принятого критерия приближения (перебор элементарных функций с минимизацией соответствующего функ¬ ционала) ; метод последовательных разностей; сплайн-аппроксимация [40]; итеративный подход; метод содержательно интерпретируемых функций; методы нелинейного сглаживания [31] и др. Рассмотрим методы, наиболее употребимые для образования ГФ из исходного временного ряда Dn. Метод выбора по значению принятого критерия приближения. Метод перебора элементарных функций с минимизацией функцио¬ нала основан на неклассическом принципе восстановления зави¬ симостей [7], в соответствии с которым из допустимого множества функций {S} выбирается функция /5, наиболее удовлетворяющая установленному критерию /(//), f}^{S}. В общем случае 7(f/) характеризует качество приближения функции // к ряду Dn. При этом наилучшему качеству соответствует минимум I (fj) в {5}. В том случае, если {S} и / (//) заданы явно, отыскание fs, ми¬ нимизирующей I (fj), является задачей вариационного исчисления. Одним из критериев выбора аналитической зависимости, аде¬ кватной тренду временного ряда, может быть критерий, который основан на соответствии инвариантов сглаживающей ГФ Q*’* (Dn, t) и временного ряда Dn = {q(ti))J ii~[tnr t*\. Для характеристи¬ ки определенной тенденции в большинстве приложений бывает достаточно получить один соответствующий инвариант q(ti), где ti = tK + At. Трудности отыскания инвариантов в случае длинных временных рядов многократно возрастают, что в большой степени связано с различными тенденциями, присущими таким рядам. Для устранения этих трудностей необходимо обеспечить построение кусочно-непрерывной модели ряда, чтобы ограничить влияние на прогноз уже несуществующих или нескорректированных тенден¬ ций. Построение кусочно-непрерывной модели тренда длинного 36
временного ряда с помощью рассматриваемого метода может быть осуществлено следующим образом: разбиением исходного множества п элементов ряда Dn = {q{h)} на статистически однородные подмножества /=1,Л4, М<п, с неизменной тенденцией; обоснованием и построением регрессионных моделей подфунк¬ ций ГФ fi = Ql (Л'> 0 110 каждому подмножеству Л/, }=1,М\ объединением отдельных подфункций в ГФ, представляющую собой статистическую модель временного ряда Dn'. м Q°s(Dn, t)- (j fj(Aj, t), ]= 1, M. 1= 1 Для выявления статистически однородных подмножеств {Л/} вре¬ менного ряда Dn используется информация о существенных при¬ знаках динамики процесса: явные тенденции роста (убывания), изломы (скачки), стремление к пределу, точки перегиба и др. Метод последовательных разностей. Каждый тип нестационар¬ ного случайного процесса (эргодического; квазистационарного; нестационарного: по математическому ожиданию, дисперсии, кор¬ реляционной функции; мультипликативного; аддитивного; сепара¬ бельного и т. д.) сложен для подгонки его к эмпирическим дан¬ ным. В свою очередь, и монотонный рост тех или иных показате¬ лей во времени может проходить по различным законам (линей¬ ному, параболическому , экспоненциальному, логарифмическому и др.). Для окончательного решения вопроса о выборе аналити¬ ческого уравнения, адекватного тренду процесса (в том числе при задании в виде кусочно-непрерывной функции) с помощью рас¬ сматриваемого метода необходимо обнаружить так называемую стационарную разность в поведении эмпирических данных, по ко¬ торой делается вывод о пригодности соответствующей аналити¬ ческой функции. Так, если у равноотстоящих элементов временно¬ го ряда приближенно равны разности логарифмов значений, раз¬ ности логарифмов разностей или вторые разности, то для модели¬ рования тренда пригодны квадратичная парабола, показательная Функция или квадратичная парабола соответственно. В табл. 3.1 1 приведены наиболее употребимые соответствия между последова¬ тельными разностями и аппроксимирующими аналитическими Функциями. Сплайн-аппроксимация. По сравнению с классическим аппара¬ том приближения многочленами сплайн-функции обладают двумя важными преимуществами: лучшими аппроксимативными свойст- вами (что объясняется в значительной степени их свойствами схо¬ димости) и удобством реализации построенных на их основе алго¬ ритмов. На практике обычно применяются сплайны не выше Ретьей степени (линейные, параболические, кубические), основан- _^^на достаточно простых алгоритмах аппроксимации. Для ка 1977ТЫ^КИН ^ ^ Статистические методы прогнозирования. — М.: Статисти- 37
Таблица 3.1 Соответствие между видом последовательной разности временных рядов и аналитическими функциями их отображения Вид последователь¬ ной разности Вид взаимозависи¬ мости между после¬ довательными разно¬ стями Функция отображения временного ряда Код s A qt Примерное равенство Qj (Dfi, t)=a-\-bt 1 A qt Линейная t)=a-\-bt-\-cP 2 kq2t (вторая разность) — » — Ql(Dn, t)=a+bt+cP + d& 3 A qt/qt Примерное равенство (?4 (Dn, i)—ab‘ 4 log A qt Линейная Qs (Dn, t) = a+bc‘ 5 A qt!qt — » — Ql(Dn, t)=ab(cr- 6 i°g(A qtlqt) 0J(D„, t)=abct 7 log (bqt/qj) » Ql(Dn, t)=a\(\ + be-c0 8 построения таких сплайнов разработано уже большое количество программ на ЭВМ различных классов. При использовании сплайн-аппроксимации задача образования ГФ Q^1 (Dny t) временного ряда Dn = {q (ti)}y i=l,n, формулиру¬ ется следующим образом. На отрезке [/н, /к] задана сетка и в ее узлах tL заданы значения {q(ti)}, ^е[/н, tK], i=l,n, пред¬ ставляющие собой некоторый временной ряд Dn. Требуется по этим значениям восстановить функцию р-го порядка Q*/ - =[Jfj(Dn, t), j= Г7 Mf на всем отрезке [/н, tK\ при условии У (ti) — QSs‘ (Dn, ti) I <e}, e<e0, i=l, n, tt G [*", *K]- При этом естественно выбрать ГФ Q^:1 (Dnt t) такой, чтобы ко¬ личество Ml подфункций /7, j=l,M (соответственно, звеньев сплай¬ на) было минимально возможным. Это обеспечивается в том слу¬ чае, если каждая из подфункций f}- будет многочленом р-го поряд¬ ка наилучшего равномерного приближения без склеивания в точ¬ ках разрыва. Результатом является ГФ Qf(Dn, *)= /=0 такая, что [39]: 38
а) при заданных t^[tz, f,+ I], z= 1, М, ГФ (£'(£> л> 0 есть наилучшее взвешенное равномерное приближение временного ря¬ да ZV, б) шах [ | q (tz — Qsl(Dn, tz) | /о>(*г)] = e < e0> 2=1, М, где со (tz) —вес ошибки приближения в точках разрыва, о)(/2)>0; в) шах [ I q{tz—S*s(tz) | h(tz)\ > е0, 2 = 1, М-1, где S*s{tz)~ наилучшее равномерное взвешенное приближение временного ря¬ да Dn многочленом степени р в точках t\ = {tz}\}{tz + Ы). Количество М звеньев сплайна (подфункций // ГФ) опреде¬ ляется допустимой погрешностью отображения ео и значениями временного ряда Dn на интервале |YH, tK\. Звенья сплайна строят¬ ся последовательно слева направо. Вычислительная схема опреде¬ ления 1 (Dn, t) приведена в {40]. Применение сплайн-аппроксимации может значительно повы¬ сить эффективность дискретизации благодаря использованию на¬ илучших сплайнов, что, в свою очередь, позволяет уменьшить среднее время анализа аппроксимируемой функции по сравнению с ранее использовавшимися для технических приложений алго¬ ритмами на один-два порядка. В пользу указанного метода гово¬ рит и тот факт, что при решении научно-технических задач раз¬ нообразные величины удобно приближать с помощью кусочно-по¬ линомиальной функции (сплайн-функции) благодаря ее унифици¬ рованности и сравнительной простоте процедур сплайн-аппрокси¬ мации. Такое же заключение справедливо и для экономических процессов, где класс применяемых функций весьма ограничен. Суть в том, что для длинного временного ряда экономических по¬ казателей зачастую невозможно найти относительно несложную единую интерполирующую аналитическую функцию, приемлемую но погрешности отображения ео, поскольку он описывает различ¬ ные сменяющие друг друга тенденции. Сплайн-аппроксимация дает такую возможность, причем количество звеньев сплайна опреде¬ ляется заданной допустимой погрешностью ео. Точки разрыва (уз¬ лы сплайна) характеризуют моменты изменения тенденций, что позволяет проследить закономерности процесса в каждом звене, а также в целях анализа получить данные о моментах изменения тенденций отображаемого процесса. Учитывая эти достоинства, сплайн-аппроксимация (построение усредненных подвижных сплайнов) принята за базовый метод построения генерирующих функций ДБД. В качестве иллюстра¬ ции применения сплайн-аппроксимации приведен пример образо- вания Гф из временного ряда, содержащего 1000 значений, полу¬ ченных с помощью функции у = sin* через 1°, л:=[0,999°], t = x+1 ^тиол. 3.2). Некоторые статистические вопросы построения и при- еиения ГФ в ДБД с использованием сплайн-аппроксимации, ко- Рые имеют практическое значение, рассмотрены ниже в 7.2. 39
к £ '7л и я я я я я >» ■0* 2 л ы о S о о я я cd я о. VO о II с О 2 я Я я 95 а> cd S Ч <у Я О- « ю ^ Ci ю w >> <0 со я О» я см со cd Я я ч хо s £ cd «* & * J2 о. С с ■&S т9* S „ 3£ ..gSSu« £**s вк л * л л н 5- £ uj у Я я о о * 2 а) ж и • * :г я 5 £ U’Q* * * £** Л я ^ ° •& о-в- 1 Ч s OS С Я Sgss S S § § “2 • а £ я U С т« bftcS о р s о Я я о и 2в« о О О О ’—' СМ СП 1^ оо оо ю см 05 сп см СП СП 05 о о о о о III, oooi о о о о о о о о Tj<OOOin ^ ю ^t« СМ т*< Ю o' о" o' о" I I со со т со I I I I О О О О о о о о о о о о ID t— СО СО СМ СМ О ^ о о * СООО-нО lO'toCO О СП оо ОО СО СО —I оо о со п- см о о o' ~ I I O’tOO СП см о о СП со о ^ см 00 см ^ ^ СО СО ^ o' со" ю" СП I со со I со ^ СМ СО П« I о со со rf СО ^ со ю ю 00 со 05 05 05 ООО оо о о" о" о" СМ 05 — юсоь 05 05 05 05 СП со ООО ОО о о о" о" со со со с© со со I I I I I I о о о о о о о о о о о о о о о о о о оо о о со со см NCMOOOCO «С0 1>1> t-t> o' о" о" о" о о" I I I со со со со со оо I I I I I I о о о о о о о о о о о о о о о о о о Ь- 1>- О- СО t"- о СО СМ Ю СМ 00 о СО г^. *-^Ю 05_ о о" О ~ —Г *-«“ I II I I 00 СМ ^ СМ т*« со CD О СО СП 05 СП О СО СМ СО <£> ^^ЮОХ^О О о см со о ^ о" о о" о" —Г ~ COhOOOO ^оо^ооо СП СМ о 00 см Tf СМ 00 ОО СМ СМ 00 о см со ю со ^ о" о" со см" см" о" ■ см о ю см < См ю I I I I Н СМ СО Я1 ю СО I о COt^cOt^CMOuOLOOOCOCOt^- ОО 1—< rf СО 00 05 00 05 05 05 05 СМ 05050505050505050505050 ОООООООООООО ОООООООООООО О- °. °~ °„ °, О о о о о_ о" о" о" о" о" о о" о" о" о" о" о" to со ю _ to to со со to со to I I I *? I ! I I 7 I I I ОООООООООООО ОООООООООООО ОООООООООООО CM CD C5 CO 05 CD 05 *—> О 1 О СО СОС0^^05Ю05^0^00 CD Tf СО b- CM CM 00 CM 00_ *-h o" o" o" o" o" o" o" o" o" o" o" o" I I I I CO CO CO I I I ООО CO CO CO CO CO CO CO I I I I I I I 5 о о о о о о о ОООООООООООО ОООООООООООО CD СО СМ О CD 05 О 05 СО СО гнОО-ЧСОООСОССОЮ СО СМ^ ^ ^ СО ID СМ_ СО ^ о" о" о" о" о" о" *-Г о" ~ч" о" см" о" III II III CM СО r—1 СО СО 05 ОС Ю N ^ ^ ^ OO^lDNr^M-CMNNcOCnCM NCM^WO^DOClCMOO —'TflDLOCHCnoOOOCMt^COO О О СО —^ СМ СМ СО Th СМ П- 05 о о" о" о" о" о" о" о" о" < о" <—< о" III II 05^10000000000 N^tM^COlDCOOOO^ ОО СМ ^ О ^ 1 < 05 1—I Ю О О *—•COCO’—'O^COCOi—'t^t^CM С5 О- t-н t>- ь- СО СЮ СО ОЭ 00 о" о" —н" со" о" со" со" о" П-" ь." СП оо < СО ID ^ СМ 00 см со ^ I — *—I CM CM 1D I I I I tCMC0^lDC0b-00 05O^<5) I О 40
3.3. АДАПТАЦИЯ И КОРРЕКТИРОВКА ГЕНЕРИРУЮЩИХ ФУНКЦИЙ Важным свойством любой информационной модели является ее способность адаптироваться к происходящим изменениям. Это, в свою очередь, предполагает проведение операций включения, удаления, замены данных и наличие соответствующих средств выполнения этих операций. Указанные операции с динамически отображенными в виде ГФ данными характеризуются определен¬ ными особенностями, вызванными своеобразием структуры дан¬ ных и необходимостью предварительной обработки информации в ДБД перед их загрузкой или выборкой. Включение данных. Операция включения данных q(ti) с време¬ нем отображения ti = tK+At состоит первоначально в поиске необ¬ ходимой ГФ (см. рис. 2.7) по коду информационного объекта (например, показателя), коду реального объекта или процесса, данные о котором отображаются в ДБД (при условии совпадения кода пользователя и разрешения других средств защиты БД от несанкционированного доступа). Далее на основе fj генерируется значение q(tK + At) и производится проверка неравенства Г= | q(t*-\-bt)-q[F + \t) | < s0. (3.2) Если неравенство (3.2) соблюдено, а момент tK+At не являет¬ ся фиксированной точкой (см. 2.3), то при е<е/ никаких операций с ГФ не производится (при е>е/ значение е/ в подфункции // изменяется на е, а счетчик смежных особых точек N' устанавли¬ вается в нуль). При условии, что момент tK+At— фиксированная точка, осуществляются необходимые преобразования в множестве фиксированных точек подфункции fj. Если неравенство (3.2) не соблюдено, а 8/^=0, то значения q{tK+At) и /к + At включаются в множество особых точек под¬ функции fj (при е/ = 0 производится повторное образование под¬ функции fj ГФ, поскольку количество образующих точек при пре¬ дыдущем образовании подфункции fj было недостаточным). В этом случае количество смежных особых точек N' увеличивается на единицу, и если оно достигает при этом некоторого предельно¬ го значения Nf, то на основе Nf последних по времени отобра¬ жения особых точек происходит образование новой подфункции fi+i гф, а из множества особых точек подфункции fj ГФ эти точек удаляются. То же самое производится и в случае, если вся отведенная память для множества особых точек подфункции // занята. В этом случае операция образования новой подфункции fi+1 ГФ осуществляется по N' особым точкам вместо Nf. Удаление данных. Операция удаления данных из ДБД на не¬ который момент ti включает первоначально поиск необходимой ГФ, причем в отличие от операции включения данных необходи¬ мым этапом после отыскания требуемой ГФ по соответствующим кодам является поиск подфункции fjy включающей момент ti. 4 Г
Поиск осуществляется до тех пор, пока не будет соблюдено усло¬ вие /=1. М-1. (3.3) При этом подфункцией, включающей момент 1является подфунк¬ ция //, т. е. предшествующая по времени. Далее во множествах особых и фиксированных точек // осу¬ ществляется поиск точки, соответствующей моменту и, если та¬ ковая находится, она удаляется из множества. В остальных случа¬ ях никаких действий не производится, поскольку представление данных в виде ГФ описывает не отдельные события (факты), про¬ исшедшие в реальности, а тенденцию их следования. Удаление данных из ГФ за какой-либо период времени также не допускается — в этом случае осуществляется замена одной тен¬ денции на другую, так как реальный объект существовал и дан¬ ные о нем должны быть представлены в ДБД за обусловленный период отображения. В особом случае — при удалении недосто¬ верных данных о «мнимом» (как выяснилось впоследствии) объ¬ екте— осуществляется удаление всей информации о соответству¬ ющей ГФ. Замена данных. Операция замены некоторых данных q(ti) из ДБД, соответствующих моменту tu включает, как и для операции удаления, поиск необходимой ГФ и ее подфункции //, включающей момент U, по условию (3.3). Далее на основе fj генерируется зна¬ чение q(ti) и производится проверка неравенства 6= I ?(</) — q{tj) | < е0. (3.4) Если неравенство (3.4) соблюдено, а момент ti не является особой или фиксированной точкой, то при е<е/ никаких операций с ГФ не производится (при е>е/ значение е/ в подфункции fj заменяется на е). При условии, что момент ti — особая точка, она удаляется из множества особых точек подфункции fj. Если же ti — фиксированная точка, то в множестве фиксированных точек осуществляется замена старого значения на q(ti). Если неравенство (3.4) не соблюдено, а момент ti до сих пор не являлся особой точкой, производится включение значения q(ti) и ti в множество особых точек подфункции fj (если ti уже являлся особой точкой, то соответственно осуществляется замена старого значения на q{ti)). Если вся отведенная память для мно¬ жества особых точек подфункции fj занята, образуется новая под¬ функция ГФ с помощью модуля создания и корректировки ГФ (см. 4.3) на основе временного ряда из Qzs (Dn, t), включающая моменты от h до tlj+v При этом из подфункции fj удаляются все данные об этих моментах и осуществляется сдвиг всех предшест¬ вующих по времени подфункций ГФ.
Глава 4 ФУНКЦИОНИРОВАНИЕ ДИНАМИЧЕСКИХ БАЗ ДАННЫХ 4.1. СТРУКТУРА ДИНАМИЧЕСКИХ БАЗ ДАННЫХ. ОРГАНИЗАЦИЯ ДИНАМИЧЕСКИХ БАЗ ДАННЫХ НА ОСНОВЕ СУЩЕСТВУЮЩИХ СУБД Очевидно, что предлагаемый подход к хранению и исполь¬ зованию данных не противоречит концепциям существующих СУБД, хорошо вписывается в их архитектуру и не требует прин¬ ципиально новых решений по их развитию или необходимости разработки каких-либо особых СУБД для управления ДБД К При реализации ДБД на основе СУБД естественно используются все средства и функции систем, такие, как разметка информацион¬ ных баз, описание данных, их загрузка, выборка и контроль, ре¬ структуризация и реорганизация БД, ведение словаря данных или каталога БД, повторный запуск и восстановление и т. д. В общем случае ДБД должны включать в свой состав (рис. 4.1): множество ГФ {Q*} с заданной допустимой погрешностью отоб¬ ражения е0 (во>е/, /=1,Л4)2; информационный блок, содержащий данные в дискретном представлении, данные последних периодов (для анализа), а так¬ же данные о несоответствиях и изменениях в хранимой информа¬ ции (для последующего проведения работ службой администриро¬ вания ДБД); описательный блок, содержащий архивную и справочную ин¬ формацию, информацию о сроках и виде поступления данных, словарь данных (каталог ДБД), системный журнал и информа¬ цию о пользователях; операционный блок (подлежит обязательному включению в состав используемой СУБД), содержащий управляющий и функ¬ циональный модули, обслуживающие модули, модуль внесения нерегламентированных изменений в ГФ, модуль контроля, а так¬ же модуль создания и корректировки (МСК) ГФ. Более того, некоторые СУБД [24] поддерживают вычисляемые данные, задаваемые посредством процедур в теле модуля схемы (а не в спецификации схемы), т. е. позволяют обходиться в таких случаях без специальных модулей Для предварительной обработки данных перед их выборкой из ДБД. Другие «УоД, например СЕТЬ, предполагают наличие системных процедур сжатия и ^становления соответственно перед записью данных в БД и их выборкой для последующее использования. Следует отметить, что е и ео не обязательно константы. Они могут в слу- е не°бходимости (например, при учете фактора старения информации) уве- птЧ^Ва1ься’ пРичем е может быть различной в рамках одной ГФ при переходе подфункции к подфункции. 43
Прикладные программы IZH кет Польза батели ■о ДБД исходная ин<рорма иия N Адми^ нистра\ тор ДВД> МножестВо\0у J генерирующих функций Данные в дискретном предстадлении Данные послед них период од (для анализа) изменения, не¬ соответствия Архидная и справоч¬ ная информация Информация о сроках и Виде поступления данных На та лог ДБД Системный журнал Информация о пользователях Управляющий модуль Функциональный модуль ОВслужиВающие модули Модуль Внесения нерегламентироВанных изменений В Г ф Модуль контроля Несоответствия, изменения I ДБД' I "1 изменения ± Источ¬ ники инфор¬ мации ОН Вновь посту¬ пившая информация Рис. 4.1. Укрупненная схема создания и функционирования ДБД (МСК вы¬ делен из состава операционного блока для иллюстрации функционирования ДБД во времени) Множество ГФ {(2гт } и информационный блок. Представление в ДБД на уровне логического структурирования было описано ранее в 2.3 на примере иерархической модели данных (см. рис. 2.7). Эти два компонента являются, по сути, фактографической информационной моделью предметной области (с той разницей, что множество ГФ {Qss } — динамическая информационная модель), взаимно дополняющие друг друга. В процессе функционирования ДБД осуществляется обмен данными между ними, причем инфор¬ мационный блок является как бы начальным накопителем (бу¬ фером) данных перед их «поглощением» соответствующей ГФ. Описательный блок. Данные, содержащиеся в этом блоке, в первую очередь метаданные, способствуют эффективной работе ДБД. Организация и последующее функционирование блока осу¬ ществляется с помощью средств используемой СУБД или совмес¬ тимых с ней пакетов программ (например, обслуживающих сло¬ вари данных). Описательный блок обеспечивает выполнение сле¬ дующих функций: хранение и выдачу определений (описаний) информации; выдачу справочных сообщений о хранимой информации; 44
регистрацию и хранение статистических данных об использо¬ вании хранимой информации; контроль доступа к ДБД и обеспечение сохранности множест¬ ва ГФ и информационного блока; инициирование сбора очередной порции информации для хра¬ нения в ДБД и (или) выдачу рекомендаций пользователям об изменении периодичности сбора данных; хранение данных для контроля достоверности поступившей информации; хранение дублей множества ГФ и информационного блока с изменениями, происшедшими с момента дублирования. Операционный блок. Является дополнением к СУБД, обеспечш .вающим возможность работы с ДО-данными. Составляющие его модули имеют следующее назначение: управляющий модуль производит запуск, ведение и заверше¬ ние работы с ДБД путем передачи управления соответствующим модулям операционного блока; функциональный модуль осуществляет выполнение соответст¬ вующих ДО-операций над ДО-данными (см. 3.1) и вызов необхо¬ димых модулей СУБД для работы с данными, содержащимися в информационном блоке; обслуживающие модули используются для работы с данными, содержащимися в описательном блоке ДБД, за исключением кон¬ троля достоверности поступивших данных (в том числе осущест¬ вляют вызов необходимых модулей СУБД); модуль внесения нерегламентированных изменений в ГФ обес¬ печивает выполнение таких операций над ГФ, которые осущест¬ вляют переопределение ее подфункций (см. 5.2); модуль контроля кроме обязательного контроля на отклонение от существующей тенденции (случайный выброс1) осуществляет заданные виды контроля достоверности поступающей информации и производит запись соответствующих данных в подблок «Изме¬ нения, несоответствия» информационного блока (в том числе с вызовом необходимых модулей СУБД); МСК создает ГФ на основе исходного временного ряда Dny а также осуществляет ее адаптацию к происшедшим реальным из¬ менениям с последующей записью данных в ДБД средствами используемой СУБД. 4.2. ОСОБЕННОСТИ УПРАВЛЕНИЯ ДИНАМИЧЕСКИМИ БАЗАМИ ДАННЫХ Использование ДО-данных в БД АСПИУ вносит определен¬ ное своеобразие в процесс управления БД, видоизменяя некоторые операции. Это связано, в частности, с хранением не самих дис¬ кретных данных о предметной области, а ГФ, описывающих тен- чай 1 ^ЗК Указывалось ранее, случайные выбросы могут быть не только слу- трип° возникшими или ошибочными данными, но и свидетельством изменения нденции временного ряда. 45
денцию их изменения. Некоторым изменениям и дополнениям подвергаются следующие периодически применяемые операции управления БД: включение (обновление или вставка), выборка, замена, удаление, поиск (просмотр), объединение агрегатов (за¬ писей, наборов) из нескольких схем (баз) данных. Реализация ДБД в соответствии с представленной структурой (см. рис. 4.1) позволяет автоматизировать процесс управления БД, оставив за службой администрирования БД лишь функции внесения изменений в описательный блок, устранение несоответ¬ ствий, обнаруженных программами контроля или анализа кор¬ ректировок, поступивших от источников информации (для систем, не относящихся к классу систем управления в реальном времени). Включение (обновление или вставка). Специфика функциони¬ рования ДБД обусловливает разделение операции включения на обновление и вставку, поскольку важную роль играет положение временного дискрета, характеризующего включаемые данные, по отношению к временному ряду, отображенному в БД. Под обнов легшем понимается операция включения данных, которые харак¬ теризуются временным фактором, большим, чем tK последней по времени подфункции ГФ. Прочие случаи включения являются вставками. Очевидно, что обновление ГФ осуществляется при поступле¬ нии новых дискретных данных только в том случае, если эти дан ные не соответствуют по точности процессу, отображаемому пос ледней по времени подфункцией ГФ. При соответствии проведение операции включения данных в ДБД излишне. Поступление новых дискретных данных осуществляется в виде тройки d=<c, q, *р>, где с — описательная часть сообщения, содержащая ключевые параметры, необходимыми из которых являются код информаци¬ онного объекта (например, показателя) и код отображаемогс процесса предметной области; q — количественный атрибут инфор¬ мационного объекта в обусловленных единицах измерения и: t9 —временной фактор в обусловленных единицах измерения 0(fP =tK+At). Управляющий модуль операционного блока ДБД передает d в обработку модулям контроля в соответствии с за данными видами проверки поступившей информации d на досто¬ верность. Если данные не соответствуют требованиям достовер¬ ности, они записываются в информационный блок (подблок «Из¬ менения, несоответствия»), и, если заранее определено, выдается сообщение службе администрирования БД. Если данные удовлет¬ воряют требованиям достоверности, то d передается соответству ющему функциональному модулю, определяющему по ключевым параметрам, содержащимся в су нужную ГФ для выполнения необходимых операций (см. 3.3). Дискретные данные, поступающие для вставки в ДБД, анало^ гичны по структуре данным, предназначенным для обновления: d=<c, qy tр >. В отличие от операции обновления, если посту- 46
пившие данные не соответствуют по точности выбранной подфунк¬ ции ГФ, d передается в обработку МСК для необходимых опера¬ ций с ГФ — либо записи новой особой точки, либо (при соответст¬ вующих условиях) переопределения выбранной подфункции и смежной (смежных) с ней последующей (последующих) под¬ функции (подфункций) до полного «поглощения» дискретных данных в рамках допустимой погрешности отображения в0 (при этом возможно изменение ео от подфункции к подфункции ГФ), Выборка. Выборка данных из ДБД удобна для пользователя с точки зрения оперативности и унифицированности обращения к БД, хотя следует отметить, что унификация логической' структуры ДБД (см. рис. 2.7) уменьшает возможность нерегламентирован- ного запроса. Такое ограничение оправдано рядом факторов, ха¬ рактеризующих применение фактографических БД, в частности тем, что при статическом подходе к отображению данных для сквозного поиска и выборки большого объема одноименной ин¬ формации для ответа на запрос требуется обычно значительное количество машинных циклов или обращений. Выборка данных из ДБД осуществляется путем задания клю¬ чевых параметров с, характеризующих соответствующую ГФ, и значений временного фактора /, причем t может задаваться как в виде времени-момента tif i=l,n, так и в виде времени-периода Г/, /=1,7 (либо t]j, t*). Реализация выборки осуществляется по¬ средством необходимых ДО-операций (см. 3.1): S(t”, t]j)9. R(tp t*)f T(tlj, t*) и др., содержащих разнообразные комбинации арифметической и логической обработки ДО-данных. Запрос к ДБД формулируется в виде тройки d = <Чо, с, t)y где со — код ДО-операции, обеспечивающей требуемую выборку данных из ДБД; с — ключевые параметры, необходимыми из ко¬ торых являются код информационного объекта и код отображае¬ мого процесса предметной области; f —временной параметр в обусловленных (либо произвольных с дополнительным заданием) единицах измерения 0. Множество ДО-операций позволяет реализовать значительную часть операторов, содержащихся в традиционных языках мани¬ пулирования данными, включая выборку и объединение частей, ДБпРК^ С обРаботкой и ДР- Более того, отображение данных в позволяет в целях повышения эффективности управления Р ализовать принципы концентрации инормации по времени бла- ка^аря непосРедственному учету фактора времени и наличию см 6НДаря (В0ПР°сы концентрации данных на основе ДБД рас- дитпРеНЫ В 5’4^ ПеРед выполнением операции выборки прово- я соответствующий контроль данных, входящих в d. аналаМеНа’ ДискРетные Данные, поступающие на замену в ДБД, ниа 0гичны по структуре данным, предназначенным для включе- пмя-вставки: 47
d = <c> q, *>• После контроля (проверка данных q на соответствие ГФ не про¬ изводится) функциональный блок, обрабатывающий d, осущест¬ вляет операцию замены (см. 3.3). В случае нереализованности операции замены d записывается в подблок «Изменения, несоот ветствия» информационного блока для оповещения службы адми¬ нистрирования БД. Другим возможным вариантом в этом случае может быть последующая обработка d с помощью МСК в режиме включения-вставки. Удаление. Удаление данных из ДБД в значительной степени отличается от подобной операции в традиционных БД статичес¬ кого отображения, кроме удаления данных, характеризующих особые либо фиксированные точки. Суть в том, что при динамо ческом отображении сами дискретные значения отсутствуют, а удаление одного элемента из множества, характеризующего тен¬ денцию развития процесса, не влияет в целом на его отображение в ДБД. Подобная операция имеет место в случае, если удаляемое значение соответствует моменту /к либо входит в состав особых или фиксированных точек (например, в случае какой-либо ошиб¬ ки в значении дискретных данных q{tK)). Кроме того, может воз¬ никнуть необходимость удаления некоторых смежных по времена значений, в том числе, когда в течение определенного периода времени в ДБД поступали «деформированные» данные. Удаление данных из ДБД осуществляется заданием ключевых параметров с, характеризующих соответствующую ГФ, и значе¬ ний временного фактора t, который может быть задан как в ви¬ де времени-момента tt (/н<^-<^к), так и в виде времени-периода Th j=T77 d~<c, tu t2>9 где с — ключевые параметры (код информационного объекта и код отображенного процесса предметной области); t\ — момент либо (если ^2=^=0) начальный момент периода Г/, данные за кото¬ рый подлежат удалению (в соответствующих единицах измерения 0); t2 — конечный момент t* периода Г/. Обработка d на удале¬ ние данных из ДБД после соответствующего контроля осущест¬ вляется посредством МСК (см. 3.3). Поиск (просмотр). В ДБД эта операция во многом идентична операции выборки из БД, поскольку представляет собой последо¬ вательное многократное применение этой операции. Благодаря «интегрированию» дискретных данных в ГФ операция поиска (просмотра) в ДБД отличается от традиционной существенным повышением ее машинной эффективности (благодаря сокращению требуемого количества машинных циклов: новая выборка осуще¬ ствляется лишь в том случае, если временной фактор t выходит за границу интервала, отображенного рассматриваемой подфункци¬ ей ГФ). •48
Реализация поиска (просмотра) после нормального заверше¬ ния контроля осуществляется средствами используемой СУБД или ее программного окружения с заданием соответствующих ДО-операций: 6(<“, t«- t9)9 v(*«, *“), y)(^, ф q9), ц(*у, q9)t MA(t”, ^•к) и др. Задание на поиск (просмотр) формулируется в виде тройки d — ^» с» * где со — код операции ДО-алгебры, обеспечивающей реализацию поиска в ДБД; с — ключевые параметры данных, необходимых к просмотру (может быть задано множество данных, подлежащих просмотру); t — временной фактор, характеризующий период вре- мени, подлежащий просмотру, в обусловленных (либо произволь¬ ных с дополнительным заданием) единицах измерения 0. Объединение агрегатов (записей, наборов) из нескольких схем (баз) данных. В некоторых ЯМД предусмотрены средства объеди¬ нения фрагментов нескольких исходных схем (баз) данных в од¬ ну, способствующую наиболее эффективному решению возникшей задачи. По сути, это означает сборку необходимых данных, соот¬ ветствующих одному моменту или периоду времени, для их пос¬ ледующего хранения и использования. В ДБД реализация подоб¬ ных операций производится на уровне прикладных программ, использующих необходимые ДО-операции с заданием одинаково¬ го временного фактора t в {d} выборки данных. 4.3. ЛИНГВИСТИЧЕСКИЕ, АЛГОРИТМИЧЕСКИЕ И ПРОГРАММНЫЕ АСПЕКТЫ РЕАЛИЗАЦИИ ДИНАМИЧЕСКИХ БАЗ ДАННЫХ НА ОСНОВЕ СУЩЕСТВУЮЩИХ СУБД Динамические БД могут быть организованы в рамках лю¬ бой СУБД, ориентированной на работу с фактографическими дан¬ ными. Однако процесс встраивания ДБД требует решения опре¬ деленных вопросов ее интерфейса с СУБД. Эти вопросы обуслов¬ лены как расширением функциональных возможностей таких баз, так и определенным изменением технологии обработки данных в связи с переходом от статического отображения информации к динамическому. Кроме того, на начальном этапе создания какой- либо АСПИУ на основе ДБД, а не встраивания ее в уже сущест¬ вующую систему с принятыми в ней общесистемными средствами возникает вопрос о выборе конкретной СУБД для управления ДБД. В настоящем разделе рассматриваются общие вопросы ин¬ терфейса ДБД с применяемой СУБД. Динамическая БД является базой с детерминированной схе- Мои, поэтому она ориентирована на предварительную фиксиро¬ ванную классификацию объектов (процессов) предметной области, точное определение их свойств и отношений. Это обусловливает ^определенный формализм языков описания данных (ЯОД) и 3Ь1Ков манипулирования данными (ЯМД) на основе ДО-опера- 4-Н5б 4Q
ций. Язык описания данных предполагает задание пространства данных для отображения предметной области в виде информаци¬ онной модели (а при использовании ГФ динамической информа¬ ционной модели), установление семантических правил, ограничи¬ вающих множество допустимых состояний БД, а также правил, определяющих развитие ДБД во времени. В общем случае ЯОД для ДБД в значительной степени упрощается благодаря унифи¬ кации структуры хранимых данных, поскольку этап описания частей БД, необходимых для конкретных приложений, оказыва¬ ется ненужныым, а программирование задач или описание запро сов — стандартным (кроме того, отпадает необходимость запоми¬ нания области размещения однородных данных, разнесенных по времени). Языки манипулирования данными, обеспечивающие идентификацию данных, изменение состояния ДБД и выборку данных из нее для приложений, также унифицируются за счет включения в их состав модулей, реализующих ДО-операции. Важ¬ ным дополнительным свойством ЯМД в этом случае становится возможность управления БД с учетом конкретного текущего мо¬ мента или требуемого периода времени. Таким образом, в случае создания ДБД для СУБД с базовым языком осуществляется «приближение» используемой СУБД к классу систем с непроце¬ дурными языками-заданиями [18], а для систем с непроцедурными языками — «повышение» их уровня К Организация ДБД с использованием какой-либо из сущест¬ вующих СУБД требует включения в ее состав определенных бло¬ ков и модулей, обеспечивающих возможность работы СУБД с ДО-данными. В состав модулей, подлежащих обязательному под¬ ключению к программным средствам СУБД, входят: функцио¬ нальный блок (реализующий выполнение ДО-операций), МСК> модуль внесения нерегламентированных изменений в ГФ, модуль контроля на отклонение от существующей тенденции. Расчетные соотношения и общее описание алгоритмов модулей функцио¬ нального блока представлены ниже на основе ДО-операций2, введенных в 3.1. и базируются на использовании сплайн-аппроксимации, 5 = 0 (все ДО-операции осуществляются с учетом особых и фиксированных точек, если нет указания по их игнорированию). р V3: V (ti) = f| kp — коэффициенты ГФ; Р — количество коэф- р— 1 1 СУБД с базовым языком предполагает задание пользователем последова¬ тельности действий, определяющих процесс получения необходимой информация из БД. Для СУБД с непроцедурными языками-заданиями характерно заполне¬ ние необходимых параметров выборки в виде таблиц либо ответов на зада¬ ваемые системой вопросы. 2 Справочник ДО-операций, отличных от приведенных ниже, для ГФ с 5=7^0 (см. табл. 3.1) дан в приложении 4. 3 Полужирным шрифтом выделено наименование подпрограммы. 50
фициентов в подфункции (Р равняется порядку сплайна, увеличенному на единицу); /к i р S:S (ф Ф = 2 П kpt\P-'\ где tr = [t'l ф; = t” + n'At; n' - 'p='(HP=1 количество дискретных значений, содержащихся в интервале [^, /£] (при соответствующей единице измерения времени 0); |*/?(<?, ф = П М^-1 - П М Д"-1; р=1 р=1 Т:^», *р = Д(*у, t*)/V(t»y, PRVI: /(f“, ф = ^ (протяженность временного интервала [^, вычисляется в установленных единицах измерения времени 0); TV:Г(t{, tKc) = T(tl <?)//(<?,<?); С:С(*р *?) = $(*?, *р/л'; ц- /р = 27^?. *к,); £=1 DI:D/(/f. *2Н, Ц) = /(<», f*)//(*J, ф; UI:£//(^, C) = I(tу, фС; (1, «<<.<«, Е:$ (ft, Лк; <р) = | * ' ' jo, (*,<fpv &>*!): NU:v(*», <*) = *» + RANDOM-/ (*», <*), где RANDOM — случайное число, равномерно распределенное на интервале [0,1]; \V{tX Ц, FI:<p(«, tK.; tf) = \ 1 1 lo. (<,<*?) v(*P>4); ETAiti(t", t*; ^)=(1, *?])’ VV*)=<l?±eс (О в противном случае; MU:p. *7p) z= tfp. Алгоритм определения t (возможно применение метода половинного де¬ ления) 1. tv = t'l +Д£, где tv — вспомогательная переменная. 2. *S(£f , ^)><7р: если да, то fp = и идти к п. 5, если нет, то к п. 3. 3. 4. если да, то t = /£ + / и идти к п. 5; если нет, то к п. 2. 4* 51
5. Выход. PI: * (tt) = V (P — p + 1) kfi-p+itp~P; P + 1 MA: MA (t", t*) = V (tp). Алгоритм определения /J; 1. tv — i “,Q = 10~8, где tvy Q — вспомогательные переменные; 2. V(tv)>Q (где V—ДО-операция): если да, то Q=V(tv), /р = t°y идти к п. 3; если нет, то к п. 3. 3. tv = tv + А/. 4. tv^>tlj: если да, то идти к п. 5; если нет, то к п. 2. 5. Выход. MI: АГ/(*», l/(g. Алгоритм определения 1. = f" Q = 108, где tv, Q — вспомогательные переменные; 2. E(^)<Q: если да, то Q=V(tv), tj = tvy идти к п. 3; если нет, то к п. 3, 3. tv = tv-\-At. 4. tv>tjf: если да, то идти к п. 5; если нет, идти к п. 2. 5. Выход. Модуль создания и корректировки ГФ наиболее сложный, обес¬ печивающий функционирование ДБД. Одна часть про-грамм моду¬ ля создает ГФ на основе исходных временных рядов и заданных параметров отображения с использованием сплайн-аппроксима ции. Алгоритмы этих программ2 приведены в приложении 2. Дру¬ гая часть программ МСК обеспечивает адаптацию ДБД к проис¬ шедшим реальным изменениям. OBNOV (подпрограмма обновления ГФ) 1. Вызов подпрограммы контроля на отклонение от существующей тенден ции COST, 2. Есть ли флажок «несоответствие»: если да, то идти к п. 3; если нет, то к п. 10. 3. Есть ли место в разделе особых точек: если да, то идти к п. 4; если нет, то к п. 7. 4. Запись тройки d в раздел особых точек. 5. «' = «' + 1. 6. (пг > — 1)д(я>20), где N^ —количество смежных последних по времени отображения особых точек, необходимое для создания новой подфунк ции, N^—6: если да, закрыть последнюю по времени подфункцию, формиро- 1 В определенных случаях (например, при использовании для аппроксима ции только сплайн-функций) возможно использование более эффективных алго¬ ритмов поиска £р. 2 Алгоритмы сплайн-аппроксимации разработаны в Львовском физико-меха¬ ническом институте АН УССР [40]. 52
вать временной ряд из смежных особых точек, установить п' в нуль, идти к п. 8; если нет, идти к п. 10. 7. Вызов соответствующей подпрограммы создания новой подфункции ГФ; идти к п. 4. 8. Вызов подпрограммы создания подфункции МСК и соответствующей под¬ программы создания ГФ. 9. Запись полученного значения етах, п=6, идти к п. И. 10. п=п+1. 11. Выход. VSTAV (подпрограмма вставки в ГФ) 1. Поиск требуемой j-й подфункции ГФ в соответствии с заданным вре¬ менным параметром. 2. Вызов подпрограммы COST. 3. Есть ли флажок «несоответствие»: если да, идти к п. 4; если нет, идти к п. 9. 4. Есть ли место в разделе особых точек: если да, идти к п. 8; если нет, идти к п. 5. 5. Выборка последней по времени tj особой точки, запись поступившей на вставку тройки d в раздел особых точек. 6. Генерирование временного ряда D* == у + 1 [q {t)} на интервале [tj, *y+i] с п, где п — количество элементов сгенерированного временного ряда (генериро¬ вание ряда D ~ осуществляется с учетом особых и фиксированных точек, если нет указания по их игнорированию). 7. Вызов подпрограммы NERIGF; идти к п. 10. 8. Запись d в раздел особых точек. 9. п = п+1. 10. Выход. 'VYBOR (подпрограмма выборки из ДБД) 1. Задана ли единица измерения 0 временного фактора в тройке запроса d: если да, идти к п. 2; если нет, идти к п. 3. 2. 0 = 0, где 0 — единица измерения временного фактора в тройке запроса; 9 то же в ГФ: если да, идти к п. 3; если нет, вызов подпрограммы CALEND1 с преобразованием временного фактора к единице измерения 0 и идти к п. 3. 3. Поиск требуемой подфункции ГФ в соответствии с заданным временным фактором t. 4. Вызов по коду со подпрограммы, выполняющей соответствующую ДО- °перацию. 3. Выход. ZAMENA (подпрограмма замены в ДБД) Е Поиск требуемой подфункции ГФ в соответствии с заданным временным Фактором t. обр ^°ДпР°грамма CALEND, осуществляет согласование и необходимые пре¬ нии ^0вания ЁФ или поступивших данных при несоответствии (изменении) еди- измерения временного фактора (см. приложение 1). 53
2. Есть ли точка с заданным t в разделе особых или фиксированных точек: если да, идти к п. 4, если нет, идти к п. 3. 3. Вызов подпрограммы VSTAV; идти к п. 7. 4. Вызов подпрограммы COST. 5. Если ли флажок «несоответствие»: если да, идти к п. 6, если нет, уда¬ лить особую или фиксированную точку с заданным t и идти к п. 7. 6. Запись тройки замены d в раздел особых или фиксированных точек вместо ранее хранимых данных с t. 7. Выход. 'UDAL (подпрограмма удаления из ДБД) 1. Поиск требуемой подфункции ГФ в соответствии с заданным временным фактором t\ (при t2 = 0, t\—точка, подлежащая удалению), где tu ^ — грани¬ цы временного интервала, данные за которой подлежат удалению. 2. t2 = 0: если да, идти к п. 3; если нет, то к п. 5. 3. Есть ли точка заданным t\ в разделе особых или фиксированных точек: если да, идти к п. 4; если нет, то к п. 6. 4. Удаление особой или фиксированной точки с заданным t\\ идти к п. 6. 5. Удаление особых и фиксированных точек на временном интервале [tu t2]- 6. Выход. SOZDPF (подпрограмма обеспечивает открытие новой у-й подфункции ГФ) 1. Установление вида s ГФ по предшествующей подфункции fj-i (если нет другого указания либо не задан автоматический выбор s в процессе создания ГФ). 2. п = 0. 3. Установление t* по первому временному интервалу, поступающему на отображение в у-ю подфункцию ГФ. 4. Установление допустимой погрешности аппроксимации е0 по предшеству¬ ющей (у—1)-й подфункции ГФ (если нет другого указания по ее установле¬ нию). 5. Выход. Модуль внесения нерегламентированных изменений в ГФ осу¬ ществляет реорганизацию ГФ, обусловливающую переопределение одной или нескольких ее подфункций, не являющихся последними по времени (подпрограмма NERIGF): 1. 6 = 0, где 6— переменная цикла, 6=0, п. 2. 6=6+1. 3.6>п: если да, т0 удаление (у + 1)-й подфункции ГФ, идти к п. 12; если нет, то к п. 4. 4# q=qk, где q — вспомогательная переменная; qk — 6-й элемент времен ного ряда D ~ . 5. Вызов подпрограммы COST. 6. Есть флажок «несоответствие»: если да, идти к п. 7; если нет, то к п. 2. 7. t"+x = t(qh). 8. Вызов соответствующей подпрограммы МСК: образование ГФ из вре¬ менного ряда D~ ^на интервале Г“+1» + 54
9. Все ли п—k точек «поглощены» (/+1)-й подфункцией ГФ: если да, «дти к п. 12; если нет, то к п. 10. 10. у=У+1; й=о. И. Генерирование временного ряда D ~={q(t)} с количеством элементов п П на интервале [**, (осуществляется с учетом особых и фиксированных точек); идти к п. 2. 12. Выход. Модуль контроля на отклонение от существующей тенденции является часто вызываемой подпрограммой, используемой прежде всего при обновлении ДБД и определяющей необходимость после¬ дующих операций с ГФ (подпрограмма COST): 1. Q = V(t), где V—ДО-операция; Q — вспомогательная переменная. 2. c=\Q—q\l(&(t), где с — вспомогательная переменная; q—количест¬ венный атрибут информационного объекта (например, показателя) в обуслов¬ ленных единицах измерения; со (0—вес погрешности аппроксимации в момент /, со (0 >0. 3. с<е0: если да, идти к п. 4; если нет, установить флажок «несоответст¬ вие» и идти к п. 6. 4. с<е: если да, идти к п. 6; если нет, то к п. 5. 5. е = с. 6. Выход. Глава 5 ТЕХНОЛОГИЧЕСКИЕ АСПЕКТЫ СОЗДАНИЯ И ИСПОЛЬЗОВАНИЯ ДИНАМИЧЕСКИХ БАЗ ДАННЫХ 5.1. ФОРМИРОВАНИЕ ДИНАМИЧЕСКИХ БАЗ ДАННЫХ Формирование ДБД предполагает проведение следующих работ: сбора и подготовки исходных данных, подлежащих хранению в ДБД (в случае перехода от статического отображения к динами¬ ческому необходимость в проведении таких работ фактически от¬ падает) ; инициализации ДБД; подготовки обеспечивающих средств ДБД; ввода исходных данных. Сбор и подготовка исходных данных, подлежащих хранению в ДБД. В состав обязательных работ этого этапа формирования ДБД входят: установление и, если необходимо, согласование с источником Дискретных данных нормативно-справочной информации1 (коды 1 Естественно, что при переходе от статического отображения данных к Динамическому по ранее установленным кодам необходимости в проведении таких работ нет. 55
информационных объектов, подлежащих хранению; коды объек¬ тов или процессов предметной области; единицы измерения количественного атрибута к и временного фактора 0; коды пользо¬ вателей и методов защиты данных от несанкционированного доступа; порядок р либо вид s ГФ); предварительная оценка периода отображения по каждому из видов информационных объектов, подлежащих хранению, и ори¬ ентировочной периодичности поступления дискретных данных, а также (если существуют данные о прошедшем временном перио¬ де) — начальной точки отображения tK\ установление допустимой погрешности отображения е0 по каж¬ дому из видов отображаемых информационных объектов; непосредственный сбор ретроспективных данных и подготовка их к вводу в БД Г В качестве источников кодирования информационных объектов (например, показателей) и кодов объектов (процессов) могут быть использованы как общесистемные классификаторы и спра¬ вочники, так и вновь разработанные с учетом приложения. В част¬ ности, для экономических систем возможно применение общесоюз¬ ных классификаторов, таких, как общесоюзный классификатор предприятий и организаций (ОКПО), общесоюзный классифика¬ тор отраслей народного хозяйства (ОКОНХ), общесоюзный клас¬ сификатор технико-экономических и социальных показателей (ОКТЭСП), высшие классификационные группы общесоюзного классификатора продукции (ВКГ ОКП), и др. Кодирование еди¬ ниц измерения временного фактора 0 может осуществляться в со¬ ответствии с общесоюзным классификатором СОЕВС (Система обозначений единиц величин и счета, используемых в автомати¬ зированных системах управления народным хозяйством для обра¬ ботки технико-экономической информации — см. приложение 1.) Кодирование показателей и установление требуемого вида s и порядка р ГФ (при сплайн-аппроксимации) может осуществляться автоматически либо исходя из требований и ограничений конкрет¬ ной АСПИУ. Указание предварительной оценки периода отображения (коли¬ чества элементов временного ряда, подлежащих хранению в ДБД) по каждому из видов информационных объектов, необходимое для более рационального использования памяти, не является обяза¬ тельным. Период отображения устанавливается МСК по умолча¬ нию в зависимости от 0: Т — nkt, Т= | 1,2(369 -Ae) I , где ko —код измерения временного фактора, установленный по СОЕВС. 1 Если данные прошлых периодов не предполагаются к загрузке в ДБД. т. е. отображение предметной области будет производиться с текущего момента /тек, сбор данных, естественно, не осуществляется. 56
Вопросы установления требуемой погрешности отображение рассмотрены в 2.2. По умолчанию устанавливается относительная погрешность отображения ео=0,05. Сбор ретроспективных данных, подлежащих вводу в ДБД, со¬ стоит в фиксации с обусловленного момента tH до tTeK временного ряда Dn, представленного в виде множества пар чисел: Dn — {{(Jit ti)}, i— 1, ti, где cji — количественный атрибут информационного объекта в обусловленных единицах измерения; ti — временной фактор, ха¬ рактеризующий момент фиксации атрибута в обусловленных еди¬ ницах измерения; п — общее количество пар (qif ti), зафиксиро¬ ванное за период [/н, /тек] через определенные (возможно, и не¬ равные) промежутки времени. Подготовка данных к вводу в БД состоит в кодировании каж¬ дого из временных рядов с помощью обусловленной нормативно¬ справочной информации (код информационного объекта, код объекта или процесса предметной области) с учетом установлен¬ ных единиц измерения количественного атрибута к и временного фактора 0, а также переносе на соответствующий машинный носи¬ тель либо при непосредственном вводе в ЭВМ. Инициализация ДБД. Осуществляется в полном соответствии с работами, проводимыми на этом этапе формирования для БД статического отображения, и требованиями применяемой СУБД. Подготовка обеспечивающих средств ДБД. Это загрузка дан¬ ных, обусловливающих работоспособность всех блоков и моду¬ лей базы, в первую очередь описательного и информационного блоков (см. рис. 4.1). В частности, в описательный блок должны быть введены данные о кодах пользователей и (если необходимо) алгоритмах обнаружения несанкционированного доступа, виде и порядке используемых ГФ (по умолчанию используются кубиче¬ ские сплайн-функции), а также информация о периодичности по¬ ступления дискретных данных и общем интервале отображения (если необходимо), допустимой погрешности отображения и зако¬ номерности ее изменения во времени. В свою очередь, операцион¬ ный блок должен содержать все необходимые программные мо¬ дули и информацию, требуемую для их работы (например, для модуля контроля информацию, обусловливающую проверку по¬ ступающих дискретных данных на достоверность). Ввод исходных данных. Осуществляется средствами использу¬ емой СУБД или ее программного окружения, если имеются ретро¬ спективные данные, характеризующие тот или иной объект (про¬ цесс) предметной области. При вводе используется модуль контро¬ ля и МСК, входящие в состав операционного блока ДБД. В про¬ цессе ввода происходит образование ГФ и их подфункций (см. приложение 2), определение и запись метаданных, заполнение соответствующих разделов информационного блока данными об особых и фиксированных точках (после завершения ввода выдает¬ ся информация обо всех особых точках для службы администри- 57"
рования БД в целях устранения возможных ошибок в исходных ретроспективных данных). Естественно, этап ввода не является обязательным. В этом случае данные, поступающие в ДБД, пер- воначально воспринимаются как особые точки. Это происходит до тех пор, пока их количество не позволит МСК создать на их основе первую подфункцию ГФ (после образования подфункции ГФ соответствующие особые точки уничтожаются). 5.2. РЕОРГАНИЗАЦИЯ ДИНАМИЧЕСКИХ БАЗ ДАННЫХ Традиционным фактографическим БД свойственна периоди ческая реорганизация для обеспечения приемлемых эксплуатаци¬ онных характеристик [1, 53]. Как правило, реорганизация обуслов лена какими-либо изменениями на физическом или логическом уровне БД, а также прогрессирующим ухудшением использования памяти и увеличением времени выборки (например, из-за удале¬ ние записей, запоминания включенных записей не в логической последовательности и т. п.). Динамические БД в значительно меньшей степени подвержены влиянию таких факторов, однако вопросы реорганизации имеют и для них существенное значение. Основными причинами реорганизации ДБД являются: старение данных (если задана закономерность изменения до пустимой погрешности отображения е0 с течением времени) изменение периода отображения |YH, tK\y а также выход опре¬ деленных подфункций ГФ за границу требуемого периода ото бражения; изменения ГФ (порядка аппроксимирующих сплайнов, вида погрешности отображения, изменения памяти, отводимой под осо¬ бые и фиксированные точки, и т. д.); корректировка динамической модели предметной области; повышенный темп включений и удалений, приводящий к пере¬ грузке информационного блока (например, области особых то¬ чек) ; изменения на логическом и физическом уровнях БД и проце¬ дурные изменения (изменения, свойственные БД статического отображения информации). Реорганизация при учете фактора старения данных. При учете фактора старения данных в ДБД для некоторой /-й подфункции ГФ с допустимой погрешностью отображения е(о,g) = F(ео, t\ t™, t”+1), g= 1, G, -(где F — функция, задающая старение данных, — ступенчатая функция, обусловливающая зависимость допустимой погрешности отображения ео ГФ от временного периода, прошедшего с момен¬ та /н; е q —начальная допустимая погрешность отображения ГФ, свойственная последней по времени отображения подфункции; G — общее количество видов-«ступеней», которые проходит до¬ пустимая погрешность отображения ГФ в процессе старения дан- .58
ных на интервале [tH, ^к]) возникает ситуация, когда требуется осуществить переход от к е^+1). В этом случае с помощью МСК осуществляется реорганизация указанной подфункции ГФ следующим образом: генерируется временной ряд у{<7(^)}, tj < tt < tKj\ если /-я подфункция не первая по времени отображения, по¬ следовательно для каждого элемента ряда j{q(tD} осуществляет¬ ся вставка-обновление в предшествующую по времени подфунк¬ цию ГФ, причем при проверке данных на соответствие Q—1)-й подфункции ГФ в качестве допустимой погрешности отображения используется значение г0 = — е^: это же значение исполь¬ зуется и при преобразовании /-й подфункции, если она является первой либо необходимо ее новое образование по условиям встав¬ ки в (/—1)-ю подфункцию, хотя впоследствии в качестве в0 ука¬ зывается значение s^'g+1); осуществляется перезапись всех необходимых элементов стру¬ ктуры ГФ, а в случае поглощения всех элементов ряда j{q{tt)} (/—1)-й подфункцией — удаление записи (набора), отведенной ранее для /-й подфункции ГФ. Реорганизация при изменении периода отображения. В случае уменьшения периода отображения осуществляется поиск подле¬ жащих удалению /-х подфункций ГФ начиная с tn до тех пор, пока не будет выполнено условие */+1 > где /н — новое значение начала периода отображения ГФ1. При подвижных границах периода отображения, когда tK всегда при¬ равнивается tTeK, a tn определяется как tH = tK — т (где т — протяженность временного периода, в течение которого необходимо обеспечивать отображение предметной области в ДБД), возникает необходимость контроля выхода какой-либо под¬ функции за пределы периода отображения ГФ JYH, tK]. В этом слу¬ чаем осуществляется контроль t\ второй по времени отображения подфункции ГФ. При достижении условия /Н<С^ первая по вре¬ мени отображения подфункция ГФ оказывается за границей не¬ обходимого периода отображения ГФ, что влечет за собой удале¬ ние записи (набора), отведенной для первой по времени под¬ функции ГФ. Реорганизация при изменениях ГФ. В некоторых случаях воз¬ никает необходимость изменений определенных параметров ГФ, таких, как s, р, х, 0, ео, вида погрешности отображения (абсолют¬ 1 Здесь и далее в настоящем разделе некоторая величина, обозначаемая, например, как tn, представляет собой новую величину, используемую вместо прежней tн. 59
ной, относительной), памяти, предназначенной для хранения осо бых и фиксированных точек. Как правило, следует избегать изменения вида 5 и порядке подфункций, составляющих ГФ, поскольку их переорганизация на основе (q{ti)} при сохранении значения в0 во избежание по грешности е, превышающей ео, должна проводиться при условия 8 = 8о—е~0, что может оказаться неэффективным с точки зрения требуемой памяти. Лучшим решением в этом случае является задание МСК нового значения 5 или р, после чего новая (послед няя по времени отображения) подфункция ГФ будет образована новой функцией вида 5 или сплайном порядка р, а предыдущие подфункции сохранят прежние 5 или р. То же самое можно ска зать об изменении вида погрешности отображения, поскольку i некоторых случаях (например, когда воткуИА(^, ^)>£обс, при переходе от относительной погрешности отображения к абсолют ной) условия реорганизации сходны с описанными выше. Реорганизация, вызванная изменением единиц измерения х и 0, осуществляется соответствующей корректировкой коэффи циентов ГФ k\ {Dn), km{Dn): kj — ktf (х/х) ЛИОО kj — kft (0/0), где cp — функция изменения коэффициентов ГФ, определяемая со¬ отношением прежних и новых единиц измерения. Реорганизация ГФ, вызванная изменением е0, осуществляется при 8о>'80 методом, используемым при учете фактора старения данных, а при 8о<во организацией новой последней по времени отображения подфункции с новым значением ео. Реорганизация области памяти, предназначенной для хране¬ ния особых и фиксированных точек, осуществляется внесением изменений в соответствующую программу МСК, которая при об¬ разовании новой подфункции ГФ выделит область памяти, исходя из вновь установленных параметров логической структуры ДБД. Реорганизация, вызванная корректировкой динамической мо¬ дели предметной области. В случае изменений в инфологической модели предметной области соответствующие изменения вносятся в динамическую модель предметной области, хранимую в ДБД. Как правило, такая реоганизация связана с вводом новых ГФ ли¬ бо исключением избыточных ГФ и осуществляется, как и все про¬ чие^ указанные виды реорганизации ДБД, средствами используе¬ мой СУБД или ее программного окружения. 5.3. ДУБЛИРОВАНИЕ И ВОССТАНОВЛЕНИЕ ИНФОРМАЦИИ В ДИНАМИЧЕСКИХ БАЗАХ ДАННЫХ. БЕЗОПАСНОСТЬ И ЦЕЛОСТНОСТЬ БАЗ ДАННЫХ. КОНТРОЛЬ ДОСТОВЕРНОСТИ Дублирование и восстановление информации в ДБД. Исполь¬ зуются для обеспечения живучести ДБД в процессе функциони¬ рования и позволяют возвращать БД к состоянию, предшество- 60
вавшему возникновению отказа. Реализация процессов дублиро¬ вания и восстановления осуществляется средствами используемой СУБД. Дублирование обеспечивается как фиксацией изменений, проводимых в ДБД, в системном журнале (за исключением опе¬ рации обновления, поскольку ДБД благодаря контролю на «со¬ ответствие тенденции» гарантированы от разрушений, вызванных записью вновь поступивших некорректных дискретных данных), так и снятием копий в обусловленные моменты времени, напри¬ мер, при организации новой подфункции ГФ либо по указанию администратора БД. Количество хранимых дублей и их поколений зависит от функционального назначения АСПИУ, однако в связи с эффектом сжатия данных при их динамическом отображении количество дублей может быть увеличено. Кроме того, учитывая эффект сжатия при организации ДБД в рамках АСПИУ опера¬ тивного характера, возможным вариантом является параллельное функционирование двух или нескольких однородных ДБД (горя¬ чее резервирование) с проведением реорганизации, восстановле¬ ния либо других работ с одной из ДБД без «остановки» другой (других) параллельно работающей (работающих) ДБД. Впослед¬ ствии при вводе в действие «остановленной» ДБД осуществляет¬ ся ее актуализация «вдогонку» на основе системного журнала и каталога (словаря данных) действовавшей ДБД. Восстановление ДБД может осуществляться как целиком, так и по конкретным информационным объектам либо отображаемым процессам предметной области. Следует отметить, что в ДБД восстановление осуществляется быстрее, чем в БД статического отображения информации, благодаря эффекту сжатия данных, особенно при использовании механизма особых точек (если он реализован в используемой СУБД). Естественным требованием при автоматизации процесса администрирования ДБД является автоматизация процедур дублирования и восстановления ДБД; для ДБД, функционирующих в режиме реального времени это требование является обязательным. Среди возможных методов реализации дублирования в этом случае могут быть использованы [20] прямой метод исходной вер¬ сии, противоположный метод исходной версии, метод конечной версии, методы промежуточной версии. Все эти методы предпо¬ лагают осуществление автоматического дублирования множества ГФ {Q‘> и информационного блока ДБД совместно с функциони¬ рованием базы для соответствующего приложения, т. е. при дуб¬ лировании не производится блокировка процессора программой Дублирования, входящей в состав обслуживающего модуля (см. Рис. 4.1). Методы исходной версии рассчитаны на фиксацию той версии ДБД, которая существовала в начале дублирования (при этом противоположный метод исходной версии исключает вторичное копирование той или иной ГФ в процессе дублирования благодаря ведению специальной таблицы контроля). Метод конечной версии предусматривает создание копии ДБД по состоянию на момент 61
завершения дублирования. Методы промежуточной версии соче¬ тают методы исходной и конечной версий, т. е. являются гибрид¬ ными. Выбор метода дублирования зависит от конкретного прило¬ жения, прежде всего от объемов хранимых данных и частоты обращения к ДБД [57]. Следует отметить, что программа дубли¬ рования игнорирует изменения, осуществляемые процессором с ДБД, которые не завершились к моменту окончания дублирова¬ ния. Дублированию подлежат лишь последние по времени ото¬ бражения подфункции ГФ {Q£s }, скорректированные составляю¬ щие описательного и операционного блока ДБД, а также под¬ функции ГФ, в которые вносились изменения по методу включе¬ ния-вставки. Естественно, соответствие между программой дублирования и другими программами, реализующими такие функции ДБД, как управление одновременностью выполнения процессов, ведение системного журнала и каталога ДБД, координация обраще¬ ний к модулям операционного и описательного блоков, реа¬ лизуется управляющим модулем, входящим в состав применя¬ емой СУБД. Безопасность БД. Характеризует, как правило, способность БД к защите при попытке испортить хранимые в ней данные ли¬ бо воспользоваться без санкции на доступ. Безопасность ДБД обеспечивается средствами используемой СУБД в зависимости от типа АСПИУ и ее «внешней среды». Безопасность конкретной ДБД должна обеспечиваться системными решениями на стадии проектирования, включающими установление источников опас¬ ности, анализ риска по каждому из них, установление оценок по критерию «риск — затраты на защиту», разработку методов конт¬ роля доступа (включая физические и логические барьеры несанк¬ ционированному доступу, проверку деятельности пользователей), установление технологических процессов восстановления ДБД. Для обеспечения безопасности в логической структуре ДБД пре¬ дусмотрен ключевой параметр «код пользователя» (см. рис. 2.7). Целостность БД. Обычно трактуется как способность к нор¬ мальному функционированию всех ее составляющих, обеспечива¬ ется решением следующих вопросов: правильностью работы БД при обращении к ней пользователей в рамках операций регулярного управления базой; отсутствием нарушений БД при параллельной обработке дан¬ ных; способностью БД к восстановлению после сбоев в работе или ее «остановки» по другим причинам. Целостность ДБД по первому из указанных вопросов обеспе¬ чивается контролем на случайный выброс, развитыми средствами логического контроля, наличием раздела особых точек, цикличес¬ кой технологией реализации изменений и устранения несоответ¬ ствий. Целостность при параллельной обработке данных обеспе¬ чивается применением средств блокировки, входящих в состаЕ 62
используемой СУБД. Восстановление после сбоя осуществляется: также средствами используемой СУБД, однако в отличие от тра¬ диционного подхода к БД оно проще и быстрее: чем больше ксж для соответствующей ГФ и ее подфункций, тем быстрее обеспечи¬ вается работоспособность ДБД. Необходимые данные для восста¬ новления содержатся в соответствующих копиях, системном жур¬ нале и каталоге (словаре данных) ДБД. Контроль достоверности поступивших данных. Это важный фактор обеспечения целостности БД и технологичности ее функ¬ ционирования. В ДБД предусмотрены следующие виды контроля: структурный и форматный, на правильность кодирования, логический. Структурный и форматный контроль включает проверку: вида обработки из множества проводимых операций манипулирования ДБД; наличия всех необходимых элементов в обрабатываемых № допустимости и соответствия заданным форматам каждого элемента обрабатываемых {d}\ порядка следования элементов в обрабатываемых {d}. Контроль правильности кодирования предполагает: проверку кодов на допустимость и наличие подобных в ДБД («новые» коды передаются для анализа службе администрирова¬ ния ДБД оперативно либо через раздел информационного блока «Изменения, несоответствия»); анализ соответствия временного фактора t периоду отображе¬ ния в ДБД и реальному времени; проверку соответствия заданной ДО-операции множеству до¬ пустимых ДО-операций (если предполагается выполнение какой- либо операции). Логический контроль осуществляет проверку на: соответствие поступивших данных ретроспективной тенденции их изменения (контроль на случайный выброс или изменение за¬ кономерности отображаемого процесса); соответствие допустимым границам диапазона изменений коли¬ чественного атрибута q\ необходимость вызова программы «Календарь» (в случае не¬ соответствия единиц измерения временного фактора ранее обус¬ ловленным единицам 0); принадлежность поступивших данных фиксированным или осо¬ бым точкам; соответствие d заданным соотношениям, в том числе соотно¬ шением атрибутов q и t\ соответствие данных контрольной сумме, если таковая преду¬ смотрена (например, контроль по modll). 63
5.4. КОНЦЕНТРАЦИЯ ИНФОРМАЦИИ Технология использования ДБД предусматривает возмож¬ ность концентрации информации. Концентрация направлена на обеспечение выбора наиболее существенных (агрегированных, ана литических, отличных от тенденции и др.) данных для управле ния или дальнейшей обработки посредством их содержательного обобщения (возможно, с потерей части исходных данных). К чис¬ лу возможных методов концентрации данных можно отнести: выборку; «пороговый» метод (иерархия отклонений от запланированно го процесса функционирования системы либо «накапливание» зна чений с течением времени до момента достижения обусловленно го порогового значения); агрегирование; эвристические [28]; моделирование; лингвистический анализ и др. Динамическое отображение данных само по себе обеспечива ет концентрацию информации по «пороговому» методу (например, выделением особых точек) и в результате агрегирования (сгла живания данных посредством отображения тенденции их измене ния в условиях допустимой погрешности отображения ео, выдачг данных в виде графиков и др.). Вместе с этим динамическое ото бражение данных в ДБД позволяет органично применять различ ные методы концентрации, недоступные при статическом отобра жении информации, что позволяет определить концентрируемостг информации как новое свойство БД. Концентрируемость характе¬ ризует способность БД автоматически адаптироваться к услови¬ ям применения либо конкретному уровню системы управления (что соответственно дает возможность концентрации ДБД в про¬ цессе ее функционирования — см. рис. 4.1). Основными способами концентрации ДБД, не требующими привлечения каких-либо дополнительных средств, являются: концентрация по t (увеличение At между смежными дискрета¬ ми: переход от единицы измерения временного фактора 0 к еди¬ нице измерения 0, где 0>0); концентрация посредством ДО-операций; концентрация посредством увеличения допустимой погрешности отображения е0. Естественно, ДБД обеспечивают необходимыми данными и другие методы концентрации информации, например имитацион ные модели, эвристические методы и т. д. Концентрация по временному фактору t. Осуществляется авто матически посредством организации новой ДБД' на основе фраг¬ мента либо всей исходной ДБД в зависимости от потребностей пользователя. Задание на проведение концентрации в общем слу- 64
чае формируется в терминах ЯМД, используемого для управления ДБД, и представляет собой кортеж d — <c, 6, t, b>, где с — описательная часть задания на концентрацию информа¬ ции, содержащая ключевые параметры тех фрагментов ДБД, ко¬ торые подлежат концентрации и включаются в состав новой ДБД': коды информационных объектов и коды отображаемых процессов предметной области (если концентрации подлежит вся исходная ДБД, то с=<*>); 0 — единица измерения времени, которая должна быть использована в сконцентрированной ДБД'; если временной фактор задан в ДБД неоднородно, возможно ука¬ зание, на какое количество «ступеней» должна быть осуществле¬ на концентрация, — в этом случае второй элемент кортежа d за¬ дается в виде1 0 = <>1<9>, где <7=1,2,...; t — временной момент, начиная с которого данные исходной ДБД подлежат концентрации (в соответствующих исходной ДБД единицах измерения 0); если /=<>!<>, концентрация проводится для всего интервала отобра¬ жения [fH, ^к]; b — указание носителя памяти, на котором должна быть организована сконцентрированная ДБД'. Алгоритм концентрации по t (подпрограмма KONCT) 1. /= 1, где /—вспомогательная переменная. 2. Выборка данных, характеризующих /-ю ГФ. 3. *=<*>: если да, то t — tUj идти к п. 4; если нет, то к п. 4. 4. Генерирование временного ряда D ~ = ,{q(t)} на интервале [/, tK] с п. 5. Определение коэффициента преобразования по временному параметру р=ф(О/0). 6. Вызов подпрограммы CALEND для преобразования ряда Dn в ряд D ' с единицей измерения временного фактора 0. 7. Есть ли на 6-м носителе памяти ДБД, содержащая /-ю ГФ с парамет¬ рами2 с: если да, идти к п. 10; если нет, то к п. 8. 8. Вызов соответствующей подпрограммы создания ГФ, входящей в МСК- 9. Организация /-й ГФ на 6-м носителе памяти; идти к п. 12. 10. Вызов подпрограммы OBNOV последовательно к каждому элементу ряда О' начиная с с/'^для которого t>t.K'у где tK'—конец временного интер¬ вала отображения в ранее сконцентрированной ДБД. 11. Все ли ГФ, подлежащие концентрации, рассмотрены: если да, идти к п- 12; если нет, то /=/+1 и идти к п. 2. 12. Выход. Сконцентрированная ДБД' продолжает функционирование с новой единицей измерения временного фактора 0; при этом дол¬ жно быть организовано поступление новых дискретных данных 1 Например, если 0=<Н<1>, то это означает необходимость концентрации Данных по следующей ступени иерархии временного фактора, т. е. данные Фиксируемые ежесуточно, концентрируются до еженедельных данных, ежегод¬ ные— до данных за пятилетку, и т. д. (см. приложение 1). 2 Параметры b и с заданы в кортеже концентрации данных 5—1154 6П
с обусловленной 0 периодичностью (возможным вариантом явля¬ ется получение сконцентрированных данных из исходной ДБД при задании концентрации с момента /к ДБД' либо периодическое повторение концентрации ДБД в ДБД'). Концентрация посредством ДО-операций. Некоторые ДО-опе рации позволяют повысить уровень концентрации информации, хранимой в ДБД. К таким ДО-операциям из множества введен¬ ных выше относятся: Г(*«, ф, S(<«, t% f(t», /“), С(/i1, *;), ?(*«, t«, tj), t*. qj). I<7y)> 71 (^/)> АТА(/Д ф, MI (tH., t*. Задание на проведение кон¬ центрации посредством ДО-операций формируется пользователем или программой с помощью операции выборки ЯМД, входящей в состав операций регулярного управления БД. Концентрация посредством увеличения допустимой погреш¬ ности отображения ео. Осуществляется либо для определения более общей закономерности изменения данных на интервале ото¬ бражения [/н, tK], либо для поиска случайных выбросов при увели чении допустимого порога отклонений от «нормального» протека ния того или иного процесса, отображаемого в ДБД. И в том г: другом случае используется метод, применяемый в процессе реор ганизации данных при учете фактора старения данных (см. 5.2). Глава 6 ПРОГНОЗИРУЕМЫЕ БАЗЫ ДАННЫХ 6.1. КОНЦЕПЦИЯ ПРОГНОЗИРУЕМОЙ БАЗЫ ДАННЫХ И ЕЕ ПРИЛОЖЕНИЯ Переход к динамическому отображению информации в БД АСПИУ наряду с решением ряда проблем информационного обес¬ печения систем позволяет по-новому решить вопросы: временно!! эволюции БД; адекватного отображения реальности (с макси¬ мальной компенсацией старения данных); получения прогнози¬ руемых данных для различных функциональных приложений ня основе прогнозируемых баз данных (ПБД). Поскольку концеп¬ ция ПБД при статическом подходе к БД имеет смысл лишь для создания дополнительных функциональных задач прогнозирования, причем в условиях неизвестного заранее интервала упреждения (прогноза), далее будут рассматриваться только ПБД динами чески отображенной информации (ПДБД). Решение указанных выше вопросов основано на прогнозиро¬ вании значений временного ряда, представленного той или иной генерирующей функцией Qssl (Dn, t), на требуемый упреждающий временной интервал h (/г</). Для прогнозирования кроме хра 66
нимых в ДБД генерирующих функций могут быть использованы в случае необходимости некоторые дополнительные статистичес¬ кие параметры, характеризующие отображаемый процесс, а ГФ может быть основой для получения прогнозирующей функции. Таким образом, реализация и дальнейшая эксплуатация ПБД возможна в трех режимах: естественном — на основе множества ГФ {QyM, по предполагав ющем никаких дополнений к созданной ДБД (устанавливается по умолчанию); расширенном — для отмеченных пользователем временных ря¬ дов вводятся дополнительные данные и программные блоки, обес¬ печивающие использование усложненных методов прогнозирова¬ ния; автоматическом — ПДБД при каждом обновлении данных в соответствующих ГФ отслеживает качество прогноза и произво¬ дит выбор более эффективной прогнозирующей функции либо корректировку ее параметров. С усложнением режима эксплуатации ПДБД, естественно, ухудшается оперативность ее функционирования, поэтому выбор того или иного режима должен осуществляться, исходя из усло¬ вий функционирования АСПИУ. Автоматический выбор в ПДБД наиболее приемлемой прогнозирующей функции может быть про¬ изведен по критериям адекватности и простоты представления- вычислимости. Первый из критериев выбора прогнозирующей функции Qy1 (Dn, t) основан на соответствии инвариантов элементов вре¬ менного ряда {q(ti)}, образуемых прогнозирующей функцией, и элементов эмпирического временного ряда Dn = {q (ti)}, где ^=1[/к, /к + /]. Определение инвариантов временных рядов связано с проверкой на независимость и стационарность множества конеч¬ ных приращений ряда [q(ti)}. Это требует 9 элементов ряда [17]. (Указанное обстоятельство, кроме того, обусловливает неко¬ торые требования к реализации ГФ, в частности к логической структуре ДБД, что нашло отражение при решении вопросов ло¬ гического структурирования, рассмотренных в 2.3.) Адекватность прогнозирующей функции Qyz (Dn, t) временному ряду Dn может быть проверена также по критерию Фишера или с помощью коэф¬ фициентов корреляции, что требует 6 [17]. Таким образом, при выборе прогнозирующей функции Qy 1 (Dn, О важным фактором проверки ее на адекватность временному ря¬ ду Dn является число элементов временного ряда п (в общем слу¬ чае зависимость между количеством влияющих факторов г и объемом выборки п: r-f 1>/г/5), в зависимости от которой осуще¬ ствляются следующие проверки: при 6 — на соответствие математического ожидания и дис- Дерсии, на основе Г-критерия и коэффициентов корреляции; 5* 67
при 9 — на соответствие математического ожидания и дис¬ персии, на основе F-критерия, на независимость по статистическим критериям, на стационарность. Исходя из этого, использование ДБД в режиме ПБД позво¬ лительно без каких-либо ограничений лишь после определенного момента, обусловленного фиксацией соответствующего количества элементов отображаемого временного ряда (я>6—10). Как ис¬ ключение, до этого момента в качестве методов прогнозирования могут быть использованы прогноз по последней или нескольким особым точкам, а также моделирование и метод экспертных оце¬ нок. Кроме того, важным вопросом для ПДБД является установ¬ ление допустимого временного интервала упреждения I. Для есте¬ ственного и расширенного режимов функционирования пользова¬ телем устанавливается фиксированное значение / (по умолчанию l = 3At, что определено на основе экспериментов с временными ря¬ дами различной природы). В общем случае следует помнить, что увеличение шага прогноза сверх установленного интервала упреж¬ дения I и использование этих прогнозируемых данных в АСПИУ может привести к нежелательным последствиям, поскольку тен¬ денция процесса может измениться в течение ближайшего At, в связи с чем ошибка прогноза может достичь недопустимо боль¬ ших значений. Для автоматического режима осуществляется от¬ слеживание и соответствующая корректировка прогнозирующей функции при каждом обновлении данных. В практике функционирования АСПИУ встречаются как слу¬ чайные, так и детерминированные процессы, поэтому применяв мые в ПДБД модели должны быть ориентированы на прогнози¬ рование тех и других процессов. При этом следует заметить, что детерминированные модели характеризуются, как правило, прос¬ тотой представления процессов, а также сами просто реализуются в виде ГФ. При реализации ПДБД предпочтение отдается послед¬ ним, если они отвечают поставленному требованию точности (до¬ стоверности). В классе случайных моделей представлены модели описывающие как стационарные, так и нестационарные процессы поскольку в функциональных приложениях АСПИУ имеют рас пространение оба вида процессов. При этом следует иметь в виду, что колебания временных рядов, характеризующих отображаемы! процесс, могут быть различной природы: сезонные, тренд (имею щие обусловленную тенденцию), эксцессы («стихийные бедствия») циклические, поэтому пользователь при выборе расширенном режима эксплуатации ПДБД должен внимательно отнестись установлению прогнозирующих функций. Исходя из указанных предпосылок, для ПДБД были исследо¬ ваны, проанализированы и использованы следующие методы г модели прогнозирования значений дискретных временных рядов: методы «естественной» экстраполяции временного ряда на ос¬ 68
нове ГФ (без привлечения каких-либо дополнительных данных об отображаемом процессе); методы прогнозирования с привлечением дополнительных ста¬ тистических данных. Естественно, что в последнем случае в информационном блоке ДБД предусматривается хранение дополнительных данных (для указанных пользователем временных рядов). 6.2. МЕТОДЫ «ЕСТЕСТВЕННОЙ» ЭКСТРАПОЛЯЦИИ ДАННЫХ НА ОСНОВЕ ГЕНЕРИРУЮЩИХ ФУНКЦИЙ В качестве основных методов «естественной» экстраполяции на основе ГФ рассмотрим: экстраполяцию с применением ДО-операции V(ti) (генериро¬ вание данных для будущего момента /£(/к<^</к + /) с помощью гф qv'oDii. 0; прогноз по последней особой точке; прогноз по математическому ожиданию процесса на основе не¬ скольких смежных особых точек. Метод экстраполяции с применением ДО-операции V(ti). Ос¬ новой для применения экстраполяции является наличие так на¬ зываемой инерции развития, которая для сложных физических, экономических, социальных систем на коротких и средних времен¬ ных интервалах имеет решающее значение. Инерционность про¬ цессов в системах обусловливается: инерционностью взаимосвязей, т. е. сохранением в основных чертах механизма формирования явления (корреляция прогнози¬ руемой по временному ряду Dn переменной q(ti), ti<=[tK, tK + l] на множество переменных-аргументов, рассматриваемых как «чер¬ ный ящик»); инерционностью в развитии отдельных сторон процессов, т. е. сохранением темпов, направления, периодичности и т. д. Следует заметить, что элементы временного ряда Dn стано¬ вятся более устойчивыми с повышением уровня иерархии систем, на котором фиксируется временной ряд Dn, уменьшается погреш¬ ность е отображения и увеличивается допустимый интервал уп¬ реждения / прогноза. При экстраполяции с применением ДО-операции V(ti) прог¬ нозируемое значение определяется (на основе сплайн-аппрокси¬ мации) как f№)= *к + Р=1 Очевидно, что q(tj) зависит от шага прогноза A, ti = tK + h, Прогноз по последней особой точке. В качестве прогнозируе¬ мого значения q(tK-\-h) принимается последняя по времени осо¬ бая точка, если последняя подфункция ГФ еще не сформирована 69
(это возможно на начальном этапе функционирования ДБД либо когда временной ряд из смежных по времени особых точек, ха¬ рактеризующих новую тенденцию процесса, еще не аппроксими¬ рован в соответствующую ГФ): Я(** + h) = q (tK). Предсказанное значение в этом случае не зависит от шага прог¬ ноза Л, вероятностные характеристики процесса не учитываются. Прогноз по математическому ожиданию процесса на основе нескольких смежных особых точек. Если тенденция отображаемо¬ го процесса изменилась, но оформление ее в новую подфункцию ГФ еще не осуществилось (из-за недостаточного количества смеж¬ ных особых точек), возможно прогнозирование по математичес¬ кому ожиданию последних смежных особых точек. В этом случае в качестве значения q(tK + h) принимается математическое ожи¬ дание последних смежных особых точек ^(tK + h) = ^q{tl)/rl. 1=1 Предсказанное значение не зависит от шага прогноза А, учиты¬ ваются лишь сведения, полученные в последний период времени отображения. Среди рассмотренных методов наиболее эффективен (с точки зрения точности и времени выдачи прогноза) и естествен в рам¬ ках разработанного подхода метод с применением ДО-операции V{ti)y что соответствует результатам, полученным в [23]. 6.3. МЕТОДЫ ПРОГНОЗИРОВАНИЯ С ПРИВЛЕЧЕНИЕМ ДОПОЛНИТЕЛЬНЫХ СТАТИСТИЧЕСКИХ ДАННЫХ В качестве методов прогнозирования, требующих привлече¬ ния дополнительных статистических данных, рассмотрим следу¬ ющие модели: авторегрессии в виде конечной линейной совокупности преды¬ дущих значений процесса и случайной величины с фиксирован¬ ным распределением; скользящего среднего в виде конечной линейной совокупности предыдущих значений процесса, сгенерированного последователь¬ ностью случайных величин с фиксированным распределением, и параметра, определяющего уровень процесса; смешанные; имитационные. Модель авторегрессии К В модели авторегрессии прогнозируе¬ мое значение элемента временного ряда q(tK + h) выражается как конечная линейная совокупность предыдущих элементов ряда 1 Модели авторегрессии и скользящего среднего рассмотрены с использова¬ нием материалов Бокс Дж., Дженкинс Г. Анализ временных рядов: Пер. с англ. — М.: Мир, 1974. — Кн. 1. Прогноз и управление. — 406 с. 70
{яШ где i=l,/, Д/</к/, и независимого импульса a(tK). Пусть рассматриваются равноотстоящие моменты •••> и соответствующие им элементы ряда, полученные с помощью ГФ Qss 1 (Dn, /) : ?(^i), ?(/2), q{tK)- Тогда q(tK h) — jx = tyi [<7 (^) — p.] + ••• + ф/ [q (^K) — Iх] + O' {tK) называется процессом авторегрессии порядка /. Таким образом, модель авторегрессии представляет собой + h) = а + [Ьгд* (tl) + (t2) + ... + у#* (/«)] + а (П (6Л) q4ti) = q(ti) — Iх, ti = [tv tK\, где г|)Ь ф/ — параметры модели, характерные (в том числе за¬ данные) для описываемого процесса; a(tK) —случайное число, являющееся реализацией на момент tK случайной величины с фик¬ сированным распределением; q(ti), ..., q(tK) —элементы времен¬ ного ряда, полученные с помощью ГФ QBS 1 (Dn> t). Модель (6.1) можно преобразовать к виду, более удобному для реализации на ЭВМ: g(tK + h) = I - 2 ^J 2 ЬяiU) + а(П- Для стационарности процесса необходимо, чтобы величины, обратные параметрам модели 1/ф/, образовывали сходящийся ряд. Перед выдачей прогноза функциональный блок ДБД должен определить ц для I последних регистрируемых точек. По умолча¬ нию, например, могут быть установлены следующие параметры модели: 1 = 4; гИ=0,1, ф2=0,2, фз = 0,3, ф>4 = 0,4. Модель скользящего среднего. В модели скользящего среднего прогнозируемое значение элемента динамического ряда q(tK + h) выражается как конечная линейная совокупность предыдущих значений независимых импульсов a(ti), ti<tK. Такой процесс q{tK-\-h)— [х = a{tK) — riia(tK — at) — ... — r\pa(tK — pM) — — ... — 7] Pa{tx) называется процессом скользящего среднего порядка Р. Тогда q (tK + h) - {«. + a (tK) — 2 -yi (tK —pM), p=1 где т]j, ..., г]р — параметры модели (веса прошлых независимых импульсов), характерные для процесса, в том числе заранее за¬ данные; a(tK) —случайное число, являющееся реализацией в мо¬ мент tK случайной величины с фиксированным распределением. Перед выдачей прогноза функциональный блок ДБД должен 71
определить р, для Р последних регистрируемых точек. По умол¬ чанию, например, могут быть установлены следующие параметры модели: Р = 4; 141 = 0,4, 142=0,3, 143=0,2, 144=0,1. Смешанные модели. В целях повышения адекватности прогно¬ зирующей функции Qyl {Dn, t) исходному временному ряду Dn = {q{ti)}, ti = ta, tK + l, иногда целесообразно объединить моде¬ ли авторегрессии и скользящего среднего q(tK + ft) = р/2 (Г2-2Ф/) + 4-2^(^)_ \ i=l ) 1 = 1 _±2W<_^+a(n, p=i где г|)ь \р/ — параметры модели, характеризующие регрессион¬ ные свойства процесса; a(tK) —случайное число, полученное с по¬ мощью генератора псевдослучайных чисел (соответствующее мо¬ менту /к); т]ь ..., т]р — параметры модели, характеризующие ее зависимость от происшедших реализаций случайной величины а (О- Перед выдачей прогноза функциональный блок ДБД должен определить ц для I последних регистрируемых точек. По умолча¬ нию, например, могут быть установлены следующие параметры модели: 1 = Р = 4; ipi = т]4 = 0,1, ф2 = г)3 = 0,2, гр>3 = Л2 = 0,3, ф4 = г|1 =0,4, К смешанным моделям относится также гибридная модель, прогноз которой является взвешенной суммой нескольких прогно¬ зов, причем используются прогнозируемые временные ряды на некотором интервале [t9, tK\ С помощью введенного кри¬ терия осуществляется выбор представительных моделей из всего множества рассматриваемых моделей прогнозирования и генера¬ ция прогнозируемого значения для требуемого момента tK + h. Следует заметить, что метод используется для функционирования ПДБД в автоматическом режиме и непригоден для оперативных систем. Имитационные модели. Имитационное моделирование являет¬ ся, как правило, эффективным методом прогнозирования развития сложных динамических систем и обладает рядом преимуществ пс сравнению с другими методами. Возможность одновременного учета большого количества входных сигналов и состояний дина¬ мических систем, характеризующихся стохастичностью функциони¬ рования, обусловила широкие прикладные возможности имита¬ ционного моделирования в следующих основных направлениях: решении проблем управления сложными динамическими систе¬ мами; составлении согласованного рационального плана создания или развития сложной системы; исследовании эффектов, вызванных внесением изменений в си¬ стему или выбором различных альтернатив; 72
исследовании новых ситуаций, информация о которых недоста¬ точна или вообще отсутствует. Однако, рассматривая имитационное моделирование с точки зрения его применения в ПДБД, следует учитывать: во-первых,, создание и проверка имитационных моделей до их использования в ПДБД могут оказаться трудоемкими, сложными и относитель¬ но дорогостоящими по сравнению с вышеприведенными методами;, во-вторых, имитационное моделирование, как правило, оказыва¬ ется непригодным для оперативных систем. Если же указанные ограничения не столь важны в отношении конкретного приложе¬ ния, то имитационное моделирование может оказаться наиболее эффективным методом для ПДБД. В частности, применение ими¬ тационных моделей для ПДБД может быть обусловлено: необходимостью получения уточненного прогноза развития си¬ стемы Sp, если полученные из ПДБД экстраполированные дан¬ ные имеют большую, чем допустимо, погрешность либо требуют дополнительной проверки, например, при увеличении шага прог¬ ноза Л; недостаточной инерционностью системы Sp, т. е. незначитель¬ ной продолжительностью временного отрезка «последействия» р5 что делает трудным применение методов экстраполяции времен¬ ных рядов; потребностями концентрационно-временных преобразований данных (см. 5.4), содержащихся в ДБД, для выдачи информации на необходимый уровень управления системой Sp; необходимостью рационализации (оптимизации) функциониро¬ вания системы Sp и др. Процесс создания имитационной модели некоторой системы состоит, как правило, из следующих основных этапов: формализации (с обусловленной точностью представления); организации выполнения во времени введенных преобразова¬ ний, соответствующих в определенной степени реально происхо¬ дящим в системе процессам; сбора и обработки данных, необходимых для функционирова¬ ния модели; проверки имитационной модели на адекватность отображения системы; проведения необходимых модельных экспериментов; оценки и использования результатов моделирования. Формализация имитационной модели состоит в анализе систе¬ мы Sp и ее представлении в виде компонентов модели, например, таких, как элементы, переменные (внешние, статусные, внутрен¬ ние), параметры и функциональные связи, которые представлены логикой взаимоопределения элементов и операционными харак¬ теристиками, наиболее полно описывающих поведение системы с точки зрения достижения целей, поставленных перед АСПИУ. Ор¬ ганизация выполнения преобразований в имитационной модели осуществляется посредством определения либо задания в ней Функциональных связей, обусловливающих взаимодействие эле¬ 73
ментов, параметров и переменных, Сбор и обработка данных мо¬ гут включать определение размеров выборок, оценку параметров и свойств распределений, обеспечение достоверности исходных данных, выбор входных данных и начальных условий, определение формы выдачи результатов и др. Проверка модели на адекват¬ ность представляет собой сложный многостадийный процесс, ко¬ торый осуществляется параллельно с созданием имитационной модели и экспериментами с ней, и может включать в себя про¬ верки: собранных данных об исследуемой системе; предварительной достоверности создаваемой модели; статистической значимости параметров операционных харак¬ теристик модели; достоверности алгоритмов модели; соответствия выбранных генераторов или датчиков случайных чисел и переменных; реализованной модели на адекватность отображаемой систе¬ ме и др. Использование имитационной модели в ПДБД состоит в уста¬ новлении модельного времени tUOA = tK-\-h и проведении экспери¬ мента на этом временном отрезке с получением в результате про¬ гнозируемого значения элемента временного ряда q(tK-\-h). Про¬ ведение модельных экспериментов в ПДБД кроме имитации раз¬ вития временного ряда, который характеризует процесс, проис¬ ходящий в системе Sp, на требуемый шаг прогноза может включать также поиск условий рационального ее функциониро¬ вания. Глава 7 ИСПОЛЬЗОВАНИЕ ДИНАМИЧЕСКИХ БАЗ ДАННЫХ В СИСТЕМАХ ОБРАБОТКИ ДАННЫХ 7.1. ОСНОВНЫЕ НАПРАВЛЕНИЯ ИСПОЛЬЗОВАНИЯ ДИНАМИЧЕСКИХ БАЗ ДАННЫХ В АСПИУ Принципиальные особенности ДБД позволяют использовать их в целом ряде приложений, среди которых могут быть выделе¬ ны: следящие системы реального времени; системы научных ис¬ следований; АСУ технологическими процессами; АСУ организа¬ ционного управления. Следящие системы реального времени. Важное место среди систем реального времени занимают следящие системы, призван¬ ные регистрировать данные о состоянии (местонахождении) того или иного объекта для выработки на их основе необходимых уп¬ равляющих сигналов. К числу основных свойств таких систем относится адекватность регистрируемой информации реальному 74
состоянию объекта, возможность прогнозирования и концентра¬ ции данных, автоматическое сглаживание временных рядов, фик¬ сируемых на входе системы, оперативность функционирования. Эти свойства в достаточно полной мере могут быть реализованы с помощью ДБД, особенно при слежении за объектами, обладаю¬ щими значительной инерционностью. Рассмотрим примеры подоб¬ ных систем. Системы слежения за космическими объектами. По результат там дискретных измерений местонахождения космических объек¬ тов (например, по прямому восхождению, склонению и радиусу) можно определить и отслеживать параметры орбит объектов и оперативно на любой момент времени в прошлом и будущем вы¬ давать необходимые данные. Важное значение эти системы полу¬ чают в связи с интенсивным освоением космоса. При этом (если учитывать ограниченность околоземного пространства) возрастает опасность столкновений и электромагнитной несовместимости кос¬ мических аппаратов. По данным каталога NOPAD в околоземном пространстве на апрель 1980 г. находилось около 12 тыс. разно¬ образных объектов; вероятность соударения для геостационарных •спутников с объектом радиусом 50 м за 1000-суточный полет сос¬ тавляет в настоящее время примерно 4%; к 1990 г. число боль¬ ших космических аппаратов на геостационарной орбите достигнет 240 [25]. Естественно, первостепенную роль приобретает безопас¬ ность пилотируемых космических полетов. Если для обеспечения •безопасности неуправляемых спутников могут быть достаточными •организационно-технические меры (например, четкое распределе¬ ние зон освоения околоземного пространства, удаление отработав¬ ших геостационарных космических аппаратов на обусловленную высоту, конструкторское совершенствование космических объек¬ тов и средств их выведения, позволяющее уменьшить «загрязне¬ ние» космического пространства), то для пилотируемых космичес¬ ких аппаратов наиболее безопасным является управление полетом с учетом параметров орбит объектов, находящихся в космическом пространстве. Организованная на борту пилотируемого космичес¬ кого аппарата ДБД может обеспечить автоматическое ведение основной ГФ, описывающей собственный полет, и постоянное сравнение его параметров на требуемом шаге прогноза с парамет¬ рами движения всех зарегистрированных космических объектов (траектории движения которых также хранятся в ДБД). В случае опасности столкновения система выдает соответствующий сигнал экипажу либо непосредственно системе управления космическим аппаратом. Актуализация данных о космических объектах в ДБД может производиться автоматически на основе информации, посту¬ пившей от системы идентификации и регистрации объектов, по Командам с Земли либо экипажем. В качестве системы идентифи¬ кации и регистрации объектов возможно применение проектов типа GEODSS [26], «Навстар» [2] и других, обеспечивающих пери¬ одическое мгновенное и высокоточное определение пространствен¬ 75
ных координат и скорости объектов, преобразование данных е цифровую форму, ввод в ЭВМ и т. д. Авиационные автоматизированные системы контроля и управ¬ ления (АСКУ). Авиационные СКУ с ДБД могут использоваться для тех же целей, что указаны выше, а также при диспетчериза¬ ции полетов. В разрабатываемых АСКУ [14, 36] возможность ста¬ тического отображения положения множества объектов во време¬ ни и циклическое проведение расчетов на предотвращение столк¬ новений с помощью соответствующих математических методов крайне мала из-за ограничений на количество отслеживаемых объектов. Эти проблемы могут быть разрешимы в условиях при¬ менения ДБД благодаря хранению не точек, а траекторий дви¬ жения самолетов (и соответственно отсутствию необходимости фиксации каждого периодического сообщения о местоположении и скорости самолетов), а также использованию свойства прогно- зируемости ГФ, описывающих эти траектории. Подобная система (например система DABS/ATARS [14]) может состоять из двух частей: дискретной адресной сигнальной системы (ДАСС), кото¬ рая запрашивает и получает информацию от каждого контроли¬ руемого самолета (дискретного адреса), а также организует при¬ ем передачу данных с самолетов, и автоматической службы для выработки рекомендаций и принятия решений (АСВРПР) по ма¬ неврированию самолетами. Наземная ЭВМ, входящая в состав. АСВРПР, использует данные ДАСС для выработки решений пс управлению движением самолетов и выдачи соответствующих команд на борт каждого самолета по каналам связи. Для обеспе¬ чения функционирования системы самолеты должны быть осна¬ щены ответчиками и дисплеями. База данных, поступающих от ДАСС (которые представляют собой временные ряды, описываю¬ щие движение самолетов), должна быть организована и исполь¬ зоваться в ЭВМ АСВРПР в виде ПДБД. В этом случае осущест¬ вляется оперативный анализ траекторий полетов, представленных соответствующими ГФ, на возможность их пересечения в буду¬ щем. Если возможность столкновения существует, АСВРПР выра¬ батывает необходимые решения по «разводке» самолетов и выда¬ ет их на борт по каналу связи ДАСС. Следует отметить два важ¬ ных свойства АСВРПР, реализованных на основе ДБД: во-первых, обеспечивается естественность сопровождения самолетов в памяти АСРПР благодаря адаптивности ГФ (в том числе отсутствует необходимость в сборе данных о скорости самолетов), во-вторых, в компактной памяти может сохраняться информация о траекто¬ риях самолетов в районе воздушного движения, управляемого АСВРПР, что может быть важным при анализе конфликтных си¬ туаций и нарушений (в дополнение к данным «черного ящика», которые традиционно используются в авиации для подобных слу¬ чаев). Подобные системы могут быть использованы, естественно, и при управлении морским движением для предотвращения столкновений судов. 76
Системы слежения за состоянием сложных опасных объектов. Динамические БД могут эффективно использоваться для отобра¬ жения и последующего хранения множества определяющих ха¬ рактеристик сложных объектов с недопустимым аварийным состо¬ янием (энергетические, химико-технологические, металлургические и другие комплексы), а также для реализации на этой основе контроля и анализа аварийности ситуации по каждой из этих характеристик и на их взаимную допустимость. В качестве конт¬ ролируемых характеристик для таких комплексов могут быть установлены: пространственные координаты и производные от них во вре¬ мени; температурные режимы; нагрузочные (статические и динамические) характеристики; прочие необходимые параметры состояния комплекса и окру¬ жающей среды. При реализации автоматических систем управления сложными опасными объектами одной из проблем является объединение от¬ дельных частей системы управления в единое целое. Принципиаль¬ ным ее решением, используемым в настоящее время, является за¬ мена проводов, используемых для информационного обмена между различными частями системы, единой шиной данных (при этом должен обеспечиваться свободный ввод-вывод данных из шины). Представляется целесообразным ориентировать модули памяти на хранение информации, необходимой для управления сложным опасным объектом, в виде ДО-данных. Это позволит ускорить выработку сообщений о критических ситуациях по каждой из контролируемых характеристик и по их совместной допустимости и соответственно повысить оперативность оповещения главной управляющей программы. Основным достоинством такого подхо¬ да к организации памяти системы управления объектом является возможность оперативной выработки сигналов о приближении критической ситуации (на основе ПДБД) и возможности своевре¬ менен выработки управляющих воздействий на ее недопущение, а не на вызод сложного объекта из такой уже возникшей ситуа¬ ции. Системы научных исследований. Представляется целесообраз¬ ным использование ДБД в автоматизированных системах научных исследований и обработки результатов испытаний, которые могут осуществляться в различных средах — космосе, атмосфере, над¬ водной и подводной средах и т. д. Погрешности измерения физи¬ ческих величин в указанных приложениях, как правило, колеб¬ лются от 0,1 до 10% (причем с увеличением частотных характе¬ ристик измеряемых сигналов наблюдается тенденция к увеличению погрешности измерения, а длительность регистрации сигналов Может меняться от десятков минут до десятков часов [32]). Дина¬ мические БД могут обеспечить предварительную обработку и хра¬ нение экспериментальных данных, снимаемых с датчиков, на 77
бортовых ЭВМ с последующей передачей по каналам связи но дискретных данных, а закономерностей (тенденций) их изменения во времени. В системах научных исследований, где важное значение имеет временной фактор [4] и требуется обеспечивать хранение получен¬ ных в экспериментах данных за длительный период (для статисти¬ ческой обработки, анализа, планирования эксперимента и др.). применение ДБД может обеспечить значительный эффект, по¬ скольку в дополнение к обычным функциям, присущим базам данных, в ДБД обеспечиваются: отражение закономерностей, свойственных объектам и отноше¬ ниям отображаемой предметной области; способность прогнозировать потенциально возможные состоя¬ ния отображаемой предметной области; способность автоматически адаптироваться к конкретному уровню АСПИУ благодаря свойству концентрируемости. С точки зрения технологии обработки информации в системах научных исследований ДБД обеспечивают [13]: автоматизирован ное формирование, пополнение и модификацию хранимой инфор¬ мации, включая ориентировочный расчет периодичности или мо¬ мента времени по сбору соответствующих данных; эффективное хранение данных; оперативный доступ к требуемой информации-и проверку ее непротиворечивости. АСУ технологическими процессами (ТП). В достаточно слож¬ ных АСУ ТП, а тем более интегрированных АСУ (ИАСУ), функ¬ ционирование которых предполагает наличие БД (обусловлен¬ ное выработкой управляющих воздействий на основе логических операций с совокупностью данных, характеризующих управляе¬ мый процесс), существует ряд серьезных проблем ИО, среди ко¬ торых следует выделить те, которые связаны с отображением информации в БД: ряд процессов в АСУ ТП — составной части ИАСУ — являются непрерывными, однако данные о них отображаются в БД множе¬ ствами дискретных информационных объектов, т. е. временными рядами Dn = {q(ti)}> i = \, п\ необходимость отображения и одновременного использования данных о технологических процессах как для непосредственного управления ими, так и для выработки организационно-экономи¬ ческих. проектных и других решений в «смежных» автоматизиро¬ ванных системах организационного управления, САПР и т. п.; большое отличие временных ограничений для управляющих воздействий АСУ ТП и других систем, входящих в состав ИАСУ и др. Использование ДБД в АСУ ТП (ИАСУ) позволяет органично решать указанные проблемы, что способствует существенному по¬ вышению технико-экономических характеристик подобных систем, в том числе позволяет реагировать в реальном масштабе времени 78
на непредвиденные изменения технологического процесса. В ка¬ честве такого рода приложений можно указать, например, гибкие автоматизированные производства [51], ИАСУ прокатного произ¬ водства [38], АСУ добычей и подготовкой газа к транспортирова¬ нию и др. Системы организационного управления. Динамические БД мо¬ гут найти успешное применение в автоматизированных системах организационного управления: при проведении оптимизационных расчетов и составлении про¬ ектов планов с обеспечением оперативной выдачи прогнозируемых данных для решения прикладных задач; для эффективного хранения статистических данных за про¬ должительные временные перио¬ ды для последующей выдачи по запросу (в том числе в режиме теледоступа), например, произ¬ водственных, социальных или финансовых данных; в управлении крупными город¬ скими хозяйствами, где необхо¬ димы большие объемы разнооб¬ разной информации в виде вре¬ менных рядов с обеспечением ее адекватности и оперативного по¬ лучения данных на любой тре¬ буемый момент или период вре¬ мени; для хранения и прогнозирова¬ ния норм, нормативов, цен, в том числе и для сопоставимости срав¬ ниваемых данных, относящихся к разным временным периодам; для оперативного получения полной информации с обуслов¬ ленным уровнем достоверности по ожидаемому выполнению пла¬ новых заданий; для уменьшения пиковых на¬ грузок на вычислительную тех¬ нику и службы ее эксплуатации в конце и начале отчетных пери¬ одов и обеспечения ритмичности их работы благодаря умень¬ шению зависимости поступления Данных от источников информа¬ ции; для проведения объективного корреляционного и регрессион- 10~3уел. ед. Рис. 7.1. Сравнение динамики роста производительности труда (машино¬ грамма) при 5 = 0 (параболическая сплайн-аппроксимация) и относи¬ тельной погрешности ео = 0,065 (О — точки разрыва тенденции развития системы) 79
Таблица 7.1 Исходный временной ряд показателей Dn = {q(t)} для анализа динамики развития производственной системы Год Значение показателя Год Значение j показателя Год Значение показателя | Год Значение показателя 60 4 312,4 72 8 826,3 76 12 014,8 80 13 018,9 65 5 877,5 73 9 949,9 77 12 106,7 81 13 535,9 70 7 794,6 74 11 469,2 78 12 577,2 82 15 321,5 71 8 282,5 75 12 356,8 79 12 977,1 83 15913,1 1 Для кодирования временного фактора используется номер года внутри века (см. приложение 1). Таблица 7.2 Анализ динамики развития производственной системы с использованием динамического отображения информации (линейная сплайн-аппроксимация) Допусти¬ мая пог¬ решность аппрокси¬ мации 1 е0 Номер подфунк¬ ции / I Г од, соот¬ ветствую¬ щий концу подфунк¬ ции, t Коэффициенты ГФ ^г=и 9 ! /г, Максималь ная ошибк предстазлс ния 1 65 —14 468,7344 313,0195 0 2 72 —28 328,7266 515,8477 14,0 3 74 — 100 958,7500 1 519,2969 0 20,0 4 76 38 008,2617 —342,0195 0 5 79 —21 385,3320 435,1914 17,7 6 81 —28 341,1016 517,0000 0 7 83 —33 194,9961 591,6641 0 1 71 — 17 461,9570 360,9111 119,7 1 90 О 2 74 —86 416,2500 1 321,4395 98,9 JzU,U 3 77 21 625,2031 — 125,0254 108,5 4 80 —4 559,0625 220,8438 89,5 5 82 — 131 094,2500 1 785,5586 0 1 Задана абсолютная ненулевая погрешность аппроксимации; естественно, могут быт заданы и £о = 0, и относительная допустимая погрешность аппроксимации. Таблица 7.3 Прогноз роста производительности труда Номер года 84 1 ! 85 86 87 88 89 90 Прогноз q(t) 16 504,7 17 096,7 17 688,1 18 279,8 18871,4 1 19 463,1 20 054,- ,80
ного анализа показателей деятельности систем в целях оператив¬ ного выявления причин их неэффективной работы и необходимого регулирования. В качестве примера рационального использования ДБД в ав¬ томатизированных системах организационного управления может быть указана республиканская автоматизированная система пла¬ новых расчетов (АСПР) [12], для которой необходимы: обеспечение надежного функционирования БД как для реше¬ ния прикладных задач, так и для выдачи информации на видео¬ терминалы управленческому персоналу (в условиях распределен* ных БД, когда значительная часть данных будет размещаться на машинных носителях в автоматизированной системе государствен¬ ной статистики, надежность их функционирования может быть недостаточной из-за неразвитости организационно-технологичес¬ кого обеспечения, низкой пропускной способности каналов свя¬ зи и др.); реализация в рамках принятой технологии обработки данных в АСПР и обеспечение целесообразной минимизации количества применяемых программных средств; выдача плановым работникам информации в виде тенденции ее изменения во времени за длительный срок, в том числе для повышения качества экономического анализа, контроля выполне¬ ния планов и наглядности (табл. 7.1, 7.2, рис. 7.1); получение достоверной прогнозной информации (табл. 7.3) для управления народным хозяйством (проектов планов, ожи¬ даемого выполнения, расчетов потребности, оптимизационных расчетов и др.); уменьшение объемов хранимой информации в условиях рас¬ ширения ее состава и временного периода отображения. 7.2. СТАТИСТИЧЕСКИЕ ВОПРОСЫ ДИНАМИЧЕСКОГО ОТОБРАЖЕНИЯ ВРЕМЕННЫХ РЯДОВ Из всего комплекса вопросов статистического характера, связанных с динамическим отображением данных, наиболее важ¬ ными являются: определение зависимостей между порядком р используемых сплайнов, допустимой погрешностью аппроксимации ео, количест¬ вом М подфункций ГФ при различных объемах выборки п (коли¬ чество элементов исходного временного ряда Dn) и видом отобра¬ жаемого процесса; поиск условий технологичного представления ГФ, в частности, по коэффициенту сжатия данных &сж; оценка машинной эффективности используемых алгоритмов сплайн-аппроксимации. Исследование зависимостей между ео и М проводилось с вре¬ менными рядами различной природы и объема для случаев ап¬ проксимации линейными, параболическими и кубическими сплай- ^—1156 81
ij(ti)'10f уел. ed. 750 500 250 CJ о О о 10 15 t, уел. ед. Рис. 7.3. Зависимость допустимой погрешности аппроксимации во Г'Т количества М подфункций ГФ для короткого временного ряда (техни¬ ческая система): /—линейная сплайн-аппроксимация, р = I, /маш «о,8 с; 2—параболическая сплайн- лип г аппроксимация, р = 2, t с'3~~ ку‘ бическая сплайн-аппроксимация,р = 3,7^1” «0,5 с; относительная погреш¬ ность £°тп; абсолютная погрешность - абс Рис. 7.2. Короткий временной ряд (техническая система) нами К При этом проверялись варианты задания абсолютной и относительной допустимой погрешности е0 аппроксимации временного ряда Dn с помо¬ щью ГФ Q®’1 (Dn, t). В качест¬ ве исследуемых систем рас¬ сматривались реальные тех¬ нические и экономические сис¬ темы, в ходе функционирова¬ ния которых фиксировались временные ряды соответствующих показателей. В последующем с помощью сплайн-аппроксимации на основе полученных временных рядов образовывались ГФ с фиксацией: коэффициентов kj(Dn) ГФ и порядка сплайна р\ количества М подфункций fj (звеньев сплайна); 1В рассматриваемых случаях использовалась сплайн-аппроксимация отрез¬ ками прямых, а также квадратичными и кубическими многочленами без склеи¬ вания в точках разрыва (в процессе аппроксимации не использовался механизм особых точек, что заведомо ухудшило соответствующие характеристики Г'Ф) Результаты некоторых экспериментов представлены в приложении 3. 82
Я (ti) • 10]3усл. ед. 13 10 машинного времени tMaш, тре¬ буемого для образования ГФ; максимальной погрешности е/ каждой подфункции /у (е/<е0); элементов временного ряда образуемых ГФ в каждом заданном временном дискрете, и погрешности ГФ в нем. На рис. 7.2—7.9 приведены результаты для короткого (п = — 20) и длинного (я = 200) вре¬ менных рядов технической систе¬ мы, для короткого (л=16) и длинного (/г = 105) временных рядов экономической системы. Нахождение условий, способ¬ ствующих повышению техноло¬ гичности ГФ с точки зрения за¬ нимаемой памяти, проводилось на основе использования коэффи¬ циента сжатия данных &сж при заданной е0: ксж = п([М(р+1)]. Естественно, динамическое отображение данных тем выгод¬ нее с точки зрения требуемой памяти, чем больше &сж. Анализ объемных характеристик ГФ про¬ водился на основе сравнения дан¬ ных, полученных выше (см. рис. 7.2, 7.4, 7.6, 7.8), для коротких и длинных временных рядов различной природы (рис. 7.10). Естест¬ венной границей целесообразности применения ДО-данных с точки зрения требуемой памяти является, очевидно, случай равенства количества хранимых коэффициентов т = М(р+1) количеству п элементов временного ряда Dn, т. е. когда &сж>1. Анализ получен¬ ных результатов позволяет сделать следующие выводы: 1. Представление данных в виде ГФ может давать значитель¬ ную экономию памяти: практически степень сжатия при приемле¬ мых значениях погрешности е0 может приближаться к 100. Для иллюстрации приведем кроме указанных (см. табл. 3.2) данные аппроксимации временного ряда, содержащего 1000 значений, полученных с помощью функции y = sinx через 1°, * = [0°,999°], ^ = х+1 (табл. 7.4, рис. 7.11). Следует заметить, что подобный Подход к сжатию данных значительно превосходит другие исполь¬ зуемые методы сжатия [47]. 2. Как правило, более эффективны с точки зрения требуемой памяти сплайны более высокого порядка, т. е. ГФ, пР^07313*7^1? Щие собой отрезки кубических парабол. Эта 3aK0H01Nleb^ свойственна временным рядам на всем спектре допусги 6» 60 65 70 75 t, год Рис 7.4. Короткий временной ряд (экономическая система) 83
otfc ОГН о €0 Рис. 7.5. Зависимость допустимой погрешности аппроксимации е0 от количества М подфункций ГФ для короткого временного ряда (экономическая система): /—линейная сплайн-аппроксимация, р=I, 7i^JJI=0,85 с; 2—параболическая сплайн-аппрокси¬ мация, р=2, " 1*1 с; 3—кубическая сплайн-аппроксимация, р=3, «0,6 с; относительная погрешность'е°тн: абсолютная погрешность е*бс грешностей аппроксимации го (см. рис. 7.11). Вместе с тем даль¬ нейшее повышение порядка сплайнов приводит к возрастанию машинного времени /маш образования и адаптации ГФ, что под¬ час недопустимо для оперативных систем. 3. Наиболее эффективны для динамического отображения с точки зрения требуемой памяти временные ряды, характеризую¬ щиеся достаточно плавной тенденцией. Кроме того, эксперименты 84
q(t$,ycn. eff. 85 Рис. 7.6. Длинный временной ряд (техническая система)
Рис. 7.7. Зависимость допустимой погрешности аппроксимации е0 от количест¬ ва М подфункций ГФ для длинного временного ряда (техническая система): /_ЛИНейная сплайн-аппроксимация, 1, f^JJ1 ***1.3 с; 2—параболическая сплайн-аппрокс г мация, р = 2, 7маш „ «1,0 с; 3—кубическая сплайн-аппроксимация, р = 3, с; ^ параб куб относительная погрешность £°тн: абсолютная погрешность е^ос свидетельствуют в пользу более длинных временных рядов, по¬ скольку влияние случайных выбросов в них на образуемые ГФ в значительной степени ослаблено. То же самое можно заметить в пользу временных рядов, элементы которых образуются нара¬ стающим итогом при задании относительной допустимой погреш¬ ности аппроксимации е0. Оценивая машинную эффективность используемых алгоритмов сплайн-аппроксимации (в зависимости от вида используемых 86
j(ti)'fQ]2уел. ед. ikO - 180 - о о 2 ° I | | | | I ° I 1 1 1 1 О 10 W 30 ЬО 50 60 70 80 оо 100 г,усл.ед. Рис. 7.8. Длинный временной ряд (экономическая система) сплайнов), следует заметить, что среднее машинное время1 ап¬ проксимации Д,аш повышается с возрастанием р и уменьшением до¬ пустимой погрешности во (причем затраты времени меньше, если задана абсолютная погрешность аппроксимации). Диапазон вре¬ мени счета на ЭВМ ЕС-1040 /маш при этом, например, для вре¬ менного ряда с п = 1000 изменяется от долей секунды (р= 1, ео = 0,05) до 9,1 с (р = 3, 8о=10-7). Следует заметить, что указан¬ ное /маш первоначального образования ГФ временного ряда ха¬ рактеризует неоптимизированные демонстрационные программы, написанные на языке Фортран (см. приложение 2). В случае не¬ обходимости временные параметры программ сплайн-аппроксима¬ ции могут быть значительно улучшены. Естественно, время адап¬ тации ГФ к происшедшим изменениям на два-три порядка мень¬ ше времени первоначального образования ГФ. Проведенные эксперименты подтверждают обратную зависи¬ мость между ео и /маш; в дополнение к материалам 2.2 это обус¬ ловливает необходимость обоснованного установления е0 в целях повышения оперативности функционирования ДБД конкретной АСПИУ. 1 Использование среднего машинного времени аппроксимации вызвано рас¬ хождениями машинного времени, потребовавшегося для отдельных эксперимен¬ тов, в зависимости от начальных условий сплайн-аппроксимации. 87
Рис. 7.9. Зависимость допустимой погрешности аппроксимации е0 от количеств? М подфункций ГФ для длинного временного ряда (экономическая система): 1—линейная сплайн-аппроксимация, р= 1, с; 2—параболическая сплайн-аппрокси¬ мация, р=2, “7маш ,.«2,4 с; 3—кубическая сплайн-аппроксимация, р = 3, t\\«1,4 с; г параб кУо относительная s0TH; абсолютная погрешность £а^с 7.3. ДОСТОВЕРНОСТЬ И ОШИБКИ ПРИ ИСПОЛЬЗОВАНИИ ПРОГНОЗИРУЕМЫХ БАЗ ДАННЫХ Важным прикладным аспектом ДБД является использование ее прогнозирующих свойств, что, в свою очередь, ставит проблему достоверности данных, выдаваемых ПБД для соответствующих будущих моментов времени. В любом из методов прогнозирования временных рядов прогноз элемента временного ряда на будущий момент времени представляет собой, по существу, оценку ожидае¬ мого распределения значений информационного объекта в буду- 88
Рис. 7.10. Характеристика ГФ, образованных сплайнами разного порядка, по коэффициенту сжатия kcm данных в зависимости от е0 • *' техническая и экономическая системы (короткий временной ряд); —. — . — . техническая и — — * экономическая системы (длинный временной ряд) щем. На точность результатов прогнозирования с помощью вре¬ менных рядов влияют следующие факторы: ошибки исходных данных; несовершенство модели прогнозирования; погрешность вычислений; длина исходного временного ряда; случайная составляющая временного ряда (шум входных сиг¬ налов) ; период упреждения. 89
Рис. 7.11. Характеристика ГФ, образованных сплайнами разного порядка, по коэффициенту сжатия kcm данных в зависимости от е0, п = 1000 Таблица 7.4 Параметры ГФ временного ряда (лг= 1 ООО), образованного с помощью функции у — sin х, при аппроксимации кубическим сплайном Допустимая погрешность ап¬ проксимации e0 Количество подфункций ГФ M Количество хранимых коэффициен¬ тов т = М(р+1) Коэффициент сжатия k сж данных при ДО Машинное время 1 ап¬ проксимации для ЕС-1040 t маш,с Интервал упреждения2: 1 шагов про¬ гноза At в пределах г;-. 10-1 4 16 62,50 0,5 33 10-2 6 24 41,66 0,6 7 10-3 12 48 20,83 1,0 25 10-4 20 80 12,50 1,5 9 10-5 37 148 6,76 2,7 7 10-6 67 268 3,73 5,0 7 10-7 124 496 2,02 9,1 7 1 Указанное машинное время первоначального образования ГФ временного ряда, со стоящего из 1000 элементов, характеризует демонстрационные программы, написанные на языке Фортран. В случае необходимости временные параметры программ сплайн-ап¬ проксимации могут быть значительно улучшены. Естественно, время адаптации ГФ к происшедшим изменениям, как правило, на два-три порядка меньше времени перво¬ начального образования ГФ. 2 Интервал упреждения / зависит в значительной степени от количества дискретов времени, охватываемых последней подфункцией ГФ; в случае близости его к &сж, как показали эксперименты, / возрастает с уменьшением , а в последующем уменьшается до некоторого стабильного уровня. Методы «естественной» экстраполяции на основе ГФ. Основ¬ ным критерием достоверности прогноза на основе ГФ в ПБД (т. е. в естественном режиме) является сравнение вновь поступившего в ПБД дискретного значения q(iK + kt) временного ряда Dn с эле¬ ментом q(tKJrkt)y образуемым ГФ для момента (/К + Л^), и про¬ верка полученной погрешности е на соответствие во: <7 {tK + &t) — q (tK + Д*) e = >(tK + Д t) 90
где со(/к + Л/)—вес погрешности аппроксимации в момент (/К + Д/), причем для случая относительной погрешности со(/к + При использовании метода экстраполяции__ с применением ДО-операции V{ti) ошибка прогноза имеет вид е2 = ст2. По мере удаления в будущее ошибка прогноза возрастает, так как боль¬ шее значение по сравнению с инерцией приобретают накопившиеся изменения в структуре переменных-аргументов. Однако и при прогнозе на долгосрочную перспективу экстраполяция имеет пра¬ во на существование для укрупненной оценки элементов из Dn в будущем, вероятного эффекта от подобного развития процесса или перспектив функционирования системы в условиях стабилиза¬ ции множества переменных-аргументов. При прогнозировании по последней особой точке ошибка прогноза (при среднем значении процесса р = 0) где R(h)—корреляционная функция процесса. Средний квадрат ошибки прогноза растет от 0 при к — 0, когда R(k)=c2, до 2а2 при к-*-оо, когда 7?(оо)=0. Ошибка прогноза по математическому ожиданию процесса на основе нескольких смежных особых точек Средний квадрат ошибки прогноза растет от 0 при к — 0 до а2 Таким образом, при использовании методов «естественной» экстраполяции ошибка максимальна при прогнозе по последней особой точке. Ошибка уменьшается при применении более эффек¬ тивного экстраполятора. Пределом уменьшения ошибки прогноза является, как показано в [23], применение оптимального прогноза с полной информацией о предыстории и вероятностных характе¬ ристиках процесса. Методы прогнозирования с привлечением дополнительных ста¬ тистических данных. Оценка достоверности прогнозирования вре¬ менного ряда при недостаточности методов «естественной» экс¬ траполяции, а затем и выбор наиболее приемлемого метода (поль¬ зователем или автоматически) могут осуществляться по следую¬ щим критериям 1: по минимуму остаточной средней квадратической ошибки; по соответствию конечных разностей функции их дифференци¬ альным инвариантам; 1 Бокс Дж., Дженкинс Г. Анализ временных рядов: Пер. с англ. — М.: Мир, 1974. — Кн. 1. Прогноз и управление. — 406 с. + At) =q(t«+АЦфО. г"2=М J q(tK + h) — q(tt) = * — 2R {к) + о* = = 2[а*-Я(Л)], При к-^оо. 91
по критериям точности прогнозирования на ретроспективном периоде; по критериям регулярности коэффициентов уравнения; по критериям несмещенности ошибок сглаживания. Для простоты будем считать, что задача прогнозирования временных рядов при функционировании ПБД в автоматическом режиме (в случае непригодности гибридной модели) состоит в нахождении прогнозирующей функции, обеспечивающей требуе¬ мую (либо минимальную) погрешность прогноза е и, кроме того, имеющей возможно минимальное количество параметров. С уче¬ том введенных обозначений задача заключается в нахождении Qy 1 (Dn, t), такой, что Г2 = S? (и) — q (*i)l2 < eg. tt=tK Статистические вопросы функционирования ПБД в естест¬ венном режиме. В ходе проведенных экспериментов оценивались прогнозирующие способности ГФ (по достоверности прогноза) с точки зрения обеспечения эффективного функционирования ПБД в естественном режиме. Из всего комплекса вопросов рассмотрены следующие: определение зависимости погрешности прогноза от порядка р используемых в качестве ГФ сплайнов, допустимой погрешности е0 аппроксимации, вида отображаемого процесса; определение закономерностей, присущих ГФ, при их исполь¬ зовании в качестве экстраполяторов в АСПИУ; выработке на этой основе проектных решений, обеспечиваю¬ щих необходимую стабильность и эффективность функциониро¬ вания ДБД в режиме ПБД. Исследование зависимостей между е и р, ео проводилось с временными рядами различной природы и объема для аппрокси¬ мации линейными, параболическими и кубическими сплайнами \ причем использовались ряды, описанные ранее в 7.2. Ниже при¬ ведены результаты для следующих случаев: короткий временной ряд (/2 = 20) —техническая система (табл. 7.5, рис. 7.12); короткий временной ряд (/г=16)—экономическая система (табл. 7.6, рис. 7.13); длинный временной ряд (/г = 200) —техническая система (табл. 7.7, рис. 7.14); длинный временной ряд (/г = 105)—экономическая система (табл. 7.8, рис. 7.15). 1 В большинстве случаев анализировались прогнозирующие способности «закрытых» звеньев сплайна, т. е. априори было известно, что следующее реаль¬ ное значение не удовлетворяет ео, а это заведомо ухудшало соответствующие характеристики ГФ. По этой же причине в ряде случаев для длинных времен¬ ных рядов оказалось, что 1=0. 92
Таблица 7.5 Короткий временной ряд (п=20) — техническая система (на основе данных, приведенных на рис. 7.2) а са л к fin Допустимая Характеристики прогнозирующей подфункции ГФ Данные, характеризующие прогнозирую¬ щую способность ГФ (для ближайшего дискрета) « S о га Ч Я" погрешность аппроксима¬ ции £„ ? (/КН- АО д (tK + ДО q(tK + M)^{tK + At) о. аз о >. С-& п' е q(tK + M) с 1 2 1 3 1 4 5 1 6 1 8 я 03 0,0016 4 3 2 0,0009 0,0012 0,0000 0,3849 0,6534 0,9198 0,3894 0,6442 0,9301 0,0116 —0,0143 0,0117 0,0125 н о ч о о VO 03 0,0250 10 7 3 0,0221 0,0215 0,0023 0,8921 1,0466 0,9084 0,8415 0,9861 0,9320 —0,0601 —0,0613 0,0233 0,0382 Я Я »Я О) г Я 0,1000 16 4 0,0927 0,0045 1,1567 0,9150 0,9996 0,9301 —0,1581 0,0162 0,0872 ч 7 Q. я 03 я 0,0062 4 4 2 0,0054 0,0051 0,0000 0,6580 1,0223 1,0047 0,6442 0,9975 0,9861 —0,0214 —0,0249 —0,0306 0,0256 ч аз н я о о я 0,0250 6 7 6 0,0200 0,0231 0,0180 0,5869 1,0157 0,9816 0,5646 0,9636 0,9328 —0,0394 —0,0541 —0,0523 0,0486 о 0,1000 11 9 0,0846 0,0448 1,0033 0,9793 0,8912 0,9301 —0,1257 —0,0529 0,0893 я 03 0,0010 7 7 5 0,0010 0,0010 0,0010 0,6602 0,9906 0,9241 0,6442 0,9854 0,9328 —0,0248 —0,0053 0,0094 0,0132 Я я М о S ч о о VO я 0,0050 11 9 0,0044 0,0022 0,9798 0,8927 0,9812 0,9301 0,0015 0,0402 0,0209 0J я Я ч о 0,0100 14 6 0,0088 0,0012 1,0007 0,8960 0,9854 0,9301 —0,0145 0,0367 0,0256 я сх я С сч II я 2 2 ч 0,0062 3 3 3 0,0000 0,0000 0,0000 0,2972 0,5652 0,9734 0,2955 0,5646 0,9975 —0,0057 —0,0011 0,0242 0,0103 о. н я О О н 0,0250 5 5 5 0,0191 0,0202 0,0224 0,8513 1,0090 0,8843 0,8415 0,9975 0,9301 —0.01116 —0,0115 0,0498 0,0243 о 0,1000 10 9 0,0946 0,0850 0,8446 0,9251 0,8366 0,9328 —0.0096 —0,0042 0,0064 93
Окончание табл. 7.5 1 2 1 3 1 4 1 5 1 6 1 7 8 к л о О) ег к 0? 2 н о ч о о VO ей 0,0004 0,0250 13 5 20 0,0003 0,0003 0,0025 0,9705 0,9564 0,8814 0,9636 0,9640 0,9301 0,0071 —0,0078 —0,0524 0,0075 0,0524 VO к 1 1 >> со II ей И л ч (D н 0,0062 16 4 0,0035 0,0000 0,9981 0,9640 0,9996 0,9301 —0,0017 —0,0364 0,0191 С*. К о о я н о 0,0500 20 0,0182 0,9158 0,9301 0,0154 0,0154 Анализ полученных результатов позволяет сделать следующие выводы: 1. Прогнозируемые БД на основе ДБД обеспечивают эффек¬ тивность и необходимые прикладные характеристики их использо¬ вания в АСПИУ; даже при работе в заведомо ухудшенных уело виях (создание ГФ без механизма особых точек, использование «закрытых» подфункций ГФ в качестве экстраполяторов) обеспе¬ чивается, как правило, соответствие q(t) заданной г0 при /=Д/. 2. Полученные результаты не позволяют с большой определен ностью предпочесть какой-либо вид задания ео (абсолютная, от¬ носительная), хотя в проведенных экспериментах с возрастанием 80 прослеживается определенная тенденция к более точной экст¬ раполяции при задании абсолютной нормативной погрешности аппроксимации. Рис. 7.12. Оценка прогнозирующих способностей ГФ, образованных сплайнами разного порядка, для короткого временного ряда (техническая система): относительная погрешность; абсолютная погрешность 94
[лайн- Таблица 7.6 Короткий временной ряд (/г=16)—экономическая система (на основе данных табл. 7.1) Допусти¬ мая пог¬ Характеристики прогнозирующей подфункции ГФ Данные, характеризующие прогнозирующую способность ГФ (для ближайшего дискрета) решность аппрок¬ симации ео п' Q(tK+Lt) ?(/к+Д/)-7«К + А0 9(tK + M) - 1 3 4 1 5 1 6 1 8 я 03 0 2 2 2 0,00 0,00 0,00 14053 13377 11074 15321 13019 11469 —0,0828 —0,0275 —0,0344 0,0482 н 2 я о О VO СЗ 150 2 3 4 0,00 108,50 119,73 17107 11873 8524 15913 12577 8826 —0,0750 —0,0560 —0,0342 0,0551 Я сЗ я »я <v я я 300 6 3 5 131,14 157,94 157,84 13758 13718 9045 15321 12015 9950 —0,1020 0,1417 —0,0905 0,1114 я 7 о. К СЗ Я л 0,0062 3 3 2 0,0017 0,0014 0,0000 9326 13431 14138 9950 13019 15321 0,0627 —0,0316 0,0772 0,0572 я <и н я о о я (-1 0,0250 3 3 6 0,0148 0,0156 0,0102 9397 10613 13777 9283 11469 15321 —0,1345 0,0746 0,1008 0,1033 о 0,1000 8 8 0,0855 0,0449 14471 15730 12014 15322 —0,2044 —0,0266 0,1155 к Я 25 3 4 3 0,00 8,00 0,00 14529 13474 13384 15321 12977 12357 —0,0517 0,0383 0,0831 0,0577 к л я Я н 2 я о о \о сЗ 100 4 4 5 36,25 75,00 42,46 12954 10967 9289 13536 12107 9950 0,0430 —0,0942 —0,0664 0,0679 о а> я я *=3 о VO 300 4 5 6 100,00 274,31 229,81 17681 12111 10429 15913 12977 11469 0,1111 —0,0663 —0,0907 0,0894 03 CU а с сТ я я 0,0100 3 3 3 0,0000 0,0000 0,0000 10443 13310 18374 12107 13019 15913 —0,1374 0,0220 0,2154 0,1249 II CJ. 2 я <и н я о о 0,0250 3 3 5 0,0000 0,0000 0,0126 11655 10443 13644 11469 12107 15322 0,0160 —0,1374 —0,1095 0.0876 р о 0,0500 4 4 6 0,0413 0,0216 0,0219 8912 13662 - 14015 8826 12015 15322 0,0097 0,1371 —0,0853 0,0773 95
Окончание табл. 7.6 1 1 2 3 4 5 1 б 7 8 я си 25 5 4 4 1,46 0,00 0,00 9417 15569 14626 9950 12107 13536 0,0535 —0,2860 —0,0805 0,140! я cd н 2 1=3 о о хо cd 100 5 4 5 1,46 0,00 70,10 9417 16569 13801 9950 12107 13536 0,0535 —0,3686 —0,0196 0,147: Я о <V Я Я 200 7 7 190,70 139,50 12831 13421 12357 15322 —0,0383 0,1234 0,080V >> Я го II Я cd Я Л с 0,0062 5 5 4 0,0024 0,0006 0,0000 13561 13475 14528 12357 12977 15322 —0,0975 —0,0384 0,0518 0,062 О) н я о о н о 0,0250 4 5 6 0,0000 0,0198 0,0098 10064 14119 13707 8282 12015 15322 —0,2150 —0,1751 0,1054 0,165: 0,1000 16 0,0858 14511 15913 0,0950 0,095 ( Таблица 7.7 Длинный временной ряд (я = 200)—техническая система (на основе данных рис. 7.6) Порядок сплайн- функции р Допустимая погрешность аппроксима¬ ции е0 Характеристики прогнозирующей подфункции ГФ Данные, характеризующие прогнозирующую способность ГФ количество образую¬ щих дис¬ кретов п' максималь¬ ная погре¬ шность аппрокси¬ мации г количество смежных h, удовлетво¬ ряющих 20, 1 номер ша¬ га с мини¬ мальной погрешно¬ стью отоб¬ ражения средняя ность на ирог ЪК погрет- интервале ноза: ближай ший ди¬ скрет (относи тельная 1 i 1 ! 2 3 1 « 5 6 7 8 13 0,0012 2 0,0068 к 0,0013 9 0,0010 2 1 0,0080 0,0041 cd 5 я 11 0,0012 4 1 0,0038 о я Я н я с; 2 33 0,0191 — 1 0,0336 •=3 о 0,0200 40 0,0198 — 1 0,0339 0,0332 || хо cd 43 0,0041 10 3 0,0096 47 0,0397 1 1 0,0443 0,0400 58 0,0397 — 1 0,0521 0,0261 31 0,0015 >20 1 0,0422 96
Окончание табл. 7.7 1 2 3 4 5 6 | 7 1 8 к: то ЗС л 0,0050 17 17 4 0,0049 0,0049 0,0002 8 1 1 1 0,0115 0,0162 0,0011 0,0043 1! CJ Н К о о н о 0.0500 45 51 50 0,0483 0,0495 0,0499 — 1 1 1 0,0621 0,0701 0,0843 , 0,0542 0,1000 65 56 20 0,0998 0,0639 0,0080 >20 >20 1 34 1 . 0,1236 0,0575 0,0143 0,0582 « то 0,0010 34 56 4 0,0010 0,0009 0,2- 10-5 >20 1 1 8 0,0083 ! 0,0143 ; 0,0006 ! 0,0086 к а ас с-1 2 4 о о VO то 0,0100 79 88 33 0,0100 0,0099 0,0010 7 9 1 4 2 0,0177 0.0037 0,0071 0,0188 о а> V К о чо 0,0500 195 5 0,0487 0,2- 10-5 >20 3 8 0,0093 0,0006 0,0050 то а. то с Csf II Ci, к то ас л <D н S о о ас 0,0100 0,0250 17 16 15 25 25 19 0,0091 i 0,0092 0,0095 0,0237 0,0248 0,0216 9 6 7 10 8 5 1 4 1 6 8 0,0036 0,0168 0,0047 0,0098 0,0014 0,0022 0,0062 0,0024 н о 0,1000 179 21 0,0884 0,0639 5 5 1 0,0731 0,0732 0,0732 к ТО О О о VO ТО 0,0031 108 92 0,0031 0,0009 7 1 1 0,0066 0,0018 0,0026 w то « о <v 0,0125 0,0500 147 53 200 0,0122 0,0001 0,0400 >20 1 1 1 1 0,0213 0,0001 0,0592 0,0075 0,0460 Э" S vo >> X со II К то ас да <V н X о о н о 0,0031 0,0125 0,0500 16 15 И 35 28 6 106 56 38 0,0025 0,0030 0,0002 0,0112 0,0120 0,0001 0,0468 0,0465 0,0241 4 11 14 >20 3 12 16 1 1 1 1 6 2 1 4 1 0,0168 0,0259 0,0003 0,0214 0,0053 0,0001 0,0581 0,0286 0,0115 0,0100 0,0101 0,0276 Примечание. Шаг прогноза Г. 7—1156 97
P'Z p I I j I I 0 Z P 6 8 €gTH I I I 1 1 —J— 60 izo 180 ш ea0 Рис. 7.13. Оценка прогнозирующих способностей ГФ, образованных сплайнам;: разного порядка, для короткого временного ряда (экономическая система): относительная погрешность е°тп ; абсолютная погрешность е^с Рис. 7.14. Оценка прогнозирующих способностей ГФ, образованных сплайнам; разного порядка, для длинного временного ряда (техническая система): ■ относительная погрешность; абсолютная погрешность 3. При создании ПБД на основе ГФ, образованных без исполь зования особых точек и без соблюдения статистически обоснован' ных объемов выборки данных, возможны случаи значительны;' ошибок в оценке q(tK + l) при больших значениях I (в связи с влиянием случайных выбросов). Во избежание таких случаев мо¬ жет быть рекомендовано применение сплайнов более высокого порядка (р = 3). Кроме того, в случае необходимости повышения достоверности прогноза одним из методов является применение ГФ, образованных сплайнами со склеенными концами звеньег 98
Таблица 7.8 Длинный временной ряд (/2=195)—экономическая система (на основе данных рис. 7.8) Характеристики прогнозирующей подфункции ГФ Данные, характеризующие прогнозирующую способность ГФ я « га с; Допустимая погрешность количество образую¬ щих дис¬ кретов п' максималь¬ количество номер ша¬ га с мини¬ средняя погреш¬ ность на интервале прогноза: Порядок с функции j ЦИИ е0 ная погре¬ шность аппрокси¬ мации г смежных /г, удовлетво¬ ряющих £(>, мальной погрешно¬ стью отоб¬ ражения 5 /г ближай¬ ший ди¬ скрет (относи¬ тельная е) 1 2 3 | 4 5 6 7 8 к то 12,5 3 5 3 12,25 9,75 12,50 0 0 0 1 3 1 429 670 291 0,0131 КЕНИЭНИ1 н 2 |=3 о о VO то 100,0 10 5 2 93,00 99,13 0,00 0 0 0 3 1 4 499 285 313 0,0374 200,0 9 7 19 191.25 176.25 199,00 0 0 0 4 5 1 457 1348 1027 0,0529 7 с*. к то 0,0062 3 5 15 0,0047 0,0060 0,0061 0 0 0 1 1 1 0,0257 0,0412 0,0493 0,0153 >=3 а с-1 К О О К (-1 0,0250 5 8 20 0,0128 0,0137 0,0159 0 0 0 10 15 1 0,1458 0,0894 0,0640 0,1158 о 0,1000 13 21 17 0,0942 0,0998 0,0484 0 0 0 2 5 17 0,1553 0,0859 0,1337 0,1424 к то 25,0 4 5 4 19,25 24,56 18,69 0 0 0 1 1 1 744 650 353 0,0051 к то н 2 |=3 о о 50,0 9 5 15 36,09 49,84 48,12 0 0 0 1 1 1 468 94 916 0,0313 о о V К =? о 'О то 200,0 17 11 19 152,09 164,97 97,42 0 0 0 2 2 7 591 639 735 0,0654 V0 ТО О., ТО С II то £ <У н о о 0,0062 0,0250 5 9 6 5 20 13 0,0050 0,0062 0,0029 0,0233 0,0163 0,0199 0 0 0 0 0 0 4 2 2 5 4 5 0,0823 0,0120 0,0627 0,0299 0,0311 0,0479 0,0695 0,0844 о 1 0,1000 i 10 29 14 0,0982 0,0978 0,0308 0 0 3 2 1 2 0,2320 0,1604 0,0927 0.1138 7* 99
Окончание табл. 7.8 1 2 3 * I 5 6 1 7 1 8 к со Е О <v tr s VO к со Я О О О VQ со 25,0 100,0 200,0 6 5 8 15 6 20 11 7 15 24,31 20,44 20,07 63,63 97,50 89,79 95,46 171,59 48,83 8 0 0 0 0 0 0 0 0 3 1 1 1 1 5 1 1 3 215 524 969 1144 3551 983 672 2389 5421 0,0323 0,0553 0,405 E 5 0,0033 0 2 1874 со II К 0,0062 5 0,0061 0 1 4664 0,0842 СО К 13 0,0030 2 1 594 ►Я ч си 5 0,0188 0 1 3059 Я 0,0250 10 0,0248 0 1 4910 0,1521 о я 6 0,0214 0 1 7417 Е-1 О 17 0,0810 0 1 1779 0,1000 26 0,0885 11 2 489 0,0595 35 0,0705 9 3 881 Примечание. Шаг прогноза ft—1. (следует учесть, что это уменьшит &сж и оперативность функци¬ онирования ДБД). 4. При аппроксимации достаточно гладких функций, представ¬ ленных длинными временными рядами, количество смежных шя- I I I 1 I L. 60 120 180 2W Са060 Рис. 7.15. Оценка прогнозирующих способностей ГФ, образованных сплайнами разного порядка, для длинного временного ряда (экономическая система): относительная погрешность £qTH; абсолютная погрешность е^бс 100
гов прогноза, удовлетворяющих /, достигает довольно больших значений (/>10Д£), что позволяет ввести автоматическое установ¬ ление и отслеживание I для последней по времени отображения подфункции ГФ в ПБД (и на этой основе выдавать информацию пользователю о необходимости в определенный момент времени «замера» данных, изменения периодичности их сбора либо о не¬ поступлении в срок требуемых данных). 5. Проведенные эксперименты показали более высокую эффек¬ тивность ПБД при работе с временными рядами, характеризую¬ щими технические системы (хотя это, скорее всего, могло быть обусловлено конкретными временными рядами, исследованными в экспериментах, а не преимуществами одного вида систем над другим). ЗАКЛЮЧЕНИЕ Рассмотренный подход к использованию динамически ото¬ браженных данных в системах обработки информации является логически обусловленным этапом в развитии методов и средств информатики, связанным с проблемами и потребностями инфор¬ мационного обеспечения АСПИУ и последними достижениями в теории и практике смежных научных направлений. В частности, созданию подхода и реализации динамических баз данных в зна¬ чительной степени способствовали исследования в области времен¬ ных рядов, теории сплайнов, работы по искусственному интеллек¬ ту и др. В качестве основных достоинств динамического отображения данных по сравнению с традиционным, основанным на сборе, хра¬ нении и использовании данных, зафиксированных в прошедшие дискреты времени, следует выделить: обеспечение адаптивности и адекватности информации (ин¬ формационной модели соответствующей предметной области), хранимой в БД, реальным отображаемым объектам и отношениям в любой момент или период времени функционирования системы; естественность отображения временного фактора и сочетания дискретных и непрерывных данных; решение вопросов временной эволюции БД путем автомати¬ ческой актуализации данных, упрощающих работу служб адми¬ нистрирования БД; расширение возможностей использования БД в системах об¬ работки информации прежде всего благодаря естественному про¬ гнозированию процессов и отображению динамики функциониро¬ вания (тенденций развития) систем; уменьшение объемов хранимых данных за счет сжатия; естественность реализации в рамках существующих програм¬ мных средств, применяемых в системах обработки информации. Указанные в книге приложения (следящие системы реального времени, АСУ ТП, системы научных исследований) не исчерпы¬ вают возможных направлений использования ДБД в различных 101
системах обработки информации. Это обусловленно в значитель- ной степени возрастанием роли временного фактора в создании и функционировании разнообразных АСПИУ. Вместе с тем далеки от завершения и разработки в рамка.; самого подхода, требующего дальнейшего развития и расширения функциональных возможностей ДБД на основе существующих СУБД (в частности, совершенствование и автоматический выбор прогнозирующих функций, автоматическое установление допусти¬ мых погрешностей отображения в процессе функционировании системы), совершенствования временных характеристик алгорит¬ мов и программ формирования генерирующих функций, развития методов концентрации информации, применения ДБД в работах по искусственному интеллекту и т. д. С развитием указанных на¬ правлений новый подход, основанный на использовании времен¬ ных рядов и их динамическом отображении в БД, приобретет, как нам представляется, широкое использование в различных на¬ правлениях информатики. ПРИЛОЖЕНИЕ 1. Коды единиц времени из Общесоюзного классификатора «Система обозначении единиц величин и счета (СОЕВС), используемых в автоматизированных систе мах управления народным хозяйством для обработки технико-экономической информации». Код Наименование Код Наименование полное сокращенное полное сокращенное 351 наносекунда НС 360 неделя нед 352 микросекунда МКС 361 декада дек 353 миллисекунда мс 362 месяц мес 354 секунда с 363 тысяча часов тыс. ч 355 минута мин 364 квартал кварт 356 час ч 365 полугодие полгод 357 смена смен 366 год 358 день дн 367 пятилетка 359 сутки сут 368 век Дополнительные коды (не входящие в СОЕВС): 451 —468 — номера по порядку для соответствующих единиц времени, 066 — номер года внутри соответствующего века (два символа). ПРИЛОЖЕНИЕ 2. Алгоритмы программ сплайн-аппроксимации (демонстрационный вариант), вхо¬ дящих в состав МСК. 102
С УНИВЕРСАЛЬНАЯ ПРОГРАММА ОБРАЗОВАНИЯ Г# МЕТОДОМ СПДАЙН- С АППРОКСИМАЦИИ: С НАИЛУЧШЕЕ РАВНОМЕРНОЕ ПРИБЛИХЕНИЕ ОТРЕЗКАМИ ЛИНЕЙНЫХ, КВА- С ДРАТИЧНЫХ И КУБИЧЕСКИХ ПАРАБОЛ БЕЗ СКЛЕИВАНИЯ КОНДОВ С ЗА- С ДАННОЙ ОТНОСИТЕЛЬНОЙ ОШИБКОЙ (ДЕМОНСТРАЦИОННЫЙ ВАРИАНТ) С БЛОК ОПРЕДЕЛЕНИЙ REAL*8 T(IOOO),Y(1000>,EPS,SO,6,АР,AWvAZ,U С T - УПОРЯДОЧЕННЫЙ МАССИВ ВРЕМЕННЫХ МОМЕНТОВ РЯДА, ПРИВЕ- С ДЕННЫХ К ОБУСЛОВЛЕННОЙ ЕДИНИЦЕ ИЗМЕРЕНИЯ С Y - УПОРЯДОЧЕННЫЙ МАССИВ ЗНАЧЕНИЙ ВРЕМЕННОГО РЯДА (ПЕРЕД С ВХОДОМ В БЛОК НЕРЕХОДА НА РАСЧЕТ ПОДФУНКЦИЙ ГФ ДОЛХЕН БЫТЬ С ПРИВЕДЕН К ОБУСЛОВЛЕННОЙ ЕДИНИЦЕ ИЗМЕРЕНИЯ) REAL*6 F(IOOO) INTEGER ID(1000) С ID - ПЕРВИЧНЫЙ МАССИВ ВРЕМЕННЫХ МОМЕНТОВ РЯДА COMMON АР(4),AW<5),AZ(5),М CQMMON/Ы/ Ы(1000) СМ- ДОПОЛНИТЕЛЬНЫЙ ПЕРВИЧНЫЙ МАССИВ ЗНАЧЕНИЙ (ДЛЯ СЛУЧАЯ С АППРОКСИМАЦИИ ПРОИЗВОЛЬНОГО ВРЕМЕННОГО РЯДА, ОБРАЗОВАН- С НОГО ИЗ 2-Х РЯДОВ! Y И W); ПЕРЕД ВХОДОМ В БЛОК РАСЧЕТА С ПОДФУНКЦИЙ ГФ - ВЕС ПОГРЕШНОСТИ АППРОКСИМАЦИИ (ДЛЯ ОТ- С НОСИТЕЛЪНОЙ ПОГРЕШНОСТИ W=Y, НО НЕ ДОЛХЕН СОДЕРХАТЬ С НУЛЕВЫХ ЗНАЧЕНИЙ) С БЛОК УСТАНОВЛЕНИЯ И ПЕЧАТИ ИСХОДНЫХ ДАННЫХ С АА - НАЧАЛЬНЫЙ ВРЕМЕННОЙ МОМЕНТ, Н - МИНИМАЛЬНЫЙ ТАКТ С (ШАГ) ВРЕМЕНИ ВО ВРЕМЕННОМ РЯДУ, N - ОБШЕЕ КОЛИЧЕСТВО С ЭЛЕМЕНТОВ РЯДА, Е - ДОПУСТИМАЯ ПОГРЕШНОСТЬ ОТОБРАХЕНИЯ С (АППРОКСИМАЦИИ) АА=1. ВВ=22. Н-1. 103
N*16 М-3 СМ- ПОРЯДОК СПЛАЙНА MN=M+1 READ<5?5) <W<J)>J=1>15) REAB<5>5)<Y(J)> J=1r15) 5 FORMAT<5F15.4) W<16)=2966.828 Y(16)*186439. READ(5>88)(ID(J)>J=l>16) 88 FORMAT(1614) DO 85 J=1>N 85 Y(J)=W(J)#1000./Y(J)*1000. WRITE <6>82) 82 FORMAT<1H >15X>'ИСХОДНЫЕ ДИСКРЕТНЫЕ ДАННЫЕ') WRITE(6>81) (ID(J)>J=1>16) 81 FORMAT<3(I7>F10.1>5X)/5<I7>F10.1>5X)/5(I7>F10.1>5X) 1/3<I7>F10.1>5X)) DO 221 I=1>N ■ W<I)=Y(I) T(I)*ID(I)«1. 221 CONTINUE DO 20 IJ=1>3 EPS=.100/2.*«<IJ-1> WRITE(6>99) EPS 99 FORMAT(1H1>75X?'ВРЕМЯ СЧЕТА - V1H >56Х>'ДОПУСТИМАЯ» 1'МАКСИМАЛЬНАЯ ОвИБКА - '>G13.5/1H г 2 119<1Н-)/1Н >'1 НОМЕР I ТОЧКА I Ч42Х>'ВИД'>43Х> 3 '1МАКСММАДЬНАЯ1'/ 41Н >' ХП0ДФУН-1ЯВДЯЮЦ.I' >42Х>' И ' >43Х>' 101ИБКА 1?РЕД-1Г> 5/1Н >'1КЦИИ IКОНДОМ I'>27Х> 6 'КОЭФФИЦИЕНТЫ ГЕНЕРИРУВШЕИ ФУНКЦИИ'>28Х> 7 ЧСТАВЛЕНИЯ V/ 104
8 IX? * I(ЗВЕНА)Ir ?2Х»'О-'?4X?fK1f ?9X? * + * ?9X? rK2«Tr ? 9 8Х? r + r ?6Х?fK3#T*#2r ?7Х? ? + r ?6Х? ?K4#T*#3r ?12Х?fI ПОДФУН *КЦИИ IV1X? 119 (1Н-)) ’ С БЛОК ОРГАНИЗАЦИИ ОБРАЗОВАНИЯ Г£ J=1 N1=1 N2=N 8 К=0 . SOeY <1) IH=N2-N1 2 IH=IH/2 IF(IH.EQ.O) IH=1 CALL RNAB<T?Y?N1?N2?6) IF(G.GT.EPS) GOTO 7 IF(N2.EQ.N) GOTO 1 IF (IH.NE.1) GOTO 55 IF(K.EQ.1) GOTO 1 K=1 55 N2=N2+IH IF(N2.GT.N) N2=N GOTO 2 С БЛОК ПЕЧАТИ ДАННЫХ О ГЕНЕРИРУВЧЕИ ФУНКЦИИ 7 N2=N2-IH GOTO 2 1 WRITE(6?93) J?N2?(AP(KI)?KI-l?MN)rG 93 FORMAT<2X?I4?4X?I4?5(7X?G14.6)) IF<N2.EQ.N) GOTO 202 N1“N2+1 N2=N J«=J+1 GOTO 8 С БЛОК ЭКСТРАПОЛЯЦИИ (ЕСТЕСТВЕННЫЙ РЕ1ИМ#ПДБД>’ 202 K=ID(N) 105
WRITE(6»100) 3.00 FORMAT (1X»119(1H-)///) 92 QPR=AP<1)+K#(AP<2)+K#(AP(3)+K*AP(4))) K=K+1 WRITE<6»97) KrQPR 97 FORMAT <1H ?f ПРОГНОЗ! 'VN=M6f' Q(T) = SF15.5) IF(K.LT.ID(N)+10> GOTO 92 WRITE(6i101) 101 FORMAT(IX/////) 20 CONTINUE STOP END SUBROUTINE RNAB(XfYfNOfNrEE) С БЛОК СПЛАЙН-АШРОКСНМАЦИИ REAL«8 X(N)>Y(N)rFUN'EErCE REAL«8 A»W»Z»EP»Cl»S»P»E»V»RrGrD»Gl»G2?U»DU REAL«8 QW(5)»RW<1000) INTEGER К(5) COMMON A(4)fW(5)rZ(5)fM COMMON/W/ RW MI«M+1 MM=M+2 K(1)=N0 K(MM)=N PI*ARCOS(-1.) M1SINT <(M+3.)/2) DO 1 I=2>M1 KP*INT(.5*(N-NO)«COS((M+I)«Р1/(M+l))+(N+NO)«.5) IF(KP-K(I-l).GT.O) K(I)»KP IF(KP-K(I-l).LE.O) K(I)=K(I-1)+1 К (M+3-I)=N-K <I)+N0 106
IF (Z(3).NE.Z(l)) GOTO 1000 Z(3)=Z<2) W(3)=W(2) 1000 CONTINUE IF (NN.GT.2) GOTO 6 A(3)=0D0 A(2)=FUN(5»b4> GOTO 5 6 A (3) =(FUN(1»3»4)-FUN(5»3»4))/(Z(1)-Z(5)) A(2)BFUN(b3r4)-A(3)*(Z(l)+Z(3>) 3 IF(N.EQ.2) A(2)=FUN(4»1»3) S*ODO DO 22 I = bH S*S+A(H-1)*(Z<1)**H-Z<2>*«I> 22 CONTINUE A(1)=.5«<W<1>+W(2>-S) 4 EE-0.0 RETURN 2 IF(H.EQ.2.0R.M.EQ.3) EP=Z(4)+Z(2)-Z(3)-Z(1) Pf=(QW(3)#W(2)+QW(2)#W(3))#(QW(2)+QW(1))- *<QW(1)*W<2)+QW(2)*W<1))*<QW(3>+QW<2)) P2=(QW(4)*W(3)+QW(3)#W(4))#(QW(2)+QW <1))- *(QW(1)*W(2)+QW(2)*W(1))*(QW(4)+QW(3)) P3B (QW (5) #W (4)+QW (4) #W (5))#(QW(2)+QW(1))- *(QW(1)*W(2)+QW(2)*W(1))*(QW(5)+QW(4)) Ql=(QW (3)*1(2)##3+QW(2)*Z <3)##3)* < QW < 2)+QW <1)) *(QW(i)#Z(2)#*3+QW(2)#Z(l)#*3)#(QW(3)+QW(2)) Q2= (QW (4) #Z (3) #*3+QW (3) #Z (4) **3) * (QW (2) +QW (1)) - #(QW(1)*Z(2)«»3+QW(2)*Z(1)««3)*<QW(4)+QW(3)) Q3=(QW(5)*1(4)**3+QW(4)*Z(5)##3)*(QW(2)+QW (1)) - «(QW(1)#Z(2)**3+QW(2)#Z(1)##3)#(QW(5)+QW(4)) R1B(QW(3) *Z (2)##2+QW(2)#Z<3)*#2) *(QW(2)+QW(1))- *<QW<1)*Z(2)##2+QW(2)*Z<1)#*2)#<QW(3)+QW(2)) 107
1 CONTINUE DO И 1 = ЬНМ KPR=K<I) U(I)=Y(KPR) QW<I)=RW(KPR) Z <I)=X(KPR) 11 CONTINUE NN=N-N0+1 IF(NN.GT.MI) GOTO 2 IF(NN.LE.M) GOTO 3 IF(H-NE.3) GOTO 10 IF(DABS(Z(4)-Z<5)).GT.ID-3) Z(3)=Z<4> Z(4)*Z(5) P1=Z(3)-Z(1) P2=Z(4)—Z <1) P3=Z(4)#Z(4)+Z(4)*Z(2)-Z(2)#Z(1)-Z<1)#Z<1) • P4=Z<3)*Z <3)+Z(3)*Z(2)-Z(2)#Z <1)-Z(1)*Z(1) A <4) = ((FUNt4»2»4)-FUN(2»1»4))#P1-(FUN <3» 2»4)-FUN(2f1?4 «>)*P2>/(P3*P1-P4*P2) A (3) = (FUN <4 »2r 4)-FUN <2»1*4)+АЛ4)# <Z(1)#Z<1) + «Z<2)*Z<1)-Z<4)*Z<2)-Z(4)#Z<4>))/(Z<4)-Z<1)) A(2)=FUN(2»b4>-A(3)«(Z<2)+Z<l))-A<4)* #(Z(2)#Z(2)+Z(2)#Z(1)+Z(1)#Z (1)) A (1) =U (1) -A (2) #Z (1) - A (3) #Z (1) #Z (1) - A (4) #(Z(1)##3> GOTO 4 10 IF(H.NE.2) GOTO 12 A(3)=(FUN(НМ»1»3)-FUN(2f1f3))/<Z(MM)-Z(2)) A(2)=FUN <2?1r3)-A(3)#(Z(2)+Z(1)) GOTO 5 12 A(2)=FUN(MHfb2) GOTO 5 3 A(M+l)=0D0 IF(H.LE.2) GOTO 5 108
R2= (QW (4) *Z (3) #«2+QW (3) »Z (4) **2) * (QU (2) +QU < 1)) - * (QU(1)#Z(2)«*2+QW(2)#Z(1)#*2)#(QU(4)+QU(3)) R3* (QU <5)*Z(Л)#*2+QW(4)#Z(5)##2)#(QW(2)+QW(1))- *<QW(1)»Z<2)**2+QU<2>#Z(1)**2)*<QU<5)+QU<4)) Gl* (QW (3) *Z (2) -KIW (2) #Z(3))# (QU (2)+QU (1)) - #(QW(1)#Z(2) +QW (2)#Z(i)) # (QU (3) +QW (2)) G2*<QU(4) #Z (3) +QU(3) #Z (4)) # (QW (2) +QU (1)) - *(Qtf (1) »Z(2)+QW(2)*Z<1))*(QU(4)+QU(3)) 63*(QW(5> «Z(4)+QW(4)*Z(5))*(QU(2)+QU (1))- * <QW(1)#Z(2)+QU(2) *Z (1)) # (QW (5)+QW(4)) IF(M.NE.3) 60T0 80 A (4) * < (P3#G1-P1*G3) # <R2#G1-R1«G2) - (P2*G1-P1#G2) « *(R3#G1-R1#G3)) /((Q3*G1-QJ.#G3>* <R2*G1-R1*G2> - *<Q2*G1-Q1»G2>*(R3#G1-R1#G3)) A(3) = ((P2»G1-P1#G2)-A(4)# <Q2*G1-Q1*G2))/<R2*G1-R1*G2> A(2)=<P1-A(4)#Q1-A(3>*R1)/G1 A (1) = ((QU (2) *U(1)+QW(1)#U (2)) -A (4) * (QW (2) #Z (1) *«3 #+QW(1)#Z (2) «#3) -A(3)#(QW(2)*Z (1) #«2+QU (1) *Z (2)#*2) *—A (2> # (QW (2) #Z (1) +GW (1) »Z (2))) / (QU (2) +QU (1)) B1 S*0D0 DO 30 I=bM S=S+A(H-1)»Z(1)«*I ,30 CONTINUE P=DABS(U(l)-(A(l)+S))/QW4i) E=ODO DO 40 I=NO»N CE*X(I) 'IF(H.NE.l) GOTO 41 S*ODO GOTO 42 ■41 IF(H.NE.2) GOTO 43 S=CE*A(3) GOTO 42 109
8<Ъ А<3)* <P2*G1-R1*G2>/<R2*G1-R1*G2) A<2)=<P1-A<3)*R1)/G1 A<1)=<<QW<2)*U<1)+QW(1>*W<2))-A<3)*<QW(2)#Z<1)# 1»2#0У(1)#Z(2)*#2)-A(2)#(QW(2)*Z(1)+QW(1)#Z(2)))/ 2(QU(2)+QW(1)) GOTO 81 43 S*CE+<A(3)+CE*A<4)) 42 V«A(1)+CE«(A(2)+S) R*(V-Y(I))/RW(I) GaDABS(R) IF(G.LE.E) GOTO 40 E*G J-I D=R 40 CONTINUE G1=E-P B2=E*3D-3 IF(G1.LE.G2) GOTO 8 JJ*M+2 IH2*H+2 DO 50 I = bIH2 IF(DABS(X <J)-Z (I)) - LE.ID-5) GOTO 8 IF(X(J).GT.Z(I)) GOTO 50 JJ=I GOTO 7 50 CONTINUE 7 S=ODO DO 60 1=1rM S=S+A(H-1)»Z<JJ>##I 60 CONTINUE U=A(1)+S DU=<U-W(JJ))/QW(JJ)*D IF<DU«GT.0D0) GOTO 70 110
IF(JJ.EQ.1) GOTO 71 IF(X<J).GT.Z(JJ)) GOTO 72 Z(JJ-1)*X(J) W <JJ-1)*Y(J) QW(JJ-1)*RW (J) GOTO 2 72 IH6=h+l DO 73 I = bIM6 Z<I)»Z<I+1) W<I)=W<I+1> QW<I)*QW (1+1) 73 CONTINUE Z<HM)*X(J) W(HM)*Y(J) QW(MM)=RW(J) GOTO 2 71 I=H+2 75 Z<I)=Z(I-1) W(I)=W(I-1) QW (I)=QW<I—1) 1*1-1 IF<1.EQ,1) GOTO 74 GOTO 75 74 Z(1)=X(J) W(1)=Y(J) QW(1)=RW(J) GOTO 2 70 Z(JJ)=X(J) W(JJ)=Y(J) QW (JJ)=RW(J) GOTO 2 8 EE=E RETURN END 111
FUNCTION FUN(IIr12»13) С ПОДПРОГРАММА-ФУНКЦИЯ СЧЕТА ОНРЕДЕЛЯМИХ ПАРАМЕТРОВ REALMS A'UfZ'FUN'S COMMON A(4)»W<5)?Z(5)»M s=o. IF(I3.GT.M) GOTO 2 DO 1J=I3»M S=S+A<J+1)m(Z(I1)m*j-Z(I2)m#J) 1 CONTINUE IF(Z(I1).NE.Z(I2)) GOTO 2 FUN=<W <11)-W(12)-S)/.OOOOOl GOTO 3 2 FUN=(W<I1)-W(I2)-S)/(Z(I1)-Z(I2)) 3 RETURN END' ПРИЛОЖЕНИЕ 3. Результаты экспериментов (демонстрационный вариант) 1. Короткий временной ряд, техническая система: п = 20, 5 = 0 (вид ГФ — линейная сплайн-аппроксимация, р= 1). Допустимая ошибка (абсолютная пог¬ решность) ео = 0,1 ООО. Время счета 0,66 с. Номер Точка, являющаяся Коэффициенты генери¬ рующей функции Максимальная ошибка подфун¬ концом представления подфунк¬ кции подфункции ki k. ции 1 16 0,0262 0,0665 0,9270018- 10-1 2 20 1,3826 —0,0223 0,4467010- 10-2 112
Значение дискрета, вычисленное по ГФ (подфункция № 1) Ошибка в точке, обусловленная ДО Значение дискрета, вычисленное по ГФ (подфункция № 1) Ошибка в точке, обусловленная ДО 0,0927 —0,927* ю-1 0,2257 —0,270* 10-1 0,3587 0,307* 10-1 0,4917 0,729* Ю-1 0,6247 0,927* 10-1 0,7577 0,838* 10-1 0,8907 0,413* 10-1 1,0237 —0,383* 10-1 0,1592 —0,594* 10-1 0,2922 0,330* ю-2 0,4252 0,542* 10-1 0,5582 0,860* 10-1 0,6912 0,921 * 10-1 0,8242 0,670* 10-1 0,9572 0,640*10-2 1,0902 —0,927 • 10-1 2. Короткий временной ряд, техническая система: п—20, s = 0 (вид ГФ — кубическая сплайн-аппроксимация, р = 3). Допустимая ошибка (относительная погрешность) ео=0,625* 10-2. Время счета 0,28 с. Номер под¬ функ¬ ции Точка, являю¬ щаяся концом под¬ функ¬ ции Коэффициенты генерирующей функции Максимальная ошибка пред¬ ставления подфункции кг к-2 h к, 1 20 -0,101133 0,101502 —0,151559 • 10-3 -0,117547* 10-3 0,525077* 10-2 Номер точки 21 22 23 24 25 26 27 28 29 30 Прогноз Q(t) 0,92790 0,87496 0,80691 0,72304 0,62264 0,50501 0,36945 0,21525 0,04170 —0,15190 3. Короткий временной ряд, экономическая система: п= 16, 5 = 0 (вид ГФ — параболическая сплайн-аппроксимация, р = 2). Допустимая ошибка (относитель¬ ная погрешность) ео = 0,065. Время счета 1,03 с. Номер подфунк¬ ции Номер го¬ да, являю¬ щийся концом подфунк¬ ции Коэффициенты генерирующей функции Максимальная ошибка пред¬ ставления подфункции кх /г. К 1 72 —20 064,965 392,1882 0,17560 0,582496* 10-1 2 75 — 1 807 063,000 47 946,0313 —315,82813 0,0 3 81 — 14 679,547 344,3269 0,06831 0,218847* 10-1 4 83 —33 194,996 591,6641 0,0 0,0 8—1156 ИЗ
4. Короткий временной ряд, экономическая система: п= 16, 5 = 0 (вид ГФ-_ кубическая сплайн-аппроксимация, р=3). Допустимая ошибка (относительная погрешность) 8о=0,100. Время счета 0,34 с. Номер подфунк¬ ции Точка, яв¬ ляющаяся концом подфунк¬ ции Коэффициенты генерирующей функции Максимально 7; ошибка пред ставления подфункции kа *3 *4 1 16 550 736,0 —238 332,3 339,627 — 1,56985 0,750330- 10-' Номер года 84 85 86 87 88 Прогноз q(t) 14 719,25 14 767,94 1 14 704,68 14 520,05 14 204.64 5. Короткий временной ряд, экономическая система: п—16, 5 = 0 (вид ГФ кубическая сплайн-аппроксимация, р—3). Допустимая ошибка (относительная погрешность) е0 = 0,500 • 10-1. Время счета 0,37 с. Номер под¬ функ¬ ции Точка, являю¬ щаяся концом под¬ функ¬ ции Коэффициенты генерирующей функции Максимальная ошибка пред-' ставления подфункции k2 *3 К 1 2 7 16 —0,135060 • 107 —0,271451 • 107 61 936,2 111 426,0 —945,832 —1 514,720 4,83169 6,85103 0,224502- 10- 0,255754* 10- Номер года 84 85 86 87 88 Прогноз <7(0 ! 16 319,37 1 18 091,09 ! 20 286,30 22 946,11 26 111,62 6. Длинный временной ряд, техническая система: я=200, 5 = 0 (вид ГФ—■ линейная сплайн-аппроксимация, р= 1). Допустимая ошибка (абсолютная пог¬ решность) е0 = 0,1000. Время счета 1,18 с. Номер подфунк¬ ции Точка, яв¬ ляющаяся концом подфункции Коэффициенты генерирующей функции ki I k. Максимальная ошибка представ¬ ления подфункции I 89 0,0878 0,0114 0,991148- 10- 2 175 2,0473 —0,0105 0,995245- 10-1 3 200 3,1124 —0,0172 0,142574- 10-2 114
7. Длинный временной ряд, техническая система: п = 200, 5 = 0 (вид ГФ — линейная сплайн-аппроксимация, р= 1). Допустимая ошибка (относительная по¬ грешность) е0 = 0,Ю00. Время счета 1,2 с. Номер под¬ функции Точка, являю¬ щаяся концом подфункции Коэффициенты генерирующей функции кх | k. Максимальная ошибка пред¬ ставления под¬ функции 1 65 0,0039 0,0153 0,998377* 10-1 2 136 1,2315 0,0034 0.996046* ГО-1 3 180 2,9562 —0,0164 0,638631 • 10-1 4 200 3,0992 —0,0172 0,803964* 10"2 Значение дискрета,. вычисленное по ГФ (подфункция № 4) Ошибка в точке, обусловленная ДО Значение дискрета, вычисленное по ГФ (подфункция № 4) Ошибка в точке, обословленная ДО —0,0176 —0,803* 10-2 —0,1898 0,322* 10-2 —0,0348 0,806* 10-2 —0,2070 —0,423* 10-2 —0,0520 0,537* 10-2 —0,2242 0,726* 10-2 —0,0692 —0,913* 10-3 —0,2414 0,697* 10-2 —0,0865 0,247* 10-2 —0,2587 0.196* 10-2 —0,1037 0,791 • 10-2 —0,2759 —0,604* 10-2 —0,1209 0,435* 10-2 —0,2931 0,790* 10-2 —0,1381 —0,252* 10-2 —0,3103 0,624* 10-2 —0,1553 0,580* 10-2 —0,3275 0,579* 10-3 —0,1786 0,754* IQ"2 —0,3448 —0,797* IQ-2 Номер точки 201 202 203 204 205 206 207 208 209 Прогноз q(t) —0,36197 —0,37919 -0,39641 | —0,41363 -0,43085 —0,44807 —0,46529 —0,48251 —0.49973 8. Длинный временной ряд, техническая система: п = 200, 5 = 0 (вид ГФ — параболическая сплайн-аппроксимация, р = 2). Допустимая ошибка (абсолютная погрешность) ео = 0,0500. Время счета 1,10 с. Максимальная ошибка пред¬ ставления подфункции 1 106 —0,003 0,0193 —0,000092 0,495395* 10-* 2 179 1,088 0,0064 ! —0,000069 0,244189* 10-1 3 184 3,311 —0,0193 ! 0,000005 0,218766* 10-3 4 200 4,197 —0,0289 1 1 0,000031 0,477409* 10-3 Номер подфунк- Точка, яв¬ ляющаяся | КОНЦОМ j подфу НК- 11 ИИ Коэффициенты генерирующей функции 8* 115
Значение дискрета, вычисленное по ГФ (подфункция № 1) Ошибка в точке, обусловленная ДО Значение дискрета, вычисленное по ГФ (подфункция № 1) Ошибка в точке, обусловленная До 0,0175 0,495 ю-1 0,0523 —0,392 ю-1 0,0872 —0,493 ю-1 0,1219 —0,485 10-1 0,1564 —0,444 ю-1 0,1908 —0,389 10-1 0,2250 —0,330 ю-1 0,2588 —0,268 ю-1 0,0349 —0,195 ю-1 0,0698 —0,466 10-1 0,1045 —0,495 ю-1 0,1392 —0,467 10-1 0,1736 —0,418 ю-1 0,2079 —0,207 10-1 0,2419 —0,299 ю-1 0,2756 —0,237 10-1 9. Длинный временной ряд, экономическая система: п=105, 5 = 0 (вид ГФ-- линейная сплайн-аппроксимация, р = 1). Допустимая ошибка (абсолютная пог¬ решность) ео=400,00. Время счета 1,90 с. Номер подфунк¬ ции Точка, яв¬ ляющаяся концом подфунк¬ ции Коэффициенты генерирующей функции Максимальная ошибка пред¬ ставления подфункции к.2 1 16 —588,4995 333,3333 355,1675 2 20 —2 151,4980 440,3333 21,8340 3 37 580,8125 386,6250 394,0625 4 40 —7 992,0000 603,0000 74,0000 5 55 3 652,5820 343,3569 360,7891 6 61 752,3125 418,7998 79,1016 7 63 1 776 675,0000 —28 199,0000 0,0 8 83 —28 376,8125 445,1052 282,0820 9 103 —24 445,5938 415,3684 209,6680 10 105 8 075,0000 121,0000 0,0 Значение дискрета, вычисленное по ГФ (подфункция № 1) Ошибка в точке, обусловленная ДО Значение дискрета, ■вычисленное по ГФ (подфункция № 1) Ошибка в точке, обусловленная ДО —255,1663 355,0 411,5002 — 14,5 1 078,1667 — 147,0 1 744,8333 —233,0 2 411,4998 —91,5 3 078,1663 —355,0 3 744,8325 —24,8 4 411,4961 7,5 78,1670 114,0 744,8335 — 102,0 1 411,5000 —251,0 2 078,1665 —231,0 2 744,8330 —217,0 3 411,4995 — 112,0 4 078,1646 —6,2 4 744,8320 355,0 116
10. Длинный временной ряд, экономическая система: п=105, 5 = 0 (вид ГФ — линейная сплайн-аппроксимация, р= 1). Допустимая ошибка (относитель¬ ная погрешность) е0 = 0,05. Время счета 1,8 с. Номер под¬ функции Точка, являющаяся концом подфункции Коэффициенты генерирующей функции к, 1 Максимальная ошибка представле¬ ния подфункции 1 2 3 4 5 6 7 8 9 10 12 20 40 62 65 81 85 105 8,0000 —452,3499 —589,9541 —2204,8655 579,5957 — 1818,3831 — 15778,2500 —26457,7344 —74545,6875 —32747,3711 92,0000 277,3391 312,0686 448,7778 369,6396 463,7500 252,6445 416,8396 1009,1016 505,1440 0,0 0,4366 0,4383 0,2440 0,4291 0,4951 0,2561 0.4817- 10-1 0,4086- 10-1 0,4218- 10-1 ю-1 ю-1 ю-1 ю--1 ю-1 ю-2 Значение дискрета, вычисленное по ГФ (подфункция № 8) Ошибка в точке, обусловленная ДО Значение дискрета, вычисленное по ГФ (подфункция № 8) Ошибка в точке, обусловленная ДО 1053,6758 0,506- 10-1 4388,3945 —0,170- 10-1 1470,5156 0,509- 10-2 4805,2344 —0,169 • 10-1 1887,3555 -0,124- 10-1 5222,0742 0,318- 10-1 2304,1953 —0.296 • 10-1 5638,3941 0,357- 10-1 2721,0352 —0,460 - 10-1 6055,7539 0,317- 10-1 3137,8750 —0,602 • 10-2 6472,5938 0,422- 10-1 3554,7148 —0,224- 10-1 6889,4336 0,445- 10-1 3971,5547 —0,228 • 10-1 7306,2695 0,506- 10-1 Номер точки 106 107 108 109 110 111 112 113 114 Прогноз Q (0 20797,89 21303,04 21808,18 22313,33 22818,47 23323,62 23828,76 24333,90 24839,05 11. Длинный временной ряд, экономическая система: /г = 105, 5 = 0 вид ГФ — параболическая сплайн-аппроксимация, р = 2). Допустимая ошибка (относитель¬ ная погрешность) е0 = 0Д500. Время счета 1,8 с. Номер Точка, яв¬ Коэффициенты генерирующей функции Максимальная ошибка пред¬ ставления подфункции под¬ функ¬ ции ляющаяся концом подфун¬ кции кг k2 *3 1 5 67,846 — 10,1277 38,106674 0,417575 • 10-1 2 12 —991,434 389,8228 —3,724736 0,451439- 10-1 3 20 — 1 983,766 417,9856 1,065543 0,241611 • 10-1 4 47 4 074,372 75,3232 5,978289 0,485812- 10”1 5 62 60 393,348 — 1 871,0137 21,659424 0,242676- 10-1 6 65 —23 928,000 508,0000 —2,000000 0,0 7 83 1 353,384 —369,2451 5,538840 0,194726- 10-1 8 105 103 128,188 —2 342,9753 14,836436 0,353024 - 10-1 117
Значение дискрета, вычисленное по ГФ (подфункция № 1) Ошибка в точке, обусловленная ДО Значение дискрета, вычисленное по ГФ (подфункция № 1) Ошибка в точке, обусловленная До 100,00 —0,418* 10-1 643,00 0,927* 10-2 192,00 —0,418* 10-1 931,00 —0,418-10-1 397,00 0,418 12. Длинный временной ряд, экономическая система: /г=105, s = 0 (вид ГФ — кубическая сплайн-аппроксимация, р — 3). Допустимая ошибка (абсолютная по¬ грешность) б0 = 320,0. Время счета 1,0 с. Номер под¬ функ¬ ции Точка, являю¬ щаяся концом под¬ функ¬ ции Коэффициенты генерирующей функции Макси¬ мальная ошибка представ¬ ления под¬ функции k.г *3 К 1 20 51,6791 913,2130 14,3797 —0,169568 154,267 2 40 15164,4000 —980,7260 39,2129 —0,355797 148,976 3 59 73843,6000 3171,3200 54,4657 —0,246233 314,534 4 63 —94930300,0000 4659010,0000 —76193,5000 415,333000 0,0 5 83 43558,0000 —2147,0400 30,3417 —0,114685 95,337 6 103 206913,0000 —6721,6800 72,7618 —0,247247 89,789 7 105 8075,0000 121,0000 0,0 0,0 0,0 Номер точки 106 107 108 109 ПО 111 112 113 114 115 Прогноз Q (0 20780,0 20901,0 21022,0 21143,0 21264,0 21385,0 21506,0 21627,0 21748,0 21869,0
ПРИЛОЖЕНИЕ 4. Справочник изменяемых ДО-операций для ГФ с видом s^O (не сплайн-аппрок¬ симация) s Расчетные соотношения V (t,) = kx -f- k2 tt\ $(*?.*?) = 2 —/и if-4 R(t{, ) — (k\ -f- k2t\) — + k2tff\ ■K (t[) = k2 V (tt) = ki + k2t[ -j- k3titf, ‘i S (t", tl>) = ^ (ki -f- k2tp + k3totp); R (t"r tf) = (^ + k2t* + k3t«t«) - (kt + k2t« + П (£,) = k2 + 2^3^, 5 (£", ^ + k3t* + kj^)', R (t*, t*) = (Л, + Щ + A3[^]2 + 64[^]3) - (ki+ktf +k3 [/»]» + + MW; n(tl) = k2 + 2k3ti + 2,kit\ 119
Продолжение приложения 4 3 Расчетные соотношения 4 ^ (U)= [а2] ** $(*?.<?) = 2 *i [*2]/p; /?(/», **) = ft,[ft'i — ft*?]; *(*,) = A, (ft2)'* In А2 5 v (*,) = ft, -f ft2ft,'«; 5(^'. <?) = 2 Л1 + *2(Лз)'р; ‘Р='У Ж*», ^) = л2[(*3)<'-(*з)<’]; «(*,) = Mfts)'1 In *з 6 vv^kM*1 /к * , <2 s (*?.*?)= 2 МА2)'Р(А8) р; Ж / /к 1 а /н I/11)1 Я(*?, *«) = ft, [(Л,)*' (А3)1 <> (А2) (А3)( <} ]; iz(ti) = 2ft, (ft2)'« (fts)^1’ In ft3 • 7 K(<i) = ft,ft^)i; $(*?.<?) = 2 M2*3,p; <p-<? (<K *" Я (*;, /“) = A, (ft!*-' — Ai‘J ); = ft,ft<*^ In ft2 • In fta • (As)'' 120
Окончание приложения 4 Расчетные соотношения 1ДО = Ах/( 1-М2е~м‘); 4 S(+4K) = 2 *i/0 +л2е-^); <Р=<" <;) = *,/(! +*2e"*J,?)-Ai/(1 + £2е~*3<‘); «(/,) = - Мг е~^*/(1 + *2е-Лз<<)2 Примечание. Все ДО-операции осуществляются с использованием особых и фиксированных точек, если нет указания на их игнорирование; k\, k3, k3, ^ — коэффициенты ГФ.
СПИСОК ЛИТЕРАТУРЫ ■1. Александров В. В., Горский Н. Д. Рекурсивный подход к представлению н анализу данных//Прикладная информатика.— 1984. — Вып. 2.— С. 102— 117. :2. Аппаратура потребителей СРНС «Навстар»/А. И. Волынкин, И. В. Кудряв цев, И. Н. Мищенко, В. С. Шебшаевич//Зарубежная радиоэлектроника.— 1983. —№ 4. —С. 70—91. 3. Атре Ш. Структурный подход к организации баз данных: Пер. с франц. / Под ред. В. И. Будзко. — М.: Финансы и статистика, 1983. — 317 с. 4. Баклашов Н. И., Солодихин Г. М., Сергеев Л. В. Комплекс средств для накопления и автоматизированной обработки данных при научных исследо ваниях//Изв. вузов СССР. Сер. Геодезия и аэрофотосъемка.— 1982.— № 1. —С. 76—82. 5. Бойко В. В., Савинков В. И. Проектирование информационной базы авто матизированной системы на основе СУБД. — М.: Финансы и статистика, 1982. — 172 с. <6. Варшавский В. И., Поспелов Д. А. Оркестр играет без дирижера: размыш¬ ления об эволюции некоторых технических систем и управлении ими. — М.: Наука, 1984. — 208 с. 7. Вапник В. Н. Восстановление зависимостей по эмпирическим данным. — М.: Наука, 1979. — 447 с. 8. Вейценбаум Дж. Возможности вычислительных машин и человеческий ра¬ зум. От суждений к вычислениям: Пер. с англ./Под ред. А. Л. Горели ка. — М.: Сов. радио, 1982. — 368 с. 9. Велихов Е. П., Выставкин А. Н. Проблемы развития работ по автоматиза¬ ции научных исследований//Управляющие системы и машины.— 1984.— № 4. —С. 3—12. 10. ГОСТ 14.413—80. Банк данных технологического назначения. Общие требо¬ вания. 11. Громов Г. Р. Национальные информационные ресурсы: проблемы промыш¬ ленной эксплуатации. — М.: Наука, 1985. — 237 с. .12. Гуляев А. И. Динамическое отображение данных в информационных базах и направления его использования в АСПР Госплана УССР//Информатика систем планирования союзной республики / Главниивц Госплана УССР.— Киев, 1985. —С. 79—90. 13. Гуляев А. И. Динамическое отображение данных в автоматизированных сис¬ темах научных исследований//Механизациия и автоматизация управле¬ ния. — 1987. — № 2. — С. 27—30. 14. Давыдовский А. Н. Некоторые вопросы использования вычислительной тех¬ ники в 1980—90-х годах//Зарубежная радиоэлектроника. — 1982. — № 5. —С. 51—60. 15. Дейт К. Введение в системы баз данных: Пер. с англ. — М.: Наука, 1980.— 464 с. 16. Демьяненко В. Ю. Программные средства создания и ведения баз дан¬ ных.— М.: Финансы и статистика, 1984.— 127 с. 17. Дерзский В. Г. Некоторые особенности разработки экстраполяционных мо¬ делей по коротким временным рядам//Прогнозирование поведения слож¬ 122
ных систем по коротким временным рядам. — Киев: Знание, 1977. — С. 15— 16. 18. Дешко А. И., Игнатенко Б. В., Павловский В. И. Непроцедурные языки манипулирования данными. Перспективы развития и классификации // Прог¬ раммирование.— 1985. — № 4. — С. 49—59. 19. Диалоговые системы в АСУ / В. М. Брябрин, Ю. А. Любарский, Л. И. Мику- лич и др.; Под ред. Д. А. Поспелова. — М.: Энергоиздат, 1983. — 208 с. 20. Rosenkrantz D. G. Dynamic database dumping//ASM SYGMOD, International Conf. of Management of Data, Austin, 1979. — P. 3—8. 21. Ершов А. П. Проблемы информатики на конгрессе ИФИП-80 // Прикладная информатика. — М.: Финансы и статистика, 1982. — Вып. 1. — С. 158—179. 22. Ефимов А. Н. Информационный взрыв: проблемы реальные и мнимые.— М.: Наука, 1985.— 160 с. 23. Ефимов А. Н., Рубанов В. Г. Оптимизация процессов первичной обработки информации в АСУ.— Киев: Техника, 1976.— 144 с. 24. Калиниченко Л. А. Методы и средства интеграции неоднородных баз дан¬ ных.— М.: Наука, 1983. — 424 с. 25. Комаров В. М., Заличев Н. Н. Вероятность столкновения геостационарных спутников и методы предотвращения их столкновений//Зарубежная радио¬ электроника. — 1986. — № 12. — С. 64—82. 26. Краткое сообщение.//Зарубежная радиоэлектроника, — 1983. — № 3. — С. 96. 27. Крукаускас Р. Сравнительные характеристики банков данных//Программи¬ рование на ЭВМ. — Вильнюс, 1981. — С. 137—170. 28. Мамиконов А. Г. Принятие решений и информация. — М.: Наука, 1983.— 184 с. 29. Мартин Дж. Автоматизация обработки данных без программистов / Пер. с англ. под ред. А. Н. Великотского. — София: С.-б. НИПИ «Интерпрограм¬ ма», 1982. — 403 с. 30- Мартин Дж. Организация баз данных в вычислительных системах / Пер. с англ. под ред. А. Л. Щерса. — М.: Мир, 1978. — 611 с. 31. Мостеллер Ф., Тьюки Дж. Анализ данных и регрессия / Пер с англ. под ред. Ю. П. Адлера. — М.: Финансы и статистика, 1982. — Кн. 1. — 317 с. 32. Натурный эксперимент: информационное обеспечение экспериментальных исследований / Н. И. Баклашов, А. Н. Белюнов, Г. М. Солодихин и др.; Под ред. Н. И. Баклашова. — М.: Радио и связь, 1982. — 303 с. 33. Некоторые проблемы обработки данных в США и Великобритании // Зару¬ бежная радиоэлектроника.— 1981. — № 3. — С. 107—116. 34. Овчаров JI. А., Селетков С. Н. Автоматизированные банки данных. — М.: Финансы и статистика, 1982. — 262 с. 35. Олле П. В. Предложения КОДАСИЛ по управлению базами данных: Пер. с англ. — М.: Финансы и статистика, 1981. — 278 с. 36. Паронджанов С. Д., Хазен Э. М. Алгоритм выделения траекторий самоле¬ тов в автоматизированной системе управления воздушным движением // Изв. АН СССР. Сер. Техническая кибернетика. — 1982. — № 2. — С. 195— 201. 37. Поляков В. И. Интеллектуальные системы доступа к данным//Управляющие системы и машины. — 1983. — № 3. — С. 66—72. 38. Попельнух В. И., Анпилогов Г. А., Корбут В. Б. Состояние и тенденции развития автоматизации прокатного производства//Приборы и средства автоматизации и системы управления. Сер. Автоматизированные системы управления. — М.: ВНИИТЭИ, 1985. — Вып. 2. — 50 с. 39. Попов Б. А. Аппроксимирующие сплайны с заданной ошибкой // Отбор и передача информации. — Киев: Наукова думка, 1980. — Вып. 60. — С. 56—57. 40. Попов Б. А., Теслер Г. С. Приближение функций для технических приложе¬ ний.— Киев: Наукова думка, 1980. — 580 с. 41. Попов Э. В. Общение с ЭВМ на естественном языке. — М.: Наука, 1982.— 360 с. 123
42. Поспелов Г. С. Системный анализ и искусственный интеллект//Проблемы вычислительной техники. — М.: МЦНТИ. 1981. — С. 21—42. 43. Савинков В. М., Вейнеров О. М., Казаров М. С. Основные концепции авто¬ матизации проектирования баз данных // Прикладная информатика. — М.: Финансы и статистика, 1982. — Вып. 1. — С. 158—179. 44. Сеничкин В. И. Автоматизированное построение базы данных иерархическом структуры//Автоматизация проектирования систем управления. — М.: Фи¬ нансы и статистика, 1981.—С. 47—58. 45. Стогний А. А., Паньшин Б. Н. Программное обеспечение управления вычис¬ лительным процессом в ВЦ и сетях ЭВМ. — Киев: Наукова думка, 1983. — 240 с. 46. Сяо Д., Керр Д., Мэдник С. Защита ЭВМ/Пер. с англ. под ред. В. Г. По темкипа. — М.: Мир, 1982. — 264 с. 47. Тиори Т., Фрай Дж. Проектирование структур баз данных/Пер. с англ. под ред. В. И. Скворцова. — В 2-х кн. — М.: Мир, 1985. — Кн. 1 — 287 с.. Кн. 2—320 с. 48. Тыугу Э. X. Концептуальное программирование. — М.: Наука, 1984. — 256 с 49. Ульман Дж. Основы систем баз данных: Пер с англ./Под. ред. М. Р. Ко- галовского. — М.: Финансы и статистика, 1983. — 334 с. 50. Хаббард Дж. Автоматизированное проектирование баз данных /Пер. англ. под ред. А. Л. Щерса. — М.: Мир, 1984. — 296 с. 51. Ходжаев В. А. Технология ГАП: состояние, проблемы, перспективы // Авто¬ матика и телемеханика.— 1986. — № 1. — С. 83—91. 52. Davis R. К. New Tools and Techniques to Make Data Base Professionals More Productive//J. Syst. Manag.— 1984.—Vol. 35, № 6. — P. 20—25. 53. Fung К. T. A Reorganization Model Based on the Database Entropy Concept ji Computer J. — 1984. — Vol. 27, № 1. —P. 67—71. 54. Johson J. America Answers Back//Datamation. — 1984. — Vol. 30, № 7.— P. 40, 43, 46, 51, 54, 57. 55. Kahn S. An Overwiew of Three Relational Data Base Products // IBM Sys¬ tem J. — 1984. — Vol. 23, № 2. —P. 100—111. 56. Suraweera F. Use of Doubly Chained Three Structures in File Organisation for Optimal Searching//Computer J. Cambridge.— 1986. — Vol. 29, № 1.— P. 52—59. 57. Sweet F. Data Flow Dynamics//Datamation. — 1985.—Vol. 31, № 17.— P. 125.
ОСНОВНЫЕ ТЕРМИНЫ И ОПРЕДЕЛЕНИЯ, ВСТРЕЧАЮЩИЕСЯ В КНИГЕ Автоматизированные системы переработки информации и управления (АСПИУ) — термин, объединяющий понятия автоматизированной системы об¬ работки данных (АСОД) и автоматизированной системы управления (АСУ) База данных (БД) — совокупность хранимых данных, используемых в АСПИУ [15] Банк данных — согласованная совокупность БД, программного обеспечения, лингвистических, организационных и технических средств для централизованно¬ го накопления и коллективного использования данных в АСПИУ Временной ряд — выборочная реализация последовательных во времени наблюдений исследуемого процесса Генерирующая функция — составная часть ДБД, отображающая временной ряд, который описывает функционирование того или иного объекта или отноше¬ ния предметной области, и обеспечивающая получение (генерирование) данных об этом объекте или отношении на любой момент времени в прошлом, настоя¬ щем и сравнительно недалеком будущем Динамическая БД (ДБД) — база данных, отображающих непосредственно динамику процессов соответствующей предметной области в виде тенденции их развития Динамическая информационная модель ■— информационная модель, пред¬ ставленная динамически отображенными данными Имитационная модель-—математическая модель, сохраняющая в той или иной степени логическую структуру системных явлений или процессов, а также характер и структуру информации о состоянии и изменениях системы и состав¬ ляющих ее объектах и отношениях Имитационное моделирование—метод анализа или прогнозирования раз¬ вития некоторой системы с помощью имитационной модели Интервал упреждения допустимый — временной интервал от момента, для которого имеются последние данные об отображаемом объекте (процессе), до момента, прогноз для которого с обусловленной вероятностью не отличается от последующего фактического значения на величину заранее заданной допустимой погрешности Информационное обеспечение (ИО) АСПИУ — составная часть АСПИУ, ко¬ торая предназначена для создания и использования совокупности информацион¬ ных объектов, необходимых для эффективного функционирования системы Информационно-логическая (инфологическая) модель данных — исчерпыва¬ ющее собрание сведений о предметной области, необходимое для проектирова¬ ния не только БД, но и информационной системы в целом [43] Информационный объект (объект БД)—элементарная поименованная со¬ вокупность данных, используемая для отображения реальности (например, по¬ казатель, отношение, отображающий элемент) Концентрационно-временное преобразование БД — автоматическая модифи¬ кация информации, хранимой в прогнозируемой БД, состоящая в ее концентра¬ ции и (или) развитии во времени 125
Концентрация информации — содержательное обобщение данных (возможно с потерей части исходных данных) Концептуальная схема данных — модель данных о предметной области, по¬ нятная различным пользователям, составленная на основе инфологическоп мо¬ дели данных Логическая структура (схема) БД — описание БД на основе концептуальной схемы данных Модель данных — способ формального представления (обработки) связен между информационными объектами БД Подсхема — описание части данных БД, ориентированной на применение определенным пользователем или комплексом прикладных программ Прогнозируемая БД (ПБД)—БД, позволяющая получать информацию о будущих моментах времени, а также о собственных будущих изменениях Сжатие информации — сокращение объема информации без потери какой- либо ее части Система реального времени — АСПИУ, работающая с учетом физического времени протекания процесса, которая управляет внешними объектами, полу¬ чая информацию, обрабатывая ее и возвращая результаты достаточно быстро для того, чтобы воздействовать на функционирование внешних объектов в тре¬ буемое время Система управления базами данных (СУБД) — совокупность программных и языковых средств, предназначенных для создания БД, их ведения и коллек¬ тивного использования в АСПИУ Следящая система — АСПИУ, воспроизводящая на выходе с определенной или заданной точностью данные о процессе, который изменяется по заранее неизвестному закону, для выработки на их основе необходимых управляющих сигналов Словарь данных — совокупность сведений об объектах, составляющих их элементах данных, взаимосвязях между объектами, их источниках, значениях, использовании и форматах представления [3] Физическая структура БД — описание расположения данных БД на носи¬ телях информации Целостность БД — обеспечение возможности восстановления БД в пригод¬ ное для работы состояние
ОГЛАВЛЕНИЕ Предисловие 3 Введение . . . .4 Глава 1. Информационное обеспечение систем обработки данных. Временной фактор в отображении реальности 1.1. Интегрированные базы данных: состояние и перспективы ... 6 1.2. Основные проблемы разработки и применения баз данных . . . 13 1.3. Динамичность систем. Использование временных рядов в отображе¬ нии реальности 15 Глава 2. Динамическое отображение процессов функционирования сложных систем в базах данных 2.1. Отображение временного фактора в системах обработки данных. Предпосылки перехода к динамически отображенным данным . . 20 2.2. Динамическое структурирование информационных объектов в базах данных 24 2.3. Разработка и применение баз данных при динамическом отображении временных рядов 29 Глава 3. Алгебра динамически отображенных данных. Генерирующие функции 3.1. Алгебра динамически отображенных данных . . 33 3.2. Генерирующие функции и методы их образования 36 3.3. Адаптация и корректировка генерирующих функций 41 Глава 4. Функционирование динамических баз данных 4.1. Структура динамических баз данных. Организация динамических баз данных на основе существующих СУБД 43 4.2. Особенности управления динамическими базами данных .... 45 4.3. Лингвистические, алгоритмические и программные аспекты реализа¬ ции динамических баз данных на основе существующих СУБД 49 Глава 5. Технологические аспекты создания и использования динами¬ ческих баз данных 5.1. Формирование динамических баз данных 55 5.2. Реорганизация динамических баз данных 58 5.3. Дублирование и восстановление информации в динамических базах данных. Безопасность и целостность баз данных. Контроль достовер¬ ности . . . ... 60 5.4. Концентрация информации . ... 64 Глава 6. Прогнозируемые базы данных 6.1. Концепция прогнозируемой базы данных и ее приложения . . . 66 6.2. Методы «естественной» экстраполяции данных на основе генерирую¬ щих функций 69 6.3. Методы прогнозирования с привлечением дополнительных статисти¬ ческих данных . . 70 127
Глава 7. Использование динамических баз данных в системах обработ¬ ки данных 7.1. Основные направления использования динамических баз данных в АСПИУ 74 7.2. Статистические вопросы динамического отображения временных ря¬ дов 81 7.3. Достоверность и ошибки при использовании прогнозируемых баз данных 88 Заключение 101 Приложение 1. Коды единиц времени из Общесоюзного классификатора «Система обозначений единиц величин и счета (СОЕВС), используемых в автоматизированных системах управления народным хозяйством для обработки технико-экономической информации» 102 Приложение 2. Алгоритмы программ сплайн-аппроксимации (демонстра¬ ционный вариант), входящих в состав МСК 102 Приложение 3. Результаты экспериментов (демонстрационный вариант) 112 Приложение 4. Справочник изменяемых ДО-операций для ГФ с видом s^O (не сплайн-аппроксимация) . . ... ... 119 Список литературы .... 122 Основные термины и определения, встречающиеся в книге 12”»
ЗАМЕЧЕННЫЕ ОПЕЧАТКИ На стр. 115 вторую таблицу следует читать: Значение дискрета, вычисленное по ГФ (подфункция № 4) Ошибка в точке, обусловленная ДО Значение дискрета, вычисленное по ГФ (подфункция № 4) Ошибка в точке, обусловленная ДО —0,0176 —0,803-10-2 —0,1898 0,537-10-2 —0,0348 0,247-10-2 —0,2070 0,435-10-2 —0,0520 0,580-10-2 —0,2242 0,322-10-2 —0,0692 0,726-10-2 —0,2414 0,196-10-2 —0,0865 0,790-10-2 —0,2587 0,579-10-3 —0,1037 0,806-10-2 —0,2759 —0,913-10-3 —0,1209 0,791-10-2 —0,2931 -0,252-Ю-2 —0,1381 0,754-10-2 —0,3103 -0,423-10-2 —0,1553 0,697*10-2 —0,3275 -0,604-10-2 —0,1786 0,624-10-2 —0,3448 -0,797-10-2