Text
                    ИНФОРМАЦИОННЫЙ БЮЛЛЕТЕНЬ
АССОЦИАЦИИ «ИСТОРИЯ И КОМПЬЮТЕР»

КОМПЬЮТЕРНЫЕ ТЕХНОЛОГИИ
И МАТЕМАТИЧЕСКИЕ МЕТОДЫ
В ИСТОРИЧЕСКИХ ИССЛЕДОВАНИЯХ
СПЕЦИАЛЬНЫЙ ВЫПУСК

ТРУДЫ МЕЖДУНАРОДНОЙ КОНФЕРЕНЦИИ

ПЕТРОЗАВОДСК, 1116 ИЮЛЯ 2011 г.

Петрозаводск
2011


ББК 63ф1а431 И665 Издание осуществлено при поддержке гранта РФФИ, проект № 11-06-06065 и Петрозаводского государственного университета Редакционный совет: к.и.н. В.Ю.Афиани (Москва), к.и.н. С.А.Баканов (Челябинск), ст. преп. Е.Н.Балыкина (Минск), д.и.н. Ш.А.Батырбаева (Бишкек), ст. преп. Е.В.Боброва (Москва), д.и.н. Л.И.Бородкин (Москва), к.и.н. Т.Я.Валетов (Москва), к.ф.-м.н. А.Г.Варфоломеев (Петрозаводск), д.и.н.В.Н.Владимиров (Барнаул), к.и.н. И.М.Гарскова (Москва), д.и.н. С.А.Жакишева (Алматы), к.и.н. Е.В.Злобин (Москва), д.и.н. В.В.Канищев (Тамбов), д.и.н. С.Г.Кащенко (Санкт-Петербург), к.и.н. Р.Б.Кончаков (Тамбов), д.и.н. С.И.Корниенко (Пермь), к.и.н. В.А.Куликов (Харьков), к.и.н. Г.В.Можаева (Томск), к.ф.н. М.В.Румянцев (Красноярск), к.и.н. И.Г.Силина (Москва), к.и.н. В.И.Тихонов (Москва) Редактор серии: Л.И. Бородкин Ответственные редакторы выпуска: А.Г. Варфоломеев, А.А. Рогов Рецензенты: чл.-корр. РАН Н.М. Арсентьев, д.т.н. Г.З. Залаев И665 Информационный бюллетень Ассоциации «История и компьютер». №37. Труды международной конференции «Компьютерные технологии и математические методы в исторических исследованиях» (Петрозаводск, 1116 июля 2011 г.).  Петрозаводск: 2011.  124 с. Материалы для следующих номеров Информационного бюллетеня можно присылать по адресу: 119992, Москва, Ломоносовский просп., д.27, корп.4, Исторический факультет МГУ, кафедра исторической информатики, к. Г423. Тел./факс: (495) 939-11-65 E-mail: borodkin@hist.msu.ru ISBN 9785802112977 © Ассоциация «История и компьютер», 2011 © Петрозаводский государственный университет, 2011
ОПЫТ РАБОТЫ АРХИВА РАН ПО ОБЕСПЕЧЕНИЮ ON-LINE ДОСТУПА К АРХИВНЫМ ДОКУМЕНТАМ В. Ю. Афиани, Е. В. Злобин Москва Одним из трендов развития современного архивного дела является обес печение свободного доступа кретроспективной информации - архи вным документам иматериалам. Это не только важнейшая черта т. н. информационного общества, но итенденция вдеятельности архивов, зафи ксированная втом числе, ина крупных международных конфере нциях а р1 хивистов, вкоторых авторы прин имали участие . Для Архива Российской Академии наук, хранящего уникальные документы по ис тории российской фундаментальной науки, зарубежной наук и, Академии наук, охватыва ющих период почти 300 лет, организация on-line доступа –одно из важне йших направлений вего деятельности по вовлечени ю документов Архи вного фонда РАН внаучный оборот. Основные направления деятельности Архива РАН по обеспечению on-line доступа кархивным документам следующие:  on-line доступ кдокумент ам непосредственно на сайте «Архивы Российской академии наук» (arran.ru) исайте информационной системы;  создание специализированного программного обеспечения для использования вархивных учреждениях сцелью обеспечения on-line до ступа кархивным документа м;  использование информационных ресурсов портала Академии наук, вчастности:  размещение коллекций (баз данных) переведенных вэлектро нную форму док у ментов из фондов архива на портале РАН (ras.ru);  публикация т.н. электронных коллекций (альбомов) на основе документов из фондов Архива иархивных собраний других академ ических учреждений напо ртале РАН(http://ras.ru/scientificactivity/ functioningsystems/e-collections.aspx);  размещение архивных документов на сайте «Электронная библи отека "Научное на следие Росс ии "» (e-nasledie.ru);  виртуальная выставочная деятельность архива. Архив РАН –од но из немногих архивных учреждений России , орган изовавших on-line доступ ко всем документам ряда фондов ученых. Для целей организации on-line доступа кдокументам архива силам исотрудн иков архива была создана специализированная информационная система «Арх и1 См. к примеру, -ой материалы Европейской 8 конференции ированию по элект (ECA) http://www.bar.admin.ch/eca2010/index.html?lang=en (9 августатакже 2011 V. Afiani,г.). E. А Zlobin. Experience of the Fundamental Archive of the Russian Academy of Sciences in digital and Internet activity/Abstract book. 8th European conference on Digital Archiving. 28 - 30.04.2010. Geneva, Switzerland. Swiss Federal Archives SFA. International Council on Archives ICA. P. 162 –163. 3
вы Российской академии наук» (ИСАРАН), доступ ккоторой осуществл яется через отдельный сайт, расположенный по адресу isaran.ru. Внастоящее время данную систему для on-line до ступа кдокументам постоянно испол ьзуют несколько десятков пользователей, втом числе ииз -за рубежа. На сайте ИСАРАН доступны список фондов (общее колич е ство 1828), реестр описей (2618), каталог отдельных документов (92 635). Для полноценного использовани явсех возможностей системы необходима регистрация, пол учение логина ипароля для входа иработы. Регистрация выполняется адм инистратором системы. Часть базы данных информационной системы арх ива недоступна для просмотра внешними пользоват е лями. Снею работ ают сотрудники архива, атакже исследователи вархивном ч итальном зале. Необходимо отметить, что информационная система создана сотру дниками архива винициативном порядке ираспространяется на безво змездной основе. Созданное вархиве программное обеспечени евкакой -то степени является альтернативой заказанному ииспользуемому Федерал ьным архивным агентством закрытому отраслевому ПО–программе «А рхивный фонд» , версия 4.0. Практическая вся работа Архива РАН по со зданию информационных систем, оцифровке докуме нтов, представлени документов вИнтернете ит.п. ведется по грантам РГНФ ипрограмм фу ндаментальных исследований Отделения историко -филологических наук РАН иПрезидиума РАН, спец иальных программ РАН. Одним из составных элементов ИСАРАН, спомощью которого ос уществляется наполнение базы данных споследующей возможностью орг анизации доступа on-line кдокументам, является программа Typer. Она предназначена для использования архивами академических учреждений при создании справочно -информационной документации –описей. Пос уществу это развитая форма вв о да информации вбазу, адаптированная под архивные задачи. Данная программа не требует никаких всп омогательных библиотек, установки SQL-сервера ит.д. Актуальную версию пр о граммы можно бесплатно скачать ссайта ИСА РАН. После инсталляции программа создаёт файл базы данных, вкоторой пользователь, как правило, это рабо тник арх ива, вносит информацию об архивных документах, описях, фондах, при необходимости сканирует ипомещает графические образы докуме нтов. После запол нения база размещается вИСАРАН истановится возмо жной обеспечить кней доступ on-line. Всвоей работе по обеспечению дистанционного доступа кдокуме нтам а р хив активно использует возможности, предоставляемые порталом Российской Академии наук –www.ras.ru. Вчастности, на портале разм ещены отсканированные образы документов из фондов архива. Сканиров ание иразмещение документов на портале выполнено отделом страховых фондов, размещенным впоселке Борок Ярославской области. Количес твенные характеристики коллек ций документов из размещенных на порт але фондов приведены вт аблице 1. 4
И если фамилии Морозова Н. А., Вернадского В. И., Вавилова С. И., Циолко в ского К. Э. уроссийских историков удивления не вызывают, то по поводу фондов двух других учёных хотелось бы да ть небольшие пояснения. Волею судеб, аточнее всоответствии сдекретом ВЦИК «Об администр ативной высылке» от 10 авг у ста 1922 г. преподаватель российской истории в вуз ах Одессы иНовороссийска Ант о ний Васильевич Флоровский на долгие годы становится ведущим специалистом поистории России вКарловом университете вПраге. Документы из его фонда могут представлять большой интерес для историков -славистов. Полная оцифровка его фонда была в ыполнена врамках проведения конкретного исследовательского прое к та. Истори ков же российской, и, особенно, советской науки могут заинтер есовать материалы, которые можно получить вon-line доступе из фондов пр езидентов Академии наук СССР, преемником которой является РАН –акад емиков Сергея Ивановича Вавилова иВладимира Леонтьевич аКомар о ва. Все вышеуказанные архивные документы Архива РАН доступны в виде графических файлов сканированных первичных архивных докуме нтов. Это, содной стороны, позволяет исследователям получить достато чно полное представление ореальном состоянии реальн ых архивных док ументов. С другой стороны, отсутствие трансформации текстовых док ументов втекстовые файлы путем распознав а ния рукописных материалов делает пока не возможным какой -либо контекстный поиск по содержанию документа, за исключением поиска по загол овкам фондов идел, времени создания документа ипр. Ещё одним способом обеспечения on-line доступа кдокументам арх ива является размещение на портале Академии наук т. н. электронных колле кций (альбомов). Основу этих web-публикаций составляет исследов а тель ская статья по теме публикации всопровождении иллюстративного ряда –обр азов документов иизобразительного материала (документов, ка р тин, гравюр, планов, чертежей, фотографий идр.), часто впервые публ икуемого. Архив РАНиспользует собственные архивные со брания документов (включая Санкт -Петербургский филиал АРАН) иколлекции других академически учреждений, выступая икак координатор подготовки этих публикаций. Да нные коллекции являются своеобразным сетевым вариа нтом подготовленны кизданию CD дисков. Ихобъединяет общее пр о граммное обеспечение. По сути это достаточно простая программа пр о смотра, или viewer, позволяющая просматривать и перелистывать заранее подготовленные и свёрстанные страницы, которые содержат как текстовую описательную часть, так игр афические образы архивных документов, иллюстрирующих излагаемый материал. При необх о димости иллюстрации можно увеличить. 5
Ɍɚɛɥɢɰɚ Оцифрованные документы из фондов доступные on-line через портал РАН ɑɢɫɥɨ % on-line ɞɨɫɬɭɩɧɵɯ Ⱥɤɚɞɟɦɢɤɢ ɱ ɇɨɦɟɪ ɜɬ Ɋɚɡɦɟɪ ɫɬɪɚɧɢɰ ɞɨɤɭɦɟɧɬɨɜɨɬɨɛɳɟɝɨ ɩɨɱɺ ɬ ɧɵɟ ɢɭɱɺɧɵɟ ɮɨɧɞɚ ɛ Ƚ ɥɢɫɬɨɜɨɛ ɴɺɦɚɮɨɧɞɚ Морозов Н.А. 543 135746 100 47,2 Вернадский В.И. 518 136302 30 4,16 Вавилов С.И. 596 13375 100 2,76 Комаров Л.В. 277 33241 80 8,5 Циолковский 555 К.Э. 31680 100 10 Флоровский 1609 А.В. 19031 100 1,54 Всего 6 369375 4 из –более 6 75% 74,16 Внастоящее время доступны следующие on-line коллекции докуме нтов: 1. « Президенты Академии наук »–подробные биографии руковод ителей Академии, проиллюстрированные архивными документами; 2. « Акварели Марии Сибиллы Мериан »–электронный альбом известной швейцарс кой художницы XVIII века, основу которого составила коллекция, зак упленная ещё Петром I. Особую известность принесли ей т.н. «Метаморфозы» - рисунки экзотических насекомых ирастений, кот орые она выполнила вдалеком Суринаме –колонии Голландии вто время. Публикация включает научный каталог собрания, хранящего вСПБ филиале АРАН. 3. « Атомная эра: вклад Академии наук »–трехчастевой иллюстрир ованный архивными фотографиями идокументами альбом, охватывающий пери од с20-хгодов XX века иначала исследований вобласти радиоа ктивности до создания пе рвой атомной бомбы вСССР. 4. « Награды Академии наук »–описания ифотографии золотых медалей Академии, атакже сведен ия опроизведенных награждениях за период с1959 по 2008 гг. 5. « Российская академия: коллекция портретов (17831841)»–несколько десятков портретов академиков, восновном из коллекции Пу шкинского дома (ИРЛИ) без к а ких -либо справок или комментариев. 6. «М.В. Ломоносов иего время» –объёмное иподробное описание деятельности выдающегося русского учёного вАкадемии наук, проилл юстрированное соответствующими архивными документами иматериал а ми. Виртуальная вы ставочная деятельность архива вкакой -то степени отражает те многочисленные выставки документов из фондов, которые архив систематич е ски организует ипроводит всвоём выставочном зале. Насайте размещаются иоригинальные виртуальные выставки, не име ющие тра диционных аналогов. Вна стоящее время виртуальная активность реализована через специальный раздел архивного сайта (www.arran.ru), доступно 10 виртуальных выставок, посвященных выдающимся ученым 6
XX столетия (химикам А.А. Байкову иН.С. Курнакову, биологу А. П. Богданову, инж е неру В.Г. Шухову, К.Э.Циолковскому, Н.А. Рындину иего коллекции по истории воздухоплавания), тематическим выставкам, сост оявшимся вВыставочном зале Архива РАН: «Российские биологи вИнст итуте Пастера», «Личность вгенетике: 2030-егоды XX века», «Музы в храме науки», иконография А.С. Пушкина всо брании Архива РАН. Новым направлением вработе Архива РАН по организации on-line доступа кдокументальным ивещественным памятникам, хранящимся в академических а р хивах, музеях ибиблиотеках долж на стать разработка виртуального музея Акад е мии наук. Многие реализованные Архивом РАН информационные проекты ун икальны. Несмотря на ограниченность имеющихся вего распоряжении р есурсов, Архив РАН вкооперации сдругими учреждениями Академии Наук ведет дос таточно активную и многостороннюю работу пообеспечению дистанционного доступа кдокументам своих фондов, открыт для совмес тных усилий сзаинтересованными учреждениями иотдельными исследов ателями для расширения представления научной информации вИнтернете . SOFTWARE TOOLS AND USER INTERFACES DESIGNED FOR HISTORICAL-LINGUISTIC PURPOSES OF PROJECT “MANUSCRIPT” ИНСТРУМЕНТАЛЬНО-ПРОГРАММНЫЕ СРЕДСТВА И ПОЛЬЗОВАТЕЛЬСКИЕ ИНТЕРФЕЙСЫ ИСТОРИКОЛИНГВИСТИЧЕСКОЙ НАПРАВЛЕННОСТИ ПРОЕКТА "МАНУСКРИПТ" V. A. Baranov Izhevsk Ⱥɧɧɨɬɚɰɢɹ Впубликации дается обзор пользовательских, редакторских иадм инистраторских модулей информационно -аналитической системы "Ман ускрипт" (портал системы: http://manuscripts.ru), предназначенной для по дготовки электронных Интернет -изданий средне вековых славянских рук описей идля лингвистического илингвотекстологического анализа отдел ьных текстов, коллекций ивсего ко рпуса. 1. General Description of System “Manuscript” The information-analytical system “Manuscript” (hereinafter –IAS “Ma nuscript”) is a complex of software tools (modules) ensuring operation on creation, administration, demonstration on the Internet and investigation of electronic full-text collections of the medieval Slavonic written heritage. All modules interact with a common database enabling operation with the units of texts and manuscripts organized in hierarchies, their relationships and values that adequately reflect the simulated objects and their relationships. All types 7
of operations on preparation of a separate manuscript, collection or a corpus as a whole can be executed in the remote mode simultaneously by several users. 2. Main Modules of IAS “Manuscript” The IAS “Manuscript” components can be divided into two groups: the modules for preparation of transcription and its markup and the modules for demonstration of data on the Internet. 2.1. Modules of Data Visualization The user web-modules ensure operation both with each separate manuscript or a collection (subcorpus) and the entire corpus as a whole. 2.1.1. Simple Query Form. The web-module ensures operation with a separate document and its fragments as well. The result form can be a text (original / converted) or indexes (a direct, inverse or quantitative index of word forms). See, for example, the electronic edition of the Ostromir Gospel (URL: http://manuscripts.ru/mns/main?p_text=40921436). 2.1.2. Multitextual Query Form. The web-module ensures operation with several documents, which gives comparative material obtained from several manuscripts. For this mode the list and table indexes and also the lemmatization results are offered as the result output forms. The user gets a possibility of:  forming a query on the basis of information on manuscripts, texts and fragments;  using several query parameters simultaneously;  saving retrievals for further operations over them. The module has a simple (URL: http://manuscripts.ru/mns/srch.simple) and an extended (URL: http://manuscripts.ru/mns/srch.complex?p_lang=RU) query web-form. Access to the simple and multitextual query forms is organized through the title pages of the collections. See, for example, the title page of the Service Menaion for May (URL: http://manuscripts.ru/mns/portal.main?p1=26). 2.1.3. Module of Retrievals and Queries It ensures data preparation for linguistic and textologic investigations. The module possibilities are the following:  implementation of complex queries and data retrievals on the basis of textologic, lexical and other values of the “Manuscript” database units;  execution of various operations over retrievals;  the result formation and type-out in the view required by the user. 2.1.4. Module of Demonstration of Parallel Corpora and Critical Editions The module of electronic critical [ECE] edition ensures search, ordering and visualization of the manuscript fragments containing the same work and is designed for textologic, linguistic and linguistic-textologic investigations (see, for example, the critical edition of the Slavonic Menaion for May: URL: http://manuscripts.ru/mns/portal.main?p1=26; Fig. 1. The electronic critical edition: “parallel vertical text” and variant readings). Unlike to the printed critical edition the ECE web-module gives to the user a possibility of independent adjustment of the representation of the materials 8
selected for comparison, which helps to solve a wide circle of problems associated with the text history and linguistic peculiarities of its copies. The ECE is based on the database of a group of manuscripts containing the same text that has established the relationships between the fragments and linguistic units matching each other and also the relationships between the text samples and lemmas. 2.1.5. Prototype of Module of Statistics It is designed for obtaining quantitative and statistic data on the linguistic objects of the full-text database on the basis of user retrievals. 2.2. Modules of Corpus Preparation The preparation web-modules ensure input, editing and page layout of the manuscript text, textologic and linguistic markup, annotation of texts, manuscripts and their fragments. 2.2.1. Editor OldEd The editor ensures operation with the documents having a complicated structure and graphic composition and their units [Редактор 2009]. The module features are the following:  interaction with the IAS “Manuscript” database;  input and editing of the database objects and establishing relationships between them;  input and editing of the properties and values of the highlighted units;  page layout of the electronic edition etc. The editor is a Win32-application with the traditional multi-window interface. 2.2.2. Morphologic Analyzer (lemmatizer) It ensures automatic analysis and synthesis of the word forms of the Old Russian grammatical dictionary, bringing the manuscript text samples to the initial form (lemma). The web-application gives to the users registered on the portal “Man uscript” the possibility of making morphologic analysis (linguistic markup) both of the whole text and its arbitrary range in the automatic mode and using the procedure of homonymy elimination in the manual mode. Lemmatization is performed on the basis of the electronic grammatical dictionary of the Old Russian that is being developed by the team of the project “Manuscript”. The basis of the lemmatization automatic procedures is formed by the units of the grammatical dictionary database and the rules of elimination of variation of text samples. The lemmatization results are used in the multitextual query web-form for automatic construction of indexes of initial forms (the direct, inverse, quantitative, full form and word index) both of separate documents and their parts and of the group of documents selected by the user. 2.2.3. Module of Textologic Markup The web-module for fragmentation of the copies of the same work (fragmentator) is designed for automatic analysis and search in the manuscript electronic copies of the fragments matching the fragments of the main already 9
marked-up manuscript (URL: http://manuscripts.ru/mns/cred.analyzer). The module gives to the user a possibility of editing the boundaries of the found fragments and to save the relationships between them in the database. The result is a parallel corpus of copies of the same work (see, for example, the parallel corpus of Slavonic copies of Gospels, URL: http://manuscripts.ru/ mns/portal.main?p1=30). Another function of the module is giving to the user a possibility of creation of a parallel corpus with flattering on the level of linguistic units. The word form invariants are the units of the so-called prototext of a specific work –the dictionary containing normalized word forms and also word combinations, combinations of word forms or syntactic fragments corresponding to separate word forms (see Fig. 2. Preparation of parallel corpus on level of linguistic units). 2.3. Auxiliary Modules They ensure auxiliary operations on administration, editing and translation of the full-text database and project portal. The following modules are among the most important:  the module designed for editing the properties and values of the objects in the “Manuscript” database,  the module designed for editing information on the project portal,  the module designed for administrating the rights of access to the portal resources,  the module designed for creation of the multilingual resources of the database and portal and some others. 3. Technology of Corpus Preparation Creation of linguistic corpora implies availability of not only user tools for data search, ordering and visualization but also special tools for corpus preparation –its editing, texts markup and other types of preparatory operations. It is possible to name the following stages of text preparation to introduce it in the corpus: 1. Preparation of the text transcript directly in the database: input, division of the text into words (editor OldEd). 2. Or: a) Preparation of the text transcript in an external editor: input, division of the text into words; b) preparation of tables of conversion into the “Manuscript” database, uploading (uploading procedures). 3. Publication of the manuscript for demonstration on the Internet, its introduction in one of the collection and/or creation of a separate entrance (the procedure of publication and opening of access to the document through the Internet). 4. Textologic markup (special editor OldEd, the module of fragmentation). 5. Automatic text lemmatization (the module of morphologic analyzer). 6. Publication of lemmatization (the procedure of publication) and giving access to lemmatization results (the multitextual query form). The most labor-consuming working stages are the first –text input –and the forth –its textologic markup. 10
The presence of the textologic markup enables search with account for analytic information on the fragments of the text or manuscript and also creation of a parallel corpus of manuscripts containing the same work. The project “Manuscript” developing in two lines – softwaretechnological and linguistic –today is, on the whole, a finished complex of web-tools both for preparation of the marked-up corpus of medieval Slavonic records and for its presentation on the Internet. Fig. 1. The electronic critical edition: “parallel vertical text” and variant readings Fig. 2. Preparation of parallel corpus on level of linguistic units 11
Acknowledgments The work is being implemented in the framework of the project “Invest igation of the dynamics of the grammatical system of the Russian language of the XI–XIV centuries (linguistic-textologic and corpus methods)” (award of RFFI No. 09-06-00298). Sources of Parallel Corpus and Electronic Critical Edition of Slavonic Menaion for May  Service Menaion for May (Putyatina Mineia), XI c. (RNB, Sof. 202), 135 leaves. URL: http://manuscripts.ru/mns/portal.main?p1=19&p_lid=1  Service Menaion for May, XII c. (GIM, Sin. 166), 176 leaves. URL: http://manuscripts.ru/mns/main?p_text=26361893  Service Menaion for May, XII c. (RNB, Sof. 203), 136 leaves. URL: http://manuscripts.ru/mns/main?p_text=27457098  Service Menaion for May, XIII c. (RNB, Sof. 204), 133 leaves. URL: http://manuscripts.ru/mns/main?p_text=26513641  Service Menaion for May, first half of XIII c. (BAN, Aleks.-Svirsk. 37), 2 leaves. URL: http://manuscripts.ru/mns/main?p_text=61883841  Festal Menaion (Service for May), end of XII c.–begin. of XIII c. (RNB, F.p.I.25), 1 leaf. URL: http://manuscripts.ru/mns/main?p_text=38495485  Festal Menaion for February-August, 1260, leaves: 1 leaf –212 rev.; 1352, leaves: 213 leaves – 232 rev. (GIM, Sin. 895). URL: http://manuscripts.ru/mns/main?p_text=62272010  Menaion for May– June, XIV cent. (RNB, OLDP, Q. 180), 7 leaves. URL: http://manuscripts.ru/mns/main?p_text=61883847  and also:  Menaion collection of sticherons, with notes, sticherons for SeptemberAugust, XII c. (BAN, 34.7.6), 203 leaves. URL: http://manuscripts.ru/mns/main?p_text=61376743  Menaion collection of sticherons, with notes, sticherons for SeptemberAugust, XII c. and XIV c. (GIM, Sin. 572), 216 leaves. URL: http://manuscripts.ru/mns/main?p_text=70766131  Menaion collection of sticherons (?), with notes (a sticheron for May 8 and 21), XII c. (RNB, SPb. DA.A.II.397), 1 leaf. URL: http://manuscripts.ru/mns/main?p_text=62111347 Electronic Resources and Abbreviations  MAF — Module of automated fragmentation [Electronic resource] // Manuscript: Slavonic written heritage / V. A. Baranov, S. V. Dubovtsev. — URL: http://manuscripts.ru/mns/cred.analyze (date of access: 03.06.2011).  ECE — Electronic critical edition [Electronic resource] // Manuscript: Slavonic written heritage / V. A. Baranov, S. V. Dubovtsev. — URL: http://manuscripts.ru/mns/cred.cred (date of access: 03.06.2011). 12
References 1. Баранов идр. 2007 — Баранов В. А. Автоматический морфологич еский анализатор древнерусского языка: лингвистические итехнологич еские решения [Электронный ресурс] / А. Н. Мир о нов, А. Н. Лапин, И. С. Мельникова [и др.] // 10-яюбилейная международная конфере нция « EVA 2007 Москва». — Мо сква, 2007. — URL: http://conf.cpic.ru/ eva2007/ rus/reports/report_1130.html (дата обращ е ния : 03.06.2011). 2. Baranov 2007 — Victor A. Baranov. The ideology and technology of creating online full-text digital collections of ancient and medieval slavonic manuscripts / Victor A. Baranov // International Conference on Applied Natural Sciences. Trnava (November 7– 9, 2007). — P. 199– 207. 3. Баранов 2008а — Баранов В. А. Проект «Манускрипт»: предвар ительные итоги // Современные информационн ые технологии иписьменное наследие: от древних текстов кэлектронным библиотекам: материалы междунар. науч. конф. (Казань, 26–30 августа 2008 г.) / отв. ред. В. А. Бар анов, В. Д. Соловьев. — Ка зань: Изд -во КГУ, 2008. — С32– 36. 4. Баранов 2008б — Баранов В. А. Полнотекстовые базы данных как основа для электронных изданий средневековых рукописей вИнтернете : требования, ре а лизация, перспективы // Scripta & e-Scripta : The Journal of Interdisciplinary Mediaeval Studies. Vol. 6. — Sofia : “Boyan Penev” Publishing Center; Institute of Literature, BAS, 2008. — C. 47– 64, 422. 5. Баранов -Гнутиков 2008 — Баранов В. А. Электронное критич еское издание средневекового текста: постановка задачи, основные треб ования иинструментальная подготовка / Р. М.Гнутиков // Современны е информационные технологии иписьменное наследие: от древних текстов кэлектронным библиотекам: матери а лымеждунар. науч. конф. (Казань, 26– 30 августа 2008 г.) / отв. ред. В. А. Баранов, В. Д. Соловьев. — Казань: Изд -во КГУ, 2008. — С37– 44. 6. Baranov 2008 — Victor A. Baranov. Development of the Processing and Visualization Technologies for the Linguistic Information in the Manuscript System: Lemmatization / Aleksey N. Mironov, Aleksey N. Lapin, Irina S. Melnikova [et al.] // JADT 2008 : actes des 9es Journé es internationales d’Analyse statistique des Données Textuelles, Lyon, 12– 14 mars 2008: proceedings of 9th International Conference on Textual Data statistical Analysis. Lyon (March 12– 14, 2008). / Scientific editors: Serge Heiden, Bénédicte Pincemin. — Lyon: Presses Universitaires de Lyon (PUL). — Vol. 2. — P. 137– 145. 7. Баранов -Романенко 2009 — Баранов В. А. Опыт разработки, со здания ииспользования кирилловского алфавита для полнотекстовых баз данных иИнтернет -изданий древнерусских рукописей XI– XIV веков / В. А. Романенко // Стандардизација старословенског ћириличког писма и његова регистрација уун икоду: Зборник радова са међународног научног скупа одржаног од 15. до 17. октобра 2007. године / Уредници Гордана Јовановић, Јасмина Грковић -Мејџор, Зоран Кост ић, Виктор Савић. — Бе о- 13
град: Српска академија наука иуметности, 2009. — С. 49– 62. — (Научни скупови: књига CXXV. Одељење језика икњижевности. Књига 20). 8. Баранов -Дубовцев 2010 –Баранов В.А., Дубовцев С.В. Электро нное критическое издание средневекового сл авянского текста: модель да нных ивизуализация лингвистических единиц / В.А. Баранов, С.В. Дубо в цев // Интеллектуальные системы впроизво д стве. –2010. –№ 1. –С. 280– 287. 9. Baranov 2010 — Victor A. Baranov. Machine-Readable Linguistic Internet Resources as a Basis for Historical-Philological Studies // Journal of Applied Mathematics, Statistics and Informatics. Volume 6, Number 2, December 2010. — Trnava: The University of SS. Cyril and Methodius, Faculty of Natural Sciences, 2010. — Pp. 63– 89. 10. Baranov-Birnbaum-Cleminson-Miklas-Rabus 2010 –Victor Baranov, David J. Birnbaum, Ralph Cleminson, Heinz Miklas, Achim Rabus. Proposal for a unified encoding of Early Cyrillic glyphs in the Unicode Private Use Area // Scripta & e-Scripta : The Journal of Interdisciplinary Mediaeval Studies. Vol. 8– 9. –Sofia : “Boyan Penev” Publishing Center ; Institute of Literature, BAS, 2010. –C. 9–26. 11. Редактор 2009 — Редактор OldEd: Руководство пользователя / Р. М. Гн утиков, В. А. Баранов. — Изд. 2-е, перераб. идоп. — Ижевск, 2009. — 121 с. ВИРТУАЛЬНАЯ РЕКОНСТРУКЦИЯ УСАДЕБНОГО КОМПЛЕКСА ГРАФА ХРАПОВИЦКОГО (КОНЕЦ XIXНАЧАЛО XX ВЕКА) Г. И. Борисов Москва Русское усадебное искусство во второй половине XIX –начале XX века переживало период расцвета. Стиль модерн придал ему особые к ра ски инепередаваемый колорит. Дворяне не жалели средств на обустройс тво своих поместий, ра з бивали огромные парки, строили целые усадебные комплексы, связанные общей планировкой и стилем построек. Однако здания этого периода, за исключением относительно небольшого числа, не пользуются вниманием исследователей. Они ветшают; некоторые из них прекратили свое существование вбурных событиях прошлого века, др угие находятся на грани исчезновения. Эти постройки составляют огро мный фонд красивейших зданий одного с тиля иодной эпохи, отобража ющих целый период вистории России. Сохранение их облика –дело огромной важности. Они являются отголоском русского серебряного века, его неотъемлемой ча стью. В современных условиях сохранение большинства этих памятников стан о в ится невозможным –их реконструкция требует вложения большого количества средств. В то жевремя памятников, подобных тому, который 14
лег воснову данной работы, очень много, финансирование же из них пол учают только единицы. Некоторые из зданий разрушаются са ми, другие о бретают новую жизнь, не связанную сих историческим прошлым. Это со здает площадку для виртуальной реконструкции такого рода объектов. Ви ртуальная реконструкция отдельных зданий иусадебных комплексов все б олее входит всовременную историческую науку. Она позволяет восстан овить внешний облик объекта вопределённый момент времени или просл едить его трансформацию за один хронологический промежуток. Виртуал ьная реконструкция не требует такого большого количества средств, как физическая реконструкция или полное восстановление объекта. Виртуальная реконструкция невозможна без научного изучения объекта ивсех связа нных сним тем, например, историй дворянских семейств. Наконец, она может широко применяться вобразовательном процессе: публикация вИнтерне те сегодня обязательна практически для каждой такой работы. Целью нашей работы является создание макета одного из самых примеч а тельных памятников русской усадебной архитектуры конца XIX  начала XX веков –усадьбы графа Храповицкого, находящейся на терр ито рии Судогодского района Владимирской области, недалеко от п. Муромцево, изучение ииспользование на примере данной реконструкци достижений современного 3D моделирования. Также очень важна пр облема привлечения внимания кпамятнику, возможн ости его изучения в дальнейшем уже врамках сугубо исторических или источник оведческих исследований. Выполнение поставленных задач не только позволит с охранить памятник архитектуры, восстановить его внешний облик, но и сделать информацию онем доступной идля исследователе й, идля пр остых любителей иску с ства ирусской истории. В качестве источников для виртуальной реконструкции здания пр ивлекались материалы разного типа. Донас не дошли чертежи особняка, что представляло определенную сложность при реконструкции. В Гос ударст венном архиве Владимирской области хранятся только документы по истории рода Храповицких –частные письма, описи имения, счета на разнообразные покупки, сделанные хозяином усадьбы для её постройки и украшения [1]. Эти источники дали нам материал по внутрен нему устро йству усадьбы, ее владельцу, атакже некоторые данные, касающиеся ее истории. Вкачестве основных источников для создания модели виртуальной реконструкции использовались план усадьбы, составленный ее совреме нной фирмой -владельцем [9], открытки сфотографиями исами фотографии усадьбы начала XX века, атакже фотоматериалы более позднего времени, по которым можно восстановить внешний облик здания ипаркового ко мплекса [7]. Там, где информации было недостаточно, привлекались совр еменные снимки, однак оих роль всоздании модели невелика, так как за последние двадцать лет усадьба, будучи необитаемой, разрушилась еще сильнее, чем после революции, когда на ее территории находился сел ьскохозяйственный техникум [3]. Методом анализа размеров строений по 15
фото графиям, разработанным Р. Шмидтом, и обработки фотографий в программе Photoshop CS3 были установлены размеры здания [8]. Также в процессе реконструкции использовались немногочисленные публик а ции разного рода, касающиеся истории, описания внешнего вида ипл анов реко нструкции памятника –работы искусствоведов [2, 4, 5], краеведов [3], ландшафтных дизайнеров [6]. В них был отражен различный материал, который активно использовался при восстановлении внешнего облика и истории развития усадебного комплекса. Созд ание модели виртуальной реконструкции объекта историко культурного наследия предполагает не только построение макета на осн овании данных источников, но ивключение вего публикацию сведений об объекте. Такая работа ос уществляется для того, чтобы сним мог работать не только специалист, но исам объект мог служить образовательным пр одуктом. Сэтой целью вего публикацию включены текстовые иисточн иковые материалы, посвященные истории усадьбы, процессу ее создания и развития как комплекса. На странице Интерне т -публикации доступны некоторые письменные источники ифотоматериалы, переведенные вэле ктронный вид, которые делают модель не только исследовател ь ским, но и образовательным продуктом. Сочетание графических итекстовых да нных делает доступ пользователя кнеобходимой информации легким ипо л ным. Вработе представлен участок усадебного комплекса, включающий в себя каскад прудов, часть паркового ансамбля иглавное здание имения. Этот выбор был обусловлен впервую очередь состоянием идоступностью источников. Сб ор материалов, построение модели ландшафта парка, со здание макета главного здания и, наконец, интеграция втрехмерную инт ерактивную среду геоинформационной системы для полноценного офор мления «виртуальной обучающей системы» –таковы основные этапы раб оты над проектом. Основой для геоинформационной системы послужил с овременный план усадьбы, доступный вИнтернете [9] иобработанный в программе Photoshop CS3. В рамках активного внедрения всовременную историческую науку технол о гий трехмерного моделирования вос становление облика массовых архитектурных памятников, представляющих историческую ценность, о днако лишенных возможности физического восстановления, представляет очень актуальным иперспективным направлением. Подобные объекты не только могут быть сохранен ыдля последующих поколений, но иподробно изучены, так как всилу своей многочисленности они часто остаются заб ытыми, хотя их ценность систорической, кул ь турной, архитектурной точек зрения очень велика. Работа может быть интересна иинформативна снау чно йточки зрения, так как можно проследить серией реконструкций процесс создания усадьбы или ее состояние на какой -то определенный момент, например, 1895 год, когда еще не была построена сама «замковая» часть – пристройка встиле английской готики. В то жев ремя трудоемкость и стоимость 3D реконструкции не сравнима сосуществлением физической 16
реконструкции объекта. Благодаря зрелищности, наглядности идоступн ости модели виртуальной реконструкции могут активно привлекаться во бразовательной деятельности для по вышения культурного образования с овременного человека. Основная работа повиртуальной реконструкции усадебного ко мплекса графа Храповицкого (конца XIX  начало XX века) завершена, с ней можно ознакомиться на сайте исторического факультета МГУ, вра зделе « научная работа» кафедры исторической информатики поадресу: http://hist.msu.ru/Departments/Inf/3D/borisov-proj.htm Ʌɢɬɟɪɚɬɭɪɚ 1. Государственный архив Владимирской области. ф. 632. 2. Вергунов А.П., Горохов В.А. Вертоград. М., 1996. 3. Голубева О., Касаткина Я., Романова С. “ Судьба имения В.С. Хра повицкого из XIX вXX век ”// Всборнике «Человек вистории. Россия – XX век». Конкурс 1999/2000 гг. Сборник материалов первого конкурса школьников Международного историко -просветительского иправозащи тного общества “ Ме мо риал ” . М., 2000. с. 313– 328. 4. Нащекина М.В. Русские усадьбы эпохи символизма // Русская усадьба. Вып.4, М., 1998. 5. Нащекина М.В. Архитекторы московского модерна. М., 1998. 6. Ожерельева М.“ Современники называли ее царской ”// Лан дшафтный дизайн, №1, 2002 г. 7. Свод памятников архитектуры имонументального искусства Ро ссии. Вл а димирская область. Часть 1. М., 2004. 8. Шмидт Р. Учение оперспективе / Пер. снем. А.П. Соловьёва; Под ред. Р.И. Гольцевой –М., 1983. 9. Графская усадьба: http://www.zamok-7x.ru DIGITAL HISTORY ИЛИ ИСТОРИЧЕСКАЯ ИНФОРМАТИКА? Л. И. Бородкин Москва Активное развитие междисциплинарной области, связанной сприм енением компьютерных технологий висторических исследованиях иобр азовании, породило впоследние годы немало дискуссий осоотношении термино в, определяющих методологические итехнологические аспекты этой области, ее теоретические иприкладные направления. Наряду сте рминами, ставшими уже привычными –History and Computing, Historical Information Science, историческая информатика –всё чаще вст речается термин “Digital History” (буквальный русский перевод –«цифровая ист ория» –представляется не вполне адекватным, т.к. наводит на мысль, что речь идет об «истории вцифрах», ориентированной на изучение статист ических источников). Можно говорить опопытках вытеснения устоявши х17
ся названий области новым названием. Вданной заметке попробуем раз обраться всоотношении этих терминов, вих содержательном наполнении. Сэтой целью обратимся купомянутым зарубежным публикациям, атакже кматериалам портала “D igital History” созданного кафедрой истории ун иверситета Небраска -Линкольн (США). Digital history обычно связывают сприменением цифровых медиа и инструментов впрактике исторических исследований, взадачах презент ации ивизуализации, висторическом образо вании, рассматривая это направление как ответвление отболее широкой области History and Computing. Если обратиться кболее ранним работам, упоминаемым вко нтексте Digital history, то ссылаются, как правило, на разработку электро нных текстов, оптических ди сков (CD-ROM), интерактивных карт, онла йновых презентаций учебного материала, виртуальных реконструкций, а также на проекты оцифровки архивных, музейных ибиблиотечных фо ндов, организации виртуальных выставок. В публикациях последних лет Digital history св язывают иногда сразработками совместных проектов, онлайновых соо бществ исоциальных (профессионально -ориентированны сетей, основанных на инновационных технологиях Web 2.0. Помнению Дж. Фрау, Digital history ориентируется на создание новых методов ци фро вой записи документов иартефактов, ихсохранения иобращения к ним; определение аутентичности цифрового контента; разработку техн ологий перевода архивных материалов, оцифрованных вустаревших медиа форматах, вболее современные форматы истандарты; облегч ение доступа коцифрованным данным пользователям сограниченн ыми возможностями (в силу возрастных или экономических факторов). Судя по всему, первыми внедрили термин Digital history америка нские исследователи Э. Эйерс иУ. Томас, учредившие в1997 г. Virginia Center for Digital History (VCDH) при университете Вирджиния (хотя тр емя годами раньше, в1994 г., Р. Розенцвейг открыл Center for History and New Media (CHNM) вуниверситете Дж. Мейсона; вего названии не использовался еще термин Digital history). В последние годы появились статьи ряда авторов, которые вошли в поле Digital history на основе своего опыта работы скомпьютерными те хнологиями, цифровыми медиа вразличных междисциплинарных проектах гуманитарного профиля, всфере сохранения культурного насл едия (вкл ючая музеи, архивы, библиотеки), впроектах по созданию масштабных эле ктронных ресурсов. Вэтих статьях Digital history определяется как широкая область прикладных разработок, призванных усовершенствовать работу историков –исследователей ипрепод авателей на основе компьютерных («цифровых») технологий, облегчить доступ пользователей коцифрова нным историческим ресурсам, повысить степень их наглядности ивизуал ьной репрезентации. Одним из наиболее цитируемых авторов этого направления является Пол Л. Артур, заместитель директора Национального биографическо 18
Центра изаместитель Генерального директора проекта по изданию авс тралийского биографического словаря при Австралийском национальном университете (г. Канберра). П. Артур возглавляет также Австрали йско Азиатскую ассоциацию “Digital Humanities”. Встатье отенденциях разв ития методов e-Research вгуманитарных исследованиях П. Артур пишет, что укрепляющийся альянс гуманитарных наук иинформационных техн ологий, выявляемый ичерез растущую популярность таких терминов, как “digital humanities”, “humanities computing”, “e -Research", свидетельству опоявлении «пограничной зоны» вконкуренции между традиционными и новыми подходами визучении ипреподавании гуманитарных дисциплин вуниверситетах. В другой своей статье, отталкиваясь от тенденций развития цифр овых медиа -технологий, применяемых вмузейном деле, П. Артур предл агает классификацию основных направлений, составляющих Digital history. Автор отмечает, что «цифровое представление» истории становится ра стущим направлением врамках учебных дисциплин, как традиционно св язанных сизучением прошлого (например, истории иархеологии), так и связанных систорией меньше, чем створческим осмыслением прошлого (имея ввиду, например, литературу, медиа -искусства, ида же портретную живопись). Без сомнения,  пишет П.Артур,  наиболее важная работа, к оторая проводилась вобласти Digital history –это оцифровка материалов первичных источников, позволявшая обеспечить широкий доступ кко ллекциям данных, практически недо ступных ранее. Внастоящее время мы только начинаем оценивать те перспективы, которые получают исследов атели (и обучаемые) врезультате масштабных проектов по оцифровке исторических источников (особенно тех проектов, которые имели поддер жку втечение целог оряда лет). П. Артур выделяет четыре направления, характеризующих, поего мнению, содержание Digital history. При этом каждое из этих направлений может включать элементы трех др угих. Первое из этих направлений П. Артур связывает свиртуальной реконструк цией объектов культурного наследия, пространственной репр езентацией иГИС -приложениями висторических исследованиях. Совр еменные технологии 3D-моделирования позволяют реализовать реконс трукцию ивизуализацию объектов культурного наследия, сиспользован ием 3D-рендеринга (представления) ианимации, атакже цифровую реста врацию объектов. Быстро признанный передовыми музеями, этот подход в течение последнего десятилетия оказал заметное воздействие на методику музейных реконструкций, организацию виртуальных выст авок. Интере сный пример таких разработок дает проект, реализованный в19972003 гг. вКалифорнийском университете (Лос Анжелес) на базе известной лаб оратории UCLA Cultural Virtual Reality Laboratory. Вэтом проекте была построена цифровая 3D модель Римског оФорума позднеантичного времени. Многообещающей перспективой использования такого моделирования П. 19
Артур считает проверку гипотез об альтернативных сценариях визуализ ации объектов историко -культурного наследия. Смежной областью первого направления Digital history П.Артур называет технологии построения пространственных репрезентаций истор ической информации на картах сиспользованием ГИС (географическ информационных систем). Это еще один вид визуализации, но, как отм ечает автор, этот подход идет дальше, че м3D-рендеринг, фиксируя связи между слоями пространственной информации. Так, недавно набазе Virginia Center for Digital History был осуществлен исследовательс проект об истории рабства вТехасе. В результате пользователь может просматривать слои карты Техаса, которые показывают, например, чи сленность рабов ирабовладельцев влюбом округе этого штата на интерв але с1837 по 1845 года. Информационный потенциал подобной системы определяется характером базы данных, связанной скартой. Второе направление Digital history П. Артур связывает сразработкой крупномасштабных информационных Интернет -ресурсов, которые шир око известны как онлайн энциклопедии, атласы исловари. Ихбазы данных открыты и допускают расширение и редактирование, не претендуя на полное или бесспорное знание. Так, вмузейной сфере заслуживает уп оминания крупный британский проект, начавшийся в2009 г.,  the National Museums Online Learning Project, врамках которого создается портал, набор блогов иобъединенный информационный поиск, охватывающ ий фо нды девяти брита нских музеев. Третье направление Digital history, по П. Артуру –это применение интера к тивных гипермедиа -технологий, экспериментальных форматов, отличных от «л инейного нарратива». Примером таких разработок может служить The Labyrinth Project, который был начат более 10 лет назад Анненбергским Центром коммуникаций вуниверситете Южной Калифо рнии, признанном лидере мультимедийных документальных разработок (преимущественно биографического характера, они содержат много виз уальной информации , удобную навигацию, включающую 3D-рендеринг, карту -интерфейс ит.д.). Соответствующая база данных обеспечивает режимы информационного поиска снелинейными механизмами исследов ания исторического материала. Пользовательская навигация втаких мул ьтимедийных документальных системах похожа на ту, что используется в компьютерных играх, включающих технологии виртуальной реальности. Наконец, четвертое направление Digital history П.Артур связывает с «соц иальными медиа», коллективным/совместным авторством ресурсов, Web 2.0, mashup’ами. Web 2.0, подразумевает широкого участия "обычных" пользователей глобальной сети вформировании иразвитии коллективных Интернет -ресурсов; выделяют несколько основных аспектов итехнологий Web 2.0: Wiki –технология коллективного создан ия гипертекста; Flickr – социальный фотосервис; YouTube –социальный видеосервис; Google Maps –карты испутниковые снимки Земли; Blogs –сетевые дневники; Del.icio.us 20
–он -лайн закладки; Netvides –сетевой десктоп идр. Содержание, доба вленное пользовател ем, может внести ценный вклад всоздаваемую колле кцию по тому или иному профилю культурного наследия. Так, Национал ьная библиотека Австралии, например, поощряет участие общественн о сти в разработк еее коллекции на портале PictureAustralia, где давно поддерж ив ается база данных визуального материала, собранного из различных учре ждений. За последние годы этот портал, используя возможности популярн ого сервиса Flickr, существенно расширил коллекцию фотогр а фий. При создании ресурсов типа mashup страны иконтинент ы, например, могут быть связаны через фотоархивы, которые, всвою очередь, могут быть связаны историческими комментариями. Ивсе же различные комп оненты такого композитного ресурса существует на отдельном сервере ив автономной форме. Итак, как на данном э тапе соотносятся различные термины, которые используются для обозначения междисциплинарной области, ориентир ованной на использование компьютерных подходов итехнологий вист о рии? На наш взгляд, из сказанного выше можно сделать вывод, что терм иныHistory and Computing, Historical Information Science, историческая информатика являются более широкими, чем термин Digital history. Истор ическая информатика является частью современной исторической науки, она включает всебя теоретическую компоненту, связанную систочниковедч еской оценкой электронных ресурсов, содержит аналитические компьютер изованные средства ипри этом проводит апробацию компьютерных техн ологий висторических исследованиях иобразовании. Digital history –это скорее прикладная область, тесно связ анная сприложениями современных цифровых технологий взадачах создания исторических ресурсов, оцифро вки материалов вфондах музеев, архивов, учреждений сохранения истор ико -культурного наследия. Как нам представляется, это часть историч е ской информатики. Трудно сказать, какой термин вближайшие годы возьмет верх. В английском языке, возможно, это будет Digital history. Врусском , скорее , останется историческая информат ика . THE DATABASE OF IVAN DIVOV’S CENSUS BOOKS FOR KARELIAN PLOUGHMEN SOLDIERS (1657) IS A METHOD TO MICROHISTORICAL INVESTIGATION D. Brusnitsyna Petrozavodsk Introduction. Computer databases used in historical researches had their start in Russia at the end of 1970s with a goal to put historical facts in a definite preselected order that must be workable and easy-to-use for solving the concrete tasks in the particular study. 21
One of the main computer databases’ advantage is visualization of information. Due to system of searching and sorting of massive character evidences historian has a possibility to choose and analyze data while spreading into different fields. Source. The complex of Ivan Divov’s Census books of Karelian ploughmen soldiers (1657) is a very important historical document for studying local peasants’ society in the middle of the 17th century [1]. Ivan Divov was sent to Olonets region on a mission to take down soldiers’ and peasants’ names in the region. Divov gathered all data into eight census books, each devoted to a special category: soldiers signed up for regiments but lived at home, soldiers dispatched to military service to different Russian, Polish or Lithuanian towns, fugitives, missing, inquired, dead and killed soldiers. Also dispatcher provided a list of soldiers’ relatives (fathers, sons, uncles, nephews, etc.) and the poorest peasants who weren’t fit for military service. Russian pre-revolutionary scholar M. A. Ostrovskaya studied Divov’s reports to central authority that included many interesting facts about course of events, but she didn’t analyze the census books’contents [4; 84―89]. Then soviet researcher of Karelian history R. B. Muller shortly mentioned Divov’s work [3]. Modern Russian historian I. A. Chernyakova counted up quantity of ploughmen soldiers and other peasants according to Divov’s census for the first time, but in her monograph (1998) only data about dead and killed soldiers, and those who didn’t return from military service have being presented [6; 120122]. On basis of I. A. Chernyakova’s summary A. S. Ryzhkov developed tables and fields of the database in a special program FileMaker Pro. He published an article about the commencement of database formation [5; 269―274], but did not continue this work. Author of this article started filling the database by names and evidences almost from the beginning. Now it is completed, all calculations are done and investigation towards Karelian ploughmen soldiers social phenomenon that is based on the computerized data has being carried out. Aim, tasks. The aim of database developing is to transform information from pre-formed (unstructured) documentary historical source into preset form so that to get structured data. Our work tasks are to represent how to use this database for revealing personalized information in a micro historical study of local peasant society –ploughmen soldiers: their relations in families, with members of the society and local administration, their minds about military service and lines of behaviour in connection with it. The database structure consists of eight layers, each for one of eight census books. There are several fields in each layer for different categories of soldiers and other local inhabitants. The key fields connected with all layers are fields with geographical names such as “village”, “vystavka”, “volost”, “pogost”, “stan”. Any layer is possible to convert into Microsoft Excel that expands our opportunities in researching data of the source in the most efficient way. This type of structured information is workable for local and micro historical research. It provides a possibility to look data on a certain village at once. 22
It is quiet laborious or often even impossible to do this without facilities that only computer database gives to historians. In fact, any census book is a long list of names and surnames. For example, Ivan Divov’s books content 13 579 soldiers’ names and 4 372 names of their relatives. Many names are identical with others and it is impossible for researcher to keep in mind such personal information as who of soldiers or peasants was taken down in which category and doesn’t provide a possibility to correlate the names from census with names, for example, from Olonets Military Commander Chancery documents. Such correlation is very important for tracing destinies of Karelian peasants who had to be in military service themselves or their relatives and neighbours. So, in order to retrieve data of identical census books’ information that is important for researcher it looks reasonable to present facts in electronic form. With the help of searching and sorting options it is became possible to find a certain peasant/ploughmen soldier and to add the personal information concern to one that is available in other sources. As a result historian gets a prosopographical database that consists dynamic information. We expect the database allows making conclusions as about destines of Karelian peasants and soldiers lived at that time, so about local inhabitants’ collective portrait in the period when the institute of ploughmen soldiers existed in Olonets region. Some preliminary results. Another advantage of the database is a possibility to get a calculations by verifiable way. The program counts and presents total results exactly and quickly. But it is not the main thing. Figures themselves don’t give us much information. It is necessary to compare and correlate them with data known from other sources. Otherwise, it is probable to misinterpret the reality. For example, there are 330 names of fugitive soldiers and 262 names of missing ones. Here it is very important to remember that fugitives and missing could return home. So, as we are going to study history on the level of personalities, it is necessary to find out what happened with namely fugitives and missing soldiers after Ivan Divov’s census. Among the documents of Olonets Military Commander Chancery for the end of 1650s and 1660s we met the names of those soldiers that were mentioned by Divov as fugitives or missing. For example, Matpheika Terentiev, a peasant of a village Bochkanskaya (Shalskii pogost), according to Divov’s census went away, the homestead was empty (“sshol bezvestno, dvor pust”). However, as it is known from petition that is kept in the archival collection of Olonets Military Commander Chancery, in March of 1661 a peasant Piminka Semenov gave to Matpheika Terentiev a hoarse with a foal on lease, but he didn’t return this hoarse in time. Piminka brought a complaint, but under the words of the pogost’s head, Matpheika put up resistance to authority and didn’t come to court. On basis of these facts looks absolutely reasonable to make conclusions that in spite of Matpheika was mentioned among those the missing in a year 1657, he obviously returned home between that time and 1661. Another illustration. Two peasants have been registered by Divov among fugitive soldiers in the same Shalskii pogost: Senka Grigorev and Mitroshka 23
Panfilov. Probably they were under the search for some years. Though, according to documents, in the summer of 1660, nevertheless they were found and dispatched to war. It is known from a guarantee act signed on the 27th of August. Even more — among guarantors there was the name of Kalinka Elizariev, about whom Divov made a record: “sshol bezvestno”. However, in the summer of 1660 he already was a head of Kupetskaya volost of Shalskii pogost. It means that a peasant once went or run away, could return and even could be elected to administrative position of local self-government. These, and a lot of similar evidences or findings, which are quite important in frames of local micro historical investigation, were done due to making information of the census books structured in a computer database. Conclusion. Electronic database of Ivan Divov’s Census makes historical research much more fruitful and efficient. A computerized collection of information, organized so that it can be expanded, manipulated and retrieved rapidly for various purposes is a necessary instrument for any historian nowadays, especially for solving the micro historical studies tasks. References 1. Russian State Archive of Ancient Acts. F. 137. I. 1. B. 5: Ivan Divov’s census book of soldiers and peasants of Olonets, Zaonezhskie and Lopskie pogosts (1657). 1130 lists. 2. Archive of the S.-Petersburg’s Institute of history Russian Academia of Science. F. 98. Olonets Military Commander Chancery. 3. Мюллер Р.Б. Очерки по истории Карелии XVIXVII вв. (Muller th R.B. Essays on history of Karelia 16 17th centuries). Петрозаводск : Госи здат К. Ф. ССР, 1947. 176 с. 4. Островская М.А. Земельный быт сельского населения Русского Сев ера вXVIXVIII веках. (Ostrovskaya M.A. Land living of rural people of Russian th th North in the 16 18 centuries). СПб .: Тип . гл . управления уд е лов , 1913. 96 с . 5. Рыжков А.С. Опыт составления электронной базы данных по переписным книгам карельских пашенных солдат Ивана Дивова // Матери ал ы XV Всеросси йской научной конференции «Писцовые книги идругие массовые источники XVI –XX веков». Кстолетию со дня рождения П. А. Колесникова . (Ryzhkov A.S. An experience of developing an electronic database for Ivan Divov’s Census books of Karelian ploughmen soldiers // Proceedth ings of the 15 Russian scientific conference “Cada stres and other mass sources th th of the 16 –20 centuries”). М.: “ Древлехранилище ” , 2008. С. 269– 274. 6. Чернякова И.А. Карелия на переломе эпох: Очерки социальной иа грарной истори иXVII века. (Chernyakova I.A. Karelia on the breaking of epochs: Essays on social and agrarian history of the 17th century). Петрозаводск: Изд -во ПетрГУ, 1998. 295 с. 24
МОДЕЛИ СТРУКТУРЫ И СОДЕРЖАНИЯ ИСТОРИЧЕСКИХ ИСТОЧНИКОВ STRUCTURAL AND SEMANTIC MODELS OF HISTORICAL SOURCES А. Г. Варфоломеев, А. С. Иванов Петрозаводск; Даугавпилс, Латвия Annotation The correlation between formal structure (pattern) and contents of historical records is a special problem in historical source studies. However, specialists do not pay appropriate attention to it. The only exception is diplomatics due to the methods employed in diplomatic studies (e.g. pattern analysis). Meanwhile, in the new Web environments, when semantic publications of historical documents have become quite topical, revealing formal and logical (i.e. semantic) structure of documents is a prerequisite for production of qualitative semantic publications, which are based on a detailed markup of the texts. This paper deals with the problems of text markup that can reveal simultaneously formal structure and contents of the documents –medieval Russian charters. Тесная взаимосвязь структуры исодержания письменных историч еских источн иков очевидна, но при этом она редко становится предметом самостоятельного иглубо кого изучения вобщем историческом источн иковедении. Пожалуй, лишь висследованиях подипломатике проблема взаимосвязи ивзаимозависимости структуры (также –внутренняя форма или формуляр) актовых источников исмысловой нагрузки структурных частей их текст ов приобретает особое значение всилу специфики метода дипломатики (формулярный анализ) [13]. Однако внастоящее время есть все основания предполагать, что да нная проблема будет неизбежно актуализирована всвязи со стремительным развитием информационных технологий, компьютерного источниковед ения ипоявлением новых подходов крепрезентации информации истор ических источников всемантических публикациях [46], так как предста вление письменного источника всемантических сетях предполагает его предвар ительную разметку (в терминологии дипломатики –деление или «членение» формуляра на части икомпоненты), выявление логической последовательности структурных частей, увязывание формальной ис емантической структуры текстов [78]. Хотя висторическом источниковедении семантические публикации все еще являются чем -то «новым», во всяком случае, не получили шир окого распространения, сам термин «семантическая публикация» можно считать уже общепринятым, если понимать под этим понятием просто электронную публикацию некоего те кста, снабженную дополнительны информационным слоем, передающим смысл текста (знание отексте) в 25
формализованном, т. е. понятном для машинной обработки виде. Всовр еменной Web-среде основные сферы подготовки семантических публик аций –электронные научные журналы ицифровые библиотеки. Выигрыш, который должны давать семантические публикации, заключается, во первых, врасширении пределов иулучшении качества поиска информ ации. Во -вторых, появляются возможности использования таких публик аций как баз знаний, порождающих новые знания или гипотезы для дал ьнейших исследований спомощью процедур автоматического вывода [9], что особенно перспективно именно висточниковедческих иисторических исследованиях, атакже вархеографии. Отметим, что вопрос опереводе на «се мантические рельсы» электронных публикаций исторических источн иков уже поднимается внаучной литературе [10, 11], однако общепринятые концептуальные итехнологические решения пока не найдены. Настоящая статья посвящена вопросу отом, как на начальной стади и подг о товки семантических публикаций, т.е. входе разметки письменных исторических источников, происходит корреляция их структуры исоде ржания. Статья опирается на разработанный авторами полифункциональ прототип семантической публикации древнерусских г рамот XIII века, хр анящихся вЛатвийском государстве нном историческом архиве (с 2011 года архив является структурным подразделением Латвийского национальног архива) ивходящих всостав обширного комплекса документальных исто чников по истории отношений дре внерусских ибелорусских городов, земель икняжеств сРигой, Ливонией иганзейскими городами, известного под историческим названием «Moscowitica – Ruthenica» [12]. Часть данного ко мплекса архивных документов, послуживших основой для создания прот отипа семант ической публикации, представлена также втрадиционном «б умажном» изд а нии [13]. Прототип семантической публикации создается как электронное дипломатическое издание древнерусских грамот, поэтому вдипломатич еской транскрипции текстов большое внимание уделяе тся по возможности точному отражению палеографических особенностей документов, для чего используются стандарты TEI [14] иCEI [15]. Принципиальным являе тся использование шрифтов вкодировке Юникод для воспроизведен древнерусских символов. Хотя эти шрифты ине позволяют вполной мере отразить начерки древнерусских букв, любой другой вариант передачи существенно ограничит возможности включения комплекса источников в семантическую сеть. Отличительная особенность прототипа семантич еской публикации –наличие дополнительных информационных слоев (м етаинформации) на основе специализированных онтологий. Ксожалению, имеющиеся исторические онтологии ориентированы на достаточно узкие цели [16], ипри этом основываются на событийно -ориентированном по дходе. Авторы же предлагают несколько иной, документно -ориентирован ный подход для описания исторических знаний, вкотором события в ыступают не узлами сети, атолько ее связями, порожденными свидетельс т26
вами источников (см., например, [17]). Непосредственное создание сема нти ческих публикаций на основе онтологий, записанных вформатах RDF или OWL, видится довольно затратным делом. Поэтому прототип сема нтической публикации использует инструменты семантич е ских Wikiсистем, вчастности, Semantic MediaWiki [18] со специальными сре дств амиупрощенной разметки для выделения втексте структурных частей, терминов или имен, атакже добавления ктексту метаинформации. Разм еченный таким образом текст может быть преобразован внабор «фактов» (триплетов вформате RDF). Итак, семантическая пу бликация актового материала опирается на детальную разметку текстов источников, задача которой отразить как формальную, так исемантическую (содержательную) структуру докуме нтов. Напервый взгляд, выделение этих частей не представляет особой сложности, так как вдипломатике довольно подробно разработана схема деления условного формуляра актов [13]. Если идти сверху вниз, то те ксты грамот обычно делятся на основные структурные блоки всоответс твии спринципами формулярного анализа –протокол (protocol), осн овной текст иэсхатокол (eschatocol). (Впрочем, есть инесколько отличный по дход кделению условного формуляра акта –см., например, [19]). Эти три основные части, всвою очередь, подвергаются более мелкому делению. Так, впр отоколе выделяются следующие ко мпоненты: invocatio, intitulatio, inscriptio, salutatio, ит. п. Идентификация данных структурных блоков, з ачастую, весьма условна, так как опирается на интерпретацию текстов а ктов. Особые проблемы возникают входе деления текстов древнерусски грамот, пос кольку, вотличие от западноевропейских актов, их формуляр был менее унифицирован истандартизирован. Для обозначения упомян утых выше структурных блоков есть соответствующие элементы всловаре CEI [20] исоответствующий набор тегов, которые, побольшей час ти, применимы ипри разметке древнерусского актового материала. Однако при более подробном рассмотрении содержания структурных блоков (особенно это относится к«основному тексту», т.е. ксодержател ьной части документа) оказывается, что их можно разбить на более мелкие фрагменты, вплоть до отдельных клаузул ислов. При этом многие клауз улыпо -прежнему могут считаться структурными частями документа, в ыступая как устойчивые обороты -формулы, но, сдругой стороны, уних есть понятный для человека смысл, который можно изложить. Этот смысл ра стет снизу вверх, складываясь из смысла отдельных слов, идалее его можно распространить на более крупные блоки, пересказывая их смысл на основе смысла входящих вних клаузул. При разметке документов именно вфо рмализованном оп ределении смысловой нагрузки этих частей иформул ировке тегов возникают наибольшие проблемы. Вкачестве примера можно привести схему разметки одного документа из прототипа семант ической публикации. Отметим, что данная разметка несколько упрощена; она отр ажает лишь основные (не все) палеографические особенности д о кумента, а 27
так жевыделяет сравнительно крупные его структурно -семантически фрагменты. Отметим, что вданной грамоте отсутствует эсхатокол, ачасти преамбулы вдовольно -таки вольном порядке вошли восновной текст; во зможно, некоторая структурная нечеткость данного д о кумента обусловлена тем, что перед нами концепт послания, ане его ор игинал: <docBody> <div W\SH ̓</invocatio> ´SURWRFRO´! <invocatio> ̨͒ ͉͊͒ N͔ͪ</salutatio> <salutatio> o> Δ <intitulati ͓͔͙͕͗ ͕͔͙͇͛͒ ᨛ ͔͗Ϧ͕͕ͣ͑͊ ʷ</intitulatio> n="1"/> ͕͑ <lb <inscriptio> ͉͕͓͚ͪ͘ ͓͔͕͓͚͒ ͘N͉͔ ͑ NͼϦͥ ͉͔͕͓͚ͪ͒͑ <lb n="2"/> ͛ͪϬ͕͚͋͗ ͔͑͡ ͕ͪ͊ ͋͸͙͓ͪ͡ ͔͕͑ ͉͒ ͋͑͸ ͔͑͡ <lb n="3"/> N͇͓͸͙ͣ͘ N͔͚͑ ͔͕͑ ͉͓ͪ͘͡ ̨͕ͼ͕͓͗͡ </inscriptio> W\SH ´0DLQB7H[W´! <publicatio> </div> ͙͕ ̨͚<lb <div n="4"/> ͔͋ ͙͕ ̨͉͕͓͕ͪͪ͋ ͖͕͗ ͙͚ͥ ͍ͼ͕͒ ̨͚ ȕ ͙͕ ͉͔͙ͣ ̨͒ <super><sCap> ͼ</sCap> </super> <lb n="5"/> N͍ͪͼ͕͒ ̨͔͔͒͘ͼ N͇͔͍͗ͼ N͢ ȕ ͔͓ͣ ͙͕ ͜ ͕ ͙͌ <super><sCap> ͒͏ </sCap></super> Ϭ<lb ͖͇͉͔͙͔͗͘ͼ ͖͕͙͔͉͚͗ ͊͸͓͔͇͒͑ </publicatio> n="6"/> ͔͔͜͡ <narratio> ͕͒͘ <super><sCap> ͉͕</sCap></super> ͙͇ <lb ͕͉͕͑ ͕͙͔ͪ͒͜ ͘ͼ ͙͓ͪͣ ͕͉͕͓͒ͣ͘ Ϭ͖͇͉͔͙͔͗ ͔͗ͪ <lb ͔͑͒ ͙͇͑͡ ͖͗ͪ͋͡ ͑ NͼϦ͓ͪͣ ̨͗ͼ N͓ͣ͑ͣ͘͢ ͉͢<lb ͇͔ͪ͒͜ Nʷ ͙ͣ ͓͚͍ͣ ͔Ϧ͡ ͔͗͊͢ ͔͚ ̨͔͔͒ ȕ͕<lb n="7"/> n="8"/> n="9"/> n="10"/> ͕͉͇͒ͪ͑ ͔͕͚Ϧͼ͔͒ ř͙ͣ ̨͸͕͉͕͗͑͑͘͡ ͉͡ ͉͕͑͘ <super><sCap> Ǫ</sCap></super> <resolution> n="12"/> </narratio> <lb n="11"/> ͔N͢Nͪͼ͓͔͙͕͕͔͙͗͛͒͡ ͙͇͕͑ ͓͕͉͒ͥ ͇͑͑ ͙͕ <lb ʷ͍ͼ͕͒ ͉͔͙ͣ ̨͒ͼ NͪN͖͇͉͕ͪ͗͋ͥ ̨͔͔͒͘ͼ N͇ ͔͍͗ <super ><sCap>ͼ</ sCap></ super > <lb n="13"/> ʷ͇͍ͪ N͢ʷ ͔N͢N͙͕ͪ ͙ͪͣ͘ ͓N͸͉͕͓͕ͪ͋ ͔͍͗ͼ Nͪ<lb ʷ</ resolution ͘ y͙ͣ ͉͙͕͓ͣ N͉͔ͪ N͕͉͇͙͔ ʷ͔͋ <lb n="14"/> > <publicatio n="15"/> ʷ͇͍ͪ ͉͒ͥ͘ͼ ͙͉͕͔ N͇͓͸͙ͣ͘ N͔͑͡ ͒͘ y͇͙ͪͣ͟ <lb n="16"/> 28 > ͔N͢Nͪͼ͙͕͓ y
ʷ͕͉͇͒͘ ʷ͇͙͇ ͉͘ͼ͕͕͑͊ ȕ͉͇͒͑ ͖͇͉͇͗͋ ͙ͪͣ͘ ͖͕͓͗͸ <lb n="17"/> ʷ͑͋͸ ͍͔ ͉͇͘͡ ͔N͇͘͡ ͘ͼ ͙ͼ͍ͼ ͖͕ ȕ N͙ͪͣ ͙\ ͕͑ <l b n="18"/> ʷ</publicatio> N͝ͼ͙͔ ͙͕ ͓͕<lb ʷ͇͑͑ ͔N͢Nͪͼ͓͕͒ͥ͘ͼ ͉͇͓͡ <notification> n="19"/> ʷ͔͕\ ʷ<lb Ϧ͔͙ͪ ͙͕͘ͼ͙͔ ͕\ ͙͕͔ ͖͇͉͗͋͸ ͑ ͙͗ N͕͓ͣ n="20"/> ʷ͇͍ͪ ȕ ͕͉͇ͪ͒ N͔͔ ͔͓͙ͪͣ ͍ͼ͕͒ ̨͔͙͔͘ͼ ͉͇͘͡ <lb n="21"/> ͙͕͑ N͇͔͍͗ͼ N͢ʷ ͔͔͒ ͊͸͓͔͕͒͑ ͔͔͒ ͙͕͑ ͔<lb n="22"/> ʷ͔͉͔͙͒ͪ͢͟ ʷ͇͓͖͇͉͕͚͗͋͢ N͔͢ ͑N͇͓͡ ͇͋ <super><sCap> ͓͢ </sCap></super> ʷ</ notification ͖͕ ̨͍͔ͣ ͖͇͉͗͋͸ </docBody> <lb n="23"/> > </ div > <lb n="24"/> [1284–1297 гг., очевидно, ближе к 1285–1287 гг.] Рига. Текст грамоты архиепископа рижского смоленскому князю Федору Ростиславичу. Концепт. Пергамен (Латвийский государственный исторический архив. Ф. 673. Оп. 4. Kasten 18. № 8. Л. 3) Представляется, что при разметке документов для семантических пу бликаций вкачестве языка изложения смысла структурных частей –статей, клаузул, формул ит.п. можно использовать Attempto Controlled English [21], который похож на естественный язык, ипри этом переводится компьют ером вформулы логики предикатов первого порядка, над к о торыми можно производить логический вывод, получая новые знания. Врезультате сема нтическая публикация создает специфическую модель (для историков –«о браз») исторической реальности исамих исторических источников. Эти модели выступают результатами исследования или интерпретации источн иков, записанными вформализованном виде, ипоэтому являются приго дными для повторного использования или верифик а ции. Ʌɢɬɟɪɚɬɭɪɚ 1. Лаппо -Данилевский А. С. Очерк русской дипломатики частных актов. СПб., 2007, с. 143– 164 2. Каштанов С. М. Очерки русской дипломатики. М., 1979, с. 53– 149 3. Каштанов С. М. Русская дипломатика. М., 1988, с. 169– 193 4. Иванов А., Варфоломеев А. Публикация ианализ рукописных исторических документов спомощью технологии XML. Humanitā ro Zinā tņ u Vē stnesis, 2009, 16, pp. 69–84 5. Варфоломеев А. Г., Иванов А. С. Сема нтические публикации ко мплексов исторических источников. В кн.: Информационные технологии и 29
письменное наследие. El’ Manuscript-10: Материалы международной нау ч ной конференции (Уфа, 28– 31 октября 2010 г.). Уфа; Ижевск: Вагант, 2010, c. 42– 46 6. Варфоломеев А., Иванов А. Семантические публикации информ ации исторических источников на основе технологии Wiki. In: Vē sture: Avoti un cilvē ki. Humanitā rā s fakultā tes XX starptautisko zinā tnisko lasī jumu materiā li. Vēsture.. Daugavpils: Daugavpils Universitātes Akadēmisk ais apgāds „Saule”, 2011, pp. 339347 7. Ivanovs, A., Varfolomeyev, A. Editing and Exploratory Analysis of Medieval Documents by Means of XML Technologies. In: Humanities, Computers and Cultural Heritage. Amsterdam, 2005, pp. 155160 8. Иванов А. С., Варфоломее вА. Г. Технология XML как инструмент компьютерного источниковедения (на примере формулярного анализа д окументов пр иказного делопроизводства). В кн.: Круг идей: Алгоритмы и технологии исторической информатики: Труды IX конференции Ассоци ации «История иком пьютер». М.; Барнаул, 2005, с. 241281 9. Варфоломеев А. Г., Кравцов И. В. Приобретение ипредставлени знаний всетевом сообществе исследователей текстов. Вкн.: Вторая конф еренция «Систе мный анализ иинформационные технологии» САИТ -2007, Обнинск, 1014 сент ября 2007 г.: Тр. конф.: в2 т. Т. 1. М., 2007, с. 104106 10. Ahonen, E., Hyvönen, E. Publishing Historical Texts on the Semantic Web –A Case Study. In: Proceedings of the Third IEEE International Conference on Semantic Computing (ICSC2009). Berkeley, 2009, pp.167173 11. Mirzaee, V., Iverson, L., Hamidzadeh, B. Computational Representation of Semantics in Historical Documents. In: Humanities, Computers and Cultural Heritage: Proceedings of the XVIth International Conference of the Association for History and Computing. Amsterdam, 2005, pp.199206 12. Иванов А. С. « Moscowitica–Ruthenica»вЛатвийском государс твенном ис торическом архиве: история формирования комплекса, состав и введение внаучный оборот. Древняя Русь: Вопросы медиевистики, 2004, № 3 (17), сентябрь, с. 4754; № 4 (18), де кабрь, с. 94106. 13. Иванов А., Смоленско Кузнецов -рижские А. акты: –пе рвая XIII половина XIV в.: Документы –Ruthenica комплекса о- об о шениях Смоленска . [Rīga], и Риги 2009 14. Text Encoding Initiative. http://www.tei-c.org 15. Charters Encoding Initiative. http://www.cei.lmu.de 16. Ide, N., Woolner, D. (2007) Historical Ontologies. In: K. Ahmad, C. Brewster and M. Stevenson, eds. Words and Intelligence II: Essays in Honor of Yorick Wilks. [S.l.]: Springer, 2007, pp.137-152 17. Varfolomeyev, A., Soms, H., Ivanovs, A. Knowledge-Based Information Systems in Research of Regional History. In: Digital Humanities 2008. Oulu, 2008, pp. 210-211 18. Semantic MediaWiki. http://semantic-mediawiki.org 19. Рогачевский А. Л.–памятник Кульмская с права сии грамот Пр XIII в. СПб., -126 2002, с. 118 30
20. Vocabulaire Internationale de Diplomatique. http://www.cei.lmu.de/VID 21. Kuhn, T. How Controlled English can Improve Semantic Wikis. In: Proceedings of the Fourth Workshop on Semantic Wikis, European Semantic Web Conference 2009. [S.l.], 2009, pp. 1-16 (SEUR Workshop Proceedings, vol. 464) ИСПОЛЬЗОВАНИЕ КОМПЬЮТЕРНЫХ ТЕХНОЛОГИЙ ПРИ СОЗДАНИИ ИНФОРМАЦИОННОЙ БАЗЫ ДАННЫХ ПОЛИТИЧЕСКИХ ССЫЛЬНЫХ НА ЕВРОПЕЙСКОМ СЕВЕРЕ (КОНЕЦ XIX – НАЧАЛО XX ВЕКОВ) С. Г. Веригин, В. Л. Степанов Петрозаводск; Москва История политической ссылки –неотъемлемая часть истории общ ественно -политического иреволюционного движения вРоссии. В своем составе ссы лка отразила весь спектр различных партий, течений игру ппировок вих развитии. В ней были представлены иосновные регионы Российской империи. Все это позволяет судить онакале игеографии оппозиционного движения встране, осоциальном, профессиональном инациональном составе его участников. Объединяя представителей разли чных партий иполитических течений, ссылка была ареной острых идейно теоретических дискуссий. Входе этих дискуссий шло развитие не только политических теорий, нои теоретических взглядов с амих «поднадзо рных». Наличие среди ссыльных представителей радикальных течений и группировок позволяет проследить истоки терроризма на российской по чве. Это определяет актуальность, научную ипрактическую значимость темы, придает ей межрегиональное ивсеро ссийское значение. Ниодин из исследователей истории общественно -политической борьбы вРоссии не может обойти историю политической ссылки. Разработка этой темы имеет большое значение идля изучения ист о рии отдельных регионов. Правительство определяло мест ами ссылки восно вном окраинные районы России, менее развитые вэкономическом иполит ическом отношении. Поселение здесь ссыльных из более развитых г у берний не могло не сказаться на жизни местного населения. Ниодна по литическая организация, ни одно относит ельно крупное оппозиционное выступление в провинции не обходилось без прямого или косвенного уч а стия ссыльных. Влияние «поднадзорных» было заметным ивсфере духовной культуры Севера. Научное изучение края, его художественное описание, создание теа тров ио рганизация концертов, работа вкачестве юристов, врачей идаже, несмотря на преследования, учителей –все это не могло пройти незаметно для населения удаленных от культурных центров уездов. Значителен вклад ссыльных ивразвитие материальной культуры регио на. Инженерные ра з31
работки, усовершенствования, внедренные ссыльными вкустарное ипр омышленное производство, новые методы хозяйствования иновые сельск охозяйственные культуры вдальних северных деревнях –вот лишь некот орые стороны деятельности ссыльных, х арактеризующие их вклад вразв итие материальной к ультуры Европейского Севера. В настоящее время начинается подготовка креализации крупнома сштабного коллективного проекта по этой теме –созданию информацио нной базы данных (БД) всех ссыльных, отбывавших нак азание в1895– 1917 гг. на Европейском Севере России, включавшего территории современной Архангельской (в том числе Ненецкого автономного округа) иМурма нской областей, республик Карелия иКоми. По приблизительным подсч е там, база будет включать около 20 тыс яч имен, вчисле которых –большая часть наиболее известных общественно -политических деятелей того вр е мени, в том числе 70% членов первого советского правительства. В дал ь нейшем предполагается значительное расширение хронол о гических рамок –с1800 до 1895 г. ис1917 до 1985 г. В состав авторского коллектива входят представители Поморского, Петрозаводского иСыктывкарского университетов. Эта группа исследов ателей под руководством доктора исторических наук, профессора Помо рского государственного университет аим. М.В.Ломоносова М.Н.Супруна активно разрабатывает теоретические ипрактические в о просы, связанные с формализацией икаталогизацией информации, новые подходы контолог ическому описанию архивных материалов вцифровой форме со структур ированием этого мат ериала исорганизацией баз данных для хранения, о бработки, поиска, визуализации сложных материалов ивзаимосвязей между его частями. Система разрабатывается сиспольз о ванием web-технологий для легкого использования, как влокальной сети, так ивсети Инте рнет ,и ориентирована на создание полнотекстовых имультимедийных баз данных, предназначенных для хранения иобработки исторических материалов. В системе предусматривается поиск по фо р мальным, структурным признакам текста иего частей, графическим пр изнака мформ, атакже дополнительн введенной иполученной врезультате обработки текста информации ист орического, географического ис о циокультурного характера. Реализацию проекта предполагается осуществить за два года. Вт екущем году мыпредполагаем: 1) провест иизучение историографии исбор материалов вархивах ибиблиотеках; 2) создать карточки -биограммы с выделением основных формализуемых признаков и характеристик для ввода вбазу данных; 3) разработать типологии единиц хранения, модели данных системы наязык едиаграмм «сущность -связь»; 4) разработать рубрикаторы иклассификаторы формального описания единиц хранения; 5) создать БДипоисковую систему; 6) ввести вБД10 тысяч имен. Всл едующем , 2012 г оду, осуществить сбор необходимых материалов варх ивах ибибл иотеках, продолжить создание картотеки, ввести вБДоставшиеся имена (до 10 тысяч). 32
Итогом работы над проектом станет электронная БДна всех полит ических ссыльных, отбывавших наказание в1895–1917 гг. на Европейском Севере России. На ее основе будет разра ботана поисковая программа, к оторая позволит не только быстро вести поиск ссыльных по алфавиту, но выявлять группы ссыльных по основным заданным характеристикам что даст возможность вести исследовани япо теме на многие годы вперед. В2005 г. при поддержк еФонда Сороса профессором Поморского г осударственного университета им. М.В. Ломоносова М.Н. Супруном была начата работа по созданию базы на 2 тысячи политссыльных, отбывавших наказание вАрхангельской губернии вконце XIX –начале XX в. [1]. Таким образом , реализация нового проекта станет продолжением уже нач атой ранее работы. Вобласти Интернет -технологий уколлектива имеется опыт создания Интернет -сайтов сиспользованием технологии генерации содержимого страниц спомощью запросов кбазе данных, втом чи сле несколько обр азовательных инаучных проектов. Результаты исследований участников проекта М.Н.Супруна [2], Л.А.Максимовой [3], Д.В.Макарова [4] идругих нашли свое отражение вопубликованных работах. Для выполнения проекта уколлектива имеется необходим ое обор удование: Web-сервер , персональный компьютер , с канер , фото -камера. Кроме того, следует отметить наличие необходимых лицензионных пр ограммных средства уразработчиков ИС. В качестве Интернет -сервера и сервера БДиспользуется сервер под управлением оп ерационной сист е мы Debian Linux сустановленными нанем СУБД Postgres, web-сервером Apache, системой дистанционного образования MOODLE. Всё ПОсервера является свободно распространяемым. Разработка мультимедиа содерж ания производится спомощью имеющегося уколлектива лицензионног графического пакета Adobe Creative Suite 3 (Design Premium). Результаты выполнения проекта будут представлены для широкого доступа на сервере Поморского государственного университета им. М. В. Ломоносова по адресу http://lib.pomorsu.ru/exile . Появляются идополнительные возможности при реализации данного проекта. Его разработка станет следующим шагом всоздании всеобъе млющей БДполитических ссыльных за пределами как хронологически так итерриториальных рамок настоящего исследова ния иможет стать в перспективе БДполитссыльных с1800 по 1985 гг., атакже включить не только соседние сЕвропейским Севером регионы, но иобласти централ ьной июжной России. Созданный сайт может быть связан линками ссе рверами заинтересованных обществ иорганизаций. Ʌɢɬɟɪɚɬɭɪɚ 1. См.: www.lib.pomorsu.ru/exile  сайт «Каторга иссылка на Русском Севере» . 2. Супрун М.Н.: 1) В.Н. Фигнер иархангельская политическая ссы л ка, 1904– 1905 гг. // Архангельское Поморье: история икультура. Арха нгельск, 33
1983; 2) Политич еская ссылка на Европейском Севере вконце XIX –начале XX вв.: Краткий биобиблиографический словарь. Выпуск 1: 1895– 1905 гг. Учебное пособие. Вологда, 1989; 3) Архивы ссылки как источник по ист ории революционного движения вРоссии вконце XIX –начале XX вв. // Ломоносовские чтения. Архангельск, 1990; 4) Изучение Европейского Севера иполитическая ссылка вконце XIX –начале XX в. // Европейский Север: История исовременность. Петрозаводск, 1990; 5) Ка торга иссылка на Севере, XIII– XX вв.: Концепция итема тико -экспозиционный план выста вки. Архангельск, 1990; 6) Политическая ссылка как срез сполитических партий иорганизаций революционной России (1895– 1905 гг.) // История политических партий ввузовском курсе политической истории: Проблемы теории, методолог ии, методики. Вып. 2. М., 1991; 7) Применение количес твенных методов визучении истории политической ссылки // Народная культура Севера: «первичное» и«вторичное», традиции иновации. Арха нгельск, 1991; 8) Документы архивов России орусско -норвежских револ юционных связях // Россия – Норвегия: История и культура. Архангельск, 1993; 9) Политическая ссылка на Русском Севере (1895– 1905 гг.) // Сол овецкий вестник. 1993. № 11; 10) Каторга иссылка на Русском Севере. Т. 1: Польская ссылка / Сост. М. Н. Супрун. СПб., 2005; 11) Каторга иссылка на Русском Севере. Т. 2. / Под ред. М.Н. Супруна. Архангельск, 2006. 3. Макаров Д.В.: 1) Из истории полиции Олонецкого края // Бюлл етень музея МВДпо РК. Петрозаводск, 2004. № 3 (14); 2) Работа ислужба Олонецкой полиции по надзор уза политическими ссыльными // Бюлл етень музея МВД по РК. Петрозаводск, 2004. № 3 (14); 3) К.Ф. Кретковский –начальник Олонецкого жандармского управления: Его работа снабл юдательным составом управления понадзору за политическими иными преступлениями по льских ссыльных ипольских подданных // Историч еские чтения на ул. Андропова, 5: Сборник материалов научной конфере нции 15– 16 апреля 2008 г. Петрозаводск, 2008. Максимова Л.А.: 1) Польская ссылка вПрилузском районе Коми АССР в40-егоды ХХвека // Каторг аиссылка на севере России. Том 2. Сборник статей. Архангельск, 2006; 2) Насильственная миграция име жкультурные связи наЕвропейском Северо -Востоке // Globalization and sustainable development of the Circumpolar North: The 9th Circumpolar Universities Conference: Материалы международной конференции. Петр озаводск , 2005; 3) The Influence of migratory processes upon the Northern native population. (The Example of the Komi Republic) // Circumpolar Change: Building a Future on Experiencies from the Past: The fifth circumpolar universities cooperation conference June, 1997; 4) Условия жизни спецпереселе нцев -поляков вКоми АССР в1940-егоды // Польская ссылка вРоссии XIX– XX веков : Региональные центры . Казань, 1998. 34
ИНФОРМАЦИОННЫЕ ТЕХНОЛОГИИ В ИСТОРИЧЕСКОМ ПРОФЕССИОВЕДЕНИИ В. Н. Владимиров, Е. А. Брюханова, Н. В. Неженцева Барнаул Развитие информационных технологий, методов обработки массовых источников идругих массивов данных открывает для исследователей но вые возможности иперспективы. Для исторического проф ессиоведения, под к оторым понимается направление исторических исследований, связанное с изучением профессионального состава, структуры ипрофессиональной мобильности населения, атакже динамики видов занятости, математ ические методы икомпьютерные технолог ии являются важнейшим инстр у ментом. Основной единицей изучения висторическом профессиоведении я вляется профессия или занятие, извлечение информации окоторой ипол учение ее социально -демографических характеристик без специальных методов обработки источни ков не представляется возможным. Речь идет прежде всего отехнологии баз данных иразличных специальных метод иках обработки данных озанятиях населения. Для исследований вобласти исторического профессиоведения по дходят практически любые массивы данных, вкоторых профессиональн занятие и/или профессиональный исоциальный статус являются отдел ьными атрибутами. Внаших исследованиях мыиспользовали 7 баз данных по 4 регионам России с1800 по 1920 гг., отражающих следующие группы источников: материалы официа льной статистики  индивидуальные пер еписные листы переписи 1897 г. (Тобольск, Ярославль), материалы церко вного учета  метрические книги (Барнаул, Санкт -Петербург), делопрои зводственные материалы  формулярные списки служащих по Алтайскому горному округу, атакже списки избирателей по выборам вУчредительно собрание (г. Тамбов), опубликованные списки беженцев Первой мировой войны по Томской губернии. Специальный метод исторического профессиоведения –классифик ация исторических профессий –обусловил испе цифику работы синфо рмационными массивами профессиональных данных, которую можно представить внесколько этапов. 1. Формирование категорий занятий исоциального статуса (студент, член семьи, почетный гражданин, нищий ит. д.). Возможности баз данных позвол яют оптимизировать работу по унификации разнообразных назв аний одного вида занятости. Данный этап может быть осложнен специф икой представления профессиональной информации висточнике: нево всех источниках профессиональное занятие является очевидным. Указ ание на занятие может перечисляться водном ряду схозяйственным с остоянием исоставом семьи (переписные книги XVI вв.) или заменяться чином, сословным положением или званием (метрические книги XVIII– XIX вв.). Для тех источников, где профессия выделена вот дельный объект 35
исследования, возникают проблемы сведения синонимичных професси ональных названий водну категорию (врач, доктор, медик, лекарь, ордин атор), разграничение схожих по написанию, но разных по значению пр офессиональных названий (акушер  акушерка ) ит. д. 2. Кодирование выделенных категорий всоответствии свыбранной системой кодирования (классификации). Наибольшее распространение на сегодняшний день вроссийских и зарубежных исследованиях получил Международный исторический стандарт классификации профессий (HISCO), на основе которого созданы ипредставлены всети Интернет две информационные системы: «History оfWork Information System» (http://hisco.antenna.nl) и«Историческое профессиоведение» (http://occupations.asu.ru). Первая из них (англоязыч ная) создана на основе западноевр опейского стандарта HISCO. При кодировании профессий из отечестве нных источников необходимо учитывать особенности перевода испецифику ро ссийской занятости (например, пимокат, банкоброшница, прис у чальщица и т. д.). Информац ионно -справочная система «Историческое профессиовед ение» создана на основе комплексной базы данных, включающей профе ссиональную информацию (варианты названий по регионам, основной ид ополнительный код по HISCO) из более чем 11 источн иков по 8 регионам Росс ии сXVII до начала XX в. включительно, атакже сиспользование описаний различных видов деятельности, собранных из словарей иэнци клопедических изданий, художественной литературы, представленных впословицах ипоговорках, изобразительном искусстве. Данна ясистема позв оляет находить профессии по коду, названию или по группе HISCO. 3. Систематизация профессиональных категорий по схеме классиф икации иподсчет количества занятых вкаждой группе. Первые два этапа направлены на изучение профессионального соста ва населения того или иного региона, третий позволяет исследователю получить ту или иную модель профессиональной структуры населения всоответствии свыбра нной системой классификации профессий. Помимо HISCO всовременных историко -профессиоведческих исследо ваниях применяется система PST, основанная на разделении видов занятости по основным секторам экон омики (первичный, вторичный, третичный). Анализ профессиональн структуры может производиться по количеству исоставу занятых вка ждой группе или посопостав лению статистических данных професси ональных групп разных классификационных систем. Отдельным аспектом визучении профессиональной структуры и ее динамики на отдельной территории, является частота встречаемости конкретной профессионал ьной категории иредко сть того или иного занятия, которые невозможно рассчитать без статистических методов обработки данных. Среди баз данных, созданных специально для профессиоведческ исслед о ваний, отметим базу «Население Тобольска 1897 г.». Подобные базы содержат кроме осно вных сведений источника дополнительные та б лицы и справочники, связанные спрофессиональной занятостью (сфера занятий, 36
профессия, образование ит.д.), атакже инструментарий для к о дирования профессий изанятий населения, который можно создать одн о временно д ля двух систем классификации. Врезультате каждая запись вбазе данных вне зависимости от того, содержит она профессиональные сведения или нет, получает соответствующий код (отсутствие професси о нального занятия в системе HISCO имеет код -2). Вданном случа еэтап кодирования является составным элементом заполнения базы данных. Таким образом, исследов атель получает набор профессиональных данных, уже закодированных в классификационных системах, асучетом возможностей СУБД  еще ист атистические данные по кажд ой классификацио нной группе. Следующим этапом обработки базы данных может стать анализ пр офессиональной исоциальной мобильности. Исследования вэтой области связаны сопр е деленными трудностями, обусловленными, прежде всего, наличием источников, содержащих сведения онаселении конкретной те рритории за несколько покол е ний, атакже необходимостью создания на их основе комплексных информационных ресурсов. Внастоящее время нами разрабатывается БД«Население Барнаула поматериалам метрических книг г. Барнаула 18771886 гг.», которая вближайшей перспективе позв олит перейти кизучению вопросов мобильности. Для перехода кизучению профессиональной исоциальной мобильн ости используется, вчастности, классификационная схема HISCLASS, осн ованная на HISCO. HISCLASS предполагает распределение данных опрофе ссиональной занятости исоциальном статусе по нескольким группам –кла ссам. Класс определяется для каждого члена семьи за 23 пок о ления, что дает возможность восстановления межпоколенной профессиональной мобильн ости. Кроме того, если источник содержит сведения очеловеке за разные периоды его жизни (такие данные могут предоставить, например, метрические книги), то исследователь может проследить карьеру, межпр о фессиональную мобильность идинамику социального статуса от дельной личности. Резюмируя, отметим основные моменты историко -профессиовед ческих исследований, где невозможно обойтись без применения совр еменных компьютерных технологий:  формирование списка профессий;  выделение отдельных групп профессий по определенному призн аку (например, женская или детская (до 18 лет) занятость, по районам г орода или губе рнии ит.п.);  кодирование профессиональной инепрофессиональной зан я тости, социальных статусов игруппировка профессий истатусов всоответствии со схемами классифик а ции (HISCO, PST, HISCLASS);  изучение профессионального состава иструктуры отдельных регионов, основанное на сравнении количества занятых вгруппах одной классификации и/или сопоставление данных разных классиф икационных схем, атакже определение частоты вс тречаемости или редкости профе ссиональных кат е горий; 37
 восстановление истории семьи и, соответственно, профессионал ьной мобильности (чаще по мужской линии (отец  сын);  восстановление карьеры имежпрофессиональной мобильности о тдельной персоны (если есть дан ные осмене профессиональной деятельн о сти). Развитие исторического профессиоведения определило иновые направления исследований. Одним из них является использование агрегир ованных данных различных статистических обследований как базового источника визучен ии профессионального состава иструктуры населения р егиона. Если до недавнего времени агрегированные материалы рассматрив ались только как вспомогательный информационный ресурс для професси оведческих исследований, то проведенный подробный анализ информац ион ного потенциала подобных данных позволил выделить их всамосто ятельный блок источников. Агрегированные материалы всероссийских, г ородских иотраслевых переписей представляют собой набор данных, обр аботанных ипредставленных всоответствии сопределенной пр о граммой. Нопри этом возможности полноценного использования агрег ированных материалов могут быть реализованы не только переводом ст а тистических результатов вэлектронный вариант, но исопоставлением данных разных источников, атакже привлечением дополните льных справочных матери алов. Например, база данных по агрегированным профессиональным да нным Всероссийской переписи 1897 г. будет включать результаты, опубл икованные втрех источниках: общей поРоссийской империи обработке главных занятий (по 360 группам), погубернских итогах (по 65 группам), данные отдельной разработки групп рабочих, прислуги ичастично побо чных занятий. База данных будет заполняться сведениями околичестве с амодеятельного населения вкаждой профессиональной группе по полу, г уберниям, уезд ам, городам, возрастным группам, народностям (в перспект иве), для отдельных групп возможно указание на колич е ство или процент грамотных, атакже количество несамодеятельного нас е ления по полу. В качестве дополнительных (справочных) материалов можно создать список губерний суказанием уездов икрупнейших городов, структуру професси ональных групп переписи, справочник по наро д ностям Российской империи. Еще одним перспективным направлением исследований врамках исторического профессиоведения является применени егеоинформационн технологий визучении профессионального состава, структуры ипрофе ссиональной мобильности. Развитие данного направления возможно внескольких аспектах: впределах отдельного города, уезда, губернии или на уровне более крупных регионов, объединяющих несколько губерний (н апример, Сибири). При этом возможно использование уже существующих геоинформационных систем. Например, дополнение ГИС «Приходы Ба рнаула» сведениями опрофессиях исоциальных статусах предоставит во зможность изучения тенден ций пространственного распределения насел ения, принадлежащего кразличным профессиональным истатусным соо бществам. Возможно ицеленаправленное создание ГИС для задач профе с38
сиоведческих исследований. Так, создание геоинформационной системы «Профессии изан ятия населения Европейской России иСибири конца XIX –начала XX в.», основанной на агрегированных профессиональн данных переписи 1897 г., позволит провести сравнительный пространс твенно -географический анализ профессионального состава населения ра зличных регионов России, аименно выделить региональную иотраслевую структуру испецифику занятости населения, выявить отраслевые связи и межрегиональные профессиональные когорты. Особую актуальность представляет соединение геоинформационн технологий иметода классификации профессий. Врезультате исследов атель получит набор тематических карт территориального распределени отдельных профессиональных групп по различным классификационн схемам. Натаких картах можно отражать исоциально -демографическ характери стики профессиональных категорий (пол, возраст, социальный статус, народность ит.д.). Таким образом, информационные технологии являются не только основой существующих исследований вобласти изучения профессионал ьного состава, структуры ипрофессиональной мобильности, но иоткрыв аютновые возможности этих исследований. Исследование поддержано РФФИ, грант 11-06-00135-аиРГНФ, грант № 11-01-00455а). БИБЛИОМЕТРИЧЕСКИЙ И СЕТЕВОЙ АНАЛИЗ ИСТОРИОГРАФИИ И. М. Гарскова Москва Для обозначения научных которые направлений, занимаются изом документальных информационных ь- пото ности (в науке, бизнесе, управлении ти ся различные названия: библиометрия, ометрия, киберметрия, ометрия, документ медиаметрия ии д ми анализировать закономерности иразвит чия этих названий при сходстве методов ами использования этих методов. Первым появился термин г.), “библиометри торый ко а-изн чально был связан со статистическим аан фии в работах XX в. начала В г. 1969 Налимов В.В. Мульченко и З.М. ввели термин наукометрия” “ (scientometrics), относится с ти к обл к науковедения, изучающей развития закономерности науки о- в е действии с другими сферами жизни н- общес тексте [2]. г. В 1979 в статьях немецких авторов “ информетрия” , который понимается как исполь аппарата для онной информаци деятельности и научн 39
также для принятия решений в информ (в 1990 -хгг.) возникли киберметрия”, термины “ “интернет ив е“ бометрия” , которые также основаны на библиометри ических иционных информаметодах и подходах в (электро нным и сетевым) формам представлени Методы анализа документопотоков о- обыч ды количественного анализа вторичных о ды и количественного лиза первичных ана документов о- и м вания [3]. Порядок перечисления соответств тветствующих татистический групп (с анализ библиогр ировался на исследовании а вторичных ции). источ Основным и параметрами количественного уа ментопотока являются: объем документоп нции, параметры концентрации и рассеяни аучным направлениям и научным школам, а вз аимосвязи (например, –число число авторов). публикаций Анализ динамики документопотока о нах стро Ципфа, Бредфорда, Брукса, Лотки. е ния, Так, который носит Лотки, имядля А. анализа научной а в торов п строится на статистике числа авторов, атьи, и является одним из фундаментальны а конов [4]. Если информационная библиографическ хконтурной, т.е. кроме содержит вторичных и первичн здокуме можно изучение количественных характе Эти исследования становятся более о- попу текстовых информационных ресурсов. На анализа первичных ется документов контент -анализ, явля особенн изучении больших корпусов текстов, -ресурсов в и полнотекстовых изданий и коллекций. Изучение частот встречаемостиеи дин мени позволяет анализировать льных семантиче с-ма сивов, возникновение и развитие научны научного направления частота определен екращение работ -либо по научному какому направлени уменьшению частоты встречаемости рминов. При опре эт важна не только дескриптивная статист между ними, т.е. совместная встречаем категорий (на уровне дескрипторов или встречаемости можно ьюпроводит корреляционного с помощ кластер -анализа и других статистических ме Наиболее популярной в настоящее у- вре ментопотоков является анализ цитирова выявления структуры научных результативно коммуникац ученых. В 1960 году Институт ISI (институт научной 40
Ю.Гарфилда) е л первый вв индекс цитирования ндл ных в научных –индекс журналах SCI (Science Citation яInd вились индексы цитирования м наукам – SSCIпо (Socialсоциал Sciences Citation Index) – AHCI и (Arts гуманитар and Humanities Citation Index). Все три индекса Web ofобъединены Science –мультидисциплин в рной реферативно -библиографической базе данных аI ет ссылк и на полные тексты в первоисточник афических ссылок, встречающихся в каждо краткие сроки получить самую полную б теме (еженедельное –свыше обновление 8700 научных ежур дневно –свыше 2 тыс. ISI создается статей). универсальны В икаций, в который входят библиографичес а ций. В последнее время быстро Google Scholar развиваетс (по явилась в –свободно 2004 г.) доступная истема, поисковая которая кс сирует полный текст научных публикаци Индекс Google Scholar включает нв себя лайн -журналов крупнейших научных издатель С 2005 г. в научной электронной РИНЦ библиот (Российский индекс научного цитировани создании отечественной библиографическ ериодике. –это РИНЦ национальная -аналитическая информационн стема, аккумулирующая более ких 2 млн. авторов, пуб также информацию о цитировании сэтих п сийских журналов. Как и другие методы, анализ цитирова ывает, что опубликованная работа, опере привлекает сследование внимания Менделя (и Г. по генетике опубликованное г., оставалось в 1865 [5]). “в тени” С одругой 34 г ны, необходимо “ типы ”учитывать цитирования. Сегодня е нии в выделяют положительное (справочное, об отрицательное (критическое, отвергающе ание, позволяющие более объективно б ликации. анал Анализ цитирования можно вести разли ко -цитирования позволяет считать сходными кации, если (не ссылки на них встречаются в одних и т ко -цитирования используется ISI при построении в групп тпу ражающих наиболее актуальные исследова озволяет изучать связи ликаций в массиве (такие новых связ называть проспективными) . Метод библиографического яется классическим между и трактует двумя публикация связи ирование ими одних и тех же документов оспективными . 41
Перспективным едставляется пр изучениеснаучн следователями, работающими в русле од методов и технологий сетевого анализа формирование как формальных, так и- и “в вов: на ве осно сведений о соавторстве и инд проследить процесс появления научных концентрацию, центральные фигуры, вок группы. Связывая информацию о группах публик уемых работ, можно выявлять специфи групп, их сходство и различия. В данной работе анализируется полна информатики на основе историографичес включающей полнотекстовую и библиографическую коллекцию нных публикаций по исторической информа 1259 авторов. Основу этой библиографи ованные в Информационном бюллетене юАсс тер” (35 выпусков), рии “Круг сборниках идей” се (10 выпу ряде тематических сборников, изданных овосибирске и Геттингене. В круго ты этих п не только членов Ассоциации “История в торов, и кот орые хотя бы однажды опубликовались ув гих изданиях АИК. Сопоставляя список членов Ассоциации (из базы данных в- АИК) торов значительно больше числа с учетом членов сча тоты публикаций в изданиях под эгидой ами, входящими и не входящими в Ассоциа На первом этапе работы анализировала афическим описаниям (вторичным учалась динамика источник научных публикаций, числа изданий, чис (т.е. опубликовавших на данный имомент ческой информатике). Анализировалась одуктивности [6]. авторов На ром вто этапе был проведен анализ со потребовало построения рубрикатора тем дескрипторов, внесенных в историографи рмулированы девять категорий н или тра льной рубрик темой каждой[7]. публикации Изучение тематики пуб выявить несколько моделей динамики, асо тическим “линиям” в историографии а тики. исто Так, динамика числа публикаций, ию ок пос личественных методов и / или информаци конкретно -исторической проблематики, си публ пользования информационных технологий (наиболее традиционные тематические изуется рост ру 42
доли таких работ -хгг. в и начале снижением –во второй 1990 поло 2000-х гг. С -х конца гг. и 1990 на протяжении всего сохраняется стабильно высокий интерес ГИС и мультимедиа. К концу го изучаемо периода (после некоторог растет “вес” исследований, связанных нс ных и информационных систем, с оразрабо граммного обеспечения в исторических уи ет усил ение технологического обеспечения ои рической информатики. Некотороееумень ским, историографическим и источников еской информатики -х гг. в начале сменяется 2000 нпротив де нцией во второй половине этого десяти и рост числа работ по проблемам информ библиотечного дела, использованию е- инф шении задач сохранения -культурного историко Можно наследия. аконст тировать углубление связи междуо-метод ставляющими, с одной стороны, и–спредме другой, которые характерны XXI для в.историч Наконец, можно выделить и, доля тематические которых йчиво растет: это методы и модели, а боты орие с различными видами информации историчес кстовой, графической и т.д., а ционные также се ресурсы. Эти аиболее рубрики концентрированном в н т ветствуют в двум основным компонентам исторической а литической и информационной). Кроме того, разные те периода и практически параллельная ь- дин с твуют, что это развитие о ванным [8]. стало более сб На третьем этапе работы были нполучен ности между авторами по количеству [9]. со Были построены [10],графы визуализирующиеесвязи ля ми, входящими в “незримые научные ыкол вают отдельные региональные центры ии ш ки. Например, четко выделяется регион основном сотрудники института Н археоло (42 человека). Эта сеть отличается очень рв стве (см. 1). рис. Полная сеть научных связей, включающ работы, написанные в соавторстве, е ния, поэтом доста она обычно тся подвергае трансформации. Трансформа ыявлении всех замкнутых локальных о-групп шаговом удалении этих групп ь тате из выделяют исходно школы, сформировавшиеся -Петербурге ика – винформационны (темат С. технологии в образовании), Саранске (и 43
демографии и экономической XVIII– XIX вв.); истории научные нРос тры в Екатеринбурге, Нижнем Тагиле и технологиями баз данных при и информационн изучении тсо ской политической истории с сий), пространственн (истории репр и реконструкции памятников -культурного историко наследия. аучная школа в –Ижевске В.А. Баранов) (лидер известна а- свои ниями в области ого издания электронн древнерусских ир ков в формате полнотекстовых базрданны мационно – поисковая с тема си “Манускрипт”. Группа исследователей из Петрозаводс ывает методы и алгоритмы дневековыми работы документ ссо сре нове XML-технологий; по этой тематике е- груп довательские проекты с Даугавпилсским трозаводске активно разрабатываются сп программы для товыми работы и с изобразительным текс Активно работает в области политическо –начала XX вв. научный центр в Пермском универс ием и анализом полнотекстовых информаци овым источникам, к газеты, ка журналы земских к- соб же ведется разработка специализирован рукописных и старопечатных кириллическ Трехмерные реконструкции архитектур объектов культурного использование наследия, информаци ологий в музейном деле находятся в цент Сибирского федерального университета. азахстана и Киргизии ведут многопланов и технологий ческой истори информатики в практику аний в своих республиках. Выше перечислены не все, но наиболее чные центры, своеобразные “точки ороста” мимо них, существует значительное – 5 соавт о ров), числ которые опубликовали – 2 работы по в тематических 1 ви ляют периферию данного научного направ После удаления из исходного графа в ядро –сеть, включающая 207 авторов. ескол ь-В это ко наиболее крупных центров и, нсоотве форматики (барнаульская, московская, –см. 2). рис. м Несмотря на значительное уменьшение м даже при таком числесьма авторов затруднительн (узлов осе му далее рассмотрены некоторые фрагмен На рис. 3 представлены две связанные меж из Алтайского и Тамбовского университ объясняются сходством их специализаци демография и социальная история) и наличием нсовмес 44
тральными фигурами в Барнаульской и Та соответственно, Владимиров В.Н. Канищев. и В.В. На рис. 4 и 5 показана возможность -сети”, т.е. е ти постро с связей одного автора со своими соавтор ами этого автора. 4 представлена На рис. сеть Бородкина, соавтор н рис. 5 к ней добавлена Владимирова. сеть соавторов НадоВ.Н от в персональную Бородкина сеть Л.И. включены представ осковской школы (специализация -экономической в ообласт и рии, технологии баз данных, квантитати рного моделирования), но также барнауль 10 мож но увидеть не только центральные о- фигу ров, которые связывают о бой. эти блоки между Таким образом, изучение научных свя помощью методов и технологий сетевого в ным направлен ием анализа историографии научной озволяет изучать формирование как ч-форма ных коллективов: на основе сведений ао ния можно проследить процесс . появления Такие коллективы можно представлять графичес аучных сетей, изучать их динамику, кон вокруг которых формируются эти пгруппы. пах с тематическими рубриками т, можнопубликуе выявлят ецифику научных интересов, сходство и р Ɋɢɫ 1 45
Ɋɢɫ 2 Ɋɢɫ 3 46
Ɋɢɫ 4 Ɋɢɫ 5 47
ɉɪɢɦɟɱɚɧɢɹ 1. См. обзор направлений и методов аан боте: Редькина Н.С. ормализованные Ф ды анализа мето ь ных докумен информационных потоков2, // 51– с. 59. Библиосфера. 2. Налимов В.В., Мульченко З.М. Наукометрия. Изуче информационного процесса. Хайтун М.: С.Д. На Наука, у1 кометрия : Состояние и перспективы. аука, 1983. М.: Н 3. См.: Редькина Н.С. Модель многоуровневого ативности научных исследований VII оВсе дых ученых по математическому моделир технологиям -3 ноября 1 2006 года, Красноярск, ярск, 2006. 4. См.: Гарскова И.М., Иванов С.А. сБи торической информатики как научного н бюллетень АИК. 2002. №30. 5. Цит. по:Н.С. Редькина Формализованные 56. метод 6. См. Гарскова И.М. Количественный историографии анализ ои рической информатики // Информационный Она же. Историческая информатика: пос идей: модели и технологии т рукций. исторических М., 2010. 7. См.: Гарскова И.М. Историческая : после информатик иточки фуркации. 22– 23. С. 8. Подробнее см.: 24– 26. Там же. С. 9. Аналогичные графы строятся опо таб держащим сведения о количестве ссылок а в торов. 10. При построении графов использовала , оп зволяющая визуализировать связи, ю- предс щих количество работ, написанных в соа одних авторов на работы нные других работы). (включа COMPUTER AIDED COLLATION OF POVEST VREMENNYKH LET COPIES D. Dobrowolski Moscow No one studying old russian chronicles avoids referring to stemma codicum proposed by A.A. Shakhmatov. Conception of chronicle writing in Old Rus presented in Shakhmatov’s investigations was a result of the first and still unsurpassed attempt to build an integral history of this genre from its origins in 1030-s to the fundamental crisis of chronicle writing in the 16th century. Such encyclopaedism makes Shakhmatov’s works second to nothing in russian chronicle study from the view of both posing questions and their solution. However, significant part of the scholar’s assertions is actually criticized, and 48
his view on the relations between two main manuscript traditions of Pověst’ vremennykh lět (further PVL) is the one. One tradition (further L), actually represented first of all by Laurentian and Radziwiłł chronicles, was based on the so-called Silvester copy of PVL finished in 1116. The second version of text, appearing in 1118 (according to Shachmatov [1, p. 529534]) or near this time [2, p. 12; 3, p. 4041], gave the root to southern tradition (further H), main representative of which is Hypatian chronicle. In general, beginning parts of three chronicles differ slightly, but several differences are quite important, including those in witness of the invitation of Varangians, where Radziwiłł and Hypatian chronicles state Rurik’s residence to be placed in Ladoga, and Laurentian manuscript contains a lacuna [4, vol. 1, col. 20, vol. 2, col. 14, vol. 38, p. 16]. The easiest desigion would be to suppose the lacuna contained the same mutatis mutandis text as in the other two copies, but the remarkable amount of common readings in Radziwiłł and Hypatian versions of PVL made Shakhmatov to suspect the scribe of Radziwiłł chronicle had been influenced by a manuscript from H group [1, p. 530532]. Radziwiłł chronicle’s witness was then recognized to be secondary and the primary reading of L was reconstructed on the basis of the First Novgorodian chronicle, which placed first russian capital in Novgorod [4, vol. 3, p. 106]. The same logics was used when reconstructing primary text of several other fragments. The idea of convergence between two branches of PVL stemma itself seems to be well-grounded. One can found a massive amount of common text in both Laurentian and Hypatian cronicles’ narration of the 12th century events [eg. 1, vol. 1, col. 392, and vol. 2, col. 630], so it is very likely that scribes belonging to one tradition had acces to the text of another. Thus it would be rather strange if none of them compared two versions of Primary chronicle, fulfilling the lacunas and making eventual corrections. However, witnesses of 12th— 13th century, that are common to both traditions, most probably appeared in the south-eastern Rus’, in Vladimir-on-Klyazma, as did L in whole. As a result, their presence in Hypatian chronicle can proove that L influenced on H, but not the influence in opposite direction. On the contrary, hypothetical appearance of toponym Ladoga instead of *Novgorod in Radziwiłł manuscript can be sufficiently explained only if we suppose that H had influenced on L. Shakhmatov never discussed the problem, giving to his opponents an opportunity to disregard the possibility of convergence between two traditions at all [5, p. 217248, 6, p. 284286, 7 etc.]. A.A. Gippius, revitalizing Shakhmatov’s idea of two traditions convergence («contamination»), proposes only some «preliminar observations» on the relations between Laurentian, Radziwiłł and Hypatian versions of text [8, p. 7487]. Full collation of three main copies of Primary chronicle remains a task to be implemented, and considerable amount of text to be proceeded (if presented as plain text each version of PVL takes approximately 500 kB of disk space) causes computer to be a very helpful tool. What we already have and can use is a PVL text from six oldest and most authoritative whitnesses (i.e. Laurentian, Troitskiy, Radziwiłł, Akademicheskiy, 49
Hypatian and Khlebnikov chronicles), tokenized and aligned by D. Ostrowski. This edition was encoded in HTML by D. Birnbaum and is available from [9] (PDF files are located at [10]). However, tokens of Ostrowski-Birnbaum edition are as long as lines in 1926 printed edition of Laurentian chronicle [11], despite the fact that variants rarely include more then several words (and a huge part of them involves only several letters). On the other hand, D. Birnbaum’s «e -PVL» is a set of 276 separate files, each containing a small part of Laurentian text (more precisely a column from printed edition) along with its correspondances from all other used manuscripts. Such composition is fundamentally grounded by the aims posed while preparing the discussed edition. However, it obviously doesn’t allow to get a precise picture of text variance. So Laurentian, Radziwiłł and Hypatian manuscript texts have to be (1) extracted from existing edition, (2) re-tokenized and re-aligned. Extraction of comparands was executed by a Python script, searching D. Birnbaum’s HTML-files one by one for the text of each manuscript involved into investigation. The script produced files with delimiter-separated values, containing the reference to column and line of 1926 edition and the corresponding text of one selected manuscript. HTML headers and references to manuscript folia were truncated. <sup> tags used by D. Birnbaum to mark letters in superlinear position were replaced by parentheses, also used as a mark of superscripted letters in scientific editions. One line of an output file named Lavr.csv looks as follows: 0, 1 & Се пов&#1123;сти врем&#1127;ньны(х) л&#1123;(т) where ampersand surrounded by spaces serves to delimit reference (containing column and row number, as proposed by D. Ostrowski in [11]) from text and symbols, not available in Windows code page 1251 used for the whole project, are replaced by HTML entities (but could be replaced by whatever else, custom TeX commands like \yat, \yussmall etc. may be a good choise as they are selfexplaining). Extracted files can be loaded into any text editor advanced enough to have a differ mode (eg. gVim Diff), re-tokenized in order to coordinate tokens size with the size of variants and aligned by inserting linebreaks where needed: file Lavr.csv (Laurentian chronicle) file Ipat.csv (Hypatian chronicle) 0, 1 & Се пов&#1123;сти врем &#1127; н ь ны (х) л&#1123;(т). 0, 1 & 50 пов&#1123;сть врем е н ны хъ л&#1123;(т). черноризца федосьева
(Differences, marked here by gray background, will be highlighted automatically, as it is the default option of any source code editor with differ mode). Finally, re-tokenized texts are to be proceeded with the second script, which shall remove tokens identical in all three copies and combine alternating readings into single file, yielding a database of variants, existing in the main copies of PVL, also presented as a delimiter-separated values like this: 0, 1 & Ce / 0 0, 1 & пов&#1123;сти / пов&#1123;сть 0, 1 & &#1127; / e 0, 1 & ь/ 0 0, 1 (х) / хъ 0, 1 0 / черноризца федосьева Analisys of the data also can be trivially automated, because «un iformative» differences (such as usage of «old» wordforms with reduced vovels vs «n ew» forms without) can be easily filtered by grep or similar program. Thus the database will allow us to learn where Radziwiłł chronicle is closer to Laurentian and where it rather follows Hypatian, so scholars will be able to trace back the influences between two branches of PVL manuscript tradition. References 1. Шахматов А.А. Повесть временных лет, In: Шахматов А.А. Ист о рия русского летописания, Санкт -Петербург, 2003, vol. 1, part 2, p. 527– 977. 2. Алешковский М.Х. Повесть временных лет: судьба литературног прои з ведения вДревней Руси, Москва, 1971. 3. Гиппиус А.А. К проблеме редакций Повести временных лет: I, Славянов е дение, 5 (2007), p. 20—44. 4. Полное собрание русских летописей, Москва, 1997, т. 1, Москва, 1998, т. 2, Москва, 2000, т. 3, Ленинград, 1989, т. 38. 5. Истрин В.М. Замечания оначале русского летописания: по поводу исследований А.А. Шахматова вобласти древнерусской летописи, In: Изве стия Отделения русского языка исловесности РАН, 27 (1922), p. 207—251. 6. Бугославский С.А. «Повесть временных лет»: (Cписки , редакции, первон а чальный текст), In: Бугославский С.А. Текстология Древней Руси, Москва, 2006, vol. 1, p. 281—312. 7. Мюллер Л.«Третья редакция» «Повести временных лет», In: Мюллер Л. Понять Россию: историко -культурные исследования, Москва, 2000, p. 165—182. 8. Гиппиус А.А. О критике текста иновом переводе -реконструкци «Повести време нных лет», In: Russian Linguistics, 26 (2002), p. 63—126. 9. http://clover.slavic.pitt.edu/pvl/, last checked Apr. 25, 2011. 10. http://hudce7.harvard.edu/~ostrowski/pvl/, last checked Apr. 26, 2011. 11. http://hudce7.harvard.edu/~ostrowski/pvl/techpref.pdf, last checked Apr. 26, 2011. 51
МЕЖДИСЦИПЛИНАРНОЕ ВЗАИМОДЕЙСТВИЕ В ПРОЦЕССЕ ВИРТУАЛЬНОЙ РЕКОНСТРУКЦИИ ОБЪЕКТОВ ИСТОРИКО-КУЛЬТУРНОГО НАСЛЕДИЯ Д. И. Жеребятьев Москва Приёмы работы историков систочниками иисторическим матери алом складывались втечени едлительного времени, методика совершенс твовалась, инструментарий историка тоже претерпевал существенные изменения, отвечая на вызовы времени. Одним из современных методов исторического исследо вания по праву считается модел ирование. В последнее время, начиная с1990-хгг. успешное развитие инфо рмационных технологий открыло перед историками новую страницу в важном деле сохранения историко -культурного наследия. Технологии трёхмерного моделирование вме ждисциплинарной научной среде нашли активное применение для решения различного рода исследовательск з адач: восстановления внешнего облика, анализа исинтеза исторических источников, проверки научных гипотез о конструктивных и функци ональных особенно ст яхстроений посредством расчётного модуля CAD программ ит. д. Формирование подобных задач для исследовательского коллектива, выработка методики виртуальной реконструкции, анализ разнородной источниковой базы данных, включая материалы экономического исо циал ьного характера, работа стехническими параметрами объектов игеодез ическими картами ландшафта, предполагает участие специалистов из ра зных областей: историков, археологов, искусствоведов, архитекторов, ге ологов, программистов, дизайнеров идр. специал истов. Чаще всего собрать такой междисциплинарный коллектив очень затруднительно, по ряду пр ичин, итогда историк должен сочетать всебе несколько профессиональн качеств: знани еистории архитектуры иинформационных технологий. Отечественная практика сод ержит несколько примеров таких ме ждисциплинарных исследований, проведённых лабораторией социальной истории ТГУ им. Г.Р. Державина [1], кафедрой информационных технол огий вкреативных и культурных индустриях Гуманитарного института СФУ [2] иинститутом исто рии материальной культуры РАН, факультетом филологии иискусств СПГУ [3]. В данной работе мырассмотрим точки такого междисциплинарного взаимодействия на примере задачи реконс трукции монастырского комплекса «Всех скорбящих Радости» сер. XIX – первой трети XX вв. Одной из непосредственных задач нашего исследования является восстановление облика монастырского комплекса посредством технол огий трёхмерного моделирования на нескольких временных срезах, хара ктеризующих основные этапы его эволюции. Особое внимание уделено 52
восстановлению состояния ифраструктуры монастыря 1909 г., когда ко мплекс сохранял единый архитектурный стиль. Территориальные рамки исследования локализованы границами территории усадьбы Голицыных; начиная с1890 г.  монастыря «Всех скорбящих Радо сти» (с севера ул. Сущёвский Вал, сюга  Вадковский пер., сзапада ул. Новослободская с востока  ул. Тихвинская). Основой для создаваемой виртуальной реконструкции монастырск ого комплекса служ а тархивны ефонд ы Московской Духовной Консист ории (ЦИАМ, ф. 203) [4], Оценочного Отделения Московского Городского Общественного Управления (Московской Городской Управы, ЦИАМ, ф. 179) [5], Строительного Отделения Московского Губернского Правления (ЦИАМ, ф.54) [6], монастыря «Всех скорбящих Радости» (ЦИАМ, ф.1178) [7], Троице -Сергиевой Лавры (РГАДА, ф.1204) [8], Московского губер нского совета рабочих, крестьянских икрасноармейских депутатов (ЦАГМ, ф. 66) [9], Московск ого областно го совет анародных депутатов иего исполнительн ого комитет а(ЦАГМ, ф.2157) [10]. В ходе работы нами ставится задача восстановить план застройки территории монастыря на 1909 г., состоящий из более чем 40 строений, на основании имеющихся планов за разные временные периоды иматери алов описательных источников, вчастности описи строений монастыря 1914 г. [11]. Для построения плана временного среза реконструкции нами была взята спутниковая карта Google Map вграницах улиц: Новослободско Вадковского переулка, Тихвинской, Сущевского вала, на которую, спомощью графического редактора, проецировали строения Скорбященског монастыря 1909 г. всоответствии синформацией архивных источников. Входе анализа оставшихся строений монастыря, данных описи, пл анов впрограмме Adobe Photoshop производилось нанесение строений на спутниковую карту Google Map. Пер воначально со спутниковой картой, благодаря наличию контрольных точек –сохранившихся строений мон астыря «Всех Скорбящих Радости», были сопоставлены и приведены в единый масштаб планы 18521853, 1890, 1893, 1912 и1914 гг., после че го, исходя из данных, ук азанных висточниках (например, места размещ е ния, формы, размера), производилось построение иразмещение контуров зд аний. Имея данные чертежей построек, информацию оплощади, ук а занную вописи строений монастыря 1914 г. иданные планов (простра нственную ин формацию расположения), нанести конкретную постройку внужном масштабе не составляло труда. К сожалению, такая подробная информ ация сохранилась не по всем строениям. В результате синтеза планов и спутниковых карт был получен план территории монастыря 1909 г., кот орый лёг воснову модели ландшафта территории монастыря истал осно вной отправной точкой масштаба виртуальной реконструкции. Монастырский комплекс был поделён на следующие части: храмовые строения, монашеские кельи, икомплекс обслуживающих строени й(ку х53
ня, прачечная, здание трапезной), строения усадьбы княжны А. Голицы ной, скотный двор, парк, монастырский огород икладбище. Лучше вс е го графическая источниковая база сохранилась по храмовым строениям, монашеским кельям, усадьбе ихозяйственным постр ойкам. Монастырское кладбище с1500 захоронениями, парк иогород получили более подробное отображение вкомплексе описательных источников, вчастности восп оминаниях монастырского священника И. Сперанского [12]. Первоначально впрограмме трёхмерного моделир ования 3D World Studio иAutodesk 3d Max были построены модели храмовых строений (храм Всемилостивого Спаса, Трёх Святителей, архангела Рафаила, Ти хвинской Божьей Матери, каменная часовня -памятник усыпальница А.А.Смирновой) имонашеских келий. После постро ения трёхмерных моделей впрограмме Autodesk 3D Max объекты были переведены вформат “.3ds” иинтегрированы вбиблиотеку компонентов Unity3D. Следующим этапом виртуальной реконструкции стал а разработка ландшафта территории монастыря. В программную среду из библиотеки компонентов всцену был перенесён план территории монастыря 1909 г., нанесённый вкачестве текстуры на трёхмерную поверхность модели в программе 3D World Studio. Реконструкция ландшафта подразумевал следующие этапы работы: моделирование карты высот, восстановлени растительного покрова (травы, кустарников, деревьев идр. растительн ости) монастырского парка иогорода, Васильевского пруда, атмосферы и т.д. Колебания уровня высот врайоне Сущёвской части г. Москвы, где располагался монастырь , не превышают одного метра. Построение модели ландшафта производилось компонентом ландшафтного генератора усло вно -бесплатной программы «трёхмерного движка» Unity3D, предназначе нного для построения виртуальных интерактивных реконструкций. После окончания процесс агенерации поверхности ландшафта, исходя из данных архивных источников, втом числе фотографий территории монастыря нач. XX в., на модель был нанесён почвенный ирастительный покров. Стоит отметить, что база почвенного ирастительного покрова была сфо рмир ована фотореалистичными текстурами разного рода почв ифотогр афиями растений, обработанных впрограмме Adobe Photoshop. Фотогр афии территории монастыря нач. XX в. стали одним из основных источн иков, позволившими восстановить облик улиц Сущёвской части г. Москвы, ограничивающих по периметру территорию монастырского компле к са. Первыми трёхмерными моделями , размещённы миналандшафте , стали храмовые объекты исоставные части монастырской стены, расп оложенные впрограммной библиотеке Unity3D. На основании сопост авл ения контура строений, отмеченных на плане 1909 г., стрёхмерным мод елями на сцене были размещены объекты храмовых строений ивыстроена мон а стырская стена. В комплексе документов строительного отделения Московского Губернского Правления найденный матер иал охватил практически всё, за 54
исключением парка, монастырского огорода икладбища. Реконструкци данных составных частей монастыря позволила нам коснуться не только истории эволюции облика иформы монастырских построек, но изатр онуть вопросы экономическ ой исоциальной жизни монастыря. Подобным образом впрограмме 3D World Studio были реконструир ованы и размещёны в программной библиотеке Unity3D модели дома усадьбы А. В. Голицыной, священника идиакона, хозяйственные постройки истроения скотного дв о ра. Подобного рода описание иналичие найденных фотографий терр итории монастырского огорода, кладбища ипарка посредством обработки материала впрограммах трёхмерного моделирования (SketchUp, 3D World Studio) играфическом редакторе (Adobe Photoshop) позволило провести анализ перспективы съёмки, установить точку съёмки, размеры отдельных объектов, запечатлённых на фотографиях (гробницы Зубатовых, входных ворот, деревянного забора огорода, памятников ит. д.) ивконечном р езультате восстановить их облик монастыр я«Всех ско рбящих Радости». Таким образом, посредством программ трёхмерного моделировани разнотипные исторические источники были синтезированы вединый образ –виртуальную модель монастырского комплекса на 1909 г. Возмо жности программы Unity3D, вкоторой производилась конечная обработка моделей, позволили пре дставить виртуальную реконструкцию монастыря вИнтернете посредством html страницы винтерактивном режиме, когда пользователь может самостоятельно перемещаться в трёхмерном пр остранстве. Посредством пр ограммы Macromedia Dreamweaver 8 и Macromedia Flash MX 2004 модуля Zoomify был переработан интерфейс html страницы: ккаждой трёхмерной модели строения монастыря была подключена источниковая база (графическая и текстовая информация , найденная нами ва рхивн ых источниках). Построение трёхмерной виртуальной реконструкции объекта истор ико -культурного наследия по своей сути является междисциплинарным источниковедческим исследованием, требующим от исследователя овлад ения инновационными методами итехнологиями ис торического исслед ования, позволяющими не просто визуализировать несохранившийся (или разрушенный) объект историко -культурного наследия, но ипровести его комплексный анализ сучетом историч е ского контекста, где компьютерная программа выступает неотъемлемы минструментом анализа исинтеза исторических источн иков. Ʌɢɬɟɪɚɬɭɪɚ 1. Кончаков Р.Б., Жеребятьев Д.И. Применение методики трёхмерн ого пространственного анализа для изучения формирования городской з астройки иво с становления культурного наследия // Круг идей: Методы и технологии исторических реконструкций. Под ред. Л.И. Бородкина, В.Н. Владимирова, Г.В. Можаевой. М.: Изд -во МГУ, 2010. С. 218 –237. 55
2. Смолин А.А., Румянцев М.В. Виртуальная реконструкция храм ового комплекса г. Енисейска на основе технологии трехме рного модел ирования // Круг идей: Методы итехнологии исторических реконструкций Под ред. Л.И. Бородкина, В.Н. Владимирова, Г.В. Можаевой. М.: Изд -во МГУ, 2010. С. 175 –196. 3. Логдачева Е.В., Швембергер С.В. Проблемы иметодики трехме рной реконструкции [Эл ектронный ресурс]. URL: http://www.nereditsa.ru/ 3D/article.htm (дата обращения: 10.02.2011). 4. ЦИАМ, ф. 203, оп. 386, д. 1, л.14, оп.407, д.5, л.1 –2, оп. 408, д.5, л.1 – 9, оп.436, д.5, л. 1– 18. 5. ЦИАМ, ф. 179, оп. 63, д. 15005, л.1 – 8, оп. 147, д.6, л. 230–236 об., оп. 181, д. 1529, л. 173– 173-об., 185– 190. 6. ЦИАМ, ф.54, оп. 147, д.,6, л. 230– 236-об., оп. 179, д. 926а, л.179 – 180, оп. 181, д. 1311, л. 1–12, д.1421, л.184 – 185, 248– 249, 251, 255, 255-об., д.1529, л. 173, 185– 190. 7. ЦИАМ, ф.1178, оп.1, д. 270, л. 106, 106-об., л.140. 8. РГАДА, ф.1204, оп.1,ч.6 д.9814, л.1 – 2-об. 64, 64-об., д.9815, л. 1–2об.,12 – 19, 24, 83, 83-об., д. 10746, л. 1– 7, д. 10828, л. 1– 10, оп. 1.ч.6, д. 12256, л.1, 1-об. 9. ЦАГМ, ф. 66, оп. 11, д. 8053, л. 178,179, оп.19, д. 366, л. 203. 10. ЦАГМ ф. 2157, оп. 1, д. 220, л.27, 28. 11. ЦИАМ, ф.179, оп. 63, д. 15005, л.1 – 8. 12. Сперанский И.Историческое описание Московского женского общежительного «Всех ско рбящих Радости» монастыря М. 1915. КОМПЬЮТЕРНОЕ ИСТОЧНИКОВЕДЕНИЕ COMPUTER-BASED SOURCE STUDIES А. С. Иванов Даугавпилс Annotation The paper deals with the problems of source studies in the age of escience. The impact of computer-based technologies on traditional and fairly conservative fields of historical research including historical source studies poses a number of theoretical and methodological problems concerning interconnection of traditional historical source studies and computer-based source studies. In author’s opinion, it is quite doubtful that computer-based source studies can be seen as a separate auxiliary historical discipline, since this field of historical studies, which employs specific research methods and technologies, has no subject and object of its own. Therefore, computer-based source studies methodologically integrated into traditional source studies. В структуре исторического знания центральное место принадлежит историческому источниковедению и связанным сним специальным и 56
вспомогательным историческим дисциплинам, так как исторический источник –единственный носитель информации опрошло м. Соответстве нно, вцентре внимания специалистов неизменно остаются свидетельств исторических источников, полнота, объем и качество –достоверност точность, степень объективности –источниковой информации. В эпоху внедрения информационных технологий визучение истории закономерно возникает вопрос отом, приобретают ли врезультате компьютеризаци исторической науки какое -либо новое качество традиционные области исторического исследования, прежде всего –классическое историческое источниковедение. В рос сийской историографии термин «компьютерное источников едение» появился уже всередине 90-хгодов ХХвека [1]. При этом вполне справедливо подчеркивалась его технологическая ианалитическая соста вляющая: «...“компьютерным источниковедением” мы... называем к ак с одержательные, так и внешние атрибуты источниковедческой работы, включающей создание иобработку машиночитаемых источников; сов окупность связанных сэтим процедур, которые выполняются на компьют ере. Иными словами, “компьютерное источниковедение” –это источник оведческая работа (и ее результаты), ориентированная на определенный набор компьютерных технологий» [2]. При этом вотдельных случаях наблюдается отождествление компьютерного источниковедения иисторич еской информатики [3], асфера применения компь ютерного источников едения достаточно четко ограничивается критикой массовых источников. Здесь следует отметить, что компьютерное источниковедение можно с полным основанием считать составной частью исторической информат ики, однако отождествление компьютерно го источниковедения иисторич еской информатики –более широкой отрасли знания –едва ли оправданно. В наши дни компьютерное источниковедение как относительно с амостоятельное направление врамках общего исторического источников едения все еще находится впро цессе становления, авсреде специалистов существуют разногласия вопределении его предмета. Вряд ли можно с огласиться спопытками ограничить область применения компьютерного источниковедения исвести его кисточниковедческой эвристике, т.е. к технологиям создания баз данных, репрезентации исторических источн иков или их информации всети Интернет , подготовки электронных публ икаций. Разумеется, представление исторических источников висточнико ориентированных базах данных или электронных публикациях обеспеч ивает их доступность для исследователей, существенно облегчает иускор яет работу сними, атакже способствует популяризации, иногда –ивульг аризации, знаний опрошлом. Однако, как уже неоднократно отмечалось исследователями, внаибольшей степени потенциал компьютерных техн ологий раскрывается именно при их использовании для проведения анал итической исинтетической критики исторических источников, очем св идетельствуют публикации (некоторые из которых, ксожалению, имеют 57
декларативный характер) по применению компьютерных методов вко нкретных источниковедческих исследованиях [48]. Следует подчеркнуть, что компьютерные методы могут суспехом применяться кизучению не только массовых, но иуникальных исторических источников. Итак, сфера применения методов компью терного источниковеден определяется достаточно четко. Это, во -первых, источниковедческ э вристика –внастоящее время наиболее развитая область компьютерного источниковедения; во -вторых, методико -аналитическое источниковеден [9], вцентре внимания кот орого –методика итехника изучения (критики) исторических источников. Не вызывает сомнений, что специфика компьютерного источников едения обусловлена методами итехникой изучения исторических источн иков на основе компьютерных технологий. Прикладной характ ер, технол огическая (инструментальная) направленность компьютерного источник оведения вопределенной степени лишает его теоретической иметодолог ической самостоятельности: можно утверждать, что внастоящее время те оретическая иметодологическая основа компь ютерного источниковеден –традиционное теоретическое источниковедение, разрабатывающее основные принципы источниковедческого познания, теорию историческог источника, атакже теорию познания источника [10]. Однако не исключ ено, что вперспективе компьюте рное источниковедение сможет внести свой весомый вклад вдальнейшую разработку учения ометодах истор ического источниковедения итеорию исторического источника вконтексте более широкого учения об информации, тем более что первые шаги вэтом направлении уж еделаются [1113]. Неразрывная связь втеоретико -методологическом плане компьюте рного источниковедения страдиционным историческим источниковеден иемставит под вопрос обоснованность выделения компьютерного исто чниковедения из общего исторического источник оведения. Ктому же для компьютерного источниковедения вряд лиможет быть определен свой предмет иобъект исследования, отличный от предмета иобъекта трад иционного источниковедения [10, 1416], что вполне естественно, так как историческое источниковедение –комплексная вспомогательная (спец иальная) историческая дисциплина, совокупность методов которой пост оянно расширяется за счет междисциплинарных связей различных областей знания. Таким образом, набор специфических методов исследования (многие из которых на новом технологическом уровне просто воспрои зводят традиционные методы источниковедческого анализа исинтеза –[5]) вкомпьютерном источниковедении еще не создает новую отрасль знания. Поэтому можно говорить лишь онаправлении врамках исторического исто чниковедения, ане оновой, самостоятельной специальной (вспомог ательной) исторической дисциплине. Нельзя при этом не отметить, что в ыделение компьютерного источниковедения как направления врамках общего исторического источниковедения возможно лишь вотно сительно 58
кратковременной перспективе –пока компьютерные технологии являются чем -то «новым» и«необычным» для значительной части историков иисточниковедов [17]. Оправданность выделения компьютерного источниковедения как относительно самостоятельного напра вления врамках общего историческ огоисточниковедения обусловлена, нанаш взгляд, задачами, которые можно решать на основе новейших компьютерных технологий. Пожалуй, наиболее актуальная задача исторического источниковед ения, решение которой возможно на кач ественно более высоком уровне именно врамках компьютерного источниковедения, это изучение структ урыисточниковой информации, раскрытие информационного потенци а ла источника, извлечение из него косвенной (скрытой) информации [13], вс есторонняя проверка полн оты, надежности идостоверности свид е тельств исторических источников, семантическое связывание информации естес твенных, исторически сложившихся комплексов источников [18] и, вконе чном итоге, восполнение пробелов висточниковой информации иг е нерация новых знаний опрошлом [19]. Эффективное решение данных задач во зможно при условии широкой репрезентации исторических источников (точнее –их информации) всемантических сетях [2024], испол ь зовании технологий сетевых сообществ для организации распределенной об работки больших комплексов источников [7] иобеспечении воспроизводимост исследований источников спомощью сохранения методик ирезультатов исследований врамках баз знаний сетевых сообществ. При этом семантич еские публикации исторических источников ценны исами по себе, так как они вводят винтенсивный научный оборот новые группы источников. Компьютерное источниковедение может быть полезным ипри реш ении многих частных задач прикладного источниковедения, перечислить которые не представляется возможным. В качестве примера можно пр ивести текстологические исследования памятников письменности [2526], работы по формулярному анализу актового иделопроизводственн материала [4, 17] имногие др. Основное требование историка иисточниковеда ктехнологиям името дам источниковедческой критики –это их универсализм, возможность применения как для анализа отдельных источников любых типов, видов и разновидностей, так идля системного изучения комплексов источников. Кажется, компьютерное источниковедение целиком ипол ностью удовл етворяет этому требованию, так как, всущности, объект его изучения – информация исторических источников как таковая. При этом следует отметить, что при представлении источников всемантических сетях не т еряется иих «индивидуальность», что поз воляет, содной стороны, иссл едовать агрегированную информацию совокупностей источников, асдр угой стороны, углубленно изучать отдельные исторические источники. 59
Ʌɢɬɟɪɚɬɭɪɚ 1. Тяжельникова В. С. Компьютерное источниковедение: К пост ановке проблемы. Вкн.: Кр уг идей: Развитие исторической информатики. М., 1995, с. 244– 257. 2. Владимиров В. Н., Цыб С. В. Источниковедение ввек компьютера (вместо предисловия). Вкн.: Источник. Метод. Компьютер: Сборник научных трудов. Ба рнаул, 1996, с. 7. 3. Соколов А. К., Тяжельников аВ. С. Массовые источники икомп ьютеризация исторических исследований. Вкн.: Источниковедение нове йшей истории России: Теория, методология, практика. М., 2004, с. 453. 4. Ivanovs, A., Varfolomeyev, A. Editing and Exploratory Analysis of Medieval Documents by Means of XML Technologies. In: Humanities, Computers and Cultural Heritage. Amsterdam, 2005, pp. 155– 160. 5. Иванов А. С. Работа сXML-документом как воспроизведение о сновных этапов источниковедческой критики: новые технологии ивозмо жность коррекции традиц ионных подходов. Вкн.: Информационный бюлл етень Ассоциации «История икомпьютер». Специальный выпуск, № 34. М.; Тамбов, 2006, c. 66– 67. 6. Варфоломеев А. Г., Иванов А. С. Технология XML: Современная реализ а ция источнико -ориентированного подхода вработе ско мплексами исторических документов. В кн.: Информационный бюллетень Ассоци ации «История икомпьютер». Специальный выпуск, № 34. М.; Тамбов, 2006, c. 61– 62. 7. Varfolomeyev, A., Soms, H., Ivanovs, A. Knowledge-Based Information Systems in Research of Regional History. In: Digital Humanities 2008. Oulu, 2008, pp. 210–211. 8. Варфоломеев А. Г., Иванов А. С. Принципы электронных публ икаций комплексов исторических документов со средствами палеографич еского, текстологического идипломатического анализа. В кн.: Совреме нные информационные технологии иписьменное наследие: от древних те кстов кэлектронным библиотекам. El’Manuscript -08: Материалы Междун ародной научной конференции. (Казань, 26– 30 августа 2008 г.). Казань, 2008, c. 60– 63. 9. Медушевская О. М. Современное зарубежн ое источниковедение М., 1983, с . 6. 10. Шмидт С. О. Современные проблемы источниковедения. В кн.: Шмидт С. О. Путь историка: Избранные труды по источниковедени и историогр а фии. М., 1997, с. 27– 28. 11. Ковальченко И. Д. Исторический источник всвете учения об информации. (К постановке проблемы). История СССР, 1982, № 3, с. 129– 148. 12. Ковальченко И. Д. Методы исторического исследования. М., 1987, с. 106– 126. 13. Иванов А. С., Варфоломеев А. Г. Идеи И. Д. Ковальченко об информационной ценности и неисчерпаемости источника всовременном 60
компьютерном источниковедении. В кн.: Идеи академика И. Д. Ковал ьченко в XXI веке: Материалы IV научных чтений памяти академика И. Д. Ковальченко. М., 2009, с. 154– 164. 14. Источниковедение: Теория. История. Метод. Источники росси йской истории / И. Н. Данилевский, В. В. Кабанов, О. М.Медушевская, М. Ф. Румянцева. М., 1998, с. 9. 15. Беленький И. Л. Источниковедение историческое. Вкн.: Источн иковед е ние: Проблемные лекции. Учебно -методический модуль. М., 2005, с. 100– 112. 16. Григорьева И. В. Источников едение новой иновейшей истории стран Ев ропы иАмерики: Учебник для студентов. М., 1984, с. 7. 17. Иванов А. С., Варфоломеев А. Г. Технология XML как инструмент компьютерного источниковедения (на примере формулярного анализа д окументов пр иказного делопроизводс тва). В кн.: Круг идей: Алгоритмы и технологии исторической информатики: Труды IX конференции Ассоци ации «История икомпьютер». М.; Барнаул, 2005, с. 241– 242. 18. Иванов А. С. Источниковедческие и археографические аспекты реконс т рукции исторических комплексов источников (отдел «Moscowitica –Ruthenica» вбывшем архиве Рижского магистрата). Вкн.: Сословия, институты игосударственная власть вРоссии. (Средние века ираннее Новое время): Сборник статей памяти академика Л. В. Черепнина. М,2010. (Studia philologica), c. 97– 105. 19. Варфоломеев А. Г., Кравцов И. В. Приобретение ипредставлени знаний всетевом сообществе исследователей текстов. Вкн.: Вторая конф еренция «Систе мный анализ иинформационные технологии» САИТ -2007, Обнинск, 10– 14 сентября 2007 г.: Тр. конф. : в2 т. Т. 1. М., 2007, с. 104106. 20. Ahonen, E., Hyvönen, E. Publishing Historical Texts on the Semantic Web –A Case Study. In: Proceedings of the Third IEEE International Conference on Semantic Computing (ICSC2009). Berkeley, 2009, pp. 167– 173. 21. Варфоломе ев А., Иванов А. Семантические публикации информ ации исторических источников на основе технологии Wiki. In: Vēsture: Avoti un cilvēki. Humanitārās fakultātes XX starptautisko zinātnisko lasījumu materiāli. Vēsture.. Daugavpils: Daugavpils Universitātes Akadēmiskais apgāds „Saule”, 2011, pp. 339– 347. 22. Варфоломеев А. Г., Иванов А. С. Семантические публикации ко мплексов исторических источников. Вкн.: Информационные технологии и письменное наследие. El’Manuscript -10: Материалы международной нау чной конференции (Уфа, 28– 31 октября 2010 г.). Уфа; Ижевск: Вагант, 2010, c. 4246. 23. Иванов А., Варфоломеев А. Публикация ианализ рукописных исторических документов спомощью технологии XML. Humanitāro Zinātņu Vēstnesis, 2009, 16, pp. 6984. 24. Варфоломеев А., Иванов А. Модел идля адекватной репрезентаци неполной и/или противоречивой исторической информации висторич е61
ской семантической сети: К постановке проблемы. In: Vēsture: Avoti un cilvēki. Humanitārās fakultātes XIX starptautisko zinātnisko lasījumu materiāli. Vēsture XIII. Daugavpils, 2010, pp. 210216 lpp. 25. Бородкин Л. И., Милов Л. В. Онекоторых аспектах автоматизаци текстологического исследования (Закон Судный людем). В кн.: Матем атические методы висторико -экономических иисторико -культурных исследованиях. М., 1977, с. 230279. 26. Варфоломеев А. Г., Бабалык М. Г., Пигин А. В. О проекте вирт уальной среды для исследования списков «Беседы трёх святителей». Вкн.: Электронные библиотеки: перспективные методы и технологии, эле ктронные коллекции: Труды XII Всероссийской научно й конференции "RCDL'2010" (Казань, 1317 октября 2010 г.). Казань, 2010, с. 551556. MANUSCRIPT AND EARLY PRINTED TEXT RECOGNITION APPLICATION2 S. Kornienko, Y. Aydarov, F. Cherepanov, D. Gagarina, L. Yasnitskiy Perm Nowadays in order to create modern scientific and educational environment of the humanities one of the main tasks is development of information resources based on manuscripts and early printed texts that date back from the 12th to the 17th centuries. This task is very important for specialists in the digital humanities, history, linguistics, philology, museums and archives. Significant aspects of cataloging, documentation, preservation and visualization of manuscripts and early printed sources have been developed. A great number of their digital copies can be downloaded from the Internet. However, usually these collections are set of images [6] that is suitable for preservation, visualization and wide access, but not for full-text information search and computer analysis. Publishing in graphic formats limits research possibilities. Therefore, the most challenging task today is web publishing in text formats. Insufficient quantity of manuscripts and early printed books in text formats is caused by lack of recognition technologies. OCR success in modern documents recognition provided hopes relating with manuscripts and early printed texts [5]. Nevertheless, even current advance in commercial OCR technologies is not enough to tackle all the recognitionrelated problems. For example, one of the most efficient recognition software ABBYY FineReader and its tools «recognition with learning» and «based on user sample recognition» provides suitable results for printed texts that date back to 18th and 19th centuries, but not for earlier texts. Uncovered challenges have led to development of special text editing programs, for example OldEd as part of Manuscript software [12]. However, this software is as time-consuming as any typing-based approach. In addition, spe- 2 62 Supported by Russian Foundation for Basic Research, grant № 09–06–00254а , 2009-2011
cial skills are required for such a typing. Nowadays only a few texts are digitized using this technology. Due to lack of specialized recognition software and inefficiency of commercial Cyrillic OCR technologies to translate manuscript and early printed books images into text, it is necessary to develop new software to tackle the problems above. It will help to create scientific and educational resources and lead to efficient use of information technologies in the humanities researches. Nowadays, it is a question of great importance worldwide [3, 7, 10, 13, etc.] There are different approaches to recognition itself, preparation to recognition and post-recognition processes. The most promising is artificialintelligence-based approach. Perm State University manuscript and early printed texts recognition software has being developed from 2009. Project team consists of historians, artificial intelligence specialists and software developers. Recognition software is based on artificial neural network that are widely involved in recognition algorithms from 70s of the 20th century [1]. Perm artificial intelligence group obtained some experience in neural-network-based software development. For example, promising results were obtained for complex from the technical point of view task –recognition of specific texts (fragmented, noisy texts with several fonts) such as vehicle plates and sketch details recognition. Our software includes several applications that help preserve, recognize and work with recognized Cyrillic books. The software consists of database for cataloging of early printed book and manuscripts and modules for preparation to recognition, recognition itself, postrecognition, data visualization on demand. Database also includes attributes of different type, digitized images, recognized text in ancient and modern transcripts, additional information about text publisher or creator. These data is used to increase efficiency of recognition and visualization. One of the main software components is «Cyrillic symbol» clusterization algorithm [9]. It can take symbols and superscripts from old books both color and black and white page images and label groups of the graphic objects for further recognition. The algorithm consists of three stages: binarization, segmentation and clusterisation. Result obtained at every stage is input for next stage that increases the share of successfully recognized graphic objects and helps performance. During binarization symbols are being separated from the document background. Inhomogenuity in background color due to manuscript or early printed book paper specifics, symbol discolorment, document damage led to the necessity of adaptive binarization algorithm. Segmentation, the second stage, is extracting symbols from the binarized image. Segmentation algorithm is based on font information that increases recognition quality. For example, small little dots are too small to be a symbol or superscript, spot of wax has specific form etc. During segmentation, process also tackled problems of disconnected and corrupt symbols, noise that is similar to superscripts, initials, illustrations and noise that is as big as main text characters. Segmentation results are developed due to symbol outline finding ap63
proach [2] that led to successful recognition of some glagolic texts [3]. Finally, segmentation quality and performance were also improved. The third stage of «Cyrillic symbol» algorithm is clusterization. During this stage, symbols are combined into groups. Array of characters and superscript images from the segmentation output is clusterisation input. Finally, every group is assigned a label that is integer number and array of characteristic values. Images are combined in one cluster if their characteristic values difference is less than threshold value. After that, every cluster is put into correspondence with user sample character or superscript in order to train artificial neural net. Only several first pages are used for artificial neural network training. After that, other pages are recognized by artificial neural network component. Due to usage of multilayer perceptron, recognition process performance can be improved by implementing it in a form of interacting parallel web-services. «C yrillic symbol» tool can be adapted to any number of parallel processors or cores. Due to great difference between neural networks for different texts, special network-matching algorithm is developed. The most important value in this process is the result of sample image recognition. Artificial neural networks are very inconvenient to debug and special reasoning component is implemented. The component is adjusting matching neural network parameters in accordance with recognition quality. The final recognition stage output is text with original spelling. On demand it can be translated into modern language text. The tool described is developed not only to recognition aim but also to help preservation, visualization and full text search. Recognition is a very computationally hard process and its results have to be put in the public domain. As a result the tool will be accessible online. Its design is oriented to be running on Perm State University server. It can help users to work in both the Internet and Intranet. Web-oriented graphics technologies also will help to work with recognition results online. References 1. Carpenter G.A., Grossberg S. A massively parallel architecture for a self-organizing neural pattern recognition machine. In: Computer Vision, Graphics, and Image Processing. 1987, Volume 37, Issue 1, pp. 54– 115. 2. Chang F., Chen C.-J., Lu C.-J. A Linear-Time Component-Labeling Algorithm Using Contour Tracing Technique. In: Computer Vision and Image Understanding. 2004, Volume 93, Issue 2, pp. 206– 220. 3. Diem M., Lettner M., Sablatnig R. Registration of Manuscript Images using Rotation Invariant Features. In: Computer Vision Winter Workshop 2008. Slovenia, 2008, pp. 107– 114. 4. Lowe D.G. Distinctive Image Features from Scale-Invariant Keypoints. In: International Journal of Computer Vision. 2004, Volume 60, Issue 2, pp. 91– 110. 5. Володихин Д.М. Перспективы примене ния программ оптического распознавания вработе со средневековыми русскими кириллическим текстами (Из опыта применения компьютерных технологий впреподав а64
нии русской палеографии) // Информационный бюллетень Ассоциации «История икомпьютер». 1999. № 24. С. 178– 181. 6. Гагарина Д.А., Корниенко С.И. Рукописные истаропечатные к ириллические книги вИнтернете // Вестник Пермского университета. Серия История. Вып. 3 (10). Серия Политология. Вып. 3(7). 2009. С. 112– 119. 7. Зеленцов И.А. Выдвижение ипроверка гипотез всистеме расп ознавания древнерусской скорописи // Информационные технологии и письменное наследие: материалы междунар. науч. конф. / отв. ред. В.А. Баранов. Уфа, 2010. С. 99– 101. 8. Корниенко С.И., Волгирева Г.П., Гагарина Д.А. База данных как средство фасетно йклассификации рукописных истаропечатных кириллич еских изданий // Информационные технологии иписьменное наследие: мат ериалы междунар. науч. конф. / отв. ред. В.А. Баранов. Уфа, 2010. С. 121– 125. 9. Корниенко С.И., Ясницкий Л.Н., Айдаров Ю.Р., Черепанов Ф.М . Инструмент параметризуемой кластеризации «Старопечатных кириллич е ский символ» // Информационные технологии иписьменное наследие: ма териалы междунар. науч. конф. / отв. ред. В.А. Баранов. Уфа, 2010. С. 130– 133. 10. Кучуганов А.В., Касимов Д.Р. RECO –програм мная система для распозн а вания старославянских текстов // Информационные технологии и письменное наследие: материалы междунар. науч. конф. / отв. ред. В.А. Баранов. Уфа, 2010. С. 114–148. 11. Пермская научная школа искусственного интеллекта иее иннов ационные проекты / Л.Н. Ясницкий, В.В. Бондарь, С.Н. Бурдин идр.; под ред. Л.Н. Ясницкого. М. -Ижевск: НИЦ«Регулярная ихаотическая дин амика», 2008. 75 с. 12. Портал «Манускрипт». http://manuscripts.ru/. 13. Рогов А.А., Талбонен А.Н ., Варфоломеев А.Г. Автоматизирова нная система распознавания рукописных исторических документов // Тр уды12й Всероссийской научной конференции «Электронные библиотеки: перспективные методы и технологии, электронные коллекции» – RCDL’2010. Казань, 2010. С. 469– 475. ИСТОРИКИ-ЛЮБИТЕЛИ И ПРОФЕССИОНАЛЫ: ФОРМИРОВАНИЕ И ФУНКЦИОНИРОВАНИЕ СЕТЕВЫХ СООБЩЕСТВ Е. А. Кочеткова Санкт-Петербург Ⱥɧɧɨɬɚɰɢɹ В докладе рассматриваются различные причины имеханизмы фо рмирования сетевых сообществ историков -любителей ипрофессио налов, а также дается характеристика основных особенностей их функциониров ания путем сравнительного анализа. 65
Под сетевым сообществом вдокладе понимается группа людей, ос уществляющих регулярное общение на протяжении длительного времени в сетевом пространс тве, имеющих схожие цели иобщие интересы. [3] На сегодняшний день вИнтернет -сети существует значительное число ра зличных сообществ историков, которые всамом широком виде можно об ъединить наличием уих участников интереса кистории. При всем мног ообразии таких сообществ, их можно разделить на две категории –сообщ ества историков -любителей, т. е. тех ценителей истории, которые не имеют профильного образования, но владеют более или менее обширными зн аниями висторической области, как правило, за счет самооб разования, и профессионалов. Вчисло последних входят академические, университе тские ишкольные историки, чья профессиональная деятельность связана с исторической наукой. Также всетевом пространстве функционирует зн ачительное число сообществ студентов -ист ориков, которые представляют собой среднее звено между объединениями любителей ипрофессионало ивтекущей работе рассматриваться не будут. Материалом для данной работы послужили более 30 сетевых соо бществ историков -профессионалов илюбителей, из которы х70 % пре дставлены виртуальными объединениями последних. Это, очевидно, отр ажает общее количественное соотношение – большая часть онлайн сообществ историков создается любителями. Помимо статистических различий вкаждой выделенной категории сообществ имеет ся значительное число особенностей, связанных сих формированием ифункционированием. Одно из важных отличий заключается впарадоксальном соотнош е нии профессионализма идилетантства всферах, которые являются кл ючевыми для каждого участника сообществ –со бственно, истории иИнтернет . Так, будучи специалистами висторической науке, многие профессионалы, вст упающие всетевые сообщества, зачастую оказываются пассивными либо начинающими пользователями сети, испытывают трудности скомпь ютерными иИнтернет -техно логиями. Напротив, члены любительских сообществ, отн осящиеся ккатегории дилетантов вистории, о б ладают ИТ -компетентност иимеют большой опыт работы всети. Такую дихотомию можно отчасти объяснить возрастным критерием –профессиональные ис торики на сегод ня представлены средним или старшим поколением, менее знакомым сгл обальной сетью, вто время как любителями являются либо более молодые участники сообществ, либо те, кто активно пользуется Интернет . Одним из главных мотивов создания сетевых сообществ ист ориков – условно назовем его «контентным» –является обмен информацией. Обе категории историков объединяются всетевые сообщества, имея целью «выкладывание» иполучение знаний, однако вкаждом случае содерж ательно икачественно разных. Цель любителей заклю чается враспростр анении иполучении новых данных, как правило, любопытных ималоизв естных фактов истории, изнания, которыми делятся эти историки –моз а66
ичны, вто время как их сообщества представляют собой хаотичные инеструктурированные энциклопедии неве рифицируемой статистики, би ографий известных деятелей ит.п. Многие сетевые объединения любит елей представляют собой музееобразные сообщества, где собраны интере сные детали из разных сюжетов истории, иллюстрации ипр. Сообщества профессионалов, как правил о, не создаются сцелью обм ена информацией ввиде фрагментарных знаний, поскольку историк, «сл ивающий» интересные факты по поводу той или иной темы явно теряет пр естиж вглазах научного сообщества. Некоторые сетевые объединения пр офессиональных историков формируются сцелью обмена более «обсто ятельными» ресурсами –оцифрованными книгами или статьями. Однако историки более активно «скачивают» такой контент, вступая вс о общество с целью получения доступа кчужому опыту, не желая делиться плодами св оих трудов. Это, вероятно, имеет практические –низкая степень защищенн ости авторских прав, малая выгода от публикации статьи всети Интернет , контрастирующая струдностями публикации вхорошем печатном издании, ипсихологические причины –слабое доверие большинства историков, ос обенно, старшего поколения кэлектронным ресу р сам. [4] Поэтому «у ученых позиция сугубо потребительская –они «скачивают» редкие ма териалы… но сами даже своих уже опубликованных статей икниг не предлагают» [6]. Гораздо чаще профессиональные историки делятся информ а цией ввиде своих комментариев ивысказываний, представляющих ре флективное, ане сырое (фактологическое) знание. При этом информация, предоставляемая профе ссионалами, сопровождается ссылками на исторические источники. Вероя тно, это к ореллирует стем, что профессиональные историки –участники с ообществ, вотличие от л юбителей, редко скрывают свое имя, рассматривая сетевые объединения как профессиональное поле деятельности, вкотором они несут ответственность за предоставляемые данные. Другой мотив формирования сетевых сообществ –проведение ди скуссий, обсуждений спорных исторических проблем, событий научного сообщества –выход всвет новых печатных трудов, проведение меропри ятий, появление новых гипотез ит.д. При этом профессиональные истор ики всетевых сообществах выступают вкачестве экспертов, участников научной коммуникации, вто время как любители «выкладывают» или дают ссылку на новую монографию или статью как рекомендованные кчт ению другим участникам, высказывая неглубокое оцено чное суждение (х орошая или плохая работа). Влюбительских сообществах трудно встретить обсуждения историографии вцелом (а не отдельного труда) или проблем исторических теории и методов, что более характерно для професси ональных историков и, вособенности, учителей истории. Часто сообщества создаются суведомительной целью –как своего рода стенды, на которых вывешиваются различные объявления. В соо бществах любителей -историков участниками публикуются сведения омузейных иИнтернет -выставках, новинках истор ической литературы, Ин67
тернет -магазинах, вкоторых можно приобрести раритетные предметы и т. п. Для историков -профессионалов важной является информация опре дстоящих «офлайновых» научных мероприятиях –конференциях, семин арах, симпозиумах, атакже грантах, материальной поддержке ипр., ата кже событиях научной жизни. Отличительной причиной создания сообществ профессиональных историков является организация мероприятий, связанных систорией, вСети. Наиболее активно здесь себя проявляют учителя истории, для к оторых обсуждения в сообществах представляются альтернативой собраний в «офлайновой» реальности. «Сложно выбирать день, который устраивал бы всех», всетевом сообществе «время для обсуждения… проблем не ограничено рамками времени заседания». [5] Вцелом, т аких сообществ немного, иони являются неустойчивыми, заканчивая свое существовани после решения важнейших задач. Как правило, сообщества создаются, л ибо начинают существовать со временем как многофункциональные, объединяя все указанные выше мотивы. При этом несложность иневерифицируемость содержания, откр ытость для широкой аудитории любительских сетевых объединений позв оляет им быть более устойчивыми идольше функционирующими. Сообщества любителей обычно создаются одним или группой цен ителей истории, ипостепенно пополняются новыми участниками. Такие объединения расширяются гораздо быстрее, чем сообщества професси оналов: достаточно появление одного модератора, создающего сообщество любой тематики, которое может привлечь большое количество пользов ателей, поскольку втаких сообществах, как указывалось выше, как прав ило, существует свобода обмена любой информацией, так или иначе имеющей отношение ктеме объединения испособной быть интересной другим участникам. Более того, любительские виртуальные объединени я являются открытыми, как правило, не требующими проверки професси онального «происхождения» или компетентности члена. Поэтому фактич ески сообщества любителей легко включают всех, подходящих под катег орию «людей, увлекающихся историей». [1] Любительские соо бщества могут быть оценены как слабая, хотя иустойчивая, кооперация, [7] т. е. объединение, включающее большое кол ичество активных ипассивных участников, имеющих разный бэкграунд и сферу деятельности, но объединенных общем проектом, членством водном соо бществе. Важным условием стабильности таких объединений я вляется наличие небольшого постоянного костяка активных участников «управленцев», которые могут поддерживать иследить за выполнением правил и безопасностью и не позволить сообществу «расплываться» в аморфную массу заинтересованных людей. Большинство сетевых сообществ профессиональных историков оформляются как «представительские», когда существующая в«офлайн овой» реальности структура или объединение –факультет вуза, универс и68
тетская кафедра, учителя истории школы, исторический клуб ит. п. –со здает свою копию вглобальной сети. Как правило, вподобных виртуал ьных объединениях участвует наиболее активная часть членов реально с уществующей структуры, выделяющей одно или несколько лиц, осущест вляющих ру ководство иконтроль всетевом сообществе. Такие объедин ения более консервативны кпринятию новых членов, иредко вчисленном от ношении превышают число участников реального сообщества. Реже онлайн -объединения профессионалов создаются одним или группой ист ориков -энтузиастов «с нуля», ивэтом случае находят немного единомышленников. Такие объединения, как и«представительски с ообщества, можно обозначить как сильную кооперацию, т.е. сообщество, включающее в себя небольшое количество участников, объединенны х общей целью. [7] Однако они являются неустойчивыми, илибо быстро распадаются, либо превращаются вподобие Интернет -сайта. В целом, профессиональные историки представляются категорией, менее активной вучастии всетевых сообществах. Вотличие от любит еле й, они реже объединяются вИнтернет -сети, проводят непродолжител ьные дискуссии [2], вследствие чего длительно функционирующими явл яется незначительное число профессиональных сообществ. Возможно, это объясняется указанными выше причинами –низкой степенью доверия к сети Интернет , препятствиями ввиде недостаточной компьютерной ко мпетентности. Тем не менее, представляется возможным предположить, что вближайшие годы сообщества профессиональных историков станут более устойчивыми имногочисленными. Ʌɢɬɟɪɚɬɭɪɚ 1. Geohistory.ru [Электронный ресурс ].–Режим доступа : http://www. nextmedia.ru/111385. Дата обращения : 1.02.2011. 2. Historians, My Blog and the Academic Blog Community [Электронный ресурс ]. – Режим доступа : http://www.historiologicalnotes.org/2004/06/ historians_my_b.html. Дата обр а щения : 17.02.2011. 3. Гидденс Э. Устроение общества: Очерк теории структурации. / Пер. сангл. И. Тюриной. М.: Академический Проект, 2003. С.15. 4. Историк, источник иИнтернет [Электронный ресурс]. –Режим до ступа: http://vivovoco.rsl.ru/VV/BONTONE/HISTORY.HTM. Дата обращения: 17.02.2011. 5. Открытый класс: Сетевые образовательные сообщества [Электро нныйресурс]. – Режим доступа: http://www.openclass.ru/forums/57583 http://www.openclass.ru/forums/57583. Дата обращения: 21.02.2011. 6. Почему истор ики пассивны в исторических Интернет -проектах [Электронный ресурс]. – Режим доступа: http://socialist.memo.ru/forum/ index.php?s=311442eb4315829726147c4a74efaf64&showtopic=927&pid=3221& mode=threaded&show=&st=&. Дата обращения: 11.02.2011. 69
7. Сетевые сообщества и будущее Интернет -технологий. Web 2.0. [Электронный ресурс]. – Режим доступа: http://www.polit.ru/lectures/ 2007/05/31/web.html. Дата обращ е ния: 11.02.2011. ИССЛЕДОВАНИЕ ВАРИАТИВНОСТИ ФОЛЬКЛОРНЫХ ПЕСЕН С ПОМОЩЬЮ НЕЧЕТКИХ ТЕОРЕТИКО-ГРАФОВЫХ МОДЕЛЕЙ RESEARCH OF FOLKLORE SONGS VARIABILITY WITH FUZZY GRAPH MODELS Н. Д. Москин Петрозаводск Annotation This paper discusses how to apply fuzzy sets and fuzzy graphs to research the structure of folklore songs. Also describes the implementation of the search procedure of song motives, based on an algorithm of subgraph isomorphism. В данной статье показано, как можно и нечеткие графы для исследования фо фольклорный (в отличие от литературног бенностей, одной из которых являетсяН. Путилов: вариативност а«В риативность –одно из самых очевидных, ярко в качеств фольклора, с исключительной об на самых разных –начиная егомикроэлементов уровнях от любо и кончая целостными национальными сист понимаем обычно видоизменения -либо устойчивых каких е- данн ствующих в традиции со своими сложивши отивов, образов, частей, текстов жанровых или их особенно Рассмотрим, как можно применить –нече т кие мате множества и нечеткие –для исследования графы [1] квариат лорных песен. При задании нечеткого имн 0   ( x )  1 сывается числоA (функция принадлежности), епень принадлежности этого A. Если элемента функция дмно п лежности равна нулю, то элемент т ву. строго Если значение равно единице, длежит то, о жеству. наоборот, мн с Применим нечеткие множества для форм границ мотивов в фольклорных текстах. еделено множество слов и множество пес  A (x ) , которая поставим в соответствие сти функцию и-прина пр нимает значение от 0 до 1 включительно отиву, то соответствующее значение е- функ жит, –единице. то Если же граница размыта, длежать мотивам, разным то значение находится оторое определяется на основе знаний эк 70
Более сложные языковые моделиотекст щью нечетких графов. Здесь в отличие о приписывается ункции значение принадлежности ф о- (неч го рода). Такие же «веса» можноапостав фа (нечеткий граф второго рода). Расс песни «Как назябло, навеяло лицо» из 1916 ода, г г. Петрозаводск) [2]: Ʉɚɤɧɚɡɹɛɥɨɧɚɜɟɹɥɨɥɢɰɨɞɚ ɉɪɨɬɢɜɫɟɜɟɪɢɤɚɢɞɭɱɢɫɶȾɚ Ʉɪɚɫɧɚɞɟɜɢɰɚɜɨɬɟɪɟɦɟɫɢɞɢɬ ɀɟɦɱɭɠɧɨɟɨɠɟɪɟɥɶɢɰɨɫɚɞɢɬɞɚ Ɋɚɡɫɵɩɚɥɨɫɶɨɠɟɪɟɥɶɢɰɨɞɚ ɉɨɜɫɟɦɭɜɵɫɨɤɭɬɟɪɟɦɭȾɚ ɇɟɫɨɛɪɚɬɶɧɟɫɨɛɪɚɬɶɠɟɦɱɭɝɚ ɑɬɨɥɶɧɢɛɚɬɸɲɤ ɭɧɢɦɚɬɭɲɤɢɞɚ ɑɬɨɥɶɧɢɛɪɚɬɰɚɦɧɢɹɫɧɵɦɫɨ ɇɢɫɟɫɬɪɢɰɚɦɛɟɥɵɦɥɟɛɟɞɹɦɞ Ⱥɫɨɛɪɚɬɶɫɨɛɟɪɟɬɠɟɦɱɭɠɨɤɞɚ Ɋɚɡɭɞɚɥɵɣɞɨɛɪɵɣɦɨɥɨɞɟɰ Подобный сюжет встречается и других позябло лицо» в записи одаФ.и Студитского «Разсыпалос ерельице» в записи К. М. Петрова 1868 г различия: персонажи «батюшка» и р«матуш вом варианте, объект «северик» есть нто тах и др. Поэтому ве трехна текстов осно можно пост граф сюжета с нечеткими 1). Здесь связями значение и(рис. ф надлежности вычисляется как отношение текстов к общему числу текстов. Рис. 1. Обобщенный графяпервого сюжета рода песнидл 71
Аналогично можно устанавливать и- «веса мер, в первом мотиве бесёдной песни и« санной В. Д. Дашковым в 1842 году [6] платок». В схожем варианте до жон песни добры», и- «Все санной Ф. Студитским в 1841 году о- [5], этому вя дом графе с вершиной р «шелков платок» тогда как с тальных веса о объектов равны единице Рис. 2. Обобщенный граф лявторого сюжета рода песнид Каждому обобщенному графу можно пос коэффициентов, отражающих «нечеткость» графе G обозначим m –количество n –количество вершин, sребер. –это сумма «весов» тать всех «вес» ребер глобаль (будем изображенной на рисунке пунктиром, s рав на число n, связей то получится среднее значени ображенного на рис. 1, этот показатель чно можно ть подсчита средний «вес» нечеткости ве Далее можно построить коэффициент C(G) подобно св тому, как это было Ф. Скороходько сделано в работе при кана Э стовых семантических сетей [8]: C (G )  2s m(m  1) . Параметр C(G) принимает ниезначе от 0 до C(G)=0 1.соо При тэто ветствует -графу, нуль C(G)=1а –полному графу с «весам единице. Для графа, изображенного C(G)≈0,15.на р Впоследствии эти и другие коэффициен т кость» структуры жно графа, использовать мо при классиф анализе) текстов. С другой стороны ьпри зовать специальные метрики [3]. На мно 72
которое позволяет оценить, насколько друг на друга (например, расстояние дна графа, наименьшего общего надграфа, ера дактирования). Однако эти метрики треб имеем дело с нечёткими моделями. ть -разному, по Здесь эт зависит от целей и задач исследования операций редактирования graph edit distance) ищется ( как мини суммарная стоимость операций редактиро еименование вершин оторые и рёбер), преобразуют к еграф в лим вес операции переименования евершин ни их «нечёткости», е. от соответствующих т. дзначен лежности. Например, если вершины одног принадлежно сти равны единице, то вес операци можно принять равным –0,5 нулю, и 1, если тоузначен вес оп дет равным е. разности 0,5, т. этих значений и т. Рис. 3. Процедура поиска мотивов Также подобные обобщенные рименять графы для мож реш задачи поиска схожих мотивов в коллек мотивов сводится к задаче поиска р-схоже ганизации поиска песенных-графовых мотивов е- на модо лей была реализована ующая процедура соответствв инфо системе «Фольклор», разработанной а- в ср ния Delphi 7.0 [4]. В настоящееевремя тырех фольклорных коллекций, одной диз ных песенXIX Заонежья –начала XX века, состоящий скомый мотив можно задать двумя оспособ стоятельно определяет объекты и связи, мотива и программа автоматически стро экс перименты, процедура работает адостат фов, у которых число вершин не превосх 73
Заметим, что обобщенные графы можно нескольких схожих мотивов, но и на ос объединять по месту записи, жанру, темпу или Ʌɢɬɟɪɚɬɭɪɚ 1. Берштейн Л.С., Боженюк А.В. Нечеткие графы –М.: и ги Научный мир, 2005. 2. Лысанов В. Д. Досюльная свадьба, пе Олонецкой –губернии. Петрозаводск: ерная скоропечатня Сев Р. 3. Москин Н.Д. Алгоритмы сравнения -графовых графов моделей: учебное –Петрозаводск: пособие. -во р Пет ГУ, Изд 2009. 4. Москин, Н. Д. Применение -графовых нечетких о делей м т в задачах моделирования сенных мотивов и поиска а//пе Тру той национальной конференции поуискусс народным участием -2010. Тверь, -24 КИИ сентября 20 –М.: 2010 зФи г. матлит, – 2010. С. -251. 243 Т. 1 5. Народные песни Вологодской нные и Олоне Ф. Студитским. –Санкт -Петербург, 1841. 6. Описание Олонецкой губернии е ском в исто и этнографическом отношениях. –Санкт -Петербург: Сост. В.ти Д мин -ва внутренних дел, 1842. 7. Путилов Б. Н. Фольклор –СПб.: и народная , 1994. Наука к 8. Скороходько Э. Ф. Семантические тсет ка текста. –Киев: Наукова думка, 1983. ЗНАЧЕНИЕ И ИСПОЛЬЗОВАНИЕ ДИСТАНЦИОННОГО КУРСА ПО ИСТОРИИ ОТЕЧЕСТВА В УЧЕБНОМ ПРОЦЕССЕ ДЛЯ СТУДЕНТОВ ТЕХНИЧЕСКИХ СПЕЦИАЛЬНОСТЕЙ А. М. Пекина Петрозаводск Молодой человек живёт вбыстроизменяющемся, противоречиво сложном мире, вкотором объём информации возрастает вгеометрическо прогрессии. Его социальный ипрофессиональный успех зависит от поз итивного отношения кновациям. В настоящее время вПетрозаводском государственном обучаются более 19500 студентов на двенадцати факультетах, вуниверситете раб отают более 3600 преподавателей исотрудников. ПетрГУ имеет высокий статус крупного исследовательского центра вобласти информационных технологий. По этому ворганизации учебного процесса широко использ уются активные методы обучения. Вуниверситете интенсивно ведутся работы по развитию информационно -образовательной среды вуз аиматер иально -технической базы для внедрения информационно -коммуникацион 74
ных т ехнологий вобразование инаучные исследования. Активно внедр яется вучебный процесс система дистанционного обуч е ния. Знание истории своего Отечества иразвитие личности винформац ионную эпоху –не разделимый процесс. Согласно учебному плану подготовки бак алавра понаправлению «Строительство» учебная нагрузка покурсу «История отечества» с 20112012 гг. будет следующая: лекции  16 часов, семинарские занятия – 16 часов, самостоятельная раб ота студентов  40 часов. Исходя из этого, целесообразна разработка ивнедрение дистанцио нного ку р са. Меню курса состоит из разных составляющих. Это –глоссарий, кот орый кратко раскрывает основное содержание дефиниций. Лекционные т емыпредставлены вформе слайд -презентаций. Биографии персоналий с опровождаются иллюстрациями. Слайды спортретами выдающихся истор ических личностей, таких как Александр Невский, Дмитрий Донской, Але ксандр Суворов, Михаил Кутузов, Петр Великий, Екатерина Великая идр угие способствуют более глубокому запоминанию учебного матери а ла, так как задейство вано образное восприятие иэмоциональное воздейс т вие. Тестовые задания выделены отдельно. Так жесодержание курса включает планы ксеминарским занятиям, основные даты, темы докладов и рефератов, вопросов кзачету ирекомендуемую литературу. Для студе нтов з аочников вкурсе предусмотрены темы контрольных заданий ив о просов. Так как учебная программа по истории Отечества предполагает самосто ятельную работу студентов, целесообразно давать задания по дистанцио нному курсу. Тем самым преподаватель может контролиро вать работу ст удентов. Одновременно происходит снижение нагрузки на преп о давателя в процессе проведения учебного процесса за счет увеличения иповышения самостоятельной работы студента. Акцент преподавательской работы до лжен быть смещен вобласть качествен ной подготовки уче б ных курсов. Все тестовые задания разрабатываются взакрытой форме. Тестиру емый студент должен дать один правильный ответ из трех предложенных. При этом неправильные ответы сформулированы так, чтобы они выгляд ели правдоподобными иих нель зя исключить логически из -за явной нел епости. То есть, дистракторы втестах не должны встречаться. Например: 1. Князь Александр Ярославич получил прозвище Невский а. после Ледового побоища б. после разгрома шведского флота Биргера в. после перенесения его праха вг.Са нкт -Петербург 2. Первое народное ополчение во время Смутного времени возглавил а. воевода Дмитрий Пожарский б. нижегородский староста Кузьма Минин в. дворянин Прокопий Ляпунов 75
3. Династия Романовых а. 1598–1917 б. 1613–1917 в. 1613–1918 У студента есть три попытки ответить на воп росы теста, на который стоит ограничитель по времени. Если наполняемость группы до 12 чел о век, целесообразно проводить тестирование вкомпьютерных классах для ди станционного обучения во время семинарских занятий. Преподаватель мо жет распечатать результаты тестирования для дальнейшего учета зн а ний кзачету вконце учебного процесса. Тестирование позволяет проводить как опер ативный контроль, так изаключительный контроль пройденного мат е риала. Для студентов заочного отделения тесты составляются отдельно. Нео бходимо отметить, что вкорпусах Петрозаводского госуниверс итета работает 46 компьютерных классов. Общее количество рабочих мест составляет 522, все рабочие места имеют доступ вИнтернет . Среднее к оличество учебных часов на одного студента вгод составляет 91. Одновременно, студенты, имеющие дома компьютер ивыход вИнте рнет , выполняют задания по дистанционному курсу вудобное для них время. Навигация позволяет управлять курсом, проследить работу студе нтов. Внедрение дистанционных курсов повышает компьют ерную грамо тность студента, особенно заочников . Студент должен уметь пользоваться различными источниками информации, включая электронные. Так, при подготовке ксеминарским занятиям изачету студенты ПетрГУ имеют возможность пользоваться электронной библиот екой университета, кот орая содержит 695 полных те к стов, из них –120 –книги из редкого фонда. Таким образом, интеграция бумажного учебника, дистанционног курса илекций преподавателя ваудитории призвана решать задачу усво ения материала по истории. Ʌɢ ɬɟɪɚɬɭɪɚ 1. Пекина А.М. Использование компьютерных технологий визуч ении гуманитарных дисциплин //Университеты вобразовательном пр остранстве региона: опыт, традиции и инновации. Материалы научно методической конференции (21– 22 апреля 2005 г.) Часть II. Петро з а водск. 2005. С.41 – 43. 2. Пекина А.М. О роли информационных технологий вповышении качества образования вПетрозаводском государственном университете Перспективы социально -экономического развития России икачество гум анитарного образования. Материалы межд ународной научно -практической конференции 13 апр.2007г. Санкт -Петербург. СПбИГО., ООО«Книжный дом». 2007. 83– 84с. 3. Пекина А.М. Роль информационных технологий впреподавании культурологии вПетрозаводском государственном университете //Инфор матизация обра зования –2009. Материалы международной нау ч но -методи ческой конференции. Волгоград. Изд -во ВГПУ «Перемена». 2009. С.385 387. 76
МЕТОДИКА И РЕЗУЛЬТАТЫ СОСТАВЛЕНИЯ ПРОСОПОГРАФИЧЕСКОЙ БАЗЫ ДАННЫХ ПО ПЕРСОНАЛЬНОМУ СОСТАВУ ГАРНИЗОННОГО ПОЛКА 1735 Г. PROSOPOGRAPHICAL DATABASE AS A METHOD FOR THE PERSONNEL STRUCTURE ANALYSIS OF THE GARRISON REGIMENT 1735 М. Проскурякова Санкт-Петербургский Институт Истории РАН; Карельский институт Университета Восточной Финляндии Annotation This article describes an investigation of the Russian military community. Focusing on the history of one garrison regiment paper suggests a method and the results of the database creating. This database integrates the personal information concerning the officers and soldiers who served in Vyborg in 1730s. ȼɜɟɞɟɧɢɟ Выборгская крепость былаг., отвоев в ходе Великой Северной войны. Взятие В ключевого пункта на берегу Финского з обеспечивали контроль м перешейком над всем оКарель и защ лицы России -Петербурга Санкт от вражеских -запада. напад Безусловно, переход крепости под ивла тельными изменениями в социальной г. жиз вВыборге постоянную сли три службу гарнизонных не у- полк ментов эпохи показал, что численность а лась от 2,5 до 3,5 тысяч человекнских в зависимо частей на протяжении – 1730-хгг. 1710 Именно сообщество у- росс жащих –наиболее многочисленное XVIII в Выборге века – п является объектом данного о нального исследования сост полков, установление ицеров семейного и солдат, положен в их родственных дружеских и связей струировать позволяет ьсоц рек ную историю годы Выборга после е динения в его присо к России. ɐɟɥɶ настоящей –проиллюстрировать статьи нна при ных результатов подход к систематизаци ослужащих. ɂɫɬɨɪɢɨɝɪɚɮɢɹ Жесткий контроль ми, находившимис над людь военной и государственной службе, е- ста форм. Вследствие этого документальные XVIII века содержат подробнейшие сведения советские годы документы му составу по персональ полевых стали предметом Д. Рабиновича, изучения М. сделавшего ыводы по истории российского офицерско 77
историографии послужные и смотровые XVIII с века находятся висториков центре В. Калашникова внимания Г. [2 А. В. Дмитриева [3]. ɂɫɬɨɱɧɢɤɢ . Смотровые списки Ивангородск 1735 г. принадлежат к одному из самых ин истории персонального состава Выборгск емыйсточник и относится к типу массовых юд щих идентичную информацию о широком рк жатся сведения о 1241 служащем полка, обучавшихся в местной гарнизонной до- школ кументе, были собраны в ходе опросов обенностью рассматриваемого источника я военных. Тем не менее большой массив еи дений затрудняет анализ материала. Ɇɟɬɨɞɢɤɚ Конструир ование -источника мета –базы данных –дает прекрасную возможность для обобщения а щих. п Яиспользовала программное FileMaker Pro 11. обеспечение у чившаяся Пол база данных относится к типу просопогр себя сведения о людях, объединенных одним базу информации из источника илась 1241 1735 карт г. Каждая них изсостоит ɋɦɉɪɢɥɨɠɟɧɢɟ из 22 полей . Материал источника 1735 -ти полях г. я размест базы да Эти поля имеют следующие названия: 1. 4.) Номер роты; 5.) Время поступления на получения последнего чина; 7.) еПроисхо мейное положение; 10.) Место авления нахождени т- смо рового списка; 11.) Преступления. Помимо названных полей я внесла в ба включают в себя информацию из именног включена подробная информация о биогра служащих ижних н чинов. В том случае если м имен в обоих источниках, -то из гарнизонных то есть кто вое вВыборге и в 1717 и 1735 гг., я вноси сведения о нем. Описанные три по поля следу ювкл щим позициям: Место 12.) службы в 1717 г.; 13.) 14.) Чин в 1717 г. Решая задачу максимальной стандарти чника XVIII века я дополнительно создала ие цер/Нижний Дата чин. рождения; 16.) 7.) Возраст 1 в начал 18.) Повышение/Понижение чинах в 1735 (в г. по срав 19.) Губерния; Сыновья; 20.) Сословие; 22.) Родственн 21.) нные поля были созданы, чтобы уточнить смотрового иска г., 1735 сп а также облегчить поиск 78
Ɋɟɡɭɥɶɬɚɬɵ . Обращаясь к исследованию ис гарнизонных полков, необходимо нсказать ном законодательстве XVIII века, первой посвященном половины подготовки военных кадров. Согласно нормам 1710-хгг. третью часть рекрутов гарнизонные направлял лпо ки [6]. В них рекруты проходили еобучен вод в полевые полки. Следовательно, чительную р долю среди служащих гарнизонных аполков чала века, описанная практика обеспечи ащихкомплектование и полевых полков д рами.квали В законодательстве следующих рекрутов одесятил не п писана столь подробно. – 1730-хгг.В порядок указах 1720 распр рекрутов между воинскими частями уступ процедуры рекрутского набора. На т-первы ской повинности наногочисленными дворы и борьба е- злоуп с м ниями [7]. Нередко –1730-хгг. наборы проводились 1720 м- с ц плектовать конкретный род войск (напри губерний) [8]. Таким, воплощались образом, не ли вполн в с 1730-хгг. в рмы жизнь указов но -хгг.? 1710 Штат Ивангородского полка условно пм пы: те, кто был принят на службу -егг. до 1 (288);-е игг. 1730 (540). Анализ полученных йм ти а ключению, к з что нных треть Ивангородского вое гарн (33%) находилась на военной -ти лет. службе Половина не жила в Выборге -хгг. с Эту 1710 часть служащих, она димо рассматривать в качестве , юные «ядра» рекруты п состав ляли основную долю полковых служащ (14%) среди служащих Ивангородского по 20 лет. 434 человека (35%) находились дставители двух названных возрастных ину г служе бных мест в воинской части (605 или Таким образом, исследование возраста жбу военных показало большое число люд а р мию1730-е в гг. В целом при анализе имеющи приме р четкого следования государственно -хгг. относительно комплектования гарнизонны Обобщение информации о местаха-прожи числения армию в показало, что большая часть из ух дв северных губерний России: Новгор (836 человек или 67% служащих).нОбщая ных в других 12 российских губерниях, Двое служащих были меня иноземцами. нет данных дении У о про 21 человека (2%). 79
Безусловно, эти цифры не случайны. О политику. Имперская администрация счи земляков на службу в один и тот же по комплектования полков ийскийотметил историк XX века росс начал А. А. Керсновский [9]. Изучение г. подтвердило материало авильность его заключения. Малое число иноземцев, находившихся всей видимости, объясняется стратегиче ыборг а на границе со Швецией. В целом оп странных подданных среди командного ес обычным для российской -хгг. Так, армии по 1730 наблюден ователя В. Дмитриева А. -среди иобер -офицеров штаб сибирских изонных полков численность иностранцев – 1740-хгг. оставалась значительной. Иноземцы сос офице рского корпуса в сибирских гарнизонн О запрещении службы иноземцев в п висториог рафии было отмечено лишь однажды, юционного историка Н. Мрочека -Дроздовского П. [11]. ь- Полу таты в ходе моего исследования аподтвер лась ограничить доступ выходцев зо низ ино ные полки, расквартированные во стях. новозав Ɂɚɤɥɸɱɟɧɢɟ . В заключение подчеркну, с- что следование на уровне имен дает гвозможн нуть устоявшиеся исторические такой концепци работы историк неизбежно сталкивается ос пробл бенно в тех случаях, когда изучается рб мации. Создание баз данных является не современного историка, собойставящего задачу рисследо перед сонального состава нескольких не одной, воинских а част длительный промежуток времени. Ʌɢɬɟɪɚɬɭɪɚ 1. Рабинович М. Д. Социальное происхождение положение офицеров регулярной йны армии / Росси в в период реформ Петра 133–171. I. М., 1973. С. 2. Калашников Г. В. Офицерский корпус – 45 гг. русско Автореферат на соискание ученой иальность степен 07.00.02 –Отечественная история. с. СПб., 1999. 3. Дмитриев А. В. Состав и структура лполевы ков русской Сибири армии середины XVIII в века.-е(1740 гг.). // Ве Новосибирского Государственного оУнивер логия. 2010. 9(1): Новосибирск История. . С. 85– 92. 4. Смотровые боргского списки Вы гарнизона е- Иван хотного полка, Ф1735 . 490. Оп . 1.г. Д. 54. 177 //л . РГВИА. 80
5. Именные списки личного состава ипех зонных полков г. со за сведениями 1717 о службе оф 412. Оп. 1. Д. 43. 261 л. 6. ПС З РИ. I. Собр. V. Т. СПб., 3000. 1830. С. № 201.; № 3443. – 748. С. 745 7. ПСЗ РИ.I.Собр. VIII. Т. СПб., 1830.–742; № 6010. ПСЗ С РИ. Собр. I. IX. Т. СПб.,6490. 1830. –218. С. № 216 8. ПСЗ РИ.I. Собр. IX. Т. СПб.,6830. 1830. – 595. С. № 594 9. Керсновс кий А. А. История русской 1: От армии. Нарвы адо Т рижа – 1814 1700 гг. М., – 1992. 63. С. 62 10. Дмитриев А. В. Иностранные офицеры на сл гарнизонных войсках на территории в.) // Aus Сиб Sibirien – 2009. Тюмень, 50– 52. 2009. С. 11. Мрочек -Дроздовский П. Н. Областное управление века.1: Вып. Областное управление уберний эпохи пер (1708– 1719 гг.). М., 1876. С. 208. Приложение 1 81
РОССИЙСКИЙ ДИСКУРС ДОСТОВЕРНОСТИ И СОЦИАЛЬНО-ПОЛИТИЧЕСКИЕ ТРАНСФОРМАЦИИ СЕТЕВОГО ПРОСТРАНСТВА О. О. Реут Петрозаводск Втечение последних двадцати лет дискурс достоверности как сов окупность текстов, создаваемых для коммуникации всфере общественно гуманитарных исследований, направленных на уточнение пределов нес омненной верно сти приводимых исторических сведений, претерпел эвол юционные изменения. В значительной степени они были предопределен трансформацией российского социально -политического пространства. В контексте коммуникативной парадигмы исторического знания дискурс досто верности позволяет соотнести концепты истинности иложности посредством выявления таких качеств информации, как верифицируемос непротиворечивость, актуальность, доступность иполнота. В свою оч ередь, сущностное уточнение пределов несомненной верности ис торич еских сведений выстраивается втрёх взаимосвязанных измерениях. Во -первых, изменяются функции общественно -гуманитарных иссл едований. Только информационная итолько ценностная функции допо лняются коммуникативной. Наблюдается последовательный переход от односторонней кдвухсторонней модели взаимодействия. Своеобразное пересечение коммуникативной иценностной функций способствует форм ированию сложно организуемых каналов социального участия. Хотя, к онечно, собственно интерактивность важна для диалога, преж де всего, на границе иза пределами профессионального исторического сословия. При этом проблематизирование исторического знания не оказывается неизменным инеподверженным внутренней динамике. В начале девян остых годов XX века стала предельно востребованной история факта. Предполагалось, что функции профессиональных исследований могут и даже должны редуцироваться до выявления идонесения публике набора достоверных сведений. Состороны потр е бителей исторического знания сформировался устойчивый запрос на обяза нность науки отождествлять собеспечением доказательств иобоснований, предоставлением аутенти чной ивалидной информации. Достоверность оценивалась по степени фа ктического отсутствия привносимого исследователем субъективизма. Получалось, что только некие идеальные подлинность иправильность могут суммарно формировать достоверность, асобственно продукт историч еских исследований, таким образом, не должен вызывать сомнений. Указанный запрос на предоставление исключительно фактологич еского материала, пожалуй , во многом может быть объяснён желанием россиян по возмо жности быстрее преодолеть ценностно -идеологическо прочтение истории, которое доэтого прививалось напротяжении не82
скольких поколений. Социально -политический режим предписывал ск орее не созидание нов ых реалий ине критическое переосмысление истор ических обстоятельств, аустранение последствий авторитарного отнош ения ксфере общественно -гуманитарных взаимодействий. Со временем, однако, стала складываться ситуация, при которой под уже почти полностью ис тончающимся слоем практически единственно возможного во с приятия исторического знания всё яснее стала проступать готовность кренессансу естественных ограничений кажущегося беск онечным фактологического потока. Востребованной оказывалась история мнений. Важн ость собственно факта уступила место доступности его а вторской трактовки. Искусственное создание идеологических систем пре дставлялось уже невозможным, но всё отчётливее стала пр оявляться опора на традиционные институты исоциально -политическую пассивность ро ссиян, осваивающих исторический материал и(ре -)транслирующих ист орические интерпретации. Сформировавшаяся демобилизационная стратегия, «режим разобщ ения», как ивцелом состояние деполитизации, способствовали не только исключению реального плюрализма, в ытеснению на дискурсивную пер иферию разнообразия социальных интересов, но иподавлению подлинной политической субъектности россиян. Повышенный интерес кнационал ьной истории явился естественным следствием усиления аскриптивной идентификации. Именно втаких условиях фиксируется спрос на автор итетное мнение, которое почти автоматически наделяется качествами по длинности, верности инадёжности. Однако принципиально важным вэтом процессе выступает то, что носителями указанных мнений вовсе не обяз ательно выступа ютпредставители профессионального сообщества истор иков. В сторону понижения изменились требования кэкспертно -академи ческой статусности интерпретаторов, претендующих на агрегир ование и артикуляцию исторического знания. Во -вторых, трансформируются функции профессионального истор ика. Онне только утрачивает своеобразную монополию на историческое знание, но илишается положения единственного поставщика историч еской информации. Поставка этой информации осуществляется не историками (непрофессионалами) –автора мипублицистических текстов по локальной истории, фиксаторами феноменов устной истории, владел ьцами личных архивов, краеведами, готовыми «делиться контентом», популяризаторами актуальных изысканий всфере массового историческог сознания, изобретателями тр адиций. Одним словом, рядовыми иодновр еменно увлечёнными Интернет -пользователями, претендующими на ук азанное выше «равенство мнений». В такой ситуации, содной стороны, историческая информация пр евращается водин из элементов новой, дигитально организован ной меди йной культуры, что, без сомнений, способствует качественным изменениям вспособах репрезентации итрансляции исторического знания. Медиатиз а83
ция отвечает ожиданиям аудитории от описания, например, национал ь но ориентированных особенностей историческо го опыта, проявляющихся посредством межпоколенной трансляции норм иценностей. Достове р ность замещается имитационными формами, простотой иоднородностью, что д елает её чувствительно пластичной, податливой для внешнего во з действия. Сдругой стороны, достове рность объективно перестаёт быть дост оинством профессионального историка. Получается, что он уже не должен выявлять идоносить достоверные факты, не обязан внепременном поря дке обладать собственным мнением об этих фактах иквалифицирован его формулирова ть. В этом смысле, осознавая, что источники остаются единственным тестом на его профессиональную идентичность, историк должен не сообщать, аговорить. Описание, систематизация иобъяснение исторического движения посредством системы понятий, идей итеорий с пособствуют, но не обеспечивают полноту достоверного представлени об историческом прошлом. В-третьих, изменяется ценность достоверности. Отрицается приор итет понятия «достоверность» над прочими, что вопределённый момент создаёт условия для расширения мин имального набора правил, регул ирующих приращение исторического знания. Пределы несомненной верн ости приводимых исторических сведений оказываются постоянно уточня емыми и, значит, дискурсивными. Этот дискурс изначально выстраивается сориентацией не на объек ты «высказывания», ана определение границ ипределов того, очём можно и следует говорить. Социально -политическая апатия нулевых годов взнач ительной мере увеличила готовность массовой аудитории квосприятию исторических сведений, испытывающих обременение имитационной дост оверностью. Непрофессионалам оказалось легче идаже соблазнительн отрешиться от рационального потребления ставших доступными истор ических знаний иих критического переосмысления. В значительной мере способствовал этому иотказ от преодо ления отчуждённости инедоверия ктак называемой официальной истории. Процесс достижения (максимальной) достоверности организуется через де - иреконструкцию коммуникации висторических исследованиях Принципиальным здесь выступает лишь вопрос отом, какой текст являе тся значимым, какой текст удовлетворяет условиям указанной коммуник ации. При этом коммуникация априорно стремится косознанию истинн ости того, что снеобходимостью вытекает из законов познания инаучно обоснованной совокупности точных иполных фактов. 84
НЕКОТОРЫЕ ОСОБЕННОСТИ СОЗДАНИЯ РАЗМЕЧЕННЫХ КОРПУСОВ ТЕКСТОВ В УСТАРЕВШЕЙ ГРАФИКЕ И ОРФОГРАФИИ А. А. Рогов, А. В. Седов, М. Ю. Некрасов, А. А. Котов Петрозаводск Внастоящее время на смену таким традиционным методам получения языковых данных, как интроспекция, сбор текстового материала, экспер имент, опрос, приходит корпусный метод. Создание лингвистических ко рпусов текстов осознается исследователями как одна из актуальных задач современного языкознания. Корпусы активно используются впрактике состав ления словарей, впроведении разнообразных исследований языка. Отечественная лингвистика несколько отстает вэтом отношении. Однако в последнее время появилось немало интересных проектов такого рода, с амый масштабный из них –Национальный корпус русск о го я зыка. ɉɪɨɝɪɚɦɦɧɵɣ ɤɨɦɩɥɟɤɫ ©ɋɆȺɅɌª В Петрозаводском государственном университете работы по комп ьютерной обработке текстов ведутся с1995 года. Ихрезультатом явилась разработка программного комплекса «Статистические методы анализа л итературных текстов» (ПК «СМАЛТ»), имеющего всвоей основе базу да нных, состоящую из публицистических статей разной тематической направленности из петербургских журналов XIX века «Время», «Эпоха», «Современник», «Гражданин» «Светоч», «Молва», «Библиотека для чт ения», «Заря» вори гинальной орфографии. Проект был поддержан грант амиРГНФ № 02-04-12015в, 05-04-12418в, 08-04-12105в (руководител А. А. Рогов). Адрес вИнтернете : http://smalt.karelia.ru. ПК«СМАЛТ» предоставляет несколько систем д оступа кединой б а зе данных, хранящей синтаксические иморфологические разборы литерату рных произведений. Онсостоит из базы данных, системы подготовки да нных, системы контроля знаний учащихся, системы доступа кБДиэкспер тной системы по выявлению скрытых количественных характеристик. Для хранения базы данных используется СУБД Interbase 6.0. Вкачестве исхо дного источника данных для клиентского приложения используется текст овый файл вкодировке Unicode, что позволяет избежать проблем, связанных сиспользов анием вотдельных текстах символов, специфичных как для о тдельных языков, так идля орфографии разных периодов одного языка. Обработка каждого текста вБДпредполагает три стадии: преформ атирование, грамматический анализ, синтаксический анализ. На этапе пр еформатирования выполняется автоматизированное разбиение исходного текста на единицы, среди которых выделяются часть (или раздел), абзац, предложение, слово. Полученное разбиение может быть откорректиров ано вручную. Важнейшим модулем ПК«СМАЛТ» является мо рфологич е- 85
ски размеченный корпус текстов русской публицистики второй половины XIX века как самосто я тельный продукт. ɋɨɫɬɚɜ ɢɨɫɨɛɟɧɧɨɫɬɢ ɦɨɪɮɨɥɨɝɢɱɟɫɤɨɝɨ ɤɨɪɩɭɫɚ Большинство современных русскоязычных корпусов ориентированы на язык XX– XXI веков, тексты предш ествующих периодов, всилу тру дности их автоматической обработки, включаются вкорпусы реже. Данный корпус является историческим, поскольку сформирован из оригинальных текстов русской публицистики 60– 70-хгодов XIX века. Публицистические тексты обязательно включаются всостав совр еменных лингвистических корпусов: именно впублицистике всилу ее определенной жанровой свободы итесной связи ссоциально -культурной, политической иэкономической жизнью социума полнее иярче отражаю тся разнообразные языковые изме нения, прослеживаются формирующиеся тенденции развития языка. Насколько нам известно, публицистическ тексты эпохи второй половины XIX века до сих пор специально не пр ивлекались вкачестве особого объекта корпусной презентации. В корпусе принципиально сох ранены исконная графика текстов, и особенности дореформенной орфографии, как известно, неустойчивой отличавшейся орфографической и фономорфологической вариативн остью. В частности вкорпусе сохраняются такие написания, как очень многiе, само -по -себе, до -си хъ -поръ, какъ -будто, другъ -къ -другу необяза нныхъ, студентскiй миръ, взмахнутый, самонов Ѣйшiй, низачто, истинно умные, предстоитъ современем, состар Ѣлась, мущина, выростетъ, ком унистъ, колосальный ипроч. Сохранение этих особенностей вдиахроническом корпус епредста вляется крайне полезным идаже необходимым не только при описании динамики норм правописания, ноипри выявлении некоторых тенденций развития грамматической системы языка XIX века. При этом корпус принципиально адресован самому широкому кругу поль зователей (ли нгвистам, втом числе историкам языка, литературоведам, студентам, пр еподавателям иучащимся средней школы), втом числе итем, кто незнаком сособенностями дореволюционной графики иорфографии. Поэтому ре ализован поиск слов по современной орф ографии, позволяющий отыск ивать, например, полемме «мужчина» все орфографические варианты (мужчина, мущина, мужщина). Словарь, наполнение которого происходит впроцессе разбора, сущ ественно ускоряет проведение морфологического анализа, атакже позвол яет рассматривать разные виды омонимии, возникающие втексте. Форм ирование собственного словаря позволяет вперспективе работать стекст ами на разных языках ɉɪɢɧɰɢɩɵ ɦɨɪɮɨɥɨɝɢɱɟɫɤɨɣ ɪɚɡɦɟɬɤɢ Общеизвестно, что «представление вкорпусе информации оморф ологичес ких формах изначениях (часть речи, род, падеж, вид…) является самостоятельной научной проблемой». Корпус опирается восновном на 86
морфологическую модель, представленную в«Грамматическом словаре русского языка» А. А. Зализняка. Однако специфика корпуса язы ка XIX века, ориентированного на широкого пользователя, такова, что внекот орых случаях требовались особые решения. Для сохранения упорядоченн ости иединообразия разметки, впервую очередь частеречной, последов ательно применялись рекомендации Малого академ ического словаря и Словаря С. И. Ожегова иН. Ю.Шведовой. Минусы этого решения вполне очевидны для разработчиков, однако принципиальной установкой было обеспечение доступности ипростоты в использовании корпуса, что учитывалось при формировании системы г рамматических параметров. В корпусе использованы два варианта мо рфологической разметки, основанной на системе традиционных морфол огических понятий. Первый вариант разметки опирается на следующий инвентарь частей речи: существительное, прилагательное, числи тельное, местоимение, гл агол, причастие, деепричастие, наречие, предикатив, союз, предлог, модал ьно -дискурсивное слово или частица, междометие, компонент идиомы, а нтропоним. Предоставляется возможность поиска по значениям базовых морф ологических категорий соответствующих частей речи. Второй вариант разметки ориентирован нашкольную традицию, включает дополнительные грамматические параметры: лексико грамматические разряды существительных, прилагательных, числител ьных, местоимений, типы склонения испряжени я. Она предназначена для использования вобразовательных целях, может рассматриваться как параллельный обучающий корпус, подобный тому, что реализован врамках Национального корпуса русского языка. Отличие «лексико -грамматического» и«формально -грамматиче ского разбора» можно пояснить на примере. В словосочетании «первый уч еник», при лексико -грамматическом анализе слово «первый» будет код ировано как прилагательное (в значении «лучший»), апри формально грамматическом разборе как числительное. Формально -грам матический разбор обладает меньшей вариативностью, но именьшей степенью суб ъективности. Заметим, что взаимнооднозначное соответствие между разб орами удалось установить только в90% случаев. Формализовать остальные 10% не удалось. 87
Рис. 1. Грамматический разбор В настоящий момент вбазе данных словаря сморфолого -семанти ческий ра з бором находится более 40 000 лемм из текстов общим объемом более 140 000 словоформ, сформально -грамматическим разб ором –более 26 000 лемм из текстов общим объемом около 100 000 слов оформ. Ɋɚɡɪɚɛɨɬɤɚ ɫɢɧɬɚɤɫɢɱɟɫɤɢ ɚɧɧɨɬɢɪɨɜɚɧɧɨɝɨ ɤɨɪɩɭɫɚ Выбор синтаксического аннотирования является непростой научной проблемой, если учитывать разнообразие подходов исинтаксических те орий. Нанаш взгляд, прежде всего, необходимо сформулировать те баз овые принципы, которыми следует руководствоваться вдальнейшем. Они могут быть различны. Например, водном из немногих корпусов русского языка синтегрированной синтаксической разметкой «ХАНКО» аннотация строится сопорой на базовый принцип доступности . Внем используется общепринятая вшкольной (и отчасти вузовской) практике система опис ания традиционного синтаксиса, врамках которого одно из центральных мест занимает учение очленах предложения , при этом различные аспекты его организации не разграничи ваются. Минусы этого решения, ивпервую очередь нечеткость имножественность характеристик при разметке, пр изнают сами авторы. Всоздаваемом корпусе, воснову синтаксической ра зметки положена идея структурной схемы впонимании Н. Ю.Шведовой и ее последов ателей, впервые отчетливо заявленная в«Грамматике совр еменного русского литературного языка» (1970), позднее наиболее полно отраженная иразвитая в«Русской грамматике» (1980). Содной стороны, это несколько сужает круг потенциальных пользователей, сдруг ой –по88
зволяет объективировать иупорядочить, насколько это возможно, систему разметки. Создание полного списка структурных схем простого предл ожения (в корпусе размечаются предикативные клаузы) –отдельная нау чная проблема, не имеющая пока своего решения. Наданный момент мы можем говорить отом, что внаучном обороте существуют как минимум три списка структурных схем –различные как количественно, так икач ественно: 1) список схем «Русской грамматики»; 2) список «минимальных схем» В. А. Белошапковой; 3) с писок схем Е. Н. Ширяева. Е. Н. Ширяев на основе достаточно убедительного теоретического обоснования знач ительно переработал идополнил исходный список свободных структурных схем «Русской грамматики». Именно он является на сегодняшний день наиболее полным иточным ивзят за основу для дальнейшей переработки. Ее необходимость объясняется двумя причинами: во -первых, использов ание структурных схем для синтаксической разметки вкорпусе имеет свою специфику, во -вторых, объективная ситуация изучения вопроса таков а, что ни один из существующих списков структурных схем нельзя признать окончательно полным. Таким образом, на выходе мыполучили наиболее полный исбалансированный список структурных схем простого предл ожения, используется для синтаксической разметки текс тов. ɋɬɪɭɤɬɭɪɵ ɞɚɧɧɵɯ ɫɢɧɬɚɤɫɢɱɟɫɤɢ ɚɧɧɨɬɢɪɨɜɚɧɧɨɝɨ ɤɨɪɩɭɫɚ Воснове системы лежит база данных, вкоторой хранится информ а ция осинтаксических разборах текстов. Следовательно, первоначальной зад ачей была разработка структур данных для хранения информации оразборе текста. Врамках нашей системы текст разбивается на структурные един ицы: главы, абзацы, предложения иклаузы. Заметим, однако, что одна кла уза врамках предложения может быть разбита на несколько частей. Для осуществления этого мырешили разделят ьпонятия клаузы ичасти пре дложения. Приняв во внимание все написанное, структура текста унас пр иобретает следующий вид: текст разбивается на главы, главы –на абзацы, абзацы –на предложения, предложения на клаузы, клаузы состоят из ча стей. Стоит отмети ть также, что одна часть предложения может принадл ежать нескольким клаузам. Сточки зрения филологов это возможно, когда предложение содержит несколько однородных сказуемых, потому, что с ами схемы, прежде всего, различаются именно по структуре сказуемых, в х одящих впредложение. Каждая из 38 синтаксических схем кодируется чи слом от 1 до 38, поэтому при разборе каждой клаузе ставится всоответстви номер соответствующей схемы. Также надо отметить, что для клауз треб уется хранение номера части, скоторой эта к лауза начин а ется. ɉɨɞɚɱɚ ɦɚɬɟɪɢɚɥɚ ɢɫɢɫɬɟɦɵ ɩɨɢɫɤɚ Реализация модулей доступа кБДсистемы производится сиспольз ованием языка PHP. Для обеспечения поддержки символов дореформенн ого алфавита все тексты произведений, словоформы хранятся вкодировке Юникод. Для отображения используется шрифт Palatino Linotype. 89
Рис.2. Предоставление информации из корпуса Для удобства работы иполноты информации корпус реализован в виде словаря салфавитной системой построения. Реализовано несколько систем поиска по разли чным критериям: 1) по словам встарой орфогр афии; 2) по словам всовременной орфографии; 3) по грамматическим пр изнакам (с возможностью сохранения заданных параметров); 4) по синта ксическим признакам; 5) смешанный поиск по синтаксическим играмм атическим признакам. Кроме того, возможен поиск через Сводный список текстоформ: 1) Алфавитный, 2) Алфавитно -частотный (с указанием частности поуб ывающей). При использовании любого поиска пользователь получает информ ацию вследующей последовательности: 1) морфологи ческий разбор (или множество морфологических разборов); 2) сведения об авторе ипроизв едении, сведения оконтексте сточностью до номера главы, параграфа и предложения; 3) контекст впределах предложения; 4) расширенный ко нтекст –полный оригинальный текст . Ɂɚɤɥɸɱɟɧɢɟ Полученный врезультате выполнения проекта синтаксически разм еченный корпус может быть использован при научных изысканиях вобла сти истории, грамматики, лексикографии, атакже при изучении соответс твующих курсов студентами филологических специ альностей. Кроме того, он может быть востребован специалистами по литературе XIX века. 90
Необходимо обратить внимание, что создаваемая информационна система универсальна по отношению кязыку текста итипу разметки. При помощи данной системы пользователь смо жет самостоятельно определять элементы текста иформировать список атрибутов для этих элементов. Для введенных атрибутов можно указать структурные связи. При желании можно создавать собственные правила для парсера текста при помощи определенного метаязыка (язык регулярных выражений, набор правил), а также осуществлять поиск вхождений текстов, частей текстов. После обработки размеченный текст можно представить ввиде графа. Ʌɢɬɟɪɚɬɭɪɚ 1. Рогов А.А., Гурин Г.Б., Котов А.А., Сидоров Ю.В. Морфологич ески ра з меченн ыйкорпус по русской публицистике второй половины XIX века. // Проблемы компьютерной лингвистики: сборник научных трудов/ под ред. А.А. Кретова. –Вып. 3. –Воронеж: Издательско -полиграфи ческий центр Воронежского государственного ун иверситета, 2008. С. 209– 219 –на рус. яз. 2. Рогов А.А., Гурин Г.Б., Котов А.А. Некоторые особенности гра мматически размеченного корпуса по русской публицистике второй пол овины XIX века. // Труды международной конференции «Корпусная ли нгвистика –2008». –СПб.: С. – Петербургский го с. университет, факультет филологии иискусств, 2008. С. 326– 333. –на рус. яз. 3. Рогов А.А., Гурин Г.Б., Котов А.А., Сидоров Ю.В., Суровцева Т.Г. Программный комплекс «СМАЛТ». // Электронные библиотеки: перспе ктивные методы итехнологии, электронные коллекц ии: Труды 10 Всеро ссийской научной ко нференции «RCDL -2008» (Дубна, Россия 7–11 октября 2008г.). –Дубна: ОИЯИ, 2008. С. 155– 160. –на рус. яз. 4. Некрасов М.Ю., Седов А.В. Особенности создания корпуса те кстов ссинтаксической разметкой // Труды XL международн ой научной конференции аспирантов истудентов. –СПб.: С. –Петербургский гос. ун иверситет, факультет прикладной математики – процессов управления, 2009. С. 485– 490. –на рус. яз. 5. Рогов А.А., Гурин Г.Б., Котов А.А., Сидоров Ю.В., Седов А.В., Некрасов М.Ю. Не которые особенности формирования электронного ко рпуса тестов ссинтаксической разметкой // Электронные библиотеки: пе рспективные методы итехнологии, электронные коллекции: Труды XI Вс ероссийской научной конференции «RCDL -2009» (Петрозаводск, Россия 17– 21 сентября 2009г.). –Петрозаводск: КарНЦ РАН, 2009. С. 276– 283. – на рус. яз. 6. Рогов А.А., Гурин Г.Б., Котов А.А. Синтаксическая разметка в корпусе текстов по русской публицистике XIX века «СМАЛТ». / Пробл емыкомпьютерной лингвистики: Сборник научных трудов/ под ред. А.А. Кретова. –Вып. 4. –Воронеж: Издательско -полиграфический комплекс АНО «Институт ИТ ОУР», 2010. С. 263– 271. –на рус. яз. 91
АВТОМАТИЗИРОВАННАЯ СИСТЕМА РАСПОЗНАВАНИЯ РУКОПИСНЫХ ИСТОРИЧЕСКИХ ДОКУМЕНТОВ А. А. Рогов, А. В. Скабин Петрозаводск Внастоящее время вархивах России имеется большой объем нера сшифрованных стенографических документов. Причина –невозможност дешифровки исторических документов современными стенографистам В течение XIX иначала XX веков стенография вРоссии находилась в процессе становления, поэтому существующие документы зашифрованы в разных системах, ктому же современная стенография существенно отл ичается от исторических систем стенографии XIX века. Основные сложн ости дешифровки стенограмм заключаются вследующем :  отсут ствие людей , обладающих знаниями осистемах стенограф ической записи вXIX –начале XX вв. Существуют только старые учебн ики;  стенографист при шифровании мог использовать свои неста ндартные символы (обозначения), так как зачастую расшифровкой зан имался он с ам;  встенографической записи распространены: метод пропуска гла сных букв или замена часто встречающихся сочетаний символов, слов одним символом;  некоторые символы стенографической записи имеют схожее написание, но взависимости от некоторых физических пар аметров, напр имер, таких как в ысота, принимают различные значения. Цель нашего исследования заключается всоздании универсально программной системы для автоматизированного распознавания историч еских рукописных текстов, включая исторические стенограммы XIX иначала XX веков. Она призвана решить задачу описания идешифровки исторических стенограмм, атакже ввести внаучных оборот новые докуме нты. Данное исследование поддержано грантом РГНФ № 11-01-12026в (рук. Рогов А.А.) Отличительные свойства разрабатывае мой системы: учет особенн остей исторической орфографии XIX иначала XX веков, учет индивид уальных знаков разных стенографистов, возможность критического анал иза, использование словаря для подсказки при дешифровке текста ит.д. [1]. Информационная система будет находиться воткрытом доступе ипредл агаться киспользованию работниками архивов, научными сотрудниками исследователями -текстологам. Отлаживание системы происходит на ст енограммах А.Г. Сниткиной. Выбор именно этих стенограмм обусловлен тем, что часть их был арасшифрован а , но расшифровка произведена не полностью, спропусками слов, словосочетаний, атакже, возможно, снеправильным употреблением значения расшифровки символов. Распознавание текста обычно включает всебя следующие этапы: 92
 предобработка изо бражения –как правило, это бинаризация из ображения;  сегментация –выделение на предобработанном изображении те кстовых областей –символов, сочетани йсимволов, слов , строк ;  анализ полученных сегментов –установление значений пр изнаков, сра в нение сэталонам и, находящимися вбазе знаний;  расшифровка –выбор наиболее подходящих словоформ из слов аря соо т ветстви й, связанного сопределенной моделью языка. Сложности при распознавании текста создают искривления строк, перепады яркости, просвечивания текста собратн ой стороны идругие дефекты оригинала иизображения. Распознавание рукописного текста со здает дополнительные сложности вотличие от распозн а вания печатного текста [2]. Врамках исследования решается задача создания достаточно униве рсальной программной сис темы для автоматизированного распознавани исторических стенограмм, для которых автоматическое распознавани оказывается пока невозможным. Предлагаемая система автоматизирова нной дешифровки исторических стенограмм свозможностью интеллект уальной поддержки принятия решений при наборе позволит существенно ускорить процесс перевода рукописного текста втекстовый файл ипов ысит точность его дешифровки. Разрабатываемая программная система будет обладать следующими особе нностями [1]:  при автоматизации набора испо льзуется виртуальная клавиатура оригинальных символов различного размера;  виртуальная клавиатура представляет собой таблицу соотве т ствия ориг инальных графем буквосочетаниям,  множество графем формируется методом сегментации на основе анализа текста;  система автоматически контролирует состояние набора ивинт ерактивном реж име выдает информацию пользователю;  система возвращает пользователю варианты набора словоформ, упорядоченные по частоте встречаемости вбазе данных, или информацию об отсутствии набра нного с лова вбазе знаний. Ȼɢɧɚɪɢɡɚɰɢɹ ɢɫɬɨɪɢɱɟɫɤɢɯ ɪɭɤɨɩɢɫɧɵɯ ɞɨɤɭɦɟɧɬɨɜ Вследствие старости изображения итого, что стенографические зап иси сделаны простым карандашом на пожелтевшей бумаге, при распознав а нии исторических рукописных документов возникает проблем асбинариз а цией изображения. Пороговый метод по цветовым компонентам (RBG) ок а зался не приемлемым для данной задачи, так как пиксели фона исимволов имеют схожие значения цветовых компонент. Как видно на гистограммах (рисунок 1-а), отсутствие двух явно вы раженных пиков не позволяет выбрать порог овое значение для бинаризации. Такие же результаты получ а ются (рисунок 193
б), если использовать разложение по цветовой схеме HSB (оттенок, нас ыщенность, яркость). Производя бинаризацию только по пороговому знач ению я ркости, мысмогли получить четкие символы, смалым количеством шума. При этом была решена задача нахождения оптимальн о го порогового значения яркости, при которой символы получаются наиб о лее четкими, с наименьшим количеством шума. Экспериментальным путем, б ыло выявл ено, что наилучший результат достигается, если процент черных пикселей после бинаризации прибл ижается к13% от общего числа пикселей. Рис 1. Гистограммы цветовых схем RGB иHSB Ɇɨɞɭɥɶ ɫɨɡɞɚɧɢɹ ɨɪɢɝɢɧɚɥɶɧɨɣ ɝɪɚɮɢɤɢ ɫɢɦɜɨɥɨɜ Система разбита на нес колько модулей. Один из них  это модуль создания оригинальной графики символов. На рисунке 2 представлен интерфейс модуля. Основное окно программы представляет собой две области. В левой области находится оригинальное изображение (оригинальная стеногра мма ), на которой пользователь выделяет необходимый символ. Место выдел е ния отображается на второй области. В этой области находится обработа нная стенограмма, т. е. все полученные ранее символы, находящиеся вме с тах, соответствующих символам воригинальном изо браж е нии. После выделения символа пользователь должен нажать на «горячую клавишу» или их сочетание. Далее система производит бинаризацию в ыделенного фрагмента иего сегментацию. Система предлагает пользоват елювыбрать сегмент или сегменты, соответствующие оригинальному си мволу. Если было выбрано несколько сегментов, то система производит связывание раз орванных «кусков». В случае, когда результат устраивает пользователя, символ записывается вбазу знаний ирасполагается впр авой области соответственно месту (координатам) на оригинальном из ображении. Если результат не соответствует требованию пользователя, то предусмотрена возможность редактирования полученного символа при помощи упрощенного графического редактора. 94
Рис 2. «Интерфейс модуля создания оригин альной графики символов» Создание оригинальной графики затруднено следующим:  оригинальное изображение –довольно старое, написаное пр о стым карандашом на пожелтевшей бумаге, которая имеет перегибы, различные повреждения, надрывы. Нанекоторых стенограммах присутствуют ст оронние записи, не несущие смысловую нагрузку, либо прочерчены линии , пе ресекающиеся ссимволами;  при бинаризации происходят разрывы символов, т. к. некоторые пиксели символа имеют схожий цвет спикселями бумаги;  при сегментации возникает нео бходимость разбиения символов, написа нных слитно, на отдельные символы. ɉɪɨɬɨɬɢɩ ɚɜɬɨɦɚɬɢɡɢɪɨɜɚɧɧɨɣ ɫɢɫɬɟɦɵ ɪɚɫɩɨɡɧɚɜɚɧɢɹ ɪɭɤɨɩɢ ɫ ɧɵɯ ɢɫ ɬɨɪɢɱɟɫɤɢɯ ɞɨɤɭɦɟɧɬɨɜ Нарисунке 3 представлен интерфейс прототипа автоматизирова системы распознавания рукописных ис торических документов. Как видно на этом рисунке система имеет четыре области, втом числе область сориг инальным изображением, область виртуальной клавиатуры соригинально графикой символов, которые были получены с помощью модул я , описа нного ранее. При нажатии на кнопку виртуальной клавиатуры, изображение си мвола располагается вобласти 3, втом же месте, где он инаходится на ор игинальной стенограмме. Вчетвертой области отображаются дешифрова н95
ные символы. Также система впроцессе набора слова анализиру ет его с оставные части ипредлагает пользователю близкие по значению расши фровки из базы знаний. Система, анализируя исходное изображение при вводе символов, производит автоматическое дешифрование схожих си мволов или групп си мволов. Рис 3. «Интерфейс пр ототипа автоматизированной системы распознавани рук описных исторических документов» Предлагаемая система обладает следующими характеристиками  виртуальная клавиатура и«горячи еклавиш и»для ускорения набора ист орической стенограммы;  связь графического из ображения стенограммы иего текстового предста в ления;  интеллектуализированный набор;  возможность автоматического распознавания втексте схожих с очетаний символов, слов;  возможность совместной работы нескольких пользователей содним сл оварем. Вдальнейшем планируется реализация системы распознавания рук описных исторических документов ввиде Web-сервиса, для организации распр е деленной, удаленной работы со стенограммами. 96
Ʌɢɬɟɪɚɬɭɪɚ 1. Рогов А.А., Талбонен А.Н., Варфоломеев А.Г. Автоматизирова нная система распоз навания рукописных исторических документов // Эле ктронные библиотеки: перспективные методы итехнологии, электронные коллекции: Труды XII Всероссийской научной конференции RCDL’2010 (Казань, Россия, 13– 17 октября 2010 г.). –Казань: Казан. ун -тРАН, 2010. – С. 469–475. 2. Горский Н., Анисимов В., Горская Л. Распознавание рукописного текста: от теории кпракт ике. –СПб.: Политехника, 1997 г. МАССОВАЯ АУДИТОРИЯ И ПРОФЕССИОНАЛЬНОЕ ИСТОРИЧЕСКОЕ СООБЩЕСТВО: ОСОБЕННОСТИ СЕТЕВОЙ КОММУНИКАЦИИ Д. А. Смирнов Иваново Значительные объемы информации, которые благодаря Интернет у стали доступны интересующимся историей пользователям, парадоксал ьным образом могут дать обратный эффект ине способствовать формиров анию достоверного образа исторических событий. При этом вопрос нестоит именно ополной информации особытиях прошлого, что, как показало ра звитие исторической науки, является практически недостижимой целью. Проблема заключается вобретении интересующимися историей пользов ателями неких контуров прошлого, позволяющих имуверенно чувствовать себя всовременном мире инаходить причину определенного развития я влений вближайшем будущем или встратегической перспект иве. Однозначно можно сказать, что значительные объемы неструктур ированной информации искажают образ прошлого, дезориентируют, со здают безграничное пространство так называемого «информационно шума». Связано это прежде всего сдвумя обстоятельствами: 1) отсутствие системного восприятия у большинства потребителей исторической информации; 2) столкновение большинства потребителей собразами ист орических событий, которые намеренно искажены сцелью формирования определенных картин прошлого. Это может быть прежде всего задача политизации информации сприменен ием пропаганды всети. Первое обстоятельство не позволяет польз ователям отбирать иан ализировать информацию, полученную через Интернет , использу яопред еленные методы, к оторые обычно применяют историки -профессионалы Интересующиеся историей стремятся самостоятельно разобраться вмн огообразии фактов, которые на собраны различных специализованных са йтах или могут быть собраны спомощью специальных поисковых си с тем, а также каталогов , ичерез обращение кспециализирова нным базам данных. 97
Существование таких средств получения информации действиетел ь но полезно, но без знания определенной метолодологии для ее анализа или без знания методологии отбора документов, размещенных на сайтах или вб азах данных, формируемый образ исторических событий будет ис кажен Знакомясь созначительными объемами неструктурированн информации, пол ьзователи приходят квыводу, что вистории было «во зможно все», иготовы воспринимать любые интерпретации такой инфо рмации на непрофессиональной или пседопрофессиональной основе. Пр имер этого представляет собой подача сообщения агентства «Интерфакс» [1] се тевым ресурсом «Взгляд» встатье «США признали суверенитет Японии над Курилами» [2]. Встатье , вотличи еот комментария агентства , ни разу не сказано, что речь идет оЮжных Курильских островах , инам еренно акцентируется внимание на стремление поддержать Яп онию всп оре за Курильские острова, слоно речь идет обо всех островах архипелага. В приводимой здесь жецитате из комментария Максима Минаева [3] внимание сконцентрировано на том же , исовершенно нереалистическ сценарий , прописываемый имвсвете ответног опризнания суверенитета России над Гавайскими островами , переводит иразвитие переговоров по проблеме Курил намеренно внереалистическое русло. Для не знакомого с сущностью проблемы пользователя такие размышления представляютс вполне научными иобоснован ными. Этот пример позволяет проиллюстрировать другое обстоятельств которое может определять формирование искаженного образа прошлого. Это цели испол ь зования определенного набора исторических фактов для формирования конкре т ного образа прошлого спропаган дистской целью, с задачей нав я зывания именно конкретного искаженного образа прошлого. Факты выстраиваются вопределенной последовательности, при этом обращается внимание на определенный комплекс фактов или приводятся откровенно лживая информация. Подача эт ой информации может сопров ождаться иразличного рода комментариями, исходящими от лиц, пре дставленных профессиональными экспертами. Продвижение искаженных образов прошлого, основанных на недо стоверной или неполной информации , обусловлено тем, что именно вфо рмирование этих образов вкладываются значительные финансовые ресу рсы. Они «продвигаются». Обладатели этих ресурсов заинтерсованы име нно втаких образах. Поэтому проблема утверждения ипродвижения име нно научного взгляда на исторически есобытия связана ссозданием усл овий именно для академических структур, образовательных учреждений или конкретных научных проектов. Необходимо продвигать всеть именно мотив непредвзятого интереса кнауке, независимость научных исслед ований от источников финансирования. С пропагандистскими целями, ноформируя искаженные образы прошлого, сетевые возможности эффективно используют прокремлевски молодежные движения. Интернет позволяет вступать одновременно вог98
ромное количество дискуссий, что называется «забрасывать» тему, пре длагая самые нелепые трактовки прошлого, азатем тихо устраняться, позволяя дискуссии , посвященной е нному определ содержанию , течь по св оимзаконам . Как говорится, «осадок остается», апропагандисткая задача выполнена, причем фактически средствами так называ емого «тролли нга». Инициаторами таких дискуссий выступают именно непрофессионал ьные сточки зрения исторической науки авторы , ипопытки профе с сионалов объяснить имсущество проблемы наталкива ются на грубый, у прощенный взгляд на историю, зачастую сопровожд ающийся игрубостью коппоненту . Однако идля представителей «другой стороны» всетевых дискуссиях, где затрагиваются вопросы истории, вполне распространенным является поверхностное имифологизированное представление опрошлом. Однако обилие исторической информации все жезаставляет пре дпри нимать попытки по структурированию этой информации. Прежде вс его, это касается каталогов, которые посвящены историческим сайтам. Попытку самоорганизоваться испособствать эффективному поиску истор ической информации всет ипредставляет каталог http://www.historylinks.ru . Его авторами признается, что «сайтов не очень много», ипотому «рубр ики каталога затрагивают обширные вр е менные игеографические рамки», как например «История древних народов», но при этом «Вторая мировая война» заслужила ввиду большого интереса кней врунете отдельной ру брики. Заслугой авторов является ипроявление внимания кисторическим блогам, атакже их сообществам. Для отдельных блогеров ведение блогов со временем выходит на определенный профессион альный уровень, что выражается нестолько в размещении вдневниках собственных соображений на ту или иную ист орическую тему, авпубликации прежде всего исторических источников по конкретной тематике. Именно сиспользованием этого круга источников они счит ают возможным, как исобственно профессиональные историки, проведение аналитической работы, результаты которой и публикуют с собственных блогах или сайтах. Примером такой работы систочниками можно считать сайт http://www.oldgazette.ru, авторы которого вид ят его не как «памятник эпохе СССР, не надгробный камень ине эпитафия... Ск орее, это театр. Театр, вкотором постоянно сменяются темы идекорации, сменяются режиссеры иактеры, меняется даже зритель, ибо тогда эти г азеты воспринимались не так, как сейчас. ..» , предназначенный «для тех, кто интересуется историей СССР, историей войны, предвоенного периода ине только; для тех, кто предпочитает первоисточники исследованиям и дайджестам; для тех, кому интересна история журналистики иСМИ, наконец, для тех, кому пр осто все это интересно». Кроме того, историческая информация всети на различных сайтах может на капливаться не только по категории принадлежности кизучению определенной группы источников, но и, что гораздо привычнее идля тр адиционных средств сбора инф ормации, по определенной теме, как напр и99
мер http://www.nazireich.net, позиционирующий себя вкачестве «истор ического Интернет -проекта оТретьем Рейхе инационал -социализме вГе рмании в1933– 1945 годах». Такой системный взгляд проявляется и во внимании кразличного рода средствам отражения истории нацизма. Спретензией на больший профессионализм выстпает http://historic.ru/ ипредлагает наряду со ссылками обширную библиотеку, постоянно обновляемую. Особого внимания как продукт инициативы одного частного лица заслуживает проект «Хронос» (Всемирная история в Интернете ) http://www.hrono.ru/, сущес т вующий с2000 г. Редактор проекта Вячеслав Румянцев, атакже его коллеги являются профессиональными исслед ов ателями, занимающимися изучением различных вопросов прошлого. Насколько необходима профессиональная историческая работа вс ети , показывает существование сайта http://stalinism.ru/, на главной стран ице которого сказано, что его создателю, «как имиллионам моих соотеч ественников надоела ложь оСталине, которая льется со страниц газет ит елеэкранов свремен "перестройки"»: «Я вижу единственный выход просто сказать правду оСталине иего эпохе. Я вообще сторонник того, чтоб ы умышленную фальсификацию истории сделать уголовно наказуемым де янием. Ведь это наносит государству вреда неменьше, чем печатание фальшивых денег. СССР был разрушен во многом благодаря историч еским фальсификациям». Представлнный здесь образ прошлого може тподавить неподготовленного человека обилием своеобразно поданной информации, ноименно разнообразие информации, которая представляет сталинскую эпоху иначе, помогает разобраться, вчем скрыта «умышле нная фальсификация истории» на самом сталинистском са йт е. Однако сталинистский сайт может привлекать значительное вним ание, не пренебрегая фактами ипредлагая системно иной взгляд на пр ивычную последов а тельность событий. На сайте такой «точной науки» , как «всемирн а яхронология» (http://www.chronologia.org) втом числе ипосл едовательность событий предлагается совершенно иная. «Вычисления» Фоменко А.Т. иНосовского Г.В., как они сами пишут на сайте, направл ены на то, чтобы «правильно упорядочить события на временной шкале по имеющейся внашем распоряжении информации», что «естественно вп исывается вобласть приложений современной математической статистики, теории информации» вситуации, когда «методов чисто гуманитарных наук, каковой является история, для решения хронологич еских задач недо статочны». Однако врезультате возникает не столько иная интерпретаци событий, сколько не научный взгляд на прошлое. Вином свете стоит представлять сайт «Лаборатории альтернативно истории» (http://lah.ru/), накотором исследователи делятся опытом прим енения нетрадиционн ыхили малораспространенн ыхметодов работы систочниками или свидами источников, такими радиоуглеродный как метод датирования ископаемых находок идендрохронология. Наряду срезул ьтатами конкре тных исследований на основе этого представлена иобши р100
ная библи отека конспектов исследований известных авторов. Кроме того , на этом сайте, атакже на http://fai.org.ru/forum/, существуют форумы для общения между увлек ающимися альтернативными подходами кизучению прошл ого. Примером инициативы энтузиастов является сайт Алексея Чернова, моско в ского учителя истории иинформатики http://lesson-history.narod.ru/, где ра з мещена е го собственная концепция преподавания истории России и всемирной истории. Материал школьных уроков Чернов представил в презентациях, которые ивыложил на сайте. Необходимость профессионального консалтинга , прежде всего уровне методологии , со стороны ис ториков сиспользованием сетевых коммуникаций для масс , интересующихся историей, должна осознаватьс впервую очередь самими ис ториками. Они не должны ждать обращения к ним за такими консульт а циями. Ихпервоочередная задача заключается в том, чтобы объясни ть важность методологической подготовленност в работе систорическим материалом для интересующихся прошлым всети. В условиях развития сетевых коммуникаций историки должны активно привлекать кподобному объяснени ю именно средства Интернет а. Впр отивном сл учае ниша исторического консультирования будет занята др угими. Вхудшем случае –непрофессионалами, стремящимися сразличн ыминенаучными или околонаучными целями преподнести свой униве рсальный иупрощенный взгляд на прошлое. Ʌɢɬɟɪɚɬɭɪɚ 1. СШАпризнали сувер енитет Японии над Курилами// http://vz.ru /news/2011/2/18/469865.html 2. Вашингтон числит Курилы за Японией// http://interfax.ru/politics/ txt.asp?id=178129&sw=%EA%F3%F0%E8%EB%FB&bd=23&bm=1&by=20 11&ed=23&em=2&ey=2011&secid=0&mp=0&p=1 3. СШАпризнали право Японии на Курилы. Комментирует Максим Мин а ев// http://actualcomment.ru/news/20538.html RECONSTRUCTION OF KARELIAN PARISH NET IN EARLY MODERN TIME: AN EXPERIENCE OF DATABASE FORMATION E. D. Suslova Petrozavodsk Aim. Historiography of the problem. Exploration of the parish structure in Karelia from the middle of the 16-th to the beginning of the 18-th century allows to trace a rather detailed picture of the church life development in the distant northwest part of Novgorod diocese. The problem has not become an object for comprehensive investigation yet. Anyway some of its aspects were touched by historians. In particular, archiman101
drite S. Tikhomirov defined number of churches in Karelian district (yezd) at the beginning of the 16-th century. Based on materials of the scribe book of the 1500 c. the author had set 66 churches, which functioned both in rural parishes and monasteries [1]. Further investigation of the problem has been renewed only two decades ago. Meanwhile soviet historian M. V. Vitov, who analyzed the rural structure of Zaonezhie, had already marked, that the number of churches in villages were much more in 1670-s than in the 1560-s [2]. The idea to use materials of Scribe and Census books for revealing the parish structure was developed by petrozavodsk researcher I. A. Chernyakova. Together with O. V. Chernyakov, I. A. Chernyakova explored three Scribe books (1582/83, 1616– 1619, 1628– 1631) and two Census books (1646, 1678). It gave the historian an opportunity to define the number of churches for seven north-western districts (pogosts) of Zaonezhie in five time slice and to set the period of reconstruction after the Time of Troubles as a period of the most intensive building of churches [3]. Moreover I. A. Chernyakova has revealed and mapped all the churches which were erected along shores of Onego lake in the 17 c. [4; 5; 6] Researchers A. E. Musin and D. A. Balovnev have payed attention to the early period of church parish formation in Zaonezhie pogosts. Proceed from texts of tzar's charters for rural churches, A. E. Musin has recognized the first part of 16-th century as a period of intensive building of rural churches [7]. D. A. Balovnev, who investigated the Scribe book of 1563, had come to the same conclusions [8]. The problem was also touched by petrozavodsk historian A. U. Zhukov. The author has underlined the fact of intensive formation of church parishes in western part of Zaonezhie pogosts from the beginning of 1610-s to the beginning of 1630-s. From his point of view, it was stimulated by the flight of karelians refugees and by actions of scribers who allowed Karelians and Vepsians to bild churches. The reseacher convinces that new churches could be erected without a special tzar's permission. However A. U. Zhukov has not specified whence he has read about such norm. It is necessary to underline that peasants appealed exclusevely to the novgorodian metropolitan, who had right to bless his flock to build churches [9]. Moreover the author asserts that there were 207 church parishes in Olonets district in 1690-th [10]. No doubt that he borrowed the data from the work of vologodian historian A. V. Kamkin. In particular, A. V. Kamkin had given the same information for estimation of the total number of churches which functioned in 14 districts of the Russian North. The author wrote his work in a popular style and made rather common note that he used data from documents of some Diocesan consistories [11]. Tasks. Object. The following tasks must be solved for revealing the formation of karelian parish structure in early modern time. It is needed to set the total number of churches in every existed parish and to estimate when they were built, destroyed and/or reconstructed. Main sources. The sources for the investigation are materials of five Scribe books (1563, 1582/83, 1616—1619, 1628—1631), three Census books 102
(1646, 1678, 1707) and Patrol book of 1597. Descriptions of small districts (pogost or volost) start from the information about local churches. They were accurately structured because scribes used a definite range of criteria. The last one was rather wide for the Scribe books. In particular, it is possible to find out data concerning dedications, architectural shapes of churches, when they were built and even how many icons and other subjects for divine services they had. On the contrary, the structure of church description in Census books are very narrow. They contain only common data about church dedications. Thus historians must use not only mass sources, but attract charters as well. This task obtains a special meaning for the reconstruction of parish net formation in the second half of the 17-th century, because a significant part of description concerning 1678 (scribe Ivan Anichkov) is lost. Territory. The investigation holds in focus territories, which were consolidated by Moscow power into Olonets district in 1648. The area covered lands around the shores of Onego and partly Ladoga Lakes (18 Zaonezhie pogosts), to the north of Onego Lake and to the north-west of the White Sea (7 Laps pogosts). Every scribe commission took into account all lands indicated above. Thus it gives excellent opportunity to compare data in the scale of the whole region in different time slices. Method. To evaluate rather typical mass information the problem-oriented data base was made. The computer program «File Maker» has become the main platform for creating the card form as this program has easy interface and wide capability to develop the data base in any step of investigation. The created card consists of two information layers. The key layer includes three fields for localization of churches — from the largest administrative object to the smallest one. In particular, the fields are intended for the input of following data: stan, pogost and/or vystavka. The number of administrative units with churches were not rather big and extended very slowly in 16—17 centuries, so fields were made as enclosed lists. It allows to organize a rapid system of search. The second layer consists of eight fields according to the number of attracted sources (1563, 1582/83, 1597, 1616—1619, 1628—1631, 1646, 1678, 1707). Each field is intended for input of citations concerning churches which were located in a one definite administrative unit. All fields are organized as boxes which are set one under another. The upper field is intended for input data from the earliest book of 1563 and the low field — for input data from the latest book of 1707. Special fields are created for counting the total number of churches in a unit or in a group of units in every time slice. Thus, the administrative units, where the churches functioned, has been chosen as a main object of counting. Such a choice has some important advantages. A lot of churches had the same dedications, so it is rather difficult to organize search system without localization of churches. Moreover the chosen object correlates with the tasks of investigation which are wider and do not consist in simple counting of churches. In particular, the structure of card allows to present visually the history of each parish — from the time of its formation to 103
the time of its division into several parishes or even trace the ways of parish reorganization. Results. The created data base has provided wide possibility for investigation of mass typical information. Nowadays it consists of 268 cards. Each of them is intended for one administrative unit where church or churches stood. Firstly, it was possible to reveal the total number of churches in the area of Zaonezhie pogosts in six time slices (See: Table 1). Table 1. Churches in Zaonezhie pogosts in early modern time 1563 y. 1582/83 y. 1616—1619 y. 1646 y. 1678 y. 1707 y. Posad / Pogost 31 25 28 34 39 31 Vystavka 29 38 54 69 88 102 Total number 60 63 82 103 127 133 Analyzing of data base gives possibility to trace, that the development of parish structure were rather irregularly than progressively from one decade to another. New parishes formed very intensively three times: in the first half of 16-th century, also in the end of 1610-s to beginning of 1630-s and in the middle of 1650-s to the end of 1690-s. It is necessary to underline, that the parish structure in northwestern districts of Zaonezhie formed in the middle of 1650-s –three decades earlier than in south-eastern districts. From our point of view, devastation of villages during the Time of Troubles and development of economic crisis in the end of 1630-s to the middle of 1640-s suspended the parish net formation. It is interesting to note, that particulaly all pogosts and some old villages had two or three churches in the beginning of 18-th century. It means that administrative units became centres of several parishes notwithstanding that scribes never noted these facts. The possibilities of computer program «File Maker» is wide enough. It allows to improve the card in order to continue investigation of the problem even up to nowadays. References 1. Тихомиров С. Черты церковно -приходского имонастырского быта вписцовой книге Водской пятины 1500 г . (всвязи собщими услови ями жизни ) [Features of every day church life in monasteries and rural parishes according to the Scribe book of Vodskaya pyatina, 1500 y.]. СПб.: Тип ография М. И. Акинфиева, 1905. C. 237, 239, 242—243. 2. Витов, М.В. Историко -географические очерки Заонежья: из ист ории сельских поселений XVI—XVII вв. [Essays on History and Geography of Zaonezhie: from the history of rural settlement in 16—17 centuries] М.: Изд -во МГУ , 1962. С. 101. 104
3. Чернякова И.А., Черняков О.В. Писцовые ипереписные книги XVI—XVII вв. как источник по истории деревянного зодчества Карелии [Scribe and Census books of 16—17 centuries as sources for the history of wooden architecture of Karelia] / Проблемы исследования, реставрации и использования архитектурного наследия Русского Севера: межвузовский сборник. Петрозаводск , 1988. С. 56, 70. [Problems of investigation, restoration and using of architecture heritage of Russian North: interuniversity collection]. 4. Чернякова И.А. Карелия на переломе эпох : очерки социальной и аграрной истории XVII века [Karelia on boundary epochs: essays of social and agrarian history in 17 cenrury] Петр озаводск : Изд -во ПетрГУ , 1998. С. 207, 213. 5. Tcherniakova I.A. Churches and Monasteries on the Shores of Lake Onego, Karelia // Saints of Europe: Studies Towards A Survey of Cults and Culture / Ed. by Graham Jones. Donington: Shaun Tyas, 2003. P. 135—170. 6. Чернякова И.А., Черняков О.В. Алтарные посвящения прихо дских цер к вей как отражение православного менталитета крестьянина карела дониконовской эпохи [Altar Dedications of parish churches as a reflection of Orthodox mentality of a Karelian peasant in Prenikonian epoch] // Православие всудьбе Урала иРоссии: история исовременность: Мат ериалы Всероссийской научно -практической конференции (г. Екатери нбург, 18—20 апреля 2010 г.). Екатеринбург : ИИА УрО РАН , Изд -во Ек атеринбургской епархии , 2010. С. 34—46. [Orthodoxy in the life of Ural and Russia: history and present time: Materials of All-Russian scientific and practical conference] 7. Мусин А.Е. Становление православия вКарелии (XII—XVI вв.): истор ико -археологический аспект [Orthodoxy Formation in Karelia (12— 16 c.) from historical and archeological points of view]/ Международная научная конференция по проблемам изучения, сохранения иактуализации народной культуры Русского Севера «Рябининские чтения'95»: сб. до кладов. Петрозаводск , 1997. С. 260. [International scientific conference on problems of investigation, preservation and actualization of national culture of Russian North «Ryabininskie chteniya'95»: collection of reports] 8. Баловнев Д.А. Приходское духовенство XV — начала XVI в . по новгородским писцовым книгам (численность и особенности состава ) [Parish clergy in 15 — beginning of 16 c. according to novgorodian scribe books (number and peculiarities of structure)] // Отечественная история . 2004. № 4. С. 135—136. 9. Перов И.Ф. Епархиальные учреждения вРусской церкв ивXVI— XVII вв. (историко -канонический очерк ) [Diocesan Institutions in Russian Church in 16—17 c. (canonic historical essay)]. Рязань: Губернская тип ография, 1882. С. 35—36. 105
10. Пулькин М.В., Захарова О.А., Жуков А.Ю. Православие вКар елии (XV — первая треть XX в.) [Orthodoxy in Karelia (15 — first third of 20 c.)]. М.: Кру г лый год , 1999. С. 58, 60—62. 11. Камкин А.В. Православная церковь на Севере России: очерки истории до 1917 года (любителю старины, краеведу, учителю, студенту) [Orthodox Church on Russian North: essays to 1917 y. (for a regional ethnographer, a teacher, a student)] Вологда: Вологодский государстве нный педагогический институт; Институт этнол огии иантропологии РАН, 1992. С. 23—24. СОЗДАНИЕ ПОИСКОВОЙ СИСТЕМЫ, ОСНОВАННОЙ НА ИНФОРМАЦИИ, ИЗВЛЕЧЕННОЙ ИЗ МАШИНОПИСНЫХ ПОДПИСЕЙ К ФОТОГРАФИЯМ В ЦИФРОВОМ АЛЬБОМЕ А. Н. Талбонен Петрозаводск Исходным материалом для данной работы послужила коллекция фотографий строительства Беломорско -Балтийского канала, предоставле нная сотрудниками карельского Государствен ного краеведческого музея [1]. Данная коллекция состоит из большого количества снимков (около 6,5 тыс.) исостоит из нескольких альбомов. Каждый снимок данной коллекции представляет собой цифровое изображение альбомного листа, на котором расположена оригин альная фотография ибумажная полоска снапечатанным текстом (см. рис. 1). Данный текст является описанием фотографии исодержит всебе искомые атрибуты. Рис. 1. Пример 106 изображения коллек
Ксожалению, качество изображений нед остаточно высокое, из -за т ого, они что были сфотографированы сочень низким разрешением (75 точек на дюйм). Оригинальные альбомные листы настолько старые, что буквы те к ста начали постепенно исчезать под воздействием времени. Кроме того, электронные снимки были сделаны вчерно -белой гамме, после чего были сохранены вформате JPEG, также подразумевающим потерю информ а ции. Основной целью данной работы является разработка информацио нной системы для навигации по данной коллекции свозможностью поиска по различны матрибутам, таким как дата, место, субъект, объект, действие идругие. Для достижения поставленной цели были определены следующие з адачи:  Извлечь текстовую информацию сизображений коллекции смин имальными потерями информации, т.е. сминимальным количес т в ом ошибок.  Составить на основе извлеченной информации поисковой индекс.  Разработать методы повышения точности поискового инде к са.  Реализовать систему поиска по данному индексу. Процесс решения первой задачи сопровождался рядом трудностей, которые пришлось преодолевать . Качество изображений не позволяло извлечь текстовую информацию прямым распознаванием спомощью OCR (системы оптического . распознавания Так, например, при пе рсим вой же попытке обработать фотографии системой распознавания обнар ужилось, что OCR находит ипытается распознать элементы изображения, принимаемые за текст. Требовалось применение специальных методов повышения качества изображений. Результат распознавания даже после применени яметодов повыш е ния качества содержал определенный проце нт ошибок, которые требов а лось устранить. С учетом вышеперечисленных трудностей было решено применить различные методы, повышающие качество распознавания :  Извлечение областей изображения, которые содержали текст по дписи эвристич е ским методом.  Применение ра зличных методов фильтрации изображения, пов ышающи хрезкость.  Применение данных методов параллельно споследующим сра внением качества полученных результатов ивыбором наиболее качестве нных результ а тов.  Применение текстового анализа на основе словарей для в ыявления иис правления ошибок. Перечислим основные методы, которые были использованы впр оцессе извлечения текстовой информации. Выделение области изображения, содержащей подпись, осуществл яется спомощью эвристического алгоритма, основанного на определенны х выявленных закономерностях. Например, восновном, подпись располаг а107
ется строго вдоль одной из сторон изображения, прилегая ккраю, афон самой подписи является монотонным иконтрастирует сцветом текста и фотографией (см. ример п на рис .1). Предварительна яобработка изображений применяется квыделенной области, содержащей подпись. Целью данной обработки является повыш ение качества изображения подписи путем устранения шумов. Достиг а ется данная цель применением методов пространственной фильтрации, атакже ме тода порогового отсечения. Существует достаточное количество методов фильтрации . Комбинации различных методов будут порождать новые методы. Каждый метод используется отдельно иприменяется копределенн омунабору изображений: по л ному или частичному. Для тог очтобы среди большого количества вариа нтов методов выбрать наиболее качественные требуется их сра в нить. Каждый метод будет создавать свою альтернативную коллекцию изображений, которую будем называть альбомом. Каждый альбом подве ргается тестовому распозна ванию итекстовому анализу, врезультате чего формируется текстовая коллекция. Для сравнения методов обработки применяется сравнение различных оценок соответствующих текстовых коллекций. Можно выделить 2 вида сравнения. Сравнение общих оценок всех текстовы хколлекций. Данное сравн ение применяется для выбора среди большого количества методов небол ьшой группы наиболее качественных методов. Из -за того, что обработка всей коллекции одним методом может занимать значительные ресурсы, для сравнения используется то лько небольшая выборка, например, 100 изображений. Сравнение оценок альтернативных текстов для каждого изображения. Данное сравнение используется для более точного отбора результатов среди возможных альтернатив. Вкачестве критериев отбора выступают не тек стовые файлы целиком, аих части, аименно, атрибуты подписи иостальной текст. Результирующий текст будет собираться из соответству ющих частей снаибольшей оценкой. Пример сравнения методов обработки можно увидеть на экране. Цветом выделены части снаибол ьшей оценкой среди альтернатив. Основные проблемы, возникшие впроцессе составления индекса:  Наличие ошибок распознавания вполученных текстовых данных  Наличие орфографических ошибок в правильно распознанных словах, в ыявленных спомощью текстового анализа.  Наличие географических названий, других собственных имен, технических терминов, атакже терминов вразговорной форме, которые отсу т ствуют вкаких -либо словарях.  Наличие орфографических ошибок внеизвестных словах, что з атрудняет идентификацию слов.  Наличи еразличных сокращений, которые воспринимаются те кстовым анализат о ром как мусор. 108
Решение вышеперечисленных проблем можно осуществить спом ощью следующих инструментов:  Использование автоматизированного метода морфологическо анализа неизвестных слов ислов сошибками.  Введение тематических словарей для классификации доба в ляемых слов. Ктаким словарям можно отнести словари географических назв а ний или имен.  Использование дополнительных частных методов анализа мусора. Индекс строится стандартным образом на осн ове нормальных форм слов, встречающихся втекстах. Для этого строится словарь нормальных форм на основе словарей известных слов, любого морфологического анализатора иморфологическо информации одобавленных словах. Таким образом, полученный индекс будет учитывать не только известные, но также неизвестные слова, кот орые были добавлены вручную. Для повышения точности был разработан контекстный анализатор, позволяющий искать информацию втексте по заданному шаблону ив ыполнять обработку как отдельных элементо втекста, так ивсего текста. Контекстный анализатор обладает следующими свойствами:  Позволяет задавать правила поиска иобработки последователь ости слов определенного типа.  Поддерживает различные типовые группы слов, например, мо рфологич е ские, лексически е, онтологические типы идр.  Позволяет уточнить поисковой индекс за счет нахождения сема нтической информации втексте, при этом найденные комбин а ции могут заменяться на одно ключевое слово сбольшей значимостью, чем все эл ементы комбинации.  Позволяет осуще ствлять обработку поискового запроса, уточняя его по з а ранее заданным правилам. Основные результата тыработы наданный момент состоят е- в сл дующем :  Произведена обработка коллекции фотографий  Составлен поисковой индекс  Разработан алгоритм контекстного поиска  Производится реализация конечного продукта –ИСдля поиска по коллекции Ʌɢɬɟɪɚɬɭɪ ɚ 1. Талбонен А. Н., Рогов А. А. Анализ машинописных подписей кфотографиям вцифровом альбоме // Электронные библиотеки: перспе к тивные методы итехнологии, электронные коллекц ии: Труды XII Вреро с сийской научной конф е ренции RCDL'2010.–Казань: Казан. ун -т, 2010. С. 422429. 109
ОСОБЕННОСТИ РЕПРЕЗЕНТАЦИИ НАУЧНОГО ИСТОРИЧЕСКОГО ЗНАНИЯ В РОССИЙСКОМ СЕГМЕНТЕ СЕТИ Т. П. Тетеревлёва Архангельск Ⱥɧɧɨɬɚɰɢɹ Доклад посвящён специфике предста вления научной исторической информации врусскоязычном сегменте глобальной сети Интернет . Выд елены условия иосновные факторы, которые определяют качественные изменения вспособах репрезентации иретрансляции научного историч еского знания вусловиях «медиа тизации» истории. Напримере основных жанров исторических сайтов, представленных врусскоязычном Интерн ете , анализируется влияние на специфику репрезентации результатов нау чных исследований таких сущностных характеристик новых медиа, как интерактивность игипертекстуальность. При этом особое внимание удел яется их взаимодействию со сложившейся вРоссии историографичес традицией и присущими отечественной историографии особенностям выстраивания исторического нарратива. Новые информационные икоммуникацион ные технологии никогда не были чисто техническим явлением [10], обуславливая возникновени новых социокультурных икогнитивных реалий. Не является исключением вэтом смысле ицифровая история (digital history). Стремительное распр остранение Интернет -технол огий приводит ктому, что цифровая история становится не только исследовательским подходом кизучению прошлого испособом обучения истории ираспространения исторических знаний, а всемирная сеть –не просто новой ареной для профессиональной научной деятель ности икоммуникации [4], способствующей более глубокому освоению исторического материала, введению внаучный оборот новых источников, атакже новых способов их хранения иобработки. Переход к «истории 2.0» порождает целый ряд проблем ивопросов, связанных с превращением исторического знания водин из элементов новой медийной культуры, что обуславливает качественные изменения, прежде всего, в способах репрезентации итрансляции исторического знания. Исследование репрезентации знания включает всебя изучение соо тношения различных форм иструктур представления знания, атакже вза имодействия различных репрезентативных систем. Ключевые изменения в системе репрезентации выражаются, прежде всего, во всё большей визу ализации исторического знания. Кроме того, следуе тупомянуть те качества новых медиа, которые сущностно важны для понимания проблем репр езентации научной информации всети иформирования новой парадигмы «он -лайн знания»: ёмкость (capacity), доступность (accessibility), гибкость (flexibility), многообрази е(diversity), управляемость (manipulability), инт ерактивность (interactivity) игипертекстуальность (hypertextuality) [2]. 110
Наиболее важными из них являются: 1) интерактивность, предусма тривающая не только количественное расширение возможностей диалога меж ду профессионалами, но икачественные изменения вдиалоге между профессиональными историками и «дилетантами»; 2) гипертекстуал ьность (нелинейность), которая предусматривает возможность продвиж ения впределах исторического нарратива множественными изачасту ю непредсказуемыми маршрутами. Именно сгипертекстом, который «обладает замечательной возможностью показа интерпретации истории вместе стем рядом данных, на котором эта интерпретация основана» , некогда связыв ались надежды на придание истории «тех черт нау чности, которых ей до сих пор не хватало: исследование может быть повторено, если предста влены данные иметоды. Мыможем до бесконечности дискутировать по поводу интерпретации истории, но вконце концов мысможем провести верификацию, проверить корректност ьанализа, на котором базируется интерпретация» [12]. Интерес, проявляемый кспецифике репрезентации научного истор ического знания впространстве Интернет аи, вчастности, вего русско язычном сегменте, неслучаен: историческое знание выступает одним из важн ейших символических ресурсов современного российского общества, находящегося впоиске оснований для новой коллективной идентичности При этом Интернет -ресурсы по истории всё чаще становятся для массов ого читателя главным источником знаний опрошлом, приним ая на себя решающую роль вформировании массового исторического сознания. Общеизвестно, что всовременном русскоязычном Интернете сущес твует огромное количество разного рода ресурсов по истории. Ихможно классифицировать по различным критериям: по хронолог ическим рамкам, представленному региону, тематике. Создаются эти ресурсы несколькими группами авторов: 1) профессионалами; 2) непрофессиональными истор иками: а) историками -любителями, самостоятельно осуществляющими исторические изыскания, иб) популяризато рами истории; 3) теми, кого пр инято именовать «носителями исторической памяти». Вроссийском сет е вом пространстве представлены все пять основных жанров исторических веб сайтов [12]: 1) посвящённые публикации исистематизации первичных источников (базы данн ых и т. ); 2) публикующие д. вторичные источники (н аучную ипублицистическую литературу по истории; кинодокументал истику идругие аудио -визуальные материалы); 3) образовательные ресурсы; 4) дискуссионные площадки (ориентированные на он -лайн диалог); 5) орга низационные сайты (представляющие информацию об историческом сообщ естве). Нужно отметить, что проблема классификации истор ических сайтов остаётся до конца нерешённой; кроме того, жанровые границы вросси йском Интернете размыты, зачастую на одном итом ресу рсе пре д ставлены материалы разной жанровой принадлежности. Тем неменее, жанровая классификация ресурсов очень важна, поскольку вусловиях «медиатиз ации» истории она имеет непосредственное отношение кожиданиям ауд и111
тории относительно способа репрезентации (а косвенно –ипроцесса пр оизводства, ихарактера использования) исторической инфо р мации. Для каждой из жанровых разновидностей Интернет -ресурсов по истории характерны свои проблемы репрезентации научного историческог знания, которые могут идолжны стать предметом специальных исслед ований. Врамках данного сообщения выделим лишь те проблемы, которые свойственны всему русскоязычному сегменту «цифровой истории». До лгое время они находились вне поля внимания историков -исследователе предполагалось, что ключ евыми для сетевой репрезентации историческ ого материала являются лишь проблемы качества исохранности информ ации, прежде всего при публикации первичных источников. Действительно, качество иаутентичность исторической информации, выкладываемой вИнтернете , –одна из самых острых проблем русско язычного сегмента сети. Существует ли надёжный способ сохранения вс ети исамой информации, иеё качества? Возможно ли остановить поток некачественной, недостоверной информации? –на эти вопросы вусловиях нарастающей « массовизации» исторического Интернет -пространства до сих пор нет однозначного ответа. Тем не менее, эти сложности не являю тся специфически присущими только периоду новых информационных технологий. Проблема качества и точности воспроизведения историч еских фактов, материала первичных источников вроссийской риторически окрашенной историографической традиции существовала задолго до Интернет -эпохи (достаточно вспомнить хотя бывспыхивающую время от времени сновой силой дискуссию вокруг «известий» Татищева). То чно так же задолго до появления виртуальной реальности сущес твовали вопросы относительно критериев отбора исистематизации при с охранении исторического материала. Интернет сего, на первый взгляд, безграничными возможностями имассовым доступом лишь обостр ил и слегка переформатировал их, несколько сместив акценты сгарантий с охранности испособов защиты информации на механизмы иинструменты защиты от информации. Гораздо более специфичными для нового этапа вразвитии росси йской историографической ситуации яв ляются проблемы, связанные срепрезе нтацией научного исторического знания при публикации вторичных исто чников, атакже скоммуникацией между профессиональными инепрофе ссиональными историками. Врусскоязычном Интернете существ у ютсотни сайтов, где размещаю тся научные инаучно -публицистические тексты по истории. Большой популярностью пользуются электронные библиотеки. При этом сетевые публикации, как правило, содержательно повторяют ан алогичный материал, существующий вне пространства сети (научные мон ографии , статьи, диссертации, документальные фильмы, историческую пу блицистику). Вчём же может заключаться проблема репрезентации научн ого знания, если подавляющее большинство размещённых всети текстов традиционны ичаще всего являются электронным воспроизведен ием сущ е112
ствующего печатного издания, лишь снекоторыми изменениями, прис ущими электронной версии (например, новыми возможн о стями поиска)? Прежде всего, стоит обратить внимание на то, что большинство до ступных сайтов спубликациями вторичных источников созд аются не сп ециалистами по историографии идаже не профессиональными историками, что имеет значимые последствия для контекстуальной репрезентации исследовательских материалов. Важнейшее из них парадоксально: новизна носителя не приводит автоматически крост упредставленности всети научно выверенной новизны интерпретаций; создатели подобных сайтов малочувствительны кновейшим тенденциям вразвитии исторической науки, предпочитая выкладывать всеть востребованные всилу «проверенност временем» тексты. Ещё од на проблема связана снарушенной иерархизац ией текстов, размещаемых на таких открытых ресурсах: из -за незнания с овременного историографического ландшафта серьёзные научные раб о ты размещаются «на равных» сявно маргинальными, азачастую ипсевдон аучными тек стами, что создаёт характерную для ситуации медиатизации иллюзию «равенства мнений» академических историков инепрофе с сионалов. Вэтом контексте «равенства мнений» стоит упомянуть ещё одно радикал ьное отступление от правил профессионального научно -историче ского зн ания ипринятых норм академизма –феномен «open -source» и, вчастности, претендующего на универсально -справочный характер «викизнания», уч астие вконструировании которого принимают (особенно врусскоязычно сегменте) не только ине столько професси оналы. Таким образом, перве нство впредставлении исторического нарратива всети принадлежит люб ителям, которые по -своему репрезентируют научное знание. Неостанавливаясь подробно на особенностях восприятия научного знания обыденным сознанием, стоит подчерк нуть, что вэтой ситуации даже корректно (в содержательном иконтекстуальном плане) предста вленный всети академический нарратив имеет достаточно специфически пределы бытования. Обусловлено это несколькими факторами. Во первых, закрытым характером многих профессиональных исторических ресурсов, недоступностью (в связи спроблемой авторских прав) для широкого читателя новейших исследовательских публикаций. Во -вторых, спецификой поисковых систем, иерархизирующ ихинформацию непо принципу её научной ценности, апо принципу востребованности, где ак адемическая «the good history» безнадёжно проигрывает медиатизирова нной «exciting history». Вцелом «медийность» истории превращает читат еля впотребителя исторической информации, вкусы изапросы которого отражают перв ые страницы результатов Интернет -поиска, куда струдом проникает научный исторический нарратив. Вомногом это связано ис изменившейся стратегией чтения. Гипертекстуальность значительно обогатила опыт чтения историч еского те к ста, придав ему принципиально новое качество. Процесс чтения гипертекста всё более превращается в«сад расходящихся тропок». «Кл и113
ковое чтение», как мин имум, нарушает каноны, сложившиеся при чтении печатного текста (тезис внач а ле, качество сносок, выводы вконце); как максимум –разруша ет негласный «общественный договор» между авт ором научного текста иего читателем (автор, со своей стороны, дает орг анизованный, аргументированный идокумент ированный текст, ачитатель, со своей –обязуется потратить некоторое время на его чтение)[9]. Вт а кой ситуации цельный исторический метанарратив, ещё вХХвеке испыта вший удар от постмодернистской методологии, окончательно рассыпается на самодост а точные фрагменты; вИнтернет -пространстве, таким образом ускоряется объе к тивный процесс «измельчения» истор ического знания, возникший как «адекватный ответ историков на вызов актуальной соци окультурной ситуации», аисследователи становятся более чуткими кал ьтернативным формам исторической репрезент а ции[15]. Эти новые формы связаны супоминавшимися вначале док лада ос обенностями он -лайн знания, которые позволяют по -новому конструир овать исследовательское пространство и коммуникативную среду, пре дставлять не только «чистовой вариант» иформальные компоненты иссл едовательской работы, но ите виды открытий иразмыш лений, которые находятся на обочине традиционно понимаемого научного исследования Технологии Web 2.0 становятся не просто наилучшим, а, по большому счёту, единственным способом репрезентации подобных материалов. В качестве частных примеров стоит упомянуть такое явление, как сетевые сообщества профессиональных историков, но, прежде всего, професси ональных историков, ведущих собственный блог. Именно появление подобных форм репрезентации научного знания способствует его принцип иально новому качеству, разрушая барьеры, традиционно разделявшие ак адемических историков имассовую аудиторию, рабочие заметки изаве ршенный научный текст, текст иобраз, прошлое инастоящее. Ʌɢɬɟɪɚɬɭɪɚ 1. A. Cartelli, L. Miglio, M. Palma. New Technologies and New Paradigms in Historical Research // Informing Science. Special Issue: Expanding the Focus. Vol. 4. No 2 (2001). 2. D. Cohen, R. Rosenzweig. Digital History: A Guide to Gathering, Preserving, and Presenting the Past on the Web. University of Pennsylvania Press, 2005. 3. D.A. Bell. The Bookless Future: What the Internet is Doing to Scholarship // New Republic. May 2. 2005. 4. D.J. Cohen, M. Frisch, P. Gallagher, S. Mintz, K. Sword, A.M. Taylor, W.G. Thomas III, W.J. Turkel. Interchange: The Promise of Digital History // Journal of American History. 95:2 (2008). 5. M. Poe. Fight Bad History with Good, or, Why Historians Must Get on the Web Now // Historically Speaking: The Newsletter of the Historical Society. 10:2 (2009). 114
6. M. Poe. The Future of the Past: Academic and Popular History in the Age of the Internet // Historically Speaking: The Newsletter of the Historical Society 1: 2 (2000). Methods of Historical Analysis in Electronic Media / D.G. Godfrey (ed.). Routledge, 2006. 7. Ph.E. Agre. Designing Genres for New Media: Social, Economic, and Political Contexts // CyberSociety 2.0: Revisiting Computer Media Community and Technology / S. Jones (ed.). Calif.: Sage, 1998. 8. R. Rosenzweig. Can History be Open Source? Wikipedia and the Future of the Past // The Journal of American History 93:1 (2006). 9. R. Rosenzweig. The Road to Xanadu: Public and Private Pathways on the History Web // Journal of American History. 88 (2001). 10. В. Друк. Автор 2.0: новые вызовы ивозможности // Новое литер атурное обозр е ние. 2009. № 100. 11. Г.П. Мягков, Н.И. Недашковская, Л.Ф. Недашк овский. Простра нство сети Интернет для исследователей истории средневековья: информ ационно -справочные ресурсы, научные центры, коммуникация, источники: учебно -методическое пособие для историков. –Казань: Изд -во Инст итута истории АНРТ, 2008. 12. Дж.М. Веллинг . Выступление на Круглом столе «Методологич еские пр облемы исторической информатики иквантитативной истории» // http://kleio.asu.ru/aik/bullet/19/29.shtml Информационный бюллетень асс оциации «Исто рия и комп ь ютер». № 19. Ноябрь 1996. http://www.ab.ru/ ~kleio/aik/bullet/19/36.shtml [23/02/2011]. 13. И.О. Ермаченко. Русско -турецкая война в непрофессиональ « Интернет -историографии»: механик аконтекстов // Международная научная конференция «Теории иметоды исторической науки: шаг вXXI век». 12– 14 ноября 2008. Москва. Российская академия наук. Институт всеобщей истории. Российское общество интеллектуал ь ной истории. 14. О.Н. Сысолятина. Вербальные иневербальные формы репрезент ации зн а ния. Дисс. … канд. филос. наук. Киров, 2004. 15. С.И. Маловичко. «Измельчение» исторической науки: актуальные ист ориографические практики // Харківський історіографічний збірник. Xарьков: Изд -во НУА, 2008. Вып. 9. 16. Ф. Анке рсмит. Нарративная логика. Семантический анализ языка истор иков. М.: Идея -Пресс, 2003. 17. Ассоциация «История икомпьютер» (http://kleio.asu.ru/aik/bullet). 18. Интернет для историков (http://www.edu.tsu.ru/historynet/informatika). 19. http://medien.ru/istoricheskaya-literatura/ 20. http://kontakte.su/forumy-istorikov/ 115
MATHEMATICAL MODELS FOR HISTORICAL AND ARCHITECTURAL ANALYSIS OF TRADITIONAL RURAL SETTLEMENTS OF THE RUSSIAN NORTH МАТЕМАТИЧЕСКИЕ МЕТОДЫ В ИСТОРИКО-АРХИТЕКТУРНЫХ ИССЛЕДОВАНИЯХ ТРАДИЦИОННЫХ ПОСЕЛЕНИЙ РУССКОГО СЕВЕРА M. Shley, A. Borisov Petrozavodsk Ⱥɧɧɨɬɚɰɢɹ Статья посвящена описанию возможности использования информ ационных технологий для проведения историко -архитектурных исследов аний традиционных поселений Русского Севера , вчастности , для разрабо тк исистемы комплексного анализа объемно -планировочной структуры поселений. Предложенная система автоматизирует метод исследования влияния инсоляции, то есть солнечного освещения напланировочную стру к туру поселения. Traditional rural communities in North Russia were typically established as part of nature, and the landscape and climate of the territory were considered in developing the area to create comfortable living conditions that meet cultural demands. The subjective concept of nature in the cultures of different peoples is reflected in the structure of their settlements. Therefore, the characteristics of planning structure are understood as an ethnic feature. V.P. Orfinsky was the first to positively answer the question of ethnic traits in the planning of traditional settlements. He argued that ethnic traits manifest themselves not in the preference of one or another planning form by different ethnic groups of population, but in the subtle differences and evolution trends of such forms. Revealing these characteristics is highly essential in ethno-architectural studies and is one of priority tasks [1]. One of the trends is obvious in houses built with south-facing (“summer facing”, sun-facing) facades. The dominantly south-oriented development of communities can be determined unambiguously only for simple planning forms. When houses are equally oriented, it is easy to reveal this pattern, particularly if other structure-forming elements, such as a water body, a road and a natural or architectural compositional dominant trait, do not compete with the sunny side of the horizon. It is more difficult to determine the dominance of “summer” orientation in chaotic or complex forms. It is even more difficult to reveal “su mmer” orientation trends in the latest forms of settlements such as street forms. With such planning structures, it is impossible to orient all houses southwards (“towards summer”). E.E. Blomqvist, who studied settlements in Middle Russia, gives a typical example of a street form: “The lines of settlements always 116
stretch in almost the same direction: one is directed towards midday and is, therefore, called a midday line and the other is directed towards midnight and is called a midnight line. The midday line is considered jolly because it is better illuminated and heated by the sun. Therefore, when settlements are re-built, peasants cast lots to decide which site they will have”[2]. To reveal planning trends in the southern orientation of houses, we propose to analyse the position of dwelling-houses that provides maximum insolation time of the various parts of living quarters and a psychological comfort created by sunlight. Many methods are now used to estimate insolation. They help solve dwelling-house design problems. The methods are based on various nomograms, plots and diagrams that provide convincing data on the visible motion of the sun in the sky. The insolation quality of rooms is dominantly assessed in designing on the basis of one index, namely insolation time. The mathematical model proposed is theoretically based on B.A. Dunaev’s method used to estimate insolation time [3]. It is better than other methods because one can estimate the entire space of the room, rather than its individual point. The essence of the method is as follows. A cartogram, produced by overlapping a so-called “solar map” and the lights and darks of the window, through which the dwelling-house is illuminated, is used to calculate the time in hours during which sunlight can penetrate into the house. The parameters of the lights and darks of the window are preset on the subsidiary net of the cartogram and depend on the size of window openings and the thickness of the wall, determining the vertical and horizontal insolation angles of the windows. We have accepted these values, considering the geometrical characteristics and proportions of windows in traditional dwelling-houses in the study area. The resulting cartogram is also used to estimate insolation time in various parts of a house. When building a house in their village, peasants presumably tried to optimize its insolation by considering some house design details such as the position of the entrance and, of course, the planning of living quarters. The schemes of houses and living quarters show some traditional traits in each territory, and the number of their varieties is limited. Therefore, a peasant can vary illumination parameters only by positioning his house in the village. The parameters can thus be unified in terms of illumination regime in izbas. To assess the illumination of a common house, izba is considered as the main and often the only living-room in the house. Analysing the planning schemes of the living quarters of a house and izba constituents with examples from the villages examined in the study areas, three basic planning types of living quarters, namely living-rooms with unilateral, bilateral and trilateral illumination, are distinguished on the basis of their illumination. The different position of windows in the facades of houses affects the insolation time of the rooms. (Izbas with unilateral illumination in the study area have not been encountered, but they are included into the typological series discussed to make the procedure more widely used). More recent designs of five-wall dwelling117
houses with a longitudinal interior wooden wall, which include an izba and a living-room, as well as an izba design with the reverse lateral position of a stove, common in the study area, are based on the above schemes. The insolation time of the inner space of a room is thus calculated from several parameters, namely house azimuth, the latitude of the area where the house is located and the type of the house. Depending on their variations, a general insolation pattern for the village can be determined. In this case, the most typical orientation of houses and, consequently, their insolation time are considered. It is safe to assume that the more effort is made to improve the illumination of the inner space of a house, the longer insolation time. As each village is unique in its natural-spatial environment, the indices estimated are used as a comparative parameter for settlements in the study area and show the insolation time of the various parts of living quarters and their orientation most typical of the volumetric-planning structure studied. Objectivized analysis of settlements can thus be attempted to reveal the tendency for the southward orientation of houses and ethnic characteristics shown by the degree of insolation of the various parts of a house that varies from people to people. A comparative study of the settlements governed by the Klimovsky Rural Council of the Leningrad region, carried out when developing the analytical procedure proposed, has led us to assume that the insolation potential was used less efficiently in Russian villages than in Karelian villages, where peasants tried to determine the optimum position of their house. To make insolation time as long as possible, peasants also considered the internal planning of their houses, including the position of the entrance. This hypothesis agrees with the conclusions drawn by other researchers. For example, analyzing available evidence for the settling of Slavonic peoples in the former USSR territory, including North Russia, well-known ethnographer Е. E. Blomqvist pointed out that all peasants built their houses so that the main facades faced south [2]. V. P. Orfinsky compared the planning structures of Russian and Karelian villages. He noted that the tendency for the southward orientation of houses is shown more distinctly by the Baltic and Finnish population than by the Russian people [4]. In order to conduct researches of this kind on a village or a group of villages in a classic way, a researcher must perform a number of time-consuming tasks to receive statistical estimates of the insolation time of the houses: To process the general layout of the village in order to determine the locations of the dwelling-houses. To form a table with information about all the houses of the village, the latitude of the village and the month of the survey, data about the orientation of the main facade of the house, the type of the house and the insolation time of different parts of the house. To compute statistical estimates of the insolation time of different house parts for the village in the whole. 118
This process is pretty time-consuming, and because of this the research is slowed down, and the preciseness of the output data is decreased. Therefore it was decided to automatize these tasks. To solve this problem it was decided to develop a software system which is aimed for conducting historical and architectural analysis of the planning structure of traditional rural settlements of the Russian North. Apart from conducting researches of the imfluence of the insolation on the planning structure of the village, the system will provide tools to compute the assessments of the planning structure relative to the main natural-climatic and landscape features of the area:  assessment of the regularity of village building, which is defined as a difference measure of the village structure and landscape foundation;  assessment of the aeration conditions of the village, which influences the ventilation processes and the impact of the wind;  assessment of the degree of closure of the village building which is determined with help of the building arrangement, which can provide the connection with natural surroundings or the separation from it;  assessment of the role of the water basin, which can prioritize the building orientation. There are no similar systems. In the mode for conducting research of the insolation the system provides the user with assessments of the insolation characteristics for an individual building or for the village in the whole [5]. In order to determine the insolation time of the main facade, the entrance wall and the insolation of the whole house the user must specify the azimuth of the main facade direction, the type of the house, the month of the survey and the latitude. After that the program will compute and output the required characteristics. In order to determine the insolation characteristics for the village in the whole, user should upload the general layout of the village in a vector WMF and specify the latitude and the month of the survey. The system processes the layout and computes the required characteristics for each house. These characteristics are used to compute statistical assessments for the village in the whole: the number of houses with favorable, acceptable and unfavorable orientation, the most typical insolation time for the village. An algorithm for detecting houses on the general layout of the village presented in a digital form was implemented and an insolation computing model was developed [6]. The algorithm is based on the methods of cluster analysis, in particular on the parallel cluster procedures. The input data for the algorithm is the digital general layout presented as an array of vectors. The algorithm searches for the houses on the map, determines the azimuth of the direction of the main facade and the types of the houses. Also other objects can be detected on the layout: roads, gardens, fences and household buildings. 119
In order to compute the insolation time for the detected houses a mathematical model was developed. The input data for the model includes the latitude of the area, the month of the survey, the type of the house and the azimuth of the direction of the main facade. The model is based on the building of the solar map and combining it with the chiaroscuro of the windows of this house. The introduced algorithm of detecting hoses and mathematical model for computing insolation time were implemented in a software system. The system ensures the effectiveness and preciseness of the required calculations which allows using the system for historical and architectural analysis of the villages. The next step in creating the software system is implementing the possibility to assess water body impact on the building structure which is determines from the orientations of the main facades of the houses. The implemented system can be used for both the fundamental theoretical researches of the historical and architectural environment of traditional rural settlements and as an auxiliary instrument for the architectural designing, for example for creating environmental settlements. References 1. Орфинский В. П. Вековой спор. Типы планиро вки как этнический признак (на примере поселений Русского Севера) // Советская этн ография. 1989. № 2. С. 55–62. 2. Бломквист Е. Э. Крестьянские постройки русских, украинцев ибелорусов // Во с точнославянский этнографический сборник. М., 1956. С. 5– 458. 3. Дунаев Б. А. Инсоляция жилых зданий. М., 1962 –79 с. 4. Орфинский В. П. Деревянное зодчество Карелии. Генезис, эвол юция, национальные особенности. Дис.на соиск. уч. ст. доктора архитект уры. М., 1975. т. I: 248 с., приложения 55 с., т. II: 124 с. 5. Шлей М.Д., Борисо вА. Ю.Информационная система комплек сного историко -архитектурного анализа объемно -планировочной структ урытрадицио нных сельских поселений Русского Севера. Университеты в образовательном пространстве региона: опыт, традиции иинновации: Материалы научно -методической конференции, посвященной 70-летию Пе трозаводского государственного университ е та (16– 17 февраля 2010 г.). Ч. II (Л –Я) / ПетрГУ. –Петроз а водск, 2010. –С. 312–316. 6. Шлей М. Д., Борисов А.Ю. Методы оценки пространственны характеристик сельских по селений Карелии [Электронный ресурс] / М.Д. Шлей, А.Ю. Борисов // Режим доступа: http://www.elbib.ru/index.phtml? page=elbib/rus/journal/2010/part2/SB 120
Оглавление В. Ю. Афиани, Е. В. Злобин ОПЫТ РАБОТЫ АРХИВА РАН ПО ОБЕСПЕЧЕНИЮ ON-LINE ДОСТУПА К АРХИВНЫМ ДОКУМЕНТАМ ........................................................................................ 3 V. A. Baranov SOFTWARE TOOLS AND USER INTERFACES DESIGNED FOR HISTORICAL-LINGUISTIC PURPOSES OF PROJECT “MANUSCRIPT” ......................... 7 Г. И. Борисов ВИРТУАЛЬНАЯ РЕКОНСТРУКЦИЯ УСАДЕБНОГО КОМПЛЕКСА ГРАФА ХРАПОВИЦКОГО (КОНЕЦ XIXНАЧАЛО XX ВЕКА) ...................................................... 14 Л. И. Бородкин DIGITAL HISTORY ИЛИ ИСТОРИЧЕСКАЯ ИНФОРМАТИКА? ......................................... 17 D. Brusnitsyna THE DATABASE OF IVAN DIVOV’S CENSUS BOOKS FOR KARELIAN PLOUGHMEN SOLDIERS (1657) IS A METHOD TO MICROHISTORICAL INVESTIGATION ...................... 21 А. Г. Варфоломеев, А. С. Иванов МОДЕЛИ СТРУКТУРЫ И СОДЕРЖАНИЯ ИСТОРИЧЕСКИХ ИСТОЧНИКОВ ................. 25 С. Г. Веригин, В. Л. Степанов ИСПОЛЬЗОВАНИЕ КОМПЬЮТЕРНЫХ ТЕХНОЛОГИЙ ПРИ СОЗДАНИИ ИНФОРМАЦИОННОЙ БАЗЫ ДАННЫХ ПОЛИТИЧЕСКИХ ССЫЛЬНЫХ НА ЕВРОПЕЙСКОМ СЕВЕРЕ (КОНЕЦ XIX – НАЧАЛО XX ВЕКОВ) ................................. 31 В. Н. Владимиров, Е. А. Брюханова, Н. В. Неженцева ИНФОРМАЦИОННЫЕ ТЕХНОЛОГИИ В ИСТОРИЧЕСКОМ ПРОФЕССИОВЕДЕНИИ ... 35 И. М. Гарскова БИБЛИОМЕТРИЧЕСКИЙ И СЕТЕВОЙ АНАЛИЗ ИСТОРИОГРАФИИ ............................ 39 D. Dobrowolski COMPUTER AIDED COLLATION OF POVEST VREMENNYKH LET COPIES ...................... 48 Д. И. Жеребятьев МЕЖДИСЦИПЛИНАРНОЕ ВЗАИМОДЕЙСТВИЕ В ПРОЦЕССЕ ВИРТУАЛЬНОЙ РЕКОНСТРУКЦИИ ОБЪЕКТОВ ИСТОРИКО-КУЛЬТУРНОГО НАСЛЕДИЯ ..................... 52 А. С. Иванов КОМПЬЮТЕРНОЕ ИСТОЧНИКОВЕДЕНИЕ ................................................................... 56 S. Kornienko, Y. Aydarov, F. Cherepanov, D. Gagarina, L. Yasnitskiy MANUSCRIPT AND EARLY PRINTED TEXT RECOGNITION APPLICATION ...................... 62 Е. А. Кочеткова ИСТОРИКИ-ЛЮБИТЕЛИ И ПРОФЕССИОНАЛЫ: ФОРМИРОВАНИЕ И ФУНКЦИОНИРОВАНИЕ СЕТЕВЫХ СООБЩЕСТВ ....................... 65 Н. Д. Москин ИССЛЕДОВАНИЕ ВАРИАТИВНОСТИ ФОЛЬКЛОРНЫХ ПЕСЕН С ПОМОЩЬЮ НЕЧЕТКИХ ТЕОРЕТИКО-ГРАФОВЫХ МОДЕЛЕЙ ..................................... 70 А. М. Пекина ЗНАЧЕНИЕ И ИСПОЛЬЗОВАНИЕ ДИСТАНЦИОННОГО КУРСА ПО ИСТОРИИ ОТЕЧЕСТВА В УЧЕБНОМ ПРОЦЕССЕ ДЛЯ СТУДЕНТОВ ТЕХНИЧЕСКИХ СПЕЦИАЛЬНОСТЕЙ ................................................. 74 121
М. Проскурякова МЕТОДИКА И РЕЗУЛЬТАТЫ СОСТАВЛЕНИЯ ПРОСОПОГРАФИЧЕСКОЙ БАЗЫ ДАННЫХ ПО ПЕРСОНАЛЬНОМУ СОСТАВУ ГАРНИЗОННОГО ПОЛКА 1735 Г........... 77 О. О. Реут РОССИЙСКИЙ ДИСКУРС ДОСТОВЕРНОСТИ И СОЦИАЛЬНО-ПОЛИТИЧЕСКИЕ ТРАНСФОРМАЦИИ СЕТЕВОГО ПРОСТРАНСТВА ......................................................... 82 А. А. Рогов, А. В. Седов, М. Ю. Некрасов, А. А. Котов НЕКОТОРЫЕ ОСОБЕННОСТИ СОЗДАНИЯ РАЗМЕЧЕННЫХ КОРПУСОВ ТЕКСТОВ В УСТАРЕВШЕЙ ГРАФИКЕ И ОРФОГРАФИИ ................................................................ 85 А. А. Рогов, А. В. Скабин АВТОМАТИЗИРОВАННАЯ СИСТЕМА РАСПОЗНАВАНИЯ РУКОПИСНЫХ ИСТОРИЧЕСКИХ ДОКУМЕНТОВ ................................................................................... 92 Д. А. Смирнов МАССОВАЯ АУДИТОРИЯ И ПРОФЕССИОНАЛЬНОЕ ИСТОРИЧЕСКОЕ СООБЩЕСТВО: ОСОБЕННОСТИ СЕТЕВОЙ КОММУНИКАЦИИ .................................. 97 E. D. Suslova RECONSTRUCTION OF KARELIAN PARISH NET IN EARLY MODERN TIME: AN EXPERIENCE OF DATABASE FORMATION .............................................................. 101 А. Н. Талбонен СОЗДАНИЕ ПОИСКОВОЙ СИСТЕМЫ, ОСНОВАННОЙ НА ИНФОРМАЦИИ, ИЗВЛЕЧЕННОЙ ИЗ МАШИНОПИСНЫХ ПОДПИСЕЙ К ФОТОГРАФИЯМ В ЦИФРОВОМ АЛЬБОМЕ ........................................................................................... 106 Т. П. Тетеревлёва ОСОБЕННОСТИ РЕПРЕЗЕНТАЦИИ НАУЧНОГО ИСТОРИЧЕСКОГО ЗНАНИЯ В РОССИЙСКОМ СЕГМЕНТЕ СЕТИ .............................................................................. 110 M. Shley, A. Borisov MATHEMATICAL MODELS FOR HISTORICAL AND ARCHITECTURAL ANALYSIS OF TRADITIONAL RURAL SETTLEMENTS OF THE RUSSIAN NORTH ............................ 116 122
ɂɇɎɈɊɆȺɐɂɈɇɇɕɃȻɘɅɅȿɌȿɇɖ Ⱥɫɫɨɰɢɚɰɢɢ©ɂɫɬɨɪɢɹɢɤɨɦɩɶɸɬɟɪªʋ Труды международной конференции. Июль 2011 г. Ответственные редакторы выпуска: А.Г. Варфоломеев, А.А. Рогов Подписано в 9.2011 печать рмат г. 07.0 Фо 60 х 90/16 Шрифт Times New Roman. Бумага офсетная . Усл. печ. л. 10,0. Тираж 200 экз.
Федеральное осударственное г бюджетное образовательное учрежд высшего профессионального я образова ПЕТРОЗАВОДСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРС Отпечатано в РЦНИТ Петрозаводского госуд 185910, г. Петрозаводск, Ленина, 33 пр. Заказ 189. № аж Тир 200 экз.