Реферат: Автоматизированная система учета и реставрации архивных рукописных материалов Муромского историко-художественного музея
Автоматизированная система учета и реставрации архивных рукописных материалов Муромского историко-художественного музея
Канунова Екатерина Евгеньевна
аспирант кафедры «Информационные системы»
Муромский Институт Владимирского Государственного Университета
Адрес: 602200, Муром, Владимирской обл. ул. Энгельса д. 15 кв. 90.
Тел: (809234) 35963
E-mail: asp_kat@rambler.ru
Садыков Султан Садыкович
д.т.н., профессор кафедры «Информационные системы»
Муромский Институт Владимирского Государственного Университета
Адрес: 602200, Муром, Владимирская обл. ул. Трудовая д. 21 кв. 92
Тел: д. (809234)49875 р. (809234)37222
E-mail: is@mivlgu.ru
В настоящее время интенсивно внедряются современные информационные технологии, обработка, хранение и передача информации во все сферы деятельности человека. Особое значение эти технологии имеют для хранения, реставрации и передачи на большие расстояния архивных документов. Во многих музеях и архивах мира осуществляется формирование компьютерных версий своих коллекций. Некоторые российские фирмы занимаются разработкой компьютерных музейных систем, предназначенных для учета архивных материалов и музейных коллекций. Так, например, в Муромском историко-художественном музее разработана автоматизированная система учета фондов (АСУФ), которая в настоящее время проходит тестирование в музее1.
Сегодня практически у каждого музея есть свой сайт в Интернете, который носит информативный и презентационный характер. Тем самым музеи предоставляют многим людям информацию о себе, о своей деятельности и о содержании своих фондов. Еще одним немаловажным направлением использования современных информационных технологий является автоматическая процедура реставрации архивных документов.
Архивные исторические документы, которые хранятся в Муромском историко-художественном музее имеют большую историческую ценность для работников различных учреждений, занимающихся изучением и исследованием истории Мурома и Муромского края. Они, наряду с музейными и библиотечными фондами составляют фундаментальный массив многоплановой информации о жизни и деятельности народов, использование этой информации - основа дальнейшего развития культуры и науки. При долгом хранении архивные документы приобретают значительные дефекты, которые способствуют потере их информативности. Так, например, в Муромском историко-художественном музее хранится около 140 рукописных книг с начала 16-ого по начало 19-ого века и около 2000 документов (векселей, дарственных грамот и т.п) с 16 по начало 20-ого века. Из них около 90 книг и 200 документов требуют восстановления. Проблема обеспечения сохранности и реставрации архивных документов является предметом исследования многих российских и зарубежных ученых. В Муромском музее в сотрудничестве с Муромским институтом Владимирского государственного университета ведется работа по созданию автоматизированной системы реставрации архивных материалов. К настоящему времени разработаны модули, предназначенные для устранения дефектов на рукописных и старопечатных книгах (документах). В ближайшем будущем предполагается дополнить систему модулями автоматизированной реставрации изображений фотодокументов.
Реставрация архивного текстового документа предусматривает восстановление текстовой информации в максимально близком к оригиналу виде, восстановление разрушенных участков основы документа или перенос текста на новый более долговечный носитель. В практике архивного дела применяются различные методы реставрации текстовых документов: ретушь, химический способ восстановления текстовой информации, электрографический метод восстановления текстов, оптико-фотографические методы и цифровые методы, т.е. автоматизированные.
Метод автоматической реставрации текстовых документов по сравнению с другими методами обладает рядом достоинств:
- позволяет устранять самые разнообразные дефекты (нерезкость, слабый контраст, пятна и т.д.);
- дает возможность исправления, как всего изображения документа, так и отдельных его участков;
- обеспечивает полную сохранность оригинала, так как преобразованиям подвергается не сам текстовый документ, а его электронная копия;
- позволяет многократно производить с заданной точностью любые преобразования изображения текстового документа;
- устраняет значительную часть трудоемких ручных операций.
Автоматическая реставрация состоит из следующих основных операций:
- оцифровка текстового документа;
- машинный анализ дефектов текстового материала;
- выбор способов для устранения дефекта на изображении;
- определение параметров обработки;
- обработка изображения текстового материала;
- контроль результатов реставрации;
- перевод отреставрированной цифровой копии документа на бумажную основу2.
^ Рассмотрим дефекты, характерные для архивных рукописных материалов.
Рукописный документ представляет собой систему, состоящую из носителя информации (бумага) и средств фиксации информации – красители, чернила, карандаш и т.п.
Вследствие этого дефекты рукописных материалов можно разделить на две основные группы:
дефекты бумажной основы документа;
дефекты, обуславливаемые средствами фиксации текстовой информации.
Дефекты бумажной основы:
дефекты, вызываемые деформацией бумаги: удлинение или усадка листа; коробление; скручивание
частичное или полное разрушение бумаги, повышенная ломкость и хрупкость
утрата отдельных частей листа бумаги (действие грызунов: отверстия на бумаге; обгрызание краев бумаги, корешков)
склеивание листов (основная причина – это плесневые грибы)
механические повреждения: складки, разрывы листов, следы частых перегибов, проколы
пожелтение бумаги (вследствие долгого хранения, зависит от свойств и состава бумаги)
пятна на бумаге (грязь, пигментные пятна, пятна, вызванные действием грибов, воск и т.п. )
коричневый цвет краев листа (обгоревшие, подмоченные и другие компоненты)
Дефекты, обуславливаемые средствами фиксации текстовой информации:
выцветание текста – естественное “темновое” локальное или по всему полю выцветание (музейный термин – “угасание” текста)
слабый контраст текстов
осыпание текста (вследствие появления складок, разрывов)
появление размазанных текстов (в следствие подмокания листов, повышенной влажности воздуха в местах хранения архивов)
нарушение конфигурации отдельных символов.
Следует отметить, что для визуального анализа рукописного материала достаточно выбрать следующие единичные показатели качества:
контраст между штрихами текста и фоном изображения
полнота информации, извлекаемая при чтении рукописного материала
отсутствие помех – пятен, загрязнений, порывов, проколов и т.п.
С точки зрения реставрации можно выделить следующие виды дефектов:
слабый контраст текстов по всему полю документа или локальный;
неравномерность фона по всему полю документа или в локальных участках;
полупрозрачные пятна с постоянной прозрачностью;
непрозрачные пятна, разрывы;
мелкие полупрозрачные пятна в виде точек, крапа;
протяженные полупрозрачные пятна -складки листа;
протяженные непрозрачные пятна – разрывы;
мелкие полупрозрачные протяженные пятна – мелкие складки;
мелкие непрозрачные протяженные пятна - мелкие разрывы и царапины;
точечные дефекты, размером не более девяти пикселей;
проступание надписей с обратной стороны листа;
шум в виде неравномерных загрязнений листа;
ненужная информация (пометки, помарки и т.п.)3.
Для каждого, из рассмотренных видов дефектов разработана своя процедура их устранения. Основная задача, которая ставилась перед разработчиком системы – это в максимальной степени свести процесс реставрации документов к автоматическому режиму и тем самым оградить оператора от лишней работы.
Система автоматизированной реставрации включает несколько модулей:
- модуль поиска и устранения локальных дефектов (мелких, средних и крупных непрозрачных и полупрозрачных пятен; царапин; трещин; перегибов);
- модуль анализа изображений архивных материалов на контрастность;
- модуль восстановления контраста слабоконтрастных изображений архивных материалов (позволяет устранять локальное потускнение штрихов текста и по всему полю документа).
- модуль устранения проступаний надписей с обратной стороны листа на изображениях рукописных архивных материалов
Система работает в двух режимах: диалоговом и автоматизированном. Диалоговый режим реализован в виде надстройки графического редактора Adobe Photoshop в виде включения в него дополнительных фильтров, позволяющих устранять дефекты. Каждый фильтр представляет собой файл с расширением 8bf, который включает в себя процедуру реставрации определенного дефекта. Надстройка редактора производится простым копированием 8bf-файлов в подкаталог Plug-Ins рабочего каталога Adobe.
Автоматизированный режим реализован в виде отдельной программы, которая без дополнительных настроек ставится на компьютер пользователя и включает в себя все рассмотренные выше модули. Программа написана на языке программирования Object Pascal в среде визуального программирования Delphi. Система снабжена удобным и понятным для начинающего пользователя интерфейсом и предназначена для работы с ней хранителей рукописей, книг, фотографий и специалистов, занимающихся вопросами реставрации. Рабочая область системы включает разделы для просмотра исходных изображений документов в формате bmp и их фрагментов, разделы для просмотра обработанных изображений документов и их фрагментов, разделы для просмотра гистограмм распределений исходных и обработанных изображений. Естественно, если оператор не доволен работой алгоритма, то он может отменить те или действия при работе с изображениями.
Основные возможности системы:
- открытие изображений в формате bmp и сохранение обработанных изображений в любом формате (jpeg, bmp, tiff) (Меню ^ Файл/Открыть изображение и Файл/Сохранить изображение). Отмена выполненной обработки (Меню Файл/Отменить );
- восстановление слабого контраста (Меню Восстановление контраста/С использованием опорных точек (для восстановления сильного выцветания); Восстановление контраста/Адаптивное коррекция (для восстановления неравномерного выцветания документов); Восстановление контраста/Локальное восстановление (для восстановления контраста в отдельных участках изображения); Восстановление контраста/Глобальное восстановление (для восстановления контраста по всему полю документа) и Восстановление контраста/ Анализ изображения на контрастность. Последний пункт меню предназначен для машинного анализа изображений и, в зависимости от типа изображения, выбора определенного алгоритма восстановления контраста. Т.е. пользователь может либо на основе визуального анализа выбрать тот или иной метод восстановления контраста, либо запустить процесс автоматического анализа и восстановления документа);
- устранение локальных дефектов (пятен, царапин, мелкого крапа и т.п.). Здесь также как и при восстановлении контраста, оператор может устранять локальные дефекты в ручную, т.е. выбора мышкой области на изображении, содержащей локальный дефект и выбора определенного пункта меню для его устранения, либо автоматически путем запуска процедуры поиска и устранения всех видов локальных дефектов. Ручной режим: (Меню Локальные дефекты/Устранение мелких пятен; Локальные дефекты/Устранение средних пятен округлой формы; Локальные дефекты/Устранение протяженных дефектов; Локальные дефекты/Устранение полупрозрачных дефектов; Локальные дефекты/Устранение непрозрачных дефектов). Автоматический режим: (Меню Локальные дефекты/Поиск и устранение);
- устранение проступания надписей с обратной стороны листа. Данный вид дефекта, наряду с локальными дефектами, очень часто встречается на архивных рукописных и старопечатных документах, поэтому его устранение также является актуальным (Меню Устранение проступания надписей);
- методы сегментации. Это отдельная группа модулей, задача которых устранение различных видов дефектов (это могут быть локальные дефекты, неравномерность фона, желтизна страниц, помарки, пометки и т.п.). (Меню Сегментация/Автоматическая классификация; Сегментация/Сегментация по гистограмме и Сегментация/Локальная сегментация – для устранения локальных дефектов, желтизны страниц, неравномерности фона;
- обработка цветных документов – (Меню ^ Обработка цветных изображений) предназначена для устранения дефектов на изображениях цветных архивных документов и включает в себя методы сегментации цветных изображений, предназначенные для устранения локальных дефектов, желтизны страниц и восстановления контраста.
Следует заметить, что система не предназначена для реконструкции текстовых символов, так как это очень трудоемкий процесс, включает в себя методы распознавания образов, а распознать рукописные символы различных авторов определенных временных периодов очень сложно.
Пример реставрации изображения текстового документа, содержащего пятна приведен ниже.
Рисунок 1 – Изображение архивного текстового документа, содержащего пятна округлой формы
Рисунок 2 – Результат устранения пятен округлой формы
Рисунок 2 – Результат устранения пятен округлой формы
Список литературы
Канунова Е.Е., Тюрина Е.К Автоматизированная система учета фондов – теория и практика.. Материалы шестой международной конференции ЕВА’2003.
Садыков С.С., Канунова Е.Е. Вопросы устранения дефектов на архивных рукописных материалах../ Пенза симпозиум «Надежность и качество 2004»
Канунова Е.Е., Садыков С.С. Дефекты рукописных архивных документов и возможные методы их устранения. Обработка информации: методы и системы: Сборник научных статей/ Под ред. Садыкова С.С., Андрианова Д.Е. – М.: Горячая линия – Телеком, 2003 г. – 231 с. (с. 9 - 12).
еще рефераты
Еще работы по разное
Реферат по разное
Ii международная научно-практическая конференция студентов «национальная экономика республики беларусь: проблемы и перспективы развития»
17 Сентября 2013
Реферат по разное
Проблемы и перспективы развития сварочного производства республики беларусь
17 Сентября 2013
Реферат по разное
На конференции предлагается рассмотреть вопросы : альтернативность как общая методология подготовки управленческих решений
17 Сентября 2013
Реферат по разное
Информация о реализации сибирского проекта «Малая Родина» Алтгту
17 Сентября 2013