Сборник 2002

ТРАДИЦИОННЫЕ ГАЗЕТТИРЫ И ЗАДАЧИ СОЗДАНИЯ
ЭЛЕКТРОННЫХ ГЕОБИБЛИОТЕК[1]

 

 

Н. В. Лунева

Институт проблем информатики Российской академии наук

nl2@mail.ru

 

 

 

Ключевые слова: геопространственная информация, метаданные, топонимы, поиск геоинформации, службы сервиса геобиблиотек

 

Формирование и развитие электронных геобиблиотек стимулировало постановку задач создания служб сервиса, которые обеспечивают каталогизацию пространственных данных, их описание с использованием метаданных, поиск и извлечение, различные виды обработки пространственной информации, ведения и развития электронных фондов геоинформации. Особый интерес представляет возможность использования электронных версий традиционных газеттиров географических названий в качестве основы для создания ряда служб поиска электронной геобиблиотеки. Лежащий в основе геобиблиотеки электронный газеттир обеспечивает связь между координатами геообъектов, их изображениями, топонимами и метаданными. Таким образом, газеттир оказывается составной частью поисковых служб геобиблиотеки, обеспечивая поиск пространственной информации по топонимам, координатам и метаданным.

 

 

  1. Введение

 

К настоящему времени специалистами и учеными разных стран собраны огромные объемы картографической и другой пространственной информации в электронной форме об объектах окружающей среды. При этом использовались разные стандарты представления, хранения, обработки и передачи геопространственной информации. Потребности обработки, хранения, поиска, многоаспектного использования таких коллекций пространственной информации вызвали к жизни формирование распределенных хранилищ геодокументов и разнородной пространственной информации, получивших название ''электронные геобиблиотеки''.

Развитие электронных геобиблиотек стимулировало постановку задач создания служб сервиса электронных геобиблиотек. Эти службы обеспечивают каталогизацию пространственных данных, ее описание с использованием метаданных, поиск и извлечение, различные виды обработки пространственной информации, ведения и развития электронных фондов. Исследования и разработки функционально-организационных структур служб сервиса электронных геобиблиотек ведутся в Федеральном комитете по географическим данным США (FGDC) и в рамках крупномасштабной американской программы DigitalLibrary Initiative [1].

Особый интерес представляет возможность использования традиционных газеттиров географических названий как основы для создания ряда служб поиска электронной геобиблиотеки. Традиционный газеттир связывает топонимы географических объектов и их локализацию – координаты, листы карты. Электронные газеттиры дополняются метаданными геопространственной информации. Например, в рамках проекта Alexandria Digital Library был создан электронный газеттир, позволяющий пользователю устанавливать соответствие между топонимом и координатами геообъекта на земной поверхности. Сама электронная геобиблиотека формируется на основе документов по наукам о Земле и пространственной геоинформации, представленной также в виде метаданных. Для локализации геоинформации в тексте документов используются тэги тех компонентов полнотекстовых документов, которые определяют пространственную и/или временную локализацию геообъектов, упоминаемых в документах. На основе такой разметки формируются наборы метаданных, в свою очередь, служащие основой для индексации, каталогизации и поиска информации [2].

 

 

  1. Доступ к геоинформации: метаданные и топонимы

 

В полнотекстовых документах, относящихся к наукам о Земле, картографическая информация, геологические схемы и разрезы, планы, диаграммы, аэрофотографии, космические снимки и другие изображения кодируются, как правило, в виде растровых или векторных графических изображений. Эти документы достаточно часто включают геоизображения, которые могут отображать пространственные отношения объектов и явлений, а также пространственно-временной ход явлений и процессов в серии дискретных моментов времени [3]. Поиск и доступ к этим геоизображениям традиционно осуществляется через тексты документов, содержащих геоизображения, а поиск самих документов обычно возможен только по их вербальным составляющим. Представляет значительный интерес доступ к таким документам, организованный через поиск по содержащательным аспектам и/или именам, включенным в геоизображения.

Широко распространенным способом доступа к геоизображениям является их каталогизация с помощью метаданных [4]. В настоящее время созданы системы распределенных хранилищ геоизображений, накоплены огромные массивы аэро- и космических снимков Земли и других планет солнечной системы, частично описанных метаданными, однако значительная часть этой геоинформации пока не каталогизирована.

В документах по наукам о Земле традиционно используются топонимы — географические названия объектов на поверхности Земли. Наличие топонимов с одинаковым написанием затрудняет идентификацию геопространственной информации и ее поиск в геобиблиотеках. Часто встречаются полностью совпадающие в определительной части названия различных геообъектов. Например, Михайловская свита (Ю.Урал) и Михайловская толща (Подмосковный бассейн); Березовская свита (Ю.Урал), Березовские слои (Тиман) и Березовский горизонт (Ю.Урал); Коркинская свита (Дальний Восток) и Коркинский горизонт (г. Красноярск); Лихвинский подъярус, Лихвинская свита и Лихвинское оледенение [5].

В электронных геобиблиотеках полнотекстовых документов по наукам о Земле накоплено большое число документов. Синхронное существование совокупностей всех географических названий многочисленных регионов, насчитывающих сотни тысяч имен собственных, часто делает имя (топоним) недостаточным средством идентификации геопространственного объекта. Кроме того, существуют такие явления, как использование одинаковых географических названий для идентификации различных геопространственных объектов, различия по написанию топонимов в различных источниках, параллельное существование общерусского и местного названия, частое изменение топонима. Например, отличаются по написанию в различных источниках названия французского происхождения: остров Беннета, Benetta иBennetta, поднятие Анжу, Anzhu High и Anjou High. В русскоязычной среде параллельно сосуществуют варианты транслитерации топонимов: для горного перевала в Ошской области Чигирчик, Чыйырчик и Чийрчик; Джалтыр и Жалтыр. Кроме того, для России характерно также параллельное существование общерусского и местного названия: Гнилое море и Сиваш, Голодная степь и Бетпак-Дала и частое изменение названий: Самара – Куйбышев, Кировобад – Пяндж и др.. В результате в разных источниках могут упоминаться разные названия одного и того же объекта или одним и тем же топонимом обозначаться разные объекты. Одним из способов решения данных проблем является применение метаданных, описывающих топонимы в контексте их пространственной локализации (геообъектов) и, параллельно, содержащих их электронных документов [5].

Метаданные – это структурированные символьные кодированные данные, описывающие другие данные, в нашем случае – электронные карты, снимки, схемы и другую пространственную информацию. С семиотической точки зрения метаданные можно рассматривать как совокупность знаковых образований, используемых для описания геопространственной информации [6].

Структура и содержание метаданных определяются стандартами на метаданные или, при отсутствии стандартов, функциями и потребностями тех информационных систем, на пространственные данные которых составляются метаданные. Во многих странах ведутся работы по созданию стандартов на метаданные пространственной информации, создаются базы метаданных, обеспечивающие поиск самой разнообразной геоинформации и доступ к ней. В нашей стране были разработаны государственный стандарт на пространственные данные, цифровые и электронные карты, введенный в действие 1 июля 1996г. [7], и государственный стандарт на состав и содержание метаданных электронных карт, утвержденный в 1999 г. [8]. В настоящее время ведутся работы по созданию поискового Интернет – сервера для электронных библиотек метаданных карт и геопространственной информации: разработка и реализация (грант РФФИ 00-07-90154), в основе работы которого лежит база метаданных электронных карт.

 

 

  1. Традиционный и электронный газеттиры

 

Традиционный газеттир представляет собой текстовый список, связывающий между собой топонимы географических объектов и их локализацию – координаты, листы карты. Если газеттир является составной частью некоторого атласа, то в нем указываются листы карт в атласе и локализация в пределах этих листов. Электронные газеттиры дополняются метаданными геопространственной информации и возможностью поиска информации по всем трем атрибутам – топониму, географической локализации, а иногда и типу рельефа [2]. В контексте электронной геобиблиотеки такой газеттир обеспечивает связь между топонимами и пространственной локализацией, что дает возможность пользователю электронной геобиблиотеки использовать топонимы геообъектов вместо указания координат на базовой карте. В газеттирах для топонимов могут указываться включенные и включающие геообъекты, а также геообъекты, смежные по пространственной локализации. Примером газеттира, обеспечивающего связь между топонимом и пространственной локализацией соответствующего ему геообъекта, может служить система GNIS (Geographic Names Information System) [9]. В этом газеттире для каждого топонима указываются географические координаты только одной точки соответствующего ему геообъекта.

В рамках крупномасштабного проекта Alexandria Digital Library Project, ведущегося в университете г. Санта-Барбара, был создан электронный газеттир географических названий, насчитывающий около 6 млн. топонимов [10]. Данный газеттир служит основой для создания ряда сервисных служб электронной геобиблиотеки. Сама электронная геобиблиотека формируется на основе документов по наукам о Земле и пространственной информации, дополненной метаданными.

Газеттиры обеспечивают переход от топонимов к изображениям геообъектов и их координатам, что является важным механизмом извлечения геопространственной информации из существующих библиотечных каталогов и электронных геобиблиотек. На сегодняшний день собраны огромные массивы метаданных, содержащих географические имена в качестве индексов или дополнительных указателей. Доступ к подобной информации существенно расширяет функциональные возможности электронной геобиблиотеки. Обратный переход, от геообъекта и его описания к топониму, обеспеченный электронным газеттиром, позволяет пользователю получить доступ к геоинформации, определенным образом классифицированной по типовым особенностям рельефа, например, при поиске элементов гидрографической сети в заданном регионе [2].

Неоднозначность топонимов и их недостаточность для однозначной идентификации геообъектов снимаются дополнением электронного газеттира метаданными. Это обеспечивает взаимооднозначную связь топонимов геообъектов, их координат и картографических изображений. Таким образом, электронный газеттир, дополненный метаданными, может обеспечить ряд следующих функций электронной геобиблиотеки:

1)     определение места геообъекта по его топониму;

2)     поиск полнотекстовых документов, связанных с определенным объектом на земной поверхности;

3)     поиск объектов заданного типа, находящихся в указанном регионе.

Приобретают важное значение работы по созданию стандартов на электронный газеттир и форматов обмена газеттирными данными между ними. Наличие таких стандартов и форматов обеспечит возможность взаимодействия различных геобиблиотек при поиске требуемой геоинформации. Отмечается также необходимость исследования и разработки проблем взаимозаменяемости газеттиров, обмена и слияния содержащейся в них информации [11].

 

 

  1. Заключение

 

Электронные геобиблиотеки сегодня представляют собой цифровую среду, интегрирующую вычислительные и коммуникационные.

В нашей стране с 1992 г. создается интегрированная информационная геобиблиотека, охватывающая всю поверхность Земли в виде Системы электронных карт [12]. Система электронных карт, создающаяся на основе существующих карт, космических снимков и других источников геоинформации, интегрирует имеющуюся картографическую информацию о Земле и ее регионах. Система электронных карт – это объединенная общим замыслом, упорядоченная и согласованная по содержанию совокупность электронных топографических, обзорно-географических и авиационных карт, электронных фотокарт, планов городов, аэро- и космических снимков, а также справочной информации. Электронные карты, входящие в Систему, не только сохраняют свойства традиционных (бумажных) карт по точности, полноте содержания, достоверности и наглядности, но и обеспечивают управление пространственными данными, возможность передачи картографической информации с необходимой подробностью по любым направлениям, районам и участкам местности. Они вместе представляют язык мыслей о нашей планете, позволяют моделировать и отображать обстановку в динамике происходящих событий, а также решать различные информационные и расчетные задачи [13].

Одной из базовых задач реализации Системы электронных карт является создание Базы метаданных, которая должна содержать сведения обо всех созданных, создаваемых и планируемых к созданию электронных картах и их характеристиках (кто и когда изготовил, по каким источникам, с какой точностью и полнотой содержания, в какой картографической проекции и системе координат, и др.).

Электронный газеттир, связывающий геообъекты с их топонимами, координатами, картографическими изображениями и ссылающимися на них документами, может использоваться для служб поиска геопространственной информации, представленной как в вербальном виде в документе и/или описанной метаданными. Таким образом, газеттир оказывается ядром ряда служб геобиблиотеки, обеспечивая поиск пространственной информации.

 

 

 

Литература

 

  1. National Science Foundation. Digital Libraries Initiative – Phase 2 (http://www. nsf.gov/).
  2. Hill L. Geolibraries: Integration into to the Life Cycle of Information Creation and Use (http://www4.nas.edu/cger/besr.nsf/44bf87db309563a0852566f2006d63bb/374b5a3c65f25ee3852567f d00525cf5?OpenDocument).
  3. Зацман И.М. Семантическое поле поиска геодокументов в политематических электронных библиотеках // Труды международного семинара Диалог-2000 по компьютерной лингвистике. Т. 2. - Протвино, 2000. – С. 148 – 158.
  4. Evans, John D., Query Language Requirements for a Distributed Geospatial Clearinghouse // W3C Query Languages Workshop Standarts\XML (http://www.w3.org/tands/QL/QL98/pp/fgdc.html).
  5. Друщиц В.А., Курчавова О.А. Географические названия и полнотекстовые документы по наукам о Земле // Труды международного семинара Диалог-2000 по компьютерной лингвистике. Т.2, – Протвино, 2000. – с. 109 – 114.
  6. Martynenko, Alexander. Digital Earth based on Metadata Electronic Maps Standard // Proceedings, 20th ICA International Cartographic Conference, Beijing, 2001, vol. 4, pp. 2747-2752.
  7. Мартыненко А.И., Сердюков А.А., Глазов С.А. и др. ГОСТ Р 50838-95 "Геоинформационное картографирование. Пространственные данные, цифровые и электронные карты. Общие требование".
  8. Мартыненко А.И., Сердюков А.А., Глазов С.А. и др. ГОСТ Р 51353-99 "Геоинформационное картографирование. Метаданные электронных карт. Состав и содержание", 1999.
  9. Geographic Names Information System (http://www-nmd.usgs.gov/www/gnis/).
  10. Hill, Linda L., Frew, James and Qi Zheng. Geographic Names. The Implementation of a Gazetteer in a Georeferenced Digital Library // D-Lib Magazine, 1999, Vol. 5, N 1.
  11. Digital Gazetteer Information Exchange (DGIE) (http://www.alexandria.ucsb.edu/~lhill/dgie /DGIE_website/DGIE_proposal/NSF_proposal.htm).
  12. Зацман И.М., Лютый А.А., Мартыненко А.И. Семантический поиск в электронных геобиблиотеках // Системы и средства информатики. Вып. 10. - М.: Наука, 2000. - С. 192 - 204.
  13. Martynenko A.I. The Concept of the Electronic Maps System // Proceedings, 16th ICA International Cartographic Conference, Cologne, 1993, vol. 2, pp. 1160-1163.

 

 

Traditional gazetteers and problems of creation of digital geolibraries

Nina Vasilievna Luneva

 

 

Keywords: geospatial information, metadata, place names, search of the geospatial information, service of digital geolibraries

 

Formation and development of digital geolibraries representing distributed storehouses of geodocuments and diverse spatial information stimulated statement of problems of creation of service of digital geolibraries. These services provide cataloguing the spatial data, its description with use metadata, search and retrieval, various kinds of processing of spatial information, support and development of electronic funds. The use of gazetteers of place names with metadata of geospatial information, as bases for creation of digital geolibrary is of an special interest. Within the framework of Alexandria Digital Library project an electronic gazetteer, allowing the user to establish conformity between a place name, the footprint to it, the cartographical image and coordinates of geoobject on a terrestrial surface was created. The digital geolibrary is formed on the basis of documents on Earth Sciences and the spatial geoinformation submitted also as metadata and other geoinformation. Ther underlying electronic gazetteer provides connection between geoobjects, their images, place names and metadata.The gazetteer can be used for search of the geospatial information represented both verbally in the text of the document and described by metadata and nonverbally. Thus, the gazetteer appears a nucleus of geolibrary, providing search of the spatial information on a place names, coordinates and metadata.

[1] Работа выполнена при поддержке гранта РФФИ  00-07-90154