Сборник 2001

МОДЕЛИРОВАНИЕ ГЕНЕРАЦИИ ОПИСАТЕЛЬНОГО ТЕКСТА

Е.Г.Соколова *, М.В.Болдасов **
РосНИИ Искусственного интеллекта, Москва
*   sokolova@aha.ru **  boldasov@bibraktis-apo.msk.ru

 

В статье на основе предварительного рассмотрения рекламно-информационных текстов про архитектурные памятники описываются основные явления, представленные в текстах, а также компоненты и механизмы системы генерации, которые могут отвечать свойствам описываемых текстов. Рассматриваются составляющие модели генерации -структура базы знаний и структура представления текста, которая строится авторами на основе теории риторических структур. Процесс генерации следует риторическим и структурно-тематическим правилам развертывания структуры текста и локально следует иерархии объектов в БЗ. Разложение составляющих заканчивается, когда узлами текстовой структуры становятся терминальные объекты из БЗ.

1. Введение

В статье обсуждается возможная концепция автоматизированной генерации описательных текстов на основе информации о предмете описания из Базы Знаний (БЗ). На основе предварительного рассмотрения текстов мы в данной статье только намечаем основные компоненты и механизмы системы генерации, которые могут отвечать основным свойствам описываемых текстов.

В соответствии с традицией работ в области генерации ЕЯ текстов мы выделяем стратегический компонент, направленный на формирование содержания текста, и тактический компонент, превращающий формализованное в виде последовательности семантических представлений предложений содержание текста в последовательность фраз на конкретном естественном языке (ЕЯ). Тактический генератор для русского языка, обслуживающий определенные лексические и синтаксические явления русского языка, реализован нами в проекте AGILE (Соколова, Шаров, 2000) и может быть расширен до обработки рассматриваемых текстов. Тактический генератор реализован в среде KPML (Bateman, 1997), на основе системно-функциональной грамматики Хэллидэя (Halliday, 1985). В данной статье мы рассматриваем стратегический компонент вплоть до создания последовательности SPL (Sentence Plan Language) представлений, которые являются входом тактического генератора KPML.

Объектом исследования стали тексты, описывающие памятники архитектуры, взятые нами из Интернет. Цель этих текстов - представление памятника архитектуры для широкого круга читателей. Эти тексты носят рекламно-информационный характер. Их особенность состоит в соединении специальных знаний об архитектуре, доступных широкому читателю, с предъявлением их в перспективе осмотра архитектурного памятника в обрамлении окружающего пространства и в сопровождении исторических фактов. Эти тексты не являются специальными текстами, которые обычно становятся объектом моделирования в прикладной лингвистике (Гердт, 1969)1.

Структура текста обычно задается отдельно от фактической информации, составляющей его содержание. Так, в (McKeown, 1986) структура текста задается дискурсивной стратегией (определение, описание или сравнение), зависящей от содержания фрагмента базы данных, описывающего определенный объект, только в количественном аспекте - какого типа информации об объекте больше. В (Bateman et al. 2000) структура текста задается тематической структурой биографического описания художника, подобной понятию Generic text structure в (Hasan, 1978), полностью независимой от содержания базы знаний. Условием применимости тематической структуры является присутствие в БЗ релевантной для перечисленных тем информации, которая может быть извлечена из нее для создания текста.

В указанных проектах фокус внимания был обращен на представление структуры текста. Особенность нашего исследования состоит в том, что мы рассматриваем вопросы представления структуры текста и информации о предмете описания параллельно. Таким образом, наше исследование предполагает две части: описание источника знаний текста -БЗ и построение модели генерации текста на основе информации из БЗ и заданной структуры рекламно-информационного текста.

Составляя Базу знаний, мы имеем в виду две цели: во-первых, наполнение БЗ информацией из конкретных текстов позволит уточнить понятия об архитектурном памятнике, которыми пользуются создатели таких текстов; во-вторых, построение формализма задания знаний системе. Известно два метода решения второй проблемы -структурный и декларативный. Структурный метод базируется на механизме декомпозиции объектов в семантическую сеть (Quillian, 1968). Декларативный метод использует формализм дескриптивной логики (Baader, 1999). Он позволяет гибко описывать непротиворечивые базы знаний, однако не очень удобен для их задания пользователем. Метод семантических сетей несколько сужает формализм дескриптивной логики (он может быть описан последним, но не наоборот), но представим в удобной графической форме для разработки и задания знаний пользователем. При построении формализма задания знаний мы взяли за основу структурный метод описания и выходим за его пределы лишь в одном случае - для задания фактов. В полученной структуре ПО используются понятия классов и связей, свойств и компонент, родовых компонент и понятий, выделяются различные типы связи. БЗ описывается в разделе 5.

В результате анализа текстов выявляется структурная и тематическая организация описательных текстов для ПО описания памятника архитектуры. В тексте выделяются интродукция, тело и заключение. Если интродукция и заключение носят риторический характер - представление предмета описания и выход из текста, соответственно, то тело, содержащее описание экстерьера и интерьера памятника, а также исторические факты, в основном следуют структуре БЗ. В разделе 2 кратко описывается структура рассматриваемых текстов.

Для представления структурно-тематической структуры текста в разделе 3 нами рассматриваются RST-like структуры, предложенные в (Bateman et al., 2000) как расширение риторических отношений (RST - Rhetorical Structure Theory (Mann et Thompson, 1986) за счет участия в структуре тематических отношений. В данной статье мы продолжаем расширение RST-like структуры до включения в нее в качестве узлов объектов, соответствующих терминальным понятиям БЗ, и соединяя их семантическими отношениями, близкими по содержанию функциям Upper Model системы KPML (Bateman et al., 1995). Мы называем их UM-like отношения. Таким образом, достигается интегральное представление текста от риторических сегментов, организованных в RST-структуры текста, до объектов, распределение которых в тексте связано с моделированием связности и номинации объектов в тексте.

В разделе 4 обсуждаются вопросы лексической базы (ЛБ) системы. ЛБ должна обеспечивать номинацию объектов в тексте. Выделяются некоторые типы лексических значений, передаваемых различными номинациями одного и того же объекта.

 

2. Структурно-тематическая организация описательного текста

Описательные тексты в регистре архитектурных памятников включают следующие структурно-тематические части: интродукция, тело текста, представляющее экстерьер, интерьер памятника и исторические справки, и заключение. В больших текстах, объемом в 1 страницу и более, описание интерьера может выделяться в отдельный раздел. В кратких текстах эти части различаются только тематически. Каждая структурная часть имеет свою организацию.

Первой и важной структурно-тематической частью текста является Интродукция. В интродукции вводится главный описываемый объект - архитектурный памятник, который задается своим именем. Выявлено два вида интродукций - прямая интродукция и интродукция через ориентир. Прямая интродукция состоит из двух частей: "собственно интродукции" и "дополнения", связанных между собой риторическим отношением Elaboration, при котором сателлит представляет дополнительные детали или элементы содержания к ситуации, представленной в ядре. Дополнение мотивируется риторически: кроме указания имени памятника в интродукции надо сообщить о нем какие-либо общие ориентирующие сведения в соответствии с общим строением повествовательных текстов. Предметный характер дополнения может быть различным и зависит от информации, имеющейся в БЗ, например, квалификационный, который вводится элементом "Highest_significance". Объект может характеризоваться с качественной (art-area, architector, art-masterhood, style) или исторической стороны (oldest), например,

Андреевскую церковь часто называют лебединой песней (bighest_significance) выдающегося мастера отечественной архитектуры Бартоломео Растрелли.(architector). Возвышается она на одной из круч Старокиевской горы. С ее террасы открывается неповторимый вид на древний Подол, заднепровские дали, новые жилые кварталы.

(Между тем,) церковь Воскрешения Лазаря - одно из самых старых деревянных строений России, сохранившееся до нашего времени.- ( highest_significance, oldest)

Введение квалификационного объекта сопровождается указанием деталей из БЗ -архитектор, эпоха, стиль, создатели для квалификационной характеристики, и material, geo-area - для исторической. Может добавляться оценка объекта с точки зрения гармонии с окружающей средой. Причем может оцениваться как перспектива окружающего пейзажа (view-from), так и сам памятник в обрамлении окружающего пространства или региона (view-on), например, утверждение о неповторимом виде с Андреевской церкви (см. выше) , церковь является визитной карточкой Крыма.

Дополнение может просто добавлять общую фактическую информацию, например, год постройки, легенду, связанную с постройкой. В этом случае архитектурный памятник не характеризуется как highest-significance.

Локативный переход включает в описание окружающее пространство памятника.

Наиболее частым видом перехода к объекту в текстах гидов является динамический -"путь", по которому зритель достигает самого памятника. Наиболее частым видом пути является движение по улице, ведущей от предыдущего памятника к актуальному. В случае восточного храма путь может быть представлен церемониальной аллеей. Например,

A grand gateway marks the entrance to the grounds of the 1927-built Cao Dai Cathedral

Beyond it, a wide boulevard escorts you past a swathe of grassland used on ceremonial occasions, to the wildly exotic cathedral itself, over whose left shoulder rises distant Nui Ba Den, Black Lady Mountain.

 

В туристском путеводителе по городу памятники архитектуры, как правило, вводятся именно таким образом, например,

From Market Place, it's a five-minute walk up the steep and cobbled Saddler Street to the majestic Durham, facing the castle across the manicured Palace Green.

Другим локативным способом перехода к описанию памятника является статический, например,:

At the far end of Deansgate stands the small, Perpendicular Cathedral, the third church on this site since its foundation in the ninth century.

Рядом с летней Преображенской церковью построена зимняя церковь Покрова Пресвятой Богородицы.

Объект может быть представлен через собственную свою часть, привлекающую внимание зрителя. В этом случае далее описывается зрительский эффект, который создается этой частью, например,

The Cathedral sits solidly on the foundations of the Inca Viracocha's palace, its massive lines looking fortress-like in comparison with the delicate form of the nearby La Compania.

With its pointed, tiled twin towers, Guadalajara's Cathedral is a bizarre but effective mixture of styles.

Историческая справка иногда представляет собой отдельный раздел описания - абзац, иногда перемежается с описанием художественных и конструкционных деталей памятника. В данной статье мы не рассматриваем исторические справки.

 

Тело описания представляет экстерьер и интерьер архитектурного памятника. В зависимости от размера текста, памятник представляется более или менее полно. Тело текста может начинаться с описания зрительно воспринимаемого облика памятника, который может быть задан непосредственно, например,

Облик Преображенской церкви монументален и прихотлив Ее пирамидальный силуэт при близком рассмотрении струится многочисленными изгибами главок, бочек, подзоров и крестов.

Облик может быть задан также через стилевые характеристики, например,     

Андреевская церковь - одна из самых ярких построек стиля барокко,... . Для барочных сооружений характерны парадность, эффектность, живописность и динамичность архитектурных форм, богатство декора, яркая окраска стен, обилие позолоты.

Описание экстерьера далее развертывается от основания храма, которое определяет членение объемов церкви и составляет основу здания, через перечисление основных особенностей самого здания к описанию верха (например, организации куполов). После такого представления здания в целом следуют детали декора, конструктивные решения и т.п.

Частым риторическим приемом перехода к части текста, описывающей интерьер, служит подчеркивание единства черт экстерьера и интерьера, например,

Тот же принцип декора сохранен и в интерьере   

The eclectic ideology of Cao Daism is mirrored in the interior.

Интерьер обычно начинается с представления внутреннего объема как целого или в виде описания внутреннего пространства по определенному маршруту или выделенным объектам (Кобозева, 1995, 1997, 2000), далее следуют описание функционально значимых объектов (иконостас), детали.

Тело описательного текста создается в тесном взаимодействии стратегии описания информации, представленной в БЗ. Именно последняя определяет содержание текста. Заключения также бывают нескольких типов.

Заключение-резюме по структуре и тематике похоже на интродукцию. Сравните интродукцию (см выше) и заключение в описании Андреевской церкви:

По своей художественной выразительности, смелости и оригинальности замысла
Андреевская церковь является одним из шедевров отечественного зодчества XVIII века
Совершенство линий, четкие пропорции, удивительная гармония форм и окружающего
ландшафта принесли этому памятнику всемирную славу. В 1968 году Андреевская церковь
объявлена музеем.   

Если в интродукции указываются художественные особенности в целом (например, стиль), то в заключении указываются конкретные черты (например, четкие пропорции) и наоборот, если с точки зрения локативной организации в интродукции указываются конкретные детали (вид на древний Подол), то в заключении подчеркивается "удивительная гармония форм и окружающего ландшафта". Заключение-резюме может заканчиваться характеристикой актуального состояния памятника.

Другой вид заключения - переход, концентрируется на объекте, позволяющем перейти к следующему объекту описания (следующему архитектурному памятнику), например, отсутствие печи в описываемой церкви - на стоящую неподалеку зимнюю церковь, в которой печка есть, выход во внешнее пространство для перехода к следующему строению и т.п.

3. RST-like2 структуры, UM-like отношения

Удобным представлением структуры текста является представление в терминах RST-hke структуры, которая строится на основе риторических структур (RST - Rhetorical Structure Theory), предложенных в (Mann et Thompson, 1987). RST-like структуры предложены в (Bateman et al., 2000) добавлением тематических отношений к риторическим.

RST обеспечивает коммуникативно-функциональную декомпозицию текста на все более мелкие сегменты, таким образом, что в результате получается структура составляющих текста. Структура описывается в терминах риторических отношений между сегментами. Это функциональная теория в том смысле, что сегменты выделяются как функциональные скорее, чем текстовые, т.е. не предполагается конкретная грамматическая или лексическая реализация связей между сегментами. Основное положение RST состоит в том, что связываемые сегменты текста, как правило, неравноценны между собой в смысле их важности с точки зрения целей автора, поэтому двум связываемым сегментами придается различный статус: один из них считается ядром - т.е более важным, второй называется сателлитом, т.е. спутником, слугой. Таким образом, большинство риторических отношений, выделяемых в стандартной RST теории - асимметричные или гипотактические. Общее правило выделения главного фрагмента - тест на его удаление из текста: тот фрагмент, удаление которого не нарушает общей связности текста, считается сателлитом. Отдельные риторические отношения, например, Joint являются симметричными или паратактическими.

Структура теста графически представляется следующим образом: сегменты текста (ядра и сателлиты), представляющие разложение текста по составляющим, обозначаются горизонтальными линиями, ядра помечаются вертикальными линиями, а сателлиты связаны с ядром размеченными дугами, изображающими риторические отношения.

В данной статье в качестве средства представления структуры текста мы рассматриваем также модификацию RST - RST-like2 структуры. Как и RST-like структуры мы заимствуем формализм RST и риторические отношения, определенные в этой теории. В RST-like структуре Бейтмана добавляются тематические отношения между сегментами текста на самом высоком уровне структуры, где они соотносятся с тематической структурой текста (Bateman et al. 2000). В RST-like2 структурах мы вводим структурно-текстовую и тематическую разметку составляющих (в RST и RST-like разметка составляющих не используется). Обычно структурно размеченная составляющая (например, дополнение) далее развертывается в структуру тематически размеченных составляющих (например, Локализация и Вид_с). Текст развертывается на составляющие вплоть до отдельных высказываний, или пропозиций. Однако форма структуры пригодна для того, чтобы продолжить моделирование до объектов БЗ. Узлами становятся объекты БЗ и их наборы, которые при реализации соответствуют уже не пропозициям, а членам предложения, например, обстоятельство места, подлежащее. Соответственно меняется характер отношений - это семантические отношения между объектами. Мы полагаем, что многие из них могут быть представлены семантическими функциями из Upper Model (Bateman et al., 1995) используемыми в системе KPML. UM-like отношения -гипотактические, т.е. один объект в отношении является главным, другой - зависимым. Развертывание структурно-тематической пропозиции текста, в структуру, организующую отношения между объектами, может задаваться специальными правилами. Ниже приводится неформальное описание нескольких таких правил:

Локализация есть соединение двух объектов отношением :spatial-locating-like, причем зависимый объект является в БЗ местоположением главного объекта.

Собственно интродукция 1 есть присоединение к объекту-памятнику, значений основных свойств памятника с помощью стандартного отношения, являющегося функцией от семантического типа присоединяемого объекта.

Собственно интродукция 2 есть присоединение к объекту-памятнику значения Highest significance. Присоединение дополнительных объектов к значению Highest significance происходит по ЛБ.

Вид с есть присоединение объекта, представляющего "смотровую площадку" памятника, к highest-significance (view) отношением :source DM в качестве первого зависимого и одновременное присоединение объекта, описывающего видовое окружение памятника, отношением :destination-like в качестве второго зависимого.

Различие между UM отношением и UM-like отношением состоит в следующем. UM отношение может реализоваться "грамматической" лексемой. Например, отношение um-identity в KPML реализуется глаголом - связкой, в русском языке - есть (в настоящем времени опускается), в английском - is. Отношение :spatial-locating оформляет обстоятельство и реализуется в русском языке предлогами на и в, в соответствии с семантикой привязываемого объекта, а в английском - at, on, т и т.д. Мы определяем :spatial-locating-like отношение для обозначения связи между объектом и локативом, которая в категориях предложения выражается двумя функциями UM: в виде сказуемого предложения - типом процесса - non-directed-action и его семантикой, здесь присутствующей по умолчанию; отношением :spatial-locating между сказуемым и вторым объектом. В этом случае значение :spatial-locating-like выражается лексемой, например, -глаголомнаходиться. Одно двухместное UM-like отношение, таким образом, представляется фрагментом SPL структуры:

:spatial-locating-like (KB-objectl, KB-object2) => (propositionX / non-directed-action

;Lex (находиться) :Actor (KB-objectl) :spatial-locating (KB-object2)).

Рисунок 1 Преобразование UM-like отношения между объектами в SPL структуру.

Формулу, приведенную на рисунке  1, можно прочесть приблизительно следующим образом: семантическое отношение типа пространственной локализации между объектами KB-object1 и KB-object2 реализуется в виде ЕЯ предложения, в котором сказуемое является ненаправленным действием, объект, вовлеченный в действие (в данном случае будет реализован как подлежащее), представляет KB-objectl, а обстоятельство места представляет KB-object2.

Таким образом, RST-like2 структура состоит из неоднородных составляющих и отношений. Задается три типа составляющих:

  • структурно-текстовые, например, собственно интродукция, дополнение.
  • тематические, например, локализация, вид_с.
  • объекты - заполняются по БЗ - Андреевская церковь, Highest-significance, art-area и т.п. Задается два вида отношений:
  • RST отношения - отношения стандартной RST теории;

    UM-like отношения - семантические отношения между объектами БЗ.

В данной статье предложение RST-like2 структур и UM-like отношений носит иллюстративный характер. В частности, они могут быть разделены формально в связи с качественным различием как узлов, так и отношений. Здесь нас привлекает возможность непосредственного присутствия объектов в представлении текста. Пример RST-like2 структуры показан в Приложении 1.

4.  Лексическая база

ЛБ является языковым источником текста. Если БЗ представляет собой источник фактических сведений из ПО, включая имена собственные объектов, конструкцию объекта, историю и т.д., то ЛБ содержит семантические типы и их конкретные и родовые номинации в тексте на конкретном языке. ЛБ соединяет объекты БЗ с текстом. В системах генерации вопросы номинации объектов часто решаются простейшим способом: существует единственная номинация, заимствованная из БЗ, или сопоставленная объекту в словаре, например, (Bateman et Teich, 1995); учитывается повторное упоминание объекта для постановки артикля в артиклевых языках (AGILE), моделируется номинация анафорическим местоимением (McKeown, 1986). Вопросы номинации объектов в тексте стали исследоваться относительно недавно. Специфика рассматриваемых текстов состоит в постоянстве объекта описания (архитектурный памятник или его составляющие), поэтому выбор номинации осуществляется на основе ассоциативных характеристик, а участие модели говорящего и слушающего, которые существенны для референции при анализе (см., например, (Толдова, 2000)), не требуется. Поэтому ЛБ для системы генерации должна включать ассоциативные связи. Рассмотрим примеры номинации церкви в описаниях русских церквей:

Церковь как объект: церковь, храм, памятник, здание, сооружение, постройка, строение.

Типы церквей: парадный торжественный храм, северная деревянная церковь, традиционная многоглавая круглая церковь "о двадцати стенах" с двадцатью двумя главами, летняя церковь, холодный летний храм, зимняя церковь(храм) , теплая церковь.

Эмоционально-зрительные номинации: церквушка, бревенчатая громада.

Характеризация как объекта высочайшей значимости: лебединая песня, замечательный памятник, шедевр, одно из самых старых деревянных строений.

Имя: церковь Покрова Пресвятой Богородицы = Покровская церковь, церковь Спаса Преображения = Преображенская церковь, церковь Воскрешения Лазаря, Андреевская церковь.

Выбор лексемы в системе KPML и в других системах генерации осуществляется по набору признаков называемого объекта. В данном случае, тоже можно предложить некоторые признаки. Например, сооружением называется здание, характеризующееся сложностью и прихотливостью конструкции, в отличие отздания, которое этим признаком не обладает. Выделенные признаки - предметные знания, реализуемые посредством выбора лексемы. С другой стороны, характеристика памятника как предмета высочайшей художественной значимости, требует уточнения области значимости. В частности, "лебединой песней"можно назвать памятник, характеризуя его как выдающийся экземпляр определенного автора, а не эпохи, замечательный памятник - как выдающийся экземпляр эпохи, а шедевр - и того и другого. Это семантика характеристики высочайшей значимости, реализуемая синтагматически, т.е. зависимым словом. Таким образом, ЛБ должна содержать сведения ассоциативного и семантического типов.

ЛБ непосредственно участвует в создании предложения по заданной информации из RST-like2 представления текста и БЗ. Указанные в RST-like2 наборы объектов должны быть представлены в виде SPL представлений. Один из возможных видов правил перехода от UM-like отношений с семантикой отношения к SPL представлению показан на рисунке 1 в разделе 3. Лексикализация глагола с семантикой отношения зависит от языковой семантики, свойств соединяемых объектов и перспективы высказывания. Для рассмотренного примера могут быть предложены глаголы находиться и располагаться, характеризуемые в SPL с точки зрения языковой семантики как ненаправленное действие. В рассматриваемом тексте это отношение реализовано глаголом возвышаться, передающем, с одной стороны, физические параметры связываемых объектов - высокое строение и возвышенное место, с другой стороны, перспективу зрительного восприятия. Другие примеры с глаголами с перспективой зрительного восприятия - церковь лепится (к краю скалы), виднеется.

При генерации необходимо также учитывать разложимость реализаций, которая должна описываться в терминах SPL. В частности, имена церквей, как правило, являются разложимыми и представляют имя собственное, слитое с классификатором типа, "Андреевская церковь", либо идентификатор, представленный конкретным типом и элементами места положения, например, "дом на Пречистенской набережной".

5. Структура предметной области и базы знаний

При создании БЗ преследовлась цель отразить в ней идеационную, т.е. фактическую, составляющую содержания текста, и исключить риторическую компоненту.

В результате была построена вполне законченная toy-модель ПО, пригодная для исследования и проектирования этапов генерации текстов на ЕЯ. Модель описана диаграммой классов, соответствующих объектам ПО. Проектирование концептуально целостной модели позволило лучше понять описываемые конструкции и разработать общий подход для представления знаний о предмете описания в расчете на их дальнейшее использование в генерации описательных текстов. Такое проектирование позволит также лучше инсценировать дальнейшие преобразования данных, представленных в ПО, и четче разработать дальнейшие структуры и процессы.

Разработанная метода описания Модели Предметной Области (МПО) основана на
формализме семантических сетей, разработанном в (Quillian, 1968). Структура БЗ - это
ориентированный граф, состоящий из узлов и дуг. В (Quillian, 1968) выделяется три типа
узлов: концепты, объекты и свойства. Мы тоже выделяем три типа. Это компоненты,
свойства и объекты. Различие состоит в трактовке этих типов.

Компоненты и свойства мы отличаем от объектов, объединяя их понятием класс. Класс, это структура, которая описывает некоторое множество объектов, их обобщенную структуру. В классе содержится информация, как уточнить его до описания конкретного объекта ПО. Такие уточнения называются объектами. С объектами мы сталкиваемся, когда реализуем структуру ПО в БЗ.

Классы могут быть свойствами и компонентами. Компонентам соответствуют понятия ЕЯ. Они отражают объекты ПО, которые могут быть выделены как самостоятельные ее части. К компонентам можно отнести такие классы как, корпус, купола, помещение, предмет интерьера. Свойства же, определяют классы-характеристики объектов ПО и без объекта не существуют. В отличие от (Quillian, 1968), понятие "свойство" в нашей модели представляет собой объект той же степени сложности, что и понятие. Это означает, что свойства обладают тоже сложной внутренней структурой, их нельзя определить только числом или строкой. В построенной нами опытной МПО были выделены свойства характеристики именования объекта, характеристики времени, количества, размера, объема, субъективные оценки, характеристики расположения в объемлющем предмете, а также некоторые специфичные для рассматриваемой ПО характеристики, такие как, характеристика освещенности, причин, целей, результатов преобразований здания, характеристика национальности и профессии физического лица.

По МПО пользователь строит БЗ, создавая экземпляры классов (объекты), заполняя атомарные свойства значениями. Процессы генерации текста имеют дело уже с БЗ (а не с МПО). Но вместо понятия ПО часто используется понятие базы знаний, если не важно, говорим ли мы о заполненной БЗ или еще о МПО. Понятия класса и объекта тоже могут перемешиваться в случае, если не имеет значения, говорим ли мы о классе или о его экземпляре.

БЗ можно рассматривать как последовательную декомпозицию классов. Декомпозиция разбивает структуру на уровни. Уровень - это множество классов компонент, или множество классов свойств, которые имеют один и тот же объемлющий класс. Каждый уровень состоит либо из свойств, либо из компонент. Этим разделяется декомпозиция компонент от декомпозиции свойств. Такой подход позволяет собрать и хранить информацию о предмете и его свойствах в удобном виде для последующего стратегического планирования текста.

Говоря о дугах сети БЗ, мы имеем в виду связи, которые ссылаются на объемлющий и подчиненный классы. Все связи в БЗ направленные. Направление естественным образом задается от объемлющего к подчиненному классу. В связи может участвовать несколько однотипных зависимых объектов. Тогда такая связь называется "от одного ко многим". Если в связи всегда участвует только один зависимый класс, то такая связь называется "от одного к одному".

В ( Quillian, 1968) рассматривается два типа дуг: ребра типа свойства и ребра типа IS-A. Мы выделяем следующие типы связей: структурные (к объектам) и внутренние (к свойствам) связи, общие и дополнительные связи (классификация в рамках структуры описания перечислимых компонент; дополнительные связи содержат уточнение альтернативой и принадлежат только альтернативе, указанной в уточнении), связь к другим уже существующим объектам (эквивалентно понятию ссылки на объект в объектно ориентированном подходе (ООП)), внешние связи (дополнительные связи между классами структуры, устанавливаемые пользователем над общей структурой).

Для выявления типов связей использовались результаты обработки базового корпуса текстов. Значительную помощь в выявлении типов связей оказала работа (Ованесбеков, 1997), в которой были изложены основные идеи его теоретического исследования метафорных схем применительно к созданию БЗ общего назначения.

Адаптируя теорию (Ованесбеков, 1997) к нашей задаче, мы выделяем среди классов МПО классы перечислимого типа (или родовые классы). Перечислимые узлы содержат в себе набор альтернатив (или конкретизации), из которых в БЗ может войти одна или несколько. Сам перечислимый класс как узел сети МПО может иметь внутреннюю структуру. Тогда эту структуру имеют все ее альтернативы. Структура перечислимого узла представляется как базовая структура для его альтернатив, в любой из которых она может быть расширена.

Перечислимый класс можно рассматривать как вкрапление механизма наследования в иерархическую МПО. С этой точки зрения он представляет одно звено цепочки наследования классов: от собственно перечислимого класса к альтернативам. Механизм наследования - один из теоретических концептов ООП, широко применяемого в современных языках программирования. Его суть - наследование объектами-потомками свойств (в нашем случае внутренних и структурных связей) объектов родителей. Таким образом, можно построить удобную структуру уточнения внутренней иерархии объекта. Объединяя все классы иерархии МПО в структуру наследования, мы получаем также удобное средство группирования объектов с последующей возможностью ссылки на полученные группы из других областей структуры ПО.

Часто, если два объекта связаны отношением "от одного ко многим", подчиненные объекты группируются по одному или нескольким свойствам и создается новая структурная именованная единица, которая наследует большинство свойств компонент. Простейший пример того - объединение мастеров-плотников в именованную группу артель. Отдельные плотники могут и не фигурировать в тексте, в то время как упоминание группы артель встречается. Существуют и более сложные формы агрегации. Например, картины по художнику, предметы интерьера по стилю и т.д. Очевидно, такие компоненты вписываются в общую концепцию нашего подхода, но их явное добавление в структуру очень сильно "утяжеляет" схему БЗ: слишком велико количество вариантов последовательной композиции простых объектов в агрегированные. Поэтому было решено рассматривать агрегацию как дополнительную операцию, которую может сделать пользователь над МПО при ее заполнении. Он должен задать только свойства, по которым будет произведена агрегация, и может также задать имя получившегося объекта.

Некоторые из конкретизации МПО ограничивают структуру родового объекта, определяя некоторые из их свойств. Например, конкретизация "пятиглавый храм" задает свойство "церкви" "Купола.ОбщееКоличество" = 5. Это обстоятельство заставляет взглянуть на построенную модель с позиций дескриптивной логики и принять механизм задания фактов. Действительно, можно провести последовательное соответствие модели семантических узлов модели дескриптивной логики. Связи можно сопоставить с отношениями, классы с понятиями и т.д. В результате мы получим возможность описывать факты на языке логики. Например, разобранный выше пример можно записать так:

<церковь>л< Купола.ОбщееКоличество .5> -> < пятиглавый храм >

Несмотря на семантику разделения классов на компоненты и свойства, не все компоненты могут рассматриваться как независимые объекты в БЗ. Примером могут послужить такие компоненты как этаж, купол или окно в отрыве от объекта церкви, частью которой они являются. Независимыми являются церковь, предмет интерьера, geo-object. Им соответствуют понятия рассматриваемой ПО. Часто понятия ПО представлены в БЗ в виде перечислимых классов. Такие объекты мы будем называть родовыми понятиями, а их альтернативы будут понятиями. Сейчас выделено два абстрактных понятия Архитектурный памятники Предмет интерьера, а также их уточнения Церковь, Здание, и Икона, Иконостас, Алтарь соответственно. Класс Предмет интерьера входит в модель декомпозиции Архитектурного памятника. Понятие Архитектурный памятник является центральным понятием построенной нами БЗ.

Еще один важный вопрос, который встает при составлении БЗ, это как будет представлена информация, находящаяся на "листьях" структуры, то есть в классах, которые не участвуют в связях как объемлющие объекты.

Если этот класс - компонента, то вся информация, представляемая им, содержится в его типе и имени, которые будут соответствующим образом трактованы в дальнейших этапах генерации ЕЯ-текста планировщиком текста и предложений. Иначе обстоит дело с классом свойством. Построенная БЗ, а также анализ результатов работы (Ованесбеков, 1997) показали, что можно выделить две группы свойств, встречающиеся в ПО: свойства-атрибуты, и свойства-предикаты.

Среди свойств первой труппы    мы выделяем    свойства типа Number, String, United Number, Date и Boolean.

Вторая группа задает набор типов, которые ссылаются на UM-Like отношения и часто входят в RST-like структуры как терминальные составляющие. Такие типы напоминают функции процедурных языков программирования от параметров-классов - участников UM-Like отношений. Как и в языках программирования, выделяются параметры по значению и по ссылке.

Среди набора типов второй группы особо выделяются типы Enumeration. В БЗ часто встречаются характеристики, которые задают свойство одним (или несколькими) вариантами прилагательных форм или словосочетаний, эквивалентных им. Например, характеристика объема может содержать следующие варианты: столпообразный, единый архитектурный объем, светлый, нарядный, мажорный, монументален, прихотлив и т.д.

Список Enumeration'a открыт для пополнения пользователем (мы не состоянии перечислить все возможные характеристики, которые может иметь объект). Пока что мы не готовы предложить простой механизм пополнения этого списка, но надеемся, что дальнейшие исследования помогут нам это сделать.

В Приложении 2 находится пример заполненной БЗ, соответствующий тексту интродукции. Особое внимание хочется обратить на присутствие в БЗ ссылок на внешние для нее объекты, такие, как одна из круч Старокиевской горы, Подол и жилые массивы.

6. Направления исследований

Мы только очертили основные свойства текстов, существенные для моделирования их автоматической генерации, и наметили способы и средства реализации системы. При продолжении исследований предполагается анализ корпуса текстов на нескольких языках, разработка языковых ресурсов и формальных средств для реализации намеченных модулей.

Смежным направлением исследований является конструирование различных вариантов типографской страницы (с иллюстрациями) из данной RST-like структуры. Отдельный интерес представляет оформление текста в виде страницы. Мы планируем адаптировать методику формирования страницы в соответствии с коммуникативной целью текста (рекламно-информационная), которая изложена в работе (Bateman et al., 2000). В работе предложена стратегия формирования из одного RST-like представления структуры текста различных презентационных решений, основанных на коммуникативной цели автора.

 

1 В статье А.С.Гердта только вводится термин "специальный текст", однако не определяются его свойства. Между тем, определение свойств текста, делающих его более или менее доступным для моделирования, заслуживает специального исследования.

Литература

Гердт, А.С., 1996. Специальный текст как предмет прикладного языкознания. В книге: прикладное

языкознание. СПб.: Изд-во С.-Петербург. Ун-та. 68-90. Кобозева,   И.М.,   1996. Как   мы  описываем  пространство,   которое  видим:   проблема  выбора

"ориентира" // Труды международного семинара по компьютерной лингвистике и ее приложениям

"Диалог'95". Казань. 146-153. Кобозева, И.М., 1997. Как мы описываем пространство, которое видим: композиционные стратегии

// Труды международного семинара по компьютерной лингвистике и ее приложениям "Диалог'97".

М. 132-136. Кобозева, И.М., 2000. Как мы описываем пространство, которое видим: форма объектов // Труды

международного семинара по компьютерной лингвистике и ее приложениям "Диалог'2000".

Протвино. 155-161.
Ованесбеков, Л., 1997. База знаний МЕТ. Научный отчет,          

http://bur.oivta.ru/IHPCS/MET/The-Project.win.html Соколова, Е.Г., Шаров С.А., 2000. Многоязыковая генерация руководств пользователя на славянских

языках.   //Труды   Седьмой   национальной   конференции   по   искусственному   интеллекту   с

международным участием КИИ'200. Москва: Издательство физико-математической литературы,

409-417.

Толдова  С.Ю.  2000.  О  когнитивном  подходе  к некоторым  проблемам референции // Труды

международного семинара по компьютерной лингвистике и ее приложениям "Диалог'2000".

Протвино. 282-289.

Baader, F. 1999. Logic-based Knowledge Representation,

ftp://www-lti.informatik.rwth-aachen.de/pub/papers/1999/Baader-LNAI-1999.ps.gz Bateman, J.A., Teich, E., 1995. Selective information presentation in an integrated publication system: an

application of gendre-driven text generation, Information processing and Management: an international

journal, 31(5), 753-768. Bateman, J.A., Henschei, R. et Rinaldi, F., 1995. The generalized Upper Model 2.0, Technical Report,

GMD/IPSI, Darmstadt, Germany. Bateman, J.A.,  1997. Enabling technology for multilingual natural language generation: the KPML

development environment. Natural Language Engineering, 3(1). Bateman, J.A., Kamps, Th., Kleinz J. et Reicheberger, K. 2000. The Dart(bio) system: constructive text,

diagram and layout generation for information presentation. (submittedO Halliday, M.A.K., 1985. Introduction to Functional grammar. London: Edward Arnold. Hasan, R.,1978. Text in the systemic-functional model. In W. Dressier (ed.), Current trends in text

linguisticsy. Berlin: de Gruyter, 228-246. Mann, W.C. et Thompson S.A, 1986. Relational propositions in discourse. Discourse processes 9 (1), 57-

  1. McKeown, K.R., 1986. Discourse strategies for generating natural language text. In: Readings in natural

language processing. Morgan Kaufmann Publishers. 479-498. Quillian, M. Semantic memory. 1968. In Minsky (ed.), Semantic Information Processing, MIT Press,

Cambridge, Mass. 216-270.   

Model for descriptive texts generation
Michael V. Boldasov, Elena G. Sokolova

In the paper we present results of preliminary research aimed to modeling descriptive text generation. We consider texts of guides describing architecture monuments - churches, houses, describe their main features and sketch some means and components of possible generation system. The texts have specifics consisting in their intermediate state between special descriptive texts for a narrow domain and artistic texts. We sketch language phenomena to model in the system. We consider only modeling strategy since we plan to use our experience in NL realization from previous project by means of KPML system. In the paper we consider the main steps of generation process and appearing problems: knowledge base representation, text representation structure, which was developed from rhetorical structure theory. Generation process is based on rhetorical and thematic text development rules. It is based also on KB (Knowledge Base) objects hierarchy. Components decomposition is finished when terminal KB objects become nodes of text structure.