Сборник 2002

ФУНКЦИОНАЛЬНАЯ СЕМАНТИКА В КОМПЬЮТЕРНЫХ РЕШЕНИЯХ[1]

 

 

Е. Б. Козеренко

Институт проблем информатики РАН

kozerenko@mail.ru

 

 

Ключевые слова: естественноязыковой процессор, многоязычная среда, представление знаний, расширенные семантические сети, функциональное значение, взаимодействие синтаксиса и семантики, машинный перевод.

 

В работе рассматриваются вопросы моделирования функциональных значений конституентов предложения естественного языка в процессе решения задач компьютерной обработки естественноязыкового текста в многоязычной ситуации (извлечение знаний, машинный перевод). Исследованы грамматические понятия, выражаемые глагольными формами в русском, английском и итальянском языках, в частности "зависимый таксис", выражаемый деепричастиями в русском языке, Participle в английском и Gerundio в итальянском языке. Внимание к этим языковым явлениям вызвано сложностями, которые возникают при автоматическом понимании и переводе полипредикативных комплексов. Для разработки естественноязыковых процессоров в качестве основного направления лингвистического моделирования предлагается построение унифицированных функционально-семантических представлений базовых концептуализаций, отражаемых в грамматических системах рассматриваемых языков.

 

 

  1. Введение

 

Данная работа посвящена вопросам моделирования функциональных значений конституентов предложения естественного языка в процессе решения задач автоматического анализа и порождения естественноязыкового текста в многоязычной ситуации (извлечение знаний, машинный перевод).

При этом внимание уделено языковым средствам, отражающим порядок действий, временные отношения между действиями: одновременность/неодновременность, соотношение главного и сопутствующего действия (для различных типов предикатов), т.е. такой языковой категории, которая в лингвистике известна как "таксис" (Р.О. Якобсон), "порядок" (Л. Блумфилд), "временная соотнесенность" (А.И. Смирницкий) [1-3]. Исследованы грамматические понятия, выражаемые глагольными формами в русском, английском и итальянском языках, в частности "зависимый таксис", выражаемый деепричастиями в русском языке, Participle в английском и Gerundio в итальянском языке. Определяются соотношение и взаимосвязи центральных и периферийных компонентов таксиса как функционально-семантического поля на материале систем грамматических форм и их реализаций в линейном тексте на указанных языках. Рассматривается взаимодействие значений этой категории с причинно-следственными, уступительными и другими значениями адвербиального типа.

Опыт проектирования и разработки естественноязыковых процессоров для систем, основанных на знаниях (ДИЕС, ИКС, ЛОГОС-Д - инструментальные среды разработки интеллектуальных систем с естественноязыковым интерфейсом, в том числе многоязычным), позволяет нам утверждать, что основным направлением лингвистического моделирования должно быть построение функционально-семантических инвариантов для основных концептуализаций, выражаемых в грамматических системах рассматриваемых языков.

Проблеме разработки семантико-синтаксических представлений посвящены работы отечественных и зарубежных лингвистов [1-22], в которых предлагаются различные типы моделей: формальные, логические, функциональные, когнитивные. Однако, реальные задачи настоящего момента, связанные с компьютерными реализациями, требуют выработки некоторого "синтетического" подхода, использующего как достижения теоретической лингвистики, так и опыт практической реализации систем обработки естественного языка.

Предлагаемый подход заключается в построении унифицированной модели функциональных значений синтаксем, учитывающей сдвиги значений, производимых трансформациями. Выбор главного объекта исследования и моделирования - предикатных выражений, т.е. финитных и нефинитных глагольных форм и других слов, образующих предикацию в предложении, обусловлен тем, что эти языковые единицы "держат" структуру предложения, и, соответственно, являются предикатными вершинами внутреннего представления знаний в структурах базы знаний, объединяющими произвольное число аргументов, которые в свою очередь, также могут являться предикатными вершинами вложенных структур.

Самые сложные ситуации при разработке процедур автоматического синтаксического анализа связаны именно с аргументами, являющимися глагольными фразами, поскольку при этом требуются специальные механизмы разрешения "глагольного конфликта", когда программа разбора может спутать аргументы различных глагольных вершин. Разрешение конфликта должно поддерживаться специальными эвристиками, которые вырабатываются в процессе лингвистического моделирования.

 

 

  1. Средства выражения аспектуально-таксисной ситуации

 

В основе грамматических структур лежат когнитивные структуры (модели, сущности, фреймы). Грамматика, таким образом, – это модель ментальных фреймов [15]. В ядре грамматической категориальности заложены системно-языковые основания единств типа функционально-семантического поля. Понятие функционально-семантического поля отражает явления взаимодействия элементов разных языковых уровней, в полной мере раскрывающихся при их функционировании в речи [1]. При исследовании семантики функционально-семантического поля таксиса выделяют ядро: значения одновременности – разновременности (предшествования-следования).

Комплекс значений, относимый к категории таксиса, активизируется каждый раз, когда задействованы глагольные формы. В характеристике таксиса фигурирует понятие “полипредикативный комплекс”. Это понятие включает 1) сочетание основной и вторичной предикации в конструкциях с деепричастиями, причастиями; 2) разные типы полипредикации в сложных предложениях и предложениях с однородными сказуемыми; понятие полипредикации распространяется и на высказывания, представляющие собой сверхфразовые единства. Аспектуальные признаки характеризуют не только каждое действие в отдельности, но и их сочетания в пределах полипредикативного комплекса.

Для передачи значений поля таксиса используются финитные (личные) и нефинитные (неличные) формы глаголов. Основная предикация в предложении выражается финитными формами глаголов, основным средством выражения вторичной предикации являются нефинитные формы глаголов (НФГ). Значения, выражаемые парадигмой финитных форм глагола (в английском, русском и итальянском языках) можно условно разделить на три большие группы: "быть в состоянии действия", "совершить, закончить действие", "выполнять повторяющееся или регулярное действие" [9]. При этом действия могут иметь различную временную отнесенность: к прошлому, настоящему или будущему. Для передачи этих значений в различных языках используются различные средства: если в английском языке существует стройная система аналитических форм выражения темпорально-аспектуальных значений, в русском языке, в основном, эти значения передаются морфологическими и лексическими средствами, за исключением сложного будущего времени. В парадигме итальянского глагола присутствуют как аналитические, так и синтетические средства выражения этих значений.

Нефинитные формы глагола - причастия, инфинитивы, герундии, деепричастия - обладают своего рода “сплавом” именных и глагольных свойств. НФГ, выражающие значения, относящиеся к семантической сфере таксиса, на которых мы фокусируем внимание в данной работе, в русском языке представлены деепричастиями, причастиями, в английском - причастиями (Participle I,Participle II), при этом формы причастия выражают функциональные значения, передаваемые в русском языке как причастиями, так и деепричастиями, придаточными предложениями; в итальянском деепричастиями (Gerundio), причастиями (Participio), придаточными предложениями.

Процессность, выражаемая несовершенным видом в форме деепричастия в русском языке (Gerundio – в итальянском, Participle I – в английском), становится основным, наиболее специфическим способом выражения таксисной функции одновременности. Таксисная функция присуща категории вида и за пределами указанных НФГ. В русском деепричастии данная функция приобретает категориальную значимость. Для разновременных действий характерно выражение бинарных отношений предшествования - следования или цепные отношения последовательности.

Грамматическими синонимами конструкций с НФГ являются сложносочиненные и сложноподчиненные предложения, они являются экспликацией, полностью развернутой формой выражения значений таксиса, представленных в этих конструкциях. В сложносочиненных предложениях, так же, как и в предложении с однородными сказуемыми, основной тип разновременности - последовательность, цепной ряд действий. В сложноподчиненных предложениях выражаются различные типы ситуаций разновременности, при этом определяющую роль играют семантические характеристики союзов и союзных слов.

Обобщенный комплекс значений функционально-семантического поля таксиса для последующих реализаций в виде формализованных предикатно-актантных структур может быть представлен в виде следующей схемы:

одновременность - одновременность процессов; одновременность процесса и целостного факта - одновременность целостных фактов;

разновременность - предшествование, следование;

предшествование - процесса целостному факту; предшествование целостного факта процессу; предшествование целостного факта целостному факту; предшествование процесса процессу;

следование процесса целостному факту; следование целостного факта процессу; следование целостного факта целостному факту; следование процесса процессу.

В простых НФГ английского и итальянского языков наиболее часто реализуется идея одновременности.

Видя, что уже поздно, мы решили вернуться домой.

Visto che era gia tardi, decidemmo di tornare a casa.

Observing that it was late already, we decided to return home.

Мы обсудили все, идя в сад.

Abbiamo parlato di tutto passeggiando per il giardino.

We have discussed everything, walking to the garden.

Сложные формы НФГ в английском и итальянском языках выражают значения предшествования и следования.

Произнеся эти слова, он ушел.

Dopo aver pronunciato queste parole, se ne ando.

Having pronounced these words he left.

Наиболее близкая по своим функционально-семантическим характеристикам форма к деепричастию в русском языке – это Gerundio в итальянском языке. Gerundio имеет простые и сложные формы и вместе с относящимися к нему словами образует обороты, которые могут выступать в функции обособленного обстоятельства или грамматических синонимов придаточных предложений времени или причины:

Egli savvicinava, gesticolando con tutte e due le mani. – Он приближался, жестикулируя обеими руками. (Одновременность).

Essendo partito troppo tardi, non speravo di arrivare a tempo. – Выехав поздно, я не надеялся приехать вовремя. (Предшествование).

В сложноподчиненных предложениях во всех трех исследуемых языках для выражения аспектуально-таксисной ситуации одновременности используются временные союзы недифференцированного значения “когда”, “when”, “quando”, “пока”, “while”, “mentre” при участии формы несовершенного вида со значением процессного действия Другое действие выступает как одновременное с данным процессом, если оно происходит в один из его моментов или параллельно с ним.

While we raised temperature the reaction became more active.

Пока мы поднимали температуру, реакция становилась более активной.

Придаточные предложения с явно выраженными отношениями предшествования - следования вводятся союзами, прежде чем, до, before, prima che; после того как, after, dopo (che) и другими, аналогичными им.

Я принес тебе книгу, после того как прочитал ее.

Ti portai il libro, dopo che l’avevo letto.

После отключения тока давление упало.

Upon switching off the current, the pressure dropped.

Особое внимание следует уделить выражению аспектуально-таксисных значений, выражаемых такой специфической для английского языка конструкцией как инфинитивный оборот.

Таксис в зависимом перфектном инфинитивном обороте (предшествование действию, выраженному финитным глаголом):

I remember him to have lectured at this club. – Я помню, что он читал лекции в этом клубе.

Таксис в зависимом прогрессивном инфинитивном обороте (одновременность c действием, выраженным финитным глаголом):

I knew him to be working at this problem. – Я знал, что он работал над этой проблемой.

На аспектуально-таксисные значения часто могут накладываться другие обстоятельственные значения, например, причины и следствия. Придаточные предложения причины вводятся союзами потому что, так как, because, as, since, perche, che, giacche, siccome, poiche.

Он устал, потому что много работал.

He is tired because he has worked much.

Egli e stanco siccome ha lavorato molto.

Могут быть выражены значения уступительности и следования в комплексе:

In spite of being very complicated the problem has been solved.

Несмотря на то, что эта проблема очень сложная, ее решили.

Важным фактором является то обстоятельство, что сходные явления в рассматриваемых языках могут иметь различную семантическую структуру, и в то же время, один и тот же смысл может передаваться средствами различного уровня. Речь может идти не о сплошном контрастивном анализе языков в их целостности, а лишь о сопоставлении частично эквивалентных фрагментов системы, категорий, парадигм. Основным интересующим нас выводом является следующий: различия между синонимичными высказываниями обусловлены различиям в деривации этих высказываний от единой исходной структуры к множеству поверхностных структур.

При выработке решений для процедур синтеза предложений естественного языка следует ориентироваться на регулярный для данного языка способ выражения значений функционально-семантического поля таксиса.

 

 

3. Подходы к компьютерному моделированию функциональных значений

 

В настоящий момент существует два основных подхода к моделированию естественного языка в компьютерных системах. Это имитационное моделирование (simulation), когда лингвистический процессор ориентирован на способ решения языковых задач, наиболее близкий к естественному лингвистическому устройству – человеку. Другой подход к лингвистическому моделированию – это эмуляция (emulation). Эмуляция - моделирование не процесса (в отличие от имитационного моделирования), а результатов языковой деятельности для текущих практических задач компьютерных реализаций, выбор решений, позволяющих таким образом организовать языковое поведение компьютерной программы, чтобы обеспечить наиболее оптимальный достижимый результат работы системы, а это означает редукцию вариативности, т.е. экономию вычислительных затрат.

Целью эмуляции являются как можно более компактные унифицированные представления. Эксплицитность и линейность представления - необходимые условия для компьютерного лингвистического моделирования.

Большой объем информации (даже хорошо структурированных правил) не всегда ведет к наилучшему результату, а чаще приводит к экспоненциальному росту порождаемых вариантов перебора.

В системах обработки англоязычного естественноязыкового текста наиболее популярными аппаратами функциональной лингвистики являются следующие.

Систематическая грамматика (Systemic Grammar) - это составная часть систематической функциональной лингвистики (Systemic-Functional linguistics), рассматривающей язык как средство выражения значения в контексте [14]. Систематические грамматики представляют предложения как наборы функций и поддерживают правила отображения этих функций на множество эксплицитных грамматических форм. Этот подход очень удобен на этапе порождения и широко используется в алгоритмах генерации естественного языка. Анализ на основе систематической грамматики обеспечивает представление предложения в виде набора функциональных “слоев”, таких как “наклонение”, “транзитивность”, “тема”. Так слой “наклонение” определяет тип декларативной структуры, например, для предложения “The system will save the document” “Система сохранит документ”, указывается, что это простая декларативная структура с субъектом, финитной формой глагола (вспомогательного), предикатором (значимой глагольной формой) и объектом. Слой “транзитивность” указывает, что “система” - это актор, или исполнитель процесса “сохранения”, и что объект, над которым совершается действие - это “документ”. Слой “тема” указывает, что “система” - это тема, или фокус внимания в предложении. Следует отметить, что все три слоя представляют различные наборы функций, называемых метафункциями и составляющих основу процесса генерации. Систематическая грамматика использует для своих представлений направленный ациклический граф И/ИЛИ, называемый “системной сетью”. Систематическая грамматика использует операторы реализации для отображения из своих внутренних представлений в стандартные синтаксические формы.

Функциональная унификационная грамматика (Functional Unification Grammar) использует вычислительный механизм унификации для того, чтобы обрабатывать признаки структур [20]. Основная идея этого подхода состоит в том, чтобы построить порождающую грамматику как структуру признаков, в которой перечислены все возможные альтернативы, и затем осуществить процесс унификации этой грамматики с входной спецификацией, в которой используется тот же тип структуры признаков. Процедура унификации в этом случае будет проверять соответствие признаков, заданных на входе, тем, которые представлены в грамматике, порождая полную структуру признаков, которая на выходе превращается в линейную структуру предложения. Обычно эта грамматика представляется в виде матрицы атрибутов-значений. На самом верхнем уровне унификационная грамматика поддерживает выбор категориальных альтернатив, таких как, например, “предложение”, “именная фраза”, “глагольная фраза”. На уровне предложения эта грамматика поддерживает такие признаки как “актор”, “процесс”, “цель”.

На уровне “глагольной фразы” происходит альтернативный выбор атрибутов таких как время, наклонение, и других характерных для этой категории признаков. Эта грамматика аналогична систематической грамматике в том, что поддерживает множество “слоев” признаков, которые вводятся рекурсивно в процессе порождения.

В словаре, полезном с точки зрения компьютерной обработки, требуется указать для каждого глагола (или другой предикатной единицы) его возможные синтаксические и семантические аргументы. В современных проектах, таких как FrameNet [22] наряду с комбинаторными характеристиками для каждого глагола указываются вероятности его тематических фреймов. Словарная статья глагола в FrameNet содержит все наборы аргументов, которые он может иметь, включая возможные наборы тематических ролей, синтаксических шаблонов и грамматических функций. Безусловно такой подход требует значительных затрат квалифицированного труда человека.

Предлагаемый нами подход к выработке семантико-синтаксических представлений в настоящий момент в большей степени является эмуляцией, хотя ряд проектных решений был сделан в традиции имитационного моделирования. В процессе анализа и синтеза используется вариант унификационной грамматики, обрабатывающей признаки разных уровней [7-9].

 

 

4. Моделирование функциональных значений на основе расширенных семантических сетей

 

Мы выделяем следующие лингвистические аспекты, которые должны учитываться при семантическом моделировании на основе аппарата расширенных семантических сетей (РСС): это организация лингвистических описаний по уровням; необходимость набора лингвистических категорий, составляющих базис универсального семантического представления, подходящих для получения сопоставимых описаний различных языков в процессе контрастивного анализа. Используется такой подход, при котором структуры сравниваемых языков порождаются из одной и той же общей базы, а сравнение и противопоставление осуществляются в ходе самого процесса порождения [17]. Функционально-семантические категории еще недостаточно разработаны и лингвист часто вынужден самостоятельно проводить межъязыковые сопоставления. Такая практика приводит к возникновению "смешанных грамматик" и потребность в ней носит объективный характер.

В РСС - представлении глубинная структура для всех языков одна и та же – это предикатно-актантные пропозициональные структуры, а в наибольшей степени языки различаются своими поверхностными структурами, что отражается в лингвистических словарях для каждого из поддерживаемых в системе языков. Функциональные значения, проявляющиеся в структурных единицах и комплексах языка, отображаются в формализованные представления записей базы знаний. Из всех категорий, отражающих понятие времени в широком смысле, категория таксиса наиболее синтаксична. В сфере анализа соотношений действий во времени аспектология непосредственно смыкается с синтаксисом.

Значения глагольных форм, также как и семантико-синтаксический фрейм, включаются в словарную статью глагола [7-9], таким образом, значение каждого слова-действия представляется в виде сложной структуры фрагментов семантической сети, где между формами глаголов различных языков, передающими одно и то же значение, устанавливаются соответствия. Маркерами дистрибутивно – трансформационных признаков глагола служат глагольные окончания, как, например, для некоторых английских глаголов:

OKON("E",ENG2,PRES,ACT%)

OKON("E",ENG2,INFI,ACT%)

OKON("ES",ENG2,PRES,ACT%)

OKON("ED",ENG2,PAST,ACT%)

OKON("ED",ENG2,PAST1,ACT%)

OKON("ER",ENG2,SUBJ%,ACT%)

OKON("ITION",ENG2,SYT%,ACT%)

OKON("ING",ENG2,PRES1,ACT%)

OKON("MENT",ENG2,SYT%,ACT%)

OKON("E",ENG2,КТО,1)}

NOUN(ACT,VERB)

Выделенные аспектуально-таксисные значения представлены в виде инвариантных отношений предикатно-актантных структур с сентенциальными аргументами. Унифицированное представление отношений одновременности, предшествования и следования задается в виде трех видов отношений и их комбинаций, что позволяет описать все основные виды таксисно-аспектуальных значений на уровне формализованных структур: BEFORE(X1,X2), AFTER(X2,X1), WHILE(X1,X3). Все виды конструкций с неличными формами глаголов на базовом, глубинном уровне приводятся к нормальной форме – последовательности простых предикатов, связанных соответствующими метками отношений. На этапе синтеза порождаются сложноподчиненные и сложносочиненные предложения, поскольку эти конструкции являются универсальными и регулярными для всех трех языков, которые затем могут трансформироваться в обороты с НФГ, если они являются регулярными способами выражения данного вида значений для указанного языка.

Таким образом строится карта синтаксем, представляющих значения, относящиеся к семантическому полю таксиса. Обеспечивается расширяемость системы значений временной соотнесенности действий.

 

 

  1. Заключение

 

Следующие лингвистические аспекты должны учитываться при семантическом моделировании в многоязычной ситуации: организация лингвистических описаний по уровням; необходимость набора лингвистических категорий, составляющих базис универсального семантического представления; выбор модели лингвистического анализа, для получения сопоставимых описаний различных языков, для которых осуществляется контрастивный анализ.

Грамматика рассматривается как проекция когнитивных структур. Модели, сущности, фреймы сознания лежат в основе структур грамматических. Функциональные значения, проявляющиеся в единицах и комплексах языка, отображаются в формализованные представления записей базы знаний.

Целью эмуляции естественного языка являются как можно более компактные унифицированные представления, отсюда сведение различных видов лингвистических моделей (в данном случае - таксиса - к компактным группам и представлениям).

В качестве действующей модели разработана кросс-лингвистическая карта основных трансформаций финитных-нефинитных глагольных форм трех языков, которая реализована в виде расширенных семантических сетей, ассоциируемых с каждой глагольной вершиной.

Текущий этап исследований и разработки связан с адаптацией и расширением действующей модели для текстов реальной сложности - полнотекстовых научных документов - и экспериментами по применению методов лингвистического моделирования к вербально-графическим объектам в виде схем, диаграмм, таблиц с текстовыми включениями.

 

 

Литература

 

  1. Бондарко А.В. Принципы функциональной грамматики и вопросы аспектологии. М.: Эдиториал УРСС, 2001г. 208 с.
  2. Смирницкий А.И. Синтаксис английского языка. М., 1957.
  3. Якобсон Р.О. Шифтеры, глагольные категории и русский глагол. // Принципы типологического анализа языков различного строя. М., 1972. С.101, 106-108.
  4. Звегинцев В.А. Предложение и его отношение к языку и речи. М.: МГУ, 1976. 307 с.
  5. Богуславский И.М. Исследования по синтаксической семантике. М., 1985.
  6. Кибрик А.Е. Подлежащее и проблема универсальной модели языка. // Известия ОЛЯ, 1979, No 4.
  7. Козеренко Е.Б. Деривационный подход к моделированию унифицированных синтаксических структур для многоязычного лингвистического процессора. // Труды Международного семинара Диалог'2001 по компьютерной лингвистике и ее приложениям. Аксаково, 2001. Том 2. С. 200-207.
  8. Kozerenko, E.B. Multilingual Processors: a Unified Approach to Semantic and Syntactic Knowledge Presentation. // In Proceedings of the International Conference on Artificial Intelligence IC-AI’2001. USA, June 25-28, 2001. / Ed. by H.R. Arabnia. Las Vegas, Nevada: CSREA Press, 2001. P.1277-1282.
  9. Кузнецов И.П., Козеренко Е.Б. Поиск языковых универсалий для лингвистического моделирования на расширенных семантических сетях. // Труды Международного семинара Диалог-99 по компьютерной лингвистике и ее приложениям. Таруса, 1999. С.157-164.
  10. Курилович Е., Деривация лексическая и деривация синтаксическая. // Очерки по лингвистике. М., 1962.
  11. Падучева Е.В. О семантике синтаксиса. М.: Наука, 1974. 292 с.
  12. Храковский В.С. Деривационные отношения в синтаксисе. // Инвариантные синтаксические значения и структура предложения. М., 1969.
  13. Halliday M.A.K., Functional Diversity in Language as seen from a Consideration of Modality and Mood in English. // Foundations of Language. 1970. 6. P. 332-361.
  14. Halliday M.A.K. An Introduction to Functional Grammar. / Ed. by Edward Arnold, London, 1985.
  15. Bock K., Loebell H. Framing sentences // Cognition. 1990. Vol. 35. P.1-39.
  16. Van Valin R.D.Jr. Functionalist Linguistic Theory and Language Acquisition. // First Language. 1991. N 11. P.7-40.
  17. Krzeszowski T.P. Interlanguage and contrastive generative grammar. // Interlanguage studies bulletin. 1976. Vol. 1, No 1. P.58-78.
  18. Kaplan R.M., Bresnan J. Lexical-functional grammar: A formal system for grammatical representation. // The mental representation of grammatical relations. / Ed. by Bresnan. Cambridge, MA: MIT Press, 1982. P.173-281.
  19. Levin B. English Verb Classes and Alternations. Chicago: University of Chicago Press, 1993.
  20. Kay M. Functional unification grammar: A formalism for machine translation. // COLING-84. Stanford, CA, 1984. P. 75-78.
  21. Carpenter B. The generative power of categorial grammars and head-driven phrase structure grammars with lexical rules. // Computational linguistics. 1991. 17, 3. P. 301-313.
  22. Baker, C.F., Fillmore, C.J., and Lowe, J.B. The Berkeley FrameNet project. // COLING/ACL-98. 1998. P. 86-90.

 

 

Functional Semantics in Computer-Based Decisions

Elena Borisovna Kozerenko

 

Key words: natural language processor, multilingual environment, syntax and semantics interaction, functional meaning, knowledge presentation, extended semantic networks, machine translation.

 

The key problem we faced in the course of NL emulation was connected with syntactic structures, their transformational and distributional characteristics, and the insistent urge of semantic presentation of syntax. The approach chosen was establishing unified functional meanings of syntaxemes, studying the shifts in meaning produced by transformations. The principal objects for investigation were predicate expressions, i.e. finite and nonfinite verb forms and other words which can produce predication in a sentence. The choise of the objects was determined by the fact that these predicate expressions (or verboids) "hold" the sentence structure and produce the presentation of a sentence in the form of inner knowledge base structures. A verboid makes a relation vertex which unites an arbitrary number of arguments, and the argumental places can be occupied by different types of objects: single words, nominal phrases, verbal phrases, clauses.

The most difficult cases for syntactic analysis are verbal phrase arguments since special mechanisms should be introduced to avoid the "verbal conflict" when the parser confuses the arguments of different verbal vertices. The resolution of the conflict should be supported by special heuristics which are worked out on the basis of linguistic emulation. The emulation efforts in our case are directed towards creation of a unified sentence semantic structure which could serve a base for designing algorithms of natural language texts analysis allowing the transition from a natural language to another one without considerable "sense" losses in conveying relations presented by the structures of a subset of natural languages (Russian, English, Italian).

 

 

[1] Работа выполнена при поддержке РФФИ, грант 00-06-80069.