Сборник 2000

Автоматическая система русского словообразования РУСЛО 2

 

 

Рафаева А.В.

НИВЦ МГУ

 

Система РУСЛО (РУсское  СЛОвообразование) может быть использована для словообразовательного анализа и синтеза производных слов русского языка, в том числе неологизмов, построенных по редким словообразовательным моделям (см. [Перцова 1998]).

Лингвистическое обеспечение системы РУСЛО разработано Н.Н. Перцовой. Первый вариант программного обеспечения системы, написанный А.В. Черемхиным, работал в среде DOS. В настоящих тезисах описывается второй вариант системы, работающий в среде Windows 98 и использующий некоторые функции и алгоритмы средыSTARLING, разработанной С.А. Старостиным. В этом варианте грамматика отделена от алгоритмической реализации, что позволяет менять лингвистическую информацию, не затрагивая программной части системы, а также задавать различные режимы работы системы, в частности:

- словообразовательный анализ слов, входящих в состав словаря А.А. Зализняка;

- анализ слов, не входящих в состав словаря Зализняка, но построенных по регулярным словообразовательным моделям;

- анализ слов, построенных по редким словообразовательным моделям (может использоваться, в частности, для анализа поэтических неологизмов В. Хлебникова).

Система РУСЛО состоит из трех главных блоков, а именно:

- блок данных, который содержит базы данных в формате DBF, описывающие различные словообразовательные модели, а также компьютерную версию словаря Зализняка;

- блок алгоритмов, содержащий функции словообразовательного анализа и функции обработки запросов к словарю;

- интерфейс пользователя, позволяющий настраивать систему, задавать режимы ее работы, а также формы ввода анализируемых слов (ручной ввод и ввод из текстового файла) и вывода результатов анализа.

В процессе работы с системой (при ручном вводе анализируемых слов) можно просматривать БД, содержащие лингвистическую информацию и запрашивать правила, примененные на каждом шаге вывода. В дальнейшем предполагается добавить возможность внесения изменений в указанные БД непосредственно в процессе работы с системой.

Система РУСЛО написана на языке программирования C++. В программном обеспечении системы используются алгоритмы С.А. Старостина и А.В. Черемхина.

Литература

[Перцова 1998] – Перцова Н.Н. Анализ окказиональных слов в системе РУСЛО // Труды Международного семинара Диалог’98 по компьютерной лингвистике и ее приложениям. Т. 2. Казань, 1998. С.846 – 847.

 [Перцова, Черемхин 1992] – Перцова Н.Н., Черемхин А.В. Эксперименты по построению формальной модели русского словообразования // Труды машинного фонда русского языка. Т.2. М.: ИРЯ РАН, 1992. С. 86 – 103.