Proceedings 2002

Contents

ЭЛЕМЕНТАРНЫЕ ПРОСТЫЕ ПРЕДЛОЖЕНИЯ КАК РЕЗУЛЬТАТ ЗАПОЛНЕНИЯ ЯЧЕЕК ВАЛЕНТНОСТИ ПРЕДИКАТА (НА МАТЕРИАЛЕ СИНТАКСИЧЕСКИХ КОНСТРУКЦИЙ УКРАИНСКОГО ЯЗЫКА)

 

О. А. Красильникова

Донецкий государственный институт искусственного интеллекта

 

Ключевые слова: актант, валентность, морфологическая характеристика, объект, обязательный компонент, предикат, семантико-синтаксический анализ, субъект, сырконстант, факультативный компонент, элементарное простое предложение

 

В докладе идет речь о принципах построения элементарных простых предложений. Валентность предиката определяет количество правосторонних  и левосторонних членов синтаксической конструкции, а также форму каждого из них. Определение валентности предиката предусматривает семантико-синтаксический анализ предложения. Обращается внимания на возможные несоответствия между собственно-формально-синтаксическим и обусловленным валентностью предиката семантико-синтаксическим уровнями анализа конструкций. Данные утверждения подкрепляются и объясняются примерами, взятыми из украинской научной литературы как  образца четкого следования правилам украинского языка. Как результат исследования представлен краткий словарь валентности предикатов, наиболее распространенных в украинской научной литературе.

 

Украинская компьютерная лингвистика еще не подошла к решению проблем, возникающих при машинном переводе и построении машиной предложений из набора определенных форм. В первом случае предложения переводятся чаще всего пословно, большей степенью без учета морфолого-синтаксической зависимости членов предложения. Общая наука о построении предложения и машинный перевод синтаксических конструкций в данном случае не пересекаются.

Украинская лингвистика за последнее время сделала значительный шаг в изучении синтаксиса украинского языка. Вершиной исследований, проводимых в данной области, можно считать постепенный переход от анализа элементарных простых предложений к анализу целостного текста. Анализ же сложных синтаксических конструкций и текста основывается на возвращении к принципам построения элементарных простых предложений [1].

Наиболее подходящим для построения предложения машиной является валентностный подход, который основывается на учете системных возможностей глагольных лексем сочетаться с определенным количеством аргументов, предусмотренных семантической структурой соответствующей лексемы. Валентность предиката определяет количество правосторонних  и левосторонних членов синтаксической конструкции, а также форму каждого из них [2]. Соответственно, предметом исследования являются только обязательные члены элементарного простого предложения, факультативные члены синтаксической конструкции как не обусловленные валентностью предиката элементы в данном докладе не рассматриваются.

Семантико-синтаксический  анализ предложения предусматривает создание электронного словаря валентности и морфологической характеристики слов. Сначала в предложении находим элемент, способный быть предикатом, что обозначается в словаре валентности. Носителями предикатной семантики выступают в первую очередь глаголы, далее – причастия, далее  - прилагательные, далее – существительные. Носители субстанциональной семантики (актанты) занимают по отношению к предикату три основных ячейки – одну правостороннюю и две левосторонние, семантика, форма и место которых строго определены предикатом [3]. Первая ячейка включает субъектную семантику, которая представляется именной частью речи в именительном падеже или реже инфинитивом, который является формальным субъектом, первая ячейка (1) занимает левостороннюю позицию по отношению к предикату (П). То есть,  слева направо до предиката ищем существительное без предлога (в случае отсутствия такового ищем другую именную часть речи без предлога или инфинитив).  Другие левосторонние компоненты будут факультативными (Ф). Например:

Тепер ми  встановимо правило складання відрізків

    Ф      1             П

Двох-   і    багатоосновні кислоти дисоціюють ступінчасто

  Ф      Ф                 Ф                 1                   П

 

Второй правосторонний актант (2) репрезентируется исключительно при предикате с семантикой переходности, занимает место после предиката, имеет форму винительного падежа, не исключается употребление его с предлогом на, что также фиксируется в словаре валентности. Например:

Пряма пересікає відрізок  в точці А

                     П             2

Суб'єкт дії замнюється на об'єкт тієї ж дії

                                П                2на

 

Третий правосторонний актант (3) выступает формальным и семантическим адресатом, имеет форму дательного падежа:

Така речовина передає свої ознаки іншій речовині.

                               П                                              3

 

Четвертый компонент не является полноценным актантом, хотя четвертая ячейка заполняется также именной частью речи. Данный элемент синтаксической конструкции имеет форму творительного падежа и фактически несет на себе обстоятельственную семантику инструмента действия:

Гіпотенуза трикутника ділиться точкою В навпіл

                                                    П               4

 

Заполнение пятой, шестой и седьмой ячейки предусматривается валентностью глагола крайне редко. Если же все-таки заполнение этих ячеек обязательно, тогда пятая, шестая и седьмая ячейки заполняются элементами собственно локативной обстоятельственной семантики (сырконстантами). Пятая ячейка заполняется элементом в форме родительного падежа с предлогами із, від, до. Шестая – элементом в форме винительного падежа с предлогами через, крізь, за, в/у. Седьмая – элементом в форме предложного (с предлогами в, на, про, при); реже родительного (с предлогами біля, до); дательного (с предлогами по), творительного (с предлогами між, за, поза).

Обусловленный валентностью предиката семантико-синтаксический уровень анализа конструкций, не соответствующий узкому собственно-формально-синтаксическому подходу, дает возможность даже из набора неправильных форм (посредством приведения их к начальным формам) с помощью заполнения валентных гнезд определить схему предложения. Данные утверждения подкрепляются и объясняются достаточным количеством примеров, взятых из украинской научной литературы как одного из образцов четкого следования правилам украинского языка.

Аналіз дієслово грунтуватися на врахування системний можливість лексема

     1           Ф                  П                         7                   Ф                   Ф                 Ф

Итак, в первую очередь находим предикат (грунтуватися) и обращаемся к словарю валентности и морфологической характеристики; далее слева направо ищем заполнитель первой ячейки – существительное без предлога (аналіз), факультативные члены временно автоматически отсекаются. Далее при условии, что предикат имеет признак переходности и это обозначено в словаре валентности,  направо от предиката ищем первое существительное без предлога или спредлогом на (грунтуватися – глагол неперходный). Так, обращаясь к словарю валентности и морфологической характеристики, доходим  до седьмой ячейки (на врахування). После этого имеем возможность восстановить формы обязательных компонентов предложения: устанавливаем соответствие между формой компонента первой ячейки и предикатом, ставим в соответствующие падежи все другие обязательные компоненты и получаем минимальную схему предложения (под чем имеем в виду не главные члены предложения, а совокупность валентно-обусловленных членов предложения):

 Аналіз грунтуватися на врахування

     1                   П                        7

В свою очередь, каждый факультативный компонент конструкции имеет свою валентность и тем самым создает свое гнездо ячеек, которое необходимо заполнить. Например, существительное аналіз – предусматривает после себя зависимый компонент в родительном падеже, который обозначается как  1ф, т.е. имеем в виду факультативный член, подчиняющийся элементу первой ячейки. Таким образом восстанавливаем формы факультативных членов предложения.

Аналіз -  дієслова, на врахування  -   можливості, системної  -  можливості, можливості   -  лексеми

Определения необходимого количества и форм членов предложения с помощью компьютерных технологий является актуальной проблемой в области компьютерной лингвистики (тем более, что украинское языкознание почти не имеет существенных разработок в данной области). Обращается внимание на разметку глаголов, наиболее удобную для последующей работы с предложением:

Пример разметки глаголов в словаре морфологической характеристики:

аксіоматизувати ндв 2а

абеткув>ати ндв-дв 2a

аблактув>ати ндв-дв 2a 

абонув>ати ндв-дв 2а 

абордув>ати ндв-дв 2a 

абортув>ати ндв-дв 2a 

абсолютизув>ати ндв-дв 2a              

абсорбув>ати ндв-дв 2a 

абстрагув>ати ндв-дв 2a 

авансув>ати ндв-дв 2a 

авізув>ати ндв-дв 2a 

автоматизув>ати ндв-дв 2a 

авторизув>ати ндв-дв 2a 

агітув>ати ндв 2a 

агонізув>ати ндв 2a нп

адаптув>ати ндв-дв 2a 

адмініструв>ати ндв 2a нп

адоптув>ати ндв-дв 2a 

адресув>ати ндв-дв 2a 

адсорбув>ати ндв-дв 2a 

азотув>ати ндв-дв 2a 

акліматизув>ати ндв-дв 2a 

акомодув>ати ндв-дв 2a  нп

акредитув>ати ндв-дв 2a 

активізув>ати ндв-дв 2a 

активув>ати ндв-дв 2a 

актуалізув>ати ндв-дв 2a

актув>ати ндв-дв 2a

акумулюв>ати ндв-дв 2a

акцентув>ати ндв-дв 2a

акцептув>ати ндв-дв 2a

алітув>ати ндв 2a нп

амальгамув>ати ндв-дв 2a

амонізув>ати ндв-дв 2a

амортизув>ати ндв-дв 2a

ампутув>ати ндв-дв 2a

аналізув>ати ндв 2a

анатомув>ати ндв-дв 2a

ангажув>ати ндв-дв 2a

анекс