БАЗА ДАННЫХ ПО МНОГОЗНАЧНЫМ КАЧЕСТВЕННЫМ ПРИЛАГАТЕЛЬНЫМ И НАРЕЧИЯМ РУССКОГО ЯЗЫКА

 

THE DATABASE ON RUSSIAN POLYSEMOUS ADJECTIVES AND ADVERBS

 

Карпова О.С. (o_k_@inbox.ru), ABBYY Press

Резникова Т.И. (tanja.reznikova@gmail.com), ВИНИТИ РАН

Архангельский Т.А. (timarkh@gmail.com), МГУ им. М.В. Ломоносова

Кюсева М.В. (pegas@nm.ru), МГУ им. М.В. Ломоносова

Рахилина Е.В. (rakhilina@gmail.com), ИРЯ им. В.В. Виноградова РАН

Рыжова Д.А. (daska1990R@yandex.ru), МГУ им. М.В. Ломоносова

Тагабилева М.Г. (geratagabileva@gmail.com), МГУ им. М.В. Ломоносова

 

В докладе представляется База данных по многозначным качественным прилагательным и соответствующим им наречиям, разработанная на материале Национального корпуса русского языка. Описываются структура Базы, принципы ее заполнения и поисковые возможности, а также некоторые теоретические результаты анализа полисемии в русской признаковой лексике.

 

1.      Постановка задачи

Настоящая работа представляет результаты проекта, посвященного созданию Базы данных по многозначным качественным прилагательным и наречиям русского языка. Разрабатываемая База призвана отразить модели полисемии, характерные для русской признаковой лексики, т.е. предназначена для выявления возможных комбинаций значений в составе одной лексемы и типов семантических переходов между отдельными значениями.

В теоретическом плане задача семантического анализа русских прилагательных и наречий освещалась в докладе на конференции «Диалог’09» (Рахилина и др. 2009). В данной работе мы представим прикладной инструмент, позволяющий обобщить и систематизировать результаты теоретического исследования.

Изучение моделей полисемии и типов семантических сдвигов имеет богатые традиции как в отечественной, так и в зарубежной лингвистике. В то же время выявляемые в таких работах закономерности семантической деривации, как правило, основаны на рассмотрении отдельных сдвигов в лексемах самых разных классов и самых разных временных срезов. Задача «сплошного» обследования и системного анализа семантических переходов для большой и представительной группы лексики до сих пор не ставилась. При этом особенно мало внимания уделялось признаковым словам (исключениями в этом отношении являются работы Апресян 1974, Кустова 2004, Толстая 2008). Между тем исчерпывающий анализ и классификация каких-л. явлений становятся возможными только тогда, когда исследователь работает с достаточно полным перечнем таких явлений, иными словами, для изучения моделей семантической деривации необходимо создать представительный каталог таких моделей. Именно задачу инвентаризации моделей полисемии и типов семантических сдвигов на материале всей частотной адъективной и адвербиальной лексики и призвана решить создаваемая База данных.

 

2.      Материал и методика исследования

Материалом для заполнения Базы послужили частотные многозначные качественные прилагательные русского языка (ср. веселая девочка), а также связанные с ними наречия (ср. весело смеяться) и предикативы (ср. мне весело). Список таких единиц был получен на основе Нового частотного словаря русской лексики (Ляшевская/Шаров 2008), составленного по данным Национального корпуса русского языка (НКРЯ). К частотным были отнесены прилагательные с встречаемостью не ниже 15 раз на миллион словоупотреблений. В соответствии с этим критерием было отобрано 300 полисемичных качественных прилагательных, которые вместе с соответствующими наречиями и предикативами и составили материал для Базы данных.

Семантический анализ вносимых в Базу единиц строился на основе изучения контекстов их употребления в НКРЯ. Для каждого прилагательного и наречия составлялся перечень таких контекстов, который затем подвергался классификации в соответствии с типом значения, реализуемом в данном контексте. Контексты, в которых признаковое слово выступает в одном и том же значении, обобщались: выделялся семантический параметр контекста, релевантный для выбора данного значения признакового слова. Так, группа контекстов слова сладкий в значении ‘обладающий сладким вкусом’, включающая, например, существительные пирог, груша, блюдо, кисель, кофе, объединяется семантическим признаком «еда и напитки», а контексты этого же слова со значением ‘доставляющий наслаждение’ – печаль, тоска, чувство – задаются параметром «эмоции» (ср. в этой связи практику разрешения семантической омонимии в НКРЯ, см. Рахилина и др. 2006, Шеманаева и др. 2007).

На следующем этапе анализа между всеми значениями признакового слова устанавливались связи и выявлялись семантические переходы, т.е. полисемия слова представлялась в виде семантической сети, в которой каждое последующее значение образовано от предыдущего посредством семантической деривации определенного типа. Общепринятыми в теоретических исследованиях являются два механизма сдвига значений: метафора и метонимия (ср. Lakoff/Johnson 1980, Croft 1993, Feyaerts 1999, Dirven 2002, Peirsman/Geeraerts 2006 и мн. др.). В нашем материале имеется множество примеров, демонстрирующих переходы обоих типов. Однако благодаря тому, что исследование строилось не на выборочном, а на «сплошном» анализе материала, в ходе работы наряду со стандартными случаями были выявлены переходы, не укладывающиеся в классические определения метафоры и метонимии, но вместе с тем обнаруживающие некоторые системные признаки. При семантических переходах такого рода имеет место комбинация метонимических и метафорических сдвигов параметров лексемы, основанная на конвенциализации импликатуры исходного значения (дружно житьдружно ненавидеть; крупно писатькрупно повезти; грубо вести себягрубо ошибиться). Переход такого рода получил название ребрендинга (подробнее см. Рахилина и др. 2009).

Важно заметить, что при построении семантических сетей отношения между значениями рассматриваются не отдельно для прилагательного и для связанного с ним наречия и предикатива, а в совокупности, как единая лексическая система, характеризующаяся общими принципами семантической эволюции. Часто именно такой подход позволяет обнаружить мотивированность деривационных моделей признаковой лексики (так, например, теплый прием естественно связать с тепло принять, а не с теплый свитер), ср. теорию метонимии, развиваемую в (Radden/Kövecses 1999), а также обсуждение соотношения между конструкциями вида наречие-глагол и прилагательное-отглагольное существительное в (Филипенко 2003: 101). Метонимические отношения между отдельными значениями разных частей речи (прилагательное-наречие или прилагательное-предикатив) классифицируются в нашей системе как транскатегориальная метонимия.  

Построенная таким образом семантическая сеть переносится в Базу данных. К обсуждению ее структуры мы переходим в следующем разделе.

 

3.      Структура Базы данных

База реализована с использованием SQLite (выбор СУБД обусловлен относительно небольшим объёмом данных и бесплатностью программного обеспечения). Для занесения значений в базу можно использовать любой из существующих редакторов баз SQLite, поддерживающий юникод, – например, SQLite2009 Pro. Поиск в базе осуществляется посредством обычных SQL-запросов, но для удобства пользователя нами была написана клиентская программа, позволяющая исследователям, не знакомым с языком SQL, задавать типичные запросы с помощью графического интерфейса, а также умеющая отображать результаты не только в виде таблицы, но и в виде части сети семантических переходов.

Каждая запись в Базе данных соответствует одному значению признакового слова. Формат Базы предполагает характеристику каждого отдельного значения по следующим параметрам:

  1. ID: номер данного значения в Базе данных.
  2. lemma: исходная форма описываемого слова (т.е. прилагательное в форме именительного падежа мужского рода единственного числа, наречие или предикатив).
  3. ID_parent: номер значения, от которого образовано данное значение признакового слова.
  4. POS: часть речи описываемого слова (прилагательное, наречие или предикатив).
  5. meaning: краткое словарное толкование данного значения.
  6. short_description: прототипический контекст для данного значения признакового слова, т.е. своего рода «ярлык», наглядно представляющий характеризуемое значение. Так, для прилагательного мягкий в значении физического свойства объектов прототипический контекст задается существительным диван, а в значении качества человека – существительным человек. Этот «ярлык» используется, в частности, как идентификатор данного значения в семантической сети переходов, которую система может отобразить для каждого признакового слова. Тем самым пользователь, обращаясь к схеме значений, по конкретным примерам легко может определить, какие значения прилагательного или наречия скрываются за каждым узлом в сети.
  7. tax_class: таксономический класс, к которому относится данное значение признакового слова. В основу классификации были положены признаки, используемые в семантической разметке НКРЯ. Но при этом по мере необходимости система пополняется новыми таксономическими категориями. Например, прилагательному тяжелый в сочетаниях типа тяжелая сумка приписывается характеристика ‘большой вес’; в сочетаниях типа тяжелая арка – ‘внешний вид’, тяжелая голова – ‘физическое состояние’, тяжелая контузия – ‘большая степень’ и т. п.
  8. ev: оценочная характеристика данного значения признакового слова (положительная, отрицательная или нейтральная оценка). Этот параметр позволяет отслеживать, как развивается оценка в семантической парадигме лексемы.
  9. gram_restrict: грамматические ограничения на функционирование слова в данном значении (например, для прилагательного полный в значении высокой степени, ср. полное отчаяние, недопустима краткая форма).
  10. context_sem: семантические свойства контекста для данного значения признакового слова, т.е. семантические признаки существительных, которые могут сочетаться с прилагательным в данном значении, или семантические признаки глаголов, прилагательных и/или наречий, которые могут выступать при описываемом наречии в данном значении. Так, например, прилагательное глубокий в значении ‘имеющий большую глубину’ сочетается с конкретными существительными топологического класса «контейнеры» (глубокая яма), в значении ‘достигший предела в развитии’ – с существительными, принадлежащими к таксономическому классу «время» (глубокая ночь), а в значении ‘отличающийся глубиной содержания’ – с именами, относящимися к ментальной сфере (глубокая мысль). В некоторых значениях та или иная лексема может сочетаться одновременно с несколькими семантическими классами слов. Например, для прилагательного легкий в значении ‘невысокая степень’ определяемое существительное может принадлежать к одному из следующих семантических классов: «воздействие», «психическое или физиологическое состояние», «болезнь», «погодные условия», «температура», «свет», «цвет», «звук», «запах», «вкус» (ср. легкое нажатие, легкий озноб, легкий ветер, легкий звон и т.п.).
  11. sem_except: список слов-исключений из правил, предписанных в context_sem. Этот параметр предназначен для таких случаев, когда прилагательное/наречие в целом может сочетаться с некоторым классом или классами существительных/глаголов, прилагательных или наречий (это правило задается в context_sem), но при этом среди единиц этого класса обнаруживаются такие, которые по каким-л. причинам нарушают общее сочетаемостное правило, т.е. не могут выступать с прилагательным/наречием в описываемом значении. Эти исключения и составляют значение данного параметра.

Так, с прилагательным жестокий в значении ‘являющийся проявлением сурового и беспощадного характера’ (метонимический переход от исходного значения – ‘свойство человека’) употребляются среди прочих существительные класса «речь», ср. жестокие слова/ вопрос/ реплика. В то же время при некоторых существительных данного класса слово жестокий получает другое значение – оно соотносится с идеей ‘высокой степени’, ср. жестокий спор/ дискуссия/ перебранка. По-види­мому, релевантным в данном случае для противопоставления внутри таксономического класса «речь» оказывается признак направленности речевого действия. Семантика прилагательного жестокий в конструкции типа жестокие слова предполагает наличие субъекта (тот, кто проявляет жестокость) и адресата (тот, на кого направлена жестокость). Если существительное, выступающее при слове жестокий, обозначает речевое действие, производимое одним участником ситуации и обращенное к другому участнику (ср. слова, вопрос, реплика), то тем самым семантика такого существительного согласуется с «адресным» значением прилагательного. Если же существительное класса «речь» подразумевает реципрокальное отношение между участниками ситуации (ср. дискуссия, спор, перебранка), то происходит переинтерпретация значения прилагательного: оно указывает не на проявление жестокости участников ситуации по отношению друг к другу, а на интенсивность протекания ситуации в целом. Тем самым параметр sem_except, во-первых, позволяет уточнить характеристику семантического контекста для описания прилагательного в Базе и, во-вторых, имеет теоретическую значимость: он выявляет когнитивно значимые признаки лексических единиц языка.

  1. context_gram: грамматические свойства контекста для данного значения прилагательного, наречия или предикатива. Например, одно из значений прилагательного верный – ‘надежный, преданный’ (ср. верный друг) – наряду со стандартной атрибутивной моделью может реализоваться в конструкции с дательным падежом, ср. остаться верным кому-л.
  2.  trans_type: тип семантического сдвига. В Базе предусмотрено 4 типа переходов:

·          метафора, ср. сладкий пирог → сладкие мечты;

·          метонимия, ср. радостный мальчик → радостная музыка;

·          транскатегориальная метонимия, т.е. метонимия, имеющая место между разными частями речи (см. раздел 2), в т. ч.

o         от некоторого значения прилагательного к некоторому значению наречия (веселая девочка → весело смотреть);

o         от некоторого значения наречия к некоторому значению прилагательного (весело смотреть → веселый взгляд);

o         от некоторого значения предикатива к некоторому значению прилагательного (мне весело → веселая музыка).

·          ребрендинг (см. раздел 2), ср. страшный фильм (= ‘фильм, внушающий страх’) страшная радость (= ‘радость в большой степени’); здоровый мальчик (= ‘мальчик, наделенный здоровьем’) → здоровая палка (= ‘палка большого размера’); смешной рассказ (= ‘рассказ, вызывающий смех’) → смешная порция (= ‘маленькая порция’). Данные примеры невозможно охарактеризовать как метонимию или метафору в чистом виде. Во-первых, при этих переходах исходное и производное значение прилагательного принадлежат разным таксономическим классам, соответственно, их нельзя признать метонимическими (в современных теориях семантических сдвигов метонимия понимается как сдвиг в пределах одного таксономического класса, или домена, ср. Croft 1993, Radden/Kövecses 1999, Peirsman/Geeraerts 2006). Во-вторых, таксономические классы, соответствующие начальному и конечному значению, не обнаруживают концептуального сходства, которое могло бы служить основанием для метафорического сравнения, или проекции (mapping) элементов структуры исходной области на структуру производной (ср. Lakoff/Johnson 1980, Turner/Fauconnier 1995). Хотя идея сравнения и присутствует в семантических сдвигах такого рода, базовым механизмом для них является импликатура, при которой результат семантического перехода служит следствием, или выводом из исходного значения (подробнее о ребрендинге см. Рахилина и др. 2009, о некоторых результатах исследования ребрендинга при помощи Базы данных см. тж. ниже).

  1. example: пример употребления прилагательного, наречия или предикатива в данном значении (из НКРЯ).

Таковы параметры, в соответствии с которыми характеризуется каждое значение признакового слова при внесении в Базу. Заполненная таким образом База данных открывает широкие возможности для изучения моделей многозначности признаковой лексики и типов семантической деривации.

 

4.         Применение Базы данных: примеры запросов

Запросы к Базе могут строиться как по одному из вышеописанных параметров, так и по их различным комбинациям. Рассмотрим некоторые примеры.

К наиболее очевидным способам построения запроса является поиск по типу семантического перехода. Так, задав в качестве условия ‘тип перехода: метафора’, пользователь получит все содержащиеся в Базе примеры метафорических сдвигов в прилагательных и наречиях. Поиск по признаку ‘тип перехода: ребрендинг’ отобразит все семантические сдвиги, которые, по нашей классификации, не подпадают под канонические определения метафоры и метонимии. Анализ таких переходов показывает, что их результирующие значения соотносятся с ограниченным набором семантических классов, ср. ‘интенсивность’ (большой: дом → плакса; страшный: рассказ → удивление), ‘большое количество’ (солидный: костюм → зарплата; сумасшедший: человек → деньги), ‘малое количество’ (скромный: жилище → доход; жалкий: зрелище → крохи), ‘большой размер’ (густой: суп → слой; здоровый: мальчик → палка), ‘положительная оценка’ (редкий: выстрелы → розы; знатный: гражданин → щи), ‘отрицательная оценка’ (неважный: вопрос → здоровье; жуткий: рассказ → почерк), ‘одновременность’ (дружный: семья → аплодисменты) и нек. др. Очевидно, что многие значения, возникающие в результате ребрендинга, связаны между собой регулярными соотношениями, ср. интенсивность/большой размер/большое количество: одно и то же прилагательное может отсылать к разным значениям этого семантического комплекса – в зависимости от свойств определяемого им существительного.

Запрос к Базе может строиться с учетом исходного или конечного значения признакового слова. Так, например, можно узнать, какие значения в результате семантического сдвига могут получать прилагательные размера. База показывает, что они могут переходить в следующие таксономические классы:

·          ‘длительность’ (большой: дом → привал; короткий: веревка → путь);

·          ‘свойство звука’ (тонкий: палка → голос);

·          ‘свойство множества’ (большой: дом → семья; маленький: яблоко → отряд; мелкий: орех → группа);

·          ‘свойство абстрактного явления’ (крупный: песок → успех; глубокий: колодец → знания; мелкий: камень → подробность; узкий: лента → тема);

·          ‘нефизическое свойство человека’ (мелкий: каменьчиновник; большой: домначальник).

И наоборот, можно выяснить, какие значения могут быть исходными для прилагательных, например, с семантикой ‘нефизическое свойство человека’: к ним относятся

·          ‘физическое свойство объекта’ (жесткий/мягкий: сидение → человек);

·          ‘физическое свойство человека’ (сильный: человек → союзник; крепкий: мужик → хозяйственник);

·          ‘физическое свойство животного’ (скользкий: угорь → человек; чуткий: зверь → человек).

Ограничение можно строить и по контекстным условиям реализации значения признакового слова, т.е., например, для прилагательного – по таксономическому классу существительных, с которым оно может сочетаться в исходном или производном значении. При этом в запросе можно задать одновременно параметры контекста исходного и конечного значения и тем самым проверить, соотносятся ли в русском языке свойства двух выбранных концептуальных областей. Так, если в качестве контекста исходного значения задать признак ‘человек’, а производного – ‘организации’, то система выдаст следующие примеры переходов: сильный / слабый: человек → государство; юный: девушка → город, а запрос на сдвиги с контекстами ‘вещество’ ‘эмоции’ вернет результаты сладкий / горький: лекарство → мука.

Предметом изучения на материале Базы могут стать и оценочные значения признаковой лексики. Хорошо известно, что признаковые слова часто получают оценочную семантику. Так, анализ примеров, выведенных Базой с помощью соответствующего запроса, показывает, что отсутствующая в исходном значении оценка может появляться в производном как результат метафорического переноса, ср. громкий: голосфразы; теплый: камень слова; искусственный: жемчуг смех; дешевый: мылопопулярность. Однако в нашем материале нет метафорических переходов, характеризующихся исчезновением в производном значении отрицательной оценки, присутствующей в исходном, или ее смены на положительную. Напротив, при ребрендинге положительная и отрицательная оценка могут в значительной степени стираться, заменяясь на значение интенсивности или большого размера (добрый: человеккусок; страшный: фильмрадость; жуткий: рассказсладкоежка; сумасшедший: человекденьги; дикий: криквосторг).

Посредством Базы можно проверять и уточнять некоторые теоретические положения современной теории метафоры и метонимии. Так, конституирующим свойством метафоры, по крайней мере начиная с классической работы Lakoff/Johnson 1980, считается мена таксономического класса лексемы, претерпевающей семантический сдвиг. Тем не менее в нашем материале обнаруживаются примеры метафор, при которых исходное и производное значение самого признакового слова соотносятся с одним и тем же таксономическим классом, метафорическое сравнение же возникает только за счет изменения класса определяемого объекта. Это явление характерно прежде всего для прилагательных, описывающих внешние признаки чего-л., т.е. метафора в данном случае возникает за счет внешнего сходства объектов разных концептуальных зон, ср. горбатый: человек → мост; стройный: девушка → дерево; вялый: трава → кожа; рваный: одежда → рана. Исключительный теоретический статус этих переходов вполне согласуется с их наивно-языковым восприятием. Интуитивно понятно, что «концептуальное расстояние» между исходным и производным значением прилагательного в данном случае меньше, чем при метафорических сдвигах, сопровождающихся меной таксономического класса признакового слова, ср. переход от физического к нефизическому свойству (черствый: хлеб → человек). Тем самым в некотором смысле можно говорить о метафоре как о градуируемом явлении, т.е. те или иные переходы можно оценивать как «более» или «менее метафорические».

Итак, разработанная База данных позволяет решать различные исследовательские задачи, нацеленные на семантическое описание русских прилагательных и наречий. В перспективе, как нам представляется, материал Базы мог бы стать и основой для лексико-типологических исследований в области признаковых слов.

 

Литература

  1. Апресян Ю.Д. Лексическая семантика (синонимические средства языка). М.: Наука, 1974.
  2. Кустова Г.И. Типы производных значений и механизмы языкового расширения. М.: Языки славянской культуры, 2004.

3.      Ляшевская О. Н., Шаров С. А. Новый частотный словарь русской лексики. 2008. http://dict.ruslang.ru/freq.php

4.      Рахилина Е.В., Кобрицов Б.П., Кустова Г.И., Ляшевская О.Н., Шеманаева О.Ю. Многозначность как прикладная проблема: Лексико-семантическая разметка в Национальном корпусе русского языка // Компьютерная лингвистика и интеллектуальные технологии: Труды международной конференции «Диалог 2006» (Бекасово, 31 мая – 4 июня 2006 г.) / Под ред. Н.И. Лауфер, А.С. Нариньяни, В.П. Селегея. М.: Изд-во РГГУ, 2006.

5.      Рахилина Е.В., Карпова О.С., Резникова Т.И. Модели семантической деривации многозначных качественных прилагательных: метафора, метонимия и их взаимодействие // Компьютерная лингвистика и интеллектуальные технологии: По материалам ежегодной Международной конференции «Диалог 2009» (Бекасово, 27-31 мая 2009 г.). Вып. 8 (15). М.: РГГУ, 2009.

6.      Толстая С.М. Пространство слова. Лексическая семантика в общеславянской перспективе. М.: Индрик, 2008.

7.      Филипенко М. В. Семантика наречий и адвербиальных выражений — М.: Азбуковник, 2003.

  1. Шеманаева О.Ю., Кустова Г.И., Ляшевская О.Н., Рахилина Е.В. Семантические фильтры для разрешения многозначности в Национальном корпусе русского языка: прилагательные // Компьютерная лингвистика и интеллектуальные технологии: Труды международной конференции «Диалог 2007» (Бекасово, 30 мая 3 июня 2007 г.) / Под ред. Л.Л. Иомдина, Н.И. Лауфер, А.С. Нариньяни, В.П. Селегея. М.: Изд-во РГГУ, 2007.
  2. Croft W. The role of domains in the interpretation of metaphors and metonymy // Cognitive Linguistics, 4, 1993, pp. 335370.
  3. Dirven R. Metonymy and metaphor: Different mental strategies of conceptualisation //R. Dirven and R. Pörings (eds.) Metaphor and Metonymy in comparison and contrast. Berlin/New York: Mouton de Gruyter, 2002. Pp. 75111.

11.  Feyaerts K. Metonymic Hierarchies: The Conceptualization of Stupidity in German Idiomatic Expressions // K.-U. Panther and G. Radden (eds). Metonymy in Language and Thought. Amsterdam & Philadelphia: John Benjamins, 1999.

12.  Lakoff G., Johnson M. Metaphors We Live By. Chicago: University of Chicago Press, 1980.

13.  Peirsman Y., Geeraerts D. Metonymy as a Prototypical category // Cognitive Linguistics 2006, 17(3). Pp. 269—316.

14.  Radden G., Kövecses Z. Towards a Theory of Metonymy // K.-U. Panther and G. Radden (eds). Metonymy in Language and Thought. Amsterdam & Philadelphia: John Benjamins, 1999. Pp. 17—59.

  1. Turner M.; Fauconnier G. Conceptual Integration and Formal Expression. In: Metaphor and Symbolic Activity, 1995. 10:3. Pp. 183203.