Грунтов И.А. altaica@narod.ru

Институт языкознания РАН

«Каталог семантических переходов» – база данных

по типологии семантических изменений[1]

«The Catalogue of semantic shifts»: A database for THE typology of semantic evolution

Описание «Каталога семантических переходов» — базы данных, включающей регулярные семантические переходы, воспроизводимые в различных языках мира. Данная база служит для систематизации и изучения типологии семантических изменений.

             В течение последних пяти лет в Москве авторским коллективом[2] под руководством Анны А. Зализняк  ведется работа по созданию базы данных  регулярно воспроизводимых лексико-семантических изменений, засвидетельствованных в различных языках мира.

             Единицей этой базы данных является семантический переход. Подробное обоснование этого понятия приводится в работах (Зализняк 2001, Зализняк 2006, стр. 399-402). Схематически, семантический переход можно обозначить как пару <значение А, значение Б>, на которой определено отношение семантической производности. При этом в каталог включаются не все возможные семантические переходы, а лишь те, которые реализуются в языке определенным образом. В каталог включаются лишь те семантические переходы, которые имеют две независимые реализации. Мы выделяем следующие типы реализаций семантических переходов:

             1. Полисемия: оба значения  А и Б  присутствуют у одного и того же слова. При этом, в каталог не включаются слишком близкие значения, такие как, например,  резать ‘разделять на части с помощью острого предмета’ и резать ‘убивать с помощью острого предмета' (как, например, в "резать скот"). Не подходят для каталога и переходы, связанные отношениями регулярной метонимии, например, «автор-произведение», «контейнер - содержимое» и т.п.  Подробнее о величине смысловой дистанции, необходимой для постулирования семантического перехода см. в  (Зализняк 2006, стр.410).Очень сложным является разграничение для многих лексем полисемии  vs. наличия обобщенного концепта, пусть даже передаваемого в других языках двумя или более различными понятиями. Так, известно, что английские слова hand и arm передаются одним русским словом рука. В отдельных работах принимается решение, что русское слово рука представляет собой полисемичное слово со значениями ‘кисть; рабочий орган; предплечье’.  Аналогичный случай — наличие в ряде языков отдельных лексем со значениями ‘теленок до года’ / ‘теленок двух лет’ и т.п. Можно ли говорить о том, что в тех языках, где используется только лексема со значением ‘теленок’ и не выделяются отдельно термины для телят различного возраста, слово теленок является полисемичным и в нем надо выделять значения ‘теленок до года’ / ‘теленок двух лет’? По-видимому, нет, поскольку такое решение может обессмыслить всю идею типологии семантических изменений и привести к выделению ряда отдельных значений практически в любом слове, кроме, быть может, семантических примитивов. По этой причине в нашей базе такие случаи выделяются в особую подгруппу, называемую «синкретизм». Примеры с синкретичным выражением  определенной пары значений включаются в базу лишь в тех случаях, когда имеются примеры из иных языков, где наличествует семантический переход между этими значениями, реализации которого относятся к иным типам (см. ниже).

             2. Семантическая эволюция  - изменение значения слова на разных временных срезах одного и того же языка. Ср. ст.-фр. labourer ‘работать’ > фр. labourer ‘пахать’.

             3. Когнаты. Лексемы с двумя значениями, находящимися в отношении семантической производности, в родственных языках восходят к одной лексеме праязыка, в которой предположительно отсутствует соответствующая полисемия. Ср. лит. nagà ‘копыто’ и рус. нога, которые восходят к общему балтославянскому корню со значением ‘ноготь’ (см. Фасмер 3, 78-79). При этом, если, как в данном случае, значение представлено в нескольких близкородственных языках (укр. нога, болг. нога, чеш. noha, пол. noga ‘нога’и т.д.), то для иллюстрации реализации данного перехода выбирается лишь один язык, а другие указываются в комментарии к переходу.

             4. Заимствование. Своего рода семантическая адаптация иноязычных слов, в ходе которой может существенно измениться значение слова. Так, например, заимствованное в румынский язык a munci ‘работать’ восходит к общеславянскому глаголу со значением ‘мучить’.

            

             5. Морфологическая деривация. Случаи образования новых значений при добавлении аффиксов. Например, переход ‘любить’ – ‘любой’, представленный такими реализациями как: рус. любитьлюбой, авар. boLd ize ‘любить’ - boLarab ‘любой’, нем. lieben ‘любить’ - beliebig ‘любой’, исп. querer ‘любить’ – cualquier ‘любой’.

При этом значение, получаемое в результате морфологической деривации должно быть идиоматичным, то есть в каталог не включаются те значения, которые аддитивно выводятся из значений корня и аффикса. Так, примеры типа учитьучитель не подходят для каталога, поскольку значение учитель однозначно выводится из сочетания морфем учи-‘преподавать’  и –тельNomen Actoris’.

             6. Грамматикализация. Это отношение устанавливается между лексемой и конструкцией, включающей данную лексему и передающую грамматическое значение. Так, португальский глагол chegar ‘приходить’ используется в составе грамматической конструкции (с инфинитивом) со значением ‘начинать делать’. Тем не менее, случаи грамматикализации рассматриваются в каталоге достаточно редко. Основное внимание сосредоточено на семантических изменениях внутри лексической системы. Отчасти это связано с тем, что вопросы типологии грамматикализации достаточно обширно рассмотрены в работе [Heine, Kuteva], тогда как по типологии семантических изменений, не связанных с грамматикализацией, широкомасштабные типологические исследования не предпринимались.

             В качестве участников перехода — значений А и Б — могут выступать не только конкретные значения, но и «переменные». В базе данных такие переменные заключаются в угловые скобки. Применение переменных можно проиллюстрировать, например, следующим переходом:

<иностранец> →  ‘таракан’, представленным такими реализациями как чеш. šváb ‘таракан; шваб’, рус. пруссак ‘таракан; житель Пруссии’, кроме того, в словаре Даля и в Словаре русских народных говоров значение ‘таракан’ зафиксировано для слов цыган, швед, француз, немец, чудак (<чудь),  киргиз. В средневековых Сиене и Флоренции тараканов называли соответственно «флорентиец» и  «сиенец».

Другой пример семантического перехода с использованием переменной в обозначении значения, участвующего в переходе: круг → <денежная единица>. Он представлен, в частности, такими реализациями:

 монг. төгөриг ‘круг; тугрик’; яп. en ‘круг; иена’; кит. yuan2 ‘круглый, круг; юань’.

             Помимо указанных типов реализаций можно указать еще один интересный тип — семантические кальки. Семантические кальки часто описываются просто как буквальный поморфемный или пословный перевод иноязычного слова или выражения. Представляется, что семантические кальки, в действительности, являются не чем иным, как заимствованием из другого языка непосредственно семантического перехода.  Сама возможность заимствования семантического перехода говорит о том, что семантический переход представляет собой особую сущность, отдельную единицу языковой системы, заслуживающую внимания лингвистов.

             Для случая, если некоторый семантический переход представлен в языке L, а в языке L1 этот семантический переход был заимствован (калькирован), мы не можем говорить о двух независимых реализациях одного семантического перехода. Использование таких примеров может затемнить картину типологии семантических изменений, принципов семантической эволюции. Однако интересно то, что некоторые семантические переходы легко калькируются в другие языки и распространяются по многим соседним языкам, тогда как другие переходы так и остаются одиночными. Кроме того, во многих случаях крайне сложно определить, имеем ли мы дело с независимым развитием или с калькой.  Калькирование может происходить только в том случае, если а) носитель языка-акцептора хорошо владеет также и языком-донором и б) метафора, стоящая за данным семантическим переходом, хорошо понятна человеку, говорящему на языке-акцепторе. Именно поэтому кальки мы все же включаем в каталог, снабжая их по возможности отдельным комментарием. Тем не менее, необходимо помнить, что для типологии семантических изменений, прежде всего, показательны семантические переходы, засвидетельствованные в нескольких, желательно неродственных на уровне семьи, языках, носители которых не связаны общей культурной традицией.

             Продемонстрировать сложность установления путей распространения семантических переходов можно на нижеследующем примере. В языках Евразии распространена модель обозначения пресной, питьевой воды (в противопоставлении с соленой) как сладкой. В качестве реализации перехода сладкий (1) > пресный (2) в каталоге имеются следующие примеры:  др.-гр. γλυκύς ‘1; 2’; лат. dulcis ‘1, 2’; фр. douce ‘1; 2’; ит. dolce ‘1; 2’; англ. sweet ‘1; 2’; нем. Süß ‘1’, Süßwasser ‘пресная вода’; швед. söt ‘1’,  sötvatten 'пресная вода'; ст.-слав. сладъкъ ‘1; 2’ (ср. контекст: дьнесь моръскыѩ сланыѩ воды сладькы бываѭтъ 'ныне соленые морские воды становятся пресными'); c.-x. сладак ‘1;2’; венг. édes ‘1’, édesvíz 'пресная вода'; фин. makea ‘1;2’; иврит מתוק  ‘1,2’; араб. ulw- ‘1; 2’; туркм. süÿji ‘1; 2’; тур. tatlı ‘1, 2’; аз. şirin ‘1, 2’. На первый взгляд, кажется, что разнообразие примеров чрезвычайно велико, однако, при внимательном анализе оказывается, что не все приведенные примеры представляют собой независимое развитие.  Есть основания полагать, что латинское семантическое развитие калькировано из греческого. Романские языки (ит., фр.) унаследовали соответствующую полисемию из латыни. Германская полисемия (англ., нем., шв.) объясняется влиянием французского языка и латыни. Венгерское употребление калькировано из немецкого, а финское – из шведского. Старославянский и сербохорватский примеры калькируют греческую модель (первые употребления встречаются в переводных с греческого религиозных текстах). Огузские языки (турк., аз., тур.) копируют семантическое развитие с арабского. Таким образом, независимым развитием можно признать лишь семитскую и древнегреческую модели, хотя и нельзя утверждать, что между ними не могло быть взаимного влияния.  Тем не менее, возможно, что в этом случае одновременно имеет место и калькирование и внутриязыковая мотивация,  тем более, что близость вкусов "сладкий" и «пресный» имеет свое основание и в физиологии (вкус пресной воды после того, как попробовал соленую воду, кажется сладким).

             В настоящее время в базе находятся около 400 переходов, соответствующих всем требованиям, предъявляемым к переходу, и еще около 1000 переходов, которые, с большой степенью вероятности, также окажутся воспроизводимыми, однако пока представлены только одной реализацией, либо находятся в стадии обсуждения.

             Создание такого каталога преследует следующие цели.

             Во-первых, наличие подробной фактографической базы регулярно воспроизводимых в языках мира семантических переходов может послужить основой для проверки типологической достоверности предлагаемых этимологий при создании этимологических словарей. Так, сопоставление между собой слов со значениями «дом» и «жениться» может, на первый взгляд, выглядеть странным, однако наличие таких типологических семантических параллелей, как тур. ev ‘дом’ – evle- ‘жениться’ и монг. ger ‘дом’ – gerle- ‘жениться’ (где le- стандартный аффикс, образующий глаголы от именных основ) делает подобную этимологию существенно более надежной.  В каталог включаются только те реализации, которые представляют собой реально засвидетельствованный в памятниках или живых языках семантический переход. Во избежание появления «порочного круга» значения, реконструируемые для праиндоевропейского, праалтайского и других праязыков, не принимаются в расчет при поиске реализаций для переходов.

             Во-вторых, с помощью такой базы данных можно производить исследования мотивации семантических переходов в языках мира.

             В-третьих, можно, хотя бы приблизительно, оценить степень распространенности ряда семантических переходов в языках мира, выделить общие метафоры, свойственные носителям разных культур (в частности, можно проверять, являются ли близкими к универсальным такие семантические переходы как «голова - начало», «правый - правильный», «низкий  - плохой», «глаз - отверстие» и т.п.). Кроме того, наличие такой базы позволяет ставить вопросы, как о наличии фреквенталий семантических изменений, так и о наличии импликационных фреквенталий (например, такого рода: если в языке зафиксирована полисемия ‘север, полночь’, то в нем будет присутствовать и полисемия ‘юг, полдень’).

             В-четвертых, учет в базе данных семантических калек позволяет проследить пути распространения культурных влияний в языках мира.

             Для некоторых переходов удается обнаружить больше реализаций, чем для других.  Отчасти это связано со свойствами самих переходов, отчасти со степенью проработанности соответствующих групп лексики.

Приведем пять переходов, представленных наибольшим количеством реализаций в нашем словаре.

1. ‘схватить’  > ‘понять’ (23 реализации): 

англ. grasp ‘схватить; понять’ (полисемия); лат. capere ‘поймать’ > ит. capire  'понять' (эволюция), рус. пойматьпонять (деривация), рус. хапать  - чеш. chápati ‘понимать’ (когнаты), арм. ařnel ‘брать’, 'понимать (слово, выражение)' (полисемия); мокш. фатямс ‘схватить; догадаться’, тиб. adzin-pa 'хватать, схватывать; понимать, постигать' (полисемия) и т.п.

2. ‘мальчик’ > ‘слуга’  (18 реализаций):

др.-англ. cniht 'мальчик, слуга' (полисемия), кирг. малай ‘холоп, батрак’ (заимств. из рус. малый), арм. tła ‘мальчик, слуга’ (полисемия), кит. tóng ‘мальчик; слуга’,  нем. Knabe ‘мальчик’ – англ. knave ‘слуга, лакей’ (когнаты) и т.п..

3. ‘спина’ > ‘горный хребет’ (18 реализаций):

лат. dorsum ‘спина; хребет, возвышенность’; лак. бархI ‘спина, горный хребет’; болг. гръб ‘спина; гребень горы, возвышенность’; хак. арға ‘спина; горный хребет’; осет. par 'спина; горный хребет'; фин. selkä ‘спина; кряж, возвышенность’; монг. нуруу ‘спинной хребет; горная цепь’ (полисемия); арм. вогн ‘спинной позвонок’ > вогунк ‘горная цепь’ (деривация)  и т.п.

4. ‘исчислять’ – ‘иметь мнение’ (17 реализаций):

нан. бодо- ‘исчислять; считать кого-л. кем-л.'; рус. считать ‘исчислять; считать кого-л. кем-л.’; фр. compter ‘вести счет; иметь мнение’; кит. suàn ‘считать, подсчитывать; полагать, думать’; геез ʷallaʷa ‘считать, исчислять; считать кем-л.’ (полисемия) и т.п.

5. ‘вращаться' – ‘становиться’ (15 реализаций):

аз. dön- ‘поворачиваться, переворачиваться; превращаться’; лат. verto ‘вращать; превращать’; саам. коаввсэ ‘повернуться, обернуться; становиться похожим, превращаться’; геез gabʔa ‘вернуться, повернуться; превратиться’ (полисемия) и т.п.

             В базе в настоящее время содержатся примеры из 162 языков, относящихся к различным языковым семьям: индоевропейской, алтайской, уральской, северокавказской, афроазиатской, сино-тибетской, австралийской, австроазиатской и чукото-камчатской.

Структура базы данных

             База данных использует платформу MS Access. Данные представлены в виде таблиц и форм. Отдельная статья каталога включает в себя две большие зоны: зона семантического перехода и зона его реализаций. Зона семантического перехода состоит из следующих полей:

1) Идентификационный номер семантического перехода;

2) Пара значений

3) Направление перехода. Указывается, если можно установить, какое из двух значений являлось исходным, а какое производным.

4) Автор перехода

5) Статус перехода (принятый, отложенный для дальнейшего обсуждения, еще не обсужденный)

6) Комментарии к переходу

Зона реализаций включает в себя следующие поля:

1) Язык лексемы 1. Язык лексемы 2.

2) Лексема 1. Лексема 2.

3) Перевод лексем 1 и 2.

4) Контекст употребления лексем 1 и 2.

5) Перевод контекста

6) Автор примера

7) Комментарий к примеру; источник примера.

Внутри базы возможен поиск по отдельным полям, создание отчета в формате pdf и ряд других функций.

             Кроме того, в базе каждое значение отнесено к одному или нескольким семантическим классам в соответствии со специальным семантическим рубрикатором. Такой рубрикатор позволяет искать в базе не только отдельные семантические переходы, но и рассматривать переходы из одного семантического класса в другой.  Так, благодаря рубрикатору, можно получить список переходов из класса АРТЕФАКТЫ в класс ЧАСТИ ТЕЛА или из класса ГЛАГОЛЫ ДВИЖЕНИЯ в класс МОДАЛЬНЫЕ ГЛАГОЛЫ.


Сокращения названий языков:

авар. – аварский

аз. – азербайджанский

англ. – английский

араб. - арабский

арм. – армянский

болг. – болгарский

венг. – венгерский

др.-англ. – древнеанглийский

др.-гр. — древнегреческий

исп. – испанский

ит. – итальянский

кирг. – киргизский

кит. – китайский

лак. – лакский

лат. – латинский

лит. – литовский

мокш. – мокшанский диал. мордовского

монг. – монгольский

нан. – нанайский

нем. – немецкий

осет. – осетинский

пол. – польский

рус. – русский

саам. – саамский

ст.-слав. – старославянский

ст.-фр. – старофранцузский

c.-x. – сербохорватский

тиб. - тибетский

тур. – турецкий

укр. – украинский

фин. – финский

хак. – хакасский

чеш. – чешский

яп. – японский

Литература:

Зализняк Анна А. Семантическая деривация в синхронии и диахронии: проект создания «Каталога семантических переходов» // М.: Вопросы языкознания. 2001.№2.

Зализняк Анна А. Многозначность в языке и способы ее представления. Москва. Языки славянских культур. 2006.

Фасмер М. Этимологический словарь русского языка. т. 3 М., 1987.

B.Heine, T.Kuteva World Lexicon of grammaticalization. Cambridge: Cambridge University Press, 2002.



[1] Данная работа выполнена при поддержке гранта INTAS № 05-1000008-7917

[2] Состав авторского коллектива: А.А.Зализняк, М.С.Булах, Д.С. Ганенков, И.А.Грунтов, Т.А.Майсак, М.М.Руссо