ОПЫТ ПРИМЕНЕНИЯ МЕТОДОВ ДИСКУРСИВНО ОРИЕНТИРОВАННОЙ ТРАНСКРИПЦИИ К МАТЕРИАЛУ НЕИНДОЕВРОПЕЙСКОГО ЯЗЫКА[1]

APPLYING METHODS OF THE DISCOUSE-ORIENTED TRANSCRIPTION TO THE NON-INDO-EUROPEAN LANGUAGE

 

В. Л. Цуканова (zukanova@mail.ru)
РГГУ

 

В докладе рассматриваются особенности применения дискурсивной транскрипции, разработанной для корпуса русских текстов, к текстам на кувейтском диалекте арабского языка. Основное внимание уделяется нестандартному делению на дискурсивные единицы и связанным с этим грамматическим особенностям.

 

Доклад посвящен применению методов транскрипции, разработанной для анализа корпуса устной детской речи (рассказы о сновидениях) к материалу корпуса устных рассказов на кувейтском диалекте арабского языка.

Разработка транскрипции для русских устных рассказов ведется с 2003 г. исследовательской группой под руководством А.А. Кибрика и В.И. Подлесской. Разработанные принципы транскрибирования уже применялись к материалу других языков, например, к языку пулар [Коваль&Кибрик 2005], [Кибрик и др. 2006]. Дискурсивная транскрипция корпуса нарративов на кувейтском диалекте арабского языка осуществляется в рамках диссертационной работы «Употребление показателей структуры дискурса в устных нарративных текстах (на материале кувейтского диалекта арабского языка)». Она опирается на уже готовые критерии, разработанные для русского языка, однако при применении их естественным образом возникает ряд трудностей ввиду несовпадения синтаксиса и интонационной структуры двух языков.

В дискурсивно ориентированной транскрипции отмечаются прежде всего параметры, релевантные для дискурсивного анализа и построения ТРС-графов[2]. Одной из проблем при разработке такой транскрипции является деление текста на элементарные дискурсивные единицы (далее – ЭДЕ).  Дискурсивные единицы – это кванты, которыми порождается дискурс и которые являются узлами ТРС-графов. В дискурсивной транскрипции каждая ЭДЕ записывается отдельной строкой. Существует два критерия выделения ЭДЕ: семантико-синтаксический и интонационный. В соответствии с первым критерием ЭДЕ должна соответствовать предикации, в соответствии со вторым ЭДЕ должна совпадать с интонационной единицей. Основные проблемы при разбиении на ЭДЕ возникают в случае несовпадения этих двух критериев. Для русского языка выделен ряд типовых случаев, когда ЭДЕ меньше или больше предикации. Принципы транскрибирования довольно подробно рассмотрены в  [Кибрик, Подлесская 2003].

Другая проблема связана с представлением в дискурсивной транскрипции текста на иностранном языке, требующим глоссирования. Одна ЭДЕ должна быть, таким образом, записана четырьмя строками: первая представляет собственно дискурсивную транскрипцию, в которой отмечаются паузы, акценты, хезитации, фальстарты, пунктуационные знаки и некоторые другие явления. Второй строкой идет поморфемное представление, третьей глоссы и четвертой перевод:

(1) S2

ee(0.6) ..(0.2) ›iћna  kinna        kill              /\yџm ee(0.6)  nidfa‹                                      adaqah.

                         ›iћna  kin-na                     kill              yџm   ni-dfa‹                                  °adaq-ah

                          мы     быть.PFV-1PL  каждый   день.SG      1PL-платить.IPFV               милостыня-F.SG

Мы каждый день платили милостыню.

Ввиду того, что проблематикой доклада является деление на ЭДЕ, мы не будем приводить первую строку полностью, а будем лишь отмечать в строке, содержащей поморфемное членение, релевантные для рассматриваемых вопросов параметры. Если пример содержит несколько ЭДЕ, то перевод приводится отдельно для каждой из них. Перед каждым примером стоит номер текста, принятый в корпусе.

ЭДЕ, совпадающие с предикациями

Приведем по одному примеру наиболее типичного случая из обоих корпусов, где ЭДЕ совпадают с предикациями, и выделение их не вызывает сомнений:

(2) N42

/Ну и я шла по этому /саду,

..(0.4) и /куда-то дошла до какой-то \двери.

...(0.9) Поднялась по /лестнице,

и \дошла вот до этой \двери.

(3) S1

јna          gј‹id        ›a-dris,

я              PROG     1SG-учиться.IPFV

«[…] я учусь,

 

јna         ›a-ћibb                                   id-dirјs-a!

я              1SG-любить.IPFV                DEF-учеба-F.SG

я люблю учебу!

 

Uu          ›enti        sawwі-t-i                                l-baћt                                      hј-da,

и             ты.F        делать.II.PFV-2-SG               DEF-задание.SG                   этот-M.SG

А ты сделала        это задание,

 

illї                            gјl-џ                                        l#eѕ                         ‹ann#a?”

который                сказать.PFV-3PL  к#тебе.F                о#нем

о котором тебе сказали?»

ЭДЕ, меньшие, чем предикации

В русском корпусе к ним относятся: вынесенные топики, парцелляции (вербализация составляющей после основной части предикации), разрыв предикации, фальстарт (говорящий отказывается от ЭДЕ, которую он уже начал строить), регуляторные ЭДЕ (состоящие исключительно из дискурсивных маркеров).

 

Топикализация

Вынесенный топик в русском корпусе считается самостоятельной ДЕ, если он представляет собой вынесенную в начало клаузы именную группу (обычно в именительном падеже), несущую восходящий акцент, которая предшествует основной предикации и имеет в ней кореферентную местоименную копию:

(4) Z33

..(0.3) /Зайчик вот,

...(0.5) он был в \лесу.

В случае, когда такая ИГ не несет на себе акцента, или имеет падающий тон, или не имеет кореферентной копии внутри последующей клаузы, она не рассматривается как вынесенный топик и в отдельную строку не выделяется.

В кувейтском корпусе наблюдается несколько иная ситуация. Топик может предшествовать или следовать за именной группой, имеющей кореферентную ему местоименную копию, причем он может быть вынесен не только в начало или конец всей предикации, но и в середину ее.

Вынос топика в конец клаузы, на топике восходящий акцент:

(5) S1

\ћallam-t#nї,         

присниться.II.PFV-1SG#мне

приснилась я себе

 

/›јna,

я

я

Вынос топика перед ИГ с кореферентной местоименной копией, на топике восходящий акцент:

(6) S1

Ya-‹nї                            ma-frў¦                                                

3.M-значить.IPFV[SG]     PTCP-предполагать.P.SG 

Значит, предполагается   

   

sјћ-a-t                    /il-madras-a,

площадь-F.SG-C  DEF-школа-F.SG

что площадь школы,

 

a-љўf#hј                                               iddјm#ї,

1SG-смотреть.IPFV#ее      перед#мной

увижу ее перед собой,

Вынос топика перед ИГ с кореферентной местоименной копией внутри одной предикации, на топике нет акцента:

(7) Р2

/Rјћ                                        yє-љўf,               

пойти.PFV[3SG.M]              3.M-увидеть.IPFV[SG]       

Пошел посмотреть,

 

љinў       zџґ-t#a                   \‹inda#ha.

что         жена-F.C#его       у#нее

что есть у его жены.

Представляется осмысленным для кувейтского диалекта выделять вынесенный топик в отдельную ЭДЕ только в том случае, если он вынесен в начало или конец предикации и на нем есть акцент, то есть он представляет собой независимую интонационную единицу, вне зависимости от его позиции по отношению к ИГ с местоименной копией.

 

Регуляторные ЭДЕ

Регуляторные ЭДЕ состоят из дискурсивных маркеров, регулирующих структуру дискурса. Они делятся на несколько классов, из них в отношении кувейтского корпуса интересны финальные и подготовительные.

Финальные ДЕ сигнализируют о завершении некоторого фрагмента. В примере (8) из русского корпуса эту роль выполняет вот в сочетании с другим дискурсивным маркером:

(8) Z12

...(0.7) /Ну я там /помню,

..(0.1) что-о' я там ….(1.1) ну с моим /другом ...(0.5) \разговаривал я.

....(2.9) Ну –вот.

/Потом ==

В кувейтском диалекте ту же роль выполняет маркер nzeyn:

(9) S1

ul#›a-љўf                                               sјћ-a-t                                     il-mal›ab,

и#1SG-смотреть.IPFV        площадь-F.SG-C  DEF-стадион.SG

а я вижу площадь стадиона,

 

/nzіn,

NZEYN

вот,

 

u#›јna    balј          ґўtї,

и#я                         без          туфли.PL

и я без туфлей,

Похожую функцию выполняет маркер ilmuhimm, стоящий в начале эпизода. Оба маркера могут как нести на себе акцент, так и составлять одну интонационную единицу с главной предикацией. Тем не менее, в обоих случаях они выделяются в отдельную ЭДЕ.

(10) S2

\Il-muhimm,          

DEF-главное.SG 

Ну вот,

 

\waddey-t                              zџґ#i ==

отвезти.II.PFV-1SG              муж.SG#мой

я отвезла моего мужа

 

raddey-t#a                                            l-beyt,

вернуть.II.PFV-1SG#его    DEF-дом.SG

отправила его домой        

То же в случае сочетания этих маркеров с другими маркерами или служебными словами:

(11) Р5

Bass ›inn#a                           /l-muhimm,

но           что#его                 DEF-главное.SG  

Но что главное,

 

љarј                                        /s-sayyјr-a,

купить.PFV[3SG.M]            DEF-машина-F.SG

он купил машину,

Подготовительные дискурсивные маркеры (препаративная замена) используются говорящим при поиске вербализации, если говорящему уже известна часть речи или синтаксическая структура искомого фрагмента. В русском корпусе встречаются изменяемые маркеры этот, такой и неизменяемые это и так. Эти же типы мы видим и в кувейтских текстах: љisma ‘как его’ и hјda ‘этот’ могут согласовываться с искомым именем в роде и числе, маркер ѕedї ‘так’ неизменяем.

В примере (12) hјda находится в середине ЭДЕ и согласуется в роде с существительным:

(12) S2

°ј‹id-a                                     ‹ala          s-sayyјr-a                              li-zѓїr-a                                   \hј-dї

подняться.PTCP.A-F.SG    на            DEF-машина-F.SG              DEF-маленький-F.SG         этот-F.SG

...(0.5) ee(0.4) m= mјl-t         єl-yahhјl,

                                        ATTR-F.C     DEF-ребенок.PL

поднялась на маленькую машину эту… детскую,

ср. в русском корпусе:

(13) N54

..(0.3) «/Алёна \Игоревна@

А /вы –сегодня нас /поведёте в \этот ..(0.4) в –тренажёрный \зал?».

љisma  в середине ЭДЕ, не согласуется с последующим существительным:

(14) P4

Ba‹dіyn ѕјn               \yu-waddї#ha            љ#\ism#a                      ћagg       /zџґ-t#a,

потом    AUX    3M-нести.II.IPFV[SG]#ее    что#имя.SG#его   для          жена-F.C#его

Потом отнес ее это… к своей жене,

В кувейтском корпусе ни разу не встречается маркер препаративной замены в начале клаузы, и в отдельную регуляторную ЭДЕ они не выделяются. Для сравнения: в русском корпусе в отдельную ЭДЕ выделяются ударные неизменяемые подстановки это и так, если они стоят в начале клаузы:

(15) Z56

..(0.3)  \Это,

..(0.2) /бизнес-класс  ..(0.4) и'  ...(0.5)  и'  \дорогие классы.

Эти же маркеры могут встречаться в конечной позиции в мужском роде в значении незаконченного перечисления:

 (16) P11

mј              gam                              ya-‹ni                            <yi>-meyyiz,

NEG          стать.PFV[3SG.M]  3M-значить.IPFV[SG]   3M-различать.II.IPFV[SG]

Перестал, значит, различать

 

љinu       ґiddјm#<a>            u#/hј-da,

что         перед#ним           и#этот-M.SG

что перед ним и все такое,

(17) S1

u=fї=hј   mdarraґ-јt               u=ѕedї _

и=в=ней                ступенька-F.PL    и=так

и на ней                трибуны                и прочее

В этой позиции они не выделяются в отдельную ЭДЕ.

Универсальными для обоих языков оказываются проблемы парцелляций и фальстартов.

Парцелляции представляют собой случаи расщепления дискурсивной единицы на две, когда к уже завершенной предикации добавляется интонационно выделенный фрагмент.

Постпозитивные определения в русском языке практически всегда рассматриваются как парцеллированные:

(18) N47

...(0.6) Я' ..(0.4) \зашёл в /комнату,

в \большую,

В кувейтском диалекте их реже можно интерпретировать таким образом, так как прилагательные и другие виды определений (изафетная конструкция, бессоюзные определительные придаточные) следуют обычно в постпозиции к имени, так что разбиение на две ЭДЕ возможно только при очевидном интонационном выделении:

(19) Р5

‹aґb-at#a                                               \sayyјr-a,

нравится.PFV-3SG.F#ему DEF-машина-F.SG

понравилась ему машина,

 

....(1.4) \ћilw-a,

                     красивый-F.SG

красивая,

 

lџn#ha   \ћilu,

цвет.SG#ее           красивый.SG

красивого цвета,

 

..(0.3) u#љakil#ha                                 \ћilu,

           и#форма.SG#ее       красивый.SG

красивой формы,

 

u#\spџrt.

и#спорт

и спортивная.

Остальные виды парцелляций – дополнений, обстоятельств, сочиненных групп – встречаются в обоих корпусах, ср., например, парцелляцию сочиненных именных групп:

(20) N32

…(0.5)  ''(0.2)  …(0.9)  И /он с 'эххэ(0.6) с‑c ..(0.4) \длинными ...(0.6) '''(0.6) такими вьющи= ээ(0.2) =мися ''(0.3) \светлыми /волосами,

...(0.7) ээ(0.2) и с \сумкой ээ(0.1) за \плечами.

...(0.5) {ЦОКАНЬЕ} ..(0.2) И || и с \верёвкой' в \руках.                         

(21) Р3

Ligј                                         inda#ha                \љєnј©                   u#addt \makiyјњ      u#kull    ey.

нашел.PFV[3SG.M]             у#нее                     сумка.PL               и#предмет-F.PL   макияж.SG   и#все      вещь.SG

Нашел   у нее     сумки, и предметы макияжа, и всё.

 

...(0.5) U#–sa‹-јt   u#\zїn-a.

            и#часы-F.PL            и#украшение-F.SG

И часы, и украшения.

Фальстарты, по-видимому, представляют собой универсальное языковое явление, которое мы здесь подробно рассматривать не будем. Приведем пример фальстарта, влияющего на деление ЭДЕ:

(22) S3

°јr                                            єl= ==

стать.PFV[3SG.M]               DEF

Настал ==

 

Kјn                                                       љuѓl                        hnї          yџm        ‹јљўra.

быть. PFV[3SG.M]                есть         работа.SG               здесь       день.SG  Ашура

Была здесь работа в день Ашура.

ЭДЕ, большие, чем предикации

ЭДЕ большие, чем предикации, возникают в случае редукции одного из предикатов до статуса цитационного или эпистемического маркера, в некоторых сложных предложениях и при сериализации. 

Цитации

В кувейтском корпусе, в отличие от русского, глагол, вводящий прямую речь, не встречается после или внутри цитации, а всегда предшествует ей. Часто он бывает неакцентирован, хотя не редуцируется так сильно, как в русском, всегда представляет собой отдельное фонетическое слово и поэтому записывается отдельной строкой. Так, в примере (23) на вводящем предикате нет акцента, несмотря на то, что он представляет собой аналитическую форму глагола, а в примере (24) есть, хотя это более короткое фонетическое слово, а формы в данном контексте синонимичны:

(23) Р2

Ѕјn                          yi-gўl:

AUX      3.M-сказать.IPFV[SG]

Сказал:

 

“/Wјyid                 ѓјli!”

   очень                  дорогой.SG

«Очень дорого!»

(24) Р5

\Gјl:

сказать.PFV[3SG.M]

Сказал:

 

“Lј›         lј›             \ђa®ј°.”

NEG                        NEG        всё

«Нет, нет, всё.»

Ср. пример из русского корпуса, где цитационный маркер сильно редуцирован и не выделяется в отдельную ЭДЕ:

(25) N54

говорю «/Давай я всё \сделаю¡»

В случае перестройки косвенной речи в прямую союз, вводящий косвенную речь, записывается одной строкой с последующей цитацией:

(26) Р5

fa            ga‹          yi-gўl                                      lu#hum,

и             PROG     3.M-сказать.IPFV[SG]         к#ним

и говорит им,

 

єnn#a     “›јna       mi-ћtјr.”

что#он     я           PTCP-быть.в.замешательстве.A.SG

что «Я в замешательстве.»

Эпистемические маркеры.

Существует ряд предикатов, которые лексикализовались в эпистемические маркеры и не выделяются в отдельную ЭДЕ. Самыми частотными из них в кувейтском корпусе являются ya‹ni ‘значит’ и wa®®a ‘ей-Богу’:

(27) S2

Wa#®®a       ya-‹ni                                     hј-da               al-ћїn                      a-rawwї#ѕ                                      iyyј#0,

ей#Бог.SG  3M-значить.IPFV[SG]  этот-SG.M DEF-время.SG        1SG-показать.II.IPFV#тебе.F ACC#его

Ей-Богу, значит, это сейчас покажу тебе.

Ср. пример из русского корпуса, содержащий лексикализованные предикаты:

(28) Z55

Значит мне /снится,

что я где-то на –приро-оде_

Вотh ..(0.3) кажется на /даче,

но /я вот там ни разу не \была.

Проблема сложных предложений.

В кувейтском корпусе встречаются сложные предложения такой структуры, в которой сложно определить границы клауз и, соответственно, ЭДЕ.

Прежде всего, это предложения с сочинительным союзом u (ul), зависимая часть которых часто содержит не финитный глагол, а причастие или нулевой предикат. Тем не менее, подобные предложения в арабском языке являются сложноподчиненными [Бронников 1998].

(29) Р8

ћarram                                    marr-a                     tјniy-a

запретить.II.PFV[3SG.M]   раз-F.SG                второй-F.SG

Зарекся в другой раз

 

›єnn#a                   /yi-lab,

что#он                  3.M-играть.IPFV[SG]

заниматься (спортом),

 

u#huwa јrib.

и#он                      пить.PTCP.A.SG

когда выпьет (= и он выпивший).

(30) Р2

Kјn                                                         fї              /rayyјl,                                   

быть.PFV[3SG.M]                                есть        мужчина.SG                        

Жил-был мужчина

 

...(0.7) u#ma         \‹јil-a

                    и#с                     семья-F.SG

с семьей.

В примере (30), помимо синтаксических, есть еще просодические критерии, по которым следует рассматривать эти части предложения как две ЭДЕ: наличие двух несущих акцентов. Однако возможна ситуация (не встретившаяся в корпусе), когда акцент на зависимой части отсутствует. В таком случае интонационный критерий будет превалировать над синтаксическим, и обе части будут объединены в одну ЭДЕ.

Другой вид сложных предложений, представляющий определенные трудности – это определительные придаточные при отсутствии относительного местоимения или с нулевым предикатом.

В примере (31) относительное местоимение невозможно ввиду того, что вершинное существительное ‘мужчина’ стоит в неопределенном состоянии; обе клаузы составляют одну интонационную единицу:

(31) P6

\kјn                         aku          \hnјk       rayyјl                      ism#a                      /Miљјri,

быть.PFV[3SG.M]                есть        там         мужчина.SG         имя.SG#его          Мишари

Там был человек по имени Мишари,

В примере (32) присутствует относительное местоимение, но в придаточном – нулевой предикат, и один несущий акцент на все предложение:

(32) P6

U#ba‹dіyn             bє#°єdf-a                               huwa      gј‹id        yi-љўf                                     il-›aљyј

и#потом  с#неожиданность-F.SG         он            PROG     3M-видеть.IPFV[SG]            DEF-вещь.PL

 

illi                            dјђil         /il-vitrїna,

который внутри    DEF-витрина

А потом он неожиданно видит вещи внутри витрины,

Есть и обратный пример, с нулевым предикатом в главной клаузе:

(33) S2

Is= itna‹aљ                            bi#/l-lіyl                 illi                            \џkey      °јr.

      двенадцать     в#DEF-ночь.SG    который                окей       стать.PFV[3SG.M]

В двенадцать ночи наладилось.

Во всех вышеприведенных примерах сложноподчиненные предложения записываются как одна ЭДЕ, что, как нам кажется, соответствует психологической реальности. Однако есть примеры относительных придаточных, представляющих разные интонационные единицы и записывающиеся в две ЭДЕ. Так, в примере (34) в главной части нулевой предикат, а в зависимой – нефинитная глагольная форма (страдательное причастие), но есть два четко выраженных несущих акцента:

(34) Р3

љinў       /l-›aљyј›,

что         DEF-вещь.PL

что за вещи

 

illї                            /ma-wґўd-a                            \‹inda#ha.

который                PTCP-находить.P-F.SG       у#нее

имеются у нее.

Следующий тип связи между предикатами, не представляющий особой трудности, но на который необходимо обратить внимание – это бессоюзное подчинение финитных форм глагола в сентенциальных актантах:

(35) Р1

rјћ                                           /yє-љўf                                  aѓrј¦                                        /zџґ-t#a,

пойти.PFV[3SG.M]              3.M-увидеть.IPFV[SG]        вещь.PL                 жена-F.C#его

пошел посмотреть вещи своей жены,

(36) S3

mј      gјm                                          \yi-љўf.

NEG        стать.PFV[3SG.M]                3.M-увидеть.IPFV[SG]

перестал видеть.

Такие случаи всегда записывают как одна ЭДЕ. В русском языке им обычно соответствуют инфинитивные конструкции:

(37) N48

Он стал носить эту /лягушку на \голове.

Также общим явлением для двух языков оказывается сериализация предикатов, ср.:

(38) Р3

Fa#rјћ                                    љјf                                           fi#ѓurf-a-t#ha       

и#пойти.PFV[3SG.M]         увидеть.PFV[3SG.M]           в#комната-F.SG-C#ее

И пошел                                                посмотрел                            в ее комнату

(39) N54

мы /взяли \поменяли /кровати,

Заключение

Принципы дискурсивно ориентированной транскрипции, разработанные для русского языка, в основном успешно применяются к материалу языков другого типа и позволяют выявить некоторые их дискурсивно релевантные особенности.

По умолчанию (не отмечаются ввиду наибольшей частотности): у имен -  мужской род, неопределенное состояние, у глаголов: I порода, активный залог.

 

Условные обозначения

#                    граница клитики

=                    фальстарт

/, \, /\                             направление движения тона

..(0.1)                            паузы

@                  обращение

¡                     директив

а                    несущий акцент

1,2,3                              1-е, 2-е, 3-е лицо

II, IIIX     производные породы глагола

A                   актив

ACC                             аккузатив

ATTR                           атрибутив

 

AUX                             вспомогательный глагол

C                   сопряженное состояние

DEF                              определенный артикль

F                    женский род

IPFV                             имперфектив

M                  мужской род

NEG                              отрицание

P                    пассив

PFV                               перфектив

PL                 множественное число

PROG                           прогрессив

PTCP                            причастие

SG                 единственное число

 

 

Список литературы

1.        Бронников Г.К. Предложения с союзом wa в арабском языке. Дипломная работа. М.: РГГУ, 1998.

2.        Кибрик А.А., Подлесская В.И. К созданию корпусов устной русской речи: принципы транскрибирования. // Научно-техническая информация, серия 2, №10, 2003 г., стр 5-12.

3.        Кибрик А.А., Ба А.Й., Коваль А.И. Сказание «любовь», или «дингирал», на языке пулар. // Африканская сказка – III. К исследованию языка фольклора. М.: Восточная литература, 2006 (в печати). С. 399-479.

4.        Коваль А.И., Кибрик А.А. Дискурс гриота. // Четвертая типологическая школа. Тезисы докладов. М, 2005.

5.        Mann W.C., Thompson S.A. 1988. Rhetorical structure theory: toward a functional theory of text organization. Text, 8, 243-281.


 



[1] Исследование поддержано грантом РГНФ № 04-04-00220А.

[2] ТРС-граф – граф, отражающий дискурсивные отношения между частями текста в терминах Теории риторических структур Манна и Томпсон [Mann, Thompson 1988].