ОПЫТ ПРИМЕНЕНИЯ МЕТОДОВ
ДИСКУРСИВНО ОРИЕНТИРОВАННОЙ ТРАНСКРИПЦИИ К МАТЕРИАЛУ НЕИНДОЕВРОПЕЙСКОГО ЯЗЫКА[1]
В. Л. Цуканова (zukanova@mail.ru)
РГГУ
В докладе рассматриваются особенности применения дискурсивной транскрипции, разработанной для корпуса русских текстов, к текстам на кувейтском диалекте арабского языка. Основное внимание уделяется нестандартному делению на дискурсивные единицы и связанным с этим грамматическим особенностям.
Доклад посвящен применению методов транскрипции, разработанной для анализа корпуса устной детской речи (рассказы о сновидениях) к материалу корпуса устных рассказов на кувейтском диалекте арабского языка.
Разработка транскрипции для русских устных рассказов ведется
с
В дискурсивно ориентированной транскрипции отмечаются прежде всего параметры, релевантные для дискурсивного анализа и построения ТРС-графов[2]. Одной из проблем при разработке такой транскрипции является деление текста на элементарные дискурсивные единицы (далее – ЭДЕ). Дискурсивные единицы – это кванты, которыми порождается дискурс и которые являются узлами ТРС-графов. В дискурсивной транскрипции каждая ЭДЕ записывается отдельной строкой. Существует два критерия выделения ЭДЕ: семантико-синтаксический и интонационный. В соответствии с первым критерием ЭДЕ должна соответствовать предикации, в соответствии со вторым ЭДЕ должна совпадать с интонационной единицей. Основные проблемы при разбиении на ЭДЕ возникают в случае несовпадения этих двух критериев. Для русского языка выделен ряд типовых случаев, когда ЭДЕ меньше или больше предикации. Принципы транскрибирования довольно подробно рассмотрены в [Кибрик, Подлесская 2003].
Другая проблема связана с представлением в дискурсивной транскрипции текста на иностранном языке, требующим глоссирования. Одна ЭДЕ должна быть, таким образом, записана четырьмя строками: первая представляет собственно дискурсивную транскрипцию, в которой отмечаются паузы, акценты, хезитации, фальстарты, пунктуационные знаки и некоторые другие явления. Второй строкой идет поморфемное представление, третьей глоссы и четвертой перевод:
(1) S2
ee(0.6) ..(0.2) ›iћna kinna kill /\yџm ee(0.6)
nidfa‹ \°adaqah.
›iћna kin-na kill yџm ni-dfa‹ °adaq-ah
мы быть.PFV-1PL каждый день.SG 1PL-платить.IPFV милостыня-F.SG
Мы каждый день платили милостыню.
Ввиду того, что проблематикой доклада является деление на ЭДЕ, мы не будем приводить первую строку полностью, а будем лишь отмечать в строке, содержащей поморфемное членение, релевантные для рассматриваемых вопросов параметры. Если пример содержит несколько ЭДЕ, то перевод приводится отдельно для каждой из них. Перед каждым примером стоит номер текста, принятый в корпусе.
Приведем по одному примеру наиболее типичного случая из обоих корпусов, где ЭДЕ совпадают с предикациями, и выделение их не вызывает сомнений:
(2) N42
/Ну и я шла по этому /саду,
..(0.4) и /куда-то дошла
до какой-то \двери.
...(0.9) Поднялась по /лестнице,
и \дошла вот до этой \двери.
(3) S1
јna gј‹id ›a-dris,
я PROG 1SG-учиться.IPFV
«[…] я учусь,
›јna ›a-ћibb id-dirјs-a!
я 1SG-любить.IPFV DEF-учеба-F.SG
я люблю учебу!
Uu ›enti
sawwі-t-i l-baћt hј-da,
и ты.F делать.II.PFV-2-SG DEF-задание.SG этот-M.SG
А ты сделала это задание,
illї gјl-џ l#eѕ ‹ann#a?”
который сказать.PFV-3PL к#тебе.F о#нем
о котором тебе сказали?»
В русском корпусе к ним относятся: вынесенные топики, парцелляции (вербализация составляющей после основной части предикации), разрыв предикации, фальстарт (говорящий отказывается от ЭДЕ, которую он уже начал строить), регуляторные ЭДЕ (состоящие исключительно из дискурсивных маркеров).
Топикализация
Вынесенный топик в русском корпусе считается самостоятельной ДЕ, если он представляет собой вынесенную в начало клаузы именную группу (обычно в именительном падеже), несущую восходящий акцент, которая предшествует основной предикации и имеет в ней кореферентную местоименную копию:
(4) Z33
..(0.3)
/Зайчик вот,
...(0.5) он был в \лесу.
В случае, когда такая ИГ не несет на себе акцента, или имеет падающий тон, или не имеет кореферентной копии внутри последующей клаузы, она не рассматривается как вынесенный топик и в отдельную строку не выделяется.
В кувейтском корпусе наблюдается несколько иная ситуация. Топик может предшествовать или следовать за именной группой, имеющей кореферентную ему местоименную копию, причем он может быть вынесен не только в начало или конец всей предикации, но и в середину ее.
Вынос топика в конец клаузы, на топике восходящий акцент:
(5) S1
\ћallam-t#nї,
присниться.II.PFV-1SG#мне
приснилась я себе
/›јna,
я
я
Вынос топика перед ИГ с кореферентной местоименной копией, на топике восходящий акцент:
(6) S1
Ya-‹nї ma-frў¦
3.M-значить.IPFV[SG]
PTCP-предполагать.P.SG
Значит, предполагается
sјћ-a-t /il-madras-a,
площадь-F.SG-C DEF-школа-F.SG
что площадь школы,
›a-љўf#hј \ґiddјm#ї,
1SG-смотреть.IPFV#ее перед#мной
увижу ее перед собой,
Вынос топика перед ИГ с кореферентной местоименной копией внутри одной предикации, на топике нет акцента:
(7) Р2
/Rјћ –yє-љўf,
пойти.PFV[3SG.M] 3.M-увидеть.IPFV[SG]
Пошел посмотреть,
љinў zџґ-t#a
\‹inda#ha.
что жена-F.C#его у#нее
что есть у его жены.
Представляется осмысленным для кувейтского диалекта выделять вынесенный топик в отдельную ЭДЕ только в том случае, если он вынесен в начало или конец предикации и на нем есть акцент, то есть он представляет собой независимую интонационную единицу, вне зависимости от его позиции по отношению к ИГ с местоименной копией.
Регуляторные ЭДЕ
Регуляторные ЭДЕ состоят из дискурсивных маркеров, регулирующих структуру дискурса. Они делятся на несколько классов, из них в отношении кувейтского корпуса интересны финальные и подготовительные.
Финальные ДЕ сигнализируют о завершении некоторого фрагмента. В примере (8) из русского корпуса эту роль выполняет вот в сочетании с другим дискурсивным маркером:
(8) Z12
...(0.7) /Ну я там /помню,
..(0.1) что-о' я там
….(1.1) ну с моим /другом ...(0.5) \разговаривал я.
....(2.9) Ну –вот.
/Потом ==
В кувейтском диалекте ту же роль выполняет маркер nzeyn:
(9) S1
ul#›a-љўf sјћ-a-t il-mal›ab,
и#1SG-смотреть.IPFV площадь-F.SG-C DEF-стадион.SG
а я вижу площадь стадиона,
/nzіn,
NZEYN
вот,
u#›јna balј ґўtї,
и#я без туфли.PL
и я без туфлей,
Похожую функцию выполняет маркер ilmuhimm, стоящий в начале эпизода. Оба маркера могут как нести на себе акцент, так и составлять одну интонационную единицу с главной предикацией. Тем не менее, в обоих случаях они выделяются в отдельную ЭДЕ.
(10) S2
\Il-muhimm,
DEF-главное.SG
Ну вот,
\waddey-t zџґ#i ==
отвезти.II.PFV-1SG муж.SG#мой
я отвезла моего мужа
raddey-t#a l-beyt,
вернуть.II.PFV-1SG#его DEF-дом.SG
отправила его домой
То же в случае сочетания этих маркеров с другими маркерами или служебными словами:
(11) Р5
Bass ›inn#a /l-muhimm,
но что#его DEF-главное.SG
Но что главное,
љarј /s-sayyјr-a,
купить.PFV[3SG.M] DEF-машина-F.SG
он купил машину,
Подготовительные дискурсивные маркеры (препаративная замена) используются говорящим при поиске вербализации, если говорящему уже известна часть речи или синтаксическая структура искомого фрагмента. В русском корпусе встречаются изменяемые маркеры этот, такой и неизменяемые это и так. Эти же типы мы видим и в кувейтских текстах: љisma ‘как его’ и hјda ‘этот’ могут согласовываться с искомым именем в роде и числе, маркер ѕedї ‘так’ неизменяем.
В примере (12) hјda находится в середине ЭДЕ и согласуется в роде с существительным:
(12) S2
°ј‹id-a ‹ala s-sayyјr-a li-zѓїr-a \hј-dї
подняться.PTCP.A-F.SG на DEF-машина-F.SG DEF-маленький-F.SG этот-F.SG
...(0.5) ee(0.4) m= mјl-t єl-yahhјl,
ATTR-F.C DEF-ребенок.PL
поднялась на маленькую машину эту… детскую,
ср. в русском корпусе:
(13) N54
..(0.3) «/Алёна \Игоревна@
А /вы –сегодня нас /поведёте в \этот ..(0.4) в –тренажёрный \зал?».
љisma в середине ЭДЕ, не согласуется с последующим существительным:
(14) P4
Ba‹dіyn ѕјn \yu-waddї#ha љ#\ism#a ћagg /zџґ-t#a,
потом AUX 3M-нести.II.IPFV[SG]#ее что#имя.SG#его для жена-F.C#его
Потом отнес ее это… к своей жене,
В кувейтском корпусе ни разу не встречается маркер препаративной замены в начале клаузы, и в отдельную регуляторную ЭДЕ они не выделяются. Для сравнения: в русском корпусе в отдельную ЭДЕ выделяются ударные неизменяемые подстановки это и так, если они стоят в начале клаузы:
(15) Z56
..(0.3)
\Это,
..(0.2)
/бизнес-класс ..(0.4) и' ...(0.5)
и' \дорогие классы.
Эти же маркеры могут встречаться в конечной позиции в мужском роде в значении незаконченного перечисления:
(16) P11
mј gam ya-‹ni <yi>-meyyiz,
NEG стать.PFV[3SG.M]
3M-значить.IPFV[SG] 3M-различать.II.IPFV[SG]
Перестал, значит, различать
љinu ґiddјm#<a> u#/hј-da,
что перед#ним и#этот-M.SG
что перед ним и все такое,
(17) S1
u=fї=hј mdarraґ-јt u=ѕedї _
и=в=ней ступенька-F.PL и=так
и на ней трибуны и прочее
В этой позиции они не выделяются в отдельную ЭДЕ.
Универсальными для обоих языков оказываются проблемы парцелляций и фальстартов.
Парцелляции представляют собой случаи расщепления дискурсивной единицы на две, когда к уже завершенной предикации добавляется интонационно выделенный фрагмент.
Постпозитивные определения в русском языке практически всегда рассматриваются как парцеллированные:
(18) N47
...(0.6) Я' ..(0.4)
\зашёл в /комнату,
в \большую,
В кувейтском диалекте их реже можно интерпретировать таким образом, так как прилагательные и другие виды определений (изафетная конструкция, бессоюзные определительные придаточные) следуют обычно в постпозиции к имени, так что разбиение на две ЭДЕ возможно только при очевидном интонационном выделении:
(19) Р5
‹aґb-at#a \sayyјr-a,
нравится.PFV-3SG.F#ему DEF-машина-F.SG
понравилась ему машина,
....(1.4) \ћilw-a,
красивый-F.SG
красивая,
lџn#ha \ћilu,
цвет.SG#ее красивый.SG
красивого цвета,
..(0.3) u#љakil#ha \ћilu,
и#форма.SG#ее красивый.SG
красивой формы,
u#\spџrt.
и#спорт
и спортивная.
Остальные виды парцелляций – дополнений, обстоятельств, сочиненных групп – встречаются в обоих корпусах, ср., например, парцелляцию сочиненных именных групп:
(20) N32
…(0.5) ''(0.2)
…(0.9) И /он с 'эххэ(0.6) с‑c
..(0.4) \длинными ...(0.6) '''(0.6) такими вьющи= ээ(0.2) =мися ''(0.3)
\светлыми /волосами,
...(0.7) ээ(0.2) и с \сумкой
ээ(0.1) за \плечами.
...(0.5) {ЦОКАНЬЕ} ..(0.2) И || и с \верёвкой' в
\руках.
(21) Р3
Ligј ‹inda#ha \љєnј© u#add-јt \makiyјњ u#kull \љey.
нашел.PFV[3SG.M] у#нее сумка.PL и#предмет-F.PL макияж.SG и#все вещь.SG
Нашел у нее сумки, и предметы макияжа, и всё.
...(0.5) U#–sa‹-јt u#\zїn-a.
и#часы-F.PL и#украшение-F.SG
И часы, и украшения.
Фальстарты, по-видимому, представляют собой универсальное языковое явление, которое мы здесь подробно рассматривать не будем. Приведем пример фальстарта, влияющего на деление ЭДЕ:
(22) S3
°јr єl= ==
стать.PFV[3SG.M] DEF
Настал ==
Kјn fї љuѓl hnї yџm
‹јљўra.
быть. PFV[3SG.M] есть работа.SG здесь день.SG Ашура
Была здесь работа в день Ашура.
ЭДЕ большие, чем предикации, возникают в случае редукции одного из предикатов до статуса цитационного или эпистемического маркера, в некоторых сложных предложениях и при сериализации.
Цитации
В кувейтском корпусе, в отличие от русского, глагол, вводящий прямую речь, не встречается после или внутри цитации, а всегда предшествует ей. Часто он бывает неакцентирован, хотя не редуцируется так сильно, как в русском, всегда представляет собой отдельное фонетическое слово и поэтому записывается отдельной строкой. Так, в примере (23) на вводящем предикате нет акцента, несмотря на то, что он представляет собой аналитическую форму глагола, а в примере (24) есть, хотя это более короткое фонетическое слово, а формы в данном контексте синонимичны:
(23) Р2
Ѕјn yi-gўl:
AUX 3.M-сказать.IPFV[SG]
Сказал:
“/Wјyid ѓјli!”
очень дорогой.SG
«Очень дорого!»
(24) Р5
\Gјl:
сказать.PFV[3SG.M]
Сказал:
“Lј› lј› \ђa®ј°.”
NEG NEG всё
«Нет, нет, всё.»
Ср. пример из русского корпуса, где цитационный маркер сильно редуцирован и не выделяется в отдельную ЭДЕ:
(25) N54
говорю
«/Давай
я всё \сделаю¡»
В случае перестройки косвенной речи в прямую союз, вводящий косвенную речь, записывается одной строкой с последующей цитацией:
(26) Р5
fa ga‹ yi-gўl lu#hum,
и PROG 3.M-сказать.IPFV[SG] к#ним
и говорит им,
єnn#a “›јna mi-ћtјr.”
что#он я PTCP-быть.в.замешательстве.A.SG
что «Я в замешательстве.»
Эпистемические маркеры.
Существует ряд предикатов, которые лексикализовались в эпистемические маркеры и не выделяются в отдельную ЭДЕ. Самыми частотными из них в кувейтском корпусе являются ya‹ni ‘значит’ и wa®®a ‘ей-Богу’:
(27) S2
Wa#®®a
ya-‹ni hј-da al-ћїn a-rawwї#ѕ iyyј#0,
ей#Бог.SG
3M-значить.IPFV[SG] этот-SG.M DEF-время.SG
1SG-показать.II.IPFV#тебе.F ACC#его
Ей-Богу, значит, это сейчас покажу тебе.
Ср. пример из русского корпуса, содержащий лексикализованные предикаты:
(28) Z55
Значит мне /снится,
что я где-то на –приро-оде_
Вотh ..(0.3) кажется на /даче,
но /я вот там ни разу не \была.
Проблема сложных предложений.
В кувейтском корпусе встречаются сложные предложения такой структуры, в которой сложно определить границы клауз и, соответственно, ЭДЕ.
Прежде всего, это предложения с сочинительным союзом u (ul), зависимая часть которых часто содержит не финитный глагол, а причастие или нулевой предикат. Тем не менее, подобные предложения в арабском языке являются сложноподчиненными [Бронников 1998].
(29) Р8
ћarram marr-a tјniy-a
запретить.II.PFV[3SG.M] раз-F.SG второй-F.SG
Зарекся в другой раз
›єnn#a /yi-l‹ab,
что#он 3.M-играть.IPFV[SG]
заниматься (спортом),
u#huwa \љјrib.
и#он пить.PTCP.A.SG
когда выпьет (= и он выпивший).
(30) Р2
Kјn fї
/rayyјl,
быть.PFV[3SG.M] есть мужчина.SG
Жил-был мужчина
...(0.7) u#ma‹ \‹ј›il-a
и#с семья-F.SG
с семьей.
В примере (30), помимо синтаксических, есть еще просодические критерии, по которым следует рассматривать эти части предложения как две ЭДЕ: наличие двух несущих акцентов. Однако возможна ситуация (не встретившаяся в корпусе), когда акцент на зависимой части отсутствует. В таком случае интонационный критерий будет превалировать над синтаксическим, и обе части будут объединены в одну ЭДЕ.
Другой вид сложных предложений, представляющий определенные трудности – это определительные придаточные при отсутствии относительного местоимения или с нулевым предикатом.
В примере (31) относительное местоимение невозможно ввиду того, что вершинное существительное ‘мужчина’ стоит в неопределенном состоянии; обе клаузы составляют одну интонационную единицу:
(31) P6
\kјn aku
\hnјk rayyјl ism#a
/Miљјri,
быть.PFV[3SG.M] есть там мужчина.SG имя.SG#его Мишари
Там был человек по имени Мишари,
В примере (32) присутствует относительное местоимение, но в придаточном – нулевой предикат, и один несущий акцент на все предложение:
(32) P6
U#ba‹dіyn bє#°єdf-a huwa gј‹id
yi-љўf il-›aљyј
и#потом с#неожиданность-F.SG он PROG 3M-видеть.IPFV[SG] DEF-вещь.PL
illi dјђil /il-vitrїna,
который внутри DEF-витрина
А потом он неожиданно видит вещи внутри витрины,
Есть и обратный пример, с нулевым предикатом в главной клаузе:
(33) S2
Is= itna‹aљ bi#/l-lіyl illi \џkey °јr.
двенадцать в#DEF-ночь.SG который окей стать.PFV[3SG.M]
В двенадцать ночи наладилось.
Во всех вышеприведенных примерах сложноподчиненные предложения записываются как одна ЭДЕ, что, как нам кажется, соответствует психологической реальности. Однако есть примеры относительных придаточных, представляющих разные интонационные единицы и записывающиеся в две ЭДЕ. Так, в примере (34) в главной части нулевой предикат, а в зависимой – нефинитная глагольная форма (страдательное причастие), но есть два четко выраженных несущих акцента:
(34) Р3
љinў /l-›aљyј›,
что DEF-вещь.PL
что за вещи
illї /ma-wґўd-a \‹inda#ha.
который PTCP-находить.P-F.SG у#нее
имеются у нее.
Следующий тип связи между предикатами, не представляющий особой трудности, но на который необходимо обратить внимание – это бессоюзное подчинение финитных форм глагола в сентенциальных актантах:
(35) Р1
rјћ /yє-љўf ›aѓrј¦ /zџґ-t#a,
пойти.PFV[3SG.M] 3.M-увидеть.IPFV[SG] вещь.PL жена-F.C#его
пошел посмотреть вещи своей жены,
(36) S3
mј gјm \yi-љўf.
NEG стать.PFV[3SG.M] 3.M-увидеть.IPFV[SG]
перестал видеть.
Такие случаи всегда записывают как одна ЭДЕ. В русском языке им обычно соответствуют инфинитивные конструкции:
(37) N48
Он стал носить эту /лягушку на \голове.
Также общим явлением для двух языков оказывается сериализация предикатов, ср.:
(38) Р3
Fa#rјћ љјf fi#ѓurf-a-t#ha
и#пойти.PFV[3SG.M] увидеть.PFV[3SG.M] в#комната-F.SG-C#ее
И пошел посмотрел в ее комнату
(39) N54
мы /взяли \поменяли /кровати,
Принципы дискурсивно ориентированной транскрипции, разработанные для русского языка, в основном успешно применяются к материалу языков другого типа и позволяют выявить некоторые их дискурсивно релевантные особенности.
По умолчанию (не отмечаются ввиду наибольшей частотности): у имен - мужской род, неопределенное состояние, у глаголов: I порода, активный залог.
|
# граница клитики = фальстарт /, \, /\ направление движения тона ..(0.1) паузы @ обращение ¡ директив а несущий акцент 1,2,3 1-е, 2-е, 3-е лицо II, III… X производные породы глагола A актив ACC аккузатив ATTR атрибутив |
AUX вспомогательный глагол C сопряженное состояние DEF определенный артикль F женский род IPFV имперфектив M мужской род NEG отрицание P пассив PFV перфектив PL множественное число PROG прогрессив PTCP причастие SG единственное число |
Список литературы
1. Бронников Г.К. Предложения с союзом wa в арабском языке. Дипломная работа. М.: РГГУ, 1998.
2.
Кибрик А.А.,
Подлесская В.И. К созданию корпусов устной русской речи: принципы
транскрибирования. // Научно-техническая информация, серия 2, №10,
3.
Кибрик А.А., Ба А.Й., Коваль А.И. Сказание «любовь», или «дингирал», на языке
пулар. // Африканская сказка – III. К исследованию языка
фольклора. М.: Восточная литература, 2006 (в печати). С. 399-479.
4. Коваль А.И., Кибрик А.А. Дискурс гриота. // Четвертая типологическая школа. Тезисы докладов. М, 2005.
5.
Mann W.C., Thompson