Просодическая транскрипция: уровни детализации[1]

Prosodic transcription: levels of detail

 

Кибрик А.А(kibrik@comtv.ru)

Институт языкознания РАН,

            Кодзасов С.В. (sankod@yandex.ru), Худякова М.В. (mariya.kh@gmail.com)

Московский государственный университет им. М.В. Ломоносова

 

В книге Кибрик и Подлесская (ред.) 2009 была предложена система просодически ориентированной дискурсивной транскрипции для устной русской речи. В докладе предлагается ряд расширений к транскрипции, в том числе различие между выделительными и тональными акцентами, более подробная разметка тональных акцентов, интервал движения тона в акценте, динамическое раздвоение гласных и др.

 

1. Вводные замечания

 

В настоящее время очень актуальна проблема создания корпусов устной речи. Все больше распространяется точка зрения о том, что ограничение языкового материала лишь письменным текстом не дает возможности сформировать адекватные представления о естественном языке. При этом устная речь не может исследоваться «как таковая», лишь в виде звукового сигнала. Для ее объективного и подробного анализа необходима репрезентация в графическом виде. Такую репрезентацию обычно называют дискурсивной транскрипцией (Du Bois et al. 1992; Edwards 2001).

В книге Кибрик и Подлесская (ред.) 2009 (ниже – К&П2009) была предложена система транскрибирования устного дискурса для русского языка. Эта система ориентирована на то, чтобы специально подготовленные транскрайберы могли последовательно и надежно транскрибировать исходный дискурс в звуковой форме. Более краткое и предварительное описание этой системы содержится также в статье Кибрик и Подлесская 2003.

 

 

2. Транскрипционная система К&П2009

 

Система транскрипции К&П2009 не является чисто просодической или тем более фонетической. Ее целью была репрезентация основных аспектов устного дискурса, в том числе дискурсивной семантики (в частности, иллокутивные и фазовые значения). Однако просодический компонент занимает в этой системе большое место. Основные просодические компоненты, отражаемые в данной системе, следующие:

 

·        паузы, в том числе абсолютные и заполненные, а также их длительность

·        акценты

·        тоны в акцентах

·        некоторые дискурсивно значимые движения тона за пределами акцентов

·        сегментные нелексические явления (смычки, придыхание)

·        удлиненная реализация фонем

·        тональный регистр

·        темп произнесения

·        фонетическая редукция

·        эмфатическая просодия

 

Необходимо отметить очень важный принцип дискурсивной транскрипции К&П2009. Эта транскрипция отражает локальную дискурсивную структуру, которая носит квантованный характер. Дискурс порождается в виде последовательность квантов, или шагов – так называемых элементарных дискурсивных единиц (ЭДЕ). ЭДЕ идентифицируются транскрайбером главным образом на основе следующих просодических признаков:

 

·        единый тональный контур

·        наличие, как правило, одного главного акцента

·        темповый паттерн: ускорение в начале, замедление к концу

·        громкостный паттерн: громче в начале, тише к концу

·        пограничная паузация

 

Эти признаки не являются обязательными и далеко не всегда присутствуют одновременно, но кумулятивно они определяют просодический прототип ЭДЕ.

В транскрипте ЭДЕ отображаются как отдельные строки.

 

 

3. Примеры транскриптов, созданных в соответствии с системой К&П2009

 

В книге К&П2009, помимо описания системы транскрибирования устного дискурса, содержится также корпус устной речи «Рассказы о сновидениях», полностью затранскрибированный на основе этой системы. Корпус состоит из 129 рассказов, общая длительность звучания – около 2 часов.

Приведем два рассказа из книги К&П2009, записанных при помощи этой транскрипционной системы. Отметим, что каждый рассказ в корпусе отражается в виде следующих компонентов:

 

·        идентификационного кода, включающего инициалы рассказчика, указание на пол и возраст

·        общее описание, в том числе длительность рассказа, просодическую характеристику и качество записи

·        колонки с временнóй разметкой – время от начала рассказа до начала данной ЭДЕ

·        колонки с номерами ЭДЕ в рамках рассказа

·        колонки, содержащей транскрипционную запись ЭДЕ

·        колонки комментариев.

034z    АМ  м  11 лет

Длительность рассказа 40.8 с.

Склонность к интонации многоточия. В первой половине рассказа фрикативное г.

Качество записи высокое. На заднем плане слышны голоса, визг.

0.0

1.

>>/сон вот,

Начало произнесения первой фонемы не попало в запись.

0.3

2.

когда я \потеря-ался.

 

1.5

 

∙∙∙(0.9) Угу.

Тихо.

3.2

3.

∙∙∙(0.5) Вотh-h я-а вышел из /дома,

 

5.2

4.

были-иh ==

 

5.5

5.

∙∙(0.4) ээ(0.4) никого \не былодома,

 

7.3

6.

мне оставили \ключи.

 

8.4

7.

∙∙∙∙(1.0) Я-а ∙∙(0.1) /погулял чуть-чуть,

Внутри начальной паузы посторонний скрип.

10.9

8.

∙∙(0.4) /потом-м вот захотел /е-есть...

 

12.7

9.

∙∙(0.4) пошёл /домой,

 

13.7

10.

там никого \не-е было...

 

14.8

11.

∙∙(0.4) /потом начал искать своих \роди-ителей...

 

17.1

12.

∙∙∙(0.5) потом ∙∙(0.2) /в-вышел ∙∙(0.1) ээ(0.2) ’из \подъезда,

 

19.7

13.

никого н-нигде \не-ет...

 

21.0

14.

∙∙∙(0.9) /о-обошёл вотh-h ∙∙(0.2) где-то пол-/у-улицы...

 

24.2

15.

∙∙(0.2) никого \не было.

 

25.2

16.

∙∙∙(0.5) Потом я-а /испугался ,

 

27.1

17.

∙∙∙(0.7) /побежал вот куда гла-а= \глаза глядят,

В оборванном фрагменте гла-а= фрикативное г, далее во фрагменте глаза глядят оба раза смычное.

29.9

18.

∙∙(0.4) /вдруг увидел какого-то /мальчика,

На увидел накладывается техническая помеха. В слове вдруг последнюю фонему произносит смычно.

31.9

19.

∙∙(0.1) я у него \спросил:

 

33.1

20.

∙∙(0.4) «/Где мои \родители?»

 

34.4

21.

∙∙∙(0.5) \Ну-у’,

 

35.1

22.

∙∙(0.2) он \сказал:

Начало строки на фоне постороннего стука.

35.9

23.

∙∙∙(0.5) «\Возвращайся /домой¡,

 

37.5

24.

ты \увидишь их \там.»,

 

38.5

25.

∙∙(0.3) я вернулся /домой,

 

39.7

26.

и их-х \увидел.

Тихо. Последний слог — шепотом.

 

084n    ДК  м  11 лет

Длительность рассказа 58.2 с.

В паузах часто шумные вдохи. В конце рассказа слышно, что у рассказчика насморк. Часто встречается скрипучий голос. Отчетливая артикуляция и просодия. Не выговаривает твердое р.

Качество записи высокое.

0.0

1.

Я-а ∙∙∙(0.7) ’’(0.1) у своего /\дру-уга,

На первые три слова накладывается техническая помеха. Слово друга произносит как дыруга.

2.7

2.

∙∙∙(0.5) т-там ∙∙(0.1) ээ(0.2) наш /дом ∙∙(0.1) отрем-м= || ре-е= || ∙∙(0.2) на \ремонт \поста-авили.

Заполненная пауза и фрагмент ре-е — скри­пучим голосом.

7.9

3.

∙∙∙(0.8) И-и /–всех ∙∙(0.2) /\переслали ээ(0.1) в другой \дом,

Несколько слогов на протяжении этой строки произносит скрипучим голосом.

12.0

4.

∙∙(0.4) какой-то /\гря-азный...

Удлиненный слог — со скрипом. В этой и двух следующих строках говорит с отвращением.

13.6

5.

/\се-ерый...

 

14.4

6.

∙∙∙(0.7) там /ле-естница побитая...

 

16.8

7.

∙∙∙∙(1.1) И вот там ещё моя \мама ~

 

19.7

8.

∙∙∙(0.5) {ЧМОКАНЬЕ 0.2} эээ(0.8) ∙∙∙∙(1.2) И-и /\мы-ы’ ∙∙∙(0.5) /гулять собра́лись,

 

24.9

9.

∙∙(0.4) а я /\куртку /забыл одеть,

На слове одеть слышен тихий стук.

27.1

10.

а мой друг /\выбежал,

 

28.2

11.

<ему показали>

 

28.6

12.

∙∙(0.4) /\музыка неприятная ,

 

30.1

13.

на площадке какие-то /\пья-аницы были...

 

32.4

14.

∙∙∙∙(1.4) И я /\испуга-ался,

Фрагмент и я — скрипучим голосом.

35.3

15.

∙∙∙(0.9) и-и там-м ∙∙(0.1) так и-и ос= ∙∙∙(0.6) =–тался там-м,

Слог тал — скрипучим голосом.

39.6

16.

∙∙∙(0.6) {ШМЫГАНЬЕ 0.3} ’’(0.2) пытался /–две-ерь запереть к парадному там...

Слово дверь произносит со смехом.

43.4

17.

∙∙∙∙(1.0) (Не \запиралась.)

Тихо.

45.0

18.

потом ∙∙(0.4) в зв= в /–звоно-ок звонил...

Первое слово — тихо.

47.5

19.

(Никто не /–открывал...)

 

48.9

20.

{ШМЫГАНЬЕ 0.5} ∙∙∙(0.9) {ЧМОКАНЬЕ 0.4} потом там ∙∙∙(0.6) ээ(0.3) \ещё громче музыку /включили,

 

54.2

21.

∙∙(0.3) и я \просну-улся.

В этой и следующей строке есть акценты на первом безударном слоге акцентированных слов.

55.8

22.

∙∙(0.4) И /больше вот \ничего не помню.

Слово ничего произносит по слогам.

 

4. Возможные расширения просодического компонента транскрипции

 

Не существует никакого объективно заданного набора признаков, которые должны отражаться в дискурсивной транскрипции. Каждая система транскрипции имеет тот уровень детализации, который соответствует исследовательским целям ее авторов. Кроме того, каждая такая система всегда является прагматичным компромиссом. С одной стороны, полнота и подробность – это плюс. С другой стороны, чем более подробна транскрипция, тем больше она содержит различных конвенций и обозначений и тем труднее читается. Кроме того, увеличение степени подробности всегда означает увеличение трудо- и времязатрат. В транскрипционной системе К&П2009 имеется определенный баланс между этими противонаправленными критериями. В целом, эта система была ориентирована на описание локальной дискурсивной структуры, а не собственно фонетики устной речи.

Тем не менее, существует целый ряд направлений, в которых эта транскрипционная система может быть расширена и углублена. Опираясь на работы Кодзасов1996, Кодзасов 2009, Кодзасов и др. 2008, в данном докладе мы предлагаем несколько расширений системы К&П2009. Большинство из них касаются акцентных признаков; возможность некоторых из этих расширений была указана уже в Кибрик и Подлесская (ред.) 2009, раздел 4.5.4. В первую очередь, в отличие от К&П2009, мы различаем два типа акцентов – выделительные и тональные.

 

4.1 Выделительные акценты

Артикуляционно выделительные акценты представляют собой дыхательные толчки, сопровождающие ударные слоги некоторых слов, входящих в ЭДЕ. Просодическая роль выделительных акцентов — создание ритмической схемы высказывания. В расширенном варианте транскрипции выделительный акцент обозначается символом * перед словом, на которое он падает. Например:

 

(1)       034z

5.5

5.

∙∙(0.4) ээ(0.4) *никого/ не\ было *до(2)ма,

 

Выделительный акцент не обязательно предполагает изменение тона – ср., например, акцент на ударном слоге слова дома в (1). Чаще всего, однако, выделительные акценты одновременно являются тональными (о них см. ниже); такое сочетание имеет место в слове никого в примере (1).

 

4.2 Тональные акценты

Тональные акценты представляют собой отклонения от некоторого базового уровня тона. Тональные акценты размечены в К&П2009, однако лишь для ударных слогов слов. Между тем, тональные акценты не всегда привязаны к ударному слогу; кроме того,  тональных акцентов в слове может быть более одного. Поэтому в расширенном варианте транскрипции знаки тональных акцентов (/, \ и др.) пишутся не перед словом, а после той фонемы, на которой размещено значимое движение тона.

Чаще всего, конечно, падение или повышение тона происходит в пределах ударного слога, см. пример (2):

 

(2)       084n

16.8

7.

∙∙∙∙(1.1) И вот та/м ещё/ моя *ма\ма ~

 

Однако достаточно часто оно бывает не локализовано или происходит на целом слове или группе слов, см. комментарий о падении тона в слове ремонт в строке 2 рассказа 084n в  разделе 5 ниже. Особый интерес представляют случаи, когда тональный акцент размещен на предударном слоге, как, например, на первом слоге слова собра́лись в (3):

 

(3)       084n

19.7

8.

∙∙∙(0.5) {ЧМОКАНЬЕ 0.2} эээ(0.8) ∙∙∙∙(1.2) И-и/ (2) мы-ы/\(2)∙∙∙(0.5) *гуля//(2)ть со\бра́(2)лись,

 

4.3. Интервалы изменения тона

В расширенном варианте транскрипции была введена градация интервалов движения тона в тональных акцентах. Изменения могут быть средние (примерно от 1/2 до 2/3 октавы), большие (порядка 1 октавы) и малые (порядка 1/3 октавы). Соответствующие обозначения для изменений тона (восходящий и нисходящий соответственно):

 

·         средние /, \

·         большие //, \\

·        малые /, \.

 

Ровный тон () обозначается, если он входит в состав тонального комплекса с раздвоением гласной, см. ниже.

 

4.4 Динамическое раздвоение гласных

Динамическое раздвоение гласных — это распадение звуковой волны гласного на два компонента по амплитуде. Раздвоение обозначается символом (2) после соответствующей гласной (и после знака тонального акцента, если он имеется). Это явление широко представлено в спонтанной устной речи. Так, в следующем примере представлено три таких случая в одной ЭДЕ:

 

(4)       084n

7.9

3.

∙∙∙(0.8) И-и/–(2) *все/–(2)х ∙∙(0.2) пересла/ли\ ээ(0.1) в друго/й *до\(2)м,

 

 

5. Транскрипты, оформленные на основе расширенной просодической транскрипции

 

Ниже представлены транскрипты тех же двух рассказов из корпуса «Рассказы о сновидениях», которые были приведены выше в соответствии с системой К&П2009. Здесь транскрипты реализованы согласно расширениям, описанным в разделе 4. Несколько дополнительных признаков, таких как степень раствора рта, размечены в колонке комментариев. Попутно с внесением расширений в транскрипте были исправлены несколько неточностей, замеченных в предыдущем варианте. Читатель может самостоятельно сравнить два варианта транскрипта.

034z    АМ  м  11 лет

Длительность рассказа 40.8 с.

Склонность к интонации многоточия. В первой половине рассказа фрикативное г.

Качество записи высокое. На заднем плане слышны голоса, визг.

0.0

1.

>>*сон во\(2)т,

Начало произнесения первой фонемы не попало в запись.

0.3

2.

 *когда я *потеря-а\(2)лся.

 

1.5

 

∙∙∙(0.9) Угу.

Тихо.

3.2

3.

∙∙∙(0.5) Во/тh-h я-а вы/\шел из до/ма,

 

5.2

4.

бы/ли-и\(2)h ==

 

5.5

5.

∙∙(0.4) ээ(0.4) *никого/ не\ было *до(2)ма,

 

7.3

6.

мне *оста\(2)вили *ключи\.

 

8.4

7.

∙∙∙∙(1.0) *Я-а/\(2) ∙∙(0.1) погулячуть-чу\ть,

Внутри начальной паузы посторонний скрип.

10.9

8.

∙∙(0.4) *пот/ом-м вот захоте\л *е-есть...

 

12.7

9.

∙∙(0.4) пош/ё\л *домо/й,

 

13.7

10.

та\м никого *не-е\ было\...

Слово там произносится с узким раствором рта.

14.8

11.

∙∙(0.4) по–т/о–м начал искать своих *роди-ителей...

Деклинация тона на словах начал искать своих родителей.

17.1

12.

∙∙∙(0.5) потом ∙∙(0.2) *в-вы/шел ∙∙(0.1) ээ(0.2) ’и\з по\дъе\зда,

 

19.7

13.

никого\ н-нигде\ не-е\т...

 

21.0

14.

∙∙∙(0.9) *о-обо/шё/л во\тh-h ∙∙(0.2) где\-то *пол‑у‑улицы\...

 

24.2

15.

∙∙(0.2) ни\кого *не\ было.

Деклинация тона.

25.2

16.

∙∙∙(0.5) Потом я-а *испугася ,

 

27.1

17.

∙∙∙(0.7) *побежа\л вот куда гла-а= *глаза\ глядя\т,

В оборванном фрагменте гла-а= фрикативное г, далее во фрагменте глаза глядят оба раза смычное.

29.9

18.

∙∙(0.4) *вдру/г увидел како\го-тоа/льчика,

На увидел накладывается техническая помеха. В слове вдруг последнюю фонему произносит смычно.

31.9

19.

∙∙(0.1) я у него *спроси\л:

 

33.1

20.

∙∙(0.4) «*Где\ мои *роди\тели?»

 

34.4

21.

∙∙∙(0.5) \Ну-у’\(2),

 

35.1

22.

∙∙(0.2) он *ска\зал:

Начало строки на фоне постороннего стука.

35.9

23.

∙∙∙(0.5) «*Возвраща\йся *домо¡,

 

37.5

24.

ты *уви\дишь их та\м.»,

 

38.5

25.

∙∙(0.3) я верну\лся *домо\й,

 

39.7

26.

и их-х *уви\дел.

Тихо. Последний слог — шепотом.

084n    ДК  м  11 лет

Длительность рассказа 58.2 с.

В паузах часто шумные вдохи. В конце рассказа слышно, что у рассказчика насморк. Часто встречается скрипучий голос. Отчетливая артикуляция и просодия. Не выговаривает твердое р.

Качество записи высокое.

0.0

1.

Я-а ∙∙∙(0.7) ’’(0.1) у своего *дру-у//га\,

На первые три слова накладывается техническая помеха. Слово друга произносит как даруга.

2.7

2.

∙∙∙(0.5) т-там ∙∙(0.1) ээ(0.2) наш *до//м ∙∙(0.1) отремм= || ре-е= || ∙∙(0.2) на/ *ремо\нт по\ста-авили.

Заполненная пауза и фрагмент ре-е — скри­пучим голосом. В слове ремонт падение тона не локализовано. В слове поставили упереднение ударного а.

7.9

3.

∙∙∙(0.8) И-и/–(2) *все/–(2)х ∙∙(0.2) пересла/ли\ ээ(0.1) в друго/й *до\(2)м,

Несколько слогов на протяжении этой строки произносит скрипучим голосом. Слово дом — узкий раствор рта.

12.0

4.

∙∙(0.4) какой-то *гря-а/(2)зны\й...

Удлиненный слог — со скрипом. В этой и двух следующих строках говорит с отвращением.

13.6

5.

*се-е/(2)ры\й...

 

14.4

6.

∙∙∙(0.7) там *ле-е/(2)стница поби\тая...

 

16.8

7.

∙∙∙∙(1.1) И вот та/м ещё/ моя *ма\ма ~

 

19.7

8.

∙∙∙(0.5) {ЧМОКАНЬЕ 0.2} эээ(0.8) ∙∙∙∙(1.2) И-и/ (2) мыы/\(2)∙∙∙(0.5) *гуля//(2)ть со\бра́(2)лись,

 

24.9

9.

∙∙(0.4) а я/*к/у\ртку *забы//л оде/(2)ть,

На слове одеть слышен тихий стук.

27.1

10.

а мо/й дру–г *вы/б–е\жа/л,

 

28.2

11.

<ему показали>

 

28.6

12.

∙∙(0.4) *му//зы\ка неприя/  \(2)тная ,

 

30.1

13.

на площадке какие-то *пья-а/\ницы были...

 

32.4

14.

∙∙∙∙(1.4) И я *испуга-а/лся\,

Фрагмент и я — скрипучим голосом.

35.3

15.

∙∙∙(0.9) и-и та/\м-м ∙∙(0.1) так и-и ос= ∙∙∙(0.6) =*тался там-м,

Слог тал — скрипучим голосом.

39.6

16.

∙∙∙(0.6) {ШМЫГАНЬЕ 0.3} ’’(0.2) пытался *две-е/рь запереть к парадному там...

Слово дверь произносит со смехом.

43.4

17.

∙∙∙∙(1.0) (Не запира\лась.)

Тихо.

45.0

18.

потом ∙∙(0.4) в зв= в *звоно-о/\(2)к звонил...

Первое слово — тихо.

47.5

19.

(Никто\ не открыва–л...)

 

48.9

20.

{ШМЫГАНЬЕ 0.5} ∙∙∙(0.9) {ЧМОКАНЬЕ 0.4} потом там ∙∙∙(0.6) ээ(0.3) \ещё\ гро\мче му\зыку *вклю\ч/и\ли,

 

54.2

21.

∙∙(0.3) и\ я просну-у\(2)лся.

В этой и следующей строке есть акценты на первом безударном слоге акцентированных слов.

55.8

22.

∙∙(0.4) И бо/–(2)льше во\т */ничего\ не по\мню.

Слово ничего произносит по слогам.

 

6. Заключительные замечания

 

В данном докладе предлагается ряд расширений к транскрипционной системе устной русской речи, описанной в книге Кибрик и Подлесская (ред.) 2009. Была добавлена разметка таких просодических параметров, как выделительные акценты, интервал движения тона, раздвоение гласных, была уточнена разметка тональных акцентов.

На дальнейших этапах мы предполагаем добавить в эту разметку такие параметры, как тайминг тональных акцентов, долготные акценты, типы фонаций и некоторые другие.

 

 

Литература

1.      Кибрик А.А., Подлесская В.И. 2003. К созданию корпусов устной русской речи: принципы транскрибирования // Научно-техническая информация. Серия 2-6. С.5-11.

2.      Кибрик А.А., Подлесская В.И. (ред.) 2009. Рассказы о сновидениях: Корпусное исследование устного русского дискурса. М.: ЯСК.

3.      Кодзасов С.В. 1996. Комбинаторная модель фразовой просодии // Просодический строй русской речи. М.: Ин-т русского языка РАН. С.85-123.

4.      Кодзасов С.В. 2009. Исследования в области русской просодии. М.: ЯСК.

5.      Кодзасов С.В., Архипов А.В., Захаров Л.М., Кривнова О.Ф. 2008. База данных «Интонация русских информационных текстов» // Компьютерная лингвистика и интеллектуальные технологии. Вып. 7 (14). По материалам международной конференции «Диалог 2008». М.: ИППИ РАН. С.206-209.

6.      Du Bois, J.W., Schuetze-Coburn, S., Cumming, S., Paolino, D. 1992. Discourse transcription // Santa Barbara Papers in Linguistics, 4. Santa Barbara: UCSB.

7.      Edwards, J.A. 2001. The transcription of discourse. // D. Schiffrin, D. Tannen, H. Hamilton (eds.) The handbook of discourse analysis. Oxford: Blackwell. С.321-348.

 

 



[1] Данное исследование поддержано грантом РГНФ №08-04-00165а. Работа А.А.Кибрика также поддерживалась грантом Фонда поддержки отечественной науки.