МНОГОУРОВНЕВАЯ ЛИНГВИСТИЧЕСКАЯ РАЗМЕТКА

ЗВУКОВОГО КОРПУСА РУССКОГО ЯЗЫКА

 

MULTILEVEL LINGUISTIC ANNOTATION OF THE RUSSIAN SPEECH CORPUS

 

Рыко А.И. (aryko@mail.ru), Степанова С.Б. (stsvet_2002@mail.ru)

Лаборатория экспериментальной фонетики Института филологических исследований СПбГУ, Санкт-Петербург, Россия

 

Аннотация:

В докладе описываются возможности многоуровневой лингвистической разметки звукового корпуса русского языка для описания спонтанной речи и ее сопоставления с кодифицированным литературным языком.

 

 

Лингвистическое описание корпуса звучащих текстов предполагает осуществление его многоуровневой аннотации (разметки), первая и главная задача которой — установление инвентаря единиц этой разметки на разных языковых уровнях. В перспективе в рамках проекта «Интегральное моделирование звуковой формы естественного языка» предполагается разработка в той или иной степени автоматического аннотирования звуковых корпусов любого объема, однако на данном этапе мы ограничиваем свои задачи созданием инвентаря лингвистических единиц для такой разметки.

Как хорошо известно, привычные понятия фонемы, морфемы, слова и предложения оказываются неприложимыми или плохо приложимыми к спонтанной речи. Фактически на этом материале все традиционные метапонятия языка (единицы его описания) так или иначе разрушаются, на их месте создается нечто новое, что не всегда легко поддается определению и описанию (см.: Богданова 2006: 189–194).

Наша многоуровневая лингвистическая разметка как раз и является попыткой вычленить в звучащем (спонтанном) тексте все традиционные единицы лингвистического анализа — синтагмы, слова, фонемы, морфемы, а также слоги — и установить специфику этих единиц в спонтанном тексте.

В качестве материала для экспериментов по многоуровневой лингвистической разметке был взят «корпус медиков» - звуковая база данных, в которой представлены записи речи женщин-медиков  (см.: Бродт 2007). В качестве «стартовой» единицы мы использовали синтаксические единицы («фразы»), соотносимые с традиционным предложением, которые были получены в результате проведенного предварительно синтаксического пунктирования текстов (см.: Там же). Всего было размечено 38 фраз (271 синтагма, 774 слова, 4140 звуков).

Многоуровневая лингвистическая разметка осуществлялась с помощью программы Praat, созданной сотрудниками факультета фонетики Амстердамского университета П. Бёрсма и Д. Вининком (Paul Boersma, David Weenink)[1], которая предназначена для фонетистов, исследующих звучащую речь.

 

Уровни лингвистической разметки

 

При  аннотировании корпуса звучащих текстов мы выделяли единицы следующих лингвистических уровней.

1) Орфографический (Orthography).

«Рабочий» уровень, содержащий орфографическую запись (точнее, транслитерацию латиницей) анализируемой фразы.

2–4) Уровень пауз (Pause) и синтагм (Syntagma Ideal; Syntagma Real).

Согласно классическим определениям, синтагма — «фонетическое единство, выражающее единое смысловое целое в процессе речи-мысли» (Щерба 1955: 87), это «цепочка слов, связанная единым интонационным рисунком; членение потока речи на синтагмы достигается, с одной стороны, интонационным объединением внутри синтагмы, с другой — особым интонационным оформлением границы синтагмы» (Гордина 1973: 211); «отрезок потока речи, заключенный между двумя паузами и характеризующийся усилением ударения на ударном слоге наиболее важного по смыслу слова (т. е. синтагматическим ударением) и объединяющей мелодикой» (Кравченко и др. 1973: 61–62)[2].

 Устанавливая границы между единицами уровня Syntagma Ideal, мы, работая практически с орфографическим представлением устного текста, как бы прочитывали текст, ставя знаки границ там, где сами могли бы сделать паузу, при этом мы,  в первую очередь, руководствовались смысловым единством внутри каждой единицы. Понятно, что дробление на отдельные сегменты зависит как от предполагаемого темпа речи, так и от нашей воображаемой выразительности. Мы приняли за правило членить на данном уровне текст с минимальной степенью дробления: различая вслед за Г.Н. Ивановой-Лукьяновой (1988: 10) «вариативные» и «обязательные» границы членения, мы отмечали лишь обязательные. Так, фразу S4t1f02 Кот воровал у нас практически всё мы посчитали односинтагменной, учитывая нераспространенность подлежащего. Реально  же в спонтанной речи диктора было обнаружено на данном участке цепи две синтагмы — в отдельную синтагму выделено слово кот.  Фраза Я настолько себя плохо чувствую / я так устал /  мне ничего не хочется // при членении на «идеальные» синтагмы была поделена на три части. При прослушивании данной фразы также было выделено три синтагмы, с одной межсинтагменной паузой между второй и третьей синтагмами. Последнее деление мы отражаем на уровне Syntagma Real.

Как правило, смысловое единство в потоке речи соответствовало и интонационному единству вычленяемого отрезка звуковой цепи, хотя здесь возможны отклонения: нарушения интонационного единства за счет пауз хезитации, самоперебивов, ошибок и их самоисправлений (см. об этом, например, Степанова 2006). Кроме того, возможны индивидуальные отклонения в интонационном рисунке по сравнению с «классическими» ИК (Брызгунова 1980). Роль пауз при выделении (интонационном оформлении) синтагм в спонтанной речи — отдельная проблема, поэтому паузы вынесены в отдельный уровень.

Таким образом, уровень пауз (Pause) — «механический» уровень, единицами которого являются отрезки звукового потока от паузы до паузы. Паузой считались все перерывы в звучании, не являющиеся глухой смычкой согласных, а также заполненные хезитационные паузы.

При сопоставлении с уровнем Syntagma Ideal уровень Pause:

    служит для установления возможных/невозможных мест для пауз хезитации;

— помогает фиксировать случаи «сцепления» синтагм  — случаи отсутствия физических пауз между «идеальными» синтагмами, т. е. смысловыми (и интонационными) единствами;

— необходим для фиксации и описания случаев, когда слова, входящие по смыслу в одну синтагму, образуют интонационное единство с другой (например, союзы).

5–6) Уровни слов (Word Real) и «идеальных» слов (Word Ideal).

Word Real — уровень фонетических слов (т. е. отрезков речевой цепи с одним словесным ударением, формируемый на основе уровня Sounds Real (см. ниже). Кроме того, на этом уровне учитываются все особенности фонетики спонтанной речи, в которой происходят различные модификации звуков в потоке речи (например, озвончение глухих, оглушение звонких согласных в нехарактерных для этого позициях, спирантизация смычных, оглушение сонантов, выпадение гласных и даже целых комплексов звуков[3]).

Word Ideal   орфографические слова, записанные в фонематической транскрипции.

Сопоставление уровней Word Real и Word Ideal позволяет описать систему энклитик спонтанной речи, а также ее морфонологические особенности.

7) Gramform — уровень морфологической разметки.

Словоформы, границы между которыми установлены на уровне word ideal, получают грамматическую метку — им приписывается морфологическое значение согласно морфологической модели, представленной в «Грамматическом словаре русского языка» А.А. Зализняка и грамматическом модуле программы starling (www.starling.rinet.ru), созданной С.А. Старостиным. (Для грамматической разметки использована вспомогательная база данных по нашему материалу, созданная С.А. Крыловым в программе Starling.)

8–9) Уровни морфем (Morpheme Real) и «идеальных» морфем (Morpheme Ideal). Morpheme Ideal — традиционное членение на морфемы (по словарю А. И. Кузнецовой и Т. Ф. Ефремовой) с поправкой на то, что мы имеем дело не с орфографической записью, а с фонематической транскрипцией. Morpheme Real — реализация морфем в речевом потоке, т. е. морфы.

Здесь мы сталкиваемся со следующими явлениями:

— конкретные морфы т. е. морфемы, имеющие «в идеале» различный «идеальный» фонетический состав, могут иметь одну и ту же фонетическую (акустическую) репрезентацию (например, одинаковое звучание морфем -ыj в словоформе рыжий и -uju в слове каждую);

— проведение границ между морфами, аналогичных границам между соответствующими морфемами (что тоже может быть осложнено благодаря явлению фузии), порой оказывается просто невозможным.

Наряду с «классическими» случаями фузии (например, казац-к-ий: казак- + -ск- — фузия очевидна и на письме, де[ц]-к-ий: дет- + -ск- — фузия актуальна только для звучащей формы), в нашем материале «сплавление» может охватывать не только соседние звуки — оно может быть и более «глубоким». Так, в фразе S1t1f01 слово обворовывал, согласно традиционным представлениям, состоит из следующих морфем: ab-var-ov-yv-a-l-Ø. Реально же звучит последовательность ab-var-av:-l, то есть справа от корня вместо набора различных суффиксальных морфем (-ov- аффикс, образующий глагольную основу, v- суффикс итератива, -a- суффикс, образующий основу прошедшего времени/инфинитива) мы видим не поддающийся дальнейшему членению с формальной стороны звуковой комплекс -av:-.

  морфемы в некоторых случаях никак не реализуются (т.е. не вычленяется из звукового потока единица анализа морфемного уровня), грамматическое значение словоформы  понимается из контекста. Это касается, прежде всего, окончаний прилагательных и местоимений. Например, во фразе дети не знали как поймать рыжего кота / который у них посто… / э-э который постоянно у них что-то воровал продукты // во фрагменте «который у них» окончание не выделяется, а предлог не реализован.

10) Уровень слогов (Syllabe).

В качестве рабочей гипотезы мы принимаем, что все слоги в русском языке открытые (закрытые возможны только в абсолютном конце перед паузой или в конце синтагмы).

11) Уровень ударения (Stress).

На этом уровне в единую шкалу (от 1 до 4) объединены словесное и синтагматическое ударение: слог,  являющийся  интонационным центром  синтагмы или акцентно выделенного слова, отмечается максимальным баллом (4), ударный слог остальных фонетических слов синтагмы — баллом 3, первая степень редукции безударных — 2, вторая степень редукции — 1. Определение первой или второй степени редукции   слога осуществлялось по общеизвестной формуле Потебни. Насколько эта формула отражает реально существующие темпоральные и динамические отношения между частями фонетического слова - сможет показать дальнейшее сравнение этого уровня с уровнем Sound Real.

12–13) Звуковые уровни представляют собой фонематическую (Sound Ideal) и фонетическую (Sound Real) транскрипции потока речи. Причем, если первая выполняется в соответствии с правилами, выработанными в рамках Санкт-Петербургской фонологической школы, учитывающей фонемную интерпретацию слов, произнесенных в полном типе, то вторая (фонетическая) транскрипция осуществляется на основе слухового анализа реального звучания отдельных звуков и/или звуков в контексте с помощью знаков Международного фонетического алфавита

звуки (sound real);

фонемы (sound ideal).

14) Уровень повторяющихся акустических элементов.

При анализе звучащего текста на русском языке мы опираемся на знания о фонетическом строе русского языка, о количественном и качественном составе фонетической системы и закономерностях ее функционирования в речи. Этими знаниями мы и пользуемся при транскрибировании звучащего текста. Например, признание звука [с] самостоятельной фонемой в русском языке заставляет нас транскрибировать акустическую последовательность физическая паузавысокочастотый шум как [c] (см. рис. 1), а не как сочетание двух звуков [ts], как это будет, например, в английском языке.

 

 

 

Рис 1. Осциллограмма, спектрограмма и транскрипция слога /са/ из слова нравится

 

Однако если мы анализируем записанный звучащий текст на неизвестном языке и нам недоступна информация, относящаяся к более высоким языковым уровням, то мы можем либо, опираясь на наш лингвистический опыт, давать участкам речевого потока приблизительную интерпретацию в рамках Международного фонетического алфавита, либо, обратившись к акустическим понятиям, членить речь на некие повторяющиеся акустические элементы (термин А.С. Асиновского) и давать им определенные метки.

Плодотворность второго подхода требует экспериментальной проверки.

Количество таких меток может быть различным: максимальным, учитывающим изменения звуковой волны по интенсивности, по длительности шумовой и/или гармонической составляющих, по месту и ширине формантных и шумовых полос и т. д.

В случае анализа нашего корпуса звучащих текстов мы пока  ограничились минимальным составом вычленяемых акустических элементов, в равной мере пригодных для символьного транскрибирования звучащей речи как на известном, так и на неизвестном исследователю языке:

1)      физическая пауза (глухая смычка) – ( Ø );

2)      высокочастотный шум при отсутствии периодов частоты основного тона (глухая щель) – (fr);

3)      наличие гармонических колебаний при отсутствии каких-либо других составляющих (звонкая смычка) (Ø-v);

4)      гармонические колебания при наличии высокочастотного шума (звонкая щель) (frv);

5)      гармонические колебания при наличии формантной структуры (вокалические участки) (V).

Разметка материала на этом уровне ориентирована на установление системных соответствий между результатами обработки речевого потока с помощью акустического речевого процессора и результатами экспертной разметки данного речевого потока.

 

На рис.2 и рис.3 представлен образец разметки корпуса на 14 описанных уровнях в программе Праат. Рис.2- разметка целой фразы Я настолько себя плохо чувствую, я так устал, мне ничего не хочется, рис.3 –разметка первой синтагмы той же фразы.

 

 

Рис. 2. Многоуровневая лингвистическая разметка фразы S1T3F02 (Я настолько себя плохо чувствую, я так устал, мне ничего не хочется)

 

 

 

Рис. 3. Многоуровневая лингвистическая разметка той же фразы S1T3F02 (фрагмент)

 

Наличие в разметке уровней «реального» описания устных текстов на нескольких лингвистических уровнях и «идеального», ориентированного на представление того же текста в кодифицированном литературном языке, в полном типе произнесения, позволит в дальнейшем произвести с помощью подпрограмм Праата («скриптов») подробное сравнение   этих  уровней на материале представительного Звукового корпуса русского языка.

 

 

Литература:

 

1. Асиновский А.С. и др. Полевая лингвистическая практика: Учебно-методический комплекс сложной структуры. Часть  2 // (В печати.)

2. Богданова Н.В.  Метапонятия языка и речи (к вопросу о поиске единиц описания живой речи) // Материалы Международного симпозиума МАПРЯЛ "Инновации в исследованиях русского языка, литературы и культуры". Пловдив: 2006.

3. Бродт И.С. Спонтанный монолог в лингвистическом и социолингвистическом аспекта (на материале текстов разного типа): Автореф. дисс. ... канд. филол. наук // СПб.: 2007.

4. Брызгунова Е.А. Интонация // Русская грамматика. М.: 1980.

5. Вольская Н. Б., Степанова С. Б. О некоторых проблемах синтагматического членения спонтанного текста // XXX Международная филологическая конференция. Вып. 10. Секция фонетики. Ч. 1. СПб.: 2005.

 5. Гордина М. В. Фонетика французского языка // Л.: 1973.

6. Зализняк А.А. Грамматический словарь русского языка // М.: 1977.

7. Иванова-Лукьянова Г.Н. Чтение вслух с опорой на пунктуацию // М., 1988

8. Кравченко М.Г., Зыкова М.А., Светозарова Н.Д., Братусь И.В. Ударение и интонация в немецком языке  // Л., 1973.

9. Кузнецова А. И., Ефремова Т.Ф. Словарь морфем русского языка // М., 1986.

10. Степанова С.Б. Соотношение синтагматического и хезитационного членения в спонтанной русской речи // Материалы Международного симпозиума МАПРЯЛ «Инновации в исследованиях русского языка, литературы и культуры». Пловдив: 2006.

11. Фонетика спонтанной речи / под ред. Н. Д. Светозаровой // Л.:1988

12. Щерба Л.В. Фонетика французского языка // М.: 1955.



[1] Создатели Praat регулярно обновляют версии программы и предлагают бесплатное использование ее для некоммерческих целей. Найти программу для бесплатного копирования можно на сайте www.praat.org.

[2] О некоторых проблемах, возникающих при выделении в спонтанных монологах синтагм, см.: Вольская, Степанова 2005: 16–24.

[3] См., например: Фонетика спонтанной речи 1988, а также раздел «Метапонятия языка и речи (к вопросу о поиске единиц описания живой речи)» (Асиновский и др.).