Proceedings 2002

Contents

ТРЕХМЕРНАЯ МОДЕЛЬ РЕЧЕВОГО ТРАКТА И АЛГОРИТМ ВЫЧИСЛЕНИЯ ПЛОЩАДЕЙ ПОПЕРЕЧНЫХ СЕЧЕНИЙ

 

 

И. С. Макаров

Институт Проблем Передачи Информации РАН

speechprod_mak@yahoo.de

 

  1. Badin

Institut de la Communication Parlée

badin@icp.inpg.fr

 

В. Н. Сорокин

Институт Проблем Передачи Информации РАН

vns@iitp.ru

 

 

Ключевые слова: трехмерная артикуляторная модель, анатомическая база данных, отображение пространства артикуляторных параметров в пространство площадей поперечных сечений, корректирующая функция

 

В задачах автоматического распознавания, синтеза и сжатия представляется целесообразным определение формы речевого тракта по параметрам речевого сигнала. Такая задача называется обратной. Для решения обратной задачи относительно формы речевого тракта необходима кодовая книга, ставящая в соответствие измеренные акустические параметры речевого сигнала и артикуляторные параметры. Создание такой книги требует решения ряда частных задач. Прежде всего, необходимо построить анатомическую базу данных и сформировать алгоритм вычисления площадей поперечных сечений речевого тракта по текущим значениям управляемых параметров. Эти задачи решались с использованием результатов  измерений формы речевого тракта посредством магнито-резонансной томографии, а также с помощью измерений на микролучевой рентгеноскопической установке. Основные результаты проведенного исследования: выяснилось, что глотка в процессе речеобразования может активно изменять свою ширину, что сказывается на значениях площадей поперечных сечений в глоточной области и, соответственно, на акустических параметрах речевого сигнала. Построена математическая модель глотки. С помощью факторного анализа были получены две собственные функции ширины глотки, покрывающие около 93% разброса измерений.

 

Полный текст статьи можно скачать здесь:

MakarovBadinSorokin.zip