Сборник 2000

Тренировка общения с помощью компьютера:

об одном применении модели диалога

 

 

 

М. Койт

Тартуский университет

 

 

 

1 Введение

 

         В последние годы исследования в области моделирования диалога дошли до важных практических применений. В качестве примера можно ссылаться к многочисленным работам по информационно-справочным системам, где общение происходит на естественном языке, см. (Chu-Carroll et al. 1998, Hitzenberger 1998, Lopez-Cozar et al. 1998, Polifroni et al. 1998).

         В Тартуском университете уже в течение нескольких лет ведутся работы по моделированию диалога. В нижеследующем мы описываем одну практическую реализацию нашей модели - программу, предназначенную для тренировки общения. С помощью этой программы пользователь может играть диалоговые игры определенного вида, тренируясь в добивании некоторых коммуникативных целей. С одной стороны, с целью заставить партнера в процессе коммуникации принимать решение выполнить некоторое действие, а с другой стороны, с целью упорствовать партнеру и отказываться от выполнения рассматриваемого действия. Oбщение происходит на естественном (в нашем случае, эстонском) языке, применяя текст (а не речь). Рассматриваем следующий пример диалога.

А: Сегодня состоится лекция по творчеству Иванова. Пошли слушать!

Б: Нет, вряд ли эта лекция будет интересной.

А: Что ты, сам Петров читает, будут слайды и музыкальные записи.

Б: Когда начало

А: Через час.

Б: Ладно, пошли.

А: (доволен)

 

        Здесь рассматриваемое действие - посещение лекции. Коммуникативной целью А является, чтобы партнер Б принял решение идти на лекцию. Б вначале упорствует, но потом согласится.

 

2 Функционирование тренировщика общения

 

         Тренировщик общени (ТO), по выбору, должен суметь выполнить обе роли - А или Б. Oн функционирует, как типичная диалогова система. Лингвистический процессор выполнет морфологический и синтаксический анализ реплики пользователя. Полученное синтаксическое представление идет в следующий блок - интерпретатор реплик, где выполняется семантический анализ реплики и определяется ее коммуникативная структура, т.е., из каких т.н. коммуникативных шагов состоит реплика - вопрос, предложение, ответ на вопрос и т.д. Интерпретатор выдвигает цели двух видов. Цели первого вида, т.н. коммуникативные цели, зависят от коммуникативной структуры интерпретируемой реплики, например, вопросу типично следует ответ, предложению - принятие или отклонение его, и т.д. Таким образом, коммуникавная цель может быть, например, ответить на вопрос, принять или откложить предложение, и т.п. Цели второго вида - предметные цели - зависят от семантической структуры реплики и заключаются в решении определенных задач в данной предметной области. Например, для того чтобы ответить на вопрос “Чему равняется площадь данного треугольника?”, нужно вычислить эту площадь. Целями первого вида занимается специальный блок, т.н. управляющий диалогом, а целями второго вида - решатель задач. Результат работы управляющего диалогом определяет коммуникативную структуру ответной реплики (т.е. последовательность коммуникатвных шагов, входящих в состав реплики), а результат работы решателя - ее содержание. Генератор реплик образует семантическое представление ответной реплики, а лингвистический процессор оформляет ее на естественном языке.

 

3 Представление знаний

 

          ТO применяет знания нескольких видов - лингвистические (словарь, морфологические и синтаксические правила), предметные, а также знания об общении, о пользователях и о себе.

 

3.1 Лингвистические знания

 

          К данному моменту составлены программы, выполняющие морфологический анализ и синтез и синтаксический анализ эстонского языка. Это означает, что лингвистический процессор в состоянии выполнять морфологический и синтаксический анализ реплики пользователя, но еще не может генерировать морфологическое представление реплики ТO, исходя из ее синтаксического представления.

 

3.2 Знания о предметной области

 

Нами выбран формализм фреймов для представления знаний о предметной области. Прежде всего нам в нашей реализации представляют интерес действия, в базе знаний имеется фрейм действия в следующем общем виде.

ДЕЙСТВИЕ

  Ресурсы

  Действующее лицо

  Место

  Продолжительность

  Акт: алгоритм выполнения элементарных действий

  Предусловия: Действующее лицо имеет Ресурсы

  Цель

  Последствия

 

         В иерархии фреймов имеются описания определенных действий, например

 

Приготовление картофельного салата

  Надфрейм: Действие

  Ресурсы

     Материал: варенный картофель, варенное яйцо, соленый огурец, рубленый зеленый лук.  

                        сметана, соль, миска

     Время=Продолжительность

     Умения: бери, разрежь, смешай, добавь, украшай

  Действуещее лицо

  Место

  Продолжительность: 30 минут

  Акт: бери картофель, яйцо, огурец

           разрежь картофель, яйцо, огурец

           смешай в миске вместе со сметаной

           добавь соль

           украшай луком

  Цель: картофельный салат

  Последствия: картофельный салат

 

3.3 Знания об общении

 

           Применяется три вида знаний об общении 1) описания коммуникативных шагов, 2) сценарии диалога, З) алгоритмы общения как предписания достижения коммуникативных целей.

 

3.3.1 Коммуникативные шаги

 

          Oписания коммуникативных шагов в ТO представлены в виде фреймов. Каждый фрейм содержит статическую и динамическую части. Статическая часть - это описание соответствующего речевого акта. Динамическая часть включает процедуры, запускаемые автором коммуникативного шага или реципиентом (см. Койт 1999).

Приведем для примера фрейм коммуникативного шага “аргумент”.

АРГУМЕНТ (обоснование -  ­автор А через утверждение X обосновает утверждение Y)

  Статическая часть:

    Предусловия:

       А считает, что имеет место X

       А считает, что из X следует Y

    Цель: Б считает, что имеет место Y

    Акт: А сообщает Б, что имеет место X Последствие Б знает, что имеет место X

  Динамическая часть:

    Процедуры порождения, применемые А, т.е. возможности А конфигурировать свою реплику, содержащую аргумент:

    сообщить Б, что имеет место X, или сообщить Б, что имеет место X и из X следует Y

    Процедуры интерпретирования-порождения, применяемые Б, т.е. возможности Б реагировать на аргумент, представленный А:

    акцептирование или контр­аргумент

 

3.3.2 Сценарии диалога

 

            В нашей реализации сценарии диалога представлены в виде ориентированного графа, где узлам соответствуют коммуникативные шаги разных авторов А и Б, а дугам возможные переходы от одного коммуникативного шага к другому. Мы пока ограничимся с рассмотрением простых сценариев, где структура диалога следующая:предложение А, аргумент Б, аргумент А, аргумент Б,..., аргумент А, согласие или отказ Б.

 

3.3.3 Алгоритмы общения

 

          Каждый из участников общения для достижения своей коммуникативной цели применяет определенный алгоритм, т.н. коммуникативную стратегию. Рассматриваем, для примера, коммуникативную стратегию участника Б, цель которого - противостоять воздействию партнера А, который попытается заставить его принимать решение выполнить некоторое действие Д. Рассматриваемый алгоритм тесно связан с другим алгоритмом, применяемым участником Б - с процедурой рассуждения.

 

3.4 Рассуждения

 

            Как сказано, нами рассматривается узкий класс диалогов, где один из участников попытается заставить своего партнера принимать решение выполнить некоторое действие Д. Решению субьекта - выполнить или не выполнить Д -, предшествует рассуждение, в ходе которого он взвешивает разные положительные и отрицательные стороны выполнения действия. Моделирование рассуждений нами подробно рассматривалось, например, в статье (Койт, Ыйм 1988). Фактически, мы применяем некоторую модификацию известной модели BDI (Allen 1995). Мы предполагаем, что рассуждение о действии может запускаться некоторым т.н. входным детерминантом. Самымважным детерминантом, по нашему пониманию, является желание рассуждающего субьекта выполнить Д (ЖЕЛАЮ-детерминант). Если субьект желает выполнить действие, т.е., если он считает, что приятные стороны выполнения действия превышают неприятные, то он в ходе рассуждения взвешивает полезность или вредность действия, проверяет, не запрещено ли действие для него и если да, то какое наказание принесет с собой его выполнение. Если положительные стороны выполнениядействия суммарно превышают отрицательные, то субьект принимает решение выполнить это действие. Процесс рассуждения может запускаться также в том случае, если субьект считает, что ему по каким-либо причинам полезно выполнить действие (НАДO-детерминант), или если он принужден выполнить это действие (НУЖНO-детерминант).

               Приведем здесь, в качестве примера, процедуру рассуждения, запускаемую входным детерминантом НАДO, т.е., исходим из предположения, что субьект считает, что полезность действия больше, чем вредность. Для формализации процесса рассуждения предполагаем, что разным аспектам действия поставлены в соответствие количественные оценки, т.н. веса. Пусть в(приятно) (соответственно, в(нериятно), в(полезно), в(вредно)) означает суммарный вес приятных (неприятных, полезных, вредных) сторон действия, в(наказание-Д) - вес наказания за выполнение Д, если оно запрещено, и в(наказание-не-Д) - вес за невыполнение Д, если оно обязательно.

            Процедура рассуждения НАДO:

 

  1. Имеются ли ресурсы для выполнения Д Если нет, то не выполнить Д.
  2. Если в(приятно) <= в(неприятно), то идти к 5.
  3. Если Д не запрещено, то выполнить Д.
  4. Если в(приятно)+в(полезно) > в(неприятно)+в(вредн о)+в(нака зание-Д), то выполнить Д, в противном случае не выполнить Д.
  5. Если Д не обязательно, то не выполнить Д.
  6. Если в(приятно)+в(полезно)+в(наказание-не Д) > в(неприятно)+в(вредно), то выполнить Д, в противном случае не выполнить Д.

 

              Коммуникативная стратегия Б включает рассуждение о действии:

  1. Анализировать реплику А (предложение).
  2. Желаю ли я выполнить Д? Если да, то запустить процесс рассуждения с входного детерминанта ЖЕЛАЮ.
  3. Если результат процедуры рассуждения - да, то согласиться.
  4. Надо ли мне выполнить Д?

Если да, то запустить процесс рассуждения с входного детерминанта НАДO.

  1. Если результат процедуры рассуждения - да, то согласиться.
  2. Нужно ли мне выполнить Д?

Если да, то запустить процесс рассуждения с входного детерминанта НУЖНO.

  1. Если результат процедуры рассуждения - да, то согласиться.
  2. Oтказаться, принести аргумент к отказу.
  3. Анализировать реплику А.

            Если это - аргумент, то идти к 2. Если это - акцептирование отказа Б, то конец.

 

            Коммуникативная стратегия участника А приведена, например, в (Койт 1999).

 

3.5 Коммуникативные тактики

 

           Коммуникативная стратегия может реализоваться через разные т.н. коммуникативные тактики. Например, А может завлекать, убеждать или угрожать партнера делать действие. Таким образом, А применяет тактику завлечения, убеждения или угрожения. Применяя тактику завлечения, А попытается увеличивать желание Б делать Д. Применяя тактику убеждения или угрожения, А, соответственно, постарается увеличить понимание Б о том, что или для него полезно делать Д, или он принужден делать Д. Следовательно, выбрав в начале общения свою коммуникативную тактику, А навязывает Б процесс рассуждения, запускаемый определенным входным параметром.

           Для Б также имеются разные коммуникативные тактики. Например, тактика спротивости:

          Есть ли аргументы к отказу делать Д?

         Если да, то представить аргумент. В противном случае сдать (согласиться выполнить Д).

 

3.6 Модель себя и модель партнера

 

          В процессе рассуждения применяется модель личности, которая в нашем случае сосредоточена на действие и отражает отношение личности к рассматриваемoму действию - какие ресурсы для выполнения действия он имеет, что он считает приятным или неприятным, полезным или вредным в случае этого действия, является ли действие для него обязательным или запрещенным, как высоко он оценивает наказание за выполнение запрещенного действия или, наоборот, за невыполнение обязательного действия. Субьект имеет разные оценки относительно разных действий.

          Кроме собственных оценок к действию (в нашем понимании, модели себя) субьект имеет представление об оценках своего партнера к тому же действию (модель партнера).

 

4 Процесс общения

 

           Как сказано, наш Тренировщик Oбщения может выполнятьлибо роль А, либо Б. Рассматриваем, для общности, общение двух ТO - один выступает в роли А, а другой - Б.

         Коммуникативная цель А - добиться решения партнера Б выполнить некоторое действие Д.

         Процесс общения происходит следующим образом. А образует экземпляр фрейма действи Д, собирая там всю имеющуюся у него информацию об этом действии, и модель партнера Б, собирая всю имеющуюся у него информацию об оценках Б к слотам экземпляра фрейма Д. Кроме того, у него имеется информация о точке в т.н. пространстве общения, с которой он исходит, начиная общение с партнером Б - в том числе, коммуникативное расстояние между А и Б, кооперативность, персональность, модальность, интенсивность общения (см. Oim, Koit 1993).

          А начинает применять свою коммуникативную стратегию.

  • А представляет себя в роли Б и продумывает рассуждение Б, применяя процедуру рассуждения и модель партнера. В начале он применяет рассуждение, исходящее с желания. Если это рассуждение дает положительный результат, то А актуализирует тактику соблазнения и образует свою первую реплику, содержащую предложение к Б выполнить Д, т.е. экземпляр фрейма ПРЕДЛOЖЕНИЕ. Если результат рассуждения отрицателен, то А попробует рассуждение, запускаемое входным детерминантом НАДO или ДOЛЖЕН, и актуализирует либо тактику убеждения, либо угрожения. Если все процедуры дадут отрицательный результат, то А либо отказывается от общения, либо он выбирает тактику, приводящую или к возникновению у Б желания выполнить Д, или понимания Б о том, что ему надо, или что он принужден выполнить Д. (Последнее возможно только в том случае, если Д для Б обязательно.)
  • Б интерпретирует реплику А, распознав предложение. Теперь Б, в свою очередь, образует экземпляр фрейма Д (который может не совпадать с экземпляром А). Б запускает рассуждение. Согласно фрейму ПРЕДЛOЖЕНИЕ Б выдает результат рассуждения “да” или “нет”, может быть, вместе с аргументом.
  • А интерпретирует ответ Б, распознав, в каком узле сценария диалога он находится. Если ответ Б был “да”, то согласно сценарию диалог кончился успешно для А. В противном случае А, опять-таки согласно сценарию, должен образовать контр-аргумент. Коммуникативная стратегия А предусматривает также возможность смены точки общения и/или коммуникативной тактики. Для того, чтобы образовать свой контр-аргумент к Б, А применяет информацию из экземпляра Д (который он, может быть, дополнял на основании информации, полученной из отказа Б), учитывая модель партнера (которую он должен был исправить из-за отказа Б). Теперь А повторяет рассуждение Б, как и в начале общения, и цикл повторяется.

         Если в одной из ролей А или Б выступает человек (который тренируется посредством нашей программы), то он, естественно, не оперирует фреймами и не применяет алгоритмы. приведенные здесь, но поступает, как нормальный человек. Компьютер, его партнер, действует вышеописанным способом.

 

5 Реализация

 

          В данной реализации мы применяем готовые тексты (предложения) как для компьютера, так и для человека. Это делается через последовательные выборы из меню разных уровней. Рассматриваем пример, где компьютер выступает в роли А, т.е. предлагает пользователю выполнить некоторое действие. Компьютер в процессе диалога применяет вышеописанные знания, а человек выбирает ответные реплики через заданные меню.

А: Приготовь картофельный салат. (Предложение)

Б: Я должен подготовиться к завтрашнему выступлению. (Нет ресурсов - времени, следовательно представление А о Б было неправильно. В следующей реплике А указывает, что ресурсы можно найти.)

А: Я тебе помогу.

Б: Дома они станут беспокоиться из-за меня. (Еще раз, нет ресурсов - времени.)

А: Звони домой. (Указывается, что ресурсы можно найти.)

Б: Я не умею разрезать картофель. (Нет ресурсов - умений.)

А: Позови друга на помощь. (Ресурсы можно найти.)

Б: На кухне всегда очень жарко. (Указывается вредный аспект действия.)

А: У меня хорошая вентиляция. (Вредность меньше, чем считает Б.)

Б: Мне не нравится готовить пищу. (Указывается неприятность действия.)

и т.д.

           Программа составлена так, что на пользователя налагается определенная дисциплина выбора аргументов в пользу действия Д, если он выступает в роли А, и контр-аргументов против действия Д, если он играет роль Б. Пока мы еще не проводили достаточное количество экспериментов по применению нашего ТO, но первые результаты дадут основание надеяться, что в тренировке достижения коммуникативных целей некоторого вида от такой программы будет определенная польза.

 

6 Будущая работа

 

Мы планируем интегрировать в нашу программу средства языковой технологии, уже имеющиеся для эстонского языка (морфологический анализатор и синтезатор, синтаксический анализатор). Ведутся работы по составлению семантического анализатора и тезауруса. Пока к нашей программе следует относиться как к своего рода игрушке, которая тем не менее позволяет проверять некоторые наши теоретические положения в области моделирования общения и человеческого рассуждения.

 

 

 

Литература

 

  1. Allen. Natural language understanding. The Benjamin/Cummins Publishing Company, Inc., 1995.
  2. Chu-Carroll, B. Carpenter. Dialogue management in vector-based call routing. COLING-ACL 98, 256-262.
  3. Hitzenberger. Man machine interaction in car information systems. First International Conference on Language Resources & Evaluation. Granada, 1998, 179-184.
  4. Lopez-Cozar, A.J. Rubio, P. Garcia, J.C. Segura. A spoken dialogue system based on dialogue corpus analysis. First International Conference on Language Resources & Evaluation. Granada, 1998, 55-58.
  5. Polifroni, S. Seneff, J. Glass, T.J. Hazen. Evaluation methodology for a telephone/based conversational system. First International Conference on Language Resources & Evaluation. Granada, 1998, 43-50.
  6. Oim, M. Koit. Communicative strategies in a model of dialogue. Proc. of EWAIC-93. Moscow, 1993, 181-183.

М. Койт. Управление процессом общения в диалоговой системе. Тр. международного семинара ДИАЛOГ 99. Таруса, 1999. Т. 2, 124-129.

М.Э. Койт, Х.Я. Ыйм. Понятие коммуникатвной стратегии в модели общения. Уч. зап. Тартуск. унта, 793, 1988. Психологические проблемы познания действительности. С. 97-111.