Dialogue Evaluation 2023
RuCoCo
Соревнование по разрешению кореференции
Соревнование и приём работ завершены. Благодарим всех за участие!
Ссылки
График проведения соревнования
- 13 января — публикация train и dev датасетов, тестовых данных;
- 23 марта 23:59 (GMT +3) — дедлайн public фазы;
- 26 марта 23:59 (GMT +3) — дедлайн private фазы, открытие финального лидерборда;
- 8 апреля — дедлайн подачи статьи.
Описание
Разрешение кореференции — одна из самых трудных и актуальных подзадач в области обработки естественного языка, важная для многих прикладных задач NLP.
Кореферентными считаются языковые выражения, соответствующие одному объекту действительности, например:
[Вася] вернулся домой поздно. [Мальчик] долго оправдывался, но в конце концов признал [свою] вину.
Здесь кореферентной цепочкой является [Вася] — [мальчик] — [свою]. Разрешение кореференции, таким образом, это составление цепочек всех кореферентных упоминаний.
Постановка задачи
Участникам предлагается решить задачу по разрешению кореференции для корпуса RuCoCo, состоящего из текстов новостного портала NewsRU.
Это соревнование по разрешению кореференции — третье в рамках Dialogue Evaluation, однако впервые используется корпус такого масштаба: более 1 млн. слов только для обучения. Корпус RuCoCo был представлен на Диалоге в прошлом году.