dialogue-evaluation / factRuEval-2016

http://www.dialog-21.ru/evaluation/2016/letter/
MIT License
56 stars 31 forks source link

factRuEval-2016

http://www.dialog-21.ru/evaluation/2016/letter/


Статус

Оценка завершена. Результаты предварительной (run_1) и окончательной (run_2) оценок опубликованы в папке https://github.com/dialogue-evaluation/factRuEval-2016/tree/master/reports .

Тестсет

В папке testset опубликована разметка оценочной коллекции для первых двух дорожек. Мы предполагаем, что в ней есть ошибки. Мы будем рады, если вы нам о них сообщите через раздел Issues. Просим вас создавать по одному issue на каждую ошибку. Это поможет быстро закрывать простые проблемы. Спасибо!

Даты


Формат демонстрационной разметки

Тексты документов (*.txt)

Текст предложений сохранён из источника. Предложения склеены через пробел. Абзацы - через двойной перевод строки.

Сегментация на токены и предложения (*.tokens)

Каждая строка - один токен. Предложения разделены пустой строкой.

Описание одного токена состоит из следующих полей:

Разделитель полей - пробел. В токене пробела быть не может.

Спаны (*.spans)

Каждая строка - один спан. Разделитель полей - пробел.

Поля:

Справочно (после решётки):

Упоминания объектов (*.objects)

Каждая строка - одно упоминание объекта. Разедлитель полей - пробел.

Поля:

Справочно (после решётки):

Кореференция и идентификация (*.coref)

Каждая запись - один объект. Разделитель записей - пустая строка.

Первая строка записи состоит из следующих полей:

Последующий строки:

Допустимые ключи: