Задачи сообщества по сбору и извлечению данных из официальных источников / Community tasks to collect open data from official sources. ПЕРЕНЕСЕНО: задачи перемещены в репозиторий hubofdata
На портале unsecret.rusarchives.ru размещена общедоступная база рассекреченных документов. Необходимо собрать данные из этой базы и выложить их как открытые данные.
Задача
выбрать язык программирования Python / R или иной, на выбор
написать парсер для сайта unsecret.rusarchives.ru
выгрузить все данные в формате CSV или JSON или XML
загрузить набор данных на github и на хаб открытых данных hubofdata.ru
Требования
открытый исходный код в Github под свободной лицензией
открытые данные под лицензией Creative Commons
Пожелания
сделать описание к выгруженным данным. Структуры данных и набора целиком.
Цель
На портале unsecret.rusarchives.ru размещена общедоступная база рассекреченных документов. Необходимо собрать данные из этой базы и выложить их как открытые данные.
Задача
Требования
Пожелания
Оценки трудоёмкости
Ожидаемое время на задачу не более 1 дня
Вспомогательные материалы:
Вопросы
Вопросы можно писать на ibegtin@infoculture.ru или в комментариях к этой задаче