opendataam / opendatam-tasks

Public tasks for volunteers, hackathons and contests
Creative Commons Zero v1.0 Universal
8 stars 0 forks source link

[RU] Собрать данные о художниках Армянского происхождения из системы Артефакт Министерства культуры РФ #2

Closed ivbeg closed 8 months ago

ivbeg commented 1 year ago

Goal

Цель в создании набора/наборов данных об объектах культуры связанных с художниками Армении и имеющих армянское происхождение. Данные о картинах хранятся в системе Артефакт (ar.culture.ru) Минкультуры России. У этой системы есть открытое API через которое можно собрать эти данные.

Tasks

Необходимо разобраться с недокументированным API системы Артефакт (ar.culture.ru) и извлечь из него описания всех персон (художников) связанных с Арменией, описания их работ и выгрузить сами работы. Описание API есть в разделе Context.

Для того чтобы выгрузить экспонаты по художникам нужно из общего списка художников выявить те кто имеет армянское происхождение, например, Айвазовский, Сарьян и другие и отфильтровать экспонаты по их именам. Это можно сделать вручную или автоматически, главное чтобы итоговый список был точен.

Результат необходимо сохранить в формате JSON или JSON lines с описаниями художников и экспонатов, а изображения загрузить в какое-то временное хранилище и приложить ссылку комментарием. Команда Open Data Armenia перенесет файлы в постоянное хранилище.

Context

У системы Артефакт есть несколько недокументированных точек подключения к API возвращающих данные в формате JSON. Например, для художников https://ar.culture.ru/ru/facets/Person, параметры вызова можно изучить на странице https://ar.culture.ru/ru/persons

А для экспонатов API https://ar.culture.ru/ru/facets/Subject и то как происходят вызовы можно посмотреть на странице https://ar.culture.ru/ru/subjects

Как и какие параметры нужно передавать и по каким ссылкам выгружать изображения необходимо разобраться в этой задаче

Requirements

Wishes

Желательно если Вы хотя бы немного опишите код чтобы в будущем кто-либо могбы его запустить чтобы собрать эти данные в случае если они обновятся в первоисточнике. Особенно хорошо будет если парсер будет создан в виде утилиты командной строки

Resources

Prepared by

Задача подготовлена командой Open Data Armenia