tocororo / iroko

Code of Sceiba
MIT License
0 stars 0 forks source link

Web scraping de OJS, v2 y v3 #52

Open eduar2arencibia opened 1 year ago

eduar2arencibia commented 1 year ago

Recolector de datos de los sitios de OJS. OJS, en sus versiones 2 y 3, tiene una serie de URL canonicas donde se exponen determinados datos sobre la revista que son necesarios recolectar. La tarea debe hacerse usando la libreria https://scrapy.org/ ... sea: URL_OJS, la url de la revista. recolectar lo qeu hay en URL_OJS/about [aqui hay que definir los datos que se estan buscando...] [definir otras urls para recolectar datos de las revistas]

Esta tarea hay que dividirla en subtareas, comenzar estudiando scrapy y recolectar los datos de https://mendive.upr.edu.cu/index.php/MendiveUPR/about

malayibiri commented 1 year ago

En general, hay que comparar los campos de metadato Revistas, y ver cuáles de estos se pueden(para validar o llenar) obtener mediante scrapping del html de ojs.