Open Nixx-K opened 3 weeks ago
@KluskaGit Co do publikacji, uważam, że do tabeli publications łatwiej będzie Ci scrapować stąd: https://bw.sggw.edu.pl/globalResultList.seam?r=publication&tab=PUBLICATION&lang=pl, a do tabeli scientists z profilu danego naukowca.
@KluskaGit Co do publikacji, uważam, że do tabeli publications łatwiej będzie Ci scrapować stąd: https://bw.sggw.edu.pl/globalResultList.seam?r=publication&tab=PUBLICATION&lang=pl, a do tabeli scientists z profilu danego naukowca.
Tabela scientists nie ma publikacji i wydaje mi się, że nie ma sensu scrapować z dwóch różnych źródeł tych samych informacji
W takim razie uważam, że najłatwiej będzie Ci scrapować stąd: https://bw.sggw.edu.pl/globalResultList.seam?r=publication&tab=PUBLICATION&lang=pl.
Na ten moment scraper jest w stanie pobrać prawie wszystkie informacje. Problem jest z tym, że muszę dostosować odpowiednią ilość requestów i opóźnienia bo inaczej dostanę error 500. Dodatkowo w profilu naukowca ministerial score jest generowany w inny sposób i nie zawsze jest pobierany. Dzisiaj powinienem dodać kilkuset naukowców z bibliometrią aby cokolwiek było w bazie i będę próbował ogarnąć resztę tabel w bazie aby coś zawierały. Też muszę się zastanowić nad schematem pobierania danych aby nie przeciążyć serwerów, gdyż ilość danych jest duża
Dziękuję!
@KluskaGit Nie musisz scrapować SNIPu ani CiteScore widocznych w profilach. Co do h-indexów, potrzebujemy obu, WoS oraz Scopus. Zaraz oba pola zostaną dodane do bazy danych.