nppo / search-portal

A search service for finding open access higher education learning materials
MIT License
1 stars 0 forks source link

Koppeling Hanze search #19

Open martineteirlinck opened 2 years ago

martineteirlinck commented 2 years ago

Koppeling Pure

fako commented 2 years ago

Dit is al geimplementeerd in november of zoiets. Het is nooit getest. Momenteel geblokkeerd door contracten @martineteirlinck @JohnMeurs

JohnMeurs commented 2 years ago

Dus als Hanze go geeft, kunnen wij gelijk gaan testen. Ik meende alleen producten. @fako Klopt dat?

fako commented 2 years ago

Ja, deze ticket gaat alleen over producten.

fako commented 2 years ago

@JohnMeurs Hanze wilt eerst een pen test uitvoeren voordat deze koppeling naar prod gaat. Klopt toch?

fako commented 1 year ago

Koppeling is nu geupdate en klaar om getest te worden. Het is nog niet helemaal duidelijk waar/hoe we gaan testen. Mogelijkheden voor testen die ik kon bedenken:

fako commented 1 year ago

Er is ook een bekend probleem. Organizations (lees: parties) worden nog niet doorgegeven. Harma heeft de verwachting dat we de namen zoals Hanze die opgeeft zichtbaar zullen zijn op Publinova, maar we halen momenteel nog helemaal geen organisaties op, dus we kunnen ook nog lastig de naam weergeven. Wellicht kan iemand het handmatig invoeren op Publinova (bij Zooma zeg maar). Geen idee hoe dat werkt. Menno heeft nog niet gereageerd op een voorstel om de organisaties op te halen. Zodra hij het ermee eens is kan ik het wel gaan bouwen, maar dan zal Zooma alsnog de naam van organisaties bij producten moeten gaan zoeken. Eventueel zou ik een translation kunnen aanleveren, maar ik geloof niet dat Zooma de harvester translations gebruikt op dit moment, dus dat is dan niet echt een oplossing. Voor nu zou ik de id's van organisaties aan Zooma kunnen doorgeven, dat is een eerste stap, maar dat kan tot een teleurgestelde Harma leiden als die id's daadwerkelijk zichtbaar worden. Tot slot is het ook mogelijk om organisaties als een extra harvest stap op te halen bij producten, dit zal dan gebouwd moeten worden.

fako commented 1 year ago

openAccessPermission is verwijderd door Elsevier uit Pure. We moeten daarom iets verzinnen wat in de toekomst werkt voor Hanze, HvA en BUAS. Wat we nu doen is kijken naar de eerste file en als permissies daar open zijn, dan is het voor alles open (dus ook mogelijk andere files). De harvester kijkt momenteel alleen naar de eerste file, dus daar zijn de access rights het belangrijkst voor. Ook bij Edusources bestaat er een wens om het permissie gedeelte per file te gaan regelen, maar het is nog onduidelijk hoe dat moet gaan werken en of de harvester zich dan anders moet gaan gedragen (en alle open files moet harvesten bijvoorbeeld). Tot nu toe houden we extra files af, omdat dit vaak gaat om "bijlagen", "errata" en soortgelijke files, die weinig toevoegen aan de zoekervaring.

Een alternatief is om te zeggen dat Publinova toestemming krijgt van Hanze om de content die zij leveren full tekst te indexeren, ongeacht de access rights. Daar moet dan iets over in de contracten worden opgenomen.

Deze waarschuwing heb ik vaker laten horen, maar hij is ook wel relevant voor nu. Een "open-access" zegt niet over het copyright wat erop zit. Het is voor te stellen dat er "open-access" is, die helemaal niet mag worden opgenomen in search indices (omwille van de copyright). Momenteel nemen we bij Publinova aan dat "open-access" hetzelfde is als "cc-0" (de meest open copyright licentie)

fako commented 1 year ago

Dit is een opmerking van Harma, waar Zooma misschien iets mee moet:

"Bij onze eigen test is gebleken dat aan de producten gerelateerde projecten nog niet meekomen in de gegevenslevering. Hier vindt nog ontwikkeling op plaats bij de leverancier van Pure."