colav / impactu

Colav Impactu Issues and Documentation
BSD 3-Clause "New" or "Revised" License
0 stars 0 forks source link

Asociación entre COD_RH y OpenAlex ID a través de doi #130

Closed restrepo closed 2 weeks ago

restrepo commented 2 weeks ago

Pensando en el peor escenario. Supongamos que de Scienti y los Minciencias tenemos:

{COD_RH:'MMMM', ORCID:'????', DOIS:[doi1, doi2, doi3, doi4, doi5, doi6]

No sabemos si ORCID = '????' es correcto.

De OpenAlex tenemos:

doi1 = {'OpenAlex_ID':'AAAA', 'ORCID:'ZZZZ'} 
doi2 = {'OpenAlex_ID':'BBBB', 'ORCID:'YYYY'}
doi3 = {'OpenAlex_ID':'CCCC', 'ORCID:''}
doi4 = {'OpenAlex_ID':'AAAA', 'ORCID:'ZZZZ'} 
doi5 = {'OpenAlex_ID':'BBBB', 'ORCID:'YYYY'}
doi6 = {'OpenAlex_ID':'DDDD', 'ORCID:''}
doi7 = {'OpenAlex_ID':'BBBB', 'ORCID:'YYYY', 'COD_RH':'????'}  #  'COD_RH' de homónimo
...
  1. If ORCID:'????' == 'ORCID:'YYYY' entonces podemos asociar COD_RH:'XXX' → 'OpenAlex_ID':'BBBB' y debemos corregir los doi1, doi3, doi4 y doi6 de OpenAlex y podemos añadir doi7 a la lista de COD_RH:'XXX'
  2. If ORCID:'????' == 'ORCID:'', se debería dejar para el final y esperando que que solo una posibilidad, tomar la que queda: ORCID: '' → 'ORCID:'YYYY' con 'OpenAlex_ID':'BBBB' (asumiendo que no existe ni doi3 ni doi6) y, además, comprobar la consistencia con las fechas de afiliación y COD_RH para los dois restantes. Si quedan varias posibilidades y una vez se descarte por ejemplo 1, habría que escoger entre 'OpenAlex_ID':'AAAA', 'OpenAlex_ID', 'OpenAlex_ID':'DDDD' basado en el match más completo en términos de nombres y apellidos y en la consistencia con las fechas de afiliación y COD_RH

En el caso de Alejandro Uribe-Tirado, https://github.com/colav/impactu/issues/124, podemos usar directamente 1.

En el caso de Jorge Enrique Tobón Gómez, https://github.com/colav/impactu/issues/118, tenemos el caso 2 que si es dejado para el final se reduce a varios identificadores OpenAlex sin ORCIDs asociados y con homónimos en algún nombre y el primer apellido. Las demás posibilidades se descartan por estar asociadas a COD_RH diferentes para el autor homónimo Jorge Iván Tobón.

restrepo commented 2 weeks ago

Sólo comprobar caso en COD_RH son diferentes con ORCIDS diferentes https://github.com/colav/impactu/issues/124