ecoinfAEET / Notas_Ecosistemas

Notas ecoinformáticas para la revista Ecosistemas
9 stars 15 forks source link

Limpieza y filtrado automático de bases de datos de biodiversidad #36

Open CarlosLaraR opened 4 years ago

CarlosLaraR commented 4 years ago

La nota puede partir de una descarga de datos de un conjunto de especies de GBIF y luego se limpian y se hace un mapa con el aspecto de los datos antes y después del filtrado y limpieza. La nota se centraría en limpieza de coordenadas (Paquete CoordinateCleanaer) y de nombre de especies (Paquete Taxize o similar). Finalmente se podría aplicar select y filter de dplry para seleccionar una parte de los datos ya filtrados.

ibartomeus commented 4 years ago

Gracias! Recuerda el limete de ~1000 palabras. Personalmente creo que select y filter no son necesarios, pero algo de regular expresions para, por ejemplo limpiar sp1, sp2, sp3, molaria. Yo quizas puedo añadirlo duarante la revisón.

CarlosLaraR commented 4 years ago

Muy bien. Acabo de hablar con Joaquin Calatayud y se va a unir a la nota para la parte de filtrado de especies. Así que en principio ya tengo compañero de viaje.

gretacv commented 4 years ago

Hola @CarlosLaraR ! ¿Sigues necesitando ayuda?

CarlosLaraR commented 4 years ago

Hola,

Pues si quieres me viene bien. Le pedí ayuda a un compañero pero creo que ha enfriado.

Mi idea es comenzar con el filtrado de datos centrado en coordenadas a partir de un dataset real y luego pasar al filtrado de especies. Necesito alguien que se encargue de la segunda parte centrada por ejemplo en corregir errores en los nombres y rransformar sinónimos en nombres aceptados por una clave taxonómica específica. Bueno y lo que se nos vaya ocurriendo.

¿Cómo lo ves?

Carlos

El miércoles, 29 de enero de 2020, gretacv notifications@github.com escribió:

Hola @CarlosLaraR https://github.com/CarlosLaraR ! ¿Sigues necesitando ayuda?

— You are receiving this because you were mentioned. Reply to this email directly, view it on GitHub https://github.com/ecoinfAEET/Notas_Ecosistemas/issues/36?email_source=notifications&email_token=AGEY73HWYD47UTKT7YY4CQLRAFWFHA5CNFSM4JMB2HK2YY3PNVWWK3TUL52HS4DFVREXG43VMVBW63LNMVXHJKTDN5WW2ZLOORPWSZGOEKG6TVI#issuecomment-579725781, or unsubscribe https://github.com/notifications/unsubscribe-auth/AGEY73ANA4GWMOKOFY4CNC3RAFWFHANCNFSM4JMB2HKQ .

--

Carlos Lara Romero - PhDPostdoctoral Researcher Biodiversity and Conservation Area. Rey Juan Carlos University. E-28933, Móstoles, SPAIN Website: http://lararomero.weebly.com/ Google Scholar: https://scholar.google.es/citations?user=DcKsIEMAAAAJ&hl=en ORCID: 0000-0003-0962-0567 http://orcid.org/0000-0003-0962-0567PUBLONS: 583636 http://publons.com/a/583636/

gretacv commented 4 years ago

Es decir, lo que comentas usando Taxize? Nunca lo he utilizado, pero puede ser un buen momento ☺️

CarlosLaraR commented 4 years ago

Cool @gretacv cuento contigo entonces.