Closed BenMerSci closed 3 weeks ago
Ajouté des tests qui confirment le comportement des précédents changements, donc:
from_all_sources
renvoie la même quantité d'information qu'il y ait un parent_scientific_name ou nonBubo scandiaca
) et que les synonymes désirés (test de Hyla versicolor versicolor
) soient incluent ou excluentFinalement retiré la portion de code qui retirait les synonymes, et ils seront finalement tous injectés
(out = [ref for ref in out if not (ref.valid == False and ref.match_type == 'fuzzy')]
)
Retiré aussi les tests qui y étaient associés.
J'ai finalement aussi updaté la custom_sources cdpnq avec la liste la plus à jour (LFVQ) sur données Québec.
Modification à la fonction
_prune_parent_taxa()
:out
, pour conserver seulement le comportement initial désiré de cette fonctionModification à la fonction
from_all_sources()
:out
, et ce peu importe si un parent_scientific_taxa est présent ou non (ce qui résolvait #14)On recevait 2 fois la même branche taxonomique pour un taxon si il y a un synonyme, donc on injectait 2 fois la même hiérarchie dans taxa_ref, exemple: Bubo scandiacus et sa hiérarchie:
Biota
,Animalia
,Chordata
, ...,Striginae
,Bubo
etBubo scandiacus
. MAIS retourne aussi: Bubo scandiaca et la même hiérarchie:Biota
,Animalia
,Chordata
, ...,Striginae
,Bubo
etBubo scandiaca
. SAUF que la hiérarchie du synonyme a un match_type ==None
au lieu deexact
donc le bout de code ajouté conserve seulement les doublons avec match_type ==exact
.out
qui sont match_type == 'fuzzy' et valid = FalseS'assure de ne pas injecter les synonymes fuzzy comme discuté avec Vincent