Bonjour,
notre collègue a identifié un problème dans l'étiquetage des données, en effet il semble que certaines entités soient indiquées à l'intérieur d'autres, c'est à dire avec leur position de départ se situant entre les positions de départ et de fin d'une autre entité.
Il semblerait que ce soit un problème dans le script qui constitue les données qui récupère le premier match de la chaîne, puisqu'il s'agit uniquelment de chaînes courtes qui sont présentes par hasard au milieu d'autres mots plus tôt dans le texte, et que le problème n'est que dans les valeurs begin et end.
Bonjour, notre collègue a identifié un problème dans l'étiquetage des données, en effet il semble que certaines entités soient indiquées à l'intérieur d'autres, c'est à dire avec leur position de départ se situant entre les positions de départ et de fin d'une autre entité. Il semblerait que ce soit un problème dans le script qui constitue les données qui récupère le premier match de la chaîne, puisqu'il s'agit uniquelment de chaînes courtes qui sont présentes par hasard au milieu d'autres mots plus tôt dans le texte, et que le problème n'est que dans les valeurs begin et end.
Voyez les exemples remontés