Closed PonteIneptique closed 4 years ago
Un bug d'une librairie externe à collatinus transformait les y courts en u (à la place de y) dans atone
ce qui supprime quelques unes des erreurs sus-citées
Ce n'est pas un bug : le y-bref (avec le signe diacritique "breve") n'existe pas dans unicode et nous l'avons codé par le "SHORT-U" cyrillique (U+045E). Si on utilise une routine qui ôte les diacritiques, il semble logique d'obtenir un "u", même si graphiquement ça n'a rien à voir.
Je viens d'avoir cette réponse de la personne responsable de la librairie :)
J'ai mis à jour la liste après la correction du bug PyCollatinus y/u et de la mise à jour du vocabulaire de la règle de Saint Benoit (donc pycollatinus==0.1.2) : 449 lemmes uniques inconnus pour 849 formes
D'après PyCollatinus, les formes et lemmes suivant-e-s sont inconnu-e-s :