biblissima / collatinus

Sources of Collatinus software - Latin lemmatizer, morphological analyzer and scansion
http://outils.biblissima.fr/en/collatinus
GNU General Public License v3.0
62 stars 15 forks source link

déramisation de V ? #21

Closed eroux closed 8 years ago

eroux commented 8 years ago

Pour l'instant, V n'est pas déramisé en U, cela pose un problème pour reconnaître Vlixes. La ligne est commentée dans Ch::deramise, il faudrait comprendre pourquoi

ycollatin commented 8 years ago

Le 29 avril 2016, à 01h48, Elie Roux écrivit :

Pour l'instant, V n'est pas déramisé en U, cela pose un problème pour reconnaître Vlixes. La ligne est commentée dans Ch::deramise, il faudrait comprendre pourquoi

La méthode serait V + voyelle -> V et V + consonne -> U.

Il faudrait voir si cette règle n'a aucune exception, ou suffisamment peu pour qu'on en fasse une liste. Il faudrait donc chercher des exemples de U+voyelle, ou V+consonne. Et comme il y a dans les titres et les inscriptions des mots entièrement en majuscules, ça complique la recherche. Par exemple, le relatif QVI (V+voyelle) doit devenir QUI, alors

que VINCO doit reste VINCO.

                    Yves
eroux commented 8 years ago

Aucune exception dans le Gaffiot en tous cas... mais je ne comprend finalement pas trop le rapport avec deramise, qui est sensé justement déramiser et donc tout transformer en U... ? S'il n'y a pas d'exception à cette règle, ça veut dire qu'il n'y a aucune ambiguité justement, et donc qu'on peut transformer les V en U pour les recherches dans le lexique non ?

PhVerkerk commented 8 years ago

Le problème n'est probablement pas tant dans deramise que dans le comptage des V (quand il sera implémenté). Il faut vérifier que ça ne crée pas de conflit avec lemmes.fr et, surtout, avec irregs.la (où la clef est non ramiste).

Le 29/04/2016 11:29, Elie Roux a écrit :

Aucune exception dans le Gaffiot en tous cas... mais je ne comprend finalement pas trop le rapport avec deramise, qui est sensé justement déramiser et donc tout transformer en U... ? S'il n'y a pas d'exception à cette règle, ça veut dire qu'il n'y a aucune ambiguité justement, et donc qu'on peut transformer les V en U pour les recherches dans le lexique non ?

— You are receiving this because you are subscribed to this thread. Reply to this email directly or view it on GitHub https://github.com/biblissima/collatinus/issues/21#issuecomment-215668256

ycollatin commented 8 years ago

Le 29 avril 2016, à 02h49, PhVerkerk écrivit :

Le problème n'est probablement pas tant dans deramise que dans le comptage des V (quand il sera implémenté). Il faut vérifier que ça ne crée pas de conflit avec lemmes.fr et, surtout, avec irregs.la (où la clef est non ramiste).

Merci Philippe. En tout cas, Vnelli (= Unelli) n'est pas

reconnu, malgré la présence du lemme dans lemmes.la.

                    Yves