ddavout / FESTIfr

https://github.com/ddavout/FESTIfr
0 stars 0 forks source link

des effets pervers: LTS et lexique #4

Closed ddavout closed 5 months ago

ddavout commented 5 months ago

( SayText "des effets pervers." ) (set! utt !)(wp utt)(utt.flat_repr utt) donne

()
id _4 ; name des ; pos_index 8 ; pos_index_score 0 ; pos ART:ind ; 
id _5 ; name effets ; pos_index 13 ; pos_index_score 0 ; pos NOM ; 
id _6 ; name pervers ; pos_index 0 ; pos_index_score 0 ; pos ADJ ; pbreak B ; 
"nil"
"<{(0 d  e )}{(0 z  e )(0 f  eh )}{(0 p  eh  rh )(0 v  e )}> _4 "

On sait bien que la LTS actuellement utilisée est sommaire, mais quand on rajoute dans un addenda

(lex.add.entry '("pervers" ADJ ((("p" "eh" "rh") 0) (("v" "eh" "rh") 0)))) ça ne change rien !!! Où est le problème ?

ddavout commented 5 months ago

En fait, on doit rajouter dans un addenda (lex.add.entry '("pervers_ADJ" ADJ ((("p" "eh" "rh") 0) (("v" "eh" "rh") 0)))) Pourquoi ? On a voulu se servir du fait qu'en français, les mots se terminant par er se prononcent, en général comme s'ils étaient terminés par é, histoire d'alléger la LTS et le dictionnaire de faciliter leur maintenance.

Comme toujours en français, il y a des exceptions. (cette règle aussi :)) Et on a du mettre au point un mécanisme un peu compliqué Pratiquement, on s'en tire en insistant avec ces 2 occurrences de ADJ. il faudra aussi ajouter

(lex.add.entry '("pervers_NOM" NOM ((("p" "eh" "rh") 0) (("v" "eh" "rh") 0)))) puisque "pervers" peut-être aussi NOM (on pensera à vérifier le résultat de is_in_poslex)

ça a l'air lourd, mais cela permet de travailler en finesse sans avoir une LTS de taille monstrueuse (en tout cas c'est notre idée et on espère en faire la preuve) : On a tant d'homographes non homophones et de lettres muettes !!