bguil / UD-French-discussion

Discussions sur l'harmonisation des Treebanks du français au format UD
0 stars 1 forks source link

Annotation de *beaucoup de*, *plus de*, … #19

Open bguil opened 6 years ago

bguil commented 6 years ago

⚠️ Exemple édité après le commentaire de @sylvainkahane

Il pourrait être tentant d'annoter beaucoup de avec une relation fixed mais cela pose de nouveau le problème de la coordination.

Proposition: annotation comme un NO

# text = beaucoup de garçons et de filles
1   beaucoup    _   ADV _   _   3   advmod  _   _
2   de  _   ADP _   _   3   case    _   _
3   garçons _   NOUN    _   _   0   root    _   _
4   et  _   CCONJ   _   _   6   cc  _   _
5   de  _   ADP _   _   6   case    _   _
6   filles  _   NOUN    _   _   3   conj    _   _
screen shot 2018-04-20 at 10 03 34
sylvainkahane commented 6 years ago

ok (avec le mark sur filles) Je vois que tu proposes la même chose pour la plupart des filles, un tas de filles, etc. Je m'interroge juste sur le choix de la relation. Dans notre article à TLT on parle DE ça (a lot of questions plus précisément). Ce qu'on propose c'est d'avoir deux annotations au choix qui soient convertibles l'une en l'autre, l'une avec beaucoup comme tête, l'autre avec garçons comme tête. Les étiquettes qu'on propose sont: beaucoup nmod:det> garçons vs beaucoup <det:complex garçons En fait, advmod me semble mieux, mais est-ce que c'est pas bien d'avoir une extension qui indique que c'est une construction un peu spéciale ?

perrier54 commented 6 years ago

A propos de la dernière question posée par @sylvainkahane , s'il s'agit de faciliter la conversion entre SUD et UD, je pense qu'une marque de cette construction est inutile car il est très facile de concevoir un motif pour la repérer.

mcandito commented 6 years ago

Hi,

Je suis pour différencier l'adverbe et le pronom

"J'ai beaucoup mangé" => adverbe "Beaucoup sont partis tôt" => pronom

"J'ai mangé beaucoup de pâtes" => pronom prenant un SP en "de"

C'est ce qui est fait dans le FTB et ça me paraît le plus cohérent syntaxiquement

beaucoup(PRON) --obl--> garçons --case--> de

C'est pour garder les têtes lexicales que vous considérez "beaucoup" adverbe dans "beaucoup de garçons" ?

sylvainkahane commented 6 years ago

On a un paradigmes d'éléments qui commutent avec "beaucoup":

J'ai mangé beaucoup/peu/trop/assez/énormément/tant/ … de pâtes

A priori tous peuvent être utilisés en position sujet sans complément et tous comme modifieurs de verbe.

beaucoup/peu/trop/assez/énormément/tant/… sont partis tôt J'ai beaucoup/peu/trop/assez/énormément/tant/… dormi

Ca me parait difficile de justifier que c'est pas le même "beaucoup" ou le même "énormément" dans les deux positions, et donc deux considérer qu'on a deux "beaucoup" avec deux POS différentes.

mcandito commented 6 years ago

ok effectivement! ça fait des adverbes qui peuvent être en position de NP

perrier54 commented 6 years ago

Choisir beaucoup comme tête de beaucoup de garçons est contraire à la philosophie de UD qui met les têtes sur les mots lexicaux. Je suis pour conserver l'annotation initiale.

sylvainkahane commented 6 years ago

OK pour avoir l'ADV comme advmod dépendant du nom et le de comme case. C'est effectivement dans l'esprit UD (càd syntaxe profonde). Mais j'aimerais un trait qui m'indique que le de sur le nom est un case imposé par le dépendant advmod et pas par le gouverneur du nom. Ce trait peut être sur le lien case ou sur le lien advmod. On peut réfléchir à ça quand on finalisera la conversion SUD <-> UD.