bguil / UD-French-discussion

Discussions sur l'harmonisation des Treebanks du français au format UD
0 stars 1 forks source link

Annotations des fixed #17

Open bguil opened 6 years ago

bguil commented 6 years ago

⚠️ Exemple mis à jour après le commentaire de @sylvainkahane

Sur le FramaCalc, dans la plupart des cas, Guy et Sylvain sont d'accord pour la liste de ce qu'il faut mettre fixed (je propose de faire des issues à part pour discuter des cas limite).

Il ne devrait pas y avoir de problème pour la façon d'annoter ces cas-là :

Exemple

# text = Jean vient de nouveau bien qu'il pleuve
1   Jean    _   PROPN   _   _   2   nsubj   _   _
2   vient   _   VERB    _   _   0   root    _   _
3   de  _   ADP _   _   2   advmod  _   MWEPOS=ADV
4   nouveau _   ADJ _   _   3   fixed   _   _
5   bien    _   ADV _   _   8   mark    _   MWEPOS=SCONJ
6   que _   VERB    _   _   5   fixed   _   _
7   il  _   PRON    _   _   8   nsubj   _   _
8   pleuve  _   VERB    _   _   2   advcl   _   _
screen shot 2018-04-20 at 09 41 32

NB: le préfixe _MISC_ dans la figure est ajouté automatiquement, notamment pour pouvoir traiter ces traits depuis Grew.

Pour pouvoir traiter les coordinations, le de final n'est pas inclus dans la partie fixed.

# text = à partir de Paris et de Nancy
1   à   _   ADP _   _   4   advmod  _   MWEPOS=ADV
2   partir  _   VERB    _   _   1   fixed   _   _
3   de  _   ADP _   _   4   case    _   _
4   Paris   _   PROPN   _   _   0   root    _   _
5   et  _   CC  _   _   7   cc  _   _
6   de  _   ADP _   _   7   case    _   _
7   Nancy   _   PROPN   _   _   4   conj    _   _
screen shot 2018-04-19 at 14 20 49
sylvainkahane commented 6 years ago

ok sur le principe. Détail : j'aurais mis ADV pour bien d'autant que toutes les locutions fixes sont sur le modèle ADV + que (alors que, plutot que …), ce qui pourrait d'ailleurs amener à y voir qqch de pas si irrégulier syntaxiquement, mais bon …

bguil commented 6 years ago

Ok pour bien ADV, j'ai mis à jour l'exemple dans le premier message

mcdm commented 6 years ago

Ca me semble très bien.

dseddah commented 6 years ago

Salut tous, Point de détail: on peut utiliser autre chose que framacalc ? si la table n'est pas éditée au moins tous les 30 jours, les fichiers sont détruits. Ca nous est arrivé récemment à p4 et on n'a eu que les yeux pour pleurer.

mcandito commented 6 years ago

Je trouve que la relation "advmod" entre le "à" et "Paris" est problématique pour retrouver le fait que "à partir" introduit le SP "de Paris"

On ne pourrait pas mettre "case" ?

Pour le "bien que" traité comme fixed, du coup comment fait-on pour la coordination ?

bien qu'il pleuve et que je n'aie pas de parapluie

?

Obligé de faire:

text = Jean vient de nouveau bien qu'il pleuve

1 Jean PROPN 2 nsubj 2 vient VERB 0 root 3 de ADP 2 advmod MWEPOS=ADV 4 nouveau ADJ 3 fixed 5 bien ADV 8 mark MWEPOS=SCONJ 6 que VERB 5 fixed 7 il PRON 8 nsubj 8 pleuve VERB 2 advcl 9 et VERB 13 cc 10 qu' SCONJ 13 mark 11 il PRON 13 advcl 12 n' ADV 13 advmod 13 a VERB 8 conj 14 pas ADV 13 advmod

Dans PARSEME-FR, on réfléchit carrément à ne pas inclure le "que" dans "bien que", sur le modèle de la non inclusion du "de" dans "à partir de"... Mais c'est peut-être un peu extrême. (Mais je serais alors pour que "bien" soit tout de même dépendant avec le label "mark")

text = Jean vient de nouveau bien qu'il pleuve et qu'il n'a pas de parapluie

1 Jean PROPN 2 nsubj 2 vient VERB 0 root 3 de ADP 2 advmod MWEPOS=ADV 4 nouveau ADJ 3 fixed 5 bien ADV 8 mark 6 que SCONJ 8 mark 7 il PRON 8 nsubj 8 pleuve VERB 2 advcl 9 et VERB 13 cc 10 qu' SCONJ 13 mark 11 il PRON 13 advcl 12 n' ADV 13 advmod 13 a VERB 8 conj 14 pas ADV 13 advmod _

?

sylvainkahane commented 6 years ago

En fait, toutes les conjonctions peuvent être reprise par "que":

s'il pleut et que j'ai pas de parapluie quand il pleut et j'ai pas de parapluie puisque …

Donc c'est pas gênant de traiter "bien que" comme un tout. Comme il a plusieurs locution ADV+que on peut être tenté de les décomposer, mais on n'a pas d'argument solide pour décider si c'est l'ADV ou "que" la tête . Si on m'oblige à a analyser "bien que" je dirais quand même que "que V" dépend de l'ADV, mais j'ai démoli mon meilleur argument plus haut ;-)

mcandito commented 6 years ago

Ah oui j'avais pas remarqué, alors ça me va! (bien que comme fixed)

sylvainkahane commented 6 years ago

Pour "à partir", si on reprend l'argument de Marie pour "en provenance", on devrait en faire un ADJ: Les trains à partir de Paris sont plus remplis que les autres.

Et du coup, ca serait raisonnable de traiter ça de manière assez parallèle à "en provenance", la seule différence étend que "à partir" correspond pas ou moins à un schéma syntaxique récurrent (quoique prép+Vinf c'est pas très irrégulier). En tout cas, si on fait de "en provenance" la tête, je ferai la même chose avec "à partir".

mcandito commented 6 years ago

Hi,

sylvainkahane commented 6 years ago

"à partir" est aussi utilisé pour introduire un complément d'ADJ (possible à partir de maintenant, accessible à partir de 12 ans). Plutôt ADV que ADP. Une prép c'est jamais qu'un ADV avec un objet direct (avant vs avant Noel). Si le complément est pas direct -> ADP.

dseddah commented 6 years ago

Dites, je reviens sur le bien que X et que Y : pourquoi est ce qu'avoir le deuxième "que" rattaché à "bien" via un fixed serait gênant ? Je vois bien l'argument visant à éviter des dépendances non projectives mais surtout une technicalité, non ? Une bonne solution serait bien-sûr d'avoir un ghost token pour le "bien" non-réalisé. C'est autorisé pour le gapping en enhanced après tout.

mcandito commented 6 years ago

Hi,

Anne Abeillé utilise pour l'ADV un critère assez filtrant : l'adverbe est la seule cat pouvant apparaître, sans rupture intonative, entre l'auxiliaire de temps et le participe, contrairement à la prep, même quand elle est "nue":

Le fait que "à partir de SN" puisse modifier un adj ne me paraît pas un argument pour en faire un ADJ plutôt qu'une prep : possible avant midi

Si on fait de "à partir" un ADV, on introduit des ADV avec argument obligatoire, ce qui est assez rare pour les adverbes non composés. D'un autre côté, si on en fait des PREP, on introduit beaucoup de prep introduisant un SP. Je suis tout de même pour cette 2eme solution "à partir" = prep, cf. sinon je ne sais pas distinguer adv et prep.

bsagot commented 6 years ago

Bonjour à tous,

Je suis d'accord pour analyser "à partir" comme une préposition composée (figée) qui sous-catégorise un objet obligatoire réalisé comme un SP introduit par de (en notation Lefff, c'est donc un Obj:de-sn). En réalité, pour moi, même "en provenance" est figé et sous-catégorise lui aussi un Obj:de-sn, de même que "à destination", "en partance" (Obj:pour-sn), et sûrement quelques autres qui ne me viennent pas à l'esprit immédiatement. Mais évidemment, tout dépend des critères qu'on se donne pour définir ce qu'est le figement... (compositionnalité sémantique, inséparabilité/non-modifiabilité, sens conventionnel/terminologique type "machine à laver" par opposition à "?appareil à nettoyer", etc…).

Je suis d'accord avec Marie pour appliquer le critère Abeillé qui permet de distinguer les adverbes des prépositions dont l'objet est facultatif lorsque ce dernier n'est pas réalisé ("J'ai voté contre").

Pour les prépositions qui introduisent un SP, il "suffit" de dire que certaines prépositions sous-catégorisent un objet qui peut être réalisé par un sytagme prépositionnel (type "jusqu'à", qui est donc un Obj:sn|loc-sn|tps-sn). Mais avec "à partir" il peut y avoir un niveau de complexité supplémentaire avec un syntagme de type "la route est inondée à partir de chez Max et jusque chez Léa", avec double sous-catégorisation prépositionnelle...

Concernant le "bien que P et que P" je suis d'accord avec l'argument de Sylvain.

Amitiés à tous,

Benoît

Le 24 avr. 2018 à 15:51, Marie Candito notifications@github.com a écrit :

Hi,

à propos de la POS de "à partir" Certaines prep introduisent un SP : jusque + SP locatif, avant chez Paul ... Donc il faut trouver autre chose pour distinguer ADV et PREP Anne Abeillé utilise pour l'ADV un critère assez filtrant : l'adverbe est la seule cat pouvant apparaître, sans rupture intonative, entre l'auxiliaire de temps et le participe, contrairement à la prep, même quand elle est "nue":

il a beaucoup mangé *il a avant mangé Le fait que "à partir de SN" puisse modifier un adj ne me paraît pas un argument pour en faire un ADJ plutôt qu'une prep : possible avant midi

Si on fait de "à partir" un ADV, on introduit des ADV avec argument obligatoire, ce qui est assez rare pour les adverbes non composés. D'un autre côté, si on en fait des PREP, on introduit beaucoup de prep introduisant un SP. Je suis tout de même pour cette 2eme solution "à partir" = prep, cf. sinon je ne sais pas distinguer adv et prep.

pour répondre à Djamé sur le "bien que P et que P": l'argument de Sylvain est important ici: on peut avoir une coordination en "que P" avec des complémenteurs simples: "quand il pleut et que j'ai pas de parapluie" — You are receiving this because you are subscribed to this thread. Reply to this email directly, view it on GitHub https://github.com/bguil/UD-French-discussion/issues/17#issuecomment-383938348, or mute the thread https://github.com/notifications/unsubscribe-auth/AEoByJBQ6QAGcS5yJGTWk7oIabkz6pWFks5try3sgaJpZM4TbsFo.

sylvainkahane commented 6 years ago

@bsagot attention on n'a pas dit que "en provenance" n'était pas figé. C'est sémantiquement figé, on est tous d'accord. Mais c'est syntaxiquement régulier. Ce qu'on a proposé pour UD, et qui est quasiment adopté maintenant, c'est que les choses qui sont syntaxiquement régulière soit analysée en syntaxe et que le figement sémantique soit indiqué par des traits (MWEPOS et INPOS).

@mcandito Attention, "jusque" et "chez" sont des items bizarres. On ne peut pas les utiliser pour dire que les PREP peuvent prendre des compléments prépositionnels. 1) "chez N" peut commuter avec des NP dans plein de positions: de chez moi à chez toi, le pain de chez Paul, chez Pierre est un endroit reposant, etc. 2) "jusque"/"jusqu'à" fonctionne comme modifier de PP, lorsqu'il est effaçable. Je le traiterai comme un ADV advmod dans "jusque PP".

Pas du tout convaincu par le critère AA: ?? il a proprement mangé ??? il aurait du autrement répondre

Moi je maintiens comme critère qu'un ADP a un complément direct.

@mcandito Le fait que "à partir" pouvait modifier un ADj était un argument pour ne pas en faire un ADJ ;-) Je ne pense pas qu'un ADJ puisse modifier un ADJ.

bsagot commented 6 years ago

Rebonjour à tous,

Le 24 avr. 2018 à 16:35, sylvainkahane notifications@github.com a écrit :

@bsagot https://github.com/bsagot attention on n'a pas dit que "en provenance" n'était pas figé. C'est sémantiquement figé, on est tous d'accord. Mais c'est syntaxiquement régulier. Ce qu'on a proposé pour UD, et qui est quasiment adopté maintenant, c'est que les choses qui sont syntaxiquement régulière soit analysée en syntaxe et que le figement sémantique soit indiqué par des traits (MWEPOS et INPOS).

Toutes mes excuses, je reviens dans la boucle avec un peu de retard sur les discussions, donc merci pour le warning! :-) @mcandito https://github.com/mcandito Attention, "jusque" et "chez" sont des items bizarres. On ne peut pas les utiliser pour dire que les PREP peuvent prendre des compléments prépositionnels.

"chez N" peut commuter avec des NP dans plein de positions: de chez moi à chez toi, le pain de chez Paul, chez Pierre est un endroit reposant, etc. "jusque"/"jusqu'à" fonctionne comme modifier de PP, lorsqu'il est effaçable. Je le traiterai comme un ADV advmod dans "jusque PP". Il n'y a pas que "chez" et pas que "jusque". Je donnais l'exemple de "à partir de chez..." mais on peut faire facilement "à partir de dans 1 heure", "à partir d'au-delà de la frontière", etc.

Pas du tout convaincu par le critère AA: ?? il a proprement mangé ??? il aurait du autrement répondre

Moi je maintiens comme critère qu'un ADP a un complément direct.

...mais es-tu d'accord que ce complément direct ("objet") peut être non-réalisé? ("je vote contre") @mcandito https://github.com/mcandito Le fait que "à partir" pouvait modifier un ADj était un argument pour ne pas en faire un ADJ ;-) Je ne pense pas qu'un ADJ puisse modifier un ADJ.

— You are receiving this because you were mentioned. Reply to this email directly, view it on GitHub https://github.com/bguil/UD-French-discussion/issues/17#issuecomment-383955634, or mute the thread https://github.com/notifications/unsubscribe-auth/AEoByAkR4UamwwuAPAggvP0j__RRUVumks5trzgggaJpZM4TbsFo.

sylvainkahane commented 6 years ago

Le 24 avr. 2018 à 16:39, Benoît Sagot notifications@github.com a écrit :

@mcandito https://github.com/mcandito Attention, "jusque" et "chez" sont des items bizarres. On ne peut pas les utiliser pour dire que les PREP peuvent prendre des compléments prépositionnels.

"chez N" peut commuter avec des NP dans plein de positions: de chez moi à chez toi, le pain de chez Paul, chez Pierre est un endroit reposant, etc. "jusque"/"jusqu'à" fonctionne comme modifier de PP, lorsqu'il est effaçable. Je le traiterai comme un ADV advmod dans "jusque PP". Il n'y a pas que "chez" et pas que "jusque". Je donnais l'exemple de "à partir de chez..." mais on peut faire facilement "à partir de dans 1 heure", "à partir d'au-delà de la frontière", etc.

c’est pas terrible quand même. La seule occurrence valable de « à partir de » sur Google est :

Répliques cultes - Kaamelott http://kaamelott.over-blog.fr/pages/Repliques_cultes-2024869.html kaamelott.over-blog.fr/pages/Repliques_cultes-2024869.html "De toutes façons, les réunions de la Table Ronde c'est deux fois par mois. Donc, si le mec il dit après-demain à partir de dans deux jours, suivant s'il le dit à la fin du mois, ça reporte. "Là, vous faites sirop de vingt-et-un et vous dites : beau sirop, mi-sirop, siroté, gagne-sirop, sirop-grelot, passe-montagne, sirop au bon goût. »

Ca suffit pas pour dire que ca se dit vraiment

Pas du tout convaincu par le critère AA: ?? il a proprement mangé ??? il aurait du autrement répondre

Moi je maintiens comme critère qu'un ADP a un complément direct.

...mais es-tu d'accord que ce complément direct ("objet") peut être non-réalisé? ("je vote contre »)

je sais pas. Est-ce qu’on veut leur donner la cat ADV ou ADP ? Pour moi la question est purement pratique, parce que du point de vue théorique ADV et ADP c’est la même chose. (C’est comme si on mettait des POS différentes pour les verbes intransitifs vs transitifs.)

Sy

bguil commented 6 years ago

J'essaie de résumer… si j'ai bien tout lu (plus haut et dans #18), dans chaque exemple ci-dessous, il y a un consensus pour l'analyse interne de la partie entre crochet et pour dire que la tête est cette partie entre crochet :

Il reste à ce mettre d'accord sur l'annotation externe. Pour les 3 premiers, on y est preque !

Pour le dernier, il n'y a pas d'accord sur [à partir] ADV vs [à partir] ADP mais un accord sur le fait de traiter ça comme on traite jusque chez Paul. jusque est ADV dans Larousse et ADP dans TLF et d'autres (les deux POS sont dans Lefff). Donc la question et de décider si la construction avec double case est régulière. Il y en a dans beaucoup de langue mais en faible quantité en général ; pour l'anglais par exemple, c'est le cas avec from within, along with, out of.

Je ne sais pas quoi décider…

perrier54 commented 6 years ago

Pour en train de venir, comme je l'ai dit dans la discussion #18, si nous considérons en train comme un adjectif, la relation de train vers venir est nécessairement XCOMP. Concernant à partir et jusque, on ne peut pas les considérer comme des ADP car il ne peuvent pas former un syntagme prépositionnel en leur adjoignant un objet : on ne peut pas dire à partir la maison ou jusque la maison. On pourrait considérer à partir de ou jusque + PREP comme une locution prépositionnelle, mais se pose alors le problème d'annoter à partir de X et de Y ou jusque PREP X et PREP Y. J'ai une préférence pour annoter à partir et jusque comme des adverbes mais faut-il les rattacher à la préposition qui suit ou à l'objet de de cette préposition ? Je serais favorable à la première solution, ce qui donnerait pour à partir de Paris : Paris -[ADP]-> de, de -[ADVMOD]-> partir, partir -[ADP]-> à

sylvainkahane commented 6 years ago

Faire dépendre qqch de la préposition, c'est pas UD-casher. Ca sera soit partir qui dépend Paris, soit l'inverse.

perrier54 commented 6 years ago

Je viens de voir que le guide de UD prévoit qu'il peut y avoir des modificateurs de mots fonctionnels donc il est tout à fait conforme à UD de considérer que jusque est un adverbe modificateur de la préposition qui suit et que à partir est un modificateur de de. Ce serait aussi conforme à ce que disent les grammaires classiques qui parlent de locutions prépositionnelles.