surfacesyntacticud / guidelines

Guidelines for Surface Syntactic Universal Dependencies
https://guidelines.surfacesyntacticud.org/
0 stars 0 forks source link

lemmes des pronoms personnels #33

Open sylvainkahane opened 1 year ago

sylvainkahane commented 1 year ago

Actuellement, les lemmes de je, tu, il, nous sont tous il (mais on est on !) et le lemme de me est le, lui ou se. En anglais, I et me ont le lemme I. Ce choix parait nettement plus motivé. Je suggère qu'on utilise les lemmes moi, toi, lui, nous, vous, on et soi, ce qui est le choix fait dans les ouvrages de Mel'cuk par ex. Pour la 1ère et 2ème personne, le réfléchi n'est pas marqué en français, donc je suggère que me ait toujours le lemme moi (avec le trait Reflex=Yes dans ce cas). On devrait aussi ajouter les traits Case=Nom, Acc, Dat, puisque ces pronoms varient bien en cas. (Voir quand même quelle valeur choisir pour la forme forte moi.)

perrier54 commented 1 year ago

Je pense qu'il est important de distinguer les pronoms personnels forts des pronoms faibles. Je ne mettrais le trait Case que pour les pronoms faibles car pour les pronoms forts, la morphologie ne dit rien sur le cas. Comme on a aussi les traits Number et Person, pourquoi ne pas avoir qu'un seul lemme pour les pronoms forts, "lui" par exemple, et un seul lemme pour les pronoms faibles, "il" par exemple. Pour les réfléchis, on ajoute le trait Reflex=Yes Pour la phrase "je me lave" , on aurait alors : "je": lemma=il, Case=Nom, Person=1, Number=Sing, (Reflex=No) "me": lemma=il, Case=Acc, Person=1, Number=Sing, Reflex=Yes

Et pour la phrase "lui se lave" , on aurait alors : "lui": lemma=lui, Person=3, Number=Sing, (Reflex=No) "se": lemma=il, Case=Acc, Person=3, Number=Sing, Reflex=Yes

sylvainkahane commented 1 year ago

Ca me semble difficile de justifier que je est une forme de il. Ni au niveau du signifié, ni au niveau du signifiant, ça ne marche. En plus, les pronoms personnels, peuvent avoir des sémantiques un peu particulières comme le il impersonnel ou le tu générique (quand tu t'inscris en doctorat, il faut signer une charte). Plus le on qu'on saura pas trop où mettre, qui peut être à la fois équivalent à nous ou générique (quand on s'inscrit en doctorat, il faut signer une charte). En plus, la forme de citation du pronom 3SG est plutôt lui que il. Donc je suis vraiment pour avoir moi, toi, lui, nous, vous, soi, on comme lemmes. Je n'ai pas compris non plus la remarque sur l'absence de Case pour le pronom fort. Il y a clairement une opposition me/moi, te/toi, etc. Ce sont clairement deux formes d'un même lexème et le choix dépend de la position syntaxique. Donc c'est bien du cas. Mais sur la page https://universaldependencies.org/u/feat/Case.html, il n'y a rien qui correspond à la forme forte. Le wolof a aussi des pronoms forts, mais ils n'ont pas de traits Case, alors que les pronoms faibles en ont.

perrier54 commented 1 year ago

C'est vrai que je n'ai pas tenu compte de la sémantique dans ma réflexion et donc qu'un lemme est rattaché à un lexème. Donc ok pour choisir moi, toi, lui, nous, vous, soi, on comme lemmes. Et si j'ai bien compris, il impersonnel aura lui il comme lemme. Pour ce qui de distinguer la forme forte de la forme faible du pronom, je suis toujours partisan de mettre le trait Case pour la forme faible du fait que c'est la morphologie qui détermine le cas et pas la syntaxe. De la même façon que l'on ne met pas un trait Case à Pierre dans je me confie à Pierre, on ne mettrait pas de trait Case à lui dans je me confie à lui. Y a-t-il une autre raison pour qu'en Wolof on fasse aussi cette distinction ?

sylvainkahane commented 1 year ago

On n'a pas conclu. Suite à la discussion sur les issues UD et à la première réaction de Guy, je suis ok pour mettre un trait Emph=Yes sur les pronoms forts et un trait Emph=No sur les autres. Seuls les pronoms Emph=No aurait un trait Case en français. (Remarque : On aura aussi le trait Emph sur la paire de pronoms interrogatifs que/quoi.) Reste plusieurs questions:

  1. Question de Pierre: le lemme de il impersonnel. J'aime pas l'idée que ce il ait un lemme différent des autres, donc je mettrais lemma=lui, Emph=No, Case=Nom. Mais on devrait surement avoir un trait qui indique que c'est un impersonnel. Ca existe comme trait ?
  2. Les pronoms après préposition (à moi) ou dans les coordinations (Pierre et moi) sont les formes fortes. Je serais pour mettre le trait Emph=Yes. C'est un trait à signification grammaticale, pas sémantique. Ca veut dire que c'est la forme forte et c'est tout.
  3. Les pronoms qui n'ont pas d'opposition faible/fort (comme nous) ne devraient pas avoir de traits Emph, non ? Et pas de trait de cas ?
  4. Que fait-on avec me qui neutralise l'opposition Acc/Dat ? Soit on considère que la forme est intrinsèquement Case=Acc,Dat, soit on considère qu'il est "désambiguïser" par la position et la commutation avec le ou lui. Mais il y a des cas où on ne peut pas désambiguïser comme je me souviens.
  5. Le cas de elle me pose problème, puisque la forme est soit Emph=Yes, soit Emph=No, Case=Nom et s'oppose à la ou lui. Donc là, contrairement à nous, on est obligé de garder le trait Emph, me semble-t-il. Même chose avec lui qui peut être Emph=Yes, Gender=Masc ou Emph=No, Case=Dat et pas de trait de genre (neutralisé).
perrier54 commented 1 year ago

Mon point de vue sur les différents points listés par @sylvainkahane :

  1. Pour il impersonnel, mettre lui comme lemme qui réfère à une personne n'a pas de sens. Je garderais il qui ne présente pas cet inconvénient. Le trait impersonnel du sujet est indiqué dans l'étiquette de la relation sujet par deep=expl.
  2. OK
  3. Il n'y a pas changement de forme entre pronom faible et pronom fort pour nous, mais on peut distinguer les deux donc je garderais le trait Emph.
  4. Pour me, on désambiguise le cas quand cela a un sens de mettre un cas. Pour dans je me souviens on ne met pas de trait Case.
  5. Pour elle pronom fort on ne met pas de trait Case comme pour tous les pronoms forts.
sylvainkahane commented 1 year ago
  1. Lemma=lui est juste le nom d'un lexeme. La forme il, qu'elle soit impersonnelle ou pas, est un forme de ce lexeme. Mais bon, c'est pas très important. Concernant le deep=expl, c'est un héritage de UD. Ce n'est pas vraiment une propriété de la relation, mais bien du pronom. Je serais assez tenté d'en faire un trait Expl=Yes.
  2. Pas sûr de voir pourquoi on garderait le trait Emph. Tu garderais aussi Case ?
  3. OK + le trait Emph=No sur me et se. On considère que pour les réfléchis il n'y a que ça (cf. se vs soi).
  4. oui bien sur
  5. Pour on, j'aimerais mettre Emph=No, Case=Nom, même si il n'y pas d'opposant.
perrier54 commented 1 year ago

Decision : For both strong and weak personal pronouns, the following lemmas are used: moi, toi, lui, nous, vous, eux and soi plus the same lemmas with -même or -mêmes. The lemma of the impersonal il is lui. The lemmas of on , en and y are on, en and y. Strong pronouns have the feature Emph=Yes. Weak pronouns have the feature Emph=No.

Correction of treebanks:

bguil commented 1 year ago

The feature Emph does not exist in UD. The data is not valid with these feature Emph=Yes and Emph=No. UD has PronType=Emp instead.

sylvainkahane commented 1 year ago

PronType=Emp would be for lui-même in il a fait ça lui-même. I said I will use Emph=Yes|No in a UD issue and nobody complained or proposed something else. But we are open to other suggestions.

perrier54 commented 1 year ago

We have two possibilities:

  1. Delete the Emph feature and not mark the distinction between strong and weak personal pronouns
  2. Delete the Emph feature and replace PronType=Prs with PronType=Emp for strong personal pronouns.
sylvainkahane commented 1 year ago

I don't like these two propositions.PronType=Emp is not a good solution because strong forms are strong forms of personal pronouns (PronType=Prs).

We must separate three things:

I thought we agree on the analysis with a distinction between strong and weak pronouns (which was the initial proposition of @perrier54, and was confirmed by Amir Zeldes in the UD issue). I am not sure to see why Emph=Yes|No is a problem. We can ask that this feature is added among the UD morphosyntactic features. If not we can put it in MISC.

bguil commented 1 year ago

I've added a doc page for Emph in UD docs. No more problem for UD validation.