ud-portugues / Brazilian-Team

Brazilian researchers initiative on UD
6 stars 0 forks source link

Anotação do QUE #1

Open MagaliDuran opened 3 years ago

MagaliDuran commented 3 years ago

A palavra QUE pode ocorrer depois de advérbios topicalizados, como partícula de realce, expletiva. Pode ser retirado sem prejuízo para o sentido da oração.

Quase que ele morreu. = Ele quase morreu Desde de ontem que estou esperando uma ligação dele. = Estou esperando uma ligação dele desde ontem. Como que a gente fica na casa? = A gente fica em casa como?

Qual a POS tag e qual deprel seriam mais adequadas para esses casos?

amandared commented 3 years ago

Não sei o que seria mais adequado, mas posso dizer o que o Google faz e podemos iniciar uma discussão a partir disso. O Google tagueia como POS=ADP e deprel=MWE cuja head é o advérbio, conforme o print:

anotacao

Na segunda árvore, em específico, tem um erro, pois a anotação correta seria mwe(ontem, que) e não mwe(desde, que)

Sei que não é uma multiword, mas é uma solução possível. Vocês sabem como o pt costuma lidar com casos mais clássicos de expletivos? Exemplos: "Foi ele que morreu" ou "Ele é que precisa fazer"

MagaliDuran commented 3 years ago

Amanda, tem alguma razão para anotar o QUE como ADP?

Em qui., 15 de abr. de 2021 às 00:44, amandared @.***> escreveu:

Não sei o que seria mais adequado, mas posso dizer o que o Google faz e podemos iniciar uma discussão a partir disso. O Google tagueia como POS=ADP e deprel=MWE cuja head é o advérbio, conforme o print:

[image: anotacao] https://user-images.githubusercontent.com/28758436/114810743-172c7c00-9d83-11eb-8a5c-2693e6d6df04.png

Na segunda árvore, em específico, tem um erro, pois a anotação correta seria mwe(ontem, que) e não mwe(desde, que)

Sei que não é uma multiword, mas é uma solução possível. Vocês sabem como o pt costuma lidar com casos mais clássicos de expletivos? Exemplos: "Foi ele que morreu" ou "Ele é que precisa fazer"

— You are receiving this because you authored the thread. Reply to this email directly, view it on GitHub https://github.com/ud-portugues/Brazilian-Team/issues/1#issuecomment-820040103, or unsubscribe https://github.com/notifications/unsubscribe-auth/ASQZJ7HCTSLK5PUFP3VYZSLTIZOIJANCNFSM422BSIBA .

amandared commented 3 years ago

Ahh desculpa, esqueci de explicar uma grande diferença entre anotação do Google e UD. O Google não tem a POS tag de SCONJ. As conjunções subordinativas são tagueadas como ADP, da mesma forma como preposições. A tag equivalente na anotação da UD seria "que: POS=SCONJ".

MagaliDuran commented 3 years ago

Entendi. Nós estamos temporariamente utilizando a POS tag PART para esse QUE expletivo, pois não tem papel morfossintático nem semântico, mas sim pragmático, como recurso de topicalização. Não sei se teremos problema com isso no nível das relações de dependências. Imagino que a deprel expl possa se adequar ao caso.

Em qui., 15 de abr. de 2021 às 15:06, amandared @.***> escreveu:

Ahh desculpa, esqueci de explicar uma grande diferença entre anotação do Google e UD. O Google não tem a POS tag de SCONJ. As conjunções subordinativas são tagueadas como ADP, da mesma forma como preposições. A tag equivalente na anotação da UD seria "que: POS=SCONJ".

— You are receiving this because you authored the thread. Reply to this email directly, view it on GitHub https://github.com/ud-portugues/Brazilian-Team/issues/1#issuecomment-820627667, or unsubscribe https://github.com/notifications/unsubscribe-auth/ASQZJ7GNJURPW5MMXNMNURDTI4TLRANCNFSM422BSIBA .

amandared commented 3 years ago

Essa anotação como POS=PART e deprel=expl me parece bemmm razoável. Concordo completamente. O Google não tem pos PART e tbm não foi "aceito" o uso da deprel expl para p pt-br. Outras línguas têm, mas convencionou-se não usar em pt-br, então não tinha essa opção, mas eu acho q é a opção sintaticamente mais correta mesmo.

vcvpaiva commented 3 years ago

Ah, obrigada pela explicacao Amanda. Isto explica porque o PUD nao tinha nenhuma SCONJ ate' eu reclamar que isso nao fazia sentido!

On Thu, Apr 15, 2021 at 11:06 AM amandared @.***> wrote:

Ahh desculpa, esqueci de explicar uma grande diferença entre anotação do Google e UD. O Google não tem a POS tag de SCONJ. As conjunções subordinativas são tagueadas como ADP, da mesma forma como preposições. A tag equivalente na anotação da UD seria "que: POS=SCONJ".

— You are receiving this because you are subscribed to this thread. Reply to this email directly, view it on GitHub https://github.com/ud-portugues/Brazilian-Team/issues/1#issuecomment-820627667, or unsubscribe https://github.com/notifications/unsubscribe-auth/AAIZ3HY26NIBAN2ZIYGIDHTTI4TLRANCNFSM422BSIBA .

arademaker commented 3 years ago

Para Foi ele que morreu me parece que/PRON como nsubj(morreu,que) e acl(ele, morreu)

arademaker commented 3 years ago

nao entendi a razão de não usar SCONJ, acho que seria mais razoável não? SCONJ e deprel=mark? Mas de qq modo, uma ideia interessante seria documentar na wikipedia, algumas paginas UD apontam para wikipedia e quase sempre faltam exemplos em PT: https://en.wikipedia.org/wiki/Grammatical_particle

Hum, mas SCONJ seria um problema para a clausula principal... mas o uso da deprel=expl ??

claudiafreitas commented 3 years ago

Acho que podemos ler das duas formas:

Quase que ele morreu. = Ele quase morreu OU Quase X (quase ISTO)

Desde de ontem que estou esperando uma ligação dele. = Estou esperando uma ligação dele desde ontem. Desde ontem X; Desde ontem ISTO

Como que a gente fica na casa? = A gente fica em casa como? Como X/Como ISTO? Na leitura como elemento de foco, concordo com a Magali que PART parece a melhor etiqueta. A leitura do ISTO leva à análise SCONJ. Vantagem PART - é mais fiel ao nosso entendimento; e para quem está trabalhando com oralidade ou textos informais, pode fazer diferença escolher entre um e outro. Um indicativo "formal" da diferença entre esses textos e outros seria justamente a presença do PART. Vantagem SCONJ/mark - ficamos no mundo mais canônico/convencional das análises...

@MagaliDuran: Com relaçao ao PART, embora vcs estejam lidando com POS primeiro, acho importante nunca perder de vista que é preciso encontrar uma deprel também. O que vcs pensaram nesse caso? A princípio, me parece que discourse é uma boa alternativa...

arademaker commented 3 years ago

Bom ponto @claudiafreitas , eu estava exatamente questionando a deprel que seria usada com a análise UPOS PART e concordo que discurse é uma alternativa.

vcvpaiva commented 3 years ago

oi @claudiafreitas sim, parece que uma versao realmente foca na modificacao e e' mais informal, enquanto a outra nao foca e e' mais tradicional.

Vale lembrar que enquanto

Desde de ontem que estou esperando uma ligação dele. = Estou esperando uma ligação dele desde ontem.

tem correspondente em ingles

Since yesterday I've been waiting for his call = I have been waiting for his call since yesterday

as outras duas frases nao tem correspondente direto, pois a modificacao nao 'passeia' tanto assim

He almost died. OK

? Almost died he did

almost dead he was found (borderline Yoda-style?)

how do we stay in the house? OK

? We stay in the house how ?

ungrammatical? but works for speech

MagaliDuran commented 3 years ago

@claudiafreitas, nós ainda não estamos anotando deprels, mas imaginei que "expl" seria adequada para anotar expletivos, fazendo uma analogia com o "se" expletivo, conforme estudo comparativo entre várias línguas (Sonja Marković, Daniel Zeman. 2018. Reflexives in Universal Dependencies). Eu percebi que no Bosque vocês optaram por anotar "é que" topicalizador como uma MWE composta de AUX, SCONJ e deprel "discourse". Até então eu imaginava que o principal uso de "discourse" fosse para anotar as interjeições e palavras de confirmação de atenção do interlocutor ("né", "sabe", "sacou", "entende", "tipo..." "tá ligado").

Uma premissa para usarmos SCONJ, @arademaker, é que ela introduza uma oração subordinada. Nos casos que estamos discutindo, os períodos nem são compostos, por isso, a princípio, me parece que essa possibilidade não existe .

Aliás, percebi que o terceiro exemplo ("Como que a gente fica em casa?", que eu traduziria para "How can we stay at home?") nitidamente não é igual aos demais, por se tratar de uma inversão comum das interrogativas e não de uma topicalização.

vcvpaiva commented 3 years ago

@MagaliDuran note que

Como que a gente fica na casa? = A gente fica em casa como?

sao frases na verdade bem diferentes uma da outra. eu achei q a @claudiafreitas estava falando de

Como que a gente fica na casa? = A gente fica na casa como?

que nao 'e sobre a sua casa, mas sim sobre alguma casa q e' parte do contexto.

se a @claudiafreitas estiver falando da pandemia e das dificuldades de se ficar em casa(na sua propria casa), as frases seriam:

Como que a gente fica em casa? = A gente fica em casa como?

e ai sim,a traducao seria "How can we stay at home?"

obrigada pela referencia sobre reflexivos!

claudiafreitas commented 3 years ago

Meu receio com expl é que UD uniformiza, no-se, casos que eu gostaria de separar. Exceto pelo -se reflexivo/recíproco, que será objeto, tanto o -se de verbos pronominais como o -se de passivas e de indeterminação serão expl. Ou seja, na prática, o -se não é usado apenas para expletivos :(

A explicação de discourse eu acho que admite topicalização (os grifos sao meus)

This is used for interjections and other discourse particles and elements (which are not clearly linked to the structure of the sentence, except in an expressive way). We generally follow the guidelines of what the Penn Treebanks count as an INTJ. They define this to include: interjections (oh, uh-huh, Welcome), fillers (um, ah), and non-adverbial discourse markers (well, like, but not you know or actually).

Nas guidelines, eu entendo que os exemplos ilustram certos pontos, mas não os esgotam/limitam.

Além disso, e diferentemente do -se, que é independente de genero/modalidade, essa topicalização do "é que" é um traço bem típico de oralidade/informalidade, e pra mim esse também seria um argumento, pois teríamos que certos tipos de texto/gênero se caracterizam pela frequencia diferente de certas relações sintáticas.

MagaliDuran commented 3 years ago

Entendi, @claudiafreitas. Obrigada. Só para registrar, estamos encontratando ocorrências do "que" expletivo no corpus Folha-Kagle, o que pode ser indício de que esse uso não esteja já tão limitado à oralidade/informalidade.