Open lucascdz opened 1 year ago
Uma atualização do exposto acima sobre verbos depoentes.
Descobri que a anotação dessa forma é controversa, na medida em que ela pode ser considerada:
• uma forma especial, anotada com a tag própria, prevista no tagset relativo à voz;
• uma forma passiva, uma vez que a questão de o verbo depoente possuir características sintático-semânticas de voz ativa nada tem que ver com morfologia (que é o nível de análise a que o tagset se refere).
A debater num futuro próximo.
Encontrei um artigo do Giuseppe Celano (2020) que propõe alguns princípios para a lematização e análise morfológica, os quais procuramos seguir, a saber:
Mas nem sempre a aplicação desses critérios é óbvia, como mostram os comentários a seguir.
CRITÉRIO 1 Uma questão importante é não confundir lema com entrada. O dicionário Lewis & Short costuma apresentar palavras derivadas como sub-entradas das primitivas, o que não significa que o lema deve remontar sempre à principal.
Um exemplo do texto é a palavra Cyprus ("Chipre", a ilha), cuja entrada abriga o adjetivo derivado Cyprius ("cipriota"), que por sua vez abriga o coletivo Cyprii ("Cipriotas"). Nesse caso, reconhecemos dois lemas: o substantivo
Cyprus1
e o adjetivoCyprius
, este valendo tanto para o uso atributivo quanto para o uso coletivo (plural substantivado), conforme o critério 2.O problema surge quando o dicionário não é sistemático na abordagem. Por exemplo, no caso de poenus ("cartaginês"), o lema principal é o substantivo plural Poeni (uso coletivo), e o adjetivo comum aparece como subentrada. Nossa posição foi manter o critério e lematizar como
poenus
.CRITÉRIOS 2-3 Na maioria das vezes a lematização de adjetivos substantivados parece bastante tranquila: além dos muitos nomes de povos (o texto é de um historiador), palavras como barbaros ("os bárbaros") ou sacra ("coisas sagradas") são exemplos simples dessa operação.
Mas pelo menos três casos geraram certo incômodo nos anotadores, por parecerem substantivações já cristalizadas e de certo modo autônomas com relação à forma primitiva:
Na dúvida, resolvemos manter a regra, com exceção de legati. Em todo caso, me parece que essa regra, se aplicada em excesso, corre o risco de passar da análise morfológica para a etimológica, o que não é nosso propósito.
CRITÉRIO 4 Essa discussão se aplica também às formas adverbiais. Em latim, os advérbios são quase todos derivados de "antigas formas do adjetivo", como explica a gramática (Faria 1958: 252). Normalmente as formas não se confundem, e.g.
O problema é quando a forma do advérbio é idêntica a alguma forma do adjetivo declinado, e.g.
Como o dicionário lematiza como advérbio (em subentrada do adjetivo, diga-se), também o fizemos, mas pode haver mais casos controversos.
CRITÉRIO 5 O Morpheus oferece sugestões de lematização inconsistentes com o critério 5 para três pronomes no texto: • o relativo qui1 (20 ocorrências): sugere analisar como
noun
• o possessivo suus (5 oc.): sugere analisar comonoun
ou comoadjective
• o indefinido alius (2 oc.): sugere analisar comonoun
Todos foram padronizados de acordo com a lematização do Lewis & Short e classificados como
pronoun
, mediante a criação de novas formas.CRIAÇÃO DE FORMAS NOVAS Foi necessário registrar 85 formas novas (11% do total de palavras do texto), seja porque o Morpheus não reconhecia, seja porque nenhuma sugestão estava em conformidade com os critérios mencionados no início.
A maioria das formas não reconhecidas pelo Morpheus eram nomes próprios de pessoas e de povos (33 oc.), bem como formas não reconhecidas provavelmente por apresentarem divergências ortográficas (5 oc., e.g. inpono x impono).
No caso de formas com sugestão incorreta, além dos pronomes acima, destacaram-se os verbos depoentes (7 oc.), cuja análise automática os dava sempre como passivos e, por isso, foi necessário criar formas com a classificação correta.
Uma lista completa de todas as formas novas criadas poderá ser incluída na documentação, se desejável.