cpdoc / dhbb-nlp

processamentos DHBB
Other
5 stars 2 forks source link

Golden subset #83

Closed Joao-Luz closed 9 months ago

Joao-Luz commented 9 months ago

Confesso que fiquei um pouco perdido nesse repositório, mas eu li o artigo de vocês e vi que vocês mencionaram um subconjunto do córpus completo que pode ser classificado como "conjunto dourado". Onde eu consigo encontrar esse subconjunto, se é que ele está disponível?

Desculpe qualquer falta de atenção se ele estava muito óbvio e não vi também!

arademaker commented 9 months ago

Olá João, neste paper fizemos um pequeno experimento de identificação e classificação das relações sintáticas appos (apositivos). A ideia seria identificar a frequência de cada tipo de relação semântica associada a esta relação sintática.

Fizemos anotações e contabilizamos os resultados no paper. Mas não preservamos as anotações. Na verdade todo o DHBB foi reprocessado com modelos mais recentes treinados com releases mais novas do corpora PT no projeto UD.

Ainda está meu meu radar a revisão das anotações do corpus.. mas não posso prometer para quando.