LR-POR / MorphoBr

Resources for morphological analysis of Portuguese
Apache License 2.0
24 stars 4 forks source link

Como criar um dict para freeling #105

Open CrashAngelArts opened 2 years ago

CrashAngelArts commented 2 years ago

Olá, estou tentando criar um dicionário para atualizar i diretorio do freeling... lá no repositorio original os arquivos são de 4 anos atras....

Como posso compilar um dict... execute o arquivo compile-dict.sh em tool e recebi erros...

arademaker commented 2 years ago

Olá,

Vou dar uma olhada. O arquivo referido deve estar desatualizado.

Não existe um processo de compilação, mas imagino dois passos fundamentais:

  1. Mapear as tags que usamos para as tags de freeling. E a partir do mapeamento produzir os arquivos dict do freeling

  2. Adaptar o arquivo afixos.dat

Mas nada é tão simples. A decisão do que será tratado pelo afixos.dat (regras) e o que será explicitamente colocado no léxico dependerá de identificar as derivações regulares a partir das formas flexionadas de um dado lema.

Estamos fazendo isso para outro projeto, logo daqui a pouco podemos ter alguns insights para ajudar nesta issue.

arademaker commented 2 years ago

@CrashAngelArts o comentário anterior ajudou? Considero esta tarefa não trivial, embora, como contribuir do Freeling, me interesse pelo problema. Vc estaria disposto em colaborar para termos uma tradução do MorphoBr para o https://github.com/TALP-UPC/FreeLing/tree/master/data/pt? Seriam os arquivos

  1. afixos.dat
  2. e os arquivos em https://github.com/TALP-UPC/FreeLing/tree/master/data/pt/dictionary/entries
arademaker commented 2 years ago

Note ainda que no arquivo TAGSET já temos um mapeamento das tags eagles usadas pelo Freeing para PT (link) para nossas tags.