ipea / phonics

Phonetic Spelling Algorithms in R
https://jameshoward.us/software/phonics/
Other
0 stars 0 forks source link

Problema com o "Y" #4

Closed igornoberto closed 7 years ago

igornoberto commented 7 years ago

GLEYCE ALVES RODRIGUES = LIS ALVS 2DRGS GLEICE ALVES RODRIGUES = LS ALVS 2DRGS

Todos os Y devem ser trocados por I.

igornoberto commented 7 years ago

Segundo a regra fonética (https://sourceforge.net/p/metaphoneptbr/code/ci/master/tree/README), as vogais devem ser mantidas apenas quando no inicio das palavras. E o "Y" deve sempre ser substituído pelo "I". Dessa forma, Gleyce e Gleice seriam, de fato, diferentes.

Vou retirar a regra do Y, mantendo-o apenas se estiver no inicio das palavras como "I".

lucasmation commented 7 years ago

Tem q ser igual... Será q não é sequencial? Primeiro troca y por i. Depois retira as vogais

Outra coisa é que se a referência do metaphoneBR que você estiver usando estiver errada nos não precisamos segui-las

Em 15 de ago de 2017 8:14 AM, "igornoberto" notifications@github.com escreveu:

Closed #4 https://github.com/ipea/phonics/issues/4 via a32ecbd https://github.com/ipea/phonics/commit/a32ecbdc7f3d77c8baef14cc520de57e8a971876 .

— You are receiving this because you are subscribed to this thread. Reply to this email directly, view it on GitHub https://github.com/ipea/phonics/issues/4#event-1206286521, or mute the thread https://github.com/notifications/unsubscribe-auth/ABXDiBotPvyoUwscERvjaj0HbiiVNFiYks5sYX1zgaJpZM4O3cWz .

igornoberto commented 7 years ago

@lucasmation Não vi nenhuma referencia a ser algo sequencial. Mas corrigi o problema.

Todas as fontes dirigem às mesmas regras fonéticas, inclusive a citada por Fabio Vaz em https://gitlab.com/IpeaDATA-lab/record_linkage_Brasil/issues/4#note_29708137