ppKrauss / SBPqO-2019

Materiais originais dos Resumos da 36ª Reunião Anual da SBPqO
0 stars 0 forks source link

Não foi adotado UTF-8 canônico (NFC) no XML original #3

Closed ppKrauss closed 5 years ago

ppKrauss commented 5 years ago

Mesmo bug que em 2015, foram detectados casos de UTF-8 em representação diacrílica (caracter decomposto em pedaços tal como "c" e "," ao invés de "ç").

Por exemplo o resumo PE010 (de 2019) apresentou já no título Percepção de estudantes de Ortodontia sobre um modelo de simulação, que foi corrigido manualmente para "Percepção" e "simulação". Além do exemplo foram encontradas mais de 300 ocorrências, principalmente nos arquivos PI.xml e PN.xml:

Caracter diacrílico aplicado sobre "=" número de ocorrências do diacrílico
chr(768)=̀ 13
chr(769)=́ 146
chr(770)=̂ 39
chr(771)=̃ 113
chr(776)=̈ 2
chr(807)=̧ 85

Conforme lembrado em 2015: