HXL-CPLP / forum

Fórum do Grupo de Usuários do Padrão HXL da Comunidade dos Países de Língua Portuguesa, "HXL-CPLP"
https://github.com/HXL-CPLP/forum/issues
The Unlicense
2 stars 0 forks source link

HXL-CPLP-Vocab_Scriptum (ISO 15924 et al) #54

Open fititnt opened 3 years ago

fititnt commented 3 years ago
Informação (usando HXL hashtags) O que essa informação significa
#meta +id +v_zz_hxl #description+label
#meta +name +i_pt HXL-CPLP-Vocab_Scriptum
#org +maint +url https://hxl.etica.ai/
#meta +license +name Open Data Commons Public Domain Dedication and License (PDDL)
#meta +forum +url https://github.com/HXL-CPLP/forum/issues/54
#meta +googledrive +url https://docs.google.com/spreadsheets/d/1B9lzzJC124GvUMbPT-6S9FQiIeO6pHsnHdQib-bcPkg/edit#gid=764269111

#meta +description +i_por

HXL-CPLP-Vocab_Scriptum contém códigos que representam sistemas de escrita. No momento está tabela pega dados com cache de 0 a 90min do conteúdo oficial de ISO 15924 na URL https://unicode.org/iso15924/iso15924.txt e os formata em HXL. É possível que novas alterações sejam feitas com mais informações sobre sistemas de escrita em versões futuras.

Resumidamente, o que são sistemas de escrita? Múltiplos idiomas como ISO 639-3 por (Português) fra (Francês), eng (inglês) podem tipicamente usarem sistema de escrita de algarismos Latin, ISO 15924 Latn, ao ponto de ferramentas providas por desenvolvedores de software as assumirem Latn como padrão. Algumas vezes isso não fica claro pois muito foi feito pelo seu provedor de sistema operacional, como em projetos do CLDR da Unicode (http://cldr.unicode.org/).

Então, por que desta tabela? Tudo não pode ser automatizado? Boa parte dos idiomas no mundo não usam apenas um sistema de escrita. Claro que a maioria não chega ao exemplo da língua japonesa que tem 4 sistemas de escrita (e usa todos eles!) porém é comum (muito mais por legado de máquinas de escrever e software que por décadas suportou apenas alfabeto latino) ter também ao menos uma versão em alfabeto latino (e, note, tais versões também podem nem mesmo ser compreendidas pela população local!)

Assumir um padrão pode prejudicar minorias étnicas, mesmo quando já existe suporte no Unicode. Outro problema é, em sistemas onde existem múltiplas traduções, o fato de não nem mesmo permitir explicitar o sistema de escrita para um mesmo idioma pode prejudicar também a maioria ou criar disputas artificiais por algo que nem se trata de problema político, mas de falha de software.

Veja também: '[meta] Internationalization and localization (i18n, l10n) and internal working vocabulary', URL: https://github.com/EticaAI/HXL-Data-Science-file-formats/issues/15

#meta +description +gtranslate +i_eng

"HXL-CPLP-Vocab_Scriptum contains codes representing writing systems. Is currently picks up table data cache from 0 to 90 min of the official content ISO 15924 in the URL https://unicode.org/iso15924/iso15924.txt and formats in HXL. It is possible that new changes to be made with more information about writing systems in future releases.

Briefly, what are writing systems? Multiple languages ​​such as ISO 639-3 for (Portuguese) fra (French), eng (English) can typically use writing system of Latin numerals, ISO 15924 Latn, to the point of tools provided by software developers to take Latn default. Sometimes it is not clear because much has been done by your operating system provider, such as projects CLDR Unicode (http://cldr.unicode.org/).

So why this table? Everything can not be automated? Much of the languages ​​in the world do not use only one writing system. Of course, the majority does not reach the example of the Japanese language has 4 writing systems (and uses all of them!) But is common (more by legacy of typewriters and software for decades endured only Latin alphabet) also have at least one version of the Latin alphabet (and note, Also these versions can even be understood by local people!)

Take a standard can harm ethnic minorities, even when already no support in Unicode. Another problem is, in systems where there are multiple translations, the fact that not even allow the explicit writing system for the same language can also hurt most or create artificial disputes for something that not it comes to problem political, but software failure.

See also: '[goal] Internationalization and localization (i18n, l10n) and internal working vocabulary ', URL: https://github.com/EticaAI/HXL-Data-Science-file-formats/issues/15"