HXL-CPLP / forum

Fórum do Grupo de Usuários do Padrão HXL da Comunidade dos Países de Língua Portuguesa, "HXL-CPLP"
https://github.com/HXL-CPLP/forum/issues
The Unlicense
2 stars 0 forks source link

Prova de conceito: codificação de taxonomia de recursos de inventários tipicamente trocados em meio a resposta de emergência #60

Open fititnt opened 2 years ago

fititnt commented 2 years ago

A ideia desse tópico é ter uma prova de conceito (isto é, mesmo caso haja evolução, tende a ser algo para equipe externa no futuro) de taxonomia que possa ser usada para referenciar recursos que são trocados em meio a resposta de emergência. Quanto a parte implementação:

Inspirações iniciais

O The Sphere Handbook: Humanitarian Charter and Minimum Standards in Humanitarian Response tem uma ótima base de códigos. Muito dele parece ter inspirado outros padrões que são mais citados.

A ACNUR parece ter códigos mais explícitos (alguns até com manuais de como criar modelo específico de banheiros para campos de refugiados), porém eles são mais para uso interno da ACNUR

Terminologia reconhecidamente em falta (no post inicial)

O The Sphere Handbook e, normalmente, e talvez parte do conteúdo da ONU focado no chamado WASH, parece intencionalmente não citar coisas como roupas. Não sei também se o que seria em inglês shelter (como exemplos de referência para itens usados em abrigo provisório) seja comum.

Sobre idealmente "endossamento" de códigos

What is Sphere?

The Sphere Project, now known as Sphere, was created in 1997 by a group of humanitarian non-governmental organisations and the Red Cross and Red Crescent Movement. (...)

ReliefWeb sobre The Sphere

Um dos principais motivos para intencionalmente fazer como prova de conceito (além de testar ferramentas como o hxltmcli para lidar com esse tipo avançado de lexicografia) é que, assim como The Sphere que teve história com voluntários da Cruz Vermelha (não fica claro se surgiu de outras ONGs, e Cruz vermelha validou antes do projeto dedicado ser criado), esse tipo de codificação faria sentido ser doado para alguma Cruz Vermelha a nível de país, porém já com visão de bom suficiente para permitir traduções. Tanto a de Portugal como a do Brasil são bons candidatos.

Inclusive, de forma informal, comecei os contatos. Não obstante esse tipo de trabalho foge do comum.

Mesmo que esse tópico aqui não fosse um rascunho (e é) creio que mesmo que alguma cruz vermelha aprove, seria necessário já ter gente que vá alem e ajude eles com outras dúvidas. Por exemplo, além de sites e páginas em redes sociais, a cruz vermelha nem tem GitHub (como a dos EUA e do UK). Então mesmo se fosse os ajudar a criar, seria relevante deixar documentação de como podem reclamar com GitHub caso tenham que recuperar acesso. E sim, isso é importante porque voluntários vêm e vão, então seria necessário mais gente apenas para garantir redundância.

fititnt commented 2 years ago

Fazendo prova de conceito focada em apenas em tratamento de códigos numéricos funcionais mesmo sem vocabulário em https://hxltm.etica.ai/codex-simplex-ontologiae.html. O motivo da prova de conceito mais genérica veio de https://github.com/SEMICeu/Core-Person-Vocabulary.


Captura de tela de 2021-12-17 10-48-52

fititnt commented 2 years ago

Interesting. JavaScript does support full Unicode General_Category for regexps (so, it's aware what is numeric, or in our case the ones which are Decimal numeric. Other programming languages also do implement this.

However, JavaScript by default does not provide way to convert between numeric systems. This actually is not hard to implement (needs add lookup table), but this type of feature is so specific that there is no built in for it.

fititnt commented 2 years ago

Legibility of CSV-like editing is not friendly. Codemirror does not have published language mode for CSV (like very popular ones such as the VSCode https://github.com/mechatroner/vscode_rainbow_csv).

For now we're using this snipped https://gist.github.com/rooks/6a13affb544ef8bc338b49af7d018318 and applying a theme based on https://davidmathlogic.com/colorblind/. This should improve a bit raw editing without need to resort to external tools. Good. Not perfect.

The current preview:

Captura de tela de 2021-12-20 15-20-12

fititnt commented 2 years ago

I believe we should test change the number separators (the . on 12.34.56) from . to : on the reference separator. (is possible to have more than one type of separator, but for sake of documentation, at least one low level need to be agreed).

Sometimes, in special with only two groups (such as 12.34) this can be confused with floats, so we would need to recommend use more often something like [12.34] when storing.

However, another argument is would allow be more near the idea of the URNs (see Uniform Resource Names (URNs), link https://datatracker.ietf.org/doc/html/rfc8141). A major discussion (but for entire datasets on any local or remote storage, not individual data in memory) is at urnresolver: Uniform Resource Names - URN Resolver https://github.com/EticaAI/HXL-Data-Science-file-formats/issues/13.

difference with HXL-Data-Science-file-formats / urnresolver

On that issue, we used as prefix urn:data. However, here I think we can go fully numeric: older 12.34 would become a urn:12:34 when need to be exposed to systems which require IRIs/URIs (yes, URNs are valid URIs, so strictly speaking this already is very likely to be compatible with several standards. Does not mean that tooling implement this, so we actually may need to upgrade to some format such tools would require.