HXL-CPLP / forum

Fórum do Grupo de Usuários do Padrão HXL da Comunidade dos Países de Língua Portuguesa, "HXL-CPLP"
https://github.com/HXL-CPLP/forum/issues
The Unlicense
2 stars 0 forks source link

HXL-CPLP-Vocab_Latinum #42

Open fititnt opened 3 years ago

fititnt commented 3 years ago

Fiat lux!

fititnt commented 3 years ago

meta +name +i_lat: Probationem-conceptu-1

Captura de tela de 2020-12-15 01-28-52

CPF | Data do evento | Nome | Tipo de agente | Agente | Lei | Tem certeza do fato? | Acha, mesmo sem ter certeza? | Situação | Descrição curta
-- | -- | -- | -- | -- | -- | -- | -- | -- | --
#meta +id +v_br_cpf | #date | #meta +name | #l_voc_latinum |   | #l_lex | #l_factum | #l_opinio | #status | #meta +description+i_por
415.234.540-32 | 2020-01-01 | João da Silva Silveira | victma | Vítima | Art. 138 Caput do CPB | 1 | 1 | 1 | João tem certeza que foi caluniando
103.253.330-76 | 2020-01-03 | Maria da Silva Silveira | victma+mater | Mãe da vítima | Art. 138 Caput do CPB | 0 | 1 | 1 | Escrivão, ao notar que mãe de João não viu o fato, anota apenas que ela "acha que é verdade"
028.368.350-36 | 2020-01-17 | Delegado Davi Moraes | dux_vigilum | Delegado de polícia | Art. 139 do CPB | 1 | 1 | 1 | Delegado tem certeza que a tipificação é "difamação" não calunia, pois a ofensa que João ouviu sobre sua opção sexual não é um crime
415.234.540-32 | 2020-01-17 | João da Silva | victma | Vítima | Art. 139 do CPB | 1 | 1 | 1 | João muda de opinião, Ele aceita como difamação.
808.324.540-28 | 2020-03-01 | Juiz Fulado da Costa | iudex | Juíz |   | 0 | 0 | 0 | Juiz arquiva o processo

Bug

Como a gente muito, mas muito provavelmente iria adicionar muitas hashtags base, optei por fazer rascunho já com prefixo #l_. Até aqui tudo bem. Creio que a gente já iria ter um schema para validar esse novo vocabulario

Um bug é que o HXL Proxy, aparentemente, está permitido não exibir alertas de erro para como #l_lex, #l_factum, etc em vez de #x_lex, #x_factum e afins. Não chega a ser algo negativo.

Captura de tela de 2020-12-15 01-34-15

fititnt commented 3 years ago

Via o Amazon Kindle Unlimited (paga um valor mensal, tem acesso a livros no pacote), li o livro The Everything Essential Latin Book: All You Need to Learn Latin in No Time (link: https://www.amazon.com/gp/product/1440574219?pf_rd_r=E4HAWXXZZTTB8WA8VQT8). Era mais barato pagar Kindle Unlimited do que comprar esse livro, então ok. Ainda vou precisar de um dicionário, mas mesmo não falando inglês nativamente, deu para ter uma ótima ideia geral.

Tem um outro livro que também está no Kindle Unlimited, o Latin: Learn Latin Fast! Understand The Latin Language & Start Talking Latin "(link: https://www.amazon.com.br/Latin-Understand-Language-Talking-Italian-ebook/dp/B00SM2U2PG) mas esse definitivamente não explica como o primeiro livro (nem mesmo o básico).

Um site gratuito para achar os termos é este aqui https://www.online-latin-dictionary.com/.

Minha ideia geral

Eu vou pesquisar melhor o potencial de usar latim como língua de vocabulário. Mesmo que a gente vá adiante, a tendência é que eu tenha que aprender bem mais do que as pessoas que possivelmente "apenas seguiriam instruções" de como adicionar novos termos. Por isso que embora eu possivelmente documente como estou fazendo para chegar nas conclusões o resultado final tende a ser mais simples.

Outro ponto: dependendo da minha proficiência com Latin, se for mesmo para usarmos, provavelmente vou pedir ajuda de especialistas em linguística. Mas antes mesmo de pedir ajuda, seria necessário ter ideia do que pedir suporte.

fititnt commented 3 years ago

Algo em especial que estou repensando é prefixo a usar. Talvez

  1. Em vez de #l_lex, #l_iudex altere nos testes internos para #lat_lex, #lat_iudex
  2. +lat_lex, +lat_iudex ... passariam a ser opções de atributos extras em hashtags já válidas no HXL v1.1final.
  3. (Outras especificações de ideias vou detalhar nas planilhas mesmo)

v0.2

Como referência, isto aqui é o que estava antes de ler o livro. Na https://docs.google.com/spreadsheets/d/1Tq1sY4f6_j1blosCjU7vmXJ5iKLjdu4OoOyPXROJIQg/edit#gid=794217719 marquei como versão v0.2

Em https://docs.google.com/spreadsheets/d/1EX5vIvyvoCguWT-vq_rrOFsjPkqD8xVbUtUdGIs64mE/edit#gid=407576732 tem uma versão arquivada que é uma cópia da que estamos trabalhando. Possivelmente essa versão arquivada não será deletada.

Representa mesmo conceito?,Wikidata Item,Situação,Hashtag,,Usar?,"Hashtag, descrição curta, i_pt","Hashtag, descrição longa",Wikipedia Latimum,"Wikitionary, Inglês"
#vocab+category,#vocab+v_wikidata,,#valid_tag,,#meta+num,#description+short+i_pt,#description+long+i_pt,#meta+wilipedia+i_lat,
en:law,Q820655,Rejeitada,#l_legis,,1,"Lei, legislação",,,
en:law,Q820655,,#l_lex,,1,"Lei, legislação",Lei (Inglês: legislative act),https://la.wikipedia.org/wiki/Lex,
en:law,Q7748,,#i_ius,,,Direito (sentido mais amplo que lex),,https://la.wikipedia.org/wiki/Ius,
en:judge,Q16533,,#l_Iudex,,,Juiz de direito,,https://la.wikipedia.org/wiki/Iudex,
en:lawyer,Q40348,,#l_causidicus,,,Adbogado,"Latim usa ""Iuris consultus"" quando pesquisa-se ""causidicus"".",https://la.wikipedia.org/wiki/Iuris_consultus,
en:police,,,#l_vigilum,,,"Policia (policial, bombeiro, etc)",,,
en:police_chief,,,#l_vigilum_dux,,,"Chefe de polícia (de bombeiro, etc)",,,
pt:escrivao_de_policia,,,#l_scriba,,,"Escrivão, secretário, etc",,,
,,,,+poena,,Pena,,,https://en.wiktionary.org/wiki/poena
,,,,+poena +maximam,,Pena máxima,,,
,,,,+poena +minimam,,Pena mínima,,,
,,???,,+mensis,,Meses,,,
,,???,,+annos,,Anos,,,

Captura de tela de 2020-12-16 04-54-30

fititnt commented 3 years ago

Feito <3.

Agora é mais palpável prova de conceito. Mas em geral se a escolha de hashtags e atributos for bem feita, pelo menos em teoria até mesmo mecanismos gratuitos de tradução, como Google Translator, teriam facilidade de usar o latim como língua interna e responder o que significa em praticamente a maioria dos idiomas. Uma provável desafio seria palavras que nem mesmo Latim tem, mas isso ainda requer mais testes práticos.

Na data atual creio que por mais trabalho que dê para começar a ter um guia de "quais hashtags + atributos em latim usar", isso necessariamente deixa as planilhas compreensíveis e mais línguas. Porém ainda imagino que uso de um vocabulário em Latim faria mais sentido exclusivo para conjuntos de dados relacionado a área de leis e área de medicina.

v0.3.5

Prova de conceito. Através da escolha de boas tags e atributos em latim usa tradução automática para explicar o que significa

Latim é uma língua muito bem estruturada. Permite, inclusive, mover termos da frase e manter o sentido e é muito amigável para ferramentas de tradução de máquina. A versão v0.3 do HXL-CPLP-Vocab_Latinum, aba ""Automated tests"", mostra exemplos. Nota: ainda é necessário ver bons termos chave em latim que funcionem 100%.

Captura de tela de 2020-12-16 07-52-33

hxl +public,,,,,,,,
description +short +i_pt,Prova de conceito. Através da escolha de boas tags e atributos em latim usa tradução automática para explicar o que significa,,,,,,,
description +long +i_pt,"Latim é uma língua muito bem estruturada. Permite, inclusive,
mover termos da frase e manter o sentido e é muito amigável para ferramentas de tradução de máquina.
A versão v0.3 do HXL-CPLP-Vocab_Latinum, aba ""Automated tests"", mostra exemplos.
Nota: ainda é necessário ver bons termos chave em latim que funcionem 100%.",,,,,,,
,,,,,,,,
,,,,,,,,
,,,,,,,,
,,,,,,,,
,,,,,,,,
,,,,,,,,
,,,,,,,,
,,,,,,,,
,,,,,,,,
,,,,,,,,
meta +output +raw +formula,"=CONCATENATE(A20, "" "",B20, "" "",C20, "" "", D20, "" "")",,,,,,,
meta +output +cleaned +formula,"=SUBSTITUTE(SUBSTITUTE(SUBSTITUTE(SUBSTITUTE(E20, ""lat_"", """"),""#"", "" ""), ""+"", "" ""), ""_"", "" "")",,,,,,,
description +referenced_cell+value,"This is the hashtag, like ""'#lat_lex+poenam +maximam +annos",,,,,,,
description +referenced_cell+value,"Planned: add multiple ""+label""",,,,,,,
Hashtag,Atributos da hashtag,Atributos extras (usa de outra coluna),Valor da célula ativa no momento,Resultado de mesclagem bruta,Resultado de mesclagem antes de traduzir do latim,Automated translation to English (use latim as internal working language),Automated translation to English (use latim as internal working language),Tradução automática para português (usa latim como língua intemediária)
#meta +hashtag_tag,#meta +hashtag_attributes,#meta +referenced_cell+value,#meta +active_cell_value,#meta +output +raw,#meta +output +cleaned,#meta +output +gtranslate +i_en,#meta +output +gtranslate +i_fr,#meta +output +gtranslate +i_pt
#lat_lex,,,,#lat_lex    , lex    , the law, la loi, a lei
#lat_lex,+poenam,,,#lat_lex +poenam   , lex  poenam   , the law penalty, la peine de loi, a pena de lei
#lat_lex,+poenam +maximam +annos,,1,#lat_lex +poenam +maximam +annos  1 , lex  poenam  maximam  annos  1 , The law the maximum penalty of 1 year, La loi la peine maximale de 1 an, A lei da pena máxima de um ano
#lat_lex,+poenam +minimam +annos,,2,#lat_lex +poenam +minimam +annos  2 , lex  poenam  minimam  annos  2 , The law minimum penalty of 2 years, La peine minimale de loi de 2 ans, A pena mínima lei de 2 anos
#lat_lex,+poenam +maximam+mensis,,6,#lat_lex +poenam +maximam+mensis  6 , lex  poenam  maximam mensis  6 , The law the maximum penalty of 6 months, La loi de la peine maximale de 6 mois, A lei a pena máxima de 6 meses
#lat_lex,+poenam +maximam+annos,,20,#lat_lex +poenam +maximam+annos  20 , lex  poenam  maximam annos  20 , The law the maximum penalty of 20 years, La loi de la peine maximale de 20 ans, A lei a pena máxima de 20 anos
#lat_opiniom,,victimam,,#lat_opiniom  victimam  , opiniom  victimam  , opinion victim, victime d'opinion, opinião vítima
#lat_opiniom,,victimam+mater,,#lat_opiniom  victimam+mater  , opiniom  victimam mater  , Mother opinion victim, Mère victime d'opinion, vítima opinião mãe
#lat_opiniom,,victimam,,#lat_opiniom  victimam  , opiniom  victimam  , opinion victim, victime d'opinion, opinião vítima
#lat_opiniom,,victimam+mater,,#lat_opiniom  victimam+mater  , opiniom  victimam mater  , Mother opinion victim, Mère victime d'opinion, vítima opinião mãe
#lat_opiniom,,dux_vigilum,,#lat_opiniom  dux_vigilum  , opiniom  dux vigilum  , the opinion of the police chief, l'avis du chef de la police, a opinião do chefe de polícia
#lat_opiniom,,victimam,,#lat_opiniom  victimam  , opiniom  victimam  , opinion victim, victime d'opinion, opinião vítima
#lat_ad_opiniom,,victimam,,#lat_ad_opiniom  victimam  , ad opiniom  victimam  , the idea victim, la victime idée, a idéia de vítima
#lat_opiniom,,iudex,,#lat_opiniom  iudex  , opiniom  iudex  , judge opinion, avis de juge, opinião juiz
fititnt commented 3 years ago

Descobri um lugar que explicitamente cita problemas comuns com criar e /ou usar termos em Latim que precisam ser parseáveis por máquinas: o próprio TA98 (versão online). Vou deixar aqui como referencia, pois a questão dos sinais de pontuação (',', '.', '/', ...) e uso de preposições seriam algo que teríamos problemas.

Changes Due to Regular Anatomical Terminology Rules

Informatics Working Group of FIPAT

Robert Baud (Switzerland), Pierre Sprumont (Switzerland), Paul E. Neumann (Canada)

Several terms in Terminologia anatomica (Thieme, 1998) do not meet the recommendations for a Regular anatomical terminology (RAT). RAT was proposed to make interpretation of the Latin terms less ambiguous for all users of human anatomical nomenclature, including students and translators, and to advance the goal of making the terminology machine-readable. The RAT rules include:

  1. Only nouns and adjectives are allowed,
    1. Adjectives follow the nouns they modify,
    2. Words in genitive case follow words in nominative case,
    3. Punctuation is not allowed within terms. In the online version of TA98, rules 1 and 4 were almost fully applied, and rules 2 and 3 were applied when the Latin syntax analyzer software (written by RB) was unable to parse terms because of ambiguity. A listing of changes due to this partial application of RAT rules follows. The most common problems that led to changes included use of conjunctions and prepositions, and ambiguity caused by similarity of nominative singular and genitive singular forms of third declension adjectives.
A01.1.00.050Cavitas abdominis et pelvisAbdominopelvic cavity Use of conjunction (et). Cavitas abdominopelvica
A01.2.00.000Plana, lineae et regionesPlanes, lines and regions Use of conjunction (et). Res referentesReference entities
A01.2.03.001Regiones thoracicae anteriores et lateralesAnterior and lateral thoracic regions Use of conjunction (et). Regiones thoracicae anterolaterales
A02.0.00.044PrimariumPrimary Absence of noun. Centrum primarium ossificationisPrimary ossification centre

(...)

http://www.unifr.ch/ifaa/Public/EntryPage/TA98RATChangesNew.html