alexis-michaud / na

linguistic data on the Yongning Na language
GNU Lesser General Public License v3.0
6 stars 3 forks source link

dictionnaire : gestion des commentaires et notes (et des champs pas encore pris en compte) #83

Closed alexis-michaud closed 3 months ago

alexis-michaud commented 4 months ago

Diverses questions à voir ensemble. Notamment : quand un commentaire d'exemple \xc porte la mention print="n", la version actuelle (9 juin) ouvre une parenthèse, laissée vide : ( : ) Avant les deux points, c'est le type de commentaire, et après, c'est le commentaire lui-même. Comme les deux sont vides, ça fait juste un espace. Il ne faut tout simplement pas ouvrir de parenthèse du tout : print="n" serait à prendre en compte avant la mise en place de l'espace typographique prévu pour les commentaires.

alexis-michaud commented 4 months ago

Aussi : affichage des définitions en langue vernaculaire. C'est un champ \dv. Exemple : entrée \lx ŋwɤ˧jɤ˩ \dv ŋwɤ˧pʰæ˧ bv̩˥-di˩, | ŋwɤ˧jɤ˩!

alexis-michaud commented 4 months ago

Autre vérification à faire : affichage de plusieurs sources concordantes pour les exemples. Quand plusieurs locutrices et locuteurs ont confirmé utiliser une certaine phrase (un exemple), leurs codes respectifs figurent à la suite les uns des autres, en fin d'exemple. Ainsi pour la phrase suivante : \xv ʝi˩ bʋ̩˩ ʝi˥ ʈv̩˩~ʈv̩˩

\rf F4
\rf F5
\rf M18

C'est à afficher sous forme de liste, comme pour le champ \va.

alexis-michaud commented 4 months ago

Encore une question liée : les attributs des notes. En retravaillant les notes, je distingue les notes d'historique qui parlent des tons type="tone"de celles qui parlent d'autres questions de phonologie type="phono", etc. Mais sans doute n'est-il pas prévu que la variable type ait plusieurs valeurs ?? \nt <type="hist" type="tone" Si oui tu @BenjaminGalliot me dis et je ré-encode en conséquence. Par exemple \nt <type="hist" field="tone" ? Exemple : \nt <type="hist" type="tone" langue="fra" print="n"> ton d6 (avant 2009: noté: lo˩ ʈʰɯ˥)

alexis-michaud commented 4 months ago

Parmi les ajustements à faire et à vérifier : l'affichage des définitions en langue vernaculaire, mis dans un champ \dv (cf. explications dans le ticket #31). Un exemple pour fixer les idées :

\lx mo˧nɑ˥-ɕi˩mi˩
(...)
\dn 闲话、碎言碎语、八卦、坏话
\gn 闲话
\df Médisance, ragot.
\dv mɤ˧-dʑɤ˩-hĩ˩ ʐwɤ˩
BenjaminGalliot commented 4 months ago

Le problème des commentaires a été réglé (j’en ai profité pour retirer quelques \xc vides), de même que celui des références (veux-tu les trier automatiquement ou je laisse l’ordre du fichier source ?).

Copie d'écran_20240618_163238

Je n’ai pas vu le problème avec \dv, ça semble être affiché depuis un bon moment…

Copie d'écran_20240618_163330

Pour les attributs des notes/commentaires, c’est une bonne question, mais avant de savoir comment on peut coder cela, il faut voir la logique : mettre plusieurs attributs homonymes, ce n’est pas permis en XML, et il y a de bonnes raisons évidentes à cela… Mais ça, c’est le XML, car dans le fichier Lex, tout est virtuellement permis. Si tu mets plusieurs attributs homonymes, comme type, c’est que tu veux créer une liste d’éléments adelphes. Or comme tu le dis juste après, tone est subordonné à hist, donc les mettre au même niveau dans une liste abstraite, ça ne correspond pas à ce que tu as en tête donc ce n’est pas la bonne solution… Les deux attributs type et field permettent 2 niveaux de profondeur, ça peut sembler mieux, mais il faut que la distinction soit claire, et qu’il n’y ait pas d’autre niveau de profondeur. Tu pourrais aussi faire quelque chose comme type="hist-tone", permettant une profondeur variable, mais ça peut devenir difficile à analyser, surtout si les combinaisons se multiplient…

alexis-michaud commented 4 months ago

ʙonnes questions ! J'essaie d'avancer dans mes réflexions ce week-end. Il y a aussi la question de comment coder les comparanda dans d'autres langues: mots apparentés (ou du moins, termes de comparaison pour un travail historique). Pour l'instant les rares exemples sont au format suivant \nt <langue="naxi" type="comp"> ʈʂə˞˩ mais ça n'est pas conforme à la logique, semble-t-il : image Bref, à reprendre sur de bonnes bases ! Un échange "en direct" pourrait être bien utile, selon tes possibilités.

alexis-michaud commented 4 months ago

Le problème des commentaires a été réglé (j’en ai profité pour retirer quelques \xc vides), de même que celui des références (veux-tu les trier automatiquement ou je laisse l’ordre du fichier source ?).

Merci de laisser l'ordre du fichier source, qui fournit une info. Tu vois, la personne mise en premier, c'est celle qui a fourni l'exemple, et les autres, c'est des gens qui apportent une vérification ("ça nous va, on dit comme ça") ou qui au contraire signalent qu'eux diraient les choses autrement. Je note que ça sera à expliquer dans l'intro du dictionnaire.

alexis-michaud commented 3 months ago

Un exemple d'info à afficher dans le PDF : \nt Indication from Roselle Dobbs: this name is /|fv{w̃æ.bi}/ in the village of Aggowua |fn{阿古瓦}, north of Alawua. Ca concerne la version anglaise... allez je le traduis, afin d'avoir quelque chose sous la dent pour les tests.

alexis-michaud commented 3 months ago

\nt <dom="dialect" langue="fra"> Roselle Dobbs fournit l'indication selon laquelle ce nom de lieu se prononce /|fv{w̃æ.bi}/ dans le village d'Aggowua |fn{阿古瓦}, au nord d'Alawua. (C'est modifié dans le document en ligne, na.lex)

alexis-michaud commented 3 months ago

Autre info à afficher : le champ \np, notes phonético-phonologiques (phon* dirait Guillaume Wisniewski, qui lit: "phon- étoile") \np <langue="fra"> Par exemple : \np <langue="fra"> Parmi les classificateurs de catégorie tonale Lβ, certains donnent plus volontiers un schéma tonal MH# lorsqu'ils sont associés à un démonstratif, tandis que d'autres donnent plus volontiers un schéma H#. Dans l'état actuel de la langue, il paraît s'agir d'une préférence parmi des variantes toutes deux acceptables. Pour ce mot-ci, le schéma préféré est MH#. Il est envisageable de tout transformer en note, \nt, si ça simplifie la structure. \nt

(Pertinent pour le dictionnaire anglais et français, et aussi pour le dictionnaire chinois, dans la philosophie actuelle qui consiste à y inclure à peu près tout. Philosophie dont il serait opportun de discuter ensemble à un moment, et on la fixerait par écrit dans l'intro.)

alexis-michaud commented 3 months ago

Aussi, histoire d'avoir un exemple sous la main, j'ai traduit en 3 langues un commentaire au sujet d'une variante. C'est pour le mot "opium"*.

\va <speaker="M23"> ʈʂʰæ˧v̩˧-nɑ˥
\vf Sens de l'expression: “médicament noir"
\ve This noun phrase means ‘black medicine’.
\vn 这个名词的意思是‘黑药’。

Pour l'affichage : en suivant la philosophie proposée (ouverte à discussion) : dans le dico chinois les 3 y seraient ; dans l'anglais, y'aurait juste l'anglais ; dans le français, juste le français.

Pour l'encodage : pas d'obstacle à réencoder en mettant la langue comme attribut, et en uniformisant la balise-champ, pour ne pas multiplier les champs; ça pourrait donner 'vc', 'c' pour 'commentaire' comme dans 'xc', et 'v' pour variante, comme dans 'va'. Dans l'attente de tes instructions.

*j'espère qu'avec ce mot je vais pas attirer les foudres de la Censure sur notre projet : entre les substances récréatives illicites, les mots tabous [les lexicographes ne respectent pas la pudeur], et les indications géographiques jalousement protégées / langues & peuples tabous, il pourrait bien y avoir dans na.lex de quoi faire réagir la plupart des filtres de surveillance de masse d'ici et d'ailleurs...

alexis-michaud commented 3 months ago

Encore une info : en cas d'absence d'étiquette de langue, il faut faire l'hypothèse selon laquelle l'information est pertinente pour les 3 versions linguistiques, et est à répéter pour chacune des langues. L'absence d'étiquette langue serait une sorte de factorisation par laquelle l'information en question cumule toutes les étiquettes langue possibles (pour ce qui concerne les "méta-langues", celles dans lesquelles le dictionnaire est publié : fra+eng+cmn).

Par exemple ci-dessous :

\xv ə˧bo˧-tɕi˥
\xe paternal uncle, father's younger brother
\xn 叔叔:父亲的弟弟
\xf oncle paternel cadet du père
\xc <dom="ton"> H#

L'information selon laquelle l'expression porte un ton H# n'est pas "en français" plus qu'en anglais ou en chinois, et elle concerne toutes les langues. Elle serait à composer typographiquement selon la langue concernée, d'après l'indication fournie par l'étiquette "domaine linguistique" (ici : "ton").

De même pour la note sémantique (commentaire d'exemple) ci-dessous : \xc <dom="synt"> |fg{clf}: |fv{/ɖɯ˧-ɭɯ˧/} Il faudra que je te fournisse une liste de traductions pour les divers types de commentaires.

alexis-michaud commented 3 months ago

Traité. Les points qui restent à voir sont dans le ticket #87