Open alexis-michaud opened 2 weeks ago
Pour les notes, pour bien distinguer le domaine linguistique concerné (sémantique, syntaxe, phonologie, dialectologie...) du type de note (est-ce que c'est de l'historique qui n'intéresse pas la majorité des lecteurs, ou des infos complémentaires fournies en bon ordre), l'attribut "type" a été modifié comme suit :
Pour la composition typographique, la traduction de ces étiquettes dans les 3 langues pourrait être comme suit : sem:Sémantique Semantics 语义 synt:Syntaxe Syntax 句法 morpho:Morphologie Morphology 形态 phono:Phonologie Phonology 音系学 ton:Tonologie Tonology 声调 dialect:Dialectologie Dialectology 方言学
Les commentaires fournis dans les 3 langues ont vocation à être de simples traductions: à terme, toutes les infos (généralement rédigées à l'origine en français) seront traduites dans les 3 langues, de sorte qu'en principe il ne sera pas nécessaire d'avoir les commentaires dans les 3 langues. Pour faire les choses proprement, comme on aime, il y a un choix à faire parmi les infos. Pour la version française, je proposerais de ne rien inclure en anglais (je compte sur ta francophonophilie militante pour pencher dans le même sens), qui même avec une couleur différente tend à ne pas être hyper-discret en comparaison du français. Ni définitions, ni traductions, ni traductions d'exemples, ni commentaires. Pour la version anglaises, je proposerais d'inclure les définitions en français, les traductions d'exemples en français, mais pas les commentaires en français. À discuter (aussi avec des utilisatrices / utilisateurs de la version anglaise). Au stade actuel, où les traductions anglaises sont un peu inégales, la présence du français (globalement pas trop dur à déchiffrer pour les anglophones) rend des services pour aider à corriger l'anglais.
Fermeture du ticket #83 et nouveau point des tâches à réaliser : types de notes : les nouvelles étiquettes :
"comp"
: gestion des comparanda dans d'autres langues : mots apparentés (ou du moins, termes de comparaison pour un travail historique). Pour l'instant les rares exemples sont au format suivant\nt <langue="naxi" dom="comp"> ʈʂə˞˩
Il y a aussi des termes de comparaison en langue pumi ; ceux-là ne sont pas à afficher dans le PDF, comme l'indique l'étiquetteprint="n"
\nt <langue="pumi" dom="comp" print="n"> bæ51
mais malgré tout ça serait bien que le codage en XML soit conforme à la logique Lexika et ne fasse pas de bazar dans les tuyaux. Il semble par exemple que \nt soit défini de base comme étant du français, ce qui serait à modifier"dialect"
:\nt <dom="dialect" langue="fra"> Roselle Dobbs fournit l'indication selon laquelle ce nom de lieu se prononce /|fv{w̃æ.bi}/ dans le village d'Aggowua |fn{阿古瓦}, au nord d'Alawua.
\np
, notes phonético-phonologiques (phon* dirait Guillaume Wisniewski, qui lit: "phon- étoile")\np <langue="fra">
Par exemple :\np <langue="fra" dom="ton"> Parmi les classificateurs de catégorie tonale Lβ, certains donnent plus volontiers un schéma tonal MH# lorsqu'ils sont associés à un démonstratif, tandis que d'autres donnent plus volontiers un schéma H#. Dans l'état actuel de la langue, il paraît s'agir d'une préférence parmi des variantes toutes deux acceptables. Pour ce mot-ci, le schéma préféré est MH#.
Il est envisageable de tout transformer en note, \nt, si ça simplifie la structure.\nt <langue="fra" dom="ton">
Au fond ça serait plus cohérent d'utiliser \nt et des étiquettes, non ? Plutôt que d'avoir un champ séparé pour les notes phonético-phonologiques, alors que les autres notes sont des\nt
pourvues d'une étiquette. (Pertinent pour le dictionnaire anglais et français, et aussi pour le dictionnaire chinois, dans la philosophie actuelle qui consiste à y inclure à peu près tout. Philosophie dont il serait opportun de discuter ensemble à un moment, et on la fixerait par écrit dans l'intro.)Pour l'affichage : en suivant la philosophie proposée (ouverte à discussion) : dans le dico chinois les 3 y seraient ; dans l'anglais, y'aurait juste l'anglais ; dans le français, juste le français.
Pour l'encodage : pas d'obstacle à réencoder en mettant la langue comme attribut, et en uniformisant la balise-champ, pour ne pas multiplier les champs; ça pourrait donner 'vc', 'c' pour 'commentaire' comme dans 'xc', et 'v' pour variante, comme dans 'va'. Dans l'attente de tes instructions.
*j'espère qu'avec ce mot je vais pas attirer les foudres de la Censure sur notre projet : entre les substances récréatives illicites, les mots tabous [les lexicographes ne respectent pas la pudeur], et les indications géographiques jalousement protégées / langues & peuples tabous, il pourrait bien y avoir dans
na.lex
de quoi faire réagir la plupart des filtres de surveillance de masse d'ici et d'ailleurs...en cas d'absence d'étiquette de langue, il faut faire l'hypothèse selon laquelle l'information est pertinente pour les 3 versions linguistiques, et est à répéter pour chacune des langues. L'absence d'étiquette langue serait une sorte de factorisation par laquelle l'information en question cumule toutes les étiquettes langue possibles (pour ce qui concerne les "méta-langues", celles dans lesquelles le dictionnaire est publié : fra+eng+cmn).
Par exemple ci-dessous :
L'information selon laquelle l'expression porte un ton H# n'est pas "en français" plus qu'en anglais ou en chinois, et elle concerne toutes les langues. Elle serait à composer typographiquement selon la langue concernée, d'après l'indication fournie par l'étiquette "domaine linguistique" (ici : "
ton
").De même pour la note sémantique (commentaire d'exemple) ci-dessous :
\xc <dom="synt"> |fg{clf}: |fv{/ɖɯ˧-ɭɯ˧/}
Il faudra que je te fournisse une liste de traductions pour les divers types de commentaires.