CNRS-LACITO / Melanesia

Linguistic data from Alex François
0 stars 0 forks source link

Lien cliquable reconnaît \lx, mais pourrait-il reconnaître \lc ? #4

Open Tavalmayam opened 7 years ago

Tavalmayam commented 7 years ago

Il y a qqs mois, j'ai modifié le XSL pour rendre cliquables les renvois à d'autres entrés, présents dans \cf ou \sy ou \an. [il faudrait d'ailleurs y ajouter \lf, cf. autre ticket que j'ai ouvert] Or les noms en mwotlap ont une forme de référence \lx (=le radical du nom) mais aussi une forme de citation (=le nom avec l'article), qui pour les locuteurs est préférable. (un peu comme en français on réfère aux verbes en utilisant non pas le radical /sav-/, mais l'infinitif /savoir/ ) Cette forme de citation est \lc dans MDF, et \la dans mon fichier Mwotlap.lex

Ainsi j'aimerais pouvoir renvoyer à l'entrée lēt2 non pas en renvoyant à [\lx lēt] mais en renvoyant à la forme de citation [\la na-lēt] Autrement dit, en plus de la possibilité d'avoir \cf lēt|hm{2} il serait bon que le lien suivant soit aussi reconnu par l'algorithme (et génère le bon lien) \cf na-lēt

Pour cela, il faudrait que le script cherche non seulement du côté des \lx, mais aussi du côté de \lc ou \la (CitationForm) (et éventuellement les variantes \va...).
Genre

tu trouves pas \lx cherche dans CitationForm et va chiper le Lemma correspondant ("lēt|hm{2}") pour en faire une cible de mon lien C possible? trop compliqué?
alexis-michaud commented 7 years ago

Bonjour bonjour,

Je vois le problème : c'est pareil en na de Yongning : ce qui est mis en \lx c'est la forme sous-jacente d'un mot, par exemple gi˧zɯ#˥ ('petit frère'), qui n'est pas prononçable telle quelle (utilisation de symboles abstraits pour représenter la catégorie tonale). Une forme \lc ("de surface") sera fournie (c'est pas encore fait): une forme lisible, qui est celle du mot dit en isolation. Exemple : /gi˧zɯ˧/.

Mon avis : Un lien comme \cf pour lequel on va fouiller dans plusieurs champs (Alex: tu cites \lx, \lc, \la, \va...), je trouve ça très casse-gueule. Avec un dictionnaire de bonne taille, ça peut donner de "faux positifs" (simples homophones), ce qui introduit du bruit: tout le contraire de ce qu'on sait faire dans ces dictionnaires "cousus main" où chaque détail compte.

Une solution pourrait consister à mettre systématiquement en avant le champ \lc : le champ \lx ce serait un truc "de linguiste", facile à trouver, mais pas mis en avant. Tandis que le \lc serait le lien "par défaut". Il apparaîtrait en tête pour chaque entrée de dictionnaire, etc.

Autrement dit : pas essayer d'avoir le beurre et l'argent du beurre, mais faire le choix de \lc systématiquement pour l'affichage des liens.

En "sous-jacent", à Benjamin de dire comment la syntaxe serait faite. Chaque entrée doit avoir un identifiant (ID). Ce que j'ai appris par Céline Buret à appeler "UID", "Unique identifier": un identifiant unique. Le \lc peut-il servir d'identifiant unique? Ou est-ce que le \lx continuerait de servir d'identifiant (lēt|hm{2}), et le \lc serait utilisé pour l'affichage? Là je sais pas. Intuitivement je me dis qu'il vaut mieux avoir le \lx comme identifiant (pour le système informatique). En tout cas il faut choisir un identifiant et s'y tenir.