CNRS-LACITO / HimalCo

Himalayan Corpora
Other
2 stars 1 forks source link

[dict na] entrée dont la forme \lx n'apparaît pas dans le PDF: "Violon à deux cordes, erhu" #77

Closed alexis-michaud closed 9 years ago

alexis-michaud commented 9 years ago

Entrée "Violon à deux cordes, erhu": \lx kɯ˩ɻ˧ la forme \lx n'apparaît pas dans le PDF. Est-ce la syllabe /ɻ/ qui pose problème? Merci++ Alexis

buret commented 9 years ago

Oui, c'est la syllabe /ɻ/ qui pose problème dans le sens où elle n'est composée que d'un seul caractère. Du coup, une regex en particulier ne passe pas sur ce lexème car la contrainte est définie à au moins 2 caractères par syllabe (sauf pour la 1ère syllabe). J'ai un fix prêt pour ce cas particulier, mais n'y a-t-il pas cette contrainte à redéfinir justement ? Ou est-ce la seule entrée comme ça ?

alexis-michaud commented 9 years ago

Oui, il faut redéfinir cette contrainte de "2 caractères par syllabes". Une syllabe peut tout à fait ne comporter qu'1 caractère. Le fait qu'elle soit la 1e ou la 2e syllabe d'un mot n'est pas pertinent. Autres exemples : Line 148304: \lx v˩ Line 148364: \lx v˧ Line 148452: \lx v˥

buret commented 9 years ago

Les exemples que tu me donnes concernent tous la 1ère syllabe. Y a-t-il d'autres lexèmes dont la 2nde syllabe soit composée d'un seul caractère ?

alexis-michaud commented 9 years ago

J'ai pris ces exemples parce que pour moi c'était facile de chercher "\lx v" dans le dictionnaire, et on tombe sur ceux-là. Mais il existe aussi des exemples comme \lx ze˩v˩

Cette structure est phonologiquement licite: ce n'est pas une exception. Il ne faut pas se fier au nombre d'exemples. Au jour d'aujourd'hui il y a moins de 3000 entrées; si je fais bien le boulot dans les années qui viennent, on peut se rapprocher à terme de 4000, puis 5000 etc. Il y en aura à coup sûr qui auront un v ou ɻ ou autre phonème unique comme 2e syllabe, c'est donc un des cas de figure à prévoir. Il faut donc redéfinir la contrainte. Si tu as d'autres hypothèses comme celle-ci au sujet de la phonologie à tester, n'hésite pas à m'en parler.

buret commented 9 years ago

En fait, tu m'avais spécifié qu'il y avait forcément au moins 2 caractères pour chaque syllabe (en dehors de la 1ère syllabe). Je vais donc mettre à jour la contrainte avec cette nouvelle indication.

alexis-michaud commented 9 years ago

Merci de la correction. Peut-être que j'incluais le symbole tonal dans le décompte? Ou alors je t'ai raconté une ânerie avec la plus parfaite assurance ^^ Si c'est ça je vais essayer de pas recommencer.