CNRS-LACITO / Pangloss_website

Tools for the Pangloss Collection, an online archive of under-documented languages
https://pangloss.cnrs.fr/
MIT License
6 stars 1 forks source link

Problème d'affichage des titres dans la liste des ressources d'un corpus #227

Closed sguillaume closed 2 months ago

sguillaume commented 7 months ago

Dans la page qui liste les ressources d'un corpus, seul un titre en anglais ou en français peut s'afficher. Si jamais il n'y a ni titre en français ni titre en anglais mais qu'il existe un titre dans une autre langue, il faudrait l'afficher.

ex. https://pangloss.cnrs.fr/corpus/SouthernQiang(Luobozhai_Dialect)?lang=fr&mode=pro Pour 9 ressources il y a un titre en chinois mais qui ne s'affiche pas.

alexis-michaud commented 7 months ago

Est-ce qu'on aurait pas meilleur temps à traduire les titres histoire d'avoir quelque chose en anglais et français ... ? C'est qd même souhaitable, pour l'interface (fr+en), d'avoir quelque chose dans ces langues pour accueillir les internautes de passage... ? Surtout en mode grand public.

Peut-être un travail pour l'équipe d'éditorialisation...? Poser l'existence de titres en au moins fr ou en comme préalable à la publication d'un corpus ?

(Je pense que c'est dans ce sens que le choix s'était fait en 2020 de n'afficher que du fr ou de l'en... mais je me trompe peut-être)

alexis-michaud commented 7 months ago

Tiens, voici des titres fr + en pour les neuf ressources.

C'est du tout simple (et Nate Sims pourra bien sûr modifier s'il le souhaite ; le connaissant je pense qu'il sera content de la traduction !)

cocoon-fafaff1d-2bf9-488a-baff-1d2bf9288af5 马孝珍采访音频 Entretien avec Ma Xiaozhen 马孝珍 [audio] Audio interview with Ma Xiaozhen 马孝珍

cocoon-6e32eafa-fb26-45c5-b2ea-fafb2695c577 王光零采访音频1 Entretien avec Wang Guangling 王光零 [audio] - 1 Audio interview with Wang Guangling 王光零 - 1

cocoon-6e32eafa-fb26-45c5-b2ea-fafb2695c577 王光零婚礼唱词2 Wang Guangling (王光零) wedding lyrics - 2 Chants de mariage par Wang Guangling (王光零) - 2

cocoon-561b6fce-2011-47dd-9b6f-ce2011d7dd97 杨登枝采访音频2 Entretien avec Yang Dengzhi 杨登枝 [audio] - 2 Audio interview with Yang Dengzhi 杨登枝 - 2

cocoon-a8b478da-2efd-4613-b478-da2efdc6130f 杨登枝采访音频1 Entretien avec Yang Dengzhi 杨登枝 [audio] - 1 Audio interview with Yang Dengzhi 杨登枝 - 1

cocoon-832450e2-9995-41da-a450-e29995e1da18 赵颁航采访音频1 Entretien avec Zhao Yanhang 赵颁航 [audio] - 1 Audio interview with Zhao Yanhang 赵颁航 - 1

cocoon-00ee490c-7881-4c06-ae49-0c7881ac0684 赵颁航采访音频2 Entretien avec Zhao Yanhang 赵颁航 [audio] - 2 Audio interview with Zhao Yanhang 赵颁航 - 2

cocoon-41a43888-a8db-4abe-a438-88a8db5abeba 赵颁航采访音频3 Entretien avec Zhao Yanhang 赵颁航 [audio] - 3 Audio interview with Zhao Yanhang 赵颁航 - 3

cocoon-67a6307b-f79d-4f60-a630-7bf79d3f60b5 赵颁航采访音频4 Entretien avec Zhao Yanhang 赵颁航 [audio] - 4 Audio interview with Zhao Yanhang 赵颁航 - 4

alexis-michaud commented 7 months ago

(si c'est utile je t'envoie un format tableur avec les DOI ? ou j'insère les titres fr et en dans un tableur que tu aurais déjà tout prêt ? bref : please instruct!)

alexis-michaud commented 7 months ago

Pour ce qui est de l'opportunité de réaliser un (petit) développement informatique... je pense que ça serait un cautère sur une jambe de bois... Afficher un titre en chinois, ça n'aidera guère...?

L'idée serait plutôt de bien remplir les champs dont l'affichage est prévu (dont les résumés)... ? Ajouter un p'tit résumé pour chaque ressource, par exemple. En anglais, ça ne devrait pas trop trop coûter au déposant...?

EdouardSombie commented 7 months ago

Salut, donc rien de plus à faire ici, non ?

alexis-michaud commented 7 months ago

@sguillaume qu'en dis-tu : la solution ci-dessus te va ? (demander un titre anglais et/ou français, a minima)

sguillaume commented 7 months ago

A terme je suis tout à fait d'accord que c'est mieux si les personnes fournissent un titre au moins en anglais ou en français.

Par contre ça me complique les dépôts parce que si on impose ça pour un dépôt ça veut dire que quand il n'y en a pas :

J'aime bien quand les choses sont faites rapidement :p et ça n'est pas dans mes habitudes de mettre en attente des corpus que je pourrai mettre immédiatement en ligne surtout s'ils ont les informations minimales.

Mais ok on peut faire comme ça.

Que fait on alors pour ce type de ressource ? https://doi.org/10.24397/pangloss-0006419 C'est indiqué anglais mais ça n'en est pas. On voulait nettoyer les métadonnées pour que tout devienne bien cohérent mais si on faisait ça proprement ça fera disparaitre des dizaines et des dizaines de titres.

alexis-michaud commented 7 months ago

Oui... ces réflexions sont convaincantes.

Retirer la balise "en" de titres qui ne sont pas en anglais, et ainsi les faire disparaître de l'affichage, serait une mauvaise solution. On ne veut pas pousser à une "contrebande" dans laquelle un titre qui n'est pas en anglais devrait être déclaré comme anglais juste pour qu'il s'affiche.

Quand il n'y a pas de titre anglais ni français, mais qu'un titre est disponible dans une autre langue, il faudrait l'afficher (plutôt que de bloquer systématiquement le processus de dépôt jusqu'à ce que la personne qui dépose fournisse un titre dans au moins une de ces 2 langues).

@EdouardSombie ça se justifie donc de faire le développement informatique nécessaire afin d'afficher le titre dans la langue disponible, s'il n'y a pas la langue demandée (fr / en).

Commentaire bavard au passage : ça revient à reconnaître l'état de fait selon lequel Pangloss accueille des ressources en voie de constitution, qui ont vocation à s'améliorer avec le temps, mais qu'on accueille à peu près "en l'état", sans poser trop de préliminaires au dépôt.

Le japhug est un bon exemple. Une ressource pour laquelle aucun "vrai" titre n'est fourni, ça fait croire à un bug, c'est pas optimal comme affichage. image Y'en a des tartines comme ça, des textes japhug : quelques-uns pour lesquels le titre est du chinois translittéré en romanisation du mandarin (bianselong, xiyouji...), d'autres qui ressemblent à du japhug romanisé... Ce ne sont pas des titres lisibles pour lectorat français ou anglais. image

En comparaison, un titre en chinois (surtout un qui est simple = facile à traduire par des outils disponibles en ligne), ça apporte une information nettement plus exploitable.

Ces documents en japhug, c'est néanmoins, à l'évidence, une bonne chose de les avoir accueillis dans Pangloss. Ce sont des ressources pour lesquelles l'essentiel a été fait (la transcription) et des outils existent maintenant pour que des contributrices/contributeurs puissent un jour enrichir et compléter les métadonnées et les annotations. Ca n'est pas grave qu'en l'état, sans traduction (ni résumé ni titre fr/en), ça ne soit accessible que pour un public de happy few qui lisent la langue japhug ou du moins arrivent à faire des recherches dans les textes. Doter ces ressources japhug d'un titre français et/ou anglais, ça n'est pas forcément plus prioritaire que de les doter d'une traduction, de gloses mot à mot, d'un résumé dans diverses langues...

alexis-michaud commented 7 months ago

Quand @EdouardSombie aura réalisé le développement nécessaire pour l'affichage des titres dans les langues les plus diverses (dans la liste des ressources d'un corpus), on pourra ouvrir un ticket "Métadonnées" pour que les titres de ressources japhug qui sont en japhug (j'imagine que c'est ça la langue de kAGWcAno, qaCpa, mAGAwunW et compagnie) soient codés comme tels dans les métadonnées : en soi ça constitue une information. Évidemment ce qui serait plus propre encore serait de les re-taper en caractères phonétiques, afin qu'ils puissent être interprétés au moyen du dictionnaire japhug. Tâche non urgente & non prioritaire mais ça aurait du sens de faire une liste de tâches de ce type à réaliser un jour ?

EdouardSombie commented 7 months ago

Bon alors, je fais quoi ? :) J'affiche les titres de ressources dans les langues autres que fr/en ? Avec à chaque fois le code de la langue ?

sguillaume commented 7 months ago

Attention, il peut aussi ne pas y avoir de code langue (ça arrive) :p

sguillaume commented 7 months ago

Mais pour répondre à ta question (si j'ai bien compris) oui on affiche un titre dans une autre langue si jamais il n'y a pas de titre en anglais ou français.

alexis-michaud commented 7 months ago

J'affiche les titres de ressources dans les langues autres que fr/en ? Avec à chaque fois le code de la langue ?

C'est pour la liste de ressources (page d'un corpus). Le code de la langue n'est pas affiché pour l'instant, juste un titre. @sguillaume tu serais d'avis de rajouter (entre parenthèses) le code langue après le titre, quand ce n'est pas la langue de l'interface de consultation ?