Chartes-TNAH / theses

Positions des thèses de l’École des chartes
0 stars 2 forks source link

corrections des erreurs dans les fichiers cts work #28

Closed saroulle closed 6 years ago

saroulle commented 6 years ago

26

Corrections d'erreurs dans les fichiers cts work et teiHeader créés automatiquement (balises i et abbr non fermées). Résultat des tests Travis : data/pos2006/pos200604/cts.xml data/pos2006/pos200611/cts.xml data/pos2010/pos201021/cts.xml

AnZadykhina commented 6 years ago

Je n'ai pa compris qu'est-ce que tu as fait avec le fichier 201021

saroulle commented 6 years ago

Sur le fichier 201021 j'ai ajouté / à la balise abbr.

AnZadykhina commented 6 years ago

Je suis vraiment désolée, peut-être c'est seulement sur mon PC mais chez moi le title est comme ça xml <title ref="http://www.sudoc.fr/143110624">La chambre_du_roi à Versailles ou l’espace de la majesté Intérieurs, institutions et cérémonial au </abbr>xvii<sup>e</sup></num> siècle.</title> et je suis absolument sûre que ce n'est pas valide

saroulle commented 6 years ago

c'est le petit e de xviie qui a une balise /abbr

vasaura commented 6 years ago

Le problème vient de la balise /num je crois. les siècles ont été signalés dans le fichier csv de deux manière comme suit (j'ai pris l'oeuvre 201021 à titre d'exemple):

..., institutions et cérémonial au <abbr>xvii<sup>e</sup></abbr> siècle.
...., institutions et cérémonial au <abbr>xvii</abbr><sup>e</sup> siècle.

On va devoir discuter avant de merger. De plus, étant donné que ces informations sont issues du fichier csv, il vaut mieux corriger d'abord le csv, car c'est le fichier source

AnZadykhina commented 6 years ago

Excusez-moi les filles, je me sens totalement stupide. Dans ce fichier je vois qu'il y a 2 balises fermantes: </abbr> et </num> et aucune balise ouvrante: ni pour abbr ni pour num. Si c'est un bug de mon PC dîtes-moi pour que j'arrête écrire des bêtises.

Je répète qu'est-ce que je vois chez moi : xml <title ref="http://www.sudoc.fr/143110624">La chambre_du_roi à Versailles ou l’espace de la majesté Intérieurs, institutions et cérémonial au </abbr>xvii<sup>e</sup></num>siècle.</title>

saroulle commented 6 years ago

J'ai transformé la balise /num en /abbr dans les deux fichiers teiHeader et cts work. Ca devrait être bon.

AnZadykhina commented 6 years ago

Super. Je fais merge.