Closed saroulle closed 6 years ago
Je n'ai pa compris qu'est-ce que tu as fait avec le fichier 201021
Sur le fichier 201021 j'ai ajouté / à la balise abbr.
Je suis vraiment désolée, peut-être c'est seulement sur mon PC mais chez moi le title est comme ça xml <title ref="http://www.sudoc.fr/143110624">La chambre_du_roi à Versailles ou l’espace de la majesté Intérieurs, institutions et cérémonial au </abbr>xvii<sup>e</sup></num> siècle.</title>
et je suis absolument sûre que ce n'est pas valide
c'est le petit e de xviie qui a une balise /abbr
Le problème vient de la balise /num je crois. les siècles ont été signalés dans le fichier csv de deux manière comme suit (j'ai pris l'oeuvre 201021 à titre d'exemple):
..., institutions et cérémonial au <abbr>xvii<sup>e</sup></abbr> siècle.
...., institutions et cérémonial au <abbr>xvii</abbr><sup>e</sup> siècle.
On va devoir discuter avant de merger. De plus, étant donné que ces informations sont issues du fichier csv, il vaut mieux corriger d'abord le csv, car c'est le fichier source
Excusez-moi les filles, je me sens totalement stupide. Dans ce fichier je vois qu'il y a 2 balises fermantes: </abbr>
et </num>
et aucune balise ouvrante: ni pour abbr ni pour num. Si c'est un bug de mon PC dîtes-moi pour que j'arrête écrire des bêtises.
Je répète qu'est-ce que je vois chez moi : xml <title ref="http://www.sudoc.fr/143110624">La chambre_du_roi à Versailles ou l’espace de la majesté Intérieurs, institutions et cérémonial au </abbr>xvii<sup>e</sup></num>siècle.</title>
J'ai transformé la balise /num en /abbr dans les deux fichiers teiHeader et cts work. Ca devrait être bon.
Super. Je fais merge.
26
Corrections d'erreurs dans les fichiers cts work et teiHeader créés automatiquement (balises i et abbr non fermées). Résultat des tests Travis : data/pos2006/pos200604/cts.xml data/pos2006/pos200611/cts.xml data/pos2010/pos201021/cts.xml