Closed saroulle closed 6 years ago
@saroulle pour le fichier 201021 le problème vient de la balise /num. Je précise que le titre apparait 2 fois dans le fichier teiHeader, donc il faut faire la correction 2 fois+ une fois dans le cts. Aussi, étant donné que ces informations sont issues du fichier csv, je vous propose de corriger le csv, car c'est le fichier source.
@vasaura Je crois que c'est une très bonne idée. En plus je crois qu'il faut faire la correction de csv pour ces trois titles.
J'ai fait les corrections des balises /num en /abbr dans les fichiers concernés. @vasaura @AnZadykhina en effet il faut mettre à jour le fichier csv.
@saroulle J'ai fait ces corrections dans nouveau pull request
Corrections des fichiers cts work et teiHeader créés automatiquement, suite aux tests Travis. Résultat des tests : data/pos2006/pos200604/cts.xml data/pos2006/pos200611/cts.xml data/pos2010/pos201021/cts.xml