Chartes-TNAH / theses

Positions des thèses de l’École des chartes
0 stars 2 forks source link

Proposition finale xml #21

Closed SybilleClochet closed 6 years ago

SybilleClochet commented 6 years ago

@saroulle : à toi de jouer pour le header :)) ! @vasaura @AnZadykhina @Verronmere : l'attribut "n" est sur 3 lettres pour l'intro ("int"), les sources ("src"), la conclusion ("ccl") et les annexes ("apx"). [https://drive.google.com/open?id=1kSKrdePKj5F1AZ7gBzessFxsagMmsnqB]

architexte commented 6 years ago

Idéalement, il faudrait suivre au plus près la sémantique proposée dans les guidelines

SybilleClochet commented 6 years ago

@architexte : est-ce le fait que l'attribut type des div intro, sources, conclusion et annexes soit une expression plutôt qu'un chiffre qui vous gêne ? Nous avons vu ce point hier en atelier pour XPath et capitains.

saroulle commented 6 years ago

@SybilleClochet Peux-tu adapter ta proposition avec cet auteur car l'exemple que tu as utilisé n'est pas dans notre corpus car il dépend de la promo 1999 ? Partons de cet auteur : Chevrant-Breton, Philippe (1972-...), promotion 2000 : https://www.idref.fr/14974983X

saroulle commented 6 years ago

J'ai fait un push d'un fichier complet xml avec la nouvelle structure : pos2000pos200010.xml (j'ai oublié le point dans le nommage du fichier, désolée), dans data/pos2000/pos200010/ créée sur la banche issue20 (#20 ). Le test Travis peut être fait sur ce fichier.

AnZadykhina commented 6 years ago

Si je comprends bien, XPath pour nos fichiers doit ressembler à cette modèle, mais je ne peux pas comprendre comment on doit nommer le premier niveau. J'ai choisi "part" mais je ne suis pas sûre que ce nom est correct.

<encodingdesc>
    <refsDecl n="CTS">
      <cRefPattern n="chapter"
        matchPattern="(\w+).(\w+)"
        replacementPattern="#xpath(/tei:TEI/tei:text/tei:body/tei:div[@n='$1']/tei:div[@n='$2'])">
        <p>This pointer pattern extracts part and chapter</p>
      </cRefPattern>
      <cRefPattern n="part?"
        matchPattern="(\w+)"
        replacementPattern="#xpath(/tei:TEI/tei:text/tei:body/tei:div[@n='$1'])">
        <p>This pointer pattern extracts part</p>
      </cRefPattern>
    </refsDecl>
  </encodingdesc>