faustedition / faust-gen-html

Pipelines to generate HTML for the Faust edition's reading texts and prints.
1 stars 4 forks source link

Help: sp without pc at end #590

Closed gerritbruening closed 6 years ago

gerritbruening commented 6 years ago

@thvitt, könntest du mir einmal bei einer Suchanfrage in faust.xml helfen:

Gefunden werden sollen Fälle wie

                           <l n="11933">Werdet ihr schauen</l>
                        </lg>
                     </sp>

Gibt es da Mittel und Wege?

thvitt commented 6 years ago

was ist wenn das letzte Element der sp ein stage ist?

gerritbruening commented 6 years ago

Ich Eumel. Also dann müsste zur l oder p davor geschritten werden. Eigenlich sollte stage am Ende von sp nicht vorkommen, da du das vorher rausverlegst.

gerritbruening commented 6 years ago

Ach so, und der gute alte Whitespace:

                           <l n="11933">Werdet ihr schauen
                              </l>
                        </lg>
                     </sp>

und dergleichen wird auch gesucht.

thvitt commented 6 years ago

Ich würd das mitm XSLT lösen, z.B. dieses hier:

<?xml version="1.0" encoding="UTF-8"?>
<xsl:stylesheet xmlns:xsl="http://www.w3.org/1999/XSL/Transform"
  xmlns:xs="http://www.w3.org/2001/XMLSchema"
  xpath-default-namespace="http://www.tei-c.org/ns/1.0"
  exclude-result-prefixes="xs"
  version="2.0">

  <!-- Identitätstransformation ... -->
  <xsl:template match="node()|@*">
    <xsl:copy copy-namespaces="no">
      <xsl:apply-templates mode="#current" select="@*, node()"/>
    </xsl:copy>
  </xsl:template>

  <!-- Apparat raus -->
  <xsl:template match="note[@type='textcrit']"/>

  <!-- Terminale sp raus -->
  <xsl:template match="sp/stage[position()=last()]"/>

  <xsl:template match="/">
    <xsl:variable name="cleaned-text">
      <xsl:apply-templates/>
    </xsl:variable>

    <!-- letztes Element in sp, das nach whitespacenormalisierung auf buchstabe oder zahl (\w) endet: -->
    <xsl:for-each select="$cleaned-text//sp/*[position()=last()][matches(normalize-space(.), '\w$')]">
      <xsl:text>&#10;###########&#10;</xsl:text>
      <xsl:copy-of select="."/>
    </xsl:for-each>

  </xsl:template>

</xsl:stylesheet>

findet das hier:

###########
<lg xmlns:f="http://www.faustedition.net/ns" xmlns="http://www.tei-c.org/ns/1.0" rend="indented" org="uniform" sample="complete" part="N">
                                    <l n="5144" part="N">Mögen bunte Phantasien</l>
                                    <l n="5145" part="N">Für des Tages Mode blühen,</l>
                                    <l n="5146" part="N"><seg type="lem" xml:id="seg.5146.wunderseltsam" part="N">Wunderseltsam</seg> seyn gestaltet</l>
                                    <l n="5147" part="N">Wie Natur sich nie entfaltet;</l>
                                    <l n="5148" part="N">Grüne Stiele, goldne Glocken</l>
                                    <l n="5149" part="N">Blickt hervor aus reichen Locken! –</l>
                                    <l n="5150" xml:id="l_5150a" part="I">Doch wir</l>
                                </lg>
###########
<l xmlns:f="http://www.faustedition.net/ns" xmlns="http://www.tei-c.org/ns/1.0" n="6147" part="N">Von nun an trink ich doppelt bessre Flasche</l>
###########
<l xmlns:f="http://www.faustedition.net/ns" xmlns="http://www.tei-c.org/ns/1.0" n="6282" part="N">Die Brust erweitert hin zum großen Werke</l>
###########
<lg xmlns:f="http://www.faustedition.net/ns" xmlns="http://www.tei-c.org/ns/1.0" rend="indented" org="uniform" sample="complete" part="N">
                           <l n="11926" part="N">Hände verschlinget</l>
                           <l n="11927" part="N">Freudig zum Ringverein,</l>
                           <l n="11928" part="N">Regt euch und singet</l>
                           <l n="11929" part="N">Heilge Gefühle drein;</l>
                           <l n="11930" part="N">Göttlich belehret</l>
                           <l n="11931" part="N">Dürft ihr vertrauen,</l>
                           <l n="11932" part="N">Den ihr verehret</l>
                           <l n="11933" part="N">Werdet ihr schauen</l>
                        </lg>

auf faust.xml von gestern oder so

gerritbruening commented 6 years ago

Komisch:

                        <sp>
                           <speaker n="before_6147_a">Cämmerer</speaker>
                           <stage n="before_6147_b" rend="inline">annehmend</stage>
                           <l n="6147">Von nun an trink ich doppelt bessre Flasche</l>
                        </sp>

wurde nicht gefunden.

thvitt commented 6 years ago

vielleicht war das nicht in dem faust.xml das ich verwendet habe. Mit dem aktuellen Output des Builds bekomm ich die hier, da ist’s ja dabei:

<?xml version="1.0" encoding="UTF-8"?>
###########
<lg xmlns:f="http://www.faustedition.net/ns" xmlns="http://www.tei-c.org/ns/1.0" rend="indented">
                                    <l n="5144">Mögen bunte Phantasien</l>
                                    <l n="5145">Für des Tages Mode blühen,</l>
                                    <l n="5146"><seg type="lem" xml:id="seg.5146.wunderseltsam">Wunderseltsam</seg> seyn gestaltet</l>
                                    <l n="5147">Wie Natur sich nie entfaltet;</l>
                                    <l n="5148">Grüne Stiele, goldne Glocken</l>
                                    <l n="5149">Blickt hervor aus reichen Locken! –</l>
                                    <l n="5150" xml:id="l_5150a" part="I">Doch wir</l>
                                </lg>
###########
<l xmlns:f="http://www.faustedition.net/ns" xmlns="http://www.tei-c.org/ns/1.0" n="6147">Von nun an trink ich doppelt bessre Flasche</l>
###########
<l xmlns:f="http://www.faustedition.net/ns" xmlns="http://www.tei-c.org/ns/1.0" n="6282">Die Brust erweitert hin zum großen Werke</l>
gerritbruening commented 6 years ago

Seltsam. An dem Vers sollte sich seit vielen Jahren nichts verändert haben. Danke für 6282, ein wichtiger Fund!

thvitt commented 6 years ago

vielleicht war’s einfach zu spät? sowohl 6282 als auch 6147 sind auch schon in den Ergebnissen von gestern vormittag drin gewesen, vllt. ein wenig rechts weil der Oxygen-interne Saxon diese part-Attribute reingeklebt hat

gerritbruening commented 6 years ago

Alles klar, danke!