faustedition / faust-gen-html

Pipelines to generate HTML for the Faust edition's reading texts and prints.
1 stars 4 forks source link

Lesetext validieren #455

Closed gerritbruening closed 6 years ago

gerritbruening commented 6 years ago

Muss kurz vor Übergabe noch mal drübergeschaut werden.

dietmarpravida commented 6 years ago

Ich sehe da (bei F-I) nur noch Meldungen, denen ich mit meinen Mitteln nicht mehr abhelfen zu können glaube

gerritbruening commented 6 years ago

@dietmarpravida, ich sehe jetzt noch das hier:

@n[replace]{insert}Vers
l2709aUnd hier!
l2709bUnd hier!
before_11350_aund dieund die

(also den oberen Fall) Wenn du nicht weiterweißt, @thvitt fragen. Mir ist der Fall nicht klar, denn der Eintrag wird ja eingefügt.

dietmarpravida commented 6 years ago

Ist das nicht auch in der Sonderdatei, wo war die nochmal?

Wo wird er eingefügt?

gerritbruening commented 6 years ago

https://github.com/faustedition/faust-gen-html/blob/master/text/app12norm_special-cases.xml#L45

gerritbruening commented 6 years ago

11350 ist F-II

Deswegen am Ende bitte nicht closen, sondern milestone auf msfaustii setzen.

dietmarpravida commented 6 years ago

Ich würde den langen Text gern für die Anmerkung aufheben und hier nur schreiben: 2709[]{} 2709] ein umbrochener Vers H5 S zwei Verse A B Ba [Typ 2a]

gerritbruening commented 6 years ago

OK, das hieße: https://github.com/faustedition/faust-gen-html/commit/ab269ea3486cc86e1e7fbd61d6cc7e641a9ed443 Die lange Version steht noch im grünen Kommentar.

dietmarpravida commented 6 years ago

danke, ich möchte im Apparat auf langen Text generell gern verzichten, wie ist das bei Faust II? (Nebenbei: Kann ich diesen Text eigentlich auch mal sehen?)

gerritbruening commented 6 years ago

Welchen Text? Den der Apparateinträge zum Faust II? Der steht in der letzten PDF, zumindest so halbwegs.

gerritbruening commented 6 years ago

@dietmarpravida, die Lesetextvalidierung gibt einige Meldungen des Typs WARNING:parse_readings: Failed to parse »Zimmer,« as lem aus. Da fehlt IMHO das none.

dietmarpravida commented 6 years ago

Was wird bei diesen Fällen gemacht? Faust II hat da wohl ganz ähnliche Meldungen.

852[]{} 852–859] Die Verse sind in allen Drucken nicht eingerückt; in faust://bibliography/Q wurden sie ebenso wie die Verse 949–980 eingerückt. [Typ 7]

948[]{} 948–980] nicht eingerückt A B Ba H1 C1 C3 eingerückt Q [Typ 7]

before_2366[]{} vor 2366–2377] Die Verse sind in S nicht enthalten. [Typ 7]

before_2392[]{=} vor 2390, 2390–2393] Die Bühnenanweisung und die vier nachfolgenden Verse sind in S nicht enthalten. [Typ 7]

before_2540_b[Die Hexe]{=} vor 2540] In S wird Die Hexe nicht als Sprecherangabe hervorgehoben. [Typ 7]

3095[Drum,]{=} 3095 Drum,] Das Komma fehlt in manchen Exemplaren von B, so auch in H1. [Typ 7]

3184[]{} 3184a–b] In H5 S A B Ba handelt es sich um zwei Verse, faust://bibliography/duentzer1882a#Düntzer und faust://bibliography/wa_I_14#Erich_Schmidt fassen sie zu einem antilabischen Vers zusammen. [Typ 3*]

3871[]{} 3871–3911] Die Verse stehen in H14 A B Ba H1 linksbündig, in C1 C3 sind sie eingerückt. [Typ 7]

3974[]{} 3974–3977] Die Verse sind in H14 A D1 B Ba H1 C1 C3 nicht eingerückt, in D2 faust://bibliography/D.3 faust://bibliography/D.4 sie auf derselben Höhe wie die Verse 3972–3973 eingerückt; in faust://bibliography/Q stehen 3972–3973 linksbündig, 3974–3977 sind eingerückt. [Typ 7]

3994[]{} 3994/3995] Die Repliken bilden in H14 A Ba einen antilabischen Vers, in B H1 C1 C3 sind es zwei Verse. [Typ 7]

dietmarpravida commented 6 years ago

Bei

INFO:parse_app2norm: Parsed: 3620[ich]{ich so} <i>3620</i>] so <i>1_H.5 1_H.12 fehlt A D.1</i> so <i>B B.a [type=2a Typ 4b]</i> WARNING:parse_readings: Failed to parse »« as lem

muss es eine andere Feherquelle sein?

Kodiert ist

3620[ich]{ich so} 3620 ſo] H5 H12 fehlt A D1 ſo B Ba [Typ 2a Typ 4b]

thvitt commented 6 years ago
dietmarpravida commented 6 years ago

danke, dann habe ich zwischenzeitlich getan, was in diesem Fall zu tun war

dietmarpravida commented 6 years ago

fehlendes none wohl nicht, es kommt hier ja keins; wohl ein Sonderfall, @gerritbruening

thvitt commented 6 years ago

damits als Lemma erkannt wird muss da eine Sigle stehen, und wenn’s none ist

gerritbruening commented 6 years ago

Ich würde sagen, dem Restbestand an Problemen wenden wir uns nach der baldigen Umstellung auf XML zu.

gerritbruening commented 6 years ago

Bleibt einzig noch das hier:

@n [replace] {insert} Vers
l2709a     Und hier!
l2709b     Und hier!

Ist hier was im XML zu fixen, @thvitt?

thvitt commented 6 years ago

Sieht das so aus wie es sollte? Dann ist das wohl ok und nur ein Artefakt der validierung

dietmarpravida commented 6 years ago

ja, sieht so aus, wie es sich gehört