quadrama / DramaAnalysis

An R package for analysis of dramatic texts
GNU General Public License v3.0
15 stars 2 forks source link

GDC Reportdatei 11g5q.0 #80

Closed BenjaminKrautter closed 6 years ago

BenjaminKrautter commented 6 years ago

GDC ID: 11g5q.0 Textgrid ID: 11g9q.0

Faust I von Goethe lässt sich nicht mit report() öffnen.

Fehlermeldung: Quitting from lines 287-335 (Report.Rmd) Error in pm$matrix[, i + 1] : subscript out of bounds

nilsreiter commented 6 years ago

@BenjaminKrautter Hast Du bei GDC (report("gdc:11g5q.0")) und TG die gleiche Fehlermeldung?

BenjaminKrautter commented 6 years ago

@nilsreiter report("tg:11g9q.0") gibt die Fehlermeldung:

Quitting from lines 80-84 (Report.Rmd) Error in merge.data.table(fstat, characters, by.x = c("corpus", "drama", : Elements listed inby.ymust be valid column names in y. Quitting from lines 80-84 (Report.Rmd) Error during wrapup: cannot open the connection

nilsreiter commented 6 years ago

Es gibt in gdc:11g5q.0 und gdc:11g5q.0 keine Akt/Szenen-Einteilung. Ist das inhaltlich korrekt?

Zeilen 287-335 beziehen sich auf den Personalwechsel an Aktgrenzen, ist also nicht verwunderlich dass es da kracht.

BenjaminKrautter commented 6 years ago

Nein, das ist nicht korrekt. Mir scheint auch, dass große Teile des Dramas in der gdc-Datei fehlen.

nilsreiter commented 6 years ago

Aber in der TG-Datei sind sie da? Kannst Du benennen was fehlt (damit ich es suchen kann)?

BenjaminKrautter commented 6 years ago

Jetzt wo ich mir die Datei genauer anschaue, scheint mir eine Verwechslung bzw. Durchmischung der Dateien vorzuliegen.

Die als "Faust. Der Tragödie erster Teil" benannte xml Datei beinhaltet das "Vorspiel auf dem Theater", das als Vorspiel zum Fauststoff gehört. Deshalb wahrscheinlich auch die andere ID. Das Figurenverzeichnis allerdings müsste Faust I entstammen. Im "Vorspiel auf dem Theater" sprechen nur drei Figuren, das Verzeichnis listet aber geschätzt 70 auf.

Faust I scheint also einfach zu fehlen und das "Vorspiel auf dem Theater" scheint mindestens falsch benannt zu sein.

nilsreiter commented 6 years ago

Also, der Report sollte in Zukunft durchlaufen, aber bestimmte Teile weglassen.