clarin-eric / ParlaMint

ParlaMint: Comparable Parliamentary Corpora
https://clarin-eric.github.io/ParlaMint/
40 stars 53 forks source link

LT: problem with unidentified speakers #649

Open vaidasmo opened 1 year ago

vaidasmo commented 1 year ago

@TomazErjavec @matyaskopp we have an issue with speakers that are not identified (mostly, in the old debates). Below is a list, but just a few translations: Counter of votes; Voice from the floor; Unidentified MP; Visitor of the Seimas etc.

BALSŲ SKAIČIUOTOJAS BALSŲ SKAIČIUOTOJA BALSAS IŠ SALĖS BALSAI IŠ SALĖS TAS PATS BALSAS NEPRISISTATĘS SEIMO NARYS NEPRISISTAČIUSI SEIMO NARĖ TAS PATS SEIMO NARYS TA PATI SEIMO NARĖ TAS PATS DEPUTATAS TA PATI DEPUTATĖ NEPRISISTATĘS KALBĖTOJAS NEPRISISTAČIUSI KALBĖTOJA NEPRISISTATĘS DEPUTATAS NEPRISISTAČIUSI DEPUTATĖ SEIMO SVEČIAI GARSO ĮRAŠAS SKAUTAS SKAUTĖ SKAUTŲ ATSTOVAS SKAUTŲ ATSTOVAI SKAUTŲ ATSTOVĖ SKAUTIJOS ATSTOVAS SKAUTIJOS ATSTOVAI SKAUTIJOS ATSTOVĖ HARCERIŲ SĄJUNGOS ATSTOVAS HARCERIŲ SĄJUNGOS ATSTOVAI HARCERIŲ SĄJUNGOS ATSTOVĖ ATEITININKŲ ATSTOVAS ATEITININKŲ ATSTOVAI ATEITININKŲ ATSTOVĖ

How should we describe these speakers in the (https://clarin-eric.github.io/ParlaMint/#TEI.person) field and subfields ( (https://clarin-eric.github.io/ParlaMint/#TEI.persName) etc.)?

matyaskopp commented 1 year ago
TomazErjavec commented 1 year ago

As it is not sure LT will be ready for 3.0, setting this issue to 3.1 milestone.

TomazErjavec commented 10 months ago

Not ready for 3.1 either, so moving to future.