clarin-eric / ParlaMint

ParlaMint: Comparable Parliamentary Corpora
https://clarin-eric.github.io/ParlaMint/
50 stars 53 forks source link

FI Feedback #637

Open matyaskopp opened 1 year ago

matyaskopp commented 1 year ago

missing terms in data

According to wiki Finland has 4-year terms. So parliament organization should contain these events and meeting elements should refer to these events. Something like: (https://github.com/SemanticComputing/ParlaMint/blob/9409cc2b77ca36f6ac9be7e83cf9f5d917cf8714/Data/ParlaMint-FI/ParlaMint-FI.xml#L517-L559)

               <org ana="#parla.uni #parla.national"
                    role="parliament"
                    xml:id="fi_parliament">
                  <orgName full="yes" xml:lang="fi">Suomen eduskunta</orgName>
                  <orgName full="yes" xml:lang="en">Parliament of Finland</orgName>
                  <event from="1907-05-23">
                     <label xml:lang="en">existence</label>
                  </event>
                  <idno type="wikimedia" xml:lang="fi">https://fi.wikipedia.org/wiki/Eduskunta</idno>
                  <idno type="wikimedia" xml:lang="en">https://en.wikipedia.org/wiki/Parliament_of_Finland</idno>
                  <listEvent>
                     <head xml:lang="en">Legislative term</head>
                     <event from="2015-04-19" to="2019-04-13" xml:id="parl_term.37">
                        <label xml:lang="fi">Valtiopäivät 2015 (22.4.2015 - 1.2.2016)</label>
                        <label xml:lang="en">Parliamentary term 37 (19.4.2015 - 13.4.2019)</label>
                     </event>
<!-- ... -->
                  </listEvent>
               </org>

and corresponding meeting element should be (https://github.com/SemanticComputing/ParlaMint/blob/9409cc2b77ca36f6ac9be7e83cf9f5d917cf8714/Data/ParlaMint-FI/ParlaMint-FI.xml#L10-L12)

  <meeting ana="#parla.term #parla.uni #parl_term.37" n="37" corresp="#fi_parliament">37</meeting>

Component files meeting element

https://github.com/SemanticComputing/ParlaMint/blob/9409cc2b77ca36f6ac9be7e83cf9f5d917cf8714/Data/ParlaMint-FI/ParlaMint-FI_2015-05-22-ps-7.xml#L13-L15

            <meeting ana="#parla.uni #parla.sitting #parl_session.2015"
                     corresp="#fi_parliament"
                     n="7">Täysistunto 7</meeting>

should be fixed and extended in this way:

<!-- I don't understand Finnísh, but it seems that 2015 is session, 7 is meeting and 2015-05-22 is sitting day -->
<meeting ana="#parla.uni #parla.term #parl_term.37" corresp="#fi_parliament" n="37"><!-- ...TERM... --></meeting>
<meeting ana="#parla.uni #parla.session" corresp="#fi_parliament" n="2015"></meeting>
<meeting ana="#parla.uni #parla.meeting" corresp="#fi_parliament" n="7">Täysistunto 7</meeting>
<meeting ana="#parla.uni #parla.sitting" corresp="#fi_parliament" n="2015-05-22"><!-- --></meeting>

missing notes

https://www.eduskunta.fi/FI/vaski/PoytakirjaAsiakohta/Sivut/PTK_7+2015+2.aspx image

https://github.com/SemanticComputing/ParlaMint/blob/9409cc2b77ca36f6ac9be7e83cf9f5d917cf8714/Data/ParlaMint-FI/ParlaMint-FI_2015-05-22-ps-7.xml#L107-L112

            <u ana="#regular"
               who="#EskoKiviranta"
               xml:id="ParlaMint-FI_2015-05-22-ps-7.u2">
               <seg xml:id="ParlaMint-FI_2015-05-22-ps-7.seg2">Arvoisa puhemies! Käsittelyssä on eduskunnan ensimmäinen mietintö alkaneella vaalikaudella. Hallituksen esitys ei sisällöllisesti ole erityisen haastava. Siinä ehdotetaan muutettavaksi ulkomaalaislain 36 §:ää, jossa säädetään oleskeluluvan myöntämisen yleisistä edellytyksistä. Vielä tällä hetkellä on voimassa ulkomaalaislain 36 §:n 1 momenttiin vuodesta 2007 sisältynyt virke, jonka mukaan kansanterveyden vaarantaminen ei estä jatkoluvan myöntämistä, jos luvan myöntämisen edellytykset ovat muutoin olemassa. Kyseinen virke, joka siis sisältyy vielä voimassa olevaan lakiin, on pudonnut viime vaalikauden lopulla lainkohtaa uudistettaessa epähuomiossa pois lakiehdotuksesta. Tämä tarkoittamaton muutos on nyt tulossa voimaan lailla 507/2015 aivan lähiaikoina, tarkemmin sanottuna runsaan viikon päästä 1.6.2015.</seg>
               <seg xml:id="ParlaMint-FI_2015-05-22-ps-7.seg3">Kysymys on siis lakiin syntymässä olevan, puhtaasti teknisen virheen korjaamisesta. On toivottavaa ja suotavaa, että eduskunta omalta osaltaan hyväksymällä käsiteltävänä olevan lakiehdotuksen pitää huolta siitä, että oikeusjärjestys on siinä muodossa kuin on tarkoitettu. Hallintovaliokunta on kuullut esityksen johdosta asiantuntijoita, käynyt keskustelun ja päättänyt yksimielisesti puoltaa hallituksen esityksen hyväksymistä muuttamattomana.</seg>
            </u>

should be:


<note>Keskustelu</note>
<note type="time">13.16</note>
<note type="speaker">Esko Kiviranta kesk (esittelypuheenvuoro):</note>
            <u ana="#regular"
               who="#EskoKiviranta"
               xml:id="ParlaMint-FI_2015-05-22-ps-7.u2">
               <seg xml:id="ParlaMint-FI_2015-05-22-ps-7.seg2">Arvoisa puhemies! Käsittelyssä on eduskunnan ensimmäinen mietintö alkaneella vaalikaudella. Hallituksen esitys ei sisällöllisesti ole erityisen haastava. Siinä ehdotetaan muutettavaksi ulkomaalaislain 36 §:ää, jossa säädetään oleskeluluvan myöntämisen yleisistä edellytyksistä. Vielä tällä hetkellä on voimassa ulkomaalaislain 36 §:n 1 momenttiin vuodesta 2007 sisältynyt virke, jonka mukaan kansanterveyden vaarantaminen ei estä jatkoluvan myöntämistä, jos luvan myöntämisen edellytykset ovat muutoin olemassa. Kyseinen virke, joka siis sisältyy vielä voimassa olevaan lakiin, on pudonnut viime vaalikauden lopulla lainkohtaa uudistettaessa epähuomiossa pois lakiehdotuksesta. Tämä tarkoittamaton muutos on nyt tulossa voimaan lailla 507/2015 aivan lähiaikoina, tarkemmin sanottuna runsaan viikon päästä 1.6.2015.</seg>
               <seg xml:id="ParlaMint-FI_2015-05-22-ps-7.seg3">Kysymys on siis lakiin syntymässä olevan, puhtaasti teknisen virheen korjaamisesta. On toivottavaa ja suotavaa, että eduskunta omalta osaltaan hyväksymällä käsiteltävänä olevan lakiehdotuksen pitää huolta siitä, että oikeusjärjestys on siinä muodossa kuin on tarkoitettu. Hallintovaliokunta on kuullut esityksen johdosta asiantuntijoita, käynyt keskustelun ja päättänyt yksimielisesti puoltaa hallituksen esityksen hyväksymistä muuttamattomana.</seg>
            </u>

Different content in TEI and TEI.ana versions

I checked the number of <vocal> elements in ParlaMint-FI_2015-05-22-ps-7.ana.xml (cnt=1) and ParlaMint-FI_2015-05-22-ps-7.xml (cnt=3)

missing annotation when notes or interruptions

I guess this can be related to the previous issue.

missing join="right"

When space is not present after token (<w>/<pc>) attrinute join="right" is required.

additional | character

<pc xml:id="ParlaMint-FI_2015-05-22-ps-7.seg24.7.157" msd="UPosTag=PUNCT|">.</ns0:pc>

should be

<pc xml:id="ParlaMint-FI_2015-05-22-ps-7.seg24.7.157" msd="UPosTag=PUNCT">.</pc>

to date before from date

https://github.com/SemanticComputing/ParlaMint/blob/9409cc2b77ca36f6ac9be7e83cf9f5d917cf8714/Data/ParlaMint-FI/ParlaMint-FI.xml#L582-L584

                  <event from="2018-12-06" to="2018-06-17">
                     <label xml:lang="en">existence</label>
                  </event>

Suspiciously short life of parliamentary groups

https://github.com/SemanticComputing/ParlaMint/blob/9409cc2b77ca36f6ac9be7e83cf9f5d917cf8714/Data/ParlaMint-FI/ParlaMint-FI.xml#L564

                  <event from="2020-06-05" to="2020-06-09">
                     <label xml:lang="en">existence</label>
                  </event>
TomazErjavec commented 1 year ago

As not sure FI will be available for 3.0, setting this to 3.1 milestone. If done before that is of course great.

yoge1 commented 1 year ago

additional | character

Task done in https://github.com/clarin-eric/ParlaMint/pull/564/commits/f477b8166e8c78ed08805b6d911c368edcf414e9

yoge1 commented 1 year ago

missing join="right"

Task done in https://github.com/clarin-eric/ParlaMint/pull/564/commits/a084340121964303802337bd105fc54ef113756a

yoge1 commented 1 year ago

missing terms in data

Component files meeting element

Tasks under both headings done in https://github.com/clarin-eric/ParlaMint/pull/564/commits/7c539a73bc148c80b85242dd6837cb2038ee1216

@matyaskopp Now we have in tei corpus root file information on parliamentary terms/legislative periods/electoral terms instead of parliamentary sessions (which we previously had). Note that we don't have full coverage for the latter 4-year term 2019 (-2023), so I hope it's not misleading to have a meeting element for that term in the corpus root file (we have full coverage for the parliamentary sessions we previously had as meeting elements).

yoge1 commented 1 year ago

to date before from date

Task done in https://github.com/clarin-eric/ParlaMint/pull/564/commits/6682e6493ec7b0effb2d08bb1bc9363416dd8e66

yoge1 commented 1 year ago

Suspiciously short life of parliamentary groups

For the particular parliamentary group example you provided, the lifetime is valid (it comes straight from Parliament of Finland's open data service). https://github.com/SemanticComputing/ParlaMint/blob/9409cc2b77ca36f6ac9be7e83cf9f5d917cf8714/Data/ParlaMint-FI/ParlaMint-FI.xml#L564

yoge1 commented 1 year ago

Different content in TEI and TEI.ana versions

Fix (not 100%) for aligning TEI and TEI.ana segments in https://github.com/clarin-eric/ParlaMint/pull/564/commits/f613e61dd3f67a17efc2ad08b1aa2bbd18f5ddbb

TomazErjavec commented 1 year ago

What is to happen with this feedback? Close it? Move it to Future?

TomazErjavec commented 1 year ago

No comment on my comment. Moving this to Future.