kokes / od

Česká otevřená data
Mozilla Public License 2.0
132 stars 16 forks source link

[steno] Ne všude naparsována osoba #86

Open kokes opened 5 years ago

kokes commented 5 years ago

Prohnat všechna CSV a zkoumat místa, kde autor není. Např. v 2017 exportu:

776    2017    NaN  ...  103. Odpovědi členů vlády na písemné interpelace   Děkuji. Vážený pane místopředsedo, vážená vlád...
863    2017    NaN  ...  7. Vládní návrh zákona o zpracování osobních ú...  Děkuji. Vážený pane místopředsedo, vážené paní...
865    2017    NaN  ...  7. Vládní návrh zákona o zpracování osobních ú...  Děkuji. V prvém čtení byl návrh zákona přiděle...
909    2017    NaN  ...                            104. Ústní interpelace   Děkuji. Vážený pane poslanče, k té vaší interp...
913    2017    NaN  ...                            104. Ústní interpelace   Děkuji. Tato podezření samozřejmě jsou. Já byc...
949    2017    NaN  ...                            104. Ústní interpelace   Děkuji. Vážený pane předsedající, vážený pane ...
953    2017    NaN  ...                            104. Ústní interpelace   Jak jsem slíbil, tak samozřejmě zadám svým spo...
kokes commented 5 years ago

Aha, tak to byl Hamáček (https://github.com/kokes/od/commit/28966b5b4d2771c8c58410a33ceb9cbacb7a2d93), ten zbytek jsou popisné texty (jsou v závorce). Tak by bylo fajn přidat nějaký runtime test, že když nemáme jméno osoby, tak text musí být v závorce (možná iff).

if v['autor'] is None and not v['text'].startswith('('):
    raise ValueError('nepodarilo se naparsovat...')