obshtestvo / sledi-parlamenta

Надежден инструмент за справки и анализ на парламентарната активност
http://parliament.obshtestvo.bg/
The Unlicense
13 stars 3 forks source link

Консистентност на данните. #46

Open tsikov opened 10 years ago

tsikov commented 10 years ago

За съжаление данните на сайта на правителството са понякога грешни. Ето един пример:

screen shot 2014-04-30 at 17 28 33

Според този XML бившият депутат все още членува в групи за приятелство.

Това прави нашата работа много по-сложна. Ако не поправим тези грешки, нашият сайт също ще е подвеждащ. Поради това предлагам в това issue да събираме информация за подобни случаи. Там където можем да напишем програмки за оправяне на данни - нека да го сторим. (Например в конкретния случай може да сложим крайна дата на членството - последния ден на съответното народно събрание.) Във всички останали случаи (а също и ако информацията е крайно важна и не можем да се доверим на догатки) - може да поискаме информацията от информационно-административния център към Народното събрание или в краен случай - по ЗДОИ.

Списък на неконсистентности в правителствените данни:

Krastanov commented 10 years ago

Списък с други проблеми (относно предишното правителство)

https://github.com/Krastanov/parlamentaren-kontrol/blob/master/README.md#workarounds

tsikov commented 10 years ago

@Krastanov, много ти благодаря :) Мисля да не слагам втората точка, защото скриптът за депутати взима информация като минава id-тата от 1 до 2312. Поради това си мисля, че няма да имаме проблем. Засега на моята машина работи без засечки.

Krastanov commented 10 years ago

@jsibelius

Относно точка две, не знам дали ползвате ексел файловете с гласовете на депутатите за сега. Проблемът е там (поне за мен, поне преди година).

'МИХАИЛ ВЛАДИМИРОВ ВЛАДОВ' and 'НИКОЛАЙ НАНКОВ НАНКОВ' присъстват в ексел файловете с гласове (два или три файла) но ги няма в списъка с id-та.

Предполагам че когато почнете да ползвате ексел файловете или ще имате foreign key errors или просто базата данни няма да проверява за това и ще съдържа имена на хора сред гласуващите които не присъстват в таблицата с депутатите.

tsikov commented 10 years ago

Прав си! Сега видях, че нямам Михаил Владов и Николай Нанков в списъка с депутати :)

tsikov commented 10 years ago

Открих още едно. На 19ти, 20ти и 21ви 2014 февруари в списъците има само 238 или 239 депутата!

screen shot 2014-05-08 at 23 04 58

screen shot 2014-05-08 at 23 06 14

screen shot 2014-05-08 at 23 06 24

antitoxic commented 10 years ago

Това с липсващите депутати трябва да се логва с logger-a

yurukov commented 10 years ago

Ето тук съм споделил кода на моите скриптове за сваляне на данните. Свалям XML-ите и HTML-ите на повечето страници и ги обръщам после с XSL. Грешката, която направих е да пазя резултата в XML, а не в база данни. https://github.com/yurukov/Bulgarian-Parliament-Open-Data

Тук е целия портал: http://parliament.yurukov.net/

Проблемът е, че при малки промени в сайтовете им се чупят скрейпърите. От доста време не работят вече и не ми е останало време да ги оправя или пренапиша.