hasadna / standalone-tasks

standalone tasks
11 stars 2 forks source link

לוודא שכל הנתונים (הנתמכים) מגיעים מממשק הנתונים החדש של הכנסת #40

Open OriHoch opened 6 years ago

OriHoch commented 6 years ago

מטרה

הכנסת שיחררו ממשק נתונים רשמי שמאפשר לקבל חלק גדול מהמידע

הממשק מכיל הן מידע חדש שלא היה ברשותינו עד כה וגם מידע קיים עם עדכונים / תוספות

צריך לוודא שכל הנתונים בפרוייקט כריית הנתונים של כנסת פתוחה מגיעים מהממשק החדש

מה צריך לעשות?

ידע נדרש

המשימה דורשת היכרות עם או רצון ללמוד עצמאית את הנושאים הבאים

הוראות מפורטות

התקנת סביבת העבודה והיכרות עם המערכת

בשלב זה נבצע התקנה ראשונית של סביבת העבודה ונריץ כמה תהליכי עיבוד שרלוונטיים למשימה לצורך היכרות עם המערכת

התקנת סביבת פיתוח והרצת בדיקות אוטומטיות

המשך הפיתוח

OrLeizerman commented 6 years ago

there's a lot of data that we don't import, should I open new issue for each one? also, I mapped where some of the description fields is located - Where can this be documented?

bills: KNS_Bill: 'PublicationSeriesFirstCallID' and 'PublicationSeriesFirstCallDesc[OL1]' - used to be, but they were removed. KNS_DocumentBill: new table to open

laws: KNS_IsraelLawMinistry: new table to open KNS_IsraelLawClassificiation: new table to open KNS_IsraelLawBinding: new table to open KNS_DocumentIsraelLaw: new table to open

Agendas: new subject to open + all the tables involved

Queries: new subject, but I think it's not relevant to us.

Plenum Sessions: new subject to open + all the tables involved

Supporting tables that in the document but not have pipeline: KNS_Faction KNS_Person KNS_Position KNS_PersonToPosition KNS_MkSiteCode KNS_KnessetDates KNS_GovMinistry KNS_ItemType KNS_Status

OriHoch commented 6 years ago

great! I think it's best to write everything in a single issue in hasadna/knesset-data-pipelines

OriHoch commented 6 years ago

this is very useful, thanks!

if you want you can choose something that is missing and add it..

basically, it's just yaml files, you can even edit them blindly, without testing

for example, all the code that is needed to load bills data is in this directory: https://github.com/hasadna/knesset-data-pipelines/tree/master/bills

so, if you want to add or fix something, feel free to edit the yaml file or add a new directory (you can even do it directly from github)