Open OriHoch opened 6 years ago
there's a lot of data that we don't import, should I open new issue for each one? also, I mapped where some of the description fields is located - Where can this be documented?
bills: KNS_Bill: 'PublicationSeriesFirstCallID' and 'PublicationSeriesFirstCallDesc[OL1]' - used to be, but they were removed. KNS_DocumentBill: new table to open
laws: KNS_IsraelLawMinistry: new table to open KNS_IsraelLawClassificiation: new table to open KNS_IsraelLawBinding: new table to open KNS_DocumentIsraelLaw: new table to open
Agendas: new subject to open + all the tables involved
Queries: new subject, but I think it's not relevant to us.
Plenum Sessions: new subject to open + all the tables involved
Supporting tables that in the document but not have pipeline: KNS_Faction KNS_Person KNS_Position KNS_PersonToPosition KNS_MkSiteCode KNS_KnessetDates KNS_GovMinistry KNS_ItemType KNS_Status
great! I think it's best to write everything in a single issue in hasadna/knesset-data-pipelines
this is very useful, thanks!
if you want you can choose something that is missing and add it..
basically, it's just yaml files, you can even edit them blindly, without testing
for example, all the code that is needed to load bills data is in this directory: https://github.com/hasadna/knesset-data-pipelines/tree/master/bills
so, if you want to add or fix something, feel free to edit the yaml file or add a new directory (you can even do it directly from github)
מטרה
הכנסת שיחררו ממשק נתונים רשמי שמאפשר לקבל חלק גדול מהמידע
הממשק מכיל הן מידע חדש שלא היה ברשותינו עד כה וגם מידע קיים עם עדכונים / תוספות
צריך לוודא שכל הנתונים בפרוייקט כריית הנתונים של כנסת פתוחה מגיעים מהממשק החדש
מה צריך לעשות?
ידע נדרש
המשימה דורשת היכרות עם או רצון ללמוד עצמאית את הנושאים הבאים
הוראות מפורטות
התקנת סביבת העבודה והיכרות עם המערכת
בשלב זה נבצע התקנה ראשונית של סביבת העבודה ונריץ כמה תהליכי עיבוד שרלוונטיים למשימה לצורך היכרות עם המערכת
bin/start.sh
postgresql://postgres:123456@localhost:5432/postgres
bin/dpp.sh
bin/dpp.sh --help
bin/dpp.sh run ./committees/committees
committees-committees
DB tablepostgresql://postgres:123456@localhost:5432/postgres
and check the datadocker-compose exec app sh -c 'OVERRIDE_COMMITTEE_IDS=2,3 dpp run ./committees/committee-meetings'
committee-meetings
tabledocker-compose exec app sh -c 'OVERRIDE_COMMITTEE_IDS=2,3 dpp run ./committees/committee-meeting-protocols'
.data-docker/committee-meeting-protocols/
.data-docker/committee-meeting-protocols-parsed/
התקנת סביבת פיתוח והרצת בדיקות אוטומטיות
bin/install.sh
bin/test.sh
המשך הפיתוח