hasadna / standalone-tasks

standalone tasks
11 stars 2 forks source link

זיהוי צמדים בהודעות פטור #29

Open maryLoi opened 7 years ago

maryLoi commented 7 years ago

מבוא

יש לנו בסיס נתונים של "הודעות פטור ממכרז" של משרדי ממשלה, המפרט התקשרויות עם גופים חיצוניים בפטור ממכרז. הוא כולל הסבירים מדוע באותם מקרים אין צורך לצאת למכרז, מי הגוף שמתקשרים איתו ובאיזה סכום. אנחנו שואבים את המידע מתוך אתר מינהל הרכש הממשלתי. בסיס הנתונים הזה נמצא ברידאש ונקרא exemption.

הבעיה

בהודעות פטור מסוג: ספק יחיד, התקשרות עם ספק חוץ, והתקשרות למיזם משותף ללא כוונת רווח, ההתקשרות מדווחת בשתי רשומות נפרדות: ברשומה המוקדמת יותר - מדווחים על כוונת ההתקשרות (ואז נותנים לציבור זמן להגיש השגות). ברשומה הזאת סכום ההתקשרות יהיה 0 (כי ההתקשרות עדיין לא אושרה), והסטאטוס יהיה "טרום החלטת וועדה". ברשומה המאוחרת יותר - מדווחים על כך שההתקשרות אושרה, ואז גם יהיה כתוב סכום ההתקשרות. הסטאטוס יהיה "נרשם".

לדוגמא

כרגע, אין לנו סימון לכך שמדובר בצמדי רשומות. ככה זה נראה באתר שלנו:

image

יש כמה דרכים לזהות שמדובר בצמד:

המשימה

לכתוב אלגוריתם שמאפשר לזהות כמה שיותר צמדי רשומות, כדי שנוכל להציג אותם ביחד

oriash93 commented 6 years ago

האם מישהו עובד על זה?