hasadna / standalone-tasks

standalone tasks
11 stars 2 forks source link

פיתוח תהליך המרה לטקסט וחלוקה לדוברים עבור קבצי פרוטוקול ישנים של הכנסת #37

Closed OriHoch closed 6 years ago

OriHoch commented 6 years ago

מטרה

בפרוייקט כריית הנתונים על הכנסת (כנסת פתוחה) אנחנו מעבדים פרוטוקולים של הכנסת בפורמט וורד ומייצרים מהם שני קבצים - קובץ טקסט - שמכיל את הטקסט בלבד וקובץ טבלאי שמכיל את הפרוטוקול מחולק לדוברים.

אנו עושים זאת מצויין עבור ישיבות ועדה מהשנים האחרונות אבל ישנם גם פרוטוקולים ישנים יותר שאנחנו לא מעבדים.

מה צריך לעשות?

ידע נדרש

המשימה דורשת היכרות עם או רצון ללמוד עצמאית את הנושאים הבאים

הוראות מפורטות

התקנת סביבת העבודה והיכרות עם המערכת

בשלב זה נבצע התקנה ראשונית של סביבת העבודה ונריץ כמה תהליכי עיבוד שרלוונטיים למשימה לצורך היכרות עם המערכת

התקנת סביבת פיתוח והרצת בדיקות אוטומטיות

המשך הפיתוח

לחצו כאן לעבור להמשך הפיתוח במשימה הרלוונטית

OriHoch commented 6 years ago

done