Sivan22 / otzaria

A modern app that brings the jewish library to every device
http://www.otzaria.org/
104 stars 17 forks source link

הגדרות ציון המקורות ב'איתור' #287

Closed Bshlomecha closed 1 month ago

Bshlomecha commented 2 months ago

האיתור הוא כלי שימושי מצויין ביותר [תרתי משמע..] אמנם נראה שהוא זקוק להגדרות יותר ממוקדות וממודרות על מנת לדייק את ההתאמה של ציוני המקורות לפי המבוקש.

אזכיר כמה אופנים מצויים:

א. לכלול צורות שונות של כיתוב ראוי שהמערכת תזהה צורות שונות של מיספור [מלבד מה שכבר הוזכר לגבי שמות הספרים],
כגון: כה עמוד ב / כה ע"ב / כה, ב / כה: ; (ואולי גם כל האופנים האלה כאשר מופיע כ"ה). וכמו כן סימן א סעיף א / סי' א סעי' א / ס"א. וכן ס"ק א / סק"א. וכן הלכה א / הל' א / ה"א.

[ואולי גם - עם גרשיים של ראשי תיבות ובלעדיהן, וכן לזהות שני גרשים [''] כמו גרשיים ["] !].

ב. זיהוי של ערכים עיקריים בציון מראי המקומות למשל כאשר כותבים 'פרק ג' - ראוי שהמערכת תקדם את הציונים הרלוונטיים [ואולי אפילו תשמיט את כל השאר !!], כגון אלו שרשום בהם 'פרק ג', ולא 'פרק כג', ולא 'פרק א משנה ג'. ובודאי שלא 'פרקי דר"א לג' או 'לפרקים סימן יג'.

זה עתה חיפשתי 'שבת לא' והביא לי גם את אלו:

  1. קובץ שיטות קמאי על תמיד לא , שמקורו מרבנו פרחיה על שבת.
  2. וגם ספר 'וביום השבת הלכות מלאכת בורר...
  3. וכן ספר חמדת ימים וכולי וכו' שבת וכו' וכו' שלא לעקור וכו' וכו'....
  4. ואפילו 'מלאכת מחשבת חלק א'. (זה כבר כשרון של המנגנון לערוך דילוגי אותיות ופרפראות לחכמה...).

ג. סידור הגיוני של המקורות המופיעים בתוצאות כדאי שהתוצאות תהיינה מסודרות [ואולי גם מחולקות למדורים] לפי דרגת ההתאמה שלהם לשאילתה, או לפי סדר כרונולוגי של הספרים [או לפי תיקיות המקור].

ד. מלבד זאת - בסוף הרשימה הופיעו כמה 'ציונים' שהם העתקות פיסקאות שלמות וארוכות מכמה ספרים, ולא הצלחתי למצוא בה בהגדרות גרם להם שיעלו. הנני מצרף צילו"ם.

איתור מקורות באוצריא

Refael11 commented 2 months ago

ממה שאני מבין חלק גדול מהבעיות אמורות להיפתר בגירסא הבאה

Sivan22 commented 1 month ago

מכיון שקשה מאד לערוך את כל האפשרויות הללו ידנית (כמו שאכן עשו בבר אילן) אז אני משתמש ב"מרחק לוינשטיין" שנגזר מכמות השינויים שצריך לעשות בתוצאה כדי להגיע לשאילתה. וכמובן שהמיון הוא לפי רמת ההתאמה. בגרסה הבאה יהיו בעזרת ה' גם שמות נרדפים לספרים (מתוך מאגר ספריא).

Bshlomecha commented 1 month ago

ייש"כ.

באמת בבר אילן [עכ"פ בגירסה החדשה] - הרשימה חולשת על אפשרויות רבות ומגוונות:

כתיב מלא וחסר: מידות מדות

שמות קרובים: פירוש המשנה [אבל לא 'פירוש המשניות'] - פיה"מ פיהמ"ש פיהמ פיהמש וכד'.

[וגם בלי ראשי תיבות שוע אוח מב וכיוצא באלו].

‫בתאריך שבת, 12 באוק׳ 2024 ב-22:37 מאת ‪Sivan Ratson‬‏ <‪ @.***‬‏>:‬

מכיון שקשה מאד לערוך את כל האפשרויות הללו ידנית (כמו שאכן עשו בבר אילן) אז אני משתמש ב"מרחק לוינשטיין" שנגזר מכמות השינויים שצריך לעשות בתוצאה כדי להגיע לשאילתה. וכמובן שהמיון הוא לפי רמת ההתאמה. בגרסה הבאה יהיו בעזרת ה' גם שמות נרדפים לספרים (מתוך מאגר ספריא).

— Reply to this email directly, view it on GitHub https://github.com/Sivan22/otzaria/issues/287#issuecomment-2408677796, or unsubscribe https://github.com/notifications/unsubscribe-auth/BHTMSK2KJX4MXIW5LSGFMLLZ3F26VAVCNFSM6AAAAABOZAU4CWVHI2DSMVQWIX3LMV43OSLTON2WKQ3PNVWWK3TUHMZDIMBYGY3TONZZGY . You are receiving this because you authored the thread.Message ID: @.***>