Closed Bshlomecha closed 1 month ago
ממה שאני מבין חלק גדול מהבעיות אמורות להיפתר בגירסא הבאה
מכיון שקשה מאד לערוך את כל האפשרויות הללו ידנית (כמו שאכן עשו בבר אילן) אז אני משתמש ב"מרחק לוינשטיין" שנגזר מכמות השינויים שצריך לעשות בתוצאה כדי להגיע לשאילתה. וכמובן שהמיון הוא לפי רמת ההתאמה. בגרסה הבאה יהיו בעזרת ה' גם שמות נרדפים לספרים (מתוך מאגר ספריא).
ייש"כ.
באמת בבר אילן [עכ"פ בגירסה החדשה] - הרשימה חולשת על אפשרויות רבות ומגוונות:
כתיב מלא וחסר: מידות מדות
שמות קרובים: פירוש המשנה [אבל לא 'פירוש המשניות'] - פיה"מ פיהמ"ש פיהמ פיהמש וכד'.
[וגם בלי ראשי תיבות שוע אוח מב וכיוצא באלו].
בתאריך שבת, 12 באוק׳ 2024 ב-22:37 מאת Sivan Ratson < @.***>:
מכיון שקשה מאד לערוך את כל האפשרויות הללו ידנית (כמו שאכן עשו בבר אילן) אז אני משתמש ב"מרחק לוינשטיין" שנגזר מכמות השינויים שצריך לעשות בתוצאה כדי להגיע לשאילתה. וכמובן שהמיון הוא לפי רמת ההתאמה. בגרסה הבאה יהיו בעזרת ה' גם שמות נרדפים לספרים (מתוך מאגר ספריא).
— Reply to this email directly, view it on GitHub https://github.com/Sivan22/otzaria/issues/287#issuecomment-2408677796, or unsubscribe https://github.com/notifications/unsubscribe-auth/BHTMSK2KJX4MXIW5LSGFMLLZ3F26VAVCNFSM6AAAAABOZAU4CWVHI2DSMVQWIX3LMV43OSLTON2WKQ3PNVWWK3TUHMZDIMBYGY3TONZZGY . You are receiving this because you authored the thread.Message ID: @.***>
האיתור הוא כלי שימושי מצויין ביותר [תרתי משמע..] אמנם נראה שהוא זקוק להגדרות יותר ממוקדות וממודרות על מנת לדייק את ההתאמה של ציוני המקורות לפי המבוקש.
אזכיר כמה אופנים מצויים:
א. לכלול צורות שונות של כיתוב ראוי שהמערכת תזהה צורות שונות של מיספור [מלבד מה שכבר הוזכר לגבי שמות הספרים],
כגון: כה עמוד ב / כה ע"ב / כה, ב / כה: ; (ואולי גם כל האופנים האלה כאשר מופיע כ"ה). וכמו כן סימן א סעיף א / סי' א סעי' א / ס"א. וכן ס"ק א / סק"א. וכן הלכה א / הל' א / ה"א.
[ואולי גם - עם גרשיים של ראשי תיבות ובלעדיהן, וכן לזהות שני גרשים [''] כמו גרשיים ["] !].
ב. זיהוי של ערכים עיקריים בציון מראי המקומות למשל כאשר כותבים 'פרק ג' - ראוי שהמערכת תקדם את הציונים הרלוונטיים [ואולי אפילו תשמיט את כל השאר !!], כגון אלו שרשום בהם 'פרק ג', ולא 'פרק כג', ולא 'פרק א משנה ג'. ובודאי שלא 'פרקי דר"א לג' או 'לפרקים סימן יג'.
זה עתה חיפשתי 'שבת לא' והביא לי גם את אלו:
ג. סידור הגיוני של המקורות המופיעים בתוצאות כדאי שהתוצאות תהיינה מסודרות [ואולי גם מחולקות למדורים] לפי דרגת ההתאמה שלהם לשאילתה, או לפי סדר כרונולוגי של הספרים [או לפי תיקיות המקור].
ד. מלבד זאת - בסוף הרשימה הופיעו כמה 'ציונים' שהם העתקות פיסקאות שלמות וארוכות מכמה ספרים, ולא הצלחתי למצוא בה בהגדרות גרם להם שיעלו. הנני מצרף צילו"ם.