Pituchey-Hotam / Genizah

Automatically scan documents for Shemot and prevent printing Genizah
6 stars 2 forks source link

Improve search patterns #2

Open michael-3-141 opened 1 year ago

michael-3-141 commented 1 year ago

Currently, the add-in wrongly replaces names appearing as substrings of words. For example:

אלגוריתם אלפון אלון מיכאל שאלות פונקציונאלי שדין

Would all be wrongly replaced with:

-לגוריתם -לפון -לון מיכ-ל ש-לות פונקציונאץ-לי ש-דין

Matching whole words only would prevent this, but we would also need to add patterns for all variations of each name, eg:

אלהי אלהיך אלי אלהנו אלוהינו וכו'

Each one of these patterns will also need its own replacement pattern.

Word has a regex like pattern language that could be used with the existing search function, and could make it easier to create patterns matching all variations and combinations of כתיב מלא/חסר.

michael-3-141 commented 1 year ago

אם אנחנו עוברים מחיפוש של וורד לחיפוש מבוסס regex, לא אמור להיות מורכב מדי