brown-uk / dict_uk

Project to generate POS tag dictionary for Ukrainian language
GNU General Public License v3.0
546 stars 71 forks source link

Стоп-слова "і" та "та" #305

Closed sergiig closed 2 years ago

sergiig commented 2 years ago

Вітання!

Прошу розглянути можливість розширити перелік стоп-слів для PostgreSQL словами "і" та "та".

Зараз ці слова сприймаються як звичайні. Наприклад:

select plainto_tsquery('ukrainian', 'Міністерство освіти і науки');

поверне

'міністерство' & ( 'освіта' | 'освітити' | 'освіта' ) & 'і' & 'наука'

Тобто для тексту "міністерство освіти і науки" повнотекстовий пошук за запитом "міністерство освіти та науки" не знайде нічого. Думаю є багато інших випадків де така поведінка буде небажаною.

arysin commented 2 years ago

Дякую, зроблено

sergiig commented 2 years ago

Дуже дякую, @arysin !