terratensor / kob-library-app

Поиск по толстым книгам ВП СССР
https://kob.svodd.ru
BSD 3-Clause "New" or "Revised" License
0 stars 0 forks source link

Поисковик по толстым книгам ВП СССР

Поиск реализуется внутри содержания отдельного параграфа, включая сноски, если они есть. Таким образом текстовый запрос в строке поиска служит цели найти наиболее подходящие под этот запрос параграфы. Рядом с кнопкой «поиск» есть кнопка опций, где можно выбрать режим и подключить «концептуальный словарь синонимов». Режимы поиска позволяют выбрать точное совпадение фразы в результатах (по соответствию фразе), появление хотя бы одного из слов запроса в параграфе (по совпадению слов), или найдя подходящий параграф, можно выбрать его номер и взяв соседние (отняв или добавив единицу), показать несколько параграфов подряд. Это удобно, если нужна более развёрнутая информация, но нет необходимости обращаться к целой книге.

Если цель поиска — найти книгу по искомому запросу, то для этой цели в выдаче к каждой цитате присоединяется название толстой книги, откуда она была получена. Поисковый запрос, к которому вы часто обращаетесь, можно сохранить при помощи кнопки «короткая ссылка» — в ней также сохраняется режим конкретного поиска. Режим «словаря концептуальных терминов» позволяет искать все синонимы (иногда антонимы) понятий, перечисленных в поисковой строке, так, при поиске «пфу» со включенным «концептуальным словарём» будут получены все связанные термины, например «полная функция управления» или «цели», однако если вы поищите «пфу» без словаря, результатом будет лишь единственный параграф, где понятие полной функции управления было обозначено аббревиатурой.

Пример одного из сценариев работы с поисковиком.

Представьте, что вам нужно найти в толстых книгах пару терминов, между которыми вы предполагаете существование какой-либо связи. Если вы воспользуетесь обычным поиском операционной системы или редактора файлов по тексту книги, вы можете найти книгу, содержащую искомые понятия, но это не означает, что в книге эти понятия будут связаны в рамках одной страницы текста или даже одной главы. Понятия просто могут присутствовать в совершенно раздельных частях текста, поскольку тексты толстых книг достаточно обширны и включают много понятий. Такие запросы практически бесполезны при использовании стандартных средств поиска по тексту книги в файле, поскольку в большинстве случаев стандартный поиск слеп к расстоянию между поисковыми словами. В нашем поисковике запрос ограничивается параграфами книг, поэтому поиск связи между понятиями намного эффективнее.

Вот примеры связок, которые будет сложно найти быстро без нашего поисковика:

«предиктор + пфу»
https://svodd.ru/exxyAS9p

«достоевский + магия»
https://svodd.ru/NYxu2lGg

«пушкин + масоны»
https://svodd.ru/hOJ0iS0u

Вопросы, предложения, замечания и найденные ошибки можно публиковать в этом обсуждении.