trufanov-nok / scantailor-universal

ScanTailor Universal - a fork based on Enhanced+Featured+Master versions of ST
http://scantailor.org
Other
181 stars 16 forks source link

Ошибка в сортировке по ширине и высоте #129

Open imamzade opened 1 year ago

imamzade commented 1 year ago

Добрый день. Столкнулся с проблемой: При сортировке по возрастающей ширине в режиме Область контента страница находится не на последнем месте, тогда как в режиме Макетирование страницы она последняя, как страница с самой широкой полезной областью. 2023-05-22_23-58-25 scantailor-universal_2023-05-22_23-56-54

imamzade commented 1 year ago

Та же ситуация и при сортировке по высоте. Программа бывает пропускает пагинацию страниц и не впускает в полезную область (а мелкую точку видит и обязательно включит в область). Сортировка в режиме Области контента сломана. По превьюшкам справа видно, что области явно отличаются по высоте и размещены в разнобой, тогда как в режиме Макетирования все отлично. scantailor-universal_2023-05-23_00-04-19 scantailor-universal_2023-05-23_00-07-41

trufanov-nok commented 1 year ago

Добрый день, Скорее всего у вас страницы с разным DPI - это число пикселей на дюйм. Сортировка проходит по кол-ву пикселей по ширине/высоте. Т.е. если у вас одна и та же страница отсканирована в 300 и в 600 DPI, то та же самая область контента в втором случае будет в два раза шире (в пиксеях). Но на глаз вы этого не увидите, т.к. все изображения при отрисовке на экране масштабируются до заданных размеров. И увидите только при увеличении масштаба (zoom in) - на 600 dpi будет больше мелких деталей.

Значение DPI обычно зашивается в заголовок исходного файла изображения (png, tiff, jpg) программой, которая выполняет сканирование. Если его нет, Scan Tailer его предлагает указать вручную. Какие DPI каким страницам назначены можно увидеть в меню Инструменты/Исправить DPI.

Но менять DPI только чтобы побороть сортировку не нужно. В списке сортировок этапа Выбор зоны контента есть варианты сортировок по возрастающей логической ширине/высоте. Вот они - учитывают DPI страницы и сравнивают "логический размер изображения", т.е. его физическую ширину/высоту в миллиметрах, которая была бы при печати. Они показали бы что ширина/высота области контента одной и той же страницы, отсканированной в 300 dpi и 600 dpi - равны. Т.е. ими можно пользоваться всегда вместо обычных сортировок.

Программа бывает пропускает пагинацию страниц и не впускает в полезную область (а мелкую точку видит и обязательно включит в область).

Это известная проблема, которую я победить не могу - не знаю как, и не имею времени, чтобы серьезно заниматься проектом сейчас.