Closed ValiullinAlbert closed 3 months ago
В docx нет четкого разделения на страницы - они меняются в зависимости от приложения, открывающего документ. На данный момент у всех строк docx документов page_id=0
, максимум, что можно сделать - это увеличивать page_id при разрыве страницы
Разрыв страницы в docx опционален, отсюда разрыв не совсем ложиться на логику страниц документа в целом. Это все же разные понятия разрыв страницы и страница.
Страницы документа формируются редакторами офисных форматов самостоятельно при рендеринге документа на экране. Отсюда количество страниц документа в одном редакторе ( например Microsoft word) будет отличаться от количества страниц этого же документа, но в другом редакторе (например libreoffice, WPS и т.д.)
В файлах docx у каждой строки page_id равен 0, например в приклепленном файле sample1.docx