Dedoc is a library (service) for automate documents parsing and bringing to a uniform format. It automatically extracts content, logical structure, tables, and meta information from textual electronic documents. (Parse document; Document content extraction; Logical structure extraction; PDF parser; Scanned document parser; DOCX parser; HTML parser
Apache License 2.0
109
stars
15
forks
source link
TLDR-638 deleted table tasker and header footer tasker #438
Удалил TableTasker и HeaderFooterTasker и все упоминания о них
Для того, чтобы не было длинной цепочки наследования классов, удалил AbstractLineLableTasker и все упоминания о нём, всё его содержимое перенёс в LineLableTasker