Dedoc is a library (service) for automate documents parsing and bringing to a uniform format. It automatically extracts content, logical structure, tables, and meta information from textual electronic documents. (Parse document; Document content extraction; Logical structure extraction; PDF parser; Scanned document parser; DOCX parser; HTML parser
При прочтении следующего файла 2 — копия.docx
При прочтении второй и третьей строки, они отображается как bold:
Хотя они не является жирными в документе