opendatalab / magic-html

Apache License 2.0
276 stars 25 forks source link

magic-html 用了模型吗 #4

Closed hurrytospring closed 3 months ago

hurrytospring commented 4 months ago

这个仓库没用模型吧,看代码都是数据清洗。从magic-pdf和magic-doc 过来的,html现在有转md的实现吗

sixgad commented 4 months ago

@hurrytospring 目前没有使用模型,基于统计和规则,可以使用markdownify等开源库将html转为markdown。