wangwenhaoxiaotie / Document_classify

active learning, layoutlm
6 stars 2 forks source link
cv medical-receipt

Document_classify

描述:在保险理赔场景中,对不同类型医疗票据(费用清单、医疗发票等)按类别准确分类,使是后续进行理赔认定的关键。通过观察已有医疗票据的特征与打标数据分布,采用active learning增加监督数据,并利用图像特征与文本特征相结合的方式,实现当打标数据量较少时对医疗票据的高准确率分类。模型最终在各类票据上的平均分类准确率为97.2%

难点:

技术方案: