ruanyf / weekly

科技爱好者周刊,每周五发布
42.89k stars 2.69k forks source link

电子发票提取助手 #4605

Open zippo-zu opened 2 weeks ago

zippo-zu commented 2 weeks ago

由于工作的需求,企业报账报税,客户开过来的发票格式各异,然后报账的时候,又需要讲发票整理到一个excel中,于是常规的思路就是人工一张一张的手动录入,录入的工作又费时间,又没有什么技术含量。而且手动录入还经常会录入错误,基于以上的痛点,又随着电子发票时代的到来,电子发票已经成为主流趋势,以后纸质发票将会逐渐退出历史舞台。于是我分析电子发票的数据格式、存储格式,发票电子发票未来的交付形式将以pdf格式为主。 于是我就开发了一个基于pdf格式的电子发票的批量提取到excel的小工具,用户只需要将自己需要提取的电子发票打包成压缩包,一键提交给发票提取助手,发票提取助手就会返回一个excel表格,表格中包含了电子发票中的关键信息,发票号码、项目类目、税额、税率、价税合计等相关信息。这一工具大大提供了工作效率,以前需要几个小时的手动录入发票的工作,现在只需要几分钟就可以完成。是一个不错的提效小工具,欢迎大家试用。 https://airegex.cn/ 目前训练的发票样本有限,有些特殊格式的发票可能提取失败,提取失败的可以联系开发者,完善电子发票样本数据。在线发票提取工具,并没有做任何的存储发票的行为。所以你不用担心发票信息泄露,未来也不会去存储。都是基于二进制流实时处理,实时返回。所以一次不能支持大批量的发票提取,但是也足够用了。 在隐私数据和实用性上,只能这样做一个权衡了。

M69W commented 2 weeks ago

支持离线使用不?就是打开后对应的页面后断网使用

zippo-zu commented 2 weeks ago

支持离线使用不?就是打开后对应的页面后断网使用

不支持,但是网站本身没有做任何的存储逻辑,都是基于流的转换。担心隐私数据的问题的话,网站本身你不用担心。但是网络劫持这些的话,我觉得还好。

1night2zero commented 1 week ago

有开源仓库吗