hiroi-sora / Umi-OCR

OCR software, free and offline. 开源、免费的离线OCR软件。支持截屏/批量导入图片,PDF文档识别,排除水印/页眉页脚,扫描/生成二维码。内置多国语言库。
MIT License
24.51k stars 2.48k forks source link

Http接口如何调用识别pdf等文件呢? #397

Closed PlanckLength closed 1 month ago

PlanckLength commented 6 months ago

小白用户,pdf读取base64调用时出错,是不是pdf格式文件不能用base64?可以给个pdf调用例子吗?

hiroi-sora commented 6 months ago

嗯,当前版本HTTP接口暂不支持文档识别,待后续版本补充。

xjxqd commented 5 months ago

谢谢这个功能太需要了,坐等更新

iris2jane commented 5 months ago

能否支持识别pdf指定页码指定位置(矩形坐标)

hiroi-sora commented 5 months ago

pdf指定页码指定位置(矩形坐标)

理论上,指定页码是可以支持的,但指定坐标有点麻烦。

不过,预计接口的返回值里会包含坐标,调用方可以自己根据坐标过滤一下结果。

aceliuchanghong commented 4 months ago

QAQ,等大神更新*2

steven0081 commented 4 months ago

当前最新的2.1.1的版本支持HTTP接口了吗?

hiroi-sora commented 4 months ago

当前最新的2.1.1的版本支持HTTP接口了吗?

抱歉,还没,我最近比较忙。此外,这项工作的优先级不高,还有一些排在前面的开发计划等待处理。

dandaaan commented 4 months ago

急需这个功能

habacat commented 2 months ago

希望能够支持Linux版http接口pdf文档识别调用。想用自己的服务器搭建一个服务。

zhangwanshen commented 2 months ago

坐等大佬出http接口pdf文档识别❤

hiroi-sora commented 2 months ago

此功能开发中,将在下版本实现。

hiroi-sora commented 1 month ago

新的测试版已发布,支持 Linux 和 http PDF识别接口。

https://github.com/hiroi-sora/Umi-OCR/releases