siyuan-note / siyuan

A privacy-first, self-hosted, fully open source personal knowledge management software, written in typescript and golang.
https://b3log.org/siyuan
GNU Affero General Public License v3.0
23.03k stars 1.62k forks source link

图片 OCR #4624

Closed Geo123abc closed 2 years ago

Geo123abc commented 2 years ago

有些图片里面有文字,OCR之后存入到块属性里面,便于以后搜索

描述可能的最优解决方案 Describe the optimal solution

可以借助这个轮子 离线批量文字识别(图片转文字)软件 Umi-OCR v1.2.1
hiroi-sora/Umi-OCR: OCR离线批量图片文字识别软件,带界面。可排除视频图片中的水印、游戏图片中的UI等干扰,提取干净的文本。基于 PaddleOCR 。

感觉这个轮子很适合思源笔记,不知道可以不

88250 commented 2 years ago

感谢提议,但是这个项目似乎不是跨平台的,所以应该无法直接使用。

后续我们会考虑看是否还有适合的库来做这件事,也欢迎继续提供思路。先关闭了,谢谢。

Jack20152019 commented 2 years ago

天若ocr识别挺好的,不知道能不能整进去

lingr7 commented 2 years ago

这个是支持中文的,c++,源码级跨平台。https://github.com/DayBreak-u/chineseocr_lite/tree/onnx/cpp_projects/OcrLiteNcnn