arkohut / pensieve

A passive recording project allows you to have complete control over your data. Automatically take screenshots of all your screens, index them, and save them locally.
Apache License 2.0
1.03k stars 45 forks source link

希望增加开关,允许对每张图片都进行 OCR #30

Open zj1123581321 opened 6 days ago

zj1123581321 commented 6 days ago

当前版本 v0.20.0

观察下来当下似乎只有画面变动比较大的时候,才会调用 ocr+ vlm 提取图片中的信息。 vlm 非常消耗资源,这个逻辑可以理解。

但 ocr 在现代的设备上占用资源应该没那么高,能否允许用户自行决定是否对每一张图片都进行离线 ocr?或者设定一定的相似度阈值也可以。


典型场景就是:我回溯网页、文档,可能只记得一个关键词,这个时候需要有 ocr 的信息才能搜索到这张图片。

arkohut commented 6 days ago

这个可以有。我应该会通过 config.yaml 中额外的配置实现这个功能。