babalae / better-genshin-impact

📦BetterGI · 更好的原神 - 自动拾取 | 自动剧情 | 全自动钓鱼(AI) | 全自动七圣召唤 | 自动伐木 | 自动刷本 - UI Automation Testing Tools For Genshin Impact
https://bgi.huiyadan.com/
GNU General Public License v3.0
3.58k stars 240 forks source link

我可以针对不同语言重新训练 OCR 吗? #380

Open tsupkasa opened 2 months ago

tsupkasa commented 2 months ago

我试图将你们的软件翻译成土耳其语,但我现在遇到了一些问题 我尤其在文本识别方面遇到问题。您使用的模型有土耳其语版本吗?或者我可以自己重新训练这个模型吗?因为当涉及到收集对象时,白名单/黑名单并不能完全识别它们。您能否提供有关您使用的文本识别模型的更多信息?

ab

bettergi

huiyadanli commented 2 months ago

巧合的是,我刚刚为自动拾取功能加上了引擎选择的功能

https://github.com/babalae/better-genshin-impact/commit/bcec9cfc6b294a063170196284cf4e0479d43206

分别是 PaddleOCRYap,两者都有对应的训练文档。

其中 PaddleOCR 本身支持英语识别,且已有现成的小语种模型,可以参考 多语言模型Multi-language model

如果你在游戏内需要识别的是英语的话,可能无需修改模型。如果需要使用其他模型,可以在此处添加模型:当前BetterGI使用的PaddleOCR的模型位置,并修改对应的加载模型代码 https://github.com/babalae/better-genshin-impact/blob/bcec9cfc6b294a063170196284cf4e0479d43206/BetterGenshinImpact/Core/Recognition/OCR/PaddleOcrService.cs#L26-L35