dmMaze / BallonsTranslator

深度学习辅助漫画翻译工具, 支持一键机翻和简单的图像/文本编辑 | Yet another computer-aided comic/manga translation tool powered by deeplearning
GNU General Public License v3.0
2.25k stars 150 forks source link

可以参考这个增加自定义模型功能吗 #508

Open lhj5426 opened 2 weeks ago

lhj5426 commented 2 weeks ago

https://github.com/CVHub520/X-AnyLabeling image

现在软件自带的识别简直就是灾难 image

这是自己训练的摸模型 image

image 没有用的 都给识别上了

自己训练的 image

简单的场景都会这样 image

自己训练的 image

这样的比比皆是 image 自己训练的 image

战斗场景 就不说了 更是重灾区

所以可以参考 https://github.com/CVHub520/X-AnyLabeling 这个模型推理 来 支持自定义模型吗 使用的 是 yoloV8 转换的 best.onnx best.pt 这种模型

因为很长时间 也看到 软件识别的改善 那么就只能换个思路了

随便跑一本漫画都要画大量的时间去处理每一页的拟声词 简直是够够了

lhj5426 commented 2 weeks ago

虽然 麻烦不过训练完 效果也确实可以的 大部分拟声词 和错误识别 都可以过滤掉 大大减少了 手动修正的麻烦 image

image

image

image

image image

dmMaze commented 2 weeks ago

确实,这个还是非常有趣的。既然软件自己都带完整的 pytorch 了其实可以直接软件内实现训练逻辑...

lhj5426 commented 2 weeks ago

确实,这个还是非常有趣的。既然软件自己都带完整的 pytorch 了其实可以直接软件内实现训练逻辑...

希望能从被拟声词 和错误识别的支配下解脱出来哈哈

bropines commented 2 weeks ago

确实,这个还是非常有趣的。既然软件自己都带完整的 pytorch 了其实可以直接软件内实现训练逻辑...

Looks entertaining, just need to figure out how to use it

Raiter123 commented 2 weeks ago

确实,这个还是非常有趣的。既然软件自己都带完整的 pytorch 了其实可以直接软件内实现训练逻辑...

希望能从被拟声词 和错误识别的支配下解脱出来哈哈

顺便也从字体突大里解脱