Open lhj5426 opened 2 weeks ago
虽然 麻烦不过训练完 效果也确实可以的 大部分拟声词 和错误识别 都可以过滤掉 大大减少了 手动修正的麻烦
确实,这个还是非常有趣的。既然软件自己都带完整的 pytorch 了其实可以直接软件内实现训练逻辑...
确实,这个还是非常有趣的。既然软件自己都带完整的 pytorch 了其实可以直接软件内实现训练逻辑...
希望能从被拟声词 和错误识别的支配下解脱出来哈哈
确实,这个还是非常有趣的。既然软件自己都带完整的 pytorch 了其实可以直接软件内实现训练逻辑...
Looks entertaining, just need to figure out how to use it
确实,这个还是非常有趣的。既然软件自己都带完整的 pytorch 了其实可以直接软件内实现训练逻辑...
希望能从被拟声词 和错误识别的支配下解脱出来哈哈
顺便也从字体突大里解脱
https://github.com/CVHub520/X-AnyLabeling![image](https://github.com/dmMaze/BallonsTranslator/assets/30548000/845049d2-5ff0-4f91-a1c4-d4c8bb213b3a)
现在软件自带的识别简直就是灾难![image](https://github.com/dmMaze/BallonsTranslator/assets/30548000/cfc233e5-ee67-46d6-aa1b-42e4e75213a6)
这是自己训练的摸模型![image](https://github.com/dmMaze/BallonsTranslator/assets/30548000/ff43acf0-de79-4264-99f1-21ca6a1e5d16)
自己训练的![image](https://github.com/dmMaze/BallonsTranslator/assets/30548000/a27e2705-e3f5-40e0-ac64-6c084b1bcaa7)
简单的场景都会这样![image](https://github.com/dmMaze/BallonsTranslator/assets/30548000/cc37eda6-dd79-462e-8262-b2d054cc4bb2)
自己训练的![image](https://github.com/dmMaze/BallonsTranslator/assets/30548000/e583fd9d-e1a5-458d-a3aa-dd0345bcf536)
这样的比比皆是
自己训练的
![image](https://github.com/dmMaze/BallonsTranslator/assets/30548000/5e34465b-6e05-4040-93e9-734584dde14c)
战斗场景 就不说了 更是重灾区
所以可以参考 https://github.com/CVHub520/X-AnyLabeling 这个模型推理 来 支持自定义模型吗 使用的 是 yoloV8 转换的 best.onnx best.pt 这种模型
因为很长时间 也看到 软件识别的改善 那么就只能换个思路了
随便跑一本漫画都要画大量的时间去处理每一页的拟声词 简直是够够了