wangwang-code / AutoX

A UiAutomator on android, does not need root access(安卓平台上的JavaScript自动化工具)
Other
10 stars 2 forks source link

关于OCR #14

Closed wangwang-code closed 2 years ago

ghost commented 2 years ago

@wangwang-code 更新了一下OCR的两个模型,看看效果如何

wangwang-code commented 2 years ago

@wangwang-code 更新了一下OCR的两个模型,看看效果如何

轻量的比标准的,纯文本上,轻量的380ms 标准的420ms,完整上,轻量的577ms,标准的657ms

ghost commented 2 years ago

轻量的比标准的,纯文本上,轻量的380ms 标准的420ms,完整上,轻量的577ms,标准的657ms

@wangwang-code 实战准确率有没有提高一些?如果识别用时差不多,那还不如都改用标准版,准确率上更有保证

wangwang-code commented 2 years ago

轻量的比标准的,纯文本上,轻量的380ms 标准的420ms,完整上,轻量的577ms,标准的657ms

@wangwang-code 实战准确率有没有提高一些?如果识别用时差不多,那还不如都改用标准版,准确率上更有保证

不清楚,目前我在训练我自己的模型

wangwang-code commented 2 years ago

轻量的比标准的,纯文本上,轻量的380ms 标准的420ms,完整上,轻量的577ms,标准的657ms

@wangwang-code 实战准确率有没有提高一些?如果识别用时差不多,那还不如都改用标准版,准确率上更有保证

不如用之前的,准确率没觉得提高,反而底了点,耗时也加了300ms左右

wangwang-code commented 2 years ago

不清楚,目前我在训练我自己的模型

我准备训练个水平文本识别的,即识别手机里浏览小说文字等等的,并且能识别出音标和一些生僻字(不强求

ghost commented 2 years ago

不如用之前的,准确率没觉得提高,反而底了点,耗时也加了300ms左右

可能和使用场景也有关系,针对特定需求,还是用自己训练的模型好,适用性更强。

wangwang-code commented 2 years ago

不如用之前的,准确率没觉得提高,反而底了点,耗时也加了300ms左右

可能和使用场景也有关系,针对特定需求,还是用自己训练的模型好,适用性更强。

妈妈米哦,弄了半天终于把一个用来测试练手的rec模型弄了出来,就差把它转成.nb的了,饭都没吃

ghost commented 2 years ago

太恶心人了,实在不想再与这个项目有任何的关系 AutoX 作者这是把我们这些尽心支持这个项目的用户和贡献者当成什么了? 就这样吧,实在不行还可以去用 Auto.js M

wangwang-code commented 2 years ago

太恶心人了,实在不想再与这个项目有任何的关系 AutoX 作者这是把我们这些尽力支持这个项目的用户和贡献者当成什么了? 就这样吧,实在不行还可以去用 Auto.js M

在这里插入图片描述

Auto.js M 没有打包功能就算了的,pro我会找些办法试试

ghost commented 2 years ago

Auto.js M 没有打包功能就算了的,pro我会找些办法试试

@wangwang-code pro不是有一些使用上的问题吗?没有打包功能对你来说也很不方便吧……算了,需要的话就继续用吧。当时对这个项目也倾注了很多精力,也就对这个项目多了几分关注。但AutoX作者现在这个态度,这也实在是让人无法接受的……

wangwang-code commented 2 years ago

@wangwang-code pro不是有一些使用上的问题吗?

对于pro8 有破解限制的代码

没有打包功能对你来说也很不方便吧……算了,那就继续用吧。

哪怕一个大大的运行按钮摆在面前,也有人不会用

当时对这个项目也倾注了很多精力,也就对这个项目多了几分关注。但AutoX作者现在这个态度,这也实在是让人无法接受的……

一个宏大的项目不是一个人能完成的,我写的脚本,某种意义上讲,叫改,这个脚本已经传了三个人了,我是第三位,当然,我毕业后也会撒手,至于会不会有人接,关心这个干嘛,填饱肚子才是正事

ghost commented 2 years ago

一个宏大的项目不是一个人能完成的,我写的脚本,某种意义上讲,叫改,这个脚本已经传了三个人了,我是第三位,当然,我毕业后也会撒手,至于会不会有人接,关心这个干嘛,填饱肚子才是正事

开源软件最大的优势不就是能聚集众人的力量共同维护和完善好一个项目吗?但就目前这个状况,参与贡献的开发者不仅完全没有什么保障,有的甚至连应有的尊重也得不到。是啊,那还关心那么多干嘛?反倒还可能害了自己。还是管好自己的正事最重要

wangwang-code commented 2 years ago

折腾了一天,就 弄出个 rec.nb 4MB 你说我图啥

ghost commented 2 years ago

折腾了一天,就 弄出个 rec.nb 4MB 你说我图啥

这个其实是专业问题,人工智能这一块算是比较有难度的,如果不是以后打算从事相关行业,那一般够用就好,否则有时可能白费很多精力还一无所得(尤其是在无人指导的情况下)

wangwang-code commented 2 years ago

折腾了一天,就 弄出个 rec.nb 4MB 你说我图啥

这个其实是专业问题,人工智能这一块算是比较有难度的,如果不是以后打算从事相关行业,那一般够用就好,否则有时可能白费很多精力还一无所得(尤其是在无人指导的情况下)

对我来说,现在的模型,不够用

wangwang-code commented 2 years ago

折腾了一天,就 弄出个 rec.nb 4MB 你说我图啥

这个其实是专业问题,人工智能这一块算是比较有难度的,如果不是以后打算从事相关行业,那一般够用就好,否则有时可能白费很多精力还一无所得(尤其是在无人指导的情况下)

最痛苦的是:编译一个opt编译了半天,然后,文档告诉我有现成的...

ghost commented 2 years ago

对我来说,现在的模型,不够用

有空尝试一下也行,只是要注意不要盲目尝试,动手前多了解一些相关知识,遇到困难时记得寻找帮助。OCR这个,百度应该有开设相关课程吧,也可以去看看学习一下

wangwang-code commented 2 years ago

有空尝试一下也行,只是要注意不要盲目尝试,动手前多了解一些相关知识,遇到困难时记得寻找帮助。OCR这个,百度应该有开设相关课程吧,也可以去看看学习一下

其实,早有预谋,从2022年的四月底,到现在,一个目标:训练出自己的模型,并应用于实战。现在离完成不远了

ghost commented 2 years ago

其实,早有预谋,从2022年的四月底,到现在,一个目标:训练出自己的模型,并应用于实战。现在离完成不远了

相当不错了。有机会也要了解一下相关的原理,要不有时出了错都不知道为什么,同时这也有助于你训练出更好的模型。

wangwang-code commented 2 years ago

相当不错了。有机会也要了解一下相关的原理,要不有时出了错都不知道为什么。

我也只不过是个应用者,对于底层的原理,那不是我要研究的东西(这些东西交给大学生研究生去搞,而我要做的是把它落地)

ghost commented 2 years ago

我也只不过是个应用者,对于底层的原理,那不是我要研究的东西(这些东西交给大学生研究生去搞,而我要做的是把它落地)

深入研究不现实,只是让你初步了解一下就可以了(程度相当于科普这一类的),这样遇到问题时也好有个方向,知道大概可能是哪一方面出了问题,不至于连该搜索什么都不清楚……

wangwang-code commented 2 years ago

深入研究不现实,只是让你初步了解一下就可以了,这样遇到问题时也好有个方向,知道大概可能是哪一方面出了问题,不至于连该搜索什么都不清楚……

希望有点的过高了

ghost commented 2 years ago

希望有点的过高了

@wangwang-code 不难的,相当于科普这一类的程度就行了

wangwang-code commented 2 years ago

目前来看,训练出问题了,不识别ABCD这些英文字母了

ghost commented 2 years ago

目前来看,训练出问题了,不识别ABCD这些英文字母了

那你有办法处理吗?或者,你知道是哪里出了问题吗?文档上有没有相关说明?

wangwang-code commented 2 years ago

那你有办法处理吗?或者,你知道是哪里出了问题吗?文档上有没有相关说明?

预训练模型==啥也没有,另外,配置文件也弄错了

wangwang-code commented 2 years ago

预训练模型==啥也没有,另外,配置文件也弄错了

这是我自己的理解,反正我训练出来的模型,它只能识别出我喂给它的数据,其他的就识别不出

比如: 我喂给它一个字 "汪" 那它只能识别出一个 "汪" 字,哪怕识别的图片里没有 “汪” 字

ghost commented 2 years ago

预训练模型==啥也没有,另外,配置文件也弄错了

做好准备工作很重要的,否则容易犯低级错误

wangwang-code commented 2 years ago

自己用预训练模型 训练出来的模型具有很强的针对性 另外,这是一次尝试,至于给它喂一大堆的数据,那我的设备是不行的 后续的训练得靠谷歌Colab的免费GPU了

做好准备工作很重要的,否则容易犯低级错误

wangwang-code commented 2 years ago

简单的讲,这是一次以学习和了解为目的的实践

wangwang-code commented 2 years ago

@LZX284 经过一周的观测和在不同设备上适配,目前发现个问题 一旦离开AutoX打包好的应用,在其他应用上进行OCR速度就变得奇慢无比,甚至在我的手机上也出现这个问题了 只有OCR变得很慢,缩放图片耗时都可以忽略不计

已经开启自启动、丢进游戏盒子、允许高耗能等等的

ghost commented 2 years ago

@LZX284 经过一周的观测和在不同设备上适配,目前发现个问题 一旦离开AutoX打包好的应用,在其他应用上进行OCR速度就变得奇慢无比,甚至在我的手机上也出现这个问题了 只有OCR变得很慢,缩放图片耗时都可以忽略不计

已经开启自启动、丢进游戏盒子、允许高耗能等等的

@wangwang-code 你现在还在用 AutoX 吗? Google paly版的 auto.JS PRO 现在应该可以用支付宝或微信支付了。 另外,最近这边也发生了很多事,实在是没有精力去处理这个项目的问题,,,抱歉了

wangwang-code commented 2 years ago

@LZX284 经过一周的观测和在不同设备上适配,目前发现个问题 一旦离开AutoX打包好的应用,在其他应用上进行OCR速度就变得奇慢无比,甚至在我的手机上也出现这个问题了 只有OCR变得很慢,缩放图片耗时都可以忽略不计 已经开启自启动、丢进游戏盒子、允许高耗能等等的

@wangwang-code 你现在还在用 AutoX 吗? Google paly版的 auto.JS PRO 现在应该可以用支付宝或微信支付了。 另外,最近这边也发生了很多事,实在是没有精力去处理这个项目的问题,,,抱歉了

仍然不支持 另外,尝试用java.lang.Thread创建子线程 在子线程里运行OCR识别可以缓解,但仍然很慢,考虑把校验去掉看看

ghost commented 2 years ago

仍然不支持 另外,尝试用java.lang.Thread创建子线程 在子线程里运行OCR识别可以缓解,但仍然很慢,考虑把校验去掉看看

@wangwang-code 顺便升级到V3版模型的OCR如何?

wangwang-code commented 2 years ago

仍然不支持 另外,尝试用java.lang.Thread创建子线程 在子线程里运行OCR识别可以缓解,但仍然很慢,考虑把校验去掉看看

@wangwang-code 顺便升级到V3版模型的OCR如何?

v3的效果我已经看过了,不行

ghost commented 2 years ago

v3的效果我已经看过了,不行

那不打包,直接主程序运行OCR不行吗?

wangwang-code commented 2 years ago

v3的效果我已经看过了,不行

那不打包,直接主程序运行OCR不行吗?

https://github.com/TonyJiangWJ/Auto.js/releases/tag/v4.1.22.0621.alpha 试过了,文字检测不行

ghost commented 2 years ago

那不打包,直接主程序运行OCR不行吗?

https://github.com/TonyJiangWJ/Auto.js/releases/tag/v4.1.22.0621.alpha 试过了,文字检测不行

AutoX的也不行吗?

wangwang-code commented 2 years ago

那不打包,直接主程序运行OCR不行吗?

https://github.com/TonyJiangWJ/Auto.js/releases/tag/v4.1.22.0621.alpha 试过了,文字检测不行

AutoX的也不行吗?

https://github.com/wangwang-code/AutoX ? 就是后台运行OCR速度不正常,很慢 (V2)

ghost commented 2 years ago

https://github.com/wangwang-code/AutoX ? 就是后台运行OCR速度不正常,很慢 (V2)

@wangwang-code 不知道你现在有空测试吗?如果有的话,这边打算去掉OCR校验、rhino1.7.13及TBS等一系列有潜在隐患的组件,你也顺便可以把Readme修正一下,如何?

wangwang-code commented 2 years ago

https://github.com/wangwang-code/AutoX ? 就是后台运行OCR速度不正常,很慢 (V2)

@wangwang-code 不知道你现在有空测试吗?如果有的话,这边打算去掉OCR校验、rhino1.7.13及TBS等一系列有潜在隐患的组件,你也顺便可以把Readme修正一下,如何?

有,暑假闲置在家

wangwang-code commented 2 years ago

还发现有些不可点击的控件是能click()点击的,但有概率点击无反应(无论失败与否

ghost commented 2 years ago

有,暑假闲置在家

稍等。 顺便提一个建议,现在这个项目算是以你为主的吧。这边也主要是不想与AutoX那边的关系搞得太僵,因为只有这样以后他们有代码改进时你才可以顺利拉取他们的代码(防止某些人在你拉取上游代码时设置障碍),而他们如果需要用到这边的代码的话,只要经过你的同意也可以自由引用,同时你也有权把赞助码放到AutoX里,不知道你觉得如何?

wangwang-code commented 2 years ago

有,暑假闲置在家

稍等。 顺便提一个建议,现在这个项目算是以你为主的吧。这边也主要是不想与AutoX那边的关系搞得太僵,因为只有这样以后他们有代码改进时你才可以顺利拉取他们的代码(防止某些人在你拉取上游代码时设置障碍),而他们如果需要用到这边的代码的话,只要经过你的同意也可以自由引用,同时你也有权把赞助码放到AutoX里,不知道你觉得如何?

这只是个满足个人需要的分支项目,比如我不想要控制台的输入框,那我就改xml砍掉它,没有别的

ghost commented 2 years ago

这只是个满足个人需要的分支项目,比如我不想要控制台的输入框,那我就改xml砍掉它,没有别的

@wangwang-code 那也行吧。这边把相关代码的处理都全部授权给你,以后如果你发现有这个需要时,也可以随时尝试使用这个建议。

ghost commented 2 years ago

@wangwang-code 5.X(dev)分支中的 Rhino 1.7.13处理起来有些麻烦,而且这个分支也落后不少了,没什么继续维护的价值,建议没有什么特殊需求的话,可以直接删除这个分支,这样也就不存在因为Rhino 1.7.13而违反开源协议的问题了

wangwang-code commented 2 years ago

rm

wangwang-code commented 2 years ago

@LZX284 注意更新了,记得pull

ghost commented 2 years ago

@LZX284 注意更新了,记得pull

已经出问题了。只能手动调整一下了