OP(operator & open)是一个开源插件(类似大漠插件).主要功能有:Windows消息模拟,后台截图,找图,字符识别(OCR)等。使用c++编写,源代码可编译为32/64位dll.op插件提供了两类接口:1)原生c++接口,可以让c/c++开发者方便调用;2)com接口,支持大多数编译型语言(c++,c#,vb,delphi等 以及脚本语言(python,lua等)的调用
OP插件是为了满足Windows平台下各种自动化操作和图像处理的需求而开发的一个轻量级、高效、易用的工具。它可以帮助开发者和用户实现各种复杂的任务,例如模拟键鼠操作、后台截图、图像识别、文字识别等。它适用于各种场景,例如办公自动化、软件测试、数据采集、图像处理等。
字符识别(OCR)
传统识别算法:最大支持255 X 255 超大点阵,支持偏色,支持模糊识别,支持系统字库
内部接入主流 ocr引擎(例如google的tesseract),无需繁琐配置,一条命令即可完成识别
包含32位和64位插件,tool工具以及必要的第三方库等文件
下载地址:GitHub
op插件的demo及函数说明可从wiki获取
cd <path of op>
# 注册32位
regsvr32 op_x86.dll
# 注册64位
# regsvr32 op_x64.dll
python -m pip install pywin32
# import moudles 导入pywin32的 Dispatch 函数
from win32com.client import Dispatch
# create op instance 创建op对象
op=Dispatch("op.opsoft")
# print version of op 打印op插件的版本
print(op.Ver())
如果一切正常,将会输出
0.4.2.0
# 识别屏幕范围[0,0,2000,2000]内的文字
text = op.Ocr(0,0,2000,2000,"",0.8)
print("ocr:",text)
# 查找屏幕范围[0,0,2000,2000]内的图片"test.bmp"
ret,x,y = op.FindPic(0,0,2000,2000,"test.bmp","0f0f0f",1.0,0)
# 移动鼠标到(30,30)
op.MoveTo(30,30)
# 点击鼠标左键
op.LeftClick()
[1] TSPLUG源码,TC company
[2] Kiero