在看雪看到一篇文章:[原创]逆向调用QQ截图NT与WeChatOCR-软件逆向-看雪-安全社区|安全招聘|kanxue.com。里面说了怎么调用微信和QQ本地的OCR模型,还有很详细的分析过程。
我稍微看了下文章,多的也看不懂。大概流程是使用mmmojo.dll这个dll来与WeChatOCR.exe做通信的,也是用它来启动和关闭WeChatOCR.exe进程的。所以关键只需要知道这个dll里的导出函数怎么使用,就能自己实现调用OCR。并且可以脱离微信,不需要启动微信就能调用。既然这样,那完全可以使用Python加载mmmojo.dll启动WeChatOCR.exe并和它通信进行OCR识别。
代码怎么实现的就不多说的,感兴趣的可以看github的源码。我就说下有意思的一个技巧和一个踩坑的地方
OCR识别成功完成后会调用你给定的回调函数,并将结果作为参数传给回调函数。而其中一个回调函数的原型是static void OCRRemoteOnConnect(bool is_connected, void* user_data);
。第一个参数是当前连接状态,比较有意思的是第二个参数
第二个参数是你给定的一个指针,它可以通过SetMMMojoEnvironmentCallbacks
这个导出函数来设置,然后你就可以在回调函数里访问到这个指针。这个有什么用呢?就以上面github里的C++代码为例,代码里是将它设置为类的this指针,然后在建立连接后调用OCRRemoteOnConnect
回调函数时,通过这个this指针改变类变量m_connect_con_var,然后你才能调用DoOCRTask
,如果m_connect_con_var变量没有被设置,说明没有连接成功,就一直等待。
搜了一下,在Python里也可以实现这样一个操作,把这个值设置成Python类对象,然后就可以在回调函数访问这个类对象。原理大概像这篇文章:python - Back-casting a ctypes.py_object in a callback - Stack Overflow。先使用ctypes.py_object
将对象转化为一个PyObject指针传给c层,然后在回调函数里再通过ctypes.cast(context, py_object).value
得到这个对象,在这个项目里的代码如下:
调用dll时的参数不能直接用c_wchar_p
,需要先赋值给一个变量,不然会被垃圾回收机制给回收了。而且错误很难定位,不会报错,程序直接终止
另外还要注意的它的生命周期,和使用的时间。有些使用比较久的,你还得定义成全局变量或者赋值给self.
我已经发布到了pypi上,可以使用pip安装:pip install wechat-ocr
如果使用的是国内源,可能还没有更新,可以使用pip install wechat-ocr -i https://pypi.org/simple
来使用官方源安装
运行结果:
https://github.com/kanadeblisst00/wechat_ocr
SetMMMojoEnvironmentCallbacks(m_mmmojo_env_ptr,
0
, py_object(
self
))
def
OCRRemoteOnConnect(is_connected:c_bool, user_data:py_object):
print
(f
"OCRRemoteOnConnect 回调函数被调用, 参数, is_connected: {is_connected}"
)
if
user_data:
manager_obj:OcrManager
=
cast(user_data, py_object).value
manager_obj.SetConnectState(
True
)
SetMMMojoEnvironmentCallbacks(m_mmmojo_env_ptr,
0
, py_object(
self
))
def
OCRRemoteOnConnect(is_connected:c_bool, user_data:py_object):
print
(f
"OCRRemoteOnConnect 回调函数被调用, 参数, is_connected: {is_connected}"
)
if
user_data:
manager_obj:OcrManager
=
cast(user_data, py_object).value
manager_obj.SetConnectState(
True
)
SetMMMojoEnvironmentInitParams(m_mmmojo_env_ptr,
2
, c_wchar_p(m_exe_path))
c_m_exe_path
=
c_wchar_p(m_exe_path)
SetMMMojoEnvironmentInitParams(m_mmmojo_env_ptr,
2
, c_m_exe_path)
SetMMMojoEnvironmentInitParams(m_mmmojo_env_ptr,
2
, c_wchar_p(m_exe_path))
c_m_exe_path
=
c_wchar_p(m_exe_path)
SetMMMojoEnvironmentInitParams(m_mmmojo_env_ptr,
2
, c_m_exe_path)
import
os
import
json
import
time
from
wechat_ocr.ocr_manager
import
OcrManager, OCR_MAX_TASK_ID
wechat_ocr_dir
=
"C:\\Users\\Administrator\\AppData\\Roaming\\Tencent\\WeChat\\XPlugin\\Plugins\\WeChatOCR\\7057\\extracted\\WeChatOCR.exe"
wechat_dir
=
"D:\\GreenSoftware\\WeChat\\3.9.6.32"
def
ocr_result_callback(img_path:
str
, results:
dict
):
result_file
=
os.path.basename(img_path)
+
".json"
print
(f
"识别成功,img_path: {img_path}, result_file: {result_file}"
)
with
open
(result_file,
'w'
, encoding
=
'utf-8'
) as f:
f.write(json.dumps(results, ensure_ascii
=
False
, indent
=
2
))
def
main():
ocr_manager
=
OcrManager(wechat_dir)
ocr_manager.SetExePath(wechat_ocr_dir)
ocr_manager.SetUsrLibDir(wechat_dir)
ocr_manager.SetOcrResultCallback(ocr_result_callback)
ocr_manager.StartWeChatOCR()
ocr_manager.DoOCRTask(r
"T:\Code\WeChat\OCR\Python\img\1.png"
)
ocr_manager.DoOCRTask(r
"T:\Code\WeChat\OCR\Python\img\2.png"
)
ocr_manager.DoOCRTask(r
"T:\Code\WeChat\OCR\Python\img\3.png"
)
time.sleep(
1
)
while
ocr_manager.m_task_id.qsize() !
=
OCR_MAX_TASK_ID:
pass
ocr_manager.KillWeChatOCR()
if
__name__
=
=
"__main__"
:
main()
import
os
import
json
import
time
from
wechat_ocr.ocr_manager
import
OcrManager, OCR_MAX_TASK_ID
wechat_ocr_dir
=
"C:\\Users\\Administrator\\AppData\\Roaming\\Tencent\\WeChat\\XPlugin\\Plugins\\WeChatOCR\\7057\\extracted\\WeChatOCR.exe"
[招生]科锐逆向工程师培训(2024年11月15日实地,远程教学同时开班, 第51期)