首页
社区
课程
招聘
[原创]逆向调用QQ截图NT与WeChatOCR
发表于: 2023-7-26 13:07 38186

[原创]逆向调用QQ截图NT与WeChatOCR

2023-7-26 13:07
38186

已逆出64位的QQ Mojo Ipc通信过程, 请点击下方链接下载QQImpl项目, 此项目将QQ的Mojo Ipc和WeChatOCR独立了出来, 可以在任何项目中使用:
https://github.com/EEEEhex/QQImpl

采用QQImpl的成品在下方链接下载:
链接:QQScreenShotNT-Plus
提取码:ctjs

QQ出Electron版了, 将截图独立出来了(应该是个过渡, 之后感觉会采用Electron重写), 并且使用的OCR改成了TencentOCR(低版本的WeChatOCR)

本文将重点介绍如何逆向调用WeChatOCR

先把QQ运行起来, 看看QQ NT的截图是什么情况的:
QQRUN
注意到 有一个--pcqq-platform-channel-handle的命令行参数, 并且存在一个有mojo字样的命名管道
那就搜索一下, 可以在 这篇文章 里发现, mojo是Chrome实现的一套IPC机制, 并且想要简单使用的话, mojo IPC有一套Invitation机制。
Invitation简单来说就是创建子进程, 并给它传命令行--mojo-platform-channel-handle=xxx。
显然QQ就是从这个基础上改了一个命令行参数, 本质就是采用Mojo IPC进行通信。
那就开逆! (一开始分析的是QQNT 64位版本的, 后面为了方便分析用的是9.9.0.14619 x86版本的, 可能地址会变化)

先从被调用端分析, 直接分析QQ太大了, 先小看一下main函数:
QQScreenShot_main
这个main函数跟我以前逆的结果差不多哇, 总的来说就是启动QQ截图的环境, 图上画框的函数是启动IPC的, 进去看看:
childipc_start
还是COM的形式, 这里碍于篇幅不再介绍child ipc的过程, 直接看parent ipc的过程
(其实可以发现parent-ipc-core-x86.dll和child-ipc-core-x86.dll是同一个代码编译的DLL)

既然QQScreenshot是通过加载child-ipc-core-x86.dll再通过DllGetClassObject获取COM对象.
那QQ也很有可能是通过加载parent-ipc-core再动态获取COM对象实现的

那就动调一下QQ.exe, 搜索一下这种情况的代码:

定位到DllGetClassObject字符串:
wrapper_init_ipc
可以看到和QQScreenshot.exe里初始化IPC的过程一模一样, 从parent-ipc-core-x86.dll中获取了一个COM对象
看一下这个COM对象的实现了哪些方法:
parent_ipc_vtable
前三个函数是实现的IUnknown接口不用管, 其他的方法都可以通过字符串猜出来, 只要确定他们的参数类型就好了, 这里碍于篇幅省略掉(动调能直接看出来)
只介绍一下pCOM->LaunchChildProcess(...)方法:

通过动调可以发现LaunchChildProcess方法的第5个参数是用来设置接收IPC MSG函数的

在LaunchChildProcess方法里, 会调用base::Thread::task_runner新起一个线程来创建截图子进程↓
LaunchChildProcess

怎么确定的这些函数呢?, 因为新版QQ本身就是一个Chrome嘛, 直接通过字符串去搜Chrome的源代码就OK了。
下面进LaunchQQScreenShot函数看看:
LaunchQQScreenShot
整个函数完全就是参考文章[1]里面介绍的Invitation机制。
这个函数其实是LaunchChildProcessInternal, 是LaunchChildProcess的内部函数,用来创建子进程:

而LaunchChildProcess的最后一个参数是接收IPC消息回调函数的第一个参数。
之后就是仿写一遍就能调用了, 详细信息还是请见QQImpl64.cpp:
code

QQ采用的TencetnOCR就是低版本的WeChatOCR, 他们也是采用Mojo IPC进行通信

通过 这篇文章 可以知道, 在Mojo中要想调用其他服务要通过Services Manager的转发, 也就是说QQScreenshot.exe是ServiceA, TencentOCR.exe是Service B, QQ.exe则是Service Manager(我猜的, 对不对也无伤大雅):
mojo_service

那想要分析OCR调用过程就不得不用IDA分析一下wrapper.node了(QQ的一个DLL, 主要逻辑都在这个DLL里)

通过搜索字符串可以发现很多个感兴趣的:
ocr_string
直接进DoOCRTask函数看看:
在DoOCRTask函数里进行了OCR的初始化以及OCR任务的发送, 即OCRdoInit和SendOCRTask函数
DoOCRTask
那我们需要分析一下是怎么实现的, 毕竟过程是QQScreenshot把IPC消息发给了我们的程序, 我们的程序要去调用OCR

首先初始化了TencentOCR.exe和mmmojo.dll的路径, 并很明显赋值给了一个类的成员变量:
OCRdoInit_path
之后就是进行了Mojo环境的初始化:在这里设置了命令行参数与回调函数
OCRdoInit_mmmojo
其中(*v11+4)这个函数是这样的:
mmmojo_func
就是获取mmmojo.dll的导出函数并保存起来供后面调用
在SetMMMojoEnvironmentCallbacks函数里设置了接收IPC消息的函数这个后面分析

在SendOCRTask函数里调用了很多方法, 一开始确实看蒙了, 但是通过后面分析可以发现其实逻辑很简单
IPB_CPB
函数一开始初始化了一些IPbMsg, CPbMsg什么的类, 一开始确实分析不出来这是啥玩意儿, 难不成为了给OCR发个IPC消息还得自己去实现这么多类? 那工作量可太大了(但其实不用, 通过后面的分析就会豁然开朗)
SendOCRTask
之后SendOCRTask函数调用CreateMMMojoWriteInfo创建了一个write_info这个write_info具体是啥现在也是不清楚, 然后拿到了WriteInfoRequest, 并调用memmove往里写东西, 最后调用了SendMMMojoWriteInfo发送出去, 那我们看看往里写了啥:
write_info
wow 龙头出来了! 发现图片路径了, 但问题是前八个字节是啥?
先不管了 既然发送函数分析不出来那就先去看接收IPC MSG的函数

通过分析SetMMMojoEnvironmentCallbacks的参数, 可以发现, 它设置的回调函数是一个虚表里的函数:
vTable_OCRMANAGER
看看OnReadPush:
OnReadPush
在这个函数里发现了protobuf的字样! (具体在哪发现的我忘了,反正确实有)
我们直接大胆猜测writeinfo、readinfo全是protobuf! 把数据扣下来测试一下(用protobuf-inspector这个工具):
protobuf
成功了! 同理, readinfo里都是OCR结果的数据包括识别的坐标、UTF8文字、识别率啥的

数据格式其实很容易看出来, 大体都能猜出来
比如发送的格式:

接收OCR结果的数据格式:

编译一下google的protobuf库, 再拿protoc生成一下头文件和.cc就能用了

WeChatOCR同理, 调用方法是一样的

demo

其实有很多细节没有写出来, 比如QQ设置的接收IPC消息的函数的分析, 比如SendOCRTask第一次调用其实是在OnRemoteConnect回调函数里新起了一个线程异步调用的, 再比如OCR初始化的时候需要SetMMMojoEnvirenmentInitParam来设置--usr-lib,就是mmmojo_64.dll所在的目录。
具体的细节都可以去看QQImpl的代码, 文章中没写出来的代码里都有哦。

[1] Mojo IPC 设计与Invitation机制实现
[2] Chrome Code Search
[3] Chromium Mojo & IPC

DllGetClassObject = GetProcAddress(LibraryA, "DllGetClassObject");
DllGetClassObject = GetProcAddress(LibraryA, "DllGetClassObject");
pIMojoIpc->LaunchChildProcess(wchar_t *path, (char*)[] cmdlines, DWORD64 cmdlines_num, LPVOID callback, LPVOID lpClass);//最后一个参数是callback的第一个参数 是一个类指针
pIMojoIpc->LaunchChildProcess(wchar_t *path, (char*)[] cmdlines, DWORD64 cmdlines_num, LPVOID callback, LPVOID lpClass);//最后一个参数是callback的第一个参数 是一个类指针
message OcrRequest {
    int32 unknow = 1;                               //必定为0
    int32 task_id = 2;
 
    message PicPaths {
        repeated string pic_path = 1;
    }
 
    PicPaths pic_path = 3;
}
message OcrRequest {
    int32 unknow = 1;                               //必定为0
    int32 task_id = 2;
 
    message PicPaths {
        repeated string pic_path = 1;
    }
 
    PicPaths pic_path = 3;
}
message OcrResponse {
    int32 type = 1;                                 //第一次运行OCR会有push一次type1, 正常OCR结束type0
    int32 task_id = 2;
    int32 err_code = 3;
 
    message OcrResult {
        message ResultPos {                         //四个角的坐标 左上 右上 右下 左下
            message PosXY {
                float x = 1;
                float y = 2;
            }
 
            repeated PosXY pos = 1;
        }
 
        message SingleResult {                      //SingleResult是一行结果 OneResult是单字的
            ResultPos single_pos = 1;
            bytes single_str_utf8 = 2;              //UTF8格式的字符串
            float single_rate = 3;                  //单行的识别率
 
            message OneResult {
                ResultPos one_pos = 1;
                bytes one_str_utf8 = 2;
            }
 
            repeated OneResult one_result = 4;
            float lx = 5;                           //识别矩形的左上和右下的坐标? 可能是
            float ly = 6;
            float rx = 7;
            float ry = 8;
            int32 unknown_0 = 9;                    //未知
            ResultPos unknown_pos = 10;             //未知
        }
 
        repeated SingleResult single_result = 1;    //repeated 每行的结果
        int32 unknown_1 = 2;
        int32 unknown_2 = 3;
    }
 
    OcrResult ocr_result = 4;
}
message OcrResponse {
    int32 type = 1;                                 //第一次运行OCR会有push一次type1, 正常OCR结束type0
    int32 task_id = 2;
    int32 err_code = 3;

[培训]内核驱动高级班,冲击BAT一流互联网大厂工作,每周日13:00-18:00直播授课

最后于 2023-9-8 11:33 被0xEEEE编辑 ,原因: 新增QQImpl代码与NTPlus版本
上传的附件:
收藏
免费 31
支持
分享
最新回复 (41)
雪    币: 4687
活跃值: (3673)
能力值: ( LV2,RANK:10 )
在线值:
发帖
回帖
粉丝
2
沙发,坐等完整的分析,谢谢大佬
2023-7-26 14:06
0
雪    币: 626
活跃值: (3926)
能力值: ( LV2,RANK:10 )
在线值:
发帖
回帖
粉丝
3
tql
2023-7-26 16:33
0
雪    币: 415
活跃值: (2633)
能力值: ( LV2,RANK:10 )
在线值:
发帖
回帖
粉丝
4
tql,你是跟QQ截图杠上了,不过这个是真的香,哈哈。
2023-7-26 19:16
0
雪    币: 761
活跃值: (628)
能力值: ( LV2,RANK:10 )
在线值:
发帖
回帖
粉丝
5
学习了
2023-7-26 19:20
0
雪    币: 2948
活跃值: (30846)
能力值: ( LV2,RANK:10 )
在线值:
发帖
回帖
粉丝
6
感谢分享
2023-7-27 08:58
1
雪    币: 4037
活跃值: (4777)
能力值: ( LV2,RANK:10 )
在线值:
发帖
回帖
粉丝
7
可以的,感谢分享
2023-7-27 18:53
0
雪    币: 3485
活跃值: (2149)
能力值: ( LV2,RANK:10 )
在线值:
发帖
回帖
粉丝
935
8
谢谢大佬分享知识!!!
2023-7-28 08:31
0
雪    币: 8178
活跃值: (4131)
能力值: ( LV2,RANK:10 )
在线值:
发帖
回帖
粉丝
9
向大佬学习!!!
2023-7-28 09:16
0
雪    币: 110
活跃值: (3305)
能力值: ( LV2,RANK:10 )
在线值:
发帖
回帖
粉丝
10
谢谢大佬分享知识!!!
2023-7-28 20:28
0
雪    币: 2266
活跃值: (6613)
能力值: ( LV7,RANK:102 )
在线值:
发帖
回帖
粉丝
11
可以白嫖OCR了
2023-7-29 08:19
0
雪    币: 3527
活跃值: (3908)
能力值: ( LV2,RANK:10 )
在线值:
发帖
回帖
粉丝
12
厉害了,来学习。
2023-7-29 09:27
0
雪    币: 47
活跃值: (114)
能力值: ( LV2,RANK:10 )
在线值:
发帖
回帖
粉丝
13
厉害了 大佬
2023-8-3 18:03
0
雪    币: 1054
活跃值: (1258)
能力值: ( LV2,RANK:10 )
在线值:
发帖
回帖
粉丝
14
感谢分享  
2023-8-3 18:56
0
雪    币: 101
能力值: ( LV1,RANK:0 )
在线值:
发帖
回帖
粉丝
15
 牛的
2023-8-9 10:29
0
雪    币: 220
能力值: ( LV1,RANK:0 )
在线值:
发帖
回帖
粉丝
16
你好,发现一个重大的问题,在你发布的逆向提取QQ截取--OCR和其他功能,截的图片体积很小,特别是对截图后划线或加文字后,保存的图片体积小,很模糊,这个怎么办?有设置图片质量的地方吗?
2023-8-15 18:23
0
雪    币: 7
能力值: ( LV1,RANK:0 )
在线值:
发帖
回帖
粉丝
17
QQ附近人,大佬有吗,重谢
2023-8-30 21:02
0
雪    币: 239
活跃值: (22)
能力值: ( LV2,RANK:10 )
在线值:
发帖
回帖
粉丝
18
这个还是好用的就是不登录QQ的时候截长图很棒
2023-9-7 04:59
0
雪    币: 589
活跃值: (205)
能力值: ( LV2,RANK:10 )
在线值:
发帖
回帖
粉丝
19

tql大佬,QQ的截图确实很方便,不过NT版本把录屏给分出来了,不知道后面会不会再合并起来

最后于 2023-9-10 19:55 被无善无我编辑 ,原因:
2023-9-10 19:52
0
雪    币: 426
能力值: ( LV1,RANK:0 )
在线值:
发帖
回帖
粉丝
20

请问下"翻译"和"以图搜图"都使用不了(点击后无响应),会是什么原因?有遇到一样情况的吗?

是我的设置项哪里不对吗?

2023-9-12 19:43
0
雪    币: 4493
活跃值: (4244)
能力值: ( LV9,RANK:140 )
在线值:
发帖
回帖
粉丝
21
mb_skcquzvw 请问下"翻译"和"以图搜图"都使用不了(点击后无响应),会是什么原因?有遇到一样情况的吗?是我的设置项哪里不对吗?
这俩功能需要python环境,因为是C++调Python实现的,你可以查看README.md去设置一下
2023-9-22 10:37
0
雪    币: 110
活跃值: (3305)
能力值: ( LV2,RANK:10 )
在线值:
发帖
回帖
粉丝
22
啥时候这个版本整合下录屏就完美了!您以前的那个工具也很棒!持续关注!
2023-9-24 10:17
0
雪    币: 212
活跃值: (178)
能力值: ( LV2,RANK:10 )
在线值:
发帖
回帖
粉丝
23
按照readmi将pyenv放在了指定的目录下,并且在设置中开启了插件。但是软件启动后还是提示Python启动失败。这是为什么。
win7 64位操作系统。
其中1台可以OCR,2台不可以。
不知道还需要什么环境。
----------------
提示:
在win7系统下启动这个软件,提示缺少api-ms-win-core-path-l1-1-0.dll这个文件,从网上找到并放到指定目录下后,这个软件才可以使用了。
建议:
将这个dll打包到软件中。
2023-10-17 09:33
0
雪    币: 4037
活跃值: (4777)
能力值: ( LV2,RANK:10 )
在线值:
发帖
回帖
粉丝
24
感谢分享,学习了
2023-10-17 19:42
0
雪    币: 83
活跃值: (190)
能力值: ( LV2,RANK:10 )
在线值:
发帖
回帖
粉丝
25
感谢分享,向大佬学习
2023-10-28 14:14
1
游客
登录 | 注册 方可回帖
返回
//