[原创]AI逆向某视频签名算法X-Medusa全过程-Android安全-看雪安全社区

[原创]AI逆向某视频签名算法X-Medusa全过程

发表于: 2026-5-5 16:17 22884

[原创]AI逆向某视频签名算法X-Medusa全过程

scxc

2026-5-5 16:17

22884

本文仅记录一次针对移动端 native 签名逻辑的逆向分析过程，用于安全研究、算法学习和逆向工程方法论交流。文中涉及的脚本、地址和结论均来自本地样本与模拟环境验证，不讨论任何绕过风控、批量请求或业务滥用场景。

这次分析的目标是某视频 App 29.3 版本中的一个 native 签名头：X-Medusa。

样本位于 Android native so：

外层调用函数是：

这个函数会一次性生成多个签名头：

本文重点只讲 X-Medusa。

我最终将 X-Medusa 主路径还原成了纯 Python，可以在不启动 native VM 的情况下，只输入同一次运行的动态值，生成和 native 一致的 X-Medusa。

整个过程并不是一开始就直接进入算法还原。前半段我先用 Cursor 的 Opus 模型搭建和调通ExAndroidNativeEmu 调用环境，它帮我把 sub_D4F3C 的 native 签名调用跑起来，也就是能从本地 emu里拿到各个签名头。到这一步后，继续深入 X-Medusa 内部时，分析基本卡在 SM3 和周边混淆逻辑，无法继续稳定拆出后续 VM 路径。

后半段切到 Codex 后，分析方式变成了“动态 trace + 局部 Python lift + native 对照验证”。也就是本文后面记录的过程：不再只看静态伪代码，而是对每个 VM 片段抓输入、输出和实际内存读写变化，再把能证明的局部逻辑写成 Python，最后组合成完整 pipeline。

最终验证结果：

也就是说，Python 重建出的明文 src_a 和最终 X-Medusa 都与 native 同一次运行完全一致。

本次使用的是一个基于 ExAndroidNativeEmu 的本地模拟环境。目录中已有调用示例：

它负责：

分析过程中还遇到一个环境问题：系统里存在不匹配的 Unicorn dylib，会影响 emu 运行。后面所有 native 对照命令都统一这样跑：

避免 Python 加载错误的 Unicorn 动态库。

一开始没有直接钻 VM，而是先观察 sub_D4F3C 的输出 map/string 插入位置。

最终确认各 header 的插入点：

其中 X-Medusa 的关键路径是：

这里最重要的是确定 VM 执行边界：

有了这个边界，后续 hook 只在 Medusa VM 活跃期间记录，避免被 JNI 初始化、其它 header 或环境探测逻辑干扰。

最开始静态看 0x445b8 这个 VM 入口，会发现它很像 MIPS 风格解释器：

但不能直接把它当标准 MIPS。

我写了一个 Python VM 模型和 native 状态对比脚本，核心思路是：

VM fetch/decode 点：

对比后得到一个重要结论：

也就是说，不能做这样的假设：

部分 R-type 指令的目标寄存器编码也和标准 MIPS 有差异。所以后续还原关键逻辑时，我没有完全依赖静态反汇编，而是优先使用动态 trace 的输入、输出和实际内存读写变化。

接下来先看最终 X-Medusa 是什么。

通过跟踪 base64 调用链：

确认 X-Medusa 是标准 base64，使用普通字母表：

base64 解码后得到一个 raw packet。继续跟踪最终 packet 的 copy 序列，得到结构：

VM copy 点如下：

这个阶段先写出最外层 Python：

继续追 packet body，发现最终 body 来自一个中间 buffer，但不是直接复制出来的。

它的生成分成两步：

second_buffer 布局：

其中：

关键 VM 写点：

这一步对应的 Python lift：

验证方式是同一次 native run 中抓取 copy 的 source/destination/len，然后和 Python 拼出来的 buffer 做 byte-for-byte 比较。

first_intermediate 继续往前追，来到 VM 片段：

静态看这里时很容易把 source 和 destination 看反。所以我对这个范围做了窄范围动态 trace，记录每一轮：

最终确认真实逻辑：

也就是：

key 的来源在前面：

它调用一个短 VM helper，对 tail2 做 hash，取低 16 位组成 4 字节 key：

验证样例：

reverse-xor 的输入不是原始明文，而是：

继续追上游，发现：

进入 lib+0xd71bc 时参数：

这里一开始也容易误判为某种标准加密算法，但动态 trace 后发现它不是 AES/SM4 这种标准 block cipher，而是一个混淆过的字节状态机。

整体结构：

把它 lift 成 Python：

然后用 native dump 的 src_a/key/dst 验证：

d71bc 的 key32 不是固定表，而是 SM3 结果。

调用链：

对 b"abc" 做验证后确认 lib+0xd9bc0 是标准 SM3：

key material 的构造：

所以：

这也解释了前面 tail2：

同一个 rand 同时参与：

只在 Medusa VM 活跃期间 trace rand wrapper，确认共有三次：

分别对应：

这里有一个坑：--lock-time 并不会固定这三个 rand。模拟器里的 rand hook 来自 Python random.randint(0, 0xffffffff)，所以想复现同一次签名，必须捕获这三个 rand，或者额外固定随机源。

d71bc 的输入 src_a 是一个 protobuf-like 明文消息。

入口参数里可以直接拿到：

解析后字段如下：

native 辅助函数也能印证这一点：

所以这一段不应该按加密算法理解，而应该按 protobuf builder 还原。

对应 Python 中实现了：

验证方式：

对 SM3 helper 的 IO 做 trace 后确认：

注意这里是 query，不包含 path，也不包含问号前面的部分。

样例：

src_a.f23 是一段嵌套环境 message，其中几个字段是动态值。

最终确认：

对应 native 证据：

这里要区分：

即使锁定 URL 里的 ts 或 emu 的 --lock-time，f40 仍可能变化。要复现同一次签名，就必须使用 native run 里抓到的当前毫秒值。

src_a.f24 是 JSON 字符串，形态如下：

先从最终 JSON 里的 fkd/pd 回溯 source string：

确认：

继续追 uuid_source，发现它不是直接把 /dev/urandom 的 16 字节格式化成 UUID，而是：

PRNG 逻辑：

UUID 模板：

填充规则：

用固定 /dev/urandom 输入 --urandom-int 1 验证：

最终 packet 的 body 还会经过一层 bit-slice 处理。

流程：

提取位置：

patch 位置：

稀疏 bit lanes：

byte bit permutation：

这一步看起来很绕，但动态验证很直接：

在 vm+0x193800 附近能看到明显的 AES GF(2^8) 乘法痕迹：

但它不是标准 AES。

继续 trace S-box、state permutation、key schedule 和 round-key 顺序后，最终确认它是一个自定义 AES-like 变换：

固定材料：

输入：

输出：

其中：

这一阶段逐轮验证了：

到这里，所有局部块都已经能和 native 对上。

最终 Python pipeline：

最终封装成：

以及纯 Python 命令行：

端到端验证脚本会在同一次 native run 中抓取：

然后 Python 用这些值重新生成：

验证结果：

这说明：

如果要让纯 Python 和某一次 native 运行输出完全一致，至少要提供：

其中最容易忽略的是：

这篇文章标题里有 “AI逆向”，但它不是指把 so 丢给 AI 然后自动出结果。

这次更接近一种分阶段的人机协作式逆向。

第一阶段用的是 Cursor 的 Opus 模型，重点解决工程入口问题：

这个阶段的价值很大，因为没有稳定 emu 调用，就谈不上后续动态验证。但它继续深入时基本只能推到 SM3 和一些外层 helper，面对 VM 内部的数据流、buffer 来源、bit-slice patch、AES-like transform 时，很难继续拆下去。

登录后可查看完整内容

传播安全知识、拓宽行业人脉——看雪讲师团队等你加入！

最后于 2026-5-5 23:11 被scxc编辑，原因：修改名词让可读性更高

#逆向分析 #协议分析 #混淆加固 #脱壳反混淆

上传的附件：

libmetasec_ml.fully_deobf.so （2.32MB，127次下载）
dy_sign_send.py （24.44kb，140次下载）
medusa_lift_blocks.py （63.96kb，131次下载）
medusa_pure_x_medusa.py （4.64kb，134次下载）
medusa_reverse_walkthrough.md （20.00kb，126次下载）
medusa_re_notes.md （35.12kb，129次下载）
中间生成文件.zip （133.92kb，130次下载）

收藏・59

免费・37

支持

赞赏记录

参与人

雪币

留言

时间

chaoxi72

为你点赞！

3天前

lingyi223

非常支持你的观点！

5天前

ruigo

你的帖子非常有用，感谢分享！

2026-5-18 00:02

wx_来时路

感谢你的贡献，论坛因你而更加精彩！

2026-5-13 16:54

之安

为你点赞！

2026-5-12 03:37

dsfa

期待更多优质内容的分享，论坛有你更精彩！

2026-5-11 14:41

jjjo

期待更多优质内容的分享，论坛有你更精彩！

2026-5-9 10:47

程序原

这个讨论对我很有帮助，谢谢！

2026-5-9 06:45

yezheyu

你的帖子非常有用，感谢分享！

2026-5-8 14:02

shmilyaxy

你的分享对大家帮助很大，非常感谢！

2026-5-8 12:50

cydian

感谢你的积极参与，期待更多精彩内容！

2026-5-8 12:31

n_1ng

你的帖子非常有用，感谢分享！

2026-5-8 11:46

霜降白羽

期待更多优质内容的分享，论坛有你更精彩！

2026-5-8 09:17

东方玻璃

感谢你的贡献，论坛因你而更加精彩！

2026-5-7 19:05

我的小拇指啊

这个讨论对我很有帮助，谢谢！

2026-5-7 15:48

Yangser

谢谢你的细致分析，受益匪浅！

2026-5-7 13:11

s1nec-1o

非常支持你的观点！

2026-5-7 11:49

mb_lbbccuua

这个讨论对我很有帮助，谢谢！

2026-5-7 11:24

卡卡骨

感谢你的贡献，论坛因你而更加精彩！

2026-5-7 07:01

Bonnie-Ran

感谢你的贡献，论坛因你而更加精彩！

2026-5-6 23:49

wjdidi

感谢你的贡献，论坛因你而更加精彩！

2026-5-6 23:42

andy张刘

为你点赞！

2026-5-6 23:14

王叔叔

期待更多优质内容的分享，论坛有你更精彩！

2026-5-6 22:45

WsttXm

感谢你的积极参与，期待更多精彩内容！

2026-5-6 20:07

wx_funcrever

感谢你的贡献，论坛因你而更加精彩！

2026-5-6 20:00

wx_0.0_522

感谢你分享这么好的资源！

2026-5-6 17:21

mb_aoooaosd

这个讨论对我很有帮助，谢谢！

2026-5-6 16:53

P1umH0

感谢你的贡献，论坛因你而更加精彩！

2026-5-6 11:45

[軍]

你的分享对大家帮助很大，非常感谢！

2026-5-6 11:12

mb_iesvmzqc

非常支持你的观点！

2026-5-6 10:15

Damn7Kx

谢谢你的细致分析，受益匪浅！

2026-5-5 21:29

dreameriii

感谢你分享这么好的资源！

2026-5-5 19:32

下雨天sana

非常支持你的观点！

2026-5-5 19:03

iCookiie

感谢你的贡献，论坛因你而更加精彩！

2026-5-5 18:11

mxystery

感谢你的积极参与，期待更多精彩内容！

2026-5-5 16:41

Umiade

+10

感谢你分享这么好的资源！

2026-5-5 16:34

wx_7788

为你点赞！

2026-5-5 16:19

最新回复 (20)
Umiade 雪币： 4356 活跃值： (3160) 能力值： ( LV4，RANK：50 ) 在线值：发帖 2 回帖 55 粉丝 10 关注私信	Umiade 2 楼给大哥点赞！ ------------ 过去，逆向所谓的工作量，一方面在于定位算法，需要尽可能准确地找到最小单元的指令流和控制流，另一个方面在于从上一步获取的数据中依靠经验还原出算法。而现在借助给大模型搭好完善的脚手架，后一步的工作量可以大幅度降低，但这个过程中，专家经验的输入仍然必不可少。未来在更多领域，会有越来越多的“一人成军”，领域专家的知识我觉得不但不会被淘汰，反而会愈发重要。最后于 2026-5-5 16:34 被Umiade编辑，原因： 2026-5-5 16:23 0
爱吃菠菜雪币： 2046 活跃值： (9645) 能力值： ( LV11，RANK：180 ) 在线值：发帖 19 回帖 192 粉丝 483 关注私信	爱吃菠菜 2 3 楼 2026-5-5 16:28 0
LowRebSwrd 雪币： 6553 活跃值： (4148) 能力值： (RANK：200 ) 在线值：发帖 15 回帖 189 粉丝 188 关注私信	LowRebSwrd 4 4 楼 2026-5-5 16:36 0
墨穹呢雪币： 4183 活跃值： (6877) 能力值： ( LV3，RANK：20 ) 在线值：发帖 2 回帖 180 粉丝 18 关注私信	墨穹呢 5 楼感谢分享 2026-5-6 00:19 0
mb_rrvlrvbk 雪币： 123 活跃值： (1302) 能力值： ( LV2，RANK：10 ) 在线值：发帖 0 回帖 9 粉丝 0 关注私信	mb_rrvlrvbk 6 楼 2026-5-7 10:40 0
Imxz 雪币： 104 活跃值： (8582) 能力值： ( LV2，RANK：10 ) 在线值：发帖 6 回帖 608 粉丝 8 关注私信	Imxz 7 楼 tql 2026-5-8 11:08 0
Light紫星雪币： 782 活跃值： (1933) 能力值： ( LV2，RANK：10 ) 在线值：发帖 0 回帖 41 粉丝 9 关注私信	Light紫星 8 楼大佬太强了 2026-5-8 11:41 0
3倍アイスクリーム! 雪币： 0 活跃值： (498) 能力值： ( LV2，RANK：10 ) 在线值：发帖 0 回帖 16 粉丝 0 关注私信	3倍アイスクリーム! 9 楼太强了这个得好好学习下 2026-5-8 11:43 0
uni7corn 雪币： 0 活跃值： (2080) 能力值： ( LV2，RANK：10 ) 在线值：发帖 0 回帖 158 粉丝 0 关注私信	uni7corn 10 楼感谢大佬的深度分析；学习了 2026-5-8 11:53 0
Migc 雪币： 20 能力值： ( LV1，RANK：0 ) 在线值：发帖 0 回帖 27 粉丝 0 关注私信	Migc 11 楼太强了 2026-5-8 11:55 0
龙幽雪币： 325 活跃值： (1283) 能力值： ( LV4，RANK：50 ) 在线值：发帖 5 回帖 92 粉丝 4 关注私信	龙幽 1 12 楼版本太老了，一个简单的mips 虚拟机，试下最新的版本 2026-5-8 13:54 0
yezheyu 雪币： 2852 活跃值： (3048) 能力值： ( LV3，RANK：35 ) 在线值：发帖 3 回帖 62 粉丝 37 关注私信	yezheyu 13 楼 666 2026-5-8 14:02 0
mb_muaytokh 雪币： 200 能力值： ( LV1，RANK：0 ) 在线值：发帖 0 回帖 2 粉丝 0 关注私信	mb_muaytokh 14 楼龙幽版本太老了，一个简单的mips 虚拟机，试下最新的版本新版本那个太绕了，我用ai跟了下，烧了8亿token，根本搞不出来 2026-5-9 15:31 0
maxcl 雪币： 204 活跃值： (705) 能力值： ( LV2，RANK：10 ) 在线值：发帖 0 回帖 34 粉丝 0 关注私信	maxcl 15 楼也尝试分析过不错 2026-5-10 14:31 0
runjin 雪币： 27 活跃值： (1711) 能力值： ( LV9，RANK：180 ) 在线值：发帖 16 回帖 126 粉丝 1 关注私信	runjin 4 16 楼请问get和post请求有没有什么区别? 它只用到url吗? 2026-5-11 14:31 0
PPTV 雪币： 11211 活跃值： (4285) 能力值： ( LV2，RANK：10 ) 在线值：发帖 4 回帖 208 粉丝 0 关注私信	PPTV 17 楼必须要好好跟着来一遍 2026-5-12 19:41 0
mb_nzmpaifg 雪币： 21 能力值： ( LV1，RANK：0 ) 在线值：发帖 2 回帖 6 粉丝 0 关注私信	mb_nzmpaifg 18 楼学习学习 2026-5-12 20:46 0
手把手教我吗雪币： 0 能力值： ( LV1，RANK：0 ) 在线值：发帖 8 回帖 60 粉丝 0 关注私信	手把手教我吗 19 楼有联系方式没，大佬发一个交流一下 5天前 0
手把手教我吗雪币： 0 能力值： ( LV1，RANK：0 ) 在线值：发帖 8 回帖 60 粉丝 0 关注私信	手把手教我吗 20 楼很好奇，sign_key_b64固定值是从哪拿到的 17小时前 0
scxc 雪币： 4917 活跃值： (1851) 能力值： ( LV13，RANK：255 ) 在线值：发帖 8 回帖 76 粉丝 51 关注私信	scxc 4 21 楼 medusa_re_notes.md 里面有写从vm里取的 10小时前 0
	游客登录 \| 注册方可回帖回帖表情雪币赚取及消费高级回复

scxc

发帖

回帖

255

RANK

关注

私信

他的文章

关于我们

联系我们

企业服务

看雪公众号

最新回复 (20)
Umiade 雪币： 4356 活跃值： (3160) 能力值： ( LV4，RANK：50 ) 在线值：发帖 2 回帖 55 粉丝 10 关注私信	Umiade 2 楼给大哥点赞！ ------------ 过去，逆向所谓的工作量，一方面在于定位算法，需要尽可能准确地找到最小单元的指令流和控制流，另一个方面在于从上一步获取的数据中依靠经验还原出算法。而现在借助给大模型搭好完善的脚手架，后一步的工作量可以大幅度降低，但这个过程中，专家经验的输入仍然必不可少。未来在更多领域，会有越来越多的“一人成军”，领域专家的知识我觉得不但不会被淘汰，反而会愈发重要。最后于 2026-5-5 16:34 被Umiade编辑，原因： 2026-5-5 16:23 0
爱吃菠菜雪币： 2046 活跃值： (9645) 能力值： ( LV11，RANK：180 ) 在线值：发帖 19 回帖 192 粉丝 483 关注私信	爱吃菠菜 2 3 楼 2026-5-5 16:28 0
LowRebSwrd 雪币： 6553 活跃值： (4148) 能力值： (RANK：200 ) 在线值：发帖 15 回帖 189 粉丝 188 关注私信	LowRebSwrd 4 4 楼 2026-5-5 16:36 0
墨穹呢雪币： 4183 活跃值： (6877) 能力值： ( LV3，RANK：20 ) 在线值：发帖 2 回帖 180 粉丝 18 关注私信	墨穹呢 5 楼感谢分享 2026-5-6 00:19 0
mb_rrvlrvbk 雪币： 123 活跃值： (1302) 能力值： ( LV2，RANK：10 ) 在线值：发帖 0 回帖 9 粉丝 0 关注私信	mb_rrvlrvbk 6 楼 2026-5-7 10:40 0
Imxz 雪币： 104 活跃值： (8582) 能力值： ( LV2，RANK：10 ) 在线值：发帖 6 回帖 608 粉丝 8 关注私信	Imxz 7 楼 tql 2026-5-8 11:08 0
Light紫星雪币： 782 活跃值： (1933) 能力值： ( LV2，RANK：10 ) 在线值：发帖 0 回帖 41 粉丝 9 关注私信	Light紫星 8 楼大佬太强了 2026-5-8 11:41 0
3倍アイスクリーム! 雪币： 0 活跃值： (498) 能力值： ( LV2，RANK：10 ) 在线值：发帖 0 回帖 16 粉丝 0 关注私信	3倍アイスクリーム! 9 楼太强了这个得好好学习下 2026-5-8 11:43 0
uni7corn 雪币： 0 活跃值： (2080) 能力值： ( LV2，RANK：10 ) 在线值：发帖 0 回帖 158 粉丝 0 关注私信	uni7corn 10 楼感谢大佬的深度分析；学习了 2026-5-8 11:53 0
Migc 雪币： 20 能力值： ( LV1，RANK：0 ) 在线值：发帖 0 回帖 27 粉丝 0 关注私信	Migc 11 楼太强了 2026-5-8 11:55 0
龙幽雪币： 325 活跃值： (1283) 能力值： ( LV4，RANK：50 ) 在线值：发帖 5 回帖 92 粉丝 4 关注私信	龙幽 1 12 楼版本太老了，一个简单的mips 虚拟机，试下最新的版本 2026-5-8 13:54 0
yezheyu 雪币： 2852 活跃值： (3048) 能力值： ( LV3，RANK：35 ) 在线值：发帖 3 回帖 62 粉丝 37 关注私信	yezheyu 13 楼 666 2026-5-8 14:02 0
mb_muaytokh 雪币： 200 能力值： ( LV1，RANK：0 ) 在线值：发帖 0 回帖 2 粉丝 0 关注私信	mb_muaytokh 14 楼龙幽版本太老了，一个简单的mips 虚拟机，试下最新的版本新版本那个太绕了，我用ai跟了下，烧了8亿token，根本搞不出来 2026-5-9 15:31 0
maxcl 雪币： 204 活跃值： (705) 能力值： ( LV2，RANK：10 ) 在线值：发帖 0 回帖 34 粉丝 0 关注私信	maxcl 15 楼也尝试分析过不错 2026-5-10 14:31 0
runjin 雪币： 27 活跃值： (1711) 能力值： ( LV9，RANK：180 ) 在线值：发帖 16 回帖 126 粉丝 1 关注私信	runjin 4 16 楼请问get和post请求有没有什么区别? 它只用到url吗? 2026-5-11 14:31 0
PPTV 雪币： 11211 活跃值： (4285) 能力值： ( LV2，RANK：10 ) 在线值：发帖 4 回帖 208 粉丝 0 关注私信	PPTV 17 楼必须要好好跟着来一遍 2026-5-12 19:41 0
mb_nzmpaifg 雪币： 21 能力值： ( LV1，RANK：0 ) 在线值：发帖 2 回帖 6 粉丝 0 关注私信	mb_nzmpaifg 18 楼学习学习 2026-5-12 20:46 0
手把手教我吗雪币： 0 能力值： ( LV1，RANK：0 ) 在线值：发帖 8 回帖 60 粉丝 0 关注私信	手把手教我吗 19 楼有联系方式没，大佬发一个交流一下 5天前 0
手把手教我吗雪币： 0 能力值： ( LV1，RANK：0 ) 在线值：发帖 8 回帖 60 粉丝 0 关注私信	手把手教我吗 20 楼很好奇，sign_key_b64固定值是从哪拿到的 17小时前 0
scxc 雪币： 4917 活跃值： (1851) 能力值： ( LV13，RANK：255 ) 在线值：发帖 8 回帖 76 粉丝 51 关注私信	scxc 4 21 楼 medusa_re_notes.md 里面有写从vm里取的 10小时前 0
	游客登录 \| 注册方可回帖回帖表情雪币赚取及消费高级回复