[原创]打破传统AI逆向的新思路多Agent、自主管理上下文 - 逆向思路-AI 工具与工作流-看雪安全社区

[原创]打破传统AI逆向的新思路多Agent、自主管理上下文 - 逆向思路

发表于: 2026-4-30 21:56 3610

[原创]打破传统AI逆向的新思路多Agent、自主管理上下文 - 逆向思路

BitWarden

2026-4-30 21:56

3610

本人使用AI逆向和AI开发已经两年时间（目前是在做Agent开发），从纯粹网页时代的GPT辅助逆向到Claude3.5，到后面的AI爆发时代的GLM5.1，Claude4.7等等。看到很多人用ai逆向的思路和手法还是过于局限和原始（纯粹的流式对话）。想分享一些新思路。作者本身是做算法逆向还原，所以文章就以我自己的方向为主进行抛砖引玉。如何高效的逆向。（本文章零AI注水请放心食用，除开绘图使用了AI）

在AI逆向中结合经验我认为存在一下几个问题：

这几个问题也是苦恼我很久了。结合总结了一套方法：

基于上面思考我设计了一套逆向RE的工程框架，只要参与大型的逆向工程我会使用我这套框架来进行。设计图如下：图片描述设计了一套多Agent的框架，由主脑来进行决策还任务的派发。主Agent直接与用户进行交互，拆解用户的语义分析，并且指挥下面的小弟干活。并且吧上下文管理，逆向分析，审查。拆分成几个Agent完成，如果说后续任务复杂度增加，已经继续增加我们的子agent，继续拆分细化任务。图片描述

我吧Ai产物分成两个部分：

具体设计是这样的：

并且设计了如下几种文件格式用来存储我们的逆向中的信息：

由一个树形结构，一个主索引，我们的具体的逆向信息。一共有四类产物：class类文件，方法文件，未归类函数或者说是面向过程中用到的。

类文件格式：

方法文件格式：

未归类函数：

这里介绍一下status 值，这个实际上就是我们的逆向的置信度，在AI逆向中，任何ai逆向的产出都是不可靠的，都是存在置信度的如果一旦100%信任你肯定会出大问题。所以我们需要给每个结果打上一个置信度，当有足够证据多维度验证后才能是可信的。否则agent在阅读这些信息的都是有一定的怀疑态度去对待。这个状态的更改是由审查agent负责 + 半人工的方式完成的。(这一步主要是解决幻觉问题)

所以设计了如下几个状态：

常见的流程是这样的：

最后给我们的不同的agent上不同的权限，但是confirmed一定要有人来审查，也就是意味着这个点完全没有问题。

在上面设计的情况下，我们是一个单一的一对一管理。但是我们知道逆向一般都是多个so或者dll进行的互相引入的，所以这种引入如何解决？用一个cross_refs文件来管理跨dll之间的关系表达：格式如下：

举例一下：

由于我们不可能一轮对话就可以吧一个任务完成，所以这里存在一个版本迭代问题。当我们逆向的第一版是这样的，但是由于各种问题导致我们推翻了我们之前的分析过程和逆向过程。但是不确定第二个方向是对的情况下，就需要对版本进行管理。格式如下：

真实的情况是这样的：

通常笔者遇到的都是大型商业软件的逆向，所以遇到面向过程的的极少都是面向对象的设计模型。传统那几种吧。所以逆向到最后一定是一个类方法，虚方法等等。这里面就存在一个最早期的函数到面向过程的转行问题，比如一个核心算法，他最后肯定是一个类，不是一个函数。在我们的上下文管理中就存在从函数状态的上下文到类对象的迁移过程。设计是这样的：

主要是做文件的迁移吧之前的旧文件删除，迁移到对应的类下面.

这个部分是非常杂的所以不能做那么精细化的区分。这里拿一个真实项目举例：图片描述从任务出发到最后的定位总结分析整套链路。设计如下:

在说完我们的上下文管理后，讲一下在我自己的任务中存在的高精度还原问题。首先我蒸馏我自己，将所有的最基础的RE和编译原理进行蒸馏成一个知识库。图片描述 INDEX是整个知识库的索引目录，用来读取Agent遇到问题的时候所需要的知识。

上面我说过AI是不懂逆向的，他懂的是F5以及汇编，不明白如何还原一个类或者一个算法。所以这里我整理了两个skills，一个是类分析和lift也就是我说的人肉f5. 图片描述这个位置就是我们需要技能，ai不会的，但是人为指点后就可以完成的事情。比如脱壳，去花等等。。。。

在高精度的还原，我们人是通过汇编的骨架还原。流程如下：

这里产物一定是一个cpp文件，也就是对应上面的上下文的产物管理的部分。

由于我工作中大量需要设计类和对象的整个项目的工程化的评估，我需要有一个系统的评估技能。根据我自己的业务制作了一个Skills

这里我拿我之前网页AI时期的半古法分析的一个的帖子作为测试（Gtuner软件协议分析可以去看我自己的其他文章），看我这套东西是否能跑通。图片描述最后产物：几乎是没用我多少时间，全程agent就自主完成了，中间打断了我四次（打了一把游戏agent就完成了）

针对我自己的工作目前就这样设计的，目前还有动态调试的部分没有讲如何融入进来。这里主要是讲解设计，虽然我会把我的工程发到附件里面去，但是不推荐直接使用，可以利用我这种设计打造属于自己的"逆向工程sln"。这里推荐使用opencode，可以把主脑配置到deep seek v4，干活可以使用glm5.1，这样可以使用国产甚至是内网模型来完成工作，不再受制于claude 虽然它目前还是最强的。（感谢您看到这里了，如果觉得有帮助可以点个赞吗？对于有啥意见和感受都可以在评论区讨论）

字段	含义
`类名`	RTTI 真名优先，无 RTTI 用 `Class_140xxxx` 临时名
`状态`	status 值（见第五节）
`版本`	时间线版本号
`大小`	sizeof(类) 字节数
`vtable`	虚表地址 + 槽位数；无虚函数则 null
`父类`	直接继承的基类列表，无继承则 []
`字段`	成员变量列表（偏移、类型、名字、初值、证据）
`方法清单`	方法名引用列表（详情在 `methods/<name>.yaml`）

字段	含义
`类`	所属类名
`方法名`	`speak` / `Animal` / `~Animal`
`地址`	函数地址（十六进制字符串）
`状态`	status 值
`版本`	时间线版本号
`签名`	推断出的 C++ 签名
`证据`	判别依据列表
`C 源码`	反编译出的 C 代码（多行字符串）

字段	含义
`地址`	函数地址
`状态`	status 值（一般是 draft 或 candidate）
`版本`	时间线版本号
`签名`	推断出的签名（不确定时填 `???`）
`证据`	判别依据列表
`C 源码`	反编译出的 C 代码

状态	含义	谁能写
`draft`	AI 单线程初稿，未经验证	worker
`wip`	正在分析中，尚未完成	worker
`candidate`	fan-out 候选 / judge 选中待审	worker / judge 选
`confirmed`	已经过用户拍板的最终结论	仅用户
`rejected`	经验证或拍板被驳回	judge / 审查 / 用户
`superseded`	被新版本取代（历史归档常用）	librarian / agent 升级新版本时

登录后可查看完整内容

[培训]《冰与火的战歌：Windows内核攻防实战》！从零到实战，融合AI与Windows内核攻防全技术栈，打造具备自动化能力的内核开发高手。

最后于 2026-4-30 22:14 被BitWarden编辑，原因：

上传的附件：

re-projects.7z （31.80kb，70次下载）

收藏・37

免费・18

支持

赞赏记录

参与人

雪币

留言

时间

xxrinkoss

非常支持你的观点！

5小时前

零_721409

感谢你的贡献，论坛因你而更加精彩！

8小时前

烧板侠

感谢你的贡献，论坛因你而更加精彩！

11小时前

dsfa

为你点赞！

12小时前

念空

你的分享对大家帮助很大，非常感谢！

12小时前

MemberA

感谢你的贡献，论坛因你而更加精彩！

2天前

程序原

感谢你的积极参与，期待更多精彩内容！

2天前

mb_iesvmzqc

感谢你的贡献，论坛因你而更加精彩！

3天前

wx_funcrever

期待更多优质内容的分享，论坛有你更精彩！

4天前

我的小拇指啊

你的分享对大家帮助很大，非常感谢！

4天前

x_req

感谢你的贡献，论坛因你而更加精彩！

5天前

Harpe

非常支持你的观点！

5天前

新气象

感谢你分享这么好的资源！

6天前

a0yark

感谢你的积极参与，期待更多精彩内容！

6天前

cr_lgdx

感谢你的积极参与，期待更多精彩内容！

6天前

孤独的街

为你点赞！

6天前

atom2024

你的分享对大家帮助很大，非常感谢！

6天前

东方玻璃

谢谢你的细致分析，受益匪浅！

2026-4-30 22:48

最新回复 (13)
淡然他徒弟雪币： 5401 活跃值： (6653) 能力值： ( LV10，RANK：160 ) 在线值：发帖 23 回帖 280 粉丝 122 关注私信	淡然他徒弟 1 2 楼 mark，学习了 2026-4-30 22:16 0
Imxz 雪币： 104 活跃值： (8407) 能力值： ( LV2，RANK：10 ) 在线值：发帖 6 回帖 569 粉丝 8 关注私信	Imxz 3 楼 tql 6天前 0
Ankeys 雪币： 679 能力值： ( LV1，RANK：0 ) 在线值：发帖 1 回帖 78 粉丝 1 关注私信	Ankeys 4 楼看完感觉整体都是在讲一个逆向的Harness设计,不知道理解的是不是到位了. 我之前也尝试过做类似的工程结构,但是实际搞下来发现会有很严重的资源浪费,很多其实没那么复杂的分析,也会被强行靠到整个架子上来,相比于直接连个ida-mcp然后扔给他一句话,让他从汇编层面分析逻辑,需要花费更多的时间和Token. 这个问题楼主是怎么解决的 4天前 0
初学者有毅力雪币： 190 活跃值： (1320) 能力值： ( LV3，RANK：26 ) 在线值：发帖 7 回帖 49 粉丝 1 关注私信	初学者有毅力 5 楼这是对早期AI有效果,,现在AI已经很聪明了,,过多的引导只会让AI陷入迷茫,AI会遵守你的规程导致没办法发挥的出AI最大的想象力,聪明反被聪明误! 4天前 0
BitWarden 雪币： 1248 活跃值： (1035) 能力值： ( LV5，RANK：70 ) 在线值：发帖 6 回帖 21 粉丝 30 关注私信	BitWarden 1 6 楼初学者有毅力这是对早期AI有效果,,现在AI已经很聪明了,,过多的引导只会让AI陷入迷茫,AI会遵守你的规程导致没办法发挥的出AI最大的想象力,聪明反被聪明误! 最先进的ai能否在保密级别较高的单位使用。如果只有一个qwen235b如何解决。Claude和codex已经在收紧策略禁止漏洞分析。有考虑过小模型问题吗？我主要做算法还原要求精度是二进制级别的反编译等价。有试过吗？普通逆向你随便怎么折腾 4天前 0
BitWarden 雪币： 1248 活跃值： (1035) 能力值： ( LV5，RANK：70 ) 在线值：发帖 6 回帖 21 粉丝 30 关注私信	BitWarden 1 7 楼 Ankeys 看完感觉整体都是在讲一个逆向的Harness设计,不知道理解的是不是到位了. 我之前也尝试过做类似的工程结构,但是实际搞下来发现会有很严重的资源浪费,很多其实没那么复杂的分析,也会被强行靠到整个架 ... 要看具体的业务，很多时候我这边都是从一个小需求扩大的传统的ai分析到后面会生成大量的tools并且逆向分析的结果都在上下文中最后还是需要产出文档管理很混乱。稍微简单的东西我直接手工古法就搞完了 4天前 0
BitWarden 雪币： 1248 活跃值： (1035) 能力值： ( LV5，RANK：70 ) 在线值：发帖 6 回帖 21 粉丝 30 关注私信	BitWarden 1 8 楼 Ankeys 看完感觉整体都是在讲一个逆向的Harness设计,不知道理解的是不是到位了. 我之前也尝试过做类似的工程结构,但是实际搞下来发现会有很严重的资源浪费,很多其实没那么复杂的分析,也会被强行靠到整个架 ... 最后于 4天前被BitWarden编辑，原因： 4天前 0
BitWarden 雪币： 1248 活跃值： (1035) 能力值： ( LV5，RANK：70 ) 在线值：发帖 6 回帖 21 粉丝 30 关注私信	BitWarden 1 9 楼 Ankeys 看完感觉整体都是在讲一个逆向的Harness设计,不知道理解的是不是到位了. 我之前也尝试过做类似的工程结构,但是实际搞下来发现会有很严重的资源浪费,很多其实没那么复杂的分析,也会被强行靠到整个架 ... 其实最主要还是需要根据不同的项目业务特点来做工程化的开展。这样就是为什么Claude要有这么多设计的原因。我周围的朋友做协议的做兼容性的不同业务他们的工程和我的完全不一样也交流过一些心得。核心还是需要管理上下文。在某一个方向干久之后会发现真的是固定的流程。分析mfc分析qt切入点其实都是一套固定的思路。分析游戏引擎等等。都有切入点这些转换成skills一定是省token的会比你ai自己去做好很多没有一个专门给逆向训练的模型。 4天前 0
wx_Lilac_176 雪币： 0 能力值： ( LV1，RANK：0 ) 在线值：发帖 0 回帖 3 粉丝 0 关注私信	wx_Lilac_176 10 楼有尝试做基准测试吗？这样一套 agent，相比直接用 coding agent（codex/cc/cursor）真的更强大吗？ 3天前 0
lixianhuei 雪币： 1122 活跃值： (1660) 能力值： ( LV2，RANK：10 ) 在线值：发帖 0 回帖 97 粉丝 0 关注私信	lixianhuei 11 楼 666 2天前 0
Ankeys 雪币： 679 能力值： ( LV1，RANK：0 ) 在线值：发帖 1 回帖 78 粉丝 1 关注私信	Ankeys 12 楼 BitWarden 其实最主要还是需要根据不同的项目业务特点来做工程化的开展。这样就是为什么Claude要有这么多设计的原因。我周围的朋友做协议的做兼容性的不同业务他们的工程和我的完全不一样也交流过一些心得。核心还是需 ... 如果说打算使用国产模型,或者社区开源模型的话,那搞这样一套工程结构那确实必不可少了.那这套系统最后是如何验证产出的呢,人工check结果嘛 1天前 0
BitWarden 雪币： 1248 活跃值： (1035) 能力值： ( LV5，RANK：70 ) 在线值：发帖 6 回帖 21 粉丝 30 关注私信	BitWarden 1 13 楼 Ankeys 如果说打算使用国产模型,或者社区开源模型的话,那搞这样一套工程结构那确实必不可少了.那这套系统最后是如何验证产出的呢,人工check结果嘛肯定是业务交付啊。最后于 1天前被BitWarden编辑，原因： 1天前 0
BitWarden 雪币： 1248 活跃值： (1035) 能力值： ( LV5，RANK：70 ) 在线值：发帖 6 回帖 21 粉丝 30 关注私信	BitWarden 1 14 楼。最后于 1天前被BitWarden编辑，原因： 1天前 0
	游客登录 \| 注册方可回帖回帖表情雪币赚取及消费高级回复

BitWarden

发帖

回帖

RANK

关注

私信

他的文章

关于我们

联系我们

企业服务

看雪公众号

最新回复 (13)
淡然他徒弟雪币： 5401 活跃值： (6653) 能力值： ( LV10，RANK：160 ) 在线值：发帖 23 回帖 280 粉丝 122 关注私信	淡然他徒弟 1 2 楼 mark，学习了 2026-4-30 22:16 0
Imxz 雪币： 104 活跃值： (8407) 能力值： ( LV2，RANK：10 ) 在线值：发帖 6 回帖 569 粉丝 8 关注私信	Imxz 3 楼 tql 6天前 0
Ankeys 雪币： 679 能力值： ( LV1，RANK：0 ) 在线值：发帖 1 回帖 78 粉丝 1 关注私信	Ankeys 4 楼看完感觉整体都是在讲一个逆向的Harness设计,不知道理解的是不是到位了. 我之前也尝试过做类似的工程结构,但是实际搞下来发现会有很严重的资源浪费,很多其实没那么复杂的分析,也会被强行靠到整个架子上来,相比于直接连个ida-mcp然后扔给他一句话,让他从汇编层面分析逻辑,需要花费更多的时间和Token. 这个问题楼主是怎么解决的 4天前 0
初学者有毅力雪币： 190 活跃值： (1320) 能力值： ( LV3，RANK：26 ) 在线值：发帖 7 回帖 49 粉丝 1 关注私信	初学者有毅力 5 楼这是对早期AI有效果,,现在AI已经很聪明了,,过多的引导只会让AI陷入迷茫,AI会遵守你的规程导致没办法发挥的出AI最大的想象力,聪明反被聪明误! 4天前 0
BitWarden 雪币： 1248 活跃值： (1035) 能力值： ( LV5，RANK：70 ) 在线值：发帖 6 回帖 21 粉丝 30 关注私信	BitWarden 1 6 楼初学者有毅力这是对早期AI有效果,,现在AI已经很聪明了,,过多的引导只会让AI陷入迷茫,AI会遵守你的规程导致没办法发挥的出AI最大的想象力,聪明反被聪明误! 最先进的ai能否在保密级别较高的单位使用。如果只有一个qwen235b如何解决。Claude和codex已经在收紧策略禁止漏洞分析。有考虑过小模型问题吗？我主要做算法还原要求精度是二进制级别的反编译等价。有试过吗？普通逆向你随便怎么折腾 4天前 0
BitWarden 雪币： 1248 活跃值： (1035) 能力值： ( LV5，RANK：70 ) 在线值：发帖 6 回帖 21 粉丝 30 关注私信	BitWarden 1 7 楼 Ankeys 看完感觉整体都是在讲一个逆向的Harness设计,不知道理解的是不是到位了. 我之前也尝试过做类似的工程结构,但是实际搞下来发现会有很严重的资源浪费,很多其实没那么复杂的分析,也会被强行靠到整个架 ... 要看具体的业务，很多时候我这边都是从一个小需求扩大的传统的ai分析到后面会生成大量的tools并且逆向分析的结果都在上下文中最后还是需要产出文档管理很混乱。稍微简单的东西我直接手工古法就搞完了 4天前 0
BitWarden 雪币： 1248 活跃值： (1035) 能力值： ( LV5，RANK：70 ) 在线值：发帖 6 回帖 21 粉丝 30 关注私信	BitWarden 1 8 楼 Ankeys 看完感觉整体都是在讲一个逆向的Harness设计,不知道理解的是不是到位了. 我之前也尝试过做类似的工程结构,但是实际搞下来发现会有很严重的资源浪费,很多其实没那么复杂的分析,也会被强行靠到整个架 ... 最后于 4天前被BitWarden编辑，原因： 4天前 0
BitWarden 雪币： 1248 活跃值： (1035) 能力值： ( LV5，RANK：70 ) 在线值：发帖 6 回帖 21 粉丝 30 关注私信	BitWarden 1 9 楼 Ankeys 看完感觉整体都是在讲一个逆向的Harness设计,不知道理解的是不是到位了. 我之前也尝试过做类似的工程结构,但是实际搞下来发现会有很严重的资源浪费,很多其实没那么复杂的分析,也会被强行靠到整个架 ... 其实最主要还是需要根据不同的项目业务特点来做工程化的开展。这样就是为什么Claude要有这么多设计的原因。我周围的朋友做协议的做兼容性的不同业务他们的工程和我的完全不一样也交流过一些心得。核心还是需要管理上下文。在某一个方向干久之后会发现真的是固定的流程。分析mfc分析qt切入点其实都是一套固定的思路。分析游戏引擎等等。都有切入点这些转换成skills一定是省token的会比你ai自己去做好很多没有一个专门给逆向训练的模型。 4天前 0
wx_Lilac_176 雪币： 0 能力值： ( LV1，RANK：0 ) 在线值：发帖 0 回帖 3 粉丝 0 关注私信	wx_Lilac_176 10 楼有尝试做基准测试吗？这样一套 agent，相比直接用 coding agent（codex/cc/cursor）真的更强大吗？ 3天前 0
lixianhuei 雪币： 1122 活跃值： (1660) 能力值： ( LV2，RANK：10 ) 在线值：发帖 0 回帖 97 粉丝 0 关注私信	lixianhuei 11 楼 666 2天前 0
Ankeys 雪币： 679 能力值： ( LV1，RANK：0 ) 在线值：发帖 1 回帖 78 粉丝 1 关注私信	Ankeys 12 楼 BitWarden 其实最主要还是需要根据不同的项目业务特点来做工程化的开展。这样就是为什么Claude要有这么多设计的原因。我周围的朋友做协议的做兼容性的不同业务他们的工程和我的完全不一样也交流过一些心得。核心还是需 ... 如果说打算使用国产模型,或者社区开源模型的话,那搞这样一套工程结构那确实必不可少了.那这套系统最后是如何验证产出的呢,人工check结果嘛 1天前 0
BitWarden 雪币： 1248 活跃值： (1035) 能力值： ( LV5，RANK：70 ) 在线值：发帖 6 回帖 21 粉丝 30 关注私信	BitWarden 1 13 楼 Ankeys 如果说打算使用国产模型,或者社区开源模型的话,那搞这样一套工程结构那确实必不可少了.那这套系统最后是如何验证产出的呢,人工check结果嘛肯定是业务交付啊。最后于 1天前被BitWarden编辑，原因： 1天前 0
BitWarden 雪币： 1248 活跃值： (1035) 能力值： ( LV5，RANK：70 ) 在线值：发帖 6 回帖 21 粉丝 30 关注私信	BitWarden 1 14 楼。最后于 1天前被BitWarden编辑，原因： 1天前 0
	游客登录 \| 注册方可回帖回帖表情雪币赚取及消费高级回复

[原创]打破传统AI逆向的新思路 多Agent、自主管理上下文 - 逆向思路

[原创]打破传统AI逆向的新思路多Agent、自主管理上下文 - 逆向思路