首页
社区
课程
招聘
[原创]利用编译器优化干掉控制流平坦化flatten
发表于: 2021-3-6 16:33 40611

[原创]利用编译器优化干掉控制流平坦化flatten

2021-3-6 16:33
40611

上一篇在这里https://bbs.pediy.com/thread-265335.htm利用编译器优化干掉虚假控制流

上一篇我们通过优化去除了类似x * (x + 1) % 2 == 0的虚假控制流,这里的混淆去除bcf之后如下图,很明显的平坦化混淆

图上已经比较清晰了,黄色圈住的块是进入平坦化,离开平坦化return,选择控制流的switch混淆块,

蓝色的两块如果执行到的话就是真实块,其余基本都是case混淆块

具体算法过程如下,这里参考了大佬的思路,看到大佬又发了一篇vmp的,下面必须抽空继续学习


一种通过后端编译优化脱混淆壳的方法https://bbs.pediy.com/thread-260626.htm


0.把ir中所有switch指令转换为cmp+br指令

1.遍历所有block,如果某个block的Predecessor >6,可能是混淆节点,也就是switch块,标记为ob

2.获取ob的Successor后续块的Terminator指令,如果是条件跳转cmp+br,getOperand(0)就得到switchvar

3.根据switchvar这个Value类的实例,遍历所有使用这个值的Users ,挑出其中指令为cmp且switchvar为op0的Users,标记为case分发块

4.紧随case分发块之后一直到ob混淆块或者return的为真实块。这里大概有这几种情况

4.1赋值->多个case分发块->1个或多个真实块->ob块->赋值->下一次循环 这种是包含了真实块的有用执行路径

4.2赋值->多个case分发块->赋值->ob块->下一次循环  这种是只改变switchvar的无用路径

4.3赋值->多个case分发块->ob块->下一次循环 这种在ob块的phi节点上没有赋值,是永远不可能执行的路径,在分析ob块的phi节点时可以直接删掉

5.根据所有分发块建立二叉树,根节点为ob节点,往下遍历block寻找结尾cmp+br指令,左节点为true,右为false,直到没有br指令或者cmp不为switchvar,就到达真实块开头,它正对着的混淆phi节点前驱块为真实块结尾

6.从混淆phi节点开始,根据switchvar的Use往上追踪所有赋值,遇到phi继续追踪直到定值,建立混淆phi节点前驱块与switchvar赋值一一对应,没有switchvar赋值的phi路径肯定不会执行

7.模拟执行,第一次switchvar的值在进入switch时赋予,也就是ob块的后继块的phi左值,其余的在到达ob混淆节点后由phi指令赋予,最后一次必然到达return指令,理清楚整个路径的顺序

8.把真实块通过br连接起来,优化,这个函数其实只有一个真实块


遍历所有block,如果某个block的Predecessor >6,可能是混淆节点,也就是switch块,标记为ob

获取ob混淆块的Successor后续块的Terminator指令,如果是条件跳转cmp+br,getOperand(0)就得到switchvar

根据switchvar这个Value类的实例,遍历所有使用这个值的Users ,挑出其中指令为cmp且switchvar为op0的Users,标记为case分发块


紧随case分发块之后一直到ob混淆块或者return的为真实块

遍历ob块phi节点获取所有switchvar,这里有一些retdec识别错误的ConstantExpr我们把它替换成Constant

本来想学着用klee的,破单位网速太差一直下一半断掉,没办法只能自己试着写

blk向量存储了所有判断状态变量switchvar的的block,blk2向量存储了所有ob混淆block的前驱块,excute向量存储了所有执行过的block,

很明显每次执行首先获得switchvar,然后沿着路径根据blk的br一直执行到blk2也就是ob混淆block的前驱块,

通过ob混淆块的phi节点更改switchvar,执行下一条路径


[培训]内核驱动高级班,冲击BAT一流互联网大厂工作,每周日13:00-18:00直播授课

最后于 2021-3-6 17:25 被挤蹭菌衣编辑 ,原因:
收藏
免费 13
支持
分享
打赏 + 1.00雪花
打赏次数 1 雪花 + 1.00
 
赞赏  Editor   +1.00 2021/03/08 精品文章~
最新回复 (22)
雪    币: 12502
活跃值: (3053)
能力值: ( LV3,RANK:20 )
在线值:
发帖
回帖
粉丝
2
我就看到那句“辣鸡注释少个s,害我浪费半个小时”。xswl
2021-3-6 17:16
0
雪    币: 5235
活跃值: (3260)
能力值: ( LV10,RANK:175 )
在线值:
发帖
回帖
粉丝
3
白菜大哥 我就看到那句“辣鸡注释少个s,害我浪费半个小时”。xswl[em_19]
llvm10源码头文件里面少个s,我粘贴过来的,一直编译出错,搞了2个多小时才搞明白错误
2021-3-6 17:22
0
雪    币: 5235
活跃值: (3260)
能力值: ( LV10,RANK:175 )
在线值:
发帖
回帖
粉丝
4

配合这篇实现原理基于LLVM Pass实现控制流平坦化https://bbs.pediy.com/thread-266082.htm食用更佳哦

最后于 2021-3-6 18:00 被挤蹭菌衣编辑 ,原因:
2021-3-6 17:59
0
雪    币: 2155
活跃值: (3216)
能力值: (RANK:260 )
在线值:
发帖
回帖
粉丝
5
不错,谢谢分享
2021-3-6 21:22
0
雪    币: 5235
活跃值: (3260)
能力值: ( LV10,RANK:175 )
在线值:
发帖
回帖
粉丝
6
xiaohang 不错,谢谢分享
感谢斑竹大佬支持
2021-3-6 22:37
0
雪    币: 530
活跃值: (975)
能力值: ( LV2,RANK:10 )
在线值:
发帖
回帖
粉丝
7
什么单位可以光明正大地摸鱼,俺也想去
2021-3-7 22:09
0
雪    币: 15172
活跃值: (16837)
能力值: (RANK:730 )
在线值:
发帖
回帖
粉丝
8
感谢分享,希望继续出干货!
2021-3-8 09:05
0
雪    币: 420
活跃值: (2638)
能力值: ( LV2,RANK:10 )
在线值:
发帖
回帖
粉丝
9
赞,这个超级厉害!!!
2021-3-8 09:34
0
雪    币: 26399
活跃值: (63267)
能力值: (RANK:135 )
在线值:
发帖
回帖
粉丝
10
感谢分享~
2021-3-8 10:38
0
雪    币: 5235
活跃值: (3260)
能力值: ( LV10,RANK:175 )
在线值:
发帖
回帖
粉丝
11
Editor 感谢分享~
感谢斑竹打赏
2021-3-8 19:28
0
雪    币: 18
活跃值: (941)
能力值: ( LV2,RANK:10 )
在线值:
发帖
回帖
粉丝
12
膜完慢慢学习
2021-3-10 10:15
0
雪    币: 1000
活跃值: (36)
能力值: ( LV2,RANK:10 )
在线值:
发帖
回帖
粉丝
13
厉害了
2021-5-7 20:59
0
雪    币: 78
活跃值: (1484)
能力值: ( LV5,RANK:60 )
在线值:
发帖
回帖
粉丝
14

111

最后于 2021-10-9 14:09 被淡淡的荧光编辑 ,原因:
2021-10-8 19:12
0
雪    币: 5235
活跃值: (3260)
能力值: ( LV10,RANK:175 )
在线值:
发帖
回帖
粉丝
15
淡淡的荧光 楼主这篇文章很奇怪,既然想用编译优化去混淆,又没有用到任何控制流和数据流分析,基本都是在做特征匹配,最后又用到了模拟执行,既然用模拟执行,又做特征匹配,干脆不直接在二进制做特征匹配,看的出来楼主对re ...
本人能力有限  求大佬指教改进 我其实就用了retdec里的capstone2llvmir 其余优化用的llvm自己的优化 开始是把llvm当个黑盒用的  
我那个模拟执行其实就是最低级的计算数据块先后顺序的控制流  
ud链的构建,常量表达式求解都是生成ir时候执行的我没有动  ir仿真器源码里我看到了不会用 或者说尝试使用失败没办法自己瞎写了个
看得出大佬对retdec很有研究 大佬有什么初级一点的学习使用案例能分享给我学习吗比如对于ud链的构建,常量表达式求解,ir仿真器的使用等等  
2021-10-8 21:52
0
雪    币: 78
活跃值: (1484)
能力值: ( LV5,RANK:60 )
在线值:
发帖
回帖
粉丝
16

1111

最后于 2021-10-9 13:46 被淡淡的荧光编辑 ,原因:
2021-10-9 11:29
0
雪    币: 5235
活跃值: (3260)
能力值: ( LV10,RANK:175 )
在线值:
发帖
回帖
粉丝
17
听完楼上大佬解惑 我仍然有很多问题
1.找不透明谓词恒等式不用特征匹配怎么判断他是恒等式 像是包含x(x-1)%2这种形式的恒等式   其余的llvm的pass的常量传播代数变换之类优化都可以直接用
楼上大佬怎么写优化pass  方便的话希望能展示一下你的代码 
2. 我找前驱块其实也就是找回边最多的块   一般的swtich平坦化或者类switch平坦化回边最多的也就是前驱块最多的肯定是switch块    遇到嵌套的混淆或者更复杂的稍微修改一下照样能用  不知道你说的不靠谱是什么混淆 有没有实例学习一下
3.我所谓的模拟执行 就是根据控制流信息和du链信息通过判断switch变量变化寻找后继块  最后统一衔接  
du链信息直接用llvmir的du信息 你说的“循环头开始向下遍历,根据ud链信息找到条件变量所有定值块,定值块的值就是它目标块的索引值,所以可以根据索引值直接将定值块的后继块指向对应的目标块,并删除衔接块”实质上跟我的代码一样 我代码比较烂所以你可能没看懂我写的循环
4.你说的“静态分析可解决大部分问题,比较复杂的需要依赖动静结合”我同意  大部分纯优化也可以搞定了
“直接上来就unicorn模拟执行找特征,没什么营养”这句话我不敢苟同 无论用什么方法只要能解决掉混淆就是好方法 你要是觉得别人unicorn模拟执行没什么营养 你倒是放你的代码给大家学习啊
最后 跪求大佬展示一下自己的优化代码让我等彩笔膜拜一下 毕竟看完大佬的言论我感觉各种混淆已被大佬踩在脚底了
2021-10-9 13:25
0
雪    币: 78
活跃值: (1484)
能力值: ( LV5,RANK:60 )
在线值:
发帖
回帖
粉丝
18
1. 我不是无脑喷,我也给了我个人的思路见解,并且说了代码可以参考retdec的常量分析相关逻辑,第二我说直接上来就unicorn模拟执行并不是说模拟执行的思路不好,我也说了动静结合效果很好,我说的是很多连混淆都没搞清楚,就用模拟执行特征匹配,对于这类文章看的一头雾水。第三我只是说了一下我的思路,你觉得没有用就略过
2021-10-9 13:43
0
雪    币: 5235
活跃值: (3260)
能力值: ( LV10,RANK:175 )
在线值:
发帖
回帖
粉丝
19
淡淡的荧光 1. 我不是无脑喷,我也给了我个人的思路见解,并且说了代码可以参考retdec的常量分析相关逻辑,第二我说直接上来就unicorn模拟执行并不是说模拟执行的思路不好,我也说了动静结合效果很好,我说的是 ...
我不是觉得没有用 只是想学习一下高手的代码  求你展示一下 
 另外一般混淆的原理有混淆pass源码我觉得大家都懂得  你说的“连混淆都没搞清楚,就用模拟执行特征匹配”目前我还没见过这类文章  请问你说的是哪一类  看的一头雾水
还是说 你的个人的思路见解还只停留在思路?那么 没有代码我也可以理解
2021-10-9 15:47
0
雪    币:
能力值: ( LV1,RANK:0 )
在线值:
发帖
回帖
粉丝
20
大佬,我发现retdec对于指针的调用,机器码转ir转的不对。比如jni函数调用blr x8这种,retdec会翻译成ret。
2022-1-18 10:45
0
雪    币: 5235
活跃值: (3260)
能力值: ( LV10,RANK:175 )
在线值:
发帖
回帖
粉丝
21
这个很多转的有问题的,需要自己先修改汇编或者自己写一个识别
2022-1-20 18:55
0
雪    币: 3903
活跃值: (3564)
能力值: ( LV6,RANK:90 )
在线值:
发帖
回帖
粉丝
22
挤蹭菌衣 这个很多转的有问题的,需要自己先修改汇编或者自己写一个识别
继续发干货啊,大佬
2022-1-24 10:44
0
雪    币: 5235
活跃值: (3260)
能力值: ( LV10,RANK:175 )
在线值:
发帖
回帖
粉丝
23
APT_华生 继续发干货啊,大佬
太菜了 没有产出了
2022-1-25 21:26
0
游客
登录 | 注册 方可回帖
返回
//