[原创]利用angr符号执行去除虚假控制流-软件逆向-看雪安全社区

[原创]利用angr符号执行去除虚假控制流

发表于: 2021-2-10 18:31 27128

[原创]利用angr符号执行去除虚假控制流

34r7hm4n

2021-2-10 18:31

27128

接触OLLVM也有好长一段时间了，但一直停留在应用层面，接下来一段时间打算从进一步研究OLLVM。俗话说柿子先挑软的捏，如果说OLLVM提供的几种混淆方式有辈分之分，那么虚假控制流（Bogus Control Flow）跟它的兄弟控制流平坦化（Control Flow Flattening）比起来就是弟中弟，我们就从去除OLLVM虚假控制流混淆开始吧！

GitHub仓库：bluesadi/debogus

虚假控制流混淆通过加入包含不透明谓词的条件跳转（也就是跳转与否在运行之前就已经确定的跳转，但IDA无法分析）和不可达的基本块，来干扰IDA的控制流分析和F5反汇编。
我们先用一个简单的例子来看看OLLVM虚假控制流混淆的效果：

正常编译，在IDA中查看程序的CFG，还是比较清晰的：
图片描述
加上-ollvm -bcf选项后编译，可以看到整个程序的流程图变得十分复杂：

F5反汇编可以看到程序多出了一些莫名其妙的跳转和循环：

这些跳转中的x和y位于.bss段，并且通过交叉引用发现没有被修改过，也就是说x和y在运行过程中一直为0。这里的x和y被称为不透明谓词，所谓不透明，就是IDA难以推断其在运行时的值，但我们都知道它就是0：
图片描述

在图中y >= 10 && ((((_BYTE)x - 1) * (_BYTE)x) & 1) != 0是一个恒为false的条件，而y < 10 || ((((_BYTE)x - 1) * (_BYTE)x) & 1) == 0是一个恒为true的条件。
因此下图中用框起来的代码块永远不会被执行，那些永远不会执行到的代码块，就叫做不可达的基本块：
图片描述
这些跳转和不可达基本块并不会影响程序原有的逻辑，但会干扰我们的分析，这就是虚假控制流混淆达到的效果。

利用符号执行去混淆的基本思路是：先找到目标函数的所有基本块，再通过符号执行遍历目标函数所有可达的基本块，剩下的就是不可达的基本块。把不可达的基本块全部nop掉，就能使IDA的F5反汇编正常分析。
图片描述
首先加载我们需要的参数，比如文件名，目标函数的起始地址：

angr加载二进制文件：

获取目标函数的函数的所有基本块：

cfg是Control Flow Graph的缩写。注意cfg.nodes()中除了会包含函数本身的基本块之外，还会包含函数里调用的其他函数的基本块，所以这里用一个node.addr >= start_address and node.addr <= end_address把函数中调用的其他函数的基本块筛掉。

Hook掉目标函数中调用的所有其他函数：

angr.SIM_PROCEDURES["stubs"]["ReturnUnconstrained"]()是ReturnUnconstrained类的一个实例，在符号执行过程中它会返回一个无约束的符号，简单来说就是一个可以返回任何值的函数。
图片描述
为什么要这样Hook，原因是在符号执行一些静态链接的文件时，angr的符号执行模拟器会陷入到复杂的库函数中，导致跑的时间非常长或者根本跑不出来，这也是我把基本块的分析范围限制在目标函数内的原因。
在我研究过程中发现的另一个脚本：cq674350529/deflat显然就没有处理这个问题。

然后是符号执行的过程：

从目标函数开始，simgr.step()逐块执行，一直到没有active状态为止（可以认为是运行结束）。
step的过程有点像BFS的过程，每碰到一个跳转就会分裂出两个新的active状态（前提是两个状态都是可达的）。
一边符号执行一边将符号执行能遍历到的所以基本块的地址保存到control_flow中。

最后nop掉没有被执行到的基本块：

最后将去混淆的结果保存到另一个文件中

这里我们直接用BUUCTF上的一道题测试：[XMAN2018排位赛]Dragon Quest
可以看到很明显是虚假控制流混淆：
图片描述

运行我们的脚本去混淆：

查看去混淆后的文件，可以看到去混淆的效果还不错：

我们再测试一个更变态的文件（感谢Rimao大佬提供）。
它的流程图是这样的：

伪代码有近2000行，混淆方式是Rimao大佬魔改的虚假控制流：
图片描述
运行去混淆脚本：

IDA查看效果，发现没去干净：

并且运行也出错了：

理论上来说只要弄清混淆原理就有办法改进，不过要过年了嘛，就暂时不研究了hh

把所有不透明谓词改为0也能使IDA的F5反汇编恢复正常，用idapython脚本就能实现，因为不是文章的重点就简单贴一下代码好了233：

这种方法的优点是脚本写起来简单，也不用考虑静态链接还是动态链接的问题，缺点是面对虚假控制流的变体可能无能为力。

在上面的脚本中为了防止angr陷到库函数里面，我把符号执行的范围限定在了目标函数内。这样的缺陷是如果有多个函数被混淆了，就要运行很多次脚本。可以加入一个深度参数--depth，距离目标函数的调用深度不超过depth的函数都会被去混淆，这是一个改进方案，不过感觉代码量很大就没实现了呜呜。

另一个可以改进的地方是在去掉不可达的基本块之后，还可以顺便把跳转到这个基本块的jnz指令改成jmp指令，可能对以后要研究的去除虚假控制流变体有帮助。

我对angr的研究也不是特别深入，因此这个去混淆脚本也许不能适用于所有情况（比如上面那个魔改虚假控制流），不过应对OLLVM的虚假控制流混淆应该没有问题。Rimao师傅还提出了一个“怎么区分虚假控制流还是输入导致的分支”问题，欢迎大家讨论吧233。
过完年之后打算研究基于LLVM的混淆了，angr也会继续学习，届时还会推出一些相关的文章，欢迎大家交流学习！

#include <stdio.h>
#include <string.h>
 
int main(){
    char name[100];
    scanf("%s", name);
    if (strcmp(name, "Alice") == 0) {
        printf("hello, %s.\n", name) ;
    } else if (strcmp(name, "Bob") == 0) {
        printf ("hello, %s\n", name);
    } else {
        printf("no permission.\n") ;
    }
}

#include <stdio.h>

#include <string.h>

int main(){

char name[100];

scanf("%s", name);

if (strcmp(name, "Alice") == 0) {

printf("hello, %s.\n", name) ;

} else if (strcmp(name, "Bob") == 0) {

printf ("hello, %s\n", name);

} else {

printf("no permission.\n") ;

}

import argparse
 
parser = argparse.ArgumentParser()
parser.add_argument('-f','--file', help='The path of binary file to deobfuscate')
parser.add_argument('-s','--start', help='Start address of target function')
parser.add_argument('-e','--end', help='End address of target function')
args = parser.parse_args()
if args.file == None or args.start == None or args.end == None:
    parser.print_help()
    exit(0)
filename = args.file
start_address = int(args.start, 16)
end_address = int(args.end, 16)

import argparse

parser = argparse.ArgumentParser()

parser.add_argument('-f','--file', help='The path of binary file to deobfuscate')

parser.add_argument('-s','--start', help='Start address of target function')

parser.add_argument('-e','--end', help='End address of target function')

args = parser.parse_args()

if args.file == None or args.start == None or args.end == None:

parser.print_help()

exit(0)

filename = args.file

start_address = int(args.start, 16)

end_address = int(args.end, 16)

import angr
 
proj = angr.Project(filename, load_options={'auto_load_libs': False})

import angr

proj = angr.Project(filename, load_options={'auto_load_libs': False})

target_blocks = set()
cfg = proj.analyses.CFGFast()
cfg = cfg.functions.get(start_address).transition_graph
for node in cfg.nodes():
    if node.addr >= start_address and node.addr <= end_address:
        target_blocks.add(node)

target_blocks = set()

cfg = proj.analyses.CFGFast()

cfg = cfg.functions.get(start_address).transition_graph

for node in cfg.nodes():

if node.addr >= start_address and node.addr <= end_address:

target_blocks.add(node)

function_size = end_address - start_address + 1
target_block = proj.factory.block(start_address,function_size)
    for ins in target_block.capstone.insns:
        if ins.mnemonic == 'call':
            proj.hook(int(ins.op_str, 16), angr.SIM_PROCEDURES["stubs"]["ReturnUnconstrained"](), replace=True)

function_size = end_address - start_address + 1

target_block = proj.factory.block(start_address,function_size)

for ins in target_block.capstone.insns:

if ins.mnemonic == 'call':

proj.hook(int(ins.op_str, 16), angr.SIM_PROCEDURES["stubs"]["ReturnUnconstrained"](), replace=True)

control_flow = set()
state = proj.factory.blank_state(addr=start_address, remove_options={angr.sim_options.LAZY_SOLVES})
simgr = proj.factory.simulation_manager(state)
control_flow.add(state.addr)
while len(simgr.active) > 0:
    for active in simgr.active:
        control_flow.add(active.addr)
        simgr.step()

control_flow = set()

state = proj.factory.blank_state(addr=start_address, remove_options={angr.sim_options.LAZY_SOLVES})

simgr = proj.factory.simulation_manager(state)

control_flow.add(state.addr)

登录后可查看完整内容

传播安全知识、拓宽行业人脉——看雪讲师团队等你加入！

最后于 2021-2-11 07:02 被34r7hm4n编辑，原因：

#软件保护

收藏・87

免费・25

支持

赞赏记录

参与人

雪币

留言

时间

MikotoDev

感谢你的贡献，论坛因你而更加精彩！

2025-11-28 17:09

飘零丶

感谢你的贡献，论坛因你而更加精彩！

2025-10-29 02:08

sinker_

感谢你分享这么好的资源！

2025-10-24 04:27

mb_qmomcleg

你的帖子非常有用，感谢分享！

2025-7-17 14:45

心游尘世外

感谢你的贡献，论坛因你而更加精彩！

2025-4-30 01:05

東陽不列山

为你点赞！

2025-4-9 01:13

马先越

你的帖子非常有用，感谢分享！

2025-2-26 02:37

一路南寻

感谢你的贡献，论坛因你而更加精彩！

2025-1-12 04:04

墨穹呢

感谢你的积极参与，期待更多精彩内容！

2024-11-14 11:19

MainError

谢谢你的细致分析，受益匪浅！

2024-11-14 10:56

嫉妒的死远点

为你点赞！

2024-6-5 18:34

伟叔叔

感谢你的贡献，论坛因你而更加精彩！

2024-6-1 18:30

g0mx

为你点赞~

2023-4-18 18:28

Learn Life

为你点赞~

2023-2-24 11:46

PLEBFE

为你点赞~

2023-1-14 06:17

以和爲貴

为你点赞~

2022-11-19 15:45

户大

为你点赞~

2022-11-1 22:09

lucifer11

为你点赞~

2022-8-6 21:19

狄人3

为你点赞~

2022-3-22 21:36

裂空座

为你点赞~

2021-5-17 13:00

mb_cwlqrkbj

为你点赞~

2021-4-13 15:00

N1ptune

为你点赞~

2021-4-1 11:25

demoscene

为你点赞~

2021-2-25 18:11

mb_oxfaajng

为你点赞~

2021-2-20 18:03

34r7hm4n

为你点赞~

2021-2-10 18:33

最新回复 (17)
breaklink 雪币： 9295 活跃值： (5327) 能力值： ( LV2，RANK：10 ) 在线值：发帖 0 回帖 50 粉丝 2 关注私信	breaklink 2 楼好奇这是什么插件还能识别stl模板忘了可能是debug版最后于 2021-2-12 10:11 被breaklink编辑，原因： 2021-2-10 18:57 0
34r7hm4n 雪币： 14349 活跃值： (10884) 能力值： ( LV12，RANK：360 ) 在线值：发帖 19 回帖 54 粉丝 399 关注私信	34r7hm4n 7 3 楼 breaklink 好奇这是什么插件还能识别stl模板 IDA 7.5 2021-2-10 19:13 0
v0id_ 雪币： 8631 活跃值： (5351) 能力值： ( LV4，RANK：45 ) 在线值：发帖 7 回帖 243 粉丝 36 关注私信	v0id_ 4 楼 mark 2021-2-11 11:05 0
lookzo 雪币： 216 活跃值： (2537) 能力值： ( LV2，RANK：10 ) 在线值：发帖 2 回帖 579 粉丝 3 关注私信	lookzo 5 楼写到非常通俗易懂，容易采坑的地方都说了，很好的文章，可以加精了 2021-2-18 13:41 0
34r7hm4n 雪币： 14349 活跃值： (10884) 能力值： ( LV12，RANK：360 ) 在线值：发帖 19 回帖 54 粉丝 399 关注私信	34r7hm4n 7 6 楼 lookzo 写到非常通俗易懂，容易采坑的地方都说了，很好的文章，可以加精了谢谢 2021-2-18 14:38 0
YenKoc 雪币： 2692 活跃值： (5915) 能力值： ( LV10，RANK：177 ) 在线值：发帖 6 回帖 70 粉丝 67 关注私信	YenKoc 2 7 楼 mark了，感谢师傅分享 2021-2-19 11:15 0
eastmaster 雪币： 614 活跃值： (948) 能力值： ( LV3，RANK：30 ) 在线值：发帖 11 回帖 156 粉丝 3 关注私信	eastmaster 8 楼不错！点赞！ 2021-3-1 19:20 0
N1ptune 雪币： 1412 活跃值： (3219) 能力值： ( LV5，RANK：74 ) 在线值：发帖 5 回帖 21 粉丝 7 关注私信	N1ptune 9 楼感谢师傅分享了，帮助很大 2021-3-25 16:02 0
mb_qpogapbl 雪币： 0 能力值： ( LV1，RANK：0 ) 在线值：发帖 0 回帖 2 粉丝 0 关注私信	mb_qpogapbl 10 楼请问最后遇到的问题解决了吗 2021-4-26 22:27 0
mb_qpogapbl 雪币： 0 能力值： ( LV1，RANK：0 ) 在线值：发帖 0 回帖 2 粉丝 0 关注私信	mb_qpogapbl 11 楼请问如果是arm架构代码应该修改哪里 2021-4-27 10:04 0
tlsn 雪币： 202 活跃值： (2242) 能力值： ( LV5，RANK：61 ) 在线值：发帖 2 回帖 20 粉丝 6 关注私信	tlsn 12 楼 mark 2022-9-6 11:22 0
t0hka1 雪币： 633 活跃值： (3051) 能力值： ( LV4，RANK：45 ) 在线值：发帖 1 回帖 21 粉丝 6 关注私信	t0hka1 1 13 楼 mark 2022-9-8 11:21 0
Gift1a 雪币： 197 活跃值： (2425) 能力值： ( LV2，RANK：10 ) 在线值：发帖 1 回帖 10 粉丝 9 关注私信	Gift1a 14 楼 . 最后于 2023-5-21 19:39 被Gift1a编辑，原因： 2022-10-25 08:10 0
Gift1a 雪币： 197 活跃值： (2425) 能力值： ( LV2，RANK：10 ) 在线值：发帖 1 回帖 10 粉丝 9 关注私信	Gift1a 15 楼 0 最后于 2023-5-21 19:38 被Gift1a编辑，原因： 2022-10-25 08:11 0
Circ1e 雪币： 158 活跃值： (2191) 能力值： ( LV2，RANK：10 ) 在线值：发帖 1 回帖 38 粉丝 2 关注私信	Circ1e 16 楼牛逼 2023-12-5 16:18 0
墨穹呢雪币： 3800 活跃值： (5977) 能力值： ( LV3，RANK：20 ) 在线值：发帖 2 回帖 125 粉丝 17 关注私信	墨穹呢 17 楼感谢分享 2024-11-14 11:19 0
git_94730eaydwshawke-gif 雪币： 0 能力值： ( LV1，RANK：0 ) 在线值：发帖 0 回帖 44 粉丝 0 关注私信	git_94730eaydwshawke-gif 18 楼 6666 2026-1-28 15:29 0
	游客登录 \| 注册方可回帖回帖表情雪币赚取及消费高级回复

34r7hm4n

发帖

回帖

360

RANK

关注

私信

他的文章

关于我们

联系我们

企业服务

看雪公众号

最新回复 (17)
breaklink 雪币： 9295 活跃值： (5327) 能力值： ( LV2，RANK：10 ) 在线值：发帖 0 回帖 50 粉丝 2 关注私信	breaklink 2 楼好奇这是什么插件还能识别stl模板忘了可能是debug版最后于 2021-2-12 10:11 被breaklink编辑，原因： 2021-2-10 18:57 0
34r7hm4n 雪币： 14349 活跃值： (10884) 能力值： ( LV12，RANK：360 ) 在线值：发帖 19 回帖 54 粉丝 399 关注私信	34r7hm4n 7 3 楼 breaklink 好奇这是什么插件还能识别stl模板 IDA 7.5 2021-2-10 19:13 0
v0id_ 雪币： 8631 活跃值： (5351) 能力值： ( LV4，RANK：45 ) 在线值：发帖 7 回帖 243 粉丝 36 关注私信	v0id_ 4 楼 mark 2021-2-11 11:05 0
lookzo 雪币： 216 活跃值： (2537) 能力值： ( LV2，RANK：10 ) 在线值：发帖 2 回帖 579 粉丝 3 关注私信	lookzo 5 楼写到非常通俗易懂，容易采坑的地方都说了，很好的文章，可以加精了 2021-2-18 13:41 0
34r7hm4n 雪币： 14349 活跃值： (10884) 能力值： ( LV12，RANK：360 ) 在线值：发帖 19 回帖 54 粉丝 399 关注私信	34r7hm4n 7 6 楼 lookzo 写到非常通俗易懂，容易采坑的地方都说了，很好的文章，可以加精了谢谢 2021-2-18 14:38 0
YenKoc 雪币： 2692 活跃值： (5915) 能力值： ( LV10，RANK：177 ) 在线值：发帖 6 回帖 70 粉丝 67 关注私信	YenKoc 2 7 楼 mark了，感谢师傅分享 2021-2-19 11:15 0
eastmaster 雪币： 614 活跃值： (948) 能力值： ( LV3，RANK：30 ) 在线值：发帖 11 回帖 156 粉丝 3 关注私信	eastmaster 8 楼不错！点赞！ 2021-3-1 19:20 0
N1ptune 雪币： 1412 活跃值： (3219) 能力值： ( LV5，RANK：74 ) 在线值：发帖 5 回帖 21 粉丝 7 关注私信	N1ptune 9 楼感谢师傅分享了，帮助很大 2021-3-25 16:02 0
mb_qpogapbl 雪币： 0 能力值： ( LV1，RANK：0 ) 在线值：发帖 0 回帖 2 粉丝 0 关注私信	mb_qpogapbl 10 楼请问最后遇到的问题解决了吗 2021-4-26 22:27 0
mb_qpogapbl 雪币： 0 能力值： ( LV1，RANK：0 ) 在线值：发帖 0 回帖 2 粉丝 0 关注私信	mb_qpogapbl 11 楼请问如果是arm架构代码应该修改哪里 2021-4-27 10:04 0
tlsn 雪币： 202 活跃值： (2242) 能力值： ( LV5，RANK：61 ) 在线值：发帖 2 回帖 20 粉丝 6 关注私信	tlsn 12 楼 mark 2022-9-6 11:22 0
t0hka1 雪币： 633 活跃值： (3051) 能力值： ( LV4，RANK：45 ) 在线值：发帖 1 回帖 21 粉丝 6 关注私信	t0hka1 1 13 楼 mark 2022-9-8 11:21 0
Gift1a 雪币： 197 活跃值： (2425) 能力值： ( LV2，RANK：10 ) 在线值：发帖 1 回帖 10 粉丝 9 关注私信	Gift1a 14 楼 . 最后于 2023-5-21 19:39 被Gift1a编辑，原因： 2022-10-25 08:10 0
Gift1a 雪币： 197 活跃值： (2425) 能力值： ( LV2，RANK：10 ) 在线值：发帖 1 回帖 10 粉丝 9 关注私信	Gift1a 15 楼 0 最后于 2023-5-21 19:38 被Gift1a编辑，原因： 2022-10-25 08:11 0
Circ1e 雪币： 158 活跃值： (2191) 能力值： ( LV2，RANK：10 ) 在线值：发帖 1 回帖 38 粉丝 2 关注私信	Circ1e 16 楼牛逼 2023-12-5 16:18 0
墨穹呢雪币： 3800 活跃值： (5977) 能力值： ( LV3，RANK：20 ) 在线值：发帖 2 回帖 125 粉丝 17 关注私信	墨穹呢 17 楼感谢分享 2024-11-14 11:19 0
git_94730eaydwshawke-gif 雪币： 0 能力值： ( LV1，RANK：0 ) 在线值：发帖 0 回帖 44 粉丝 0 关注私信	git_94730eaydwshawke-gif 18 楼 6666 2026-1-28 15:29 0
	游客登录 \| 注册方可回帖回帖表情雪币赚取及消费高级回复