[原创] 使用BinaryNinja去除libtprt.so的混淆 (一)-逆向工程-看雪安全社区

[原创] 使用BinaryNinja去除libtprt.so的混淆 (一)

发表于: 2024-8-9 17:32 17727

[原创] 使用BinaryNinja去除libtprt.so的混淆 (一)

0xEEEE

2024-8-9 17:32

17727

文章中的思路只是个人想法, 并不是最优解, 如有错误还望斧正.
插件代码github: detx 916K9s2c8@1M7s2y4Q4x3@1q4Q4x3V1k6Q4x3V1k6Y4K9i4c8Z5N6h3u0Q4x3X3g2U0L8$3#2Q4x3V1k6q4c8f1g2q4K9r3g2^5i4K6u0r3k6r3g2@1P5l9`.`.

版本: speedmobile_1.45.0.53757.apk中的libtprt.so

文章将分享去除[寄存器间接跳转]与[魔改控制流平坦化]混淆的思路, 并编写去混淆插件代码

libtprt.so中的混淆大体分为三种类型:

以及这三种的穿插混合, 这些混淆要么是获取信息麻烦, 要么是Patch起来麻烦, 总之就是很麻烦

本文将先分享去除[寄存器间接跳转]混淆的思路, 主要是Patch思路

其实就是跳转地址是计算出来的, 如下图所示:
jmpreg
这种混淆就是把原先的逻辑跳转改为了jmp(var2)
其中var2 = mem[var1 (<< num)] + const 这些值其实都是可以确定的, 即:

通过cond设置偏移var1, 然后从跳转表data_1fd630中拿出var1偏移处的值, 然后+/-一个常量就得到真正的跳转地址了

我的思路是静态分析+模拟执行:

例如一次混淆涉及到的如下指令:
involve_asm
具体来说就是:

问: 可以直接模拟执行br之前的全部指令, 不去识别一次混淆涉及到的指令吗?
答: 可以是可以, 但这样会涉及到非混淆的真实指令, 我感觉处理起这种情况来不比去识别混淆指令简单.

假设现在已经知道了两个跳转地址是多少, 怎么去Patch呢?
我们的Patch不能改变了原始的逻辑, 比如说:
问: 可以把"csel x11, x28, x27"改为"b.lt t_addr", 把"br x12"改为"b f_addr"这样patch吗?
答: 不可以, 因为原始逻辑是在csel之后还执行了"0x9cc6c 0x9cc70 0x9cc78"这些指令, 如果从0x9cc64处就改成"b.lt"跳转, 那逻辑就不对了, 原逻辑中br之前执行的指令就少执行了一部分.
.
问: 可以上移指令(因为混淆指令是无效的可以随便覆盖), 然后在末尾插入"b.lt + b"指令吗?
答: 不可以, 比如说0x9cc74处的指令属于混淆指令, 是无效的, 将其改为:
tiqian
就是把csel ... br中间的指令全部上移覆盖上一个指令, 在末尾多出一个指令的空间, 但这样会出现一个问题, 原逻辑中是:

这样Patch之后就变成了:

条件判断被覆盖了, 原本逻辑是判断的"cmp w12, w23"这样一改变成判断"cmp w12, w15"了
.
那要怎么Patch?我的思路如下:

就是cmp下沉, 将"cmp + b.cc + b"放到一起, 这样就不会因为其他指令的cmp导致条件被覆盖了
问: 这样下沉如果cmp w7, w22中的w7和w22被之前的指令改变了怎么办?
答: 事实证明是不会的, 我一开始的思路是不移动cmp而是在cmp之后保存nzcv标志位到例如w10中, 然后b.cc之前再恢复标志位, 结果发现有没有保存nzcv都一样.
其实这个so中的函数都是在控制流平坦化之上又加了一层寄存器间接跳转, 所以这些cmp指令其实是控制流平坦化的分发指令, 这些值(w7,w22之类的)在进入分发逻辑之前就确定好了, 是不会被改变的.

代码逻辑分为: ①模拟执行 ②信息获取 ③Patch逻辑三部分

采用unicorn框架, 具体请查看emulate.py中的"Emulator" "FuncEmulate" "DeJmpRegEmulate"三个类, 其实就是给unicorn封装了一层.
修改条件选择指令时要根据不同的类型进行修改:

问: 怎么通过代码拿到一次混淆涉及到的全部指令?
答: 我是通过从mlil ssa层面, 因为用ssa的话, 可以很方便的查找一个变量的被写入的语句, 代码中是通过def_site.
比如从jump(x9_2#5)开始, 先拿到x9_2#5的def_site, 比如说是"x9_2#5 = x9_1#4 + 0x3872d170", 然后取出这条语句的等号右边涉及到的变量, 这里是x9_1#4, 然后拿到x9_1#4的def_site, 比如是x9_1#4 = [&data_1dd4c0 + x9#3].q @ mem#1, 然后拿x9#3的def_site, 比如是x9#3 = ϕ(x9#1, x9#2), 最后得到x9#1 = 0, x9#2 = 0x58. 其实用一个递归就解决了:

然后通过mlssa_insn.llils拿到一条mlil指令涉及到的llil指令, llil和汇编指令的地址是基本一一对应的:

实际这样下来可能会缺少指令, 就是那两个设置跳转表偏移量的指令, 比如"mov w27, #0x30"和"mov w28, #0x8"
那么就通过从当前块开始, 向前继块从后往前搜索指令, 先拿到csel/cinc指令的操作寄存器, 然后搜索类型是"mov", 第一个寄存器是条件选择指令操作寄存器的指令
具体逻辑请查看dejmpreg.py

首先要拿到从csel到br之间的所有指令, 当然可以分段获取然后移动构造, 而且分段获取的话还可以应对从后往前跳转的情况(当前混淆中是没有这种情况的), 只是我懒得写了:)

demo

//-----------------
if (Cond)
  jmp(true_addr)
else
  jmp(false_addr)
//-----------------
变为了->
//-----------------
if (Cond)
  var1 = 0;
else
  var1 = 1;
var2 = data_1fd630[var1];
var3 = var2 - 0x7218df2;
jump(var3); 
//-----------------

//-----------------

if (Cond)

jmp(true_addr)

else

jmp(false_addr)

//-----------------

变为了->

//-----------------

if (Cond)

var1 = 0;

else

var1 = 1;

var2 = data_1fd630[var1];

var3 = var2 - 0x7218df2;

jump(var3);

//-----------------

0x9cc60 cmp w12, w23  
....... 改变跳转寄存器x12
0x9cc7c br x12 

0x9cc60 cmp w12, w23

....... 改变跳转寄存器x12

0x9cc7c br x12

0x9cc60 cmp w12, w23
....... ............
0x9cc70 cmp w12, w15
....... ............
0x9cc78 b.lt 满足条件地址
0x9cc7c b 不满足条件地址

0x9cc60 cmp w12, w23

....... ............

0x9cc70 cmp w12, w15

....... ............

0x9cc78 b.lt 满足条件地址

0x9cc7c b 不满足条件地址

1. 一次混淆!至少!涉及以下7个指令(中间穿插着其他逻辑的指令):  
  mov     w10, #0x60  
  ...  
  mov     w11, #0x58  
  ...  
  cmp     w7, w22  
  ...  
  csel    x23, x11, x10, lt  
  ...  
  ldr     x25, [x12, x23]  
  ...  
  add     x7, x25, x13  
  ...  
  br      x7  
2. 改为如下:
  mov     w10, #0x60      <- 可以nop掉 不nop也不影响结果  
  ...  
  mov     w11, #0x58       
  ...
  nop                     <-  cmp     w7, w22 [cmp语句要最后统一nop 因为会可能有多个逻辑共用同一个cmp]  
  ...  
  nop                     <-  csel    x23, x11, x10, lt  
  ...  
  nop                     <-  其他涉及到的指令  
  ...  
  cmp     w7, w22         <-  ldr     x25, [x12, x23]  
  b.lt    ...             <-  add     x7, x25, x13  
  b       ...             <-  br      x7  
  大多只有第一次混淆的时候这些混淆指令会穿插在一起, 之后基本都是ldr+add+br一个整体了  

1. 一次混淆!至少!涉及以下7个指令(中间穿插着其他逻辑的指令):

mov w10, #0x60

...

mov w11, #0x58

...

cmp w7, w22

...

csel x23, x11, x10, lt

...

ldr x25, [x12, x23]

...

add x7, x25, x13

...

br x7

2. 改为如下:

mov w10, #0x60 <- 可以nop掉不nop也不影响结果

...

mov w11, #0x58

...

nop <- cmp w7, w22 [cmp语句要最后统一nop 因为会可能有多个逻辑共用同一个cmp]

...

nop <- csel x23, x11, x10, lt

...

nop <- 其他涉及到的指令

...

cmp w7, w22 <- ldr x25, [x12, x23]

b.lt ... <- add x7, x25, x13

b ... <- br x7

大多只有第一次混淆的时候这些混淆指令会穿插在一起, 之后基本都是ldr+add+br一个整体了

#如果是csinc指令, 不满足条件应该改为add x24, x1, #1 | csinc是条件不满足则xd=xm+1, cinc是条件满足则xd=xn+1
if ((insn_token[0] == 'csinc' ) and (index == 1)) or ((insn_token[0] == 'cinc') and (index == 0)): 
    if value == 'xzr':#如果是xzr寄存器就不能用add, 相当于赋值为了1
        mov_opcode = bv.arch.assemble(f"mov {cond_set_reg}, #1", condition_insn_addr) 
    else:
        mov_opcode = bv.arch.assemble(f"add {cond_set_reg}, {value}, #1", condition_insn_addr) 
elif (insn_token[0] == 'csinv') and (index == 1): 
    mov_opcode = bv.arch.assemble(f"mvn {cond_set_reg}, {value}", condition_insn_addr) #按位取反
elif (insn_token[0] == 'sneg') and (index == 1):
    mov_opcode = bv.arch.assemble(f"neg {cond_set_reg}, {value}", condition_insn_addr) #取负值
else:
    mov_opcode = bv.arch.assemble(f"mov {cond_set_reg}, {value}", condition_insn_addr) #汇编mov x4, x9

#如果是csinc指令, 不满足条件应该改为add x24, x1, #1 | csinc是条件不满足则xd=xm+1, cinc是条件满足则xd=xn+1

if ((insn_token[0] == 'csinc' ) and (index == 1)) or ((insn_token[0] == 'cinc') and (index == 0)):

if value == 'xzr':#如果是xzr寄存器就不能用add, 相当于赋值为了1

mov_opcode = bv.arch.assemble(f"mov {cond_set_reg}, #1", condition_insn_addr)

else:

mov_opcode = bv.arch.assemble(f"add {cond_set_reg}, {value}, #1", condition_insn_addr)

elif (insn_token[0] == 'csinv') and (index == 1):

mov_opcode = bv.arch.assemble(f"mvn {cond_set_reg}, {value}", condition_insn_addr) #按位取反

elif (insn_token[0] == 'sneg') and (index == 1):

mov_opcode = bv.arch.assemble(f"neg {cond_set_reg}, {value}", condition_insn_addr) #取负值

else:

登录后可查看完整内容

[招生]科锐逆向工程师培训(2026年7月3日实地，远程教学同时开班, 第56期)！

#调试逆向 #软件保护

上传的附件：

libtprt.so.zip （710.58kb，159次下载）

收藏・50

免费・0

打赏

赞赏记录

参与人

雪币

留言

时间

by_Lin

为你点赞！

2026-5-24 12:33

mb_rrvlrvbk

为你点赞！

2026-4-20 10:50

Rusty19

感谢你的贡献，论坛因你而更加精彩！

2026-2-11 02:51

ngiokweng

感谢你的贡献，论坛因你而更加精彩！

2025-12-4 16:55

阿荣413

为你点赞！

2025-12-3 09:54

Ram98

你的帖子非常有用，感谢分享！

2025-10-6 12:22

Je2em1ah

感谢你分享这么好的资源！

2025-9-13 15:28

wx_Q道长

谢谢你的细致分析，受益匪浅！

2025-7-20 17:34

yiyeqiuyu

非常支持你的观点！

2025-4-2 23:34

泺泺

感谢你的贡献，论坛因你而更加精彩！

2025-1-29 05:15

PLEBFE

为你点赞！

2024-10-14 03:41

渣渣灰

期待更多优质内容的分享，论坛有你更精彩！

2024-8-15 11:46

复活甲

感谢你的贡献，论坛因你而更加精彩！

2024-8-12 10:35

三一·

看不懂啊啊啊啊啊啊啊我都学了什么

2024-8-11 13:44

值得怀疑

非常支持你的观点！

2024-8-11 12:17

R0g

你的帖子非常有用，感谢分享！

2024-8-10 17:43

梧桐生

感谢你的贡献，论坛因你而更加精彩！

2024-8-10 15:05

deadxing

期待更多优质内容的分享，论坛有你更精彩！

2024-8-9 19:14

最新回复 (12)
fjqisba 雪币： 72 活跃值： (9278) 能力值： ( LV7，RANK：102 ) 在线值：发帖 18 回帖 334 粉丝 87 关注私信	fjqisba 2 楼老铁必须得顶一个 2024-8-9 18:31 0
fallw1nd 雪币： 946 活跃值： (2479) 能力值： ( LV4，RANK：40 ) 在线值：发帖 1 回帖 19 粉丝 34 关注私信	fallw1nd 1 3 楼 1 最后于 2024-8-9 20:51 被fallw1nd编辑，原因： 1 2024-8-9 20:20 0
fallw1nd 雪币： 946 活跃值： (2479) 能力值： ( LV4，RANK：40 ) 在线值：发帖 1 回帖 19 粉丝 34 关注私信	fallw1nd 1 4 楼 2 最后于 2024-8-9 20:51 被fallw1nd编辑，原因： 2 2024-8-9 20:28 0
mb_ldbucrik 雪币： 7 能力值： ( LV1，RANK：0 ) 在线值：发帖 0 回帖 609 粉丝 7 关注私信	mb_ldbucrik 5 楼必须支持一下 2024-8-10 10:11 0
breaklink 雪币： 9838 活跃值： (5917) 能力值： ( LV2，RANK：10 ) 在线值：发帖 0 回帖 50 粉丝 2 关注私信	breaklink 6 楼动图好评 2024-8-10 13:03 0
mb_voihvufe 雪币： 0 能力值： ( LV1，RANK：0 ) 在线值：发帖 0 回帖 7 粉丝 0 关注私信	mb_voihvufe 7 楼牛逼 2024-8-11 12:14 0
coneco 雪币： 5151 活跃值： (4978) 能力值： ( LV10，RANK：171 ) 在线值：发帖 10 回帖 141 粉丝 88 关注私信	coneco 3 8 楼感谢分享！！ 2024-8-12 09:54 0
FANGG3 雪币： 156 活跃值： (4473) 能力值： ( LV2，RANK：15 ) 在线值：发帖 6 回帖 32 粉丝 100 关注私信	FANGG3 9 楼支持~ binja的使用文章很少, 期待下一篇 2024-8-14 18:17 0
孤独的街雪币： 4586 活跃值： (7336) 能力值： ( LV2，RANK：10 ) 在线值：发帖 0 回帖 37 粉丝 2 关注私信	孤独的街 10 楼支持一下，感谢分享 2024-8-14 18:26 0
iBa0 雪币： 1551 活跃值： (5363) 能力值： ( LV4，RANK：40 ) 在线值：发帖 6 回帖 430 粉丝 37 关注私信	iBa0 11 楼我来学习了 2025-12-2 15:46 0
iBa0 雪币： 1551 活跃值： (5363) 能力值： ( LV4，RANK：40 ) 在线值：发帖 6 回帖 430 粉丝 37 关注私信	iBa0 12 楼按照博主的思路，写到最后的patch，我发现cmp指令没说怎么提呀总共 10 个汇编地址: [] 0x49cc0c: adrp x20, 0x5dd000 [] 0x49cc10: mov x21, #0xffffffffffff11d8 [] 0x49cc34: mov w27, #0x30 [] 0x49cc38: mov w28, #0x8 [] 0x49cc3c: add x20, x20, #0xc80 [] 0x49cc40: movk x21, #0xf3b7, lsl #0x10 [] 0x49cc64: csel x11, x28, x27, lt [] 0x49cc68: ldr x13, [x20, x11] [] 0x49cc74: add x12, x13, x21 [] 0x49cc7c: br x12 2025-12-3 14:20 0
iBa0 雪币： 1551 活跃值： (5363) 能力值： ( LV4，RANK：40 ) 在线值：发帖 6 回帖 430 粉丝 37 关注私信	iBa0 13 楼从博主的dejumpreg.py代码找到了，原来是遍历条件语句cond前面的代码，以基本块为单位，寻找第一个cmp指令。感谢分享，参考博主的思路和代码，自己又写了一份 2025-12-3 14:49 0
	游客登录 \| 注册方可回帖回帖表情雪币赚取及消费高级回复

0xEEEE

发帖

回帖

160

RANK

关注

私信

他的文章

关于我们

联系我们

企业服务

看雪公众号

最新回复 (12)
fjqisba 雪币： 72 活跃值： (9278) 能力值： ( LV7，RANK：102 ) 在线值：发帖 18 回帖 334 粉丝 87 关注私信	fjqisba 2 楼老铁必须得顶一个 2024-8-9 18:31 0
fallw1nd 雪币： 946 活跃值： (2479) 能力值： ( LV4，RANK：40 ) 在线值：发帖 1 回帖 19 粉丝 34 关注私信	fallw1nd 1 3 楼 1 最后于 2024-8-9 20:51 被fallw1nd编辑，原因： 1 2024-8-9 20:20 0
fallw1nd 雪币： 946 活跃值： (2479) 能力值： ( LV4，RANK：40 ) 在线值：发帖 1 回帖 19 粉丝 34 关注私信	fallw1nd 1 4 楼 2 最后于 2024-8-9 20:51 被fallw1nd编辑，原因： 2 2024-8-9 20:28 0
mb_ldbucrik 雪币： 7 能力值： ( LV1，RANK：0 ) 在线值：发帖 0 回帖 609 粉丝 7 关注私信	mb_ldbucrik 5 楼必须支持一下 2024-8-10 10:11 0
breaklink 雪币： 9838 活跃值： (5917) 能力值： ( LV2，RANK：10 ) 在线值：发帖 0 回帖 50 粉丝 2 关注私信	breaklink 6 楼动图好评 2024-8-10 13:03 0
mb_voihvufe 雪币： 0 能力值： ( LV1，RANK：0 ) 在线值：发帖 0 回帖 7 粉丝 0 关注私信	mb_voihvufe 7 楼牛逼 2024-8-11 12:14 0
coneco 雪币： 5151 活跃值： (4978) 能力值： ( LV10，RANK：171 ) 在线值：发帖 10 回帖 141 粉丝 88 关注私信	coneco 3 8 楼感谢分享！！ 2024-8-12 09:54 0
FANGG3 雪币： 156 活跃值： (4473) 能力值： ( LV2，RANK：15 ) 在线值：发帖 6 回帖 32 粉丝 100 关注私信	FANGG3 9 楼支持~ binja的使用文章很少, 期待下一篇 2024-8-14 18:17 0
孤独的街雪币： 4586 活跃值： (7336) 能力值： ( LV2，RANK：10 ) 在线值：发帖 0 回帖 37 粉丝 2 关注私信	孤独的街 10 楼支持一下，感谢分享 2024-8-14 18:26 0
iBa0 雪币： 1551 活跃值： (5363) 能力值： ( LV4，RANK：40 ) 在线值：发帖 6 回帖 430 粉丝 37 关注私信	iBa0 11 楼我来学习了 2025-12-2 15:46 0
iBa0 雪币： 1551 活跃值： (5363) 能力值： ( LV4，RANK：40 ) 在线值：发帖 6 回帖 430 粉丝 37 关注私信	iBa0 12 楼按照博主的思路，写到最后的patch，我发现cmp指令没说怎么提呀总共 10 个汇编地址: [] 0x49cc0c: adrp x20, 0x5dd000 [] 0x49cc10: mov x21, #0xffffffffffff11d8 [] 0x49cc34: mov w27, #0x30 [] 0x49cc38: mov w28, #0x8 [] 0x49cc3c: add x20, x20, #0xc80 [] 0x49cc40: movk x21, #0xf3b7, lsl #0x10 [] 0x49cc64: csel x11, x28, x27, lt [] 0x49cc68: ldr x13, [x20, x11] [] 0x49cc74: add x12, x13, x21 [] 0x49cc7c: br x12 2025-12-3 14:20 0
iBa0 雪币： 1551 活跃值： (5363) 能力值： ( LV4，RANK：40 ) 在线值：发帖 6 回帖 430 粉丝 37 关注私信	iBa0 13 楼从博主的dejumpreg.py代码找到了，原来是遍历条件语句cond前面的代码，以基本块为单位，寻找第一个cmp指令。感谢分享，参考博主的思路和代码，自己又写了一份 2025-12-3 14:49 0
	游客登录 \| 注册方可回帖回帖表情雪币赚取及消费高级回复