首页
社区
课程
招聘
[原创]从Frida源码学习ArtHook
发表于: 2021-8-22 13:02 18546

[原创]从Frida源码学习ArtHook

2021-8-22 13:02
18546

为了填AppInspect的坑,开始研究ArtHook。

从Frida入手是因为的资料多,更新频繁。

坏处是Frida体系庞大,比其他单纯的Hook框架复杂。

Frida的native hook代码在frida-gum,虽然是C语言,但用了gobject框架,对没接触过的人需要一定时间习惯。

Frida的art hook代码在 frida-java-bridge ,纯js代码实现。

通过enumerateLoadedClasses的执行流程,作为入口开始代码走读。

第一步是初始化Runtime,这个Runtime是Art Runtime在js侧的一个代理,是Frida ArtHook的核心。

通过getApi()获取Art Runtime的Api接口。

怎么理解获取Api呢,

Android程序运行时,art运行时会以libart.so等动态库的形式加载在当前进程的地址空间中。那我们能不能像访问libc.so里的函数一样访问里面的函数呢?

答案是肯定的,

从CPU运行流程看,调用一个函数就是,准备好函数的参数,跳到函数地址执行。

这里只有两个问题要解决:

只是如果你在ndk的代码里调用c库的函数,头文件解决了参数问题,而函数地址,在编译时和运行时由链接器帮你填好。

但对于libart.so我们只能自己动手了,好在Linux有一套运行时加载so的机制。

https://tldp.org/HOWTO/html_single/C++-dlopen/

但在Android 7以后,限制了App直接调用dlopen打开libart.so等系统库,

作为例外libc .so, libandroid.so等在白名单里的不受影响。白名单在/system/etc/public.libraries.txt

除了白名单,还有一个在代码里写死的灰名单,需在编译App时把targetSdk设定为23之前才能有效。

那么怎么绕过这个限制等呢:

有两种方法:

跟踪调用,真正干活的是linker中的do_dlopen函数,它会根据__loader_dlopen传进来的caller_addr,检查调用者所属的模块,然后根据模块查找其对应命名空间,判断是否允许加载。

所以只要传一个系统库中的函数,就能加载其他在同一个命名空间里的系统模块。

如何找一个跟目标模块命名空间相同的地址呢,

方法1,调用dl_iterate_data

The dl_iterate_phdr() function walks through the list of an application's shared objects and calls the function callback once for each object,

参考快手的KOOM

原理就是调用dl_iterate_phdr后,会在callback里返回App加载的所有模块信息,当找到目标模块时,把它基址保存下来,作为__loader_dlopen的caller_addr参数。

方法2,通过/proc/self/maps文件获取到目标模块的基址作为caller_addr。

另外,还有一个更简单的方法是传一个libc里的函数地址,但Android Q以后增加了新的命名空间,libc和libart并不在同一个命名空间里。

Rust版代码验证

看到这里,可能会有个疑问,为什么谷歌这么弱,弄个安全机制这么简单就被破解了,

看看官方对链接器命名空间的介绍,

https://source.android.com/devices/architecture/vndk/linker-namespace?hl=zh-cn

链接器命名空间解决的问题是:可以隔离不同链接器命名空间中的共享库,以确保具有相同库名称和不同符号的库不会发生冲突。

所以它不是一种安全机制,只是为了安全的解析符号,前面的操作只是对这种限制的规避,不能算漏洞,谷歌也不会去修复,所以预估能够长期使用。

回到Frida,再看看Frida是怎么解决这个dlopen限制的

因为手头只有Android 10的设备,这里只关注Android29的版本

frida-gum在里查找__dl___loader_dlopen(地址就是libdl.so的loader_dlopen),如果没有找到会通过搜索内存对比指令集特征的方式继续查找。但在Android 10上,这一步就找到了,之后的操作和前述`loader_dlopen`方式一致。

gum_linker_api_try_init

理解了这些基本原理后,后面再回到frida-java-bridge,看看js端如何访问Android 运行时。

参考:

https://bbs.pediy.com/thread-257022.htm

http://weishu.me/2018/06/07/free-reflection-above-android-p/

https://fadeevab.com/android-linker-namespace-security-flaws/

 
 
 
 
 
 
 
 
 
 
 
 
 
 
void* handle = dlopen("./hello.so", RTLD_LAZY);
typedef void (*hello_t)();
hello_t hello = (hello_t) dlsym(handle, "hello");
hello();
void* handle = dlopen("./hello.so", RTLD_LAZY);
typedef void (*hello_t)();
hello_t hello = (hello_t) dlsym(handle, "hello");
hello();
void* handle = dlopen("libart.so", RTLD_LAZY);
LOGD("dlopen %p",handle); //返回0
void* handle = dlopen("libart.so", RTLD_LAZY);
LOGD("dlopen %p",handle); //返回0
 
 

[培训]内核驱动高级班,冲击BAT一流互联网大厂工作,每周日13:00-18:00直播授课

最后于 2021-8-22 17:43 被whx编辑 ,原因:
收藏
免费 7
支持
分享
最新回复 (10)
雪    币: 230
能力值: ( LV1,RANK:0 )
在线值:
发帖
回帖
粉丝
2
2021-8-22 15:35
0
雪    币: 154
活跃值: (3786)
能力值: ( LV3,RANK:30 )
在线值:
发帖
回帖
粉丝
3
文中关于dlopen相关的,frida的实现应该是在frida-core中的,https://github.com/frida/frida-core/blob/1a7cec96a11b9ecb60501a6bf27c4f0963cb44de/src/linux/frida-helper-backend-glue.c#L3014 frida注入的过程也是通过这里找到目标进程的libc的,然后再使用libc的mmaps注册so,再使用dlopen和dlsym加载.具体的可以看:
https://frida.re/slides/osdc-2015-the-engineering-behind-the-reverse-engineering.pdf
https://www.youtube.com/watch?v=uc1mbN9EJKQ

有什么不正确的欢迎指正,互相学习.
2021-8-23 14:52
0
雪    币: 188
活跃值: (529)
能力值: ( LV2,RANK:10 )
在线值:
发帖
回帖
粉丝
whx
4
frida-core是host侧用来注入和通讯的,Android上的hook是由frida-gum来做的,不依赖frida-core。

我没仔细看frida-core的代码,估计是host侧注入的时候需要类似的操作加载so吧
2021-8-23 15:19
0
雪    币: 188
活跃值: (529)
能力值: ( LV2,RANK:10 )
在线值:
发帖
回帖
粉丝
whx
5

不知道为什么,我这边一到下午访问看雪就特别卡


刚跟新了第二部分 欢迎批评指正  从Frida源码学习ArtHook(二)

2021-8-23 15:24
0
雪    币: 18
活跃值: (941)
能力值: ( LV2,RANK:10 )
在线值:
发帖
回帖
粉丝
6
学习了
2021-9-2 18:46
0
雪    币: 116
活跃值: (1012)
能力值: ( LV2,RANK:10 )
在线值:
发帖
回帖
粉丝
7
学习了
2021-9-3 08:09
0
雪    币: 116
活跃值: (1012)
能力值: ( LV2,RANK:10 )
在线值:
发帖
回帖
粉丝
8
学习了
2021-9-3 08:09
0
雪    币: 1094
活跃值: (1166)
能力值: ( LV2,RANK:10 )
在线值:
发帖
回帖
粉丝
9
学习了。
2021-9-3 09:02
0
雪    币: 34
活跃值: (734)
能力值: ( LV2,RANK:10 )
在线值:
发帖
回帖
粉丝
10
存在一个模拟器架构转换后,如何执行的问题,比如模拟器是x86,使用native_briage后,可以运行arm的指令,这个时候,又要如何处理呢
2023-11-28 17:46
0
雪    币: 116
活跃值: (1012)
能力值: ( LV2,RANK:10 )
在线值:
发帖
回帖
粉丝
11
复习了
2023-12-4 18:16
0
游客
登录 | 注册 方可回帖
返回
//