脚本引擎开发者在设计GC
(Garbage Collect
,简称GC
)时追踪指针不善导致的UAF
(Use-After-Free
)是一类常见的漏洞,这类问题在主流脚本引擎中都比较常见,本文用一个例子来向读者介绍这类漏洞的成因与分析思路。
CVE-2018-8353
是谷歌的Ivan Fratric
发现的一个jscript
漏洞,该漏洞在2018
年8
月被修复。这是一个UAF
漏洞,Ivan Fratric
在披露页 清晰地描述了该漏洞的成因:
There is a use-after-free vulnerability in jscript.dll related to how the lastIndex property of a RegExp object is handled. This vulnerability can be exploited through Internet Explorer or potentially through WPAD over local network. The vulnerability has been reproduced on multiple Windows versions with the most recent patches applied.
The issue is that lastIndex property of a RegExp object is not tracked by the garbage collector. If you look at RegExpObj::LastIndex you'll see that, on x64, lastIndex gets stored in a VAR at offset 272 (at least in my version), but if you take a look at RegExpObj::ScavengeCore (which gets called by the garbage collector to track various member variables) you'll notice that that offset is not being tracked. This allows an attacker to set the lastIndex property, and after the garbage collector gets trigger, the corresponding variable is going to get freed.
通俗一点说就是RegExp
类的lastIndex
成员没有被加入GC
追踪列表,如果给它赋值,在GC
时会导致lastIndex
处存储的指针变为悬垂指针。后续再访问lastIndex
时,即造成一个典型的Use-After-Free
场景。
jscript
模块目前已发现多个类似漏洞,例如CVE-2017-11793 ,CVE-2017-11903 ,CVE-2018-0866 ,CVE-2018-0935 ,CVE-2018-8353 ,CVE-2018-8653 ,CVE-2018-8389 ,CVE-2019-1429
本文试图通过CVE-2018-8353
一窥这类漏洞的成因,并在此基础上分析谷歌PoC
中的信息泄露利用代码。读者将会看到一个GC
导致的UAF
如何被转化为高质量的信息泄露漏洞。
以下为Ivan Fratric
给出的PoC
,下一小节将通过该PoC
分析漏洞成因。
@0Patch 团队已通过补丁分析发现,x86
下lastIndex
位于RegExpObj
对象的+A8
偏移处,如下:
现在RegExpObj::Create
函数内下断点,在RegExpObj
对象创建完成后,对其偏移+A8
处下一个硬件写入断点,这个偏移处存储一个VAR
结构体,此结构体在x86
下大小为0x10
。重点观察+B0
处的数据变化。
为了更清晰地解释成因,笔者并没有开启页堆,但开启了用户模式下堆申请的栈回溯,以下为调试日志:
到这里已经获得一个非常好的UAF
,接下来的问题是:如何使用它?
从调试日志中可以看出,用来存储VAR
变量的内存块是从GcBlockFactory::PblkAlloc
申请的,x86
下其申请大小固定为0x648
(这篇文章 有解释为什么x86
下这个大小是0x648
):
如果要重用被释放的内存,得在GC
后迅速用大小为0x648
的内存申请去占用之。如何做到?
一个比较好的方法是借助NameList
。jscript
对象在创建成员变量时,如果成员变量的名称过长(谷歌的文章中说这个长度阈值为4
),会在NameList::FCreateVval
函数内单独申请内存,以存储对应的成员变量,并且会以第一个成员名称的长度去申请特定大小的内存,而相关计算公式是固定的。
通过逆向调试,可以得到x86
下的计算公式:
现在,令alloc_size=0x648
,解上述方程,可得到x=0x178(0n376)
。于是可以通过下面的代码重用被释放的内存:
在调试器中观察验证重用:
前一小节已经在合适的时机控制了被Free
的内存,接下来要通过这个UAF
漏洞实现信息泄露,以得到被重用内存的起始地址。
NameList::FCreateVval
函数内在申请成员变量名内存时,若成员名长度超过一定值,就会额外申请内存去存储这些名称。第一个成员名可以用来控制申请的内存大小,相关计算过程已经在前面说明。后面的成员名称只要长度合适,就可以在第一个成员名称初始化时申请的内存中使用剩余的部分,从而用来布控内存。
在x86
环境下,通过逆向NameList::FCreateVval
函数,发现每个成员名称前面会额外留0x30
大小的空间作为头部,用于初始化各种数据。每次成员名称进行申请时,还会按照下图的计算公式按4
字节对齐并保存与返回相关偏移:
整个计算公式比较复杂,但设计思路很简单,笔者在这里描述一遍,读者只要有一些大致思路即可:x86下
,第一个成员名初始化时,先申请(2x+0x32)*2+4
的内存大小,得到内存后,最前面的4字节有自己的用途,接下来的0x30
作为头部使用,用来初始化各种数据,包括本次字符串长度,指向下一个成员名头的指针(这个指针会后面的成员名初始化时被更新)。所以从前面的调试日志也可以看到,第一个成员名从+0x34
开始被复制。只要第一次申请的内存空间够,第二个成员名会接着从LABEL_7这里按照base+4+offset
的方式进行内存地址获取,然后前0x30
又是头部,接着再开始复制,以此类推。
接下来是泄露被重用内存的首地址。
由于被重用的内容之前存储着lastIndex
引用的VAR
数据,所以只要用长度及内容合适的字符串设计类成员名称,就可以控制指定地址处的VAR
结构。
从这里开始笔者使用Ivan Fratric
在附件中给出的infoleak.html
代码,为便于展示,去除了部分注释:
name1
用来申请大小为0x648
的内存。name2
可调节,用来对齐。name3
用来指定类型,以泄露特定偏移处的一个指针,这个后面再会提及。name4
用来布控0x1337
对应的VAR
,用于jscript
代码中的条件判断。
上面的小节中只关心了name1
,现在开始来具体设计name4,name3,name2
。
首先得计算垂悬指针指向的VAR
结构在被重用内存的偏移值。Ivan Fratric
的适配的是x64
的版本,原poc
在笔者的环境中运行后0x1337
对应的i
为十进制的115
。
x64
与x86
的原理一致,笔者以x86
的版本进行说明。既然x64
环境中对应的i
为115
。x32
环境中笔者也以115
为例进行偏移计算。在上述代码中在第115
个RegExpObj
对象创建时下断点,相关方法在前面UAF
小结已经描述,这个偏移很容易计算得到。
笔者的环境中这个偏移每次固定为0x3d8
,如下:
现在来设计name
,在每个成员名称初始化时,都会有0x30
的头部,在这个头部的+0x24
处是一个指针(这个指针要到初始化下一个成员名时才会被初始化),指向下一个变量名的0x30
头部,下图中字体为红色的即为这些指针。如果能读取其中一个指针,减去其相对内存起始地址的偏移,就可以得到被重用内存的首地址。
下图中字体颜色为橙黄的是被拷贝的成员名称,每个名称最后会多拷贝两个0x00
。字体颜色为蓝色的是每个成员名称的实际长度(unicode
)。字体颜色为红色上面已经进行解释。字体背景为灰色的一个个0x30
内存区域为name2、name3、name4
三个成员名的头部。
字体背景为黄色高亮的区域,实验时发现会与name3
的值相同(意思就是给3
得3
,给5
得5
)。后面需要借助这个值来读取它后面偏移8
字节的一个红色指针。
因为要泄露某个红色指针,所以x86
下必须保证这个红色指针之前8
字节处的type
为long
型,这可以通过设计name3
来实现。现在的问题是:VAR
与某个特定的lastIndex
对应起来?
幸运的是,通过调试观察发现,当连续申请VAR
结构时,一个个大小为0x10
的VAR
似乎是从高内存往低内存次第排列。笔者用下图来通俗地解释一下VAR
的分布(name2
中b
的数量被用来调节这里的对齐):
所以,在x86
下,如果找到了0x1337
对应的regexps[i].lastIndex
,就可以通过读取regexps[i+5].lastIndex
来泄露相关指针,减去固定偏移就得到被重用内存的起始地址了。如下:
到这里已经将这个UAF
漏洞转为了信息泄露,泄露出一块(aaa...
部分)完全可控的内存的首地址。如果读者之前看过笔者之前的一篇文章 ,就会明白这里已经将CVE-2018-8353
转换为和CVE-2017-11906
具有相同功能的信息泄露漏洞。
此类信息泄露漏洞与其他堆溢出漏洞一起使用可以实现RCE
。笔者将这个漏洞的利用代码稍加改动,并配合CVE-2017-11907
一起使用,可以在未打补丁的机器上实现RCE
。
考虑到CVE-2018-8653
或CVE-2019-1429
这类在野0day
的利用方式,应该是用了更高级的利用手法,通过UAF
直接实现了任意地址读写,通过单个UAF
即可实现RCE
,并不需要其他漏洞进行辅助。
这类漏洞后面一定还会出现,请大家做好防范工作。
Issue 1587: Windows: use-after-free in JScript in RegExp.lastIndex Garbage Collection Internals of JScript
感谢ty1337指出NameList::FCreateVval函数逆向部分表述的一处错误,原文已修正
[培训]内核驱动高级班,冲击BAT一流互联网大厂工作,每周日13:00-18:00直播授课
最后于 2020-7-27 15:10
被银雁冰编辑
,原因: