首页
社区
课程
招聘
[原创]谈谈幽灵和熔断两兄弟
发表于: 2018-1-11 13:47 11386

[原创]谈谈幽灵和熔断两兄弟

2018-1-11 13:47
11386

最近爆出的CPU漏洞引起业内外人士一片哗然,其影响之广,危害之大相信各位都已了解。我就谈一谈自己对这两个漏洞的理解吧。

在计算机工程领域,乱序执行(错序执行,英语:out-of-order execution,简称OoOE或OOE)是一种应用在高性能微处理器中来利用指令周期以避免特定类型的延迟消耗的范式。在这种范式中,处理器在一个由输入数据可用性所决定的顺序中执行指令,而不是由程序的原始数据所决定。在这种方式下,可以避免因为获取下一条程序指令所引起的处理器等待,取而代之的处理下一条可以立即执行的指令。    


分支预测器(英语:Branch predictor)是一种数字电路,在分支指令执行结束之前猜测哪一路分支将会被运行,以提高处理器的指令流水线的性能。使用分支预测器的目的,在于改善指令管线化的流程。现代使用指令管线化处理器的性能能够提高,分支预测器对于现今的指令流水线微处理器获得高性能是非常关键的技术。


CPU高速缓存(英语:CPU Cache,在本文中简称缓存)是用于减少处理器访问内存所需平均时间的部件。在金字塔式存储体系中它位于自顶向下的第二层,仅次于CPU寄存器。其容量远小于内存,但速度却可以接近处理器的频率。当处理器发出内存访问请求时,会先查看缓存内是否有请求数据。如果存在(命中),则不经访问内存直接返回该数据;如果不存在(失效),则要先把内存中的相应数据载入缓存,再将其返回处理器。


上边提到cpu在执行指令的时候会进行分支预测,简单来说,就是cpu在执行一个逻辑判断的时候会进行提前预测改走哪个逻辑,然后选择其中它正确的逻辑,并将其所需要的数据加入缓存中。

这样,我们看一个例子。


一般来说,如果data[untrusted_opffset_from_caller]越界,程序就会失败。但是cpu有一个预测执行的特性,如果arr1->length不在缓存之中,并且之前这个逻辑多次进入的情况下,cpu就判断if语句是真的,然后先将下一步指令所需要的内存存储到缓存之中(此时不对访问数据是否允许进行判断)。假如发现预测错误,然后回滚指令就可以了。但是这时,cpu缓存并没有清空,而spectre正是利用了这一点来获取非法内存的内容的。

1)spectre构造一个训练集,使cpu不断地进入以下的逻辑。此时这是一个很正常的逻辑,x为一个小于array1_size的值。多次训练之后,cpu自作聪明的认为,哦,这就是一个正常的逻辑,那我为了加快执行速度就在判断的时候我将下条指令的所需的内存填入缓存吧。但是,此时CPU不对这个内存的地址是否合法进行判断!只有在执行到它的时候才判断对错,并且,上层预测执行如果预测失败,cpu会回滚指令,但是不去清除这里的缓存。

2)突然,攻击者传入了一个非法的x值,x值是目标地址相当于array1的偏移(注意,在这之前攻击者已经清除掉array1_size的缓存,cpu并不知道array1_size的大小)。但是cpu还是傻傻的认为我可以进入if逻辑,那我就先将大菜准备好,等待客人到来吧。此时,cpu不知道自己已经陷入了攻击者的陷阱了(这时看来,spectre是精心构造了一个结构,其中,array1是一个普通的数组,而array2就比较神奇了,array2[256 * 512]是一个256 * 512的二维数组。为什么是256 * 512呢?这是因为单个字节最大为255。我们来看spectre构造的这个结构,x为目标地址到array1的偏移,这样当这条指令被cpu解析装入缓存之后,array1[x]处便是我们要访问的地址内容,因为是一个字节,肯定小于256。这样array2[array1[x]*512]就是一个正常的数组)。欸,cpu忽然发现这个时候x不再小于array1_size了,那我就不用等客人了,先跑去其他地方玩了,但是,它却忘了将准备好的菜倒掉(嘻嘻,这个cpu和大部分人一样懒呢,都不知道马上洗盘子洗碗)。

3)重头戏来了,我这时就要偷偷的从盘子中取菜了。这时,array2[目标内容*512]已经在缓存之中。因为读取缓存和读取内存所需的时间是不相同的,我们只需要去循环读取array2的内容,判断读取的时间就可以推测出目标内存的内容。

Meltdown利用的原理和spectre相似,只不过实现方式不同。

来看一个简化版的meltdown


[培训]内核驱动高级班,冲击BAT一流互联网大厂工作,每周日13:00-18:00直播授课

收藏
免费 2
支持
分享
最新回复 (5)
雪    币: 465
活跃值: (667)
能力值: ( LV4,RANK:40 )
在线值:
发帖
回帖
粉丝
2
好像明白了一些了。
2018-1-11 14:06
0
雪    币: 615
活跃值: (580)
能力值: ( LV4,RANK:40 )
在线值:
发帖
回帖
粉丝
3
通过访问时间来推出目标内容    ?????????????    还是没看明白,  CPU缓存里面的内容是怎么被读出来的?
2018-1-11 16:11
0
雪    币: 1380
活跃值: (116)
能力值: ( LV5,RANK:70 )
在线值:
发帖
回帖
粉丝
4
ugvjewxf 通过访问时间来推出目标内容 ????????????? 还是没看明白, CPU缓存里面的内容是怎么被读出来的?
你仔细看第  2)部分,我详细解释了。array1[x]是我们要读的内容,假如是43,array2[  43*  512]就被加载到缓存中了。我们遍历array2数组,读array2[  43*  512]的速度肯定比读array2[  1*  512]的速度快,这不就反推出了目标内存是43了么?
2018-1-11 17:15
0
雪    币: 50
活跃值: (10)
能力值: ( LV2,RANK:10 )
在线值:
发帖
回帖
粉丝
5
简单来说就是根据CPU读取缓存和内存的时长不同来逆推目标内存的值
然后目标内存的值是利用分支优化原则  骗取CPU去将目标内存的值放到缓存中
是这样么?
2018-1-18 16:11
0
雪    币: 7285
活跃值: (780)
能力值: ( LV9,RANK:270 )
在线值:
发帖
回帖
粉丝
6
spectre解释的很清楚,都很清楚
2020-6-8 22:18
1
游客
登录 | 注册 方可回帖
返回
//