[求助]内核页表随机化的计算公式-软件逆向-看雪-安全社区|安全招聘|kanxue.com

[求助]内核页表随机化的计算公式

发表于: 2021-6-6 22:41 10317

[求助]内核页表随机化的计算公式

小白iii

2021-6-6 22:41

10317

看了 hzqst 大表哥的文章 [原创]逆向TesSafe.sys有感：鹅厂是如何定位随机化的PTE_BASE，得到4个基址的计算公式分别为：

实际测试后也确实是这样，想知道上面的公式是通过简单的找规律逆运算出来的，还是说微软对这些地址的排布有一定的讲究？希望大家能解答一下我的问题，谢谢。

pte_base = (index << 39) | FFFF000000000000;

pde_base = (index << 30) | pte_base;

ppe_base = (index << 21) | pde_base;

pxe_base = (index << 12) | ppe_base;

pte_base = (index << 39) | FFFF000000000000;

登录后可查看完整内容

[招生]科锐逆向工程师培训(2024年11月15日实地，远程教学同时开班, 第51期)

#调试逆向 #系统底层 #问题讨论

收藏・4

免费・5

支持

最新回复 (13)
lytywg 雪币： 668 活跃值： (1215) 能力值： ( LV2，RANK：10 ) 在线值：发帖 10 回帖 69 粉丝 1 关注私信	lytywg 2 楼就是PTE正好需要512G才能映射完，各级页表依次在PTE后面，因为这样写比较方便所以微软就这样写了，没别的理由 2021-6-7 04:08 0
dearfuture 雪币： 2428 活跃值： (2597) 能力值： ( LV2，RANK：10 ) 在线值：发帖 6 回帖 64 粉丝 1 关注私信	dearfuture 3 楼 index是自映射项的下标，一旦index确定了，页表基址就确定了。也可以反过来说，一旦页表基址确定了，index就确定了。这种一一对应的关系是由windows的页表顺序连续映射方案决定的。PTE_BASE一定映射虚拟地址0，PTE_BASE[1]一定映射虚拟地址1...以此类推，接下来一定有一个PTE_BASE[index]映射PTE_BASE，这个index就是自映射项的下标，而且PTE_BASE[index][index]映射PTE_BASE[index]（也就是PDE_BASE)...用简单的数学知识推一下就能得出这些公式了 2021-6-7 09:32 0
烟花易冷丶雪币： 1230 活跃值： (1770) 能力值： ( LV3，RANK：30 ) 在线值：发帖 6 回帖 30 粉丝 34 关注私信	烟花易冷丶 4 楼最后于 2021-6-7 14:22 被烟花易冷丶编辑，原因： 2021-6-7 14:17 1
烟花易冷丶雪币： 1230 活跃值： (1770) 能力值： ( LV3，RANK：30 ) 在线值：发帖 6 回帖 30 粉丝 34 关注私信	烟花易冷丶 5 楼不太会看雪的编辑方式..总会存在大量空白，勉强看吧 2021-6-7 14:23 0
小白iii 雪币： 711 活跃值： (574) 能力值： ( LV2，RANK：10 ) 在线值：发帖 3 回帖 9 粉丝 1 关注私信	小白iii 6 楼烟花易冷丶不太会看雪的编辑方式..总会存在大量空白，勉强看吧请问 PTE 只有一个固定值，PMDL4 有 4 个固定值应该怎么理解呢 2021-6-9 07:23 0
小白iii 雪币： 711 活跃值： (574) 能力值： ( LV2，RANK：10 ) 在线值：发帖 3 回帖 9 粉丝 1 关注私信	小白iii 7 楼 lytywg 就是PTE正好需要512G才能映射完，各级页表依次在PTE后面，因为这样写比较方便所以微软就这样写了，没别的理由可能是我钻牛角尖了，这边思路没缕过来。 2021-6-9 07:24 0
coneco 雪币： 5029 活跃值： (4798) 能力值： ( LV10，RANK：171 ) 在线值：发帖 10 回帖 140 粉丝 76 关注私信	coneco 3 8 楼你先计算出Win10 1607以前，0x1ED这个index是怎么得来的，（自己用windbg本地内核调试算一下），然后观察规律。最后观察Win10 1607之后的index的变化。你提到的公式的左移操作数(39,30,21,12)都相差9，这个你观察Win10 1607以前的index能知道原因。 2021-6-10 21:44 0
coneco 雪币： 5029 活跃值： (4798) 能力值： ( LV10，RANK：171 ) 在线值：发帖 10 回帖 140 粉丝 76 关注私信	coneco 3 9 楼给你看一下win8.1下这个0x1ED代表什么意思：已知当前进程的CR3为35d02000， kd> !dq 35d02000+1ed*8 l1 #35d02f68 80000000`35d02863 注意，这里的PFN仍然是35d02 2021-6-10 21:46 0
lytywg 雪币： 668 活跃值： (1215) 能力值： ( LV2，RANK：10 ) 在线值：发帖 10 回帖 69 粉丝 1 关注私信	lytywg 10 楼小白iii 可能是我钻牛角尖了，这边思路没缕过来。我之前没说全，整理下思路吧 1. 让PTE_BASE按照512GB对齐实现自映射，所以微软设计成PTE_BASE就是某一项PML4E，这一项的索引记为index，为什么微软要这样设计呢，很简单就是这样的写法比较好，其它实现也有，但是没这种好。 2. 页表是自映射的，你把PML4T的物理地址放在某一个PML4E里面，寻到页表底的时候，PFN指向的是PT, 表现在虚拟地址上不就是PTE_BASE吗 3.假设把PML4T的物理地址放在某一个PDPTE里面，寻到表底指向的是PDT，也就是PDE_BASE，但此时不需要放专门往某个PDPTE写入PML4T物理地址了，只是解释下连续映射各级BASE的原理，接下来就是自映射的性质了，当你读PTE_BASE+(index << 30)时，此时读到的虚拟地址对应的是的内容是PDPT的index项, 因为该PDPT的物理地址就是PML4T，PML4T的index项的PFN又写成PML4T的物理地址>>12, 产生了套娃(所谓的自映射)，所以该PDPE项的PFN是PML4T的物理地址 >> 12，寻到表底PFN指向的是PDT，所以那个地方就是PDE_BASE 4. PPE_BASE及PXE_BASE依此类推 5.所以index就是通过对比PML4T的物理地址和某一项PML4E指向的物理地址来确定最后于 2021-6-12 16:21 被lytywg编辑，原因： 2021-6-12 16:03 1
fengyunabc 雪币： 3785 活跃值： (3947) 能力值： ( LV4，RANK：50 ) 在线值：发帖 11 回帖 526 粉丝 26 关注私信	fengyunabc 1 11 楼评论很精彩，感谢分享！ 2021-6-12 21:15 0
小白iii 雪币： 711 活跃值： (574) 能力值： ( LV2，RANK：10 ) 在线值：发帖 3 回帖 9 粉丝 1 关注私信	小白iii 12 楼 lytywg 小白iii 可能是我钻牛角尖了，这边思路没缕过来。我之前没说全，整理下思路吧1. 让PTE_BASE按照512GB对齐实现自 ... 二级页表自映射刚完全搞懂，现在换成4级以后，又有点乱了。 2021-6-12 22:44 0
lhxdiao 雪币： 2089 活跃值： (3933) 能力值： ( LV2，RANK：10 ) 在线值：发帖 16 回帖 184 粉丝 111 关注私信	lhxdiao 13 楼基址可以通过index计算出来，反之亦可，这种是通过Windows特征码判断是否可用的，可能以后Windows 10更新就把这个特性又改了 2021-6-12 23:07 0
小白iii 雪币： 711 活跃值： (574) 能力值： ( LV2，RANK：10 ) 在线值：发帖 3 回帖 9 粉丝 1 关注私信	小白iii 14 楼对于二级页表，我自己的推断是这样的，感觉逻辑是行得通的，四级页表的推算卡住了一步，再想不通我就准备先放着了： PDT 是页目录表，保存了 1024 个 PDE，指向 1024 个页表。 PT 是页表，保存了 1024 个 PTE，每一项索引一个页面，一个页表管理 4MB 的页面。 CR3 指向页目录表，其中 PDT[0] 指向第一个 PT，PDT [0] [0] 指向第一个 PTE 由于 PDT 本身占用 4KB，所以在 4MB 个 PTE 中，肯定存在一个 PTE 指向 PDT 基址。假设 PTE_BASE 为 0xXXXXXXXX，则可以计算出他的 index 和 PDI 分别为由于PTE_BASE 一定对齐到了 4MB，所以找到页目录中的第一项就是 PTE_BASE 假设基址是 D0000000，其对应的 index 为 D0000000 / 4kb = D 0000，对应的 PDI 为 832 又因为 PTE_BASE 是 PTE基址，所以要求 C0000000 能够直接找到 PDT[0]，即页目录表基址，为了满足这一条件，要求 PDT[index] 刚好可以获取到 PDT 的地址，二次寻址找到的就是 PDT[0] 除了存在 PTE_BASE[index] == PTE_BASE 外，由于 PDE_BASE 也使用了一个分页，所以也会存在页表中，即 PTE_BASE[index2] == PDE_BASE。前面已经推算出，PDT[index] 就是当前的页目录，所以可以通过 PDI 先找到 PDT，再通过 PDI 就能找到页目录的基址了。最后于 2021-6-13 01:00 被小白iii编辑，原因： 2021-6-13 00:58 0
	游客登录 \| 注册方可回帖回帖表情雪币赚取及消费高级回复

小白iii

发帖

回帖

RANK

关注

私信

他的文章

关于我们

联系我们

企业服务

看雪公众号

最新回复 (13)
lytywg 雪币： 668 活跃值： (1215) 能力值： ( LV2，RANK：10 ) 在线值：发帖 10 回帖 69 粉丝 1 关注私信	lytywg 2 楼就是PTE正好需要512G才能映射完，各级页表依次在PTE后面，因为这样写比较方便所以微软就这样写了，没别的理由 2021-6-7 04:08 0
dearfuture 雪币： 2428 活跃值： (2597) 能力值： ( LV2，RANK：10 ) 在线值：发帖 6 回帖 64 粉丝 1 关注私信	dearfuture 3 楼 index是自映射项的下标，一旦index确定了，页表基址就确定了。也可以反过来说，一旦页表基址确定了，index就确定了。这种一一对应的关系是由windows的页表顺序连续映射方案决定的。PTE_BASE一定映射虚拟地址0，PTE_BASE[1]一定映射虚拟地址1...以此类推，接下来一定有一个PTE_BASE[index]映射PTE_BASE，这个index就是自映射项的下标，而且PTE_BASE[index][index]映射PTE_BASE[index]（也就是PDE_BASE)...用简单的数学知识推一下就能得出这些公式了 2021-6-7 09:32 0
烟花易冷丶雪币： 1230 活跃值： (1770) 能力值： ( LV3，RANK：30 ) 在线值：发帖 6 回帖 30 粉丝 34 关注私信	烟花易冷丶 4 楼最后于 2021-6-7 14:22 被烟花易冷丶编辑，原因： 2021-6-7 14:17 1
烟花易冷丶雪币： 1230 活跃值： (1770) 能力值： ( LV3，RANK：30 ) 在线值：发帖 6 回帖 30 粉丝 34 关注私信	烟花易冷丶 5 楼不太会看雪的编辑方式..总会存在大量空白，勉强看吧 2021-6-7 14:23 0
小白iii 雪币： 711 活跃值： (574) 能力值： ( LV2，RANK：10 ) 在线值：发帖 3 回帖 9 粉丝 1 关注私信	小白iii 6 楼烟花易冷丶不太会看雪的编辑方式..总会存在大量空白，勉强看吧请问 PTE 只有一个固定值，PMDL4 有 4 个固定值应该怎么理解呢 2021-6-9 07:23 0
小白iii 雪币： 711 活跃值： (574) 能力值： ( LV2，RANK：10 ) 在线值：发帖 3 回帖 9 粉丝 1 关注私信	小白iii 7 楼 lytywg 就是PTE正好需要512G才能映射完，各级页表依次在PTE后面，因为这样写比较方便所以微软就这样写了，没别的理由可能是我钻牛角尖了，这边思路没缕过来。 2021-6-9 07:24 0
coneco 雪币： 5029 活跃值： (4798) 能力值： ( LV10，RANK：171 ) 在线值：发帖 10 回帖 140 粉丝 76 关注私信	coneco 3 8 楼你先计算出Win10 1607以前，0x1ED这个index是怎么得来的，（自己用windbg本地内核调试算一下），然后观察规律。最后观察Win10 1607之后的index的变化。你提到的公式的左移操作数(39,30,21,12)都相差9，这个你观察Win10 1607以前的index能知道原因。 2021-6-10 21:44 0
coneco 雪币： 5029 活跃值： (4798) 能力值： ( LV10，RANK：171 ) 在线值：发帖 10 回帖 140 粉丝 76 关注私信	coneco 3 9 楼给你看一下win8.1下这个0x1ED代表什么意思：已知当前进程的CR3为35d02000， kd> !dq 35d02000+1ed*8 l1 #35d02f68 80000000`35d02863 注意，这里的PFN仍然是35d02 2021-6-10 21:46 0
lytywg 雪币： 668 活跃值： (1215) 能力值： ( LV2，RANK：10 ) 在线值：发帖 10 回帖 69 粉丝 1 关注私信	lytywg 10 楼小白iii 可能是我钻牛角尖了，这边思路没缕过来。我之前没说全，整理下思路吧 1. 让PTE_BASE按照512GB对齐实现自映射，所以微软设计成PTE_BASE就是某一项PML4E，这一项的索引记为index，为什么微软要这样设计呢，很简单就是这样的写法比较好，其它实现也有，但是没这种好。 2. 页表是自映射的，你把PML4T的物理地址放在某一个PML4E里面，寻到页表底的时候，PFN指向的是PT, 表现在虚拟地址上不就是PTE_BASE吗 3.假设把PML4T的物理地址放在某一个PDPTE里面，寻到表底指向的是PDT，也就是PDE_BASE，但此时不需要放专门往某个PDPTE写入PML4T物理地址了，只是解释下连续映射各级BASE的原理，接下来就是自映射的性质了，当你读PTE_BASE+(index << 30)时，此时读到的虚拟地址对应的是的内容是PDPT的index项, 因为该PDPT的物理地址就是PML4T，PML4T的index项的PFN又写成PML4T的物理地址>>12, 产生了套娃(所谓的自映射)，所以该PDPE项的PFN是PML4T的物理地址 >> 12，寻到表底PFN指向的是PDT，所以那个地方就是PDE_BASE 4. PPE_BASE及PXE_BASE依此类推 5.所以index就是通过对比PML4T的物理地址和某一项PML4E指向的物理地址来确定最后于 2021-6-12 16:21 被lytywg编辑，原因： 2021-6-12 16:03 1
fengyunabc 雪币： 3785 活跃值： (3947) 能力值： ( LV4，RANK：50 ) 在线值：发帖 11 回帖 526 粉丝 26 关注私信	fengyunabc 1 11 楼评论很精彩，感谢分享！ 2021-6-12 21:15 0
小白iii 雪币： 711 活跃值： (574) 能力值： ( LV2，RANK：10 ) 在线值：发帖 3 回帖 9 粉丝 1 关注私信	小白iii 12 楼 lytywg 小白iii 可能是我钻牛角尖了，这边思路没缕过来。我之前没说全，整理下思路吧1. 让PTE_BASE按照512GB对齐实现自 ... 二级页表自映射刚完全搞懂，现在换成4级以后，又有点乱了。 2021-6-12 22:44 0
lhxdiao 雪币： 2089 活跃值： (3933) 能力值： ( LV2，RANK：10 ) 在线值：发帖 16 回帖 184 粉丝 111 关注私信	lhxdiao 13 楼基址可以通过index计算出来，反之亦可，这种是通过Windows特征码判断是否可用的，可能以后Windows 10更新就把这个特性又改了 2021-6-12 23:07 0
小白iii 雪币： 711 活跃值： (574) 能力值： ( LV2，RANK：10 ) 在线值：发帖 3 回帖 9 粉丝 1 关注私信	小白iii 14 楼对于二级页表，我自己的推断是这样的，感觉逻辑是行得通的，四级页表的推算卡住了一步，再想不通我就准备先放着了： PDT 是页目录表，保存了 1024 个 PDE，指向 1024 个页表。 PT 是页表，保存了 1024 个 PTE，每一项索引一个页面，一个页表管理 4MB 的页面。 CR3 指向页目录表，其中 PDT[0] 指向第一个 PT，PDT [0] [0] 指向第一个 PTE 由于 PDT 本身占用 4KB，所以在 4MB 个 PTE 中，肯定存在一个 PTE 指向 PDT 基址。假设 PTE_BASE 为 0xXXXXXXXX，则可以计算出他的 index 和 PDI 分别为由于PTE_BASE 一定对齐到了 4MB，所以找到页目录中的第一项就是 PTE_BASE 假设基址是 D0000000，其对应的 index 为 D0000000 / 4kb = D 0000，对应的 PDI 为 832 又因为 PTE_BASE 是 PTE基址，所以要求 C0000000 能够直接找到 PDT[0]，即页目录表基址，为了满足这一条件，要求 PDT[index] 刚好可以获取到 PDT 的地址，二次寻址找到的就是 PDT[0] 除了存在 PTE_BASE[index] == PTE_BASE 外，由于 PDE_BASE 也使用了一个分页，所以也会存在页表中，即 PTE_BASE[index2] == PDE_BASE。前面已经推算出，PDT[index] 就是当前的页目录，所以可以通过 PDI 先找到 PDT，再通过 PDI 就能找到页目录的基址了。最后于 2021-6-13 01:00 被小白iii编辑，原因： 2021-6-13 00:58 0
	游客登录 \| 注册方可回帖回帖表情雪币赚取及消费高级回复