首页
社区
课程
招聘
[原创]Windows(x86)页表与虚拟空间之我见
发表于: 2018-9-1 20:05 16260

[原创]Windows(x86)页表与虚拟空间之我见

2018-9-1 20:05
16260

运行环境:

工具软件:

参考书籍:

参考博文:

本文引用了以上书籍、文章的部分观点,算是一篇学习笔记。在此感谢各位作者!


页表机制准确的说是CPU实现的特性,由OS加以利用。网上有很多陈述页表机制的文章,但以Linux居多,Windows偏少,且很多都是理论层面借图表的阐述,或许对于科班出身的人士来说是小菜一碟,可对我等自学爱好者而言却经常是一脸懵逼的感叹!因此,萌发了动手实践的想法,经过一翻折腾,总算小有心得,就此记录于网际,希望本文能给和我一样的爱好者以帮助。本文可能存在很多歪解,请各位看官多多斧正!

本文试图解决的疑问:

从test.exe开始:

代码很简单不出大问题的话,编译运行敲回车直接崩溃QAQ。在默认设置的Win10(17134)cmd下可正常运行和退出,但没有打印“Hello nullptr”,在XP下报错终止,错误代码0xC0000005(访问违规)。可见Win10在异常处理上有所调整(记得《Windows核心编程》有提过在Vista之后即如此)。


有C/C++基础的码友一定记得一条原则,0x00000000为空指针,设计思想很简单,例如调用malloc返回0表示失败,如果返回0指针是可用的,那错误用什么表示呢?


我的运行结果是正常的,我承认我搞事情了,嘿嘿!


在动手完成空指针写入数据之前先大致了解一些基本情况,在Windbg枚举进程。

信息经过删减,留下了几个比较熟悉的进程,文中类似信息也会将无关清除,清除部分会用“...”表示,不再单独注明。

这些进程分别是:taskmgr.exe任务管理器、cmd.exe控制台、System系统进程、OllyICE.exe调试器、test.exe测试程序。

每个进程的DirBase项的16进制数可以发现以下特征:

如果你的显示结果与特征不符,那是另外一种模式PAE,本文不做解释。从特征上分析,可被4096整除说明是4K对齐;各进程不相同说明每个进程的起始页不同,因此得以隔离进程;000结尾说明PDE没有属性,PDE为何物见下文。

了解了进程信息之后,再来看看进程的地址、占用空间大小等信息,着重观察test.exe。

在任务管理器窗口红色框部分,是各进程使用物理内存占用大小,单位Kb,这些数都可以被4整除,所得商即该程序使用的内存页数。


当test.exe在前台时(最大化)使用了193(772K/4)页内存,在后台时(最小化)使用9(36/4)页,由此可见当程序非活动状态或需求非常少时,物理内存会归还给OS。从test.exe代码可知,程序阻塞在cin.get ()调用,基本上没什么运行需求。(切换的窗口是cmd,因test运行于此)。


OD窗口红色框部分,是test.exe的逻辑地址和空间大小信息,此空间大小是程序自身可能用到的大小,粗略合计约1000(4M/4K)页,通过OD的简要信息,可获知地址处都存放了什么,如主栈、PE头、.text代码段等。这里的空间大小基本是固定的。

经过以上分析得到一个结果,程序虚拟空间远大于物理占用,实际上程序在运行时,不会将所有内容都放入物理内存,仅将当前运行所需要的代码、数据放入物理页。


有了这些线索,我们通过实验来进一步印证。利用PROCESS项的16进制数将test.exe切换至当前环境。默认当前环境是System进程,所以查询显示信息将是System进程的。

使用r指令查看了cr3寄存器,显示的信息与DirBase项一致,实际上OS在后台不断的自动切换cr3,让每个进程都得到一点运行时间。


实验所需的知识点简单介绍一下(以下仅是小页面,大页面请翻阅书籍):每个进程都有一页(4K)存放一个页目录(Page Directory Entry,PDE),PDE占4K空间,分成1024项,每项4B,每项描述一个页表(Page Table Entr,PTE),PTE的高20位是基址域,低12位是属性域;PTE也占4K,同样可分成1024项,每项4B,每项描述一页(Page),Page的高20位是基址域,低12位是属性域。


根据上述可得

1024(PTE 个数)*1024(Page 个数)*4096(Page 大小)=4G(总空间);

1024(PTE 个数)*1024(Page个数)*4(描述项大小)=4M(总占用);

1024(PTE个数)*1024(Page个数)=1M(总页数);

实际总占用仅是理论值,一般程序不可能达到4G,下面实验会得到证实。


查看test.exe的PDE,我将PDE分成两部分,前512项和后512项分别进行分析,因PDE管理4G虚拟空间,但其高2G(后512项)是内核态使用,剩余低2G(前512项)由用户态使用(PAE模式用户态拥有更多的空间)。

PDE前512项中只有5个非空PTE,前面说过1个PTE占用4K物理内存,含1024个Page描述,也就是说1个PTE维护4M(1024*4096)空间,因此可认为OS给test.exe分配了20M(4*5)虚拟空间。

我把以上数据和OD的逻辑地址整理成表进行对比。

逻辑地址(OD) 

范围(4M) 

...

003AF000

...

0042D000

...

7C9B0000

7F6F0000

7FFA0000

...

7FFE0000


PDE可通过cr3得到,PDE+偏移即可找到PTE描述,PTE+偏移又可找到Page描述,Page+页内偏移可指向具体数据,这就是用逻辑地址搜索页表的过程。


进一步查看PTE索引1(第二个PTE)的内容:

截取部分中共41项非空Page描述(省略的都是空Page),第二个PTE管理的4M空间范围是0x00400000~0x007FFFFF,回顾OD截图在这4M范围内的大小合计是46页,这里相差5个页,原因是什么我不清楚,猜测可能是软件之间的误差,有知道的请告知!


PTE和Page的低12位是属性域,数据上对应的如025、067等,属性域其中一位描述了数据是在物理内存还是在硬盘的虚拟内存,OS通过属性域控制内存,PTE可控制4M,Page可控制4K。更多属性的内容请翻阅书籍。


在OD截图可知0x00401000是.text段的起始,从demo程序的显示结果获知该逻辑地址PTE的索引1偏移4,现在来看该Page内容:

或许有人会问这些数据是什么?我们来看一张截图,看完之后自然豁然开朗……!

所谓的页内偏移就是以上数据页字节的位置,Page[0]=b9,Page[1]=a0……Page[15]=e8,偏移的范围是0~4095(4K页内)。

上文书说到:“令贵妃魏璎珞为救五阿哥永琪……”。咦!好像是走错片场了……,好吧,书接上文……。

前面分析了PDE前512项,基本清楚了含盖的内容,现在来分析PDE的后512项,我将test.exe的后512项PTE与taskmgr、cmd、System、OllyICE等4个进程的后512项PTE进行了对比,发现这些PTE只有2项不同,其它完全一致,共有414项非空PTE(含2项不同),按每项管理4M来计算(414-2)*4=1648M,可认为这些空间是所有进程共享的。


不同项和偏移如下:

从数据上看不同的第一个PTE基址域都指向了自己,而属性域指明了该PTE归内核态空间所有,第二个不同PTE没有深挖。如有知者请告知。将这个位置转换成逻辑地址是0xC0000000,可以想见PTE是由内核态空间保存的。

现在来说下test.exe向0地址写入数据的方法,首先将0x00000000逻辑地址分解成三段式结构,通过所得结果找到对应页一探究竟。

或许有人会问“29e3c067”是哪里来的,《OS 学习笔记》的作者是将主栈的描述挂到此处,但我认为主栈涉及局部变量、调用参数和返回地址等,修改可能造成程序报错,因此我的方法是用OD的插件分配一页堆空间,并将堆逻辑地址解析成三段式找到对应的Page描述将其挂到此处,“29e3c067”就是该堆页的描述。

总结:

test.exe分析结果统计,1个PDE,5个PTE,占6个4K物理页,后512项那些PTE或复制或映射,总之这些都不属于当前进程,5个PTE所描述的是20M虚拟空间,程序仅用4M,20M是5120页,4M是1024页,急需运行的193页放入物理内存。

// test.exe 源码
#include <iostream>

int main()
{
    std::cin.get ();			// 等待做手脚

    int* p = NULL;
    *p = 0x89abcdef	;		// 向0指针写入数据
    std::cout << "Hello nullptr!\n";	// 改编自经典:)

    return 0;
}

代码很简单不出大问题的话,编译运行敲回车直接崩溃QAQ。在默认设置的Win10(17134)cmd下可正常运行和退出,但没有打印“Hello nullptr”,在XP下报错终止,错误代码0xC0000005(访问违规)。可见Win10在异常处理上有所调整(记得《Windows核心编程》有提过在Vista之后即如此)。


有C/C++基础的码友一定记得一条原则,0x00000000为空指针,设计思想很简单,例如调用malloc返回0表示失败,如果返回0指针是可用的,那错误用什么表示呢?


我的运行结果是正常的,我承认我搞事情了,嘿嘿!



在动手完成空指针写入数据之前先大致了解一些基本情况,在Windbg枚举进程。

kd> !process 0 0
**** NT ACTIVE PROCESS DUMP ****
PROCESS 8a0e59c8  SessionId: none  Cid: 0004    Peb: 00000000  ParentCid: 0000
    DirBase: 00039000  ObjectTable: e1000d10  HandleCount: 240.
    Image: System

PROCESS 89be5020  SessionId: 0  Cid: 05d8    Peb: 7ffd6000  ParentCid: 05e4
    DirBase: 19f3c000  ObjectTable: e1e27cc8  HandleCount:  35.
    Image: cmd.exe

PROCESS 89ba8318  SessionId: 0  Cid: 0578    Peb: 7ffde000  ParentCid: 0268
    DirBase: 19f97000  ObjectTable: e1b8ef08  HandleCount:  82.
    Image: taskmgr.exe

PROCESS 89f52c10  SessionId: 0  Cid: 07c0    Peb: 7ffde000  ParentCid: 05e4
    DirBase: 1d42f000  ObjectTable: e1ba5700  HandleCount:  77.
    Image: OllyICE.exe

PROCESS 89bfc470  SessionId: 0  Cid: 01b8    Peb: 7ffde000  ParentCid: 05d8
    DirBase: 24231000  ObjectTable: e1d764b8  HandleCount:   7.
    Image: test.exe
...

信息经过删减,留下了几个比较熟悉的进程,文中类似信息也会将无关清除,清除部分会用“...”表示,不再单独注明。


kd> !process 0 0
**** NT ACTIVE PROCESS DUMP ****
PROCESS 8a0e59c8  SessionId: none  Cid: 0004    Peb: 00000000  ParentCid: 0000
    DirBase: 00039000  ObjectTable: e1000d10  HandleCount: 240.
    Image: System

PROCESS 89be5020  SessionId: 0  Cid: 05d8    Peb: 7ffd6000  ParentCid: 05e4
    DirBase: 19f3c000  ObjectTable: e1e27cc8  HandleCount:  35.
    Image: cmd.exe

PROCESS 89ba8318  SessionId: 0  Cid: 0578    Peb: 7ffde000  ParentCid: 0268
    DirBase: 19f97000  ObjectTable: e1b8ef08  HandleCount:  82.
    Image: taskmgr.exe

PROCESS 89f52c10  SessionId: 0  Cid: 07c0    Peb: 7ffde000  ParentCid: 05e4
    DirBase: 1d42f000  ObjectTable: e1ba5700  HandleCount:  77.
    Image: OllyICE.exe

PROCESS 89bfc470  SessionId: 0  Cid: 01b8    Peb: 7ffde000  ParentCid: 05d8
    DirBase: 24231000  ObjectTable: e1d764b8  HandleCount:   7.
    Image: test.exe
...

信息经过删减,留下了几个比较熟悉的进程,文中类似信息也会将无关清除,清除部分会用“...”表示,不再单独注明。


这些进程分别是:taskmgr.exe任务管理器、cmd.exe控制台、System系统进程、OllyICE.exe调试器、test.exe测试程序。

每个进程的DirBase项的16进制数可以发现以下特征:

  1. 各进程不同;
  2. 可被4096整除;
  3. 以000结尾。

如果你的显示结果与特征不符,那是另外一种模式PAE,本文不做解释。从特征上分析,可被4096整除说明是4K对齐;各进程不相同说明每个进程的起始页不同,因此得以隔离进程;000结尾说明PDE没有属性,PDE为何物见下文。



[注意]APP应用上架合规检测服务,协助应用顺利上架!

最后于 2019-1-11 19:34 被kanxue编辑 ,原因:
收藏
免费 3
支持
分享
打赏 + 1.00雪花
打赏次数 1 雪花 + 1.00
 
赞赏  demoscene   +1.00 2018/09/14
最新回复 (15)
雪    币: 573
活跃值: (242)
能力值: ( LV2,RANK:10 )
在线值:
发帖
回帖
粉丝
2
可以可以 感谢 分享心得。
2018-9-1 23:23
0
雪    币: 6
活跃值: (3545)
能力值: ( LV2,RANK:10 )
在线值:
发帖
回帖
粉丝
3
期待win7 64的
2018-9-1 23:59
0
雪    币: 5270
活跃值: (3505)
能力值: ( LV7,RANK:117 )
在线值:
发帖
回帖
粉丝
4
咖啡_741298 期待win7 64的
https://bbs.pediy.com/thread-205143.htm前半部分
2018-9-2 01:11
0
雪    币: 23352
活跃值: (3447)
能力值: (RANK:648 )
在线值:
发帖
回帖
粉丝
5
感谢分享,期待楼主的更多佳作
2018-9-2 13:42
0
雪    币: 6818
活跃值: (153)
能力值: ( LV2,RANK:10 )
在线值:
发帖
回帖
粉丝
6
2018-9-2 23:47
0
雪    币: 300
活跃值: (2607)
能力值: ( LV2,RANK:10 )
在线值:
发帖
回帖
粉丝
7
mark
2018-9-3 14:34
0
雪    币: 2359
活跃值: (533)
能力值: ( LV4,RANK:50 )
在线值:
发帖
回帖
粉丝
8
mark一下,谢lz
2018-9-4 18:54
0
雪    币: 1486
活跃值: (1135)
能力值: ( LV2,RANK:10 )
在线值:
发帖
回帖
粉丝
9
有没有试过win7 系统的?r3调用自己安装的调用门。r3会崩溃
2018-9-4 19:05
0
雪    币: 1026
活跃值: (10)
能力值: ( LV2,RANK:10 )
在线值:
发帖
回帖
粉丝
10
多核心就麻烦了
2018-9-5 00:02
0
雪    币: 136
活跃值: (432)
能力值: ( LV4,RANK:50 )
在线值:
发帖
回帖
粉丝
11
冰雄 有没有试过win7 系统的?r3调用自己安装的调用门。r3会崩溃
win7的调用门和中断门r3都试过调用,调用门没有,中断门有崩溃过,原因没挖。
2018-9-5 10:20
0
雪    币: 3802
活跃值: (3972)
能力值: ( LV4,RANK:50 )
在线值:
发帖
回帖
粉丝
12
感谢分享!
2018-9-10 14:26
0
雪    币: 11716
活跃值: (133)
能力值: ( LV2,RANK:10 )
在线值:
发帖
回帖
粉丝
13
#寻宝大战#祝看雪19岁快乐!
2019-1-11 20:09
0
雪    币: 697
活跃值: (60)
能力值: ( LV2,RANK:10 )
在线值:
发帖
回帖
粉丝
14
Mark
2019-2-20 14:23
0
雪    币: 419
活跃值: (96)
能力值: ( LV2,RANK:10 )
在线值:
发帖
回帖
粉丝
15
mark
2019-4-2 16:22
0
雪    币: 300
活跃值: (2607)
能力值: ( LV2,RANK:10 )
在线值:
发帖
回帖
粉丝
16
mark
2019-4-2 17:55
0
游客
登录 | 注册 方可回帖
返回
// // 统计代码