首页
社区
课程
招聘
[原创]缓冲区溢出漏洞那些事:C -gets函数
发表于: 2022-3-25 16:33 15669

[原创]缓冲区溢出漏洞那些事:C -gets函数

2022-3-25 16:33
15669

备注

首发:1caK9s2c8@1M7s2y4Q4x3@1q4Q4x3V1k6Q4x3V1k6K6k6h3y4Q4x3X3c8A6L8W2)9J5k6h3y4G2L8g2)9J5c8X3q4J5N6r3W2U0L8r3g2Q4x3V1j5I4y4U0l9$3

基本概念

缓冲区是在数据从一个位置传输到另一个位置时临时保存数据的内存存储区域。当数据量超过内存缓冲区的存储容量时,就会发生缓冲区溢出(或缓冲区溢出)。结果,试图将数据写入缓冲区的程序会覆盖相邻的内存位置。

缓冲区溢出原指当某个数据超过了处理程序回传堆栈地址限制的范围时,程序出现的异常操作。造成此现象的原因有:

什么是缓冲区溢出攻击


攻击者通过覆盖应用程序的内存来利用缓冲区溢出问题。这会改变程序的执行路径,触发损坏文件或暴露私人信息的响应。例如,攻击者可能会引入额外的代码,向应用程序发送新指令以访问 IT 系统。

如果攻击者知道程序的内存布局,他们可以故意提供缓冲区无法存储的输入,并覆盖保存可执行代码的区域,用他们自己的代码替换它。例如,攻击者可以覆盖指针(指向内存中另一个区域的对象)并将其指向漏洞利用负载,从而获得对程序的控制权。

缓冲区溢出攻击的类型

基于堆栈的缓冲区溢出更为常见,并利用仅在函数执行期间存在的堆栈内存。

基于堆的攻击更难执行,并且涉及将分配给程序的内存空间泛滥到超出用于当前运行时操作的内存。

哪些编程语言更容易受到攻击?

C 和 C++ 是两种极易受到缓冲区溢出攻击的语言,因为它们没有内置的保护措施来防止覆盖或访问内存中的数据。Mac OSX、Windows 和 Linux 都使用用 C 和 C++ 编写的代码。

PERL、Java、JavaScript 和 C# 等语言使用内置的安全机制来最大限度地减少缓冲区溢出的可能性。

如何防止缓冲区溢出

开发人员可以通过代码中的安全措施或使用提供内置保护的语言来防止缓冲区溢出漏洞。

此外,现代操作系统具有运行时保护。三种常见的保护措施是:

  • 地址空间随机化 (ASLR) — 随机移动数据区域的地址空间位置。通常,缓冲区溢出攻击需要知道可执行代码的位置,而随机化地址空间使得这几乎不可能。
  • 数据执行预防——将某些内存区域标记为不可执行或可执行,从而阻止攻击在不可执行区域中运行代码。
  • 结构化异常处理程序覆盖保护 (SEHOP) — 帮助阻止恶意代码攻击结构化异常处理 (SEH),这是一种用于管理硬件和软件异常的内置系统。因此,它可以防止攻击者利用 SEH 覆盖利用技术。在功能级别上,使用基于堆栈的缓冲区溢出来覆盖存储在线程堆栈中的异常注册记录来实现 SEH 覆盖。

代码和操作系统保护中的安全措施是不够的。当组织发现缓冲区溢出漏洞时,它必须迅速做出反应以修补受影响的软件,并确保软件用户可以访问补丁。



示例代码展示

根据STACK1_VS_2017.cpp代码进行修改

#include 
#include  
#include "Windows.h"

int main(int argc, char **argv) {

	MessageBoxA((HWND)-0, (LPCSTR) "缓冲区溢出测试\n", (LPCSTR)"功能", (UINT)0);

	int cookie;
	char buf[2];
    int *a = &cookie;
    char * b = buf;
	printf("buf: %08x cookie: %08x\n", b, a);
    u_int64 p =(u_int64)a-(u_int64)b;
    printf("两变量内存地址之差=%d\n",p);
	gets(buf);
	if (cookie == 0x41424344)
		printf("缓冲区溢出成功!\n");

}

运行效果展示

使用MessageBoxA函数检测程序是否正常运行,点击确定开始测试

使用printf()函数输出提示信息,使用gets()函数获取用户输入信息

任意输入两个数值,不满足条件,程序运行完毕

代码分析漏洞成因

诱因:char buf[2]; 代码部分解析---使用char 将变量buf声明成了一个拥有2个元素数组其中元素类型为字符.buf有了两个自己长度,

提示:u_int64 p =(u_int64)a-(u_int64)b; 代码部分对程序涉及变量了内存地址进行了一个减分计算并对赋值给变量 p,(为使其运算成立还对其进行了类型转义),结果可告知两个变量内存地址距离,方便溢出利用

隐患:使用gets()函数获取输入数据,因gets()函数无限读取数据并不检查缓冲区的大小限制,会将超出缓冲区的数据继续写入堆栈,导致存在溢出隐患。

    为方便理解此处代码演示下:

#include 
#include  
#include "Windows.h"

int main() {
    char test[] = "test1";
    printf("test1初始值为%s\n清输入st值:",test);
    char st[2];
    gets(st);
    printf("输出test:%s\n",test);
    printf("输出st:%s\n",st);
}

 

在运行效果上可以看到超出堆栈空间的值继续写入堆栈导致覆盖了test在堆栈内对应的值,导致其数值进行了改变:test1-3456

    反汇编分析其运行过程堆栈是如何变化的

有运行得知(外加源代码)程序初始关键词:test1初始值为test1

可通过此关键词,在反汇编程序快速定位到程序相关函数运行区域

在入口指令处下断点方便分析

并在实际运行发现运行到此处为显示相关特征字符信息,初步判断正确

将此区域字符串进行反编译与源码对照进一步验证

没汇编指令对照不太直观换个插件与工具,进行展示

未输入st值时test对应数据堆栈情况

000000000061FDE8  000000000061FE0A  "test1"

输入后查看

000000000061FDE8  000000000061FE08  "123456"

000000000061FDF0  000000000061FE0A  "3456"        //之前为test1


[注意]看雪招聘,专注安全领域的专业人才平台!

收藏
免费 8
支持
分享
最新回复 (0)
游客
登录 | 注册 方可回帖
返回