近两年,Protobuf结构体与Pwn结合的题目越来越多。
23年和24年Ciscn都出现了Protobuf题目,24年甚至还出现了2道。
与常规的Pwn题利用相比,只是多套了一层Protobuf的Unpack操作。
本文包含Protobuf环境安装、相关语法、编译运行以及pb结构逆向和例题实战,实现从0基础到进阶。
Protocol Buffers,是Google公司开发的一种数据描述语言,类似于XML能够将结构化数据序列化,可用于数据存储、通信协议等方面。
常用于跨平台和异构系统中进行RPC调用,序列化和反序列化效率高且体积比XML和JSON小得多,非常适合网络传输。
为了能够和程序进行交互,我们需要先逆向分析得到Protobuf结构体,然后构造序列化后的Protobuf与程序进行交互。
官方GitHub地址:https://github.com/protocolbuffers/protobuf
需要安装 Protobuf运行时 和 协议编译器(用于编译.proto文件)。
下载Protobuf项目(不要下载版本太高的,否则后面的protobuf-c无法安装):
解压并进入Protobuf目录:
配置、编译并安装
此时,输入protoc命令会报错:
原因是因为probuf默认安装路径是/usr/local/lib,而在Ubuntu中这个路径不在LD_LIBRARY_PATH 中。
因此,需要在/usr/lib中创建软连接:
再次输入protoc命令,发现正常打印版本号:
Protobuf官方支持C++、C#、Dart、Go、Java、Kotlin、Python等语言,但是不支持C语言。
而CTF中的Pwn题通常由C语言编写,这就用到了一个第三方库 protobuf-c。
Github项目地址:https://github.com/protobuf-c/protobuf-c
下载Protobuf-c项目:https://github.com/protobuf-c/protobuf-c/releases
进入Protobuf-c目录配置、编译并安装:
先来看一个官方文档给出的例子:
syntax指明protobuf的版本,有proto2和proto3两个版本,省略默认为proto2。
package可以防止命名空间冲突,简单的项目中可以省略。
message用于定义消息结构体,类似C语言中的struct。
每个字段包括修饰符 类型 字段名,并且末尾通过等号设置唯一字段编号。
修饰符包括如下几种:
常见的基本类型:
可以通过如下命令编译proto文件:
因此,以上命令也可以简化为:
这会编译生成以下两个文件:
CTF题目通常为C语言编写,因此为了后续逆向工作,需要理解编译后的C语言文件相关结构。
如果想要编译为Python代码,用如下命令(在CTF中通常编译为Python代码以在脚本中与程序交互):
会生成 demo_pb2.py。(pb2后缀只是为了和protobuf1区分)
可以直接在Python中import后调用:
可以通过 SerializeToString序列化 或 ParseFromString反序列化:
在生成的demo-pb-c.c文件中,可以发现存在unpack函数:
这个反序列化函数传入描述消息结构体数据的descriptor。我们可以在IDA中分析descriptor还原消息结构体。
Descriptor定义如下:
我们需要关注的有几个重要字段:
fields是ProtobufCFieldDescriptor类型。
我们看一下它的定义:
我们需要关注的有:
label和type都是枚举类型,我们看一下它的定义:
有了上面关于Descriptor的基础知识后,我们尝试在IDA中对protobuf结构体进行逆向。
以ciscn2023-talkbot为例,拖入IDA分析:
发现将输入传入protobuf_unpack函数处理后,将处理后的结果传递给真正的主函数。
我们直接搜索0x28AAEEF9,定位到Descriptor结构体:
而根据我们对Descriptor结构体定义分析:
然后,我们根据ProtobufCFieldDescriptor指针找到字段位置:
第一个为字段名actionid,后面的1、0、4分别为id、label和type。
id为1,而label和type查阅enum定义后发现是required和sint64。
其它字段同理,不再一一分析。
这里需要注意如何区分程序用的是proto2还是3。
在proto3中,删除了字段的默认值,因此ProtobufCFieldDescriptor结构体中没有了default_value字段。
可以根据逆向后字段的数量来判断题目用的proto版本。例如,这道题目就是proto2。
经过上述分析得到如下定义:
有了结构体,我们继续分析程序。
发现调用对象时,是从下标3开始,而不是从0开始的,这是为什么呢?
因为我们还原的结构体还没经过编译,我们可以编译后查看这个结构体:
查看编译后的头文件:
发现在结构体的头部多了一个ProtobufCMessage类型的变量,查看一下这个类型的定义:
它存储这个结构体的一些关键信息,比如Descriptor和未识别的字段。
ProtobufCMessage的大小为24字节,因此我们自己定义的字段下标应该是从3开始。
那为什么会多出一个参数呢?
查看编译后的代码发现,bytes类型被替换为了ProtobufCBinaryData类型,看一下它的定义:
它包括8字节的长度和8字节的数据部分,因此IDA识别时会多出一个参数。
反序列化后,将明文参数传递给真正的函数执行。
这部分和Protobuf就无关了,如果不想看可以直接跳过。
主函数:
经典的菜单函数,提供增删改查功能,逐个分析。
add函数:
可以申请最多0x20个不超过0x100大小chunk,并且申请的size不能小于输入的内容长度。
delete函数:
指针置零时用错了变量,存在UAF漏洞。
edit函数:
正常edit,不存在漏洞。
show函数:
正常show,不存在漏洞。
题目给glibc为2.31版本,最多申请0x20个不超过0x100大小的chunk,并且存在UAF漏洞。
发现存在沙箱限制了execve函数,可以考虑tcache posioning改__free_hook -> rdi转rdx寄存器gadget -> setcontext+61打orw。
本篇文章主要讲Protobuf,关于Setcontext打orw相关知识可以自行查阅相关资料,不再赘述。
关键是我们如何和程序进行交互呢?我们不能和传统题目一样通过scanf、read交互,而是构造序列化后的数据来交互。
首先,我们将之前还原出来的proto代码编译为Python代码:
得到device_pb2.py文件。我们需要做的就是在exp调用这个模块对payload进行序列化。
以add函数为例,创建结构体对象后设置字段,最后调用SerializeToString函数序列化,其它同理:
根据利用思路编写exp如下:
根据magic:0x28AAEEF9找到Protobuf结构体:
消息结构体名称为heybro,继续分析字段:
还原出如下结构体:
分析main函数:
将6个变量传入realMain,分别是wahtcon、wahtcon_len、whattodo、whatidx、whatsize、whatsthis,且每次输入都malloc0x200。
初始化函数,设置沙箱保护,但是最后没调用seccomp_load函数,所以沙箱无效。
并让全局变量buf指向申请的0x420大小的chunk,然后再申请一个0x420大小的chunk。
当whattodo为0时为nop空函数:
当whattodo为1时,执行add函数:
add函数最多申请9个0x40大小的chunk。
当whattodo为2时,执行delete函数:
最多可以使用10次delete函数,存在UAF漏洞。
当whattodo为3时,执行show:
可以调用3次该函数,并且如果设置whatsthis为\xff,会先调用seccomp_load。(显示不是我们想要的)
如果设置size为0x30,会调用strtok。也就是说题目提供了两个进入strtok的机会,这里可疑,可能有利用点。
程序保护全开,能够free10次,填满tcache后,剩余3次chunk可以完成一次double free,即构造一次任意地址写。
具体做法:
初始状态bin中有剩余的small bin,申请一个chunk会在small bin切割并残留fd指针指向libc,直接打印可以泄露libc地址:
然后填满tcache,泄露heap地址:
最后,通过double free + tcache stash unlink完成一次任意地址写:
2.35版本libc,没有各种hook,查看保护情况,发现libc没有开启RELRO保护,考虑修改libc的got表。
查看libc中的strtok函数调用了strspn函数,将这个函数修改为system函数完成利用即可。
这里说一下如何计算strspn函数got表地址,先将题目patch到本地有符号的libc中,然后vmmap查看libc:
最后面这个带有可写权限的即got表存储的地方,发现这个函数偏移量是0x58:
换回题目给的libc,即可计算出该函数got表地址,要注意tcache需要地址0x10对齐。
设置size为0x30即可触发strtok,参数为content。还需要注意的是,直接传入/bin/sh\x00会出问题。
猜测可能是因为序列化时所有字符都是相邻的,所以在最前面任意加个字符和分号,然后传/bin/sh\x00没问题。
wget https:
//github
.com
/protocolbuffers/protobuf/releases/download/v3
.6.1
/protobuf-cpp-3
.6.1.
tar
.gz
wget https:
//github
.com
/protocolbuffers/protobuf/releases/download/v3
.6.1
/protobuf-cpp-3
.6.1.
tar
.gz
tar
-xzvf protobuf-cpp-3.6.1
cd
protobuf-3.6.1
tar
-xzvf protobuf-cpp-3.6.1
cd
protobuf-3.6.1
.
/configure
make
sudo
make
install
.
/configure
make
sudo
make
install
➜ protobuf-3.6.1 protoc --version protoc: error
while
loading shared libraries: libprotoc.so.17: cannot
open
shared object
file
: No such
file
or directory
➜ protobuf-3.6.1 protoc --version protoc: error
while
loading shared libraries: libprotoc.so.17: cannot
open
shared object
file
: No such
file
or directory
cd
/usr/lib
sudo
ln
-s
/usr/local/lib/libprotoc
.so.17 libprotobuf.so.17
sudo
ln
-s
/usr/local/lib/libprotoc
.so.17 libprotoc.so.17
cd
/usr/lib
sudo
ln
-s
/usr/local/lib/libprotoc
.so.17 libprotobuf.so.17
sudo
ln
-s
/usr/local/lib/libprotoc
.so.17 libprotoc.so.17
➜ tools protoc --version
libprotoc 3.6.1
➜ tools protoc --version
libprotoc 3.6.1
tar
-xzvf protobuf-c.
tar
.gz
cd
protobuf-c
.
/configure
&&
make
sudo
make
install
tar
-xzvf protobuf-c.
tar
.gz
cd
protobuf-c
.
/configure
&&
make
sudo
make
install
protoc -I=$SRC_DIR --c_out=$DST_DIR $SRC_DIR
/demo
.proto
protoc -I=$SRC_DIR --c_out=$DST_DIR $SRC_DIR
/demo
.proto
protoc --c_out=. demo.proto
protoc --c_out=. demo.proto
protoc --python_out=. demo.proto
protoc --python_out=. demo.proto
import
demo_pb2
person
=
demo_pb2.Person()
person.
id
=
1234
person.name
=
"John Doe"
person.email
=
"jdoe@example.com"
phone
=
person.phones.add()
phone.number
=
"555-4321"
phone.
type
=
demo_pb2.Person.PHONE_TYPE_HOME
import
demo_pb2
person
=
demo_pb2.Person()
person.
id
=
1234
person.name
=
"John Doe"
person.email
=
"jdoe@example.com"
phone
=
person.phones.add()
phone.number
=
"555-4321"
phone.
type
=
demo_pb2.Person.PHONE_TYPE_HOME
with
open
(sys.argv[
1
],
"wb"
) as f:
f.write(demo_pb2.SerializeToString())
with
open
(sys.argv[
1
],
"wb"
) as f:
f.write(demo_pb2.SerializeToString())
demo
=
demo_pb2.AddressBook()
try
:
with
open
(sys.argv[
1
],
"rb"
) as f:
demo_pb2.ParseFromString(f.read())
except
IOError:
print
(sys.argv[
1
]
+
": Could not open file. Creating a new one."
)
demo
=
demo_pb2.AddressBook()
try
:
with
open
(sys.argv[
1
],
"rb"
) as f:
demo_pb2.ParseFromString(f.read())
except
IOError:
print
(sys.argv[
1
]
+
": Could not open file. Creating a new one."
)
Tutorial__AddressBook * tutorial__address_book__unpack(ProtobufCAllocator *allocator,
size_t
len,
const
uint8_t *data)
{
return
(Tutorial__AddressBook *)
protobuf_c_message_unpack (&tutorial__address_book__descriptor,
allocator, len, data);
}
Tutorial__AddressBook * tutorial__address_book__unpack(ProtobufCAllocator *allocator,
size_t
len,
const
uint8_t *data)
{
return
(Tutorial__AddressBook *)
protobuf_c_message_unpack (&tutorial__address_book__descriptor,
allocator, len, data);
}
struct
ProtobufCMessageDescriptor {
uint32_t magic;
const
char
*name;
const
char
*short_name;
const
char
*c_name;
const
char
*package_name;
size_t
sizeof_message;
unsigned n_fields;
const
ProtobufCFieldDescriptor *fields;
const
unsigned *fields_sorted_by_name;
unsigned n_field_ranges;
const
ProtobufCIntRange *field_ranges;
ProtobufCMessageInit message_init;
void
*reserved1;
void
*reserved2;
void
*reserved3;
};
struct
ProtobufCMessageDescriptor {
uint32_t magic;
const
char
*name;
const
char
*short_name;
const
char
*c_name;
const
char
*package_name;
size_t
sizeof_message;
unsigned n_fields;
const
ProtobufCFieldDescriptor *fields;
const
unsigned *fields_sorted_by_name;
unsigned n_field_ranges;
const
ProtobufCIntRange *field_ranges;
ProtobufCMessageInit message_init;
void
*reserved1;
void
*reserved2;
void
*reserved3;
};
struct
ProtobufCFieldDescriptor {
const
char
*name;
uint32_t id;
ProtobufCLabel label;
ProtobufCType type;
unsigned quantifier_offset;
unsigned offset;
const
void
*descriptor;
const
void
*default_value;
uint32_t flags;
unsigned reserved_flags;
void
*reserved2;
void
*reserved3;
};
struct
ProtobufCFieldDescriptor {
const
char
*name;
uint32_t id;
ProtobufCLabel label;
ProtobufCType type;
unsigned quantifier_offset;
unsigned offset;
const
void
*descriptor;
const
void
*default_value;
uint32_t flags;
unsigned reserved_flags;
void
*reserved2;
void
*reserved3;
};
typedef
enum
{
PROTOBUF_C_LABEL_REQUIRED,
PROTOBUF_C_LABEL_OPTIONAL,
PROTOBUF_C_LABEL_REPEATED,
PROTOBUF_C_LABEL_NONE,
} ProtobufCLabel;
typedef
enum
{
PROTOBUF_C_LABEL_REQUIRED,
PROTOBUF_C_LABEL_OPTIONAL,
PROTOBUF_C_LABEL_REPEATED,
PROTOBUF_C_LABEL_NONE,
} ProtobufCLabel;
typedef
enum
{
PROTOBUF_C_TYPE_INT32,
PROTOBUF_C_TYPE_SINT32,
PROTOBUF_C_TYPE_SFIXED32,
PROTOBUF_C_TYPE_INT64,
PROTOBUF_C_TYPE_SINT64,
PROTOBUF_C_TYPE_SFIXED64,
PROTOBUF_C_TYPE_UINT32,
PROTOBUF_C_TYPE_FIXED32,
PROTOBUF_C_TYPE_UINT64,
PROTOBUF_C_TYPE_FIXED64,
PROTOBUF_C_TYPE_FLOAT,
PROTOBUF_C_TYPE_DOUBLE,
PROTOBUF_C_TYPE_BOOL,
PROTOBUF_C_TYPE_ENUM,
PROTOBUF_C_TYPE_STRING,
PROTOBUF_C_TYPE_BYTES,
PROTOBUF_C_TYPE_MESSAGE,
} ProtobufCType;
typedef
enum
{
PROTOBUF_C_TYPE_INT32,
PROTOBUF_C_TYPE_SINT32,
PROTOBUF_C_TYPE_SFIXED32,
PROTOBUF_C_TYPE_INT64,
PROTOBUF_C_TYPE_SINT64,
PROTOBUF_C_TYPE_SFIXED64,
PROTOBUF_C_TYPE_UINT32,
PROTOBUF_C_TYPE_FIXED32,
PROTOBUF_C_TYPE_UINT64,
PROTOBUF_C_TYPE_FIXED64,
PROTOBUF_C_TYPE_FLOAT,
PROTOBUF_C_TYPE_DOUBLE,
PROTOBUF_C_TYPE_BOOL,
PROTOBUF_C_TYPE_ENUM,
PROTOBUF_C_TYPE_STRING,
PROTOBUF_C_TYPE_BYTES,
PROTOBUF_C_TYPE_MESSAGE,
} ProtobufCType;
protoc --c_out=. device.proto
protoc --c_out=. device.proto
struct
Devicemsg
{
ProtobufCMessage base;
int64_t actionid;
int64_t msgidx;
int64_t msgsize;
ProtobufCBinaryData msgcontent;
};
struct
Devicemsg
{
ProtobufCMessage base;
int64_t actionid;
int64_t msgidx;
int64_t msgsize;
ProtobufCBinaryData msgcontent;
};
struct
ProtobufCMessage {
const
ProtobufCMessageDescriptor *descriptor;
unsigned n_unknown_fields;
ProtobufCMessageUnknownField *unknown_fields;
};
struct
ProtobufCMessage {
[招生]科锐逆向工程师培训(2024年11月15日实地,远程教学同时开班, 第51期)