首页
社区
课程
招聘
[原创]整数溢出的处理方式
发表于: 15小时前 220

[原创]整数溢出的处理方式

15小时前
220

在做 pwnable.krhorcruxes 时候,遇到整数溢出的问题,导致脚本不稳定。
这里打算写一下计算机处理整数溢出的方法,以及以后写脚本如何处理溢出。也研究一下一些算法的原理。

计算机组成基础

本来想从数学原理,原码、反码、补码详细阐述,并且加上数学证明。没想到知乎大佬写得太棒了。甚至没有什么可删减的,我全部复制也没什么意义。
把链接放在这里,作为前置知识,本篇就只讲代码手动处理溢出的方式与原理。

二进制的原码、反码、补码——狂风吹我心:这些码产生的原因,以及如何运算,举例丰富。
一文读懂二进制补码 - 从计数原理开始说起 ——红色的红:完整的数学证明,各种情况的举例证明,非常详细的论证。

计算机中均采用补码进行加减运算,有符号整数溢出,采用补码 232 回绕的方式。

简单原理

补码的字面是无符号的,只不过我们把左起第一位比特定义为符号位
无符号范围:0 ~ 4294967295,有符号范围:-2147483648 ~ 2147483647

0x00000000 ~ 0x7FFFFFFF  => 0 到 2147483647
0x80000000 ~ 0xFFFFFFFF  => 负数

正数很明显是和补码字面对应的,无需操作,而要处理的就是负数。
后半段被映射成负数:

补码字面(HEX表达) 无符号 有符号
0x7FFFFFFF 2147483647 2147483647
0x80000000 2147483648 -2147483648
0xFFFFFFFF 4294967295 -1

规则就是:如果值 >= 231,有符号值 = 无符号值 - 232

后面的例子都用99931111111119992111111111来解释。首先太长了需要先截断到32位再进行回绕。

例子 HEX 截断后HEX 截断后BIN 正负
9993111111111 0x916b3d685c7 0xb3d685c7 10110011110101101000010111000111
9992111111111 0x916783bbbc7 0x783bbbc7 01111000001110111011101111000111

所以我们要求有符号值 ,上面例子中:
负数 = 0xb3d685c7 - 232 = -1277786681
正数在有效范围内,保留。

代码处理

C语言

C语言是固定长度寄存器运算的,对于无符号整数天然就有截断,天然回绕,要注意的是有符号整数:

#include <stdio.h>
#include <limits.h>

int main() {
    int a = INT_MAX;
    int b = INT_MIN;
    int c = 9993111111111; // int型 默认就是32位的

    printf("%d\n", a + 1);
    printf("%d\n", b - 1);
    printf("%d\n", c);
    
    char str[20];
    strcpy(str, "9993111111111");
    int val = atoi(str);
    printf("%d\n", val);
}

输出

-2147483648
2147483647
-1277786681
-1277786681

Python

由于Python是无限精度,导致机器计算出具体值后,与程序存的值不一致,因为程序存的是溢出后的。这里写一下手动把值转换成32位溢出情况下的值。

Python有三种方式处理溢出:

1、ctypes自动处理:


import ctypes

arr = 9993111111111
res = ctypes.c_int32(arr).value
print(res)

# 输出:-1277786681

2、位运算(最快)

arr = 9993111111111
res = arr & 0xFFFFFFFF # 截断
if res > 0x7FFFFFFF: # 判断正负
    res -= 0x100000000 # 减去2^32
print(res)

# 输出:-1277786681

3、区间折叠

arr = 9993111111111
res = ((arr + 2**31) % 2**32) - 2**31
print(res)

# 输出:-1277786681

32位有符号范围是[231,2311],即[-2147483648, 2147483647]
% 2**32 的结果范围是:[0,2321],也就是无符号范围。
怎么把 无符号 区间重新“折叠”回 有符号 区间?

  1. 整体右移231,原本[231,2311] 变成 [0,2321],这样两区间就对齐了。
  2. 取模,通过% 2**32强制限制在 [0,2321],做这一步是因为代码里没有截断,等价于保留低 32 位,如果有截断,就不需要这一步。
  3. 再平移回来,通过231 ,把区间平移回:[231,2311],于是得到了有符号整数

传播安全知识、拓宽行业人脉——看雪讲师团队等你加入!

收藏
免费 0
支持
分享
最新回复 (0)
游客
登录 | 注册 方可回帖
返回