[原创]编译器优化分析-2-软件逆向-看雪-安全社区|安全招聘|kanxue.com

[原创]编译器优化分析-2

发表于: 2006-7-10 22:11 12747

[原创]编译器优化分析-2

foxabu

2006-7-10 22:11

12747

DFCGVC编译器优化分析-2
今天讲讲常见的算术运算的优化：
1. 先来看看加减法运算
__asm int 3
int a,b;
scanf("%d %d",&a,&b);
int c;
int d;
c=a+b;
d=a-b;
printf("\n%d %d",c,d);
__asm int 3
汇编代码如下
00401020 /$  83EC 08          sub esp,8
00401023 |.  CC                int3
00401024 |.  8D4424 04       lea eax,dword ptr ss:[esp+4]
00401028 |.  50                push eax
00401029 |.  8D4C24 04       lea ecx,dword ptr ss:[esp+4]
0040102D |.  51                push ecx
0040102E |.  68 50214000       push 编译器学.00402150                                     ; /format = "%d %d"
00401033 |.  FF15 C4204000    call dword ptr ds:[<&MSVCR80.scanf>]                   ; \scanf
00401039 |.  8B4424 0C       mov eax,dword ptr ss:[esp+C]
0040103D |.  8B4C24 10       mov ecx,dword ptr ss:[esp+10]
00401041 |.  8BD0             mov edx,eax
00401043 |.  2BD1             sub edx,ecx
00401045 |.  52                push edx                                              ; /<%d>
00401046 |.  03C1             add eax,ecx                                           ; |
00401048 |.  50                push eax                                              ; |<%d>
00401049 |.  68 58214000       push 编译器学.00402158                                     ; |format = "
%d %d"
0040104E |.  FF15 C8204000    call dword ptr ds:[<&MSVCR80.printf>]                   ; \printf
00401054 |.  83C4 18          add esp,18
00401057 |.  CC                int3

虽然我们声明了4个变量。但编译器会认为这等价于
printf("\n%d %d",a+b,c+d);
因此也只给我们分配了两个变量。
其实这也告诉编程序的人，没有必要写成printf("\n%d %d",a+b,c+d);
形式，这种形式显然更难维护和阅读。
00401039 |.  8B4424 0C       mov eax,dword ptr ss:[esp+C]
0040103D |.  8B4C24 10       mov ecx,dword ptr ss:[esp+10]
00401041 |.  8BD0             mov edx,eax
00401043 |.  2BD1             sub edx,ecx
00401045 |.  52                push edx                                              ; /<%d>
00401046 |.  03C1             add eax,ecx                                           ; |
这里比较巧妙由于涉及到两次运算，因此将两个变量统一读到两个寄存器中，而不象有些编译器会使用内存相加。
加减法没有什么好说的。主要说乘除法：
2. 乘除法
先来看乘法运算：
首先是有符号运算。
void study5()
{
__asm int 3
int a,b;
scanf("%d %d",&a,&b);
int c,d,e;
c=a*2;
d=a*b;
e=a*7;
printf("\n%d %d",c,d,e);
__asm int 3
}
00401023 |.  CC                int3
00401024 |.  8D4424 04       lea eax,dword ptr ss:[esp+4]
00401028 |.  50                push eax
00401029 |.  8D4C24 04       lea ecx,dword ptr ss:[esp+4]
0040102D |.  51                push ecx
0040102E |.  68 50214000       push 编译器学.00402150                               ; /format = "%d %d"
00401033 |.  FF15 C4204000    call dword ptr ds:[<&MSVCR80.scanf>]             ; \scanf
00401039 |.  8B4424 0C       mov eax,dword ptr ss:[esp+C]
0040103D |.  8BC8             mov ecx,eax
0040103F |.  0FAF4C24 10       imul ecx,dword ptr ss:[esp+10]
00401044 |.  8D14C5 00000000 lea edx,dword ptr ds:[eax*8]
0040104B |.  2BD0             sub edx,eax
0040104D |.  52                push edx
0040104E |.  51                push ecx                                        ; /<%d>
0040104F |.  8D1400          lea edx,dword ptr ds:[eax+eax]                   ; |
00401052 |.  52                push edx                                        ; |<%d>
00401053 |.  68 58214000       push 编译器学.00402158                               ; |format = "
%d %d"
00401058 |.  FF15 C8204000    call dword ptr ds:[<&MSVCR80.printf>]             ; \printf
0040105E |.  83C4 1C          add esp,1C
00401061 |.  CC                int3

0040103F |.  0FAF4C24 10       imul ecx,dword ptr ss:[esp+10]
没有什么说的，整数乘法
00401044 |.  8D14C5 00000000 lea edx,dword ptr ds:[eax*8]
0040104B |.  2BD0             sub edx,eax
呵呵。看到这里是否想到我们小学的时候得简便运算。我们是乘以7
但是编译器给我们编程了乘以8在减掉被乘数。神奇吧。
同样的道理
0040104F |.  8D1400          lea edx,dword ptr ds:[eax+eax]                   ; |
乘以二就是两个这个数相加。。想象力丰富吧。
总结一下载VC中乘法如果在已知被除数的情况下用
lea edx,dword ptr ds:[eax*x]的形式，
否则采用IMUL 指令。
现在我们把代码变成这样
c=a*-2;
d=a*-4;
e=a*-7;
测试一下有符号运算。
00401033 |.  FF15 C4204000    call dword ptr ds:[<&MSVCR80.scanf>]             ; \scanf
00401039 |.  8B4424 0C       mov eax,dword ptr ss:[esp+C]
0040103D |.  8D14C5 00000000 lea edx,dword ptr ds:[eax*8]
00401044 |.  8BC8             mov ecx,eax
00401046 |.  2BD0             sub edx,eax
00401048 |.  F7D9             neg ecx
0040104A |.  F7DA             neg edx
0040104C |.  52                push edx
0040104D |.  03C9             add ecx,ecx
0040104F |.  03C9             add ecx,ecx
00401051 |.  F7D8             neg eax
00401053 |.  51                push ecx                                        ; /<%d>
00401054 |.  03C0             add eax,eax                                     ; |
00401056 |.  50                push eax                                        ; |<%d>
00401057 |.  68 58214000       push 编译器学.00402158                               ; |format = "
%d %d"
0040105C |.  FF15 C8204000    call dword ptr ds:[<&MSVCR80.printf>]             ; \printf

代码有些变化除了用了NEG指令以外。还有
原来的
lea edx,dword ptr ds:[eax+eax]                   ; |
变成了
0040104D |.  03C9             add ecx,ecx
0040104F |.  03C9             add ecx,ecx

不过大体上没有什么好说的。
乘法总的来说都比较好识别
代码在改一改改为
d=short(a*b);
c=c*c*c;
e=a*100;
我们来看看类型转换的问题
其他的都差不多主要说一下
0040104E |.  0FBFD1          movsx edx,cx
00401051 |.  8BC8             mov ecx,eax
00401053 |.  0FAFC8          imul ecx,eax
00401056 |.  0FAFC8          imul ecx,eax
如果是short 那么就会用movsx符号取得低位
c=c*c*c---〉imul ecx,eax；imul ecx,eax
乘法总的来说都比较容易识别也比较简单。
除法就不一样了，无符号有符号完全不同，另外以及不同编译器的处理也很不一样
且涉及到求模运算和除法运算两种。
由于CPU中只有加法器和乘法器所以一般而言除法会转变为乘法运算。
我们先来看两组最简单的。
先讲无符号的明天再说有符号的
代码：
__asm int 3
unsigned int a,b;
scanf("%d %d",&a,&b);
unsigned int c,d,e;
d=a/2;
c=b/4;
printf("\n%d %d",c,d);
__asm int 3
生成代码（部分）
00401039 |.  8B5424 0C          mov edx,dword ptr ss:[esp+C]
0040103D |.  8B4424 10          mov eax,dword ptr ss:[esp+10]
00401041 |.  D1EA                shr edx,1
00401043 |.  52                push edx                                  ; /<%d>
00401044 |.  C1E8 02             shr eax,2                                  ; |
当乘以2的n次方的时候可以采用位移的方式。
Shr 向右移
其实就是一个乘方关系不是很难理解，但是要大家注意，不要看着shr就想着用〉〉指令可读性肯定没有用/??好
但是如果是求模式不同的
看代码：
d=a%2;
c=b%4;
会变为
00401039 |.  8B5424 0C          mov edx,dword ptr ss:[esp+C]
0040103D |.  8B4424 10          mov eax,dword ptr ss:[esp+10]
00401041 |.  83E2 01             and edx,1
00401044 |.  52                push edx                                  ; /<%d>
00401045 |.  83E0 03             and eax,3                                  ; |
00401048 |.  50                push eax                                  ; |<%d>
00401049 |.  68 58214000       push 编译器学.00402158                         ; |format = "
%d %d"
即为AND运算。其实也比较好理解
我们随便举个例子：
比如17的二进制代码为       10001
如果是除以2那么就是AND    00001
留下最后一位，
如果是除以4那么就是AND    00011
余下最后两位。其实我们想象成10进制就好理解了
比如12345 mod 10 肯定就是5 也就是保留个位
12345 mod 100 肯定就是45 保留十位
二进制是同样一个道理当是2的N次方的时候就和10的N 次方的时候是一样的
也就是去掉 N位的前面所有位就是余数
这一点希望大家注意。很多时候为什么我们在写注册机的时候往往会出现很多位操作原因就是我们对这些理解不是很到位。而且位操作也不便于反退注册过程。
今天就讲到这里

除法部分比较复杂。

谢谢
By Fox

登录后可查看完整内容

[招生]科锐逆向工程师培训(2025年3月11日实地，远程教学同时开班, 第52期)！

收藏・10

免费・7

支持

最新回复 (12)
sbright 雪币： 146 活跃值： (33) 能力值： ( LV6，RANK：90 ) 在线值：发帖 120 回帖 995 粉丝 1 关注私信	sbright 2 2 楼这东西要顶,虽然还不是很复杂,但却属于上乘武功之挥刀自宫式 2006-7-11 00:07 0
you8107 雪币： 223 活跃值： (25) 能力值： ( LV4，RANK：50 ) 在线值：发帖 7 回帖 121 粉丝 0 关注私信	you8107 1 3 楼 2006-7-11 11:28 0
微微虫雪币： 152 活跃值： (10) 能力值： ( LV2，RANK：10 ) 在线值：发帖 3 回帖 24 粉丝 0 关注私信	微微虫 4 楼谢谢了。收下学习之！ 2006-7-11 21:16 0
bxm 雪币： 461 活跃值： (93) 能力值： ( LV9，RANK：1170 ) 在线值：发帖 41 回帖 306 粉丝 1 关注私信	bxm 29 5 楼好文章,楼主辛苦了,收藏,学习. 2006-7-11 21:43 0
kanxue 雪币： 53122 活跃值： (21080) 能力值： (RANK：350 ) 在线值：发帖 2376 回帖 17052 粉丝 559 关注私信	kanxue 8 6 楼 foxabu文章不错，感觉可以再深化一些。 2006-7-11 21:51 0
nbw 雪币： 339 活跃值： (1510) 能力值： ( LV13，RANK：970 ) 在线值：发帖 141 回帖 2842 粉丝 23 关注私信	nbw 24 7 楼期待你那个除法，一年来，除法部分我一直理解不了，期待你给我讲明白。 2006-7-11 22:48 0
WAKU 雪币： 179 活跃值： (131) 能力值： ( LV12，RANK：290 ) 在线值：发帖 32 回帖 501 粉丝 0 关注私信	WAKU 7 8 楼楼主研究的透彻不过好像对做编译器的有用 2006-7-11 23:31 0
bfqyygy 雪币： 338 活跃值： (10) 能力值： ( LV4，RANK：50 ) 在线值：发帖 1 回帖 523 粉丝 0 关注私信	bfqyygy 1 9 楼学习一下. 2006-7-11 23:44 0
kanxue 雪币： 53122 活跃值： (21080) 能力值： (RANK：350 ) 在线值：发帖 2376 回帖 17052 粉丝 559 关注私信	kanxue 8 10 楼最初由 WAKU* 发布* 楼主研究的透彻不过好像对做编译器的有用呵～对逆向破解也很有用的。 2006-7-12 09:11 0
sosli 雪币： 200 活跃值： (10) 能力值： ( LV2，RANK：10 ) 在线值：发帖 0 回帖 9 粉丝 0 关注私信	sosli 11 楼好功夫,,,,,,,学习学习 2006-7-12 19:47 0
nop 雪币： 221 活跃值： (10) 能力值： ( LV2，RANK：10 ) 在线值：发帖 2 回帖 16 粉丝 0 关注私信	nop 12 楼对于最后说的求余优化楼主举的是无符号数的例子, 如果是有符号数, 例如eax%256 (eax是个有符号数) 编译器优化后代码是这样: and eax, 800000ffh jns L_A dec eax or eax, 0ffffff00h inc eax L_A: ; do something ... 2007-1-27 01:10 0
sudami 雪币： 709 活跃值： (2420) 能力值： ( LV12，RANK：1010 ) 在线值：发帖 71 回帖 1581 粉丝 65 关注私信	sudami 25 13 楼思路蛮好的, 借鉴一下! 2007-1-27 08:06 0
	游客登录 \| 注册方可回帖回帖表情雪币赚取及消费高级回复

foxabu

发帖

1236

回帖

530

RANK

关注

私信

他的文章

[讨论]讨论下工资待遇 29483
[推荐][原创](MSFT) Interview Prep 9788

关于我们

联系我们

企业服务

看雪公众号

最新回复 (12)
sbright 雪币： 146 活跃值： (33) 能力值： ( LV6，RANK：90 ) 在线值：发帖 120 回帖 995 粉丝 1 关注私信	sbright 2 2 楼这东西要顶,虽然还不是很复杂,但却属于上乘武功之挥刀自宫式 2006-7-11 00:07 0
you8107 雪币： 223 活跃值： (25) 能力值： ( LV4，RANK：50 ) 在线值：发帖 7 回帖 121 粉丝 0 关注私信	you8107 1 3 楼 2006-7-11 11:28 0
微微虫雪币： 152 活跃值： (10) 能力值： ( LV2，RANK：10 ) 在线值：发帖 3 回帖 24 粉丝 0 关注私信	微微虫 4 楼谢谢了。收下学习之！ 2006-7-11 21:16 0
bxm 雪币： 461 活跃值： (93) 能力值： ( LV9，RANK：1170 ) 在线值：发帖 41 回帖 306 粉丝 1 关注私信	bxm 29 5 楼好文章,楼主辛苦了,收藏,学习. 2006-7-11 21:43 0
kanxue 雪币： 53122 活跃值： (21080) 能力值： (RANK：350 ) 在线值：发帖 2376 回帖 17052 粉丝 559 关注私信	kanxue 8 6 楼 foxabu文章不错，感觉可以再深化一些。 2006-7-11 21:51 0
nbw 雪币： 339 活跃值： (1510) 能力值： ( LV13，RANK：970 ) 在线值：发帖 141 回帖 2842 粉丝 23 关注私信	nbw 24 7 楼期待你那个除法，一年来，除法部分我一直理解不了，期待你给我讲明白。 2006-7-11 22:48 0
WAKU 雪币： 179 活跃值： (131) 能力值： ( LV12，RANK：290 ) 在线值：发帖 32 回帖 501 粉丝 0 关注私信	WAKU 7 8 楼楼主研究的透彻不过好像对做编译器的有用 2006-7-11 23:31 0
bfqyygy 雪币： 338 活跃值： (10) 能力值： ( LV4，RANK：50 ) 在线值：发帖 1 回帖 523 粉丝 0 关注私信	bfqyygy 1 9 楼学习一下. 2006-7-11 23:44 0
kanxue 雪币： 53122 活跃值： (21080) 能力值： (RANK：350 ) 在线值：发帖 2376 回帖 17052 粉丝 559 关注私信	kanxue 8 10 楼最初由 WAKU* 发布* 楼主研究的透彻不过好像对做编译器的有用呵～对逆向破解也很有用的。 2006-7-12 09:11 0
sosli 雪币： 200 活跃值： (10) 能力值： ( LV2，RANK：10 ) 在线值：发帖 0 回帖 9 粉丝 0 关注私信	sosli 11 楼好功夫,,,,,,,学习学习 2006-7-12 19:47 0
nop 雪币： 221 活跃值： (10) 能力值： ( LV2，RANK：10 ) 在线值：发帖 2 回帖 16 粉丝 0 关注私信	nop 12 楼对于最后说的求余优化楼主举的是无符号数的例子, 如果是有符号数, 例如eax%256 (eax是个有符号数) 编译器优化后代码是这样: and eax, 800000ffh jns L_A dec eax or eax, 0ffffff00h inc eax L_A: ; do something ... 2007-1-27 01:10 0
sudami 雪币： 709 活跃值： (2420) 能力值： ( LV12，RANK：1010 ) 在线值：发帖 71 回帖 1581 粉丝 65 关注私信	sudami 25 13 楼思路蛮好的, 借鉴一下! 2007-1-27 08:06 0
	游客登录 \| 注册方可回帖回帖表情雪币赚取及消费高级回复