能力值:
( LV12,RANK:210 )
9 楼
上述算法的简单汇编实现。
一下代码由http://bbs.pediy.com/showthread.php?s=&threadid=11673 这里给出的md5的汇编实现转化过来。
然而,这个代码的运行速度和源代码经过优化后的运行速度一样。速度上没有任何改观。 //Md5算法
typedef unsigned char UI8;
typedef char I8;
typedef unsigned long UI32;
#define S11 7
#define S12 12
#define S13 17
#define S14 22
#define S21 5
#define S22 9
#define S23 14
#define S24 20
#define S31 4
#define S32 11
#define S33 16
#define S34 23
#define S41 6
#define S42 10
#define S43 15
#define S44 21
#define a esi
#define b edi
#define c edx
#define d ebx
#define tmp1 eax
#define tmp2 ecx
#define x(i) [x+4*i]
#define FF(a, b, c, d, x, s, ac) \
__asm mov tmp1,b \
__asm and tmp1,c \
__asm mov tmp2,b \
__asm not tmp2 \
__asm and tmp2,d \
__asm or tmp2,tmp1 \
__asm lea a,[tmp2+a+ac] \
__asm add a,x \
__asm rol a,s \
__asm add a,b \
#define GG(a, b, c, d, x, s, ac) \
__asm mov tmp1,b \
__asm and tmp1,d \
__asm mov tmp2,d \
__asm not tmp2 \
__asm and tmp2,c \
__asm or tmp2,tmp1 \
__asm lea a,[tmp2+a+ac] \
__asm add a,x \
__asm rol a,s \
__asm add a,b
#define HH(a,b,c, d, x, s, ac) \
__asm mov tmp2,b \
__asm xor tmp2,c \
__asm xor tmp2,d \
__asm lea a,[tmp2+a+ac] \
__asm add a,x \
__asm rol a,s \
__asm add a,b
#define II(a, b, c, d, x, s, ac) \
__asm mov tmp2,d \
__asm not tmp2 \
__asm or tmp2,b \
__asm xor tmp2,c \
__asm lea a,[tmp2+a+ac] \
__asm add a,x \
__asm rol a,s \
__asm add a,b
///////////////////////////////////////
// QQ解密正式开始
//////////////////////////////////////
//作者:冲出宇宙
//2005,11,1
//////////////////////////////////////
UI8 MD5Result[16]; //md5加密后的结果
UI32 LoopNum; //循环次数
UI32 QQNum; //qq号码
UI32 PwdNum; //已经对多少个字符串进行了检查
CString Pwd; //当前正确的密码
CString FileQQ,FilePwd; //密码文件和密码字典文件
DWORD DecodeThreadId;
HANDLE DecodeThreadHandle; //解密线程
CQQDecoderCtrl *Me;
//密码是否正确
bool IsPasswordCorrect(char* sPwd)
{
UI32 x[16];
UI32 a0;
a0 = strlen(sPwd);
memset(x,0,64);
memcpy(x,sPwd,a0);
x[14] = a0*8;
((UI8*)x)[a0] = 0x80;
{
__asm pushad;
{
__asm {
//initial
mov a,0x67452301
mov b,0xefcdab89
mov c,0x98badcfe
mov d,0x10325476
}
/* Round 1 */
FF(a, b, c, d, x( 0), S11, 0xd76aa478); /* 1 */
FF(d, a, b, c, x( 1), S12, 0xe8c7b756); /* 2 */
FF(c, d, a, b, x( 2), S13, 0x242070db); /* 3 */
FF(b, c, d, a, x( 3), S14, 0xc1bdceee); /* 4 */
FF(a, b, c, d, x( 4), S11, 0xf57c0faf); /* 5 */
FF(d, a, b, c, x( 5), S12, 0x4787c62a); /* 6 */
FF(c, d, a, b, x( 6), S13, 0xa8304613); /* 7 */
FF(b, c, d, a, x( 7), S14, 0xfd469501); /* 8 */
FF(a, b, c, d, x( 8), S11, 0x698098d8); /* 9 */
FF(d, a, b, c, x( 9), S12, 0x8b44f7af); /* 10 */
FF(c, d, a, b, x(10), S13, 0xffff5bb1); /* 11 */
FF(b, c, d, a, x(11), S14, 0x895cd7be); /* 12 */
FF(a, b, c, d, x(12), S11, 0x6b901122); /* 13 */
FF(d, a, b, c, x(13), S12, 0xfd987193); /* 14 */
FF(c, d, a, b, x(14), S13, 0xa679438e); /* 15 */
FF(b, c, d, a, x(15), S14, 0x49b40821); /* 16 */
/* Round 2 */
GG (a, b, c, d, x( 1), S21, 0xf61e2562); /* 17 */
GG (d, a, b, c, x( 6), S22, 0xc040b340); /* 18 */
GG (c, d, a, b, x(11), S23, 0x265e5a51); /* 19 */
GG (b, c, d, a, x( 0), S24, 0xe9b6c7aa); /* 20 */
GG (a, b, c, d, x( 5), S21, 0xd62f105d); /* 21 */
GG (d, a, b, c, x(10), S22, 0x2441453); /* 22 */
GG (c, d, a, b, x(15), S23, 0xd8a1e681); /* 23 */
GG (b, c, d, a, x( 4), S24, 0xe7d3fbc8); /* 24 */
GG (a, b, c, d, x( 9), S21, 0x21e1cde6); /* 25 */
GG (d, a, b, c, x(14), S22, 0xc33707d6); /* 26 */
GG (c, d, a, b, x( 3), S23, 0xf4d50d87); /* 27 */
GG (b, c, d, a, x( 8), S24, 0x455a14ed); /* 28 */
GG (a, b, c, d, x(13), S21, 0xa9e3e905); /* 29 */
GG (d, a, b, c, x( 2), S22, 0xfcefa3f8); /* 30 */
GG (c, d, a, b, x( 7), S23, 0x676f02d9); /* 31 */
GG (b, c, d, a, x(12), S24, 0x8d2a4c8a); /* 32 */
/* Round 3 */
HH (a, b, c, d, x( 5), S31, 0xfffa3942); /* 33 */
HH (d, a, b, c, x( 8), S32, 0x8771f681); /* 34 */
HH (c, d, a, b, x(11), S33, 0x6d9d6122); /* 35 */
HH (b, c, d, a, x(14), S34, 0xfde5380c); /* 36 */
HH (a, b, c, d, x( 1), S31, 0xa4beea44); /* 37 */
HH (d, a, b, c, x( 4), S32, 0x4bdecfa9); /* 38 */
HH (c, d, a, b, x( 7), S33, 0xf6bb4b60); /* 39 */
HH (b, c, d, a, x(10), S34, 0xbebfbc70); /* 40 */
HH (a, b, c, d, x(13), S31, 0x289b7ec6); /* 41 */
HH (d, a, b, c, x( 0), S32, 0xeaa127fa); /* 42 */
HH (c, d, a, b, x( 3), S33, 0xd4ef3085); /* 43 */
HH (b, c, d, a, x( 6), S34, 0x4881d05); /* 44 */
HH (a, b, c, d, x( 9), S31, 0xd9d4d039); /* 45 */
HH (d, a, b, c, x(12), S32, 0xe6db99e5); /* 46 */
HH (c, d, a, b, x(15), S33, 0x1fa27cf8); /* 47 */
HH (b, c, d, a, x( 2), S34, 0xc4ac5665); /* 48 */
/* Round 4 */
II (a, b, c, d, x( 0), S41, 0xf4292244); /* 49 */
II (d, a, b, c, x( 7), S42, 0x432aff97); /* 50 */
II (c, d, a, b, x(14), S43, 0xab9423a7); /* 51 */
II (b, c, d, a, x( 5), S44, 0xfc93a039); /* 52 */
II (a, b, c, d, x(12), S41, 0x655b59c3); /* 53 */
II (d, a, b, c, x( 3), S42, 0x8f0ccc92); /* 54 */
II (c, d, a, b, x(10), S43, 0xffeff47d); /* 55 */
II (b, c, d, a, x( 1), S44, 0x85845dd1); /* 56 */
II (a, b, c, d, x( 8), S41, 0x6fa87e4f); /* 57 */
II (d, a, b, c, x(15), S42, 0xfe2ce6e0); /* 58 */
II (c, d, a, b, x( 6), S43, 0xa3014314); /* 59 */
II (b, c, d, a, x(13), S44, 0x4e0811a1); /* 60 */
II (a, b, c, d, x( 4), S41, 0xf7537e82); /* 61 */
II (d, a, b, c, x(11), S42, 0xbd3af235); /* 62 */
II (c, d, a, b, x( 2), S43, 0x2ad7d2bb); /* 63 */
II (b, c, d, a, x( 9), S44, 0xeb86d391); /* 64 */
__asm {
mov [x],0x67452301;
mov [x+4],0xefcdab89;
mov [x+8],0x98badcfe;
mov [x+12],0x10325476;
add [x],a;
add [x+4],b;
add [x+8],c;
add [x+12],d;
}
__asm popad;
}
}
memset(x+16,0,48);
x[4] = 0x80;
x[14] = 0x80;
//主要轮次
for(UI32 i=1;i<LoopNum;i++)
{
__asm pushad;
{
__asm {
//initial
mov a,0x67452301
mov b,0xefcdab89
mov c,0x98badcfe
mov d,0x10325476
}
/* Round 1 */
FF(a, b, c, d, x( 0), S11, 0xd76aa478); /* 1 */
FF(d, a, b, c, x( 1), S12, 0xe8c7b756); /* 2 */
FF(c, d, a, b, x( 2), S13, 0x242070db); /* 3 */
FF(b, c, d, a, x( 3), S14, 0xc1bdceee); /* 4 */
FF(a, b, c, d, x( 4), S11, 0xf57c0faf); /* 5 */
FF(d, a, b, c, x( 5), S12, 0x4787c62a); /* 6 */
FF(c, d, a, b, x( 6), S13, 0xa8304613); /* 7 */
FF(b, c, d, a, x( 7), S14, 0xfd469501); /* 8 */
FF(a, b, c, d, x( 8), S11, 0x698098d8); /* 9 */
FF(d, a, b, c, x( 9), S12, 0x8b44f7af); /* 10 */
FF(c, d, a, b, x(10), S13, 0xffff5bb1); /* 11 */
FF(b, c, d, a, x(11), S14, 0x895cd7be); /* 12 */
FF(a, b, c, d, x(12), S11, 0x6b901122); /* 13 */
FF(d, a, b, c, x(13), S12, 0xfd987193); /* 14 */
FF(c, d, a, b, x(14), S13, 0xa679438e); /* 15 */
FF(b, c, d, a, x(15), S14, 0x49b40821); /* 16 */
/* Round 2 */
GG (a, b, c, d, x( 1), S21, 0xf61e2562); /* 17 */
GG (d, a, b, c, x( 6), S22, 0xc040b340); /* 18 */
GG (c, d, a, b, x(11), S23, 0x265e5a51); /* 19 */
GG (b, c, d, a, x( 0), S24, 0xe9b6c7aa); /* 20 */
GG (a, b, c, d, x( 5), S21, 0xd62f105d); /* 21 */
GG (d, a, b, c, x(10), S22, 0x2441453); /* 22 */
GG (c, d, a, b, x(15), S23, 0xd8a1e681); /* 23 */
GG (b, c, d, a, x( 4), S24, 0xe7d3fbc8); /* 24 */
GG (a, b, c, d, x( 9), S21, 0x21e1cde6); /* 25 */
GG (d, a, b, c, x(14), S22, 0xc33707d6); /* 26 */
GG (c, d, a, b, x( 3), S23, 0xf4d50d87); /* 27 */
GG (b, c, d, a, x( 8), S24, 0x455a14ed); /* 28 */
GG (a, b, c, d, x(13), S21, 0xa9e3e905); /* 29 */
GG (d, a, b, c, x( 2), S22, 0xfcefa3f8); /* 30 */
GG (c, d, a, b, x( 7), S23, 0x676f02d9); /* 31 */
GG (b, c, d, a, x(12), S24, 0x8d2a4c8a); /* 32 */
/* Round 3 */
HH (a, b, c, d, x( 5), S31, 0xfffa3942); /* 33 */
HH (d, a, b, c, x( 8), S32, 0x8771f681); /* 34 */
HH (c, d, a, b, x(11), S33, 0x6d9d6122); /* 35 */
HH (b, c, d, a, x(14), S34, 0xfde5380c); /* 36 */
HH (a, b, c, d, x( 1), S31, 0xa4beea44); /* 37 */
HH (d, a, b, c, x( 4), S32, 0x4bdecfa9); /* 38 */
HH (c, d, a, b, x( 7), S33, 0xf6bb4b60); /* 39 */
HH (b, c, d, a, x(10), S34, 0xbebfbc70); /* 40 */
HH (a, b, c, d, x(13), S31, 0x289b7ec6); /* 41 */
HH (d, a, b, c, x( 0), S32, 0xeaa127fa); /* 42 */
HH (c, d, a, b, x( 3), S33, 0xd4ef3085); /* 43 */
HH (b, c, d, a, x( 6), S34, 0x4881d05); /* 44 */
HH (a, b, c, d, x( 9), S31, 0xd9d4d039); /* 45 */
HH (d, a, b, c, x(12), S32, 0xe6db99e5); /* 46 */
HH (c, d, a, b, x(15), S33, 0x1fa27cf8); /* 47 */
HH (b, c, d, a, x( 2), S34, 0xc4ac5665); /* 48 */
/* Round 4 */
II (a, b, c, d, x( 0), S41, 0xf4292244); /* 49 */
II (d, a, b, c, x( 7), S42, 0x432aff97); /* 50 */
II (c, d, a, b, x(14), S43, 0xab9423a7); /* 51 */
II (b, c, d, a, x( 5), S44, 0xfc93a039); /* 52 */
II (a, b, c, d, x(12), S41, 0x655b59c3); /* 53 */
II (d, a, b, c, x( 3), S42, 0x8f0ccc92); /* 54 */
II (c, d, a, b, x(10), S43, 0xffeff47d); /* 55 */
II (b, c, d, a, x( 1), S44, 0x85845dd1); /* 56 */
II (a, b, c, d, x( 8), S41, 0x6fa87e4f); /* 57 */
II (d, a, b, c, x(15), S42, 0xfe2ce6e0); /* 58 */
II (c, d, a, b, x( 6), S43, 0xa3014314); /* 59 */
II (b, c, d, a, x(13), S44, 0x4e0811a1); /* 60 */
II (a, b, c, d, x( 4), S41, 0xf7537e82); /* 61 */
II (d, a, b, c, x(11), S42, 0xbd3af235); /* 62 */
II (c, d, a, b, x( 2), S43, 0x2ad7d2bb); /* 63 */
II (b, c, d, a, x( 9), S44, 0xeb86d391); /* 64 */
__asm {
mov [x],0x67452301;
mov [x+4],0xefcdab89;
mov [x+8],0x98badcfe;
mov [x+12],0x10325476;
add [x],a;
add [x+4],b;
add [x+8],c;
add [x+12],d;
}
}
__asm popad;
}
if(memcmp(MD5Result,x,16) == 0) return true;
return false;
}
有一点很重要的就是,vc好像不主动优化汇编代码。
速度上没有改观的主要原因可能是因为x数组的数据没有保存到寄存器中。
考虑到x[5-13]=0,以及x[4]=x[14]=0x80,如果把x[0-3]保存到mmx空间,我估计时间上肯定能好不少。
能力值:
( LV12,RANK:210 )
11 楼
工作了半天,终于写出了基于mmx的代码。并且使用了一些技巧。比如,
F(x,y,z) = (x and y) or ( not(x) and z) 可以修改为:
f(x,y,z) = ((y xor z) and x) xor z
同时,每次比较2个密码。这点利用了mmx是64位的特性。不过,难以执信的是,代码速度的提速没有预计的那么明显。明天再探讨这个问题。今天困了。
代码如下:
//Md5算法
typedef unsigned char UI8;
typedef char I8;
typedef unsigned long UI32;
//mm0,mm1,mm2,mm3保存有2个md5变换的a,b,c,d值
//a0和a1都保存在这里
#define a mm0
//b0,b1
#define b mm1
//c0,c1
#define c mm2
//d0,d1
#define d mm3
//m0,m1,m2,m3是第一个数据
//m4,m5,m6,m7是第二个数据
#define m2 eax
#define m6 ebx
#define m3 ecx
#define m7 edx
//m0,m4 保存在mm4
//m1,m5 保存在mm5
//把ac(32)复制2个到mm7(64)中去
#define Move(ac) \
__asm mov esi,ac \
__asm movd mm6,esi \
__asm movd mm7,esi \
__asm psll mm6,32 \
__asm por mm7,mm6
//把data(32)复制2个到a0(64)中去
#define Move0(a0,data) \
__asm mov esi,data \
__asm movd a0,esi \
__asm movd mm7,esi \
__asm psll a0,32 \
__asm por a0,mm7 #define F(x,y,z) \
__asm movq mm6,y \
__asm pxor mm6,z \
__asm pand mm6,x \
__asm pxor mm6,z
#define G(x,y,z) \
__asm movq mm6,x \
__asm pxor mm6,y \
__asm pand mm6,z \
__asm pxor mm6,y
#define H(x,y,z) \
__asm movq mm6,x \
__asm pxor mm6,y \
__asm pxor mm6,z
#define I(x,y,z) \
__asm movd mm6,edi \
__asm movd mm7,edi \
__asm psllq mm6,32 \
__asm pxor mm6,mm7 \
__asm pxor mm6,z \
__asm por mm6,x \
__asm pxor mm6,y //当x数组数据为0或者0x80时,有x[4]=0x80,x[14]=0x80,x[5-13,15]=0;
//ac 为普通的2个32位组成
//s0 + s1 = 32,因为没有循环左移位
#define md5_FF0(a0,b0,c0,d0,s0,s1,ac) \
Move(ac) \
F(b0,c0,d0) \
__asm paddd a0,mm7 \
__asm paddd a0,mm6 \
__asm movq mm7,a0 __asm psrld a0,s0 __asm pslld mm7,s1 __asm por a0,mm7 \
__asm paddd a0,b0 //当x数组数据不为0时
//调用第一个数据
#define md5_FF1(a0,b0,c0,d0,s0,s1,ac) \
Move(ac) \
F(b0,c0,d0) \
__asm paddd a0,mm6 \
__asm paddd mm7,mm4 \
__asm paddd a0,mm7 \
__asm movq mm7,a0 __asm psrld a0,s0 __asm pslld mm7,s1 __asm por a0,mm7 \
__asm paddd a0,b0
//第二个数据
#define md5_FF2(a0,b0,c0,d0,s0,s1,ac) \
Move(ac) \
F(b0,c0,d0) \
__asm paddd mm7,mm5 \
__asm paddd a0,mm6 \
__asm paddd a0,mm7 \
__asm movq mm7,a0 __asm psrld a0,s0 __asm pslld mm7,s1 __asm por a0,mm7 \
__asm paddd a0,b0
//第三个数据
#define md5_FF3(a0,b0,c0,d0,s0,s1,ac) \
Move(ac) \
F(b0,c0,d0) \
__asm paddd mm7,mm6 \
__asm paddd a0,mm7 \
__asm movd mm6,eax \
__asm movd mm7,ebx \
__asm psll mm6,32 \
__asm por mm7,mm6 \
__asm paddd a0,mm7 \
__asm movq mm7,a0 __asm psrld a0,s0 __asm pslld mm7,s1 __asm por a0,mm7 \
__asm paddd a0,b0
//第四个数据
#define md5_FF4(a0,b0,c0,d0,s0,s1,ac) \
Move(ac) \
F(b0,c0,d0) \
__asm paddd mm7,mm6 \
__asm paddd a0,mm7 \
__asm movd mm6,ecx \
__asm movd mm7,edx \
__asm psll mm6,32 \
__asm por mm7,mm6 \
__asm paddd a0,mm7 \
__asm movq mm7,a0 __asm psrld a0,s0 __asm pslld mm7,s1 __asm por a0,mm7 \
__asm paddd a0,b0
//为0
#define md5_GG0(a0,b0,c0,d0,s0,s1,ac) \
Move(ac) \
G(b0,c0,d0) \
__asm paddd a0,mm6 \
__asm paddd a0,mm7 \
__asm movq mm7,a0 __asm psrld a0,s0 __asm pslld mm7,s1 __asm por a0,mm7 \
__asm paddd a0,b0
//当x数组数据不为0时
#define md5_GG1(a0,b0,c0,d0,s0,s1,ac) \
Move(ac) \
G(b0,c0,d0) \
__asm paddd mm7,mm4 \
__asm paddd a0,mm6 \
__asm paddd a0,mm7 \
__asm movq mm7,a0 __asm psrld a0,s0 __asm pslld mm7,s1 __asm por a0,mm7 \
__asm paddd a0,b0
#define md5_GG2(a0,b0,c0,d0,s0,s1,ac) \
Move(ac) \
G(b0,c0,d0) \
__asm paddd mm7,mm5 \
__asm paddd a0,mm6 \
__asm paddd a0,mm7 \
__asm movq mm7,a0 __asm psrld a0,s0 __asm pslld mm7,s1 __asm por a0,mm7 \
__asm paddd a0,b0
#define md5_GG3(a0,b0,c0,d0,s0,s1,ac) \
Move(ac) \
G(b0,c0,d0) \
__asm paddd mm7,mm6 \
__asm paddd a0,mm7 \
__asm movd mm6,eax \
__asm movd mm7,ebx \
__asm psll mm6,32 \
__asm por mm7,mm6 \
__asm paddd a0,mm7 \
__asm movq mm7,a0 __asm psrld a0,s0 __asm pslld mm7,s1 __asm por a0,mm7 \
__asm paddd a0,b0
#define md5_GG4(a0,b0,c0,d0,s0,s1,ac) \
Move(ac) \
G(b0,c0,d0) \
__asm paddd mm7,mm6 \
__asm paddd a0,mm7 \
__asm movd mm6,ecx \
__asm movd mm7,edx \
__asm psll mm6,32 \
__asm por mm7,mm6 \
__asm paddd a0,mm7 \
__asm movq mm7,a0 __asm psrld a0,s0 __asm pslld mm7,s1 __asm por a0,mm7 \
__asm paddd a0,b0 //为0
#define md5_HH0(a0,b0,c0,d0,s0,s1,ac) \
Move(ac) \
H(b0,c0,d0) \
__asm paddd a0,mm6 \
__asm paddd a0,mm7 \
__asm movq mm7,a0 __asm psrld a0,s0 __asm pslld mm7,s1 __asm por a0,mm7 \
__asm paddd a0,b0
//当x数组数据不为0时
#define md5_HH1(a0,b0,c0,d0,s0,s1,ac) \
Move(ac) \
H(b0,c0,d0) \
__asm paddd mm7,mm4 \
__asm paddd a0,mm6 \
__asm paddd a0,mm7 \
__asm movq mm7,a0 __asm psrld a0,s0 __asm pslld mm7,s1 __asm por a0,mm7 \
__asm paddd a0,b0
#define md5_HH2(a0,b0,c0,d0,s0,s1,ac) \
Move(ac) \
H(b0,c0,d0) \
__asm paddd mm7,mm5 \
__asm paddd a0,mm6 \
__asm paddd a0,mm7 \
__asm movq mm7,a0 __asm psrld a0,s0 __asm pslld mm7,s1 __asm por a0,mm7 \
__asm paddd a0,b0
#define md5_HH3(a0,b0,c0,d0,s0,s1,ac) \
Move(ac) \
H(b0,c0,d0) \
__asm paddd mm7,mm6 \
__asm paddd a0,mm7 \
__asm movd mm6,eax \
__asm movd mm7,ebx \
__asm psll mm6,32 \
__asm por mm7,mm6 \
__asm paddd a0,mm7 \
__asm movq mm7,a0 __asm psrld a0,s0 __asm pslld mm7,s1 __asm por a0,mm7 \
__asm paddd a0,b0
#define md5_HH4(a0,b0,c0,d0,s0,s1,ac) \
Move(ac) \
H(b0,c0,d0) \
__asm paddd mm7,mm6 \
__asm paddd a0,mm7 \
__asm movd mm6,ecx \
__asm movd mm7,edx \
__asm psll mm6,32 \
__asm por mm7,mm6 \
__asm paddd a0,mm7 \
__asm movq mm7,a0 __asm psrld a0,s0 __asm pslld mm7,s1 __asm por a0,mm7 \
__asm paddd a0,b0 //为0
#define md5_II0(a0,b0,c0,d0,s0,s1,ac)\
I(b0,c0,d0) \
__asm paddd a0,mm6 \
Move(ac) \
__asm paddd a0,mm7 \
__asm movq mm7,a0 __asm psrld a0,s0 __asm pslld mm7,s1 __asm por a0,mm7 \
__asm paddd a0,b0
//当x数组数据不为0时
#define md5_II1(a0,b0,c0,d0,s0,s1,ac) \
I(b0,c0,d0) \
__asm paddd a0,mm6 \
Move(ac) \
__asm paddd mm7,mm4 \
__asm paddd a0,mm7 \
__asm movq mm7,a0 __asm psrld a0,s0 __asm pslld mm7,s1 __asm por a0,mm7 \
__asm paddd a0,b0
#define md5_II2(a0,b0,c0,d0,s0,s1,ac) \
I(b0,c0,d0) \
__asm paddd a0,mm6 \
Move(ac) \
__asm paddd mm7,mm5 \
__asm paddd a0,mm7 \
__asm movq mm7,a0 __asm psrld a0,s0 __asm pslld mm7,s1 __asm por a0,mm7 \
__asm paddd a0,b0
#define md5_II3(a0,b0,c0,d0,s0,s1,ac) \
I(b0,c0,d0) \
__asm paddd a0,mm6 \
Move(ac) \
__asm paddd a0,mm7 \
__asm movd mm6,eax \
__asm movd mm7,ebx \
__asm psll mm6,32 \
__asm por mm7,mm6 \
__asm paddd a0,mm7 \
__asm movq mm7,a0 __asm psrld a0,s0 __asm pslld mm7,s1 __asm por a0,mm7 \
__asm paddd a0,b0
#define md5_II4(a0,b0,c0,d0,s0,s1,ac) \
I(b0,c0,d0) \
__asm paddd a0,mm6 \
Move(ac) \
__asm paddd a0,mm7 \
__asm movd mm6,ecx \
__asm movd mm7,edx \
__asm psll mm6,32 \
__asm por mm7,mm6 \
__asm paddd a0,mm7 \
__asm movq mm7,a0 __asm psrld a0,s0 __asm pslld mm7,s1 __asm por a0,mm7 \
__asm paddd a0,b0
#define md5_S11 25
#define md5_S12 20
#define md5_S13 15
#define md5_S14 10
#define md5_S21 27
#define md5_S22 23
#define md5_S23 18
#define md5_S24 12
#define md5_S31 28
#define md5_S32 21
#define md5_S33 16
#define md5_S34 9
#define md5_S41 26
#define md5_S42 22
#define md5_S43 17
#define md5_S44 11
//以下数据和上面数据对应的和为32
#define md5_S110 7
#define md5_S120 12
#define md5_S130 17
#define md5_S140 22
#define md5_S210 5
#define md5_S220 9
#define md5_S230 14
#define md5_S240 20
#define md5_S310 4
#define md5_S320 11
#define md5_S330 16
#define md5_S340 23
#define md5_S410 6
#define md5_S420 10
#define md5_S430 15
#define md5_S440 21 ///////////////////////////////////////
// QQ解密正式开始
//////////////////////////////////////
//作者:冲出宇宙
//2005,11,2
//////////////////////////////////////
UI8 MD5Result[16]; //md5加密后的结果
UI32 LoopNum; //循环次数
UI32 QQNum; //qq号码
UI32 PwdNum; //已经对多少个字符串进行了检查
CString Pwd; //当前正确的密码
CString FileQQ,FilePwd; //密码文件和密码字典文件
DWORD DecodeThreadId;
HANDLE DecodeThreadHandle; //解密线程
CQQDecoderCtrl *Me;
//密码是否正确,每次测试2个密码
int IsPasswordCorrect(char* sPwd0,char* sPwd1)
{
UI32 i,dataIn0[4],dataIn1[4];
MD5 md5;
//第一轮
md5.Hash((UI8*)dataIn0,(UI8*)sPwd0,strlen(sPwd0));
md5.Hash((UI8*)dataIn1,(UI8*)sPwd1,strlen(sPwd1));
__asm pushad;
//准备输入数据
__asm
{
//1: mm4
mov esi,[dataIn0];
mov edi,[dataIn1];
movd mm4,esi;
movd mm6,edi;
psll mm4,32;
por mm4,mm6;
//2: mm5
mov esi,[dataIn0+4];
mov edi,[dataIn1+4];
movd mm5,esi;
movd mm6,edi;
psll mm5,32;
por mm5,mm6;
//3: eax:ebx
mov eax,[dataIn0+8];
mov ebx,[dataIn1+8];
//4: ecx:edx
mov ecx,[dataIn0+12];
mov edx,[dataIn1+12];
//5: mov esi,0xffffffff
xor edi,edi;
not edi;
}
//主要轮次
__asm
{
push ebp;
mov ebp,LoopNum;
}
Begin:
__asm
{
dec ebp;
cmp ebp,0;
je End;
Move0(a,0x67452301);
Move0(b,0xefcdab89);
Move0(c,0x98badcfe);
Move0(d,0x10325476);
md5_FF1 (a, b, c, d, md5_S11, md5_S110,0xd76aa478);
md5_FF2 (d, a, b, c, md5_S12, md5_S120,0xe8c7b756);
md5_FF3 (c, d, a, b, md5_S13, md5_S130,0x242070db);
md5_FF4 (b, c, d, a, md5_S14, md5_S140,0xc1bdceee);
md5_FF0 (a, b, c, d, md5_S11, md5_S110,0xf57c102f);
md5_FF0 (d, a, b, c, md5_S12, md5_S120,0x4787c62a);
md5_FF0 (c, d, a, b, md5_S13, md5_S130,0xa8304613);
md5_FF0 (b, c, d, a, md5_S14, md5_S140,0xfd469501);
md5_FF0 (a, b, c, d, md5_S11,md5_S110, 0x698098d8);
md5_FF0 (d, a, b, c, md5_S12, md5_S120,0x8b44f7af);
md5_FF0 (c, d, a, b, md5_S13, md5_S130,0xffff5bb1);
md5_FF0 (b, c, d, a, md5_S14, md5_S140,0x895cd7be);
md5_FF0 (a, b, c, d, md5_S11, md5_S110,0x6b901122);
md5_FF0 (d, a, b, c, md5_S12, md5_S120,0xfd987193);
md5_FF0 (c, d, a, b,md5_S13, md5_S130,0xa679440e);
md5_FF0 (b, c, d, a, md5_S14, md5_S140,0x49b40821);
md5_GG2 (a, b, c, d,md5_S21, md5_S210,0xf61e2562);
md5_GG0 (d, a, b, c, md5_S22, md5_S220,0xc040b340);
md5_GG0 (c, d, a, b, md5_S23, md5_S230,0x265e5a51);
md5_GG1 (b, c, d, a,md5_S24, md5_S240,0xe9b6c7aa);
md5_GG0 (a, b, c, d, md5_S21, md5_S210,0xd62f105d);
md5_GG0 (d, a, b, c, md5_S22, md5_S220, 0x2441453);
md5_GG0 (c, d, a, b, md5_S23, md5_S230,0xd8a1e681);
md5_GG0 (b, c, d, a, md5_S24, md5_S240,0xe7d3fc48);
md5_GG0 (a, b, c, d, md5_S21, md5_S210,0x21e1cde6);
md5_GG0 (d, a, b, c, md5_S22, md5_S220,0xc3370856);
md5_GG4 (c, d, a, b,md5_S23, md5_S230,0xf4d50d87);
md5_GG0 (b, c, d, a, md5_S24, md5_S240,0x455a14ed);
md5_GG0 (a, b, c, d, md5_S21, md5_S210,0xa9e3e905);
md5_GG3 (d, a, b, c,md5_S22, md5_S220,0xfcefa3f8);
md5_GG0 (c, d, a, b, md5_S23, md5_S230,0x676f02d9);
md5_GG0 (b, c, d, a, md5_S24,md5_S240, 0x8d2a4c8a);
md5_HH0 (a, b, c, d, md5_S31, md5_S310,0xfffa3942);
md5_HH0 (d, a, b, c, md5_S32, md5_S320,0x8771f681);
md5_HH0 (c, d, a, b, md5_S33, md5_S330,0x6d9d6122);
md5_HH0 (b, c, d, a, md5_S34, md5_S340,0xfde5388c);
md5_HH2 (a, b, c, d,md5_S31, md5_S310,0xa4beea44);
md5_HH0 (d, a, b, c, md5_S32, md5_S320,0x4bded029);
md5_HH0 (c, d, a, b, md5_S33, md5_S330,0xf6bb4b60);
md5_HH0 (b, c, d, a, md5_S34, md5_S340,0xbebfbc70);
md5_HH0 (a, b, c, d, md5_S31, md5_S310,0x289b7ec6);
md5_HH1 (d, a, b, c,md5_S32, md5_S320,0xeaa127fa);
md5_HH4 (c, d, a, b,md5_S33, md5_S330,0xd4ef3085);
md5_HH0 (b, c, d, a, md5_S34, md5_S340, 0x4881d05);
md5_HH0 (a, b, c, d, md5_S31, md5_S310,0xd9d4d039);
md5_HH0 (d, a, b, c, md5_S32, md5_S320,0xe6db99e5);
md5_HH0 (c, d, a, b, md5_S33, md5_S330,0x1fa27cf8);
md5_HH3 (b, c, d, a,md5_S34, md5_S340,0xc4ac5665);
md5_II1 (a, b, c, d,md5_S41, md5_S410,0xf4292244);
md5_II0 (d, a, b, c, md5_S42, md5_S420,0x432aff97);
md5_II0 (c, d, a, b, md5_S43, md5_S430,0xab942427);
md5_II0 (b, c, d, a, md5_S44, md5_S440,0xfc93a039);
md5_II0 (a, b, c, d, md5_S41, md5_S410,0x655b59c3);
md5_II4 (d, a, b, c,md5_S42, md5_S420,0x8f0ccc92);
md5_II0 (c, d, a, b, md5_S43, md5_S430,0xffeff47d);
md5_II2 (b, c, d, a, md5_S44, md5_S440,0x85845dd1);
md5_II0 (a, b, c, d, md5_S41, md5_S410,0x6fa87e4f);
md5_II0 (d, a, b, c, md5_S42, md5_S420,0xfe2ce6e0);
md5_II0 (c, d, a, b, md5_S43,md5_S430, 0xa3014314);
md5_II0 (b, c, d, a, md5_S44, md5_S440,0x4e0811a1);
md5_II0 (a, b, c, d, md5_S41,md5_S410, 0xf7537f02);
md5_II0 (d, a, b, c, md5_S42,md5_S420, 0xbd3af235);
md5_II3 (c, d, a, b, md5_S43, md5_S430, 0x2ad7d2bb);
md5_II0 (b, c, d, a, md5_S44, md5_S440,0xeb86d391);
Move0(mm4,0x67452301);
__asm paddd mm4,a;
Move0(mm5,0xefcdab89);
__asm paddd mm5,b;
Move0(mm6,0x98badcfe);
__asm paddd mm6,c;
__asm movd ebx,mm6;
__asm psrl mm6,32;
__asm movd eax,mm6;
Move0(mm6,0x10325476);
__asm paddd mm6,d;
__asm movd edx,mm6;
__asm psrl mm6,32;
__asm movd ecx,mm6;
__asm jmp Begin;
}
End:
//输出数据
__asm
{
pop ebp;
//1:mm4
movd esi,mm4;
mov [dataIn1],esi;
psrl mm4,32;
movd esi,mm4;
mov [dataIn0],esi;
//2:mm5
movd esi,mm5;
mov [dataIn1+4],esi;
psrl mm5,32;
movd esi,mm5;
mov [dataIn0+4],esi;
//3:eax:ebx
mov [dataIn0+8],eax;
mov [dataIn1+8],ebx;
//4:ecx:edx
mov [dataIn0+12],ecx;
mov [dataIn1+12],edx;
emms;
}
__asm popad;
if(memcmp(MD5Result,dataIn0,16) == 0) return 1;
if(memcmp(MD5Result,dataIn1,16) == 0) return 2;
return 3;
}