[原创]九宫格类型验证码识别图像特征提取(CNN图像分类)-WEB安全-看雪-安全社区|安全招聘|kanxue.com

[原创]九宫格类型验证码识别图像特征提取(CNN图像分类)

发表于: 2024-9-7 15:00 14131

[原创]九宫格类型验证码识别图像特征提取(CNN图像分类)

太岁又沐风

2024-9-7 15:00

14131

项目github : https://github.com/taisuii/ClassificationCaptchaOcr
某验验证码识别，算法部分不放了，识别的教程和代码如下

import requests

from PIL import Image, ImageFont, ImageDraw, ImageOps

from io import BytesIO

def crop_image(image_bytes, coordinates):

   img = Image.open(BytesIO(image_bytes))

   width, height = img.size

   grid_width = width // 3

   grid_height = height // 3

   cropped_images = []

   for coord in coordinates:

       y, x = coord

       left = (x - 1) * grid_width

       upper = (y - 1) * grid_height

       right = left + grid_width

       lower = upper + grid_height

       box = (left, upper, right, lower)

       cropped_img = img.crop(box)

       cropped_images.append(cropped_img)

   return cropped_images
# 切割顺序，这里是从左到右，从上到下[x,y]

coordinates = [[1, 1], [1, 2], [1, 3], [2, 1], [2, 2], [2, 3], [3, 1], [3, 2], [3, 3]]

bg_img = requests.get("https://static.geetest.com/captcha_v4/policy/3d0936b11a2c4a65bbb53635e656c780/nine/110394/2024-09-06T00/ed02acd0ac294a41b880d9106240f12a.jpg").content

cropped_images = crop_image(bg_img, coordinates)
# 一个个保存下来

for j, img_crop in enumerate(cropped_images):

   img_crop.save(f"./test_crop/bg{j}.jpg")

import requests

from PIL import Image, ImageFont, ImageDraw, ImageOps

from io import BytesIO

def crop_image(image_bytes, coordinates):

   img = Image.open(BytesIO(image_bytes))

   width, height = img.size

   grid_width = width // 3

   grid_height = height // 3

   cropped_images = []

   for coord in coordinates:

       y, x = coord

       left = (x - 1) * grid_width

       upper = (y - 1) * grid_height

       right = left + grid_width

       lower = upper + grid_height

       box = (left, upper, right, lower)

       cropped_img = img.crop(box)

       cropped_images.append(cropped_img)

   return cropped_images
# 切割顺序，这里是从左到右，从上到下[x,y]

coordinates = [[1, 1], [1, 2], [1, 3], [2, 1], [2, 2], [2, 3], [3, 1], [3, 2], [3, 3]]

bg_img = requests.get("https://static.geetest.com/captcha_v4/policy/3d0936b11a2c4a65bbb53635e656c780/nine/110394/2024-09-06T00/ed02acd0ac294a41b880d9106240f12a.jpg").content

cropped_images = crop_image(bg_img, coordinates)
# 一个个保存下来

for j, img_crop in enumerate(cropped_images):

   img_crop.save(f"./test_crop/bg{j}.jpg")

import torchvision.transforms as transforms

from torchvision.datasets import ImageFolder

from tqdm import tqdm

import torch

import torchvision

import torch.nn as nn

from torch.utils.data import DataLoader

import numpy as np
 
# 定义数据转换

data_transform = transforms.Compose(

   [

       transforms.Resize((224, 224)),  # 调整图像大小

       transforms.ToTensor(),  # 将图像转换为张量

       transforms.Normalize(

           (0.485, 0.456, 0.406), (0.229, 0.224, 0.225)

       ),  # 标准化图像

   ]
)
 
# 定义数据集

class CustomDataset:

   def __init__(self, data_dir):

       self.dataset = ImageFolder(root=data_dir, transform=data_transform)
 
   def __len__(self):

       return len(self.dataset)
 
   def __getitem__(self, idx):

       image, label = self.dataset[idx]

       return image, label
 
class MyResNet18(torch.nn.Module):

   def __init__(self, num_classes):

       super(MyResNet18, self).__init__()

       self.resnet = torchvision.models.resnet18(pretrained=True)

       self.resnet.fc = nn.Linear(512, num_classes)  # 修改这里的输入大小为512
 
   def forward(self, x):

       return self.resnet(x)
 
def train(epoch):

   device = torch.device("cuda" if torch.cuda.is_available() else "cpu")

   data_dir = "dataset"

   # 自定义数据集实例

   custom_dataset = CustomDataset(data_dir)

   # 数据加载器

   batch_size = 64

   data_loader = DataLoader(custom_dataset, batch_size=batch_size, shuffle=True)
 
   # 初始化模型 num_classes就是目录下的子文件夹数目，每个子文件夹对应一个分类，模型输出的向量长度也是这个长度

   model = MyResNet18(num_classes=91)

   model.to(device)
 
   # 损失函数

   criterion = torch.nn.CrossEntropyLoss()

   # 优化器

   optimizer = torch.optim.SGD(model.parameters(), lr=0.001, momentum=0.9)
 
   # 训练模型

   for i in range(epoch):

       losses = []
 
       # 迭代器进度条

       data_loader_tqdm = tqdm(data_loader)
 
       for inputs, labels in data_loader_tqdm:

           # 将输入数据和标签传输到指定的计算设备（如 GPU 或 CPU）

           inputs, labels = inputs.to(device), labels.to(device)
 
           # 梯度更新之前将所有模型参数的梯度置为零，防止梯度累积

           optimizer.zero_grad()
 
           # 前向传播：将输入数据传入模型，计算输出

           outputs = model(inputs)
 
           # 根据模型的输出和实际标签计算损失值

           loss = criterion(outputs, labels)
 
           # 将当前批次的损失值记录到 losses 列表中，以便后续计算平均损失

           losses.append(loss.item())

           epoch_loss = np.mean(losses)

           data_loader_tqdm.set_description(

               f"This epoch is {i} and it's loss is {loss.item()}, average loss {epoch_loss}"

           )

           # 反向传播：根据当前损失值计算模型参数的梯度

           loss.backward()

           # 使用优化器更新模型参数，根据梯度调整模型参数

           optimizer.step()

       # 每过一个batch就保存一次模型

       torch.save(model.state_dict(), f'model/my_resnet18_{epoch_loss}.pth')

   print(f"completed. Model saved.")

if __name__ == '__main__':

   train(50)

import torchvision.transforms as transforms

from torchvision.datasets import ImageFolder

from tqdm import tqdm

import torch

import torchvision

import torch.nn as nn

from torch.utils.data import DataLoader

import numpy as np
 
# 定义数据转换

data_transform = transforms.Compose(

   [

       transforms.Resize((224, 224)),  # 调整图像大小

       transforms.ToTensor(),  # 将图像转换为张量

       transforms.Normalize(

           (0.485, 0.456, 0.406), (0.229, 0.224, 0.225)

       ),  # 标准化图像

   ]
)
 
# 定义数据集

class CustomDataset:

   def __init__(self, data_dir):

       self.dataset = ImageFolder(root=data_dir, transform=data_transform)
 
   def __len__(self):

       return len(self.dataset)
 
   def __getitem__(self, idx):

       image, label = self.dataset[idx]

       return image, label
 
class MyResNet18(torch.nn.Module):

   def __init__(self, num_classes):

       super(MyResNet18, self).__init__()

       self.resnet = torchvision.models.resnet18(pretrained=True)

       self.resnet.fc = nn.Linear(512, num_classes)  # 修改这里的输入大小为512
 
   def forward(self, x):

       return self.resnet(x)
 
def train(epoch):

   device = torch.device("cuda" if torch.cuda.is_available() else "cpu")

   data_dir = "dataset"

   # 自定义数据集实例

   custom_dataset = CustomDataset(data_dir)

   # 数据加载器

   batch_size = 64

   data_loader = DataLoader(custom_dataset, batch_size=batch_size, shuffle=True)
 
   # 初始化模型 num_classes就是目录下的子文件夹数目，每个子文件夹对应一个分类，模型输出的向量长度也是这个长度

   model = MyResNet18(num_classes=91)

   model.to(device)

				登录后可查看完整内容
			
[注意]看雪招聘，专注安全领域的专业人才平台！

上传的附件：

			ClassificationCaptchaOcr-main.zip
		
		（1.46MB，11次下载）

收藏・12

免费・2

支持

赞赏记录

参与人

雪币

留言

时间

笑笑.

这个讨论对我很有帮助，谢谢！

2025-2-15 18:39

PLEBFE

为你点赞！

2025-1-23 03:36

最新回复 (5)
Black.WuKong 雪币： 302 活跃值： (458) 能力值： ( LV2，RANK：10 ) 在线值：发帖 0 回帖 11 粉丝 0 关注私信	Black.WuKong 2 楼楼主是搞算法的吗？我主业是做AI芯片的。 2024-9-7 15:23 0
mb_ldbucrik 雪币： 10 能力值： ( LV1，RANK：0 ) 在线值：发帖 0 回帖 302 粉丝 2 关注私信	mb_ldbucrik 3 楼感谢分享，其实难点还是轨迹的构造 2024-9-7 19:17 0
zylrocket 雪币： 3597 活跃值： (5999) 能力值： ( LV2，RANK：10 ) 在线值：发帖 27 回帖 271 粉丝 13 关注私信	zylrocket 4 楼思路不错，学习了！ 2024-9-14 08:10 0
mb_kzhbtosr 雪币： 6 能力值： ( LV1，RANK：0 ) 在线值：发帖 0 回帖 3 粉丝 0 关注私信	mb_kzhbtosr 5 楼岁哥活了啊 2024-10-10 15:39 0
ＴＭＤ雪币： 56 活跃值： (30) 能力值： ( LV2，RANK：10 ) 在线值：发帖 0 回帖 2 粉丝 0 关注私信	ＴＭＤ 6 楼谢谢分享，受教了！ 2024-10-25 22:05 0
	游客登录 \| 注册方可回帖回帖表情雪币赚取及消费高级回复

太岁又沐风

发帖

回帖

RANK

关注

私信

他的文章

关于我们

联系我们

企业服务

看雪公众号

最新回复 (5)
Black.WuKong 雪币： 302 活跃值： (458) 能力值： ( LV2，RANK：10 ) 在线值：发帖 0 回帖 11 粉丝 0 关注私信	Black.WuKong 2 楼楼主是搞算法的吗？我主业是做AI芯片的。 2024-9-7 15:23 0
mb_ldbucrik 雪币： 10 能力值： ( LV1，RANK：0 ) 在线值：发帖 0 回帖 302 粉丝 2 关注私信	mb_ldbucrik 3 楼感谢分享，其实难点还是轨迹的构造 2024-9-7 19:17 0
zylrocket 雪币： 3597 活跃值： (5999) 能力值： ( LV2，RANK：10 ) 在线值：发帖 27 回帖 271 粉丝 13 关注私信	zylrocket 4 楼思路不错，学习了！ 2024-9-14 08:10 0
mb_kzhbtosr 雪币： 6 能力值： ( LV1，RANK：0 ) 在线值：发帖 0 回帖 3 粉丝 0 关注私信	mb_kzhbtosr 5 楼岁哥活了啊 2024-10-10 15:39 0
ＴＭＤ雪币： 56 活跃值： (30) 能力值： ( LV2，RANK：10 ) 在线值：发帖 0 回帖 2 粉丝 0 关注私信	ＴＭＤ 6 楼谢谢分享，受教了！ 2024-10-25 22:05 0
	游客登录 \| 注册方可回帖回帖表情雪币赚取及消费高级回复

[原创]九宫格类型验证码识别图像特征提取(CNN图像分类)

账号登录 验证码登录

账号登录

验证码登录