[原创]图标点选，opencv图标匹配，非模型纯算法识别

发表于: 2024-9-27 21:51 4052

[原创]图标点选，opencv图标匹配，非模型纯算法识别

太岁又沐风

2024-9-27 21:51

4052

0x0 前言

github开源地址：https://github.com/taisuii/OpenCV_IconSelect

验证码分析

验证码例子为，数美
在这里插入图片描述

我们不难可以发现这几个特征点

图标大小均匀没有拉伸和畸变，只进行了简单的旋转
图标颜色单一且均为红色

解决方案

对于这种图像，我们可以直接使用纯算法识别，思路如下：
提取背景图红色像素部分，把小图标按X轴均匀切割，逐个匹配，或四个线程并发匹配

0x1 识别算法部分

字节流转换为cv2图片

对于网络下载的图片进行转换以便于后续处理

def cv2_imread_buffer(buffer):
    buffer = io.BytesIO(buffer)
    arr = np.frombuffer(buffer.getvalue(), np.uint8)
    img = cv2.imdecode(arr, cv2.IMREAD_COLOR)
    return img

背景图红色部分提取

def preprocess_red_image(img):
    hsv = cv2.cvtColor(img, cv2.COLOR_BGR2HSV)
    lower_red1 = np.array([0, 120, 70])
    upper_red1 = np.array([10, 255, 255])
    lower_red2 = np.array([170, 120, 70])
    upper_red2 = np.array([180, 255, 255])
    mask1 = cv2.inRange(hsv, lower_red1, upper_red1)
    mask2 = cv2.inRange(hsv, lower_red2, upper_red2)
    mask = cv2.bitwise_or(mask1, mask2)
    result = np.zeros_like(img)
    result[mask > 0] = img[mask > 0]
    return result

提取后效果如下，到这一步，几乎是无脑识别了，剩下的代码就是
在这里插入图片描述

识别，匹配出坐标

切割小图标，并把小图标缩放成和背景图上大小差不多的图标
然后旋转360度，每6度匹配一次大图

def split_image_tag(img, tag_pos):
    x, y = tag_pos
    img_ = img[0:35, y - 37:y]
    return img_
# 多线程识别
def process_tag(tag_pos):
 
    new_template = split_image_tag(img_2, tag_pos)
    new_size = 75
    new_template = cv2.resize(new_template, (new_size, new_size))
 
    ocr_infos = []
    angel_size = 6
 
    for angle in range(-180, 180, angel_size):
        template_ = rotate_image(new_template, angle)
        max_val, max_loc = template_match(template_, img_1)
        ocr_infos.append([angle, max_val, max_loc])
 
    max_info = max(ocr_infos, key=lambda x: x[1])
 
    return max_info
 
with ThreadPoolExecutor() as executor:
    results = list(executor.map(process_tag, [(37, 37), (37, 74), (37, 111), (37, 148)]))
 
for max_info in results:
    match_tag_list.append(list(max_info[-1]))
 
return match_tag_list

旋转图片，模板匹配

# 旋转图片
def rotate_image(template, angle):
    center = (template.shape[1] // 2, template.shape[0] // 2)
    rotation_matrix = cv2.getRotationMatrix2D(center, angle, 1.0)
    rotated_image = cv2.warpAffine(template, rotation_matrix, (template.shape[1], template.shape[0]),
                                   flags=cv2.INTER_CUBIC, borderMode=cv2.BORDER_REPLICATE)
    return rotated_image
 
 
# 模板匹配
def template_match(template, img):
    template_gray = cv2.cvtColor(template, cv2.COLOR_BGR2GRAY)
    img_gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
    res = cv2.matchTemplate(img_gray, template_gray, cv2.TM_CCOEFF_NORMED)
    min_val, max_val, min_loc, max_loc = cv2.minMaxLoc(res)
    return max_val, max_loc

识别结果 300+ms，速度非常不错，使用了线程识别
[[132, 71], [181, 20], [88, 29], [221, 97]]
识别耗时：0.3492300510406494

0x3 识别测试

这里仍然采用官网去测试了100次识别，平均速度344ms，成功率84%
在这里插入图片描述

在这里插入图片描述

[培训]内核驱动高级班，冲击BAT一流互联网大厂工作，每周日13:00-18:00直播授课

#其他

上传的附件：

ocr.py （3.79kb，12次下载）

收藏・4

免费・3

支持

赞赏记录

参与人

雪币

留言

时间

gusong

这个讨论对我很有帮助，谢谢！

2025-2-16 21:42

迷雾中的影子

感谢你分享这么好的资源！

2024-11-12 17:25

gamehack

感谢你分享这么好的资源！

2024-9-27 22:14

最新回复 (2)
mb_ldbucrik 雪币： 10 能力值： ( LV1，RANK：0 ) 在线值：发帖 0 回帖 300 粉丝 2 关注私信	mb_ldbucrik 2 楼感谢分享 2024-9-28 09:09 0
陈某人雪币： 1213 活跃值： (3982) 能力值： ( LV2，RANK：10 ) 在线值：发帖 0 回帖 60 粉丝 2 关注私信	陈某人 3 楼感谢分享 2024-11-10 19:45 0
	游客登录 \| 注册方可回帖回帖表情雪币赚取及消费高级回复

太岁又沐风

发帖

回帖

RANK

关注

私信

0x0 前言
0x1 识别算法部分
0x3 识别测试

他的文章

关于我们

联系我们

企业服务

看雪公众号

最新回复 (2)
mb_ldbucrik 雪币： 10 能力值： ( LV1，RANK：0 ) 在线值：发帖 0 回帖 300 粉丝 2 关注私信	mb_ldbucrik 2 楼感谢分享 2024-9-28 09:09 0
陈某人雪币： 1213 活跃值： (3982) 能力值： ( LV2，RANK：10 ) 在线值：发帖 0 回帖 60 粉丝 2 关注私信	陈某人 3 楼感谢分享 2024-11-10 19:45 0
	游客登录 \| 注册方可回帖回帖表情雪币赚取及消费高级回复