首页
社区
课程
招聘
BinaryAI全新代码匹配模型BAI-2.0上线,“大模型”时代的安全实践[原创]
2023-2-8 14:35 6686

BinaryAI全新代码匹配模型BAI-2.0上线,“大模型”时代的安全实践[原创]

2023-2-8 14:35
6686

科恩实验室在2021年8月首次发布二进制安全智能分析平台—BinaryAI,BinaryAI可精准高效识别二进制文件的第三方组件及其版本号,旨在推动SCA(Software Composition Analysis,软件成分分析)技术在DevSecOps、威胁情报、安全研究等应用场景发展。
BinaryAI本次发布产品重要更新,配备创新的算法模型和持续扩展的后台数据。科恩代码匹配模型BAI-2.0和配套算法引擎彻底革新了SCA的表现,配合业界领先的数据集和种种精彩新功能,BinaryAI实现了分析准确性及效率的大幅提升。

关于BinaryAI

BinaryAI对上传文件进行自动化解包、解析后,基于自研SCA算法和后台GitHub全量C/C++库的开源组件数据集,对其进行软件成分分析、函数相似性检索,以业界领先的识别准确率匹配到文件所使用的开源组件,辅助用户完成软件成分分析和恶意软件分析的安全分析工作。BinaryAI算法引擎背后是各种AI算法和经典算法,其中核心的代码匹配模型在行业内具备显著优势。
科恩实验室持续深耕智能软件安全分析研究,联合多所高校和科研院所,在信息安全、软件工程和人工智能领域的多个顶级会议上发表十余篇文章。基于科恩智能软件安全分析的研究沉淀,BinaryAI不断提升其准确分析能力。

BinaryAI更新亮点

后端模型重磅升级

科恩代码匹配模型上线BAI-2.0,顺应了AI模型开发领域向大模型演进的趋势。大模型的出现不仅促进了技术的迭代,还衍生出一批备受关注的大模型应用,如AIGC图像生成应用、ChatGPT工具等。作为领域内的先行者,科恩通过在软件成分分析领域落地应用大模型,适配了该领域的细分场景,提升了BinaryAI的召回效果。

准确率步步攀升

BinaryAI基于科恩自研的代码匹配模型BAI-2.0和复杂图的程序分析算法,对可执行文件中的二进制函数使用图算法分析,同时与AI算法相辅相成,在GitHub全量C/C++库中找到匹配的源代码函数。经过多次迭代,BinaryAI的算法引擎提升了算法的准确率,降低了误报,较上个版本更上一台阶。

亿级函数数据集持续拓展

BinaryAI已经支持全网主流开源C/C++语言项目,采集了数万代码仓库的百万级版本分支,累计百亿C/C++源代码文件特征数据,去重后包含亿级函数特征。数据能力和算法引擎使得BinaryAI的SCA能够准确定位二进制文件所使用的的开源项目的具体版本,满足查看软件成分清单的需求。数据集已经拓宽对其他开发语言的支持,共计三百多万个代码仓库,未来将支持BinaryAI在其他开发语言、应用场景发挥其成分分析能力。
往期回顾:BinaryAI功能更新布告|构建全量开源项目数据集

倾听用户之声

为改善过去BinaryAI提供的插件在客户端上网络请求结果慢、交互体验不佳的问题,BinaryAI在网页平台上新增“BinaryAI函数相似性检索”导出能力,用户可以在平台上传二进制文件并浏览分析结果后,下载结果导入到IDA或Ghidra等二进制分析软件中,继续安全分析工作,这一优化将大幅提升深度分析二进制文件场景的用户体验。
此外,平台增加科恩自研腾讯云二进制软件成分分析产品—BSCA的跳转入口,用户可一键跳转体验漏洞扫描、License审计等特有功能,适用于DevSecOps 制品扫描、软件上线前安全风险识别、检查上下游供应链安全问题等应用场景。

最新功能特性展示

点击“BinaryAI函数相似性检索”,即可下载结果Json文件,获得插件的GitHub下载链接。

 

典型文件示例

 

软件成分分析和函数识别:示例1示例2

 

威胁情报(C2样本检测):示例3

 

威胁情报(挖矿样本检测):示例4

演示视频

最新功能特性演示视频

更多业务体验

BinaryAI的算法引擎核心能力已同步落地应用于腾讯安全多款产品:

除此之外,科恩实验室始终以积极的姿态探索软件安全领域和前沿AI结合的科研落地,推动成果转化以解决产业痛点问题。

加入用户群

微信扫码或搜索并添加“keenlab”为好友,发送“BinaryAI交流群”获得入群链接

了解更多

[1]腾讯安全科恩实验室推出首款免费在线SCA平台:BinaryAI

 

[2]BinaryAI功能更新布告|构建全量开源项目数据集

 

[3]科恩实验室最新NeurIPS-2020论文解读:基于跨模态检索的二进制代码-源代码匹配

 

[4]AAAI-20论文解读:基于图神经网络的二进制代码分析

 

[5]腾讯安全科恩实验室二进制安全最新成果入选AAAI-20


[培训]《安卓高级研修班(网课)》月薪三万计划,掌握调试、分析还原ollvm、vmp的方法,定制art虚拟机自动化脱壳的方法

最后于 2023-2-8 17:18 被科恩实验室编辑 ,原因:
收藏
点赞2
打赏
分享
最新回复 (4)
雪    币: 26
活跃值: (1375)
能力值: ( LV2,RANK:10 )
在线值:
发帖
回帖
粉丝
imliuxin 2023-2-24 11:12
2
0
今后还的研究怎样逃过它的分析
雪    币: 2428
活跃值: (2854)
能力值: ( LV3,RANK:20 )
在线值:
发帖
回帖
粉丝
boursonjane 2023-2-24 12:09
3
0
6
雪    币: 52
活跃值: (3274)
能力值: ( LV2,RANK:10 )
在线值:
发帖
回帖
粉丝
DirtyAngle 2023-2-24 13:49
4
0
单走一个6
雪    币: 5088
活跃值: (3837)
能力值: ( LV2,RANK:10 )
在线值:
发帖
回帖
粉丝
mb_rjdrqvpa 2023-2-24 14:08
5
0

试了一下,感觉还有很大提升空间,这个人工分析都能找到用了几个开源库的代码


游客
登录 | 注册 方可回帖
返回