首页
社区
课程
招聘
[原创]从免费的物联网防火墙hihttps谈机器学习之样本采集
发表于: 2020-2-1 11:58 8870

[原创]从免费的物联网防火墙hihttps谈机器学习之样本采集

2020-2-1 11:58
8870

   hiihttps是首款免费的MQTT物联网防火墙,同时也是一款web应用防火墙,既支持传统的WAF的OWASP特征工程检查(如SQL注入、XSS、恶意漏洞扫描、密码暴力破解、CC、DDOS等),也支持机器采集样本无监督学习,自主对抗,重新定义网络安全。今天笔者就从物联网MQTT协议安全的角度,介绍机器学习之样本采集。

   MQTT是物联网loT最广泛采用的协议,腾讯百度阿里云都支持,基础协议请百度搜索“物联网防火墙himqtt源码之MQTT协议分析”。在PUBLISH发布和主题订阅SUBSCRIBLE指令中,json是物联网最常用的通信格式,如:

{

"topic": "hihttps/read",

"payload1": {"user=123’ or 1=’1": 888},

"payload2": {"id=456”},

 "code": 4200

}

   网络安全专家通常认为:MQTT协议攻击很多是有其特殊的特征,SQL注入如user=123' or 1='1、XSS攻击如user=<script>alert(1);</script>等,这类攻击确实有非常典型的特征。上面payload1认为是一个攻击,那么payload2呢,肯定就无法判断了。

   再进一步,如果物联网服务器上根本没有hihttps这个接口,那就是恶意行为,一定要检测出来并阻断。但传统的方法肯定不行了,那么机器学习将是唯一的办法。

    和图形图像的机器学习相比,物联网安全采集样本的成本是最低的,因为只要把软件在服务器上运行即可采集,甚至读取日志文件,就可以拿到大量的样本,而成本几乎是0。

   但物联网领域黑客攻击样本太稀缺了,根本无法拿完并且日新月异,从这个角度也可以说无监督或者半监督学习,才是未来物联网安全的发展方向。下面举例:

如果从mqtt服务器上hihttps/read 的接口中"payload2": {"id=456”},,采集到的样本参数大于99.9%都是“?id=数字”这种形态,那么可以认为下面的网址都视为攻击:

"payload2": {"id=456 or 1='1”}


[培训]内核驱动高级班,冲击BAT一流互联网大厂工作,每周日13:00-18:00直播授课

收藏
免费 1
支持
分享
最新回复 (1)
雪    币: 2510
能力值: ( LV1,RANK:0 )
在线值:
发帖
回帖
粉丝
2
感谢分享,学习了
2020-2-3 21:26
3
游客
登录 | 注册 方可回帖
返回
//