摘要
机器学习算法使许多决策系统执行更快、更准确、更高效。然而相比其她领域,机器学习在网络安全中的应用面临更多的主动对抗动机的威胁。因为机器学习在网络安全中的应用(如恶意软件检测、入侵检测和垃圾邮件过滤)本身就是对抗性的。这可以被视为攻击者和防御者之间的一场军备竞赛,对手不断探测机器学习系统,并将其输入设计为可绕过系统,诱导系统做出错误预测的样本。在本项调查中,我们首先将机器学习从技术、任务和深度角度分类。然后介绍了机器学习在网络安全应用中的类别。接下来我们研究了网络安全中针对机器学习的各种对抗性攻击,并介绍了网络安全中对抗性攻击的两种分类方法。首先,我们根据网络安全应用的分类对网络安全中的对抗攻击进行划分。其次,我们将网络安全中的对抗攻击从问题空间与特征空间两个维度进行划分。然后我们分析了针对基于机器学习的网络安全应用程序上的对抗攻击的各种防御方案。最后,我们总结了一个对抗风险网格图,使用此图评估了几种针对应用于网络安全的机器学习的对抗攻击。我们还确定了每个攻击分类在网格图中的位置。
简介
设计者在设计机器学习算法时更注重准确率和效率,这些模型的安全性和鲁棒性往往遭到忽视。研究证明对抗样本可以轻易欺骗机器学习系统。对抗样本是一种特制的输入,它可以导致机器学习模型对输入进行错误的分类。机器学习系统通常在两个阶段接收数据,分别是在训练阶段输入的训练数据和在预测阶段输入的测试数据。将网络安全领域的对抗攻击进行问题空间和特征空间两个维度的划分。基于机器学习任务和技术的判别自主性与指令自主性来评估网络安全中对抗攻击的风险。