大数据+人工智能下,对网络安全应用的回顾及对未来的展望
扫描二维码
随时随地手机看文章
回顾刚刚过去的2017,我们可能会有一种感觉:周围谈论大数据的声音越来越小。一个佐证是在2017年底举办的"北向论坛"上,现场参会人员投票预测了2018年的热词,在21个候选词中,去年还入选的"大数据"本次没能进入前十,得票只有寥寥数票。
表1 2016和2017"北向论坛"预测的年度热词对比
事实上,这并非"大数据"首次在热词排行榜中淡出大众的视野。早在2015年Gartner发布的新兴技术成熟度曲线中,"大数据"就没有出现在曲线中。而在之前的一年,Gartner对"大数据"的定位还是处于从炒作的顶峰开始下降的区域,二者的对比见图1和图2。对此Gartner给出的解释是,"大数据"的概念已经快速被各个行业接受,成为一项具体的底层技术,因此不再出现在每年的新型技术成熟度曲线中。
图1 2014年Gartner新兴技术成熟度曲线
图2 2015年Gartner新兴技术成熟度曲线
回顾2017,业界谈论大数据的声音虽然在降低,但通过采集、分析和运用数据提升能力的行动却越来越普遍,大数据已经真正成为众多行业的底层关键技术。在国家层面,新一届政治局在2017年底就实施国家大数据战略进行第二次集体学习,习近平总书记强调了通过大数据进行产业创新、打造数字经济、提升国家治理水平、改善民生,以及保障国家数据安全。在企业层面,大数据应用已在电子商务、金融、交通、医疗等领域普遍开展,甚至因数据所有权引发了顺丰快递和菜鸟网络的"丰鸟之争",引起了大众的高度关注。
回到网络安全行业,大数据已成为了安全领域新兴技术的基础。回顾近几年网络安全行业流行的新概念,从威胁情报、UEBA(用户实体行为分析),再到态势感知、人工智能,底层的基础都是大数据。可以说,大数据隐藏在各个具体技术的背后,为用户提供更直接的安全价值。在企业级用户安全建设中,以数据驱动安全,实现持续检测响应的理念,已经被越来越多的用户所接受。
因此,对2017年的"大数据"进行总结,我觉得大数据概念已经不"新",已经越过了概念炒作阶段,并作为一项底层支撑技术,迅速融入到各类更"新"的概念中。大数据已经开始在各个领域发挥实际的价值。
2.人工智能:处于炒作的顶峰与此相对应的是,人工智能像三、四年前的大数据一样,正处于炒作的最顶峰。Gartner于2017年7月发布了本年度新兴技术成熟度曲线,人工智能的两个分支——深度学习和机器学习,均处于曲线的最顶端。
国内对人工智能的发展也非常重视。2017年7月国务院印发了《新一代人工智能发展规划》,提出要推动人工智能与各行业融合创新,推动人工智能规模化应用,全面提升产业发展智能化水平。为了落实该规划,工信部于2017年12月制定了《促进新一代人工智能产业发展三年行动计划(2018-2020)》,提出要抓住历史机遇,突破重点领域,促进人工智能产业发展,提升制造业智能化水平,推动人工智能和实体经济深度融合。
图3 国务院和工信部关于人工智能的发展规划
在上述两个重磅文件中,无论是人工智能技术自身的安全,还是在网络安全领域利用人工智能的前沿技术,都用大量的篇幅进行了阐述。为此在网络安全圈掀起了一股人工智能的浪潮,利用人工智能检测未知恶意代码、实现智能化的安全运维(AIOps),甚至进行无人参与的自动化攻防。网络安全界的小伙伴们纷纷撸起袖子,都想用人工智能搞定目前还没有解决的安全问题。
虽然人工智能很火,但我们也看到在网络安全领域,尚未出现新的基于AI技术的有效解决方案。在网络安全领域其实很早就用到了人工智能技术,比如SOC类产品中的关联分析引擎,就是一个基于规则推理的专家系统,但新的人工智能技术还没有广泛应用的案例。对于最近几年大热的深度学习,我们也看到业界进行了积极的尝试,例如进行恶意文件检测、应用识别、异常行为分析等,但真实效果距离产业界的要求尚有一定差距。此外,深度学习固有的对结果的可解释性不强、鲁棒性不足等缺点,目前也尚未看到有希望的解决方案。
因此,对2017年的"人工智能"进行总结,我觉得当前正处于炒作的巅峰,国家在产业政策上支持的力度也很大。当前颇有人工智能在网络安全的各个分支中遍地开花的局面,这也是新技术发展过程中必不可少的阶段。相信随着时间的推移,那些真正有价值的应用场景会逐渐沉淀出来,人工智能的应用才会从炒作走向成熟。
3.我们对新技术的应用探索作为网络安全领域的领航企业,我们在过去的一年也对大数据安全、人工智能,特别是深度学习技术的应用进行了尝试。在大数据安全领域,主要的应用场景包括大数据平台4A技术、大数据访问控制策略自动化生成技术等;在人工智能领域,主要的应用场景包括利用深度学习算法进行恶意代码检测(检测对象包括PE文件、文档类文件、web访问流量等)、利用深度学习算法进行应用识别、基于本体的安全事件自动化处置及响应技术等。这里面既有成功的案例,也有失败的教训。
在对人工智能新技术的应用探索中,我们由衷地感受到在网络安全领域应用人工智能技术,需要在人工智能算法和安全业务知识两方面都有深厚的沉淀。在算法层面,不能简单地利用各类封装好的软件包、把算法当成即插即用的黑盒子,那样会导致无法理解算法的"上限"而陷入盲目尝试的局面。在安全业务层面,对安全业务的理解有助于将实际安全问题转换为抽象的数学问题,并根据问题的类型指导算法的筛选。
展望2018,我们将结合特定的业务场景,实现大数据分析和人工智能算法在某些特定应用中的落地。在算法层面,人工智能的两大流派,即联结主义和符号主义的算法,都将是我们解决特定问题的有效工具。我们也期待人工智能能够尽快告别炒作,网络安全行业能够从更理性的角度审视人工智能的应用前景,这样才能促进人工智能在网络安全行业的良性发展。