大数据与人工智能的主要发展趋势
扫描二维码
随时随地手机看文章
技术的进步推动着经济和生活的全面数字化,对数据的重视提到了前所未有的高度,“数据是资产”已经被广泛认可。正如《大数据时代》作者舍恩伯格所说,“虽然数据还没有被列入企业的资产负债表,但这只是一个时间问题”。
在过去几年,我们已经开始通过数据科学、机器学习和人工智能让部分应用场景的数据产生价值。这些技术也逐步从最初的早期采用者(BAT和初创公司)扩展到更广泛的经济。如何存储数据、管理数据并深挖数据的价值已经变成了几乎所有的企业都需要思考的问题。
尽管角度不同,Serverless模式就是这种简化的一种尝试。这种执行模型允许用户编写和部署代码,而无需担心底层基础设施。云提供商处理所有后端服务,客户根据实际使用情况的付费。在过去的几年里,Serverless模式无疑是一个重要的新兴主题,这也是我们在今年的Data&AI领域中增加的新品类。然而,将Serverless模式应用于机器学习和数据科学仍有较多工作要做,像Algorithmia和Iguazio/Nuclio这样的公司是早期进入者。
数据环境日益混合的另一个后果是,企业需要加大努力来获得对数据的控制。目前的数据环境非常复杂,有些位于数据仓库、有些位于数据湖、有些位于各种其他数据源,跨越本地部署、私有云和公共云,那应该如何查找、管理、控制和跟踪数据?这包含各种相关的形式和名称,包括数据查询、数据治理、数据编目和数据沿袭,所有这些都越来越重要和突出。
今年一直在加速发展的最后一个关键趋势,是AI专用基础设施的不断涌现。管理人工智能管道和模型的需求导致了MLOps(或AIOps)领域的快速增长。为了呼应这种新趋势,今年的Landscape里面,我们添加了两个新的框,一个名为基础设施(各种早期创业公司包括Algorithmia、Spell、 Weights&Biases等等),一个名为开放源码(各种各样的项目,通常相当早,包括Pachyderm、Seldon、Snorkel、MLeap等等)。
企业部署ML/AI的阶段已来企业自动化和RPA的兴起在这个阶段,我们可能需要3到4年的时间来尝试为企业构建ML/AI应用。当然已经有过一些远远早于现实的尴尬产品尝试(第一代聊天机器人)和一些重大的营销声明,特别是一些公司试图改造现有产品实现ML/AI。
但是,我们已经逐步进入了ML/AI在企业中的部署阶段,从好奇和实验到实际的生产使用。未来几年的趋势似乎很明显:以一个给定的问题为例,看看ML/AI(通常是深度学习,或其变体)是否会产生影响,如果是的话,构建一个AI应用程序来更有效地解决问题。
自从信息技术出现以来,企业就被信息孤岛所困扰,各种系统和数据分散到各个部门,彼此之间无法沟通(这导致了大规模的系统集成服务行业),而人类充当了两者之间的“粘合剂”。当前数据和系统日益集成、ML/AI有能力逐步将人类从某些功能中移除,企业完全有可能以一种日益自动化、系统化的方式运作。
RPA是机器人过程自动化的简称(尽管可能令人失望的是,它没有利用任何实际的机器人),涉及到通常非常简单的工作流,通常是手工的(由人类执行)和重复的,并由软件替代它们。许多RPA发生在后台办公室功能中(例如,发票处理)。
RPA应该与智能自动化区分开来,智能自动化是以ML/AI为核心的新兴领域。智能自动化也以企业流程和工作流为目标,但是它更以数据为中心,而不是以流程为中心,并且最终能够学习、改进和治愈。智能自动化的一个例子是智能文档处理(ADP),这是一个可以利用ML/AI来理解文档(表单、发票、合同等)的类别,其水平与人类相当或更好。
在未来几年观察这些领域将特别有趣,RPA和智能自动化有可能通过并购或推出新的本土产品进行合并,除非后者的进展如此之快,限制了对前者的需求。