人工智能的下一个前沿在哪里
扫描二维码
随时随地手机看文章
【导读】在人类的早期,当我们迈入数学和数量的世界时,我们知道一个苹果加一个苹果等于两个苹果。我们开始学习实物计数,直到后来才引入了零的概念,或者不妨说空盒子里的苹果数。
在印度阿拉伯学者和意大利数学家斐波那契之后,“零”的概念彻底改变了数学界,将其引入了我们的现代编号系统,今天我们可以自由自在地在数学运算中使用“零”。但对人工智能而言,“零”或“无”仍然是一个尚未涉足的领域,
从某种意义上说,人工智能和深度学习仍然需要通过“零”或“无”学习识别和推理。
这是一个苹果还是香蕉?都不是!
(图源:Richard Drury/Getty Images)
传统上,深度学习算法(例如深度神经网络 DNN)以有监督的方式进行训练,以识别特定类别的事物。
在一个典型的任务中,可能会训练 DNN 以可视化的方式识别一定数量的类,例如苹果和香蕉的图片。深度学习算法在获得大量数据和质量的数据时,实际上非常擅长进行精确、低错误率和可信的分类。
当第三个未知对象出现时,DNN 识别就会出现问题。如果引入了训练集中不存在的未知对象(例如橙色),DNN 网络将被迫“猜测”并将橙色分类为捕获未知对象的最接近类别——一个苹果!
基本上,用苹果和香蕉训练的 DNN 的世界完全由苹果和香蕉组成。它想不到水果篮里还有其他的水果。
进入“零”的世界
尽管我们尚不清楚“无”或“零”是否在所有应用中都能发挥作用,但是在训练和部署 DNN 时,“无”或“零”的想法在许多方面都非常有用。
在训练过程中,如果 DNN 能够将项目分类为“苹果”,“香蕉”或“什么都没有”,则算法的开发人员可以确定是否还有尚未有效学习识别的类别。就是说,如果水果图片继续反馈“零”,那么开发人员可能需要添加另一类“水果”来进行识别,例如橘子。
但到目前为止,还没有一个简单的方法来训练 DNN 产生“无”的回应,能发出信号通知开发者它看到了偏离常规的东西。
同时,在部署场景中,经过训练的 DNN 如果识别出与已经学会的原型水果苹果和香蕉有偏差的东西,则会回答“无”。从这个意义上讲,DNN 可以被当做一个异常检测网络——除了对苹果和香蕉进行分类之外,它还可以不经进一步更改就发出信号,通知它看到偏离规范的东西。
然而,现在还没有简单的方法来训练可以具备上述功能的标准 DNN。
一种被称为“ Lifelong DNN ”的新方法自然会将“无”的概念纳入其体系中。“ Lifelong DNN 巧妙地利用反馈机制,通过过去学习到的知识来确定输入是否匹配。
2017 年,AI 创业公司 Neurala 宣布在深度学习软件方面取得重大进展,其 Lifelong DNN 软件能够能够在边缘学习增量对象(incremental object)。在此之前,如果一个 AI 系统学会了一定数量的对象,并且需要再学习一次,那么它必须针对所有对象再训练一次。这种传统方法需要利用强大的服务器,通常是云上的服务器。
Neurala 的 Lifelong DNN“既能在运行中学习,也能在边缘学习的能力意味着 Neurala 的新方法可以直接在设备上学习,从而不会有云上学习的所有缺点。此外,它消除了网络延迟,提高了实时性能,并在需要时确保隐私。最重要的是,它将促进一系列无云应用(cloud-less applications)的开发,”本文作者,同时是 Neurala CEO Max Versace 说道。当时,吴恩达也评价了从云到“边缘”转化的技术,认为这会加速消费级 IoT,带来新的赢家。
Lifelong DNN 的机制和人类的学习方式类似:我们在潜意识中不断检查我们的预测是否符合现实世界。例如,如果有人跟你开玩笑调整了你办公椅的高度,你马上就能意识到。那是因为随着时间的推移,你学习到了办公椅高度的“模型”——一旦模型有变,你会立即意识到异常。人类不断检查我们的分类是否符合实际情况。如果没有,我们的大脑就会注意到并发出警报。对人来来说,我们不仅可以认识苹果、香蕉和苹果,还可以推理“我还以为是苹果,但实际上不是。”
Lifelong DNN 会在运行中学会这种机制,因此,如果学到的模型有变,它会输出“无”。
应用前景
在以苹果和香蕉为例对“无”有了基本了解之后,现在让我们考虑一下除了水果识别之外,它在实际应用中应该如何发挥作用。
比如制造业,机器负责生产大量产品。对传统的计算机视觉系统进行训练以识别产品中各种各样的异常(例如表面划痕)非常具有挑战性。在运作良好的生产线上,没有多少“坏”产品的样例,“坏”可以有无数种形式。很简单,根本没有大量可用于训练系统的不良产品数据。
但是,借助 Lifelong DNN,开发人员可以训练计算机视觉系统来识别“好”产品的不同示例。然后,当系统检测到与商品定义不符的商品时,可以将该商品归类为异常,然后进行适当处理。
对于制造商而言, Lifelong DNN 和发现异常的能力可以节省时间并提高生产线的效率。对于无数其他越来越依赖人工智能的行业来说,可能会有类似的好处。
谁知道“无”竟然有这样的重要性呢?
Neurala 是一家美国软件公司,所开发的深度学习软件 Neurala Brain 可以让机器人、无人机、移动设备和相机更加智能,同时也为高端设备和日常应用场景提供定制化的解决方案。Neurala 可以让普通相机也能学习人物和目标,并实现视频和视频流中的识别和运动追踪功能。基于 Neurala Brain 为 NASA、DARPA 和美国空军所开发的技术,它已成功部署在超过一百万台智能设备中。