深度学习算法助力 人工智能或将迸发出更强力量
扫描二维码
随时随地手机看文章
驱动了现代人工智能革命的深度学习软件大多都是在标准的计算机硬件上运行的。然而,IBM却采取了一个更不同寻常的方式:他们在测试仿人脑芯片TrueNorth,希望能将其用作深度学习的硬件平台。
深度学习算法助力 人工智能或将迸发出更强力量
深度学习的强大功能依赖于卷积神经网络算法,这个算法由多层节点(也称之为神经元)组成。这种神经网络可以通过“深”层节点筛选海量数据,以此在自动识别人脸或理解不同的语言等方面变得更加智能。谷歌、facebook、亚马逊和微软等公司所提供的网络服务已经在运用这些能力了。
IBM在最近的研究中证明,深度学习算法可以在仿人脑硬件上运行,而后者通常支持的是一种完全不同形式的神经网络。
2016年9月9日,《美国国家科学院院刊》 (Proceedings of the NaTIonal Academy of Sciences)刊登了IBM的研究论文。美国国防高级研究计划局(tDARPA)给该项研究提供了不到100万美金的资助。这笔资助是DARPA皮质处理器项目(CorTIcal Processor Program)的一部分,该项目旨在研究能辨认复杂模式并适应不断变化的环境的仿人脑人工智能系统。
位于加利福尼亚州圣何塞的IBM Almaden研究实验室的仿人脑计算领域首席科学家Dharmendra Modha 表示:“新的里程碑研究清楚地证明,仿人脑计算的效率能是可以与深度学习的效果相融合的,进而为新一代更高效和更有效的芯片和算法的诞生铺平了道路。”
2011年,IBM首次详细描述了TrueNorth,并推出了原型芯片。因此,TrueNorth的诞生早于2012年开始的基于卷积神经网络的深度学习革命,当然也不是为了深度学习而专门设计出的。相反,TrueNorth支持的是脉冲神经网络,后者能更加细致地模仿生物体大脑中神经元的活动。
脉冲神经网络中的神经元不会在每个循环都放电,而是必须在放电之前逐渐积累电压。通常情况下,为在深度学习任务上达到所需的精确度,脉冲神经网络不得不经过多个循环以得到平均结果。这实际上减慢了诸如图像识别或语言处理任务的整体计算速度。
深度学习专家普遍认为脉冲神经网络在深度学习方面的效率较低——至少与卷积神经网络相比是这样的。Facebook人工智能研究所主任、深度学习领域的先驱者Yann LeCun,之前就批评过IBM的TrueNorth芯片,因为其最初就是为脉冲神经网络设计的。
加利福尼亚大学圣地亚哥分校人工智能组的深度学习研究者Zachary Chase Lipton表示,IBM TrueNorth的设计可能更符合神经形态计算的目标,即专注于细致地模仿和理解生物大脑。相比较而言,深度学习研究者对获取人工智能服务和产品的实际结果更感兴趣。他解释了这一差别:“这让我们想到关于鸟类和飞机之间的老套比喻,你可能会说计算机神经科学/神经形态领域更关注研究鸟类,而机器学习领域更关注理解航空动力学(不管是否有生物学的帮助)。通常情况下,深度学习领域看好专业化硬件带来的益处。神经形态芯片所关注的脉冲神经网络在深度学习领域并不热门,所以人们对它们也没有很大的兴趣。”
为使TrueNorth芯片更好地适应深度学习,IBM必须开发一种新算法,让卷积神经网络在神经形态计算硬件上良好地运行。这种联合的方式在8个数据集(包括视觉和语音)上达到了IBM所谓的“几乎是最高水准的”分类准确度。在最好的情况下,准确度在65~97%之间。
当仅使用一个TrueNorth芯片时,它只能在8个数据集中的一个上超越最佳准确率。然而,IBM研究者可以通过使用8个芯片来提升深度学习技术下硬件的准确率。这使得TrueNorth能在其中3个数据集上达到或超越最佳准确度。
TrueNorth在测试中也能做到每秒处理1200~1600视频帧信息,这意味着单独一个TrueNorth芯片可以同时对多达100个照相机拍摄的视频实时进行模式识别。在这种情况下,我们假设每个相机使用1024个彩色像素(32*32)及24帧频的标准电视数据流信息。
Lipton表示,TrueNorth在深度学习领域首次测试所得的这些结果也许令人印象深刻,但是还应该谨慎看待。他指出视觉数据集中的32 x 32像素图像还有些小问题。
尽管如此,IBM的Modha似乎对继续在深度学习应用中测试TrueNorth充满热情。他和他的同事希望在所谓的“不受约束的深度学习”上测试芯片,这意味着在训练神经网络的过程中逐步引入硬件限制,而非在一开始就采用限制措施。
Modha也指出,TrueNorth的总体设计比深度学习专属硬件更具有优势,后者仅在卷积神经网络上运行。而TrueNorth有希望让多种形式的人工智能网络在同样的芯片上运作。
Modha表示:“TrueNorth不仅能够实现卷积网络的功能(尽管这并不是设计它们的初衷),而且还能够支持多样的连接形式(反馈、横向反馈和正向反馈),并能同时执行各种不同的其他算法。”
Lipton说,这样的生物型芯片只有在深度学习上的表现超越其他硬件,才可能变得流行。但是他也建议说IBM可以利用其硬件专长,与谷歌和英特尔合作,共同研发深度学习领域的新型专业芯片。
Lipton表示:“我认为某些神经形态芯片制造商将会利用他们在硬件加速方面的专长,来开发深度学习的应用型芯片,而非仅在进行生物模仿。”