人工智能技术发展的方向:ML和DL
扫描二维码
随时随地手机看文章
人工智能(ArTIficial Intelligence),英文缩写为AI。AI是一门让机器变得智能的科学研究,让机器像人类一样具备解决某些特定问题的能力。其实,AI可不是什么新事物,早在上世纪中叶就已经诞生了。1950年,一位名叫马文﹒明斯基的大四学生和同学一起建造了世界上第一台神经网络计算机,被看作是人工智能的起点。马文后来也被人称为“人工智能之父”,从那时到现在已经过了近70年。这些年AI技术一直不温不火,偶尔出现一些吸引人的技术,很快就消失殆尽了。直到最近,AI又重新回到人们的视线里,而且获得了几乎所有互联网大佬的青睐,将AI看作是未来技术发展的方向,并投入大量人力和资金去研究它。
AI之所以到现在才火爆起来是有原因的。早在70年前,计算机技术刚出现,计算能力和传感器技术都不发达,AI的理念虽然先进,却无实施的条件。众所周知,让机器具备学习的能力,要进行大量的学习计算,通过对已掌握的数据计算规律,从而知晓下一步该如何处理。甄别和计算数据的能力在70年前都不具备,所以AI技术的研究总是被搁浅。而现在则不同,云计算、虚拟化和大数据技术的出现,对数据的分析能力已经很强,再加上计算能力的提升,海量数据的计算数秒内就能完成,这给AI提供了良好的成长土壤,所以到了现在,AI不火都不行了。
AI只是一门技术的概念,最终还是要靠各种具体技术来实现,机器学习(Machine Learning)就是其中之一。ML使用算法分析数据,从中学习并做出推断或预测。ML使用大量数据和算法来“训练”机器,由此让机器学会如何去完成任务。比如在图像识别中,一开始机器在识别事物的时候准确率是比较差的,机器的表现带有很大随机性,但是经过一段时间训练,随着我们给机器看的图像越来越多,机器的图像识别准确性会逐步提高。当学习的图片积累到一定数量的时候,我们可以对于某一种动物拍一张照片,这张照片是以前机器学习没有看到的,但当我们显示这张照片,机器可以根据以往的经验准确地识别出这是哪一种动物。ML背后的核心思想是,设计程序使得它可以在执行的时候提升它在某任务上的能力,而不是有着固定行为的程序。ML包括多种问题定义,提供很多不同算法,能解决不同领域的各种问题,ML利用数据来解决简单规则不能或者难以解决的问题,被广泛应用在了搜索引擎、无人驾驶、机器翻译、医疗诊断、垃圾邮件过滤、玩游戏、人脸识别、数据匹配、信用评级和给图片加滤镜等任务中。
深度学习(Deep Learning)是一种实现ML的技术,是当前AI技术中非常火的话题,由Hinton等人于2006年提出,基于深度置信网络提出非监督贪心逐层训练算法。DL也称为深度结构学习,层次学习或者深度机器学习,是一类算法集合。DL利用多层神经网络结构,从大数据中学习现实世界中各类事物能直接用于计算机计算的表示形式,被认为是智能机器可能的“大脑结构”。DL本身是神经网络算法的衍生,在图像,语音等富媒体的分类和识别上取得了非常好的效果,所以各大研究机构和公司都投入了大量人力来做相关研究和开发。DL重点在于如何快速地训练模型。通过DL,机器可以处理大量数据,识别复杂的模式,并提出深入的见解。DL有几个有名的技术框架:tensorflow 谷歌、CNTK 微软、Theano、caffe Berkeley、scikit-learn Python,AlphaGo就是使用了TensorFlow的杰出作品,AlphaGo 完虐李世乭,直接将DL带火了。我们日常的一些推送新闻购物等,都有DL的影子。之所以DL能火,最为主要的原因是准确性,DL模式可以达到前所未有的精确度,有时甚至超过人类表现,让人类都感觉到可怕,未来人类会不会被DL所创造的机器人打败并消灭掉。如果是那样,人类真的是搬起石头砸自己的脚。其实,这种想法的人实属多虑了,DL的学习能力的确可能超过人类大脑,但所有的学习能力都是人类赋予的,自然有控制的方法。
ML和DL都是AI的具体技术实现形式,但两者区别明显。DL是ML的技术之一,ML包含DL,但DL的技术更优于ML,ML更是一种通用型的技术,包括决策树、贝叶斯、支持向量机等算法,也包括神经网络算法。而DL深耕神经网络,是深度神经网络算法技术,包括深度卷积网络、深度循环网络、递归网络等。ML和DL都提供了训练模型和分类数据方法,但ML需要手动选择图像的相关特征,以训练机器学习模型,DL可以从图像中自动提取相关功能,是一种端到端的学习,网络被赋予原始数据和分类等任务并自动完成;如果没有高性能GPU和标记数据,那么ML和DL更具优势。这是因为DL通常比较复杂,就图像而言可能需要几千张图才能获得可靠的结果。高性能的GPU才能够实现快速计算,在建模上花更少时间来分析所有图像,DL计算量更大;ML由手工设计特征决定学习效果,但是特征工程非常繁琐,而DL能够从大数据中自动学习特征;当解决问题时,ML会将问题分解为多个子问题并逐个子问题解决,最后结合所有子问题的结果获得最终结果,DL提倡直接的端到端解决问题。ML比较擅长分析维度较低,可解释性很强的任务。DL擅长分析高维度的数据。比如图像、语音等,两者应用的领域会有差别。
ML和DL是AI领域最先进的技术,尤其是DL,代表了当今AI技术发展的方向,将有越来越多的产品采用DL技术,不过两者应用的领域不同,对于数据量较少,计算能力不高的领域,ML依然可以继续发挥技术优势,两种技术将长期同时存在着。