我们现在处于AI发展的什么阶段
扫描二维码
随时随地手机看文章
由中国商务部、科技部、工信部、国家发改委、农业农村部、国家知识产权局、中国科学院、中国工程院等国家部委和深圳市人民政府共同举办的“第二十一届中国国际高新技术成果交易会”于2019年11月13日-17日在中国深圳举行。德国哈索-普拉特纳数字工程研究院院长,波茨坦大学数字工程学部主任,德国国家科学工程院院士克里斯托夫·梅内尔出席“改变世界的新兴科技”论坛并演讲。
克里斯托夫·梅内尔表示,人工智能也会有不同的阶段和不同的形式,人工智能不仅仅是我们去定义的,现在有不同的技术,它们都是人工智能的基础,包括机器学习、表示性学习和深度学习。如果我们回溯历史,我们发现我们是第三次人工智能发展大浪潮了。第一次是上世纪50年代,那时候计算机进入到我们的视野。第二次人工智能的浪潮是在上实际九率80年代,当时有很多相应的研究机构都在收集数据,有很多人都会想我们作为人在作决策的时候会有一些原则和法则。不是这样子,我们发现在做决策的时候也没有那么多的原则可以遵守,或者说有的时候法则太多了根本就收集不了。
以下为演讲实录:
女士们、先生们,今天非常高兴来到这里跟大家打一个来自德国的招呼,我是克里斯托夫·梅内尔,是德国哈索-普拉特纳数字工程研究院的院长,我们主要关注互联网安全以及未来的技术,以及在互联网行业的技术应用。一个德国式的比尔盖茨式人物,哈索-普拉特纳 (SAP的创始人和现任主席) 创建了我们这个机构,有很多学生在我们机构学习,也会跟其他的中国大学合作, 比如南京大学等。我们的目标是希望进行数字化转型,能够推动德国的数字化转型。我们知道有很多创新都是来自于我们的机构,今天不细谈这个。当下我们正在进行一个试点性的项目,我们也有网上的慕课课程,它是德国的课程,但是有很多学校都可以使用这个课程。今天我想跟大家谈的是人工智能的现实。
大家都知道人工智能跟机器学习有关,机器是从数据当中学习,它就像人学习一样,我们看到周边的世界然后会从中学习。计算机就可以看、可以听、可以读、可以感受、也可以理解。为什么人工智能是现在出现?我们之前所做的据测都非常重要,比如我们有大数据,有很多的电子大数据,包括声音、图片等。我觉得它非常大地改变了硬件设备,比如有一些储存的设备和记忆设备,它能够分析大数据,能够实时进行分析,包括云计算。现在很多的开发者都在谈计算力,现在互联网上也有的计算力。我们在人工智能方面也有新的发展,就是深度学习和相应的算法,这些都是我们所开发出来的。现在我们先谈一下大数据,为什么我们需要机器学习。
上面有几个数字,比如大家看到有400小时的视频,每分钟会有400小时长的视频传到youtube网络当中,如果用机器学习这种方式的话,每秒就会创造出10GB的数据,每小时会有350亿个物联网设备收集数据。大家现在都使用智能手机,有5亿人在使用手机,我相信阿里巴巴会收集很多数据。为什么我们觉得机器学习非常难做?这些图片人眼看的话比较简单,比如它是黑的还是浅色的,它是泰迪熊还是可爱的狗,我们希望用机器去回答这些问题,这些问题对人类来说有的时候也不容易回答。
人工智能也会有不同的阶段和不同的形式,人工智能不仅仅是我们去定义的,现在有不同的技术,它们都是人工智能的基础,包括机器学习、表示性学习和深度学习。如果我们回溯历史,我们发现我们是第三次人工智能发展大浪潮了。第一次是上世纪50年代,那时候计算机进入到我们的视野,那时候我们就会想如果计算机可以思考的话是不是可以向人类那样做出行为,是不是可以改变我们的世界。第二次人工智能的浪潮是在上实际九率80年代,当时有很多相应的研究机构都在收集数据,那时候有很多人都会想我们作为人在作决策的时候会有一些原则和法则。我们要把写法则给具体起来,把这些法则放到电脑当中,这样的话机损级是不是就可以跟人一样做决策了。但是后来事实并不是这样子,我们发现在做决策的时候也没有那么多的原则可以遵守,或者说有的时候法则太多了根本就收集不了。
第三个阶段是五六年前,当时深度学习非常成功,深度学习我们会发现也是编程的方式,我们会用一个架构,这个架构的运作方式跟我们的大脑非常像,我们有很多的网络,这些小的网络都是相互联系的,这是计算机深度学习的方式。机器跟人的大脑一样,我们需要学习的材料来帮助机器去学习,机器也需要学习,这些都是一些图片的数据集,我们会使用这些图片来训练人工智能或深度计算的算法。我们用图片来训练机器,机器看到这些图片的时候是没有解释的,我们问这个机器图片上是什么,是有人的特征,还是有人的特征,还是说是其他的特征,这些都是机器要解决的。我们发现计算机深度学习网络在识别图片的时候质量也在不断下降,这是它们面临的挑战。
在2015年和2018年的时候有两个领域,一个是深度学习的算法,有时候算法可以超过人脑,另外一个是在图像识别方面。左边是曲线,也就是算法准确度的曲线,还有人的识别准确度的曲线,我们发现机器的准确率已经远超过人类,在其他领域,深度学习运作非常好的就是语音的识别。所以所有的机器人翻译都是基于语音的识别,有时候我们会发现机器出来的结果要比人更好。这是人脑,大家知道人脑会有不同的分区,不同的分区会负责不同的活动,在这边主要是负责识别曲线,之后信息会去到大脑不同的区域,这些曲线会集合起来,包括它们会形成鼻子或者形成嘴,之后这个信息又到了大脑的另一个区域,在这个区域当中,我们又把鼻子加上去,加到脸上,机器才能识别别人的脸。这就是我们最大程度的认知,它可能想起昨天的所见所闻。
我们的AI也是卷积式的认识网络,在某一个神经节点代表着不同的算力,或者是加法、乘法,就是信息对加减乘除的处理,在卷积后面有一个结果能够解释这个形象人脑会给它加一个字幕在下面,就是对它进行描述和画像,去了解它在这个网络里面有什么样的指证。第一级别是看到颜色,第二级别是看到不同的内容,就是基于颜色有更高级别的认知,更上一级能够看到有不同的物体,最后你就能够对它有一个总体的画像和认知,到了最高级别你就知道它是什么,就是对它有一个抽象,在你的脑袋里面有一个抽象的萃取,这就是我们对卷积层级网络的回顾。
基于我们对它的架构分析,基于卷积网络,能够更好地萃取不同层级的信息产出一个结果,用更加精准的方法达到产出的结果。这里我给大家举一个例子,汽车是怎样在街上进行行驶证、进行判定。这里面我给大家展示一个原理图,在右上脚,这是一个卷积网络,在这里面它得到了微调,会微调来集合它的学习目标,能够基于不同的节点建立起来。在这里面看到信息不问上升或信号不断衰减,或者信号不断增强,这个网络也会进行调整,进行流量的处理,这都是基于不同神经节点的联系。可以看到这里面汽车启动了,如果它不能捕捉这个线路的话就会发生碰撞。当这个汽车可以自主学习的时候,网络可以被训练,汽车的自动驾驶系统可以被训练,能够让汽车知道怎么做下一步的决策,不会发生碰撞。
因此需要一系列的学习成果的生成才能进行这个系统的训练,这个车的系统得到训练之后,才可以进行下一步碰撞的测试。每一次尝试无论是成功还是失败,这个网络都会重新得到构建,参数不断变化,因为周围的环境不断变化。这就是通过变化的环境不断收取变化的信号,无论是增强还是衰减。对于这些颜色的认知,颜色是加深了,就是对它进行算法的处理,哪些信息是有用的,哪些是可以过滤的。可以看到最后经过训练之后,这个汽车越来越聪明,越来越知道怎么样识别网络里面需要它注意的东西。就像我刚才讲到的,这已经是14次迭代,经过14次卷积网络的迭代之后,汽车就知道了怎样应对这个路况。这很好地说明了深度学习架构可以怎么样被训练。这里描述了这个训练的过程,没有撞对不对。这个汽车一往无前地沿着个路径行驶,可以看到这个绿色的车自控性非常好、非常简单,能够通过多轮的需要和训练,经过不同的计算网络的运力和卷积网络适应更加复杂的架构和网络。
我们在开发这一系列人工智能应用的时候,我们会考虑不同的框架,包括非常著名的在大学里面进行产学研结合研发出来的框架,能够基于这些框架进行自身的应用程序的研发,使用卷积网络架构来做到这一点。这一系列的AI可以应用到哪些领域呢?我们是否已经蓄势待发把它用在一些具体的场景里面。我刚才讲到了语音识别,包括在社交媒体零售里面的聊天机器人。
我跟大家分享一个故事,就是有一些人会打客服中心,可以看到客服中心的人越来越礼貌、越来越耐心,如果你通过电话拨入,它们会非常耐心,为什么这些客服会这么耐心礼貌?因为它们是客服机器人,而不是真正由人类来做。包括AI也可以应用在自动驾驶之上,这是我们的机构所研究的动向,我们进行了语义识别,使用大规模的网上课程,包吸引了450万名线上的学习者。我们希望能够把这些语义和文本,也就是老师的讲课能够进行自然语言的识别进行字母的翻译,能够吸引不同国家的学习者。所以有图像、有文本,我们可以使用这些自然语言识别来翻译帮助线上的学习者学习,让他们能够自动地了解这些文本的含义,这对于AI的应用来说是非常重要的进步。
我们已经很好地把AI和深度学习结合在一起。另外就是医疗影像社别,一般人看不懂医学影像,但是机损级可以帮助我们了解和阐释这些医学影像会带来什么结果或病症。这就是基于卷积网络、层级网络能够帮助我们做到的事情。这些使用AI来做,帮助我们节省能源,可以训练机器,而不是训练人。所以我们如果没有很好地进行训练,就不能大规模展开,所以我们需要找到更好的方法进行人工智能深度学习的网络更好地对结果产出有一个精准的预测。
能够基于我们有限的资源去做。我们觉得二元网络可以帮助我们做到这点,我们发明了多媒体自动化分析,可以使用在很多领域,包括医疗健康领域,对医学影像进行分析,对于CT/PTE扫描以及超声波仪器进行报告和分析,这样就能帮助主治医生进行判断。这是脑肿瘤的识别,能够识别里面的病灶。我们通过机器学习和人工智能的识别更好地进行判定,而不需要过于人工的干预,能够让个机器罗列人的病症和原因,作为辅佐人类的手段。另外是在心脏疾病的应用,中国在这方面的研究已经非常领先了,把二元神经网络用在实际的应用场景。尤其是在能源领域的应用使得温室气体排放,使得全球气候变暖,所以我们在机器运转的时候要注重生态友好。德国有一句话是绿色IT,我们要评估这些机器不是说它们的功劳有多大,而是能耗是不是非常友好的机器或仪器。
我们设计了一系列的网络,这个网络并不是我们之前讲到的现在的深度学习网络所拥有的,但它是基于深度学习的网络迭代而来的。我们刚才讲到的二元神经网络,包括数学逻辑的分析,还有其他非常复杂的一套生态系统,也有其他多重的应用。
最后我想总结一下,在哈索-普拉特纳数字工程研究院,我们可以记住我们这个研究院的名字,我们学院一直希望能够更好地收集数据进行研究。AI也能够应用在艺术另面,这是我们的办公楼,你能够看到这是研究所主要的楼宇,但是我们希望以油画的滤镜效果来呈现,这是梵高的星空图,如果我们把这个星空图结合到我们实际的大楼里面,就有了以下的效果。其实并不是那么容易,就像换一个滤镜一样,我们只要训练了这个网络,并且有很好的输入,输入原来的艺术作品,同时输入梵高的艺术作品的参数,结合这两个照片,网络会自动学习这个艺术照片和这个照片之间会有什么样的联系,可以看到可以应用到其他照片的再创造里面。谢谢大家的聆听。