了解人工智能在语音方面、图像处理方面及自然语言方面的突破
扫描二维码
随时随地手机看文章
有人说现在是人工智能的春天,有人说是夏天,还有人悲观一点,说是秋天,秋天的意思就是冬天马上就来了。
作为人工智能的学者,我们该怎么看待这件事情,我们能做些什么?不管大家怎么预测,至少今天还是一个人工智能的黄金时代。
为什么这么讲呢?接下来先给大家展示一些最近人工智能取得的成果,确实是之前十几年我们完全想不到的。
1、人工智能在语音方面的突破
小米电视日前推出主打”高性价比”的全球首款人工智能语音电视小米电视4A,只需一个语音按键,便可实现关键词搜索、热度排行、开启应用游戏等10类语音交互功能。无独有偶,长虹近期推出CHiQ人工智能电视新品Q5N和OLED电视新品Q5A系列,主打的功能还是语音控制。
实际上,在市面上海尔、TCL等已经推出了所谓的可进行语音搜索的人工智能电视。小米电视最重磅的功能是支持人工智能语音控制,号称老人孩子都能使用,可以用很自然的语言对电视进行声控。
智能语音正在向着私人助理机器人方向快速发展,在大数据、人工智能、机器学习等技术的支撑下,可为每个人量身定制自己的个性化私人助理。
私人助理会根据用户的行为和使用习惯,帮助用户网上购物、安排出行、调整设备、智能提醒、聊天解闷。
私人助理可以提供越来越多的线下生活服务,如订餐厅、订外卖、购买电影票、医院预约等操作。
2、人工智能在图像处理方面的突破过不了多久,所有人都可以通过人工智能对一张图片或是对视频进行复杂的处理。举个栗子,SmileVector 是一个推特机器人,
可以生成任何明星照片微笑的动图,如果输入一张人脸图片,它可以通过深度学习神经网络生成它们微笑的表情。
虽然这些图片也许并不完美,但它们完全是自动生成的,这是人工智能在图像处理领域的又一进步。
也许不久之后,图片、声音和视频造假都将变得容易。想象一下,假如新版本的 Photoshop 可以像用 Word 编辑文字一样轻松编辑图片,
你还会相信自己的眼睛吗?
Smile Vector 只是新技术的冰山一角,我们很难对现代人工智能多媒体处理技术做出全面的概述,但我们能够找出其中一些有意思的应用。
例如:从一张 2D 图片中创建 3D 面部模型;使用人类“模型”实时改变视频中人物的面部表情;改变图片中的光源和阴影;
为无声视频自动生成声音;在总统选举直播中让特朗普变成秃头;用视频剪辑“复活”朋友等等。这些事例只是其中的一小部分。
3、人工智能在自然语言方面的突破通过互联网搜索引擎,发掘、建立语音信息数据库,利用云计算、大数据、自然语义分析、机器学习和深度神经网络技术进行语音信息聚类处理,
力求得到更准确的答案。在实际生活场景下,用户口语化表述更加多样,容易产生歧义,人机交互难度非常大。
微软在构建Bing和Azure过程中成熟应用了NLP,计算语义学,情感分析,逻辑或者统计机器学习,信号处理,大规模计算,云端存储和响应,
本地硬件加速等技术,所以Cortana实现了更加贴近生活的自然人机交互。Siri基于WolframAlpha,WolframAlpha是一个计算知识引擎,
而不是搜索引擎,用户在搜索框键入需要查询的问题后,该知识引擎将直接向用户返回答案,而不是返回一大堆网页链接。
前面说的这些语音、图像、语言,听起来还都是一些感知方面的东西。大家也知道,最近这段时间,
人工智能在一些传统我们认为可能很难由机器来取得成功的领域也获得了突破。比如腾讯已经在对战中加入人工智能,利用人工智能技术来打游戏。
碰到过的人都知道,这种游戏机器人虽然只能按既定的设置去完成游戏,但是能跟玩家完成简单的配合辅助等基本细节。
也许在我们眼里它只是达到了所谓“菜鸟”玩家的水准,一旦成熟,我相信它会发现一些平时我们自己都玩不出来的窍门。
大家都知道AlphaGo非常火,使用了深度增强学习的技术,经过了非常长的训练时间,引用了大量数据做self-play,
最终是以压倒性的优势,4:1战胜了当时的世界冠军李世石。在去年的IJCAI上面,AlphaGo主要的开发人员做了一个keynote,
说自战胜了李世石之后,AlphaGo并没有停下脚步,因为它是一个self-play的process,可以继续训练,只要给他足够的运算时间和样例,
它就可以不断地去训练。所以也能理解为什么今年年初Master重新回到大家视野里,可以对围棋高手60连胜,因为这个差距太大了。
这些事情都是以前人们觉得人工智能不可以去企及的领域。但正是因为这些计算机科学家、人工智能科学家不断地去模仿人的决策过程,
比如他们训练了value network,训练了policy network,就是怎么样根据现在的棋局去评估胜率,去决定下一步该走什么子,
而不是走简单的穷举,用这些value network来对搜索树进行有效的剪枝,从而在有限的时间内完成一个非常有意义的探索,
所有这些都是人工智能技术取得的本质的进展,让我们看到了一些不一样的结果。