当前位置:首页 > 通信技术 > 通信网络
[导读] 日前,《麻省理工科技评论》刊文评出了2018年十大突破性技术,“对抗性神经网络”(GAN)赫然在列。 什么是对抗性神经网络?为什么它能入选MIT十大突破性技术?它

日前,《麻省理工科技评论》刊文评出了2018年十大突破性技术,“对抗性神经网络”(GAN)赫然在列。

什么是对抗性神经网络?为什么它能入选MIT十大突破性技术?它的发展脉络如何?与我们此前耳熟能详的神经网络有什么区别?能够应用在人工智能的哪些场景?还有哪些关键问题有待攻克?

对抗性神经网络凭啥入选MIT2018十大突破性技术

中国自动化学会混合智能专委会副主任、中国人工智能学会机器学习专委会常委、复旦大学博士生导师张军平教授在接受科记者采访时做了深入浅出的解释。

故事中的GAN幻影

张军平告诉记者,虽然GAN是科技领域的“新贵”,但其实在很久以前的中外小说中就能看到这个想法的影子。

这个想法最早可以追溯到奥地利小说家斯蒂芬·茨威格写于1941年的小说《象棋的故事》。

在该小说中,主人公B博士被长期囚禁在纳粹集中营中。在想尽了各种摆脱空虚和孤独的办法却徒劳无功后,B博士意外得到了一本国际象棋棋谱。

他背完书里的上千棋谱后,用送来的面包做了副国际象棋,开始自己跟自己下棋,最终演变成一盘接一盘的相互疯狂挑战,这令他棋力大涨。出狱后,在一艘游艇上,他居然轻松地在首盘就击败当时的世界冠军。

在中文小说里也有类似的影子,它出现在金庸写于1957年的武侠小说《射雕英雄传》中。

王重阳的师弟周伯通被东邪“黄药师”困在桃花岛的地洞里。为了打发时间,周伯通就用左手与右手打架,自娱自乐。其武功决窍在于要先“左手画圆、右手画方”,分心二用,保证可以同时使出两种武功,从而使得武力倍增。

这两部小说主人公功力大增的关键都是“自己跟自己决斗,试图倾尽全力击败对方”,而结果都是练成后,去跟高手过招时能轻松秒杀对手。用一句俗话来解释,叫“双拳难敌四手”。

让机器学会“左右互搏”

GAN网络的原理本质上就是这两篇小说中主人公练功的人工智能或机器学习版本。

一个网络中有两个角色,修炼的过程中左手扮演攻方,即生成器(generator),试图生成和自然世界中拟完成任务足够相似的目标;右手扮演守方,即判别器(discriminator),试图把这个假的、生成的目标和真实目标区分开来。经过反复多次双手互搏,左手右手的功力都会倍增,从而达到“舍我其谁”的目标。

明白这个道理,就不难明白为什么GAN网络一出,就有独孤求败的感觉了。

正是因为GAN网络的机理是“双手互搏、一心两用”,所以,虽然最初的应用场景是针对图像相关任务,但其机理是普适性的。只要能用这个“诀窍”的地方,都能把自己的功力提升一个档次。不过,需要注意的是,GAN只把双手互搏用来训练自己“双手”的功力。在多数实际应用中,它只用了自己千锤百炼出来的生成器,就得到了非常好的结果。

于是,自2014年GAN网络被Ian J. Goodfellow等人提出,至今其演绎出的各种版本就像攻城掠地般在各个领域蔓延。

在今年的人工智能顶级会议IJCAI、机器学习顶级会议ICML和NIPS、深度学习著名会议ICLR上,光读参会论文的标题,就能发现大量GAN网络的工作痕迹。图像处理、计算机视觉、自然语言处理、语音识别、智能驾驶、安全监控……似乎GAN已经无所不能了。

张军平用几个比较火的人工智能应用场景举例——

在年龄估计中,GAN能通过攻守互搏,基于给定的人脸图像实现对其人衰老或年轻时的样貌生成。

在多视角人脸识别、跨视角步态识别领域,采用类似的机理,实现对人脸角度和步态角度的自动旋转,从而有效提高了多视角、跨视角人脸和步态识别的精度。

在自动驾驶领域,需要对智能汽车进行复杂环境下的虚拟训练。此时,就可以利用GAN来实现与实际交通场景分布一致的图像生成。具体来说,可以先给GAN输入一张随机噪声图像,通过其生成器来最小化与真实场景接近的图像,同时判别器最大化生成场景与真实场景间的差异。经过反复迭代的攻守博弈,从而获得与真实环境一致的交通场景。

“不光在应用领域上有了突破,互搏的方式也有了不少变化。既然可以双手互搏,那当然可以三手甚至更多手的互搏,也可以组团逐对互搏、成串互搏,诸如此类。还可以把圆和方换成其他东西或者所谓的函数或结构来互搏。但万变不离其宗,内在的机理是不变的。”张军平补充道。

GAN有什么“软肋”

“毫无疑问,这种可倍增‘功力’的技术入选MIT年度十大突破性技术是当之无愧的。但值得注意的是,这一技术仍然有较大需要改善的空间。”作为《IEEE Intelligent System》(智能系统)和《IEEE TransacTIons on Intelligent TransportaTIon Systems 》(智能交通系统)等著名期刊的编委,张军平对GAN的“软肋”了如指掌——

首先,对抗不好是容易出问题的。比如那位B博士。国棋象棋的世界冠军在觉察到他的强烈焦躁与急切情绪后,就有意识地放慢下棋速度。结果诱发了B博士的精神分裂,使得他再次陷入狂乱的自我对弈之中,最终才幡然醒悟而告别了棋局。对抗网也是如此,稳定性一直是其存在的问题之一。尽管理论上Wasserstein GAN (WGAN)可以部分解决其收敛性问题,但实际的效果还没有达到尽人意的地步。

其次,枪打出头鸟,既然这项技术这么牛了,过来挑战的也不少。据不完全报告,似乎已经有十五波“武林高手”对GAN网络的抗击打能力进行了挑战。极端情况,在图像中加一个像素就可能使GAN网络产生误判。

第三,GAN网络也是深度网络的一种,在可解释性这条路上,仍然没有找到非常明确的方向。

最后,双手互搏的基础还是手。而这一基础的结构并没有从近几十年来人工智能发展的框架中脱离出来。

因此,张军平提醒,期望以GAN之奇技,从弱人工智能冲击“能真正推理和解决问题,且有知觉、有自主意识的”的强人工智能还遥遥无期。

本站声明: 本文章由作者或相关机构授权发布,目的在于传递更多信息,并不代表本站赞同其观点,本站亦不保证或承诺内容真实性等。需要转载请联系该专栏作者,如若文章内容侵犯您的权益,请及时联系本站删除。
换一批
延伸阅读

9月2日消息,不造车的华为或将催生出更大的独角兽公司,随着阿维塔和赛力斯的入局,华为引望愈发显得引人瞩目。

关键字: 阿维塔 塞力斯 华为

加利福尼亚州圣克拉拉县2024年8月30日 /美通社/ -- 数字化转型技术解决方案公司Trianz今天宣布,该公司与Amazon Web Services (AWS)签订了...

关键字: AWS AN BSP 数字化

伦敦2024年8月29日 /美通社/ -- 英国汽车技术公司SODA.Auto推出其旗舰产品SODA V,这是全球首款涵盖汽车工程师从创意到认证的所有需求的工具,可用于创建软件定义汽车。 SODA V工具的开发耗时1.5...

关键字: 汽车 人工智能 智能驱动 BSP

北京2024年8月28日 /美通社/ -- 越来越多用户希望企业业务能7×24不间断运行,同时企业却面临越来越多业务中断的风险,如企业系统复杂性的增加,频繁的功能更新和发布等。如何确保业务连续性,提升韧性,成...

关键字: 亚马逊 解密 控制平面 BSP

8月30日消息,据媒体报道,腾讯和网易近期正在缩减他们对日本游戏市场的投资。

关键字: 腾讯 编码器 CPU

8月28日消息,今天上午,2024中国国际大数据产业博览会开幕式在贵阳举行,华为董事、质量流程IT总裁陶景文发表了演讲。

关键字: 华为 12nm EDA 半导体

8月28日消息,在2024中国国际大数据产业博览会上,华为常务董事、华为云CEO张平安发表演讲称,数字世界的话语权最终是由生态的繁荣决定的。

关键字: 华为 12nm 手机 卫星通信

要点: 有效应对环境变化,经营业绩稳中有升 落实提质增效举措,毛利润率延续升势 战略布局成效显著,战新业务引领增长 以科技创新为引领,提升企业核心竞争力 坚持高质量发展策略,塑强核心竞争优势...

关键字: 通信 BSP 电信运营商 数字经济

北京2024年8月27日 /美通社/ -- 8月21日,由中央广播电视总台与中国电影电视技术学会联合牵头组建的NVI技术创新联盟在BIRTV2024超高清全产业链发展研讨会上宣布正式成立。 活动现场 NVI技术创新联...

关键字: VI 传输协议 音频 BSP

北京2024年8月27日 /美通社/ -- 在8月23日举办的2024年长三角生态绿色一体化发展示范区联合招商会上,软通动力信息技术(集团)股份有限公司(以下简称"软通动力")与长三角投资(上海)有限...

关键字: BSP 信息技术
关闭
关闭