新华社AI合成主播引关注，外媒：你们怕是对AI有什么误解？

时间：2018-11-22 18:51:07

关键字： ai人工智能 ai合成主播

手机看文章

扫描二维码
随时随地手机看文章

[导读]目前，“AI合成主播”已经在新华社正式上岗，已被运用到进博会、世界互联网大会等重要新闻事件，以及突发、科技、社会、文化等各领域的新闻报道。“AI合成主播”视频在新华社中英文客户端、新华社微信公众号、中国新华新闻电视网(CNC)、新华视点微博、新华社中国网事微博、新华社“微悦读”小程序等平台上播发后，引发网友持续关注。

如果有一天，为你播报新闻的不是真人，而是和真人像得不得了的AI合成主播，你觉得怎么样呢?

日前，新华社联合搜狗(Sogou)近日在乌镇举办的第五届世界互联网大会上发布全球首个合成新闻主播——“AI合成主播” ，无论是脸部表情、声线都以AI人工智能合成。看过的人不禁惊呼：“主播们要失业了吗?”

和过去AI人物多以3D立体动画出现的方式不同,该技术采用人脸关键点检测、人脸特征提取、人脸重构、唇语识别、情感迁移等多项尖端技术，并结合语音、图像等多模态信息进行联合建模训练，所生成与真人无异的人工智能分身，和真人主播在某些方面难分轩轾，“看起来不只是一台冷冰冰的机器人”。

其中，中文AI合成主播是按照新华社当家主播邱浩为原型，只见它戴着红领带、穿着条纹西装，在播报时不只有抑扬顿挫，还会搭配点头、眨眼和抬高眉毛等小动作来强调播报内容。

新华社指，此技术可把输入的中文、英文新闻内容，自动生成相关内容的影片，展现出与真人主播无异的信息传达效果。

新华社形容这个AI合成主播是开了“外挂”，因为真人主播每天工作8小时，而这个“分身”却能不知疲倦地工作24小时。这个AI新闻主播可提升电视新闻的制作效率、降低制作成本，也可在报道突发新闻当中快速生成影片，提高报道时效与质量。

但 The Verge 观察表示，目前还不清楚究竟是采用什么技术，但不外乎有机器学习技术。而看来新华社使用人类主播的连续镜头作为基础，然后使用动画制作口腔和脸部表情变成虚拟人偶，再与合成语音结合，新华社可以对数字主播进行编码以阅读新闻，这比使用传统的计算机生成影像要快得多。

引发全球媒体关注

几天来，全球媒体纷纷予以持续关注，路透社、BBC、CNN等数十家海外权威媒体以文字、视频等方式进行了大篇幅报道。

BBC(英国广播公司)、REUTERS(路透社)的报道页面

《参考消息》援引外媒报道称，中国的新闻主播可能面临一些新的竞争——人工智能机器人在播报新闻时可以模仿人的面部表情和举止。

除此之外，《泰晤士报》、福克斯新闻、今日俄罗斯电视台、法兰西24电视台、《新闻周刊》、《洛杉矶时报》、美国国家公共电台等媒体也进行了报道。

路透社报道称，这个AI主播是以中国新闻主播邱浩为原型的，它身穿黑西装打着领带。这是中国旨在提升其在人工智能技术方面能力努力的一部分。

CNN(美国有线电视新闻网)、英国《卫报》的报道页面

英国《媒体》网站则称，新华社的AI主播是一位栩栩如生的数字化播报员，可以通过模仿真人主播的形象和声音朗读文本内容。

在受到赞许的同时，有些媒体认为“AI合成主播”还需要进一步完善。美国《赫芬顿邮报》网站称，新华社似乎知道AI主播是需要不断完善的，正如AI主播在其首次播报中所强调的那样。它说：“作为一名正在研发中的人工智能新闻主播，我知道我需要改进的还有很多。谢谢。”

美国《华盛顿邮报》、美国《赫芬顿邮报》关于“AI合成主播”的相关报道

创新驱动媒体行业发展

目前，“AI合成主播”已经在新华社正式上岗，已被运用到进博会、世界互联网大会等重要新闻事件，以及突发、科技、社会、文化等各领域的新闻报道。“AI合成主播”视频在新华社中英文客户端、新华社微信公众号、中国新华新闻电视网(CNC)、新华视点微博、新华社中国网事微博、新华社“微悦读”小程序等平台上播发后，引发网友持续关注。

尤其是结合新华社客户端“现场新闻”报道，将“AI合成主播”与短视频一体化生产制作，呈现了令人耳目一新的新闻短视频。

民众：有点恐怖，看久了很枯燥

技术的开发者搜狗公司表示，这样的科技还可以因应不同产业的客户需求，为它们量身打造产品。搜狗公司CEO王小川提到，他们可以拿着这一套AI系统去和有声书app“凯叔讲故事”谈合作，“以前是凯叔去讲故事，以后可能就会变成你的爸爸妈妈给你讲故事。在我们大的理念下，主播是其中一块，之后要把它个性化，变成其他的人”。

至于民众对新华社和搜狗推出的AI合成主播买不买单呢?许多网友不约而同都提到有点可怕。

英国牛津大学计算机科学教授伍尔德里吉(Michael Wooldridge)表示，AI合成主播的出现让他想到了著名的“恐怖谷理论”(uncanny valley)。

恐怖谷理论是 1970年，由日本机器人专家森政弘(Masahiro Mori)提出的概念，他指出当机器人或动画的外型跟人类相像到特定程度时，人们在心理上会出现非常不舒服的感受，哪怕它们与人类只有一点点的差别，都会显得非常刺眼。

伍尔德里吉教授说：“要(让我)多看AI合成主播几分钟很困难，它的播报非常平、非常单一，这之中没有节奏、拍子或重点。”

伍尔德里吉教授也提到，主播这个角色在不少人心中算是值得高度信赖的公众人物，“如果你只看合成影像，那么你会完全失去和主播间的连结”。

英国谢菲尔德大学AI和机器人学荣誉教授夏基(Noel Sharkey)则说，中国AI合成主播的出现是很好的尝试，他说：“我们会看着它随着时间进步，问题在它可能非常枯燥。”

外媒专家：你们怕是对AI有什么误解?

MIT Technology Review 的高级编辑 Will Knight 表示，在这个情况下使用“人工智能”做描述有点不实，因为报导员本身并不拥有智慧，而只是利用了某种机器学习来捕捉真正报导员的动作和声音，透过虚拟报导员的影像来表达真人预备的新闻内容。

他认为，如果连报导内容都是由人工智能编写，包括数据搜集甚至打电话进行采访等，则会是相当震撼的技术，不过目前仍然在技术上难以做到。Will 说，人们在使用“人工智能”一词时应该相当谨慎，例如这次报导员并不是人工智能，只是个相当细致的虚拟形像。

伦敦帝国大学的机器及人工智能研究人员 Ali Shafti 也表示，向大众介绍人工智能和机器人技术的时候，要特别小心，因为大众对于这些科技都有一定的恐惧和负面想法，因此正确地解释技术而非夸大其词相当重要。