2018迎来“人工智能之年” 微软口述绘图AI机器人亮瞎眼
扫描二维码
随时随地手机看文章
微软的“口述绘图”AI机器人研究迎来了最新的进展,基于语音转译的文本内容的绘画机器人可以根据你口述创造出图像。
微软相信 2018 会是“人工智能之年”,并且投资了多个 AI 项目,比如几天前发布的一款能够读取和回答问题、准确水平与人类文件相当的 AI,且希望将这类技术用到解密免疫系统上。今天,微软公布了当前正在开发的另一项全新的 AI 技术 —— 你只需口述、它就可以帮你画出相关内容。基于语音转译的文本内容,该“绘画机器人”(drawing bot)可以创作出细节程度相当之高的图像。
与之前考虑过的顶级技术相比,drawing bot 带来了三重改进。有趣的是,即便口述内容中并未提及,画作中仍可包含诸多微小的细节。微软表示,这表明该 AI 已经自带“想象力”。
微软研究院首席研究院兼研究主管何晓东解释到:“当你通过必应搜索鸟类的时候,返回的图像其实是由计算机的一个个像素组成的。这些鸟儿可能不存在于现实世界中,而是计算机帮你想象出来的”。
打造这款 drawing bot,同时涉及计算机视觉和自然语言处理领域的大量研究。作为一项困难的任务,研究人员在图像生成方面倾注了很多的努力。
值得一提的是,该 AI 也是微软“生成对抗网络”(GeneraTIve Adversarial Network)的一个重要组成部分。不过这家科技巨头认为当前的技术还不够完善。
在计算机生成的图像中,仍有肉眼可见的几处小瑕疵,然而这已经算是迈出了人工智能发展道路的重要一步。微软相信,未来该 AI 的改进版本,可以作为一个绘图助手,甚至根据电影剧本而创作动画电影。