一反过往的保密传统，苹果旗下的人员可以自由投稿自己的AI研究成果

时间：2020-08-15 17:09:01

关键字： AI 苹果

手机看文章

扫描二维码
随时随地手机看文章

[导读] 苹果在月初曾表示，将会公开发表他们的 AI 研究成果。而首份论文也在日前亮相，主题是电脑的“视觉辨识”。这篇名为“Learning from Sim

苹果在月初曾表示，将会公开发表他们的 AI 研究成果。而首份论文也在日前亮相，主题是电脑的“视觉辨识”。

这篇名为“Learning from Simulated and Unsupervised Images through Adversarial Training”的论文，内容阐述了苹果对图片辨识的看法。传统上让电脑“学习”辨识影像，通常会使用电玩照之类的合成图，而不是真实照片，原因是合成图会编上预设的标签，比如“狗”。相比之下，直接看真实影像，电脑就需要先透过人工重新对照片中的物件下标签，再从一片背景里判断出“狗”。这会导致辨识的效率下降很多。

不过这么一来也有个缺点。由于电脑平时“学习”看的图片是合成影像，但事后要拿去辨识的却是真实照片，导致这一类图像辨识的演算法效果都差强人意。因此，苹果的研究员在这篇论文想出的办法，是让合成图更逼近真实。

这个方法首先是先建立两组 AI 神经网络，一组负责资料输入（generator），另一组则是辨识器（discriminator），负责辨识 generator 产制的资料，以及一般“学习用”的图像，最后再让两组 AI 互相对抗，逼生更接近真实的影像。实际上，这样的资料处理方式，就是 GeneraTIve Adversarial Networks（GANs）的基础手法。

有趣的是，这批研究员有的是苹果收购来的新创公司成员，有的则来自大学。例如论文的共同作者 Joss Susskind，就是 EmoTIent 的创办人。它们的技术是透过 AI，从表情辨识人的情绪，但在今年一月时被苹果收购。苹果的研究员亦表示，他们希望接下来可以从图片进展到影片辨识。

这篇论文是由康乃尔大学出版。苹果在日前的宣布中，也开放旗下的研究员或学者，可以自由投稿自己的 AI 研究成果，一反过往的保密传统。

注：由于已经公开发布，短期内应该没有引进商用产品的想法。