李飞飞的新研究，将让“给AI打工的人”再一次失业

时间：2020-06-13 20:57:01

关键字： AI 李飞飞

手机看文章

扫描二维码
随时随地手机看文章

[导读] 你可能听说过，在河南的农村里，在非洲的城市中，每一个你想象不到的地方，有着大量的数据标注员。他们手动在图片里把每一只花瓶和每一辆汽车框出来，并且标上“花瓶”和“汽车”。一段时间后，这些

你可能听说过，在河南的农村里，在非洲的城市中，每一个你想象不到的地方，有着大量的数据标注员。

他们手动在图片里把每一只花瓶和每一辆汽车框出来，并且标上“花瓶”和“汽车”。一段时间后，这些人把成千上万张标记好的图片打包，发送给远在北京、上海甚至旧金山的AI公司。

GQ将这些人称为《那些给人工智能打工的人》。

图片来自G

人工智能发展迅速，大大小小的互联网科技公司相继开展研究，投入商用。然而训练一个可用的AI，需要大量准确标记好的图片、视频等资料。

正因为此，市场对数据标注的需求如此之大，吸引“那些给AI打工的人”争相加入，其中不乏原来找不到工作的闲散人员——毕竟这份工作只需要动动鼠标，用不上太多知识。

但是，恐怕不久后，这些人就将再次失业。

上周，来自约翰·霍普金斯大学、斯坦福大学和Google的专家联合发布了一篇论文，介绍了他们使用神经网络来自动搜索神经网络，将其投入图像分割方面的研究，并且取得的重要进展：

研究人员采用神经架构搜索(NeuralArchitectureSeartch,NAS)技术设计了一个神经架构(A)，放任它去自动搜索/设计出新的神经架构(B)，投入到图像语义分割(semanticimagesegmentaTIon)的任务中。

研究人员发现，这个被自动搜索出来的神经架构B，在主流的小规模图像数据集上，未经训练就直接使用，表现已经超过了现有人类设计的、预先训练好的模型。

用人话来说：

以往人们一直相信，设计AI需要大量知识和经验，简而言之就是需要人来设计。

但现在，AI设计出的AI，已经比人设计出的AI更强。

论文的名字叫做《Auto-DeepLab:HierarchicalNeuralArchitectureSearchforSemanTIcImageSegmentaTIon》[2]。

研究人员将这个能够自动搜索（设计）神经架构的技术命名为Auto-DeepLab。这个名字来自于DeepLab，Google人工开发的图像语义分割技术。前面加上Auto，意思是在DeepLab的基础上，新的技术可以实现了很大程度的自动化。

论文署名作者当中，两人来自约翰·霍普金斯大学，其中第一作者是ChenxiLiu，曾在Google实习；有四人来自Google；剩下的一人来自斯坦福大学，正是原GoogleCloud首席科学家，在计算机视觉学术和业界知名的李飞飞教授。

“本着AutoML（编者注：Google主导的AI计划，将算法选择，模型的超参数调整，迭代建模和模型评估等工作自动化。）和人工智能普及化的精神，对于不依赖专家经验知识，自动设计神经网络架构，人们的兴趣有了显著提升。”论文作者提到。

在“AI自动设计AI”这件事上，Auto-DeepLab有几个比较重要的新尝试。

首先，神经架构搜索NAS技术是AI领域的新兴物种，主要用于简单的图片分类。而在这篇论文里，研究者首次尝试将NAS投入到高密度的图片预测任务上（也就是对更复杂的高分辨率图片进行语义分割，比如Cityscapes城市街景数据集、PASCALVOC2012和ADE20K等数据集）。

其次，在计算机视觉领域内的神经网络架构，通常分为内层、外层的两级架构，自动化的神经架构设计往往只能设计内层，外层仍需要人来设计和手调。而Auto-DeepLab是第一个让AI掌握外层设计和调参能力，并在图像语义分割任务上得到优异结果的尝试。

“图像语义分割”六个字听上去有点拗口，其实很好理解：对于一张图划分几个类别，然后将所有的像素点归类。

比如下面这张图，可以简单分为三类。图像语义分割的任务，就是判断每一个像素点属于人、自行车，还是背景。

图片来自Jeremy Jordan :Anover view of semanTIc image segmentation

需要明确的是，图像语义分割的任务纯粹是判断像素点属于哪个类别，它不能识别和区分独立的物体。

不过图像语义分割仍然有很重要的意义，比如在它可以用于手机拍照的“人像模式”。采用更优秀的图像语义分割技术，手机能够在更高精度的照片里确认每一个像素点，属于人，亦或是背景。

目前Google、小米等公司都在手机拍照上使用这一技术。理论上，未来的“人像模式”可以在毛发、衣物边缘实现更好的效果。

图片来自红米手机广

以及在自动驾驶的场景里，神经网络需要判断挡在前面的是车、行人还是建筑物，进而采用不同策略进行躲避，这同样需要图像语义分割来打基础。

图片来自Karol Majek:Tensorflow DeepLab v3 Xception Cityscapes

从该论文体现的效果来看，Auto-DeepLab还可以被转移、泛化到其他任务上。言外之意，让AI自动设计AI这件事，可能还会有很大的想象空间。

比如作者在论文最后提到，在目前的研究框架内，他们可以继续在物体识别的方向进行研究。

硅星人认为，如果能够取得类似的结果，这将意味着在数据标注（特别是图像标注）这件事上，人类标注员的准确度、成本等优势会进一步消失。

人工智能可以给人工智能打工，打工效率比人还高。

届时，“那些给人工智能打工的人”可能又会失去工作了……

本文来源：硅星人

李飞飞的新研究，将让“给AI打工的人”再一次失业

阿维塔、赛力斯已入股！华为引望可能成“中国博世”

Trianz与AWS达成战略合作协议，彻底改变云采用和管理方式

人工智能驱动工具SODA V将颠覆汽车市场，使汽车开发时间和成本降低90%

从容应对未知风险----解密亚马逊云科技的韧性之道

中国游戏市场开始复苏！腾讯、网易等巨头缩减在日本投资

独立自主！华为董事：致力打造不依赖西方的技术

华为张平安：数字世界话语权最终由生态繁荣决定！

中国通信服务公布2024年中期业绩

NVI技术创新联盟成立！自主生态将带动产业链高速发展

软通动力与长三角投资达成战略合作共谋数字生态新发展

海南区6家凯悦系酒店与岚图达成战略合作，共同推动新能源出行体验

安岚携手妮可•巴菲特开启疗愈之旅在秋日红叶的浪漫中疗愈身心

不惧美国封锁！华为：我们给大家提供系统、存储等

尼尔森IQ深耕中国四十载，共绘未来新篇章

第二十二届跨盈年度B2B营销高管峰会2025聚焦"营销竞取，打破市场内卷实现认知进化"

恒久动力驰骋天地美孚1号携手周冠宇邀您纵擎驰骋，劲享驾趣体验

美通社母公司Cision发布CisionOne平台，进军亚太地区媒体监测市场

移远通信推出大模型解决方案，重塑千行百业智能边界

高途公布2024年第二季度未经审计业绩

华为发布AI百校计划：培养AI人才每年获最高100万支持