在某些事情上机器人可能比你更懂
扫描二维码
随时随地手机看文章
在美剧《硅谷》中,曾出现一个基于深度学习来识别热狗的 app : Not Hotdog ,可过去 AI 要识别一种食物已经不容易,但在未来你每一个细微的动作可能都逃不过 AI 的眼睛。
最近 Netflix 的高级数据科技学家 Amir Ziai 发布了一项新的研究,用 AI 识别电影中接吻场景,这项技术看似无聊,但对于视频行业却有着重要的意义。一般来说接吻场景会出现在影视作品高潮和关键节点,有了这项技术,视频网站可以直接在视频中标记,方便用户检索和查看,甚至可以自动剪辑成视频集锦推送给用户。
此外如果你是个恋爱新手,或许还能通过这个工具快速学习一下电影中的那些接吻技巧,速成接吻十八式(误)。但是要让机器看懂人是怎么接吻并容易,Amir Ziai 建立了一个 2.3TB 的数据库,包含了从 1915 年到 2016 年的 600 部好莱坞电影,包括不同的类型,每部大小在 200MB 到 12 GB 之间。
Amir Ziai 选取了其中 100 部电影进行手动标记,总共标记 263 个接吻片段和 363 个非接吻片段,时长从 10 秒到 120 秒不等,而且每个标记片段都会提取图像特征和音频特征。也就是说,AI 鉴定电影中的角色是否接吻,除了「看画面」,还会「听声音」,这有助于提高识别的准确率。经过测试,Amir Ziai 发现这套系统的识别接吻的准确率达到 95%。
正如 Amir Ziai 在研究中采取的方法,目前训练 AI 还离不开人工。类似的技术其实在优酷等视频网站已经开始应用,甚至还出现一种叫做「吻戏鉴定师」的新职业。去年优酷一个 29 岁的「吻戏鉴定师」吉恒杉就曾登上热搜,据吉恒杉介绍,为了教会计算机识别接吻等场景,需要从图片库和视频中截取数千幅照片,一张一张标记「接吻」的画面。
光接吻场景就需要标注 2000 多张照片,目前已经为「接吻」这个标签做了两万多张图像的标注。据称以目前阿里巴巴的视频识别技术,可以在 10 秒对 5 分钟的视频进行识别标记。以电视剧《三生三世十里桃花》,机器会将单集 50 分钟的视频切割成 3000 帧图片,只要 5 秒钟就能挑出杨幂和赵又廷的吻戏。
目前类似的技术正在向更多场景拓展,比如识别体育赛事中进球、投篮、庆祝等动作,甚至应用在视频之外的更多场景。据《华尔街日报》报道,中国平安正在使用面部识别系统识别客户脸上的微表情,以决定是否接受他们的投保,从 2016 年开始中国平安已经将这项技术应用于消费金融部门,作为发放贷款时风险评估的一部分。
有意思的是,根据国际权威人脸识别数据库 LFW 2107 年的一份测试结果,中国平安旗下平安科技的人脸识别技术以 99.8% 的识别精度和最低的波动幅度领先苹果、Google 等科技巨头,位居世界第一。而日本一家人工智能公司 Vaak 开发出的一款 AI 软件,能通过分析顾客的神情和肢体动作,从而找出潜在的扒手,并提醒店员注意,去年还在一家便利店就成功识别出一名可疑的顾客。
这种 AI 分析技术除了可用于零售商,未来还能在火车站台等公众场所预防自杀 ,将有自杀倾向的人检测出来,提前阻止跳轨自杀等悲剧发生。
从静态的图片到动态的画面,AI 识别的能力越来越强,但这也引发了一些人的担忧。美国公民自由联盟(ACLU)最近在一份报告中指出,人工智能技术的进步使得摄像头更加聪明,可能会让我们的每个动作都被识别,如果不加以控制,可能会引发不少隐私问题。
上周微软主动删除了其最大的公共人脸识别数据库 MS Celeb,可能就是担心这些数据和相关技术被滥用,但这不会影响 AI 技术不断进步,在不久的将来还可能引发更多的争议。