人工智能首次超过人眼准确率 人脸识别准确度已经提升4个数量级
扫描二维码
随时随地手机看文章
商汤研究院院长王晓刚日前表示,2014年人工智能(AI)人脸识别技术的准确率首次超过人眼准确率,但目前误差率已经可以达到亿分之一。机器做人脸识别如果相当于一个4位元口令,现在则相当于一个8位元的口令,人脸识别4年内准确度已经提升了4个数量级。
商汤研究院院长王晓刚日前在《麻省理工科技评论》新兴科技峰会上发表了题为「AI赋能下的当下与未来」演讲,阐述了人工智能如何通过云和端改变生活和未来。
王晓刚回顾在过去的十年里,人工智能飞速发展最杰出的代表就是深度学习。其中有三个推动深度学展的因素:一是大数据,二是云端计算能力包括了GPU和AI芯片,三是深度学习算法不断创新。
王晓刚举例,2014年时机器做人脸识别可以达到万分之一的误差率;而现在误差率可以达到亿分之一。换句话说,机器做人脸识别如果相当于一个4位元口令,现在则相当于一个8位元的口令,人脸识别性能已经提升了4个数量级。
随著算法的提升,应用边界不断扩大,从最开始1:1身份的比对,到后来动态布控,如抓捕在逃嫌疑人。现在可以在整个城市范围内,从上千亿的图象中去搜索人脸,恢复人的活动轨迹。这样高的准确率实际上得益于神经网络的强大,通过训练超过1,200层的神经网络,从而超过人眼识别的能力。
神经网络已经从2012年的5层,发展到现在的1,200层这样一个过程,其网络的复杂度、深度也在不断的提升。但是为何在前端应用的时只用一个很小的网络,后台却需要训练1,200层这么大的网络?
王晓刚指出,原因是为了得到一个很小、但是识别率很高的网络,你首先需要得到一个非常深、非常强的网络进行学习。他比喻,这个小的但是识别率高的网络,就好比是一个小学生,资料就好比是书籍。
若是直接让一个小学生,从大量的书籍当中提取知识,这是一件非常困难的事,首先要找到一个老师,老师有非常强的学习能力,这就是1,200层网络。它首先能够从海量的资料里面,把知识提取出来,然后通过知识传播的方式去教更小的网络,让其达到很好的识别性能。
算法的提升可以带来非常多的应用,能让城市变得更加安全。比如,有罪犯十几年前隐姓埋名,就算改了身份证,最终还是被动态人脸布控系统所捕捉;此外公安局利用人脸识别系统结合城市里几万个摄像头,能够成功找到走丢的老人或孩童。
以商汤这几年累积的成果来看,2014年能够用20万人脸来对机器进行训练做到了98.5%的准确率,而人是97.5%;2015年用30万人脸进行训练,达到了99.55%的准确率;2016年用6,000万人脸训练可以达到了百万分之一的误识率;2017年用20亿人脸训练可以达到一亿分之一的误识率,这样的误识率才已可以真正地应用到各行各业。
在硬件方面,王晓刚也提及商汤与高通(Qualcomm)的战略合作,他认为如果人工智能想要普及,那么AI就要走到前端设备。而这些前端设备都离不开芯片。目前商汤的人脸解锁技术已经被超过上亿的手机用户使用,都要靠高通的芯片支持。