目前为止, Galaxy Z Fold 产品线上试验了屏下摄像头,但没有更广泛的搭载
扫描二维码
随时随地手机看文章
人脸识别,是基于人的脸部特征信息进行身份识别的一种生物识别技术。用摄像机或摄像头采集含有人脸的图像或视频流,并自动在图像中检测和跟踪人脸,进而对检测到的人脸进行脸部识别的一系列相关技术,通常也叫做人像识别、面部识别。
人脸识别系统以人脸识别技术为核心,是一项新兴的生物识别技术,是当今国际科技领域攻关的高精尖技术。它广泛采用区域特征分析算法,融合了计算机图像处理技术与生物统计学原理于一体,利用计算机图像处理技术从视频中提取人像特征点,利用生物统计学的原理进行分析建立数学模型,具有广阔的发展前景。2006年,美国已经要求和它有出入免签证协议的国家在10月26日之前必须使用结合了人脸识别的电子护照系统,到 2006年底已经有50多个国家实现了这样的系统。2012年4月,铁路部门宣布车站安检区域将安装用于身份识别的高科技安检系统人脸识别系统;可以对人脸明暗侦测,自动调整动态曝光补偿, 人脸追踪侦测,自动调整影像放大。
三星可能正在开发一个屏下人脸识别系统,其中包括两个屏下摄像头。
三星早在 2021 年 3 月就向 KIPRIS(韩国知识产权信息服务)提交了专利申请,该文件已于上周公开,并被一家荷兰出版物收录。
专利介绍称,该方法从两个角度获取用户的多张图像,以更好地构建面部的 3D 模型并将其用于身份验证。不过,三星特别提到了使用屏下摄像头。
了解到,到目前为止,三星只是在其 Galaxy Z Fold 产品线上试验了屏下摄像头,而没有更广泛的搭载。
从专利来看,可能需要在手机底部附近放置一个摄像头,靠近屏下指纹所在的位置,甚至可能将两者组合成一个光学模块。
此外,专利中提到了测量瞳孔大小,人类的瞳孔大小会根据照明条件而变化,预计可以用作额外的安全措施,以防止使用照片或面具等东西来欺骗人脸识别。
现在AI发展的如火如荼,我们已逐步进入智能时代。虽然人工智能偏技术类,学习和理解需要一定的技术背景和数学做支撑。但拆开看,其原理、方法、思路并不复杂,「不懂技术」的产品经理也能理解。
人工智能牵扯很多学科,知识点盘根错节,需要具备多学科的知识储备。从学习路径上看,比较适合做成系列,从浅入深,从基础到应用,逐渐深入。但无形中提高了学习门槛,降低了学习的兴趣,导致很难坚持。
有感于此,我想以一种轻松、探索的视角,跟大家一起摸索,用简单、直白的方式来学习AI。这样,虽然会有错误、遗漏等,但学习难度会降低,那就在过程中完善吧,毕竟「模糊的正确大于精确的错误」。
一、人脸识别产品
我们从人脸识别开始,逐步了解其技术路径的演变和原理等,今天先从最简单的原理讲起。
人脸识别其实很早就有了,多年前就以人脸考勤的方式出现,但由于使用效果不好,用户体验不佳,逐步被市场淘汰。
而这一波人工智能的火热,计算能力、模型等都是其重要推动力,但更重要的是产品能够落地,能够在实际业务场景中使用。
尤其是人脸识别,产品在识别精度、速度、用户友好度等多个方面都有明显提升,用户和市场的接受度明显上升。
二、图像表示
了解人脸识别,先要从图像表示讲起。
大家都知道,计算机能够识别和处理的是二进制,不管我们输入的是文本、图像、声音,计算机都是用一定长度的二进制串进行存储和处理。
我们先以黑白图片为例,看看计算机是怎么表示的。
计算机程序可以将黑白图片可以表示为灰度图像。在灰度图像中,一个像素使用8个比特位,从而可以表示256个灰度阶,表示范围是0-255。其中0代表纯黑色,255代表纯白色。
一个字节可以表示一个像素,那怎么表示一张图片呢,用矩阵进行表示。
简单来说,就是表格,比如可以使用8行8列来表示一张8*8的灰度图片。
这样我们就解决了图像的表示问题,建立了图像和矩阵的等价关系。图片可以转化为矩阵,通过矩阵也可以恢复原始图片。
通过矩阵表示图像后,图像的各种处理就转化为数学问题,可以使用数学的理论和方法进行解决,而这正是计算机所擅长的。
我们输入图片,希望计算机能够将内容识别出来,将结果输出。
仍以数字为例,当输入图片并用矩阵表示后,通过将灰度值转化为灰度,可以轻松辨识其所表示的内容。
但在计算机的世界里,只有0和1。想要通过辨识矩阵内容并将结果输出,就必须建立矩阵到结果的映射。这样,输入一张图片,经过处理和计算后,才能输出一个数字。
人脸识别的主要算法以及原理
主流的人脸识别技术基本上可以归结为三类,即:基于几何特征的方法、基于模板的方法和基于模型的方法。
1. 基于几何特征的方法是最早、最传统的方法,通常需要和其他算法结合才能有比较好的效果;
2. 基于模板的方法可以分为基于相关匹配的方法、特征脸方法、线性判别分析方法、奇异值分解方法、神经网络方法、动态连接匹配方法等。
3. 基于模型的方法则有基于隐马尔柯夫模型,主动形状模型和主动外观模型的方法等。
人脸由眼睛、鼻子、嘴巴、下巴等部件构成,正因为这些部件的形状、大小和结构上的各种差异才使得世界上每个人脸千差万别,因此对这些部件的形状和结构关系的几何描述,可以做为人脸识别的重要特征。几何特征最早是用于人脸侧面轮廓的描述与识别,首先根据侧面轮廓曲线确定若干显著点,并由这些显著点导出一组用于识别的特征度量如距离、角度等。Jia 等由正面灰度图中线附近的积分投影模拟侧面轮廓图是一种很有新意的方法。
采用几何特征进行正面人脸识别一般是通过提取人眼、口、鼻等重要特征点的位置和眼睛等重要器官的几何形状作为分类特征,但Roder对几何特征提取的精确性进行了实验性的研究,结果不容乐观。
可变形模板法可以视为几何特征方法的一种改进,其基本思想是 :设计一个参数可调的器官模型 (即可变形模板),定义一个能量函数,通过调整模型参数使能量函数最小化,此时的模型参数即做为该器官的几何特征。
这种方法思想很好,但是存在两个问题,一是能量函数中各种代价的加权系数只能由经验确定,难以推广,二是能量函数优化过程十分耗时,难以实际应用。 基于参数的人脸表示可以实现对人脸显著特征的一个高效描述,但它需要大量的前处理和精细的参数选择。同时,采用一般几何特征只描述了部件的基本形状与结构关系,忽略了局部细微特征,造成部分信息的丢失,更适合于做粗分类,而且目前已有的特征点检测技术在精确率上还远不能满足要求,计算量也较大。