科大讯飞将为你“量身”播放音乐

[导读]7月16日下午消息，科大讯飞发布非公开发行股票发行情况报告暨上市公告，共向十名投资者发行1.08亿股新增股份，用于新一代感知及认知智能核心技术研发、智能语音人工智能开放平台、销售与服务体系升级建设等项

7月16日下午消息，科大讯飞发布非公开发行股票发行情况报告暨上市公告，共向十名投资者发行1.08亿股新增股份，用于新一代感知及认知智能核心技术研发、智能语音人工智能开放平台、销售与服务体系升级建设等项目。

随着现代生活水平的不断提高，人们对于娱乐化的需求也越来越多样性，计算机技术、图像识别技术已逐步应用于日常生活中各个领域中，例如，可以在数以亿万计的人群中迅速定位目标人物，也可以根据人脸图像判断人脸表情信息。目前随着音视频内容的多样性，音视频压缩技术的成熟，存储技术的提高，出现了大量根据人脸图像推荐音乐的应用，该应用将音乐与图像以一种新的形式展现给用户，受到了越来越多用户的关注与喜爱。

其实早在15年7月30日，科大讯飞就申请了一项名为“一种基于人脸的音视频推荐方法及系统”的发明专利（申请号：201510467751.9），申请人为科大讯飞股份有限公司。

根据目前公开的专利资料，让我们一起来了解一下科大讯飞的这项音视频推荐系统吧。

如上图为音视频推荐方法的流程图，具体可以包括以下这些步骤。

首先，接收用户发送的包含人脸的用户图像。这些用户图像可以是用户使用移动终端设备拍摄的包含人脸的图像。可以有：用户的自拍照、朋友间的合照、家庭成员的全家福照片等。

其次，确定所述用户图像中人脸的数量，包括人脸检测、人脸的局部特征点定位。可以预先收集大量包含人脸的用户图像，通过提取尺度不变特征转换特征，训练人脸与非人脸的分类模型，利用该模型对用户图像中的人脸进行检测。在确定了用户图像中所有人脸所在的位置后，对该位置区域进行人脸特征点检测，以确定人脸的局部特征点 ( 如眼睛、眉毛、鼻子、嘴巴、脸部外轮廓 ) 的位置。

接着，根据用户图像的人脸检测、人脸的局部特征点定位结果，即可确定用户图像中人脸的数量。如果为一个，则执行1）：

1）提取包含单个人脸用户图像相关的特征信息：单个人脸特征提取主要包括根据单个人脸信息获取用户属性相关信息( 如年龄、性别、是否化妆等信息 )、计算明星相似度、获取用户图像的拍摄时间。

如果多于一个，则执行2）：

2）提取包含多个人脸的图像特征信息：对于包含多个人脸的用户图像，可以提取的图像特征信息可以有：图像整体氛围、人脸亲密度等。

如果不包含人脸，则不进行音视频推荐或推荐预先设定的通用音视频。

最后，根据提取的图像特征信息确定向所述用户推荐的音视频，并将音视频推荐给所述用户。

了解了科大讯飞的音视频推荐方法后，大家是不是还是觉得很神奇，因为这样的智能技术距离人们的生活还存在一定的距离，还需要产品的落地。不过想想音箱能够看着你就能够播放出你喜欢的音乐，真是一件令人激动的事情，让我们期待这样的产品的到来！