腾讯云智能+视频能力全面升级,满足行业智能化需求
扫描二维码
随时随地手机看文章
腾讯云在2017腾讯全球合作伙伴大会云计算分论坛上正式宣布智能+视频能力全面升级,在视频云的基础上,为广大各行各业用户提供基于人脸识别、图像识别、OCR识别、视频鉴黄、音频鉴黄、智能客服等人工智能技术与服务,结合直播、点播、实时音视频、短视频、IM等视频云通信平台基础产品并创造出更具行业特征的产品特性。
▲腾讯云视频业务总经理李郁涛
“智能+视频”,1+1=N种智能行业应用场景
随着视频云朝着行业垂直化、智能化的不断渗透和发展,与人工智能相结合也已成行业趋势。目前,在人工智能上占有一席之地的关于语音和图像的AI技术种类就有很多,比如语音转文字、文本转语音、声纹识别、证件识别、人脸识别等相关技术,这对于绝大多数的业内企业来说,巨大技术门槛是一道不可逾越的鸿沟,只能望“智”兴叹。
不仅如此,要啃下如此繁多且复杂的技术,势必会投入与之对应的巨大人力和物力,同时也会是一场技术马拉松,这对于普通企业来说都是不太利于可持续发展的。企业应当在其自身核心业务中不断发展并建立业内领先优势,现在大多数企业正不断将其自身业务上云,结合云的优势来实现业务的增长和突破已是行业共识。
作为视频云行业的领先者,腾讯云在基于早两年推出并在业内建立领先地位的视频云PaaS产品以来,结合时下腾讯尖端人工智能技术,面向企业用户提供一整套“智能+视频”的全新视频以及通信平台能力,旨在为企业客户创造更多的智能化应用场景。
在此次的解决方案中,腾讯云将语音和图像方面的AI能力和视频云基础产品做了深度的融合和创新,不仅在原有的PaaS层服务结合AI技术有了重大升级之外,还提供了丰富的AI元素组件,帮助客户更好地理解具体的技术能力场景,并加快集成各个产品和服务的所需的开发周期,应对瞬息万变的市场,给企业提供更有力的行业竞争力。
三大能力升级,音视频识别准确率99%
腾讯“智能+视频”能力本次升级发布主要分为语音+AI、声纹+AI、视频+AI三个方面。
首先在语音+AI方面,腾讯云可提供语音文字互转(语音转文字、文字转语音、语义识别)、广告过滤、违禁检测、涉政检测等能力,可以有效过滤国家法律限制的物品信息、涉政敏感信息等,帮助用户进行敏感词隔离和舆情监控。
其次在声纹+AI方面,腾讯云在去年推出鉴黄V1.0版后,再一次对升级了鉴黄能力,此次升级是通过音频内容、声纹识别技术,提供识别准确率超过99%、检索时间小于150ms的音频鉴黄V2.0版,通过音频鉴黄能力能够广泛用于版权保护、敏感过滤及游戏角色标注等情况,进一步扩大鉴黄相关业务范围。
在视频+AI方面,腾讯云可在直播、点播等场景中可实现实时字幕和视频内容自动翻译。根据相关数据显示,在环境噪声50db左右、没有回音消除的背景下用腾讯云的互动直播音视频会话时,自动字幕识别准确率高达96%以上,识别的文本均在1S内返回并显示。
基于传统图像特征识别与深度学习,腾讯云的手势识别能力还可应用于直播和短视频上,动态手势识别率接近99%,而移动客户端CPU仅增长2%。
此外,腾讯云基于绑卡验证、OCT技术、人脸识别、活体检验、腾讯辅助身份信息大数据的多维度综合模型,进一步升级了直播平台主播的身份实名认证能力,识别通过率已高达95%,误判率仅为0.01%,为互联网网络净化又增加一大利器。
实际运用已有成功案例
满足行业智能化需求
目前,腾讯云的“智能+视频”能力已经在网络庭审、小微客服机器人、微信小程序保险定损、视频检索等实际运用中有了成功案例。例如解决约80%小型案件的网络庭审,腾讯云可智能识别语音所属对象(法官、原告、被告、书记员等),语音文字识别准确率95%以上,达到实时笔录效果,释放近90%书记员人力。
在微信小程序保险定损之中,腾讯云可帮助保险企业快速进行OCR证件识别、视频定损等,实现音视频、小程序、AI的融会贯通。此外,腾讯云还让媒体音像资料的视频检索成为可能,囊括市场主流视频文件格式。
腾讯云视频业务总经理李郁涛表示,此次升级发布的“智能+视频”能力,将腾讯云长久以来的音视频技术经验和AI能力充分结合起来,将帮助通信、视频、社交、游戏、广电等行业用户更加智能化的开展业务。业内分析认为,腾讯“智能+视频”能力的升级发布,也将有助于泛娱乐、在校教育、互联网金融、线上法院、智能客服等新生业态的快速发展。